通話システム
【課題】 日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制可能な通話システムを提供する。
【解決手段】 通話装置1の制御部1aは、マイクロホンMに入力された音声データが終話コマンド格納部1sに格納している終話コマンドワードに一致した認識結果が音声認識部1pから得られた場合に、終話コマンドを含むデータを通話先の通話装置1へ送信し、さらにマイクロホンMに入力された音声データが終話コマンド格納部1sに格納している終話コマンドワードに一致した認識結果が音声認識部1pから得られるとタイマ部100による計時を開始し、当該計時時間が予め設定された終話タイマ値T1に達するまでに通話先の通話装置1から終話コマンドを含むデータを受信すれば、通話回線を切断する。
【解決手段】 通話装置1の制御部1aは、マイクロホンMに入力された音声データが終話コマンド格納部1sに格納している終話コマンドワードに一致した認識結果が音声認識部1pから得られた場合に、終話コマンドを含むデータを通話先の通話装置1へ送信し、さらにマイクロホンMに入力された音声データが終話コマンド格納部1sに格納している終話コマンドワードに一致した認識結果が音声認識部1pから得られるとタイマ部100による計時を開始し、当該計時時間が予め設定された終話タイマ値T1に達するまでに通話先の通話装置1から終話コマンドを含むデータを受信すれば、通話回線を切断する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通話システムに関するものである。
【背景技術】
【0002】
従来、ユーザが発話する特定の言葉を音声認識手段が認識することによって、発呼等の各操作をハンズフリーで行う電話機がある(例えば、特許文献1参照)。
【0003】
例えば、ユーザが発話した発信先の電話番号を音声認識手段が認識した後に、「決定」というコマンドワード発話し、このコマンドワードが音声認識手段で認識された場合に、発信先の電話番号へ発呼するよう電話機が制御される。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−58390号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
音声認識手段によって、通話の開始から終了までの処理をハンズフリーで行う場合、発呼時、および発呼に対する応答時には通話回線がまだつながっていないので、通話先との会話がまだ始まっておらず、会話中の単語によるコマンドワードの誤認識が発生することはない。しかし、通話中は通話回線がつながっているので、通常の会話の中に終話を示す言葉(終話コマンドワード)が入ると、会話中のなにげない言葉であるにも関わらず、音声認識手段が終話コマンドワードであると誤認識して通話回線を切断し、ユーザの意思に反して終話処理が行われてしまう。
【0006】
例えば、終話コマンドワードに「さよなら」等を用いることが一般的であり、このような一般的に終話を示す言葉は電話機の音声認識手段に予め記憶されているため、ユーザによるコマンドワードの記憶操作が不要となって使い勝手がよい。しかし、「C君に会ってさよならと言ったけど、返事してくれなかった」のように、通話中の会話に終話コマンドワード「さよなら」が入ることが十分考えられ、音声認識手段がこの「さよなら」を終話コマンドワードであると誤認識すると、通話回線が切断されてしまう。
【0007】
また、日常会話で使わないような「閉じろゴマ」のような言葉を終話コマンドワードに用いると、終話時に発したそのコマンドワードが通話先にも聞こえてしまい、会話が不自然になってしまう。また、このような日常会話で使わない「閉じろゴマ」のような言葉を終話コマンドワードとして用いる場合は、ユーザによるコマンドワードの記憶操作が必要となって使い勝手も低下する。
【0008】
本発明は、上記事由に鑑みてなされたものであり、その目的は、日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制可能な通話システムを提供することにある。
【課題を解決するための手段】
【0009】
請求項1の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、前記終話音声一致信号が音声認識部から出力された場合に、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。
【0010】
この発明によれば、通話中の通話装置の双方が第1の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0011】
請求項2の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、通話先から終話コマンドを含むデータを受信した場合に、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。
【0012】
この発明によれば、通話中の通話装置の双方が第1の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0013】
請求項3の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、前記終話音声一致信号が音声認識部から出力された場合、または通話先から終話コマンドを含むデータを受信した場合、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合、またはタイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。
【0014】
この発明によれば、通話中の通話装置の双方が第1の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。さらに、双方の通話装置がタイマ部による計時動作を個別に行い、第1の所定値内にユーザがコマンドワードを発したか否かを個別に判別するので、一方の通話装置が他方の通話装置へ終話通知を送信する必要がなく、通信トラフィックの低減化を図ることができる。
【0015】
請求項4の発明は、請求項1乃至3いずれかにおいて、前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに通話先との間で通話が行われなければ、通話先との通信を停止することを特徴とする。
【0016】
この発明によれば、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の終話コマンドワードを認識した後、双方が何も話さない無音状態が、第2の所定値に基づいて計時される期間、継続した場合にのみ通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0017】
請求項5の発明は、請求項1乃至3いずれかにおいて、各通話装置は、通話を行うユーザが所定範囲内に存在するか否かを検知するユーザ検知手段を備え、前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のユーザ検知手段が所定範囲内のユーザを検知しなくなれば、通話先との通信を停止することを特徴とする。
【0018】
この発明によれば、一般的な会話でお別れの挨拶をした以降にユーザが席を離れることを利用して、双方の終話コマンドワードを認識した後、第2の所定値に基づいて計時される期間に、少なくともいずれか一方が席を離れた場合に通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、離席の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0019】
請求項6の発明は、請求項1乃至3いずれかにおいて、各通話装置は、ユーザを撮像する撮像手段と、終話時にユーザが行う動作の映像データを格納した終話ジェスチャー記憶部と、撮像手段からの映像データが終話ジェスチャー記憶部に格納している映像データに一致するか否かを判定し、一致した場合には終話ジェスチャー一致信号を出力するジェスチャー認識部とを備え、前記制御部の終話処理手段は、前記終話処理開始トリガが発生し、且つタイマ部による計時が開始されてから計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のジェスチャー認識部から終話ジェスチャー一致信号が出力されると、通話先との通信を停止することを特徴とする。
【0020】
この発明によれば、一般的な会話でお別れの挨拶をした以降に「お辞儀」や「手を振る」等のジェスチャーが行われることを利用して、双方の終話コマンドワードを認識した後、第2の所定値に基づいて計時される期間において、ユーザが「お辞儀」や「手を振る」等のジェスチャーを行った場合にのみ通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、終話ジェスチャーの有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0021】
請求項7の発明は、請求項1乃至6いずれかにおいて、各通話装置は、表示手段と、当該表示手段の表示動作を制御する表示制御手段とを備え、表示制御手段は、通話先から終話コマンドを含むデータを受信すると、表示手段の表示を変化させることを特徴とする。
【0022】
この発明によれば、ユーザは、通話先が終話処理に移行中であることを表示手段によって判断でき、さらには終話処理に至る進行度合も表示手段によって判断できるので、ユーザによる誤切断を抑制できる。
【発明の効果】
【0023】
以上説明したように、本発明では、日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制することができるという効果がある。
【図面の簡単な説明】
【0024】
【図1】実施形態1の通話装置の構成を示す図である。
【図2】同上の通話システムの構成を示す図である。
【図3】同上のパケット信号の構造を示す図である。
【図4】同上の通話シーケンスを示す図である。
【図5】同上の別の通話シーケンスを示す図である。
【図6】実施形態2の通話シーケンスを示す図である。
【図7】実施形態3の通話装置の構成を示す図である。
【図8】同上の通話シーケンスを示す図である。
【図9】同上の別の通話シーケンスを示す図である。
【図10】実施形態4の通話装置の構成を示す図である。
【図11】同上の通話シーケンスを示す図である。
【図12】実施形態5の通話装置の構成を示す図である。
【図13】同上の通話シーケンスを示す図である。
【図14】実施形態6の通話装置の構成を示す図である。
【図15】同上の通話シーケンスを示す図である。
【発明を実施するための形態】
【0025】
以下、本発明の実施の形態を図面に基づいて説明する。
【0026】
(実施形態1)
図2は本実施形態の通話システムの構成を示し、インターネットを含むネットワークNTに複数の通話装置1が接続されている。各通話装置1は、ネットワークNTを介して1対1で通信可能な電話機であり、音声データおよび映像データを含むパケット信号を互いに送受信し、受信した映像データを表示するためのモニタ装置2が各々接続されている。
【0027】
通話装置1は、図1に示すように、マイクロホンM(音声入力部)、スピーカSP、カメラC(撮像手段)を備えており、マイクロホンMから入力された音声データ、およびカメラCが撮像した映像データをパケット信号に格納して通話先へ送信する。また、通話先からネットワークNTを介してパケット信号を受信すると、当該パケット信号に含まれる音声データをスピーカSPから出力し、当該パケット信号に含まれる映像データをモニタ装置2に表示させる。すなわち、双方向で、ユーザ同士が互いの映像を見ながら通話できるテレビ電話機として機能するものである。
【0028】
まず通話装置1では、ネットワークI/F部1hがネットワークNTとの間でパケット信号の授受を行っている。パケット信号は、図3に示すように、コマンドエリアD1、音声エリアD2、映像エリアD3で構成されており、コマンドエリアD1には通話先に対して各種通知等を行うためのコマンドデータが格納され、音声エリアD2には音声データが格納され、映像エリアD3には映像データが格納される。なお、全てのエリアにデータが格納される必要はなく、必要なエリアのみにデータが格納されておればよい。
【0029】
そして、カメラCが出力する映像データはA/D変換部1bによってA/D変換され、マイクロホンMが出力する音声データはA/D変換部1cによってA/D変換された後に、CPU等で構成される制御部1aに入力される。制御部1aは、マイクロホンMからの音声データを自己音声蓄積部1lに一時保存し、カメラCからの映像データを自己映像蓄積部1jに一時保存する。
【0030】
制御部1aは、自己音声蓄積部1lおよび自己映像蓄積部1jの音声データおよび映像データを順次読み出して、パケット信号の音声エリアD2および映像エリアD3に各々格納し、ネットワークI/F部1hからネットワークNTを介して通話先の通話装置1にパケット信号を送信する。
【0031】
また、制御部1aは、通話先からネットワークNT、ネットワークI/F部1hを介してパケット信号を受信すると、パケット信号の音声エリアD2および映像エリアD3に格納されている音声データおよび映像データを、相手音声蓄積部1kおよび相手映像蓄積部1iに各々一時保存する。次に制御部1aは、相手音声蓄積部1kの音声データを順次読み出してD/A変換部1eに入力し、D/A変換された音声データがスピーカSPから出力される。さらに、制御部1aは、相手映像蓄積部1iの映像データを順次読み出してD/A変換部1dに入力し、D/A変換された映像データがモニタ装置2に表示される。
【0032】
さらに通話装置1は、スピーカSPから出力される音声がマイクロホンMに回りこんで発生するハウリングを防止するためにエコーキャンセラ部1fを具備しており、エコーキャンセラ部1fは、マイクロホンM2が出力する音声データからスピーカSPに入力される音声データを減算したデータを、A/D変換部1cに出力している。したがって、送信される音声データは、スピーカSPからマイクロホンMに回りこんだ音声成分がキャンセルされており、ハウリングの発生が防止されている。
【0033】
そして、通話装置1では、ユーザが発話する特定の言葉を音声認識部1pが認識することによって、発呼、応答、終話等の各操作をハンズフリーで行うことを可能としており、以下、通話装置1間の通信における音声認識処理について説明する。
【0034】
通話装置1は、音声認識手段として、音声認識部1p、発呼コマンド格納部1q、応答コマンド格納部1r、終話コマンド格納部1sを備えている。発呼コマンド格納部1qには、「B君につないで」等の発呼操作時にユーザが用いる言葉が発呼コマンドワードとして格納されており、応答コマンド格納部1rには、「応答して」等の応答操作時にユーザが用いる言葉が応答コマンドワードとして格納されており、終話コマンド格納部1sには、「さよなら」「バイバイ」等の終話操作時にユーザが用いる言葉が終話コマンドワードとして格納されている。音声認識部1pは、自己音声蓄積部1lに保存されている音声データを、発呼コマンド格納部1q、応答コマンド格納部1r、終話コマンド格納部1sに格納している各コマンドワードと比較して、音声データ中にいずれかのコマンドワードと一致する言葉があれば、当該認識結果として、発呼音声一致信号、応答音声一致信号、終話音声一致信号を制御部1aに出力する。
【0035】
制御部1aは、音声認識部1pによる認識結果から、一致したコマンドワード[発呼コマンドワード、または応答コマンドワード、または終話コマンドワード]に対応するコマンドデータ[発呼コマンドデータ、または応答コマンドデータ、または終話コマンドデータ]を送信コマンド蓄積部1mに一時保存した後に読み出して、パケット信号のコマンドエリアD1に格納し(通話回線が接続状態であれば、上記音声データおよび映像データも音声エリアD2および映像エリアD3に格納し)、ネットワークI/F部1hからネットワークNTを介して通話先の通話装置1にパケット信号を送信する。
【0036】
また、制御部1aは、通話先からネットワークNT、ネットワークI/F部1hを介して、コマンドエリアD1にコマンドデータが格納されたパケット信号を受信すると、コマンドエリアD1に格納されているコマンドデータを、受信コマンド蓄積部1nに一時保存する。次に制御部1aは、受信コマンド蓄積部1nのコマンドデータを読み出して、コマンドデータに基づいた処理を行う。すなわちユーザが、発呼、応答、終話の各コマンドワードに設定されている言葉を発すれば、音声認識部1pが各コマンドワードに対応する処理を行うことで、ハンズフリー操作が可能となる。
【0037】
図4は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0038】
まず、発呼動作を行うために、ユーザAが通話装置11のマイクロホンMに対して「B君につないで」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と発呼コマンド格納部1q内のコマンドワード「B君につないで」とが一致するとして、発呼音声一致信号を制御部1aへ出力する。制御部1aは、B君の電話番号(またはIPアドレス)をコマンドワード「B君につないで」に対応させて予め格納しており、前記認識結果に基づいてユーザBの通話装置12へ発呼コマンドデータのみを格納した発呼通知P1を送信する(発呼処理)。なお、この発呼通知P1の送信経路については、図示しない呼制御サーバを用いて発信先の電話番号とIPアドレスとの対応付けを行う方法や、IPアドレスのみを用いて通話装置11から通話装置12へ直接送信する方法等が周知であり、詳細な説明は省略する。
【0039】
ネットワークNTを介して発呼通知P1を受信した通話装置12では、制御部1aがスピーカSPから呼び出し音を鳴動させる。この呼出音に反応したユーザBが通話装置12のマイクロホンMに対して「応答して」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と応答コマンド格納部1r内のコマンドワード「応答して」とが一致するとして、応答音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ応答コマンドデータのみを格納した応答通知P2を送信する(応答処理)。
【0040】
ネットワークNTを介して応答通知P2を受信した通話装置11では、制御部1aが、予め決められた応答確認コマンドデータのみを格納した応答確認P3を通話装置12へ送信し、マイクロホンMからの音声データ、カメラCからの映像データを格納したパケット信号を生成して送信する通話機能を実行状態にする(応答確認処理)。
【0041】
ネットワークNTを介して応答確認P3を受信した通話装置12では、制御部1aが、マイクロホンMからの音声データ、カメラCからの映像データを格納したパケット信号を生成して送信する通話機能を実行状態にすることで、通話装置11−12間の通話回線が確立される(回線確立処理)。
【0042】
以降は、通話装置11−12間で、音声データおよび映像データを格納したパケット信号Paを互いに送受信して、通話が行われる。以降、終話コマンドワードが入らない会話がユーザA,B間で行われている間は、パケット信号PaのコマンドエリアD1には終話コマンドデータが格納されることがない。
【0043】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0044】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12では、表示制御手段としても機能する制御部1aが、表示手段を構成するLED1zを点灯させることで、ユーザBに対して終話待ち状態であること報知する。そして通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。なお、通話装置12では、終話パケット信号P5を送信した時点でLED1zを消灯させる。
【0045】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aは、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信した後に、通話機能を停止して通話回線を切断する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0046】
また、通話装置11において、終話パケット信号P5を受信しなければ(すなわち、ユーザBが通話を終了させるための「さよなら」という言葉を発しておらず、終話処理開始トリガが発生しなければ)、図5に示すように、タイマ部100の計時時間が終話タイマ値T1に達した時点で、制御部1aは、タイマ部100の計時時間をリセットして終話待ちモードを終了し、予め決められたタイムアウトコマンドデータを格納したタイムアウトパケット信号P11を、ユーザBの通話装置12へ送信する。以降は、通話装置11または12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。この場合、通話装置12では、終話パケット信号P4を受信した時点でLED1zを点灯させ、タイムアウトパケット信号P11を受信した時点でLED1zを消灯させる。
【0047】
而して、通話装置11は、タイマ部100の計時時間が終話タイマ値T1に達した後に、終話パケット信号P5を受信したとしても、ユーザBの通話装置12へ終話通知P6を送信することはなく、通話機能を停止して通話回線を切断することもない。すなわち、終話処理を行うことはない。
【0048】
したがって、通話装置11,12の双方が終話タイマ値T1内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0049】
(実施形態2)
本実施形態の通話システムは、実施形態1と同様に図1の構成を備えており、説明は省略する。
【0050】
図6は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0051】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0052】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信する[終話コマンド送信手段]。
【0053】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12では、制御部1aが内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置12の制御部1aは通常モードから終話待ちモードとなる。さらに、表示制御手段としても機能する制御部1aが、表示手段を構成するLED1zを点灯させることで、ユーザBに対して終話待ち状態であること報知する。
【0054】
そして、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、通話装置12のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。終話音声一致信号を受け取った制御部1aは、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザAの通話装置11へ送信した後に、通話機能を停止して通話回線を切断する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置11では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。なお、通話装置12では、終話通知P6を送信した時点でLED1zを消灯させる。
【0055】
また、通話装置12において、ユーザBが通話を終了させるための「さよなら」という言葉を発することなく、終話処理開始トリガが発生しなければ、タイマ部100の計時時間が終話タイマ値T1に達した時点で、制御部1aは、タイマ部100の計時時間をリセットして終話待ちモードを終了する。以降は、通話装置11または12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。
【0056】
而して、通話装置12は、タイマ部100の計時時間が終話タイマ値T1に達した後に、ユーザBが通話を終了させるための「さよなら」という言葉を発したとしても、ユーザAの通話装置11へ終話通知P6を送信することはなく、通話機能を停止して通話回線を切断することもない。すなわち、終話処理を行うことはない。
【0057】
したがって、通話装置11,12の双方が終話タイマ値T1内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0058】
(実施形態3)
図7は本実施形態の通話システムの構成を示し、実施形態1の通話装置1に無音タイマ値格納部1tを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0059】
図8は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0060】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0061】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0062】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0063】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aが、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、無音タイマ値格納部1tに予め設定している無音タイマ値T2と比較する。そして、タイマ部100の計時時間が無音タイマ値T2に達するまでユーザA,Bの双方が言葉を発することなく無音状態が継続すれば、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信した後に、通話機能を停止して通話回線を切断する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0064】
また、図9のように、無音タイマ値T2の計時中にユーザAが「それでね」という会話を継続させる言葉を発すると、通話装置11の制御部1aはタイマ部100の計時動作をリセットして通常モードに戻るとともに、予め決められた通話継続コマンドデータを格納した通話継続パケット信号P12を、ユーザBの通話装置12へ送信する。以降は、通話装置11または12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。
【0065】
例えば、ユーザA−B間の会話中に、例えば「C君に会って、さよならと言ったけど返事してくれなかったの」に対して、「そう、さよならも言ってくれなかったの」のように、通常の会話の中で「さよなら」を双方が発する場合が考えられ、この通常の会話中に発せられた双方の「さよなら」を終話コマンドワードと誤認識する虞がある。
【0066】
しかしながら本実施形態では、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、無音タイマ値T2の間、双方が何も話さない無音状態が継続した場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0067】
なお、本実施形態の無音期間の有無によって終話処理を行か否かを判断する構成は、実施形態2の構成に適用しても上記同様の効果を得ることができる。
【0068】
(実施形態4)
図10は本実施形態の通話システムの構成を示し、実施形態1の通話装置1にジェスチャー待ちタイマ値格納部1u、ジェスチャー認識部1v、終話得ジェスチャー記憶部1wを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0069】
図11は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0070】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0071】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1、およびジェスチャー待ちタイマ値格納部1uに予め設定しているジェスチャー待ちタイマ値T3と比較し、タイマ部100の計時時間が終話タイマ値T1またはジェスチャー待ちタイマ値T3内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。なお、本実施形態では、終話タイマ値T1<ジェスチャー待ちタイマ値T3の関係にあるが、T1=T3、T1>T3の関係に設定してもよい。さらには、終話タイマ値T1とジェスチャー待ちタイマ値T3との各計時期間が重複することなく、例えば終話タイマ値T1を計時した後にジェスチャー待ちタイマ値T3を計時する構成でもよい。
【0072】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0073】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11では、タイマ部100の計時時間が終話タイマ値T1に達していなければ、終話処理開始トリガの発生を記憶する。
【0074】
さらに、本実施形態では、終話処理開始トリガが発生し、且つタイマ部100の計時時間がジェスチャー待ちタイマ値T3に達するまでに、ユーザA,Bの双方が終話動作を行えば終話処理可能であると判断する。
【0075】
各通話装置1において、終話ジェスチャー記憶部1wには、「お辞儀」や「手を振る」等の終話時に一般的に行われるジェスチャーを映像データ(終話ジェスチャーデータ)で格納している。そして、ジェスチャー認識部1vは、自己映像蓄積部1jに保存されている映像データを、終話ジェスチャー記憶部1wに格納している終話ジェスチャーデータと比較して、映像データ中に終話ジェスチャーデータと一致する映像があれば、ユーザの終話ジェスチャーを検知したとして、終話ジェスチャー一致信号を制御部1aに出力する。
【0076】
制御部1aは、ジェスチャー認識部1vによる認識結果から、終話動作コマンドデータを送信コマンド蓄積部1mに一時保存した後に読み出して、パケット信号のコマンドエリアD1に格納し(通話回線が接続状態であれば、上記音声データおよび映像データも音声エリアD2および映像エリアD3に格納し)、ネットワークI/F部1hからネットワークNTを介して通話先の通話装置1にパケット信号を送信する。
【0077】
而して、通話装置11においてジェスチャー待ちタイマ値T3の計時中に、例えば、通話装置12がユーザBの「お辞儀」や「手を振る」等の終話ジェスチャーを検知すると、終話動作コマンドを格納したパケット信号P7が通話装置12から通話装置11へ送信される。ネットワークNTを介してパケット信号P7を受信した通話装置11においても、ユーザBの終話ジェスチャーに反応したユーザAが、終話ジェスチャーを行うと、ジェスチャー認識部1vの認識結果に基づいてユーザBの通話装置12へ終話動作コマンドデータを格納したパケット信号P8を送信するとともに、当該認識結果を制御部1aに出力する。したがって、通話装置11の制御部1aは、終話処理開始トリガが発生し、且つ通話装置11,12ともにユーザが終話ジェスチャーを行ったので終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信し、通話機能を停止して通話回線を切断する[第1の集話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の集話処理手段](終話処理)。
【0078】
このように本実施形態では、一般的な会話でお別れの挨拶をした以降に「お辞儀」や「手を振る」等のジェスチャーが行われることを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、ジェスチャー待ちタイマ値T3の間に、双方が「お辞儀」や「手を振る」等のジェスチャーを行った場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、終話ジェスチャーの有無によって区別して、終話コマンドワードの誤認識を防止できる。また、ユーザA,Bのいずれか一方が終話動作を行えば終話処理可能であると判断してもよい。
【0079】
また、終話パケット信号P4,P5、終話動作コマンドを格納したパケット信号P7,P8が送信される順番は図11の例に限定されることなく、例えば、ユーザAが「さよなら」という終輪コマンドワードを発するとともに「お辞儀」や「手を振る」等の終話ジェスチャーを行い、その後にユーザBが「さよなら」という終輪コマンドワードを発するとともに「お辞儀」や「手を振る」等の終話ジェスチャーを行う場合でも、上記同様に動作する。この場合、終話パケット信号P4 → 終話動作コマンドを格納したパケット信号P7 → 終話パケット信号P5 → 終話動作コマンドを格納したパケット信号P8のように、パケット信号P4〜P7がタイマ値T1,T3内に混在する。
【0080】
なお、本実施形態の終話ジェスチャーの有無によって終話処理を行か否かを判断する構成は、実施形態2の構成に適用しても上記同様の効果を得ることができる。
【0081】
(実施形態5)
図12は本実施形態の通話システムの構成を示し、実施形態1の通話装置1に離席タイマ値格納部1x、測距センサ1yを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0082】
図13は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0083】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0084】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0085】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0086】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aが、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、離席タイマ値格納部1xに予め設定している離席タイマ値T4と比較する。
【0087】
そして本実施形態では、タイマ部100の計時時間が離席タイマ値T4に達するまでに、少なくともユーザA,Bのいずれかが、通話を行うための定位置から離席すれば終話処理可能であると判断する。
【0088】
ここで、通話装置1の測距センサ1yは、通話中のユーザを検知対象として当該ユーザまでの距離を測定している。制御部1aは、ユーザまでの距離が所定距離未満であれば、通話を行うための定位置に着席中であると判定し、ユーザまでの距離が所定距離以上であれば、通話を行うための定位置から離席したと判定するとともに通話先へ離席通知を送信する。
【0089】
而して、通話装置12がユーザBの離席を検知した場合、図13に示すように、予め決められた離席通知コマンドデータのみを格納した離席通知P13をユーザAの通話装置11へ送信する。そして、通話装置11では、タイマ部100の計時時間が離席タイマ値T4に達するまでに離席通知P13を受信すれば、制御部1aが、通話機能を停止して通話回線を切断するとともに、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0090】
また、通話装置11が、タイマ部100の計時時間が離席タイマ値T4に達するまでにユーザAの離席を検知した場合は、制御部1aが、通話機能を停止して通話回線を切断するとともに、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0091】
このように本実施形態では、一般的な会話でお別れの挨拶をした以降にユーザが席を離れることを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、離席タイマ値T4の間に、少なくともいずれか一方が席を離れた場合に通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、離席の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0092】
また、測距センサの代わりに、人感センサや顔認識手段を用いてユーザの離席を検知してもよい。なお、顔認識手段は、撮像範囲におけるユーザの顔の位置を認識するものであり、撮像範囲から顔が外れることによって離席検知を行う。
【0093】
なお、本実施形態の離席の有無によって終話処理を行か否かを判断する構成は、実施形態2の構成に適用しても上記同様の効果を得ることができる。
【0094】
(実施形態6)
図14は本実施形態の通話システムの構成を示し、実施形態3の通話装置1にLED1zを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0095】
図15は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0096】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0097】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に[終話コマンド送信手段]、内部に具備したタイマ部100の計時動作を開始し[計時開始手段]、さらにはLED1zを黄色点灯させる。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0098】
通話装置12では、ネットワークNTを介して終話パケット信号P4を受信すると、内部に具備したタイマ部100の計時動作を開始し[計時開始手段]、さらにはLED1zを黄色点灯させる。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め格納している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置12の制御部1aは終話待ちモードとなる。
【0099】
そして、通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。終話音声一致信号を受け取った制御部1aは、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、LED1zを赤色点灯させるとともに、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、無音タイマ値格納部1tに予め設定している無音タイマ値T2と比較する。さらには、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0100】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aは、LED1zを赤色点灯させるとともに、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、無音タイマ値格納部1tに予め設定している無音タイマ値T2と比較する。
【0101】
そして本実施形態では、タイマ部100の計時時間が無音タイマ値T2に達するまでに、ユーザA,Bの双方が言葉を発することなく無音状態が継続すれば、終話処理可能であると判断する。
【0102】
而して、通話装置11,12において無音タイマ値T2の間、無音状態が継続すれば、図15に示すように、通話装置11,12の各制御部1aは、通話機能を停止して通話回線を切断する(終話処理)。
【0103】
また、無音タイマ値T2の計時中にユーザAが「それでね」という会話を継続させる言葉を発すると、通話装置11の制御部1aはタイマ部100の計時動作をリセットして通常モードに戻るとともに、予め決められた通話継続コマンドデータを格納した通話継続パケット信号(図示なし)を、ユーザBの通話装置12へ送信する。通話継続パケット信号を受信した通話装置12においても、制御部1aがタイマ部100の計時動作をリセットして通常モードに戻る。以降は、通話装置11および12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。
【0104】
このように本実施形態では、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、無音タイマ値T2の間、双方が何も話さない無音状態が継続した場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0105】
さらに、通話装置11,12の双方がタイマ部100による計時動作を個別に行い、終話タイマ値T1内にユーザがコマンドワード「さよなら」を発したか否かを個別に判別するので、実施形態3のように終話通知P6を送信する必要がなく、通信トラフィックの低減化を図ることができる。
【0106】
さらにユーザは、通話先が終話処理に移行中であることをLED1zの発光色によって判断でき、さらには終話処理に至る進行度合もLED1zの発光色によって判断できるので、ユーザによる誤切断を抑制できる。また、LED1zの発光色の変化に連動して、モニタ装置2にLED1zの発光色が意味する内容を文字で表示したり、モニタ装置2の表示色も黄色から赤色に徐々に変化させてもよい。
【0107】
また、実施形態4,5では、終話パケット信号P4を送信した通話装置11のみがタイマ部100を動作させて、終話タイマ値T1の計時を行う構成、または終話パケット信号P4を受信した通話装置12のみがタイマ部100を動作させて、終話タイマ値T1の計時を行う構成を示したが、実施形態4,5においても、実施形態6と同様に終話パケット信号P4を送受信した通話装置11,12の双方がタイマ部100を動作させて、終話タイマ値T1の計時を行う構成や、終話処理に至る進行度合をLEDの発光色によって判断する構成を適用することは可能である。
【0108】
さらに、上記実施形態では、伝送路としてインターネットを用いており、パケット通信によって音声データ、画像データ、各種コマンドデータ等を送信している。しかし、伝送路として一般電話回線を用いてもよく、この場合はコマンドデータとしてトーン信号が用いられる。また、一般電話回線で音声データ、画像データを送信し、インターネットでコマンドデータを送信してもよい。
【符号の説明】
【0109】
1 通話装置
100 タイマ部
1a 制御部
1g 終話タイマ値格納部
1p 音声認識部
1s 終話コマンド格納部
C カメラ
M マイクロホン
SP スピーカ
NT インターネット
【技術分野】
【0001】
本発明は、通話システムに関するものである。
【背景技術】
【0002】
従来、ユーザが発話する特定の言葉を音声認識手段が認識することによって、発呼等の各操作をハンズフリーで行う電話機がある(例えば、特許文献1参照)。
【0003】
例えば、ユーザが発話した発信先の電話番号を音声認識手段が認識した後に、「決定」というコマンドワード発話し、このコマンドワードが音声認識手段で認識された場合に、発信先の電話番号へ発呼するよう電話機が制御される。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−58390号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
音声認識手段によって、通話の開始から終了までの処理をハンズフリーで行う場合、発呼時、および発呼に対する応答時には通話回線がまだつながっていないので、通話先との会話がまだ始まっておらず、会話中の単語によるコマンドワードの誤認識が発生することはない。しかし、通話中は通話回線がつながっているので、通常の会話の中に終話を示す言葉(終話コマンドワード)が入ると、会話中のなにげない言葉であるにも関わらず、音声認識手段が終話コマンドワードであると誤認識して通話回線を切断し、ユーザの意思に反して終話処理が行われてしまう。
【0006】
例えば、終話コマンドワードに「さよなら」等を用いることが一般的であり、このような一般的に終話を示す言葉は電話機の音声認識手段に予め記憶されているため、ユーザによるコマンドワードの記憶操作が不要となって使い勝手がよい。しかし、「C君に会ってさよならと言ったけど、返事してくれなかった」のように、通話中の会話に終話コマンドワード「さよなら」が入ることが十分考えられ、音声認識手段がこの「さよなら」を終話コマンドワードであると誤認識すると、通話回線が切断されてしまう。
【0007】
また、日常会話で使わないような「閉じろゴマ」のような言葉を終話コマンドワードに用いると、終話時に発したそのコマンドワードが通話先にも聞こえてしまい、会話が不自然になってしまう。また、このような日常会話で使わない「閉じろゴマ」のような言葉を終話コマンドワードとして用いる場合は、ユーザによるコマンドワードの記憶操作が必要となって使い勝手も低下する。
【0008】
本発明は、上記事由に鑑みてなされたものであり、その目的は、日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制可能な通話システムを提供することにある。
【課題を解決するための手段】
【0009】
請求項1の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、前記終話音声一致信号が音声認識部から出力された場合に、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。
【0010】
この発明によれば、通話中の通話装置の双方が第1の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0011】
請求項2の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、通話先から終話コマンドを含むデータを受信した場合に、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。
【0012】
この発明によれば、通話中の通話装置の双方が第1の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0013】
請求項3の発明は、一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、制御部は、前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、前記終話音声一致信号が音声認識部から出力された場合、または通話先から終話コマンドを含むデータを受信した場合、タイマ部による計時を開始する計時開始手段と、少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合、またはタイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段とを具備することを特徴とする。
【0014】
この発明によれば、通話中の通話装置の双方が第1の所定値に基づいて計時される期間内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。さらに、双方の通話装置がタイマ部による計時動作を個別に行い、第1の所定値内にユーザがコマンドワードを発したか否かを個別に判別するので、一方の通話装置が他方の通話装置へ終話通知を送信する必要がなく、通信トラフィックの低減化を図ることができる。
【0015】
請求項4の発明は、請求項1乃至3いずれかにおいて、前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに通話先との間で通話が行われなければ、通話先との通信を停止することを特徴とする。
【0016】
この発明によれば、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の終話コマンドワードを認識した後、双方が何も話さない無音状態が、第2の所定値に基づいて計時される期間、継続した場合にのみ通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0017】
請求項5の発明は、請求項1乃至3いずれかにおいて、各通話装置は、通話を行うユーザが所定範囲内に存在するか否かを検知するユーザ検知手段を備え、前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のユーザ検知手段が所定範囲内のユーザを検知しなくなれば、通話先との通信を停止することを特徴とする。
【0018】
この発明によれば、一般的な会話でお別れの挨拶をした以降にユーザが席を離れることを利用して、双方の終話コマンドワードを認識した後、第2の所定値に基づいて計時される期間に、少なくともいずれか一方が席を離れた場合に通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、離席の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0019】
請求項6の発明は、請求項1乃至3いずれかにおいて、各通話装置は、ユーザを撮像する撮像手段と、終話時にユーザが行う動作の映像データを格納した終話ジェスチャー記憶部と、撮像手段からの映像データが終話ジェスチャー記憶部に格納している映像データに一致するか否かを判定し、一致した場合には終話ジェスチャー一致信号を出力するジェスチャー認識部とを備え、前記制御部の終話処理手段は、前記終話処理開始トリガが発生し、且つタイマ部による計時が開始されてから計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のジェスチャー認識部から終話ジェスチャー一致信号が出力されると、通話先との通信を停止することを特徴とする。
【0020】
この発明によれば、一般的な会話でお別れの挨拶をした以降に「お辞儀」や「手を振る」等のジェスチャーが行われることを利用して、双方の終話コマンドワードを認識した後、第2の所定値に基づいて計時される期間において、ユーザが「お辞儀」や「手を振る」等のジェスチャーを行った場合にのみ通話回線を切断しており、通常の会話中の終話コマンドワードとお別れの挨拶の終話コマンドワードとを、終話ジェスチャーの有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0021】
請求項7の発明は、請求項1乃至6いずれかにおいて、各通話装置は、表示手段と、当該表示手段の表示動作を制御する表示制御手段とを備え、表示制御手段は、通話先から終話コマンドを含むデータを受信すると、表示手段の表示を変化させることを特徴とする。
【0022】
この発明によれば、ユーザは、通話先が終話処理に移行中であることを表示手段によって判断でき、さらには終話処理に至る進行度合も表示手段によって判断できるので、ユーザによる誤切断を抑制できる。
【発明の効果】
【0023】
以上説明したように、本発明では、日常的に通話を終了させる言葉を終話コマンドワードとして使用しながら、終話コマンドワードの誤認識を抑制することができるという効果がある。
【図面の簡単な説明】
【0024】
【図1】実施形態1の通話装置の構成を示す図である。
【図2】同上の通話システムの構成を示す図である。
【図3】同上のパケット信号の構造を示す図である。
【図4】同上の通話シーケンスを示す図である。
【図5】同上の別の通話シーケンスを示す図である。
【図6】実施形態2の通話シーケンスを示す図である。
【図7】実施形態3の通話装置の構成を示す図である。
【図8】同上の通話シーケンスを示す図である。
【図9】同上の別の通話シーケンスを示す図である。
【図10】実施形態4の通話装置の構成を示す図である。
【図11】同上の通話シーケンスを示す図である。
【図12】実施形態5の通話装置の構成を示す図である。
【図13】同上の通話シーケンスを示す図である。
【図14】実施形態6の通話装置の構成を示す図である。
【図15】同上の通話シーケンスを示す図である。
【発明を実施するための形態】
【0025】
以下、本発明の実施の形態を図面に基づいて説明する。
【0026】
(実施形態1)
図2は本実施形態の通話システムの構成を示し、インターネットを含むネットワークNTに複数の通話装置1が接続されている。各通話装置1は、ネットワークNTを介して1対1で通信可能な電話機であり、音声データおよび映像データを含むパケット信号を互いに送受信し、受信した映像データを表示するためのモニタ装置2が各々接続されている。
【0027】
通話装置1は、図1に示すように、マイクロホンM(音声入力部)、スピーカSP、カメラC(撮像手段)を備えており、マイクロホンMから入力された音声データ、およびカメラCが撮像した映像データをパケット信号に格納して通話先へ送信する。また、通話先からネットワークNTを介してパケット信号を受信すると、当該パケット信号に含まれる音声データをスピーカSPから出力し、当該パケット信号に含まれる映像データをモニタ装置2に表示させる。すなわち、双方向で、ユーザ同士が互いの映像を見ながら通話できるテレビ電話機として機能するものである。
【0028】
まず通話装置1では、ネットワークI/F部1hがネットワークNTとの間でパケット信号の授受を行っている。パケット信号は、図3に示すように、コマンドエリアD1、音声エリアD2、映像エリアD3で構成されており、コマンドエリアD1には通話先に対して各種通知等を行うためのコマンドデータが格納され、音声エリアD2には音声データが格納され、映像エリアD3には映像データが格納される。なお、全てのエリアにデータが格納される必要はなく、必要なエリアのみにデータが格納されておればよい。
【0029】
そして、カメラCが出力する映像データはA/D変換部1bによってA/D変換され、マイクロホンMが出力する音声データはA/D変換部1cによってA/D変換された後に、CPU等で構成される制御部1aに入力される。制御部1aは、マイクロホンMからの音声データを自己音声蓄積部1lに一時保存し、カメラCからの映像データを自己映像蓄積部1jに一時保存する。
【0030】
制御部1aは、自己音声蓄積部1lおよび自己映像蓄積部1jの音声データおよび映像データを順次読み出して、パケット信号の音声エリアD2および映像エリアD3に各々格納し、ネットワークI/F部1hからネットワークNTを介して通話先の通話装置1にパケット信号を送信する。
【0031】
また、制御部1aは、通話先からネットワークNT、ネットワークI/F部1hを介してパケット信号を受信すると、パケット信号の音声エリアD2および映像エリアD3に格納されている音声データおよび映像データを、相手音声蓄積部1kおよび相手映像蓄積部1iに各々一時保存する。次に制御部1aは、相手音声蓄積部1kの音声データを順次読み出してD/A変換部1eに入力し、D/A変換された音声データがスピーカSPから出力される。さらに、制御部1aは、相手映像蓄積部1iの映像データを順次読み出してD/A変換部1dに入力し、D/A変換された映像データがモニタ装置2に表示される。
【0032】
さらに通話装置1は、スピーカSPから出力される音声がマイクロホンMに回りこんで発生するハウリングを防止するためにエコーキャンセラ部1fを具備しており、エコーキャンセラ部1fは、マイクロホンM2が出力する音声データからスピーカSPに入力される音声データを減算したデータを、A/D変換部1cに出力している。したがって、送信される音声データは、スピーカSPからマイクロホンMに回りこんだ音声成分がキャンセルされており、ハウリングの発生が防止されている。
【0033】
そして、通話装置1では、ユーザが発話する特定の言葉を音声認識部1pが認識することによって、発呼、応答、終話等の各操作をハンズフリーで行うことを可能としており、以下、通話装置1間の通信における音声認識処理について説明する。
【0034】
通話装置1は、音声認識手段として、音声認識部1p、発呼コマンド格納部1q、応答コマンド格納部1r、終話コマンド格納部1sを備えている。発呼コマンド格納部1qには、「B君につないで」等の発呼操作時にユーザが用いる言葉が発呼コマンドワードとして格納されており、応答コマンド格納部1rには、「応答して」等の応答操作時にユーザが用いる言葉が応答コマンドワードとして格納されており、終話コマンド格納部1sには、「さよなら」「バイバイ」等の終話操作時にユーザが用いる言葉が終話コマンドワードとして格納されている。音声認識部1pは、自己音声蓄積部1lに保存されている音声データを、発呼コマンド格納部1q、応答コマンド格納部1r、終話コマンド格納部1sに格納している各コマンドワードと比較して、音声データ中にいずれかのコマンドワードと一致する言葉があれば、当該認識結果として、発呼音声一致信号、応答音声一致信号、終話音声一致信号を制御部1aに出力する。
【0035】
制御部1aは、音声認識部1pによる認識結果から、一致したコマンドワード[発呼コマンドワード、または応答コマンドワード、または終話コマンドワード]に対応するコマンドデータ[発呼コマンドデータ、または応答コマンドデータ、または終話コマンドデータ]を送信コマンド蓄積部1mに一時保存した後に読み出して、パケット信号のコマンドエリアD1に格納し(通話回線が接続状態であれば、上記音声データおよび映像データも音声エリアD2および映像エリアD3に格納し)、ネットワークI/F部1hからネットワークNTを介して通話先の通話装置1にパケット信号を送信する。
【0036】
また、制御部1aは、通話先からネットワークNT、ネットワークI/F部1hを介して、コマンドエリアD1にコマンドデータが格納されたパケット信号を受信すると、コマンドエリアD1に格納されているコマンドデータを、受信コマンド蓄積部1nに一時保存する。次に制御部1aは、受信コマンド蓄積部1nのコマンドデータを読み出して、コマンドデータに基づいた処理を行う。すなわちユーザが、発呼、応答、終話の各コマンドワードに設定されている言葉を発すれば、音声認識部1pが各コマンドワードに対応する処理を行うことで、ハンズフリー操作が可能となる。
【0037】
図4は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0038】
まず、発呼動作を行うために、ユーザAが通話装置11のマイクロホンMに対して「B君につないで」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と発呼コマンド格納部1q内のコマンドワード「B君につないで」とが一致するとして、発呼音声一致信号を制御部1aへ出力する。制御部1aは、B君の電話番号(またはIPアドレス)をコマンドワード「B君につないで」に対応させて予め格納しており、前記認識結果に基づいてユーザBの通話装置12へ発呼コマンドデータのみを格納した発呼通知P1を送信する(発呼処理)。なお、この発呼通知P1の送信経路については、図示しない呼制御サーバを用いて発信先の電話番号とIPアドレスとの対応付けを行う方法や、IPアドレスのみを用いて通話装置11から通話装置12へ直接送信する方法等が周知であり、詳細な説明は省略する。
【0039】
ネットワークNTを介して発呼通知P1を受信した通話装置12では、制御部1aがスピーカSPから呼び出し音を鳴動させる。この呼出音に反応したユーザBが通話装置12のマイクロホンMに対して「応答して」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と応答コマンド格納部1r内のコマンドワード「応答して」とが一致するとして、応答音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ応答コマンドデータのみを格納した応答通知P2を送信する(応答処理)。
【0040】
ネットワークNTを介して応答通知P2を受信した通話装置11では、制御部1aが、予め決められた応答確認コマンドデータのみを格納した応答確認P3を通話装置12へ送信し、マイクロホンMからの音声データ、カメラCからの映像データを格納したパケット信号を生成して送信する通話機能を実行状態にする(応答確認処理)。
【0041】
ネットワークNTを介して応答確認P3を受信した通話装置12では、制御部1aが、マイクロホンMからの音声データ、カメラCからの映像データを格納したパケット信号を生成して送信する通話機能を実行状態にすることで、通話装置11−12間の通話回線が確立される(回線確立処理)。
【0042】
以降は、通話装置11−12間で、音声データおよび映像データを格納したパケット信号Paを互いに送受信して、通話が行われる。以降、終話コマンドワードが入らない会話がユーザA,B間で行われている間は、パケット信号PaのコマンドエリアD1には終話コマンドデータが格納されることがない。
【0043】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0044】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12では、表示制御手段としても機能する制御部1aが、表示手段を構成するLED1zを点灯させることで、ユーザBに対して終話待ち状態であること報知する。そして通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。なお、通話装置12では、終話パケット信号P5を送信した時点でLED1zを消灯させる。
【0045】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aは、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信した後に、通話機能を停止して通話回線を切断する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0046】
また、通話装置11において、終話パケット信号P5を受信しなければ(すなわち、ユーザBが通話を終了させるための「さよなら」という言葉を発しておらず、終話処理開始トリガが発生しなければ)、図5に示すように、タイマ部100の計時時間が終話タイマ値T1に達した時点で、制御部1aは、タイマ部100の計時時間をリセットして終話待ちモードを終了し、予め決められたタイムアウトコマンドデータを格納したタイムアウトパケット信号P11を、ユーザBの通話装置12へ送信する。以降は、通話装置11または12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。この場合、通話装置12では、終話パケット信号P4を受信した時点でLED1zを点灯させ、タイムアウトパケット信号P11を受信した時点でLED1zを消灯させる。
【0047】
而して、通話装置11は、タイマ部100の計時時間が終話タイマ値T1に達した後に、終話パケット信号P5を受信したとしても、ユーザBの通話装置12へ終話通知P6を送信することはなく、通話機能を停止して通話回線を切断することもない。すなわち、終話処理を行うことはない。
【0048】
したがって、通話装置11,12の双方が終話タイマ値T1内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0049】
(実施形態2)
本実施形態の通話システムは、実施形態1と同様に図1の構成を備えており、説明は省略する。
【0050】
図6は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0051】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0052】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信する[終話コマンド送信手段]。
【0053】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12では、制御部1aが内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置12の制御部1aは通常モードから終話待ちモードとなる。さらに、表示制御手段としても機能する制御部1aが、表示手段を構成するLED1zを点灯させることで、ユーザBに対して終話待ち状態であること報知する。
【0054】
そして、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、通話装置12のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。終話音声一致信号を受け取った制御部1aは、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザAの通話装置11へ送信した後に、通話機能を停止して通話回線を切断する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置11では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。なお、通話装置12では、終話通知P6を送信した時点でLED1zを消灯させる。
【0055】
また、通話装置12において、ユーザBが通話を終了させるための「さよなら」という言葉を発することなく、終話処理開始トリガが発生しなければ、タイマ部100の計時時間が終話タイマ値T1に達した時点で、制御部1aは、タイマ部100の計時時間をリセットして終話待ちモードを終了する。以降は、通話装置11または12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。
【0056】
而して、通話装置12は、タイマ部100の計時時間が終話タイマ値T1に達した後に、ユーザBが通話を終了させるための「さよなら」という言葉を発したとしても、ユーザAの通話装置11へ終話通知P6を送信することはなく、通話機能を停止して通話回線を切断することもない。すなわち、終話処理を行うことはない。
【0057】
したがって、通話装置11,12の双方が終話タイマ値T1内に終話コマンドワードを発した場合のみ、双方が終話の意思表示をしたものとみなして終話処理を行い、通話回線を切断する。したがって、一方の通話中の会話に入った「さよなら」という言葉や、一定時間以上の間隔で双方から発せられた「さよなら」という言葉によって、通話回線が切断されてしまう誤認識を防止できる。さらに、日常的に通話を終了させる「さよなら」のような言葉を終話コマンドワードとして使用でき、使い勝手がよいものとなる。
【0058】
(実施形態3)
図7は本実施形態の通話システムの構成を示し、実施形態1の通話装置1に無音タイマ値格納部1tを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0059】
図8は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0060】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0061】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0062】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0063】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aが、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、無音タイマ値格納部1tに予め設定している無音タイマ値T2と比較する。そして、タイマ部100の計時時間が無音タイマ値T2に達するまでユーザA,Bの双方が言葉を発することなく無音状態が継続すれば、終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信した後に、通話機能を停止して通話回線を切断する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0064】
また、図9のように、無音タイマ値T2の計時中にユーザAが「それでね」という会話を継続させる言葉を発すると、通話装置11の制御部1aはタイマ部100の計時動作をリセットして通常モードに戻るとともに、予め決められた通話継続コマンドデータを格納した通話継続パケット信号P12を、ユーザBの通話装置12へ送信する。以降は、通話装置11または12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。
【0065】
例えば、ユーザA−B間の会話中に、例えば「C君に会って、さよならと言ったけど返事してくれなかったの」に対して、「そう、さよならも言ってくれなかったの」のように、通常の会話の中で「さよなら」を双方が発する場合が考えられ、この通常の会話中に発せられた双方の「さよなら」を終話コマンドワードと誤認識する虞がある。
【0066】
しかしながら本実施形態では、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、無音タイマ値T2の間、双方が何も話さない無音状態が継続した場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0067】
なお、本実施形態の無音期間の有無によって終話処理を行か否かを判断する構成は、実施形態2の構成に適用しても上記同様の効果を得ることができる。
【0068】
(実施形態4)
図10は本実施形態の通話システムの構成を示し、実施形態1の通話装置1にジェスチャー待ちタイマ値格納部1u、ジェスチャー認識部1v、終話得ジェスチャー記憶部1wを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0069】
図11は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0070】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0071】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1、およびジェスチャー待ちタイマ値格納部1uに予め設定しているジェスチャー待ちタイマ値T3と比較し、タイマ部100の計時時間が終話タイマ値T1またはジェスチャー待ちタイマ値T3内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。なお、本実施形態では、終話タイマ値T1<ジェスチャー待ちタイマ値T3の関係にあるが、T1=T3、T1>T3の関係に設定してもよい。さらには、終話タイマ値T1とジェスチャー待ちタイマ値T3との各計時期間が重複することなく、例えば終話タイマ値T1を計時した後にジェスチャー待ちタイマ値T3を計時する構成でもよい。
【0072】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0073】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11では、タイマ部100の計時時間が終話タイマ値T1に達していなければ、終話処理開始トリガの発生を記憶する。
【0074】
さらに、本実施形態では、終話処理開始トリガが発生し、且つタイマ部100の計時時間がジェスチャー待ちタイマ値T3に達するまでに、ユーザA,Bの双方が終話動作を行えば終話処理可能であると判断する。
【0075】
各通話装置1において、終話ジェスチャー記憶部1wには、「お辞儀」や「手を振る」等の終話時に一般的に行われるジェスチャーを映像データ(終話ジェスチャーデータ)で格納している。そして、ジェスチャー認識部1vは、自己映像蓄積部1jに保存されている映像データを、終話ジェスチャー記憶部1wに格納している終話ジェスチャーデータと比較して、映像データ中に終話ジェスチャーデータと一致する映像があれば、ユーザの終話ジェスチャーを検知したとして、終話ジェスチャー一致信号を制御部1aに出力する。
【0076】
制御部1aは、ジェスチャー認識部1vによる認識結果から、終話動作コマンドデータを送信コマンド蓄積部1mに一時保存した後に読み出して、パケット信号のコマンドエリアD1に格納し(通話回線が接続状態であれば、上記音声データおよび映像データも音声エリアD2および映像エリアD3に格納し)、ネットワークI/F部1hからネットワークNTを介して通話先の通話装置1にパケット信号を送信する。
【0077】
而して、通話装置11においてジェスチャー待ちタイマ値T3の計時中に、例えば、通話装置12がユーザBの「お辞儀」や「手を振る」等の終話ジェスチャーを検知すると、終話動作コマンドを格納したパケット信号P7が通話装置12から通話装置11へ送信される。ネットワークNTを介してパケット信号P7を受信した通話装置11においても、ユーザBの終話ジェスチャーに反応したユーザAが、終話ジェスチャーを行うと、ジェスチャー認識部1vの認識結果に基づいてユーザBの通話装置12へ終話動作コマンドデータを格納したパケット信号P8を送信するとともに、当該認識結果を制御部1aに出力する。したがって、通話装置11の制御部1aは、終話処理開始トリガが発生し、且つ通話装置11,12ともにユーザが終話ジェスチャーを行ったので終話処理可能であると判断して、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信し、通話機能を停止して通話回線を切断する[第1の集話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の集話処理手段](終話処理)。
【0078】
このように本実施形態では、一般的な会話でお別れの挨拶をした以降に「お辞儀」や「手を振る」等のジェスチャーが行われることを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、ジェスチャー待ちタイマ値T3の間に、双方が「お辞儀」や「手を振る」等のジェスチャーを行った場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、終話ジェスチャーの有無によって区別して、終話コマンドワードの誤認識を防止できる。また、ユーザA,Bのいずれか一方が終話動作を行えば終話処理可能であると判断してもよい。
【0079】
また、終話パケット信号P4,P5、終話動作コマンドを格納したパケット信号P7,P8が送信される順番は図11の例に限定されることなく、例えば、ユーザAが「さよなら」という終輪コマンドワードを発するとともに「お辞儀」や「手を振る」等の終話ジェスチャーを行い、その後にユーザBが「さよなら」という終輪コマンドワードを発するとともに「お辞儀」や「手を振る」等の終話ジェスチャーを行う場合でも、上記同様に動作する。この場合、終話パケット信号P4 → 終話動作コマンドを格納したパケット信号P7 → 終話パケット信号P5 → 終話動作コマンドを格納したパケット信号P8のように、パケット信号P4〜P7がタイマ値T1,T3内に混在する。
【0080】
なお、本実施形態の終話ジェスチャーの有無によって終話処理を行か否かを判断する構成は、実施形態2の構成に適用しても上記同様の効果を得ることができる。
【0081】
(実施形態5)
図12は本実施形態の通話システムの構成を示し、実施形態1の通話装置1に離席タイマ値格納部1x、測距センサ1yを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0082】
図13は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0083】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0084】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に、内部に具備したタイマ部100の計時動作を開始する[計時開始手段]。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0085】
ネットワークNTを介して終話パケット信号P4を受信した通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0086】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aが、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、離席タイマ値格納部1xに予め設定している離席タイマ値T4と比較する。
【0087】
そして本実施形態では、タイマ部100の計時時間が離席タイマ値T4に達するまでに、少なくともユーザA,Bのいずれかが、通話を行うための定位置から離席すれば終話処理可能であると判断する。
【0088】
ここで、通話装置1の測距センサ1yは、通話中のユーザを検知対象として当該ユーザまでの距離を測定している。制御部1aは、ユーザまでの距離が所定距離未満であれば、通話を行うための定位置に着席中であると判定し、ユーザまでの距離が所定距離以上であれば、通話を行うための定位置から離席したと判定するとともに通話先へ離席通知を送信する。
【0089】
而して、通話装置12がユーザBの離席を検知した場合、図13に示すように、予め決められた離席通知コマンドデータのみを格納した離席通知P13をユーザAの通話装置11へ送信する。そして、通話装置11では、タイマ部100の計時時間が離席タイマ値T4に達するまでに離席通知P13を受信すれば、制御部1aが、通話機能を停止して通話回線を切断するとともに、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0090】
また、通話装置11が、タイマ部100の計時時間が離席タイマ値T4に達するまでにユーザAの離席を検知した場合は、制御部1aが、通話機能を停止して通話回線を切断するとともに、予め決められた終話通知コマンドデータのみを格納した終話通知P6をユーザBの通話装置12へ送信する[第1の終話処理手段]。そして、ネットワークNTを介して終話通知P6を受信した通話装置12では、制御部1aが、通話機能を停止して通話回線を切断する[第2の終話処理手段](終話処理)。
【0091】
このように本実施形態では、一般的な会話でお別れの挨拶をした以降にユーザが席を離れることを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、離席タイマ値T4の間に、少なくともいずれか一方が席を離れた場合に通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、離席の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0092】
また、測距センサの代わりに、人感センサや顔認識手段を用いてユーザの離席を検知してもよい。なお、顔認識手段は、撮像範囲におけるユーザの顔の位置を認識するものであり、撮像範囲から顔が外れることによって離席検知を行う。
【0093】
なお、本実施形態の離席の有無によって終話処理を行か否かを判断する構成は、実施形態2の構成に適用しても上記同様の効果を得ることができる。
【0094】
(実施形態6)
図14は本実施形態の通話システムの構成を示し、実施形態3の通話装置1にLED1zを設けたものであり、実施形態1と同様の構成には同一の符号を付して説明は省略する。
【0095】
図15は、本通話システムの一対の通話装置11−12間の通話シーケンスであり、この通話シーケンスを用いて発呼から終話までの処理について説明する。なお、通話装置11はユーザAが使用し、通話装置12はユーザBが使用するものとする。
【0096】
発呼通知P1を用いた発呼処理、応答通知P2を用いた応答処理、応答確認P3を用いた応答確認処理および回線確立処理、音声データおよび映像データを格納したパケット信号Paを用いた通話処理については実施形態1と同様であり、説明は省略する。
【0097】
そして、ユーザAが通話を終了させようとして、通話装置11のマイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。制御部1aは、前記認識結果に基づいてユーザBの通話装置12へ終話コマンドデータを格納した終話パケット信号P4を送信すると同時に[終話コマンド送信手段]、内部に具備したタイマ部100の計時動作を開始し[計時開始手段]、さらにはLED1zを黄色点灯させる。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め設定している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置11の制御部1aは通常モードから終話待ちモードとなる。
【0098】
通話装置12では、ネットワークNTを介して終話パケット信号P4を受信すると、内部に具備したタイマ部100の計時動作を開始し[計時開始手段]、さらにはLED1zを黄色点灯させる。そして制御部1aは、タイマ部100の計時時間を、終話タイマ値格納部1gに予め格納している終話タイマ値T1と比較し、タイマ部100の計時時間が終話タイマ値T1内であれば、通話装置12の制御部1aは終話待ちモードとなる。
【0099】
そして、通話装置12においても、ユーザAの発した「さよなら」に反応したユーザBが通話を終了させようとして、マイクロホンMに対して「さよなら」という言葉を入力すると、音声認識部1pにおいて、入力された言葉と終話コマンド格納部1s内のコマンドワード「さよなら」とが一致するとして、終話音声一致信号を制御部1aへ出力する。終話音声一致信号を受け取った制御部1aは、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、LED1zを赤色点灯させるとともに、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、無音タイマ値格納部1tに予め設定している無音タイマ値T2と比較する。さらには、前記認識結果に基づいてユーザAの通話装置11へ終話コマンドデータを格納した終話パケット信号P5を送信する[終話コマンド送信手段]。
【0100】
ネットワークNTを介して終話パケット信号P5を受信した通話装置11において、タイマ部100の計時時間が終話タイマ値T1に達しておらず、終話待ちモードを維持しておれば[終話処理開始トリガ]、制御部1aは、LED1zを赤色点灯させるとともに、タイマ部100の計時時間をリセットした後に計時動作を再開し、タイマ部100の計時時間を、無音タイマ値格納部1tに予め設定している無音タイマ値T2と比較する。
【0101】
そして本実施形態では、タイマ部100の計時時間が無音タイマ値T2に達するまでに、ユーザA,Bの双方が言葉を発することなく無音状態が継続すれば、終話処理可能であると判断する。
【0102】
而して、通話装置11,12において無音タイマ値T2の間、無音状態が継続すれば、図15に示すように、通話装置11,12の各制御部1aは、通話機能を停止して通話回線を切断する(終話処理)。
【0103】
また、無音タイマ値T2の計時中にユーザAが「それでね」という会話を継続させる言葉を発すると、通話装置11の制御部1aはタイマ部100の計時動作をリセットして通常モードに戻るとともに、予め決められた通話継続コマンドデータを格納した通話継続パケット信号(図示なし)を、ユーザBの通話装置12へ送信する。通話継続パケット信号を受信した通話装置12においても、制御部1aがタイマ部100の計時動作をリセットして通常モードに戻る。以降は、通話装置11および12が終話待ちモードに再び切り替わるまで、音声データおよび映像データを格納したパケット信号Paを互いに送受信する通常の通話処理を行う。
【0104】
このように本実施形態では、通常の電話であり得るお別れの挨拶の後、受話器を置くまで何も言わないということを利用して、双方の「さよなら」を終話コマンドワードとして認識した後、無音タイマ値T2の間、双方が何も話さない無音状態が継続した場合にのみ通話回線を切断しており、通常の会話中の「さよなら」とお別れの挨拶の「さよなら」とを、無音期間の有無によって区別して、終話コマンドワードの誤認識を防止できる。
【0105】
さらに、通話装置11,12の双方がタイマ部100による計時動作を個別に行い、終話タイマ値T1内にユーザがコマンドワード「さよなら」を発したか否かを個別に判別するので、実施形態3のように終話通知P6を送信する必要がなく、通信トラフィックの低減化を図ることができる。
【0106】
さらにユーザは、通話先が終話処理に移行中であることをLED1zの発光色によって判断でき、さらには終話処理に至る進行度合もLED1zの発光色によって判断できるので、ユーザによる誤切断を抑制できる。また、LED1zの発光色の変化に連動して、モニタ装置2にLED1zの発光色が意味する内容を文字で表示したり、モニタ装置2の表示色も黄色から赤色に徐々に変化させてもよい。
【0107】
また、実施形態4,5では、終話パケット信号P4を送信した通話装置11のみがタイマ部100を動作させて、終話タイマ値T1の計時を行う構成、または終話パケット信号P4を受信した通話装置12のみがタイマ部100を動作させて、終話タイマ値T1の計時を行う構成を示したが、実施形態4,5においても、実施形態6と同様に終話パケット信号P4を送受信した通話装置11,12の双方がタイマ部100を動作させて、終話タイマ値T1の計時を行う構成や、終話処理に至る進行度合をLEDの発光色によって判断する構成を適用することは可能である。
【0108】
さらに、上記実施形態では、伝送路としてインターネットを用いており、パケット通信によって音声データ、画像データ、各種コマンドデータ等を送信している。しかし、伝送路として一般電話回線を用いてもよく、この場合はコマンドデータとしてトーン信号が用いられる。また、一般電話回線で音声データ、画像データを送信し、インターネットでコマンドデータを送信してもよい。
【符号の説明】
【0109】
1 通話装置
100 タイマ部
1a 制御部
1g 終話タイマ値格納部
1p 音声認識部
1s 終話コマンド格納部
C カメラ
M マイクロホン
SP スピーカ
NT インターネット
【特許請求の範囲】
【請求項1】
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
前記終話音声一致信号が音声認識部から出力された場合に、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
【請求項2】
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
通話先から終話コマンドを含むデータを受信した場合に、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
【請求項3】
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
前記終話音声一致信号が音声認識部から出力された場合、または通話先から終話コマンドを含むデータを受信した場合、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合、またはタイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
【請求項4】
前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに通話先との間で通話が行われなければ、通話先との通信を停止することを特徴とする請求項1乃至3いずれか記載の通話システム。
【請求項5】
各通話装置は、通話を行うユーザが所定範囲内に存在するか否かを検知するユーザ検知手段を備え、
前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のユーザ検知手段が所定範囲内のユーザを検知しなくなれば、通話先との通信を停止する
ことを特徴とする請求項1乃至3いずれか記載の通話システム。
【請求項6】
各通話装置は、ユーザを撮像する撮像手段と、終話時にユーザが行う動作の映像データを格納した終話ジェスチャー記憶部と、撮像手段からの映像データが終話ジェスチャー記憶部に格納している映像データに一致するか否かを判定し、一致した場合には終話ジェスチャー一致信号を出力するジェスチャー認識部とを備え、
前記制御部の終話処理手段は、前記終話処理開始トリガが発生し、且つタイマ部による計時が開始されてから計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のジェスチャー認識部から終話ジェスチャー一致信号が出力されると、通話先との通信を停止する
ことを特徴とする請求項1乃至3いずれか記載の通話システム。
【請求項7】
各通話装置は、表示手段と、当該表示手段の表示動作を制御する表示制御手段とを備え、
表示制御手段は、通話先から終話コマンドを含むデータを受信すると、表示手段の表示を変化させることを特徴とする請求項1乃至6いずれか記載の通話システム。
【請求項1】
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
前記終話音声一致信号が音声認識部から出力された場合に、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
【請求項2】
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
通話先から終話コマンドを含むデータを受信した場合に、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
【請求項3】
一対の通話装置が伝送路を介して互いにデータを送受信することによって通話を行う通話システムであって、
各通話装置は、通話先に送信するデータを生成し、通話先から受信したデータに基づく処理を行う制御部と、ユーザの発した音声を入力する音声入力部と、終話操作時にユーザが用いる言葉の音声データである終話コマンドワードを格納した終話コマンド格納部と、音声入力部に入力された音声データが終話コマンド格納部に格納している終話コマンドワードに一致するか否かを判定し、一致した場合には終話音声一致信号を出力する音声認識部と、計時動作を行うタイマ部とを備え、
制御部は、
前記終話音声一致信号が音声認識部から出力された場合に、終話コマンドを含むデータを通話先へ送信する終話コマンド送信手段と、
前記終話音声一致信号が音声認識部から出力された場合、または通話先から終話コマンドを含むデータを受信した場合、タイマ部による計時を開始する計時開始手段と、
少なくとも、タイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに通話先から終話コマンドを含むデータを受信する終話処理開始トリガが発生した場合、またはタイマ部による計時が開始されてから計時時間が予め設定された第1の所定値に達するまでに前記終話音声一致信号が音声認識部から出力される終話処理開始トリガが発生した場合に、通話先との通信を停止する終話処理手段と
を具備する
ことを特徴とする通話システム。
【請求項4】
前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに通話先との間で通話が行われなければ、通話先との通信を停止することを特徴とする請求項1乃至3いずれか記載の通話システム。
【請求項5】
各通話装置は、通話を行うユーザが所定範囲内に存在するか否かを検知するユーザ検知手段を備え、
前記制御部の終話処理手段は、前記終話処理開始トリガが発生した後、タイマ部による計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のユーザ検知手段が所定範囲内のユーザを検知しなくなれば、通話先との通信を停止する
ことを特徴とする請求項1乃至3いずれか記載の通話システム。
【請求項6】
各通話装置は、ユーザを撮像する撮像手段と、終話時にユーザが行う動作の映像データを格納した終話ジェスチャー記憶部と、撮像手段からの映像データが終話ジェスチャー記憶部に格納している映像データに一致するか否かを判定し、一致した場合には終話ジェスチャー一致信号を出力するジェスチャー認識部とを備え、
前記制御部の終話処理手段は、前記終話処理開始トリガが発生し、且つタイマ部による計時が開始されてから計時時間が予め設定された第2の所定値に達するまでに、少なくとも一方の通話装置のジェスチャー認識部から終話ジェスチャー一致信号が出力されると、通話先との通信を停止する
ことを特徴とする請求項1乃至3いずれか記載の通話システム。
【請求項7】
各通話装置は、表示手段と、当該表示手段の表示動作を制御する表示制御手段とを備え、
表示制御手段は、通話先から終話コマンドを含むデータを受信すると、表示手段の表示を変化させることを特徴とする請求項1乃至6いずれか記載の通話システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2010−183205(P2010−183205A)
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願番号】特願2009−23125(P2009−23125)
【出願日】平成21年2月3日(2009.2.3)
【出願人】(000005832)パナソニック電工株式会社 (17,916)
【Fターム(参考)】
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願日】平成21年2月3日(2009.2.3)
【出願人】(000005832)パナソニック電工株式会社 (17,916)
【Fターム(参考)】
[ Back to top ]