テレビ会議システム、テレビ会議方法、プログラムおよび記録媒体
【課題】プライバシー保護機能を備えたテレビ会議システムを提供すること。
【解決手段】撮影部100で撮影した画像から、画像認識部110にて顔領域を検出し、検出した顔領域画像からユーザが居眠りをしているかどうかを判定する。ユーザが居眠りをしていると判断した場合、テレビ会議通話を一時保留状態にし、映像および音声の送信を停止する。ユーザが覚醒したと判断した場合、一時保留状態を解除する。あるいは、画像認識部110にてユーザが居眠りをしていると判断した場合、テレビ会議通話を切断する。
【解決手段】撮影部100で撮影した画像から、画像認識部110にて顔領域を検出し、検出した顔領域画像からユーザが居眠りをしているかどうかを判定する。ユーザが居眠りをしていると判断した場合、テレビ会議通話を一時保留状態にし、映像および音声の送信を停止する。ユーザが覚醒したと判断した場合、一時保留状態を解除する。あるいは、画像認識部110にてユーザが居眠りをしていると判断した場合、テレビ会議通話を切断する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像および音声を用いて双方向コミュニケーションを行うことができるテレビ会議システムに関する。
【背景技術】
【0002】
カメラとマイクを備え、映像と音声を双方向に送受信できるテレビ会議システムが多数実用化されている。カメラとマイクを備え、インターネットに接続されたパーソナルコンピュータで動作するテレビ会議ソフトウェアの登場や、カメラつき携帯電話での対応などにより、専用システムによる運用が行われていた時代と比較して、飛躍的にテレビ会議の利用者数が増加している。テレビ会議機能を備えたテレビも登場しており、テレビ会議が非常に身近なコミュニケーション手段のひとつになりつつある。
【0003】
このようなテレビ会議システムにおいて、自動的に映像および音声の送受信を停止させるシステムが開示されている。特許文献1におけるテレビ会議システムでは、カメラから取り込まれた映像のフレーム間差分情報から算出した動きベクトルや、カメラのオートフォーカス情報を用いて、ユーザが離席したかどうかを判定し、離席したと判定した場合、通話を切断するよう構成されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平8−336122号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に示したようなテレビ会議システムにおける従来の自動通話切断機能は、主に省電力化や通信料金の節約を目的としており、ユーザのプライバシー保護を目的とした適用はこれまでなされていなかった。インターネットを介したテレビ会議が主流となり、コストを意識せずにテレビ会議ができるようになるにつれ、テレビ会議が行われる機会および時間はますます増大していく可能性が高い。そのような状況下では、テレビのながら見のように、映像・音声のやりとりが行われる通話状態が、長時間行われることが十分予想される。その結果として、ユーザが居眠りをしてしまい、居眠り中の映像や音声が通話相手に送信されるといった弊害の発生が考えられるが、そのような課題に対して、映像や音声の送信を停止させ、ユーザのプライバシーを保護するようなシステムはこれまで存在しなかった。
【課題を解決するための手段】
【0006】
前記課題を解決するために、本発明のテレビ会議システムは、通信手段を介して画像信号および音声信号を送受信可能な通信部と、前記画像信号を生成する撮影部と、前記音声信号を生成する音声入力部と、前記画像信号に基づく画像を表示する表示部と、前記音声信号に基づく音声を出力する音声出力部と、送信予定の画像信号に含まれる被写体の覚醒度を監視する監視部と、前記画像信号および前記音声信号を送受信する相手先との通信を制御する制御部を備え、前記監視部で得られる被写体の覚醒度に基づき、前記送信予定の画像信号が相手先の表示部に表示されるかどうかを制御する。
【0007】
また、前記課題を解決するために、本発明のテレビ会議方法は、通信手段を介して画像信号および音声信号を送受信する通信ステップと、前記画像信号および前記音声信号を互いに送受信する相手先を選択可能な選択ステップと、前記画像信号を生成する撮影ステップと、前記音声信号を生成する音声入力ステップと、前記画像信号に基づく画像を表示する表示ステップと、前記音声信号に基づく音声を出力する音声出力ステップと、送信予定の画像信号に含まれる被写体の覚醒度を監視する監視ステップと、前記監視部にて得られる被写体の覚醒度に基づき、当該画像信号が相手先の表示部に表示されるかどうかを制御する制御ステップからなる。
【発明の効果】
【0008】
本発明のテレビ会議システムによれば、ユーザの居眠り状態を検出することでユーザが意図しない映像や音声の送信を防止できるため、ユーザのプライバシーを保護することができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施の形態1におけるテレビ会議システムの端末の構成を示すブロック図
【図2】本発明の実施の形態1におけるテレビ会議システムのシステム構成例を示す図
【図3】本発明の実施の形態1におけるテレビ会議システムのログイン画面を示す図
【図4】本発明の実施の形態1におけるテレビ会議システムへのログイン後の画面表示例を示す図
【図5】本発明の実施の形態1におけるテレビ会議システムの通話確立時の画面表示例を示す図
【図6】本発明の実施の形態1におけるテレビ会議システムにて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【図7】本発明の実施の形態2におけるテレビ会議システムにて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【図8】本発明の実施の形態2におけるテレビ会議システムにて、通話相手の端末が一時保留中であった場合の画面表示例を示す図
【図9】本発明の実施の形態3におけるテレビ会議システムにて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【図10】本発明の実施の形態4におけるテレビ会議機能を備えたテレビのブロック図
【図11】本発明の実施の形態4におけるテレビ会議中の表示部160の表示の一例を示す図
【図12】本発明の実施の形態4におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【発明を実施するための形態】
【0010】
以下に、本発明の実施の形態について、図面を参照しながら説明する。
【0011】
(実施の形態1)
図1は、本発明の実施の形態1におけるテレビ会議システムの端末を示すブロック図である。図1において、撮影部100は典型的にはカメラであり、撮影部100で撮影された画像は、画像認識部110に入力される。画像認識部110は、撮影部100で撮影された画像に対して様々な画像処理を施すことで、画像から各種の情報を取り出すことができる。本実施例においては、テレビ会議システムのユーザが居眠りをしているかどうかを判定する。具体的には、撮影画像から顔画像を検出し、更に、検出された顔画像から目に該当する領域を抽出し、目領域の形状または面積よりユーザの覚醒度を算出し、ユーザが居眠りを行っているかどうかを判定する。判定結果は制御部120に送信される。
【0012】
通信部125はネットワークと接続しておりテレビ会議時に、通話相手と映像データおよび音声データの送受信を行う。音声入力部130は典型的にはマイクおよびマイクから出力されるアナログの音声信号をデジタル信号に変換するA/Dコンバータ等から構成されており、音声入力部130から入力された音声はデジタル信号として音声CODEC135に入力された後、圧縮処理が施され、通信部125を通してネットワークに送信される。撮影部100から入力された映像はデジタル信号として映像CODEC140にて圧縮され、通信部125を通してネットワークに送信される。一方、通信部125にて受信された、圧縮音声データは音声CODEC135で伸長された後、音声処理部145にて音量調整などの音質調整処理が適宜施され、典型的にはスピーカーである音声出力部150から出力される。同様に、通信部125にて受信された圧縮映像データは映像CODEC140にて伸長され、映像処理部155にて適宜画像サイズの変更が施された後、アイコンやメニューなどの画像表示と重畳され、液晶パネルやプラズマディスプレイパネルに代表される表示部160に表示される。
【0013】
リモコン170は、本実施例におけるテレビ会議システムを操作するための各種ボタンを備えたリモコンである。リモコン170の入力は、赤外線等を用いて受信部175に通知される。受信部175では受信した信号をデジタルテレビの操作コマンドに変換し、制御部120に通知する。
【0014】
タイマー180は、テレビ会議の通話時間の計測に使用される。
【0015】
なお、本実施例におけるテレビ会議システムの端末の主要なブロックはバス190にて相互に接続されており、バスを経由して映像データや音声データ、各種制御信号のやり取りを行う。また、制御部120は本テレビ会議システムの端末の主要なブロックを統合的に制御する。
【0016】
図2は、本実施例におけるテレビ会議システムのシステム構成例である。図2においては、拠点200aと、拠点200bを1対1で接続し、映像および音声の送受信を行う例を示している。ユーザ210aおよびユーザ210bはそれぞれ、図1で示した、テレビ会議システムの端末220aおよび端末220bの利用者である。どちらの端末にもそれぞれ、撮影部100aと音声入力部130aおよび撮影部100bと音声入力部130bを備えている。
【0017】
サーバ230はテレビ会議システムの制御を行うためのサーバであり、クライアントである端末220aおよび端末220bと通信を確立し、発呼や保留、通話切断などの呼制御や、映像データおよび音声データの中継、ユーザ情報の管理などを行う。
【0018】
サーバ230、端末220aおよび端末220bは通信路240を介してインターネット250に接続されている。
【0019】
なお、図2はテレビ会議を行うための最小限の構成例であり、拠点の数は3つ以上でもよく、更に、負荷分散のため、サーバ230が複数台で構成されていてもよい。端末がサーバ機能を兼ねる構成でも構わない。
【0020】
以上のように構成されたテレビ会議システムにおいて、以下、テレビ会議機能の動作説明を行う。
【0021】
まず、テレビ会議システムのユーザはテレビ会議システムへのログインを行う。リモコン170を操作することにより、図3に示すログイン画面が表示部160に表示される。図3において、表示部160にはテレビ会議システムのユーザに対応するログインIDを選択するためのダイアログ300が表示されており、ダイアログ300内には登録済みのユーザIDが表示されている。ユーザはリモコン170に備えた上下左右の指示が可能な移動キーを用いてカーソル315を動かし、自身に対応するユーザIDを指定し、リモコン170に備えた決定ボタンを押下することで、自身に対応するユーザIDが選択される。ユーザID選択後、カーソル315をログインボタン320へと移動させ、リモコン170に備えた決定ボタンを押下することでログイン処理が開始される。また、キャンセルボタン330を選択することもできる。キャンセルボタン330を選択すると、図示していない、ネットワーク設定などのテレビ会議システムの諸設定を行うためのメニュー画面に戻る。
【0022】
なお、ログイン時に別ユーザへのなりすましを防止するためにパスワード入力を促すようシステムを構成してもよい。
【0023】
図4はテレビ会議システムへログインした後の画面の表示例である。図4において、コンタクトリスト400は、ログインしたユーザが登録しているテレビ会議システムの相手ユーザを表示している。相手ユーザのユーザIDの隣には相手ユーザの現在のステータスを示すアイコンが表示されており、発呼前に相手ユーザの状態を知ることができる。ステータスはサーバ230に問い合わせることで取得できる。アイコン410aはオンライン、すなわちテレビ会議可能であることを示している。アイコン410b、アイコン410cはオフラインのため現在テレビ会議ができないことを示している。オフラインとは、端末の電源がオフとなっている場合や、一時的に端末がネットワークから切り離されている場合、端末の電源は入っているものの該当するユーザがログインしていない場合など、通信ができない状態になっていることである。アイコン410dはビジー中、すなわちすでに相手ユーザが別のユーザとテレビ会議中であることを示している。アイコン410eは、当該通話相手がテレビ会議を行いたくない状態であることを示している。
【0024】
カーソル415はリモコン170を用いて上下に移動可能であり、発呼対象となる相手を選択することができる。なお、相手ユーザ数が多いためコンタクトリスト400に相手ユーザの表示が納まりきらない場合、スクロール指示ボタン420をカーソル415で選択することで、表示されていない相手ユーザをコンタクトリスト400内に表示することができる。
【0025】
また、ログイン情報430には、現在ログイン中のユーザのユーザIDと、そのステータスが表示されている。ログイン中のユーザのステータスを変更したい場合、ログイン中のユーザのステータスを表すアイコン440を、リモコン170を用いて選択すると、変更可能なステータスが一覧表示されるので、希望するステータスを選択する。選択したステータスはサーバ230に通知される。
【0026】
発呼を行いたい場合、オンラインの相手ユーザの中から自分が通話したい相手を選択し、リモコン170に備えられた選択ボタンを押下すると、選択した通話相手に対して発呼が開始される。相手ユーザ側端末の表示部160には着呼がある旨のダイアログが表示され、ダイアログ内のボタンをリモコン170を用いて押下し着呼に応答すると、通話が確立する。
【0027】
図5は通話確立時の端末の表示部160の表示例である。図5はAさんと通話が確立し、互いの端末間で映像と音声が送受信される状態となっている。Aさんとの通話確立に伴い、Aさんのステータスを示すアイコン410aの表示は通話中を示すアイコンへと変化している。また、ユーザ自身のステータスを示すアイコン440も通話中を示すアイコンへと変化している。図5において、ウィンドウ510は撮影部100で撮影されたユーザ自身の映像が表示されている。ウィンドウ520はインターネット250を介して通信部125で受信された、通話相手の映像および対応するユーザIDが表示されている。表示部160下部には、ビデオ会議の各種操作を行うためのボタンが配置されており、それぞれリモコン170を用いて選択が可能となっている。リモコン170で通話切断ボタン530を選択・押下すると、通話が切断されテレビ会議が終了する。一時保留ボタン540は、テレビ会議の通話は維持したまま、映像および音声の送信を一時停止するためのボタンである。一時保留後、リモコン170で再度一時保留ボタン540を選択・押下すると、映像および音声の送信が再開される。カンファレンス開始ボタン550は、現在の通話に更にユーザを追加するためのボタンである。カンファレンス開始ボタン550をリモコン170を用いて選択・押下すると、コンタクトリスト400に表示されている相手ユーザをカーソル415で選択可能となり、テレビ会議を行ったまま、選択した相手ユーザに更に発呼を行うことができる。相手ユーザが応答すると、相手ユーザは現在のテレビ会議に加わることができる。音声ミュートボタン560は、音声の送信を制御するためのボタンであり、リモコン170を用いて選択・押下すると、マイク150から入力された音声の送信が停止される。再度音声ミュートボタン560を押下すると、音声の送信が再開される。映像ミュートボタン570は映像の送信を制御するためのボタンであり、リモコン170を用いて選択・押下すると、撮影部100で撮影された映像の送信が停止される。再度映像ミュートボタン570を押下すると、映像の送信が再開される。
【0028】
以上に示したテレビ会議システムにおいて、テレビ会議中にユーザの覚醒度を監視する処理について、図6に示すフローチャートに基づき説明する。
【0029】
まず、ステップS600において、撮影部100で撮影が行われる。撮影された画像は、相手端末に送信されるだけでなく、画像認識部110に入力され、顔領域の検出が行われる(ステップS610)。顔の検出についてはP.Violaおよび M.Jonesによって発表されたブースティングによる顔画像の訓練学習手法をはじめとして、各種手法が既知となっているためその詳細説明は省略する。
【0030】
撮影画像から顔領域が抽出されると、更に抽出した顔領域から目の開閉状態が検出される(ステップS615)。目領域についても、顔領域と同様に既知の訓練学習手法などの適用により抽出が可能である。画像認識部110は検出した目領域の上部と下部、目頭、目尻の座標情報より、目頭から目尻までの距離と、目の上部から下部までの距離の比率を求め、得られた比率より目の開閉状態を得て、覚醒度とする。目が閉じられている状態と判定された場合、該当する顔に対応する人物は居眠りをしていると判断する。
【0031】
ステップS620において居眠り中であると判定された場合、ステップS640へと進み、通話終了処理が行われる。まず、ステップS650にて通話切断処理が行われる。制御部120の指示により、サーバ230を介して通話切断通知が相手端末に送信され、相手端末が応答を返すことで通話切断処理が行われる。続くステップS660にて映像データおよび音声データの送受信を停止し、ステップS670に進む。ステップS670では、通話履歴の更新が行われる。通話相手のユーザIDと、タイマー180にて得られる通話開始時刻と通話終了時刻、および両者の差である通話時間が、制御部120内の図示していない不揮発性メモリに蓄積される。最後に、ステップS680にて、ビジーステータスからオンラインステータスへとステータス情報が更新される。更新されたステータス情報はサーバ230へ送信される。
【0032】
一方、ステップS620において居眠り中でないと判定された場合ステップS670に進み、リモコン170の操作によって通話切断ボタン530が押下されたかどうか、すなわちユーザが通話終了を指示したかどうかがチェックされる。通話終了が指示されていなければ、ステップS600に戻り、撮影部100で新規に画像の撮影が行われる。通話終了が指示されていれば、ステップS640に進み通話切断処理が行われる。
【0033】
以上のように、本実施の形態においては、撮影部100で撮影された画像を元に画像認識部110にてユーザが居眠り中であるかどうかが判定され、ユーザが居眠り中と判定された場合、テレビ会議の通話を自動的に切断する。
【0034】
(実施の形態2)
本実施の形態においては、テレビ会議中にユーザが居眠りをしてしまった場合、テレビ会議の通話は切断せず、一時保留状態に移行する。本実施の形態におけるテレビ会議システムの端末を表すブロック図は図1と同様であるため、説明を省略する。図7は、本実施の形態におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理について示したフローチャートである。なお、図7において、実施の形態1で説明した図6のフローチャートと同様の処理を示す処理フローについては同一の番号を付与し、適宜説明を省略する。
【0035】
まず、ステップS600において、撮影部100で撮影が行われる。撮影された画像は、相手端末に送信されるだけでなく、画像認識部110に入力され、顔画像の検出が行われる(ステップS610)。撮影画像から顔領域が抽出されると、更に抽出した顔領域から目領域が抽出され、目領域の座標情報を元に、目の開閉状態を取得する(ステップS615)。ステップS615で得られた目の開閉状態に基づき、ユーザが居眠り状態であるかどうかを判定する(ステップS620)。
【0036】
ユーザが居眠り中であると判定された場合、ステップS710に進み、サーバ230を介して、一時保留開始通知が通話相手の端末へと送信される。相手側端末では、通話相手が一時保留になった旨の表示が行われる。続くステップS720では、映像および音声の送信が一時的に停止される。映像および音声の送信が停止するため、通話間の端末にてユーザが居眠りしている画像が表示されたり、音声が再生されたりすることがなくなる。この後処理はステップS670に進む。
【0037】
一方、ステップS620においてユーザが居眠り中でないと判定された場合、ステップS730に進む。ステップS730においては、一時保留中であるかどうかが判定される。一時保留中の場合、ステップS740に進み、一時保留は解除され、映像と音声の送信が再開される。再びユーザの映像および音声がサーバ230を介して相手端末に送信されるようになり、相手端末では受信した映像および音声が再生される。この後処理はステップS670に進む。
【0038】
ステップS670では、リモコン170の操作によって通話切断ボタン530が押下されたかどうか、すなわちユーザが通話終了を指示したかどうかが判定される。通話終了が指示されていなければ、ステップS600に戻り、撮影部100で新規に画像の撮影が行われる。通話終了が指示されていれば、本発明の実施の形態1と同様に、通話終了処理(ステップS640)が行われる。
【0039】
テレビ会議の通話相手の端末が一時保留中であった場合の表示部160の表示例を図8に示す。図8において、図5と同一の構成要素については同一の番号を付し説明を省略する。図8において、図7のフローチャートのステップS710で送信された、一時保留開始通知を受けた端末では、通話相手の映像を確認することができないよう、通話相手の映像が表示されるウィンドウ520が灰色に塗りつぶされている。相手端末からの映像に加えて、音声の送信も停止されるため、通話相手の音声も再生されない。
【0040】
なお、図8においては一時保留中の端末に対応するウィンドウ520は灰色に塗りつぶされているが表示の方法はこれに限らず、別の画像や、メッセージ、アニメーション等を表示させてもよい。
【0041】
居眠り状態のユーザが覚醒した場合、当該ユーザが使用している端末は、図7のフローチャートにおけるステップS740にて一時保留が解除され、映像および音声の送信を再開する。通話相手の端末では、映像および音声の受信が再開したことで、図8におけるウィンドウ520での灰色の塗りつぶし表示を解除し、受信した通話相手の映像を再びウィンドウ520内に表示する。同様に、受信した音声の再生も音声出力部150にて行われる。
【0042】
(実施の形態3)
本実施の形態は、実施の形態2の変形であり、居眠り状態のユーザが覚醒しても、自動的に一時保留状態が解除されず、ユーザの操作を必要とする。本実施の形態におけるテレビ会議システムの端末を示すブロック図は図1と同様であるため、説明を省略する。図9は、本発明の実施の形態におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理について示したフローチャートである。なお、図9において、図7にて説明した実施の形態2と同様の処理を示す処理フローについては同一の番号を付与し、適宜説明を省略する。
【0043】
図9に示すフローチャートにおいて、撮影部100によるユーザの監視、およびユーザが居眠りに入った際の処理(ステップS710における一時保留開始通知送信と、ステップS720における映像および音声の送信停止)は図7に示したフローチャートと同様である。本実施の形態では、居眠り中のユーザが覚醒していると判定された場合、ステップS620からステップS730に進む。ステップS730にて、一時保留中かどうかが判定され、もし一時保留中であればステップS910に進む。ステップS910では、一時保留の解除指示がユーザから出されたかどうかが判定される。これは、図5において、アイコン540がリモコン170による操作により押下されたかどうかを制御部120にて判定するステップであり、もし一時保留の解除指示が出されていた場合、ステップS740に進み、一時保留が解除され、映像および音声の送信が再開される。その後、処理はステップS670へと続く。
【0044】
ステップS910にて一時保留解除が指示されていなかった場合、またはステップS730にて映像および音声送信を再開した場合のいずれの場合もステップS670へと処理が続く。ステップS670での通話終了指示のチェック、およびステップS640での通話終了処理の処理内容は、実施の形態2と同様である。
【0045】
(実施の形態4)
本実施の形態は、実施の形態2に個人認識機能を加えることで、テレビ会議を行っているユーザとは別の人物が撮影部100によって撮影されてしまった際、居眠り状態のユーザが覚醒したと誤判定されることを防止する。
【0046】
図10は、本発明の実施の形態におけるテレビ会議システムの端末の一例である、テレビ会議機能を備えたテレビのブロック図である。図10において、図1に示したテレビ会議システムの端末と同様のブロックに関しては同一の記号を付与し説明を省略する。図10において、アンテナ1010はテレビ放送波を受信するアンテナ、チューナ部1020は、アンテナ1010で受信した放送波から希望のチャネルを選択した後、デジタル放送信号に復調するチューナ部である。信号分離部1050は、チューナ部1020で選択したチャネルから放送多重化信号を抽出して映像信号と音声信号に分離する信号分離部である。信号分離部1050で分離された映像信号の信号列は、映像CODEC140にてデコード・伸張され、デジタル映像信号として出力される。信号分離部1050で分離された音声信号の信号列は、音声CODEC135にてデコード・伸張され、デジタル音声信号として出力される。映像CODEC140から出力されたデジタル映像信号は映像処理部155にてメニューなどの各種表示と重畳され、表示部160に表示される。音声CODEC135から出力されたデジタル音声信号は、音声処理部145にて音量調整などの音質調整処理が適宜施され、音声出力部150から出力される。なお、テレビ番組の選局は、リモコン170に備えられたチャネルボタンを押下することで行う。
【0047】
本実施の形態におけるテレビでは、テレビを視聴しながらテレビ会議を行うことができる。テレビ会議中、通信部125から受信した映像データおよび音声データは、それぞれ映像CODEC140および音声CODEC135にて復号化される。一方で、すでに説明したように、同じく映像CODEC140および音声CODEC135にてテレビ放送波の映像データおよび音声データもデコードされている。テレビ会議用の映像データおよびテレビ放送波の映像データは制御部120の指示により映像処理部155で合成され、表示部160にて表示される。同様に、テレビ会議用の音声データおよびテレビ放送波の音声データは制御部120の指示により音声処理部145で合成され、音声出力部150から出力される。なお、撮影部100で撮影された映像データと音声入力部130から得られる音声データは実施の形態1と同様に、それぞれ映像CODEC140と音声CODEC135で圧縮後、通信部125から送信される。
【0048】
以上の処理により、ユーザはテレビを視聴しつつテレビ会議を行うことができる。
【0049】
また、本実施の形態における画像認識部110は、検出した顔がどのユーザであるかを識別する、個人識別処理が可能となっている。個人識別処理については様々な方法が提案されているが、例えば、目や鼻、口の位置といった、顔の部位の座標を元に、それらの部位の座標の相対的な位置関係に基づき、登録済みの顔データベースより、最も確からしいユーザを選択することで実現する。なお、本実施の形態におけるテレビでは、画像認識部110内に、顔の各部位の相対的な位置関係とユーザIDとを関連付けた顔データベースが保持されているものとする。
【0050】
図11は、本実施の形態における、テレビ会議中の表示部160の表示の一例を示している。表示部160にはテレビ放送が表示されており、そのテレビ放送にテレビ会議用の各種表示が重畳されている。図11において、ウィンドウ1110は通話相手の映像を表示するウィンドウである。ピクチャ・イン・ピクチャウィンドウ1120には、ユーザ自身の映像が表示される。テレビ放送の表示をなるべく妨げないよう、ウィンドウ1110は画面の端に表示されている。その他、テレビ会議の操作のためのアイコンやコンタクトリストなどは実施の形態1と同じであるため、同一の番号を振り、説明を省略する。ただし、これらの表示についてもテレビ放送の表示をなるべく妨げないよう、必要に応じてリモコン170の操作によって表示のON/OFFが切り替えられるよう構成することが望ましい。
【0051】
以上のような表示により、ユーザはテレビを視聴しながら同時にテレビ会議を行うことができる。
【0052】
図12は、本実施の形態におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理について示したフローチャートであり、処理内容は図7に示したフローチャートとほぼ同一である。図7に示したフローチャートとの違いは、顔検出を行うステップS610に続いて実施される、個人識別処理ステップS1210である。ステップS1210では、検出された顔を、画像認識部110内に保持されている顔データベースに照会することで個人識別処理を行い、ステップS610で検出した顔領域から、ログインしているユーザIDに該当するユーザの顔領域を選択する。続くステップS615では、ステップS1210で選択された顔領域を対象に、居眠り状態であるかどうかが判定される。
【0053】
以上のように、テレビ会議を行っているユーザの顔を選択して居眠り状態を判定することで、別の人物が撮影されても処理は正しく実行される。例えば家族の出入りが多いリビングなどに本実施の形態におけるテレビが置かれていた場合、テレビ会議を行っているユーザ以外の人物が撮影部100によって撮影される可能性が高いため、個人識別を行うことで居眠り状態の誤判定を回避することができる。
【0054】
以上、本発明の好適な実施の形態について説明した。なお、以上の実施の形態においては、ユーザが居眠りをしていると判定された場合、すぐに通話切断や一時保留をせず、タイマー180を用いて経過時間の監視を開始し、居眠り状態が一定時間経過した場合に、通話切断や一時保留を行うよう構成してもなんら問題はない。更には、実施の形態1で示したように、居眠り状態の場合に通話切断される場合、通話切断後も居眠り状態を監視し、一定時間居眠り状態が続いた場合、テレビ会議システムからログオフするようにしてもよい。一方、実施の形態2から4で示したように、居眠り状態の場合に一時保留される場合、一時保留後も居眠り状態を監視し、一定時間居眠り状態が続いた場合、通話を切断するよう構成してもよい。
【0055】
また、以上の実施形態においては、居眠り状態であると判定された場合、省電力化のため、通話切断や一時保留だけでなく、表示部の表示の停止、または輝度の引き下げ、あるいは通話切断後にテレビ会議端末の電源を切るよう構成してもなんら問題はない。
【0056】
また、以上の実施の形態においてユーザが居眠りをしていると判定された場合、ユーザが起きるよう、制御部120の指示により音声出力部150より警告音を発するよう構成してもよい。音声はミュートされているため、警告音が通話相手の端末にて再生されることはない。
【0057】
また、以上の実施の形態においては1対1のテレビ会議を例に挙げて説明したがこれに限らず、3人以上のテレビ会議システムにおいても適用可能であることは言うまでもない。
【0058】
また、テレビ会議の機能において、特定の相手にのみ音声を送信できるような機能を備えてもよい。本処理はメニュー操作において、音声データの送信先を選択可能にすることで実現できる。本機能により、3人以上のテレビ会議中に、居眠りをしている相手だけを選択し、起きるよう大声で発声することが可能になる。
【0059】
なお、以上の実施の形態において説明した画像認識部における画像処理の内容は一例に過ぎず、他の画像処理アルゴリズムを適用してもよいことは言うまでもない。特に居眠り状態の検出は、目の開閉状態からの判断のみに限らず、うつむいた状態の継続時間、身体が横になっているかどうかなども加味して総合的に判断してもよい。
【0060】
また、以上の実施の形態においてはテレビ会議用端末、およびテレビを想定したが対象はこれに限らず、PCやゲーム機、モバイル機器など、様々なコミュニケーションデバイスに対して本発明が適用可能であることは言うまでもない。また、図1で示したテレビ会議用端末および図10で示したテレビ会議機能を備えたテレビのブロック図に示した処理ブロックはいずれも専用のハードウェアであるとは限らず、ソフトウェアで実行できるよう構成されていてもなんら問題はない。ソフトウェアであるプログラムは、テレビ会議システムを構成する端末内の記録媒体、あるいは端末の外付けの記録媒体に記録されていてもよい。あるいは、インターネットを介して存在するサーバ上の記録媒体にプログラムが記録されており、適宜ダウンロードする構成になっていてもなんら問題はない。
【産業上の利用可能性】
【0061】
本発明にかかるテレビ会議システムは、ユーザの覚醒度を監視しユーザが意図しない映像や音声の送信を防止するため、ユーザのプライバシー保護への配慮が必要なテレビ会議システムに好適である。
【符号の説明】
【0062】
100 撮影部
110 監視部、蓄積部
125 通信部
130 音声入力部
150 音声再生部
160 表示部
170 利用者選択部、操作部
180 タイマー
【技術分野】
【0001】
本発明は、映像および音声を用いて双方向コミュニケーションを行うことができるテレビ会議システムに関する。
【背景技術】
【0002】
カメラとマイクを備え、映像と音声を双方向に送受信できるテレビ会議システムが多数実用化されている。カメラとマイクを備え、インターネットに接続されたパーソナルコンピュータで動作するテレビ会議ソフトウェアの登場や、カメラつき携帯電話での対応などにより、専用システムによる運用が行われていた時代と比較して、飛躍的にテレビ会議の利用者数が増加している。テレビ会議機能を備えたテレビも登場しており、テレビ会議が非常に身近なコミュニケーション手段のひとつになりつつある。
【0003】
このようなテレビ会議システムにおいて、自動的に映像および音声の送受信を停止させるシステムが開示されている。特許文献1におけるテレビ会議システムでは、カメラから取り込まれた映像のフレーム間差分情報から算出した動きベクトルや、カメラのオートフォーカス情報を用いて、ユーザが離席したかどうかを判定し、離席したと判定した場合、通話を切断するよう構成されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平8−336122号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に示したようなテレビ会議システムにおける従来の自動通話切断機能は、主に省電力化や通信料金の節約を目的としており、ユーザのプライバシー保護を目的とした適用はこれまでなされていなかった。インターネットを介したテレビ会議が主流となり、コストを意識せずにテレビ会議ができるようになるにつれ、テレビ会議が行われる機会および時間はますます増大していく可能性が高い。そのような状況下では、テレビのながら見のように、映像・音声のやりとりが行われる通話状態が、長時間行われることが十分予想される。その結果として、ユーザが居眠りをしてしまい、居眠り中の映像や音声が通話相手に送信されるといった弊害の発生が考えられるが、そのような課題に対して、映像や音声の送信を停止させ、ユーザのプライバシーを保護するようなシステムはこれまで存在しなかった。
【課題を解決するための手段】
【0006】
前記課題を解決するために、本発明のテレビ会議システムは、通信手段を介して画像信号および音声信号を送受信可能な通信部と、前記画像信号を生成する撮影部と、前記音声信号を生成する音声入力部と、前記画像信号に基づく画像を表示する表示部と、前記音声信号に基づく音声を出力する音声出力部と、送信予定の画像信号に含まれる被写体の覚醒度を監視する監視部と、前記画像信号および前記音声信号を送受信する相手先との通信を制御する制御部を備え、前記監視部で得られる被写体の覚醒度に基づき、前記送信予定の画像信号が相手先の表示部に表示されるかどうかを制御する。
【0007】
また、前記課題を解決するために、本発明のテレビ会議方法は、通信手段を介して画像信号および音声信号を送受信する通信ステップと、前記画像信号および前記音声信号を互いに送受信する相手先を選択可能な選択ステップと、前記画像信号を生成する撮影ステップと、前記音声信号を生成する音声入力ステップと、前記画像信号に基づく画像を表示する表示ステップと、前記音声信号に基づく音声を出力する音声出力ステップと、送信予定の画像信号に含まれる被写体の覚醒度を監視する監視ステップと、前記監視部にて得られる被写体の覚醒度に基づき、当該画像信号が相手先の表示部に表示されるかどうかを制御する制御ステップからなる。
【発明の効果】
【0008】
本発明のテレビ会議システムによれば、ユーザの居眠り状態を検出することでユーザが意図しない映像や音声の送信を防止できるため、ユーザのプライバシーを保護することができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施の形態1におけるテレビ会議システムの端末の構成を示すブロック図
【図2】本発明の実施の形態1におけるテレビ会議システムのシステム構成例を示す図
【図3】本発明の実施の形態1におけるテレビ会議システムのログイン画面を示す図
【図4】本発明の実施の形態1におけるテレビ会議システムへのログイン後の画面表示例を示す図
【図5】本発明の実施の形態1におけるテレビ会議システムの通話確立時の画面表示例を示す図
【図6】本発明の実施の形態1におけるテレビ会議システムにて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【図7】本発明の実施の形態2におけるテレビ会議システムにて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【図8】本発明の実施の形態2におけるテレビ会議システムにて、通話相手の端末が一時保留中であった場合の画面表示例を示す図
【図9】本発明の実施の形態3におけるテレビ会議システムにて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【図10】本発明の実施の形態4におけるテレビ会議機能を備えたテレビのブロック図
【図11】本発明の実施の形態4におけるテレビ会議中の表示部160の表示の一例を示す図
【図12】本発明の実施の形態4におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理を示したフローチャート
【発明を実施するための形態】
【0010】
以下に、本発明の実施の形態について、図面を参照しながら説明する。
【0011】
(実施の形態1)
図1は、本発明の実施の形態1におけるテレビ会議システムの端末を示すブロック図である。図1において、撮影部100は典型的にはカメラであり、撮影部100で撮影された画像は、画像認識部110に入力される。画像認識部110は、撮影部100で撮影された画像に対して様々な画像処理を施すことで、画像から各種の情報を取り出すことができる。本実施例においては、テレビ会議システムのユーザが居眠りをしているかどうかを判定する。具体的には、撮影画像から顔画像を検出し、更に、検出された顔画像から目に該当する領域を抽出し、目領域の形状または面積よりユーザの覚醒度を算出し、ユーザが居眠りを行っているかどうかを判定する。判定結果は制御部120に送信される。
【0012】
通信部125はネットワークと接続しておりテレビ会議時に、通話相手と映像データおよび音声データの送受信を行う。音声入力部130は典型的にはマイクおよびマイクから出力されるアナログの音声信号をデジタル信号に変換するA/Dコンバータ等から構成されており、音声入力部130から入力された音声はデジタル信号として音声CODEC135に入力された後、圧縮処理が施され、通信部125を通してネットワークに送信される。撮影部100から入力された映像はデジタル信号として映像CODEC140にて圧縮され、通信部125を通してネットワークに送信される。一方、通信部125にて受信された、圧縮音声データは音声CODEC135で伸長された後、音声処理部145にて音量調整などの音質調整処理が適宜施され、典型的にはスピーカーである音声出力部150から出力される。同様に、通信部125にて受信された圧縮映像データは映像CODEC140にて伸長され、映像処理部155にて適宜画像サイズの変更が施された後、アイコンやメニューなどの画像表示と重畳され、液晶パネルやプラズマディスプレイパネルに代表される表示部160に表示される。
【0013】
リモコン170は、本実施例におけるテレビ会議システムを操作するための各種ボタンを備えたリモコンである。リモコン170の入力は、赤外線等を用いて受信部175に通知される。受信部175では受信した信号をデジタルテレビの操作コマンドに変換し、制御部120に通知する。
【0014】
タイマー180は、テレビ会議の通話時間の計測に使用される。
【0015】
なお、本実施例におけるテレビ会議システムの端末の主要なブロックはバス190にて相互に接続されており、バスを経由して映像データや音声データ、各種制御信号のやり取りを行う。また、制御部120は本テレビ会議システムの端末の主要なブロックを統合的に制御する。
【0016】
図2は、本実施例におけるテレビ会議システムのシステム構成例である。図2においては、拠点200aと、拠点200bを1対1で接続し、映像および音声の送受信を行う例を示している。ユーザ210aおよびユーザ210bはそれぞれ、図1で示した、テレビ会議システムの端末220aおよび端末220bの利用者である。どちらの端末にもそれぞれ、撮影部100aと音声入力部130aおよび撮影部100bと音声入力部130bを備えている。
【0017】
サーバ230はテレビ会議システムの制御を行うためのサーバであり、クライアントである端末220aおよび端末220bと通信を確立し、発呼や保留、通話切断などの呼制御や、映像データおよび音声データの中継、ユーザ情報の管理などを行う。
【0018】
サーバ230、端末220aおよび端末220bは通信路240を介してインターネット250に接続されている。
【0019】
なお、図2はテレビ会議を行うための最小限の構成例であり、拠点の数は3つ以上でもよく、更に、負荷分散のため、サーバ230が複数台で構成されていてもよい。端末がサーバ機能を兼ねる構成でも構わない。
【0020】
以上のように構成されたテレビ会議システムにおいて、以下、テレビ会議機能の動作説明を行う。
【0021】
まず、テレビ会議システムのユーザはテレビ会議システムへのログインを行う。リモコン170を操作することにより、図3に示すログイン画面が表示部160に表示される。図3において、表示部160にはテレビ会議システムのユーザに対応するログインIDを選択するためのダイアログ300が表示されており、ダイアログ300内には登録済みのユーザIDが表示されている。ユーザはリモコン170に備えた上下左右の指示が可能な移動キーを用いてカーソル315を動かし、自身に対応するユーザIDを指定し、リモコン170に備えた決定ボタンを押下することで、自身に対応するユーザIDが選択される。ユーザID選択後、カーソル315をログインボタン320へと移動させ、リモコン170に備えた決定ボタンを押下することでログイン処理が開始される。また、キャンセルボタン330を選択することもできる。キャンセルボタン330を選択すると、図示していない、ネットワーク設定などのテレビ会議システムの諸設定を行うためのメニュー画面に戻る。
【0022】
なお、ログイン時に別ユーザへのなりすましを防止するためにパスワード入力を促すようシステムを構成してもよい。
【0023】
図4はテレビ会議システムへログインした後の画面の表示例である。図4において、コンタクトリスト400は、ログインしたユーザが登録しているテレビ会議システムの相手ユーザを表示している。相手ユーザのユーザIDの隣には相手ユーザの現在のステータスを示すアイコンが表示されており、発呼前に相手ユーザの状態を知ることができる。ステータスはサーバ230に問い合わせることで取得できる。アイコン410aはオンライン、すなわちテレビ会議可能であることを示している。アイコン410b、アイコン410cはオフラインのため現在テレビ会議ができないことを示している。オフラインとは、端末の電源がオフとなっている場合や、一時的に端末がネットワークから切り離されている場合、端末の電源は入っているものの該当するユーザがログインしていない場合など、通信ができない状態になっていることである。アイコン410dはビジー中、すなわちすでに相手ユーザが別のユーザとテレビ会議中であることを示している。アイコン410eは、当該通話相手がテレビ会議を行いたくない状態であることを示している。
【0024】
カーソル415はリモコン170を用いて上下に移動可能であり、発呼対象となる相手を選択することができる。なお、相手ユーザ数が多いためコンタクトリスト400に相手ユーザの表示が納まりきらない場合、スクロール指示ボタン420をカーソル415で選択することで、表示されていない相手ユーザをコンタクトリスト400内に表示することができる。
【0025】
また、ログイン情報430には、現在ログイン中のユーザのユーザIDと、そのステータスが表示されている。ログイン中のユーザのステータスを変更したい場合、ログイン中のユーザのステータスを表すアイコン440を、リモコン170を用いて選択すると、変更可能なステータスが一覧表示されるので、希望するステータスを選択する。選択したステータスはサーバ230に通知される。
【0026】
発呼を行いたい場合、オンラインの相手ユーザの中から自分が通話したい相手を選択し、リモコン170に備えられた選択ボタンを押下すると、選択した通話相手に対して発呼が開始される。相手ユーザ側端末の表示部160には着呼がある旨のダイアログが表示され、ダイアログ内のボタンをリモコン170を用いて押下し着呼に応答すると、通話が確立する。
【0027】
図5は通話確立時の端末の表示部160の表示例である。図5はAさんと通話が確立し、互いの端末間で映像と音声が送受信される状態となっている。Aさんとの通話確立に伴い、Aさんのステータスを示すアイコン410aの表示は通話中を示すアイコンへと変化している。また、ユーザ自身のステータスを示すアイコン440も通話中を示すアイコンへと変化している。図5において、ウィンドウ510は撮影部100で撮影されたユーザ自身の映像が表示されている。ウィンドウ520はインターネット250を介して通信部125で受信された、通話相手の映像および対応するユーザIDが表示されている。表示部160下部には、ビデオ会議の各種操作を行うためのボタンが配置されており、それぞれリモコン170を用いて選択が可能となっている。リモコン170で通話切断ボタン530を選択・押下すると、通話が切断されテレビ会議が終了する。一時保留ボタン540は、テレビ会議の通話は維持したまま、映像および音声の送信を一時停止するためのボタンである。一時保留後、リモコン170で再度一時保留ボタン540を選択・押下すると、映像および音声の送信が再開される。カンファレンス開始ボタン550は、現在の通話に更にユーザを追加するためのボタンである。カンファレンス開始ボタン550をリモコン170を用いて選択・押下すると、コンタクトリスト400に表示されている相手ユーザをカーソル415で選択可能となり、テレビ会議を行ったまま、選択した相手ユーザに更に発呼を行うことができる。相手ユーザが応答すると、相手ユーザは現在のテレビ会議に加わることができる。音声ミュートボタン560は、音声の送信を制御するためのボタンであり、リモコン170を用いて選択・押下すると、マイク150から入力された音声の送信が停止される。再度音声ミュートボタン560を押下すると、音声の送信が再開される。映像ミュートボタン570は映像の送信を制御するためのボタンであり、リモコン170を用いて選択・押下すると、撮影部100で撮影された映像の送信が停止される。再度映像ミュートボタン570を押下すると、映像の送信が再開される。
【0028】
以上に示したテレビ会議システムにおいて、テレビ会議中にユーザの覚醒度を監視する処理について、図6に示すフローチャートに基づき説明する。
【0029】
まず、ステップS600において、撮影部100で撮影が行われる。撮影された画像は、相手端末に送信されるだけでなく、画像認識部110に入力され、顔領域の検出が行われる(ステップS610)。顔の検出についてはP.Violaおよび M.Jonesによって発表されたブースティングによる顔画像の訓練学習手法をはじめとして、各種手法が既知となっているためその詳細説明は省略する。
【0030】
撮影画像から顔領域が抽出されると、更に抽出した顔領域から目の開閉状態が検出される(ステップS615)。目領域についても、顔領域と同様に既知の訓練学習手法などの適用により抽出が可能である。画像認識部110は検出した目領域の上部と下部、目頭、目尻の座標情報より、目頭から目尻までの距離と、目の上部から下部までの距離の比率を求め、得られた比率より目の開閉状態を得て、覚醒度とする。目が閉じられている状態と判定された場合、該当する顔に対応する人物は居眠りをしていると判断する。
【0031】
ステップS620において居眠り中であると判定された場合、ステップS640へと進み、通話終了処理が行われる。まず、ステップS650にて通話切断処理が行われる。制御部120の指示により、サーバ230を介して通話切断通知が相手端末に送信され、相手端末が応答を返すことで通話切断処理が行われる。続くステップS660にて映像データおよび音声データの送受信を停止し、ステップS670に進む。ステップS670では、通話履歴の更新が行われる。通話相手のユーザIDと、タイマー180にて得られる通話開始時刻と通話終了時刻、および両者の差である通話時間が、制御部120内の図示していない不揮発性メモリに蓄積される。最後に、ステップS680にて、ビジーステータスからオンラインステータスへとステータス情報が更新される。更新されたステータス情報はサーバ230へ送信される。
【0032】
一方、ステップS620において居眠り中でないと判定された場合ステップS670に進み、リモコン170の操作によって通話切断ボタン530が押下されたかどうか、すなわちユーザが通話終了を指示したかどうかがチェックされる。通話終了が指示されていなければ、ステップS600に戻り、撮影部100で新規に画像の撮影が行われる。通話終了が指示されていれば、ステップS640に進み通話切断処理が行われる。
【0033】
以上のように、本実施の形態においては、撮影部100で撮影された画像を元に画像認識部110にてユーザが居眠り中であるかどうかが判定され、ユーザが居眠り中と判定された場合、テレビ会議の通話を自動的に切断する。
【0034】
(実施の形態2)
本実施の形態においては、テレビ会議中にユーザが居眠りをしてしまった場合、テレビ会議の通話は切断せず、一時保留状態に移行する。本実施の形態におけるテレビ会議システムの端末を表すブロック図は図1と同様であるため、説明を省略する。図7は、本実施の形態におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理について示したフローチャートである。なお、図7において、実施の形態1で説明した図6のフローチャートと同様の処理を示す処理フローについては同一の番号を付与し、適宜説明を省略する。
【0035】
まず、ステップS600において、撮影部100で撮影が行われる。撮影された画像は、相手端末に送信されるだけでなく、画像認識部110に入力され、顔画像の検出が行われる(ステップS610)。撮影画像から顔領域が抽出されると、更に抽出した顔領域から目領域が抽出され、目領域の座標情報を元に、目の開閉状態を取得する(ステップS615)。ステップS615で得られた目の開閉状態に基づき、ユーザが居眠り状態であるかどうかを判定する(ステップS620)。
【0036】
ユーザが居眠り中であると判定された場合、ステップS710に進み、サーバ230を介して、一時保留開始通知が通話相手の端末へと送信される。相手側端末では、通話相手が一時保留になった旨の表示が行われる。続くステップS720では、映像および音声の送信が一時的に停止される。映像および音声の送信が停止するため、通話間の端末にてユーザが居眠りしている画像が表示されたり、音声が再生されたりすることがなくなる。この後処理はステップS670に進む。
【0037】
一方、ステップS620においてユーザが居眠り中でないと判定された場合、ステップS730に進む。ステップS730においては、一時保留中であるかどうかが判定される。一時保留中の場合、ステップS740に進み、一時保留は解除され、映像と音声の送信が再開される。再びユーザの映像および音声がサーバ230を介して相手端末に送信されるようになり、相手端末では受信した映像および音声が再生される。この後処理はステップS670に進む。
【0038】
ステップS670では、リモコン170の操作によって通話切断ボタン530が押下されたかどうか、すなわちユーザが通話終了を指示したかどうかが判定される。通話終了が指示されていなければ、ステップS600に戻り、撮影部100で新規に画像の撮影が行われる。通話終了が指示されていれば、本発明の実施の形態1と同様に、通話終了処理(ステップS640)が行われる。
【0039】
テレビ会議の通話相手の端末が一時保留中であった場合の表示部160の表示例を図8に示す。図8において、図5と同一の構成要素については同一の番号を付し説明を省略する。図8において、図7のフローチャートのステップS710で送信された、一時保留開始通知を受けた端末では、通話相手の映像を確認することができないよう、通話相手の映像が表示されるウィンドウ520が灰色に塗りつぶされている。相手端末からの映像に加えて、音声の送信も停止されるため、通話相手の音声も再生されない。
【0040】
なお、図8においては一時保留中の端末に対応するウィンドウ520は灰色に塗りつぶされているが表示の方法はこれに限らず、別の画像や、メッセージ、アニメーション等を表示させてもよい。
【0041】
居眠り状態のユーザが覚醒した場合、当該ユーザが使用している端末は、図7のフローチャートにおけるステップS740にて一時保留が解除され、映像および音声の送信を再開する。通話相手の端末では、映像および音声の受信が再開したことで、図8におけるウィンドウ520での灰色の塗りつぶし表示を解除し、受信した通話相手の映像を再びウィンドウ520内に表示する。同様に、受信した音声の再生も音声出力部150にて行われる。
【0042】
(実施の形態3)
本実施の形態は、実施の形態2の変形であり、居眠り状態のユーザが覚醒しても、自動的に一時保留状態が解除されず、ユーザの操作を必要とする。本実施の形態におけるテレビ会議システムの端末を示すブロック図は図1と同様であるため、説明を省略する。図9は、本発明の実施の形態におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理について示したフローチャートである。なお、図9において、図7にて説明した実施の形態2と同様の処理を示す処理フローについては同一の番号を付与し、適宜説明を省略する。
【0043】
図9に示すフローチャートにおいて、撮影部100によるユーザの監視、およびユーザが居眠りに入った際の処理(ステップS710における一時保留開始通知送信と、ステップS720における映像および音声の送信停止)は図7に示したフローチャートと同様である。本実施の形態では、居眠り中のユーザが覚醒していると判定された場合、ステップS620からステップS730に進む。ステップS730にて、一時保留中かどうかが判定され、もし一時保留中であればステップS910に進む。ステップS910では、一時保留の解除指示がユーザから出されたかどうかが判定される。これは、図5において、アイコン540がリモコン170による操作により押下されたかどうかを制御部120にて判定するステップであり、もし一時保留の解除指示が出されていた場合、ステップS740に進み、一時保留が解除され、映像および音声の送信が再開される。その後、処理はステップS670へと続く。
【0044】
ステップS910にて一時保留解除が指示されていなかった場合、またはステップS730にて映像および音声送信を再開した場合のいずれの場合もステップS670へと処理が続く。ステップS670での通話終了指示のチェック、およびステップS640での通話終了処理の処理内容は、実施の形態2と同様である。
【0045】
(実施の形態4)
本実施の形態は、実施の形態2に個人認識機能を加えることで、テレビ会議を行っているユーザとは別の人物が撮影部100によって撮影されてしまった際、居眠り状態のユーザが覚醒したと誤判定されることを防止する。
【0046】
図10は、本発明の実施の形態におけるテレビ会議システムの端末の一例である、テレビ会議機能を備えたテレビのブロック図である。図10において、図1に示したテレビ会議システムの端末と同様のブロックに関しては同一の記号を付与し説明を省略する。図10において、アンテナ1010はテレビ放送波を受信するアンテナ、チューナ部1020は、アンテナ1010で受信した放送波から希望のチャネルを選択した後、デジタル放送信号に復調するチューナ部である。信号分離部1050は、チューナ部1020で選択したチャネルから放送多重化信号を抽出して映像信号と音声信号に分離する信号分離部である。信号分離部1050で分離された映像信号の信号列は、映像CODEC140にてデコード・伸張され、デジタル映像信号として出力される。信号分離部1050で分離された音声信号の信号列は、音声CODEC135にてデコード・伸張され、デジタル音声信号として出力される。映像CODEC140から出力されたデジタル映像信号は映像処理部155にてメニューなどの各種表示と重畳され、表示部160に表示される。音声CODEC135から出力されたデジタル音声信号は、音声処理部145にて音量調整などの音質調整処理が適宜施され、音声出力部150から出力される。なお、テレビ番組の選局は、リモコン170に備えられたチャネルボタンを押下することで行う。
【0047】
本実施の形態におけるテレビでは、テレビを視聴しながらテレビ会議を行うことができる。テレビ会議中、通信部125から受信した映像データおよび音声データは、それぞれ映像CODEC140および音声CODEC135にて復号化される。一方で、すでに説明したように、同じく映像CODEC140および音声CODEC135にてテレビ放送波の映像データおよび音声データもデコードされている。テレビ会議用の映像データおよびテレビ放送波の映像データは制御部120の指示により映像処理部155で合成され、表示部160にて表示される。同様に、テレビ会議用の音声データおよびテレビ放送波の音声データは制御部120の指示により音声処理部145で合成され、音声出力部150から出力される。なお、撮影部100で撮影された映像データと音声入力部130から得られる音声データは実施の形態1と同様に、それぞれ映像CODEC140と音声CODEC135で圧縮後、通信部125から送信される。
【0048】
以上の処理により、ユーザはテレビを視聴しつつテレビ会議を行うことができる。
【0049】
また、本実施の形態における画像認識部110は、検出した顔がどのユーザであるかを識別する、個人識別処理が可能となっている。個人識別処理については様々な方法が提案されているが、例えば、目や鼻、口の位置といった、顔の部位の座標を元に、それらの部位の座標の相対的な位置関係に基づき、登録済みの顔データベースより、最も確からしいユーザを選択することで実現する。なお、本実施の形態におけるテレビでは、画像認識部110内に、顔の各部位の相対的な位置関係とユーザIDとを関連付けた顔データベースが保持されているものとする。
【0050】
図11は、本実施の形態における、テレビ会議中の表示部160の表示の一例を示している。表示部160にはテレビ放送が表示されており、そのテレビ放送にテレビ会議用の各種表示が重畳されている。図11において、ウィンドウ1110は通話相手の映像を表示するウィンドウである。ピクチャ・イン・ピクチャウィンドウ1120には、ユーザ自身の映像が表示される。テレビ放送の表示をなるべく妨げないよう、ウィンドウ1110は画面の端に表示されている。その他、テレビ会議の操作のためのアイコンやコンタクトリストなどは実施の形態1と同じであるため、同一の番号を振り、説明を省略する。ただし、これらの表示についてもテレビ放送の表示をなるべく妨げないよう、必要に応じてリモコン170の操作によって表示のON/OFFが切り替えられるよう構成することが望ましい。
【0051】
以上のような表示により、ユーザはテレビを視聴しながら同時にテレビ会議を行うことができる。
【0052】
図12は、本実施の形態におけるテレビ会議システムにおいて、テレビ会議中にユーザの居眠りを監視する処理について示したフローチャートであり、処理内容は図7に示したフローチャートとほぼ同一である。図7に示したフローチャートとの違いは、顔検出を行うステップS610に続いて実施される、個人識別処理ステップS1210である。ステップS1210では、検出された顔を、画像認識部110内に保持されている顔データベースに照会することで個人識別処理を行い、ステップS610で検出した顔領域から、ログインしているユーザIDに該当するユーザの顔領域を選択する。続くステップS615では、ステップS1210で選択された顔領域を対象に、居眠り状態であるかどうかが判定される。
【0053】
以上のように、テレビ会議を行っているユーザの顔を選択して居眠り状態を判定することで、別の人物が撮影されても処理は正しく実行される。例えば家族の出入りが多いリビングなどに本実施の形態におけるテレビが置かれていた場合、テレビ会議を行っているユーザ以外の人物が撮影部100によって撮影される可能性が高いため、個人識別を行うことで居眠り状態の誤判定を回避することができる。
【0054】
以上、本発明の好適な実施の形態について説明した。なお、以上の実施の形態においては、ユーザが居眠りをしていると判定された場合、すぐに通話切断や一時保留をせず、タイマー180を用いて経過時間の監視を開始し、居眠り状態が一定時間経過した場合に、通話切断や一時保留を行うよう構成してもなんら問題はない。更には、実施の形態1で示したように、居眠り状態の場合に通話切断される場合、通話切断後も居眠り状態を監視し、一定時間居眠り状態が続いた場合、テレビ会議システムからログオフするようにしてもよい。一方、実施の形態2から4で示したように、居眠り状態の場合に一時保留される場合、一時保留後も居眠り状態を監視し、一定時間居眠り状態が続いた場合、通話を切断するよう構成してもよい。
【0055】
また、以上の実施形態においては、居眠り状態であると判定された場合、省電力化のため、通話切断や一時保留だけでなく、表示部の表示の停止、または輝度の引き下げ、あるいは通話切断後にテレビ会議端末の電源を切るよう構成してもなんら問題はない。
【0056】
また、以上の実施の形態においてユーザが居眠りをしていると判定された場合、ユーザが起きるよう、制御部120の指示により音声出力部150より警告音を発するよう構成してもよい。音声はミュートされているため、警告音が通話相手の端末にて再生されることはない。
【0057】
また、以上の実施の形態においては1対1のテレビ会議を例に挙げて説明したがこれに限らず、3人以上のテレビ会議システムにおいても適用可能であることは言うまでもない。
【0058】
また、テレビ会議の機能において、特定の相手にのみ音声を送信できるような機能を備えてもよい。本処理はメニュー操作において、音声データの送信先を選択可能にすることで実現できる。本機能により、3人以上のテレビ会議中に、居眠りをしている相手だけを選択し、起きるよう大声で発声することが可能になる。
【0059】
なお、以上の実施の形態において説明した画像認識部における画像処理の内容は一例に過ぎず、他の画像処理アルゴリズムを適用してもよいことは言うまでもない。特に居眠り状態の検出は、目の開閉状態からの判断のみに限らず、うつむいた状態の継続時間、身体が横になっているかどうかなども加味して総合的に判断してもよい。
【0060】
また、以上の実施の形態においてはテレビ会議用端末、およびテレビを想定したが対象はこれに限らず、PCやゲーム機、モバイル機器など、様々なコミュニケーションデバイスに対して本発明が適用可能であることは言うまでもない。また、図1で示したテレビ会議用端末および図10で示したテレビ会議機能を備えたテレビのブロック図に示した処理ブロックはいずれも専用のハードウェアであるとは限らず、ソフトウェアで実行できるよう構成されていてもなんら問題はない。ソフトウェアであるプログラムは、テレビ会議システムを構成する端末内の記録媒体、あるいは端末の外付けの記録媒体に記録されていてもよい。あるいは、インターネットを介して存在するサーバ上の記録媒体にプログラムが記録されており、適宜ダウンロードする構成になっていてもなんら問題はない。
【産業上の利用可能性】
【0061】
本発明にかかるテレビ会議システムは、ユーザの覚醒度を監視しユーザが意図しない映像や音声の送信を防止するため、ユーザのプライバシー保護への配慮が必要なテレビ会議システムに好適である。
【符号の説明】
【0062】
100 撮影部
110 監視部、蓄積部
125 通信部
130 音声入力部
150 音声再生部
160 表示部
170 利用者選択部、操作部
180 タイマー
【特許請求の範囲】
【請求項1】
通信手段を介して画像信号および音声信号を送受信可能な通信部と、
前記画像信号を生成する撮影部と、
前記音声信号を生成する音声入力部と、
前記画像信号に基づく画像を表示する表示部と、
前記音声信号に基づく音声を出力する音声出力部と、
送信予定の画像信号に含まれる被写体の覚醒度を監視する監視部と、
前記画像信号および前記音声信号を送受信する相手先との通信を制御する制御部を備えたテレビ会議システムであって、
前記監視部で得られる被写体の覚醒度に基づき、前記送信予定の画像信号が相手先の表示部に表示されるかどうかを制御することを特徴とする、
テレビ会議システム。
【請求項2】
前記監視部は、前記撮影部によって撮影された画像より顔領域を検出し、前記検出した顔領域の画像に基づき、人物の覚醒度を監視することを特徴とする、請求項1記載のテレビ会議システム。
【請求項3】
前記監視部は、前記検出した顔領域の画像から目領域を検出し、前記検出した目の開閉状態に基づき人物の覚醒度を監視することを特徴とする、請求項2記載のテレビ会議システム。
【請求項4】
前記監視部は、前記撮影部によって撮影された画像より頭部領域を検出し、前記検出した頭部の俯き加減に基づき人物の覚醒度を監視することを特徴とする、請求項1記載のテレビ会議システム。
【請求項5】
前記監視部は、前記撮影部によって撮影された画像より人体領域を検出し、前記検出した人体の姿勢に基づき人物の覚醒度を監視することを特徴とする、請求項1記載のテレビ会議システム。
【請求項6】
前記テレビ会議システムの利用者を選択する利用者選択部と、
前記テレビ会議システムの利用者の顔の特徴情報を蓄積する蓄積部とを更に備え、
前記監視部は、前記撮影部によって撮影された画像より顔領域を検出し、前記利用者選択部によって選択された利用者に関する顔の特徴情報を前記蓄積部より抽出し、前記蓄積部より抽出された顔の特徴情報と合致する顔領域に対して、人物の覚醒度を監視することを特徴とする、請求項2記載のテレビ会議システム。
【請求項7】
前記制御部は、前記監視部が前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物を検出したとき、少なくとも前記通信部からの当該画像信号の送信を停止するよう制御することを特徴とする、請求項1記載のテレビ会議システム。
【請求項8】
前記通信部からの画像信号の送信停止に加えて、前記通信部からの音声信号の送信も停止することを特徴とする、請求項1記載のテレビ会議システム。
【請求項9】
前記制御部は、前記監視部が前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物を検出したとき、前記画像信号および前記音声信号を互いに送受信する相手先に対して、少なくとも当該画像信号の送信を停止することを前記通信部を用いて通知することを特徴とする、請求項1記載のテレビ会議システム。
【請求項10】
前記表示部は、前記画像信号および前記音声信号を互いに送受信する相手先より、当該画像信号の送信を停止することを通知されたとき、前記通信部で受信した前記画像信号の表示を消去することを特徴とする、請求項8記載のテレビ会議システム。
【請求項11】
前記監視部が、前記送信予定の画像信号に含まれる人物の覚醒度が、あらかじめ定められた閾値を上回ったことを検出したとき、前記制御部は、当該画像信号が相手先の表示部に表示されるよう制御することを特徴とする、請求項1記載のテレビ会議システム。
【請求項12】
前記テレビ会議システムを操作する操作部を更に備え、前記画像信号が相手先の表示部に表示されないよう前記制御部によって制御されている際、前記操作部の操作により前記画像信号が相手先の表示部に表示されるよう制御部の制御を変更できることを特徴とする、請求項1記載のテレビ会議システム。
【請求項13】
前記監視部が前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物を検出したとき、前記音声出力部は警告音を出力することを特徴とする、請求項1記載のテレビ会議システム。
【請求項14】
前記監視部にて得られる被写体の覚醒度に基づき、前記送信予定の画像信号が相手先の表示部に表示されないよう制御されている際、テレビ会議システムを省電力モードに移行させることを特徴とする、請求項1記載のテレビ会議システム。
【請求項15】
経過時間を計測するタイマーを更に備え、前記監視部によって前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物が一定時間検出され続けた場合、相手先との通信を終了することを特徴とする、請求項1記載のテレビ会議システム。
【請求項16】
相手先との通信を終了した後、テレビ会議システムを省電力モードまたは電源オフの状態に移行させることを特徴とする、請求項15記載のテレビ会議システム。
【請求項17】
前記画像信号および前記音声信号を互いに送受信する相手先を選択可能な選択部を更に備えることを特徴とする、請求項1記載のテレビ会議システム。
【請求項18】
通信手段を介して画像信号および音声信号を送受信する通信ステップと、
前記画像信号および前記音声信号を互いに送受信する相手先を選択可能な選択ステップと、
前記画像信号を生成する撮影ステップと、
前記音声信号を生成する音声入力ステップと、
前記画像信号に基づく画像を表示する表示ステップと、
前記音声信号に基づく音声を出力する音声出力ステップと、
送信予定の画像信号に含まれる被写体の覚醒度を監視する監視ステップと、
前記監視部にて得られる被写体の覚醒度に基づき、当該画像信号が相手先の表示部に表示されるかどうかを制御する制御ステップ、
からなるテレビ会議方法。
【請求項19】
請求項18記載の通信制御方法を実現することを特徴とするプログラム。
【請求項20】
請求項19記載のプログラムを記憶したことを特徴とするコンピュータが読み取り可能な記録媒体。
【請求項1】
通信手段を介して画像信号および音声信号を送受信可能な通信部と、
前記画像信号を生成する撮影部と、
前記音声信号を生成する音声入力部と、
前記画像信号に基づく画像を表示する表示部と、
前記音声信号に基づく音声を出力する音声出力部と、
送信予定の画像信号に含まれる被写体の覚醒度を監視する監視部と、
前記画像信号および前記音声信号を送受信する相手先との通信を制御する制御部を備えたテレビ会議システムであって、
前記監視部で得られる被写体の覚醒度に基づき、前記送信予定の画像信号が相手先の表示部に表示されるかどうかを制御することを特徴とする、
テレビ会議システム。
【請求項2】
前記監視部は、前記撮影部によって撮影された画像より顔領域を検出し、前記検出した顔領域の画像に基づき、人物の覚醒度を監視することを特徴とする、請求項1記載のテレビ会議システム。
【請求項3】
前記監視部は、前記検出した顔領域の画像から目領域を検出し、前記検出した目の開閉状態に基づき人物の覚醒度を監視することを特徴とする、請求項2記載のテレビ会議システム。
【請求項4】
前記監視部は、前記撮影部によって撮影された画像より頭部領域を検出し、前記検出した頭部の俯き加減に基づき人物の覚醒度を監視することを特徴とする、請求項1記載のテレビ会議システム。
【請求項5】
前記監視部は、前記撮影部によって撮影された画像より人体領域を検出し、前記検出した人体の姿勢に基づき人物の覚醒度を監視することを特徴とする、請求項1記載のテレビ会議システム。
【請求項6】
前記テレビ会議システムの利用者を選択する利用者選択部と、
前記テレビ会議システムの利用者の顔の特徴情報を蓄積する蓄積部とを更に備え、
前記監視部は、前記撮影部によって撮影された画像より顔領域を検出し、前記利用者選択部によって選択された利用者に関する顔の特徴情報を前記蓄積部より抽出し、前記蓄積部より抽出された顔の特徴情報と合致する顔領域に対して、人物の覚醒度を監視することを特徴とする、請求項2記載のテレビ会議システム。
【請求項7】
前記制御部は、前記監視部が前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物を検出したとき、少なくとも前記通信部からの当該画像信号の送信を停止するよう制御することを特徴とする、請求項1記載のテレビ会議システム。
【請求項8】
前記通信部からの画像信号の送信停止に加えて、前記通信部からの音声信号の送信も停止することを特徴とする、請求項1記載のテレビ会議システム。
【請求項9】
前記制御部は、前記監視部が前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物を検出したとき、前記画像信号および前記音声信号を互いに送受信する相手先に対して、少なくとも当該画像信号の送信を停止することを前記通信部を用いて通知することを特徴とする、請求項1記載のテレビ会議システム。
【請求項10】
前記表示部は、前記画像信号および前記音声信号を互いに送受信する相手先より、当該画像信号の送信を停止することを通知されたとき、前記通信部で受信した前記画像信号の表示を消去することを特徴とする、請求項8記載のテレビ会議システム。
【請求項11】
前記監視部が、前記送信予定の画像信号に含まれる人物の覚醒度が、あらかじめ定められた閾値を上回ったことを検出したとき、前記制御部は、当該画像信号が相手先の表示部に表示されるよう制御することを特徴とする、請求項1記載のテレビ会議システム。
【請求項12】
前記テレビ会議システムを操作する操作部を更に備え、前記画像信号が相手先の表示部に表示されないよう前記制御部によって制御されている際、前記操作部の操作により前記画像信号が相手先の表示部に表示されるよう制御部の制御を変更できることを特徴とする、請求項1記載のテレビ会議システム。
【請求項13】
前記監視部が前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物を検出したとき、前記音声出力部は警告音を出力することを特徴とする、請求項1記載のテレビ会議システム。
【請求項14】
前記監視部にて得られる被写体の覚醒度に基づき、前記送信予定の画像信号が相手先の表示部に表示されないよう制御されている際、テレビ会議システムを省電力モードに移行させることを特徴とする、請求項1記載のテレビ会議システム。
【請求項15】
経過時間を計測するタイマーを更に備え、前記監視部によって前記送信予定の画像信号よりあらかじめ定められた閾値以下の覚醒度の人物が一定時間検出され続けた場合、相手先との通信を終了することを特徴とする、請求項1記載のテレビ会議システム。
【請求項16】
相手先との通信を終了した後、テレビ会議システムを省電力モードまたは電源オフの状態に移行させることを特徴とする、請求項15記載のテレビ会議システム。
【請求項17】
前記画像信号および前記音声信号を互いに送受信する相手先を選択可能な選択部を更に備えることを特徴とする、請求項1記載のテレビ会議システム。
【請求項18】
通信手段を介して画像信号および音声信号を送受信する通信ステップと、
前記画像信号および前記音声信号を互いに送受信する相手先を選択可能な選択ステップと、
前記画像信号を生成する撮影ステップと、
前記音声信号を生成する音声入力ステップと、
前記画像信号に基づく画像を表示する表示ステップと、
前記音声信号に基づく音声を出力する音声出力ステップと、
送信予定の画像信号に含まれる被写体の覚醒度を監視する監視ステップと、
前記監視部にて得られる被写体の覚醒度に基づき、当該画像信号が相手先の表示部に表示されるかどうかを制御する制御ステップ、
からなるテレビ会議方法。
【請求項19】
請求項18記載の通信制御方法を実現することを特徴とするプログラム。
【請求項20】
請求項19記載のプログラムを記憶したことを特徴とするコンピュータが読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2012−100185(P2012−100185A)
【公開日】平成24年5月24日(2012.5.24)
【国際特許分類】
【出願番号】特願2010−248069(P2010−248069)
【出願日】平成22年11月5日(2010.11.5)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】
【公開日】平成24年5月24日(2012.5.24)
【国際特許分類】
【出願日】平成22年11月5日(2010.11.5)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】
[ Back to top ]