説明

端末、サーバ、会議システム、会議方法、会議プログラム

【課題】テレビ会議システムにおいて、自分が話者になった場合に、自分が注目した相手もまた自分を注目しているか否かがわかる。
【解決手段】端末21と端末22を備えるテレビ会議システムにおける会議方法であって、発話者側端末21の利用者が、表示手段により表示された映像のうち、聴衆者側端末22の利用者の映像を注目している場合に、端末22は、端末21から、端末22を注目していることを示す第1の注目情報を受信する。第1の注目情報を受信すると、端末22は、利用者が注目している映像に対応する端末と端末21とが一致するか否かを判定する。端末22は、一致すると判定した場合に、第2の注目情報を生成して送信する。端末21は、第2の注目情報を受信すると、表示手段により表示される映像のうち、端末22に対応する映像を強調して表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、利用者の映像を表示する端末を備えた会議システムに関する。
【背景技術】
【0002】
従来、複数の端末をネットワークで接続し、端末利用者の画像や音声を相互に送受信しあうことにより、多地点に分散した複数の利用者によるコミュニケーションを実現する多地点テレビ会議システムがある。
【0003】
典型的な多地点テレビ会議システムでは、各地点に1台のカメラと1台のディスプレイを配置し、カメラから得た自地点の利用者映像を他地点に伝送する。また、他地点から受信した他地点の利用者映像をデイスプレイの画面にタイル状に並べて表示する。
【0004】
従来、多地点間会議システムでは、会議への参加者の正面画像(利用者映像)をただ伝送・表示しているだけで、デイスプレイの画面からだけでは、他の人が、自分に対して話をしているのか、他者に対して話をしているのかを特定することができなかった。
【0005】
このような課題を解決する技術として、特許文献1記載の技術がある。この技術は、一の端末の利用者が、他の端末に対して会話を行っている場合に、画面上に、送信元の端末の利用者から他の端末の利用者に対して、矢印等の識別情報を表示する。これにより、他の人が、自分に対して、話をしているのか、他者に対して、話をしているのかを特定しようと工夫している。
【0006】
しかしながら、この技術においては、例えば、テレビ会議システム利用者全員が、会話を行っている場合に、自分に関係しない矢印を含めた多数の矢印が、自分の画面上に表示されるために、表示画面が煩雑になるといった課題があった。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2007−158945公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は、上記従来技術の問題点を解決するためになされたものであって、自分が話者になった場合に、自分が注目した相手もまた自分を注目しているか否かがわかるようにするテレビ会議システムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために、本発明の一実施態様に係る端末は、自端末の利用者を撮像した第1映像を他端末に送信する映像送信手段と、他端末の利用者を撮像した複数の第2映像を受信する映像受信手段と、複数の前記第2映像を並べて表示する表示手段と、前記第1映像に対応する利用者が発話していることを検知する発話検知手段と、前記第1映像に対応する利用者が発話中に注目している利用者の注目映像を、前記第2映像から検知する注目検知手段と、前記注目検知手段が検知した注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する注目情報送信手段と、前記注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する注目情報受信手段と、前記第2の注目情報を受信した場合に、前記表示手段により表示される前記第2映像のうち、前記注目映像に対応する第2映像を、残りの第2映像にくらべて強調表示する制御を行う制御手段とを備える。
【0010】
又、本発明の一実施形態に係る端末は、自端末の利用者を撮像した第1映像をサーバに送信する映像送信手段と、前記サーバから他端末の利用者を撮像した複数の第2映像の合成映像を受信する映像受信手段と、前記映像受信手段により受信した合成映像を表示する表示手段と、前記第1映像に対応する利用者が発話していることを検知する発話検知手段と、前記第1映像に対応する利用者が発話中に注目している利用者の注目映像を、前記第2映像の合成映像から検知する注目検知手段と、前記注目検知手段が検知した注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する注目情報送信手段と、前記注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する注目情報受信手段と、前記第2の注目情報を受信した場合に、前記表示手段により表示される前記第2映像のうち、前記注目映像に対応する第2映像を、残りの第2映像にくらべて強調する要求を前記サーバへ送信する要求送信手段とを備える。
【0011】
又、本発明の一実施形態に係るサーバは、複数の端末の利用者を撮像した映像を受信する映像受信手段と、前記映像受信手段により受信した端末の利用者の映像を合成することにより合成映像を生成する合成手段と、前記合成映像を前記複数の端末へ送信する映像送信手段と、前記端末の利用者が、発話をしていることを通知する発話者通知信号を受信する通知信号受信手段と、前記通知信号受信手段が、発話者通知信号を受信した場合に、前記発話者通知信号を通知した端末の利用者が注目している端末の利用者の第1の注目映像を、前記合成映像から検知する検知手段とを備え、前記検知手段は、前記第1の注目映像に対応する端末の利用者が、注目している端末の利用者の第2の注目映像を、前記合成映像から検知し、該第2の注目映像に対応する端末の利用者と前記発話者通知信号を通知した端末の利用者とが一致するか否かを判定し、前記合成手段は、前記検知手段が一致すると判定した場合に、前記合成映像のうち、前記第1の注目映像に対応する端末の利用者の映像を強調表示した合成映像を生成する。
【0012】
又、本発明の一実施形態に係る会議方法は、第1の端末が、前記第1の端末の利用者の映像を撮像した第1映像を他端末に送信する映像送信ステップと、前記第1の端末が、他端末の利用者を撮像した複数の第2映像を受信する映像受信ステップと、前記第1の端末が、前記複数の第2映像を並べて表示する表示ステップと、前記第1の端末の利用者が、発話をしていることを検知する発話検知ステップと、前記第1の端末が、発話中に注目している利用者の第1の注目映像を、前記第2映像から検知する第1の注目検知ステップと、前記第1の注目検知ステップにおいて検知した前記第1の注目映像に対応する他の端末に対して、前記第1の端末の利用者が、前記第1の注目映像を注目していることを示す第1の注目情報を送信する第1の注目情報送信ステップと、前記第1の注目映像に対応する第2の端末が、前記第1の端末から前記第1の注目情報を受信する第1の注目情報受信ステップと、前記第2の端末が、前記第1の注目情報受信ステップにより前記第1の注目情報を受信した場合に、前記第2の端末の利用者が、注目している利用者の第2の注目映像を、前記第2の端末の表示手段に表示された映像から検知し、該第2の注目映像に対応する端末と前記第1の端末とが一致するか否かを判定する第2の注目検知ステップと、前記第2の注目検知ステップにおいて、一致すると判定した場合に、前記第2の端末が、第2の注目映像を注目していることを示す第2の注目情報を送信する第2の注目情報送信ステップと、前記第1の端末が、前記第2の注目情報を受信する第2の注目情報受信ステップと、前記第1の端末が、前記第2の注目情報を受信した場合に、前記第1の注目映像に対応する第2映像を強調表示する制御を行う制御ステップとを備える。
【0013】
又、本発明の一実施形態に係る会議システムは、自端末の利用者を撮像した第1映像を他端末に送信する映像送信手段と、他端末の利用者を撮像した複数の第2映像を受信する映像受信手段と、複数の前記第2映像を並べて表示する表示手段と、前記第1映像に対応する利用者が発話していることを検知する発話検知手段と、前記第1映像に対応する利用者が発話中に注目している利用者の第1の注目映像を、前記第2映像から検知する第1の注目検知手段と、前記第1の注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記第1の注目映像を注目していることを示す第1の注目情報を送信する第1の注目情報送信手段と、前記第1の注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する第1の注目情報受信手段と、前記第2の注目情報を受信した場合に、前記表示手段により表示される前記第2映像のうち、前記第1の注目映像に対応する第2映像を、残りの第2映像にくらべて強調表示する制御を行う制御手段とを備える第1の端末と、他の端末から第2の注目情報を受信する第2の注目情報受信手段と、前記第2の注目情報受信手段により前記第2の注目情報を受信した場合に、自端末の利用者が、注目している第2の注目映像を、表示手段に表示された複数の第2映像から検知し、該検知した第2の注目映像に対応する端末と前記第2の注目情報の送信元である端末とが一致するか否かを判定する第2の注目検知手段と、前記第2の注目検知手段が一致すると判定した場合に、前記第2の注目映像に対応する端末に対して、自端末が、前記第2の注目映像を注目していることを示す第1の注目情報を送信する第2の注目情報送信手段とを備える第2の端末とを備える。
【0014】
又、本発明の一実施形態に係る会議プログラムは、自端末の利用者を撮像した第1映像を他端末に送信する映像送信機能と、他端末の利用者を撮像した複数の第2映像を受信する映像受信機能と、複数の前記第2映像を並べて表示する表示機能と、前記第1映像に対応する利用者が発話していることを検知する発話検知機能と、前記第1映像に対応する利用者が発話中に注目している利用者の注目映像を、前記第2映像から検知する注目検知機能と、前記注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する注目情報送信機能と、前記注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する注目情報受信機能と、前記第2の注目情報を受信した場合に、前記表示機能により表示される前記第2映像のうち、前記注目映像に対応する第2映像を、残りの第2映像にくらべて強調表示する制御を行う制御機能とを有し、前記注目検知機能は、前記注目情報受信機能により前記第2の注目情報を受信した場合に、検知した注目映像に対応する端末と前記第2の注目情報の送信元である端末とが一致するか否かを判定し、前記注目情報送信機能は、前記注目検知機能が一致すると判定した場合に、前記注目映像に対応する端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する。
【発明の効果】
【0015】
本発明によれば、自分が話者になった場合に、自分が注目した相手もまた自分を注目しているか否かがわかるようにするテレビ会議システムを提供することができる。
【図面の簡単な説明】
【0016】
【図1】本発明の第1の実施形態に係るテレビ会議システムを示す簡略図。
【図2】第1実施形態に係るテレビ会議システムにおいてテレビ会議開始時の入力映像、表示映像を示す図。
【図3】第1の実施形態に係る端末を示すブロック図。
【図4】第1の実施形態に係る注目検知部を示すブロック図。
【図5】第1の実施形態に係る発話者側端末と聴衆者側端末の関係を示す図。
【図6】第1の実施形態に係る発話者側端末の動作を示すフローチャート。
【図7】第1の実施形態に係る発話者側端末の「発話者処理」の動作を示すフローチャート。
【図8】第1の実施形態に係る聴衆者側端末の動作を示すフローチャート。
【図9】第1の実施形態に係る聴衆者側端末の「聴衆者処理」の動作を示すフローチャート。
【図10】第1の実施形態に係る聴衆者側端末の「発話者表示変更処理」の動作を示すフローチャート。
【図11】第1の実施形態に係る発話者端末の「聴衆者表示変更処理」の動作を示すフローチャート。
【図12】第1の実施形態に係るテレビ会議システムおける端末の表示画面を示す簡略図。
【図13】第1の実施形態に係るテレビ会議システムおける端末の表示画面を示す簡略図。
【図14】第1の実施形態に係るテレビ会議システムおける端末の表示画面を示す簡略図。
【図15】第1の実施形態に係る聴衆者側端末の動作の変形例を示すフローチャート。
【図16】第1の実施形態に係る発話者側端末の「発話者処理」の動作の変形例を示すフローチャート。
【図17】第1の実施形態に係るテレビ会議システムおける端末の表示画面を示す簡略図。
【図18】第1の実施形態に係るテレビ会議システムおける端末の表示画面を示す簡略図。
【図19】第2の実施形態に係るテレビ会議システムを示す簡略図。
【図20】第2の実施形態に係る端末を示すブロック図。
【図21】第2の実施形態に係る発話者端末の「聴衆者表示変更処理」の動作を示すフローチャート。
【図22】第2の実施形態に係る聴衆者側端末の「発話者表示変更処理」の動作を示すフローチャート。
【図23】第2の実施形態に係るMCUを示すブロック図。
【図24】テレビ会議開始時に、第2の実施形態に係るMCUが端末から受信する映像と、端末へ送信する合成映像を示す図。
【図25】第2の実施形態に係るMCUが、レイアウトを変更した後の合成映像を示す図。
【図26】第2の実施形態に係る合成映像のレイアウトの変形例を示す図。
【図27】第3の実施形態に係るテレビ会議システムを示す図。
【図28】第3の実施形態に係る端末を示すブロック図。
【図29】第3の実施形態に係るMCUを示すブロック図。
【図30】第4の実施形態における第1の参加者及び第2の参加者の画像変形処理(台形変形)を示す図。
【図31】第4の実施形態における第3の参加者及び第4の参加者の画像変形処理(台形変形)を示す図。
【図32】第4の実施形態に係る端末が、最初の状態において、表示画面に表示する映像を示す図。
【図33】第4の実施形態に係る端末において、「発話者注目情報」を受信した場合における表示画面に表示する映像を示す図。
【図34】第4の実施形態に係る端末において、「発話者注目情報」を受信した場合における表示画面に表示する映像を示す図。
【発明を実施するための形態】
【0017】
以下、本発明の実施形態について説明する。
【0018】
(第1の実施形態)
図1は、本発明の第1の実施形態に係るテレビ会議システムを示す簡略図である。
【0019】
このテレビ会議システムは、4つの端末21、22、23、24がそれぞれネットワーク接続(伝送路3に接続)されている。
【0020】
各端末(21〜24)はそれぞれ、入力映像(V1〜V4)を取り込むためのカメラ(21c、22c、23c、24c)、入力音声(A1〜A4)を取り込むためのマイク(21m、22m、23m、24m)と、映像(MV1〜MV4)を表示するための表示デバイス(21d、22d、23d、24d)と、音声(MA1〜MA4)を再生するためのスピーカ(21s、22s、23s、24s)とを備える。
【0021】
なお、端末(21〜24)は、例えば、ノートブックタイプのポータブルパーソナルコンピュータ(ノートPC)等により実現される。あるいは、端末(21〜24)は、会議専用装置であってもよい。また、伝送路3は、例えば、有線LAN、IEEE 802.11b、若しくは802.11aとして規定された無線LAN、及び、スイッチやルータを介して接続されるインターネットを含める。
【0022】
端末21は、カメラ21cで得た入力映像V1を伝送路3に対して送信し、伝送路3から他の端末が送信した映像V2、V3、V4を受信する。そして、端末21は自身の映像V1と、受信した映像V2、V3、V4を表示デバイス21dに表示する。尚、以下では、表示するデバイスに表示する映像V1、V2、V3、V4をまとめてMV1と表現し、「V1、V2、V3、V4を表示する」ことを、「MV1を表示する」と表現する。
【0023】
また、端末21は、マイク21mで得た入力音声A1を伝送路3に対して送信し、伝送路3から他の端末が送信した音声A2、A3、A4を受信する。端末21は、受信した音声A2、A3、A4をスピーカ21sにより出力する。尚、以下では、スピーカ21sが出力する音声A2、A3、A4をまとめてMA1と表現し、「A2、A3、A4を再生する」ことを、「MA1を再生する」と表現する。
【0024】
図2は、テレビ会議システムを4人で開始した最初の状態での入力映像(V1〜V4)、及び表示する映像(MV1〜MV4)を表す図である。図2の例においては、各入力映像(V1〜V4)の画像サイズは、共に320ピクセル×240ピクセルであるとしており、表示する際に自身の映像と、受信した各映像を160ピクセル×120ピクセルに縮小した後に、それらを並べて配置している。
【0025】
次に、端末21について説明する。図3は、第1の実施形態に係る端末を示すブロック図である。
【0026】
端末21は、注目情報入力部10、映像送信部11、映像受信部12、映像制御部13、映像表示部14、発話検知部15、注目検知部16、注目情報送信部17、注目情報受信部18を備える。
【0027】
映像送信部11は、端末21のカメラ21cにより撮影された映像データが入力されると、MEPG4などの形式に圧縮符号化し、圧縮した映像データを映像ストリームとして伝送路3へ送信する。また、圧縮した映像データは、映像受信部12へも出力される。
【0028】
映像受信部12は、伝送路3から映像ストリームとしてMPEG4などの形式に圧縮された映像データを受信し、圧縮された映像データを伸張した後に映像制御部13へ出力する。なお、映像受信部12は、複数の端末から映像ストリームを受信して前述の処理を行うことが可能とする。また、映像送信部11から得た圧縮された映像データについても同様に処理する。
【0029】
映像制御部13は、映像受信部12から得た映像データを変形した後、映像表示部14へ出力する。なお、映像制御部13は、自端末を含めた複数の端末に対応する複数の映像データに対し、変形処理を行うことが可能とする。映像制御部13は、変形処理として、例えば、サイズ変換を行う。例えば、入力映像が320ピクセル×240ピクセルなど、160ピクセル×120ピクセル以外の場合に、それらをすべて160ピクセル×120ピクセルに変換して映像表示部14へ出力する機能を備える。尚、映像制御部13が行う変形処理は、サイズ変換に限るものではない。形状の変更、色調の変更等も変形処理に含まれる概念である。
【0030】
映像表示部14は、映像制御部13から入力された映像データを、表示デバイス21dに表示させる。表示の際には、自端末を含めた複数の端末に対応する複数の映像データの配置作業を行う。例えば、図2に示されるように、表示する映像が4つの場合には、自端末の映像を左上に配置し、次に、端末の識別番号が若い順に右上、左下、右下とする。なお、端末の識別番号は、端末で一意に決まっているものとし、映像データと共に端末間で送受信されるものとする。
【0031】
発話検知部15は、マイク21mから音声入力があった場合に、自端末の利用者が発話者となったと判断する発話判断処理機能を備える。発話判断処理機能の一例として、音声レベルの閾値と、検出時間が設定されており、閾値を超える音声レベルの入力が検出時間を超えて連続して発生した場合に発話者となったと判断する。発話検知部15は、自端末の利用者が発話者と判断した場合には、発話者処理開始信号を注目検知部16へ出力する。なお、発話検知部15は、発話者と判断した後であって、一定の時間が経過後、再度、発話判断処理機能により自端末の利用者が発話者であると判断した場合には、発話者処理継続信号を注目検知部16へ出力する。一方、発話検知部15は、発話者と判断した後であって、再度、発話判断処理機能により発話者でないと判断した場合には、発話者処理終了信号を注目検知部16へ出力する。
【0032】
注目情報入力部10は、自端末の利用者が、表示画面上のどの位置を注目しているかを入力する。注目情報入力部10としては、例えば、ポインティングデバイスを用いる。ポインティングデバイスを用いる場合、利用者は、表示画面をポインティングすることにより、利用者が注目している画面上の位置を入力する。なお、注目情報入力部10としては、前述したマイク21m、又はカメラ21cであっても良い。
【0033】
次に、注目検知部16について、まず一つ目の機能について説明する。図4は、注目検知部16の構成を示すブロック図である。
【0034】
注目検知部16は、発話者処理部16Aと、聴衆者注目情報構築部16Bと、聴衆者登録情報テーブル16Cと、聴衆者登録処理部16Dと、聴衆者表示変更処理部16Eと,発話者登録処理部16Fと、発話者登録情報テーブル16Gと、発話者表示変更処理部16Hと、聴衆者処理部16Iと、発話者注目情報構築部16Jとを備える。
【0035】
注目検知部16は、発話者処理開始信号が入力されると、「発話者処理」を実行する。
【0036】
「発話者処理」は、発話者処理部16Aが、注目情報入力部10により入力された情報から、自端末の利用者Aが、どの端末から送られてきた映像に注目しているかを検出する処理と、その検出結果により、聴衆者注目情報構築部16Bが、その注目者となった端末の識別番号を含む聴衆者注目情報を構築する処理を含む処理である。
【0037】
例えば、注目情報入力部10が、ポインティングデバイスである場合、発話者処理部16Aは、デイスプレイ21dの表示画面上の映像MV1のうち、利用者Aがポインティングした位置にある映像を注目していると検出する。
【0038】
また、注目情報入力部10が、マイク21mである場合、発話者処理部16Aは、音声解析機能を備えることにより、まず、利用者Aが「○○さん」と呼びかけた場合に、利用者Aが呼びかける端末の利用者を特定する。又、発話者処理部16Aは、更に、端末の識別番号とそれぞれの端末の利用者名を関連づけて記憶していることにより、特定した利用者からその利用者名に対応する端末から送られて来た映像を注目していると検出する。
【0039】
また、注目情報入力部10が、カメラ21cである場合、発話者処理部16Aは、映像解析機能を備えることにより、カメラ21cから撮影された利用者Aの顔と目の位置を検出し、それらの情報から、利用者Aがどの方向を見ているのかを推定し、その見ている方向から表示画面上の注視点を推測し、その注視点の位置にある映像を注目していると検出する。
【0040】
また、発話者処理部16Aは、自端末の利用者Aが注目している映像を検出した結果、利用者Aが、自端末以外の端末の利用者の映像を注目している場合に、自端末の利用者Aが、その端末を注目していることを示す情報を含む信号を聴衆者注目情報構築部16Bに出力する。例えば、信号としては、その端末の利用者の映像である。又、その端末の識別子であっても良い。
【0041】
次に、聴衆者注目情報構築部16Bは、自端末の利用者Aが、自端末以外の端末を注目していることを示す情報を含む信号を受信すると、「聴衆者注目情報」を構築し、注目情報送信部17へ出力する。この「聴衆者注目情報」には、自端末(端末21)の端末の識別番号と、注目者となった端末の識別番号を含む情報である。
【0042】
「発話者処理」は、注目検知部16にて繰り返し実行され、その度に「聴衆者注目情報」が注目情報送信部17へ出力される。例えば、発話者処理継続信号が入力される毎に、注目検知部16は、「発話者処理」を繰り返し実行する。一方、注目検知部16は、発話者処理終了信号が入力されると、「発話者処理」を停止する。
【0043】
注目情報送信部17についても、まず一つ目の機能について説明する。注目情報送信部17は、聴衆者注目情報構築部16Bから得た「聴衆者注目情報」を伝送路3へ送信するための加工を行い、伝送路3へ送信する。ここでいう加工とは、例えば、ネットワーク(伝送路3)へ送信するために、宛先アドレス等の情報を含むヘッダ情報を付加し、ペイロード部分に「聴衆者注目情報」を入れたパケット信号を構築することである。なお、注目情報送信部17は、伝送路3を介して、注目者となった端末のみに「聴衆者注目情報」を送信する(便宜的にユニキャストと呼ぶ)。なお、注目情報送信部17は、会議に参加している全端末に「聴衆者注目情報」を送信してもよい(便宜的にマルチキャストと呼ぶ)。
【0044】
注目情報受信部18についても、まず一つ目の機能について説明する。注目情報受信部18は、「聴衆者注目情報」が含まれたパケット信号を伝送路3から受信すると、「聴衆者注目情報」を抜き出し、注目検知部16へ出力する。
【0045】
次に、注目検知部16について、二つ目の機能について説明する。注目検知部16は、注目情報受信部18が受信した「聴衆者注目情報」に応じて、「発話者登録処理」、「発話者表示変更処理」、および、「聴衆者処理」を実行する。
【0046】
「発話者登録処理」では、発話者登録処理部16Fは、まず「聴衆者注目情報」を解析し、発話者となった端末の識別番号と、注目者となった端末の識別番号を認識する。次に、発話者登録処理部16Fは、認識した注目者となった端末の識別番号と、自端末の識別番号とを比較し、自端末が、注目者となったか否かを判定する。次に、発話者登録処理部16Fは、自端末が、注目者であると判定した場合に、発話者の端末の識別番号(発話者情報とする。)を発話者登録情報テーブル16Gに登録する。また、発話者登録処理部16Fは、入力された「聴衆者注目情報」の注目者が自端末であって、「聴衆者注目情報」に含まれる発話者となった端末の識別番号が、既に、発話者登録情報テーブル16Gに登録されている発話者の端末の識別番号である場合には、更新されたことを記録する。また、発話者登録処理部16Fは、定期的に発話者登録状態を確認する処理も行う。即ち、発話者登録処理部16Fは、発話者登録情報テーブル16Gに登録されている発話者情報のうち、一定時間更新されていない発話者情報を検出した場合には、発話者情報、即ち、発話者の端末の識別番号を発話者登録テーブル16Gから削除する。
【0047】
「発話者表示変更処理」では、発話者表示変更処理部16Hが、発話者登録処理部16Fが認識し、新たに発話者登録情報テーブル16Gに登録した発話者の端末の識別番号に対応する映像の表示方法を変更するように要求する変形要求信号を映像制御部13に出力する。ここで、変形要求信号は、映像の表示方法の変更を要求する端末の識別番号と、その映像法表示方法の変形方法についての情報を含む。変形方法としては、例えば、発話者の端末の映像の周囲の枠の色を強調する色への変更する方法、又は、発話者の端末の映像を他の映像より大きく表示する変更(例えば、他の映像の大きさが、160ピクセル×120ピクセルの場合に、発話者の端末の映像の大きさを200ピクセル×150ピクセルにする)などがある。
【0048】
「発話者表示変更処理」においては、発話者表示変更処理部16Hは発話者登録情報テーブル16Gから発話者として登録されている端末の識別番号が削除された場合に、その発話者の映像の表示方法を前述した発話者表示変更処理部16Hの指示により変形される前の状態に戻すための表示復元信号を映像制御部13に出力する処理も行う。一方、映像制御部13は、注目検知部16からの変形要求信号または表示復元信号に従い対応する端末の利用者の映像を、変形要求信号または表示復元信号に含まれる前述した変形方法により変形して映像表示部14へ出力する。
【0049】
聴衆者処理部16Iは、発明者登録情報テーブル16Gに、発話者となった端末の識別番号が1つ登録された時点で、「聴衆者処理」を実行する。
【0050】
一方、発話者登録情報テーブル16Gに登録されている識別番号が0個になった時点で「聴衆者処理」を終了する。
【0051】
「聴衆者処理」においては、聴衆者処理部16Iが、注目情報処理部10により入力された情報から、自端末(端末21)の利用者Aが、表示されている映像MV1のうち、発話者登録情報テーブル16Gに登録されている識別番号に対応する端末から送られてきた映像に注目しているかを検出する。即ち、聴衆者処理部16Iは、利用者Aの注目箇所を検出し、利用者Aの注目箇所が、発話者登録情報テーブル16Gに登録されている識別番号に対応する端末から送られてきた映像であるか否かを判定する。
【0052】
発話者注目情報構築部16Jは、利用者Aの注目箇所が、発話者登録情報テーブル16Gに登録されている識別番号に対応する端末から送られてきた映像であると判定した場合に、「発話者注目情報」を構築し、注目情報送信部17へ出力する。この「発話者注目情報」は、自端末(端末21)の端末の識別番号と、注目した発話者の端末の識別番号を含む情報である。
【0053】
「聴衆者処理」は注目検知部16にて繰り返し実行され、その度に「発話者注目情報」が注目情報送信部17へ出力される。
【0054】
注目情報送信部17についても、二つ目の機能について説明する。注目情報送信部17は、「発話者注目情報」が入力されると、それを伝送路3へ送信するための加工を行い、伝送路3へ送信する。ここでいう加工とは、例えば、ネットワーク(伝送路3)へ送信するために、宛先アドレス等の情報を含むヘッダ情報を付加し、ペイロード部分に「発話者注目情報」を入れたパケット信号を構築することである。ここで、伝送路3は送信する際に、注目情報送信部17は注目した発話者の端末のみに対して、「発話者注目情報」を送信する(便宜的にユニキャストと呼ぶ)。
【0055】
次に、注目情報受信部18について、二つ目の機能について説明する。注目情報受信部18は、「発話者注目情報」が含まれたパケット信号を伝送路3から受信すると、「発話者注目情報」を抜き出し、注目検知部16へ出力する。
【0056】
次に、注目検知部16について、三つ目の機能について説明する。注目検知部16は「発話者注目情報」が入力されると、「聴衆者登録処理」、「聴衆者表示変更処理」を実行する。
【0057】
「聴衆者登録処理」では、聴衆者登録処理部16Dは、まず「発話者注目情報」を解析し、注目された発話者の端末の識別番号と、その発話者を注目した端末の識別番号を認識する。次に、聴衆者登録処理部16Dは、注目された発話者の端末の識別番号と、自端末の識別番号とを比較し、自端末が、注目された発話者となったか否かを判定する。次に、発話者登録処理部は、自端末が、注目された発話者であると判定した場合に、自端末を注目した端末の識別番号(聴衆者情報とする。)を聴衆者登録情報テーブル16Cに登録する。また、聴衆者登録処理部16Dは、入力された「発話者注目情報」の注目された発話者が、自端末と一致する場合であって、「発話者注目情報」に含まれる注目者である聴衆者の端末の識別番号が、既に、聴衆者登録情報テーブル16Cに登録されている聴衆者の端末の識別番号である場合には、更新されたことを記録する。また、聴衆者登録処理部16Dは、定期的に聴衆者登録状態を確認する処理も行う。即ち、聴衆者登録処理部16Dは、聴衆者登録情報テーブル16Cに登録されている聴衆者情報のうち、一定時間更新されていない聴衆者情報を検出した場合には、聴衆者情報、即ち、聴衆者の端末の識別番号を聴衆者登録テーブル16Cから削除する。
【0058】
「聴衆者表示変更処理」では、聴衆者表示変更処理部16Eが、聴衆者登録処理部16Dが認識し、新たに聴衆者登録情報テーブル16Cに登録した聴衆者の端末の識別番号に対応する映像の表示方法を変更するように要求する変形要求信号を映像制御部13に出力する。ここで、変形要求信号は、映像の表示方法の変更を要求する端末の識別番号と、その映像法表示方法の変形方法についての情報を含む。変形方法としては、例えば、注目者である聴衆者の端末の映像の周囲の枠の色を強調する色への変更する方法、又は、注目者である聴衆者の端末の映像を他の聴衆社の映像より大きく表示する変更(例えば、他の映像の大きさが、160ピクセル×120ピクセルの場合に、注目者である聴衆者の端末の映像の大きさを200ピクセル×150ピクセルにする)などがある。
【0059】
また、「聴衆者表示変更処理」においては、聴衆者表示変更処理部16Eは聴衆者登録情報テーブル16Cに登録されている聴衆者の端末の識別番号が削除された場合に、その聴衆者の映像の表示方法を前述した聴衆者表示変更処理部16Eの指示により変形される前の状態に戻すための表示復元信号を映像制御部13に出力する処理も行う。
【0060】
以上、端末21の機能として、注目情報入力部10、映像送信部11、映像受信部12、映像制御部13、映像表示部14、発話検知部15、注目検知部16、注目情報送信部17、注目情報受信部18について説明したが、端末22、23、24も同様にこれらを構成要素として備えるものとする。
【0061】
ところで、先に説明した発話検知部15、注目検知部16、注目情報送信部17、注目情報受信部18については、発話者側端末として行う処理と、聴衆者側端末として行う処理とに分けることができる。なお、図5には、端末21が発話者側端末、端末22が聴衆者側端末となり、お互いが通信している様子を示している。
【0062】
図6は、発話者側端末の動作を概略的に示すフローチャートである。
【0063】
まず、発話検知部15が、自端末の利用者が発話者であるか否かを検出する(発話検出処理)(S111)。発話検出処理において、発話検知部15が、自端末の利用者が発話者となったことを判断すると(S112)、注目検知部16が、「発話者処理」を開始する(S113)。次に、発話者処理を実行後、注目検知部16は、再度、発話検出処理を実行し、発話検知部15が、自端末の利用者が、発話者でなくなったと判断すると(S114)、注目検知部16は、「発話者処理」を終了する(S115)。
【0064】
図7は、発話者側端末の「発話者処理」において実行される処理の動作を示すフローチャートである。
【0065】
まず、発話検知部15により発話者処理実行に対する終了命令がなされていない場合(S121)、注目検知部16の発話者処理部16Aは、自端末の利用者が、表示されている映像のうち、どの聴衆者を注目しているか検出する処理(以下、発話者処理部注目箇所検出処理とする。)を行う(S122)。発話者処理部注目箇所検出処理により、発話処理部16Aが、表示された映像のうちいずれかの端末の利用者を注目していると判断すると(S123)、聴衆者注目情報構築部16Bは、「聴衆者注目情報」を構築する(S124)。次に、注目情報送信部17は、聴衆者注目情報構築部16Bにより構築された「聴衆者注目情報」を注目している聴衆者に対応する端末へ送信する(S125)。
【0066】
図8は、聴衆者側端末の動作を概略的に示すフローチャートである。
【0067】
注目情報受信部18は、「聴衆者注目情報」受信処理を開始、または継続する(S211)。注目情報受信部18が「聴衆者注目情報」を受信した場合(S212)、聴衆者処理部16Iは、発話者登録情報テーブル16Gに登録されている発話者数を確認し、登録されている発話者数が0である場合には(S213)、「聴衆者処理」の実行を開始する(S214)。また、発話者登録処理部16Fは、「聴衆者注目情報」に含まれる発話者が、発話者登録テーブル16Gに登録されていない新たな発話者であると認識すると、「聴衆者注目情報」に含まれる発話者に対応する端末の識別番号(発話者情報とする。)を発話者登録情報テーブルに登録する。(S215)。一方、注目情報受信部18が、「聴衆者注目情報」を受信していない場合(S212)、発話者登録処理部16Fは、発話者登録情報テーブル16Gにより、発話者登録状態を確認する(S216)。発話者登録処理部16Fは、発話者登録テーブル16Gに登録されている発話者情報に対応する発話者のうち、一定時間以上、自端末に対して、「聴衆者注目情報」を送信していない発話者を検出すると、その発話者に対応する発話情報を発話者登録テーブル16Gから削除する(S217)。発話者登録テーブル16Gに登録されている発話者情報数が0となった場合には(S218)、聴衆者処理部16Iは、「聴衆者処理」の実行を終了する(S219)。なお、発話者登録処理部16Fは、注目情報受信部18が、「聴衆者注目情報」を受信している場合において、発話者登録情報テーブル16Gに、新たに発話者情報を登録する際(S215)、同時に、一定時間以上、自端末に対して「聴衆者注目情報」を送信していない発話者を検出した場合、その発話者に対応する発話者情報を発話者登録テーブル16Gから削除しても良い。
【0068】
次に、聴衆者側端末の「聴衆者処理」の動作について説明する。図9は、聴衆者側端末が、「聴衆者処理」において実行する処理の動作を示すフローチャートである。まず、聴衆者処理実行に対する終了命令がなされていない場合(S221)、聴衆者処理部16Iは、自端末の利用者が、表示されている映像につき、どの端末の利用者を注目しているか検出する処理(以下、聴衆者処理部注目箇所検出処理とする。)を行う(S222)。
【0069】
次に、聴衆者処理部16Iは、聴衆者処理部注目箇所検出処理により検出した相手が、発話者登録テーブル16Gに登録されている発話者(以下、登録発話者とする。)と一致するか否か判断する。(S223)聴衆者処理部16Iが、一致すると判断すると、発話者注目情報構築部16Jは、一致すると判断した発話者に関して、「発話者注目情報」を構築する(S224)。注目情報送信部17は、発話者注目情報構築部16Jが構築した「発話者注目情報」を対応する端末へ送信する(S225)。
【0070】
次に、聴衆者側端末の発話者表示変更処理について説明する。図10は、聴衆者側端末が、「発話者表示変更処理」において実行する処理の動作を示すフローチャートである。
【0071】
まず、聴衆者処理実行に対する終了命令がなされていない場合(S231)、発話者表示変更処理部16Hは、発話者登録テーブル16Gに登録された発話者情報に対応する発話者の映像の表示状態を変更する要求を、映像制御部13に対して送り、映像制御部13は、その要求を受けて、発話者の映像の表示状態を変更する(S232)。一方、聴衆者処理実行に対する終了命令を検知した場合には、発話者表示変更処理部16Hは、S232により表示状態が変更された発話者の映像につき、前述したS232おける表示状態を変更前の映像の表示状態に戻す(S233)。
【0072】
次に、発話者側端末の聴衆者表示変更処理について説明する。図11は、発話者端末が、「聴衆者表示変更処理」において実行する処理の動作を示すフローチャートである。まず、発話者処理実行に対する終了命令がなされていない場合(S131)、注目情報受信部12は、「発話者注目情報」の受信処理を開始、または継続する(S132)。注目情報受信部12が、「発話者注目情報」を受信した場合は(S133)、聴衆者表示変更処理部16Eは、「発話者注目情報」の送信元の端末(即ち、注目者である聴衆者側端末。)から受信している映像の表示状態を変更する要求を、映像制御部13に対して送り、映像制御部13は、その要求を受けて、注目者である聴衆者の映像の表示状態を変更する(S134)。一方、発話者処理実行に対する終了命令を検知した場合には、聴衆者表示変更処理部16Eは、S134により表示状態が変更された聴衆者の映像について、前述したS134における表示状態を変更前の映像の表示状態に戻す(S135)。
【0073】
本実施形態に係る端末を備えるテレビ会議システムよれば、自分が話者になった場合に、自分が注目した相手もまた自分を注目しているか否かがわかるようになる。
【0074】
以下では、本実施形態に係る端末を備えた端末同士でテレビ会議を行う場合の、端末における表示画面の様子を図12から図14を用いて説明する。図12から図14は、本実施形態に係るテレビ会議システムおける端末の表示画面を示す簡略図である。以下では、9台の端末(9人の利用者(A,B,C,D,E,F,G,H,I)が利用)が映像を送受信し、各端末の表示画面には、自分をふくめ9人の利用者の映像が表示されているとする。
【0075】
図12は、いずれの利用者も発話者となっていない状態での、9人のうち利用者A,B,C,Iの4人の端末の表示状態を示している。
【0076】
図13は、利用者Aが発話者となり、利用者Aが、利用者Bを注目した状態での、9人のうち利用者A,B,C,Iの4人の端末の表示状態を示している。利用者Bの表示画面では、発話者Aに対応する表示状態が変更される。
【0077】
図14は、図13の状態の後、利用者Bが発話者である利用者Aを注目した状態での、9人のうち利用者A,B,C,Iの4人の端末の表示状態を示している。利用者Aの表示画面では、利用者Aが注目した利用者Bに対応する表示状態が変更される。
【0078】
ここで、図13と図14を比較すると、図13の場合には、利用者Aの表示画面において、自分が注目した利用者Bに対応する表示状態は変更されていない。すなわち、利用者Aは、自分は利用者Bを注目して話をしているが利用者Bは自分を見ていないということが認識できる。一方、利用者Aの表示画面が、図13から図14に示した表示状態に変化すると、利用者Aは、自分が注目して話をしている利用者Bもまた自分を注目しているということを認識できる。
【0079】
なお、図6から図11に示した本実施形態に係る動作フローは一例であり、これに限られない。
【0080】
例えば、図7の動作フロー、即ち、発話者側端末の「発話者処理」において実行される処理の動作フローにおいて、処理ステップS125について、注目情報送信部17は、聴衆者注目情報構築部16Bにより構築された「聴衆者注目情報」を注目している聴衆者に対応する端末へ送信(ユニキャスト)するとしたが、注目情報送信部17は、構築した「聴衆者注目情報」を、テレビ会議システムの全端末へ送信(マルチキャスト)してもよい。また、図8の聴衆者側端末の動作フローに関して、図15のように変更し、「聴衆者注目情報」を受信した際に、発話者登録処理部16Fが、自端末が、発話者を注目する聴衆者に対応するか否かを判断する処理(S2110)を追加してもよい。
【0081】
また、図7の動作フローにおいて、「聴衆者注目情報」の送信に関する処理を、図16に示した動作フローに変更してもよい。図16の動作フローにおいては、発話者処理部注目箇所検出処理(S122)により、発話者処理部16Aが、いずれかの聴衆者を注目していると判断すると(S123)、聴衆者注目情報構築部16Bは、注目した相手に対応する「聴衆者注目情報」を構築し(S124−1)、構築した「聴衆者注目情報」を注目した相手に対応する端末へのみ送信する(S125−1)。一方、発話者処理部16Aが、発話者処理部注目箇所検出処理(S122)により、発話者が、どの端末の利用者も注目していないと判断すると(S123)、聴衆者注目情報構築部16Bは、全員を注目したとし、全員に対応する「聴衆者注目情報」を構築し(S124−2)、注目情報送信部17は、構築した「聴衆者注目情報」を全端末へ送信する(S125−2)。
【0082】
図7のかわりに図16の動作シーケンスとした場合の差分を補足説明するため、先と同様に端末における表示画面の様子を図17と図18を用いて説明する。図17及び図18は、本実施形態に係るテレビ会議システムにおける端末の表示画面を示す簡略図である。
図17は、いずれの利用者も発話者となっていない状態の後、利用者Aが発話者となったが、利用者Aが誰も注目していない状態で、かつ、利用者Bと利用者Iの2人が利用者Aを注目した状態での、9人のうち利用者A,B,C,Iの4人の端末の表示状態を示している。利用者Aは発話者となったが、だれも注目していないため、全員を注目したと判断し「聴衆者注目情報」が全員に送信される。そのため、発話者が注目した聴衆者となる利用者B,C,I側では、発話者Aに対応する表示状態が変更される。一方、発話者である利用者A側では、発話者が注目した聴衆者のうち自分(利用者A)を注目している聴衆者(この場合は、利用者Bと利用者Iのみ)に対応する表示状態が変更される。
【0083】
図18は、図17の状態の後、発話者である利用者Aが利用者Iのみを注目した状態での、9人のうち利用者A,B,C,Iの4人の端末の表示状態を示している。この場合、「聴衆者注目情報」が利用者Iに対応する会議機器にのみに送信される。その結果、利用者B、C側での利用者Aの表示状態は元の状態にもどり、一方、利用者A側でも利用者Bの表示状態は元の状態にもどっている。
【0084】
図16の動作シーケンスを利用した場合には、利用者Aが特に相手を意識することなく発話を開始しているが、図17に示されるように、利用者Aの表示画面が変更されることにより、自分を注目している聴衆者が誰なのかがわかる。その結果、利用者Aは、特定の相手として利用者Iを注目すれば、利用者Aは、自分が注目して話をしている利用者Iもまた自分を注目しているということを認識しながら話を継続することができる。
【0085】
尚、本実施形態に係る端末(21〜24)は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いることでも実現することが可能である。即ち、映像情報入力部10、映像送信部11、映像受信部12、映像制御部13、映像表示部14、発話検知部15、注目検知部16(注目検知部16のうち発話処理部16A、聴衆者注目情報構築部16B、聴衆者登録処理部16D、聴衆者表示変更処理部16E、発話者登録処理部16F、発話者表示変更処理部16H、聴衆者処理部16I、発話者注目情報構築部16J)、注目情報送信部17、注目情報受信部18とは、上記のコンピュータ装置に搭載されたプロセッサにプログラムを実行させることにより実現することができる。このとき、端末(21〜24)は、上記のプログラムをコンピュータ装置にあらかじめインストールすることで実現しても良いし、CD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータ装置い適宜インストールすることで実現しても良い。
【0086】
また、注目検知部16のうち聴衆者登録情報テーブル16C、発話者登録情報テーブル16Gは、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスク若しくはCD−R、CD−RW、DVD−RAM、DVD−Rなどの記憶媒体などを適宜利用して実現することができる。
【0087】
尚、本実施形態に係る端末は、「発話者表示変更処理」、「聴衆者表示変更処理」共に、それぞれ、発話者、発話者が注目する聴衆者を強調表示するために、映像制御部13は、注目検知部16からの変形要求信号の変形方法により、発話者、発話者が注目する聴衆者の映像を変更した。例えば、「聴衆者表示変更処理」においては、注目検知部16の聴衆者表示変更処理部16Eによる変形要求信号に基づき、発話者が注目する聴衆者の映像を他の端末の利用者の映像より大きく表示する変形を行った。しかしながら、映像制御部13は、他の端末の利用者の映像と比べて、発話者が注目する聴衆者を強調表示すればよく、発話者が注目する聴衆者以外の映像を変形しても良い。例えば、映像制御部13は、「聴衆者表示変更処理」において、注目検知部16からの変形要求信号に基づき、発話者が注目する聴衆者の映像の大きさは変形せず、発話者が注目する聴衆者以外の聴衆者の映像を小さくする変形を行っても良い。
【0088】
(第2の実施形態)
図19は、本発明の第2の実施形態に係るテレビ会議システムを示す簡略図である。
【0089】
第2の実施形態に係るテレビ会議システムは、4つの端末21−2、22−2、223−2、24−2と多地点制御装置(MCU:Multipoint Control Unit)5(サーバ)がそれぞれネットワーク接続されている。
【0090】
MCU5は、複数の映像を受信し、複数の受信映像から合成映像を複数生成し、生成した複数の合成映像を配信する機能を備える。
【0091】
次に、本実施形態に係る端末21−2について説明する。図20は、本実施形態に係る端末21−2を示すブロック図である。以下では、端末21−2につき、第1の実施形態に係る端末21と異なる点について説明する。尚、端末22−2〜24−2も、端末21−2と同様の構成、機能を有するものとする。
【0092】
まず、端末21−2は、映像制御部13を備えない点、変形要求信号送信部19を備える点が、第1の実施形態に係る端末21と異なる。
【0093】
変形要求信号送信部19は、注目検知部16−2により構築された変形要求信号が入力されると、変形要求信号をネットワークへ送信するための加工を行い、MCU5を宛先として指定してネットワークへ送信する。
【0094】
端末21−2の映像送信部11−2は、圧縮した映像データを伝送路3へ送信するが、宛先としてMCU5が指定されている。一方、端末21−2の映像受信部12−2は、MCU5から圧縮された映像データを受信する。また、映像受信部12−2は、受信した圧縮された映像データを伸長した後に、映像表示部14へ出力する。そして、映像表示部14は、映像受信部12−2が、MCU5から受信し、伸長した映像データを表示デバイス21dに表示させる。
【0095】
また、端末21−2は、映像制御部13を備えないため、端末21−2の注目検知部16−2の処理は、第1の実施形態に係る端末21の注目検知部16の処理と異なる。まず、発話者表示変更処理において、注目検知部16−2は、発話者登録処理にて認識した発話者の端末に対応する映像の表示状態を変更する変形要求信号を映像制御部13でなく、変形要求信号送信部19に出力する。また、聴衆者表示変更処理において、聴衆者登録情報テーブル16Cに聴衆者が登録されると、その聴衆者の端末に対応する映像の表示状態を変更するように要求する変形要求信号を映像制御部13でなく、変形要求信号送信部19に出力する。尚、端末21−2の発話検知部15、注目情報送信部17、注目情報受信部18についての処理は、第1の実施形態と同様の処理を行う。
【0096】
次に本実施形態に係る会議システムにおいて、端末21−2が発話者端末、及び聴衆者側端末となる場合の、端末21−2の動作フローが、第1の実施形態に係る端末21の動作フローと異なる点について説明する。
【0097】
まず、端末21−2が発話者端末になる場合について説明する。発話者端末となる場合は、図11に示した発話者側端末の聴衆者表示変更処理において実行する処理が異なる。即ち、発話者端末において、第1の実施形態にかかる端末21は、映像制御部13が、表示画面の変更する処理を行っていたが、第2の実施形態に係る端末21−2は、端末自身は、表示画面の変更する処理は行わず、変形要求信号送信部19が、その変形要求信号をMCU5へ送信し、表示画面の変更処理をMCU5に処理させる。具体的に動作フローを説明すると、図21に示すとおりである。即ち、注目情報受信部18が、「発話者注目情報」を受信した場合(S133)、注目検知部16−2の聴衆者表示変更処理部16Eは、「発話者注目情報」の送信元の端末(即ち、聴衆者側端末。)に対応する映像の表示を変更する要求を含む変形要求信号を構築し(S136)、変形要求信号送信部19は、その変形要求信号をMCU5へ送信する(S137)。一方、発話者処理実行に対する終了命令を検知した場合には、聴衆者表示変更処理部16Eは、表示状態が変更された聴衆者の映像について表示状態変更前の映像の表示状態に戻すための表示復元信号を構築し(S138)、変形要求信号送信部19は、構築した表示復元信号をMCU5へ送信する。(S139)。
【0098】
次に、端末21−2が聴衆者側端末になる場合について説明する。聴衆者側端末となる場合は、図10に示した聴衆者側端末の発話者表示変更処理において実行する処理が異なる。即ち、聴衆者端末において、第1の実施形態にかかる端末21は、映像制御部13が、表示画面を変更する処理を行っていたが、第2の実施形態に係る端末21−2は、端末自身は、表示画面を変更する処理は行わず、変形要求信号送信部19が、その変形要求信号をMCU5へ送信し、表示画面の変更処理をMCU5に処理させる。具体的に動作フローを説明すると、図22に示すとおりである。即ち、聴衆者処理実行に対する終了命令がなされていない場合、注目検知部16の発話者表示変更処理部16Hは、発話者登録テーブル16Gに登録された発話者情報に対応する発話者の映像の表示状態を変更する要求を含む変形要求信号を構築し(S234)、変形要求信号送信部19は、その変形要求信号をMCU5へ送信する(235)。一方、聴衆者処理実行に対する終了命令を検知した場合には、発話者表示変更処理部16Hは、表示状態が変更された発話者の映像を前述した表示状態変更前の映像の表示状態に戻すための表示復元信号を構築し(S236)、変形要求信号送信部19は、構築した表示復元信号をMCU5へ送信する(S237)。
【0099】
次に、MCU5について説明する。
【0100】
図23はMCU5を示すブロック図である。MCU5は、パケット送受信部510、映像伸長部541〜544、映像合成部520、映像圧縮部551〜554、制御部530、レイアウト情報記憶部560、レイアウト変更指示解析部570を備える。
【0101】
パケット送受信部510は、伝送路3からMPEG4等に圧縮された映像データを受信し、圧縮された映像データを映像伸長部541〜544のいずれかへ出力する。パケット送受信部510は複数の端末が送信する映像データを受信することが可能である。そして、その場合、パケット送受信部510は、複数の端末ごとの映像データを分離して処理することができる。本実施形態においては、パケット送受信部510は、4台の端末(21−2、22−2、23−2、24−2)と同時に通信を行っているため、4台の端末(21−2、22−2、23−2、24−2)それぞれから映像データを受信する(計4つの映像データを受信する)。4つの映像データを受信したパケット送受信部510は、4つの映像データを分離した後、それぞれの映像データを対応する映像伸長部541〜544へ出力する。
【0102】
映像伸長部541〜544は、パケット送受信部により受信された圧縮された映像データが入力されると、圧縮された映像データを伸長し非圧縮の映像を生成する。映像伸長部541〜544は、生成した非圧縮の映像を、映像合成部520に出力する。
【0103】
映像合成部520は、4つの非圧縮映像が映像伸長部541〜544から入力されると、それら4つの映像を用いて合成映像を生成する。なお、合成映像も非圧縮映像である。本実施例では、映像合成部520は、4つの異なる合成映像を生成できるものとする。尚、4つの合成映像は、それぞれ4台の端末(21−2、22−2、23−2、24−2)に対応した合成映像とする。尚、映像合成部が、4つの合成映像を生成する際に必要となる合成映像のレイアウト情報は、レイアウト情報記憶部560に記憶されている。そして、制御部530が、レイアウト情報記憶部560が記憶するレイアウト情報を取得し、映像合成部520に出力する。
【0104】
映像圧縮部551〜554は、映像合成部520から入力された非圧縮の合成映像をMPEG4などの形式に圧縮した映像データを生成する。映像圧縮部551〜554は、圧縮した合成映像の映像データを、パケット送受信部510に出力する。
【0105】
パケット送受信部510は、映像圧縮部551〜554から映像データが入力されると、伝送路3へ送信する機能を備える。パケット送受信部510は複数の端末へそれぞれ異なる映像データを送信することも可能である。本実施形態においては、パケット送受信部510は、映像圧縮部551〜554から入力された映像データを、対応する4台の端末(21−2、22−2、23−2、24−2)へそれぞれ送信する。
【0106】
制御部530は、映像伸長部541〜544と映像圧縮部551〜554を起動させる機能及び、停止する機能を備える。また、制御部530は、映像伸長部541〜544それぞれに対し個別に伸長処理を行うためのパラメータを与える機能及び、映像圧縮部551〜554それぞれに対し個別に圧縮処理を行うためのパラメータを与える機能を備える。また、制御部530は、先述したとおり、映像合成部520に対し、4つの合成映像を生成する際に必要となる合成映像のレイアウト情報を与える機能を備える。また、制御部530は、パケット送受信部510に対し、端末(本実施例では21−2、22−2、23−2、24−2)から受信した映像データをいずれの映像伸長部541〜544に入力するかの対応情報を与える機能、および、パケット受信部510に対して、映像圧縮部551〜554から入力された映像データをいずれの端末(21−2、22−2、23−2、24−2)に送信するかの対応情報を与える機能を備える。
【0107】
図24は、テレビ会議システムを4人で開始した最初の状態で、MCU5が4台の端末(21−2、22−2、23−2、24−2)それぞれから受信する映像(V1〜V4)と、それぞれの端末へ送信する合成映像(MV1〜MV4)を図示したものである。この合成映像のレイアウト構成に関する情報は、レイアウト情報記憶部560に記憶されている。
【0108】
レイアウト変更指示解析部570は、端末から受信した変形要求信号が制御部530から入力されると、その変形要求信号に従って、レイアウト情報記憶部560に記憶されているレイアウト情報を更新し、制御部530にレイアウト情報が更新されたことを通知する機能を備える。本実施例では、例えば、端末21−2の変形要求信号送信部19から変形要求信号を受信すると、レイアウトを変更する命令として解釈し、レイアウト情報記憶部560に記憶されている、端末21−2へ送信する合成映像のレイアウト情報を変更し、制御部530に対して端末21−2へ送信する合成映像のレイアウトを変更するように命令する。制御部530はレイアウト変更指示解析部570による命令に従い、更新されたレイアウト情報を映像合成部520へ与える。映像合成部520は、制御部530からレイアウト情報が与えられると、それに従いレイアウトを変更した合成映像を生成する。例えば、変形要求信号に「端末21−2に対応する映像を大きくする」と解釈可能な内容がふくまれている場合、映像合成部520は、レイアウト変更指示解析部570の命令を受けた制御部530から与えられるレイアウト情報に従って、端末21−2へ送信される合成映像を図25に示すように、端末22−2に対応する映像を大きくするような映像に変更する。また、変形要求信号に「端末22−2に対応する映像をもとにもどす」と解釈可能な内容が含まれていれば、映像合成部520は、レイアウト変更解析部570の命令を受けた制御部530から与えられるレイアウト情報に従って、レイアウト情報記憶部560に記憶されている最初の状態のレイアウトを参考とし、端末21−2へ送信される合成映像を図24に示した状態に戻す。
【0109】
なお、図26(a)は、テレビ会議システムを4人で開始した最初の状態での合成映像のレイアウトの別の例である。この場合、レイアウト変更指示解析部570が、変形要求信号を受信した場合であって、変形要求信号が「端末22−2に対応する映像を強調する」と解釈可能な内容がふくまれている場合、レイアウト変更指示解析部570は、例えば、図26(b)に示されるように端末22−2に対応する映像の位置をずらし、最前面にした状態で、さらに影をつけるようなレイアウト情報に更新しても良い。
【0110】
本実施形態に係るテレビ会議システムによれば、端末(21−2、22−2、23−2、24−2)とMCU5とを備えることにより、端末は他の端末から個別に映像を受信しなくても、MCU5から一つの映像を受信して表示しつづけるだけでよく、端末(21−2、22−2、23−2、24−2)の映像変形処理等の処理負荷を低減することができる。
【0111】
また、本実施形態に係るテレビ会議システムによれば、第1の実施形態と同様な効果を達成することができる。即ち、自分が話者になった場合に、自分が注目した相手もまた自分を注目しているか否かがわかるようにすることができる。第1の実施形態に係るテレビ会議システムと同様に、端末(21−2、22−2、23−2、24−2)が、発話者側端末と聴衆者側端末となった場合、図12から図14に示した表示画面の変化や、図17と図18に示した表示画面の変化を実現することができる。
【0112】
(第3の実施形態)
第3の実施形態に係るテレビ会議について説明する。図27に、第3の実施形態に係るテレビ会議システムを示す。第3の実施形態に係るテレビ会議システムは、端末21−3、22−3、23−3及び24−3、ネットワーク3及びMCU5−3(サーバ)から構成される。
【0113】
第3の実施形態に係るテレビ会議システムでは、第2の実施形態に係るテレビ会議システムにおいては端末側の構成要素である注目検知部、注目情報送信部、注目情報受信部をMCU側の構成要素としている。
【0114】
次に、本実施形態に係る端末21−3について説明する。
【0115】
図28は、本実施形態に係る端末21−3の内部構成を示すブロック図である。
【0116】
本実施形態に係る端末21−3は、発話検知部15−3と、映像送信部11−3と、映像受信部12−3と、映像表示部14−3とを備える。
【0117】
発話検知部15−3は、自端末が発話者となったことを検知する機能を備える。更に、発話検知部15−3は、自端末が発話者となったことを検知した場合に、自端末が発話者となったことを示す発話者通知信号を生成し、ネットワーク3からMCU5−3を宛先として指定して送信する機能を備える点が、第2の実施形態に係る発話検知部と異なる。
【0118】
なお、本実施形態に係る映像送信部11−3、映像受信部12−3、映像表示部14−3の機能は、第2の実施形態に係る機能と同様である。また、本実施形態に係る端末21−3は、第2の実施形態に係る端末21−2と異なり、注目情報入力部、注目検知部、注目情報送信部、変形要求信号送信部、注目情報受信部を備えない。
【0119】
次に、MCU5−3について説明する。
【0120】
図29は、MCU5−3を示すブロック図である。MCU5−3は、まず、構成要素として、第2の実施形態に係るMCU5と同様の構成要素を備える。更に、MCU5−3は、注目検知部516(516−1、516−2、516−3、516−4)、注目情報送信部517(517−1、517−2、517−3、517−4)、注目情報受信部518(518−1、518−2、518−3、518−4)、内部バス580を更に備える点が、第2の実施形態に係るMCU5と異なる。尚、注目検知部516−1、注目情報送信部517−1及び注目情報受信部518−1は、端末21−3に対応する処理を行う。又、同様に、注目検知部516−2〜516−4、注目情報送信部517−2〜517−4及び注目情報受信部518−2〜518−4は、それぞれ、端末22−3〜24−3に対応する処理を行う。
【0121】
パケット送受信部510は、端末21−3の発話検知部15−3から発話者通知信号を受信すると、発話者処理開始信号を生成し、注目検知部516−1へ出力する。
【0122】
注目検知部516−1は、発話者処理開始信号が入力されると、「発話者処理」を実行する。注目検知部516−1の「発話者処理」は、第1の実施形態に係る注目検知部16と同様の処理を行う。尚、注目箇所を検出する方法として、例えば、注目検知部516−1は、映像伸長部541から端末21−3の利用者Aの映像を取得し、映像解析機能を利用して利用者Aの注視点を推測し、その注視点の位置にある映像を注目していると検出してもよい。また、注目検知部516−1は、利用者Aの注目箇所を検出し、例えば、注目箇所に利用者Bの端末22−3に対応する映像が表示されているとすると、注目検知部516−1は、その情報を含む「聴衆者注目情報」を構築し、注目情報送信部517−1へ出力する。
【0123】
注目情報送信部517−1は、「聴衆者注目情報」を、内部バス580を利用し、端末22−3に対応する注目情報受信部518−2へ通知する。
【0124】
「聴衆者注目情報」を受信した注目情報受信部518−2は、「聴衆者注目情報」を抜き出し、注目検知部516−2へ出力する。
【0125】
注目検知部516−2は、聴衆者注目情報を受信すると、第1の実施形態の注目検知部16と同様に「聴衆者処理」を実行する。即ち、注目検知部516−2は、利用者Bの注目箇所を検出し、利用者Bの注目箇所が、発話者である利用者Aの端末21−3に対応する映像であると検出した場合には、「発話者注目情報」を構築し、注目情報送信部517−2へ出力する。
【0126】
注目情報送信部517−2は、「発話者注目情報」が入力されると、「発話者注目情報」を、端末21−3に対応する注目情報受信部518−1へ通知する。
【0127】
また、注目検知部516−2は、「聴衆者注目情報」を受信すると、第1の実施形態の注目検知部16と同様に「発話者表示変更処理」を行う。即ち、注目検知部516−2は、発話者であり、「聴衆者注目情報」の送信元である注目情報送信部517−1に対応する端末21−3を認識した上で、「端末21−3に対応する映像を大きくする」という変形要求信号を作成し、制御部530を介してレイアウト変更指示解析部570へ通知する。レイアウト変更指示解析部570での処理は、第2の実施形態で示したとおりである。即ち、レイアウト変更指示解析部570は、制御部530から変形要求信号が入力された場合に、その変形要求信号に従って、レイアウト情報記憶部560に記憶されているレイアウト情報を更新し、制御部530にレイアウト情報が更新されたことを通知する機能を備える。レイアウト情報記憶部560に記憶されている端末21−3へ送信する合成映像のレイアウト情報を変更し、制御部530に対して端末21−3へ送信する合成映像のレイアウトを変更するように命令する。制御部530はレイアウト変更指示解析部570による命令に従い、更新されたレイアウト情報を映像合成部520へ与える。映像合成部520は、制御部530からレイアウト情報が与えられると、それに従い、レイアウトを変更した合成映像を生成する。
【0128】
注目情報受信部518−1は、注目情報送信部517−2から「発話者注目情報」を受信すると、「発話者注目情報」を抜き出し、注目検知部516−1へ出力する。
【0129】
注目検知部516−1は、第1の実施形態の注目検知部16と同様に、「発話者注目情報」が入力されると、「聴衆者表示変更処理」を行う。即ち、注目検知部516−1は、自分宛の「発話者注目情報」を受信した場合には、発話者が注目する聴衆者であり、「発話者注目情報」の送信元である注目情報送信部517−2に対応する端末22−3を認識した上で、「端末22−3に対応する映像を大きくする」という変形要求信号を作成し、制御部530を介してレイアウト変更指示解析部570へ通知する。レイアウト変更指示解析部570での処理は第2の実施形態で示した通りである。
【0130】
以上、本実施形態に係るテレビ会議システムに関して、概要のみを示したが、本実施形態で説明を省略した部分は第1の実施形態、又は、第2の実施形態で示したとおりの動作を適用することが可能である。
【0131】
また、本実施形態に係るテレビ会議システムによれば、第1の実施形態と同様な効果を達成することができる。即ち、自分が話者になった場合に、自分が注目した相手もまた自分を注目しているかがわかるようにすることができる。
【0132】
また、本実施形態に係るテレビ会議システムによれば、第2の実施形態に係るテレビ会議システムと同様な効果を達成することができる。即ち、端末とMCUとを備えることにより、端末は他の端末から個別に映像を受信しなくても、MCUから一つの映像を受信して表示しつづけるだけでよく、端末の映像変形処理等の処理負荷を低減することができる。また、本実施形態に係るテレビ会議システムによれば、第2の実施形態に係るテレビ会議システムにおいては端末側の構成要素である注目検知部、注目情報送信部、注目情報受信部をMCU側の構成要素とすることにより、端末側の処理をより低減することができる。
【0133】
(第4の実施形態)
本実施形態に係るテレビ会議システムは、端末が、最初の状態(いずれの端末が聴衆者でない場合)において、表示画面に表示する映像が、図32に示されるように、台形である点が、第1の実施形態に係るテレビ会議システムと異なる。
【0134】
まず、端末が、最初の状態において、表示画面に表示するテレビ会議参加者を台形に表示する方法について説明する。
【0135】
尚、本実施形態では、発話者となる会議参加者S(Speaker)が、自分以外に4人の会議参加者(A,B,C,D)とテレビ会議システムを利用している場合であって、端末の表示画面に自分以外の4人の参加者の映像を表示する場合について説明する。尚、図32に示すように、参加者A、参加者B、参加者C,参加者Dは、それぞれ胸に「−」マーク、「○」マーク、「+」マーク、「A」マークを有するものとする。
【0136】
尚、本実施形態において、テレビ会議システムへの参加順序が、A、B,C,Dの順であるとし、参加者Sの端末は、この参加順序を認識しているものとする。例えば、参加者Sの端末は、映像受信部12により受信した映像に対応する端末の順序で、参加順序を認識する。
【0137】
まず、映像制御部13が、映像受信部12により受信され、映像受信部12により入力された4人の参加者の映像を変形する方法について説明する。
【0138】
まず、映像制御部13は、映像受信部12から受信した映像についてサイズの調整を行う。例えば、受信した映像が横のサイズが320ピクセル、縦のサイズが240ピクセルであった場合、横のサイズを240ピクセル、縦のサイズを240ピクセルとなるように調整する。(以下では、この画像サイズの調整を正規化と呼ぶ。)
次に、参加者Sの端末の映像制御部13が、正規化した映像に対して行う画像変形処理について説明する。
【0139】
映像制御部13が行う画像変形処理は、概略を説明すると以下のとおりである。
【0140】
(1)受信した映像を正規化後、正規化した映像の右辺部、又は、左辺部の長さがr11/r12となるように台形変形する。
【0141】
(2)次に、台形変形した映像につき、横方向の長さがr21/r22となるように縮小変形する。
【0142】
(3)次に、縮小変形した映像に対して、面積がr31/r32となるように縮小変換する。
【0143】
次に、上記(1)〜(3)の映像制御部13が行う画像変形処理について、具体的な処理を説明する。
【0144】
まず、第1の参加者(参加者A)の映像の画像変形処理について説明する。第1の参加者の映像の画像変形処理においては、例えば、r11/r12=1/2、r21/r22=2/3、r31/r32=1/1とする。
【0145】
(1−1)まず、第1の参加者の映像を正規化後(図30の(a1))、受信映像の右辺部が1/2(120ピクセル)となるように台形変形する(図30の(a2))。
【0146】
(1−2)次に、上記第1の参加者の台形変形映像に対し、横方向が2/3(160ピクセル)となるように縮小変形する(図30の(a3))
(1−3)更に、上記第1の参加者の縮小変形映像に対し、面積が1/1倍となるように縮変換する(図30の(a4))。
【0147】
次に、第2の参加者(参加者B)の画像変形処理について説明する。第1の参加者の映像の画像変形処理においては、例えば、r11/r12=1/2、r21/r22=2/3、r31/r32=1/1とする。
【0148】
(2−1)まず、第1の参加者の映像を正規化した後(図30の(b1))、受信映像の左辺部が1/2(120ピクセル)となるように台形変形する(図30の(b2))
(2−2)次に、上記第2の参加者の台形変形映像に対し、横方向が2/3(160ピクセル)となるように縮小変形する(図30の(b3))
(2−3)更に、上記第2の参加者の縮小変形映像に対し、面積が1/1倍となるように縮小変換する(図30の(b4))
次に、第3の参加者(参加者C)の画像変形処理について説明する。第1の参加者の映像の画像変形処理においては、例えば、r11/r12=1/2、r21/r22=2/3、r31/r32=1/4とする。
【0149】
(3−1)第3の参加者の映像を正規化した後(図31の(c1))、受信映像の右辺部が1/2(120ピクセル)となるように台形変形する(図31の(c2))
(3−2)また、上記第3の参加者の台形変形映像に対し、横方向が2/3(160ピクセル)となるように縮小変形する(図31の(c3))
(3−3)更に、上記第3の参加者の縮小変形映像に対し、面積が1/4倍となるように縮小変換する(図31の(c4))。
【0150】
次に、第4の参加者(参加者D)の画像変形処理について説明する。第1の参加者の映像の画像変形処理においては、例えば、r11/r12=1/2、r21/r22=2/3、r31/r32=1/4とする。
【0151】
(4−1)まず、第4の参加者の映像を正規化した後(図31の(d1))、受信映像の左辺部が1/2(120ピクセル)となるように台形変形する(図31の(d2))
(4−2)また、上記第4の参加者の台形変形映像に対し、横方向が2/3(160ピクセル)となるように縮小変形する(図31の(d3))
(4−3)更に、上記第4の参加者の縮小変形映像に対し、面積が1/4倍となるように縮小変換する(図31の(d4))
以上の映像制御部13が行う画像変形処理により、図32に示されるように、第1の参加者(参加者A)の映像の右辺部(すなわち、台形の上底)の長さと第3の参加者(参加者C)の映像の左辺部(すなわち、台形の下底)の長さとが一致するように変形される。また、第2の参加者(参加者B)の映像の左辺部(すなわち、台形の上底)の長さと第4の参加者(参加者D)の映像の右辺部(すなわち、台形の下底)の長さとが一致するように変形される。
【0152】
なお、本実施形態では発話者の会議参加者S以外の参加者が、4人である場合について説明したが、4人以上であっても良い。例えば、8人である場合について、映像制御部13の上述した画像変形処理について説明する。第5の参加者の受信映像については、右辺部を1/2倍、横方向に2/3倍したのち、面積が1/16倍となるように変形する。第6の参加者の受信映像については、左辺部を1/2倍、横方向に2/3倍したのち、面積が1/16倍となるように変形する。第7の参加者の受信映像については、右辺部を1/2倍、横方向に2/3倍したのち、面積が1/64倍となるように変形する。第8の受信映像については、左辺部を1/2倍、横方向に2/3倍したのち、面積が1/64倍となるように変形する。
【0153】
次に、映像表示部14が、映像制御部13から入力された映像データを、表示デバイスに表示させる。表示の際には、前述した4人の参加者の映像データの配置作業を行う。図32には、映像表示部14により配置された映像データを示す。参加者Sの端末の映像表示部14は、まず、第1の参加者の映像が表示エリアの左部分に表示されるように配置する。次に、第2の参加者の映像が表示エリアの右部分に表示されるように配置する。次に、第3の参加者の映像は、第3の参加者の映像の左辺が第1の参加者の映像の右辺に接して表示されるように配置する。次に、第4の映像は、第4の参加者の映像の右辺が第2映像の左辺に接して表示されるように配置する。尚、第1の参加者の映像と第3の参加者の映像とは、接するように配置されなくても良い。第2の参加者の映像と第4の参加者の映像についても同様である。
【0154】
次に、端末が、発話者S側の端末である場合であって、「聴衆者表示変更処理」において、最初の状態において、図32のように映像表示部14に配置された映像データに関して、発話者Sが注目する聴衆者の映像の表示を変更する方法について説明する。
【0155】
即ち、第1の実施形態で説明したとおり、参加者Sの端末では、参加者Sが図32の表示映像において、参加者N(ここでNはA,B,C,Dのいずれかとする)の映像を注目すれば、参加者Nの端末に対し「聴衆者注目情報」が送付される。一方、「聴衆者注目情報」を受信した参加者Nの端末において、参加者Nが発話者側である参加者Sの映像(図示せず)を注目したとすると、参加者Sの端末に「発話者注目情報」が送付される。参加者Sの端末は「発話者注目情報」を受信した場合に、「聴衆者表示変更処理」を行う。
【0156】
本実施形態においては、参加者Sの端末は、「聴衆者表示変更処理」として、聴衆者である参加者Nの映像を正規化した後、面積がr41/r42となるように縮小変換する。本実施形態においては、例えば、r41/r42=4/9とする。
【0157】
以下では、参加者Sの端末が発話者となり、参加者A〜Dそれぞれが、発話者が注目する聴衆者となった場合の、参加者Sの端末における「聴衆者表示変更処理」について説明する。
【0158】
例えば、参加者Sの端末では、参加者Sが図32の表示映像において、参加者Aの映像を注目し、参加者Aの端末から「発話者注目情報」を受信した場合は、参加者Sの端末は、発話者が注目する聴衆者である参加者Aからの受信映像を正規化した後、面積が4/9となるように縮小変換する。その結果、通常状態(「発話者注目情報」を受信前の状態。)において台形変形された状態(図30の(a4))で表示されていた参加者Aの映像が、「発話者注目情報」を受信後には、正規化され、4/9倍に縮小変換された参加者Aの映像が表示される。図33(a)に参加者Aの表示方法を変化させた場合の様子を示す。
【0159】
同様に、図33(b)には、参加者Sが参加者Bを注目し、参加者Bの端末から「発話者注目情報」を受信した場合に、参加者Bの表示方法を変化させた場合の様子を示す。また、図34(c)には、参加者Sが参加者Cを注目し、参加者Cの端末から「発話者注目情報」を受信した場合に、参加者Cの表示方法を変化させた場合の様子を示す。また、図34(d)には、参加者Sが参加者Dを注目し、参加者Dの端末から「発話者注目情報」を受信した場合に、参加者Dの表示方法を変化させた場合の様子を示す。
【0160】
尚、以上では、発話者側の端末の「聴衆者表示変更処理」における聴衆者の映像の表示の変更方法について説明したが、聴衆者側の端末の「発話者表示変更処理」における発話者の映像の表示の変更方法も上記で説明した表示方法の変更方法と同様の変更方法により処理を行う。
【0161】
本実施形態に係るテレビ会議システムによれば、発話者側端末が、最初の状態(いずれの参加者も発話者でない場合)において、表示画面に表示する映像が、台形であり、発話者端末が、「発話者注目情報」を受信した場合に、発話者注目情報の送信元である聴衆者の画像だけ形状を変更(例えば、正方形にする。)して強調表示することにより、端末を利用する利用者が、自分が注目した相手もまた自分を注目している様子がより強調され、その認識が容易となる効果を有する。即ち、最初の状態において、表示画面に表示される映像が、台形であることにより、表示画面により表示された他端末の利用者の映像は、自端末の利用者が、表示画面を斜めから見たような映像であり、正面から見たような映像として表示されないのに対して、強調表示することにより表示される端末の利用者の映像は、自端末の利用者が、表示画面を正面から見たような映像として表示されるため、利用者は、容易に認識することができる。
【0162】
本実施形態において、最初の状態において、表示画面に表示する映像は台形としたが、必ずしも台形である必要はない。即ち、表示画面により表示された他端末の利用者の映像が、自端末の利用者が、表示画面を斜めから見たような映像であれば良い。また、本実施形態においては、「発話者注目情報」を受信した場合に、発話者注目情報の送信元の画像を正方形として表示したが、必ずしも正方形として表示する必要はない。即ち、自端末の利用者が、表示画面を正面から見たような映像として表示すれば良い。例えば、長方形として表示しても良い。
【0163】
尚、本実施形態においては、次に、映像表示部14が、映像制御部13から入力された映像データを、表示デバイスに表示させる際の、配置作業は、本実施形態に示した方法に限られない。例えば、参加者Sの端末の映像表示部14は、第1の参加者の映像が表示エリアの右部分に表示されるように配置し、第2の参加者の映像が表示エリアの左部分に表示されるように配置し、第3の参加者の映像が、第3の参加者の映像の右辺が第1の映像の左辺に接して表示されるように配置し、第4の映像は、第4の参加者の映像の左辺が第2映像の右辺に接して表示されるように配置しても良い。また、第1の参加者の映像から第4の参加者の映像を、左から順番に配置しても良い。この場合、それぞれの配置に合わせて、第1の参加者から第4の参加者の映像の台形変形、縮小変形等を行って良い。
【0164】
また、r11/r12、r21/r22、r31/r33の比率についても本実施形態に示した上記に示した値に限られない。例えば、r11/r12 = 3/4、r21/r22 = 4/7とし、r31/r33で示す面積比も順に1/1倍(参加者Aの映像、参加者Bの映像の場合)、9/16倍(参加者Cの映像、参加者Dの映像の場合)となるようにしてもよい。
【0165】
また、r41/r42についても本実施形態に示した上記に示した値に限られない。例えば、r41/r42 = 1/2としても良い。また、r41/r42について、参加者の映像に応じて値を変更してもよい。例えば、r41/r42に関して、参加者A、参加者Bの映像については、4/9倍として、参加者C及び参加者Dの映像については、1/9倍となるようにしてもよい。また、正規化後の映像のサイズについても、横のサイズを240ピクセル、縦のサイズを240ピクセルとするサイズ(正方形)に限られない。例えば、横のサイズを320ピクセル、縦のサイズを240ピクセル(長方形)であっても良い。
【0166】
尚、本実施形態に係るテレビ会議システムは、第1の実施形態に示したような端末とネットワークからなるテレビ会議システム、第2及び第3の実施形態に示したような端末とMCUを備えるテレビ会議システム、いずれのテレビ会議システムにも適用することができる。
【0167】
尚、本発明は上記実施形態をそのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0168】
3・・・伝送路
5、5−3・・・MCU
10・・・注目情報入力部
11、11−2、11−3・・・映像送信部
12、12−2、12−3・・・映像受信部
13・・・映像制御部
14、14−3・・・映像表示部
15、15−3・・・発話検知部
16、16−2、516−1、516−2、516−3、516−4・・・注目検知部
17、517−1、517−2、517−3、517−4・・・注目情報送信部
18、518−1、518−2、518−3、518−4・・・注目情報受信部
16A・・・発話者処理部
16B・・・聴衆者注目情報構築部
16C・・・聴衆者登録情報テーブル
16D・・・聴衆者登録処理部
16E・・・聴衆者表示変更処理部
16F・・・発話者登録処理部
16G・・・発話者登録情報テーブル
16H・・・発話者表示変更処理部
16I・・・聴衆者処理部
16J・・・発話者注目情報構築部
19・・・変形要求信号送信部
21、22、23、24、21−2、22−2、23−2、24−2、21−3、22−3、23−3、24−3・・・端末
21c、22c、23c、24c・・・カメラ
21m、22m、23m、24m・・・マイク
21s、22s、23s、24s・・・スピーカ
21d、22d、23d、24d・・・表示デバイス
510・・・パケット送受信部
520・・・映像合成部
530・・・制御部
541、542、543、544・・・映像伸長部
551、552、553、554・・・映像圧縮部
560・・・レイアウト情報記憶部
570・・・レイアウト変更指示解析部
580・・・内部バス
V1、V2、V3、V4・・・入力映像
A1、A2、A3、A4・・・入力音声
MV1、MV2、MV3、MV4・・・映像
MA1、MA2、MA3、MA4・・・音声

【特許請求の範囲】
【請求項1】
自端末の利用者を撮像した第1映像を他端末に送信する映像送信手段と、
他端末の利用者を撮像した複数の第2映像を受信する映像受信手段と、
複数の前記第2映像を並べて表示する表示手段と、
前記第1映像に対応する利用者が発話していることを検知する発話検知手段と、
前記第1映像に対応する利用者が発話中に注目している利用者の注目映像を、前記第2映像から検知する注目検知手段と、
前記注目検知手段が検知した注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する注目情報送信手段と、
前記注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する注目情報受信手段と、
前記第2の注目情報を受信した場合に、前記表示手段により表示される前記第2映像のうち、前記注目映像に対応する第2映像を、残りの第2映像にくらべて強調表示する制御を行う制御手段とを備えることを特徴とする端末。
【請求項2】
前記制御手段は、前記注目映像に対応する第2映像を、残りの第2映像にくらべて拡大することを特徴とする
請求項1記載の端末。
【請求項3】
前記制御手段は、前記注目映像に対応する第2映像を、残りの第2映像にくらべて形状を変形することを特徴とする
請求項1記載の端末。
【請求項4】
前記表示手段により表示された前記第2映像は、台形であり、
前記表示手段により表示された表示エリアの左部分は、該台形の左辺が下底、右辺が上底であり、表示エリアの右部分は、該台形の右辺が下底、左辺が上底となるような台形であり、
前記表示エリアの左部分に配置された前記第2映像は、前記表示エリアの右側に配置される台形ほど、上底及び下底の長さが短く、
前記表示エリアの右側に配置された前記第2映像は、前記表示エリアの左側に配置される台形ほど、上底及び下底の長さが短いことを特徴とする
請求項1記載の端末。
【請求項5】
前記第2映像は、隣り合う前記第2映像の台形の上底と下底が接するように配置され、
前記表示エリアの左部に配置された隣り合う前記第2映像は、左側に配置された台形の上底の長さと右側に配置された台形の下底の長さとが一致し、
前記表示エリアの右部に配置された隣り合う前記第2映像は、右側に配置された台形の上底の長さと左側に配置された台形の下底の長さとが一致することを特徴とする
請求項4記載の端末。
【請求項6】
前記制御手段は、前記注目映像に対応する第2映像を、長方形に変形することを特徴とする
請求項4、又は請求項5記載の端末。
【請求項7】
前記表示手段により表示された前記第2映像は、前記第1映像に対応する利用者が、表示画面を斜めから見たような映像であり、
前記制御手段は、前記注目映像に対応する第2映像は、前記第1映像に対応する利用者が、表示画面を正面から見たような映像とすることで強調することを特徴とする
請求項1記載の端末。
【請求項8】
自端末の利用者を撮像した第1映像をサーバに送信する映像送信手段と、
前記サーバから他端末の利用者を撮像した複数の第2映像の合成映像を受信する映像受信手段と、
前記映像受信手段により受信した合成映像を表示する表示手段と、
前記第1映像に対応する利用者が発話していることを検知する発話検知手段と、
前記第1映像に対応する利用者が発話中に注目している利用者の注目映像を、前記第2映像の合成映像から検知する注目検知手段と、
前記注目検知手段が検知した注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する注目情報送信手段と、
前記注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する注目情報受信手段と、
前記第2の注目情報を受信した場合に、前記表示手段により表示される前記第2映像のうち、前記注目映像に対応する第2映像を、残りの第2映像にくらべて強調する要求を前記サーバへ送信する要求送信手段とを備えることを特徴とする端末。
【請求項9】
前記注目検知手段は、前記注目情報受信手段により前記第2の注目情報を受信した場合に、検知した注目映像に対応する端末と前記第2の注目情報の送信元である端末とが一致するか否かを判定し、
前記注目情報送信手段は、前記注目検知手段が一致すると判定した場合に、前記注目映像に対応する端末に対して、第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する手段であることを特徴とする
請求項1、又は請求項8記載の端末。
【請求項10】
複数の端末の利用者を撮像した映像を受信する映像受信手段と、
前記映像受信手段により受信した端末の利用者の映像を合成することにより合成映像を生成する合成手段と、
前記合成映像を前記複数の端末へ送信する映像送信手段と、
前記端末の利用者が、発話をしていることを通知する発話者通知信号を受信する通知信号受信手段と、
前記通知信号受信手段が、発話者通知信号を受信した場合に、前記発話者通知信号を通知した端末の利用者が注目している端末の利用者の第1の注目映像を、前記合成映像から検知する検知手段とを備え、
前記検知手段は、前記第1の注目映像に対応する端末の利用者が、注目している端末の利用者の第2の注目映像を、前記合成映像から検知し、該第2の注目映像に対応する端末の利用者と前記発話者通知信号を通知した端末の利用者とが一致するか否かを判定し、
前記合成手段は、前記検知手段が一致すると判定した場合に、前記合成映像のうち、前記第1の注目映像に対応する端末の利用者の映像を強調表示した合成映像を生成することを特徴とするサーバ。
【請求項11】
前記合成手段は、前記合成映像のうち、前記第1の注目映像に対応する端末の利用者の映像を拡大することを特徴とする
請求項10記載のサーバ。
【請求項12】
前記合成手段は、前記合成映像のうち、前記第1の注目映像に対応する端末の利用者の映像を変形することを特徴とする
請求項10記載のサーバ。
【請求項13】
前記合成手段は、前記映像受信手段により受信した複数の端末の利用者の映像を台形に変形した合成映像を生成し、
前記合成映像の利用者の映像は、前記合成映像の左部分は、該台形の左辺が下底、右辺が上底であり、前記合成映像の右部分は、該台形の右辺が下底、左辺が上底であり、
前記合成映像の左部の利用者の映像は、前記合成映像の右側にある映像ほど、上底及び下底の長さが短く、
前記合成映像の右部の利用者の映像は、前記合成映像の左側にある映像ほど、上底及び下底の長さが短いことを特徴とする
請求項10記載のサーバ。
【請求項14】
前記合成映像の利用者の映像は、隣り合う前記合成映像の利用者の映像の台形の上底と下底が、接するように配置され、
前記合成映像の左部の隣り合う利用者の映像は、左側に配置された台形の上底の長さと右側に配置された台形の下底の長さとが一致し、
前記合成映像の右部の隣り合う利用者の映像は、右側に配置された台形の上底の長さと左側に配置された台形の下底の長さとが一致することを特徴とする
請求項13記載のサーバ。
【請求項15】
前記合成手段は、前記合成映像のうち、前記第1の注目映像に対応する端末の利用者の映像を、長方形に変形して強調表示した合成映像を生成することを特徴とする
請求項13記載のサーバ。
【請求項16】
前記合成映像の利用者の映像は、前記端末の利用者が、表示画面を斜めから見たよう映像であり、
前記合成手段は、前記第1の注目映像に対応する端末の利用者の映像を、前記端末の利用者が表示画面を正面から見たような映像として強調表示した合成映像を生成することを特徴とする
請求項10記載のサーバ。
【請求項17】
第1の端末が、前記第1の端末の利用者の映像を撮像した第1映像を他端末に送信する映像送信ステップと、
前記第1の端末が、他端末の利用者を撮像した複数の第2映像を受信する映像受信ステップと、
前記第1の端末が、前記複数の第2映像を並べて表示する表示ステップと、
前記第1の端末の利用者が、発話をしていることを検知する発話検知ステップと、
前記第1の端末が、発話中に注目している利用者の第1の注目映像を、前記第2映像から検知する第1の注目検知ステップと、
前記第1の注目検知ステップにおいて検知した前記第1の注目映像に対応する他の端末に対して、前記第1の端末の利用者が、前記第1の注目映像を注目していることを示す第1の注目情報を送信する第1の注目情報送信ステップと、
前記第1の注目映像に対応する第2の端末が、前記第1の端末から前記第1の注目情報を受信する第1の注目情報受信ステップと、
前記第2の端末が、前記第1の注目情報受信ステップにより前記第1の注目情報を受信した場合に、前記第2の端末の利用者が、注目している利用者の第2の注目映像を、前記第2の端末の表示手段に表示された映像から検知し、該第2の注目映像に対応する端末と前記第1の端末とが一致するか否かを判定する第2の注目検知ステップと、
前記第2の注目検知ステップにおいて、一致すると判定した場合に、前記第2の端末が、第2の注目映像を注目していることを示す第2の注目情報を送信する第2の注目情報送信ステップと、
前記第1の端末が、前記第2の注目情報を受信する第2の注目情報受信ステップと、
前記第1の端末が、前記第2の注目情報を受信した場合に、前記第1の注目映像に対応する第2映像を強調表示する制御を行う制御ステップとを備えることを特徴とする会議方法。
【請求項18】
自端末の利用者を撮像した第1映像を他端末に送信する映像送信手段と、
他端末の利用者を撮像した複数の第2映像を受信する映像受信手段と、
複数の前記第2映像を並べて表示する表示手段と、
前記第1映像に対応する利用者が発話していることを検知する発話検知手段と、
前記第1映像に対応する利用者が発話中に注目している利用者の第1の注目映像を、前記第2映像から検知する第1の注目検知手段と、
前記第1の注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記第1の注目映像を注目していることを示す第1の注目情報を送信する第1の注目情報送信手段と、
前記第1の注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する第1の注目情報受信手段と、
前記第2の注目情報を受信した場合に、前記表示手段により表示される前記第2映像のうち、前記第1の注目映像に対応する第2映像を、残りの第2映像にくらべて強調表示する制御を行う制御手段とを備える第1の端末と、
他の端末から第2の注目情報を受信する第2の注目情報受信手段と、
前記第2の注目情報受信手段により前記第2の注目情報を受信した場合に、自端末の利用者が、注目している第2の注目映像を、表示手段に表示された複数の第2映像から検知し、該検知した第2の注目映像に対応する端末と前記第2の注目情報の送信元である端末とが一致するか否かを判定する第2の注目検知手段と、
前記第2の注目検知手段が一致すると判定した場合に、前記第2の注目映像に対応する端末に対して、自端末が、前記第2の注目映像を注目していることを示す第1の注目情報を送信する第2の注目情報送信手段とを備える第2の端末とを
備えることを特徴とする会議システム。
【請求項19】
自端末の利用者を撮像した第1映像を他端末に送信する映像送信機能と、
他端末の利用者を撮像した複数の第2映像を受信する映像受信機能と、
複数の前記第2映像を並べて表示する表示機能と、
前記第1映像に対応する利用者が発話していることを検知する発話検知機能と、
前記第1映像に対応する利用者が発話中に注目している利用者の注目映像を、前記第2映像から検知する注目検知機能と、
前記注目映像に対応する他の端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信する注目情報送信機能と、
前記注目映像に対応する他の端末の利用者が、前記第1映像に注目していたことを示す第2の注目情報を受信する注目情報受信機能と、
前記第2の注目情報を受信した場合に、前記表示機能により表示される前記第2映像のうち、前記注目映像に対応する第2映像を、残りの第2映像にくらべて強調表示する制御を行う制御機能とを有し、
前記注目検知機能は、前記注目情報受信機能により前記第2の注目情報を受信した場合に、検知した注目映像に対応する端末と前記第2の注目情報の送信元である端末とが一致するか否かを判定し、
前記注目情報送信機能は、前記注目検知機能が一致すると判定した場合に、前記注目映像に対応する端末に対して、前記第1映像に対応する利用者が、前記注目映像を注目していることを示す第1の注目情報を送信することを特徴とする
会議プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate


【公開番号】特開2010−200150(P2010−200150A)
【公開日】平成22年9月9日(2010.9.9)
【国際特許分類】
【出願番号】特願2009−44517(P2009−44517)
【出願日】平成21年2月26日(2009.2.26)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】