映像提示システム、プログラム及び記録媒体
【課題】利用者に取って煩わしい電子データの合成位置を考慮することなく、相手の映像内に適切に合成表示された電子データを見ながら遠隔地間で実作業に適したコミュニケーションを可能とする。
【解決手段】LUT31は、画像提示システムで利用可能な利用形態に応じて、電子データの合成に必要とする加工を行うための加工情報を保持する。CPU29は、操作装置5に対する操作入力等に応じて画像提示システムの利用形態を予め定められた利用形態のなかから決定する。電子データ加工部28は、CPU29により決定された利用形態に基づいて、LUT31から加工情報を取得し、撮影装置2aで撮影された撮影画像に合成すべき電子データを加工する。画像重畳部21は、電子データ加工部25で加工された電子データと撮影画像とを合成し、送信制御部32から送信させる。
【解決手段】LUT31は、画像提示システムで利用可能な利用形態に応じて、電子データの合成に必要とする加工を行うための加工情報を保持する。CPU29は、操作装置5に対する操作入力等に応じて画像提示システムの利用形態を予め定められた利用形態のなかから決定する。電子データ加工部28は、CPU29により決定された利用形態に基づいて、LUT31から加工情報を取得し、撮影装置2aで撮影された撮影画像に合成すべき電子データを加工する。画像重畳部21は、電子データ加工部25で加工された電子データと撮影画像とを合成し、送信制御部32から送信させる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像提示システム、プログラム及び記録媒体に関し、より具体的には、撮影画像に対してリアルタイムに電子データを合成表示することで、遠隔地との間のシステム間でコミュニケーションをとって共同作業を行うことができるようにした映像提示システム、及び該システムの機能を実現するプログラム及び記録媒体に関する。
【背景技術】
【0002】
複数の作業者によるフェイスツーフェイスの共同作業には様々な形態がある。例えば、フェイスツーフェイスの共同作業として、実在の物を使った作業(モックアップを用いたプロダクトデザイン確認、作業リーダによる製造装置の使用方法に関するレクチャー等)や、作業者がお互いに横に座りながら、あるいは側に立ち、共通の画面を見ながら計算機を使った作業(ペアプログラミング、作業画面を使った状況報告等)等があり、これらの作業が頻繁に行われている。これらの作業は、コミュニケーションを伴う共同作業の中でも頻度が高く・重要な作業形態である。
【0003】
ここで示した作業はすべて、実在のものであれ、計算機によって作り出された電子データであれ、何らかの介在物を上手く使うことで人と人のコミュニケーションが成立している。一般的に、作業は効率を高めることが求められ、また複雑高度化したタスクは、何らかの補助情報を用いなければ解決することが困難である。従って、作業の中で会話によるコミュニケーションと共に何らかの作業オブジェクトを用いることが必須事項である。
【0004】
遠隔地との間で作業オブジェクトを介在させた作業を実現するために、撮影された実写映像に、計算機で利用することができる電子データを合成表示することで、上記実際の作業に近いコミュニケーションを遠隔地間で提供することができる。さらに撮影された実写映像の3次元的な空間や位置関係を考慮して電子データを合成できると、2次元平面に単純に電子データを貼り付ける場合に比べて、視認性や物体位置認識効果を高めることができる。これらの研究は、拡張現実(AR:Augmented Reality)・複合現実(MR:Mixed Reality)と呼ばれ、多くの実施例がある。
【0005】
しかし、3次元空間に関する知識を有していない一般利用者が、3次元的な空間や位置関係を考慮して実写映像のどの場所や角度に電子データを表示させるかを決めることは容易ではない。これは、2次元配置の場合には、映像内の縦位置と横位置の2自由度の設定で済むのに対し、3次元配置の場合には、縦位置と横位置の他に奥行き位置とさらに回転(ピッチ、ヨー、ロール)の6自由度の設定をする必要があることも要因の一つである。
【0006】
例えば、特許文献1には、送信者側の映像を受信者側に転送し、仮想空間内で送信者と受信者のアバターと呼ばれる人物映像を合成しリアルタイムに表示することで、コミュニケーションや協調作業を行うための装置について開示されている。送信者の映像は、送信者と受信者の位置関係から、複数の角度に設置された撮影装置の中から適切な位置の映像が選択されて伝送されるような構成になっている。しかし、利用者は空間の位置関係を考慮してアバターを適切に配置する必要がある。
【0007】
また、特許文献2では、撮影対象の3次元的な形状や位置関係等の3次元特徴に合わせて、広告画像や所望の画像を合成するための装置について開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2004−178036号公報
【特許文献2】特開2004−145448号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
上記2つの特許文献では、電子データやアバターを配置する位置をどのように決めるかについては明確に言及されていない。一般的には、利用者によって適切な位置に電子データ等を配置させるか、あるいは利用者の3次元位置をセンシングする装置を利用する方法が考えられる。しかしながら、遠隔地コミュニケーションを想定したテレビ会議システムなどの汎用的な装置では、利用者が3次元空間や3次元の概念に精通していることを利用条件にするような使い方は現実的ではない。
【0010】
また、3次元位置をセンシングする装置については、様々なセンシング技術が存在するが、3次元位置情報を直接用いて電子データを重畳すると、取得した3次元位置の精度によって重畳位置が安定しないなどの問題がある。仮に精度良く3次元位置を取得できたとしても、利用途中で逐次電子データの提示位置が変わることは、視認性の問題もあり作業効率を阻害しかねない。
【0011】
従って本発明では、遠隔地で実写された撮像画像に電子データを合成して表示する画像提示システムにおいて、利用者に取って煩わしい電子データの合成位置を考慮することなく、相手の映像内に適切に合成表示された電子データを見ながら遠隔地間で実作業に適したコミュニケーションを行うことを可能とする画像提示システム、プログラム及び記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0012】
上記課題を解決するために、本発明の第1の技術手段は、撮影装置によって取得された撮影画像を入力し、該入力した撮影画像に、画像として生成された電子データを加工して合成し、該合成した画像を送受信することにより、遠隔地間でコミュニケーションを行なうことを可能とした画像提示システムであって、該画像提示システムの利用形態を予め定められた利用形態の中から決定する利用形態決定部と、前記利用形態決定部で決定可能な利用形態に応じて、前記電子データの合成に必要とする加工を行うための加工情報を保持する加工情報保持部と、前記利用形態決定部により決定された利用形態に基づいて、前記加工情報保持部から前記加工情報を取得し、前記撮影画像に合成すべき電子データを加工する電子データ加工部と、前記電子データ加工部で加工された電子データと、前記撮影画像とを合成する合成部とを有し、該合成部で合成された映像を送信することを特徴としたものである。
【0013】
第2の技術手段は、第1の技術手段において、利用者による操作入力を受け付ける操作装置を有し、前記利用形態決定部は、前記操作装置に対する利用者の入力操作に従って、前記画像提示システムの利用形態を決定することを特徴としたものである。
【0014】
第3の技術手段は、第1の技術手段において、利用者の3次元上の位置を計測する3次元位置計測装置を有し、前記利用形態決定部は、前記3次元位置計測装置で計測された利用者の位置情報に従って、前記画像提示システムの利用形態を決定することを特徴としたものである。
【0015】
第4の技術手段は、第1〜第3のいずれか1の技術手段において、前記画像提示システムの利用形態は、遠隔地間で利用者同士がコミュニケーションを行う状況を想定した作業を類型化して予め定めた利用形態であることを特徴としたものである。
【0016】
第5の技術手段は、第1〜第4の技術手段において、前記加工情報保持部は、前記利用形態と、前記電子データを加工するために必要な情報とを対応付けた変換テーブルであることを特徴としたものである。
【0017】
第6の技術手段は、第1〜第5の技術手段において、前記電子データを加工するために必要な情報は、前記撮像装置が撮像した三次元空間内における電子データの配置状態を指定する情報であって、前記配置状態を指定する情報を用いて電子データを加工することにより、前記撮像画像内に前記電子データが指定された状態で配置された合成画像が得られることを特徴としたものである。
【0018】
第7の技術手段は、コンピュータに、第1〜第6のいずれか1の技術手段の機能を実現させるためのプログラムである。
【0019】
第8の技術手段は、第7の技術手段のプログラムをコンピュータ読み取り可能に記録した記録媒体である。
【発明の効果】
【0020】
本発明によれば、遠隔地で実写された撮像画像に電子データを合成して表示する画像提示システムにおいて、利用者に取って煩わしい電子データの合成位置を考慮することなく、相手の映像内に適切に合成表示された電子データを見ながら遠隔地間で実作業に適したコミュニケーションを行うことを可能とする画像提示システム、プログラム及び記録媒体を提供することができる。
【0021】
本発明では、3次元空間や概念に慣れていない一般利用者であっても簡単に所望の位置に電子データを合成して表示させたり、あるいは、3次元的な位置関係をセンシングする装置を利用した場合においても、逐次重畳位置を変えるのではなく、位置を安定させて電子データを表示させることが可能となる。
【図面の簡単な説明】
【0022】
【図1】本発明の映像提示システムの第1の実施形態を模式的に示す図である。
【図2】本発明の映像提示システムの第1の実施形態における映像・音声処理機能を示すブロック図である。
【図3】図2の映像処理機能を更に詳しく説明するためのブロック図である。
【図4】電子データを加工するときの加工情報に関連付ける具体的な利用形態の例を説明するための図である。
【図5】利用形態に対応する利用者選択信号から電子データの加工情報を抽出するためのテーブルの一例を示す図である。
【図6】画像提示システムのディスプレイに表示する画像における電子データの配置位置を説明するための図である。
【図7】電子データを空間内に正しく配置するために使用する座標軸の定義を説明するための図である。
【図8】表示装置の上部に撮影装置を設置した場合の座標系の変換方法を説明するための図である。
【図9】本発明に係る映像提示システムの第2の実施形態を模式的に示す図である
【図10】本発明の映像提示システムの第2の実施形態における映像・音声処理機能を示すブロック図である。
【図11】利用者の相対的な位置関係を算出するために用いる基準座標系について説明するための図である。
【図12】双方の利用者の位置とディスプレイとの位置関係から利用形態を推定する例を説明するための図である。
【図13】利用形態の推定方法の一例を説明するためのフローチャートである。
【発明を実施するための形態】
【0023】
(第1の実施形態)
<システム構成>
本発明の第1の実施形態を図1〜図8に基づいて説明する。図1は映像と音声を双方向通信できる本発明に係る映像提示システムの第1の実施形態を模式的に示す図である。広域のネットワーク6より先の遠隔地にも同じ映像提示システムが設置されており、遠隔の映像提示システム間で、映像と音声を使ったコミュニケーションをリアルタイムに行うことができる。
【0024】
図1について詳しく説明する。本発明に係る映像提示システムの実施形態は、計算機4で実行され、計算機4の有する機能により映像・音声処理が行われる。計算機4は、例えばPCなどの情報処理装置を適用することができる。
計算機4には、遠隔地の利用者の映像7、及び遠隔地の相手と一緒に作業を行っている電子データ8を表示する液晶ディスプレイなどの表示装置1と、遠隔地の音声を再生する音声再生装置3とが接続される。計算機4は、遠隔地から伝送された映像と音声の情報を受け取り、表示装置1と音声再生装置3に映像や音声を提示するためのものである。
【0025】
表示装置1の上部には、利用者の映像と音声を一度に取得するマルチメディア情報取得装置2が設置されている。映像や音声を取得するためのマルチメディア情報取得装置2は必ずしも一体化している必要はなく、映像の取得と音声の取得を分離した装置で実現する構成も可能である。例えば、マルチメディア情報取得装置2をマイク及び撮影装置(カメラ)によって構成し、音声を取得するためのマイクを利用者の近くに置き、撮影カメラのみを表示装置1の上部に設置した構成としてもよい。
【0026】
マルチメディア情報取得装置2は、上記遠隔地からの映像と音声を提示するための計算機4に接続されている。計算機4は、上記受信側の処理とは別に、遠隔地に映像や音声を伝送するための送信制御も行っている。
また、計算機4には、キーボードなどの操作装置5が接続されており、利用者が本発明の特徴である作業形態等の情報を入力し、システムを制御することが可能である。計算機4は、ネットワーク6を介して、遠隔地の同一の画像提示システムと繋がっており、映像や音声の送受信を行うことができる。利用者9はこの画像提示システムを利用することで、遠隔地に設置された同システムの利用者とリアルタイムに電子データ8を見ながらコミュニケーションを行うことができる。
【0027】
<各処理内容について説明>
(システムブロック図の基本処理の説明)
計算機4の内部で行われる基本の処理について、図2のブロック図を用いて説明する。図2において、広域のネットワーク6より左側が上記利用者9の側を示し、右側が遠隔地の側を示している。
利用者9側の画像提示システムにおける送信機能についてはじめに説明する。カメラやマイクで構成されるマルチメディア情報取得装置2で取得された映像と音声の信号は、映像・音声処理装置41の内部にある送信装置16に取り込まれる。映像・音声処理装置41は、図1の計算機4と等価な装置である。ここでは、映像信号は送信装置16内の映像処理装置(送信側)21に入力され、音声信号は音声処理装置(送信側)22に入力され、遠隔地に送信するための信号処理が施された後に、外部に出力され、広域のネットワーク6を経由して遠隔地に伝送される。
【0028】
続いて、画像提示システムの受信機能について説明する。広域のネットワーク6を経由して遠隔地から送られてきた映像と音声の信号が、映像・音声処理装置41の内部の受信装置15に取り込まれる。映像信号は受信装置15内の映像処理装置(受信側)19に入力され、音声信号は音声処理装置(受信側)20に入力される。そしてこれら映像信号及び音声信号は、映像や音声を再現できる形に信号処理され、ディスプレイ(表示装置)やスピーカで構成されるマルチメディア情報提示装置10に出力される。
【0029】
遠隔地の処理についても同様で、映像・音声処理装置11は利用者側の映像・音声処理装置41に、受信装置17は利用者側の受信装置15に、送信装置18は利用者側の送信装置16に、マルチメディア情報提示装置12は利用者側のマルチメディア情報提示装置10に、マルチメディア情報取得装置13は利用者側のマルチメディア情報取得装置2に、それぞれ対応している。
【0030】
(映像・音声処理装置41の詳細説明)
映像・音声処理装置41について図3のブロック図を用いて具体的に説明する。但し、音声処理については、支障がない限り説明を省略する。以下、上記利用者9が使用する画像提示システムにおいて、撮影された利用者の撮像画像に作業で扱う電子データを合成(重畳)した映像を遠隔地に伝送する流れと、遠隔地から送られてきた映像を受信して表示するまでの流れについて説明する。もう一方の遠隔地側の流れについては、利用者9のシステムと同じであるため説明は省略する。
【0031】
撮影装置2aは、マルチメディア情報取得装置2に含まれる装置であり、本画像提示システムを使う利用者9の映像を撮影する。この撮影装置2aは、WebカメラやHD(High-Definition)解像度の撮影カメラなどの汎用の撮像デバイスを利用することが可能で、レンズ、露光調整機構、CCD(Charge Coupled Device)など基本的な撮像デバイス構成要素を有している。撮影装置2aは、外部入力端子(I/F)25によって映像・音声処理装置41に接続されている。撮影装置2aでは、撮影対象を含む視野からの光はレンズ・露光調整機構を通してCCD上に結像される。CCDは入力された受光量に応じた信号を生成し出力する。
【0032】
CCDで生成された信号は、カメラ用の所定の信号処理が施された後に画像信号(映像信号)として映像処理装置(送信側)21の内部に取り込まれ、一旦画像メモリ26に蓄積される。動画像を扱うため、撮影装置2aは一定間隔で映像を取得し、逐次映像信号を映像処理装置(送信側)21に供給する。画像メモリ26には、映像処理装置(送信側)21に入力された映像信号を順次上書き処理することにより、最新の映像データが蓄積されている。画像重畳部27は、画像メモリ26に蓄積された映像データをリアルタイムに読み出す必要があるため、画像メモリ26はDRAM(Dynamic Random Access Memory)等の高速にアクセス可能なメモリを用いて実現する。
【0033】
画像重畳部27は、画像メモリ26と電子データ加工部28とCPU29にそれぞれ接続しており、CPU29からの指示によって、撮影装置2aにより実写された撮像画像に電子データを合成するか、あるいは合成処理を行なわずに撮像画像をそのまま出力するかを切り替えることができる。
CPU29から撮影画像に電子データを合成処理するように指示された場合、画像重畳部27は、画像メモリ26から入力される撮像画像に、電子データ加工部28から入力される電子データを合成処理し、送信制御部32に結果を出力する。一方、CPU29によって、合成処理を行なわないように指示された場合には、画像メモリ26から入力される撮像画像をそのまま送信制御部32に出力する。
【0034】
電子データ加工部28は、画像重畳部27において撮像画像に適切に合成できるように、電子データの合成位置と表示角度を加工した画像データを生成し出力する。加工する前の電子データは、電子映像生成部30に接続された外部記憶装置34、あるいは映像・音声処理装置41内に格納され、必要な電子データが選択され取り出される。
【0035】
電子データ加工部28は、電子映像生成部30によって画像として生成された電子データを加工する。その際に、CPU29によって指示される利用形態を示す情報に基づいてLUT31に格納された電子データを加工するための加工情報が抽出されて、電子データ加工部28に入力される。電子データ加工部28は、LUT31から抽出された加工情報に応じて電子データを適切に加工する。
【0036】
上記の利用形態は、本画像提示システムを利用可能な形態を予め定めたもので、CPU29は操作装置5に対する操作入力に従って、利用形態を決定する。従って本実施形態のCPU29は、本発明の利用形態決定部に該当するものである。また、LUT31は、本画像提示システムで使用可能な利用形態と、電子データを加工するための加工情報とを対応付けた変換テーブルとして構成され、本発明の加工情報保持部に該当するものである。
【0037】
また、上記の電子データを加工するために必要な情報は、撮像装置が撮像した三次元空間内における電子データの配置状態を指定する情報であって、この配置状態を指定する情報を用いて電子データを加工することにより、撮像画像内に電子データが指定された状態で配置された合成画像が得られるようにしたものである。
【0038】
画像重畳部27で撮像画像と電子データが合成され、生成された映像信号は送信制御部32に入力され、通信に適した形に加工されて外部出力端子(I/F)33を通して、外部に送信される。画像重畳部27は、加工された電子データと撮影画像とを合成する本発明の合成部に該当する。
【0039】
一方遠隔地から送られてきた映像信号は、映像処理装置(受信側)19の外部出力端子35を通して映像処理装置(受信側)19に入力される。入力された映像信号は受信制御部36においてデータ解析が行なわれ、システムが扱うことができる信号に変換される。受信制御部36によって変換された信号は、一旦表示メモリ37に蓄積されて、外部出力端子38に接続された外部表示装置1に映像信号を送り、映像を表示する。
【0040】
(LUT31について)
LUT31から電子データを加工するための加工情報が出力されるまでの処理について順に説明する。始めに、操作装置5の入力操作によって指定された利用形態を示す情報を、CPU29がLUT31を制御するための信号に変換する。利用形態は、遠隔地間で利用者同士がコミュニケーションを行う状況を想定した作業を類型化して予め定めたものである。このような利用形態としてはその内容によって様々な形態が存在するが、ここでは実際の場面でよく行われていて、比較的重要な利用形態を用いる。図4を用いて、3つの具体的な利用形態について説明する。
【0041】
図4(A)は、二人の作業者91,92がディスプレイ100に表示された電子情報を見ていて、時々作業者同士が会話をするような状況で、具体的にはペアプログラミングで良く行われる利用形態を示している。図4(B)は、2人の作業者91,92が対面の位置関係にあり、作業者の間に計算機101を置き、そこに電子データを表示させ、お互いが見ている状況で、具体的にはモックアップ確認の際によく行われる利用形態を示している。図4(C)は、一方の作業者92の後方のスクリーン102にプロジェクタなどにより電子データが表示され、もう一方の作業者91に説明を行うような場面で、具体的にはプレゼンテーションの際に良く行われる利用形態を示している。利用形態については、ここで説明した3つ以外にも扱うことは可能である。
【0042】
利用者がこの3つの利用形態の中から一つを選択すると、その選択された情報がCPU29に入力される。操作装置5では、利用形態を簡単に選択できるように、図示していない操作パネル上に、図4のような画像を表示させ利用者に選択させるようなユーザインタフェースを備えることも可能である。利用者が利用形態を選択すると、CPU29は、利用者による操作信号を選択された利用形態に対応する識別コードに変換する。
【0043】
例えば、3種類の利用形態を識別するために、2bitの利用者選択信号Sinを割り当てると、図4(A)〜図4(C)の利用形態は順番に、Sin=00,01,10とすることができる。ここでSin=11は対応する利用形態が存在しないため、不定信号(未割当信号)である。
LUT31では、CPU29から入力される利用者選択信号Sinから、適切に電子データを加工するための加工情報を、変換テーブルを用いて抽出し、電子データ加工部28に出力する。電子情報加工のための加工情報は、例えば、電子データを合成するために必要な3次元位置と角度の情報である。
【0044】
図5に変換テーブルの例を示す。変換テーブルにおいて、第1列は利用者が選択する利用形態、第2列は利用者選択信号Sin、第3列は位置情報、第4列は角度情報を示している。LUT31は、このテーブルの利用者選択信号Sinに基づいて位置情報と角度情報を加工情報として抽出し、これら抽出した加工情報を電子データ加工部28に出力する。
【0045】
図6は、画像提示システムのディスプレイに表示する映像における電子データの配置位置を説明するための図で、LUT31のテーブルに設定される電子データの位置関係を示すものである。ここでは、図1のシステムの表示装置(ディスプレイ)1のディスプレイ面fに対する電子データの配置位置を仮想的に示している。ディスプレイ面fの水平方向をX軸、垂直方向をY軸、奥行き方向をZ軸とし、ディスプレイ面fの中心を原点とする位置情報と、ディスプレイ面fに対する角度情報を電子データdの中心に設定することによって、電子データdの配置位置を決定する。
【0046】
図6(A)は、ペアプログラミングの利用形態を示していて、ディスプレイ中心からX軸の負の方向に1m、奥行き方向に1mの位置に電子データdを表示させる。また、電子データdの角度についてもディスプレイ面fに対して45度傾けることで利用者が見やすくなるようにしている。図6(B)はモックアップ確認の利用形態を示しており、ディスプレイ中心に電子データdを配置している。図6(C)はプレゼンテーションの利用形態を示しており、ディスプレイ中心からX軸の負の方向に0.5m、奥行き方向に2mの位置に角度を変えずに電子データdを表示させる。
【0047】
(ワールド座標系)
電子データdに与えられる位置情報と角度情報とからその電子データdを空間内に正しく配置するために、図7を用いて座標軸の定義を行う。座標軸の原点oを利用者のディスプレイの中心とし、ディスプレイ面fに向かって右手方向がX軸の正の向き、上側がY軸の正の向き、ディスプレイ面fの奥の方向がZ軸の正の向きとする。以下、原点oを中心としたこの座標系をワールド座標系と呼び、基準の座標系とする。
【0048】
ワールド座標系のX軸、Y軸、Z軸をそれぞれXw、Yw、Zwとし、この座標軸上に電子データを配置する必要がある。電子データの配置は、上記LUT31より出力される加工情報に基づいて決定される。いま、LUT31より設置角度(ピッチ,ヨー,ロール)=(θpitch,θyaw,θroll)、座標位置(Xw,Yw,Zw)=(XI,YI,ZI)の6軸の値が設定されると、ワールド座標系の適切な位置に電子データを一意に配置することができる。設置角度のピッチはX軸回りの垂直角、ヨーはY軸回りの水平角、ロールはZ軸回りの回転角を、それぞれ示す。
【0049】
(撮影装置の座標変換)
一方、利用者らを撮影する撮影装置(カメラ)2aは撮影装置固有の座標系を有しているため、そのままでは上記ワールド座標系に配置された電子データと実写した撮影画像とを合成することはできない。そのため、撮影装置固有のカメラ座標系を、ワールド座標系に変換する必要がある。ワールド座標系への変換方法については図8を用いて説明する。
【0050】
座標系変換は、撮影装置2aの設置角度とディスプレイ中心oからの併進量を用いて表すことが可能である。始めに一般的なローカル座標系をもつ撮影装置について、上記ワールド座標系に変換する方法について説明を行い、その後具体的に図8に示すような場所に設置された撮影装置のローカル座標系からワールド座標系への変換方法について示す。
【0051】
座標系の変換は、X軸周りの回転θx、Y軸周りの回転θy、Z軸周りの回転θzとX軸方向の併進lx、Y軸方向の併進ly、Z軸方向の併進lzの組み合わせで行われる。
具体的に、X軸周りの回転θx、Y軸周りの回転θy、Z軸周りの回転θzを示す変換行列は、それぞれ以下のようになる。
【0052】
【数1】
【0053】
また、X軸方向の併進、Y軸方向の併進、Z軸方向の併進は以下の変換行列で表すことができる。
【0054】
【数2】
【0055】
上記変換行列を用いると座標系を変換することが可能で、ローカル座標系を有する撮影装置で撮影する空間の3次元位置(Xc,Yc,Zc)は、式(3)によってワールド座標系上の点(Xw,Yw,Zw)に変換することができる。
【0056】
(Xw,Yw,Zw,1)=(Xc,Yc,Zc,1)・rotX(θx)・rotY(θy)・rotZX(θz)・shiftXYZ(lx,ly,lz)・・・(3)
【0057】
続いて、図8のように表示装置1の上部に撮影装置2aを設置した場合の座標系変換方法について説明する。図8(A)は、撮影装置と表示装置の関係を斜視図によって説明する図、図8(B)はその上面図、図8(C)はその側面図である。
表示装置1の枠を含めた高さをν、幅をhとすると、撮影装置2aはディスプレイ中心oからν/2上側に設置されている。また、ディスプレイ中心oから手前方向に向かったZw軸のマイナス方向の軸を便宜上−Zw軸と呼ぶと、撮影装置2aの光学系の光軸は、−Zw軸に平行な軸40に対して下向きにθx傾いている。ワールド座標系と撮影装置固有のローカル座標系がこのような関係にあるとすると、ローカル座標系上の点(Xc,Yc,Zc)からワールド座標系上の点(Xw,Yw,Zw)への変換は式(式4)によって実現できる。
【0058】
(Xw,Yw,Zw,1)
=(Xc,Yc,Zc,1)・rot(180−θx)・shiftXYZ(0,ly,0)
・・・(4)
【0059】
ところが、撮影装置2aで実写された撮像画像は、撮影装置2aの撮像面に投影された2次元情報しかなく、(式4)を用いてワールド座標系に変換するために必要な3次元座標情報を得ることができない。従って、上記座標系の変換式(4)では、投影された画像をワールド座標系に変換して配置することができない。
そこで本発明に係る実施形態では、上記撮影装置で撮影されたローカル座標系を新たに基準座標系と定義し直し、ワールド座標系から基準座標系に変換しなおす。変換は、上記式(4)とは反対の変換を行えばよく、以下のように行うことができる。
【0060】
(Xc,Yc,Zc,1)
=(Xw,Yw,Zw,1)・rotX(−180+θx)・shiftXYZ(0,−ly,0)
・・・(5)
【0061】
以上、ローカル座標系を有する撮影装置で実写された撮影画像は座標系の変換ができないため、3次元情報をもつ電子データを基準座標系に変換し、撮影画像と合成を行う例を示した。他の例として、任意の視点映像を合成する技術を用いれば、撮影画像の方をワールド変換座標系に変換して、電子データを合成して提示することも可能である。
任意の視点を合成して生成する技術の詳細については説明を行わないが、例えば公知技術解説文献「自由視点映像技術」映像メディア学会誌Vol.60,No.1(2006)に記載のように、複数の撮影装置で撮影された映像から光線空間を構築し、仮想的な視点の映像を生成する技術を応用することも可能である。
【0062】
以上、撮影装置で実写された撮影画像と作業に用いる電子情報の座標系を基準座標系に統一することができると、この空間内から映像を作り出すことができる仮想的なカメラを設置し、ディスプレイに表示するための映像を作成することができるようになる。
【0063】
(3次元位置に基づいたレンダリング方法)
一般的な3DCGレンダリング技術では、画像供給源より供給される3次元位置を持った複数の平面画像を仮想的な3次元空間内に配置することでシーンが形成され、上記算出された基準座標系において想定する利用者位置から見た映像を生成することができる。この利用者位置に設置された仮想的なカメラよって3次元空間に再現されたシーンが撮影され、その後表示装置に表示するためのビュー変換処理によって想定する観察者位置から見た画像を切り出して提示することができる。
【0064】
ビュー変換処理は、基準座標系から観察者位置に置かれた仮想撮像装置を基準とする座標に変換することである。仮想撮像装置のX軸を示すベクトルをR=(rx,ux,νx)、仮想撮像装置のY軸を示すベクトルをU=(ry,uy,νy)、仮想撮像装置のZ軸を示すベクトルをV=(rz,uz,νz)、仮想撮像装置の位置を示すベクトルをP=(x,y,z)としたときに、ビュー変換行列は式6のようになる。
【0065】
【数3】
【0066】
続いて、ビュー変換されたシーンに対して遠くのものが小さく、近くのものが大きく見えるように透視投影処理が実施される。透視投影処理では、撮像装置に近いところ(前方投影面)と、遠いところ(後方投影面)に対して2つの投影面が導入され、撮像装置原点を中心とした錘状になるように設定される。プロジェクション変換によって、近いところの面と遠いところの面の間の空間が立方体になるように変換することによって、近いところが大きく、遠いところが小さく見えるような変換がなされる。このプロジェクション変換によって、射影座標系に変換される。水平方向の視野角をw、垂直方向の視野角をhとし、仮想撮像装置の位置から前方投影面までの距離をzn、後方投影面までの距離をzfとすると、以下の行列によって射影座標系に変換することができる。
【0067】
【数4】
【0068】
さらに、表示装置に表示するために、射影座標系からスクリーン座標系への変換が行なわれる。スクリーン座標系では、表示装置の左上を原点に、またY軸の向きが逆になるような変換が行なわれる。表示装置の水平方向の画素数をWidth、垂直方向の画素数をHeightとすると変換行列は以下のようになる。
【0069】
【数5】
【0070】
以上3DCGレンダリング技術により利用者の位置から見た画像が生成される。このように生成された映像を遠隔地に伝送して、相手側の画像提示システムに接続された表示装置に表示することで、撮像画像と共に適切な位置に電子作業オブジェクトなどの電子データを合成した映像を使ってコミュニケーションすることができる。
【0071】
遠隔地間で実作業を行うために相手側の実写された撮像映像に電子データを合成表示する際に、一般利用者にとって理解しにくい3次元的な位置関係を考慮することなく、解釈しやすい作業形態を選択させるだけで、適切な位置と角度に電子データを合成表示することが可能になる。
利用者は、表示装置1に提示される遠隔地の撮像画像と選択された利用形態に合わせた位置と角度に調整された電子データを見ると、その利用形態に合うように適切な位置に移動しコミュニケーションを行うことができる。これは、通常のフェイスツーフェイスの作業でも、特に意識することなく行われており、適切な位置関係で作業することが作業効率を高められることを潜在的・経験的に認知しているためである。利用者自信が備えているこの能力を活用することで、本発明の画像提示システムを補完することができる。
【0072】
(実施形態2)
本発明の第2の実施の形態を図9〜図13に基づいて説明する。上記第1の実施例では、利用者が操作装置5を用いて作業形態を入力する必要がある。本実施例では、利用者の位置を検出する3次元位置計測装置を導入することで、お互いの利用者の位置関係から適切な利用形態を計算機で推定し、その推定結果に基づいて電子情報を適切に合成表示することができる。
【0073】
図9は映像と音声を双方向通信できる本発明に係る映像提示システムの第2の実施形態を模式的に示す図である。図9において、第1の実施形態を説明する図と同一の要素には同じ符号を付し、その繰り返しの説明を省略する。
本実施形態では、利用者の3次元位置をリアルタイムに計測する3次元位置計測装置が追加されていることが、第1の実施形態と異なる点である。具体的には、3次元位置計測装置として、利用者9の頭に装着される磁場を計測するセンサ52と、磁場を発生させる磁場発生器51とが追加されている。センサ52と磁場発生器53はそれぞれ、計算機4に接続されており、リアルタイムに利用者の3次元位置を測定することができる。
【0074】
利用者の3次元位置を計測する3次元位置計測装置として磁気方式の例を示したが、他にも超音波を使った3次元位置計測装置や光学式の3次元位置計測装置を用いることも可能である。計算機4については、3次元位置計測装置による利用者の3次元位置から利用形態を推定する処理が加わる点が実施形態1と異なる。
また、計算機4で行われるシステムの基本処理である図2とその説明については第1の実施形態と同一である。
【0075】
図10は、第2の実施形態における映像・音声処理装置41のブロックを説明する図である。映像・音声処理装置41は、第1の実施形態と同様に計算機4と等価の装置である。本実施形態の映像・音声処理装置41は、利用者9の3次元位置を計測するための3次元位置計測装置53が接続されていることと、3次元位置計測装置53によって計測された3次元位置から利用形態を推定する形態推定部54とが追加されている点が第1実施形態と異なっている。その他の構成は図3に示す第1の実施形態の構成と同じである。
本実施形態では、形態推定部54は、3次元位置計測装置53による利用者の位置計測情報に従って利用形態を推定し、電子データの加工情報の抽出に使用する利用形態を決定する。従って本実施形態では、形態推定部54が本発明の利用形態決定部に該当する。
【0076】
(自動で作業形態を推定)
利用形態の推定方法について、図13のフローチャートを用いて説明する。S1において、3次元位置計測装置53を用いて利用者の3次元位置を計測する。S2では、S1で計測された利用者の位置より、お互いの利用者の相対的な位置関係を算出する。相対的な位置関係の算出は、上記第1の実施形態と同様に基準座標系に基づいて行う。但し、双方それぞれに基準座標系が存在するため、擬似的に図11に示すようにお互いの空間が接続しているものとして、片方の座標系をベースに考える。
【0077】
図11に示すように、地点Aの座標系を基準とし、地点Bの座標系を次のように変換すると共通化することができる。いま、地点Bの座標位置(XB,YB,ZB)とすると地点Aの座標系における座標(XA,YA,ZA)は、以下のようになる。
(XA,YA,ZA)=(−XB,YB,−ZB) ・・・(9)
【0078】
続いて、双方の利用者の位置とディスプレイとの位置関係から以下の条件により利用形態を推定する一例を示す。双方の利用者の位置を直線で結び、ディスプレイを含む面と交わる位置と利用者間の距離を用いて分類する。具体的には、図12(A)、図12(B)、図12(C)の3つの利用形態に分類する。
【0079】
図12(A)の条件は、双方(利用者9と遠隔地の利用者55)を結ぶ直線とディスプレイ面fが交わる交点56がディスプレイ中央より離れているか判定を行う。この条件を例えば条件Aとし、利用者の相対位置関係の算出結果から条件Aを満足するか否かを判定する(S3)。条件Aを満たす場合は、利用形態としてペアプログラミングを選択する(S5)。例えば、交点56とディスプレイ中央までの距離57が、表示装置の横サイズの25%以上離れている場合(距離57≧表示装置の横サイズh×0.25)に、S5のペアプロミングを選択する判-定を行うものとする。
【0080】
最初の条件Aを満足しない場合、双方が表示装置の正面の近くにいる可能性が高いため、利用形態としてモックアップ確認かプレゼンテーションのいずれかを選択する。ここでは利用者の位置からディスプレイ面までの距離を算出し、お互いのディスプレイまでの距離が同じぐらい離れているか判定を行う。この条件を例えば条件Bとし、条件Aを満足しない場合に、条件Bを満足するか否かを判定する(S4)。
【0081】
条件Bを満たす場合には利用形態としてモックアップ確認を選択し(S6)、条件Bを満足しない場合には利用形態としてプレゼンテーションを選択する(S7)。具体的には、地点Aの利用者9からディスプレイ面fまでの距離58と地点Bの利用者55からディスプレイ面fまでの距離を59とすると、距離58と距離59との差の絶対値が例えば0.5m以下の場合にS6でモックアップ確認を選択するものとする。
【0082】
以上、双方の利用者の位置と表示装置の位置関係により、利用形態を推定することができる。利用形態の推定ができると、上記第一の実施形態と同様に、LUT31の加工情報により、電子作業オブジェクト等の電子データを合成する位置が確定され、撮像画像に電子データを合成することが可能となる。
このように利用者の位置関係から利用形態を求め、その利用形態によって電子データの合成位置を制御することの利点は、利用者の直接の位置関係から電子データの合成位置を制御する場合に比べて、電子データの合成位置をより安定させることが可能になる。後者の方法では、利用者が動く度に電子データの合成位置が変わってしまい、視認性を低下させる問題がある。
【0083】
(第3の実施形態)
本発明は、上記第1または第2の実施形態の画像提示システムの機能を実現するプログラムとして実施することができる。また、このプログラムをコンピュータ読み取り可能に記録した記録媒体として実施することができる。
本実施形態のプログロムは、利用者に取って解釈しやすい利用形態から適切な角度と位置になるように電子データを実写された撮像画像に合成し、提示することで、遠隔地間の実作業に適したコミュニケーションを実現するための映像を生成する方法をソフトウエア処理として実行することができる。この結果、一般利用者にとって理解しにくい3次元的な位置関係を考慮することなく、解釈しやすい利用形態を利用者に選択させるだけで、適切な位置と角度に電子データを合成表示することが可能になる。
【0084】
本実施形態のプログラムを記録する記録媒体としては、マイクロコンピュータで処理が行われるために図示しないメモリ、例えばROMのようなプログラムメディアであってもよく、図示しない外部記憶装置としてのプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であってもよいし、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であってもよい。
【0085】
この場合、ダウンロード用のプログラムは予めコンピュータ等の情報処理装置本体に格納されているものとする。ここで、上記プログラムメディアは、情報処理装置本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フロッピーディスク(登録商標)やハードディスク等の磁気ディスク並びにCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
【0086】
また、この場合、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め情報処理装置本体に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。上記記録媒体は、デジタルカラー画像形成装置やコンピュータシステムに備えられるプログラム読み取り装置により読み取られることで上述した画像提示処理が実行される。
【0087】
なお、上記コンピュータシステムは、WEBカメラなどの汎用画像入力装置、所定のプログラムがロードされることにより上記画像提示処理など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するディスプレイ・液晶ディスプレイなどの表示装置より構成される。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられる。
【符号の説明】
【0088】
1…表示装置、2…マルチメディア情報取得装置、2a…撮影装置、3…音声再生装置、4…計算機、5…操作装置、7…映像、8…電子データ、9…利用者、10…マルチメディア情報提示装置、11…映像・音声処理装置、12…マルチメディア情報提示装置、13…マルチメディア情報取得装置、15…受信装置、16…送信装置、17…受信装置、18…送信装置、26…画像メモリ、27…画像重畳部、28…電子データ加工部、29…CPU、30…電子映像生成部、31…LUT、32…送信制御部、34…外部記憶装置、35…外部出力端子、36…受信制御部、37…表示メモリ、38…外部出力端子、40…軸、41…映像・音声処理装置、51…磁場発生器、52…センサ、53…次元位置計測装置、53…磁場発生器、54…形態推定部、55…利用者、56…交点、91,92…作業者、100…ディスプレイ、101…計算機、102…スクリーン。
【技術分野】
【0001】
本発明は、映像提示システム、プログラム及び記録媒体に関し、より具体的には、撮影画像に対してリアルタイムに電子データを合成表示することで、遠隔地との間のシステム間でコミュニケーションをとって共同作業を行うことができるようにした映像提示システム、及び該システムの機能を実現するプログラム及び記録媒体に関する。
【背景技術】
【0002】
複数の作業者によるフェイスツーフェイスの共同作業には様々な形態がある。例えば、フェイスツーフェイスの共同作業として、実在の物を使った作業(モックアップを用いたプロダクトデザイン確認、作業リーダによる製造装置の使用方法に関するレクチャー等)や、作業者がお互いに横に座りながら、あるいは側に立ち、共通の画面を見ながら計算機を使った作業(ペアプログラミング、作業画面を使った状況報告等)等があり、これらの作業が頻繁に行われている。これらの作業は、コミュニケーションを伴う共同作業の中でも頻度が高く・重要な作業形態である。
【0003】
ここで示した作業はすべて、実在のものであれ、計算機によって作り出された電子データであれ、何らかの介在物を上手く使うことで人と人のコミュニケーションが成立している。一般的に、作業は効率を高めることが求められ、また複雑高度化したタスクは、何らかの補助情報を用いなければ解決することが困難である。従って、作業の中で会話によるコミュニケーションと共に何らかの作業オブジェクトを用いることが必須事項である。
【0004】
遠隔地との間で作業オブジェクトを介在させた作業を実現するために、撮影された実写映像に、計算機で利用することができる電子データを合成表示することで、上記実際の作業に近いコミュニケーションを遠隔地間で提供することができる。さらに撮影された実写映像の3次元的な空間や位置関係を考慮して電子データを合成できると、2次元平面に単純に電子データを貼り付ける場合に比べて、視認性や物体位置認識効果を高めることができる。これらの研究は、拡張現実(AR:Augmented Reality)・複合現実(MR:Mixed Reality)と呼ばれ、多くの実施例がある。
【0005】
しかし、3次元空間に関する知識を有していない一般利用者が、3次元的な空間や位置関係を考慮して実写映像のどの場所や角度に電子データを表示させるかを決めることは容易ではない。これは、2次元配置の場合には、映像内の縦位置と横位置の2自由度の設定で済むのに対し、3次元配置の場合には、縦位置と横位置の他に奥行き位置とさらに回転(ピッチ、ヨー、ロール)の6自由度の設定をする必要があることも要因の一つである。
【0006】
例えば、特許文献1には、送信者側の映像を受信者側に転送し、仮想空間内で送信者と受信者のアバターと呼ばれる人物映像を合成しリアルタイムに表示することで、コミュニケーションや協調作業を行うための装置について開示されている。送信者の映像は、送信者と受信者の位置関係から、複数の角度に設置された撮影装置の中から適切な位置の映像が選択されて伝送されるような構成になっている。しかし、利用者は空間の位置関係を考慮してアバターを適切に配置する必要がある。
【0007】
また、特許文献2では、撮影対象の3次元的な形状や位置関係等の3次元特徴に合わせて、広告画像や所望の画像を合成するための装置について開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2004−178036号公報
【特許文献2】特開2004−145448号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
上記2つの特許文献では、電子データやアバターを配置する位置をどのように決めるかについては明確に言及されていない。一般的には、利用者によって適切な位置に電子データ等を配置させるか、あるいは利用者の3次元位置をセンシングする装置を利用する方法が考えられる。しかしながら、遠隔地コミュニケーションを想定したテレビ会議システムなどの汎用的な装置では、利用者が3次元空間や3次元の概念に精通していることを利用条件にするような使い方は現実的ではない。
【0010】
また、3次元位置をセンシングする装置については、様々なセンシング技術が存在するが、3次元位置情報を直接用いて電子データを重畳すると、取得した3次元位置の精度によって重畳位置が安定しないなどの問題がある。仮に精度良く3次元位置を取得できたとしても、利用途中で逐次電子データの提示位置が変わることは、視認性の問題もあり作業効率を阻害しかねない。
【0011】
従って本発明では、遠隔地で実写された撮像画像に電子データを合成して表示する画像提示システムにおいて、利用者に取って煩わしい電子データの合成位置を考慮することなく、相手の映像内に適切に合成表示された電子データを見ながら遠隔地間で実作業に適したコミュニケーションを行うことを可能とする画像提示システム、プログラム及び記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0012】
上記課題を解決するために、本発明の第1の技術手段は、撮影装置によって取得された撮影画像を入力し、該入力した撮影画像に、画像として生成された電子データを加工して合成し、該合成した画像を送受信することにより、遠隔地間でコミュニケーションを行なうことを可能とした画像提示システムであって、該画像提示システムの利用形態を予め定められた利用形態の中から決定する利用形態決定部と、前記利用形態決定部で決定可能な利用形態に応じて、前記電子データの合成に必要とする加工を行うための加工情報を保持する加工情報保持部と、前記利用形態決定部により決定された利用形態に基づいて、前記加工情報保持部から前記加工情報を取得し、前記撮影画像に合成すべき電子データを加工する電子データ加工部と、前記電子データ加工部で加工された電子データと、前記撮影画像とを合成する合成部とを有し、該合成部で合成された映像を送信することを特徴としたものである。
【0013】
第2の技術手段は、第1の技術手段において、利用者による操作入力を受け付ける操作装置を有し、前記利用形態決定部は、前記操作装置に対する利用者の入力操作に従って、前記画像提示システムの利用形態を決定することを特徴としたものである。
【0014】
第3の技術手段は、第1の技術手段において、利用者の3次元上の位置を計測する3次元位置計測装置を有し、前記利用形態決定部は、前記3次元位置計測装置で計測された利用者の位置情報に従って、前記画像提示システムの利用形態を決定することを特徴としたものである。
【0015】
第4の技術手段は、第1〜第3のいずれか1の技術手段において、前記画像提示システムの利用形態は、遠隔地間で利用者同士がコミュニケーションを行う状況を想定した作業を類型化して予め定めた利用形態であることを特徴としたものである。
【0016】
第5の技術手段は、第1〜第4の技術手段において、前記加工情報保持部は、前記利用形態と、前記電子データを加工するために必要な情報とを対応付けた変換テーブルであることを特徴としたものである。
【0017】
第6の技術手段は、第1〜第5の技術手段において、前記電子データを加工するために必要な情報は、前記撮像装置が撮像した三次元空間内における電子データの配置状態を指定する情報であって、前記配置状態を指定する情報を用いて電子データを加工することにより、前記撮像画像内に前記電子データが指定された状態で配置された合成画像が得られることを特徴としたものである。
【0018】
第7の技術手段は、コンピュータに、第1〜第6のいずれか1の技術手段の機能を実現させるためのプログラムである。
【0019】
第8の技術手段は、第7の技術手段のプログラムをコンピュータ読み取り可能に記録した記録媒体である。
【発明の効果】
【0020】
本発明によれば、遠隔地で実写された撮像画像に電子データを合成して表示する画像提示システムにおいて、利用者に取って煩わしい電子データの合成位置を考慮することなく、相手の映像内に適切に合成表示された電子データを見ながら遠隔地間で実作業に適したコミュニケーションを行うことを可能とする画像提示システム、プログラム及び記録媒体を提供することができる。
【0021】
本発明では、3次元空間や概念に慣れていない一般利用者であっても簡単に所望の位置に電子データを合成して表示させたり、あるいは、3次元的な位置関係をセンシングする装置を利用した場合においても、逐次重畳位置を変えるのではなく、位置を安定させて電子データを表示させることが可能となる。
【図面の簡単な説明】
【0022】
【図1】本発明の映像提示システムの第1の実施形態を模式的に示す図である。
【図2】本発明の映像提示システムの第1の実施形態における映像・音声処理機能を示すブロック図である。
【図3】図2の映像処理機能を更に詳しく説明するためのブロック図である。
【図4】電子データを加工するときの加工情報に関連付ける具体的な利用形態の例を説明するための図である。
【図5】利用形態に対応する利用者選択信号から電子データの加工情報を抽出するためのテーブルの一例を示す図である。
【図6】画像提示システムのディスプレイに表示する画像における電子データの配置位置を説明するための図である。
【図7】電子データを空間内に正しく配置するために使用する座標軸の定義を説明するための図である。
【図8】表示装置の上部に撮影装置を設置した場合の座標系の変換方法を説明するための図である。
【図9】本発明に係る映像提示システムの第2の実施形態を模式的に示す図である
【図10】本発明の映像提示システムの第2の実施形態における映像・音声処理機能を示すブロック図である。
【図11】利用者の相対的な位置関係を算出するために用いる基準座標系について説明するための図である。
【図12】双方の利用者の位置とディスプレイとの位置関係から利用形態を推定する例を説明するための図である。
【図13】利用形態の推定方法の一例を説明するためのフローチャートである。
【発明を実施するための形態】
【0023】
(第1の実施形態)
<システム構成>
本発明の第1の実施形態を図1〜図8に基づいて説明する。図1は映像と音声を双方向通信できる本発明に係る映像提示システムの第1の実施形態を模式的に示す図である。広域のネットワーク6より先の遠隔地にも同じ映像提示システムが設置されており、遠隔の映像提示システム間で、映像と音声を使ったコミュニケーションをリアルタイムに行うことができる。
【0024】
図1について詳しく説明する。本発明に係る映像提示システムの実施形態は、計算機4で実行され、計算機4の有する機能により映像・音声処理が行われる。計算機4は、例えばPCなどの情報処理装置を適用することができる。
計算機4には、遠隔地の利用者の映像7、及び遠隔地の相手と一緒に作業を行っている電子データ8を表示する液晶ディスプレイなどの表示装置1と、遠隔地の音声を再生する音声再生装置3とが接続される。計算機4は、遠隔地から伝送された映像と音声の情報を受け取り、表示装置1と音声再生装置3に映像や音声を提示するためのものである。
【0025】
表示装置1の上部には、利用者の映像と音声を一度に取得するマルチメディア情報取得装置2が設置されている。映像や音声を取得するためのマルチメディア情報取得装置2は必ずしも一体化している必要はなく、映像の取得と音声の取得を分離した装置で実現する構成も可能である。例えば、マルチメディア情報取得装置2をマイク及び撮影装置(カメラ)によって構成し、音声を取得するためのマイクを利用者の近くに置き、撮影カメラのみを表示装置1の上部に設置した構成としてもよい。
【0026】
マルチメディア情報取得装置2は、上記遠隔地からの映像と音声を提示するための計算機4に接続されている。計算機4は、上記受信側の処理とは別に、遠隔地に映像や音声を伝送するための送信制御も行っている。
また、計算機4には、キーボードなどの操作装置5が接続されており、利用者が本発明の特徴である作業形態等の情報を入力し、システムを制御することが可能である。計算機4は、ネットワーク6を介して、遠隔地の同一の画像提示システムと繋がっており、映像や音声の送受信を行うことができる。利用者9はこの画像提示システムを利用することで、遠隔地に設置された同システムの利用者とリアルタイムに電子データ8を見ながらコミュニケーションを行うことができる。
【0027】
<各処理内容について説明>
(システムブロック図の基本処理の説明)
計算機4の内部で行われる基本の処理について、図2のブロック図を用いて説明する。図2において、広域のネットワーク6より左側が上記利用者9の側を示し、右側が遠隔地の側を示している。
利用者9側の画像提示システムにおける送信機能についてはじめに説明する。カメラやマイクで構成されるマルチメディア情報取得装置2で取得された映像と音声の信号は、映像・音声処理装置41の内部にある送信装置16に取り込まれる。映像・音声処理装置41は、図1の計算機4と等価な装置である。ここでは、映像信号は送信装置16内の映像処理装置(送信側)21に入力され、音声信号は音声処理装置(送信側)22に入力され、遠隔地に送信するための信号処理が施された後に、外部に出力され、広域のネットワーク6を経由して遠隔地に伝送される。
【0028】
続いて、画像提示システムの受信機能について説明する。広域のネットワーク6を経由して遠隔地から送られてきた映像と音声の信号が、映像・音声処理装置41の内部の受信装置15に取り込まれる。映像信号は受信装置15内の映像処理装置(受信側)19に入力され、音声信号は音声処理装置(受信側)20に入力される。そしてこれら映像信号及び音声信号は、映像や音声を再現できる形に信号処理され、ディスプレイ(表示装置)やスピーカで構成されるマルチメディア情報提示装置10に出力される。
【0029】
遠隔地の処理についても同様で、映像・音声処理装置11は利用者側の映像・音声処理装置41に、受信装置17は利用者側の受信装置15に、送信装置18は利用者側の送信装置16に、マルチメディア情報提示装置12は利用者側のマルチメディア情報提示装置10に、マルチメディア情報取得装置13は利用者側のマルチメディア情報取得装置2に、それぞれ対応している。
【0030】
(映像・音声処理装置41の詳細説明)
映像・音声処理装置41について図3のブロック図を用いて具体的に説明する。但し、音声処理については、支障がない限り説明を省略する。以下、上記利用者9が使用する画像提示システムにおいて、撮影された利用者の撮像画像に作業で扱う電子データを合成(重畳)した映像を遠隔地に伝送する流れと、遠隔地から送られてきた映像を受信して表示するまでの流れについて説明する。もう一方の遠隔地側の流れについては、利用者9のシステムと同じであるため説明は省略する。
【0031】
撮影装置2aは、マルチメディア情報取得装置2に含まれる装置であり、本画像提示システムを使う利用者9の映像を撮影する。この撮影装置2aは、WebカメラやHD(High-Definition)解像度の撮影カメラなどの汎用の撮像デバイスを利用することが可能で、レンズ、露光調整機構、CCD(Charge Coupled Device)など基本的な撮像デバイス構成要素を有している。撮影装置2aは、外部入力端子(I/F)25によって映像・音声処理装置41に接続されている。撮影装置2aでは、撮影対象を含む視野からの光はレンズ・露光調整機構を通してCCD上に結像される。CCDは入力された受光量に応じた信号を生成し出力する。
【0032】
CCDで生成された信号は、カメラ用の所定の信号処理が施された後に画像信号(映像信号)として映像処理装置(送信側)21の内部に取り込まれ、一旦画像メモリ26に蓄積される。動画像を扱うため、撮影装置2aは一定間隔で映像を取得し、逐次映像信号を映像処理装置(送信側)21に供給する。画像メモリ26には、映像処理装置(送信側)21に入力された映像信号を順次上書き処理することにより、最新の映像データが蓄積されている。画像重畳部27は、画像メモリ26に蓄積された映像データをリアルタイムに読み出す必要があるため、画像メモリ26はDRAM(Dynamic Random Access Memory)等の高速にアクセス可能なメモリを用いて実現する。
【0033】
画像重畳部27は、画像メモリ26と電子データ加工部28とCPU29にそれぞれ接続しており、CPU29からの指示によって、撮影装置2aにより実写された撮像画像に電子データを合成するか、あるいは合成処理を行なわずに撮像画像をそのまま出力するかを切り替えることができる。
CPU29から撮影画像に電子データを合成処理するように指示された場合、画像重畳部27は、画像メモリ26から入力される撮像画像に、電子データ加工部28から入力される電子データを合成処理し、送信制御部32に結果を出力する。一方、CPU29によって、合成処理を行なわないように指示された場合には、画像メモリ26から入力される撮像画像をそのまま送信制御部32に出力する。
【0034】
電子データ加工部28は、画像重畳部27において撮像画像に適切に合成できるように、電子データの合成位置と表示角度を加工した画像データを生成し出力する。加工する前の電子データは、電子映像生成部30に接続された外部記憶装置34、あるいは映像・音声処理装置41内に格納され、必要な電子データが選択され取り出される。
【0035】
電子データ加工部28は、電子映像生成部30によって画像として生成された電子データを加工する。その際に、CPU29によって指示される利用形態を示す情報に基づいてLUT31に格納された電子データを加工するための加工情報が抽出されて、電子データ加工部28に入力される。電子データ加工部28は、LUT31から抽出された加工情報に応じて電子データを適切に加工する。
【0036】
上記の利用形態は、本画像提示システムを利用可能な形態を予め定めたもので、CPU29は操作装置5に対する操作入力に従って、利用形態を決定する。従って本実施形態のCPU29は、本発明の利用形態決定部に該当するものである。また、LUT31は、本画像提示システムで使用可能な利用形態と、電子データを加工するための加工情報とを対応付けた変換テーブルとして構成され、本発明の加工情報保持部に該当するものである。
【0037】
また、上記の電子データを加工するために必要な情報は、撮像装置が撮像した三次元空間内における電子データの配置状態を指定する情報であって、この配置状態を指定する情報を用いて電子データを加工することにより、撮像画像内に電子データが指定された状態で配置された合成画像が得られるようにしたものである。
【0038】
画像重畳部27で撮像画像と電子データが合成され、生成された映像信号は送信制御部32に入力され、通信に適した形に加工されて外部出力端子(I/F)33を通して、外部に送信される。画像重畳部27は、加工された電子データと撮影画像とを合成する本発明の合成部に該当する。
【0039】
一方遠隔地から送られてきた映像信号は、映像処理装置(受信側)19の外部出力端子35を通して映像処理装置(受信側)19に入力される。入力された映像信号は受信制御部36においてデータ解析が行なわれ、システムが扱うことができる信号に変換される。受信制御部36によって変換された信号は、一旦表示メモリ37に蓄積されて、外部出力端子38に接続された外部表示装置1に映像信号を送り、映像を表示する。
【0040】
(LUT31について)
LUT31から電子データを加工するための加工情報が出力されるまでの処理について順に説明する。始めに、操作装置5の入力操作によって指定された利用形態を示す情報を、CPU29がLUT31を制御するための信号に変換する。利用形態は、遠隔地間で利用者同士がコミュニケーションを行う状況を想定した作業を類型化して予め定めたものである。このような利用形態としてはその内容によって様々な形態が存在するが、ここでは実際の場面でよく行われていて、比較的重要な利用形態を用いる。図4を用いて、3つの具体的な利用形態について説明する。
【0041】
図4(A)は、二人の作業者91,92がディスプレイ100に表示された電子情報を見ていて、時々作業者同士が会話をするような状況で、具体的にはペアプログラミングで良く行われる利用形態を示している。図4(B)は、2人の作業者91,92が対面の位置関係にあり、作業者の間に計算機101を置き、そこに電子データを表示させ、お互いが見ている状況で、具体的にはモックアップ確認の際によく行われる利用形態を示している。図4(C)は、一方の作業者92の後方のスクリーン102にプロジェクタなどにより電子データが表示され、もう一方の作業者91に説明を行うような場面で、具体的にはプレゼンテーションの際に良く行われる利用形態を示している。利用形態については、ここで説明した3つ以外にも扱うことは可能である。
【0042】
利用者がこの3つの利用形態の中から一つを選択すると、その選択された情報がCPU29に入力される。操作装置5では、利用形態を簡単に選択できるように、図示していない操作パネル上に、図4のような画像を表示させ利用者に選択させるようなユーザインタフェースを備えることも可能である。利用者が利用形態を選択すると、CPU29は、利用者による操作信号を選択された利用形態に対応する識別コードに変換する。
【0043】
例えば、3種類の利用形態を識別するために、2bitの利用者選択信号Sinを割り当てると、図4(A)〜図4(C)の利用形態は順番に、Sin=00,01,10とすることができる。ここでSin=11は対応する利用形態が存在しないため、不定信号(未割当信号)である。
LUT31では、CPU29から入力される利用者選択信号Sinから、適切に電子データを加工するための加工情報を、変換テーブルを用いて抽出し、電子データ加工部28に出力する。電子情報加工のための加工情報は、例えば、電子データを合成するために必要な3次元位置と角度の情報である。
【0044】
図5に変換テーブルの例を示す。変換テーブルにおいて、第1列は利用者が選択する利用形態、第2列は利用者選択信号Sin、第3列は位置情報、第4列は角度情報を示している。LUT31は、このテーブルの利用者選択信号Sinに基づいて位置情報と角度情報を加工情報として抽出し、これら抽出した加工情報を電子データ加工部28に出力する。
【0045】
図6は、画像提示システムのディスプレイに表示する映像における電子データの配置位置を説明するための図で、LUT31のテーブルに設定される電子データの位置関係を示すものである。ここでは、図1のシステムの表示装置(ディスプレイ)1のディスプレイ面fに対する電子データの配置位置を仮想的に示している。ディスプレイ面fの水平方向をX軸、垂直方向をY軸、奥行き方向をZ軸とし、ディスプレイ面fの中心を原点とする位置情報と、ディスプレイ面fに対する角度情報を電子データdの中心に設定することによって、電子データdの配置位置を決定する。
【0046】
図6(A)は、ペアプログラミングの利用形態を示していて、ディスプレイ中心からX軸の負の方向に1m、奥行き方向に1mの位置に電子データdを表示させる。また、電子データdの角度についてもディスプレイ面fに対して45度傾けることで利用者が見やすくなるようにしている。図6(B)はモックアップ確認の利用形態を示しており、ディスプレイ中心に電子データdを配置している。図6(C)はプレゼンテーションの利用形態を示しており、ディスプレイ中心からX軸の負の方向に0.5m、奥行き方向に2mの位置に角度を変えずに電子データdを表示させる。
【0047】
(ワールド座標系)
電子データdに与えられる位置情報と角度情報とからその電子データdを空間内に正しく配置するために、図7を用いて座標軸の定義を行う。座標軸の原点oを利用者のディスプレイの中心とし、ディスプレイ面fに向かって右手方向がX軸の正の向き、上側がY軸の正の向き、ディスプレイ面fの奥の方向がZ軸の正の向きとする。以下、原点oを中心としたこの座標系をワールド座標系と呼び、基準の座標系とする。
【0048】
ワールド座標系のX軸、Y軸、Z軸をそれぞれXw、Yw、Zwとし、この座標軸上に電子データを配置する必要がある。電子データの配置は、上記LUT31より出力される加工情報に基づいて決定される。いま、LUT31より設置角度(ピッチ,ヨー,ロール)=(θpitch,θyaw,θroll)、座標位置(Xw,Yw,Zw)=(XI,YI,ZI)の6軸の値が設定されると、ワールド座標系の適切な位置に電子データを一意に配置することができる。設置角度のピッチはX軸回りの垂直角、ヨーはY軸回りの水平角、ロールはZ軸回りの回転角を、それぞれ示す。
【0049】
(撮影装置の座標変換)
一方、利用者らを撮影する撮影装置(カメラ)2aは撮影装置固有の座標系を有しているため、そのままでは上記ワールド座標系に配置された電子データと実写した撮影画像とを合成することはできない。そのため、撮影装置固有のカメラ座標系を、ワールド座標系に変換する必要がある。ワールド座標系への変換方法については図8を用いて説明する。
【0050】
座標系変換は、撮影装置2aの設置角度とディスプレイ中心oからの併進量を用いて表すことが可能である。始めに一般的なローカル座標系をもつ撮影装置について、上記ワールド座標系に変換する方法について説明を行い、その後具体的に図8に示すような場所に設置された撮影装置のローカル座標系からワールド座標系への変換方法について示す。
【0051】
座標系の変換は、X軸周りの回転θx、Y軸周りの回転θy、Z軸周りの回転θzとX軸方向の併進lx、Y軸方向の併進ly、Z軸方向の併進lzの組み合わせで行われる。
具体的に、X軸周りの回転θx、Y軸周りの回転θy、Z軸周りの回転θzを示す変換行列は、それぞれ以下のようになる。
【0052】
【数1】
【0053】
また、X軸方向の併進、Y軸方向の併進、Z軸方向の併進は以下の変換行列で表すことができる。
【0054】
【数2】
【0055】
上記変換行列を用いると座標系を変換することが可能で、ローカル座標系を有する撮影装置で撮影する空間の3次元位置(Xc,Yc,Zc)は、式(3)によってワールド座標系上の点(Xw,Yw,Zw)に変換することができる。
【0056】
(Xw,Yw,Zw,1)=(Xc,Yc,Zc,1)・rotX(θx)・rotY(θy)・rotZX(θz)・shiftXYZ(lx,ly,lz)・・・(3)
【0057】
続いて、図8のように表示装置1の上部に撮影装置2aを設置した場合の座標系変換方法について説明する。図8(A)は、撮影装置と表示装置の関係を斜視図によって説明する図、図8(B)はその上面図、図8(C)はその側面図である。
表示装置1の枠を含めた高さをν、幅をhとすると、撮影装置2aはディスプレイ中心oからν/2上側に設置されている。また、ディスプレイ中心oから手前方向に向かったZw軸のマイナス方向の軸を便宜上−Zw軸と呼ぶと、撮影装置2aの光学系の光軸は、−Zw軸に平行な軸40に対して下向きにθx傾いている。ワールド座標系と撮影装置固有のローカル座標系がこのような関係にあるとすると、ローカル座標系上の点(Xc,Yc,Zc)からワールド座標系上の点(Xw,Yw,Zw)への変換は式(式4)によって実現できる。
【0058】
(Xw,Yw,Zw,1)
=(Xc,Yc,Zc,1)・rot(180−θx)・shiftXYZ(0,ly,0)
・・・(4)
【0059】
ところが、撮影装置2aで実写された撮像画像は、撮影装置2aの撮像面に投影された2次元情報しかなく、(式4)を用いてワールド座標系に変換するために必要な3次元座標情報を得ることができない。従って、上記座標系の変換式(4)では、投影された画像をワールド座標系に変換して配置することができない。
そこで本発明に係る実施形態では、上記撮影装置で撮影されたローカル座標系を新たに基準座標系と定義し直し、ワールド座標系から基準座標系に変換しなおす。変換は、上記式(4)とは反対の変換を行えばよく、以下のように行うことができる。
【0060】
(Xc,Yc,Zc,1)
=(Xw,Yw,Zw,1)・rotX(−180+θx)・shiftXYZ(0,−ly,0)
・・・(5)
【0061】
以上、ローカル座標系を有する撮影装置で実写された撮影画像は座標系の変換ができないため、3次元情報をもつ電子データを基準座標系に変換し、撮影画像と合成を行う例を示した。他の例として、任意の視点映像を合成する技術を用いれば、撮影画像の方をワールド変換座標系に変換して、電子データを合成して提示することも可能である。
任意の視点を合成して生成する技術の詳細については説明を行わないが、例えば公知技術解説文献「自由視点映像技術」映像メディア学会誌Vol.60,No.1(2006)に記載のように、複数の撮影装置で撮影された映像から光線空間を構築し、仮想的な視点の映像を生成する技術を応用することも可能である。
【0062】
以上、撮影装置で実写された撮影画像と作業に用いる電子情報の座標系を基準座標系に統一することができると、この空間内から映像を作り出すことができる仮想的なカメラを設置し、ディスプレイに表示するための映像を作成することができるようになる。
【0063】
(3次元位置に基づいたレンダリング方法)
一般的な3DCGレンダリング技術では、画像供給源より供給される3次元位置を持った複数の平面画像を仮想的な3次元空間内に配置することでシーンが形成され、上記算出された基準座標系において想定する利用者位置から見た映像を生成することができる。この利用者位置に設置された仮想的なカメラよって3次元空間に再現されたシーンが撮影され、その後表示装置に表示するためのビュー変換処理によって想定する観察者位置から見た画像を切り出して提示することができる。
【0064】
ビュー変換処理は、基準座標系から観察者位置に置かれた仮想撮像装置を基準とする座標に変換することである。仮想撮像装置のX軸を示すベクトルをR=(rx,ux,νx)、仮想撮像装置のY軸を示すベクトルをU=(ry,uy,νy)、仮想撮像装置のZ軸を示すベクトルをV=(rz,uz,νz)、仮想撮像装置の位置を示すベクトルをP=(x,y,z)としたときに、ビュー変換行列は式6のようになる。
【0065】
【数3】
【0066】
続いて、ビュー変換されたシーンに対して遠くのものが小さく、近くのものが大きく見えるように透視投影処理が実施される。透視投影処理では、撮像装置に近いところ(前方投影面)と、遠いところ(後方投影面)に対して2つの投影面が導入され、撮像装置原点を中心とした錘状になるように設定される。プロジェクション変換によって、近いところの面と遠いところの面の間の空間が立方体になるように変換することによって、近いところが大きく、遠いところが小さく見えるような変換がなされる。このプロジェクション変換によって、射影座標系に変換される。水平方向の視野角をw、垂直方向の視野角をhとし、仮想撮像装置の位置から前方投影面までの距離をzn、後方投影面までの距離をzfとすると、以下の行列によって射影座標系に変換することができる。
【0067】
【数4】
【0068】
さらに、表示装置に表示するために、射影座標系からスクリーン座標系への変換が行なわれる。スクリーン座標系では、表示装置の左上を原点に、またY軸の向きが逆になるような変換が行なわれる。表示装置の水平方向の画素数をWidth、垂直方向の画素数をHeightとすると変換行列は以下のようになる。
【0069】
【数5】
【0070】
以上3DCGレンダリング技術により利用者の位置から見た画像が生成される。このように生成された映像を遠隔地に伝送して、相手側の画像提示システムに接続された表示装置に表示することで、撮像画像と共に適切な位置に電子作業オブジェクトなどの電子データを合成した映像を使ってコミュニケーションすることができる。
【0071】
遠隔地間で実作業を行うために相手側の実写された撮像映像に電子データを合成表示する際に、一般利用者にとって理解しにくい3次元的な位置関係を考慮することなく、解釈しやすい作業形態を選択させるだけで、適切な位置と角度に電子データを合成表示することが可能になる。
利用者は、表示装置1に提示される遠隔地の撮像画像と選択された利用形態に合わせた位置と角度に調整された電子データを見ると、その利用形態に合うように適切な位置に移動しコミュニケーションを行うことができる。これは、通常のフェイスツーフェイスの作業でも、特に意識することなく行われており、適切な位置関係で作業することが作業効率を高められることを潜在的・経験的に認知しているためである。利用者自信が備えているこの能力を活用することで、本発明の画像提示システムを補完することができる。
【0072】
(実施形態2)
本発明の第2の実施の形態を図9〜図13に基づいて説明する。上記第1の実施例では、利用者が操作装置5を用いて作業形態を入力する必要がある。本実施例では、利用者の位置を検出する3次元位置計測装置を導入することで、お互いの利用者の位置関係から適切な利用形態を計算機で推定し、その推定結果に基づいて電子情報を適切に合成表示することができる。
【0073】
図9は映像と音声を双方向通信できる本発明に係る映像提示システムの第2の実施形態を模式的に示す図である。図9において、第1の実施形態を説明する図と同一の要素には同じ符号を付し、その繰り返しの説明を省略する。
本実施形態では、利用者の3次元位置をリアルタイムに計測する3次元位置計測装置が追加されていることが、第1の実施形態と異なる点である。具体的には、3次元位置計測装置として、利用者9の頭に装着される磁場を計測するセンサ52と、磁場を発生させる磁場発生器51とが追加されている。センサ52と磁場発生器53はそれぞれ、計算機4に接続されており、リアルタイムに利用者の3次元位置を測定することができる。
【0074】
利用者の3次元位置を計測する3次元位置計測装置として磁気方式の例を示したが、他にも超音波を使った3次元位置計測装置や光学式の3次元位置計測装置を用いることも可能である。計算機4については、3次元位置計測装置による利用者の3次元位置から利用形態を推定する処理が加わる点が実施形態1と異なる。
また、計算機4で行われるシステムの基本処理である図2とその説明については第1の実施形態と同一である。
【0075】
図10は、第2の実施形態における映像・音声処理装置41のブロックを説明する図である。映像・音声処理装置41は、第1の実施形態と同様に計算機4と等価の装置である。本実施形態の映像・音声処理装置41は、利用者9の3次元位置を計測するための3次元位置計測装置53が接続されていることと、3次元位置計測装置53によって計測された3次元位置から利用形態を推定する形態推定部54とが追加されている点が第1実施形態と異なっている。その他の構成は図3に示す第1の実施形態の構成と同じである。
本実施形態では、形態推定部54は、3次元位置計測装置53による利用者の位置計測情報に従って利用形態を推定し、電子データの加工情報の抽出に使用する利用形態を決定する。従って本実施形態では、形態推定部54が本発明の利用形態決定部に該当する。
【0076】
(自動で作業形態を推定)
利用形態の推定方法について、図13のフローチャートを用いて説明する。S1において、3次元位置計測装置53を用いて利用者の3次元位置を計測する。S2では、S1で計測された利用者の位置より、お互いの利用者の相対的な位置関係を算出する。相対的な位置関係の算出は、上記第1の実施形態と同様に基準座標系に基づいて行う。但し、双方それぞれに基準座標系が存在するため、擬似的に図11に示すようにお互いの空間が接続しているものとして、片方の座標系をベースに考える。
【0077】
図11に示すように、地点Aの座標系を基準とし、地点Bの座標系を次のように変換すると共通化することができる。いま、地点Bの座標位置(XB,YB,ZB)とすると地点Aの座標系における座標(XA,YA,ZA)は、以下のようになる。
(XA,YA,ZA)=(−XB,YB,−ZB) ・・・(9)
【0078】
続いて、双方の利用者の位置とディスプレイとの位置関係から以下の条件により利用形態を推定する一例を示す。双方の利用者の位置を直線で結び、ディスプレイを含む面と交わる位置と利用者間の距離を用いて分類する。具体的には、図12(A)、図12(B)、図12(C)の3つの利用形態に分類する。
【0079】
図12(A)の条件は、双方(利用者9と遠隔地の利用者55)を結ぶ直線とディスプレイ面fが交わる交点56がディスプレイ中央より離れているか判定を行う。この条件を例えば条件Aとし、利用者の相対位置関係の算出結果から条件Aを満足するか否かを判定する(S3)。条件Aを満たす場合は、利用形態としてペアプログラミングを選択する(S5)。例えば、交点56とディスプレイ中央までの距離57が、表示装置の横サイズの25%以上離れている場合(距離57≧表示装置の横サイズh×0.25)に、S5のペアプロミングを選択する判-定を行うものとする。
【0080】
最初の条件Aを満足しない場合、双方が表示装置の正面の近くにいる可能性が高いため、利用形態としてモックアップ確認かプレゼンテーションのいずれかを選択する。ここでは利用者の位置からディスプレイ面までの距離を算出し、お互いのディスプレイまでの距離が同じぐらい離れているか判定を行う。この条件を例えば条件Bとし、条件Aを満足しない場合に、条件Bを満足するか否かを判定する(S4)。
【0081】
条件Bを満たす場合には利用形態としてモックアップ確認を選択し(S6)、条件Bを満足しない場合には利用形態としてプレゼンテーションを選択する(S7)。具体的には、地点Aの利用者9からディスプレイ面fまでの距離58と地点Bの利用者55からディスプレイ面fまでの距離を59とすると、距離58と距離59との差の絶対値が例えば0.5m以下の場合にS6でモックアップ確認を選択するものとする。
【0082】
以上、双方の利用者の位置と表示装置の位置関係により、利用形態を推定することができる。利用形態の推定ができると、上記第一の実施形態と同様に、LUT31の加工情報により、電子作業オブジェクト等の電子データを合成する位置が確定され、撮像画像に電子データを合成することが可能となる。
このように利用者の位置関係から利用形態を求め、その利用形態によって電子データの合成位置を制御することの利点は、利用者の直接の位置関係から電子データの合成位置を制御する場合に比べて、電子データの合成位置をより安定させることが可能になる。後者の方法では、利用者が動く度に電子データの合成位置が変わってしまい、視認性を低下させる問題がある。
【0083】
(第3の実施形態)
本発明は、上記第1または第2の実施形態の画像提示システムの機能を実現するプログラムとして実施することができる。また、このプログラムをコンピュータ読み取り可能に記録した記録媒体として実施することができる。
本実施形態のプログロムは、利用者に取って解釈しやすい利用形態から適切な角度と位置になるように電子データを実写された撮像画像に合成し、提示することで、遠隔地間の実作業に適したコミュニケーションを実現するための映像を生成する方法をソフトウエア処理として実行することができる。この結果、一般利用者にとって理解しにくい3次元的な位置関係を考慮することなく、解釈しやすい利用形態を利用者に選択させるだけで、適切な位置と角度に電子データを合成表示することが可能になる。
【0084】
本実施形態のプログラムを記録する記録媒体としては、マイクロコンピュータで処理が行われるために図示しないメモリ、例えばROMのようなプログラムメディアであってもよく、図示しない外部記憶装置としてのプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であってもよいし、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であってもよい。
【0085】
この場合、ダウンロード用のプログラムは予めコンピュータ等の情報処理装置本体に格納されているものとする。ここで、上記プログラムメディアは、情報処理装置本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フロッピーディスク(登録商標)やハードディスク等の磁気ディスク並びにCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
【0086】
また、この場合、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め情報処理装置本体に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。上記記録媒体は、デジタルカラー画像形成装置やコンピュータシステムに備えられるプログラム読み取り装置により読み取られることで上述した画像提示処理が実行される。
【0087】
なお、上記コンピュータシステムは、WEBカメラなどの汎用画像入力装置、所定のプログラムがロードされることにより上記画像提示処理など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するディスプレイ・液晶ディスプレイなどの表示装置より構成される。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられる。
【符号の説明】
【0088】
1…表示装置、2…マルチメディア情報取得装置、2a…撮影装置、3…音声再生装置、4…計算機、5…操作装置、7…映像、8…電子データ、9…利用者、10…マルチメディア情報提示装置、11…映像・音声処理装置、12…マルチメディア情報提示装置、13…マルチメディア情報取得装置、15…受信装置、16…送信装置、17…受信装置、18…送信装置、26…画像メモリ、27…画像重畳部、28…電子データ加工部、29…CPU、30…電子映像生成部、31…LUT、32…送信制御部、34…外部記憶装置、35…外部出力端子、36…受信制御部、37…表示メモリ、38…外部出力端子、40…軸、41…映像・音声処理装置、51…磁場発生器、52…センサ、53…次元位置計測装置、53…磁場発生器、54…形態推定部、55…利用者、56…交点、91,92…作業者、100…ディスプレイ、101…計算機、102…スクリーン。
【特許請求の範囲】
【請求項1】
撮影装置によって取得された撮影画像を入力し、該入力した撮影画像に、画像として生成された電子データを加工して合成し、該合成した画像を送受信することにより、遠隔地間でコミュニケーションを行なうことを可能とした画像提示システムであって、
該画像提示システムの利用形態を予め定められた利用形態の中から決定する利用形態決定部と、
前記利用形態決定部で決定可能な利用形態に応じて、前記電子データの合成に必要とする加工を行うための加工情報を保持する加工情報保持部と、
前記利用形態決定部により決定された利用形態に基づいて、前記加工情報保持部から前記加工情報を取得し、前記撮影画像に合成すべき電子データを加工する電子データ加工部と、
前記電子データ加工部で加工された電子データと、前記撮影画像とを合成する合成部とを有し、該合成部で合成された映像を送信することを特徴とする画像提示システム。
【請求項2】
利用者による操作入力を受け付ける操作装置を有し、
前記利用形態決定部は、前記操作装置に対する利用者の入力操作に従って、前記画像提示システムの利用形態を決定することを特徴とする請求項1に記載の画像提示システム。
【請求項3】
利用者の3次元上の位置を計測する3次元位置計測装置を有し、
前記利用形態決定部は、前記3次元位置計測装置で計測された利用者の位置情報に従って、前記画像提示システムの利用形態を決定することを特徴とする請求項1に記載の画像提示システム。
【請求項4】
前記画像提示システムの利用形態は、遠隔地間で利用者同士がコミュニケーションを行う状況を想定した作業を類型化して予め定めた利用形態であることを特徴とする請求項1〜3のいずれか1に記載の画像提示システム。
【請求項5】
前記加工情報保持部は、前記利用形態と、前記電子データを加工するために必要な情報とを対応付けた変換テーブルであることを特徴とする請求項1〜4のいずれか1に記載の画像提示システム。
【請求項6】
前記電子データを加工するために必要な情報は、前記撮像装置が撮像した三次元空間内における電子データの配置状態を指定する情報であって、
前記配置状態を指定する情報を用いて電子データを加工することにより、前記撮像画像内に前記電子データが指定された状態で配置された合成画像が得られることを特徴とする請求項1〜5のいずれか1に記載の画像提示システム。
【請求項7】
コンピュータに、請求項1〜6のいずれか1の画像提示システムの機能を実現させるためのプログラム。
【請求項8】
請求項7に記載のプログラムをコンピュータ読み取り可能に記録した記録媒体。
【請求項1】
撮影装置によって取得された撮影画像を入力し、該入力した撮影画像に、画像として生成された電子データを加工して合成し、該合成した画像を送受信することにより、遠隔地間でコミュニケーションを行なうことを可能とした画像提示システムであって、
該画像提示システムの利用形態を予め定められた利用形態の中から決定する利用形態決定部と、
前記利用形態決定部で決定可能な利用形態に応じて、前記電子データの合成に必要とする加工を行うための加工情報を保持する加工情報保持部と、
前記利用形態決定部により決定された利用形態に基づいて、前記加工情報保持部から前記加工情報を取得し、前記撮影画像に合成すべき電子データを加工する電子データ加工部と、
前記電子データ加工部で加工された電子データと、前記撮影画像とを合成する合成部とを有し、該合成部で合成された映像を送信することを特徴とする画像提示システム。
【請求項2】
利用者による操作入力を受け付ける操作装置を有し、
前記利用形態決定部は、前記操作装置に対する利用者の入力操作に従って、前記画像提示システムの利用形態を決定することを特徴とする請求項1に記載の画像提示システム。
【請求項3】
利用者の3次元上の位置を計測する3次元位置計測装置を有し、
前記利用形態決定部は、前記3次元位置計測装置で計測された利用者の位置情報に従って、前記画像提示システムの利用形態を決定することを特徴とする請求項1に記載の画像提示システム。
【請求項4】
前記画像提示システムの利用形態は、遠隔地間で利用者同士がコミュニケーションを行う状況を想定した作業を類型化して予め定めた利用形態であることを特徴とする請求項1〜3のいずれか1に記載の画像提示システム。
【請求項5】
前記加工情報保持部は、前記利用形態と、前記電子データを加工するために必要な情報とを対応付けた変換テーブルであることを特徴とする請求項1〜4のいずれか1に記載の画像提示システム。
【請求項6】
前記電子データを加工するために必要な情報は、前記撮像装置が撮像した三次元空間内における電子データの配置状態を指定する情報であって、
前記配置状態を指定する情報を用いて電子データを加工することにより、前記撮像画像内に前記電子データが指定された状態で配置された合成画像が得られることを特徴とする請求項1〜5のいずれか1に記載の画像提示システム。
【請求項7】
コンピュータに、請求項1〜6のいずれか1の画像提示システムの機能を実現させるためのプログラム。
【請求項8】
請求項7に記載のプログラムをコンピュータ読み取り可能に記録した記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2011−238085(P2011−238085A)
【公開日】平成23年11月24日(2011.11.24)
【国際特許分類】
【出願番号】特願2010−109881(P2010−109881)
【出願日】平成22年5月12日(2010.5.12)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成21年度、独立行政法人情報通信研究機構「高度通信・放送研究開発委託研究/革新的な三次元映像技術による超臨場感コミュニケーション技術の研究開発」、産業技術力強化法第19条の適用を受ける特許出願
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】
【公開日】平成23年11月24日(2011.11.24)
【国際特許分類】
【出願日】平成22年5月12日(2010.5.12)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成21年度、独立行政法人情報通信研究機構「高度通信・放送研究開発委託研究/革新的な三次元映像技術による超臨場感コミュニケーション技術の研究開発」、産業技術力強化法第19条の適用を受ける特許出願
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】
[ Back to top ]