説明

コミュニケーション装置、コミュニケーション方法、及びプログラム

【課題】映像中の対話相手との距離を任意に制御し、人間の視覚特性を考慮して、2次元ディスプレイ上の対話相手のサイズを、表現したい距離に応じて変換可能とする。
【解決手段】画像取得部1−aは、対話相手の2次元映像を撮影する。距離測定部1−bは、カメラから対話相手までの距離を測定する。3次元画像生成部1−cは、ユーザBの2次元画像、並びに、ディスプレイ面とユーザBの距離Zに基づいて、ユーザBの2次元画像を、ユーザBの3次元画像情報に変換する。視点位置検出部1−dは、ディスプレイ位置に対するユーザAの視点位置を取得する。視点位置画像生成部1−eは、ユーザAの視点位置と、ユーザBの3次元画像情報とから、ユーザAのディスプレイ面に表示する映像を生成する。映像表示部1−fは、生成された表示画像を表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特に対話相手の距離感を制御する技術に係り、テレビ電話や、ビデオチャットなど映像を用いた遠隔地間のコミュニケーションを、よりリアルに実現するコミュニケーション装置、コミュニケーション方法、及びプログラムに関する。
【背景技術】
【0002】
映像コミュニケーションにおいて、対話相手とあたかも対面しているかのような感覚をユーザに提示するためには、ユーザに対して対話相手の映像をどのように提示するかが重要である。その際、特に、対人間の距離をユーザに正しく認識させることは重要である。なぜなら、古くから対面会話において、対人間の距離感は、話しやすさや、緊張感に影響を与えることが確認されているからである。
【0003】
そこで、従来技術では、あたかも実物大の対話相手が目の前にいるように感じさせるために、対話相手の人物を2次元ディスプレイ上に実物大に表示する技術(例えば、特許文献1参照)や、所望のサイズに映す方式が考えられている(例えば、特許文献2参照)。2次元ディスプレイ上の人物サイズと、ユーザが感じる対話相手との距離感には相関があると考えられるが、通常の2次元ディスプレイに表示される映像は奥行き手がかりが欠如するため、距離感を感じにくく、個人差も大きい。
【0004】
これに対して、2次元ディスプレイ上に表示される対話相手の映像に運動視差を与えることで、ユーザに奥行き手がかりを与え、より高精度に距離を感じさせることが提案されている(例えば、非特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2004−200929号公報
【特許文献2】特許第3586126号公報
【非特許文献】
【0006】
【非特許文献1】石井亮,能登肇,高田英明,鈴木英夫:“映像コミュニケーションにおける運動視差を利用した奥行き表現手法の提案”,MVE2009-36,pp.11-16,(2009)
【発明の概要】
【発明が解決しようとする課題】
【0007】
対面会話において、相手との距離感は、話しやすさや、緊張感に影響を与え重要である。しかしながら、2次元ディスプレイに映された従来の映像では、奥行き情報が欠落するため、映像中の対話相手と自身の位置関係を把握することは難しく、対話相手との距離の表現ができなかった。すなわち、ユーザが感じる映像中の対話相手との距離を任意に制御することができなかった。このため、対面会話と同様に、互いの実距離に合わせて互いに同じ対人距離を感じさせることができないという問題があった。
【0008】
また、上述した理由により、相手の映像中に映っている物を指差ししたときに、相手は、その指差しを観察して、何を指しているのか(指示対象が何かを)正しく理解することができないという問題があった。これは、互いの距離感が整合されていないために、どこから(自分に対してどの位置から)指差しがされているか把握できないことによって生じる対話相手の現実の指示動作とのズレが原因である。したがって、映像中の対話相手との距離感を正しく表現することが可能であれば、互いの指示動作における指示対象の認識が正しく行えると考えられる。
【0009】
さらに、対話相手との対人距離を適度に調節することができなかったため、ユーザが対話相手と望ましい(好みの)距離感で会話することができないという問題があった。
【0010】
また、対話相手の映像に運動視差を与える従来技術においても、運動視差量と、ユーザが感じる対話相手との距離感とには、相関があると考えられるが、その関係は明確にされておらず、さらに所望の距離感を表現する手段は、これまで無かった。
【0011】
本発明は、このような事情を考慮してなされたものであり、その目的は、映像中の対話相手との距離を任意に制御でき、人間の視覚特性を考慮して、2次元ディスプレイ上の対話相手のサイズを、表現したい距離、及び運動視差に応じて変換することができるコミュニケーション装置、コミュニケーション方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0012】
上述した課題を解決するために、本発明は、2点間で互いの映像を含む情報を双方向で通信するコミュニケーション装置であって、対話相手とその背景とを含む2次元画像を撮影する画像取得手段と、前記対話相手と前記画像取得手段との距離を測定する距離測定手段と、前記画像取得手段により撮影された前記2次元画像と、前記距離測定手段により測定された前記対話相手と前記画像取得手段との距離とに基づいて、当該装置側のユーザと前記対話相手の画像との距離を幾何学計算によって算出される距離より大きく、かつ、当該装置側のユーザが感じる知覚距離が大きくなるほど、その大きさの差が大きくなるように、前記対話相手とその背景とからなる多層画像に分割した3次元画像を生成する3次元画像生成手段と、当該装置側のユーザの視点位置を検出する視点位置検出手段と、前記視点位置検出手段により検出された、当該装置側のユーザの視点位置と、前記3次元画像生成手段により生成された、前記対話相手とその背景とからなる多層画像に分割した3次元画像とに基づいて、前記対話相手側の2次元画像を生成する視点位置画像生成手段と、前記視点位置画像生成手段により生成された前記対話相手側の2次元画像を表示する表示手段とを備えることを特徴とするコミュニケーション装置である。
【0013】
本発明は、上記の発明において、前記3次元画像生成手段は、当該装置側のユーザと前記対話相手の画像との距離をS=f(D,α)としたとき、2次方程式S=α*(ax+bx+c)(但し、0<αかつa,b,cは、次式(1)を満たす全ての実数)、もしくは1次方程式S=α*(ax+b)(但し、数式(2)を満たす全ての実数)、もしくは指数関数を用いた式S=α*(a+b)+c(但し、数式(3)であるとき)に従って、当該装置側のユーザと前記対話相手の画像との距離を算出することを特徴とする。
【0014】
【数1】

【0015】
【数2】

【0016】
【数3】

【0017】
本発明は、上記の発明において、前記3次元画像生成手段は、前記知覚距離として、前記距離測定手段により測定された、前記対話相手と前記画像取得手段との距離を用いる、ことを特徴とする。
【0018】
本発明は、上記の発明において、自装置側のユーザとの映像を撮影する第2の画像取得手段と、自装置側のユーザと前記第2の画像取得手段との距離を測定する第2の距離測定手段と、自装置側のユーザと前記表示手段により表示される対話相手との距離を選択するための距離選択手段とを更に備え、前記3次元画像生成手段は、前記知覚距離として、前記距離選択手段により選択された距離から、前記第2の距離測定手段により測定された、前記自装置側のユーザと該ユーザの映像を撮影する前記第2の画像取得手段との距離を減算した値を用いる、ことを特徴とする。
【0019】
また、上述した課題を解決するために、本発明は、2点間で互いの映像を含む情報を双方向で通信するコミュニケーション方法であって、対話相手とその背景とを含む2次元画像をカメラで撮影する画像取得ステップと、前記対話相手と前記カメラとの距離を測定する距離測定ステップと、前記画像取得ステップで撮影された前記2次元画像と、前記距離測定ステップで測定された前記対話相手と前記カメラとの距離とに基づいて、当該装置側のユーザと前記対話相手の画像との距離を幾何学計算によって算出される距離より大きく、かつ、当該装置側のユーザが感じる知覚距離が大きくなるほど、その大きさの差が大きくなるように、前記対話相手とその背景とからなる多層画像に分割した3次元画像を生成する3次元画像生成ステップと、当該装置側のユーザの視点位置を検出する視点位置検出ステップと、前記視点位置検出ステップで検出された、当該装置側のユーザの視点位置と、前記3次元画像生成ステップで生成された、前記対話相手とその背景とからなる多層画像に分割した3次元画像とに基づいて、前記対話相手側の2次元画像を生成する視点位置画像生成ステップと、前記視点位置画像生成ステップで生成された前記対話相手側の2次元画像を表示する表示ステップとを含むことを特徴とするコミュニケーション方法である。
【0020】
本発明は、上記の発明において、前記3次元画像生成ステップは、当該装置側のユーザと前記対話相手の画像との距離をS=f(D,α)としたとき、2次方程式S=α*(ax+bx+c)(但し、0<αかつa,b,cは、次式(4)を満たす全ての実数)、もしくは1次方程式S=α*(ax+b)(但し、数式(5)を満たす全ての実数)、もしくは指数関数を用いた式S=α*(a+b)+c(但し、数式(6)であるとき)に従って、当該装置側のユーザと前記対話相手の画像との距離を算出することを特徴とする。
【0021】
【数4】

【0022】
【数5】

【0023】
【数6】

【0024】
本発明は、上記の発明において、前記3次元画像生成ステップは、前記知覚距離として、前記距離測定ステップで測定された、前記対話相手と前記カメラとの距離を用いる、ことを特徴とする。
【0025】
本発明は、上記の発明において、自装置側のユーザと該ユーザの映像を撮影するカメラとの距離を測定する第2の距離測定ステップと、自装置側のユーザと前記表示ステップで表示される対話相手との距離を選択するための距離選択ステップとを更に備え、前記3次元画像生成ステップは、前記知覚距離として、前記距離選択ステップで選択された距離から、前記第2の距離測定ステップで測定された、前記自装置側のユーザと該ユーザを撮影する前記カメラとの距離を減算した値を用いる、ことを特徴とする。
【0026】
また、上述した課題を解決するために、本発明は、2点間で互いの映像を含む情報を双方向で通信するコミュニケーション装置のコンピュータに、対話相手とその背景とを含む2次元画像をカメラで撮影する画像取得機能、前記対話相手と前記カメラとの距離を測定する距離測定機能、前記画像取得機能で撮影された前記2次元画像と、前記距離測定機能で測定された前記対話相手と前記カメラとの距離とに基づいて、当該装置側のユーザと前記対話相手の画像との距離を幾何学計算によって算出される距離より大きく、かつ、当該装置側のユーザが感じる知覚距離が大きくなるほど、その大きさの差が大きくなるように、前記対話相手とその背景とからなる多層画像に分割した3次元画像を生成する3次元画像生成機能、当該装置側のユーザの視点位置を検出する視点位置検出機能、前記視点位置検出機能で検出された、当該装置側のユーザの視点位置と、前記3次元画像生成機能で生成された、前記対話相手とその背景とからなる多層画像に分割した3次元画像とに基づいて、前記対話相手側の2次元画像を生成する視点位置画像生成機能、前記視点位置画像生成機能で生成された前記対話相手側の2次元画像を表示する表示機能を実行させることを特徴とする。
【発明の効果】
【0027】
この発明によれば、映像中の対話相手との距離を任意に制御でき、人間の視覚特性を考慮して、2次元ディスプレイ上の対話相手のサイズを、表現したい距離、及び運動視差に応じて変換することができる。
【図面の簡単な説明】
【0028】
【図1】本発明による映像表示のイメージを示す概念図である。
【図2】本第1実施形態によるコミュニケーション装置の構成を示すブロック図である。
【図3】本第1実施形態による3次元画像生成部1−cにおける処理を説明するためのフローチャートである。
【図4】本第1実施形態において、各レイヤの画像の大きさ情報の算出方法を説明するための概念図である。
【図5】本第1実施形態において、ディスプレイ上の人物のサイズと知覚される距離の関係を説明するための概念図である。
【図6】実際の知覚距離に対してそれらの回答データをプロットした例を示す図である。
【図7】実際に、生成される「奥行き情報を持つユーザBの3次元画像情報」の例を示す概念図である。
【図8】本第1実施形態による視点位置画像生成部1−eの動作を説明するためのフローチャートである。
【図9】本第1実施形態による視点位置画像生成部1−eの動作を説明するための概念図である。
【図10】本発明の第3実施形態によるコミュニケーション装置の構成を示すブロック図である。
【発明を実施するための形態】
【0029】
以下、本発明の一実施形態を、図面を参照して説明する。
【0030】
本発明は、2地点での映像コミュニケーションにおいて、ディスプレイを1枚の窓に見立てて、ユーザがあたかも対話相手の空間を窓越しに互いが覗いているかのように、ユーザの視点位置に応じて、その位置から見える対話相手の空間の映像をディスプレイに表示すること(運動視差)を実現し、映像中の対話相手の奥行き位置の表現を行う映像表現において(非特許文献1)、2次元ディスプレイ上の人物の大きさ、及び運動視差量を制御を行うことにより、ユーザと対話相手の距離感を所望の大きさに表現することを特徴としている。
【0031】
図1は、本発明による映像表示のイメージを示す概念図である。図1において、ユーザ1が視点を変えると(3軸移動に対応)、映像中の対話相手2の奥行き位置(対話相手2とその背景の壁3)を、その視点の変化に応じて2次元ディスプレイ4上に表示することで、対話相手2の見え方があたかも現実のように再現される。
【0032】
すなわち、ユーザAが位置P1にて2次元ディスプレイ4に対峙する場合には、対話相手(ユーザB)を正面から見ているように表示し、ユーザAが左側の位置P2から見ている場合には、対話相手B、及びその背景にある壁3との位置関係(奥行き)を反映し、対話相手Bを左側から見ているように表示し、ユーザAが右側の位置P3から見ている場合には、対話相手B、及びその背景にある壁3との位置関係(奥行き)を反映し、対話相手Bを右側から見ているように表示する。
【0033】
本発明の技術は、2次元ディスプレイ上の人物の大きさ、及び運動視差量を制御し、ユーザと対話相手の距離感を所望の大きさに表現する技術であり、以下のような技術i)〜iii)からなる。
【0034】
i)対話相手の位置を表示装置(ディスプレイなど)に対して任意の距離に表現する人物サイズ制御技術。
ii)対話相手の位置を検出し、検出される位置に合わせて距離を表現する機能。
iii)常にユーザと対話相手の距離を任意の距離に一定に保つ機能。
それぞれについて、以下に順に説明する。
【0035】
A.第1実施形態
まず、本発明の第1実施形態について説明する。
本第1実施形態では、上述した、i)対話相手の位置をディスプレイに対して任意の距離に表現する人物サイズ制御技術を実現する。
【0036】
図2は、本第1実施形態によるコミュニケーション装置の構成を示すブロック図である。図1において、コミュニケーション装置は、画像取得部1−a、距離測定部1−b、3次元情報生成部1−c、視点位置取得部(ユーザA)1−d、視点位置画像生成部(ユーザA)1−e、映像表示部1−fから構成されている。
【0037】
図2には、ユーザA、B間で通信することを想定して、ユーザA側のコミュニケーション装置の構成を示しており、映像表示部1−fには、ユーザBの映像が表示される。すなわち、本第1実施形態によるコミュニケーション手法は、図2に示す構成を2セット用意することにより、双方向で使用する。なお、以下の説明で「ディスプレイ」と表記されるものは、対話相手側(ユーザB)の映像表示部1−fを指すものである。
【0038】
本説明では、ユーザAが映像中のユーザBを観察して距離Dに感じるように、映像表示部1−fに、ユーザBを実物大に対して、どの程度の大きさで表示し、ユーザにどれくらいの運動視差を与えるべきかを決定する。実際には、ディスプレイから人物レイヤまでの距離Sを決定することで、大きさ、運動視差量が決まるため、この距離Sを制御する。最後に、映像表示部1−fに処理後の映像を表示するということを前提として説明する。
【0039】
まず、画像取得部1−aは、撮影装置(カメラ)を用いて、ユーザBの2次元映像(画像)を撮影する。カメラは、ユーザAがユーザBと視線を合わせるために、ユーザBの映像表示部1−e上に表示されるユーザAの目位置(目位置とは、両目の目頭を結ぶ線分の中点の位置)に光学的、または、仮想的にカメラのレンズ中心がくるように配置する。
【0040】
例えば、ユーザB側のディスプレイとユーザBとの間にハーフミラーを、ディスプレイの平面の法線とハーフミラーの法線とのなす角度が45度となるように設置し、カメラを該ハーフミラーの上方または下方に、ハーフミラーからディスプレイまでの距離だけ離して設置することにより、ハーフミラーを介してカメラ撮像する手法を用いることも考えられる。
【0041】
また、ユーザB側のディスプレイを隠さないように、ユーザBのディスプレイの周囲に複数のカメラを配置し、FTV(Free-Viewpoint Television)技術によって、該周囲の複数のカメラ画像から、ユーザBのディスプレイ上に表示されるユーザAの視点位置にある仮想視点の映像を生成する手法を用いることも考えられる。
【0042】
その他、視線一致を実現するために、カメラ位置は、できるだけ、ユーザB側のディスプレイに表示されたユーザAの目位置にレンズ中心が来るように配置する。
【0043】
以後、ユーザBのディスプレイの中心にカメラレンズの中心がくるようにカメラが設置されており、カメラの撮像面がディスプレイの画面にあると仮定して説明する。
【0044】
距離測定部1−bは、カメラからユーザBまでの距離を測定する。具体的な距離測定手法として、以下の方法が考えられる。
a)複数のカメラを用いた顔認識、及びステレオマッチングを用いた画像処理技術。
b)光学式または磁気式のモーショントラッキング技術。
【0045】
また、映像コミュニケーションにおいて人物がカメラ映像の中央にいることを前提条件とし、
c)カメラのオートフォーカス機能によるフォーカス距離情報取得(特許文献2)、
を用いる。これらの技術を用いて、距離測定部1−bは、ディスプレイ面とユーザB間の距離Zを取得する。このとき、ディスプレイ面とユーザB間の距離Zは、ディスプレイ面からユーザBへの法線の長さである。距離を取得できる手法は、上記の手法だけに限らず、他の手法であってもよい。
【0046】
次に、3次元画像生成部(ユーザB)1−cは、画像取得部(カメラ)1−aによって撮影された、ユーザBの2次元画像、並びに、距離測定部1−bによって取得された、ディスプレイ面とユーザBの距離Zに基づいて、ユーザBの2次元画像を、奥行き情報を持つユーザBの3次元画像情報に変換して出力する。
【0047】
本第1実施形態の特徴として、1対1の映像コミュニケーションにおいては、ディスプレイの正面から大きくユーザが動かないという前提条件の下、完全な3次元形状をもつ奥行き映像を生成するのではなく、入力された「ユーザBの2次元画像」を、人物領域と背景領域とに分割し、書割のように平面レイヤのまま奥行き情報を付与し多層化する。
【0048】
図3は、本第1実施形態による3次元画像生成部1−cにおける処理を説明するためのフローチャートである。説明を簡単にするため、もっとも単純な構成である2層化の手法について具体的に述べる。まず、画像取得部1−aによって撮影された「ユーザBの2次元画像」と、距離情報取得部1−bから供給される、「ディスプレイ面とユーザBの距離」を入力する(ステップS1)。
【0049】
次に、「ディスプレイ面とユーザBの距離」に基づいて、「ユーザBの2次元画像」を、人物領域とその背景領域とに分割する(ステップS2)。2層化する際、前のレイヤが人物領域、後ろのレイヤが背景領域となる。人物領域と背景領域の分割には、ディスプレイが据え置きの映像コミュニケーションにおいては、背景が多くの場合で固定であるため背景差分を利用し、あらかじめ背景のみを撮影しておき、それをリファレンスとして差分を取得することで人物を抽出する。
【0050】
また、距離画像センサを用いた距離情報や、温度画像センサによる人物の体温情報、顔認識を併用して領域分割の精度を向上することも考えられる。具体的な手法として、所定の範囲内に人物が存在し得る(例えば、ディスプレイが設置された部屋の場合には、ディスプレイから部屋の壁までの範囲内)場合には、ディスプレイの所定の位置を基準点とした人の存在範囲(該基準点から該部屋の壁までの範囲)を規定し、距離画像センサを用いて距離画像を取得し、人物が存在すると規定される範囲の距離を示す画素領域を該距離画像中の人物領域と判定する。
【0051】
例えば、ディスプレイ面から、0〜3mまでの領域は、人物領域と判定し、3m以上の領域は背景領域と判定する。また、温度画像センサの場合、同様に人物を示す温度範囲を規定して、同様な判定を行う。これらの複数センサから取得された複数の人物領域を候補として、各画素でボーティングして人物領域を最終的に判定する。具体的には、例えば、画像中のある画素で、各センサを用いた人物領域判定の論理積を取ることで、最終的な判定を行う。
【0052】
顔認識の利用用途は、上記処理などを行った後に、人物領域と判定される領域の候補が複数存在し、その中に人物以外のものが混在していたときに、2次元画像中の領域毎に顔認識を行い、顔抽出された領域のみを人物領域と判定する。これにより、誤って人物領域と判定された領域を排除することが可能であり、より頑健な人物領域抽出が可能となる。
【0053】
その他、画像中の領域分割には様々な手法が提案されており、それらも利用可能である。
【0054】
なお、上記説明では、2層化についての方式を説明したが、さらに多層化する場合、距離や、温度の閾値を細かく設定し、距離画像や、温度画像の分割数を増やすことが考えられる。これにより、多層の書割レイヤを生成することが可能である。
【0055】
次に、2層化されたうち、背景領域の画像を入力として、新たな背景画像を生成する(ステップS3)。単純に1枚の元画像から人物領域を抜いた(減算した)ままだと、背景画像中の人物領域にあたる部分の画像が欠けてしまう。このため、欠落している背景画像の領域(以後、欠落領域)を過去の背景画像から補完する。該補完した背景画像が新たな背景領域の画像となる。
【0056】
その他、背景が大きく変化しないと仮定し、事前に撮影した背景画像を背景レイヤとして使用してもよい。または、プライバシ保護の観点から、背景部分を実際とは違う画像と差し替えてもよい。その他、背景画像に用いる画像に特に制約は無く、一般的に考えられるあらゆる画像が利用可能である。
【0057】
なお、上記ステップS1〜S3において、3次元画像の生成において多層のレイヤ表現について述べたが、TOFカメラ(距離画像測定カメラ)の距離画像からテクスチャを生成し、3次元モデルで表現することも可能である。
【0058】
次に、上記生成された、人物領域の画像、背景画像に実寸の大きさ情報を付与する(ステップS4)。まず、各レイヤの画像の大きさ情報の算出方法について以下に述べる。ここで、図4は、本第1実施形態において、各レイヤの画像の大きさ情報の算出方法を説明するための概念図である。このとき、人物レイヤαの画像の高さα、幅αは、画像取得部1−a(カメラ)の画角(縦θ、横θ)、画像取得部1−aから人物レイヤまでの距離D(画像取得部1−a(カメラ)とディスプレイ(ユーザB側の映像表示部)との位置関係を既知とし、「ディスプレイ面とユーザBの距離」から算出)、カメラズーム率Zを用いて、次式(7)、(8)で算出される。
【0059】
【数7】

【0060】
【数8】

【0061】
次に、ディスプレイからの距離情報と実寸情報とを併せて奥行き情報とし、人物領域の画像と背景画像とに該奥行き情報を付与し、それぞれレイヤ化する(ステップS5)。以後、これらのレイヤを「人物レイヤ」、「背景レイヤ」と呼ぶ。この3次元画像情報が、「奥行き情報を持つユーザBの3次元画像情報」として生成される。この3次元情報が、後述する映像表示部1−fで表示される。
【0062】
このとき、ここでの距離と実際にユーザAが知覚する映像中のユーザBまでの距離は一致しない。例えば、図5に示すように、人物レイヤをディプレイから距離Dとしたとしても、実際には、ユーザAは、距離Dに比べてディスプレイに近い距離(距離の短い位置)にユーザBがいるように感じる。そのため、人間の実際の知覚距離とディスプレイから人物レイヤまでの距離の関係を考慮して、ユーザAがユーザBと任意の距離を感じるように、ディスプレイから人物レイヤまでの距離を制御する。また、ここでいう、ディスプレイから人物レイヤまでの距離を制御することは、ユーザAの視点位置に応じた運動視差の視差量とディスプレイ上のユーザBの人物サイズとを制御することと同等である。例えば、ディスプレイから人物レイヤまでの距離を大きくすることは、視差量を大きくし、人物サイズを小さくすることになる。
【0063】
ディスプレイから人物レイヤまでの距離(すなわち、視差量とディスプレイ上の人物サイズ)とユーザAのユーザBまでの知覚距離との関係は、被験者を用いた評価実験などからデータを収集し、それらを近似式で表すことができる。例えば、ディスプレイから人物レイヤまでの距離(すなわち、視差量とディスプレイ上の人物サイズ)を変化させて、被験者(ユーザAに相当)に観察させ、被験者からユーザBまでの距離感(知覚距離)を数値で回答させる。回答データは、数値で回答されるため、個人差が生じるため、それを補正する。
【0064】
図6は、実際の知覚距離に対してそれらの回答データをプロットした例を示す図である。図6において、横軸は、ユーザAの知覚距離D、縦軸は、ディスプレイから人物レイヤまでの距離Sである。図中の破線L1は、ディスプレイと人物レイヤの距離=ユーザAの知覚距離と仮定したときに描かれる線(すなわち、S=D)、×印が回答された実データ、実線L2がその近似線である。
【0065】
この近似式をS=f(D,α)(※αは、ユーザからディスプレイまでの距離や、ディスプレイサイズなどによって変化する値である。これらの要因によってもユーザが感じる距離感は変化する)で表す。S=f(D,α)は、2次方程式S=α*(ax+bx+c)(但し、0<αかつa,b,cは、次式(9)を満たす全ての実数)、もしくは1次方程式S=α*(ax+b)(但し、数式(10)を満たす全ての実数)、指数関数を用いた式S=α*(a+b)+c(但し、数式(11)であるとき)などの形で表される。
【0066】
【数9】

【0067】
【数10】

【0068】
【数11】

【0069】
上記近似式を用いれば、ユーザに対して対話相手が任意の位置D(ディスプレイ位置を基準として)にいるように感じさせるためには、ディスプレイに人物をどの程度のサイズで表示すべきか、距離Sを決定することが可能である。すなわち、ディスプレイから人物レイヤまでの距離を、幾何学計算によって算出される距離(図6の点線)より大きく、かつ、知覚距離が大きくなるほどその大きさの差が大きくなるように決定すればよい。観測される実データから近似式S=f(D,α)を算出する方法は、一般的なあらゆる手法が適用可能であり、さらに式f(D,α)の形や、次元に制約はない。
【0070】
ここで算出されたSを人物レイヤの奥行き情報とする。また、背景レイヤの奥行きは、任意の値(但し、人物レイヤより奥行き位置が遠いこと)を用いる。但し、ステップS3において、背景レイヤの距離情報が取得できていた場合、その距離を用いて値を決めることもできる。
【0071】
図7は、実際に、生成される「奥行き情報を持つユーザBの3次元画像情報」の例を示す概念図である。図7において、距離1.0mの位置に人物レイヤ、距離3.0mの位置に背景レイヤが配置されている。この奥行きに応じて配置された多層レイヤの情報は、各レイヤの2D画像データ、各レイヤ面とディスプレイ間の距離、各レイヤの縦・横サイズ(α,α)であり、これらの「奥行き情報を持つユーザBの3次元画像情報」が出力される。「奥行き情報を持つユーザBの3次元画像情報」は、各レイヤの2D画像データ+D+α+αである。
【0072】
次に、視点位置検出部(ユーザA)1−dは、顔認識およびステレオマッチングを用いた画像処理技術や、光学式または磁気式のモーショントラッキング技術等を用いて、ユーザの視点(目)位置がどこにあるかのユーザの視点位置V(v,v,v)を取得し、出力する。視点位置画像生成部(ユーザA)1−eは、ディスプレイ位置に対するユーザAの視点位置と、奥行き情報を持つユーザBの3次元画像情報とから、ユーザAのディスプレイ面に表示する映像(「ユーザAの視点位置に応じた2次元画像」)を生成する。
【0073】
ここで、図8は、本第1実施形態による視点位置画像生成部1−eの動作を説明するためのフローチャートである。また、図9は、本第1実施形態による視点位置画像生成部1−eの動作を説明するための概念図である。「ユーザの視点位置に応じた2次元画像」は、図9に示すように「奥行き情報を持つユーザBの3次元画像情報」を、「ディスプレイ位置に対するユーザAの視点位置」を基点に、ユーザAのディスプレイ面に透視投影などの射影変換を行うことで生成される(ステップS20)。
【0074】
まず、「ディスプレイ位置に対するユーザAの視点位置」、「奥行き情報を持つユーザBの3次元画像情報」、ユーザAのディスプレイの座標系を統一する。このとき、座標系は実寸のサイズ情報を有する。ここで、ユーザAのディスプレイサイズが必要となる。
【0075】
次に、実際の透視変換の一例を示す。ディスプレイの中心を座標系の原点O(0,0,0)とし、座標ディスプレイ面の横方向にx軸、縦方向にy軸、ディスプレイ面の法線をz軸とし、ユーザ位置とは逆向きを正の方向とする。ユーザの視点位置をV(v,v,v)(但し、v<0)としたとき、ディスプレイ面上の点D(x,y,z)に投影されるべき、あるレイヤiの点H(h,h,h)は、次式(12)により算出される。
【0076】
【数12】

【0077】
なお、数式(12)の変換行列式中の座標は、実寸の情報を有する座標系ということを前提としている。
【0078】
この処理を、ディスプレイ面上の各画素において、「奥行き情報を持つユーザBの3次元画像情報」の各画像レイヤに対して行う。また、その他、平行投影といった一般的な射影変換の手法も利用可能である。
【0079】
このとき、人物レイヤ中でディスプレイ面上に投影するのは人物領域のみとする。また、複数のレイヤの点がディスプレイ面に投影される場合、最も前面のレイヤのみを投影して表示する。また、計算量を軽くするために、各画像レイヤの前面(ディスプレイに対して)から、ディスプレイに射影されるべき点を計算し、あるレイヤ中に射影される点がある場合、このレイヤより後ろのレイヤに対しては計算を行わない。
【0080】
また、上述したように、最も前面のレイヤのみ投影することせずに、全レイヤを投影することとし、該当する点の透明度(α値)を任意に設定し、複数のレイヤを透かせて見えることで、背景情報など、実際には見えない背景情報も可視化することで、背景情報を伝達するようにすることも考えられる。
【0081】
最後に、映像表示部15は、映像生成部1−fは、生成された映像、すなわち、ユーザAの視点位置に応じた、ユーザBの2次元画像を表示する。
【0082】
B.第2実施形態
次に、本発明の第2実施形態について説明する。
本第2実施形態では、上述した、ii)対話相手(ユーザB)の位置を検出し、検出される位置に合わせて距離を表現する機能を実現する。これは、2地点での映像コミュニケーションにおいて、互いのディスプレイを1枚の窓(ディスプレイを2つの空間の境界面)に見立てて、空間を窓越しに互いが覗いているかのように、互いの距離感を再現する技術である。
【0083】
例えば、ユーザBがユーザBのディスプレイの前方2mの位置にいたとする。この場合、ユーザAは、ユーザAのディスプレイ上に映っているユーザBを観察したとき、ユーザBがユーザAのディスプレイ後方2mの位置にいるように感じさせることを実現する。これを実現するためには、例えば、ディプレイの中心にカメラレンズがある場合には、視点位置検出部(ユーザA)1−d内のパラメータであるD(ステップS5)に、距離測定部1−bで取得されるZを代入(D=Z)すれば良い。
【0084】
C.第3実施形態
次に、本発明の第3実施形態について説明する。
本第3実施形態では、上述した、iii)常にユーザとユーザBの距離を任意の距離に一定に保つ機能を実現する。これは、2地点での映像コミュニケーションにおいて、ユーザBとの距離感を一定に保つ技術である。例えば、ユーザAがユーザAのディプレイに対して前後に大きく動いたり、ユーザBが大きく動いてしまった際にも、ユーザAから映像中のユーザBを観察したときに、常に同じ距離にユーザBがいるように感じさせる技術である。
【0085】
一定に保たれる距離の決定方法としては、ユーザAが映像中のユーザBに対する距離を決定することと、ユーザBが決定すること、または、2人の望む距離の中間を利用することが考えられる。例えば、ユーザBがユーザAに怒っているとき、ユーザAは、できるだけユーザBを遠くにすることができ、また、ユーザBは、より切迫感や、圧迫感を与えるためにユーザB自身の映像をユーザAに近づけることができる。
【0086】
また、両者がこのように相反することを望んだ場合、これらの中間地点を選択する。このとき、他にも時間的に距離をシステム側で切り替えるなど様々な方法が考えられる。また、距離の選択は、リモコンなどを用いてシステムにユーザ自身がそれぞれ入力を行う(後述する距離選択部(ユーザA)1−f、距離選択部(ユーザB)1−g)。
【0087】
図10は、本発明の第3実施形態によるコミュニケーション装置の構成を示すブロック図である。なお、図1に対応する部分には同一の符号を付けて説明を省略する。説明を簡易にするために、ディプレイの中心にカメラレンズがあったときを考える。上述した、ii)のシステム構成に加えて、図10に示すように、距離測定部(ユーザA)1-b’を追加する。また、ユーザAが映像中のユーザBに対する距離を決定するための距離選択部(ユーザA)1−f、ユーザBが映像中のユーザAに対する距離を決定するための距離選択部(ユーザB)1−gを備えている。
【0088】
前述した通り、本第3実施形態においても、図10に示す構成を2セット用意し、双方向で使用する。距離測定部(ユーザA)1−b’は、相手側(2セットある内の一方の側)の距離測定部1−bに相当し、カメラからユーザAまでの距離D(今回は、カメラ位置=ディスプレイ位置)を測定する。また、相手側の距離測定部1−bで取得される、カメラからユーザBまでの距離をDとする。
【0089】
このとき、3次元情報生成部1−cにおけるパラメータであるD(ステップS5)に、一定に保つユーザと対話相手との距離DABから、ユーザAとディプレイとの距離Dを減算した値を代入すれば良い。すなわち、D=DAB−Dとなる。ここで、カメラとディスプレイとの中心位置がずれていた場合には、カメラ座標系をディスプレイを中心とする座標系に変換して計算する必要がある。
【0090】
上述した第1実施形態によれば、対面会話において、話しやすさや、緊張感に影響を与える重要な要素である、対話相手(ユーザB)との距離を任意に制御することができる。
【0091】
また、上述した第2実施形態によれば、対面会話と同様に、互いの実距離に合わせて互いに同じ対人距離を感じさせることができる。さらに、互いが同じ距離を共有しているため、自然に対人距離を適度に調節することや、距離の遠近によってもたらせる緊張感が感じさせられる。また、相手の映像中に映っている物を指差ししたときに、相手は、その指差しを観察して、何を指しているのか(指示対象が何かを)正しく理解することができる。
【0092】
また、上述した第3実施形態によれば、対話相手との対人距離を適度に調節することができる。すなわち、常にユーザが対話相手と望ましい(好みの)距離感に調節して会話することができる。さらに、対話相手が感じる自分自身の映像との距離感を制御することが可能であるため、対話相手に威圧感を与えたり、印象や、圧迫感を調整することができる。
【符号の説明】
【0093】
1−a 画像取得部
1−b、1−b’ 距離測定部
1−c 3次元情報生成部
1−d 視点位置検出部
1−e 視点位置画像生成部
1−f 映像表示部
1−g 距離選択部(ユーザA)
1−h 距離選択部(ユーザB)

【特許請求の範囲】
【請求項1】
2点間で互いの映像を含む情報を双方向で通信するコミュニケーション装置であって、
対話相手とその背景とを含む2次元画像を撮影する画像取得手段と、
前記対話相手と前記画像取得手段との距離を測定する距離測定手段と、
前記画像取得手段により撮影された前記2次元画像と、前記距離測定手段により測定された前記対話相手と前記画像取得手段との距離とに基づいて、当該装置側のユーザと前記対話相手の画像との距離を幾何学計算によって算出される距離より大きく、かつ、当該装置側のユーザが感じる知覚距離が大きくなるほど、その大きさの差が大きくなるように、前記対話相手とその背景とからなる多層画像に分割した3次元画像を生成する3次元画像生成手段と、
当該装置側のユーザの視点位置を検出する視点位置検出手段と、
前記視点位置検出手段により検出された、当該装置側のユーザの視点位置と、前記3次元画像生成手段により生成された、前記対話相手とその背景とからなる多層画像に分割した3次元画像とに基づいて、前記対話相手側の2次元画像を生成する視点位置画像生成手段と、
前記視点位置画像生成手段により生成された前記対話相手側の2次元画像を表示する表示手段と
を備えることを特徴とするコミュニケーション装置。
【請求項2】
前記3次元画像生成手段は、
当該装置側のユーザと前記対話相手の画像との距離をS=f(D,α)としたとき、
2次方程式S=α*(ax+bx+c)(但し、0<αかつa,b,cは、次式(1)を満たす全ての実数)、もしくは1次方程式S=α*(ax+b)(但し、数式(2)を満たす全ての実数)、もしくは指数関数を用いた式S=α*(a+b)+c(但し、数式(3)であるとき)に従って、当該装置側のユーザと前記対話相手の画像との距離を算出することを特徴とする請求項1に記載のコミュニケーション装置。
【数1】

【数2】

【数3】

【請求項3】
前記3次元画像生成手段は、
前記知覚距離として、前記距離測定手段により測定された、前記対話相手と前記画像取得手段との距離を用いる、
ことを特徴とする請求項1または2に記載のコミュニケーション装置。
【請求項4】
自装置側のユーザとの映像を撮影する第2の画像取得手段と、
自装置側のユーザと前記第2の画像取得手段との距離を測定する第2の距離測定手段と、
自装置側のユーザと前記表示手段により表示される対話相手との距離を選択するための距離選択手段と
を更に備え、
前記3次元画像生成手段は、
前記知覚距離として、前記距離選択手段により選択された距離から、前記第2の距離測定手段により測定された、前記自装置側のユーザと該ユーザの映像を撮影する前記第2の画像取得手段との距離を減算した値を用いる、
ことを特徴とする請求項3に記載のコミュニケーション装置。
【請求項5】
2点間で互いの映像を含む情報を双方向で通信するコミュニケーション方法であって、
対話相手とその背景とを含む2次元画像をカメラで撮影する画像取得ステップと、
前記対話相手と前記カメラとの距離を測定する距離測定ステップと、
前記画像取得ステップで撮影された前記2次元画像と、前記距離測定ステップで測定された前記対話相手と前記カメラとの距離とに基づいて、当該装置側のユーザと前記対話相手の画像との距離を幾何学計算によって算出される距離より大きく、かつ、当該装置側のユーザが感じる知覚距離が大きくなるほど、その大きさの差が大きくなるように、前記対話相手とその背景とからなる多層画像に分割した3次元画像を生成する3次元画像生成ステップと、
当該装置側のユーザの視点位置を検出する視点位置検出ステップと、
前記視点位置検出ステップで検出された、当該装置側のユーザの視点位置と、前記3次元画像生成ステップで生成された、前記対話相手とその背景とからなる多層画像に分割した3次元画像とに基づいて、前記対話相手側の2次元画像を生成する視点位置画像生成ステップと、
前記視点位置画像生成ステップで生成された前記対話相手側の2次元画像を表示する表示ステップと
を含むことを特徴とするコミュニケーション方法。
【請求項6】
前記3次元画像生成ステップは、
当該装置側のユーザと前記対話相手の画像との距離をS=f(D,α)としたとき、
2次方程式S=α*(ax+bx+c)(但し、0<αかつa,b,cは、次式(4)を満たす全ての実数)、もしくは1次方程式S=α*(ax+b)(但し、数式(5)を満たす全ての実数)、もしくは指数関数を用いた式S=α*(a+b)+c(但し、数式(6)であるとき)に従って、当該装置側のユーザと前記対話相手の画像との距離を算出することを特徴とする請求項5に記載のコミュニケーション方法。
【数4】

【数5】

【数6】

【請求項7】
前記3次元画像生成ステップは、
前記知覚距離として、前記距離測定ステップで測定された、前記対話相手と前記カメラとの距離を用いる、
ことを特徴とする請求項5または6に記載のコミュニケーション方法。
【請求項8】
自装置側のユーザと該ユーザの映像を撮影するカメラとの距離を測定する第2の距離測定ステップと、
自装置側のユーザと前記表示ステップで表示される対話相手との距離を選択するための距離選択ステップと
を更に備え、
前記3次元画像生成ステップは、
前記知覚距離として、前記距離選択ステップで選択された距離から、前記第2の距離測定ステップで測定された、前記自装置側のユーザと該ユーザを撮影する前記カメラとの距離を減算した値を用いる、
ことを特徴とする請求項7に記載のコミュニケーション方法。
【請求項9】
2点間で互いの映像を含む情報を双方向で通信するコミュニケーション装置のコンピュータに、
対話相手とその背景とを含む2次元画像をカメラで撮影する画像取得機能、
前記対話相手と前記カメラとの距離を測定する距離測定機能、
前記画像取得機能で撮影された前記2次元画像と、前記距離測定機能で測定された前記対話相手と前記カメラとの距離とに基づいて、当該装置側のユーザと前記対話相手の画像との距離を幾何学計算によって算出される距離より大きく、かつ、当該装置側のユーザが感じる知覚距離が大きくなるほど、その大きさの差が大きくなるように、前記対話相手とその背景とからなる多層画像に分割した3次元画像を生成する3次元画像生成機能、
当該装置側のユーザの視点位置を検出する視点位置検出機能、
前記視点位置検出機能で検出された、当該装置側のユーザの視点位置と、前記3次元画像生成機能で生成された、前記対話相手とその背景とからなる多層画像に分割した3次元画像とに基づいて、前記対話相手側の2次元画像を生成する視点位置画像生成機能、
前記視点位置画像生成機能で生成された前記対話相手側の2次元画像を表示する表示機能
を実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−85172(P2012−85172A)
【公開日】平成24年4月26日(2012.4.26)
【国際特許分類】
【出願番号】特願2010−230757(P2010−230757)
【出願日】平成22年10月13日(2010.10.13)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】