説明

画像処理装置および方法、補完画像生成装置および方法、プログラム、並びに記録媒体

【課題】低コストで、より広範囲の空間の多数の視点から見た画像を提供することができるようにする。
【解決手段】複数のカメラにより被写体の画像を撮影する撮影部と、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部と、前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成する任意点画像生成部とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本技術は、画像処理装置および方法、補完画像生成装置および方法、プログラム、並びに記録媒体に関し、特に、低コストで、より広範囲の空間の多数の視点から見た画像を提供することができるようにする画像処理装置および方法、補完画像生成装置および方法、プログラム、並びに記録媒体に関する。
【背景技術】
【0002】
従来の、CRT(Cathod Ray Tube)や液晶パネル、プロジェクタなどを利用したディスプレイにおいては、例えば、ビデオカメラ(以下、適宜、単に、カメラともいう)で撮像された画像が表示される。しかし、その画像は、例えば、カメラの位置を視点として見たものにすぎなかった。
【0003】
従って、ユーザが、例えば、頭部を移動して、ディスプレイに表示された画像を見るときの視点を変えても、ディスプレイに表示される画像は、カメラのレンズ中心(以下、適宜、カメラの視点ともいう)から見た画像のままである。
【0004】
そこで、出願人は、CGなどではない実写の画像であっても、容易に、ユーザの視点に応じて変化させることができるようにする技術を提案した(例えば、特許文献1参照)。特許文献1の技術によれば、ユーザの視点の変化に応じて、ディスプレイに表示される画像を変化させるようにすることができる。
【0005】
また、複数カメラによって撮影された映像により被写体の3次元形状を推定し、そこにテクスチャを貼り付けてコンピュータグラフィクスとして任意の視点から見た映像を再構成する技術も提案されている(例えば、非特許文献1参照)。
【0006】
さらに、スーパーボウル(アメリカンフットボール)が開催されたスタジアムにおいて、フィールドを取り囲むようにカメラを配置し、リプレイしたいシーンにおいて、視点を自由に切り替えて提示することも提案されている(例えば、非特許文献2参照)。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特許第4211292号公報
【非特許文献】
【0008】
【非特許文献1】T.Kanade and P.J.NarayananP.W.Rander. Virtualized Reality: Constructing Virtual Worlds from Real Scenes. IEEE Multimedia, Vol.4, No.1, pp.34-47, 1997.
【非特許文献2】I.Kitahara, H.Saito, S.Akimichi, T.Ono, Y.Ohta and T.Kanade. Large-scale Virtualized Reality. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR2001), 2001.
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、非特許文献1の技術のように、ステレオマッチングによる3次元の被写体モデルを推定する方式は、人間の頭髪など、モデル化が難しい部分で失敗する可能性がある。このようにモデル化が失敗すると、映像としても大きく破綻するという問題があった。
【0010】
また、テクスチャの貼り付けなどに係る処理負荷は大きく、処理の簡素化が期待される。
【0011】
さらに、非特許文献2の技術の場合、視点を切り替えることができるのは、実際にカメラが配置されている場所のみであり、実際に面白味のある映像を提供するためには、コストがかかるという問題があった。
【0012】
本技術はこのような状況に鑑みてなされたものであり、低コストで、より広範囲の空間の多数の視点から見た画像を提供することができるようにするものである。
【課題を解決するための手段】
【0013】
本技術の第1の側面は、複数のカメラにより被写体の画像を撮影する撮影部と、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部と、前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成する任意点画像生成部とを備える画像処理装置である。
【0014】
前記画像補完部は、前記複数のカメラのうちの3台を頂点とした三角形の面内の任意の位置において撮影された画像を補完するようにすることができる。
【0015】
前記画像補完部は、前記複数のカメラのうちの3台を特定し、前記3台のカメラのうちの2台の組み合わせを3通り設定し、前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完するようにすることができる。
【0016】
前記画像補完部は、複数のカメラにより撮影された画像の領域を、前記画像を構成する画素の色に基づいてクラス分けして、同一のクラスに属する画素の領域を単位領域とし、前記単位領域毎に画素を移動させて貼り付けることにより前記画像を補完するようにすることができる。
【0017】
任意点画像生成部は、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点に仮想的なカメラであるバーチャルカメラを配置し、前記バーチャルカメラの焦点とフィルム面を通る直線に基づいて、前記カメラ面画像の中から適当な画像を選択し、前記選択された画像を撮影したカメラの焦点とフィルム面を通る直線、および前記バーチャルカメラの焦点とフィルム面を通る直線に基づいて、前記選択された画像の中から適当な画素を選択し、前記選択された画素により前記バーチャルカメラで撮影された画像を構成することで、前記任意の点から撮影された被写体の画像を生成するようにすることができる。
【0018】
前記撮影部は、前記複数のカメラのうち、2台のカメラのレンズに入射する光の光軸の交点を特定し、前記交点を焦点とするように、他のカメラの向きを移動させるようにすることができる。
【0019】
本技術の第1の側面は、撮影部が、複数のカメラにより被写体の画像を撮影し、画像補完部が、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完し、任意点画像生成部が、前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成するステップを含む画像処理装置である。
【0020】
本技術の第1の側面は、コンピュータを、複数のカメラにより被写体の画像を撮影する撮影部と、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部と、前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成する任意点画像生成部とを備える画像処理装置として機能させるプログラムである。
【0021】
本技術の第1の側面においては、複数のカメラにより被写体の画像が撮影され、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像が補完され、前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像が生成される。
【0022】
本技術の第2の側面は、複数のカメラにより被写体の画像を撮影する撮影部と、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部とを備え、前記画像補完部は、前記複数のカメラのうちの3台を特定し、前記3台のカメラのうちの2台の組み合わせを3通り設定し、前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する補完画像生成装置である。
【0023】
前記画像補完部は、複数のカメラにより撮影された画像の領域を、前記画像を構成する画素の色に基づいてクラス分けして、同一のクラスに属する画素の領域を単位領域とし、前記単位領域毎に画素を移動させて貼り付けることにより前記画像を補完するようにすることができる。
【0024】
本技術の第2の側面は、撮影部が、複数のカメラにより被写体の画像を撮影し、画像補完部が、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完するステップを含み、前記複数のカメラのうちの3台が特定され、前記3台のカメラのうちの2台の組み合わせが3通り設定され、前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量が算出され、前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量が算出され、前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量が算出され、前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量が決定され、前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルが特定され、前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像が補完される補完画像生成方法である。
【0025】
本技術の第2の側面は、コンピュータを、複数のカメラにより被写体の画像を撮影する撮影部と、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部とを備え、前記画像補完部は、前記複数のカメラのうちの3台を特定し、前記3台のカメラのうちの2台の組み合わせを3通り設定し、前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する補完画像生成装置として機能させるプログラムである。
【0026】
本技術の第2の側面においては、複数のカメラにより被写体の画像が撮影され、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像が補完され、前記複数のカメラのうちの3台が特定され、前記3台のカメラのうちの2台の組み合わせが3通り設定され、前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量が算出され、前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量が算出され、前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量が算出され、前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量が決定され、前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルが特定され、前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像が補完される。
【発明の効果】
【0027】
本技術によれば、低コストで、より広範囲の空間の多数の視点から見た画像を提供することができる。
【図面の簡単な説明】
【0028】
【図1】従来の画像の視点を説明する図である。
【図2】多視点ディスプレイを実現する画像表示装置の一実施の形態の構成例を示す図である。
【図3】図2の画像表示装置における多視点の画像の表示を説明する図である。
【図4】各視点における画像の生成を説明する図である。
【図5】ステレオ撮影された画像の例を示す図である。
【図6】EPIによる画像の補完の例を説明する図である。
【図7】実際のカメラの配置の例を示す図である。
【図8】実際のカメラと補完カメラの配置の例を示す図である。
【図9】3点補完方式におけるカメラの位置および画像の視差の関係を説明する図である。
【図10】サッカースタジアムにおけるカメラ面と、各視点の画像について説明する図である。
【図11】バーチャルカメラを配置可能な位置を説明する図である。
【図12】バーチャルカメラの配置位置の制限を説明する図である。
【図13】バーチャルカメラの配置位置の制限を説明する図である。
【図14】本技術の一実施の形態に係る画像処理装置の構成例を示すブロック図である。
【図15】図14の補完カメラ画像生成部の詳細な構成例を示すブロック図である。
【図16】図13の視点画像生成部の詳細な構成例を示すブロック図である。
【図17】画像提示処理の例を説明するフローチャートである。
【図18】カメラ面画像生成処理の例を説明するフローチャートである。
【図19】視点画像生成処理の例を説明するフローチャートである。
【図20】本技術の一実施の形態に係る補完画像生成装置の構成例を示すブロック図である。
【図21】パーソナルコンピュータの構成例を示すブロック図である。
【発明を実施するための形態】
【0029】
以下、図面を参照して、ここで開示する技術の実施の形態について説明する。
【0030】
従来の、液晶パネル、プロジェクタなどを利用したディスプレイにおいては、例えば、ビデオカメラ(以下、適宜、単に、カメラともいう)で撮像された画像が表示されるが、その画像は、図1に示すように、カメラの位置を視点として見たものにすぎなかった。
【0031】
従って、ユーザが、例えば、頭部を移動して、ディスプレイに表示された画像を見るときの視点を変えても、ディスプレイに表示される画像は、カメラのレンズ中心(以下、適宜、カメラの視点ともいう)から見た画像のままであり、ユーザの視点の変化に応じて、ディスプレイに表示される画像が変化することはなかった。
【0032】
図2は、多視点ディスプレイを実現する画像表示装置の一実施の形態の構成例を示している。
【0033】
コンピュータ1は、画像データベース2に記憶された原画像データを、中間データに変換し、中間データベース3に記憶させる。また、コンピュータ1は、位置センサとしてのレシーバ4およびトランスミッタ5を制御し、レシーバ4の出力に基づいて、ユーザの位置(さらには、必要に応じて姿勢)を検出する。
【0034】
さらに、コンピュータ1は、ユーザの位置を、ユーザの視点の位置として設定し、中間データベース3に記憶された中間データを、そのユーザの視点から見た画像データ(以下、適宜、提示用画像データという)に変換する。そして、コンピュータ1は、提示用画像データを、ディスプレイ6に供給して表示させる。
【0035】
画像データベース2は、後述するように、カメラ等の撮像装置で撮像された実写の画像データとしての原画像データを記憶している。中間データベース3は、コンピュータ1から供給される、原画像データを変換した中間データを記憶する。
【0036】
レシーバ4は、ユーザに装着されており、トランスミッタ5が発生する磁界を検知し、その磁界の強度を、コンピュータ1に供給する。トランスミッタ5は、コンピュータ1の制御にしたがい、磁界を発生する。即ち、図2の実施の形態では、レシーバ4およびトランスミッタ5は、位置センサとしての磁界センサを構成しており、レシーバ4が、トランスミッタが発生する磁界の強度を計測することにより、レシーバ4の位置、ひいては、ユーザの位置が検出されるようになっている。
【0037】
ここで、レシーバ4は、例えば、ユーザの頭部に装着される。また、ユーザが、例えば、ネクタイピンを着用していたり、または眼鏡をかけている場合には、レシーバ4は、そのネクタイピンや眼鏡のフレームに装着することができる。
【0038】
なお、位置センサである磁界センサとしては、例えば、ポヒマス(Polhemus)社の3次元位置センサなどを採用することができる。
【0039】
また、位置センサとしては、磁界センサの他、例えば、機械リンク式の位置計測手段(例えば、3次元ディジタイザなど)を採用することが可能である。さらに、位置センサとしては、例えば、ジョイスティックやトラックボールなどの、ユーザの位置の変化を入力することのできる手段を採用することも可能である。すなわち、ここでは、位置センサは、必ずしも実際のユーザの位置を検知する必要はなく、例えば、仮想的なユーザの位置を入力することができるものとしてもよい。
【0040】
ディスプレイ6は、例えば、例えば、液晶パネルなどで構成され、コンピュータ1から供給される提示用画像データを表示する。なお、ディスプレイ6としては、CRTや液晶パネル以外に、例えば、プロジェクタやHMD(Head Mount Display)などを採用することが可能である。
【0041】
図2の画像表示装置では、例えば、図3Aに示すように、現実世界において、ユーザが、ある被写体を観察する場合と同様の提示用画像データが表示される。
【0042】
即ち、現実世界において、ユーザが、ある被写体を観察する場合には、ユーザが、その視点を移動すると、ユーザは、その移動後の視点から見た被写体を観察することができる。具体的には、現実世界では、ユーザが、その視点を移動することによって、被写体の見える部分と見えない部分が変化する。
【0043】
図2の画像表示装置においても、図3Bに示すように、ユーザが、その視点を移動した場合、その視点に応じて、ディスプレイ6に表示される提示用画像データが、現実世界においてユーザの視覚に映る被写体が表示されたものとなるようになっている。即ち、図2の画像表示装置においては、図3Cに示すように、ユーザが視点を移動した場合に、その視点から被写体を見た場合の提示用画像データが表示されるようになっている。
【0044】
従って、図2の画像表示装置では、ユーザが視点を移動すると、例えば、移動前の視点からでは見えなかった被写体の部分が見える状態となった提示用画像データが表示される。すなわち、ユーザが、ディスプレイ6における提示用画像データに表示された被写体をのぞき込むように、視点を移動すると、現実世界において、その移動後の視点から被写体を見た場合に視覚に映るのと同様の提示用画像データが表示される。このことから、図2の画像表示装置は、多視点ディスプレイということができる。
【0045】
次に、多視点の画像を生成する方式について説明する。
【0046】
いま、被写体を囲む局面Ωを考える。視点Pから被写体を見たときの光線の軌跡(被写体から視点Pに入射する光線の軌跡)は、視点Pと被写体上の各点とを結ぶ直線によって表現することができる。この光線は、必ず、曲面Ωと交わる。
【0047】
曲面Ω上の全ての視点において取得した画像を得ることができれば、視点Pと被写体上の各点とを結ぶ直線で表される光線に対応する画素値を得ることができる。従って、曲面Ω上の全ての視点において取得した画像を得ることができれば、それらの画像の画素値を用いて、被写体を曲面内の任意の視点から見た画像を生成することができる。
【0048】
例えば、視点Pと被写体上のある点Riとを結ぶ直線Liに注目し、その直線Liと曲面Ωとの交点をQiと表す。ここで、曲面Ω上の任意の点を視点として、被写体を撮像した画像データが、データベースに記憶されているものとする。
【0049】
光線は直進し、かつ減衰しないことを前提とすると、被写体上の点Riから、曲面Ω上の点Qiに入射する光線と、視点Pに入射する光線とは、同一である。従って、視点Pから被写体を見た場合、その被写体上の点Riから視点Pに向かう光線に対応する画素値は、被写体上の点Riから曲面Ω上の点Qiに向かう光線に対応する画素値に一致し、この画素値は、データベースに記憶されている。
【0050】
以上より、視点Pから、被写体上の点Riを見たときの画素値は、曲面Ω上の点Qiを視点として撮像された画像データから得ることができる。
【0051】
例えば、図4に示されるように被写体を囲む曲面Ω上にカメラCa1乃至カメラCa7が配置されていたものとする。この場合、視点P1から、被写体上の点Riを見たときの画素値は、曲面Ω上の点Qiを視点として撮像された画像データから得ることができるので、カメラCa2により撮影された画像データから得ることができる。
【0052】
一方、視点P2から、被写体上の点Riを見たときの画素値は、曲面Ω上の点Qiを視点として撮像された画像データから得ることができるが、カメラCa3とカメラCa4の間にカメラが配置されていないので画像データを得ることができない。同様に、視点P3から、被写体上の点Riを見たときの画素値は、曲面Ω上の点Qiを視点として撮像された画像データから得ることができるが、カメラCa4とカメラCa5の間にカメラが配置されていないので画像データを得ることができない。
【0053】
このように、図4の形態では、視点P1から被写体上の点Riを見たときの画素値を得ることはできるが、視点P2や視点P3から被写体上の点Riを見たときの画素値を得ることができない。このため、多視点の画像を生成することはできるが、任意の視点の画像を生成することはできない。
【0054】
任意の視点の画像を生成するためには、例えば、図4の曲面Ω上の全ての位置にカメラを配置することが必要であるようにも思われる。しかし、実際には、カメラCa1乃至カメラCa7により撮影された画像を用いて曲面Ω上の全ての位置から撮影した画像を補完することができる。
【0055】
図5は、ステレオ撮影された画像の幾何的な特性を説明する図である。同図の右側の図および左側の図は、同一の被写体(ライオンの像)を、それぞれ異なる角度からカメラで撮影した画像の例を示している。
【0056】
すなわち、図5はステレオ撮影された画像の例を示している。
【0057】
図中の右側の画像32は、図中の左側の画像31を撮影したカメラの位置より右方向にカメラを移動させて被写体を撮影した画像である。この場合、画像31と画像32におけるカメラの位置は、被写体からの距離が同一であって、地面からの高さも同一であるものとする。
【0058】
このように、カメラを水平右側に移動させて画像を撮影すると、撮影された画像の中の被写体の画素は水平左側に移動する。
【0059】
例えば、画像31の中の矩形の枠41で示されるライオンの顔の画像を構成する画素は、画像32において、図中左側に移動している。
【0060】
このように、ステレオ撮影された画像においては、上述のように、カメラの移動方向と平行に画素が移動するという幾何的な特性を有している。
【0061】
このような画像の幾何的な特性に基づいて、視点(すなわちカメラの位置)を平行移動させた画像を生成することが可能である。このようにして生成(補完)される画像は、エピポーラ平面画像(EPI)と称される。
【0062】
EPIによれば、例えば、2つの異なる位置に配置されたカメラの画像により、カメラをそれぞれの位置の間を水平に移動させて撮影される画像を仮想的に生成し、本来取得できなかった画像を補完することが可能となる。また、同様に、2つの異なる位置に配置されたカメラの画像により、カメラをそれぞれの位置の間を垂直に移動させて撮影される画像を仮想的に生成し、本来取得できなかった画像を補完することが可能となる。
【0063】
例えば、図6に示されるように、位置A乃至位置Dのそれぞれ4点に実際にカメラを配置する。位置Aと位置Bは、水平方向に距離Lだけ離れており、垂直方向の位置は同じであるとする。また、位置Cと位置Dは、水平方向に距離Lだけ離れており、垂直方向の位置は同じであるとする。
【0064】
従って、位置Aと位置Bの間の位置A´、位置A´´、位置B´´、および位置B´にカメラを配置して撮影した場合に得られる画像は、位置Aのカメラにより撮影された画像と位置Bのカメラにより撮影された画像によって補完できる。また、位置Cと位置Dの間の位置C´、位置C´´、位置D´´、および位置D´にカメラを配置して撮影した場合に得られる画像は、位置Cのカメラにより撮影された画像と位置Dのカメラにより撮影された画像によって補完できる。このようにして、EPIによる水平方向の画像の補完を行うことができる。
【0065】
さらに、位置Aと位置C、または、位置Bと位置Dは、それぞれ垂直方向に距離Lだけ離れており、水平方向の位置は同じであるとする。そうすると、位置Aと位置Cの間の位置、または、位置Bと位置Dの間の位置のそれぞれについても、EPIによる垂直方向の画像の補完を行うことができる。
【0066】
また、EPIによる水平方向の補完により得られた画像に基づいて、垂直方向の画像の補完を行うこともできる。例えば、位置A´と位置C´の間の位置にカメラを配置して撮影した場合に得られる画像は、位置A´のカメラにより撮影された画像と位置C´のカメラにより撮影された画像によって補完できる。同様にして、位置A´´と位置C´´の間の位置にカメラを配置して撮影した場合に得られる画像、位置B´´と位置D´´の間の位置にカメラを配置して撮影した場合に得られる画像、位置B´と位置D´の間の位置にカメラを配置して撮影した場合に得られる画像のそれぞれも補完できる。
【0067】
すなわち、正方形ABCDの各頂点にそれぞれ配置された4つのカメラの画像を用いたEPIにより、正方形ABCDの面内の各位置から撮影された画像を補完することが可能である。つまり、例えば、図4のカメラCa1乃至カメラCa7により撮影された画像を用いて曲面Ω上の全ての位置から撮影した画像を補完することができるのである。
【0068】
しかしながら、上述した画像の補完の方式(4点補完方式と称することにする)には、次のような問題がある。
【0069】
例えば、4点補完方式では演算量が膨大になり、処理負荷、処理時間が増大するという問題がある。例えば、図6の例の場合、位置Aと位置Bの間の水平方向の補完、および、位置Cと位置Dの間の水平方向の補完を完了させた後、垂直方向の補完のための演算を多数実行する必要がある。
【0070】
また、例えば、4点補完方式ではロバスト性に欠けるという問題がある。すなわち、図6における位置A´と位置C´の間の垂直方向の補完は、もともと、水平方向の補完により得られた位置A´の画像と位置C´の画像に基づいて行われることになる。例えば、位置A´の画像、または、位置C´の画像が補完される際に、誤差などのエラーなどが発生した場合、垂直方向の補完によって生成される画像のそれぞれには、そのエラーが伝搬されることになる。
【0071】
そこで、本技術においては、次に述べるような方式を採用することにする。
【0072】
例えば、図7に示されるようにカメラを配置する。図7中の黒い丸によりカメラの配置位置が示されており、これらのカメラにより、実際に画像が撮影されるものとされる。同図の例では、各カメラを頂点とする三角形が示されている。本技術では、三角形の頂点に配置された3つのカメラにより撮影されたそれぞれの画像に基づいて、当該三角形の面内の任意の位置に配置されたカメラで撮影された画像を補完する。
【0073】
すなわち、例えば、図8に示されるように、実際には配置されていないカメラにより画像が撮影されるようにする。図8においては、図中の黒い丸によりカメラの配置位置が示されており、図中の白い丸により補完された画像に対応するカメラの配置位置が示されている。なお、ここでは、補完された画像に対応するカメラを補完カメラと称することにする。
【0074】
例えば、被写体を囲むように実際のカメラを配置し、図8に示されるように補完カメラが配置された状態においては、図4を参照して上述した曲面Ω上の任意の一点で撮影された画像データを得ることができることになる。以下においては、実際のカメラと補完カメラにより形成される面(曲面)をカメラ面と称することにする。
【0075】
三角形の頂点に配置された3つのカメラにより撮影されたそれぞれの画像に基づく当該三角形の面内の任意の位置に配置されたカメラで撮影された画像の補完は、次のようにして行うことができる。
【0076】
例えば、図9に示されるように、三角形の頂点となる位置に実際のカメラであるカメラA、カメラB、カメラCを配置する。同図には、カメラAにより撮影された画像101、カメラBにより撮影された画像102、カメラCにより撮影された画像103が示されている。この例では、画像101乃至画像103のそれぞれは、サッカーボールの背景にグラウンド、校舎などが表示された画像とされている。
【0077】
図5を参照して上述した場合と同様に、画像101乃至画像103において、サッカーボールが表示されている位置のそれぞれは、カメラA、カメラB、カメラCの位置に応じてずれている。例えば、画像101において、サッカーボールは画像の右下に表示されているが、画像102において、サッカーボールは画像の左下に表示されている。さらに、画像103においては、サッカーボールは画像のほぼ中央に表示されている。
【0078】
背景の画像を固定し、画像101乃至画像103におけるサッカーボールの画像を重ね合わせて表示すると、画像110のようになる。画像110においては、3つのサッカーボールの画像が重ねられて表示されている。3つのサッカーボールの中心点どうしを結ぶ直線が画像101乃至画像103のそれぞれの画像における視差を表すベクトルとなる。
【0079】
すなわち、画像110に示される3つのサッカーボールの中心点どうしを結ぶ直線により構成される三角形の各辺がカメラ位置による視差を表す視差ベクトルになる。この三角形の1辺は、カメラAとカメラBとの視差を表すベクトル(AB間視差ベクトル)となり、別の1辺は、カメラBとカメラCとの視差を表すベクトル(BC間視差ベクトル)となり、さらに別の1辺は、カメラAとカメラCとの視差を表すベクトル(AC間視差ベクトル)となる。
【0080】
一方、実際のカメラであるカメラA乃至カメラCにおいて、各カメラのレンズの中心点を結ぶ直線により、各カメラの位置を表すベクトルが得られる。例えば、カメラAおよびカメラBのそれぞれのレンズの中心点を結ぶ直線により、カメラAの位置からカメラBの位置までの距離と方向を表すベクトル(ABベクトル)が構成される。また、カメラBおよびカメラCのそれぞれのレンズの中心点を結ぶ直線により、カメラBの位置からカメラCの位置までの距離と方向を表すベクトル(BCベクトル)が構成される。さらに、カメラAおよびカメラCのそれぞれのレンズの中心点を結ぶ直線により、カメラAの位置からカメラCの位置までの距離と方向を表すベクトル(ACベクトル)が構成される。
【0081】
そうすると、例えば、画像101と画像102における被写体(例えば、サッカーボール)のずれ量は、(AB間視差ベクトル)/(ABベクトル)として算出することができる。また、画像102と画像103における被写体(例えば、サッカーボール)のずれ量は、(BC間視差ベクトル)/(BCベクトル)として算出することができる。さらに、画像101と画像103における被写体(例えば、サッカーボール)のずれ量は、(AC間視差ベクトル)/(ACベクトル)として算出することができる。
【0082】
なお、上記の3種類の計算のうち、いずれの計算を行った場合も、ずれ量は同一となるはずであるが、誤差が生じる場合もある。例えば、上記の3種類の計算の結果の中央値を算出し、その値をずれ量とすることで、誤差の発生を抑制することができる。
【0083】
例えば、図9のカメラKにより撮影された画像における被写体の画素位置を算出する場合、カメラAおよびカメラKのそれぞれのレンズの中心点を結ぶAKベクトルに、上述のようにして得られたずれ量を乗じて得られたベクトルによって画素位置を特定することができる。つまり、画像101のサッカーボールの画素を、AKベクトルにずれ量を乗じて得られたベクトルにより定まる位置に移動させる。
【0084】
なお、図9においては、カメラA、カメラB、カメラCがほぼ正三角形の頂点となる位置に配置されている例について説明したが、必ずしも正三角形とする必要はない。
【0085】
このようにして、補完カメラの画像を生成することができる。上述したように、本技術では、三角形の面内の任意の位置で撮影された画像を補完することができ、この方式を3点補完方式と称することにする。3点補完方式は、4点補完方式の場合と異なり、例えば、水平方向の補完を完了させた後、垂直方向の補完のための演算を行うなどする必要がなく、演算量、処理負荷、処理時間を抑制することができる。また、3点補完方式は、4点補完方式の場合と異なり、誤差などのエラーなどが発生した場合、そのエラーが伝搬されるなどの問題もなく、ロバスト性に富んでいる。
【0086】
さらに、本技術によれば、実際のカメラにより撮影された画像と補完カメラにより撮影された画像を用いて多視点の画像を生成することが可能となる。図10は、本技術により多視点の画像を生成する例を示す図である。
【0087】
例えば、図10に示されるように、サッカースタジアムを囲むように実際のカメラを配置する。この例では、図中の黒い丸により実際のカメラが示されている。上述したように、実際のカメラにより撮影された画像を用いて3点補完方式により補完カメラの画像が補完され、曲面Ωにカメラ面が構成される。この際、実際のカメラの焦点は、全てスタジアム内の一点に向けられているものとする。
【0088】
なお、図10の例では、カメラが水平方向に一列に並べられて表現されているが、実際には図7や図8を参照して上述した3点補完方式を採用することができるように、垂直方向(紙面の奥行方向)にもカメラが並べられているものとする。
【0089】
また、カメラ面は、実際には、図8に示されるような平面ではなく曲面であるものの、3点補完方式により補完カメラの画像が補完される際には、実際のカメラ3台により構成される三角形を個々に平面とみなすことができる。よって、図10に示されるような曲面状のカメラ面であっても、図7や図8を参照して上述した3点補完方式を採用することができる
【0090】
いま、プレーヤーAに近い視点P1からみた画像と、プレーヤーBに近い視点P2から見た画像を生成する場合を考える。この場合、視点P1または視点P2に仮想的なカメラ(バーチャルカメラ)を配置して画像を撮影することで、視点P1または視点P2からみた画像を得るようにする。
【0091】
ここで、バーチャルカメラをピンホールカメラとし、そのピンホールカメラの内部のフィルムまたはCCDにより画素が記録されていると考える。例えば、バーチャルカメラのフィルム(CCD)面を構成する個々の画素の画素値は、バーチャルカメラの焦点(ピンホール)とフィルム面の各画素とを結んだ直線と平行な光線により定まる。つまり、バーチャルカメラの解像度に応じた個数の画素のそれぞれについて、画素と焦点とを結ぶ直線を特定していけば、各画素の画素に入射する光線を特定することができる。
【0092】
光が減衰しないものと仮定すると、バーチャルカメラの焦点とフィルム面の各画素とを結んだ直線を曲面Ωまで延長すれば、その直線と曲面Ωの交点に、バーチャルカメラの各画素に入射した光線が入射していることになる。つまり、カメラ面(曲面Ω)上の1点で撮影された画像の画素を用いて、バーチャルカメラの画素を1つずつ構成することができる。
【0093】
すなわち、バーチャルカメラのある画素を生成する場合、まずその画素と焦点を結ぶ直線(この直線をLvと称することにする)をカメラ面まで延長し、実際のカメラまたは補完カメラのうち、直線Lvとカメラ面との交点に一番近いカメラを選択する。そして、選択された実際のカメラまたは補完カメラの焦点を起点とした、直線Lvと平行な半直線Lwを引く。なお、実際のカメラまたは補完カメラにも、焦点とフィルム(CCD)面が存在する。
【0094】
そして、半直線Lwと選択された実際のカメラまたは補完カメラのフィルム面の交点に一番近い画素を、バーチャルカメラにおける当該画素として抽出する。この画素は、実際のカメラの画像または補完カメラの画像を構成する複数の画素の中の1つの画素として特定される。
【0095】
このように、カメラ面のカメラにより撮影された画像の画素を個々に抽出していくことによりバーチャルカメラにより撮影された画像が生成される。これにより、視点P1や視点P2からみた画像が生成されるのである。
【0096】
いま、水平方向のみについて考えた場合、カメラ面の最も左に配置された実際のカメラの撮影範囲内に位置し、かつカメラ面の最も右に配置された実際のカメラの撮影範囲内に位置する被写体を撮影するものであれば、任意の位置から見た画像を生成することができる。すなわち、例えば、図11に示されるように、サッカースタジアムの周囲に配置された実際のカメラのそれぞれに共通する撮影範囲である空間RCの内部であれば、バーチャルカメラを配置することが可能である。
【0097】
例えば、サッカーの試合を中継する際に、実際のカメラによりボールを追いかけるように画像を撮影すれば、空間RCはボールとともに移動することになる。その結果、例えば、ボールの周辺の様々な位置にバーチャルカメラを配置して、それらの視点からみた迫力のある画像を視聴者に提示することができる。
【0098】
実際のカメラの台数が多い場合、カメラの台数分のカメラマンを集めることが難しい場合もある。このような場合、例えば、任意の2台のカメラのレンズの中心および焦点を通る直線が交わる点を焦点とするように、他のカメラが自動的に操作されるようにするとよい。つまり、少なくとも2台のカメラのレンズに入射する光の光軸が交差する点を求めることができれば、他のカメラはその点を焦点として追随させるようにすれば、全てのカメラでほぼ同じ場所の被写体を撮影するようにすることができるのである。
【0099】
このようにすることで、少なくとも2人のカメラマンがカメラを操作することにより、空間RCをボールとともに移動させることが可能になる。
【0100】
また、例えば、サッカースタジアムの周囲を全て囲むように実際のカメラを配置すれば、ピッチのどの位置にもバーチャルカメラを配置することが可能である。
【0101】
ただし、サッカースタジアムの真上や真下に実際のカメラを配置することはできないと考えられるので、水平方向のカメラ位置は自由に選択できるものの、垂直方向のカメラ位置は制限される。
【0102】
例えば、図12に示されるように、カメラ面において、垂直方向にカメラCa1乃至カメラCa5が配置されているものとする。なお、カメラCa1乃至カメラCa5は、実際のカメラであってもよいし、補完カメラであってもよい。図12の例では、バーチャルカメラVCを被写体である人物の顔の高さとほぼ同等の位置に配置している。この場合、バーチャルカメラVCの焦点を通りフィルム面の各画素に入射する光は、全てカメラCa1乃至カメラCa5に入射している。従って、カメラ面のカメラで撮影された画像に基づいて、バーチャルカメラVCで撮影された画像を生成することができる。
【0103】
一方、例えば、図13に示されるようにバーチャルカメラVCを被写体である人物の足元に配置した場合、バーチャルカメラVCの焦点を通りフィルム面の各画素に入射する光の一部はカメラCa1乃至カメラCa5に入射しない。図13の場合、バーチャルカメラVCの上方向から入射する光は、カメラ面のカメラに入射していないので、例えば、バーチャルカメラVCで撮影された画像において、画面のほぼ上半分程度の画素を生成できないことになる。
【0104】
このように、バーチャルカメラを配置する場合、垂直方向のカメラ位置は制限される。
【0105】
なお、ここでは、サッカースタジアムの周囲に実際のカメラを配置する例について説明したが、例えば、コンサートホールの周囲に実際のカメラを配置するなど他の実施例も考えられる。
【0106】
図14は、本技術を適用した画像処理装置の一実施の形態に係る構成例を示すブロック図である。同図に示される画像処理装置200は、撮像部201、補完カメラ画像生成部202、視点画像生成部203、および画像提示部204により構成されている。
【0107】
同図において、撮像部201は、カメラ1乃至カメラnを有する構成とされている。ここで、カメラ1乃至カメラnは実際のカメラとされ、例えば、図10の場合のように、サッカースタジアムの周囲に配置される。また、カメラ1乃至カメラnは、図7や図8を参照して上述した3点補完方式を採用することができるように、垂直方向、水平方向に所定の距離をとって配置されるものとする。
【0108】
撮像部201は、カメラ1乃至カメラnにより撮影された画像のデータを補完カメラ画像生成部202に供給する。なお、カメラ1乃至カメラnにより撮影された画像のデータのそれぞれは、各カメラのカメラ面上での位置を特定する情報(例えば、カメラの座標位置)に対応付けられて供給される。
【0109】
補完カメラ画像生成部202は、カメラ1乃至カメラnにより撮影された画像のデータに基づいて、補完カメラの画像を生成する。このとき、図7や図8を参照して上述した3点補完方式により補完カメラの画像が生成される。これにより、カメラ面の各位置で撮影された画像が記録されることになる。
【0110】
視点画像生成部203は、例えば、ユーザの所望の視点の入力を受け付け、当該視点における画像を生成する。視点画像生成部203は、例えば、図10に示される視点P1、視点P2などの入力を受け付け、それらの視点においてバーチャルカメラで撮影された画像を生成することで、ユーザの所望の視点の画像を生成する。
【0111】
画像提示部204は、視点画像生成部203により生成された画像を、図示せぬディスプレイなどに提示する。これにより、ユーザは、所望の視点画像を見ることができる。
【0112】
なお、画像提示部204は、画像処理装置200とは別の装置として設けられるようにしてもよい。
【0113】
図15は、補完カメラ画像生成部202の詳細な構成例を示すブロック図である。同図に示されるように、補完カメラ画像生成部202は、ずれ量算出部211、および画素生成部212により構成されている。
【0114】
ずれ量算出部211は、AB間ずれ量判定部221−1、BC間ずれ量判定部221−2、AC間ずれ量判定部221−3、結果照合部222、およびずれ量出力部223により構成されている。
【0115】
ずれ量算出部211は、例えば、図9を参照して説明したようにずれ量を算出する。ずれ量算出部211は、いまから補完すべき画像を撮影する補完カメラの位置を特定し、その位置に応じて定まる三角形の面を特定するとともに、その三角形の頂点を構成する実際のカメラを特定する。このとき、例えば、図9のカメラA乃至カメラCが特定される。
【0116】
AB間ずれ量判定部221−1、BC間ずれ量判定部221−2、およびAC間ずれ量判定部221−3は、それぞれ上述した三角形の頂点を構成する実際のカメラにより撮影された画像のずれ量を判定(算出)する。AB間ずれ量判定部221−1、BC間ずれ量判定部221−2、およびAC間ずれ量判定部221−3は、撮影部201から供給される実際のカメラの画像を取得し、ブロックマッチング処理を行うなどして各画像において対応する画素を特定する。例えば、図9の画像101と画像102におけるサッカーボールの画素からなるブロックが各画像において対応するブロックとして特定される。
【0117】
そして、AB間ずれ量判定部221−1、BC間ずれ量判定部221−2、およびAC間ずれ量判定部221−3は、図9を参照して説明したように、各カメラ間の距離と方向を表すベクトル(ABベクトル、BCベクトル、ACベクトル)、および各カメラ間の視差を表すベクトル(AB間視差ベクトル、BC間視差ベクトル、AC間視差ベクトル)を演算する。
【0118】
その後、AB間ずれ量判定部221−1は、(AB間視差ベクトル)/(ABベクトル)によりずれ量を算出する。また、BC間ずれ量判定部221−2は、(BC間視差ベクトル)/(BCベクトル)によりずれ量を算出し、AC間ずれ量判定部221−3は、(AC間視差ベクトル)/(ACベクトル)によりずれ量を算出する。
【0119】
結果照合部222は、例えば、AB間ずれ量判定部221−1、BC間ずれ量判定部221−2、およびAC間ずれ量判定部221−3によるそれぞれの計算の結果の中央値を算出する。あるいはまた、AB間ずれ量判定部221−1、BC間ずれ量判定部221−2、およびAC間ずれ量判定部221−3の3種類の計算結果のうち、値が近い2つを選択し、その中央値が算出されるようにしてもよい。
【0120】
ずれ量出力部223は、結果照合部222から出力される値をずれ量として、画素生成部212に供給する。
【0121】
画素生成部212は、ずれ量出力部223により算出されたずれ量に基づいて、所定の位置の補完カメラの画像の画素を生成するようになされている。画素生成部212は、移動先計算部231、画素プロット部232、および画素補完部233により構成されている。
【0122】
移動先計算部231は、いまから補完すべき画像を撮影する補完カメラの位置と、上述した3点補完方式における三角形の頂点のいずれかを構成する実際のカメラの位置との間の距離と方向を表すベクトル特定する。このとき、例えば、補完カメラが図9のカメラKである場合、カメラAおよびカメラKのそれぞれのレンズの中心点を結ぶAKベクトルが特定される。そして、移動先計算部231は、例えば、AKベクトルに、ずれ量出力部223から出力されたずれ量を乗じて得られたベクトルを移動先ベクトルとして特定する。
【0123】
画素プロット部232は、実際のカメラにより撮影された画像の中の所定の画素数により構成されるブロックを抽出し、そのブロックを構成する画素を、補完カメラの画像の所定の位置に貼り付ける。このとき、画素プロット部232は、移動先計算部231により特定された移動先ベクトルに基づいて、補完カメラの画像の中で当該画素を貼り付ける位置を特定する。
【0124】
例えば、補完カメラが図9のカメラKである場合、画像101のサッカーボール上の1点である座標(x1,y1)の画素が、座標(x1,y1)を起点とした移動先ベクトルにより示される座標(x2,y2)に貼り付けられる。このとき、画素単位での移動と貼り付けが行われるようにしてもよいし、ブロック単位での移動と貼り付けが行われるようにしてもよい。
【0125】
画素補完部233は、画素プロット部232により画素を貼り付けることができない位置の画素を補完する。画素補完部233は、例えば、実際のカメラの画像において、前景に隠れていた背景の部分が、補完カメラの画像では前景に隠れないようになった場合、その背景の画素を補完する。この場合、例えば、背景を構成する近隣の画素を用いて補完される。
【0126】
図16は、図14の視点画像生成部203の詳細な構成例を示すブロック図である。同図に示されるように視点画像生成部203は、画素取得部251、および画像合成部252により構成されている。
【0127】
画素取得部251は、例えば、ユーザにより入力された視点の位置を特定し、その位置において撮影された画像の画素を、カメラ面の画像の画素の中から選択する。画素取得部251は、カメラ選択部261と画素選択部262とを有する構成とされている。
【0128】
画素取得部251は、例えば、図10の視点P1や視点P2などのように、ユーザにより入力された視点の位置を特定する。そして、画素取得部251は、上述したように、視点P1や視点P2にバーチャルカメラを配置して画像を撮影することで、視点P1や視点P2からみた画像を得るために、カメラ面のカメラと画素を選択して取得する。
【0129】
カメラ選択部261は、バーチャルカメラの画素と焦点を結ぶ直線Lvをカメラ面まで延長し、実際のカメラまたは補完カメラのうち、直線Lvとカメラ面との交点に一番近いカメラを選択する。
【0130】
画素選択部262は、カメラ選択部261により選択された実際のカメラまたは補完カメラの焦点を起点とした、直線Lvと平行な半直線Lwを引く。そして、半直線Lwと選択された実際のカメラまたは補完カメラのフィルム面の交点に一番近い画素を、バーチャルカメラにおける当該画素として抽出(選択)する。この画素は、実際のカメラの画像または補完カメラの画像を構成する複数の画素の中の1つの画素として特定される。
【0131】
画素選択部262により選択された画素は、画像合成部252に供給される。なお、このとき、選択された画素がバーチャルカメラにより撮影された画像の中のどの位置の画素であるかを特定する情報も供給される。
【0132】
画像合成部252は、画素選択部262から供給された画素を、それぞれの位置に貼り付けることでバーチャルカメラにより撮影された画像の中の個々の画素を生成していく。
【0133】
このように、バーチャルカメラにより撮影された画像を構成する画素のそれぞれが、カメラ面のカメラにより撮影された画像の画素の中から選択されていく。これにより、視点P1や視点P2からみた画像が生成されるのである。
【0134】
次に、図17のフローチャートを参照して、図14の画像処理装置200による画像提示処理の例について説明する。この処理は、例えば、ユーザにより所望の視点の画像の提示に係る指令がなされたとき実行される。
【0135】
ステップS21において、撮像部201は、カメラ1乃至カメラnによりそれぞれ画像を撮影する。これにより実際のカメラによる画像が撮影される。
【0136】
また、撮像部201は、カメラ1乃至カメラnにより撮影された画像のデータを補完カメラ画像生成部202に供給する。なお、カメラ1乃至カメラnにより撮影された画像のデータのそれぞれは、各カメラのカメラ面上での位置を特定する情報(例えば、カメラの座標位置)に対応付けられて供給される。
【0137】
ステップS22において、補完カメラ画像生成部202は、図18を参照して後述するカメラ面画像生成処理を実行する。このとき、カメラ1乃至カメラnにより撮影された画像のデータに基づいて、補完カメラの画像が、例えば、図7や図8を参照して上述した3点補完方式により生成される。これにより、カメラ面の各位置で撮影された画像が記録されることになる。
【0138】
ステップS23において、視点画像生成部203は、例えば、ユーザの所望の視点の入力を受け付ける。このとき、例えば、図10に示される視点P1、視点P2などの入力が受け付けられる。
【0139】
ステップS24において、視点画像生成部203は、図19を参照して後述する視点画像生成処理を実行する。これにより、ステップS23で受け付けられた視点における画像が生成される。例えば、図10に示される視点P1、視点P2などの入力を受け付け、それらの視点においてバーチャルカメラで撮影された画像を生成することで、ユーザの所望の視点の画像が生成される。
【0140】
ステップS25において、画像提示部204は、ステップS24の処理で生成された画像を、図示せぬディスプレイなどに提示する。これにより、ユーザは、所望の視点画像を見ることができる。
【0141】
このようにして、画像提示処理が実行される。
【0142】
次に、図18のフローチャートを参照して、図17のステップS22のカメラ面画像生成処理の詳細な例について説明する。
【0143】
ステップS41において、ずれ量算出部211は、いまから補完すべき画像を撮影する補完カメラの位置を特定する。
【0144】
ステップS42において、ずれ量算出部211は、ステップS41で特定された位置に応じて定まる三角形の面を特定するとともに、その三角形の頂点を構成する実際のカメラを特定する。このとき、例えば、図9のカメラA乃至カメラCが特定される。
【0145】
ステップS43において、AB間ずれ量判定部221−1は、上述したように、(AB間視差ベクトル)/(ABベクトル)によりずれ量(AB間ずれ量)を算出する。
【0146】
ステップS44において、BC間ずれ量判定部221−2は、上述したように、(BC間視差ベクトル)/(BCベクトル)によりずれ量(BC間ずれ量)を算出する。
【0147】
ステップS45において、AC間ずれ量判定部221−3は、上述したように、(AC間視差ベクトル)/(ACベクトル)によりずれ量(AC間ずれ量)を算出する。
【0148】
ステップS46において、結果照合部222は、ずれ量を決定する。例えば、ステップS43乃至ステップS45の処理で得られたそれぞれのずれ量の中央値が算出されてずれ量が決定される。あるいはまた、3種類のずれ量のうち、値が近い2つが選択され、その中央値が算出されるようにしてもよい。
【0149】
このずれ量は、ずれ量出力部223により画素生成部212に出力される。
【0150】
ステップS47において、移動先計算部231は、移動先ベクトルを特定する。このとき、例えば、補完カメラが図9のカメラKである場合、カメラAおよびカメラKのそれぞれのレンズの中心点を結ぶAKベクトルが特定される。そして、移動先計算部231は、例えば、AKベクトルに、ずれ量出力部223から出力されたずれ量を乗じて得られたベクトルを移動先ベクトルとして特定する。
【0151】
ステップS48において、画素プロット部232は、ステップS47で特定された移動先ベクトルに基づいて画素を貼り付ける。このとき、例えば、実際のカメラにより撮影された画像の中の所定の画素数により構成されるブロックが抽出され、そのブロックを構成する画素が、補完カメラの画像の所定の位置に貼り付けられる。
【0152】
例えば、補完カメラが図9のカメラKである場合、画像101のサッカーボール上の1点である座標(x1,y1)の画素が、座標(x1,y1)を起点とした移動先ベクトルにより示される座標(x2,y2)に貼り付けられる。なお、画素単位での移動と貼り付けが行われるようにしてもよいし、ブロック単位での移動と貼り付けが行われるようにしてもよい。
【0153】
ステップS49において、画素補完部233は、画素プロット部232により画素を貼り付けることができない位置の画素を補完する。画素補完部233は、例えば、実際のカメラの画像において、前景に隠れていた背景の部分が、補完カメラの画像では前景に隠れないようになった場合、その背景の画素を補完する。この場合、例えば、背景を構成する近隣の画素を用いて補完される。
【0154】
ステップS50において、次の補完カメラがあるか否かが判定される。例えば、カメラ面において、補完カメラを配置すべき部分が残っている場合、次の補完カメラがあると判定される。
【0155】
ステップS50において、次の補完カメラがあると判定された場合、処理は、ステップS41に戻り、それ以降の処理が繰り返し実行される。
【0156】
ステップS50において、次の補完カメラがないと判定された場合、処理は、ステップS51に進む。
【0157】
ステップS51において、補完カメラ画像生成部202は、カメラ面の画像を記録する。これにより、実際のカメラにより撮影された画像、補完カメラにより撮影された画像が、それぞれのカメラの位置に対応付けられて記録される。
【0158】
このようにして、カメラ面画像生成処理が実行される。
【0159】
次に、図17のステップS24の視点画像生成処理の詳細な例について図19のフローチャートを参照して説明する。
【0160】
ステップS71において、画素取得部251は、バーチャルカメラの画素を特定する。上述したように、画素取得部251は、視点P1や視点P2にバーチャルカメラを配置して画像を撮影することで、視点P1や視点P2からみた画像を得るようにする。ステップS71では、バーチャルカメラにより撮影される画像を構成する画素のうち、処理対象となる画素が特定される。
【0161】
ステップS72において、カメラ選択部261は、カメラ面のカメラを選択する。このとき、例えば、ステップS71で特定されたバーチャルカメラの画素と焦点を結ぶ直線Lvをカメラ面まで延長し、実際のカメラまたは補完カメラのうち、直線Lvとカメラ面との交点に一番近いカメラが選択される。
【0162】
ステップS73において、画素選択部262は、利用する画素を選択する。このとき、例えば、ステップS72の処理で選択された実際のカメラまたは補完カメラの焦点を起点とした、直線Lvと平行な半直線Lwが引かれる。そして、半直線Lwと選択された実際のカメラまたは補完カメラのフィルム面の交点に一番近い画素が、ステップS71で特定されたバーチャルカメラの画素に利用する画素として選択される。
【0163】
ここで、画素選択部262により選択された画素は、画像合成部252に供給される。
【0164】
ステップS74において、画像合成部252は、ステップS73の処理で選択された画素を、ステップS71の処理で特定された画素の位置に貼り付ける。
【0165】
ステップS75において、次の画素があるか否かが判定される。まだ、バーチャルカメラの全ての画素が貼り付けられていない場合、ステップS75では、次の画素があると判定される。
【0166】
ステップS75において、次の画素があると判定された場合、処理は、ステップS71に戻り、それ以降の処理が繰り返し実行される。
【0167】
ステップS75において、次の画素がないと判定された場合、処理は終了する。
【0168】
このようにして、視点画像生成処理が実行される。
【0169】
従来より、複数カメラによって撮影された映像により被写体の3次元形状を推定し、そこにテクスチャを貼り付けてコンピュータグラフィクスとして任意の視点から見た映像を再構成する技術が提案されている。しかしながら、ステレオマッチングによる3次元の被写体モデルを推定する方式は、人間の頭髪など、モデル化が難しい部分で失敗する可能性がある。このようにモデル化が失敗すると、映像としても大きく破綻するという問題があった。また、テクスチャの貼り付けなどに係る処理負荷は大きく、処理の簡素化が期待される。
【0170】
さらに、従来よりスタジアムを取り囲むようにカメラを配置し、リプレイしたいシーンにおいて、視点を自由に切り替えて提示することも提案されているが、実際に面白味のある映像を提供するためには、コストがかかるという問題があった。
【0171】
これに対して、本技術によれば、上述したように、カメラ面画像の生成が行われ、視点画像の生成が行われるようにしたので、限られた台数のカメラを配置するだけで、多視点の画像の生成を行うことができる。また、コンピュータグラフィクスなどを用いる必要もないので、リアルで迫力のある視点画像を提供することができるとともに、処理負荷を軽減することも可能となる。
【0172】
従って、本技術によれば、低コストで、より広範囲の空間の多数の視点から見た画像を提供することができる。
【0173】
なお、以上において、図15の画素プロット部232により、実際のカメラにより撮影された画像の中の所定の画素数により構成されるブロックが抽出され、移動と貼り付けが行われると説明した。この際、抽出されるブロックは、例えば、所定の画素を中心とした9×9の画素で構成されるブロックのようにしてもよいし、画素の色をクラスタリングし、同一クラスの画素で構成されるブロックのようにしてもよい。
【0174】
例えば、K−means法により、1枚の画像の全画素を、画素の色に基づいてクラス分けする。その結果得られた各クラスに属する画素群が、画素プロット部232によりブロックとして抽出され、上述したように移動と貼り付けが行われるようにしてもよい。
【0175】
このようにすることで、より効率的かつ適切に画素の移動と貼り付けを行うことができ、より完成度の高い補完カメラの画像を、より高速に生成することが可能となる。
【0176】
また、以上においては、本技術を、例えば、図14に示される画像処理装置200に適用する例について説明した。すなわち、撮像部201で撮影された画像に基づいて補完カメラの画像を生成する補完カメラ画像生成部202と、バーチャルカメラにより撮影された所望の視点の画像を生成する視点画像生成部203とを有する画像処理装置200に本技術を適用するものとして説明した。
【0177】
しかしながら、例えば、図20に示されるように、撮像部201で撮影された画像に基づいて補完カメラの画像を生成する補完カメラ画像生成部202によって構成される補完画像生成装置300をもって本技術の実施の形態とすることも可能である。すなわち、上述したカメラ面の画像の生成は、多視点の画像の生成、3D画像の生成などにおいて有益な技術である。
【0178】
また、上述したように、本技術においては、3点補完方式を採用したことにより、例えば、水平方向の補完を完了させた後、垂直方向の補完のための演算を行うなどする必要がなく、演算量、処理負荷、処理時間を抑制することができる。さらに、3点補完方式は、4点補完方式の場合と異なり、誤差などのエラーなどが発生した場合、そのエラーが伝搬されるなどの問題もなく、ロバスト性に富んでいる。このように、本技術は、従来にはなかった方式でカメラ面の画像の生成を行うことを可能としている。
【0179】
なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図21に示されるような汎用のパーソナルコンピュータ700などに、ネットワークや記録媒体からインストールされる。
【0180】
図21において、CPU(Central Processing Unit)701は、ROM(Read Only Memory)702に記憶されているプログラム、または記憶部708からRAM(Random Access Memory)703にロードされたプログラムに従って各種の処理を実行する。RAM703にはまた、CPU701が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0181】
CPU701、ROM702、およびRAM703は、バス704を介して相互に接続されている。このバス704にはまた、入出力インタフェース705も接続されている。
【0182】
入出力インタフェース705には、キーボード、マウスなどよりなる入力部706、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部707、ハードディスクなどより構成される記憶部708、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部709が接続されている。通信部709は、インターネットを含むネットワークを介しての通信処理を行う。
【0183】
入出力インタフェース705にはまた、必要に応じてドライブ710が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア711が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部708にインストールされる。
【0184】
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア711などからなる記録媒体からインストールされる。
【0185】
なお、この記録媒体は、図21に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フロッピディスク(登録商標)を含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア711により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM702や、記憶部708に含まれるハードディスクなどで構成されるものも含む。
【0186】
なお、本明細書において上述した一連の処理は、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0187】
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
【0188】
なお、本技術は以下のような構成も取ることができる。
【0189】
(1)複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部と、
前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成する任意点画像生成部と
を備える画像処理装置。
(2)前記画像補完部は、
前記複数のカメラのうちの3台を頂点とした三角形の面内の任意の位置において撮影された画像を補完する
(1)に記載の画像処理装置。
(3)前記画像補完部は、
前記複数のカメラのうちの3台を特定し、
前記3台のカメラのうちの2台の組み合わせを3通り設定し、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する
(1)または(2)に記載の画像処理装置。
(4)前記画像補完部は、
複数のカメラにより撮影された画像の領域を、前記画像を構成する画素の色に基づいてクラス分けして、同一のクラスに属する画素の領域を単位領域とし、
前記単位領域毎に画素を移動させて貼り付けることにより前記画像を補完する
(1)乃至(3)のいずれかに記載の画像処理装置。
(5)任意点画像生成部は、
前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点に仮想的なカメラであるバーチャルカメラを配置し、
前記バーチャルカメラの焦点とフィルム面を通る直線に基づいて、前記カメラ面画像の中から適当な画像を選択し、
前記選択された画像を撮影したカメラの焦点とフィルム面を通る直線、および前記バーチャルカメラの焦点とフィルム面を通る直線に基づいて、前記選択された画像の中から適当な画素を選択し、
前記選択された画素により前記バーチャルカメラで撮影された画像を構成することで、前記任意の点から撮影された被写体の画像を生成する
(1)乃至(4)のいずれかに記載の画像処理装置。
(6)前記撮影部は、
前記複数のカメラのうち、2台のカメラのレンズに入射する光の光軸の交点を特定し、
前記交点を焦点とするように、他のカメラの向きを移動させる
(1)乃至(5)のいずれかに記載の画像処理装置。
(7)撮影部が、複数のカメラにより被写体の画像を撮影し、
画像補完部が、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完し、
任意点画像生成部が、前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成するステップ
を含む画像処理装置。
(8)コンピュータを、
複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部と、
前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成する任意点画像生成部とを備える画像処理装置として機能させる
プログラム。
(9)(8)に記載のプログラムが記録されている記録媒体。
(10)複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部とを備え、
前記画像補完部は、
前記複数のカメラのうちの3台を特定し、
前記3台のカメラのうちの2台の組み合わせを3通り設定し、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する
補完画像生成装置。
(11)前記画像補完部は、
複数のカメラにより撮影された画像の領域を、前記画像を構成する画素の色に基づいてクラス分けして、同一のクラスに属する画素の領域を単位領域とし、
前記単位領域毎に画素を移動させて貼り付けることにより前記画像を補完する
(10)に記載の補完画像生成装置。
(12)撮影部が、複数のカメラにより被写体の画像を撮影し、
画像補完部が、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完するステップを含み、
前記複数のカメラのうちの3台が特定され、
前記3台のカメラのうちの2台の組み合わせが3通り設定され、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量が算出され、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量が算出され、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量が算出され、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量が決定され、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルが特定され、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像が補完される
補完画像生成方法。
(13)コンピュータを、
複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部とを備え、
前記画像補完部は、
前記複数のカメラのうちの3台を特定し、
前記3台のカメラのうちの2台の組み合わせを3通り設定し、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する補完画像生成装置として機能させる
プログラム。
(14)
(13)に記載のプログラムが記録されている記録媒体。
【符号の説明】
【0190】
200 画像処理装置, 201 撮像部, 202 補完カメラ画像生成部, 203 視点画像生成部, 204 画像提示部, 221−1 AB間ずれ量判定部, 221−2 BC間ずれ量判定部, 221 ずれ量算出部, 212 画素生成部, 221−3 AC間ずれ量判定部, 222 結果照合部, 223 ずれ量出力部, 231 移動先計算部, 232 画素プロット部, 233 画素補完部, 251 画素取得部, 252 画像合成部, 261 カメラ選択部, 262 画素選択部, 300 補完画像生成装置

【特許請求の範囲】
【請求項1】
複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部と、
前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成する任意点画像生成部と
を備える画像処理装置。
【請求項2】
前記画像補完部は、
前記複数のカメラのうちの3台を頂点とした三角形の面内の任意の位置において撮影された画像を補完する
請求項1に記載の画像処理装置。
【請求項3】
前記画像補完部は、
前記複数のカメラのうちの3台を特定し、
前記3台のカメラのうちの2台の組み合わせを3通り設定し、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する
請求項1に記載の画像処理装置。
【請求項4】
前記画像補完部は、
複数のカメラにより撮影された画像の領域を、前記画像を構成する画素の色に基づいてクラス分けして、同一のクラスに属する画素の領域を単位領域とし、
前記単位領域毎に画素を移動させて貼り付けることにより前記画像を補完する
請求項1に記載の画像処理装置。
【請求項5】
任意点画像生成部は、
前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点に仮想的なカメラであるバーチャルカメラを配置し、
前記バーチャルカメラの焦点とフィルム面を通る直線に基づいて、前記カメラ面画像の中から適当な画像を選択し、
前記選択された画像を撮影したカメラの焦点とフィルム面を通る直線、および前記バーチャルカメラの焦点とフィルム面を通る直線に基づいて、前記選択された画像の中から適当な画素を選択し、
前記選択された画素により前記バーチャルカメラで撮影された画像を構成することで、前記任意の点から撮影された被写体の画像を生成する
請求項1に記載の画像処理装置。
【請求項6】
前記撮影部は、
前記複数のカメラのうち、2台のカメラのレンズに入射する光の光軸の交点を特定し、
前記交点を焦点とするように、他のカメラの向きを移動させる
請求項1に記載の画像処理装置。
【請求項7】
撮影部が、複数のカメラにより被写体の画像を撮影し、
画像補完部が、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完し、
任意点画像生成部が、前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成するステップ
を含む画像処理装置。
【請求項8】
コンピュータを、
複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部と、
前記複数のカメラにより撮影された画像および前記補完された画像により構成されるカメラ面画像に基づいて、前記複数のカメラのそれぞれに共通する撮影範囲内の任意の点から撮影された被写体の画像を生成する任意点画像生成部とを備える画像処理装置として機能させる
プログラム。
【請求項9】
請求項8に記載のプログラムが記録されている記録媒体。
【請求項10】
複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部とを備え、
前記画像補完部は、
前記複数のカメラのうちの3台を特定し、
前記3台のカメラのうちの2台の組み合わせを3通り設定し、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する
補完画像生成装置。
【請求項11】
前記画像補完部は、
複数のカメラにより撮影された画像の領域を、前記画像を構成する画素の色に基づいてクラス分けして、同一のクラスに属する画素の領域を単位領域とし、
前記単位領域毎に画素を移動させて貼り付けることにより前記画像を補完する
請求項10に記載の補完画像生成装置。
【請求項12】
撮影部が、複数のカメラにより被写体の画像を撮影し、
画像補完部が、前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完するステップを含み、
前記複数のカメラのうちの3台が特定され、
前記3台のカメラのうちの2台の組み合わせが3通り設定され、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量が算出され、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量が算出され、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量が算出され、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量が決定され、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルが特定され、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像が補完される
補完画像生成方法。
【請求項13】
コンピュータを、
複数のカメラにより被写体の画像を撮影する撮影部と、
前記撮影された画像に基づいて、前記複数のカメラの全部または一部の位置を結んだ複数の線分により構成される面内の任意の位置において撮影された画像を補完する画像補完部とを備え、
前記画像補完部は、
前記複数のカメラのうちの3台を特定し、
前記3台のカメラのうちの2台の組み合わせを3通り設定し、
前記3通りの組み合わせの中の第1番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第1のずれ量を算出し、
前記3通りの組み合わせの中の第2番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第2のずれ量を算出し、
前記3通りの組み合わせの中の第3番目の組み合わせにおいて、それぞれのカメラで撮影された画像の視差に基づいて、第3のずれ量を算出し、
前記第1乃至第3のずれ量に基づいて、最も確からしいずれ量を決定し、
前記補完される画像が撮影される位置および前記3台のカメラのいずれか1台の位置、並びに前記ずれ量に基づいて移動先ベクトルを特定し、
前記移動先ベクトルに基づいて、前記3台のカメラのいずれか1台により撮影された画像の画素を移動させて貼り付けることにより前記画像を補完する補完画像生成装置として機能させる
プログラム。
【請求項14】
請求項13に記載のプログラムが記録されている記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2012−244527(P2012−244527A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−114610(P2011−114610)
【出願日】平成23年5月23日(2011.5.23)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】