多視点画像圧縮符号化方法、装置及びプログラム
【課題】複数のカメラの光軸に対して、被写体の表面が傾いている場合であっても、ブロックマッチングによって視差ベクトルを検出し、その視差ベクトルを用いた多視点画像圧縮符号化方法等を提供する。
【解決手段】カメラの光軸が、2つのカメラを通る同一平面に対して垂直となるように同一の回転変換を加える。任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトルnとを任意に決定し、t及びZに基づく視差ベクトルで移動させ、t、Z及びnに基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる。Z及びnを任意に変更しながら、第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索する。第1のブロックと第2のブロックとの予測誤差を導出し且つ符号化し、奥行き距離Z及び単位法線ベクトルnも符号化する。
【解決手段】カメラの光軸が、2つのカメラを通る同一平面に対して垂直となるように同一の回転変換を加える。任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトルnとを任意に決定し、t及びZに基づく視差ベクトルで移動させ、t、Z及びnに基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる。Z及びnを任意に変更しながら、第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索する。第1のブロックと第2のブロックとの予測誤差を導出し且つ符号化し、奥行き距離Z及び単位法線ベクトルnも符号化する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多視点画像圧縮符号化方法、装置及びプログラムに関する。
【背景技術】
【0002】
異なる位置にあるカメラによって同時に撮影された画像(以下「多視点画像」という)の間には、視差による違いを除けば、強い相関がある。従って、これら画像を一連の映像シーケンスとみなして、動き補償(視差補償)を用いて符号化することにより、情報圧縮をすることができる(例えば特許文献1参照)。
【0003】
多視点画像間の視差補償を行う代表的な方法として、「ブロックマッチング」がある。「ブロックマッチング」を用いた視差ベクトルの検出は、以下のようにしてなされる。
【0004】
第1のカメラ(第1の視点)によって撮影された第1の画像を、小さなブロックに分割する。第1の画像の第1のブロックの各々を、第2のカメラ(他の視点)の第2の画像の中で平行移動させて、最も類似度が高い領域を探索する。具体的には、第1の画像の第1のブロックに対して、絶対値誤差又は2乗誤差が最小となる第2の画像の第2のブロックを探索する。そして、探索された第2のブロックと、第1のブロックとの距離量を視差ベクトルとして算出する。第1のブロックと第2のブロックとの予測誤差を符号化し、視差ベクトルを符号化データに付加することによって、その多視点画像を圧縮符号化することができる。
【0005】
【特許文献1】特開2005−260464号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
従来のブロックマッチングは、第1の画像の中の被写体が、第2の画像の中で平行移動した場合に、ブロックをマッチングさせるものである。複数のカメラから見て、被写体の表面が、そのカメラの光軸に垂直となり、かつ、そのカメラから等距離にある場合にしか、完全なブロックマッチングをさせることができない。
【0007】
しかしながら、複数のカメラの光軸に対して、被写体の表面が傾いている場合には、その被写体の面も異なって見える。即ち、第1の画像の第1のブロックを、第2の画像の中で平行移動させても、第1のブロックと完全にマッチングした第2のブロックを探索することはできない。第1の画像の中の被写体の形状は、第2の画像の中の被写体の形状と異なって射影されたものとなるからである。
【0008】
そこで、本発明は、複数のカメラの光軸に対して、被写体の表面が傾いている場合であっても、ブロックマッチングによって視差ベクトルを検出し、その視差ベクトルを用いた多視点画像圧縮符号化方法、装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第1の画像について任意点を含む第1のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1のブロックを、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする。
【0010】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第8のステップは、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことも好ましい。
【0011】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第2の画像について任意点を含む第2のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1の画像を、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする。
【0012】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第8のステップは、MPEGの予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことも好ましい。
【0013】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、第2から第7のステップを繰り返し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことも好ましい。
【0014】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第1のステップについて、回転変換を表す行列は、以下のものであり、
【数1】
第2のステップについて、任意点の画像座標は、正規化画像座標であり、
回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
第6のステップについて、視差ベクトルは、以下のものであり、
【数2】
一次変換行列は、以下のものである
【数3】
ことも好ましい。
【0015】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、第1のステップの前段にあって、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するステップを有することも好ましい。
【0016】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことも好ましい。
【0017】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、該任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする。
【0018】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
予測誤差符号化手段は、MPEGの予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことも好ましい。
【0019】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする。
【0020】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
予測誤差符号化手段は、MPEGの予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことも好ましい。
【0021】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
任意点選択手段は、第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、
任意点について、画像座標算出手段と、パラメータ決定手段と、ブロックマッチング手段と、マッチング制御手段と、視差補償手段と、多視点画像圧縮符号化手段とを繰り返すブロック制御手段を更に有し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことも好ましい。
【0022】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
カメラ座標系座標変換手段について、回転変換を表す行列は、以下のものであり、
【数4】
画像座標算出手段は、任意点の画像座標として正規化画像座標を導出し、
回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
ブロックマッチング手段は、視差ベクトルを以下のものとし、
【数5】
一次変換行列を以下のものとする
【数6】
ことも好ましい。
【0023】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換することも好ましい。
【0024】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことも好ましい。
【0025】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする。
【0026】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする。
【発明の効果】
【0027】
本発明の多視点画像圧縮符号化方法、装置及びプログラムによれば、複数のカメラの光軸に対して、被写体の表面が傾いている場合であっても、ブロックマッチングによって視差ベクトルを検出し、その視差ベクトルを用いて多視点画像を圧縮符号化することができる。MPEGによれば、符号化対象ピクチャの第1のブロック又は参照ピクチャ自体を、任意の奥行き距離Zと、被写体の表面の法線の任意の向きnに基づいて移動及び変形をさせながらブロックマッチングをすることにより、視差ベクトルと共に、一次変換行列も検出する。第1の画像座標を原点として一次変換行列に基づいて変形させたブロック又は画像と、他方のブロックとの予測誤差を導出することにより、予測誤差のデータ量を低減し、高い効率で多視点画像を圧縮符号化することができる。
【発明を実施するための最良の形態】
【0028】
以下では、図面を用いて、本発明を実施するための最良の形態について詳細に説明する。
【0029】
図1は、本発明におけるシステム構成図である。
【0030】
異なる位置に配置された複数のカメラ1が、被写体3を撮影する。複数のカメラ1は、光軸をZ軸に平行として配置されている。但し、それらのカメラは、光軸に垂直な同一平面(XY平面に平行な平面)上には配置されない。即ち、前後左右に散らばって配置されている。図1によれば、9台の縦3列横3列(視点(0,0)〜(2,2))で配置されている。また、複数のカメラ1は、多視点画像圧縮符号化装置2に接続される。本発明によれば、少なくとも2つのカメラによって撮影された多視点画像を必要とする。
【0031】
カメラ1は、被写体3を撮影した画像を多視点画像圧縮符号化装置2へ送信する。ここで、カメラ1が移動可能なものである場合、カメラ位置情報も、多視点画像圧縮符号化装置2へ送信される。勿論、多視点画像圧縮符号化装置2が、全てのカメラ位置情報を予め記憶しているものであってもよい。
【0032】
図2は、図1のシステム構成について、複数のカメラを正面及び側面から見た配置図である。
【0033】
図2によれば、正面から見ると、等幅で縦3列横3列に配置されている。側面から見ると、カメラ(0,1)(1,1)(2,1)がz軸に対して後方に配置されている。即ち、被写体3に対して、複数のカメラ1は、y軸に対して円筒面上に配置されている。
【0034】
図3は、図2における各カメラから見た被写体の見え方を表す画面図である。
【0035】
図3によれば、被写体は、台形状立体である。被写体の正面に、カメラ(1,1)が位置する。カメラ(0,1)(1,1)(2,1)は、z軸に対して後方に配置されているので、被写体が少し小さく見える。また、カメラ(1,1)の前方にあり且つ左側のカメラ(1,0)から見ると、被写体が全体として大きく、且つ、左側が広がり、右側が縮小して見える。また、カメラ(1,1)の前方にあり且つ右側のカメラ(1,2)から見ると、被写体が全体として大きく、且つ、左側が縮小し、右側が広がって見える。
【0036】
同様に、カメラ(1,1)の上側のカメラ(0,1)から見ると、被写体の上側が広がり、下側が縮小して見える。カメラ(1,1)の下側のカメラ(2,1)から見ると、被写体の上側が縮小し、下側が広がって見える。
【0037】
図3からも明らかなとおり、視差を考慮してブロックを移動させても、正確に一致する領域がない。従って、正しいマッチングを取ることができない。
【0038】
図4〜図6には、被写体の表面の傾きによって、各カメラによって撮影される画像を表している。
【0039】
図4は、被写体の表面を横方向斜めに傾けた場合に、各カメラから撮影した画像である。
【0040】
被写体は、左側が奥に、右側が手前にある。このとき、カメラ(1,1)の画像よりも、カメラ(1,1)の前方にあり且つ左側のカメラ(1,0)の画像の方が、被写体が全体として大きく、且つ、横方向に広がって見える。また、カメラ(1,1)の画像よりも、カメラ(1,1)の前方にあり且つ右側のカメラ(1,2)の画像の方が、被写体が全体として大きく、且つ、横方向に狭く見える。
【0041】
図5は、被写体の表面を上下方向斜めに傾けた場合に、各カメラから撮影した画像である。
【0042】
被写体は、上側が奥に、下側が手前にある。このとき、カメラ(1,1)の画像よりも、カメラ(1,1)の上側のカメラ(0,1)の画像の方が、平面が縦方向に広がって見える。また、カメラ(1,1)の画像よりも、カメラ(1,1)の下側のカメラ(2,1)の画像の方が、平面が縦方向に狭く見える。
【0043】
図6は、被写体の表面を横方向斜めに傾けて、且つ、上下方向斜めに傾けた場合に、各カメラから撮影した画像である。即ち、図4の傾きと図5の傾きとを合わせたものである。
【0044】
図3、図4〜図6に表されたように、このような見え方の差異は、複数のカメラの光軸に対して、被写体の台形状立体の側面が傾いているために生じる。本発明によれば、カメラの光軸に対して被写体の表面が傾いている場合であっても、第1のブロックと完全にマッチングした第2のブロックを探索することができる。
【0045】
図7は、2つのカメラにおける第1の相対位置関係の説明図である。
【0046】
一般に、被写体は平面ではないため、ブロックの変形も非線形になる。しかしながら、充分に小さなブロックに着目すると、ブロック内の被写体の面は平面に近似できる。また、2つのカメラは、光軸を平行に、第1の相対的位置(tx,ty,tz)で配置される。図7によれば、被写体に対して、カメラCとカメラC’のxy平面は、異なる位置にある。従って、tz≠0である。
【0047】
図8は、2つのカメラに回転を加えた第2の相対位置関係の説明図である。
【0048】
本発明によれば、カメラ内部パラメータを用いて、カメラCとカメラC’に同一の回転変換を加える。この回転Rは、カメラC及びカメラC’の光軸が、カメラC及びカメラC’を通る同一平面に対して垂直となるようにする。このように、カメラCのカメラ座標系座標と、カメラC’のカメラ座標系座標とを変換する。これにより、カメラC及びカメラC’の第2の相対的位置は、(tRx,tRy,0)となる。即ち、tRz=0で表される。
【0049】
カメラ座標系座標に回転Rを加えて、そのxy平面から被写体の任意点までの奥行き距離ZRと、近似平面の向き(単位法線ベクトル)nRとを、ブロックマッチングのパラメータとして用いる。
【0050】
図9は、第1のブロックマッチングの説明図である。
【0051】
予測符号化方式に、MPEGを適用する。図9によれば、符号化対象ピクチャ(第1の画像)について任意点を含む第1のブロックを選択する。次に、任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定する。そして、第1のブロックを、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、参照ピクチャのブロックにマッチングさせる。
【0052】
図9は、第2のブロックマッチングの説明図である。
【0053】
図9によれば、符号化対象ピクチャ(第2の画像)について任意点を含む第2のブロックを選択する。次に、任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定する。そして、参照ピクチャ(第1の画像)を、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、符号化対象ピクチャの第2のブロックにマッチングさせる。
【0054】
以下では、ブロック又は画像の移動及び変形となる一次変換行列の導出過程を詳細に説明する。
【0055】
最初に、カメラの内部パラメータ(内部カメラ行列)Aは、以下の式で表される。この値は、既知であるとする。
【数7】
fku、fkv:焦点距離(カメラの距離のピクセル数)
θ=π/2:座標軸の角度
u0、v0:画像中心
【0056】
カメラCのカメラ座標系を平行移動(相対的位置t)させて、カメラC’のカメラ座標系が得られる。tは、カメラの外部パラメータの1つであり、カメラCのカメラ座標系に対するカメラC’の変位ベクトルを表す。カメラC及びC’は、光軸を平行に配置される。また、カメラCのカメラ座標系に対するカメラC’の相対的位置ベクトルtは、z軸成分を必ず非0とする(tZ≠0)。
【数8】
【0057】
カメラCのカメラ座標系座標と、カメラC’のカメラ座標系座標との間には、以下の関係が成り立つ。即ち、カメラCのカメラ座標系座標が、カメラの外部パラメータを通じて、カメラC’のカメラ座標系座標に変換される。
M=M’+t 式(2)
M:カメラCにおける被写体の任意点Pのカメラ座標系座標
M’:カメラC’における被写体の任意点Pのカメラ座標系座標
【数9】
【0058】
ここで、被写体の近似平面πに対して、カメラC’のカメラ座標系では以下の式が成り立つ。
nTM’=d 式(5)
n(|n|=1):カメラC’のカメラ座標系における平面の法線ベクトル
【数10】
d:カメラC’のカメラ座標系の原点から平面までの距離
【0059】
次に、任意点Pのディジタル画像座標を、以下のようにする。
m:カメラCにおける任意点Pのディジタル画像座標
m’:カメラC’における任意点Pのディジタル画像座標
【数11】
【0060】
また、任意点Pの正規化画像座標を、以下のようにする。「正規化画像」とは、画像平面が焦点から単位長のところにあるカメラ(正規化カメラ)で撮影したと仮定した場合の画像をいう。正規化画像における任意点の座標を、「正規化画像座標」という。
x:任意点PのカメラCにおける正規化画像座標
x’:任意点PのカメラC’における正規化画像座標
【数12】
【0061】
これにより、以下の中心射影変換が成立する。
【数13】
【0062】
次に、式(9)に式(7)及び式(3)を代入すると、以下の式が導出される。
【数14】
【0063】
両辺の3行目を比較すると、s=Zが導かれる。
【0064】
これを式(9)に代入すると、以下の式が導出される。
【数15】
【0065】
一方で、式(10)に式(2)を代入すると、以下の式が成立する。
【数16】
【0066】
式(1)、式(3)、式(4)、及び式(8)を代入して、以下の式が導出される。
【数17】
【0067】
両辺の3行目を比較すると、s’=Z’=Z−tzが導出される。
【0068】
これを式(10)に代入すると、以下の式が導出される。
【数18】
【0069】
次に、カメラCのカメラ座標系を回転変換し、tを、それをXY平面に正射影したベクトルtxyの方向に一致させることを考える。但し、txyは、以下のようになる。
【数19】
【0070】
一般に、単位ベクトルrを回転軸とする角度θの回転を表す行列Rは、Rodriguesの公式により、以下のように表される。
【数20】
【0071】
ここで、以下のものである。
【数21】
【0072】
rは、t及びtxyと直交するので、以下の式になる。
【数22】
【0073】
回転角度をθとすると、以下の式となる。
【数23】
【0074】
以上より、式(14)及び式(15)を式(13)に代入すると、求める回転変換行列は、以下のようになる。
【数24】
【0075】
同様に、逆変換の行列は、以下のようになる。
【数25】
【0076】
回転変換行列Rを用いて、平行移動ベクトルt、近似平面πの単位法線ベクトルnを回転変換する。回転変換した結果をそれぞれ、tR、nRとおくと、以下のようになる。
【数26】
【0077】
回転変換後のカメラCのカメラ座標系座標と、回転変換後のカメラC’のカメラ座標系座標との間には、以下の関係が成り立つ。即ち、カメラCのカメラ座標系座標が、カメラの外部パラメータを通じて、カメラC’のカメラ座標系座標に変換される。
MR=MR’+tR 式(20)
MR:回転変換後のカメラCにおける被写体の任意点Pのカメラ座標系座標
MR’:回転変換後のカメラC’における被写体の任意点Pのカメラ座標系座標
【数27】
【0078】
ここで、被写体の近似平面πに対して、回転変換後のカメラC’のカメラ座標系では、近似平面πとカメラC’との距離dの値は回転変換によって不変であるから、以下の式が成り立つ。
nRTMR’=d 式(23)
∴nRTMR’/d=1 式(24)
【0079】
式(24)を、式(20)に代入すると、以下の平面射影変換の式が得られる。
【数28】
【0080】
Hをホモグラフィ行列とすると、以下のようになる。
【数29】
【0081】
次に、任意点Pのディジタル画像座標を、以下のようにする。
mR:回転変換後のカメラCにおける任意点Pのディジタル画像座標
mR’:回転変換後のカメラC’における任意点Pのディジタル画像座標
【数30】
【0082】
また、任意点Pの正規化画像座標を、以下のようにする。
xR:回転変換後の任意点PのカメラCにおける正規化画像座標
xR’:回転変換後の任意点PのカメラC’における正規化画像座標
【数31】
【0083】
これにより、中心射影変換として、以下の式が成立する。
【数32】
【0084】
式(28)に式(26)及び式(21)式を代入すると、以下の式が導出される。
【数33】
【0085】
両辺の3行目を比較すると、sR=ZRが導かれる。
【0086】
これを式(28)に代入すると、以下の式が導出される。
【数34】
【0087】
一方で、式(29)に式(20)を代入すると、以下の式が成立する。
【数35】
【0088】
式(21)、式(22)、式(1)、式(18)及び式(27)を代入して、以下の式を導出する。
【数36】
【0089】
両辺の3行目を比較すると、
sR’=ZR’=ZR 式(41)
が導かれる。
【0090】
これを、式(29)に代入すると、以下の式が成立する。
【数37】
【0091】
従って、式(23)に代入すると、以下の式が成立する。
【数38】
【0092】
式(19)及び式(27)を代入すると、以下の式が成立する。
d=ZR(nRxxR’+nRyyR’+nRz) 式(31)
【0093】
式(31)を式(13)に代入すると、以下の式が導出される。
【数39】
【0094】
また、xとxRの変換式、及び、x’とxR’の変換式を求める。簡単のため、以下のように定義する。
【数40】
【0095】
そうすると、式(11)より、以下のようになる。
【数41】
【0096】
両辺の3行目を比較すると、以下の式となる。
【数42】
【0097】
これにより、以下の式が成立する。
【数43】
【0098】
また、式(32)に式(41)を代入すると、以下の式となり、Z,t,x’,y’からZRが導出できる。
【数44】
【0099】
ここで、式(40)において、カメラ座標系座標MR及びMR’に代えて、正規化画像座標xR及びxR’を用いると、以下の変換式が得られる。
【数45】
【0100】
両辺の3行目を比較すると、sR=1が導かれる。
【0101】
これを式(35)に代入すると、以下の式が成立する。
【数46】
【0102】
更に、ディジタル画像座標mR及びmR’を用いると、以下の変換式が得られる。
【数47】
【0103】
正規化画像座標系における視差ベクトルをDとすると、以下の式が成り立つ。
【数48】
【0104】
【数49】
【0105】
右辺及び左辺の差を求めると、以下の式が成り立つ。
【数50】
【0106】
回転変換した第2の画像の第2のブロックについて、回転変換した第1の画像の中を、以下のDの平行移動をさせて、第1の画像座標(xR,yR)を原点として以下のLの一次変換行列で変形をさせることにより、第2のブロックに最も類似するような、第1の画像のブロックを探索する。一次変換行列によれば、視差ベクトルと、被写体の(平面に近似された)面の傾きとに基づいてブロックを変形し、ブロックマッチングをすることができる。
【0107】
【数51】
【0108】
ここで、参照ピクチャと符号化対象ピクチャとを圧縮符号化する方法を説明する。
【0109】
最初に、符号化対象ピクチャを、画面内予測符号化する。次に、参照ピクチャを複数のブロックに分割し、各ブロックに対して前述の平行移動D及び一次変換行列Lに基づいて、第1の画像座標(x,y)を原点として変形させる。そして、予測誤差が最小となる参照ピクチャのブロック(参照ブロック)を求め、その際の平行移動ベクトルDと一次変換行列L(即ち、奥行き距離Z及び単位法線ベクトル(nx,ny,nz))を導出する。ここで、当該ブロックと、変形した参照ブロックとを比較して予測誤差を算出するために、変形した参照ブロックを線形補間等によって補間し、当該ブロックの各画素と比較するための対応する画素値を算出する。例えば、線形補間を用いる場合は、図Xの点Xの画素値は、周辺4点(A,B,C,D)の画素値を用いて、以下の式から求める。
X=(1−dx)(1−dy)A+dx(1−dy)B+(1−dy)dyC+dxdyD
【0110】
最後に、予測誤差を圧縮符号化し、奥行き距離Z(又は平行移動ベクトルD)と単位法線ベクトル(nx,ny,nz)を符号化する。
【0111】
但し、第1の画像の参照ブロックとの予測誤差を符号化するよりも、第2の画像の中で画面内予測符号化する方が、圧縮効率が高くなる場合は、第2の画像の中で画面内予測符号化をする。
【0112】
以下では、具体的な実施例を説明する。
【0113】
第1に、同一平面上に無い2台のカメラの画像に対してブロックマッチングを行う場合の実施例を示す。
【0114】
カメラの内部パラメータA及び相対的位置ベクトルtは、事前に得られていることが前提である。簡単のため、以下のように定義する。
【数52】
【0115】
この相対的位置ベクトルtは、2台のカメラが半径Rの円周上に角度θだけ離れて設置してある状況に相当する。
【0116】
まず、カメラCの画像の中の点M0に着目する。点M0のディジタル画像座標m0が、以下の値であったとする。
【数53】
【0117】
そこで、正規化画像座標に変換する。点M0の正規化画像座標x0は、以下の値になる。
【数54】
【0118】
同様にして、カメラCの画像及びカメラC’の画像を、ディジタル画像座標から正規化画像座標に変換する。
【0119】
次に、カメラCの画像及びカメラC’の画像を回転変換する。回転変換行列は、式(16)に基づくと、下記の通りである。
【数55】
【0120】
相対的位置ベクトルは、式(18)に基づき、下記のベクトルに変換される。
【数56】
【0121】
式(33)に基づき、回転変換する。例えば、点M0は下記の点MR0に変換される。
【数57】
【0122】
点M0を左上端とする、大きさW×Hのブロックで探索を行うとする。
【0123】
本発明によれば、法線ベクトル(nx、ny、nz)及び奥行き距離Zを、任意に変化させてブロックマッチングを行う。例えば、nx=0、ny=1、nz=0、Z=R/2の時、回転変換された座標系における、奥行き距離、法線ベクトルは、式(32)及び式(19)を用いて、以下のようになる。
【数58】
【0124】
従って、この時の視差ベクトルD0は、式(37)より、以下のようになる。
【数59】
【0125】
また、この時の一次変換行列L0は、式(38)より、以下のようになる。
【数60】
【0126】
このとき、ブロックマッチングの誤差が最小であったならば、D0及びL0が目的の視差ベクトルと一次変換行列であることになる。
【0127】
第2に、同一平面上にあるK台のカメラの画像に対してブロックマッチングを行う場合の実施例を示す。
【0128】
カメラの内部パラメータA及び相対的位置ベクトルtk(第0カメラをベースカメラとして、第0カメラに対する第kカメラの相対的位置ベクトルを示す。k=1〜K−1)は、事前に得られていることが前提である。簡単のため、以下のようであったとする。
【数61】
【0129】
この相対的位置ベクトルtkは、K台のカメラがX軸上にΔ間隔で設置してある状況に相当する。
【0130】
まず、第0カメラの画像の中の点M0に着目する。点M0のディジタル画像座標m0が、以下の値であったとする。
【数62】
【0131】
そこで、正規化画像座標に変換する。点M0の正規化画像座標x0は、以下の値になる。
【数63】
【0132】
同様にして、他のK−1台のカメラの画像を、ディジタル画像座標から正規化画像座標に変換する。
【0133】
本発明によれば、法線ベクトル(nx、ny、nz)及び奥行き距離Zを、任意に変化させてブロックマッチングを行う。例えば、nx=nx0、ny=ny0、nz=nz0、Z=Z0の時、第0カメラの画像の中の点M0に対する第kカメラの画像の対応点の視差ベクトルDkは、以下のようになる。
【数64】
【0134】
また、第0カメラの画像の中のブロックに対する第kカメラの画像の中のブロックの一次変換行列Lkは、以下のようになる。
【数65】
【0135】
ここで、法線ベクトル(nx、ny、nz)及び奥行き距離Zは固定したまま(nx=nx0、ny=ny0、nz=nz0、Z=Z0)で、各カメラにおいて、Dkに基づいて平行移動しLkに基づいて一次変換したブロックを比較し、両者(第0カメラの画像と第kカメラの画像の中の対応するブロック同士)の差分を評価する。例えば、最小自乗誤差を求める。
【0136】
第0カメラの画像と第kカメラの画像の中の対応するブロック同士の差分の評価値をdkとおく。この時、法線ベクトルと奥行き距離の各組合せに対して、以下のように算出する。
【数66】
【0137】
このSを最小化する、法線ベクトルと奥行き距離の組合せが、目的の視差ベクトルと一次変換行列であることになる。
【0138】
第3に、同一平面上に無いK台のカメラの画像に対してブロックマッチングを行う場合の実施例を示す。
【0139】
カメラの内部パラメータA及び相対的位置ベクトルtk(第0カメラをベースカメラとして、第0カメラに対する第kカメラの相対的位置ベクトルを示す。k=1〜K−1)は、事前に得られていることが前提である。簡単のため、以下のようであったとする。
【数67】
【0140】
この相対的位置ベクトルtkは、K台のカメラが半径Rの円周上に角度Θ間隔で設置してある状況に相当する。
【0141】
まず、第0カメラの画像の中の点M0に着目する。点M0のディジタル画像座標m0が、以下の値であったとする。
【数68】
【0142】
そこで、正規化画像座標に変換する。点M0の正規化画像座標x0は、以下の値になる。
【数69】
【0143】
同様にして、他のK−1台のカメラの画像を、ディジタル画像座標から正規化画像座標に変換する。
【0144】
次に、K台のカメラの画像を回転変換する。第0カメラと第kカメラの組合せにおける回転変換行列は、式(16)に基づくと、以下のようになる。
【数70】
【0145】
第0カメラと第kカメラの組合せにおける相対的位置ベクトルは、式(18)に基づき、下記のベクトルに変換される。
【数71】
【0146】
式(33)に基づき、回転変換する。例えば、点M0は下記の点Mkに変換される。
【数72】
【0147】
点M0を左上端とするブロックで探索を行うとする。
【0148】
本発明によれば、法線ベクトル(nx、ny、nz)及び奥行き距離Zを、任意に変化させてブロックマッチングを行う。例えば、nx=0、ny=1、nz=0、Z=R/2の時、第0カメラと第kカメラの組合せで回転変換された座標系における、奥行き距離、法線ベクトルは、式(32)及び式(19)を用いて、以下のようになる。
【数73】
【0149】
従って、この時の第0カメラと第kカメラの組合せにおける視差ベクトルDkは、式(37)より、以下のようになる。
【数74】
【0150】
また、この時の第0カメラと第kカメラの組合せにおける一次変換行列Lkは、式(38)より、以下のようになる。
【数75】
【0151】
ここで、法線ベクトル(nx、ny、nz)及び奥行き距離Zは固定したまま(nx=0、ny=1、nz=0、Z=R/2)で、各カメラにおいて、Dkに基づいて平行移動しLkに基づいて一次変換したブロックを比較し、両者(第0カメラの画像と第kカメラの画像の中の対応するブロック同士)の差分を評価する。例えば、最小自乗誤差を求める。
【0152】
第0カメラの画像と第kカメラの画像の中の対応するブロック同士の差分の評価値をdkとおく。この時、法線ベクトルと奥行き距離の各組合せに対して、以下のように算出する。
【数76】
【0153】
このSを最小化する、法線ベクトルと奥行き距離の組合せが、目的の視差ベクトルと一次変換行列であることになる。
【0154】
このとき、ブロックマッチングの誤差が最小であったならば、D0及びL0が目的の視差ベクトルと一次変換行列であることになる。
【0155】
図11は、2つのカメラによる変形ブロックマッチングの説明図である。
【0156】
図11によれば、各画像について1対1の組み合わせによって、独立に変形ブロックマッチングをする。この場合、組み合わせ毎に、異なる奥行き距離と法線ベクトルとが必要となり、大きい計算量を要する。
【0157】
図12は、3つ以上のカメラによる変形ブロックマッチングの説明図である。
【0158】
図12によれば、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、その予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する。1組の奥行き距離及び法線ベクトルによって、全ての画像の対応ブロックのマッチングをとることができる。
【0159】
図13は、本発明におけるフローチャートである。尚、図13は、図9のマッチングに基づいて説明する。
【0160】
(S901)全てのカメラの位置情報を取得する。全てのカメラは、光軸を平行に且つ該光軸に垂直な同一平面上に配置されている。従って、第1のカメラに対する第2のカメラの世界座標系の第1の相対的位置(tx,ty,tz)を取得する。カメラは、移動可能なものであってもよい。カメラ自体が、例えばGPS等の測位機能を備えている場合、その位置情報を受信する。尚、カメラが固定なものであれば、その位置情報は予め登録されているものであってもよい。
【0161】
(S902)全てのカメラの画像を取得する。ここで、第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する。
【0162】
(S903)第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する。回転変換を表す行列は、以下のものである。
【数77】
【0163】
(S904)被写体上の任意点を決定する。
(S905)任意点を、回転変換を加えた符号化対象ピクチャに射影した第1の画像座標(x,y)と、該任意点を、回転変換を加えた参照ピクチャに射影した第2の画像座標(x',y')とを導出する。ここで、任意点の画像座標は、正規化画像座標である。
(S906)符号化対象ピクチャについて任意点を含む第1のブロックを選択する。
【0164】
(S907)以下、S907〜S910を繰り返す。
(S908)任意点の奥行き距離Zを任意に決定する。
(S909)被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)を任意に決定する。
【0165】
(S910)ここで、回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR',yR')が得られたとする。そうすると、視差ベクトルは、以下のものとなる。
【数78】
一次変換行列は、以下のものである。
【数79】
【0166】
第1のブロックを、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、参照ピクチャのブロックにマッチングさせる。
【0167】
(S911)奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、S906〜S909を繰り返す。そして、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索する。結果的に、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する。
【0168】
(S912)移動させ且つ変形させた符号化対象ピクチャの第1のブロックと最も類似する参照ピクチャの第2のブロックとの予測誤差を導出し且つ符号化する。予測誤差の符号化方式は、MPEGに規定された一般的なものである。
(S913)奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を、符号化データに付加する。
【0169】
(S914)符号化対象ピクチャの第1のブロック以外の部分について被写体上の任意点を更に決定し、S904〜S913を繰り返す。
【0170】
図14は、本発明における多視点画像圧縮符号化装置の機能構成図である。
【0171】
図14によれば、多視点画像圧縮符号化装置2は、位置情報取得部21と、画像取得部22と、カメラ座標系座標変換部203と、任意点選択部204と、正規化画像座標導出部205と、ブロック選択部206と、ブロックマッチング部207と、パラメータ決定部208と、マッチング制御部209と、ブロック制御部210と、予測誤差符号化部211と、パラメータ付加部212とを有する。これら機能部は、コンピュータによって実行されるプログラムによっても実現できる。
【0172】
位置情報取得部21は、全てのカメラの位置情報を取得する。前述した図13のS901と同様の機能を有する。
【0173】
画像取得部22は、全てのカメラから同期した画像を取得する。前述した図13のS902と同様の機能を有する。
【0174】
カメラ座標系座標変換部203は、第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する。前述した図13のS903と同様の機能を有する。
【0175】
任意点選択部204は、被写体上の任意点を決定する。任意点選択部204は、ブロック制御部210からの指示に応じて、第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定する。前述した図13のS904と同様の機能を有する。
【0176】
正規化画像座標導出部205は、任意点を、回転変換を加えた第1の画像に射影した第1の正規化画像座標(x,y)と、任意点を、回転変換を加えた第2の画像に射影した第2の正規化画像座標(x',y')とを導出する。前述した図13のS905と同様の機能を有する。
【0177】
ブロック選択部206は、第1の画像について任意点を含む第1のブロックを選択する。前述した図13のS906と同様の機能を有する。
【0178】
ブロックマッチング部207は、第1のブロックを、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる。前述した図13のS910と同様である。
【0179】
尚、ブロック選択部206が、第2の画像について任意点を含む第2のブロックを選択する場合、ブロックマッチング部207は、第1の画像を、視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせる。
【0180】
パラメータ決定部208は、任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定する。前述した図13のS908及びS909と同様である。
【0181】
マッチング制御部209は、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する。前述した図13のS907及びS911と同様である。
【0182】
ブロック制御部210は、任意点について、正規化画像座標算出部205と、パラメータ決定部208と、ブロックマッチング部207と、マッチング制御部209と、予測誤差符号化部211と、パラメータ付加部212とを繰り返す。最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する。前述した図13のS904及びS914と同様である。
【0183】
予測誤差符号化部211は、移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する。前述した図13のS912と同様である。
【0184】
パラメータ付加部212は、導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を、符号化データに付加する。前述した図13のS913と同様である。
【0185】
以上、詳細に説明したように、本発明の多視点画像圧縮符号化方法、装置及びプログラムによれば、複数のカメラの光軸に対して、被写体の表面が傾いている場合であっても、ブロックマッチングによって視差ベクトルを検出し、その視差ベクトルを用いて多視点画像を圧縮符号化することができる。MPEGによれば、符号化対象ピクチャの第1のブロック又は参照ピクチャ自体を、任意の奥行き距離Zと、被写体の表面の法線の任意の向きnに基づいて移動及び変形をさせながらブロックマッチングをすることにより、視差ベクトルと共に、一次変換行列も検出する。第1の画像座標を原点として一次変換行列に基づいて変形させたブロック又は画像と、他方のブロックとの予測誤差を導出することにより、予測誤差のデータ量を低減し、高い効率で多視点画像を圧縮符号化することができる。
【0186】
前述した本発明における種々の実施形態によれば、当業者は、本発明の技術思想及び見地の範囲における種々の変更、修正及び省略を容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【図面の簡単な説明】
【0187】
【図1】本発明におけるシステム構成図である。
【図2】図1のシステム構成について、複数のカメラを正面及び側面から見た配置図である。
【図3】図2における各カメラから見た被写体の見え方を表す画面図である。
【図4】被写体の表面を横方向斜めに傾けた場合に、各カメラから撮影した画像である。
【図5】被写体の表面を上下方向斜めに傾けた場合に、各カメラから撮影した画像である。
【図6】被写体の表面を横方向斜めに傾けて、且つ、上下方向斜めに傾けた場合に、各カメラから撮影した画像である。
【図7】2つのカメラにおける第1の相対位置関係の説明図である。
【図8】2つのカメラに回転を加えた第2の相対位置関係の説明図である。
【図9】第1のブロックマッチングの説明図である。
【図10】第2のブロックマッチングの説明図である。
【図11】2つのカメラによる変形ブロックマッチングの説明図である。
【図12】3つ以上のカメラによる変形ブロックマッチングの説明図である。
【図13】本発明におけるフローチャートである。
【図14】本発明における多視点画像圧縮符号化装置の機能構成図である。
【符号の説明】
【0188】
1 カメラ
2 多視点画像圧縮符号化装置
201 位置情報取得部
202 画像取得部
203 カメラ座標系座標変換部
204 任意点選択部
205 正規化画像座標導出部
206 ブロック選択部
207 ブロックマッチング部
208 パラメータ決定部
209 マッチング制御部
210 ブロック制御部
211 予測誤差符号化部
212 パラメータ付加部
3 被写体
【技術分野】
【0001】
本発明は、多視点画像圧縮符号化方法、装置及びプログラムに関する。
【背景技術】
【0002】
異なる位置にあるカメラによって同時に撮影された画像(以下「多視点画像」という)の間には、視差による違いを除けば、強い相関がある。従って、これら画像を一連の映像シーケンスとみなして、動き補償(視差補償)を用いて符号化することにより、情報圧縮をすることができる(例えば特許文献1参照)。
【0003】
多視点画像間の視差補償を行う代表的な方法として、「ブロックマッチング」がある。「ブロックマッチング」を用いた視差ベクトルの検出は、以下のようにしてなされる。
【0004】
第1のカメラ(第1の視点)によって撮影された第1の画像を、小さなブロックに分割する。第1の画像の第1のブロックの各々を、第2のカメラ(他の視点)の第2の画像の中で平行移動させて、最も類似度が高い領域を探索する。具体的には、第1の画像の第1のブロックに対して、絶対値誤差又は2乗誤差が最小となる第2の画像の第2のブロックを探索する。そして、探索された第2のブロックと、第1のブロックとの距離量を視差ベクトルとして算出する。第1のブロックと第2のブロックとの予測誤差を符号化し、視差ベクトルを符号化データに付加することによって、その多視点画像を圧縮符号化することができる。
【0005】
【特許文献1】特開2005−260464号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
従来のブロックマッチングは、第1の画像の中の被写体が、第2の画像の中で平行移動した場合に、ブロックをマッチングさせるものである。複数のカメラから見て、被写体の表面が、そのカメラの光軸に垂直となり、かつ、そのカメラから等距離にある場合にしか、完全なブロックマッチングをさせることができない。
【0007】
しかしながら、複数のカメラの光軸に対して、被写体の表面が傾いている場合には、その被写体の面も異なって見える。即ち、第1の画像の第1のブロックを、第2の画像の中で平行移動させても、第1のブロックと完全にマッチングした第2のブロックを探索することはできない。第1の画像の中の被写体の形状は、第2の画像の中の被写体の形状と異なって射影されたものとなるからである。
【0008】
そこで、本発明は、複数のカメラの光軸に対して、被写体の表面が傾いている場合であっても、ブロックマッチングによって視差ベクトルを検出し、その視差ベクトルを用いた多視点画像圧縮符号化方法、装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第1の画像について任意点を含む第1のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1のブロックを、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする。
【0010】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第8のステップは、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことも好ましい。
【0011】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第2の画像について任意点を含む第2のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1の画像を、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする。
【0012】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第8のステップは、MPEGの予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことも好ましい。
【0013】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、第2から第7のステップを繰り返し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことも好ましい。
【0014】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第1のステップについて、回転変換を表す行列は、以下のものであり、
【数1】
第2のステップについて、任意点の画像座標は、正規化画像座標であり、
回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
第6のステップについて、視差ベクトルは、以下のものであり、
【数2】
一次変換行列は、以下のものである
【数3】
ことも好ましい。
【0015】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、第1のステップの前段にあって、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するステップを有することも好ましい。
【0016】
本発明の多視点画像圧縮符号化方法における他の実施形態によれば、
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことも好ましい。
【0017】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、該任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする。
【0018】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
予測誤差符号化手段は、MPEGの予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことも好ましい。
【0019】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする。
【0020】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
予測誤差符号化手段は、MPEGの予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことも好ましい。
【0021】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
任意点選択手段は、第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、
任意点について、画像座標算出手段と、パラメータ決定手段と、ブロックマッチング手段と、マッチング制御手段と、視差補償手段と、多視点画像圧縮符号化手段とを繰り返すブロック制御手段を更に有し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことも好ましい。
【0022】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
カメラ座標系座標変換手段について、回転変換を表す行列は、以下のものであり、
【数4】
画像座標算出手段は、任意点の画像座標として正規化画像座標を導出し、
回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
ブロックマッチング手段は、視差ベクトルを以下のものとし、
【数5】
一次変換行列を以下のものとする
【数6】
ことも好ましい。
【0023】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換することも好ましい。
【0024】
本発明の多視点画像圧縮符号化装置における他の実施形態によれば、
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことも好ましい。
【0025】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする。
【0026】
本発明によれば、光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
任意点を、回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、任意点を、回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、回転変換を加えた同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする。
【発明の効果】
【0027】
本発明の多視点画像圧縮符号化方法、装置及びプログラムによれば、複数のカメラの光軸に対して、被写体の表面が傾いている場合であっても、ブロックマッチングによって視差ベクトルを検出し、その視差ベクトルを用いて多視点画像を圧縮符号化することができる。MPEGによれば、符号化対象ピクチャの第1のブロック又は参照ピクチャ自体を、任意の奥行き距離Zと、被写体の表面の法線の任意の向きnに基づいて移動及び変形をさせながらブロックマッチングをすることにより、視差ベクトルと共に、一次変換行列も検出する。第1の画像座標を原点として一次変換行列に基づいて変形させたブロック又は画像と、他方のブロックとの予測誤差を導出することにより、予測誤差のデータ量を低減し、高い効率で多視点画像を圧縮符号化することができる。
【発明を実施するための最良の形態】
【0028】
以下では、図面を用いて、本発明を実施するための最良の形態について詳細に説明する。
【0029】
図1は、本発明におけるシステム構成図である。
【0030】
異なる位置に配置された複数のカメラ1が、被写体3を撮影する。複数のカメラ1は、光軸をZ軸に平行として配置されている。但し、それらのカメラは、光軸に垂直な同一平面(XY平面に平行な平面)上には配置されない。即ち、前後左右に散らばって配置されている。図1によれば、9台の縦3列横3列(視点(0,0)〜(2,2))で配置されている。また、複数のカメラ1は、多視点画像圧縮符号化装置2に接続される。本発明によれば、少なくとも2つのカメラによって撮影された多視点画像を必要とする。
【0031】
カメラ1は、被写体3を撮影した画像を多視点画像圧縮符号化装置2へ送信する。ここで、カメラ1が移動可能なものである場合、カメラ位置情報も、多視点画像圧縮符号化装置2へ送信される。勿論、多視点画像圧縮符号化装置2が、全てのカメラ位置情報を予め記憶しているものであってもよい。
【0032】
図2は、図1のシステム構成について、複数のカメラを正面及び側面から見た配置図である。
【0033】
図2によれば、正面から見ると、等幅で縦3列横3列に配置されている。側面から見ると、カメラ(0,1)(1,1)(2,1)がz軸に対して後方に配置されている。即ち、被写体3に対して、複数のカメラ1は、y軸に対して円筒面上に配置されている。
【0034】
図3は、図2における各カメラから見た被写体の見え方を表す画面図である。
【0035】
図3によれば、被写体は、台形状立体である。被写体の正面に、カメラ(1,1)が位置する。カメラ(0,1)(1,1)(2,1)は、z軸に対して後方に配置されているので、被写体が少し小さく見える。また、カメラ(1,1)の前方にあり且つ左側のカメラ(1,0)から見ると、被写体が全体として大きく、且つ、左側が広がり、右側が縮小して見える。また、カメラ(1,1)の前方にあり且つ右側のカメラ(1,2)から見ると、被写体が全体として大きく、且つ、左側が縮小し、右側が広がって見える。
【0036】
同様に、カメラ(1,1)の上側のカメラ(0,1)から見ると、被写体の上側が広がり、下側が縮小して見える。カメラ(1,1)の下側のカメラ(2,1)から見ると、被写体の上側が縮小し、下側が広がって見える。
【0037】
図3からも明らかなとおり、視差を考慮してブロックを移動させても、正確に一致する領域がない。従って、正しいマッチングを取ることができない。
【0038】
図4〜図6には、被写体の表面の傾きによって、各カメラによって撮影される画像を表している。
【0039】
図4は、被写体の表面を横方向斜めに傾けた場合に、各カメラから撮影した画像である。
【0040】
被写体は、左側が奥に、右側が手前にある。このとき、カメラ(1,1)の画像よりも、カメラ(1,1)の前方にあり且つ左側のカメラ(1,0)の画像の方が、被写体が全体として大きく、且つ、横方向に広がって見える。また、カメラ(1,1)の画像よりも、カメラ(1,1)の前方にあり且つ右側のカメラ(1,2)の画像の方が、被写体が全体として大きく、且つ、横方向に狭く見える。
【0041】
図5は、被写体の表面を上下方向斜めに傾けた場合に、各カメラから撮影した画像である。
【0042】
被写体は、上側が奥に、下側が手前にある。このとき、カメラ(1,1)の画像よりも、カメラ(1,1)の上側のカメラ(0,1)の画像の方が、平面が縦方向に広がって見える。また、カメラ(1,1)の画像よりも、カメラ(1,1)の下側のカメラ(2,1)の画像の方が、平面が縦方向に狭く見える。
【0043】
図6は、被写体の表面を横方向斜めに傾けて、且つ、上下方向斜めに傾けた場合に、各カメラから撮影した画像である。即ち、図4の傾きと図5の傾きとを合わせたものである。
【0044】
図3、図4〜図6に表されたように、このような見え方の差異は、複数のカメラの光軸に対して、被写体の台形状立体の側面が傾いているために生じる。本発明によれば、カメラの光軸に対して被写体の表面が傾いている場合であっても、第1のブロックと完全にマッチングした第2のブロックを探索することができる。
【0045】
図7は、2つのカメラにおける第1の相対位置関係の説明図である。
【0046】
一般に、被写体は平面ではないため、ブロックの変形も非線形になる。しかしながら、充分に小さなブロックに着目すると、ブロック内の被写体の面は平面に近似できる。また、2つのカメラは、光軸を平行に、第1の相対的位置(tx,ty,tz)で配置される。図7によれば、被写体に対して、カメラCとカメラC’のxy平面は、異なる位置にある。従って、tz≠0である。
【0047】
図8は、2つのカメラに回転を加えた第2の相対位置関係の説明図である。
【0048】
本発明によれば、カメラ内部パラメータを用いて、カメラCとカメラC’に同一の回転変換を加える。この回転Rは、カメラC及びカメラC’の光軸が、カメラC及びカメラC’を通る同一平面に対して垂直となるようにする。このように、カメラCのカメラ座標系座標と、カメラC’のカメラ座標系座標とを変換する。これにより、カメラC及びカメラC’の第2の相対的位置は、(tRx,tRy,0)となる。即ち、tRz=0で表される。
【0049】
カメラ座標系座標に回転Rを加えて、そのxy平面から被写体の任意点までの奥行き距離ZRと、近似平面の向き(単位法線ベクトル)nRとを、ブロックマッチングのパラメータとして用いる。
【0050】
図9は、第1のブロックマッチングの説明図である。
【0051】
予測符号化方式に、MPEGを適用する。図9によれば、符号化対象ピクチャ(第1の画像)について任意点を含む第1のブロックを選択する。次に、任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定する。そして、第1のブロックを、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、参照ピクチャのブロックにマッチングさせる。
【0052】
図9は、第2のブロックマッチングの説明図である。
【0053】
図9によれば、符号化対象ピクチャ(第2の画像)について任意点を含む第2のブロックを選択する。次に、任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定する。そして、参照ピクチャ(第1の画像)を、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、符号化対象ピクチャの第2のブロックにマッチングさせる。
【0054】
以下では、ブロック又は画像の移動及び変形となる一次変換行列の導出過程を詳細に説明する。
【0055】
最初に、カメラの内部パラメータ(内部カメラ行列)Aは、以下の式で表される。この値は、既知であるとする。
【数7】
fku、fkv:焦点距離(カメラの距離のピクセル数)
θ=π/2:座標軸の角度
u0、v0:画像中心
【0056】
カメラCのカメラ座標系を平行移動(相対的位置t)させて、カメラC’のカメラ座標系が得られる。tは、カメラの外部パラメータの1つであり、カメラCのカメラ座標系に対するカメラC’の変位ベクトルを表す。カメラC及びC’は、光軸を平行に配置される。また、カメラCのカメラ座標系に対するカメラC’の相対的位置ベクトルtは、z軸成分を必ず非0とする(tZ≠0)。
【数8】
【0057】
カメラCのカメラ座標系座標と、カメラC’のカメラ座標系座標との間には、以下の関係が成り立つ。即ち、カメラCのカメラ座標系座標が、カメラの外部パラメータを通じて、カメラC’のカメラ座標系座標に変換される。
M=M’+t 式(2)
M:カメラCにおける被写体の任意点Pのカメラ座標系座標
M’:カメラC’における被写体の任意点Pのカメラ座標系座標
【数9】
【0058】
ここで、被写体の近似平面πに対して、カメラC’のカメラ座標系では以下の式が成り立つ。
nTM’=d 式(5)
n(|n|=1):カメラC’のカメラ座標系における平面の法線ベクトル
【数10】
d:カメラC’のカメラ座標系の原点から平面までの距離
【0059】
次に、任意点Pのディジタル画像座標を、以下のようにする。
m:カメラCにおける任意点Pのディジタル画像座標
m’:カメラC’における任意点Pのディジタル画像座標
【数11】
【0060】
また、任意点Pの正規化画像座標を、以下のようにする。「正規化画像」とは、画像平面が焦点から単位長のところにあるカメラ(正規化カメラ)で撮影したと仮定した場合の画像をいう。正規化画像における任意点の座標を、「正規化画像座標」という。
x:任意点PのカメラCにおける正規化画像座標
x’:任意点PのカメラC’における正規化画像座標
【数12】
【0061】
これにより、以下の中心射影変換が成立する。
【数13】
【0062】
次に、式(9)に式(7)及び式(3)を代入すると、以下の式が導出される。
【数14】
【0063】
両辺の3行目を比較すると、s=Zが導かれる。
【0064】
これを式(9)に代入すると、以下の式が導出される。
【数15】
【0065】
一方で、式(10)に式(2)を代入すると、以下の式が成立する。
【数16】
【0066】
式(1)、式(3)、式(4)、及び式(8)を代入して、以下の式が導出される。
【数17】
【0067】
両辺の3行目を比較すると、s’=Z’=Z−tzが導出される。
【0068】
これを式(10)に代入すると、以下の式が導出される。
【数18】
【0069】
次に、カメラCのカメラ座標系を回転変換し、tを、それをXY平面に正射影したベクトルtxyの方向に一致させることを考える。但し、txyは、以下のようになる。
【数19】
【0070】
一般に、単位ベクトルrを回転軸とする角度θの回転を表す行列Rは、Rodriguesの公式により、以下のように表される。
【数20】
【0071】
ここで、以下のものである。
【数21】
【0072】
rは、t及びtxyと直交するので、以下の式になる。
【数22】
【0073】
回転角度をθとすると、以下の式となる。
【数23】
【0074】
以上より、式(14)及び式(15)を式(13)に代入すると、求める回転変換行列は、以下のようになる。
【数24】
【0075】
同様に、逆変換の行列は、以下のようになる。
【数25】
【0076】
回転変換行列Rを用いて、平行移動ベクトルt、近似平面πの単位法線ベクトルnを回転変換する。回転変換した結果をそれぞれ、tR、nRとおくと、以下のようになる。
【数26】
【0077】
回転変換後のカメラCのカメラ座標系座標と、回転変換後のカメラC’のカメラ座標系座標との間には、以下の関係が成り立つ。即ち、カメラCのカメラ座標系座標が、カメラの外部パラメータを通じて、カメラC’のカメラ座標系座標に変換される。
MR=MR’+tR 式(20)
MR:回転変換後のカメラCにおける被写体の任意点Pのカメラ座標系座標
MR’:回転変換後のカメラC’における被写体の任意点Pのカメラ座標系座標
【数27】
【0078】
ここで、被写体の近似平面πに対して、回転変換後のカメラC’のカメラ座標系では、近似平面πとカメラC’との距離dの値は回転変換によって不変であるから、以下の式が成り立つ。
nRTMR’=d 式(23)
∴nRTMR’/d=1 式(24)
【0079】
式(24)を、式(20)に代入すると、以下の平面射影変換の式が得られる。
【数28】
【0080】
Hをホモグラフィ行列とすると、以下のようになる。
【数29】
【0081】
次に、任意点Pのディジタル画像座標を、以下のようにする。
mR:回転変換後のカメラCにおける任意点Pのディジタル画像座標
mR’:回転変換後のカメラC’における任意点Pのディジタル画像座標
【数30】
【0082】
また、任意点Pの正規化画像座標を、以下のようにする。
xR:回転変換後の任意点PのカメラCにおける正規化画像座標
xR’:回転変換後の任意点PのカメラC’における正規化画像座標
【数31】
【0083】
これにより、中心射影変換として、以下の式が成立する。
【数32】
【0084】
式(28)に式(26)及び式(21)式を代入すると、以下の式が導出される。
【数33】
【0085】
両辺の3行目を比較すると、sR=ZRが導かれる。
【0086】
これを式(28)に代入すると、以下の式が導出される。
【数34】
【0087】
一方で、式(29)に式(20)を代入すると、以下の式が成立する。
【数35】
【0088】
式(21)、式(22)、式(1)、式(18)及び式(27)を代入して、以下の式を導出する。
【数36】
【0089】
両辺の3行目を比較すると、
sR’=ZR’=ZR 式(41)
が導かれる。
【0090】
これを、式(29)に代入すると、以下の式が成立する。
【数37】
【0091】
従って、式(23)に代入すると、以下の式が成立する。
【数38】
【0092】
式(19)及び式(27)を代入すると、以下の式が成立する。
d=ZR(nRxxR’+nRyyR’+nRz) 式(31)
【0093】
式(31)を式(13)に代入すると、以下の式が導出される。
【数39】
【0094】
また、xとxRの変換式、及び、x’とxR’の変換式を求める。簡単のため、以下のように定義する。
【数40】
【0095】
そうすると、式(11)より、以下のようになる。
【数41】
【0096】
両辺の3行目を比較すると、以下の式となる。
【数42】
【0097】
これにより、以下の式が成立する。
【数43】
【0098】
また、式(32)に式(41)を代入すると、以下の式となり、Z,t,x’,y’からZRが導出できる。
【数44】
【0099】
ここで、式(40)において、カメラ座標系座標MR及びMR’に代えて、正規化画像座標xR及びxR’を用いると、以下の変換式が得られる。
【数45】
【0100】
両辺の3行目を比較すると、sR=1が導かれる。
【0101】
これを式(35)に代入すると、以下の式が成立する。
【数46】
【0102】
更に、ディジタル画像座標mR及びmR’を用いると、以下の変換式が得られる。
【数47】
【0103】
正規化画像座標系における視差ベクトルをDとすると、以下の式が成り立つ。
【数48】
【0104】
【数49】
【0105】
右辺及び左辺の差を求めると、以下の式が成り立つ。
【数50】
【0106】
回転変換した第2の画像の第2のブロックについて、回転変換した第1の画像の中を、以下のDの平行移動をさせて、第1の画像座標(xR,yR)を原点として以下のLの一次変換行列で変形をさせることにより、第2のブロックに最も類似するような、第1の画像のブロックを探索する。一次変換行列によれば、視差ベクトルと、被写体の(平面に近似された)面の傾きとに基づいてブロックを変形し、ブロックマッチングをすることができる。
【0107】
【数51】
【0108】
ここで、参照ピクチャと符号化対象ピクチャとを圧縮符号化する方法を説明する。
【0109】
最初に、符号化対象ピクチャを、画面内予測符号化する。次に、参照ピクチャを複数のブロックに分割し、各ブロックに対して前述の平行移動D及び一次変換行列Lに基づいて、第1の画像座標(x,y)を原点として変形させる。そして、予測誤差が最小となる参照ピクチャのブロック(参照ブロック)を求め、その際の平行移動ベクトルDと一次変換行列L(即ち、奥行き距離Z及び単位法線ベクトル(nx,ny,nz))を導出する。ここで、当該ブロックと、変形した参照ブロックとを比較して予測誤差を算出するために、変形した参照ブロックを線形補間等によって補間し、当該ブロックの各画素と比較するための対応する画素値を算出する。例えば、線形補間を用いる場合は、図Xの点Xの画素値は、周辺4点(A,B,C,D)の画素値を用いて、以下の式から求める。
X=(1−dx)(1−dy)A+dx(1−dy)B+(1−dy)dyC+dxdyD
【0110】
最後に、予測誤差を圧縮符号化し、奥行き距離Z(又は平行移動ベクトルD)と単位法線ベクトル(nx,ny,nz)を符号化する。
【0111】
但し、第1の画像の参照ブロックとの予測誤差を符号化するよりも、第2の画像の中で画面内予測符号化する方が、圧縮効率が高くなる場合は、第2の画像の中で画面内予測符号化をする。
【0112】
以下では、具体的な実施例を説明する。
【0113】
第1に、同一平面上に無い2台のカメラの画像に対してブロックマッチングを行う場合の実施例を示す。
【0114】
カメラの内部パラメータA及び相対的位置ベクトルtは、事前に得られていることが前提である。簡単のため、以下のように定義する。
【数52】
【0115】
この相対的位置ベクトルtは、2台のカメラが半径Rの円周上に角度θだけ離れて設置してある状況に相当する。
【0116】
まず、カメラCの画像の中の点M0に着目する。点M0のディジタル画像座標m0が、以下の値であったとする。
【数53】
【0117】
そこで、正規化画像座標に変換する。点M0の正規化画像座標x0は、以下の値になる。
【数54】
【0118】
同様にして、カメラCの画像及びカメラC’の画像を、ディジタル画像座標から正規化画像座標に変換する。
【0119】
次に、カメラCの画像及びカメラC’の画像を回転変換する。回転変換行列は、式(16)に基づくと、下記の通りである。
【数55】
【0120】
相対的位置ベクトルは、式(18)に基づき、下記のベクトルに変換される。
【数56】
【0121】
式(33)に基づき、回転変換する。例えば、点M0は下記の点MR0に変換される。
【数57】
【0122】
点M0を左上端とする、大きさW×Hのブロックで探索を行うとする。
【0123】
本発明によれば、法線ベクトル(nx、ny、nz)及び奥行き距離Zを、任意に変化させてブロックマッチングを行う。例えば、nx=0、ny=1、nz=0、Z=R/2の時、回転変換された座標系における、奥行き距離、法線ベクトルは、式(32)及び式(19)を用いて、以下のようになる。
【数58】
【0124】
従って、この時の視差ベクトルD0は、式(37)より、以下のようになる。
【数59】
【0125】
また、この時の一次変換行列L0は、式(38)より、以下のようになる。
【数60】
【0126】
このとき、ブロックマッチングの誤差が最小であったならば、D0及びL0が目的の視差ベクトルと一次変換行列であることになる。
【0127】
第2に、同一平面上にあるK台のカメラの画像に対してブロックマッチングを行う場合の実施例を示す。
【0128】
カメラの内部パラメータA及び相対的位置ベクトルtk(第0カメラをベースカメラとして、第0カメラに対する第kカメラの相対的位置ベクトルを示す。k=1〜K−1)は、事前に得られていることが前提である。簡単のため、以下のようであったとする。
【数61】
【0129】
この相対的位置ベクトルtkは、K台のカメラがX軸上にΔ間隔で設置してある状況に相当する。
【0130】
まず、第0カメラの画像の中の点M0に着目する。点M0のディジタル画像座標m0が、以下の値であったとする。
【数62】
【0131】
そこで、正規化画像座標に変換する。点M0の正規化画像座標x0は、以下の値になる。
【数63】
【0132】
同様にして、他のK−1台のカメラの画像を、ディジタル画像座標から正規化画像座標に変換する。
【0133】
本発明によれば、法線ベクトル(nx、ny、nz)及び奥行き距離Zを、任意に変化させてブロックマッチングを行う。例えば、nx=nx0、ny=ny0、nz=nz0、Z=Z0の時、第0カメラの画像の中の点M0に対する第kカメラの画像の対応点の視差ベクトルDkは、以下のようになる。
【数64】
【0134】
また、第0カメラの画像の中のブロックに対する第kカメラの画像の中のブロックの一次変換行列Lkは、以下のようになる。
【数65】
【0135】
ここで、法線ベクトル(nx、ny、nz)及び奥行き距離Zは固定したまま(nx=nx0、ny=ny0、nz=nz0、Z=Z0)で、各カメラにおいて、Dkに基づいて平行移動しLkに基づいて一次変換したブロックを比較し、両者(第0カメラの画像と第kカメラの画像の中の対応するブロック同士)の差分を評価する。例えば、最小自乗誤差を求める。
【0136】
第0カメラの画像と第kカメラの画像の中の対応するブロック同士の差分の評価値をdkとおく。この時、法線ベクトルと奥行き距離の各組合せに対して、以下のように算出する。
【数66】
【0137】
このSを最小化する、法線ベクトルと奥行き距離の組合せが、目的の視差ベクトルと一次変換行列であることになる。
【0138】
第3に、同一平面上に無いK台のカメラの画像に対してブロックマッチングを行う場合の実施例を示す。
【0139】
カメラの内部パラメータA及び相対的位置ベクトルtk(第0カメラをベースカメラとして、第0カメラに対する第kカメラの相対的位置ベクトルを示す。k=1〜K−1)は、事前に得られていることが前提である。簡単のため、以下のようであったとする。
【数67】
【0140】
この相対的位置ベクトルtkは、K台のカメラが半径Rの円周上に角度Θ間隔で設置してある状況に相当する。
【0141】
まず、第0カメラの画像の中の点M0に着目する。点M0のディジタル画像座標m0が、以下の値であったとする。
【数68】
【0142】
そこで、正規化画像座標に変換する。点M0の正規化画像座標x0は、以下の値になる。
【数69】
【0143】
同様にして、他のK−1台のカメラの画像を、ディジタル画像座標から正規化画像座標に変換する。
【0144】
次に、K台のカメラの画像を回転変換する。第0カメラと第kカメラの組合せにおける回転変換行列は、式(16)に基づくと、以下のようになる。
【数70】
【0145】
第0カメラと第kカメラの組合せにおける相対的位置ベクトルは、式(18)に基づき、下記のベクトルに変換される。
【数71】
【0146】
式(33)に基づき、回転変換する。例えば、点M0は下記の点Mkに変換される。
【数72】
【0147】
点M0を左上端とするブロックで探索を行うとする。
【0148】
本発明によれば、法線ベクトル(nx、ny、nz)及び奥行き距離Zを、任意に変化させてブロックマッチングを行う。例えば、nx=0、ny=1、nz=0、Z=R/2の時、第0カメラと第kカメラの組合せで回転変換された座標系における、奥行き距離、法線ベクトルは、式(32)及び式(19)を用いて、以下のようになる。
【数73】
【0149】
従って、この時の第0カメラと第kカメラの組合せにおける視差ベクトルDkは、式(37)より、以下のようになる。
【数74】
【0150】
また、この時の第0カメラと第kカメラの組合せにおける一次変換行列Lkは、式(38)より、以下のようになる。
【数75】
【0151】
ここで、法線ベクトル(nx、ny、nz)及び奥行き距離Zは固定したまま(nx=0、ny=1、nz=0、Z=R/2)で、各カメラにおいて、Dkに基づいて平行移動しLkに基づいて一次変換したブロックを比較し、両者(第0カメラの画像と第kカメラの画像の中の対応するブロック同士)の差分を評価する。例えば、最小自乗誤差を求める。
【0152】
第0カメラの画像と第kカメラの画像の中の対応するブロック同士の差分の評価値をdkとおく。この時、法線ベクトルと奥行き距離の各組合せに対して、以下のように算出する。
【数76】
【0153】
このSを最小化する、法線ベクトルと奥行き距離の組合せが、目的の視差ベクトルと一次変換行列であることになる。
【0154】
このとき、ブロックマッチングの誤差が最小であったならば、D0及びL0が目的の視差ベクトルと一次変換行列であることになる。
【0155】
図11は、2つのカメラによる変形ブロックマッチングの説明図である。
【0156】
図11によれば、各画像について1対1の組み合わせによって、独立に変形ブロックマッチングをする。この場合、組み合わせ毎に、異なる奥行き距離と法線ベクトルとが必要となり、大きい計算量を要する。
【0157】
図12は、3つ以上のカメラによる変形ブロックマッチングの説明図である。
【0158】
図12によれば、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、その予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する。1組の奥行き距離及び法線ベクトルによって、全ての画像の対応ブロックのマッチングをとることができる。
【0159】
図13は、本発明におけるフローチャートである。尚、図13は、図9のマッチングに基づいて説明する。
【0160】
(S901)全てのカメラの位置情報を取得する。全てのカメラは、光軸を平行に且つ該光軸に垂直な同一平面上に配置されている。従って、第1のカメラに対する第2のカメラの世界座標系の第1の相対的位置(tx,ty,tz)を取得する。カメラは、移動可能なものであってもよい。カメラ自体が、例えばGPS等の測位機能を備えている場合、その位置情報を受信する。尚、カメラが固定なものであれば、その位置情報は予め登録されているものであってもよい。
【0161】
(S902)全てのカメラの画像を取得する。ここで、第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する。
【0162】
(S903)第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する。回転変換を表す行列は、以下のものである。
【数77】
【0163】
(S904)被写体上の任意点を決定する。
(S905)任意点を、回転変換を加えた符号化対象ピクチャに射影した第1の画像座標(x,y)と、該任意点を、回転変換を加えた参照ピクチャに射影した第2の画像座標(x',y')とを導出する。ここで、任意点の画像座標は、正規化画像座標である。
(S906)符号化対象ピクチャについて任意点を含む第1のブロックを選択する。
【0164】
(S907)以下、S907〜S910を繰り返す。
(S908)任意点の奥行き距離Zを任意に決定する。
(S909)被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)を任意に決定する。
【0165】
(S910)ここで、回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR',yR')が得られたとする。そうすると、視差ベクトルは、以下のものとなる。
【数78】
一次変換行列は、以下のものである。
【数79】
【0166】
第1のブロックを、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、参照ピクチャのブロックにマッチングさせる。
【0167】
(S911)奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、S906〜S909を繰り返す。そして、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索する。結果的に、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する。
【0168】
(S912)移動させ且つ変形させた符号化対象ピクチャの第1のブロックと最も類似する参照ピクチャの第2のブロックとの予測誤差を導出し且つ符号化する。予測誤差の符号化方式は、MPEGに規定された一般的なものである。
(S913)奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を、符号化データに付加する。
【0169】
(S914)符号化対象ピクチャの第1のブロック以外の部分について被写体上の任意点を更に決定し、S904〜S913を繰り返す。
【0170】
図14は、本発明における多視点画像圧縮符号化装置の機能構成図である。
【0171】
図14によれば、多視点画像圧縮符号化装置2は、位置情報取得部21と、画像取得部22と、カメラ座標系座標変換部203と、任意点選択部204と、正規化画像座標導出部205と、ブロック選択部206と、ブロックマッチング部207と、パラメータ決定部208と、マッチング制御部209と、ブロック制御部210と、予測誤差符号化部211と、パラメータ付加部212とを有する。これら機能部は、コンピュータによって実行されるプログラムによっても実現できる。
【0172】
位置情報取得部21は、全てのカメラの位置情報を取得する。前述した図13のS901と同様の機能を有する。
【0173】
画像取得部22は、全てのカメラから同期した画像を取得する。前述した図13のS902と同様の機能を有する。
【0174】
カメラ座標系座標変換部203は、第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する。前述した図13のS903と同様の機能を有する。
【0175】
任意点選択部204は、被写体上の任意点を決定する。任意点選択部204は、ブロック制御部210からの指示に応じて、第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定する。前述した図13のS904と同様の機能を有する。
【0176】
正規化画像座標導出部205は、任意点を、回転変換を加えた第1の画像に射影した第1の正規化画像座標(x,y)と、任意点を、回転変換を加えた第2の画像に射影した第2の正規化画像座標(x',y')とを導出する。前述した図13のS905と同様の機能を有する。
【0177】
ブロック選択部206は、第1の画像について任意点を含む第1のブロックを選択する。前述した図13のS906と同様の機能を有する。
【0178】
ブロックマッチング部207は、第1のブロックを、第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR',yR')に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる。前述した図13のS910と同様である。
【0179】
尚、ブロック選択部206が、第2の画像について任意点を含む第2のブロックを選択する場合、ブロックマッチング部207は、第1の画像を、視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせる。
【0180】
パラメータ決定部208は、任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定する。前述した図13のS908及びS909と同様である。
【0181】
マッチング制御部209は、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する。前述した図13のS907及びS911と同様である。
【0182】
ブロック制御部210は、任意点について、正規化画像座標算出部205と、パラメータ決定部208と、ブロックマッチング部207と、マッチング制御部209と、予測誤差符号化部211と、パラメータ付加部212とを繰り返す。最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する。前述した図13のS904及びS914と同様である。
【0183】
予測誤差符号化部211は、移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する。前述した図13のS912と同様である。
【0184】
パラメータ付加部212は、導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を、符号化データに付加する。前述した図13のS913と同様である。
【0185】
以上、詳細に説明したように、本発明の多視点画像圧縮符号化方法、装置及びプログラムによれば、複数のカメラの光軸に対して、被写体の表面が傾いている場合であっても、ブロックマッチングによって視差ベクトルを検出し、その視差ベクトルを用いて多視点画像を圧縮符号化することができる。MPEGによれば、符号化対象ピクチャの第1のブロック又は参照ピクチャ自体を、任意の奥行き距離Zと、被写体の表面の法線の任意の向きnに基づいて移動及び変形をさせながらブロックマッチングをすることにより、視差ベクトルと共に、一次変換行列も検出する。第1の画像座標を原点として一次変換行列に基づいて変形させたブロック又は画像と、他方のブロックとの予測誤差を導出することにより、予測誤差のデータ量を低減し、高い効率で多視点画像を圧縮符号化することができる。
【0186】
前述した本発明における種々の実施形態によれば、当業者は、本発明の技術思想及び見地の範囲における種々の変更、修正及び省略を容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【図面の簡単な説明】
【0187】
【図1】本発明におけるシステム構成図である。
【図2】図1のシステム構成について、複数のカメラを正面及び側面から見た配置図である。
【図3】図2における各カメラから見た被写体の見え方を表す画面図である。
【図4】被写体の表面を横方向斜めに傾けた場合に、各カメラから撮影した画像である。
【図5】被写体の表面を上下方向斜めに傾けた場合に、各カメラから撮影した画像である。
【図6】被写体の表面を横方向斜めに傾けて、且つ、上下方向斜めに傾けた場合に、各カメラから撮影した画像である。
【図7】2つのカメラにおける第1の相対位置関係の説明図である。
【図8】2つのカメラに回転を加えた第2の相対位置関係の説明図である。
【図9】第1のブロックマッチングの説明図である。
【図10】第2のブロックマッチングの説明図である。
【図11】2つのカメラによる変形ブロックマッチングの説明図である。
【図12】3つ以上のカメラによる変形ブロックマッチングの説明図である。
【図13】本発明におけるフローチャートである。
【図14】本発明における多視点画像圧縮符号化装置の機能構成図である。
【符号の説明】
【0188】
1 カメラ
2 多視点画像圧縮符号化装置
201 位置情報取得部
202 画像取得部
203 カメラ座標系座標変換部
204 任意点選択部
205 正規化画像座標導出部
206 ブロック選択部
207 ブロックマッチング部
208 パラメータ決定部
209 マッチング制御部
210 ブロック制御部
211 予測誤差符号化部
212 パラメータ付加部
3 被写体
【特許請求の範囲】
【請求項1】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第1の画像について任意点を含む第1のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZR’と単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1のブロックを、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする多視点画像圧縮符号化方法。
【請求項2】
第8のステップは、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことを特徴とする請求項1に記載の多視点画像圧縮符号化方法。
【請求項3】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第2の画像について任意点を含む第2のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1の画像を、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする多視点画像圧縮符号化方法。
【請求項4】
第8のステップは、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことを特徴とする請求項3に記載の多視点画像圧縮符号化方法。
【請求項5】
第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、第2から第7のステップを繰り返し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことを特徴とする請求項1から4のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項6】
第1のステップについて、前記回転変換を表す行列は、以下のものであり、
【数1】
第2のステップについて、任意点の画像座標は、正規化画像座標であり、
前記回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
第6のステップについて、視差ベクトルは、以下のものであり、
【数2】
前記一次変換行列は、以下のものである
【数3】
ことを特徴とする請求項1から5のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項7】
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、第1のステップの前段にあって、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するステップを有する
ことを特徴とする請求項1から6のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項8】
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことを特徴とする請求項1から7のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項9】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、該任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする多視点画像圧縮符号化装置。
【請求項10】
前記予測誤差符号化手段は、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことを特徴とする請求項9に記載の多視点画像圧縮符号化装置。
【請求項11】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする多視点画像圧縮符号化装置。
【請求項12】
予測誤差符号化手段は、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことを特徴とする請求項11に記載の多視点画像圧縮符号化装置。
【請求項13】
前記任意点選択手段は、第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、
前記任意点について、画像座標算出手段と、パラメータ決定手段と、ブロックマッチング手段と、マッチング制御手段と、視差補償手段と、多視点画像圧縮符号化手段とを繰り返すブロック制御手段を更に有し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことを特徴とする請求項9から12のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項14】
前記カメラ座標系座標変換手段について、前記回転変換を表す行列は、以下のものであり、
【数4】
前記画像座標算出手段は、前記任意点の画像座標として正規化画像座標を導出し、
前記回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
前記ブロックマッチング手段は、前記視差ベクトルを以下のものとし、
【数5】
前記一次変換行列を以下のものとする
【数6】
ことを特徴とする請求項9から13のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項15】
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する
ことを特徴とする請求項9から14のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項16】
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことを特徴とする請求項9から15のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項17】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする多視点画像圧縮符号化プログラム。
【請求項18】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする多視点画像圧縮符号化プログラム。
【請求項1】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第1の画像について任意点を含む第1のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZR’と単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1のブロックを、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする多視点画像圧縮符号化方法。
【請求項2】
第8のステップは、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことを特徴とする請求項1に記載の多視点画像圧縮符号化方法。
【請求項3】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化方法であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する第1のステップと、
被写体上の任意点を決定する第2のステップと、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する第3のステップと、
第2の画像について任意点を含む第2のブロックを選択する第4のステップと、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出する第5のステップと、
第1の画像を、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせる第6のステップと、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、第5及び第6のステップを繰り返し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する第7のステップと、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する第8のステップと、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加する第9のステップと
を有することを特徴とする多視点画像圧縮符号化方法。
【請求項4】
第8のステップは、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことを特徴とする請求項3に記載の多視点画像圧縮符号化方法。
【請求項5】
第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、第2から第7のステップを繰り返し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことを特徴とする請求項1から4のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項6】
第1のステップについて、前記回転変換を表す行列は、以下のものであり、
【数1】
第2のステップについて、任意点の画像座標は、正規化画像座標であり、
前記回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
第6のステップについて、視差ベクトルは、以下のものであり、
【数2】
前記一次変換行列は、以下のものである
【数3】
ことを特徴とする請求項1から5のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項7】
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、第1のステップの前段にあって、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するステップを有する
ことを特徴とする請求項1から6のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項8】
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことを特徴とする請求項1から7のいずれか1項に記載の多視点画像圧縮符号化方法。
【請求項9】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、該任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする多視点画像圧縮符号化装置。
【請求項10】
前記予測誤差符号化手段は、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は符号化対象ピクチャであり、第2の画像は参照ピクチャである
ことを特徴とする請求項9に記載の多視点画像圧縮符号化装置。
【請求項11】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いた多視点画像圧縮符号化装置であって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
を有することを特徴とする多視点画像圧縮符号化装置。
【請求項12】
予測誤差符号化手段は、MPEG(Moving Picture Experts Group)の予測誤差符号化方式を用いており、
第1の画像は参照ピクチャであり、第2の画像は符号化対象ピクチャである
ことを特徴とする請求項11に記載の多視点画像圧縮符号化装置。
【請求項13】
前記任意点選択手段は、第1の画像の第1のブロック以外の部分について被写体上の任意点を更に決定し、
前記任意点について、画像座標算出手段と、パラメータ決定手段と、ブロックマッチング手段と、マッチング制御手段と、視差補償手段と、多視点画像圧縮符号化手段とを繰り返すブロック制御手段を更に有し、
最終的に、第1の画像及び第2の画像の全ての部分を圧縮符号化する
ことを特徴とする請求項9から12のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項14】
前記カメラ座標系座標変換手段について、前記回転変換を表す行列は、以下のものであり、
【数4】
前記画像座標算出手段は、前記任意点の画像座標として正規化画像座標を導出し、
前記回転変換の結果、新たな奥行き距離ZR及び新たな単位法線ベクトル(nRx,nRy,nRz)と、任意の視点の新たな相対的位置(tRx,tRy,0)及び新たな画像座標(xR’,yR’)が得られたとし、
前記ブロックマッチング手段は、前記視差ベクトルを以下のものとし、
【数5】
前記一次変換行列を以下のものとする
【数6】
ことを特徴とする請求項9から13のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項15】
第1のカメラ及び/又は第2のカメラの光軸がZ軸に平行でない場合に、
第1のカメラと第2のカメラの光軸がZ軸に平行となるように、カメラ内部パラメータを用いて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換する
ことを特徴とする請求項9から14のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項16】
3つ以上のカメラが配置された場合であっても、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)は一定であって、
第7のステップにおいて、1つのベースカメラのブロックに対する他のカメラのブロックとの予測誤差を算出し、該予測誤差の総和が最小となる奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出する
ことを特徴とする請求項9から15のいずれか1項に記載の多視点画像圧縮符号化装置。
【請求項17】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第1の画像について任意点を含む第1のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1のブロックを、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする多視点画像圧縮符号化プログラム。
【請求項18】
光軸をZ軸に平行とする第1のカメラ及び第2のカメラが、第1の相対的位置(tx,ty,tz)(ただし、tz≠0)で配置されており、被写体を撮影した第1のカメラの第1の画像と第2のカメラの第2の画像とを用いて、多視点画像を圧縮符号化するようにコンピュータを機能させる多視点画像圧縮符号化プログラムであって、
第1のカメラ及び第2のカメラの光軸が第1のカメラと第2のカメラを通る同一平面に対して垂直となるように、カメラ内部パラメータを用いて、第1のカメラ及び第2のカメラに同一の回転変換を加えて、第1のカメラのカメラ座標系座標及び第2のカメラのカメラ座標系座標を変換するカメラ座標系座標変換手段と、
被写体上の任意点を決定する任意点選択手段と、
前記任意点を、前記回転変換を加えた第1のカメラの第1の画像に射影した第1の画像座標(xR,yR)と、前記任意点を、前記回転変換を加えた第2のカメラの第2の画像に射影した第2の画像座標(xR’,yR’)とを導出する画像座標算出手段と、
第2の画像について任意点を含む第2のブロックを選択するブロック選択手段と、
任意点の奥行き距離Zと、被写体の表面の任意点における単位法線ベクトル(nx,ny,nz)とを任意に決定し、前記回転変換を加えた前記同一平面に対する奥行き距離ZRと単位法線ベクトル(nRx,nRy,nRz)を導出するパラメータ決定手段と、
第1の画像を、前記回転変換を加えた第2の相対的位置(tRx,tRy,0)及び奥行き距離ZRに基づく視差ベクトルで移動させ、第1の画像座標(xR,yR)を原点として、第2の相対的位置(tRx,tRy,0)、奥行き距離ZR、単位法線ベクトル(nRx,nRy,nRz)及び第2の画像座標(xR’,yR’)に基づく一次変換行列で変形させて、第2の画像の第2のブロックにマッチングさせるブロックマッチング手段と、
奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を任意に変更しながら、パラメータ決定手段及びブロックマッチング手段を繰り返し制御し、移動させ且つ変形させた第1の画像の第1のブロックに最も類似する第2の画像の第2のブロックを探索し、奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を導出するマッチング制御手段と、
移動させ且つ変形させた第1の画像の第1のブロックと最も類似する第2の画像の第2のブロックとの予測誤差を導出し且つ符号化する予測誤差符号化手段と、
導出された奥行き距離Z及び単位法線ベクトル(nx,ny,nz)を符号化データに付加するパラメータ付加手段と
してコンピュータを機能させることを特徴とする多視点画像圧縮符号化プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2008−22421(P2008−22421A)
【公開日】平成20年1月31日(2008.1.31)
【国際特許分類】
【出願番号】特願2006−193840(P2006−193840)
【出願日】平成18年7月14日(2006.7.14)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
【公開日】平成20年1月31日(2008.1.31)
【国際特許分類】
【出願日】平成18年7月14日(2006.7.14)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
[ Back to top ]