説明

画像処理装置、画像処理方法およびプログラム

【課題】画像中の特定領域の位置・姿勢を高精度に推定可能な、画像処理装置、画像処理方法およびプログラムを提供する。
【解決手段】入力画像I1の特徴点を抽出する特徴点抽出部11と、参照画像Rとの間で特徴点の対応関係を決定するマッチング部12と、対応関係に基づき入力画像I1と参照画像Rの射影関係を算出するホモグラフィ算出部13と、射影関係に基づき入力画像I1の少なくとも一部を変換する画像変換部14とを備え、ホモグラフィ算出部13は、入力画像I1について、参照画像Rとの間で特徴点の対応関係に基づきホモグラフィ行列H1を算出し、画像変換部14によりホモグラフィ行列H1に基づき変換された入力画像I1について、参照画像Rとの間で特徴点の対応関係に基づきホモグラフィ行列H2を算出し、ホモグラフィ行列H1、H2に基づき入力画像I1と参照画像Rの射影関係を再び算出する

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法およびプログラムに関する。
【背景技術】
【0002】
近年、拡張現実感(Augumented Reality:AR)に対するニーズが高まりつつある。拡張現実感は、例えば、入力画像中の特定領域(または特定物体)を基準として、コンピュータ画像等の付加画像を入力画像に合成することで付与される。この場合、拡張現実感の品質は、入力画像中での特定領域の位置・姿勢の推定精度に大きく左右される。
【0003】
このような画像処理では、入力画像中の特定領域(マーカー)を指定するために、マーカーに相当する参照画像が用いられる。そして、入力画像の特徴点を抽出し、参照画像との間で特徴点の対応関係を決定し、対応関係に基づき入力画像と参照画像の射影関係を算出することで、入力画像中でのマーカーの位置・姿勢が推定される。そして、射影関係に基づき付加画像が変換され、変換後の付加画像がマーカーを基準として入力画像に合成される。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、マーカーの位置・姿勢の推定結果には誤差が伴う。特に、入力画像が動画である場合、カメラおよびマーカーが静止していてもフレーム毎に推定結果に誤差が伴うことで、合成画像上で付加画像が微かに震える状態が生じ、拡張現実感の品質が低下してしまう。
【0005】
推定結果の誤差としては、入力画像中のマーカーと参照画像の間で画像の姿勢が異なる点が挙げられる。画像の特徴点は、線形フィルタ、非線形フィルタ等、各種のフィルタを用いて抽出されるが、フィルタの出力は、画像の姿勢に応じて変化する。例えば、ある画像と、この画像を回転させた画像との間では、特徴点の座標値が異なったり、画像間で対応する同一の特徴点(対応点)が見出されなかったりする。
【0006】
ここで、座標値の誤差は、多くの対応点が見いだされれば平均化することで、推定結果の誤差に及ぼす影響を抑えられる。しかし、マーカーと参照画像の間で画像の姿勢が異なれば多くの対応点が見いだされなくなり、推定結果の誤差に及ぼす影響を抑えられず、良好な推定結果を得られない。
【0007】
そこで、本発明は、画像中の特定領域の位置・姿勢を高精度に推定可能な、画像処理装置、画像処理方法およびプログラムを提供しようとするものである。
【課題を解決するための手段】
【0008】
本発明のある観点によれば、入力画像の特徴点を抽出する特徴点抽出部と、参照画像との間で特徴点の対応関係を決定する対応関係決定部と、対応関係に基づき入力画像と参照画像の射影関係を算出する射影関係算出部と、射影関係に基づき入力画像の少なくとも一部を変換する画像変換部とを備え、射影関係算出部は、入力画像について、参照画像との間で特徴点の対応関係に基づき第1の射影関係を算出し、画像変換部により第1の射影関係に基づき変換された入力画像について、参照画像との間で特徴点の対応関係に基づき第2の射影関係を算出し、第1および第2の射影関係に基づき入力画像と参照画像の射影関係を再び算出する画像処理装置が提供される。
【0009】
画像変換部は、少なくとも第1の射影関係に基づき、入力画像中の特定領域の姿勢が参照画像の姿勢に近づくように、入力画像の少なくとも一部を変換してもよい。
【0010】
射影関係算出部は、さらに、画像変換部により第1および第2の射影関係に基づき変換された入力画像について、参照画像との間で特徴点の対応関係に基づき第3の射影関係を算出し、第1から第3の射影関係に基づき入力画像と参照画像の射影関係を再び算出してもよい。
【0011】
特徴点抽出部は、第1の射影関係を算出する場合と第2の射影関係を算出する場合で互いに異なる手法を用いて特徴点を抽出してもよい。
【0012】
対応関係決定部は、第1の射影関係を算出する場合と第2の射影関係を算出する場合で互いに異なる手法を用いて対応関係を決定してもよい。
【0013】
第1の射影関係を算出する場合、第2の射影関係を算出する場合よりも、入力画像中の特定領域の姿勢変化に対してロバストな手法が用いられてもよい。
【0014】
画像変換部は、入力画像のうち参照画像に対応する特定領域の画像を変換してもよい。
【0015】
画像処理装置は、入力画像に画像を合成する画像合成部をさらに備え、画像変換部は、さらに少なくとも第1および第2の射影関係に基づき付加画像を変換し、画像合成部は、変換した付加画像を、入力画像のうち参照画像に対応する特定領域に合成してもよい。
【0016】
本発明の他の観点によれば、入力画像について、参照画像との間で特徴点の対応関係に基づき第1の射影関係を算出し、第1の射影関係に基づき入力画像の少なくとも一部を変換し、変換した入力画像について、参照画像との間で特徴点の対応関係に基づき第2の射影関係を算出し、第1および第2の射影関係に基づき入力画像と参照画像の射影関係を再び算出することを含む画像処理方法が提供される。
【0017】
本発明の他の観点によれば、上記画像処理方法をコンピュータに実行させるためのプログラムが提供される。ここで、プログラムは、コンピュータ読取り可能な記録媒体を用いて提供されてもよく、通信手段等を介して提供されてもよい。
【発明の効果】
【0018】
本発明によれば、画像中の特定領域の位置・姿勢を高精度に推定可能な、画像処理装置、画像処理方法およびプログラムを提供することができる。
【図面の簡単な説明】
【0019】
【図1】本発明の実施形態に係る画像処理方法の概念を示す図である。
【図2】本発明の実施形態に係る画像処理装置の構成を示すブロック図である。
【図3】画像処理装置の動作を示すフロー図である。
【図4A】画像処理方法の一例を示す図(1/2)である。
【図4B】画像処理方法の一例を示す図(2/2)である。
【図5】画像中の特定領域に画像を合成する一般的な画像処理方法を示すフロー図である。
【発明を実施するための形態】
【0020】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0021】
[1.一般的な画像処理方法]
まず、図5を参照して、画像中の特定領域に画像を合成する一般的な画像処理方法について説明する。図5は、画像中の特定領域に画像を合成する一般的な画像処理方法を示すフロー図である。
【0022】
画像処理方法は、パーソナルコンピュータ、ゲーム機、PDA、携帯電話等の画像処理装置により行われる。画像処理方法では、参照画像Rの特徴点Pを示すデータがメモリ(不図示)等に格納されている。参照画像Rとは、入力画像I1中の特定領域(マーカーM)を指定するための平面画像であり、例えば、任意のテクスチャでもよく、二次元コード等でもよい。特徴点Pとは、輝度のエッジ成分等、画像中の特徴部分を表す画素点である。
【0023】
図5に示すように、画像処理方法では、動画または静止画が入力画像I1としてカメラ(不図示)等から入力され(ステップS51)、入力画像I1の特徴点Pが抽出される(ステップS52)。入力画像I1は、参照画像Rとの間で特徴点Pの対応関係が決定される(マッチングされる)(ステップS53)。特徴点Pの対応関係は、入力画像I1と参照画像Rの間で対応する同一の特徴点Pを見出すことで決定される。
【0024】
入力画像I1は、特徴点Pのマッチングに基づき、参照画像Rとの間で射影関係(ホモグラフィ)が算出される(ステップS54)。画像間の射影関係とは、特定平面を異なる地点から捉えた画像間に成立する関係であり、画像間のホモグラフィとも称される。画像間のホモグラフィは、3行3列のホモグラフィ行列を用いて表される。そして、入力画像I1と参照画像Rの射影関係を示すホモグラフィ行列H1は、マーカーMを任意の姿勢で捉えた入力画像I1と、参照画像R(マーカーMを一定の姿勢で捉えた画像)との間に成立する射影関係を示している。
【0025】
ホモグラフィ行列H1を適切に算出できると(ステップS55で「Yes」)、入力画像I1中でのマーカーMの位置・姿勢が推定される。そして、ホモグラフィ行列H1に基づき付加画像が変換され(ステップS56)、変換された付加画像がマーカーMを基準として入力画像I1に合成され(ステップS57)、合成画像として出力される(ステップS58)。なお、付加画像のデータは、コンピュータ画像等のデータとしてメモリ等に格納されている。一方、ホモグラフィ行列H1を適切に算出できなければ(ステップS55で「No」)、マーカーMの位置・姿勢が適切に推定されず、入力画像I1自体が出力される(ステップS59)。
【0026】
しかし、マーカーの位置・姿勢の推定結果には誤差が伴う。特に、入力画像が動画である場合、カメラおよびマーカーが静止していてもフレーム毎に推定結果に誤差が伴うことで、合成画像上で付加画像が微かに震える状態が生じ、拡張現実感の品質が低下してしまう。
【0027】
推定結果の誤差としては、入力画像中のマーカーと参照画像の間で画像の姿勢が異なる点が挙げられる。画像の特徴点Pは、線形フィルタ、非線形フィルタ等、各種のフィルタを用いて抽出されるが、フィルタの出力は、画像の姿勢に応じて変化する。例えば、ある画像と、この画像を回転させた画像との間では、特徴点Pの座標値が異なったり、画像間で対応する同一の特徴点P(対応点)が見出されなかったりする。
【0028】
ここで、座標値の誤差は、多くの対応点が見いだされれば平均化することで、推定結果の誤差に及ぼす影響を抑えられる。しかし、マーカーと参照画像の間で画像の姿勢が異なれば多くの対応点が見いだされなくなり、推定結果の誤差に及ぼす影響を抑えられず、良好な推定結果を得られない。
【0029】
画像間のホモグラフィは、理論上、画像間で対応する4組の特徴点P(対応点)の座標値を用いて算出できる。しかし、各座標値に誤差が生じている場合、ホモグラフィにも誤差が生じてしまうので、実際上、4つの対応点の座標値のみでは、ホモグラフィを精度良く算出できない。
【0030】
このため、座標値の誤差を正規分布と仮定し、対応点の数を多くして最小二乗法によりホモグラフィを算出することが行われる。この場合、対応点の数が多いほどホモグラフィの算出精度が向上し、さらにいえば、特徴点Pの抽出数が多いほど対応点の数が多くなる。よって、ホモグラフィの算出精度は、特徴点Pの抽出精度に依存することになる。
【0031】
極端な例として入力画像I1中のマーカーMと参照画像Rが同一であれば、入力画像I1中のマーカーMと参照画像Rとの間で画像の姿勢が一致するので、画像間で対応する全ての特徴点Pが抽出され、対応点の数が最多となる。換言すれば、入力画像I1中のマーカーMと参照画像Rの間で画像の姿勢が異なるほど、特徴点Pが抽出されない可能性が増え、対応点の数が少なくなり、ホモグラフィの算出精度が低下する。
【0032】
[2.画像処理方法の概念]
つぎに、図1を参照して本発明の実施形態に係る画像処理方法の概念について説明する。図1は、本発明の実施形態に係る画像処理方法の概念を示す図である。
【0033】
図1に示すように、本発明の実施形態に係る画像処理方法では、まず、入力画像I1について、参照画像Rとの間で特徴点Pの対応関係に基づき第1の射影関係(ホモグラフィ行例H1)が算出される。よって、入力画像I1中での特定領域(マーカーM)の位置・姿勢がラフに推定される。そして、入力画像I1の少なくとも一部は、ホモグラフィ行例H1に基づき、マーカーMの姿勢が参照画像Rの姿勢に近づくように変換される。図1に示す例では、マーカーMは、入力画像I1では、時計回りに135°程度と大きく回転しているが、変換画像I2では、時計回りに15°程度と僅かに回転している。
【0034】
つぎに、変換後の入力画像I1(変換画像I2)について、参照画像Rとの間で特徴点Pの対応関係に基づき第2の射影関係(ホモグラフィ行例H2)が算出される。前述したように、変換画像I2では、入力画像I1に比べて、マーカーMの姿勢が参照画像Rの姿勢に近づいている。よって、変換画像I2では、入力画像I1中でマーカーMの位置・姿勢を推定する場合よりも、マーカーMの位置・姿勢が緻密に推定される。また、ホモグラフィ行例H2は、ホモグラフィ行例H1の誤差を打ち消すように作用する。そして、ホモグラフィ行例H1、H2を合成したホモグラフィ行例Hに基づき、入力画像I1中でのマーカーMの位置・姿勢を高い精度で推定することができる。
【0035】
これにより、マーカーMの姿勢が参照画像Rの姿勢に近づくように入力画像I1を変換しながら、入力画像I1および変換された入力画像I1(変換画像I2)と参照画像Rのホモグラフィを算出することで、入力画像I1中でのマーカーMの位置・姿勢を高い精度で推定することができる。
【0036】
[3.画像処理装置10の構成]
つぎに、図2を参照して本発明の実施形態に係る画像処理装置10の構成について説明する。図2は、本発明の実施形態に係る画像処理装置10の構成を示すブロック図である。
【0037】
本発明の実施形態に係る画像処理装置10は、パーソナルコンピュータ、ゲーム機、PDA、携帯電話等である。図2に示すように、画像処理装置10は、特徴点抽出部11、マッチング部12(対応関係決定部)、ホモグラフィ算出部13(射影関係算出部)、画像変換部14、画像合成部15および記憶部16を含んでいる。なお、画像処理装置10は、カメラ等の画像入力装置と一体に構成されてもよく、ディスプレイ等の画像表示装置と一体に構成されてもよい。
【0038】
記憶部16は、メモリ等の記憶装置により構成され、参照画像R、付加画像、参照画像Rの特徴点P等のデータを格納しており、ホモグラフィの算出結果等、画像処理の中間結果も格納する。なお、記憶部16は、例えば画像データを格納する記憶部、特徴点データを記憶する記憶部等のように、複数に区分して構成されてもよい。
【0039】
参照画像データとは、入力画像I1中のマーカーMを指定する画像のデータであり、付加画像データとは、マーカーMを基準として入力画像I1に合成される画像のデータである。特徴点データとは、輝度のエッジ成分等、画像中の特徴部分を表す画素点のデータである。特徴点データは、画像中での特徴点Pの座標値および特徴量(輝度値、輝度値勾配等)のデータを少なくとも含んでいる。
【0040】
特徴点抽出部11には、動画または静止画が入力画像I1として入力される。特徴点抽出部11は、入力画像I1に対応する輝度値データを生成し、入力画像I1の特徴点Pを抽出し、抽出結果を示す特徴点データをマッチング部12に供給する。また、特徴点抽出部11は、画像変換部14により変換された変換画像I2を供給され、入力画像I1の場合と同様に、変換画像I2の特徴点Pを抽出する。
【0041】
特徴点Pは、例えばハリスコーナー(Harris Corner)、SIFT(Scale Invariant Feature Transform)、Random Ferns等、任意の手法・パラメータを用いて抽出される。SIFTは、特徴点Pの周辺の画素の勾配方向を用いて特徴点Pを記述する手法であり、マーカーMの回転に対してロバストである。Random Fernsは、参照画像Rを画像変換して事前に学習する手法であり、マーカーMの姿勢変化に対してロバストである。
【0042】
マッチング部12には、入力画像I1の特徴点データと、参照画像Rの特徴点データとが供給される。マッチング部12は、入力画像I1と参照画像Rの間で特徴点Pをマッチングし、マッチング結果を示すマッチングデータをホモグラフィ算出部13に供給する。また、マッチング部12は、変換画像I2の特徴データを供給され、入力画像I1の場合と同様に、変換画像I2と参照画像Rの間で特徴点Pをマッチングする。
【0043】
特徴点Pは、特徴点P間の類似度を測る評価値として差分絶対値和(SAD)や特徴点Pベクトルの差のノルム等、任意の手法・パラメータを用いてマッチングされる。マッチングデータは、入力画像I1と参照画像Rの間で対応関係が確認された特徴点Pについて、入力画像I1中の座標値と参照画像R中の座標値のデータを少なくとも含んでいる。入力画像I1と参照画像Rの間では、入力画像I1中でのマーカーの位置・姿勢に応じては、画像間で対応する同一の特徴点Pを見出すことができず、1対1の対応関係を確認できない場合もある。なお、変換画像I2と参照画像Rの間についても、入力画像I1と参照画像Rの間と同様に説明される。
【0044】
ホモグラフィ算出部13には、マッチングデータが供給される。ホモグラフィ算出部13は、マッチングデータに基づき、入力画像I1と参照画像Rのホモグラフィを算出し、画像変換部14および記憶部16に供給する。また、ホモグラフィ算出部13は、入力画像I1の場合と同様に、変換画像I2と参照画像Rのホモグラフィ行列H2を算出し、ホモグラフィ行列H1、H2を合成したホモグラフィ行列H(=H1・H2)を算出する。
【0045】
入力画像I1と参照画像Rのホモグラフィとは、マーカーMを任意の姿勢で捉えた入力画像I1と、参照画像R(一定の姿勢で捉えられたマーカーMの画像)との間に成立する射影関係を意味し、3行3列のホモグラフィ行列を用いて表される。なお、変換画像I2の場合についても、入力画像I1の場合と同様に説明される。ホモグラフィ行列は、マッチングデータを構成する4組以上の特徴点P(対応点)の座標値を用いて算出される。
【0046】
画像変換部14には、入力画像データおよびホモグラフィ行列が供給される。画像変換部14は、ホモグラフィ行列H1に基づき、マーカーMの姿勢が参照画像Rの姿勢に近づくように入力画像I1(特にマーカーMの領域の画像)を線形変換し、変換後の入力画像I1を変換画像I2として記憶部16に一時的に格納する。画像変換は、ホモグラフィ行列H、入力画像I1の各画素の3次元座標ベクトルXsrc、変換結果Xdstとすると、Xdst=H・Xsrcとして表される。
【0047】
ここで、画像変換の対象は、マーカーMの領域の画像のみでもよく、マーカーMの領域を含む入力画像I1自体でもよい。なお、マーカーMの領域の画像を変換する場合、参照画像Rのコーナー部の座標とホモグラフィ行列HとからマーカーMの領域の座標を算出し、この座標に基づきマーカーMの領域の画像が入力画像I1から切出される。また、画像変換部14は、ホモグラフィ行列に基づき、付加画像を線形変換し、変換後の付加画像を画像合成部15に供給する。
【0048】
画像合成部15には、入力画像データ、変換後の付加画像データおよびホモグラフィ行列Hが供給される。画像合成部15は、ホモグラフィ行列Hに基づき、変換後の付加画像を入力画像I1中のマーカーMを基準として入力画像I1に合成して合成画像を生成し、画像表示装置等に出力する。
【0049】
画像処理装置10の各構成要素は、回路ロジック等のハードウェアおよび/またはプログラム等のソフトウェアとして構成される。ソフトウェアとして構成される構成要素は、例えば、不図示のCPU上でプログラムを実行することにより実現される。
【0050】
なお、画像変換部14は、画像合成部15と一体に構成されてもよい。また、入力画像I1と変換画像I2をそれぞれに処理するために、特徴量抽出部11、マッチング部12、ホモグラフィ算出部13、画像変換部14のうち少なくとも1以上が個別に設けられてもよい。また、入力画像I1は、バッファ(不図示)を通じて特徴点抽出部11に入力されてもよい。
【0051】
[4.画像処理装置10の動作]
つぎに、図3および図4A、4Bを参照して本発明の実施形態に係る画像処理装置10の動作について説明する。図3は、画像処理装置10の動作を示すフロー図であり、図4A、4Bは、画像処理方法の一例を示す図である。
【0052】
図3に示すように、特徴点抽出部11は、動画フレームのデータを入力画像I1のデータとして入力され(ステップS31)、入力画像I1の特徴点Pを抽出する(ステップS32)。なお、入力画像I1のデータは、記憶部16に一時的に格納される。マッチング部12は、入力画像I1の特徴点データと参照画像Rの特徴点データを供給され、入力画像I1と参照画像Rの間で特徴点Pをマッチングする(ステップS33)。なお、参照画像Rの特徴点データは、記憶部16から読み出される代わりに、特徴点抽出部11により参照画像Rから抽出されてマッチング部12に供給されてもよい。
【0053】
ホモグラフィ算出部13は、マッチングデータを供給され、入力画像I1と参照画像Rの射影関係を示すホモグラフィ行列H1を算出する(ステップS34)。ホモグラフィ行列H1は、記憶部16に一時的に格納される。なお、例えば、4組以上の特徴点P(対応点)を見出せなかった場合(ステップS35で「No」)、ホモグラフィ行列H1を算出することができず、画像合成を行わずに入力画像I1が出力される(ステップS45)。
【0054】
図4Aには、特徴点Pのマッチング例が示されている。この例では、入力画像I1中の特定領域(マーカーM)は、日本周辺の地図画像を示す参照画像Rにより指定されている。入力画像I1は、斜めに吊り下げられた地図画像(マーカーM)を斜め前方から捉えている。参照画像Rは、正立した状態のマーカーMに対応する地図画像であり、輝度値のエッジ成分等、9つの特徴点P1〜P9が予め抽出されている。なお、図4Aでは、便宜上、地図画像の輝度画像ではなく地図画像自体に特徴点Pが示されている。
【0055】
参照画像Rと入力画像I1の間では、対応関係にある同一の特徴点P(対応点)同士を結ぶ線分を用いて暗示するように、9つの特徴点P1〜P9のうち5つの特徴点P1〜P5がマッチングされている。これは、入力画像I1中のマーカーMと参照画像Rの間で画像の姿勢が大きく異なるので、残り4つの特徴点P6〜P9を入力画像I1から適切に抽出できないためである。
【0056】
画像変換部14は、入力画像I1のデータおよびホモグラフィ行列H1を供給され、ホモグラフィ行列H1に基づき入力画像I1を変換する(ステップS36)。変換後の入力画像I1(変換画像I2)は、入力画像I1に比べて、マーカーMの姿勢が参照画像Rの姿勢に近づくように入力画像I1を変換することで得られる。変換画像I2のデータは、記憶部16に一時的に格納される。
【0057】
特徴点抽出部11は、さらに、変換画像I2のデータを供給され、変換画像I2の特徴点Pを抽出する(ステップS37)。マッチング部12は、変換画像I2の特徴点データと参照画像Rの特徴点データを供給され、変換画像I2と参照画像Rの間で特徴点Pをマッチングする(ステップS38)。
【0058】
ホモグラフィ算出部13は、マッチングデータを供給され、変換画像I2と参照画像Rの射影関係を示すホモグラフィ行列H2を算出する(ステップS39)。ホモグラフィ行列H2は、記憶部16に一時的に格納されてもよい。なお、ホモグラフィ行列H2を算出することができない場合(ステップS40で「No」)、画像合成を行わずに入力画像I1が出力される(ステップS45)。ホモグラフィ算出部13は、ホモグラフィH1、H2を合成してホモグラフィ行列H(=H1・H2)を算出する(ステップS41)。
【0059】
図4Bには、図4Aに関連する特徴点Pのマッチング例が示されている。この例では、変換画像I2は、ホモグラフィ行列H1に基づきマーカーMの領域を含む画像を入力画像I1から切出し、入力画像I1に比べて、マーカーMの姿勢が参照画像Rの姿勢に近づくように切出し画像を変換することで得られる。入力画像I1に占めるマーカーMの領域が小さい場合、画像変換に要する処理を低減することができる。なお、図4Bでも、便宜上、地図画像の輝度画像ではなく地図画像自体に特徴点Pが示されている。
【0060】
参照画像Rと変換画像I2の間では、対応関係にある同一の特徴点P(対応点)同士を結ぶ線分を用いて暗示するように、9つの特徴点P1〜P9の全てがマッチングされている。これは、変換画像I2中のマーカーMと参照画像Rの間で画像の姿勢が近いので、特徴点P1〜P9を変換画像I2から適切に抽出できるためである。
【0061】
画像変換部14は、付加画像のデータおよびホモグラフィ行列Hを供給され、ホモグラフィ行列Hに基づき付加画像を線形変換する(ステップS42)。付加画像は、付加画像の姿勢がマーカーMの姿勢に一致するように変換される。画像合成部15は、変換後の付加画像のデータ、入力画像I1のデータおよびホモグラフィ行列Hを供給され、ホモグラフィ行列Hに基づき変換後の付加画像を入力画像I1に合成し(ステップS43)、合成画像として出力する(ステップS43)。
【0062】
ホモグラフィ行列H1、H2は、同一の手法(およびパラメータ)を用いて算出されてもよく、互いに異なる手法(および/またはパラメータ)を用いて算出されてもよい。なお、異なる手法とは、特徴量の抽出(参照画像の特徴量データの種類も含む)および/または特徴点Pのマッチングの手法が異なることを意味している。
【0063】
ホモグラフィ行列H1は、入力画像I1中のマーカーMと参照画像Rの間で画像の位置・姿勢が大きく異なる可能性が高いので、マーカーMの姿勢変化に対してロバストな手法を用いて算出されることが好ましい。一方、ホモグラフィ行列H2は、変換画像I2中のマーカーMと参照画像Rの間で画像の位置・姿勢が大きく異なる可能性が低いので、大抵のケースでは、推定精度の高い手法を用いて算出されることが好ましい。一般に、マーカーMの姿勢変化に対するロバスト性と推定精度は、トレードオフの関係にあるので、ホモグラフィ行列H1をロバストな手法を用いて算出し、ホモグラフィ行列H2を推定精度の高い手法を用いて算出することで、マーカーMの位置・姿勢を高精度で推定できる可能性が高くなる。
【0064】
マーカーMの位置・姿勢は、3段階以上のホモグラフィの算出結果に基づき推定されてもよい。例えば、ホモグラフィ行列H1、H2、H3の算出結果に基づく場合、画像変換部14は、ホモグラフィ行列H2に基づき変換画像I2を2次変換画像にさらに変換する(もちろん、ホモグラフィ行列H1、H2基づき入力画像I1を2次変換画像に変換してもよい。)。
【0065】
画像処理装置10では、2次変換画像について、参照画像Rとの間で特徴点Pの抽出、特徴点Pのマッチングおよびホモグラフィの算出が行われ、2次変換画像と参照画像Rの射影関係を示すホモグラフィ行列H3が算出される。そして、入力画像I1と参照画像Rの射影関係を示すホモグラフィ行列H´(=H1・H2・H3)が算出され、ホモグラフィ行列H´に基づき入力画像I1に付加画像が合成される。
【0066】
この場合も、各ホモグラフィ行列H1、H2、H3は、前述した場合と同様に、同一の手法を用いて算出されてもよく、互いに異なる手法を用いて算出されてもよい。ここで、ホモグラフィの算出段階が上がるほど、変換後の入力画像I1中のマーカーMの姿勢は、参照画像Rの姿勢に近づくと期待される。よって、算出段階が上がるほど、マーカーMの姿勢変化に対するロバスト性が低く精度水準が高い手法を用いることで、マーカーMの位置・姿勢を高精度に推定できる可能性が高くなる。
【0067】
[5.まとめ]
以上説明したように、本発明によれば、マーカーMの姿勢が参照画像Rの姿勢に近づくように入力画像I1を変換しながら、入力画像I1および変換された入力画像I1(変換画像I2等)と参照画像Rのホモグラフィを算出することで、入力画像I1中でのマーカーMの位置・姿勢を高い精度で推定することができる。
【0068】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0069】
例えば、上記実施形態では、画像処理装置10は、カメラ等の画像入力装置から入力画像I1を入力され、ディスプレイ等の画像表示装置に出力画像を出力する場合について説明した。しかし、入力画像I1は、レコーダ、プレイヤ等の画像再生装置から入力されてもよく、出力画像は、レコーダ、プレイヤ等の画像記録装置に出力されてもよい。
【符号の説明】
【0070】
10 画像処理装置
11 特徴点抽出部
12 マッチング部(対応関係決定部)
13 ホモグラフィ算出部(射影関係算出部)
14 画像変換部
15 画像合成部
16 記憶部
M マーカー(特定領域)
R 参照画像
I1 入力画像
I2 変換画像
H、H1、H2 ホモグラフィ行列(射影関係)
P 特徴点

【特許請求の範囲】
【請求項1】
入力画像の特徴点を抽出する特徴点抽出部と、
参照画像との間で特徴点の対応関係を決定する対応関係決定部と、
前記対応関係に基づき前記入力画像と前記参照画像の射影関係を算出する射影関係算出部と、
前記射影関係に基づき前記入力画像の少なくとも一部を変換する画像変換部と
を備え、
前記射影関係算出部は、前記入力画像について、前記参照画像との間で前記特徴点の対応関係に基づき第1の射影関係を算出し、前記画像変換部により前記第1の射影関係に基づき変換された前記入力画像について、前記参照画像との間で前記特徴点の対応関係に基づき第2の射影関係を算出し、前記第1および第2の射影関係に基づき前記入力画像と前記参照画像の射影関係を再び算出する画像処理装置。
【請求項2】
前記画像変換部は、少なくとも前記第1の射影関係に基づき、前記入力画像中の特定領域の姿勢が前記参照画像の姿勢に近づくように、前記入力画像の少なくとも一部を変換する、請求項1に記載の画像処理装置。
【請求項3】
前記射影関係算出部は、さらに、前記画像変換部により前記第1および第2の射影関係に基づき変換された前記入力画像について、前記参照画像との間で前記特徴点の対応関係に基づき第3の射影関係を算出し、前記第1から第3の射影関係に基づき前記入力画像と前記参照画像の射影関係を再び算出する、請求項1または2に記載の画像処理装置。
【請求項4】
前記特徴点抽出部は、前記第1の射影関係を算出する場合と前記第2の射影関係を算出する場合で互いに異なる手法を用いて前記特徴点を抽出する、請求項1から3のうちいずれか1項に記載の画像処理装置。
【請求項5】
前記対応関係決定部は、前記第1の射影関係を算出する場合と前記第2の射影関係を算出する場合で互いに異なる手法を用いて前記対応関係を決定する、請求項1から4のうちいずれか1項に記載の画像処理装置。
【請求項6】
前記第1の射影関係を算出する場合、前記第2の射影関係を算出する場合よりも、前記入力画像中の特定領域の姿勢変化に対してロバストな手法が用いられる、請求項4または5に記載の画像処理装置。
【請求項7】
前記画像変換部は、前記入力画像のうち前記参照画像に対応する特定領域の画像を変換する、請求項1から6のうちいずれか1項に記載の画像処理装置。
【請求項8】
前記入力画像に画像を合成する画像合成部をさらに備え、
前記画像変換部は、さらに少なくとも前記第1および第2の射影関係に基づき付加画像を変換し、
前記画像合成部は、前記変換した付加画像を、前記入力画像のうち前記参照画像に対応する特定領域に合成する、請求項1から7のうちいずれか1項に記載の画像処理装置。
【請求項9】
入力画像について、参照画像との間で特徴点の対応関係に基づき第1の射影関係を算出し、
前記第1の射影関係に基づき前記入力画像の少なくとも一部を変換し、
前記変換した入力画像について、前記参照画像との間で特徴点の対応関係に基づき第2の射影関係を算出し、
前記第1および第2の射影関係に基づき前記入力画像と前記参照画像の射影関係を再び算出すること
を含む画像処理方法。
【請求項10】
入力画像について、参照画像との間で特徴点の対応関係に基づき第1の射影関係を算出し、
前記第1の射影関係に基づき前記入力画像の少なくとも一部を変換し、
前記変換した入力画像について、前記参照画像との間で特徴点の対応関係に基づき第2の射影関係を算出し、
前記第1および第2の射影関係に基づき前記入力画像と前記参照画像の射影関係を再び算出すること
を含む画像処理方法をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate


【公開番号】特開2012−164188(P2012−164188A)
【公開日】平成24年8月30日(2012.8.30)
【国際特許分類】
【出願番号】特願2011−24870(P2011−24870)
【出願日】平成23年2月8日(2011.2.8)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】