説明

モザイク画像合成装置、モザイク画像合成方法及びモザイク画像合成プログラム

【課題】本発明は、上記実情に鑑みてなされたもので、誤差の累積を緩和可能なモザイク画像合成装置及びモザイク画像合成方法を提供することを目的とする。
【解決手段】本発明のモザイク画像合成方法は、第2の画像と第1の画像とに共通に存在する複数の特徴点を抽出し、当該特徴点の移動量を求め、当該移動量と前記第1の画像を撮影した時の位置・姿勢情報とに基づき、前記第1の画像撮影時の位置・姿勢情報から前記第2の画像撮影時の位置・姿勢情報への変換パラメータを推定する推定手段を有し、前記推定手段は、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値に基づいて前記変換パラメータを投票し、前記投票において最多の票を得た前記変換パラメータを、最終的な前記変換パラメータを推定値とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、視野の狭い複数の画像から視野の広い1つの画像(モザイク画像)を合成する技術に関する。
【背景技術】
【0002】
従来から、空中から地上を撮影したビデオ映像から広域写真地図を作成すること等を目的として、視野の狭い複数の画像から視野の広い1つの画像(モザイク画像)を合成する技術が開発されてきた。
【0003】
図9に示すように、上空から地表を撮影する場合のように、被写体が平面と見なせる場合、異なるカメラの位置及び撮影方向(以下では位置・姿勢情報と呼ぶ)によって撮影された複数の画像は互いに射影変換の関係となる。射影変換の関係にある2枚の画像内の点は、位置・姿勢情報の変化量を表す変換パラメータを用いた演算により相互に変換することが可能である。
例えば、位置・姿勢情報を6つのパラメータ(X、Y、Z、φ、θ、ψ)で表現する場合、変換パラメータは1枚目の画像の撮影時の位置・姿勢情報と2枚目の画像の位置・姿勢情報の各パラメータの差(ΔX、ΔY、ΔZ、Δφ、Δθ、Δψ)で表すことができる。
【0004】
モザイク画像を合成する場合、変換パラメータを用いた演算により、位置・姿勢情報の変化による画像の歪みやずれ等を修正しながら、変換画像を貼り合わせていく。
このとき、合成する画像の全てについて、その撮影時の位置・姿勢情報を計測し、計測値に基づいて変換パラメータを得ることも可能である。しかし、正確な位置・姿勢情報を得るためには、高精度のセンサが必要となる。また、誤差によって画像の歪みやずれ等が十分に修正されず、画像が滑らかに接続されないことがある。
【0005】
このため、多くの場合、変換パラメータは、2枚の画像に共通して存在する特徴点の移動量に基づいて、推定することにより取得される。変換パラメータの推定方法として、最小二乗法を用いた手法(例えば特許文献1参照)、投票計算による手法(例えば非特許文献1参照)、パターンマッチングによる処理を用いた手法(例えば特許文献2参照)等が提案されている。
【特許文献1】特開2002−150264号公報
【特許文献2】特開2000−215317号公報
【非特許文献1】金澤靖、金谷健一、「段階的マッチングによる画像モザイク生成」電子情報通信学会論文誌、電子情報通信学会、Vol.J86−D−II、No.6、p.816−824
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかし、上記のいずれの手法を採用したとしても、変換パラメータの推定値が不安定となり正確な変換パラメータが求められなくなる場合がある。この場合、モザイク画像合成の精度や安定性が悪化する。例えば、図10に例示したように、撮影方向を変化させずに前方に水平移動をして撮影した場合(図10(a))と、撮影位置を変化させず撮影方向を前方に変化さるように回転する場合(図10(b))とでは、よく似た特徴点の動きを生じさせる。特に、図10に示した特徴点のうち一列に並んだ特徴点のみを抽出して比較する場合、撮影位置の移動と撮影方向の変化とを区別することができない。
【0007】
本発明は、上記実情に鑑みてなされたもので、変換パラメータを安定且つ精度良く推定可能なモザイク画像合成装置、モザイク画像合成方法及びモザイク画像合成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1の観点に係るモザイク画像合成装置は、合成されるモザイク画像の元になる第1の画像及び第2の画像のデータを取得する画像取得手段と、前記第1の画像を撮影した時のカメラの位置・姿勢情報を取得する位置・姿勢情報取得手段と、前記第2の画像と前記第1の画像とに共通に存在する被写体上の位置(以下では当該位置を特徴点と呼ぶ)を抽出し、前記第1の画像における当該特徴点の座標と前記第2の画像における当該特徴点の座標との差分を求め、当該差分と前記位置・姿勢情報取得手段により取得される前記第1の画像を撮影した時の位置・姿勢情報とに基づいて、前記第1の画像撮影時の位置・姿勢情報を前記第2の画像撮影時の位置・姿勢情報に変換するための変換パラメータを推定する推定手段と、前記第1の画像撮影時の位置・姿勢情報と前記推定手段により推定された前記変換パラメータとに基づいて、前記第1の画像及び前記第2の画像をモザイク画像平面の画像へと変換して貼り合わせる合成手段と、から構成されるモザイク画像合成装置であって、前記推定手段は、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値と前記推定された変換パラメータとに基づき、最終的な前記変換パラメータの推定値を決定する、ことを特徴とする。
【0009】
前記推定手段は、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値に基づいて前記変換パラメータの候補値に投票し、前記投票において最多の票を得た前記変換パラメータを、最終的な前記変換パラメータを推定値としてもよい。
【0010】
前記推定手段は、前記直交性の評価値が所定の閾値以上である場合に、前記変換パラメータに投票し、前記直交性の評価値が所定の閾値より小さい場合には前記変換パラメータを投票しないようにしてもよい。
【0011】
前記推定手段は、前記直交性の評価値が大きいほど多数の票を前記変換パラメータに投票してもよい。
【0012】
本発明の第2の観点に係るモザイク画像合成方法は、撮影範囲の一部が重複する第1の画像及び第2の画像に対して、前記第1の画像を撮影した時の位置・姿勢情報を取得する取得ステップと、前記第2の画像と前記第1の画像とに共通に存在する複数の特徴点を抽出し、当該特徴点の移動量を求め、当該移動量と前記取得ステップにおいて取得される前記第1の画像を撮影した時の位置・姿勢情報とに基づき、前記第1の画像撮影時の位置・姿勢情報から前記第2の画像撮影時の位置・姿勢情報への変換パラメータを推定する推定ステップと、前記第1の画像撮影時の位置・姿勢情報及び前記推定ステップにおいて推定された前記変換パラメータに基づいて、前記第1の画像及び前記第2の画像をモザイク画像平面の画像へと変換して貼り合わせる合成ステップと、から構成されるモザイク画像合成方法であって、前記推定ステップは、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値に基づいて前記変換パラメータを投票し、前記投票において最多の票を得た前記変換パラメータを、最終的な前記変換パラメータを推定値とする、ことを特徴とする。
【0013】
本発明の第3の観点に係るモザイク画像合成プログラムは、コンピュータに、撮影範囲の一部が重複する第1の画像及び第2の画像に対して、前記第1の画像を撮影した時の位置・姿勢情報を取得する取得ステップと、前記第2の画像と前記第1の画像とに共通に存在する複数の特徴点を抽出し、当該特徴点の移動量を求め、当該移動量と前記取得ステップにおいて取得される前記第1の画像を撮影した時の位置・姿勢情報とに基づき、前記第1の画像撮影時の位置・姿勢情報から前記第2の画像撮影時の位置・姿勢情報への変換パラメータを推定する推定ステップと、前記第1の画像撮影時の位置・姿勢情報及び前記推定ステップにおいて推定された前記変換パラメータに基づいて、前記第1の画像及び前記第2の画像をモザイク画像平面の画像へと変換して貼り合わせる合成ステップと、を実行させるモザイク画像合成プログラムであって、前記推定ステップは、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値に基づいて前記変換パラメータを投票し、前記投票において最多の票を得た前記変換パラメータを、最終的な前記変換パラメータを推定値とする、ことを特徴とする。
【発明の効果】
【0014】
本発明のモザイク画像合成装置、モザイク画像合成方法及びモザイク画像合成プログラムは、変換パラメータの候補値の直交性を評価し、評価値に基づいた投票を行い、投票の結果に基づいて変換パラメータを決定するので、変換パラメータを安定且つ精度良く推定することができる。
【発明を実施するための最良の形態】
【0015】
本発明の実施の形態を、航空撮影した映像から、写真地図を作成する用途に適用した場合を例に説明する。航空撮影から合成された写真地図の出力までの手順の概略は、以下の2段階に分けることができる。
第1の段階では、航空撮影により映像を得ると同時に、映像と対応付けて位置・姿勢情報を記録する。
第2の段階では、取得した映像から、フレーム画像を切り出し、切り出したフレーム画像を貼り合わせてモザイク画像を合成する。
【0016】
上記第1の段階で映像及び位置・姿勢情報を記録するための航空撮影用のカメラは、図1に示すように、画像を撮影する撮像部21と、位置センサ22と、姿勢センサ23と、映像及び映像に同期して検出された位置・姿勢情報を記録する記録装置24とから構成される。
撮像部21は、例えば、テレビジョンカメラにより構成される。なお、撮像部21は、撮像管、CCD(Charge-Coupled Devices)撮像素子等の撮像手段を採用してもよい。
また、位置センサ22は、例えば、GPS(Global Positioning System)レシーバにより構成される。また、姿勢センサ23は、例えば、ジャイロスコープにより構成される。
記憶装置24は、例えば、ハードディスク、磁気テープ等により構成される。
【0017】
図2に示すように、位置・姿勢情報は地上座標に対するカメラの位置を定義する3つのパラメータ(X、Y、Z)の情報と、カメラの傾き(撮影方向)を定義する3つのパラメータ(φ、θ、ψ)の情報の計6つのパラメータから構成される。
位置を定義するパラメータ(X、Y、Z)は、GPSレシーバにより検出され、映像を構成する各画像に対応付けて記録装置に記録される。
また、傾きを定義するパラメータ(φ、θ、ψ)は、カメラに搭載されたジャイロスコープにより検出され、映像を構成する各画像に対応付けて記録装置24に記録される。
なお、画像と位置・姿勢情報とは対応付けられて記録されるが、後述する合成処理においては、合成に用いられる複数の画像の中の一枚を撮影したときの位置・姿勢情報をもとに、他の画像を撮影したときの位置・姿勢情報を推定する。合成処理に用いられない、他の画像を撮影したときの位置・姿勢情報は、例えば、推定された位置・姿勢情報の妥当性を検証するために用いられてもよい。
【0018】
例えば、図2に示すように、位置・姿勢情報Φ1が(X、Y、Z、φ、θ、ψ)であるカメラの位置及び姿勢は以下のように定義される。図2(a)及び(b)に示すように、位置は、X、Y、Zの各座標軸をそれぞれX、Y、Zだけ平行移動した座標系(x1、y1、z1軸とする)の原点の位置にカメラが存在すると定義される。また、図2(c)乃至(e)に示すように、傾きは、z1軸の負方向を向き、カメラの上方にy1軸が伸び、カメラの右手にx1軸が伸びるように設置されたカメラを基準として、z1軸、y1軸、x1軸の正方向に対して左回りに、順にφ、θ、ψだけ回転させた方向を向いているものと定義される。
【0019】
航空撮影の際は、上述のような映像及び位置・姿勢情報を記録する記録装置を備えたカメラをほぼ鉛直下向きになるように飛行機、ヘリコプター等の航空機に搭載し、地表を撮影しながら、写真地図を作成する地域の上空を飛行する。
【0020】
航空撮影により得られた映像は、上述の第2の段階において、モザイク画像合成装置によってモザイク画像へと合成される。モザイク画像合成装置1は、図4に示すように、画像取得部11と、CPU12と、メモリ13と、記憶部14と、出力部15と、位置・姿勢情報取得部16とから構成される。
【0021】
画像取得部11は、再生ヘッド、デコーダ等から構成される。画像取得部11は、航空撮影により記録した映像をカメラの有する記録装置から取得する。画像の取得は、カセットテープ等の記録媒体を介して行われてもよいし、無線又は有線の通信手段を用いて行われてもよい。
そして、取得した映像を再生して出力部15に表示させる。また、画像取得部11は、再生した映像のうち、利用者により選択されたフレームの画像をメモリ13に供給する。選択されたフレームの画像は、例えばビットマップ形式の画像データとして、メモリ13に供給される。 なお、図示せぬ入力装置(例えば、操作ボタン、マウス、キーボード等)を操作することより、利用者は、映像の再生、一時停止、コマ送り、画像の選択等を指示できるものとする。
【0022】
CPU12は、記憶部14に格納されたプログラムに基づいて、モザイク画像を合成する。
メモリ13は、RAM(Random Access Memory)等から構成される。メモリ13は、CPU12による各種処理のためのワークエリアとなる。例えば、メモリ13は、画像取得部から取得した画像を一時的に格納する。また、推定処理において用いられる投票テーブルを格納する。
【0023】
記憶部14は、磁気記憶装置等から構成される。記憶部14は、CPU12による各種処理の手順を定義するプログラムを格納する。例えば、記憶部14は、後述する合成処理及び推定処理のプログラムを格納する。
出力部15は、表示制御回路、表示装置、プリンタ等から構成される。出力部15は、再生映像、処理過程の画像、処理後のモザイク画像等を表示又は印刷する。
【0024】
位置・姿勢情報取得部16は、特定の画像が撮影された時の位置・姿勢情報を取得してCPU12に供給する。位置・姿勢情報取得部16は、例えば、画像とともに記憶装置に記録された位置・姿勢情報をCPU12からの求めに応じて取得するようにしてもよいし、利用者による手動入力により、位置・姿勢情報を取得するようにしてもよい。
【0025】
このような構成のモザイク画像合成装置1により、モザイク画像を合成する合成処理が実施される手順を、図5に示すフローチャートを参照して説明する。
合成処理に先立ち、メモリ13に合成に用いるN枚の画像(第1の画像乃至第Nの画像)が格納される。第1の画像乃至第Nの画像は、一枚前の画像と撮影範囲が一部重複したものが選ばれる。
【0026】
N枚の画像を選択してメモリ13に格納した後、合成処理が実施される。
初めに、CPU12は、メモリ13から第1の画像を取得する(ステップS100)。次に、CPU12は、位置・姿勢情報取得部16から第1の画像が撮影された時点の位置・姿勢情報を取得しメモリ13に格納する(ステップS110)。続いて、CPU12は、第1の画像を位置・姿勢情報に基づき、第1の画像をモザイク画像平面上に投影されたモザイク画像へと変換する(ステップS120)。
【0027】
位置・姿勢情報に基づいて、撮影された画像をモザイク画像平面上に投影された画像へと変換する方法は、例えば以下のように実現される。
ここでは、カメラのピンホールモデルを仮定した中心投影により、画像をモザイク画像平面上に投影された画像に変換する方法を示す。図3に示すように、カメラの位置・姿勢情報を(X、Y、Z、φ、θ、ψ)、焦点距離をFで表し、画像上の点(u、v)が、モザイク画像平面上の点(X、Y)に投影されるとする。この時、(X、Y)は(u、v)を用いて(1)式及び(2)式で求められる(「解析写真測量改訂版」日本写真測量学会参照)。なお、モザイク画像はZ=Zの平面上に存在するものとする。
【0028】
【数1】

【0029】
上記の各式では、モザイク画像平面の標高Z及び焦点距離Fが未知数となっている。これらについて、Zは、Z=0とし、対地高度Z−Zが、位置検出装置で得られる標高Zに等しいと仮定して計算を行えばよい。なお、地表面の平均的な高さが既知である場合には、その高さをZに採用してもよい。また、焦点距離Fはカメラのカタログ値や予め実験により求めた値を使用すればよい。
【0030】
上記の変換により、撮影された画像(ここでは第1の画像)が、位置・姿勢情報に基づいて、モザイク画像平面上に投影される。
【0031】
図5に戻って、モザイク画像平面上に投影され合成された画像を表示装置に表示する(ステップS130)。第1の画像に関しては、第1の画像をモザイク画像平面上に投影した画像がそのまま表示される。第2の画像と第1の画像を合成する際は、貼り合わされたモザイク画像が表示される。
【0032】
次に、CPU12は、次の画像があるかを判定する(ステップS140)。次の画像がない場合(ステップS140;No)、合成処理は終了となる。一方、次の画像がある場合(ステップS140;Yes)、CPU12は、次の画像を取得する(ステップS150)。この例では、まだ1枚の画像についてモザイク画像平面上への変換をしただけであるので、第2の画像を取得する。そして、第1の画像と第2の画像とに基づいて、後に詳述する推定処理を実施し、第2の画像撮影時の位置・姿勢情報を求めるための変換パラメータを推定する。(ステップS160)。
【0033】
次に、CPU12は、推定処理によって得られた変換パラメータを第1の画像撮影時の位置・姿勢情報に加算し、第2の画像撮影時の位置・姿勢情報を求める(ステップS170)。そして、CPU12は処理をステップS120に進め、第2の画像をモザイク画像平面上に投影された画像に変換し、第1の画像との合成をする。以下、同様の手順を繰り返して、順次、位置・姿勢情報を推定しながら第Nの画像までモザイク画像を合成する。
以上のような手順により、N枚の画像を貼り合わせたモザイク画像を合成することができる。
【0034】
次に、推定処理の実現方法について、説明する。推定処理は、撮影範囲の一部が共通する2枚の画像と、当該2枚の画像の一方を撮影したときの位置・姿勢情報とに基づき、他方の画像を撮影したときの位置・姿勢情報を推定する処理である。以下では、図6に示すフローチャートを参照して、第1の画像と第2の画像と第1の画像の撮影時の位置・姿勢情報とから、第2の画像撮影時の位置・姿勢情報を推定する場合を例に、推定処理の手順を説明する。
【0035】
推定処理は、上述の合成処理におけるステップS160で呼び出される処理であり、推定処理の開始時点において、第1の画像、第2の画像、及び、第1の画像撮影時の位置・姿勢情報は既にメモリ13に格納されている。
推定処理が開始されると、CPU12は、第1の画像撮影時の位置・姿勢情報を初期の座標に設定する(ステップS200)。次に、CPU12は、第1の画像と第2の画像に共通して存在する特徴点を複数抽出し対応付ける(ステップS210)。
【0036】
特徴点の対応付けの一つの手法として、文献「Detection and Tracking of Point Features」(Carnegie Mellon
University Technical Report CMU-CS-91-132、1991)」において述べられているFeatureTrackerを用いる。
簡単に説明すると、FeatureTrackerでは、画像対のうち、一方の画像において輝度勾配がx軸方向、y軸方向ともに大きな点を特徴点として抽出し、時空間微分方程式と呼ばれる拘束条件を用いてその対応点を他の画像から求める。FeatureTrackerでは、第jの画像上の特徴点の座標(u,v)と、第j+1の画像上のその対応点の座標(u,v)を対として出力する。FeatureTrackerを用いて適当な数(例えば100対)の対応する特徴点の対を求める。
【0037】
次に、CPU12は、メモリ12内に設けられた投票テーブルを初期化する(ステップS220)。次に、CPU12は、ステップS210で抽出した複数の特徴点から3点を取り出す組み合わせに、未抽出の組み合わせがないかを判別する(ステップS230)。例えばステップS210において、100点の特徴点を得た場合には、100=161700通りの組み合わせが抽出されるまでステップS230の判定はYesとなる。
なお、本実施の形態では、ステップS230で、全ての特徴点の組み合わせを抽出する場合を例に説明しているが、適当な個数の組み合わせをランダムに抽出するようにしてもよい。
【0038】
未抽出の組み合わせがあると判別された場合(ステップ230;Yes)、CPU12は、未抽出の組み合わせに対応する3点の特徴点を抽出する(ステップS240)。次に、CPU12は、抽出された3点から算出されるべき変換パラメータについて、直交性の評価値を算出し(ステップS250)、評価値が所定の閾値以上であるかを判定する(ステップS260)。そして、評価値が所定の閾値以上である場合(ステップS260;Yes)には、各特徴点について、第1の画像における座標と第2の画像における座標との差に基づいて、変換パラメータの候補値Vを算出する(ステップS270)。そして、算出された変換パラメータの候補値Vに1票を投票し(ステップS280)、ステップS230に戻る。また、評価値が閾値よりも小さい場合(ステップS260;No)、変換パラメータの算出及び投票をせずにステップS230に戻る。
【0039】
なお、変換パラメータの直交性とは、変換パラメータの独立性の尺度である。例えば、図10に示したような、X方向の変化かθ方向の変化かの区別がつかない特徴点の組み合わせの場合、直交性の評価値は低くなる。以下では、評価値を算出する手法について説明する。
【0040】
第1の画像における3つの特徴点の座標をそれぞれ(u[1],v[1])、(u[2],v[2])、(u[3],v[3])とし、 第2の画像における3つの特徴点の座標をそれぞれ(u[1],v[1])、(u[2],v[2])、(u[3],v[3])とする。また、第1の画像撮影時の位置・姿勢情報Φ1=(X、Y、Z、φ、θ、ψ)は、図5に示された合成処理のステップS110において取得される既知の値または、先に実施された第1の画像に基づいた第2の画像撮影時の位置・姿勢情報についての推定処理により推定された値である。
【0041】
このような条件のもと、直交性の評価値を求めるために、まず、第2の画像における3つの特徴点の各パラメータに対する移動量を表す偏微分係数ベクトルa1乃至a6を算出する。なお、a1乃至a6は順にX、Y、Z、φ、θ、ψの変動に対応する。偏微分係数ベクトルa1乃至a6は次式により求められる。
【0042】
【数2】

【0043】
次に、各偏微分係数ベクトルa1乃至a6の直交性を評価する。例えば、1つの偏微分係数ベクトル(例えばa1)における、他の5つの偏微分係数ベクトル(例えばa2乃至a6)全てと垂直な成分の大きさを、直交性の評価値とすることができる。以下では図8を参照して評価値の算出過程を説明する。ただし、各偏微分係数ベクトルa1乃至a6は6次元の空間におけるベクトルであり、そのまま図示することは困難であり、また理解の妨げとなる。このため、以下では、図8(a)に示すように、3次元空間における3本のベクトルa1乃至a3を想定し、そのうちa1の他の2本のベクトルに対する直交性の評価値を算出する過程を模式的に説明する。
【0044】
はじめに、ベクトルa3に直交する平面P3を想定する(図8(b))。次に、ベクトルa1及びa2を平面P3に投影してできたベクトル(図8(c)において、それぞれベクトルb1及びb2とする)を求める。次に、ベクトルb1のベクトルb2に垂直な成分のベクトル(図8(d)におけるベクトルc1)を求める。このベクトルc1の絶対値|c1|を直交性の評価値とする。あるいは、ベクトルc1の絶対値|c1|をベクトルa1の絶対値|a1|で割った値を評価値としてもよい。
【0045】
なお、上述の図8を参照した説明では、理解を容易にするために3次元の空間を例に、直交性の評価手法を説明したが、実際の推定処理においては、同様の手法を6次元空間における各偏微分係数ベクトルa1乃至a6に施せばよい。具体的には、以下のような手順による。初めに、ベクトルa1のベクトルa6に垂直な成分のベクトルb1を求める。次に、ベクトルb1のベクトルa5に垂直な成分のベクトルc1を求める。次に、ベクトルc1のベクトルa4に垂直な成分のベクトルd1を求める。以下同様に、ベクトルd1のベクトルa3に垂直な成分のベクトルe1、ベクトルe1のa2に垂直な成分のベクトルf1を求める。そして、ベクトルf1の絶対値|f1|又は|f1|/|a1|により、直交性を評価する。ベクトルa2乃至a6についても同様にして、それぞれf2乃至f6を求め、その絶対値により直交性を評価する。
また、ベクトルa1についての評価値が所定の閾値を上回った場合、投票する変換パラメータの候補値Vは、次式に従って求められる。ベクトルa2乃至a6についても同様である。
【0046】
【数3】

【0047】
なお、式(11)において、候補値の算出に用いられるベクトルq1は、特徴点の座標の変化を表すベクトルq(次式参照)の、ベクトルa2乃至a6の全てに直交する成分である。なお、ベクトルq1は、上記のベクトルa1からベクトルf1を求めたのと同様の手法をベクトルqに適用することにより求められる。
【0048】
【数4】

【0049】
図6に戻って、ステップS230において、未抽出の組み合わせがないと判別された場合(ステップS230;No)、第2の画像撮影時の位置・姿勢情報の更新値を決定する(ステップS290)。更新値は、投票テーブルに格納された投票結果に基づき、多数決で最も多くの得票があった候補値に決定される。
ただし、図7に示すように、更新値には、多数決により選ばれた変換パラメータを所定の比率で縮小したものが用いられる。図7に示した方法では、一回の投票結果に基づき変換パラメータを決定するのではなく、投票を複数回繰り返してより正確な位置・姿勢情報に徐々に近づけていく(いわゆるテーラー展開による手法)。これにより、より正確な位置・姿勢情報の推定が可能となる。
【0050】
次に、CPU12は、更新値を元の位置・姿勢情報に加算し、新たな位置・姿勢情報としてメモリ13に格納する(ステップS300)。次に、CPU12は、推定処理の終了条件が満たされたかを判定する(ステップS310)。ステップS310で用いられる終了条件は、例えば、所定回数の投票が繰り返されたことであってもよいし、更新値が所定の許容値よりも小さな値となったことであってもよい。
【0051】
ステップS310で終了条件が満たされたと判定された場合(ステップS310;Yes)、CPU12は、第1の画像撮影時の位置・姿勢情報の初期値と更新を繰り返して得られた位置・姿勢情報(ステップS300における新たな位置・姿勢情報)との差分を算出し、変換パラメータとして出力する(ステップS320)。すなわち、図7における推定結果を算出して、位置・姿勢情報の変化量を示す変換パラメータとして出力する。
一方、ステップS310で終了条件が満たされていないと判定された場合(ステップS310;No)、CPU12は処理をステップS220に戻し、新たな位置・姿勢情報に基づいて変換パラメータの推定を繰り返す。
【0052】
このように、変換パラメータの直交性を評価し、評価値の高いパラメータのみ投票することにより、本実施の形態のモザイク画像合成装置は、高い精度で位置・姿勢情報の推定をすることが可能である。
また、本実施の形態のモザイク画像合成装置は、いわゆるテーラー展開の手法により、徐々に真の値に近づくように位置・姿勢情報を推定するので、より精度の高い位置・姿勢情報の推定を可能としている。
【0053】
このような、精度の高い推定手法を採用することにより、本発明のモザイク画像合成装置は、高品質なモザイク画像の生成が可能である。
【0054】
本実施の形態では、直交性の評価値が、所定の閾値より小さい場合には投票をしないことにより確度の低い変換パラメータを除外したが、直交性の評価値に応じて重み付けをして投票をすることで確度の高い変換パラメータを得るようする場合も、本発明に含まれる。
このような手法は、例えば、以下のようにして実現できる。
まず、上述の実施の形態の推定処理におけるステップS260と同様に評価値を算出する。また、式(11)に従い候補値Vを算出する。そして、投票の際、候補値Vに評価値に応じた(評価値に比例した)票数を投票する。これにより、直交性が高い変換パラメータの候補値ほど相対的に多くの票を得ることができる。
【0055】
本実施の形態では、外部のカメラ2により事前に撮影された画像を取得して合成するモザイク画像合成装置を例に説明したが、本発明のモザイク画像合成装置は、撮像装置、位置センサ、姿勢センサ等を内蔵し、自ら撮影した画像をもとにモザイク画像を合成するものであってもよい。
【0056】
本実施の形態では、専用のシステムによるモザイク画像合成装置を例に説明したが、本発明のモザイク画像合成装置は、通常のコンピュータシステムを用いて実現可能である。例えば、コンピュータに、本願に係るモザイク画像合成プログラムを格納した媒体(CD−ROM、MO等)から、当該プログラムをインストールすることにより、当該コンピュータは、上述の合成処理をするモザイク画像合成装置として機能する。
【図面の簡単な説明】
【0057】
【図1】航空撮影用のカメラの構成を示すブロック図である。
【図2】位置・姿勢情報の定義を説明する図である。
【図3】ピンホールカメラを用いた場合の位置・姿勢情報に基づいた中心投影を説明する図である。
【図4】モザイク画像合成装置の構成を示すブロック図である。
【図5】合成処理の手順を示すフローチャートである。
【図6】推定処理の手順を示すフローチャートである。
【図7】推定処理の過程を模式的に示す図である。
【図8】評価値の算出過程を模式的に示す図である。
【図9】射影変換の関係にある画像を説明するための模式図である。
【図10】従来の変換パラメータ推定手法において、推定が不安定になる場合を模式的に示す図である。
【符号の説明】
【0058】
1 モザイク画像合成装置
11 画像取得部
12 CPU
13 メモリ
14 記憶部
15 出力部
16 位置・姿勢情報取得部

【特許請求の範囲】
【請求項1】
合成されるモザイク画像の元になる第1の画像及び第2の画像のデータを取得する画像取得手段と、
前記第1の画像を撮影した時のカメラの位置・姿勢情報を取得する位置・姿勢情報取得手段と、
前記第2の画像と前記第1の画像とに共通に存在する被写体上の位置(以下では当該位置を特徴点と呼ぶ)を抽出し、前記第1の画像における当該特徴点の座標と前記第2の画像における当該特徴点の座標との差分を求め、当該差分と前記位置・姿勢情報取得手段により取得される前記第1の画像を撮影した時の位置・姿勢情報とに基づいて、前記第1の画像撮影時の位置・姿勢情報を前記第2の画像撮影時の位置・姿勢情報に変換するための変換パラメータを推定する推定手段と、
前記第1の画像撮影時の位置・姿勢情報と前記推定手段により推定された前記変換パラメータとに基づいて、前記第1の画像及び前記第2の画像をモザイク画像平面の画像へと変換して貼り合わせる合成手段と、から構成されるモザイク画像合成装置であって、
前記推定手段は、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値と前記推定された変換パラメータとに基づき、最終的な前記変換パラメータの推定値を決定する、
ことを特徴とするモザイク画像合成装置。
【請求項2】
前記推定手段は、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値に基づいて前記変換パラメータの候補値に投票し、前記投票において最多の票を得た前記変換パラメータを、最終的な前記変換パラメータを推定値とする、
ことを特徴とする請求項1に記載のモザイク画像合成装置。
【請求項3】
前記推定手段は、前記直交性の評価値が所定の閾値以上である場合に、前記変換パラメータに投票し、前記直交性の評価値が所定の閾値より小さい場合には前記変換パラメータを投票しない、
ことを特徴とする請求項1に記載のモザイク画像合成装置。
【請求項4】
前記推定手段は、前記直交性の評価値が大きいほど多数の票を前記変換パラメータに投票する、
ことを特徴とする請求項1に記載のモザイク画像合成装置。
【請求項5】
撮影範囲の一部が重複する第1の画像及び第2の画像に対して、
前記第1の画像を撮影した時の位置・姿勢情報を取得する取得ステップと、
前記第2の画像と前記第1の画像とに共通に存在する複数の特徴点を抽出し、当該特徴点の移動量を求め、当該移動量と前記取得ステップにおいて取得される前記第1の画像を撮影した時の位置・姿勢情報とに基づき、前記第1の画像撮影時の位置・姿勢情報から前記第2の画像撮影時の位置・姿勢情報への変換パラメータを推定する推定ステップと、
前記第1の画像撮影時の位置・姿勢情報及び前記推定ステップにおいて推定された前記変換パラメータに基づいて、前記第1の画像及び前記第2の画像をモザイク画像平面の画像へと変換して貼り合わせる合成ステップと、から構成されるモザイク画像合成方法であって、
前記推定ステップは、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値に基づいて前記変換パラメータを投票し、前記投票において最多の票を得た前記変換パラメータを、最終的な前記変換パラメータを推定値とする、
ことを特徴とするモザイク画像合成方法。
【請求項6】
コンピュータに、
撮影範囲の一部が重複する第1の画像及び第2の画像に対して、
前記第1の画像を撮影した時の位置・姿勢情報を取得する取得ステップと、
前記第2の画像と前記第1の画像とに共通に存在する複数の特徴点を抽出し、当該特徴点の移動量を求め、当該移動量と前記取得ステップにおいて取得される前記第1の画像を撮影した時の位置・姿勢情報とに基づき、前記第1の画像撮影時の位置・姿勢情報から前記第2の画像撮影時の位置・姿勢情報への変換パラメータを推定する推定ステップと、
前記第1の画像撮影時の位置・姿勢情報及び前記推定ステップにおいて推定された前記変換パラメータに基づいて、前記第1の画像及び前記第2の画像をモザイク画像平面の画像へと変換して貼り合わせる合成ステップと、を実行させるモザイク画像合成プログラムであって、
前記推定ステップは、前記特徴点の複数の組み合わせに基づいて、前記特徴点の組み合わせ毎に前記変換パラメータを推定し、推定された前記変換パラメータの直交性の評価値を算出し、前記直交性の評価値に基づいて前記変換パラメータを投票し、前記投票において最多の票を得た前記変換パラメータを、最終的な前記変換パラメータを推定値とする、
ことを特徴とするモザイク画像合成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2006−195540(P2006−195540A)
【公開日】平成18年7月27日(2006.7.27)
【国際特許分類】
【出願番号】特願2005−3924(P2005−3924)
【出願日】平成17年1月11日(2005.1.11)
【出願人】(000102728)株式会社エヌ・ティ・ティ・データ (438)
【Fターム(参考)】