画像処理装置及び画像処理プログラム
【課題】 対象物の姿勢推定を高精度に行うことができる画像処理装置及び画像処理プログラムを提供する。
【解決手段】 物体の姿勢を推定する場合、物体の撮像画像から物体の輪郭の特徴量を抽出し、その輪郭の特徴量をデータベースとして記憶されている複数の特徴量データと照合して、各特徴量データに対する輪郭の特徴量の類似度を算出する。続いて、各特徴量データに対する輪郭の特徴量の類似度を、緯度・経度の2次元類似度マップとして表示する。続いて、各類似度を経度方向に対して累積した経度ヒストグラムと、各類似度を緯度方向に対して類似度を累積した緯度ヒストグラムとを作成する。続いて、各ヒストグラムについて閾値よりも大きい類似度総和ピークを抽出し、候補領域を選定する。そして、候補領域内に存在する視点に対応する特徴量データに対する輪郭の特徴量の類似度を最大類似度とする。
【解決手段】 物体の姿勢を推定する場合、物体の撮像画像から物体の輪郭の特徴量を抽出し、その輪郭の特徴量をデータベースとして記憶されている複数の特徴量データと照合して、各特徴量データに対する輪郭の特徴量の類似度を算出する。続いて、各特徴量データに対する輪郭の特徴量の類似度を、緯度・経度の2次元類似度マップとして表示する。続いて、各類似度を経度方向に対して累積した経度ヒストグラムと、各類似度を緯度方向に対して類似度を累積した緯度ヒストグラムとを作成する。続いて、各ヒストグラムについて閾値よりも大きい類似度総和ピークを抽出し、候補領域を選定する。そして、候補領域内に存在する視点に対応する特徴量データに対する輪郭の特徴量の類似度を最大類似度とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対象物の撮像画像を用いて対象物の姿勢を推定する画像処理装置及び画像処理プログラムに関するものである。
【背景技術】
【0002】
従来の画像処理装置としては、例えば非特許文献1に記載されているように、物体の撮像画像から物体の輪郭を抽出し、この輪郭の同一勾配点を利用した特徴量を生成し、この特徴量を予め登録されている複数の特徴量データと照合(マッチング)して、各特徴量データに対する抽出した特徴量の類似度を求めるものが知られている。
【非特許文献1】Amit Sethi,et al.”’Curve and Surface Duals and the Recognition ofCurved 3D Objects from their Silhouettes”’, International Journal of ComputerVision,vol.58,no.1,pp.73-86,June 2004.
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記従来技術においては、各特徴量データに対する抽出した特徴量の類似度に基づいて物体の姿勢を推定する場合に、単純に特徴量データに対する抽出した特徴量が最大となる類似度を選択すると、ノイズ等によって突発的に類似度が高くなった異常値が物体の姿勢推定に用いられることがある。この場合には、姿勢推定が不安定になり、推定精度が悪化する可能性がある。
【0004】
本発明の目的は、対象物の姿勢推定を高精度に行うことができる画像処理装置及び画像処理プログラムを提供することである。
【課題を解決するための手段】
【0005】
本発明は、対象物の撮像画像を用いて対象物の姿勢を推定する画像処理装置であって、対象物における複数の姿勢の特徴量データを予め記憶する記憶手段と、対象物の撮像画像から対象物の姿勢の特徴量を抽出する特徴量抽出手段と、記憶手段に記憶された各特徴量データに対する特徴量抽出手段で抽出した特徴量の類似度をそれぞれ求める類似度算出手段と、類似度算出手段で求めた各類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成手段と、第1ヒストグラムに基づいて、特徴量データに対する抽出した特徴量の最大類似度を求め、対象物の姿勢を推定する推定手段とを備えることを特徴とするものである。
【0006】
このような画像処理装置においては、まず対象物の撮像画像から対象物の姿勢の特徴量を抽出し、各特徴量データに対する抽出した特徴量(抽出特徴量)の類似度をそれぞれ求める。そして、これらの類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成し、この第1ヒストグラムに基づいて、特徴量データに対する抽出特徴量の最大類似度を求める。ここで、第1ヒストグラムに存在する類似度総和のピークが1つだけあれば、そのピークに対応する特徴量データに対する抽出特徴量の類似度を最大類似度とする。しかし、第1ヒストグラムに類似度総和のピークが2つ以上存在する場合には、ノイズ等によって突発的に類似度が高くなった異常値が存在していると考えられる。この場合には、各ピークとなる棒グラフの類似度総和の値(ピーク値)や、各ピークとなる棒グラフに隣接する他の棒グラフの類似度総和の値等を考慮して、正常と推定される何れか1つのピークに対応する特徴量データを選び、その特徴量データに対する抽出特徴量の類似度を最大類似度とする。これにより、ノイズ等に起因して突発的に類似度が高くなった異常値が除外され、特徴量データに対する抽出特徴量の適切な最大類似度が得られる。その結果、対象物の姿勢を精度良く推定することができる。
【0007】
好ましくは、ヒストグラム作成手段は、類似度算出手段で求めた各類似度を2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、推定手段は、第1ヒストグラム及び第2ヒストグラムに基づいて最大類似度を求める。
【0008】
この場合には、第1ヒストグラムに存在する類似度総和のピークと第2ヒストグラムに存在する類似度総和のピークとを組み合わせることで、特徴量データに対する抽出特徴量の適切な最大類似度が安定して得られる。これにより、対象物の姿勢を更に精度良く推定することができる。
【0009】
このとき、好ましくは、推定手段は、第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から最大類似度を求める。
【0010】
この場合には、第1ヒストグラムにおける類似度総和のピーク値及び第2ヒストグラムにおける類似度総和のピーク値を用いて、特徴量データに対する抽出特徴量の適切な最大類似度を容易に且つ確実に求めることができる。
【0011】
また、好ましくは、特徴量抽出手段で抽出した特徴量と記憶手段に記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出手段と、回転成分算出手段で求めた各回転成分のうち対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出手段とを更に備え、推定手段は、更に回転成分の差分に基づいて最大類似度を求める。
【0012】
各特徴量データに対する抽出特徴量の類似度を求める際には、抽出特徴量を各特徴量データに対して回転させて、両者を照合させる。このとき、特徴量データに対する抽出特徴量の最大類似度が正常値であれば、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分は小さい。しかし、ノイズ等によって突発的に類似度が高くなった異常値を最大類似度とした場合には、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分が大きくなる。そこで、対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求め、上記のヒストグラムと回転成分の差分とに基づいて、特徴量データに対する抽出特徴量の最大類似度を求めることにより、適切な最大類似度が安定して得られるようになる。これにより、対象物の姿勢を更に精度良く推定することができる。
【0013】
また、本発明は、対象物の撮像画像を用いて対象物の姿勢を推定する画像処理をコンピュータに実行させる画像処理プログラムであって、対象物の撮像画像から対象物の姿勢の特徴量を抽出する特徴量抽出ステップと、メモリに予め記憶されている対象物における複数の姿勢の特徴量データに対する特徴量抽出ステップで抽出した特徴量の類似度をそれぞれ求める類似度算出ステップと、類似度算出ステップで求めた各類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成ステップと、第1ヒストグラムに基づいて、特徴量データに対する抽出した特徴量の最大類似度を求め、対象物の姿勢を推定する推定ステップとをコンピュータに実行させることを特徴とするものである。
【0014】
このような画像処理プログラムの実行においては、まず対象物の撮像画像から対象物の姿勢の特徴量を抽出し、各特徴量データに対する抽出した特徴量(抽出特徴量)の類似度をそれぞれ求める。そして、これらの類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成し、この第1ヒストグラムに基づいて、特徴量データに対する抽出特徴量の最大類似度を求める。ここで、第1ヒストグラムに存在する類似度総和のピークが1つだけあれば、そのピークに対応する特徴量データに対する抽出特徴量の類似度を最大類似度とする。しかし、第1ヒストグラムに類似度総和のピークが2つ以上存在する場合には、ノイズ等によって突発的に類似度が高くなった異常値が存在していると考えられる。この場合には、各ピークとなる棒グラフの類似度総和の値(ピーク値)や、各ピークとなる棒グラフに隣接する他の棒グラフの類似度総和の値等を考慮して、正常と推定される何れか1つのピークに対応する特徴量データを選び、その特徴量データに対する抽出特徴量の類似度を最大類似度とする。これにより、ノイズ等に起因して突発的に類似度が高くなった異常値が除外され、特徴量データに対する抽出特徴量の適切な最大類似度が得られる。その結果、対象物の姿勢を精度良く推定することができる。
【0015】
好ましくは、ヒストグラム作成ステップでは、類似度算出ステップで求めた各類似度を2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、推定ステップでは、第1ヒストグラム及び第2ヒストグラムに基づいて最大類似度を求める。
【0016】
この場合には、第1ヒストグラムに存在する類似度総和のピークと第2ヒストグラムに存在する類似度総和のピークとを組み合わせることで、特徴量データに対する抽出特徴量の適切な最大類似度が安定して得られる。これにより、対象物の姿勢を更に精度良く推定することができる。
【0017】
このとき、好ましくは、推定ステップでは、第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から最大類似度を求める。
【0018】
この場合には、第1ヒストグラムにおける類似度総和のピーク値及び第2ヒストグラムにおける類似度総和のピーク値を用いて、特徴量データに対する抽出特徴量の適切な最大類似度を容易に且つ確実に求めることができる。
【0019】
また、好ましくは、特徴量抽出ステップで抽出した特徴量とメモリに記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出ステップと、回転成分算出ステップで求めた各回転成分のうち対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出ステップとを更にコンピュータに実行させ、推定ステップでは、更に回転成分の差分に基づいて最大類似度を求める。
【0020】
各特徴量データに対する抽出特徴量の類似度を求める際には、抽出特徴量を各特徴量データに対して回転させて、両者を照合させる。このとき、特徴量データに対する抽出特徴量の最大類似度が正常値であれば、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分は小さい。しかし、ノイズ等によって突発的に類似度が高くなった異常値を最大類似度とした場合には、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分が大きくなる。そこで、対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求め、上記のヒストグラムと回転成分の差分とに基づいて、特徴量データに対する抽出特徴量の最大類似度を求めることにより、適切な最大類似度が安定して得られるようになる。これにより、対象物の姿勢を更に精度良く推定することができる。
【発明の効果】
【0021】
本発明によれば、対象物の撮像画像を用いて対象物の姿勢を推定する際に、対象物の誤認識を抑制し、対象物の姿勢推定を高精度に行うことができる。
【発明を実施するための最良の形態】
【0022】
以下、本発明に係わる画像処理装置及び画像処理プログラムの好適な実施形態について、図面を参照して詳細に説明する。
【0023】
図1は、本発明に係わる画像処理装置の一実施形態の概略構成を示すブロック図である。本実施形態の画像処理装置1は、例えば急須やマグカップ等の取っ手付き容器を把持するロボットに適用されるものである。
【0024】
同図において、画像処理装置1は、認識対象物体を撮像するカメラ2A,2Bと、これらのカメラ2A,2Bによる撮像画像を入力し、所定の画像処理を行い、物体の姿勢を推定する画像処理部3と、この画像処理部3の処理結果を表示するモニタ部4と、画像処理部3による画像処理に使用されるデータベースを蓄積記憶するデータ格納部5とを備えている。画像処理部3の処理結果は、把持制御処理部6にも送られる。把持制御処理部6は、画像処理部3で推定された物体の姿勢に基づいて、物体を把持するように制御する。
【0025】
カメラ2A,2Bは、例えばCCDカメラであり、異なる2つの視点から物体を撮像するようにロボットの両眼部(図示せず)に設けられている。
【0026】
画像処理部3は、物体認識処理に特化した専用のハードウェアとして構成されていても良いし、或いはCPU、メモリ(記憶媒体)、入力部及び出力部を有するパーソナルコンピュータ等の汎用コンピュータを用い、この汎用コンピュータにソフトウェアとしての画像処理プログラムを実行させても良い。このとき、画像処理プログラムは、例えばCD−ROM、DVD、ROM等の記憶媒体または半導体メモリによって提供される。また、画像処理プログラムは、搬送波に重畳されたコンピュータデータ信号としてネットワークを介して提供されるものであっても良い。
【0027】
図2は、画像処理部3による処理手順の概略を示すフローチャートである。同図において、まずカメラ2A,2Bによる撮像画像を取得する(手順11)。カメラ2A,2Bによる撮像画像の一例を図3に示す。図3(a)は、ロボットの左眼部に配置されたカメラ2Aによる撮像画像(左画像とする)を示し、図3(b)は、ロボットの右眼部に配置されたカメラ2Bによる撮像画像(右画像とする)を示している。
【0028】
続いて、手順11で取得した左画像及び右画像について、濃度値が一様とみなせる物体毎の領域に分割する(手順12)。例えば図3に示す画像では、枠で囲まれた領域Rが認識対象物体を含む領域となる。
【0029】
また、手順12の領域分割処理と並行して、2次元の左画像及び右画像から3次元画像を復元する(手順13)。この3次元画像の復元は、例えば両眼視差の考え方を利用して、ある点の左画像及び右画像での位置座標とカメラ2A,2B間の距離とから当該点の奥行きを計算することにより行う。
【0030】
続いて、手順12で領域分割された2次元画像と手順13で復元された3次元画像とに基づいて、エッジ検出等により領域R内に存在する物体の輪郭を抽出する(手順14)。例えば図3(a)に示す左画像における物体の輪郭Bは、図4に示すようなものとなる。
【0031】
続いて、手順14で得られた物体の輪郭Bの特徴量を抽出する(手順15)。輪郭Bの特徴量としては、輪郭Bの位置、回転及び大きさに対して不変な不変量を用いる。この不変量としては、図5に示すように、輪郭Bにおける1つの勾配(接線の傾き)Hから他の勾配Hまでの距離d1〜iが挙げられる。例えば図5に示すような角度の勾配度では、不変量の次元数は3次元となる。
【0032】
続いて、手順15で得られた物体の輪郭Bの特徴量を、データ格納部5にデータベースとして記憶されている複数の特徴量データと照合(マッチング)することにより、各特徴量データに対する輪郭Bの特徴量の類似度をそれぞれ算出する(手順16)。
【0033】
特徴量データは、図6に示すように、認識対象物体7を複数の視点(姿勢取得位置)Wから見た時の物体7の姿勢に関するデータである。それらの視点Wは、物体7を取り囲むように想定した仮想球面V上に設定されている。物体7の姿勢の特徴量データは、例えばレンジファインダによって物体7の3次元形状として取得される。
【0034】
このような類似度の算出時には、輪郭Bの特徴量を各特徴量データに対して照合させるための回転成分(後述)が求められる。なお、マッチング手法としては、例えば類似性を精度良く判定できるDP(Dynamic Programming)マッチング等が採用される。
【0035】
続いて、左画像及び右画像のうち、特徴量データに対する輪郭Bの特徴量の類似度が高い方の画像を基準画像として選択する(手順17)。続いて、選択された基準画像における物体の輪郭Bについて、特徴量データに対する輪郭Bの特徴量の最大類似度を算出する(手順18)。この最大類似度算出処理については、後で詳述する。そして、その最大類似度となる特徴量データに対応する輪郭の形状を物体の初期姿勢位置に設定する(手順19)。
【0036】
続いて、まず基準画像のみを用いて、物体の姿勢を粗推定する(手順20)。この単眼姿勢推定処理としては、例えば輪郭BのDT(Distance Transforms)画像を作成し、このDT画像を3次元の輪郭形状データとDTマッチングすることにより行う。続いて、その単眼姿勢推定の妥当性を判断する(手順21)。この妥当性は、例えば手順20の姿勢推定によって得られた輪郭と手順13の3次元復元によって得られた輪郭とを重ね合わせた時の重なり程度から判断する。
【0037】
このとき、姿勢推定が正しいと判定されたときは、引き続き左画像及び右画像の両方を用いて、物体の姿勢を詳細に推定する(手順22)。この複眼姿勢推定処理は、手順20の単眼姿勢推定処理と同様の手法で行う。続いて、その複眼姿勢推定の妥当性を判断する(手順23)。この時の妥当性の判断手法は、手順21と同様である。そして、姿勢推定が正しいと判定されたときは、その推定結果を把持制御処理部6に送出すると共にモニタ部4に表示させる(手順24)。
【0038】
一方、手順21,23において姿勢推定が正しくないと判断されたときは、特徴量データに対する輪郭Bの特徴量の類似度が次に高くなるような他の特徴量データを選択し、その特徴量データに対応する輪郭の形状を新たな物体の初期姿勢位置に設定する(手順25)。そして、上記の手順20〜24を再度実行する。
【0039】
図7は、図2に示す手順18の最大類似度算出処理の詳細を示すフローチャートである。同図において、まず図2に示す手順16で算出された各特徴量データに対する輪郭Bの特徴量(不変量)の類似度を2次元マップとして表示する(手順31)。
【0040】
具体的には、図6に示すように、複数の視点Wを決めるための仮想球面Vについて緯度及び経度を設定する。これらの緯度及び経度は、認識対象物体7の直交する2つの姿勢方向を示す指標となるものである。そして、ここで用いられる2次元マップは、図8に示すように、横軸を経度、縦軸を緯度としたグラフからなるものである。図8では、図6に示す複数の視点Wの位置を2次元的に表している。つまり、図6に示すまばらな3次元上の視点Wを、補間を用いて2次元上の視点として均一化している。このような2次元マップ化を実施することで、計算処理を容易にすることができる。
【0041】
そして、各特徴量データに対する輪郭Bの特徴量の類似度を、図8に示すグラフにおいて特徴量データに対応する視点の位置にそれぞれ展開して、類似度マップを作成する。この類似度マップの一例を図9に示す。図9に示す類似度マップでは、類似度が高くなるほど白くなるように表示される。
【0042】
続いて、類似度マップの各類似度を経度方向に対して累積した経度ヒストグラムを作成すると共に、類似度マップの各類似度を緯度方向に対して類似度を累積した緯度ヒストグラムを作成する(手順32)。図9に示す類似度マップに対しては、図10に示すような経度ヒストグラム及び緯度ヒストグラムが得られる。これらのヒストグラムでは、横軸の階級が経度または緯度、縦軸の度数が類似度総和となっている。
【0043】
続いて、1つの視点に対応する特徴量データに対する輪郭Bの特徴量の回転成分と当該視点に隣接する複数(例えば8箇所)の視点に対応する各特徴量データに対する輪郭Bの特徴量の回転成分との差分を求める(手順33)。この処理は、全ての視点について実施する。
【0044】
そして、各視点について求めた回転成分の差分を、図8に示すグラフにおいて対応する視点の位置にそれぞれ展開して、回転成分差マップを作成する(手順34)。この回転成分差マップの一例を図11に示す。図11に示す回転成分差マップでは、回転成分の差分が大きくなるほど白くなるように表示される。
【0045】
続いて、手順32で作成した経度ヒストグラム及び緯度ヒストグラムについて、予め設定された閾値よりも大きい値をもった類似度総和のピークをそれぞれ抽出し、類似度マップにおいて最大類似度となる可能性のある候補領域を選定する(手順35)。
【0046】
例えば図10に示すものでは、経度ヒストグラムにおいて閾値よりも大きい値をもった類似度総和のピークが2つある。このため、経度ヒストグラムにおいて2つのピークとなる各棒グラフの経度と緯度ヒストグラムにおいてピークとなる棒グラフの緯度とが交差する点に最も近い視点を含むような候補領域S1,S2を決定する。
【0047】
そして、手順35で得られた視点の候補領域が複数存在するかどうかを判断し(手順36)、候補領域が複数存在するときは、複数の候補領域から最適と考えられる1つの候補領域を選択する(手順37)。
【0048】
特徴量データに対する輪郭Bの特徴量の類似度が正常の最大類似度となる場合には、対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の類似度も高くなる傾向にあるが、特徴量データに対する輪郭Bの特徴量の類似度がノイズや外乱等により突発的に高くなる場合には、対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の類似度が低くなることが多い。そこで、ヒストグラムにおける類似度総和のピーク値と、このピークとなる棒グラフに対して経度が近い他の棒グラフの類似度総和とを考慮して、1つの候補領域を選択する。
【0049】
例えば図10に示すものでは、経度ヒストグラムにおいて候補領域S1内の類似度総和のピーク値が候補領域S2内の類似度総和のピーク値よりも高いことに加え、候補領域S1内でピークとなる棒グラフに近い他の棒グラフの類似度総和が比較的高いにも拘わらず、候補領域S2内でピークとなる棒グラフに近い他の棒グラフの類似度総和は下がっている。このため、候補領域S2内に存在する類似度総和のピークは突発的に生じたものと考えられ、候補領域S1が選択される。
【0050】
続いて、手順34で作成した回転成分差マップを用いて、選択された候補領域の妥当性を判断する(手順38)。
【0051】
特徴量データに対する輪郭Bの特徴量の類似度が正常の最大類似度となる場合には、当該特徴量データに対する輪郭Bの特徴量の回転成分と対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の回転成分との差分が小さくなる傾向にある。しかし、特徴量データに対する輪郭Bの特徴量の類似度がノイズや外乱等により突発的に高くなる場合には、当該特徴量データに対する輪郭Bの特徴量の回転成分と対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の回転成分との差分が大きくなることが多い。従って、そのような回転成分の差分から候補領域の妥当性を判断することができる。
【0052】
例えば図11に示す回転成分差マップでは、選択された候補領域S1が比較的黒くなっている。つまり、候補領域S1内では、回転成分の差分が小さくなっている。従って、選択された候補領域S1は正しいと判断される。
【0053】
そして、候補領域が正しく選択されたと判断されると、緯度・経度が当該候補領域内に存在するような視点を抽出し、この視点に対応する特徴量データに対する輪郭Bの特徴量の類似度を最大類似度とする(手順39)。
【0054】
以上において、データ格納部5は、対象物における複数の姿勢の特徴量データを予め記憶する記憶手段を構成する。画像処理部3の手順11〜15(図2参照)は、対象物の撮像画像から対象物の姿勢の特徴量を抽出する特徴量抽出手段(特徴量抽出ステップ)を構成する。画像処理部3の手順16(図2参照)は、記憶手段に記憶された各特徴量データに対する特徴量抽出手段で抽出した特徴量の類似度をそれぞれ求める類似度算出手段(類似度算出ステップ)を構成する。画像処理部3の手順31,32(図7参照)は、類似度算出手段で求めた各類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成手段(ヒストグラム作成ステップ)を構成する。画像処理部3の手順35〜39(図7参照)及び手順19〜25(図2参照)は、第1ヒストグラムに基づいて、特徴量データに対する抽出した特徴量の最大類似度を求め、対象物の姿勢を推定する推定手段(推定ステップ)を構成する。
【0055】
また、画像処理部3の手順16(図2参照)は、特徴量抽出手段で抽出した特徴量と記憶手段に記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出手段(回転成分算出ステップ)を構成する。画像処理部3の手順33,34(図7参照)は、回転成分算出手段で求めた各回転成分のうち対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出手段(回転差分算出ステップ)を構成する。
【0056】
以上のように本実施形態にあっては、各特徴量データに対する輪郭Bの特徴量の類似度を2次元的に表す類似度マップを作成し、この類似度マップの類似度を経度方向及び緯度方向に対して累積した2つのヒストグラムを作成し、各ヒストグラムに存在するピークを抽出して、最大類似度となる可能性の最も高い1つの候補領域を選定する。また、1つの視点に対応する特徴量データに対する輪郭Bの特徴量の回転成分と当該視点に隣接する複数の視点に対応する各特徴量データに対する輪郭Bの特徴量の回転成分との差分を求め、この回転成分の差分を考慮して、選定した候補領域の妥当性を判断する。そして、その結果に基づいて、特徴量データに対する輪郭Bの特徴量の最大類似度を決定する。
【0057】
従って、ノイズや外乱等により類似度が突発的に高くなった異常値が除外されるため、特徴量データに対する輪郭Bの特徴量の適切な最大類似度を求めることができる。これにより、その後の処理において物体の初期姿勢位置を高精度に設定できるため、結果的に物体の姿勢推定の推定精度を向上させることが可能となる。
【0058】
なお、本発明は、上記実施形態に限定されるものではない。例えば上記実施形態では、輪郭Bの各勾配H間の距離に関するパラメータを物体の特徴量として用いたが、特徴量としては、輪郭Bの位置、回転及び大きさに対して不変な不変量であれば、特にこれには限られず、例えば曲率、色情報、ヒストグラム等を用いても良い。
【0059】
また、上記実施形態は、物体を把持するロボットに適用されるものであるが、本発明の画像処理装置及び画像処理プログラムは、物体を認識して物体の姿勢を推定する他の装置やシステム等にも適用可能である。
【図面の簡単な説明】
【0060】
【図1】本発明に係わる画像処理装置の一実施形態の概略構成を示すブロック図である。
【図2】図1に示す画像処理部による処理手順の概略を示すフローチャートである。
【図3】図1に示す2つのカメラで撮像して得られた左画像及び右画像の一例を示す図である。
【図4】図3(a)に示す左画像から抽出された物体の輪郭を示す図である。
【図5】物体の特徴量として物体の輪郭の不変量を抽出する様子を示す概念図である。
【図6】物体の複数の姿勢に関する特徴量データを取得するための複数の視点を示す概念図である。
【図7】図2に示す最大類似度算出処理の詳細を示すフローチャートである。
【図8】図6に示す複数の視点の位置を2次元的に表した概念図である。
【図9】図7に示す最大類似度算出処理によって得られる類似度マップの一例を示す図である。
【図10】図9に示す類似度マップから作成される経度ヒストグラム及び緯度ヒストグラムの一例を示す図である。
【図11】図7に示す最大類似度算出処理によって得られる回転成分差マップの一例を示す図である。
【符号の説明】
【0061】
1…画像処理装置、2A,2B…カメラ、3…画像処理部(特徴量抽出手段、類似度算出手段、ヒストグラム作成手段、推定手段、回転成分算出手段、回転差分算出手段)、5…データ格納部(記憶手段)。
【技術分野】
【0001】
本発明は、対象物の撮像画像を用いて対象物の姿勢を推定する画像処理装置及び画像処理プログラムに関するものである。
【背景技術】
【0002】
従来の画像処理装置としては、例えば非特許文献1に記載されているように、物体の撮像画像から物体の輪郭を抽出し、この輪郭の同一勾配点を利用した特徴量を生成し、この特徴量を予め登録されている複数の特徴量データと照合(マッチング)して、各特徴量データに対する抽出した特徴量の類似度を求めるものが知られている。
【非特許文献1】Amit Sethi,et al.”’Curve and Surface Duals and the Recognition ofCurved 3D Objects from their Silhouettes”’, International Journal of ComputerVision,vol.58,no.1,pp.73-86,June 2004.
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記従来技術においては、各特徴量データに対する抽出した特徴量の類似度に基づいて物体の姿勢を推定する場合に、単純に特徴量データに対する抽出した特徴量が最大となる類似度を選択すると、ノイズ等によって突発的に類似度が高くなった異常値が物体の姿勢推定に用いられることがある。この場合には、姿勢推定が不安定になり、推定精度が悪化する可能性がある。
【0004】
本発明の目的は、対象物の姿勢推定を高精度に行うことができる画像処理装置及び画像処理プログラムを提供することである。
【課題を解決するための手段】
【0005】
本発明は、対象物の撮像画像を用いて対象物の姿勢を推定する画像処理装置であって、対象物における複数の姿勢の特徴量データを予め記憶する記憶手段と、対象物の撮像画像から対象物の姿勢の特徴量を抽出する特徴量抽出手段と、記憶手段に記憶された各特徴量データに対する特徴量抽出手段で抽出した特徴量の類似度をそれぞれ求める類似度算出手段と、類似度算出手段で求めた各類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成手段と、第1ヒストグラムに基づいて、特徴量データに対する抽出した特徴量の最大類似度を求め、対象物の姿勢を推定する推定手段とを備えることを特徴とするものである。
【0006】
このような画像処理装置においては、まず対象物の撮像画像から対象物の姿勢の特徴量を抽出し、各特徴量データに対する抽出した特徴量(抽出特徴量)の類似度をそれぞれ求める。そして、これらの類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成し、この第1ヒストグラムに基づいて、特徴量データに対する抽出特徴量の最大類似度を求める。ここで、第1ヒストグラムに存在する類似度総和のピークが1つだけあれば、そのピークに対応する特徴量データに対する抽出特徴量の類似度を最大類似度とする。しかし、第1ヒストグラムに類似度総和のピークが2つ以上存在する場合には、ノイズ等によって突発的に類似度が高くなった異常値が存在していると考えられる。この場合には、各ピークとなる棒グラフの類似度総和の値(ピーク値)や、各ピークとなる棒グラフに隣接する他の棒グラフの類似度総和の値等を考慮して、正常と推定される何れか1つのピークに対応する特徴量データを選び、その特徴量データに対する抽出特徴量の類似度を最大類似度とする。これにより、ノイズ等に起因して突発的に類似度が高くなった異常値が除外され、特徴量データに対する抽出特徴量の適切な最大類似度が得られる。その結果、対象物の姿勢を精度良く推定することができる。
【0007】
好ましくは、ヒストグラム作成手段は、類似度算出手段で求めた各類似度を2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、推定手段は、第1ヒストグラム及び第2ヒストグラムに基づいて最大類似度を求める。
【0008】
この場合には、第1ヒストグラムに存在する類似度総和のピークと第2ヒストグラムに存在する類似度総和のピークとを組み合わせることで、特徴量データに対する抽出特徴量の適切な最大類似度が安定して得られる。これにより、対象物の姿勢を更に精度良く推定することができる。
【0009】
このとき、好ましくは、推定手段は、第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から最大類似度を求める。
【0010】
この場合には、第1ヒストグラムにおける類似度総和のピーク値及び第2ヒストグラムにおける類似度総和のピーク値を用いて、特徴量データに対する抽出特徴量の適切な最大類似度を容易に且つ確実に求めることができる。
【0011】
また、好ましくは、特徴量抽出手段で抽出した特徴量と記憶手段に記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出手段と、回転成分算出手段で求めた各回転成分のうち対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出手段とを更に備え、推定手段は、更に回転成分の差分に基づいて最大類似度を求める。
【0012】
各特徴量データに対する抽出特徴量の類似度を求める際には、抽出特徴量を各特徴量データに対して回転させて、両者を照合させる。このとき、特徴量データに対する抽出特徴量の最大類似度が正常値であれば、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分は小さい。しかし、ノイズ等によって突発的に類似度が高くなった異常値を最大類似度とした場合には、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分が大きくなる。そこで、対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求め、上記のヒストグラムと回転成分の差分とに基づいて、特徴量データに対する抽出特徴量の最大類似度を求めることにより、適切な最大類似度が安定して得られるようになる。これにより、対象物の姿勢を更に精度良く推定することができる。
【0013】
また、本発明は、対象物の撮像画像を用いて対象物の姿勢を推定する画像処理をコンピュータに実行させる画像処理プログラムであって、対象物の撮像画像から対象物の姿勢の特徴量を抽出する特徴量抽出ステップと、メモリに予め記憶されている対象物における複数の姿勢の特徴量データに対する特徴量抽出ステップで抽出した特徴量の類似度をそれぞれ求める類似度算出ステップと、類似度算出ステップで求めた各類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成ステップと、第1ヒストグラムに基づいて、特徴量データに対する抽出した特徴量の最大類似度を求め、対象物の姿勢を推定する推定ステップとをコンピュータに実行させることを特徴とするものである。
【0014】
このような画像処理プログラムの実行においては、まず対象物の撮像画像から対象物の姿勢の特徴量を抽出し、各特徴量データに対する抽出した特徴量(抽出特徴量)の類似度をそれぞれ求める。そして、これらの類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成し、この第1ヒストグラムに基づいて、特徴量データに対する抽出特徴量の最大類似度を求める。ここで、第1ヒストグラムに存在する類似度総和のピークが1つだけあれば、そのピークに対応する特徴量データに対する抽出特徴量の類似度を最大類似度とする。しかし、第1ヒストグラムに類似度総和のピークが2つ以上存在する場合には、ノイズ等によって突発的に類似度が高くなった異常値が存在していると考えられる。この場合には、各ピークとなる棒グラフの類似度総和の値(ピーク値)や、各ピークとなる棒グラフに隣接する他の棒グラフの類似度総和の値等を考慮して、正常と推定される何れか1つのピークに対応する特徴量データを選び、その特徴量データに対する抽出特徴量の類似度を最大類似度とする。これにより、ノイズ等に起因して突発的に類似度が高くなった異常値が除外され、特徴量データに対する抽出特徴量の適切な最大類似度が得られる。その結果、対象物の姿勢を精度良く推定することができる。
【0015】
好ましくは、ヒストグラム作成ステップでは、類似度算出ステップで求めた各類似度を2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、推定ステップでは、第1ヒストグラム及び第2ヒストグラムに基づいて最大類似度を求める。
【0016】
この場合には、第1ヒストグラムに存在する類似度総和のピークと第2ヒストグラムに存在する類似度総和のピークとを組み合わせることで、特徴量データに対する抽出特徴量の適切な最大類似度が安定して得られる。これにより、対象物の姿勢を更に精度良く推定することができる。
【0017】
このとき、好ましくは、推定ステップでは、第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から最大類似度を求める。
【0018】
この場合には、第1ヒストグラムにおける類似度総和のピーク値及び第2ヒストグラムにおける類似度総和のピーク値を用いて、特徴量データに対する抽出特徴量の適切な最大類似度を容易に且つ確実に求めることができる。
【0019】
また、好ましくは、特徴量抽出ステップで抽出した特徴量とメモリに記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出ステップと、回転成分算出ステップで求めた各回転成分のうち対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出ステップとを更にコンピュータに実行させ、推定ステップでは、更に回転成分の差分に基づいて最大類似度を求める。
【0020】
各特徴量データに対する抽出特徴量の類似度を求める際には、抽出特徴量を各特徴量データに対して回転させて、両者を照合させる。このとき、特徴量データに対する抽出特徴量の最大類似度が正常値であれば、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分は小さい。しかし、ノイズ等によって突発的に類似度が高くなった異常値を最大類似度とした場合には、当該特徴量データに対する回転成分と対象物の姿勢取得位置が隣接する他の特徴量データに対する回転成分との差分が大きくなる。そこで、対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求め、上記のヒストグラムと回転成分の差分とに基づいて、特徴量データに対する抽出特徴量の最大類似度を求めることにより、適切な最大類似度が安定して得られるようになる。これにより、対象物の姿勢を更に精度良く推定することができる。
【発明の効果】
【0021】
本発明によれば、対象物の撮像画像を用いて対象物の姿勢を推定する際に、対象物の誤認識を抑制し、対象物の姿勢推定を高精度に行うことができる。
【発明を実施するための最良の形態】
【0022】
以下、本発明に係わる画像処理装置及び画像処理プログラムの好適な実施形態について、図面を参照して詳細に説明する。
【0023】
図1は、本発明に係わる画像処理装置の一実施形態の概略構成を示すブロック図である。本実施形態の画像処理装置1は、例えば急須やマグカップ等の取っ手付き容器を把持するロボットに適用されるものである。
【0024】
同図において、画像処理装置1は、認識対象物体を撮像するカメラ2A,2Bと、これらのカメラ2A,2Bによる撮像画像を入力し、所定の画像処理を行い、物体の姿勢を推定する画像処理部3と、この画像処理部3の処理結果を表示するモニタ部4と、画像処理部3による画像処理に使用されるデータベースを蓄積記憶するデータ格納部5とを備えている。画像処理部3の処理結果は、把持制御処理部6にも送られる。把持制御処理部6は、画像処理部3で推定された物体の姿勢に基づいて、物体を把持するように制御する。
【0025】
カメラ2A,2Bは、例えばCCDカメラであり、異なる2つの視点から物体を撮像するようにロボットの両眼部(図示せず)に設けられている。
【0026】
画像処理部3は、物体認識処理に特化した専用のハードウェアとして構成されていても良いし、或いはCPU、メモリ(記憶媒体)、入力部及び出力部を有するパーソナルコンピュータ等の汎用コンピュータを用い、この汎用コンピュータにソフトウェアとしての画像処理プログラムを実行させても良い。このとき、画像処理プログラムは、例えばCD−ROM、DVD、ROM等の記憶媒体または半導体メモリによって提供される。また、画像処理プログラムは、搬送波に重畳されたコンピュータデータ信号としてネットワークを介して提供されるものであっても良い。
【0027】
図2は、画像処理部3による処理手順の概略を示すフローチャートである。同図において、まずカメラ2A,2Bによる撮像画像を取得する(手順11)。カメラ2A,2Bによる撮像画像の一例を図3に示す。図3(a)は、ロボットの左眼部に配置されたカメラ2Aによる撮像画像(左画像とする)を示し、図3(b)は、ロボットの右眼部に配置されたカメラ2Bによる撮像画像(右画像とする)を示している。
【0028】
続いて、手順11で取得した左画像及び右画像について、濃度値が一様とみなせる物体毎の領域に分割する(手順12)。例えば図3に示す画像では、枠で囲まれた領域Rが認識対象物体を含む領域となる。
【0029】
また、手順12の領域分割処理と並行して、2次元の左画像及び右画像から3次元画像を復元する(手順13)。この3次元画像の復元は、例えば両眼視差の考え方を利用して、ある点の左画像及び右画像での位置座標とカメラ2A,2B間の距離とから当該点の奥行きを計算することにより行う。
【0030】
続いて、手順12で領域分割された2次元画像と手順13で復元された3次元画像とに基づいて、エッジ検出等により領域R内に存在する物体の輪郭を抽出する(手順14)。例えば図3(a)に示す左画像における物体の輪郭Bは、図4に示すようなものとなる。
【0031】
続いて、手順14で得られた物体の輪郭Bの特徴量を抽出する(手順15)。輪郭Bの特徴量としては、輪郭Bの位置、回転及び大きさに対して不変な不変量を用いる。この不変量としては、図5に示すように、輪郭Bにおける1つの勾配(接線の傾き)Hから他の勾配Hまでの距離d1〜iが挙げられる。例えば図5に示すような角度の勾配度では、不変量の次元数は3次元となる。
【0032】
続いて、手順15で得られた物体の輪郭Bの特徴量を、データ格納部5にデータベースとして記憶されている複数の特徴量データと照合(マッチング)することにより、各特徴量データに対する輪郭Bの特徴量の類似度をそれぞれ算出する(手順16)。
【0033】
特徴量データは、図6に示すように、認識対象物体7を複数の視点(姿勢取得位置)Wから見た時の物体7の姿勢に関するデータである。それらの視点Wは、物体7を取り囲むように想定した仮想球面V上に設定されている。物体7の姿勢の特徴量データは、例えばレンジファインダによって物体7の3次元形状として取得される。
【0034】
このような類似度の算出時には、輪郭Bの特徴量を各特徴量データに対して照合させるための回転成分(後述)が求められる。なお、マッチング手法としては、例えば類似性を精度良く判定できるDP(Dynamic Programming)マッチング等が採用される。
【0035】
続いて、左画像及び右画像のうち、特徴量データに対する輪郭Bの特徴量の類似度が高い方の画像を基準画像として選択する(手順17)。続いて、選択された基準画像における物体の輪郭Bについて、特徴量データに対する輪郭Bの特徴量の最大類似度を算出する(手順18)。この最大類似度算出処理については、後で詳述する。そして、その最大類似度となる特徴量データに対応する輪郭の形状を物体の初期姿勢位置に設定する(手順19)。
【0036】
続いて、まず基準画像のみを用いて、物体の姿勢を粗推定する(手順20)。この単眼姿勢推定処理としては、例えば輪郭BのDT(Distance Transforms)画像を作成し、このDT画像を3次元の輪郭形状データとDTマッチングすることにより行う。続いて、その単眼姿勢推定の妥当性を判断する(手順21)。この妥当性は、例えば手順20の姿勢推定によって得られた輪郭と手順13の3次元復元によって得られた輪郭とを重ね合わせた時の重なり程度から判断する。
【0037】
このとき、姿勢推定が正しいと判定されたときは、引き続き左画像及び右画像の両方を用いて、物体の姿勢を詳細に推定する(手順22)。この複眼姿勢推定処理は、手順20の単眼姿勢推定処理と同様の手法で行う。続いて、その複眼姿勢推定の妥当性を判断する(手順23)。この時の妥当性の判断手法は、手順21と同様である。そして、姿勢推定が正しいと判定されたときは、その推定結果を把持制御処理部6に送出すると共にモニタ部4に表示させる(手順24)。
【0038】
一方、手順21,23において姿勢推定が正しくないと判断されたときは、特徴量データに対する輪郭Bの特徴量の類似度が次に高くなるような他の特徴量データを選択し、その特徴量データに対応する輪郭の形状を新たな物体の初期姿勢位置に設定する(手順25)。そして、上記の手順20〜24を再度実行する。
【0039】
図7は、図2に示す手順18の最大類似度算出処理の詳細を示すフローチャートである。同図において、まず図2に示す手順16で算出された各特徴量データに対する輪郭Bの特徴量(不変量)の類似度を2次元マップとして表示する(手順31)。
【0040】
具体的には、図6に示すように、複数の視点Wを決めるための仮想球面Vについて緯度及び経度を設定する。これらの緯度及び経度は、認識対象物体7の直交する2つの姿勢方向を示す指標となるものである。そして、ここで用いられる2次元マップは、図8に示すように、横軸を経度、縦軸を緯度としたグラフからなるものである。図8では、図6に示す複数の視点Wの位置を2次元的に表している。つまり、図6に示すまばらな3次元上の視点Wを、補間を用いて2次元上の視点として均一化している。このような2次元マップ化を実施することで、計算処理を容易にすることができる。
【0041】
そして、各特徴量データに対する輪郭Bの特徴量の類似度を、図8に示すグラフにおいて特徴量データに対応する視点の位置にそれぞれ展開して、類似度マップを作成する。この類似度マップの一例を図9に示す。図9に示す類似度マップでは、類似度が高くなるほど白くなるように表示される。
【0042】
続いて、類似度マップの各類似度を経度方向に対して累積した経度ヒストグラムを作成すると共に、類似度マップの各類似度を緯度方向に対して類似度を累積した緯度ヒストグラムを作成する(手順32)。図9に示す類似度マップに対しては、図10に示すような経度ヒストグラム及び緯度ヒストグラムが得られる。これらのヒストグラムでは、横軸の階級が経度または緯度、縦軸の度数が類似度総和となっている。
【0043】
続いて、1つの視点に対応する特徴量データに対する輪郭Bの特徴量の回転成分と当該視点に隣接する複数(例えば8箇所)の視点に対応する各特徴量データに対する輪郭Bの特徴量の回転成分との差分を求める(手順33)。この処理は、全ての視点について実施する。
【0044】
そして、各視点について求めた回転成分の差分を、図8に示すグラフにおいて対応する視点の位置にそれぞれ展開して、回転成分差マップを作成する(手順34)。この回転成分差マップの一例を図11に示す。図11に示す回転成分差マップでは、回転成分の差分が大きくなるほど白くなるように表示される。
【0045】
続いて、手順32で作成した経度ヒストグラム及び緯度ヒストグラムについて、予め設定された閾値よりも大きい値をもった類似度総和のピークをそれぞれ抽出し、類似度マップにおいて最大類似度となる可能性のある候補領域を選定する(手順35)。
【0046】
例えば図10に示すものでは、経度ヒストグラムにおいて閾値よりも大きい値をもった類似度総和のピークが2つある。このため、経度ヒストグラムにおいて2つのピークとなる各棒グラフの経度と緯度ヒストグラムにおいてピークとなる棒グラフの緯度とが交差する点に最も近い視点を含むような候補領域S1,S2を決定する。
【0047】
そして、手順35で得られた視点の候補領域が複数存在するかどうかを判断し(手順36)、候補領域が複数存在するときは、複数の候補領域から最適と考えられる1つの候補領域を選択する(手順37)。
【0048】
特徴量データに対する輪郭Bの特徴量の類似度が正常の最大類似度となる場合には、対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の類似度も高くなる傾向にあるが、特徴量データに対する輪郭Bの特徴量の類似度がノイズや外乱等により突発的に高くなる場合には、対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の類似度が低くなることが多い。そこで、ヒストグラムにおける類似度総和のピーク値と、このピークとなる棒グラフに対して経度が近い他の棒グラフの類似度総和とを考慮して、1つの候補領域を選択する。
【0049】
例えば図10に示すものでは、経度ヒストグラムにおいて候補領域S1内の類似度総和のピーク値が候補領域S2内の類似度総和のピーク値よりも高いことに加え、候補領域S1内でピークとなる棒グラフに近い他の棒グラフの類似度総和が比較的高いにも拘わらず、候補領域S2内でピークとなる棒グラフに近い他の棒グラフの類似度総和は下がっている。このため、候補領域S2内に存在する類似度総和のピークは突発的に生じたものと考えられ、候補領域S1が選択される。
【0050】
続いて、手順34で作成した回転成分差マップを用いて、選択された候補領域の妥当性を判断する(手順38)。
【0051】
特徴量データに対する輪郭Bの特徴量の類似度が正常の最大類似度となる場合には、当該特徴量データに対する輪郭Bの特徴量の回転成分と対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の回転成分との差分が小さくなる傾向にある。しかし、特徴量データに対する輪郭Bの特徴量の類似度がノイズや外乱等により突発的に高くなる場合には、当該特徴量データに対する輪郭Bの特徴量の回転成分と対応する視点の位置が近い他の特徴量データに対する輪郭Bの特徴量の回転成分との差分が大きくなることが多い。従って、そのような回転成分の差分から候補領域の妥当性を判断することができる。
【0052】
例えば図11に示す回転成分差マップでは、選択された候補領域S1が比較的黒くなっている。つまり、候補領域S1内では、回転成分の差分が小さくなっている。従って、選択された候補領域S1は正しいと判断される。
【0053】
そして、候補領域が正しく選択されたと判断されると、緯度・経度が当該候補領域内に存在するような視点を抽出し、この視点に対応する特徴量データに対する輪郭Bの特徴量の類似度を最大類似度とする(手順39)。
【0054】
以上において、データ格納部5は、対象物における複数の姿勢の特徴量データを予め記憶する記憶手段を構成する。画像処理部3の手順11〜15(図2参照)は、対象物の撮像画像から対象物の姿勢の特徴量を抽出する特徴量抽出手段(特徴量抽出ステップ)を構成する。画像処理部3の手順16(図2参照)は、記憶手段に記憶された各特徴量データに対する特徴量抽出手段で抽出した特徴量の類似度をそれぞれ求める類似度算出手段(類似度算出ステップ)を構成する。画像処理部3の手順31,32(図7参照)は、類似度算出手段で求めた各類似度を対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成手段(ヒストグラム作成ステップ)を構成する。画像処理部3の手順35〜39(図7参照)及び手順19〜25(図2参照)は、第1ヒストグラムに基づいて、特徴量データに対する抽出した特徴量の最大類似度を求め、対象物の姿勢を推定する推定手段(推定ステップ)を構成する。
【0055】
また、画像処理部3の手順16(図2参照)は、特徴量抽出手段で抽出した特徴量と記憶手段に記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出手段(回転成分算出ステップ)を構成する。画像処理部3の手順33,34(図7参照)は、回転成分算出手段で求めた各回転成分のうち対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出手段(回転差分算出ステップ)を構成する。
【0056】
以上のように本実施形態にあっては、各特徴量データに対する輪郭Bの特徴量の類似度を2次元的に表す類似度マップを作成し、この類似度マップの類似度を経度方向及び緯度方向に対して累積した2つのヒストグラムを作成し、各ヒストグラムに存在するピークを抽出して、最大類似度となる可能性の最も高い1つの候補領域を選定する。また、1つの視点に対応する特徴量データに対する輪郭Bの特徴量の回転成分と当該視点に隣接する複数の視点に対応する各特徴量データに対する輪郭Bの特徴量の回転成分との差分を求め、この回転成分の差分を考慮して、選定した候補領域の妥当性を判断する。そして、その結果に基づいて、特徴量データに対する輪郭Bの特徴量の最大類似度を決定する。
【0057】
従って、ノイズや外乱等により類似度が突発的に高くなった異常値が除外されるため、特徴量データに対する輪郭Bの特徴量の適切な最大類似度を求めることができる。これにより、その後の処理において物体の初期姿勢位置を高精度に設定できるため、結果的に物体の姿勢推定の推定精度を向上させることが可能となる。
【0058】
なお、本発明は、上記実施形態に限定されるものではない。例えば上記実施形態では、輪郭Bの各勾配H間の距離に関するパラメータを物体の特徴量として用いたが、特徴量としては、輪郭Bの位置、回転及び大きさに対して不変な不変量であれば、特にこれには限られず、例えば曲率、色情報、ヒストグラム等を用いても良い。
【0059】
また、上記実施形態は、物体を把持するロボットに適用されるものであるが、本発明の画像処理装置及び画像処理プログラムは、物体を認識して物体の姿勢を推定する他の装置やシステム等にも適用可能である。
【図面の簡単な説明】
【0060】
【図1】本発明に係わる画像処理装置の一実施形態の概略構成を示すブロック図である。
【図2】図1に示す画像処理部による処理手順の概略を示すフローチャートである。
【図3】図1に示す2つのカメラで撮像して得られた左画像及び右画像の一例を示す図である。
【図4】図3(a)に示す左画像から抽出された物体の輪郭を示す図である。
【図5】物体の特徴量として物体の輪郭の不変量を抽出する様子を示す概念図である。
【図6】物体の複数の姿勢に関する特徴量データを取得するための複数の視点を示す概念図である。
【図7】図2に示す最大類似度算出処理の詳細を示すフローチャートである。
【図8】図6に示す複数の視点の位置を2次元的に表した概念図である。
【図9】図7に示す最大類似度算出処理によって得られる類似度マップの一例を示す図である。
【図10】図9に示す類似度マップから作成される経度ヒストグラム及び緯度ヒストグラムの一例を示す図である。
【図11】図7に示す最大類似度算出処理によって得られる回転成分差マップの一例を示す図である。
【符号の説明】
【0061】
1…画像処理装置、2A,2B…カメラ、3…画像処理部(特徴量抽出手段、類似度算出手段、ヒストグラム作成手段、推定手段、回転成分算出手段、回転差分算出手段)、5…データ格納部(記憶手段)。
【特許請求の範囲】
【請求項1】
対象物の撮像画像を用いて前記対象物の姿勢を推定する画像処理装置であって、
前記対象物における複数の姿勢の特徴量データを予め記憶する記憶手段と、
前記対象物の撮像画像から前記対象物の姿勢の特徴量を抽出する特徴量抽出手段と、
前記記憶手段に記憶された各特徴量データに対する前記特徴量抽出手段で抽出した特徴量の類似度をそれぞれ求める類似度算出手段と、
前記類似度算出手段で求めた各類似度を前記対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成手段と、
前記第1ヒストグラムに基づいて、前記特徴量データに対する前記抽出した特徴量の最大類似度を求め、前記対象物の姿勢を推定する推定手段とを備えることを特徴とする画像処理装置。
【請求項2】
前記ヒストグラム作成手段は、前記類似度算出手段で求めた各類似度を前記2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、
前記推定手段は、前記第1ヒストグラム及び前記第2ヒストグラムに基づいて前記最大類似度を求めることを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記推定手段は、前記第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に前記第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から前記最大類似度を求めることを特徴とする請求項2記載の画像処理装置。
【請求項4】
前記特徴量抽出手段で抽出した特徴量と前記記憶手段に記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出手段と、
前記回転成分算出手段で求めた各回転成分のうち前記対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出手段とを更に備え、
前記推定手段は、更に前記回転成分の差分に基づいて前記最大類似度を求めることを特徴とする請求項1〜3のいずれか一項記載の画像処理装置。
【請求項5】
対象物の撮像画像を用いて前記対象物の姿勢を推定する画像処理をコンピュータに実行させる画像処理プログラムであって、
前記対象物の撮像画像から前記対象物の姿勢の特徴量を抽出する特徴量抽出ステップと、
予めメモリに記憶されている前記対象物における複数の姿勢の特徴量データに対する前記特徴量抽出ステップで抽出した特徴量の類似度をそれぞれ求める類似度算出ステップと、
前記類似度算出ステップで求めた各類似度を前記対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成ステップと、
前記第1ヒストグラムに基づいて、前記特徴量データに対する前記抽出した特徴量の最大類似度を求め、前記対象物の姿勢を推定する推定ステップとを前記コンピュータに実行させることを特徴とする画像処理プログラム。
【請求項6】
前記ヒストグラム作成ステップでは、前記類似度算出ステップで求めた各類似度を前記2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、
前記推定ステップでは、前記第1ヒストグラム及び前記第2ヒストグラムに基づいて前記最大類似度を求めることを特徴とする請求項5記載の画像処理プログラム。
【請求項7】
前記推定ステップでは、前記第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に前記第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から前記最大類似度を求めることを特徴とする請求項6記載の画像処理プログラム。
【請求項8】
前記特徴量抽出ステップで抽出した特徴量と前記メモリに記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出ステップと、
前記回転成分算出ステップで求めた各回転成分のうち前記対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出ステップとを更に前記コンピュータに実行させ、
前記推定ステップでは、更に前記回転成分の差分に基づいて前記最大類似度を求めることを特徴とする請求項5〜7のいずれか一項記載の画像処理プログラム。
【請求項1】
対象物の撮像画像を用いて前記対象物の姿勢を推定する画像処理装置であって、
前記対象物における複数の姿勢の特徴量データを予め記憶する記憶手段と、
前記対象物の撮像画像から前記対象物の姿勢の特徴量を抽出する特徴量抽出手段と、
前記記憶手段に記憶された各特徴量データに対する前記特徴量抽出手段で抽出した特徴量の類似度をそれぞれ求める類似度算出手段と、
前記類似度算出手段で求めた各類似度を前記対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成手段と、
前記第1ヒストグラムに基づいて、前記特徴量データに対する前記抽出した特徴量の最大類似度を求め、前記対象物の姿勢を推定する推定手段とを備えることを特徴とする画像処理装置。
【請求項2】
前記ヒストグラム作成手段は、前記類似度算出手段で求めた各類似度を前記2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、
前記推定手段は、前記第1ヒストグラム及び前記第2ヒストグラムに基づいて前記最大類似度を求めることを特徴とする請求項1記載の画像処理装置。
【請求項3】
前記推定手段は、前記第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に前記第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から前記最大類似度を求めることを特徴とする請求項2記載の画像処理装置。
【請求項4】
前記特徴量抽出手段で抽出した特徴量と前記記憶手段に記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出手段と、
前記回転成分算出手段で求めた各回転成分のうち前記対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出手段とを更に備え、
前記推定手段は、更に前記回転成分の差分に基づいて前記最大類似度を求めることを特徴とする請求項1〜3のいずれか一項記載の画像処理装置。
【請求項5】
対象物の撮像画像を用いて前記対象物の姿勢を推定する画像処理をコンピュータに実行させる画像処理プログラムであって、
前記対象物の撮像画像から前記対象物の姿勢の特徴量を抽出する特徴量抽出ステップと、
予めメモリに記憶されている前記対象物における複数の姿勢の特徴量データに対する前記特徴量抽出ステップで抽出した特徴量の類似度をそれぞれ求める類似度算出ステップと、
前記類似度算出ステップで求めた各類似度を前記対象物の直交する2つの姿勢方向のうち何れか一方の姿勢方向に対して累積した第1ヒストグラムを作成するヒストグラム作成ステップと、
前記第1ヒストグラムに基づいて、前記特徴量データに対する前記抽出した特徴量の最大類似度を求め、前記対象物の姿勢を推定する推定ステップとを前記コンピュータに実行させることを特徴とする画像処理プログラム。
【請求項6】
前記ヒストグラム作成ステップでは、前記類似度算出ステップで求めた各類似度を前記2つの姿勢方向の他方の姿勢方向に対して累積した第2ヒストグラムを更に作成し、
前記推定ステップでは、前記第1ヒストグラム及び前記第2ヒストグラムに基づいて前記最大類似度を求めることを特徴とする請求項5記載の画像処理プログラム。
【請求項7】
前記推定ステップでは、前記第1ヒストグラムにおける類似度総和のピーク値が第1所定値以上であると共に前記第2ヒストグラムにおける類似度総和のピーク値が第2所定値以上となるような候補領域を選定し、当該候補領域から前記最大類似度を求めることを特徴とする請求項6記載の画像処理プログラム。
【請求項8】
前記特徴量抽出ステップで抽出した特徴量と前記メモリに記憶された各特徴量データとを照合させる時の回転成分をそれぞれ求める回転成分算出ステップと、
前記回転成分算出ステップで求めた各回転成分のうち前記対象物の姿勢取得位置が互いに隣り合う複数の特徴量データに対する回転成分の差分をそれぞれ求める回転差分算出ステップとを更に前記コンピュータに実行させ、
前記推定ステップでは、更に前記回転成分の差分に基づいて前記最大類似度を求めることを特徴とする請求項5〜7のいずれか一項記載の画像処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2008−3798(P2008−3798A)
【公開日】平成20年1月10日(2008.1.10)
【国際特許分類】
【出願番号】特願2006−171736(P2006−171736)
【出願日】平成18年6月21日(2006.6.21)
【出願人】(000003207)トヨタ自動車株式会社 (59,920)
【Fターム(参考)】
【公開日】平成20年1月10日(2008.1.10)
【国際特許分類】
【出願日】平成18年6月21日(2006.6.21)
【出願人】(000003207)トヨタ自動車株式会社 (59,920)
【Fターム(参考)】
[ Back to top ]