説明

位置推定装置、位置推定方法及びプログラム

【課題】現在の位置が既に登録済みの場所であるか、未登録の場所であるかを認識することができる位置推定装置、位置推定方法及びプログラムを提供する。
【解決手段】位置推定装置1は、入力画像から局所特徴量を抽出する特徴量抽出部11と、各登録場所と局所特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング部13と、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出部15と、類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する登録場所認定部17とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ロボット装置などに好適に使用され得る位置推定装置、位置推定方法及びプログラムに関し、特に局所特徴量を使用して位置推定する位置推定装置、位置推定方法及びプログラム関する。
【背景技術】
【0002】
自己位置の推定・特定は、人間や機械にとっては必須の能力である。今自分はどこにいるかということを知ることは、ロボットやコンピュータビジョンにとっては、常に重要である。特に、可動式のロボットにとって、今自分がどこにいるかを把握することは、ナビゲーションシステムのための基本的要求となっている。
【0003】
従来、特許文献1に記載の位置検出装置がある。この位置検出装置では、移動体の前方視野の輝度画像を取得する輝度画像取得手段と、輝度画像取得手段と同一の視野を有し、輝度画像取得手段が輝度画像を取得するのと同時に距離画像を取得する距離画像取得手段と、少なくとも連続する2フレームの輝度画像からそれぞれ特徴点を抽出する特徴点抽出手段と、特徴点抽出手段によって抽出された特徴点の2フレーム間の位置の変位量を距離画像に基づいて算出し、当該変位量から自己位置を算出するための基準特徴点を選択する基準特徴点選択手段とを備えている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2002−048513号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、現在画像を撮影した場所が、ロボットが以前も訪れた場所であるか、又は全く知らない場所であるかを識別することは大変難しい。特徴量の抽出の仕方によっては、全く知らない場所をある場所に関連づけてしまうことがある。したがって、現在の位置がデータベースに登録済みの場所であるか、新しい場所であるかを切り分ける能力は大変重要である。また、当該撮影した場所が新しい場所であることが認識できれば、DBを拡大していく、すなわち、地図を学習していくことが可能になる。このような、移動体、特にロボット装置に好適に搭載される位置推定装置の開発が望まれている。
【0006】
本発明は、このような問題点を解決するためになされたものであり、現在の位置が既に登録済みの場所であるか、未登録の場所であるかを認識することができる位置推定装置、位置推定方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る位置推定装置は、入力画像から局所特徴量を抽出する特徴量抽出手段と、各登録場所と局所特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング手段と、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出手段と、前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する認定手段とを有するものである。
【0008】
本発明においては、マッチングを取った後、近傍の登録場所を含めて類似度を算出することで、よりノイズに強く、正確に入力画像がデータベースに登録された登録画像であるか否かを推定することができる。
【0009】
また、前記データベースは、前記各登録場所の局所特徴量を使用して作成された、いずれの登録場所にも属さない非登録場所及びその特徴量を有することができる。これにより、新規の場所の特定率を向上する。
【0010】
更に、前記非登録場所は、各登録場所の局所特徴量の一部又は全部が対応付けられているものとすることができる。
【0011】
更にまた、前記入力画像が、前記非登録場所と最もマッチングする場合、当該入力画像とその特徴量を新しい登録場所としてデータベースに登録することができる。これにより、データベースを更新することができる。
【0012】
また、マッチングスコアは、前記データベースに含まれる登録場所の数及び当該登録場所のうち、入力画素とマッチングした登録場所の数に基づき算出されることができる。
【0013】
更に、マッチングスコアをs、前記データベースに含まれる登録場所の数をn、当該登録場所のうち、入力画素とマッチングした登録場所の数をnwk=M、0<j<n、j≠i、mは、入力画像Mと現在のモデルMとの間でマッチした局所特徴量の数、k、i、j、tは整数としたとき、下記により前記マッチングスコアsを求めることができる。これにより、多くの登録モデルに存在する特徴量とマッチングした場合はスコアを低く、少数、例えばたった1つの登録モデルに存在する特徴量とマッチングした場合は、スコアを高く設定することができる。iは、データベースの中に登録されたインデックスを示す。
【0014】
【数1】

【0015】
更にまた、前記類似度算出手段は、マッチングスコアと、ガウス分布から得られる遷移確率とに基づき類似度スコアを算出定することができる。類似スコアにより、更に位置特定率を向上することができる。
【0016】
また、前記類似度スコアをβ、ガウシアンシグマ=2としたとき、iからkの距離を示す前記遷移確率をp(i,k)、考慮する隣接登録画像に関する値をω、i、kを整数とすると、下記により、前記類似度スコアβを求めることができる。類似度スコアにより、マッチングした登録画像の近傍場所のデータも考慮されることができる。
【0017】
【数2】

【0018】
更に、前記類似度算出手段は、前記類似度スコアを正規化した正規化スコアを算出することができる。類似度スコアは、最もマッチする登録モデルと、これに類似する登録モデルがある場合、特徴量の多くが共通となるため、類似度スコアが当該類似する登録モデルとの方が高くなる場合があり得るため、正規化することが好ましい。
【0019】
更にまた、前記認定手段は、前記類似度スコアから前記類似度スコアの標準偏差と平均値の和を引いた値が所定の閾値以上である場合、前記入力画像を前記登録場所であると認定することができる。正規化により、より確実に入力画像の位置を特定することができる。
【0020】
また、前記認定手段の認定結果を補正する補正手段を更に有し、前記補正手段は、前記類似度スコアを正規化した正規化スコアに基づき当該認定結果を補正した補正スコアを算出することができる。補正することで、更に場所の特定率を向上することができる。
【0021】
更に、前記類似度スコアをβi、前記類似度スコアの標準偏差及び平均をそれぞれσ及びμ、T=σ+μ、iは整数としたとき、前記正規化スコアCは、下記の式により求めることができる。
【0022】
【数3】

【0023】
更にまた、前記補正手段は、ω+1≦i≦nt−(ω+1)とし、ガウシアンシグマ=2としたとき、iからkの距離を示す前記遷移確率をp(i,k)、考慮する隣接登録画像に関する値をω、i、kを整数とすると、前記補正スコアCは、下記により求めることができる。補正することで、更に場所の特定率を向上することができる。
【0024】
【数4】

【0025】
また、前記特徴量抽出手段は、前記入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出手段と、前記局所特徴量抽出手段により抽出された前記局所特徴量について、前記連続する入力画像間でマッチングをとる特徴量マッチング手段と、前記特徴量マッチング手段により所定数連続する画像間でマッチングが取れた局所特徴量を連続特徴量として選択する連続特徴量選択手段と、各前記連続特徴量の平均を不変特徴量として求める不変特徴量算出手段とを有するものとすることができる。これにより、連続して撮影された画像を使用し、連続する2枚の画像間で特徴量のマッチングをとり、さらにマッチングを取った特徴量が連続して出現するもののみを抽出し、その平均の局所特徴量を求めることで、撮影位置の変化にロバストな特徴を抽出することができ、それを使用して位置を推定するため、正確に位置を特定することが可能となる。連続画像とは、ビデオ画像から取得される連続的に撮影された複数枚の画像セットである。
【0026】
更に、前記局所特徴量は、SIFT(Scale Invariant Feature Transformation)及び/又はSURF(Speed Up Robustness Features)の特徴量とすることができる。また、これらSIFTやSURFに限らず、スケール、回転の変動、又はノイズ等に対してロバストな他の局所特徴量を用いることも可能である。これにより、これら既存の局所特徴量を用いることで、これらの特徴量が有する性能もそのまま引き継がれ、照明変化等にも頑健な特徴として抽出・記述することが可能となる。
【0027】
本発明に係る位置推定方法は、入力画像から局所特徴量を抽出する特徴量抽出工程と、各登録場所と局所特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング工程と、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出工程と、前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する認定工程とを有するものである。
【0028】
また、本発明に係るプログラムは、上述した位置推定処理をコンピュータに実行させるものである。
【発明の効果】
【0029】
本発明によれば、現在の位置が既に登録済みの場所であるか、未登録の場所であるかを認識することができる位置推定装置、位置推定方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0030】
【図1】本発明の実施の形態にかかる位置推定装置を示す図である。
【図2】本発明の実施の形態にかかる位置推定装置を示すフローチャートである。
【図3】正規化前後の類似度スコア及び正規化スコアを示す図である。
【図4】補正前後のマッチングスコアを示す図である。
【図5】本発明の実施の形態にかかる位置推定装置の特徴量抽出部を示す図である。
【図6】本発明の実施の形態にかかる特徴量PIRFを抽出する方法を説明する図である。
【図7】不変特徴量抽出方法を示すフローチャートである。
【図8】本発明の実施の形態にかかる位置推定装置の推定結果を示すものである。
【図9】同じく、本発明の実施の形態にかかる位置推定装置の推定結果を示すものである。
【図10】同じく、本発明の実施の形態にかかる位置推定装置の推定結果を示すものである。
【図11】同じく、本発明の実施の形態にかかる位置推定装置の推定結果を示すものである。
【発明を実施するための形態】
【0031】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、移動型のロボット装置などに搭載される、位置を推定する位置推定装置に適用したものである。
【0032】
図1は、本実施の形態にかかる位置推定装置を示す図である。図1に示すように、位置推定装置は、特徴量抽出部11、マッチング部13、類似度算出部15、登録場所認定部17、登録場所補正部21及びデータベース19を有する。
【0033】
特徴量抽出部11は、入力画像から局所特徴量を抽出する。局所特徴量としては、SIFT(Scale Invariant Feature Transformation)及び/又はSURF(Speed Up Robustness Features)、又は後述するPIRF(Position-Invariant Robust Features)等を使用することができる。
【0034】
マッチング部13は、各登録場所と局所特徴量が対応づけられて保存されているデータベース19を参照し、入力画像と登録場所とのマッチングを求める。データベース19は、各登録場所毎にその識別情報と、当該登録場所の特徴量の値を対応付けたモデルテーブル193を登録場所の個数だけ有する。例えば、モデルテーブルは、600(M〜M600)、特徴量の個数は100(p1_1〜p1_100)等とすることができる。
【0035】
また、データベース19は、各登録場所の局所特徴量を使用して作成された、いずれの登録場所にも属さない非登録場所M及びその特徴量を有する。ここでは、当該テーブルをモデルテーブル191という。非登録場所Mは、各登録場所の局所特徴量の一部又は全部が対応付けられたものであり、例えば各登録場所の局所特徴量のうち、ランダムに抽出した10%の特徴量からなるもの等とすることができる。
【0036】
マッチング部13は、入力画像が、非登録場所Mと最もマッチングする場合、当該入力画像とその特徴量を新しい登録場所としてデータベース19に登録する。このマッチング部13においては、マッチングスコアは、データベース19に含まれる登録場所の数及び当該登録場所のうち、入力画像とマッチングした登録場所の数に基づき算出される。ここで、マッチングスコアをs、データベースに含まれる登録場所の数をn、当該登録場所のうち、入力画素とマッチングした登録場所の数をnwk=M、0<j<n、j≠i、mは、入力画像Mと現在のモデルMとの間でマッチした局所特徴量の数、k、i、j、tは整数としたとき、下記式(1)によりマッチングスコアsを求めることができる。
【0037】
【数5】

【0038】
類似度算出部15は、マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を判定する。この類似度算出部15は、マッチングスコアと、ガウス分布から得られる遷移確率とに基づき類似度スコアを算出する。ここで、類似度スコアをβ、ガウシアンシグマ=2としたとき、iからkの距離を示す遷移確率をp(i,k)、考慮する隣接登録画像の数をω、i、kを整数とすると、下記式(2)により、類似度スコアβを求めることができる。
【0039】
【数6】

【0040】
ここで、類似度算出部15は、類似度スコアβを正規化する。正規化することにより、よりノイズにロバストなスコアを取得することができる。本実施の形態においては、類似度スコアをβ、類似度スコアの標準偏差及び平均をそれぞれσ及びμ、T=σ+μ、iは整数としたとき、正規化スコアCは、下記の式(3)により求めることができる。
【0041】
【数7】

【0042】
登録場所認定部17は、類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する。具体的には、類似度算出部15は、類似度スコアから類似度スコアの標準偏差σと平均値μとの和Tを引いた値が所定の閾値τ2より大きい場合、入力画像を前記登録場所であると判定する。
【0043】
登録場所補正部21は、登録場所認定部17の認定結果を補正する。具体的には、登録場所補正部21は、類似度スコアを正規化した正規化スコアを補正する。
【0044】
ω+1≦i≦nt−(ω+1)とし、ガウシアンシグマ=2としたとき、iからkの距離を示す遷移確率をp(i,k)、考慮する隣接登録画像の数をω、i、kを整数とすると、補正スコアCは、下記式(4)により求まる。補正結果に応じて、入力画像がいずれの登録画像に一致するかを補正して求めることができる。
【0045】
【数8】

【0046】
次に、本実施の形態にかかる位置推定方法について説明する。図2は、本実施の形態にかかる位置推定装置を示すフローチャートである。図2に示すように、特徴量抽出部11は、先ず入力画像を取得する。特徴量抽出部11が特徴量として後述するPIRFを使用する場合には、この入力画像として、連続画像が入力される(ステップS1)。そして、類似度算出部15は、特徴量を抽出する(ステップS2)。特徴量抽出部11は、入力画像から抽出した複数の局所特徴量と入力画像が表わす場所(以下、入力場所という。)とを対応づけたモデルMを生成する(ステップS3)。
【0047】
次に、マッチング部13は、データベース19を参照してマッチングスコアSを算出する。先ず、現在のモデル(入力画像モデル)Mと、データベース19に登録してある全てのモデルとでマッチングを行う。各モデルにおける各特徴量が所定の閾値以上でマッチングが取れている場合は、マッチングしているものとしてとり扱う。
【0048】
上述したように、データベース19は、モデルMのモデルテーブル191を有している。これは、各モデルが有する全部又は一部の特徴量をそれぞれ有しているもので、場所が特定できないものである。このモデルMは、例えば他のモデルの3乃至4倍の特徴量を有する。もし入力モデルがこのモデルMと最もマッチングが取れている場合は、入力モデルは新しいモデルとみなされ(ステップS5:Yes)、当該入力モデルMを新規の場所としてデータベース19に追加する(ステップS13,12)。ここで、モデルテーブル191に登録してある特徴量の例えばランダムに5つ抽出して破棄し、新規に登録する入力モデルMの特徴量からランダムに5つ抽出して、モデルMの特徴量の更新を行うことができる。又は、例えば新規の登録場所が例えば300枚追加になった時点でモデルMの特徴量を全部破棄し、データベースにある各モデルからランダムに例えば3つの特徴量を抽出し、これを合わせてモデルMの特徴量とすることも可能である。
【0049】
次に、入力モデルMが非登録場所モデルMに類似しない場合について説明する。入力モデルMと各モデルの特徴量を比較するが、例えば、東京タワーのような、広範囲の場所から認識できるような特徴量は、その場所固有の特徴量としては、精度の低いものとなる。すなわち、入力モデルのある特徴量のうち、データベース19の600の登録モデルのうちの例えば10%と一致してしまうような特徴量は、識別力が低いものと言える。一方で、入力モデルのある特徴量が、ある登録モデル1つの特徴量と一致する場合、その特徴量は識別能力が高いと見なすことができる。
【0050】
これらを考慮して、各特徴量についてマッチングを取りつつ、識別力の高い特徴量のマッチングには高いスコアを、識別力の弱い特徴量のマッチングには低いスコアを付与する。このため、本実施の形態においては、下記式(1)を使用する。この式(1)に示すように、入力画素とマッチングした登録場所の数をnwkが多いほどスコアSが小さくなることがわかる。
【0051】
【数9】

【0052】
次に、このスコアSの最大値が所定の閾値τより大きいか否かを判定する(ステップS6)。ここで、スコアSの最大値がMではなかったとしても、所定の閾値τより小さい場合は、入力画像モデルは登録モデルとマッチングしていないと判断し、ステップS13に進み、当該入力画像モデルMを新規の場所として登録する(ステップS12)。所定の閾値τは例えば、3等とすることができる。
【0053】
ここで、このスコアSは、非常にセンシティブでありノイズに敏感である。そこで、このスコアSから、隣接する登録モデルのデータを使用して別のスコアを求める。このスコアを、本明細書においては、類似度スコアβという。上述したように、類似度スコアβは、式(2)により求まる(ステップS7)。
【0054】
【数10】

【0055】
次に、この類似度スコアを正規化する。いくつの特徴量がマッチすればよいかを予測することは困難である。したがって、例えば隣接する登録モデルとの間でよい類似度スコアが得られていたとしても、最もマッチする登録モデルと、これに類似する登録モデルがある場合、特徴量の多くが共通となるため、類似度スコアが当該類似する登録モデルとの方が高くなる場合があり得る。したがって、類似度スコアは正規化されなければならない。本実施の形態においては、上述のように正規化スコアは、式(3)により求める。
【0056】
【数11】

【0057】
図3は、正規化前後の類似度スコア及び正規化スコアを示す図である。図3(a)に示すように、15個の類似度スコアを正規化に使用する。ここで、lを、考慮する隣接登録モデルの個数とし、l=7として、15個の類似度スコアを使用する例を示している。標準偏差σ及びその平均μの合計をTで示す。lは、値Tを算出する際の制限として利用する。これは、登録モデル全体において、Tは非常に幅のある数であるためである。なお、lの値は、結果に大きな影響を及ぼすものではないが、Tを毎回計算するにあたり、同じスケールに確定するために使用するものである。正規化スコアを図3(b)に示す。なお、正規化はスコアのトレンドをきれいな正規分布の形になるように修正する。
【0058】
そして、類似度スコアβ−Tが所定の閾値τ2より大きいか判定する(ステップS8)。ここで、β−Tが閾値τ2より小さかった場合は、ステップS11に進み、当該入力画像モデルは、登録場所とマッチングしないと判断し、ステップS12に進み、当該入力画像モデルを新たな登録場所モデルとして登録する。以上により、入力画像を登録画像のいずれかに一致するものと判断してもよいが、本実施の形態においては、更に、ここで求められた登録場所を更に補正する。
【0059】
図4は、補正前後のマッチングスコアを示す図である。図4(a)は、最大スコアC,j=87を示す。ここで、マッチングスコアは、左右対称であることが好ましいため、これを上述した式(4)で補正し補正スコアCを求める。
【0060】
【数12】

【0061】
これにより、図4(b)に示すように、C,j=87に補正される。なお、このように入力画像は、登録画像モデルM87に一致すると判定した場合、入力画像モデルはそのまま破棄することも可能であるが、登録画像モデルM87を更新することも可能である。例えば、いくつかの特徴量を入れ替えたり、平均してもよい。
【0062】
次に、特徴量抽出部について詳細に説明する。上述したように、特徴量としては、局所特徴量であれば、どのようなものでも使用可能であるが、本願発明者等が先に出願しているPIRFを使用することで、位置推定確率を向上させることができる。
【0063】
図5は、本発明の実施の形態にかかる位置推定装置の特徴量抽出部を示す図である。本実施の形態における特徴量抽出部は、連続して撮影された連続画像からなる入力画像から不変特徴量を抽出する。
【0064】
特徴量抽出部11は、入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出部111と、局所特徴量抽出部111により抽出された局所特徴量について、連続する入力画像間でマッチングをとる特徴量マッチング部113と、特徴量マッチング部113により所定数連続する画像間でマッチングが取れた特徴量を連続特徴量として選択する連続特徴量選択部115と、各連続特徴量の平均を不変特徴量として求める不変特徴量算出部117とを有する。
【0065】
以下の説明においては、不変特徴量算出部117が抽出する不変特徴量のことを、特徴量PIRF(Position-Invariant Robust Features)という。特徴量抽出部11は、撮影位置の変化に影響を受けにくい(局所)特徴量として特徴量PIRFを抽出する。
【0066】
これは、本願発明者が位置の変化にロバストな特徴量を抽出すべく鋭意実験研究した結果、近くの対象については撮影位置や撮影時間帯の変化による見え方の差(特徴量変化)が大きいが、遠くの対象については変化が小さい(ランドマークの特徴量はあまり変化しない)ことを知見し、その結果本特徴量PIRFを抽出する方法を見出したものである。
【0067】
本実施の形態にかかる特徴量抽出部11は、簡単には、連続画像間で局所特徴のマッチングを行い、予め定めた枚数間で、連続してマッチングのとれている特徴を選択し、選択された特徴において、それとマッチングのとれている全特徴の平均を特徴量PIRFとして抽出・記述するものである。
【0068】
この特徴量抽出部11により撮影位置の変化に頑健な局所特徴のみを抽出・記述することができる。また、記述子としては、局所特徴であれば様々なものが適用可能であり、上述のように既存の局所特徴量を用いることで、既存の特徴量が持つ性能もそのまま引き継がれ、照明変化等にも頑健な特徴として抽出・記述することが可能となる
【0069】
以下、各ブロックについて詳細に説明する。図6は、本実施の形態にかかる特徴量PIRFを抽出する方法を説明する図である。局所特徴量抽出部111には、連続して撮影された連続画像が入力画像として入力される。ここで、PIRFで要求される連続画像とは、ある画像セットであって、一定のフレームで、例えば1秒毎に2フレームなど、毎秒毎に連続的に撮影されたビデオ画像をいう。すなわち、ビデオからキャプチャされた画像は一般的に連続的であり、PIRFにおける連続画像は、ビデオ画像を使用したものでなければならない。画像の取得率は、カメラの速度に応じて設定される。たとえば、カメラが車に搭載されていた場合、カメラの速度は1分間に約1000m/分であり、ビデオからキャプチャされる連続画像はおよそ50乃至100フレーム/秒となる。
【0070】
本実施の形態においては、入力画像として全方位画像を用い、連続する画像は、1つのプレイス(place)を撮影したものを使用する。後述するように、このプレイスとは、例えば交差点から交差点までのある領域とする。当該プレイスは、いくつかの連続画像からなる複数のサブプレイスに分割される。すなわち、1つのプレイスは、複数のサブプレイスから構成される。このサブプレイス毎に1又は複数の不変特徴量を抽出する。この不変特徴量の集合をサブプレイスPIRF辞書(PIRF-dictionary)という。1つのプレイスから抽出された全不変特徴量の集合、すなわち、上記サブプレイスPIRF辞書の集合によりPIRF辞書が構成される。1つのプレイスには1つのPIRF辞書が対応する。このサブプレイスPIRF辞書及びPIRF辞書が抽出されたプレイスの識別情報が、PIRF辞書と共に上述のエリアデータベース11に格納される。
【0071】
先ず、局所特徴量抽出部111は、既存の局所特徴量抽出方法を使用して局所特徴量を抽出する。局所特徴量抽出部111は、例えば、SIFT(Scale Invariant Feature Transformation)、又はSURF(Speed Up Robustness Features)の特徴量を使用することができる。または、これらSIFTやSURFに限らず、他の局所特徴量を使用することができることは勿論である。特に、スケール、回転の変動、又はノイズ等に対してロバストな他の局所特徴量を用いることが好ましい。これらの局所特徴量を用いることで、既存の特徴量が有する性能もそのまま引き継がれ、照明変化等にも頑健な特徴として抽出・記述することが可能となる。ここで、i番目のエリアにおける全方位画像の数をnとし、その中でj番目の画像から抽出された局所特徴量の集合をUとする。ここでは、局所特徴量はu→で表す。
【0072】
次に、特徴量マッチング部113が、連続する2枚の画像間全てについて局所特徴量u→を構成する各特徴量のマッチングを行う。すなわち、j=q番目の画像の全局所特徴量について、j=q+1番目の画像の全局所特徴量に対してマッチングを行う。ここでは、それぞれマッチングのとれた特徴へのインデックスをマッチング結果ベクトルm→として求める。
【0073】
ここで、マッチング方法の一例について、SIFTを例にとって説明する。画像Iから抽出される特徴をvとする。この特徴vが次の画像Ia+1の特徴v'とマッチングするか否かを判定する。先ず、特徴vと画像Ia+1から抽出した全ての特徴との間のドット積(dot product)を求める。そして、最も類似する特徴vfirstと、2番目に類似する特徴vsecondを求めるために、この結果をソートする。もし、
(vfirst・v)/(vsecond・v)>θ
が成立する場合、マッチングのとれた特徴v'=vfirstと判定する。ここで、閾値θはたとえば0.6とすることができる。上記が成立しない場合は、画像Iにおける特徴vにマッチングする特徴は、画像Ia+1には存在しないと判定する。
【0074】
図6に示すように、各入力画像から6つの局所特徴量が抽出された場合について説明する。これら6つの局所特徴量間でマッチングを取り、マッチングが取れた場合にのみ、マッチングが取れた特徴量へのインデックスを付す。例えば、m→の1番目の局所特徴量は、m→の3番目の局所特徴量とマッチングがとれていることを示し、m→の3番目の特徴量は、m→の6番目の特徴量とマッチングが取れていることを示す。
【0075】
次に、連続特徴量選択部115が連続特徴量を選択する。先ず、いくつのm→を使用して連続特徴量を求めるかを決定する。このm→の数を、本明細書においては、ウィンドウサイズwともいう。また、このウィンドウサイズwに含まれるm→の集合を、サブプレイスという。ここで、ウィンドウサイズwが大きいほどより頑健な、識別力の高い連続特徴量のみを抽出できるが、大きすぎると特徴数が極端に少なくなってしまう。また、小さすぎると、頑健ではない、識別力のないような特徴量も抽出してしまうので、目的等に応じて最適な大きさとする必要がある。
【0076】
本実施の形態においては、ウィンドウサイズwを3とする。したがって、連続する4枚の入力画像を使用して連続特徴量を求める。すなわち、図6に示すように、1番目のサブプレイスには、m→、m→、m→が含まれ、入力画像I、I、I、Iが対応する。なお、インデックスの数が0の場合は、次にマッチングする特徴量がないことを示す。よって、図6の場合、1番目のサブプレイスには、3つの連続特徴量が含まれることになる。
【0077】
連続特徴量選択部115は、ウィンドウサイズwを設定したらこのウィンドウwをひとつずつずらしながら、そのウィンドウサイズに含まれる全方位画像4枚内で共通して出現する特徴を連続特徴量として抽出する。ウィンドウサイズwを設定したら、連続特徴量を抽出するために用いる関数を以下のように定義する。ただし、bは注目するインデックスベクトルの番号とする。
【数13】

そして、全てのマッチング結果ベクトルm→について、f(mx,y)を計算し、f(mx,y)>0となるときの局所特徴量ux,y→のみを抽出する。入力画像の数がn、ウィンドウサイズがwのとき、サブプレイスの数は、n−w+1となる。
【0078】
不変特徴量算出部117は、同一ウィンドウグループであるサブプレイス内においてマッチングがとれた局所特徴量の平均を求める。これらの平均値からなるベクトルによりPIFR辞書が構成される。全サブプレイス(n−w+1)個から抽出された(n−w+1)個のサブプレイスPIFR辞書(D,j≦n−w+1)をPIRF辞書(D)に登録する。このPIFR辞書を構成する、マッチングがとれた局所特徴量の平均各がPIRFである。
【0079】
次に、特徴量抽出部の不変特徴量PIFRの抽出方法について説明する。図7は、不変特徴量抽出方法を示すフローチャートである。先ず、i=1、j=1に初期化する(ステップS21)。ここで、nは、プレイスAに属する画像の枚数であり、wは、PIRFを抽出するウィンドウサイズである。
【0080】
次に、エリアAの画像Iを入力する(ステップS22)。そして、iがウィンドウサイズwより大きいか否かを判定する(ステップS23)。iがウィンドウサイズw以下である場合は、iをインクリメントし(ステップS30)、ステップS2に戻る。
【0081】
一方、ウィンドウサイズwより大きい場合は、画像Iと画像Ii−1の間でマッチングを取る(ステップS24)。そして、w+1枚の連続する入力画像(Ii−w,…,I)から安定している局所特徴量(SIFT)を抽出する(ステップS25)。ここで、本実施の形態においては、ウィンドウサイズwを3に設定している。ウィンドウサイズwは、何枚の連続画像からPIRFを抽出するかを示す。たとえば、ウィンドウサイズwを3に設定した場合、PIRFは4つの連続画像に連続して現れる特徴があるときにのみ得られる。従って、あるプレイスAの画像イメージが4枚より少ない場合、3つの2画像間で一致する特徴を見つけるのに十分ではない。よって、画像が少なくとも4枚であるとき、プレイスAからのPIRFの抽出をスタートすることができる。例えば、現在の画像がIであるとき、PIRFは、4枚の連続画像I、I、I、Iから求めることができる。
【0082】
次に、抽出した安定した局所特徴量の平均をPIRFとして算出する(ステップS26)。次いで、エリアAに含まれるPIRFを収集し、PIRF辞書Dに登録する(ステップS27)。そして、i=nであるか否かが判断され(ステップS28)、i=nであれば、i=1、j=j+1とし、ステップS2からの処理を繰り返す(ステップS29)。i=nではない場合は、ステップS10に進み、iをインクリメントして、ステップS2に戻る。
【0083】
次に、本実施の形態の効果について説明する。図8乃至図11は、本実施の形態にかかる位置推定装置の推定結果を示すものである。図8乃至図11は、それぞれ、New College、City Center、Suzukakedai、混合モデルの位置推定結果を示す。図8に示すように、スケールを0.25としたものでさえも、他の位置推定方法であるFAB−MAPよりよい精度を示していることがわかる。その他の結果についても、FAB−MAPより極めて精度よく場所を特定できていることがわかる。
【0084】
以上説明したように、本実施の形態においては、入力画像と登録画像のマッチングを取った後、登録場所の近傍の登録場所を含めて類似度を算出し、それを正規化して、入力画像がいずれの登録場所に一致するかを判定するため、極めて正確に、入力画像が既にデータベースに登録された登録場所であるか、初めて認識した画像であるかの切り分けを行うことができる。また、登録画像を一致しない入力画像は、そのままデータデータベースに登録することで、自律型の移ロボット装置等に搭載すれば、自己の位置を探索し、位置データベースを自身で拡大させることも可能である。
【0085】
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
【0086】
例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【符号の説明】
【0087】
11 特徴量抽出部
13 マッチング部
15 類似度算出部
17 登録場所認定部
19 データベース
21 登録場所補正部
193 モデルテーブル
191 モデルテーブル
111 局所特徴量抽出部
113 特徴量マッチング部
115 連続特徴量選択部
117 不変特徴量算出部

【特許請求の範囲】
【請求項1】
入力画像から局所特徴量を抽出する特徴量抽出手段と、
各登録場所と局所特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング手段と、
マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出手段と、
前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する認定手段とを有する位置推定装置。
【請求項2】
前記データベースは、前記各登録場所の局所特徴量を使用して作成された、いずれの登録場所にも属さない非登録場所及びその特徴量を有する、請求項1記載の位置推定装置。
【請求項3】
前記非登録場所は、各登録場所の局所特徴量の一部又は全部が対応付けられている、請求項2記載の位置推定装置。
【請求項4】
前記入力画像が、前記非登録場所と最もマッチングする場合、当該入力画像とその特徴量を新しい登録場所としてデータベースに登録する、請求項1乃至3のいずれか1項記載の位置推定装置。
【請求項5】
マッチングスコアは、前記データベースに含まれる登録場所の数及び当該登録場所のうち、入力画素とマッチングした登録場所の数に基づき算出される、請求項1乃至4のいずれか1項記載の位置推定装置。
【請求項6】
マッチングスコアをs、前記データベースに含まれる登録場所の数をn、当該登録場所のうち、入力画素とマッチングした登録場所の数をnwk=M、0<j<n、j≠i、mは、入力画像Mと現在のモデルMとの間でマッチした局所特徴量の数、k、i、j、tは整数としたとき、下記により前記マッチングスコアsを求めることができる、請求項5記載の位置推定装置。
【数14】

【請求項7】
前記類似度算出手段は、マッチングスコアと、ガウス分布から得られる遷移確率とに基づき類似度スコアを算出定する、請求項1乃至6のいずれか1項記載の位置推定装置。
【請求項8】
前記類似度スコアをβ、ガウシアンシグマ=2としたとき、iからkの距離を示す前記遷移確率をp(i,k)、考慮する隣接登録画像に関する値をω、i、kを整数とすると、下記により、前記類似度スコアβを求めることができる、請求項7記載の位置推定装置。
【数15】

【請求項9】
前記類似度算出手段は、前記類似度スコアを正規化した正規化スコアを算出する、請求項7又は8記載の位置推定装置。
【請求項10】
前記認定手段は、前記類似度スコアから前記類似度スコアの標準偏差と平均値の和を引いた値が所定の閾値以上である場合、前記入力画像を前記登録場所であると認定する、請求項7乃至9項記載の位置推定装置。
【請求項11】
前記認定手段の認定結果を補正する補正手段を更に有し、前記補正手段は、前記類似度スコアを正規化した正規化スコアに基づき当該認定結果を補正した補正スコアを算出する、請求項7乃至10のいずれか1項記載の位置推定装置。
【請求項12】
前記類似度スコアをβ、前記類似度スコアの標準偏差及び平均をそれぞれσ及びμ、T=σ+μ、iは整数としたとき、前記正規化スコアCは、下記の式により求めることができる、請求項11項記載の位置推定装置。
【数16】

【請求項13】
前記補正手段は、ω+1≦i≦nt−(ω+1)とし、ガウシアンシグマ=2としたとき、iからkの距離を示す前記遷移確率をp(i,k)、考慮する隣接登録画像に関する値をω、i、kを整数とすると、前記補正スコアCは、下記により求まる、請求項11又は12記載の位置推定装置。
【数17】

【請求項14】
前記特徴量抽出手段は、
前記入力画像それぞれから、局所特徴量を抽出する局所特徴量抽出手段と、
前記局所特徴量抽出手段により抽出された前記局所特徴量について、前記連続する入力画像間でマッチングをとる特徴量マッチング手段と、
前記特徴量マッチング手段により所定数連続する画像間でマッチングが取れた局所特徴量を連続特徴量として選択する連続特徴量選択手段と、
各前記連続特徴量の平均を不変特徴量として求める不変特徴量算出手段とを有する、請求項1乃至13のいずれか1項記載の位置推定装置。
【請求項15】
前記局所特徴量は、SIFT(Scale Invariant Feature Transformation)及び/又はSURF(Speed Up Robustness Features)の特徴量である、請求項14項記載の位置推定装置。
【請求項16】
入力画像から局所特徴量を抽出する特徴量抽出工程と、
各登録場所と局所特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング工程と、
マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を算出する類似度算出工程と、
前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する認定工程とを有する位置推定方法。
【請求項17】
所定の動作をコンピュータに実行させるためのプログラムであって、
入力画像から局所特徴量を抽出する特徴量抽出工程と、
各登録場所と局所特徴量が対応づけられて保存されているデータベースを参照し、入力画像と登録場所とのマッチングを求めるマッチング工程と、
マッチングが所定の閾値以上である場合に、選ばれた登録場所の近傍の登録場所を含めて類似度を判定する類似度算出工程と、
前記類似度が所定の閾値以上である場合に、当該入力画像が登録場所であると認定する認定工程とを有するプログラム。

【図1】
image rotate

【図2】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図3】
image rotate

【図4】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2011−215716(P2011−215716A)
【公開日】平成23年10月27日(2011.10.27)
【国際特許分類】
【出願番号】特願2010−81027(P2010−81027)
【出願日】平成22年3月31日(2010.3.31)
【出願人】(000003207)トヨタ自動車株式会社 (59,920)
【出願人】(304021417)国立大学法人東京工業大学 (1,821)
【Fターム(参考)】