画像処理装置、画像処理方法及びプログラム
【課題】物体認識において使用されている認識手法をユーザに簡易にフィードバックする。
【解決手段】入力画像を取得する画像取得部と、複数の認識手法から上記入力画像に映る物体の認識手法を選択する選択部と、上記選択部により選択される認識手法を用いて、上記入力画像に映る物体を認識する認識部と、上記認識部により認識される物体と関連付けられる仮想オブジェクトを上記入力画像に重畳して表示する表示制御部と、を備え、上記表示制御部は、上記選択部により選択される認識手法に応じて、上記仮想オブジェクトの表示を変化させる、画像処理装置が提供される。
【解決手段】入力画像を取得する画像取得部と、複数の認識手法から上記入力画像に映る物体の認識手法を選択する選択部と、上記選択部により選択される認識手法を用いて、上記入力画像に映る物体を認識する認識部と、上記認識部により認識される物体と関連付けられる仮想オブジェクトを上記入力画像に重畳して表示する表示制御部と、を備え、上記表示制御部は、上記選択部により選択される認識手法に応じて、上記仮想オブジェクトの表示を変化させる、画像処理装置が提供される。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像処理装置、画像処理方法及びプログラムに関する。
【背景技術】
【0002】
近年、実世界に付加的な情報を重畳してユーザに呈示する拡張現実(AR:Augmented Reality)と呼ばれる技術が注目されている。AR技術においてユーザに呈示される情報は、様々な形態の仮想的なオブジェクトを用いて可視化され得る。例えば、AR技術を実世界の物体への注目を促すために利用する場合には、実世界の物体(またはその物体の周囲)などに、その物体への注目を促すための仮想オブジェクト(例えば、目印など)が重畳して表示され得る。ユーザは、その仮想オブジェクトを閲覧することにより、注目が促された物体に注目することができる。注目が促される物体としては、例えば、案内や広告などを挙げることができる。
【0003】
このような物体は、撮像装置により実世界が撮像されることにより得られた撮像画像に基づいて認識され得る。ここで、物体認識の手法としては、常に同一の認識手法が用いられるとは限らず、状況に応じて適宜変更され得る。例えば、物体認識の正確さを評価し、評価結果に基づいて、認識に使用するパラメータを修正したり認識アルゴリズムを変更したりすることにより、物体認識の精度を高める技術について開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−175860号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、どのような認識手法が使用されているかをユーザにフィードバックする技術はこれまで開示されていない。認識手法は、処理コストや実現可能な認識精度において互いに異なる。そのため、認識手法がユーザにフィードバックされれば、特に使用される可能性のある認識手法が複数存在する場合に有益である。一例として、ユーザは、フィードバックに応じて、現在表示されている仮想オブジェクトの位置若しくは姿勢又は呈示される情報の内容の信頼性を判断することができる。また、他の例として、ユーザは、フィードバックに応じて、高い認識精度を期待できる認識手法が使用される状況になるまで待って仮想オブジェクトを操作することもできる。したがって、物体認識において使用されている認識手法をユーザに簡易にフィードバックすることのできる技術が実現されることが望ましい。
【課題を解決するための手段】
【0006】
本開示によれば、入力画像を取得する画像取得部と、複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、を備え、前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、画像処理装置が提供される。
【発明の効果】
【0007】
以上説明したように本開示によれば、物体認識において使用されている認識手法をユーザに簡易にフィードバックすることが可能である。
【図面の簡単な説明】
【0008】
【図1】本開示の実施形態に係る画像処理装置の概要を説明するための図である。
【図2】同実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。
【図3】制御部により実現される機能の構成の一例を示すブロック図である。
【図4】複数の認識手法から認識手法を選択する機能を説明するための図である。
【図5】制御部により実現される機能の構成の他の一例を示すブロック図である。
【図6】複数の認識手法に関する第1の例を説明するための図である。
【図7】複数の認識手法に関する第2の例を説明するための図である。
【図8】複数の認識手法に関する第3の例を説明するための図である。
【図9】物体の認識処理の流れを示すフローチャートである。
【図10】選択された認識手法に応じた仮想オブジェクトの表示例を示す図である。
【図11】選択された認識手法に応じた仮想オブジェクトの表示例を示す図である。
【図12】出力画像の表示制御処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0009】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0010】
なお、説明は以下の順序で行うものとする。
1.画像処理装置の概要
2.ハードウェア構成例
3.画像処理装置が有する機能
3−1.画像取得部
3−2.検出部
3−3.選択部
3−4.認識部
3−5.認識処理の流れ
3−6.表示制御部
3−7.表示制御処理の流れ
4.まとめ
【0011】
<1.画像処理装置の概要>
図1は、本開示の実施形態に係る画像処理装置の概要を説明するための図である。図1には、本開示の実施形態に係る画像処理装置100を持つユーザが存在する実空間1が示されている。
【0012】
図1を参照すると、実空間1の内部には、物体Objが存在する。物体Objは、例えば、ユーザが注目すべき物体であり、典型的には、図1に示したように、目的地の場所を説明するための案内などであるが、商品やイベントを宣伝するための広告などであってもよく、他の物体であってもよい。また、図1に示した例では、物体Objは、壁に設置されているが、天井や床などに設置されていてもよい。さらに、実空間1は、図1の例に限定されず、屋内の環境であっても屋外の環境であってもよい。
【0013】
画像処理装置100は、実空間の内部を撮影し、後に説明する本実施形態に係る画像処理を実行する。図1では、画像処理装置100の一例としてビデオカメラを示しているが、画像処理装置100はかかる例に限定されない。例えば、画像処理装置100は、ビデオカメラなどの撮像装置から画像を取得することのできる、PC(Personal Computer)、携帯端末又はデジタル家電機器などの情報処理装置であってもよい。また、画像処理装置100は、必ずしも図1に示したようにユーザに保持されていなくてもよい。例えば、画像処理装置100は、任意の場所に固定的に設置されてもよく、又は視覚としてのカメラを有するロボットなどに搭載されてもよい。
【0014】
撮像された画像を入力画像とし、その入力画像に基づいて画像処理装置100により物体Objが認識されると、認識された物体Objに関連付けられる仮想オブジェクトが入力画像に重畳されて表示され得る。仮想オブジェクトは、例えば、認識された物体Objへの注目を促すための仮想オブジェクト(例えば、目印など)であり、例えば、入力画像内の物体Obj(またはその物体Objの周囲)などに重畳され得る。ユーザは、その仮想オブジェクトを閲覧することにより、注目が促された物体Objに注目することができる。
【0015】
物体認識の手法としては、常に同一の認識手法が用いられるとは限らず、状況に応じて適宜変更され得る。本開示の実施形態に係る画像処理装置100は、次節より詳しく説明する仕組みにより、物体の認識手法をユーザに把握させることを可能とする。
【0016】
<2.ハードウェア構成例>
図2は、本開示の実施形態に係る画像処理装置100のハードウェア構成の一例を示すブロック図である。図2を参照すると、画像処理装置100は、撮像部102、センサ部104、入力部106、記憶部108、表示部112、接続ポート114、バス116及び制御部118を備える。
【0017】
(撮像部)
撮像部102は、例えば、撮像装置に相当するカメラモジュールである。撮像部102は、CCD(Charge Coupled Device)又はCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を用いて実空間1を撮像することにより、撮像画像を生成する。本開示の実施形態においては、撮像部102が画像処理装置100の一部であることを想定しているが、撮像部102は、画像処理装置100とは別体に構成されてもよい。
【0018】
(センサ部)
センサ部104は、画像処理装置100の位置及び姿勢(撮像部102の位置及び姿勢)の認識を支援するセンサ群である。例えば、センサ部104は、GPS(Global Positioning System)信号を受信して画像処理装置100の緯度、経度及び高度を測定するGPSセンサを含んでもよい。また、センサ部104は、無線アクセスポイントから受信される無線信号の強度に基づいて画像処理装置100の位置を測定する測位センサを含んでもよい。また、例えば、センサ部104は、画像処理装置100の傾き角を測定するジャイロセンサ、3軸加速度を測定する加速度センサ、又は方位を測定する地磁気センサを含んでもよい。なお、画像処理装置100が画像認識に基づく位置推定機能及び姿勢推定機能を有する場合には、センサ部104は画像処理装置100の構成から省略されてもよい。
【0019】
(入力部)
入力部106は、ユーザが画像処理装置100を操作し又は画像処理装置100へ情報を入力するために使用される入力デバイスである。入力部106は、例えば、キーボード、キーパッド、マウス、ボタン、スイッチ又はタッチパネルなどを含み得る。入力部106は、入力画像に映るユーザのジェスチャを認識するジェスチャ認識モジュールを含んでもよい。また、入力部106は、HMD(Head Mounted Display)を装着したユーザの視線方向をユーザ入力として検出する視線検出モジュールを含んでもよい。
【0020】
(記憶部)
記憶部108は、半導体メモリ又はハードディスクなどの記憶媒体を用いて、画像処理装置100による処理のためのプログラム及びデータを記憶する。例えば、記憶部108は、撮像部102から出力される画像データ及びセンサ部104から出力されるセンサデータを記憶する。また、記憶部108は、物体認識のために使用される特徴量辞書及び表示対象となる仮想オブジェクトのデータである仮想オブジェクトデータを記憶する。さらに、記憶部108は、物体認識の結果として生成される認識結果を記憶する。
【0021】
(表示部)
表示部112は、LCD(Liquid Crystal Display)、OLED(Organic light-Emitting Diode)又はCRT(Cathode Ray Tube)などにより構成される表示モジュールである。表示部112の画面上には、画像処理装置100により入力画像に仮想オブジェクトが重畳された出力画像が表示される。表示部112は、画像処理装置100の一部であってもよく、又は画像処理装置100とは別体に構成されてもよい。また、表示部112は、ユーザにより装着されるHMDであってもよい。
【0022】
(接続ポート)
接続ポート114は、画像処理装置100を周辺機器又はネットワークと接続するためのポートである。例えば、接続ポート114には、追加的な記憶媒体としてのリムーバブルメディアが接続されてもよい。また、接続ポート114には、有線又は無線通信インタフェースが接続されてもよい。それにより、例えば、画像処理装置100がネットワーク上のサーバから画像を取得することが可能となる。
【0023】
(バス)
バス116は、撮像部102、センサ部104、入力部106、記憶部108、表示部112、接続ポート114及び制御部118を相互に接続する。
【0024】
(制御部)
制御部118は、CPU(Central Processing Unit)又はDSP(Digital Signal Processor)などのプロセッサに相当する。制御部118は、記憶部108又は他の記憶媒体に記憶されるプログラムを実行することにより、後に説明する画像処理装置100の様々な機能を動作させる。
【0025】
<3.機能構成例>
図3は、図2に示した画像処理装置100の制御部118により実現される機能の構成の一例を示すブロック図である。図3を参照すると、制御部118は、画像取得部120、検出部130、選択部140、認識部150及び表示制御部160を含む。
【0026】
[3−1.画像取得部]
画像取得部120は、撮像部102(又は他の撮像装置)を用いて撮像された実空間を映す入力画像を取得する。入力画像は、仮想オブジェクトが配置される実空間内の場所又は物体が映された画像である。画像取得部120は、取得した入力画像を、検出部130及び表示制御部160へ出力する。また、後に説明するように、画像取得部120は、取得した入力画像を、検出部130に出力しなくてもよい。例えば、撮像部102(又は他の撮像装置)が実空間を連続的に撮像している場合には、画像取得部120は、連続的に入力画像を取得することができる。
【0027】
[3−2.検出部]
検出部130は、画像取得部120から入力される入力画像に映る物体の動きに関するパラメータを検出する。検出部130により検出されるパラメータは、例えば、画像処理装置100と入力画像に映る物体との間の相対的な移動量に応じたパラメータである。検出部130は、例えば、入力画像の各領域における移動量をオプティカルフローなどにより取得し、各領域における移動量の総和を、相対的な移動量として算出することができる。移動量は、例えば、ベクトルにより表現され得る。
【0028】
入力画像の各領域は、例えば、あらかじめ決められていてもよい。例えば、入力画像の各領域は、入力画像全体の各ブロック(画素の集合)であってもよく、入力画像全体の各画素であってもよい。また、入力画像の各領域は、あらかじめ決められていなくてもよい。例えば、検出部130は、入力画像に映っている物体の移動量をオプティカルフローなどにより取得し、その物体の移動量を相対的な移動量として算出することもできる。オプティカルフローとしては、例えば、ブロックマッチング法、勾配法などの手法が採用され得る。
【0029】
[3−3.選択部]
図4は、複数の認識手法から認識手法を選択する機能を説明するための図である。図4を参照しながら、物体を認識するための手法が複数存在する場合に、複数の認識手法から入力画像に映る物体の認識手法を選択する機能を説明する。選択部140は、複数の認識手法から少なくとも1つの認識手法を選択することができる。
【0030】
選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていないことを示している場合に、処理コストのより高い認識手法を選択する。例えば、画像取得部120により取得される入力画像が、画像Im0Aから画像Im1Aに遷移した場合を想定する。この場合、選択部140は、検出部130により算出された移動量が所定の移動量を超えていないため、入力画像に所定のレベルを超えて動く物体が映っていないことをパラメータが示していると判断することができる。
【0031】
一方、選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する。例えば、画像取得部120により取得される入力画像が、画像Im0Aから画像Im1A’に遷移した場合を想定する。この場合、選択部140は、検出部130により算出された移動量が所定の移動量を超えているため、入力画像に所定のレベルを超えて動く物体が映っていることをパラメータが示していると判断することができる。
【0032】
選択部140は、選択した認識手法を、認識部150及び表示制御部160へ出力する。なお、処理コストのより高い認識手法や、処理コストのより低い認識手法などといった表現は、相対的な関係における処理コストの高低を表現しているにすぎず、絶対的な処理コストの高低を示すものではない。すなわち、2つの処理コストを比較した場合に、一方の処理コストが他方の処理コストよりも高いということを意味している。
【0033】
このように認識手法を選択することにより、パラメータに応じて物体認識のための処理コストを変更することができる。例えば、入力画像に所定のレベルを超えて動く物体が映っている場合には、入力画像に大きなブレが生じている(入力画像が比較的不鮮明である)と考えられるため、物体認識の精度よりも物体認識における処理速度を重視することができる。そこで、選択部140は、より低い処理コストの認識手法を選択する。
【0034】
他方、例えば、入力画像に所定のレベルを超えて動く物体が映っていない場合には、入力画像に大きなブレが生じていない(入力画像が比較的鮮明である)と考えられるため、物体認識における処理速度よりも物体認識の精度を重視することができる。そこで、選択部140は、より高い処理コストの認識手法を選択する。
【0035】
図5は、図2に示した画像処理装置100の制御部118により実現される機能の構成の他の一例を示すブロック図である。図5を参照しながら、物体を認識するための手法が複数存在する場合に、複数の認識手法から入力画像に映る物体の認識手法を選択する機能の他の一例を説明する。
【0036】
上記したように、検出部130は、画像取得部120から入力される入力画像に映る物体の動きに関するパラメータを検出する。検出部130により検出されるパラメータは、例えば、画像処理装置100の絶対的な移動量に応じたパラメータであってもよい。この場合、検出部130は、センサ部104により検出されたセンサデータを、画像処理装置100の絶対的な移動量として検出することができる。
【0037】
また、上記したように、選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていないことを示している場合に、処理コストのより高い認識手法を選択する。例えば、過去に検出された複数のセンサデータの平均値と現在検出されたセンサデータの値との差分が所定値を超えている場合に、入力画像に所定のレベルを超えて動く物体が映っていないことをパラメータが示していると判断することができる。
【0038】
あるいは、過去に検出されたセンサデータと現在検出されたセンサデータの値との差分が所定値を超えている場合に、入力画像に所定のレベルを超えて動く物体が映っていないことをパラメータが示していると判断してもよい。
【0039】
一方、上記したように、選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する。例えば、過去に検出された複数のセンサデータの平均値と現在検出されたセンサデータの値との差分が所定値を超えていない場合に、入力画像に所定のレベルを超えて動く物体が映っていることをパラメータが示していると判断することができる。
【0040】
あるいは、過去に検出されたセンサデータと現在検出されたセンサデータの値との差分が所定値を超えていない場合に、入力画像に所定のレベルを超えて動く物体が映っていることをパラメータが示していると判断してもよい。
【0041】
[3−4.認識部]
認識部150は、選択部140により選択される認識手法を用いて、入力画像に映る物体を認識する。認識部150は、例えば、入力画像から抽出される各特徴量を既知の物体画像の特徴量の集合である特徴量辞書と照合することにより、入力画像に映る物体を認識することができる。認識部150は、例えば、入力画像から抽出される特徴量に一致する特徴量が特徴量辞書に存在する場合、その特徴量に対応付けられている物体IDとその物体の位置及び姿勢とを取得することにより、物体を認識することができる。ここで使用される特徴量辞書は、記憶部108にあらかじめ記憶させておいてもよいし、他の装置から送信されてもよい。
【0042】
また、入力画像から抽出される特徴量は、1つであってもよいし複数であってもよい。入力画像から各特徴量を抽出する処理は、例えば、認識部150により行われ得る。特徴量辞書は、物体を識別するための物体IDとその物体画像の特徴量との組み合わせを有しているが、この組み合わせは、1つであってもよいし複数であってもよい。以下では、入力画像に映る物体として、物体Objが認識される例を主に説明するが、入力画像に映る物体は、1つに限らず複数認識されてもよい。認識部150は、認識結果を、表示制御部160へ出力する。
【0043】
認識部150は、より具体的には、例えば、FAST特徴検出法(FAST feature detection)などの任意の公知の手法に従って、入力画像内の特徴点を抽出する。そして、認識部150は、抽出された特徴点を特徴量辞書に含まれる物体の頂点と照合する。その結果、認識部150は、入力画像にどの物体が映っているか、及び認識された各物体がどの位置にどのような姿勢で映っているかを認識する。
【0044】
認識された物体が実空間モデルに含まれる物体である場合には、当該物体の3次元位置及び姿勢は、実空間モデルにおいて示されている。認識された物体が物体モデルに含まれる物体である場合には、当該物体の3次元位置及び姿勢は、当該物体の頂点群の撮像面上での2次元位置をピンホールモデルに従って実空間内の3次元位置に変換することにより求められ得る(例えば、特開2008−304268号公報参照)。
【0045】
認識部150は、選択部140により処理コストのより低い認識手法が選択された場合には、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識する。また、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合には、処理コストのより高い認識手法を用いて、入力画像に映る物体Objを認識する。この二つの認識手法(処理コストのより低い認識手法、及び処理コストのより高い認識手法)は、入力画像から各特徴量を抽出するアルゴリズム自体が異なることにより処理コストが異なっていてもよいし、照合の対象とされるデータ量が互いに異なることにより処理コストが異なっていてもよい。以下では、主に、照合の対象とされるデータ量が互いに異なることにより二つの認識手法の処理コストが異なる例を説明する。
【0046】
図6は、複数の認識手法に関する第1の例を説明するための図である。図6に示すように、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合、例えば、入力画像Im1Aのサイズを縮小し、縮小した画像Im1Bから特徴量辞書と照合される各特徴量を抽出することができる。そして、認識部150は、抽出した各特徴量を特徴量辞書と照合することにより、入力画像に映る物体Objを認識することができる。
【0047】
他方、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合、例えば、入力画像Im1Aのサイズを縮小せずに、入力画像Im1Aから特徴量辞書と照合される各特徴量を抽出することができる。そして、認識部150は、抽出した各特徴量を特徴量辞書と照合することにより、入力画像に映る物体Objを認識することができる。
【0048】
このように、複数の認識手法に関する第1の例においては、選択部140により処理コストのより低い認識手法(第1の認識手法)が選択された場合、認識部150は、よりサイズの小さい画像から各特徴量を抽出することが可能である。これにより、選択部140により処理コストのより低い認識手法が選択された場合には、照合対象のデータ量がより小さくなることにより、認識部150は、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識することができる。
【0049】
なお、ここでは、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合、入力画像Im1Aのサイズを縮小し、選択部140により処理コストのより高い認識手法が選択された場合、入力画像Im1Aのサイズを縮小しないこととした。しかし、このような例に限らず、選択部140により処理コストのより低い認識手法が選択された場合、選択部140により処理コストのより高い認識手法が選択された場合と比較して、よりサイズが小さい画像から各特徴量を抽出するようにすればよい。
【0050】
図7は、複数の認識手法に関する第2の例を説明するための図である。図7に示すように、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量の高周波成分を無視するとともに特徴量辞書の高周波成分を無視し、各特徴量と特徴量辞書との照合を行うことができる。認識部150は、例えば、入力画像Im1Aから抽出した各特徴量及び特徴量辞書の各特徴量のうち所定の周波数を超える領域を高周波成分としてカットする。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0051】
他方、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量と特徴量辞書との照合を行うことができる。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0052】
このように、複数の認識手法に関する第2の例においては、選択部140により処理コストのより低い認識手法(第2の認識手法)が選択された場合、認識部150は、各特徴量の高周波成分を無視して各特徴量を照合することが可能である。これにより、選択部140により処理コストのより低い認識手法が選択された場合には、照合対象のデータ量がより小さくなることにより、認識部150は、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識することができる。
【0053】
なお、ここでは、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合、入力画像Im1Aから抽出した各特徴量及び特徴量辞書の各特徴量の高周波成分を無視した照合を行うこととした。しかし、このような例に限らず、選択部140により処理コストのより低い認識手法が選択された場合、選択部140により処理コストのより高い認識手法が選択された場合と比較して、より広範囲の周波数成分を各特徴量からカットするようにすればよい。
【0054】
図8は、複数の認識手法に関する第3の例を説明するための図である。図8に示すように、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量とよりデータ量の小さい特徴量辞書との照合を行うことができる。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0055】
他方、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量とよりデータ量の大きい特徴量辞書との照合を行うことができる。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0056】
このように、複数の認識手法に関する第3の例においては、選択部140により処理コストのより低い認識手法(第3の認識手法)が選択された場合、認識部150は、よりデータ量の小さい特徴量辞書を用いて照合することが可能である。これにより、選択部140により処理コストのより低い認識手法が選択された場合には、照合対象のデータ量がより小さくなることにより、認識部150は、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識することができる。
【0057】
なお、データ量のより大きい特徴量辞書や、データ量のより小さい特徴量辞書などといった表現は、相対的な関係における特徴量辞書のデータ量の大小を表現しているにすぎず、絶対的なデータ量の大小を示すものではない。すなわち、2つの特徴量辞書のデータ量を比較した場合に、一方のデータ量が他方のデータ量よりも小さいということを意味している。
【0058】
[3−5.認識処理の流れ]
図9は、物体の認識処理の流れを示すフローチャートである。図9を参照しながら、物体の認識処理の流れを説明する。
【0059】
図9に示すように、まず、画像取得部120は、撮像部102(又は他の撮像装置)を用いて撮像された実空間を映す入力画像を取得する(S101)。また、検出部130は、画像取得部120から入力される入力画像に映る物体の動きに関するパラメータを検出する(S102)。
【0060】
続いて、選択部140は、パラメータを解析して処理コストを判定する(S103)。選択部140は、より低い処理コストの認識手法を選択すべきと判定した場合には(S103において「処理コスト:低」)、より低い処理コストの認識手法を選択する(S104)。他方、選択部140は、より高い処理コストの認識手法を選択すべきと判定した場合には(S103において「処理コスト:高」)、より高い処理コストの認識手法を選択する(S105)。
【0061】
続いて、認識部150は、選択部140により選択された認識手法を用いて、入力画像に映る物体を認識する(S106)。選択部140は、選択した認識手法を表示制御部160へ出力し、認識部150は、認識結果を表示制御部160へ出力する(S107)。制御部118は、入力画像の取得(S101)に戻り、画像取得部120による画像取得(S101)から認識手法及び認識結果の出力(S107)までの処理が再度行われ得る。
【0062】
[3−6.表示制御部]
表示制御部160は、認識部150により認識される物体と関連付けられる仮想オブジェクトを入力画像に重畳して表示する。仮想オブジェクトは、例えば、物体IDと仮想オブジェクトデータとが関連付けられたデータが記憶部108により記憶されている。すなわち、表示制御部160は、認識部150により取得された物体IDに関連付けられた仮想オブジェクトデータを記憶部108から取得し、取得した仮想オブジェクトデータに基づいて仮想オブジェクトを表示することができる。
【0063】
図10及び図11は、選択部140により選択された認識手法に応じた仮想オブジェクトの表示例を示す図である。図10に示すように、表示制御部160は、認識部150により認識される物体と関連付けられる仮想オブジェクトを入力画像Im1Aに重畳して表示することができる。また、表示制御部160は、仮想オブジェクトをどのような位置にどのような姿勢により表示してもよい。例えば、表示制御部160は、認識部150により取得された物体の位置(又はその物体の周囲)に、認識部150により取得された姿勢により、仮想オブジェクトを表示することができる。
【0064】
例えば、選択部140により処理コストのより低い認識手法が選択された場合には、認識部150により、処理コストのより低い認識手法を用いて入力画像Im1Aに映る物体Objが認識されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより低くすることができる。図10に示した例では、時刻t1において、入力画像1Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により鮮明度のより低い仮想オブジェクトV1が表示されている。
【0065】
その後、図10に示すように、ユーザが、時刻t2において、画像処理装置100の向きを左に移動させたとする。この場合、選択部140により処理コストのより低い認識手法が選択されることが想定されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより低くすることができる。図10に示した例では、時刻t2において、入力画像2Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により鮮明度のより低い仮想オブジェクトV2が表示されている。
【0066】
表示制御部160は、選択部140により処理コストのより低い認識手法が選択される場合に、仮想オブジェクトの残像を表示させてもよい。図10に示した例では、時刻t2において、入力画像2Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により仮想オブジェクトV1の残像が表示されている。このように、仮想オブジェクトV2とともに過去に表示された仮想オブジェクトV1の残像を表示するようにすることで、残像を見たユーザは、画像処理装置100の向きを戻し、物体Objの表示位置を所望の位置に戻すことができる。
【0067】
その後、図11に示すように、ユーザが、時刻t3において、画像処理装置100の向きを右に移動させたとする。この場合、選択部140により処理コストのより低い認識手法が選択されることが想定されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより低くすることができる。図11に示した例では、時刻t3において、入力画像3Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により鮮明度のより低い仮想オブジェクトV3が表示されている。
【0068】
なお、時刻t3においても、入力画像3Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により仮想オブジェクトV2の残像が表示されている。このように、仮想オブジェクトV3とともに過去に表示された仮想オブジェクトV2の残像を表示するようにすることで、残像を見たユーザは、画像処理装置100の向きを戻し、物体Objの表示位置を所望の位置に戻すことができる。
【0069】
その後、図11に示すように、ユーザが、時刻t4において、画像処理装置100の向きを固定したとする。この場合、選択部140により処理コストのより高い認識手法が選択されることが想定されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより高くすることができる。図11に示した例では、時刻t4において、入力画像4Aに映る物体の認識手法として処理コストのより高い認識手法が選択部140により選択され、表示制御部160により鮮明度のより高い仮想オブジェクトV4が表示されている。
【0070】
このように、表示制御部160は、選択部140により選択される認識手法に応じて、仮想オブジェクトの表示を変化させることができる。かかる制御により、仮想オブジェクトに関連付けられる物体の認識手法をユーザに把握させることが可能である。
【0071】
[3−7.表示制御処理の流れ]
図12は、出力画像の表示制御処理の流れを示すフローチャートである。図12を参照しながら、出力画像の表示制御処理の流れを説明する。
【0072】
図12に示すように、まず、表示制御部160は、画像取得部120から入力画像を取得する(S201)。また、表示制御部160は、選択部140により出力された認識手法及び認識部150により出力された認識結果を取得する(S202)。続いて、表示制御部160は、認識された物体に関連付けられる仮想オブジェクトを、認識手法に応じて入力画像に重畳することにより出力画像を生成する(S203)。続いて、表示制御部160は、出力画像を表示する(S204)。制御部118は、入力画像の取得(S201)に戻り、画像取得部120による画像取得(S201)から出力画像の表示(S204)までの処理が再度行われ得る。
【0073】
<4.まとめ>
以上説明したように、本開示の実施形態によれば、画像処理装置は、仮想オブジェクトに関連付けられる物体の認識手法をユーザに把握させることが可能である。これにより、ユーザは、例えば、表示される仮想オブジェクトを見れば、その仮想オブジェクトに関連付けられる物体の認識がどの程度の処理コストによりなされたかを把握することができる。既に述べたように、仮想オブジェクトは、例えば、認識手法に基づいてその鮮明度が変更され得る。
【0074】
また、本開示の実施形態によれば、画像処理装置は、現在認識された物体に関連付けられる仮想オブジェクトとともに過去に表示された仮想オブジェクトの残像を表示するようにすることもできる。これにより、残像を見たユーザは、画像処理装置の向きを戻し、物体の表示位置を所望の位置に戻すことができる。
【0075】
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0076】
例えば、本明細書の画像処理装置が実行する処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、画像処理装置が実行する処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
【0077】
また、本明細書において説明した画像処理装置による一連の制御処理は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。ソフトウェアを構成するプログラムは、例えば、各装置の内部又は外部に設けられる記憶媒体に予め格納される。そして、各プログラムは、例えば、実行時にRAM(Random Access Memory)に読み込まれ、CPU(Central Processing Unit)などのプロセッサにより実行される。
【0078】
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置。
(2)
前記認識部は、前記入力画像から抽出される特徴量を既知の物体画像の特徴量の集合である特徴量辞書と照合することにより、前記入力画像に映る物体を認識する、(1)に記載の画像処理装置。
(3)
前記複数の認識手法は、前記認識部による照合の対象とされるデータ量が互いに異なる手法である、(1)又は(2)に記載の画像処理装置。
(4)
前記認識部は、第1の認識手法において、サイズを縮小した前記入力画像から前記特徴量辞書と照合される特徴量を抽出する、(1)から(3)のいずれか一項に記載の画像処理装置。
(5)
前記認識部は、第2の認識手法において、各特徴量の高周波成分を無視して特徴量を照合する、(1)から(3)のいずれか一項に記載の画像処理装置。
(6)
前記認識部は、第3の認識手法において、複数の特徴量辞書のうちデータ量のより小さい特徴量辞書を用いる、(1)から(3)のいずれか一項に記載の画像処理装置。
(7)
前記複数の認識手法は、前記認識部による前記特徴量の抽出アルゴリズムが互いに異なる手法である、(2)に記載の画像処理装置。
(8)
前記画像処理装置は、前記入力画像に映る物体の動きに関するパラメータを検出する検出部、をさらに備え、
前記選択部は、前記検出部により検出されるパラメータが前記入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する、
(1)から(7)のいずれか一項に記載の画像処理装置。
(9)
前記パラメータは、前記画像処理装置と前記入力画像に映る物体との間の相対的な移動量に応じたパラメータである、(8)に記載の画像処理装置。
(10)
前記パラメータは、前記画像処理装置の絶対的な移動量に応じたパラメータである、(8)に記載の画像処理装置。
(11)
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示の鮮明度を変化させる、(1)から(10)のいずれか一項に記載の画像処理装置。
(12)
前記表示制御部は、前記選択部により処理コストのより低い認識手法が選択される場合に、前記仮想オブジェクトの残像を表示させる、(1)から(11)のいずれか一項に記載の画像処理装置。
(13)
入力画像を取得することと、
複数の認識手法から前記入力画像に映る物体の認識手法を選択することと、
選択された前記認識手法を用いて、前記入力画像に映る物体を認識することと、
認識された物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示することと、
選択された前記認識手法に応じて、前記仮想オブジェクトの表示を変化させることと、
を含む、画像処理方法。
(14)
コンピュータを、
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置として機能させるためのプログラム。
【符号の説明】
【0079】
100 画像処理装置
102 撮像部
104 センサ部
106 入力部
108 記憶部
112 表示部
118 制御部
120 画像取得部
130 検出部
140 選択部
150 認識部
160 表示制御部
【技術分野】
【0001】
本開示は、画像処理装置、画像処理方法及びプログラムに関する。
【背景技術】
【0002】
近年、実世界に付加的な情報を重畳してユーザに呈示する拡張現実(AR:Augmented Reality)と呼ばれる技術が注目されている。AR技術においてユーザに呈示される情報は、様々な形態の仮想的なオブジェクトを用いて可視化され得る。例えば、AR技術を実世界の物体への注目を促すために利用する場合には、実世界の物体(またはその物体の周囲)などに、その物体への注目を促すための仮想オブジェクト(例えば、目印など)が重畳して表示され得る。ユーザは、その仮想オブジェクトを閲覧することにより、注目が促された物体に注目することができる。注目が促される物体としては、例えば、案内や広告などを挙げることができる。
【0003】
このような物体は、撮像装置により実世界が撮像されることにより得られた撮像画像に基づいて認識され得る。ここで、物体認識の手法としては、常に同一の認識手法が用いられるとは限らず、状況に応じて適宜変更され得る。例えば、物体認識の正確さを評価し、評価結果に基づいて、認識に使用するパラメータを修正したり認識アルゴリズムを変更したりすることにより、物体認識の精度を高める技術について開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−175860号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、どのような認識手法が使用されているかをユーザにフィードバックする技術はこれまで開示されていない。認識手法は、処理コストや実現可能な認識精度において互いに異なる。そのため、認識手法がユーザにフィードバックされれば、特に使用される可能性のある認識手法が複数存在する場合に有益である。一例として、ユーザは、フィードバックに応じて、現在表示されている仮想オブジェクトの位置若しくは姿勢又は呈示される情報の内容の信頼性を判断することができる。また、他の例として、ユーザは、フィードバックに応じて、高い認識精度を期待できる認識手法が使用される状況になるまで待って仮想オブジェクトを操作することもできる。したがって、物体認識において使用されている認識手法をユーザに簡易にフィードバックすることのできる技術が実現されることが望ましい。
【課題を解決するための手段】
【0006】
本開示によれば、入力画像を取得する画像取得部と、複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、を備え、前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、画像処理装置が提供される。
【発明の効果】
【0007】
以上説明したように本開示によれば、物体認識において使用されている認識手法をユーザに簡易にフィードバックすることが可能である。
【図面の簡単な説明】
【0008】
【図1】本開示の実施形態に係る画像処理装置の概要を説明するための図である。
【図2】同実施形態に係る画像処理装置のハードウェア構成を示すブロック図である。
【図3】制御部により実現される機能の構成の一例を示すブロック図である。
【図4】複数の認識手法から認識手法を選択する機能を説明するための図である。
【図5】制御部により実現される機能の構成の他の一例を示すブロック図である。
【図6】複数の認識手法に関する第1の例を説明するための図である。
【図7】複数の認識手法に関する第2の例を説明するための図である。
【図8】複数の認識手法に関する第3の例を説明するための図である。
【図9】物体の認識処理の流れを示すフローチャートである。
【図10】選択された認識手法に応じた仮想オブジェクトの表示例を示す図である。
【図11】選択された認識手法に応じた仮想オブジェクトの表示例を示す図である。
【図12】出力画像の表示制御処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0009】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0010】
なお、説明は以下の順序で行うものとする。
1.画像処理装置の概要
2.ハードウェア構成例
3.画像処理装置が有する機能
3−1.画像取得部
3−2.検出部
3−3.選択部
3−4.認識部
3−5.認識処理の流れ
3−6.表示制御部
3−7.表示制御処理の流れ
4.まとめ
【0011】
<1.画像処理装置の概要>
図1は、本開示の実施形態に係る画像処理装置の概要を説明するための図である。図1には、本開示の実施形態に係る画像処理装置100を持つユーザが存在する実空間1が示されている。
【0012】
図1を参照すると、実空間1の内部には、物体Objが存在する。物体Objは、例えば、ユーザが注目すべき物体であり、典型的には、図1に示したように、目的地の場所を説明するための案内などであるが、商品やイベントを宣伝するための広告などであってもよく、他の物体であってもよい。また、図1に示した例では、物体Objは、壁に設置されているが、天井や床などに設置されていてもよい。さらに、実空間1は、図1の例に限定されず、屋内の環境であっても屋外の環境であってもよい。
【0013】
画像処理装置100は、実空間の内部を撮影し、後に説明する本実施形態に係る画像処理を実行する。図1では、画像処理装置100の一例としてビデオカメラを示しているが、画像処理装置100はかかる例に限定されない。例えば、画像処理装置100は、ビデオカメラなどの撮像装置から画像を取得することのできる、PC(Personal Computer)、携帯端末又はデジタル家電機器などの情報処理装置であってもよい。また、画像処理装置100は、必ずしも図1に示したようにユーザに保持されていなくてもよい。例えば、画像処理装置100は、任意の場所に固定的に設置されてもよく、又は視覚としてのカメラを有するロボットなどに搭載されてもよい。
【0014】
撮像された画像を入力画像とし、その入力画像に基づいて画像処理装置100により物体Objが認識されると、認識された物体Objに関連付けられる仮想オブジェクトが入力画像に重畳されて表示され得る。仮想オブジェクトは、例えば、認識された物体Objへの注目を促すための仮想オブジェクト(例えば、目印など)であり、例えば、入力画像内の物体Obj(またはその物体Objの周囲)などに重畳され得る。ユーザは、その仮想オブジェクトを閲覧することにより、注目が促された物体Objに注目することができる。
【0015】
物体認識の手法としては、常に同一の認識手法が用いられるとは限らず、状況に応じて適宜変更され得る。本開示の実施形態に係る画像処理装置100は、次節より詳しく説明する仕組みにより、物体の認識手法をユーザに把握させることを可能とする。
【0016】
<2.ハードウェア構成例>
図2は、本開示の実施形態に係る画像処理装置100のハードウェア構成の一例を示すブロック図である。図2を参照すると、画像処理装置100は、撮像部102、センサ部104、入力部106、記憶部108、表示部112、接続ポート114、バス116及び制御部118を備える。
【0017】
(撮像部)
撮像部102は、例えば、撮像装置に相当するカメラモジュールである。撮像部102は、CCD(Charge Coupled Device)又はCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を用いて実空間1を撮像することにより、撮像画像を生成する。本開示の実施形態においては、撮像部102が画像処理装置100の一部であることを想定しているが、撮像部102は、画像処理装置100とは別体に構成されてもよい。
【0018】
(センサ部)
センサ部104は、画像処理装置100の位置及び姿勢(撮像部102の位置及び姿勢)の認識を支援するセンサ群である。例えば、センサ部104は、GPS(Global Positioning System)信号を受信して画像処理装置100の緯度、経度及び高度を測定するGPSセンサを含んでもよい。また、センサ部104は、無線アクセスポイントから受信される無線信号の強度に基づいて画像処理装置100の位置を測定する測位センサを含んでもよい。また、例えば、センサ部104は、画像処理装置100の傾き角を測定するジャイロセンサ、3軸加速度を測定する加速度センサ、又は方位を測定する地磁気センサを含んでもよい。なお、画像処理装置100が画像認識に基づく位置推定機能及び姿勢推定機能を有する場合には、センサ部104は画像処理装置100の構成から省略されてもよい。
【0019】
(入力部)
入力部106は、ユーザが画像処理装置100を操作し又は画像処理装置100へ情報を入力するために使用される入力デバイスである。入力部106は、例えば、キーボード、キーパッド、マウス、ボタン、スイッチ又はタッチパネルなどを含み得る。入力部106は、入力画像に映るユーザのジェスチャを認識するジェスチャ認識モジュールを含んでもよい。また、入力部106は、HMD(Head Mounted Display)を装着したユーザの視線方向をユーザ入力として検出する視線検出モジュールを含んでもよい。
【0020】
(記憶部)
記憶部108は、半導体メモリ又はハードディスクなどの記憶媒体を用いて、画像処理装置100による処理のためのプログラム及びデータを記憶する。例えば、記憶部108は、撮像部102から出力される画像データ及びセンサ部104から出力されるセンサデータを記憶する。また、記憶部108は、物体認識のために使用される特徴量辞書及び表示対象となる仮想オブジェクトのデータである仮想オブジェクトデータを記憶する。さらに、記憶部108は、物体認識の結果として生成される認識結果を記憶する。
【0021】
(表示部)
表示部112は、LCD(Liquid Crystal Display)、OLED(Organic light-Emitting Diode)又はCRT(Cathode Ray Tube)などにより構成される表示モジュールである。表示部112の画面上には、画像処理装置100により入力画像に仮想オブジェクトが重畳された出力画像が表示される。表示部112は、画像処理装置100の一部であってもよく、又は画像処理装置100とは別体に構成されてもよい。また、表示部112は、ユーザにより装着されるHMDであってもよい。
【0022】
(接続ポート)
接続ポート114は、画像処理装置100を周辺機器又はネットワークと接続するためのポートである。例えば、接続ポート114には、追加的な記憶媒体としてのリムーバブルメディアが接続されてもよい。また、接続ポート114には、有線又は無線通信インタフェースが接続されてもよい。それにより、例えば、画像処理装置100がネットワーク上のサーバから画像を取得することが可能となる。
【0023】
(バス)
バス116は、撮像部102、センサ部104、入力部106、記憶部108、表示部112、接続ポート114及び制御部118を相互に接続する。
【0024】
(制御部)
制御部118は、CPU(Central Processing Unit)又はDSP(Digital Signal Processor)などのプロセッサに相当する。制御部118は、記憶部108又は他の記憶媒体に記憶されるプログラムを実行することにより、後に説明する画像処理装置100の様々な機能を動作させる。
【0025】
<3.機能構成例>
図3は、図2に示した画像処理装置100の制御部118により実現される機能の構成の一例を示すブロック図である。図3を参照すると、制御部118は、画像取得部120、検出部130、選択部140、認識部150及び表示制御部160を含む。
【0026】
[3−1.画像取得部]
画像取得部120は、撮像部102(又は他の撮像装置)を用いて撮像された実空間を映す入力画像を取得する。入力画像は、仮想オブジェクトが配置される実空間内の場所又は物体が映された画像である。画像取得部120は、取得した入力画像を、検出部130及び表示制御部160へ出力する。また、後に説明するように、画像取得部120は、取得した入力画像を、検出部130に出力しなくてもよい。例えば、撮像部102(又は他の撮像装置)が実空間を連続的に撮像している場合には、画像取得部120は、連続的に入力画像を取得することができる。
【0027】
[3−2.検出部]
検出部130は、画像取得部120から入力される入力画像に映る物体の動きに関するパラメータを検出する。検出部130により検出されるパラメータは、例えば、画像処理装置100と入力画像に映る物体との間の相対的な移動量に応じたパラメータである。検出部130は、例えば、入力画像の各領域における移動量をオプティカルフローなどにより取得し、各領域における移動量の総和を、相対的な移動量として算出することができる。移動量は、例えば、ベクトルにより表現され得る。
【0028】
入力画像の各領域は、例えば、あらかじめ決められていてもよい。例えば、入力画像の各領域は、入力画像全体の各ブロック(画素の集合)であってもよく、入力画像全体の各画素であってもよい。また、入力画像の各領域は、あらかじめ決められていなくてもよい。例えば、検出部130は、入力画像に映っている物体の移動量をオプティカルフローなどにより取得し、その物体の移動量を相対的な移動量として算出することもできる。オプティカルフローとしては、例えば、ブロックマッチング法、勾配法などの手法が採用され得る。
【0029】
[3−3.選択部]
図4は、複数の認識手法から認識手法を選択する機能を説明するための図である。図4を参照しながら、物体を認識するための手法が複数存在する場合に、複数の認識手法から入力画像に映る物体の認識手法を選択する機能を説明する。選択部140は、複数の認識手法から少なくとも1つの認識手法を選択することができる。
【0030】
選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていないことを示している場合に、処理コストのより高い認識手法を選択する。例えば、画像取得部120により取得される入力画像が、画像Im0Aから画像Im1Aに遷移した場合を想定する。この場合、選択部140は、検出部130により算出された移動量が所定の移動量を超えていないため、入力画像に所定のレベルを超えて動く物体が映っていないことをパラメータが示していると判断することができる。
【0031】
一方、選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する。例えば、画像取得部120により取得される入力画像が、画像Im0Aから画像Im1A’に遷移した場合を想定する。この場合、選択部140は、検出部130により算出された移動量が所定の移動量を超えているため、入力画像に所定のレベルを超えて動く物体が映っていることをパラメータが示していると判断することができる。
【0032】
選択部140は、選択した認識手法を、認識部150及び表示制御部160へ出力する。なお、処理コストのより高い認識手法や、処理コストのより低い認識手法などといった表現は、相対的な関係における処理コストの高低を表現しているにすぎず、絶対的な処理コストの高低を示すものではない。すなわち、2つの処理コストを比較した場合に、一方の処理コストが他方の処理コストよりも高いということを意味している。
【0033】
このように認識手法を選択することにより、パラメータに応じて物体認識のための処理コストを変更することができる。例えば、入力画像に所定のレベルを超えて動く物体が映っている場合には、入力画像に大きなブレが生じている(入力画像が比較的不鮮明である)と考えられるため、物体認識の精度よりも物体認識における処理速度を重視することができる。そこで、選択部140は、より低い処理コストの認識手法を選択する。
【0034】
他方、例えば、入力画像に所定のレベルを超えて動く物体が映っていない場合には、入力画像に大きなブレが生じていない(入力画像が比較的鮮明である)と考えられるため、物体認識における処理速度よりも物体認識の精度を重視することができる。そこで、選択部140は、より高い処理コストの認識手法を選択する。
【0035】
図5は、図2に示した画像処理装置100の制御部118により実現される機能の構成の他の一例を示すブロック図である。図5を参照しながら、物体を認識するための手法が複数存在する場合に、複数の認識手法から入力画像に映る物体の認識手法を選択する機能の他の一例を説明する。
【0036】
上記したように、検出部130は、画像取得部120から入力される入力画像に映る物体の動きに関するパラメータを検出する。検出部130により検出されるパラメータは、例えば、画像処理装置100の絶対的な移動量に応じたパラメータであってもよい。この場合、検出部130は、センサ部104により検出されたセンサデータを、画像処理装置100の絶対的な移動量として検出することができる。
【0037】
また、上記したように、選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていないことを示している場合に、処理コストのより高い認識手法を選択する。例えば、過去に検出された複数のセンサデータの平均値と現在検出されたセンサデータの値との差分が所定値を超えている場合に、入力画像に所定のレベルを超えて動く物体が映っていないことをパラメータが示していると判断することができる。
【0038】
あるいは、過去に検出されたセンサデータと現在検出されたセンサデータの値との差分が所定値を超えている場合に、入力画像に所定のレベルを超えて動く物体が映っていないことをパラメータが示していると判断してもよい。
【0039】
一方、上記したように、選択部140は、検出部130により検出されるパラメータが入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する。例えば、過去に検出された複数のセンサデータの平均値と現在検出されたセンサデータの値との差分が所定値を超えていない場合に、入力画像に所定のレベルを超えて動く物体が映っていることをパラメータが示していると判断することができる。
【0040】
あるいは、過去に検出されたセンサデータと現在検出されたセンサデータの値との差分が所定値を超えていない場合に、入力画像に所定のレベルを超えて動く物体が映っていることをパラメータが示していると判断してもよい。
【0041】
[3−4.認識部]
認識部150は、選択部140により選択される認識手法を用いて、入力画像に映る物体を認識する。認識部150は、例えば、入力画像から抽出される各特徴量を既知の物体画像の特徴量の集合である特徴量辞書と照合することにより、入力画像に映る物体を認識することができる。認識部150は、例えば、入力画像から抽出される特徴量に一致する特徴量が特徴量辞書に存在する場合、その特徴量に対応付けられている物体IDとその物体の位置及び姿勢とを取得することにより、物体を認識することができる。ここで使用される特徴量辞書は、記憶部108にあらかじめ記憶させておいてもよいし、他の装置から送信されてもよい。
【0042】
また、入力画像から抽出される特徴量は、1つであってもよいし複数であってもよい。入力画像から各特徴量を抽出する処理は、例えば、認識部150により行われ得る。特徴量辞書は、物体を識別するための物体IDとその物体画像の特徴量との組み合わせを有しているが、この組み合わせは、1つであってもよいし複数であってもよい。以下では、入力画像に映る物体として、物体Objが認識される例を主に説明するが、入力画像に映る物体は、1つに限らず複数認識されてもよい。認識部150は、認識結果を、表示制御部160へ出力する。
【0043】
認識部150は、より具体的には、例えば、FAST特徴検出法(FAST feature detection)などの任意の公知の手法に従って、入力画像内の特徴点を抽出する。そして、認識部150は、抽出された特徴点を特徴量辞書に含まれる物体の頂点と照合する。その結果、認識部150は、入力画像にどの物体が映っているか、及び認識された各物体がどの位置にどのような姿勢で映っているかを認識する。
【0044】
認識された物体が実空間モデルに含まれる物体である場合には、当該物体の3次元位置及び姿勢は、実空間モデルにおいて示されている。認識された物体が物体モデルに含まれる物体である場合には、当該物体の3次元位置及び姿勢は、当該物体の頂点群の撮像面上での2次元位置をピンホールモデルに従って実空間内の3次元位置に変換することにより求められ得る(例えば、特開2008−304268号公報参照)。
【0045】
認識部150は、選択部140により処理コストのより低い認識手法が選択された場合には、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識する。また、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合には、処理コストのより高い認識手法を用いて、入力画像に映る物体Objを認識する。この二つの認識手法(処理コストのより低い認識手法、及び処理コストのより高い認識手法)は、入力画像から各特徴量を抽出するアルゴリズム自体が異なることにより処理コストが異なっていてもよいし、照合の対象とされるデータ量が互いに異なることにより処理コストが異なっていてもよい。以下では、主に、照合の対象とされるデータ量が互いに異なることにより二つの認識手法の処理コストが異なる例を説明する。
【0046】
図6は、複数の認識手法に関する第1の例を説明するための図である。図6に示すように、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合、例えば、入力画像Im1Aのサイズを縮小し、縮小した画像Im1Bから特徴量辞書と照合される各特徴量を抽出することができる。そして、認識部150は、抽出した各特徴量を特徴量辞書と照合することにより、入力画像に映る物体Objを認識することができる。
【0047】
他方、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合、例えば、入力画像Im1Aのサイズを縮小せずに、入力画像Im1Aから特徴量辞書と照合される各特徴量を抽出することができる。そして、認識部150は、抽出した各特徴量を特徴量辞書と照合することにより、入力画像に映る物体Objを認識することができる。
【0048】
このように、複数の認識手法に関する第1の例においては、選択部140により処理コストのより低い認識手法(第1の認識手法)が選択された場合、認識部150は、よりサイズの小さい画像から各特徴量を抽出することが可能である。これにより、選択部140により処理コストのより低い認識手法が選択された場合には、照合対象のデータ量がより小さくなることにより、認識部150は、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識することができる。
【0049】
なお、ここでは、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合、入力画像Im1Aのサイズを縮小し、選択部140により処理コストのより高い認識手法が選択された場合、入力画像Im1Aのサイズを縮小しないこととした。しかし、このような例に限らず、選択部140により処理コストのより低い認識手法が選択された場合、選択部140により処理コストのより高い認識手法が選択された場合と比較して、よりサイズが小さい画像から各特徴量を抽出するようにすればよい。
【0050】
図7は、複数の認識手法に関する第2の例を説明するための図である。図7に示すように、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量の高周波成分を無視するとともに特徴量辞書の高周波成分を無視し、各特徴量と特徴量辞書との照合を行うことができる。認識部150は、例えば、入力画像Im1Aから抽出した各特徴量及び特徴量辞書の各特徴量のうち所定の周波数を超える領域を高周波成分としてカットする。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0051】
他方、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量と特徴量辞書との照合を行うことができる。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0052】
このように、複数の認識手法に関する第2の例においては、選択部140により処理コストのより低い認識手法(第2の認識手法)が選択された場合、認識部150は、各特徴量の高周波成分を無視して各特徴量を照合することが可能である。これにより、選択部140により処理コストのより低い認識手法が選択された場合には、照合対象のデータ量がより小さくなることにより、認識部150は、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識することができる。
【0053】
なお、ここでは、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合、入力画像Im1Aから抽出した各特徴量及び特徴量辞書の各特徴量の高周波成分を無視した照合を行うこととした。しかし、このような例に限らず、選択部140により処理コストのより低い認識手法が選択された場合、選択部140により処理コストのより高い認識手法が選択された場合と比較して、より広範囲の周波数成分を各特徴量からカットするようにすればよい。
【0054】
図8は、複数の認識手法に関する第3の例を説明するための図である。図8に示すように、認識部150は、選択部140により処理コストのより低い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量とよりデータ量の小さい特徴量辞書との照合を行うことができる。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0055】
他方、認識部150は、選択部140により処理コストのより高い認識手法が選択された場合には、入力画像Im1Aから各特徴量を抽出し、抽出した各特徴量とよりデータ量の大きい特徴量辞書との照合を行うことができる。認識部150は、かかる照合により、入力画像に映る物体Objを認識することができる。
【0056】
このように、複数の認識手法に関する第3の例においては、選択部140により処理コストのより低い認識手法(第3の認識手法)が選択された場合、認識部150は、よりデータ量の小さい特徴量辞書を用いて照合することが可能である。これにより、選択部140により処理コストのより低い認識手法が選択された場合には、照合対象のデータ量がより小さくなることにより、認識部150は、処理コストのより低い認識手法を用いて、入力画像に映る物体Objを認識することができる。
【0057】
なお、データ量のより大きい特徴量辞書や、データ量のより小さい特徴量辞書などといった表現は、相対的な関係における特徴量辞書のデータ量の大小を表現しているにすぎず、絶対的なデータ量の大小を示すものではない。すなわち、2つの特徴量辞書のデータ量を比較した場合に、一方のデータ量が他方のデータ量よりも小さいということを意味している。
【0058】
[3−5.認識処理の流れ]
図9は、物体の認識処理の流れを示すフローチャートである。図9を参照しながら、物体の認識処理の流れを説明する。
【0059】
図9に示すように、まず、画像取得部120は、撮像部102(又は他の撮像装置)を用いて撮像された実空間を映す入力画像を取得する(S101)。また、検出部130は、画像取得部120から入力される入力画像に映る物体の動きに関するパラメータを検出する(S102)。
【0060】
続いて、選択部140は、パラメータを解析して処理コストを判定する(S103)。選択部140は、より低い処理コストの認識手法を選択すべきと判定した場合には(S103において「処理コスト:低」)、より低い処理コストの認識手法を選択する(S104)。他方、選択部140は、より高い処理コストの認識手法を選択すべきと判定した場合には(S103において「処理コスト:高」)、より高い処理コストの認識手法を選択する(S105)。
【0061】
続いて、認識部150は、選択部140により選択された認識手法を用いて、入力画像に映る物体を認識する(S106)。選択部140は、選択した認識手法を表示制御部160へ出力し、認識部150は、認識結果を表示制御部160へ出力する(S107)。制御部118は、入力画像の取得(S101)に戻り、画像取得部120による画像取得(S101)から認識手法及び認識結果の出力(S107)までの処理が再度行われ得る。
【0062】
[3−6.表示制御部]
表示制御部160は、認識部150により認識される物体と関連付けられる仮想オブジェクトを入力画像に重畳して表示する。仮想オブジェクトは、例えば、物体IDと仮想オブジェクトデータとが関連付けられたデータが記憶部108により記憶されている。すなわち、表示制御部160は、認識部150により取得された物体IDに関連付けられた仮想オブジェクトデータを記憶部108から取得し、取得した仮想オブジェクトデータに基づいて仮想オブジェクトを表示することができる。
【0063】
図10及び図11は、選択部140により選択された認識手法に応じた仮想オブジェクトの表示例を示す図である。図10に示すように、表示制御部160は、認識部150により認識される物体と関連付けられる仮想オブジェクトを入力画像Im1Aに重畳して表示することができる。また、表示制御部160は、仮想オブジェクトをどのような位置にどのような姿勢により表示してもよい。例えば、表示制御部160は、認識部150により取得された物体の位置(又はその物体の周囲)に、認識部150により取得された姿勢により、仮想オブジェクトを表示することができる。
【0064】
例えば、選択部140により処理コストのより低い認識手法が選択された場合には、認識部150により、処理コストのより低い認識手法を用いて入力画像Im1Aに映る物体Objが認識されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより低くすることができる。図10に示した例では、時刻t1において、入力画像1Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により鮮明度のより低い仮想オブジェクトV1が表示されている。
【0065】
その後、図10に示すように、ユーザが、時刻t2において、画像処理装置100の向きを左に移動させたとする。この場合、選択部140により処理コストのより低い認識手法が選択されることが想定されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより低くすることができる。図10に示した例では、時刻t2において、入力画像2Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により鮮明度のより低い仮想オブジェクトV2が表示されている。
【0066】
表示制御部160は、選択部140により処理コストのより低い認識手法が選択される場合に、仮想オブジェクトの残像を表示させてもよい。図10に示した例では、時刻t2において、入力画像2Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により仮想オブジェクトV1の残像が表示されている。このように、仮想オブジェクトV2とともに過去に表示された仮想オブジェクトV1の残像を表示するようにすることで、残像を見たユーザは、画像処理装置100の向きを戻し、物体Objの表示位置を所望の位置に戻すことができる。
【0067】
その後、図11に示すように、ユーザが、時刻t3において、画像処理装置100の向きを右に移動させたとする。この場合、選択部140により処理コストのより低い認識手法が選択されることが想定されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより低くすることができる。図11に示した例では、時刻t3において、入力画像3Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により鮮明度のより低い仮想オブジェクトV3が表示されている。
【0068】
なお、時刻t3においても、入力画像3Aに映る物体の認識手法として処理コストのより低い認識手法が選択部140により選択され、表示制御部160により仮想オブジェクトV2の残像が表示されている。このように、仮想オブジェクトV3とともに過去に表示された仮想オブジェクトV2の残像を表示するようにすることで、残像を見たユーザは、画像処理装置100の向きを戻し、物体Objの表示位置を所望の位置に戻すことができる。
【0069】
その後、図11に示すように、ユーザが、時刻t4において、画像処理装置100の向きを固定したとする。この場合、選択部140により処理コストのより高い認識手法が選択されることが想定されるため、表示制御部160は、仮想オブジェクトの表示の鮮明度をより高くすることができる。図11に示した例では、時刻t4において、入力画像4Aに映る物体の認識手法として処理コストのより高い認識手法が選択部140により選択され、表示制御部160により鮮明度のより高い仮想オブジェクトV4が表示されている。
【0070】
このように、表示制御部160は、選択部140により選択される認識手法に応じて、仮想オブジェクトの表示を変化させることができる。かかる制御により、仮想オブジェクトに関連付けられる物体の認識手法をユーザに把握させることが可能である。
【0071】
[3−7.表示制御処理の流れ]
図12は、出力画像の表示制御処理の流れを示すフローチャートである。図12を参照しながら、出力画像の表示制御処理の流れを説明する。
【0072】
図12に示すように、まず、表示制御部160は、画像取得部120から入力画像を取得する(S201)。また、表示制御部160は、選択部140により出力された認識手法及び認識部150により出力された認識結果を取得する(S202)。続いて、表示制御部160は、認識された物体に関連付けられる仮想オブジェクトを、認識手法に応じて入力画像に重畳することにより出力画像を生成する(S203)。続いて、表示制御部160は、出力画像を表示する(S204)。制御部118は、入力画像の取得(S201)に戻り、画像取得部120による画像取得(S201)から出力画像の表示(S204)までの処理が再度行われ得る。
【0073】
<4.まとめ>
以上説明したように、本開示の実施形態によれば、画像処理装置は、仮想オブジェクトに関連付けられる物体の認識手法をユーザに把握させることが可能である。これにより、ユーザは、例えば、表示される仮想オブジェクトを見れば、その仮想オブジェクトに関連付けられる物体の認識がどの程度の処理コストによりなされたかを把握することができる。既に述べたように、仮想オブジェクトは、例えば、認識手法に基づいてその鮮明度が変更され得る。
【0074】
また、本開示の実施形態によれば、画像処理装置は、現在認識された物体に関連付けられる仮想オブジェクトとともに過去に表示された仮想オブジェクトの残像を表示するようにすることもできる。これにより、残像を見たユーザは、画像処理装置の向きを戻し、物体の表示位置を所望の位置に戻すことができる。
【0075】
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0076】
例えば、本明細書の画像処理装置が実行する処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、画像処理装置が実行する処理における各ステップは、フローチャートとして記載した順序と異なる順序で処理されても、並列的に処理されてもよい。
【0077】
また、本明細書において説明した画像処理装置による一連の制御処理は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。ソフトウェアを構成するプログラムは、例えば、各装置の内部又は外部に設けられる記憶媒体に予め格納される。そして、各プログラムは、例えば、実行時にRAM(Random Access Memory)に読み込まれ、CPU(Central Processing Unit)などのプロセッサにより実行される。
【0078】
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置。
(2)
前記認識部は、前記入力画像から抽出される特徴量を既知の物体画像の特徴量の集合である特徴量辞書と照合することにより、前記入力画像に映る物体を認識する、(1)に記載の画像処理装置。
(3)
前記複数の認識手法は、前記認識部による照合の対象とされるデータ量が互いに異なる手法である、(1)又は(2)に記載の画像処理装置。
(4)
前記認識部は、第1の認識手法において、サイズを縮小した前記入力画像から前記特徴量辞書と照合される特徴量を抽出する、(1)から(3)のいずれか一項に記載の画像処理装置。
(5)
前記認識部は、第2の認識手法において、各特徴量の高周波成分を無視して特徴量を照合する、(1)から(3)のいずれか一項に記載の画像処理装置。
(6)
前記認識部は、第3の認識手法において、複数の特徴量辞書のうちデータ量のより小さい特徴量辞書を用いる、(1)から(3)のいずれか一項に記載の画像処理装置。
(7)
前記複数の認識手法は、前記認識部による前記特徴量の抽出アルゴリズムが互いに異なる手法である、(2)に記載の画像処理装置。
(8)
前記画像処理装置は、前記入力画像に映る物体の動きに関するパラメータを検出する検出部、をさらに備え、
前記選択部は、前記検出部により検出されるパラメータが前記入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する、
(1)から(7)のいずれか一項に記載の画像処理装置。
(9)
前記パラメータは、前記画像処理装置と前記入力画像に映る物体との間の相対的な移動量に応じたパラメータである、(8)に記載の画像処理装置。
(10)
前記パラメータは、前記画像処理装置の絶対的な移動量に応じたパラメータである、(8)に記載の画像処理装置。
(11)
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示の鮮明度を変化させる、(1)から(10)のいずれか一項に記載の画像処理装置。
(12)
前記表示制御部は、前記選択部により処理コストのより低い認識手法が選択される場合に、前記仮想オブジェクトの残像を表示させる、(1)から(11)のいずれか一項に記載の画像処理装置。
(13)
入力画像を取得することと、
複数の認識手法から前記入力画像に映る物体の認識手法を選択することと、
選択された前記認識手法を用いて、前記入力画像に映る物体を認識することと、
認識された物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示することと、
選択された前記認識手法に応じて、前記仮想オブジェクトの表示を変化させることと、
を含む、画像処理方法。
(14)
コンピュータを、
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置として機能させるためのプログラム。
【符号の説明】
【0079】
100 画像処理装置
102 撮像部
104 センサ部
106 入力部
108 記憶部
112 表示部
118 制御部
120 画像取得部
130 検出部
140 選択部
150 認識部
160 表示制御部
【特許請求の範囲】
【請求項1】
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置。
【請求項2】
前記認識部は、前記入力画像から抽出される特徴量を既知の物体画像の特徴量の集合である特徴量辞書と照合することにより、前記入力画像に映る物体を認識する、請求項1に記載の画像処理装置。
【請求項3】
前記複数の認識手法は、前記認識部による照合の対象とされるデータ量が互いに異なる手法である、請求項2に記載の画像処理装置。
【請求項4】
前記認識部は、第1の認識手法において、サイズを縮小した前記入力画像から前記特徴量辞書と照合される特徴量を抽出する、請求項3に記載の画像処理装置。
【請求項5】
前記認識部は、第2の認識手法において、各特徴量の高周波成分を無視して特徴量を照合する、請求項3に記載の画像処理装置。
【請求項6】
前記認識部は、第3の認識手法において、複数の特徴量辞書のうちデータ量のより小さい特徴量辞書を用いる、請求項3に記載の画像処理装置。
【請求項7】
前記複数の認識手法は、前記認識部による前記特徴量の抽出アルゴリズムが互いに異なる手法である、請求項2に記載の画像処理装置。
【請求項8】
前記画像処理装置は、前記入力画像に映る物体の動きに関するパラメータを検出する検出部、をさらに備え、
前記選択部は、前記検出部により検出されるパラメータが前記入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する、
請求項1に記載の画像処理装置。
【請求項9】
前記パラメータは、前記画像処理装置と前記入力画像に映る物体との間の相対的な移動量に応じたパラメータである、請求項8に記載の画像処理装置。
【請求項10】
前記パラメータは、前記画像処理装置の絶対的な移動量に応じたパラメータである、請求項8に記載の画像処理装置。
【請求項11】
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示の鮮明度を変化させる、請求項1に記載の画像処理装置。
【請求項12】
前記表示制御部は、前記選択部により処理コストのより低い認識手法が選択される場合に、前記仮想オブジェクトの残像を表示させる、請求項1に記載の画像処理装置。
【請求項13】
入力画像を取得することと、
複数の認識手法から前記入力画像に映る物体の認識手法を選択することと、
選択された前記認識手法を用いて、前記入力画像に映る物体を認識することと、
認識された物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示することと、
選択された前記認識手法に応じて、前記仮想オブジェクトの表示を変化させることと、
を含む、画像処理方法。
【請求項14】
コンピュータを、
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置として機能させるためのプログラム。
【請求項1】
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置。
【請求項2】
前記認識部は、前記入力画像から抽出される特徴量を既知の物体画像の特徴量の集合である特徴量辞書と照合することにより、前記入力画像に映る物体を認識する、請求項1に記載の画像処理装置。
【請求項3】
前記複数の認識手法は、前記認識部による照合の対象とされるデータ量が互いに異なる手法である、請求項2に記載の画像処理装置。
【請求項4】
前記認識部は、第1の認識手法において、サイズを縮小した前記入力画像から前記特徴量辞書と照合される特徴量を抽出する、請求項3に記載の画像処理装置。
【請求項5】
前記認識部は、第2の認識手法において、各特徴量の高周波成分を無視して特徴量を照合する、請求項3に記載の画像処理装置。
【請求項6】
前記認識部は、第3の認識手法において、複数の特徴量辞書のうちデータ量のより小さい特徴量辞書を用いる、請求項3に記載の画像処理装置。
【請求項7】
前記複数の認識手法は、前記認識部による前記特徴量の抽出アルゴリズムが互いに異なる手法である、請求項2に記載の画像処理装置。
【請求項8】
前記画像処理装置は、前記入力画像に映る物体の動きに関するパラメータを検出する検出部、をさらに備え、
前記選択部は、前記検出部により検出されるパラメータが前記入力画像に所定のレベルを超えて動く物体が映っていることを示している場合に、処理コストのより低い認識手法を選択する、
請求項1に記載の画像処理装置。
【請求項9】
前記パラメータは、前記画像処理装置と前記入力画像に映る物体との間の相対的な移動量に応じたパラメータである、請求項8に記載の画像処理装置。
【請求項10】
前記パラメータは、前記画像処理装置の絶対的な移動量に応じたパラメータである、請求項8に記載の画像処理装置。
【請求項11】
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示の鮮明度を変化させる、請求項1に記載の画像処理装置。
【請求項12】
前記表示制御部は、前記選択部により処理コストのより低い認識手法が選択される場合に、前記仮想オブジェクトの残像を表示させる、請求項1に記載の画像処理装置。
【請求項13】
入力画像を取得することと、
複数の認識手法から前記入力画像に映る物体の認識手法を選択することと、
選択された前記認識手法を用いて、前記入力画像に映る物体を認識することと、
認識された物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示することと、
選択された前記認識手法に応じて、前記仮想オブジェクトの表示を変化させることと、
を含む、画像処理方法。
【請求項14】
コンピュータを、
入力画像を取得する画像取得部と、
複数の認識手法から前記入力画像に映る物体の認識手法を選択する選択部と、
前記選択部により選択される認識手法を用いて、前記入力画像に映る物体を認識する認識部と、
前記認識部により認識される物体と関連付けられる仮想オブジェクトを前記入力画像に重畳して表示する表示制御部と、
を備え、
前記表示制御部は、前記選択部により選択される認識手法に応じて、前記仮想オブジェクトの表示を変化させる、
画像処理装置として機能させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2012−226529(P2012−226529A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2011−93089(P2011−93089)
【出願日】平成23年4月19日(2011.4.19)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願日】平成23年4月19日(2011.4.19)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]