対象認識装置及びそれを用いた制御装置、並びに対象認識方法
【課題】 装置の大型化及びコストの上昇を抑えつつ、画像から正確に対象を認識できる対象認識装置を提供する。
【解決手段】 肌色を有する対象(手)を認識するための対象認識装置100は、撮影によりカラー画像を生成するカラーカメラ11と、カラー画像における肌色領域を検出する肌色領域検出部12と、対象に赤外線を照射するための赤外線ランプと、入射する赤外線の強度に応じた赤外線画像を生成する赤外線カメラ15と、赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部16と、肌色領域検出部12における領域検出の結果及び赤外線領域検出部16における領域検出の結果に基づいて、対象の認識結果を出力する認識部19とを備えている。
【解決手段】 肌色を有する対象(手)を認識するための対象認識装置100は、撮影によりカラー画像を生成するカラーカメラ11と、カラー画像における肌色領域を検出する肌色領域検出部12と、対象に赤外線を照射するための赤外線ランプと、入射する赤外線の強度に応じた赤外線画像を生成する赤外線カメラ15と、赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部16と、肌色領域検出部12における領域検出の結果及び赤外線領域検出部16における領域検出の結果に基づいて、対象の認識結果を出力する認識部19とを備えている。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、認識対象の位置、形状、数等を認識する対象認識装置及びそれを用いた制御装置、並びに対象認識方法に関する。
【背景技術】
【0002】
従来から、カメラで撮影された画像に対して画像認識を行って、その画像から特定の領域を抽出して認識対象の位置や形状等を認識する対象認識装置が知られている。例えば、カメラで人の手を撮影して、そのカラー画像から手や指の領域を抽出して手の向きや形状、指の位置等を認識し、その認識結果に応じた制御信号をコンピュータに入力する対象認識装置がある。この対象認識装置により、ユーザは、キーボードやマウスといった入力デバイスを用いることなく、空中で手の動かすという自然な動作でコンピュータに対して所望の入力を行うことができる。
【0003】
この種の対象認識装置では、カメラがユーザの手を撮像してカラー画像を生成し、このカラー画像から、まず肌色領域を抽出し、次にその肌色領域の輪郭線を抽出して、指の検出や手の向きの推定を行っている(例えば、非特許文献1参照)。
【0004】
また、カメラと3次元スキャナを用いて、手の画像及び3次元情報を取得して、手の形状等を認識する装置もある(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−241833号公報
【非特許文献】
【0006】
【非特許文献1】Taehee Lee; Tobias Hollerer, “Handy AR: Markerless Inspection of Augmented Reality Objects Using Fingertip Tracking”, IEEE ISWC 2007 (11th Int’l Symposium on Wearable Computers), Boston, MA Oct. 11-13, 2007
【非特許文献2】平成18年度情報科学科知識情報科学講座卒業論文発表会予稿、 「幾何学的特徴を用いる顔領域のモデル化」、山形大学情報科学科古閑研究室、遠藤力
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記の非特許文献1の認識装置では、カラー画像から肌色領域を抽出することで、画像中の手の領域を抽出しているので、例えば背景に肌色に近い領域が含まれる場合には、そのような背景までも手の領域として抽出されていまい、手の形状や方向等の認識ができないことがある。また、照明等の影響によって、画像中の手の領域が肌色になっていない場合(例えば逆光で黒っぽくなっている場合など)には、手の領域を抽出できない。
【0008】
一方、上記の特許文献1の認識装置のように3次元スキャナを利用すれば上記の問題を解消でき、背景を排除しつつ手が画像中でどのような色に撮影されているかにかかわらず手の形状等を認識できる。しかしながら、特許文献1の認識装置では、3次元スキャナを必要とするため、装置が大掛かりになり、製造コストも高くなるという問題がある。
【0009】
そこで、本発明は、装置の大型化及びコストの上昇を抑えつつ、画像から正確に対象を認識できる対象認識装置を提供する。
【課題を解決するための手段】
【0010】
本発明の一態様は、特定色を有する対象を認識する対象認識装置であって、この対象認識装置は、撮影によりカラー画像を生成するカラーカメラと、前記カラー画像における前記特定色の領域を検出する特定色検出部と、対象に赤外線を照射するための赤外線ランプと、入射する赤外線の強度に応じた赤外線画像を生成する赤外線カメラと、前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、前記特定色検出部における領域検出の結果及び前記赤外線領域検出部における領域検出の結果に基づいて、前記対象の認識結果を出力する認識部とを備えている。
【0011】
この構成により、対象認識装置は、カラーカメラと赤外線カメラを備えるので、カラー画像から特定色を検出するのみでは認識できない対象ついても、赤外線画像から当該対象の数、形状、位置等を認識できるので、対象の認識精度を向上できる。また、このような認識精度の向上をカラーカメラと赤外線カメラという安価な構成で実現できるので、装置の大型化及びコストの上昇を抑えることができる。
【0012】
本発明の対象認識装置は、前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する。
【0013】
この構成により、輪郭の特徴(例えば全長)に基づいて、対象以外のものを排除できるので、認識精度が向上する。また、認識結果として、対象の形状、位置及び数の少なくともいずれかの情報が得られる。
【0014】
本発明の対象認識装置において、前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する。
【0015】
この構成により、対象の特定部分(例えば手の指先)がいくつあるかを認識できる。
【0016】
本発明の対象認識装置において、前記対象は人の手であり、前記特定色は肌色である。
【0017】
この構成により、ユーザの手の位置や形状を認識できる。
【0018】
本発明の対象認識装置において、前記対象は人の手であり、前記特定色は肌色であり、前記特定部分は指先である。
【0019】
この構成により、ユーザの手の指が何本立っているか等の状態を認識できる。
【0020】
本発明の別の態様は、特定色を有する対象を認識する対象認識装置であって、この対象認識装置は、撮影により第1のカラー画像を生成する第1のカラーカメラと、前記第1のカラー画像における前記特定色の領域を検出する特定色検出部と、撮影により第2のカラー画像を生成する第2のカラーカメラと、前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定部と、前記特定色検出部における領域検出の結果及び前記距離推定部にて生成された距離画像に基づいて、前記対象の認識結果を出力する認識部とを備えている。
【0021】
この構成により、対象認識装置は、2台のカラーカメラを備えてそれらのカラー画像から距離画像を生成するので、第1のカラー画像から特定色を検出するのみでは認識できない対象物の形状や位置についても、距離画像に基づいて対象を正しく認識できるので、対象の認識精度を向上できる。また、このような認識精度の向上を2台のカラーカメラという安価な構成で実現できるので、装置の大型化及びコストの上昇を抑えることができる。
【0022】
本発明の対象認識装置は、前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する。
【0023】
この構成により、輪郭の特徴(例えば全長)に基づいて、対象の輪郭以外の輪郭を排除できるので、認識精度が向上する。
【0024】
本発明の対象認識装置において、前記特定色検出部は、前記距離推定部で生成された距離画像に基づいて、前記特定色の領域ではあるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する。
【0025】
この構成により、特定色検出部は、カラー画像の色の情報のみで判断した領域から、距離から判断して対象ではないと判断される部分を除くので、より正確に対象の領域を検出できる。
【0026】
本発明の対象認識装置において、前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する。
【0027】
この構成により、対象の特定部分(例えば手の指先)がいくつあるかを認識できる。
【0028】
本発明のさらに別の態様は、対象を認識する対象認識装置であって、この対象認識装置は、対象に赤外線を照射するための赤外線ランプと、入射する赤外線の強度に応じた第1の赤外線画像を生成する第1の赤外線カメラと、前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、入射する赤外線の強度に応じた第2の赤外線画像を生成する第2の赤外線カメラと、前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、前記対象までの距離を推定する距離推定部と、前記赤外線領域検出部における領域検出の結果及び前記距離推定部における距離推定の結果に基づいて、前記対象の認識結果を出力する認識部とを備えている。
【0029】
この構成により、対象認識装置は、2台の赤外線カメラを備えて、それらの視差画像から対象までの距離を推定するので、第1の赤外線画像から赤外線強度の強い領域を検出するのみでは認識できない対象物の形状や位置についても、推定された距離に基づいて対象を正しく認識できるので、対象の認識精度を向上できる。また、このような認識精度の向上を2台の赤外線カメラという安価な構成で実現できるので、装置の大型化及びコストの上昇を抑えることができる。
【0030】
本発明の対象認識装置は、前記赤外線領域検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する。
【0031】
この構成により、輪郭の特徴(例えば全長)に基づいて、対象以外のものを排除できるので、認識精度が向上する。
【0032】
本発明の対象認識装置において、前記赤外線領域検出部は、前記距離推定部で推定された前記対象までの距離に基づいて、赤外線の強度が強い領域であるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する。
【0033】
この構成により、赤外線領域検出部は、第1の赤外線画像から得られた赤外線強度の強い領域から、距離から判断して対象ではないと判断される部分を除くので、より正確に対象の領域を検出できる。
【0034】
本発明の対象認識装置において、前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する。
【0035】
この構成により、対象の特定部分(例えば手の指先)がいくつあるかを認識できる。
【0036】
本発明のさらに別の態様は、制御装置であって、この制御装置は、上記のいずれかの対象認識装置と、前記認識部における認識結果に基づいて、制御信号を生成する制部とを備えている。
【0037】
この構成により、対象の位置、形状、数等を正確に反映した制御信号を生成できる。
【0038】
本発明のさらに別の態様は、特定色を有する対象を認識する対象認識方法であって、この方法は、撮影により対象のカラー画像を生成するとともに、対象に赤外線を照射して、入射する赤外線の強度に応じた赤外線画像を生成する画像生成ステップと、前記カラー画像における前記特定色の領域を検出する特定色検出ステップと、前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、前記特定色検出ステップにおける領域検出の結果及び前記領域検出ステップにおける領域検出の結果に基づいて、前記対象の認識結果を出力する認識ステップとを含んでいる。
【0039】
本発明のさらに別の態様は、特定色を有する対象を認識する対象認識方法であって、この方法は、第1のカラーカメラ及び第2のカラーカメラによりそれぞれ撮影して、第1のカラー画像及び第2のカラー画像を生成する画像生成ステップと、前記第1のカラー画像における前記特定色の領域を検出する特定色検出ステップと、前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定ステップと、前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップとを含んでいる。
【0040】
本発明のさらに別の態様は、対象を認識する対象認識方法であって、この方法は、対象に赤外線を照射して、第1の赤外線カメラ及び第2の赤外線カメラを用いて、それぞれ入射する赤外線の強度に応じた第1の赤外線画像及び第2の赤外線画像を生成する画像生成ステップと、前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、距離画像を生成する距離推定ステップと、前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップとを含んでいる。
【0041】
本発明のさらに別の態様は、プログラムであって、このプログラムは、コンピュータにて実行されることにより、コンピュータに、上記のいずれかの方法を行わせる。
【発明の効果】
【0042】
本発明によれば、装置の大型化及びコストの上昇を抑えつつ、画像から正確に対象を認識できる。
【図面の簡単な説明】
【0043】
【図1】本発明の第1の実施の形態における制御装置の全体構成を示すブロック図
【図2】本発明の第1の実施の形態における対象認識装置の撮像部の外観正面図
【図3A】本発明の第1の実施の形態におけるカラー画像の例を示す図
【図3B】本発明の第1の実施の形態における検出された肌色領域の例を示す図
【図3C】本発明の第1の実施の形態における輪郭抽出処理を行って得られた輪郭を示す図
【図3D】本発明の第1の実施の形態における抽出された輪郭を示す図
【図3E】本発明の第1の実施の形態における指抽出の結果を示す図
【図4A】本発明の第1の実施の形態における指を抽出する処理を説明するための図
【図4B】本発明の第1の実施の形態における指の判定を行った結果を示す図
【図4C】本発明の第1の実施の形態における指先に楕円をフィッティングした結果を示す図
【図5】本発明の第1の実施の形態における手の輪郭を構成する画素を走査したときの角度Θiの変化を示すグラフ
【図6A】本発明の第1の実施の形態における赤外線画像の例を示す図
【図6B】本発明の第1の実施の形態における検出された赤外線領域の例を示す図
【図6C】本発明の第1の実施の形態における輪郭抽出処理を行って得られた輪郭を示す図
【図6D】本発明の第1の実施の形態における抽出された輪郭を示す図
【図6E】本発明の第1の実施の形態における指抽出の結果を示す図
【図7】本発明の第2の実施の形態の制御装置の全体構成を示すブロック図
【図8】本発明の第3の実施の形態の制御装置の全体構成を示すブロック図
【図9】本発明の第3の実施の形態における対象認識装置の撮像部の外観正面図
【図10A】本発明の第3の実施の形態における第1のカラー画像の例を示す図
【図10B】本発明の第3の実施の形態における検出された肌色領域の例を示す図
【図10C】本発明の第3の実施の形態における肌色領域のうち距離の遠い領域を排除した結果を示す図
【図11】本発明の第4の実施の形態の制御装置の全体構成を示すブロック図
【図12】本発明の第4の実施の形態における対象認識装置の撮像部の外観正面図
【図13A】本発明の第4の実施の形態における第1の赤外線画像の例を示す図
【図13B】本発明の第4の実施の形態における検出された赤外線領域の例を示す図
【図13C】本発明の第4の実施の形態における赤外線領域のうち距離の遠い領域を排除した結果を示す図
【発明を実施するための形態】
【0044】
以下、本発明の実施の形態の対象認識装置及びそれを備えた制御装置について、図面を参照しながら説明する。以下では、人の手の指の数を認識する対象認識装置と、対象認識装置の認識結果に基づいてコンピュータを操作するための制御信号を生成する制御部とを備えた制御装置を例として説明する。この制御装置は、コンピュータに対するインターフェースとして用いることができる。
【0045】
(第1の実施の形態)
図1は、第1の実施の形態の制御装置の全体構成を示すブロック図である。制御装置1は、対象認識装置100と制御部50とからなる。対象認識装置100は、肌色の人の手を認識する。対象認識装置100は、カラーカメラ11と、肌色領域検出部12と、輪郭抽出部13と、指抽出部14とを備えている。この構成により、カラーカメラ11で撮影して得られたカラー画像から手の指を抽出する。対象認識装置100は、さらに、赤外線ランプ20と、赤外線カメラ15と、赤外線領域検出部16と、輪郭検出部17と、指抽出部18とを備えている。この構成により、赤外線カメラ15で撮影して得られた赤外線画像から手の指を抽出する。
【0046】
図2は、対象認識装置100の撮像部21の外観正面図である。図2において、レンズ201は、カラーカメラ11のレンズであり、レンズ202は、赤外線カメラ15のレンズである。赤外線カメラ15のレンズ202には、可視光カットフィルタが被せられる。赤外線カメラ15のレンズ202の周囲には、赤外光を発光する複数の赤外線ランプ20としての赤外線LED203が配置されている。図2に示すように、対象認識装置100において、カラーカメラ11と赤外線カメラ15とは、近接して設けられている。これにより、カラーカメラ11の撮像画像と赤外線カメラ15の撮像画像とでは、画像内のほぼ同一の位置において同一の被写体部分を撮像したものとなる。ユーザは、撮像部21が自らの手を撮影できるように、撮像部21に対して手をかざす。
【0047】
図1に戻って、カラーカメラ11は、ユーザの手を撮影することによりカラー画像を生成する。このために、カラーカメラ11は、光電変換素子が2次元配列された撮像素子を有している。撮像素子には、レンズ等を介して外部の光が入射する。カラーカメラ11は、各画素について、入射した光を光電変換して、RBGデータを生成し、これをカラー画像として出力する。図3Aは、カラー画像の例を示す図である。図3Aの例では、ユーザは、撮像部21に右手をかざしている。また、図3Aの例では、ユーザの手の他に、ユーザの顔や首、及び背景も撮影されている。
【0048】
肌色領域検出部12は、カラーカメラ11にて生成されたカラー画像における肌色の領域を検出する。具体的には、肌色領域検出部12は、非特許文献2にあるように、カラーカメラ11から出力されたカラー画像であるRGBデータをLUVデータに変換し、LUV空間において所定の閾値の範囲内にある値を持つ領域を肌色領域として検出する。図3Bは、図3Aのカラー画像に対して、肌色領域検出部12において肌色検出を行った結果、検出された肌色領域の例を示す図である。図3Bの例では、ユーザの手の人差し指部分は背景の肌色部分と一体となって肌色領域として検出されている。また、図3Bの例では、ユーザの手のほか、ユーザの顔や首、及び背景の肌色の物体も肌色領域として検出されている。
【0049】
輪郭抽出部13は、肌色領域検出部12にて検出された肌色領域の輪郭を求め、そこから手の輪郭を抽出する。ここで、輪郭を示すデータは、輪郭を構成する画素が順序付けされたデータである。このデータにおいて、任意の一の画素と順序が連続する画素は、当該一の画素を取り囲む8つの画素のいずれかである。なお、輪郭を示すデータは、輪郭を構成する画素の座標値を順序に従って並べたベクトルの形式で表される。
【0050】
図3Cは、肌色領域検出部12にて検出された図3Bの肌色領域について、輪郭抽出処理を行って得られた輪郭を示す図である。図3Bの例では、一部に背景を含む手、顔及び首、及び背景の物体がそれぞれ肌色領域として検出されているので、これに従って輪郭抽出部13においても肌色領域として検出された一部に背景を含む手、顔及び首、及び背景の物体の領域の輪郭が求められる。
【0051】
輪郭抽出部13は、このようにして求められた輪郭から、手の領域の輪郭以外の輪郭を排除するために、まず、各輪郭の全長を求める。そして、全長が最も長いものを手の輪郭として抽出する。図3Dは、全長が最も長いものとして抽出された輪郭を示す図である。即ち、図3Dでは、一部に背景を含む手の輪郭が抽出されており、この段階で、顔及び首や背景の一部の肌色領域は排除されている。輪郭抽出部13は、図3Dの輪郭を示すデータを指抽出部14に出力する。
【0052】
指抽出部14は、輪郭抽出部13にて抽出された手の輪郭に基づいて、指の形状及び位置の情報を含む抽出結果を出力する。図4A〜図4C及び図5は、指を抽出する処理を説明するための図である。図4A〜図4Cは、輪郭抽出部13にて抽出された手の輪郭の指先部分を拡大したものである。図4A〜図4Cにおいて、1つの点は、1つの画素を示している。上記のように、輪郭を示すデータでは、画素の座標値が順序付けられて並んでいる。指抽出部14は、輪郭を構成する画素をこの順序に従って順に走査していく。図4Aに示すように、指抽出部14は、注目する第i番目の画素Ciと、その画素から一定の数d(図4Aの例では、d=30)だけ前の順序の画素Ci−dとを結ぶ線と、画素Ciと、その画素からdだけ後の順序の画素Ci+dとを結ぶ線とがなす角の角度Θiを求める。
【0053】
そして、指抽出部14は、角度Θiが所定の閾値(例えば、70度)を下回る否かを判定する。図4Bは、このようにして角度Θiを順に判定していった結果を示す図である。図4Bの例では、上部の合計11個の画素(点を○で囲んだ画素)が上記の条件を満たしている。指抽出部14は、このようにして注目画素Ciの角度Θiが閾値を下回るか否かを判定しながら輪郭を走査していき、最終的に角度Θiが閾値を下回る画素Ciが5以上連続した箇所があればその箇所を指先であると判断する。図4Bの例では、上記の条件を満たす画素が11個連続しているので、この部分を指先と判断する。なお、本実施の形態では、指先と判断するための角度Θiが閾値を下回る連続した画素Ciの数を5としたが、この数は5に限られない。
【0054】
図5は、手の輪郭を構成する画素Ciを順次走査しながら5本の指を検出したときの、角度Θiの変化を示すグラフである。このグラフでは、横軸に輪郭における位置iをとり、縦軸に角度Θiをとってある。図5の例では、閾値を85度としてある。この閾値を下回る5つの谷部分(図5中の○で囲った部分)が指の先端部分に相当する。なお、輪郭線は1周する閉曲線であるので、図5のグラフの左隅と右隅とは輪郭線上の同一点を表している。
【0055】
指抽出部14は、指先を見つけ出すと、指先と判断された部分で楕円のフィッティングを行う。具体的には、指抽出部14は、角度Θiが閾値を下回る連続する画素Ci及びその周囲の何点かと最もよくフィッティングする楕円を設定する。図4Cは、楕円をフィッティングした結果を示す図である。指抽出部14は、フィッティングされた楕円の長辺、短辺の長さ及びそれらの比が所定の閾値の範囲内にある場合に、この楕円がフィッティングされた部分を指(の先端)であると判断する。楕円が大きすぎたり、扁平しすぎていたりする場合には、指でない部分を誤検出した可能性が高いため、この場合は指とは判断しない。
【0056】
指抽出部14は、上記の処理をすべての指について行う。図3Eは、指抽出部14による指抽出の結果を示す図である。図3Eに示すように、人差し指の輪郭が背景の長方形領域に吸収されてしまっている部分については、角度Θiが閾値を下回る画素Ciが5以上連続するという上記の条件を満たさないので、指とは検出されていない。指抽出部14は、指先にフィッティングした楕円の位置(中心の座標)と形状(長軸及び短軸の長さ及び方向)を表すデータを認識部19に出力する。
【0057】
対象認識装置100は、さらに、赤外線カメラ15と、赤外線領域検出部16と、輪郭抽出部17と、指抽出部18とを備えている。赤外線カメラ15は、赤外線ランプ20が、赤外線カメラ15の撮影方向に向けて赤外線を照射している状態で、入射する赤外線の強度に応じた赤外線画像を生成する。赤外線カメラ15は、カラーカメラ11と同じサイズ、同じ画素数の撮像素子を有しており、カラーカメラ11と同時に被写体を撮影する。カラーカメラ11と同様に、赤外線カメラ15はレンズを備えており、レンズを通過した赤外線が撮像素子に入射するように構成されている。赤外線カメラ15は、さらにレンズの前面に可視光カットフィルタを有しており、可視光はレンズを通して撮像素子に至らないように構成されている。撮像素子は、入射した赤外線を光電変換して、赤外線強度に応じた画素値を持つ各画素のデータを赤外線画像として出力する。
【0058】
図6Aは、図3のカラー画像と同時に撮像された赤外線画像を示す図である。図6Aの例では、ユーザの手、腕の一部、背景の一部(部屋に入り込んだ外光に照らされた壁)の領域において赤外線強度が比較的強い赤外線画像が得られている。なお、図6Aの例では便宜上、比較的赤外線強度の強い領域を輪郭で囲って示したが、実際には赤外線画像における各画素は赤外線強度に応じた画素値を持っている。なお、赤外線強度に対して色温度を定義して、赤外線画像を色温度で表現すると理解しやすくなる。また、上述のように、赤外線カメラ15の付近からは赤外線の撮像方向に赤外光が発光されているが、この赤外光はそれほど強くなく、ある程度の距離だけ離れれば、そこからの反射赤外光は、撮像素子でほとんど感知されなくなる。
【0059】
赤外線領域検出部16は、赤外線カメラ15で生成された赤外線画像に基づいて、赤外線強度の強い領域(以下、「赤外線領域」という)を検出する。具体的には、赤外線領域検出部16は、赤外線画像において画素値が所定の閾値を超える領域を赤外線領域として検出する。図6Bは、図6Aの赤外線画像に対して、赤外線領域検出を行った結果、検出された赤外線領域の例を示す図である。図6Bの例では、ユーザの手のほか、ユーザの腕の一部、背景の一部(外光に照らされた壁)が赤外線領域として検出されている。
【0060】
輪郭抽出部17は、赤外線領域検出部16にて検出された領域の輪郭を求め、そこから手の輪郭を抽出する。輪郭抽出部17における処理は、輪郭抽出部13における処理と同じである。図6Cは、赤外線領域検出部16にて検出された図6Bの赤外線領域について、輪郭抽出処理を行って得られた輪郭を示す図である。図6Dは、輪郭抽出部17が、求めた輪郭のうち、全長の短い輪郭を排除して抽出された輪郭を示す図である。腕部分及び背景の一部の赤外線領域は、その輪郭の全長が比較的短いので、手の輪郭としては抽出されていない。輪郭抽出部17は、図6Dの輪郭を示すデータを指抽出部18に出力する。
【0061】
指抽出部18は、輪郭抽出部17にて抽出された手の輪郭に基づいて、指の形状及び位置の情報を含む抽出結果を出力する。指抽出部18が指を抽出する処理も、指抽出部14における処理と同じであるので、説明を省略する。図6Eは、指抽出部18による指抽出の結果を示す図である。なお、ここでは、人差し指の先に楕円がフィッティングされている。指抽出部18は、指先にフィッティングした楕円の位置(中心の座標)と形状(長軸及び短軸の長さ及び向き)を表すデータを認識部19に出力する。
【0062】
認識部19は、指抽出部14における抽出結果及び指抽出部18における抽出結果を考慮して、最終的な指の認識を行い、認識結果として指の数の情報を出力する。認識部19が2つの抽出結果に基づいて認識結果を得る方法は様々考えられる。例えば、上記の例では、人差し指を除く他の4本の指については、カラーカメラ11のカラー画像から検出された指と、赤外線カメラ15の赤外線画像から検出された指とは、ほぼ一致しているが、人差し指については、赤外線画像のみで抽出され、カラー画像では抽出されていない。このような場合には、本実施の形態の認識部19は、少なくとも一方の抽出結果で抽出されている指をユーザの指であると認識する。他の例の認識部19は、両方の抽出結果で抽出されている指のみをユーザの指であると認識する。さらに他の例の認識部19は、両方の抽出結果で抽出されている指をユーザの指であると認識するとともに、一方の抽出結果でしか抽出されていない指については、それが所定の条件を満たした場合に、それを指であると認識する。例えば、両方の検出結果で検出されている他の指先と当該一方の抽出結果のみで抽出されている指先との位置関係が所定の条件を満たすときに、それをユーザの指であると認識する。
【0063】
また、認識部19は、キャリブレーション機能を用いて、2つの抽出結果に基づいて認識結果を得てもよい。この場合は、予め、ユーザに指を1本から5本まで順に提示してもらって、また、複数の制御信号の各々に応じた形状及び位置で手を提示してもらい、これらをカラーカメラ11及び赤外線カメラ15でそれぞれ撮影して、カラー画像及び赤外線画像を生成する。そして、認識部19は、これらのカラー画像及び赤外線画像を所定の指の本数に対応する標準の情報として記憶しておく。認識部19は、2つの抽出結果に基づいて指の認識を行う場合には、2つの抽出結果をそれぞれの標準の情報と比較して、より標準の情報に近いほうの検出結果を採用する。認識部19は、以上で説明した方法以外の方法で2つの抽出結果に基づいて指の認識を行ってよい。
【0064】
制御部50は、指の本数に応じた制御信号を生成して出力する。この制御信号はコンピュータに送られて、コンピュータの操作を制御することになる。例えば、制御部50は、指の本数がゼロ(手を握り締めている状態)の場合は、マウスをホールドする制御信号を出力し、指の本数が5本の場合はマウスをリリースする制御信号を出力する。このような指の本数と制御信号との対応付けも種々の実施の形態が考えられる。
【0065】
なお、認識部19が指の本数と指先に設定した楕円の位置の情報を含む認識結果を出力して、制御部50がその認識結果に応じた制御信号を出力してもよい。この場合は、手を広げて縦にする場合と横にする場合とで異なる制御信号を生成できることになる。
【0066】
以上のように、本実施の形態の対象認識装置100によれば、1つのカラーカメラと1つの赤外線カメラという安価かつ簡易な構造で、背景色等に係らず、正確に手の指を検出でき、制御装置1は、ユーザの手の形状や位置を正確に反映させた制御信号を生成できる。
【0067】
(第2の実施の形態)
次に、本発明の第2の実施の形態を説明する。図7は、本発明の第2の実施の形態の制御装置の全体構成を示すブロック図である。本実施の形態の制御装置2において、第1の実施の形態の制御装置1と同一の構成については、同一の符号を付して、適宜説明を省略する。
【0068】
制御装置2は、対象認識装置200と制御部50とからなる。対象認識装置200は、カラーカメラ11と、肌色領域検出部12と、赤外線カメラ15と、赤外線領域検出部16とを備えている。これらの構成は、第1の実施の形態の対応する部分の構成と同じである。本実施の形態の対象認識装置200は、肌色領域検出部12の検出結果と、赤外線領域検出部16の検出結果とに基づいて、ユーザの手の領域を検出する手領域検出部22を備えている。即ち、第1の実施の形態の対象認識装置100では、カラー画像と赤外線画像のそれぞれについて指を抽出した上で、認識部19にて2つの指抽出の結果を考慮して最終的な指の認識結果を得ていたが、本実施の形態では、カラー画像から肌色領域を検出して、赤外線画像から赤外線領域を検出して、それらの結果に基づいて、手領域を検出した上で、輪郭抽出、指抽出、認識という後続の処理を行う。
【0069】
手領域検出部22には、肌色領域検出部12にて検出された肌色の領域と、赤外線領域検出部16で検出された赤外線領域とがオーバラップする領域を手領域として検出する。即ち、手領域検出部22は、カラー画像及び赤外線画像のいずれにおいても検出された領域を手領域とする。なお、オーバラップする領域が複数ある場合には、面積の大きい方の領域のみを残して、面積の小さい方の領域を無視してもよいし、複数の領域をそのまま手領域として出力してもよい。
【0070】
輪郭抽出部13は、第1の実施の形態の輪郭抽出部13、17と同様にして、手領域について輪郭を求め、それをユーザの手の輪郭として抽出する。ここで、手領域検出部22にて手領域として検出された領域が複数ある場合には、第1の実施の形態と同様に、全長が最も長い輪郭をユーザの手の輪郭として抽出する。指抽出部14も、第1の実施の形態の指抽出部14、18と同様にして指の検出を行い、検出された指に楕円をフィッティングして、指にフィッティングした楕円の情報を出力する。認識部23は、指抽出部14から得た楕円の情報に基づいて、認識結果として、指の数を含む情報を制御部50に出力する。但し、本実施の形態の認識部23は、第1の実施の形態の認識部19と異なり、複数の指抽出の結果から指の数等を判断する必要はなく、1つの指抽出の結果に基づいて、上記のキャリブレーション機能を利用するなどして指の数を認識する。制御部50は、第1の実施の形態と同様である。
【0071】
本実施の形態によっても、対象認識装置200は、1つのカラーカメラと1つの赤外線カメラという安価かつ簡易な構造で、背景色等に係らず、正確に手の指を検出でき、制御装置2は、ユーザの手の形状や位置を正確に反映させた制御信号を生成できる。また、本実施の形態では、輪郭抽出や指抽出の処理をカラー画像及び赤外線画像のそれぞれについて行う必要がないので、少ないリソースで対象を認識できる。
【0072】
(第3の実施の形態)
次に、本発明の第3の実施の形態を説明する。図8は、本発明の第3の実施の形態の制御装置の全体構成を示すブロック図である。本実施の形態の制御装置3において、第1、第2の実施の形態の制御装置1、2と同一の構成については、同一の符号を付して、適宜説明を省略する。
【0073】
制御装置3は、対象認識装置300と制御部50とからなる。対象認識装置300は、第1のカラーカメラ11−1と、手領域検出部24と、第2のカラーカメラ11−2と、距離推定部25とを備えている。第1のカラーカメラ11−1と第2のカラーカメラ11−2は一体的に構成されている。
【0074】
図9は、対象認識装置300の撮像部26の外観正面図である。レンズ201−1は、第1のカラーカメラ11−1のレンズであり、レンズ201−2は、第2のカラーカメラのレンズである。図9に示すように、対象認識装置300において、第1のカラーカメラ11−1と第2のからーカメラ11−2とは、近接して設けられている。これにより、第1のカラーカメラ11−1で得られたカラー画像(第1のカラー画像)と第2のカラーカメラ11−2で得られたカラー画像(第2のカラー画像)とでは、画像内のほぼ同一の位置において同一の被写体部分を撮像したものとなる。
【0075】
第1のカラーカメラ11−1にて得られた第1のカラー画像は、手領域検出部24及び距離推定部25に入力される。第2のカラーカメラ11−2にて得られた第2のカラー画像は、距離推定部25に入力される。距離推定部25は、第1のカラー画像及び第2のカラー画像の視差に基づいて、ステレオ法により被写体までの距離を求めて、距離画像を生成する。距離画像とは、各画素の画素値がその画素に現れている被写体までの距離を表している画像である。
【0076】
図10Aは、第1のカラーカメラ11−1にて撮像された第1のカラー画像の例を示す図である。このカラー画像には、ユーザの手と、その背景として天井(画像の上側)及び後方の壁(画像の下側)が写りこんでいる。手領域検出部24は、この第1のカラー画像に対して肌色の検出処理を行う。肌色の検出は、第1の実施例で説明したのと同様の方法で行う。図10Bは、手領域検出部24にて検出された肌色領域を示す図である。図10Bの例では、天井がユーザの手と重なって肌色領域として検出されている。
【0077】
手領域検出部24は、距離推測部25にて得られた距離画像を用いて、検出された肌色領域から手の部分のみを検出する。このために、手領域検出部24は、肌色領域として検出された領域のうち、距離画像における距離が閾値以上である領域を排除する。図10Bの例では、肌色として検出されている天井は距離が閾値以上であるため、排除される。図10Cは、肌色の領域のうち距離の遠い領域を排除した結果を示す図である。図10Cに示すように、肌色として検出された領域から、距離の遠い領域を排除した結果、ユーザの手の領域が天井の領域と切り離されて検出されている。
【0078】
手領域検出部24は、上記のようにして、検出された手の部分のみの肌色領域を輪郭抽出部13に出力する。輪郭抽出部13は、この肌色領域から輪郭を抽出して、指抽出部14に出力する。指抽出部14は、手の輪郭から指の先端を抽出して、指の先端に楕円をフィッティングして、手の輪郭及び楕円の情報を認識部23に出力する。認識部23は、指抽出部14から得た情報を元に、指の数を認識して、認識結果を制御部50に出力する。
【0079】
本実施の形態の対象認識装置300によれば、2つのカラーカメラという安価かつ簡易な構造で、背景色等に係らず、正確に手の指を検出でき、制御装置3は、ユーザの手の形や位置を正確に反映させた制御信号を生成できる。
【0080】
(第4の実施の形態)
次に、本発明の第4の実施の形態を説明する。図11は、本発明の第4の実施の形態の制御装置の全体構成を示すブロック図である。本実施の形態の制御装置4において、第1、第2、第3の実施の形態の制御装置1、2、3と同一の構成については、同一の符号を付して、適宜説明を省略する。図11と図8とを比較して分かるように、本実施の形態の制御装置4は、第3の実施の形態の制御装置3の第1及び第2のカラーカメラ11−1、11−2が、第1及び第2の赤外線カメラ15−1、15−2に置き換わったものである。
【0081】
制御装置4は、対象認識装置400と制御部50とからなる。対象認識装置400は、第1の赤外線カメラ15−1と、手領域検出部27と、第2の赤外線カメラ15−2と、距離推定部25とを備えている。第1の赤外線カメラ15−1と第2の赤外線カメラ15−2は一体的に構成されている。
【0082】
図12は、対象認識装置300の撮像部28の外観正面図である。レンズ202−1は、第1の赤外線カメラ15−1のレンズであり、レンズ202−2は、第2の赤外線カメラ15−2のレンズである。レンズ202−1及びレンズ202−2の周りには複数の赤外線LED203が配置されている。図12に示すように、対象認識装置300において、第1の赤外線カメラ15−1と第2の赤外線カメラ15−2とは、近接して設けられている。これにより、第1の赤外線カメラ15−1で得られた赤外線画像(第1の赤外線画像)と第2の赤外線カメラ15−2で得られた赤外線画像(第2の赤外線画像)とでは、画像内のほぼ同一の位置において同一の被写体部分を撮像したものとなる。
【0083】
第1の赤外線カメラ15−1にて得られた第1の赤外線画像は、手領域検出部27及び距離推定部25に入力される。第2の赤外線カメラ15−2にて得られた第2の赤外線画像は、距離推定部25に入力される。距離推定部25は、第1のカラー画像及び第2のカラー画像の視差に基づいて、ステレオ法により被写体までの距離を求めて、距離画像を生成する。
【0084】
図13Aは、第1の赤外線カメラ15−1にて撮像された第1の赤外線画像の例を示す図である。この赤外線画像では、ユーザの手と、顔と、上半身とが赤外線の強度の強い領域として撮像されている。図13Aでは、第1の実施の形態で説明した図6Aと同様に、便宜上、比較的赤外線強度の強い領域を輪郭で囲って示したが、実際には赤外線画像における各画素は赤外線強度に応じた画素値を持っている。
【0085】
手領域検出部27は、この第1の赤外線画像に対して赤外線領域の検出処理を行う。赤外線領域の検出は、第1の実施例で説明したのと同様の方法で行う。図13Bは、手領域検出部27にて検出された赤外線領域を示す図である。図13Bの例では、ユーザの手と、顔の一部と上半身の一部とがすべて一体となって赤外線領域として検出されている。
【0086】
手領域検出部27は、距離推定部25にて得られた距離画像を用いて、検出された赤外線領域から手の部分のみを検出する。このために、手領域検出部27は、赤外線領域として検出された領域のうち、距離画像における距離が閾値以上である領域を排除する。図13Bの例では、赤外線領域として検出されている顔及び上半身は距離が閾値以上であるため、排除される。図13Cは、赤外線領域のうち距離の遠い領域を排除した結果を示す図である。図13Cに示すように、赤外線領域として検出された領域から距離の遠い領域を排除した結果、ユーザの手の領域が顔や上半身の領域と切り離されて検出されている。
【0087】
手領域検出部27は、上記のようにして、検出された手の部分のみの赤外線領域を輪郭抽出部13に出力する。輪郭抽出部13は、この赤外線領域から輪郭を抽出して、指抽出部14に出力する。指抽出部14は、手の輪郭から指の先端を抽出して、指の先端に楕円をフィッティングして、手の輪郭及び楕円の情報を認識部23に出力する。認識部23は、指抽出部14から得た情報を元に、指の数や位置等を認識して、認識結果を制御部50に出力する。
【0088】
本実施の形態の対象認識装置400によれば、2つの赤外線カメラという安価かつ簡易な構造で、背景色に係らず、正確に手の指を検出でき、制御装置4は、ユーザの手の形状や位置を正確に反映させた制御信号を生成できる。
【0089】
以上、本発明の実施の形態を説明したが、上記の説明は例示に過ぎず、本発明は他の実施の形態でも実施される。
【0090】
例えば、上記の実施の形態の対象認識装置は、認識結果として指の数の情報を出力したが、対象認識装置が認識結果として出力する情報は、指の数に限られない。例えば、対象認識装置が、指抽出部で得られた指の形状や位置の情報を認識結果として出力してもよい。さらに、対象認識装置が、輪郭抽出部で抽出された手の輪郭の情報を認識結果として出力してもよい。また、対象認識装置が、肌色領域検出部や赤外線領域検出部で検出した領域の情報を認識結果として出力してもよい。また、対象認識装置が、これらの情報を加工した情報を認識結果として出力してもよい。例えば、対象認識装置が、輪郭抽出部で抽出された手の輪郭の長さの情報を認識結果として出力してもよい。また、例えば、対象認識装置が、肌色領域検出部や赤外線領域検出部で検出した領域の面積の情報を認識結果として出力してもよい。さらに、第3及び第4の実施の形態のように、対象認識装置が、手までの距離を推定する構成を有している場合には、この距離の情報を認識結果の情報に付加して出力してもよい。
【0091】
また、上記の実施の形態では、対象認識装置は、1つのカラーカメラと1つの赤外線カメラ(第1及び第2の実施の形態)、又は2台のカラーカメラ(第3の実施の形態)、又は2台の赤外線カメラ(第4の実施の形態)という合計2台のカメラを備えていたが、合計3台以上のカメラを備えていてもよい。
【0092】
さらに、上記の実施の形態では、カラー画像から肌色の領域を検出する例を説明したが、認識対象が他の色を有している場合には、当該他の色を検出してよい。
【産業上の利用可能性】
【0093】
本発明は、装置の大型化及びコストの上昇を抑えつつ、画像から正確に対象を認識できるという優れた効果を有し、認識対象の数、位置、形状等を認識する対象認識装置等に適用することができる。
【符号の説明】
【0094】
1、2、3、4 制御装置
100、200、300、400 対象認識装置
11、11−1、11−2 カラーカメラ
12 肌色領域検出部
13 輪郭抽出部
14 指抽出部
15、15−1、15−2 赤外線カメラ
16 赤外線領域検出部
17 輪郭抽出部
18 指抽出部
19、23 認識部
20 赤外線ランプ
21、26、28 撮像部
22、24、27 手領域検出部
25 距離推定部
50 制御部
【技術分野】
【0001】
本発明は、認識対象の位置、形状、数等を認識する対象認識装置及びそれを用いた制御装置、並びに対象認識方法に関する。
【背景技術】
【0002】
従来から、カメラで撮影された画像に対して画像認識を行って、その画像から特定の領域を抽出して認識対象の位置や形状等を認識する対象認識装置が知られている。例えば、カメラで人の手を撮影して、そのカラー画像から手や指の領域を抽出して手の向きや形状、指の位置等を認識し、その認識結果に応じた制御信号をコンピュータに入力する対象認識装置がある。この対象認識装置により、ユーザは、キーボードやマウスといった入力デバイスを用いることなく、空中で手の動かすという自然な動作でコンピュータに対して所望の入力を行うことができる。
【0003】
この種の対象認識装置では、カメラがユーザの手を撮像してカラー画像を生成し、このカラー画像から、まず肌色領域を抽出し、次にその肌色領域の輪郭線を抽出して、指の検出や手の向きの推定を行っている(例えば、非特許文献1参照)。
【0004】
また、カメラと3次元スキャナを用いて、手の画像及び3次元情報を取得して、手の形状等を認識する装置もある(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−241833号公報
【非特許文献】
【0006】
【非特許文献1】Taehee Lee; Tobias Hollerer, “Handy AR: Markerless Inspection of Augmented Reality Objects Using Fingertip Tracking”, IEEE ISWC 2007 (11th Int’l Symposium on Wearable Computers), Boston, MA Oct. 11-13, 2007
【非特許文献2】平成18年度情報科学科知識情報科学講座卒業論文発表会予稿、 「幾何学的特徴を用いる顔領域のモデル化」、山形大学情報科学科古閑研究室、遠藤力
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記の非特許文献1の認識装置では、カラー画像から肌色領域を抽出することで、画像中の手の領域を抽出しているので、例えば背景に肌色に近い領域が含まれる場合には、そのような背景までも手の領域として抽出されていまい、手の形状や方向等の認識ができないことがある。また、照明等の影響によって、画像中の手の領域が肌色になっていない場合(例えば逆光で黒っぽくなっている場合など)には、手の領域を抽出できない。
【0008】
一方、上記の特許文献1の認識装置のように3次元スキャナを利用すれば上記の問題を解消でき、背景を排除しつつ手が画像中でどのような色に撮影されているかにかかわらず手の形状等を認識できる。しかしながら、特許文献1の認識装置では、3次元スキャナを必要とするため、装置が大掛かりになり、製造コストも高くなるという問題がある。
【0009】
そこで、本発明は、装置の大型化及びコストの上昇を抑えつつ、画像から正確に対象を認識できる対象認識装置を提供する。
【課題を解決するための手段】
【0010】
本発明の一態様は、特定色を有する対象を認識する対象認識装置であって、この対象認識装置は、撮影によりカラー画像を生成するカラーカメラと、前記カラー画像における前記特定色の領域を検出する特定色検出部と、対象に赤外線を照射するための赤外線ランプと、入射する赤外線の強度に応じた赤外線画像を生成する赤外線カメラと、前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、前記特定色検出部における領域検出の結果及び前記赤外線領域検出部における領域検出の結果に基づいて、前記対象の認識結果を出力する認識部とを備えている。
【0011】
この構成により、対象認識装置は、カラーカメラと赤外線カメラを備えるので、カラー画像から特定色を検出するのみでは認識できない対象ついても、赤外線画像から当該対象の数、形状、位置等を認識できるので、対象の認識精度を向上できる。また、このような認識精度の向上をカラーカメラと赤外線カメラという安価な構成で実現できるので、装置の大型化及びコストの上昇を抑えることができる。
【0012】
本発明の対象認識装置は、前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する。
【0013】
この構成により、輪郭の特徴(例えば全長)に基づいて、対象以外のものを排除できるので、認識精度が向上する。また、認識結果として、対象の形状、位置及び数の少なくともいずれかの情報が得られる。
【0014】
本発明の対象認識装置において、前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する。
【0015】
この構成により、対象の特定部分(例えば手の指先)がいくつあるかを認識できる。
【0016】
本発明の対象認識装置において、前記対象は人の手であり、前記特定色は肌色である。
【0017】
この構成により、ユーザの手の位置や形状を認識できる。
【0018】
本発明の対象認識装置において、前記対象は人の手であり、前記特定色は肌色であり、前記特定部分は指先である。
【0019】
この構成により、ユーザの手の指が何本立っているか等の状態を認識できる。
【0020】
本発明の別の態様は、特定色を有する対象を認識する対象認識装置であって、この対象認識装置は、撮影により第1のカラー画像を生成する第1のカラーカメラと、前記第1のカラー画像における前記特定色の領域を検出する特定色検出部と、撮影により第2のカラー画像を生成する第2のカラーカメラと、前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定部と、前記特定色検出部における領域検出の結果及び前記距離推定部にて生成された距離画像に基づいて、前記対象の認識結果を出力する認識部とを備えている。
【0021】
この構成により、対象認識装置は、2台のカラーカメラを備えてそれらのカラー画像から距離画像を生成するので、第1のカラー画像から特定色を検出するのみでは認識できない対象物の形状や位置についても、距離画像に基づいて対象を正しく認識できるので、対象の認識精度を向上できる。また、このような認識精度の向上を2台のカラーカメラという安価な構成で実現できるので、装置の大型化及びコストの上昇を抑えることができる。
【0022】
本発明の対象認識装置は、前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する。
【0023】
この構成により、輪郭の特徴(例えば全長)に基づいて、対象の輪郭以外の輪郭を排除できるので、認識精度が向上する。
【0024】
本発明の対象認識装置において、前記特定色検出部は、前記距離推定部で生成された距離画像に基づいて、前記特定色の領域ではあるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する。
【0025】
この構成により、特定色検出部は、カラー画像の色の情報のみで判断した領域から、距離から判断して対象ではないと判断される部分を除くので、より正確に対象の領域を検出できる。
【0026】
本発明の対象認識装置において、前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する。
【0027】
この構成により、対象の特定部分(例えば手の指先)がいくつあるかを認識できる。
【0028】
本発明のさらに別の態様は、対象を認識する対象認識装置であって、この対象認識装置は、対象に赤外線を照射するための赤外線ランプと、入射する赤外線の強度に応じた第1の赤外線画像を生成する第1の赤外線カメラと、前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、入射する赤外線の強度に応じた第2の赤外線画像を生成する第2の赤外線カメラと、前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、前記対象までの距離を推定する距離推定部と、前記赤外線領域検出部における領域検出の結果及び前記距離推定部における距離推定の結果に基づいて、前記対象の認識結果を出力する認識部とを備えている。
【0029】
この構成により、対象認識装置は、2台の赤外線カメラを備えて、それらの視差画像から対象までの距離を推定するので、第1の赤外線画像から赤外線強度の強い領域を検出するのみでは認識できない対象物の形状や位置についても、推定された距離に基づいて対象を正しく認識できるので、対象の認識精度を向上できる。また、このような認識精度の向上を2台の赤外線カメラという安価な構成で実現できるので、装置の大型化及びコストの上昇を抑えることができる。
【0030】
本発明の対象認識装置は、前記赤外線領域検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する。
【0031】
この構成により、輪郭の特徴(例えば全長)に基づいて、対象以外のものを排除できるので、認識精度が向上する。
【0032】
本発明の対象認識装置において、前記赤外線領域検出部は、前記距離推定部で推定された前記対象までの距離に基づいて、赤外線の強度が強い領域であるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する。
【0033】
この構成により、赤外線領域検出部は、第1の赤外線画像から得られた赤外線強度の強い領域から、距離から判断して対象ではないと判断される部分を除くので、より正確に対象の領域を検出できる。
【0034】
本発明の対象認識装置において、前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する。
【0035】
この構成により、対象の特定部分(例えば手の指先)がいくつあるかを認識できる。
【0036】
本発明のさらに別の態様は、制御装置であって、この制御装置は、上記のいずれかの対象認識装置と、前記認識部における認識結果に基づいて、制御信号を生成する制部とを備えている。
【0037】
この構成により、対象の位置、形状、数等を正確に反映した制御信号を生成できる。
【0038】
本発明のさらに別の態様は、特定色を有する対象を認識する対象認識方法であって、この方法は、撮影により対象のカラー画像を生成するとともに、対象に赤外線を照射して、入射する赤外線の強度に応じた赤外線画像を生成する画像生成ステップと、前記カラー画像における前記特定色の領域を検出する特定色検出ステップと、前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、前記特定色検出ステップにおける領域検出の結果及び前記領域検出ステップにおける領域検出の結果に基づいて、前記対象の認識結果を出力する認識ステップとを含んでいる。
【0039】
本発明のさらに別の態様は、特定色を有する対象を認識する対象認識方法であって、この方法は、第1のカラーカメラ及び第2のカラーカメラによりそれぞれ撮影して、第1のカラー画像及び第2のカラー画像を生成する画像生成ステップと、前記第1のカラー画像における前記特定色の領域を検出する特定色検出ステップと、前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定ステップと、前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップとを含んでいる。
【0040】
本発明のさらに別の態様は、対象を認識する対象認識方法であって、この方法は、対象に赤外線を照射して、第1の赤外線カメラ及び第2の赤外線カメラを用いて、それぞれ入射する赤外線の強度に応じた第1の赤外線画像及び第2の赤外線画像を生成する画像生成ステップと、前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、距離画像を生成する距離推定ステップと、前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップとを含んでいる。
【0041】
本発明のさらに別の態様は、プログラムであって、このプログラムは、コンピュータにて実行されることにより、コンピュータに、上記のいずれかの方法を行わせる。
【発明の効果】
【0042】
本発明によれば、装置の大型化及びコストの上昇を抑えつつ、画像から正確に対象を認識できる。
【図面の簡単な説明】
【0043】
【図1】本発明の第1の実施の形態における制御装置の全体構成を示すブロック図
【図2】本発明の第1の実施の形態における対象認識装置の撮像部の外観正面図
【図3A】本発明の第1の実施の形態におけるカラー画像の例を示す図
【図3B】本発明の第1の実施の形態における検出された肌色領域の例を示す図
【図3C】本発明の第1の実施の形態における輪郭抽出処理を行って得られた輪郭を示す図
【図3D】本発明の第1の実施の形態における抽出された輪郭を示す図
【図3E】本発明の第1の実施の形態における指抽出の結果を示す図
【図4A】本発明の第1の実施の形態における指を抽出する処理を説明するための図
【図4B】本発明の第1の実施の形態における指の判定を行った結果を示す図
【図4C】本発明の第1の実施の形態における指先に楕円をフィッティングした結果を示す図
【図5】本発明の第1の実施の形態における手の輪郭を構成する画素を走査したときの角度Θiの変化を示すグラフ
【図6A】本発明の第1の実施の形態における赤外線画像の例を示す図
【図6B】本発明の第1の実施の形態における検出された赤外線領域の例を示す図
【図6C】本発明の第1の実施の形態における輪郭抽出処理を行って得られた輪郭を示す図
【図6D】本発明の第1の実施の形態における抽出された輪郭を示す図
【図6E】本発明の第1の実施の形態における指抽出の結果を示す図
【図7】本発明の第2の実施の形態の制御装置の全体構成を示すブロック図
【図8】本発明の第3の実施の形態の制御装置の全体構成を示すブロック図
【図9】本発明の第3の実施の形態における対象認識装置の撮像部の外観正面図
【図10A】本発明の第3の実施の形態における第1のカラー画像の例を示す図
【図10B】本発明の第3の実施の形態における検出された肌色領域の例を示す図
【図10C】本発明の第3の実施の形態における肌色領域のうち距離の遠い領域を排除した結果を示す図
【図11】本発明の第4の実施の形態の制御装置の全体構成を示すブロック図
【図12】本発明の第4の実施の形態における対象認識装置の撮像部の外観正面図
【図13A】本発明の第4の実施の形態における第1の赤外線画像の例を示す図
【図13B】本発明の第4の実施の形態における検出された赤外線領域の例を示す図
【図13C】本発明の第4の実施の形態における赤外線領域のうち距離の遠い領域を排除した結果を示す図
【発明を実施するための形態】
【0044】
以下、本発明の実施の形態の対象認識装置及びそれを備えた制御装置について、図面を参照しながら説明する。以下では、人の手の指の数を認識する対象認識装置と、対象認識装置の認識結果に基づいてコンピュータを操作するための制御信号を生成する制御部とを備えた制御装置を例として説明する。この制御装置は、コンピュータに対するインターフェースとして用いることができる。
【0045】
(第1の実施の形態)
図1は、第1の実施の形態の制御装置の全体構成を示すブロック図である。制御装置1は、対象認識装置100と制御部50とからなる。対象認識装置100は、肌色の人の手を認識する。対象認識装置100は、カラーカメラ11と、肌色領域検出部12と、輪郭抽出部13と、指抽出部14とを備えている。この構成により、カラーカメラ11で撮影して得られたカラー画像から手の指を抽出する。対象認識装置100は、さらに、赤外線ランプ20と、赤外線カメラ15と、赤外線領域検出部16と、輪郭検出部17と、指抽出部18とを備えている。この構成により、赤外線カメラ15で撮影して得られた赤外線画像から手の指を抽出する。
【0046】
図2は、対象認識装置100の撮像部21の外観正面図である。図2において、レンズ201は、カラーカメラ11のレンズであり、レンズ202は、赤外線カメラ15のレンズである。赤外線カメラ15のレンズ202には、可視光カットフィルタが被せられる。赤外線カメラ15のレンズ202の周囲には、赤外光を発光する複数の赤外線ランプ20としての赤外線LED203が配置されている。図2に示すように、対象認識装置100において、カラーカメラ11と赤外線カメラ15とは、近接して設けられている。これにより、カラーカメラ11の撮像画像と赤外線カメラ15の撮像画像とでは、画像内のほぼ同一の位置において同一の被写体部分を撮像したものとなる。ユーザは、撮像部21が自らの手を撮影できるように、撮像部21に対して手をかざす。
【0047】
図1に戻って、カラーカメラ11は、ユーザの手を撮影することによりカラー画像を生成する。このために、カラーカメラ11は、光電変換素子が2次元配列された撮像素子を有している。撮像素子には、レンズ等を介して外部の光が入射する。カラーカメラ11は、各画素について、入射した光を光電変換して、RBGデータを生成し、これをカラー画像として出力する。図3Aは、カラー画像の例を示す図である。図3Aの例では、ユーザは、撮像部21に右手をかざしている。また、図3Aの例では、ユーザの手の他に、ユーザの顔や首、及び背景も撮影されている。
【0048】
肌色領域検出部12は、カラーカメラ11にて生成されたカラー画像における肌色の領域を検出する。具体的には、肌色領域検出部12は、非特許文献2にあるように、カラーカメラ11から出力されたカラー画像であるRGBデータをLUVデータに変換し、LUV空間において所定の閾値の範囲内にある値を持つ領域を肌色領域として検出する。図3Bは、図3Aのカラー画像に対して、肌色領域検出部12において肌色検出を行った結果、検出された肌色領域の例を示す図である。図3Bの例では、ユーザの手の人差し指部分は背景の肌色部分と一体となって肌色領域として検出されている。また、図3Bの例では、ユーザの手のほか、ユーザの顔や首、及び背景の肌色の物体も肌色領域として検出されている。
【0049】
輪郭抽出部13は、肌色領域検出部12にて検出された肌色領域の輪郭を求め、そこから手の輪郭を抽出する。ここで、輪郭を示すデータは、輪郭を構成する画素が順序付けされたデータである。このデータにおいて、任意の一の画素と順序が連続する画素は、当該一の画素を取り囲む8つの画素のいずれかである。なお、輪郭を示すデータは、輪郭を構成する画素の座標値を順序に従って並べたベクトルの形式で表される。
【0050】
図3Cは、肌色領域検出部12にて検出された図3Bの肌色領域について、輪郭抽出処理を行って得られた輪郭を示す図である。図3Bの例では、一部に背景を含む手、顔及び首、及び背景の物体がそれぞれ肌色領域として検出されているので、これに従って輪郭抽出部13においても肌色領域として検出された一部に背景を含む手、顔及び首、及び背景の物体の領域の輪郭が求められる。
【0051】
輪郭抽出部13は、このようにして求められた輪郭から、手の領域の輪郭以外の輪郭を排除するために、まず、各輪郭の全長を求める。そして、全長が最も長いものを手の輪郭として抽出する。図3Dは、全長が最も長いものとして抽出された輪郭を示す図である。即ち、図3Dでは、一部に背景を含む手の輪郭が抽出されており、この段階で、顔及び首や背景の一部の肌色領域は排除されている。輪郭抽出部13は、図3Dの輪郭を示すデータを指抽出部14に出力する。
【0052】
指抽出部14は、輪郭抽出部13にて抽出された手の輪郭に基づいて、指の形状及び位置の情報を含む抽出結果を出力する。図4A〜図4C及び図5は、指を抽出する処理を説明するための図である。図4A〜図4Cは、輪郭抽出部13にて抽出された手の輪郭の指先部分を拡大したものである。図4A〜図4Cにおいて、1つの点は、1つの画素を示している。上記のように、輪郭を示すデータでは、画素の座標値が順序付けられて並んでいる。指抽出部14は、輪郭を構成する画素をこの順序に従って順に走査していく。図4Aに示すように、指抽出部14は、注目する第i番目の画素Ciと、その画素から一定の数d(図4Aの例では、d=30)だけ前の順序の画素Ci−dとを結ぶ線と、画素Ciと、その画素からdだけ後の順序の画素Ci+dとを結ぶ線とがなす角の角度Θiを求める。
【0053】
そして、指抽出部14は、角度Θiが所定の閾値(例えば、70度)を下回る否かを判定する。図4Bは、このようにして角度Θiを順に判定していった結果を示す図である。図4Bの例では、上部の合計11個の画素(点を○で囲んだ画素)が上記の条件を満たしている。指抽出部14は、このようにして注目画素Ciの角度Θiが閾値を下回るか否かを判定しながら輪郭を走査していき、最終的に角度Θiが閾値を下回る画素Ciが5以上連続した箇所があればその箇所を指先であると判断する。図4Bの例では、上記の条件を満たす画素が11個連続しているので、この部分を指先と判断する。なお、本実施の形態では、指先と判断するための角度Θiが閾値を下回る連続した画素Ciの数を5としたが、この数は5に限られない。
【0054】
図5は、手の輪郭を構成する画素Ciを順次走査しながら5本の指を検出したときの、角度Θiの変化を示すグラフである。このグラフでは、横軸に輪郭における位置iをとり、縦軸に角度Θiをとってある。図5の例では、閾値を85度としてある。この閾値を下回る5つの谷部分(図5中の○で囲った部分)が指の先端部分に相当する。なお、輪郭線は1周する閉曲線であるので、図5のグラフの左隅と右隅とは輪郭線上の同一点を表している。
【0055】
指抽出部14は、指先を見つけ出すと、指先と判断された部分で楕円のフィッティングを行う。具体的には、指抽出部14は、角度Θiが閾値を下回る連続する画素Ci及びその周囲の何点かと最もよくフィッティングする楕円を設定する。図4Cは、楕円をフィッティングした結果を示す図である。指抽出部14は、フィッティングされた楕円の長辺、短辺の長さ及びそれらの比が所定の閾値の範囲内にある場合に、この楕円がフィッティングされた部分を指(の先端)であると判断する。楕円が大きすぎたり、扁平しすぎていたりする場合には、指でない部分を誤検出した可能性が高いため、この場合は指とは判断しない。
【0056】
指抽出部14は、上記の処理をすべての指について行う。図3Eは、指抽出部14による指抽出の結果を示す図である。図3Eに示すように、人差し指の輪郭が背景の長方形領域に吸収されてしまっている部分については、角度Θiが閾値を下回る画素Ciが5以上連続するという上記の条件を満たさないので、指とは検出されていない。指抽出部14は、指先にフィッティングした楕円の位置(中心の座標)と形状(長軸及び短軸の長さ及び方向)を表すデータを認識部19に出力する。
【0057】
対象認識装置100は、さらに、赤外線カメラ15と、赤外線領域検出部16と、輪郭抽出部17と、指抽出部18とを備えている。赤外線カメラ15は、赤外線ランプ20が、赤外線カメラ15の撮影方向に向けて赤外線を照射している状態で、入射する赤外線の強度に応じた赤外線画像を生成する。赤外線カメラ15は、カラーカメラ11と同じサイズ、同じ画素数の撮像素子を有しており、カラーカメラ11と同時に被写体を撮影する。カラーカメラ11と同様に、赤外線カメラ15はレンズを備えており、レンズを通過した赤外線が撮像素子に入射するように構成されている。赤外線カメラ15は、さらにレンズの前面に可視光カットフィルタを有しており、可視光はレンズを通して撮像素子に至らないように構成されている。撮像素子は、入射した赤外線を光電変換して、赤外線強度に応じた画素値を持つ各画素のデータを赤外線画像として出力する。
【0058】
図6Aは、図3のカラー画像と同時に撮像された赤外線画像を示す図である。図6Aの例では、ユーザの手、腕の一部、背景の一部(部屋に入り込んだ外光に照らされた壁)の領域において赤外線強度が比較的強い赤外線画像が得られている。なお、図6Aの例では便宜上、比較的赤外線強度の強い領域を輪郭で囲って示したが、実際には赤外線画像における各画素は赤外線強度に応じた画素値を持っている。なお、赤外線強度に対して色温度を定義して、赤外線画像を色温度で表現すると理解しやすくなる。また、上述のように、赤外線カメラ15の付近からは赤外線の撮像方向に赤外光が発光されているが、この赤外光はそれほど強くなく、ある程度の距離だけ離れれば、そこからの反射赤外光は、撮像素子でほとんど感知されなくなる。
【0059】
赤外線領域検出部16は、赤外線カメラ15で生成された赤外線画像に基づいて、赤外線強度の強い領域(以下、「赤外線領域」という)を検出する。具体的には、赤外線領域検出部16は、赤外線画像において画素値が所定の閾値を超える領域を赤外線領域として検出する。図6Bは、図6Aの赤外線画像に対して、赤外線領域検出を行った結果、検出された赤外線領域の例を示す図である。図6Bの例では、ユーザの手のほか、ユーザの腕の一部、背景の一部(外光に照らされた壁)が赤外線領域として検出されている。
【0060】
輪郭抽出部17は、赤外線領域検出部16にて検出された領域の輪郭を求め、そこから手の輪郭を抽出する。輪郭抽出部17における処理は、輪郭抽出部13における処理と同じである。図6Cは、赤外線領域検出部16にて検出された図6Bの赤外線領域について、輪郭抽出処理を行って得られた輪郭を示す図である。図6Dは、輪郭抽出部17が、求めた輪郭のうち、全長の短い輪郭を排除して抽出された輪郭を示す図である。腕部分及び背景の一部の赤外線領域は、その輪郭の全長が比較的短いので、手の輪郭としては抽出されていない。輪郭抽出部17は、図6Dの輪郭を示すデータを指抽出部18に出力する。
【0061】
指抽出部18は、輪郭抽出部17にて抽出された手の輪郭に基づいて、指の形状及び位置の情報を含む抽出結果を出力する。指抽出部18が指を抽出する処理も、指抽出部14における処理と同じであるので、説明を省略する。図6Eは、指抽出部18による指抽出の結果を示す図である。なお、ここでは、人差し指の先に楕円がフィッティングされている。指抽出部18は、指先にフィッティングした楕円の位置(中心の座標)と形状(長軸及び短軸の長さ及び向き)を表すデータを認識部19に出力する。
【0062】
認識部19は、指抽出部14における抽出結果及び指抽出部18における抽出結果を考慮して、最終的な指の認識を行い、認識結果として指の数の情報を出力する。認識部19が2つの抽出結果に基づいて認識結果を得る方法は様々考えられる。例えば、上記の例では、人差し指を除く他の4本の指については、カラーカメラ11のカラー画像から検出された指と、赤外線カメラ15の赤外線画像から検出された指とは、ほぼ一致しているが、人差し指については、赤外線画像のみで抽出され、カラー画像では抽出されていない。このような場合には、本実施の形態の認識部19は、少なくとも一方の抽出結果で抽出されている指をユーザの指であると認識する。他の例の認識部19は、両方の抽出結果で抽出されている指のみをユーザの指であると認識する。さらに他の例の認識部19は、両方の抽出結果で抽出されている指をユーザの指であると認識するとともに、一方の抽出結果でしか抽出されていない指については、それが所定の条件を満たした場合に、それを指であると認識する。例えば、両方の検出結果で検出されている他の指先と当該一方の抽出結果のみで抽出されている指先との位置関係が所定の条件を満たすときに、それをユーザの指であると認識する。
【0063】
また、認識部19は、キャリブレーション機能を用いて、2つの抽出結果に基づいて認識結果を得てもよい。この場合は、予め、ユーザに指を1本から5本まで順に提示してもらって、また、複数の制御信号の各々に応じた形状及び位置で手を提示してもらい、これらをカラーカメラ11及び赤外線カメラ15でそれぞれ撮影して、カラー画像及び赤外線画像を生成する。そして、認識部19は、これらのカラー画像及び赤外線画像を所定の指の本数に対応する標準の情報として記憶しておく。認識部19は、2つの抽出結果に基づいて指の認識を行う場合には、2つの抽出結果をそれぞれの標準の情報と比較して、より標準の情報に近いほうの検出結果を採用する。認識部19は、以上で説明した方法以外の方法で2つの抽出結果に基づいて指の認識を行ってよい。
【0064】
制御部50は、指の本数に応じた制御信号を生成して出力する。この制御信号はコンピュータに送られて、コンピュータの操作を制御することになる。例えば、制御部50は、指の本数がゼロ(手を握り締めている状態)の場合は、マウスをホールドする制御信号を出力し、指の本数が5本の場合はマウスをリリースする制御信号を出力する。このような指の本数と制御信号との対応付けも種々の実施の形態が考えられる。
【0065】
なお、認識部19が指の本数と指先に設定した楕円の位置の情報を含む認識結果を出力して、制御部50がその認識結果に応じた制御信号を出力してもよい。この場合は、手を広げて縦にする場合と横にする場合とで異なる制御信号を生成できることになる。
【0066】
以上のように、本実施の形態の対象認識装置100によれば、1つのカラーカメラと1つの赤外線カメラという安価かつ簡易な構造で、背景色等に係らず、正確に手の指を検出でき、制御装置1は、ユーザの手の形状や位置を正確に反映させた制御信号を生成できる。
【0067】
(第2の実施の形態)
次に、本発明の第2の実施の形態を説明する。図7は、本発明の第2の実施の形態の制御装置の全体構成を示すブロック図である。本実施の形態の制御装置2において、第1の実施の形態の制御装置1と同一の構成については、同一の符号を付して、適宜説明を省略する。
【0068】
制御装置2は、対象認識装置200と制御部50とからなる。対象認識装置200は、カラーカメラ11と、肌色領域検出部12と、赤外線カメラ15と、赤外線領域検出部16とを備えている。これらの構成は、第1の実施の形態の対応する部分の構成と同じである。本実施の形態の対象認識装置200は、肌色領域検出部12の検出結果と、赤外線領域検出部16の検出結果とに基づいて、ユーザの手の領域を検出する手領域検出部22を備えている。即ち、第1の実施の形態の対象認識装置100では、カラー画像と赤外線画像のそれぞれについて指を抽出した上で、認識部19にて2つの指抽出の結果を考慮して最終的な指の認識結果を得ていたが、本実施の形態では、カラー画像から肌色領域を検出して、赤外線画像から赤外線領域を検出して、それらの結果に基づいて、手領域を検出した上で、輪郭抽出、指抽出、認識という後続の処理を行う。
【0069】
手領域検出部22には、肌色領域検出部12にて検出された肌色の領域と、赤外線領域検出部16で検出された赤外線領域とがオーバラップする領域を手領域として検出する。即ち、手領域検出部22は、カラー画像及び赤外線画像のいずれにおいても検出された領域を手領域とする。なお、オーバラップする領域が複数ある場合には、面積の大きい方の領域のみを残して、面積の小さい方の領域を無視してもよいし、複数の領域をそのまま手領域として出力してもよい。
【0070】
輪郭抽出部13は、第1の実施の形態の輪郭抽出部13、17と同様にして、手領域について輪郭を求め、それをユーザの手の輪郭として抽出する。ここで、手領域検出部22にて手領域として検出された領域が複数ある場合には、第1の実施の形態と同様に、全長が最も長い輪郭をユーザの手の輪郭として抽出する。指抽出部14も、第1の実施の形態の指抽出部14、18と同様にして指の検出を行い、検出された指に楕円をフィッティングして、指にフィッティングした楕円の情報を出力する。認識部23は、指抽出部14から得た楕円の情報に基づいて、認識結果として、指の数を含む情報を制御部50に出力する。但し、本実施の形態の認識部23は、第1の実施の形態の認識部19と異なり、複数の指抽出の結果から指の数等を判断する必要はなく、1つの指抽出の結果に基づいて、上記のキャリブレーション機能を利用するなどして指の数を認識する。制御部50は、第1の実施の形態と同様である。
【0071】
本実施の形態によっても、対象認識装置200は、1つのカラーカメラと1つの赤外線カメラという安価かつ簡易な構造で、背景色等に係らず、正確に手の指を検出でき、制御装置2は、ユーザの手の形状や位置を正確に反映させた制御信号を生成できる。また、本実施の形態では、輪郭抽出や指抽出の処理をカラー画像及び赤外線画像のそれぞれについて行う必要がないので、少ないリソースで対象を認識できる。
【0072】
(第3の実施の形態)
次に、本発明の第3の実施の形態を説明する。図8は、本発明の第3の実施の形態の制御装置の全体構成を示すブロック図である。本実施の形態の制御装置3において、第1、第2の実施の形態の制御装置1、2と同一の構成については、同一の符号を付して、適宜説明を省略する。
【0073】
制御装置3は、対象認識装置300と制御部50とからなる。対象認識装置300は、第1のカラーカメラ11−1と、手領域検出部24と、第2のカラーカメラ11−2と、距離推定部25とを備えている。第1のカラーカメラ11−1と第2のカラーカメラ11−2は一体的に構成されている。
【0074】
図9は、対象認識装置300の撮像部26の外観正面図である。レンズ201−1は、第1のカラーカメラ11−1のレンズであり、レンズ201−2は、第2のカラーカメラのレンズである。図9に示すように、対象認識装置300において、第1のカラーカメラ11−1と第2のからーカメラ11−2とは、近接して設けられている。これにより、第1のカラーカメラ11−1で得られたカラー画像(第1のカラー画像)と第2のカラーカメラ11−2で得られたカラー画像(第2のカラー画像)とでは、画像内のほぼ同一の位置において同一の被写体部分を撮像したものとなる。
【0075】
第1のカラーカメラ11−1にて得られた第1のカラー画像は、手領域検出部24及び距離推定部25に入力される。第2のカラーカメラ11−2にて得られた第2のカラー画像は、距離推定部25に入力される。距離推定部25は、第1のカラー画像及び第2のカラー画像の視差に基づいて、ステレオ法により被写体までの距離を求めて、距離画像を生成する。距離画像とは、各画素の画素値がその画素に現れている被写体までの距離を表している画像である。
【0076】
図10Aは、第1のカラーカメラ11−1にて撮像された第1のカラー画像の例を示す図である。このカラー画像には、ユーザの手と、その背景として天井(画像の上側)及び後方の壁(画像の下側)が写りこんでいる。手領域検出部24は、この第1のカラー画像に対して肌色の検出処理を行う。肌色の検出は、第1の実施例で説明したのと同様の方法で行う。図10Bは、手領域検出部24にて検出された肌色領域を示す図である。図10Bの例では、天井がユーザの手と重なって肌色領域として検出されている。
【0077】
手領域検出部24は、距離推測部25にて得られた距離画像を用いて、検出された肌色領域から手の部分のみを検出する。このために、手領域検出部24は、肌色領域として検出された領域のうち、距離画像における距離が閾値以上である領域を排除する。図10Bの例では、肌色として検出されている天井は距離が閾値以上であるため、排除される。図10Cは、肌色の領域のうち距離の遠い領域を排除した結果を示す図である。図10Cに示すように、肌色として検出された領域から、距離の遠い領域を排除した結果、ユーザの手の領域が天井の領域と切り離されて検出されている。
【0078】
手領域検出部24は、上記のようにして、検出された手の部分のみの肌色領域を輪郭抽出部13に出力する。輪郭抽出部13は、この肌色領域から輪郭を抽出して、指抽出部14に出力する。指抽出部14は、手の輪郭から指の先端を抽出して、指の先端に楕円をフィッティングして、手の輪郭及び楕円の情報を認識部23に出力する。認識部23は、指抽出部14から得た情報を元に、指の数を認識して、認識結果を制御部50に出力する。
【0079】
本実施の形態の対象認識装置300によれば、2つのカラーカメラという安価かつ簡易な構造で、背景色等に係らず、正確に手の指を検出でき、制御装置3は、ユーザの手の形や位置を正確に反映させた制御信号を生成できる。
【0080】
(第4の実施の形態)
次に、本発明の第4の実施の形態を説明する。図11は、本発明の第4の実施の形態の制御装置の全体構成を示すブロック図である。本実施の形態の制御装置4において、第1、第2、第3の実施の形態の制御装置1、2、3と同一の構成については、同一の符号を付して、適宜説明を省略する。図11と図8とを比較して分かるように、本実施の形態の制御装置4は、第3の実施の形態の制御装置3の第1及び第2のカラーカメラ11−1、11−2が、第1及び第2の赤外線カメラ15−1、15−2に置き換わったものである。
【0081】
制御装置4は、対象認識装置400と制御部50とからなる。対象認識装置400は、第1の赤外線カメラ15−1と、手領域検出部27と、第2の赤外線カメラ15−2と、距離推定部25とを備えている。第1の赤外線カメラ15−1と第2の赤外線カメラ15−2は一体的に構成されている。
【0082】
図12は、対象認識装置300の撮像部28の外観正面図である。レンズ202−1は、第1の赤外線カメラ15−1のレンズであり、レンズ202−2は、第2の赤外線カメラ15−2のレンズである。レンズ202−1及びレンズ202−2の周りには複数の赤外線LED203が配置されている。図12に示すように、対象認識装置300において、第1の赤外線カメラ15−1と第2の赤外線カメラ15−2とは、近接して設けられている。これにより、第1の赤外線カメラ15−1で得られた赤外線画像(第1の赤外線画像)と第2の赤外線カメラ15−2で得られた赤外線画像(第2の赤外線画像)とでは、画像内のほぼ同一の位置において同一の被写体部分を撮像したものとなる。
【0083】
第1の赤外線カメラ15−1にて得られた第1の赤外線画像は、手領域検出部27及び距離推定部25に入力される。第2の赤外線カメラ15−2にて得られた第2の赤外線画像は、距離推定部25に入力される。距離推定部25は、第1のカラー画像及び第2のカラー画像の視差に基づいて、ステレオ法により被写体までの距離を求めて、距離画像を生成する。
【0084】
図13Aは、第1の赤外線カメラ15−1にて撮像された第1の赤外線画像の例を示す図である。この赤外線画像では、ユーザの手と、顔と、上半身とが赤外線の強度の強い領域として撮像されている。図13Aでは、第1の実施の形態で説明した図6Aと同様に、便宜上、比較的赤外線強度の強い領域を輪郭で囲って示したが、実際には赤外線画像における各画素は赤外線強度に応じた画素値を持っている。
【0085】
手領域検出部27は、この第1の赤外線画像に対して赤外線領域の検出処理を行う。赤外線領域の検出は、第1の実施例で説明したのと同様の方法で行う。図13Bは、手領域検出部27にて検出された赤外線領域を示す図である。図13Bの例では、ユーザの手と、顔の一部と上半身の一部とがすべて一体となって赤外線領域として検出されている。
【0086】
手領域検出部27は、距離推定部25にて得られた距離画像を用いて、検出された赤外線領域から手の部分のみを検出する。このために、手領域検出部27は、赤外線領域として検出された領域のうち、距離画像における距離が閾値以上である領域を排除する。図13Bの例では、赤外線領域として検出されている顔及び上半身は距離が閾値以上であるため、排除される。図13Cは、赤外線領域のうち距離の遠い領域を排除した結果を示す図である。図13Cに示すように、赤外線領域として検出された領域から距離の遠い領域を排除した結果、ユーザの手の領域が顔や上半身の領域と切り離されて検出されている。
【0087】
手領域検出部27は、上記のようにして、検出された手の部分のみの赤外線領域を輪郭抽出部13に出力する。輪郭抽出部13は、この赤外線領域から輪郭を抽出して、指抽出部14に出力する。指抽出部14は、手の輪郭から指の先端を抽出して、指の先端に楕円をフィッティングして、手の輪郭及び楕円の情報を認識部23に出力する。認識部23は、指抽出部14から得た情報を元に、指の数や位置等を認識して、認識結果を制御部50に出力する。
【0088】
本実施の形態の対象認識装置400によれば、2つの赤外線カメラという安価かつ簡易な構造で、背景色に係らず、正確に手の指を検出でき、制御装置4は、ユーザの手の形状や位置を正確に反映させた制御信号を生成できる。
【0089】
以上、本発明の実施の形態を説明したが、上記の説明は例示に過ぎず、本発明は他の実施の形態でも実施される。
【0090】
例えば、上記の実施の形態の対象認識装置は、認識結果として指の数の情報を出力したが、対象認識装置が認識結果として出力する情報は、指の数に限られない。例えば、対象認識装置が、指抽出部で得られた指の形状や位置の情報を認識結果として出力してもよい。さらに、対象認識装置が、輪郭抽出部で抽出された手の輪郭の情報を認識結果として出力してもよい。また、対象認識装置が、肌色領域検出部や赤外線領域検出部で検出した領域の情報を認識結果として出力してもよい。また、対象認識装置が、これらの情報を加工した情報を認識結果として出力してもよい。例えば、対象認識装置が、輪郭抽出部で抽出された手の輪郭の長さの情報を認識結果として出力してもよい。また、例えば、対象認識装置が、肌色領域検出部や赤外線領域検出部で検出した領域の面積の情報を認識結果として出力してもよい。さらに、第3及び第4の実施の形態のように、対象認識装置が、手までの距離を推定する構成を有している場合には、この距離の情報を認識結果の情報に付加して出力してもよい。
【0091】
また、上記の実施の形態では、対象認識装置は、1つのカラーカメラと1つの赤外線カメラ(第1及び第2の実施の形態)、又は2台のカラーカメラ(第3の実施の形態)、又は2台の赤外線カメラ(第4の実施の形態)という合計2台のカメラを備えていたが、合計3台以上のカメラを備えていてもよい。
【0092】
さらに、上記の実施の形態では、カラー画像から肌色の領域を検出する例を説明したが、認識対象が他の色を有している場合には、当該他の色を検出してよい。
【産業上の利用可能性】
【0093】
本発明は、装置の大型化及びコストの上昇を抑えつつ、画像から正確に対象を認識できるという優れた効果を有し、認識対象の数、位置、形状等を認識する対象認識装置等に適用することができる。
【符号の説明】
【0094】
1、2、3、4 制御装置
100、200、300、400 対象認識装置
11、11−1、11−2 カラーカメラ
12 肌色領域検出部
13 輪郭抽出部
14 指抽出部
15、15−1、15−2 赤外線カメラ
16 赤外線領域検出部
17 輪郭抽出部
18 指抽出部
19、23 認識部
20 赤外線ランプ
21、26、28 撮像部
22、24、27 手領域検出部
25 距離推定部
50 制御部
【特許請求の範囲】
【請求項1】
特定色を有する対象を認識する対象認識装置であって、
撮影によりカラー画像を生成するカラーカメラと、
前記カラー画像における前記特定色の領域を検出する特定色検出部と、
対象に赤外線を照射するための赤外線ランプと、
入射する赤外線の強度に応じた赤外線画像を生成する赤外線カメラと、
前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、
前記特定色検出部における領域検出の結果及び前記赤外線領域検出部における領域検出の結果に基づいて、前記対象の認識結果を出力する認識部と、
を備えたことを特徴とする対象認識装置。
【請求項2】
前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、
前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する請求項1に記載の対象認識装置。
【請求項3】
前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する請求項2に記載の対象認識装置。
【請求項4】
前記対象は人の手であり、前記特定色は肌色である請求項1又は2に記載の対象認識装置。
【請求項5】
前記対象は人の手であり、前記特定色は肌色であり、前記特定部分は指先である請求項3に記載の対象認識装置。
【請求項6】
特定色を有する対象を認識する対象認識装置であって、
撮影により第1のカラー画像を生成する第1のカラーカメラと、
前記第1のカラー画像における前記特定色の領域を検出する特定色検出部と、
撮影により第2のカラー画像を生成する第2のカラーカメラと、
前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定部と、
前記特定色検出部における領域検出の結果及び前記距離推定部にて生成された距離画像に基づいて、前記対象の認識結果を出力する認識部と、
を備えたことを特徴とする対象認識装置。
【請求項7】
前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、
前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する請求項6に記載の対象認識装置。
【請求項8】
前記特定色検出部は、前記距離推定部で生成された距離画像に基づいて、前記特定色の領域ではあるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、
前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する請求項7に記載の対象認識装置。
【請求項9】
前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する請求項7又は8に記載の対象認識装置。
【請求項10】
対象を認識する対象認識装置であって、
対象に赤外線を照射するための赤外線ランプと、
入射する赤外線の強度に応じた第1の赤外線画像を生成する第1の赤外線カメラと、
前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、
入射する赤外線の強度に応じた第2の赤外線画像を生成する第2の赤外線カメラと、
前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、距離画像を生成する距離推定部と、
前記赤外線領域検出部における領域検出の結果及び前記距離推定部にて生成された距離画像に基づいて、前記対象の認識結果を出力する認識部と、
を備えたことを特徴とする対象認識装置。
【請求項11】
前記赤外線領域検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、
前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する請求項10に記載の対象認識装置。
【請求項12】
前記赤外線領域検出部は、前記距離推定部で生成された距離画像に基づいて、赤外線の強度が強い領域であるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、
前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する請求項11に記載の対象認識装置。
【請求項13】
前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する請求項11又は12に記載の対象認識装置。
【請求項14】
請求項1ないし請求項13のいずれかに記載の対象認識装置と、
前記認識部における認識結果に応じた制御信号を生成する制御部と、
を備えたことを特徴とする制御装置。
【請求項15】
特定色を有する対象を認識する対象認識方法であって、
撮影により対象のカラー画像を生成すると同時に、対象に赤外線を照射して、入射する赤外線の強度に応じた赤外線画像を生成する画像生成ステップと、
前記カラー画像における前記特定色の領域を検出する特定色検出ステップと、
前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、
前記特定色検出ステップにおける領域検出の結果及び前記領域検出ステップにおける領域検出の結果に基づいて、前記対象の認識結果を出力する認識ステップと、
を含むことを特徴とする対象認識方法。
【請求項16】
特定色を有する対象を認識する対象認識方法であって、
第1のカラーカメラ及び第2のカラーカメラによりそれぞれ同時に撮影をして、第1のカラー画像及び第2のカラー画像を生成する画像生成ステップと、
前記第1のカラー画像における前記特定色の領域を検出する特定色検出ステップと、
前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定ステップと、
前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップと、
を含むことを特徴とする対象認識方法。
【請求項17】
対象を認識する対象認識方法であって、
対象に赤外線を照射して、第1の赤外線カメラ及び第2の赤外線カメラを用いて、それぞれ入射する赤外線の強度に応じた第1の赤外線画像及び第2の赤外線画像を同時に生成する画像生成ステップと、
前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、
前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、距離画像を生成する距離推定ステップと、
前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップと、
を含むことを特徴とする対象認識方法。
【請求項18】
コンピュータにて実行されることにより、コンピュータに、請求項15ないし請求項17のいずれかに記載の方法を行わせることを特徴とするプログラム。
【請求項1】
特定色を有する対象を認識する対象認識装置であって、
撮影によりカラー画像を生成するカラーカメラと、
前記カラー画像における前記特定色の領域を検出する特定色検出部と、
対象に赤外線を照射するための赤外線ランプと、
入射する赤外線の強度に応じた赤外線画像を生成する赤外線カメラと、
前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、
前記特定色検出部における領域検出の結果及び前記赤外線領域検出部における領域検出の結果に基づいて、前記対象の認識結果を出力する認識部と、
を備えたことを特徴とする対象認識装置。
【請求項2】
前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、
前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する請求項1に記載の対象認識装置。
【請求項3】
前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する請求項2に記載の対象認識装置。
【請求項4】
前記対象は人の手であり、前記特定色は肌色である請求項1又は2に記載の対象認識装置。
【請求項5】
前記対象は人の手であり、前記特定色は肌色であり、前記特定部分は指先である請求項3に記載の対象認識装置。
【請求項6】
特定色を有する対象を認識する対象認識装置であって、
撮影により第1のカラー画像を生成する第1のカラーカメラと、
前記第1のカラー画像における前記特定色の領域を検出する特定色検出部と、
撮影により第2のカラー画像を生成する第2のカラーカメラと、
前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定部と、
前記特定色検出部における領域検出の結果及び前記距離推定部にて生成された距離画像に基づいて、前記対象の認識結果を出力する認識部と、
を備えたことを特徴とする対象認識装置。
【請求項7】
前記特定色検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、
前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する請求項6に記載の対象認識装置。
【請求項8】
前記特定色検出部は、前記距離推定部で生成された距離画像に基づいて、前記特定色の領域ではあるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、
前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する請求項7に記載の対象認識装置。
【請求項9】
前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する請求項7又は8に記載の対象認識装置。
【請求項10】
対象を認識する対象認識装置であって、
対象に赤外線を照射するための赤外線ランプと、
入射する赤外線の強度に応じた第1の赤外線画像を生成する第1の赤外線カメラと、
前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出部と、
入射する赤外線の強度に応じた第2の赤外線画像を生成する第2の赤外線カメラと、
前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、距離画像を生成する距離推定部と、
前記赤外線領域検出部における領域検出の結果及び前記距離推定部にて生成された距離画像に基づいて、前記対象の認識結果を出力する認識部と、
を備えたことを特徴とする対象認識装置。
【請求項11】
前記赤外線領域検出部にて検出された領域の輪郭を求め、求めた輪郭に基づいて前記対象の輪郭を抽出する輪郭抽出部をさらに備え、
前記認識部は、前記輪郭抽出部にて抽出された輪郭に基づいて、前記対象の形状、位置及び数の少なくともいずれかの情報を含む認識結果を出力する請求項10に記載の対象認識装置。
【請求項12】
前記赤外線領域検出部は、前記距離推定部で生成された距離画像に基づいて、赤外線の強度が強い領域であるが前記対象の領域ではない領域を除いて、前記領域検出の結果とし、
前記輪郭抽出部は、前記対象の領域ではない領域が除かれた前記領域検出の結果について、領域の輪郭を求めて、その輪郭を抽出する請求項11に記載の対象認識装置。
【請求項13】
前記認識部は、前記輪郭抽出部にて抽出された輪郭内の所定の条件を満たす特定部分の数の情報を含む認識結果を出力する請求項11又は12に記載の対象認識装置。
【請求項14】
請求項1ないし請求項13のいずれかに記載の対象認識装置と、
前記認識部における認識結果に応じた制御信号を生成する制御部と、
を備えたことを特徴とする制御装置。
【請求項15】
特定色を有する対象を認識する対象認識方法であって、
撮影により対象のカラー画像を生成すると同時に、対象に赤外線を照射して、入射する赤外線の強度に応じた赤外線画像を生成する画像生成ステップと、
前記カラー画像における前記特定色の領域を検出する特定色検出ステップと、
前記赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、
前記特定色検出ステップにおける領域検出の結果及び前記領域検出ステップにおける領域検出の結果に基づいて、前記対象の認識結果を出力する認識ステップと、
を含むことを特徴とする対象認識方法。
【請求項16】
特定色を有する対象を認識する対象認識方法であって、
第1のカラーカメラ及び第2のカラーカメラによりそれぞれ同時に撮影をして、第1のカラー画像及び第2のカラー画像を生成する画像生成ステップと、
前記第1のカラー画像における前記特定色の領域を検出する特定色検出ステップと、
前記第1のカラー画像及び前記第2のカラー画像の視差に基づいて、距離画像を生成する距離推定ステップと、
前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップと、
を含むことを特徴とする対象認識方法。
【請求項17】
対象を認識する対象認識方法であって、
対象に赤外線を照射して、第1の赤外線カメラ及び第2の赤外線カメラを用いて、それぞれ入射する赤外線の強度に応じた第1の赤外線画像及び第2の赤外線画像を同時に生成する画像生成ステップと、
前記第1の赤外線画像に基づいて、赤外線強度の強い領域を検出する赤外線領域検出ステップと、
前記第1の赤外線画像及び前記第2の赤外線画像の視差に基づいて、距離画像を生成する距離推定ステップと、
前記特定色検出ステップにおける領域検出の結果及び前記距離推定ステップにて生成された距離画像に基づいて、前記対象の認識結果を出力する認識ステップと、
を含むことを特徴とする対象認識方法。
【請求項18】
コンピュータにて実行されることにより、コンピュータに、請求項15ないし請求項17のいずれかに記載の方法を行わせることを特徴とするプログラム。
【図1】
【図2】
【図3A】
【図3B】
【図3C】
【図3D】
【図3E】
【図4A】
【図4B】
【図4C】
【図5】
【図6A】
【図6B】
【図6C】
【図6D】
【図6E】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図10C】
【図11】
【図12】
【図13A】
【図13B】
【図13C】
【図2】
【図3A】
【図3B】
【図3C】
【図3D】
【図3E】
【図4A】
【図4B】
【図4C】
【図5】
【図6A】
【図6B】
【図6C】
【図6D】
【図6E】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図10C】
【図11】
【図12】
【図13A】
【図13B】
【図13C】
【公開番号】特開2011−198270(P2011−198270A)
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願番号】特願2010−66655(P2010−66655)
【出願日】平成22年3月23日(2010.3.23)
【出願人】(502324066)株式会社デンソーアイティーラボラトリ (332)
【Fターム(参考)】
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願日】平成22年3月23日(2010.3.23)
【出願人】(502324066)株式会社デンソーアイティーラボラトリ (332)
【Fターム(参考)】
[ Back to top ]