物体認識処理装置及び物体認識処理方法
【課題】バーコードラベルや無線タグが付されていない商品を画像認識処理により短時間で精度良く認識できるようにする。
【解決手段】撮像部10より撮像された認識対象物のカラー画像信号について、認識処理部20において、第1の認識処理部22により、上記カラー画像信号からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識し、また、第2の認識処理部23により、上記カラー画像信号に含まれる認識対象物の輝度情報からSIFT特徴量を抽出し、K−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、上記認識対象物の第2の特徴情報として、予め作成されている基準のヒストグラムと比較することにより上記認識対象物を認識する。
【解決手段】撮像部10より撮像された認識対象物のカラー画像信号について、認識処理部20において、第1の認識処理部22により、上記カラー画像信号からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識し、また、第2の認識処理部23により、上記カラー画像信号に含まれる認識対象物の輝度情報からSIFT特徴量を抽出し、K−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、上記認識対象物の第2の特徴情報として、予め作成されている基準のヒストグラムと比較することにより上記認識対象物を認識する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、認識対象物を撮像して画像認識処理により認識する物体認識処理装置及び物体認識処理方法に関する。
【背景技術】
【0002】
一般に、スーパーマーケット等の店舗に設置されたレジカウンタにおいて商品チェックアウトを行う場合には、商品に付されたバーコードを読み取ることによって当該商品の価格等のデータを求め、そのデータをPOS装置に出力する事によって販売管理や在庫管理を効率的に行うことができる。
【0003】
バーコードリーダは、小売雑貨業において、レジでバーコードタグの付いた商品を識別するのに広く用いられている。商品は、そのバーコードにより、ホストコンピュータに記憶されたデータベースを用いて識別される。一般に、商品の説明およびその価格がレシートに印刷され、さらに商品がスキャンされる間、現在の価格合計が保持される。バーコードリーダの使用は、信頼性とレジにかかる時間の短縮などにより、一般に広く受け入れられている。
【0004】
また、近年、商品に無線タグを取り付け、無線タグのメモリにその無線タグを付した商品に関するデータ、例えば、商品コードを記憶させておき、そのデータを用いて商品販売データ処理や商品管理を実行するようにした各種の技術が提案され、実用化されている。また、無線タグのメモリに記憶されている商品コード等のデータを複数商品について一括して読み取ることで、効率的なチェックアウトを可能にする技術についても開発が進められ、一部実用化されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−226320号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、例えば果実や野菜などの生鮮品のような未包装の商品では、バーコードラベルや無線タグを付けることが好ましくない場合もあり、バーコードラベルや無線タグが付されていない商品については、商品コードの入力が困難であるという問題がある。
また、ケーキや野菜などを店で会計する際、レジで値段を入力するのは効率悪く、また従業員に対して、すべての商品の値段を覚えるのが大変である。また、ケーキは作る人により個体差が生じ、また、野菜などは栽培環境や自然環境によりそれぞれの形状に個体差が生じる。
【0007】
そこで、本発明の目的は、上記従来の課題を解決するものであり、バーコードラベルや無線タグが付されていない商品を画像認識処理により短時間で精度良く認識できる物体認識処理装置及び物体認識処理方法を提供することにある。
また、本発明の目的は、個体差のある物体の認識を高精度且つ高速で可能にした物体認識装置及び物体認識方法を提供することにある。
【0008】
本発明の他の目的、本発明によって得られる具体的な利点は、以下に説明される実施の形態の説明から一層明らかにされる。
【課題を解決するための手段】
【0009】
本発明に係る物体認識処理装置は、認識対象物を撮像する撮像部と、上記撮像部により撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理部とを備え、上記認識処理部は、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理部と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理部を備えることを特徴とする。
【0010】
本発明に係る物体認識処理装置において、上記認識処理部は、例えば、上記第1の認識処理部による認識処理に用いる認識対象物の基準のカラーヒストグラムを作成して保存する学習処理と、認識対象物のSIFT特徴量についてK−means法によるクラスタリングを行い、上記第2の認識処理部による認識処理に用いるヒストグラムを作成して保存する学習処理を予め行うものとすることができる。
【0011】
また、本発明に係る物体認識処理装置は、例えば、上記第1の認識処理部により上記認識対象物の認識処理を行い、上記認識対象物を認識できない場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うものとすることができる。
【0012】
さらに、本発明に係る物体認識処理装置において、上記認識処理部は、例えば、上記認識対象物の基準のカラーヒストグラムを作成して保存する学習処理を行う際に、誤認識の虞のある認識対象物を分類して保存しておき、上記第1の認識処理部により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うものとすることができる。
【0013】
本発明に係る物体認識処理方法は、認識対象物を撮像する撮像ステップと、上記撮像ステップにおいて撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理ステップとを有し、上記認識処理ステップでは、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことを特徴とする。
【発明の効果】
【0014】
本発明によれば、撮像部により撮像された認識対象物のカラー画像信号について、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことにより、バーコードラベルや無線タグが付されていない商品を画像処理により短時間で精度良く認識できる。
【図面の簡単な説明】
【0015】
【図1】本発明を適用した物体認識処理装置の構成例を示すブロック図である。
【図2】上記物体認識処理装置の外観斜視図である。
【図3】上記物体認識処理装置における認識処理の手順を示すフローチャートである。
【図4】上記認識処理における前処理の手順を示すフローチャートである。
【図5】上記認識処理における第1の認識処理の手順を示すフローチャートである。
【図6】上記第1の認識処理を行う第1の認識処理部の機能構成を示すブロック図である。
【図7】上記第1の認識処理部におけるカラーヒストグラム生成処理部によるカラーヒストグラムの作成例を示す図である。
【図8】上記第1の認識処理部におけるカラーヒストグラム比較処理部によるカラーヒストグラムの比較例を示す図である。
【図9】上記第1の認識処理部により行われる第1の認識処理に用いられる基準のカラーヒストグラムを作成する学習処理の手順を示すフローチャートである。
【図10】上記認識処理における第2の認識処理の手順を示すフローチャートである。
【図11】上記第2の認識処理を行う第2の認識処理部の機能構成を示すブロック図である。
【図12】上記第2の認識処理部において特徴点検出処理部により行われる特徴点検出処理を模式的に示す図である。
【図13】上記特徴点検出処理部の平滑化処理部におけるスケールとDOGフィルタ出力の関係を示す図である。
【図14】上記特徴点検出処理部の特徴点決定部における特徴点決定例を示す図である。
【図15】上記第2の認識処理部において特徴量抽出処理部により作成される重み付け方向ヒストグラムの作成例を示す図である。
【図16】上記第2の認識処理部においてスケール不変特徴量算出処理部でスケール不変特徴量を算出することにより作成される特徴ベクトルの例を示す図である。
【図17】上記第2の認識処理部において行われる第2の認識処理を模式的に示す図である。
【図18】上記第2の認識処理部により行われる第2の認識処理に用いられる基準のヒストグラムを作成する学習処理の手順を示すフローチャートである。
【図19】上記基準のヒストグラムを作成する学習処理を模式的に示す図である。
【図20】上記物体認識処理装置において上記第1の上記認識処理部により行われる認識対象物の認識処理を行うための決定木(decision tree)の学習処理の手順を示すフローチャートである。
【図21】上記第1の上記認識処理部における第1の特徴情報のデータベースを用いる第1の認識処理では、認識対象物が誤認識される虞のある例を示す図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明は以下の例に限定されるものではなく、本発明の要旨を逸脱しない範囲で、任意に変更可能であることは言うまでもない。
【0017】
本発明は、例えば図1に示すような構成の物体認識処理装置100に適用される。
【0018】
この物体認識処理装置100は、認識対象物を撮像するための撮像部10と、上記撮像部10により撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理部20とを備からなる。
【0019】
上記認識処理部20は、上記撮像部10から撮像出力として出力されたカラー画像信号が入力される撮像信号処理部21、この撮像信号処理部21により処理された認識処理対象のカラー画像信号に含まれる色情報RGBが供給される第1の認識処理部22、上記撮像信号処理部21により処理された認識処理対象のカラー画像信号に含まれる輝度情報Yが供給される第2の認識処理部23、上記第1の認識処理部22及び第2の認識処理部23による認識処理結果を出力する出力部24、これら各部の動作を制御する制御部25、この制御部25に接続された記憶部26などからなる。
【0020】
この物体認識処理装置100は、従来のPOSシステムでは管理しにくい、バーコードラベルや無線タグを付けることが好ましくない商品、例えば果実や野菜などの生鮮品やケーキのような商品を認識対象物とし、画像認識処理により識別して認識するものであって、図2に示すように、上記撮像部10は、テーブル1上に載置される認識対象物5を上方から撮像するWEBカメラからなり、WEBカメラがUSBケーブルを介して接続されたコンピュータからなる上記認識処理部20に、撮像出力としてカラー画像信号を供給するようになっている。
【0021】
そして、この物体認識処理装置100において、上記制御部25は、上記テーブル1上に載置された認識対象物5の認識処理を図3のフローチャートに示す手順に従って行うように、撮像信号処理部21、第1の認識処理部22、第2の認識処理部23、出力部24の動作を制御する。
【0022】
すなわち、この物体認識処理装置100では、上記撮像信号処理部21において、上記撮像部10により得られたカラー画像信号から認識対象物5の画像領域を抽出する前処理(ステップST1)を行う。
【0023】
上記ステップST1の前処理では、上記制御部25による指示に基づいて、上記撮像信号処理部21は、図4のフローチャートに示すように、上記撮像部10から供給されるカラー画像信号をキャプチャーし(ステップST11)、キャプチャーしたカラー画像信号から認識対象物5の画像領域を抽出する処理を行う(ステップST12)。
【0024】
そして、上記撮像信号処理部21は、抽出した認識対象物5の画像領域のカラー画像信号に含まれる色情報R(Red:赤)G(Green:緑)B(Blue:青)を上記第1の認識処理部22に供給し、また、抽出した認識対象物5の画像領域のカラー画像信号に含まれる輝度情報Yを上記第2の認識処理部23に供給する。
【0025】
ここで、上記ステップST12における認識対象物5の画像領域を抽出する処理では、例えば、上記制御部25による指示に基づき、予め、上記テーブル1上に認識対象物5が載置されていない状態で上記撮像部10による撮像出力として得られるカラー画像信号を上記撮像信号処理部21でキャプチャーすることにより背景画像情報を得て記憶部26に保存しておき、上記撮像信号処理部21により認識対象物5の画像領域を抽出する処理を行う際にキャプチャーしたカラー画像信号と上記背景画像情報との差分検出を行うことにより、認識対象物5の画像領域を抽出する。
【0026】
次に、上記制御部25は、上記認識対象物5の画像領域の抽出に成功したか否かを判定し(ステップST2)、その判定結果が「NO」、すなわち、上記認識対象物5の画像領域を抽出できなかった場合には、上記ステップST1の前処理を繰り返し行い、上記認識対象物5の画像領域が抽出され、「YES」の判定結果が得られると、第1の認識処理部22によりカラー画像信号に含まれる色情報R(Red:赤)G(Green:緑)B(Blue:青)に基づく第1の認識処理を行う(ステップST3)。
【0027】
このステップST3の第1の認識処理では、第1の認識処理部22により、図5のフローチャートに示すように、カラー画像信号に含まれる色情報R(Red:赤)G(Green:緑)B(Blue:青)からカラーヒストグラムを作成し(ステップST31)、作成したカラーヒストグラムを基準のカラーヒストグラムと比較することにより、上記認識対象物5を認識する処理を行う(ステップST32)。
【0028】
ここで、上記第1の認識処理部22は、その機能構成を図6に示すように、上記撮像信号処理部21により抽出した認識対象物5の画像領域のカラー画像信号に含まれる色情報RGBが入力されるRGB・HSV変換処理部221と、このHSV変換処理部221による変換出力が供給されるカラーヒストグラム生成処理部222と、このカラーヒストグラム生成処理部222により生成されたカラーヒストグラムを基準のカラーヒストグラムと比較するカラーヒストグラム比較処理部223からなる。
【0029】
上記RGB・HSV変換処理部221は、上記カラー画像信号に含まれる認識対象物の色情報RGBをR(Red:赤)G(Green:緑)B(Blue:青)空間からH(Hue:色相)S(Saturation:彩度)V(Value:明度)空間に変換する。また、上記カラーヒストグラム生成処理部222は、図7に示すように、上記RGB・HSV変換処理部221による変換出力として得られるH(色相)情報、S(彩度)情報、V(明度)情報の内の、H情報とS情報のカラーヒストグラムを作成する。
【0030】
そして、上記カラーヒストグラム比較処理部223は、上記カラーヒストグラム生成処理部222において作成されたカラーヒストグラムを上記認識対象物5の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物5を認識する。
【0031】
上記カラーヒストグラムを第1の特徴情報として認識対象物5を認識する処理では、例えば、図8に示すように、上記カラーヒストグラム生成処理部222において作成されたカラーヒストグラムと予め作成されている基準のカラーヒストグラムのバタチャリア(Bhattacharyya)距離を比較し、距離が最小になる基準のカラーヒストグラムの商品であると認識する。
【0032】
上記ステップST3の第1の認識処理では、上記ステップST31のカラーヒストグラム作成処理において、上記カラー画像信号に含まれる認識対象物の色情報RGBを上記RGB・HSV変換処理部221によりRGB空間からHSV空間に変換し、上記RGB・HSV変換処理部221による変換出力として得られるH(色相)情報、S(彩度)情報、V(明度)情報の内の、H情報とS情報のカラーヒストグラムを上記カラーヒストグラム生成処理部222により作成し、上記ステップST32の認識処理において、上記H情報とS情報のカラーヒストグラムを第1の特徴情報として認識対象物5を認識する処理を行う。
【0033】
すなわち、上記第1の認識処理部22は、上記制御部25による指示に基づいて、上記カラー画像信号に含まれる認識対象物5の色情報RGBをRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物5の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物5を認識する。
【0034】
ここで、この物体認識処理装置100において、上記基準のカラーヒストグラムは、各種認識対象物5について、上記第1の認識処理部22により図9のフローチャートに示す手順に従ってカラーヒストグラムの学習処理を行うことにより予め作成され、上記記憶部26に第1の特徴情報のデータベースとして保存されている。
【0035】
カラーヒストグラムの学習処理では、上記第1の認識処理部22により、上記第1の認識処理における上記認識対象物5の第1の特徴情報であるH(色相)情報とS(彩度)情報のカラーヒストグラムを作成して(ステップST131)、上記記憶部26に保存し(ステップST132)、上記カラーヒストグラムの保存数が必要なデータ数になったか否かを判定する処理(ステップST133)を繰り返し行うことにより、各種認識対象物の基準のカラーヒストグラムを作成して上記記憶部26に第1の特徴情報のデータベースを作成する。
【0036】
上記RGB・HSV変換処理部221による変換出力として得られるH(色相)情報、S(彩度)情報、V(明度)情報の内、V(明度)情報は、上記撮像部10による撮像の際の照明の影響を大きく受けるが、H(色相)情報、S(彩度)情報は、照明の影響が少ないので、この第1の認識処理部22のように、認識対象物5の色情報RGBをRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物5の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物5を的確に認識することができる。
【0037】
次に、上記制御部25は、上記第1の認識処理部22における第1の認識処理により上記認識対象物5の認識に成功したか否かを判定し(ステップST4)、その判定結果が「NO」、すなわち、上記認識対象物5の画像領域を抽出できなかった場合には、第2の認識処理部23によりカラー画像信号に含まれる輝度情報Yに基づく第2の認識処理を行い(ステップST5)、第1の認識処理により上記認識対象物5が認識され、「YES」の判定結果が得られると、認識結果を出力部24から出力する処理(ステップST6)を行う。
【0038】
上記ステップST5の第2の認識処理では、第2の認識処理部23により、図10のフローチャートに示すように、上記カラー画像信号に含まれる認識対象物の輝度情報YからScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し(ステップST51)、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、(ステップST52)、作成した上記ヒストグラムを上記認識対象物5の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物5を認識する処理を行う(ステップST53)。
【0039】
すなわち、上記第2の認識処理部23は、その機能構成を図11に示すように、上記撮像信号処理部21により抽出した認識対象物5の画像領域のカラー画像信号に含まれる輝度情報Yについて、SIFT法により特徴量を抽出する特徴量抽出処理部231と、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成する上記ステップST51の処理を行うストグラム生成処理部232と、上記ヒストグラム生成処理部222により作成した上記ヒストグラムを上記認識対象物5の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物5を認識する上記ステップST52の処理を行う認識処理部233からなる。
【0040】
上記特徴量抽出処理部231は、上記撮像信号処理部21から供給される輝度情報Yについて、平滑化処理部231A1によりガウス関数のスケールσを複数段階に変えた複数枚の平滑化画像を得て、スケールの異なる複数の平滑化画像に対してDoG(Difference of Gaussian)フィルタ231A2を適用し、そのDoGフィルタ出力画像(DoG画像)から極値検出部221A3により極値を検出してこの極値となる点を特徴点候補点とし、特徴点候補点から特徴点決定部231A4により特徴点を決定する処理を行う特徴点検出処理部221Aと、上記特徴点検出処理部231Aにより検出された各特徴点に対し、特徴量を算出する特徴量算出処理部231Bを備える。
【0041】
上記特徴量抽出処理部231では、上記特徴点検出処理部231Aにおいて、図12に示すように、上記平滑化処理部231A1により、入力画像Y(x,y)を一又は複数段階に縮小処理することにより解像度の異なる複数種類の入力画像を得て、縮小前の入力画像を含む各解像度の入力画像毎に、スケールσのガウス関数G(x,y,σ)と入力画像Y(x,y)を畳み込んだ平滑化画像L(x,y,σ)を異なる複数のスケールσについて求める。
【0042】
図12は、各解像度の入力画像に対し、スケールσを5段階に変化させて各段階毎の平滑化画像を得た例を示している。
【0043】
次に、上記平滑化処理部231A1により得られたスケールの異なる複数の平滑化画像に対してDoG(Difference of Gaussian)フィルタ231A2を適用し、そのDoGフィルタ出力画像(DoG画像)を得る。図12には、スケールの異なる平滑化画像間の差分処理(DoGフィルタ処理)により、各解像度毎に4枚のDoG画像が得られた例が示されている。
【0044】
ここで、スケールとDOGフィルタ出力の関係を図13に示す。
【0045】
そして、上記極値検出部221A3では、注目画素が26近傍領域において極値(極大値又は極小値)である場合に、その注目画素を特徴点候補とする。即ち、注目画素の周囲3×3領域の画素(計8画素)と、その注目画素を含むDoG画像(スケールσi)より一段下位のDoG画像(スケールσi-1)及び一段上位のDoG画像(スケールσi+1)における対応する領域(3×3領域)の画素(それぞれ計9画素)の、合わせて26画素に対し、注目画素が極値となるか否かを判断する。そして、極値である場合にその注目画素を特徴点候補とする。
【0046】
さらに、このようにして求めた特徴点候補点には、開口問題が発生しやすい点が含まれている可能性があるため、上記特徴点検出処理部231Aでは、上記特徴点決定部231A4により、図14に示すように、コントラストの低い点やエッジ上の候補点を削除し、より頑健な点を特徴点として抽出する。
【0047】
次に、上記特徴量抽出処理部231では、上記特徴量算出処理部231Bの方向ヒストグラム生成処理部231B1において、上記特徴点検出処理部231Aにより検出された特徴点毎に、その特徴点付近の方向ヒストグラムを生成する。すなわち、例えば図15の(A)に示すように、特徴点(keypoint)を中心とする基準領域(図中に四角の枠印で示した範囲)内の各画素につき、図15の(B)に示すように、輝度勾配m(x,y)とその勾配方向θ(x,y)を求める。なお、この基準領域の大きさは、特徴点が抽出されたDoG画像の平滑化スケールによって決定される。
【0048】
そして、求めた輝度勾配の大きさmと勾配方向θから、重み付き方向ヒストグラム作成処理部231B2により、図15の(C)に示すように、36方向に分割した重み付き方向ヒストグラムを作成する。そして、作成した36方向のヒストグラムから、ピーク値をとる方向を、その特徴点の基準勾配方向として割り当てる。
【0049】
このようにして、特徴点付近の方向ヒストグラムを作成することによりその特徴点の基準勾配方向を求め、特徴点の周辺領域を、その特徴点の基準勾配方向に回転することにより、度数(回転方向)の正規化を行うことで、回転に対する不変性を有する特徴量を得ることができるようになる。
【0050】
そして、上記特徴量算出処理部231Bでは、スケール不変特徴量算出処理部231B3により、スケール不変特徴量を算出する。すなわち、スケール不変特徴量算出処理部231B3では、図16に示すように、ガウス窓を用いて中心付近が強くなるように重み付けをする。このガウス窓の大きさは、特徴点が抽出されたDoG画像の平滑化スケールによって決定される。そのため、画像サイズが例えば2倍であれば、スケールも2倍となり、構造的に同一の範囲における特徴量が得られることとなる。これにより、スケール変化に対する不変性を有する特徴量を得ることができるようになる。このスケール不変特徴量算出処理部231B3では、基準領域を4×4の16領域に分割し、それぞれに8方向のヒストグラムを作成する。この結果、128次元ベクトルのスケール不変特徴量が得られることとなる。このようにして、全ての特徴点に対して特徴量(スケール不変特徴量)の算出を行う。
【0051】
上記Scale-Invariant Feature Transform(SIFT)法により算出されるSIFT特徴量は、スケール不変特徴量、特徴量を求める際のスケール情報(範囲)、及びその範囲の画像の回転情報で構成されている。スケール不変特徴量は、画像の拡大や縮小、回転に拘わらず不変なものである。そのため、入力画像中に対象物が含まれていれば、それがどのような大きさ、回転位置で含まれていても、入力画像の特徴量を比較することで、入力画像中の認識対象物を認識することができる。
【0052】
そして、上記ステップST52の処理を行うストグラム生成処理部232は、上記特徴量抽出処理部231で抽出した全ての特徴点のSIFT特徴量を、図17の(A)に示すように、予めK−means法によるクラスタリングにより決定されたクラスに対応する128次元の空間にプロットし、クラス毎に、そのクラスに属するSIFT特徴量の頻度を求めて、図17の(B)に示すように、クラスを横軸とするヒストグラムを作成し、上記ステップST53の処理を行う認識処理部232により、上記ヒストグラム生成処理部232により作成した上記ヒストグラムを上記認識対象物5の第2の特徴情報として、図17の(C)に示すように、予め作成されている基準のヒストグラムの比較することにより上記認識対象物5を認識する処理を行う。
【0053】
ここで、この物体認識処理装置100において、上記基準のヒストグラムは、各種認識対象物5について、上記第2の認識処理部22により図18のフローチャートに示す手順に従ってヒストグラムの学習処理を行うことにより予め作成され、上記記憶部26に第2の特徴情報のデータベースとして保存されている。
【0054】
この基準のヒストグラムの学習処理では、上記第2の認識処理部23により、各種認識対象物5について、第2の認識処理部23により、図19の(A)に示すように、上記カラー画像信号に含まれる認識対象物の輝度情報YからScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し(ステップST151)、抽出したSIFT特徴量について128次元の空間にプロットしてK−means法によるクラスタリングを行い、図19の(B)に示すように、認識対象物5毎に、クラス毎に、そのクラスに属する認識対象物5毎のSIFT特徴量の頻度を求めて、図19の(C)に示すように、クラスを横軸とするヒストグラムを作成し(ステップST152)、上記第2の認識処理における各種認識対象物5毎の第2の特徴情報であるヒストグラムを上記記憶部26に保存し(ステップST82)、上記ヒストグラムの保存数が必要なデータ数になったか否かを判定する処理(ステップST83)を繰り返し行うことにより、各種認識対象物の基準のヒストグラムを作成して上記記憶部26内に第2の特徴情報のデータベースを作成する。
【0055】
また、この物体認識処理装置100において、上記制御部25は、上記第1の上記認識処理部22により、認識対象物の基準のカラーヒストグラムを作成して保存する学習処理を行う際に、図20のフローチャートに示す誤認識の虞のある認識対象物を分類して保存しておき、上記第1の認識処理部22により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記第2の認識処理部23により上記認識対象物の認識処理を行うための決定木(decision tree)の学習処理を行う。
【0056】
すなわち、決定木(decision tree)の学習処理では、上記第1の認識処理部22により、カラーヒストグラムの学習処理により認識対象物の基準のカラーヒストグラムを作成して上記記憶部26に第1の特徴情報のデータベースを作成する際に(ステップST231)、作成した基準のカラーヒストグラムの認識対象物について、上記第1の認識処理部22により上記第1の認識を行い(ステップST231)、その認識結果に基づいて誤認識の虞のある認識対象物を分類し(ステップST232)、その分類結果を上記記憶部26に保存し(ステップST233)、上記分類結果を保存数が必要なデータ数になったか否かを判定する処理(ステップST134)を繰り返し行うことにより、上記記憶部26内に決定木(decision tree)のデータベースを作成する。
【0057】
そして、この物体認識処理装置100では、上記第1の認識処理部22における第1の認識処理により上記認識対象物5の認識に成功したか否かを判定する上記ステップST4において、上記記憶部26内の決定木(decision tree)のデータベースに基づいて、上記第1の認識処理部22により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記ステップST4における判定結果を「NO」として、上記第2の認識処理部23による第2の認識処理を行う。
【0058】
このような構成の物体認識処理装置100では、撮像部10により撮像された認識対象物のカラー画像信号について、第1の認識処理部22により、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、第2の認識処理部23により、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことにより、バーコードラベルや無線タグが付されていない商品を画像処理により短時間で精度良く認識できる。
【0059】
しかも、この物体認識処理装置100では、 上記第1の認識処理部22により上記認識対象物5の認識処理を行い、上記認識対象物を認識できない場合に、上記第2の認識処理部23により上記認識対象物の認識処理を行うので、上記認識対象物5の認識処理を迅速に行うことができる。
また、この物体認識処理装置100では、ケーキや野菜などを個体差のある商品を高精度且つ高速で認識することができる。
【0060】
ここで、上記物体認識処理装置100において、33種類のケーキを3個ずつ合計99個のサンプルについて、990枚の画像データを取り込んで、上記基準のカラーヒストグラムの学習処理による第1の特徴情報のデータベース、上記基準のストグラムの学習処理による第2の特徴情報のデータベース、上記決定木(decision tree)の学習処理による決定木(decision tree)のデータベースを上記記憶部26内に作成したところ、第1の特徴情報のデータベースを用いる第1の認識処理では、図21に示す、ミルクレープとプリンフルーツケーキの組、フルーツケーキと四種のチーズを使ったケーキの組、ブラックココアのミルクレープとショコラフランボワーズの組、ティラミスタルトとクランチショコラの組は、識別が困難であったが、これらの組のケーキは誤認識の虞のある認識対象物であるとして上記決定木(decision tree)の学習処理により決定木(decision tree)のデータベースが上記記憶部26内に作成されることにより、第2の特徴情報のデータベースを用いる第2の認識処理により認識することができ、認識率を高めることができた。
【符号の説明】
【0061】
10 撮像部、20 認識処理部、21 撮像信号処理部、22 第1の認識処理部、23 第2の認識処理部、24 出力部、25 制御部、26 記憶部、221 RGB・HSV変換処理部、222 カラーヒストグラム作成処理部、223 カラーヒストグラム比較処理部、231 特徴量抽出処理部、231A 特徴点検出処理部、231A1 平滑化処理部、231A2 DoGフィルタ、231A3 極値検出部、231A4 特徴点決定処理部、231B 特徴量算出処理部、231B1 方向ヒストグラム生成処理部、231B2 重み付き方向ヒストグラム作成処理部、231B3 スケール不変特徴量算出処理部、232 ヒストグラム生成処理部、233 認識処理部
【技術分野】
【0001】
本発明は、認識対象物を撮像して画像認識処理により認識する物体認識処理装置及び物体認識処理方法に関する。
【背景技術】
【0002】
一般に、スーパーマーケット等の店舗に設置されたレジカウンタにおいて商品チェックアウトを行う場合には、商品に付されたバーコードを読み取ることによって当該商品の価格等のデータを求め、そのデータをPOS装置に出力する事によって販売管理や在庫管理を効率的に行うことができる。
【0003】
バーコードリーダは、小売雑貨業において、レジでバーコードタグの付いた商品を識別するのに広く用いられている。商品は、そのバーコードにより、ホストコンピュータに記憶されたデータベースを用いて識別される。一般に、商品の説明およびその価格がレシートに印刷され、さらに商品がスキャンされる間、現在の価格合計が保持される。バーコードリーダの使用は、信頼性とレジにかかる時間の短縮などにより、一般に広く受け入れられている。
【0004】
また、近年、商品に無線タグを取り付け、無線タグのメモリにその無線タグを付した商品に関するデータ、例えば、商品コードを記憶させておき、そのデータを用いて商品販売データ処理や商品管理を実行するようにした各種の技術が提案され、実用化されている。また、無線タグのメモリに記憶されている商品コード等のデータを複数商品について一括して読み取ることで、効率的なチェックアウトを可能にする技術についても開発が進められ、一部実用化されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007−226320号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、例えば果実や野菜などの生鮮品のような未包装の商品では、バーコードラベルや無線タグを付けることが好ましくない場合もあり、バーコードラベルや無線タグが付されていない商品については、商品コードの入力が困難であるという問題がある。
また、ケーキや野菜などを店で会計する際、レジで値段を入力するのは効率悪く、また従業員に対して、すべての商品の値段を覚えるのが大変である。また、ケーキは作る人により個体差が生じ、また、野菜などは栽培環境や自然環境によりそれぞれの形状に個体差が生じる。
【0007】
そこで、本発明の目的は、上記従来の課題を解決するものであり、バーコードラベルや無線タグが付されていない商品を画像認識処理により短時間で精度良く認識できる物体認識処理装置及び物体認識処理方法を提供することにある。
また、本発明の目的は、個体差のある物体の認識を高精度且つ高速で可能にした物体認識装置及び物体認識方法を提供することにある。
【0008】
本発明の他の目的、本発明によって得られる具体的な利点は、以下に説明される実施の形態の説明から一層明らかにされる。
【課題を解決するための手段】
【0009】
本発明に係る物体認識処理装置は、認識対象物を撮像する撮像部と、上記撮像部により撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理部とを備え、上記認識処理部は、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理部と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理部を備えることを特徴とする。
【0010】
本発明に係る物体認識処理装置において、上記認識処理部は、例えば、上記第1の認識処理部による認識処理に用いる認識対象物の基準のカラーヒストグラムを作成して保存する学習処理と、認識対象物のSIFT特徴量についてK−means法によるクラスタリングを行い、上記第2の認識処理部による認識処理に用いるヒストグラムを作成して保存する学習処理を予め行うものとすることができる。
【0011】
また、本発明に係る物体認識処理装置は、例えば、上記第1の認識処理部により上記認識対象物の認識処理を行い、上記認識対象物を認識できない場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うものとすることができる。
【0012】
さらに、本発明に係る物体認識処理装置において、上記認識処理部は、例えば、上記認識対象物の基準のカラーヒストグラムを作成して保存する学習処理を行う際に、誤認識の虞のある認識対象物を分類して保存しておき、上記第1の認識処理部により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うものとすることができる。
【0013】
本発明に係る物体認識処理方法は、認識対象物を撮像する撮像ステップと、上記撮像ステップにおいて撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理ステップとを有し、上記認識処理ステップでは、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことを特徴とする。
【発明の効果】
【0014】
本発明によれば、撮像部により撮像された認識対象物のカラー画像信号について、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことにより、バーコードラベルや無線タグが付されていない商品を画像処理により短時間で精度良く認識できる。
【図面の簡単な説明】
【0015】
【図1】本発明を適用した物体認識処理装置の構成例を示すブロック図である。
【図2】上記物体認識処理装置の外観斜視図である。
【図3】上記物体認識処理装置における認識処理の手順を示すフローチャートである。
【図4】上記認識処理における前処理の手順を示すフローチャートである。
【図5】上記認識処理における第1の認識処理の手順を示すフローチャートである。
【図6】上記第1の認識処理を行う第1の認識処理部の機能構成を示すブロック図である。
【図7】上記第1の認識処理部におけるカラーヒストグラム生成処理部によるカラーヒストグラムの作成例を示す図である。
【図8】上記第1の認識処理部におけるカラーヒストグラム比較処理部によるカラーヒストグラムの比較例を示す図である。
【図9】上記第1の認識処理部により行われる第1の認識処理に用いられる基準のカラーヒストグラムを作成する学習処理の手順を示すフローチャートである。
【図10】上記認識処理における第2の認識処理の手順を示すフローチャートである。
【図11】上記第2の認識処理を行う第2の認識処理部の機能構成を示すブロック図である。
【図12】上記第2の認識処理部において特徴点検出処理部により行われる特徴点検出処理を模式的に示す図である。
【図13】上記特徴点検出処理部の平滑化処理部におけるスケールとDOGフィルタ出力の関係を示す図である。
【図14】上記特徴点検出処理部の特徴点決定部における特徴点決定例を示す図である。
【図15】上記第2の認識処理部において特徴量抽出処理部により作成される重み付け方向ヒストグラムの作成例を示す図である。
【図16】上記第2の認識処理部においてスケール不変特徴量算出処理部でスケール不変特徴量を算出することにより作成される特徴ベクトルの例を示す図である。
【図17】上記第2の認識処理部において行われる第2の認識処理を模式的に示す図である。
【図18】上記第2の認識処理部により行われる第2の認識処理に用いられる基準のヒストグラムを作成する学習処理の手順を示すフローチャートである。
【図19】上記基準のヒストグラムを作成する学習処理を模式的に示す図である。
【図20】上記物体認識処理装置において上記第1の上記認識処理部により行われる認識対象物の認識処理を行うための決定木(decision tree)の学習処理の手順を示すフローチャートである。
【図21】上記第1の上記認識処理部における第1の特徴情報のデータベースを用いる第1の認識処理では、認識対象物が誤認識される虞のある例を示す図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明は以下の例に限定されるものではなく、本発明の要旨を逸脱しない範囲で、任意に変更可能であることは言うまでもない。
【0017】
本発明は、例えば図1に示すような構成の物体認識処理装置100に適用される。
【0018】
この物体認識処理装置100は、認識対象物を撮像するための撮像部10と、上記撮像部10により撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理部20とを備からなる。
【0019】
上記認識処理部20は、上記撮像部10から撮像出力として出力されたカラー画像信号が入力される撮像信号処理部21、この撮像信号処理部21により処理された認識処理対象のカラー画像信号に含まれる色情報RGBが供給される第1の認識処理部22、上記撮像信号処理部21により処理された認識処理対象のカラー画像信号に含まれる輝度情報Yが供給される第2の認識処理部23、上記第1の認識処理部22及び第2の認識処理部23による認識処理結果を出力する出力部24、これら各部の動作を制御する制御部25、この制御部25に接続された記憶部26などからなる。
【0020】
この物体認識処理装置100は、従来のPOSシステムでは管理しにくい、バーコードラベルや無線タグを付けることが好ましくない商品、例えば果実や野菜などの生鮮品やケーキのような商品を認識対象物とし、画像認識処理により識別して認識するものであって、図2に示すように、上記撮像部10は、テーブル1上に載置される認識対象物5を上方から撮像するWEBカメラからなり、WEBカメラがUSBケーブルを介して接続されたコンピュータからなる上記認識処理部20に、撮像出力としてカラー画像信号を供給するようになっている。
【0021】
そして、この物体認識処理装置100において、上記制御部25は、上記テーブル1上に載置された認識対象物5の認識処理を図3のフローチャートに示す手順に従って行うように、撮像信号処理部21、第1の認識処理部22、第2の認識処理部23、出力部24の動作を制御する。
【0022】
すなわち、この物体認識処理装置100では、上記撮像信号処理部21において、上記撮像部10により得られたカラー画像信号から認識対象物5の画像領域を抽出する前処理(ステップST1)を行う。
【0023】
上記ステップST1の前処理では、上記制御部25による指示に基づいて、上記撮像信号処理部21は、図4のフローチャートに示すように、上記撮像部10から供給されるカラー画像信号をキャプチャーし(ステップST11)、キャプチャーしたカラー画像信号から認識対象物5の画像領域を抽出する処理を行う(ステップST12)。
【0024】
そして、上記撮像信号処理部21は、抽出した認識対象物5の画像領域のカラー画像信号に含まれる色情報R(Red:赤)G(Green:緑)B(Blue:青)を上記第1の認識処理部22に供給し、また、抽出した認識対象物5の画像領域のカラー画像信号に含まれる輝度情報Yを上記第2の認識処理部23に供給する。
【0025】
ここで、上記ステップST12における認識対象物5の画像領域を抽出する処理では、例えば、上記制御部25による指示に基づき、予め、上記テーブル1上に認識対象物5が載置されていない状態で上記撮像部10による撮像出力として得られるカラー画像信号を上記撮像信号処理部21でキャプチャーすることにより背景画像情報を得て記憶部26に保存しておき、上記撮像信号処理部21により認識対象物5の画像領域を抽出する処理を行う際にキャプチャーしたカラー画像信号と上記背景画像情報との差分検出を行うことにより、認識対象物5の画像領域を抽出する。
【0026】
次に、上記制御部25は、上記認識対象物5の画像領域の抽出に成功したか否かを判定し(ステップST2)、その判定結果が「NO」、すなわち、上記認識対象物5の画像領域を抽出できなかった場合には、上記ステップST1の前処理を繰り返し行い、上記認識対象物5の画像領域が抽出され、「YES」の判定結果が得られると、第1の認識処理部22によりカラー画像信号に含まれる色情報R(Red:赤)G(Green:緑)B(Blue:青)に基づく第1の認識処理を行う(ステップST3)。
【0027】
このステップST3の第1の認識処理では、第1の認識処理部22により、図5のフローチャートに示すように、カラー画像信号に含まれる色情報R(Red:赤)G(Green:緑)B(Blue:青)からカラーヒストグラムを作成し(ステップST31)、作成したカラーヒストグラムを基準のカラーヒストグラムと比較することにより、上記認識対象物5を認識する処理を行う(ステップST32)。
【0028】
ここで、上記第1の認識処理部22は、その機能構成を図6に示すように、上記撮像信号処理部21により抽出した認識対象物5の画像領域のカラー画像信号に含まれる色情報RGBが入力されるRGB・HSV変換処理部221と、このHSV変換処理部221による変換出力が供給されるカラーヒストグラム生成処理部222と、このカラーヒストグラム生成処理部222により生成されたカラーヒストグラムを基準のカラーヒストグラムと比較するカラーヒストグラム比較処理部223からなる。
【0029】
上記RGB・HSV変換処理部221は、上記カラー画像信号に含まれる認識対象物の色情報RGBをR(Red:赤)G(Green:緑)B(Blue:青)空間からH(Hue:色相)S(Saturation:彩度)V(Value:明度)空間に変換する。また、上記カラーヒストグラム生成処理部222は、図7に示すように、上記RGB・HSV変換処理部221による変換出力として得られるH(色相)情報、S(彩度)情報、V(明度)情報の内の、H情報とS情報のカラーヒストグラムを作成する。
【0030】
そして、上記カラーヒストグラム比較処理部223は、上記カラーヒストグラム生成処理部222において作成されたカラーヒストグラムを上記認識対象物5の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物5を認識する。
【0031】
上記カラーヒストグラムを第1の特徴情報として認識対象物5を認識する処理では、例えば、図8に示すように、上記カラーヒストグラム生成処理部222において作成されたカラーヒストグラムと予め作成されている基準のカラーヒストグラムのバタチャリア(Bhattacharyya)距離を比較し、距離が最小になる基準のカラーヒストグラムの商品であると認識する。
【0032】
上記ステップST3の第1の認識処理では、上記ステップST31のカラーヒストグラム作成処理において、上記カラー画像信号に含まれる認識対象物の色情報RGBを上記RGB・HSV変換処理部221によりRGB空間からHSV空間に変換し、上記RGB・HSV変換処理部221による変換出力として得られるH(色相)情報、S(彩度)情報、V(明度)情報の内の、H情報とS情報のカラーヒストグラムを上記カラーヒストグラム生成処理部222により作成し、上記ステップST32の認識処理において、上記H情報とS情報のカラーヒストグラムを第1の特徴情報として認識対象物5を認識する処理を行う。
【0033】
すなわち、上記第1の認識処理部22は、上記制御部25による指示に基づいて、上記カラー画像信号に含まれる認識対象物5の色情報RGBをRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物5の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物5を認識する。
【0034】
ここで、この物体認識処理装置100において、上記基準のカラーヒストグラムは、各種認識対象物5について、上記第1の認識処理部22により図9のフローチャートに示す手順に従ってカラーヒストグラムの学習処理を行うことにより予め作成され、上記記憶部26に第1の特徴情報のデータベースとして保存されている。
【0035】
カラーヒストグラムの学習処理では、上記第1の認識処理部22により、上記第1の認識処理における上記認識対象物5の第1の特徴情報であるH(色相)情報とS(彩度)情報のカラーヒストグラムを作成して(ステップST131)、上記記憶部26に保存し(ステップST132)、上記カラーヒストグラムの保存数が必要なデータ数になったか否かを判定する処理(ステップST133)を繰り返し行うことにより、各種認識対象物の基準のカラーヒストグラムを作成して上記記憶部26に第1の特徴情報のデータベースを作成する。
【0036】
上記RGB・HSV変換処理部221による変換出力として得られるH(色相)情報、S(彩度)情報、V(明度)情報の内、V(明度)情報は、上記撮像部10による撮像の際の照明の影響を大きく受けるが、H(色相)情報、S(彩度)情報は、照明の影響が少ないので、この第1の認識処理部22のように、認識対象物5の色情報RGBをRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物5の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物5を的確に認識することができる。
【0037】
次に、上記制御部25は、上記第1の認識処理部22における第1の認識処理により上記認識対象物5の認識に成功したか否かを判定し(ステップST4)、その判定結果が「NO」、すなわち、上記認識対象物5の画像領域を抽出できなかった場合には、第2の認識処理部23によりカラー画像信号に含まれる輝度情報Yに基づく第2の認識処理を行い(ステップST5)、第1の認識処理により上記認識対象物5が認識され、「YES」の判定結果が得られると、認識結果を出力部24から出力する処理(ステップST6)を行う。
【0038】
上記ステップST5の第2の認識処理では、第2の認識処理部23により、図10のフローチャートに示すように、上記カラー画像信号に含まれる認識対象物の輝度情報YからScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し(ステップST51)、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、(ステップST52)、作成した上記ヒストグラムを上記認識対象物5の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物5を認識する処理を行う(ステップST53)。
【0039】
すなわち、上記第2の認識処理部23は、その機能構成を図11に示すように、上記撮像信号処理部21により抽出した認識対象物5の画像領域のカラー画像信号に含まれる輝度情報Yについて、SIFT法により特徴量を抽出する特徴量抽出処理部231と、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成する上記ステップST51の処理を行うストグラム生成処理部232と、上記ヒストグラム生成処理部222により作成した上記ヒストグラムを上記認識対象物5の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物5を認識する上記ステップST52の処理を行う認識処理部233からなる。
【0040】
上記特徴量抽出処理部231は、上記撮像信号処理部21から供給される輝度情報Yについて、平滑化処理部231A1によりガウス関数のスケールσを複数段階に変えた複数枚の平滑化画像を得て、スケールの異なる複数の平滑化画像に対してDoG(Difference of Gaussian)フィルタ231A2を適用し、そのDoGフィルタ出力画像(DoG画像)から極値検出部221A3により極値を検出してこの極値となる点を特徴点候補点とし、特徴点候補点から特徴点決定部231A4により特徴点を決定する処理を行う特徴点検出処理部221Aと、上記特徴点検出処理部231Aにより検出された各特徴点に対し、特徴量を算出する特徴量算出処理部231Bを備える。
【0041】
上記特徴量抽出処理部231では、上記特徴点検出処理部231Aにおいて、図12に示すように、上記平滑化処理部231A1により、入力画像Y(x,y)を一又は複数段階に縮小処理することにより解像度の異なる複数種類の入力画像を得て、縮小前の入力画像を含む各解像度の入力画像毎に、スケールσのガウス関数G(x,y,σ)と入力画像Y(x,y)を畳み込んだ平滑化画像L(x,y,σ)を異なる複数のスケールσについて求める。
【0042】
図12は、各解像度の入力画像に対し、スケールσを5段階に変化させて各段階毎の平滑化画像を得た例を示している。
【0043】
次に、上記平滑化処理部231A1により得られたスケールの異なる複数の平滑化画像に対してDoG(Difference of Gaussian)フィルタ231A2を適用し、そのDoGフィルタ出力画像(DoG画像)を得る。図12には、スケールの異なる平滑化画像間の差分処理(DoGフィルタ処理)により、各解像度毎に4枚のDoG画像が得られた例が示されている。
【0044】
ここで、スケールとDOGフィルタ出力の関係を図13に示す。
【0045】
そして、上記極値検出部221A3では、注目画素が26近傍領域において極値(極大値又は極小値)である場合に、その注目画素を特徴点候補とする。即ち、注目画素の周囲3×3領域の画素(計8画素)と、その注目画素を含むDoG画像(スケールσi)より一段下位のDoG画像(スケールσi-1)及び一段上位のDoG画像(スケールσi+1)における対応する領域(3×3領域)の画素(それぞれ計9画素)の、合わせて26画素に対し、注目画素が極値となるか否かを判断する。そして、極値である場合にその注目画素を特徴点候補とする。
【0046】
さらに、このようにして求めた特徴点候補点には、開口問題が発生しやすい点が含まれている可能性があるため、上記特徴点検出処理部231Aでは、上記特徴点決定部231A4により、図14に示すように、コントラストの低い点やエッジ上の候補点を削除し、より頑健な点を特徴点として抽出する。
【0047】
次に、上記特徴量抽出処理部231では、上記特徴量算出処理部231Bの方向ヒストグラム生成処理部231B1において、上記特徴点検出処理部231Aにより検出された特徴点毎に、その特徴点付近の方向ヒストグラムを生成する。すなわち、例えば図15の(A)に示すように、特徴点(keypoint)を中心とする基準領域(図中に四角の枠印で示した範囲)内の各画素につき、図15の(B)に示すように、輝度勾配m(x,y)とその勾配方向θ(x,y)を求める。なお、この基準領域の大きさは、特徴点が抽出されたDoG画像の平滑化スケールによって決定される。
【0048】
そして、求めた輝度勾配の大きさmと勾配方向θから、重み付き方向ヒストグラム作成処理部231B2により、図15の(C)に示すように、36方向に分割した重み付き方向ヒストグラムを作成する。そして、作成した36方向のヒストグラムから、ピーク値をとる方向を、その特徴点の基準勾配方向として割り当てる。
【0049】
このようにして、特徴点付近の方向ヒストグラムを作成することによりその特徴点の基準勾配方向を求め、特徴点の周辺領域を、その特徴点の基準勾配方向に回転することにより、度数(回転方向)の正規化を行うことで、回転に対する不変性を有する特徴量を得ることができるようになる。
【0050】
そして、上記特徴量算出処理部231Bでは、スケール不変特徴量算出処理部231B3により、スケール不変特徴量を算出する。すなわち、スケール不変特徴量算出処理部231B3では、図16に示すように、ガウス窓を用いて中心付近が強くなるように重み付けをする。このガウス窓の大きさは、特徴点が抽出されたDoG画像の平滑化スケールによって決定される。そのため、画像サイズが例えば2倍であれば、スケールも2倍となり、構造的に同一の範囲における特徴量が得られることとなる。これにより、スケール変化に対する不変性を有する特徴量を得ることができるようになる。このスケール不変特徴量算出処理部231B3では、基準領域を4×4の16領域に分割し、それぞれに8方向のヒストグラムを作成する。この結果、128次元ベクトルのスケール不変特徴量が得られることとなる。このようにして、全ての特徴点に対して特徴量(スケール不変特徴量)の算出を行う。
【0051】
上記Scale-Invariant Feature Transform(SIFT)法により算出されるSIFT特徴量は、スケール不変特徴量、特徴量を求める際のスケール情報(範囲)、及びその範囲の画像の回転情報で構成されている。スケール不変特徴量は、画像の拡大や縮小、回転に拘わらず不変なものである。そのため、入力画像中に対象物が含まれていれば、それがどのような大きさ、回転位置で含まれていても、入力画像の特徴量を比較することで、入力画像中の認識対象物を認識することができる。
【0052】
そして、上記ステップST52の処理を行うストグラム生成処理部232は、上記特徴量抽出処理部231で抽出した全ての特徴点のSIFT特徴量を、図17の(A)に示すように、予めK−means法によるクラスタリングにより決定されたクラスに対応する128次元の空間にプロットし、クラス毎に、そのクラスに属するSIFT特徴量の頻度を求めて、図17の(B)に示すように、クラスを横軸とするヒストグラムを作成し、上記ステップST53の処理を行う認識処理部232により、上記ヒストグラム生成処理部232により作成した上記ヒストグラムを上記認識対象物5の第2の特徴情報として、図17の(C)に示すように、予め作成されている基準のヒストグラムの比較することにより上記認識対象物5を認識する処理を行う。
【0053】
ここで、この物体認識処理装置100において、上記基準のヒストグラムは、各種認識対象物5について、上記第2の認識処理部22により図18のフローチャートに示す手順に従ってヒストグラムの学習処理を行うことにより予め作成され、上記記憶部26に第2の特徴情報のデータベースとして保存されている。
【0054】
この基準のヒストグラムの学習処理では、上記第2の認識処理部23により、各種認識対象物5について、第2の認識処理部23により、図19の(A)に示すように、上記カラー画像信号に含まれる認識対象物の輝度情報YからScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し(ステップST151)、抽出したSIFT特徴量について128次元の空間にプロットしてK−means法によるクラスタリングを行い、図19の(B)に示すように、認識対象物5毎に、クラス毎に、そのクラスに属する認識対象物5毎のSIFT特徴量の頻度を求めて、図19の(C)に示すように、クラスを横軸とするヒストグラムを作成し(ステップST152)、上記第2の認識処理における各種認識対象物5毎の第2の特徴情報であるヒストグラムを上記記憶部26に保存し(ステップST82)、上記ヒストグラムの保存数が必要なデータ数になったか否かを判定する処理(ステップST83)を繰り返し行うことにより、各種認識対象物の基準のヒストグラムを作成して上記記憶部26内に第2の特徴情報のデータベースを作成する。
【0055】
また、この物体認識処理装置100において、上記制御部25は、上記第1の上記認識処理部22により、認識対象物の基準のカラーヒストグラムを作成して保存する学習処理を行う際に、図20のフローチャートに示す誤認識の虞のある認識対象物を分類して保存しておき、上記第1の認識処理部22により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記第2の認識処理部23により上記認識対象物の認識処理を行うための決定木(decision tree)の学習処理を行う。
【0056】
すなわち、決定木(decision tree)の学習処理では、上記第1の認識処理部22により、カラーヒストグラムの学習処理により認識対象物の基準のカラーヒストグラムを作成して上記記憶部26に第1の特徴情報のデータベースを作成する際に(ステップST231)、作成した基準のカラーヒストグラムの認識対象物について、上記第1の認識処理部22により上記第1の認識を行い(ステップST231)、その認識結果に基づいて誤認識の虞のある認識対象物を分類し(ステップST232)、その分類結果を上記記憶部26に保存し(ステップST233)、上記分類結果を保存数が必要なデータ数になったか否かを判定する処理(ステップST134)を繰り返し行うことにより、上記記憶部26内に決定木(decision tree)のデータベースを作成する。
【0057】
そして、この物体認識処理装置100では、上記第1の認識処理部22における第1の認識処理により上記認識対象物5の認識に成功したか否かを判定する上記ステップST4において、上記記憶部26内の決定木(decision tree)のデータベースに基づいて、上記第1の認識処理部22により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記ステップST4における判定結果を「NO」として、上記第2の認識処理部23による第2の認識処理を行う。
【0058】
このような構成の物体認識処理装置100では、撮像部10により撮像された認識対象物のカラー画像信号について、第1の認識処理部22により、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、第2の認識処理部23により、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことにより、バーコードラベルや無線タグが付されていない商品を画像処理により短時間で精度良く認識できる。
【0059】
しかも、この物体認識処理装置100では、 上記第1の認識処理部22により上記認識対象物5の認識処理を行い、上記認識対象物を認識できない場合に、上記第2の認識処理部23により上記認識対象物の認識処理を行うので、上記認識対象物5の認識処理を迅速に行うことができる。
また、この物体認識処理装置100では、ケーキや野菜などを個体差のある商品を高精度且つ高速で認識することができる。
【0060】
ここで、上記物体認識処理装置100において、33種類のケーキを3個ずつ合計99個のサンプルについて、990枚の画像データを取り込んで、上記基準のカラーヒストグラムの学習処理による第1の特徴情報のデータベース、上記基準のストグラムの学習処理による第2の特徴情報のデータベース、上記決定木(decision tree)の学習処理による決定木(decision tree)のデータベースを上記記憶部26内に作成したところ、第1の特徴情報のデータベースを用いる第1の認識処理では、図21に示す、ミルクレープとプリンフルーツケーキの組、フルーツケーキと四種のチーズを使ったケーキの組、ブラックココアのミルクレープとショコラフランボワーズの組、ティラミスタルトとクランチショコラの組は、識別が困難であったが、これらの組のケーキは誤認識の虞のある認識対象物であるとして上記決定木(decision tree)の学習処理により決定木(decision tree)のデータベースが上記記憶部26内に作成されることにより、第2の特徴情報のデータベースを用いる第2の認識処理により認識することができ、認識率を高めることができた。
【符号の説明】
【0061】
10 撮像部、20 認識処理部、21 撮像信号処理部、22 第1の認識処理部、23 第2の認識処理部、24 出力部、25 制御部、26 記憶部、221 RGB・HSV変換処理部、222 カラーヒストグラム作成処理部、223 カラーヒストグラム比較処理部、231 特徴量抽出処理部、231A 特徴点検出処理部、231A1 平滑化処理部、231A2 DoGフィルタ、231A3 極値検出部、231A4 特徴点決定処理部、231B 特徴量算出処理部、231B1 方向ヒストグラム生成処理部、231B2 重み付き方向ヒストグラム作成処理部、231B3 スケール不変特徴量算出処理部、232 ヒストグラム生成処理部、233 認識処理部
【特許請求の範囲】
【請求項1】
認識対象物を撮像する撮像部と、
上記撮像部より撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理部とを備え、
上記認識処理部は、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理部と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている基準のヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理部を備える
ことを特徴とする物体認識処理装置。
【請求項2】
上記認識処理部は、上記第1の認識処理部による認識処理に用いる基準のカラーヒストグラムを認識対象物毎に作成して保存する学習処理と、認識対象物のSIFT特徴量についてK−means法によるクラスタリングを行い、上記第2の認識処理部による認識処理に用いる基準のヒストグラムを認識対象物毎に作成して保存する学習処理を予め行うことを特徴とする請求項1記載の物体認識処理装置。
【請求項3】
上記第1の認識処理部により上記認識対象物の認識処理を行い、上記認識対象物を認識できない場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うことを特徴とする請求項1記載の物体認識処理装置。
【請求項4】
上記認識処理部は、上記認識対象物の基準のカラーヒストグラムを作成して保存する学習処理を行う際に、誤認識の虞のある認識対象物を分類して保存しておき、上記第1の認識処理部により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うことを特徴とする請求項1記載の物体認識処理装置。
【請求項5】
認識対象物を撮像する撮像ステップと、
上記撮像ステップにおいて撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理ステップとを有し、
上記認識処理ステップでは、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことを特徴とする物体認識処理方法。
【請求項1】
認識対象物を撮像する撮像部と、
上記撮像部より撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理部とを備え、
上記認識処理部は、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理部と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている基準のヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理部を備える
ことを特徴とする物体認識処理装置。
【請求項2】
上記認識処理部は、上記第1の認識処理部による認識処理に用いる基準のカラーヒストグラムを認識対象物毎に作成して保存する学習処理と、認識対象物のSIFT特徴量についてK−means法によるクラスタリングを行い、上記第2の認識処理部による認識処理に用いる基準のヒストグラムを認識対象物毎に作成して保存する学習処理を予め行うことを特徴とする請求項1記載の物体認識処理装置。
【請求項3】
上記第1の認識処理部により上記認識対象物の認識処理を行い、上記認識対象物を認識できない場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うことを特徴とする請求項1記載の物体認識処理装置。
【請求項4】
上記認識処理部は、上記認識対象物の基準のカラーヒストグラムを作成して保存する学習処理を行う際に、誤認識の虞のある認識対象物を分類して保存しておき、上記第1の認識処理部により認識した認識対象物が上記誤認識の虞のある認識対象物である場合に、上記第2の認識処理部により上記認識対象物の認識処理を行うことを特徴とする請求項1記載の物体認識処理装置。
【請求項5】
認識対象物を撮像する撮像ステップと、
上記撮像ステップにおいて撮像された認識対象物のカラー画像信号について、認識対象物の認識処理を行う認識処理ステップとを有し、
上記認識処理ステップでは、上記カラー画像信号に含まれる認識対象物の色情報をRGB色空間からHSV色空間に変換して、H(色相)情報とS(彩度)情報のカラーヒストグラムを作成し、上記カラーヒストグラムを上記認識対象物の第1の特徴情報として、予め作成されている基準のカラーヒストグラムと比較することにより上記認識対象物を認識する第1の認識処理と、上記カラー画像信号に含まれる認識対象物の輝度情報からScale-Invariant Feature Transform(SIFT)法により特徴量を抽出し、抽出したSIFT特徴量についてK−means法によるクラスタリングに対応したクラスを横軸としたヒストグラムを作成し、作成した上記ヒストグラムを上記認識対象物の第2の特徴情報として、予め作成されている各クラスのヒストグラムと比較することにより上記認識対象物を認識する第2の認識処理を行うことを特徴とする物体認識処理方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【公開番号】特開2012−150552(P2012−150552A)
【公開日】平成24年8月9日(2012.8.9)
【国際特許分類】
【出願番号】特願2011−7059(P2011−7059)
【出願日】平成23年1月17日(2011.1.17)
【出願人】(592124148)株式会社堀内電機製作所 (1)
【Fターム(参考)】
【公開日】平成24年8月9日(2012.8.9)
【国際特許分類】
【出願日】平成23年1月17日(2011.1.17)
【出願人】(592124148)株式会社堀内電機製作所 (1)
【Fターム(参考)】
[ Back to top ]