説明

物体形状推定装置

【課題】多様な形状をとり得る物体の輪郭形状を少ない処理負荷で推定でき、背景や対象物細部の影響による輪郭形状の誤推定が減じられた物体形状推定装置を実現する。
【解決手段】画像中の所定物体の形状を推定する物体形状推定装置3であって、推定用記憶部30は、様々な形状の所定物体をかたどった物体領域と背景領域とに異なる画素値が設定された複数の形状画像と、複数の形状画像を非線形次元圧縮処理して得られた低次元の形状特徴空間における形状画像それぞれの座標値とを格納した形状画像データベース301と、所定物体が撮像された物体画像を形状特徴空間に写像する回帰モデル300とを予め記憶し、入力画像写像部321は入力画像を回帰モデル300により写像して写像値を算出し、形状推定部322は形状画像の中から座標値が写像値と類似する形状画像を検出し、検出した形状画像の物体領域から推定対象の形状を求める。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像中の対象物の形状を推定する物体形状推定装置に関する。
【背景技術】
【0002】
監視カメラを用いて車両等の対象物を監視するために画像中の対象物の追跡、姿勢判定、検索などが盛んに研究されている。これらを高精度に行うためには対象物の形状のとおりの領域を背景から正確に分離する必要がある。
【0003】
対象物の形状を判定するためにその輪郭形状を表した形状パターンを用いる方法があり、典型的には形状パターンで画像中を探索するパターンマッチングが行なわれる。形状パターンを用いる方法は、見た目そのままの輪郭を連続的になぞるだけで正確な参照データを作成でき、マッチしたときに得られる領域が正確である、といった利点を有する。
【0004】
しかし、対象物の見かけ上の形状は、その姿勢の変化、カメラアングルの違い、車種の違いなどにより多様である。そのため、従来、これらの変化や違いを考慮した多数の形状パターンを用意してパターンマッチングを行なっていた。
【0005】
特許文献1には、車両の輪郭線を表す車両形状パターンを十分な車種数だけ用意しておき、走行車両が撮像された画像から輪郭線の特徴量を抽出して各車両形状パターンとのパターンマッチングを行なうことが記載されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2003−242595
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来技術では形状パターンの数だけパターンマッチングを繰り返すため処理負荷が大きく、リアルタイム処理できる装置を実現するには計算コストが掛かりすぎていた。
【0008】
また、従来技術では背景や対象物細部(車両の窓枠やライトなど)を対象物の輪郭形状と誤ってマッチングしてしまうことが多かった。
【0009】
本発明は、上記問題を鑑みてなされたものであり、形状パターンを用いる利点を活かしつつ、多様な形状をとり得る対象物の輪郭形状を少ない処理負荷で推定できる物体形状推定装置を実現することを目的とする。また本発明は、背景や対象物細部の影響による誤推定を減じた物体形状推定装置を実現することをもうひとつの目的とする。
【課題を解決するための手段】
【0010】
本発明に係る物体形状推定装置は、画像中に撮像された所定物体の形状を推定する物体形状推定装置であって、予め、様々な形状の所定物体をかたどった物体領域と背景領域とに異なる画素値が設定された複数の形状画像と、複数の形状画像を非線形次元圧縮処理して得られた低次元の形状特徴空間における形状画像それぞれの座標値と、所定物体が撮像された物体画像を形状特徴空間に写像する写像関数と、を記憶した記憶部と、推定対象の所定物体が撮像された入力画像を取得する画像取得部と、入力画像を写像関数により写像して写像値を算出する入力画像写像部と、形状画像の中から座標値が写像値と類似する形状画像を検出し、検出した形状画像の物体領域から推定対象の形状を求める形状推定部と、を備えたことを特徴とする。
【0011】
上記本発明に係る物体形状推定装置において、形状特徴空間は、形状画像のうち互いの物体領域同士の非重複度が所定基準より小さな類似形状画像の間で座標値の近接関係を維持して非線形次元圧縮処理された特徴空間であることを特徴とする。
【0012】
また、上記本発明に係る物体形状推定装置において、複数の形状画像にローカリー・リニア・エンベッディング法を適用して得られた特徴空間であることを特徴とする。
【0013】
また、上記本発明に係る物体形状推定装置において、形状推定部は、座標値と写像値との距離が近い順に所定数の形状画像を検出し、所定数の形状画像における物体領域を合成して推定対象の形状を求めることを特徴とする。
【0014】
また、上記本発明に係る物体形状推定装置において、形状画像は、物体領域と背景領域との境界付近における画素値が平滑化処理された画像であることを特徴とする。
【0015】
また、上記本発明に係る物体形状推定装置において、写像関数は、物体画像と形状特徴空間とを回帰分析することにより得られた回帰モデルであることを特徴とする。
【発明の効果】
【0016】
本発明によれば、物体領域を画素単位で表した形状画像を用いることで多様で非線形に変化する物体形状を高精度に推定でき、入力画像を写像することで推定を行なうため少ない処理負荷で推定が可能となる。
【0017】
また、本発明によれば、形状画像を非線形次元圧縮した形状特徴空間を用いて推定することで形状変化に本質的に寄与する成分に基づいた推定ができるため、背景の影響による誤推定や、物体の内部形状による誤推定を減じることができる。
【図面の簡単な説明】
【0018】
【図1】形状推定装置が行う処理の概要を説明する図である。
【図2】形状推定システム1の構成を表すブロック図である。
【図3】車両形状画像を例示した図である。
【図4】標本車両画像及び車両形状画像を例示した図である。
【図5】形状特徴空間を例示した図である。
【図6】回帰モデルを例示した図である。
【図7】学習装置2による学習処理のフローチャートである。
【図8】形状推定装置3による形状推定処理のフローチャートである。
【発明を実施するための形態】
【0019】
本発明の好適な実施形態の一例として、車両を対象物とし、画像中の車両の形状を推定する形状推定装置について説明する。
【0020】
まず図1を参照して本発明に係る形状推定装置が行う処理の概要を説明する。
【0021】
形状推定装置は、車両が背景とともに撮像された車両画像(入力画像100)が入力されると、当該車両の形状を推定する形状推定処理を行い、入力画像100において当該車両が撮像されていると推定される車両領域113と当該車両が撮像されていないと推定される背景領域114とで異なる画素値を設定した推定形状画像112を出力する。
【0022】
形状推定装置は、複数の車両形状画像107が格納された形状画像データベース110を備えており、予めの学習により生成された写像関数に従って、入力画像100を車両形状画像107に写像することにより形状を推定する。この写像は、車両画像の輝度特徴量が張る輝度特徴空間101から車両形状画像が張る形状特徴空間104への写像102、及び、形状特徴空間104から車両形状画像107への写像106、の2段階の写像により実現される。
【0023】
写像102は事前の回帰分析により生成された回帰モデル103(写像関数)により実現できる。すなわち入力画像100は回帰モデル103に従って形状特徴空間104中の1点に写像される。形状特徴空間104は事前の非線形次元圧縮処理115により形状推定に有効な少数の成分のみからなる低次元の特徴空間に次元圧縮されている。
【0024】
形状画像データベース110には、複数の車両形状画像107と、形状特徴空間104における当該車両形状画像107それぞれの座標との対応関係105が記憶されている。
【0025】
例えば、各車両形状画像107が128×128画素であれば元の形状特徴空間は128×128次元の特徴空間であるが、これが5次元の特徴空間に次元圧縮されている。128×128次元ベクトルデータである車両形状画像107−1,107−2,107−3,…はそれぞれに対応する5次元ベクトルデータの座標値108−1,108−2,108−3,…と同一の識別番号が付与されて形状画像データベース110に格納されている。
【0026】
これらの座標値は形状推定に有効な車両形状画像107それぞれの形状特徴量であると言うこともできる。
【0027】
写像106は、対応関係105に基づき入力画像100の写像値に対応する車両形状画像を検出することにより実現される。すなわち形状画像データベース110の中から入力画像100の写像値と類似する(近接する)座標値)を検出し、検出された座標値に対応する車両形状画像を求めることで写像106が行われる。このとき、車両形状画像107の個数は有限であり、一般的には写像値がいずれかの座標値と完全一致することは殆どないため、写像106では、写像値と類似する複数の座標値を検出してこれらと対応する車両形状画像を類似度に応じて重み付け平均(合成111)することで推定形状画像112を求める。
【0028】
〔形状推定システム1の構成〕
次に図2を参照して形状推定装置を含む形状推定システム1の構成について説明する。形状推定システム1は学習装置2、形状推定装置3及び不審車両監視装置4から構成される。
【0029】
学習装置2は学習処理により車両形状画像の次元圧縮、回帰モデルの生成等を行う。学習後、学習装置2と形状推定装置3とが一時的に接続され、学習装置2は学習の結果として生成された情報を形状推定装置3に出力し、形状推定装置3はこれらの情報を格納する。
【0030】
形状推定装置3には不審車両監視装置4が接続され、形状推定装置3は不審車両監視装置4が実行する不審車両の監視処理の一部を担う。
【0031】
不審車両監視装置4は移動式の監視カメラ40、車両識別器41および不審車両判定部42を含んで構成される。監視カメラ40は駐車場を移動しながら順次撮像を行って駐車場画像を車両識別器41に出力する。車両識別器41には予め車両画像を用いて学習された車両有無の識別基準が設定されている。車両識別器41は駐車場画像中の各所に順次矩形窓を設定して矩形窓内の画像が車両画像であるか否かを識別し、車両画像であると識別した矩形窓内の画像を切り出して形状推定装置3に入力する。
【0032】
形状推定装置3は、入力画像に撮像されている車両の形状を推定し、推定形状画像を不審車両判定部42に出力する。不審車両判定部42は、車両画像に推定形状画像を重ね合わせて、車両領域における色など特徴量を分析し、予め登録された不審車両の特徴量と照合して不審車両か否かを判定する。推定形状画像と重ね合わせて得られる車両領域には背景が殆ど含まれないので、高精度な照合が可能となる。
【0033】
[学習装置2の構成]
学習装置2は学習用記憶部20、学習処理部21および学習出力部22を含んで構成され、パーソナルコンピューター等で実現される。学習用記憶部20と学習出力部22は学習処理部21に接続されており、学習出力部22はさらに形状推定装置3とも接続される。
【0034】
学習用記憶部20はハードディスクドライブ、RAM(Random Access Memory)等のメモリ装置であり、各種プログラムや各種データを記憶して学習処理部21との間でこれらの情報を入出力する。各種データには標本車両画像200及び車両形状画像201が含まれる。
【0035】
標本車両画像200は、背景とともに様々な形状の車両がそれぞれに撮像された複数の車両画像であり、予め作成されて学習用記憶部20に記憶されている。標本車両画像200は様々な場所、アングルで、車両の様々な姿勢、様々な車種、車色の車両を撮影した画像から車両をほぼ中央に含む矩形を手作業等により切り出し、大きさを規格化(例えば128×128画素)して作成する。標本車両画像200における車両の形状は様々でありその背景も様々である。標本車両画像200は学習に十分な数だけ用意され、例えば2000枚の標本車両画像200が用意される。
【0036】
車両形状画像201は、標本車両画像200のそれぞれおける車両の輪郭形状をかたどった車両領域と車両領域以外である背景領域とに異なる画素値を設定した画像であり、予め作成されて学習用記憶部20に記憶されている。学習用記憶部20には、1枚の標本車両画像200とそれに対応する車両形状画像201とで1ペアを為して同一の識別番号が付与され、複数ペアが記憶される。
【0037】
車両形状画像201は、各標本車両画像200における車両の輪郭画素を目視確認により特定することで作成される。例えば、特定された輪郭画素及び輪郭画素に囲まれる領域を車両領域として車両領域内の画素の画素値を255、車両領域以外の画素の画素値を0に設定する。標本形状画像201の大きさは規格化されており、本実施形態では標本車両画像200と同じく128×128画素とする。但し、車両形状画像201の大きさは標本車両画像200の大きさと同一でなくてもよい。
【0038】
車両形状画像201はその画素値(輝度値)が座標順に画素数だけ並んだベクトル形式で車両の形状を表すデータである。
【0039】
車両形状画像201は、標本車両画像200から得られる輪郭形状の情報として過不足がなく正確であるため、学習における正解データとして精度が高く、推定の出力形式としても高精度で利用価値が高い。その上、車両形状画像201は標本車両画像200に撮像された車両の輪郭形状を見た目そのままになぞるだけで正確に作成できる。これらの特性は見た目の形状が非線形に変化する対象物の画像に対しても失われない。
【0040】
車両形状画像201を形状推定に用いる利点について、形状を規定数の特徴点、規定数の制御点或いは等間隔のサンプル点などの離散点で表現する場合との比較で説明する。
【0041】
車両の見た目の形状は、そのアングル等によって非線形に変化するため、離散点で表現した形状データでは一貫した始点が定まらない。例えば前面バンパーの角による輪郭形状は、斜め前方からのアングルでは画像上に現れるが、他のアングルでは消失する。そのため、あるアングルでは前面バンパーの角の特徴点を形状データの始点に設定できても、他のアングルでは設定できず代替の始点を設定せざるを得なくなる。このように始点が一貫しない形状データ同士を比較すると始点のずれが誤差に含まれ、本来類似した形状同士が相違した形状として学習され、形状推定精度の低下を招く。一方、車両形状画像201であれば形状データの始点は常に画像の原点となるため、始点ずれの問題が生じない。
【0042】
また車両の形状はルーフのように単純な部分とタイヤ付近のようにやや複雑な部分が混在して形成されるため、形状データを離散点で表現すると、複雑さに対する点の疎密が生じる。点が過疎な部分では形状情報の局所的な欠落により、点が過密な部分では形状情報の冗長性により本来類似した形状同士が相違した形状として学習され、形状推定精度の低下を招く。一方、車両形状画像201であれば後述するように車両領域間の重複度で形状の類似性を評価できるため、複雑さに対する疎密の問題が生じない。
【0043】
ここで、車両形状画像201は、車両領域の画素値を255とし背景領域の画素値を0とした2値画像とすることもできるが、さらに車両領域と背景領域の境界付近近傍を平滑化処理した濃淡画像(多値画像)とすることで形状画像間の変化が滑らかとなり次元圧縮効率を高めることができる。
【0044】
図3に濃淡画像で表した車両形状画像500を例示する。同図において線501は車両領域の輪郭線であり輪郭線501上の画素が輪郭画素である。線502は輪郭線501から車両領域外側に一定距離だけ離れた外郭線、線503は輪郭画素から車両領域内側に一定距離だけ離れた内郭線である。グラフ504は車両形状画像500における線分a−b上の輝度値(画素値)を表している。
【0045】
図3に例示した車両形状画像500は、輪郭画素に中央輝度値である127を設定し、車両領域には各画素から最も近い輪郭画素までの距離を中央輝度値に加算して255でクリッピングさせた輝度値を設定し、背景領域には各画素から最も近い輪郭画素までの距離を中央輝度値から減算して0でクリッピングさせた画素値を設定することで平滑化処理される。このようにして車両形状画像には、車両領域(図3の横線領域と白抜き領域)において127以上255以下の画素値が輪郭からの距離に応じて連続的に設定され、背景領域(図3の縦線領域と斜め線領域)において0以上127未満の画素値が輪郭からの距離に応じて連続的に設定される。
【0046】
以上のように作成された標本車両画像200と車両形状画像201を図4に例示する。
【0047】
学習処理部21は、CPU(Central Processing Unit)等の演算装置を用いて構成され、学習用記憶部20からプログラムを読み出して実行することで非線形次元圧縮部210、輝度特徴抽出部211、回帰分析部212として機能する。
【0048】
非線形次元圧縮部210は、車両形状画像の分布を表す形状特徴空間を所定の非線形次元圧縮処理により次元圧縮し、次元圧縮された形状特徴空間における各車両形状画像201の座標値(形状特徴量)を算出する。各車両形状画像201の座標値は、回帰分析部212に参照されるとともに、算出元の車両形状画像201と対応付けられて形状推定装置3に出力される。圧縮後の次元数Dは、元の形状画像の次元数よりも十分に小さく、対象物の形状変化に本質的に寄与する次元数として十分に大きな数が、実験等を通じて決定され、予め設定される(例えばD=5)。
【0049】
非線形次元圧縮処理は、LLE(Locally Linear Embedding;ローカリー・リニア・エンベッディング)法により行なうことができる。LLE法では、車両形状画像201のうち互いに類似する類似形状画像を選出しておき、類似形状画像間の近接関係を維持して次元圧縮が行なわれる。本発明では、車両形状画像間の類似性を判定する尺度にその車両領域同士の非重複度を用い、非重複度が基準を超えて小さい車両形状画像同士を類似形状画像と判定する。
【0050】
非重複度は、形状画像間で対応する画素同士の画素値の差の二乗和の平方根とすることができる。また、別の実施形態では形状画像間で対応する画素同士の差の絶対値の和とすることができる。
【0051】
非重複度に基づき選出される類似形状画像同士は現に車両領域の見た目の形状が類似するため、次元圧縮後の形状特徴空間における座標値が互いに近接関係にある車両形状画像201は現にその車両領域の形状が類似関係にあるものとすることができる。
【0052】
以下、LLE法を用いた非線形次元圧縮部210により行なわれる非線形次元圧縮処理の概要を説明する。圧縮後の次元数Dは例えば5に予め設定しておく。
【0053】
まず非線形次元圧縮部210は、車両形状画像201のそれぞれについて他の車両形状画像との間で非重複度を算出して非重複度の昇順に上位n個(n>1)を類似形状画像として選出する。
【0054】
続いて非線形次元圧縮部210は、車両形状画像201のそれぞれをその類似形状画像の重み付け線形和で近似する各重みを導出する。すなわち非線形次元圧縮部210は次式1で表されるコスト関数ε(W)を最小化するN×N次元の重み行列Wを最小二乗法により導出する。
【数1】

ただし、S,Sは車両形状画像(1≦i≦N,1≦j≦N)、WijはSを近似する各Sの重みをi行j列の要素の値とした行列である。ただし、WijにおいてSがSの類似形状画像として選出された(i,j)要素以外の値は0とする。
【0055】
続いて非線形次元圧縮部210は、上記局所的な線形和を維持したまま車両形状画像201をD次元に次元圧縮する。すなわち非線形次元圧縮部210は次式2で表されるコスト関数Φ(Y)を最小化するD×N次元の行列Yを導出する。
【数2】

ただし、Y,YはD次元に次元圧縮された形状特徴空間における上記車両形状画像S,Sの座標値、Yは各Yをi列目のベクトルとするD×N次元の行列である。Wijは式1に基づき求めた重みであり固定値として扱われる。このことが上述した類似形状画像間の近接関係維持を意味する。
【0056】
非線形次元圧縮部210は、式2のコスト関数をそのまま用いるのではなく、式2を変形した次式3のコスト関数を最小化するYを、N×N次元の行列Mを固有値分析することにより導出する。
【数3】

【数4】

ただし変形にあたりΣY=0を仮定している。形状特徴空間は平行移動に不変であるためこのようにしても式3の一般性は失われない。なお、Yの集合の共分散行列が単位行列となるよう制限する。
【0057】
非線形次元圧縮部210は、固有値分析された行列Mの各行を構成する固有ベクトルのうち固有値が2番目に小さな固有ベクトルから固有値が(D+1)番目に小さな固有ベクトルまでを抜き出して並べたD×N次元の行列を生成し、当該行列の各列をYとして抜き出す。こうして算出されたN個のYがD次元形状特徴空間における車両形状画像201それぞれの座標値である。
【0058】
本出願人は実験を重ねた結果、LLE法を用いて車両形状画像を非線形次元圧縮処理し、その際に車両領域間の非重複度に基づき類似形状画像を選出することにより、128×128次元の形状特徴空間を5次元に次元圧縮したときに低次元且つ高い形状推定精度が得られるとの知見を得た。
【0059】
図5は2次元に次元圧縮した形状特徴空間600における車両形状画像の座標値の分布を例示したものである。また同図においては車両形状画像601〜607に対応する座標値を引き出し線で示している。この図から車両領域の形状が類似した(非重複度が小さな)車両形状画像602,603の座標値が近接関係にあり、これら以外の座標値は離れた関係にあることが分かる。
【0060】
なお、LLE法に代えてISOMAP(アイソマップ)法、ラプラシアン・アイゲンマップ(Laplacian Eigenmap)法を用いて非線形次元圧縮処理を行うこともできる。これらの方法を適用したときも類似形状画像を選出して類似形状画像間の近接関係を維持する次元圧縮が行なわれる。このとき非重複度に基づいて類似形状画像を行うことにより高精度な形状推定を実現可能な次元圧縮が可能となる。
【0061】
輝度特徴抽出部211は、標本車両画像200それぞれから各画素における輝度特徴量を抽出し、回帰分析部212に出力する。具体的には輝度特徴抽出部211は輝度特徴量としてHOG(Histogram Of Gradient)を抽出する。HOGは画像平面上の輝度勾配を勾配方向別にヒストグラム分析して得られる特徴量であり、照明変動の影響を受けにくい点で形状推定に適している。本実施形態において輝度特徴抽出部211は、標本車両画像200中に49個の小領域を設定し、各小領域において輝度勾配を9方向に量子化して各方向のヒストグラムを分析し、全小領域の分析結果を並べて輝度特徴量とする。このようにして得られる輝度特徴量は49×9次元ベクトルのデータとなる。
【0062】
なお、輝度特徴量はHOGに限らず種々の特徴量を用いることができる。別の実施形態において輝度特徴抽出部211は、HOGに代えてSIFT(Scale-Invariant Feature Transform)、ハール・ライク(Haar-like)特徴、SURF(Speeded Up Robust Features)、又はシェイプ・コンテキスト(Shape Context)を輝度特徴量として抽出する。また、輝度特徴量として各画素の輝度値をそのまま利用することもでき、この場合は輝度特徴抽出部211を省略した構成とすることも可能である。
【0063】
回帰分析部212は、各標本車両画像200の輝度特徴量と当該標本車両画像200に対応する車両形状画像201の形状特徴量(形状特徴空間における座標)との関係を回帰分析して、車両画像の輝度特徴空間から車両形状画像の形状特徴空間への写像関数を生成し、生成した写像関数を形状推定装置3に出力する。このような写像関数の生成が可能となったのは形状特徴空間を低次元化できたことによる。
【0064】
具体的には回帰分析部212は、ブースティング回帰木(Boosted Regression Tree)法を用いて回帰分析を行う。
【0065】
ブースティング回帰木法において、写像関数は複数段の回帰木(Regression Tree)の出力の重み付け和でモデル化され(回帰モデル)、学習はブースティング法により順次段数を増加させることにより行なわれる。次式5はブースティング回帰木法における回帰モデルを定式化したものである。
【数5】

但し、Fは回帰モデル、Xは入力画像の輝度特徴量、Mは回帰木の段数、νは予め設定される定数(0<ν<1)、h(X;A,R)はm段目の回帰木、Rはm種類目の分割パターンで所定の分割数に分割された輝度特徴空間720、Aは分割されたRそれぞれに属する標本車両画像200と対応する車両形状画像201の座標値の平均値を表す。νは例えば0.1、Mは例えば1000、分割数は例えば4に設定することができ、これらの値は予め設定しておく。分割パターンは各段の学習の都度、目標値と推定値の差を最小化するように決定される。
【0066】
図5は回帰モデルを例示したものである。回帰木700は式5における1段目の回帰木、回帰木710は同2段目の回帰木を表している。この例では分割数は4であり、各回帰木の根ノード701,711は車両画像の輝度特徴空間720の全体に対応し、各回帰木の葉ノード704〜707,714〜717は輝度特徴空間720が4分割された各空間R1,1〜R1,4,R2,1〜R2,4に対応する。根ノードと葉ノードは中間ノード702,703,712,713を介して接続され、根ノード及び各中間ノードには標本車両画像200の輝度特徴量の一部に注目して輝度特徴空間720を尤もらしく分割する分割ルールが学習される。例えば、回帰木700の根ノード701には車両画像の輝度特徴量の第4次成分値が閾値θより大きいか否かにより輝度特徴空間720をR1,1,R1,2の和空間とR1,3,R1,4の和空間とに最も近く分割するルール「x>θ?」が設定され、同回帰木700の中間ノード702には車両画像の輝度特徴量の第5次成分値が閾値θ1より大きいか否かによりR1,1,R1,2の和空間をR1,1とR1,2とに最も近く分割するルール「x>θ?」が設定される。また、各葉ノードにはこの分割ルールにより分割された各空間に属する標本車両画像200と対応する車両形状画像201の座標値の平均値が回帰木の出力値として設定される。
【0067】
回帰分析部212は、これらM段の回帰木の根ノード及び各中間ノードにおける分割ルールと各葉ノードにおける出力値からなる回帰モデルを生成する。形状特徴空間は上述したように物体の輪郭形状変化に寄与する成分に次元圧縮され、回帰モデルは輝度特徴空間と上記形状特徴空間との関係を回帰分析して生成される。そのため回帰モデルを構成する分割ルールには、輝度特徴量の成分のうち、物体の輪郭形状変化に関係する成分が選択的に設定され、背景の形状や物体細部の形状に関係する成分は設定されにくい。このことによって背景の形状や物体細部の形状の影響を受けにくく高精度な形状推定が可能となる。
【0068】
なお、ブースティング回帰木法に代えてSVR(サポート・ベクター・リグレッション)法を用いることもできる。
【0069】
学習出力部22は、学習処理部21からの情報を形状推定装置3に出力する通信回路である。
【0070】
[形状推定装置3の構成]
形状推定装置3は、推定用記憶部30、入力画像取得部31、推定処理部32および形状出力部33を含んで構成される。推定用記憶部30、入力画像取得部31および形状出力部33は推定処理部32に接続され、入力画像取得部31および形状出力部33はさらに不審車両監視装置4とも接続される。
【0071】
推定用記憶部30は、ROM(Read Only Memory)、RAM等の記憶装置である。推定用記憶部30は、各種プログラムや各種データを記憶し、推定処理部32との間でこれらの情報を入出力する。各種データには、回帰モデル300、形状画像データベース301が含まれる。
【0072】
回帰モデル300は、学習装置2の回帰分析部212により予め生成されたものであり、学習出力部22を介して入力され、推定用記憶部30に記憶される。
【0073】
形状画像データベース301は、学習用記憶部20に記憶されていた車両形状画像201と学習装置2の非線形次元圧縮部210により予め生成された車両形状画像201それぞれの形状特徴空間における座標値とを対応付けたデータ群である。これらは学習出力部22を介して入力され、推定用記憶部30に記憶される。
【0074】
入力画像取得部31は、形状推定処理の対象となる車両画像を不審車両監視装置4から入力する通信回路である。入力画像取得部31は入力された車両画像(以下、入力画像と称する)を推定処理部32に出力する。
【0075】
推定処理部32は、入力画像取得部31からの入力画像を処理して入力画像中の車両形状に適合する車両形状画像を推定して推定結果を形状出力部33に出力する。推定処理部32は、CPU、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置を用いて構成され、推定用記憶部30からプログラムを読み出して実行することで輝度特徴抽出部320、入力画像写像部321、形状推定部322として機能する。
【0076】
輝度特徴抽出部320は、入力画像から輝度特徴量を抽出し、抽出した輝度特徴量を入力画像写像部321に出力する。輝度特徴抽出部320が抽出する輝度特徴量は回帰モデル300の学習に用いられた輝度特徴量と同種であり、輝度特徴抽出部320は輝度特徴抽出部211と同じ方法で輝度特徴量を抽出する。すなわち本実施形態においては輝度特徴抽出部320は49個の小領域を設定し、各小領域において輝度勾配を9方向に量子化したHOGを抽出する。上述したようにHOGは画像平面上の輝度勾配であり、照明変動の影響を受けにくい点で形状推定に適している。なお、輝度特徴量として各画素の輝度値をそのまま利用する場合、輝度特徴抽出部320を省略した構成とすることも可能である。
【0077】
入力画像写像部321は、回帰モデル300に従って入力画像の輝度特徴量を形状特徴空間に写像することで、入力画像の写像値を算出する。この処理により入力画像は5次元の形状特徴空間の1点、すなわち入力画像中の車両の形状特徴を表す5次元ベクトルに写像される。
【0078】
形状推定部322は、形状画像データベース301に記憶している車両形状画像の中からその座標値が入力画像の写像値と類似する車両形状画像を検出し、検出した車両形状画像の車両領域から入力画像に撮像されている車両の形状を求める。形状推定部322は求めた形状を形状画像と同様の画像形式(推定形状画像)で形状出力部33に出力する。
【0079】
具体的には形状推定部322は、形状画像データベース301に格納されている複数の車両形状画像の座標値と入力画像の写像値との距離を算出して、距離の昇順に予め設定された個数(k>0)の車両形状画像を検出し、検出した車両形状画像の平均画像を推定形状画像として出力する。このように写像値と類似した座標値を有する複数の車両形状画像を合成することで有限個数の車両形状画像からその中間形状を推定できるので、推定精度が向上する。
【0080】
k個の車両形状画像を検出する処理は、k最近傍(k−NN;k-nearest neighbour)法を用いて行うことができる。すなわち形状推定部322は、k最近傍法を用いてk個の車両形状画像を検出し、検出したk個の車両形状画像を当該各画像の座標値と入力画像の写像値との距離に基づく類似度にて重み付けて平均化することで推定形状画像を生成する。重みwすなわち類似度は距離dが小さいほど大きく、距離dが大きいほど小さく算出し、例えばw=exp(−d)なる関数で算出する。
【0081】
こうして出力される推定形状画像の各画素値は対応する入力画像の画素が車両領域であるか否かを表している。具体的には出力される推定形状画像において画素値が127以下の画素は背景領域、画素値が128以上の画素は車両領域であることを表す。
【0082】
別の実施形態では形状推定部322は上記平均画像を車両領域と背景領域で2値化して推定形状画像を生成し出力する。
【0083】
形状出力部33は、推定処理部32からの推定形状画像を不審車両監視装置4に出力する通信回路である。
【0084】
〔形状推定システム1の動作〕
形状推定システム1の動作を、形状推定処理の事前に学習装置2が行なう動作と、形状推定装置3が行う形状推定処理の動作とに分けて説明する。
【0085】
[学習装置2の動作]
図7のフローチャートを参照して、学習装置2の動作を説明する。
【0086】
まず非線形次元圧縮部210は、学習記憶部20から車両形状画像201を読み出し(S10)、読み出した車両形状画像201に非線形次元圧縮処理を施してD次元の形状特徴空間における車両形状画像201それぞれの座標値を算出し(S11)、算出した座標値を回帰分析部212に出力する。
【0087】
次に輝度特徴抽出部211は、学習記憶部20から標本車両画像200を読み出し(S12)、読み出した標本車両画像200のそれぞれから輝度特徴量を抽出し(S13)、抽出した各輝度特徴量を回帰分析部212に出力する。
【0088】
続いて回帰分析部212は、車両画像の輝度特徴空間から車両形状画像の形状特徴空間への写像関数である回帰モデルを、ステップS13にて算出された標本車両画像200の輝度特徴量およびステップS11にて算出された車両形状画像201の座標値を回帰分析することにより生成する(S14)。
【0089】
以上の処理が終わると、学習装置2は上記処理により生成・算出した情報を学習出力部22経由で形状推定装置3に出力し(S15)、形状推定装置3はこれらを推定用記憶部30に格納する。すなわち、ステップS14にて生成された回帰モデルは回帰モデル300として格納され、車両形状画像201とその識別番号およびステップS11にて算出した各車両形状画像201の座標値とその識別番号は形状画像データベース301として格納される。
【0090】
[形状推定装置3の動作]
図8のフローチャートを参照して、形状推定装置3の動作を説明する。
【0091】
形状推定装置3は、起動すると、まず不審車両検知装置4からの入力を待機する待機状態となる。待機状態では、車両画像入力部31が定期的に入力画像の有無を確認する(S20にてNO→S20)。不審車両検知装置4から画像が入力されると車両画像入力部31が入力画像を推定処理部32に入力して推定処理が始まる(S20にてYES→S21)。
【0092】
形状推定処理においては、まず推定処理部32の輝度特徴抽出部320が入力画像から輝度特徴量、すなわちHOGを抽出し、抽出した輝度特徴量を推定処理部32の入力画像写像部321に出力する(S21)。
【0093】
続いて入力画像写像部321は、入力画像写像部321からの輝度特徴量を回帰モデル300に入力してその出力を算出することにより、入力画像を形状特徴空間に写像し、算出された写像値を推定処理部32の形状推定部322に出力する(S22)。すなわち入力画像写像部321は、輝度特徴量の成分のうち各回帰木の根ノード及び中間ノードの分割ルールに設定されている成分を当該ノード設定されている閾値と比較して次のノードを決定する処理をいずれかの葉ノードに達するまで繰り返し、到達した葉ノードに設定されている出力値を取得する処理を全ての回帰木について行い、取得した全ての出力値の重み付き和を写像値として求める。
【0094】
次に形状推定部322はk最近傍法により形状画像データベース301の中から入力画像の写像値の近傍に分布するk個の車両形状画像を選出し(S23)、選出したk個の車両形状画像を平均処理して推定形状画像を生成する(S24)。
【0095】
続いて形状推定部322は、生成した推定形状画像を形状画像出力部33経由で不審車両検知装置4に出力し(S25)、再びステップS20の待機状態に戻る。
【0096】
上記実施形態においては、車両を対象物として形状推定を行う例を示したが、人または人の頭部などを対象物として形状推定を行う場合にも本発明を適用することができる。
【0097】
また上記実施形態においては、不審車両検知処理のために形状推定を行う例を示したが、検索、姿勢推定、追跡など画像内の対象物を検出して処理する他の用途に用いることも可能である。
【符号の説明】
【0098】
1・・・形状推定システム
2・・・学習装置
3・・・形状推定装置
4・・・不審車両監視装置
20・・・学習用記憶部
21・・・学習処理部
22・・・学習出力部
30・・・推定用記憶部
31・・・入力画像取得部
32・・・推定処理部
33・・・形状出力部
40・・・監視カメラ
41・・・車両識別器
42・・・不審車両判定部
100・・・入力画像
112・・・推定形状画像
200・・・標本車両画像
201、500・・・車両形状画像
210・・・非線形次元圧縮部
211・・・輝度特徴量抽出部
212・・・回帰分析部
300・・・回帰モデル
301・・・形状画像データベース
320・・・輝度特徴量抽出部
321・・・入力画像写像部
322・・・形状推定部
600・・・形状特徴空間
700、710・・・回帰木


【特許請求の範囲】
【請求項1】
画像中に撮像された所定物体の形状を推定する物体形状推定装置であって、
予め、様々な形状の前記所定物体をかたどった物体領域と背景領域とに異なる画素値が設定された複数の形状画像と、前記複数の形状画像を非線形次元圧縮処理して得られた低次元の形状特徴空間における前記形状画像それぞれの座標値と、前記所定物体が撮像された物体画像を前記形状特徴空間に写像する写像関数と、を記憶した記憶部と、
推定対象の前記所定物体が撮像された入力画像を取得する画像取得部と、
前記入力画像を前記写像関数により写像して写像値を算出する入力画像写像部と、
前記形状画像の中から前記座標値が前記写像値と類似する形状画像を検出し、前記検出した形状画像の前記物体領域から前記推定対象の形状を求める形状推定部と、
を備えたことを特徴とする物体形状推定装置。
【請求項2】
請求項1に記載の物体形状推定装置において、
前記特徴空間は、前記複数の形状画像のうち互いの前記物体領域同士の非重複度が所定基準より小さな類似形状画像の間で前記座標値の近接関係を維持して前記非線形次元圧縮処理された特徴空間であることを特徴とする物体形状推定装置。
【請求項3】
請求項2に記載の物体形状推定装置において、
前記形状特徴空間は、前記複数の形状画像にローカリー・リニア・エンベッディング法を適用して得られた特徴空間であることを特徴とする物体形状推定装置。
【請求項4】
請求項1〜3のいずれかひとつに記載の物体形状推定装置において、
前記形状推定部は、前記座標値と前記写像値との距離が近い順に所定数の形状画像を検出し、前記所定数の形状画像における前記物体領域を合成して前記推定対象の形状を求めることを特徴とする物体形状推定装置。
【請求項5】
請求項1〜4のいずれかひとつに記載の物体形状推定装置において、
前記形状画像は、前記物体領域と前記背景領域との境界付近における画素値が平滑化処理された画像であることを特徴とする物体形状推定装置。
【請求項6】
請求項1〜5のいずれかひとつに記載の物体形状推定装置において、
前記写像関数は、前記物体画像と前記形状特徴空間とを回帰分析することにより得られた回帰モデルであることを特徴とする物体形状推定装置。


【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図2】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−3861(P2013−3861A)
【公開日】平成25年1月7日(2013.1.7)
【国際特許分類】
【出願番号】特願2011−134674(P2011−134674)
【出願日】平成23年6月17日(2011.6.17)
【出願人】(000108085)セコム株式会社 (596)
【Fターム(参考)】