説明

移動対象追跡装置、移動対象追跡方法及び移動対象追跡プログラム

【課題】移動対象の数や見かけ上の形状変化が生じる場合であっても移動対象を確実に追跡する移動対象追跡装置、移動対象追跡方法及び移動対象追跡プログラムを提供することを課題とする。
【解決手段】マルコフ連鎖を用いて移動対象を追跡するので、見かけの変形や変化が生じた場合であっても移動対象を確実に追跡することができる。また、色(色彩)や2値(モノクロ)に関する結合確率関数を用いているため、高速性とロバスト性を高めることが可能となる。更に、追跡指標のパラメータを確率関数を用いて近似しているため、揺らぎ変動分を吸収することも可能となる

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮影された映像を構成している画像フレーム上で移動している移動対象を追跡する移動対象追跡装置、移動対象追跡方法及び移動対象追跡プログラムの技術に関する。
【背景技術】
【0002】
実環境下において、カメラ等で撮影された人や魚などの移動対象を画像上で追跡する場合には、多少のノイズ影響は残るものの、一般的には移動対象の数を一定と仮定したり、移動対象の形状を見かけの変化が少ない剛体とみなすことにより追跡する方法が用いられている。
【非特許文献1】“マルコフ連鎖モンテカルロ”、[online]、[平成20年12月1日検索]、インターネット<URL : http://d.hatena.ne.jp/keyword/%A5%DE%A5%EB%A5%B3%A5%D5%CF%A2%BA%BF%A5%E2%A5%F3%A5%C6%A5%AB%A5%EB%A5%ED?kid=4365>
【非特許文献2】“Expectation-maximization algorithm”、[online]、[平成20年12月1日検索]、インターネット<URL : http://en.wikipedia.org/wiki/Expectation-maximization_algorithm>
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、複数の移動対象が撮影されている場合には移動対象同士が重なり合う問題や、壁の後ろなどで見え隠れする隠蔽(オクルージョン)が発生する問題や、定点カメラから見た場合に移動対象の見かけの形状が変化するという問題があった。
【0004】
本発明は、上記を鑑みてなされたものであり、移動対象の数や見かけ上の形状変化が生じる場合であっても移動対象を確実に追跡する移動対象追跡装置、移動対象追跡方法及び移動対象追跡プログラムを提供することを課題とする。
【課題を解決するための手段】
【0005】
第1の請求項に係る発明は、マルコフ連鎖を用いて移動対象を追跡する移動対象追跡装置において、少なくとも2つの移動対象が撮影された映像を時系列な複数の画像フレームとして記憶する記憶手段と、前記画像フレームを前記記憶手段から読み出して、前記2つの移動対象をそれぞれ示した2つの追跡指標の現在状態を解析する解析手段と、前記2つの移動対象の動きが正規分布に従うものとして、前記2つの追跡指標の次状態を仮推定する仮推定手段と、前記現在状態から前記次状態に遷移する遷移コストを求め、当該遷移コストに基づいて前記2つの追跡指標が重複しているかいないかを判定する判定手段と、重複していないと判定された場合には、仮推定された前記次状態で前記2つの追跡指標の次状態をそれぞれ本推定し、重複していると判定された場合には、仮推定された互いの前記次状態を交換して本推定する本推定手段と、本推定された次状態に対する次確率分布と前記現在状態に対する現在確率分布とを前記画像フレームの画像濃淡値を用いて解析し、当該現在確率分布に対する当該次確率分布の比率を受容率として計算し、当該受容率に基づいて本推定された前記次状態を採用するか否かを決定する状態決定手段と、を有し、前記画像フレームの画像濃淡値は、前記移動対象である前景と当該移動対象でない背景との2値で表現されるものであって、前記次確率分布は、前記前景と前記次状態の追跡指標との重複率と、前記背景と当該次状態の追跡指標との重複率とに基づいて求められ、前記現在確率分布は、前記前景と前記現在状態の追跡指標との重複率と、前記背景と当該現在状態の追跡指標との重複率とに基づいて求められることを要旨とする。
【0006】
第2の請求項に係る発明は、前記次確率分布及び前記現在確率分布は、色彩に関する画像特徴量を更に用いて求められることを要旨とする。
【0007】
第3の請求項に係る発明は、前記仮推定手段は、確率関数を前記追跡指標のパラメータに用いて前記2つの追跡指標の次状態を仮推定することを要旨とする。
【0008】
第4の請求項に係る発明は、前記状態決定手段は、前記重複していないと判定された場合には、
【数3】

【0009】
を用いて前記2つの追跡指標についてぞれぞれ前記受容率を計算し、前記重複していると判定された場合には、
【数4】

【0010】
を用いて前記受容率を計算することを要旨とする。
【0011】
第5の請求項に係る発明は、マルコフ連鎖を用いて移動対象を追跡する移動対象追跡装置で処理する移動対象追跡方法において、前記移動対象追跡方法により、少なくとも2つの移動対象が撮影された映像を時系列な複数の画像フレームとして記憶手段に記憶する第1ステップと、前記画像フレームを前記記憶手段から読み出して、前記2つの移動対象をそれぞれ示した2つの追跡指標の現在状態を解析する第2ステップと、前記2つの移動対象の動きが正規分布に従うものとして、前記2つの追跡指標の次状態を仮推定する第3ステップと、前記現在状態から前記次状態に遷移する遷移コストを求め、当該遷移コストに基づいて前記2つの追跡指標が重複しているかいないかを判定する第4ステップと、重複していないと判定された場合には、仮推定された前記次状態で前記2つの追跡指標の次状態をそれぞれ本推定し、重複していると判定された場合には、仮推定された互いの前記次状態を交換して本推定する第5ステップと、本推定された次状態に対する次確率分布と前記現在状態に対する現在確率分布とを前記画像フレームの画像濃淡値を用いて解析し、当該現在確率分布に対する当該次確率分布の比率を受容率として計算し、当該受容率に基づいて本推定された前記次状態を採用するか否かを決定する第6ステップと、を有し、前記画像フレームの画像濃淡値は、前記移動対象である前景と当該移動対象でない背景との2値で表現されるものであって、前記次確率分布は、前記前景と前記次状態の追跡指標との重複率と、前記背景と当該次状態の追跡指標との重複率とに基づいて求められ、前記現在確率分布は、前記前景と前記現在状態の追跡指標との重複率と、前記背景と当該現在状態の追跡指標との重複率とに基づいて求められることを要旨とする。
【0012】
第6の請求項に係る発明は、前記次確率分布及び前記現在確率分布は、色彩に関する画像特徴量を更に用いて求められることを要旨とする。
【0013】
第7の請求項に係る発明は、前記第3ステップは、確率関数を前記追跡指標のパラメータに用いて前記2つの追跡指標の次状態を仮推定することを要旨とする。
【0014】
第8の請求項に係る発明は、請求項5乃至7のいずれか1項に記載の移動対象追跡方法における各ステップをコンピュータによって実行させることを要旨とする。
【発明の効果】
【0015】
本発明によれば、移動対象の数や見かけ上の形状変化が生じる場合であっても移動対象を確実に追跡する移動対象追跡装置、移動対象追跡方法及び移動対象追跡プログラムを提供することができる。
【発明を実施するための最良の形態】
【0016】
本実施の形態に係る移動対象追跡装置の構成及び処理について説明する前に、本発明のベースに用いるマルコフ連鎖モンテカルロ(MCMC:Markov Chain Monte Calro)法(非特許文献1参照。以下、「MCMC」と称する)と、後述する状態決定部で用いる移動対象の重なり率(重複率)に関する技術について説明する。
【0017】
<MCMCについて>
MCMCを用いた移動対象の動きモデルは、各時間ステップにおいて動的に推定すべき状態が構成されていくことを特徴としている。このMCMCを適用することにより、移動対象を追跡する際において移動対象の見かけの複雑な変形や変化に対応させる効果を得ることができる。
【0018】
MCMCでは、通常、MHアルゴリズム(Metropolis-Hastings algorithm)が適用され、新しい状態(変数)を選択していく。このMHアルゴリズムを用いて確率分布P(X)に従う変数Xのサンプリングを行う手順は、以下の通りである。
【0019】
まず、現在の値Xから次の値Xを確率T(X|X)で選択する。次に、選択された値Xを採用するか否かを式(1)を用いて決定する。
【数5】

【0020】
式(1)の値が1以上の場合には常に採用し、1未満の場合には確率A(X|X)で採用(採用しない場合にはそのままで更新しない)するというステップを繰り返していくと、変数Xは確率分布P(X)に従うことになる。
【0021】
すなわち、式(1)は、マルコフ連鎖過程が定常状態になるための詳細釣り合い条件に基づいており、A=1の場合に完全な定常状態となる。従って、Aが1以上か又は1未満かで各過程での状態が判別できると共に、XとXとの間での状態推移を調整することができる。
【0022】
<移動対象の重なり率(重複率)について>
次に、移動対象の重なり率(重複率)に関する技術について説明する。移動対象の重なりとは、一つの移動対象に他の移動対象が覆い被さることから「ハイジャック問題」として知られている。従来法では、それぞれの移動対象を追跡している場合において、互いの移動対象が重なり合った後に、一方の移動対象を追跡している追跡指標が他方の追跡指標に入れ替わるという問題がある(図1(b)参照)。
【0023】
撮影された映像の画像フレームで移動している2つの移動対象iと移動対象jとの状態(位置、大きさ、形状)をそれぞれSXi、SXjで表現した場合に、双方の重なりについては以下2つの評価指数を用いて定義することができる。なお、tは時間であり、Xは空間的な大きさを意味している。一つには、移動対象iから見て、どれだけ移動対象iであるかという重なり率(空振り率)を式(2)を用いて定義することができる。
【数6】

【0024】
また、移動対象iよりも移動対象jである重なり率(見逃し率)を式(3)を用いて定義することができる。
【数7】

【0025】
式(2)と式(3)とは右辺の分母が異なるのみであり、換言すれば、前者は移動対象iとしての可能性の高さを表し、後者は移動対象iではないことの可能性の高さを表している。
【0026】
そして、式(2)及び式(3)に基づいて、2つの移動対象iと移動対象jとの全体的な重なり率については、調和平均を用いて統合した評価式(式(4))を利用して評価することができる。
【数8】

【0027】
このF値を用いると、2つの移動対象の相互の重なり合いに関する確率(類似度)は、式(5)で与えられることになる。なお、λはハイパーパラメータである。
【数9】

【0028】
式(5)示すポテンシャルは、移動対象同士に重なりがない場合、すなわち、双方の距離が一定以上離れている場合にゼロ値となり、重なりがある場合には非ゼロ値となる。
【0029】
従って、式(5)を用いて移動対象同士の重なり率を計算し、その計算結果がゼロか否かを重複に関する基準に用いることにより、2つ以上の対象が重なり合った後に、一方の対象と他方の対象とが不自然に入れ替わることを防止することが可能となる(図1(a)参照)。
【0030】
<移動対象追跡装置の構成について>
続いて、本実施の形態に係る移動対象追跡装置の構成について説明する。図2は、移動対象追跡装置の機能構成を示す図である。この移動対象追跡装置100は、入力部11と、解析部12と、仮推定部13と、判定部14と、本推定部15と、状態決定部16と、表示部17と、記憶部31とを備えている。
【0031】
入力部11は、カメラ等で撮影された複数の移動対象の映像の入力を受け付ける機能を備えている。なお、本実施の形態では、2つの移動対象を一例として以下説明する。
【0032】
記憶部31は、入力部11で受け付けた後に入力された映像を時系列な複数の画像フレームをとして記憶する機能を備えている。このような記憶部31としては、例えばメモリ、ハードディスク等の記憶装置を用いることが一般的であり、移動対象追跡装置100の内部のみならず、インターネットや電話回線等の通信ネットワークを介して電気的に接続可能な外部の記憶装置を用いることも可能である。
【0033】
解析部12は、記憶部31から画像フレームを読み出して、2つの移動対象をそれぞれ示した2つの追跡指標の現在状態を解析する機能を備えている。なお、本実施の形態で用いる追跡指標は楕円モデルであり、追跡指標の状態とは楕円モデルの形状・位置・大きさを意味するものである。具体的には、記憶部31から読み出した画像フレームが撮影された時刻をt、2つの移動対象のインデックス(番号)をI、画像フレーム内における移動対象の位置をベクトルX={Xt,i,i∈I}、移動対象の数をm=|I|(但し、m<M(移動対象の最大数))とした場合に、この楕円モデルは式(6)に示す五次元ベクトルで表現することができる。
【数10】

【0034】
ただし、(Xt,i,Xt,i)は楕円モデルの中心座標であり、Xt,iとXt,iは楕円モデルの短経と長経であり、Xt,iは水平軸からみたときの楕円モデルの回転角度である。
【0035】
仮推定部13は、2つの移動対象の動きが正規分布に従うものとして、2つの追跡指標の次状態を仮推定する機能を備えている。解析部12で解析された楕円モデルの現在状態をXt,iと、仮推定される次状態をXt+1,iとの関係は、式(7)に示すシステムモデルを用いることができる。
【数11】

【0036】
ただし、[Δx,Δy,Δw,Δh,Δr]〜[N(0,σ),N(0,σ),N(0,σ),N(0,σ),N(0,σ)]であり、N(ave,dev)は、平均値aveと分散値devを持つ正規分布関数である。本発明では、各移動対象を近似した楕円モデルに関するパラメータを全て確率関数により近似しているだめ、各移動対象の見かけの形状や大きさ等が時々刻々と変化した場合であっても、安定かつロバストに追跡することができると共に、揺らぎ変動分を吸収することもできる。
【0037】
判定部14は、現在状態から仮推定部13で仮推定された次状態に遷移する遷移コストを求め、求めた遷移コストに基づいて追跡指標が重複しているかいないかを判定する機能を備えている。現在状態Xt,iから、仮推定された次状態Xt+1,iに遷移する遷移コストとしては、例えば式(8)を用いて計算することができる。
【数12】

【0038】
そして、式(8)の計算結果が一様乱数r(∈[0,1])以下の場合には重複していないと判定(更新タイプ)し、その計算結果が一様乱数rより大きい場合には重複していると判定(交換タイプ)する。なお、式(8)以外にも、μ〜U[0,1]の分布を用いることも可能である。但し、Uは一様分布の確率関数であり、平均値0、分散値1の乱数を発生させる関数である。
【0039】
本推定部15は、判定部14で重複していないと判定(更新タイプ)された場合には、仮推定された次状態で各追跡指標の次状態をそれぞれ本推定する。即ち、仮推定された追跡指標のパラメータが、そのまま次状態における追跡指標のパラメータとなる。一方、重複していると判定(交換タイプ)された場合には、仮推定された互いの次状態を交換して本推定する機能を備えている。即ち、2つの追跡指標が重複している場合には、一方の追跡指標のパラメータを他方の追跡指標のパラメータで置換して、次状態における追跡指標のパラメータとする。
【0040】
状態決定部16は、本推定部15で本推定された次状態に対する次確率分布と現在状態に対する現在確率分布とを画像フレームの画像濃淡値を用いて解析し、現在確率分布に対する次確率分布の比率を受容率として計算し、計算した受容率に基づいて本推定された次状態を採用するか否かを決定する機能を備えている。具体的には、次状態と現在状態との尤度比を受容率aとし、更新タイプの場合には式(9)を用いて各楕円モデルについてそれぞれ受容率aを計算し、交換タイプの場合には式(10)を用いて受容率aを計算する。
【数13】

【数14】

【0041】
なお、式(9)及び式(10)の分子に示された次確率分布と、分母に示された現在確率分布の計算については後述にて説明する。
【0042】
そして、状態決定部16は、a≧1の場合に本推定された状態Xt,iを採用し、そうでない場合には受容率を採用する。
【0043】
表示部17は、最終的に推定された次状態の楕円モデルをモニタ等に表示・出力する機能を備えている。
【0044】
<状態決定部における次確率分布や現在確率分布の計算について>
本実施の形態では、観測モデルとして、2値及び色の2種類の画像特徴量を用いるものとする。これを条件付確率モデルでは、式(11)に示すように表現することができる。
【数15】

【0045】
式(11)は左辺の事象Xが生じた場合にZが生じる確率を表現しており、右辺の2つは色モデル(col)と2値化モデル(bin)との結合確率である。すなわち、事象Xが生じた時に2値化の画像特徴量Zbinが生じ、この条件の下で色の画像特徴量Zcolが生じる確率を表している。2値化モデルは移動対象のロバストな追跡を行うため、色モデルは同一の移動対象を終始追跡し続けるために用いられる。また、双方とも確率モデルなので、環境光やノイズによる色ムラ等の色彩変化について許容することができ、安定的に移動対象を追跡することができる。特に2値化モデルの場合には、極めて少ない情報量で演算することができ、高速に移動対象を追跡することが可能となる。なお、本実施の形態では2値と色とを結合させた結合確率を用いているが、2値化モデル又は色モデルを単独で用いることも可能である。また、テクスチャや他の画像特徴量を更に用いて結合確率とすることも可能である。
【0046】
最初に2値化モデルについて説明する。2値化モデルの確率モデルは、移動対象である前景と移動対象でない背景とに関する結合確率モデルを用いる。ある画像フレームは、背景と前景の割合(確率)を用いて式(12)に示すようにモデル化することができる。
【数16】

【0047】
なお、前景をFとし、背景をBとしている。また、前景モデルp(Zbin,F|X)は正規分布(ガウス分布)であるものとする。ここで、移動対象iを追跡する楕円モデルの状態をSXiで表現すると、移動対象を追跡している楕円モデルがどれだけ前景F(移動対象)であるかを示す割合を式(13)で定義することができる。
【数17】

【0048】
また、前景F(移動対象)に属する画素がどれだけの割合であるかを式(14)で定義することができる。
【数18】

【0049】
なお、SXiはXについての空間情報であり、|F|は前景の面積である。一方、背景モデルp(Zbin,B|X)についても同様に、移動対象を追跡している楕円モデルがどれだけ背景Bであるかを示す割合を式(15)で定義する。
【数19】

【0050】
また、背景Bに属する画素がどれだけの割合であるかを式(16)で定義する。
【数20】

【0051】
すなわち、式(13)〜式(16)を用いて式(12)を計算することで、次確率分布や現在確率分布を計算することができる。
【0052】
また、式(13)〜式(16)を用いて式(4)や式(5)に示すような評価式を導出することにより、前景と楕円モデルとの重なり合いと、背景と楕円モデルとの重なり合いとを評価することが可能となる。例えば、移動対象である人を追跡する場合に、図3(a)に示すように一部を追跡(検出)したものとする。人と楕円モデルとの重なり合いについては式(13)を用いて計算し、楕円モデルと人とが完全に一致する場合には1となり、全く重なっていない場合には0となる。背景と楕円モデルとの重なり合いについても同様である。そして、両者の調和平均において、Fm>th(閾値)の場合に、前景と背景そして楕円領域の重なりが最もよい状態とし、これ以外の場合には無視することができる。
【0053】
なお。上述したp(Zbin,F|X)やp(Zbin,B|X)の確率分布は、例えば混合ガウスモデルを用いて具体的に計算することができる。m次元の混合ガウスモデルについては、式(17)で表現することができる。
【数21】

【0054】
ただし、aは平均値、Sは共分散行列、πはk番目のガウス分布への重み付け量である。GMMにおける未知数は、EM(Expectation Maximization)法(非特許文献2参照)を用いて計算することができる。しかし、一般的には、収束性から二次元から五次元のGMMを用いることが多い。
【0055】
EM法は最尤推定法の一つであり、EステップとMステップと称される2段階の数値解法からなり、一定の収束条件に到達するまでEステップとMステップとの間を反復的に計算し、上記3つのパラメータ(a,S,π)を推定していく。EM法は極小解に陥りにくく最小値を導くことが可能である。Eステップにおいて、ある反復回数での確率αkiは式(18)で表現できる。
【数22】

【0056】
そして、Mステップにおいて、GMMにおける3つのパラメータを更新する。
【数23】

【数24】

【数25】

【0057】
次に、色モデルについて説明する。移動対象を構成している画像濃淡値の画素の頻度数をヒストグラムと称する。ここでは、RGBの3色それぞれをH(X)とする。但し、Xは移動対象iに関する画像濃淡値(R,G,B)である。
【0058】
正規化したヒストグラムは式(22)で表現することができる。なお、Aは移動対象iを囲む楕円の画素数である。
【数26】

【0059】
ある時刻iと次の時刻jとの間における色のヒストグラムに基づく移動移動対象の類似性は式(23)を用いて計算することが可能となる。
【数27】

【0060】
なお、画像濃淡値はRGB分布において8ビットであって、1つの移動対象について224ビットとなるが、色階調を粗く量子化することにより計算の効率化を図ることも可能である。
【0061】
<移動対象追跡装置の処理について>
次に、本実施の形態に係る移動対象追跡装置の処理について説明する。なお、ある時刻tにおいて、一つ前の時刻での事前分布をp(Xt−1|Zt−1)≒{Xt−1(n)n=1で表すものとする。但し、右辺はN個の状態変数からなるものとする。一方、現在の分布p(X|Z)の近似表現は、マルコフ連鎖によってN+N個のサンプルデータが得られるものとする。なお、Nはburn−inサンプルと称され、Nはburn−inで少なくなった数を補うためのサンプル数である。一般的に、MCMCを適用した場合には、N+N個のサンプルで学習した後に、前半のデータN個については精度が安定しないことから、このデータを捨てて後半のデータN個だけを用いることで精度を安定化することが可能となっている。
【0062】
最初に、時刻t−1からのサンプルデータを用いて初期化する(S101)。なお、サンプル数n=0とする。
【0063】
次に、解析部12が、2つの移動対象をそれぞれ示した2つの楕円モデルの現在状態を解析する(S102)。
【0064】
続いて、仮推定部13が、式(7)を利用して2つの楕円モデルの次時刻における次状態を仮推定する(S103)。
【0065】
その後、判定部14が、式(10)を利用した計算結果に基づいて、更新タイプか交換タイプかを判定する(S104)。
【0066】
本推定部15が、更新タイプの場合には、仮推定された次状態で各追跡指標の次状態をそれぞれ本推定し、一方、交換タイプの場合には、仮推定された2つの次状態を交換して本推定する(S105)。
【0067】
そして、状態決定部16が、更新タイプの場合には、式(9)を用いて受容率を計算し、一方、交換タイプの場合には、式(10)を用いて受容率を計算する(S106)。
【0068】
状態決定部16が、受容率の計算結果に基づいて、本推定した次状態を採用するか否かを決定する(S107)。
【0069】
S107の処理と同時に、状態決定部16が、サンプル数nをn+1とし、マルコフ連鎖において、X(n)=X*(n)を付け加える。もし、本推定された状態Xt,iを採用しない場合には、マルコフ連鎖において前の時刻のサンプルを現在状態X(n)=X(n−1)に加える(S108)。これは、前述した詳細釣り合い条件に基づいた処理である。
【0070】
その後、状態決定部16は、サンプル全体にわたって平均ベクトルを計算し、時刻t+1における楕円モデルの状態を推定する(S109)。なお、移動対象を増加する場合には、移動対象の総数を新しい移動対象が検出されるごとに増加させる。逆に、移動対象が減る場合には、所定の閾値を超えた場合にその追跡対象を消去して、現時点まで追加した移動対象の数を減少させることも可能である。
【0071】
最後に、表示部17が、推定された楕円モデルを画面に出力する(S110)。
【0072】
<実験結果について>
本実施の形態で説明した移動対象追跡装置を用いて、水槽中を泳ぐ魚と屋外で歩いている人との追跡結果について説明する。
【0073】
魚の追跡問題においては更新タイプを適用した。複数の魚がいる場合には群れをなすことが多い。そのため、単純に色の画像特徴量のみでは個体識別することは困難である。また、交換タイプを魚の群れに適応した場合には、絶えず置換処理が生じるため、置換型は魚の群れ追跡問題では適切でないと言える。そのため、魚の追跡問題ではオクルージョン問題は考慮しない。オクルージョンが生じた場合には消滅したものと捉え、再び見えるようになったときには新しい移動対象として検出される。なお、人の追跡問題では、オクルージョンを考慮している。
【0074】
図4は、二人の歩行者が交錯する場合の実験結果である。二人が向かい合っている状態から次第に近づいてすれ違うときにオクルージョンが生じるが、交錯後においても、追跡指標である楕円M1,M2は、交錯前に追跡していた移動対象を追跡している検出結果を得ることができた。
【0075】
図5は、一人の歩行者が壁に完全に隠れてしまう場合の実験結果である。左側から中央に近づいて数秒間壁の裏側で立ち止まり、右側へ歩行し始めている。この場合であっても、追跡指標である楕円は、移動対象を確実に追従する検出結果を得ることができた。
【0076】
図6は、従来法の場合と本実施の形態の場合とにおける魚の追跡結果を示す図である。従来法では、中央の魚が急に移動する向きを変えたため、追跡することを失敗している。一方、本実施の形態では、2匹の魚について確実に追跡している。
【0077】
なお、従来法の場合と本実施の形態の場合との追跡率の評価結果についても説明しておく。人と魚について20種類以上の異なるシーンの映像を用いて実験を行った結果、平均的中率の改善率は、人の場合に40%向上し、魚の場合に30%向上した。なお。これら実験には、σとσは2〜5である。σとσとは0.05〜0.5である。そして、σについては、人の場合に0.05〜0.3とし、魚の場合に0.5〜1.5とした。λは2〜20であり、N+Nは250〜400である。
【0078】
本実施の形態によれば、マルコフ連鎖を用いて移動対象を追跡するので、見かけの変形や変化が生じた場合であっても移動対象を確実に追跡することができる。また、色(色彩)や2値(モノクロ)に関する結合確率関数を用いているため、高速性とロバスト性を高めることが可能となる。更に、追跡指標のパラメータを確率関数を用いて近似しているため、揺らぎ変動分を吸収することもできる。
【0079】
最後に、各実施の形態で説明した移動対象追跡装置は、コンピュータで構成され、各機能ブロックの各処理はプログラムで実行されるようになっている。また、各実施の形態で説明した移動対象追跡装置の各処理動作をプログラムとして例えばコンパクトディスクやフロッピー(登録商標)ディスク等の記録媒体に記録して、この記録媒体をコンピュータに組み込んだり、若しくは記録媒体に記録されたプログラムを、任意の通信回線を介してコンピュータにダウンロードしたり、又は記録媒体からインストールし、該プログラムでコンピュータを動作させることにより、上述した各処理動作を移動対象追跡装置として機能させることができるのは勿論である。
【0080】
なお、本実施の形態で説明した移動対象追跡装置は、マルチメディア分野、符号化分野、通信分野や、複数の対象を視覚的な情報を利用して追従することを必要とする産業分野において応用可能であることを付言しておく。
【図面の簡単な説明】
【0081】
【図1】本実施の形態の場合と従来の場合とにおける2つの移動対象の追跡状況を説明する図である。
【図2】移動対象追跡装置の機能構成を示す図である。
【図3】楕円モデルと前景又は背景との重なりを説明する図である。
【図4】本実施の形態における第1実験結果である。
【図5】本実施の形態における第2実験結果である。
【図6】本実施の形態における第3実験結果である。
【符号の説明】
【0082】
11…入力部
12…解析部
13…仮推定
14…判定部
15…本推定
16…状態決定部
17…表示部
31…記憶部
100…移動対象追跡装置
S101〜S110…ステップ

【特許請求の範囲】
【請求項1】
マルコフ連鎖を用いて移動対象を追跡する移動対象追跡装置において、
少なくとも2つの移動対象が撮影された映像を時系列な複数の画像フレームとして記憶する記憶手段と、
前記画像フレームを前記記憶手段から読み出して、前記2つの移動対象をそれぞれ示した2つの追跡指標の現在状態を解析する解析手段と、
前記2つの移動対象の動きが正規分布に従うものとして、前記2つの追跡指標の次状態を仮推定する仮推定手段と、
前記現在状態から前記次状態に遷移する遷移コストを求め、当該遷移コストに基づいて前記2つの追跡指標が重複しているかいないかを判定する判定手段と、
重複していないと判定された場合には、仮推定された前記次状態で前記2つの追跡指標の次状態をそれぞれ本推定し、重複していると判定された場合には、仮推定された互いの前記次状態を交換して本推定する本推定手段と、
本推定された次状態に対する次確率分布と前記現在状態に対する現在確率分布とを前記画像フレームの画像濃淡値を用いて解析し、当該現在確率分布に対する当該次確率分布の比率を受容率として計算し、当該受容率に基づいて本推定された前記次状態を採用するか否かを決定する状態決定手段と、を有し、
前記画像フレームの画像濃淡値は、前記移動対象である前景と当該移動対象でない背景との2値で表現されるものであって、
前記次確率分布は、前記前景と前記次状態の追跡指標との重複率と、前記背景と当該次状態の追跡指標との重複率とに基づいて求められ、前記現在確率分布は、前記前景と前記現在状態の追跡指標との重複率と、前記背景と当該現在状態の追跡指標との重複率とに基づいて求められることを特徴とする移動対象追跡装置。
【請求項2】
前記次確率分布及び前記現在確率分布は、
色彩に関する画像特徴量を更に用いて求められることを特徴とする請求項1に記載の移動対象追跡装置。
【請求項3】
前記仮推定手段は、
確率関数を前記追跡指標のパラメータに用いて前記2つの追跡指標の次状態を仮推定することを特徴とする請求項1又は2に記載の移動対象追跡装置。
【請求項4】
前記状態決定手段は、
前記重複していないと判定された場合には、
【数1】

を用いて前記2つの追跡指標についてぞれぞれ前記受容率を計算し、
前記重複していると判定された場合には、
【数2】

を用いて前記受容率を計算することを特徴とする請求項1乃至3のいずれか1項に記載の移動対象追跡装置。
【請求項5】
マルコフ連鎖を用いて移動対象を追跡する移動対象追跡装置で処理する移動対象追跡方法において、
前記移動対象追跡方法により、
少なくとも2つの移動対象が撮影された映像を時系列な複数の画像フレームとして記憶手段に記憶する第1ステップと、
前記画像フレームを前記記憶手段から読み出して、前記2つの移動対象をそれぞれ示した2つの追跡指標の現在状態を解析する第2ステップと、
前記2つの移動対象の動きが正規分布に従うものとして、前記2つの追跡指標の次状態を仮推定する第3ステップと、
前記現在状態から前記次状態に遷移する遷移コストを求め、当該遷移コストに基づいて前記2つの追跡指標が重複しているかいないかを判定する第4ステップと、
重複していないと判定された場合には、仮推定された前記次状態で前記2つの追跡指標の次状態をそれぞれ本推定し、重複していると判定された場合には、仮推定された互いの前記次状態を交換して本推定する第5ステップと、
本推定された次状態に対する次確率分布と前記現在状態に対する現在確率分布とを前記画像フレームの画像濃淡値を用いて解析し、当該現在確率分布に対する当該次確率分布の比率を受容率として計算し、当該受容率に基づいて本推定された前記次状態を採用するか否かを決定する第6ステップと、を有し、
前記画像フレームの画像濃淡値は、前記移動対象である前景と当該移動対象でない背景との2値で表現されるものであって、
前記次確率分布は、前記前景と前記次状態の追跡指標との重複率と、前記背景と当該次状態の追跡指標との重複率とに基づいて求められ、前記現在確率分布は、前記前景と前記現在状態の追跡指標との重複率と、前記背景と当該現在状態の追跡指標との重複率とに基づいて求められることを特徴とする移動対象追跡方法。
【請求項6】
前記次確率分布及び前記現在確率分布は、
色彩に関する画像特徴量を更に用いて求められることを特徴とする請求項5に記載の移動対象追跡方法。
【請求項7】
前記第3ステップは、
確率関数を前記追跡指標のパラメータに用いて前記2つの追跡指標の次状態を仮推定することを特徴とする請求項5又は6に記載の移動対象追跡方法。
【請求項8】
請求項5乃至7のいずれか1項に記載の移動対象追跡方法における各ステップをコンピュータによって実行させることを特徴とする移動対象追跡プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−141668(P2010−141668A)
【公開日】平成22年6月24日(2010.6.24)
【国際特許分類】
【出願番号】特願2008−316812(P2008−316812)
【出願日】平成20年12月12日(2008.12.12)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】