説明

複数対象物追跡方法、複数対象物追跡装置、複数対象物追跡プログラムおよびそのプログラムを記録した記録媒体

【課題】運用上のコストが安く、対象が重なり合う場合においても安定して3次元空間上での位置の追跡を行うことができる複数対象物追跡装置を提供する。
【解決手段】 画像入力装置(カメラ)より画像を取得する画像の取得手段11と、前記画像の取得手段11によって取得された画像から追跡対象が写っている領域を抽出したシルエット画像を作成するシルエット画像の作成手段12と、実世界上に配置したカメラの外部・内部パラメータが保存されたセンサ情報データベース21と、前記シルエット画像の作成手段12によって作成されたシルエット画像および前記センサ情報データベース21に保存された前記カメラの外部・内部パラメータに基づいて、追跡対象の状態を確率的に推定する対象状態の推定手段13と、前記推定された対象状態を記憶する対象状態記憶手段22とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像入力装置(例えば,カメラ等)を用いて,物体,動物,人間の三次元位置や大きさなどの状態を追跡する複数対象物追跡方法、複数対象物追跡装置、複数対象物追跡プログラムおよびそのプログラムを記録した記録媒体に関するものである。
【背景技術】
【0002】
コンピュータビジョン分野では複数のカメラの情報を利用して人物などの動く対象の追跡に関する研究が多く行われており、例えば次の処理が実現されている。
【0003】
複数の視点から対象を観測し,画像上における対象の領域(シルエット)を抽出したシルエット画像を用意する。さらに予め追跡を行う空間の三次元構造(以下,三次元環境情報と呼ぶ)と追跡に利用する全てのカメラの内部・外部パラメータを予め計測して求めておき,三次元環境中に人物モデルを配置し,先に算出したカメラパラメータを持つ仮想のカメラでこのシーンを撮影すると,シルエット画像のシミュレーションを行うことができる。人物モデルに楕円体を用いて,生成したシミュレーション画像とシルエット画像を比較することで一般的な環境の下でも複数の人物の追跡を行う方法が提案されている(例えば非特許文献1)。
【非特許文献1】T. Osawa,X. Wu, K. Sudo, K. Wakabayashi, H. Arai and T. Yasuno, “MCMC based Multi−body Tracking Using Full 3D Model of Both Target and Environment,” in Proc. of IEEE Intl Conf. on Advanced Video and Signal based Surveillance(AVSS 2007), Sep. 2007.pp.1〜6.
【非特許文献2】Z. Zhang. “A flexible new technique for camera calibration”. IEEE Transactions on Pattern Analysis and Machine Intelligence, VOL.22,NO.11,NOVEMBER 2000.pp.1330−1334
【発明の開示】
【発明が解決しようとする課題】
【0004】
前記非特許文献1の方法では,人物の三次元空間上での位置を直接予測し,複数のカメラからの情報を統合することで,対象同士が接近しても安定して追跡を行うことができることを特徴としている。
【0005】
しかしながら,複数のカメラの情報を統合するにはカメラのシャッターを同期すること,カメラ間の姿勢情報を予め取得しておく必要があることなど,運用上のコストが高くなってしまうという問題を有している。
【0006】
また,一台のカメラから従来行われてきた研究では画像上の追跡では,対象が重なり合うと追跡が極端に不安定となるといった問題点がある。
【0007】
本発明は,上述のような従来技術の問題点を解決するためになされたものであり,1台のカメラ情報のみを用いることにより、運用上のコストが安く、対象が重なり合う場合においても安定して3次元空間上での位置の追跡を行うことができる複数対象物追跡方法、複数対象物追跡装置、複数対象物追跡プログラムおよびそのプログラムを記録した記録媒体を提供することを目的としている。
【課題を解決するための手段】
【0008】
上記課題を解決するための請求項1に記載の複数対象物追跡方法は、画像入力装置を用いて、物体、動物、人間の少なくともいずれかを含む複数の対象物の三次元位置、大きさなどの状態を追跡する方法であって、画像の取得手段が、前記画像入力装置より画像を取得する画像の取得ステップと、シルエット画像の作成手段が、前記画像の取得ステップによって取得された画像から追跡対象が写っている領域を抽出したシルエット画像を作成するシルエット画像の作成ステップと、対象状態の推定手段が、前記シルエット画像の作成ステップによって作成されたシルエット画像に基づいて、追跡対象の状態を確率的に推定する対象状態の推定ステップとを備え、前記対象状態の推定ステップは、予め用意された複数の変化タイプから任意の確率に従って1つの変化タイプを選択する変化タイプの選択ステップと、追跡対象の中からどの対象を変化させるかを選択する変化対象の選択ステップと、前記変化タイプの選択ステップにより選択された変化タイプと前記変化対象の選択ステップにより選択された変化対象に基づいて、対象状態を変化させるステップと、前記対象状態を変化させるステップにより変化させた対象状態に基づいて、その状態となった対象を実世界に配置したカメラと同じ外部・内部パラメータを持つ仮想のカメラに投影し、実画像より作成されたシルエット画像をシミュレートしたシミュレーション画像を作成するシミュレーション画像作成ステップと、前記対象状態を変化させるステップにより変化させた対象状態の尤もらしさを評価するために、対象物同士の重なりに関する事前知識に基づいた対象状態自体の確率的尤度と、実画像より作成されたシルエット画像とシミュレーションにより作成されたシルエット画像の一致度に基づいた尤度とを計算し、それらの積を最終的な尤度として計算する尤度の計算ステップと、前記尤度の計算ステップにより計算された尤度より、その状態を対象状態分布の一つとして受け入れるか、もしくは拒否するかを判断する演算を行う受け入れ・拒否演算ステップとを備えたことを特徴としている。
【0009】
また請求項2に記載の複数対象物追跡方法は、請求項1において、前記対象状態の推定ステップでは、前記対象状態を楕円体モデルの集合で表し、モデル頭頂部の画像上での二次元座標値、頭部を近似する楕円体の短軸および身体を近似する楕円体の短軸および身長を表すモデルの高さで人物を表すことを特徴としている。
【0010】
また、請求項3に記載の複数対象物追跡装置は、画像入力装置を用いて、物体、動物、人間の少なくともいずれかを含む複数の対象物の三次元位置、大きさなどの状態を追跡する装置であって、前記画像入力装置より画像を取得する画像の取得手段と、前記画像の取得手段によって取得された画像から追跡対象が写っている領域を抽出したシルエット画像を作成するシルエット画像の作成手段と、実世界上に配置したカメラの外部・内部パラメータが保存されたセンサ情報データベースと、前記シルエット画像の作成手段によって作成されたシルエット画像および前記センサ情報データベースに保存された前記カメラの外部・内部パラメータに基づいて、追跡対象の状態を確率的に推定する対象状態の推定手段とを備え、前記対象状態の推定手段は、予め用意された複数の変化タイプから任意の確率に従って1つの変化タイプを選択し、追跡対象の中からどの対象を変化させるかを選択し、前記選択された変化タイプと変化対象に基づいて、対象状態を変化させ、前記変化させた対象状態に基づいて、その状態となった対象を実世界に配置したカメラと同じ外部・内部パラメータを持つ仮想のカメラに投影し、実画像より作成されたシルエット画像をシミュレートしたシミュレーション画像を作成し、前記変化させた対象状態の尤もらしさを評価するために、対象物同士の重なりに関する事前知識に基づいた対象状態自体の確率的尤度と、実画像より作成されたシルエット画像とシミュレーションにより作成されたシルエット画像の一致度に基づいた尤度とを計算し、それらの積を最終的な尤度として計算し、前記計算された尤度より、その状態を対象状態分布の一つとして受け入れるか、もしくは拒否するかを判断する演算を行うことを特徴としている。
【0011】
また、請求項4に記載の複数対象物追跡プログラムは、コンピュータに請求項1又は2に記載の各ステップを実行するための複数対象物追跡プログラムである。
【0012】
また、請求項5に記載の記録媒体は、コンピュータに請求項1又は2に記載の各ステップを実行するための複数対象物追跡プログラムを記録したコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0013】
本発明によれば、対象状態を楕円体モデルの集合で表し、モデル頭頂部の画像上での二次元座標値、頭部を近似する楕円体の短軸および身体を近似する楕円体の短軸および身長を表すモデルの高さで人物を表して、画像上の二次元情報と人物モデルの三次元情報を組み合わせることによって、1台の画像入力装置(カメラ)情報のみを用いて、対象物が重なり合う場合においても安定して3次元空間上での位置の追跡を行う、複数対象物追跡装置を実現できる。
【0014】
また、1台のカメラのみしか使わないので、コストの安い複数対象物追跡装置を実現できる。
【0015】
また、「実画像より作成したシルエット画像とシミュレーション画像の比較による尤度」と「人物同士の重なりに関する事前知識に基づいた対象状態自体の確率的尤度」を組み合わせることによって、従来困難とされていた、対象物同士が非常に接近するような状況下においても安定した追跡を可能とする、複数対象物追跡装置、方法を実現できる。
【発明を実施するための最良の形態】
【0016】
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。
【0017】
図1に本発明の複数対象物追跡装置の実施形態例を示す。図1において、本実施形態例の複数対象物追跡装置は、画像の取得手段11と,シルエット画像の作成手段12と,対象状態の推定手段13と,センサ情報データベース21と,対象状態記憶手段22で構成される。
【0018】
画像の取得手段11は,各時刻に撮影された画像データを取得する手段であり,例えばデジタルカメラやビデオカメラ等の画像センサーなどで構成されている。
【0019】
シルエット画像の作成手段12は,前記取得された画像データから対象の写っている領域のみを抽出した画像,すなわちシルエット画像を作成する。
【0020】
対象状態の推定手段13は,前時刻に推定された対象状態を初期状態として,シルエット画像の作成手段12により作成されたシルエット画像とセンサ情報データベース21を用いて対象状態を確率的に推定し,対象状態記憶手段22に保存されている前時刻の対象状態分布を現時刻の対象状態分布に更新する。
【0021】
センサ情報データベース21は,予め計測しておいたカメラなどの画像の取得手段11のカメラ内部パラメータ(焦点距離,画像中心などのパラメータ),カメラ外部パラメータ(設置されているカメラの三次元位置および姿勢情報)を保存する。
【0022】
対象状態記憶手段22は,対象状態の推定手段13によって推定された対象状態を記憶する。
【0023】
次に本発明の実施形態の一例を詳細に説明する.本発明の目的は,三次元空間中に存在する複数の物体、動物、人間(人物)の少なくともいずれかを含む対象物の各時刻tにおける位置,大きさを表す対象状態を逐次的に推定し,対象物を追跡することである.
本実施形態では,例えば図2のように平面上を歩行する複数の人物を追跡対象とし,位置と姿勢を固定されたビデオカメラ(カメラ1)を用いて追跡を行う例について示す。
【0024】
また配置されたカメラのカメラ内部パラメータの校正,および三次元位置(x,y,z)と姿勢(φ,θ,γ)を求める。これは例えば非特許文献2の方法によって取得することが可能である。このようにして取得したカメラの三次元位置および姿勢を,センサ情報データベース21に予め記憶しておくことにする。
【0025】
本実施形態では一例として,図3のように2つの楕円体を用いて人物の形状を近似したモデルを定義した。モデル頭頂部の画像上での二次元座標値(x,y),頭部を近似する楕円体の短軸r1および身体を近似する楕円体の短軸r2および身長を表すモデルの高さhで人物を表すこととした。なお,頭部を近似する楕円体の長軸と短軸は一定の比率を保っていると考え,長軸半径r=k1×r1とした。k1は任意の定数であり,例えば1.5という数値を使っても良い。また,身体を近似する楕円体の長軸に関しても同様に長軸半径r=h−k2×r1とした。k2は任意の定数であり,例えば1.2という数値を使っても良い。
【0026】
以上のようにして,(x,y,r1,r2,h)の5つのパラメータにより,一人の人物の状態を表すことができる。
【0027】
対象状態の推定手段13には確率統計状態分布推定法の一種であるMCMC(Markov Chain Monte Carlo)法を用いる例で説明する。
【0028】
複数の人物の状態を表す対象状態Sは各人物の位置,大きさを表すベクトルM(人物モデル)を並べたものによって表す.対象状態Sの次元数は追跡人数Kによって定まり可変である.すなわちベクトルMが5次元ベクトルであるので,5K次元ベクトルとなる.時刻tにおける状態Stは以下の式(1)で表される。
【0029】
【数1】

【0030】
状態Sを構成する人物kの位置,大きさ,形を表す人物モデルMkは,以下の式(2)で表される5次元ベクトルである。
【0031】
【数2】

【0032】
ただし,ここで人物モデルMkを構成する5つのパラメータは前述の人物の形状を近似したモデルのパラメータである。
【0033】
本実施形態は,以上説明した各時刻tにおける状態Stを推定することで,複数人物の状態を逐次推定し,追跡を行うものである。
【0034】
図4は本実施形態の動作を示すフローチャートの一例である。処理が開始されると,画像の取得手段11により,カメラより撮影された画像データ(Im1)を取得する(ステップS301)。
【0035】
次にシルエット画像の作成手段12により,前記カメラから取得した画像データ(Im1)に対し,それぞれのシルエット画像(Sil1)を作成する(ステップS302)。シルエット画像とは図5のように撮影した画像の対象が写っている領域の輝度値が1,他の領域が0である2値画像のことで,501は入力画像,502が作成されたシルエット画像の一例である。このような画像は背景差分法やフレーム間差分法などのよく知られた方法を利用することで簡単に生成することができる。
【0036】
次に前時刻で推定され対象状態記憶手段22に保存された対象状態St-1を対象状態の初期値とし,これを逐次更新していくことで対象状態の確率的分布を推定する(ステップS303)。ここでステッS303の処理の詳細を図6のフローチャートを用いて説明する。
【0037】
対象状態の確率分布の推定は複数回,(B+P)回の反復計算によって生成される(B+P)個の状態候補を用いて行われる。ここで,前時刻に推定された対象状態をS’t,0,n回目の反復計算において生成された状態候補をS’t,nと表すことにする。最初のB回に生成された状態候補は捨て,最後のP回に得られた状態候補は全て等確率で起こりうると考え対象状態を計算する。これは最初のほうに生成された状態候補は初期状態S’t,0に大きく依存していると考えられるためである。
【0038】
尚t=0では、S’0,0={0}として処理を始める。この場合、誰も人物を追跡していないので、ステップS401において変化タイプ「人物の追加」が選ばれ、順々に処理を続ける。
【0039】
まず更新回数n=1として処理が開始される。ステップS401では変化タイプの選択を行う。変化タイプとは対象状態を変化させる処理のタイプを表すものであり,次の4種類から成る。
【0040】
1:人物の追加,2:人物の消去,3:人物の位置変更,4:人物の大きさ変更。
【0041】
まず現在の状態として誰も人物を追跡していない場合には必ず「1:人物の追加」が選択される。それ以外の場合には各タイプが選ばれる確率を予め任意に設定しておき,確率的に4つのタイプから選択を行う。例えば(p1, p2, p3, p4)=(0.1,0.1,0.4,0.4)というように設定することができる(piはタイプiが選択される確率)。
【0042】
次にステップS402では変化させる対象を選択する。一度の処理で全ての対象の状態を変化させると推定が大きくばらつくため,一度の計算において,選択された一つの対象の状態のみを変化させる。
【0043】
まず変化タイプが「1:人物の追加」である場合には,新たな人物状態を追加するため,前回生成された状態候補S’t,n-1から対象を選択せず、追加した状態を変化させる対象として選択する。
【0044】
変化タイプが「1:人物の追加」以外である場合には,前回生成された状態候補S’t,n-1からランダムに対象を選択する。すなわちK個の対象があった場合には各々の対象が1/Kの確率で選択されることになる。
【0045】
次に、ステップS403は本発明の対象状態を変化させるステップであり、ここでは選択された人物モデルMkから選択された各変化タイプの処理に従って状態を変化させ暫定的な状態候補S*を計算する.以下で変化タイプ別に処理を説明する。
【0046】
「1:人物の追加」が選ばれた場合には、新たにモデルパラメータの設定を行う必要がある。例えばこれは以下のようにして設定することができる。
【0047】
画像の大きさが決まっていることから,人物頭頂部の画像平面上で取り得る位置の範囲が定まる,ここではこの範囲を
【0048】
【数3】

【0049】
とする。また人物を近似する楕円体の大きさを表すパラメータr1,r2およびhに関しては,人物の大きさに関する経験的な事前知識(3mを超える身長の人はいないなど)から同様にして取り得る値の範囲を制限することができる。ここではこの範囲を
【0050】
【数4】

【0051】
とする。
以上のような条件下でx,y,r1,r2,hのそれぞれのパラメータに関して一様乱数を発生させることで,新しいモデルパラメータMnを生成することができる。これは人物が新たに追跡範囲に入ってきたことを表す。
【0052】
当然ながら予め入退室する場所,例えばドアの場所などの情報が得られていれば,画像上のその近辺だけを入退室エリアにすることも可能である。
【0053】
暫定的な状態候補S*はS’t,n-1に新たな対象状態Mnを追加した状態となる。
【0054】
「2:人物の消去」が選択された場合には,選択された対象Mkを消去する。これは追跡していた人物が追跡範囲から消えたことを表す。
【0055】
暫定的な状態候補S*はS’t,n-1から対象状態Mkを消去した状態となる。
【0056】
「3:人物の位置変更」が選択された場合には,選択されたMkの要素の内,人物の二次元平面上での位置(xk,yk)から次の式(5)に従って変化させた暫定的な位置(x’k,y’k)を計算する。
【0057】
【数5】

【0058】
ただしδx,δyはそれぞれ一次元のガウスノイズであり,そのパラメータは実験的に任意の値に決めることができる.M’kを以下の式(6)のように定義する。
【0059】
【数6】

【0060】
暫定的な状態候補S*はS’t,n-1の対象状態MkをM’kに更新した状態となる。
【0061】
「4:人物の大きさ変更」が選択された場合には,選択されたMkの要素の内,人物を近似する楕円体の半径r1,半径r2および高さhを表す(r1k,r2k,hk)から次の式(7)に従って変化させた暫定的な形,大きさパラメータ(r1’k,r2’k,h’k)を計算する。
【0062】
【数7】

【0063】
ただしδr1,δr2,δhはそれぞれ一次元のガウスノイズであり,そのパラメータは実験的に任意の値に決めることができる。この暫定的な形,大きさパラメータを用いてM’kを以下の式(8)のように定義する。
【0064】
【数8】

【0065】
暫定的な状態候補S*はS’t,n-1の対象状態MkをM’kに更新した状態となる。
【0066】
次に暫定的な状態候補S*を用いて,シルエット画像の作成(ステップS302)で作成されたシルエット画像(Sil1)をシミュレートした画像,シミュレーション画像(Sim1)を作成する(ステップS404)。センサ情報データベース21に保存されている。実世界上に配置されたカメラの内部パラメータ(焦点距離,画像中心など)と外部パラメータ(カメラの三次元位置と姿勢)を用いると三次元空間に存在する物体のカメラ画像上への投影関係が計算できる。この関係を利用すると画像上の二次元座標値(x,y)に投影される平面上に直立する高さhの物体の平面上の二次元座標値(X,Y)を計算することが可能である。これより三次元空間内にS403で計算された暫定的な対象状態S*に基づいた楕円体で構成された三次元モデルを複数配置することができる。
【0067】
以上のように生成された仮想シーンを仮想カメラへ投影することで,シミュレーション画像を作成する。
【0068】
この投影処理は一例として非特許文献1に記載の方法を用いて一意に行うことができる。この際,画像上の楕円体領域の値を1,それ以外の領域の値を0とする2値画像とすることで,シルエット画像(Sil1)をシミュレートしたシミュレーション画像(Sim1)を作成することができる。以上がステップS404の処理である。
【0069】
次にこの暫定的な対象候補S*が尤もらしいか判断するために,尤度Lを計算する(ステップS405)。これは事前知識による対象状態自体の確からしさの判定およびステップS302で作成されたシルエット画像(Sil1)とステップS404で生成されたシミュレーション画像(Sim1)の比較により行う。
【0070】
事前知識による対象状態自体の確からしさの判定は,追跡している人物同士が三次元空間上で重なることがないという条件である。いま,人物を楕円体モデルで近似しているため,個々の楕円体が重ならない条件,すなわち異なる二つの楕円体の中心同士の距離が,二つの楕円体の半径の和より大きいことを満たす必要がある。
【0071】
二人の人物同士が三次元空間上で重ならないようにするために,次の式(9)で表された距離R,すなわち二人の人物を表す楕円体の中心同士の距離に応じたペナルティ関数E(S*)を設定する。
【0072】
【数9】

【0073】
ただし,Xk,Ykはシミュレーション画像生成の際に計算した三次元空間上での人物kの平面上の位置X座標,Y座標を示す。
【0074】
楕円体の距離が近くなるとペナルティを与える関数Eは、本発明の、対象物同士の重なりに関する事前知識に基づいた対象状態自体の確率的尤度を表し、例えば以下の式(10)のように設定できる。
【0075】
【数10】

【0076】
ただしαは定数で,実験的に任意に設定可能である。
【0077】
次に前記ステップS302で作成されたシルエット画像(Sil1)とステップS404で生成されたシミュレーション画像(Sim1)の比較について説明する。これは例えば以下の式(11)の評価式によって計算を行うことができる。
【0078】
【数11】

【0079】
ただし,Vは前記シルエット画像とシミュレーション画像の一致度、(u,v)は画像のu行v列成分を示す。
【0080】
最終的に暫定状態S*の尤度Lは式(12)によって表される,積演算によって計算される。
【0081】
【数12】

【0082】
このような尤度を用いることで,三次元空間上での人物位置の確からしさと二次元画像上での追跡を融合することが可能となる。
以上がステップS405の処理である。
【0083】
次にステップS406では前記ステップS405で計算された尤度を用いて,暫定状態候補S*を受け入れるか,もしくは拒否するかの演算を行う。これは受け入れ拒否判断確率Aの計算によって決定する。受け入れ拒否判断確率Aは例えば以下の式(13)により計算することが可能である。
【0084】
【数13】

【0085】
ここで現在n回目の更新だとすると,L’はn−1回目の状態候補S’t,n-1の尤度を表す。つまり前回の状態よりも今回の状態のほうが尤度が高ければ必ず受け入れ,そうでなければL/L’の確率で暫定状態S*を採用する。
【0086】
ここで暫定状態S*が採用されれば,S’t,n=S*とし,採用が拒否されればS’t,n=S’t,n-1として,ステップS407の条件判断ステップへと進む。
【0087】
ステップS407では更新処理が規定の回数行われたかの判断が行われる。更新回数nが任意に決定できる定数BとPの和で表されるB+P回を超えていれば反復計算処理を終了し,ステップS408の対象状態の推定ステップへと進む。
【0088】
次にステップS408では最大確率を持つ対象状態の計算を行う。反復計算により生成された状態候補のうち,最後のP個の対象状態は全て等確率で起こると仮定しているため,最大確率を持つ対象状態Stは以下の式(14)によって計算することができる。
【0089】
【数14】

【0090】
このようにして計算したStを対象状態記憶手段22に保存する。
【0091】
以上述べた処理が図4のステップS303である。
【0092】
次にステップS304では追跡を終了するかどうかのチェックを行う。追跡が終了なら処理を終了とし,まだ追跡を続けるのならば,次の時刻の画像取得(ステップS301)の処理を行う。
【0093】
以上,述べた処理を繰り返すことで動的に人数の変化する複数の人物の状態を逐次推定することが可能となる。
【0094】
本実施形態では,図6のステップS405の処理において,一例としてシルエット画像とシミュレーション画像の比較に式(11)を用いたが,画像間の類似度を取る評価関数,例えば単純な積演算を利用しても同様に実現できる。
【0095】
なお図1で示した装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し,そのプログラムをコンピュータを用いて実行して本発明を実現することができること,図4,図6で示した処理の手順をコンピュータのプログラムで構成し,そのプログラムをコンピュータに実行させることができることは言うまでもなく,コンピュータでその機能を実現するためのプログラムを,そのコンピュータが読み取り可能な記録媒体,例えばFDや,MO,ROM,メモリカード,CD,DVD,リムーバブルディスクなどに記録して,保存したり,配布したりすることが可能である。また,上記のプログラムをインターネットや電子メールなど,ネットワークを通して提供することも可能である。
【0096】
<実施例>
以下に,上述の複数対象物追跡装置を用いて,ビデオカメラから得られた映像を処理して,追跡範囲に侵入してくる人物を追跡した結果を図4に示した処理フローを用いて述べる。まず処理が開始されると,カメラ画像の取得を行い(ステップS301),シルエット画像を作成する(ステップS302)。図7にカメラから取得した画像列の一部(701〜706),背景差分法を用いて作成したシルエット画像(707〜712)を示す。
【0097】
次にステップS303にて対象状態の推定を行う。ここでは状態を逐次更新させながらその状態をシミュレートしたシミュレーション画像の作成を行って,その評価を行う。
【0098】
図8に計算された最大確率を取る対象状態を表現した画像を示す。図8は,それぞれ上段がカメラからの画像(901〜906),中段が最大確率を取る対象状態をシミュレートした画像(907〜912),下段が俯瞰図として天井にカメラが設置されているとして最大確率を取る対象状態をシミュレートした画像(913〜918)であり,複数の人物同士が重なり合っているが安定して追跡できていることが確認できる。
【0099】
ステップS304では現時刻までで,追跡を終了とする場合には,処理を終了とし,そうでない場合には,ステップS301の画像の取得へ戻る。
【0100】
以上述べた処理を繰り返すことで本実施例では一台のカメラのみを用いて人物が重なり合うような状況においても安定した追跡を行うことができる。
【0101】
これは二次元画像上での追跡と三次元空間上での対象の位置の整合性を融合しているためである。
【図面の簡単な説明】
【0102】
【図1】本発明の複数対象物追跡装置の一実施形態の構成を示すブロック図である。
【図2】本発明の複数対象物追跡装置の一実施形態における画像データ取得の様子を示す説明図である.
【図3】本発明の複数対象物追跡装置の一実施形態で用いる対象の三次元モデルである楕円体モデルを示す説明図である。
【図4】本発明の複数対象物追跡方法の処理手順を示すフローチャートである。
【図5】本発明の一実施形態における入力画像に対応するシルエット画像を示す説明図である。
【図6】本発明の一実施形態における対象状態の推定(ステップS303)の処理手順を示すフローチャートである。
【図7】本発明の実施例における、カメラからの画像列、作成したシルエット画像の一部を示した説明図である。
【図8】本発明の実施例における、入力画像の一部および入力画像から計算した対象状態をシミュレートした画像とそれを俯瞰した画像を示した図である。
【符号の説明】
【0103】
11…画像の取得手段、12…シルエット画像の作成手段、13…対象状態の推定手段、21…センサ情報データベース、22…対象状態記憶手段、701〜706,901〜906…カメラ画像、707〜712…シルエット画像、907〜918…計算した対象状態をシミュレートした画像。

【特許請求の範囲】
【請求項1】
画像入力装置を用いて、物体、動物、人間の少なくともいずれかを含む複数の対象物の三次元位置、大きさなどの状態を追跡する方法であって、
画像の取得手段が、前記画像入力装置より画像を取得する画像の取得ステップと、
シルエット画像の作成手段が、前記画像の取得ステップによって取得された画像から追跡対象が写っている領域を抽出したシルエット画像を作成するシルエット画像の作成ステップと、
対象状態の推定手段が、前記シルエット画像の作成ステップによって作成されたシルエット画像に基づいて、追跡対象の状態を確率的に推定する対象状態の推定ステップとを備え、
前記対象状態の推定ステップは、
予め用意された複数の変化タイプから任意の確率に従って1つの変化タイプを選択する変化タイプの選択ステップと、
追跡対象の中からどの対象を変化させるかを選択する変化対象の選択ステップと、
前記変化タイプの選択ステップにより選択された変化タイプと前記変化対象の選択ステップにより選択された変化対象に基づいて、対象状態を変化させるステップと、
前記対象状態を変化させるステップにより変化させた対象状態に基づいて、その状態となった対象を実世界に配置したカメラと同じ外部・内部パラメータを持つ仮想のカメラに投影し、実画像より作成されたシルエット画像をシミュレートしたシミュレーション画像を作成するシミュレーション画像作成ステップと、
前記対象状態を変化させるステップにより変化させた対象状態の尤もらしさを評価するために、対象物同士の重なりに関する事前知識に基づいた対象状態自体の確率的尤度と、実画像より作成されたシルエット画像とシミュレーションにより作成されたシルエット画像の一致度に基づいた尤度とを計算し、それらの積を最終的な尤度として計算する尤度の計算ステップと、
前記尤度の計算ステップにより計算された尤度より、その状態を対象状態分布の一つとして受け入れるか、もしくは拒否するかを判断する演算を行う受け入れ・拒否演算ステップと
を備えたことを特徴とする複数対象物追跡方法。
【請求項2】
請求項1において、前記対象状態の推定ステップでは、
前記対象状態を楕円体モデルの集合で表し、モデル頭頂部の画像上での二次元座標値、頭部を近似する楕円体の短軸および身体を近似する楕円体の短軸および身長を表すモデルの高さで人物を表すことを特徴とする複数対象物追跡方法。
【請求項3】
画像入力装置を用いて、物体、動物、人間の少なくともいずれかを含む複数の対象物の三次元位置、大きさなどの状態を追跡する装置であって、
前記画像入力装置より画像を取得する画像の取得手段と、
前記画像の取得手段によって取得された画像から追跡対象が写っている領域を抽出したシルエット画像を作成するシルエット画像の作成手段と、
実世界上に配置したカメラの外部・内部パラメータが保存されたセンサ情報データベースと、
前記シルエット画像の作成手段によって作成されたシルエット画像および前記センサ情報データベースに保存された前記カメラの外部・内部パラメータに基づいて、追跡対象の状態を確率的に推定する対象状態の推定手段とを備え、
前記対象状態の推定手段は、
予め用意された複数の変化タイプから任意の確率に従って1つの変化タイプを選択し、
追跡対象の中からどの対象を変化させるかを選択し、
前記選択された変化タイプと変化対象に基づいて、対象状態を変化させ、
前記変化させた対象状態に基づいて、その状態となった対象を実世界に配置したカメラと同じ外部・内部パラメータを持つ仮想のカメラに投影し、実画像より作成されたシルエット画像をシミュレートしたシミュレーション画像を作成し、
前記変化させた対象状態の尤もらしさを評価するために、対象物同士の重なりに関する事前知識に基づいた対象状態自体の確率的尤度と、実画像より作成されたシルエット画像とシミュレーションにより作成されたシルエット画像の一致度に基づいた尤度とを計算し、それらの積を最終的な尤度として計算し、
前記計算された尤度より、その状態を対象状態分布の一つとして受け入れるか、もしくは拒否するかを判断する演算を行う
ことを特徴とする複数対象物追跡装置。
【請求項4】
コンピュータに請求項1又は2に記載の各ステップを実行するための複数対象物追跡プログラム。
【請求項5】
コンピュータに請求項1又は2に記載の各ステップを実行するための複数対象物追跡プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2009−301241(P2009−301241A)
【公開日】平成21年12月24日(2009.12.24)
【国際特許分類】
【出願番号】特願2008−153583(P2008−153583)
【出願日】平成20年6月11日(2008.6.11)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】