動体追跡装置
【課題】複数動体が交差しても、効率的かつ正確に動体追跡する。
【解決手段】時系列の連続原画像P(i)からなる動画を画像入力部110で入力し、動体識別画像生成部130により、背景画像との差分をとり、背景と前景を区別する動体識別画像M(i)を生成する。トラッカー格納部150は、個々の動体の輪郭に外接するブロッブ包摂図形を、時系列で格納する。マスキング処理部140は、トラッカー格納部150内の時刻t(i−1)の着目動体Tj以外の動体のブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域をマスキングする。ブロッブ包摂図形抽出部170は、マスキング部分を除く前景領域の輪郭を候補ブロッブ包摂図形として抽出する。トラッカー登録部160は、着目動体Tjの先行ブロッブ包摂図形Bj(i−1)に対する後続ブロッブ包摂図形Bj(i)を候補ブロッブ包摂図形の中から選択し、トラッカー格納部150に登録する。
【解決手段】時系列の連続原画像P(i)からなる動画を画像入力部110で入力し、動体識別画像生成部130により、背景画像との差分をとり、背景と前景を区別する動体識別画像M(i)を生成する。トラッカー格納部150は、個々の動体の輪郭に外接するブロッブ包摂図形を、時系列で格納する。マスキング処理部140は、トラッカー格納部150内の時刻t(i−1)の着目動体Tj以外の動体のブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域をマスキングする。ブロッブ包摂図形抽出部170は、マスキング部分を除く前景領域の輪郭を候補ブロッブ包摂図形として抽出する。トラッカー登録部160は、着目動体Tjの先行ブロッブ包摂図形Bj(i−1)に対する後続ブロッブ包摂図形Bj(i)を候補ブロッブ包摂図形の中から選択し、トラッカー格納部150に登録する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、時系列で連続して与えられる静止画像の集合からなる動画について、複数の動体を検出し、これを画面上で追跡する動体追跡装置に関する。
【背景技術】
【0002】
ビデオカメラを用いた監視システムなどでは、監視領域内に存在する動体(移動物体)を自動的に検出し、これを追跡する技術が重要になってきている。動体の自動検出が可能になれば、当該物体が車両であるのか、人間であるのか、といった識別を行う処理に利用することができる。更に、検出した動体を追跡することができれば、所望の動体をズームアップして追尾することも可能になり、不審者などを監視する用途に利用できる。
【0003】
動体検出に利用されている最も一般的な手法は、時系列で連続的に与えられるフレーム単位の原画像を、予め用意した背景画像と比較し、両者の差分を求めることにより、時間的に変化している領域を認識する方法である。たとえば、下記の非特許文献1には、原画像と背景画像とを画素単位で比較して、当該画素が動体を構成する画素であるか否かを判定する手法が開示されている。具体的には、比較対象となる両画素の画素値が類似している場合、当該画素は背景を構成する画素であるとし、類似していない場合、当該画素は動体を構成する画素であるとする判定が行われる。このとき、画素の類否判定は、カラー画像の場合、三次元の色空間上で、双方の画素値に対応する座標点をプロットし、一方の座標点が他方の座標点の近傍領域に入っているか否かを調べることにより行われる。
【0004】
また、下記の特許文献1には、フレーム単位の入力画像をブロックに分割し、個々のブロックごとに画素値の平均値を求め、背景画像の画素値平均と比較することにより、当該ブロックが移動物体を含むか否かを判定する手法が開示されており、特許文献2には、背景画像との差分を求める手法と、テンプレートマッチングを行う手法とを適宜切り替えることにより、照明変動が生じても正確な動体検出を行う方法が提案されている。一方、特許文献3には、複数のカメラを用いた撮影を行うことにより、動体追跡を行う装置が提案されている。
【0005】
更に、特許文献4には、検出した動体の色特徴量を算出し、この色特徴量を用いて動体追跡を行う方法が開示されており、特許文献5には、原画像をサブ区画に分割し、隣接するサブ区画同士の関係度の近似性に基づいて動体追跡を行う方法が開示されている。また、特許文献6には、過去の複数フレームにおける動体の位置から現時点の動体の位置を予測し、予測位置に最も近い動体候補を追跡対象とする方法が開示され、特許文献7には、複数の動体の移動経路が交差した場合にも、これら複数の動体を支障なく追跡する技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平7−302328号公報
【特許文献2】特開2011−60167号公報
【特許文献3】特開2007−142527号公報
【特許文献4】特開2000−48211号公報
【特許文献5】特開2007−287006号公報
【特許文献6】特開2004−46647号公報
【特許文献7】特開2010−39580号公報
【非特許文献】
【0007】
【非特許文献1】Kim K, Chalidabhongse T H, Harwood D, Davis L S. "Background Modeling and Subtraction by Codebook Construction" Proceedings of International Conference on Image Processing, Singapore. IEEE, 2004. 5: 3061-3064
【発明の概要】
【発明が解決しようとする課題】
【0008】
監視システムなどの撮影視野内には、複数の動体が同時に存在することが少なくない。しかも、これら複数の動体はそれぞれが任意の方向に移動しているため、移動経路が画面上で交差する場合がある。従来提案されている動体追跡装置の多くは、このように複数の動体が交差した場合に、正確な追跡を行うことができない。これは、複数の物体の移動経路が交差すると、画面上では、交差時点で複数の物体が、ひとかたまりの物体に融合し、その後、元通りの複数の物体に分離することになるため、個々の物体を正しく認識することができなくなるためである。
【0009】
前掲の特許文献7には、玄関に設置されたカメラ付きインターホンの撮影画像において、人や車などの動体が重なって写った場合にも、個々の動体を適切に追跡する技術が開示されている。この技術では、複数の動体を追跡する際に、動体同士が交差しているか否かの判定を行い、交差していると判定された場合には、重なり合った複数の動体の奥行き関係を認識して、正しい追跡を行う手法が採られる。しかしながら、動体同士の交差を判定する処理や、奥行き関係を把握する処理のために、複雑なプロセスが必要になり、また、様々な状況において常に正確な処理を行うことは困難である。
【0010】
そこで本発明は、複数の動体が交差した場合にも、効率的かつ正確に個々の動体を追跡することが可能な動体追跡装置を提供することを目的とする。
【課題を解決するための手段】
【0011】
(1) 本発明の第1の態様は、動画画像について動体を検出し、これを追跡する動体追跡装置において、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
第i番目の動体識別画像M(i)に基づいて、前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形を第i番目の時系列に所属するブロッブ包摂図形B(i)として抽出するブロッブ包摂図形抽出部と、
同一の動体に基づいて抽出されたと推定される複数のブロッブ包摂図形を先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
ブロッブ包摂図形抽出部によって抽出された第i番目の時系列に所属するブロッブ包摂図形B(i)を、第j番目のトラッカーTj(但し、jはトラッカーの番号を示す自然数)の第i番目の時系列に所属するメンバーとして、トラッカー格納部に登録するトラッカー登録部と、
動体識別画像生成部が生成した動体識別画像の前景領域に対して、トラッカー格納部に格納されている特定のブロッブ包摂図形を利用したマスキングを行うマスキング処理部と、
を設け、
マスキング処理部は、トラッカー格納部に格納されている第j番目のトラッカーTjを着目トラッカーとして、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことにより、着目トラッカーTj用の個別動体識別画像M(i,j)を生成し、これをブロッブ包摂図形抽出部に提供するようにし、
ブロッブ包摂図形抽出部には、動体識別画像M(i)に基づいてブロッブ包摂図形B(i)を抽出する機能に加えて、個別動体識別画像M(i,j)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、動体と認識した画素集団の包摂図形を第i番目の時系列に所属させるべき第j番目のトラッカー用の候補ブロッブ包摂図形として抽出する機能を付加し、
トラッカー登録部が、
(a) 第j番目のトラッカーTjの第(i−1)番目の時系列に末尾ブロッブ包摂図形ではないブロッブ包摂図形が登録されている場合に、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、これに後続させるのに適したブロッブ包摂図形が第j番目のトラッカー用の候補ブロッブ包摂図形内に存在するか否かを判定し、存在するときには、当該候補ブロッブ包摂図形を第i番目の時系列に所属する後続ブロッブ包摂図形として登録する処理を行い、存在しないときには、先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示す処理を行う後続ブロッブ包摂図形登録処理と、
(b) 後続ブロッブ包摂図形登録処理を各トラッカーについて行った後、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)の中に、後続ブロッブ包摂図形登録処理によって登録された後続ブロッブ包摂図形に対応しない新参ブロッブ包摂図形が存在する場合に、当該新参ブロッブ包摂図形を第i番目の時系列が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録する新参ブロッブ包摂図形登録処理と、
を行うようにしたものである。
【0012】
(2) 本発明の第2の態様は、上述した第1の態様に係る動体追跡装置において、
背景画像提供部が、外部から与えられた静止画像を取り込んで保存する機能を有し、静止画像を背景画像として提供するようにしたものである。
【0013】
(3) 本発明の第3の態様は、上述した第1の態様に係る動体追跡装置において、
背景画像提供部が、画像入力部が過去の所定期間にわたって入力した原画像の単純平均もしくは重みづけ平均を求める機能を有し、求めた平均画像を背景画像として提供するようにしたものである。
【0014】
(4) 本発明の第4の態様は、上述した第1〜第3の態様に係る動体追跡装置において、
動体識別画像生成部が、原画像P(i)上の特定位置にある画素の色と、背景画像上の上記特定位置にある画素の色とを比較し、両画素の色の近似度が所定条件を満たす場合には当該特定位置にある画素を背景領域の画素とし、所定条件を満たさない場合には当該特定位置にある画素を前景領域の画素とすることにより、動体識別画像M(i)を生成するようにしたものである。
【0015】
(5) 本発明の第5の態様は、上述した第1〜第4の態様に係る動体追跡装置において、
ブロッブ包摂図形抽出部が、面積が所定の基準に満たない画素集団については、動体と認識せず、ブロッブ包摂図形の抽出を行わないようにしたものである。
【0016】
(6) 本発明の第6の態様は、上述した第1〜第5の態様に係る動体追跡装置において、
ブロッブ包摂図形抽出部が、画素集団の外接矩形をその包摂図形として用いるようにしたものである。
【0017】
(7) 本発明の第7の態様は、上述した第6の態様に係る動体追跡装置において、
ブロッブ包摂図形抽出部が、動体識別画像M(i)を構成する個々の画素に順に着目し、各着目画素について、
(a) 着目画素が前景画素であり、かつ、所定近傍範囲に登録矩形が存在しない場合には、当該着目画素の輪郭を構成する矩形を登録する処理を行い、
(b) 着目画素が前景画素であり、かつ、所定近傍範囲に登録された矩形が存在する場合には、当該登録矩形の領域を着目画素を含む外接矩形に拡張して登録する処理を行い、
最終的に登録された矩形に基づいてブロッブ包摂図形の抽出を行うようにしたものである。
【0018】
(8) 本発明の第8の態様は、上述した第6または第7の態様に係る動体追跡装置において、
トラッカー格納部が、外接矩形の対角に位置する2頂点の座標値をトラッカーの情報として格納するようにしたものである。
【0019】
(9) 本発明の第9の態様は、上述した第1〜第8の態様に係る動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形のうち、着目トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形の所定の近傍範囲内に位置するブロッブ包摂図形のみを用いて、マスキングを行うようにしたものである。
【0020】
(10) 本発明の第10の態様は、上述した第1〜第9の態様に係る動体追跡装置において、
マスキング処理部が、各トラッカーに格納されている第(i−1)番目以前の連続した時系列に所属するブロッブ包摂図形の位置の変遷に基づいて、第i番目の時系列に所属するブロッブ包摂図形の予測位置を求める機能を有し、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、予測位置への位置修正を施し、位置修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにしたものである。
【0021】
(11) 本発明の第11の態様は、上述した第10の態様に係る動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは2以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)の位置の基準点から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)の位置の基準点へ向かうベクトルに対して、その長さを(L/(L−1))倍に伸ばすことにより得られるベクトルの先端を予測位置の基準点とするようにしたものである。
【0022】
(12) 本発明の第12の態様は、上述した第10の態様に係る動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは3以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)まで、合計L個のブロッブ包摂図形の各位置の基準点を近似的に通る二次曲線を求め、この二次曲線上の点を予測位置の基準点とするようにしたものである。
【0023】
(13) 本発明の第13の態様は、上述した第1〜第12の態様に係る動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、輪郭線を所定量だけ外方へ拡張する修正を施し、拡張修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにしたものである。
【0024】
(14) 本発明の第14の態様は、上述した第1〜第13の態様に係る動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理を行う際に、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に対して、第j番目のトラッカー用として抽出された個々の候補ブロッブ包摂図形の適合性評価を行い、所定の基準以上の評価、かつ、最も高い評価を得た候補ブロッブ包摂図形を、先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形と判定し、これを後続ブロッブ包摂図形として登録するようにしたものである。
【0025】
(15) 本発明の第15の態様は、上述した第14の態様に係る動体追跡装置において、
トラッカー登録部が、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて適合性評価を行うようにしたものである。
【0026】
(16) 本発明の第16の態様は、上述した第1〜第15の態様に係る動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理で、第j番目のトラッカーTjについての後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形の大きさが、連続して先行登録されている所定数のブロッブ包摂図形の平均サイズとなるように、当該後続ブロッブ包摂図形の大きさに対する修正を行うようにしたものである。
【0027】
(17) 本発明の第17の態様は、上述した第1〜第16の態様に係る動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理において、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形が、第j番目のトラッカー用の候補ブロッブ包摂図形内に存在しない場合に、第j番目のトラッカーTjの第i番目の時系列を無登録状態とする処理を行うことにより、先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示すようにしたものである。
【0028】
(18) 本発明の第18の態様は、上述した第1〜第17の態様に係る動体追跡装置において、
トラッカー登録部が、新参ブロッブ包摂図形登録処理を行う際に、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)と、後続ブロッブ包摂図形登録処理によって第i番目の時系列に登録された後続ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、ブロッブ包摂図形B(i)の中で対応関係が認識できないブロッブ包摂図形を新参ブロッブ包摂図形とするようにしたものである。
【0029】
(19) 本発明の第19の態様は、動画画像について動体を検出し、これを追跡する動体追跡装置において、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
同一の動体と推定される画素集団の包摂図形からなるブロッブ包摂図形を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体を示すブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理部と、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出部と、
トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体を示す先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体を示すブロッブ包摂図形を、着目動体以外の動体を示すブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から選択し、これをトラッカー格納部に、先行ブロッブ包摂図形に後続する第i番目の時系列の後続ブロッブ包摂図形として登録するとともに、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形の登録が行われていない新参ブロッブ包摂図形を、第i番目の時系列が未登録状態のトラッカーに、先頭ブロッブ包摂図形として登録するトラッカー登録部と、
を設けたものである。
【0030】
(20) 本発明の第20の態様は、上述した第19の態様に係る動体追跡装置において、
トラッカー登録部が、
先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、第i番目の時系列の後続ブロッブ包摂図形として登録されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とするようにしたものである。
【0031】
(21) 本発明の第21の態様は、上述した第1〜第20の態様に係る動体追跡装置を、コンピュータに専用のプログラムを組み込むことにより構成したものである。
【0032】
(22) 本発明の第22の態様は、上述した第1〜第20の態様に係る動体追跡装置に加えて、更に、
動画画像を撮影して画像入力部に与えるビデオカメラと、
トラッカー格納部から、1つの選択トラッカーに連続して登録されているブロッブ包摂図形B(i)を順次取り出し、画像入力部が入力した原画像P(i)からブロッブ包摂図形B(i)の内部の画像を切出して表示することにより、特定の動体を追跡した部分動画画像を提示する部分動画提示部と、
を設けることにより、監視システムを構成したものである。
【0033】
(23) 本発明の第23の態様は、上述した第22の態様に係る監視システムにおいて、
部分動画提示部が、ブロッブ包摂図形B(i)を所定量だけ外方へ拡張し、拡張された包摂図形の内部の画像を切出して表示するようにしたものである。
【0034】
(24) 本発明の第24の態様は、動画画像について動体を検出し、これを追跡する動体追跡方法において、
コンピュータが、時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力段階と、
コンピュータが、動画画像の背景を構成する背景画像と、第i番目の原画像P(i)とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成段階と、
コンピュータが、第(i−1)番目の原画像P(i−1)内に含まれる着目動体の輪郭を包摂する先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体の輪郭を包摂する後続ブロッブ包摂図形を認識するとともに、第i番目の原画像P(i)において新たに出現した動体の輪郭を包摂する新参ブロッブ包摂図形を認識する後続/新参ブロッブ包摂図形認識段階と、
を行い、
後続/新参ブロッブ包摂図形認識段階では、
第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体の輪郭を包摂するブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理ステップと、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の輪郭を包摂する図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出ステップと、
着目動体以外の動体を包摂するブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から、着目動体の輪郭を包摂する先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形を後続ブロッブ包摂図形として選択する後続ブロッブ包摂図形選択ステップと、
マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形が認識されていない新参ブロッブ包摂図形を、新たな動体の輪郭を包摂する新参ブロッブ包摂図形として認識する新参ブロッブ包摂図形認識ステップと、
を行うようにしたものである。
【0035】
(25) 本発明の第25の態様は、上述した第24の態様に係る動体追跡方法において、
後続ブロッブ包摂図形選択ステップで、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
新参ブロッブ包摂図形認識ステップで、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形として認識されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とするようにしたものである。
【発明の効果】
【0036】
本発明に係る動体追跡装置では、複数の動体のうち、ある1つの着目動体を時間軸上で継承する動体を検出する際に、当該着目動体以外の動体が存在していた領域をマスキングする方法を採るようにしたため、複数の動体が交差した場合にも、効率的かつ正確に個々の動体を追跡することが可能になる。
【図面の簡単な説明】
【0037】
【図1】動画画像についての動体の検出例を示す平面図である。
【図2】一般的な動体検出の基本原理を示す図である。
【図3】背景を示す画像として用いられる平均画像の作成方法の一例を示す図である。
【図4】図3に示す方法に基づいて作成される平均画像上の1画素の画素値変遷プロセスを示す図である。
【図5】一般的な動体識別画像M(i)の画素値決定プロセスを示す図である。
【図6】図1に示す動体識別画像M30およびM40に基づいて、ブロッブ包摂図形B30,B40を抽出した例を示す平面図である。
【図7】図6に示すブロッブ包摂図形B30,B40を利用して、部分画像f30,f40を切出した状態を示す平面図である。
【図8】複数の動体が存在する原画像P10を示す平面図である(背景は省略)。
【図9】図8に示す原画像P10から作成された動体識別画像M10を示す平面図である。
【図10】時間軸上の時刻t10,t20,t40における原画像P10,P20,P40を示す平面図である。
【図11】図10に示す原画像P10,P20,P40から作成された動体識別画像M10,M20,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図12】図11に示す動体識別画像M10,M20,M40に基づいて作成されたトラッカーの一例を示す図である。
【図13】ブロッブ包摂図形Bの実体データを示す平面図である。
【図14】時系列上の時刻t20,t30,t40における原画像P20,P30,P40を示す平面図である。
【図15】図14に示す原画像P20,P30,P40から作成された動体識別画像M20,M30,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図16】図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの一例を示す図である。
【図17】図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの別な一例を示す図である。
【図18】時系列上の時刻t29,t30における原画像P29,P30を示す平面図である。
【図19】図18に示す原画像P29,P30から作成された動体識別画像M29,M30およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図20】図19(a) に示すブロッブ包摂図形B29a以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,1)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30aを示す平面図(図(b) )である。
【図21】図19(a) に示すブロッブ包摂図形B29b以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,2)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30bを示す平面図(図(b) )である。
【図22】図19(a) に示すブロッブ包摂図形B29c以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,3)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30cを示す平面図(図(b) )である。
【図23】図19(a) に示すブロッブ包摂図形B29d以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,4)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30dを示す平面図(図(b) )である。
【図24】図20〜図23に示す候補ブロッブ包摂図形に基づいて、各トラッカーに後続ブロッブ包摂図形の登録を行った状態を示す図である。
【図25】各トラッカーT1〜T4について認識された後続ブロッブ包摂図形を動体識別画像M30に重ねた状態を示す平面図である。
【図26】図20に示すマスキング処理では完全なマスキングがなされなかった状態を示す平面図(図(a) )およびこの状態から抽出された候補ブロッブ包摂図形を示す平面図(図(b) )である。
【図27】時系列上の時刻t39,t40における原画像P39,P40を示す平面図である。
【図28】図27に示す原画像P39,P40から作成された動体識別画像M39,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図29】図28に示すブロッブ包摂図形に基づいて作成されたトラッカーを示す図である。
【図30】図24の表の時刻t30の欄に登録された後続ブロッブ包摂図形と、図19(b) に示す動体識別画像M30上のブロッブ包摂図形と、の対応関係を示すテーブルである。
【図31】本発明の基本的な実施形態に係る動体追跡装置の構成を示すブロック図である。
【図32】図31に示す動体追跡装置におけるブロッブ包摂図形抽出部170によるブロッブ包摂図形抽出処理の手順の一例を示す流れ図である。
【図33】図32に示すブロッブ包摂図形抽出処理の処理対象となる画像の一例を示す平面図である。
【図34】図33に示す画像に対して、図32に示すブロッブ包摂図形抽出処理の手順を施したプロセスの各段階を示す平面図である。
【図35】図31に示す動体追跡装置におけるトラッカー登録部160による後続ブロッブ包摂図形の適合性評価の方法を示す平面図である。
【図36】図31に示す動体追跡装置におけるマスキング処理部140によって、マスクとして機能するブロッブ包摂図形に対する予測位置を求める方法の一例を示す平面図である。
【図37】図31に示す動体追跡装置におけるマスキング処理部140によって、マスクとして機能するブロッブ包摂図形に対する予測位置を求める方法の別な一例を示す平面図である。
【図38】図31に示す動体追跡装置におけるマスキング処理部140によるブロッブ包摂図形に対する拡張修正の一例を示す平面図である。
【図39】図31に示す動体追跡装置におけるトラッカー登録部160によるブロッブ包摂図形に対する大きさ修正の一例を示す平面図である。
【図40】本発明の基本概念に基づく動体追跡方法の手順を示す流れ図である。
【図41】本発明に係る動体追跡装置を利用して構成された監視システムの一例を示すブロック図である。
【発明を実施するための形態】
【0038】
以下、本発明を図示する実施形態に基づいて説明する。
【0039】
<<< §1.一般的な動体検出の基本原理 >>>
はじめに、一般的な動体検出の基本原理を説明する。この基本原理は、動画画像について動体(移動物体)を検出するためのものであり、ここでは、三原色の各画素値を有する画素の集合体として、時系列で連続的にフレーム単位のカラー原画像が与えられた場合を例にとって説明する。
【0040】
いま、図1の左側に示すように、フレーム単位の原画像P10,P20,P30,P40がこの順番で与えられたものとしよう。図示の例は、街頭に設置された定点ビデオカメラによる撮影画像を示すものであり、右から左へと1台の車両(動体)が通過する状態が示されている。なお、一般的なビデオカメラの場合、1秒間に30フレーム程度の周期で連続して撮影画像が出力されるので、実際には、より細かな時間間隔で多数のフレーム画像が得られることになるが、ここでは、説明の便宜上、図示のとおり、4枚の原画像P10,P20,P30,P40が順番に与えられた場合を考える。
【0041】
これら4枚の原画像を見ると、原画像P10は街の背景のみであるが、原画像P20では、右側に車両の一部が侵入したため、背景上に車両の一部が重なった画像になっている。同様に、原画像P30,P40も、背景上に車両が重なった画像になっている。背景は静止しているため、原画像P10〜P40について共通になるが、車両は動体であるため、原画像P10〜P40では異なる。ここでは、各画像上において、背景を構成する領域を背景領域K、車両(動体)を構成する領域を前景領域Fと呼ぶことにする。
【0042】
ここで行う動体検出の目的は、与えられた各原画像P10〜P40について、それぞれ背景領域Kと前景領域Fとを区別することにある。図1の右側に示す各画像M10〜M40は、それぞれ左側に示す各原画像P10〜P40について、背景領域Kと前景領域Fとの区別を示す画像であり、ここでは、動体識別画像M10〜M40と呼ぶことにする。この動体識別画像M10〜M40では、図にハッチングを施した領域が前景領域F(F20,F30,F40)であり、白地の領域が背景領域K(K10〜K40)である。これらの動体識別画像M10〜M40は、2つの領域を識別できればよいので、二値画像として与えられる。たとえば、前景領域Fに所属する画素には画素値「1」を与え、背景領域Kに所属する画素には画素値「0」を与えることにすれば、動体識別画像M10〜M40は、1ビットの画素値をもった画素の集合体からなる画像データとして用意することができる。
【0043】
後述する手法を採れば、与えられた個々のフレーム単位の原画像Pのそれぞれについて、対応する動体識別画像Mを二値画像として得ることができる。結局、ここで述べる動体検出処理の本質は、時系列で連続的に与えられた個々の原画像Pについて、それぞれ背景領域Kと前景領域Fとの区別を示す二値画像(動体識別画像M)を作成する処理ということができる。
【0044】
図1に示す例では、各原画像P10〜P40のそれぞれについて、動体識別画像M10〜M40が作成された例が示されている。これら動体識別画像を利用すれば、原画像上のどの領域が動体であるかを認識できるので、動体の形状やサイズを把握したり、動体の部分をズームアップして、車両のナンバーを確認したり、人物を特定したりする処理を行うことが可能になる。また、画面上で動体をズームアップしたまま追跡したり、移動経路を把握したりすることも可能になる。
【0045】
もちろん、このような動体識別画像の作成を、1枚の原画像のみから行うことは困難である。たとえば、図示の原画像P20のみが静止画像として与えられた場合、人間の脳は様々な情報から車両の存在を認識することができるが、この1枚の静止画像のみから、コンピュータに車両の存在を認識させるには、複雑なアルゴリズムに基づく処理が必要となる。そこで、一般的な動体検出アルゴリズムでは、既に述べたとおり、原画像と背景画像との差を求めることにより、当該差の領域を動体の領域(前景領域F)と判断する手法が採られる。
【0046】
たとえば、予め原画像P10を背景画像として指定しておけば、原画像P20が入力された時点で両者を比較することにより、差の領域(異なる領域)を前景領域Fと認識し、図示のような動体識別画像M20(背景領域K20と前景領域F20とを区別する画像)を作成することが可能になる。差の領域を認識するには、原画像と背景画像とを画素単位で比較して、両画素の画素値が類似している場合、当該画素は背景領域Kを構成する画素であるとし、類似していない場合、当該画素は前景領域Fを構成する画素であるとする方法が最も簡便な方法である。
【0047】
背景画像としては、予め動体が存在しない状態(たとえば、原画像P10に示す状態)で撮影した静止画像を利用することも可能であるが、屋外の場合、天候や時刻などの要因により、照明環境は時々刻々と変化してゆくものであり、ある特定の時点で撮影した静止画像をそのまま背景画像として継続して利用するのは不適切である。そこで、通常は、過去に入力された複数の原画像に基づいて、これら原画像の平均的な特徴を有する平均画像を作成し、この平均画像を背景画像として利用する手法が採られる。平均画像は新たな画像が入力されるたびに逐次更新されるので、天候や時刻などの要因により、照明環境が変化したとしても、当該変化に追随した適切な背景画像として機能する。
【0048】
図2は、一般的な動体検出の基本原理を示す図である。ここで、図の上段に示す原画像P(1),P(2),... ,P(i−2),P(i−1)は、時系列で連続的に与えられるフレーム単位の原画像であり、これまでに第1番目の原画像P(1)から第(i−1)番目の原画像P(i−1)まで、(i−1)フレーム分の画像が与えられた状態が示されている。一方、図の中段左に示す画像P(i)は、新たに与えられた第i番目の原画像であり、図の中段右に示す画像A(i−1)は、図の上段に示す過去に与えられた(i−1)フレーム分の原画像P(1)〜P(i−1)の平均的な特徴を有する平均画像である。
【0049】
新たに入力された原画像P(i)についての動体識別画像M(i)は、当該原画像P(i)と平均画像A(i−1)とを比較することによって作成される。図2の下段は、このようにして作成された動体識別画像M(i)を示すものである。具体的には、原画像P(i)上の各画素の画素値を、平均画像A(i−1)上の対応する画素の画素値と比較し、類似範囲内と判定された画素については背景領域K(i)を示す画素値(たとえば、「0」)を与え、類似範囲外と判定された画素については前景領域F(i)を示す画素値(たとえば、「1」)を与えることにより、二値画像からなる動体識別画像M(i)を作成すればよい。
【0050】
続いて、第(i+1)番目の原画像P(i+1)が入力されたときには、過去に入力された第i番目の原画像P(i)までの平均的な特徴を有する平均画像A(i)が新たに作成され、原画像P(i+1)と平均画像A(i)とを比較することにより、動体識別画像M(i+1)が作成される。このように、平均画像は逐次更新されてゆくため、天候や時刻などの要因により、照明環境が変化した場合でも、各時点に適した背景画像としての機能を果たすことができる。
【0051】
なお、平均画像を作成する際には、時系列に沿った重みづけを行うようにし、最新の原画像の情報に重みをおいた加重平均を求めるようにするのが好ましい。たとえば、過去10分間に入力された原画像について重み1、それ以前に入力された原画像について重み0を与えて平均を求めれば、常に、最新10分間に得られた原画像についての平均画像を得ることができ、照明環境が変化した場合にも対応することができる。もちろん、常に最新の原画像ほど重みづけが大きくなるように、重みづけをきめ細かく設定することもできる。
【0052】
結局、この図2に示す例の場合、平均画像A(i−1)を得るには、第1番目の原画像P(1)から第(i−1)番目の原画像P(i−1)について(i=1,2,...)、それぞれ対応する位置の画素の各色別の画素値の重みづけ平均値を算出し、当該平均値をもつ画素の集合体からなる画像を作成すればよい。そして、第i番目の原画像P(i)が入力されたときには、第i番目の動体識別画像M(i)を作成するために、原画像P(i)と平均画像A(i−1)とを比較すればよい。
【0053】
ただ、1秒間に30フレームという一般的なフレームレートで動画画像が入力された場合、過去10分間の原画像であっても、その画像データをすべて蓄積しておくには、画像データのバッファにかなりの記憶容量が必要になる。そこで、実用上は、第i番目の原画像P(i)が与えられたときに、第(i−1)番目の平均画像A(i−1)と、当該第i番目の原画像P(i)との2枚の画像に基づいて、第i番目の平均画像A(i)を作成する手法が採られる。図3は、このような手法に基づく平均画像の作成方法の一例を示す図である。
【0054】
まず、最初の原画像P(1)が与えられたときには、当該原画像P(1)をそのまま最初の平均画像A(1)とする処理を行う。そして、以後、図3の上段右に示す第i番目の原画像P(i)が入力されるたびに(i=2,3,...)、図3の上段左に示す第(i−1)番目の平均画像A(i−1)を利用して、図3の中段に示す第i番目の平均画像A(i)を、図3の下段に示す
a(i)=(1−w)・a(i−1)+w・p(i) 式(1)
なる演算式を用いて作成すればよい。ここで、a(i)は、平均画像A(i)の所定位置の画素の所定色の画素値、a(i−1)は、平均画像A(i−1)の前記所定位置の画素の前記所定色の画素値、p(i)は、原画像P(i)の前記所定位置の画素の前記所定色の画素値、wは、所定の重みを示すパラメータ(w<1)である。
【0055】
要するに、直前に与えられた原画像P(i−1)までの原画像について算出された第(i−1)番目の平均画像A(i−1)の画素値a(i−1)と、新たに与えられた第i番目の原画像P(i)の画素値p(i)とについて、重みwを考慮した平均値が算出され、当該算出値を第i番目の平均画像A(i)の画素値a(i)とする処理が行われることになる。このように、新たな原画像P(i)が入力されるたびに、平均画像A(i)を更新してゆき、しかも更新には直前の平均画像A(i−1)のみを用いるようにすれば、過去の原画像データを何フレーム分にもわたって蓄積保持しておく必要がないので、処理を行うために必要なバッファの容量を大幅に節約することができる。
【0056】
図3に示すとおり、重みwの値を大きくすればするほど、最新の原画像P(i)の画素値が平均画像A(i)の画素値に大きな影響を与えることになる。図4は、図3に示す方法に基づいて作成される平均画像上の1画素の画素値変遷プロセスを示す図である。この例では、重みw=0.01に設定した具体例が示されている。
【0057】
たとえば、第1番目(i=1)の原画像P(1)の特定位置の画素の画素値がp(1)=100であったとすると、第1番目の平均画像A(1)の当該特定位置の画素の画素値a(1)は、そのままa(1)=100となる。続いて、第2番目の原画像P(2)の当該特定位置の画素の画素値がp(2)=100であったとすると、第2番目の平均画像A(2)の当該特定位置の画素の画素値a(2)は、a(1)とp(2)との重みつき平均「0.99×100+0.01×100」を計算することにより、a(2)=100になる。
【0058】
図示の例では、原画像の当該特定位置の画素値は、p(1)〜p(4)まで100のまま変化しないため、平均画像の当該特定位置の画素値も、a(1)〜a(4)まで100を維持する。ところが、第5番目の原画像P(5)では、画素値p(5)=200に急変したため、第5番目の平均画像A(5)の画素値a(5)は、図4の下段の式に示すとおり、a(4)とp(5)との重みつき平均「0.99×100+0.01×200」を計算することにより、a(5)=101になる。更に、第6番目の原画像P(6)および第7番目の原画像P(7)では、画素値p(6)=p(7)=200が維持されているため、図4の下段の式に示すとおり、第6番目の平均画像A(6)および第7番目の平均画像A(7)では、画素値a(6)=102、画素値a(7)=103、と徐々に増加している。
【0059】
この例のように、重みwを0.01程度の値に設定すると、原画像の画素値が急激に変化しても、平均画像の画素値は直ちに変化することはなく、原画像の画素値にゆっくりと近づいてゆくことになる。したがって、図1に示す例のように、車両が通過する動画が与えられたとしても、一過性の画素値変化は、平均画像の画素値に大きな変化をもたらすことはなく、平均画像は背景画像としての機能を果たすことができる。一方、時刻が日中から夕暮れに変わった場合など、照明環境に変化が生じた場合、当該変化は多数のフレーム画像にわたって持続するため、平均画像の画素値も当該変化に追従して変化することになる。したがって、日中には日中の背景画像に適した平均画像が得られ、夕暮れには夕暮れの背景画像に適した平均画像が得られることになる。
【0060】
動体の領域を示す動体識別画像Mは、このような方法で作成された平均画像を背景画像として、個々の原画像を比較することによって作成することができる。図5は、このようにして作成される動体識別画像Mの画素値決定プロセスを示す図である。第i番目の原画像P(i)についての動体識別画像M(i)は、次のような方法で決定される画素値をもつ画素の集合体からなる二値画像である。すなわち、動体識別画像M(i)の特定位置の画素の画素値m(i)は、原画像P(i)の当該特定位置の画素の画素値p(i)と、平均画像A(i−1)の当該特定位置の画素の画素値a(i−1)との比較によって決定され、両画素値が類似範囲内であれば、背景領域K内の画素であることを示す画素値(たとえば、「0」)が与えられ、両画素値が類似範囲外であれば、前景領域F内の画素であることを示す画素値(たとえば、「1」)が与えられる。
【0061】
なお、原画像が三原色の各画素値(たとえば、RGB表色系の場合、R,G,Bの3色の画素値)をもったカラー画像である場合は、原画像P(i)を構成する各画素の画素値p(i)や、平均画像A(i)を構成する各画素の画素値a(i)は、いずれも色ごとに独立した3つの値から構成されていることになる。そして、式(1)の演算は、個々の色ごとにそれぞれ独立して実行されることになる。たとえば、平均画像A(i)上の特定位置の画素の画素値a(i)は、R色の画素値、G色の画素値、B色の画素値という3組の画素値によって構成され、R色の画素値は、過去の原画像のR色の画素値の重みつき平均として得られた値になる。
【0062】
したがって、図5における画素値p(i)と画素値a(i−1)との比較は、単なる2つの値の比較ではなく、3組の画素値と3組の画素値との比較ということになる。当然ながら、画素の類否判定は、この3組の画素値の組み合わせからなる色同士が類似するか否かを判定する処理ということになる。このような2つの色の類否判定は、たとえば、色空間上でのユークリッド距離の大小に基づいて行うことができる。すなわち、画素値R,G,Bをそれぞれ座標軸にとった色空間上に、比較対象となる2つの色を点としてプロットし、2つの点のユークリッド距離が所定の基準値以下である場合には類似、基準値を越える場合には非類似とすればよい。
【0063】
<<< §2.ブロッブ包摂図形を用いた動体追跡の手法 >>>
さて、§1では、一般的な動体検出の基本原理を述べた。ここでは、こうして検出された動体を追跡する手法を説明する。動体の追跡とは、個々のフレーム単位で検出された動体を時系列的に追ってゆくことである。たとえば、図1に示す例の場合、動体識別画像M20,M30,M40を個々に見ると、それぞれ前景領域F20,F30,F40を動体として認識することができるが、動体追跡とは、これら前景領域F20,F30,F40を、同一の動体の時系列情報として把握することである。一般に、動体に対応する個々の前景領域F20,F30,F40を構成するひとまとまりの画素集団は、ブロッブ(blob)と呼ばれており、動体追跡とは、同一の動体を示すブロッブを時系列に並べて把握することである。
【0064】
ある1フレームの原画像に含まれるブロッブは、その輪郭線によって規定することができる。たとえば、図1の動体識別画像M30に含まれている前景領域F30は、原画像P30内の動体(車両)の領域を示すブロッブであり、このブロッブの輪郭線の情報さえあれば、原画像P30から動体(車両)の部分のみを切出すことが可能である。したがって、動体追跡の結果は、ブロッブの輪郭線の情報を時系列で並べることによって示すことができる。
【0065】
ただ、実際には、ブロッブの輪郭線は非常に複雑な図形であり、このような輪郭線の情報を個々のフレーム単位で保存するには、かなり大きな記憶容量が必要になる。また、一般的な用途では、そのような複雑な輪郭線の情報が必要になることは少ない。そこで、実用上は、このブロッブの外接図形によって、動体の位置、形状、大きさを代表させる手法が採られる。本願では、このような外接図形を「ブロッブ包摂図形」と呼ぶことにする。外接図形としては、どのような図形を採用してもよいが、通常、四角形が利用される。したがって、以下に述べる基本的な実施形態においても、ブロッブの外接矩形を「ブロッブ包摂図形」と定義し、このブロッブ包摂図形によって、動体の位置、形状、大きさを代表させるものとする。
【0066】
図6(a) および(b) は、図1に示す動体識別画像M30およびM40に基づいて、それぞれブロッブ包摂図形B30およびB40(太線で示す矩形)を抽出した例を示す平面図である。図6(a) に示すブロッブ包摂図形B30は、動体識別画像M30に含まれる前景領域F30(ブロッブ)の外接矩形であり、図6(b) に示すブロッブ包摂図形B40は、動体識別画像M40に含まれる前景領域F40(ブロッブ)の外接矩形である。このような外接矩形からなるブロッブ包摂図形B30,B40は、単純な幾何学図形であるため、極めて小さな情報量で表現することができ、しかも、動体の位置、形状、大きさを大まかに示すことができる。もちろん、ブロッブの輪郭線の情報に比べれば、ブロッブ包摂図形の情報は精度が低く、特に形状に関しては、大まかな縦横比しか示すことはできない。しかしながら、実用上は、このような大まかな情報をもったブロッブ包摂図形により動体追跡が行われれば十分である。
【0067】
たとえば、図6(a) から(b) へのブロッブ包摂図形の変遷を見ると、横長の矩形のブロッブ包摂図形が画面の下方を右から左へと移動していることが認識できる。これを図1の原画像P30からP40への変遷と照らし合わせれば、車両を動体として追跡することが可能である。図7(a) ,(b) は、図6(a) ,(b) に示すブロッブ包摂図形B30,B40を利用して、原画像P30,P40から、それぞれ部分画像f30,f40を切出した状態を示す平面図である。図の下段に示す図は、切出した部分画像f30,f40をディスプレイの画面一杯に拡大表示した状態を示している。
【0068】
ディスプレイ画面の縦横比(アスペクト比)は、通常、固定されているのに対して、ブロッブ包摂図形を構成する矩形の縦横比は動体の形状に応じて任意になるので、ブロッブ包摂図形B30,B40を構成する矩形と部分画像f30,f40の外枠とは正確には一致しないが、ブロッブ包摂図形B30,B40をほぼ画面一杯に表示するような切出しを行うことにより、常に動体(車両)をズームアップした状態で追跡するような動画提示を行うことができるようになる。したがって、監視システムなどで、検出した動体をズームアップした状態で追跡して表示させるような用途の場合、動体の外接矩形からなるブロッブ包摂図形を時系列に並べた情報が得られれば、当該情報は、動体追跡の結果を示す情報として十分に利用価値がある。
【0069】
ここで述べる基本的な実施形態に係る動体追跡装置の目的は、このようなブロッブ包摂図形を時間軸上に並べた情報(後述するように、当該情報をトラッカーと呼ぶ)を得ることにある。ただ、図1に示す例は、単一の動体(車両)が画面を横切る単純な動画画像の例であるが、実際には、同じ画面上に複数の動体が同時に存在することも少なくない。このように1フレームの原画像上に複数の動体が存在する場合、ブロッブ包摂図形も複数抽出されることになるので、同一の動体に基づいて抽出されたブロッブ包摂図形を一連の連続ブロッブ包摂図形として時間軸上に並べる必要がある。
【0070】
図8は、複数の動体が存在する原画像P10を示す平面図である。この例は、あまり現実的な景色ではないが、説明の便宜上、動体O1(馬)、動体O2(人)、動体O3(車)、動体O4(鳥)という4種類の動体が同時に存在する例になっている。ここで、馬O1と人O2は画面の左から右へ移動しており、車O3と鳥O4は画面の右から左へ移動しているものとする。なお、実際には、これら4種類の動体O1〜O4の奥には、背景画像(街の景色)が写っているが、図が繁雑になるため、以下に示す各原画像では、背景画像の描画は省略する。
【0071】
図9は、図8に示す原画像P10から作成された動体識別画像M10を示す平面図である。この動体識別画像M10は、§1で述べたとおり、原画像P10と背景画像との差分画像として作成される二値画像であり、背景領域K10と前景領域F10a,F10b,F10c,F10dによって構成される。
【0072】
ここでは、時間軸上に時刻t1,t2,t3,...,を定義し、これらの各時刻に得られた原画像をそれぞれ原画像P1,P2,P3,...,と呼ぶことにしよう。図8に示す原画像P10は、時刻t10において得られた原画像ということになる。図10は、時間軸上の時刻t10,t20,t40における原画像P10,P20,P40を示す平面図である。すなわち、図10(a) に示す原画像P10は、時刻t10において得られた原画像であり、上述したとおり、馬O1と人O2が右へ移動し、車O3と鳥O4が左へ移動している。また、図10(b) に示す原画像P20は、時刻t20において得られた原画像であり、各動体が進行方向に向かって更に移動を続けた状態になっている。そして、図10(c) に示す原画像P40は、時刻t40において得られた原画像であり、馬O1,人O2,車O3はそれぞれ進行方向に向かって移動を続け、鳥O4は既に画面左方向へ飛び去り、新たな動体として犬O5が出現した状態になっている。
【0073】
図11(a) 〜(c) は、図10(a) 〜(c) に示す原画像P10,P20,P40から作成された動体識別画像M10,M20,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。ここで、K10,K20,K40は、各動体識別画像M10,M20,M40内の背景領域である。また、文字Fが先頭に付された符号で示すハッチング領域は前景領域であり、文字Fに後続する2桁の数字は時刻を示し、末尾の小文字のアルファベットは動体を区別するための記号である。一方、文字Bが先頭に付された符号で示す太線の矩形は、文字Bを文字Fに置き換えた前景領域(ブロッブ)の外接矩形として抽出されたブロッブ包摂図形である。
【0074】
たとえば、図11(a) の動体識別画像M10の左下に示されているハッチング領域F10aは、図10(a) に示す原画像P10上の動体O1(馬)に対応する前景領域(ブロッブ)であり、太線の矩形で示されたブロッブ包摂図形B10aは、この前景領域F10aの外接矩形として抽出されたブロッブ包摂図形である。結局、図11(a) に示す動体識別画像M10上では、合計4つのブロッブ包摂図形B10a〜B10dが抽出され、図11(b) に示す動体識別画像M20上では、合計4つのブロッブ包摂図形B20a〜B20dが抽出され、図11(c) に示す動体識別画像M40上では、合計4つのブロッブ包摂図形B40a〜B40c,B40eが抽出されることになる。
【0075】
このように、同一画面上に複数の動体が存在し、複数のブロッブ包摂図形が抽出される場合、同一の動体に基づいて抽出されたブロッブ包摂図形を一連の連続するブロッブ包摂図形として時系列で並べることが重要である。このような一連の連続するブロッブ包摂図形の並びは、一般に、トラッカー(Tracker)と呼ばれている。図12は、図11に示す動体識別画像M10,M20,M40に基づいて作成されたトラッカーの一例を示す図である。この図は、横方向に時間軸をとり、縦方向に6個のトラッカーを並べた表によって構成されている。表の1行目には対応する時刻t1〜t40が示されており、表の2行目には各時刻に得られた原画像P1〜P40が示されている。一方、左端の列に記載されたT1〜T6は、個々のトラッカーの名称であり、各トラッカーの実体は、表の横方向に記載されたブロッブ包摂図形の並びの情報である。
【0076】
たとえば、第1番目のトラッカーT1の実体は、...,B10a,...,B20a,...,B40aといったブロッブ包摂図形の並びを示す情報である。ここで、ブロッブ包摂図形B10aは、図11(a) に示すように、時刻t10における馬の輪郭に対する外接矩形であり、ブロッブ包摂図形B20aは、図11(b) に示すように、時刻t20における馬の輪郭に対する外接矩形であり、ブロッブ包摂図形B40aは、図11(c) に示すように、時刻t40における馬の輪郭に対する外接矩形である。結局、トラッカーT1は、馬を示すブロッブ包摂図形を時系列的に並べたものになる。同様に、トラッカーT2は人、T3は車,T4は鳥、T5は犬を示すブロッブ包摂図形を、それぞれ時系列的に並べたものになる。
【0077】
なお、図12に示す表では、図示の便宜上、時刻t10,t20,t40以外の時刻についてのブロッブ包摂図形は掲載が省略されているが、もちろん、各フレームの原画像について、それぞれブロッブ包摂図形が抽出され、所定のトラッカー上に並べられることになる。たとえば、1秒間に30フレームの撮影画像からなる動画の場合、1/30秒ごとの各時刻に得られた各原画像のそれぞれについて、ブロッブ包摂図形が抽出され、トラッカー上に並べられる。
【0078】
この図12に例示するようなトラッカーの情報は、動体追跡の結果を示す情報に他ならない。たとえば、トラッカーT1は、馬を追跡した結果であり、表の左側から右側へと、各ブロッブ包摂図形...,B10a,...,B20a,...,B40aを追ってゆけば、動画上で馬を追跡することができる。具体的には、原画像P10,...,P20,...,P40,...から、各ブロッブ包摂図形B10a,...,B20a,...,B40a...を構成する矩形内部を切出して拡大表示すれば、馬をズームアップした状態で追跡することができる。
【0079】
ここに示す実施形態の場合、1つのブロッブ包摂図形は動体の輪郭線の外接矩形を示すものであり、ブロッブ包摂図形を示すデータの実体は、当該外接矩形の対角に位置する2頂点の座標値によって構成される。図13は、ブロッブ包摂図形Bの実体データを示す平面図である。図示の例は動体O3(車)に対応する前景領域F(ブロッブ)の外接矩形としてブロッブ包摂図形Bが抽出された例であり、このブロッブ包摂図形Bは、原画像P上に定義されたXY座標系を用いて、左上の頂点Q1(x1,y1)の座標値(x1,y1)と、右下の頂点Q2(x2,y2)の座標値(x2,y2)とによって定義することができる(もちろん、左下の頂点と右上の頂点とによって定義してもよい)。したがって、図12に示すトラッカーの各欄には、実際には、「x1,y1,x2,y2」のような座標値を示すデータが収容されていることになる。
【0080】
図10に例示する動画の場合、馬O1,人O2,車O3は原画像P10からP40を経ても画面上に留まっているが、鳥O4は原画像P40に至る前に画面外へ去っており、犬は原画像P40において出現している。そのため、図12に示す動体追跡の結果では、トラッカーT1(馬),トラッカーT2(人),トラッカーT3(車)上には、時刻t10からt40を経てもなお、連続したブロッブ包摂図形の並びが存在しているが、トラッカーT4(鳥)上では、時刻t40の直前で連続したブロッブ包摂図形の並びが消滅しており、トラッカーT5(犬)上では、時刻t40から連続したブロッブ包摂図形の並びが始まっている。図の各トラッカー欄に示す太線の細長い楕円は、このような時系列に沿った一連の連続したブロッブ包摂図形の並びを示している。また、×印の欄は、当該時刻にはブロッブ包摂図形が登録されていないことを示している。別言すれば、×印の欄の存在により、一連の連続したブロッブ包摂図形の並び(すなわち、ある1つの動体についての追跡)が終焉することになる。
【0081】
図11に示す各ブロッブ包摂図形を、図12に示すトラッカー上に登録する際には、同一の動体に基づいて抽出されたと推定されるブロッブ包摂図形が同一のトラッカー上に登録されるようにする必要がある。たとえば、図11(a) に示すブロッブ包摂図形B10a(馬)が、図12に示すようにトラッカーT1の時刻t10欄に登録された場合、図11(b) に示すブロッブ包摂図形B20a(馬)も、図12に示すように同じトラッカーT1の時刻t20欄に登録されるようにし、図11(c) に示すブロッブ包摂図形B40a(馬)も、図12に示すように同じトラッカーT1の時刻t40欄に登録されるようにしなければならない。
【0082】
ここで、人間が目視すれば、ブロッブ包摂図形B10a,B20a,B40a内の各原画像には、馬という同一の動体が含まれていることが認識できるが、コンピュータにそのような認識をさせるためには、複雑なアルゴリズムによる動体の特徴解析を行う必要がある。そこで、通常は、ブロッブ包摂図形の位置、面積、形状といった情報を手掛かりに、同一の動体が含まれているブロッブ包摂図形を推定する手法を採り、同一の動体に基づいて抽出されたと推定されるブロッブ包摂図形を同一のトラッカー上に登録する処理を行う。
【0083】
たとえば、原画像P10に基づいて、図12に示すように、トラッカーT1,T2,T3,T4にそれぞれブロッブ包摂図形B10a,B10b,B10c,B10dが登録された状態において、これらのブロッブ包摂図形に後続して、原画像P20に基づいて、ブロッブ包摂図形B20a,B20b,B20c,B20dをいずれかのトラッカーに登録する処理を例にとって考えてみる(実際には、その間に、原画像P11〜P19に基づくブロッブ包摂図形が登録される)。この場合、図11(a) に示すブロッブ包摂図形B10aに後続してトラッカーT1に登録するのに最も適したブロッブ包摂図形として、図11(b) に示す4つの候補ブロッブ包摂図形の中から、位置、面積、形状が最も類似しているブロッブ包摂図形B20aが選択されることになる。かくして、図12に示すように、トラッカーT1の時刻t20欄には、ブロッブ包摂図形B20aが登録される。
【0084】
要するに、ブロッブ包摂図形の実体が単純な矩形図形であったとしても、位置、面積、形状が類似するブロッブ包摂図形を時系列的に追跡してゆき、これを同一トラッカー上に登録してゆくという簡便な手法を採ることにより、図12に示すように、正しい動体追跡の結果が得られるのである。このような手法では、馬,人,車,鳥といった個別の動体の特徴を解析する複雑な処理を行う必要はない。
【0085】
<<< §3.複数の動体が交差した場合の問題点 >>>
上述したとおり、ブロッブ包摂図形(ここに示す実施形態では外接矩形)を時系列的に追跡してゆく手法を採れば、個別の動体の特徴を解析する複雑な処理を行うことなしに動体追跡が可能になる。実際、2つの矩形の位置、面積、形状の類似度を定量的に評価する処理は比較的単純な算術演算処理によって行うことができるので、ブロッブ包摂図形を時系列的に追跡してゆく処理の演算負担は小さい。これがブロッブ包摂図形を用いた動体追跡の手法の利点である。
【0086】
しかしながら、同一画面内に存在する複数の動体は、それぞれが任意の方向に移動しているため、移動経路が画面上で交差する場合がある。図10(a) ,(b) ,(c) に示す3つの原画像P10,P20,P40は、説明の便宜上、複数の動体が交差した状態を避けたものであり、いずれの動体も画面上で重なり合っていないが、実際には、これらの中間時点において、複数の動体が画面上で重なり合う状態が生じる。
【0087】
図14(a) ,(b) ,(c) は、時系列上の時刻t20,t30,t40における原画像P20,P30,P40を示す平面図である。ここで、原画像P20およびP40は、図10に示す原画像P20およびP40と全く同じものであるが、原画像P30は、その中間時点の状態を示すものである。この原画像P30では、馬O1,人O2,車O3が部分的に重なり合っており、鳥O4だけが重なりを免れている。
【0088】
§2で述べた手法では、このように複数の動体の移動経路の交差により、動体同士に重なり合いが生じると、正確な追跡を行うことができない。これは、図14(b) に原画像P30として示すように、交差時点で複数の物体が、ひとかたまりの物体に融合し、その後、元通りの複数の物体に分離することになるためである。もちろん、人間が原画像P30を観察すれば、依然として、馬O1,人O2,車O3という動体を個別の動体として把握することが可能であるが、§2で述べたブロッブ包摂図形を用いた動体追跡の手法を採ると、馬O1,人O2,車O3が融合した状態でブロッブ包摂図形を構成することになるため、個々の動体を個別に認識することができなくなるのである。
【0089】
図15(a) ,(b) ,(c) は、図14(a) ,(b) ,(c) に示す原画像P20,P30,P40から作成された動体識別画像M20,M30,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。ここで、動体識別画像M20およびM40は、図11に示す動体識別画像M20およびM40と全く同じものである。これに対して、動体識別画像M30は、その中間時点の状態を示すものであり、図14(b) に示す原画像P30に基づいて作成されたものである。図示のとおり、動体識別画像M30からは、2つのブロッブ包摂図形B30d,B30gが抽出されるだけである。ここで、ブロッブ包摂図形B30dは、鳥O4の輪郭を包摂するものであるが、ブロッブ包摂図形B30gは、馬O1,人O2,車O3の融合体の輪郭を包摂するものになっている。
【0090】
§2で述べた動体追跡の手法では、ブロッブ包摂図形B30gが、馬O1,人O2,車O3の融合体の輪郭を包摂するものと認識することはできないので、トラッカーに登録するプロセスにおいて、誤認識が生じることになり、正しい動体追跡を行うことができなくなる。どのような誤認識が生じるかは、ブロッブ包摂図形の位置、面積、形状といった情報を手掛かりに、同一の動体が含まれているブロッブ包摂図形を推定するために採用した具体的な方法によって様々である。
【0091】
図16は、図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの一例を示す図である。この例は、ブロッブ包摂図形B30g(人車馬)を車と誤認識した例である。すなわち、図15(b) に示すブロッブ包摂図形B30g(人車馬)が、図15(a) に示すブロッブ包摂図形B20c(車)の後続ブロッブ包摂図形として適している(すなわち、位置、面積、形状が類似している)と判断し、ブロッブ包摂図形B30g(人車馬)をトラッカーT3の時刻t30欄に登録している。一方、図15(b) に示すブロッブ包摂図形B30d(鳥)については、図15(a) に示すブロッブ包摂図形B20d(鳥)の後続ブロッブ包摂図形として適していると判断し(この判断は正しい)、ブロッブ包摂図形B30d(鳥)をトラッカーT4の時刻t30欄に登録している。動体識別画像M30には、その他のブロッブ包摂図形はないので、トラッカーT1,T2,T5,T6の時刻t30欄に登録するブロッブ包摂図形は存在せず、これらの欄は無登録状態(×印)となっている。
【0092】
一方、時刻t40になると、馬O1,人O2,車O3の融合状態は解消する。このため、動体識別画像M40からは、4つのブロッブ包摂図形B40a,B40b,B40c,B40eが抽出される。図16に示す例の場合、こうして抽出された4つのブロッブ包摂図形のうち、ブロッブ包摂図形B40b(人)がブロッブ包摂図形B30g(人車馬)の後続ブロッブ包摂図形として適している(すなわち、位置、面積、形状が類似している)と判断され、ブロッブ包摂図形B40b(人)がトラッカーT3の時刻t40欄に登録されている。また、鳥O4は画面から去ってしまっているので、トラッカーT4の時刻t40欄は無登録状態(×印)となっている。
【0093】
残りの3つのブロッブ包摂図形B40a(馬),B40c(車),B40e(犬)は、時刻t40になって出現した新参ブロッブ包摂図形(時刻t40になって初めて出現した新参動体についてのブロッブ包摂図形)と認識され、それぞれ空き状態のトラッカーT1,T2,T5の時刻t40欄に登録されている。ここで、ブロッブ包摂図形B40e(犬)が、新参ブロッブ包摂図形であるとの認識は正しいものであるが、ブロッブ包摂図形B40a(馬),B40c(車)が、新参ブロッブ包摂図形であるとの認識は誤りである。
【0094】
この図16に示すような誤った動体追跡結果が得られると、特定の動体をズームアップした状態で追跡表示させるような処理を正しく行うことができない。たとえば、車O3をズームアップして追跡表示させるために、トラッカーT3に並べられたブロッブ包摂図形B20c(車),...,B30g(人車馬),...,B40b(人)...を構成する矩形内部を切出して拡大表示すると、拡大表示される追跡対象が車から人に途中で取り違えられてしまうことになる。また、トラッカーT1に基づいて馬O1を追跡した場合や、トラッカーT2に基づいて人O2を追跡した場合、時刻t30の直前で追跡は終了してしまう。
【0095】
図17は、図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの別な一例を示す図である。この例は、ブロッブ包摂図形B30g(人車馬)を新参動体と誤認識した例である。すなわち、図15(b) に示すブロッブ包摂図形B30g(人車馬)が、図15(a) に示すブロッブ包摂図形B20a(馬),B20b(人),B20c(車),B20d(鳥)のいずれの後続ブロッブ包摂図形としても適していない(すなわち、位置、面積、形状が類似していない)と判断し、ブロッブ包摂図形B30g(人車馬)をトラッカーT5の時刻t30欄に登録している。別言すれば、ブロッブ包摂図形B30g(人車馬)は、馬,人,車,鳥のいずれでもない新参動体と判断されたことになる。一方、図15(b) に示すブロッブ包摂図形B30d(鳥)については、図15(a) に示すブロッブ包摂図形B20d(鳥)の後続ブロッブ包摂図形として適していると判断し(この判断は正しい)、ブロッブ包摂図形B30d(鳥)をトラッカーT4の時刻t30欄に登録している。動体識別画像M30には、その他のブロッブ包摂図形はないので、トラッカーT1,T2,T3,T6の時刻t30欄に登録するブロッブ包摂図形は存在せず、これらの欄は無登録状態(×印)となっている。
【0096】
一方、時刻t40になると、馬O1,人O2,車O3の融合状態は解消する。このため、動体識別画像M40からは、4つのブロッブ包摂図形B40a,B40b,B40c,B40eが抽出される。図17に示す例の場合、こうして抽出された4つのブロッブ包摂図形は、いずれも時刻t40になって出現した新参ブロッブ包摂図形と認識され、それぞれ空き状態のトラッカーT1,T2,T3,T6の時刻t40欄に登録されている。ここで、ブロッブ包摂図形B40e(犬)が、新参ブロッブ包摂図形であるとの認識は正しいものであるが、ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)が、新参ブロッブ包摂図形であるとの認識は誤りである。
【0097】
この図17に示すような誤った動体追跡結果が得られると、やはり特定の動体をズームアップした状態で追跡表示させるような処理を正しく行うことができない。たとえば、トラッカーT1に基づいて馬O1を追跡した場合、トラッカーT2に基づいて人O2を追跡した場合、トラッカーT3に基づいて車O3を追跡した場合、いずれも時刻t30の直前で追跡は終了してしまう。
【0098】
前掲の特許文献7には、このような問題を解決するための一手法として、複数の動体を追跡する際に、動体同士が交差しているか否かの判定を行い、交差していると判定された場合には、重なり合った複数の動体の奥行き関係を認識して、正しい追跡を行う方法が開示されている。しかしながら、動体同士の交差を判定する処理や、奥行き関係を把握する処理のために、複雑なプロセスが必要になり、また、様々な状況において常に正確な処理を行うことは困難である。本発明は、複数の動体が交差した場合にも、効率的かつ正確に個々の動体を追跡することが可能な新しいアプローチを提案するものである。以下、本発明に係るこの新しいアプローチを詳述する。
【0099】
<<< §4.本発明に係る後続ブロッブ包摂図形の認識法 >>>
この§4では、§3でも説明した図14に示す事例について、本発明に係る後続ブロッブ包摂図形の認識法を適用した場合を説明する。この事例の問題点は、図14(b) に示すように、時刻t30における原画像P30上で複数の動体が交差しているため、図15(b) に示すように、動体識別画像M30から複数の動体の融合体についてのブロッブ包摂図形B30gが抽出されてしまう点である。本発明に係る後続ブロッブ包摂図形の認識法では、原画像P30のように、複数の動体が交差した場合でも、個々の動体について別個独立したブロッブ包摂図形を抽出することが可能になる。
【0100】
そこで、以下、図18に示すように、時刻t29における原画像P29から、時刻t30における原画像P30への変遷が生じた場合に、原画像P29から抽出されたブロッブ包摂図形に対する後続ブロッブ包摂図形を、原画像P30から認識する方法を説明しよう。ただ、ここでは説明の便宜上、まず、次の2つの点を前提とした仮想的な例を考えてみる。
【0101】
第1の前提は、図18(a) に示す原画像P29から、既に、4つの動体O1〜O4のそれぞれについて別個独立したブロッブ包摂図形が抽出されている、という前提である。図示のとおり、この原画像P29上でも、既に動体O1〜O3が重なりを生じているため、§3で述べた方法では、動体O1〜O3の融合体について1つの合成ブロッブ包摂図形が抽出されてしまうが、ここでは、何らかの手法により、4つの動体O1〜O4のそれぞれについて、別個独立したブロッブ包摂図形が抽出されており、4つの異なるトラッカーの時刻t29欄に、これらのブロッブ包摂図形がそれぞれ登録されているものと仮定する。
【0102】
第2の前提は、図18(a) に示す原画像P29と図18(b) に示す原画像P30とが、全く同じ画像である、という前提である。実際には、時刻t29と時刻t30との間にはわずかながら時間差があり、各動体はそれぞれの進行方向に当該時間差に相当する距離だけ移動している。したがって、原画像P29と原画像P30とは若干異なる画像ということになる。ただ、ここでは、時刻t29と時刻t30との間において各動体の移動がなく、両画像が全く同じ画像であると仮定する。
【0103】
図19(a) ,(b) は、図18(a) ,(b) に示す原画像P29,P30から作成された動体識別画像M29,M30およびこれらから抽出されたブロッブ包摂図形を示す平面図である。図19(a) に示すように、動体識別画像M29からは、B29a(馬),B29b(人),B29c(車),B29d(鳥)という4つの独立したブロッブ包摂図形が抽出されており、これらのブロッブ包摂図形は、それぞれトラッカーT1,T2,T3,T4の時刻t29欄に登録されている。人・馬・車が重なり合って融合体を形成しているにもかかわらず、それぞれ独立したブロッブ包摂図形が抽出されているのは、上述した第1の前提に基づくものである。
【0104】
これに対して、図19(b) には、動体識別画像M30から、§3で述べた方法により、ブロッブ包摂図形B30d,B30gが抽出された状態(図15(b) と同じ状態)が示されている。この状態で、トラッカーT1,T2,T3,T4の時刻t29欄に登録されている各ブロッブ包摂図形B29a(馬),B29b(人),B29c(車),B29d(鳥)の後続ブロッブ包摂図形(時刻t30欄に登録すべきブロッブ包摂図形)を認識しようとしても、既に述べたとおり、正しい認識を行うことはできない。その理由は、トラッカーT1,T2,T3の時刻t29欄に登録されている各ブロッブ包摂図形B29a(馬),B29b(人),B29c(車)に後続すべきブロッブ包摂図形が、1つのブロッブ包摂図形B30gとして融合してしまっているためである。したがって、トラッカーT4に登録されているブロッブ包摂図形B29d(鳥)に対しては、ブロッブ包摂図形B30d(鳥)という後続ブロッブ包摂図形を登録することができるが、他のブロッブ包摂図形については、後続ブロッブ包摂図形の登録に失敗することになる。
【0105】
そこで、本発明では、複数の動体のうち、ある1つの動体に着目し、この着目動体のブロッブ包摂図形についての後続ブロッブ包摂図形を認識する際に、当該着目動体以外の動体についての先行ブロッブ包摂図形の領域をマスキングした動体識別画像を用いる、という手法を採る。ここでは、まず、動体O1(馬)を着目動体として、その後続ブロッブ包摂図形を認識する処理手順を説明しよう。別言すれば、図19(a) に示すブロッブ包摂図形B29a(馬)がトラッカーT1の時刻t29欄に登録されている状態において、トラッカーT1の時刻t30欄に登録すべき後続ブロッブ包摂図形を認識する処理を行うことになる。
【0106】
そのために、まず、図19(b) に示す動体識別画像M30に対して、マスキング処理を施す。図20(a) は、このようなマスキング処理を行うことにより得られた動体識別画像を示す平面図である。ここでは、このようなマスキング後の動体識別画像を個別動体識別画像M(30,1)と呼ぶことにする。図において、二重斜線によるハッチングを施して示されている領域は、各ブロッブ包摂図形に対応する矩形領域であり、これらの矩形領域によるマスキングを行うことにより、着目動体O1(馬)以外の動体が隠蔽されることになる。すなわち、トラッカーT2の時刻t29欄に登録されていたブロッブ包摂図形B29bにより動体O2(人)が隠蔽され、トラッカーT3の時刻t29欄に登録されていたブロッブ包摂図形B29cにより動体O3(車)が隠蔽され、トラッカーT4の時刻t29欄に登録されていたブロッブ包摂図形B29dにより動体O4(鳥)が隠蔽される。結局、このマスキング処理によって得られた個別動体識別画像M(30,1)には、着目動体O1(馬)のみが残ることになる。
【0107】
なお、図20(a) では、説明の便宜上、二重斜線によるハッチングを施した矩形領域として、マスク領域(マスキング処理によって隠蔽される領域)を明示してあるが、実際には、このマスク領域は、背景領域の一部を構成することになるので、本来は、白地の領域として示すべき領域である。後述する図21以降においても、説明の便宜上、マスク領域を二重斜線によるハッチング領域として明示するが、実際には、いずれも背景領域の一部を構成する領域となるので、本来は、白地の領域として示すべき領域である。
【0108】
図20(b) は、図20(a) に示す個別動体識別画像M(30,1)から抽出されたブロッブ包摂図形B30a(太線の矩形)を示す平面図である。前述したとおり、ここで述べる基本的実施形態では、前景領域の外接矩形をブロッブ包摂図形として抽出するため、ブロッブ包摂図形B30aは、着目動体O1(馬)の輪郭線の外接矩形となっている。このブロッブ包摂図形B30aは、トラッカーT1の時刻t30欄に登録すべき候補となるため、ここでは、候補ブロッブ包摂図形と呼ぶことにする。この例では、個別動体識別画像M(30,1)から抽出された候補ブロッブ包摂図形が、図20(b) に示す候補ブロッブ包摂図形B30aのみであるため、トラッカーT1の時刻t30欄には、この候補ブロッブ包摂図形B30aが後続ブロッブ包摂図形として登録されることになる。候補ブロッブ包摂図形が複数存在する場合には、§2で述べたとおり、候補ブロッブ包摂図形の中から、位置、面積、形状が最も類似しているものが後続ブロッブ包摂図形として選択される。
【0109】
なお、上述したマスキング処理により、個別動体識別画像M(30,1)上では、着目動体O1(馬)の一部分が欠けた状態になっている。図示の例では、たまたま馬の首の部分の一部が欠けたため、ブロッブ包摂図形B30aは、依然として、着目動体O1(馬)の輪郭線の外接矩形となっているが、たとえば、馬の鼻の部分が欠けると、本来の外接矩形よりも横幅が若干小さい矩形がブロッブ包摂図形として抽出されることになる。このように、マスキング処理後の個別動体識別画像から抽出したブロッブ包摂図形は、本来の着目動体の輪郭線の外接矩形とは若干異なる可能性があるが、トラッカーに登録して動体追跡を行う上では支障は生じない。
【0110】
動体O2(人)を着目動体として、その後続ブロッブ包摂図形を認識する処理、すなわち、図19(a) に示すブロッブ包摂図形B29b(人)がトラッカーT2の時刻t29欄に登録されている状態において、時刻t30欄に登録すべき後続ブロッブ包摂図形を認識する処理も同様に行うことができる。具体的には、図19(b) に示す動体識別画像M30に対して、着目動体(人)以外のブロッブ包摂図形を用いたマスキング処理を行えばよい。図21(a) は、このようなマスキング処理を行うことにより得られた個別動体識別画像M(30,2)を示す平面図である。図示のとおり、トラッカーT1の時刻t29欄に登録されていたブロッブ包摂図形B29aにより動体O1(馬)が隠蔽され、トラッカーT3の時刻t29欄に登録されていたブロッブ包摂図形B29cにより動体O3(車)が隠蔽され、トラッカーT4の時刻t29欄に登録されていたブロッブ包摂図形B29dにより動体O4(鳥)が隠蔽され、個別動体識別画像M(30,2)には、着目動体O2(人)のみが残ることになる。
【0111】
図21(b) は、図21(a) に示す個別動体識別画像M(30,2)から抽出された候補ブロッブ包摂図形B30b(太線の矩形)を示す平面図である。トラッカーT2の時刻t30欄には、この候補ブロッブ包摂図形B30bが後続ブロッブ包摂図形として登録されることになる。ここでも、マスキング処理により、個別動体識別画像M(30,2)上では、着目動体O2(人)の一部分が欠けた状態になっている。具体的には、着目動体O2(人)の下半身が欠けてしまっているため、ブロッブ包摂図形B30bは、上半身の輪郭線の外接矩形となっている。ただ、図18(b) に示す原画像P30を見ればわかるとおり、もともと原画像P30上においても動体O2(人)の下半身の画像情報は欠落しているので、ブロッブ包摂図形B30bが上半身のみを示すものであっても支障は生じない。
【0112】
同様に、動体O3(車)を着目動体として、その後続ブロッブ包摂図形を認識する処理を行う場合は、図19(b) に示す動体識別画像M30に対して、着目動体(車)以外のブロッブ包摂図形を用いたマスキング処理を行えばよい。図22(a) は、このようなマスキング処理を行うことにより得られた個別動体識別画像M(30,3)を示す平面図である。図示のとおり、トラッカーT1の時刻t29欄に登録されていたブロッブ包摂図形B29aにより動体O1(馬)が隠蔽され、トラッカーT2の時刻t29欄に登録されていたブロッブ包摂図形B29bにより動体O2(人)が隠蔽され、トラッカーT4の時刻t29欄に登録されていたブロッブ包摂図形B29dにより動体O4(鳥)が隠蔽され、個別動体識別画像M(30,3)には、着目動体O3(車)のみが残ることになる。
【0113】
図22(b) は、図22(a) に示す個別動体識別画像M(30,3)から抽出された候補ブロッブ包摂図形B30c(太線の矩形)を示す平面図である。トラッカーT3の時刻t30欄には、この候補ブロッブ包摂図形B30cが後続ブロッブ包摂図形として登録されることになる。ここでも、マスキング処理により、個別動体識別画像M(30,3)上では、着目動体O3(車)の一部分が欠けた状態になっているが、動体追跡を行う上で支障は生じない。
【0114】
最後に、動体O4(鳥)を着目動体として、その後続ブロッブ包摂図形を認識する処理が行われる。動体O4(鳥)は、他の動体と融合することなしに、常に、独立を維持した動体であるが、後続ブロッブ包摂図形を認識する処理を行う上では、これまで述べてきた他の動体と全く同じ手法が採られる。すなわち、図19(b) に示す動体識別画像M30に対して、着目動体(鳥)以外のブロッブ包摂図形を用いたマスキング処理を行うことにより、図23(a) に示すような個別動体識別画像M(30,4)を得る。図示のとおり、トラッカーT1の時刻t29欄に登録されていたブロッブ包摂図形B29aにより動体O1(馬)が隠蔽され、トラッカーT2の時刻t29欄に登録されていたブロッブ包摂図形B29bにより動体O2(人)が隠蔽され、トラッカーT3の時刻t29欄に登録されていたブロッブ包摂図形B29cにより動体O3(車)が隠蔽され、個別動体識別画像M(30,4)には、着目動体O4(鳥)のみが残ることになる。
【0115】
図23(b) は、図23(a) に示す個別動体識別画像M(30,4)から抽出された候補ブロッブ包摂図形B30d(太線の矩形)を示す平面図である。トラッカーT4の時刻t30欄には、この候補ブロッブ包摂図形B30dが後続ブロッブ包摂図形として登録されることになる。
【0116】
図24は、図20〜図23に示す候補ブロッブ包摂図形に基づいて、各トラッカーの時刻t30欄以降に後続ブロッブ包摂図形の登録を行った状態を示す図である。ここで、時刻t29欄に登録されているブロッブ包摂図形は、図19(a) に示す各ブロッブ包摂図形B29a〜B20dであり、時刻t30欄に登録されているブロッブ包摂図形は、前述した方法によって認識された後続ブロッブ包摂図形である。
【0117】
すなわち、トラッカーT1について、ブロッブ包摂図形B29a(馬)に対する後続ブロッブ包摂図形(時刻t30欄に登録すべきブロッブ包摂図形)を認識する際には、トラッカーT1を着目トラッカーとして(すなわち、馬を着目動体として)、着目外トラッカーT2,T3,T4の時刻t29欄に登録されているブロッブ包摂図形B29b(人),B29c(車),B29d(鳥)を用いて、動体識別画像M30に対するマスキング処理を行い、図20(a) に示すような個別動体識別画像M(30,1)を生成し、図20(b) に示すような候補ブロッブ包摂図形B30a(馬)を抽出し、これを後続ブロッブ包摂図形として認識することになる。図24には、こうして後続ブロッブ包摂図形として認識された候補ブロッブ包摂図形B30a(馬)が着目トラッカーT1の時刻t30欄に登録された状態が示されている。
【0118】
また、トラッカーT2について、ブロッブ包摂図形B29b(人)に対する後続ブロッブ包摂図形を認識する際には、今度はトラッカーT2を着目トラッカーとして(すなわち、人を着目動体として)、着目外トラッカーT1,T3,T4の時刻t29欄に登録されているブロッブ包摂図形B29a(馬),B29c(車),B29d(鳥)を用いて、動体識別画像M30に対するマスキング処理を行い、図21(a) に示すような個別動体識別画像M(30,2)を生成し、図21(b) に示すような候補ブロッブ包摂図形B30b(人)を抽出し、これを後続ブロッブ包摂図形として認識することになる。トラッカーT3,T4についての後続ブロッブ包摂図形認識処理も全く同様である。
【0119】
図25は、こうして、各トラッカーT1〜T4について認識された後続ブロッブ包摂図形B30a〜B30dを、動体識別画像M30に重ねた状態を示す平面図である。結局、本発明に係る後続ブロッブ包摂図形の認識法を採用すると、動体識別画像M30から、図19(b) に示すブロッブ包摂図形B30d,B30gが抽出される代わりに、図25に示すようなブロッブ包摂図形B30a〜B30dが抽出されることになる。別言すれば、複数の動体が交差したために原画像P30上で融合体が形成されていたとしても、この融合体の輪郭を包摂するブロッブ包摂図形B30gではなく、個々の動体の輪郭を包摂するブロッブ包摂図形B30a,B30b,B30cが個別に抽出され、それぞれのトラッカーの後続ブロッブ包摂図形として登録されることになる。
【0120】
以上、時刻t29から時刻t30への変遷を例にとって、各トラッカーの時刻t30欄に登録する後続ブロッブ包摂図形を認識する手順を説明したが、同様の手順がすべての時刻欄について実行されることになる。その結果、図24に示すとおり、トラッカーT1には、動体O1(馬)についてのブロッブ包摂図形を時系列に並べた情報が記録され、トラッカーT2には、動体O2(人)についてのブロッブ包摂図形を時系列に並べた情報が記録され、トラッカーT3には、動体O3(車)についてのブロッブ包摂図形を時系列に並べた情報が記録される。実際には、時刻t30の前後において、これら3つの動体は重なりを生じているが、上述した手順によれば、このような重なりを生じている期間であっても、個々の動体についてのブロッブ包摂図形が個別に抽出され、正しいトラッカーに登録されることになる。
【0121】
図24の表を、図16,図17の表と比較すれば、正しい動体追跡が行われていることが容易に理解できよう。たとえば、車O3をズームアップして追跡表示させるために、トラッカーT3に並べられたブロッブ包摂図形を構成する矩形内部を切出して拡大表示すれば、常に、車O3を追跡する正しい結果が得られる。
【0122】
このように、本発明に係る後続ブロッブ包摂図形の認識法によって各トラッカーに後続ブロッブ包摂図形の登録を行うと、良好な動体追跡の結果が得られる理由は、個々のトラッカーごとに、それぞれ異なる個別動体識別画像(他のトラッカーの先行ブロッブ包摂図形を利用してマスキングした画像)を用意し、この個別動体識別画像から候補ブロッブ包摂図形を抽出するようにしたためである。
【0123】
すなわち、§2,§3で述べた方法では、図19(b) に示すような共通の動体識別画像M30から候補ブロッブ包摂図形B30d,B30gを抽出していたため、正しい後続ブロッブ包摂図形の認識を行うことができなかった。これに対して、本発明に係る方法では、トラッカーT1の後続ブロッブ包摂図形は、図20(a) に示すようなマスキングされた個別動体識別画像M(30,1)から抽出し、トラッカーT2の後続ブロッブ包摂図形は、図21(a) に示すようなマスキングされた個別動体識別画像M(30,2)から抽出し、トラッカーT3の後続ブロッブ包摂図形は、図22(a) に示すようなマスキングされた個別動体識別画像M(30,3)から抽出し、トラッカーT4の後続ブロッブ包摂図形は、図23(a) に示すようなマスキングされた個別動体識別画像M(30,4)から抽出する、という手法を採るため、正しい後続ブロッブ包摂図形の認識を行うことが可能になる。
【0124】
なお、これまでの説明に用いた実例は、前述したとおり、2つの前提を仮定した実例である。まず、第1の前提として、図19(a) に示すように、時刻t29において、一部の動体が重なり合っているにもかかわらず、何らかの手法により、4つの動体O1〜O4のそれぞれについて、別個独立したブロッブ包摂図形が抽出されており、4つの異なるトラッカーの時刻t29欄に、これらのブロッブ包摂図形がそれぞれ登録されているものと仮定する前提をおいた。しかしながら、当該前提は、特別な前提条件ではなく、本発明に係る後続ブロッブ包摂図形の認識法を採用すれば、必然的に満たされる前提条件になる。
【0125】
すなわち、初期時刻t1において、各動体に重なりが生じていないものとすれば、その後に動体の重なりが生じたとしても、上述した手順で後続ブロッブ包摂図形の認識を行う限り、個々の動体は別個独立したブロッブ包摂図形として登録されることになる。たとえば、図14に示す実例の場合、時刻t20における原画像P20では動体の重なりは生じていないので、その後、時刻t30に至る過程で、動体の重なりが生じたとしても、個々の動体は別個独立したブロッブ包摂図形として登録されるので、図19(a) に示す時刻t29においても、4つの動体O1〜O4のそれぞれについて、別個独立したブロッブ包摂図形が登録されている、という前提が成り立つことになる。したがって、この第1の前提は、特別な前提ではなく、上記手順を採用すれば当然満たされる前提である。
【0126】
次に、第2の前提として、図18(a) に示す原画像P29と図18(b) に示す原画像P30とが、全く同じ画像である、という前提をおいた。これは、時刻t29からt30に至る期間、すべての動体O1〜O4が静止していた、という前提であるから、現実的には成立しない前提である。このような前提を置いたのは、本発明の基本原理の説明を容易にするための便宜に他ならない。
【0127】
図20(a) に示すマスキング処理後の個別動体識別画像M(30,1)上で、着目動体である馬以外の動体(人,車,鳥)が、ブロッブ包摂図形B29b,B29c,B29dによって完全に隠蔽されているのは、上記前提を置いたためである。すなわち、ブロッブ包摂図形B29b,B29c,B29dは、時刻t29における人,車,鳥の位置に基づいて抽出された外接矩形であるから、時刻t29における動体識別画像M29に対するマスキング処理を行えば、図20(a) に示す例のように、人,車,鳥を完全に隠蔽することが可能である。ところが、実際には、図20(a) に示す例は、時刻t30における動体識別画像M30に対するマスキング処理を行った結果であるから、上記前提がなければ、人,車,鳥を完全に隠蔽することはできない。
【0128】
図26は、図20に示すマスキング処理では完全なマスキングがなされなかった状態を示す平面図(図(a) )およびこの状態から抽出された候補ブロッブ包摂図形を示す平面図(図(b) )である。実際には、時刻t29からt30に至る期間も、各動体O1〜O4は移動しているので、図26(a) に示す例のように、動体の一部がマスクから食み出すことになり前景領域の一部を構成する。その結果、この個別動体識別画像M(30,1)からは、図26(b) に示すように、4つの候補ブロッブ包摂図形B30a−1〜B30a−4が抽出されることになる。
【0129】
ただ、このように複数の候補ブロッブ包摂図形が抽出された場合でも、その中から後続ブロッブ包摂図形として最適な候補ブロッブ包摂図形を選択すれば、結局、候補ブロッブ包摂図形B30a−1が後続ブロッブ包摂図形として選択され、トラッカーT1の時刻t30欄に登録されることになる。具体的には、図19(a) に示す先行ブロッブ包摂図形B29aに対して、位置、面積、形状が最も類似している候補ブロッブ包摂図形を後続ブロッブ包摂図形として選択する作業を行えばよい。選択されなかった候補ブロッブ包摂図形B30a−2〜B30a−4は、トラッカーに登録されることなく捨てられる。
【0130】
このように、上述した第2の前提は、説明の便宜のために意図的に設けた前提であり、本発明に係る後続ブロッブ包摂図形の認識法を実行する上で必須の前提条件ではない。したがって、本発明を実行する上で、特別な前提条件は必要ない。
【0131】
<<< §5.本発明に係る新参ブロッブ包摂図形の認識法 >>>
さて、§4では、本発明に係る後続ブロッブ包摂図形の認識法の基本原理を説明した。この後続ブロッブ包摂図形の認識処理は、既に登録されている先行ブロッブ包摂図形に後続して、新たなブロッブ包摂図形を追加する処理を行うための処理であり、画面上を継続して移動中の動体についての追跡を続行するための処理と言うことができる。
【0132】
しかしながら、通常、画面上に存在する動体はやがて消え去り、一方で、新たな動体が画面上に出現する、という現象が繰り返される。したがって、実際には、画面上を移動中の動体を追跡する処理に加えて、既存動体が消滅した場合の処理と、新参動体が出現した場合の処理を行う必要がある。図14に示す実例の場合も、時刻t40で得られる原画像P40には、もはや動体O4(鳥)は存在せず、その代わりに新参者の動体O5(犬)が出現している。その結果、図24に示す表では、トラッカーT4の鳥についての一連のブロッブ包摂図形群は時刻t40に至るまでの途中で終焉を迎えており、時刻t40欄は無登録状態(×印)になっている。一方で、トラッカーT5の時刻t40欄には、新参者の動体O5(犬)についてのブロッブ包摂図形B40eが新参ブロッブ包摂図形として登録されている。
【0133】
ここで、既存動体が消滅した場合の処理は、§4で述べた手順において、後続ブロッブ包摂図形が認識できなかった場合の処理として実行することができる。たとえば、動体O4(鳥)が、時刻t38までは存在したが(画面の枠の近くに一部だけ存在した場合も含む)、時刻t39において画面外へ飛び去った、という場合を考えてみる。この場合、トラッカーT4の時刻t39欄に登録すべき後続ブロッブ包摂図形を認識する処理を行っても、後続ブロッブ包摂図形に適した候補ブロッブ包摂図形が認識できないことになり、結局、時刻t39欄は無登録状態(×印)になる。これは、動体O4(鳥)が消滅した場合の処理に他ならない。すなわち、トラッカーT4上では、時系列的に連続して登録されてきた一連のブロッブ包摂図形群が、時刻t38欄の末尾ブロッブ包摂図形をもって途絶えることになり、これにより、動体O4(鳥)が消滅したという情報が記録されることになる。
【0134】
なお、動体が消滅するのは、必ずしも画面外に移動した場合に限られるわけではない。たとえば、人が建物に入った場合、車が地下駐車場へ降りた場合などでは、画面の中央付近で動体が消滅することも起こりうる。ただ、動体がどこで消滅しようと、トラッカー上では、後続ブロッブ包摂図形が認識できない、という状態に変わりはなく、無登録状態(×印)として記録されることになる。
【0135】
これに対して、新参動体が出現した場合は、新参ブロッブ包摂図形を認識した上で、これを所定のトラッカー(空き状態の任意のトラッカー)に新規登録する処理を行う必要がある。そこで、以下、図27に示すように、時刻t39における原画像P39から、時刻t40における原画像P40への変遷が生じた場合に、原画像P40に突然出現した新参動体O5についての新参ブロッブ包摂図形を、トラッカー上に登録する処理の手順を説明する。
【0136】
図28(a) ,(b) は、図27(a) ,(b) に示す原画像P39,P40から作成された動体識別画像M39,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。ここでは、図28(a) に示す動体識別画像M39に基づいて、ブロッブ包摂図形B39a(馬),B39b(人),B39c(車)が、既にトラッカーに登録されている状態において、図28(b) に示す動体識別画像M40に基づいて、時刻t40欄に新たなブロッブ包摂図形を登録する作業を述べる。
【0137】
図29は、図28に示すブロッブ包摂図形に基づいて作成されたトラッカーを示す図である。時刻t39欄には、既に、ブロッブ包摂図形B39a(馬),B39b(人),B39c(車)が、それぞれトラッカーT1,T2,T3に登録されているものとする。一方、時刻t40欄については、まず、§4で述べた後続ブロッブ包摂図形の認識法を適用して、ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)の登録が行われる。当該登録は、図28(b) に示す動体識別画像M40に対してマスキング処理を施すことにより得られた個別動体識別画像M(40,1),M(40,2),M(40,3)を利用して行われる。
【0138】
具体的には、動体識別画像M40に対して、ブロッブ包摂図形B39b(人),B39c(車)を用いたマスキング処理により個別動体識別画像M(40,1)が得られ、ここから抽出されたブロッブ包摂図形B40a(馬)がトラッカーT1に登録される。同様に、ブロッブ包摂図形B39a(馬),B39c(車)を用いたマスキング処理により得られた個別動体識別画像M(40,2)から抽出されたブロッブ包摂図形B40b(人)がトラッカーT2に登録され、ブロッブ包摂図形B39a(馬),B39b(人)を用いたマスキング処理により得られた個別動体識別画像M(40,3)から抽出されたブロッブ包摂図形B40c(車)がトラッカーT3に登録される。図29には、これらの後続ブロッブ包摂図形の登録が完了した状態が示されている。
【0139】
図27(b) に示す原画像P40から新参動体を認識して、これをトラッカーに登録する処理は、このような後続ブロッブ包摂図形の登録が完了した後に行われる。その基本原理は、図28(b) に示す動体識別画像M40から抽出されたブロッブ包摂図形B40a(馬),B40b(人),B40c(車),B40e(犬)の中に、上記処理によって登録された後続ブロッブ包摂図形に対応しないブロッブ包摂図形が存在するか否かを判断し、そのようなブロッブ包摂図形が存在する場合には、これを新参ブロッブ包摂図形と認識し、時刻t40欄が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録するというものである。
【0140】
具体的には、上例の場合、図29に示すとおり、トラッカーT1,T2,T3には、既に後続ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)が登録されているので、図28(b) に示す動体識別画像M40から抽出された4つのブロッブ包摂図形のうち、既に登録された後続ブロッブ包摂図形に対応しないブロッブ包摂図形は、ブロッブ包摂図形B40e(犬)のみである。よって、このブロッブ包摂図形B40e(犬)が、新参ブロッブ包摂図形と判断され、時刻t40欄が未登録状態(空欄状態)のトラッカーに先頭ブロッブ包摂図形として登録される。もちろん、新参ブロッブ包摂図形が複数存在する場合には、それぞれが異なるトラッカーに登録されることになる。
【0141】
図29に示す例の場合、トラッカーT4,T5,T6は、いずれも時刻t40欄が未登録状態であるので、新参ブロッブ包摂図形B40e(犬)は、これらのいずれに登録してもかまわない。図24に示す例は、この新参ブロッブ包摂図形B40e(犬)を、トラッカーT5に登録した例である。残りのトラッカーT4,T6の時刻t40欄は、登録すべきブロッブ包摂図形がないため、無登録状態(×印)となっている。こうして登録された新参ブロッブ包摂図形B40e(犬)は、先頭ブロッブ包摂図形として機能し、トラッカーT5には、以後、動体O5(犬)が消滅するまで、後続ブロッブ包摂図形が並べられることになる。
【0142】
図27(b) に示すとおり、原画像P40上には、互いに重なり合う動体が存在しないため、図28(b) に示す動体識別画像M40から抽出されたブロッブ包摂図形B40a(馬),B40b(人),B40c(車)と、図29に示す表における時刻t40欄に登録されている後続ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)とは、互いに1対1に対応する。たとえば、図29のトラッカーT1の時刻t40欄に登録されているブロッブ包摂図形B40a(馬)は、図28(b) に示す動体識別画像M40に対するマスキング処理後の個別動体識別画像M(40,1)から抽出されたブロッブ包摂図形であるから、もともと動体識別画像M40に含まれていたブロッブ包摂図形B40a(馬)に一致する。ところが、図28(b) に示す動体識別画像M40から抽出されたブロッブ包摂図形B40e(犬)は、図29に示すいずれのトラッカー上にも対応する後続ブロッブ包摂図形が存在しない。このため、当該ブロッブ包摂図形B40e(犬)を、新参ブロッブ包摂図形と認識することができる。
【0143】
なお、原画像上に互いに重なり合う動体が存在する場合は、上例のような単純な1対1の対応にはならない。たとえば、図18(b) に示す原画像P30上では、3つの動体O1,O2,O3が重なり合っているため、動体識別画像M30からは、図19(b) に示すような2つのブロッブ包摂図形B30d(鳥),B30g(人車馬)が抽出される。一方、図24に示す表において、トラッカーT1,T2,T3の時刻t30欄に登録されている後続ブロッブ包摂図形B30a(馬),B30b(人),B30c(車)は、それぞれマスキング処理後の個別動体識別画像M(30,1),M(30,2),M(30,3)から抽出されたものであるため、図19(b) に示すブロッブ包摂図形B30g(人車馬)とは1対1に対応するわけではない。
【0144】
このように、複数n個の動体が互いに重なり合っている場合は、動体識別画像M上において、複数n個の動体の融合体に対して1つのブロッブ包摂図形が抽出されることになるので、トラッカーに登録されている後続ブロッブ包摂図形に対して1対1の対応は得られないが、その代わりに、1対nの対応が得られることになる。すなわち、上例の場合、図19(b) に示されているブロッブ包摂図形B30g(人車馬)に対して、図29の表の時刻t30欄に登録されている3つの後続ブロッブ包摂図形B30a(馬),B30b(人),B30c(車)が対応するという1対3の対応関係が得られることになる。一方、図19(b) のブロッブ包摂図形B30d(鳥)については、図29の表の時刻t30欄に登録されている後続ブロッブ包摂図形B30d(鳥)に対して1対1の対応が得られる。
【0145】
このように、原画像上に互いに重なり合う動体が存在する場合でも、動体識別画像Mから抽出した各ブロッブ包摂図形と、トラッカー上に登録されている後続ブロッブ包摂図形との間には、1対1もしくは1対nの対応関係が得られる。したがって、上述したとおり、対応する後続ブロッブ包摂図形がトラッカー上に登録されていないブロッブ包摂図形を新参ブロッブ包摂図形と認識し、これを新たにトラッカー上に登録することが可能である。図19(b) に示す動体識別画像M30の場合、抽出されたブロッブ包摂図形B30g(人車馬)は、3つの後続ブロッブ包摂図形B30a(馬),B30b(人),B30c(車)に対応し、抽出されたブロッブ包摂図形B30d(鳥)は単一の後続ブロッブ包摂図形B30d(鳥)に対応することになるので、動体識別画像M30上には新参ブロッブ包摂図形は存在しない、との判断を行うことができる。
【0146】
なお、このような新参ブロッブ包摂図形の有無を判断する用途に資するため、実用上は、トラッカー上に後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形と、当該後続ブロッブ包摂図形を抽出する元になった動体識別画像M上のブロッブ包摂図形と、の対応関係を示すテーブルを作成しておくのが好ましい。図30に、このようなテーブルの一例を示す。この例は、図24の表の時刻t30の欄に登録された後続ブロッブ包摂図形と、図19(b) に示す動体識別画像M30上のブロッブ包摂図形と、の対応関係を示すテーブルであり、トラッカー上に各後続ブロッブ包摂図形を登録する作業を行う際に作成することができる。
【0147】
たとえば、図24の表のトラッカーT1の時刻t30欄に、図20(b) に示す個別動体識別画像M(30,1)から抽出された後続ブロッブ包摂図形B30a(馬)を登録する場合を考えよう。この場合、この図20(b) に示す後続ブロッブ包摂図形B30a(馬)と、図19(b) に示すブロッブ包摂図形B30g(人車馬)とは、後者が前者を包含する関係になっていることがわかる。このように、一方が他方を包含する関係になっているブロッブ包摂図形については、互いに対応するブロッブ包摂図形と認識し、テーブル上に当該対応関係を記録しておくようにする。図30に示すテーブルの1行目に記録された対応関係は、このようにして記録されたものである。
【0148】
同様に、図24の表のトラッカーT2の時刻t30欄に、図21(b) に示す個別動体識別画像M(30,2)から抽出された後続ブロッブ包摂図形B30b(人)を登録する場合や、図24の表のトラッカーT3の時刻t30欄に、図22(b) に示す個別動体識別画像M(30,3)から抽出された後続ブロッブ包摂図形B30c(車)を登録する場合にも、包含関係にあるブロッブ包摂図形B30g(人車馬)との対応関係が記録される。図30に示すテーブルの2行目および3行目に記録された対応関係は、このようにして記録されたものである。
【0149】
また、図24の表のトラッカーT4の時刻t30欄に、図23(b) に示す個別動体識別画像M(30,4)から抽出された後続ブロッブ包摂図形B30d(鳥)を登録する場合は、当該後続ブロッブ包摂図形B30d(鳥)と図19(b) に示すブロッブ包摂図形B30d(鳥)とが一致する関係(1対1の対応関係)になっているので、やはり両者が互いに対応するブロッブ包摂図形と認識し、テーブル上に当該対応関係を記録しておくようにする。図30に示すテーブルの4行目に記録された対応関係は、このようにして記録されたものである。
【0150】
要するに、トラッカー上に個々の後続ブロッブ包摂図形を登録する処理を行う際に、登録対象となる後続ブロッブ包摂図形と動体識別画像M上の各ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、当該対応関係をテーブルに記録しておくようにすればよい。このようなテーブルを用意しておけば、前述したように、動体識別画像M上に新参ブロッブ包摂図形が存在するか否かの判断を容易に行うことが可能になる。すなわち、動体識別画像M上の個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形との対応関係が記録されていないブロッブ包摂図形を新参ブロッブ包摂図形と認識することができる。
【0151】
<<< §6.基本的実施形態に係る動体追跡装置 >>>
本発明に係る動体追跡装置は、§4で述べた後続ブロッブ包摂図形の認識法と、§5で述べた新参ブロッブ包摂図形の認識法とを採用し、トラッカー上に新参ブロッブ包摂図形の登録および後続ブロッブ包摂図形の登録を行い、個々の動体を追跡する処理を行うものである。以下、図31のブロック図を参照しながら、本発明の基本的な実施形態に係る動体追跡装置の構成および動作を説明する。
【0152】
この動体追跡装置は、入力した動画画像について動体を検出し、これを追跡する処理を行う装置であり、その基本的な役割は、これまで述べてきたトラッカーの情報を作成し、保持することにある。図示のとおり、この装置の基本的な構成要素は、画像入力部110,背景画像提供部120,動体識別画像生成部130,マスキング処理部140,トラッカー格納部150,トラッカー登録部160,ブロッブ包摂図形抽出部170である。以下、これらの構成要素の機能を順に説明する。
【0153】
<6−1:画像入力部110>
画像入力部110は、時系列で連続する複数の原画像P(i)からなる動画画像を入力し、これを動体識別画像生成部130に提供する構成要素である。ここで、iは時系列の順序を示す自然数(i=1,2,3,... )である。§3では、図14(a) ,(b) ,(c) に示すように、時刻t20,t30,t40において原画像P20,P30,P40が入力された実例を用いた説明を行ったが、ここでは、画像入力部110に対して、時刻t(1)において原画像P(1)が与えられ、次の時刻t(2)において原画像P(2)が与えられ、... 、時刻t(i)において原画像P(i)が与えられたものとする。こうして与えられた時系列で連続する複数の原画像P(i)は動画画像を構成する。たとえば、30フレーム/秒の動画画像の場合は、原画像P(i+1)は原画像(i)の1/30秒後のフレームということになる。
【0154】
なお、画像入力部110を、ハードディスク装置などの記憶装置によって構成しておけば、入力した複数の原画像P(i)からなる動画画像を動画データとして蓄積することができ、必要に応じて、必要なフレームの原画像を動体識別画像生成部130に提供することができる。したがって、動画の任意のパートについての動体追跡処理を随時行うことが可能になる。また、動体識別画像生成部130に対して、時系列を遡るように逆順で原画像を提供するようにすれば、動画を逆送りしながら動体追跡を行うことも可能になる。もちろん、リアルタイムで撮影された動画に基づいて、その場で動体追跡を行う用途に利用する場合には、画像入力部110に動画画像を蓄積保存する機能を設けておく必要はない。
【0155】
<6−2:背景画像提供部120>
背景画像提供部120は、こうして画像入力部110に与えられた動画画像の背景を構成する背景画像を、動体識別画像生成部130に対して提供する機能をもった構成要素である。たとえば、背景画像提供部120に、外部から与えられた静止画像を取り込んで保存する機能をもたせておき、予め所定の静止画像を背景画像として与えておくようにすれば、背景画像提供部120は、当該静止画像をそのまま背景画像として提供することができる。このような方法で背景画像を提供するのであれば、背景画像提供部120を、静止画像のデータを記憶する単純なデータ記憶装置によって構成することができる。
【0156】
もっとも、照明環境に変化のない室内を定点カメラで撮影した動画画像を取り扱う場合であれば、上述のように、単純なデータ記憶装置によって背景画像提供部120を構成することも可能であるが、外光により照明環境が時々刻々と変化してゆく室内や、屋外を撮影した動画画像を取り扱う場合は、当然、背景画像も時間とともに変化させる必要がある。すなわち、定点カメラで撮影した動画画像であっても、朝、昼、晩といった時間経過により背景画像は変化し、また、雲の動き、日照状態の変化などの天候によっても背景画像は変化する。また、定点カメラの設置場所や撮影方向を変更した場合にも背景画像は変化する。
【0157】
このような背景画像の変化にも対応できるようにするためには、背景画像提供部120に、画像入力部110が過去の所定期間にわたって入力した原画像の単純平均もしくは重みづけ平均を求める機能をもたせておき、求めた平均画像を背景画像として提供するようにすればよい。平均画像は、動体の情報が希釈されているため、背景画像として利用するのに適している。図31に示す実施形態の背景画像提供部120は、このような機能をもった構成要素である。すなわち、画像入力部110が入力した原画像P(i)は、逐次、背景画像提供部120に与えられる。背景画像提供部120は、こうして与えられた原画像P(i)に基づいて平均画像を作成し、この平均画像を背景画像として動体識別画像生成部130に提供する機能を果たす。
【0158】
過去の原画像の平均をとることにより背景画像を作成する具体的な方法は、§1でいくつか述べたとおりである。たとえば、過去10分間に得られた原画像の単純平均を示す画像(個々の画素ごとの画素値の単純平均を求めた画像)を背景画像とするのであれば、背景画像提供部120には、常に、現時点から10分間だけ遡った分の原画像を蓄積するデータ記憶場所と、画素値の平均演算を行う演算機能と、を組み込んでおけばよい。もちろん、現時点に近い原画像の画素ほど大きな重みをつけるような重みづけ平均を求めることも可能である。
【0159】
ただ、30フレーム/秒程度の動画の10分間の画像データを蓄積するには、かなりの記憶容量が必要になるので、実用上は、§1で述べたとおり、第i番目の原画像P(i)が与えられたときに、第(i−1)番目の平均画像A(i−1)と、当該第i番目の原画像P(i)との2枚の画像に基づいて、第i番目の平均画像A(i)を作成する手法を採るのが好ましい。その具体的な手法は、図3で説明したとおりである。
【0160】
<6−3:動体識別画像生成部130>
動体識別画像生成部130は、画像入力部110から提供された第i番目の原画像P(i)と、背景画像提供部120から提供された背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する構成要素である。ここに示す実施形態の場合、図2で説明したように、第i番目の原画像P(i)と、第(i−1)番目の平均画像(すなわち背景画像)A(i−1)と、を比較することにより、第i番目の動体識別画像M(i)の生成が行われる。この動体識別画像M(i)は、背景領域K(i)と前景領域F(i)とを区別する二値画像である。
【0161】
ここで、動体識別画像M(i)を生成するには、図5で説明したとおり、原画像P(i)上の特定位置にある画素p(i)の色と、背景画像A(i−1)上の前記特定位置にある画素a(i−1)の色とを比較し、両画素の色の近似度が所定条件を満たす場合には当該特定位置にある画素m(i)を背景領域Kの画素とし、所定条件を満たさない場合には当該特定位置にある画素m(i)を前景領域Fの画素とすればよい。近似度の所定条件としては、たとえば、§1で述べたように、色空間上でのユークリッド距離を設定することができる。
【0162】
<6−4:トラッカー格納部150>
トラッカー格納部150は、トラッカーの情報を個々の動体ごとに格納する構成要素であり、具体的には、図24や図29に例示したような表の情報を格納する機能を果たす。ここで、トラッカーとは、既に説明したとおり、同一の動体に基づいて抽出されたと推定される複数のブロッブ包摂図形を先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べた情報である。
【0163】
図31のトラッカー格納部150のブロック内には、横方向に時系列をとったトラッカーを縦方向に複数並べた表が例示されている。ここで、T1,T2,... ,Tj,... は、個々のトラッカーの名称であり、各トラッカーには、それぞれ特定の時刻に対応する欄が設けられており、特定のブロッブ包摂図形を示す情報が登録される。たとえば、第j番目のトラッカーTjの欄を見ると、時刻t(i−1)の欄にはブロッブ包摂図形Bj(i−1)が登録されており、時刻t(i)の欄にはブロッブ包摂図形Bj(i)が登録されている。もちろん、まだブロッブ包摂図形の登録が行われていない未登録状態の欄もあれば、登録すべきブロッブ包摂図形がないことを示す無登録状態の欄もある。
【0164】
なお、ここに示す実施形態の場合、図13に示すように、個々のブロッブ包摂図形Bは動体の外接矩形によって構成されており、その実体は、2頂点Q1(x1,y1),Q2(x2,y2)の座標値である。したがって、トラッカー格納部150の各欄に格納される情報の実体は、(x1,y1,x2,y2)のような外接矩形の2頂点を示す座標値のデータということになる。すなわち、トラッカー格納部150は、外接矩形の対角に位置する2頂点の座標値をトラッカーの情報として格納することになる。
【0165】
もちろん、トラッカー格納部150は、一連のブロッブ包摂図形を時系列で並べた情報を示すトラッカーを複数格納する機能をもっていれば足り、個々のブロッブ包摂図形をどのようなデータで表現し、時系列の並びの情報をどのような形態で記録するかは任意である。したがって、トラッカー格納部150内に格納される具体的なデータ構造は、ここに例示した形態に限定されるものではない。
【0166】
<6−5:マスキング処理部140>
マスキング処理部140は、動体識別画像生成部130が生成した動体識別画像Mの前景領域Fに対して、トラッカー格納部150に格納されている特定のブロッブ包摂図形を利用したマスキングを行う構成要素である。より具体的には、トラッカー格納部150に格納されている第j番目のトラッカーTjを着目トラッカーとして、着目外トラッカー(Tj以外のトラッカー)の第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことにより、着目トラッカーTj用の個別動体識別画像M(i,j)を生成し、これをブロッブ包摂図形抽出部に提供する。
【0167】
たとえば、j=1とすれば、トラッカーT1が着目トラッカーになり、トラッカーT2以降の全トラッカーが着目外トラッカーになる。そして、動体識別画像M(i)に対して、各着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形を利用したマスキング処理を行うことにより、着目トラッカーT1用の個別動体識別画像M(i,1)が生成される。同様に、J=2とすれば、着目トラッカーT2用の個別動体識別画像M(i,2)が生成され、J=3とすれば、着目トラッカーT3用の個別動体識別画像M(i,3)が生成される。
【0168】
図20(b) ,図21(b) ,図22(b) ,図23(b) に示されている個別動体識別画像M(30,1),M(30,2),M(30,3),M(30,4)は、こうして作成された個別動体識別画像の実例である。なお、これらの個別動体識別画像は、トラッカー登録部160における後続ブロッブ包摂図形登録処理に利用されるものであるので、後続ブロッブ包摂図形をみつける必要のないトラッカーについては作成する必要はない。
【0169】
たとえば、図24に示す例の場合、トラッカーT1〜T4については、時刻t29欄にブロッブ包摂図形が登録されており、時刻t30欄に登録すべき後続ブロッブ包摂図形をみつける必要があるので、トラッカーT1〜T4をそれぞれ着目トラッカーとして、個別動体識別画像M(30,1),M(30,2),M(30,3),M(30,4)を作成する必要があるが、トラッカーT5,T6については、時刻t29欄が無登録状態(×印)であるため、時刻t30欄に登録すべき後続ブロッブ包摂図形は存在しない。したがって、トラッカーT5,T6を着目トラッカーとして、個別動体識別画像M(30,5),M(30,6)を作成する必要はない。結局、マスキング処理部140は、第(i−1)番目の時系列にブロッブ包摂図形B(i−1)が登録されているトラッカーについてのみ個別動体識別画像M(i,j)を生成すれば足りる。
【0170】
<6−6:ブロッブ包摂図形抽出部170>
ブロッブ包摂図形抽出部170は、動体識別画像生成部130が生成した第i番目の動体識別画像M(i)に基づいて、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)を動体と認識し、当該画素集団の外接矩形を第i番目の時系列に所属するブロッブ包摂図形B(i)として抽出する機能と、マスキング処理部140が生成した個別動体識別画像M(i,j)について、マスキングされた部分を除いた前景領域Fを構成するひとまとまりの画素集団(ブロッブ)を動体と認識し、動体と認識した画素集団の外接矩形を第i番目の時系列に所属させるべき第j番目のトラッカー用の候補ブロッブ包摂図形として抽出する機能と、を有する構成要素である。
【0171】
具体的には、図19(b) に示すブロッブ包摂図形B30g,B30d(太線で示す矩形)が、動体識別画像M30から抽出されたブロッブ包摂図形であり、図20(b) ,図21(b) ,図22(b) ,図23(b) に示すブロッブ包摂図形B30a,B30b,B30c,B30dが、それぞれ個別動体識別画像M(30,1),M(30,2),M(30,3),M(30,4)から抽出されたブロッブ包摂図形である。
【0172】
なお、動体識別画像M上の前景領域Fを構成するひとまとまりの画素集団から、その外接矩形をブロッブ包摂図形として抽出する方法には、いくつかの具体的な方法が知られている。ここでは、動体識別画像Mが、小さな矩形状の画素を縦横に行列状に並べた画素配列から構成される一般的な画像であった場合を例にとって、比較的単純なアルゴリズムに基づく方法を以下に例示しておく。図32は、このブロッブ包摂図形抽出処理の手順の一例を示す流れ図である。
【0173】
まず、ステップS1において、動体識別画像M上に初期着目画素を設定する。動体識別画像Mが、縦横の画素配列をもつ一般的な画像であった場合、たとえば、左上の画素(1行1列目の画素)を初期着目画素に設定すればよい。続くステップS2では、着目画素が前景画素か否かの判定を行う。たとえば、図5に示す方法で作成された動体識別画像Mの場合、画素値=1であれば前景画素ということになる。
【0174】
このステップS2において、前景画素との判定がなされた場合には、ステップS3において、当該着目画素のn画素以内の距離に登録矩形が存在するか否かの判定がなされる。ここで、登録矩形とは、後述するように、ステップS4で登録された矩形、もしくは、当該矩形に基づいてステップS5により拡張された矩形である。一方、ステップS2において、前景画素との判定がなされなかった場合(すなわち、着目画素が背景画素であった場合)には、ステップS6へと進むことになる。
【0175】
続いて、ステップS3の判定結果に基づく分岐を説明しよう。まず、ステップS3において、着目画素のn画素以内の距離に登録矩形が存在しないと判定された場合には、ステップS4において、当該着目画素自身の輪郭矩形を登録する処理が行われる。一方、ステップS3において、着目画素のn画素以内の距離に登録矩形が存在すると判定された場合には、ステップS5において、当該登録矩形の領域を、当該着目画素を含む外接矩形にまで拡張する処理が行われる。
【0176】
このような処理を、ステップS6,S7を経て、全画素について着目するまで繰り返し実行すれば、すなわち、全画素を着目画素とする走査を行えば、このブロッブ包摂図形抽出処理は完了である。完了時点で登録されていた矩形が、ブロッブ包摂図形として抽出すべき外接矩形になる。
【0177】
ここでは、図33に示すような具体的な画像を処理対象として、図32に示すブロッブ包摂図形抽出処理を施した場合のプロセスを簡単に説明しておこう。図34は、このブロッブ包摂図形抽出処理の手順を施したプロセスの各段階を示す平面図である。
【0178】
図33に例示する画像は、6行12列に配列された合計72個の画素からなる単純な画像である。ここでは、ハッチングを施した画素が前景画素、白地の画素が背景画素であるものとする。図示のとおり、この画像には、前景領域を構成するひとまとまりの画素集団(ハッチングを施した前景画素の集団:すなわちブロッブ)が2組含まれており、正しいブロッブ包摂図形抽出処理が実行されれば、これら2組の画素集団(ブロッブ)についての外接矩形が、それぞれブロッブ包摂図形として抽出されるはずである。なお、着目画素の走査は、同一行に含まれる左側の画素から右側の画素へと順に行い、1行の走査が完了したら、次の行の走査に移ることにする。
【0179】
まず、ステップS1において、1行1列目の画素が初期着目画素として設定される。この初期着目画素は前景画素ではないので、ステップS2からステップS6,S7を経て、1行2列目の画素が次の着目画素になる。当該着目画素も前景画素ではないので、1行3列目の画素が次の着目画素になる。図33に示す例の場合、1行目には前景画素が存在しないので、2行目の画素について着目する処理が続行される。
【0180】
そうすると、2行2列目の画素が着目画素となった段階で、はじめて着目画素が前景画素になる。そこで、ステップS3の判定が行われるが、この時点では、まだ登録された矩形は存在しないので、ステップS4に進み、当該着目画素自身の輪郭矩形が登録矩形として登録されることになる。図34(a) は、このような登録がなされた状態を示している。図に太線で示す矩形が登録矩形である。続いて、ステップS6,S7を経て、2行3列目の画素が次の着目画素になるが、2行目には、以降、前景画素が存在しないので、3行目の画素について着目する処理が続行される。
【0181】
すると、3行2列目の画素が着目画素となった段階で、再び着目画素が前景画素になる。そこで、ステップS3の判定が行われる。ここでは、説明の便宜上、n=3に設定した場合を考えてみよう(実用上は、より大きなnを設定するのが一般的である)。すると、図34(a) に示すとおり、3行2列目の着目画素に対して、3画素以内の距離に登録矩形(太線の矩形)が存在するので、ステップS5へと進み、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(b) は、このような拡張がなされた状態を示している。これまで1画素分の大きさしかなかった登録矩形が、縦長の2画素分の登録矩形に拡張されている。
【0182】
続いて、ステップS6,S7を経て、3行3列目の画素が次の着目画素になるが、この画素も前景画素である。そこで、ステップS3の判定を行うと、図34(b) に示すとおり、3行3列目の着目画素に対して、3画素以内の距離に登録矩形(太線の矩形)が存在するので、ステップS5へと進み、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(c) は、このような拡張がなされた状態を示している。これまで2画素分の大きさしかなかった登録矩形が、4画素分の登録矩形に拡張されている。
【0183】
続いて、ステップS6,S7を経て、3行4列目の画素が次の着目画素になるが、この画素は前景画素ではない。そこで、ステップS6,S7を経て、3行5列目の画素が次の着目画素になるが、この画素は前景画素である。そこで、ステップS3の判定を行うと、図34(c) に示すとおり、3行5列目の着目画素に対して、3画素以内の距離に登録矩形(太線の矩形)が存在するので、ステップS5へと進み、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(d) は、このような拡張がなされた状態を示している。これまで4画素分の大きさしかなかった登録矩形が、8画素分の登録矩形に拡張されている。
【0184】
再び前景画素が着目画素となるのは、3行10列目である。この3行10列目の画素を着目画素として、ステップS3の判定を行うと、図34(d) に示すとおり、登録矩形(太線の矩形)は存在するものの、5画素分だけ離れているため、着目画素に対して3画素以内の距離の登録矩形は存在しない。そこで、ステップS4に進み、当該着目画素自身の輪郭矩形が登録矩形として登録されることになる。図34(e) は、このような登録がなされた状態を示している。これにより、第2の登録矩形が生成されたことになる。
【0185】
続いて、3行11列目の画素が着目画素になる。当該着目画素は前景画素であり、左隣に登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(f) は、このような拡張がなされた状態を示している。これまで1画素分の大きさしかなかった第2の登録矩形が、2画素分の登録矩形に拡張されている。
【0186】
次に、4行2列目の画素が着目画素になると、図34(f) に示すとおり、上隣に第1の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(g) は、このような拡張がなされた状態を示している。これまで8画素分の大きさしかなかった第1の登録矩形が、12画素分の登録矩形に拡張されている。
【0187】
続いて、4行3列目〜5列目の画素が着目画素になった場合、当該着目画素自身が登録矩形内の画素になるため、当然、3画素以内の距離に登録矩形が存在するため、ステップS5へ進むが、既に当該登録矩形は当該着目画素を含む外接矩形に拡張されているため、実質的な登録矩形の拡張は行われない。ただ、4行6列目の画素が着目画素になると、左隣に第1の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(h) は、このような拡張がなされた状態を示している。これまで12画素分の大きさしかなかった第1の登録矩形が、15画素分の登録矩形に拡張されている。
【0188】
続いて、4行11列目の前景画素が着目画素になると、図34(h) に示すとおり、上隣に第2の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図35(i) は、このような拡張がなされた状態を示している。これまで2画素分の大きさしかなかった第2の登録矩形が、4画素分の登録矩形に拡張されている。
【0189】
歳後に、5行11列目の前景画素が着目画素になると、図34(i) に示すとおり、上隣に第2の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図35(j) は、このような拡張がなされた状態を示している。これまで4画素分の大きさしかなかった第2の登録矩形が、6画素分の登録矩形に拡張されている。かくして、15画素分の画素の輪郭を包摂する第1の登録矩形と、6画素分の画素の輪郭を包摂する第2の登録矩形とが、それぞれブロッブ包摂図形として抽出されることになる。
【0190】
結局、ブロッブ包摂図形抽出部170が、上述した方法でブロッブ包摂図形抽出を行うには、動体識別画像Mを構成する個々の画素に順に着目し、各着目画素について、(a) 着目画素が前景画素であり、かつ、所定近傍範囲(上例の場合、3画素以内の距離)に登録矩形が存在しない場合には、当該着目画素の輪郭を構成する矩形を登録する処理を行い、(b) 着目画素が前景画素であり、かつ、所定近傍範囲に登録された矩形が存在する場合には、当該登録矩形の領域を着目画素を含む外接矩形に拡張して登録する処理を行い、最終的に登録された矩形に基づいてブロッブ包摂図形の抽出を行うようにすればよい。
【0191】
もちろん、上述したブロッブ包摂図形抽出処理の方法は、一例を示すものであり、図31に示すブロッブ包摂図形抽出部170によるブロッブ包摂図形抽出処理の方法は、上述した方法に限定されるものではない。
【0192】
<6−7:トラッカー登録部160>
トラッカー登録部160の基本機能は、ブロッブ包摂図形抽出部170によって抽出された第i番目の時系列に所属するブロッブ包摂図形B(i)を、第j番目のトラッカーTjの第i番目の時系列に所属するメンバーとして、トラッカー格納部150に登録することである。実際には、このトラッカー登録部160によって実行される処理は、後続ブロッブ包摂図形登録処理と新参ブロッブ包摂図形登録処理とに分けて行われる。ここで、後続ブロッブ包摂図形登録処理は先行して行われる前半段階の処理であり、新参ブロッブ包摂図形登録処理は、後続ブロッブ包摂図形登録処理が実行された後に行われる後半段階の処理である。
【0193】
まず、後続ブロッブ包摂図形登録処理は、トラッカーの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形(末尾ブロッブ包摂図形ではないブロッブ包摂図形)に対して、第i番目の時系列として後続ブロッブ包摂図形を登録するための処理である。ここで、後続ブロッブ包摂図形の登録は必ず行われるわけではなく、後続ブロッブ包摂図形に適したブロッブ包摂図形が存在しない場合には、登録は行われず、当該先行ブロッブ包摂図形は末尾ブロッブ包摂図形となり、ブロッブ包摂図形の継続性は絶たれる。この後続ブロッブ包摂図形登録処理の具体的な手法は、既に、§4において、後続ブロッブ包摂図形の認識法として説明したとおりである。
【0194】
すなわち、この後続ブロッブ包摂図形登録処理は、第j番目のトラッカーTjの第(i−1)番目の時系列に末尾ブロッブ包摂図形ではないブロッブ包摂図形が登録されている場合に、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、これに後続させるのに適したブロッブ包摂図形が、ブロッブ包摂図形抽出部170から与えられた第j番目のトラッカー用の候補ブロッブ包摂図形内に存在するか否かを判定し、存在するときには、当該候補ブロッブ包摂図形を第i番目の時系列に所属する後続ブロッブ包摂図形として登録する処理を行い、存在しないときには、前記先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示す処理を行うことによって構成される。
【0195】
たとえば、図24に示す例の場合、トラッカーT1の第29番目の時系列(時刻t29欄)には、末尾ブロッブ包摂図形ではないブロッブ包摂図形B29a(馬)が登録されているので、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、第30番目の時系列(時刻t30欄)に登録するのに適した後続ブロッブ包摂図形の認識が行われる。既に述べたとおり、後続ブロッブ包摂図形は、たとえば、図26(b) に示すような4つの候補ブロッブ包摂図形B30a−1,B30a−2,B30a−3,B30a−4の中から選択される。もちろん、この4つの候補の中に、後続ブロッブ包摂図形として適したブロッブ包摂図形が存在しない場合には、後続ブロッブ包摂図形の登録は行われない。
【0196】
このため、トラッカー登録部160は、後続ブロッブ包摂図形登録処理を行う際に、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に対して、第j番目のトラッカー用として抽出された個々の候補ブロッブ包摂図形の適合性評価を行い、所定の基準以上の評価、かつ、最も高い評価を得た候補ブロッブ包摂図形を、先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形と判定し、これを後続ブロッブ包摂図形として登録する処理を行う。上例の場合、図19(a) に示す先行ブロッブ包摂図形B29a(馬)に対して、図26(b) に示す4つの候補ブロッブ包摂図形B30a−1,B30a−2,B30a−3,B30a−4の適合性評価が行われ、最も高い評価を得たブロッブ包摂図形が、所定の基準以上の評価であれば、これを後続ブロッブ包摂図形として登録することになる。
【0197】
たとえば、図26(b) に示す例の場合、既に述べたように、候補ブロッブ包摂図形B30a−1が、最も高い評価、かつ、所定の基準以上の評価を得ることになるため、先行ブロッブ包摂図形B29a(馬)に後続する後続ブロッブ包摂図形として、トラッカーT1の時刻t30欄に登録されることになる。なお、最も高い評価を得た候補でも、所定の基準に満たない場合には、後続ブロッブ包摂図形として登録されることはない。たとえば、図26(b) において、候補ブロッブ包摂図形B30a−1が存在しなかった場合、たとえ、候補ブロッブ包摂図形B30a−3が最も高い評価を得たとしても、当該評価が所定の基準に満たない場合には、候補ブロッブ包摂図形B30a−3が後続ブロッブ包摂図形として登録されることはない。
【0198】
後続ブロッブ包摂図形としての適合性評価は、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形との位置、面積、形状の類似性に基づいて行うようにすればよい。図35は、このような後続ブロッブ包摂図形の適合性評価の方法を示す平面図である。
【0199】
図35(a) は、位置の類似性に基づく適合性評価の方法を示している。ここで、太線の矩形は、先行ブロッブ包摂図形B(i−1)であり、他の3つの矩形は、比較対象となる候補ブロッブ包摂図形B(i)a,B(i)b,B(i)cである。ここに示す例では、各ブロッブ包摂図形を構成する矩形の中心点Q,Qa,Qb,Qcを、各ブロッブ包摂図形の位置と定義し、中心点間の距離が小さいほど、類似性に関して高い評価値を与えるようにしている。たとえば、2点Q/Qa間の距離、2点Q/Qb間の距離、2点Q/Qc間の距離を求め、これらの距離の逆数を位置の類似性を示す評価値とすれば、類似性を定量的に示す評価値を得ることができる。図示の例の場合、先行ブロッブ包摂図形B(i−1)に最も近い位置にある候補ブロッブ包摂図形B(i)bが、最高の評価値を得ることになる。
【0200】
このような評価は、同一の動体が短時間に移動した場合、別な動体の位置よりも近い位置に存在する可能性が高いであろう、という推定に基づくものである。
【0201】
なお、位置の類似性の評価材料としては、必ずしも距離を用いる必要はなく、重なり部分の面積を評価材料として用いることも可能である。たとえば、30フレーム/秒といったレートで撮影された動画画像の場合、動体のフレーム単位の移動時間はわずか1/30秒であるから、原画像P(i−1)上の動体の位置と、原画像P(i)上の動体の位置とに大きな差はなく、動体の輪郭を包摂するブロッブ包摂図形は、互いに重なりを生じているのが一般的である。そして、この重なり部分の面積が大きいほど、位置の類似性も高いことになるので、やはり位置の類似性を定量的に示す評価値を得ることができる。
【0202】
図35(a) に示す例の場合、重なり部分の面積を求めると、B(i−1)とB(i)aとは重なっていないので面積は0になり、B(i−1)とB(i)bとは、図にハッチングを施した部分の面積となり、B(i−1)とB(i)cとは重なっていないので面積は0になる。したがって、重なり部分の面積を評価値として利用すれば、やはり候補ブロッブ包摂図形B(i)bが、最高の評価値を得ることになる。
【0203】
一方、図35(b) は、面積の類似性に基づく適合性評価の方法を示している。すなわち、先行ブロッブ包摂図形B(i−1)の面積をAとして、候補ブロッブ包摂図形B(i)a,B(i)b,B(i)cの面積をそれぞれAa,Ab,Acとすれば、面積の類似性を示す評価値を得ることができる。たとえば、比較対象となる2つの矩形のうち、大きい方の面積をα、小さい方の面積をβとすれば、β/αが面積の類似性を定量的に示す評価値になる。評価値β/αの最大値は1であり、評価値が1に近いほど、面積の類似性が高いことになる。
【0204】
このような評価は、同一の動体が短時間に移動した場合、原画像上での大きさが急激に変化することはないであろう、という推定に基づくものである。もちろん、人が手足を動かして歩行した場合、原画像上での大きさは若干変化するであろう。また、動体がカメラに近づいたり、遠ざかったりする動きをした場合も、大きさは若干変化するであろう。しかしながら、1/30秒程度の移動時間では、動体の大きさに、それほど大きな変化は生じないであろう。したがって、面積の類似性に基づく適合性評価は、上述した位置の類似性に基づく適合性評価と同様に、合理的な評価方法である。
【0205】
そして、図35(c) は、形状の類似性に基づく適合性評価の方法を示している。ここに示す実施形態の場合、各ブロッブ包摂図形は矩形によって構成されているので、形状は、縦横比(アスペクト比)として定量化することができる。すなわち、先行ブロッブ包摂図形B(i−1)の形状は、アスペクト比v/hで表現することができ、候補ブロッブ包摂図形B(i)a,B(i)b,B(i)cの形状も、それぞれアスペクト比va/ha,vb/hb,vc/hcで表現することができる。したがって、たとえば、比較対象となる2つの矩形のアスペクト比のうち、大きい方のアスペクト比をα、小さい方のアスペクト比をβとすれば、面積を比較する場合と同様に、β/αが形状の類似性を定量的に示す評価値になる。評価値β/αの最大値は1であり、評価値が1に近いほど、形状の類似性が高いことになる。
【0206】
このような評価は、同一の動体が短時間に移動した場合、原画像上での形状が急激に変化することはないであろう、という推定に基づくものである。やはり、人が手足を動かして歩行した場合、原画像上での形状は若干変化するであろうが、同一の動体であれば、形状にそれほど大きな変化は生じないであろう。したがって、形状の類似性に基づく適合性評価は、上述した位置や面積の類似性に基づく適合性評価と同様に、合理的な評価方法である。
【0207】
結局、後続ブロッブ包摂図形としての適合性評価は、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて行うようにすればよい。複数の評価値を組み合わせて類似性の評価を行う場合は、上述したような方法で定量的に求めた各評価値に、それぞれ所定の重み係数を乗じ、これを積算して総合評価値を求めるようにすればよい。
【0208】
こうして求めた評価値が所定の基準値以上となるブロッブ包摂図形が、候補ブロッブ包摂図形の中に存在しない場合には、後続ブロッブ包摂図形として登録するのに適したブロッブ包摂図形が存在しないことになる。このように、後続ブロッブ包摂図形登録処理において、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形B(i−1)に後続させるのに適したブロッブ包摂図形が、第j番目のトラッカー用の候補ブロッブ包摂図形内に存在しない場合には、先行ブロッブ包摂図形B(i−1)に後続する後続ブロッブ包摂図形の登録を行わずに、当該先行ブロッブ包摂図形B(i−1)が末尾ブロッブ包摂図形となったことを示す処理を行う。
【0209】
ここで、第j番目のトラッカーTjの先行ブロッブ包摂図形B(i−1)が末尾ブロッブ包摂図形となったことを示す処理としては、第j番目のトラッカーTjの第i番目の時系列を無登録状態とする処理を行えばよい。ここで、無登録状態とは、登録すべきブロッブ包摂図形が存在しないことを示す状態であり、まだ登録が行われていない未登録状態とは意味合いが異なっている。たとえば、図29に示す例の場合、トラッカー上の×印欄は無登録状態を示し、空白欄は未登録状態を示している。
【0210】
もっとも、実用上は、無登録状態を示すデータと未登録状態を示すデータとを、必ずしも区別する必要はない。たとえば、図29に示すトラッカーT4,T5,T6の時刻t40欄は空白欄(未登録状態)になっているが、トラッカー登録部160による時刻t40に関する処理(後続ブロッブ包摂図形登録処理および新参ブロッブ包摂図形登録処理)が完了した時点では、これらの空白欄は×印欄と把握されることになる。もちろん、無登録状態と未登録状態とを明確に区別したい場合は、無登録状態を示すデータ(×印に対応するデータ)を積極的に書き込む処理を行うようにしてもよい。
【0211】
このように、これまで述べてきた実施形態の場合、第j番目のトラッカーTjの先行ブロッブ包摂図形B(i−1)が末尾ブロッブ包摂図形となったことを示すための処理として、第i番目の時系列を無登録状態とする処理が行われている。たとえば、図29に示す例は、§5で述べたとおり、動体O4(鳥)が、時刻t38までは存在したが、時刻t39において画面外へ飛び去った、という場合の例である。この場合、トラッカーT4の時刻t39欄に登録すべき後続ブロッブ包摂図形を認識する処理を行っても、後続ブロッブ包摂図形に適した候補ブロッブ包摂図形が存在しなかったため、時刻t39欄を無登録状態(×印)とする処理が行われている。別言すれば、時刻t39欄が無登録状態(×印)となっていることにより、間接的に、時刻t38欄のブロッブ包摂図形B38d(鳥)が末尾ブロッブ包摂図形であることが示されている。
【0212】
要するに、これまで述べてきた実施形態の場合、無登録状態(×印)の欄が、時系列で連続する一連のブロッブ包摂図形群の区切りとして機能し、何らかのブロッブ包摂図形が登録されている欄の左側の欄が無登録状態(×印)である場合には、当該ブロッブ包摂図形は先頭ブロッブ包摂図形ということになり、何らかのブロッブ包摂図形が登録されている欄の右側の欄が無登録状態(×印)である場合には、当該ブロッブ包摂図形は末尾ブロッブ包摂図形ということになる。このように、無登録状態(×印)の欄を、一連のブロッブ包摂図形群の区切りとして利用すれば、無登録状態(×印)の欄で挟まれた一連のブロッブ包摂図形群を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べられた同一の動体の追跡結果として把握することができる。
【0213】
ただ、一連のブロッブ包摂図形群の区切りを示す方法は、このような無登録状態(×印)の欄を設ける方法に限定されるものではない。たとえば、先頭ブロッブ包摂図形には、当該ブロッブ包摂図形が先頭ブロッブ包摂図形であることを示す識別コードを付してトラッカー上の該当欄に格納するようにし、末尾ブロッブ包摂図形には、当該ブロッブ包摂図形が末尾ブロッブ包摂図形であることを示す識別コードを付してトラッカー上の該当欄に格納するようにすれば、無登録状態(×印)の欄を設けなくても、上記識別コードに基づいて、個々のブロッブ包摂図形が先頭ブロッブ包摂図形であるのか、末尾ブロッブ包摂図形であるのか、あるいはこれらの間に挟まれた中間ブロッブ包摂図形であるのか、を判別することができる。
【0214】
このように、識別コードにより先頭ブロッブ包摂図形や末尾ブロッブ包摂図形の判別を行う方法を採用した場合、無登録状態(×印)の欄による区切りは不要になるので、末尾ブロッブ包摂図形に後続させて、別な動体(新参動体)についての先頭ブロッブ包摂図形を格納することが可能になる。たとえば、図29に示す例の場合、もし時刻t39に新参動体が出現した場合、当該新参動体についての新参ブロッブ包摂図形を、トラッカーT4の時刻t39欄に先頭ブロッブ包摂図形として登録することができる。この場合、トラッカーT4の時刻t38欄にはブロッブ包摂図形B38d(鳥)が登録されているが、当該ブロッブ包摂図形には、末尾ブロッブ包摂図形である識別コードが付されており、時刻t39欄に登録された新参ブロッブ包摂図形には、先頭ブロッブ包摂図形である識別コードが付されているので、無登録状態(×印)の欄による区切りがなくても支障は生じない。
【0215】
上例の場合、トラッカーT4の時刻t38欄のブロッブ包摂図形B38d(鳥)が末尾ブロッブ包摂図形となったことを示すための処理として、時刻t39欄を無登録状態(×印)とする処理を行う代わりに、時刻t38欄のブロッブ包摂図形B38d(鳥)に、当該ブロッブ包摂図形が末尾ブロッブ包摂図形であることを示す識別コードを書き込む処理を行うことになる。
【0216】
以上、トラッカー登録部160が前半段階の処理として行う後続ブロッブ包摂図形登録処理を説明した。続いて、後半段階の処理として行う新参ブロッブ包摂図形登録処理について説明しよう。この新参ブロッブ包摂図形登録処理は、第i番目の時系列の原画像P(i)で新たに出現した新参動体を、先頭ブロッブ包摂図形としてトラッカーに登録する処理であり、その具体的な手法は、既に、§5において、新参ブロッブ包摂図形の認識法として説明したとおりである。
【0217】
すなわち、この新参ブロッブ包摂図形登録処理は、後続ブロッブ包摂図形登録処理を各トラッカーについて行った後、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)の中に、後続ブロッブ包摂図形登録処理によって登録された後続ブロッブ包摂図形に対応しない新参ブロッブ包摂図形が存在する場合に、当該新参ブロッブ包摂図形を第i番目の時系列が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録する処理である。
【0218】
たとえば、図24に示す例の場合、前半段階の後続ブロッブ包摂図形登録処理により、トラッカーT1,T2,T3の時刻t40欄に、それぞれブロッブ包摂図形B40a(馬),B40b(人),B40c(車)が登録されている。そこで、後半段階の新参ブロッブ包摂図形登録処理では、図28(b) に示すように、動体識別画像M40に基づいて抽出された4つのブロッブ包摂図形B40a,B40b,B40c,B40eについて、図24に示す時刻t40欄に登録されているブロッブ包摂図形B40a(馬),B40b(人),B40c(車)に対応しない新参ブロッブ包摂図形が存在するか否かが判定される。その結果、ブロッブ包摂図形B40e(犬)については、対応する後続ブロッブ包摂図形が登録されていないことが判明するので、このブロッブ包摂図形B40e(犬)を新参ブロッブ包摂図形として、時刻t40欄が未登録状態となっている任意のトラッカーに先頭ブロッブ包摂図形として登録する処理が行われる。
【0219】
なお、§5で述べたとおり、原画像上に互いに重なり合う動体が存在する場合は、動体識別画像に基づいて抽出されたブロッブ包摂図形と、前半段階の後続ブロッブ包摂図形登録処理により登録された後続ブロッブ包摂図形との間の対応関係は、1対1ではなく、1対n(n≧2)になる。すなわち、2つのブロッブ包摂図形を構成する矩形が完全に一致する対応関係ではなく、一方のブロッブ包摂図形を構成する矩形が他方のブロッブ包摂図形を構成する矩形を包含する対応関係になる。この場合でも、図30に示すようなテーブルを作成しておけば、両者の対応関係を認識することができるので、対応する後続ブロッブ包摂図形の有無の判定を行うことができ、新参ブロッブ包摂図形の存在を認識することができる。
【0220】
結局、トラッカー登録部160は、後半段階の新参ブロッブ包摂図形登録処理を行う際に、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)と、前半段階の後続ブロッブ包摂図形登録処理によって第i番目の時系列に登録された後続ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、前記ブロッブ包摂図形B(i)の中で対応関係が認識できないブロッブ包摂図形を新参ブロッブ包摂図形と認識すればよい。
【0221】
<6−8:コンピュータを用いた構成>
以上、図31に示すブロック図を参照しながら、本発明の基本的な実施形態に係る動体追跡装置の構成および動作を説明したが、実際には、この装置は、コンピュータに専用のプログラムを組み込むことにより構成することができる。たとえば、トラッカー格納部150は、コンピュータの記憶装置によって実現することができ、画像入力部110は、コンピュータの入出力インターフェイスによって実現することができ、その余の構成要素は、コンピュータがプログラムと協働して実行する機能として実現することができる。
【0222】
<<< §7.いくつかの変形例 >>>
続いて、ここでは、§6で述べた基本的な実施形態に係る動体追跡装置の変形例をいくつか述べておく。
【0223】
<7−1:マスキング処理時のブロッブ包摂図形の位置修正>
§6で述べたとおり、マスキング処理部140は、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)を利用して、第i番目の時系列の動体識別画像M(i)についてのマスキングを行うため、マスクと動体との間に若干の時差が生じる。このような時差の存在により、たとえば、図26(a) に例示する個別動体識別画像M(30,1)の場合、マスクとなるブロッブ包摂図形B29b,B29c,B29dから動体の一部が食み出してしまっている。その結果、個別動体識別画像M(30,1)からは、図26(b) に示すように、合計4組の候補ブロッブ包摂図形B30a−1,B30a−2,B30a−3,B30a−4が抽出されることになる。
【0224】
これら4組の候補ブロッブ包摂図形のうち、先行ブロッブ包摂図形B29a(馬)に後続させるべきブロッブ包摂図形は、候補ブロッブ包摂図形B30a−1であり、残りの3つの候補ブロッブ包摂図形は、いわばノイズブロッブ包摂図形というべき無用なブロッブ包摂図形である。もちろん、このようなノイズブロッブ包摂図形が混入していたとしても、トラッカー登録部160は、位置、面積、形状に関する類似性を評価し、先行ブロッブ包摂図形B29a(馬)に最も類似している候補ブロッブ包摂図形B30a−1を後続ブロッブ包摂図形として選択するので問題は生じない。しかしながら、このようなノイズブロッブ包摂図形の存在は、誤った選択を誘発する要因になるため、できるだけ避けるのが好ましい。すなわち、理想的には、図26(b) に示す個別動体識別画像M(30,1)ではなく、図20(b) に示す個別動体識別画像M(30,1)が得られるのが好ましい。
【0225】
そのためには、マスキング処理時に、マスクとして機能するブロッブ包摂図形の位置を修正すればよい。たとえば、図26(a) において、動体O2(人)を隠蔽する役割を果たしているブロッブ包摂図形B29bは、図19(a) に示すように、時刻t29の時点における動体O2(人)の位置を示すものである。ところが、動体O2(人)は画面の右方向へ移動しているため、時刻t30の時点では、図26(a) に示すように、動体O2(人)の一部がマスクとなるブロッブ包摂図形B29bの右側に食み出してしまっている。このような食み出しを防止するには、ブロッブ包摂図形B29bが動体O2(人)の移動とともに画面の右方向へ移動していったものと推定して、時刻t30の時点におけるブロッブ包摂図形B29bの予測位置を求め、マスクとなるブロッブ包摂図形B29bに対して、当該予測位置への位置修正を施すようにすればよい。
【0226】
図26(a) に示す例の場合、右方向に移動中の動体O2(人)のマスクとして機能するブロッブ包摂図形B29bは若干右方向に位置修正し、左方向に移動中の動体O3(車)および動体O4(鳥)のマスクとして機能するブロッブ包摂図形B29c,B29dは若干左方向に位置修正すればよい。もちろん、このような位置修正は、あくまでも予想位置への修正であるため、実際には、位置修正後のマスクによっても、各動体を完全に隠蔽することはできないかもしれないが、少なくとも、食み出しの程度を低減することができるので、上述したノイズブロッブ包摂図形の面積を低減させる効果は得られる。
【0227】
このように、マスキング処理時にマスクとして機能するブロッブ包摂図形の位置修正を行うには、マスキング処理部140に、各トラッカーに格納されている第(i−1)番目以前の連続した時系列に所属するブロッブ包摂図形の位置の変遷に基づいて、第i番目の時系列に所属するブロッブ包摂図形の予測位置を求める機能を付加しておき、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形に対して、前記予測位置への位置修正を施し、位置修正後の外接矩形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにすればよい。
【0228】
たとえば、図26(a) に示す例において、動体O2(人)のマスクとして機能するブロッブ包摂図形B29bについての時刻t30の時点での予測位置は、図24に示すトラッカーT2の時刻t29以前の欄に格納されているブロッブ包摂図形の位置の変遷に基づいて求めることができる。以下、このような過去の位置(時刻t(i−1)以前の位置)の変遷に基づいて、次の時点(時刻t(i)の時点)の予測位置を求める具体的な方法を2例だけ述べておく。
【0229】
図36は、このような予測位置を求めるための第1の具体的な方法を示す平面図である。ここでは、同一のトラッカーの時刻t(i−4),t(i−3),t(i−2),t(i−1)の各欄に、それぞれ図示のようなブロッブ包摂図形B(i−4),B(i−3),B(i−2),B(i−1)が登録されている状態において、この一連のブロッブ包摂図形の時刻t(i)の時点での予測位置を示すブロッブ包摂図形B(i)′を求める具体的な方法を説明しよう。ここでは、各ブロッブ包摂図形を構成する矩形の中心点を、当該ブロッブ包摂図形の位置の基準点R0〜R4と定義することにする。もちろん、各ブロッブ包摂図形の位置の基準点は、必ずしも矩形の中心点に定義する必要はなく、たとえば、矩形の左上隅点などに定義してもかまわない。あるいは、ブロッブ包摂図形の抽出時に前景領域Fの重心点を求めておき、この重心点をブロッブ包摂図形の位置の基準点としてもよい。
【0230】
この第1の具体的な方法の要点は、第(i−L)番目(Lは2以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)の位置の基準点から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)の位置の基準点へ向かうベクトルに対して、その長さを(L/(L−1))倍に伸ばすことにより得られるベクトルの先端を予測位置の基準点とすることにある。
【0231】
図36に示す例は、L=4の場合であり、時刻t(i−4)欄に登録されているブロッブ包摂図形B(i−4)の位置の基準点R4から、時刻t(i−1)欄に登録されているブロッブ包摂図形B(i−1)の位置の基準点R1へ向かうベクトル「R4→R1」に対して、その長さを(4/(4−1))倍に伸ばすことにより得られるベクトル「R4→R0」の先端の点R0が、予測位置の基準点として求められることになる。
【0232】
一方、図37は、予測位置を求めるための第2の具体的な方法を示す平面図である。この第2の具体的な方法の要点は、第(i−L)番目(Lは3以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)まで、合計L個のブロッブ包摂図形の各位置の基準点を近似的に通る二次曲線Cを求め、この二次曲線C上の点を予測位置の基準点とすることにある。このような二次曲線Cを求める具体的な方法は、種々のアルゴリズムに基づく方法が公知であるため、ここでは詳しい説明は省略する。
【0233】
図37に示す例は、L=4の場合であり、時刻t(i−4)欄に登録されているブロッブ包摂図形B(i−4)から、時刻t(i−1)欄に登録されているブロッブ包摂図形B(i−1)まで、合計4個のブロッブ包摂図形の各位置の基準点R4,R3,R2,R1を近似的に通る二次曲線Cを求め、この二次曲線C上の点R0が、予測位置の基準点として求められることになる。二次曲線C上に点R0を求めるには、たとえば、2点R4/R3間、R3/R2間、R2/R1間の二次曲線Cに沿った距離を求め、これらの距離の平均だけ点R1から隔たった二次曲線C上の点を、点R0とすればよい。
【0234】
図36に例示する方法はいわゆる一次補間によって予測位置の基準点R0を決定する方法であり、図37に例示する方法はいわゆる二次補間によって予測位置の基準点R0を決定する方法である。一般に、後者の方法の方が、より正確な予測ができるものとされている。いずれの場合も、ブロッブ包摂図形B(i−1)の位置が、ブロッブ包摂図形B(i)′の位置に修正された上で、マスキングが行われることになる。もちろん、ブロッブ包摂図形B(i)′は、あくまでも予測によって位置修正されたマスクの位置を示すものであり、トラッカーの時刻t(i)欄に実際に登録されるブロッブ包摂図形B(i)とは異なるものである。
【0235】
<7−2:マスキング処理時のブロッブ包摂図形の拡張修正>
上述した§7−1では、ノイズブロッブ包摂図形を低減させるために、マスキング処理時にブロッブ包摂図形の位置を修正する方法を述べたが、ここで述べる方法は、同じ目的のために、ブロッブ包摂図形の大きさを拡張修正する方法である。
【0236】
この方法を採用する場合、マスキング処理部140は、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形に対して、輪郭線を所定量だけ外方へ拡張する修正を施し、拡張修正後の図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにすればよい。
【0237】
図38は、このような拡張修正の具体例を示す平面図である。図38(a) は、図26(a) と同様に、個別動体識別画像M(30,1)を示す平面図である。ここで、ブロッブ包摂図形B29b,B29c,B29dは、マスクとなるブロッブ包摂図形であり、前述したとおり、これらのマスクから動体の一部が食み出した状態となっている。上述した§7−1では、マスクの位置を修正することにより、この食み出し状態を解消するアプローチが採られたが、ここでは、マスクを広げることにより、食み出し部分まで隠蔽するアプローチが採られる。すなわち、図に破線で示す矩形B29b′,B29c′,B29d′は、ブロッブ包摂図形B29b,B29c,B29dとなる矩形に対して、輪郭線を所定量だけ外方へ拡張する修正を施して得られる拡張修正後のマスク図形である。
【0238】
このような拡張修正後のマスク図形を用いたマスキング処理が施された個別動体識別画像M(30,1)からブロッブ包摂図形抽出処理を行うと、図38(b) に示すように、合計3組の候補ブロッブ包摂図形B30a−1,B30a−3,B30a−4が抽出される。この図38(b) を図26(b) と比較すると、候補ブロッブ包摂図形B30a−2は消滅し、候補ブロッブ包摂図形B30a−3,B30a−4の面積は縮小していることがわかる。すなわち、ノイズブロッブ包摂図形を低減する効果が得られたことになる。もちろん、このような拡張修正と、§7−1で述べた位置修正とを併用してもよい。
【0239】
<7−3:マスキング処理時のブロッブ包摂図形の取捨選択>
本発明において、マスキング処理部140によるマスキング処理により、個別動体識別画像を作成する理由は、複数の動体が交差した場合の問題を解決するためである。したがって、他の動体と重なりを生じていない動体については、必ずしもマスキングによる隠蔽を行う必要はない。
【0240】
たとえば、図26(a) に示す例の場合、動体O1(馬)についてのブロッブ包摂図形が登録されている着目トラッカーT1用の個別動体識別画像M(30,1)を生成するために、ブロッブ包摂図形B29b(人),ブロッブ包摂図形B29c(車),ブロッブ包摂図形B29d(鳥)を用いたマスキングを行っている。しかしながら、この例の場合、時刻t30において、動体O1(馬),動体O2(人),動体O3(車)は重なりを生じているが、動体O4(鳥)は重なりを生じていない。したがって、動体O4(鳥)については、ブロッブ包摂図形B29d(鳥)を用いたマスキング処理による隠蔽を行わなくても支障は生じない。すなわち、図26(b) に示す例において、ブロッブ包摂図形B30a−4の代わりに、動体O4(鳥)の全体に対応するブロッブ包摂図形が候補ブロッブ包摂図形として残っていたとしても、後続ブロッブ包摂図形として選択される候補がブロッブ包摂図形B30a−1(馬)であることに変わりはない。
【0241】
このような点を考慮すれば、マスキング処理部140によるマスキング処理には、必ずしも着目外トラッカーに登録されているすべてのブロッブ包摂図形を用いる必要はないことがわかる。たとえば、マスキング処理部140が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形のうち、着目トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形の所定の近傍範囲内に位置するブロッブ包摂図形のみを用いて、マスキングを行うようにしてもかまわない。
【0242】
図26(a) に示す例の場合、動体O1(馬)についてのブロッブ包摂図形が登録されている着目トラッカーT1用の個別動体識別画像M(30,1)を生成する際に、着目外トラッカーT2〜T4の時刻t29欄に登録されているブロッブ包摂図形のうち、着目トラッカーT1の時刻t29欄に登録されているブロッブ包摂図形B29a(馬)の所定の近傍範囲内に位置するブロッブ包摂図形B29b(人)およびB29c(車)のみを用いて、マスキングを行うようにしてもかまわない。この場合、ブロッブ包摂図形B29d(鳥)によるマスキングは行われないことになる。
【0243】
<7−4:後続ブロッブ包摂図形登録時の大きさ修正>
一般に、同一の動体に基づいて抽出されたブロッブ包摂図形は、その大きさが急激に、あるいは極端に変化することはないと考えられる。図36や図37に例示したブロッブ包摂図形の変遷において、個々のブロッブ包摂図形が同一サイズの矩形で示されているのは、このような考え方に基づくものである。
【0244】
しかしながら、人,馬,鳥のような動物は、絶えず形態を変えながら移動する動体であるから、抽出したブロッブ包摂図形を時系列的に並べれば、少なからず大きさの変化が生じることになる。また、車のような動体であっても、向きを変えたり、カメラに対して近付いたり遠ざかったりすれば、ブロッブ包摂図形に大きさの変化が生じることになる。
【0245】
図39(a) は、同一の動体から抽出したブロッブ包摂図形を時系列的に並べた結果、大きさの変化が生じた例を示した平面図である。ここでは、動体の移動経路が破線で示すとおり直線であるものとし、各ブロッブ包摂図形の中心点が、この破線に沿って左から右へと移動するものとしよう。図示のブロッブ包摂図形B1〜B7は、同一の動体に基づいて、それぞれ時刻t1〜t7の時点で抽出されたブロッブ包摂図形であり、説明の便宜上、大きさの時間的な変化を誇張して描いてある。
【0246】
このようなブロッブ包摂図形B1〜B7は、同一の動体の外接矩形として抽出されたものであるから、当該動体の画像上に示す領域を示す情報としては正しい情報になる。しかしながら、トラッカー上にこのようなブロッブ包摂図形B1〜B7の並びが登録された場合、これらのブロッブ包摂図形に基づいて、各原画像上から部分画像を切出して、当該動体をズームアップした状態で追跡する動画提示を行うと、ズームアップの倍率がブロッブ包摂図形B1〜B7の大きさの変動に応じて変動するという弊害が生じる。
【0247】
たとえば、図7の下段に示すズームアップ画像では、ブロッブ包摂図形B30とブロッブ包摂図形B40の大きさが等しいため、ズームアップの倍率は一定になる。したがって、動体(車)をズームアップした状態で追跡するような動画提示を行っても違和感は生じない。ところが、図39(a) に示すように、大きさが変動するブロッブ包摂図形B1〜B7に基づいて、動体をズームアップした追跡を行うと、画面上で動体のサイズが変動することになり、非常に見にくい動画にならざるを得ない。
【0248】
このような問題を解決するには、図39(a) に示すブロッブ包摂図形B1〜B9を、トラッカーに後続ブロッブ包摂図形として登録する際に、大きさについての修正を施して、たとえば図39(b) に示すようなブロッブ包摂図形B1′〜B9′とし、これら修正後のブロッブ包摂図形をトラッカー上に登録するようにすればよい。
【0249】
具体的には、トラッカー登録部160が、後続ブロッブ包摂図形登録処理において第j番目のトラッカーTjについての後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形の大きさが、連続して先行登録されている所定数のブロッブ包摂図形の平均サイズとなるように、当該後続ブロッブ包摂図形の大きさに対する修正を行うようにすればよい。たとえば、ブロッブ包摂図形B1が先頭ブロッブ包摂図形(新参ブロッブ包摂図形)の場合、ブロッブ包摂図形B1についてはそのままの大きさで登録し、これに続く後続ブロッブ包摂図形B2については、ブロッブ包摂図形B1,B2の平均サイズとなるような修正を加えて登録し、更に続く後続ブロッブ包摂図形B3については、ブロッブ包摂図形B1〜B3の平均サイズとなるような修正を加えて登録する、と言った具合である。予め、過去n個分のブロッブ包摂図形の平均サイズとなるような修正を加える、というように定めておけば、動体の緩やかな大きさ変動には追従することができる。なお、図39(b) に示すブロッブ包摂図形B1′〜B9′は、いずれも同じ大きさになっており、上記方法で得られたブロッブ包摂図形を示すものではない。
【0250】
<7−5:ブロッブ包摂図形抽出部の動体認識>
ブロッブ包摂図形抽出部170によるブロッブ包摂図形抽出処理の具体な方法は、図32の流れ図を参照しながら説明したとおりであり、図34には、当該方法によるブロッブ包摂図形抽出のプロセスの実例を示した。このブロッブ包摂図形抽出処理は、動体識別画像Mに基づいて、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)を動体と認識し、当該画素集団の外接矩形を抽出する処理であるが、実際には、動体識別画像M上の前景領域Fが、必ずしも動体が存在する領域であるとは限らない。
【0251】
動体識別画像Mは、図5に示すように、原画像P(i)上の画素と背景画像A(i−1)上の画素との類否判定によって生成される画像であるため、本来は背景領域Kに所属する画素であっても、何らかの要因によって非類似と判定されると、前景領域Fに所属する画素になってしまう。たとえば、樹木の葉などに風が作用すると、光の反射状態が変動するため、前景領域Fと判定される可能性がある。また、海,川,池などを含む背景では、水面の変動が前景領域Fと判定される可能性もある。
【0252】
そこで、実用上は、ブロッブ包摂図形抽出部170が、面積が所定の基準に満たない画素集団については、動体と認識せず、ブロッブ包摂図形の抽出を行わないようにするのが好ましい。一般に、画面上で動体として認識して追跡対象にしたい物体は、画面上である程度の大きさをもっている物と考えられるので、面積が所定の基準に満たない画素集団については、動体と認識しなくても支障は生じない。そして、このように小面積の画素集団をブロッブ包摂図形として抽出しないことにより、候補ブロッブ包摂図形の数を低減し、演算負担を軽減することができるようになる。
【0253】
<7−6:ブロッブ包摂図形を構成する図形のバリエーション>
これまで述べてきた実施形態では、ブロッブ包摂図形抽出部170が、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)の外接矩形をブロッブ包摂図形として抽出しているが、ブロッブ包摂図形は、必ずしもブロッブの外接矩形である必要はない。たとえば、外接円や外接三角形など、任意形状の外接図形をブロッブ包摂図形として抽出してもかまわない。また、これまで述べてきた実施形態では、外接矩形として、画素配列の縦横方向に平行な四辺をもった矩形(いわゆる正則な四角形)を用いているが、もちろん、ブロッブ包摂図形として抽出する矩形は、必ずしも正則な四角形である必要はない。
【0254】
また、ブロッブ包摂図形として抽出する図形は、必ずしも前景領域F(ブロッブ)に接する図形(外接図形)である必要はない。たとえば、外接図形をひとまわり大きくした図形をブロッブ包摂図形として抽出するようにしてもかまわない。もちろん、前景領域F(ブロッブ)の細かな輪郭形状をそのまま示す図形をブロッブ包摂図形として抽出してもよい。要するに、本発明を実施するにあたり、ブロッブ包摂図形は、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)の大まかな輪郭を示すものであれば、任意の図形によって構成することができる。
【0255】
要するに、本願にいう「ブロッブ包摂図形」には、様々な形状をもった図形を用いることができ、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)に外接する任意形状の図形や、これらの図形を外方に拡張して得られる任意形状の図形 などを広く利用することができる。ただ、実用上は、これまで述べてきた実施形態のように、正則な四角形からなる外接矩形を「ブロッブ包摂図形」として用いるのが好ましい。正則な四角形からなる外接矩形をブロッブ包摂図形として利用すれば、図13に示すように、対角2頂点の座標値によってのみ定義することができ、また、内部の画像を切出すような演算負担も軽くなる。
【0256】
<<< §8.本発明の基本的な技術思想 >>>
これまで本発明を基本的な実施形態およびその変形例について説明してきたが、ここでは、本発明の基本的な技術思想をまとめておく。
【0257】
まず、本発明に係る動体追跡装置は、動画画像について動体を検出し、これを追跡する機能をもった装置であり、その基本構成は、図31のブロック図に示すとおりである。
【0258】
すなわち、この動体追跡装置は、時系列で連続する複数の原画像P(i)からなる動画画像を入力する画像入力部110と、動画画像の背景を構成する背景画像を提供する背景画像提供部120と、第i番目の原画像P(i)と背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部130と、同一の動体と推定される画素集団の包摂図形からなるブロッブ包摂図形を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部150と、このトラッカー格納部150に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体を示すブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理部140と、マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出部170と、トラッカー格納部150に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体を示す先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体を示すブロッブ包摂図形を、着目動体以外の動体を示すブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から選択し、これをトラッカー格納部150に、先行ブロッブ包摂図形に後続する第i番目の時系列の後続ブロッブ包摂図形として登録するとともに、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形の登録が行われていない新参ブロッブ包摂図形を、第i番目の時系列が未登録状態のトラッカーに、先頭ブロッブ包摂図形として登録するトラッカー登録部と、によって構成されることになる。
【0259】
ここで、トラッカー登録部160は、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、第i番目の時系列の後続ブロッブ包摂図形として登録されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とする。
【0260】
一方、本発明は、動画画像について動体を検出し、これを追跡する動体追跡方法として把握することも可能である。図40は、この動体追跡方法の手順を示す流れ図である。
【0261】
図示のとおり、この動体追跡方法は、コンピュータが、時系列で連続する複数の原画像P(i)からなる動画画像を入力する画像入力段階S10と、コンピュータが、動画画像の背景を構成する背景画像と、第i番目の原画像P(i)とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成段階S20と、コンピュータが、第(i−1)番目の原画像P(i−1)内に含まれる着目動体の輪郭を包摂する先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体の輪郭を包摂する後続ブロッブ包摂図形を認識するとともに、第i番目の原画像P(i)において新たに出現した動体の輪郭を包摂する新参ブロッブ包摂図形を認識する後続/新参ブロッブ包摂図形認識段階S30と、を有している。
【0262】
ここで、後続/新参ブロッブ包摂図形認識段階S30は、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体の輪郭を包摂するブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理ステップS31と、マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の輪郭を包摂する図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出ステップS32と、着目動体以外の動体を包摂するブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から、着目動体の輪郭を包摂する先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形を後続ブロッブ包摂図形として選択する後続ブロッブ包摂図形選択ステップS33と、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形が認識されていない新参ブロッブ包摂図形を、新たな動体の輪郭を包摂する新参ブロッブ包摂図形として認識する新参ブロッブ包摂図形認識ステップS34と、によって構成されている。
【0263】
また、後続ブロッブ包摂図形選択ステップS33では、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形を選択する処理が行われ、新参ブロッブ包摂図形認識ステップS34では、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形として認識されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とする処理が行われる。
【0264】
<<< §9.監視システムへの応用 >>>
最後に、本発明に係る動体追跡装置を監視システムに応用した実施形態を、図41に示すブロック図を参照しながら説明する。この監視システムは、図31に示す動体追跡装置に、ビデオカメラ210と部分動画提示部220とを付加したものである。
【0265】
ここで、ビデオカメラ210は、定点に設置され、周囲の動画画像を撮影して画像入力部110に与える構成要素である。一方、部分動画提示部220は、トラッカー格納部150から、1つの選択トラッカーに連続して登録されているブロッブ包摂図形B(i)を順次取り出し、画像入力部110が入力した原画像P(i)から、取り出したブロッブ包摂図形B(i)の内部の画像を切出して表示することにより、特定の動体を追跡した部分動画画像を提示する構成要素である。
【0266】
たとえば、図24に示すようなトラッカー情報がトラッカー格納部150に格納されている場合に、ユーザが、部分動画提示部220に対して、トラッカーT1を選択する指示を与えると、部分動画提示部220は、トラッカーT1の先頭から、ブロッブ包摂図形B1a,B2a,B3a,... ,B40aを順次取り出し、これらのブロッブ包摂図形に基づいて、それぞれ原画像P1,P2,P3,... ,P40から各ブロッブ包摂図形内を含む部分画像の切出しを行い提示する処理を行う。その結果、画面上には、動体O1(馬)をズームアップして追跡する動画が表示されることになる。
【0267】
もちろん、ビデオカメラ210がリアルタイムで撮影した動画画像に基づいて、所定の動体追跡を行うことも可能である。この場合、トラッカー格納部150内には、リアルタイムで各時刻欄のブロッブ包摂図形が登録されてゆくので、部分動画提示部220は、選択トラッカーについてブロッブ包摂図形の登録が行われたその時点で、当該ブロッブ包摂図形を取り出して部分画像の切出処理を行うことになる。
【0268】
なお、通常は、画像を表示するディスプレイ画面のアスペクト比とブロッブ包摂図形のアスペクト比とは異なっているため、部分動画提示部220は、ブロッブ包摂図形B(i)を所定量だけ外方へ拡張し、拡張された包摂図形の内部の画像を切出して表示するようにすればよい。たとえば、図7に示す例の場合、ブロッブ包摂図形B30,B40を構成する矩形(太線で示す矩形)のアスペクト比と、表示画面のアスペクト比とが異なっているため、ブロッブ包摂図形B30,B40を構成する矩形を所定量だけ外方へ拡張し、拡張された矩形(部分画像f30,f40の輪郭)の内部の画像が切出されている。こうすることにより、追跡対象となる動体が、画面内に常に正しく表示された状態でのズームアップ表示が可能になる。
【符号の説明】
【0269】
110:画像入力部
120:背景画像提供部
130:動体識別画像生成部
140:マスキング処理部
150:トラッカー格納部
160:トラッカー登録部
170:ブロッブ包摂図形抽出部
210:ビデオカメラ
220:部分動画提示部
A,Aa,Ab,Ac:ブロッブ包摂図形の面積
A(i−1),A(i):背景画像(平均画像)
a(i−1),a(i):背景画像を構成する1つの画素もしくはその画素値
B,B1〜B7,B1′〜B7′:ブロッブ包摂図形
B30〜B40:ブロッブ包摂図形
B10a〜B10d:ブロッブ包摂図形
B20a〜B20d:ブロッブ包摂図形
B29a〜B29d:ブロッブ包摂図形
B30a〜B30g:ブロッブ包摂図形
B30a−1〜B30a−5:ブロッブ包摂図形
B40a〜B40e:ブロッブ包摂図形
B(i−4)〜B(i−1):ブロッブ包摂図形
B1(i−1)〜Bj(i−1):ブロッブ包摂図形
B1(i)〜Bj(i):ブロッブ包摂図形
B(i)a,B(i)b,B(i)c:ブロッブ包摂図形
B(i)′:ブロッブ包摂図形の予測位置
B29b′,B29c′,B29d′:拡張修正後のマスク図形
C:二次曲線
F,F20〜F40,F(i):前景領域
F10a〜F10d:前景領域
F20a〜F20d:前景領域
F30a〜F30d:前景領域
F40a〜F40e:前景領域
f30,f40:部分画像
h,ha,hb,hc:ブロッブ包摂図形の横寸法
K,K10〜K40,K(i):背景領域
M10〜M40,M(i):動体識別画像
M(i,j),M30a〜M30d:個別動体識別画像
m(i):動体識別画像を構成する1つの画素もしくはその画素値
O1〜O5:動体
P(1)〜P(i):原画像(動画を構成する個々の静止画像)
P10〜P40:原画像(動画を構成する個々の静止画像)
p(i):原画像を構成する1つの画素もしくはその画素値
Q1(x1,y1),Q2(x2,y2):矩形の頂点座標
Q,Qa〜Qc:ブロッブ包摂図形の位置の基準点
R0〜R4:ブロッブ包摂図形の位置の基準点
S1〜S7,S10〜S33:流れ図のステップ
T1〜T6,Tj:トラッカー
t10〜t40,t(i−1),t(i):時刻
v,va,vb,vc:ブロッブ包摂図形の縦寸法
w:重みを示すパラメータ
【技術分野】
【0001】
本発明は、時系列で連続して与えられる静止画像の集合からなる動画について、複数の動体を検出し、これを画面上で追跡する動体追跡装置に関する。
【背景技術】
【0002】
ビデオカメラを用いた監視システムなどでは、監視領域内に存在する動体(移動物体)を自動的に検出し、これを追跡する技術が重要になってきている。動体の自動検出が可能になれば、当該物体が車両であるのか、人間であるのか、といった識別を行う処理に利用することができる。更に、検出した動体を追跡することができれば、所望の動体をズームアップして追尾することも可能になり、不審者などを監視する用途に利用できる。
【0003】
動体検出に利用されている最も一般的な手法は、時系列で連続的に与えられるフレーム単位の原画像を、予め用意した背景画像と比較し、両者の差分を求めることにより、時間的に変化している領域を認識する方法である。たとえば、下記の非特許文献1には、原画像と背景画像とを画素単位で比較して、当該画素が動体を構成する画素であるか否かを判定する手法が開示されている。具体的には、比較対象となる両画素の画素値が類似している場合、当該画素は背景を構成する画素であるとし、類似していない場合、当該画素は動体を構成する画素であるとする判定が行われる。このとき、画素の類否判定は、カラー画像の場合、三次元の色空間上で、双方の画素値に対応する座標点をプロットし、一方の座標点が他方の座標点の近傍領域に入っているか否かを調べることにより行われる。
【0004】
また、下記の特許文献1には、フレーム単位の入力画像をブロックに分割し、個々のブロックごとに画素値の平均値を求め、背景画像の画素値平均と比較することにより、当該ブロックが移動物体を含むか否かを判定する手法が開示されており、特許文献2には、背景画像との差分を求める手法と、テンプレートマッチングを行う手法とを適宜切り替えることにより、照明変動が生じても正確な動体検出を行う方法が提案されている。一方、特許文献3には、複数のカメラを用いた撮影を行うことにより、動体追跡を行う装置が提案されている。
【0005】
更に、特許文献4には、検出した動体の色特徴量を算出し、この色特徴量を用いて動体追跡を行う方法が開示されており、特許文献5には、原画像をサブ区画に分割し、隣接するサブ区画同士の関係度の近似性に基づいて動体追跡を行う方法が開示されている。また、特許文献6には、過去の複数フレームにおける動体の位置から現時点の動体の位置を予測し、予測位置に最も近い動体候補を追跡対象とする方法が開示され、特許文献7には、複数の動体の移動経路が交差した場合にも、これら複数の動体を支障なく追跡する技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平7−302328号公報
【特許文献2】特開2011−60167号公報
【特許文献3】特開2007−142527号公報
【特許文献4】特開2000−48211号公報
【特許文献5】特開2007−287006号公報
【特許文献6】特開2004−46647号公報
【特許文献7】特開2010−39580号公報
【非特許文献】
【0007】
【非特許文献1】Kim K, Chalidabhongse T H, Harwood D, Davis L S. "Background Modeling and Subtraction by Codebook Construction" Proceedings of International Conference on Image Processing, Singapore. IEEE, 2004. 5: 3061-3064
【発明の概要】
【発明が解決しようとする課題】
【0008】
監視システムなどの撮影視野内には、複数の動体が同時に存在することが少なくない。しかも、これら複数の動体はそれぞれが任意の方向に移動しているため、移動経路が画面上で交差する場合がある。従来提案されている動体追跡装置の多くは、このように複数の動体が交差した場合に、正確な追跡を行うことができない。これは、複数の物体の移動経路が交差すると、画面上では、交差時点で複数の物体が、ひとかたまりの物体に融合し、その後、元通りの複数の物体に分離することになるため、個々の物体を正しく認識することができなくなるためである。
【0009】
前掲の特許文献7には、玄関に設置されたカメラ付きインターホンの撮影画像において、人や車などの動体が重なって写った場合にも、個々の動体を適切に追跡する技術が開示されている。この技術では、複数の動体を追跡する際に、動体同士が交差しているか否かの判定を行い、交差していると判定された場合には、重なり合った複数の動体の奥行き関係を認識して、正しい追跡を行う手法が採られる。しかしながら、動体同士の交差を判定する処理や、奥行き関係を把握する処理のために、複雑なプロセスが必要になり、また、様々な状況において常に正確な処理を行うことは困難である。
【0010】
そこで本発明は、複数の動体が交差した場合にも、効率的かつ正確に個々の動体を追跡することが可能な動体追跡装置を提供することを目的とする。
【課題を解決するための手段】
【0011】
(1) 本発明の第1の態様は、動画画像について動体を検出し、これを追跡する動体追跡装置において、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
第i番目の動体識別画像M(i)に基づいて、前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形を第i番目の時系列に所属するブロッブ包摂図形B(i)として抽出するブロッブ包摂図形抽出部と、
同一の動体に基づいて抽出されたと推定される複数のブロッブ包摂図形を先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
ブロッブ包摂図形抽出部によって抽出された第i番目の時系列に所属するブロッブ包摂図形B(i)を、第j番目のトラッカーTj(但し、jはトラッカーの番号を示す自然数)の第i番目の時系列に所属するメンバーとして、トラッカー格納部に登録するトラッカー登録部と、
動体識別画像生成部が生成した動体識別画像の前景領域に対して、トラッカー格納部に格納されている特定のブロッブ包摂図形を利用したマスキングを行うマスキング処理部と、
を設け、
マスキング処理部は、トラッカー格納部に格納されている第j番目のトラッカーTjを着目トラッカーとして、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことにより、着目トラッカーTj用の個別動体識別画像M(i,j)を生成し、これをブロッブ包摂図形抽出部に提供するようにし、
ブロッブ包摂図形抽出部には、動体識別画像M(i)に基づいてブロッブ包摂図形B(i)を抽出する機能に加えて、個別動体識別画像M(i,j)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、動体と認識した画素集団の包摂図形を第i番目の時系列に所属させるべき第j番目のトラッカー用の候補ブロッブ包摂図形として抽出する機能を付加し、
トラッカー登録部が、
(a) 第j番目のトラッカーTjの第(i−1)番目の時系列に末尾ブロッブ包摂図形ではないブロッブ包摂図形が登録されている場合に、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、これに後続させるのに適したブロッブ包摂図形が第j番目のトラッカー用の候補ブロッブ包摂図形内に存在するか否かを判定し、存在するときには、当該候補ブロッブ包摂図形を第i番目の時系列に所属する後続ブロッブ包摂図形として登録する処理を行い、存在しないときには、先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示す処理を行う後続ブロッブ包摂図形登録処理と、
(b) 後続ブロッブ包摂図形登録処理を各トラッカーについて行った後、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)の中に、後続ブロッブ包摂図形登録処理によって登録された後続ブロッブ包摂図形に対応しない新参ブロッブ包摂図形が存在する場合に、当該新参ブロッブ包摂図形を第i番目の時系列が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録する新参ブロッブ包摂図形登録処理と、
を行うようにしたものである。
【0012】
(2) 本発明の第2の態様は、上述した第1の態様に係る動体追跡装置において、
背景画像提供部が、外部から与えられた静止画像を取り込んで保存する機能を有し、静止画像を背景画像として提供するようにしたものである。
【0013】
(3) 本発明の第3の態様は、上述した第1の態様に係る動体追跡装置において、
背景画像提供部が、画像入力部が過去の所定期間にわたって入力した原画像の単純平均もしくは重みづけ平均を求める機能を有し、求めた平均画像を背景画像として提供するようにしたものである。
【0014】
(4) 本発明の第4の態様は、上述した第1〜第3の態様に係る動体追跡装置において、
動体識別画像生成部が、原画像P(i)上の特定位置にある画素の色と、背景画像上の上記特定位置にある画素の色とを比較し、両画素の色の近似度が所定条件を満たす場合には当該特定位置にある画素を背景領域の画素とし、所定条件を満たさない場合には当該特定位置にある画素を前景領域の画素とすることにより、動体識別画像M(i)を生成するようにしたものである。
【0015】
(5) 本発明の第5の態様は、上述した第1〜第4の態様に係る動体追跡装置において、
ブロッブ包摂図形抽出部が、面積が所定の基準に満たない画素集団については、動体と認識せず、ブロッブ包摂図形の抽出を行わないようにしたものである。
【0016】
(6) 本発明の第6の態様は、上述した第1〜第5の態様に係る動体追跡装置において、
ブロッブ包摂図形抽出部が、画素集団の外接矩形をその包摂図形として用いるようにしたものである。
【0017】
(7) 本発明の第7の態様は、上述した第6の態様に係る動体追跡装置において、
ブロッブ包摂図形抽出部が、動体識別画像M(i)を構成する個々の画素に順に着目し、各着目画素について、
(a) 着目画素が前景画素であり、かつ、所定近傍範囲に登録矩形が存在しない場合には、当該着目画素の輪郭を構成する矩形を登録する処理を行い、
(b) 着目画素が前景画素であり、かつ、所定近傍範囲に登録された矩形が存在する場合には、当該登録矩形の領域を着目画素を含む外接矩形に拡張して登録する処理を行い、
最終的に登録された矩形に基づいてブロッブ包摂図形の抽出を行うようにしたものである。
【0018】
(8) 本発明の第8の態様は、上述した第6または第7の態様に係る動体追跡装置において、
トラッカー格納部が、外接矩形の対角に位置する2頂点の座標値をトラッカーの情報として格納するようにしたものである。
【0019】
(9) 本発明の第9の態様は、上述した第1〜第8の態様に係る動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形のうち、着目トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形の所定の近傍範囲内に位置するブロッブ包摂図形のみを用いて、マスキングを行うようにしたものである。
【0020】
(10) 本発明の第10の態様は、上述した第1〜第9の態様に係る動体追跡装置において、
マスキング処理部が、各トラッカーに格納されている第(i−1)番目以前の連続した時系列に所属するブロッブ包摂図形の位置の変遷に基づいて、第i番目の時系列に所属するブロッブ包摂図形の予測位置を求める機能を有し、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、予測位置への位置修正を施し、位置修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにしたものである。
【0021】
(11) 本発明の第11の態様は、上述した第10の態様に係る動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは2以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)の位置の基準点から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)の位置の基準点へ向かうベクトルに対して、その長さを(L/(L−1))倍に伸ばすことにより得られるベクトルの先端を予測位置の基準点とするようにしたものである。
【0022】
(12) 本発明の第12の態様は、上述した第10の態様に係る動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは3以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)まで、合計L個のブロッブ包摂図形の各位置の基準点を近似的に通る二次曲線を求め、この二次曲線上の点を予測位置の基準点とするようにしたものである。
【0023】
(13) 本発明の第13の態様は、上述した第1〜第12の態様に係る動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、輪郭線を所定量だけ外方へ拡張する修正を施し、拡張修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにしたものである。
【0024】
(14) 本発明の第14の態様は、上述した第1〜第13の態様に係る動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理を行う際に、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に対して、第j番目のトラッカー用として抽出された個々の候補ブロッブ包摂図形の適合性評価を行い、所定の基準以上の評価、かつ、最も高い評価を得た候補ブロッブ包摂図形を、先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形と判定し、これを後続ブロッブ包摂図形として登録するようにしたものである。
【0025】
(15) 本発明の第15の態様は、上述した第14の態様に係る動体追跡装置において、
トラッカー登録部が、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて適合性評価を行うようにしたものである。
【0026】
(16) 本発明の第16の態様は、上述した第1〜第15の態様に係る動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理で、第j番目のトラッカーTjについての後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形の大きさが、連続して先行登録されている所定数のブロッブ包摂図形の平均サイズとなるように、当該後続ブロッブ包摂図形の大きさに対する修正を行うようにしたものである。
【0027】
(17) 本発明の第17の態様は、上述した第1〜第16の態様に係る動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理において、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形が、第j番目のトラッカー用の候補ブロッブ包摂図形内に存在しない場合に、第j番目のトラッカーTjの第i番目の時系列を無登録状態とする処理を行うことにより、先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示すようにしたものである。
【0028】
(18) 本発明の第18の態様は、上述した第1〜第17の態様に係る動体追跡装置において、
トラッカー登録部が、新参ブロッブ包摂図形登録処理を行う際に、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)と、後続ブロッブ包摂図形登録処理によって第i番目の時系列に登録された後続ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、ブロッブ包摂図形B(i)の中で対応関係が認識できないブロッブ包摂図形を新参ブロッブ包摂図形とするようにしたものである。
【0029】
(19) 本発明の第19の態様は、動画画像について動体を検出し、これを追跡する動体追跡装置において、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
同一の動体と推定される画素集団の包摂図形からなるブロッブ包摂図形を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体を示すブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理部と、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出部と、
トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体を示す先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体を示すブロッブ包摂図形を、着目動体以外の動体を示すブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から選択し、これをトラッカー格納部に、先行ブロッブ包摂図形に後続する第i番目の時系列の後続ブロッブ包摂図形として登録するとともに、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形の登録が行われていない新参ブロッブ包摂図形を、第i番目の時系列が未登録状態のトラッカーに、先頭ブロッブ包摂図形として登録するトラッカー登録部と、
を設けたものである。
【0030】
(20) 本発明の第20の態様は、上述した第19の態様に係る動体追跡装置において、
トラッカー登録部が、
先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、第i番目の時系列の後続ブロッブ包摂図形として登録されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とするようにしたものである。
【0031】
(21) 本発明の第21の態様は、上述した第1〜第20の態様に係る動体追跡装置を、コンピュータに専用のプログラムを組み込むことにより構成したものである。
【0032】
(22) 本発明の第22の態様は、上述した第1〜第20の態様に係る動体追跡装置に加えて、更に、
動画画像を撮影して画像入力部に与えるビデオカメラと、
トラッカー格納部から、1つの選択トラッカーに連続して登録されているブロッブ包摂図形B(i)を順次取り出し、画像入力部が入力した原画像P(i)からブロッブ包摂図形B(i)の内部の画像を切出して表示することにより、特定の動体を追跡した部分動画画像を提示する部分動画提示部と、
を設けることにより、監視システムを構成したものである。
【0033】
(23) 本発明の第23の態様は、上述した第22の態様に係る監視システムにおいて、
部分動画提示部が、ブロッブ包摂図形B(i)を所定量だけ外方へ拡張し、拡張された包摂図形の内部の画像を切出して表示するようにしたものである。
【0034】
(24) 本発明の第24の態様は、動画画像について動体を検出し、これを追跡する動体追跡方法において、
コンピュータが、時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力段階と、
コンピュータが、動画画像の背景を構成する背景画像と、第i番目の原画像P(i)とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成段階と、
コンピュータが、第(i−1)番目の原画像P(i−1)内に含まれる着目動体の輪郭を包摂する先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体の輪郭を包摂する後続ブロッブ包摂図形を認識するとともに、第i番目の原画像P(i)において新たに出現した動体の輪郭を包摂する新参ブロッブ包摂図形を認識する後続/新参ブロッブ包摂図形認識段階と、
を行い、
後続/新参ブロッブ包摂図形認識段階では、
第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体の輪郭を包摂するブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理ステップと、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の輪郭を包摂する図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出ステップと、
着目動体以外の動体を包摂するブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から、着目動体の輪郭を包摂する先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形を後続ブロッブ包摂図形として選択する後続ブロッブ包摂図形選択ステップと、
マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形が認識されていない新参ブロッブ包摂図形を、新たな動体の輪郭を包摂する新参ブロッブ包摂図形として認識する新参ブロッブ包摂図形認識ステップと、
を行うようにしたものである。
【0035】
(25) 本発明の第25の態様は、上述した第24の態様に係る動体追跡方法において、
後続ブロッブ包摂図形選択ステップで、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
新参ブロッブ包摂図形認識ステップで、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形として認識されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とするようにしたものである。
【発明の効果】
【0036】
本発明に係る動体追跡装置では、複数の動体のうち、ある1つの着目動体を時間軸上で継承する動体を検出する際に、当該着目動体以外の動体が存在していた領域をマスキングする方法を採るようにしたため、複数の動体が交差した場合にも、効率的かつ正確に個々の動体を追跡することが可能になる。
【図面の簡単な説明】
【0037】
【図1】動画画像についての動体の検出例を示す平面図である。
【図2】一般的な動体検出の基本原理を示す図である。
【図3】背景を示す画像として用いられる平均画像の作成方法の一例を示す図である。
【図4】図3に示す方法に基づいて作成される平均画像上の1画素の画素値変遷プロセスを示す図である。
【図5】一般的な動体識別画像M(i)の画素値決定プロセスを示す図である。
【図6】図1に示す動体識別画像M30およびM40に基づいて、ブロッブ包摂図形B30,B40を抽出した例を示す平面図である。
【図7】図6に示すブロッブ包摂図形B30,B40を利用して、部分画像f30,f40を切出した状態を示す平面図である。
【図8】複数の動体が存在する原画像P10を示す平面図である(背景は省略)。
【図9】図8に示す原画像P10から作成された動体識別画像M10を示す平面図である。
【図10】時間軸上の時刻t10,t20,t40における原画像P10,P20,P40を示す平面図である。
【図11】図10に示す原画像P10,P20,P40から作成された動体識別画像M10,M20,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図12】図11に示す動体識別画像M10,M20,M40に基づいて作成されたトラッカーの一例を示す図である。
【図13】ブロッブ包摂図形Bの実体データを示す平面図である。
【図14】時系列上の時刻t20,t30,t40における原画像P20,P30,P40を示す平面図である。
【図15】図14に示す原画像P20,P30,P40から作成された動体識別画像M20,M30,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図16】図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの一例を示す図である。
【図17】図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの別な一例を示す図である。
【図18】時系列上の時刻t29,t30における原画像P29,P30を示す平面図である。
【図19】図18に示す原画像P29,P30から作成された動体識別画像M29,M30およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図20】図19(a) に示すブロッブ包摂図形B29a以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,1)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30aを示す平面図(図(b) )である。
【図21】図19(a) に示すブロッブ包摂図形B29b以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,2)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30bを示す平面図(図(b) )である。
【図22】図19(a) に示すブロッブ包摂図形B29c以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,3)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30cを示す平面図(図(b) )である。
【図23】図19(a) に示すブロッブ包摂図形B29d以外のブロッブ包摂図形によるマスキング処理を行うことにより得られた個別動体識別画像M(30,4)を示す平面図(図(a) )およびこれから抽出された候補ブロッブ包摂図形B30dを示す平面図(図(b) )である。
【図24】図20〜図23に示す候補ブロッブ包摂図形に基づいて、各トラッカーに後続ブロッブ包摂図形の登録を行った状態を示す図である。
【図25】各トラッカーT1〜T4について認識された後続ブロッブ包摂図形を動体識別画像M30に重ねた状態を示す平面図である。
【図26】図20に示すマスキング処理では完全なマスキングがなされなかった状態を示す平面図(図(a) )およびこの状態から抽出された候補ブロッブ包摂図形を示す平面図(図(b) )である。
【図27】時系列上の時刻t39,t40における原画像P39,P40を示す平面図である。
【図28】図27に示す原画像P39,P40から作成された動体識別画像M39,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。
【図29】図28に示すブロッブ包摂図形に基づいて作成されたトラッカーを示す図である。
【図30】図24の表の時刻t30の欄に登録された後続ブロッブ包摂図形と、図19(b) に示す動体識別画像M30上のブロッブ包摂図形と、の対応関係を示すテーブルである。
【図31】本発明の基本的な実施形態に係る動体追跡装置の構成を示すブロック図である。
【図32】図31に示す動体追跡装置におけるブロッブ包摂図形抽出部170によるブロッブ包摂図形抽出処理の手順の一例を示す流れ図である。
【図33】図32に示すブロッブ包摂図形抽出処理の処理対象となる画像の一例を示す平面図である。
【図34】図33に示す画像に対して、図32に示すブロッブ包摂図形抽出処理の手順を施したプロセスの各段階を示す平面図である。
【図35】図31に示す動体追跡装置におけるトラッカー登録部160による後続ブロッブ包摂図形の適合性評価の方法を示す平面図である。
【図36】図31に示す動体追跡装置におけるマスキング処理部140によって、マスクとして機能するブロッブ包摂図形に対する予測位置を求める方法の一例を示す平面図である。
【図37】図31に示す動体追跡装置におけるマスキング処理部140によって、マスクとして機能するブロッブ包摂図形に対する予測位置を求める方法の別な一例を示す平面図である。
【図38】図31に示す動体追跡装置におけるマスキング処理部140によるブロッブ包摂図形に対する拡張修正の一例を示す平面図である。
【図39】図31に示す動体追跡装置におけるトラッカー登録部160によるブロッブ包摂図形に対する大きさ修正の一例を示す平面図である。
【図40】本発明の基本概念に基づく動体追跡方法の手順を示す流れ図である。
【図41】本発明に係る動体追跡装置を利用して構成された監視システムの一例を示すブロック図である。
【発明を実施するための形態】
【0038】
以下、本発明を図示する実施形態に基づいて説明する。
【0039】
<<< §1.一般的な動体検出の基本原理 >>>
はじめに、一般的な動体検出の基本原理を説明する。この基本原理は、動画画像について動体(移動物体)を検出するためのものであり、ここでは、三原色の各画素値を有する画素の集合体として、時系列で連続的にフレーム単位のカラー原画像が与えられた場合を例にとって説明する。
【0040】
いま、図1の左側に示すように、フレーム単位の原画像P10,P20,P30,P40がこの順番で与えられたものとしよう。図示の例は、街頭に設置された定点ビデオカメラによる撮影画像を示すものであり、右から左へと1台の車両(動体)が通過する状態が示されている。なお、一般的なビデオカメラの場合、1秒間に30フレーム程度の周期で連続して撮影画像が出力されるので、実際には、より細かな時間間隔で多数のフレーム画像が得られることになるが、ここでは、説明の便宜上、図示のとおり、4枚の原画像P10,P20,P30,P40が順番に与えられた場合を考える。
【0041】
これら4枚の原画像を見ると、原画像P10は街の背景のみであるが、原画像P20では、右側に車両の一部が侵入したため、背景上に車両の一部が重なった画像になっている。同様に、原画像P30,P40も、背景上に車両が重なった画像になっている。背景は静止しているため、原画像P10〜P40について共通になるが、車両は動体であるため、原画像P10〜P40では異なる。ここでは、各画像上において、背景を構成する領域を背景領域K、車両(動体)を構成する領域を前景領域Fと呼ぶことにする。
【0042】
ここで行う動体検出の目的は、与えられた各原画像P10〜P40について、それぞれ背景領域Kと前景領域Fとを区別することにある。図1の右側に示す各画像M10〜M40は、それぞれ左側に示す各原画像P10〜P40について、背景領域Kと前景領域Fとの区別を示す画像であり、ここでは、動体識別画像M10〜M40と呼ぶことにする。この動体識別画像M10〜M40では、図にハッチングを施した領域が前景領域F(F20,F30,F40)であり、白地の領域が背景領域K(K10〜K40)である。これらの動体識別画像M10〜M40は、2つの領域を識別できればよいので、二値画像として与えられる。たとえば、前景領域Fに所属する画素には画素値「1」を与え、背景領域Kに所属する画素には画素値「0」を与えることにすれば、動体識別画像M10〜M40は、1ビットの画素値をもった画素の集合体からなる画像データとして用意することができる。
【0043】
後述する手法を採れば、与えられた個々のフレーム単位の原画像Pのそれぞれについて、対応する動体識別画像Mを二値画像として得ることができる。結局、ここで述べる動体検出処理の本質は、時系列で連続的に与えられた個々の原画像Pについて、それぞれ背景領域Kと前景領域Fとの区別を示す二値画像(動体識別画像M)を作成する処理ということができる。
【0044】
図1に示す例では、各原画像P10〜P40のそれぞれについて、動体識別画像M10〜M40が作成された例が示されている。これら動体識別画像を利用すれば、原画像上のどの領域が動体であるかを認識できるので、動体の形状やサイズを把握したり、動体の部分をズームアップして、車両のナンバーを確認したり、人物を特定したりする処理を行うことが可能になる。また、画面上で動体をズームアップしたまま追跡したり、移動経路を把握したりすることも可能になる。
【0045】
もちろん、このような動体識別画像の作成を、1枚の原画像のみから行うことは困難である。たとえば、図示の原画像P20のみが静止画像として与えられた場合、人間の脳は様々な情報から車両の存在を認識することができるが、この1枚の静止画像のみから、コンピュータに車両の存在を認識させるには、複雑なアルゴリズムに基づく処理が必要となる。そこで、一般的な動体検出アルゴリズムでは、既に述べたとおり、原画像と背景画像との差を求めることにより、当該差の領域を動体の領域(前景領域F)と判断する手法が採られる。
【0046】
たとえば、予め原画像P10を背景画像として指定しておけば、原画像P20が入力された時点で両者を比較することにより、差の領域(異なる領域)を前景領域Fと認識し、図示のような動体識別画像M20(背景領域K20と前景領域F20とを区別する画像)を作成することが可能になる。差の領域を認識するには、原画像と背景画像とを画素単位で比較して、両画素の画素値が類似している場合、当該画素は背景領域Kを構成する画素であるとし、類似していない場合、当該画素は前景領域Fを構成する画素であるとする方法が最も簡便な方法である。
【0047】
背景画像としては、予め動体が存在しない状態(たとえば、原画像P10に示す状態)で撮影した静止画像を利用することも可能であるが、屋外の場合、天候や時刻などの要因により、照明環境は時々刻々と変化してゆくものであり、ある特定の時点で撮影した静止画像をそのまま背景画像として継続して利用するのは不適切である。そこで、通常は、過去に入力された複数の原画像に基づいて、これら原画像の平均的な特徴を有する平均画像を作成し、この平均画像を背景画像として利用する手法が採られる。平均画像は新たな画像が入力されるたびに逐次更新されるので、天候や時刻などの要因により、照明環境が変化したとしても、当該変化に追随した適切な背景画像として機能する。
【0048】
図2は、一般的な動体検出の基本原理を示す図である。ここで、図の上段に示す原画像P(1),P(2),... ,P(i−2),P(i−1)は、時系列で連続的に与えられるフレーム単位の原画像であり、これまでに第1番目の原画像P(1)から第(i−1)番目の原画像P(i−1)まで、(i−1)フレーム分の画像が与えられた状態が示されている。一方、図の中段左に示す画像P(i)は、新たに与えられた第i番目の原画像であり、図の中段右に示す画像A(i−1)は、図の上段に示す過去に与えられた(i−1)フレーム分の原画像P(1)〜P(i−1)の平均的な特徴を有する平均画像である。
【0049】
新たに入力された原画像P(i)についての動体識別画像M(i)は、当該原画像P(i)と平均画像A(i−1)とを比較することによって作成される。図2の下段は、このようにして作成された動体識別画像M(i)を示すものである。具体的には、原画像P(i)上の各画素の画素値を、平均画像A(i−1)上の対応する画素の画素値と比較し、類似範囲内と判定された画素については背景領域K(i)を示す画素値(たとえば、「0」)を与え、類似範囲外と判定された画素については前景領域F(i)を示す画素値(たとえば、「1」)を与えることにより、二値画像からなる動体識別画像M(i)を作成すればよい。
【0050】
続いて、第(i+1)番目の原画像P(i+1)が入力されたときには、過去に入力された第i番目の原画像P(i)までの平均的な特徴を有する平均画像A(i)が新たに作成され、原画像P(i+1)と平均画像A(i)とを比較することにより、動体識別画像M(i+1)が作成される。このように、平均画像は逐次更新されてゆくため、天候や時刻などの要因により、照明環境が変化した場合でも、各時点に適した背景画像としての機能を果たすことができる。
【0051】
なお、平均画像を作成する際には、時系列に沿った重みづけを行うようにし、最新の原画像の情報に重みをおいた加重平均を求めるようにするのが好ましい。たとえば、過去10分間に入力された原画像について重み1、それ以前に入力された原画像について重み0を与えて平均を求めれば、常に、最新10分間に得られた原画像についての平均画像を得ることができ、照明環境が変化した場合にも対応することができる。もちろん、常に最新の原画像ほど重みづけが大きくなるように、重みづけをきめ細かく設定することもできる。
【0052】
結局、この図2に示す例の場合、平均画像A(i−1)を得るには、第1番目の原画像P(1)から第(i−1)番目の原画像P(i−1)について(i=1,2,...)、それぞれ対応する位置の画素の各色別の画素値の重みづけ平均値を算出し、当該平均値をもつ画素の集合体からなる画像を作成すればよい。そして、第i番目の原画像P(i)が入力されたときには、第i番目の動体識別画像M(i)を作成するために、原画像P(i)と平均画像A(i−1)とを比較すればよい。
【0053】
ただ、1秒間に30フレームという一般的なフレームレートで動画画像が入力された場合、過去10分間の原画像であっても、その画像データをすべて蓄積しておくには、画像データのバッファにかなりの記憶容量が必要になる。そこで、実用上は、第i番目の原画像P(i)が与えられたときに、第(i−1)番目の平均画像A(i−1)と、当該第i番目の原画像P(i)との2枚の画像に基づいて、第i番目の平均画像A(i)を作成する手法が採られる。図3は、このような手法に基づく平均画像の作成方法の一例を示す図である。
【0054】
まず、最初の原画像P(1)が与えられたときには、当該原画像P(1)をそのまま最初の平均画像A(1)とする処理を行う。そして、以後、図3の上段右に示す第i番目の原画像P(i)が入力されるたびに(i=2,3,...)、図3の上段左に示す第(i−1)番目の平均画像A(i−1)を利用して、図3の中段に示す第i番目の平均画像A(i)を、図3の下段に示す
a(i)=(1−w)・a(i−1)+w・p(i) 式(1)
なる演算式を用いて作成すればよい。ここで、a(i)は、平均画像A(i)の所定位置の画素の所定色の画素値、a(i−1)は、平均画像A(i−1)の前記所定位置の画素の前記所定色の画素値、p(i)は、原画像P(i)の前記所定位置の画素の前記所定色の画素値、wは、所定の重みを示すパラメータ(w<1)である。
【0055】
要するに、直前に与えられた原画像P(i−1)までの原画像について算出された第(i−1)番目の平均画像A(i−1)の画素値a(i−1)と、新たに与えられた第i番目の原画像P(i)の画素値p(i)とについて、重みwを考慮した平均値が算出され、当該算出値を第i番目の平均画像A(i)の画素値a(i)とする処理が行われることになる。このように、新たな原画像P(i)が入力されるたびに、平均画像A(i)を更新してゆき、しかも更新には直前の平均画像A(i−1)のみを用いるようにすれば、過去の原画像データを何フレーム分にもわたって蓄積保持しておく必要がないので、処理を行うために必要なバッファの容量を大幅に節約することができる。
【0056】
図3に示すとおり、重みwの値を大きくすればするほど、最新の原画像P(i)の画素値が平均画像A(i)の画素値に大きな影響を与えることになる。図4は、図3に示す方法に基づいて作成される平均画像上の1画素の画素値変遷プロセスを示す図である。この例では、重みw=0.01に設定した具体例が示されている。
【0057】
たとえば、第1番目(i=1)の原画像P(1)の特定位置の画素の画素値がp(1)=100であったとすると、第1番目の平均画像A(1)の当該特定位置の画素の画素値a(1)は、そのままa(1)=100となる。続いて、第2番目の原画像P(2)の当該特定位置の画素の画素値がp(2)=100であったとすると、第2番目の平均画像A(2)の当該特定位置の画素の画素値a(2)は、a(1)とp(2)との重みつき平均「0.99×100+0.01×100」を計算することにより、a(2)=100になる。
【0058】
図示の例では、原画像の当該特定位置の画素値は、p(1)〜p(4)まで100のまま変化しないため、平均画像の当該特定位置の画素値も、a(1)〜a(4)まで100を維持する。ところが、第5番目の原画像P(5)では、画素値p(5)=200に急変したため、第5番目の平均画像A(5)の画素値a(5)は、図4の下段の式に示すとおり、a(4)とp(5)との重みつき平均「0.99×100+0.01×200」を計算することにより、a(5)=101になる。更に、第6番目の原画像P(6)および第7番目の原画像P(7)では、画素値p(6)=p(7)=200が維持されているため、図4の下段の式に示すとおり、第6番目の平均画像A(6)および第7番目の平均画像A(7)では、画素値a(6)=102、画素値a(7)=103、と徐々に増加している。
【0059】
この例のように、重みwを0.01程度の値に設定すると、原画像の画素値が急激に変化しても、平均画像の画素値は直ちに変化することはなく、原画像の画素値にゆっくりと近づいてゆくことになる。したがって、図1に示す例のように、車両が通過する動画が与えられたとしても、一過性の画素値変化は、平均画像の画素値に大きな変化をもたらすことはなく、平均画像は背景画像としての機能を果たすことができる。一方、時刻が日中から夕暮れに変わった場合など、照明環境に変化が生じた場合、当該変化は多数のフレーム画像にわたって持続するため、平均画像の画素値も当該変化に追従して変化することになる。したがって、日中には日中の背景画像に適した平均画像が得られ、夕暮れには夕暮れの背景画像に適した平均画像が得られることになる。
【0060】
動体の領域を示す動体識別画像Mは、このような方法で作成された平均画像を背景画像として、個々の原画像を比較することによって作成することができる。図5は、このようにして作成される動体識別画像Mの画素値決定プロセスを示す図である。第i番目の原画像P(i)についての動体識別画像M(i)は、次のような方法で決定される画素値をもつ画素の集合体からなる二値画像である。すなわち、動体識別画像M(i)の特定位置の画素の画素値m(i)は、原画像P(i)の当該特定位置の画素の画素値p(i)と、平均画像A(i−1)の当該特定位置の画素の画素値a(i−1)との比較によって決定され、両画素値が類似範囲内であれば、背景領域K内の画素であることを示す画素値(たとえば、「0」)が与えられ、両画素値が類似範囲外であれば、前景領域F内の画素であることを示す画素値(たとえば、「1」)が与えられる。
【0061】
なお、原画像が三原色の各画素値(たとえば、RGB表色系の場合、R,G,Bの3色の画素値)をもったカラー画像である場合は、原画像P(i)を構成する各画素の画素値p(i)や、平均画像A(i)を構成する各画素の画素値a(i)は、いずれも色ごとに独立した3つの値から構成されていることになる。そして、式(1)の演算は、個々の色ごとにそれぞれ独立して実行されることになる。たとえば、平均画像A(i)上の特定位置の画素の画素値a(i)は、R色の画素値、G色の画素値、B色の画素値という3組の画素値によって構成され、R色の画素値は、過去の原画像のR色の画素値の重みつき平均として得られた値になる。
【0062】
したがって、図5における画素値p(i)と画素値a(i−1)との比較は、単なる2つの値の比較ではなく、3組の画素値と3組の画素値との比較ということになる。当然ながら、画素の類否判定は、この3組の画素値の組み合わせからなる色同士が類似するか否かを判定する処理ということになる。このような2つの色の類否判定は、たとえば、色空間上でのユークリッド距離の大小に基づいて行うことができる。すなわち、画素値R,G,Bをそれぞれ座標軸にとった色空間上に、比較対象となる2つの色を点としてプロットし、2つの点のユークリッド距離が所定の基準値以下である場合には類似、基準値を越える場合には非類似とすればよい。
【0063】
<<< §2.ブロッブ包摂図形を用いた動体追跡の手法 >>>
さて、§1では、一般的な動体検出の基本原理を述べた。ここでは、こうして検出された動体を追跡する手法を説明する。動体の追跡とは、個々のフレーム単位で検出された動体を時系列的に追ってゆくことである。たとえば、図1に示す例の場合、動体識別画像M20,M30,M40を個々に見ると、それぞれ前景領域F20,F30,F40を動体として認識することができるが、動体追跡とは、これら前景領域F20,F30,F40を、同一の動体の時系列情報として把握することである。一般に、動体に対応する個々の前景領域F20,F30,F40を構成するひとまとまりの画素集団は、ブロッブ(blob)と呼ばれており、動体追跡とは、同一の動体を示すブロッブを時系列に並べて把握することである。
【0064】
ある1フレームの原画像に含まれるブロッブは、その輪郭線によって規定することができる。たとえば、図1の動体識別画像M30に含まれている前景領域F30は、原画像P30内の動体(車両)の領域を示すブロッブであり、このブロッブの輪郭線の情報さえあれば、原画像P30から動体(車両)の部分のみを切出すことが可能である。したがって、動体追跡の結果は、ブロッブの輪郭線の情報を時系列で並べることによって示すことができる。
【0065】
ただ、実際には、ブロッブの輪郭線は非常に複雑な図形であり、このような輪郭線の情報を個々のフレーム単位で保存するには、かなり大きな記憶容量が必要になる。また、一般的な用途では、そのような複雑な輪郭線の情報が必要になることは少ない。そこで、実用上は、このブロッブの外接図形によって、動体の位置、形状、大きさを代表させる手法が採られる。本願では、このような外接図形を「ブロッブ包摂図形」と呼ぶことにする。外接図形としては、どのような図形を採用してもよいが、通常、四角形が利用される。したがって、以下に述べる基本的な実施形態においても、ブロッブの外接矩形を「ブロッブ包摂図形」と定義し、このブロッブ包摂図形によって、動体の位置、形状、大きさを代表させるものとする。
【0066】
図6(a) および(b) は、図1に示す動体識別画像M30およびM40に基づいて、それぞれブロッブ包摂図形B30およびB40(太線で示す矩形)を抽出した例を示す平面図である。図6(a) に示すブロッブ包摂図形B30は、動体識別画像M30に含まれる前景領域F30(ブロッブ)の外接矩形であり、図6(b) に示すブロッブ包摂図形B40は、動体識別画像M40に含まれる前景領域F40(ブロッブ)の外接矩形である。このような外接矩形からなるブロッブ包摂図形B30,B40は、単純な幾何学図形であるため、極めて小さな情報量で表現することができ、しかも、動体の位置、形状、大きさを大まかに示すことができる。もちろん、ブロッブの輪郭線の情報に比べれば、ブロッブ包摂図形の情報は精度が低く、特に形状に関しては、大まかな縦横比しか示すことはできない。しかしながら、実用上は、このような大まかな情報をもったブロッブ包摂図形により動体追跡が行われれば十分である。
【0067】
たとえば、図6(a) から(b) へのブロッブ包摂図形の変遷を見ると、横長の矩形のブロッブ包摂図形が画面の下方を右から左へと移動していることが認識できる。これを図1の原画像P30からP40への変遷と照らし合わせれば、車両を動体として追跡することが可能である。図7(a) ,(b) は、図6(a) ,(b) に示すブロッブ包摂図形B30,B40を利用して、原画像P30,P40から、それぞれ部分画像f30,f40を切出した状態を示す平面図である。図の下段に示す図は、切出した部分画像f30,f40をディスプレイの画面一杯に拡大表示した状態を示している。
【0068】
ディスプレイ画面の縦横比(アスペクト比)は、通常、固定されているのに対して、ブロッブ包摂図形を構成する矩形の縦横比は動体の形状に応じて任意になるので、ブロッブ包摂図形B30,B40を構成する矩形と部分画像f30,f40の外枠とは正確には一致しないが、ブロッブ包摂図形B30,B40をほぼ画面一杯に表示するような切出しを行うことにより、常に動体(車両)をズームアップした状態で追跡するような動画提示を行うことができるようになる。したがって、監視システムなどで、検出した動体をズームアップした状態で追跡して表示させるような用途の場合、動体の外接矩形からなるブロッブ包摂図形を時系列に並べた情報が得られれば、当該情報は、動体追跡の結果を示す情報として十分に利用価値がある。
【0069】
ここで述べる基本的な実施形態に係る動体追跡装置の目的は、このようなブロッブ包摂図形を時間軸上に並べた情報(後述するように、当該情報をトラッカーと呼ぶ)を得ることにある。ただ、図1に示す例は、単一の動体(車両)が画面を横切る単純な動画画像の例であるが、実際には、同じ画面上に複数の動体が同時に存在することも少なくない。このように1フレームの原画像上に複数の動体が存在する場合、ブロッブ包摂図形も複数抽出されることになるので、同一の動体に基づいて抽出されたブロッブ包摂図形を一連の連続ブロッブ包摂図形として時間軸上に並べる必要がある。
【0070】
図8は、複数の動体が存在する原画像P10を示す平面図である。この例は、あまり現実的な景色ではないが、説明の便宜上、動体O1(馬)、動体O2(人)、動体O3(車)、動体O4(鳥)という4種類の動体が同時に存在する例になっている。ここで、馬O1と人O2は画面の左から右へ移動しており、車O3と鳥O4は画面の右から左へ移動しているものとする。なお、実際には、これら4種類の動体O1〜O4の奥には、背景画像(街の景色)が写っているが、図が繁雑になるため、以下に示す各原画像では、背景画像の描画は省略する。
【0071】
図9は、図8に示す原画像P10から作成された動体識別画像M10を示す平面図である。この動体識別画像M10は、§1で述べたとおり、原画像P10と背景画像との差分画像として作成される二値画像であり、背景領域K10と前景領域F10a,F10b,F10c,F10dによって構成される。
【0072】
ここでは、時間軸上に時刻t1,t2,t3,...,を定義し、これらの各時刻に得られた原画像をそれぞれ原画像P1,P2,P3,...,と呼ぶことにしよう。図8に示す原画像P10は、時刻t10において得られた原画像ということになる。図10は、時間軸上の時刻t10,t20,t40における原画像P10,P20,P40を示す平面図である。すなわち、図10(a) に示す原画像P10は、時刻t10において得られた原画像であり、上述したとおり、馬O1と人O2が右へ移動し、車O3と鳥O4が左へ移動している。また、図10(b) に示す原画像P20は、時刻t20において得られた原画像であり、各動体が進行方向に向かって更に移動を続けた状態になっている。そして、図10(c) に示す原画像P40は、時刻t40において得られた原画像であり、馬O1,人O2,車O3はそれぞれ進行方向に向かって移動を続け、鳥O4は既に画面左方向へ飛び去り、新たな動体として犬O5が出現した状態になっている。
【0073】
図11(a) 〜(c) は、図10(a) 〜(c) に示す原画像P10,P20,P40から作成された動体識別画像M10,M20,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。ここで、K10,K20,K40は、各動体識別画像M10,M20,M40内の背景領域である。また、文字Fが先頭に付された符号で示すハッチング領域は前景領域であり、文字Fに後続する2桁の数字は時刻を示し、末尾の小文字のアルファベットは動体を区別するための記号である。一方、文字Bが先頭に付された符号で示す太線の矩形は、文字Bを文字Fに置き換えた前景領域(ブロッブ)の外接矩形として抽出されたブロッブ包摂図形である。
【0074】
たとえば、図11(a) の動体識別画像M10の左下に示されているハッチング領域F10aは、図10(a) に示す原画像P10上の動体O1(馬)に対応する前景領域(ブロッブ)であり、太線の矩形で示されたブロッブ包摂図形B10aは、この前景領域F10aの外接矩形として抽出されたブロッブ包摂図形である。結局、図11(a) に示す動体識別画像M10上では、合計4つのブロッブ包摂図形B10a〜B10dが抽出され、図11(b) に示す動体識別画像M20上では、合計4つのブロッブ包摂図形B20a〜B20dが抽出され、図11(c) に示す動体識別画像M40上では、合計4つのブロッブ包摂図形B40a〜B40c,B40eが抽出されることになる。
【0075】
このように、同一画面上に複数の動体が存在し、複数のブロッブ包摂図形が抽出される場合、同一の動体に基づいて抽出されたブロッブ包摂図形を一連の連続するブロッブ包摂図形として時系列で並べることが重要である。このような一連の連続するブロッブ包摂図形の並びは、一般に、トラッカー(Tracker)と呼ばれている。図12は、図11に示す動体識別画像M10,M20,M40に基づいて作成されたトラッカーの一例を示す図である。この図は、横方向に時間軸をとり、縦方向に6個のトラッカーを並べた表によって構成されている。表の1行目には対応する時刻t1〜t40が示されており、表の2行目には各時刻に得られた原画像P1〜P40が示されている。一方、左端の列に記載されたT1〜T6は、個々のトラッカーの名称であり、各トラッカーの実体は、表の横方向に記載されたブロッブ包摂図形の並びの情報である。
【0076】
たとえば、第1番目のトラッカーT1の実体は、...,B10a,...,B20a,...,B40aといったブロッブ包摂図形の並びを示す情報である。ここで、ブロッブ包摂図形B10aは、図11(a) に示すように、時刻t10における馬の輪郭に対する外接矩形であり、ブロッブ包摂図形B20aは、図11(b) に示すように、時刻t20における馬の輪郭に対する外接矩形であり、ブロッブ包摂図形B40aは、図11(c) に示すように、時刻t40における馬の輪郭に対する外接矩形である。結局、トラッカーT1は、馬を示すブロッブ包摂図形を時系列的に並べたものになる。同様に、トラッカーT2は人、T3は車,T4は鳥、T5は犬を示すブロッブ包摂図形を、それぞれ時系列的に並べたものになる。
【0077】
なお、図12に示す表では、図示の便宜上、時刻t10,t20,t40以外の時刻についてのブロッブ包摂図形は掲載が省略されているが、もちろん、各フレームの原画像について、それぞれブロッブ包摂図形が抽出され、所定のトラッカー上に並べられることになる。たとえば、1秒間に30フレームの撮影画像からなる動画の場合、1/30秒ごとの各時刻に得られた各原画像のそれぞれについて、ブロッブ包摂図形が抽出され、トラッカー上に並べられる。
【0078】
この図12に例示するようなトラッカーの情報は、動体追跡の結果を示す情報に他ならない。たとえば、トラッカーT1は、馬を追跡した結果であり、表の左側から右側へと、各ブロッブ包摂図形...,B10a,...,B20a,...,B40aを追ってゆけば、動画上で馬を追跡することができる。具体的には、原画像P10,...,P20,...,P40,...から、各ブロッブ包摂図形B10a,...,B20a,...,B40a...を構成する矩形内部を切出して拡大表示すれば、馬をズームアップした状態で追跡することができる。
【0079】
ここに示す実施形態の場合、1つのブロッブ包摂図形は動体の輪郭線の外接矩形を示すものであり、ブロッブ包摂図形を示すデータの実体は、当該外接矩形の対角に位置する2頂点の座標値によって構成される。図13は、ブロッブ包摂図形Bの実体データを示す平面図である。図示の例は動体O3(車)に対応する前景領域F(ブロッブ)の外接矩形としてブロッブ包摂図形Bが抽出された例であり、このブロッブ包摂図形Bは、原画像P上に定義されたXY座標系を用いて、左上の頂点Q1(x1,y1)の座標値(x1,y1)と、右下の頂点Q2(x2,y2)の座標値(x2,y2)とによって定義することができる(もちろん、左下の頂点と右上の頂点とによって定義してもよい)。したがって、図12に示すトラッカーの各欄には、実際には、「x1,y1,x2,y2」のような座標値を示すデータが収容されていることになる。
【0080】
図10に例示する動画の場合、馬O1,人O2,車O3は原画像P10からP40を経ても画面上に留まっているが、鳥O4は原画像P40に至る前に画面外へ去っており、犬は原画像P40において出現している。そのため、図12に示す動体追跡の結果では、トラッカーT1(馬),トラッカーT2(人),トラッカーT3(車)上には、時刻t10からt40を経てもなお、連続したブロッブ包摂図形の並びが存在しているが、トラッカーT4(鳥)上では、時刻t40の直前で連続したブロッブ包摂図形の並びが消滅しており、トラッカーT5(犬)上では、時刻t40から連続したブロッブ包摂図形の並びが始まっている。図の各トラッカー欄に示す太線の細長い楕円は、このような時系列に沿った一連の連続したブロッブ包摂図形の並びを示している。また、×印の欄は、当該時刻にはブロッブ包摂図形が登録されていないことを示している。別言すれば、×印の欄の存在により、一連の連続したブロッブ包摂図形の並び(すなわち、ある1つの動体についての追跡)が終焉することになる。
【0081】
図11に示す各ブロッブ包摂図形を、図12に示すトラッカー上に登録する際には、同一の動体に基づいて抽出されたと推定されるブロッブ包摂図形が同一のトラッカー上に登録されるようにする必要がある。たとえば、図11(a) に示すブロッブ包摂図形B10a(馬)が、図12に示すようにトラッカーT1の時刻t10欄に登録された場合、図11(b) に示すブロッブ包摂図形B20a(馬)も、図12に示すように同じトラッカーT1の時刻t20欄に登録されるようにし、図11(c) に示すブロッブ包摂図形B40a(馬)も、図12に示すように同じトラッカーT1の時刻t40欄に登録されるようにしなければならない。
【0082】
ここで、人間が目視すれば、ブロッブ包摂図形B10a,B20a,B40a内の各原画像には、馬という同一の動体が含まれていることが認識できるが、コンピュータにそのような認識をさせるためには、複雑なアルゴリズムによる動体の特徴解析を行う必要がある。そこで、通常は、ブロッブ包摂図形の位置、面積、形状といった情報を手掛かりに、同一の動体が含まれているブロッブ包摂図形を推定する手法を採り、同一の動体に基づいて抽出されたと推定されるブロッブ包摂図形を同一のトラッカー上に登録する処理を行う。
【0083】
たとえば、原画像P10に基づいて、図12に示すように、トラッカーT1,T2,T3,T4にそれぞれブロッブ包摂図形B10a,B10b,B10c,B10dが登録された状態において、これらのブロッブ包摂図形に後続して、原画像P20に基づいて、ブロッブ包摂図形B20a,B20b,B20c,B20dをいずれかのトラッカーに登録する処理を例にとって考えてみる(実際には、その間に、原画像P11〜P19に基づくブロッブ包摂図形が登録される)。この場合、図11(a) に示すブロッブ包摂図形B10aに後続してトラッカーT1に登録するのに最も適したブロッブ包摂図形として、図11(b) に示す4つの候補ブロッブ包摂図形の中から、位置、面積、形状が最も類似しているブロッブ包摂図形B20aが選択されることになる。かくして、図12に示すように、トラッカーT1の時刻t20欄には、ブロッブ包摂図形B20aが登録される。
【0084】
要するに、ブロッブ包摂図形の実体が単純な矩形図形であったとしても、位置、面積、形状が類似するブロッブ包摂図形を時系列的に追跡してゆき、これを同一トラッカー上に登録してゆくという簡便な手法を採ることにより、図12に示すように、正しい動体追跡の結果が得られるのである。このような手法では、馬,人,車,鳥といった個別の動体の特徴を解析する複雑な処理を行う必要はない。
【0085】
<<< §3.複数の動体が交差した場合の問題点 >>>
上述したとおり、ブロッブ包摂図形(ここに示す実施形態では外接矩形)を時系列的に追跡してゆく手法を採れば、個別の動体の特徴を解析する複雑な処理を行うことなしに動体追跡が可能になる。実際、2つの矩形の位置、面積、形状の類似度を定量的に評価する処理は比較的単純な算術演算処理によって行うことができるので、ブロッブ包摂図形を時系列的に追跡してゆく処理の演算負担は小さい。これがブロッブ包摂図形を用いた動体追跡の手法の利点である。
【0086】
しかしながら、同一画面内に存在する複数の動体は、それぞれが任意の方向に移動しているため、移動経路が画面上で交差する場合がある。図10(a) ,(b) ,(c) に示す3つの原画像P10,P20,P40は、説明の便宜上、複数の動体が交差した状態を避けたものであり、いずれの動体も画面上で重なり合っていないが、実際には、これらの中間時点において、複数の動体が画面上で重なり合う状態が生じる。
【0087】
図14(a) ,(b) ,(c) は、時系列上の時刻t20,t30,t40における原画像P20,P30,P40を示す平面図である。ここで、原画像P20およびP40は、図10に示す原画像P20およびP40と全く同じものであるが、原画像P30は、その中間時点の状態を示すものである。この原画像P30では、馬O1,人O2,車O3が部分的に重なり合っており、鳥O4だけが重なりを免れている。
【0088】
§2で述べた手法では、このように複数の動体の移動経路の交差により、動体同士に重なり合いが生じると、正確な追跡を行うことができない。これは、図14(b) に原画像P30として示すように、交差時点で複数の物体が、ひとかたまりの物体に融合し、その後、元通りの複数の物体に分離することになるためである。もちろん、人間が原画像P30を観察すれば、依然として、馬O1,人O2,車O3という動体を個別の動体として把握することが可能であるが、§2で述べたブロッブ包摂図形を用いた動体追跡の手法を採ると、馬O1,人O2,車O3が融合した状態でブロッブ包摂図形を構成することになるため、個々の動体を個別に認識することができなくなるのである。
【0089】
図15(a) ,(b) ,(c) は、図14(a) ,(b) ,(c) に示す原画像P20,P30,P40から作成された動体識別画像M20,M30,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。ここで、動体識別画像M20およびM40は、図11に示す動体識別画像M20およびM40と全く同じものである。これに対して、動体識別画像M30は、その中間時点の状態を示すものであり、図14(b) に示す原画像P30に基づいて作成されたものである。図示のとおり、動体識別画像M30からは、2つのブロッブ包摂図形B30d,B30gが抽出されるだけである。ここで、ブロッブ包摂図形B30dは、鳥O4の輪郭を包摂するものであるが、ブロッブ包摂図形B30gは、馬O1,人O2,車O3の融合体の輪郭を包摂するものになっている。
【0090】
§2で述べた動体追跡の手法では、ブロッブ包摂図形B30gが、馬O1,人O2,車O3の融合体の輪郭を包摂するものと認識することはできないので、トラッカーに登録するプロセスにおいて、誤認識が生じることになり、正しい動体追跡を行うことができなくなる。どのような誤認識が生じるかは、ブロッブ包摂図形の位置、面積、形状といった情報を手掛かりに、同一の動体が含まれているブロッブ包摂図形を推定するために採用した具体的な方法によって様々である。
【0091】
図16は、図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの一例を示す図である。この例は、ブロッブ包摂図形B30g(人車馬)を車と誤認識した例である。すなわち、図15(b) に示すブロッブ包摂図形B30g(人車馬)が、図15(a) に示すブロッブ包摂図形B20c(車)の後続ブロッブ包摂図形として適している(すなわち、位置、面積、形状が類似している)と判断し、ブロッブ包摂図形B30g(人車馬)をトラッカーT3の時刻t30欄に登録している。一方、図15(b) に示すブロッブ包摂図形B30d(鳥)については、図15(a) に示すブロッブ包摂図形B20d(鳥)の後続ブロッブ包摂図形として適していると判断し(この判断は正しい)、ブロッブ包摂図形B30d(鳥)をトラッカーT4の時刻t30欄に登録している。動体識別画像M30には、その他のブロッブ包摂図形はないので、トラッカーT1,T2,T5,T6の時刻t30欄に登録するブロッブ包摂図形は存在せず、これらの欄は無登録状態(×印)となっている。
【0092】
一方、時刻t40になると、馬O1,人O2,車O3の融合状態は解消する。このため、動体識別画像M40からは、4つのブロッブ包摂図形B40a,B40b,B40c,B40eが抽出される。図16に示す例の場合、こうして抽出された4つのブロッブ包摂図形のうち、ブロッブ包摂図形B40b(人)がブロッブ包摂図形B30g(人車馬)の後続ブロッブ包摂図形として適している(すなわち、位置、面積、形状が類似している)と判断され、ブロッブ包摂図形B40b(人)がトラッカーT3の時刻t40欄に登録されている。また、鳥O4は画面から去ってしまっているので、トラッカーT4の時刻t40欄は無登録状態(×印)となっている。
【0093】
残りの3つのブロッブ包摂図形B40a(馬),B40c(車),B40e(犬)は、時刻t40になって出現した新参ブロッブ包摂図形(時刻t40になって初めて出現した新参動体についてのブロッブ包摂図形)と認識され、それぞれ空き状態のトラッカーT1,T2,T5の時刻t40欄に登録されている。ここで、ブロッブ包摂図形B40e(犬)が、新参ブロッブ包摂図形であるとの認識は正しいものであるが、ブロッブ包摂図形B40a(馬),B40c(車)が、新参ブロッブ包摂図形であるとの認識は誤りである。
【0094】
この図16に示すような誤った動体追跡結果が得られると、特定の動体をズームアップした状態で追跡表示させるような処理を正しく行うことができない。たとえば、車O3をズームアップして追跡表示させるために、トラッカーT3に並べられたブロッブ包摂図形B20c(車),...,B30g(人車馬),...,B40b(人)...を構成する矩形内部を切出して拡大表示すると、拡大表示される追跡対象が車から人に途中で取り違えられてしまうことになる。また、トラッカーT1に基づいて馬O1を追跡した場合や、トラッカーT2に基づいて人O2を追跡した場合、時刻t30の直前で追跡は終了してしまう。
【0095】
図17は、図15に示す動体識別画像M20,M30,M40に基づいて作成されたトラッカーの別な一例を示す図である。この例は、ブロッブ包摂図形B30g(人車馬)を新参動体と誤認識した例である。すなわち、図15(b) に示すブロッブ包摂図形B30g(人車馬)が、図15(a) に示すブロッブ包摂図形B20a(馬),B20b(人),B20c(車),B20d(鳥)のいずれの後続ブロッブ包摂図形としても適していない(すなわち、位置、面積、形状が類似していない)と判断し、ブロッブ包摂図形B30g(人車馬)をトラッカーT5の時刻t30欄に登録している。別言すれば、ブロッブ包摂図形B30g(人車馬)は、馬,人,車,鳥のいずれでもない新参動体と判断されたことになる。一方、図15(b) に示すブロッブ包摂図形B30d(鳥)については、図15(a) に示すブロッブ包摂図形B20d(鳥)の後続ブロッブ包摂図形として適していると判断し(この判断は正しい)、ブロッブ包摂図形B30d(鳥)をトラッカーT4の時刻t30欄に登録している。動体識別画像M30には、その他のブロッブ包摂図形はないので、トラッカーT1,T2,T3,T6の時刻t30欄に登録するブロッブ包摂図形は存在せず、これらの欄は無登録状態(×印)となっている。
【0096】
一方、時刻t40になると、馬O1,人O2,車O3の融合状態は解消する。このため、動体識別画像M40からは、4つのブロッブ包摂図形B40a,B40b,B40c,B40eが抽出される。図17に示す例の場合、こうして抽出された4つのブロッブ包摂図形は、いずれも時刻t40になって出現した新参ブロッブ包摂図形と認識され、それぞれ空き状態のトラッカーT1,T2,T3,T6の時刻t40欄に登録されている。ここで、ブロッブ包摂図形B40e(犬)が、新参ブロッブ包摂図形であるとの認識は正しいものであるが、ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)が、新参ブロッブ包摂図形であるとの認識は誤りである。
【0097】
この図17に示すような誤った動体追跡結果が得られると、やはり特定の動体をズームアップした状態で追跡表示させるような処理を正しく行うことができない。たとえば、トラッカーT1に基づいて馬O1を追跡した場合、トラッカーT2に基づいて人O2を追跡した場合、トラッカーT3に基づいて車O3を追跡した場合、いずれも時刻t30の直前で追跡は終了してしまう。
【0098】
前掲の特許文献7には、このような問題を解決するための一手法として、複数の動体を追跡する際に、動体同士が交差しているか否かの判定を行い、交差していると判定された場合には、重なり合った複数の動体の奥行き関係を認識して、正しい追跡を行う方法が開示されている。しかしながら、動体同士の交差を判定する処理や、奥行き関係を把握する処理のために、複雑なプロセスが必要になり、また、様々な状況において常に正確な処理を行うことは困難である。本発明は、複数の動体が交差した場合にも、効率的かつ正確に個々の動体を追跡することが可能な新しいアプローチを提案するものである。以下、本発明に係るこの新しいアプローチを詳述する。
【0099】
<<< §4.本発明に係る後続ブロッブ包摂図形の認識法 >>>
この§4では、§3でも説明した図14に示す事例について、本発明に係る後続ブロッブ包摂図形の認識法を適用した場合を説明する。この事例の問題点は、図14(b) に示すように、時刻t30における原画像P30上で複数の動体が交差しているため、図15(b) に示すように、動体識別画像M30から複数の動体の融合体についてのブロッブ包摂図形B30gが抽出されてしまう点である。本発明に係る後続ブロッブ包摂図形の認識法では、原画像P30のように、複数の動体が交差した場合でも、個々の動体について別個独立したブロッブ包摂図形を抽出することが可能になる。
【0100】
そこで、以下、図18に示すように、時刻t29における原画像P29から、時刻t30における原画像P30への変遷が生じた場合に、原画像P29から抽出されたブロッブ包摂図形に対する後続ブロッブ包摂図形を、原画像P30から認識する方法を説明しよう。ただ、ここでは説明の便宜上、まず、次の2つの点を前提とした仮想的な例を考えてみる。
【0101】
第1の前提は、図18(a) に示す原画像P29から、既に、4つの動体O1〜O4のそれぞれについて別個独立したブロッブ包摂図形が抽出されている、という前提である。図示のとおり、この原画像P29上でも、既に動体O1〜O3が重なりを生じているため、§3で述べた方法では、動体O1〜O3の融合体について1つの合成ブロッブ包摂図形が抽出されてしまうが、ここでは、何らかの手法により、4つの動体O1〜O4のそれぞれについて、別個独立したブロッブ包摂図形が抽出されており、4つの異なるトラッカーの時刻t29欄に、これらのブロッブ包摂図形がそれぞれ登録されているものと仮定する。
【0102】
第2の前提は、図18(a) に示す原画像P29と図18(b) に示す原画像P30とが、全く同じ画像である、という前提である。実際には、時刻t29と時刻t30との間にはわずかながら時間差があり、各動体はそれぞれの進行方向に当該時間差に相当する距離だけ移動している。したがって、原画像P29と原画像P30とは若干異なる画像ということになる。ただ、ここでは、時刻t29と時刻t30との間において各動体の移動がなく、両画像が全く同じ画像であると仮定する。
【0103】
図19(a) ,(b) は、図18(a) ,(b) に示す原画像P29,P30から作成された動体識別画像M29,M30およびこれらから抽出されたブロッブ包摂図形を示す平面図である。図19(a) に示すように、動体識別画像M29からは、B29a(馬),B29b(人),B29c(車),B29d(鳥)という4つの独立したブロッブ包摂図形が抽出されており、これらのブロッブ包摂図形は、それぞれトラッカーT1,T2,T3,T4の時刻t29欄に登録されている。人・馬・車が重なり合って融合体を形成しているにもかかわらず、それぞれ独立したブロッブ包摂図形が抽出されているのは、上述した第1の前提に基づくものである。
【0104】
これに対して、図19(b) には、動体識別画像M30から、§3で述べた方法により、ブロッブ包摂図形B30d,B30gが抽出された状態(図15(b) と同じ状態)が示されている。この状態で、トラッカーT1,T2,T3,T4の時刻t29欄に登録されている各ブロッブ包摂図形B29a(馬),B29b(人),B29c(車),B29d(鳥)の後続ブロッブ包摂図形(時刻t30欄に登録すべきブロッブ包摂図形)を認識しようとしても、既に述べたとおり、正しい認識を行うことはできない。その理由は、トラッカーT1,T2,T3の時刻t29欄に登録されている各ブロッブ包摂図形B29a(馬),B29b(人),B29c(車)に後続すべきブロッブ包摂図形が、1つのブロッブ包摂図形B30gとして融合してしまっているためである。したがって、トラッカーT4に登録されているブロッブ包摂図形B29d(鳥)に対しては、ブロッブ包摂図形B30d(鳥)という後続ブロッブ包摂図形を登録することができるが、他のブロッブ包摂図形については、後続ブロッブ包摂図形の登録に失敗することになる。
【0105】
そこで、本発明では、複数の動体のうち、ある1つの動体に着目し、この着目動体のブロッブ包摂図形についての後続ブロッブ包摂図形を認識する際に、当該着目動体以外の動体についての先行ブロッブ包摂図形の領域をマスキングした動体識別画像を用いる、という手法を採る。ここでは、まず、動体O1(馬)を着目動体として、その後続ブロッブ包摂図形を認識する処理手順を説明しよう。別言すれば、図19(a) に示すブロッブ包摂図形B29a(馬)がトラッカーT1の時刻t29欄に登録されている状態において、トラッカーT1の時刻t30欄に登録すべき後続ブロッブ包摂図形を認識する処理を行うことになる。
【0106】
そのために、まず、図19(b) に示す動体識別画像M30に対して、マスキング処理を施す。図20(a) は、このようなマスキング処理を行うことにより得られた動体識別画像を示す平面図である。ここでは、このようなマスキング後の動体識別画像を個別動体識別画像M(30,1)と呼ぶことにする。図において、二重斜線によるハッチングを施して示されている領域は、各ブロッブ包摂図形に対応する矩形領域であり、これらの矩形領域によるマスキングを行うことにより、着目動体O1(馬)以外の動体が隠蔽されることになる。すなわち、トラッカーT2の時刻t29欄に登録されていたブロッブ包摂図形B29bにより動体O2(人)が隠蔽され、トラッカーT3の時刻t29欄に登録されていたブロッブ包摂図形B29cにより動体O3(車)が隠蔽され、トラッカーT4の時刻t29欄に登録されていたブロッブ包摂図形B29dにより動体O4(鳥)が隠蔽される。結局、このマスキング処理によって得られた個別動体識別画像M(30,1)には、着目動体O1(馬)のみが残ることになる。
【0107】
なお、図20(a) では、説明の便宜上、二重斜線によるハッチングを施した矩形領域として、マスク領域(マスキング処理によって隠蔽される領域)を明示してあるが、実際には、このマスク領域は、背景領域の一部を構成することになるので、本来は、白地の領域として示すべき領域である。後述する図21以降においても、説明の便宜上、マスク領域を二重斜線によるハッチング領域として明示するが、実際には、いずれも背景領域の一部を構成する領域となるので、本来は、白地の領域として示すべき領域である。
【0108】
図20(b) は、図20(a) に示す個別動体識別画像M(30,1)から抽出されたブロッブ包摂図形B30a(太線の矩形)を示す平面図である。前述したとおり、ここで述べる基本的実施形態では、前景領域の外接矩形をブロッブ包摂図形として抽出するため、ブロッブ包摂図形B30aは、着目動体O1(馬)の輪郭線の外接矩形となっている。このブロッブ包摂図形B30aは、トラッカーT1の時刻t30欄に登録すべき候補となるため、ここでは、候補ブロッブ包摂図形と呼ぶことにする。この例では、個別動体識別画像M(30,1)から抽出された候補ブロッブ包摂図形が、図20(b) に示す候補ブロッブ包摂図形B30aのみであるため、トラッカーT1の時刻t30欄には、この候補ブロッブ包摂図形B30aが後続ブロッブ包摂図形として登録されることになる。候補ブロッブ包摂図形が複数存在する場合には、§2で述べたとおり、候補ブロッブ包摂図形の中から、位置、面積、形状が最も類似しているものが後続ブロッブ包摂図形として選択される。
【0109】
なお、上述したマスキング処理により、個別動体識別画像M(30,1)上では、着目動体O1(馬)の一部分が欠けた状態になっている。図示の例では、たまたま馬の首の部分の一部が欠けたため、ブロッブ包摂図形B30aは、依然として、着目動体O1(馬)の輪郭線の外接矩形となっているが、たとえば、馬の鼻の部分が欠けると、本来の外接矩形よりも横幅が若干小さい矩形がブロッブ包摂図形として抽出されることになる。このように、マスキング処理後の個別動体識別画像から抽出したブロッブ包摂図形は、本来の着目動体の輪郭線の外接矩形とは若干異なる可能性があるが、トラッカーに登録して動体追跡を行う上では支障は生じない。
【0110】
動体O2(人)を着目動体として、その後続ブロッブ包摂図形を認識する処理、すなわち、図19(a) に示すブロッブ包摂図形B29b(人)がトラッカーT2の時刻t29欄に登録されている状態において、時刻t30欄に登録すべき後続ブロッブ包摂図形を認識する処理も同様に行うことができる。具体的には、図19(b) に示す動体識別画像M30に対して、着目動体(人)以外のブロッブ包摂図形を用いたマスキング処理を行えばよい。図21(a) は、このようなマスキング処理を行うことにより得られた個別動体識別画像M(30,2)を示す平面図である。図示のとおり、トラッカーT1の時刻t29欄に登録されていたブロッブ包摂図形B29aにより動体O1(馬)が隠蔽され、トラッカーT3の時刻t29欄に登録されていたブロッブ包摂図形B29cにより動体O3(車)が隠蔽され、トラッカーT4の時刻t29欄に登録されていたブロッブ包摂図形B29dにより動体O4(鳥)が隠蔽され、個別動体識別画像M(30,2)には、着目動体O2(人)のみが残ることになる。
【0111】
図21(b) は、図21(a) に示す個別動体識別画像M(30,2)から抽出された候補ブロッブ包摂図形B30b(太線の矩形)を示す平面図である。トラッカーT2の時刻t30欄には、この候補ブロッブ包摂図形B30bが後続ブロッブ包摂図形として登録されることになる。ここでも、マスキング処理により、個別動体識別画像M(30,2)上では、着目動体O2(人)の一部分が欠けた状態になっている。具体的には、着目動体O2(人)の下半身が欠けてしまっているため、ブロッブ包摂図形B30bは、上半身の輪郭線の外接矩形となっている。ただ、図18(b) に示す原画像P30を見ればわかるとおり、もともと原画像P30上においても動体O2(人)の下半身の画像情報は欠落しているので、ブロッブ包摂図形B30bが上半身のみを示すものであっても支障は生じない。
【0112】
同様に、動体O3(車)を着目動体として、その後続ブロッブ包摂図形を認識する処理を行う場合は、図19(b) に示す動体識別画像M30に対して、着目動体(車)以外のブロッブ包摂図形を用いたマスキング処理を行えばよい。図22(a) は、このようなマスキング処理を行うことにより得られた個別動体識別画像M(30,3)を示す平面図である。図示のとおり、トラッカーT1の時刻t29欄に登録されていたブロッブ包摂図形B29aにより動体O1(馬)が隠蔽され、トラッカーT2の時刻t29欄に登録されていたブロッブ包摂図形B29bにより動体O2(人)が隠蔽され、トラッカーT4の時刻t29欄に登録されていたブロッブ包摂図形B29dにより動体O4(鳥)が隠蔽され、個別動体識別画像M(30,3)には、着目動体O3(車)のみが残ることになる。
【0113】
図22(b) は、図22(a) に示す個別動体識別画像M(30,3)から抽出された候補ブロッブ包摂図形B30c(太線の矩形)を示す平面図である。トラッカーT3の時刻t30欄には、この候補ブロッブ包摂図形B30cが後続ブロッブ包摂図形として登録されることになる。ここでも、マスキング処理により、個別動体識別画像M(30,3)上では、着目動体O3(車)の一部分が欠けた状態になっているが、動体追跡を行う上で支障は生じない。
【0114】
最後に、動体O4(鳥)を着目動体として、その後続ブロッブ包摂図形を認識する処理が行われる。動体O4(鳥)は、他の動体と融合することなしに、常に、独立を維持した動体であるが、後続ブロッブ包摂図形を認識する処理を行う上では、これまで述べてきた他の動体と全く同じ手法が採られる。すなわち、図19(b) に示す動体識別画像M30に対して、着目動体(鳥)以外のブロッブ包摂図形を用いたマスキング処理を行うことにより、図23(a) に示すような個別動体識別画像M(30,4)を得る。図示のとおり、トラッカーT1の時刻t29欄に登録されていたブロッブ包摂図形B29aにより動体O1(馬)が隠蔽され、トラッカーT2の時刻t29欄に登録されていたブロッブ包摂図形B29bにより動体O2(人)が隠蔽され、トラッカーT3の時刻t29欄に登録されていたブロッブ包摂図形B29cにより動体O3(車)が隠蔽され、個別動体識別画像M(30,4)には、着目動体O4(鳥)のみが残ることになる。
【0115】
図23(b) は、図23(a) に示す個別動体識別画像M(30,4)から抽出された候補ブロッブ包摂図形B30d(太線の矩形)を示す平面図である。トラッカーT4の時刻t30欄には、この候補ブロッブ包摂図形B30dが後続ブロッブ包摂図形として登録されることになる。
【0116】
図24は、図20〜図23に示す候補ブロッブ包摂図形に基づいて、各トラッカーの時刻t30欄以降に後続ブロッブ包摂図形の登録を行った状態を示す図である。ここで、時刻t29欄に登録されているブロッブ包摂図形は、図19(a) に示す各ブロッブ包摂図形B29a〜B20dであり、時刻t30欄に登録されているブロッブ包摂図形は、前述した方法によって認識された後続ブロッブ包摂図形である。
【0117】
すなわち、トラッカーT1について、ブロッブ包摂図形B29a(馬)に対する後続ブロッブ包摂図形(時刻t30欄に登録すべきブロッブ包摂図形)を認識する際には、トラッカーT1を着目トラッカーとして(すなわち、馬を着目動体として)、着目外トラッカーT2,T3,T4の時刻t29欄に登録されているブロッブ包摂図形B29b(人),B29c(車),B29d(鳥)を用いて、動体識別画像M30に対するマスキング処理を行い、図20(a) に示すような個別動体識別画像M(30,1)を生成し、図20(b) に示すような候補ブロッブ包摂図形B30a(馬)を抽出し、これを後続ブロッブ包摂図形として認識することになる。図24には、こうして後続ブロッブ包摂図形として認識された候補ブロッブ包摂図形B30a(馬)が着目トラッカーT1の時刻t30欄に登録された状態が示されている。
【0118】
また、トラッカーT2について、ブロッブ包摂図形B29b(人)に対する後続ブロッブ包摂図形を認識する際には、今度はトラッカーT2を着目トラッカーとして(すなわち、人を着目動体として)、着目外トラッカーT1,T3,T4の時刻t29欄に登録されているブロッブ包摂図形B29a(馬),B29c(車),B29d(鳥)を用いて、動体識別画像M30に対するマスキング処理を行い、図21(a) に示すような個別動体識別画像M(30,2)を生成し、図21(b) に示すような候補ブロッブ包摂図形B30b(人)を抽出し、これを後続ブロッブ包摂図形として認識することになる。トラッカーT3,T4についての後続ブロッブ包摂図形認識処理も全く同様である。
【0119】
図25は、こうして、各トラッカーT1〜T4について認識された後続ブロッブ包摂図形B30a〜B30dを、動体識別画像M30に重ねた状態を示す平面図である。結局、本発明に係る後続ブロッブ包摂図形の認識法を採用すると、動体識別画像M30から、図19(b) に示すブロッブ包摂図形B30d,B30gが抽出される代わりに、図25に示すようなブロッブ包摂図形B30a〜B30dが抽出されることになる。別言すれば、複数の動体が交差したために原画像P30上で融合体が形成されていたとしても、この融合体の輪郭を包摂するブロッブ包摂図形B30gではなく、個々の動体の輪郭を包摂するブロッブ包摂図形B30a,B30b,B30cが個別に抽出され、それぞれのトラッカーの後続ブロッブ包摂図形として登録されることになる。
【0120】
以上、時刻t29から時刻t30への変遷を例にとって、各トラッカーの時刻t30欄に登録する後続ブロッブ包摂図形を認識する手順を説明したが、同様の手順がすべての時刻欄について実行されることになる。その結果、図24に示すとおり、トラッカーT1には、動体O1(馬)についてのブロッブ包摂図形を時系列に並べた情報が記録され、トラッカーT2には、動体O2(人)についてのブロッブ包摂図形を時系列に並べた情報が記録され、トラッカーT3には、動体O3(車)についてのブロッブ包摂図形を時系列に並べた情報が記録される。実際には、時刻t30の前後において、これら3つの動体は重なりを生じているが、上述した手順によれば、このような重なりを生じている期間であっても、個々の動体についてのブロッブ包摂図形が個別に抽出され、正しいトラッカーに登録されることになる。
【0121】
図24の表を、図16,図17の表と比較すれば、正しい動体追跡が行われていることが容易に理解できよう。たとえば、車O3をズームアップして追跡表示させるために、トラッカーT3に並べられたブロッブ包摂図形を構成する矩形内部を切出して拡大表示すれば、常に、車O3を追跡する正しい結果が得られる。
【0122】
このように、本発明に係る後続ブロッブ包摂図形の認識法によって各トラッカーに後続ブロッブ包摂図形の登録を行うと、良好な動体追跡の結果が得られる理由は、個々のトラッカーごとに、それぞれ異なる個別動体識別画像(他のトラッカーの先行ブロッブ包摂図形を利用してマスキングした画像)を用意し、この個別動体識別画像から候補ブロッブ包摂図形を抽出するようにしたためである。
【0123】
すなわち、§2,§3で述べた方法では、図19(b) に示すような共通の動体識別画像M30から候補ブロッブ包摂図形B30d,B30gを抽出していたため、正しい後続ブロッブ包摂図形の認識を行うことができなかった。これに対して、本発明に係る方法では、トラッカーT1の後続ブロッブ包摂図形は、図20(a) に示すようなマスキングされた個別動体識別画像M(30,1)から抽出し、トラッカーT2の後続ブロッブ包摂図形は、図21(a) に示すようなマスキングされた個別動体識別画像M(30,2)から抽出し、トラッカーT3の後続ブロッブ包摂図形は、図22(a) に示すようなマスキングされた個別動体識別画像M(30,3)から抽出し、トラッカーT4の後続ブロッブ包摂図形は、図23(a) に示すようなマスキングされた個別動体識別画像M(30,4)から抽出する、という手法を採るため、正しい後続ブロッブ包摂図形の認識を行うことが可能になる。
【0124】
なお、これまでの説明に用いた実例は、前述したとおり、2つの前提を仮定した実例である。まず、第1の前提として、図19(a) に示すように、時刻t29において、一部の動体が重なり合っているにもかかわらず、何らかの手法により、4つの動体O1〜O4のそれぞれについて、別個独立したブロッブ包摂図形が抽出されており、4つの異なるトラッカーの時刻t29欄に、これらのブロッブ包摂図形がそれぞれ登録されているものと仮定する前提をおいた。しかしながら、当該前提は、特別な前提条件ではなく、本発明に係る後続ブロッブ包摂図形の認識法を採用すれば、必然的に満たされる前提条件になる。
【0125】
すなわち、初期時刻t1において、各動体に重なりが生じていないものとすれば、その後に動体の重なりが生じたとしても、上述した手順で後続ブロッブ包摂図形の認識を行う限り、個々の動体は別個独立したブロッブ包摂図形として登録されることになる。たとえば、図14に示す実例の場合、時刻t20における原画像P20では動体の重なりは生じていないので、その後、時刻t30に至る過程で、動体の重なりが生じたとしても、個々の動体は別個独立したブロッブ包摂図形として登録されるので、図19(a) に示す時刻t29においても、4つの動体O1〜O4のそれぞれについて、別個独立したブロッブ包摂図形が登録されている、という前提が成り立つことになる。したがって、この第1の前提は、特別な前提ではなく、上記手順を採用すれば当然満たされる前提である。
【0126】
次に、第2の前提として、図18(a) に示す原画像P29と図18(b) に示す原画像P30とが、全く同じ画像である、という前提をおいた。これは、時刻t29からt30に至る期間、すべての動体O1〜O4が静止していた、という前提であるから、現実的には成立しない前提である。このような前提を置いたのは、本発明の基本原理の説明を容易にするための便宜に他ならない。
【0127】
図20(a) に示すマスキング処理後の個別動体識別画像M(30,1)上で、着目動体である馬以外の動体(人,車,鳥)が、ブロッブ包摂図形B29b,B29c,B29dによって完全に隠蔽されているのは、上記前提を置いたためである。すなわち、ブロッブ包摂図形B29b,B29c,B29dは、時刻t29における人,車,鳥の位置に基づいて抽出された外接矩形であるから、時刻t29における動体識別画像M29に対するマスキング処理を行えば、図20(a) に示す例のように、人,車,鳥を完全に隠蔽することが可能である。ところが、実際には、図20(a) に示す例は、時刻t30における動体識別画像M30に対するマスキング処理を行った結果であるから、上記前提がなければ、人,車,鳥を完全に隠蔽することはできない。
【0128】
図26は、図20に示すマスキング処理では完全なマスキングがなされなかった状態を示す平面図(図(a) )およびこの状態から抽出された候補ブロッブ包摂図形を示す平面図(図(b) )である。実際には、時刻t29からt30に至る期間も、各動体O1〜O4は移動しているので、図26(a) に示す例のように、動体の一部がマスクから食み出すことになり前景領域の一部を構成する。その結果、この個別動体識別画像M(30,1)からは、図26(b) に示すように、4つの候補ブロッブ包摂図形B30a−1〜B30a−4が抽出されることになる。
【0129】
ただ、このように複数の候補ブロッブ包摂図形が抽出された場合でも、その中から後続ブロッブ包摂図形として最適な候補ブロッブ包摂図形を選択すれば、結局、候補ブロッブ包摂図形B30a−1が後続ブロッブ包摂図形として選択され、トラッカーT1の時刻t30欄に登録されることになる。具体的には、図19(a) に示す先行ブロッブ包摂図形B29aに対して、位置、面積、形状が最も類似している候補ブロッブ包摂図形を後続ブロッブ包摂図形として選択する作業を行えばよい。選択されなかった候補ブロッブ包摂図形B30a−2〜B30a−4は、トラッカーに登録されることなく捨てられる。
【0130】
このように、上述した第2の前提は、説明の便宜のために意図的に設けた前提であり、本発明に係る後続ブロッブ包摂図形の認識法を実行する上で必須の前提条件ではない。したがって、本発明を実行する上で、特別な前提条件は必要ない。
【0131】
<<< §5.本発明に係る新参ブロッブ包摂図形の認識法 >>>
さて、§4では、本発明に係る後続ブロッブ包摂図形の認識法の基本原理を説明した。この後続ブロッブ包摂図形の認識処理は、既に登録されている先行ブロッブ包摂図形に後続して、新たなブロッブ包摂図形を追加する処理を行うための処理であり、画面上を継続して移動中の動体についての追跡を続行するための処理と言うことができる。
【0132】
しかしながら、通常、画面上に存在する動体はやがて消え去り、一方で、新たな動体が画面上に出現する、という現象が繰り返される。したがって、実際には、画面上を移動中の動体を追跡する処理に加えて、既存動体が消滅した場合の処理と、新参動体が出現した場合の処理を行う必要がある。図14に示す実例の場合も、時刻t40で得られる原画像P40には、もはや動体O4(鳥)は存在せず、その代わりに新参者の動体O5(犬)が出現している。その結果、図24に示す表では、トラッカーT4の鳥についての一連のブロッブ包摂図形群は時刻t40に至るまでの途中で終焉を迎えており、時刻t40欄は無登録状態(×印)になっている。一方で、トラッカーT5の時刻t40欄には、新参者の動体O5(犬)についてのブロッブ包摂図形B40eが新参ブロッブ包摂図形として登録されている。
【0133】
ここで、既存動体が消滅した場合の処理は、§4で述べた手順において、後続ブロッブ包摂図形が認識できなかった場合の処理として実行することができる。たとえば、動体O4(鳥)が、時刻t38までは存在したが(画面の枠の近くに一部だけ存在した場合も含む)、時刻t39において画面外へ飛び去った、という場合を考えてみる。この場合、トラッカーT4の時刻t39欄に登録すべき後続ブロッブ包摂図形を認識する処理を行っても、後続ブロッブ包摂図形に適した候補ブロッブ包摂図形が認識できないことになり、結局、時刻t39欄は無登録状態(×印)になる。これは、動体O4(鳥)が消滅した場合の処理に他ならない。すなわち、トラッカーT4上では、時系列的に連続して登録されてきた一連のブロッブ包摂図形群が、時刻t38欄の末尾ブロッブ包摂図形をもって途絶えることになり、これにより、動体O4(鳥)が消滅したという情報が記録されることになる。
【0134】
なお、動体が消滅するのは、必ずしも画面外に移動した場合に限られるわけではない。たとえば、人が建物に入った場合、車が地下駐車場へ降りた場合などでは、画面の中央付近で動体が消滅することも起こりうる。ただ、動体がどこで消滅しようと、トラッカー上では、後続ブロッブ包摂図形が認識できない、という状態に変わりはなく、無登録状態(×印)として記録されることになる。
【0135】
これに対して、新参動体が出現した場合は、新参ブロッブ包摂図形を認識した上で、これを所定のトラッカー(空き状態の任意のトラッカー)に新規登録する処理を行う必要がある。そこで、以下、図27に示すように、時刻t39における原画像P39から、時刻t40における原画像P40への変遷が生じた場合に、原画像P40に突然出現した新参動体O5についての新参ブロッブ包摂図形を、トラッカー上に登録する処理の手順を説明する。
【0136】
図28(a) ,(b) は、図27(a) ,(b) に示す原画像P39,P40から作成された動体識別画像M39,M40およびこれらから抽出されたブロッブ包摂図形を示す平面図である。ここでは、図28(a) に示す動体識別画像M39に基づいて、ブロッブ包摂図形B39a(馬),B39b(人),B39c(車)が、既にトラッカーに登録されている状態において、図28(b) に示す動体識別画像M40に基づいて、時刻t40欄に新たなブロッブ包摂図形を登録する作業を述べる。
【0137】
図29は、図28に示すブロッブ包摂図形に基づいて作成されたトラッカーを示す図である。時刻t39欄には、既に、ブロッブ包摂図形B39a(馬),B39b(人),B39c(車)が、それぞれトラッカーT1,T2,T3に登録されているものとする。一方、時刻t40欄については、まず、§4で述べた後続ブロッブ包摂図形の認識法を適用して、ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)の登録が行われる。当該登録は、図28(b) に示す動体識別画像M40に対してマスキング処理を施すことにより得られた個別動体識別画像M(40,1),M(40,2),M(40,3)を利用して行われる。
【0138】
具体的には、動体識別画像M40に対して、ブロッブ包摂図形B39b(人),B39c(車)を用いたマスキング処理により個別動体識別画像M(40,1)が得られ、ここから抽出されたブロッブ包摂図形B40a(馬)がトラッカーT1に登録される。同様に、ブロッブ包摂図形B39a(馬),B39c(車)を用いたマスキング処理により得られた個別動体識別画像M(40,2)から抽出されたブロッブ包摂図形B40b(人)がトラッカーT2に登録され、ブロッブ包摂図形B39a(馬),B39b(人)を用いたマスキング処理により得られた個別動体識別画像M(40,3)から抽出されたブロッブ包摂図形B40c(車)がトラッカーT3に登録される。図29には、これらの後続ブロッブ包摂図形の登録が完了した状態が示されている。
【0139】
図27(b) に示す原画像P40から新参動体を認識して、これをトラッカーに登録する処理は、このような後続ブロッブ包摂図形の登録が完了した後に行われる。その基本原理は、図28(b) に示す動体識別画像M40から抽出されたブロッブ包摂図形B40a(馬),B40b(人),B40c(車),B40e(犬)の中に、上記処理によって登録された後続ブロッブ包摂図形に対応しないブロッブ包摂図形が存在するか否かを判断し、そのようなブロッブ包摂図形が存在する場合には、これを新参ブロッブ包摂図形と認識し、時刻t40欄が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録するというものである。
【0140】
具体的には、上例の場合、図29に示すとおり、トラッカーT1,T2,T3には、既に後続ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)が登録されているので、図28(b) に示す動体識別画像M40から抽出された4つのブロッブ包摂図形のうち、既に登録された後続ブロッブ包摂図形に対応しないブロッブ包摂図形は、ブロッブ包摂図形B40e(犬)のみである。よって、このブロッブ包摂図形B40e(犬)が、新参ブロッブ包摂図形と判断され、時刻t40欄が未登録状態(空欄状態)のトラッカーに先頭ブロッブ包摂図形として登録される。もちろん、新参ブロッブ包摂図形が複数存在する場合には、それぞれが異なるトラッカーに登録されることになる。
【0141】
図29に示す例の場合、トラッカーT4,T5,T6は、いずれも時刻t40欄が未登録状態であるので、新参ブロッブ包摂図形B40e(犬)は、これらのいずれに登録してもかまわない。図24に示す例は、この新参ブロッブ包摂図形B40e(犬)を、トラッカーT5に登録した例である。残りのトラッカーT4,T6の時刻t40欄は、登録すべきブロッブ包摂図形がないため、無登録状態(×印)となっている。こうして登録された新参ブロッブ包摂図形B40e(犬)は、先頭ブロッブ包摂図形として機能し、トラッカーT5には、以後、動体O5(犬)が消滅するまで、後続ブロッブ包摂図形が並べられることになる。
【0142】
図27(b) に示すとおり、原画像P40上には、互いに重なり合う動体が存在しないため、図28(b) に示す動体識別画像M40から抽出されたブロッブ包摂図形B40a(馬),B40b(人),B40c(車)と、図29に示す表における時刻t40欄に登録されている後続ブロッブ包摂図形B40a(馬),B40b(人),B40c(車)とは、互いに1対1に対応する。たとえば、図29のトラッカーT1の時刻t40欄に登録されているブロッブ包摂図形B40a(馬)は、図28(b) に示す動体識別画像M40に対するマスキング処理後の個別動体識別画像M(40,1)から抽出されたブロッブ包摂図形であるから、もともと動体識別画像M40に含まれていたブロッブ包摂図形B40a(馬)に一致する。ところが、図28(b) に示す動体識別画像M40から抽出されたブロッブ包摂図形B40e(犬)は、図29に示すいずれのトラッカー上にも対応する後続ブロッブ包摂図形が存在しない。このため、当該ブロッブ包摂図形B40e(犬)を、新参ブロッブ包摂図形と認識することができる。
【0143】
なお、原画像上に互いに重なり合う動体が存在する場合は、上例のような単純な1対1の対応にはならない。たとえば、図18(b) に示す原画像P30上では、3つの動体O1,O2,O3が重なり合っているため、動体識別画像M30からは、図19(b) に示すような2つのブロッブ包摂図形B30d(鳥),B30g(人車馬)が抽出される。一方、図24に示す表において、トラッカーT1,T2,T3の時刻t30欄に登録されている後続ブロッブ包摂図形B30a(馬),B30b(人),B30c(車)は、それぞれマスキング処理後の個別動体識別画像M(30,1),M(30,2),M(30,3)から抽出されたものであるため、図19(b) に示すブロッブ包摂図形B30g(人車馬)とは1対1に対応するわけではない。
【0144】
このように、複数n個の動体が互いに重なり合っている場合は、動体識別画像M上において、複数n個の動体の融合体に対して1つのブロッブ包摂図形が抽出されることになるので、トラッカーに登録されている後続ブロッブ包摂図形に対して1対1の対応は得られないが、その代わりに、1対nの対応が得られることになる。すなわち、上例の場合、図19(b) に示されているブロッブ包摂図形B30g(人車馬)に対して、図29の表の時刻t30欄に登録されている3つの後続ブロッブ包摂図形B30a(馬),B30b(人),B30c(車)が対応するという1対3の対応関係が得られることになる。一方、図19(b) のブロッブ包摂図形B30d(鳥)については、図29の表の時刻t30欄に登録されている後続ブロッブ包摂図形B30d(鳥)に対して1対1の対応が得られる。
【0145】
このように、原画像上に互いに重なり合う動体が存在する場合でも、動体識別画像Mから抽出した各ブロッブ包摂図形と、トラッカー上に登録されている後続ブロッブ包摂図形との間には、1対1もしくは1対nの対応関係が得られる。したがって、上述したとおり、対応する後続ブロッブ包摂図形がトラッカー上に登録されていないブロッブ包摂図形を新参ブロッブ包摂図形と認識し、これを新たにトラッカー上に登録することが可能である。図19(b) に示す動体識別画像M30の場合、抽出されたブロッブ包摂図形B30g(人車馬)は、3つの後続ブロッブ包摂図形B30a(馬),B30b(人),B30c(車)に対応し、抽出されたブロッブ包摂図形B30d(鳥)は単一の後続ブロッブ包摂図形B30d(鳥)に対応することになるので、動体識別画像M30上には新参ブロッブ包摂図形は存在しない、との判断を行うことができる。
【0146】
なお、このような新参ブロッブ包摂図形の有無を判断する用途に資するため、実用上は、トラッカー上に後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形と、当該後続ブロッブ包摂図形を抽出する元になった動体識別画像M上のブロッブ包摂図形と、の対応関係を示すテーブルを作成しておくのが好ましい。図30に、このようなテーブルの一例を示す。この例は、図24の表の時刻t30の欄に登録された後続ブロッブ包摂図形と、図19(b) に示す動体識別画像M30上のブロッブ包摂図形と、の対応関係を示すテーブルであり、トラッカー上に各後続ブロッブ包摂図形を登録する作業を行う際に作成することができる。
【0147】
たとえば、図24の表のトラッカーT1の時刻t30欄に、図20(b) に示す個別動体識別画像M(30,1)から抽出された後続ブロッブ包摂図形B30a(馬)を登録する場合を考えよう。この場合、この図20(b) に示す後続ブロッブ包摂図形B30a(馬)と、図19(b) に示すブロッブ包摂図形B30g(人車馬)とは、後者が前者を包含する関係になっていることがわかる。このように、一方が他方を包含する関係になっているブロッブ包摂図形については、互いに対応するブロッブ包摂図形と認識し、テーブル上に当該対応関係を記録しておくようにする。図30に示すテーブルの1行目に記録された対応関係は、このようにして記録されたものである。
【0148】
同様に、図24の表のトラッカーT2の時刻t30欄に、図21(b) に示す個別動体識別画像M(30,2)から抽出された後続ブロッブ包摂図形B30b(人)を登録する場合や、図24の表のトラッカーT3の時刻t30欄に、図22(b) に示す個別動体識別画像M(30,3)から抽出された後続ブロッブ包摂図形B30c(車)を登録する場合にも、包含関係にあるブロッブ包摂図形B30g(人車馬)との対応関係が記録される。図30に示すテーブルの2行目および3行目に記録された対応関係は、このようにして記録されたものである。
【0149】
また、図24の表のトラッカーT4の時刻t30欄に、図23(b) に示す個別動体識別画像M(30,4)から抽出された後続ブロッブ包摂図形B30d(鳥)を登録する場合は、当該後続ブロッブ包摂図形B30d(鳥)と図19(b) に示すブロッブ包摂図形B30d(鳥)とが一致する関係(1対1の対応関係)になっているので、やはり両者が互いに対応するブロッブ包摂図形と認識し、テーブル上に当該対応関係を記録しておくようにする。図30に示すテーブルの4行目に記録された対応関係は、このようにして記録されたものである。
【0150】
要するに、トラッカー上に個々の後続ブロッブ包摂図形を登録する処理を行う際に、登録対象となる後続ブロッブ包摂図形と動体識別画像M上の各ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、当該対応関係をテーブルに記録しておくようにすればよい。このようなテーブルを用意しておけば、前述したように、動体識別画像M上に新参ブロッブ包摂図形が存在するか否かの判断を容易に行うことが可能になる。すなわち、動体識別画像M上の個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形との対応関係が記録されていないブロッブ包摂図形を新参ブロッブ包摂図形と認識することができる。
【0151】
<<< §6.基本的実施形態に係る動体追跡装置 >>>
本発明に係る動体追跡装置は、§4で述べた後続ブロッブ包摂図形の認識法と、§5で述べた新参ブロッブ包摂図形の認識法とを採用し、トラッカー上に新参ブロッブ包摂図形の登録および後続ブロッブ包摂図形の登録を行い、個々の動体を追跡する処理を行うものである。以下、図31のブロック図を参照しながら、本発明の基本的な実施形態に係る動体追跡装置の構成および動作を説明する。
【0152】
この動体追跡装置は、入力した動画画像について動体を検出し、これを追跡する処理を行う装置であり、その基本的な役割は、これまで述べてきたトラッカーの情報を作成し、保持することにある。図示のとおり、この装置の基本的な構成要素は、画像入力部110,背景画像提供部120,動体識別画像生成部130,マスキング処理部140,トラッカー格納部150,トラッカー登録部160,ブロッブ包摂図形抽出部170である。以下、これらの構成要素の機能を順に説明する。
【0153】
<6−1:画像入力部110>
画像入力部110は、時系列で連続する複数の原画像P(i)からなる動画画像を入力し、これを動体識別画像生成部130に提供する構成要素である。ここで、iは時系列の順序を示す自然数(i=1,2,3,... )である。§3では、図14(a) ,(b) ,(c) に示すように、時刻t20,t30,t40において原画像P20,P30,P40が入力された実例を用いた説明を行ったが、ここでは、画像入力部110に対して、時刻t(1)において原画像P(1)が与えられ、次の時刻t(2)において原画像P(2)が与えられ、... 、時刻t(i)において原画像P(i)が与えられたものとする。こうして与えられた時系列で連続する複数の原画像P(i)は動画画像を構成する。たとえば、30フレーム/秒の動画画像の場合は、原画像P(i+1)は原画像(i)の1/30秒後のフレームということになる。
【0154】
なお、画像入力部110を、ハードディスク装置などの記憶装置によって構成しておけば、入力した複数の原画像P(i)からなる動画画像を動画データとして蓄積することができ、必要に応じて、必要なフレームの原画像を動体識別画像生成部130に提供することができる。したがって、動画の任意のパートについての動体追跡処理を随時行うことが可能になる。また、動体識別画像生成部130に対して、時系列を遡るように逆順で原画像を提供するようにすれば、動画を逆送りしながら動体追跡を行うことも可能になる。もちろん、リアルタイムで撮影された動画に基づいて、その場で動体追跡を行う用途に利用する場合には、画像入力部110に動画画像を蓄積保存する機能を設けておく必要はない。
【0155】
<6−2:背景画像提供部120>
背景画像提供部120は、こうして画像入力部110に与えられた動画画像の背景を構成する背景画像を、動体識別画像生成部130に対して提供する機能をもった構成要素である。たとえば、背景画像提供部120に、外部から与えられた静止画像を取り込んで保存する機能をもたせておき、予め所定の静止画像を背景画像として与えておくようにすれば、背景画像提供部120は、当該静止画像をそのまま背景画像として提供することができる。このような方法で背景画像を提供するのであれば、背景画像提供部120を、静止画像のデータを記憶する単純なデータ記憶装置によって構成することができる。
【0156】
もっとも、照明環境に変化のない室内を定点カメラで撮影した動画画像を取り扱う場合であれば、上述のように、単純なデータ記憶装置によって背景画像提供部120を構成することも可能であるが、外光により照明環境が時々刻々と変化してゆく室内や、屋外を撮影した動画画像を取り扱う場合は、当然、背景画像も時間とともに変化させる必要がある。すなわち、定点カメラで撮影した動画画像であっても、朝、昼、晩といった時間経過により背景画像は変化し、また、雲の動き、日照状態の変化などの天候によっても背景画像は変化する。また、定点カメラの設置場所や撮影方向を変更した場合にも背景画像は変化する。
【0157】
このような背景画像の変化にも対応できるようにするためには、背景画像提供部120に、画像入力部110が過去の所定期間にわたって入力した原画像の単純平均もしくは重みづけ平均を求める機能をもたせておき、求めた平均画像を背景画像として提供するようにすればよい。平均画像は、動体の情報が希釈されているため、背景画像として利用するのに適している。図31に示す実施形態の背景画像提供部120は、このような機能をもった構成要素である。すなわち、画像入力部110が入力した原画像P(i)は、逐次、背景画像提供部120に与えられる。背景画像提供部120は、こうして与えられた原画像P(i)に基づいて平均画像を作成し、この平均画像を背景画像として動体識別画像生成部130に提供する機能を果たす。
【0158】
過去の原画像の平均をとることにより背景画像を作成する具体的な方法は、§1でいくつか述べたとおりである。たとえば、過去10分間に得られた原画像の単純平均を示す画像(個々の画素ごとの画素値の単純平均を求めた画像)を背景画像とするのであれば、背景画像提供部120には、常に、現時点から10分間だけ遡った分の原画像を蓄積するデータ記憶場所と、画素値の平均演算を行う演算機能と、を組み込んでおけばよい。もちろん、現時点に近い原画像の画素ほど大きな重みをつけるような重みづけ平均を求めることも可能である。
【0159】
ただ、30フレーム/秒程度の動画の10分間の画像データを蓄積するには、かなりの記憶容量が必要になるので、実用上は、§1で述べたとおり、第i番目の原画像P(i)が与えられたときに、第(i−1)番目の平均画像A(i−1)と、当該第i番目の原画像P(i)との2枚の画像に基づいて、第i番目の平均画像A(i)を作成する手法を採るのが好ましい。その具体的な手法は、図3で説明したとおりである。
【0160】
<6−3:動体識別画像生成部130>
動体識別画像生成部130は、画像入力部110から提供された第i番目の原画像P(i)と、背景画像提供部120から提供された背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する構成要素である。ここに示す実施形態の場合、図2で説明したように、第i番目の原画像P(i)と、第(i−1)番目の平均画像(すなわち背景画像)A(i−1)と、を比較することにより、第i番目の動体識別画像M(i)の生成が行われる。この動体識別画像M(i)は、背景領域K(i)と前景領域F(i)とを区別する二値画像である。
【0161】
ここで、動体識別画像M(i)を生成するには、図5で説明したとおり、原画像P(i)上の特定位置にある画素p(i)の色と、背景画像A(i−1)上の前記特定位置にある画素a(i−1)の色とを比較し、両画素の色の近似度が所定条件を満たす場合には当該特定位置にある画素m(i)を背景領域Kの画素とし、所定条件を満たさない場合には当該特定位置にある画素m(i)を前景領域Fの画素とすればよい。近似度の所定条件としては、たとえば、§1で述べたように、色空間上でのユークリッド距離を設定することができる。
【0162】
<6−4:トラッカー格納部150>
トラッカー格納部150は、トラッカーの情報を個々の動体ごとに格納する構成要素であり、具体的には、図24や図29に例示したような表の情報を格納する機能を果たす。ここで、トラッカーとは、既に説明したとおり、同一の動体に基づいて抽出されたと推定される複数のブロッブ包摂図形を先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べた情報である。
【0163】
図31のトラッカー格納部150のブロック内には、横方向に時系列をとったトラッカーを縦方向に複数並べた表が例示されている。ここで、T1,T2,... ,Tj,... は、個々のトラッカーの名称であり、各トラッカーには、それぞれ特定の時刻に対応する欄が設けられており、特定のブロッブ包摂図形を示す情報が登録される。たとえば、第j番目のトラッカーTjの欄を見ると、時刻t(i−1)の欄にはブロッブ包摂図形Bj(i−1)が登録されており、時刻t(i)の欄にはブロッブ包摂図形Bj(i)が登録されている。もちろん、まだブロッブ包摂図形の登録が行われていない未登録状態の欄もあれば、登録すべきブロッブ包摂図形がないことを示す無登録状態の欄もある。
【0164】
なお、ここに示す実施形態の場合、図13に示すように、個々のブロッブ包摂図形Bは動体の外接矩形によって構成されており、その実体は、2頂点Q1(x1,y1),Q2(x2,y2)の座標値である。したがって、トラッカー格納部150の各欄に格納される情報の実体は、(x1,y1,x2,y2)のような外接矩形の2頂点を示す座標値のデータということになる。すなわち、トラッカー格納部150は、外接矩形の対角に位置する2頂点の座標値をトラッカーの情報として格納することになる。
【0165】
もちろん、トラッカー格納部150は、一連のブロッブ包摂図形を時系列で並べた情報を示すトラッカーを複数格納する機能をもっていれば足り、個々のブロッブ包摂図形をどのようなデータで表現し、時系列の並びの情報をどのような形態で記録するかは任意である。したがって、トラッカー格納部150内に格納される具体的なデータ構造は、ここに例示した形態に限定されるものではない。
【0166】
<6−5:マスキング処理部140>
マスキング処理部140は、動体識別画像生成部130が生成した動体識別画像Mの前景領域Fに対して、トラッカー格納部150に格納されている特定のブロッブ包摂図形を利用したマスキングを行う構成要素である。より具体的には、トラッカー格納部150に格納されている第j番目のトラッカーTjを着目トラッカーとして、着目外トラッカー(Tj以外のトラッカー)の第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことにより、着目トラッカーTj用の個別動体識別画像M(i,j)を生成し、これをブロッブ包摂図形抽出部に提供する。
【0167】
たとえば、j=1とすれば、トラッカーT1が着目トラッカーになり、トラッカーT2以降の全トラッカーが着目外トラッカーになる。そして、動体識別画像M(i)に対して、各着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形を利用したマスキング処理を行うことにより、着目トラッカーT1用の個別動体識別画像M(i,1)が生成される。同様に、J=2とすれば、着目トラッカーT2用の個別動体識別画像M(i,2)が生成され、J=3とすれば、着目トラッカーT3用の個別動体識別画像M(i,3)が生成される。
【0168】
図20(b) ,図21(b) ,図22(b) ,図23(b) に示されている個別動体識別画像M(30,1),M(30,2),M(30,3),M(30,4)は、こうして作成された個別動体識別画像の実例である。なお、これらの個別動体識別画像は、トラッカー登録部160における後続ブロッブ包摂図形登録処理に利用されるものであるので、後続ブロッブ包摂図形をみつける必要のないトラッカーについては作成する必要はない。
【0169】
たとえば、図24に示す例の場合、トラッカーT1〜T4については、時刻t29欄にブロッブ包摂図形が登録されており、時刻t30欄に登録すべき後続ブロッブ包摂図形をみつける必要があるので、トラッカーT1〜T4をそれぞれ着目トラッカーとして、個別動体識別画像M(30,1),M(30,2),M(30,3),M(30,4)を作成する必要があるが、トラッカーT5,T6については、時刻t29欄が無登録状態(×印)であるため、時刻t30欄に登録すべき後続ブロッブ包摂図形は存在しない。したがって、トラッカーT5,T6を着目トラッカーとして、個別動体識別画像M(30,5),M(30,6)を作成する必要はない。結局、マスキング処理部140は、第(i−1)番目の時系列にブロッブ包摂図形B(i−1)が登録されているトラッカーについてのみ個別動体識別画像M(i,j)を生成すれば足りる。
【0170】
<6−6:ブロッブ包摂図形抽出部170>
ブロッブ包摂図形抽出部170は、動体識別画像生成部130が生成した第i番目の動体識別画像M(i)に基づいて、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)を動体と認識し、当該画素集団の外接矩形を第i番目の時系列に所属するブロッブ包摂図形B(i)として抽出する機能と、マスキング処理部140が生成した個別動体識別画像M(i,j)について、マスキングされた部分を除いた前景領域Fを構成するひとまとまりの画素集団(ブロッブ)を動体と認識し、動体と認識した画素集団の外接矩形を第i番目の時系列に所属させるべき第j番目のトラッカー用の候補ブロッブ包摂図形として抽出する機能と、を有する構成要素である。
【0171】
具体的には、図19(b) に示すブロッブ包摂図形B30g,B30d(太線で示す矩形)が、動体識別画像M30から抽出されたブロッブ包摂図形であり、図20(b) ,図21(b) ,図22(b) ,図23(b) に示すブロッブ包摂図形B30a,B30b,B30c,B30dが、それぞれ個別動体識別画像M(30,1),M(30,2),M(30,3),M(30,4)から抽出されたブロッブ包摂図形である。
【0172】
なお、動体識別画像M上の前景領域Fを構成するひとまとまりの画素集団から、その外接矩形をブロッブ包摂図形として抽出する方法には、いくつかの具体的な方法が知られている。ここでは、動体識別画像Mが、小さな矩形状の画素を縦横に行列状に並べた画素配列から構成される一般的な画像であった場合を例にとって、比較的単純なアルゴリズムに基づく方法を以下に例示しておく。図32は、このブロッブ包摂図形抽出処理の手順の一例を示す流れ図である。
【0173】
まず、ステップS1において、動体識別画像M上に初期着目画素を設定する。動体識別画像Mが、縦横の画素配列をもつ一般的な画像であった場合、たとえば、左上の画素(1行1列目の画素)を初期着目画素に設定すればよい。続くステップS2では、着目画素が前景画素か否かの判定を行う。たとえば、図5に示す方法で作成された動体識別画像Mの場合、画素値=1であれば前景画素ということになる。
【0174】
このステップS2において、前景画素との判定がなされた場合には、ステップS3において、当該着目画素のn画素以内の距離に登録矩形が存在するか否かの判定がなされる。ここで、登録矩形とは、後述するように、ステップS4で登録された矩形、もしくは、当該矩形に基づいてステップS5により拡張された矩形である。一方、ステップS2において、前景画素との判定がなされなかった場合(すなわち、着目画素が背景画素であった場合)には、ステップS6へと進むことになる。
【0175】
続いて、ステップS3の判定結果に基づく分岐を説明しよう。まず、ステップS3において、着目画素のn画素以内の距離に登録矩形が存在しないと判定された場合には、ステップS4において、当該着目画素自身の輪郭矩形を登録する処理が行われる。一方、ステップS3において、着目画素のn画素以内の距離に登録矩形が存在すると判定された場合には、ステップS5において、当該登録矩形の領域を、当該着目画素を含む外接矩形にまで拡張する処理が行われる。
【0176】
このような処理を、ステップS6,S7を経て、全画素について着目するまで繰り返し実行すれば、すなわち、全画素を着目画素とする走査を行えば、このブロッブ包摂図形抽出処理は完了である。完了時点で登録されていた矩形が、ブロッブ包摂図形として抽出すべき外接矩形になる。
【0177】
ここでは、図33に示すような具体的な画像を処理対象として、図32に示すブロッブ包摂図形抽出処理を施した場合のプロセスを簡単に説明しておこう。図34は、このブロッブ包摂図形抽出処理の手順を施したプロセスの各段階を示す平面図である。
【0178】
図33に例示する画像は、6行12列に配列された合計72個の画素からなる単純な画像である。ここでは、ハッチングを施した画素が前景画素、白地の画素が背景画素であるものとする。図示のとおり、この画像には、前景領域を構成するひとまとまりの画素集団(ハッチングを施した前景画素の集団:すなわちブロッブ)が2組含まれており、正しいブロッブ包摂図形抽出処理が実行されれば、これら2組の画素集団(ブロッブ)についての外接矩形が、それぞれブロッブ包摂図形として抽出されるはずである。なお、着目画素の走査は、同一行に含まれる左側の画素から右側の画素へと順に行い、1行の走査が完了したら、次の行の走査に移ることにする。
【0179】
まず、ステップS1において、1行1列目の画素が初期着目画素として設定される。この初期着目画素は前景画素ではないので、ステップS2からステップS6,S7を経て、1行2列目の画素が次の着目画素になる。当該着目画素も前景画素ではないので、1行3列目の画素が次の着目画素になる。図33に示す例の場合、1行目には前景画素が存在しないので、2行目の画素について着目する処理が続行される。
【0180】
そうすると、2行2列目の画素が着目画素となった段階で、はじめて着目画素が前景画素になる。そこで、ステップS3の判定が行われるが、この時点では、まだ登録された矩形は存在しないので、ステップS4に進み、当該着目画素自身の輪郭矩形が登録矩形として登録されることになる。図34(a) は、このような登録がなされた状態を示している。図に太線で示す矩形が登録矩形である。続いて、ステップS6,S7を経て、2行3列目の画素が次の着目画素になるが、2行目には、以降、前景画素が存在しないので、3行目の画素について着目する処理が続行される。
【0181】
すると、3行2列目の画素が着目画素となった段階で、再び着目画素が前景画素になる。そこで、ステップS3の判定が行われる。ここでは、説明の便宜上、n=3に設定した場合を考えてみよう(実用上は、より大きなnを設定するのが一般的である)。すると、図34(a) に示すとおり、3行2列目の着目画素に対して、3画素以内の距離に登録矩形(太線の矩形)が存在するので、ステップS5へと進み、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(b) は、このような拡張がなされた状態を示している。これまで1画素分の大きさしかなかった登録矩形が、縦長の2画素分の登録矩形に拡張されている。
【0182】
続いて、ステップS6,S7を経て、3行3列目の画素が次の着目画素になるが、この画素も前景画素である。そこで、ステップS3の判定を行うと、図34(b) に示すとおり、3行3列目の着目画素に対して、3画素以内の距離に登録矩形(太線の矩形)が存在するので、ステップS5へと進み、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(c) は、このような拡張がなされた状態を示している。これまで2画素分の大きさしかなかった登録矩形が、4画素分の登録矩形に拡張されている。
【0183】
続いて、ステップS6,S7を経て、3行4列目の画素が次の着目画素になるが、この画素は前景画素ではない。そこで、ステップS6,S7を経て、3行5列目の画素が次の着目画素になるが、この画素は前景画素である。そこで、ステップS3の判定を行うと、図34(c) に示すとおり、3行5列目の着目画素に対して、3画素以内の距離に登録矩形(太線の矩形)が存在するので、ステップS5へと進み、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(d) は、このような拡張がなされた状態を示している。これまで4画素分の大きさしかなかった登録矩形が、8画素分の登録矩形に拡張されている。
【0184】
再び前景画素が着目画素となるのは、3行10列目である。この3行10列目の画素を着目画素として、ステップS3の判定を行うと、図34(d) に示すとおり、登録矩形(太線の矩形)は存在するものの、5画素分だけ離れているため、着目画素に対して3画素以内の距離の登録矩形は存在しない。そこで、ステップS4に進み、当該着目画素自身の輪郭矩形が登録矩形として登録されることになる。図34(e) は、このような登録がなされた状態を示している。これにより、第2の登録矩形が生成されたことになる。
【0185】
続いて、3行11列目の画素が着目画素になる。当該着目画素は前景画素であり、左隣に登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(f) は、このような拡張がなされた状態を示している。これまで1画素分の大きさしかなかった第2の登録矩形が、2画素分の登録矩形に拡張されている。
【0186】
次に、4行2列目の画素が着目画素になると、図34(f) に示すとおり、上隣に第1の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(g) は、このような拡張がなされた状態を示している。これまで8画素分の大きさしかなかった第1の登録矩形が、12画素分の登録矩形に拡張されている。
【0187】
続いて、4行3列目〜5列目の画素が着目画素になった場合、当該着目画素自身が登録矩形内の画素になるため、当然、3画素以内の距離に登録矩形が存在するため、ステップS5へ進むが、既に当該登録矩形は当該着目画素を含む外接矩形に拡張されているため、実質的な登録矩形の拡張は行われない。ただ、4行6列目の画素が着目画素になると、左隣に第1の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図34(h) は、このような拡張がなされた状態を示している。これまで12画素分の大きさしかなかった第1の登録矩形が、15画素分の登録矩形に拡張されている。
【0188】
続いて、4行11列目の前景画素が着目画素になると、図34(h) に示すとおり、上隣に第2の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図35(i) は、このような拡張がなされた状態を示している。これまで2画素分の大きさしかなかった第2の登録矩形が、4画素分の登録矩形に拡張されている。
【0189】
歳後に、5行11列目の前景画素が着目画素になると、図34(i) に示すとおり、上隣に第2の登録矩形が存在するので、当該登録矩形の領域を、当該着目画素を含む外接矩形に拡張する処理が行われる。図35(j) は、このような拡張がなされた状態を示している。これまで4画素分の大きさしかなかった第2の登録矩形が、6画素分の登録矩形に拡張されている。かくして、15画素分の画素の輪郭を包摂する第1の登録矩形と、6画素分の画素の輪郭を包摂する第2の登録矩形とが、それぞれブロッブ包摂図形として抽出されることになる。
【0190】
結局、ブロッブ包摂図形抽出部170が、上述した方法でブロッブ包摂図形抽出を行うには、動体識別画像Mを構成する個々の画素に順に着目し、各着目画素について、(a) 着目画素が前景画素であり、かつ、所定近傍範囲(上例の場合、3画素以内の距離)に登録矩形が存在しない場合には、当該着目画素の輪郭を構成する矩形を登録する処理を行い、(b) 着目画素が前景画素であり、かつ、所定近傍範囲に登録された矩形が存在する場合には、当該登録矩形の領域を着目画素を含む外接矩形に拡張して登録する処理を行い、最終的に登録された矩形に基づいてブロッブ包摂図形の抽出を行うようにすればよい。
【0191】
もちろん、上述したブロッブ包摂図形抽出処理の方法は、一例を示すものであり、図31に示すブロッブ包摂図形抽出部170によるブロッブ包摂図形抽出処理の方法は、上述した方法に限定されるものではない。
【0192】
<6−7:トラッカー登録部160>
トラッカー登録部160の基本機能は、ブロッブ包摂図形抽出部170によって抽出された第i番目の時系列に所属するブロッブ包摂図形B(i)を、第j番目のトラッカーTjの第i番目の時系列に所属するメンバーとして、トラッカー格納部150に登録することである。実際には、このトラッカー登録部160によって実行される処理は、後続ブロッブ包摂図形登録処理と新参ブロッブ包摂図形登録処理とに分けて行われる。ここで、後続ブロッブ包摂図形登録処理は先行して行われる前半段階の処理であり、新参ブロッブ包摂図形登録処理は、後続ブロッブ包摂図形登録処理が実行された後に行われる後半段階の処理である。
【0193】
まず、後続ブロッブ包摂図形登録処理は、トラッカーの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形(末尾ブロッブ包摂図形ではないブロッブ包摂図形)に対して、第i番目の時系列として後続ブロッブ包摂図形を登録するための処理である。ここで、後続ブロッブ包摂図形の登録は必ず行われるわけではなく、後続ブロッブ包摂図形に適したブロッブ包摂図形が存在しない場合には、登録は行われず、当該先行ブロッブ包摂図形は末尾ブロッブ包摂図形となり、ブロッブ包摂図形の継続性は絶たれる。この後続ブロッブ包摂図形登録処理の具体的な手法は、既に、§4において、後続ブロッブ包摂図形の認識法として説明したとおりである。
【0194】
すなわち、この後続ブロッブ包摂図形登録処理は、第j番目のトラッカーTjの第(i−1)番目の時系列に末尾ブロッブ包摂図形ではないブロッブ包摂図形が登録されている場合に、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、これに後続させるのに適したブロッブ包摂図形が、ブロッブ包摂図形抽出部170から与えられた第j番目のトラッカー用の候補ブロッブ包摂図形内に存在するか否かを判定し、存在するときには、当該候補ブロッブ包摂図形を第i番目の時系列に所属する後続ブロッブ包摂図形として登録する処理を行い、存在しないときには、前記先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示す処理を行うことによって構成される。
【0195】
たとえば、図24に示す例の場合、トラッカーT1の第29番目の時系列(時刻t29欄)には、末尾ブロッブ包摂図形ではないブロッブ包摂図形B29a(馬)が登録されているので、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、第30番目の時系列(時刻t30欄)に登録するのに適した後続ブロッブ包摂図形の認識が行われる。既に述べたとおり、後続ブロッブ包摂図形は、たとえば、図26(b) に示すような4つの候補ブロッブ包摂図形B30a−1,B30a−2,B30a−3,B30a−4の中から選択される。もちろん、この4つの候補の中に、後続ブロッブ包摂図形として適したブロッブ包摂図形が存在しない場合には、後続ブロッブ包摂図形の登録は行われない。
【0196】
このため、トラッカー登録部160は、後続ブロッブ包摂図形登録処理を行う際に、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に対して、第j番目のトラッカー用として抽出された個々の候補ブロッブ包摂図形の適合性評価を行い、所定の基準以上の評価、かつ、最も高い評価を得た候補ブロッブ包摂図形を、先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形と判定し、これを後続ブロッブ包摂図形として登録する処理を行う。上例の場合、図19(a) に示す先行ブロッブ包摂図形B29a(馬)に対して、図26(b) に示す4つの候補ブロッブ包摂図形B30a−1,B30a−2,B30a−3,B30a−4の適合性評価が行われ、最も高い評価を得たブロッブ包摂図形が、所定の基準以上の評価であれば、これを後続ブロッブ包摂図形として登録することになる。
【0197】
たとえば、図26(b) に示す例の場合、既に述べたように、候補ブロッブ包摂図形B30a−1が、最も高い評価、かつ、所定の基準以上の評価を得ることになるため、先行ブロッブ包摂図形B29a(馬)に後続する後続ブロッブ包摂図形として、トラッカーT1の時刻t30欄に登録されることになる。なお、最も高い評価を得た候補でも、所定の基準に満たない場合には、後続ブロッブ包摂図形として登録されることはない。たとえば、図26(b) において、候補ブロッブ包摂図形B30a−1が存在しなかった場合、たとえ、候補ブロッブ包摂図形B30a−3が最も高い評価を得たとしても、当該評価が所定の基準に満たない場合には、候補ブロッブ包摂図形B30a−3が後続ブロッブ包摂図形として登録されることはない。
【0198】
後続ブロッブ包摂図形としての適合性評価は、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形との位置、面積、形状の類似性に基づいて行うようにすればよい。図35は、このような後続ブロッブ包摂図形の適合性評価の方法を示す平面図である。
【0199】
図35(a) は、位置の類似性に基づく適合性評価の方法を示している。ここで、太線の矩形は、先行ブロッブ包摂図形B(i−1)であり、他の3つの矩形は、比較対象となる候補ブロッブ包摂図形B(i)a,B(i)b,B(i)cである。ここに示す例では、各ブロッブ包摂図形を構成する矩形の中心点Q,Qa,Qb,Qcを、各ブロッブ包摂図形の位置と定義し、中心点間の距離が小さいほど、類似性に関して高い評価値を与えるようにしている。たとえば、2点Q/Qa間の距離、2点Q/Qb間の距離、2点Q/Qc間の距離を求め、これらの距離の逆数を位置の類似性を示す評価値とすれば、類似性を定量的に示す評価値を得ることができる。図示の例の場合、先行ブロッブ包摂図形B(i−1)に最も近い位置にある候補ブロッブ包摂図形B(i)bが、最高の評価値を得ることになる。
【0200】
このような評価は、同一の動体が短時間に移動した場合、別な動体の位置よりも近い位置に存在する可能性が高いであろう、という推定に基づくものである。
【0201】
なお、位置の類似性の評価材料としては、必ずしも距離を用いる必要はなく、重なり部分の面積を評価材料として用いることも可能である。たとえば、30フレーム/秒といったレートで撮影された動画画像の場合、動体のフレーム単位の移動時間はわずか1/30秒であるから、原画像P(i−1)上の動体の位置と、原画像P(i)上の動体の位置とに大きな差はなく、動体の輪郭を包摂するブロッブ包摂図形は、互いに重なりを生じているのが一般的である。そして、この重なり部分の面積が大きいほど、位置の類似性も高いことになるので、やはり位置の類似性を定量的に示す評価値を得ることができる。
【0202】
図35(a) に示す例の場合、重なり部分の面積を求めると、B(i−1)とB(i)aとは重なっていないので面積は0になり、B(i−1)とB(i)bとは、図にハッチングを施した部分の面積となり、B(i−1)とB(i)cとは重なっていないので面積は0になる。したがって、重なり部分の面積を評価値として利用すれば、やはり候補ブロッブ包摂図形B(i)bが、最高の評価値を得ることになる。
【0203】
一方、図35(b) は、面積の類似性に基づく適合性評価の方法を示している。すなわち、先行ブロッブ包摂図形B(i−1)の面積をAとして、候補ブロッブ包摂図形B(i)a,B(i)b,B(i)cの面積をそれぞれAa,Ab,Acとすれば、面積の類似性を示す評価値を得ることができる。たとえば、比較対象となる2つの矩形のうち、大きい方の面積をα、小さい方の面積をβとすれば、β/αが面積の類似性を定量的に示す評価値になる。評価値β/αの最大値は1であり、評価値が1に近いほど、面積の類似性が高いことになる。
【0204】
このような評価は、同一の動体が短時間に移動した場合、原画像上での大きさが急激に変化することはないであろう、という推定に基づくものである。もちろん、人が手足を動かして歩行した場合、原画像上での大きさは若干変化するであろう。また、動体がカメラに近づいたり、遠ざかったりする動きをした場合も、大きさは若干変化するであろう。しかしながら、1/30秒程度の移動時間では、動体の大きさに、それほど大きな変化は生じないであろう。したがって、面積の類似性に基づく適合性評価は、上述した位置の類似性に基づく適合性評価と同様に、合理的な評価方法である。
【0205】
そして、図35(c) は、形状の類似性に基づく適合性評価の方法を示している。ここに示す実施形態の場合、各ブロッブ包摂図形は矩形によって構成されているので、形状は、縦横比(アスペクト比)として定量化することができる。すなわち、先行ブロッブ包摂図形B(i−1)の形状は、アスペクト比v/hで表現することができ、候補ブロッブ包摂図形B(i)a,B(i)b,B(i)cの形状も、それぞれアスペクト比va/ha,vb/hb,vc/hcで表現することができる。したがって、たとえば、比較対象となる2つの矩形のアスペクト比のうち、大きい方のアスペクト比をα、小さい方のアスペクト比をβとすれば、面積を比較する場合と同様に、β/αが形状の類似性を定量的に示す評価値になる。評価値β/αの最大値は1であり、評価値が1に近いほど、形状の類似性が高いことになる。
【0206】
このような評価は、同一の動体が短時間に移動した場合、原画像上での形状が急激に変化することはないであろう、という推定に基づくものである。やはり、人が手足を動かして歩行した場合、原画像上での形状は若干変化するであろうが、同一の動体であれば、形状にそれほど大きな変化は生じないであろう。したがって、形状の類似性に基づく適合性評価は、上述した位置や面積の類似性に基づく適合性評価と同様に、合理的な評価方法である。
【0207】
結局、後続ブロッブ包摂図形としての適合性評価は、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて行うようにすればよい。複数の評価値を組み合わせて類似性の評価を行う場合は、上述したような方法で定量的に求めた各評価値に、それぞれ所定の重み係数を乗じ、これを積算して総合評価値を求めるようにすればよい。
【0208】
こうして求めた評価値が所定の基準値以上となるブロッブ包摂図形が、候補ブロッブ包摂図形の中に存在しない場合には、後続ブロッブ包摂図形として登録するのに適したブロッブ包摂図形が存在しないことになる。このように、後続ブロッブ包摂図形登録処理において、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形B(i−1)に後続させるのに適したブロッブ包摂図形が、第j番目のトラッカー用の候補ブロッブ包摂図形内に存在しない場合には、先行ブロッブ包摂図形B(i−1)に後続する後続ブロッブ包摂図形の登録を行わずに、当該先行ブロッブ包摂図形B(i−1)が末尾ブロッブ包摂図形となったことを示す処理を行う。
【0209】
ここで、第j番目のトラッカーTjの先行ブロッブ包摂図形B(i−1)が末尾ブロッブ包摂図形となったことを示す処理としては、第j番目のトラッカーTjの第i番目の時系列を無登録状態とする処理を行えばよい。ここで、無登録状態とは、登録すべきブロッブ包摂図形が存在しないことを示す状態であり、まだ登録が行われていない未登録状態とは意味合いが異なっている。たとえば、図29に示す例の場合、トラッカー上の×印欄は無登録状態を示し、空白欄は未登録状態を示している。
【0210】
もっとも、実用上は、無登録状態を示すデータと未登録状態を示すデータとを、必ずしも区別する必要はない。たとえば、図29に示すトラッカーT4,T5,T6の時刻t40欄は空白欄(未登録状態)になっているが、トラッカー登録部160による時刻t40に関する処理(後続ブロッブ包摂図形登録処理および新参ブロッブ包摂図形登録処理)が完了した時点では、これらの空白欄は×印欄と把握されることになる。もちろん、無登録状態と未登録状態とを明確に区別したい場合は、無登録状態を示すデータ(×印に対応するデータ)を積極的に書き込む処理を行うようにしてもよい。
【0211】
このように、これまで述べてきた実施形態の場合、第j番目のトラッカーTjの先行ブロッブ包摂図形B(i−1)が末尾ブロッブ包摂図形となったことを示すための処理として、第i番目の時系列を無登録状態とする処理が行われている。たとえば、図29に示す例は、§5で述べたとおり、動体O4(鳥)が、時刻t38までは存在したが、時刻t39において画面外へ飛び去った、という場合の例である。この場合、トラッカーT4の時刻t39欄に登録すべき後続ブロッブ包摂図形を認識する処理を行っても、後続ブロッブ包摂図形に適した候補ブロッブ包摂図形が存在しなかったため、時刻t39欄を無登録状態(×印)とする処理が行われている。別言すれば、時刻t39欄が無登録状態(×印)となっていることにより、間接的に、時刻t38欄のブロッブ包摂図形B38d(鳥)が末尾ブロッブ包摂図形であることが示されている。
【0212】
要するに、これまで述べてきた実施形態の場合、無登録状態(×印)の欄が、時系列で連続する一連のブロッブ包摂図形群の区切りとして機能し、何らかのブロッブ包摂図形が登録されている欄の左側の欄が無登録状態(×印)である場合には、当該ブロッブ包摂図形は先頭ブロッブ包摂図形ということになり、何らかのブロッブ包摂図形が登録されている欄の右側の欄が無登録状態(×印)である場合には、当該ブロッブ包摂図形は末尾ブロッブ包摂図形ということになる。このように、無登録状態(×印)の欄を、一連のブロッブ包摂図形群の区切りとして利用すれば、無登録状態(×印)の欄で挟まれた一連のブロッブ包摂図形群を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べられた同一の動体の追跡結果として把握することができる。
【0213】
ただ、一連のブロッブ包摂図形群の区切りを示す方法は、このような無登録状態(×印)の欄を設ける方法に限定されるものではない。たとえば、先頭ブロッブ包摂図形には、当該ブロッブ包摂図形が先頭ブロッブ包摂図形であることを示す識別コードを付してトラッカー上の該当欄に格納するようにし、末尾ブロッブ包摂図形には、当該ブロッブ包摂図形が末尾ブロッブ包摂図形であることを示す識別コードを付してトラッカー上の該当欄に格納するようにすれば、無登録状態(×印)の欄を設けなくても、上記識別コードに基づいて、個々のブロッブ包摂図形が先頭ブロッブ包摂図形であるのか、末尾ブロッブ包摂図形であるのか、あるいはこれらの間に挟まれた中間ブロッブ包摂図形であるのか、を判別することができる。
【0214】
このように、識別コードにより先頭ブロッブ包摂図形や末尾ブロッブ包摂図形の判別を行う方法を採用した場合、無登録状態(×印)の欄による区切りは不要になるので、末尾ブロッブ包摂図形に後続させて、別な動体(新参動体)についての先頭ブロッブ包摂図形を格納することが可能になる。たとえば、図29に示す例の場合、もし時刻t39に新参動体が出現した場合、当該新参動体についての新参ブロッブ包摂図形を、トラッカーT4の時刻t39欄に先頭ブロッブ包摂図形として登録することができる。この場合、トラッカーT4の時刻t38欄にはブロッブ包摂図形B38d(鳥)が登録されているが、当該ブロッブ包摂図形には、末尾ブロッブ包摂図形である識別コードが付されており、時刻t39欄に登録された新参ブロッブ包摂図形には、先頭ブロッブ包摂図形である識別コードが付されているので、無登録状態(×印)の欄による区切りがなくても支障は生じない。
【0215】
上例の場合、トラッカーT4の時刻t38欄のブロッブ包摂図形B38d(鳥)が末尾ブロッブ包摂図形となったことを示すための処理として、時刻t39欄を無登録状態(×印)とする処理を行う代わりに、時刻t38欄のブロッブ包摂図形B38d(鳥)に、当該ブロッブ包摂図形が末尾ブロッブ包摂図形であることを示す識別コードを書き込む処理を行うことになる。
【0216】
以上、トラッカー登録部160が前半段階の処理として行う後続ブロッブ包摂図形登録処理を説明した。続いて、後半段階の処理として行う新参ブロッブ包摂図形登録処理について説明しよう。この新参ブロッブ包摂図形登録処理は、第i番目の時系列の原画像P(i)で新たに出現した新参動体を、先頭ブロッブ包摂図形としてトラッカーに登録する処理であり、その具体的な手法は、既に、§5において、新参ブロッブ包摂図形の認識法として説明したとおりである。
【0217】
すなわち、この新参ブロッブ包摂図形登録処理は、後続ブロッブ包摂図形登録処理を各トラッカーについて行った後、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)の中に、後続ブロッブ包摂図形登録処理によって登録された後続ブロッブ包摂図形に対応しない新参ブロッブ包摂図形が存在する場合に、当該新参ブロッブ包摂図形を第i番目の時系列が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録する処理である。
【0218】
たとえば、図24に示す例の場合、前半段階の後続ブロッブ包摂図形登録処理により、トラッカーT1,T2,T3の時刻t40欄に、それぞれブロッブ包摂図形B40a(馬),B40b(人),B40c(車)が登録されている。そこで、後半段階の新参ブロッブ包摂図形登録処理では、図28(b) に示すように、動体識別画像M40に基づいて抽出された4つのブロッブ包摂図形B40a,B40b,B40c,B40eについて、図24に示す時刻t40欄に登録されているブロッブ包摂図形B40a(馬),B40b(人),B40c(車)に対応しない新参ブロッブ包摂図形が存在するか否かが判定される。その結果、ブロッブ包摂図形B40e(犬)については、対応する後続ブロッブ包摂図形が登録されていないことが判明するので、このブロッブ包摂図形B40e(犬)を新参ブロッブ包摂図形として、時刻t40欄が未登録状態となっている任意のトラッカーに先頭ブロッブ包摂図形として登録する処理が行われる。
【0219】
なお、§5で述べたとおり、原画像上に互いに重なり合う動体が存在する場合は、動体識別画像に基づいて抽出されたブロッブ包摂図形と、前半段階の後続ブロッブ包摂図形登録処理により登録された後続ブロッブ包摂図形との間の対応関係は、1対1ではなく、1対n(n≧2)になる。すなわち、2つのブロッブ包摂図形を構成する矩形が完全に一致する対応関係ではなく、一方のブロッブ包摂図形を構成する矩形が他方のブロッブ包摂図形を構成する矩形を包含する対応関係になる。この場合でも、図30に示すようなテーブルを作成しておけば、両者の対応関係を認識することができるので、対応する後続ブロッブ包摂図形の有無の判定を行うことができ、新参ブロッブ包摂図形の存在を認識することができる。
【0220】
結局、トラッカー登録部160は、後半段階の新参ブロッブ包摂図形登録処理を行う際に、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)と、前半段階の後続ブロッブ包摂図形登録処理によって第i番目の時系列に登録された後続ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、前記ブロッブ包摂図形B(i)の中で対応関係が認識できないブロッブ包摂図形を新参ブロッブ包摂図形と認識すればよい。
【0221】
<6−8:コンピュータを用いた構成>
以上、図31に示すブロック図を参照しながら、本発明の基本的な実施形態に係る動体追跡装置の構成および動作を説明したが、実際には、この装置は、コンピュータに専用のプログラムを組み込むことにより構成することができる。たとえば、トラッカー格納部150は、コンピュータの記憶装置によって実現することができ、画像入力部110は、コンピュータの入出力インターフェイスによって実現することができ、その余の構成要素は、コンピュータがプログラムと協働して実行する機能として実現することができる。
【0222】
<<< §7.いくつかの変形例 >>>
続いて、ここでは、§6で述べた基本的な実施形態に係る動体追跡装置の変形例をいくつか述べておく。
【0223】
<7−1:マスキング処理時のブロッブ包摂図形の位置修正>
§6で述べたとおり、マスキング処理部140は、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)を利用して、第i番目の時系列の動体識別画像M(i)についてのマスキングを行うため、マスクと動体との間に若干の時差が生じる。このような時差の存在により、たとえば、図26(a) に例示する個別動体識別画像M(30,1)の場合、マスクとなるブロッブ包摂図形B29b,B29c,B29dから動体の一部が食み出してしまっている。その結果、個別動体識別画像M(30,1)からは、図26(b) に示すように、合計4組の候補ブロッブ包摂図形B30a−1,B30a−2,B30a−3,B30a−4が抽出されることになる。
【0224】
これら4組の候補ブロッブ包摂図形のうち、先行ブロッブ包摂図形B29a(馬)に後続させるべきブロッブ包摂図形は、候補ブロッブ包摂図形B30a−1であり、残りの3つの候補ブロッブ包摂図形は、いわばノイズブロッブ包摂図形というべき無用なブロッブ包摂図形である。もちろん、このようなノイズブロッブ包摂図形が混入していたとしても、トラッカー登録部160は、位置、面積、形状に関する類似性を評価し、先行ブロッブ包摂図形B29a(馬)に最も類似している候補ブロッブ包摂図形B30a−1を後続ブロッブ包摂図形として選択するので問題は生じない。しかしながら、このようなノイズブロッブ包摂図形の存在は、誤った選択を誘発する要因になるため、できるだけ避けるのが好ましい。すなわち、理想的には、図26(b) に示す個別動体識別画像M(30,1)ではなく、図20(b) に示す個別動体識別画像M(30,1)が得られるのが好ましい。
【0225】
そのためには、マスキング処理時に、マスクとして機能するブロッブ包摂図形の位置を修正すればよい。たとえば、図26(a) において、動体O2(人)を隠蔽する役割を果たしているブロッブ包摂図形B29bは、図19(a) に示すように、時刻t29の時点における動体O2(人)の位置を示すものである。ところが、動体O2(人)は画面の右方向へ移動しているため、時刻t30の時点では、図26(a) に示すように、動体O2(人)の一部がマスクとなるブロッブ包摂図形B29bの右側に食み出してしまっている。このような食み出しを防止するには、ブロッブ包摂図形B29bが動体O2(人)の移動とともに画面の右方向へ移動していったものと推定して、時刻t30の時点におけるブロッブ包摂図形B29bの予測位置を求め、マスクとなるブロッブ包摂図形B29bに対して、当該予測位置への位置修正を施すようにすればよい。
【0226】
図26(a) に示す例の場合、右方向に移動中の動体O2(人)のマスクとして機能するブロッブ包摂図形B29bは若干右方向に位置修正し、左方向に移動中の動体O3(車)および動体O4(鳥)のマスクとして機能するブロッブ包摂図形B29c,B29dは若干左方向に位置修正すればよい。もちろん、このような位置修正は、あくまでも予想位置への修正であるため、実際には、位置修正後のマスクによっても、各動体を完全に隠蔽することはできないかもしれないが、少なくとも、食み出しの程度を低減することができるので、上述したノイズブロッブ包摂図形の面積を低減させる効果は得られる。
【0227】
このように、マスキング処理時にマスクとして機能するブロッブ包摂図形の位置修正を行うには、マスキング処理部140に、各トラッカーに格納されている第(i−1)番目以前の連続した時系列に所属するブロッブ包摂図形の位置の変遷に基づいて、第i番目の時系列に所属するブロッブ包摂図形の予測位置を求める機能を付加しておき、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形に対して、前記予測位置への位置修正を施し、位置修正後の外接矩形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにすればよい。
【0228】
たとえば、図26(a) に示す例において、動体O2(人)のマスクとして機能するブロッブ包摂図形B29bについての時刻t30の時点での予測位置は、図24に示すトラッカーT2の時刻t29以前の欄に格納されているブロッブ包摂図形の位置の変遷に基づいて求めることができる。以下、このような過去の位置(時刻t(i−1)以前の位置)の変遷に基づいて、次の時点(時刻t(i)の時点)の予測位置を求める具体的な方法を2例だけ述べておく。
【0229】
図36は、このような予測位置を求めるための第1の具体的な方法を示す平面図である。ここでは、同一のトラッカーの時刻t(i−4),t(i−3),t(i−2),t(i−1)の各欄に、それぞれ図示のようなブロッブ包摂図形B(i−4),B(i−3),B(i−2),B(i−1)が登録されている状態において、この一連のブロッブ包摂図形の時刻t(i)の時点での予測位置を示すブロッブ包摂図形B(i)′を求める具体的な方法を説明しよう。ここでは、各ブロッブ包摂図形を構成する矩形の中心点を、当該ブロッブ包摂図形の位置の基準点R0〜R4と定義することにする。もちろん、各ブロッブ包摂図形の位置の基準点は、必ずしも矩形の中心点に定義する必要はなく、たとえば、矩形の左上隅点などに定義してもかまわない。あるいは、ブロッブ包摂図形の抽出時に前景領域Fの重心点を求めておき、この重心点をブロッブ包摂図形の位置の基準点としてもよい。
【0230】
この第1の具体的な方法の要点は、第(i−L)番目(Lは2以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)の位置の基準点から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)の位置の基準点へ向かうベクトルに対して、その長さを(L/(L−1))倍に伸ばすことにより得られるベクトルの先端を予測位置の基準点とすることにある。
【0231】
図36に示す例は、L=4の場合であり、時刻t(i−4)欄に登録されているブロッブ包摂図形B(i−4)の位置の基準点R4から、時刻t(i−1)欄に登録されているブロッブ包摂図形B(i−1)の位置の基準点R1へ向かうベクトル「R4→R1」に対して、その長さを(4/(4−1))倍に伸ばすことにより得られるベクトル「R4→R0」の先端の点R0が、予測位置の基準点として求められることになる。
【0232】
一方、図37は、予測位置を求めるための第2の具体的な方法を示す平面図である。この第2の具体的な方法の要点は、第(i−L)番目(Lは3以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)まで、合計L個のブロッブ包摂図形の各位置の基準点を近似的に通る二次曲線Cを求め、この二次曲線C上の点を予測位置の基準点とすることにある。このような二次曲線Cを求める具体的な方法は、種々のアルゴリズムに基づく方法が公知であるため、ここでは詳しい説明は省略する。
【0233】
図37に示す例は、L=4の場合であり、時刻t(i−4)欄に登録されているブロッブ包摂図形B(i−4)から、時刻t(i−1)欄に登録されているブロッブ包摂図形B(i−1)まで、合計4個のブロッブ包摂図形の各位置の基準点R4,R3,R2,R1を近似的に通る二次曲線Cを求め、この二次曲線C上の点R0が、予測位置の基準点として求められることになる。二次曲線C上に点R0を求めるには、たとえば、2点R4/R3間、R3/R2間、R2/R1間の二次曲線Cに沿った距離を求め、これらの距離の平均だけ点R1から隔たった二次曲線C上の点を、点R0とすればよい。
【0234】
図36に例示する方法はいわゆる一次補間によって予測位置の基準点R0を決定する方法であり、図37に例示する方法はいわゆる二次補間によって予測位置の基準点R0を決定する方法である。一般に、後者の方法の方が、より正確な予測ができるものとされている。いずれの場合も、ブロッブ包摂図形B(i−1)の位置が、ブロッブ包摂図形B(i)′の位置に修正された上で、マスキングが行われることになる。もちろん、ブロッブ包摂図形B(i)′は、あくまでも予測によって位置修正されたマスクの位置を示すものであり、トラッカーの時刻t(i)欄に実際に登録されるブロッブ包摂図形B(i)とは異なるものである。
【0235】
<7−2:マスキング処理時のブロッブ包摂図形の拡張修正>
上述した§7−1では、ノイズブロッブ包摂図形を低減させるために、マスキング処理時にブロッブ包摂図形の位置を修正する方法を述べたが、ここで述べる方法は、同じ目的のために、ブロッブ包摂図形の大きさを拡張修正する方法である。
【0236】
この方法を採用する場合、マスキング処理部140は、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)となる矩形に対して、輪郭線を所定量だけ外方へ拡張する修正を施し、拡張修正後の図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うようにすればよい。
【0237】
図38は、このような拡張修正の具体例を示す平面図である。図38(a) は、図26(a) と同様に、個別動体識別画像M(30,1)を示す平面図である。ここで、ブロッブ包摂図形B29b,B29c,B29dは、マスクとなるブロッブ包摂図形であり、前述したとおり、これらのマスクから動体の一部が食み出した状態となっている。上述した§7−1では、マスクの位置を修正することにより、この食み出し状態を解消するアプローチが採られたが、ここでは、マスクを広げることにより、食み出し部分まで隠蔽するアプローチが採られる。すなわち、図に破線で示す矩形B29b′,B29c′,B29d′は、ブロッブ包摂図形B29b,B29c,B29dとなる矩形に対して、輪郭線を所定量だけ外方へ拡張する修正を施して得られる拡張修正後のマスク図形である。
【0238】
このような拡張修正後のマスク図形を用いたマスキング処理が施された個別動体識別画像M(30,1)からブロッブ包摂図形抽出処理を行うと、図38(b) に示すように、合計3組の候補ブロッブ包摂図形B30a−1,B30a−3,B30a−4が抽出される。この図38(b) を図26(b) と比較すると、候補ブロッブ包摂図形B30a−2は消滅し、候補ブロッブ包摂図形B30a−3,B30a−4の面積は縮小していることがわかる。すなわち、ノイズブロッブ包摂図形を低減する効果が得られたことになる。もちろん、このような拡張修正と、§7−1で述べた位置修正とを併用してもよい。
【0239】
<7−3:マスキング処理時のブロッブ包摂図形の取捨選択>
本発明において、マスキング処理部140によるマスキング処理により、個別動体識別画像を作成する理由は、複数の動体が交差した場合の問題を解決するためである。したがって、他の動体と重なりを生じていない動体については、必ずしもマスキングによる隠蔽を行う必要はない。
【0240】
たとえば、図26(a) に示す例の場合、動体O1(馬)についてのブロッブ包摂図形が登録されている着目トラッカーT1用の個別動体識別画像M(30,1)を生成するために、ブロッブ包摂図形B29b(人),ブロッブ包摂図形B29c(車),ブロッブ包摂図形B29d(鳥)を用いたマスキングを行っている。しかしながら、この例の場合、時刻t30において、動体O1(馬),動体O2(人),動体O3(車)は重なりを生じているが、動体O4(鳥)は重なりを生じていない。したがって、動体O4(鳥)については、ブロッブ包摂図形B29d(鳥)を用いたマスキング処理による隠蔽を行わなくても支障は生じない。すなわち、図26(b) に示す例において、ブロッブ包摂図形B30a−4の代わりに、動体O4(鳥)の全体に対応するブロッブ包摂図形が候補ブロッブ包摂図形として残っていたとしても、後続ブロッブ包摂図形として選択される候補がブロッブ包摂図形B30a−1(馬)であることに変わりはない。
【0241】
このような点を考慮すれば、マスキング処理部140によるマスキング処理には、必ずしも着目外トラッカーに登録されているすべてのブロッブ包摂図形を用いる必要はないことがわかる。たとえば、マスキング処理部140が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形のうち、着目トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形の所定の近傍範囲内に位置するブロッブ包摂図形のみを用いて、マスキングを行うようにしてもかまわない。
【0242】
図26(a) に示す例の場合、動体O1(馬)についてのブロッブ包摂図形が登録されている着目トラッカーT1用の個別動体識別画像M(30,1)を生成する際に、着目外トラッカーT2〜T4の時刻t29欄に登録されているブロッブ包摂図形のうち、着目トラッカーT1の時刻t29欄に登録されているブロッブ包摂図形B29a(馬)の所定の近傍範囲内に位置するブロッブ包摂図形B29b(人)およびB29c(車)のみを用いて、マスキングを行うようにしてもかまわない。この場合、ブロッブ包摂図形B29d(鳥)によるマスキングは行われないことになる。
【0243】
<7−4:後続ブロッブ包摂図形登録時の大きさ修正>
一般に、同一の動体に基づいて抽出されたブロッブ包摂図形は、その大きさが急激に、あるいは極端に変化することはないと考えられる。図36や図37に例示したブロッブ包摂図形の変遷において、個々のブロッブ包摂図形が同一サイズの矩形で示されているのは、このような考え方に基づくものである。
【0244】
しかしながら、人,馬,鳥のような動物は、絶えず形態を変えながら移動する動体であるから、抽出したブロッブ包摂図形を時系列的に並べれば、少なからず大きさの変化が生じることになる。また、車のような動体であっても、向きを変えたり、カメラに対して近付いたり遠ざかったりすれば、ブロッブ包摂図形に大きさの変化が生じることになる。
【0245】
図39(a) は、同一の動体から抽出したブロッブ包摂図形を時系列的に並べた結果、大きさの変化が生じた例を示した平面図である。ここでは、動体の移動経路が破線で示すとおり直線であるものとし、各ブロッブ包摂図形の中心点が、この破線に沿って左から右へと移動するものとしよう。図示のブロッブ包摂図形B1〜B7は、同一の動体に基づいて、それぞれ時刻t1〜t7の時点で抽出されたブロッブ包摂図形であり、説明の便宜上、大きさの時間的な変化を誇張して描いてある。
【0246】
このようなブロッブ包摂図形B1〜B7は、同一の動体の外接矩形として抽出されたものであるから、当該動体の画像上に示す領域を示す情報としては正しい情報になる。しかしながら、トラッカー上にこのようなブロッブ包摂図形B1〜B7の並びが登録された場合、これらのブロッブ包摂図形に基づいて、各原画像上から部分画像を切出して、当該動体をズームアップした状態で追跡する動画提示を行うと、ズームアップの倍率がブロッブ包摂図形B1〜B7の大きさの変動に応じて変動するという弊害が生じる。
【0247】
たとえば、図7の下段に示すズームアップ画像では、ブロッブ包摂図形B30とブロッブ包摂図形B40の大きさが等しいため、ズームアップの倍率は一定になる。したがって、動体(車)をズームアップした状態で追跡するような動画提示を行っても違和感は生じない。ところが、図39(a) に示すように、大きさが変動するブロッブ包摂図形B1〜B7に基づいて、動体をズームアップした追跡を行うと、画面上で動体のサイズが変動することになり、非常に見にくい動画にならざるを得ない。
【0248】
このような問題を解決するには、図39(a) に示すブロッブ包摂図形B1〜B9を、トラッカーに後続ブロッブ包摂図形として登録する際に、大きさについての修正を施して、たとえば図39(b) に示すようなブロッブ包摂図形B1′〜B9′とし、これら修正後のブロッブ包摂図形をトラッカー上に登録するようにすればよい。
【0249】
具体的には、トラッカー登録部160が、後続ブロッブ包摂図形登録処理において第j番目のトラッカーTjについての後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形の大きさが、連続して先行登録されている所定数のブロッブ包摂図形の平均サイズとなるように、当該後続ブロッブ包摂図形の大きさに対する修正を行うようにすればよい。たとえば、ブロッブ包摂図形B1が先頭ブロッブ包摂図形(新参ブロッブ包摂図形)の場合、ブロッブ包摂図形B1についてはそのままの大きさで登録し、これに続く後続ブロッブ包摂図形B2については、ブロッブ包摂図形B1,B2の平均サイズとなるような修正を加えて登録し、更に続く後続ブロッブ包摂図形B3については、ブロッブ包摂図形B1〜B3の平均サイズとなるような修正を加えて登録する、と言った具合である。予め、過去n個分のブロッブ包摂図形の平均サイズとなるような修正を加える、というように定めておけば、動体の緩やかな大きさ変動には追従することができる。なお、図39(b) に示すブロッブ包摂図形B1′〜B9′は、いずれも同じ大きさになっており、上記方法で得られたブロッブ包摂図形を示すものではない。
【0250】
<7−5:ブロッブ包摂図形抽出部の動体認識>
ブロッブ包摂図形抽出部170によるブロッブ包摂図形抽出処理の具体な方法は、図32の流れ図を参照しながら説明したとおりであり、図34には、当該方法によるブロッブ包摂図形抽出のプロセスの実例を示した。このブロッブ包摂図形抽出処理は、動体識別画像Mに基づいて、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)を動体と認識し、当該画素集団の外接矩形を抽出する処理であるが、実際には、動体識別画像M上の前景領域Fが、必ずしも動体が存在する領域であるとは限らない。
【0251】
動体識別画像Mは、図5に示すように、原画像P(i)上の画素と背景画像A(i−1)上の画素との類否判定によって生成される画像であるため、本来は背景領域Kに所属する画素であっても、何らかの要因によって非類似と判定されると、前景領域Fに所属する画素になってしまう。たとえば、樹木の葉などに風が作用すると、光の反射状態が変動するため、前景領域Fと判定される可能性がある。また、海,川,池などを含む背景では、水面の変動が前景領域Fと判定される可能性もある。
【0252】
そこで、実用上は、ブロッブ包摂図形抽出部170が、面積が所定の基準に満たない画素集団については、動体と認識せず、ブロッブ包摂図形の抽出を行わないようにするのが好ましい。一般に、画面上で動体として認識して追跡対象にしたい物体は、画面上である程度の大きさをもっている物と考えられるので、面積が所定の基準に満たない画素集団については、動体と認識しなくても支障は生じない。そして、このように小面積の画素集団をブロッブ包摂図形として抽出しないことにより、候補ブロッブ包摂図形の数を低減し、演算負担を軽減することができるようになる。
【0253】
<7−6:ブロッブ包摂図形を構成する図形のバリエーション>
これまで述べてきた実施形態では、ブロッブ包摂図形抽出部170が、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)の外接矩形をブロッブ包摂図形として抽出しているが、ブロッブ包摂図形は、必ずしもブロッブの外接矩形である必要はない。たとえば、外接円や外接三角形など、任意形状の外接図形をブロッブ包摂図形として抽出してもかまわない。また、これまで述べてきた実施形態では、外接矩形として、画素配列の縦横方向に平行な四辺をもった矩形(いわゆる正則な四角形)を用いているが、もちろん、ブロッブ包摂図形として抽出する矩形は、必ずしも正則な四角形である必要はない。
【0254】
また、ブロッブ包摂図形として抽出する図形は、必ずしも前景領域F(ブロッブ)に接する図形(外接図形)である必要はない。たとえば、外接図形をひとまわり大きくした図形をブロッブ包摂図形として抽出するようにしてもかまわない。もちろん、前景領域F(ブロッブ)の細かな輪郭形状をそのまま示す図形をブロッブ包摂図形として抽出してもよい。要するに、本発明を実施するにあたり、ブロッブ包摂図形は、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)の大まかな輪郭を示すものであれば、任意の図形によって構成することができる。
【0255】
要するに、本願にいう「ブロッブ包摂図形」には、様々な形状をもった図形を用いることができ、前景領域Fを構成するひとまとまりの画素集団(ブロッブ)に外接する任意形状の図形や、これらの図形を外方に拡張して得られる任意形状の図形 などを広く利用することができる。ただ、実用上は、これまで述べてきた実施形態のように、正則な四角形からなる外接矩形を「ブロッブ包摂図形」として用いるのが好ましい。正則な四角形からなる外接矩形をブロッブ包摂図形として利用すれば、図13に示すように、対角2頂点の座標値によってのみ定義することができ、また、内部の画像を切出すような演算負担も軽くなる。
【0256】
<<< §8.本発明の基本的な技術思想 >>>
これまで本発明を基本的な実施形態およびその変形例について説明してきたが、ここでは、本発明の基本的な技術思想をまとめておく。
【0257】
まず、本発明に係る動体追跡装置は、動画画像について動体を検出し、これを追跡する機能をもった装置であり、その基本構成は、図31のブロック図に示すとおりである。
【0258】
すなわち、この動体追跡装置は、時系列で連続する複数の原画像P(i)からなる動画画像を入力する画像入力部110と、動画画像の背景を構成する背景画像を提供する背景画像提供部120と、第i番目の原画像P(i)と背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部130と、同一の動体と推定される画素集団の包摂図形からなるブロッブ包摂図形を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部150と、このトラッカー格納部150に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体を示すブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理部140と、マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出部170と、トラッカー格納部150に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体を示す先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体を示すブロッブ包摂図形を、着目動体以外の動体を示すブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から選択し、これをトラッカー格納部150に、先行ブロッブ包摂図形に後続する第i番目の時系列の後続ブロッブ包摂図形として登録するとともに、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形の登録が行われていない新参ブロッブ包摂図形を、第i番目の時系列が未登録状態のトラッカーに、先頭ブロッブ包摂図形として登録するトラッカー登録部と、によって構成されることになる。
【0259】
ここで、トラッカー登録部160は、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、第i番目の時系列の後続ブロッブ包摂図形として登録されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とする。
【0260】
一方、本発明は、動画画像について動体を検出し、これを追跡する動体追跡方法として把握することも可能である。図40は、この動体追跡方法の手順を示す流れ図である。
【0261】
図示のとおり、この動体追跡方法は、コンピュータが、時系列で連続する複数の原画像P(i)からなる動画画像を入力する画像入力段階S10と、コンピュータが、動画画像の背景を構成する背景画像と、第i番目の原画像P(i)とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成段階S20と、コンピュータが、第(i−1)番目の原画像P(i−1)内に含まれる着目動体の輪郭を包摂する先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる、着目動体と同一と推定される動体の輪郭を包摂する後続ブロッブ包摂図形を認識するとともに、第i番目の原画像P(i)において新たに出現した動体の輪郭を包摂する新参ブロッブ包摂図形を認識する後続/新参ブロッブ包摂図形認識段階S30と、を有している。
【0262】
ここで、後続/新参ブロッブ包摂図形認識段階S30は、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体の輪郭を包摂するブロッブ包摂図形を利用して、動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理ステップS31と、マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の輪郭を包摂する図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出ステップS32と、着目動体以外の動体を包摂するブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から、着目動体の輪郭を包摂する先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形を後続ブロッブ包摂図形として選択する後続ブロッブ包摂図形選択ステップS33と、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形が認識されていない新参ブロッブ包摂図形を、新たな動体の輪郭を包摂する新参ブロッブ包摂図形として認識する新参ブロッブ包摂図形認識ステップS34と、によって構成されている。
【0263】
また、後続ブロッブ包摂図形選択ステップS33では、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形を選択する処理が行われ、新参ブロッブ包摂図形認識ステップS34では、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形として認識されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とする処理が行われる。
【0264】
<<< §9.監視システムへの応用 >>>
最後に、本発明に係る動体追跡装置を監視システムに応用した実施形態を、図41に示すブロック図を参照しながら説明する。この監視システムは、図31に示す動体追跡装置に、ビデオカメラ210と部分動画提示部220とを付加したものである。
【0265】
ここで、ビデオカメラ210は、定点に設置され、周囲の動画画像を撮影して画像入力部110に与える構成要素である。一方、部分動画提示部220は、トラッカー格納部150から、1つの選択トラッカーに連続して登録されているブロッブ包摂図形B(i)を順次取り出し、画像入力部110が入力した原画像P(i)から、取り出したブロッブ包摂図形B(i)の内部の画像を切出して表示することにより、特定の動体を追跡した部分動画画像を提示する構成要素である。
【0266】
たとえば、図24に示すようなトラッカー情報がトラッカー格納部150に格納されている場合に、ユーザが、部分動画提示部220に対して、トラッカーT1を選択する指示を与えると、部分動画提示部220は、トラッカーT1の先頭から、ブロッブ包摂図形B1a,B2a,B3a,... ,B40aを順次取り出し、これらのブロッブ包摂図形に基づいて、それぞれ原画像P1,P2,P3,... ,P40から各ブロッブ包摂図形内を含む部分画像の切出しを行い提示する処理を行う。その結果、画面上には、動体O1(馬)をズームアップして追跡する動画が表示されることになる。
【0267】
もちろん、ビデオカメラ210がリアルタイムで撮影した動画画像に基づいて、所定の動体追跡を行うことも可能である。この場合、トラッカー格納部150内には、リアルタイムで各時刻欄のブロッブ包摂図形が登録されてゆくので、部分動画提示部220は、選択トラッカーについてブロッブ包摂図形の登録が行われたその時点で、当該ブロッブ包摂図形を取り出して部分画像の切出処理を行うことになる。
【0268】
なお、通常は、画像を表示するディスプレイ画面のアスペクト比とブロッブ包摂図形のアスペクト比とは異なっているため、部分動画提示部220は、ブロッブ包摂図形B(i)を所定量だけ外方へ拡張し、拡張された包摂図形の内部の画像を切出して表示するようにすればよい。たとえば、図7に示す例の場合、ブロッブ包摂図形B30,B40を構成する矩形(太線で示す矩形)のアスペクト比と、表示画面のアスペクト比とが異なっているため、ブロッブ包摂図形B30,B40を構成する矩形を所定量だけ外方へ拡張し、拡張された矩形(部分画像f30,f40の輪郭)の内部の画像が切出されている。こうすることにより、追跡対象となる動体が、画面内に常に正しく表示された状態でのズームアップ表示が可能になる。
【符号の説明】
【0269】
110:画像入力部
120:背景画像提供部
130:動体識別画像生成部
140:マスキング処理部
150:トラッカー格納部
160:トラッカー登録部
170:ブロッブ包摂図形抽出部
210:ビデオカメラ
220:部分動画提示部
A,Aa,Ab,Ac:ブロッブ包摂図形の面積
A(i−1),A(i):背景画像(平均画像)
a(i−1),a(i):背景画像を構成する1つの画素もしくはその画素値
B,B1〜B7,B1′〜B7′:ブロッブ包摂図形
B30〜B40:ブロッブ包摂図形
B10a〜B10d:ブロッブ包摂図形
B20a〜B20d:ブロッブ包摂図形
B29a〜B29d:ブロッブ包摂図形
B30a〜B30g:ブロッブ包摂図形
B30a−1〜B30a−5:ブロッブ包摂図形
B40a〜B40e:ブロッブ包摂図形
B(i−4)〜B(i−1):ブロッブ包摂図形
B1(i−1)〜Bj(i−1):ブロッブ包摂図形
B1(i)〜Bj(i):ブロッブ包摂図形
B(i)a,B(i)b,B(i)c:ブロッブ包摂図形
B(i)′:ブロッブ包摂図形の予測位置
B29b′,B29c′,B29d′:拡張修正後のマスク図形
C:二次曲線
F,F20〜F40,F(i):前景領域
F10a〜F10d:前景領域
F20a〜F20d:前景領域
F30a〜F30d:前景領域
F40a〜F40e:前景領域
f30,f40:部分画像
h,ha,hb,hc:ブロッブ包摂図形の横寸法
K,K10〜K40,K(i):背景領域
M10〜M40,M(i):動体識別画像
M(i,j),M30a〜M30d:個別動体識別画像
m(i):動体識別画像を構成する1つの画素もしくはその画素値
O1〜O5:動体
P(1)〜P(i):原画像(動画を構成する個々の静止画像)
P10〜P40:原画像(動画を構成する個々の静止画像)
p(i):原画像を構成する1つの画素もしくはその画素値
Q1(x1,y1),Q2(x2,y2):矩形の頂点座標
Q,Qa〜Qc:ブロッブ包摂図形の位置の基準点
R0〜R4:ブロッブ包摂図形の位置の基準点
S1〜S7,S10〜S33:流れ図のステップ
T1〜T6,Tj:トラッカー
t10〜t40,t(i−1),t(i):時刻
v,va,vb,vc:ブロッブ包摂図形の縦寸法
w:重みを示すパラメータ
【特許請求の範囲】
【請求項1】
動画画像について動体を検出し、これを追跡する動体追跡装置であって、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
前記動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と前記背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
前記第i番目の動体識別画像M(i)に基づいて、前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形を第i番目の時系列に所属するブロッブ包摂図形B(i)として抽出するブロッブ包摂図形抽出部と、
同一の動体に基づいて抽出されたと推定される複数のブロッブ包摂図形を先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
前記ブロッブ包摂図形抽出部によって抽出された第i番目の時系列に所属するブロッブ包摂図形B(i)を、第j番目のトラッカーTj(但し、jはトラッカーの番号を示す自然数)の第i番目の時系列に所属するメンバーとして、前記トラッカー格納部に登録するトラッカー登録部と、
前記動体識別画像生成部が生成した動体識別画像の前景領域に対して、前記トラッカー格納部に格納されている特定のブロッブ包摂図形を利用したマスキングを行うマスキング処理部と、
を備え、
前記マスキング処理部は、前記トラッカー格納部に格納されている第j番目のトラッカーTjを着目トラッカーとして、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことにより、前記着目トラッカーTj用の個別動体識別画像M(i,j)を生成し、これを前記ブロッブ包摂図形抽出部に提供し、
前記ブロッブ包摂図形抽出部は、前記動体識別画像M(i)に基づいて前記ブロッブ包摂図形B(i)を抽出する機能に加えて、前記個別動体識別画像M(i,j)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、動体と認識した画素集団の包摂図形を第i番目の時系列に所属させるべき第j番目のトラッカー用の候補ブロッブ包摂図形として抽出する機能を有し、
前記トラッカー登録部は、
(a) 第j番目のトラッカーTjの第(i−1)番目の時系列に末尾ブロッブ包摂図形ではないブロッブ包摂図形が登録されている場合に、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、これに後続させるのに適したブロッブ包摂図形が前記第j番目のトラッカー用の候補ブロッブ包摂図形内に存在するか否かを判定し、存在するときには、当該候補ブロッブ包摂図形を第i番目の時系列に所属する後続ブロッブ包摂図形として登録する処理を行い、存在しないときには、前記先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示す処理を行う後続ブロッブ包摂図形登録処理と、
(b) 前記後続ブロッブ包摂図形登録処理を各トラッカーについて行った後、前記動体識別画像M(i)に基づいて抽出された前記ブロッブ包摂図形B(i)の中に、前記後続ブロッブ包摂図形登録処理によって登録された後続ブロッブ包摂図形に対応しない新参ブロッブ包摂図形が存在する場合に、当該新参ブロッブ包摂図形を第i番目の時系列が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録する新参ブロッブ包摂図形登録処理と、
を行うことを特徴とする動体追跡装置。
【請求項2】
請求項1に記載の動体追跡装置において、
背景画像提供部が、外部から与えられた静止画像を取り込んで保存する機能を有し、前記静止画像を背景画像として提供することを特徴とする動体追跡装置。
【請求項3】
請求項1に記載の動体追跡装置において、
背景画像提供部が、画像入力部が過去の所定期間にわたって入力した原画像の単純平均もしくは重みづけ平均を求める機能を有し、求めた平均画像を背景画像として提供することを特徴とする動体追跡装置。
【請求項4】
請求項1〜3のいずれかに記載の動体追跡装置において、
動体識別画像生成部が、原画像P(i)上の特定位置にある画素の色と、背景画像上の前記特定位置にある画素の色とを比較し、両画素の色の近似度が所定条件を満たす場合には当該特定位置にある画素を背景領域の画素とし、前記所定条件を満たさない場合には当該特定位置にある画素を前景領域の画素とすることにより、動体識別画像M(i)を生成することを特徴とする動体追跡装置。
【請求項5】
請求項1〜4のいずれかに記載の動体追跡装置において、
ブロッブ包摂図形抽出部が、面積が所定の基準に満たない画素集団については、動体と認識せず、ブロッブ包摂図形の抽出を行わないことを特徴とする動体追跡装置。
【請求項6】
請求項1〜5のいずれかに記載の動体追跡装置において、
ブロッブ包摂図形抽出部が、画素集団の外接矩形をその包摂図形として用いることを特徴とする動体追跡装置。
【請求項7】
請求項6に記載の動体追跡装置において、
ブロッブ包摂図形抽出部が、動体識別画像M(i)を構成する個々の画素に順に着目し、各着目画素について、
(a) 着目画素が前景画素であり、かつ、所定近傍範囲に登録矩形が存在しない場合には、当該着目画素の輪郭を構成する矩形を登録する処理を行い、
(b) 着目画素が前景画素であり、かつ、所定近傍範囲に登録された矩形が存在する場合には、当該登録矩形の領域を着目画素を含む外接矩形に拡張して登録する処理を行い、
最終的に登録された矩形に基づいてブロッブ包摂図形の抽出を行うことを特徴とする動体追跡装置。
【請求項8】
請求項6または7に記載の動体追跡装置において、
トラッカー格納部が、外接矩形の対角に位置する2頂点の座標値をトラッカーの情報として格納することを特徴とする動体追跡装置。
【請求項9】
請求項1〜8のいずれかに記載の動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形のうち、着目トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形の所定の近傍範囲内に位置するブロッブ包摂図形のみを用いて、マスキングを行うことを特徴とする動体追跡装置。
【請求項10】
請求項1〜9のいずれかに記載の動体追跡装置において、
マスキング処理部が、各トラッカーに格納されている第(i−1)番目以前の連続した時系列に所属するブロッブ包摂図形の位置の変遷に基づいて、第i番目の時系列に所属するブロッブ包摂図形の予測位置を求める機能を有し、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、前記予測位置への位置修正を施し、位置修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことを特徴とする動体追跡装置。
【請求項11】
請求項10に記載の動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは2以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)の位置の基準点から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)の位置の基準点へ向かうベクトルに対して、その長さを(L/(L−1))倍に伸ばすことにより得られるベクトルの先端を予測位置の基準点とすることを特徴とする動体追跡装置。
【請求項12】
請求項10に記載の動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは3以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)まで、合計L個のブロッブ包摂図形の各位置の基準点を近似的に通る二次曲線を求め、この二次曲線上の点を予測位置の基準点とすることを特徴とする動体追跡装置。
【請求項13】
請求項1〜12のいずれかに記載の動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、輪郭線を所定量だけ外方へ拡張する修正を施し、拡張修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことを特徴とする動体追跡装置。
【請求項14】
請求項1〜13のいずれかに記載の動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理を行う際に、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に対して、第j番目のトラッカー用として抽出された個々の候補ブロッブ包摂図形の適合性評価を行い、所定の基準以上の評価、かつ、最も高い評価を得た候補ブロッブ包摂図形を、前記先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形と判定し、これを後続ブロッブ包摂図形として登録することを特徴とする動体追跡装置。
【請求項15】
請求項14に記載の動体追跡装置において、
トラッカー登録部が、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて適合性評価を行うことを特徴とする動体追跡装置。
【請求項16】
請求項1〜15のいずれかに記載の動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理で、第j番目のトラッカーTjについての後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形の大きさが、連続して先行登録されている所定数のブロッブ包摂図形の平均サイズとなるように、当該後続ブロッブ包摂図形の大きさに対する修正を行うことを特徴とする動体追跡装置。
【請求項17】
請求項1〜16のいずれかに記載の動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理において、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形が、第j番目のトラッカー用の候補ブロッブ包摂図形内に存在しない場合に、第j番目のトラッカーTjの第i番目の時系列を無登録状態とする処理を行うことにより、前記先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示すことを特徴とする動体追跡装置。
【請求項18】
請求項1〜17のいずれかに記載の動体追跡装置において、
トラッカー登録部が、新参ブロッブ包摂図形登録処理を行う際に、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)と、後続ブロッブ包摂図形登録処理によって第i番目の時系列に登録された後続ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、前記ブロッブ包摂図形B(i)の中で対応関係が認識できないブロッブ包摂図形を新参ブロッブ包摂図形とすることを特徴とする動体追跡装置。
【請求項19】
動画画像について動体を検出し、これを追跡する動体追跡装置であって、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
前記動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と前記背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
同一の動体と推定される画素集団の包摂図形からなるブロッブ包摂図形を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
前記トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体を示すブロッブ包摂図形を利用して、前記動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理部と、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出部と、
前記トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体を示す先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる前記着目動体と同一と推定される動体を示すブロッブ包摂図形を、前記着目動体以外の動体を示すブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から選択し、これを前記トラッカー格納部に、前記先行ブロッブ包摂図形に後続する第i番目の時系列の後続ブロッブ包摂図形として登録するとともに、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形の登録が行われていない新参ブロッブ包摂図形を、第i番目の時系列が未登録状態のトラッカーに、先頭ブロッブ包摂図形として登録するトラッカー登録部と、
を備えることを特徴とする動体追跡装置。
【請求項20】
請求項19に記載の動体追跡装置において、
トラッカー登録部が、
先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、第i番目の時系列の後続ブロッブ包摂図形として登録されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とすることを特徴とする動体追跡装置。
【請求項21】
請求項1〜20のいずれかに記載の動体追跡装置としてコンピュータを機能させるプログラム。
【請求項22】
請求項1〜20のいずれかに記載の動体追跡装置に加えて、更に、
動画画像を撮影して画像入力部に与えるビデオカメラと、
トラッカー格納部から、1つの選択トラッカーに連続して登録されているブロッブ包摂図形B(i)を順次取り出し、前記画像入力部が入力した原画像P(i)から前記ブロッブ包摂図形B(i)の内部の画像を切出して表示することにより、特定の動体を追跡した部分動画画像を提示する部分動画提示部と、
を備えることを特徴とする監視システム。
【請求項23】
請求項22に記載の監視システムにおいて、
部分動画提示部が、ブロッブ包摂図形B(i)を所定量だけ外方へ拡張し、拡張された包摂図形の内部の画像を切出して表示することを特徴とする監視システム。
【請求項24】
動画画像について動体を検出し、これを追跡する動体追跡方法であって、
コンピュータが、時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力段階と、
コンピュータが、前記動画画像の背景を構成する背景画像と、第i番目の原画像P(i)とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成段階と、
コンピュータが、第(i−1)番目の原画像P(i−1)内に含まれる着目動体の輪郭を包摂する先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる前記着目動体と同一と推定される動体の輪郭を包摂する後続ブロッブ包摂図形を認識するとともに、第i番目の原画像P(i)において新たに出現した動体の輪郭を包摂する新参ブロッブ包摂図形を認識する後続/新参ブロッブ包摂図形認識段階と、
を有し、
前記後続/新参ブロッブ包摂図形認識段階は、
第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体の輪郭を包摂するロッブ包摂図形を利用して、前記動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理ステップと、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の輪郭を包摂する図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出ステップと、
前記着目動体以外の動体を包摂するブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から、前記着目動体の輪郭を包摂する先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形を後続ブロッブ包摂図形として選択する後続ブロッブ包摂図形選択ステップと、
マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形が認識されていない新参ブロッブ包摂図形を、新たな動体の輪郭を包摂する新参ブロッブ包摂図形として認識する新参ブロッブ包摂図形認識ステップと、
を有することを特徴とする動体追跡方法。
【請求項25】
請求項24に記載の動体追跡方法において、
後続ブロッブ包摂図形選択ステップで、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
新参ブロッブ包摂図形認識ステップで、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形として認識されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とすることを特徴とする動体追跡方法。
【請求項1】
動画画像について動体を検出し、これを追跡する動体追跡装置であって、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
前記動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と前記背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
前記第i番目の動体識別画像M(i)に基づいて、前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形を第i番目の時系列に所属するブロッブ包摂図形B(i)として抽出するブロッブ包摂図形抽出部と、
同一の動体に基づいて抽出されたと推定される複数のブロッブ包摂図形を先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
前記ブロッブ包摂図形抽出部によって抽出された第i番目の時系列に所属するブロッブ包摂図形B(i)を、第j番目のトラッカーTj(但し、jはトラッカーの番号を示す自然数)の第i番目の時系列に所属するメンバーとして、前記トラッカー格納部に登録するトラッカー登録部と、
前記動体識別画像生成部が生成した動体識別画像の前景領域に対して、前記トラッカー格納部に格納されている特定のブロッブ包摂図形を利用したマスキングを行うマスキング処理部と、
を備え、
前記マスキング処理部は、前記トラッカー格納部に格納されている第j番目のトラッカーTjを着目トラッカーとして、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことにより、前記着目トラッカーTj用の個別動体識別画像M(i,j)を生成し、これを前記ブロッブ包摂図形抽出部に提供し、
前記ブロッブ包摂図形抽出部は、前記動体識別画像M(i)に基づいて前記ブロッブ包摂図形B(i)を抽出する機能に加えて、前記個別動体識別画像M(i,j)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、動体と認識した画素集団の包摂図形を第i番目の時系列に所属させるべき第j番目のトラッカー用の候補ブロッブ包摂図形として抽出する機能を有し、
前記トラッカー登録部は、
(a) 第j番目のトラッカーTjの第(i−1)番目の時系列に末尾ブロッブ包摂図形ではないブロッブ包摂図形が登録されている場合に、当該ブロッブ包摂図形を先行ブロッブ包摂図形として、これに後続させるのに適したブロッブ包摂図形が前記第j番目のトラッカー用の候補ブロッブ包摂図形内に存在するか否かを判定し、存在するときには、当該候補ブロッブ包摂図形を第i番目の時系列に所属する後続ブロッブ包摂図形として登録する処理を行い、存在しないときには、前記先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示す処理を行う後続ブロッブ包摂図形登録処理と、
(b) 前記後続ブロッブ包摂図形登録処理を各トラッカーについて行った後、前記動体識別画像M(i)に基づいて抽出された前記ブロッブ包摂図形B(i)の中に、前記後続ブロッブ包摂図形登録処理によって登録された後続ブロッブ包摂図形に対応しない新参ブロッブ包摂図形が存在する場合に、当該新参ブロッブ包摂図形を第i番目の時系列が未登録状態のトラッカーに先頭ブロッブ包摂図形として登録する新参ブロッブ包摂図形登録処理と、
を行うことを特徴とする動体追跡装置。
【請求項2】
請求項1に記載の動体追跡装置において、
背景画像提供部が、外部から与えられた静止画像を取り込んで保存する機能を有し、前記静止画像を背景画像として提供することを特徴とする動体追跡装置。
【請求項3】
請求項1に記載の動体追跡装置において、
背景画像提供部が、画像入力部が過去の所定期間にわたって入力した原画像の単純平均もしくは重みづけ平均を求める機能を有し、求めた平均画像を背景画像として提供することを特徴とする動体追跡装置。
【請求項4】
請求項1〜3のいずれかに記載の動体追跡装置において、
動体識別画像生成部が、原画像P(i)上の特定位置にある画素の色と、背景画像上の前記特定位置にある画素の色とを比較し、両画素の色の近似度が所定条件を満たす場合には当該特定位置にある画素を背景領域の画素とし、前記所定条件を満たさない場合には当該特定位置にある画素を前景領域の画素とすることにより、動体識別画像M(i)を生成することを特徴とする動体追跡装置。
【請求項5】
請求項1〜4のいずれかに記載の動体追跡装置において、
ブロッブ包摂図形抽出部が、面積が所定の基準に満たない画素集団については、動体と認識せず、ブロッブ包摂図形の抽出を行わないことを特徴とする動体追跡装置。
【請求項6】
請求項1〜5のいずれかに記載の動体追跡装置において、
ブロッブ包摂図形抽出部が、画素集団の外接矩形をその包摂図形として用いることを特徴とする動体追跡装置。
【請求項7】
請求項6に記載の動体追跡装置において、
ブロッブ包摂図形抽出部が、動体識別画像M(i)を構成する個々の画素に順に着目し、各着目画素について、
(a) 着目画素が前景画素であり、かつ、所定近傍範囲に登録矩形が存在しない場合には、当該着目画素の輪郭を構成する矩形を登録する処理を行い、
(b) 着目画素が前景画素であり、かつ、所定近傍範囲に登録された矩形が存在する場合には、当該登録矩形の領域を着目画素を含む外接矩形に拡張して登録する処理を行い、
最終的に登録された矩形に基づいてブロッブ包摂図形の抽出を行うことを特徴とする動体追跡装置。
【請求項8】
請求項6または7に記載の動体追跡装置において、
トラッカー格納部が、外接矩形の対角に位置する2頂点の座標値をトラッカーの情報として格納することを特徴とする動体追跡装置。
【請求項9】
請求項1〜8のいずれかに記載の動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形のうち、着目トラッカーの第(i−1)番目の時系列に登録されているブロッブ包摂図形の所定の近傍範囲内に位置するブロッブ包摂図形のみを用いて、マスキングを行うことを特徴とする動体追跡装置。
【請求項10】
請求項1〜9のいずれかに記載の動体追跡装置において、
マスキング処理部が、各トラッカーに格納されている第(i−1)番目以前の連続した時系列に所属するブロッブ包摂図形の位置の変遷に基づいて、第i番目の時系列に所属するブロッブ包摂図形の予測位置を求める機能を有し、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、前記予測位置への位置修正を施し、位置修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことを特徴とする動体追跡装置。
【請求項11】
請求項10に記載の動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは2以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)の位置の基準点から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)の位置の基準点へ向かうベクトルに対して、その長さを(L/(L−1))倍に伸ばすことにより得られるベクトルの先端を予測位置の基準点とすることを特徴とする動体追跡装置。
【請求項12】
請求項10に記載の動体追跡装置において、
マスキング処理部が、第(i−L)番目(Lは3以上の整数)の時系列に所属するブロッブ包摂図形B(i−L)から、第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)まで、合計L個のブロッブ包摂図形の各位置の基準点を近似的に通る二次曲線を求め、この二次曲線上の点を予測位置の基準点とすることを特徴とする動体追跡装置。
【請求項13】
請求項1〜12のいずれかに記載の動体追跡装置において、
マスキング処理部が、個別動体識別画像M(i,j)を生成する際に、着目外トラッカーの第(i−1)番目の時系列に所属するブロッブ包摂図形B(i−1)に対して、輪郭線を所定量だけ外方へ拡張する修正を施し、拡張修正後の包摂図形を利用して、第i番目の動体識別画像M(i)についてのマスキングを行うことを特徴とする動体追跡装置。
【請求項14】
請求項1〜13のいずれかに記載の動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理を行う際に、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に対して、第j番目のトラッカー用として抽出された個々の候補ブロッブ包摂図形の適合性評価を行い、所定の基準以上の評価、かつ、最も高い評価を得た候補ブロッブ包摂図形を、前記先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形と判定し、これを後続ブロッブ包摂図形として登録することを特徴とする動体追跡装置。
【請求項15】
請求項14に記載の動体追跡装置において、
トラッカー登録部が、判定対象となる先行ブロッブ包摂図形と候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて適合性評価を行うことを特徴とする動体追跡装置。
【請求項16】
請求項1〜15のいずれかに記載の動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理で、第j番目のトラッカーTjについての後続ブロッブ包摂図形を登録する際に、当該後続ブロッブ包摂図形の大きさが、連続して先行登録されている所定数のブロッブ包摂図形の平均サイズとなるように、当該後続ブロッブ包摂図形の大きさに対する修正を行うことを特徴とする動体追跡装置。
【請求項17】
請求項1〜16のいずれかに記載の動体追跡装置において、
トラッカー登録部が、後続ブロッブ包摂図形登録処理において、第j番目のトラッカーTjの第(i−1)番目の時系列に登録されている先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形が、第j番目のトラッカー用の候補ブロッブ包摂図形内に存在しない場合に、第j番目のトラッカーTjの第i番目の時系列を無登録状態とする処理を行うことにより、前記先行ブロッブ包摂図形が末尾ブロッブ包摂図形となったことを示すことを特徴とする動体追跡装置。
【請求項18】
請求項1〜17のいずれかに記載の動体追跡装置において、
トラッカー登録部が、新参ブロッブ包摂図形登録処理を行う際に、動体識別画像M(i)に基づいて抽出されたブロッブ包摂図形B(i)と、後続ブロッブ包摂図形登録処理によって第i番目の時系列に登録された後続ブロッブ包摂図形とを比較し、両者が一致するか、もしくは、一方が他方を包含する関係になっているものを互いに対応するブロッブ包摂図形と認識し、前記ブロッブ包摂図形B(i)の中で対応関係が認識できないブロッブ包摂図形を新参ブロッブ包摂図形とすることを特徴とする動体追跡装置。
【請求項19】
動画画像について動体を検出し、これを追跡する動体追跡装置であって、
時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力部と、
前記動画画像の背景を構成する背景画像を提供する背景画像提供部と、
第i番目の原画像P(i)と前記背景画像とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成部と、
同一の動体と推定される画素集団の包摂図形からなるブロッブ包摂図形を、先頭ブロッブ包摂図形から末尾ブロッブ包摂図形に至るまで時系列で並べることにより構成されるトラッカーの情報を、個々の動体ごとに格納するトラッカー格納部と、
前記トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体を示すブロッブ包摂図形を利用して、前記動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理部と、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の包摂図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出部と、
前記トラッカー格納部に格納されている、第(i−1)番目の原画像P(i−1)内に含まれる着目動体を示す先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる前記着目動体と同一と推定される動体を示すブロッブ包摂図形を、前記着目動体以外の動体を示すブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から選択し、これを前記トラッカー格納部に、前記先行ブロッブ包摂図形に後続する第i番目の時系列の後続ブロッブ包摂図形として登録するとともに、マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形の登録が行われていない新参ブロッブ包摂図形を、第i番目の時系列が未登録状態のトラッカーに、先頭ブロッブ包摂図形として登録するトラッカー登録部と、
を備えることを特徴とする動体追跡装置。
【請求項20】
請求項19に記載の動体追跡装置において、
トラッカー登録部が、
先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、第i番目の時系列の後続ブロッブ包摂図形として登録されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とすることを特徴とする動体追跡装置。
【請求項21】
請求項1〜20のいずれかに記載の動体追跡装置としてコンピュータを機能させるプログラム。
【請求項22】
請求項1〜20のいずれかに記載の動体追跡装置に加えて、更に、
動画画像を撮影して画像入力部に与えるビデオカメラと、
トラッカー格納部から、1つの選択トラッカーに連続して登録されているブロッブ包摂図形B(i)を順次取り出し、前記画像入力部が入力した原画像P(i)から前記ブロッブ包摂図形B(i)の内部の画像を切出して表示することにより、特定の動体を追跡した部分動画画像を提示する部分動画提示部と、
を備えることを特徴とする監視システム。
【請求項23】
請求項22に記載の監視システムにおいて、
部分動画提示部が、ブロッブ包摂図形B(i)を所定量だけ外方へ拡張し、拡張された包摂図形の内部の画像を切出して表示することを特徴とする監視システム。
【請求項24】
動画画像について動体を検出し、これを追跡する動体追跡方法であって、
コンピュータが、時系列で連続する複数の原画像P(i)(但し、iは時系列の順序を示す自然数)からなる動画画像を入力する画像入力段階と、
コンピュータが、前記動画画像の背景を構成する背景画像と、第i番目の原画像P(i)とを比較して、背景領域と前景領域とを区別する第i番目の動体識別画像M(i)を生成する動体識別画像生成段階と、
コンピュータが、第(i−1)番目の原画像P(i−1)内に含まれる着目動体の輪郭を包摂する先行ブロッブ包摂図形に対して、第i番目の原画像P(i)内に含まれる前記着目動体と同一と推定される動体の輪郭を包摂する後続ブロッブ包摂図形を認識するとともに、第i番目の原画像P(i)において新たに出現した動体の輪郭を包摂する新参ブロッブ包摂図形を認識する後続/新参ブロッブ包摂図形認識段階と、
を有し、
前記後続/新参ブロッブ包摂図形認識段階は、
第(i−1)番目の原画像P(i−1)内に含まれる着目動体以外の動体の輪郭を包摂するロッブ包摂図形を利用して、前記動体識別画像M(i)の前景領域に対してマスキング処理を行うマスキング処理ステップと、
マスキング処理前後の動体識別画像M(i)について、マスキングされた部分を除いた前景領域を構成するひとまとまりの画素集団を動体と認識し、当該画素集団の輪郭を包摂する図形をブロッブ包摂図形として抽出するブロッブ包摂図形抽出ステップと、
前記着目動体以外の動体を包摂するブロッブ包摂図形を利用してマスキング処理された動体識別画像M(i)から抽出された候補ブロッブ包摂図形の中から、前記着目動体の輪郭を包摂する先行ブロッブ包摂図形に後続させるのに適したブロッブ包摂図形を後続ブロッブ包摂図形として選択する後続ブロッブ包摂図形選択ステップと、
マスキング処理前の動体識別画像M(i)から抽出されたブロッブ包摂図形のうち、対応する後続ブロッブ包摂図形が認識されていない新参ブロッブ包摂図形を、新たな動体の輪郭を包摂する新参ブロッブ包摂図形として認識する新参ブロッブ包摂図形認識ステップと、
を有することを特徴とする動体追跡方法。
【請求項25】
請求項24に記載の動体追跡方法において、
後続ブロッブ包摂図形選択ステップで、先行ブロッブ包摂図形と各候補ブロッブ包摂図形とを、位置、面積、形状のいずれか1つもしくは複数の組み合わせに関して比較し、その類似性に基づいて後続ブロッブ包摂図形の選択を行い、
新参ブロッブ包摂図形認識ステップで、マスキング処理前の動体識別画像M(i)から抽出された個々のブロッブ包摂図形のうち、後続ブロッブ包摂図形として認識されているブロッブ包摂図形と一致もしくは包含する関係になっていないブロッブ包摂図形を新参ブロッブ包摂図形とすることを特徴とする動体追跡方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【図38】
【図39】
【図40】
【図41】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【図38】
【図39】
【図40】
【図41】
【公開番号】特開2013−45152(P2013−45152A)
【公開日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願番号】特願2011−180559(P2011−180559)
【出願日】平成23年8月22日(2011.8.22)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
【公開日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願日】平成23年8月22日(2011.8.22)
【出願人】(000002897)大日本印刷株式会社 (14,506)
【Fターム(参考)】
[ Back to top ]