説明

画像処理装置

【課題】監視画像から背景画像を生成する画像処理装置において、監視空間内に似た色の服を着た人物が多く往来していたり、滞留する人物がいたりすると、生成した背景画像の一部に人の画素値が混入することがあった。
【解決手段】背景モデル生成部は、注目時刻より過去の入力画像の画素値から、注目画素300の特徴量の頻度分布330を生成し、当該頻度分布からなる背景モデルを生成する。背景特徴選出部は、注目画素300、近傍画素320の頻度分布330,340において集中度が最大ピークとなる正規分布331,342をそれぞれの画素の位置での背景特徴量として抽出する。背景モデル修正部は、注目画素300の頻度分布330のうち、近傍画素320の背景特徴量として選出される正規分布342に対応するものである正規分布332の頻度を高める修正を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、移動物体が現れる空間を撮影した動画像からその背景画像情報を生成する画像処理装置に関する。
【背景技術】
【0002】
監視空間内を移動する人物等の移動物体を検出するために、監視空間を撮像した画像から当該監視空間の背景画像を差し引いて所定以上の差がある領域を移動物体によるものとして抽出する背景差分処理が行われる。
【0003】
背景差分処理により移動物体を高精度に検出するには移動物体の像を含まない背景画像が必要である。監視空間に移動物体が存在しているときでもこのような背景画像を生成できれば容易に監視を始めることができる。
【0004】
従来、移動物体が存在していても背景は断続的に撮像されることから、画素ごとに最も高い時間頻度で出現する画素値を検出し、各画素の最頻値からなる背景画像を生成していた(特許文献1)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平5−94536号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、監視空間内に似た色の服を着た人物が多く往来していたり、滞留する人物がいたりすると、一部の画素において人の画素値の頻度が背景の画素値の頻度を上回り、背景画像の一部に人の画素値が混入することがあった。
【0007】
そのため、似た色を有する移動物体が存在しているとき又は移動物体が滞留しているときに監視を始めると移動物体の領域を高精度に抽出できないという問題があった。
【0008】
本発明は上記課題を鑑みてなされたものであり、移動物体の特徴量の頻度が背景の特徴量の頻度を上回る画素があってもそれを背景の特徴量に補正した背景画像情報を生成できる画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明に係る画像処理装置は、移動物体が現れる所定空間を撮影した時系列の画像から当該空間についての背景モデルを生成するものであって、前記各画像の画素値から画素ごとの特徴量を抽出する特徴抽出部と、前記時系列における前記各画素の前記特徴量の頻度分布を分析して背景モデルを生成する背景モデル生成部と、前記各画素の前記頻度分布において、前記特徴量の分布範囲ごとに頻度の集中度を算出し、少なくとも最も高い前記集中度が算出された前記分布範囲を背景特徴量として選出する背景特徴選出部と、前記各画素の前記頻度分布に対し、当該画素の画像上における近傍領域にて選出された前記背景特徴量と対応する特徴量の頻度を高める修正を行う背景モデル修正部と、を有する。
【0010】
他の本発明に係る画像処理装置においては、前記背景モデル修正部は、大きさが互いに異なる複数の前記近傍領域を当該大きさの降順で順次、設定して前記修正を繰り返し行う。
【0011】
さらに他の本発明に係る画像処理装置においては、前記背景モデル修正部は、設定する前記近傍領域が小さいほど前記修正の度合いを大きくする。
【0012】
別の本発明に係る画像処理装置においては、前記背景モデル修正部は、前記近傍領域での前記背景特徴量の前記集中度が高いほど前記修正の度合いを大きくする。
【0013】
さらに別の本発明に係る画像処理装置においては、前記背景モデル修正部は、前記各画素の前記頻度分布に対する前記修正を前記背景特徴量の前記集中度が高い画素から順に行う。
【0014】
また別の本発明に係る画像処理装置においては、前記特徴量抽出部は、少なくともエッジ情報を抽出し、前記背景モデル修正部は、前記近傍領域にて選出された前記背景特徴量に含まれる前記エッジ情報の多寡に応じた背景複雑度を算出し、前記近傍領域での前記背景複雑度が低いほど前記修正の度合いを大きくする。
【0015】
さらに別の本発明に係る画像処理装置においては、前記特徴量抽出部は、少なくともエッジ情報を抽出し、前記背景モデル修正部は、前記近傍領域において選出された前記背景特徴量に含まれる前記エッジ情報の多寡に応じた背景複雑度を算出し、前記背景複雑度が予め設定されたしきい値未満である前記近傍領域を用いて前記修正を行なう。
【発明の効果】
【0016】
本発明によれば、移動物体の特徴量が背景の特徴量の頻度を上回る画素があってもそれを背景の特徴量に補正するので移動物体を大幅に排除した背景画像情報を生成できる。当該背景画像情報を用いれば、例えば、監視画像における移動物体の領域を高精度に抽出できる。
【図面の簡単な説明】
【0017】
【図1】本発明の実施形態に係る監視カメラシステムのブロック構成図である。
【図2】(1)式の混合正規分布を模式的に示すグラフである。
【図3】背景モデルを構成するデータを模式的に示すテーブルである。
【図4】背景モデル生成部及び背景特徴選出部による処理の具体例を説明する模式図である。
【図5】注目画素に対して3×3の近傍領域を設定した場合を例に修正処理を説明する説明図である。
【図6】背景モデル生成から物体検出までの処理の流れを示すタイミング図である。
【図7】監視カメラシステムの概略の動作を示すフロー図である。
【図8】背景モデル修正部による修正処理の概略のフロー図である。
【発明を実施するための形態】
【0018】
以下、本発明の実施形態について、図面に基づいて説明する。本実施形態は、店舗等の監視空間内を移動する人物を監視対象の移動物体とし、監視空間を撮像した動画像内の人物領域を抽出する監視カメラシステムである。当該監視カメラシステムは、各人物のプライバシーを保護するために、動画像を表示する際に、抽出した人物領域にマスク処理を施す。これらの処理において監視カメラシステムは背景モデルを生成し、生成した背景モデルを用いて人物領域を抽出し、また、生成した背景モデルを用いてマスク処理の下地となる背景画像を作成する。
【0019】
図1は、実施形態に係る監視カメラシステム1のブロック構成図である。監視カメラシステム1は、撮像部2、記憶部3、制御部4及び表示部5を含んで構成される。撮像部2、記憶部3及び表示部5は制御部4に接続される。
【0020】
撮像部2は監視カメラであり、監視空間の天井部に監視空間を俯瞰して固定設置され、監視空間を所定の時間間隔で撮影する。撮影された監視空間の監視画像は順次、制御部4へ出力される。監視画像が撮像される時間間隔は例えば1/5秒である。以下、この撮像の時間間隔で刻まれる時間の単位を時刻と称する。
【0021】
記憶部3はROM(Read Only Memory)、RAM(Random Access Memory)等の記憶装置である。記憶部3は各種プログラムや各種データを記憶し、制御部4との間でこれらの情報を入出力する。各種データには背景モデル30が含まれる。
【0022】
背景モデル30は、監視画像の各画素における当該画素の特徴量の時間方向の出現頻度を表す頻度分布、各頻度分布において頻度が集中しており背景の特徴量であると推定される背景特徴量、及び各背景特徴量の集中の度合いを表す集中度を含んで構成される。本実施形態では各頻度分布を混合正規分布によりモデル化し、各画素における頻度分布(出現確率)PをK個の正規分布Nの重み付け和で表す。
【0023】
【数1】

【0024】
ここで、P(a)は注目画素において特徴量aが出現する確率である。N(a;μ,σ)は、平均がμ、分散がσであるi番目の正規分布関数に従い特徴量aが出現する確率である。また、wはi番目の正規分布に対する重み係数である。
【0025】
また、頻度分布において真の背景特徴量と背景の前を通過する移動物体による偽の背景特徴量とを区別して近似できるよう、Kは2以上であることが望ましい。例えばK=3とすることができる。
【0026】
混合正規分布を用いる本実施形態においては、頻度分布においていずれかの正規分布が表す範囲に分布している特徴量を背景特徴量とすることができ、背景特徴量はそのインデックスiで示すことができる。また、集中度をCで表記することにする。
【0027】
図2は(1)式の混合正規分布を模式的に示すグラフであり、図3は背景モデル30を構成するデータを模式的に示すテーブルである。図2に示す混合正規分布のグラフ100、及び図3に示すテーブル150はある1つの画素(x,y)に関するものである。頻度分布P(a)は実際には多次元分布であるが、簡単のため図2では1次元で模式的に表しており、またK=3としている。テーブル150は当該画素のx座標及びy座標、各正規分布のインデックス番号iと当該正規分布の平均値μと分散値σと重み係数wとの組、当該画素の背景特徴量である正規分布のインデックスI、当該画素の集中度Cを含む。なお、図2に示す例ではI=3である。背景モデル30にはこのテーブル150に示す情報が画素の数だけ列挙される。
【0028】
制御部4は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置を用いて構成され、特徴抽出部40、背景モデル生成部41、背景特徴選出部42、背景モデル修正部43、物体検出部44及びマスク画像生成部45等の動作が記述されたプログラムを記憶部3から読み出して実行することにより各手段として動作する。制御部4は撮像部2より入力される監視画像から人物領域を抽出して人物領域にマスク処理を施し、マスク処理した画像を表示部5へ出力する。
【0029】
特徴抽出部40は監視画像の各画素の特徴量を算出し、算出された特徴量を背景モデル生成部41及び物体検出部44へ出力する。特徴量は具体的には、輝度情報とエッジ情報とからなる12次元ベクトルであり、また輝度情報はR成分値、G成分値、B成分値を並べた3次元ベクトルで表され、エッジ情報はエッジ方向ごとのエッジ強度のヒストグラムを分析した9次元ベクトルで表される。
【0030】
特徴抽出部40は監視画像から公知のソーベル・フィルターなどを用いて各画素におけるエッジ強度とエッジ方向を算出し、エッジ方向を9方向に量子化するとともに各画素を中心に所定サイズ(例えば9×9画素)の分析窓を設定して分析窓内でエッジ方向ごとにエッジ強度を累積したヒストグラムをエッジ情報として求める。
【0031】
なお、各画素の特徴量として輝度情報のみ或いはエッジ情報のみを抽出してもよい。輝度情報はRGB値をHSV表色系に変換したものとしてもよい。エッジ情報はエッジ強度エッジ情報とエッジ方向とからなる2次元ベクトルとしてもよい。また、カラー画像ではなくグレースケール画像を入力画像としてその輝度情報とエッジ情報とからなる特徴量又はその輝度情報のみ或いはそのエッジ情報のみからなる特徴量を抽出してもよい。
【0032】
背景モデル生成部41は現時刻(注目時刻)より過去の監視画像から抽出された特徴量の時間方向の出現頻度を分析して頻度分布を画素ごとに生成し、各画素の頻度分布からなる背景モデル30を記憶部3に記憶させる。例えば、背景モデル生成部41は時系列の監視画像に公知のオンラインEM法等などを適用して各画素の頻度分布を表す平均値μ、分散値σ、重み係数wを算出する。この背景モデルの構築法については、島田,有田,谷口:「混合ガウス分布による動的背景モデルの分布数増減法」,画像の認識・理解シンポジウム(MIRU2006),2006年.が参考となる。
【0033】
背景特徴選出部42は画素ごとの頻度分布のそれぞれにおいて特徴量の集中度Cを算出するとともに、集中度Cが予め設定された条件を満たす背景特徴量を選出する。つまり、頻度分布にピークが形成される特徴量の中から予め設定した条件に基づいて、少なくとも最大ピークに対応するものを含む背景特徴量を選出する。本実施形態では、各画素について下記(2)式で示すように当該画素の頻度分布を構成する各正規分布i(iは正規分布を示すインデックス)の重みwを分散σで除して集中度Cを算出する。集中度Cが高い正規分布iほど、当該正規分布iは高く急峻な分布形状であり、当該正規分布iと対応する特徴量は頻度分布全体の中で集中して偏在しており背景らしさが高い。そこで、集中度Cが最も高い正規分布のインデックスIを当該画素の背景特徴量として選出する。
【0034】
【数2】

【0035】
背景特徴選出部42は選出した背景特徴量及びその集中度を記憶部3の背景モデル30に記憶させる。
【0036】
別の実施形態では、集中度が最も高い正規分布と、集中度が予め設定された集中度閾値Tc1以上である正規分布とを背景特徴量として選出し、集中度が高い順に記憶部3に書き込む。この実施形態では特徴量が集中して偏在する正規分布が複数存在するときにこれらのいずれをも背景特徴量として選出することができ、後述する修正処理を複数の正規分布に対して行うことが可能となる。この実施形態は正規分布の混合数Kを比較的多く設定する場合に有用である。
【0037】
図4は、背景モデル生成部41及び背景特徴選出部42による処理の具体例を説明する模式図であり、図4(a)は起動直後の監視画像200を示しており、図4(b)は起動直後の初期化期間の動画像に基づいて得られる背景画像250を示している。初期化期間は予め設定され、例えば、起動直後からの20秒間を初期化期間として設定する。背景モデル生成部41は初期化期間の監視画像を用いて背景モデル30を初期化し、背景特徴選出部42は、この背景モデル30から背景特徴量を抽出する。背景画像250は各画素の特徴量として、抽出された背景特徴量を設定された画像である。図4では図示の都合上、背景画像250は背景特徴量のうち輝度情報を画素値に設定したものを表している。
【0038】
図4(a)の監視画像200は、複数の通行人が、斜線で示す床及び白い壁を有する監視空間を歩いている様子を示している。図4(b)の背景画像250の殆どの画素では床や壁などの真の背景特徴量が選出されているが、画素300などの一部の画素においてズボン(画像200中にて網目模様で示している)の特徴量が背景特徴量として誤選出され、背景画像250中にズボンの特徴量に相当する黒画素がまだらに現れている。この例において当該まだらが現れている原因は、初期化期間中、絶えず黒いズボンを着用した通行人が監視空間を往来していたことにあり、そのため、黒画素となる一部の画素においてズボンの特徴量が床や壁の特徴量の頻度を上回り背景特徴量として抽出されてしまっている。通行人の滞留も当該通行人と床・壁との頻度の逆転の原因となる。このように出現頻度の逆転が生じた画素を放置しておくと、物体領域の一部欠損や物体の誤検出が生じる。
【0039】
次に説明する背景モデル修正部43は、この逆転を解消するために背景モデル30の修正処理を実行する。修正実行期間は例えば初期化期間の終わりの1秒間と予め設定される。
【0040】
背景モデル修正部43は記憶部3から背景モデル30を読み出して、各画素の頻度分布に対し、当該画素の近傍領域にて選出された背景特徴量と対応する特徴量の頻度を高める修正を行ない、修正した背景モデルで記憶部3の背景モデル30を更新する。すなわち背景モデル修正部43は各画素を注目画素に順次設定し、注目画素の頻度分布のうちその近傍領域内の各画素(近傍画素)にて選出された背景特徴量と対応する特徴量それぞれの頻度を所定値だけ増加させることで修正を行なう。具体的には背景モデル修正部43は、注目画素の頻度分布を構成する正規分布のうち、各近傍画素にて背景特徴量として選出された正規分布と対応する正規分布の重み係数を所定値Δwだけ増加させることで修正を行なう。なお、(1)式に示したように重み係数の総和は1であることから背景モデル修正部43は同時に他の正規分布の重み係数を減少させる。
【0041】
近傍画素と注目画素との特徴量の対応付けは、混合正規分布を用いる本実施形態においては、近傍画素の背景特徴量に対応する正規分布と注目画素の頻度分布を構成する正規分布との対応付けとなる。この点に関して、注目画素の頻度分布において重み係数を増加させる正規分布は、近傍画素において背景特徴量として選出された正規分布と十分に近い正規分布とするのがよい。具体的には背景モデル修正部43は、背景特徴量として選出された正規分布の平均値μと注目画素の頻度分布を構成する各正規分布iとの間で下記(3)式で表されるマハラノビス距離dを算出し、当該距離dを予め設定された閾値Tと比較する。そして、マハラノビス距離dが閾値T以下である注目画素側の正規分布の重み係数を増加させる。
【0042】
【数3】

【0043】
なお、マハラノビス距離dが閾値T以下である正規分布が複数となった場合は、マハラノビス距離dが最小の正規分布の重み係数を増加させる。
【0044】
またマハラノビス距離dが閾値T以下である正規分布がない場合、すなわち注目画素の頻度分布において近傍画素の背景特徴量と対応する特徴量が分布していない場合は当該近傍画素に基づく修正を行なわない。こうすることで注目画素に対して背景の境界をまたいで近傍画素が設定されてしまったとしても(例えば壁と床)、注目画素において偽の背景特徴量の集中度が高まることを防止できる。
【0045】
別の実施形態においては、マハラノビス距離dが閾値T以下である正規分布が複数となった場合にそれら複数の正規分布それぞれの重み係数を増加させることもできる。
【0046】
このように注目画素の頻度分布の中で、注目画素の近傍領域にて選出された背景特徴量と対応する特徴量の頻度を選択的に増加させることにより、注目画素の頻度分布における真の背景特徴量の集中度を多数決的に高めることができる。
【0047】
このとき背景モデル修正部43は特に近傍領域にて最も多く選出された背景特徴量と対応する特徴量に限定して頻度を高める修正を行なう構成とすることができる。これにより注目画素の頻度分布における真の背景特徴量の集中度をより効果的に高めることができる。具体的には、近傍領域の背景特徴量のうち注目画素の特徴量と対応付けがとれたものに関して「投票」を行い、投票値が最大となった背景特徴量に対応する注目画素の特徴量に関して重み係数を増加させる修正をする。各近傍画素は注目画素の特徴量のうち、自身の背景特徴量に対応するものに1票を投じることができる。つまり、背景モデル修正部43はどの特徴量を修正するかを決めるために投票処理を行い、投票処理として、注目画素の各特徴量について近傍画素の背景特徴量と対応付けがされた回数を計数する。計数された値が投票値となる。そして、背景モデル修正部43は修正量Δwを最大の投票値VMAXに比例させることで修正の度合いを調整する。
【0048】
また、注目画素の頻度分布における真の背景特徴量の集中度を効果的に高める別の実施形態として、各近傍画素が自身の背景特徴量に対応する集中度を投票する構成とすることもできる。具体的には修正量Δwを修正対象となった注目画素の特徴量との対応付けがとれた近傍画素の集中度(Cqとする)の和に比例させることで修正の度合いを調整する。
【0049】
図5は注目画素に対して3×3画素の範囲に近傍領域を設定した場合を例に修正処理を説明する説明図である。ここでは図4(b)の画素300を注目画素とし、図5の上側の近傍領域310は修正前、下側の近傍領域310は修正後のものである。グラフ330は修正前の注目画素300の頻度分布であり、横軸は本実施形態において12次元のベクトルである特徴量aを便宜的に1次元座標で表している。縦軸は頻度分布Pに対応している。頻度分布330は3つの正規分布331,332,333の混合正規分布として生成されており、正規分布331はズボンの特徴量の出現頻度、正規分布332は床の特徴量の出現頻度、正規分布333はシャツ等の特徴量の出現頻度を表している。頻度分布330は床の特徴量の正規分布332の集中度よりもズボンの特徴量の正規分布331の集中度の方が高くなってしまい出現頻度の逆転が生じていることを示している。一方、近傍領域310内の画素の1つである近傍画素320には逆転が生じておらず、その頻度分布340においてはズボンの特徴量に対応する正規分布341の集中度及びシャツ等の特徴量に対応する正規分布343の集中度よりも床の特徴量に対応する正規分布342の集中度の方が高くなっており、床の特徴量が背景特徴量として選出されている。
【0050】
背景モデル修正部43は、注目画素300の頻度分布330において近傍画素320の背景特徴量である正規分布342に対応する正規分布332の重み係数を所定値だけ増加させる修正を行なう。背景モデル修正部43は同様の処理を近傍領域310内の各画素に対して行なう。近傍領域310内には逆転した画素が3画素あるが、逆転していない画素は5画素であり、逆転していない画素の方が多い。従って、正規分布331や正規分布333を増加させる修正よりも正規分布332を増加させる修正の方が多く行われるので、逆転を解消することが可能である。上述したように最も多く選出された背景特徴量と対応する特徴量に修正を限定すれば、逆転していない5画素に関する修正すなわち正規分布331に関する修正のみが行なわれて逆転解消の可能性がさらに高まる。
【0051】
頻度分布350は、注目画素300における頻度分布330に対して近傍領域310内の全画素に基づき修正した後の状態を示している。当該頻度分布350は、床の特徴量に対応する正規分布352の集中度がズボンの特徴量に対応する正規分布351の集中度及びシャツ等の特徴量に対応する正規分布353の集中度よりも高くなるように修正され、逆転が解消した状態を示している。
【0052】
ここで近傍領域が小さ過ぎると修正の信頼性が低くなる場合がある。すなわち出現頻度の逆転が生じている画素が密集している位置に小さな近傍領域を設定すると逆転している画素の割合が多くなってしまうことがある。例えば、図4(b)に示す例において画面右下の画素に3×3の近傍領域を設定すると逆転を解消し切れない部分が発生する。
【0053】
そこで背景モデル修正部43は、大きさが互いに異なる複数の近傍領域を設定し、これら複数の近傍領域を用いた修正を大きさの降順に繰り返し行なうことで上記逆転画素密集問題の解決を図る構成を採用することができる。具体的には背景モデル修正部43は、まず7×7画素の大きさの近傍領域を各画素に設定して修正処理を行い、次に5×5画素の近傍領域を各画素に設定して修正処理を行い、最後に3×3画素の近傍領域を各画素に設定して修正処理を行う。
【0054】
なお、近傍領域の上記サイズ設定は一例であり、近傍領域の最大サイズは監視画像中に撮像される移動物体の幅などに応じて適宜設定すればよいし、サイズの段階もそれに合わせて適宜設定することができる。
【0055】
こうすることで逆転画素が疎な近傍領域による修正結果が順次内側へ伝播されるので、小さな近傍領域における逆転画素の割合が減少し、逆転画素が密集している部分があっても真の背景特徴量の頻度が高い背景モデル30に修正できる可能性が高まる。
【0056】
他方、背景は一様ではなく床や壁やその他様々なもので構成されていることから注目画素に近い位置の近傍画素における真の背景特徴量は注目画素と同じであることが多く、近傍画素の位置が注目画素から離れるほど近傍画素における真の背景特徴量が注目画素と異なる可能性が高い。そのため、逆転画素密集問題を除いて考えると、近傍領域を小さく設定したときに行われる修正の信頼性の方が、近傍領域を大きく設定したときに行われる修正の信頼性よりも高い。
【0057】
そこで背景モデル修正部43は、上述した繰り返し修正処理において、小さな近傍領域を用いたときほど修正の度合いを大きくすることができる。具体的には修正量Δwを近傍領域の大きさm×mに反比例させることで修正の度合いを調整することができる。
【0058】
こうすることで注目画素とは真の背景特徴量が異なる可能性の高い修正結果ほど弱く、注目画素と真の背景特徴量が同じである可能性の高い修正結果ほど強く注目画素に向かって順次伝播されるので、小さな近傍領域における逆転画素の割合を減少させつつ、近傍領域において注目画素にとっての真の背景特徴量が選出される割合を高めることができるので、逆転画素が密集している部分があっても真の背景特徴量の頻度が高い背景モデル30に修正できる可能性が高まる。
【0059】
ちなみに、集中度に基づく選択的修正が時系列的な信頼性の選択であるのに対し、ここで述べた複数サイズの近傍領域による修正及び近傍領域の大小に応じた修正度合いの調整は空間的な信頼性の選択であるといえる。
【0060】
また背景が一様でないことへのもう1つの対応策として、背景モデル修正部43は近傍領域内の各画素において選出された背景特徴量に含まれるエッジ情報の多寡に応じた背景複雑度Zを算出し、背景複雑度に応じて修正量を調整し、及び背景複雑度に応じて近傍領域の大きさを制限することができる。具体的には、背景モデル修正部43は近傍領域内の各画素にて選出された背景特徴量に含まれるエッジ強度を閾値Tと比較して閾値T以上のエッジ強度を有する画素数Eを求め、下記(4)式に示すように、当該画素数Eを近傍領域内の総画素数m×mで除して背景複雑度Zを算出する。
【0061】
【数4】

【0062】
背景複雑度Zが高い近傍領域は背景構造物同士の境目や模様などを多く含む複雑な領域であることを意味し、背景複雑度Zが低い近傍領域は一様性が高い単純な領域であることを意味する。
【0063】
そこで、背景モデル修正部43は、背景複雑度Zが低い近傍領域を用いたときほど注目画素の頻度分布に対する修正量を大きくすることで、一様性が高い近傍領域を用いたときの修正を大きく反映させる。具体的には修正量Δwを背景複雑度Zに反比例させることで修正の度合いを調整することができる。これにより真の背景特徴量の頻度が高い背景モデル30に修正できる可能性が高まる。
【0064】
また背景モデル修正部43は、背景複雑度Zが予め設定された閾値T未満である近傍領域を用いて修正を行ない、背景複雑度Zが閾値T以上である近傍領域は修正に用いないように構成することができる。これにより注目画素における真の背景特徴量とは異なる特徴量の頻度を増加させる誤修正を防ぐことができ、真の背景特徴量の頻度が高い背景モデル30に修正できる可能性が高まる。
【0065】
修正を施す画素の順番は単にその並び順とすることもできるが、各画素は自身が修正対象となる一方で他の画素の近傍画素として修正処理に利用されることから、真の背景特徴量に頻度が集中している画素から順に処理を施していくことが望ましい。
【0066】
そこで背景モデル修正部43は、各画素の集中度を参照して、各画素の頻度分布に対する修正を集中度が高い画素から順に行うように構成することができる。このように信頼性の高い近傍画素の修正結果を先行させることで背景モデル30全体対する修正の信頼性を高めることができる。
【0067】
上述した各種の構成を取り入れると、注目画素の正規分布の重み係数に対する修正量(加算値)Δwは次式のようになる。
【0068】
【数5】

【0069】
ここで、C,Cは近傍画素の背景特徴量に対する集中度であり、このうちCは最大投票値を得た注目画素の特徴量との対応が得られた近傍画素の背景特徴量の集中度であり、ΣCは当該集中度の総和である。一方、Cは注目画素のいずれかの特徴量との対応が得られた近傍画素の背景特徴量の集中度であり、ΣCは当該集中度の総和である。(α・ΣCq/ΣCg)は集中度を投票値とした場合の当該投票値が修正量に与える影響を定める因子であり、近傍領域において多数派の背景特徴量と対応する特徴量ほど修正量を大きくする作用を有している。αはΔwに対して投票値に関する因子の寄与率を調整するために予め設定される定数であり0<αである。mは近傍領域サイズであり、(γ/m・m)は近傍領域サイズの影響に関する因子であって、小さな近傍領域を用いたときほど修正量を大きくする作用を有している。γはΔwに対して近傍領域サイズに関する因子の寄与率を調整するために予め設定される定数であり0<γである。Zは背景複雑度であり、(ζ/Z)は背景複雑度に関する因子であって、近傍領域の背景の一様性が高いほど修正量を大きくする作用を有している。ζはΔwに対して背景複雑度に関する因子の寄与率を調整するために予め設定される定数であり0<ζである。
【0070】
修正量に集中度を反映させない場合、(5)式の代わりに(6)式を用いる。
【0071】
【数6】

【0072】
ここで、VMAXは注目画素の特徴量に対する最大投票値、またVVARIDは投票値の総和(注目画素との対応が得られた近傍画素の数)であり、(β・VMAX/VVARID)は投票値に係る加算値である。当該加算値は、上記(5)式の場合と同様、近傍領域において多数派の背景特徴量と対応する特徴量ほど修正量を大きくする作用を有しており、βは上記αと同様、加算値寄与率の調整のための定数であり0<βである。
【0073】
なお、修正量Δwに近傍領域サイズを反映させない場合は(5)式又は(6)式から因子(γ/m・m)を除いた式を用いることができ、修正量Δwに背景複雑度を反映させない場合は因子(ζ/Z)を除いた(5)式又は(6)式を用いることができる。
【0074】
物体検出部44は注目時刻の監視画像から抽出された特徴量と背景モデル30とを対応する画素ごとに比較して所定以上の差を有する画素のまとまりを物体領域として抽出し、抽出された物体領域の情報をマスク画像生成部45へ出力する。具体的には、監視画像の各画素の特徴量と当該画素の背景特徴量との差Dを算出して、当該差Dを予め設定された差分閾値Tと比較し差Dが差分閾値Tを超える差分画素を検出する。そして、互いに近接する差分画素同士を1つの領域としてまとめ、まとめられた領域の面積が人物像の大きさ程度に予め設定された大きさ閾値を超える場合に当該領域を人物領域として抽出する。注目する画素の特徴量aとそれに対応する画素の背景特徴量との差Dは、当該背景特徴量として選出された正規分布iとのマハラノビス距離とすることができ、次式で与えられる。
【0075】
【数7】

【0076】
この差Dはi番目の正規分布の平均値μと注目画素の特徴量aとの距離を分散σの大小に応じて正規化したものである。この正規化により背景特徴量と注目画素の近さが統計的に正しく計算される。
【0077】
なお、物体検出処理の高速化を優先するために、分散による正規化を省略し、差Dをi番目の正規分布関数の平均値μと注目画素の特徴量aとの距離|a−μ|で算出してもよい。
【0078】
マスク画像生成部45は各画素の画素値に背景特徴量を設定した背景画像を生成するとともに、物体検出部44により抽出された物体領域を単色で塗りつぶした領域画像を生成し、背景画像と領域画像とを透過合成してマスク画像を生成し、生成されたマスク画像を表示部5に出力する。背景特徴量を正規分布とする本実施形態において、マスク画像生成部45は各画素の背景徴量の正規分布の平均値での輝度情報を背景画像の画素値に設定する。
【0079】
表示部5は、制御部4から入力されるマスク処理済みの監視画像を表示する液晶ディスプレイ又はCRT(Cathode Ray Tube)ディスプレイ等のディスプレイ装置である。表示部5は例えば、その表示面を店舗内の売り場に向けて設置され、顧客のプライバシーを保護しつつ店員が不審な動きをしている顧客の存在を確認することを可能にする。
【0080】
次に監視カメラシステム1の動作を説明する。図6は、背景モデル生成から物体検出までの処理の流れを示すタイミング図である。背景モデル生成部41は監視カメラシステム1の起動直後から動作を開始する。起動直後は背景モデル30の元となるデータが不足しているため、物体検出部44は予め設定された初期化期間(例えば、20秒間に設定)だけ処理を実行せずに待機する。背景モデル修正部43は初期化期間の終わりに設定される修正実行期間(例えば、1秒間に設定)に動作する。そして初期化期間が過ぎると物体検出部44は処理を開始する。初期化期間後も背景モデル生成部41は随時、背景モデル30の更新を行う。
【0081】
ちなみに、逆転解消のために初期化時間を長く設定することは当該時間が経過するまで監視を始めることができない点で好ましくない上、逆転解消に必要な時間は移動物体の挙動次第であるため長さに応じた効果を期待することは難しい。この点、背景モデル修正部43による修正処理は、逆転を解消して高精度な物体検出を可能とすることに加え、初期化時間の短縮をも可能としている。
【0082】
図7は監視カメラシステム1の概略の動作を示すフロー図である。監視カメラシステム1が起動すると、撮像部2は所定時間おきに監視空間を撮像して監視画像を制御部4に入力する(S1)。また制御部4は、起動時にカウンタを用意して0にリセットし、当該カウンタにより監視画像の入力回数をカウントする。以降、監視画像が撮像されるたびにステップS1〜S10までの処理が繰り返される。
【0083】
監視画像が入力されると制御部4の特徴抽出部40は該画像にエッジ抽出処理を施して輝度情報とエッジ情報とからなる特徴量を画素ごとに抽出する(S2)。以下、最新の監視画像を現画像と称する。
【0084】
特徴量が抽出されると、制御部4はカウンタを参照して初期化期間が経過しているか確認する(S3)。初期化期間が未だ経過していなければ(S3にてNO)、制御部4はステップS4〜S6を省略して処理をステップS7へ進める。
【0085】
一方、初期化期間が経過していれば(S3にてYES)、制御部4は処理をステップS4へ進める。制御部4の物体検出部44は記憶部3の背景モデル30から各画素の背景特徴量を読み出して、読み出した背景特徴量と現画像の対応する画素の特徴量との差Dを算出して差分閾値Tと比較し、D≧Tである画素のまとまりを物体領域として抽出する(S4)。物体領域が抽出されると、制御部4のマスク画像生成部45は記憶部3の背景モデル30から各画素の背景特徴量に選出された正規分布iの平均値μにおける輝度情報を読み出して、読み出した輝度情報を当該画素の画素値に設定した背景画像を生成する。さらに、抽出された物体領域内の画素値を所定の単色(例えば赤)に設定し且つその他の画素値を0に設定した領域画像を生成し、背景画像と領域画像を透過合成してマスク画像を生成する(S5)。そして、マスク画像生成部45は生成したマスク画像を表示部5に出力し、表示部5は入力されたマスク画像を視認可能に表示する(S6)。
【0086】
マスク画像の表示処理を終えた後、または初期化期間未了によりステップS4〜S6が省略された場合(S3にてNOであった場合)、制御部4の背景モデル生成部41は現画像を用いて記憶部3の背景モデル30における各画素の頻度分布を更新する(S7)。
【0087】
各頻度分布が更新されると、制御部4の背景特徴選出部42は更新された頻度分布を参照し、画素ごとに当該画素の頻度分布を構成する正規分布iそれぞれに対する頻度の集中度Cを算出する。そして、当該集中度が最大となる正規分布Iを当該画素の背景特徴量に選出してそのインデックスI及びその集中度Cを記憶部3の背景モデル30に記憶させる。
【0088】
背景モデル30の更新が終わると、制御部4はカウンタを参照して修正実行期間であるか否かを確認する(S9)。修正実行期間でなければ(ステップS9にてNO)、制御部4はステップS10を省略して処理を再びステップS1へ戻す。
【0089】
他方、修正実行期間が訪れていると(ステップS9にてYES)、制御部4の背景モデル修正部43は背景モデル30の修正処理を行う(S10)。
【0090】
図8は修正処理の概略のフロー図であり、以下、図8に基づいて修正処理の流れを説明する。背景モデル修正部43は、近傍領域の大きさmを7,5,3の順に順次設定し(S100)、ステップS100〜S116のループ処理を設定する。
【0091】
近傍領域サイズのループ処理において、背景モデル修正部43は記憶部3の背景モデル30を参照して各画素をその背景特徴量の集中度Cが大きい順に順次、注目画素に設定し(S101)、ステップS101〜S115の処理を実行する。
【0092】
注目画素を設定した背景モデル修正部43は、注目画素を中心とするm×mの近傍領域を設定するとともに記憶部3の背景モデル30を参照し、近傍領域内の各画素に対して選出された背景特徴量に関しその平均ベクトルμに含まれるエッジ情報の強度を閾値Tと比較する。そして、当該強度がT以上である画素数Eを計数し、計数した画素数Eとmに(4)式を適用して背景複雑度Zを算出する(S102)。
【0093】
背景モデル修正部43は算出した背景複雑度Zを閾値Tと比較し(S103)、Z≧Tであれば(S103にてYES)、注目画素に設定中の近傍領域を用いた修正処理を行わないとして注目画素に対する修正処理S104〜S114を省略してステップS115へ処理を進める。
【0094】
一方、Z<Tの場合(S103にてNO)、背景モデル修正部43は注目画素に対する修正処理を行う。修正処理のうちステップS104〜S110は投票処理である。背景モデル修正部43は、まず投票値をクリアする(S104)。投票値はそれぞれ1〜Kのインデックスを付与されたK個の値で、これらの値が0に設定される。次に背景モデル修正部43は注目画素を中心とするサイズm×mの近傍領域内で注目画素を除く各画素を順次、近傍画素に設定し(S105)、注目画素の頻度分布を構成する正規分布iのうち近傍画素の背景特徴量Iと対応する正規分布iを対応特徴量として検出する(S106)。対応特徴量が検出された場合は当該対応特徴量のインデックスが付与された投票値に処理中の近傍画素における背景特徴量の集中度Cを累積加算する(S107にてYES→S109)。一方、対応特徴量が検出されない場合はステップS109を省略する。背景モデル修正部43は処理S105〜S109を全近傍画素に対して繰り返し行う(S110)。
【0095】
なお、ステップS106の処理において、背景モデル修正部43は記憶部3の背景モデル30から注目画素の頻度分布を構成する各正規分布iの平均値μ、及び近傍画素の背景特徴量Iの平均値μ及び分散σを読み出して、これらの値に(3)式を適用することでマハラビノス距離dを算出する。そして、算出したマハラビノス距離dを閾値Tと比較して、d≦Tである注目画素の正規分布iを近傍画素の背景特徴量Iと対応する対応特徴量として検出する。
【0096】
こうして投票処理を終えた背景モデル修正部43は、投票値を参照して最多得票である対応特徴量のインデックスIを特定する(S111)。背景モデル修正部43は当該対応特徴量Iのインデックスに対応する投票値を集中度累積値ΣCqとし、全てのインデックスiに対応する集中度累積値の総和をΣCgとして求め、これらとステップS100にて設定された近傍領域サイズm、及びステップS102にて算出された背景複雑度Zを(5)式に適用して修正量Δwを算出する(S112)。なお、(5)式に代えて(6)式を用いる場合には、ステップS108にて集中度Cに代えて近傍画素ごとに1を累積加算し、ステップS112では最多得票のインデックスIに対応する投票値をVMAXとし、全てのインデックスiに対応する投票値の総和を求めてVVARIDとする。
【0097】
背景モデル修正部43は記憶部3の背景モデル30から注目画素の頻度分布を読み出して、対応特徴量の正規分布Iの重みwにΔwを加算し、加算処理後のK個の重みの総和が1になるように調整して修正し、修正後の注目画素の頻度分布を記憶部3に書き戻す(S113)。例えば、当該調整は各重みwに共通の係数を乗じることにより実現できる。また背景特徴選出部42は記憶部3の修正された背景モデル30から注目画素の頻度分布を読み出して、読み出した頻度分布に対して背景特徴量の選出をし直して選出結果を記憶部3に書き戻す(S114)。
【0098】
背景モデル修正部43は全ての画素に対してループ処理S101〜S114を終え(S115にてYES)、さらに全ての近傍領域サイズに対してループ処理S100〜S115のループ処理を終えると(S116にてYES)、処理を図7のステップS1へ戻し、制御部4は次の監視画像に対する処理へと進む。
【0099】
上記実施形態では、混合正規分布を用いた背景モデル30を例示したが、ヒストグラムを用いた背景モデル30とすることもできる。この場合における背景特徴選出部42による集中度算出処理、及び背景モデル修正部43による修正処理は以下のように行うことができる。
【0100】
まず、集中度算出処理はヒストグラムにおいて0より大きな頻度を有する特徴量をクラスタリングして、各クラスタにおける特徴量の平均値と分散を算出して(3)式に代入することで集中度を算出する。そして、集中度が予め設定された集中度閾値Tc3以上であるクラスタに属する特徴量を背景特徴量として選出する。また、各クラスタに属する特徴量の頻度の総和がヒストグラム全体における特徴量の頻度の総和に占める割合を集中度として算出することもできる。
【0101】
修正処理では、クラスタを上記実施形態における正規分布と同様に扱う。クラスタ間の距離は当該クラスタの平均値と分散を用いたマハラノビス距離とする。分散を算出しない場合、クラスタ間の距離は当該クラスタの平均値間の距離にすればよい。修正は、対応特徴量として検出されたクラスタに属する特徴量の頻度を一律に増加させる、または対応特徴量として検出されたクラスタに属する特徴量のうち近傍画素の背景特徴量の平均値それぞれの頻度を個別に増加させる、または対応特徴量として検出されたクラスタの平均値の頻度を個別に増加させるという手法を採用することができる。
【0102】
さらに別の構成では、物体検出部44により抽出された物体領域を用いて侵入者を検知してもよい。また、物体検出部44により抽出された物体領域を用いて移動物体の追跡を行って、不審者を検知してもよい。
【0103】
また、近傍領域は必ずしも矩形領域である必要は無く、円形領域としてもよいし、注目画素から所定距離範囲内の画素からランダムにサンプリングして近傍領域を都度形成してもよい。
【符号の説明】
【0104】
1 監視カメラシステム、2 撮像部、3 記憶部、4 制御部、5 表示部、40 特徴抽出部、41 背景モデル生成部、42 背景特徴選出部、43 背景モデル修正部、44 物体検出部、45 マスク画像生成部。

【特許請求の範囲】
【請求項1】
移動物体が現れる所定空間を撮影した時系列の画像から当該空間についての背景モデルを生成する画像処理装置であって、
前記各画像の画素値から画素ごとの特徴量を抽出する特徴抽出部と、
前記時系列における前記各画素の前記特徴量の頻度分布を分析して背景モデルを生成する背景モデル生成部と、
前記各画素の前記頻度分布において、前記特徴量の分布範囲ごとに頻度の集中度を算出し、少なくとも最も高い前記集中度が算出された前記分布範囲を背景特徴量として選出する背景特徴選出部と、
前記各画素の前記頻度分布に対し、当該画素の画像上における近傍領域にて選出された前記背景特徴量と対応する特徴量の頻度を高める修正を行う背景モデル修正部と、
を有することを特徴とする画像処理装置。
【請求項2】
請求項1に記載の画像処理装置において、
前記背景モデル修正部は、大きさが互いに異なる複数の前記近傍領域を当該大きさの降順で順次、設定して前記修正を繰り返し行うこと、を特徴とする画像処理装置。
【請求項3】
請求項2に記載の画像処理装置において、
前記背景モデル修正部は、設定する前記近傍領域が小さいほど前記修正の度合いを大きくすること、を特徴とする画像処理装置。
【請求項4】
請求項1から請求項3のいずれか1つに記載の画像処理装置において、
前記背景モデル修正部は、前記近傍領域での前記背景特徴量の前記集中度が高いほど前記修正の度合いを大きくすること、を特徴とする画像処理装置。
【請求項5】
請求項1から請求項4のいずれか1つに記載の画像処理装置において、
前記背景モデル修正部は、前記各画素の前記頻度分布に対する前記修正を前記背景特徴量の前記集中度が高い画素から順に行うこと、を特徴とする画像処理装置。
【請求項6】
請求項1から請求項5のいずれか1つに記載の画像処理装置において、
前記特徴量抽出部は、少なくともエッジ情報を抽出し、
前記背景モデル修正部は、前記近傍領域にて選出された前記背景特徴量に含まれる前記エッジ情報の多寡に応じた背景複雑度を算出し、前記近傍領域での前記背景複雑度が低いほど前記修正の度合いを大きくすること、
を特徴とする画像処理装置。
【請求項7】
請求項1から請求項5のいずれか1つに記載の画像処理装置において、
前記特徴量抽出部は、少なくともエッジ情報を抽出し、
前記背景モデル修正部は、前記近傍領域において選出された前記背景特徴量に含まれる前記エッジ情報の多寡に応じた背景複雑度を算出し、前記背景複雑度が予め設定されたしきい値未満である前記近傍領域を用いて前記修正を行なうこと、
を特徴とする画像処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−203680(P2012−203680A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−68102(P2011−68102)
【出願日】平成23年3月25日(2011.3.25)
【出願人】(000108085)セコム株式会社 (596)
【Fターム(参考)】