説明

物体検出装置、物体検出方法及び物体検出プログラム

【課題】物体(人物)が比較的長い期間静止している場合でも、物体が背景モデルに同化することを抑制し、正確な物体の数の計数を可能とする。
【解決手段】物体検出処理部3では、固定カメラ1で撮影された入力画像と背景モデルとを、複数の画素からなるブロックに分割し、各ブロック毎に物体の輪郭に対応する物体領域を抽出する。また、この輪郭部分の内側の領域を埋めるように膨張処理を行うとともに、この膨張処理による物体領域の過剰検出を抑制する収縮処理を行う。荷重値テーブル生成部5は、物体の数に対する各画素の寄与率を表す荷重値を求めて荷重値テーブルを生成する。物体計数部6は、物体領域中の画素の荷重値を積算して物体の数を計数する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、固定カメラ等の画像入力装置で撮影された入力画像中に存在する物体の領域を検出し、その入力画像中の物体の数を計数する物体検出装置、物体検出方法及び物体検出プログラムに関し、特に、雑踏中の人物のように、静止していてもふらつき等によって手足、足先や頭部などの輪郭部分が微動する物体の計数に好適な技術に関する。
【背景技術】
【0002】
固定カメラ等からの入力画像(映像)から物体の数を計数(計測)する手法として、特許文献1に記載のものが公知である。このものでは、撮影に使用するカメラの姿勢や位置などを含む幾何的条件に基づいて、入力画像中の各画素に物体が存在する場合における、物体の数に対する各画素の寄与率に相当する荷重値を全画素に対して求める一方、入力画像から物体を除く背景モデルを構築し、これら入力画像と背景モデルとの差分により、物体が存在する物体領域を求めている。そして、この物体領域を構成する画素の荷重値を積算することによって、入力画像中に存在する物体の数を計測している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−294755号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記背景モデルは、例えば時系列に撮影された複数枚の入力画像の平均を用いて生成され、更に、屋外における時間的な照明の変化(朝と夜の明るさの違い)を除外するため、定期的に更新される。そのため、物体としての人物が長期的にその場に留まる場合、物体の移動を検出できずに物体が背景に同化し易く、物体の検出漏れを招くおそれがある。また、同様に類似した物体が多数存在する場合、物体間の差異が小さいために、過去に同一箇所に存在した類似物体が背景として取り込まれ易く、やはり物体の検出漏れを招き易い。
【課題を解決するための手段】
【0005】
人物などが長期的に静止・滞留する場合、一般的には完全な静止状態になることは無く、ふらつきなどにより、手先や足先などの輪郭部分では微少な動きの変化が現れる。本発明ではこの点に着目し、物体の輪郭を抽出した上で、膨張処理及び収縮処理を行うことで、長期的に静止・滞留する物体が存在する場合や、同様に類似した物体が多数存在する場合であっても、物体が背景に同化することによる検出漏れを低減し、物体の数を正確に計数するものである。
【0006】
すなわち、本発明に係る物体検出装置は、物体検出の対象範囲に対して所定の俯角をもって設置された画像入力装置により撮影される入力画像に基づいて、背景モデルを構築するとともに、前記入力画像と背景モデルとに基づいて、前記入力画像中に物体が存在する物体領域を検出する物体検出処理手段と、前記画像入力装置の幾何的条件に基づいて、前記入力画像中の各画素に物体が存在した場合における物体の数に対する各画素の寄与率を表す荷重値を求めて荷重値テーブルを生成する荷重値テーブル生成手段と、前記物体領域を構成する画素の荷重値を積算して、前記入力画像中に存在する物体の数を計数する物体計数手段と、を有するものである。
【0007】
そして、本発明では、上記物体検出処理手段が、前記入力画像と背景モデルとを、複数の画素からなるブロックに分割し、各ブロック毎に、前記入力画像と背景モデルとの類似度に基づいて、物体の輪郭に対応する物体領域を抽出し、この物体の輪郭の内側の領域を物体領域に補正するように、前記物体の輪郭に対応する物体領域の膨張処理を行い、かつ、この膨張処理による物体領域の過剰な膨張を抑制するように、前記膨張処理後の物体領域の収縮処理を行う、ことを特徴としている。
【0008】
このように、入力画像と背景モデルとの類似度に基づく物体領域の検出を、物体に対して適切な大きさに設定された複数の画素を含むブロック単位で定量的に行うことで、例えば個々の画素単位で細かく物体領域の検出を行う場合に比して、物体の形状に対する追従性は低下するものの、個々の画素の誤検出による影響を相殺・吸収することができるために、微小な変動を生じる物体の輪郭を確実に抽出することが可能となる。そして、膨張処理により物体の輪郭の内側の領域を物体領域として補正し、かつ、収縮処理によって、膨張処理による物体領域の過剰な膨張を抑制することで、物体領域を適切に検出することができる。これにより、物体が背景モデルに同化することによる物体の検出漏れを抑制し、正確な物体の数の計数が可能となる。
【0009】
但し、膨張処理及び収縮処理を経ることによって、隣接する物体間の非物体領域が物体領域として過剰に検出される結合領域が不可避的に発生し、この結合領域の分、物体の数が過剰に計数される、という新たな問題が生じる。そこで好ましくは、前記結合領域が発生する確率を求め、この確率に基づいて、前記物体計数手段により計数される物体の数を低下側へ補正する。これによって、結合領域の分、過剰に計数される物体の数を抑制することが可能となる。
【0010】
上述したように、物体領域の検出精度や物体の輪郭の抽出精度は、物体の大きさとブロックの大きさとの相関関係に大きく依存しており、物体に対してブロック(格子)が小さ過ぎると、図1(A)に示すように、物体の輪郭の内側に存在する物体未検出のブロックの数が多くなり、上述した膨張処理により輪郭内部の欠損部分を埋める補正が困難となる。
【0011】
従って、好ましくは、前記画像入力装置の幾何的条件に基づいて、入力画像中の平均的な物体の大きさを算出し、この平均的な物体の縦幅と横幅のうちで短い方の長さに基づいて、前記ブロックの大きさを設定する。具体的には、この平均的な物体の縦幅と横幅のうちで短い方の長さに対してブロックの一辺の長さが1/2〜1/3の範囲内となるように、ブロックの大きさを自動的に調整・設定する。
【0012】
あるいは、ブロックを一定の大きさとして、入力画像や背景モデルを拡大もしくは縮小するようにしても良い。すなわち、前記画像入力装置の幾何的条件に基づいて、入力画像中の平均的な物体の大きさを算出し、この平均的な物体の縦幅と横幅のうちで短い方の長さに基づいて、各ブロックに対する物体の大きさが所定レベルとなるように、前記入力画像と背景モデルの大きさを拡大もしくは縮小した上で、各ブロック毎に物体を検出する。この場合、前記物体計数手段は、検出結果を元の大きさへ戻した後、物体の数を計数することとなる。
【0013】
上述した各処理内容は、例えば、プログラムの形態としてコンピュータにより実行され、このプログラムは適宜な記録媒体に記録することができる。
【発明の効果】
【0014】
以上のように本発明によれば、複数の画素を含むブロック単位で物体領域を検出することによって物体の輪郭を抽出し、かつ、この物体の輪郭の内側を埋める膨張処理並びに過度な膨張を抑制する収縮処理を行うことで、人物などの物体が比較的長い期間、その場に滞留・静止する場合や、長期的な照明変動に対応するために背景モデルの更新を行った場合においても、人物のふらつきなどにより不可避的に微動を生じる物体の輪郭を抽出して、検出対象の物体を背景モデルから分離し、適切な物体領域の検出並びに物体の数の計数を行うことができる。
【図面の簡単な説明】
【0015】
【図1】(A)がブロックサイズが小さい場合、(B)がブロックサイズが大きい場合における物体として検出される領域の概念を示す説明図。
【図2】モルフォロジー演算による膨張処理(A)と収縮処理(B)の一例を示す説明図。
【図3】収縮処理による物体周辺の過剰検出画素の抑制の一例を示す説明図。
【図4】膨張処理及び収縮処理により残存する物体の結合領域を示す説明図。
【図5】膨張処理により物体の結合が発生する可能性のある領域を示す説明図。
【図6】本発明に係る画像蓄積部を含む場合の基本構成を簡略的に示す構成図。
【図7】本発明に係る画像蓄積部を含まない場合の基本構成を簡略的に示す構成図。
【図8】本発明の第1実施例に係る制御処理の流れを示すフローチャート。
【図9】本発明の第2実施例に係る制御処理の流れを示すフローチャート。
【図10】本発明の第3実施例に係る制御処理の流れを示すフローチャート。
【発明を実施するための形態】
【0016】
以下、本発明の好ましい実施形態について図面を参照して詳細に説明する。先ず、図1〜図5を参照して、基本的な原理・概念について説明する。
【0017】
人物などが長期的にその場に静止・滞留する場合、一般的には完全な静止状態になることは無く、ふらつきなどによって、手先、足先や頭部などの輪郭部分では微少な動きの変化が現れる。この点に着目し、固定カメラ等の画像入力装置により撮影される入力画像(単に「画像」とも呼ぶ)と背景モデル(以下、単に「背景」とも呼ぶ)とを、複数の画素からなる格子状のブロック(「格子」とも呼ぶ)毎に比較することにより、このような微少な変化を伴う物体の輪郭を抽出し、この物体の輪郭に対して後述する膨張処理並びに収縮処理を施すことによって、実際の物体に応じた適切な物体領域の検出を可能とするものである。つまり、複数の画素からなるブロック単位で物体領域を検出することで、長期的な照明変動に対応するために背景更新を行ったような場合においても、画像中の物体のふらつき等による物体の輪郭部分の微少な変化を検出し、検出対象の物体の輪郭を背景と分離して確実に抽出することができる。従って、類似した物体が複数存在する場合においても、類似した物体間の微少な差異を検出することが可能となる。
【0018】
図1に本発明の一実施形態に係る物体検出の第一段階の概念図を示す。任意の画像と背景モデルとを、それぞれ正方格子状の適宜な大きさのブロック10に区切り、各ブロック10毎に、入力画像と背景モデルとを比較することで、各ブロック10、つまりはブロック10内に含まれる全ての画素が物体領域か否かを検出する。人物のような移動物体11の場合、ふらつきなどの微少な変化により、物体11の輪郭・周辺領域では、背景と物体領域が変動するため、複数画素から構成される各ブロック10単位で、入力画像と背景モデルとを比較することで、図1の右側白抜き部分12に示すように、物体領域として物体11の輪郭部分を抽出することができる。
【0019】
ここで、ブロック10の大きさは任意の大きさに設定可能であるが、物体11の大きさに対し、ブロック10が小さ過ぎる場合には、図1(A)に示すように、物体の輪郭部分12の内側に位置する物体として検出されない未検出領域13となるブロック数が増加し、後述する膨張処理による補正が困難となる。従って、ブロック10は一定以上の大きさを持つこととし、且つ後述の膨張処理による未検出領域の補正のため、画像中で一様な大きさとする。
【0020】
物体表面の変化が乏しい場合、図1に示すように、物体の輪郭部分12は物体領域として検出されるものの、物体内側の領域13では物体の移動・変化がほとんど起こらないため、複数画素を含むブロック毎の比較であっても、物体が背景モデルに同化して検出することはできない。そこで、このような検出できない物体の輪郭部分12の内側の未検出領域13を、物体領域として補正・検出するため、図2に示すように、例えば公知のモルフォロジー(morphology)演算を用いた膨張処理、更にはこの膨張処理による過度な物体領域の膨張を低減するための収縮処理を行う。モルフォロジー演算の膨張処理により、物体の輪郭に対応する領域12の内側の未検出領域13を物体領域として補正し、その後の収縮処理によって、膨張処理により過剰検出された物体周辺の領域12Aを抑制する。このとき、モルフォロジー演算の膨張処理、収縮処理に使用する構造要素としてのブロックは、例えば3画素×3画素の正方格子とし、膨張処理、収縮処理を正方格子の1辺の画素数の半分の回数(1辺10画素の場合は5回)ずつ繰り返し実行することにより、未検出領域13が物体領域として検出される。図3に示すように、格子状に分割された複数画素を含む各ブロック毎に比較を行うことによって、過剰検出される物体周辺画素についても、モルフォロジー演算の収縮処理によって、実際の物体の大きさに応じた適宜な大きさの物体領域に抑制することができる。
【0021】
図4は、画像中の複数の物体11が一定の範囲内に近接して存在した場合の例である。ここで、一定の範囲内とは、モルフォロジー演算の膨張処理により物体同士が結合する結合領域14を生じ得る物体間の距離に相当する。モルフォロジー演算の膨張処理により結合した画素は、その後の収縮処理でも元の状態に戻らないため、物体領域として検出され、物体及び物体の数の過剰検出の原因となる。そこで、このような膨張処理による物体の結合が発生する確率を計算し、過剰検出による誤差を補正する必要がある。画像中の物体の大きさは、実際の物体の大きさ、カメラの焦点距離、及びカメラから物体までの距離により変動するが、事前に物体の大きさやカメラから移動する物体までの距離を計測することはできないため、ここでは簡易的に平均的な大きさの物体が画像中で一様に存在すると仮定し、実空間ではなく画像中に存在する物体の平均的な大きさを用いて、物体の結合する確率を計算する。
【0022】
モルフォロジー演算の性質上、膨張処理により結合が発生するのは、物体の斜め方向を除く、図5に示す物体の上下左右の方向の領域β1〜β4のみとなる。例えば、ある物体11の右側の領域β2と、隣接する他の物体(図示省略)の左側の領域β4と、の間の距離が所定レベルより近い場合に、膨張処理による結合が発生し、同様に、物体11の左側の領域部β4と他の物体の右側の領域β2、ある物体11の上側の領域β1と他の物体の下側の領域β3、ある物体11の下側の領域β3と他の物体の上側の領域β1、のそれぞれの領域間の距離が近い場合に結合が発生する。このことから、ある画素(x,y)について、結合による誤差が発生する確率は、該当する画素が物体ではなく、且つ前述の膨張処理により結合する組合せの場合となる。物体が1つだけ存在し、ある画素(x,y)が物体ではない確率P1'(x,y)は、画像中の平均的な物体面積(画素数)をα、画像全体の面積(画素数)をAとした場合、以下の式(1)により表すことができる。
P1'(x,y)=1−α/A…(1)
また、物体が2つ存在し、ある画素(x,y)が物体では無い確率P1''(x,y)は、P1'の確率に対して、1つ目の物体以外の領域に2つ目の物体が存在しない確率であるため、画像中における物体の床面積(画素数)の平均値をaとすると、以下の式(2)で表すことができる。
P1''(x,y)=P1'(x,y)×{1−α/(A−a)}…(2)
上記の式(1)、式(2)より、物体がN個存在する場合に、ある画素(x,y)が物体では無い確率P1(x,y)を一般化すると、以下の式により表すことができる。
【0023】
【数1】

【0024】
物体の数Nは、例えば、物体面積αと、上記の特許文献1により求められるカメラと床面との幾何的な関係から求められる荷重値と、に基づいて算出される。
【0025】
なお、物体検出の対象範囲を画像全体ではなく、画像の一部に対してのみ行う場合には、物体検出の面積Aの値を、画像全体の面積ではなく、対象範囲の面積(画素数)として算出すれば良い。
【0026】
画像入力装置の幾何学条件、つまり焦点距離、画像中心、レンズ歪みなどの内部パラメータと、姿勢と位置を含む外部パラメータと、更には物体検出の対象範囲と、が変更されなければ、α、A、aは固定値となり、P1(x,y)はNに依存する関数となる。Nは物体検出の対象範囲における物体の数となることから、計測対象となる撮影範囲の床面積や物体の大きさが固定されていれば、最大数が大きく変更されることはない。従って、Nの上限値を決定することも容易であり、事前にNを1から上限値まで変えたP1(x,y)を計算し、テーブル化しておくことにより、処理を高速化することも可能となる。
【0027】
次に、膨張処理により結合する各領域を、図5に示すβ1、β2、β3、β4とすると、膨張処理により結合する確率は、物体Aのβ1の領域が、この物体Aとは異なる他の物体(以降、物体X)のβ3の領域と2つ以上重なる領域と考えられる。ここで、物体Aと物体Xの大きさが、画像中の平均的な物体の大きさであるという仮定を用いると、以下の式(4),(5)に示すように、物体Aと物体Xそれぞれのβ1とβ3、β2とβ4は、同じ面積になる。
β1=β3=β' …(4)
β2=β4=β'' …(5)
以上のことから、ある画素(x,y)が膨張処理により結合しない確率は、β'またはβ''が一つも存在しない、あるいは一つしか存在しない確率である。ある画素(x,y)にβ'またはβ''が一つも存在しない確率Pb01(x,y)、Pb02(x,y)は、それぞれ以下の式(6),(7)で表すことができる。
Pb01(x,y)=2×(1−β'/A)^N …(6)
Pb02(x,y)=2×(1−β''/A)^N …(7)
また、ある画素(x,y)にβ'またはβ''が一つしか存在しない確率Pb11(x,y)、Pb12(x,y)は、以下の式(8),(9)で表すことができる。
Pb11(x,y)=2×N×β'/A×(1−β'/A)^(N−1) …(8)
Pb12(x,y)=2×N×β''/A×(1−β''/A)^(N−1)…(9)
上記の式(6)〜(9)を用いると、ある画素(x,y)にβ'またはβ''が二つ以上存在する確率P2(x,y)は、下式(10)で表すことができる。
P2(x,y)=1−{Pb01(x,y)+Pb02(x,y)+Pb11(x,y)+Pb12(x,y)}…(10)
式(3)および式(10)より、ある画素(x,y)が膨張処理により結合する確率P(x,y)は、下式(11)として表すことができる。
P(x,y)=P1(x,y)×P2(x,y) …(11)
ここで、P1(x,y)とP2(x,y)のうち、P1(x,y)は、物体の数Nが大きくなるほど小さくなる特性のもので、P2(x,y)は、物体の数Nが大きくなるほど大きくなる特性のものである。従って、これらのP1(x,y)とP2(x,y)とを掛け合わせることで、最終的な確率P(x,y)は、物体の数Nがある所定レベルに達するまでは、物体の数Nが大きくなるほど大きくなり、所定レベルを超えると、物体の数Nが大きくなるほど減少する特性のものとなる。
【0028】
物体領域として検出された画素数のうち、確率P(x,y)により導き出される画素数は、膨張処理により結合が発生し、収縮処理により収縮されずに過剰に検出されている画素と考えることができる。ここで、画像中の物体の大きさを平均的な物体の大きさとして仮定しているため、画素数と物体数には比例関係が成り立ち、式(11)により表される過剰検出される確率は、画素に対するものとしてではなく、物体数としてとらえることもできる。そこで、下式(12)に示すように、物体数Nに対し、式(11)により算出した確率P(x,y)を用いた補正を行うことで、過剰検出を考慮した物体数N'を導き出すことができる。
【0029】
図6は、本発明に係る基本構成の一例を示す図である。図6において、1は画像入力装置としての固定カメラ、2はカメラ1で取得した画像を蓄積する画像蓄積部、3は画像蓄積部2に蓄積された画像から背景モデルを生成し、複数画素を含む各ブロック毎に背景モデルと入力画像と比較を行うことによって、物体の輪郭部分を物体を含む領域として検出し、検出した領域に対して輪郭内部の欠損部分を埋める膨張処理や、膨張処理により過剰検出した部分を低減する収縮処理などの、誤差低減処理を行う物体検出処理部である。
【0030】
背景モデルの生成については公知の手法を用いることができ、例えば複数フレームの画像を平均して作成することができる。背景モデルの生成は必ずしも全ての画像入力時に行う必要は無く、背景モデルを一時的に保持することで、過去に生成した背景モデルを使用し、任意の間隔で背景モデルを更新可能とする。
【0031】
4はカメラ1の内部パラメータ(焦点距離、画像中心、レンズ歪みなど)、外部パラメータ(姿勢と位置)などのカメラ情報(幾何的条件)を入力するカメラ情報入力部である。5は前記カメラ情報入力部4から入力された内部パラメータ、外部パラメータと実空間中の3次元点を対応付けた透視投影の関係を前提として、観測される画像上の各画素に投影される視体積のうち物体の体積に寄与する体積を算出し、その画素が物体の数にどれだけ寄与するかを数量的に表す寄与率としての荷重値を全ての画素に対して求めて荷重値テーブルを生成する荷重値テーブル算出手段としての荷重値テーブル生成部である。
【0032】
6は、前記物体検出処理部3により検出された物体を含む領域の各画素と前記荷重値テーブル生成部5で得た各画素の荷重値から物体数を計測する物体計数部である。つまり、物体計数部6では、物体領域内の画素の荷重値を積算することで、物体の数が計数される。
【0033】
7は、前記物体検出処理部3により検出された物体を含む領域の各画素と、前記物体計数部6で計測された物体数とに基づいて、前記物体検出処理部3の誤差低減処理(膨張・収縮処理)により不可避的に生じる物体間の結合領域に起因する物体数の過剰検出の発生確率を算出し、この確率に基づいて、計測された物体数に対して再度誤差の補正を行い、物体数を再算出する物体数補正手段としての誤差補正部である。
【0034】
8は、誤差補正部で再算出された物体数を出力する物体数出力部である。尚、前記物体検出処理部3、荷重値テーブル生成部5、物体計数部6および誤差補正部7における各処理は、たとえば周知のコンピュータシステムにより実行可能である。画像蓄積部2には、ハードディスク、RAID装置、CD−ROMなどの記録媒体を利用してもよく、あるいは、ネットワークを介してリモートなデータ資源を利用する形態でも構わない。
【0035】
図7は、本発明に係る基本構成の他の例を示している。この例ように、蓄積部などの記憶装置、記録媒体を持たずにリアルタイムでの処理を行う構成とすることも可能である。図7において、図6と同一部分は同一符号をもって示し、重複する説明を適宜省略する。図7の例では、前記画像蓄積部2は省略しており、代わりに物体検出処理部3において背景モデルを保持し、カメラ1から入力された画像に対して背景モデルを更新する。このとき、背景モデルの更新は必ずしも全ての画像入力時に行う必要は無く、1枚以上の任意の間隔で設定可能とする。
【0036】
次に、図6、図7の装置の各部の処理の流れを図8のフローチャートに沿って説明する。まず全体の流れを説明すると、ステップS1においてカメラ1で撮影した画像を取り込む。ここで、図6の場合は、取り込んだ画像を画像蓄積部2へ蓄積する。次にステップS2において、前記取り込んだ画像から物体検出処理部3にて背景モデルを生成、あるいは更新する。次にステップS3で未処理の画像の有無を判定し、未処理の画像が存在する場合にはステップS4へ進み、前記背景モデルと入力された未処理の画像との間で、複数の画素を含む各ブロック毎の比較により、物体の輪郭に対応する領域を、物体を含む領域として検出する。つまり、複数の画素を含む各ブロック毎に、背景モデルと入力画像との間で、正規化相関による類似度を算出し、この類似度が所定レベルに達していない場合に、当該ブロックの入力画像を物体領域と判定・検出し、このブロック内の全ての画素を、物体が存在する画素として検出する。
【0037】
次にステップS5において、前記物体を含む領域に対して、上述したように、物体輪郭部分の内側の欠損部分を物体領域として検出する膨張処理や、この膨張処理によって過剰検出される物体領域を低減・縮小する収縮処理を行い、物体領域の誤差を低減する。これらステップS3からステップS5の処理は、図6、図7の物体検出処理部3において行われる。
【0038】
次にステップS10において、ステップS9で生成された荷重値テーブルをもとに、ステップS5により検出された物体を含む領域内に存在する画素の荷重値を加算つまり積算して、この積算値を物体の数として計数・計測する。これらの処理は、図6、図7の物体計数部6で行われる。このとき、ステップS9で生成される荷重値テーブルは、ステップS6で入力されるカメラ情報、ステップS7で入力・設定されるカメラパラメータなどの幾何的条件に基づいて、ステップS8において各画素毎に算出される。荷重値テーブルはカメラの設置位置に依存するため、カメラの設置以降であれば、物体数計測の前に事前に算出しておくことができる。
【0039】
次にステップS11において、上述した膨張処理と収縮処理を経ることによって、隣接する物体間の非物体領域が物体領域として過剰に検出される結合領域の分、過剰に計数される物体の数を抑制するように、物体の数を補正する。つまり、ステップS10で計測された物体数と、ステップS5で算出された物体を含む領域の画素数と、に基づいて、計測された物体数の誤差を算出し、計測された物体数に対して誤差の補正を行う。具体的には、上記の式(12)を用いて、過剰検出を考慮した物体数N'を求める。このステップS11の処理は、図6、図7の誤差補正部7で行われる。そして、ステップS12において、ステップS11で補正された物体数N'を出力する。ステップS12の処理は図6、図7の物体数出力部8で行われる。
【0040】
以下、各処理の詳細を説明する。カメラ1を経由して取得された画像は画像蓄積部2に蓄積され、画像蓄積部2から取り出した画像に基づき、物体検出処理部3にて背景モデルを更新する。このとき、背景モデルの更新は、1枚以上の任意の間隔で行うこととする。例えば複数フレームの画像を平均して背景モデルを作成する場合には、複数回の更新によって背景モデルが完全に更新されるまでの時間が、上記「任意の間隔」に相当し、屋外であれば5〜10分、屋内であれば30分程度に設定される。
【0041】
次に、取り出した画像と更新した背景モデルをそれぞれ格子状のブロック(格子)に分割し、複数の画素を含む各ブロック毎に、入力画像と背景モデルの位置的に対応するブロック内の各画素を用いて、正規化相互相関による類似度を算出する。この類似度は、0〜1の間の値であり、屋内もしくは屋外などのカメラの設置環境(幾何的条件)に応じて求められる。この類似度と、上記のカメラの設置環境等に応じて実験により予め設定しておいた閾値と、の比較処理を行い、一定以下の類似度を持つブロックが、物体領域として検出される。
【0042】
全てのブロックについて類似度の算出,閾値処理を終えたのち、図2に示すモルフォロジー演算の膨張処理によって、物体領域として検出された物体輪郭部分の内側の未検出領域の欠損を物体領域として補正し、次いで収縮処理により、膨張処理により過剰検出された領域や、ブロック単位での演算により、過剰に検出されてしまった領域を縮小・低減する補正を行う。ここでモルフォロジー演算以降は、ブロック毎の演算ではなく、画素単位での膨張処理、収縮処理の演算を行う。
【0043】
次に、物体検出処理部3で検出された物体領域と、荷重値テーブル生成部5にて生成された荷重値テーブルとから、物体計数部6において、物体領域に含まれる画素に対し、その荷重値を積算することで、画像中に含まれる物体数を計数する。
【0044】
ここで、固定されたカメラを前提とし、カメラ情報入力部4にて入力されたカメラの3次元位置、ならびにカメラの姿勢を表す回転角度、およびカメラの焦点距離(以降、カメラ情報)が、全て既知であるものとする。荷重値テーブル生成部5では、カメラ情報入力部4にて入力されたカメラ情報から、画像空間と3次元実空間との対応付けを行い、ある画素に物体が存在した場合の物体表面の全画素数に対する割合を、荷重値として算出する。物体計数部6では、物体検出処理部3で検出された物体領域に対応する荷重値テーブルの値を積算することにより、画像全体に含まれる物体数を算出する。ここで、物体検出処理部3では、図4に示すようにモルフォロジー演算の膨張処理により、本来物体領域ではない結合領域も、物体領域として検出される可能性がある。そのため、この結合領域による物体数の過剰検出を抑制するように、誤差補正部7にて物体数を補正する。誤差補正部7では、物体計数部6で算出された物体数や、画像全体の画素数、画像中に存在する平均的な物体の大きさ、物体検出処理部3で検出された物体領域の画素数に基づいて、上述した式(1)から式(11)に示すように、結合確率P(x,y)を算出する。算出したP(x,y)は結合による誤差の発生確率に相当するため、誤差補正部7ではP(x,y)と物体計数部6で算出された物体数Nを用いて、上述した式(12)により、補正後の物体数N'を算出する。物体数出力部8では、この補正後の物体数N'を誤差補正部7から取得し、最終的な物体数として出力する。
【0045】
再び図8を参照して、本発明の第1実施例について説明する。本実施例の処理内容は、大きく分けて、事前に設置したカメラ情報に基づき荷重値テーブルを算出するルーチンと、それに基づき入力画像から物体数を計数するフローと、により大略構成される。
【0046】
まず、荷重値テーブルを算出するルーチンでは、事前に設置したカメラの情報、カメラパラメータをステップS6およびステップS7により入力し、それぞれの値に基づいてステップS8において荷重値を各画素毎に算出し、算出した荷重値とカメラパラメータに基づいてステップS9において荷重値テーブルを生成する。荷重値テーブルには、入力画像の各画素に対して、物体表面積の占める割合を荷重値として記録し、また、算出に使用したカメラパラメータも記録される。
【0047】
一方物体数を計数するフローにおける物体検出処理では、まずステップS1においてカメラ1からの入力画像を取得し、取得した入力画像を元にステップS2において背景モデルの構築を行う。このとき、背景モデルは全ての入力画像に対して生成されるわけではなく、事前に設定した処理間隔に基づいて、背景モデルの更新も行えるものとする。また、並行して未処理の入力画像があるかどうかの判定をステップS3にて行い、未処理の入力画像がある場合にはステップS4の処理へ移り、未処理の入力画像が無い場合にはステップS1の処理へ移る。
【0048】
ステップS4ではステップS2にて生成または更新した背景モデル、及び入力画像をそれぞれ格子状のブロックに分割し、分割した全てのブロックに対してブロック内の画素数を元に正規化相互相関を用いて背景モデルと入力画像との比較を行う。ここで、正規化相互相関の値が事前に設定した一定の値以下の場合は、背景との差分が大きいため、物体領域として判定され、一定の値を超えた場合は、背景との差分が少ないことから、物体以外の領域として判定される。続いてステップS5においてモルフォロジ演算の膨張、収縮処理により、格子状に分割比較したことにより発生する欠損や過剰検出を抑制する処理を行う。次いで、ステップS5において補正を行った物体領域、ステップS9において事前に作成された荷重値テーブルに基づき、ステップS10において物体数を計数する。次いで、ステップS11においてステップS5において補正を行った物体領域およびステップS10において算出した物体数から、図4に示すステップS5の処理により発生する物体の結合による過剰検出領域の発生確率を算出する。最後にステップS12においてステップS11により算出した誤差発生確率に基づいてステップS10において算出した物体数の補正を行い、物体数を計数する。
【0049】
前記第1実施例では、入力画像と背景モデルとの比較に正規化相互相関を用いており、その際のブロックのサイズは任意としていた。しかしながら、図1に示すように、物体の大きさに対してブロック10のサイズが小さ過ぎると、物体検出処理部3における欠損の補正処理(膨張処理)を行う際に、物体輪郭部分の内部の欠損を補正しきれない。また、固定カメラを用い、カメラ情報入力部4によりカメラ情報が入力されれば、入力画像中に存在する物体の平均的な大きさを算出することができる。
【0050】
そこで、図9に示す第2実施例においては、物体領域検出ステップS4Aがカメラ情報入力ステップS6からカメラ情報を受け取り、受け取ったカメラ情報に基づき、平均的な物体の大きさを算出し、入力画像と背景モデルとの比較に使用するブロックの大きさを自動で決定する。例えば、検出したい対象の物体が画像の中心に最も近い状態で映し出されているものと仮定し、当該物体の大きさを平均的な物体の大きさとして用いる。ここで、物体周辺領域では物体の微少なふらつきなどにより検出が可能となることから、ブロックの大きさは、図1に示すように対象となる物体の画像中の縦幅、横幅のうちで短い長さの寸法に対し、3分の1から2分の1の範囲の大きさとすることで、ふらつきにより検出される物体の輪郭周辺を除く物体中心部分の物体領域として検出されない欠損領域も、概ねブロック1つ分の大きさとなり、物体検出処理部3における欠損の補正処理により良好な補正が可能となる。
【0051】
前記第1実施例および前記第2実施例では、正規化相互相関を用いるブロックサイズを任意としている。ブロックサイズが大きいほど、1つのブロック内の情報量(画素数)が増加することから、微少な変化を捉え易くなるが、一方で1つのブロックあたりの演算量が増加するという問題がある。そこで、第3実施例では、図10に示すように、画像サイズ変更ステップS13及びステップS14を新たに追加している。画像サイズ変更ステップS13では、カメラ情報入力ステップS6からの情報を受け取り、受け取ったカメラ情報に基づき、平均的な物体の大きさを算出し、ステップS1で取得される入力画像の大きさを変更し、ブロックの大きさを変えずに相対的なブロックの大きさを変更する。このとき、前記第2実施例と同様に、ブロックの大きさが対象となる物体の画像中の縦幅、横幅のうちで長い方の長さ寸法の3分の1から2分の1の大きさになるように、入力画像の大きさを変更することで、物体中心の欠損もブロック概ね1つ分となり、物体検出処理部3における欠損の補正処理による良好な補正が可能となる。荷重値テーブルは元の大きさの入力画像に基づいて作成されているため、物体検出処理部で検出された物体領域は、ステップS5による欠損、過剰検出の補正処理後の画像サイズ変更ステップS14によって、元の入力画像の大きさに戻した後、ステップS10へ進み、物体計数部6により物体数の計数を行う。この画像サイズ変更ステップS14では、上記の画像サイズ変更ステップS13と同様に、カメラ情報入力ステップS6からの情報を受け取り、この情報に基づいて、画像サイズを元に戻せば良い。
【0052】
なお、本発明は、上述した物体検出装置の各部の処理内容の一部又は全部を、コンピュータを機能させるプログラムとして構成することもできる。
【符号の説明】
【0053】
1…カメラ(画像入力装置)
2…画像蓄積部
3…物体検出処理部(物体検出処理手段)
4…カメラ情報入力部
5…荷重値テーブル生成部(荷重値テーブル生成手段)
6…物体計数部(物体計数手段)
7…誤差補正部(物体数補正手段)
8…物体数出力部

【特許請求の範囲】
【請求項1】
物体検出の対象範囲に対して所定の俯角をもって設置された画像入力装置により撮影される入力画像に基づいて、背景モデルを構築するとともに、前記入力画像と背景モデルとに基づいて、前記入力画像中に物体が存在する物体領域を検出する物体検出処理手段と、
前記画像入力装置の幾何的条件に基づいて、前記入力画像中の各画素に物体が存在した場合における物体の数に対する各画素の寄与率を表す荷重値を求めて荷重値テーブルを生成する荷重値テーブル生成手段と、
前記物体領域の画素の荷重値を積算して、前記入力画像中に存在する物体の数を計数する物体計数手段と、
を有する物体検出装置において、
上記物体検出処理手段が、
前記入力画像と背景モデルとを、複数の画素からなるブロックに分割し、各ブロック毎に、前記入力画像と背景モデルとの類似度に基づいて、物体の輪郭に対応する物体領域を抽出し、
この物体の輪郭の内側の領域を物体領域に補正するように、前記物体の輪郭に対応する物体領域の膨張処理を行い、
かつ、この膨張処理による物体領域の過剰な膨張を抑制するように、前記膨張処理後の物体領域の収縮処理を行う、
ことを特徴とする物体検出装置。
【請求項2】
前記膨張処理及び収縮処理を経ることによって、隣接する物体間の非物体領域が物体領域として過剰に検出される結合領域が発生する確率を求め、この確率に基づいて、前記物体計数手段により計数される物体の数を補正する物体数補正手段を有することを特徴とする請求項1に記載の物体検出装置。
【請求項3】
前記物体検出処理手段は、前記画像入力装置の幾何的条件に基づいて、入力画像中の平均的な物体の大きさを算出し、物体の縦幅と横幅のうちで短い方の長さに基づいて、前記ブロックの大きさを設定することを特徴とする請求項1又は請求項2に記載の物体検出装置。
【請求項4】
前記物体検出処理手段は、
前記画像入力装置の幾何的条件に基づいて、入力画像中の平均的な物体の大きさを算出し、物体の縦幅と横幅のうちで短い方の長さに基づいて、各ブロックに対する物体の大きさが所定レベルとなるように、前記入力画像と背景モデルの大きさを拡大もしくは縮小した上で、各ブロック毎に物体を検出し、
前記物体計数手段は、検出結果を元の大きさへ戻した後、物体の数を計数することを特徴とする請求項1又は2に記載の物体検出装置。
【請求項5】
コンピュータに請求項1〜4のいずれかに記載の各手段を実行させるプログラムとしたことを特徴とする物体検出プログラム。
【請求項6】
物体検出の対象範囲に対して所定の俯角をもって設置された画像入力装置により撮影される入力画像に基づいて、背景モデルを構築する背景モデル構築ステップと、
前記入力画像と背景モデルとに基づいて、前記入力画像中に物体が存在する物体領域を検出する物体検出処理ステップと、
前記画像入力装置の幾何的条件に基づいて、前記入力画像中の各画素に物体が存在した場合における物体の数に対する各画素の寄与率を表す荷重値を求めて荷重値テーブルを生成する荷重値テーブル生成ステップと、
前記物体領域の画素の荷重値を積算して、前記入力画像中に存在する物体の数を計数する物体計数ステップと、
を有する物体検出方法において、
上記物体検出処理ステップが、
前記入力画像と背景モデルとを、複数の画素からなるブロックに分割し、各ブロック毎に、前記入力画像と背景モデルとの類似度に基づいて、物体の輪郭に対応する物体領域を抽出し、
この物体の輪郭の内側の領域を物体領域に補正するように、前記物体の輪郭に対応する物体領域の膨張処理を行い、
かつ、この膨張処理による物体領域の過剰な膨張を抑制するように、前記膨張処理後の物体領域の収縮処理を行う、
ことを特徴とする物体検出方法。

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2011−186719(P2011−186719A)
【公開日】平成23年9月22日(2011.9.22)
【国際特許分類】
【出願番号】特願2010−50417(P2010−50417)
【出願日】平成22年3月8日(2010.3.8)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】