説明

人数カウント装置、人数カウント方法及び人数カウントプログラム

【課題】入力画像上に複数の人物が近接している、または、複数の人物によりオクルージョンが生じている場合にもより高精度、高速に人物検出することができる人数カウント装置、人数カウント方法及び人数カウントプログラムを提供する。
【解決手段】入力画像に対して人物検出を行い人物の存在する領域を抽出する人物存在領域抽出部104と、人物存在領域抽出結果から人物の存在状況を推定する人物存在状況推定部105と、人物存在状況推定結果に基づき人数計測に用いる部分検出器の種類を選択する部分検出器選択部106と、部分検出器情報から人物の一部分を検出する部分検出処理を行う部分検出処理部107と、部分検出処理結果から入力画像内の人物の数を求める人数カウント部109とを備えるので、部分検出器を入力画像全体に用いる従来手法よりも、高速且つ誤検出のより少ない高精度な人数カウント処理を行うことができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、監視カメラ等から撮影された画像に対し、人物検出技術を用いることで人数カウントを行うための人数カウント装置、人数カウント方法及び人数カウントプログラムに関する。
【背景技術】
【0002】
近年の監視カメラシステムには、店舗等への侵入者の自動検知や、入場者数の自動カウント等を行うことを目的に、人物検出技術が導入されている。従来の人物検出技術としては、例えば特許文献1や非特許文献1、2に記載されたものが知られている。
【0003】
特許文献1には、監視カメラ等で撮影された入力画像に対して背景画像データベースとのマッチング処理を行い、差分検出した画素の位置や数に応じて人数を推定する方法が開示されている。非特許文献1には、事前に大量の検出対象サンプル(人物の全身が含まれる画像)と非検出対象サンプル(人物の全身が含まれない画像)からHOG(Histogram of Oriented Gradient)特徴量を抽出し、その特徴量空間上の各々のサンプル群の境界線を、SVM(Support Vector Machine)を用いてモデル化することで、静止画像中からの人物検出技術を実現する方法が開示されている。非特許文献2には、人物の一部分を検出する部分検出器をEdgelet特徴量とブースティング法を用いて構築し、各々の部分検出器の出力結果を最大事後確率推定を行うことで1つに統合する方法が開示されている。
【0004】
上記非特許文献1、2で行われている静止画像中からの人物検出は、一般的に次のように行われる。まず、監視カメラ等で撮影された入力画像中における人物のサイズ及び位置は一定ではないため、入力画像に対してリサイズ処理等のスケーリング処理を繰り返し行うことで、入力画像をピラミッド画像に変換する。その後、ピラミッド画像を構成する各々のスケーリング画像から、所定サイズの画像ウィンドゥを所定間隔で抽出し、各々の画像ウィンドゥ中における所定特徴量の値に基づいたスコアの閾値判定によって人物検出判定処理を行う。
【0005】
人物検出器は、人物のような非剛体の様々な形状変化に対してロバスト(強靭)な検出性能を発揮するように構築されているため、人物検出結果を入力画像中に人物検出候補枠矩形として表示すると、図11のように、人物の周辺で複数の人物検出候補枠矩形110aが出力される(以下、人物検出結果の位置ずれ問題と呼ぶ)。最終的には、人物検出候補枠矩形110aを、各々の矩形の属性情報(中心位置、サイズ、スコア等)に基づき、同一グループと判定するような統合処理を行うことで、その最終統合結果111を人物検出結果として表示する(非特許文献1のFig.5.1参照)。人数カウント等を行う場合は、この矩形の最終統合結果111の数を人数としてカウントすることになる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−25328号公報
【非特許文献】
【0007】
【非特許文献1】Navneet Dalal, “Finding People in Images and Videos”, PhD Thesis, Institut National Polytechnique de Grenoble/INRIA Grenoble, Grenoble, July 2006.
【非特許文献2】Bo Wu and Ram Nevatia, “Detection and Tracking of Multiple, Partially Occluded Humans by Bayesian Combination of Edgelet based Part Detectors”, International Journal of Computer Vision, 75(2): 247-266, 2007.
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上述した従来の人物検出技術においては、下記のような課題があった。
まず特許文献1で開示された技術では、入力画像と背景画像データベースとの差分情報に基づくマッチング処理を行うため、照明や影等の急激な環境変動が生じ、適切な背景画像が選択できない場合に人数カウント精度が劣化してしまう。
【0009】
非特許文献1で開示された技術では、全身検出器を用いているために、人物検出結果の位置ずれ問題の影響を特に受ける。例えば、図12の(a)に示すように、複数の人物が近接した場合、左右に並んだ人物に対する各々の人物検出候補枠矩形自体が近接し、その後の人物検出候補枠矩形の統合処理で同一グループと判定されてしまうため、左右の人物を分離して検出できなくなってしまう。また、図12の(b)に示すように、オクルージョンのある後方人物に対する人物検出精度が劣化してしまうことで、人物検出候補枠矩形の数が前方人物の人物検出候補枠矩形と比較して小さくなってしまい、前後の人物を分離して検出できなくなってしまう。
【0010】
非特許文献2で開示された技術では、部分検出器を用いているために、人物検出結果の位置ずれ問題の影響は緩和される。これは、人体をより細かく部分的に見た場合、人体の一部分は、より剛体に近い非剛体と考えられるからである。しかしながら、非特許文献2で開示された技術では、どのような状況のオクルージョンに対しても、入力画像から抽出される全ての画像ウィンドゥに対し、常に事前に用意した全ての部分検出器を用いて人物検出処理を行う必要があるため、本来必要のない部分検出器までも用いてしまうことによる誤検出増加の可能性、及び処理速度増加という点で、最適な人物検出処理が行えているとは言い難い。
【0011】
例えば図13において、入力画像130上に対して上半身検出器134と下半身検出器135を常に使用すると、下半身にオクルージョンのある人物131、及び上半身にオクルージョンのある人物132を、ともに検出することができる。しかしながら、本来下半身にオクルージョンのある人物131、及び上半身にオクルージョンのある人物132に対しては、それぞれ上半身検知器134、下半身検知器135のみの人物検出処理を行うだけで十分であり、下半身検知器135及び上半身検出器134をさらに用いることによって処理速度が増加してしまっている。さらに、一般的に上半身や下半身などの部分検出器は、全身検出器に比べて誤検出が多く(非特許文献1のFig.7.1参照)、入力画像130上に対して上半身検出器134と下半身検出器135を常に使用することで、より誤検出(例えば木133を検出してしまうような誤検出)を発生してしまう危険性を高めてしまうことになる。
【0012】
本発明は、係る事情に鑑みてなされたものであり、入力画像上に複数の人物が近接している、または、複数の人物によりオクルージョンが生じている場合にも、より高精度、高速に人物検出することができる人数カウント装置、人数カウント方法及び人数カウントプログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
本発明の人数カウント装置は、入力画像に対して、人物検出を行い人物の存在する領域を抽出する人物存在領域抽出手段と、前記人物存在領域抽出手段の抽出結果から人物の存在状況を推定する人物存在状況推定手段と、前記人物存在状況推定手段の推定結果に基づき、人数計測に用いる部分検出器の種類を選択し部分検出器情報を出力する部分検出器選択手段と、前記部分検出器選択手段から出力された部分検出器情報に基づく部分検出処理を用いて人物の一部分を検出する部分検出処理を行う部分検出処理手段と、前記部分検出処理手段の部分検出処理結果から前記入力画像内の人物の数を求める人数カウント手段と、を備えた。
【0014】
上記構成により、人数カウントを行うための複数の検出器の中から、状況に応じて最適なものを選択することができるようになり、人数カウントの精度が向上する。これにより、入力画像上に複数の人物が近接している、または、複数の人物によりオクルージョンが生じている場合にも、より高精度、高速に人物検出することが可能となる。
【0015】
上記構成において、前記人物存在領域抽出手段は、抽出結果として矩形情報を出力し、前記人物存在状況推定手段は、前記人物存在領域抽出手段の抽出した矩形情報の縦横比または縦と横の長さに応じて人物存在状況を推定する。
【0016】
上記構成により、人物存在状況をより確実に推定することができ、高精度で人数カウントができる。
【0017】
上記構成において、前記部分検出器選択手段は、前記人物存在状況推定手段の推定結果が人物が重なっていると判断した場合には部分検出を行う種類の前記部分検出器を選択する。
【0018】
上記構成により、人物が重なっている場合でも高精度で人数カウントができる。
【0019】
上記構成において、前記部分検出器選択手段は、前記部分検出器として、上半身検出器、下半身検出器、右半身検出器、左半身検出器のうち、少なくとも一つを選択する。
【0020】
上記構成により、4つの検出器のうち少なくとも一つを選択することで、人物が重なっている場合でも高精度で人数カウントができる。
【0021】
上記構成において、前記人物存在状況推定手段は、前記人物存在領域抽出手段の抽出した前記矩形情報が人物のサイズに比べて横方向には長くなく縦方向に長い場合は人物が縦方向に重なっていると判断し、前記部分検出器選択手段は、前記人物存在状況推定手段が人物が縦方向に重なっていると判断した場合には、前記上半身検出器を選択する。
【0022】
上記構成により、人物が縦方向に重なっている場合でも高精度で人数カウントができる。
【0023】
上記構成において、前記人物存在状況推定手段は、前記矩形情報が人物のサイズに比べて横方向に長く縦方向に長くない場合は人物が横方向に重なっていると判断し、前記部分検出器選択手段は、前記人物存在状況推定手段が人物が横方向に重なっていると判断した場合には、前記右半身検出器及び前記左半身検出器を選択する。
【0024】
上記構成により、人物が横方向に重なっている場合でも高精度で人数カウントができる。
【0025】
上記構成において、前記人物存在状況推定手段は、前記矩形情報が人物のサイズに比べて横方向にも縦方向にも長い場合は人物が広範囲に重なっていると判断し、前記部分検出器選択手段は、前記人物存在状況推定手段が人物が広範囲に重なっていると判断した場合には、前記上半身検出器、前記下半身検出器、前記右半身検出器及び前記左半身検出器を選択する。
【0026】
上記構成により、人物が広範囲に重なっている場合でも高精度で人数カウントができる。
【0027】
本発明の人数カウント方法は、入力画像に対して、人物検出を行い人物の存在する領域を抽出するステップと、人物の存在する領域を抽出した結果から人物の存在状況を推定するステップと、人物の存在状況を推定した結果に基づき、人数計測に用いる部分検出器の種類を選択し部分検出器情報を出力するステップと、選択された部分検出器の部分検出器情報に基づく部分検出処理を用いて人物の一部分を検出する部分検出処理を行うステップと、検出処理結果から前記入力画像内の人物の数を求めるステップと、を備えた。
【0028】
上記方法により、人数カウントを行うための複数の検出器の中から、状況に応じて最適なものを選択することができるようになり、人数カウントの精度が向上する。これにより、入力画像上に複数の人物が近接している、または、複数の人物によりオクルージョンが生じている場合にも、より高精度、高速に人物検出することが可能となる。
【0029】
本発明の人数カウントプログラムは、上記人数カウント方法の各ステップをコンピュータに実行させるためのプログラムである。
【0030】
上記プログラムにより、人数カウントを行うための複数の検出器の中から、状況に応じて最適なものを選択することができるようになり、人数カウントの精度が向上する。これにより、入力画像上に複数の人物が近接している、または、複数の人物によりオクルージョンが生じている場合にも、より高精度、高速に人物検出することが可能となる。
【発明の効果】
【0031】
本発明によれば、入力画像上に複数の人物が近接している、または、複数の人物によりオクルージョンが生じている場合にも、より高精度、高速に人物検出することができるという効果を有する人数カウント装置、人数カウント方法及び人数カウントプログラムを提供することができる。
【図面の簡単な説明】
【0032】
【図1】本発明の一実施の形態に係る人数カウント装置の概略構成を示すブロック図
【図2】図1の人数カウント装置において、入力画像と入力画像から生成されるピラミッド画像の一例を示す図
【図3】図1の人数カウント装置において、全身検出候補枠の和集合領域である人物存在領域の設定の一例を示す図
【図4】図1の人数カウント装置において、標準的な人物サイズの求め方の一例を示す図
【図5】図1の人数カウント装置において、標準的な人物サイズを矩形とし、人物存在領域と矩形との縦横各々のサイズの差分を閾値と比較し4パターンに分類した状態を示す図
【図6】図1の人数カウント装置における部分検出処理の概要を示す図
【図7】図1の人数カウント装置における統合検出枠群の作成の一例を示す図
【図8】図1の人数カウント装置における統合検出枠の作成処理の一例を示す図
【図9】図1の人数カウント装置における統合検出枠同士の統合処理の一例を示す図
【図10】図1の人数カウント装置の動作を説明するためのフローチャート
【図11】従来の人物検出技術における人物検出候補枠矩形を示す図
【図12】従来の人物検出技術の課題を説明するための図
【図13】従来の人物検出技術の課題を説明するための図
【発明を実施するための形態】
【0033】
以下、本発明を実施するための好適な実施の形態について、図面を参照して詳細に説明する。
【0034】
図1は、本発明の一実施の形態に係る人数カウント装置の概略構成を示すブロック図である。図1において、本実施の形態の人数カウント装置1は、画像入力部101と、全身検出処理部102と、全身検出モデルデータベース部(以下、全身検出モデルDB部と記述する)103と、人物存在領域抽出部104と、人物存在状況推定部105と、部分検出器選択部106と、部分検出処理部107と、部分検出モデルデータベース部(以下、部分検出モデルDB部と記述する)108と、人数カウント部109と、表示部110と、を有する。
【0035】
以下、図1に示す人数カウント装置1の各構成要素について詳しく説明する。画像入力部101は、図示せぬ監視カメラ等で撮影された画像情報の入出力と、その保持を行う。全身検出処理部102は、画像入力部101から出力された画像を入力とし、その入力画像に対してリサイズ処理等のスケーリング処理を繰り返し行うことで、入力画像をピラミッド画像に変換する。図2は、入力画像と入力画像から生成されるピラミッド画像の一例を示す図である。図2の(a)は入力画像201を表し、図2の(b)はピラミッド画像202を表す。全身検出処理部102は、入力画像201から生成したピラミッド画像202を構成する各々のスケーリング画像から、所定サイズの画像ウィンドゥ203を所定間隔で抽出し、各々の画像ウィンドゥ203に対して全身検出処理を行う。この全身検出処理は、画像ウィンドゥ203内の人物の全身らしさを示すスコア値に基づいて行われ、事前に設定した所定のスコア閾値A以上のスコア値が算出された画像ウィンドゥ203に対して、人物の全身が含まれていると判定する。全身検出処理部102は、最終的に、各々のスケーリング画像から全身が含まれると判定した画像ウィンドゥ203の二次元位置情報をスケーリング処理を行う前の入力画像201上に逆スケール変換したときの二次元位置情報と、その画像ウィンドゥ203のスコア値を出力する。
【0036】
全身検出モデルDB部103は、画像ウィンドゥ203内から抽出された特徴量の値を入力とし、画像ウィンドゥ203内に全身が含まれるか否かを判定するためのスコア値を出力するようなモデル情報が少なくとも1つ以上蓄積されているデータベースである。全身検出処理部102は、これらのモデル情報に基づいて画像ウィンドゥ203に対する全身検出処理を行う。
【0037】
全身検出モデルDB部103におけるモデル情報は、事前に大量の検出対象サンプル(人物の全身が含まれる画像)と非検出対象サンプル(人物の全身が含まれない画像)から特徴量を抽出し、その特徴量空間上の各々のサンプル群の境界線を、SVM(Support Vector Machine)やブースティング法などの代表的な統計的学習手法を用いることで構築できる。その結果、画像ウィンドゥ203内に人物の全身が含まれる場合はスコア値が大きく、逆に画像ウィンドゥ203内に人物の全身が含まれない場合は、スコア値が小さくなるようなモデル情報が、全身検出モデルDB部103に蓄積される。
【0038】
人物存在領域抽出部104は、全身検出処理部102の出力結果である複数の全身検出候補枠204(図2の(a)参照)の中から、例えば、中心位置同士の距離が所定の距離閾値B以内の全身検出候補枠204同士を1つの同一グループに分類し、各グループごとに全身検出候補枠204の和集合領域である人物存在領域205を設定する。なお、人物存在領域205は、入力画像中における複数の全身検出候補枠204の二次元位置情報を、各々の矩形の4点のXY座標(X、Y)で表現したとき、各グループごとにX座標が最小となるX_MIN、Y座標が最小となるY_MIN、X座標が最大となるX_MAX、Y座標が最大となるY_MAXを算出し、次の4点の座標(X_MIN、Y_MIN)、(X_MIN、Y_MAX)、(X_MAX、Y_MIN)、(X_MAX、Y_MAX)によって内包される領域によって設定してもよい。図3は、全身検出候補枠301、302の和集合領域である人物存在領域303の設定の一例を示す図である。
【0039】
人物存在状況推定部105は、人物存在領域抽出部104から出力される人物存在領域205の縦横各々のサイズ情報による閾値判定結果に基づいて、人物存在領域205内における人物の存在状況を、(パターン1)人物が1人存在する、(パターン2)人物が縦方向に並んでいる、(パターン3)人物が横方向に並んでいる、(パターン4)その他、の4パターンのいずれかに推定する。
【0040】
人物存在領域205の閾値判定は、標準的な人物サイズとの比較により行う。標準的な人物サイズの求め方としては、例えば事前にカメラの設置位置などから標準的な人物サイズを設定しておけばよい。また、他の方法として、カメラの設置角度によっては画面上の位置によって標準的な人物のサイズが異なる場合があるため、その場合には入力画像201上の任意位置において検出されうる人物の身長情報を事前に設定しておくことで標準的な人物サイズを得ることができる。例えば、画像上のY軸方向で人物の大きさが変化する場合は、入力画像201上に図4に示すような画面内の各位置における標準的な人物サイズを表す参照画像ウィンドゥ群401を設定しておき、人物存在領域402の中心位置403のY座標と、参照画像ウィンドゥ群401中で中心位置のY座標との距離が最も近くなる矩形404を標準的な人物サイズとして採用する。
【0041】
図5は、標準的な人物サイズを矩形501とし、人物存在領域402と矩形501との縦横各々のサイズの差分を閾値と比較し上記の4パターンに分類した図である。人物存在領域が502のように横サイズ差分が横サイズ閾値C_hより小さく、かつ縦サイズ差分が縦サイズ閾値C_vよりも小さい場合、人物存在領域における人物の存在状況は、人物存在状況推定部105によって上記(パターン1)に推定される。また、人物存在領域が503のように横サイズ差分が横サイズ閾値C_hよりも小さく、かつ縦サイズ差分が縦サイズ閾値C_vよりも大きい場合、(パターン2)に推定される。また、人物存在領域が504のように横サイズ差分が横サイズ閾値C_hよりも大きく、かつ縦サイズ差分が縦サイズ閾値C_vよりも小さい場合、(パターン3)に推定され、人物存在領域が505のように縦横各々のサイズ差分が上記のいずれにも該当しない場合、(パターン4)に推定される。
【0042】
部分検出器選択部106では、人物存在状況推定部105で推定された4つのパターンに応じて、以降の処理で用いる部分検出処理を選択する。具体的には、(パターン1)人物が1人存在する場合は部分検出処理は行わない、(パターン2)人物が縦方向に並んでいる場合は上半身検出処理を行う、(パターン3)人物が横方向に並んでいる場合は半身検出処理(右半身と左半身)を行う、(パターン4)その他の場合、上半身検出処理と半身検出処理(右半身と左半身)を共に行う、の4パターンのいずれかの部分検出処理が選択される。
【0043】
図6は、部分検出処理の概要を示す図であり、上半身検出器、右半身検出器、及び左半身検出器は、それぞれ図6の点線で表示される矩形領域601、602、及び603内の人物の部分形状を検出する。部分検出処理部107では、人物存在領域抽出部104によって抽出された人物存在領域を入力とし、その入力画像201に対してリサイズ処理等のスケーリング処理を繰り返し行うことで、入力画像201をピラミッド画像に変換する。その後、全身検出処理部102と同様に、ピラミッド画像における各々のスケーリング画像から、所定サイズの画像ウィンドゥを所定間隔で抽出し、各々の画像ウィンドゥに対して、部分検出器選択部106から出力された部分検出器情報を用いることで、部分検出処理を行う。この部分検出処理は、画像ウィンドゥ内の人物の一部分らしさを示すスコア値に基づいて行われ、事前に設定した所定のスコア閾値F以上のスコア値が算出された画像ウィンドゥに対して、人物の一部分が含まれていると判定する処理である。部分検出処理部107は、最終的に、各々のスケーリング画像から人物の一部分が含まれると判定した画像ウィンドゥの二次元位置情報をスケーリング処理を行う前の入力画像201上に逆スケール変換したときの二次元位置情報を出力するとともに、その画像ウィンドゥのスコア値を出力する。
【0044】
部分検出モデルDB部108は、画像ウィンドゥ内から抽出された特徴量の値を入力とし、画像ウィンドゥ内に人物の一部分が含まれるか否かを判定するためのスコア値を出力するようなモデル情報が少なくとも1つ以上蓄積されているデータベースである。部分検出処理部107における画像ウィンドゥに対する部分検出処理は、これらのモデル情報に基づいて行われる。
【0045】
部分検出モデルDB部108におけるモデル情報は、事前に大量の検出対象サンプル(人物の一部分が含まれる画像)と非検出対象サンプル(人物の一部分が含まれない画像)から特徴量を抽出し、その特徴量空間上の各々のサンプル群の境界線を、SVM(Support Vector Machine)やブースティング法などの代表的な統計的学習手法を用いることで構築できる。その結果、画像ウィンドゥ内に人物の一部分が含まれる場合はスコア値が大きく、逆に画像ウィンドゥ内に人物の一部分が含まれない場合は、スコア値が小さくなるようなモデル情報が、部分検出モデルDB部108に蓄積される。
【0046】
人数カウント部109は、人物存在状況推定部105の推定結果に応じた人数カウントを行う。具体的には各パターンでの動作について下記に示す。
【0047】
(パターン1)の場合
入力画像201上において人物の全身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行った統合検出枠数を、検出された人数としてカウントする。
【0048】
(パターン2)の場合
入力画像201上において人物の上半身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行った統合検出枠数を、検出された人数としてカウントする。図7は、統合検出枠群702の作成の一例を示す図である。図7に示すように、各々の検出候補枠群701同士のスコア差がある所定のスコア閾値G以内であり、かつ中心位置の距離が所定の距離閾値H以下のものを同一グループと判定し、同一グループ内の検出候補枠の平均位置と平均サイズを算出することで、検出枠候補を統合し、統合検出枠群702を作成することができる。
【0049】
(パターン3)の場合
入力画像201上において人物の半身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行った統合検出枠に対し、さらに右半身、左半身各々の検出器による統合検出枠同士をさらに統合した結果を人数としてカウントする。
【0050】
図8は、パターン3における統合検出枠の作成処理の一例を示す図である。図8に示すように、各々の検出候補枠群801、802、803同士のスコア差がある所定のスコア閾値G以内であり、かつ中心位置の距離が所定の距離閾値H以下のものを同一グループと判定し、同一グループ内の検出候補枠の平均位置と平均サイズを算出することで検出枠候補を統合し、統合検出枠804、805、806を作成する。その後、可能な場合は、異なる部分検出器の検出候補枠同士を統合する。例えば、人物809の左半身統合検出枠804の中心位置と、人物809の右半身統合検出枠805の中心位置間の距離が所定の距離閾値I以下であり、かつ左半身統合検出枠804の中心位置のX座標よりも、右半身統合検出枠805の中心位置のX座標が大きいとき、左半身統合検出枠804と右半身統合検出枠805は、同一人物の左半身、右半身に対する検出結果であるとみなし、各々の統合検出枠804、805の和集合領域807を、人物809に対する最終的な1つの統合検出枠とする。また、人物810の右半身統合検出枠806に関しては、右半身統合検出枠806の中心位置から所定の距離閾値I以内で、かつ右半身統合検出枠806の中心位置のX座標よりも小さい領域に、左半身検出器の検出候補枠が存在しないため、人物810の体の左部分にオクルージョン等が生じていると推定し、右半身統合検出枠806を人物810に対する最終的な1つの統合検出枠808とする。
【0051】
(パターン4)の場合
入力画像201上において人物の上半身、及び半身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行ったあと統合検出枠に対し、さらに上半身、右半身、左半身各々の検出器による統合検出枠同士をさらに統合した結果を人数としてカウントする。なお、和集合領域は図3と同様の方法で作成でき、また、パターン505において上半身検出器を同時に用いる際も同様の方法で処理することができる。
【0052】
人数カウント部109における異なる部分検出器の統合検出枠同士の統合処理は、例えば、上半身検出器の矩形領域601(図6参照)の統合検出枠901が図9に示す位置にあるとき、左半身検出器の矩形領域603の統合検出枠の中心位置が点線矩形902内に、または、右半身検出器の矩形領域602の統合検出枠の中心位置が点線矩形903内にある場合のみ統合処理を行えばよい。これは、基準となる統合検出枠が上半身検出器の矩形領域601でない場合でも同様に定義すればよい。
【0053】
表示部110では、人数カウント部109から出力された人数カウント数をユーザに表示する。
【0054】
次に、本実施の形態の人数カウント装置1の動作を説明する。
図10は、本実施の形態の人数カウント装置1の動作を説明するためのフローチャートである。図10において、まず監視カメラ等から撮影された画像情報の入出力を画像入力部101で行う(ステップS1)。
【0055】
次いで、全身検出モデルDB部103が、画像ウィンドゥ内から抽出された特徴量の値を入力とし、画像ウィンドゥ内に全身が含まれるか否かを判定するためのスコア値を出力するような全身検出モデル情報を全身検出処理部102に出力する(ステップS2)。
【0056】
次いで、全身検出処理部102が、画像入力部101から入力される画像に対して、リサイズ処理等のスケーリング処理を繰り返し行うことで、入力画像をピラミッド画像に変換した後、ピラミッド画像を構成する各々のスケーリング画像から、所定サイズの画像ウィンドゥを所定間隔で抽出し、各々の画像ウィンドゥに対して全身検出処理を行う(ステップS3)。この全身検出処理は、画像ウィンドゥ内の人物の全身らしさを示すスコア値に基づいて行われ、事前に設定した所定のスコア閾値A以上のスコア値が算出された画像ウィンドゥに対して、人物の全身が含まれていると判定する。そして、全身検出処理部102は、最終的に、各々のスケーリング画像から全身が含まれると判定された画像ウィンドゥの二次元位置情報をスケーリング処理を行う前の入力画像上に逆スケール変換したときの二次元位置情報を出力するとともに、その画像ウィンドゥのスコア値を出力する。
【0057】
次いで、人物存在領域抽出部104が、全身検出処理部102の出力結果である複数の全身検出候補枠の中から、中心位置同士の距離が所定の距離閾値B以内の全身検出候補枠同士を1つの同一グループに分類し、各グループごとに全身検出候補枠の和集合領域である人物存在領域を設定する(ステップS4)。
【0058】
次いで、人物存在状況推定部105が、人物存在領域抽出部104から出力された人物存在領域の縦横各々のサイズ情報による閾値判定結果に基づいて、人物存在領域内における人物の存在状況を、(パターン1)人物が1人存在する、(パターン2)人物が縦方向に並んでいる、(パターン3)人物が横方向に並んでいる、(パターン4)その他、の4パターンのいずれかに推定する(ステップS5)。
【0059】
次いで、部分検出器選択部106が、人物存在状況推定部105で推定された4つのパターンに応じて、以降の処理で用いる部分検出処理を選択する(ステップS6)。
【0060】
次いで、部分検出モデルDB部108が、部分検出器選択部106によって選択され、画像ウィンドゥ内から抽出された特徴量の値を入力とし、画像ウィンドゥ内に人物の一部分が含まれるか否かを判定するためのスコア値を出力するような部分検出モデル情報を部分検出処理部107に出力する(ステップS7)。
【0061】
次いで、部分検出処理部107が、人物存在領域抽出部104によって抽出された人物存在領域を入力とし、その入力画像に対してリサイズ処理等のスケーリング処理を繰り返し行うことで、入力画像をピラミッド画像に変換する。その後、全身検出処理部102と同様に、ピラミッド画像における各々のスケーリング画像から、所定サイズの画像ウィンドゥを所定間隔で抽出し、各々の画像ウィンドゥに対して、部分検出器選択部106から出力された部分検出器情報を用いることで、部分検出処理を行う(ステップS8)。この部分検出処理は、画像ウィンドゥ内の人物の一部分らしさを示すスコア値に基づいて行われ、事前に設定した所定のスコア閾値F以上のスコア値が算出された画像ウィンドゥに対して、人物の一部分が含まれていると判定する。そして、部分検出処理部107は、最終的に、各々のスケーリング画像から人物の一部分が含まれると判定された画像ウィンドゥの二次元位置情報をスケーリング処理を行う前の入力画像上に逆スケール変換したときの二次元位置情報を出力するとともに、その画像ウィンドゥのスコア値を出力する。
【0062】
次いで、人数カウント部109が、部分検出器選択部106によって選択された4つのパターンに従い、検出された人数をカウントする(ステップS9)。例えば、(1)人物が1人存在する場合は、人物の全身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行った統合検出枠数を検出された人数としてカウントする。また、(2)人物が縦方向に並んでいる場合は、人物の上半身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行った統合検出枠数を検出された人数としてカウントする。また、(3)人物が横方向に並んでいる場合は、人物の半身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行った統合検出枠に対し、さらに右半身、左半身各々の検出器による統合検出枠同士をさらに統合した結果を人数としてカウントする。また、(4)その他の場合は、人物の上半身、及び半身が含まれると判定された複数の画像ウィンドゥの二次元位置情報と、その各々の画像ウィンドゥのスコア値を用いて、検出枠候補の統合処理を行った統合検出枠に対し、さらに上半身、右半身、左半身各々の検出器による統合検出枠同士をさらに統合した結果を人数としてカウントする。
【0063】
次いで、表示部110が、人数カウント部109から出力された人数カウント数をユーザに表示する(ステップS10)。
【0064】
このように本実施の形態の人数カウント装置1によれば、全身検出処理部102、人物存在領域抽出部104、人物存在状況推定部105及び部分検出器選択部106を有するので、人物の存在領域を抽出後、その存在領域の形状から人物の存在状況を推定することができ、さらにその推定結果から、近接した人物同士やオクルージョンのある人物同士を人数カウントするために最適な部分検出処理を人物存在領域に対して行える。これにより、部分検出器を入力画像全体に用いる従来手法よりも、高速、かつ誤検出のより少ない高精度な人数カウント処理を行うことができる。
【0065】
なお、全身検出処理部102、及び部分検出処理部107で抽出される特徴量は、人物の全身検出、及び人物の一部分の部分検出用途で一般的に用いられているHOG特徴量や、Edgelet特徴量など、限定されたものではない。
【0066】
また、人物存在領域抽出部104における人物存在領域303は、図3に示すような和集合領域の算出による設定以外にも、例えば、ノイズ矩形(中心位置同士の距離が所定の距離閾値B以内ではあるが、明らかに和集合領域の設定に悪影響を与えるようなはずれた位置にある矩形)対策の1つの例として、中心位置同士の距離が所定の距離閾値B以内にある全ての全身検出候補枠204の平均中心位置、平均サイズを算出した結果を人物存在領域303とするような方法を用いてもよい。
【0067】
また、人物存在状況推定部105における参照画像ウィンドゥ群401のサイズ設定は、監視カメラ等のキャリブレーションによって自動設定してもよいし、ユーザが実際に撮影された画像を見ながら、手動で設定してもよい。
【0068】
また、全身検出処理部102、及び部分検出処理部107では、人物存在状況推定部105において設定された参照画像ウィンドゥ群401のサイズ情報を用いることで、入力画像上の任意の位置で検出されうる人物の全身、上半身、半身の入力画像上での大きさが推定できるため、入力画像をピラミッド画像に変換する際のスケーリングパラメータ(スケーリング回数、スケーリングステップ)を最適化してもよい。
【0069】
また、全身検出モデルDB部103内には、例えば、前向き、後ろ向き、右向き、左向き、斜め前右向き、斜め前左向き、斜め後ろ右向き、斜め後ろ左向きなどの方向別、あるいは、帽子やヘルメット等の被り物、スカートなどの着衣、鞄等の持ち物といった、人物の様々な属性情報別に全身を検出するような複数のモデル情報を蓄積しておいてもよく、部分検出モデルDB部108内に対しても同様である。
【0070】
また、人数カウント部109における検出候補枠群701、801、802、803の統合処理は、スコア閾値を用いた閾値判定を考慮せず、検出候補枠群701、801、802、803の各々の中心位置の距離閾値Gを用いた閾値判定のみを考慮した統合処理方式を用いてもよい。
【0071】
さらに、人数カウント部109における検出候補枠群701、801、802、803の統合処理は、各々の検出候補枠群701、801、802、803内に人物の上半身、及び半身が含まれているらしさを示すスコア値に加え、ステレオカメラ等を用いて計測した入力画像上の奥行き情報を用いて、各々の検出候補枠群701、801、802、803内のに立体物が含まれているらしさを算出した立体物スコア値や、過去の入力画像における最終的な統合検出枠のテンプレート位置に対して、テンプレートマッチング等を用いた追跡技術を適用し、現在の入力画像における各々の検出候補枠群701、801、802、803と、過去のフレームからの追跡結果とのマッチング程度を示す追跡スコア値などを加算することで、検出候補枠群の統合処理であるグルーピング精度を高める手法を用いてもよい。
【0072】
また、人数カウント部109における異なる部分検出器の統合検出枠同士の統合処理に関して、例えば図9のように基準となる上半身検出器の矩形領域601の統合検出枠901が図9の位置にあるとき、点線矩形902、903の位置はユーザが事前に手動で設定してもよいし、大量の検出対象サンプル(人物の全身が含まれる画像)から統計的に設定してもよい。
【0073】
また、人数カウント部109における異なる部分検出器の統合検出枠同士の統合処理に関しては、非特許文献2にあるような各々の部分検出器の出力結果を、最大事後確率推定を行うことで1つに統合する方法などを用いてもよい。
【産業上の利用可能性】
【0074】
本発明は、入力画像上に複数の人物が近接している、または、複数の人物によりオクルージョンが生じている場合にも、より高精度、高速に人物検出することができるといった効果を有し、監視カメラシステムへの適用が可能である。
【符号の説明】
【0075】
1 人数カウント装置
101 画像入力部
102 全身検出処理部
103 全身検出モデルデータベース部
104 人物存在領域抽出部
105 人物存在状況推定部
106 部分検出器選択部
107 部分検出処理部
108 部分検出モデルデータベース部
109 人数カウント部
110 表示部
201 入力画像
202 ピラミッド画像
203 画像ウィンドゥ
204 全身検出候補枠
205、303、402 人物存在領域
301、302 全身検出候補枠
401 参照画像ウィンドゥ群
403 中心位置
404、501 矩形
601 上半身検出器の矩形領域
602 右半身検出器の矩形領域
603 左半身検出器の矩形領域
701、801〜803 検出候補枠群
702、804〜806 統合検出枠
807 和集合領域
809 人物
901 統合検出枠
902、903 点線矩形

【特許請求の範囲】
【請求項1】
入力画像に対して、人物検出を行い人物の存在する領域を抽出する人物存在領域抽出手段と、
前記人物存在領域抽出手段の抽出結果から人物の存在状況を推定する人物存在状況推定手段と、
前記人物存在状況推定手段の推定結果に基づき、人数計測に用いる部分検出器の種類を選択し部分検出器情報を出力する部分検出器選択手段と、
前記部分検出器選択手段から出力された部分検出器情報に基づく部分検出処理を用いて人物の一部分を検出する部分検出処理を行う部分検出処理手段と、
前記部分検出処理手段の部分検出処理結果から前記入力画像内の人物の数を求める人数カウント手段と、
を備えた人数カウント装置。
【請求項2】
前記人物存在領域抽出手段は、抽出結果として矩形情報を出力し、
前記人物存在状況推定手段は、前記人物存在領域抽出手段の抽出した矩形情報の縦横比または縦と横の長さに応じて人物存在状況を推定する請求項1に記載の人数カウント装置。
【請求項3】
前記部分検出器選択手段は、前記人物存在状況推定手段の推定結果が人物が重なっていると判断した場合には部分検出を行う種類の前記部分検出器を選択する請求項2に記載の人数カウント装置。
【請求項4】
前記部分検出器選択手段は、前記部分検出器として、上半身検出器、下半身検出器、右半身検出器、左半身検出器のうち、少なくとも一つを選択する請求項3に記載の人数カウント装置。
【請求項5】
前記人物存在状況推定手段は、前記人物存在領域抽出手段の抽出した前記矩形情報が人物のサイズに比べて横方向には長くなく縦方向に長い場合は人物が縦方向に重なっていると判断し、
前記部分検出器選択手段は、前記人物存在状況推定手段が人物が縦方向に重なっていると判断した場合には、前記上半身検出器を選択する請求項4に記載の人数カウント装置。
【請求項6】
前記人物存在状況推定手段は、前記矩形情報が人物のサイズに比べて横方向に長く縦方向に長くない場合は人物が横方向に重なっていると判断し、
前記部分検出器選択手段は、前記人物存在状況推定手段が人物が横方向に重なっていると判断した場合には、前記右半身検出器及び前記左半身検出器を選択する請求項4または請求項5に記載の人数カウント装置。
【請求項7】
前記人物存在状況推定手段は、前記矩形情報が人物のサイズに比べて横方向にも縦方向にも長い場合は人物が広範囲に重なっていると判断し、
前記部分検出器選択手段は、前記人物存在状況推定手段が人物が広範囲に重なっていると判断した場合には、前記上半身検出器、前記下半身検出器、前記右半身検出器及び前記左半身検出器を選択する請求項4ないし請求項6のいずれか一項に記載の人数カウント装置。
【請求項8】
入力画像に対して、人物検出を行い人物の存在する領域を抽出するステップと、
人物の存在する領域を抽出した結果から人物の存在状況を推定するステップと、
人物の存在状況を推定した結果に基づき、人数計測に用いる部分検出器の種類を選択し部分検出器情報を出力するステップと、
選択された部分検出器の部分検出器情報に基づく部分検出処理を用いて人物の一部分を検出する部分検出処理を行うステップと、
検出処理結果から前記入力画像内の人物の数を求めるステップと、
を備えた人数カウント方法。
【請求項9】
請求項8に記載の人数カウント方法の各ステップをコンピュータに実行させるための人数カウントプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2012−108785(P2012−108785A)
【公開日】平成24年6月7日(2012.6.7)
【国際特許分類】
【出願番号】特願2010−258037(P2010−258037)
【出願日】平成22年11月18日(2010.11.18)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】