画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体
【課題】 背景差分と色検出の統合により、画像中における複数の領域を正確に識別することができる画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供する。
【解決手段】 まず、カメラ3により背景領域1のみが撮像された背景画像データが得られる。そして、構造化データ記憶部13に、背景画像データの画素の座標と画素の色階調値とが識別空間内に構造化されて記憶され、背景色領域が形成される。続いて、カメラ3により背景領域1および対象領域2が撮像された入力画像データが得られる。そして、クラス識別部14において、各画素の色階調値と背景色領域との識別空間内における距離が計算される。その計算された距離に基づき、クラス識別部14において、各画素の色階調値が、背景色領域とそれ以外の背景外色領域のいずれに属するかが識別される。
【解決手段】 まず、カメラ3により背景領域1のみが撮像された背景画像データが得られる。そして、構造化データ記憶部13に、背景画像データの画素の座標と画素の色階調値とが識別空間内に構造化されて記憶され、背景色領域が形成される。続いて、カメラ3により背景領域1および対象領域2が撮像された入力画像データが得られる。そして、クラス識別部14において、各画素の色階調値と背景色領域との識別空間内における距離が計算される。その計算された距離に基づき、クラス識別部14において、各画素の色階調値が、背景色領域とそれ以外の背景外色領域のいずれに属するかが識別される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像中に含まれる複数の領域を識別する画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体に関するものである。
【背景技術】
【0002】
観測画像中から移動物体などの対象(ターゲット)を検出する問題は、コンピュータビジョンの中でも重要な課題の一つとして挙げられる。その解決のために開発された方法の中でも、画像中の特定の色を検出する色検出と、あらかじめ用意した背景画像から変化した領域を検出する背景差分は、ターゲット検出の基本的な技術として用いられている。
【0003】
色検出は、ターゲット色ごとに適切な閾値を設定できるので、微妙な色の違いを識別することが可能である。
【0004】
また、背景差分は、ターゲットに関する事前知識を必要とせず、任意のターゲットを検出可能であり、かつ画素ごとに背景色の変化をモデル化可能な方法である。このような利点を有するため、背景差分は、静止領域の検出が不可能なフレーム間差分や、事前に定義されたターゲットしか検出できない顔検出・肌色検出と比較して、多くの視覚システムで利用されている。特に、十分な背景情報を事前に学習可能な環境下であれば、優れた結果を期待することができる。
【0005】
さらに最近は、背景変動に対してロバスト(頑健)であり、かつ背景と任意のターゲットの微妙な色の差を検出可能とするために、これら背景差分と最近傍識別による色検出を有機的に統合することも行われている(例えば、非特許文献1参照)。
【0006】
この非特許文献1に開示された方法においては、図12に示したように、画素の色(色階調値)が6次元のYUV色空間(識別空間)で表現される。具体的には、背景領域を撮像した背景画像データの座標(xp,yp)における画素の3次元色が(Ybp,Ubp,Vbp)であるとき、その背景色は、識別空間において(Ybp,Ubp,Vbp,Ybp,Ubp,Vbp)Tという6次元ベクトルで表現される(Tは、ベクトルの転置を表す。)。同様に、背景画像データの座標(xq,yq)における画素の3次元色が(Ybq,Ubq,Vbq)であるとき、その背景色は、識別空間において(Ybq,Ubq,Vbq,Ybq,Ubq,Vbq)Tという6次元ベクトルで表現される。このように識別空間における6次元ベクトルで表された背景画像データ(背景色ベクトル)は、背景色領域を形成する。
【0007】
また、背景領域および対象領域を撮像した入力画像データの座標(xs,ys)における画素の3次元色が(Yis,Uis,Vis)であるとき、その入力された色は、識別空間において(Ybs,Ubs,Vbs,Yis,Uis,Vis)Tという6次元ベクトルで表現される。このようにして得られた6次元ベクトルに対して、6次元空間における最近傍識別を用いることで、入力された色が背景色領域または対象色(ターゲット色)領域に識別される。対象色領域に識別された6次元ベクトル(Ybs,Ubs,Vbs,Yis,Uis,Vis)Tは対象色ベクトルと呼ばれ、背景色領域と対象色領域との境界は決定境界と呼ばれる。
【0008】
この方法では、通常(3次元)に比べて次元数が大きいため、処理時間はかかるが、最近傍識別のためのキャッシュの効率的利用により実時間動作が可能となっている。
【非特許文献1】加藤丈和、柴田智行、和田俊和:「最近傍識別器を用いた背景差分と色検出の統合」、情処研報 CVIM-142-5, Vol. 145, no. 5, pp. 31-36, Jan. 2004.
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、背景差分は、照明変化(照明強度や照明色の変化)や影による背景物体の見えの変化、または、背景内に、例えば葉や旗の揺らぎなどの非静止領域がある場合には、背景とターゲットを正確に識別することができない。さらに、背景差分には、背景に似た色を有するターゲットの検出が困難であるという課題がある。
【0010】
また、色検出は、背景画像の全画素に含まれる色集合と各ターゲット色の間の識別を行う方法であるため、膨大な種類の色集合を扱う識別問題となる。そのため、必然的に異なるクラス間の距離は小さくなり、識別性能が低下する(位置情報の欠落)。さらに、ターゲット色は人手により与えられているので、自律動作するターゲット検出システムにはそのまま適用することができない(非自律性)という課題を有する。
【0011】
背景差分と色検出を統合した非特許文献1に開示された方法においては、参照する背景画像が1枚だけなので、照明変化に対応できないという課題がある。例え、様々な照明条件下における背景画像集合を記録していたとしても、現状の方法では、逐次参照する背景画像を選択する基準がない。また、背景情報は独立なYUV値として表現されているため、位置情報が欠落している。すなわち、近接画素間の共起性などは全く考慮されていない。さらに、適切なターゲット色を指定するために人手を要しているという課題もある。
【0012】
本発明は、上記課題に鑑みてなされたものであり、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0013】
請求項1記載の発明は、画像処理装置であって、所定の領域を撮像し、画像データに変換する撮像手段と、前記撮像手段により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶手段と、前記撮像手段により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別手段と、前記クラス識別手段により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶手段と、を備えることを特徴とする。
【0014】
この構成によれば、まず、撮像手段により背景領域のみが撮像された背景画像データが得られる。そして、背景色記憶手段により、背景画像データの画素の座標と前記画素の色階調値とが識別空間内に構造化されて記憶される。この識別空間内における背景画像データの集合は、背景色領域と呼ばれる。続いて、撮像手段により背景領域および対象領域が撮像された入力画像データが得られる。そして、入力画像データの各画素の色階調値と背景色領域との識別空間内における距離が計算される。その計算された距離に基づき、クラス識別手段により、入力画像データの各画素の色階調値が、背景色領域とそれ以外の背景外色領域のいずれに属するかが識別される。このクラス識別手段により各画素の色階調値が背景外色領域に属すると判断された場合には、対象色記憶手段により、各画素の色階調値と各画素の座標とが識別空間内に構造化して記憶される。
【0015】
請求項2記載の発明は、請求項1記載の画像処理装置であって、画像データの色階調値はYUV方式で表されていることを特徴とする。
【0016】
この構成によれば、輝度信号であるYと、色信号であるUおよびVで画像データの色を表現する。
【0017】
請求項3記載の発明は、請求項1記載の画像処理装置であって、画像データの色階調値はRGB方式で表されていることを特徴とする。
【0018】
この構成によれば、光の三原色であるR(赤)、G(緑)およびB(青)で画像データの色を表現する。
【0019】
請求項4記載の発明は、請求項1記載の画像処理装置であって、グレースケールで表されていることを特徴とする。
【0020】
この構成によれば、明度差に基づいたグレースケールで画像データの色を表現する。
【0021】
請求項5記載の発明は、請求項1乃至4のいずれかに記載の画像処理装置であって、クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、最近傍識別を用いることを特徴とする。
【0022】
この構成によれば、識別空間において、背景領域と背景外領域のいずれが、各画素の色階調値から最も近い点を有するのかが、最近傍識別により判断される。
【0023】
請求項6記載の発明は、請求項1乃至5のいずれかに記載の画像処理装置であって、クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、ハッシュ表を用いることを特徴とする。
【0024】
この構成によれば、キーとなるオブジェクトから対応するオブジェクトへの直接的なアクセスが可能となる。
【0025】
請求項7記載の発明は、請求項1乃至6のいずれかに記載の画像処理装置であって、クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合、前記各画素の色階調値と前記背景色領域の識別空間内における距離が所定の閾値より大きいときに、前記各画素の色階調値が前記背景外色領域に含まれると判断し、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶することを特徴とする。
【0026】
この構成によれば、クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合であっても、各画素の色階調値と背景色領域の識別空間内における距離が所定の閾値より大きいときには、背景外色領域に含まれると判断し直される。
【0027】
請求項8記載の発明は、請求項1乃至7のいずれかに記載の画像処理装置であって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、近接する複数の画素の色階調値をまとめて一つの画素の座標に記憶することを特徴とする。
【0028】
この構成によれば、識別空間において、近接する複数の画素の色階調値をまとめて一つの画素の座標に構造化して記憶するので、画素の座標に関する情報をほとんど減らすことなく、1箇所に集約する。
【0029】
請求項9記載の発明は、請求項1乃至8のいずれかに記載の画像処理装置であって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、色階調値に所定の値を掛けて記憶することを特徴とする。
【0030】
この構成によれば、色階調に関する情報をほとんど減らすことなく、各画素の色階調値が圧縮される。
【0031】
請求項10記載の発明は、請求項1乃至9のいずれかに記載の画像処理装置であって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、画素の座標を指定する座標軸に所定の重みを掛けて得られた画素の座標を用い、該画素の座標と前記各画素の色階調値とを識別空間内に構造化して記憶することを特徴とする。
【0032】
この構成によれば、画素の座標を指定する座標軸に所定の重みを掛けて、空間座標における距離を変更する。これにより、識別空間における、空間座標と色階調空間の距離の関係が修正される。
【0033】
請求項11記載の発明は、画像処理方法であって、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、を含むことを特徴とする。
【0034】
請求項12記載の発明は、記録媒体であって、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能であることを特徴とする。
【0035】
請求項13記載の発明は、プログラムであって、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、をコンピュータに実行させることを特徴とする。
【発明の効果】
【0036】
請求項1記載の発明によれば、複数枚の背景画像データを利用することができ、かつ画像データにおける画素の座標と画素の色階調値とが識別空間内に構造化して記憶されている。そのため、色情報だけでなく、位置情報も取り込まれている。その結果、定常的な背景変動だけでなく急激かつ大きな照明変化に対しても対応でき、かつ背景色とターゲット色との小さな差分の検出も可能である。
【0037】
請求項2記載の発明によれば、輝度信号(Y)により多くのデータ量を割り当てることで、少ない画質の劣化で高いデータ圧縮率を得ることができる。
【0038】
請求項3記載の発明によれば、RGB方式はスキャナ、モニタ、デジタルカメラ、カラーテレビなどに使用されているので、汎用性が高い。また、例えば、フルカラーであれば、RGBをそれぞれ256階調に分けて色を表現するので、1677万7216色の色調表現が可能である。
【0039】
請求項4記載の発明によれば、画像を白から黒までの明暗だけで表現するため、カラー画像に比べて色を指定するための情報量が少なくて済む。その結果、色を識別する処理が高速に行える。
【0040】
請求項5記載の発明によれば、識別問題で典型的に用いられている最近傍識別により識別を行うので、これまでに開発された効率的なアルゴリズムなどを有効に活用することができる。
【0041】
請求項6記載の発明によれば、データ量が大きくなっても、キーとなるオブジェクトから対応するオブジェクトへ高速にアクセスできるため、高速な処理が可能となる。
【0042】
請求項7記載の発明によれば、閾値を変えることにより、識別の基準を制御することができる。そのため、背景領域の変動などがあった場合にも、閾値を調整することで、容易に最適な識別を行うことができる。
【0043】
請求項8記載の発明によれば、画素の座標に関する情報をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。
【0044】
請求項9記載の発明によれば、色階調に関する情報をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。
【0045】
請求項10記載の発明によれば、画像座標xyと色階調YUVという異なる情報量による各軸間の距離に重みを与えて調整しているので、適切な識別が行われる。
【0046】
請求項11記載の発明によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法を提供することができる。
【0047】
請求項12記載の発明によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法に関する、コンピュータが読み取り可能なプログラムが記録されていることを特徴とする記録媒体を提供することができる。
【0048】
請求項13記載の発明によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法に関するプログラムを提供することができる。
【発明を実施するための最良の形態】
【0049】
以下、本発明の一実施形態について、図面を参照しながら説明する。
【0050】
[本実施形態の概略]
本発明は背景差分を基本とした方法であり、ターゲット検出時に起こりうる背景変動はすべて事前に撮影された背景画像中の色分布そのものによって表現される。したがって、ターゲット検出性能を上げるためには、起こりうる背景変動を可能な限りもれなく観測・収集しておく必要がある。しかし、すべての移動対象物の写り込みや雲の移動による細かな影の変化なども含めた背景の見えのパターンは膨大であり、それらすべてを事前に観測することは不可能である。
【0051】
したがって、背景情報のみに基づくターゲット検出時は、背景情報が不完全であることを考慮して、確実に背景外領域と見なせる領域を検出する。また、背景色とターゲット色を考慮したターゲット検出時は、ターゲット色学習後に、背景色とターゲット色が似通っていても、最近傍識別によって双方の等方的な誤差・変動に対してロバストな識別を行うことを可能とする。
【0052】
[背景色領域形成]
図1は、本発明に係る画像処理装置の一実施形態における機能ブロック図である。所定の位置に固定されたカメラ3は、矩形の点線で示された背景領域1、または背景領域1および対象領域2からなる領域を撮像する。このカメラ3は、制御部4に接続され、制御部4によって制御されるとともに、撮像した画像データなどを制御部4に出力する。また、制御部4にはドライブ5が接続されており、制御部4から出力された画像データなどを記録媒体に記録する。
【0053】
背景領域1および対象領域2は、本発明を高度道路交通システム(ITS:Intelligent Transport System)に適用する場合には、例えば、高速道路を含めた所定の領域が背景領域1であり、その道路を走行している車が対象領域2に対応する。また、本発明を監視システムに適用する場合には、例えば、住居の入り口やエレベータホールなどが背景領域1であり、その背景領域1内を通過する人物が対象領域2に対応する。
【0054】
カメラ3は、静止画撮影の場合には、例えばデジタルスチルカメラであり、動画撮影の場合には、例えばデジタルビデオカメラである。また、カメラ3は、CCD(Charge Coupled Devices)を撮像素子として備えるものである。カメラ3は、制御部4の指示に従って画像を撮像し、画素値I(x,y)からなる画像データを制御部4に出力する。本実施形態においては、この画素値I(x,y)は、カラーデータであり、画像データの色階調値はYUV方式で表されているとする。YUV方式は、輝度信号であるYと、色信号であるUおよびVとで画像データの色を表現するものである。このようにYUV方式では輝度と色の信号を分けているため、輝度信号(Y)により多くのデータ量を割り当てることで、少ない画質の劣化で高いデータ圧縮率を得ることができる。また、このYUV値(色階調値)は、光の三原色であるR(赤)、G(緑)およびB(青)で画像データの色を表現するRGB方式におけるRGB値や、それ以外の色表現形式に容易に変換することができる。
【0055】
また、本実施形態においては、CCDは単板式であり、各画素にYUV値が与えられているとして説明するが、カメラ3のCCDは、3板式であっても、単板式であっても構わない。3板式は、撮像された画像データの色を、例えばR、G、Bの三原色に分けて、それぞれにCCDを割り当てる方式である。それに対して、単板式は、RGBなどの色をまとめて、それに1つのCCDを割り当てる方式である。
【0056】
制御部4は、カメラ3で撮像された画像データを取り込み、その画像データに基づいて所定の処理を施す機能部である。また、制御部4は、ドライブ5に対して画像データなどのデータを出力する。さらに、制御部4は、ドライブ5を介して、種々の画像データやプログラムなどが記録された記録媒体から必要な情報をインストールし、その機能を実行することができる。
【0057】
この制御部4は、主制御部10、背景画像データ記憶部11、入力画像データ記憶部12、構造化データ記憶部13、クラス識別部14、閾値比較部15および周辺機器制御部16を備える。
【0058】
主制御部10は、背景画像データ記憶部11、入力画像データ記憶部12、構造化データ記憶部13、クラス識別部14、閾値比較部15および周辺機器制御部16に接続され、これらの処理を制御するものである。
【0059】
背景画像データ記憶部11は、カメラ3で撮像された背景領域1のみの画像データ(背景画像データ)を記憶する機能部である。この背景画像データ記憶部11においては、画素の座標(x,y)に対応して、YUV値が記憶されている。
【0060】
入力画像データ記憶部12は、カメラ3で撮像された背景領域1および対象領域2からなる画像データを記憶する機能部である。この入力画像データ記憶部12においても、背景画像データ記憶部11と同様、画素の座標(x,y)に対応して、YUV値が記憶されている。
【0061】
構造化データ記憶部13は、画素の座標(x,y)に対応して、背景画像データのYUV値を記憶する。ただし、背景画像データ記憶部11とは異なり、画素の座標一つに対応して背景画像データ枚数分のYUV値を構造化して記憶する。さらに、構造化データ記憶部13は、入力画像データの各画素において、対象色領域に含まれると判断された画素の座標(x,y)とYUV値とを構造化して記憶する。この画素の座標に対応してYUV値が構造化されている色空間を、以後、識別空間と呼ぶ。また、構造化データ記憶部13は、背景色記憶手段および対象色記憶手段として機能する。
【0062】
クラス識別部14は、入力画像データ記憶部12に記憶された入力画像データの各画素のYUV値が、識別空間において背景色領域と対象色領域のいずれに属するかを判別する機能部である。そして、YUV値が対象色領域に属すると判別された場合に、クラス識別部14は、そのYUV値を構造化データ記憶部13に記憶させる。また、同時に、クラス識別部14は、識別空間において各画素のYUV値と背景色領域の最近傍点までの距離とを求める。また、クラス識別部14は、クラス識別手段として機能する。
【0063】
閾値比較部15は、クラス識別部14で求められた、各画素のYUV値と背景色領域の最近傍点までの距離と閾値Thbとを比較する機能部である。
【0064】
周辺機器制御部16は、例えば静止画撮影の場合に、カメラ3に撮像信号を送出し、画像を撮像させるなど、カメラ3を制御する機能を有する。また、周辺機器制御部16は、画像データやプログラムをドライブ5に出力し記録媒体に記録させ、逆に記録媒体に記録された画像データやプログラムをドライブ5を介して入力するなど、ドライブ5を制御する機能を有する。
【0065】
ドライブ5は、制御部4から出力された画像データなどのデータを受け取り、そのデータを種々の記録媒体に出力する。また、ドライブ5は、記録媒体に記録された種々の画像データやプログラムなどを制御部4に出力する。この記録媒体は、磁気ディスク(フロッピー(登録商標)ディスクを含む)21、光ディスク(CD:Compact Disk、DVD:Digital Versatile Diskを含む)22、光磁気ディスク(MD:Mini-Diskを含む)23または半導体メモリ24などにより構成される。
【0066】
図2は、本発明に係る画像処理装置の一実施形態における処理の流れを示すフローチャートである。以下、この図1および図2を参照しながら、本発明に係る画像処理装置の一実施形態における機能および処理の流れを説明する。
【0067】
まず、背景画像データに基づいて、背景色領域形成を行う処理(図2のS10およびS11)について説明する。
【0068】
最初に、照明条件などを変化させながら、背景領域1のみがカメラ3で複数枚撮像される(S10)。得られた背景画像データは、制御部4内の背景画像データ記憶部11に出力され、そこに記憶される。このとき、背景画像データ記憶部11においては、背景画像データの各画素の座標(x,y)に対応して、YUV値が記憶されている。また、背景画像データは複数枚撮像されているので、同じ画素の座標に複数個のYUV値が存在している。これを表現するために、本実施形態においては、xy−YUV5次元空間(識別空間)を考え、その空間内にYUV値を記憶させる(S11)。
【0069】
図3は、本発明の一実施形態における識別空間を表す模式図である。この図は、複数枚の背景画像データおよび入力画像データにおける、画素の座標とYUV値とをどのように識別空間に配置させるかを示している。例えば、背景画像データにおける座標が(xq,yq)である画素のYUV値が(Yq,Uq,Vq)のとき、このxy座標とYUV値とを合わせて5次元ベクトル(xq,yq,Yq,Uq,Vq)T(背景色ベクトル)が構成される。そして、この5次元ベクトル(xq,yq,Yq,Uq,Vq)Tが、識別空間において「背景」とラベル付けされる。このとき、模式的には、各(x,y)座標点にそれぞれYUV軸が備わっていると考えることができる。つまり、背景画像データの画素の座標(xq,yq)と画素のYUV値(色階調値)(Yq,Uq,Vq)とが識別空間内に構造化((xq,yq,Yq,Uq,Vq)T)され、背景色領域とラベル付けされることになる。この構造化された5次元ベクトルは、構造化データ記憶部13に記憶される。
【0070】
[対象領域検出]
前述した識別空間における背景色領域形成(背景学習)が終了すると、対象領域検出の準備が整ったことになる。対象領域中の色情報が未知の場合には、背景色情報のみから対象領域検出を行う。
【0071】
以下、入力画像データが、背景色領域と対象色領域とのいずれに属するかを判別する処理(図2のS20〜S26)について説明する。
【0072】
最初に、背景領域1と対象領域2とが重なった入力画像がカメラ3で撮像される(S20)。得られた入力画像データは、制御部4内の入力画像データ記憶部12に出力され、そこに記憶される。このとき、入力画像データ記憶部12においては、入力画像データの各画素の座標(x,y)に対応して、YUV値が記憶されている。
【0073】
続いて、入力画像データの画素(xq,yq)が選択され(S21)、その画素のxy−YUV値が識別空間に投影される(S22)。これは、クラス識別部14が、入力画像データ記憶部12から座標(xq,yq)の画素のYUV値を受け取り、さらに構造化データ記憶部13から同じ座標(xq,yq)の画素のすべてのYUV値を受け取り、これらを比較することに相当する。
【0074】
次に、クラス識別部14において、画素(xq,yq)のYUV値に対して、最近傍識別が行われる(S23)。本実施形態においては、簡単のため、識別すべきクラスは背景とターゲットの2つだけとする。したがって、最近傍識別の結果、入力画像データのYUV値は、背景かターゲットかのいずれかのクラスに分けられる。また、クラス識別部14において、最近接クラスが決定されると同時に、背景色領域に属する最近傍点までの距離が求められる。求められた最近傍点までの距離は、閾値比較部15に出力される。
【0075】
識別空間にターゲット色が全く記録されていない初期状態では、最近傍識別はすべてのxy−YUV値を背景として識別してしまう。そこで、通常の背景差分のように閾値Thb(定数)を導入し、最近傍点までの距離が閾値Thbより大きいxy−YUV値を背景外色領域(本実施形態においては対象色領域)として検出するように構成する。
【0076】
まず、図2の最近傍識別(S23)において、入力画像データの座標(xq,yq)の画素のYUV値が背景色領域に属すると識別された場合を説明する。まず、閾値比較部15において、クラス識別部14で求められた最近傍点までの距離と閾値Thbとが比較される(S24)。そして、最近傍点までの距離が閾値Thbより小さければ(S24でNO)、その入力画像データのYUV値は背景色領域に属すると識別され、入力画像データの次の画素の識別に移る(S21)。
【0077】
それに対して、閾値比較部15において、最近傍点までの距離が閾値Thbより大きいと判断されれば(S24でYES)、その入力画像データのYUV値は対象色領域に属すると識別される。また、このときの5次元ベクトル(xq,yq,Yq,Uq,Vq)Tを、対象色ベクトルと呼ぶ。そして、識別空間の全画素のxy座標において、そのYUV値が対象色領域として記憶され(S26)、入力画像データの次の画素の識別に移る(S21)。
【0078】
このようにして、順次、対象色ベクトルが記憶されていくと、背景色領域と対象色領域とを分けている決定境界の形状も、それに応じて変化していく。
【0079】
次に、図2の最近傍識別(S23)において、入力画像データの座標(xq,yq)の画素のYUV値が対象色領域に属すると識別された場合を説明する。まず、閾値比較部15において、クラス識別部14で求められた最近傍点までの距離と閾値Thbとが比較される(S25)。そして、最近傍点までの距離が閾値Thbより小さければ(S25でNO)、その入力画像データのYUV値は背景色領域にも近いことになるために、識別空間内に記憶させることはせず、入力画像データの次の画素の識別に移る(S21)。
【0080】
つまり、本実施形態においては、「確実に背景外領域である」と判断された領域のみを切り出し、その領域中の色をターゲット色として記録し、以降の識別処理に利用する。
【0081】
それに対して、閾値比較部15において、最近傍点までの距離が閾値Thbより大きいと判断されれば(S25でYES)、その入力画像データのYUV値は確実に対象色領域に属すると識別される。そして、識別空間の全画素の座標において、そのYUV値が対象色領域として記憶され、入力画像データの次の画素の識別に移る(S21)。
【0082】
以上の処理を繰り返していくことにより、背景領域の中から対象領域を識別することができる。
【0083】
以上説明したように本実施形態においては、入力画像データのYUV値が対象色領域に属すると識別されると、そのYUV値が識別空間に記憶される。そのため、この識別に不具合が生ずると、以降の最近傍識別による誤検出が増加してしまう。これを避けるためには、識別時の閾値Thbを十分に大きくすることが好ましい。
【0084】
この閾値Thbを十分に大きく取ってよい理由は以下の通りである。ある背景領域の色とそれに似た色の対象領域が重なったとき、閾値Thbが大きいと、その対象領域が全く検出されなくなってしまう。しかし、閾値Thbによる背景差分は、背景とターゲットの色が大きく異なる領域において確実に対象領域を検出し、その検出領域中の色をターゲット色として識別空間に記録するための処理であり、類似した背景・ターゲット色間の識別は最近傍識別によって行われる。したがって、閾値Thbは適当に十分大きな値でよい。
【0085】
また、本実施形態においては、閾値Thbを定数として説明したが、これは識別処理を高速化するためである。これにより、識別の実時間処理が可能となる。しかし、本発明はこれに限られることなく、背景領域の変動に応じた適切な閾値設定も可能である。
【0086】
上記の識別処理においては、例えば(xp,yp,Yp,Up,Vp)Tが背景外色領域として識別されると、この(Yp,Up,Vp)が他のxy座標で観測されてもターゲット色として識別されるように、全xy座標の(Yp,Up,Vp)をターゲット色にクラス分類する。しかし、他のxy座標(xq,yq)では、(xq,yq,Yp,Up,Vp)Tが背景色領域に分類されている可能性がある。このとき、(xq,yq,Yp,Up,Vp)Tのクラスをターゲットに変更してしまうと、座標(xq,yq)を頻繁に誤検出してしまう。そこで、以下のターゲット色登録処理によってこの問題を回避することも可能である。
【0087】
まず、ターゲット色として識別されたYUV値(Yi,Ui,Vi)を色成分に持つ全xy−YUV値{(xi,yi,Yi,Ui,Vi)T}(ただし、iは全画像座標を要素に持つ集合の要素)の最近傍識別を行う。
【0088】
次に、最近傍識別の結果、最近傍点までの距離が閾値Thtより大きい場合のみ背景色との重なりがないとみなし、そのxy−YUV値をターゲットにクラス分類する。
【0089】
ここで導入した閾値Thtは、識別空間における背景色領域が信頼できる場合は、0(ゼロ)でよい。つまり、YUV値が完全に一致した場合のみ、ターゲットにクラス分類するように構成してもよい。それは、本発明においては、背景領域の観測・学習はオフライン処理であるため、この処理の段階で識別空間における背景色領域の信頼性を十分に高めておくことが可能であるからである。
【0090】
[対象色領域の逐次更新]
ターゲット色が学習されると、閾値Thbによる閾値処理によってだけでなく、最近傍識別によってターゲットに識別されるxy−YUV値(xp,yp,Yp,Up,Vp)Tが現れる。図4(a)に、十分な背景学習が行われたため、識別空間における背景色領域は信頼できるが、ターゲット色学習が不十分な時点(時刻Tpとする)の、画素(xp,yp)における3次元YUV空間を示す。この時刻Tpにおいても、図4(a)のV1のように、最近傍識別によるターゲット色検出結果は信頼性が高い。したがって、画素(xp,yp)を対象領域として検出する。しかし、逆に、図4(a)のV2のように、最近傍識別により背景色と識別されたxy−YUV値が実際に背景に対応している可能性は必ずしも高くない。
【0091】
図4(a)の例では、ターゲット色学習が不十分な時刻Tpにおいて、少ないながらも学習済の対象色領域TTpとの距離が小さいV1はターゲットとして識別されている。しかしながら、本来はターゲットに識別されるべきV2は、背景に識別されている。この問題は、ターゲット色学習が進むにつれて自動的に解決できる。図4(b)に、十分なターゲット色学習が行われた時刻Tqの、画素(xp,yp)における3次元YUV空間を示す。この図からわかるように、V1、V2ともにターゲットとして識別されることになる。
【0092】
これは、言い換えれば、背景領域と対象色領域を分けている境界である、決定境界の位置に依存する。図4(a)に示したように、不十分な学習しか行われていなければ、対象色領域に属するベクトルが少ないために、決定境界(不十分な学習)DBTpは、対象色領域側に近いところに位置している。そのため、本来はターゲットに識別されるべきV2は、背景に識別されている。それに対して、学習が進んでいき時刻Tqになると、決定境界(十分な学習)DBTqは、より背景色領域側に近いところに移動している。これにより、V2もターゲットとして識別されることになる。
【0093】
また、最近傍識別によりあるxy−YUV値がターゲット色に識別されても、最近傍背景色領域との距離が大きい(確実にターゲット色であると確認できる)ことは保証されていない。そこで、最近傍識別によってターゲットに識別されたxy−YUV値を、識別空間内にターゲット色として記憶する際にも、前述したターゲット色登録処理を実行することが好ましい。
【0094】
[他の好ましい実施形態]
前述した実施形態においては、画像データの色階調値はYUV方式で表されているとして説明した。しかし、本発明はそれに限られることなく、光の三原色であるR(赤)、G(緑)およびB(青)で画像データの色を表現するRGB方式におけるRGB値や、それ以外の色表現形式で表してもよい。また、例えばカメラから出力されたYUV値をRGB値など、他の色表現形式に変換して本発明に係る画像処理を行ってもよいし、逆に、カメラから出力されたRGB値など、他の色表現形式のものをYUV値に変換して本発明に係る画像処理を行うように構成することも可能である。
【0095】
また、本発明はカラー画像に限られることなく、例えば、8ビット256階調のグレースケールで表された画像データに対しても、適用可能である。
【0096】
さらに、本発明は、画素の座標を表すxy2次元座標と色階調を表すYUV3次元ベクトルとの組み合わせに限られることなく、画素の座標と色階調を表すベクトルとの他の任意の組み合わせに対しても適応可能である。例えば、画素が3次元的に配列されている場合であれば、画素の座標を表すxyz3次元座標と色階調を表す任意の次元のベクトルとを組み合わせることも可能である。
【0097】
また、以上の説明においては、識別すべきクラスは背景とターゲットの2つだけとしたが、本発明はそれに限られることなく、3つ以上のクラスの識別においても有効である。
【0098】
前述した実施形態においては、1画素ごとにそのYUV値を識別空間に投影し、ターゲット色検出を行った。しかし、近接画素間においては、YUV値の生起確率には高い相関があり、またカメラの量子化誤差の影響で各YUV値の下位ビットの値は信頼性が低い。そのため、xy−YUV軸をそれぞれ観測可能な最大解像度(すなわち、xy軸を1画素ごと、YUV軸を1階調ごと)でサンプリングしても冗長性が高く、識別空間の巨大化に伴う識別の高精度化は期待できない。そこで、識別性能と計算コストとのトレードオフを考慮して、各軸のサンプリングレートを決めることが好ましい。
【0099】
図5は、xy軸の画素、およびYUV軸の階調をリサンプリングする一実施形態を示した模式図である。図5(a)は画像データの画素を表しており、(b)はxy各軸をリサンプリングして得たYUV集合である(空間リサンプリング)。図5(a)では、xy各軸をそれぞれ1/bにリサンプリングして、図5(b)のYUV集合SSを作製している。ここで、この例においては、b=4である。すなわち、4×4ピクセルのブロック中の全YUV値を識別空間中の一つのxy値(例えば、4×4ピクセルの最も左上の座標など)に対応させている。
【0100】
続いて、YUV軸の各階調を1/cにリサンプリングして、図5(c)に示したYUV集合SCを得ている(階調リサンプリング)。図中の記号[x]は、xを超えない最大の整数を表す。
【0101】
本発明においては、画像座標xyと色階調YUVという異なる情報量によって、識別空間が構成されている。そのため、識別空間中の距離によって色を識別する際に、全軸間の距離を均一に評価してしまうことは、識別結果に悪影響を及ぼす可能性がある。そこで、前述のサンプリングレートを考慮した上で、各軸間の距離に重みを与えることにより、適切な識別が行われるように調整する。
【0102】
図5(d)では、画像中の(x=n,y=n)番目のブロックからサンプリングされたYUV集合SCが、xy−YUV空間のxy軸方向単位長にw倍の重みを与えられて、(x=wn,y=wn)に投影されている。この重みは、厳密には入力画像の複雑さによって変化させるべきであるが、一般的にはxy−YUV軸のサンプリングレートのみに応じて決定しても識別結果に大きな影響はない。
【0103】
また、このリサンプリングは、識別空間のサイズを調整しているだけで、入力画像データのサイズを縮小している訳ではない。それでありながら、情報量をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。さらに、空間リサンプリングにおいては、例えある画素の色階調値がノイズにより本来の値から変動させられたとしても、隣接する画素と合わせたブロックに対して処理が行われるため、その変動の影響をほとんど受けずに済む。
【0104】
ターゲット検出時は、全画素に対応するxy−YUV値が上記の背景学習と同様のルールで識別空間に投影され、それぞれ独立に、例えば画像が640×480ピクセルであれば、640×480回の最近傍識別が行われる。
【0105】
以上説明した一連の画像処理は、ソフトウェアにより実行することができる。例えば、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータで実現される。これは、図1において、制御部4およびドライブ5をコンピュータとし、主制御部10を専用のハードウェアとすることに相当する。
【0106】
または、一連の画像処理は、記録媒体からソフトウェアを構成するプログラムがインストールされることにより、各種の機能を実行することが可能な汎用のコンピュータで実現される。これは、例えば、図1において、制御部4およびドライブ5を汎用のコンピュータとし、磁気ディスク21、光ディスク22、光磁気ディスク23または半導体メモリ24などを、プログラムを記録した記録媒体としたことに相当する。
【実施例1】
【0107】
以下、照明の変化、背景物体の動きなどの背景領域の変動に対する、本発明の有効性を確認するための一実施例について説明する。
【0108】
本実施例では、図1の制御部4およびドライブ5としてPentium(登録商標)4 2.4GHzのPC(パーソナルコンピュータ)と、図1のカメラ3としてSONY製IEEE1394カメラDFW−VL500とを用いた画像処理の一例を示す。入力画像データは、640×480ピクセルのYUV画像である。
【0109】
図6に、実験を行った背景領域を示す。図6(a)は照明がオンの場合であり、図6(b)は照明がオフの場合である。日照変化により壁や床の陰影は微妙に変化している。また、画面左上のカーテンは風のため揺れている。
【0110】
図7および図8は、定数閾値による背景差分の検出結果を示す。ただし、図7(b)および図8(b)、(d)は、「極力全対象領域が検出されるように」手動で決められる閾値を小さく取った場合の検出結果である。また、図7(c)および図8(c)、(e)は、逆に、「極力誤検出が小さくなるように」手動で決められる閾値を大きく取った場合の検出結果である。そして、全結果の閾値は互いに異なる値である。
【0111】
図7(b)、(c)は、図6(a)(照明オン)と図7(a)の差分結果において、閾値を変えた結果である。適切な閾値によって、図7(c)のように比較的良好な結果を得ることもできるが、図6(a)と図7(a)において、カーテンが移動した分は誤検出されている。また、図8(b)、(c)は、図6(a)(照明オン)と図8(a)の差分結果において、閾値を変えた結果である。入力画像の照明条件が急激に変化しているため、閾値を調節しても大きな誤検出が生じている。
【0112】
一方、図8(d)、(e)は、図6(b)(照明オフ)と図8(a)の差分結果において、閾値を変えた結果である。このように、仮に入力画像に適した静止背景画像が与えられたとしても、照明が消えて画像全体が暗い場合、背景色とターゲット色との差分が小さいため、閾値の小さな違いが検出結果に大きな影響を与えてしまう。
【0113】
次に、図9に、ガウス混合モデルを用いた背景差分の検出結果を示す。図9(a)は、図7(a)(照明オン)からの検出結果であり、照明状況に対して十分に背景モデルが適応した後の検出結果を示している。この図9(a)に示した結果は、全画素に対して定数の閾値処理が行われた図7(b)、(c)と比べて、非静止背景物体の誤検出がほとんどない。しかし、図9(b)に示すように、照明オンに適応した背景モデルにより、図8(a)(照明オフ)からの検出を行うと、誤検出が生じてしまう。
【0114】
これは、照明オフ直後には背景モデル更新が間に合わないために誤検出が生じることを意味する。照明オフの背景画像集合に合わせて十分に更新された背景モデルから検出閾値を決定すると、図9(c)に示すように単純な背景差分の結果(図8(b)、(c)、(d)、(e))と比べて良好な結果を得ることができる。
【0115】
最後に、図10(照明オン)および図11(照明オフ)に、本発明に係る画像処理方法による検出結果を示す。xy−YUV空間での最近傍識別には、ハッシュ表を用いた効率的キャッシングによる高速化を施した。ハッシュ表を用いると、データ量が大きくなっても、キーとなるオブジェクトから対応するオブジェクトへ高速にアクセスできるため、高速な処理が可能となる。
【0116】
また、x、y軸をそれぞれ1/8に(x軸:640ピクセル→80ピクセル、y軸:480ピクセル→60ピクセル)、YUV軸はそれぞれ階調を半分(256→128)にリサンプリングし、xy軸とYUV軸の単位長の比が2:1になるようにxy軸に2倍の重みを与えた。つまり、前述のb、cおよびwは、b=8、c=2およびw=2である。
【0117】
本実施例では、まず図6に示したような照明オン・オフ時の背景画像をそれぞれ5種類ずつ事前に撮影し、計10枚の画像中の全xy−YUV値を一つの識別空間中に記録した。これらの画像において、壁や床の上の陰影は微妙に変化し、風で揺れるカーテンは様々な形状で撮影された。
【0118】
本実施例においては、ターゲットは画像内を数往復し、その間に十分なターゲット色学習が行われた。また、ターゲット色学習量に応じた検出結果の変化を確認するため、ある1枚の入力画像に対して、(a)ターゲット色学習なし、(b)ターゲット色学習量小、および(c)ターゲット色学習量大、という3つの異なる条件でターゲット検出を行った。その結果が、それぞれ、図10ならびに図11の(a)、(b)および(c)である。すなわち、図10(a)と図11(a)、図10(b)と図11(b)、および図10(c)と図11(c)は、それぞれ同一の背景色・ターゲット色データによる検出結果であり、照明オン・オフ時のそれぞれに適した識別データを用意している訳ではない。
【0119】
図7(a)(照明オン)と図8(a)(照明オフ)からの検出結果を、それぞれ図10および図11に示す。ただし、本発明に係る画像処理方法には、図7および図8に示した単純な背景差分のように、人間が適切な閾値を定めるような手動処理は一切含まれていない。つまり、本実施例においては自律動作によりターゲット検出を行わせている。
【0120】
図10(a)、(b)や図11(a)、(b)に示すように、ターゲット色の学習量が十分ではないときは、背景色と対象領域中の色が似ている領域(カーテンとシャツが重なる領域)での検出洩れが多い。しかし、図10(c)、図11(c)に示したように、十分な量のターゲット色を学習した後の検出結果では、背景色と類似した色の対象領域の検出率も向上し、他の方法と比べて極めて優れた結果が得られている。
【0121】
また、図10(c)における検出洩れのほとんどは、照明によりターゲット色が完全に飽和している領域であり、色情報のみを参照して同じく色が完全に飽和した背景領域と識別することは不可能である。また、ターゲット色学習後の動作速度は、PCの性能に依存するが、現状10fpsに近い値が得られており、十分に実時間ターゲット検出が可能である。
【0122】
以上説明したように、本発明によれば、背景差分とターゲット色検出を統合した、任意の対象領域における実時間ターゲット検出が可能な画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供できる。本発明においては、画像のxy軸と色のYUV軸からなる5次元空間における最近傍識別によって、背景画像色の空間的分布とターゲット色の分布との両方を考慮した識別空間を構成することにより、背景差分の適切な閾値設定を実現している。その結果、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である。
【図面の簡単な説明】
【0123】
【図1】本発明に係る画像処理装置の一実施形態における機能ブロック図である。
【図2】本発明に係る画像処理装置の一実施形態における処理の流れを示すフローチャートである。(a)は背景色領域形成、(b)は対象領域検出の処理に関するものである。
【図3】本発明の一実施形態におけるxy−YUV5次元空間を表す模式図である。
【図4】画素(xp,yp)における3次元YUV空間を示す模式図である。(a)はターゲット色学習時間が不十分、(b)はターゲット色学習時間が十分行われた場合の結果である。
【図5】xy軸の画素、およびYUV軸の階調をリサンプリングする一実施形態を示した模式図である。(a)は画像データの画素、(b)は空間リサンプリング後、(c)は階調リサンプリング後、(d)は空間重み付け後を表す。
【図6】実験を行った背景領域である。(a)は照明オン時、(b)は照明オフ時である。
【図7】背景差分による、照明オン時の入力画像を用いたターゲット検出結果である。(a)は入力画像、(b)は差分閾値小、(c)は差分閾値大の場合の結果である。
【図8】背景差分による、照明オフ時の入力画像を用いたターゲット検出結果である。(a)は入力画像、(b)は差分閾値小、(c)は差分閾値大、(d)は差分閾値小、(e)は差分閾値大の場合の結果である。
【図9】ガウス混合モデルを用いた背景差分によるターゲット検出結果である。(a)は照明オン時、(b)は照明オフ直後、(c)は照明オフ時の場合の結果である。
【図10】本発明に係る画像処理方法による、照明オン時のターゲット検出結果である。(a)はターゲット色未学習、(b)はターゲット色学習量小、(c)はターゲット色学習量大の場合の結果である。
【図11】本発明に係る画像処理方法による、照明オフ時のターゲット検出結果である。(a)はターゲット色未学習、(b)はターゲット色学習量小、(c)はターゲット色学習量大の場合の結果である。
【図12】従来の画像処理方法におけるYUV−YUV6次元空間を表す模式図である。
【符号の説明】
【0124】
1 背景領域
2 対象領域
3 カメラ
4 制御部
5 ドライブ
10 主制御部
11 背景画像データ記憶部
12 入力画像データ記憶部
13 構造化データ記憶部
14 クラス識別部
15 閾値比較部
16 周辺機器制御部
【技術分野】
【0001】
本発明は、画像中に含まれる複数の領域を識別する画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体に関するものである。
【背景技術】
【0002】
観測画像中から移動物体などの対象(ターゲット)を検出する問題は、コンピュータビジョンの中でも重要な課題の一つとして挙げられる。その解決のために開発された方法の中でも、画像中の特定の色を検出する色検出と、あらかじめ用意した背景画像から変化した領域を検出する背景差分は、ターゲット検出の基本的な技術として用いられている。
【0003】
色検出は、ターゲット色ごとに適切な閾値を設定できるので、微妙な色の違いを識別することが可能である。
【0004】
また、背景差分は、ターゲットに関する事前知識を必要とせず、任意のターゲットを検出可能であり、かつ画素ごとに背景色の変化をモデル化可能な方法である。このような利点を有するため、背景差分は、静止領域の検出が不可能なフレーム間差分や、事前に定義されたターゲットしか検出できない顔検出・肌色検出と比較して、多くの視覚システムで利用されている。特に、十分な背景情報を事前に学習可能な環境下であれば、優れた結果を期待することができる。
【0005】
さらに最近は、背景変動に対してロバスト(頑健)であり、かつ背景と任意のターゲットの微妙な色の差を検出可能とするために、これら背景差分と最近傍識別による色検出を有機的に統合することも行われている(例えば、非特許文献1参照)。
【0006】
この非特許文献1に開示された方法においては、図12に示したように、画素の色(色階調値)が6次元のYUV色空間(識別空間)で表現される。具体的には、背景領域を撮像した背景画像データの座標(xp,yp)における画素の3次元色が(Ybp,Ubp,Vbp)であるとき、その背景色は、識別空間において(Ybp,Ubp,Vbp,Ybp,Ubp,Vbp)Tという6次元ベクトルで表現される(Tは、ベクトルの転置を表す。)。同様に、背景画像データの座標(xq,yq)における画素の3次元色が(Ybq,Ubq,Vbq)であるとき、その背景色は、識別空間において(Ybq,Ubq,Vbq,Ybq,Ubq,Vbq)Tという6次元ベクトルで表現される。このように識別空間における6次元ベクトルで表された背景画像データ(背景色ベクトル)は、背景色領域を形成する。
【0007】
また、背景領域および対象領域を撮像した入力画像データの座標(xs,ys)における画素の3次元色が(Yis,Uis,Vis)であるとき、その入力された色は、識別空間において(Ybs,Ubs,Vbs,Yis,Uis,Vis)Tという6次元ベクトルで表現される。このようにして得られた6次元ベクトルに対して、6次元空間における最近傍識別を用いることで、入力された色が背景色領域または対象色(ターゲット色)領域に識別される。対象色領域に識別された6次元ベクトル(Ybs,Ubs,Vbs,Yis,Uis,Vis)Tは対象色ベクトルと呼ばれ、背景色領域と対象色領域との境界は決定境界と呼ばれる。
【0008】
この方法では、通常(3次元)に比べて次元数が大きいため、処理時間はかかるが、最近傍識別のためのキャッシュの効率的利用により実時間動作が可能となっている。
【非特許文献1】加藤丈和、柴田智行、和田俊和:「最近傍識別器を用いた背景差分と色検出の統合」、情処研報 CVIM-142-5, Vol. 145, no. 5, pp. 31-36, Jan. 2004.
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、背景差分は、照明変化(照明強度や照明色の変化)や影による背景物体の見えの変化、または、背景内に、例えば葉や旗の揺らぎなどの非静止領域がある場合には、背景とターゲットを正確に識別することができない。さらに、背景差分には、背景に似た色を有するターゲットの検出が困難であるという課題がある。
【0010】
また、色検出は、背景画像の全画素に含まれる色集合と各ターゲット色の間の識別を行う方法であるため、膨大な種類の色集合を扱う識別問題となる。そのため、必然的に異なるクラス間の距離は小さくなり、識別性能が低下する(位置情報の欠落)。さらに、ターゲット色は人手により与えられているので、自律動作するターゲット検出システムにはそのまま適用することができない(非自律性)という課題を有する。
【0011】
背景差分と色検出を統合した非特許文献1に開示された方法においては、参照する背景画像が1枚だけなので、照明変化に対応できないという課題がある。例え、様々な照明条件下における背景画像集合を記録していたとしても、現状の方法では、逐次参照する背景画像を選択する基準がない。また、背景情報は独立なYUV値として表現されているため、位置情報が欠落している。すなわち、近接画素間の共起性などは全く考慮されていない。さらに、適切なターゲット色を指定するために人手を要しているという課題もある。
【0012】
本発明は、上記課題に鑑みてなされたものであり、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0013】
請求項1記載の発明は、画像処理装置であって、所定の領域を撮像し、画像データに変換する撮像手段と、前記撮像手段により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶手段と、前記撮像手段により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別手段と、前記クラス識別手段により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶手段と、を備えることを特徴とする。
【0014】
この構成によれば、まず、撮像手段により背景領域のみが撮像された背景画像データが得られる。そして、背景色記憶手段により、背景画像データの画素の座標と前記画素の色階調値とが識別空間内に構造化されて記憶される。この識別空間内における背景画像データの集合は、背景色領域と呼ばれる。続いて、撮像手段により背景領域および対象領域が撮像された入力画像データが得られる。そして、入力画像データの各画素の色階調値と背景色領域との識別空間内における距離が計算される。その計算された距離に基づき、クラス識別手段により、入力画像データの各画素の色階調値が、背景色領域とそれ以外の背景外色領域のいずれに属するかが識別される。このクラス識別手段により各画素の色階調値が背景外色領域に属すると判断された場合には、対象色記憶手段により、各画素の色階調値と各画素の座標とが識別空間内に構造化して記憶される。
【0015】
請求項2記載の発明は、請求項1記載の画像処理装置であって、画像データの色階調値はYUV方式で表されていることを特徴とする。
【0016】
この構成によれば、輝度信号であるYと、色信号であるUおよびVで画像データの色を表現する。
【0017】
請求項3記載の発明は、請求項1記載の画像処理装置であって、画像データの色階調値はRGB方式で表されていることを特徴とする。
【0018】
この構成によれば、光の三原色であるR(赤)、G(緑)およびB(青)で画像データの色を表現する。
【0019】
請求項4記載の発明は、請求項1記載の画像処理装置であって、グレースケールで表されていることを特徴とする。
【0020】
この構成によれば、明度差に基づいたグレースケールで画像データの色を表現する。
【0021】
請求項5記載の発明は、請求項1乃至4のいずれかに記載の画像処理装置であって、クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、最近傍識別を用いることを特徴とする。
【0022】
この構成によれば、識別空間において、背景領域と背景外領域のいずれが、各画素の色階調値から最も近い点を有するのかが、最近傍識別により判断される。
【0023】
請求項6記載の発明は、請求項1乃至5のいずれかに記載の画像処理装置であって、クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、ハッシュ表を用いることを特徴とする。
【0024】
この構成によれば、キーとなるオブジェクトから対応するオブジェクトへの直接的なアクセスが可能となる。
【0025】
請求項7記載の発明は、請求項1乃至6のいずれかに記載の画像処理装置であって、クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合、前記各画素の色階調値と前記背景色領域の識別空間内における距離が所定の閾値より大きいときに、前記各画素の色階調値が前記背景外色領域に含まれると判断し、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶することを特徴とする。
【0026】
この構成によれば、クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合であっても、各画素の色階調値と背景色領域の識別空間内における距離が所定の閾値より大きいときには、背景外色領域に含まれると判断し直される。
【0027】
請求項8記載の発明は、請求項1乃至7のいずれかに記載の画像処理装置であって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、近接する複数の画素の色階調値をまとめて一つの画素の座標に記憶することを特徴とする。
【0028】
この構成によれば、識別空間において、近接する複数の画素の色階調値をまとめて一つの画素の座標に構造化して記憶するので、画素の座標に関する情報をほとんど減らすことなく、1箇所に集約する。
【0029】
請求項9記載の発明は、請求項1乃至8のいずれかに記載の画像処理装置であって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、色階調値に所定の値を掛けて記憶することを特徴とする。
【0030】
この構成によれば、色階調に関する情報をほとんど減らすことなく、各画素の色階調値が圧縮される。
【0031】
請求項10記載の発明は、請求項1乃至9のいずれかに記載の画像処理装置であって、背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、画素の座標を指定する座標軸に所定の重みを掛けて得られた画素の座標を用い、該画素の座標と前記各画素の色階調値とを識別空間内に構造化して記憶することを特徴とする。
【0032】
この構成によれば、画素の座標を指定する座標軸に所定の重みを掛けて、空間座標における距離を変更する。これにより、識別空間における、空間座標と色階調空間の距離の関係が修正される。
【0033】
請求項11記載の発明は、画像処理方法であって、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、を含むことを特徴とする。
【0034】
請求項12記載の発明は、記録媒体であって、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能であることを特徴とする。
【0035】
請求項13記載の発明は、プログラムであって、所定の領域を撮像し、画像データに変換する撮像ステップと、前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、をコンピュータに実行させることを特徴とする。
【発明の効果】
【0036】
請求項1記載の発明によれば、複数枚の背景画像データを利用することができ、かつ画像データにおける画素の座標と画素の色階調値とが識別空間内に構造化して記憶されている。そのため、色情報だけでなく、位置情報も取り込まれている。その結果、定常的な背景変動だけでなく急激かつ大きな照明変化に対しても対応でき、かつ背景色とターゲット色との小さな差分の検出も可能である。
【0037】
請求項2記載の発明によれば、輝度信号(Y)により多くのデータ量を割り当てることで、少ない画質の劣化で高いデータ圧縮率を得ることができる。
【0038】
請求項3記載の発明によれば、RGB方式はスキャナ、モニタ、デジタルカメラ、カラーテレビなどに使用されているので、汎用性が高い。また、例えば、フルカラーであれば、RGBをそれぞれ256階調に分けて色を表現するので、1677万7216色の色調表現が可能である。
【0039】
請求項4記載の発明によれば、画像を白から黒までの明暗だけで表現するため、カラー画像に比べて色を指定するための情報量が少なくて済む。その結果、色を識別する処理が高速に行える。
【0040】
請求項5記載の発明によれば、識別問題で典型的に用いられている最近傍識別により識別を行うので、これまでに開発された効率的なアルゴリズムなどを有効に活用することができる。
【0041】
請求項6記載の発明によれば、データ量が大きくなっても、キーとなるオブジェクトから対応するオブジェクトへ高速にアクセスできるため、高速な処理が可能となる。
【0042】
請求項7記載の発明によれば、閾値を変えることにより、識別の基準を制御することができる。そのため、背景領域の変動などがあった場合にも、閾値を調整することで、容易に最適な識別を行うことができる。
【0043】
請求項8記載の発明によれば、画素の座標に関する情報をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。
【0044】
請求項9記載の発明によれば、色階調に関する情報をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。
【0045】
請求項10記載の発明によれば、画像座標xyと色階調YUVという異なる情報量による各軸間の距離に重みを与えて調整しているので、適切な識別が行われる。
【0046】
請求項11記載の発明によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法を提供することができる。
【0047】
請求項12記載の発明によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法に関する、コンピュータが読み取り可能なプログラムが記録されていることを特徴とする記録媒体を提供することができる。
【0048】
請求項13記載の発明によれば、背景差分と色検出の統合により、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である画像処理方法に関するプログラムを提供することができる。
【発明を実施するための最良の形態】
【0049】
以下、本発明の一実施形態について、図面を参照しながら説明する。
【0050】
[本実施形態の概略]
本発明は背景差分を基本とした方法であり、ターゲット検出時に起こりうる背景変動はすべて事前に撮影された背景画像中の色分布そのものによって表現される。したがって、ターゲット検出性能を上げるためには、起こりうる背景変動を可能な限りもれなく観測・収集しておく必要がある。しかし、すべての移動対象物の写り込みや雲の移動による細かな影の変化なども含めた背景の見えのパターンは膨大であり、それらすべてを事前に観測することは不可能である。
【0051】
したがって、背景情報のみに基づくターゲット検出時は、背景情報が不完全であることを考慮して、確実に背景外領域と見なせる領域を検出する。また、背景色とターゲット色を考慮したターゲット検出時は、ターゲット色学習後に、背景色とターゲット色が似通っていても、最近傍識別によって双方の等方的な誤差・変動に対してロバストな識別を行うことを可能とする。
【0052】
[背景色領域形成]
図1は、本発明に係る画像処理装置の一実施形態における機能ブロック図である。所定の位置に固定されたカメラ3は、矩形の点線で示された背景領域1、または背景領域1および対象領域2からなる領域を撮像する。このカメラ3は、制御部4に接続され、制御部4によって制御されるとともに、撮像した画像データなどを制御部4に出力する。また、制御部4にはドライブ5が接続されており、制御部4から出力された画像データなどを記録媒体に記録する。
【0053】
背景領域1および対象領域2は、本発明を高度道路交通システム(ITS:Intelligent Transport System)に適用する場合には、例えば、高速道路を含めた所定の領域が背景領域1であり、その道路を走行している車が対象領域2に対応する。また、本発明を監視システムに適用する場合には、例えば、住居の入り口やエレベータホールなどが背景領域1であり、その背景領域1内を通過する人物が対象領域2に対応する。
【0054】
カメラ3は、静止画撮影の場合には、例えばデジタルスチルカメラであり、動画撮影の場合には、例えばデジタルビデオカメラである。また、カメラ3は、CCD(Charge Coupled Devices)を撮像素子として備えるものである。カメラ3は、制御部4の指示に従って画像を撮像し、画素値I(x,y)からなる画像データを制御部4に出力する。本実施形態においては、この画素値I(x,y)は、カラーデータであり、画像データの色階調値はYUV方式で表されているとする。YUV方式は、輝度信号であるYと、色信号であるUおよびVとで画像データの色を表現するものである。このようにYUV方式では輝度と色の信号を分けているため、輝度信号(Y)により多くのデータ量を割り当てることで、少ない画質の劣化で高いデータ圧縮率を得ることができる。また、このYUV値(色階調値)は、光の三原色であるR(赤)、G(緑)およびB(青)で画像データの色を表現するRGB方式におけるRGB値や、それ以外の色表現形式に容易に変換することができる。
【0055】
また、本実施形態においては、CCDは単板式であり、各画素にYUV値が与えられているとして説明するが、カメラ3のCCDは、3板式であっても、単板式であっても構わない。3板式は、撮像された画像データの色を、例えばR、G、Bの三原色に分けて、それぞれにCCDを割り当てる方式である。それに対して、単板式は、RGBなどの色をまとめて、それに1つのCCDを割り当てる方式である。
【0056】
制御部4は、カメラ3で撮像された画像データを取り込み、その画像データに基づいて所定の処理を施す機能部である。また、制御部4は、ドライブ5に対して画像データなどのデータを出力する。さらに、制御部4は、ドライブ5を介して、種々の画像データやプログラムなどが記録された記録媒体から必要な情報をインストールし、その機能を実行することができる。
【0057】
この制御部4は、主制御部10、背景画像データ記憶部11、入力画像データ記憶部12、構造化データ記憶部13、クラス識別部14、閾値比較部15および周辺機器制御部16を備える。
【0058】
主制御部10は、背景画像データ記憶部11、入力画像データ記憶部12、構造化データ記憶部13、クラス識別部14、閾値比較部15および周辺機器制御部16に接続され、これらの処理を制御するものである。
【0059】
背景画像データ記憶部11は、カメラ3で撮像された背景領域1のみの画像データ(背景画像データ)を記憶する機能部である。この背景画像データ記憶部11においては、画素の座標(x,y)に対応して、YUV値が記憶されている。
【0060】
入力画像データ記憶部12は、カメラ3で撮像された背景領域1および対象領域2からなる画像データを記憶する機能部である。この入力画像データ記憶部12においても、背景画像データ記憶部11と同様、画素の座標(x,y)に対応して、YUV値が記憶されている。
【0061】
構造化データ記憶部13は、画素の座標(x,y)に対応して、背景画像データのYUV値を記憶する。ただし、背景画像データ記憶部11とは異なり、画素の座標一つに対応して背景画像データ枚数分のYUV値を構造化して記憶する。さらに、構造化データ記憶部13は、入力画像データの各画素において、対象色領域に含まれると判断された画素の座標(x,y)とYUV値とを構造化して記憶する。この画素の座標に対応してYUV値が構造化されている色空間を、以後、識別空間と呼ぶ。また、構造化データ記憶部13は、背景色記憶手段および対象色記憶手段として機能する。
【0062】
クラス識別部14は、入力画像データ記憶部12に記憶された入力画像データの各画素のYUV値が、識別空間において背景色領域と対象色領域のいずれに属するかを判別する機能部である。そして、YUV値が対象色領域に属すると判別された場合に、クラス識別部14は、そのYUV値を構造化データ記憶部13に記憶させる。また、同時に、クラス識別部14は、識別空間において各画素のYUV値と背景色領域の最近傍点までの距離とを求める。また、クラス識別部14は、クラス識別手段として機能する。
【0063】
閾値比較部15は、クラス識別部14で求められた、各画素のYUV値と背景色領域の最近傍点までの距離と閾値Thbとを比較する機能部である。
【0064】
周辺機器制御部16は、例えば静止画撮影の場合に、カメラ3に撮像信号を送出し、画像を撮像させるなど、カメラ3を制御する機能を有する。また、周辺機器制御部16は、画像データやプログラムをドライブ5に出力し記録媒体に記録させ、逆に記録媒体に記録された画像データやプログラムをドライブ5を介して入力するなど、ドライブ5を制御する機能を有する。
【0065】
ドライブ5は、制御部4から出力された画像データなどのデータを受け取り、そのデータを種々の記録媒体に出力する。また、ドライブ5は、記録媒体に記録された種々の画像データやプログラムなどを制御部4に出力する。この記録媒体は、磁気ディスク(フロッピー(登録商標)ディスクを含む)21、光ディスク(CD:Compact Disk、DVD:Digital Versatile Diskを含む)22、光磁気ディスク(MD:Mini-Diskを含む)23または半導体メモリ24などにより構成される。
【0066】
図2は、本発明に係る画像処理装置の一実施形態における処理の流れを示すフローチャートである。以下、この図1および図2を参照しながら、本発明に係る画像処理装置の一実施形態における機能および処理の流れを説明する。
【0067】
まず、背景画像データに基づいて、背景色領域形成を行う処理(図2のS10およびS11)について説明する。
【0068】
最初に、照明条件などを変化させながら、背景領域1のみがカメラ3で複数枚撮像される(S10)。得られた背景画像データは、制御部4内の背景画像データ記憶部11に出力され、そこに記憶される。このとき、背景画像データ記憶部11においては、背景画像データの各画素の座標(x,y)に対応して、YUV値が記憶されている。また、背景画像データは複数枚撮像されているので、同じ画素の座標に複数個のYUV値が存在している。これを表現するために、本実施形態においては、xy−YUV5次元空間(識別空間)を考え、その空間内にYUV値を記憶させる(S11)。
【0069】
図3は、本発明の一実施形態における識別空間を表す模式図である。この図は、複数枚の背景画像データおよび入力画像データにおける、画素の座標とYUV値とをどのように識別空間に配置させるかを示している。例えば、背景画像データにおける座標が(xq,yq)である画素のYUV値が(Yq,Uq,Vq)のとき、このxy座標とYUV値とを合わせて5次元ベクトル(xq,yq,Yq,Uq,Vq)T(背景色ベクトル)が構成される。そして、この5次元ベクトル(xq,yq,Yq,Uq,Vq)Tが、識別空間において「背景」とラベル付けされる。このとき、模式的には、各(x,y)座標点にそれぞれYUV軸が備わっていると考えることができる。つまり、背景画像データの画素の座標(xq,yq)と画素のYUV値(色階調値)(Yq,Uq,Vq)とが識別空間内に構造化((xq,yq,Yq,Uq,Vq)T)され、背景色領域とラベル付けされることになる。この構造化された5次元ベクトルは、構造化データ記憶部13に記憶される。
【0070】
[対象領域検出]
前述した識別空間における背景色領域形成(背景学習)が終了すると、対象領域検出の準備が整ったことになる。対象領域中の色情報が未知の場合には、背景色情報のみから対象領域検出を行う。
【0071】
以下、入力画像データが、背景色領域と対象色領域とのいずれに属するかを判別する処理(図2のS20〜S26)について説明する。
【0072】
最初に、背景領域1と対象領域2とが重なった入力画像がカメラ3で撮像される(S20)。得られた入力画像データは、制御部4内の入力画像データ記憶部12に出力され、そこに記憶される。このとき、入力画像データ記憶部12においては、入力画像データの各画素の座標(x,y)に対応して、YUV値が記憶されている。
【0073】
続いて、入力画像データの画素(xq,yq)が選択され(S21)、その画素のxy−YUV値が識別空間に投影される(S22)。これは、クラス識別部14が、入力画像データ記憶部12から座標(xq,yq)の画素のYUV値を受け取り、さらに構造化データ記憶部13から同じ座標(xq,yq)の画素のすべてのYUV値を受け取り、これらを比較することに相当する。
【0074】
次に、クラス識別部14において、画素(xq,yq)のYUV値に対して、最近傍識別が行われる(S23)。本実施形態においては、簡単のため、識別すべきクラスは背景とターゲットの2つだけとする。したがって、最近傍識別の結果、入力画像データのYUV値は、背景かターゲットかのいずれかのクラスに分けられる。また、クラス識別部14において、最近接クラスが決定されると同時に、背景色領域に属する最近傍点までの距離が求められる。求められた最近傍点までの距離は、閾値比較部15に出力される。
【0075】
識別空間にターゲット色が全く記録されていない初期状態では、最近傍識別はすべてのxy−YUV値を背景として識別してしまう。そこで、通常の背景差分のように閾値Thb(定数)を導入し、最近傍点までの距離が閾値Thbより大きいxy−YUV値を背景外色領域(本実施形態においては対象色領域)として検出するように構成する。
【0076】
まず、図2の最近傍識別(S23)において、入力画像データの座標(xq,yq)の画素のYUV値が背景色領域に属すると識別された場合を説明する。まず、閾値比較部15において、クラス識別部14で求められた最近傍点までの距離と閾値Thbとが比較される(S24)。そして、最近傍点までの距離が閾値Thbより小さければ(S24でNO)、その入力画像データのYUV値は背景色領域に属すると識別され、入力画像データの次の画素の識別に移る(S21)。
【0077】
それに対して、閾値比較部15において、最近傍点までの距離が閾値Thbより大きいと判断されれば(S24でYES)、その入力画像データのYUV値は対象色領域に属すると識別される。また、このときの5次元ベクトル(xq,yq,Yq,Uq,Vq)Tを、対象色ベクトルと呼ぶ。そして、識別空間の全画素のxy座標において、そのYUV値が対象色領域として記憶され(S26)、入力画像データの次の画素の識別に移る(S21)。
【0078】
このようにして、順次、対象色ベクトルが記憶されていくと、背景色領域と対象色領域とを分けている決定境界の形状も、それに応じて変化していく。
【0079】
次に、図2の最近傍識別(S23)において、入力画像データの座標(xq,yq)の画素のYUV値が対象色領域に属すると識別された場合を説明する。まず、閾値比較部15において、クラス識別部14で求められた最近傍点までの距離と閾値Thbとが比較される(S25)。そして、最近傍点までの距離が閾値Thbより小さければ(S25でNO)、その入力画像データのYUV値は背景色領域にも近いことになるために、識別空間内に記憶させることはせず、入力画像データの次の画素の識別に移る(S21)。
【0080】
つまり、本実施形態においては、「確実に背景外領域である」と判断された領域のみを切り出し、その領域中の色をターゲット色として記録し、以降の識別処理に利用する。
【0081】
それに対して、閾値比較部15において、最近傍点までの距離が閾値Thbより大きいと判断されれば(S25でYES)、その入力画像データのYUV値は確実に対象色領域に属すると識別される。そして、識別空間の全画素の座標において、そのYUV値が対象色領域として記憶され、入力画像データの次の画素の識別に移る(S21)。
【0082】
以上の処理を繰り返していくことにより、背景領域の中から対象領域を識別することができる。
【0083】
以上説明したように本実施形態においては、入力画像データのYUV値が対象色領域に属すると識別されると、そのYUV値が識別空間に記憶される。そのため、この識別に不具合が生ずると、以降の最近傍識別による誤検出が増加してしまう。これを避けるためには、識別時の閾値Thbを十分に大きくすることが好ましい。
【0084】
この閾値Thbを十分に大きく取ってよい理由は以下の通りである。ある背景領域の色とそれに似た色の対象領域が重なったとき、閾値Thbが大きいと、その対象領域が全く検出されなくなってしまう。しかし、閾値Thbによる背景差分は、背景とターゲットの色が大きく異なる領域において確実に対象領域を検出し、その検出領域中の色をターゲット色として識別空間に記録するための処理であり、類似した背景・ターゲット色間の識別は最近傍識別によって行われる。したがって、閾値Thbは適当に十分大きな値でよい。
【0085】
また、本実施形態においては、閾値Thbを定数として説明したが、これは識別処理を高速化するためである。これにより、識別の実時間処理が可能となる。しかし、本発明はこれに限られることなく、背景領域の変動に応じた適切な閾値設定も可能である。
【0086】
上記の識別処理においては、例えば(xp,yp,Yp,Up,Vp)Tが背景外色領域として識別されると、この(Yp,Up,Vp)が他のxy座標で観測されてもターゲット色として識別されるように、全xy座標の(Yp,Up,Vp)をターゲット色にクラス分類する。しかし、他のxy座標(xq,yq)では、(xq,yq,Yp,Up,Vp)Tが背景色領域に分類されている可能性がある。このとき、(xq,yq,Yp,Up,Vp)Tのクラスをターゲットに変更してしまうと、座標(xq,yq)を頻繁に誤検出してしまう。そこで、以下のターゲット色登録処理によってこの問題を回避することも可能である。
【0087】
まず、ターゲット色として識別されたYUV値(Yi,Ui,Vi)を色成分に持つ全xy−YUV値{(xi,yi,Yi,Ui,Vi)T}(ただし、iは全画像座標を要素に持つ集合の要素)の最近傍識別を行う。
【0088】
次に、最近傍識別の結果、最近傍点までの距離が閾値Thtより大きい場合のみ背景色との重なりがないとみなし、そのxy−YUV値をターゲットにクラス分類する。
【0089】
ここで導入した閾値Thtは、識別空間における背景色領域が信頼できる場合は、0(ゼロ)でよい。つまり、YUV値が完全に一致した場合のみ、ターゲットにクラス分類するように構成してもよい。それは、本発明においては、背景領域の観測・学習はオフライン処理であるため、この処理の段階で識別空間における背景色領域の信頼性を十分に高めておくことが可能であるからである。
【0090】
[対象色領域の逐次更新]
ターゲット色が学習されると、閾値Thbによる閾値処理によってだけでなく、最近傍識別によってターゲットに識別されるxy−YUV値(xp,yp,Yp,Up,Vp)Tが現れる。図4(a)に、十分な背景学習が行われたため、識別空間における背景色領域は信頼できるが、ターゲット色学習が不十分な時点(時刻Tpとする)の、画素(xp,yp)における3次元YUV空間を示す。この時刻Tpにおいても、図4(a)のV1のように、最近傍識別によるターゲット色検出結果は信頼性が高い。したがって、画素(xp,yp)を対象領域として検出する。しかし、逆に、図4(a)のV2のように、最近傍識別により背景色と識別されたxy−YUV値が実際に背景に対応している可能性は必ずしも高くない。
【0091】
図4(a)の例では、ターゲット色学習が不十分な時刻Tpにおいて、少ないながらも学習済の対象色領域TTpとの距離が小さいV1はターゲットとして識別されている。しかしながら、本来はターゲットに識別されるべきV2は、背景に識別されている。この問題は、ターゲット色学習が進むにつれて自動的に解決できる。図4(b)に、十分なターゲット色学習が行われた時刻Tqの、画素(xp,yp)における3次元YUV空間を示す。この図からわかるように、V1、V2ともにターゲットとして識別されることになる。
【0092】
これは、言い換えれば、背景領域と対象色領域を分けている境界である、決定境界の位置に依存する。図4(a)に示したように、不十分な学習しか行われていなければ、対象色領域に属するベクトルが少ないために、決定境界(不十分な学習)DBTpは、対象色領域側に近いところに位置している。そのため、本来はターゲットに識別されるべきV2は、背景に識別されている。それに対して、学習が進んでいき時刻Tqになると、決定境界(十分な学習)DBTqは、より背景色領域側に近いところに移動している。これにより、V2もターゲットとして識別されることになる。
【0093】
また、最近傍識別によりあるxy−YUV値がターゲット色に識別されても、最近傍背景色領域との距離が大きい(確実にターゲット色であると確認できる)ことは保証されていない。そこで、最近傍識別によってターゲットに識別されたxy−YUV値を、識別空間内にターゲット色として記憶する際にも、前述したターゲット色登録処理を実行することが好ましい。
【0094】
[他の好ましい実施形態]
前述した実施形態においては、画像データの色階調値はYUV方式で表されているとして説明した。しかし、本発明はそれに限られることなく、光の三原色であるR(赤)、G(緑)およびB(青)で画像データの色を表現するRGB方式におけるRGB値や、それ以外の色表現形式で表してもよい。また、例えばカメラから出力されたYUV値をRGB値など、他の色表現形式に変換して本発明に係る画像処理を行ってもよいし、逆に、カメラから出力されたRGB値など、他の色表現形式のものをYUV値に変換して本発明に係る画像処理を行うように構成することも可能である。
【0095】
また、本発明はカラー画像に限られることなく、例えば、8ビット256階調のグレースケールで表された画像データに対しても、適用可能である。
【0096】
さらに、本発明は、画素の座標を表すxy2次元座標と色階調を表すYUV3次元ベクトルとの組み合わせに限られることなく、画素の座標と色階調を表すベクトルとの他の任意の組み合わせに対しても適応可能である。例えば、画素が3次元的に配列されている場合であれば、画素の座標を表すxyz3次元座標と色階調を表す任意の次元のベクトルとを組み合わせることも可能である。
【0097】
また、以上の説明においては、識別すべきクラスは背景とターゲットの2つだけとしたが、本発明はそれに限られることなく、3つ以上のクラスの識別においても有効である。
【0098】
前述した実施形態においては、1画素ごとにそのYUV値を識別空間に投影し、ターゲット色検出を行った。しかし、近接画素間においては、YUV値の生起確率には高い相関があり、またカメラの量子化誤差の影響で各YUV値の下位ビットの値は信頼性が低い。そのため、xy−YUV軸をそれぞれ観測可能な最大解像度(すなわち、xy軸を1画素ごと、YUV軸を1階調ごと)でサンプリングしても冗長性が高く、識別空間の巨大化に伴う識別の高精度化は期待できない。そこで、識別性能と計算コストとのトレードオフを考慮して、各軸のサンプリングレートを決めることが好ましい。
【0099】
図5は、xy軸の画素、およびYUV軸の階調をリサンプリングする一実施形態を示した模式図である。図5(a)は画像データの画素を表しており、(b)はxy各軸をリサンプリングして得たYUV集合である(空間リサンプリング)。図5(a)では、xy各軸をそれぞれ1/bにリサンプリングして、図5(b)のYUV集合SSを作製している。ここで、この例においては、b=4である。すなわち、4×4ピクセルのブロック中の全YUV値を識別空間中の一つのxy値(例えば、4×4ピクセルの最も左上の座標など)に対応させている。
【0100】
続いて、YUV軸の各階調を1/cにリサンプリングして、図5(c)に示したYUV集合SCを得ている(階調リサンプリング)。図中の記号[x]は、xを超えない最大の整数を表す。
【0101】
本発明においては、画像座標xyと色階調YUVという異なる情報量によって、識別空間が構成されている。そのため、識別空間中の距離によって色を識別する際に、全軸間の距離を均一に評価してしまうことは、識別結果に悪影響を及ぼす可能性がある。そこで、前述のサンプリングレートを考慮した上で、各軸間の距離に重みを与えることにより、適切な識別が行われるように調整する。
【0102】
図5(d)では、画像中の(x=n,y=n)番目のブロックからサンプリングされたYUV集合SCが、xy−YUV空間のxy軸方向単位長にw倍の重みを与えられて、(x=wn,y=wn)に投影されている。この重みは、厳密には入力画像の複雑さによって変化させるべきであるが、一般的にはxy−YUV軸のサンプリングレートのみに応じて決定しても識別結果に大きな影響はない。
【0103】
また、このリサンプリングは、識別空間のサイズを調整しているだけで、入力画像データのサイズを縮小している訳ではない。それでありながら、情報量をほとんど減らすことなく、効率的な処理が行えるため、計算の高速化が可能となる。また、必要なメモリ量も少なくて済む。さらに、空間リサンプリングにおいては、例えある画素の色階調値がノイズにより本来の値から変動させられたとしても、隣接する画素と合わせたブロックに対して処理が行われるため、その変動の影響をほとんど受けずに済む。
【0104】
ターゲット検出時は、全画素に対応するxy−YUV値が上記の背景学習と同様のルールで識別空間に投影され、それぞれ独立に、例えば画像が640×480ピクセルであれば、640×480回の最近傍識別が行われる。
【0105】
以上説明した一連の画像処理は、ソフトウェアにより実行することができる。例えば、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータで実現される。これは、図1において、制御部4およびドライブ5をコンピュータとし、主制御部10を専用のハードウェアとすることに相当する。
【0106】
または、一連の画像処理は、記録媒体からソフトウェアを構成するプログラムがインストールされることにより、各種の機能を実行することが可能な汎用のコンピュータで実現される。これは、例えば、図1において、制御部4およびドライブ5を汎用のコンピュータとし、磁気ディスク21、光ディスク22、光磁気ディスク23または半導体メモリ24などを、プログラムを記録した記録媒体としたことに相当する。
【実施例1】
【0107】
以下、照明の変化、背景物体の動きなどの背景領域の変動に対する、本発明の有効性を確認するための一実施例について説明する。
【0108】
本実施例では、図1の制御部4およびドライブ5としてPentium(登録商標)4 2.4GHzのPC(パーソナルコンピュータ)と、図1のカメラ3としてSONY製IEEE1394カメラDFW−VL500とを用いた画像処理の一例を示す。入力画像データは、640×480ピクセルのYUV画像である。
【0109】
図6に、実験を行った背景領域を示す。図6(a)は照明がオンの場合であり、図6(b)は照明がオフの場合である。日照変化により壁や床の陰影は微妙に変化している。また、画面左上のカーテンは風のため揺れている。
【0110】
図7および図8は、定数閾値による背景差分の検出結果を示す。ただし、図7(b)および図8(b)、(d)は、「極力全対象領域が検出されるように」手動で決められる閾値を小さく取った場合の検出結果である。また、図7(c)および図8(c)、(e)は、逆に、「極力誤検出が小さくなるように」手動で決められる閾値を大きく取った場合の検出結果である。そして、全結果の閾値は互いに異なる値である。
【0111】
図7(b)、(c)は、図6(a)(照明オン)と図7(a)の差分結果において、閾値を変えた結果である。適切な閾値によって、図7(c)のように比較的良好な結果を得ることもできるが、図6(a)と図7(a)において、カーテンが移動した分は誤検出されている。また、図8(b)、(c)は、図6(a)(照明オン)と図8(a)の差分結果において、閾値を変えた結果である。入力画像の照明条件が急激に変化しているため、閾値を調節しても大きな誤検出が生じている。
【0112】
一方、図8(d)、(e)は、図6(b)(照明オフ)と図8(a)の差分結果において、閾値を変えた結果である。このように、仮に入力画像に適した静止背景画像が与えられたとしても、照明が消えて画像全体が暗い場合、背景色とターゲット色との差分が小さいため、閾値の小さな違いが検出結果に大きな影響を与えてしまう。
【0113】
次に、図9に、ガウス混合モデルを用いた背景差分の検出結果を示す。図9(a)は、図7(a)(照明オン)からの検出結果であり、照明状況に対して十分に背景モデルが適応した後の検出結果を示している。この図9(a)に示した結果は、全画素に対して定数の閾値処理が行われた図7(b)、(c)と比べて、非静止背景物体の誤検出がほとんどない。しかし、図9(b)に示すように、照明オンに適応した背景モデルにより、図8(a)(照明オフ)からの検出を行うと、誤検出が生じてしまう。
【0114】
これは、照明オフ直後には背景モデル更新が間に合わないために誤検出が生じることを意味する。照明オフの背景画像集合に合わせて十分に更新された背景モデルから検出閾値を決定すると、図9(c)に示すように単純な背景差分の結果(図8(b)、(c)、(d)、(e))と比べて良好な結果を得ることができる。
【0115】
最後に、図10(照明オン)および図11(照明オフ)に、本発明に係る画像処理方法による検出結果を示す。xy−YUV空間での最近傍識別には、ハッシュ表を用いた効率的キャッシングによる高速化を施した。ハッシュ表を用いると、データ量が大きくなっても、キーとなるオブジェクトから対応するオブジェクトへ高速にアクセスできるため、高速な処理が可能となる。
【0116】
また、x、y軸をそれぞれ1/8に(x軸:640ピクセル→80ピクセル、y軸:480ピクセル→60ピクセル)、YUV軸はそれぞれ階調を半分(256→128)にリサンプリングし、xy軸とYUV軸の単位長の比が2:1になるようにxy軸に2倍の重みを与えた。つまり、前述のb、cおよびwは、b=8、c=2およびw=2である。
【0117】
本実施例では、まず図6に示したような照明オン・オフ時の背景画像をそれぞれ5種類ずつ事前に撮影し、計10枚の画像中の全xy−YUV値を一つの識別空間中に記録した。これらの画像において、壁や床の上の陰影は微妙に変化し、風で揺れるカーテンは様々な形状で撮影された。
【0118】
本実施例においては、ターゲットは画像内を数往復し、その間に十分なターゲット色学習が行われた。また、ターゲット色学習量に応じた検出結果の変化を確認するため、ある1枚の入力画像に対して、(a)ターゲット色学習なし、(b)ターゲット色学習量小、および(c)ターゲット色学習量大、という3つの異なる条件でターゲット検出を行った。その結果が、それぞれ、図10ならびに図11の(a)、(b)および(c)である。すなわち、図10(a)と図11(a)、図10(b)と図11(b)、および図10(c)と図11(c)は、それぞれ同一の背景色・ターゲット色データによる検出結果であり、照明オン・オフ時のそれぞれに適した識別データを用意している訳ではない。
【0119】
図7(a)(照明オン)と図8(a)(照明オフ)からの検出結果を、それぞれ図10および図11に示す。ただし、本発明に係る画像処理方法には、図7および図8に示した単純な背景差分のように、人間が適切な閾値を定めるような手動処理は一切含まれていない。つまり、本実施例においては自律動作によりターゲット検出を行わせている。
【0120】
図10(a)、(b)や図11(a)、(b)に示すように、ターゲット色の学習量が十分ではないときは、背景色と対象領域中の色が似ている領域(カーテンとシャツが重なる領域)での検出洩れが多い。しかし、図10(c)、図11(c)に示したように、十分な量のターゲット色を学習した後の検出結果では、背景色と類似した色の対象領域の検出率も向上し、他の方法と比べて極めて優れた結果が得られている。
【0121】
また、図10(c)における検出洩れのほとんどは、照明によりターゲット色が完全に飽和している領域であり、色情報のみを参照して同じく色が完全に飽和した背景領域と識別することは不可能である。また、ターゲット色学習後の動作速度は、PCの性能に依存するが、現状10fpsに近い値が得られており、十分に実時間ターゲット検出が可能である。
【0122】
以上説明したように、本発明によれば、背景差分とターゲット色検出を統合した、任意の対象領域における実時間ターゲット検出が可能な画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体を提供できる。本発明においては、画像のxy軸と色のYUV軸からなる5次元空間における最近傍識別によって、背景画像色の空間的分布とターゲット色の分布との両方を考慮した識別空間を構成することにより、背景差分の適切な閾値設定を実現している。その結果、定常的な背景変動だけでなく急激かつ大きな照明変化などに対しても対応でき、かつ背景色とターゲット色の小さな差分の検出も可能である。
【図面の簡単な説明】
【0123】
【図1】本発明に係る画像処理装置の一実施形態における機能ブロック図である。
【図2】本発明に係る画像処理装置の一実施形態における処理の流れを示すフローチャートである。(a)は背景色領域形成、(b)は対象領域検出の処理に関するものである。
【図3】本発明の一実施形態におけるxy−YUV5次元空間を表す模式図である。
【図4】画素(xp,yp)における3次元YUV空間を示す模式図である。(a)はターゲット色学習時間が不十分、(b)はターゲット色学習時間が十分行われた場合の結果である。
【図5】xy軸の画素、およびYUV軸の階調をリサンプリングする一実施形態を示した模式図である。(a)は画像データの画素、(b)は空間リサンプリング後、(c)は階調リサンプリング後、(d)は空間重み付け後を表す。
【図6】実験を行った背景領域である。(a)は照明オン時、(b)は照明オフ時である。
【図7】背景差分による、照明オン時の入力画像を用いたターゲット検出結果である。(a)は入力画像、(b)は差分閾値小、(c)は差分閾値大の場合の結果である。
【図8】背景差分による、照明オフ時の入力画像を用いたターゲット検出結果である。(a)は入力画像、(b)は差分閾値小、(c)は差分閾値大、(d)は差分閾値小、(e)は差分閾値大の場合の結果である。
【図9】ガウス混合モデルを用いた背景差分によるターゲット検出結果である。(a)は照明オン時、(b)は照明オフ直後、(c)は照明オフ時の場合の結果である。
【図10】本発明に係る画像処理方法による、照明オン時のターゲット検出結果である。(a)はターゲット色未学習、(b)はターゲット色学習量小、(c)はターゲット色学習量大の場合の結果である。
【図11】本発明に係る画像処理方法による、照明オフ時のターゲット検出結果である。(a)はターゲット色未学習、(b)はターゲット色学習量小、(c)はターゲット色学習量大の場合の結果である。
【図12】従来の画像処理方法におけるYUV−YUV6次元空間を表す模式図である。
【符号の説明】
【0124】
1 背景領域
2 対象領域
3 カメラ
4 制御部
5 ドライブ
10 主制御部
11 背景画像データ記憶部
12 入力画像データ記憶部
13 構造化データ記憶部
14 クラス識別部
15 閾値比較部
16 周辺機器制御部
【特許請求の範囲】
【請求項1】
所定の領域を撮像し、画像データに変換する撮像手段と、
前記撮像手段により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶手段と、
前記撮像手段により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別手段と、
前記クラス識別手段により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶手段と、
を備えることを特徴とする画像処理装置。
【請求項2】
画像データの色階調値はYUV方式で表されていることを特徴とする請求項1記載の画像処理装置。
【請求項3】
画像データの色階調値はRGB方式で表されていることを特徴とする請求項1記載の画像処理装置。
【請求項4】
画像データの色階調値はグレースケールで表されていることを特徴とする請求項1記載の画像処理装置。
【請求項5】
クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、最近傍識別を用いることを特徴とする請求項1乃至4のいずれかに記載の画像処理装置。
【請求項6】
クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、ハッシュ表を用いることを特徴とする請求項1乃至5のいずれかに記載の画像処理装置。
【請求項7】
クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合、前記各画素の色階調値と前記背景色領域の識別空間内における距離が所定の閾値より大きいときに、前記各画素の色階調値が前記背景外色領域に含まれると判断し、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶することを特徴とする請求項1乃至6のいずれかに記載の画像処理装置。
【請求項8】
背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、近接する複数の画素の色階調値をまとめて一つの画素の座標に記憶することを特徴とする請求項1乃至7のいずれかに記載の画像処理装置。
【請求項9】
背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、色階調値に所定の値を掛けて記憶することを特徴とする請求項1乃至8のいずれかに記載の画像処理装置。
【請求項10】
背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、画素の座標を指定する座標軸に所定の重みを掛けて得られた画素の座標を用い、該画素の座標と前記各画素の色階調値とを識別空間内に構造化して記憶することを特徴とする請求項1乃至9のいずれかに記載の画像処理装置。
【請求項11】
所定の領域を撮像し、画像データに変換する撮像ステップと、
前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、
前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、
前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、
を含むことを特徴とする画像処理方法。
【請求項12】
所定の領域を撮像し、画像データに変換する撮像ステップと、
前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、
前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、
前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、
をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体。
【請求項13】
所定の領域を撮像し、画像データに変換する撮像ステップと、
前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、
前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、
前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、
をコンピュータに実行させるためのプログラム。
【請求項1】
所定の領域を撮像し、画像データに変換する撮像手段と、
前記撮像手段により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶手段と、
前記撮像手段により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別手段と、
前記クラス識別手段により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶手段と、
を備えることを特徴とする画像処理装置。
【請求項2】
画像データの色階調値はYUV方式で表されていることを特徴とする請求項1記載の画像処理装置。
【請求項3】
画像データの色階調値はRGB方式で表されていることを特徴とする請求項1記載の画像処理装置。
【請求項4】
画像データの色階調値はグレースケールで表されていることを特徴とする請求項1記載の画像処理装置。
【請求項5】
クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、最近傍識別を用いることを特徴とする請求項1乃至4のいずれかに記載の画像処理装置。
【請求項6】
クラス識別手段において、前記各画素の色階調値が前記背景領域と前記背景外領域のいずれに属するかを識別する際に、ハッシュ表を用いることを特徴とする請求項1乃至5のいずれかに記載の画像処理装置。
【請求項7】
クラス識別手段により前記各画素の色階調値が前記背景色領域に属すると判断された場合、前記各画素の色階調値と前記背景色領域の識別空間内における距離が所定の閾値より大きいときに、前記各画素の色階調値が前記背景外色領域に含まれると判断し、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶することを特徴とする請求項1乃至6のいずれかに記載の画像処理装置。
【請求項8】
背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、近接する複数の画素の色階調値をまとめて一つの画素の座標に記憶することを特徴とする請求項1乃至7のいずれかに記載の画像処理装置。
【請求項9】
背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、色階調値に所定の値を掛けて記憶することを特徴とする請求項1乃至8のいずれかに記載の画像処理装置。
【請求項10】
背景色記憶手段または対象色記憶手段において、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する際、画素の座標を指定する座標軸に所定の重みを掛けて得られた画素の座標を用い、該画素の座標と前記各画素の色階調値とを識別空間内に構造化して記憶することを特徴とする請求項1乃至9のいずれかに記載の画像処理装置。
【請求項11】
所定の領域を撮像し、画像データに変換する撮像ステップと、
前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、
前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、
前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、
を含むことを特徴とする画像処理方法。
【請求項12】
所定の領域を撮像し、画像データに変換する撮像ステップと、
前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、
前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、
前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、
をコンピュータに実行させるためのプログラムを記録したコンピュータが読み取り可能な記録媒体。
【請求項13】
所定の領域を撮像し、画像データに変換する撮像ステップと、
前記撮像ステップの処理により撮像された背景領域のみからなる背景画像データにおける各画素の座標と、前記各画素の色階調値とを識別空間内に構造化して記憶し、背景色領域を形成する背景色記憶ステップと、
前記撮像ステップの処理により撮像された、背景領域および対象領域からなる入力画像データにおける、各画素の色階調値と前記背景色領域との識別空間内における距離を計算し、その計算された距離に基づき前記入力画像データの前記各画素の色階調値が、前記背景色領域とそれ以外の背景外色領域のいずれに属するかを識別するクラス識別ステップと、
前記クラス識別ステップの処理により前記各画素の色階調値が前記背景外色領域に属すると判断された場合、前記各画素の色階調値と前記各画素の座標とを識別空間内に構造化して記憶する対象色記憶ステップと、
をコンピュータに実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図12】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図12】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2006−39689(P2006−39689A)
【公開日】平成18年2月9日(2006.2.9)
【国際特許分類】
【出願番号】特願2004−214920(P2004−214920)
【出願日】平成16年7月22日(2004.7.22)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【Fターム(参考)】
【公開日】平成18年2月9日(2006.2.9)
【国際特許分類】
【出願日】平成16年7月22日(2004.7.22)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【Fターム(参考)】
[ Back to top ]