画像処理装置および方法、並びにプログラム
【課題】画像内の被写体の種別の認識精度を向上できるようにする。
【解決手段】距離検出部32は、画像取得部31により取得された画像内に撮像されている被写体の、画像の撮像時の撮像機器からの距離の情報を、画像の画素単位で取得する。物体認識部36の領域分割部41は、画像、および距離情報に基づいて、画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する。背景影響低減特徴量抽出部42は、画像、距離情報、および分割された背景領域の情報の全て、またはそのいずれかに基づいて、背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する。認識処理部43は、抽出された特徴量に基づいて、画像における前景となる被写体の種別を認識する。本発明は、画像処理装置に適用することができる。
【解決手段】距離検出部32は、画像取得部31により取得された画像内に撮像されている被写体の、画像の撮像時の撮像機器からの距離の情報を、画像の画素単位で取得する。物体認識部36の領域分割部41は、画像、および距離情報に基づいて、画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する。背景影響低減特徴量抽出部42は、画像、距離情報、および分割された背景領域の情報の全て、またはそのいずれかに基づいて、背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する。認識処理部43は、抽出された特徴量に基づいて、画像における前景となる被写体の種別を認識する。本発明は、画像処理装置に適用することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および方法、並びにプログラムに関し、特に、画像内の被写体となる物体の種別の認識精度を向上させるようにした画像処理装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
従来において、物体認識技術として、認識対象を人の掌とし、グー、チョキ、またはパー等の手の形状を識別する技術がある。
【0003】
また、これらの物体認識技術の物体認識精度を向上させるために、画像と併せて、特定の条件や付加情報を利用する技術があり、その一例として、肌色情報を利用することで手の領域を取得し易くし、手の形状認識の精度向上を図るようにした技術が提案されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−148663号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1の技術においては、肌色情報を用いる為に、認識処理の精度が照明等の影響を受け易い。
【0006】
本発明はこのような状況に鑑みてなされたものであり、特に、様々な環境の下で撮像された画像に対しても画像内の被写体となる物体の種別を高精度で認識できるようにするものである。
【課題を解決するための手段】
【0007】
本発明の一側面の画像処理装置は、画像を取得する画像取得手段と、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段とを含む。
【0008】
前記背景影響低減特徴量抽出手段には、前記画像、および前記領域分割手段により分割された背景領域の情報に基づいて、前記画像のうち、前記背景領域に対応する画素を平滑化する平滑化手段を含ませるようにすることができ、前記平滑化手段により前記背景領域に対応する画素が平滑化された画像より、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出させるようにすることができる。
【0009】
前記平滑化手段には、前記領域分割手段により分割された背景領域の画素に対して、その近傍の画素の背景画素と前景画素との比率に応じた強度で画素を平滑化させるようにすることができる。
【0010】
背景影響低減特徴量抽出手段には、前記画像の特徴量を抽出する特徴量抽出手段と、前記画像、および距離情報、前記領域分割手段により分割された背景領域の情報に基づいて、重み設定し、前記特徴量に前記重みを付する重み設定手段とを含ませるようにすることができ、前記重み設定手段により設定された重みが付された特徴量を、前記背景による被写体の種別の認識に対する影響を低減する特徴量として抽出させるようにすることができる。
【0011】
前記特徴量抽出手段には、HOG特徴量を抽出させるようにすることができる。
【0012】
本発明の一側面の画像処理方法は、画像を取得する画像取得手段と、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段とを含む画像処理装置の画像処理方法であって、前記画像取得手段における、前記画像を取得する画像取得ステップと、前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップとを含む。
【0013】
本発明の一側面のプログラムは、画像を取得する画像取得手段と、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段とを含む画像処理装置を制御するコンピュータに、前記画像取得手段における、前記画像を取得する画像取得ステップと、前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップとを含む処理を実行させる。
【0014】
本発明の一側面においては、画像が取得され、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報が、前記画像の画素単位で取得され、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域が分割され、前記画像、前記距離情報、および分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響が低減される特徴量が抽出され、抽出された特徴量に基づいて、前記画像における前景となる被写体の種別が認識される。
【0015】
本発明の画像処理装置は、独立した装置であっても良いし、画像処理を行うブロックであっても良い。
【発明の効果】
【0016】
本発明の一側面によれば、様々な環境下で撮像された画像に含まれる被写体である物体の種別の識別精度を向上させることが可能となる。
【図面の簡単な説明】
【0017】
【図1】本発明を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。
【図2】図1の画像処理装置による物体認識処理を説明するフローチャートである。
【図3】図1の画像処理装置による物体認識処理を説明する図である。
【図4】図1の画像処理装置による背景影響低減特徴量抽出処理を説明するフローチャートである。
【図5】図1の画像処理装置による画像加工処理を説明するフローチャートである。
【図6】図1の画像処理装置による特徴量抽出処理を説明するフローチャートである。
【図7】特徴量抽出処理を説明する図である。
【図8】本発明を適用した画像処理装置のその他の実施の形態の構成例を示すブロック図である。
【図9】図8の画像処理装置による背景影響低減特徴量抽出処理を説明するフローチャートである。
【図10】本発明を適用した画像処理装置のさらにその他の実施の形態の構成例を示すブロック図である。
【図11】図10の画像処理装置による特徴量抽出処理を説明するフローチャートである。
【図12】汎用のパーソナルコンピュータの構成例を説明する図である。
【発明を実施するための最良の形態】
【0018】
以下、発明を実施するための最良の形態(以下実施の形態とする)について説明する。尚、説明は以下の順序で行う。
1.第1の実施の形態(画像加工処理と特徴量抽出処理とで認識精度低下を低減する例)
2.第2の実施の形態(特徴量抽出処理のみで認識精度低下を低減する例)
3.第3の実施の形態(画像加工処理のみで認識精度低下を低減する例)
【0019】
<1.第1の実施の形態>
[画像処理装置の構成例]
図1は、本発明を適用した画像処理装置のハードウェアの一実施の形態の構成例を示している。図1の画像処理装置11は、様々な環境下で撮像された画像に含まれる被写体である物体の種別を認識するものである。
【0020】
画像処理装置11は、画像取得部31、距離検出部32、目標位置検出部33、拡大縮小部34,35、および物体認識部36を備えている。
【0021】
画像取得部31は、CCD(Charge Coupled Devices)やCMOS(Complementary Metal Oxide Semiconductor)などからなる撮像素子によりリアルタイムに複数の画像をステレオ画像のように撮像して、距離検出部32、および目標位置検出部33に供給する。また、画像取得部31は、リアルタイムに撮像されているステレオ画像に代えて、予め撮像された少なくとも1枚の画像を取得するようにしてもよく、この場合、取得した画像を目標位置検出部33にのみ供給する。
【0022】
距離検出部32は、画像取得部31によりステレオ画像などの複数の画像がリアルタイムに撮像される場合、撮像された画像間の対応点探索処理により対応点における視差を求める。そして、距離検出部32は、求められた対応点における視差により撮像された画像に含まれる被写体の画素単位での画像取得部31から被写体までの距離を求めて、距離情報として目標位置検出部33、および拡大縮小部35に供給する。また、距離検出部32は、画像取得部31よりリアルタイムでステレオ画像などが取得できず、予め撮像された画像が供給される場合、画像を用いた手法とは異なる、例えば、TOF(Time of Flight)法などにより撮像時における被写体までの距離を検出し、距離情報として目標位置検出部33、および拡大縮小部35に供給する。さらに、距離検出部32は、画像取得部31により取得された画像が撮像されるタイミングにおいて、例えば、測距センサなどにより検出された画像内の被写体までの撮像位置からの距離の情報を距離情報として取得して、目標位置検出部33、および拡大縮小部35に供給する。
【0023】
目標位置検出部33は、画像取得部31より供給されてくる画像、および、距離検出部32により供給されてくる距離情報に基づいて、画像内に存在する目標位置を検出し、目標位置の情報に基づいて画像内の必要領域を切り出して拡大縮小部34に供給する。ここで、目標とは、認識すべき対象となる被写体としての物体であり、目標位置とは、3次元座標空間における目標である被写体の位置を示す座標である。目標位置検出部33は、例えば、画像取得部31が撮像素子である場合、その撮像素子や測距センサから最も近い領域(若しくは点)、または、所定の距離の条件を満たす領域を、逐次モンテカルロ法等の任意の確率モデルを用いた推定等により目標位置として求める。尚、目標位置検出部33は、画像取得部31により取得された画像のうち、必要とされる領域を求めて、求められたその領域を切り出すものであるが、処理領域を特定することが目的であるため、必ずしも必要ではない。特に、取得される画像の被写体の領域が所定領域より大きいことが想定されているような場合などには、その処理は必ずしも必要ではないので、目標位置検出部33は、構成として省略するようにしてもよいものである。
【0024】
拡大縮小部34,35は、画像、および距離情報を処理の必要に応じてサイズを拡大、または縮小して物体認識部36に供給する。より詳細には、拡大縮小部34,35は、ニアレストネイバー法、バイリニア法、バイキュービック法、またはLanczosフィルタ等により画像、および距離情報を拡大、または縮小する。尚、サイズの拡大、または縮小は、必要に応じてなされる処理であるため、拡大縮小部34,35は、拡大または縮小せずにそのままのサイズで出力するようにしてもよい。
【0025】
物体認識部36は、拡大縮小部34より供給されてくる画像と、拡大縮小部35より供給されてくる距離情報とに基づいて、画像内の被写体である物体の種別を識別して認識し、認識結果として出力する。より詳細には、物体認識部36は、領域分割部41、背景影響低減特徴量抽出部42、および認識処理部43を備えている。
【0026】
領域分割部41は、拡大縮小部35より供給されてくる距離情報に基づいて、拡大縮小部34より供給されてくる画像を、前景領域、および背景領域に分割し、領域分割情報として背景影響低減特徴量抽出部42に供給する。より具体的には、領域分割部41は、例えば、距離情報に含まれる全画素の距離の中央値を求め、中央値よりも近い距離となる画素を前景領域とし、遠い距離となる画素を背景領域とする。ただし、前景領域および背景領域の分割は、これ以外の手法であっても良く、例えば、所定の距離より近い画素を前景領域とし、これより遠い画素を背景領域としてもよいし、画像セグメンテーション等の任意のオブジェクト抽出と距離を併せて、例えば、所定のオブジェクトの距離よりも近い距離の画素を前景領域とし、それ以外を背景領域とするようにしてもよい。また、領域分割情報は、各画素が、分割されたそれぞれ前景領域または背景領域のいずれに属するのかを示すフラグ情報となる。従って、画像の全領域が前景領域と背景領域の2つの領域に分割される場合、領域分割情報は、前景領域を示すフラグと背景領域を示すフラグで構成される情報となる。さらに、領域分割部41は、前景領域および背景領域以外に距離に応じた更に多くの領域に分割するようにしてもよく、この場合、領域分割情報は、距離に応じて分割される領域を示すフラグで構成される情報となる。
【0027】
背景影響低減特徴量抽出部42は、拡大縮小部34より供給される画像、拡大縮小部35より供給される距離情報、および領域分割部41より供給される領域分割情報に基づいて、背景領域の影響により前景領域である物体の種別の認識低下を低減させるための特徴量を抽出して認識処理部43に出力する。より詳細には、背景影響低減特徴量抽出部42は、画像加工部51、および特徴量抽出部52を備えている。
【0028】
画像加工部51は、領域分割情報、および距離情報に基づいて、画像のうち、背景領域に属する画素に対して平滑化処理を施す。より詳細には、画像加工部51は、比率計算部61、比率強度計算部62、距離強度計算部63、および平滑化部64を備えている。比率計算部61は、背景領域に属する画素のそれぞれに対応付けて局所領域を設定し、局所領域に属する画素の背景領域に属する画素の割合を比率として求める。比率強度計算部62は、平滑化部64における平滑化の強度を比率計算部61により求められた比率に基づいて比率強度として計算する。距離強度計算部63は、距離情報に基づいて、平滑化部64における平滑化の強度を距離強度として計算する。平滑化部64は、比率強度、および距離強度に対応した強度で、背景領域に属する画素を平滑化する。
【0029】
特徴量抽出部52は、領域分割情報および距離情報に基づいて、画像加工部51により背景領域が平滑化された画像より、認識処理に必要となる特徴量としてHOG(Histogram of Oriented Gradients)特徴量を抽出する。より詳細には、特徴量抽出部52は、勾配計算部71、比率計算部72、比率重み計算部73、距離重み計算部74、ヒストグラム生成部75、および正規化部76を備えている。勾配計算部71は、画像加工部51より供給されてくる画像における各画素について勾配の大きさと方向を求める。比率計算部72は、比率計算部61と同様に、各画素のそれぞれに対応付けて局所領域を設定し、局所領域に属する画素の背景領域に属する画素の割合を比率として求める。比率重み計算部73は、比率計算部72により計算された比率に基づいて、各画素の勾配の大きさに付加する比率重みを設定する。距離重み計算部74は、距離情報に基づいて、各画素の距離に応じて、各画素の勾配の大きさに付加する距離重みを設定する。ヒストグラム生成部75は、複数の画素からなるセル単位で勾配の方向別に、勾配の大きさに比率重み、および距離重みを付加して度数を求め、求められた度数に基づいてヒストグラムを生成する。正規化部76は、複数のセルからなるブロック単位で、生成されたヒストグラムを正規化し、これをHOG特徴量として認識処理部43に供給する。尚、この例においては、特徴量としてHOG特徴量を抽出する例について説明しているが、物体の認識に利用できる特徴量であれば、これに限るものではなく、例えば、Haar-like特徴量、SIFT特徴量、またはGabor特徴量等などを利用するようにしても良い。
【0030】
認識処理部43は、背景影響低減特徴量抽出部42より供給されてくる背景影響低減特徴量に基づいて、例えば、SVM(Support Vector Machine)、またはBoostingなどにより物体の種別を識別する認識処理を実行し、認識結果を出力する。
【0031】
[物体認識処理]
次に、図2のフローチャートを参照して、物体認識処理について説明する。
【0032】
ステップS11において、画像取得部31は、被写体となる物体を含む画像を取得して、距離検出部32、および目標位置検出部33に供給する。
【0033】
ステップS12において、距離検出部32は、画像取得部31により取得された画像に含まれる被写体としての物体のそれぞれに対応する画素単位の距離の情報を検出し、目標位置検出部33、および拡大縮小部35に供給する。より詳細には、例えば、画像取得部31が撮像素子を備えており、リアルタイムにステレオ画像などの複数のアングルから同一の被写体を捉えるように撮像する場合、距離検出部32は、複数の画像の対応点探索処理により、その視差を用いて各画素単位で距離を求め、距離情報として検出する。
【0034】
ステップS13において、目標位置検出部33は、画像取得部31より供給されてくる画像、および、距離検出部32により供給されてくる距離情報に基づいて、画像内に存在する目標位置を検出し、ステップS14において、目標位置の情報に基づいて画像内の必要領域を切り出して調整し、拡大縮小部34に供給する。
【0035】
ステップS15において、拡大縮小部34,35は、それぞれ目標位置検出部33により目標位置に基づいて調整された画像、および距離情報を処理に適当なサイズに拡大、または縮小し、物体認識部36に供給する。尚、拡大縮小部34,35より供給されてくるサイズが拡大、または縮小されている画像、および距離情報については、それぞれ処理に適当な領域についてサイズが調整されているのみであるので、以降においては、単に画像、および距離情報と称するものとする。
【0036】
ステップS16において、物体認識部36における領域分割部41は、距離情報に基づいて、画像を画素単位で前景領域、および背景領域に分割する。より詳細には、領域分割部41は、例えば、各画素について、距離情報に基づいて、所定の距離より近い距離の画素について前景領域に分類し、その他の画素を背景領域に分類することにより、前景領域と背景領域とに分割する。すなわち、例えば、図3の画像A1で示されるような画像が取得されると共に、図3の距離情報A2が検出される場合、図3の領域分割情報A3が求められる。ここで、画像A1は、掌からなる被写体となる物体Z1が背景Z2上に存在する画像である。また、距離情報A2は、掌の物体Z1の存在する領域全体が所定の距離を示す配色Z11で描かれ、背景Z2における空間内の各画素の距離が遠くなるにつれて黒くなるように配色Z12で示されている。さらに、領域分割情報A3は、掌の物体Z1の存在する領域より僅かに背後となる所定の距離より近い掌が白色の前景領域Z21として表示されており、それ以降については、背景領域Z22として示される灰色で示されている。結果として、掌の物体Z1に対応する領域が前景領域Z21として分割され、それ以外が背景領域Z22に分割されている。
【0037】
ステップS17において、背景影響低減特徴量抽出部42は、背景影響低減特徴量抽出処理を実行し、距離情報、および領域分割情報に基づいて、画像より背景影響低減特徴量を抽出する。
【0038】
[背景影響低減特徴量抽出処理]
ここで、図4のフローチャートを参照して、背景影響低減特徴量抽出処理について説明する。背景影響低減特徴量抽出処理は、画像加工部51においてステップS31で実行される画像加工処理と、特徴量抽出部52において、ステップS32で実行される特徴量抽出処理とから構成される。
【0039】
[画像加工処理]
ここで、図5のフローチャートを参照して、画像加工処理について説明する。
【0040】
ステップS51において、画像加工部51は、画像を構成する垂直方向の座標、すなわちy座標のカウンタyを0に初期化する。
【0041】
ステップS52において、画像加工部51は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを0に初期化する。
【0042】
ステップS53において、画像加工部51は、距離情報に基づいて、画像上の処理対象である画素I(x,y)が背景領域であるか否かを判定し、例えば、背景領域を示すフラグである場合、処理は、ステップS54に進む。
【0043】
ステップS54において、画像加工部51は、比率計算部61を制御して、画素I(x,y)に対応する局所領域を設定する。すなわち、比率制御部61は、例えば、処理対象である画素I(x,y)を中心とした6画素×6画素の方形領域を局所領域に設定する。
【0044】
ステップS55において、比率計算部61は、局所領域に属する各画素の前景領域に属する画素数と、背景領域に属する画素数との比率qを計算する。
【0045】
ステップS56において、画像加工部51は、比率強度計算部62を制御して、処理対象となる画素I(x,y)の平滑化の比率qに基づいた比率強度St_qを計算する。すなわち、例えば、比率qが前景領域の割合が高いことを示している場合、処理対象となる画素I(x,y)の周辺には、物体の認識処理に影響を及ぼす背景領域の画素が少ないと考えられるため、比率強度計算部62は、比率強度St_qを弱くするように計算する。一方、比率qが背景領域の割合が高いことを示している場合、処理対象となる画素I(x,y)の周辺には、物体の認識処理に影響を及ぼす背景領域の画素が多いと考えられるため、比率強度計算部62は、比率強度St_qを強くするように計算する。
【0046】
ステップS57において、画像加工部51は、距離強度計算部63を制御して、処理対象となる画素I(x,y)の平滑化の距離情報の距離に基づいた距離強度kkを計算する。すなわち、処理対象である画素I(x,y)の距離が遠いほど背景領域であると考えられるので、距離強度計算部63は、距離強度St_dを強くするように計算し、逆に、距離が近いほど、距離強度St_dを弱くして平滑化する。
【0047】
ステップS58において、画像加工部51は、平滑化部64を制御して、比率強度St_qおよび距離強度St_dに対応した強度で、処理対象である画素I(x,y)を平滑化する。このように、平滑化の強度は、比率qと距離に依存することとなるため、例えば、平滑化部64は、比率強度St_qおよび距離強度St_dの乗算結果St_q×St_dに基づいて、平滑化の強度を設定するようにしてもよい。
【0048】
一方、ステップS53において、処理対象となる画素I(x,y)が背景領域のフラグではないと判定された場合、ステップS54乃至S58の処理はスキップされる。
【0049】
例えば、処理対象の画素I(x,y)が、図3の分割領域情報A4における画素B1である場合、画素B1は、前景領域に属するため、ステップS53において、処理対象となる画素が背景領域のフラグではないと判定されて、ステップS54乃至S58の処理がスキップされる。
【0050】
一方、例えば、処理対象の画素I(x,y)が、図3の分割領域情報A4における画素B2またはB3である場合、画素B2,B3は、背景領域に属すので、局所領域Z102,Z103における背景領域の割合に基づいて、それぞれが平滑化される。すなわち、局所領域Z103は、全てが背景領域であるが、局所領域Z102は、一部のみが背景領域である。このため、画素B3は、画素B2よりも、より強い強度で平滑化されることになる。
【0051】
ステップS59において、画像加工部51は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0052】
ステップS60において、画像加工部51は、カウンタxが画像の水平方向のサイズSxよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS53に戻る。すなわち、カウンタxが水平方向のサイズSxよりも小さくなるまで、ステップS53乃至S60の処理が繰り返される。そして、ステップS60において、カウンタxが水平方向のサイズSxよりも小さいと判定された場合、処理は、ステップS61に進む。
【0053】
ステップS61において、画像加工部51は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0054】
ステップS62において、画像加工部51は、カウンタyが画像の垂直方向のサイズSyよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS52に戻る。すなわち、カウンタyが垂直方向のサイズSyよりも小さくなるまで、ステップS52乃至S62の処理が繰り返される。そして、ステップS62において、カウンタyが垂直方向のサイズSyよりも小さいと判定された場合、処理は、終了する。
【0055】
すなわち、領域分割情報に基づいて、背景領域に対応する画素については、局所領域における背景領域と前景領域との比率、および距離情報の距離に対応した強度で平滑化される。この結果、物体の種別の認識に影響を与える背景領域の画素による影響が低減されることになり、後段において、認識処理に影響を与える背景領域の画素の影響が低減された画像から特徴量が抽出されることになるので、物体の種別の認識処理における認識率を向上させることが可能となる。尚、平滑化の強度については、比率のみで制御するようにしても、距離のみで制御するようにしても、背景領域による認識処理の認識精度の低減を抑制する効果を奏する事ができるので、いずれかのみで平滑化の強度を制御するようにしても良い。
【0056】
[特徴量抽出処理]
次に、図6のフローチャートを参照して、特徴量抽出処理について説明する。
【0057】
ステップS71において、特徴量抽出部52は、画像を構成する垂直方向の座標、すなわちy座標のカウンタyを0に初期化する。
【0058】
ステップS72において、特徴量抽出部52は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを0に初期化する。
【0059】
ステップS73において、特徴量抽出部52は、勾配計算部71を制御して、処理対象となる画素I(x,y)について勾配の角度および大きさを計算させる。より詳細には、例えば、処理対象画素I(x,y)が、図7の画素C1である場合、勾配計算部71は、その垂直方向131に隣接する画素I(x,y+1),I(x,y−1)および水平方向132に隣接する画素I(x+1,y),I(x−1,y)を用いて、以下の式(1)を計算することにより勾配を求める。尚、図7の左上部においては、処理対象となる画素I(x,y)の勾配の配置が示されており、図7の中央上部にいては、処理対象画素C1である画素121を含むm画素×n画素からなるセル102の構成例が示されている。さらに、図7の右上部においては、セル102に対応するセル111がM個×N個からなるブロック101の構成例が示されており、下部には、セル102を構成する各画素の勾配の方向L1乃至LL毎の度数からなるヒストグラム103の例が示されている。
【0060】
【数1】
【0061】
ここで、gx(x,y),gy(x,y)は、それぞれ水平方向の勾配、および垂直方向の勾配である。
【0062】
そして、勾配計算部71は、以下の式(2),式(3)を計算することにより、それぞれ勾配の大きさ、および角度を計算する。
【0063】
【数2】
【数3】
【0064】
ここr(x,y)は、勾配の大きさであり、θ(x,y)は、勾配の角度を示している。
【0065】
ステップS74において、特徴量抽出部52は、比率計算部72を制御して、画像上の処理対象である画素I(x,y)に対応する局所領域を設定する。すなわち、ステップS74の処理により、比率計算部72は、例えば、処理対象である画素I(x,y)を中心とした近傍のu画素×v画素の方形領域を局所領域に設定する。
【0066】
ステップS75において、比率計算部72は、局所領域に属する各画素の前景領域に属する画素数と、背景領域に属する画素数との比率qを計算する。
【0067】
ステップS76において、特徴量抽出部52は、比率重み計算部73を制御して、比率qに基づいて比率重みwkを計算させる。
【0068】
ステップS77において、特徴量抽出部52は、距離重み計算部74を制御して、距離情報における処理対象となる画素I(x,y)の距離に基づいて、距離重みwdを計算させる。
【0069】
ステップS78において、特徴量抽出部52は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0070】
ステップS79において、特徴量抽出部52は、カウンタxが画像の水平方向のサイズSxよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS73に戻る。すなわち、カウンタxが水平方向のサイズSxよりも小さくなるまで、ステップS73乃至S79の処理が繰り返される。そして、ステップS79において、カウンタxが水平方向のサイズSxよりも小さいと判定された場合、処理は、ステップS80に進む。
【0071】
ステップS80において、特徴量抽出部52は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0072】
ステップS81において、特徴量抽出部52は、カウンタyが画像の垂直方向のサイズSyよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS72に戻る。すなわち、カウンタyが垂直方向のサイズSyよりも小さくなるまで、ステップS72乃至S81の処理が繰り返される。そして、ステップS81において、カウンタyが垂直方向のサイズSyよりも小さいと判定された場合、処理は、ステップS82に進む。
【0073】
ステップS82において、ヒストグラム生成部75は、未処理のセルを処理対象のセルに設定する。すなわち、図7の中央上部で示されるように、複数の画素群からなるセルを画像内に設定し、そのうち、未処理のセルを処理対象のセルに設定する。尚、図7の中央上部においては、m画素×n画素のセル102が設定される例が示されている。
【0074】
ステップS83において、ヒストグラム生成部75は、処理対象となるセルにおける勾配の方向毎の比率重みwk、および距離重みwdを含めた度数を設定する。すなわち、HOG特徴量は、図7の中央上部で示されるセル102の各画素について勾配方向を方向L1乃至LLに分けて、各画素の勾配方向に属する度数から求められるヒストグラムに基づくものである。
【0075】
すなわち、ヒストグラム生成部75は、以下の式(4)で示されるように、各画素の勾配方向Llの度数fl’を設定する。
【0076】
【数4】
【0077】
ここで、fl’は、方向Llの度数であり、wkは、ステップS76の処理で求められた各画素の局所領域における前景領域と背景領域との比率に基づいた比率重みである。また、wdは、ステップS77の処理で求められた各画素の距離情報の距離に応じて設定される距離重みであり、rl(x,y)は、勾配の大きさである。
【0078】
すなわち、比率重みwkは、以下の式(5)で設定される前景領域と背景領域との比率bに基づいて設定されている。
【0079】
【数5】
【0080】
ここで、δ(D)は、以下の式(6)で設定される領域分割情報D(x,y)を一般化した関数である。また、u,vは、局所領域がu画素×v画素の領域であることを示している。
【0081】
【数6】
【0082】
ここで、すなわち、関数δ(D)は、前景領域では1であり、背景領域では0となる関数である。
【0083】
例えば、比率重みwkをk段階設定する場合、比率重み計算部73は、これらの条件に基づいて、例えば、以下の式(7)で示されるように重みを含めた度数を設定する。
【0084】
【数7】
【0085】
ここで、th1,th2,・・・,thkは、k段階の重みを設定するための閾値であり、比率重みwk、および閾値thkは、以下の式(8)で示される関係となる。
【0086】
【数8】
【0087】
すなわち、比率bが大きくなるに連れて、比率重みwkも大きくなり、すなわち、前景領域の比率が大きいほど、比率重みwkは、大きく設定されて、逆に、前景領域の比率が小さいほど、比率重みwkは小さく設定される。このため、物体の識別に影響を及ぼす背景領域の画素によるヒストグラムの度数が軽減されるように比率重みwkが設定されるので、特徴量より背景領域の画素による影響を排除し、認識精度を向上させることが可能となる。
【0088】
同様に、距離重みwdは、各画素について、距離情報に応じて、距離が大きいほど小さく設定され、逆に、距離が小さいほど大きく設定される。このため、やはり、物体の識別に影響を及ぼす背景領域の画素によるヒストグラムの度数が軽減されるように距離重みwdが設定されるので、特徴量より背景領域の画素による影響を排除し、認識精度を向上させることが可能となる。
【0089】
ステップS84において、ヒストグラム生成部75は、このようにして求められた比率重みwk、および距離重みwdを含む度数に基づいて、処理対象となるセル単位でヒストグラムを生成する。すなわち、ヒストグラムは、各画素の勾配方向を、所定数に分類し、分類される勾配方向毎の度数の和であり、例えば、以下の式(9)で示される。
【0090】
【数9】
【0091】
ここで、Fは、各セルのヒストグラムであり、fL1,fL2、・・・fLLは、各勾配方向LL毎の度数を示している。
【0092】
ステップS85において、ヒストグラム生成部75は、未処理のセルが存在するか否かを判定し、未処理のセルが存在する場合、処理は、ステップS82に戻る。すなわち、全てのセルについてヒストグラムが生成されるまで、ステップS82乃至S85の処理が繰り返される。そして、ステップS85において、全てのセルについてヒストグラムが求められ、未処理のセルが存在しないと判定された場合、処理は、ステップS86に進む。
【0093】
ステップS86において、正規化部76は、未処理のブロックを処理対象のブロックに設定する。すなわち、ブロックは、複数のセルからなる領域であり、例えば、図7の右上部のようにセルがM個×N個の領域である。
【0094】
ステップS87において、正規化部76は、求められたセル単位で求められたヒストグラムを各セルを中心として設定される処理対象のブロック単位で正規化し、ブロック単位で正規化されたヒストグラムによりHOG特徴量を生成し、認識処理部43に出力する。すなわち、セル単位で設定されるブロック単位のヒストグラムVは、以下の式(10)となる。
【0095】
【数10】
【0096】
正規化部76は、全てのセルに対して、セル単位で設定されるブロック内のヒストグラムVを、以下の式(11)を計算することにより正規化する。この結果、各セル毎に設定されるブロック単位の正規化結果がHOG特徴量として求められることになる。
【0097】
【数11】
【0098】
ここで、Vバーは、ブロック単位のヒストグラムVが正規化されたものを示している。また、εは、ブロック単位のヒストグラムVがゼロとなって発散しないようにさせるための定数である。
【0099】
ステップS88において、正規化部76は、未処理のブロックが存在するか否かを判定し、未処理のブロックが存在する場合、処理は、ステップS86に戻る。すなわち、全てのブロックに対して正規化処理がなされるまで、ステップS86乃至S88の処理が繰り返される。そして、ステップS88において、全てのブロックの正規化処理が終了し、未処理のブロックが存在しないと判定された場合、処理は、終了する。
【0100】
すなわち、画像内が前景領域と背景領域との2種類にしか設定されない場合、比率重みwkは、k=2であるときの処理となる。従って、前景領域および背景領域以外の領域を距離情報に基づいて設定し、k>2とするときも、距離が近い領域の比率が高いほど比率重みwkを大きくすると共に、距離が近い画素についての距離重みwdを大きくすることで、距離の遠い画素、すなわち、背景領域に属しているものとみなされる、認識処理に影響を及ぼす要素を排除することが可能となり、より高い精度で物体の種別を識別して認識することが可能となる。
【0101】
ここで、図2のフローチャートに戻る。
【0102】
ステップS18において、認識処理部43は、上述した処理により供給されてきた背景影響低減特徴量に基づいて、例えば、SVM(Support Vector Machine)、またはBoostingなどにより画像に含まれる物体の種別を識別して認識し、認識結果を出力する。
【0103】
以上の処理により、画像における背景領域に属する画素を、局所領域における前景領域と背景領域との比率に応じた強度で平滑化した上で、さらに、各画素について局所領域における前景領域と背景領域との比率に応じて設定される比率重みと、各画素の距離情報に基づいて設定される距離重みとを付して特徴量を抽出するようにした。この結果、物体の認識処理において、認識精度を低減させる背景領域の影響を低減させることが可能となり、物体の認識精度を向上させることが可能となる。
【0104】
<2.第2の実施の形態>
[その他の画像処理装置の構成例]
以上においては、画像加工処理、および特徴量抽出処理の両方の処理において、物体の認識精度を低下させる要因となる背景領域の画素による影響を低減させる例について説明してきたが、いずれの処理のみであっても効果を奏するものである。従って、図8で示される画像処理装置11のように、画像加工部51を削除するような構成としても、特徴量抽出処理により背景領域の画素による影響を低減させることが可能である。その場合、背景影響低減特徴量抽出処理は、図9で示されるように、ステップS101で示される特徴量抽出処理のみとなる。尚、特徴量抽出処理については、図6のフローチャートを参照して説明した処理と同様であるので、その説明は省略するものとする。
【0105】
<3.第3の実施の形態>
[さらにその他の画像処理装置の構成例]
また、図10で示される画像処理装置11のように、画像加工処理のみで物体の認識精度を低下させる要因となる背景領域の画素による影響を低減させるようにしてもよい。すなわち、図10における画像処理装置11においては、背景影響特徴量抽出部52における特徴量抽出部52より比率計算部72、比率重み計算部73、および距離重み計算部74が削除されている。この場合、特徴量抽出処理は、図11で示されるように、図6のステップS75乃至S77の比率重みおよび距離重みを設定する処理が含まれておらず、ステップS130において、比率重みおよび距離重みを考慮しない度数が設定される。尚、図11のフローチャートで示されるステップS121乃至S129,S131乃至S135の処理は、図6のステップS71乃至S74,S78乃至S82,S84乃至S88の処理と同様であるので、その説明は省略する。
【0106】
以上によれば、画像に含まれる被写体たる物体の種別を認識する認識処理における認識精度を低減させる要因となる背景領域の要素を排除して特徴量を抽出できるようにしたので、画像に含まれる被写体たる物体の種別を認識する認識精度を向上させることが可能となる。
【0107】
ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
【0108】
図12は、汎用のパーソナルコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)1001を内蔵している。CPU1001にはバス1004を介して、入出力インタ-フェイス1005が接続されている。バス1004には、ROM(Read Only Memory)1002およびRAM(Random Access Memory)1003が接続されている。
【0109】
入出力インタ-フェイス1005には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部1006、処理操作画面や処理結果の画像を表示デバイスに出力する出力部1007、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部1008、LAN(Local Area Network)アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部1009が接続されている。また、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどのリムーバブルメディア1011に対してデータを読み書きするドライブ1010が接続されている。
【0110】
CPU1001は、ROM1002に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディア1011から読み出されて記憶部1008にインストールされ、記憶部1008からRAM1003にロードされたプログラムに従って各種の処理を実行する。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0111】
尚、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理は、もちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理を含むものである。
【符号の説明】
【0112】
11 画像処理装置, 31 画像取得部, 32 距離検出部, 33 目標位置検出部, 34,35 拡大縮小部, 36 物体認識部, 41 領域分割部, 42 背景影響低減特徴量抽出部, 43 認識処理部, 51 画像加工部, 52 特徴量抽出部, 61 比率計算部, 62 比率強度計算部, 63 距離強度計算部, 64 平滑化部, 71 勾配計算部, 72 比率計算部, 73 比率重み計算部, 74 距離重み計算部, 75 ヒストグラム生成部, 76 正規化部
【技術分野】
【0001】
本発明は、画像処理装置および方法、並びにプログラムに関し、特に、画像内の被写体となる物体の種別の認識精度を向上させるようにした画像処理装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
従来において、物体認識技術として、認識対象を人の掌とし、グー、チョキ、またはパー等の手の形状を識別する技術がある。
【0003】
また、これらの物体認識技術の物体認識精度を向上させるために、画像と併せて、特定の条件や付加情報を利用する技術があり、その一例として、肌色情報を利用することで手の領域を取得し易くし、手の形状認識の精度向上を図るようにした技術が提案されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−148663号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1の技術においては、肌色情報を用いる為に、認識処理の精度が照明等の影響を受け易い。
【0006】
本発明はこのような状況に鑑みてなされたものであり、特に、様々な環境の下で撮像された画像に対しても画像内の被写体となる物体の種別を高精度で認識できるようにするものである。
【課題を解決するための手段】
【0007】
本発明の一側面の画像処理装置は、画像を取得する画像取得手段と、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段とを含む。
【0008】
前記背景影響低減特徴量抽出手段には、前記画像、および前記領域分割手段により分割された背景領域の情報に基づいて、前記画像のうち、前記背景領域に対応する画素を平滑化する平滑化手段を含ませるようにすることができ、前記平滑化手段により前記背景領域に対応する画素が平滑化された画像より、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出させるようにすることができる。
【0009】
前記平滑化手段には、前記領域分割手段により分割された背景領域の画素に対して、その近傍の画素の背景画素と前景画素との比率に応じた強度で画素を平滑化させるようにすることができる。
【0010】
背景影響低減特徴量抽出手段には、前記画像の特徴量を抽出する特徴量抽出手段と、前記画像、および距離情報、前記領域分割手段により分割された背景領域の情報に基づいて、重み設定し、前記特徴量に前記重みを付する重み設定手段とを含ませるようにすることができ、前記重み設定手段により設定された重みが付された特徴量を、前記背景による被写体の種別の認識に対する影響を低減する特徴量として抽出させるようにすることができる。
【0011】
前記特徴量抽出手段には、HOG特徴量を抽出させるようにすることができる。
【0012】
本発明の一側面の画像処理方法は、画像を取得する画像取得手段と、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段とを含む画像処理装置の画像処理方法であって、前記画像取得手段における、前記画像を取得する画像取得ステップと、前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップとを含む。
【0013】
本発明の一側面のプログラムは、画像を取得する画像取得手段と、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段とを含む画像処理装置を制御するコンピュータに、前記画像取得手段における、前記画像を取得する画像取得ステップと、前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップとを含む処理を実行させる。
【0014】
本発明の一側面においては、画像が取得され、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報が、前記画像の画素単位で取得され、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域が分割され、前記画像、前記距離情報、および分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響が低減される特徴量が抽出され、抽出された特徴量に基づいて、前記画像における前景となる被写体の種別が認識される。
【0015】
本発明の画像処理装置は、独立した装置であっても良いし、画像処理を行うブロックであっても良い。
【発明の効果】
【0016】
本発明の一側面によれば、様々な環境下で撮像された画像に含まれる被写体である物体の種別の識別精度を向上させることが可能となる。
【図面の簡単な説明】
【0017】
【図1】本発明を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。
【図2】図1の画像処理装置による物体認識処理を説明するフローチャートである。
【図3】図1の画像処理装置による物体認識処理を説明する図である。
【図4】図1の画像処理装置による背景影響低減特徴量抽出処理を説明するフローチャートである。
【図5】図1の画像処理装置による画像加工処理を説明するフローチャートである。
【図6】図1の画像処理装置による特徴量抽出処理を説明するフローチャートである。
【図7】特徴量抽出処理を説明する図である。
【図8】本発明を適用した画像処理装置のその他の実施の形態の構成例を示すブロック図である。
【図9】図8の画像処理装置による背景影響低減特徴量抽出処理を説明するフローチャートである。
【図10】本発明を適用した画像処理装置のさらにその他の実施の形態の構成例を示すブロック図である。
【図11】図10の画像処理装置による特徴量抽出処理を説明するフローチャートである。
【図12】汎用のパーソナルコンピュータの構成例を説明する図である。
【発明を実施するための最良の形態】
【0018】
以下、発明を実施するための最良の形態(以下実施の形態とする)について説明する。尚、説明は以下の順序で行う。
1.第1の実施の形態(画像加工処理と特徴量抽出処理とで認識精度低下を低減する例)
2.第2の実施の形態(特徴量抽出処理のみで認識精度低下を低減する例)
3.第3の実施の形態(画像加工処理のみで認識精度低下を低減する例)
【0019】
<1.第1の実施の形態>
[画像処理装置の構成例]
図1は、本発明を適用した画像処理装置のハードウェアの一実施の形態の構成例を示している。図1の画像処理装置11は、様々な環境下で撮像された画像に含まれる被写体である物体の種別を認識するものである。
【0020】
画像処理装置11は、画像取得部31、距離検出部32、目標位置検出部33、拡大縮小部34,35、および物体認識部36を備えている。
【0021】
画像取得部31は、CCD(Charge Coupled Devices)やCMOS(Complementary Metal Oxide Semiconductor)などからなる撮像素子によりリアルタイムに複数の画像をステレオ画像のように撮像して、距離検出部32、および目標位置検出部33に供給する。また、画像取得部31は、リアルタイムに撮像されているステレオ画像に代えて、予め撮像された少なくとも1枚の画像を取得するようにしてもよく、この場合、取得した画像を目標位置検出部33にのみ供給する。
【0022】
距離検出部32は、画像取得部31によりステレオ画像などの複数の画像がリアルタイムに撮像される場合、撮像された画像間の対応点探索処理により対応点における視差を求める。そして、距離検出部32は、求められた対応点における視差により撮像された画像に含まれる被写体の画素単位での画像取得部31から被写体までの距離を求めて、距離情報として目標位置検出部33、および拡大縮小部35に供給する。また、距離検出部32は、画像取得部31よりリアルタイムでステレオ画像などが取得できず、予め撮像された画像が供給される場合、画像を用いた手法とは異なる、例えば、TOF(Time of Flight)法などにより撮像時における被写体までの距離を検出し、距離情報として目標位置検出部33、および拡大縮小部35に供給する。さらに、距離検出部32は、画像取得部31により取得された画像が撮像されるタイミングにおいて、例えば、測距センサなどにより検出された画像内の被写体までの撮像位置からの距離の情報を距離情報として取得して、目標位置検出部33、および拡大縮小部35に供給する。
【0023】
目標位置検出部33は、画像取得部31より供給されてくる画像、および、距離検出部32により供給されてくる距離情報に基づいて、画像内に存在する目標位置を検出し、目標位置の情報に基づいて画像内の必要領域を切り出して拡大縮小部34に供給する。ここで、目標とは、認識すべき対象となる被写体としての物体であり、目標位置とは、3次元座標空間における目標である被写体の位置を示す座標である。目標位置検出部33は、例えば、画像取得部31が撮像素子である場合、その撮像素子や測距センサから最も近い領域(若しくは点)、または、所定の距離の条件を満たす領域を、逐次モンテカルロ法等の任意の確率モデルを用いた推定等により目標位置として求める。尚、目標位置検出部33は、画像取得部31により取得された画像のうち、必要とされる領域を求めて、求められたその領域を切り出すものであるが、処理領域を特定することが目的であるため、必ずしも必要ではない。特に、取得される画像の被写体の領域が所定領域より大きいことが想定されているような場合などには、その処理は必ずしも必要ではないので、目標位置検出部33は、構成として省略するようにしてもよいものである。
【0024】
拡大縮小部34,35は、画像、および距離情報を処理の必要に応じてサイズを拡大、または縮小して物体認識部36に供給する。より詳細には、拡大縮小部34,35は、ニアレストネイバー法、バイリニア法、バイキュービック法、またはLanczosフィルタ等により画像、および距離情報を拡大、または縮小する。尚、サイズの拡大、または縮小は、必要に応じてなされる処理であるため、拡大縮小部34,35は、拡大または縮小せずにそのままのサイズで出力するようにしてもよい。
【0025】
物体認識部36は、拡大縮小部34より供給されてくる画像と、拡大縮小部35より供給されてくる距離情報とに基づいて、画像内の被写体である物体の種別を識別して認識し、認識結果として出力する。より詳細には、物体認識部36は、領域分割部41、背景影響低減特徴量抽出部42、および認識処理部43を備えている。
【0026】
領域分割部41は、拡大縮小部35より供給されてくる距離情報に基づいて、拡大縮小部34より供給されてくる画像を、前景領域、および背景領域に分割し、領域分割情報として背景影響低減特徴量抽出部42に供給する。より具体的には、領域分割部41は、例えば、距離情報に含まれる全画素の距離の中央値を求め、中央値よりも近い距離となる画素を前景領域とし、遠い距離となる画素を背景領域とする。ただし、前景領域および背景領域の分割は、これ以外の手法であっても良く、例えば、所定の距離より近い画素を前景領域とし、これより遠い画素を背景領域としてもよいし、画像セグメンテーション等の任意のオブジェクト抽出と距離を併せて、例えば、所定のオブジェクトの距離よりも近い距離の画素を前景領域とし、それ以外を背景領域とするようにしてもよい。また、領域分割情報は、各画素が、分割されたそれぞれ前景領域または背景領域のいずれに属するのかを示すフラグ情報となる。従って、画像の全領域が前景領域と背景領域の2つの領域に分割される場合、領域分割情報は、前景領域を示すフラグと背景領域を示すフラグで構成される情報となる。さらに、領域分割部41は、前景領域および背景領域以外に距離に応じた更に多くの領域に分割するようにしてもよく、この場合、領域分割情報は、距離に応じて分割される領域を示すフラグで構成される情報となる。
【0027】
背景影響低減特徴量抽出部42は、拡大縮小部34より供給される画像、拡大縮小部35より供給される距離情報、および領域分割部41より供給される領域分割情報に基づいて、背景領域の影響により前景領域である物体の種別の認識低下を低減させるための特徴量を抽出して認識処理部43に出力する。より詳細には、背景影響低減特徴量抽出部42は、画像加工部51、および特徴量抽出部52を備えている。
【0028】
画像加工部51は、領域分割情報、および距離情報に基づいて、画像のうち、背景領域に属する画素に対して平滑化処理を施す。より詳細には、画像加工部51は、比率計算部61、比率強度計算部62、距離強度計算部63、および平滑化部64を備えている。比率計算部61は、背景領域に属する画素のそれぞれに対応付けて局所領域を設定し、局所領域に属する画素の背景領域に属する画素の割合を比率として求める。比率強度計算部62は、平滑化部64における平滑化の強度を比率計算部61により求められた比率に基づいて比率強度として計算する。距離強度計算部63は、距離情報に基づいて、平滑化部64における平滑化の強度を距離強度として計算する。平滑化部64は、比率強度、および距離強度に対応した強度で、背景領域に属する画素を平滑化する。
【0029】
特徴量抽出部52は、領域分割情報および距離情報に基づいて、画像加工部51により背景領域が平滑化された画像より、認識処理に必要となる特徴量としてHOG(Histogram of Oriented Gradients)特徴量を抽出する。より詳細には、特徴量抽出部52は、勾配計算部71、比率計算部72、比率重み計算部73、距離重み計算部74、ヒストグラム生成部75、および正規化部76を備えている。勾配計算部71は、画像加工部51より供給されてくる画像における各画素について勾配の大きさと方向を求める。比率計算部72は、比率計算部61と同様に、各画素のそれぞれに対応付けて局所領域を設定し、局所領域に属する画素の背景領域に属する画素の割合を比率として求める。比率重み計算部73は、比率計算部72により計算された比率に基づいて、各画素の勾配の大きさに付加する比率重みを設定する。距離重み計算部74は、距離情報に基づいて、各画素の距離に応じて、各画素の勾配の大きさに付加する距離重みを設定する。ヒストグラム生成部75は、複数の画素からなるセル単位で勾配の方向別に、勾配の大きさに比率重み、および距離重みを付加して度数を求め、求められた度数に基づいてヒストグラムを生成する。正規化部76は、複数のセルからなるブロック単位で、生成されたヒストグラムを正規化し、これをHOG特徴量として認識処理部43に供給する。尚、この例においては、特徴量としてHOG特徴量を抽出する例について説明しているが、物体の認識に利用できる特徴量であれば、これに限るものではなく、例えば、Haar-like特徴量、SIFT特徴量、またはGabor特徴量等などを利用するようにしても良い。
【0030】
認識処理部43は、背景影響低減特徴量抽出部42より供給されてくる背景影響低減特徴量に基づいて、例えば、SVM(Support Vector Machine)、またはBoostingなどにより物体の種別を識別する認識処理を実行し、認識結果を出力する。
【0031】
[物体認識処理]
次に、図2のフローチャートを参照して、物体認識処理について説明する。
【0032】
ステップS11において、画像取得部31は、被写体となる物体を含む画像を取得して、距離検出部32、および目標位置検出部33に供給する。
【0033】
ステップS12において、距離検出部32は、画像取得部31により取得された画像に含まれる被写体としての物体のそれぞれに対応する画素単位の距離の情報を検出し、目標位置検出部33、および拡大縮小部35に供給する。より詳細には、例えば、画像取得部31が撮像素子を備えており、リアルタイムにステレオ画像などの複数のアングルから同一の被写体を捉えるように撮像する場合、距離検出部32は、複数の画像の対応点探索処理により、その視差を用いて各画素単位で距離を求め、距離情報として検出する。
【0034】
ステップS13において、目標位置検出部33は、画像取得部31より供給されてくる画像、および、距離検出部32により供給されてくる距離情報に基づいて、画像内に存在する目標位置を検出し、ステップS14において、目標位置の情報に基づいて画像内の必要領域を切り出して調整し、拡大縮小部34に供給する。
【0035】
ステップS15において、拡大縮小部34,35は、それぞれ目標位置検出部33により目標位置に基づいて調整された画像、および距離情報を処理に適当なサイズに拡大、または縮小し、物体認識部36に供給する。尚、拡大縮小部34,35より供給されてくるサイズが拡大、または縮小されている画像、および距離情報については、それぞれ処理に適当な領域についてサイズが調整されているのみであるので、以降においては、単に画像、および距離情報と称するものとする。
【0036】
ステップS16において、物体認識部36における領域分割部41は、距離情報に基づいて、画像を画素単位で前景領域、および背景領域に分割する。より詳細には、領域分割部41は、例えば、各画素について、距離情報に基づいて、所定の距離より近い距離の画素について前景領域に分類し、その他の画素を背景領域に分類することにより、前景領域と背景領域とに分割する。すなわち、例えば、図3の画像A1で示されるような画像が取得されると共に、図3の距離情報A2が検出される場合、図3の領域分割情報A3が求められる。ここで、画像A1は、掌からなる被写体となる物体Z1が背景Z2上に存在する画像である。また、距離情報A2は、掌の物体Z1の存在する領域全体が所定の距離を示す配色Z11で描かれ、背景Z2における空間内の各画素の距離が遠くなるにつれて黒くなるように配色Z12で示されている。さらに、領域分割情報A3は、掌の物体Z1の存在する領域より僅かに背後となる所定の距離より近い掌が白色の前景領域Z21として表示されており、それ以降については、背景領域Z22として示される灰色で示されている。結果として、掌の物体Z1に対応する領域が前景領域Z21として分割され、それ以外が背景領域Z22に分割されている。
【0037】
ステップS17において、背景影響低減特徴量抽出部42は、背景影響低減特徴量抽出処理を実行し、距離情報、および領域分割情報に基づいて、画像より背景影響低減特徴量を抽出する。
【0038】
[背景影響低減特徴量抽出処理]
ここで、図4のフローチャートを参照して、背景影響低減特徴量抽出処理について説明する。背景影響低減特徴量抽出処理は、画像加工部51においてステップS31で実行される画像加工処理と、特徴量抽出部52において、ステップS32で実行される特徴量抽出処理とから構成される。
【0039】
[画像加工処理]
ここで、図5のフローチャートを参照して、画像加工処理について説明する。
【0040】
ステップS51において、画像加工部51は、画像を構成する垂直方向の座標、すなわちy座標のカウンタyを0に初期化する。
【0041】
ステップS52において、画像加工部51は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを0に初期化する。
【0042】
ステップS53において、画像加工部51は、距離情報に基づいて、画像上の処理対象である画素I(x,y)が背景領域であるか否かを判定し、例えば、背景領域を示すフラグである場合、処理は、ステップS54に進む。
【0043】
ステップS54において、画像加工部51は、比率計算部61を制御して、画素I(x,y)に対応する局所領域を設定する。すなわち、比率制御部61は、例えば、処理対象である画素I(x,y)を中心とした6画素×6画素の方形領域を局所領域に設定する。
【0044】
ステップS55において、比率計算部61は、局所領域に属する各画素の前景領域に属する画素数と、背景領域に属する画素数との比率qを計算する。
【0045】
ステップS56において、画像加工部51は、比率強度計算部62を制御して、処理対象となる画素I(x,y)の平滑化の比率qに基づいた比率強度St_qを計算する。すなわち、例えば、比率qが前景領域の割合が高いことを示している場合、処理対象となる画素I(x,y)の周辺には、物体の認識処理に影響を及ぼす背景領域の画素が少ないと考えられるため、比率強度計算部62は、比率強度St_qを弱くするように計算する。一方、比率qが背景領域の割合が高いことを示している場合、処理対象となる画素I(x,y)の周辺には、物体の認識処理に影響を及ぼす背景領域の画素が多いと考えられるため、比率強度計算部62は、比率強度St_qを強くするように計算する。
【0046】
ステップS57において、画像加工部51は、距離強度計算部63を制御して、処理対象となる画素I(x,y)の平滑化の距離情報の距離に基づいた距離強度kkを計算する。すなわち、処理対象である画素I(x,y)の距離が遠いほど背景領域であると考えられるので、距離強度計算部63は、距離強度St_dを強くするように計算し、逆に、距離が近いほど、距離強度St_dを弱くして平滑化する。
【0047】
ステップS58において、画像加工部51は、平滑化部64を制御して、比率強度St_qおよび距離強度St_dに対応した強度で、処理対象である画素I(x,y)を平滑化する。このように、平滑化の強度は、比率qと距離に依存することとなるため、例えば、平滑化部64は、比率強度St_qおよび距離強度St_dの乗算結果St_q×St_dに基づいて、平滑化の強度を設定するようにしてもよい。
【0048】
一方、ステップS53において、処理対象となる画素I(x,y)が背景領域のフラグではないと判定された場合、ステップS54乃至S58の処理はスキップされる。
【0049】
例えば、処理対象の画素I(x,y)が、図3の分割領域情報A4における画素B1である場合、画素B1は、前景領域に属するため、ステップS53において、処理対象となる画素が背景領域のフラグではないと判定されて、ステップS54乃至S58の処理がスキップされる。
【0050】
一方、例えば、処理対象の画素I(x,y)が、図3の分割領域情報A4における画素B2またはB3である場合、画素B2,B3は、背景領域に属すので、局所領域Z102,Z103における背景領域の割合に基づいて、それぞれが平滑化される。すなわち、局所領域Z103は、全てが背景領域であるが、局所領域Z102は、一部のみが背景領域である。このため、画素B3は、画素B2よりも、より強い強度で平滑化されることになる。
【0051】
ステップS59において、画像加工部51は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0052】
ステップS60において、画像加工部51は、カウンタxが画像の水平方向のサイズSxよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS53に戻る。すなわち、カウンタxが水平方向のサイズSxよりも小さくなるまで、ステップS53乃至S60の処理が繰り返される。そして、ステップS60において、カウンタxが水平方向のサイズSxよりも小さいと判定された場合、処理は、ステップS61に進む。
【0053】
ステップS61において、画像加工部51は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0054】
ステップS62において、画像加工部51は、カウンタyが画像の垂直方向のサイズSyよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS52に戻る。すなわち、カウンタyが垂直方向のサイズSyよりも小さくなるまで、ステップS52乃至S62の処理が繰り返される。そして、ステップS62において、カウンタyが垂直方向のサイズSyよりも小さいと判定された場合、処理は、終了する。
【0055】
すなわち、領域分割情報に基づいて、背景領域に対応する画素については、局所領域における背景領域と前景領域との比率、および距離情報の距離に対応した強度で平滑化される。この結果、物体の種別の認識に影響を与える背景領域の画素による影響が低減されることになり、後段において、認識処理に影響を与える背景領域の画素の影響が低減された画像から特徴量が抽出されることになるので、物体の種別の認識処理における認識率を向上させることが可能となる。尚、平滑化の強度については、比率のみで制御するようにしても、距離のみで制御するようにしても、背景領域による認識処理の認識精度の低減を抑制する効果を奏する事ができるので、いずれかのみで平滑化の強度を制御するようにしても良い。
【0056】
[特徴量抽出処理]
次に、図6のフローチャートを参照して、特徴量抽出処理について説明する。
【0057】
ステップS71において、特徴量抽出部52は、画像を構成する垂直方向の座標、すなわちy座標のカウンタyを0に初期化する。
【0058】
ステップS72において、特徴量抽出部52は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを0に初期化する。
【0059】
ステップS73において、特徴量抽出部52は、勾配計算部71を制御して、処理対象となる画素I(x,y)について勾配の角度および大きさを計算させる。より詳細には、例えば、処理対象画素I(x,y)が、図7の画素C1である場合、勾配計算部71は、その垂直方向131に隣接する画素I(x,y+1),I(x,y−1)および水平方向132に隣接する画素I(x+1,y),I(x−1,y)を用いて、以下の式(1)を計算することにより勾配を求める。尚、図7の左上部においては、処理対象となる画素I(x,y)の勾配の配置が示されており、図7の中央上部にいては、処理対象画素C1である画素121を含むm画素×n画素からなるセル102の構成例が示されている。さらに、図7の右上部においては、セル102に対応するセル111がM個×N個からなるブロック101の構成例が示されており、下部には、セル102を構成する各画素の勾配の方向L1乃至LL毎の度数からなるヒストグラム103の例が示されている。
【0060】
【数1】
【0061】
ここで、gx(x,y),gy(x,y)は、それぞれ水平方向の勾配、および垂直方向の勾配である。
【0062】
そして、勾配計算部71は、以下の式(2),式(3)を計算することにより、それぞれ勾配の大きさ、および角度を計算する。
【0063】
【数2】
【数3】
【0064】
ここr(x,y)は、勾配の大きさであり、θ(x,y)は、勾配の角度を示している。
【0065】
ステップS74において、特徴量抽出部52は、比率計算部72を制御して、画像上の処理対象である画素I(x,y)に対応する局所領域を設定する。すなわち、ステップS74の処理により、比率計算部72は、例えば、処理対象である画素I(x,y)を中心とした近傍のu画素×v画素の方形領域を局所領域に設定する。
【0066】
ステップS75において、比率計算部72は、局所領域に属する各画素の前景領域に属する画素数と、背景領域に属する画素数との比率qを計算する。
【0067】
ステップS76において、特徴量抽出部52は、比率重み計算部73を制御して、比率qに基づいて比率重みwkを計算させる。
【0068】
ステップS77において、特徴量抽出部52は、距離重み計算部74を制御して、距離情報における処理対象となる画素I(x,y)の距離に基づいて、距離重みwdを計算させる。
【0069】
ステップS78において、特徴量抽出部52は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0070】
ステップS79において、特徴量抽出部52は、カウンタxが画像の水平方向のサイズSxよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS73に戻る。すなわち、カウンタxが水平方向のサイズSxよりも小さくなるまで、ステップS73乃至S79の処理が繰り返される。そして、ステップS79において、カウンタxが水平方向のサイズSxよりも小さいと判定された場合、処理は、ステップS80に進む。
【0071】
ステップS80において、特徴量抽出部52は、画像を構成する水平方向の座標、すなわちx座標のカウンタxを1インクリメントする。
【0072】
ステップS81において、特徴量抽出部52は、カウンタyが画像の垂直方向のサイズSyよりも小さいか否かを判定し、小さいと判定した場合、処理は、ステップS72に戻る。すなわち、カウンタyが垂直方向のサイズSyよりも小さくなるまで、ステップS72乃至S81の処理が繰り返される。そして、ステップS81において、カウンタyが垂直方向のサイズSyよりも小さいと判定された場合、処理は、ステップS82に進む。
【0073】
ステップS82において、ヒストグラム生成部75は、未処理のセルを処理対象のセルに設定する。すなわち、図7の中央上部で示されるように、複数の画素群からなるセルを画像内に設定し、そのうち、未処理のセルを処理対象のセルに設定する。尚、図7の中央上部においては、m画素×n画素のセル102が設定される例が示されている。
【0074】
ステップS83において、ヒストグラム生成部75は、処理対象となるセルにおける勾配の方向毎の比率重みwk、および距離重みwdを含めた度数を設定する。すなわち、HOG特徴量は、図7の中央上部で示されるセル102の各画素について勾配方向を方向L1乃至LLに分けて、各画素の勾配方向に属する度数から求められるヒストグラムに基づくものである。
【0075】
すなわち、ヒストグラム生成部75は、以下の式(4)で示されるように、各画素の勾配方向Llの度数fl’を設定する。
【0076】
【数4】
【0077】
ここで、fl’は、方向Llの度数であり、wkは、ステップS76の処理で求められた各画素の局所領域における前景領域と背景領域との比率に基づいた比率重みである。また、wdは、ステップS77の処理で求められた各画素の距離情報の距離に応じて設定される距離重みであり、rl(x,y)は、勾配の大きさである。
【0078】
すなわち、比率重みwkは、以下の式(5)で設定される前景領域と背景領域との比率bに基づいて設定されている。
【0079】
【数5】
【0080】
ここで、δ(D)は、以下の式(6)で設定される領域分割情報D(x,y)を一般化した関数である。また、u,vは、局所領域がu画素×v画素の領域であることを示している。
【0081】
【数6】
【0082】
ここで、すなわち、関数δ(D)は、前景領域では1であり、背景領域では0となる関数である。
【0083】
例えば、比率重みwkをk段階設定する場合、比率重み計算部73は、これらの条件に基づいて、例えば、以下の式(7)で示されるように重みを含めた度数を設定する。
【0084】
【数7】
【0085】
ここで、th1,th2,・・・,thkは、k段階の重みを設定するための閾値であり、比率重みwk、および閾値thkは、以下の式(8)で示される関係となる。
【0086】
【数8】
【0087】
すなわち、比率bが大きくなるに連れて、比率重みwkも大きくなり、すなわち、前景領域の比率が大きいほど、比率重みwkは、大きく設定されて、逆に、前景領域の比率が小さいほど、比率重みwkは小さく設定される。このため、物体の識別に影響を及ぼす背景領域の画素によるヒストグラムの度数が軽減されるように比率重みwkが設定されるので、特徴量より背景領域の画素による影響を排除し、認識精度を向上させることが可能となる。
【0088】
同様に、距離重みwdは、各画素について、距離情報に応じて、距離が大きいほど小さく設定され、逆に、距離が小さいほど大きく設定される。このため、やはり、物体の識別に影響を及ぼす背景領域の画素によるヒストグラムの度数が軽減されるように距離重みwdが設定されるので、特徴量より背景領域の画素による影響を排除し、認識精度を向上させることが可能となる。
【0089】
ステップS84において、ヒストグラム生成部75は、このようにして求められた比率重みwk、および距離重みwdを含む度数に基づいて、処理対象となるセル単位でヒストグラムを生成する。すなわち、ヒストグラムは、各画素の勾配方向を、所定数に分類し、分類される勾配方向毎の度数の和であり、例えば、以下の式(9)で示される。
【0090】
【数9】
【0091】
ここで、Fは、各セルのヒストグラムであり、fL1,fL2、・・・fLLは、各勾配方向LL毎の度数を示している。
【0092】
ステップS85において、ヒストグラム生成部75は、未処理のセルが存在するか否かを判定し、未処理のセルが存在する場合、処理は、ステップS82に戻る。すなわち、全てのセルについてヒストグラムが生成されるまで、ステップS82乃至S85の処理が繰り返される。そして、ステップS85において、全てのセルについてヒストグラムが求められ、未処理のセルが存在しないと判定された場合、処理は、ステップS86に進む。
【0093】
ステップS86において、正規化部76は、未処理のブロックを処理対象のブロックに設定する。すなわち、ブロックは、複数のセルからなる領域であり、例えば、図7の右上部のようにセルがM個×N個の領域である。
【0094】
ステップS87において、正規化部76は、求められたセル単位で求められたヒストグラムを各セルを中心として設定される処理対象のブロック単位で正規化し、ブロック単位で正規化されたヒストグラムによりHOG特徴量を生成し、認識処理部43に出力する。すなわち、セル単位で設定されるブロック単位のヒストグラムVは、以下の式(10)となる。
【0095】
【数10】
【0096】
正規化部76は、全てのセルに対して、セル単位で設定されるブロック内のヒストグラムVを、以下の式(11)を計算することにより正規化する。この結果、各セル毎に設定されるブロック単位の正規化結果がHOG特徴量として求められることになる。
【0097】
【数11】
【0098】
ここで、Vバーは、ブロック単位のヒストグラムVが正規化されたものを示している。また、εは、ブロック単位のヒストグラムVがゼロとなって発散しないようにさせるための定数である。
【0099】
ステップS88において、正規化部76は、未処理のブロックが存在するか否かを判定し、未処理のブロックが存在する場合、処理は、ステップS86に戻る。すなわち、全てのブロックに対して正規化処理がなされるまで、ステップS86乃至S88の処理が繰り返される。そして、ステップS88において、全てのブロックの正規化処理が終了し、未処理のブロックが存在しないと判定された場合、処理は、終了する。
【0100】
すなわち、画像内が前景領域と背景領域との2種類にしか設定されない場合、比率重みwkは、k=2であるときの処理となる。従って、前景領域および背景領域以外の領域を距離情報に基づいて設定し、k>2とするときも、距離が近い領域の比率が高いほど比率重みwkを大きくすると共に、距離が近い画素についての距離重みwdを大きくすることで、距離の遠い画素、すなわち、背景領域に属しているものとみなされる、認識処理に影響を及ぼす要素を排除することが可能となり、より高い精度で物体の種別を識別して認識することが可能となる。
【0101】
ここで、図2のフローチャートに戻る。
【0102】
ステップS18において、認識処理部43は、上述した処理により供給されてきた背景影響低減特徴量に基づいて、例えば、SVM(Support Vector Machine)、またはBoostingなどにより画像に含まれる物体の種別を識別して認識し、認識結果を出力する。
【0103】
以上の処理により、画像における背景領域に属する画素を、局所領域における前景領域と背景領域との比率に応じた強度で平滑化した上で、さらに、各画素について局所領域における前景領域と背景領域との比率に応じて設定される比率重みと、各画素の距離情報に基づいて設定される距離重みとを付して特徴量を抽出するようにした。この結果、物体の認識処理において、認識精度を低減させる背景領域の影響を低減させることが可能となり、物体の認識精度を向上させることが可能となる。
【0104】
<2.第2の実施の形態>
[その他の画像処理装置の構成例]
以上においては、画像加工処理、および特徴量抽出処理の両方の処理において、物体の認識精度を低下させる要因となる背景領域の画素による影響を低減させる例について説明してきたが、いずれの処理のみであっても効果を奏するものである。従って、図8で示される画像処理装置11のように、画像加工部51を削除するような構成としても、特徴量抽出処理により背景領域の画素による影響を低減させることが可能である。その場合、背景影響低減特徴量抽出処理は、図9で示されるように、ステップS101で示される特徴量抽出処理のみとなる。尚、特徴量抽出処理については、図6のフローチャートを参照して説明した処理と同様であるので、その説明は省略するものとする。
【0105】
<3.第3の実施の形態>
[さらにその他の画像処理装置の構成例]
また、図10で示される画像処理装置11のように、画像加工処理のみで物体の認識精度を低下させる要因となる背景領域の画素による影響を低減させるようにしてもよい。すなわち、図10における画像処理装置11においては、背景影響特徴量抽出部52における特徴量抽出部52より比率計算部72、比率重み計算部73、および距離重み計算部74が削除されている。この場合、特徴量抽出処理は、図11で示されるように、図6のステップS75乃至S77の比率重みおよび距離重みを設定する処理が含まれておらず、ステップS130において、比率重みおよび距離重みを考慮しない度数が設定される。尚、図11のフローチャートで示されるステップS121乃至S129,S131乃至S135の処理は、図6のステップS71乃至S74,S78乃至S82,S84乃至S88の処理と同様であるので、その説明は省略する。
【0106】
以上によれば、画像に含まれる被写体たる物体の種別を認識する認識処理における認識精度を低減させる要因となる背景領域の要素を排除して特徴量を抽出できるようにしたので、画像に含まれる被写体たる物体の種別を認識する認識精度を向上させることが可能となる。
【0107】
ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
【0108】
図12は、汎用のパーソナルコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)1001を内蔵している。CPU1001にはバス1004を介して、入出力インタ-フェイス1005が接続されている。バス1004には、ROM(Read Only Memory)1002およびRAM(Random Access Memory)1003が接続されている。
【0109】
入出力インタ-フェイス1005には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部1006、処理操作画面や処理結果の画像を表示デバイスに出力する出力部1007、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部1008、LAN(Local Area Network)アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部1009が接続されている。また、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどのリムーバブルメディア1011に対してデータを読み書きするドライブ1010が接続されている。
【0110】
CPU1001は、ROM1002に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディア1011から読み出されて記憶部1008にインストールされ、記憶部1008からRAM1003にロードされたプログラムに従って各種の処理を実行する。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0111】
尚、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理は、もちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理を含むものである。
【符号の説明】
【0112】
11 画像処理装置, 31 画像取得部, 32 距離検出部, 33 目標位置検出部, 34,35 拡大縮小部, 36 物体認識部, 41 領域分割部, 42 背景影響低減特徴量抽出部, 43 認識処理部, 51 画像加工部, 52 特徴量抽出部, 61 比率計算部, 62 比率強度計算部, 63 距離強度計算部, 64 平滑化部, 71 勾配計算部, 72 比率計算部, 73 比率重み計算部, 74 距離重み計算部, 75 ヒストグラム生成部, 76 正規化部
【特許請求の範囲】
【請求項1】
画像を取得する画像取得手段と、
前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、
前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、
前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、
前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段と
を含む画像処理装置。
【請求項2】
前記背景影響低減特徴量抽出手段は、
前記画像、および前記領域分割手段により分割された背景領域の情報に基づいて、前記画像のうち、前記背景領域に対応する画素を平滑化する平滑化手段を含み、
前記平滑化手段により前記背景領域に対応する画素が平滑化された画像より、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する
請求項1に記載の画像処理装置。
【請求項3】
前記平滑化手段は、前記領域分割手段により分割された背景領域の画素に対して、その近傍の画素の背景画素と前景画素との比率に応じた強度で画素を平滑化する
請求項2に記載の画像処理装置。
【請求項4】
背景影響低減特徴量抽出手段は、
前記画像の特徴量を抽出する特徴量抽出手段と、
前記画像、および距離情報、前記領域分割手段により分割された背景領域の情報に基づいて、重み設定し、前記特徴量に前記重みを付する重み設定手段とを含み、
前記重み設定手段により設定された重みが付された特徴量を、前記背景による被写体の種別の認識に対する影響を低減する特徴量として抽出する
請求項1に記載の画像処理装置。
【請求項5】
前記特徴量抽出手段は、HOG特徴量を抽出する
請求項1に記載の画像処理装置。
【請求項6】
画像を取得する画像取得手段と、
前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、
前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、
前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、
前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段と
を含む画像処理装置の画像処理方法は、
前記画像取得手段における、前記画像を取得する画像取得ステップと、
前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、
前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、
前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、
前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップと
を含む画像処理方法。
【請求項7】
画像を取得する画像取得手段と、
前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、
前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、
前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、
前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段と
を含む画像処理装置を制御するコンピュータに、
前記画像取得手段における、前記画像を取得する画像取得ステップと、
前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、
前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、
前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、
前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップと
を含む処理を実行させるプログラム。
【請求項1】
画像を取得する画像取得手段と、
前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、
前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、
前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、
前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段と
を含む画像処理装置。
【請求項2】
前記背景影響低減特徴量抽出手段は、
前記画像、および前記領域分割手段により分割された背景領域の情報に基づいて、前記画像のうち、前記背景領域に対応する画素を平滑化する平滑化手段を含み、
前記平滑化手段により前記背景領域に対応する画素が平滑化された画像より、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する
請求項1に記載の画像処理装置。
【請求項3】
前記平滑化手段は、前記領域分割手段により分割された背景領域の画素に対して、その近傍の画素の背景画素と前景画素との比率に応じた強度で画素を平滑化する
請求項2に記載の画像処理装置。
【請求項4】
背景影響低減特徴量抽出手段は、
前記画像の特徴量を抽出する特徴量抽出手段と、
前記画像、および距離情報、前記領域分割手段により分割された背景領域の情報に基づいて、重み設定し、前記特徴量に前記重みを付する重み設定手段とを含み、
前記重み設定手段により設定された重みが付された特徴量を、前記背景による被写体の種別の認識に対する影響を低減する特徴量として抽出する
請求項1に記載の画像処理装置。
【請求項5】
前記特徴量抽出手段は、HOG特徴量を抽出する
請求項1に記載の画像処理装置。
【請求項6】
画像を取得する画像取得手段と、
前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、
前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、
前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、
前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段と
を含む画像処理装置の画像処理方法は、
前記画像取得手段における、前記画像を取得する画像取得ステップと、
前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、
前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、
前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、
前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップと
を含む画像処理方法。
【請求項7】
画像を取得する画像取得手段と、
前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得手段と、
前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割手段と、
前記画像、前記距離情報、および前記領域分割手段により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出手段と、
前記背景影響低減特徴量抽出手段により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識手段と
を含む画像処理装置を制御するコンピュータに、
前記画像取得手段における、前記画像を取得する画像取得ステップと、
前記距離取得手段における、前記画像内に撮像されている被写体の、前記画像の撮像時の撮像機器からの距離の情報を、前記画像の画素単位で取得する距離取得ステップと、
前記領域分割手段における、前記画像、および前記距離情報に基づいて、前記画像における被写体となる前景領域と、それ以外の背景領域とに領域を分割する領域分割ステップと、
前記背景影響低減特徴量抽出手段における、前記画像、前記距離情報、および前記領域分割ステップの処理により分割された背景領域の情報の全て、またはそのいずれかに基づいて、前記背景による被写体の種別の認識に対する影響を低減する特徴量を抽出する背景影響低減特徴量抽出ステップと、
前記認識手段における、前記背景影響低減特徴量抽出ステップの処理により抽出された特徴量に基づいて、前記画像における前景となる被写体の種別を認識する認識ステップと
を含む処理を実行させるプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−253354(P2011−253354A)
【公開日】平成23年12月15日(2011.12.15)
【国際特許分類】
【出願番号】特願2010−126779(P2010−126779)
【出願日】平成22年6月2日(2010.6.2)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成23年12月15日(2011.12.15)
【国際特許分類】
【出願日】平成22年6月2日(2010.6.2)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]