説明

被写体検出装置、被写体検出方法及びプログラム

【課題】背景を含む画像から被写体の頭部領域を高精度に検出できるようにする。
【解決手段】検出したエッジ画素に基づいて、ハフ変換を用いて直線を表すパラメータρ、θを検出し、直線パラメータρ、θに基づいて、検出された複数のエッジ画素を含むように所定の幅wの直線領域を検出する。次に、全ての直線領域以外におけるエッジ画素の中から、直線領域と連結する連結エッジ画素を抽出し、注目する直線領域と連結する連結エッジ画素との交点の間の注目する直線領域内のエッジ画素を関連エッジ画素とする。そして、関連エッジ画素以外の直線領域上のエッジ画素を削除する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特に、背景を含む画像から被写体を検出するために用いて好適な被写体検出装置、被写体検出方法及びプログラムに関する。
【背景技術】
【0002】
近年、カメラなどの撮影装置から撮影された映像に指定された人物の位置を特定して追尾することにより、カメラのフォーカス、露出及びカメラのパン、チルト、ズームなどの姿勢を自動的に制御する機能が注目されている。
【0003】
人物の位置を特定するためには、人物の顔パターンを検出してその動きを追尾することが一般的である。このように画像から顔を検出する技術としては、非特許文献1に各種方式が挙げられている。特に、非特許文献2に記載された手法は、実行速度及び検出率の高さから、顔検出研究において広く使用されている。
【0004】
一方、人物の位置を特定する場合、人物の顔パターンを検出して追尾するだけでは十分ではない。例えば、人物顔の横回転や後ろ反転などにより、顔パターンを検出できない場合がある。そこで、顔の代わりに頭部領域を検出して追尾することは有力な代替手段でもある。
【0005】
頭部領域を検出する手法としては、非特許文献3に開示されているHough変換を用い楕円形状を検出する手法が古くから知られている。そして、非特許文献4には、ランダンムの3点エッジ座標データから楕円のパラメータを推定して投票する方法も開示されている。さらに、非特許文献5には、楕円円周上の勾配情報と、事前に取った頭部カラーヒストグラムモデルと楕円内部のカラーヒストグラムとのマッチングにより頭部の楕円形状を検出する方法も開示されている。なお、頭部領域は楕円で近似することを前提とし、頭部領域は頭部楕円領域または頭部楕円の外接矩形領域とする。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】M.H.Yang, D.J.Kriegman and N.Ahuja. "Detecting Faces in Images : A Survey," IEEE Trans. on PAMI, vol.24, no.1, pp.34-58, January, 2002.
【非特許文献2】P.Viola and M.Jones. "Robust Real-time Object Detection," in Proc. of IEEE Workshop SCTV, July, 2001.
【非特許文献3】Duda, R.O. and P.E.Hart, "Use of the Hough Transformation to Detect Lines and Curves in Pictures," Comm. ACM, Vol. 15, pp.11-15 (January, 1972).
【非特許文献4】R.A.McLaughlin, "Randomized Hough Transform : Better Ellipse. Detection," IEEE TENCON Digital Signal Processing Applications. 1996. pp.409-414.
【非特許文献5】Stan Birchfield, "Elliptical Head Tracking Using Intensity Gradients and Color Histogram," Proc. IEEE International Conference On Computer Vision and Pattern Recognition(CVPR '98), Santa Barbara, California, pp.232-237, June 1998.
【非特許文献6】J.Matas, C.Galambos, and J.Kittler, "Progressive Probabilistic Hough Transform," Computer Vision and Pattern Recognition, pages 554-560, Los Alamitos, Calfornia, June 1999. IEEE Computer Society.
【発明の概要】
【発明が解決しようとする課題】
【0007】
前述したように、人物の顔を検出できない場合に、人物の位置を特定するために人物の頭部を代わりに検出して追尾する方法が考えられる。しかしながら、人物の頭部領域の周辺の背景に、ドア、机、大型テレビ、部屋パーティションなどの被写体があって、これらの被写体の境界線がエッジ画素として検出されることがある。頭部領域とこれらのエッジ画素とが近接すると、背景のエッジ画素によって頭部領域の検出を妨げることがある。
【0008】
そこで、複雑な背景から人物の頭部領域の楕円エッジを検出するために、さまざまな対策を考えられる。非特許文献5には、エッジ勾配の強度のみ利用することではなく、エッジ勾配の方向も利用し、楕円内部のカラーアピアランスも併用し、最も頭部領域らしい楕円形状のエッジを検出している。
【0009】
しかしながら、このような方法でも、背景のエッジを誤って頭部領域の楕円エッジとして検出することがある。例えば、頭部領域のエッジと背景領域のエッジとを検出し、前フレームの頭部領域の楕円形状と少し外れることがあっても、頭部領域の楕円として検出することがある。このように、少しずつ、頭部領域は、頭部領域のエッジと背景領域のエッジとを両方検出し、真の頭部領域のエッジから段々外れることがある。
【0010】
本発明は前述の問題点に鑑み、背景を含む画像から被写体の頭部領域を高精度に検出できるようにすることを目的としている。
【課題を解決するための手段】
【0011】
本発明の被写体検出装置は、入力画像からエッジ画素を検出するエッジ画素検出手段と、前記エッジ画素検出手段によって検出されたエッジ画素から直線領域を検出する直線領域検出手段と、前記直線領域検出手段によって検出された直線領域と連結する連結エッジ画素を前記直線領域以外のエッジ画素から抽出する連結エッジ画素抽出手段と、前記連結エッジ画素抽出手段によって抽出された連結エッジ画素と関連する関連エッジ画素を前記直線領域から抽出する関連エッジ画素抽出手段と、前記直線領域の中から前記関連エッジ画素を除いた領域に属するエッジ画素を前記入力画像から削除するエッジ画素削除手段とを備えることを特徴とする。
【発明の効果】
【0012】
本発明によれば、被写体エッジを維持しながら、直線エッジを削除することができ、被写体の検出精度を向上することができる。
【図面の簡単な説明】
【0013】
【図1】実施形態に係る被写体検出装置の機能構成例を示すブロック図である。
【図2】実施形態に係る被写体検出装置のハードウェア構成例を示すブロック図である。
【図3】第1の実施形態に係る被写体検出装置の直線エッジ削除部の詳細な構成例を示すブロック図である。
【図4】エッジ画素を削除する手順を説明する図である。
【図5】第1の実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。
【図6】ハフ変換のパラメータを説明する図である。
【図7】第1の実施形態において、エッジ画素を削除する手順を説明する図である。
【図8】関連エッジ画素を抽出する手順を説明する図である。
【図9】第2の実施形態に係る被写体検出装置の直線エッジ削除部の詳細な構成例を示すブロック図である。
【図10】被写体の候補領域を含む被写体検出領域を説明する図である。
【図11】第2の実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。
【図12】第3の実施形態において、エッジ画素を削除する手順を説明する図である。
【図13】第3の実施形態に係る被写体検出装置の直線エッジ削除部の詳細な構成例を示すブロック図である。
【図14】被写体の候補領域を含む第1の被写体検出領域及び第2の被写体検出領域を説明する図である。
【図15】第3の実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。
【図16】第4の実施形態において、エッジ画素を削除する手順を説明する図である。
【図17】第4の実施形態に係る被写体検出装置の直線エッジ削除部の詳細な構成例を示すブロック図である。
【図18】第4の実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0014】
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。なお、本発明は以下の実施形態に限定されるものではなく、本発明の実施に有利な具体例を示すにすぎない。本発明の特徴となる機能を実現するものも本発明の範囲に含まれる。
【0015】
(第1の実施形態)
図1は、本実施形態に係る被写体検出装置100の機能構成例を示すブロック図である。
図1に示すように、まず、入力画像110が被写体検出装置100の直線エッジ削除部101に入力され、直線エッジ削除部101は、入力画像110から、被写体エッジ以外の直線エッジ画素を検出して削除する。被写体領域検出部102は、前記直線エッジ画素を削除後の情報を用いて被写体領域を検出し、被写体情報130を出力する。
【0016】
なお、被写体領域検出部102は、ハフ変換を用いて被写体領域として頭部の楕円形状を検出する以外に、以下の手法により被写体領域を検出することができる。すなわち、削除した直線エッジ画素以外の画素のエッジ強度や方向情報などを用いて、機械学習で事前に抽出した被写体の特徴と照合することにより被写体領域を検出することも可能である。
【0017】
図2は、本実施形態に係る被写体検出装置100のハードウェア構成例を示すブロック図である。
図2において、CPU201は、本実施形態の被写体検出装置100における各種制御を実行する。ROM202は、本装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。RAM203は、CPU201が処理するための制御プログラムを格納するとともに、CPU201が各種制御を実行する際の作業領域を提供する。キーボード204及びマウス205は、ユーザが情報を入力するためのものである。
【0018】
外部記憶装置206は、例えば、ハードディスクやフレキシブルディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ等である。なお、外部記憶装置206は、制御プログラムや各種データを全てROM202に記憶するような構成とする場合には、必ずしも必要な構成要素ではない。
【0019】
表示器207は、ディスプレイなどで構成され、処理結果等の情報を表示する。ネットワークインターフェース208は、外部装置と情報をやり取りするためのインターフェースである。ビデオインターフェース209は、撮像装置などと同軸ケーブルを介して接続することが可能なインターフェースであり、フレーム画像を取り込むことができる。また、バス210は、上記の各構成を接続するためのバスである。
【0020】
図3は、本実施形態に係る被写体検出装置100の直線エッジ削除部101の詳細な構成例を示すブロック図である。以下の説明では、検出しようとする被写体を人物の頭部とする。
図3において、エッジ画素検出部301は、静止画像などの入力画像110から、Sobel、Prewitt、Morpholgyなどのエッジ検出方法を用いて、エッジ画素を検出する。
【0021】
直線領域検出部302は、エッジ画素検出部301で検出したエッジ画素に基づいて、ハフ変換を用いて直線を表すパラメータρ、θを検出する。なお、パラメータρ、θの詳細については後述する。そして、入力画像110において、検出した直線パラメータρ、θに基づいて、検出された複数のエッジ画素を含むように所定の幅wで直線を入力画像に描画する。直線を描画する際には、最も離れた2点のエッジ画素間で直線を描画する。本実施形態においては、描画した幅wの直線そのものの領域を直線領域とする。このように直線状に形成される直線領域に含まれるエッジ画素は、主に背景により形成されるものであり、被写体を検出するために、以降の処理でこれらのエッジ画素を削除する。
【0022】
連結エッジ画素抽出部303は、全ての直線領域以外におけるエッジ画素の中から、直線領域と連結するエッジ画素を連結エッジ画素として抽出する。関連エッジ画素抽出部304は、注目する直線領域と連結する連結エッジ画素との交点の間の注目する直線領域内のエッジ画素を関連エッジ画素とする。
【0023】
図4(a)は、入力画像で検出されたエッジ画素の一例を示す図である。ここで、図4(b)に示す例では、直線領域401と、直線領域以外のエッジ画素とが連結していないため、直線領域401上には関連エッジ画素が存在しない。これに対して直線領域402、403は、直線領域以外のエッジ画素と連結する。図4(b)では、関連エッジ画素が黒色に示されている。
【0024】
エッジ画素削除部305は、関連エッジ画素以外の直線領域に属するエッジ画素を削除する。図4(c)には、直線領域上のエッジ画素を削除した後のエッジ画像を示している。
【0025】
次に、本実施形態における処理の流れについて、図5のフローチャートを参照しながら説明する。図5は、本実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。
まず、ステップS501において、直線エッジ削除部101は、入力画像110を入力する。入力画像110は、静止画像でもよいし、動画像におけるフレーム画像でもよい。本実施形態においては、動画像のフレーム画像を例として説明する。
【0026】
次に、ステップS502において、エッジ画素検出部301は、入力画像110から、Sobel、Prewitt、Morphologyなどのエッジ検出方法を用いて、エッジ画素を検出する。
【0027】
次に、ステップS503において、直線領域検出部302は、ステップS502で検出したエッジ画素から、ハフ変換を用いて直線領域を検出するために、ハフ変換のパラメータを設定する。ハフ変換には種々なものがあるが、非特許文献6に開示されているPPHTは、高速的で、太い直線エッジの場合でも、高精度で直線の始点と終点と角度を確定できる。このため、ステップS503ではこの方法を用いるものとする。本実施形態では、図6に示すように、原点と直線距離ρの解像度、原点から直線への垂線の角度θの解像度、直線検出の長さの閾値、直線セグメントの閾値、セグメントを連結する長さの閾値などのパラメータを設定する。
【0028】
次に、ステップS504において、直線領域検出部302は、ステップS503で設定したハフ変換のパラメータを用いて、各エッジ画素から直線のパラメータ空間に変換して直線を検出する。そして、ステップS505において、直線領域検出部302は、ステップS504に検出した直線のパラメータ(直線距離ρ及び角度θ)に基づいて、所定の幅wで直線を入力画像に描画する。図7(a)には、エッジ画素を含む入力画像の一例を示し、図7(b)には、直線が描画された入力画像の一例を示す。
【0029】
ステップS506において、被写体検出装置100の直線エッジ削除部101は、ステップS505で描画した全ての直線領域のそれぞれにについて、以下に説明するステップS507からステップS509までの処理を繰り返す。
【0030】
ステップS507においては、連結エッジ画素抽出部303は、注目する直線領域Lを両側に所定の幅dwだけ膨張する。図7(c)には、注目する直線領域Lが所定の幅dwだけ膨張した入力画像の一例を示している。そして、他の直線領域以外で、膨張した直線領域Lと重なるエッジ画素を抽出する。次に、抽出したエッジ画素のそれぞれについて、幅(w+dw)で膨張し、ラベリングを行う。そして、同じラベルのエッジ画素の中心を連結エッジ画素とする。図7(d)には、抽出された連結エッジ画素A、Bの一例を示している。
【0031】
次に、ステップS508において、関連エッジ画素抽出部304は、ステップS507で抽出された連結エッジ画素A、B間で、描画した直線領域Lと同じ幅wからなる直線領域ABを作成する。そして、直線領域AB上のエッジ画素を関連エッジ画素として抽出する。図7(e)には、抽出した関連エッジ画素701の一例を示している。
【0032】
次に、ステップS509において、エッジ画素削除部305は、関連エッジ画素を除いた直線領域L上のエッジ画素を削除する。図7(f)には、直線領域上のエッジ画素が削除されたエッジ画像の一例を示している。なお、直線領域に属するエッジ画素を削除した後に、関連エッジ画素を修復するようにしてもよい。そして、全ての直線領域についてエッジ画素を削除すると、ステップS510においては、エッジ画素削除部305は、エッジ画素を削除した入力画像(エッジ画像)を出力する。このとき、削除されたエッジ画素の画像も出力情報として出力してもよい。
【0033】
ここで、図8(a)に示す例のように、1点の連結エッジ画素Aしか存在しない場合は、関連エッジ画素がないものとするか、以下の手順で関連エッジ画素を抽出する。例えば、連結エッジ画素Aの位置から、直線領域Lと入力画像の境界線との交点C、D間で直線領域ACまたは直線領域ADを作成し、直線領域ACまたは直線領域AD上のエッジ画素を関連エッジ画素として抽出してもよい。
【0034】
また、図8(b)に示す例のように、連結エッジ画素が2点以上存在する場合は、最も離れた2点の連結エッジ画素A、B間で直線領域ABを作成し、直線領域AB上のエッジ画素を関連エッジ画素として抽出する。もしくは、任意の2点の間に所定の幅wで直線領域を作成し、直線領域内のエッジ画素を関連エッジ画素として抽出してもよい。
【0035】
また、本実施形態において、検出した直線のパラメータ(直線距離ρ及び角度θ)に基づいて、直線上最も離れた2点のエッジ画素間を結ぶように所定の幅wの直線領域を描画した。この他に、直線領域そのものではなく、作成された直線上の最も離れた2点のエッジ画素間のエッジ画素の集合のみを直線領域と定義してもよい。
【0036】
なお、本実施形態において、全ての直線領域以外のエッジ画素の中から、注目する直線領域と連結するエッジ画素を連結エッジ画素として抽出した。一方、全ての直線領域ではなく、注目する直線領域以外のエッジ画素の中から、注目する直線領域と連結するエッジ画素を連結エッジ画素として抽出してもよい。
【0037】
以上のように本実施形態によれば、被写体エッジを維持しながら、直線エッジを削除することができ、被写体の検出精度を向上することができる。
【0038】
(第2の実施形態)
以下、本発明の第2の実施形態について説明する。本実施形態では、第1の実施形態とは異なり、後述する被写体検出領域を設けるようにしている。入力画像にノイズを含むエッジ画素が存在すると、連結エッジ画素の抽出に悪い影響を与える。そこで本実施形態では、このような影響を低減するために、被写体の候補領域の周辺に、被写体の候補領域を含む被写体検出領域を設定してエッジ画像を生成する。そのため、本実施形態に係る被写体検出装置の構成は図1と同様であるが、直線エッジ削除部101の詳細な構成が第1の実施形態と異なる。以下、第1の実施形態と異なる部分についてのみ説明する。
【0039】
図9は、本実施形態に係る被写体検出装置100の直線エッジ削除部101の詳細な構成例を示すブロック図である。
図9において、領域設定部901は、過去のフレームで検出した被写体の位置及び画像データに基づいて、現在のフレームに相当する入力画像から被写体の候補領域を求める。そして、図10に示すように、現在のフレームにおける被写体の候補領域1001を含むように、被写体検出領域1002を設定する。なお、入力画像110が静止画像の場合は、被写体の候補領域の情報を、外部装置から直接入力するようにしてもよい。エッジ画素検出部301〜エッジ画素削除部305の処理は、第1の実施形態と同様であるが、入力画像110に対してではなく、設定された被写体検出領域1002に対して処理を行う。
【0040】
図11は、本実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。図11に示すフローチャートは、図5のフローチャートと比べ、ステップS1101の処理が含まれている。ステップS1101では、領域設定部901は、前述したように被写体検出領域1002を検出する。以降のステップS502からステップS510の処理は、設定された被写体検出領域に対して処理を行うようにする。
【0041】
以上のように本実施形態によれば、被写体エッジを維持しながら、直線エッジを削除することができ、被写体の検出精度を向上することができる。
【0042】
(第3の実施形態)
以下、本発明の第3の実施形態について説明する。本実施形態では、第2の実施形態で説明した被写体検出領域を2段階に設定し、第1の被写体検出領域と、さらによりサイズの大きい第2の被写体検出領域とを設定する。例えば、図12(a)に示すように、被写体検出領域1204では2つの直線1201、1202が断続した直線となり、よりサイズの小さい被写体検出領域1203では直線のエッジ画素と被写体のエッジ画素とを分離しにくい場合がある。そこで本実施形態では、このような場合にエッジ画素を削除する手順について説明する。なお、本実施形態に係る被写体検出装置の構成は図1と同様であるが、直線エッジ削除部101の詳細な構成が第1の実施形態と異なる。以下、第1の実施形態と異なる部分についてのみ説明する。
【0043】
図13は、本実施形態に係る被写体検出装置100の直線エッジ削除部101の詳細な構成例を示すブロック図である。
図13において、第1の領域設定部1301は、過去のフレームで検出した被写体の位置情報に基づいて、現在のフレームである入力画像から被写体の候補位置を求める。例えば図14に示すように、現在のフレームにおいて被写体の候補位置1401を含むように所定パラメータでサイズの小さい第1の被写体検出領域1402を設定する。
【0044】
第2の領域設定部1302は、第1の領域設定部1301と同様に被写体の候補位置を求める。そして、図14に示すように、現在のフレームにおいて被写体の候補位置1401を含むように所定パラメータでサイズの大きい第2の被写体検出領域1403を設定する。
【0045】
第1のエッジ画素検出部1303は、第1の領域設定部1301で設定された第1の被写体検出領域において、Sobel、Prewitt、Morpholgyなどのエッジ検出方法を用いてエッジ画素を検出する。なお、第1の被写体検出領域が完全に第2の被写体検出領域に包含される場合は、第2のエッジ画素検出部1304の検出結果を利用することにより、本処理は省略することができる。
【0046】
第2のエッジ画素検出部1304は、第2の領域設定部1302で設定した第2の被写体検出領域において、Sobel、Prewitt、Morphologyなどのエッジ検出方法を用いてエッジ画素を検出する。直線領域検出部1305は、第2のエッジ画素検出部1304で検出したエッジ画素に基づいて、ハフ変換を利用して第2の被写体検出領域内の直線エッジを検出し、直線領域を作成する。図12(b)には、直線領域が描画された入力画像の一例を示している。
【0047】
連結エッジ画素抽出部1306は、直線領域検出部1305が第2の被写体検出領域において検出した直線領域のうち、第1の被写体検出領域の範囲内において、直線領域と連結するエッジ画素を連結エッジ画素として抽出する。関連エッジ画素抽出部1307は、第2の実施形態と同様に、第1の被写体検出領域内の直線領域のそれぞれについて、関連エッジ画素を抽出する。エッジ画素削除部1308は、注目する直線領域において、関連エッジ画素以外の直線領域内のエッジ画素を削除する。図12(c)及び図12(d)は、関連エッジ画素以外のエッジ画素の削除を説明する図である。
【0048】
図15は、本実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。
まず、ステップS1501において、直線エッジ削除部101は、入力画像110を入力する。入力画像110は、静止画像でもよいし、動画像のフレーム画像でもよい。本実施形態においては、動画像のフレーム画像を例として説明する。
【0049】
次に、ステップS1502において、第1の領域設定部1301及び第2の領域設定部1302はそれぞれ、過去のフレームに検出した被写体の位置および画像データに基づいて、現在のフレームの入力画像に、被写体の候補位置を求める。そして、図14に示すように、現在フレームに被写体候補位置を含め、それぞれサイズの異なる被写体検出領域を設定する。なお、入力画像110が静止画像の場合は、被写体の候補位置の情報を外部入力装置から直接入力してもよい。
【0050】
次に、ステップS1503において、第1の領域設定部1301及び第2の領域設定部1302はそれぞれ、第1及び第2の被写体検出領域において、Sobel、Prewitt、Morphologyなどのエッジ検出方法を用いてエッジ画素を検出する。なお、第1の被写体検出領域が完全に第2の被写体検出領域に含まない場合は、少なくともどちらかに属する領域についてエッジ画素を検出する。
【0051】
次に、ステップS1504において、直線領域検出部1305は、ステップS1503で検出した第2の被写体検出領域のエッジ画素について、非特許文献6に開示されたPPHTに用いた各パラメータを設定する。設定するパラメータは、第1実施形態と同様に、原点と直線距離ρの解像度、原点から直線への垂線の角度θの解像度、直線検出の長さの閾値、直線セグメントの閾値、セグメントを連結する長さの閾値などがある。
【0052】
次に、ステップS1505において、直線領域検出部1305は、ステップS1504で設定したハフ変換のパラメータを利用して、第2の被写体検出領域において各エッジ画素から直線のパラメータ空間に変換して直線を検出する。そして、ステップS1506において、直線領域検出部1305は、ステップS1505に検出した直線のパラメータρ、θに基づいて、第2の被写体検出領域内に、所定の幅wで直線を作成する。そして、作成した所定の幅wの直線上最も離れた2点のエッジ画素間の領域を直線領域と設定する。
【0053】
以降のステップS506からステップS510の処理は図5と同様であり、設定された第1の被写体検出領域に対して処理を行うようにする。
【0054】
以上のように本実施形態においては、第1の被写体検出領域は、第2の被写体検出領域に完全に含まれるように設定される。第2の被写体検出領域を設定することにより、第1の被写体検出領域内の被写体のエッジ画素の一部を間違って直線として誤検出することを防ぎ、全局的に直線を検出することができる。したがって、以上の目的を達成できれば、第1の被写体検出領域を第2の被写体検出領域に完全に含まないように設定してもよい。
【0055】
また、本実施形態において、ステップS1503のエッジ検出処理は、第1の被写体検出領域と第2の被写体検出領域とで同じ方法で検出してもよいし、異なる方法で検出してもよい。例えば、Sobelエッジ検出器で検出してもよく、1つはSobelエッジ検出器を用いて検出し、もう1つはMorphologyエッジ検出器を用いて検出してもよい。
【0056】
また、本実施形態において、直線領域は第2の被写体検出領域において作成するが、第1の被写体検出領域において作成して、関連エッジ以外の直線領域内のエッジ画素を削除してもよい。
【0057】
(第4の実施形態)
以下、本発明の第4の実施形態について説明する。本実施形態は、図16に示すように、第1の被写体検出領域1601では被写体のエッジ画素1602が直線として検出される可能性が高いような場合に好適な例である。本実施形態では、第1の被写体検出領域1601で検出されたエッジ画素を、第2の被写体検出領域1603の直線の検出に利用しない例について説明する。なお、本実施形態に係る被写体検出装置の構成は図1と同様であるが、直線エッジ削除部101の詳細な構成が第1の実施形態と異なる。以下、第1の実施形態と異なる部分についてのみ説明する。
【0058】
図17は、本実施形態に係る被写体検出装置100の直線エッジ削除部101の詳細な構成例を示すブロック図である。本実施形態では、第1の直線領域検出部1701及び第2の直線領域検出部1702を備えている。そして、第1の直線領域検出部1701で検出した直線領域と、第2の直線領域検出部1702で検出した直線領域とが重なる直線領域のみについて、関連エッジ画素以外のエッジ画素の削除処理を行う。
【0059】
図18は、本実施形態において、エッジ画像を生成する処理手順の一例を示すフローチャートである。
ステップS1801からステップS1803までの処理は、図15のステップS1501からステップS1503までの処理と同じなので、詳細な説明を省略する。ただし、第2の被写体検出領域のエッジ画素を検出する際に、第1の被写体検出領域を除いてもよい。
【0060】
ステップS1804においては、第1の直線領域検出部1701及び第2の直線領域検出部1702はそれぞれ、第1及び第2の被写体検出領域のエッジ画素について、非特許文献6に開示されたPPHTに用いた各パラメータを設定する。設定するパラメータは、第1の実施形態と同様に、原点と直線距離ρの解像度、原点から直線への垂線の角度θの解像度、直線検出の長さの閾値、直線セグメントの閾値、セグメントを連結する長さの閾値などがある。
【0061】
次に、ステップS1805において、第1の直線領域検出部1701及び第2の直線領域検出部1702はそれぞれ、ハフ変換のパラメータを利用して、第1及び第2の被写体検出領域において各エッジ画素から直線のパラメータ空間に変換して直線を検出する。なお、第1及び第2の被写体検出領域のエッジ画素について、同じハフ変換を用いてもよいし、異なるハフ変換を用いてもよい。また、同じハフ変換を用いても、異なるパラメータを設定してもよい。
【0062】
次に、ステップS1806において、第1の直線領域検出部1701及び第2の直線領域検出部1702はそれぞれ、直ステップS1805に検出した直線のパラメータρ、θに基づいて、第1及び第2の被写体検出領域内に、所定の幅wで直線を作成する。そして、作成した所定の幅wの直線上最も離れた2点のエッジ画素間の領域を直線領域と設定する。
【0063】
次に、ステップS1807において、第1の直線領域検出部1701は、第1の被写体検出領域で検出した全ての直線領域のそれぞれについて、第2の被写体検出領域に検出した直線領域のいずれか1つと重なるかどうかを判断する。そして、重なると判断した第1の被写体検出領域の直線領域のみについて、後続の処理を行う。
【0064】
ここで、直線領域が重なるかどうかについては、第1の被写体検出領域の直線におけるハフ変換の投票空間におけるビンと、第2の被写体検出領域の直線における投票空間におけるビンとが等価であるかどうかにより判断する。等価のビンとは、第1の被写体検出領域及び第2の被写体検出領域の直線の座標を同じ座標系で表すとき、その2つのビンが同じ直線を表すことである。また、第1の被写体検出領域の直線領域と第2の被写体検出領域の直線領域とをメモリ上でマッピングし、重なるかどうかを判断してもよい。
【0065】
以降のステップS506からステップS510の処理は図5と同様であり、重なると判断した第1の被写体検出領域の直線領域のみに対して処理を行うようにする。
【0066】
以上のように本実施形態によれば、被写体のエッジ画素が直線として検出される可能性が高いような場合にも、被写体の検出精度を向上させることができる。
【0067】
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【符号の説明】
【0068】
301 エッジ画素検出部
302 直線領域検出部
303 連結エッジ画素抽出部
304 関連エッジ画素抽出部
305 エッジ画素削除部

【特許請求の範囲】
【請求項1】
入力画像からエッジ画素を検出するエッジ画素検出手段と、
前記エッジ画素検出手段によって検出されたエッジ画素から直線領域を検出する直線領域検出手段と、
前記直線領域検出手段によって検出された直線領域と連結する連結エッジ画素を前記直線領域以外のエッジ画素から抽出する連結エッジ画素抽出手段と、
前記連結エッジ画素抽出手段によって抽出された連結エッジ画素と関連する関連エッジ画素を前記直線領域から抽出する関連エッジ画素抽出手段と、
前記直線領域の中から前記関連エッジ画素を除いた領域に属するエッジ画素を前記入力画像から削除するエッジ画素削除手段とを備えることを特徴とする被写体検出装置。
【請求項2】
前記直線領域検出手段は、ハフ変換を用いて直線領域を検出することを特徴とする請求項1に記載の被写体検出装置。
【請求項3】
前記エッジ画素削除手段は、前記直線領域に属するエッジ画素を削除した後に、前記関連エッジ画素を修復することを特徴とする請求項1又は2に記載の被写体検出装置。
【請求項4】
前記入力画像から被写体の候補位置を含む被写体検出領域を設定する設定手段を有し、
前記エッジ画素検出手段は、前記設定手段によって設定された被写体検出領域においてエッジ画素を検出することを特徴とする請求項1〜3の何れか1項に記載の被写体検出装置。
【請求項5】
前記入力画像から被写体の候補位置を含む第1の被写体検出領域と、前記第1の被写体検出領域を包含する第2の被写体検出領域とを設定する設定手段を有し、
前記直線領域検出手段は、前記第2の被写体検出領域において直線領域を検出し、
前記連結エッジ画素抽出手段は、前記第1の被写体検出領域において連結エッジ画素を抽出することを特徴とする請求項1〜3の何れか1項に記載の被写体検出装置。
【請求項6】
前記入力画像から被写体の候補位置を含む第1の被写体検出領域と、前記第1の被写体検出領域を包含する第2の被写体検出領域とを設定する設定手段を有し、
前記直線領域検出手段は、前記第1の被写体検出領域及び前記第2の被写体検出領域において直線領域を検出するとともに、前記第1の被写体検出領域と前記第2の被写体検出領域とで重なる直線領域を検出し、
前記連結エッジ画素抽出手段は、前記第1の被写体検出領域において連結エッジ画素を抽出することを特徴とする請求項1〜3の何れか1項に記載の被写体検出装置。
【請求項7】
前記エッジ画素削除手段によってエッジ画素が削除された入力画像から被写体を検出する手段をさらに備えることを特徴とする請求項1〜6の何れか1項に記載の被写体検出装置。
【請求項8】
入力画像からエッジ画素を検出するエッジ画素検出工程と、
前記エッジ画素検出工程において検出されたエッジ画素から直線領域を検出する直線領域検出工程と、
前記直線領域検出工程において検出された直線領域と連結する連結エッジ画素を前記直線領域以外のエッジ画素から抽出する連結エッジ画素抽出工程と、
前記連結エッジ画素抽出工程において抽出された連結エッジ画素と関連する関連エッジ画素を前記直線領域から抽出する関連エッジ画素抽出工程と、
前記直線領域の中から前記関連エッジ画素を除いた領域に属するエッジ画素を前記入力画像から削除するエッジ画素削除工程とを備えることを特徴とする被写体検出方法。
【請求項9】
入力画像からエッジ画素を検出するエッジ画素検出工程と、
前記エッジ画素検出工程において検出されたエッジ画素から直線領域を検出する直線領域検出工程と、
前記直線領域検出工程において検出された直線領域と連結する連結エッジ画素を前記直線領域以外のエッジ画素から抽出する連結エッジ画素抽出工程と、
前記連結エッジ画素抽出工程において抽出された連結エッジ画素と関連する関連エッジ画素を前記直線領域から抽出する関連エッジ画素抽出工程と、
前記直線領域の中から前記関連エッジ画素を除いた領域に属するエッジ画素を前記入力画像から削除するエッジ画素削除工程とをコンピュータに実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公開番号】特開2013−114611(P2013−114611A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−262777(P2011−262777)
【出願日】平成23年11月30日(2011.11.30)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】