デジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラム
【課題】顔領域に対する後処理のために、画像の輝度信号や色差信号に加えて、顔検出で顔と判断されたことを示す信号を好適に用いる。
【解決手段】輝度信号や色差信号を持つ固定長データを用いて顔検出処理とその処理により顔の可能性があると判断された領域に対して後処理を行なうシステムに適用することができるが、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加し、データ長を増やすのではなく、固定データ長を変えることなく後処理回路の仕様や性能に合わせ輝度、あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報をマージする。
【解決手段】輝度信号や色差信号を持つ固定長データを用いて顔検出処理とその処理により顔の可能性があると判断された領域に対して後処理を行なうシステムに適用することができるが、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加し、データ長を増やすのではなく、固定データ長を変えることなく後処理回路の仕様や性能に合わせ輝度、あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報をマージする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を行なうデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムに係り、特に、画像データの輝度信号及び色差信号を用いて顔領域の検出を行なうデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムに関する。
【背景技術】
【0002】
顔認識の技術は、ユーザに負担をかけない個人認証システムをはじめとして、性別の識別など、マンマシン・インターフェースに幅広く適用が可能である。また、最近では、デジタルカメラにも顔認識技術が搭載されるようになってきている。例えば検出した顔領域に対して輝度補正、色補正、アパーチャ補正といった後処理を行なったり、あるいは被写体検出若しくは被写体認識に基づく自動焦点合わせ(AF)や自動露光調整(AE)、自動画角設定、自動撮影といったカメラワークを自動化したりすることができる。
【0003】
顔認識システムは、例えば、入力画像に含まれる顔画像の位置と大きさを検出する顔検出処理と、検出された顔画像から主要な顔パーツの位置を検出する顔パーツ検出処理と、顔パーツの位置に基づいて顔画像に位置合わせや回転の補正を行なって得られる照合画像と登録画像を照合して顔画像の識別(人物の特定)を行なう顔識別処理で構成される。
【0004】
デジタルカメラなどでは、撮影したRGB画像信号から所定の計算式により輝度信号と色差信号(Y/Cr/Cb)に色空間変換してから、JPEGやMPEGなどの符号化圧縮処理が施される。また、このような撮影画像から輝度信号と式差信号を用いて顔検出を行なう方法が知られている。
【0005】
まず、画像データの輝度信号(Y)を用いてその周波数成分を処理することで、顔の位置と形状を判別することができる。例えば、極端に輝度信号の変化の大きい部分又は小さい部分を検出することで顔である可能性を判断する材料としたり、輪郭抽出することにより、その抽出された輪郭の大きさや形状などから顔である可能性を判断したりすることができる。続いて、色差信号(Cb、Cr)を用いて、色として図11に示すようなCb及びCr座標空間において肌色と判断するため設定可能なCb及びCrの値と入力画像のCb、Crを比較し、肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なうことができる。
【0006】
そして、デジタルカメラとしては、顔検出された後、その検出顔の領域に対して輝度補正、色補正、アパーチャ補正といった、デジタル画像の後処理を行なうことができる。また、顔領域を抽出して顔に適した符号化を行なうことにより、画質の改善や低ビットレ−トでの符号化が可能となる。
【0007】
例えば、肌色として検出されるべき色相の条件を光源判定の誤差を許容するように可変設定している顔領域抽出方法について提案がなされている(例えば、特許文献1を参照のこと)。
【0008】
また、R−Y及びB−Y色差信号の位相及び振幅に基づくメモリの出力と輝度信号のレベルとに応じて肌色領域を示す肌色検出信号を出力し、その肌色検出信号によってR−Y及びB−Y色差信号の利得を制御する映像信号処理装置について提案がなされている(例えば、特許文献2を参照のこと)。
【0009】
このように顔領域の判定結果や肌色検出結果を基に顔領域に対して後処理を行なうシステムなどにおいては、画像の輝度信号や色差信号に加えて、顔検出で顔と判断されたことを示す信号を用いる必要がある。
【0010】
一方、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を行なうシステムは、一般に、バス接続されたCPUやメモリ(RAM、SDRAM、DDRなど)などで構成されるアーキテクチャを備え、データの演算、転送、記録を行なう。しかしながら、このようなシステム・アーキテクチャ上で使用する画像データ(輝度、色差信号など)は有限なデータ長(ビット長)を持つので、輝度信号や色差信号の他に顔検出若しくは肌色検出の結果などを示す信号を追加すると、データ長の増加に伴い回路規模の増大を招来し、あるいはアーキテクチャを変更しなければならなくなる、といった弊害がある。
【0011】
【特許文献1】特開2004−192129号公報
【特許文献2】特開平11−146405号公報
【発明の開示】
【発明が解決しようとする課題】
【0012】
本発明の目的は、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することにある。
【0013】
本発明のさらなる目的は、画像データの輝度信号及び色差信号を用いて顔領域の検出を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することにある。
【0014】
本発明のさらなる目的は、カムコーダやデジタルカメラにおける輝度補正や色補正、アパーチャ補正といった顔領域に対する後処理のために、画像の輝度信号や色差信号に加えて、顔検出で顔と判断されたことを示す信号を好適に用いることができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することにある。
【課題を解決するための手段】
【0015】
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、画像データを用いたデジタル信号処理を行なうデジタル信号処理装置であって、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
を具備することを特徴とするデジタル信号処理装置である。
【0016】
最近、デジタルカメラなどに顔認識技術が搭載され、例えば検出した顔領域に対して輝度補正、色補正、アパーチャ補正といった後処理を行なうことができる。
【0017】
撮影画像から輝度信号と式差信号を用いて顔検出を行なう方法が知られており、まず、画像データの輝度信号(Y)を用いてその周波数成分を処理することで、顔の位置と形状を判別し、続いて、色差信号(Cb、Cr)を用いて肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なうことができる。
【0018】
ところで、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を行なうシステムの多くは各回路コンポーネントがバス接続されたアーキテクチャを備えており、使用する画像データ(輝度、色差信号など)は有限なデータ長(ビット長)を持つ。このため、画像データから顔領域若しくは肌色領域の検出処理を行なった後に、固定データ長からなる輝度信号や色差信号の他に顔検出若しくは肌色検出の結果などを示す信号を追加すると、データ長の増加に伴い回路規模の増大を招来し、あるいはアーキテクチャを変更しなければならなくなる、という問題がある。
【0019】
これに対し、本発明に係るデジタル信号処理装置では、顔又は肌色検出手段は、輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行なった後、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として、後段の後処理回路などに出力するようになっている。
【0020】
本発明に係るデジタル信号処理装置によれば、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加してデータ長を増やすのではなく、固定データ長を一定としたまま後処理回路の仕様や性能に合わせて輝度信号あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報(輪郭、形状、肌色情報など)をマージするようになっている。
【0021】
すなわち、本発明を顔検出若しくは顔認識などの処理において輝度信号並びに色差信号の固定長データにより必要な情報(顔領域判定や肌色検出の結果など)を検出する処理に適用すると、限られたデータ長に新たに処理された情報を既存のデータ部分に付加することで、データ長を変化させることなく、顔検出若しくは顔識別に有用な付加データを生成し転送することができる。これにより、システムのアーキテクチャの大幅な変更や、それに伴うハードウェアの回路規模増加を起こすことなく、検出された顔領域に対して補正などの後処理を行なうことが可能となる。
【0022】
また、本発明の第2の側面は、画像データを用いたデジタル信号処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータを、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
として機能させるためのコンピュータ・プログラムである。
【0023】
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータにインストールすることによって、コンピュータ上では協働的作用が発揮され、本発明の第1の側面に係るデジタル信号処理装置と同様の作用効果を得ることができる。
【発明の効果】
【0024】
本発明によれば、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することができる。
【0025】
また、本発明によれば、画像データの輝度信号及び色差信号を用いて顔領域の検出を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することができる。
【0026】
また、本発明によれば、カムコーダやデジタルカメラにおける輝度補正や色補正、アパーチャ補正といった顔領域に対する後処理のために、画像の輝度信号や色差信号に加えて、顔検出で顔と判断されたことを示す信号を好適に用いることができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することができる。
【0027】
本発明に係るデジタル信号処理装置によれば、顔検出若しくは顔認識などの処理において輝度信号並びに色差信号の固定長データにより必要な情報(顔領域判定や肌色検出の結果など)を検出する処理において、限られたデータ長に新たに処理された情報を既存のデータ部分に付加することで、データ長を変化させることなく、顔検出若しくは顔識別に有用な付加データを生成し転送することができる。
【0028】
本発明は、輝度信号や色差信号を持つ固定長データを用いて顔検出(若しくは顔認識)処理とその処理により顔の可能性があると判断された領域に対して後処理を行なうシステムに適用することができるが、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加してデータ長を増やすのではなく、固定データ長を一定としたまま後処理回路の仕様や性能に合わせて輝度信号あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報(輪郭、形状、肌色情報など)をマージするようになっている。これにより、システムのアーキテクチャの大幅な変更や、それに伴うハードウェアの回路規模増加を起こすことなく、検出された顔領域に対して補正などの後処理を行なうことが可能となる。
【0029】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【発明を実施するための最良の形態】
【0030】
以下、図面を参照しながら本発明の実施形態について詳解する。
【0031】
図1には、本発明の一実施形態に係るカメラ信号処理システムの構成を模式的に示している。同装置は、固体撮像素子などから得られた画像を信号処理して得られるRGB画像信号に基づいて、輝度信号と色差信号(Y/Cr/Cbなど)を出力し、さらに顔検出を行なうとともに、顔検出結果に基づいて輝度補正、色補正、アパーチャ補正といった後処理を行なうように構成されている。以下、各部について説明する。
【0032】
センサ1は、CCDやCMOSなどの固体撮像素子が利用される。光電変換効果を持つ各画素が2次元に配列され、受光側には例えばG市松RB色コーディング単板が配設されている。各色フィルタを通した入射光量に対応する信号電荷が各画素に蓄積され、各画素から読み出される3色の各信号電荷量からその画素位置における入射光の色を再現することができる。
【0033】
センサ1からの画素信号は、CDS(Correlated Double Sampling:相関二重サンプリング)回路2にてセンサ1から受ける信号の低雑音を高精度に抑圧し、さらにAGC(Automatic Gain Control:自動利得制御回路)3により適正なゲイン・コントロールをかけた後、AD変換器4によりデジタル信号に変換する。
【0034】
続くカメラ信号処理回路5では、AWB、γ補正、色空間変換といった、デジタル画像データに対するデジタル信号処理を行なう。AWB(Auto White Balance)によりホワイトバランス・ゲインを掛けて適正な色状態を再現し、デモザイク処理してRGB画面信号を作成する。また、RGBγ補正をかけて、RGB信号をモニタなどで撮影画像を出力する際に階調を正しく再現させるために階調変換を行なうようにしてもよい。そして、Yマトリクス計算並びにCマトリクス計算を実行することによって、RGB画像信号を輝度信号と色差信号(Y/Cr/Cb)に色空間変換して、それぞれ固定データ長からなる輝度信号及び色差信号を出力する。
【0035】
顔又は肌色検出回路6は、輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行なう。まず、画像データの輝度信号(Y)を用いてその周波数成分を処理することで、顔の位置と形状を判別する。続いて、色差信号(Cb、Cr)を用いて、色として図11に示すようなCb及びCr座標空間において肌色と判断するため設定可能なCb及びCrの値と入力画像のCb、Crを比較し、肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なう。
【0036】
なお、本出願人に既に譲渡されている特願2007−167415号明細書には、輝度信号及び色差信号を用いて顔検出を行なう画像処理装置について開示されているで、参照されたい。
【0037】
顔後段処理回路7は、入力画像データのうち顔又は肌色検出回路6によって検出された顔領域に対して、輝度補正、色補正、アパーチャ補正といった、デジタル画像の後処理を行なう。
【0038】
顔後段処理回路7によって後処理を施した後のYCrCb画像信号は、モニタ・ディスプレイ(図示しないが、デジタルカメラに備えられた表示パネル、並びにテレビ画面への外部出力を含む)などの表示系で表示出力され、あるいはJPEGやMPEGといった適切な画像符号化圧縮を施した後、記録画像としてフラッシュメモリやハード・ディスクなどのメディア(いずれも図示しない)に記録される。また、後処理した後の画像信号から得られる被写体検出若しくは被写体認識の情報に基づいて、自動焦点合わせ(AF)や自動露光調整(AE)、自動画角設定、自動撮影といったカメラワークの自動化のための制御を行なうことができる。
【0039】
なお、図面の錯綜を回避するために図1では省略しているが、カメラ信号処理回路5や顔又は肌色検出回路6は、必要に応じて画像情報を記録するためのメモリや、各回路の制御を司るマイクロコンピュータとの接続を配設するようにしてもよい。
【0040】
図1に示したカメラ信号処理システムにおいて、カメラ信号処理回路5から顔後段処理回路7までの間に着目すると、輝度信号(Y)、色差信号(Cr、Cb)は有限なデータ長を持つ。図2には、カメラ信号処理回路5から顔後段処理回路7までの間の経路を示している。
【0041】
図2に示す回路例では、輝度信号(Y)、並びに色差信号(Cb、Cr)は有限固定長のビット幅として各8ビットのデータ[7:0]で記述する。カメラ信号処理回路5は、RGB画像信号を色空間変換して、各8ビットのデータ[7:0]から輝度信号(Y)、並びに色差信号(Cb、Cr)を顔又は肌色検出回路6に出力する。
【0042】
また、顔又は肌色検出回路6は、これら有限固定長の8ビット幅からなる輝度信号(Y)、並びに色差信号(Cb、Cr)を基に、画像データから顔領域を検出する。そして、顔又は肌色検出回路6は、それぞれ有限固定長の8ビット幅からなる輝度信号(Y)、並びに色差信号(Cb、Cr)に加えて、顔領域判定若しくは肌色検出の結果を示す1ビット幅(若しくは数ビット幅)のFace信号を、顔後段処理回路7に出力する。図3には、顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。
【0043】
顔後段処理回路7は、輝度信号(Y)、並びに色差信号(Cb、Cr)と、顔検出を示すFace信号を情報として使用して、輝度補正、色補正、アパーチャ補正といった、デジタル画像の後処理を行なう。
【0044】
ここで、カメラ信号処理回路5と、顔又は肌色検出回路6、及び顔後段処理回路6の間の信号接続が、実際には固定データ長のバスを介したCPUと画像記録メモリ(いずれも図示しない)間のやり取りとなるアーキテクチャであるとし、且つ、そのハードウェア構成が24ビット幅のデータ長を前提としたとする。このような場合、各8ビット長の輝度信号(Y)、並びに色差信号(Cb、Cr)に加えて、顔又は肌色検出回路6において1ビット(若しくは数ビット)幅のFace信号が加わると、大幅な回路増加、あるいはアーキテクチャの変更が必要となる可能性があり、言い換えればコスト増大を招来する。
【0045】
図4には、カメラ信号処理回路5から顔後段処理回路7までの間の経路の他の構成例を示している。図2との主な相違は、輝度信号Y[7:0]の最下位1ビットY[0]を削除し、そこにFace信号をマージしている点にある。すなわち、ハードウェア構成が24ビット幅のデータ長とするアーキテクチャに抵触しないことから、顔又は肌色検出回路6が顔領域判定若しくは肌色検出結果に関する情報を出力したとしても、ハードウェア構成として変更する必要がない。
【0046】
見かけ上は、カメラ信号処理回路5から出力される輝度信号(Y)及び色差信号(Cr、Cb)の合計24ビット幅となるが、顔又は肌色検出回路6の出力24ビットの中にはFace信号がマージされているので、顔後段処理回路7に対しては、輝度信号(Y)及び色差信号(Cr、Cb)に加えて顔領域判定若しくは肌色検出結果に関する情報を供給することができる。
【0047】
図5には、図4の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。同図では、全体のビット長を顔又は肌色検出回路6に入力される輝度信号及び色差信号のビット長の合計と同じ24ビットとなることを前提にしている。図示の例では、輝度信号(Y)のデータのうち最下位1ビットが削除され、同ビット位置に顔又は肌色検出回路6における顔領域判定若しくは肌色検出結果に関する情報を示すFace信号がマージされている。
【0048】
この場合、顔後段処理回路7では、使用する輝度情報が減ることになるので、顔後段処理回路7では輝度信号(Y)の最下位ビットの情報が必要ではない、あるいは顔後段処理の性能に影響がないことが前提となる。また、顔後段処理に必要がない、又は性能に影響がないという条件を満たしていれば、輝度信号(Y)で削減するビット数を増やし、その分だけマージするFace信号のビット長を拡張することができる。また、顔又は肌色検出回路6が削減する輝度信号(Y)のビット長(若しくはマージするFace信号のビット長)を固定にしてもよいし、顔後段処理回路7の条件に応じて可変にしてもよい。いずれにせよ、顔又は肌色検出回路6から出力する信号全体でビット長が固定であることが保証されていればよい。
【0049】
また、図6には、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示している。図示の例では、顔後段処理回路7は輝度信号のみを用いて顔後段処理を行なうことから、顔又は肌色検出回路6は、輝度信号(Y)及び色差信号(Cr、Cb)をそれぞれ8ビットずつ出力するのではなく、それぞれ8ビット長の3画素分の輝度信号(Y0、Y1、Y2)を出力するようになっている。そして、各画素の輝度信号(Y0、Y1、Y2)の最下位1ビットY0[0]、Y1[0]、及びY2[0]を削除し、これら最下位ビット位置に各画素についてのFace信号(Face0、Face1、Face2)をそれぞれマージしている。この場合も、ハードウェア構成が24ビット幅のデータ長とするアーキテクチャに抵触しないことから、顔又は肌色検出回路6が顔領域判定若しくは肌色検出結果に関する情報を出力したとしても、ハードウェア構成として変更する必要がない。
【0050】
図7には、図6の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。図示の例では、3画素分の各輝度信号(Y0、Y1、Y2)のデータのうち最下位1ビット(Y0[0]、Y1[0]、Y2[0])が削除され、これらのビット位置にはそれぞれに対応する画素についてのFace信号(Face0、Face1、Face2)がマージされている。
【0051】
この場合、顔後段処理回路7では、画素毎に使用する輝度情報が減ることになるので、顔後段処理回路7では輝度信号(Y)の最下位ビットの情報が必要ではない、あるいは顔後段処理の性能に影響がないことが前提となる。また、顔後段処理に必要がない、又は性能に影響がないという条件を満たしていれば、各画素について輝度信号(Y)で削減するビット数をそれぞれ増やし、その分だけマージする画素毎のFace信号のビット長を拡張することができる。また、顔又は肌色検出回路6が削減する輝度信号(Y)のビット長(若しくはマージするFace信号のビット長)を固定にしてもよいし、顔後段処理回路7の条件に応じて可変にしてもよい。いずれにせよ、顔又は肌色検出回路6から出力する信号全体でビット長が固定であることが保証されていればよい。
【0052】
また、図8には、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示している。図示の例では、顔後段処理回路7は色差信号(Cr、Cb)の最下位1ビットは顔後段処理に必要ない若しくは性能に影響を与えないことから、顔又は肌色検出回路6は、輝度信号(Y)は8ビット長で出力するが、各色差信号の最下位1ビットCr[0]及びCb[0]をともに削除し、詰めた上で、顔領域判定若しくは肌色検出結果に関する情報を2ビット長の信号Face[1:0]を全出力24ビットのうち上位2ビットにマージしている。この場合も、ハードウェア構成が24ビット幅のデータ長とするアーキテクチャに抵触しないことから、顔又は肌色検出回路6が顔領域判定若しくは肌色検出結果に関する情報を出力したとしても、ハードウェア構成として変更する必要がない。
【0053】
図8が、図4及び図6に示した例と相違する主な点は、顔領域判定若しくは肌色検出結果に関する情報が1ビットから2ビットに拡張されているところにある。Face信号が1ビットであると、該当する画素が顔であるかあるいは層でないかを0又は1の値で示すフラグの役割として使用される。これに対し、Face信号が2ビット長である場合には、顔として検出されたことの有無に加え、検出された部分が顔領域である可能性があり、且つ肌色の種類(人種)であることや、顔の大きさや形状などのような情報も付加することが可能となる。
【0054】
例えば、2ビットの信号Face[1:0]の上位1ビットFace[1]は顔の有無を示すフラグとし、下位1ビットは肌色のレベルの相違(黒に近い肌色、白に近い肌色など)の情報に使用することなどが考えられる。この例では、Face[1:0]の場合を示しているが、本発明の要旨はFace信号が2ビット超であることに限定されるものではなく、顔後段処理回路7の仕様や性能に応じて必要とする顔や肌色の情報量が異なる。また、輝度信号(Y)のデータではなく、色差信号(Cr、Cb)の各最下位から1ビットずつを削減している点に関しても顔後段処理回路7の必要とする仕様や性能に応じて削除データ幅を決定すればよい。
【0055】
図9には、図8の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。図示の例では、輝度信号(Y)は8ビット長のまま出力するが、各色差信号(Cr、Cb)のデータのうち最下位1ビットがそれぞれ削除され、詰めた上で2ビット長の信号Face[1:0]を全出力24ビットのうち上位2ビットにマージしている。
【0056】
この場合、顔後段処理回路7では、使用する色差情報が減ることになるので、顔後段処理回路7では色差信号(Cr、Cb)の最下位ビットの情報が必要ではない、あるいは顔後段処理の性能に影響がないことが前提となる。また、顔後段処理に必要がない、又は性能に影響がないという条件を満たしていれば、各色差信号(Cr、Cb)で削減するビット数を増やし、その分だけマージするFace信号のビット長を拡張することができる。また、顔又は肌色検出回路6が削減する各色差信号(Cr、Cb)のビット長(若しくはマージするFace信号のビット長)を固定にしてもよいし、顔後段処理回路7の条件に応じて可変にしてもよい。いずれにせよ、顔又は肌色検出回路6から出力する信号全体でビット長が固定であることが保証されていればよい。
【0057】
これまで説明してきたデータ・アラインメント例では、顔又は肌色検出回路6の出力として輝度信号(Y)と色差信号(Cr、Cb)、顔検出信号(Face)の全体で24ビットのシステムとして説明してきたが、本発明の要旨はこれに限定されるものではなく、顔後段処理回路7などに依存して全体のビット長が決定される。図10には、全体で64ビット長としたデータ・アラインメント例を示している。
【産業上の利用可能性】
【0058】
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。
【0059】
本発明は、輝度信号や色差信号を持つ固定長データを用いて顔検出(若しくは顔認識)処理とその処理により顔の可能性があると判断された領域に対して後処理を行なうシステムに適用することができる。その際、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加してデータ長を増やすのではなく、固定データ長を一定としたまま後処理回路の仕様や性能に合わせて輝度信号あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報(輪郭、形状、肌色情報など)をマージするので、システムのアーキテクチャの大幅な変更や、それに伴うハードウェアの回路規模増加を起こすことなく、検出された顔領域に対して補正などの後処理を行なうことが可能となる。
【0060】
例えば、本発明は、カムコーダ、デジタルカメラ、あるいは携帯付きカメラにおけるデジタル信号処理において、顔検出、認識を輝度、色差信号を用いて輪郭、形状や肌色などから顔領域を検出し、その領域に対して補正などを行なう処理部、又はその周辺回路に適用することができる。
【0061】
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、特許請求の範囲を参酌すべきである。
【図面の簡単な説明】
【0062】
【図1】図1は、本発明の一実施形態に係るカメラ信号処理システムの構成を模式的に示した図である。
【図2】図2は、カメラ信号処理回路5から顔後段処理回路7までの間の経路を示した図である。
【図3】図3は、図2の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図4】図4は、カメラ信号処理回路5から顔後段処理回路7までの間の経路の他の構成例を示した図である。
【図5】図5は、図4の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図6】図6は、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示した図である。
【図7】図7は、図6の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図8】図8は、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示した図である。
【図9】図9は、図8の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図10】図10は、全体で64ビットとなるシステムにおけるデータ・アラインメント例を示した図である。
【図11】図11は、Cb及びCr座標空間において肌色と判断するため設定可能なCb及びCrの値と入力画像のCb、Crを比較し、肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なう処理を説明するための図である
【符号の説明】
【0063】
1…センサ
2…CDS(相関二重サンプリング)回路
3…AGC(自動利得制御回路)
4…AD変換器
5…カメラ信号処理回路
6…顔又は肌色検出回路
7…顔後段処理回路
【技術分野】
【0001】
本発明は、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を行なうデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムに係り、特に、画像データの輝度信号及び色差信号を用いて顔領域の検出を行なうデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムに関する。
【背景技術】
【0002】
顔認識の技術は、ユーザに負担をかけない個人認証システムをはじめとして、性別の識別など、マンマシン・インターフェースに幅広く適用が可能である。また、最近では、デジタルカメラにも顔認識技術が搭載されるようになってきている。例えば検出した顔領域に対して輝度補正、色補正、アパーチャ補正といった後処理を行なったり、あるいは被写体検出若しくは被写体認識に基づく自動焦点合わせ(AF)や自動露光調整(AE)、自動画角設定、自動撮影といったカメラワークを自動化したりすることができる。
【0003】
顔認識システムは、例えば、入力画像に含まれる顔画像の位置と大きさを検出する顔検出処理と、検出された顔画像から主要な顔パーツの位置を検出する顔パーツ検出処理と、顔パーツの位置に基づいて顔画像に位置合わせや回転の補正を行なって得られる照合画像と登録画像を照合して顔画像の識別(人物の特定)を行なう顔識別処理で構成される。
【0004】
デジタルカメラなどでは、撮影したRGB画像信号から所定の計算式により輝度信号と色差信号(Y/Cr/Cb)に色空間変換してから、JPEGやMPEGなどの符号化圧縮処理が施される。また、このような撮影画像から輝度信号と式差信号を用いて顔検出を行なう方法が知られている。
【0005】
まず、画像データの輝度信号(Y)を用いてその周波数成分を処理することで、顔の位置と形状を判別することができる。例えば、極端に輝度信号の変化の大きい部分又は小さい部分を検出することで顔である可能性を判断する材料としたり、輪郭抽出することにより、その抽出された輪郭の大きさや形状などから顔である可能性を判断したりすることができる。続いて、色差信号(Cb、Cr)を用いて、色として図11に示すようなCb及びCr座標空間において肌色と判断するため設定可能なCb及びCrの値と入力画像のCb、Crを比較し、肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なうことができる。
【0006】
そして、デジタルカメラとしては、顔検出された後、その検出顔の領域に対して輝度補正、色補正、アパーチャ補正といった、デジタル画像の後処理を行なうことができる。また、顔領域を抽出して顔に適した符号化を行なうことにより、画質の改善や低ビットレ−トでの符号化が可能となる。
【0007】
例えば、肌色として検出されるべき色相の条件を光源判定の誤差を許容するように可変設定している顔領域抽出方法について提案がなされている(例えば、特許文献1を参照のこと)。
【0008】
また、R−Y及びB−Y色差信号の位相及び振幅に基づくメモリの出力と輝度信号のレベルとに応じて肌色領域を示す肌色検出信号を出力し、その肌色検出信号によってR−Y及びB−Y色差信号の利得を制御する映像信号処理装置について提案がなされている(例えば、特許文献2を参照のこと)。
【0009】
このように顔領域の判定結果や肌色検出結果を基に顔領域に対して後処理を行なうシステムなどにおいては、画像の輝度信号や色差信号に加えて、顔検出で顔と判断されたことを示す信号を用いる必要がある。
【0010】
一方、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を行なうシステムは、一般に、バス接続されたCPUやメモリ(RAM、SDRAM、DDRなど)などで構成されるアーキテクチャを備え、データの演算、転送、記録を行なう。しかしながら、このようなシステム・アーキテクチャ上で使用する画像データ(輝度、色差信号など)は有限なデータ長(ビット長)を持つので、輝度信号や色差信号の他に顔検出若しくは肌色検出の結果などを示す信号を追加すると、データ長の増加に伴い回路規模の増大を招来し、あるいはアーキテクチャを変更しなければならなくなる、といった弊害がある。
【0011】
【特許文献1】特開2004−192129号公報
【特許文献2】特開平11−146405号公報
【発明の開示】
【発明が解決しようとする課題】
【0012】
本発明の目的は、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することにある。
【0013】
本発明のさらなる目的は、画像データの輝度信号及び色差信号を用いて顔領域の検出を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することにある。
【0014】
本発明のさらなる目的は、カムコーダやデジタルカメラにおける輝度補正や色補正、アパーチャ補正といった顔領域に対する後処理のために、画像の輝度信号や色差信号に加えて、顔検出で顔と判断されたことを示す信号を好適に用いることができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することにある。
【課題を解決するための手段】
【0015】
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、画像データを用いたデジタル信号処理を行なうデジタル信号処理装置であって、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
を具備することを特徴とするデジタル信号処理装置である。
【0016】
最近、デジタルカメラなどに顔認識技術が搭載され、例えば検出した顔領域に対して輝度補正、色補正、アパーチャ補正といった後処理を行なうことができる。
【0017】
撮影画像から輝度信号と式差信号を用いて顔検出を行なう方法が知られており、まず、画像データの輝度信号(Y)を用いてその周波数成分を処理することで、顔の位置と形状を判別し、続いて、色差信号(Cb、Cr)を用いて肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なうことができる。
【0018】
ところで、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を行なうシステムの多くは各回路コンポーネントがバス接続されたアーキテクチャを備えており、使用する画像データ(輝度、色差信号など)は有限なデータ長(ビット長)を持つ。このため、画像データから顔領域若しくは肌色領域の検出処理を行なった後に、固定データ長からなる輝度信号や色差信号の他に顔検出若しくは肌色検出の結果などを示す信号を追加すると、データ長の増加に伴い回路規模の増大を招来し、あるいはアーキテクチャを変更しなければならなくなる、という問題がある。
【0019】
これに対し、本発明に係るデジタル信号処理装置では、顔又は肌色検出手段は、輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行なった後、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として、後段の後処理回路などに出力するようになっている。
【0020】
本発明に係るデジタル信号処理装置によれば、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加してデータ長を増やすのではなく、固定データ長を一定としたまま後処理回路の仕様や性能に合わせて輝度信号あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報(輪郭、形状、肌色情報など)をマージするようになっている。
【0021】
すなわち、本発明を顔検出若しくは顔認識などの処理において輝度信号並びに色差信号の固定長データにより必要な情報(顔領域判定や肌色検出の結果など)を検出する処理に適用すると、限られたデータ長に新たに処理された情報を既存のデータ部分に付加することで、データ長を変化させることなく、顔検出若しくは顔識別に有用な付加データを生成し転送することができる。これにより、システムのアーキテクチャの大幅な変更や、それに伴うハードウェアの回路規模増加を起こすことなく、検出された顔領域に対して補正などの後処理を行なうことが可能となる。
【0022】
また、本発明の第2の側面は、画像データを用いたデジタル信号処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータを、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
として機能させるためのコンピュータ・プログラムである。
【0023】
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータにインストールすることによって、コンピュータ上では協働的作用が発揮され、本発明の第1の側面に係るデジタル信号処理装置と同様の作用効果を得ることができる。
【発明の効果】
【0024】
本発明によれば、カムコーダやデジタルカメラ(カメラ付携帯電話を含む)のような、画像データを用いたデジタル信号処理を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することができる。
【0025】
また、本発明によれば、画像データの輝度信号及び色差信号を用いて顔領域の検出を好適に行なうことができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することができる。
【0026】
また、本発明によれば、カムコーダやデジタルカメラにおける輝度補正や色補正、アパーチャ補正といった顔領域に対する後処理のために、画像の輝度信号や色差信号に加えて、顔検出で顔と判断されたことを示す信号を好適に用いることができる、優れたデジタル信号処理装置及びデジタル信号処理方法、並びにコンピュータ・プログラムを提供することができる。
【0027】
本発明に係るデジタル信号処理装置によれば、顔検出若しくは顔認識などの処理において輝度信号並びに色差信号の固定長データにより必要な情報(顔領域判定や肌色検出の結果など)を検出する処理において、限られたデータ長に新たに処理された情報を既存のデータ部分に付加することで、データ長を変化させることなく、顔検出若しくは顔識別に有用な付加データを生成し転送することができる。
【0028】
本発明は、輝度信号や色差信号を持つ固定長データを用いて顔検出(若しくは顔認識)処理とその処理により顔の可能性があると判断された領域に対して後処理を行なうシステムに適用することができるが、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加してデータ長を増やすのではなく、固定データ長を一定としたまま後処理回路の仕様や性能に合わせて輝度信号あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報(輪郭、形状、肌色情報など)をマージするようになっている。これにより、システムのアーキテクチャの大幅な変更や、それに伴うハードウェアの回路規模増加を起こすことなく、検出された顔領域に対して補正などの後処理を行なうことが可能となる。
【0029】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【発明を実施するための最良の形態】
【0030】
以下、図面を参照しながら本発明の実施形態について詳解する。
【0031】
図1には、本発明の一実施形態に係るカメラ信号処理システムの構成を模式的に示している。同装置は、固体撮像素子などから得られた画像を信号処理して得られるRGB画像信号に基づいて、輝度信号と色差信号(Y/Cr/Cbなど)を出力し、さらに顔検出を行なうとともに、顔検出結果に基づいて輝度補正、色補正、アパーチャ補正といった後処理を行なうように構成されている。以下、各部について説明する。
【0032】
センサ1は、CCDやCMOSなどの固体撮像素子が利用される。光電変換効果を持つ各画素が2次元に配列され、受光側には例えばG市松RB色コーディング単板が配設されている。各色フィルタを通した入射光量に対応する信号電荷が各画素に蓄積され、各画素から読み出される3色の各信号電荷量からその画素位置における入射光の色を再現することができる。
【0033】
センサ1からの画素信号は、CDS(Correlated Double Sampling:相関二重サンプリング)回路2にてセンサ1から受ける信号の低雑音を高精度に抑圧し、さらにAGC(Automatic Gain Control:自動利得制御回路)3により適正なゲイン・コントロールをかけた後、AD変換器4によりデジタル信号に変換する。
【0034】
続くカメラ信号処理回路5では、AWB、γ補正、色空間変換といった、デジタル画像データに対するデジタル信号処理を行なう。AWB(Auto White Balance)によりホワイトバランス・ゲインを掛けて適正な色状態を再現し、デモザイク処理してRGB画面信号を作成する。また、RGBγ補正をかけて、RGB信号をモニタなどで撮影画像を出力する際に階調を正しく再現させるために階調変換を行なうようにしてもよい。そして、Yマトリクス計算並びにCマトリクス計算を実行することによって、RGB画像信号を輝度信号と色差信号(Y/Cr/Cb)に色空間変換して、それぞれ固定データ長からなる輝度信号及び色差信号を出力する。
【0035】
顔又は肌色検出回路6は、輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行なう。まず、画像データの輝度信号(Y)を用いてその周波数成分を処理することで、顔の位置と形状を判別する。続いて、色差信号(Cb、Cr)を用いて、色として図11に示すようなCb及びCr座標空間において肌色と判断するため設定可能なCb及びCrの値と入力画像のCb、Crを比較し、肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なう。
【0036】
なお、本出願人に既に譲渡されている特願2007−167415号明細書には、輝度信号及び色差信号を用いて顔検出を行なう画像処理装置について開示されているで、参照されたい。
【0037】
顔後段処理回路7は、入力画像データのうち顔又は肌色検出回路6によって検出された顔領域に対して、輝度補正、色補正、アパーチャ補正といった、デジタル画像の後処理を行なう。
【0038】
顔後段処理回路7によって後処理を施した後のYCrCb画像信号は、モニタ・ディスプレイ(図示しないが、デジタルカメラに備えられた表示パネル、並びにテレビ画面への外部出力を含む)などの表示系で表示出力され、あるいはJPEGやMPEGといった適切な画像符号化圧縮を施した後、記録画像としてフラッシュメモリやハード・ディスクなどのメディア(いずれも図示しない)に記録される。また、後処理した後の画像信号から得られる被写体検出若しくは被写体認識の情報に基づいて、自動焦点合わせ(AF)や自動露光調整(AE)、自動画角設定、自動撮影といったカメラワークの自動化のための制御を行なうことができる。
【0039】
なお、図面の錯綜を回避するために図1では省略しているが、カメラ信号処理回路5や顔又は肌色検出回路6は、必要に応じて画像情報を記録するためのメモリや、各回路の制御を司るマイクロコンピュータとの接続を配設するようにしてもよい。
【0040】
図1に示したカメラ信号処理システムにおいて、カメラ信号処理回路5から顔後段処理回路7までの間に着目すると、輝度信号(Y)、色差信号(Cr、Cb)は有限なデータ長を持つ。図2には、カメラ信号処理回路5から顔後段処理回路7までの間の経路を示している。
【0041】
図2に示す回路例では、輝度信号(Y)、並びに色差信号(Cb、Cr)は有限固定長のビット幅として各8ビットのデータ[7:0]で記述する。カメラ信号処理回路5は、RGB画像信号を色空間変換して、各8ビットのデータ[7:0]から輝度信号(Y)、並びに色差信号(Cb、Cr)を顔又は肌色検出回路6に出力する。
【0042】
また、顔又は肌色検出回路6は、これら有限固定長の8ビット幅からなる輝度信号(Y)、並びに色差信号(Cb、Cr)を基に、画像データから顔領域を検出する。そして、顔又は肌色検出回路6は、それぞれ有限固定長の8ビット幅からなる輝度信号(Y)、並びに色差信号(Cb、Cr)に加えて、顔領域判定若しくは肌色検出の結果を示す1ビット幅(若しくは数ビット幅)のFace信号を、顔後段処理回路7に出力する。図3には、顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。
【0043】
顔後段処理回路7は、輝度信号(Y)、並びに色差信号(Cb、Cr)と、顔検出を示すFace信号を情報として使用して、輝度補正、色補正、アパーチャ補正といった、デジタル画像の後処理を行なう。
【0044】
ここで、カメラ信号処理回路5と、顔又は肌色検出回路6、及び顔後段処理回路6の間の信号接続が、実際には固定データ長のバスを介したCPUと画像記録メモリ(いずれも図示しない)間のやり取りとなるアーキテクチャであるとし、且つ、そのハードウェア構成が24ビット幅のデータ長を前提としたとする。このような場合、各8ビット長の輝度信号(Y)、並びに色差信号(Cb、Cr)に加えて、顔又は肌色検出回路6において1ビット(若しくは数ビット)幅のFace信号が加わると、大幅な回路増加、あるいはアーキテクチャの変更が必要となる可能性があり、言い換えればコスト増大を招来する。
【0045】
図4には、カメラ信号処理回路5から顔後段処理回路7までの間の経路の他の構成例を示している。図2との主な相違は、輝度信号Y[7:0]の最下位1ビットY[0]を削除し、そこにFace信号をマージしている点にある。すなわち、ハードウェア構成が24ビット幅のデータ長とするアーキテクチャに抵触しないことから、顔又は肌色検出回路6が顔領域判定若しくは肌色検出結果に関する情報を出力したとしても、ハードウェア構成として変更する必要がない。
【0046】
見かけ上は、カメラ信号処理回路5から出力される輝度信号(Y)及び色差信号(Cr、Cb)の合計24ビット幅となるが、顔又は肌色検出回路6の出力24ビットの中にはFace信号がマージされているので、顔後段処理回路7に対しては、輝度信号(Y)及び色差信号(Cr、Cb)に加えて顔領域判定若しくは肌色検出結果に関する情報を供給することができる。
【0047】
図5には、図4の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。同図では、全体のビット長を顔又は肌色検出回路6に入力される輝度信号及び色差信号のビット長の合計と同じ24ビットとなることを前提にしている。図示の例では、輝度信号(Y)のデータのうち最下位1ビットが削除され、同ビット位置に顔又は肌色検出回路6における顔領域判定若しくは肌色検出結果に関する情報を示すFace信号がマージされている。
【0048】
この場合、顔後段処理回路7では、使用する輝度情報が減ることになるので、顔後段処理回路7では輝度信号(Y)の最下位ビットの情報が必要ではない、あるいは顔後段処理の性能に影響がないことが前提となる。また、顔後段処理に必要がない、又は性能に影響がないという条件を満たしていれば、輝度信号(Y)で削減するビット数を増やし、その分だけマージするFace信号のビット長を拡張することができる。また、顔又は肌色検出回路6が削減する輝度信号(Y)のビット長(若しくはマージするFace信号のビット長)を固定にしてもよいし、顔後段処理回路7の条件に応じて可変にしてもよい。いずれにせよ、顔又は肌色検出回路6から出力する信号全体でビット長が固定であることが保証されていればよい。
【0049】
また、図6には、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示している。図示の例では、顔後段処理回路7は輝度信号のみを用いて顔後段処理を行なうことから、顔又は肌色検出回路6は、輝度信号(Y)及び色差信号(Cr、Cb)をそれぞれ8ビットずつ出力するのではなく、それぞれ8ビット長の3画素分の輝度信号(Y0、Y1、Y2)を出力するようになっている。そして、各画素の輝度信号(Y0、Y1、Y2)の最下位1ビットY0[0]、Y1[0]、及びY2[0]を削除し、これら最下位ビット位置に各画素についてのFace信号(Face0、Face1、Face2)をそれぞれマージしている。この場合も、ハードウェア構成が24ビット幅のデータ長とするアーキテクチャに抵触しないことから、顔又は肌色検出回路6が顔領域判定若しくは肌色検出結果に関する情報を出力したとしても、ハードウェア構成として変更する必要がない。
【0050】
図7には、図6の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。図示の例では、3画素分の各輝度信号(Y0、Y1、Y2)のデータのうち最下位1ビット(Y0[0]、Y1[0]、Y2[0])が削除され、これらのビット位置にはそれぞれに対応する画素についてのFace信号(Face0、Face1、Face2)がマージされている。
【0051】
この場合、顔後段処理回路7では、画素毎に使用する輝度情報が減ることになるので、顔後段処理回路7では輝度信号(Y)の最下位ビットの情報が必要ではない、あるいは顔後段処理の性能に影響がないことが前提となる。また、顔後段処理に必要がない、又は性能に影響がないという条件を満たしていれば、各画素について輝度信号(Y)で削減するビット数をそれぞれ増やし、その分だけマージする画素毎のFace信号のビット長を拡張することができる。また、顔又は肌色検出回路6が削減する輝度信号(Y)のビット長(若しくはマージするFace信号のビット長)を固定にしてもよいし、顔後段処理回路7の条件に応じて可変にしてもよい。いずれにせよ、顔又は肌色検出回路6から出力する信号全体でビット長が固定であることが保証されていればよい。
【0052】
また、図8には、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示している。図示の例では、顔後段処理回路7は色差信号(Cr、Cb)の最下位1ビットは顔後段処理に必要ない若しくは性能に影響を与えないことから、顔又は肌色検出回路6は、輝度信号(Y)は8ビット長で出力するが、各色差信号の最下位1ビットCr[0]及びCb[0]をともに削除し、詰めた上で、顔領域判定若しくは肌色検出結果に関する情報を2ビット長の信号Face[1:0]を全出力24ビットのうち上位2ビットにマージしている。この場合も、ハードウェア構成が24ビット幅のデータ長とするアーキテクチャに抵触しないことから、顔又は肌色検出回路6が顔領域判定若しくは肌色検出結果に関する情報を出力したとしても、ハードウェア構成として変更する必要がない。
【0053】
図8が、図4及び図6に示した例と相違する主な点は、顔領域判定若しくは肌色検出結果に関する情報が1ビットから2ビットに拡張されているところにある。Face信号が1ビットであると、該当する画素が顔であるかあるいは層でないかを0又は1の値で示すフラグの役割として使用される。これに対し、Face信号が2ビット長である場合には、顔として検出されたことの有無に加え、検出された部分が顔領域である可能性があり、且つ肌色の種類(人種)であることや、顔の大きさや形状などのような情報も付加することが可能となる。
【0054】
例えば、2ビットの信号Face[1:0]の上位1ビットFace[1]は顔の有無を示すフラグとし、下位1ビットは肌色のレベルの相違(黒に近い肌色、白に近い肌色など)の情報に使用することなどが考えられる。この例では、Face[1:0]の場合を示しているが、本発明の要旨はFace信号が2ビット超であることに限定されるものではなく、顔後段処理回路7の仕様や性能に応じて必要とする顔や肌色の情報量が異なる。また、輝度信号(Y)のデータではなく、色差信号(Cr、Cb)の各最下位から1ビットずつを削減している点に関しても顔後段処理回路7の必要とする仕様や性能に応じて削除データ幅を決定すればよい。
【0055】
図9には、図8の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示している。図示の例では、輝度信号(Y)は8ビット長のまま出力するが、各色差信号(Cr、Cb)のデータのうち最下位1ビットがそれぞれ削除され、詰めた上で2ビット長の信号Face[1:0]を全出力24ビットのうち上位2ビットにマージしている。
【0056】
この場合、顔後段処理回路7では、使用する色差情報が減ることになるので、顔後段処理回路7では色差信号(Cr、Cb)の最下位ビットの情報が必要ではない、あるいは顔後段処理の性能に影響がないことが前提となる。また、顔後段処理に必要がない、又は性能に影響がないという条件を満たしていれば、各色差信号(Cr、Cb)で削減するビット数を増やし、その分だけマージするFace信号のビット長を拡張することができる。また、顔又は肌色検出回路6が削減する各色差信号(Cr、Cb)のビット長(若しくはマージするFace信号のビット長)を固定にしてもよいし、顔後段処理回路7の条件に応じて可変にしてもよい。いずれにせよ、顔又は肌色検出回路6から出力する信号全体でビット長が固定であることが保証されていればよい。
【0057】
これまで説明してきたデータ・アラインメント例では、顔又は肌色検出回路6の出力として輝度信号(Y)と色差信号(Cr、Cb)、顔検出信号(Face)の全体で24ビットのシステムとして説明してきたが、本発明の要旨はこれに限定されるものではなく、顔後段処理回路7などに依存して全体のビット長が決定される。図10には、全体で64ビット長としたデータ・アラインメント例を示している。
【産業上の利用可能性】
【0058】
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。
【0059】
本発明は、輝度信号や色差信号を持つ固定長データを用いて顔検出(若しくは顔認識)処理とその処理により顔の可能性があると判断された領域に対して後処理を行なうシステムに適用することができる。その際、後処理回路の固定の入力データ長の輝度信号や色差信号に新たな検出信号を追加してデータ長を増やすのではなく、固定データ長を一定としたまま後処理回路の仕様や性能に合わせて輝度信号あるいは色差信号のデータ長を削減し、その部分に新たに顔検出処理で得られた情報(輪郭、形状、肌色情報など)をマージするので、システムのアーキテクチャの大幅な変更や、それに伴うハードウェアの回路規模増加を起こすことなく、検出された顔領域に対して補正などの後処理を行なうことが可能となる。
【0060】
例えば、本発明は、カムコーダ、デジタルカメラ、あるいは携帯付きカメラにおけるデジタル信号処理において、顔検出、認識を輝度、色差信号を用いて輪郭、形状や肌色などから顔領域を検出し、その領域に対して補正などを行なう処理部、又はその周辺回路に適用することができる。
【0061】
要するに、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、特許請求の範囲を参酌すべきである。
【図面の簡単な説明】
【0062】
【図1】図1は、本発明の一実施形態に係るカメラ信号処理システムの構成を模式的に示した図である。
【図2】図2は、カメラ信号処理回路5から顔後段処理回路7までの間の経路を示した図である。
【図3】図3は、図2の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図4】図4は、カメラ信号処理回路5から顔後段処理回路7までの間の経路の他の構成例を示した図である。
【図5】図5は、図4の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図6】図6は、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示した図である。
【図7】図7は、図6の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図8】図8は、カメラ信号処理回路5から顔後段処理回路7までの間の経路についてのさらに他の構成例を示した図である。
【図9】図9は、図8の場合の顔又は肌色検出回路6が出力するデータ・アラインメント例を示した図である。
【図10】図10は、全体で64ビットとなるシステムにおけるデータ・アラインメント例を示した図である。
【図11】図11は、Cb及びCr座標空間において肌色と判断するため設定可能なCb及びCrの値と入力画像のCb、Crを比較し、肌色エリア内のものと判断された入力画像領域と、輝度信号により判断された形状情報から顔検出を行なう処理を説明するための図である
【符号の説明】
【0063】
1…センサ
2…CDS(相関二重サンプリング)回路
3…AGC(自動利得制御回路)
4…AD変換器
5…カメラ信号処理回路
6…顔又は肌色検出回路
7…顔後段処理回路
【特許請求の範囲】
【請求項1】
画像データを用いたデジタル信号処理を行なうデジタル信号処理装置であって、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
を具備することを特徴とするデジタル信号処理装置。
【請求項2】
前記顔又は肌色検出手段は、輝度信号あるいは色差信号のデータ長を削減するとともに、該削減したデータ長部分の信号に顔領域若しくは肌色領域の検出処理で得られた情報をマージすることで、出力信号を前記有限固定長と同一のビット幅とする、
ことを特徴とする請求項1に記載のデジタル信号処理装置。
【請求項3】
入力画像データのうち前記顔又は肌色検出手段によって検出された顔領域に対して輝度補正、色補正、アパーチャ補正若しくはその他の後処理を行なう顔後段処理手段をさらに備え、
前記顔又は肌色検出手段は、前記顔後段処理手段の仕様若しくは性能に応じて、輝度信号又は色差信号において削減するデータ長を決定する、
ことを特徴とする請求項2に記載のデジタル信号処理装置。
【請求項4】
画像データを用いたデジタル信号処理を行なうデジタル信号処理方法であって、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理ステップと、
前記画像データ処理ステップによって得られる輝度信号及び色差信号を基に画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出ステップと、
を具備することを特徴とするデジタル信号処理装置。
【請求項5】
画像データを用いたデジタル信号処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータを、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
として機能させるためのコンピュータ・プログラム。
【請求項1】
画像データを用いたデジタル信号処理を行なうデジタル信号処理装置であって、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
を具備することを特徴とするデジタル信号処理装置。
【請求項2】
前記顔又は肌色検出手段は、輝度信号あるいは色差信号のデータ長を削減するとともに、該削減したデータ長部分の信号に顔領域若しくは肌色領域の検出処理で得られた情報をマージすることで、出力信号を前記有限固定長と同一のビット幅とする、
ことを特徴とする請求項1に記載のデジタル信号処理装置。
【請求項3】
入力画像データのうち前記顔又は肌色検出手段によって検出された顔領域に対して輝度補正、色補正、アパーチャ補正若しくはその他の後処理を行なう顔後段処理手段をさらに備え、
前記顔又は肌色検出手段は、前記顔後段処理手段の仕様若しくは性能に応じて、輝度信号又は色差信号において削減するデータ長を決定する、
ことを特徴とする請求項2に記載のデジタル信号処理装置。
【請求項4】
画像データを用いたデジタル信号処理を行なうデジタル信号処理方法であって、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理ステップと、
前記画像データ処理ステップによって得られる輝度信号及び色差信号を基に画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出ステップと、
を具備することを特徴とするデジタル信号処理装置。
【請求項5】
画像データを用いたデジタル信号処理をコンピュータ上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、前記コンピュータを、
デジタル画像データに対する画像データ処理を行ない、有限固定長のビット幅からなる輝度信号及び色差信号を出力する画像データ処理手段と、
前記画像データ処理手段から輝度信号及び色差信号を入力して、画像データから顔領域若しくは肌色領域の検出処理を行ない、該検出結果に関する情報を輝度信号及び色差信号と併せて、前記有限固定長と同一のビット幅からなる信号として出力する顔又は肌色検出手段と、
として機能させるためのコンピュータ・プログラム。
【図1】
【図2】
【図4】
【図6】
【図8】
【図3】
【図5】
【図7】
【図9】
【図10】
【図11】
【図2】
【図4】
【図6】
【図8】
【図3】
【図5】
【図7】
【図9】
【図10】
【図11】
【公開番号】特開2009−123119(P2009−123119A)
【公開日】平成21年6月4日(2009.6.4)
【国際特許分類】
【出願番号】特願2007−298602(P2007−298602)
【出願日】平成19年11月16日(2007.11.16)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成21年6月4日(2009.6.4)
【国際特許分類】
【出願日】平成19年11月16日(2007.11.16)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]