説明

画像識別装置,画像識別方法,撮像装置

【課題】画像識別の精度を確保しつつ、処理速度の低下を防止することができる画像識別装置,画像識別方法,撮像装置を提供する。
【解決手段】画像識別時に、画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行い、画像識別部が、所定の範囲の画素からなる画像の識別の結果に基づいて、更に、該所定の範囲の画素に対応する識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うか、又は、更に、識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人物の顔等の画像を認識する画像識別装置,画像識別方法,撮像装置に関する。
【背景技術】
【0002】
デジタルカメラなどの撮像装置や、このような撮像装置に採用される画像識別装置には、撮像した画像に含まれる人物の顔などを識別して、所定の画像処理を行うものが知られている。
【0003】
撮像した画像に含まれる人物等の顔を識別する技術としては、例えば、機械的学習手法として、ブースティング(Boosting)と呼ばれる手法があり、特にその手法の変形であるアダブースティング(Adaboosting)と呼ばれる手法が用いられている。
【0004】
従来、アダブースティングを用いた画像識別装置は、画像の認識に用いる学習データを生成する学習部と、学習データに基づいて画像の識別を行う識別部と、認識データに基づいて再学習を行う再学習部とを備えている。画像識別としては、例えば、下記特許文献のものがあげられる。
【0005】
図6は、従来の画像識別システムの処理フローの一例を示す図である。従来の画像識別システムでは、画像データを入力するための画像入力工程と、画像データの多重解像度化を行う多重解像度化工程と、多重解像度化された画像データに正規化を行う正規化工程とが行われる。また、処理された画像データを予め大容量メモリなどに記憶された参照データに基づいて、どの程度参照データの画像と一致するかを解析し、識別の対象となる画像の特徴量を導出する特徴量導出工程と、画像の識別を行う識別工程とが行われる。
【0006】
ここで、多重解像度化工程では、画像の全画素に対して所定の画素範囲を検出し、所定の画素範囲を検出するための始点となる画素を一個づつずらしていくことで、全画素を検出し、検出し所定の画素範囲の画像データの特徴量が予め設定されたしきい値となるか判別している。しかし、全画素を対象として検出を行うと、識別の精度を最大限まで向上させることができるが、検出にかかる処理量が増大してしまい、処理速度が低下してしまう点が問題となっていた。そこで、図7に示すように、全画素のうち、所定の画素範囲を検出するための始点となる画素を、画素に対してx方向及びy方向の各方向に対してそれぞれ等間隔に配置した略格子状となるように設定することで、特徴量を検出する処理回数を低減させて、処理速度を向上させる手段が用いられている。
【0007】
【特許文献1】特開2005−100121号公報
【特許文献2】特開2005−100122号公報
【特許文献3】特開2003−44853号公報
【特許文献4】特開2006−85685号公報
【0008】
【発明の開示】
【発明が解決しようとする課題】
【0009】
従来のように、多重解像度化工程において所定の画素範囲を検出するための始点となる画素を設定することで、識別処理にかかる時間を短縮できるものの、画像識別の精度が低下してしまうことは避けられなかった。そして、画像識別の精度を確保しつつ、処理時間を短縮できるようにしたいという要望があった。
【0010】
本発明は、上記事情に鑑みてなされたもので、その目的は、画像識別の精度を確保しつつ、処理速度の低下を防止することができる画像識別装置,画像識別方法,撮像装置を提供することにある。
【課題を解決するための手段】
【0011】
本発明の上記目的は、下記構成によって達成される。
(1)画像の識別を行う画像識別装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、前記所定の範囲の画素からなる画像の識別の結果に基づいて、更に、該所定の範囲の画素に対応する前記識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別装置。
(2)画像の識別を行う画像識別装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、更に、前記識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別装置。
(3)画像の識別を行う画像識別方法であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別工程を有し、
前記所定の範囲の画素からなる画像の識別の結果に基づいて、更に、該所定の範囲の画素に対応する前記識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別方法。
(4)画像の識別を行う画像識別方法であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別工程を有し、
前記画像識別工程において、更に、前記識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別方法。
(5)撮像した画像の識別を行う撮像装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、前記所定の範囲の画素からなる画像の識別の結果に基づいて、更に、該所定の範囲の画素に対応する前記識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする撮像装置。
(6)撮像した画像の識別を行う撮像装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、更に、前記識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする撮像装置。
【0012】
本発明は、画像の識別を行う場合に、画像を構成する画素のうち格子状の配置を有する複数の画素を識別点として、この識別点を含む所定の範囲の画素ごとに繰り返して識別を行うことで、画像全体の識別を行うものである。このとき、格子状に配置された識別点ごとの所定の範囲の画素からなる画像の識別の結果を判別し、必要に応じて更に別の画素を含む画像についても識別を行っている。例えば、格子状に配置された識別点ごとの所定の範囲の画素からなる画像が、識別の際に参照する参照データとの一致点が多い場合に特徴量が高くなるように設定し、その特徴量が予め定めたしきい値より大きくなる場合に、更に別の画素に対して識別を行うことができる。こうすれば、従来のように格子状の識別点を含む画像についてのみ識別を行う場合に比べて、画像識別処理の精度をより一層向上させることができるとともに、最初の画像の識別の結果により、別の画像に対して識別を行う必要がない場合は更なる識別を省くことができるため、処理速度の低下を防止することができる。
また、互いに1/2ピッチずれた識別点の画素をサンプリングして、画像の特徴量を算出するようにすれば、従来の単純な格子状の識別点でのみ識別を行う場合に比べて、全画素において広い画素範囲を識別の対象とすることができ、同一の画素が識別の対象として重複して処理されることがないため、識別処理のロスを失くすことができるため、処理速度を向上させることができる。
【発明の効果】
【0013】
本発明によれば、画像識別の精度を確保しつつ、処理速度の低下を防止することができる画像識別装置,画像識別方法及び撮像装置を提供できる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の実施形態を図面に基づいて詳しく説明する。
図1は、本発明にかかる画像識別装置及びこれを適用した撮像装置の一実施形態の構成を示すブロック図である。本実施形態では、撮像装置の一例としてデジタルカメラの構成を用いて説明する。
撮像装置10は、被写体からの光を受光するレンズ12と、レンズ12に受光した入射光が入射することで画像データを生成する撮像素子14とを備えている。撮像素子14は、例えば、固体撮像素子(CCD)やCMOS型のイメージセンサを用いることができる。
【0015】
撮像素子14で生成された画像データがアナログフロントエンド16に出力される。アナログフロントエンド16では、撮像素子14から入力された画像データをアナログ/デジタル変換処理を行い、画像識別部50に出力する。画像の識別時には、後述するように画像識別部50で画像データの識別を行った後、識別された画像データをCPU(中央演算処理部)36に出力される。CPU36の内部には、デジタル信号を処理する信号処理プロセッサ22が設けられている。
【0016】
CPU36には、バス42を介して、AF(オートフォーカス)制御回路32、メインメモリ38、ROM40、I/F(インターフェース)部34、LCD制御部26、メディア制御部30がそれぞれ接続されている。
【0017】
I/F部34には、撮像装置10を使用する使用者が手指などで直接入力することで操作指示を行うための操作手段20が接続されている。
【0018】
LCD制御部26には、LCD18が接続されている。LCD18は、撮像装置10の撮像時の画像や撮像状態を表示する表示手段として機能している。
【0019】
メディア制御部30には、外部記録メディア28が接続されている。外部記録メディア28は、撮像装置10から着脱可能に構成されている。
【0020】
図2は、本実施形態の画像識別処理の手順を示すフロー図であり、図3は、画像識別部を示すブロック図である。また、図4は、本実施形態の画像の識別点を簡略的に説明する図である。
画像識別を行う場合には、最初に、撮像した画像データを図1に示すアナログフロントエンド16から画像識別部50に入力する。
【0021】
図3に示すように、画像識別部50は、アナログフロントエンド16から画像データが、画像データ入力部52に入力される。画像データは、フレームメモリ54に転送され、一時的に記憶される。次に、画像データに多重解像処理部56において多重解像処理が行われる。多重解像処理が行われた画像データは、ラインメモリ58に記憶され、その後、正規化処理部62において正規化処理が行われる。画像データは、正規化処理が実行された後、ラインメモリ64に一旦記憶された後、特徴量導出部66に出力される。
【0022】
特徴量導出部66は、画像の識別時に、ROM68に予め記憶されている画像識別用の学習データを読み出し、正規化された画像データと学習データとに基づいて画像データの特徴量を導き出す。特徴量とは、画像データが識別の目標としている画像にどの程度一致又は近いものであるかを示す指標である。画像データの特徴量は、識別部72に出力される。識別部72は、画像データの特徴量に基づいて、特徴量が所定の閾値より高い値(又は、低い値)であることを判別することで、画像データの識別を行う。ここで、特徴量とは、例えば、画像データが識別の目標としている画像にどの程度一致又は近いものであるかを示す指標である。
【0023】
本実施形態では、入力した画像に多重解像度化の処理を行った後、図7に示すように、画像の行方向(図中x方向)及び列方向(図中y方向)に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点と設定し、サンプリングを行う。識別点とは、画像の特徴量を検出する所定の範囲の画像に含まれる各画素を検出する際に、始点となる画素である。例えば、横640×縦480個の画素からなる画像に対して識別を行う場合、各始点となる識別点に設定された画素からx方向に対して32個、かつ、y方向に対して32個とからなる画像について特徴量を算出する。本実施形態では、図7に示すように最初に設定されている格子状の識別点を第1の識別点群とした。具体的には、第1の識別点群は、画像を構成する全画素のうち、x方向及びy方向にそれぞれ4画素に1個のピッチで、識別点となる画素を設定したものである。
【0024】
次に、サンプリングした第1の識別点群の各画像について算出された特徴量が、予め設定されたしきい値を超えるか否かを判別する。本実施形態では、しきい値より大きい値の特徴量を示す画像を以降のフローで更なる識別処理を行うための対象とする。
【0025】
第1の識別点群において、しきい値より大きい特徴量を示した画像に対応する識別点の周囲近傍の画素を新たに第2の識別点群に設定し、各識別点を始点として所定の範囲の画素からなる画像の特徴量を算出する。図4では、各四角のマスが画素を示し、「○」を付した画素が第1の識別点群であり、「◎」を付した画素が、第2の識別点群を示している。図4に示すように、第2の識別点群の周囲近傍の画素(図4では、「△」で示す識別点を中心とする縦5個×横5個の範囲Rに含まれる画素)からなる画像について、更に、画像識別を行い、特徴量を算出する。
【0026】
つまり、本実施形態では、図2に示すように、第1の識別点群に基づく画像のうち特徴量がしきい値より大きいものについては、その周囲近傍を画素ごとに識別を行うため、画像識別の精度を向上させることができる。このとき、第1の識別点群に基づく画像のうち特徴量がしきい値を超えないものについては、更なる識別を行うことなく、画像識別処理のフローを終了するため、処理速度の低下を防止することができる。
【0027】
次に、本実施形態の変形例を説明する。
図5は、画像の識別点を簡略的に説明する図である。この例では、図5に示すように、「○」を付した画素である第1の識別点群をサンプリングし、サンプリングした第1の識別点群に対応する各画像について特徴量を算出し、しきい値に基づいて判別する点で、上述の実施形態と同じである。また、第1の識別点群に対してx方向及びy方向にそれぞれ1/2ピッチずれて配置された第2の識別点群を設定することができる。こうして、識別を行う場合には、第1の識別点群及び第2の識別点群の画素をサンプリングし、所定の範囲の画像の特徴量を算出してもよい。こうすれば、図4に示す実施形態のように、第2の識別点群を更に識別する際に、一部の画像が識別の対象として重複することに起因して、識別処理のロスが生じることを防止することができる。
【0028】
本発明にかかる上記実施形態は、画像の識別を行う場合に、図4に示すように、画像を構成する画素のうち格子状の配置を有する複数の画素を識別点として、この識別点を含む所定の範囲の画素ごとに繰り返して識別を行うことで、画像全体の識別を行うものである。このとき、格子状に配置された識別点ごとの所定の範囲の画素からなる画像の識別の結果を判別し、必要に応じて更に別の画素を含む画像についても識別を行っている。そして、格子状に配置された識別点ごとの所定の範囲の画素からなる画像が、識別の際に参照する参照データとの一致点が多い場合に特徴量が高くなるように設定し、その特徴量が予め定めたしきい値より大きくなる場合に、更に別の画素に対して識別を行うことができる。こうすれば、従来のように格子状の識別点を含む画像についてのみ識別を行う場合に比べて、画像識別処理の精度をより一層向上させることができるとともに、最初の画像の識別の結果により、別の画像の対して識別を行う必要がない場合は更なる識別を省くことができるため、処理速度の低下を防止することができる。
【0029】
また、図5に示す例のように、互いに1/2ピッチずれた識別点の画素をサンプリングして、画像の特徴量を算出するようにすれば、従来の単純な格子状の識別点でのみ識別を行う場合に比べて、全画素において広い画素範囲を識別の対象とすることができ、同一の画素が識別の対象として重複して処理されることがないため、識別処理のロスを失くすことができるため、処理速度を向上させることができる。
【0030】
本発明にかかる画像識別方法は、上記画像識別装置及び撮像装置を用いることで好適に実施することができる。
すなわち、画像識別方法は、図4に示すように、画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別工程を有している。そして、所定の範囲の画素からなる画像の識別の結果に基づいて、更に、所定の範囲の画素に対応する識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行う。
【0031】
また、図5に示すように、画像識別工程において、更に、識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことで、全画素において広い画素範囲を識別の対象とすることができ、処理速度を向上させることができる。
【0032】
なお、本発明は、前述した実施形態に限定されるものではなく、適宜な変形、改良などが可能である。
例えば、画像識別装置は、デジタルカメラや携帯電話に搭載されたものに限定されず、画像識別部50を備えた、その他の画像識別装置に適用することができる。
【図面の簡単な説明】
【0033】
【図1】本発明にかかる画像識別装置及びこれを適用した撮像装置の一実施形態の構成を示すブロック図である。
【図2】画像識別処理の手順を示すフロー図である。
【図3】画像識別部の構成を示すブロック図である。
【図4】画像の識別点を簡略的に説明する図である。
【図5】画像の識別点を簡略的に説明する図である。
【図6】従来の画像識別システムの処理フローの一例を示す図である。
【図7】従来のサンプリング時における画像の識別点を簡略的に説明する図である。
【符号の説明】
【0034】
10 撮像装置
50 画像識別部

【特許請求の範囲】
【請求項1】
画像の識別を行う画像識別装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、前記所定の範囲の画素からなる画像の識別の結果に基づいて、更に、該所定の範囲の画素に対応する前記識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別装置。
【請求項2】
画像の識別を行う画像識別装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、更に、前記識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別装置。
【請求項3】
画像の識別を行う画像識別方法であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別工程を有し、
前記所定の範囲の画素からなる画像の識別の結果に基づいて、更に、該所定の範囲の画素に対応する前記識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別方法。
【請求項4】
画像の識別を行う画像識別方法であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別工程を有し、
前記画像識別工程において、更に、前記識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする画像識別方法。
【請求項5】
撮像した画像の識別を行う撮像装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、前記所定の範囲の画素からなる画像の識別の結果に基づいて、更に、該所定の範囲の画素に対応する前記識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする撮像装置。
【請求項6】
撮像した画像の識別を行う撮像装置であって、
前記画像の行方向及び列方向に対して配置された全画素のうち、格子状の配置を有する複数の画素を識別点とし、該識別点を含む所定の範囲の画素からなる画像ごとに識別を行う画像識別部を有し、
前記画像識別部が、更に、前記識別点に対して行方向及び列方向にそれぞれ1/2ピッチずれて配置された格子状の識別点の周囲近傍の画素を含む所定の範囲の画素からなる画像について画像の識別を行うことを特徴とする撮像装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−217206(P2008−217206A)
【公開日】平成20年9月18日(2008.9.18)
【国際特許分類】
【出願番号】特願2007−51266(P2007−51266)
【出願日】平成19年3月1日(2007.3.1)
【出願人】(306037311)富士フイルム株式会社 (25,513)
【Fターム(参考)】