説明

画像識別装置,画像識別方法,撮像装置及び撮像方法

【課題】画像識別の処理にかかる時間の高速化を実現できる画像識別装置、画像識別方法、撮像装置や撮像方法を提供する。
【解決手段】画像データの多重解像度化を行う多重解像処理部56と、多重解像度化された画像データに正規化を行う正規化処理部62と、正規化された画像データを、学習データに基づいて、特徴量を求める特徴量導出部66と、特徴量に基づいて画像データの識別を行う識別部72とを備え、多重解像処理部56と、正規化処理部62と、特徴量導出部66と、識別部72とが、バスを介することのないパイプライン機構を構成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人物の顔等の画像を認識する画像識別装置、画像識別方法、撮像装置及び撮像方法に関する。
【背景技術】
【0002】
一般的に、撮像した画像に含まれる人物等の顔を識別する技術としては、機械的学習手法として、ブースティング(Boosting)と呼ばれる手法があり、特にその手法の変形であるアダブースティング(Adaboosting)と呼ばれる手法が用いられている。
【0003】
従来、アダブースティングを用いた画像識別装置は、画像の認識に用いる学習データを生成する学習部と、学習データに基づいて画像の識別を行う識別部と、認識データに基づいて再学習を行う再学習部とを備えている。画像識別としては、例えば、下記特許文献のものがあげられる。
【0004】
【特許文献1】特開2005−100121号公報
【特許文献2】特開2005−100122号公報
【特許文献3】特開2003−44853号公報
【特許文献4】特開2006−85685号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
図4は、従来の画像識別システムの一例を示す図である。従来の画像識別システムでは、画像データを入力するための画像入力部と、多重解像度化、正規化を行うそれぞれの処理部と、特徴量を導出する特徴量導出部と、画像の識別を行う識別部とが、それぞれ汎用バスを介して、大容量メモリに接続されている。このため、画像識別処理を行う際には、各処理部からそれぞれ大容量メモリに読み出しを行い、大容量メモリから予め記憶された、入力画像フレームデータ、多重解像度データ、正規化データ、特徴量の種類などの各データを読み出す必要があった。このとき、大容量メモリへのデータの保存や読み出しが、汎用バスを介して行われるため、処理時間は汎用バスに依存してしまう。また、各処理の並列化を図ったとしても、汎用バスを介して行われるため、処理時間の短縮には限界があった。さらに、大容量メモリがコストを増加させる要因となっていた。
【0006】
現在、デジタルカメラや携帯電話に内蔵されたカメラに画像識別機能を備えることが検討されており、画像識別にかかる処理時間の短縮やコストの低減を図りたいという要望があった。
【0007】
本発明は、上記事情に鑑みてなされたもので、その目的は、画像識別の処理にかかる時間の高速化を実現できる画像識別装置、画像識別方法、撮像装置及び撮像方法を提供することにある。
【課題を解決するための手段】
【0008】
本発明の上記目的は、下記構成によって達成される。
(1)画像データの識別を行う画像識別装置であって、前記画像データの多重解像度化を行う多重解像処理部と、多重解像度化された前記画像データに正規化を行う正規化処理部と、正規化された前記画像データを、学習データに基づいて、特徴量を求める特徴量導出部と、前記特徴量に基づいて前記画像データの識別を行う識別部とを備え、前記多重解像処理部と、前記正規化処理部と、前記特徴量導出部と、前記識別部とが、バスを介することのないパイプライン機構を構成することを特徴とする画像識別装置。
(2)正規化された前記画像データを記憶するラインメモリを備え、前記ラインメモリが複数に分割され、分割されたそれぞれのラインメモリに対応するように前記特徴量導出部が複数設けられていることを特徴とする上記(1)に記載の画像識別装置。
(3)画像データの識別を行う画像識別方法であって、前記画像データの多重解像度化を行う多重解像化工程と、多重解像度化された前記画像データに正規化を行う正規化工程と、正規化された前記画像データを、学習データに基づいて、特徴量を求める特徴量導出工程と、前記特徴量に基づいて前記画像データの識別を行う識別工程とを備え、前記多重解像化工程と、前記正規化工程と、前記特徴量導出工程と、前記識別工程とが、バスを介することのないパイプライン処理によって実行されることを特徴とする画像識別方法。
(4)前記ラインメモリが複数に分割され、正規化された前記画像データを複数の前記ラインメモリに記憶し、複数の前記ラインメモリに対応するように設けられた複数の前記特徴量導出部において特徴量を算出する処理が並列して行われることを特徴とする上記(3)に記載の画像識別方法。
(5)撮像素子と、前記撮像素子によって撮像した画像データの識別を行う画像識別装置とを備えた撮像装置であって、前記画像識別装置には、前記画像データの多重解像度化を行う多重解像処理部と、多重解像度化された前記画像データに正規化を行う正規化処理部と、正規化された前記画像データを、学習データに基づいて、特徴量を算出する特徴量導出部と、前記特徴量に基づいて前記画像データの識別を行う識別部とが設けられ、前記多重解像処理部と、前記正規化処理部と、前記特徴量導出部と、前記識別部とが、バスを介することのないパイプライン機構を構成することを特徴とする撮像装置。
(6)撮像素子と、前記撮像素子によって撮像した画像データの識別を行う画像識別装置とを備えた撮像装置を用いた撮像方法であって、前記画像データの多重解像度化を行う多重解像化工程と、多重解像度化された前記画像データに正規化を行う正規化工程と、正規化された前記画像データを、学習データに基づいて、特徴量を算出する特徴量導出工程と、前記特徴量に基づいて前記画像データの識別を行う識別工程とを有し、画像の識別時には、前記画像識別装置において、前記多重解像化工程と、前記正規化工程と、前記特徴量導出工程と、前記識別工程とが、バスを介することのないパイプライン処理によって実行されることを特徴とする撮像方法。
【0009】
本発明は、撮像した画像の識別する場合に、多重解像処理と、正規化処理と、特徴量の導出と、識別処理が、パイプライン処理される。パイプライン処理時には、各処理部同士の間でバスを介することなく信号の入出力が行われる。このため、大容量メモリに記憶された各データをバスを介して読み出す必要がないため、大容量メモリへのデータの保存や読み出しにかかる処理時間を短縮することができる。また、大容量メモリに入力画像フレームデータ、多重解像度データ、正規化データ、特徴量の種類などの各データを全て記憶させておく必要がないため、メモリ容積の増大を防止することで、コストを低減することができる。したがって、デジタルカメラや携帯電話などの低コスト化が必要な分野において適用することができる。
さらに、画像の識別にかかる処理時間を短縮することができるため、車載のカーナビのように高速なリアルタイム性能が要求される画像識別システムに適用することができる。
【発明の効果】
【0010】
本発明によれば、画像識別の処理にかかる時間の高速化を実現できる画像識別装置、画像識別方法、撮像装置及び撮像方法を提供できる。
【発明を実施するための最良の形態】
【0011】
以下、本発明の実施形態を図面に基づいて詳しく説明する。
図1は、本発明にかかる撮像装置の一実施形態の構成を示すブロック図である。本実施形態では、撮像装置の一例としてデジタルカメラの構成を用いて説明する。
撮像装置10は、被写体からの光を受光するレンズ12と、レンズ12に受光した入射光が入射することで画像データを生成する撮像素子14とを備えている。撮像素子14は、例えば、固体撮像素子(CCD)やCMOS型の撮像素子を用いることができる。
【0012】
撮像素子14で生成された画像データがアナログフロントエンド16に出力される。アナログフロントエンド16では、撮像素子14から入力された画像データをアナログ/デジタル変換処理を行い、画像識別部50に出力する。画像の識別時には、後述するように画像識別部50で画像データの識別を行った後、識別された画像データをCPU(中央演算処理部)36に出力される。CPU36の内部には、デジタル信号を処理する信号処理プロセッサ22が設けられている。
【0013】
CPU36には、バス42を介して、AF(オートフォーカス)制御回路32、メインメモリ38、ROM40、I/F(インターフェース)部34、LCD制御部26、メディア制御部30がそれぞれ接続されている。
【0014】
I/F部34には、撮像装置10を使用する使用者が手指などで直接入力することで操作指示を行うための操作手段20が接続されている。
【0015】
LCD制御部26には、LCD18が接続されている。LCD18は、撮像装置10の撮像時の画像や撮像状態を表示する表示手段として機能している。
【0016】
メディア制御部30には、外部記録メディア28が接続されている。外部記録メディア28は、撮像装置10から着脱可能に構成されている。
【0017】
図2は、本実施形態の画像識別部を説明するブロック図である。画像識別部50は、アナログフロントエンド16から画像データが、画像データ入力部52に入力される。画像データは、フレームメモリ54に転送され、一時的に記憶される。次に、画像データに多重解像処理部56において多重解像処理が行われる。多重解像処理が行われた画像データは、ラインメモリ58に記憶され、その後、正規化処理部62において正規化処理が行われる。画像データは、正規化処理が実行された後、ラインメモリ64に一旦記憶された後、特徴量導出部66に出力される。
【0018】
特徴量導出部66は、画像の識別時に、ROM68に予め記憶されている画像識別用の学習データを読み出し、正規化された画像データと学習データとに基づいて画像データの特徴量を導き出す。特徴量とは、画像データが識別の目標としている画像にどの程度一致又は近いものであるかを示す指標である。画像データの特徴量は、識別部72に出力される。識別部72は、画像データの特徴量に基づいて、特徴量が所定の閾値より高い値(又は、低い値)であることを判別することで、画像データの識別を行う。
【0019】
画像データとしては、例えば、被写体の中の人間の顔などである。学習データとして、顔を示す画像情報を予め設定しておき、撮像した画像データと学習データとに基づいて、該画像データが実施に顔であるのかを識別することができる。
【0020】
なお、ROM68には、特徴量導出部66において特徴量を導き出すために必要最小限のデータのみを記憶させておくことができ、従来のような大容量メモリを必要としないため、コストの増大を回避することができる。
【0021】
本実施形態の画像識別部50では、多重解像処理部56と、正規化処理部62と、特徴量導出部66と、識別部72とが、バスを介することのないパイプライン機構を構成している。
このため、本実施形態の撮像装置10は、撮像した画像の識別する場合に、画像データの識別にかかる一連の処理がパイプライン処理され、各処理部同士の間でバスを介することなく信号の入出力が行われる。このため、大容量メモリに記憶された各データをバスを介して読み出す必要がないため、大容量メモリへのデータの保存や読み出しにかかる処理時間を短縮することができる。また、大容量メモリに入力画像フレームデータ、多重解像度データ、正規化データ、特徴量の種類などの各データを全て記憶させておく必要がないため、メモリ容積の増大を防止することで、コストを低減することができる。したがって、デジタルカメラや携帯電話などの低コスト化が必要な分野において適用することができる。
さらに、画像の識別にかかる処理時間を短縮することができるため、車載のカーナビのように高速なリアルタイム性能が要求される画像識別システムに適用することができる。
【0022】
本発明にかかる撮像方法は、上記撮像装置を用いることで好適に実施することができる。撮像装置によって、撮像方法を実施するには、多重解像処理部56で画像データの多重解像度化を行う多重解像化工程と、正規化処理部62で多重解像度化された画像データに正規化を行う正規化工程と、特徴量導出部66で正規化された画像データを、学習データに基づいて、特徴量を算出する特徴量導出工程と、識別部72で特徴量に基づいて画像データの識別を行う識別工程とを有し、画像の識別時には、多重解像化工程と、正規化工程と、特徴量導出工程と、識別工程とが、バスを介することのないパイプライン処理によって実行される。
【0023】
なお、本発明は、デジタルカメラや携帯電話に搭載された撮像装置に限定されず、画像識別部50を画像の識別を行う画像識別装置に適用することができる。画像識別装置は、多重解像処理部と、正規化処理部と、特徴量導出部と、識別部とを備え、これらの処理部が、互いにバスを介することのない、パイプライン機構を構成するものである。
【0024】
次に、本発明にかかる撮像装置及び画像識別装置の変形例を説明する。図3は、画像識別部の一部の構成を示すブロック図である。
図3に示すように正規化処理された画像データを一時的に記憶するラインメモリ64を複数に分割した構成としてもよい。また、ラインメモリ64の分割されたそれぞれの領域に対応するように特徴量導出部66が設けられてよい。そして、画像の識別時に、複数の特徴量導出部66において、同時に並列処理を行うことができる。各特徴量導出部66で導き出された特徴量は、複数の特徴量導出部66の全てに接続されたバッファ69に出力され、その後、識別部72に転送され、画像データの特徴量と学習データとに基づいて識別を行う。こうすることで、画像の識別にかかる時間をより一層短縮することができる。
【0025】
なお、本発明は、前述した実施形態に限定されるものではなく、適宜な変形、改良などが可能である。
【図面の簡単な説明】
【0026】
【図1】本発明にかかる撮像装置の一実施形態の構成を示すブロック図である。
【図2】画像識別部を説明するブロック図である。
【図3】画像識別部の一部の構成を示すブロック図である。
【図4】従来の画像識別システムの一例を示す図である。
【符号の説明】
【0027】
10 撮像装置
14 撮像素子
50 画像識別部
56 多重解像処理部
62 正規化処理部
66 特徴量導出部

【特許請求の範囲】
【請求項1】
画像データの識別を行う画像識別装置であって、
前記画像データの多重解像度化を行う多重解像処理部と、
多重解像度化された前記画像データに正規化を行う正規化処理部と、
正規化された前記画像データを、学習データに基づいて、特徴量を求める特徴量導出部と、
前記特徴量に基づいて前記画像データの識別を行う識別部とを備え、
前記多重解像処理部と、前記正規化処理部と、前記特徴量導出部と、前記識別部とが、バスを介することのないパイプライン機構を構成することを特徴とする画像識別装置。
【請求項2】
正規化された前記画像データを記憶するラインメモリを備え、前記ラインメモリが複数に分割され、分割されたそれぞれのラインメモリに対応するように前記特徴量導出部が複数設けられていることを特徴とする請求項1に記載の画像識別装置。
【請求項3】
画像データの識別を行う画像識別方法であって、
前記画像データの多重解像度化を行う多重解像化工程と、
多重解像度化された前記画像データに正規化を行う正規化工程と、
正規化された前記画像データを、学習データに基づいて、特徴量を求める特徴量導出工程と、
前記特徴量に基づいて前記画像データの識別を行う識別工程とを備え、
前記多重解像化工程と、前記正規化工程と、前記特徴量導出工程と、前記識別工程とが、バスを介することのないパイプライン処理によって実行されることを特徴とする画像識別方法。
【請求項4】
前記ラインメモリが複数に分割され、正規化された前記画像データを複数の前記ラインメモリに記憶し、複数の前記ラインメモリに対応するように設けられた複数の前記特徴量導出部において特徴量を算出する処理が並列して行われることを特徴とする請求項3に記載の画像識別方法。
【請求項5】
撮像素子と、
前記撮像素子によって撮像した画像データの識別を行う画像識別装置とを備えた撮像装置であって、
前記画像識別装置には、前記画像データの多重解像度化を行う多重解像処理部と、多重解像度化された前記画像データに正規化を行う正規化処理部と、
正規化された前記画像データを、学習データに基づいて、特徴量を算出する特徴量導出部と、前記特徴量に基づいて前記画像データの識別を行う識別部とが設けられ、前記多重解像処理部と、前記正規化処理部と、前記特徴量導出部と、前記識別部とが、バスを介することのないパイプライン機構を構成することを特徴とする撮像装置。
【請求項6】
撮像素子と、
前記撮像素子によって撮像した画像データの識別を行う画像識別装置とを備えた撮像装置を用いた撮像方法であって、
前記画像データの多重解像度化を行う多重解像化工程と、多重解像度化された前記画像データに正規化を行う正規化工程と、正規化された前記画像データを、学習データに基づいて、特徴量を算出する特徴量導出工程と、前記特徴量に基づいて前記画像データの識別を行う識別工程とを有し、画像の識別時には、前記画像識別装置において、前記多重解像化工程と、前記正規化工程と、前記特徴量導出工程と、前記識別工程とが、バスを介することのないパイプライン処理によって実行されることを特徴とする撮像方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2008−210009(P2008−210009A)
【公開日】平成20年9月11日(2008.9.11)
【国際特許分類】
【出願番号】特願2007−43913(P2007−43913)
【出願日】平成19年2月23日(2007.2.23)
【出願人】(306037311)富士フイルム株式会社 (25,513)
【Fターム(参考)】