説明

情報処理装置、情報処理方法、およびプログラム

【課題】識別対象画像の被写体が登録済みの被写体のいずれであるかを判別する際の精度を向上させる。
【解決手段】輝度レベル飽和処理部21は、登録用元画像に対して、露出過多で撮像された状態を再現するための画像処理を行うことにより登録用画像を生成する。反対に、輝度レベル間引き処理部22は、登録用元画像に対して、露出不足で撮像された状態を再現するための画像処理を行うことにより登録用画像を生成する。本発明は、顔判別などの画像識別装置に適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、例えば、撮像された被写体を識別する場合に用いて好適な情報処理装置、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
従来、識別対象とする人物の顔を撮像し、その結果得られる画像に基づいて、その人物が誰であるのかを判別する顔識別技術が存在する。
【0003】
図1は、従来存在する顔識別技術の一連の動作(以下、顔識別処理と称する)を説明するフローチャートである。
【0004】
顔識別処理は、識別対象となり得る人物(登録人物)の顔を予め登録する登録フェーズと、識別対象とする人物の顔を判別する判別フェーズとからなり、以下に説明するステップS1乃至S3の処理が登録フェーズ、ステップS4乃至S7の処理が判別フェーズである。
【0005】
登録フェーズであるステップS1においては、各登録人物の顔が様々な撮像条件の下で複数の登録用画像が撮像される。ここで、様々な撮像条件とは、照明の位置や照度を変化させたものを指す。様々な撮像条件の中には、人物の顔が適切な輝度で撮像される、最適な撮像される照明の位置や照度を示す撮像条件もあるが、例えば、逆光となって人物の顔の輝度が不足してしまったり、反対に、人物の顔の輝度が飽和したりしてしまう不適切な撮像条件も含まれる。
【0006】
ステップS2においては、複数の登録用画像の特徴量が抽出される。ステップS3では、複数の登録用画像から抽出された特徴量が各登録人物に対応付けて、データベースに蓄積される。
【0007】
判別フェーズであるステップS4においては、識別対象とする人物の顔が撮像されて識別対象画像が生成される。ステップS5においては、識別対象画像の特徴量が抽出される。
【0008】
ステップS6においては、識別対象画像の特徴量と、データベースに登録済みの登録用画像の特徴量との類似度が算出される。ステップS7においては、算出された類似度に基づいて識別対象画像の人物が登録人物のうちの誰であるかが判別される(登録人物の誰にも判別されないこともある)。
【0009】
上述したように、登録フェーズにおいて、不適切な撮像条件の下で撮像した登録画像の特徴量も登録することにより、判別フェーズにおいて、識別対象とする人物の顔の撮像が不適切な撮像条件の下で行われたとしても、その顔を判別することが可能となる。
【0010】
ただし、上述した顔識別処理では、登録フェーズにおいて、同一の登録人物に対して様々な撮像条件の下で複数回撮像を行わなければならず、この処理が面倒である。
【0011】
そこで、登録人物を1回のみ撮像し、その結果得られた画像に対して様々な補正を行うことにより複数の登録用画像を得る方法も提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0012】
【特許文献1】特開2008−251039号公報
【発明の概要】
【発明が解決しようとする課題】
【0013】
上述したように、撮像して得られた画像を補正することにより複数の登録用画像を得ることは従来提案されているものの、具体的には、補正により、単に画像全体を明るくしたり、暗くしたりしているに過ぎない。
【0014】
また、判別フェーズでの判別精度を上げるためには、識別対象画像を撮像する撮像部(カメラ)の特性なども考慮した補正により登録用画像を生成すべきであるが、現状、そのような方法は提案されていない。
【0015】
本発明はこのような状況に鑑みてなされたものであり、識別対象画像を撮像する撮像部(カメラ)の特性に基づく補正により登録用画像を生成することにより、判別フェーズでの判別精度を向上させるようにするものである。
【課題を解決するための手段】
【0016】
本発明の一側面である情報処理装置は、撮像部の撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の異なる複数の照明条件が想定された複数の登録用画像を生成する登録用画像生成手段と、前記識別対象とする被写体が撮像されている識別対象画像および前記複数の登録用画像のそれぞれの特徴量を抽出する特徴量抽出手段と、前記識別対象画像の特徴量と、前記複数の登録用画像の特徴量との類似度に基づき、前記識別対象画像の被写体を識別する識別手段とを含む。
【0017】
前記登録用画像生成手段は、前記撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の露光過多が想定された飽和処理により前記登録用画像を生成することができる。
【0018】
前記撮像特性は、前記撮像部におけるγ補正のパラメータ、またはニー補正における閾値の少なくとも一方を含むことができる。
【0019】
前記登録用画像生成手段は、さらに、登録する被写体が撮像されている登録用元画像を元にして、撮像時の露光不足が想定された間引き処理により前記登録用画像を生成することができる。
【0020】
本発明の一側面である情報処理装置は、登録または識別の対象とする被写体を撮像する前記撮像部から前記撮像特性を取得する取得手段をさらに含むことができる。
【0021】
本発明の一側面である情報処理装置は、登録または識別の対象とする被写体を撮像する前記撮像部の前記撮像特性を予め保持する保持手段をさらに含むことができる。
【0022】
本発明の一側面である情報処理方法は、情報処理装置による、撮像部の撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の異なる複数の照明条件が想定された複数の登録用画像を生成する登録用画像生成ステップと、前記複数の登録用画像のそれぞれの特徴量を抽出する第1の特徴量抽出ステップと、前記識別対象とする被写体が撮像されている識別対象画像の特徴量を抽出する第2の特徴量抽出ステップと、前記識別対象画像の特徴量と、前記複数の登録用画像の特徴量との類似度に基づき、前記識別対象画像の被写体を識別する識別ステップとを含む。
【0023】
本発明の一側面であるプログラムは、コンピュータを、撮像部の撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の異なる複数の照明条件が想定された複数の登録用画像を生成する登録用画像生成手段と、前記識別対象とする被写体が撮像されている識別対象画像および前記複数の登録用画像のそれぞれの特徴量を抽出する特徴量抽出手段と、前記識別対象画像の特徴量と、前記複数の登録用画像の特徴量との類似度に基づき、前記識別対象画像の被写体を識別する識別手段として機能させる。
【0024】
本発明の一側面においては、撮像部の撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の異なる複数の照明条件が想定された複数の登録用画像が生成される。また、識別対象とする被写体が撮像されている識別対象画像および複数の登録用画像のそれぞれの特徴量が抽出され、識別対象画像の特徴量と、複数の登録用画像の特徴量との類似度に基づき、識別対象画像の被写体が識別される。
【発明の効果】
【0025】
本発明の一側面によれば、判別フェーズでの判別精度を向上させることができる。
【図面の簡単な説明】
【0026】
【図1】従来の顔識別処理を説明するフローチャートである。
【図2】本発明を適用した画像識別装置の構成例を示すブロック図である。
【図3】図2の登録用画像生成部の詳細な構成例を示すブロック図である。
【図4】露出過多、または露出不足で撮像された状態を説明したための図である。
【図5】ニー補正に基づいて飽和処理を説明するための図である。
【図6】γ補正に基づいて飽和処理を説明するための図である。
【図7】ディテール処理を説明するための図である。
【図8】本発明を適用した顔識別処理を説明するフローチャートである。
【図9】コンピュータの構成例を示すブロック図である。
【発明を実施するための形態】
【0027】
以下、発明を実施するための最良の形態(以下、実施の形態と称する)について、図面を参照しながら詳細に説明する。なお、説明は、以下の順序で行なう。
【0028】
<1.実施の形態>
[画像識別装置の構成例]
図2は、本発明の実施の形態である画像識別装置の構成例を示している。
【0029】
この画像識別装置10は、登録フェーズにおいて、登録する被写体(例えば、人物の顔)を撮像し、その結果得られた画像に所定の画像処理を施して複数の登録用画像を生成し、複数の登録用画像の特徴量を抽出してデータベースに蓄積する。または、画像識別装置10は、判別フェーズにおいて、識別対象画像の被写体が、予め登録されている被写体のいずれと同一であるかを識別する。
【0030】
画像識別装置10は、撮像部11、撮像特性取得部12、登録用画像生成部13、特徴量抽出部14、登録用画像DB(データベース)15、類似度計算部16、および判別部17から構成される。
【0031】
撮像部11は、例えばデジタルカメラから成り、登録フェーズにおいては、登録する被写体をモノクロ撮像し、その結果得られる輝度画像(以下、登録用元画像と称する)を登録用画像生成部13に出力する。また、判別フェーズにおいては、識別対象とする被写体をモノクロ撮像し、その結果得られる輝度画像(以下、識別対象画像と称する)を特徴量抽出部14に出力する。なお、撮像部11にて被写体をカラー撮像し、その画素のうちの輝度成分にのみ着目するようにしてもよい。
【0032】
撮像特性取得部12は、撮像部11の撮像特性、具体的には、撮像された画像を解析することにより、γ補正におけるパラメータや、ニー補正におけるニー補正閾値などを取得して登録用画像生成部13に通知する。
【0033】
なお、予め取得または推測した撮像部11の撮像特性を、登録用画像生成部13の内部に設けたメモリ(不図示)などに保持しておくようにしてもよい。この場合、撮像特性取得部12が撮像部11から撮像特性を取得できないときに、保持されている撮像特性を用いるようにすればよいし、あるいは、撮像特性取得部12を省略するようにしてもよい。さらに、撮像部11が出力する画像のフォーマットに依存するが、撮像特性を画像のプロパティ情報から読み出すようにしてもよい。
【0034】
登録用画像生成部13は、通知される撮像部11の撮像特性に基づき、撮像部11から入力される登録用元画像に所定の画像処理を行い、その結果得られる複数の登録用画像を特徴量抽出部14に出力する。また、登録用画像生成部13は、入力される登録用元画像もそのまま登録用画像として特徴量抽出部14に出力する。
【0035】
特徴量抽出部14は、登録フェーズにおいて、登録用画像生成部13から入力される複数の登録用画像の特徴量を抽出して登録用画像DB15に出力する。また、特徴量抽出部14は、判別フェーズにおいて、撮像部11から入力される識別対象画像の特徴量を抽出して類似度計算部16に出力する。なお、特徴量の抽出方法については任意である。
【0036】
登録用画像DB15は、登録する被写体の識別情報に対し、対応する複数の登録用画像から抽出された特徴量を対応付けて登録する。
【0037】
類似度計算部16は、判別フェーズにおいて、識別対象画像の特徴量と、登録用画像DB15に登録されている各登録用画像のとの類似度を算出して判別部17に出力する。ここで、類似度は、例えば特徴量が多次元ベクトルによって表現される場合には、両者の距離により表現することができる。
【0038】
判別部17は、類似度計算部16により算出される類似度に基づき、識別対象画像の被写体が、予め登録されている被写体のいずれと同一であるかを判別する。
【0039】
[登録用画像生成部13の詳細な構成例]
図3は、登録用画像生成部13の詳細な構成例を示している。
【0040】
登録用画像生成部13は、輝度レベル飽和処理部21、輝度レベル間引き処理部22、および輝度レベルディテール処理部23から構成される。
【0041】
輝度レベル飽和処理部21は、登録用元画像に対して、露出過多で撮像された状態を再現するための画像処理を行うことにより登録用画像を生成する。反対に、輝度レベル間引き処理部22は、登録用元画像に対して、露出不足で撮像された状態を再現するための画像処理を行うことにより登録用画像を生成する。
【0042】
図4は、露出過多で撮像された状態、および露出不足で撮像された状態を示している。以下、同図に示されるように、人の顔を撮像し、その目付近のx方向ラインに注目した場合を例にして説明する。
【0043】
撮像時の露出が適正である場合、その輝度は、許容されている範囲(例えば、8ビットの場合には0乃至255)に分散して配置される。しかしながら、その撮像時に露出過多であると、その輝度は、全体的に大きな値となり、画素によっては最大値(例えば、8ビットの場合には255)に飽和してしまうことになる。反対に、その撮像時に露出不足であると、その輝度は、全体的に小さな値となり、各画素の輝度の差が小さくなる、すなわち、量子化誤差が生じてしまうことになる。
【0044】
そこで、輝度レベル飽和処理部21では、撮像部11の撮像特性に基づいて、登録用元画像の輝度を増加させ、輝度に許容されている最大値(例えば、8ビットの場合には255)を超える画素については最大値に置換することにより登録用画像を生成する。なお、登録用元画像の輝度を増加させる程度を変化させることにより、飽和している画素の面積が異なる、露出過多が再現された複数の登録用画像を生成するようにしてもよい。
【0045】
具体的には、撮像部11において、図5に示すように、ニー補正閾値を越える高輝度域を圧縮するニー補正が行われている場合、曲線aで示される登録用元画像の輝度を、曲線bで示されるまで増加させ、ニー補正閾値を越えた輝度についてその値を圧縮して曲線b’に示す登録用画像を生成する。また、曲線aで示される登録用元画像の輝度を、曲線cで示されるまで増加させ、ニー補正閾値を越えた輝度についてその値を圧縮し、さらに最大値を超える輝度については最大値に置換して曲線c’に示す登録用画像を生成する。
【0046】
また、撮像部11において、図6に示すように、γ補正が行われている場合には、登録用元画像の輝度を増加させた後、γ補正を行って登録用画像を生成する。また、曲線aで示される登録用元画像の輝度を、曲線cで示されるまで増加させ、ニー補正閾値を越えた輝度についてその値を圧縮し、さらに最大値を超える輝度については最大値に置換して曲線c’に示す登録用画像を生成する。
【0047】
図3に戻る。輝度レベル間引き処理部22では、登録用元画像の輝度の上位ビットを間引くことにより、輝度を低減させて、意図的に量子化誤差が生じている登録用画像を生成する。なお、登録用元画像の輝度を上位ビット側から1ビットだけ間引いた登録用画像、2ビットだけ間引いた登録用画像、3ビットだけ間引いた登録用画像などの、露出不足が再現された複数の登録用画像を生成するようにしてもよい。
【0048】
輝度レベルディテール処理部23は、登録用元画像に対し、例えば図7に示されるような輝度のエッジを強調する処理を施して登録用画像を生成する。
【0049】
輝度レベル飽和処理部21、輝度レベル間引き処理部22、および輝度レベルディテール処理部23にて生成された各登録用画像は、特徴量抽出部14に出力される。
【0050】
なお、さらに、登録用画像生成部13において、ピントが合っていないまま撮像された状態を再現するための画像処理を行うことにより登録用画像を生成するようにしてもよい。
[動作説明]
次に、画像識別装置10の動作について図8を参照して説明する。図8は、画像識別装置10による顔識別処理を説明するフローチャートである。
【0051】
この顔識別処理は、識別対象となり得る人物(登録人物)の顔を予め登録する登録フェーズと、識別対象とする人物の顔を識別する判別フェーズとからなり、以下に説明するステップS21乃至S25の処理が登録フェーズ、ステップS26乃至S29の処理が判別フェーズである。
【0052】
登録フェーズであるステップS21において、撮像特性取得部12は、撮像部11の撮像特性を取得して登録用画像生成部13に通知する。
【0053】
ステップS22において、撮像部11は、各登録人物の顔を撮像し、その結果得られた登録用元画像を登録用画像生成部13に出力する。
【0054】
ステップS23において、登録用画像生成部13は、通知された撮像部11の撮像特性に基づき、撮像部11から入力された登録用元画像を元にして複数の登録用画像を特徴量抽出部14に出力する。また、登録用元画像もそのまま登録用画像として特徴量抽出部14に出力する。
【0055】
ステップS24において、特徴量抽出部14は、複数の登録用画像からそれぞれの特徴量を抽出して登録用データベースDB15に出力する。ステップS25において、登録用画像DB15は、登録する被写体の識別情報に対し、対応する複数の登録用画像から抽出された特徴量を対応付けて登録する。
【0056】
判別フェーズであるステップS26において、撮像部11は、識別対象とする人物の顔を撮像し、その結果得られた識別対象画像を特徴量抽出部14に出力する。ステップS27において、特徴量抽出部14は、識別対象画像の特徴量を抽出して類似度計算部16に出力する。
【0057】
ステップS28において、類似度計算部16は、登録用データベースDB15を参照し、識別対象画像の特徴量と、登録用データベースDB15に登録済みの各登録用画像の特徴量との類似度を算出して判別部17に出力する。ステップS29において、判別部17は、算出された類似度に基づいて、識別対象画像の人物が登録人物のうちの誰であるかを判別する。以上で、顔識別処理は終了される。
【0058】
上述した顔識別処理によれば、撮像特性を考慮して、登録用元画像から複数の登録用画像を生成しているので、仮に識別対象画像を撮像するときに露出過多であったり、反対に露出不足であったりしても、判別精度を低下させることなく、識別対象画像の人物を判別することができる。
【0059】
なお、本実施の形態においては、登録フェーズにおいて、登録用元画像から複数の登録用画像を生成しその特徴量を計算して登録するようにしたが、登録フェーズにおいて、登録用元画像のみの特徴量を計算して登録するようにし、識別フェーズにおいて、登録用元画像から複数の登録用画像を生成しその特徴量を計算するようにしてもよい。
【0060】
また、本実施の形態においては、人の顔を識別対象としたが、識別対象はこれに限るものではなく任意である。
【0061】
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどに、プログラム記録媒体からインストールされる。
【0062】
図9は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0063】
このコンピュータ100において、CPU(Central Processing Unit)101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。
【0064】
バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、キーボード、マウス、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111を駆動するドライブ110が接続されている。
【0065】
以上のように構成されるコンピュータ100では、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105およびバス104を介して、RAM103にロードして実行することにより、上述した一連の処理が行われる。
【0066】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであってもよいし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであってもよい。
【0067】
また、プログラムは、1台のコンピュータにより処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであってもよい。
【0068】
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【符号の説明】
【0069】
10 画像識別装置, 11 撮像部, 12 撮像特性取得部, 13 登録用画像生成部, 14 特徴量抽出部, 15 登録用画像DB, 16 類似度計算部, 17 判別部, 21 輝度レベル飽和処理部, 22 輝度レベル間引き処理部, 23 輝度レベルディテール処理部

【特許請求の範囲】
【請求項1】
撮像部の撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の異なる複数の照明条件が想定された複数の登録用画像を生成する登録用画像生成手段と、
前記識別対象とする被写体が撮像されている識別対象画像および前記複数の登録用画像のそれぞれの特徴量を抽出する特徴量抽出手段と、
前記識別対象画像の特徴量と、前記複数の登録用画像の特徴量との類似度に基づき、前記識別対象画像の被写体を識別する識別手段と
を含む情報処理装置。
【請求項2】
前記登録用画像生成手段は、前記撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の露光過多が想定された飽和処理により前記登録用画像を生成する
請求項1に記載の情報処理装置。
【請求項3】
前記撮像特性は、前記撮像部におけるγ補正のパラメータ、またはニー補正における閾値の少なくとも一方を含む
請求項1または2に記載の情報処理装置。
【請求項4】
前記登録用画像生成手段は、さらに、登録する被写体が撮像されている登録用元画像を元にして、撮像時の露光不足が想定された間引き処理により前記登録用画像を生成する
請求項1乃至3に記載の情報処理装置。
【請求項5】
登録または識別の対象とする被写体を撮像する前記撮像部から前記撮像特性を取得する取得手段を
さらに含む請求項1乃至4に記載の情報処理装置。
【請求項6】
登録または識別の対象とする被写体を撮像する前記撮像部の前記撮像特性を予め保持する保持手段を
さらに含む請求項1乃至5に記載の情報処理装置。
【請求項7】
情報処理装置の情報処理方法において、
情報処理装置による、
撮像部の撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の異なる複数の照明条件が想定された複数の登録用画像を生成する登録用画像生成ステップと、
前記複数の登録用画像のそれぞれの特徴量を抽出する第1の特徴量抽出ステップと、
前記識別対象とする被写体が撮像されている識別対象画像の特徴量を抽出する第2の特徴量抽出ステップと、
前記識別対象画像の特徴量と、前記複数の登録用画像の特徴量との類似度に基づき、前記識別対象画像の被写体を識別する識別ステップと
を含む情報処理方法。
【請求項8】
コンピュータを、
撮像部の撮像特性に基づき、登録する被写体が撮像されている登録用元画像を元にして、撮像時の異なる複数の照明条件が想定された複数の登録用画像を生成する登録用画像生成手段と、
前記識別対象とする被写体が撮像されている識別対象画像および前記複数の登録用画像のそれぞれの特徴量を抽出する特徴量抽出手段と、
前記識別対象画像の特徴量と、前記複数の登録用画像の特徴量との類似度に基づき、前記識別対象画像の被写体を識別する識別手段と
して機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−58954(P2012−58954A)
【公開日】平成24年3月22日(2012.3.22)
【国際特許分類】
【出願番号】特願2010−200734(P2010−200734)
【出願日】平成22年9月8日(2010.9.8)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】