撮像装置および表情評価装置
【課題】被撮影者あるいは撮影者にとってより満足度の高い画像を撮像できるようにする。
【解決手段】撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、顔検出部31は、その画像信号から人物の顔を検出し、表情評価部41は、検出された顔の表情を評価して、例えば笑顔と通常の表情などの異なる表情の間において一方の表情にどれだけ近いかの度合いを示す表情評価値を算出する。報知制御部42は、算出された表情評価値の大きさを視覚的に示す報知情報を生成して、例えばディスプレイ16を通じて、撮影者あるいは被撮影者などに対して報知するように制御する。さらに、表情評価部41は、表情評価値が所定のしきい値を超えた場合には、記録動作制御部43に対して、画像信号を記録媒体に記録させるように要求する。
【解決手段】撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、顔検出部31は、その画像信号から人物の顔を検出し、表情評価部41は、検出された顔の表情を評価して、例えば笑顔と通常の表情などの異なる表情の間において一方の表情にどれだけ近いかの度合いを示す表情評価値を算出する。報知制御部42は、算出された表情評価値の大きさを視覚的に示す報知情報を生成して、例えばディスプレイ16を通じて、撮影者あるいは被撮影者などに対して報知するように制御する。さらに、表情評価部41は、表情評価値が所定のしきい値を超えた場合には、記録動作制御部43に対して、画像信号を記録媒体に記録させるように要求する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、固体撮像素子を用いて画像を撮像する撮像装置、および、撮像された顔の表情を評価する表情評価装置に関する。
【背景技術】
【0002】
撮像装置において、シャッタボタンを押下する操作から一定時間経過後に自動的にシャッタを切る、いわゆるセルフタイマ機能は、銀塩カメラのみならず、デジタルスチルカメラにも一般的に搭載されている。しかし、このセルフタイマ機能によりシャッタが切られるタイミングは事前に決められたものとなるので、シャッタを切った時点で被撮影者が必ずしもよい表情となるという保証はなく、満足のいかない写真が撮像されることが少なくないという問題があった。
【0003】
一方、近年では、画像信号を基にデジタル演算処理する画像処理技術が急速に進んでおり、その例として、画像から人間の顔を検出する技術がある。例えば、顔画像中の2画素間の輝度差を特徴量として学習しておき、その特徴量に基づいて入力画像中の所定領域が顔であるか否かを示す推定値を算出し、その1以上の推定値から領域内の画像が顔であるか否かを最終的に判別するようにした顔検出技術があった(例えば、特許文献1参照)。
【0004】
このような顔検出技術は、デジタルスチルカメラなど、固体撮像素子で撮像を行うデジタル方式の撮像装置に搭載できるレベルまで開発が進んでおり、最近ではさらに、検出された顔の表情を判別する技術なども注目されている。例えば、連続して複数コマを撮像した画像信号から、被撮影者の顔の表情などを撮像画像ごとに評価し、それらの評価情報から好適な画像を選択できるようにすることが考えられている(例えば、特許文献2参照)。
【特許文献1】特開2005−157679号公報(段落番号〔0040〕〜〔0052〕、図1)
【特許文献2】特開2004−46591号公報(段落番号〔0063〕〜〔0071〕、図3)
【発明の開示】
【発明が解決しようとする課題】
【0005】
ところで、最近ではデジタル方式の撮像装置のメーカ間競争が激化していることから、このような撮像装置を高機能化して、その商品価値を高めることが強く求められている。また、上述したセルフタイマ機能の問題点のように、撮像した画像は撮影者や被撮影者にとって必ずしも満足のいくものとはならないことから、このような満足度を高めるべく撮像動作を補助する機能は、商品価値を高めるための非常に重要なものと言える。特に、発達の進んでいる画像処理技術を用いてこのような機能を実現することが望まれているが、撮像動作中にリアルタイムにその動作を補助するような機能は実現されていなかった。
【0006】
本発明はこのような課題に鑑みてなされたものであり、被撮影者あるいは撮影者にとってより満足度の高い画像を撮像することが可能な撮像装置を提供することを目的とする。
また、本発明の他の目的は、被撮影者あるいは撮影者にとってより満足度の高い画像を撮像することが可能な表情評価装置を提供することである。
【課題を解決するための手段】
【0007】
本発明では上記課題を解決するために、固体撮像素子を用いて画像を撮像する撮像装置において、撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出する顔検出部と、検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、前記特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する表情評価部と、算出された前記表情評価値の大きさを視覚的に示す報知情報を報知する報知部とを有することを特徴とする撮像装置が提供される。
【0008】
このような撮像装置では、顔検出部が、撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出し、表情評価部が、顔検出部により検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する。報知部は、算出された表情評価値の大きさを視覚的に示す報知情報を報知する。
【発明の効果】
【0009】
本発明の撮像装置によれば、撮像された画像信号を記録媒体に記録するまでの期間において、撮像された画像から人物の顔が検出され、その顔の表情が評価されて、その表情が、特定の表情とそれ以外の表情との間において、特定の表情にどれだけ近いかの度合いを示す表情評価値が算出される。そして、その表情評価値の大きさを視覚的に示す報知情報が報知される。従って、被撮影者の表情が撮像に適しているかを例えば被撮影者あるいは撮影者などに認識させることができるので、被撮影者や撮影者にとって満足度の高い画像を確実に記録媒体に記録できるようになる。
【発明を実施するための最良の形態】
【0010】
以下、本発明の実施の形態を図面を参照して詳細に説明する。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る撮像装置の要部構成を示すブロック図である。
【0011】
図1に示す撮像装置は、デジタルスチルカメラあるいはデジタルビデオカメラなどとして実現されるものである。この撮像装置は、光学ブロック11、ドライバ11a、撮像素子12、タイミングジェネレータ(TG)12a、アナログフロントエンド(AFE)回路13、カメラ信号処理回路14、グラフィック処理回路15、ディスプレイ16、画像エンコーダ17、記録装置18、マイクロコンピュータ19、入力部20、LED(Light Emitting Diode)発光部21、および音声出力部22を具備する。
【0012】
光学ブロック11は、被写体からの光を撮像素子12に集光するためのレンズ、レンズを移動させてフォーカス合わせやズーミングを行うための駆動機構、シャッタ機構、アイリス機構などを具備している。ドライバ11aは、マイクロコンピュータ19からの制御信号に基づいて、光学ブロック11内の各機構の駆動を制御する。
【0013】
撮像素子12は、例えば、CCD(Charge Coupled Device)型、CMOS(Complementary Metal Oxide Semiconductor)型などの固体撮像素子であり、TG12aから出力されるタイミング信号に基づいて駆動され、被写体からの入射光を電気信号に変換する。TG12aは、マイクロコンピュータ19の制御の下でタイミング信号を出力する。
【0014】
AFE回路13は、撮像素子12から出力された画像信号に対して、CDS(Correlated Double Sampling)処理によりS/N(Signal/Noise)比を良好に保つようにサンプルホールドを行い、さらにAGC(Auto Gain Control)処理により利得を制御し、A/D変換を行ってデジタル画像データを出力する。
【0015】
カメラ信号処理回路14は、AFE回路13からの画像データに対して、AF(Auto Focus)、AE(Auto Exposure)、各種画質補正処理のための検波処理や、検波情報を基にマイクロコンピュータ19から出力される信号に応じた画質補正処理を施す。なお、後述するように、本実施の形態では、このカメラ信号処理回路14は、顔検出機能およびその顔領域のデータを切り出す機能を備えている。
【0016】
グラフィック処理回路15は、カメラ信号処理回路14から出力された画像データを、ディスプレイ16に表示するための信号に変換し、ディスプレイ16に供給する。また、マイクロコンピュータ19からの要求に応じて、後述する表情スコアなどの情報を画像上に合成する。ディスプレイ16は、例えばLCD(Liquid Crystal Display)などからなり、グラフィック処理回路15からの画像信号を基に画像を表示する。
【0017】
画像エンコーダ17は、カメラ信号処理回路14から出力された画像データを圧縮符号化し、符号化データを記録装置18に出力する。具体的には、カメラ信号処理回路14で処理された1フレーム分の画像データを、JPEG(Joint Photographic Experts Group)などの符号化方式に従って圧縮符号化し、静止画像の符号化データを出力する。なお、静止画像だけでなく、動画像のデータを圧縮符号化できるようにしてもよい。
【0018】
記録装置18は、画像エンコーダ17からの符号化データを画像ファイルとして記録する装置であり、例えば、磁気テープ、光ディスクなどの可搬型記録媒体のドライブ装置、あるいはHDD(Hard Disk Drive)などとして実現される。
【0019】
マイクロコンピュータ19は、CPU(Central Processing Unit)や、ROM(Read Only Memory)、RAM(Random Access Memory)などのメモリを備え、メモリに格納されたプログラムを実行することで、この撮像装置を統括的に制御する。
【0020】
入力部20は、各種の入力スイッチに対するユーザによる操作入力に応じた制御信号を、マイクロコンピュータ19に出力する。この入力スイッチとしては、例えば、シャッタレリーズボタン、各種メニュー選択や動作モードの設定などを行うための十字キーなどが設けられる。
【0021】
LED発光部21は、マイクロコンピュータ19からの制御信号に基づき、撮像装置の外装面に設けられたLEDを点灯させる。このLEDとしては、例えば、セルフタイマ機能の動作中であることを示すものなどが考えられる。
【0022】
音声出力部22は、マイクロコンピュータ19からの制御信号に基づき、例えば動作確認音などの音声を出力する。なお、音声データのエンコーダ/デコーダを備える場合には、この音声データを再生したときの再生音声を出力してもよい。
【0023】
この撮像装置では、撮像素子12によって受光されて光電変換された信号が、順次AFE回路13に供給され、CDS処理やAGC処理が施された後、デジタル画像データに変換される。カメラ信号処理回路14は、AFE回路13から供給された画像データを画質補正処理し、処理後の画像データはグラフィック処理回路15に供給されて表示用の画像信号に変換される。これによりディスプレイ16には、現在撮像中の画像(カメラスルー画像)がディスプレイ16に表示され、撮影者はこの画像を視認して画角を確認できるようになる。
【0024】
また、この状態から、入力部20のシャッタレリーズボタンが押下されることなどにより、マイクロコンピュータ19に対して画像の記録が指示されると、カメラ信号処理回路14からの画像データは画像エンコーダ17に供給され、圧縮符号化処理が施されて、記録装置18に記録される。静止画像の記録の際には、カメラ信号処理回路14からは1フレーム分の画像データが画像エンコーダ17に供給され、動画像の記録の際には、処理された画像データが画像エンコーダ17に連続的に供給される。
【0025】
次に、この撮像装置が備える撮像動作モードについて説明する。この撮像装置は、静止画像を撮像する際に、撮像画像から被撮影者の顔を検出して、その表情を評価し、評価の度合いを示す情報を被撮影者に報知するモードと、その評価の度合いに応じて自動的にシャッタを切り、静止画像データを記録装置18に記録するモードとを備えている。以下、前者モードを「表情評価モード」、後者を「表情応答記録モード」と呼ぶことにする。
【0026】
表情評価モードでは、撮像画像から顔を検出した場合に、その顔の表情を評価し、評価に応じた情報を被撮影者に報知して、被撮影者がより撮像に適した表情になるように促す役割を果たす。例えば、表情として笑顔であるか否かの度合いを評価する。また、表情応答記録モードでは、その評価値が所定の値を超えたときに、被撮影者の顔が撮像に適した表情になったと判断して、自動的に静止画像データを記録する。これにより、被撮影者にとってより満足度の高い画像を記録できるように補助する。なお、ここでは表情評価モードと表情応答記録モードの2つのモードを備えるものとしているが、表情応答記録モードのみを備えていてもよい。
【0027】
図2は、表情評価モードおよび表情応答記録モードを実現するために撮像装置が備える機能を示すブロック図である。
図2に示すように、この撮像装置は、上記各撮像動作モードを実現するための機能として、顔検出部31、顔画像生成部32、表情評価部41、報知制御部42、および記録動作制御部43を備えている。本実施の形態では、顔検出部31および顔画像生成部32は、カメラ信号処理回路14内のハードウェアによって実現され、表情評価部41、報知制御部42および記録動作制御部43は、マイクロコンピュータ19によって実行されるソフトウェアの機能として実現される。ただし、これらの機能のそれぞれは、ハードウェアあるいはソフトウェアのいずれによって実現されてもよい。また、マイクロコンピュータ19は、表情評価部41による表情評価演算に用いるための判別軸情報44を、その内部のROMなどのメモリにあらかじめ保持している。後述するように、判別軸情報44は、2つの表情についての多数の顔のサンプルデータから主成分分析によって得た信号成分を基に、線形判別分析を行って得た表情の判別軸を示すベクトルの係数情報などを含む。
【0028】
ここで、以下の図3および図4を用いて、図2に示した各機能の動作を説明する。まず、図3は、表情評価モードにおける動作の概要を示す図である。
表情評価モードでは、まず、顔検出部31が、撮像素子12による撮像により得られ、カメラ信号処理回路14内を伝達される画像データを基に、その画像から被撮影者の顔を検出する(ステップS1)。そして、検出した顔の領域を示す検出情報を顔画像生成部32に出力する。なお、本実施の形態のように、表情評価値に応じた情報をディスプレイ16に表示することで報知する場合、顔検出部31からの顔の検出情報は、マイクロコンピュータ19の報知制御部42にも供給される。
【0029】
顔の検出手法としては周知の手法を適用することが可能であるが、例えば、特許文献1に記載された手法を用いることができる。この手法では、まず、顔画像中の2画素間の輝度差を学習し、特徴量としてあらかじめ保持しておく。そして、図3のステップS1の欄に示すように、入力画像に対して一定の大きさのウィンドウW1を順次当てはめていき、ウィンドウW1の中の画像に顔が含まれるか否かを特徴量を基に推定して、推定値を出力する。このとき、入力画像を順次縮小して同じ処理を行うことで、一定の大きさのウィンドウW1を用いて推定を行うことができる。そして、それらの動作により得られた推定値から、顔が存在する領域を最終的に判別する。
【0030】
次に、顔画像生成部32は、入力画像から、検出された顔の領域Afのデータを切り出す(ステップS2)。そして、切り出した画像データを一定サイズの画像データに変換して正規化し、表情評価部41に供給する(ステップS3)。
【0031】
ここで、本実施の形態では、顔検出部31から出力される顔の検出情報の例として、顔の周囲を囲む長方形の検出枠の位置(例えば左端の座標。以下、顔の位置情報と呼ぶ。)と、その検出枠のサイズ(例えば水平・垂直方向の各画素数。以下、顔のサイズ情報と呼ぶ。)が出力されるものとする。この場合、顔画像生成部32は、顔の検出対象とされた画像データが一時的に記憶されたメモリ(RAM)にアクセスし、顔検出部31からの顔の位置情報およびサイズ情報に対応する領域のデータのみを読み込む。
【0032】
また、切り出された画像データは、一定サイズ(解像度)の画像データとして解像度変換されることで正規化される。この正規化後の画像サイズは、表情評価部41において顔の表情を評価する際の処理単位となるサイズとなる。本実施の形態では、例として48画素×48画素のサイズとする。
【0033】
なお、顔画像生成部32が備える上記のような画像切り出し機能および解像度変換機能としては、従来のカメラ信号処理回路14が検波や出力画像の生成などのために一般的に備えている同様の機能を流用することが可能である。
【0034】
次に、表情評価部41は、顔画像生成部32からの顔の正規化画像データと、あらかじめ記憶されている判別軸情報44とを基に、その顔の表情の度合いを評価する演算を行って、表情評価値を出力する(ステップS4)。この表情評価値は、2つの表情のうちどちらの表情に近いかの度合いを示すものである。例えば、2つの表情として「笑顔」と「通常時の表情」を適用し、表情評価値が高いほど「通常時の表情」でなく「笑顔」である度合いが強いと評価する。なお、この表情評価値の算出手法については後述する。
【0035】
次に、報知制御部42は、表情評価部41から出力された表情評価値に応じた情報を、被撮影者に対して報知する(ステップS5)。例えば、表情評価値に応じた情報は、グラフィック処理回路15を通じて、被撮影者側に向けられたディスプレイ16に表示される。この場合、顔検出部31から供給された顔の位置およびサイズ情報を基に、評価対象の顔をディスプレイ16の中で特定するような表示が行われてもよい。また、LED発光部21を利用して、例えばその輝度の変化や点滅速度の変化、色の変化などにより表情評価値に違いが報知されてもよい。あるいは、音声出力部22を通じて、表情評価値に応じた異なる音声が出力されることで報知されてもよい。
【0036】
以下の説明では、表情評価部41は、例として顔の表情が笑顔であるか無表情であるかの度合いを評価するものとする。また、本実施の形態では、特に、その表情評価値に応じた情報を、被撮影者側に表示面を向けたディスプレイ16に表示することで、被撮影者に報知する。図3では、表情評価値に応じた値である「笑顔スコア」を示すバーグラフをディスプレイ16に表示した例を示している。
【0037】
図4は、笑顔スコアを示すバーグラフの動きを説明するための図である。
この図4に示すように、表情評価値は、顔の表情が笑顔である度合いが強いほど高くなり、通常時の表情である度合いが高いほど低くなる。また、バーグラフに示される笑顔スコアは、表情評価値に比例して連続的あるいは段階的に変動する。このバーグラフは、被撮影者側に向けられたディスプレイ16に表示され、被撮影者は撮像時にこのバーグラフをリアルタイムで視認することで、自分の表情が撮像に適した笑顔になっているか否かを認識できる。その結果、バーグラフは、被撮影者に対して撮像に適した表情になるように促し、より良好な画像を撮像できるように撮像動作を補助する機能を果たす。なお、後述するように、表情評価値の低い被撮影者に対して、笑顔を促すような具体的な文字情報などを表示してもよい。
【0038】
ここで、「表情応答記録モード」に設定されていた場合、表情評価部41は、表情評価値が所定のしきい値を超えた場合に、自動的にシャッタを切る、すなわち撮像画像を記録するように制御する。図2において、記録動作制御部43は、撮像画像データの記録動作を制御するブロックであり、通常の撮像動作では、入力部20のシャッタレリーズボタンが押下されたことを検知したときに、撮像装置内の各部を記録時に適した撮像動作(例えば露光動作や信号処理動作)を行うように制御し、それによって撮像画像データを、画像エンコーダ17にエンコードさせ、符号化データを記録装置18に記録させる。そして、表情評価部41は、表情評価値が所定のしきい値を超えたとき、この記録動作制御部43に対して画像データの記録動作を実行するように要求する。
【0039】
これにより、撮像画像から顔が検出され、その顔の表情が撮像に適した状態になったとき(ここでは笑顔の度合いが強くなったとき)に、そのときの撮像画像が自動的に記録されるようになる。従って、従来のセルフタイマ機能(すなわち、シャッタレリーズボタンを押下して一定時間後に撮像画像を記録する機能)と比較して、被撮影者が良好な表情で映った画像を確実に撮像できるようになり、被撮影者や撮影者の満足度を高めることができる。
【0040】
次に、ディスプレイ16における笑顔スコアの具体的な表示画面の例について説明する。
図5は、バーグラフを用いた笑顔スコアの画面表示例を示す図である。
【0041】
この図5では、撮像装置としてデジタルビデオカメラ100を想定している。デジタルビデオカメラ100では、カメラ本体部101の側面に、画角確認用のディスプレイ16が設けられている。このような構成のデジタルビデオカメラ100では、一般的にディスプレイ16の表示面の角度や方向が可変になっており、図5のように表示面を撮像レンズ102が設けられた方向、すなわち被撮影者の方向に向けることも可能になっている。表情評価モードおよび表情応答記録モードでは、このようにディスプレイ16の表示面を撮影者側に向けた状態で使用され、撮像されている被写体の画像とともに、表情評価値に応じた情報が表示される。
【0042】
図5の画面表示例では、顔201を含む撮像画像の上に笑顔スコア表示部202が合成されて表示されている。笑顔スコア表示部202には、表情評価値に応じた笑顔スコアがバーグラフ203として表示されているとともに、数値表示部204にその笑顔スコアが数値として表示されている。また、表情応答記録モードでは、自動的に撮像画像が記録されるときの笑顔スコアの境界を示す境界表示アイコン205が表示される。この例ではさらに、境界表示アイコン205の上に、しきい値が数値によって表示されている。
【0043】
また、図5の例では、笑顔スコア表示部202とともに、その笑顔スコアに対応する顔201の周囲に顔表示枠206を表示して、笑顔の評価対象の顔201をわかりやすく表示している。さらに、その顔表示枠206の近傍に、表情評価値に応じて異なる文字を表示する文字表示部207を設け、笑顔である度数が低いほどより強い笑顔にするように、被撮影者に対して文字によって促すようにしている。
【0044】
また、表情応答記録モードでは、撮像画像が記録される際の表情評価値のしきい値をユーザが任意に設定できるようにして、被撮影者がどの程度の笑顔となったときの画像を得たいかを自由に決められるようにしてもよい。図5の例では、例えば入力部20に設けられた左右方向の方向キー(図示せず)をユーザが押下することで、表情評価値のしきい値が変化するとともに、境界表示アイコン205が左右に移動して、表情評価値のしきい値に対応する笑顔スコアをユーザが視認できるようになっている。この場合、表情応答記録モードに設定されたときに、左右方向の方向キーを表情評価値のしきい値を設定するためのキーとして自動的に対応付けるようにしてもよく、これによりユーザの操作性を向上させることができる。
【0045】
なお、表情評価値のしきい値の変更は上記の手法に限らず、例えば、メニュー画面から選択される専用の設定画面から行うようにしてもよい。また、専用の操作キーを設けて行うようにしてもよい。また、ディスプレイ16がタッチパネル方式の場合は、例えばディスプレイ16上に表示させたキー画像に指を接触させることで、しきい値を変更してもよい。また、図5の境界表示アイコン205に指を接触させたまま左右に動かすことで、しきい値を変更できるようにしてもよい。
【0046】
また、撮像画面内から複数の顔が検出された場合には、それらの顔ごとに表情評価値を算出し、それらの値に応じた情報をディスプレイ16に表示してもよい。図6は、複数の顔が検出された場合における表情評価値に応じた情報の第1の画面表示例を示す図である。
【0047】
図6では例として、2つの顔211および212が検出された例を示している。顔211および212のそれぞれには、顔領域の周囲に顔表示枠213および214が表示されているとともに、その近傍に文字表示部215および216が設けられている。顔表示枠213および214は、それぞれの顔211および212に対する表情評価値に応じてその線種が変化するようにされ、文字表示部215および216には、表情評価値に応じた異なる文字が表示される。
【0048】
図6の例では、顔211については十分に強い笑顔であると評価されているが、顔212については笑顔の度合いが足りないと評価されている。例えば、顔211については表情評価値が自動記録のしきい値に達しているが、顔212については表情評価値がそのしきい値より少し低い状態を示している。このとき、顔211についての顔表示枠213を実線、顔212についての顔表示枠214を破線としてこのような評価状態の違いを対応する被撮影者に報知するとともに、文字表示部216にはさらに笑顔を強めることを促す文字情報を表示している。なお、この例では顔表示枠213および214の線種により表情評価値の違いを表しているが、その他に例えば、顔表示枠の輝度の違いや色の違い、太さの違いなどにより、表情評価値の違いを報知してもよい。
【0049】
図7は、複数の顔が検出された場合における表情評価値に応じた情報の第2の画面表示例を示す図である。
図7の例でも、図6と同様に2つの顔211および212が検出され、顔211については十分に強い笑顔であると評価され、顔212については笑顔の度合いが足りないと評価されている。また、図7の例では、顔211および212の各領域の近傍に、表情評価値に応じた記号217および218を示すことで、表情評価値の違いを被撮影者に報知している。
【0050】
以上のように、表情評価値に応じた情報をディスプレイを用いて報知することで、表情評価値に応じた笑顔スコアをバーグラフや数値で示す、あるいは、表情評価値に応じて顔表示枠の線種や色、明るさなどを変える、顔の近傍に表情評価値に応じて笑顔を促すような文字を表示するなど、様々な方法で表情評価値に応じた情報を被撮影者にわかりやすく報知することができる。特に、デジタルビデオカメラの場合、従来から設けられていた表示面方向可変のディスプレイを用いて報知できるので、カメラの基本的な構成を変えることによる大幅な開発・製造コストの上昇を招くことなく、ユーザにとって満足度の高い画像を確実に記録することができるようになる。
【0051】
なお、以上では表示面方向可変のディスプレイが搭載されたデジタルビデオカメラを例に挙げたが、撮像レンズとは反対の面に画角確認用のディスプレイが設けられるデジタルスチルカメラなどにも、そのディスプレイの表示面方向が可変のものがあり、その表示面を被撮影者側に向けることができれば、上記のような表示画像を表示させて表情評価値に応じた情報を被撮影者に報知することが可能である。
【0052】
次に、この撮像装置で用いる表情評価の手法について説明する。
図8は、表情評価のために事前に生成すべき情報と、その情報生成の流れについて概念的に示す図である。
【0053】
本実施の形態では、表情の評価手法として、いわゆる「フィッシャー(Fisher)の線形判別分析」の手法を用いる。この手法では、まず、2つの表情をそれぞれ持つ顔のサンプル画像を事前に多数用意しておき、これらのサンプル画像のデータを基に、2つの表情間の2クラス問題と考えて、線形判別分析(LDA:Linear Discriminant Analysis)によりこれらの2つの表情をよく判別する判別軸Adを事前に形成しておく。そして、表情評価の際には、入力された顔画像のデータと判別軸Adとの内積を求めることで、表情評価値を算出する。
【0054】
図8に示すように、本実施の形態では、笑顔のサンプル画像Psと通常の表情のサンプル画像Pnを用いる。これらのサンプル画像PsおよびPnは、例えば48画素×48画素の一定サイズに正規化した画像として用意しておく。そして、これらのサンプル画像のデータを(48×48)次元のベクトルデータとして取り扱い、LDA処理を行う。ただし、このベクトル空間は(48×48)本の座標軸を持つ非常に次元の大きい空間となる。そこで、LDA処理に先立って、それらのベクトルデータに対して主成分分析(PCA:Principal Component Analysis)を行い、顔の特徴だけを効率よく表すような次元の低い空間のデータに変換(次元圧縮)する。
【0055】
このPCA処理では、まず、入力されたM個(例えばM=300)のN次元(N=48×48)のサンプル画像群間のバラツキ(分散)が最大になるように、M本の軸を得ることを考える。このような軸は、画像群の共分散行列の固有値問題の解(固有ベクトル)として求められ、係数の比較的大きいベクトル成分のみを主成分として取り出すことで、顔の特徴を表すのに適したベクトル成分のみのN’次元(N>>N’)のデータに圧縮することができる。例えばN’=40程度とすることで、顔の表情判別について十分な精度を維持できることがわかっている。なお、PCA処理で得られた主成分のうち、係数の大きいものから順に数個程度除外することで、表情判別精度を保ちつつ、次元数をさらに減らして次のPCA処理の負荷を軽減できる。
【0056】
ここで、図9は、PCA処理時に入力するサンプル画像のマスキング処理について説明するための図である。
図9(A)のように、顔221が所定サイズの矩形領域に撮像されたサンプル画像Pをそのまま用いてPCA処理を行った場合、顔221の背景や髪などの影響により、適切な主成分を必ずしも選択できない場合があり得る。このため、図9(B)のように、顔221以外の領域にマスク222をかけて、できるだけ顔領域のみが残されたサンプル画像P1に変換し、顔の情報濃度を上げた状態でPCA処理することで、より高精度な次元圧縮を行うことができる。さらに、顔領域の中でも口は表情によって大きく変化し、擾乱要素となることが多いので、図9(C)のように口の領域までもマスク223をかけたサンプル画像P2を用いてPCA処理することで、さらに次元圧縮の精度を高めることができる。
【0057】
以下、図8に戻って説明すると、PCA処理によって次元圧縮された笑顔、通常の表情の各サンプル画像は、顔の特徴を効率よく表すような座標軸のみを持つ部分空間(PCA空間Spca)上のベクトルデータに変換される。図8では、このPCA空間Spcaに、笑顔、通常の表情の各サンプル画像PsおよびPnが射影された様子を模式的に表している。この図のように、PCA空間Spcaの上では、表情が同じサンプル画像は比較的近くに存在すると言える。そこで、これらの各表情のサンプル画像群を2つのクラスタCLsおよびCLnと捉え、これらのクラスタ同士を最もよく分離する射影軸(判別軸Ad)をLDA処理により形成する。このような判別軸Adは“フィッシャーの射影軸”と呼ばれる。
【0058】
LDA処理では、一般的に、N’次元の固有ベクトル上に射影されたクラス内およびクラス間の分散が最大になるような判別軸が求められる。すなわち、クラス内、クラス間の各共分散行列の最大固有値に対応する固有ベクトルを求め、これを判別軸Ad上のベクトル(フィッシャー・ベクトル)とする。各共分散行列と固有値、固有ベクトルとの関係を、式(1)および(2)に示す。
【0059】
【数1】
【0060】
ここで、式(2)の左辺の逆行列、固有値、固有ベクトルの演算には、それぞれLU(Lower-Upper)分解法、QR分解法(Q:直交行列,R:上三角行列)、ガウスの消去法を用いることができる。表情評価部41は、以上のように得られた判別軸Adの情報(判別軸情報44)として、フィッシャー・ベクトルの各成分の係数などの情報を、ROMなどにあらかじめ保持しておく。
【0061】
図10は、ピクセル空間およびPCA空間における判別軸および顔の入力画像の関係を概念的に示す図である。
上記の判別軸Adを用いた表情判別の基本的な手順は、まず、撮像画像から検出された顔の画像データをPCA処理し、主成分を抽出する。そして、この顔画像の表情は、図10のPCA空間Spcaに示すように、PCA処理された顔画像ベクトル(入力顔画像ベクトル)の判別軸Adに対する射影成分として評価される。すなわち、表情評価値Eexpの演算は、入力顔画像ベクトルとフィッシャー・ベクトルとの内積により算出できる(式(5−1)参照)。
【0062】
【数2】
【0063】
ただし、フィッシャー・ベクトルの情報は、ピクセル空間Spxl(PCA処理前の元の画像データが持つ次元の空間)での情報に換算しておくこともできる。式(3)および(4)はそれぞれ、入力顔画像ベクトルおよびフィッシャー・ベクトルをピクセル空間Spxlでのベクトルとして表しており、これらの関係を概念的に表したものが図10である。式(3)、式(4)および図10に示すように、PCA処理により得られる主成分μ1〜μN'以外のベクトル成分は、すべての入力画像の平均値として定数Cで近似できる。従って、式(5−1)に示すような内積演算は、式(5−2)のようにピクセル空間Spxlの上でのベクトルの内積演算として等価的に表すことができる。
【0064】
式(5−2)において、ピクセル空間Spxlでのフィッシャー・ベクトル成分と定数Cとの減算結果は事前に算出できるので、表情評価部41は、この減算結果と定数Cとを判別軸情報44としてあらかじめ保持しておく。そして、撮像画像から検出された顔画像のベクトルが与えられると、そのベクトルをPCA処理することなく、式(5−2)の内積演算を実行する。式(5−2)による1つの顔に対する評価値演算では、それぞれ最大で(48×48)回の減算、乗算および加算が実行されるのみであり、しかも実際には、40個程度の主成分μ1〜μN'に対応する係数の演算のみが実行されることになる。従って、PCA空間Spcaでのベクトルの内積演算を行う場合と比較して、表情評価の精度を落とすことなく演算量を大幅に削減することができ、撮像画像記録前の画角合わせの状態で表情評価値Eexpをリアルタイムで容易に算出できる。
【0065】
このような演算手法では、例えば、多数の顔画像のテンプレートと検出された顔画像とのマッチングにより表情を評価する手法と比較しても、はるかに低処理負荷かつ高精度の表情評価を行うことが可能である。テンプレートを用いたマッチングを行う場合、通常は、検出された顔画像からさらに目や口などのパーツを抽出し、パーツごとにマッチング処理を行う必要がある。これに対して、本実施の形態の手法では、検出した顔画像のデータを一定サイズに正規化した後、その顔画像をベクトル情報に置き換えてそのまま(あるいは部分的にマスクするだけで)内積演算に適用でき、その内積演算も上述の通り40次元程度の減算、乗算および加算からなる単純なものとなる。
【0066】
図11は、表情評価値を数値として出力する場合の算出例を示す図である。
本実施の形態では、例として、サンプル画像のPCA処理結果に基づき、PCA空間における笑顔の顔画像および通常の表情の顔画像のそれぞれの分布の平均を求め、これらの平均の判別軸Adに対する射影点を決めておく。そして、各平均の射影点の中点を基準として表情評価値Eexpを数値に換算する。すなわち、図11のように、入力顔画像の判別軸に対する射影点と平均の射影点の中点との距離を表情評価値Eexpとし、笑顔のサンプル画像の分布している側を正の数値とする。これにより、検出された顔の画像が笑顔と通常の表情のどちらに近いかを連続的な数値として出力できるようになり、表情評価値Eexpが高いほど強い笑顔であると評価される。
【0067】
次に、表情応答記録モードにおける撮像装置の処理手順について、フローチャートにまとめて説明する。図12は、表情応答記録モードにおける撮像装置の処理の流れを示すフローチャートである。
【0068】
〔ステップS11〕顔検出部31は、撮像画像のデータから顔を検出し、検出されたすべての顔の位置情報およびサイズ情報を、顔画像生成部32および報知制御部42に対して出力する。
【0069】
〔ステップS12〕顔画像生成部32は、顔検出部31からの顔の位置情報およびサイズ情報に基づき、撮像画像のデータから検出されたそれぞれの顔の領域のデータを切り出す。
【0070】
〔ステップS13〕顔画像生成部32は、切り出したそれぞれの顔領域のデータを、所定画素数(ここでは48画素×48画素)のデータに正規化し、さらに、表情検出に必要のない領域をマスキングして、処理後の画像データを表情評価部41に出力する。
【0071】
〔ステップS14〕表情評価部41は、判別軸情報44を読み込み、顔画像生成部32から供給されたもののうち1つの顔画像から得たベクトル成分と、判別軸のベクトル成分との内積演算を行って、表情評価値を算出する。算出した表情評価値は、例えばRAMなどに一時的に記憶される。
【0072】
〔ステップS15〕表情評価部41は、検出されたすべての顔について表情評価処理が済んだか否かを判断する。処理済みでない場合は、他の顔についてステップS14を再び実行し、処理済みの場合にはステップS16を実行する。
【0073】
〔ステップS16〕報知制御部42は、ステップS15で算出された表情評価値と、それに対応する顔の位置情報およびサイズ情報とを基に、笑顔スコアや表示枠などの表情情報をグラフィック処理回路15に出力し、ディスプレイ16に合成して表示させる。
【0074】
〔ステップS17〕表情評価部41は、ステップS14で算出した、すべての顔についての表情評価値が、しきい値を超えているか否かを判定する。しきい値を超えていない表情評価値がある場合には、ステップS11に戻って顔検出を実行するようにカメラ信号処理回路14に対して指示し、これにより次の顔画像の検出および表情評価処理が開始される。また、すべての表情評価値がしきい値を超えている場合には、ステップS18を実行する。
【0075】
〔ステップS18〕表情評価部41は、記録動作制御部43に対して、撮像画像のデータを記録装置18に記録するように要求する。これにより、撮像画像に対して記録用の信号処理が施され、処理後の符号化画像データが記録装置18に記録される。
【0076】
以上の処理により、検出されたすべての顔について表情評価値が算出され、その表情評価値に応じた情報が表示情報として被撮影者に通知されるので、被撮影者に対して撮像に適した表情になるように促すことができる。そして、すべての被撮影者が撮像に適した表情になったときに、撮像画像のデータが自動的に記録されるので、被撮影者や撮影者にとって満足度の高い画像を確実に記録できる。
【0077】
なお、ステップS17での判定基準はあくまで例であり、必ずしもすべての表情評価値がしきい値を超えたときに画像データを記録するように制御する必要はない。例えば、検出された顔のうち、一定の割合の顔の表情評価値がしきい値を超えたときに画像データを記録してもよい。あるいは、一定の数の顔の表情評価値がしきい値を超えたときに画像データを記録するようにして、偶然撮像された必要のない顔に対しても表情評価が実行されることを防止してもよい。
【0078】
また、上記の表情応答記録モードでは、単に表情評価値が所定のしきい値を超えたときに自動的に撮像画像を記録しているが、この他に例えば、撮影者によりシャッタレリーズボタンが押下されると、その一定時間後から被撮影者の表情を評価し、撮像に適する表情となったときに自動的に撮像画像を記録するようにしてもよい。この場合例えば、マイクロコンピュータ19は、シャッタレリーズボタンの押下を検出すると時間のカウントを開始し、一定時間が経過したときに図12の処理を開始させればよい。このような処理により、シャッタレリーズボタンを押下した撮影者も確実に撮像範囲に移動することができ、操作性が向上される。
【0079】
また、上記の説明では、「笑顔」と「通常時の表情」という2つの表情を定義し、笑顔にどれだけ近いかを判別していたが、「笑顔」とそれ以外の表情(非笑顔と呼ぶ)との間で判別を行うようにしてもよい。この「非笑顔」の表情は、真顔、泣き顔、怒り顔などの笑顔でない複数の表情を含んでもよい。この場合、これらの複数の表情に対応する顔のサンプル画像の平均から「非笑顔」の集合を求め、この集合と「笑顔」の集合とを基にLDA処理のための判別軸を算出する。
【0080】
さらに、表情評価値は、必ずしも「笑顔」のような1つの表情に対する近さを示すものでなくてもよく、例えば「笑顔」「真顔」などの特定の複数の表情を撮像に適する表情と考えて、これらの複数の表情の側にどれだけ近いかを示すようにしてもよい。この場合にも、これらの複数の表情に対応する顔のサンプル画像の平均から「撮像に適する表情」の集合を求め、この集合と「撮像に適さない表情」の集合とを基にLDA処理のための判別軸を算出すればよい。
【0081】
[第2の実施の形態]
図13は、本発明の第2の実施の形態に係る撮像装置の外観を示す図である。
本実施の形態では、表情評価値に応じた情報を、図1の構成の中のLED発光部21の一部を用いて被撮影者に報知する。図13に示した撮像装置110は、撮像レンズ111やフラッシュ発光部112などが搭載された面に、表情評価値に応じた情報を報知するための専用のLED発光部21aが設けられている。LED発光部21aには複数のLED21b〜21fが1つの線上に設けられており、それらの一方からのLEDの点灯数により、表情評価値に応じた情報(ここでは笑顔スコア)が被撮影者に通知される。このような構成により、表示面方向可変のディスプレイを持たないデジタルスチルカメラなどの撮像装置においても、表情評価値に応じた情報を被撮影者に報知して、適切な画像が記録されるように撮像動作を補助することができる。また、LEDなどの小型の発光デバイスを用いることで、撮像装置本体の大型化を最小限に留めることができる。
【0082】
さらに、LED発光部21aにおいては、最も他方の側のLED(図ではLED21f)が、撮像画像が自動的に記録される際の笑顔スコアを示すものとし、このLEDを他とは別の色や輝度などで発光させてもよい。これにより、自動記録が行われる際の笑顔スコアを被撮影者に明確に報知でき、また自動記録が行われたことを被撮影者が認識できるようにもなる。
【0083】
[第3の実施の形態]
図14は、本発明の第3の実施の形態に係る撮像装置の外観を示す図である。
図14に示す撮像装置120では、撮像レンズ121やフラッシュ発光部122などが搭載された面に、1つのLEDのみを持つLED発光部21gが設けられている。このようなLED発光部21gにおいては、表情評価値に応じて、例えば、LEDの点滅速度を変える、LEDの輝度や色を変えることなどによって、笑顔スコアを被撮影者に報知することが可能である。例えば、表情評価値が大きくなるに連れて、LEDの色を赤、緑、青に徐々に変化させる、あるいは、LEDを徐々に明るくするなどの制御が可能である。このように、1つのLEDのみ用いることで、撮像装置本体の大型化をさらに顕著に阻止できる。
【0084】
また、この撮像装置120が従来のセルフタイマ機能を備えている場合には、そのセルフタイマ作動時に用いられるLEDを表情評価用に兼用することもできる。例えば、セルフタイマの作動時には、シャッタレリーズボタンが押下された後、記録までの間に時間の経過に従って徐々にLEDの点滅速度を高くする。そして、表情評価モードや表情応答記録モードでは、表情評価値が高いほどLEDの点滅速度を高くする。このような構成により、従来の撮像装置の基本構成や外観を変えることなく、表情評価値に応じた情報を被撮影者に報知できる。また、兼用可能な発光部はセルフタイマ用に限らず、例えば、露光制御時の測光用発光部を兼用することもできる。ただし、この場合には、少なくとも表情評価時には可視光を発光できる必要がある。
【0085】
[第4の実施の形態]
図15は、本発明の第4の実施の形態に係る撮像装置の外観を示す図である。
上記の各実施の形態では、表情評価値に応じた情報を視覚的に報知していた。これに対して、本実施の形態では、図2に示した音声出力部22を用いて、表情評価値に応じた情報を音声により報知する。図15に示した撮像装置130では、撮像レンズ131が搭載された側にスピーカ22aを設け、表情評価値に応じて異なる音声を再生出力させる。出力する音声としては、例えば、図5や図6に示した文字情報と同様、笑顔である度数が低いほどより強い笑顔にするように、被撮影者に対して促すような音声とする。この場合、撮像装置130は、再生すべき音声のデータを、表情評価値に対して段階的に対応付けてあらかじめ保持しておけばよい。また、表情評価値に応じて音の高さや出力間隔を変える手法や、表情評価値に応じて異なるメロディの音声を出力する手法などを採ってもよい。なお、音声による報知と、視覚的な情報による報知とが併用されてもよい。
【0086】
[第5の実施の形態]
図16は、本発明の第5の実施の形態に係るPC(パーソナルコンピュータ)の外観を示す図である。
【0087】
上記の各実施の形態における表情評価機能、表情評価値に応じた情報の報知機能、および表情評価値に応じた画像の自動記録機能は、図16に示すPC140のように各種のコンピュータにおいても実現することができる。図16では例として、LCDからなるディスプレイ141とキーボード142や本体部が一体に構成されたノート型のPC140を示している。そして、このPC140には、例えばディスプレイ141の上端部に撮像部143が一体に設けられており、PC140を操作しているユーザの側を撮像できるようになっている。なお、撮像部143は、例えばUSB(Universal Serial Bus)などの通信インタフェースを介して外部に接続されるものでもよい。
【0088】
このようなコンピュータにおいては、上記各機能の処理内容を記述したプログラムをコンピュータで実行することにより、それらの機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。
【0089】
このプログラムを流通させる場合には、例えば、プログラムが記録された光ディスクなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0090】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【図面の簡単な説明】
【0091】
【図1】本発明の第1の実施の形態に係る撮像装置の要部構成を示すブロック図である。
【図2】表情評価モードおよび表情応答記録モードを実現するために撮像装置が備える機能を示すブロック図である。
【図3】表情評価モードにおける動作の概要を示す図である。
【図4】笑顔スコアを示すバーグラフの動きを説明するための図である。
【図5】バーグラフを用いた笑顔スコアの画面表示例を示す図である。
【図6】複数の顔が検出された場合における表情評価値に応じた情報の第1の画面表示例を示す図である。
【図7】複数の顔が検出された場合における表情評価値に応じた情報の第2の画面表示例を示す図である。
【図8】表情評価のために事前に生成すべき情報と、その情報生成の流れについて概念的に示す図である。
【図9】PCA処理時に入力するサンプル画像のマスキング処理について説明するための図である。
【図10】ピクセル空間およびPCA空間における判別軸および顔の入力画像の関係を概念的に示す図である。
【図11】表情評価値を数値として出力する場合の算出例を示す図である。
【図12】表情応答記録モードにおける撮像装置の処理の流れを示すフローチャートである。
【図13】本発明の第2の実施の形態に係る撮像装置の外観を示す図である。
【図14】本発明の第3の実施の形態に係る撮像装置の外観を示す図である。
【図15】本発明の第4の実施の形態に係る撮像装置の外観を示す図である。
【図16】本発明の第5の実施の形態に係るPCの外観を示す図である。
【符号の説明】
【0092】
11……光学ブロック、11a……ドライバ、12……撮像素子、12a……タイミングジェネレータ(TG)、13……アナログフロントエンド(AFE)回路、14……カメラ信号処理回路、15……グラフィック処理回路、16……ディスプレイ、17……画像エンコーダ、18……記録装置、19……マイクロコンピュータ、20……入力部、21……LED発光部、22……音声出力部、31……顔検出部、32……顔画像生成部、41……表情評価部、42……報知制御部、43……記録動作制御部、44……判別軸情報
【技術分野】
【0001】
本発明は、固体撮像素子を用いて画像を撮像する撮像装置、および、撮像された顔の表情を評価する表情評価装置に関する。
【背景技術】
【0002】
撮像装置において、シャッタボタンを押下する操作から一定時間経過後に自動的にシャッタを切る、いわゆるセルフタイマ機能は、銀塩カメラのみならず、デジタルスチルカメラにも一般的に搭載されている。しかし、このセルフタイマ機能によりシャッタが切られるタイミングは事前に決められたものとなるので、シャッタを切った時点で被撮影者が必ずしもよい表情となるという保証はなく、満足のいかない写真が撮像されることが少なくないという問題があった。
【0003】
一方、近年では、画像信号を基にデジタル演算処理する画像処理技術が急速に進んでおり、その例として、画像から人間の顔を検出する技術がある。例えば、顔画像中の2画素間の輝度差を特徴量として学習しておき、その特徴量に基づいて入力画像中の所定領域が顔であるか否かを示す推定値を算出し、その1以上の推定値から領域内の画像が顔であるか否かを最終的に判別するようにした顔検出技術があった(例えば、特許文献1参照)。
【0004】
このような顔検出技術は、デジタルスチルカメラなど、固体撮像素子で撮像を行うデジタル方式の撮像装置に搭載できるレベルまで開発が進んでおり、最近ではさらに、検出された顔の表情を判別する技術なども注目されている。例えば、連続して複数コマを撮像した画像信号から、被撮影者の顔の表情などを撮像画像ごとに評価し、それらの評価情報から好適な画像を選択できるようにすることが考えられている(例えば、特許文献2参照)。
【特許文献1】特開2005−157679号公報(段落番号〔0040〕〜〔0052〕、図1)
【特許文献2】特開2004−46591号公報(段落番号〔0063〕〜〔0071〕、図3)
【発明の開示】
【発明が解決しようとする課題】
【0005】
ところで、最近ではデジタル方式の撮像装置のメーカ間競争が激化していることから、このような撮像装置を高機能化して、その商品価値を高めることが強く求められている。また、上述したセルフタイマ機能の問題点のように、撮像した画像は撮影者や被撮影者にとって必ずしも満足のいくものとはならないことから、このような満足度を高めるべく撮像動作を補助する機能は、商品価値を高めるための非常に重要なものと言える。特に、発達の進んでいる画像処理技術を用いてこのような機能を実現することが望まれているが、撮像動作中にリアルタイムにその動作を補助するような機能は実現されていなかった。
【0006】
本発明はこのような課題に鑑みてなされたものであり、被撮影者あるいは撮影者にとってより満足度の高い画像を撮像することが可能な撮像装置を提供することを目的とする。
また、本発明の他の目的は、被撮影者あるいは撮影者にとってより満足度の高い画像を撮像することが可能な表情評価装置を提供することである。
【課題を解決するための手段】
【0007】
本発明では上記課題を解決するために、固体撮像素子を用いて画像を撮像する撮像装置において、撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出する顔検出部と、検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、前記特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する表情評価部と、算出された前記表情評価値の大きさを視覚的に示す報知情報を報知する報知部とを有することを特徴とする撮像装置が提供される。
【0008】
このような撮像装置では、顔検出部が、撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出し、表情評価部が、顔検出部により検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する。報知部は、算出された表情評価値の大きさを視覚的に示す報知情報を報知する。
【発明の効果】
【0009】
本発明の撮像装置によれば、撮像された画像信号を記録媒体に記録するまでの期間において、撮像された画像から人物の顔が検出され、その顔の表情が評価されて、その表情が、特定の表情とそれ以外の表情との間において、特定の表情にどれだけ近いかの度合いを示す表情評価値が算出される。そして、その表情評価値の大きさを視覚的に示す報知情報が報知される。従って、被撮影者の表情が撮像に適しているかを例えば被撮影者あるいは撮影者などに認識させることができるので、被撮影者や撮影者にとって満足度の高い画像を確実に記録媒体に記録できるようになる。
【発明を実施するための最良の形態】
【0010】
以下、本発明の実施の形態を図面を参照して詳細に説明する。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る撮像装置の要部構成を示すブロック図である。
【0011】
図1に示す撮像装置は、デジタルスチルカメラあるいはデジタルビデオカメラなどとして実現されるものである。この撮像装置は、光学ブロック11、ドライバ11a、撮像素子12、タイミングジェネレータ(TG)12a、アナログフロントエンド(AFE)回路13、カメラ信号処理回路14、グラフィック処理回路15、ディスプレイ16、画像エンコーダ17、記録装置18、マイクロコンピュータ19、入力部20、LED(Light Emitting Diode)発光部21、および音声出力部22を具備する。
【0012】
光学ブロック11は、被写体からの光を撮像素子12に集光するためのレンズ、レンズを移動させてフォーカス合わせやズーミングを行うための駆動機構、シャッタ機構、アイリス機構などを具備している。ドライバ11aは、マイクロコンピュータ19からの制御信号に基づいて、光学ブロック11内の各機構の駆動を制御する。
【0013】
撮像素子12は、例えば、CCD(Charge Coupled Device)型、CMOS(Complementary Metal Oxide Semiconductor)型などの固体撮像素子であり、TG12aから出力されるタイミング信号に基づいて駆動され、被写体からの入射光を電気信号に変換する。TG12aは、マイクロコンピュータ19の制御の下でタイミング信号を出力する。
【0014】
AFE回路13は、撮像素子12から出力された画像信号に対して、CDS(Correlated Double Sampling)処理によりS/N(Signal/Noise)比を良好に保つようにサンプルホールドを行い、さらにAGC(Auto Gain Control)処理により利得を制御し、A/D変換を行ってデジタル画像データを出力する。
【0015】
カメラ信号処理回路14は、AFE回路13からの画像データに対して、AF(Auto Focus)、AE(Auto Exposure)、各種画質補正処理のための検波処理や、検波情報を基にマイクロコンピュータ19から出力される信号に応じた画質補正処理を施す。なお、後述するように、本実施の形態では、このカメラ信号処理回路14は、顔検出機能およびその顔領域のデータを切り出す機能を備えている。
【0016】
グラフィック処理回路15は、カメラ信号処理回路14から出力された画像データを、ディスプレイ16に表示するための信号に変換し、ディスプレイ16に供給する。また、マイクロコンピュータ19からの要求に応じて、後述する表情スコアなどの情報を画像上に合成する。ディスプレイ16は、例えばLCD(Liquid Crystal Display)などからなり、グラフィック処理回路15からの画像信号を基に画像を表示する。
【0017】
画像エンコーダ17は、カメラ信号処理回路14から出力された画像データを圧縮符号化し、符号化データを記録装置18に出力する。具体的には、カメラ信号処理回路14で処理された1フレーム分の画像データを、JPEG(Joint Photographic Experts Group)などの符号化方式に従って圧縮符号化し、静止画像の符号化データを出力する。なお、静止画像だけでなく、動画像のデータを圧縮符号化できるようにしてもよい。
【0018】
記録装置18は、画像エンコーダ17からの符号化データを画像ファイルとして記録する装置であり、例えば、磁気テープ、光ディスクなどの可搬型記録媒体のドライブ装置、あるいはHDD(Hard Disk Drive)などとして実現される。
【0019】
マイクロコンピュータ19は、CPU(Central Processing Unit)や、ROM(Read Only Memory)、RAM(Random Access Memory)などのメモリを備え、メモリに格納されたプログラムを実行することで、この撮像装置を統括的に制御する。
【0020】
入力部20は、各種の入力スイッチに対するユーザによる操作入力に応じた制御信号を、マイクロコンピュータ19に出力する。この入力スイッチとしては、例えば、シャッタレリーズボタン、各種メニュー選択や動作モードの設定などを行うための十字キーなどが設けられる。
【0021】
LED発光部21は、マイクロコンピュータ19からの制御信号に基づき、撮像装置の外装面に設けられたLEDを点灯させる。このLEDとしては、例えば、セルフタイマ機能の動作中であることを示すものなどが考えられる。
【0022】
音声出力部22は、マイクロコンピュータ19からの制御信号に基づき、例えば動作確認音などの音声を出力する。なお、音声データのエンコーダ/デコーダを備える場合には、この音声データを再生したときの再生音声を出力してもよい。
【0023】
この撮像装置では、撮像素子12によって受光されて光電変換された信号が、順次AFE回路13に供給され、CDS処理やAGC処理が施された後、デジタル画像データに変換される。カメラ信号処理回路14は、AFE回路13から供給された画像データを画質補正処理し、処理後の画像データはグラフィック処理回路15に供給されて表示用の画像信号に変換される。これによりディスプレイ16には、現在撮像中の画像(カメラスルー画像)がディスプレイ16に表示され、撮影者はこの画像を視認して画角を確認できるようになる。
【0024】
また、この状態から、入力部20のシャッタレリーズボタンが押下されることなどにより、マイクロコンピュータ19に対して画像の記録が指示されると、カメラ信号処理回路14からの画像データは画像エンコーダ17に供給され、圧縮符号化処理が施されて、記録装置18に記録される。静止画像の記録の際には、カメラ信号処理回路14からは1フレーム分の画像データが画像エンコーダ17に供給され、動画像の記録の際には、処理された画像データが画像エンコーダ17に連続的に供給される。
【0025】
次に、この撮像装置が備える撮像動作モードについて説明する。この撮像装置は、静止画像を撮像する際に、撮像画像から被撮影者の顔を検出して、その表情を評価し、評価の度合いを示す情報を被撮影者に報知するモードと、その評価の度合いに応じて自動的にシャッタを切り、静止画像データを記録装置18に記録するモードとを備えている。以下、前者モードを「表情評価モード」、後者を「表情応答記録モード」と呼ぶことにする。
【0026】
表情評価モードでは、撮像画像から顔を検出した場合に、その顔の表情を評価し、評価に応じた情報を被撮影者に報知して、被撮影者がより撮像に適した表情になるように促す役割を果たす。例えば、表情として笑顔であるか否かの度合いを評価する。また、表情応答記録モードでは、その評価値が所定の値を超えたときに、被撮影者の顔が撮像に適した表情になったと判断して、自動的に静止画像データを記録する。これにより、被撮影者にとってより満足度の高い画像を記録できるように補助する。なお、ここでは表情評価モードと表情応答記録モードの2つのモードを備えるものとしているが、表情応答記録モードのみを備えていてもよい。
【0027】
図2は、表情評価モードおよび表情応答記録モードを実現するために撮像装置が備える機能を示すブロック図である。
図2に示すように、この撮像装置は、上記各撮像動作モードを実現するための機能として、顔検出部31、顔画像生成部32、表情評価部41、報知制御部42、および記録動作制御部43を備えている。本実施の形態では、顔検出部31および顔画像生成部32は、カメラ信号処理回路14内のハードウェアによって実現され、表情評価部41、報知制御部42および記録動作制御部43は、マイクロコンピュータ19によって実行されるソフトウェアの機能として実現される。ただし、これらの機能のそれぞれは、ハードウェアあるいはソフトウェアのいずれによって実現されてもよい。また、マイクロコンピュータ19は、表情評価部41による表情評価演算に用いるための判別軸情報44を、その内部のROMなどのメモリにあらかじめ保持している。後述するように、判別軸情報44は、2つの表情についての多数の顔のサンプルデータから主成分分析によって得た信号成分を基に、線形判別分析を行って得た表情の判別軸を示すベクトルの係数情報などを含む。
【0028】
ここで、以下の図3および図4を用いて、図2に示した各機能の動作を説明する。まず、図3は、表情評価モードにおける動作の概要を示す図である。
表情評価モードでは、まず、顔検出部31が、撮像素子12による撮像により得られ、カメラ信号処理回路14内を伝達される画像データを基に、その画像から被撮影者の顔を検出する(ステップS1)。そして、検出した顔の領域を示す検出情報を顔画像生成部32に出力する。なお、本実施の形態のように、表情評価値に応じた情報をディスプレイ16に表示することで報知する場合、顔検出部31からの顔の検出情報は、マイクロコンピュータ19の報知制御部42にも供給される。
【0029】
顔の検出手法としては周知の手法を適用することが可能であるが、例えば、特許文献1に記載された手法を用いることができる。この手法では、まず、顔画像中の2画素間の輝度差を学習し、特徴量としてあらかじめ保持しておく。そして、図3のステップS1の欄に示すように、入力画像に対して一定の大きさのウィンドウW1を順次当てはめていき、ウィンドウW1の中の画像に顔が含まれるか否かを特徴量を基に推定して、推定値を出力する。このとき、入力画像を順次縮小して同じ処理を行うことで、一定の大きさのウィンドウW1を用いて推定を行うことができる。そして、それらの動作により得られた推定値から、顔が存在する領域を最終的に判別する。
【0030】
次に、顔画像生成部32は、入力画像から、検出された顔の領域Afのデータを切り出す(ステップS2)。そして、切り出した画像データを一定サイズの画像データに変換して正規化し、表情評価部41に供給する(ステップS3)。
【0031】
ここで、本実施の形態では、顔検出部31から出力される顔の検出情報の例として、顔の周囲を囲む長方形の検出枠の位置(例えば左端の座標。以下、顔の位置情報と呼ぶ。)と、その検出枠のサイズ(例えば水平・垂直方向の各画素数。以下、顔のサイズ情報と呼ぶ。)が出力されるものとする。この場合、顔画像生成部32は、顔の検出対象とされた画像データが一時的に記憶されたメモリ(RAM)にアクセスし、顔検出部31からの顔の位置情報およびサイズ情報に対応する領域のデータのみを読み込む。
【0032】
また、切り出された画像データは、一定サイズ(解像度)の画像データとして解像度変換されることで正規化される。この正規化後の画像サイズは、表情評価部41において顔の表情を評価する際の処理単位となるサイズとなる。本実施の形態では、例として48画素×48画素のサイズとする。
【0033】
なお、顔画像生成部32が備える上記のような画像切り出し機能および解像度変換機能としては、従来のカメラ信号処理回路14が検波や出力画像の生成などのために一般的に備えている同様の機能を流用することが可能である。
【0034】
次に、表情評価部41は、顔画像生成部32からの顔の正規化画像データと、あらかじめ記憶されている判別軸情報44とを基に、その顔の表情の度合いを評価する演算を行って、表情評価値を出力する(ステップS4)。この表情評価値は、2つの表情のうちどちらの表情に近いかの度合いを示すものである。例えば、2つの表情として「笑顔」と「通常時の表情」を適用し、表情評価値が高いほど「通常時の表情」でなく「笑顔」である度合いが強いと評価する。なお、この表情評価値の算出手法については後述する。
【0035】
次に、報知制御部42は、表情評価部41から出力された表情評価値に応じた情報を、被撮影者に対して報知する(ステップS5)。例えば、表情評価値に応じた情報は、グラフィック処理回路15を通じて、被撮影者側に向けられたディスプレイ16に表示される。この場合、顔検出部31から供給された顔の位置およびサイズ情報を基に、評価対象の顔をディスプレイ16の中で特定するような表示が行われてもよい。また、LED発光部21を利用して、例えばその輝度の変化や点滅速度の変化、色の変化などにより表情評価値に違いが報知されてもよい。あるいは、音声出力部22を通じて、表情評価値に応じた異なる音声が出力されることで報知されてもよい。
【0036】
以下の説明では、表情評価部41は、例として顔の表情が笑顔であるか無表情であるかの度合いを評価するものとする。また、本実施の形態では、特に、その表情評価値に応じた情報を、被撮影者側に表示面を向けたディスプレイ16に表示することで、被撮影者に報知する。図3では、表情評価値に応じた値である「笑顔スコア」を示すバーグラフをディスプレイ16に表示した例を示している。
【0037】
図4は、笑顔スコアを示すバーグラフの動きを説明するための図である。
この図4に示すように、表情評価値は、顔の表情が笑顔である度合いが強いほど高くなり、通常時の表情である度合いが高いほど低くなる。また、バーグラフに示される笑顔スコアは、表情評価値に比例して連続的あるいは段階的に変動する。このバーグラフは、被撮影者側に向けられたディスプレイ16に表示され、被撮影者は撮像時にこのバーグラフをリアルタイムで視認することで、自分の表情が撮像に適した笑顔になっているか否かを認識できる。その結果、バーグラフは、被撮影者に対して撮像に適した表情になるように促し、より良好な画像を撮像できるように撮像動作を補助する機能を果たす。なお、後述するように、表情評価値の低い被撮影者に対して、笑顔を促すような具体的な文字情報などを表示してもよい。
【0038】
ここで、「表情応答記録モード」に設定されていた場合、表情評価部41は、表情評価値が所定のしきい値を超えた場合に、自動的にシャッタを切る、すなわち撮像画像を記録するように制御する。図2において、記録動作制御部43は、撮像画像データの記録動作を制御するブロックであり、通常の撮像動作では、入力部20のシャッタレリーズボタンが押下されたことを検知したときに、撮像装置内の各部を記録時に適した撮像動作(例えば露光動作や信号処理動作)を行うように制御し、それによって撮像画像データを、画像エンコーダ17にエンコードさせ、符号化データを記録装置18に記録させる。そして、表情評価部41は、表情評価値が所定のしきい値を超えたとき、この記録動作制御部43に対して画像データの記録動作を実行するように要求する。
【0039】
これにより、撮像画像から顔が検出され、その顔の表情が撮像に適した状態になったとき(ここでは笑顔の度合いが強くなったとき)に、そのときの撮像画像が自動的に記録されるようになる。従って、従来のセルフタイマ機能(すなわち、シャッタレリーズボタンを押下して一定時間後に撮像画像を記録する機能)と比較して、被撮影者が良好な表情で映った画像を確実に撮像できるようになり、被撮影者や撮影者の満足度を高めることができる。
【0040】
次に、ディスプレイ16における笑顔スコアの具体的な表示画面の例について説明する。
図5は、バーグラフを用いた笑顔スコアの画面表示例を示す図である。
【0041】
この図5では、撮像装置としてデジタルビデオカメラ100を想定している。デジタルビデオカメラ100では、カメラ本体部101の側面に、画角確認用のディスプレイ16が設けられている。このような構成のデジタルビデオカメラ100では、一般的にディスプレイ16の表示面の角度や方向が可変になっており、図5のように表示面を撮像レンズ102が設けられた方向、すなわち被撮影者の方向に向けることも可能になっている。表情評価モードおよび表情応答記録モードでは、このようにディスプレイ16の表示面を撮影者側に向けた状態で使用され、撮像されている被写体の画像とともに、表情評価値に応じた情報が表示される。
【0042】
図5の画面表示例では、顔201を含む撮像画像の上に笑顔スコア表示部202が合成されて表示されている。笑顔スコア表示部202には、表情評価値に応じた笑顔スコアがバーグラフ203として表示されているとともに、数値表示部204にその笑顔スコアが数値として表示されている。また、表情応答記録モードでは、自動的に撮像画像が記録されるときの笑顔スコアの境界を示す境界表示アイコン205が表示される。この例ではさらに、境界表示アイコン205の上に、しきい値が数値によって表示されている。
【0043】
また、図5の例では、笑顔スコア表示部202とともに、その笑顔スコアに対応する顔201の周囲に顔表示枠206を表示して、笑顔の評価対象の顔201をわかりやすく表示している。さらに、その顔表示枠206の近傍に、表情評価値に応じて異なる文字を表示する文字表示部207を設け、笑顔である度数が低いほどより強い笑顔にするように、被撮影者に対して文字によって促すようにしている。
【0044】
また、表情応答記録モードでは、撮像画像が記録される際の表情評価値のしきい値をユーザが任意に設定できるようにして、被撮影者がどの程度の笑顔となったときの画像を得たいかを自由に決められるようにしてもよい。図5の例では、例えば入力部20に設けられた左右方向の方向キー(図示せず)をユーザが押下することで、表情評価値のしきい値が変化するとともに、境界表示アイコン205が左右に移動して、表情評価値のしきい値に対応する笑顔スコアをユーザが視認できるようになっている。この場合、表情応答記録モードに設定されたときに、左右方向の方向キーを表情評価値のしきい値を設定するためのキーとして自動的に対応付けるようにしてもよく、これによりユーザの操作性を向上させることができる。
【0045】
なお、表情評価値のしきい値の変更は上記の手法に限らず、例えば、メニュー画面から選択される専用の設定画面から行うようにしてもよい。また、専用の操作キーを設けて行うようにしてもよい。また、ディスプレイ16がタッチパネル方式の場合は、例えばディスプレイ16上に表示させたキー画像に指を接触させることで、しきい値を変更してもよい。また、図5の境界表示アイコン205に指を接触させたまま左右に動かすことで、しきい値を変更できるようにしてもよい。
【0046】
また、撮像画面内から複数の顔が検出された場合には、それらの顔ごとに表情評価値を算出し、それらの値に応じた情報をディスプレイ16に表示してもよい。図6は、複数の顔が検出された場合における表情評価値に応じた情報の第1の画面表示例を示す図である。
【0047】
図6では例として、2つの顔211および212が検出された例を示している。顔211および212のそれぞれには、顔領域の周囲に顔表示枠213および214が表示されているとともに、その近傍に文字表示部215および216が設けられている。顔表示枠213および214は、それぞれの顔211および212に対する表情評価値に応じてその線種が変化するようにされ、文字表示部215および216には、表情評価値に応じた異なる文字が表示される。
【0048】
図6の例では、顔211については十分に強い笑顔であると評価されているが、顔212については笑顔の度合いが足りないと評価されている。例えば、顔211については表情評価値が自動記録のしきい値に達しているが、顔212については表情評価値がそのしきい値より少し低い状態を示している。このとき、顔211についての顔表示枠213を実線、顔212についての顔表示枠214を破線としてこのような評価状態の違いを対応する被撮影者に報知するとともに、文字表示部216にはさらに笑顔を強めることを促す文字情報を表示している。なお、この例では顔表示枠213および214の線種により表情評価値の違いを表しているが、その他に例えば、顔表示枠の輝度の違いや色の違い、太さの違いなどにより、表情評価値の違いを報知してもよい。
【0049】
図7は、複数の顔が検出された場合における表情評価値に応じた情報の第2の画面表示例を示す図である。
図7の例でも、図6と同様に2つの顔211および212が検出され、顔211については十分に強い笑顔であると評価され、顔212については笑顔の度合いが足りないと評価されている。また、図7の例では、顔211および212の各領域の近傍に、表情評価値に応じた記号217および218を示すことで、表情評価値の違いを被撮影者に報知している。
【0050】
以上のように、表情評価値に応じた情報をディスプレイを用いて報知することで、表情評価値に応じた笑顔スコアをバーグラフや数値で示す、あるいは、表情評価値に応じて顔表示枠の線種や色、明るさなどを変える、顔の近傍に表情評価値に応じて笑顔を促すような文字を表示するなど、様々な方法で表情評価値に応じた情報を被撮影者にわかりやすく報知することができる。特に、デジタルビデオカメラの場合、従来から設けられていた表示面方向可変のディスプレイを用いて報知できるので、カメラの基本的な構成を変えることによる大幅な開発・製造コストの上昇を招くことなく、ユーザにとって満足度の高い画像を確実に記録することができるようになる。
【0051】
なお、以上では表示面方向可変のディスプレイが搭載されたデジタルビデオカメラを例に挙げたが、撮像レンズとは反対の面に画角確認用のディスプレイが設けられるデジタルスチルカメラなどにも、そのディスプレイの表示面方向が可変のものがあり、その表示面を被撮影者側に向けることができれば、上記のような表示画像を表示させて表情評価値に応じた情報を被撮影者に報知することが可能である。
【0052】
次に、この撮像装置で用いる表情評価の手法について説明する。
図8は、表情評価のために事前に生成すべき情報と、その情報生成の流れについて概念的に示す図である。
【0053】
本実施の形態では、表情の評価手法として、いわゆる「フィッシャー(Fisher)の線形判別分析」の手法を用いる。この手法では、まず、2つの表情をそれぞれ持つ顔のサンプル画像を事前に多数用意しておき、これらのサンプル画像のデータを基に、2つの表情間の2クラス問題と考えて、線形判別分析(LDA:Linear Discriminant Analysis)によりこれらの2つの表情をよく判別する判別軸Adを事前に形成しておく。そして、表情評価の際には、入力された顔画像のデータと判別軸Adとの内積を求めることで、表情評価値を算出する。
【0054】
図8に示すように、本実施の形態では、笑顔のサンプル画像Psと通常の表情のサンプル画像Pnを用いる。これらのサンプル画像PsおよびPnは、例えば48画素×48画素の一定サイズに正規化した画像として用意しておく。そして、これらのサンプル画像のデータを(48×48)次元のベクトルデータとして取り扱い、LDA処理を行う。ただし、このベクトル空間は(48×48)本の座標軸を持つ非常に次元の大きい空間となる。そこで、LDA処理に先立って、それらのベクトルデータに対して主成分分析(PCA:Principal Component Analysis)を行い、顔の特徴だけを効率よく表すような次元の低い空間のデータに変換(次元圧縮)する。
【0055】
このPCA処理では、まず、入力されたM個(例えばM=300)のN次元(N=48×48)のサンプル画像群間のバラツキ(分散)が最大になるように、M本の軸を得ることを考える。このような軸は、画像群の共分散行列の固有値問題の解(固有ベクトル)として求められ、係数の比較的大きいベクトル成分のみを主成分として取り出すことで、顔の特徴を表すのに適したベクトル成分のみのN’次元(N>>N’)のデータに圧縮することができる。例えばN’=40程度とすることで、顔の表情判別について十分な精度を維持できることがわかっている。なお、PCA処理で得られた主成分のうち、係数の大きいものから順に数個程度除外することで、表情判別精度を保ちつつ、次元数をさらに減らして次のPCA処理の負荷を軽減できる。
【0056】
ここで、図9は、PCA処理時に入力するサンプル画像のマスキング処理について説明するための図である。
図9(A)のように、顔221が所定サイズの矩形領域に撮像されたサンプル画像Pをそのまま用いてPCA処理を行った場合、顔221の背景や髪などの影響により、適切な主成分を必ずしも選択できない場合があり得る。このため、図9(B)のように、顔221以外の領域にマスク222をかけて、できるだけ顔領域のみが残されたサンプル画像P1に変換し、顔の情報濃度を上げた状態でPCA処理することで、より高精度な次元圧縮を行うことができる。さらに、顔領域の中でも口は表情によって大きく変化し、擾乱要素となることが多いので、図9(C)のように口の領域までもマスク223をかけたサンプル画像P2を用いてPCA処理することで、さらに次元圧縮の精度を高めることができる。
【0057】
以下、図8に戻って説明すると、PCA処理によって次元圧縮された笑顔、通常の表情の各サンプル画像は、顔の特徴を効率よく表すような座標軸のみを持つ部分空間(PCA空間Spca)上のベクトルデータに変換される。図8では、このPCA空間Spcaに、笑顔、通常の表情の各サンプル画像PsおよびPnが射影された様子を模式的に表している。この図のように、PCA空間Spcaの上では、表情が同じサンプル画像は比較的近くに存在すると言える。そこで、これらの各表情のサンプル画像群を2つのクラスタCLsおよびCLnと捉え、これらのクラスタ同士を最もよく分離する射影軸(判別軸Ad)をLDA処理により形成する。このような判別軸Adは“フィッシャーの射影軸”と呼ばれる。
【0058】
LDA処理では、一般的に、N’次元の固有ベクトル上に射影されたクラス内およびクラス間の分散が最大になるような判別軸が求められる。すなわち、クラス内、クラス間の各共分散行列の最大固有値に対応する固有ベクトルを求め、これを判別軸Ad上のベクトル(フィッシャー・ベクトル)とする。各共分散行列と固有値、固有ベクトルとの関係を、式(1)および(2)に示す。
【0059】
【数1】
【0060】
ここで、式(2)の左辺の逆行列、固有値、固有ベクトルの演算には、それぞれLU(Lower-Upper)分解法、QR分解法(Q:直交行列,R:上三角行列)、ガウスの消去法を用いることができる。表情評価部41は、以上のように得られた判別軸Adの情報(判別軸情報44)として、フィッシャー・ベクトルの各成分の係数などの情報を、ROMなどにあらかじめ保持しておく。
【0061】
図10は、ピクセル空間およびPCA空間における判別軸および顔の入力画像の関係を概念的に示す図である。
上記の判別軸Adを用いた表情判別の基本的な手順は、まず、撮像画像から検出された顔の画像データをPCA処理し、主成分を抽出する。そして、この顔画像の表情は、図10のPCA空間Spcaに示すように、PCA処理された顔画像ベクトル(入力顔画像ベクトル)の判別軸Adに対する射影成分として評価される。すなわち、表情評価値Eexpの演算は、入力顔画像ベクトルとフィッシャー・ベクトルとの内積により算出できる(式(5−1)参照)。
【0062】
【数2】
【0063】
ただし、フィッシャー・ベクトルの情報は、ピクセル空間Spxl(PCA処理前の元の画像データが持つ次元の空間)での情報に換算しておくこともできる。式(3)および(4)はそれぞれ、入力顔画像ベクトルおよびフィッシャー・ベクトルをピクセル空間Spxlでのベクトルとして表しており、これらの関係を概念的に表したものが図10である。式(3)、式(4)および図10に示すように、PCA処理により得られる主成分μ1〜μN'以外のベクトル成分は、すべての入力画像の平均値として定数Cで近似できる。従って、式(5−1)に示すような内積演算は、式(5−2)のようにピクセル空間Spxlの上でのベクトルの内積演算として等価的に表すことができる。
【0064】
式(5−2)において、ピクセル空間Spxlでのフィッシャー・ベクトル成分と定数Cとの減算結果は事前に算出できるので、表情評価部41は、この減算結果と定数Cとを判別軸情報44としてあらかじめ保持しておく。そして、撮像画像から検出された顔画像のベクトルが与えられると、そのベクトルをPCA処理することなく、式(5−2)の内積演算を実行する。式(5−2)による1つの顔に対する評価値演算では、それぞれ最大で(48×48)回の減算、乗算および加算が実行されるのみであり、しかも実際には、40個程度の主成分μ1〜μN'に対応する係数の演算のみが実行されることになる。従って、PCA空間Spcaでのベクトルの内積演算を行う場合と比較して、表情評価の精度を落とすことなく演算量を大幅に削減することができ、撮像画像記録前の画角合わせの状態で表情評価値Eexpをリアルタイムで容易に算出できる。
【0065】
このような演算手法では、例えば、多数の顔画像のテンプレートと検出された顔画像とのマッチングにより表情を評価する手法と比較しても、はるかに低処理負荷かつ高精度の表情評価を行うことが可能である。テンプレートを用いたマッチングを行う場合、通常は、検出された顔画像からさらに目や口などのパーツを抽出し、パーツごとにマッチング処理を行う必要がある。これに対して、本実施の形態の手法では、検出した顔画像のデータを一定サイズに正規化した後、その顔画像をベクトル情報に置き換えてそのまま(あるいは部分的にマスクするだけで)内積演算に適用でき、その内積演算も上述の通り40次元程度の減算、乗算および加算からなる単純なものとなる。
【0066】
図11は、表情評価値を数値として出力する場合の算出例を示す図である。
本実施の形態では、例として、サンプル画像のPCA処理結果に基づき、PCA空間における笑顔の顔画像および通常の表情の顔画像のそれぞれの分布の平均を求め、これらの平均の判別軸Adに対する射影点を決めておく。そして、各平均の射影点の中点を基準として表情評価値Eexpを数値に換算する。すなわち、図11のように、入力顔画像の判別軸に対する射影点と平均の射影点の中点との距離を表情評価値Eexpとし、笑顔のサンプル画像の分布している側を正の数値とする。これにより、検出された顔の画像が笑顔と通常の表情のどちらに近いかを連続的な数値として出力できるようになり、表情評価値Eexpが高いほど強い笑顔であると評価される。
【0067】
次に、表情応答記録モードにおける撮像装置の処理手順について、フローチャートにまとめて説明する。図12は、表情応答記録モードにおける撮像装置の処理の流れを示すフローチャートである。
【0068】
〔ステップS11〕顔検出部31は、撮像画像のデータから顔を検出し、検出されたすべての顔の位置情報およびサイズ情報を、顔画像生成部32および報知制御部42に対して出力する。
【0069】
〔ステップS12〕顔画像生成部32は、顔検出部31からの顔の位置情報およびサイズ情報に基づき、撮像画像のデータから検出されたそれぞれの顔の領域のデータを切り出す。
【0070】
〔ステップS13〕顔画像生成部32は、切り出したそれぞれの顔領域のデータを、所定画素数(ここでは48画素×48画素)のデータに正規化し、さらに、表情検出に必要のない領域をマスキングして、処理後の画像データを表情評価部41に出力する。
【0071】
〔ステップS14〕表情評価部41は、判別軸情報44を読み込み、顔画像生成部32から供給されたもののうち1つの顔画像から得たベクトル成分と、判別軸のベクトル成分との内積演算を行って、表情評価値を算出する。算出した表情評価値は、例えばRAMなどに一時的に記憶される。
【0072】
〔ステップS15〕表情評価部41は、検出されたすべての顔について表情評価処理が済んだか否かを判断する。処理済みでない場合は、他の顔についてステップS14を再び実行し、処理済みの場合にはステップS16を実行する。
【0073】
〔ステップS16〕報知制御部42は、ステップS15で算出された表情評価値と、それに対応する顔の位置情報およびサイズ情報とを基に、笑顔スコアや表示枠などの表情情報をグラフィック処理回路15に出力し、ディスプレイ16に合成して表示させる。
【0074】
〔ステップS17〕表情評価部41は、ステップS14で算出した、すべての顔についての表情評価値が、しきい値を超えているか否かを判定する。しきい値を超えていない表情評価値がある場合には、ステップS11に戻って顔検出を実行するようにカメラ信号処理回路14に対して指示し、これにより次の顔画像の検出および表情評価処理が開始される。また、すべての表情評価値がしきい値を超えている場合には、ステップS18を実行する。
【0075】
〔ステップS18〕表情評価部41は、記録動作制御部43に対して、撮像画像のデータを記録装置18に記録するように要求する。これにより、撮像画像に対して記録用の信号処理が施され、処理後の符号化画像データが記録装置18に記録される。
【0076】
以上の処理により、検出されたすべての顔について表情評価値が算出され、その表情評価値に応じた情報が表示情報として被撮影者に通知されるので、被撮影者に対して撮像に適した表情になるように促すことができる。そして、すべての被撮影者が撮像に適した表情になったときに、撮像画像のデータが自動的に記録されるので、被撮影者や撮影者にとって満足度の高い画像を確実に記録できる。
【0077】
なお、ステップS17での判定基準はあくまで例であり、必ずしもすべての表情評価値がしきい値を超えたときに画像データを記録するように制御する必要はない。例えば、検出された顔のうち、一定の割合の顔の表情評価値がしきい値を超えたときに画像データを記録してもよい。あるいは、一定の数の顔の表情評価値がしきい値を超えたときに画像データを記録するようにして、偶然撮像された必要のない顔に対しても表情評価が実行されることを防止してもよい。
【0078】
また、上記の表情応答記録モードでは、単に表情評価値が所定のしきい値を超えたときに自動的に撮像画像を記録しているが、この他に例えば、撮影者によりシャッタレリーズボタンが押下されると、その一定時間後から被撮影者の表情を評価し、撮像に適する表情となったときに自動的に撮像画像を記録するようにしてもよい。この場合例えば、マイクロコンピュータ19は、シャッタレリーズボタンの押下を検出すると時間のカウントを開始し、一定時間が経過したときに図12の処理を開始させればよい。このような処理により、シャッタレリーズボタンを押下した撮影者も確実に撮像範囲に移動することができ、操作性が向上される。
【0079】
また、上記の説明では、「笑顔」と「通常時の表情」という2つの表情を定義し、笑顔にどれだけ近いかを判別していたが、「笑顔」とそれ以外の表情(非笑顔と呼ぶ)との間で判別を行うようにしてもよい。この「非笑顔」の表情は、真顔、泣き顔、怒り顔などの笑顔でない複数の表情を含んでもよい。この場合、これらの複数の表情に対応する顔のサンプル画像の平均から「非笑顔」の集合を求め、この集合と「笑顔」の集合とを基にLDA処理のための判別軸を算出する。
【0080】
さらに、表情評価値は、必ずしも「笑顔」のような1つの表情に対する近さを示すものでなくてもよく、例えば「笑顔」「真顔」などの特定の複数の表情を撮像に適する表情と考えて、これらの複数の表情の側にどれだけ近いかを示すようにしてもよい。この場合にも、これらの複数の表情に対応する顔のサンプル画像の平均から「撮像に適する表情」の集合を求め、この集合と「撮像に適さない表情」の集合とを基にLDA処理のための判別軸を算出すればよい。
【0081】
[第2の実施の形態]
図13は、本発明の第2の実施の形態に係る撮像装置の外観を示す図である。
本実施の形態では、表情評価値に応じた情報を、図1の構成の中のLED発光部21の一部を用いて被撮影者に報知する。図13に示した撮像装置110は、撮像レンズ111やフラッシュ発光部112などが搭載された面に、表情評価値に応じた情報を報知するための専用のLED発光部21aが設けられている。LED発光部21aには複数のLED21b〜21fが1つの線上に設けられており、それらの一方からのLEDの点灯数により、表情評価値に応じた情報(ここでは笑顔スコア)が被撮影者に通知される。このような構成により、表示面方向可変のディスプレイを持たないデジタルスチルカメラなどの撮像装置においても、表情評価値に応じた情報を被撮影者に報知して、適切な画像が記録されるように撮像動作を補助することができる。また、LEDなどの小型の発光デバイスを用いることで、撮像装置本体の大型化を最小限に留めることができる。
【0082】
さらに、LED発光部21aにおいては、最も他方の側のLED(図ではLED21f)が、撮像画像が自動的に記録される際の笑顔スコアを示すものとし、このLEDを他とは別の色や輝度などで発光させてもよい。これにより、自動記録が行われる際の笑顔スコアを被撮影者に明確に報知でき、また自動記録が行われたことを被撮影者が認識できるようにもなる。
【0083】
[第3の実施の形態]
図14は、本発明の第3の実施の形態に係る撮像装置の外観を示す図である。
図14に示す撮像装置120では、撮像レンズ121やフラッシュ発光部122などが搭載された面に、1つのLEDのみを持つLED発光部21gが設けられている。このようなLED発光部21gにおいては、表情評価値に応じて、例えば、LEDの点滅速度を変える、LEDの輝度や色を変えることなどによって、笑顔スコアを被撮影者に報知することが可能である。例えば、表情評価値が大きくなるに連れて、LEDの色を赤、緑、青に徐々に変化させる、あるいは、LEDを徐々に明るくするなどの制御が可能である。このように、1つのLEDのみ用いることで、撮像装置本体の大型化をさらに顕著に阻止できる。
【0084】
また、この撮像装置120が従来のセルフタイマ機能を備えている場合には、そのセルフタイマ作動時に用いられるLEDを表情評価用に兼用することもできる。例えば、セルフタイマの作動時には、シャッタレリーズボタンが押下された後、記録までの間に時間の経過に従って徐々にLEDの点滅速度を高くする。そして、表情評価モードや表情応答記録モードでは、表情評価値が高いほどLEDの点滅速度を高くする。このような構成により、従来の撮像装置の基本構成や外観を変えることなく、表情評価値に応じた情報を被撮影者に報知できる。また、兼用可能な発光部はセルフタイマ用に限らず、例えば、露光制御時の測光用発光部を兼用することもできる。ただし、この場合には、少なくとも表情評価時には可視光を発光できる必要がある。
【0085】
[第4の実施の形態]
図15は、本発明の第4の実施の形態に係る撮像装置の外観を示す図である。
上記の各実施の形態では、表情評価値に応じた情報を視覚的に報知していた。これに対して、本実施の形態では、図2に示した音声出力部22を用いて、表情評価値に応じた情報を音声により報知する。図15に示した撮像装置130では、撮像レンズ131が搭載された側にスピーカ22aを設け、表情評価値に応じて異なる音声を再生出力させる。出力する音声としては、例えば、図5や図6に示した文字情報と同様、笑顔である度数が低いほどより強い笑顔にするように、被撮影者に対して促すような音声とする。この場合、撮像装置130は、再生すべき音声のデータを、表情評価値に対して段階的に対応付けてあらかじめ保持しておけばよい。また、表情評価値に応じて音の高さや出力間隔を変える手法や、表情評価値に応じて異なるメロディの音声を出力する手法などを採ってもよい。なお、音声による報知と、視覚的な情報による報知とが併用されてもよい。
【0086】
[第5の実施の形態]
図16は、本発明の第5の実施の形態に係るPC(パーソナルコンピュータ)の外観を示す図である。
【0087】
上記の各実施の形態における表情評価機能、表情評価値に応じた情報の報知機能、および表情評価値に応じた画像の自動記録機能は、図16に示すPC140のように各種のコンピュータにおいても実現することができる。図16では例として、LCDからなるディスプレイ141とキーボード142や本体部が一体に構成されたノート型のPC140を示している。そして、このPC140には、例えばディスプレイ141の上端部に撮像部143が一体に設けられており、PC140を操作しているユーザの側を撮像できるようになっている。なお、撮像部143は、例えばUSB(Universal Serial Bus)などの通信インタフェースを介して外部に接続されるものでもよい。
【0088】
このようなコンピュータにおいては、上記各機能の処理内容を記述したプログラムをコンピュータで実行することにより、それらの機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。
【0089】
このプログラムを流通させる場合には、例えば、プログラムが記録された光ディスクなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0090】
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【図面の簡単な説明】
【0091】
【図1】本発明の第1の実施の形態に係る撮像装置の要部構成を示すブロック図である。
【図2】表情評価モードおよび表情応答記録モードを実現するために撮像装置が備える機能を示すブロック図である。
【図3】表情評価モードにおける動作の概要を示す図である。
【図4】笑顔スコアを示すバーグラフの動きを説明するための図である。
【図5】バーグラフを用いた笑顔スコアの画面表示例を示す図である。
【図6】複数の顔が検出された場合における表情評価値に応じた情報の第1の画面表示例を示す図である。
【図7】複数の顔が検出された場合における表情評価値に応じた情報の第2の画面表示例を示す図である。
【図8】表情評価のために事前に生成すべき情報と、その情報生成の流れについて概念的に示す図である。
【図9】PCA処理時に入力するサンプル画像のマスキング処理について説明するための図である。
【図10】ピクセル空間およびPCA空間における判別軸および顔の入力画像の関係を概念的に示す図である。
【図11】表情評価値を数値として出力する場合の算出例を示す図である。
【図12】表情応答記録モードにおける撮像装置の処理の流れを示すフローチャートである。
【図13】本発明の第2の実施の形態に係る撮像装置の外観を示す図である。
【図14】本発明の第3の実施の形態に係る撮像装置の外観を示す図である。
【図15】本発明の第4の実施の形態に係る撮像装置の外観を示す図である。
【図16】本発明の第5の実施の形態に係るPCの外観を示す図である。
【符号の説明】
【0092】
11……光学ブロック、11a……ドライバ、12……撮像素子、12a……タイミングジェネレータ(TG)、13……アナログフロントエンド(AFE)回路、14……カメラ信号処理回路、15……グラフィック処理回路、16……ディスプレイ、17……画像エンコーダ、18……記録装置、19……マイクロコンピュータ、20……入力部、21……LED発光部、22……音声出力部、31……顔検出部、32……顔画像生成部、41……表情評価部、42……報知制御部、43……記録動作制御部、44……判別軸情報
【特許請求の範囲】
【請求項1】
固体撮像素子を用いて画像を撮像する撮像装置において、
撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出する顔検出部と、
検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、前記特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する表情評価部と、
算出された前記表情評価値の大きさを視覚的に示す報知情報を報知する報知部と、
を有することを特徴とする撮像装置。
【請求項2】
前記表情評価部は、前記特定の表情に含まれると判断される複数の顔データに基づく第1の顔集合と、前記特定の表情以外の表情に含まれると判断される複数の顔データに基づく第2の顔集合との間において、前記第1の顔集合にどれだけ近いかの度合いを示す前記表情評価値を算出することを特徴とする請求項1記載の撮像装置。
【請求項3】
前記表情評価部は、前記特定の表情として笑顔を適用し、検出された顔が笑顔にどれだけ近いかの度合いを前記表情評価値として算出することを特徴とする請求項1記載の撮像装置。
【請求項4】
前記表情評価部は、前記特定の表情以外の表情として、通常の表情を適用することを特徴とする請求項3記載の撮像装置。
【請求項5】
前記表情評価部は、前記特定の表情以外の表情として、笑顔以外の表情を適用することを特徴とする請求項3記載の撮像装置。
【請求項6】
前記表情評価値が所定のしきい値を超えた場合に、撮像によって得られた画像信号を記録媒体に自動的に記録する画像記録制御部をさらに有することを特徴とする請求項1記載の撮像装置。
【請求項7】
前記しきい値をユーザの入力操作に応じて変更可能であることを特徴とする請求項6記載の撮像装置。
【請求項8】
前記報知部は、前記表情評価値に応じて変化する前記報知情報と、前記しきい値の位置を前記報知情報の変化に対応させて示すしきい値情報とを、視覚的な情報として報知することを特徴とする請求項6記載の撮像装置。
【請求項9】
前記報知部は、前記表情評価値の大きさをバーの長さで示すバー表示画像を表示装置に表示するとともに、前記しきい値の位置を示す位置表示画像を前記バー表示画像上に表示し、
ユーザによる入力操作に応じて前記しきい値が変更されるとともに、前記しきい値の変更に応じて前記バー表示画像上での前記位置表示画像の位置も変化することを特徴とする請求項8記載の撮像装置。
【請求項10】
前記顔検出部が複数の顔を検出し、前記表情評価部が検出された複数の顔のそれぞれについて前記表情評価値を算出したとき、前記画像記録制御部は、検出されたすべての顔についての前記表情評価値が前記しきい値を超えた場合に、画像信号を自動的に記録することを特徴とする請求項6記載の撮像装置。
【請求項11】
前記顔検出部が複数の顔を検出し、前記表情評価部が検出された複数の顔のそれぞれについて前記表情評価値を算出したとき、前記画像記録制御部は、検出された顔のうち、所定数または所定割合の顔についての表情評価値が前記しきい値を超えた場合に、画像信号を自動的に記録することを特徴とする請求項6記載の撮像装置。
【請求項12】
前記画像記録制御部は、ユーザによる画像記録操作を検出すると、一定時間後に前記表情評価部から前記表情評価値を取得し、当該表情評価値が所定のしきい値を超えた場合に、撮像によって得られた画像信号を記録媒体に自動的に記録することを特徴とする請求項6記載の撮像装置。
【請求項13】
前記報知部は、前記報知情報を被撮影者側に向けて報知することを特徴とする請求項1記載の撮像装置。
【請求項14】
前記報知部は、前記表情評価値に応じた前記報知情報を撮像中の画像とともに表示装置に表示することを特徴とする請求項13記載の撮像装置。
【請求項15】
前記報知部は、前記報知情報として、前記表情評価値の大きさをバーの長さで示すバー表示画像を前記表示装置に表示することを特徴とする請求項14記載の撮像装置。
【請求項16】
前記報知部は、前記報知情報として、前記表示装置に表示された被撮影者の顔の周囲に枠体として表示し、前記表情評価値の大きさに応じて前記枠体の色、明るさ、線種の少なくとも1つを変化させることを特徴とする請求項14記載の撮像装置。
【請求項17】
前記報知部は、前記報知情報として、前記表情評価値の大きさに応じて異なる文字情報として前記表示装置に表示することを特徴とする請求項14記載の撮像装置。
【請求項18】
前記表情評価部は、前記顔検出部により複数の顔が検出された場合には、検出された顔ごとにそれぞれ前記表情評価値を算出し、
前記報知部は、顔ごとの前記表情評価値に応じた前記報知情報を、前記表示装置に表示された被撮影者の顔のそれぞれに対応付けて表示することを特徴とする請求項14記載の撮像装置。
【請求項19】
前記報知部は、前記報知情報として、前記表情評価値の大きさに応じた異なる報知音声をさらに出力することを特徴とする請求項1記載の撮像装置。
【請求項20】
固体撮像素子を用いて撮像された顔の表情を評価する表情評価装置において、
撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出する顔検出部と、
検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、前記特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する表情評価部と、
算出された前記表情評価値の大きさを視覚的に報知するための報知情報を生成する報知情報生成部と、
を有することを特徴とする表情評価装置。
【請求項1】
固体撮像素子を用いて画像を撮像する撮像装置において、
撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出する顔検出部と、
検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、前記特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する表情評価部と、
算出された前記表情評価値の大きさを視覚的に示す報知情報を報知する報知部と、
を有することを特徴とする撮像装置。
【請求項2】
前記表情評価部は、前記特定の表情に含まれると判断される複数の顔データに基づく第1の顔集合と、前記特定の表情以外の表情に含まれると判断される複数の顔データに基づく第2の顔集合との間において、前記第1の顔集合にどれだけ近いかの度合いを示す前記表情評価値を算出することを特徴とする請求項1記載の撮像装置。
【請求項3】
前記表情評価部は、前記特定の表情として笑顔を適用し、検出された顔が笑顔にどれだけ近いかの度合いを前記表情評価値として算出することを特徴とする請求項1記載の撮像装置。
【請求項4】
前記表情評価部は、前記特定の表情以外の表情として、通常の表情を適用することを特徴とする請求項3記載の撮像装置。
【請求項5】
前記表情評価部は、前記特定の表情以外の表情として、笑顔以外の表情を適用することを特徴とする請求項3記載の撮像装置。
【請求項6】
前記表情評価値が所定のしきい値を超えた場合に、撮像によって得られた画像信号を記録媒体に自動的に記録する画像記録制御部をさらに有することを特徴とする請求項1記載の撮像装置。
【請求項7】
前記しきい値をユーザの入力操作に応じて変更可能であることを特徴とする請求項6記載の撮像装置。
【請求項8】
前記報知部は、前記表情評価値に応じて変化する前記報知情報と、前記しきい値の位置を前記報知情報の変化に対応させて示すしきい値情報とを、視覚的な情報として報知することを特徴とする請求項6記載の撮像装置。
【請求項9】
前記報知部は、前記表情評価値の大きさをバーの長さで示すバー表示画像を表示装置に表示するとともに、前記しきい値の位置を示す位置表示画像を前記バー表示画像上に表示し、
ユーザによる入力操作に応じて前記しきい値が変更されるとともに、前記しきい値の変更に応じて前記バー表示画像上での前記位置表示画像の位置も変化することを特徴とする請求項8記載の撮像装置。
【請求項10】
前記顔検出部が複数の顔を検出し、前記表情評価部が検出された複数の顔のそれぞれについて前記表情評価値を算出したとき、前記画像記録制御部は、検出されたすべての顔についての前記表情評価値が前記しきい値を超えた場合に、画像信号を自動的に記録することを特徴とする請求項6記載の撮像装置。
【請求項11】
前記顔検出部が複数の顔を検出し、前記表情評価部が検出された複数の顔のそれぞれについて前記表情評価値を算出したとき、前記画像記録制御部は、検出された顔のうち、所定数または所定割合の顔についての表情評価値が前記しきい値を超えた場合に、画像信号を自動的に記録することを特徴とする請求項6記載の撮像装置。
【請求項12】
前記画像記録制御部は、ユーザによる画像記録操作を検出すると、一定時間後に前記表情評価部から前記表情評価値を取得し、当該表情評価値が所定のしきい値を超えた場合に、撮像によって得られた画像信号を記録媒体に自動的に記録することを特徴とする請求項6記載の撮像装置。
【請求項13】
前記報知部は、前記報知情報を被撮影者側に向けて報知することを特徴とする請求項1記載の撮像装置。
【請求項14】
前記報知部は、前記表情評価値に応じた前記報知情報を撮像中の画像とともに表示装置に表示することを特徴とする請求項13記載の撮像装置。
【請求項15】
前記報知部は、前記報知情報として、前記表情評価値の大きさをバーの長さで示すバー表示画像を前記表示装置に表示することを特徴とする請求項14記載の撮像装置。
【請求項16】
前記報知部は、前記報知情報として、前記表示装置に表示された被撮影者の顔の周囲に枠体として表示し、前記表情評価値の大きさに応じて前記枠体の色、明るさ、線種の少なくとも1つを変化させることを特徴とする請求項14記載の撮像装置。
【請求項17】
前記報知部は、前記報知情報として、前記表情評価値の大きさに応じて異なる文字情報として前記表示装置に表示することを特徴とする請求項14記載の撮像装置。
【請求項18】
前記表情評価部は、前記顔検出部により複数の顔が検出された場合には、検出された顔ごとにそれぞれ前記表情評価値を算出し、
前記報知部は、顔ごとの前記表情評価値に応じた前記報知情報を、前記表示装置に表示された被撮影者の顔のそれぞれに対応付けて表示することを特徴とする請求項14記載の撮像装置。
【請求項19】
前記報知部は、前記報知情報として、前記表情評価値の大きさに応じた異なる報知音声をさらに出力することを特徴とする請求項1記載の撮像装置。
【請求項20】
固体撮像素子を用いて撮像された顔の表情を評価する表情評価装置において、
撮像によって得られた画像信号が記録媒体に記録されるまでの期間において、その画像信号から人物の顔を検出する顔検出部と、
検出された顔の表情を評価し、特定の表情とそれ以外の表情との間において、前記特定の表情にどれだけ近いかの度合いを示す表情評価値を算出する表情評価部と、
算出された前記表情評価値の大きさを視覚的に報知するための報知情報を生成する報知情報生成部と、
を有することを特徴とする表情評価装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2008−289189(P2008−289189A)
【公開日】平成20年11月27日(2008.11.27)
【国際特許分類】
【出願番号】特願2008−209119(P2008−209119)
【出願日】平成20年8月15日(2008.8.15)
【分割の表示】特願2006−211000(P2006−211000)の分割
【原出願日】平成18年8月2日(2006.8.2)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成20年11月27日(2008.11.27)
【国際特許分類】
【出願日】平成20年8月15日(2008.8.15)
【分割の表示】特願2006−211000(P2006−211000)の分割
【原出願日】平成18年8月2日(2006.8.2)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]