説明

電子機器

【課題】画像や音楽等のコンテンツを正確に評価できるようにする。
【解決手段】コンテンツとしての画像を再生すると、サブカメラによって鑑賞者の顔が撮像されるとともに、鑑賞者の声が録音される。取得された顔画像データに基づいて表情認識および体動認識が行われ、その結果に基づいて点数付けがなされる。一方、録音された鑑賞者の音声に基づいて音声認識が行われ、その結果に基づいて点数付けがなされる。両点数付けの結果の合計値に基づいて当該画像の評価が決まる。決定された評価は、当該画像データに対応づけられて記憶される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像や音楽等のコンテンツを自動的に評価可能な電子機器に関する。
【背景技術】
【0002】
楽曲や映像等のコンテンツを再生しているときに鑑賞者の体動を検出し、当該コンテンツに対する鑑賞者の嗜好度を算出し、その嗜好度を当該楽曲に対応づけて記録することが可能な再生装置が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−86835号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、体動で鑑賞者の嗜好度を判断するのは困難な場合が多い。
【課題を解決するための手段】
【0005】
本発明に係る電子機器は、コンテンツを再生する再生手段と、コンテンツの再生中に鑑賞者の表情および/または音声を検出する検出手段と、検出手段の検出結果に基づいて上記再生されたコンテンツを評価する評価手段とを具備することを特徴とする。
【発明の効果】
【0006】
本発明によれば、コンテンツの評価をその鑑賞者の表情および/または音声にて行うので、コンテンツを正確に評価できる。
【図面の簡単な説明】
【0007】
【図1】一実施形態におけるデジタルカメラの制御ブロック図。
【図2】レイティング結果を画像に重ね合わせて表示する際の表示例を示す図。
【図3】レイティング時の鑑賞者の様子を画像に重ね合わせて表示する際の表示例を示す図。
【図4】スライドショー時の再生レイティング機能を説明するフローチャート。
【図5】スライドショー後のレイティング結果をグラフ表示する際の表示例を示す図。
【発明を実施するための形態】
【0008】
図1〜図5により本発明の一実施の形態を説明する。
図1は本実施形態におけるカメラの制御系を示すブロック図である。不図示の撮影レンズを透過した撮影光束は、光学ローパスフィルタ1を経て撮像センサ2にて撮像される。撮像センサ2の動作は、タイミングジェネレータ(TG)3によって制御される。
【0009】
撮像センサ2の光電変換出力である撮像信号は、A/Dコンバータ4でデジタル信号に変換されて画像処理MCU5に入力され、DSP(デジタル信号処理装置)5aで処理されて画像データが生成される。画像データは、画像ファイルとしてメモリカード6等の画像記録媒体に記録される。
【0010】
再生モード時には、メモリカード6等に記録された画像ファイルを読み出し、DSP5aおよび表示出力部5bの処理を経た後、内蔵LCDユニット7に画像として表示することができる。LCDユニット7は、例えばカメラ背面に設けられたカラー液晶モニタである。また再生モードでは、スライドショーの作成および実行が可能である。スライドショーは、メモリカード6内の複数の画像データを、所定時間間隔で順次入れ替えてLCDユニット7に表示する機能である。
【0011】
さらに、画像データをビデオ信号に変換し、ビデオ出力部8を介してTVなどの外部装置に表示することもできる。また、高解像度出力トランスミッター9を介して画像ファイルを外部のハイビジョンTV等へ出力できる。
【0012】
画像処理MCU5には、マイク10、スピーカ11およびサブカメラ12が接続され、マイク10を介して入力された音声データを記録したり、記録した音声データをスピーカ11から再生することができる。サブカメラ12は、専用の撮影レンズや撮像センサ等を有し、LCDユニット7上の画像を鑑賞する鑑賞者の顔を撮像可能な位置に設けられている。例えばLCDユニット7がカメラ背面に設けられる場合は、サブカメラ12の撮影レンズもカメラ背面に設けられる。
【0013】
画像処理MCU5に接続されたサブMCU20は、レリーズボタン21や他の操作部22の操作に応答し、センサ(AFセンサ,AEセンサなど)22Aからの入力情報や、姿勢検出部23から入力されるカメラの姿勢情報等に基づいて各種演算を行い、その演算結果に基づいてカメラ駆動部24を制御する。カメラ駆動部24は、AF駆動部(レンズ駆動部)や、絞り駆動部、ミラー駆動部などから構成される。
【0014】
次に、画像のレイティング機能について説明する。
本実施形態のカメラは、画像再生中の鑑賞者の表情や発声を検出し、それらの検出結果に基づいて画像を自動的に評価する機能を有している。以下、この機能を「再生レイティング機能」と呼ぶ。
【0015】
この機能を実現するために、カメラは顔認識機能、表情認識機能および音声認識機能を備えている。顔認識は、公知のように画像データ中に被写体として人物が存在する場合に、その人物の顔領域の位置および大きさを検出する機能であり、一般的には顔部分にピントや露出を合わせるのに用いられる。表情認識は、顔認識で認識された画像データ中の顔の表情を認識する機能であり、例えば「笑顔」、「喜び」、「悲しみ」、「怒り」、「驚き」といった喜怒哀楽の表情を検出できる。これは、例えば特開2001−51338号公報に記載されている技術を用いて実現可能である。音声認識は、公知のように音声データから音声の内容を認識する機能である。
【0016】
再生レイティング機能は、その選択/非選択を設定画面等で指定することができる。この機能が選択されているときに再生モードで画像再生を行うと、サブカメラ12およびマイク10が作動し、それぞれ撮像および録音を行う。サブカメラ12は、上述したように画像の鑑賞者の顔を撮像して画像データを生成する。
【0017】
画像処理MCU5は、サブカメラ12によって得られた顔画像データに対して顔認識を行い、続いて表情認識を行う。また録音された音声データに対して音声認識を行い、音声の内容を取得するとともに、音声の大きさやトーンなどを検出する。そして、表情認識および音声認識の結果に基づいて、再生された画像の評価を行う。
【0018】
例えば「笑顔」や「喜び」、「驚き」の表情が検出された場合は点数が加算され、「悲しみ」、「怒り」等では点数が減算される。いずれの喜怒哀楽の表情も検出されない場合は点数の加算/減算は行わない。なお、複数人で画像を鑑賞する場合は複数の顔が認識されるが、この場合は複数の顔に対する表情認識結果に基づいて点数が決定される。例えば、各顔に対して点数を求め、それらの最大値あるいは平均値を求める。表情の度合いに基づいて点数を変えてもよい(例えば、同じ「笑顔」でも、微笑み程度と大笑いとで点数を変える)。
【0019】
また音声では、声の大きさ、トーンに応じて点数を加算/減算する。例えば声が大きいほど、あるいはトーンが高いほど感動が大きいと判断し、点数を加算する。さらに上記音声認識の結果に基づき、「すごい」などの誉め言葉が検出された場合は点数を加算する。
【0020】
上記表情や音声に加え、体動による点数付けを行ってもよい。体動については、サブカメラ12によって繰り返し得られる画像データから判断でき、例えば鑑賞者の体が大きく動いた場合や、手を叩く仕草が検出された場合に点数を加算するようにすればよい。さらに、サブカメラ12により動画撮影を行い、それに基づいて表情認識や体動認識を行ってもよい。
【0021】
なお、何らかの理由によりサブカメラ12の画像中に顔領域が検出されなかった場合は、表情認識や体動認識による点数付けは行えない。この場合は、今回の点数付けは行わないようにしてもよいし、音声の結果のみで点数付けを行うようにしてもよい。また、音声が検出されなかった場合は、今回の点数付けは行わないようにしてもよいし、顔領域が検出されていれば、表情認識や体動認識のみによる点数付けを行うようにしてもよい。
【0022】
上記鑑賞者の撮像および録音から点数付けまでの一連の処理は、1枚の画像の再生中に最低1度行えばよいが、再生中に所定の周期で繰り返し行い、各回の点数の最大値または平均値をその画像の点数としてもよい。
【0023】
以上のようにして求められた点数をそのまま画像の評価としてもよいが、点数に基づいて5段階評価、あるいは10段階評価などの評価を行ってもよい。
【0024】
決定された評価は、当該画像に対応づけられて記憶される。一般に画像は、コンピュータで扱うことが可能な画像ファイルとしてメモリカード6等の記録媒体に記録されるが、その画像ファイルのヘッダ情報として上記評価情報を埋め込むことが可能である。画像ファイルとは別に評価データを記憶してもよい。
【0025】
レイティングがなされた画像を内蔵LCDユニット7に再生表示すると、その画像ファイルに対応づけられた評価情報が読み出され、画像とともに表示される。図2はその表示例を示し、5段階評価の結果が星の数で画像に重ね合わせて表示されている。画像の余白部分に表示してもよい。このレイティング表示は、画像選択用のサムネイル表示において各サムネイル画像にも表示することができる。
【0026】
一方、図3に示すように、レイティングに使用した画像(鑑賞者を撮影したものであり、静止画または動画)をサブウィンドウSWに表示したり、レイティングに使用した音声を再生することで、鑑賞者の反応付きで画像を楽しむことができる。これを実現するには、鑑賞者を撮影した画像データや録音した音声データを、評価の対象となった画像ファイルに対応づけて保存しておく必要がある。
【0027】
ここで、レイティングは、画像の分類や並び替え、画像検索におけるキーとしても利用できる。例えば、レイティングがなされた画像ファイルは、評価別に作成したフォルダに自動的に移動するようにしてもよい(例えば、5つ星の画像ファイルは5つ星フォルダに入れるなど)。また、画像を評価順に並べ替えたり、評価の高い(低い)幾つかの画像を選び出して表示したり(例えば、トップ10、ワースト10など、)、特定の評価(例えば、5つ星、3つ星以上など)の画像のみを検索してサムネイル表示したりすることも容易である。
【0028】
このようなレイティング結果を用いた処理は、パーソナルコンピュータ等の外部装置でも実行可能である。ただし、その場合は外部装置に専用のソフトウェアを組み込むとともに、レイティング済みの画像ファイルを転送する必要がある。
【0029】
なお、レイティング済みの画像を再生した場合は、再度のレイティングを行わないようにしてもよいし、再度レイティングを行って結果を書き換えたり、結果を累積するようにしてもよい。上記いずれかを選択可能としてもよい。
【0030】
以上のような再生レイティング機能は、ユーザが1枚ずつ画像を選択して再生するときも可能であるし、スライドショー実行時にも行うことができる。
【0031】
図4はスライドショーにおける再生レイティング処理の一例を示すフローチャートである。
スライドショーが開始されるとこのプログラムが起動され、まずステップS1で枚数カウンタNを「1」とする。ステップS2では、N枚目の画像を再生表示し、ステップS3でサブカメラ12による撮像とマイク10による録音とを行う。ステップS4では、サブカメラ12で得られた画像データに対して顔認識を行い、ステップS5で顔領域が検出されたか否かを判定する。顔領域が検出された場合はステップS6で表情認識を行うとともに、ステップS7で体動認識を行う。またステップS8では、録音された音声データに対して音の高さやトーンなどを検出するとともに、音声認識を行う。ステップS9では、ステップS6〜S8の結果に基づいて上述したようにN枚目の表示画像の点数付けを行う。
【0032】
ステップS10では、N枚目の画像の表示開始から所定時間(スライドショーにおける1枚の表示時間)が経過したか否かを判定し、まだ経過していない場合はステップS3に戻り、経過した場合はステップS11に進む。ステップS11では、例えば各回の点数の最大値に基づいてN枚目の画像の評価を決定する。決定された評価情報は、当該画像ファイルに対応づけられて記憶される。
【0033】
ステップS12ではスライドショーの終了か否かを判定する。予め決められた画像が全て再生された場合や、ユーザがスライドショーを強制終了させる操作を行った場合は、ステップS12が肯定されてステップS13に進む。ステップS13では、例えば図5に示すように、各画像の評価結果をグラフ表示する。図5において、縦線は各画像の評価を表示順に示したものであり、特に評価が基準値以上の画像については、そのサムネイル画像が表示される。これにより高評価の画像を一目で確認できる。
【0034】
まだスライドショーが終了でない場合はステップS14に進み、NをカウントアップしてステップS2に戻る。
【0035】
なお、鑑賞者によって評価が異なることに鑑み、レイティングを鑑賞者ごとに行ってもよい。つまり1枚の画像に対し、鑑賞者Aによる評価、鑑賞者Bによる評価、鑑賞者Cによる評価・・・を別々に求めて記憶できるようにする。これを実現するには、カメラに設けられたデータベースに、予め複数の人物の名前(A,B,C・・・)と、顔の特徴データとを対応づけて登録しておく。顔の特徴データは、各人の顔を撮像したデータからカメラが自動的に取得する。その後、再生レイティング機能を実行すると、カメラはサブカメラ12による画像データに対して顔認識を行い、上記データベース検索を行って鑑賞者が誰であるか(複数人の場合は誰と誰であるか)を認識する。そして、各人に対して表情認識を行い、その結果に基づいて各人の評価を求めて記憶する。これによれば、各鑑賞者がどのような画像を好むかが分かって面白い。
【0036】
また、サブカメラで得た画像をレイティングに用いるようにしたが、例えばレンズ回転式のカメラで、LCDユニットを視認する鑑賞者に撮影レンズを向けることが可能なものであれば、メインのカメラ機能で得た画像をレイティングに用いることができ、サブカメラは不要となる。また、TV等の外部装置に画像を表示しているときに上記再生レイティング機能が働くようにした場合も、メインのカメラ機能でレイティング用の画像を得ることができる。
【0037】
さらに、評価すべきコンテンツは静止画に限定されず、動画や音楽、その他のコンテンツでもよい。
【符号の説明】
【0038】
2 撮像センサ
5 画像処理MCU
7 内蔵LCDユニット
10 マイク
12 サブカメラ

【特許請求の範囲】
【請求項1】
コンテンツを再生する再生手段と、
コンテンツの再生中に鑑賞者の表情および/または音声を検出する検出手段と、
前記検出手段の検出結果に基づいて前記再生されたコンテンツを評価する評価手段とを具備することを特徴とする電子機器。
【請求項2】
前記検出手段は、前記コンテンツを鑑賞する鑑賞者を撮像する撮像部と、該撮像部の出力から鑑賞者の表情を検出する表情検出部とを含むことを特徴とする請求項1に記載の電子機器。
【請求項3】
前記再生手段は、前記コンテンツとしての画像を内蔵表示装置または外部の表示装置に再生表示する画像再生手段であることを特徴とする請求項1または2に記載の電子機器。
【請求項4】
前記再生手段は、前記コンテンツとしての画像を内蔵表示装置に再生表示する画像再生手段であり、前記撮像部は、前記内蔵表示装置の画像を鑑賞する鑑賞者を撮像可能な位置に設けられていることを特徴とする請求項2に記載の電子機器。
【請求項5】
前記検出した音声から音声の内容を取得する取得手段を更に備え、前記評価手段は、前記音声の内容に基づいて前記再生されたコンテンツを評価することを特徴とする請求項1に記載の電子機器。
【請求項6】
被写体を撮像して前記コンテンツとしての画像を得る撮像手段を更に備えることを特徴とする請求項1〜5のいずれか1項に記載の電子機器。
【請求項7】
前記評価手段による評価後に前記コンテンツを再生する際に、当該コンテンツの評価を報知する報知手段を更に備えることを特徴とする請求項1〜6のいずれか1項に記載の電子機器。
【請求項8】
前記評価手段による評価後に前記コンテンツを再生する際に、前記撮像部の出力を画像として表示することを特徴とする請求項2に記載の電子機器。
【請求項9】
前記評価手段の評価結果を当該コンテンツと対応づけて保存することを特徴とする請求項1〜8のいずれか1項に記載の電子機器。
【請求項10】
前記検出手段は、鑑賞者の前記表情および/または音声に加えて鑑賞者の体動をも検出することを特徴とする請求項1〜9のいずれか1項に記載の電子機器。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−237761(P2010−237761A)
【公開日】平成22年10月21日(2010.10.21)
【国際特許分類】
【出願番号】特願2009−82285(P2009−82285)
【出願日】平成21年3月30日(2009.3.30)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】