電子カメラ

【課題】
従来、発音してペットなどの顔をカメラの方に向けさせる場合、どのような音が最適かわからないという問題があった。
【解決手段】
本発明では、被写体画像を撮像する撮像手段と、前記撮像手段に撮像指示を与える操作手段と、前記撮像手段が撮像する画像から顔を検出する顔検出手段と、予め登録された複数種類の音を発生する発音手段と、前記発音手段が音を発生してから前記顔検出手段で顔を検出するまでの時間を測定する時間測定手段と、前記時間測定手段により測定された時間を前記音の種類に対応させて保存する保存手段と、前記保存手段に保存された時間が最小となる音の種類を判別する判別手段とを有し、前記発音手段は、本撮影時に前記判別手段が判別した種類の音を発生させることを特徴とする。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、電子カメラに関する。
【背景技術】
【０００２】
従来、ペットなどの動物を撮影する場合、撮影者の意思に反して、カメラの方に顔を向けないことが多い。そのため、ペットを振り向かせるための音をカメラで発音して、ペットがカメラの方に顔を向けたときに撮影するカメラが提案されている（例えば、特許文献１参照）。
【先行技術文献】
【特許文献】
【０００３】
【特許文献１】特開２００２−１０７８０７号公報
【発明の概要】
【発明が解決しようとする課題】
【０００４】
ところが、ペットを振り向かせるのに最適な音がペットの種類や個体により異なり、どの音が最適であるかわからないという問題がある。例えば同じ種類のペットの声（たとえば犬の吠える声）をカメラで発音しても、その音で犬がカメラの方を向くとは限らず、逆にカメラから逃げてしまう場合もある。
【０００５】
本発明の目的は、撮影するペットをカメラの方に振り向かせるのに最適な音を発音することができる電子カメラを提供することである。
【課題を解決するための手段】
【０００６】
本発明に係る電子カメラは、被写体画像を撮像する撮像手段と、前記撮像手段に撮像指示を与える操作手段と、前記撮像手段が撮像する画像から顔を検出する顔検出手段と、予め登録された複数種類の音を発生する発音手段と、前記発音手段が音を発生してから前記顔検出手段で顔を検出するまでの時間を測定する時間測定手段と、前記時間測定手段により測定された時間を前記音の種類に対応させて保存する保存手段と、前記保存手段に保存された時間が最小となる音の種類を判別する判別手段とを有し、前記発音手段は、本撮影時に前記判別手段が判別した種類の音を発生させることを特徴とする。
【発明の効果】
【０００７】
本発明に係る電子カメラは、撮影するペットを振り向かせるのに最適な音を発音することができる。
【図面の簡単な説明】
【０００８】
【図１】本実施形態に係る電子カメラ１０１の構成例を示す図である。
【図２】電子カメラ１０１の「ペット撮影モード」の処理を示すフローチャートである。
【図３】音選択処理を示すフローチャートである。
【図４】変形例１および変形例２に係る電子カメラ１０１ａの構成例を示す図である。
【図５】変形例１の「ペット撮影モード」の処理を示すフローチャートである。
【図６】変形例１の音選択処理を示すフローチャートである。
【図７】時間計測例を示す図である。
【図８】個体識別例を示す図である。
【発明を実施するための形態】
【０００９】
以下、本発明に係る電子カメラの実施形態について図面を用いて詳しく説明する。
【００１０】
図１は、本実施形態に係る電子カメラ１０１の構成例を示す図である。図１において、電子カメラ１０１は、レンズ１０２と、撮像部１０３と、画像バッファ１０４と、ＣＰＵ１０５と、表示部１０６と、操作部１０７と、音発生部１０８と、スピーカ１０９と、メモリ１１０と、時計部１１１と、メモリカードＩＦ（インターフェース）１１２と、共通バス１１３とで構成される。
【００１１】
レンズ１０２は、入射される被写体光を撮像部１０３の受光面に結像する。尚、図には示していないが、レンズ１０２はフォーカスレンズおよびフォーカスレンズ位置の駆動機構を有し、ＣＰＵ１０５によりフォーカスレンズ位置が制御される。
【００１２】
撮像部１０３は、例えばＣＭＯＳ型固体撮像素子で構成され、受光面に行列状に配置された画素のフォトダイオードにより受光量に応じた電気信号に変換する。そして、各画素毎に出力されるアナログの電気信号をＡ／Ｄ変換して、デジタルの画像データを出力する。尚、本実施形態に係る電子カメラ１０１では、ＣＰＵ１０５により撮像部１０３の露光時間を制御する電子シャッタ方式を用いるものとするが、メカニカルシャッタを設けてもよい。尚、ＣＰＵ１０５による自動露出（ＡＥ）制御は、撮像部１０３で撮像しているライブビュー画像から測光を行うものとするが、専用の測光部を設けてもよい。また、ＡＦ制御についても、撮像部１０３で撮像しているライブビュー画像からフォーカス制御を行うものとするが、専用のＡＦ部を設けてもよい。
【００１３】
画像バッファ１０４は、撮像部１０３から出力される画像データを一時的に記憶するためのバッファである。
【００１４】
ＣＰＵ１０５は、中央演算処理部で内部に予め記憶されたプログラムに従って動作し、操作部１０７から出力される操作情報に応じて、電子カメラ１０１の各部を制御する。
【００１５】
表示部１０６は、液晶モニタなどで構成され、ＣＰＵ１０５により、メニュー画面、メッセージ情報、ライブビュー画像、撮影画像などが表示される。
【００１６】
操作部１０７は、電源ボタン１０７ａ、レリーズボタン１０７ｂ、撮影モード選択ダイヤル１０７ｃ、メニューボタン１０７ｄ、十字キー１０７ｅなどの操作ボタンやスイッチで構成され、各操作情報はＣＰＵ１０５に出力される。
【００１７】
音発生部１０８は、共通バス１１３を介して入力する音声データをアナログの音声信号にＤ／Ａ変換し、アンプで音量を調節してスピーカ１０９を駆動する。
【００１８】
スピーカ１０９は、音発生部１０８が出力する音声信号を空気振動に変換し、音声データに応じた音を発生する。ここで、説明がわかり易いように、スピーカ１０９を別に設けたが、音発生部１０８にスピーカの機能を含めてもよい。
【００１９】
メモリ１１０は、電子カメラ１０１の動作に必要なパラメータが記憶されている。特に本実施形態に係る電子カメラ１０１では、音発生部１０８およびスピーカ１０９から発音する音声データや撮影画像から顔を検出するための顔情報などが予め記憶されている。また、スピーカ１０９で発音してから顔検出するまでの測定時間が記憶される。
【００２０】
時計部１１１は、時刻情報を出力する。そして、ＣＰＵ１０５は時計部１１１が出力する時刻情報を用いて、スピーカ１０９で発音してから顔検出するまでの時間を計測する。
【００２１】
メモリカードＩＦ１１２は、メモリカード１１２ａを接続するためのインターフェースで、メモリカード１１２ａに画像データを書き込んだり、メモリカード１１２ａに記憶されている撮影済みの画像データを読み出すことができる。
【００２２】
共通バス１１３は、各ブロック間で画像データや制御コマンドなどを入出力するためのバスである。
【００２３】
ここで、本実施形態に係る電子カメラ１０１は、撮影モード選択ダイヤル１０７ｃにより「通常撮影モード」と「ペット撮影モード」とを選択できるようになっている。「通常撮影モード」では、一般的なカメラと同じようにレリーズボタン１０７ｂを押下した時に撮像部１０３で撮影した画像をメモリカード１１２ａに記録する。「ペット撮影モード」では、撮影時にスピーカ１０９から音を発してペットや乳幼児などの気を惹くことにより、電子カメラ１０１の方に顔を向けさせて撮影することができる。
【００２４】
また、「ペット撮影モード」では、さらに「時間測定撮影モード」と「本撮影モード」とを選択する。尚、本実施形態では、撮影モード選択ダイヤル１０７ｃによって「時間測定撮影モード」と「本撮影モード」とを選択するようにしたが、専用のスイッチを設けても構わない。
【００２５】
「時間測定撮影モード」では、メモリ１１０に予め記憶された複数の異なる種類の音データを順番に読み出して音発生部１０８およびスピーカ１０９から発音し、撮像部１０３からリアルタイムで画像バッファ１０４に取り込まれるライブビュー画像の画像データからペットなどの顔を検出するまでの時間を計測し、音の種類別にメモリ１１０に保存するための撮影モードである。ここで、撮像部１０３からリアルタイムで画像バッファ１０４に取り込まれる画像データは、動画撮影やライブビュー撮影のように、例えば３０フレーム／秒で撮影される画像である。尚、計測される時間は、フレームレート単位の離散値なので、時間を計測するのではなく、発音から顔検出までのフレーム数をカウントして保存するようにしてもよい。また、ペットや乳幼児などの顔検出は、周知の技術を用いることができ、例えば顔の形状や目鼻口の配置などの特徴量により、検出可能である。ここでの説明では、一般的な顔検出で個体識別は行わない。
【００２６】
さらに、本実施形態では、「時間測定撮影モード」でレリーズボタン１０７ｂを半押し状態にする毎に、発音から顔検出までの時間を計測してメモリ１１０に保存する。そして、半押し状態のレリーズボタン１０７ｂを全押しすると、撮像部１０３で撮像した画像をメモリカード１１２ａに記録する。
【００２７】
尚、レリーズボタン１１２ｂの半押し状態と半押し解除を繰り返すことにより、静止画撮影を行うことなく、メモリ１１０に予め記憶された複数の異なる種類の音データを順番に読み出してスピーカ１０９から発音し、顔検出するまでの時間を計測してメモリ１１０に保存することができる。この場合、ＣＰＵ１０５は、レリーズボタン１１２ｂの半押し状態と半押し解除を繰り返す毎に、メモリ１１０に記憶された複数の異なる種類の音データを順番に読み出すように制御する。これにより、様々な種類の音を発音することができ、音の種類別に顔検出するまでの時間を計測できる。
【００２８】
［ＣＰＵ１０５の処理］
次に、ＣＰＵ１０５の処理について詳しく説明する。ＣＰＵ１０５は、先に説明したように、操作部１０７から出力される操作情報に応じて、電子カメラ１０１の各部を制御する。特に本実施形態では、「ペット撮影モード」に関係するＣＰＵ１０５の処理として、発音処理２０１と、顔検出処理２０２と、時間測定処理２０３と、時間保存処理２０４と、音判別処理２０５と、撮影処理２０６と、記録処理２０７とを有する。
【００２９】
発音処理２０１では、メモリ１１０に予め記憶された音データを読み出して音発生部１０８に設定し、スピーカ１０９から発音する処理を行う。
【００３０】
顔検出処理２０２では、撮像部１０３で撮像され画像バッファ１０４にリアルタイムで取り込まれる画像からペットなどの顔を検出する処理を行う。尚、顔検出処理は、顔の特徴量（顔の輪郭形状、目や鼻や口の配置や形状など）によってパターンマッチングを行うなどの周知技術を用いて検出する。
【００３１】
時間測定処理２０３では、時計部１１１が出力する時刻情報により、スピーカ１０９で発音してから顔検出するまでの時間を計測する。
【００３２】
時間保存処理２０４では、発音処理２０１によりスピーカ１０９から発音した音の種類別に時間測定処理２０３で計測した時間をメモリ１１０に保存する。
【００３３】
音判別処理２０５では、時間保存処理２０４でメモリ１１０に保存した音の種類の中で計測時間が最小の音を判別する処理を行う。尚、同じ種類の音に対して複数回の計測時間が保存されている場合は、平均値を求めて、他の種類の音の平均時間と比較する。また、平均時間を求める時に、特異点を排除するために最大値と最小値の計測時間を除いて平均値を求めるようにしてもよい。或いは、発音してから所定時間が経過しても顔検出できなかった場合は、他の測定時間よりも十分に大きな時間を計測時間として保存するようにしてもよい。
【００３４】
撮影処理２０６では、「時間測定撮影モード」においては、スピーカ１０９で発音してから顔検出するまでの時間を計測するために、動画撮影やライブビュー撮影と同じようにリアルタイムで画像を撮影する処理を行い、顔検出処理２０２で顔検出するまで撮影処理を行う。そして、レリーズボタン１０７ｂが全押しされた時に静止画撮影を行う。また、「本撮影モード」においては、音判別処理２０５で判別された種類の音をレリーズボタン１０７ｂの半押し状態でスピーカ１０９から発音し、ペットが振り向いたことを表示部１０６で撮影者が確認してからレリーズボタン１０７ｂを全押しし、静止画撮影を行う。
【００３５】
記録処理２０７では、撮影処理２０６で撮影された静止画をメモリカード１１２ａに保存する処理を行う。或いは、ペットがカメラの方を振り向いて、顔検出処理２０２で顔検出したタイミングで、自動的に静止画撮影を行うようにしてもよい。
【００３６】
このように、本実施形態に係る電子カメラ１０１は、撮影時にスピーカ１０９から音を発してペットや乳幼児などの気を惹くことにより、電子カメラ１０１の方に顔を向けさせて撮影することができる。特に「時間測定撮影モード」においては、スピーカ１０９で発音してから顔検出するまでの時間が最小の音を判別して、「本撮影モード」で静止画撮影する時にスピーカ１０９から発音するので、高い確率で電子カメラ１０１の方に顔を向けさせることができる。
【００３７】
［ペット撮影モード］
次に、本実施形態に係る電子カメラ１０１の「ペット撮影モード」における動作について、図２のフローチャートを用いて説明する。尚、図２のフローチャートは、撮影者の操作に応じてＣＰＵ１０５の内部に予め記憶されたプログラムによって実行される処理で、操作部１０７の撮影モード選択ダイヤル１０７ｃで「ペット撮影モード」を選択した時の処理の流れを示している。
【００３８】
尚、本実施形態に係る電子カメラ１０１は、撮影モード選択ダイヤル１０７ｃにより、通常のカメラと同様に「風景撮影モード」、「ポートレート撮影モード」、「スポーツ撮影モード」、「夜景撮影モード」などの撮影モードとは別に、「ペット撮影モード」が設けられている。
【００３９】
また、「ペット撮影モード」の中で、更に「時間測定撮影モード」と「本撮影モード」とを選択する。「ペット撮影モード」では、レリーズボタン１０７ｂが半押しされると選択された音がスピーカ１０９から発音され、レリーズボタン１０７ｂを全押しされると静止画撮影を行うことができるが、スピーカ１０９から発音される音が時間計測のための音であるか、ペットを振り向かせるために判別した最適な音であるかが異なる。以下に「時間測定撮影モード」と「本撮影モード」の動作の違いを説明する。
【００４０】
「時間測定撮影モード」では、レリーズボタン１０７ｂが半押しされる毎に様々な種類の音を順番に発音し、各音の種類別にペットが電子カメラ１０１の方に顔を向けるまでの時間を計測して保存する処理が行われる。尚、「時間測定撮影モード」でもレリーズボタン１０７ｂを全押しすることにより静止画の撮影を行うことができる。
【００４１】
「本撮影モード」では、レリーズボタン１０７ｂが半押しされると「時間測定撮影モード」で保存した音の種類別の計測時間の中で最小の計測時間であった種類の音を発音し、レリーズボタン１０７ｂが全押しされると静止画の撮影を行う。
【００４２】
以下、「ペット撮影モード」における処理を図３のフローチャートに従って説明する。尚、電子カメラ１０１の電源ボタン１０７ａが押下されて電源が投入され、さらに撮影モード選択ダイヤル１０７ｃで「ペット撮影モード」が選択されて表示部１０６には撮像部１０３で撮像されるライブビュー画像が動画表示された状態にある。また、「ペット撮影モード」が選択されると、先ず「時間測定撮影モード」が自動的に選択されるものとするが、撮影するペットに対して過去に「時間測定撮影モード」が実行されている場合は撮影者がマニュアルで「本撮影モード」を選択しても構わない。
【００４３】
（ステップＳ１０１）ＣＰＵ１０５は、操作部１０７のレリーズボタン１０７ｂが半押しされたか否かを判別する。そして、レリーズボタン１０７ｂが半押しされるまで待機し、半押しされた場合はステップＳ１０２に進む。
【００４４】
（ステップＳ１０２）ＣＰＵ１０５は、レリーズボタン１０７ｂが半押しされると、一般的な電子カメラと同様に、撮像部１０３で撮像されるライブビュー画像に基づいてＡＥ制御と、ＡＦ制御とを行う。
【００４５】
（ステップＳ１０３）ＣＰＵ１０５は、メモリ１１０から読み出す音データの種類を選択する処理（音選択処理）を行う。音選択処理は、サブルーチン化されており、ＣＰＵ１０５は、スピーカ１０９から発音する音を選択してメモリ１１０から音データを読み出し、次のステップＳ１０４の処理を実行する。尚、音選択処理については後で詳しく説明する。
【００４６】
（ステップＳ１０４）ＣＰＵ１０５は、音選択処理でメモリ１１０から読み出された音データを音発生部１０８に出力し、音発生部１０８で音声信号に変換してスピーカ１０９から発音する（発音処理２０１）。
【００４７】
（ステップＳ１０５）ＣＰＵ１０５は、時計部１１１から発音した時刻を取得し、時間計測を開始する（時間測定処理２０３）。
【００４８】
（ステップＳ１０６）ＣＰＵ１０５は、撮像部１０３が撮像するライブビュー画像に対して、ペットの顔があるか否かを検出する処理を行う（顔検出処理２０２）。ペットの顔が未検出の場合はステップＳ１０７に進み、ペットの顔が検出された場合はステップＳ１１１に進む。ここでの顔検出は、予め決められた一般的なペットの特徴量に基づいて行われ、個体識別は行わない。
【００４９】
（ステップＳ１０７）ＣＰＵ１０５は、予め設定した所定時間が経過したか否かを判別する。例えば所定時間が１分間に設定されている場合は、発音してから１分間が経過した時にステップＳ１１５に進み、１分間が経過するまではステップＳ１０８に進む。
【００５０】
（ステップＳ１０８）ＣＰＵ１０５は、ステップＳ１０６と同じ処理を行い、ペットの顔が未検出の場合はステップＳ１１１に進み、ペットの顔が検出された場合はステップＳ１０９に進む。
【００５１】
（ステップＳ１０９）ＣＰＵ１０５は、時間計測を終了する。例えば発音してから３秒後にペットの顔を検出した場合は計測時間は３秒となる。尚、ここでは処理遅延などを無視するが、実際には顔検出の処理時間や、ライブビュー画像のフレーム間隔などにより、実際にスピーカ１０９から発音してペットが電子カメラ１０１の方を向くまでの時間とは少し異なるが、音の種類毎の計測時間に同様に誤差が含まれるので、後に説明する相対的な計測時間の比較には影響しない。
【００５２】
（ステップＳ１１０）ＣＰＵ１０５は、計測した時間を発音した音の種類に対応させてメモリ１１０に保存する（時間保存処理２０４）。
【００５３】
（ステップＳ１１１）ＣＰＵ１０５は、操作部１０７のレリーズボタン１０７ｂが半押し状態にあるか否かを判別する。半押し状態が維持されている場合はステップＳ１１２に進み、半押し状態が解除された場合は処理を終了する。尚、処理を終了した場合も「ペット撮影モード」にあり、ステップＳ１０１の処理が再び実行される。
【００５４】
（ステップＳ１１２）ＣＰＵ１０５は、操作部１０７のレリーズボタン１０７ｂが全押しされたか否かを判別する。全押しされた場合はステップＳ１１３に進み、全押しされていない場合はステップＳ１０６に戻る。
【００５５】
（ステップＳ１１３）ＣＰＵ１０５は、静止画の撮影を行う。具体的には、ＣＰＵ１０５は、撮像部１０３で静止画を撮影して画像バッファ１０４に取り込む。尚、撮像部１０３は、レリーズボタン１０７ｂが全押しされるまでライブビュー画像を撮影しているので、ライブビュー画像の解像度（例えば３２０×２４０画素）から静止画の解像度（１２８０×９６０画素）に切り替えて撮像し、撮像部１０３から画像データを読み出して画像バッファ１０４に取り込む。
【００５６】
（ステップＳ１１４）ＣＰＵ１０５は、画像バッファ１０４に取り込まれた静止画に対して色補間処理やガンマ補正処理あるいはＪＰＥＧ規格による画像圧縮処理などを施し、メモリカードＩＦ１１２に装着されているメモリカード１１２ａに記憶する。
【００５７】
（ステップＳ１１５）ステップＳ１０７でタイムアウトした場合、ＣＰＵ１０５は、計測時間を予め設定した所定値とする。ここで、所定値は、実際に計測されない時間（例えばタイムアウト時間が１分の場合は２分など）に設定する。これにより、後に説明する平均時間で比較して最適な音を判別する際に、タイムアウトした種類の音の適性度を低くすることができる。
【００５８】
（ステップＳ１１６）ＣＰＵ１０５は、ステップＳ１１０と同様に、計測した時間を発音した音の種類に対応させてメモリ１１０に保存する（時間保存処理２０４）。
【００５９】
（ステップＳ１１７）ＣＰＵ１０５は、顔検出できなかったことを示す情報を表示部１０６に表示して撮影者に知らせる。例えばライブビュー画像を表示している表示部１０６に「顔検出できませんでした」というメッセージをオーバーレイ表示することにより、撮影者にレリーズボタン１０７ｂの半押しを一旦解除することを促すことができる。
【００６０】
尚、ステップＳ１０７、ステップＳ１１５からステップＳ１１７までの処理は無くても構わない。この場合、ステップＳ１０６とステップＳ１０８の間でループが形成されるが、実際には撮影者が永久に半押し状態を続けることはなく、ある程度の時間が経過すれば、撮影者はレリーズボタン１０７ｂの半押しから全押しに移行するか、半押しを解除すると考えられるからである。但し、ステップＳ１０７、ステップＳ１１５からステップＳ１１７までの処理が無い場合は、顔検出できなかったことが計測時間に反映されないので、音の種類別の計測時間の比較を公正に行えないという問題が生じる。例えば３回中で１回しか検出できなかった音Ａの計測時間が２秒で、３回中で３回検出できた音Ｂの計測時間の平均が３秒であった場合、音Ｂの方が確実にペットを振り向かせることができるにも拘わらず、音Ａが最適な音として判別されることになる。これに対して、ステップＳ１０７、ステップＳ１１５からステップＳ１１７までの処理を実行することにより、上記の例では音Ａの平均時間は、２秒と、１２０秒と、１２０秒とを平均した約８２秒となり、音Ａは選択されず、確実にペットを振り向かせることができる音Ｂを最適な音として判別することができる。
【００６１】
次に、ステップＳ１０３の音選択処理について図３のフローチャートを用いて詳しく説明する。図３のフローチャートは、スピーカ１０９から発音する音の種類を選択する処理を示している。尚、図３の例では、メモリ１１０に予め記憶されている音の種類は、音Ａ、音Ｂおよび音Ｃの三種類である。そして、「時間測定撮影モード」で最初に選択される音は、音Ａに設定されている。
【００６２】
（ステップＳ２０１）ＣＰＵ１０５は、撮影モード選択ダイヤル１０７ｃで「時間測定撮影モード」が選択されているか、「本撮影モード」が選択されているかを判別する。「時間測定撮影モード」が選択されている場合はステップＳ２０２に進み、「本撮影モード」が選択されている場合はステップＳ２０６に進む。
【００６３】
（ステップＳ２０２）ＣＰＵ１０５は、前回、レリーズボタン１０７ｂが押下された時にスピーカ１０９から発音した音が音Ａ、音Ｂおよび音Ｃのいずれであるかを判別する。前回が音Ａである場合はステップＳ２０３、音Ｂである場合はステップＳ２０４、音Ｃである場合はステップＳ２０５にそれぞれ進む。これは、音Ａから音Ｃまでの全ての種類の音を順番に発音して、全ての種類の音に対してペットが電子カメラ１０１の方を振り向くまでの時間を計測するために行われる処理である。
【００６４】
（ステップＳ２０３）ＣＰＵ１０５は、メモリ１１０から音Ｂの音データを読み出して、音発生部１０８で発音できるように設定し、音選択処理を終了する。
【００６５】
（ステップＳ２０４）ＣＰＵ１０５は、メモリ１１０から音Ｃの音データを読み出して、音発生部１０８で発音できるように設定し、音選択処理を終了する。
【００６６】
（ステップＳ２０５）ＣＰＵ１０５は、メモリ１１０から音Ａの音データを読み出して、音発生部１０８で発音できるように設定し、音選択処理を終了する。
【００６７】
（ステップＳ２０６）ＣＰＵ１０５は、「時間測定撮影モード」で音Ａ、音Ｂおよび音Ｃのそれぞれに対応させてメモリ１１０に保存された計測時間を読み出す。
【００６８】
（ステップＳ２０７）ＣＰＵ１０５は、音Ａ、音Ｂおよび音Ｃの各音の種類別に計測時間の平均時間を算出する。
【００６９】
（ステップＳ２０８）ＣＰＵ１０５は、音Ａ、音Ｂおよび音Ｃの平均時間が最小の音を判別する。平均時間が最小の音が音Ａである場合はステップＳ２０９、音Ｂである場合はステップＳ２１０、音Ｃである場合はステップＳ２１１にそれぞれ進む。
【００７０】
（ステップＳ２０９）ＣＰＵ１０５は、メモリ１１０から音Ａの音データを読み出して、音発生部１０８で発音できるように設定し、音選択処理を終了する。
【００７１】
（ステップＳ２１０）ＣＰＵ１０５は、メモリ１１０から音Ｂの音データを読み出して、音発生部１０８で発音できるように設定し、音選択処理を終了する。
【００７２】
（ステップＳ２１１）ＣＰＵ１０５は、メモリ１１０から音Ｃの音データを読み出して、音発生部１０８で発音できるように設定し、音選択処理を終了する。
【００７３】
このようにして、「時間測定撮影モード」の場合はメモリ１１０に予め記憶されている全ての種類の音を順番に選択し、「本撮影モード」の場合は「時間測定撮影モード」で計測した発音から顔検出までの時間が最小となる音を選択することができる。
【００７４】
以上、説明したように、本実施形態に係る電子カメラ１０１は、レリーズボタン１０７ｂを半押しする毎に、予めメモリ１１０に登録された複数種類の音を順番に発生して、ペットの顔を検出するまでの時間を計測し、計測時間（または平均時間）が最小となる音の種類を判別することができる。そして、本撮影時に計測時間が最小となる音を発音するので、ペットの顔を電子カメラ１０１の方に容易に向けさせて撮影することができる。
【００７５】
（変形例１）
次に、上記の実施形態に係る電子カメラ１０１の変形例１について説明する。上記の説明ではペットの種類については特に言及しなかったが、例えばペットとして複数の犬や猫を飼っている場合、ペットによってカメラの方を振り向かせるのに最適な音が異なることが考えられる。そこで、本変形例１に係る電子カメラ１０１ａでは、ペットの個体別に最適な音を判別して設定することができる。例えば犬Ｘの場合は音Ａ、猫Ｙの場合は音Ｂ、犬Ｚの場合は音Ｃのように最適な音を個体別に設定する。
【００７６】
図４は、本実施形態に係る電子カメラ１０１ａの構成例を示す図である。尚、図４において図１と同符号のブロックは同じ機能のブロックなので重複する説明は省略する。本変形例１では、個体識別のためにペットの声を識別する場合について説明するが、ペットの横顔や体型あるいは体の模様などにより個体識別を行うようにしても構わない。
【００７７】
図４の電子カメラ１０１ａでは、ペットの声を識別するために、図１の電子カメラ１０１に対して音入力部１１４とマイク１１５とが追加されている。また、ＣＰＵ１０５の処理として声や横顔などの個体情報を取得してメモリ１１０に予め登録する処理を行う個体情報登録処理２０８と、メモリ１１０に登録された個体情報により個体識別を行う個体識別処理２０９とが追加されている。
【００７８】
ここで、ＣＰＵ１０５の個体情報登録処理２０８は、例えば操作部１０７のメニューボタン１０７ｄで個体情報登録メニューを選択することにより、個体情報の登録処理が開始される。本実施形態では個体情報としてペットの声を利用するので、マイク１１５から入力する音声信号を音入力部１１４で音データにＡ／Ｄ変換してメモリ１１０に登録する。この時、例えば登録処理が開始されてから入力する音データの大まかな周波数スペクトルや変化の特徴などが予め設定された範囲にあるものを自動的に判別し、その特徴量（個体識別可能な詳細な周波数スペクトルや変化の特徴）を個体情報としてメモリ１１０に登録するようにしてもよいし、音声波形などを表示部１０６に表示して撮影者が指定するようにしてもよい。
【００７９】
次に、図４の電子カメラ１０１ａにおける「ペット撮影モード」の処理について図５のフローチャートを用いて説明する。尚、図２のフローチャートと同符号の処理ステップは同じ処理を示すので重複する説明は省略する。また、電子カメラ１０１の電源ボタン１０７ａが押下されて電源が投入され、さらに撮影モード選択ダイヤル１０７ｃで「ペット撮影モード」が選択されて表示部１０６には撮像部１０３で撮像されるライブビュー画像が動画表示された状態にある。
【００８０】
図５では、図２で説明したステップＳ１０１の処理でレリーズボタン１０７ｂが半押しされるまで待機している間に以下の個体識別処理３００を実行する。
【００８１】
尚、先に説明したように、個体情報登録処理２０８により、事前に個体情報がメモリ１１０に登録されているものとする。
【００８２】
（ステップＳ３０１）ＣＰＵ１０５は、マイク１１５から入力する音声信号を音入力部１１４で音データに変換する。
【００８３】
（ステップＳ３０２）ＣＰＵ１０５は、入力した音データが一般的なペット（犬や猫）の声の特徴（大まかな周波数スペクトルや音の変化など）に類似するか否かを判別する。そして、ペットの声であると判断した場合はステップＳ３０３に進み、ペットの声ではない場合はステップＳ１０１に進んでレリーズボタン１０７ｂが半押しになるまで待機する処理を継続する。尚、本処理ステップでは個体識別は行わない。
【００８４】
（ステップＳ３０３）ＣＰＵ１０５は、ステップＳ３０１でマイク１１５から入力した音データと、事前にメモリ１１０に登録された個体別のペットの声データとを比較して、ペットの個体識別を行う。尚、ここでは、音声入力したペットの声は必ず予め登録した個体のいずれかに識別されるものとするが、実際には識別できない場合も考えられるので、この場合は個体識別できなかったものとしてステップＳ１０１に進ようにしてもよい。
【００８５】
このようにして、個体識別処理３００により、電子カメラ１０１ａで撮影するペットの個体識別を行うことができる。尚、レリーズボタン１０７ｂの半押し待ちの間に複数の個体が識別される場合が考えられるが、この場合は例えば半押しタイミングに一番近い最新の識別個体のみを選択する。
【００８６】
そして、ステップＳ１０１でレリーズボタン１０７ｂの半押しが検出されると次のステップＳ１０２に進み、音選択処理Ｓ１０３ａを実行する。尚、音選択処理Ｓ１０３ａは、図２で説明した音選択処理Ｓ１０３と同様に、スピーカ１０９から発音する音を選択する処理を行うが、本変形例ではステップＳ３００で識別した個体別に音を選択する。尚、音選択処理Ｓ１０３ａについては、後で詳しく説明する。
【００８７】
次のステップＳ１０４からステップＳ１０９までの処理は図２の場合と同じである。そして、ステップＳ１０９で時間計測を終了すると、次のステップＳ１１０ａを実行する。
【００８８】
（ステップＳ１１０ａ）ＣＰＵ１０５は、計測した時間を発音した音の種類に対応させてステップＳ３００で識別した個体別にメモリ１１０に保存する（時間保存処理２０４ａ）。
【００８９】
次のステップＳ１１１からステップＳ１１５までの処理は図２の場合と同じである。そして、次のステップＳ１１６ａの処理を実行する。
【００９０】
（ステップＳ１１６ａ）ＣＰＵ１０５は、ステップＳ１１０ａと同様に、計測した時間を発音した音の種類に対応させて個体別にメモリ１１０に保存する（時間保存処理２０４ａ）。
【００９１】
尚、上記以外の処理については、図２と同じである。
【００９２】
次に、ステップＳ１０３ａの音選択処理について図６のフローチャートを用いて詳しく説明する。図６のフローチャートは、図３と同様に、スピーカ１０９から発音する音の種類を選択する処理を示している。尚、図３と同符号の処理ステップは同じ処理を示すので重複する説明は省略する。
【００９３】
次のステップＳ２０１からステップＳ２０５までの処理は図３の場合と同じである。そして、「本撮影モード」が選択された場合はステップＳ２０１の次にステップＳ２０６ａを実行する。
【００９４】
（ステップＳ２０６ａ）ＣＰＵ１０５は、「時間測定撮影モード」で音Ａ、音Ｂおよび音Ｃのそれぞれに対応させて個体別にメモリ１１０に保存された計測時間を読み出す。この時、図５のフローチャートのステップＳ３００で識別した個体に対応する音Ａ、音Ｂおよび音Ｃの計測時間をメモリ１１０から読み出す。
【００９５】
次のステップＳ２０７からステップＳ２１１までの処理は図３の場合と同じである。
【００９６】
例えばメモリ１１０には、各個体別に、音の種類に対応させて発音から顔検出までの計測時間が保存されている。図７は、ペットＸに対して、複数種類の音（音Ａ，音Ｂおよび音Ｃ）別に発音してから顔検出するまでの時間を計測してメモリ１１０に保存された例を示している。図７において、各音は１０回ずつ計測され、その平均時間は、音Ａでは、二回目が０．５秒、三回目が０．８秒、・・・、１０回目が０．７秒であるが、一回目が検出できなかったので６０秒と記録され、平均時間は約６．７秒である。同様に、音Ｂの平均時間は約０．２秒、音Ｃの平均時間は約０．５秒である。図７の例では、ペットＸを電子カメラ１０１の方に振り向かせるのに最適な音は音Ｂであると判定される。尚、ペットＹおよびペットＺについても同様に平均時間が求められ、例えばペットＹに最適な音は音Ｂ、ペットＺに最適な音は音Ｃのように判定される。
【００９７】
このようにして、「時間測定撮影モード」の場合はメモリ１１０に予め記憶されている全ての種類の音を順番に選択し、「本撮影モード」の場合は「時間測定撮影モード」で計測した発音から顔検出までの時間または平均時間が最小となる音を個体別に選択することができる。
【００９８】
以上、説明したように、本実施形態に係る電子カメラ１０１は、撮影前に個体識別を行って、レリーズボタン１０７ｂを半押しする毎に、予めメモリ１１０に登録された複数種類の音を順番に発生して、ペットの顔を検出するまでの時間を計測し、計測時間（または平均時間）が最小となる音の種類を個体別に判別することができる。そして、本撮影時に個体別に計測時間が最小となる音を発音して撮影することができるので、予め登録された複数のペットに対応して、撮影時にペットの顔を電子カメラ１０１の方に容易に向けさせることができる。
【００９９】
尚、上記の変形例１では、ステップＳ３００の個体識別処理でペットの声を識別するようにしたが、ペットの横顔や体型あるいは体の模様などにより個体識別を行うようにしても構わない。この場合、ＣＰＵ１０５の個体情報登録処理２０８では、操作部１０７のメニューボタン１０７ｄで個体情報登録メニューが選択されると、撮像部１０３で撮像して画像バッファ１０４に取り込まれた画像から特徴量（ペットの横顔や体型あるいは体の模様など）や画像自体を個体情報としてメモリ１１０に登録する。
【０１００】
図８は、ＣＰＵ１０５の個体情報登録処理２０８でメモリ１１０に登録される個体別の画像例を示す図である。図８において、画像４０１はペットＸの横顔および体型あるいは体の模様などの個体情報を取得するために撮像部１０３で撮像された画像例である。同様に、画像４０２はペットＹ、画像４０３はペットＺのそれぞれの横顔および体型あるいは体の模様などの個体情報を取得するために撮像部１０３で撮像された画像例である。
【０１０１】
このようにして、事前にメモリ１１０に登録された個体情報を用いて、次のようにステップＳ３００ａの個体識別処理が実行される。
【０１０２】
（ステップＳ３０１ａ）ＣＰＵ１０５は、撮像部１０３が撮像するライブビュー画像を画像バッファ１０４に取り込む。
【０１０３】
（ステップＳ３０２ａ）ＣＰＵ１０５は、画像バッファ１０４に取り込まれた画像にペットが撮影されているか否かを被写体の輪郭などから大まかに判別する。そして、ペットの画像であると判断した場合はステップＳ３０３に進み、ペットの画像ではない場合はステップＳ１０１に進んでレリーズボタン１０７ｂが半押しになるまで待機する処理を継続する。尚、ここでは、ペットの個体識別は行わない。
【０１０４】
（ステップＳ３０３ａ）ＣＰＵ１０５は、画像バッファ１０４に取り込まれた画像がメモリ１１０に事前に登録された個体情報のペットの画像に類似しているか否かを判別する。そして、最も類似している画像に対応する個体であると判断する。尚、ここでは、ステップＳ３０２ａで検出した画像は必ず予め登録した個体のいずれかに識別されるものとするが、識別できなかった場合は個体識別できなかったものとしてステップＳ１０１に進んでもよい。
【０１０５】
このようにして、個体識別処理３００ａにより、電子カメラ１０１ａで撮影するペットの個体識別を行うことができる。尚、ステップＳ３００ａの個体識別処理以外の処理は、図５および図６と同じなので重複する説明は省略する。
【０１０６】
このようにして、個体別に最適な音の種類を判別することができるので、本撮影時に個体別に最適な音をスピーカ１０９から発音することにより、撮影者はペットの顔が電子カメラ１０１の方を向いた時の画像を簡単に撮影することができる。例えば、先に説明した図８の例では、ステップＳ３００ａの個体識別処理で画像４０１によりペットＸと識別された場合、ペットＸに最適な音（例えば音Ａ）をスピーカ１０９から発音してペットＸが電子カメラ１０１の方を向いた時の画像４０４を撮影することができる。同様に、ペットＹの場合は例えば音Ｂをスピーカ１０９から発音してペットＹが電子カメラ１０１の方を向いた時の画像４０５を撮影することができ、ペットＺの場合は例えば音Ｃをスピーカ１０９から発音してペットＺが電子カメラ１０１の方を向いた時の画像４０６を撮影することができる。
【０１０７】
（変形例２）
次に、上記の実施形態に係る電子カメラ１０１の変形例２について説明する。上記の説明では音発生部１０８から発生する音は、予めメモリ１１０に記憶された複数の音の種類しか発生させることができなかったが、ペットの種類や他の動物或いは乳幼児など被写体に応じて発声させる音を追加したい場合がある。本変形例２では、撮影者が任意の音を後で追加できるようになっている。尚、先に説明した電子カメラ１０１ａと同様の構成で、マイク１１５と音入力部１１４とを備えている。そして、ＣＰＵ１０５の処理として、図４に示したように、音登録処理２１０を実行する。
【０１０８】
音登録処理２１０は、変形例１の個体情報登録処理２０８と同様に、例えば操作部１０７のメニューボタン１０７ｄで音登録メニューを選択することにより、音を登録するための処理を開始する。そして、マイク１１５から入力する音声信号を音入力部１１４で音データにＡ／Ｄ変換し、音発生部１０８で発音する新たな音データとしてメモリ１１０に登録する。
【０１０９】
このようにして、撮影者が任意の音を追加することができる。尚、追加された音が例えば音Ｄである場合は、図３および図６の音選択処理において、ステップＳ２０２で前回の音が音Ｃの場合は次の音として音Ｄを設定する。そして、ステップＳ２０８では音Ｄの計測時間を含めて平均時間が最小の音を判別し、音Ｄの平均時間が最小の場合は音Ｄを設定する。これにより、新たに追加した音Ｄを本撮影時に発音することができる。
【０１１０】
以上、各実施形態で説明してきたように、本発明に係る電子カメラ１０１は、ペットを撮影する際に、電子カメラ１０１から音を発音し、発音からペットの顔検出までの時間を測定する。特に撮影する毎に、複数の音のいずれかの音を順番に発音し、検出時間を音の種類別に保存して平均時間を求め、平均時間が最も短かった音を、そのペットに対して最適な音と判断する。また、ペットを繰り返し撮影して多数の計測時間が蓄積されることによって、最適な音を判別するときの平均時間の信頼性が向上し、そのペットにとって最適な音を決定することができる。これにより、ペットを確実にカメラの方に向けさせて撮影することができる。
【０１１１】
また、個体識別をすることにより、複数種類のペットや乳幼児などを撮影対象とした場合でも、撮影する個体に応じて最適な音を自動的に選択して発音するので、撮影しようとするペットや乳幼児などを確実にカメラの方に向けさせて撮影することができる。
【０１１２】
さらに、発音する音の種類を任意に追加できるので、ペットや乳幼児などが好む音が電子カメラ１０１に登録されていない場合でも対応することができ、最適な音を選択して確実にカメラの方に向けさせて撮影することができる。
【０１１３】
以上、本発明に係る電子カメラについて、各実施形態で例を挙げて説明してきたが、その精神またはその主要な特徴から逸脱することなく他の多様な形で実施することができる。そのため、上述した実施形態はあらゆる点で単なる例示に過ぎず、限定的に解釈してはならない。本発明は、特許請求の範囲によって示されるものであって、本発明は明細書本文にはなんら拘束されない。さらに、特許請求の範囲の均等範囲に属する変形や変更は、全て本発明の範囲内である。
【符号の説明】
【０１１４】
１０１、１０１ａ・・・電子カメラ；１０２・・・レンズ；１０３・・・撮像部；１０４・・・画像バッファ；１０５、１０５ａ・・・ＣＰＵ；１０６・・・表示部；１０７・・・操作部；１０８・・・音発生部；１０９・・・スピーカ；１１０・・・メモリ；１１１・・・時計部；１１２・・・メモリカードＩＦ；１１３・・・共通バス；１１４・・・音入力部１１４；１１５・・・マイク；１１２ａ・・・メモリカード；２０１・・・発音処理；２０２・・・顔検出処理；２０３・・・時間測定処理；２０４、２０４ａ・・・時間保存処理；２０５・・・音判別処理；２０６・・・撮影処理；２０７・・・記録処理；２０８・・・個体情報登録処理；２０９・・・個体識別処理；２１０・・・音登録処理

【特許請求の範囲】
【請求項１】
被写体画像を撮像する撮像手段と、
前記撮像手段に撮像指示を与える操作手段と、
前記撮像手段が撮像する画像から顔を検出する顔検出手段と、
予め登録された複数種類の音を発生する発音手段と、
前記発音手段が音を発生してから前記顔検出手段で顔を検出するまでの時間を測定する時間測定手段と、
前記時間測定手段により測定された時間を前記音の種類に対応させて保存する保存手段と、
前記保存手段に保存された時間が最小となる音の種類を判別する判別手段と
を有し、
前記発音手段は、本撮影時に前記判別手段が判別した種類の音を発生させる
ことを特徴とする電子カメラ。
【請求項２】
請求項１に記載の電子カメラにおいて、
前記操作手段は、時間測定撮影モードまたは本撮影モードの選択手段を有し、
前記発音手段は、前記本撮影モードが選択されている場合には、前記判別手段が判別した種類の音を発生させ、前記時間撮影モードが選択されている場合には、前記複数種類の音を順番に発生させる
ことを特徴とする電子カメラ。
【請求項３】
請求項１または２に記載の電子カメラにおいて、
前記判別手段は、前記保存手段に保存された時間の平均時間を音の種類毎に求め、前記平均時間が最小となる音を判別する
ことを特徴とする電子カメラ。
【請求項４】
請求項３に記載の電子カメラにおいて、
前記時間測定手段は、予め設定した時間内に前記顔検出手段で顔を検出できなかった場合、他の測定時間よりも十分に大きな値を測定時間として前記保存手段に保存する
ことを特徴とする電子カメラ。
【請求項５】
請求項１から４のいずれか一項に記載の電子カメラにおいて、
撮影時に予め登録された複数の個体のいずれであるかを識別する個体識別手段を更に設け、
前記保存手段は、前記個体識別手段が識別した前記個体別に前記時間測定手段により測定された時間を前記音の種類に対応させて保存し、
前記判別手段は、前記保存手段に保存された時間が最小となる音の種類を前記個体別に判別する
ことを特徴とする電子カメラ。
【請求項６】
請求項５に記載の電子カメラにおいて、
前記個体識別手段は、撮影しようとする個体の声の特徴により個体識別を行うことを特徴とする電子カメラ。
【請求項７】
請求項５に記載の電子カメラにおいて、
前記個体識別手段は、撮影しようとする個体画像の特徴により個体識別を行うことを特徴とする電子カメラ。
【請求項８】
請求項１から７のいずれか一項に記載の電子カメラにおいて、
音を入力する音入力手段と、
前記音入力手段から入力する音を前記発音手段が発生する音の種類に追加する音登録手段と
を更に設けたことを特徴とする電子カメラ。
【請求項９】
請求項１から８のいずれか一項に記載の電子カメラにおいて、
前記操作手段は、撮影準備を指示する半押し状態と、画像を撮影して記憶媒体に保存する指示を行う全押し状態の二段階のレリーズボタンを有し、
前記レリーズボタンが半押しされる毎に、前記発音手段は前記複数種類の音を順番に発生させ、前記時間測定手段は前記発音手段が音を発生してから前記顔検出部が顔を検出するまでの時間を測定して前記保存手段に保存し、前記レリーズボタンが全押しされた場合は、前記撮像手段により撮像された画像を前記記憶媒体に保存する
ことを特徴とする電子カメラ。

【図１】