説明

録音装置

【課題】録音装置における、使用者の使用勝手の向上。
【解決手段】 本発明の録音装置は、被写体の光学像を撮像し画像信号として出力する撮像手段と、画像信号に基づいてシーンを判別するシーン判別手段と、音声を集音し録音する録音手段と、シーン判別手段によって判別されたシーンに基づいて、録音するための録音条件を設定する設定手段とを備えることを特徴とする。
この録音装置のある局面によれば、画像信号に基づいて推奨する録音シーンを判別し、該録音シーンに基づいて録音条件を設定するため、使用者は録音シーンを意識して録音条件を自ら設定する必要がないため、より簡単に好適な録音条件を設定することが出来る。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、録音装置に関し、特に撮像機能を有し撮像された画像信号に基づいて好適な録音を行う録音装置に関する。
【背景技術】
【0002】
従来、予め複数の動画シーンに対応した録音設定情報を記録しておき、音声付の動画撮影に際して使用者に所望するいずれかの録画シーンを指定させ、録画シーンに対応する録音設定情報に基づき、撮影時の録音を制御する技術が開示されている。
【特許文献1】特開2006−217111号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
従来の技術では、使用者が所望する録画シーンを設定することによって適切な録音設定情報に基づき録音を制御することが出来る。言い換えれば、録画シーンを設定しない限り、録音を適切に制御することが出来ない。従って、従来の技術では、録画を目的とせず適切な録音を目的とした場合においても、所望の録音設定情報に対応する録画シーンを選択しなければならず、使用者にとってわずらわしいものであった。
【0004】
本発明は上記の問題を解決するもので、この発明の目的の一つは、好適な録音設定をより簡単に行うことが出来る録音装置を提供するものである。
【課題を解決するための手段】
【0005】
本発明の録音装置は、被写体の光学像を撮像し画像信号として出力する撮像手段と、画像信号に基づいてシーンを判別するシーン判別手段と、音声を集音し録音する録音手段と、シーン判別手段によって判別されたシーンに基づいて、録音するための録音条件を設定する設定手段とを備えることを特徴とする。
【0006】
この録音装置のある局面によれば、画像信号に基づいて推奨する録音シーンを判別し、該録音シーンに基づいて録音条件を設定するため、使用者は録音シーンを意識して録音条件を自ら設定する必要がないため、より簡単に好適な録音条件を設定することが出来る。
【0007】
好ましくは、録音手段を制御して設定手段によって設定された録音条件で録音する録音制御手段と、設定手段によって設定された録音条件を変更する変更手段を更に備える。
【0008】
この局面によれば、画像信号に基づいて設定された録音条件に対して変更することが出来るため、使用者が所望する録音条件により近づく。
【0009】
好ましくは、設定手段によって設定された録音条件を報知する報知手段を更に備える。
【0010】
この局面によれば、録音条件が報知されることにより使用者は設定された録音条件を認識することが出来るため、所望する録音条件か否かを判断することが可能となる。
【0011】
好ましくは、シーン判別手段は、画像信号から所定の形状をした物体などを検出することにより得られる物体の数及び又は物体と物体の離れ具合を検出してシーンを判別する。
【0012】
この局面によれば、画像信号から所定の形状をした物体などを検出することにより得られる物体の数及び又は物体と物体の離れ具合が検出出来るため、現在のシーンをより精度よく判別することが出来る。
【0013】
好ましくは、シーン判別手段は、画像信号に基づいて人数及び又は人と人の離れ具合を検出してシーンを判別する。
【0014】
この局面によれば、人数及び又は人と人の離れ具合が検出出来るため、現在のシーンをより精度よく判別することが出来る。
【0015】
好ましくは、シーン判別手段は、画像信号に含まれる顔信号に基づいて人数及び又は人と人の離れ具合を検出してシーンを判別する。
【0016】
この局面によれば、設定手段においてシーン判別手段によって判別されたシーンに基づいて設定された録音条件は、無指向性のマイクロフォン又は指向性のマイクロフォンを用いて音声を集音する条件を含む。
【0017】
この局面によれば、録音条件が無指向性のマイクロフォン又は指向性のマイクロフォンを用いて音声を集音する条件を含むため、より好適な録音をすることが出来る。
【0018】
本発明の音声を集音し録音する録音装置において録音するための条件を設定する方法は、被写体の光学像を撮像し画像信号として出力するステップ、画像信号に基づいてシーンを判別するステップ、判別されたシーンに基づいて、録音するための録音条件を設定するステップから成る。 本発明のプログラムは、被写体の光学像を撮像し画像信号として出力する撮像手段と音声を集音し録音する録音手段を備える電子機器のプロセッサに、被写体の光学像を撮像し画像信号として出力するステップ、画像信号に基づいてシーンを判別するステップ、判別されたシーンに基づいて、録音するための録音条件を設定するステップを実行させる。
【発明の効果】
【0019】
本発明の録音装置によれば、好適な録音条件の設定をより簡単に行うことが出来る。
【図面の簡単な説明】
【0020】
【図1】本発明の一実施例であるICレコーダの回路構成の一部を示すブロック図である。
【図2】顔認識処理に用いる各サイズを示す概念図の一例である。
【図3】被写体Aの撮像画像に対して顔認識処理及びパターン認識処理において検出される顔及びサイズを示す概念図の一例である。
【図4】被写体Aの撮像画像に対して空間認識処理において検出した幅を示す概念図の一例である。
【図5】被写体Bの撮像画像に対して顔認識処理及びパターン認識処理において検出される顔及びサイズを示す概念図の一例である。
【図6】被写体Cの撮像画像に対して顔認識処理及びパターン認識処理において検出される顔及びサイズを示す概念図の一例である。
【図7】被写体Cの撮像画像に対して空間認識処理において検出した幅を示す概念図の一例である。
【図8】被写体Dの撮像画像に対して顔認識処理及びパターン認識処理において検出される顔及びサイズを示す概念図の一例である。
【図9】被写体Dの撮像画像に対して空間認識処理において検出した幅を示す概念図の一例である。
【図10】LCD28に表示される口述シーンモードを示す画面の一例である。
【図11】LCD28に表示される会議シーンモードを示す画面の一例である。
【図12】LCD28に表示される講義シーンモードを示す画面の一例である。
【図13】LCD28に表示される音楽シーンモードを示す画面の一例である。
【図14】顔認識処理、空間認識処理及びパターン認識処理の結果と推奨される録音シーンとの関係を示す認識テーブルである。
【図15】各録音シーンと録音機能のパラメータとの関係を示す録音シーンテーブルである。
【図16】オートシーンセレクト機能における処理を実行するタスクの一例を示すフローチャートである。
【発明を実施するための最良の形態】
【0021】
以下、本発明の録音装置の一実施例として、ICレコーダ10に実施した形態につき、図面に沿って具体的に説明する。
【0022】
図1は、本実施例のICレコーダ10のブロック図を示している。ICレコーダ10は、少なくとも光学レンズを含むレンズ群16、図示しない絞り、CMOSイメージャユニット18、信号処理回路20、CPU22、操作部24、LCD(Liquid Crystal Display)28、外部メモリカード制御回路30、SDRAM32、外部メモリカード34、フラッシュメモリ36、バス38、コーデック40、マイク部42、スピーカ44、DSP(Digital Signal Processor)46及びアンプ48を含んで構成されている。
【0023】
マイク部42は、無指向性マイクロフォン42L及び無指向性マイクロフォン42Rを含む。マイク部42で集音された音声は、アナログ音声信号として出力され、マイク部42に接続されるコーデック40へ入力される。コーデック40は、入力されたアナログ音声信号に対し所定のデジタル処理を施し、デジタル音声信号を出力する。
【0024】
バス38は、CPU22とフラッシュメモリ36に接続される。CPU22はフラッシュメモリ36に格納されているプログラムを実行することにより、ICレコーダ10の各回路及び各部を制御する。ICレコーダ10は、複数の録音機能を備えており、CPU22は、該録音機能に対して設定されたパラメータに基づいて処理を実行する。
【0025】
バス38には、CPU22及びフラッシュメモリ36のほか、CMOSイメージャユニット18、信号処理回路20、LCD28、外部メモリカード制御回路30、SDRAM32、コーデック40及びDSP46が接続されている。
【0026】
さて、SDRAM32に格納されたデジタル音声信号がファイル形式としてMP3形式で圧縮される場合、デジタル音声信号はSDRAM32からDSP46へ出力される。DSP46は、入力されたデジタル音声信号に対してMP3形式で圧縮処理を施し、SDRAM32へMP3音声圧縮データとして一旦格納する。そして、CPU22は外部メモリコントローラ30を制御して、SDRAM32に格納されているMP3音声圧縮データを音声ファイルとして外部メモリカード34へ記録する。
【0027】
なお、ファイル形式としてPCM方式が採用された場合は、SDRAM32に格納されているデジタル音声信号は、音声ファイルとして外部メモリカード制御回路30の制御のもと、外部メモリカード34へ記録される。
【0028】
以上のように、マイク部42で集音された音声が外部メモリカード34へ記録される処理を“録音”と定義する。
【0029】
外部メモリカード34に記録された音声ファイルを再生する際には、外部メモリカード制御回路30の制御のもと、外部メモリカード34に記録された音声ファイルが読み出される。読み出された音声ファイルがMP3圧縮音声データを含む場合は、DSP46へ入力され、伸張処理が施されて伸張デジタル音声信号としてコーデック40へ出力される。コーデック40では伸張デジタル音声信号を処理してアナログ再生信号としてアンプ48へ出力する。アンプ48では、アナログ再生信号に対してゲイン調整を施した後、スピーカ44へ出力し、スピーカ44はゲイン調整が施されたアナログ再生信号を音声として出力する。
【0030】
以上のように、外部メモリカード34に記録された音声ファイルがスピーカ44から音声として出力されるまでの処理を“再生”と定義する。
【0031】
操作部24はCPU22と接続されており、録音機能のパラメータを設定するための設定画面を呼び出すなどのさまざまなメニューを表示するためのメニューキー24a、音声ファイルの再生処理を開始するための再生ボタン24b、音声の録音処理を開始するための録音ボタン24c、LCD28上に表示されるカーソルを移動させるためのカーソルキー24d、各機能の実行を決定するためのセットボタン24e、再生処理又は録音処理を停止するための停止ボタン24f及びオートシーンセレクト機能を有効化するためのオートシーンセレクトボタン24gを含む。
【0032】
ICレコーダ10に電源が投入されると、ICレコーダ10は録音スタンバイ状態に移行する。録音スタンバイ状態において、メニューキー24aが操作されると、録音機能のパラメータを設定する設定画面が呼び出される。使用者はカーソルキー24dやセットボタン24eを操作することにより、設定画面において所望する録音機能のパラメータの設定が可能である。なお、パラメータとして、各録音機能自体のオン/オフも含むものとして説明を続ける。
【0033】
録音機能について詳細に説明する。音声を圧縮する比率を設定する“圧縮比率”機能、マイクロフォン42L、42Rのマイク感度を設定する“MIC感度”機能、音声信号の振幅を自動調整する自動レベル制御(Automatic Level Control)を示す“ALC” 機能、所定周波数以下の音声をカットするためのローカットフィルタを示す“LowCut”機能、突然の過大入力を抑制するためのピークリミッタを示す“ピークリミッタ” 機能、録音ボタン24cが押下された後に指定した時間が経過すると録音を開始する機能である“セルフタイマ”機能及び無音部分の録音を一時停止するボイスアクティベートシステムを示す“VAS” 機能がある。
【0034】
“圧縮比率”機能のパラメータとして、MP3方式である32kbps、64kbps、192kbps、320kbps及びPCM方式である48kHz16bitが用意されており、それらの中から1つ選択可能である。なお、32kbpsとは、1秒間に32キロビットのデータを送れるかを示すデータ通信の速度を表し、48kHz16bitとは、サンプリング周波数48kHz量子化ビットレート16bitを表している。
【0035】
“MIC感度”機能のパラメータとして、Low又はHiが用意されており、それらの中から1つ選択可能である。Lowが選択された場合はマイク感度が低く、Hiが選択された場合はマイク感度が高くなる。
【0036】
“ALC”機能のパラメータとしてオン又はオフが選択可能である。オンが選択された場合は自動レベル制御が有効化され、オフが選択された場合は無効化される。
【0037】
“LowCut”機能のパラメータとして、オン又はオフが選択可能である。オンが選択された場合はローカットフィルタが有効化され、オフが選択された場合は無効化される。
【0038】
“ピークリミッタ”機能のパラメータとして、オン又はオフが選択可能である。オンが選択された場合はピークリミッタが有効化され、オフが選択された場合は無効化される。
【0039】
“VAS”機能のパラメータとして、オン又はオフが選択可能である。オンが選択された場合はボイスアクティベートシステムが有効化され、オフが選択された場合は無効化される。
【0040】
また、ICレコーダ10は、予め複数の録音シーンを想定し録音シーンを指定することにより録音シーン夫々に対して設定されている録音機能のパラメータを自動的に有効化するシーンセレクト機能を備えている。
【0041】
図15は、録音シーンに対して夫々設定されている録音機能のパラメータを示した録音シーンテーブルを表わしている。録音シーンテーブルは、フラッシュメモリ36に格納されている。シーンセレクト機能において、使用者によって口述シーンが選択された場合、圧縮比率を64kbps、MIC感度をLow、ALCをオン、LowCutをオン、ピークリミッタをオフ、セルフタイマをオフ及びVASをオフになるよう設定され、図10に示すような口述シーンを示す画面がLCD28に表示される。
【0042】
同様に会議シーンが選択されると、CPU22は録音シーンテーブルを参照して録音機能のパラメータを設定し、図11に示すような会議シーンを示す画面をLCD28に表示させる。講義シーンが選択されると、CPU22は録音シーンテーブルを参照して録音機能のパラメータを設定し、図12に示すような講義シーンを示す画面をLCD28に表示させる。音楽シーンが選択されると、録音シーンテーブルを参照して録音機能のパラメータを設定し、図13に示すような音楽シーンを示す画面をLCD28に表示させる。
【0043】
また、録音スタンバイ状態において、録音ボタン24cが押下されると、CPU22は、設定されたパラメータに基づいて録音を開始させ、停止ボタン24fが押下されることにより録音を終了する。また、録音スタンバイ状態において、再生ボタン24bが押下されると、CPU22は、音声ファイルの再生を開始させ、停止ボタン24fが押下されることにより、再生を終了する。
【0044】
更に、録音スタンバイ状態において、オートシーンセレクトボタン24gが押下されると、CPU22はオートシーンセレクト機能を実行する。オートシーンセレクト機能とは、ICレコーダ10が持つ撮像機能を利用して得られた撮像画像に基づいて推奨する録音シーンを特定する機能である。そして、録音シーンテーブルが参照され、特定された録音シーンに対応する録音機能のパラメータが自動的に設定される。
【0045】
以下に、オートシーンセレクト機能について詳細に説明する。
【0046】
オートシーンセレクトボタン24gが押下されると、ICレコーダ10において撮像が開始され、撮像画像が取得される。具体的には、被写体の光学像はCPU22による指示によって、図示しないモータ駆動部に制御されたレンズ群16及び絞りを通して、CMOSイメージャユニット18に取り込まれる。CPU22に接続された図示しないタイミングジェネレータによって与えられる取り込みパルスによって、CMOSイメージャユニット18から1フレーム分のデジタル撮像信号が出力される。
【0047】
CMOSイメージャユニット18では、各画素で蓄積した電荷を増幅し、各画素から配線を使用して信号として読み出しを行い、該信号に対して、相関2重サンプリング処理、ゲイン調整、クランプ処理、A/D変換処理を施す。該処理が施されたデジタル撮像信号は、画素毎にR、G、Bのいずれかの色信号を有し、CPU22の制御によって、バス38を介してSDRAM32に一旦格納される。
【0048】
なお、本実施例では、イメージセンサとしてCMOSイメージャユニット18を採用した形態で説明するが、CCDイメージャを採用しても良い。CCDイメージャを採用した場合は、相関2重サンプリング処理、ゲイン調整、クランプ処理、A/D変換処理を含むAFE回路が追加される。
【0049】
SDRAM32に一旦格納されたデジタル撮像信号は、CPU22の制御によって信号処理回路20へ入力される。信号処理回路20では、入力されたデジタル撮像信号に対して色分離処理を施し、更にYUV変換により、Y、U、V信号に変換する。そして、信号処理回路20で変換されたデジタル画像信号は、バス38を介して、再びSDRAM32へ格納される。このように、被写体の光学像がさまざまな処理を経てSDRAM32に格納されるまでを撮像処理と定義する。
【0050】
さて、撮像処理において得られた1フレーム分のデジタル画像信号に対して、CPU22は所定の形状をした物体を検出する処理を実行する。より具体的には、顔を検出する顔認識処理及び楽器及び人の後頭部を検出するパターン認識処理を行う。顔認識処理及びパターン認識処理では、デジタル画像信号の中から、テンプレートとして用意されている複数の顔テンプレート、複数の楽器テンプレート又は複数の後頭部テンプレートとマッチングを行う。マッチしたテンプレートがデジタル画像信号のどこに位置するかを特定することによって、顔及び又は楽器及び又は後頭部が検出される。
【0051】
検出された顔及び又は楽器及び又は後頭部に対し、CPU22は夫々のサイズを認識する。サイズは6種類に分かれており、図2は画像サイズが5インチであるときに対応する6つのサイズを図示したものである。1番小さいサイズを1とし、次に2、3、4、5と続き1番大きいサイズを6とする。ここでは、サイズ1は縦1.2cm×横1cmとしているが、サイズはこれに限定されない。
【0052】
なお便宜上、図3−図9で示される撮像画像A、B、C、Dの画像サイズを5インチとし、それに対応する6つのサイズを用いて説明する。
【0053】
次に、検出された顔及び又は楽器及び又は後頭部が複数存在する場合には、CPU22は、夫々がどれくらい離れているかを示す離れ具合を検出する。離れ具合は、顔及び又は楽器及び又は後頭部の中心から互いに最も近い顔及び又は楽器及び又は後頭部の中心までの幅を測定し、夫々測定された幅の中で最大の幅を検出する。この離れ具合を検出する処理を“空間認識処理”と定義する。
【0054】
CPU22は、顔検出処理、パターン検出処理及び空間認識処理に基づき、フラッシュメモリ36に格納されている認識テーブルを参照して、推奨する録音シーンを決定する。認識テーブルは図14に示すように録音シーンと顔認識処理、パターン認識処理及び空間認識処理の結果が対応付けられている。
【0055】
CPU22は、顔認識処理の結果、顔の個数が1つでサイズが5又は6であり、パターン認識処理の結果、何も認識されなかったことが分かると、認識テーブルを参照して、推奨する録音シーンは口述シーンであると決定する。
【0056】
顔認識処理の結果、顔の個数が2つ以上でサイズが3−6のいずれかであり、空間認識処理の結果、最大幅が0−5cmのいずれかに該当し、パターン認識処理の結果、楽器が認識されなかったことが分かると、推奨する録音シーンは会議シーンであると決定する。この場合、後頭部が検出されてもされなくても推奨する録音シーンは会議シーンであると決定される。
【0057】
顔認識処理の結果、顔の個数が1つでサイズが1又は2であり、空間認識の結果、最大幅が0−5cmに該当することが分かり、パターン認識処理の結果、楽器が検出されず後頭部を検出した場合、推奨する録音シーンは講義シーンであると決定する。
【0058】
顔認識処理の結果、顔の個数が1つ以上でサイズが1−6であり、空間認識の結果、最大幅が0〜12cmに該当することが分かり、パターン認識処理の結果、楽器が検出した場合、推奨する録音シーンは音楽シーンであると決定する。この場合、後頭部が検出されてもされなくても推奨する録音シーンは音楽シーンであると決定される。
【0059】
なお、顔認識処理、空間認識処理及びパターン認識処理の結果、図15に示す認識テーブルに該当しないことが分かった場合には、LCD28に“シーンが見つけられません”等の表示をしても良い。
【0060】
図3は、推奨する録音シーンが会議シーンであると決定され得る撮像画像Aを示している。CPU22による顔認識処理及びパターン認識処理の結果、図3に示すように、撮像画像Aのデジタル画像信号からサイズ2の顔w、x、サイズ3の顔y及びサイズ4の顔zが検出され、楽器は検出されないこととなる。空間認識処理の結果、図4に示すように、顔wと顔x間の幅K1=4cm、顔xと顔y間の幅K2=2cm及び顔yと顔z間の幅K3=3cmが検出されると、最大幅は4cmとして決定される。この検出結果からCPU22は図14の認識テーブルを参照して、推奨する録音シーンは会議シーンであると決定する。
【0061】
図5は、推奨する録音シーンが口述シーンであると決定され得る撮像画像Bを示している。CPU22による顔認識処理及びパターン認識処理の結果、図5に示すように、撮像画像Bのデジタル画像信号からサイズ6の顔vが検出され、楽器は検出されないこととなる。CPU22はこの検出結果から図14の認識テーブルを参照して、推奨する録音シーンは口述シーンであると決定する。
【0062】
図6は、推奨する録音シーンが講義シーンであると決定され得る撮像画像Cを示している。CPU22による顔認識処理及びパターン認識の結果、図6に示すように、撮像画像Cのデジタル画像信号からサイズ1の顔tが検出され、後頭部l、m、nが検出される。なお、顔tはサイズ1よりも小さいが、CPU22はサイズ1−6の中で直近のサイズに割り当てる。空間認識処理の結果、図7にすように、顔tと後頭部l間の幅K4=4cm、後頭部lと後頭部m間の幅K5=2.5cm及び後頭部mと後頭部n間の幅K6=2cmが検出され、最大幅は4cmとして決定される。CPU22は、この検出結果から図14の認識テーブルを参照して、推奨するシーンは講義シーンであると決定する。
【0063】
図8は、推奨する録音シーンが音楽シーンであると決定され得る撮像画像Dを示している。CPU22による顔認識処理及びパターン認識処理の結果、図8に示すように撮像画像Dのデジタル画像信号からサイズ1の顔e、f、g、hが検出され、後頭部iが検出され、楽器o、p、q、r、sが検出される。空間認識処理の結果、図9に示すように、顔hと楽器r間の幅K7=1.5cm、顔gと楽器q間の幅K8=1.5cm、顔fと楽器p間の幅K9=1.5cm及び後頭部iと楽器s間の幅=0cmが検出され、最大幅は1.5cmとして決定される。CPU22は、この検出結果から図14の認識テーブルを参照して、推奨するシーンは音楽シーンであると決定する。
【0064】
推奨される録音シーンが決定されると、CPU22は、LCD28に推奨される録音シーンに対応する録音シーンの画面を表示させる。推奨される録音シーンが口述シーンの場合には、図10に示すような口述シーンを示す画面が表示される。推奨される録音シーンが会議シーンの場合には、図11に示すような会議シーンを示す画面が表示される。推奨される録音シーンが講義シーンの場合には、図12に示すような会議シーンを示す画面が表示される。推奨される録音シーンが音楽シーンの場合には、図13に示すような音楽シーンを示す画面が表示される。
【0065】
そして、CPU22は、録音シーンテーブルを参照して推奨する録音シーンに対応する録音機能のパラメータを設定する。そして、録音ボタン24cが押下された場合は、CPU22は推奨する録音シーンに対応する録音機能のパラメータを録音条件として録音を開始する。
【0066】
録音機能のパラメータをカスタマイズする場合には、LCD28に録音シーンの画面が表示されてから所定時間内に、使用者によってメニューキー24aが操作されることによりパラメータを変更する画面へと遷移させ、カーソルキー24dやセットボタン24eが操作されることによって所望のパラメータに変更することが出来る。なお、所望のパラメータの変更例としては、ALC機能のパラメータをオンからオフに変更したり、圧縮比率機能のパラメータを64kbpsから192kbpsに変更することが挙げられる。そして、録音ボタン24cが押下されることによって、設定されたパラメータを録音条件として録音が開始される。
【0067】
次に図16に示すオートシーンセレクトタスクのフローチャートを参照して、上述したオートシーンセレクト機能を実現するための処理を説明する。このタスクは、フラッシュメモリ36に格納されている夫々のプログラムに基づいてCPU22が実行する。
【0068】
電源が投入され、オートシーンセレクトボタン24gが押下されるとオートシーンセレクトタスクが起動する。まずステップS101において、CPU22は1フレームの撮像処理を行う。次のステップS103では、撮像処理によって得られたデジタル画像信号に対してCPU22は顔認識処理を実行し、次のステップS105では空間認識処理を実行する。次のステップS107ではパターン認識処理を実行する。次のステップS109では、CPU22は、顔認識処理、空間認識処理及びパターン認識処理の結果に基づいて、認識テーブルを参照して推奨する録音シーンを決定し、次のステップS111では、推奨する録音シーンに対応する録音機能のパラメータを設定して、推奨する録音シーンの画面をLCD28に表示する。
【0069】
次のステップS113では、推奨する録音シーンの画面が表示されてから所定時間内にメニューキー24aが操作され、カーソルキー24d及びセットボタン24eの操作によりパラメータ変更の操作があったか否かを判別する。ステップS113においてYESと判別されると、ステップS115へ進みパラメータの変更を行った後、本タスクを終了する。また、ステップS113においてNOと判断された場合も、本タスクを終了する。
【0070】
上述したように、本実施例によるICレコーダ10によれば、使用者はオートシーンセレクトボタン24gを押下するだけで、ICレコーダ10自身で推奨する録音シーンを判別し、該録音シーンに対応する録音機能のパラメータを設定するため、より簡単にかつ好適な録音条件で録音をすることが出来る。また、撮像画像から推奨する録音シーンが判別されるため、判別の精度がより高くなる。
【0071】
なお、本実施例のICレコーダ10では、オートシーンセレクト機能を実行するためのプログラムが予めフラッシュメモリ36に格納されているが、ICレコーダ10と外部装置とを接続させ、使用者が無線通信や有線通信を介して外部装置が保持するプログラムを取得しても良い。
【0072】
また、本実施例では本発明をICレコーダ10に適用させた例を説明したが、デジタルカメラ、PDA、携帯電話及びスマートフォンでも適用可能である。携帯電話及びスマートフォンに適用される場合は、オートシーンセレクト機能を実行するためのプログラム全部または一部を、使用者がインターネット又は電話回線を介してダウンロードされても良い。
【0073】
また、本発明がタッチパネル式のスマートフォンに適用される場合、操作部24の各キー及びボタンの役割は、画面を軽く叩いてすぐ指を離すタップ操作や、指で画面を触れ続ける長押し操作や、画面を軽く払うよう指を動かすフリック操作や、画面に2本以上の指を接しさせ互いの指が離れる方向や近づく方向に動かすスワイプ操作などに対応させても良い。
【0074】
また、SDRAM32に格納されたデジタル画像信号は、CPU22の制御によりLCD28へ出力しても良い。LCD28は、図示しないLCDドライバを含み、LCDドライバはY、U、V信号をRGB信号に変換して、LCD28にデジタル画像信号に基づく画像を表示させることが出来る。画像をLCD28に表示させると消費電力が増加するため、使用者によるメニューキー24a、カーソルキー24d及びセットボタン24eの操作によって表示モードに設定したときのみ、表示を行ってもよい。
【0075】
また、実施例では、モニタとしてLCD28を採用した形態を説明したが、有機ELなどの表示デバイスを採用しても良い。
【0076】
また、顔認識処理、パターン認識処理及び空間認識処理において1フレーム分のデジタル画像信号を認識処理対象としたが、10フレーム分を認識対象としても良い。この場合、認識精度の向上が期待される。
【0077】
また、本実施例において顔認識処理から得られる顔のサイズの種類として6つ用意したが、顔のサイズや種類はこれに限らない。顔のサイズの種類が多ければ多いほど、推奨する録音シーンの判別精度が向上する。
【0078】
また、本実施例においてマイク部42に無指向性マイクロフォン42L、42Rを設けたが、更に指向性マイクロフォンを設けても良い。この場合、録音シーンに対して夫々設定されている録音機能のパラメータとして無指向性マイクロフォン42L、42Rと指向性マイクロフォンのオン/オフを追加しても良い。例えば、口述シーンに設定される録音機能のパラメータとして、無指向性マイクロフォン42L、42Rをオフ、指向性マイクロフォンをオンと設定される場合、より一層好適な録音が可能となる。
【符号の説明】
【0079】
10 ・・・ ICレコーダ
16 ・・・ レンズ群
18 ・・・ CMOSイメージャユニット
20 ・・・ 信号処理回路
22 ・・・ CPU
24 ・・・ 操作部
28 ・・・ LCD
30 ・・・ 外部メモリカード制御回路
32 ・・・ SDRAM
34 ・・・ 外部メモリカード
36 ・・・ フラッシュメモリ
40 ・・・ コーデック
42 ・・・ マイク部
46 ・・・ DSP

【特許請求の範囲】
【請求項1】
被写体の光学像を撮像し画像信号として出力する撮像手段と、
前記画像信号に基づいてシーンを判別するシーン判別手段と、
音声を集音し録音する録音手段と、
前記シーン判別手段によって判別されたシーンに基づいて、録音するための録音条件を設定する設定手段とを備える、録音装置。
【請求項2】
前記録音手段を制御して前記設定手段によって設定された録音条件で録音する録音制御手段と、
前記設定手段によって設定された録音条件を変更する変更手段を更に備える、請求項1記載の録音装置。
【請求項3】
前記設定手段によって設定された録音条件を報知する報知手段を更に備えることを特徴とする、請求項1又は2記載の録音装置。
【請求項4】
前記シーン判別手段は、前記画像信号から物体の数及び又は物体と物体の離れ具合を検出してシーンを判別することを特徴とする請求項1乃至3のいずれかに記載の録音装置。
【請求項5】
前記シーン判別手段は、前記画像信号に基づいて人数及び又は人と人の離れ具合を検出してシーンを判別することを特徴とする請求項1乃至4のいずれかに記載の録音装置。
【請求項6】
前記シーン判別手段は、前記画像信号に含まれる顔信号に基づいて人数及び又は人と人の離れ具合を検出してシーンを判別することを特徴とする、請求項5記載の録音装置。
【請求項7】
前記設定手段において前記シーン判別手段によって判別されたシーンに基づいて設定された録音条件は、無指向性のマイクロフォン又は指向性のマイクロフォンを用いて音声を集音する条件を含むことを特徴とする、請求項1乃至6のいずれかに記載の録音装置。
【請求項8】
音声を集音し録音する録音装置において録音するための条件を設定する方法であって、
被写体の光学像を撮像し画像信号として出力するステップ、
前記画像信号に基づいてシーンを判別するステップ、
判別されたシーンに基づいて、録音するための録音条件を設定するステップから成る方法。
【請求項9】
被写体の光学像を撮像し画像信号として出力する撮像手段と音声を集音し録音する録音手段を備える電子機器のプロセッサに、
被写体の光学像を撮像し画像信号として出力するステップ、
前記画像信号に基づいてシーンを判別するステップ、
判別されたシーンに基づいて、録音するための録音条件を設定するステップを実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate