画像処理装置
【課題】
複数のマイクを利用可能な環境で、マイク操作アイコンで画面が見にくくならないようにする。
【解決手段】
複数のワイヤレスマイクが通信装置(107)を介して利用可能であり、撮影対象となりうる人物に装着されている。CPU(101)は、画面に表示可能なアイコン数の範囲内で、撮影視野内の人物に装着されたマイクか否か、録音中か否か、画面から消えたか、画面に入ったか等に従い、アイコンの表示の要否を決定する。CPU(101)は、撮像部(120)の撮影画像に決定したアイコンを重畳した表示制御信号を表示制御部104に供給する。
複数のマイクを利用可能な環境で、マイク操作アイコンで画面が見にくくならないようにする。
【解決手段】
複数のワイヤレスマイクが通信装置(107)を介して利用可能であり、撮影対象となりうる人物に装着されている。CPU(101)は、画面に表示可能なアイコン数の範囲内で、撮影視野内の人物に装着されたマイクか否か、録音中か否か、画面から消えたか、画面に入ったか等に従い、アイコンの表示の要否を決定する。CPU(101)は、撮像部(120)の撮影画像に決定したアイコンを重畳した表示制御信号を表示制御部104に供給する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置に関し、特に、画像表示装置に画像と当該画像に関連する音声の操作のためのアイコンとを表示させる画像処理に関する。
【背景技術】
【0002】
従来、撮像装置のように撮像した画像を表示装置に表示することが知られている。これらの撮像装置には、マイクにより得られる周囲の音声を画像とともに記録する機能が搭載されている。音声入力手段としてわいやれるマイクも使用するようになった。
【0003】
特許文献1には、被写体を表示する画面上にワイヤレスマイクを示すアイコンを表示し、当該アイコンを操作することにより、音声記録に使用するワイヤレスマイクを選択する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−054567号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の技術では、ワイヤレスマイクが検出すると、無条件にアイコンを画面上に表示するようになっている。この結果、音声記録に使用するワイヤレスマイクのアイコンも、使用しないワイヤレスマイクのアイコンも、撮影中に常時表示されることになり、構図及び被写体を確認しづらくなってしまう。
【0006】
本発明は、このような不都合を解消する画像処理装置を提示することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る表示画像処理装置は、画像信号を取得する画像取得手段と、前記画像信号に関連する複数の音声信号を取得する音声取得手段と、前記画像信号に基づく画像を表示装置に表示させる表示制御手段と、前記画像信号から特定被写体を検出する被写体検出手段と、前記音声信号を解析する音声解析手段と、前記複数の音声信号のうちの、選択した音声信号を記録する記録手段と、前記音声信号の解析結果及び記録状態並びに前記被写体検出手段の検出結果に応じて、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御する制御手段とを備えることを特徴とする。
【発明の効果】
【0008】
本発明によれば、たとえば、ワイヤレスマイク等により得られた音声信号を示すアイコンとして、必要である可能性の高いアイコンを優先して表示することができる。これにより、画面が不必要なアイコンの表示により見にくくなってしまう可能性を低減できる。
【図面の簡単な説明】
【0009】
【図1】本発明に係る画像処理装置の一実施例の概略構成ブロック図を示す。
【図2】顔に関連付けてマイクを予め登録するCPU処理のフローチャートである。
【図3】個人認証データベースの模式図である。
【図4】表示すべき操作アイコンを表示制御するCPU処理のフローチャートである。
【図5A】撮影中に表示するマイクの選択処理のフローチャートである。
【図5B】撮影中に表示するマイクの選択処理のフローチャートである。
【図6】音声解析処理の説明用模式図である。
【図7】タッチパネル上で見た動作説明図である。
【図8】図7で説明する動作状態を示すタイムチャートである。
【図9】通信品質順位例である。
【図10】マイク毎の録音時間の順序付け例である。
【図11】表示条件と結果の分類表である。
【図12A】再生中に表示するマイクの選択処理のフローチャートである。
【図12B】再生中に表示するマイクの選択処理のフローチャートである。
【図13】記録済み音声の音声解析の説明用模式図である。
【図14】表示条件と結果の分類表である。
【図15】タッチパネル上で見た動作説明の画面例とタイムチャートである。
【図16】マイク毎の滞在時間の順位表の一例である。
【図17】画面内での位置に応じて操作アイコン表示数を設定するエリア別表示数制限の概念図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、本発明の実施例を詳細に説明する。
【実施例1】
【0011】
図1は、本発明に係る画像処理装置の一実施例の概略構成ブロック図を示す。撮像装置100に本発明に係る画像処理装置の一実施例が組み込まれているが、一般的な情報処理装置(例えば、パーソナルコンピュータ、携帯電話、スマートフォンなど)にも組み込み可能である。
【0012】
内部バス109に、CPU101、ハードディスク(HDD)102、メモリ103、表示制御部104、操作部105、ドライブ装置106、通信装置107、映像処理部110、音声処理部111及び撮像部120が接続する。内部バス109に接続される各部は、内部バス109を介して互いにデータのやりとりを行うことができる。
【0013】
ハードディスク102には、顔検出パターンデータ、個人認証データベース、映像音声データ、その他のデータ、及びCPU101が動作するための各種プログラムなどが格納される。ハードディスク102の代わりに、不揮発性の記録媒体であればどのようなものであっても良い。顔検出パターンデータとは、顔検出のパターンマッチングに使うデータである。顔検出については後述する。個人認証データベースとは、検出した顔に対して人物認証を行う特徴データが登録されているデータベースである。個人認証については後述する。
【0014】
メモリ103は、例えばRAMからなる。表示制御手段、変更手段および音声解析手段としてのCPU101は、例えばハードディスク102に格納されるプログラムに従い、メモリ103をワークメモリとして用いて、撮像装置100の各部を制御する。CPU101上で動作するプログラムは、ハードディスク102に格納されるのに限られず、例えば図示されないROMに予め記憶しておいてもよい。
【0015】
操作部105は、使用者の操作を受け付け、操作に応じた制御信号を生成し、CPU101に供給する。例えば、操作部105は、使用者の操作を受け付ける入力デバイスとして、キーボードといった文字情報入力デバイス、及び、マウスやタッチパネルといったポインティングデバイスなどを有する。タッチパネルは、例えば平面的に構成された操作部に対して接触された位置に応じた座標情報が出力されるようにした入力デバイスである。
【0016】
CPU101は、入力デバイスに対してなされた使用者の操作に応じて操作部105で生成され供給される制御信号に基づき、プログラムに従い、撮像装置100の各部を制御する。これにより、CPU101は、撮像装置100に対し、使用者の操作に応じた動作を行わせることができる。
【0017】
表示制御部104は、ディスプレイ108に画像を表示させるための表示信号を出力する。例えば、CPU101は、プログラムに従い生成した表示制御信号を表示制御部104に供給する。表示制御部104は、CPU101からの表示制御信号に基づき表示信号を生成してディスプレイ108に出力する。
【0018】
例えば、表示制御部104は、CPU101が生成する表示制御信号に基づき、GUI(Graphical User Interface)を構成するGUI画面をディスプレイ108に表示させる。
【0019】
操作部105としてタッチパネルを用いる場合、操作部105とディスプレイ108とを一体的に構成することができる。例えば、タッチパネルを光の透過率がディスプレイ108の表示を妨げないように構成し、ディスプレイ108の表示面の上層に取り付ける。そして、タッチパネルにおける入力座標と、ディスプレイ108上の表示座標とを対応付ける。これにより、恰も使用者がディスプレイ108上に表示された画面を直接的に操作可能であるかのようなGUIを構成することができる。
【0020】
操作部105がタッチパネルである場合、CPU101は、タッチパネルへの以下の操作を検出できる。タッチパネルを指やペンで触れる操作を、以下、タッチダウンと称する。タッチパネルを指やペンで触れている状態であることを、以下、タッチオンと称する。タッチパネルを指やペンで触れたまま移動することを、以下、ムーブと称する。タッチパネルへ触れていた指やペンを離したことを、以下、タッチアップと称する。タッチパネルに何も触れていない状態を、以下、タッチオフと称する。
【0021】
これらの操作と、タッチパネル上に指やペンが触れている位置座標は、内部バス109を通じて、CPU101に通知され、CPU101は、通知された情報に基づいてタッチパネル上にどのような操作が行なわれたかを判定する。
【0022】
ムーブについては、タッチパネル上で移動する指やペンの移動方向についても、位置座標の変化に基づいて、タッチパネル上の垂直成分・水平成分毎に判定できる。タッチパネル上をタッチダウンから一定のムーブを経てタッチアップをしたとき、ストロークを描いたこととする。素早くストロークを描く操作をフリックと呼ぶ。フリックは、タッチパネル上に指を触れたままある程度の距離だけ素早く動かして、そのまま離すといった操作であり、言い換えればタッチパネル上を指ではじくように素早くなぞる操作である。所定距離以上を、所定速度以上でムーブしたことが検出され、そのままタッチアップが検出されると、フリックが行なわれたと判定できる。また、所定距離以上を、所定速度未満でムーブしたことが検出された場合はドラッグが行なわれたと判定するものとする。
【0023】
ドライブ装置106は、CDやDVDといったディスク状の外部記憶媒体(不図示)を駆動する装置である。ドライブ装置106は、CPU101の制御に基づき、装着された外部記憶媒体にデータを読み書きする。ドライブ装置106の代わりに、例えばメモリカードなどの不揮発性半導体メモリを接続するインターフェース又は接続装置を用いても良い。
【0024】
通信装置107は、CPU101の制御に基づき、ワイヤレスマイク(不図示)との通信を行い、ワイヤレスマイクが取り込んだ音声を示す音声データ(以下、マイク音声データという)をマイクID付きで受信する。CPU101の制御に基づき、通信装置107は、受信したマイク音声データを音声処理部111に転送し、受信したマイクIDはメモリ103に書き込む。通信装置107は、通信エラー発生回数をカウントし、CPU101の制御に基づき、所定時間当たりのエラー発生回数を通信品質としてメモリ103に書き込む。ワイヤレスマイク及び通信装置107は、撮像部120による撮影画像に関連する複数の音声信号を取得する音声取得手段として機能する。
【0025】
撮像部120は画像取得手段として機能し、被写体を撮像し、画像信号を出力する。映像処理部110は、撮影時には、CPU101の制御に基づき、撮像部120により得られる画像信号からなる動画信号をデジタルデータに変換し、メモリ103に書き込む。再生時には、映像処理部110は、CPU101の制御に基づき、ドライブ装置106から動画データを再生してメモリ103に書き込む。
【0026】
音声処理部111は、撮影時には、CPU101の制御に基づき、マイク音声データをデジタルデータへ変換し、メモリ103へ書き込む。再生時には、音声処理部111は、CPU101の制御に基づき、ドライブ装置106からマイク音声データを再生し、メモリ103へ書き込む。
【0027】
撮影時および再生時に、音声処理部111は、CPU101の制御に基づき、所定の濾過周波数特性を持つフィルタ処理を施した後で、マイク音声データの示す音声のレベルの検知を行う。音声処理部111は、検知した音声レベルを示すデータをメモリ103に書き込む。
【0028】
撮像装置100は、2種類の音声記録方法を利用できる。第1の方法では、音声処理部111は、CPU101の制御に基づき、操作部105で任意に選択した複数マイクのマイク音声を合成し、合成音声データをメモリ103に書き込む。撮影時には、CPU101は、メモリ103に書き込まれた画像データ、選択されたマイク音声データ、及びマイク毎の録音時間等の付加情報等のデジタルデータを、必要により圧縮処理して、ドライブ装置106に記録する。
【0029】
第2の方法では、音声処理部111は、CPU101の制御に基づき、受信した複数のマイク音声を別々のままメモリ103に書き込む。撮影時には、CPU101は、メモリ103に書き込まれた画像データ、複数のマイク音声データ及びマイク毎の録音時間等の付加情報等のデジタルデータを、必要により圧縮処理して、ドライブ装置106に記録する。
【0030】
撮影画像の圧縮記録処理と並行に、CPU101は、メモリ103に書き込まれた画像データを最適なサイズにリサイズ処理し、操作アイコンと顔枠等を重畳した表示制御信号を生成する。表示制御部104は、表示制御信号に従い、撮影画像に操作アイコンと顔枠等を重畳してディスプレイ108に表示させる。これにより、撮影者は、リアルタイムで撮影画像と、認識された顔及びその位置とを視覚的に確認でき、操作アイコンによる操作を行える。
【0031】
複数のマイク音声と付加情報等のデジタルデータは、撮影画像からなる動画データのメタデータに関連付けて記録される。再生時には、メタデータによって動画に同期したマイク音声データを検出でき、再生できる。
【0032】
ワイヤレスマイクを被写体人物に関連付けている場合、再生画像データから顔検出して個人認証することにより、マイクIDを判別でき、判別したマイクIDとメタデータからどのマイク音声データを解析すべきかも判別できる。
【0033】
再生時には、CPU101は、ドライブ装置106から記録データ(画像、音声及び付加情報等)を読み出し、必要により伸長処理して、メモリ103に書き込む。すなわち、CPUは、画像信号を取得する画像取得手段として機能し、更には、画像信号に関連する複数の音声信号を取得する音声取得手段として機能する。再生時の伸長処理と並行に、CPU101は、メモリ103に書き込まれた再生画像データを最適なサイズにリサイズ処理し、操作アイコンと顔枠等を重畳した表示制御信号を生成する。表示制御部104は、表示制御信号に従い、再生画像に操作アイコンと顔枠等を重畳してディスプレイ108に表示させる。これにより、撮影者は、再生画像を鑑賞しつつ、認識された顔及びその位置を視覚的に確認でき、操作アイコンによる操作を行える。
【0034】
CPU101は、メモリ103の画像データに顔検出を行い、顔検出結果をメモリ103に書きこむ。顔検出には、パターンマッチング等の公知の顔検出技術を適用できる。顔検出の結果は、例えば、画角内の座標及びサイズからなる。CPU101は、検出した顔画像をハードディスク102に記憶されている個人認証データベースと照合し、結果をメモリ103に書きこむ。この照合には、公知の顔認証技術を用いることができる。個人認証結果は、例えば、顔認識の類似度を示すデータからなる。顔以外の指定物体等の特定被写体を検出して特徴データを抽出する技術を使用することで、顔以外の指定物体の有無を検出できる。顔に限らず、特徴のパターンマッチング等の公知の物体認証を用いることで、形状が既知の特定物体の物体認証も行うことができる。
【0035】
本実施例の特徴的な動作を説明する。本実施例では、認識されているわいやれるマイク中、被写体検出結果と音声解析結果に基づいて決定した1又は複数のマイクに対応するマイク操作アイコンを表示する。ユーザは、表示されたマイク操作アイコンを操作して、記録に使用するマイクを選択する。
【0036】
操作部105又は不図示のリモートコントローラによりユーザが撮像装置100の電源を入れると、不図示の電源部が、撮像装置100の各部に電源を供給する。電源を入れてから記録開始する前に、顔に関連付けてマイクを予め登録しておく。図2は、顔に関連付けてマイクを予め登録するCPU101の処理のフローチャートである。図3は、個人認証データベースの模式図である。図2に示すフローチャートにおける各処理は、CPU101がハードディスク102に格納されたプログラムをメモリ103に展開して実行することにより実現される。
【0037】
S201において、CPU101は、ハードディスク102に記録されている以前に登録した既存マイク登録情報を初期化して、S202に処理を移す。
【0038】
S202において、CPU101は、登録したいワイヤレスマイクの送信を開始するように案内を表示する表示制御信号を表示制御部104に送り、S203に処理を移す。
【0039】
S203において、CPU101は、マイクIDを受信したかどうかを判断し、受信していれば処理をS204に移し、受信していなければS203に処理を移す。無線方式としてBluetooth(登録商標)を使用する場合、認証が行われるので、通信相手を特定できる。マイクIDは、特定したマイクに割り付ける識別情報を示す。
【0040】
S204において、CPU101は、受信したマイクIDと装着者とを対応付けるために、装着者の顔の撮影と確定を案内する表示の表示制御信号を表示制御部104に送り、S205に処理を移す。
【0041】
S205において、CPU101は、確定操作された撮影画像に唯一つの顔を検出したかどうかを判断し、検出していれば処理をS206に移し、検出していなければS204に処理を移す。
【0042】
S206において、CPU101は、検出された顔と個人認証データベースとの照合を行う個人認証処理を行い、S207に処理を移す。
【0043】
S207において、CPU101は、個人認証処理の結果、装着者の顔が既に特定個人の顔として個人認証データベースに登録済みであるかどうかを判断する。そして、登録されていれば処理をS209に移し、登録されていなければS208に処理を移す。
【0044】
S206,S207により、CPU101は、画像信号から特定被写体を検出する被写体検出手段として機能する。
【0045】
S208において、CPU101は、装着者の顔を新たに特定個人の顔として個人認証データベースに追加登録し、S209に処理を移す。
【0046】
S209において、CPU101は、個人認証データベースにマイク装着情報を追加し、S210に処理を移す。
【0047】
図3に示す例では、特徴データX1である人は人物Aであり、人物AはID1のマイクを装着している。特徴データX2である人は人物Bであり、人物Bはマイクを装着していない。このように画像中の人物の顔を個人認証することで、マイクが装着されている場合のマイクIDを特定できる。
【0048】
S210において、CPU101は、他の登録したいワイヤレスマイク送信を開始するように案内を表示させる表示制御信号を表示制御部104に送り、S211に処理を移す。
【0049】
S211において、CPU101は、待ち時間を計るタイマ(不図示)を開始して、S212に処理を移す。
【0050】
S212において、CPU101は、他のマイクIDを受信したかどうかを判断し、受信していれば処理をS204に移し、受信していなければS213に処理を移す。
【0051】
S213において、CPU101は、S211で設定したタイマがタイムアウトであるかどうかを判断し、タイムアウトであれば処理を終了し、タイムアウトでなければS212に処理を移す。
【0052】
以上のように、顔を検出して個人認証が出来る場合に、その人物が装着しているマイクを特定するデータベースを準備できる。顔に限らず、予め登録してある特定の物体として物体認証をすることで、画像内の物体に対するマイクの装着を検出出来る。例えば、ワイヤレスマイクそのものにマイク自体を特定するための模様や文字などが付加しても良い。また、ワイヤレスマイク自体に可視光外の光を発光する発光素子を備え、それぞれのワイヤレスマイクの発光素子がワイヤレスマイクを識別するためのパターン発光を行うようにしても良い。
【0053】
図4は、表示すべき操作アイコンを表示制御するCPU101の処理のフローチャートである。
【0054】
S401において、CPU101は、顔検出結果を読み込み、S402に処理を移す。
【0055】
S402において、CPU101は、検出結果にある顔と個人認証データベースとの照合を行う個人認証処理を行い、S403に処理を移す。
【0056】
S403において、CPU101は、検出結果にある顔に対し全て個人認証処理が終わったかどうかを判断し、終わっていれば処理をS404に移し、終わっていなければS402に処理を移す。
【0057】
S404において、CPU101は、マイク検出数を初期化して、S405に処理を移す。
【0058】
S405において、CPU101は、個人認証データベースを読みこみ、S406に処理を移す。
【0059】
S406において、CPU101は、検出された顔が個人認証データベースでマイク装着と登録されているかどうかを判断し、マイク装着と登録されていれば処理をS407に移し、登録されていなければS408に処理を移す。
【0060】
S407において、CPU101は、個人認証データベースからマイクIDを取得し、S408に処理を移す。
【0061】
S408において、CPU101は、個人認証済み顔全員分のマイク検出処理が終わったかどうかを判断し、終わっていれば処理をS409に移し、終わっていなければS405に処理を移す。
【0062】
S409において、CPU101は、表示が必要なマイクIDの選択処理を行い、S410に処理を移す。
【0063】
S410において、CPU101は、表示が必要であると選択されたマイクIDの操作アイコンを表示する表示制御信号を表示制御部104に送り、処理を終える。
【0064】
図5A及び図5Bは、図4のステップS409における、撮影中に表示が必要なマイクIDの選択処理の詳細なフローチャートである。
【0065】
S501において、CPU101は、前回以前の選択処理で表示すると選択されて、現在既に表示中のマイク操作アイコンのマイクIDを取得し、S502に処理を移す。
【0066】
S502において、CPU101は、今回検出した選択処理対象のマイクIDを取得し、S503に処理を移す。
【0067】
S503において、CPU101は、今回、選択処理対象のマイクIDが検出されているかどうかを判断し、いれば処理をS504に移し、いなければS508に処理を移す。
【0068】
S504において、CPU101は、現在既にマイク操作アイコンを表示中かどうかを判断する。表示していれば処理をS513に移し、表示していなければS505に処理を移す。
【0069】
S505において、CPU101は、今回検出した選択処理対象のマイクIDの検出個数が所定数以下かどうかを判断し、以下ならば処理をS506に移し、以下でなければS519に処理を移す。
【0070】
S506において、CPU101は、今回検出した選択処理対象のマイクIDを今後表示するマイクIDに全て選択し、S507に処理を移す。
【0071】
S507において、CPU101は、今回のマイク選択処理で表示すると選択したマイクIDを保存し、処理を終える。
【0072】
このように、今まで操作アイコンを表示していなかった状態から新たに画角内に検出されたマイク本数が所定本数以下なら、全部の操作アイコンが、表示するように選択される。
【0073】
S508において、CPU101は、現在既にマイク操作アイコンを表示中のマイクIDがあるかどうか判断し、あれば処理をS509に移し、なければS507に処理を移す。
【0074】
S509において、CPU101は、現在既に表示中のマイク操作アイコンのマイクIDが既に録音中かどうかを判断し、既に録音中ならば処理をS510に移し、なければS511に処理を移す。ここで、録音中とは、CPU101がマイク音声データを圧縮処理しているか、又は、生成された圧縮データをドライブ装置106に記録している最中であることを指す。ステップS509では、記録中か否かを示す記録状態に応じて、処理を分岐していることになる。
【0075】
S510において、CPU101は、録音中のマイクIDを今後も表示するマイクIDに選択し、S512に処理を移す。
【0076】
S511において、CPU101は、録音中にないマイクIDを今後表示するマイクIDに選択せず、S512に処理を移す。
【0077】
S512において、CPU101は、現在既に表示中のマイク操作アイコンのマイクIDについて全て表示するか否かの選択が完了したかどうか判断する。CPU101は、完了していれば処理をS507に移し、完了していなければS509に処理を移す。
【0078】
このように、今まで操作アイコンを表示していたが画角外へ消えたマイクのマイク音が現在も録音中なら、記録オフ操作が可能なように、今後も表示するように選択する。他方、非録音中の場合、消えただけなので、今後、表示を消すように選択する。すなわち、記録中か否かを示す記録状態に応じて、表示/非表示を選択する。
【0079】
S513において、CPU101は、S501とS502で取得したマイクIDの中から現在既に表示中だが今回検出されないマイクID、即ち撮影視野から消失した被写体に関連付けられたマイクIDを抽出し、S514に処理を移す。
【0080】
S514において、CPU101は、現在表示中で今回検出されない消失マイクIDは録音中かどうかを判断し、録音中ならば処理をS515に移し、なければS516に処理を移す。すなわち、記録中か否かを示す記録状態に応じて、処理を分岐する。
【0081】
S515において、CPU101は、録音中のマイクIDを今後も表示するマイクIDに選択し、S517に処理を移す。
【0082】
S516において、CPU101は、録音中にないマイクIDを今後表示するマイクIDに選択せず、S517に処理を移す。
【0083】
S517において、CPU101は、今後表示するように選択したマイクIDの個数が所定数以下かどうかを判断し、以下ならば処理をS518に移し、以下でなければS528に処理を移す。
【0084】
S518において、CPU101は、現在表示中で今回検出されない全消失マイクIDについて表示/非表示の選択が完了したかどうか判断し、完了していれば処理をS519に移し、完了していなければS514に処理を移す。
【0085】
このように、今まで操作アイコンを表示していたが画角外へ消えた被写体に対応するマイクIDのマイク音声が現在録音中なら、記録オフ操作できるように、今後表示するように選択する。他方、非録音中なら、消えただけなので、今後表示を消すように選択する。すなわち、記録中か否かを示す記録状態に応じて、表示/非表示を選択する。
【0086】
S519において、CPU101は、検出されたマイクIDの音声解析を行い、S520に処理を移す。図6は、図5BのS519でCPU101が行う音声解析の説明用模式図を示す。
【0087】
図6(1)は、メモリ103に書き込まれるマイクID1のマイク音声データのマイク入力レベル601の変化例を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、メモリ103に書き込まれるマイク音声のマイク入力レベル601を人の声の濾過周波数特性を持つフィルタ処理を施した後、音量レベルを検知する。CPU101又は音声処理部111は、音声信号を解析する音声解析手段として機能する。
【0088】
図6(2)は、検知された音量レベル602を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、音量レベル602を示すデータ(検知レベルデータ)をメモリ103に書き込む。CPU101は、メモリ103に書き込まれた検知レベル602に対して、閾値超えタイマ計測処理を実行する。具体的には、CPU101は、検知レベル602が閾値Thを超えたら計時を開始し、所定時間で計時を停止し、Th未満になると計時値(カウント値)をクリアする。図6(3)は、閾値超えタイマ計測処理で得られるカウント値603の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0089】
また、CPU101は、メモリ103に書き込まれた検知レベル602に対し閾値未満タイマ計測処理を実行する。具体的には、CPU101は、メモリ103に書き込まれた検知レベル602が閾値Th未満になると、計時を開始し、所定時間で計測を停止し、閾値Thを超えると、計時値(カウント値)をクリアする。図6(4)は、閾値未満タイマ計測処理で得られるカウント値604の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0090】
CPU101は、閾値超えタイマカウント値603がTon1を超えると録音推奨条件フラグを1とし、閾値未満タイマカウント値604がToff1を超えると録音推奨条件フラグを0とする。図6(5)は、録音推奨条件フラグ605の変化例を示す。縦軸はフラグ値を示し、横軸は時間を示す。
【0091】
S520において、CPU101は、検出したマイクIDの録音推奨条件フラグが1であるかどうかを判断し、1ならば処理をS521に移し、1でなければS523に処理を移す。
【0092】
S521において、CPU101は、録音推奨条件フラグが1であるマイクIDの音声を現在録音中かどうかを判断し、録音中ならば処理をS522に移し、録音中で無ければS524に処理を移す。すなわち、記録中か否かを示す記録状態に応じて、処理を分岐する
【0093】
S522において、CPU101は、録音中のマイクIDを今後表示するマイクIDに選択せず、S526に処理を移す。
【0094】
S523において、CPU101は、録音推奨条件フラグが0であるマイクIDの音声を現在録音中かどうかを判断し、録音中ならば処理をS524に移し、録音中でなければS525に処理を移す。すなわち、記録中か否かを示す記録状態に応じて、処理を分岐する。
【0095】
S524において、CPU101は、録音中でないマイクIDを今後表示するマイクIDに選択し、S526に処理を移す。
【0096】
S525において、CPU101は、録音中でないマイクIDを今後表示するマイクIDに選択せず、S526に処理を移す。
【0097】
ステップS519〜S521、S523により、CPU101は、所定時間以上継続して所定音量レベル以上の音声が検出されたか否かを判別している。
【0098】
S526において、CPU101は、今後表示するように選択したマイクIDの個数が所定数以下かどうかを判断し、以下ならば処理をS527に移し、以下でなければS528に処理を移す。
【0099】
S527において、CPU101は、今回検出されたマイクIDの全てについて表示/非表示の選択が完了したかどうかを判断し、完了していれば処理をS528に移し、完了していなければS519に処理を移す。
【0100】
S528において、CPU101は、今回のマイク選択処理で表示と選択したマイクIDを保存し、処理を終える。
【0101】
このように、録音推奨条件を満たしているマイクIDが非録音中の場合、記録オン操作できるように操作アイコンの表示を選択する。また、録音推奨条件を満たしていないマイクIDが録音中の場合、記録オフ操作できるように、操作アイコンの表示を選択する。録音推奨条件を満たしているマイクIDが既に録音中の場合、操作の必要が無いので、操作アイコンの非表示を選択する。録音推奨条件を満たしていない非録音中のマイクIDも操作の必要が無いので、操作アイコンの非表示を選択する。
【0102】
図7は、図4、図5A及び図5Bに示すフローチャートに示す処理に対する操作部105とディスプレイ108を兼ねるタッチパネルの動作を視覚的に説明する模式図である。図8は、図7に示す模式図の動作状態を示すタイムチャートである。図7及び図8を参照して説明する動作は、CPU101がハードディスク102に格納されたプログラムをメモリ103に展開して実行し、表示制御部104を制御することにより実現される。
【0103】
図7(1)に示す表示例では、3人の人物(被写体)701,702,703とマイク操作アイコン704,705が表示されている。これは、撮影視野内に人物(被写体)703がいる状態で人物701,702が新たに入った状況である。但し、この表示以前のマイク操作アイコンは非表示であり、検出から非検出へ変化した被写体は無く、検出を継続の被写体は無く、人物703が非検出を継続している。
【0104】
例えば、ステップS505における所定数を2とすると、マイク操作アイコンの最大表示数が2個となる。従って、ステップS505において表示するマイク操作アイコンとしては、人物701,702のマイクが選択される。
【0105】
図7(1)に示す表示例は、S410において、CPU101が表示制御部104に送った、ディスプレイ108上にマイク操作アイコン704,705を撮影映像に重畳して表示する表示制御信号に相当する。
【0106】
CPU101は、人物701に対応するマイク操作アイコン704がタッチされたのを検出すると、表示制御部104を制御して、図7(2)に示すような画面をディスプレイ108に表示させる。図7(2)に示す表示例は、人物701のマイク非録音状態であり、CPU101は、人物701のマイクに対するマイク操作アイコンを、録音開始操作を指示する操作アイコン706に変更する。
【0107】
CPU101は、マイク操作アイコン706がタッチされたのを検出すると、対応するマイクからの音声の録音を開始するように音声処理部111を制御する。他方、CPU101は、所定時間経過してもマイク操作アイコン706がタッチされたのを検出できなければ、図7(1)に示す表示に戻す。
【0108】
図7(3)に示す表示例は、図7(1)に示す状態の後で、人物701のマイク音声を録音していながら、人物701,702が撮影視野から外れた状態を示す。人物701,702が検出から非検出に変化し、非検出から検出へ変化した被写体は無く、検出を継続の被写体は無く、被写体703は非検出を継続している。人物701のマイクからの音声を録音中なので、人物701が撮影視野から外れても、S514において表示中のマイク操作アイコン704が表示用に選択される。仮に、元々非録音の人物703が撮影視野から消えても、人物703に対応するマイク操作アイコンは、S514で表示用には選択されない。
【0109】
CPU101は、図7(3)に示す状態でマイク操作アイコン704がタッチされたのを検出すると、図7(4)に示すような画面になるように表示制御部104を制御する。図7(4)は、図7(3)に示すマイク操作アイコン704を、録音停止を指示するマイク操作アイコン707に切り替えたものになっている。CPU101は、図7(4)のマイク操作アイコン707がタッチされたのを検出すると、対応するマイクからの音声の録音を終了するように音声処理部111を制御する。また、所定時間経過してもマイク操作アイコン707がタッチされたのを検出しない場合、CPU101は、図7(4)に示すマイク操作アイコン707から図7(3)に示すマイク操作アイコン704に戻す。
【0110】
図8(A)は、図7(1)〜(3)に相当するタイムチャートを示す。横軸は時間である。(1)検出状態はマイクが検出されたか、されていないかの状態を示す。(2)録音状態はマイク録音有無の状態を示す。(3)解析状態はマイク音声解析結果の状態を示す。(4)表示状態はアイコン表示有無の状態を示す。
【0111】
タイミングT1までは、(1)検出状態が(1)−1、(1)−2のように非検出、(2)録音状態は(2)−1、(2)−2のように非録音、(3)解析状態は(3)−1、(3)−2のように非解析である。よって(4)表示状態は(4)−1、(4)−2のように非表示となる。
【0112】
タイミングT1から、(1)検出状態が(1)−1、(1)−2のようにA MIC検出とC MIC検出となる。最大表示数の2以下なので、(4)表示状態は(4)−1、(4)−2のようにA MIC操作アイコンとC MIC操作アイコン共に表示され始める。
【0113】
タイミングT2において、(3)解析状態が(3)−1、(3)−2のようにA MIC録音推奨とC MIC録音推奨となる。しかし、以前から表示しているので、(4)表示状態は(4)−1、(4)−2のようにA MIC操作アイコンとC MIC操作アイコン表示で維持される。
【0114】
タイミングT3において、(3)解析状態が(3)−1のようにA MIC録音推奨である。しかし、利用者操作により(2)録音状態が(2)−1のようにA MIC録音にされたので、(4)−1のようにA MIC操作アイコンは表示されなくなる。(3)解析状態が(3)−2のようにC MIC録音推奨であるのに(2)録音状態が(2)−2のようにC MIC非録音のままなので、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示され続ける。
【0115】
タイミングT4において、(1)検出状態が(1)−2のようにC MIC非検出となる。しかし、もともと(2)録音状態が(2)−2のようにC MIC非録音なので、(3)解析状態は(3)−2のように解析を止めるだけとなる。また、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示されなくなる。
【0116】
タイミングT5において、(1)検出状態が(1)−1のようにA MIC非検出となったのに、(2)録音状態が(2)−1のようにA MIC録音を継続している。これにより、(3)解析状態は(3)−2のように解析をやめる一方、(4)表示状態は(4)−1のようにA MIC操作アイコンが表示し続ける。
【0117】
図7(5)に示す表示例では、人物(被写体)701,702,709,710の検出を継続している。また、録音推奨条件フラグが1になっているのは人物701,709である。録音推奨条件フラグが0になっているのは被写体702,710であり、録音中なのは人物702,709である。
【0118】
例としてマイク操作アイコンの最大表示数を2個とすると、録音推奨条件フラグ1であるのに録音していない人物701のマイク操作アイコンは、S521において表示用に選択される。録音推奨条件フラグ0であるのに録音し続けている人物702のマイク操作アイコンは、S523において表示用に選択される。録音推奨条件フラグ1であって既に録音中で状況に変化が無い人物709のマイク操作アイコンは、S521において非表示に選択される。録音推奨条件フラグ0であるが、元々非録音で状況に変化が無い人物710のマイク操作アイコンは、S523において非表示に選択される。
【0119】
図7(5)に示す画面は、CPU101がディスプレイ108上に選択結果に応じてマイク操作アイコン704,705を表示するような表示制御信号を表示制御部104に送ることで実現される。
【0120】
CPU101は、図7(5)に示す画面でマイク操作アイコン704がタッチされたのを検出すると、図7(6)に示す画面になるように表示制御部104を制御する。また、CPU101は、図7(5)に示す画面でマイク操作アイコン705がタッチされたのを検出すると、図7(7)に示す画面になるように表示制御部104を制御する。
【0121】
図7(6)に示す画面は、録音推奨状態であるのに録音をしていない例である。すなわち、CPU101は、ディスプレイ108上にマイク操作アイコン706を表示する表示制御信号を表示制御部104に送り、マイク操作アイコン704,705が録音開始を指示する操作アイコン706に切り替えられる。
【0122】
CPU101は、図7(6)に示す画面でマイク操作アイコン706がタッチされたのを検出すると、対応するマイクからの音声の録音を開始するように音声処理部111を制御する。CPU101は、所定時間経過しても、図7(6)に示す画面のマイク操作アイコン706がタッチされたのを検出できなければ、図7(5)に示す表示状態に戻す。
【0123】
図7(7)に示す画面は、録音非推奨状態なのに録音し続けている例である。すなわち、CPU101は、ディスプレイ108上にマイク操作アイコン711を表示する表示制御信号を表示制御部104に送り、マイク操作アイコン704,705が録音終了を指示する操作アイコンに切り替えられる。
【0124】
CPU101は、図7(7)に示す画面のマイク操作アイコン711がタッチされたのを検出すると、対応するマイクからの音声の録音を終了するように音声処理部111を制御する。CPU101は、所定時間経過しても、マイク操作アイコン711がタッチされたのを検出できなければ、図7(5)に示す表示状態に戻す。
【0125】
図8(B)は、図7(5)に示す画面のタイミング付近に相当するタイムチャートを示す。横軸は時間である。
【0126】
タイミングT6までは、(1)検出状態として、(1)−1、(1)−2、(1)−3、(1)−4のようにA MIC、C MIC、D MIC、E MICと4つのマイクが検出されている。(2)録音状態として、(2)−1、(2)−3のように、A MICとEMICは非録音、(2)−2、(2)−3のようにC MICとD MICは録音している。(3)解析状態として、(3)−1、(3)−3のようにA MICとD MICは録音推奨状態、(3)−2、(3)−4のようにC MICとE MICは非録音推奨状態である。従って(4)表示状態として、(4)−1、(4)−2のようにA MICとC MICは表示、D MICとE MICは表示していない。
【0127】
タイミングT6において、(1)検出状態は変化していない。しかし、利用者操作により、(2)録音状態が(2)−1のようにA MIC録音にされて(3)解析状態は(3)−1のようにA MIC録音推奨状態のままである。従って、(4)表示状態は(4)−1のようにA MIC操作アイコンは表示されなくなる。
【0128】
タイミングT7において、(1)検出状態が変化していないが、利用者操作により(2)録音状態が(2)−2のようにC MIC非録音とされ、(3)解析状態は(3)−2のようにC MIC非録音推奨状態のままである。従って、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示されなくなる。
【0129】
図5A及び図5Bに示すフローチャートでは、音声解析結果のみで表示アイコンを選択している。しかし、図3に示すように個人認証データベース上で優先順位を付けておき、音声解析結果と優先順位の高さを条件として絞り込むことも可能である。
【0130】
図9は、通信品質順位例を示す。通信装置107が通信エラー発生回数をカウントし、CPU101の制御に基づき、図9に示すような通信品質順位表が、メモリ103へ書き込まれる。
【0131】
図5A及び図5Bに示すフローチャートでは、音声解析結果のみで表示アイコンを選択している。しかし、図9に示すように、通信エラー発生回数により通信品質順位を付けておき、音声解析結果と通信品質順位の高さを条件として絞り込むことも可能である。
【0132】
図10は、マイク毎の録音時間の順序付け例を示す。付加情報として映像と共に記録するためにマイク毎の録音時間が、CPU101の制御に基づき、図10に示すような表としてメモリ103に書き込まれる。
【0133】
図5A及び図5Bに示すフローチャートでは、音声解析結果のみで表示アイコンを選択している。しかし、図10に示すように、マイク毎の録音時間として順位を付けておき、音声解析結果と録音機会が少ない順を条件として絞り込むことも可能である。
【0134】
図11は、図5A及び図5Bに示すフローチャートの表示条件と結果の分類表を示す。マイク検出状態、マイク検出数、マイク録音状態、及び、音声解析結果による録音推奨/非推奨により、表示の有無が決定される。
【0135】
CPU101は、操作アイコン表示のための上記条件に加えて、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上を考慮しても良い。
【0136】
以上のように、本実施例では、ワイヤレスマイク等により得られた音声信号を示す操作アイコンを、音声が所定時間、所定音量条件を継続するという条件を満たすときに表示するようにした。これにより、画面に不必要なアイコンが表示され被写体自体を見にくくしてしまう可能性を低減できる。本実施例の制御はまた、タッチパネル操作に限らず、ジョグキー操作でマイク操作する場合にも有効である。
【実施例2】
【0137】
映像再生時に、複数の記録済みの音声の中から被写体検出結果と音声解析結果に基づいて選択的に音声操作アイコンを表示し、アイコン操作により音声を選択的に再生する実施例を説明する。
【0138】
実施例1と同様に図3に示すような個人認証データベースを持つとする。すなわち、特徴データX1である人は人物Aであり、人物AならばID1のマイクを装着している。特徴データX2である人は人物Bであり、人物Bならばマイクを装着していないことが判断できる。これにより、再生映像中に特定個人の顔があるかどうかを個人認証すれば、特定のワイヤレスマイクIDを持つマイクが装着されていたかどうかが判断できる。
【0139】
再生中に表示するべき操作アイコンを表示制御するCPU101における処理は、図4に示すフローチャート同様である。図12A及び図12Bは、図4のS409において、CPU101が行う、再生中に表示が必要なマイクIDの選択処理の詳細フローチャートである。
【0140】
S1201において、CPU101は、前回以前の選択処理で表示と選択され、現在既に表示中のマイク操作アイコンのマイクIDを取得し、S1202に処理を移す。
【0141】
S1202において、CPU101は、今回検出した選択処理対象のマイクIDを取得し、S1203に処理を移す。
【0142】
S1203において、CPU101は、今回、選択処理対象のマイクIDが検出されているかどうかを判断し、いれば処理をS1210に移し、いなければS1204に処理を移す。
【0143】
S1204において、CPU101は、現在既にマイク操作アイコンを表示中かどうか判断し、表示していれば処理をS1205に移し、なければS1209に処理を移す。
【0144】
S1205において、CPU101は、現在表示中のマイク操作アイコンのマイクIDの音声は再生中かどうかを判断し、再生中ならば処理をS1206に移し、なければS1207に処理を移す。ここで再生中とは音声出力中を意味する。すなわち、CPU101によってドライブ装置106から読みとられて伸長処理されてメモリ103に書き込んでいることを指すのではない。再生中は、伸長処理されてメモリ103に書き込まれている再生音声データを音声処理部111がCPU101によって他のマイク音とミキシングし、スピーカ(不図示)に出力していることを指す。他方、再生していない状態とは、CPU101によってドライブ装置106から読みとられて伸長処理されてメモリ103へ書き込んでいないことを指すのではない。伸長処理されてメモリ103へ書き込まれている再生音声データを音声処理部111がCPU101によって他のマイク音とミキシングせず、そのマイク音声がスピーカ(不図示)に出力されていないことを指す。
【0145】
S1206において、CPU101は、再生中のマイクIDを今後も表示するマイクIDに選択し、S1208に処理を移す。
【0146】
S1207において、CPU101は、再生中にないマイクIDを今後表示するマイクIDに選択せず、S1208に処理を移す。
【0147】
S1208において、CPU101は、現在既に表示中の全マイク操作アイコンのマイクIDについて表示/非表示の選択が完了したかどうかを判断する。完了していれば処理をS1209に移し、完了していなければS1205に処理を移す。
【0148】
S1209において、CPU101は、今回のマイク選択処理で表示と選択したマイクIDを保存し、処理を終える。
【0149】
このように今まで操作アイコンを表示していたが画角外へ消えたマイクIDの音が現在再生中なら再生オフ操作できるように表示用に選択する。他方、非再生中なら、消えただけなので、非表示に選択する。
【0150】
S1210において、CPU101は、現在既にマイク操作アイコンを表示中かどうか判断し、していれば処理をS1211に移し、していなければS1217に処理を移す。
【0151】
S1211において、CPU101は、S1201,S1202で取得したマイクIDから現在既に表示中で今回検出されないマイクID、即ち被写体が消失したマイクIDを抽出し、S1212に処理を移す。
【0152】
S1212において、CPU101は、現在表示中で今回検出されない消失マイクIDの音声が再生中かどうかを判断し、再生中ならば処理をS1213に移し、再生中でなければS1214に処理を移す。
【0153】
S1213において、CPU101は、再生中のマイクIDを今後も表示するマイクIDに選択し、S1215に処理を移す。
【0154】
S1214において、CPU101は、再生中でないマイクIDを今後表示するマイクIDに選択せず、S1215に処理を移す。
【0155】
S1215において、CPU101は、表示と選択したマイクIDの個数が所定数以下かどうかを判断する。所定数以下ならば、処理をS1216へ移し、以下でなければS1226に処理を移す。
【0156】
S1216において、CPU101は、現在表示中で今回検出されない全消失マイクIDについて表示/非表示の選択が終わったかどうか判断し、終わっていれば処理をS1217に移し、終わっていなければS1212に処理を移す。
【0157】
このように今まで操作アイコンを表示していたが画角外へ消えた被写体に相当するマイクIDの音声が現在再生中の場合、再生オフ操作できるように表示を選択する。他方、非再生中の場合、消えただけなので、非表示を選択する。
【0158】
S1217において、CPU101は、検出したマイクIDの記録済み音声の音声解析を行い、S1218に処理を移す。
【0159】
図13は図12BのS1217においてCPU101が行う記録済み音声の音声解析の説明に使う模式図である。
【0160】
図13(1)は、メモリ103に書き込まれるマイクID1のマイク再生音声データのマイク再生レベル1301の変化例を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、メモリ103に書き込まれるマイク再生音声のマイク再生レベル1301を人の声の濾過周波数特性を持つフィルタ処理を施した後、音量レベルを検知する。CPU101又は音声処理部111は、音声信号を解析する音声解析手段として機能する。
【0161】
図13(2)は、検知された再生音量レベル1302を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、音量レベル1302を示すデータ(検知レベルデータ)をメモリ103に書き込む。CPU101は、メモリ103に記憶される検知レベル1302に対して、閾値超えタイマ計測処理を実行する。具体的には、CPU101は、検知レベル1302が閾値Thを超えたら計時を開始し、所定時間で計時を停止し、Th未満になると計時値(カウント値)をクリアする。図13(3)は、閾値超えタイマ計測処理で得られるカウント値1303の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0162】
また、CPU101は、メモリ103に書き込まれた検知レベル1302に対し閾値未満タイマ計測処理を実行する。具体的には、CPU101は、メモリ103に書き込まれた検知レベル1302が閾値Th未満になると、計時を開始し、所定時間で計測を停止し、閾値Thを超えると、計時値(カウント値)をクリアする。図13(4)は、閾値未満タイマ計測処理で得られるカウント値1304の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0163】
CPU101は、閾値超えタイマカウント値1303がTon1を超えると録音推奨条件フラグを1とし、閾値未満タイマカウント値1304がToff1を超えると録音推奨条件フラグを0とする。図13(5)は、録音推奨条件フラグ1305の変化例を示す。縦軸はフラグ値を示し、横軸は時間を示す。
【0164】
S1218において、CPU101は、検出したマイクIDの再生推奨条件フラグが1であるかどうかを判断し、1ならば処理をS1219に移し、1でなければS1221に処理を移す。
【0165】
S1219において、CPU101は、再生推奨条件フラグが1とされた検出したマイクIDの音声が現在、再生中かどうかを判断し、再生中ならば処理をS1220に移し、再生中でなければS1222に処理を移す。
【0166】
S1220において、CPU101は、再生中のマイクIDを今後の表示用に選択せず、S1224に処理を移す。
【0167】
S1222において、CPU101は、再生中でないマイクIDを今後の表示用に選択し、S1224に処理を移す。
【0168】
S1221において、CPU101は、再生推奨条件フラグが0とされた検出マイクIDの音声が現在、再生中かどうかを判断し、再生中ならば処理をS1222へ移し、再生中でなければS1223に処理を移す。
【0169】
S1222において、CPU101は、再生中のマイクIDを今後の表示用に選択し、S1224に処理を移す。
【0170】
S1223において、CPU101は、再生中でないマイクIDを今後の表示用に選択せず、S1224に処理を移す。
【0171】
ステップS1217〜S1219、S1221により、CPU101は、所定時間以上継続して所定音量レベル以上の音声が検出されたか否かを判別している。
【0172】
S1224において、CPU101は、今後の表示用に選択したマイクIDの個数が所定数以下かどうかを判断し、以下ならば処理をS1225に移し、以下でなければS1226に処理を移す。
【0173】
S1225において、CPU101は、検出マイクIDの全てについて表示/非表示の選択が完了したかどうかを判断し、完了していれば処理をS1226に移し、完了していなければS1217に処理を移す。
【0174】
S1226において、CPU101は、今回のマイク選択処理で表示すると選択したマイクIDを保存し、処理を終える。
【0175】
このように、再生推奨条件を満たしているマイクIDの音声が非再生中なら再生オン操作できるように、表示用に選択する。他方、再生推奨条件を満たしていないマイクIDの音声が再生中なら、再生オフ操作できるように、今後表示するように選択する。
【0176】
再生推奨条件を満たしているマイクIDの音声が既に再生中の場合、操作の必要が無いので、今後表示を消すように選択する。他方、再生推奨条件を満たしていない非再生中のマイクIDの音声は、操作の必要が無いので、今後表示を消すように選択する。
【0177】
図14は、図12A及び図12Bに示すフローチャートの表示条件と結果の分類表を示す。マイク検出状態、マイク再生状態、及び、音声解析結果による再生推奨/非推奨の条件に従い、表示の有無が決定される。
【0178】
図15(A)は、図4、図12A及び図12Bのフローチャートを実施した時の操作部105とディスプレイ108を兼ねるタッチパネルの動作イメージ図、図15(B)はその動作状態を示したタイムチャートである。
【0179】
図15(A)(1)は、ディスプレイ108の画面例を示す。この画面例では、人物(被写体)1501,1502,1509,1510のマイク装着の検出を継続になっている。再生推奨条件フラグが1になっているのは人物(被写体)1501,1509である。再生推奨条件フラグが0になっているのは人物(被写体)1502,1510である。再生中なのは人物(被写体)1502,1509の音声である。
【0180】
例としてマイク操作アイコンの最大表示数を2個とすると、再生推奨条件フラグ1であるのに音声を再生していない人物1501のマイク操作アイコンが、S1219において表示用に選択される。再生推奨条件フラグ0であるのに音声を再生し続けている人物1502のマイク操作アイコンは、S1221において表示用に選択される。再生推奨条件フラグ1であって既に再生中で状況に変化が無い人物(被写体)1509のマイク操作アイコンは、S1219において非表示に選択される。再生推奨条件フラグ0であるが、元々非再生で状況に変化が無い人物(被写体)1510のマイク操作アイコンは、S1221において非表示に選択される。
【0181】
図15(A)(1)では、人物1501のマイク操作アイコン1504と、人物1503のマイク操作アイコン1505が表示されている。この画面は、CPU101がディスプレイ108上に選択結果に応じてマイク操作アイコン1504,1505を表示するような表示制御信号を表示制御部104に送ることで実現される。
【0182】
CPU101は、図15(A)(1)に示す画面でマイク操作アイコン1504がタッチされたのを検出すると、図15(A)(2)に示す画面になるように表示制御部104を制御する。CPU101はまた、図15(A)(1)に示す画面でマイク操作アイコン1505がタッチされたのを検出すると、図15(A)(3)に示す画面になるように表示制御部104を制御する。
【0183】
図15(A)(2)は、人物1501(人物A)の音声が非再生状態の画面例を示す。CPU101がディスプレイ108上にマイク操作アイコン1506を表示するような表示制御信号を表示制御部104に送り、マイク操作アイコン1504,1505が、再生開始を指示するマイク操作アイコン1506に切り替えられる。
【0184】
CPU101は、マイク操作アイコン1506がタッチされたのを検出すると、対応するマイクの音声の再生を開始するように音声処理部111を制御する。CPU101は、所定時間経過しても、マイク操作アイコン1506がタッチされたのを検出できなければ、図15(A)(1)に示す表示状態に戻す。
【0185】
図15(A)(3)は、再生推奨状態にないのに人物1501(人物A)の音声を再生し続けているときの画面例を示す。CPU101がディスプレイ108上にマイク操作アイコン1511を表示するような表示制御信号を表示制御部104に送り、マイク操作アイコン1504,1505が、再生終了を指示するマイク操作アイコン1511に切り替えられる。
【0186】
CPU101は、マイク操作アイコン1511がタッチされたのを検出すると、対応する音声の再生を終了するように音声処理部111を制御する。CPU101は、所定時間経過しても、マイク操作アイコン1511がタッチされたのを検出できない場合、図15(A)(1)に示す表示状態に戻す。
【0187】
図15(B)は、図15(A)(1)に示す画面のタイミング付近に相当するタイムチャートを示す。横軸は時間である。
【0188】
タイミングT1までは、(1)検出状態として、(1)−1、(1)−2、(1)−3、(1)−4のようにA MIC、C MIC、D MIC及びE MICの4つのマイク音声が検出されている。なお、撮影時に全チャンネル分の音声が画像ファイルと関連付けた個別ファイルとして記録済みである。再生時には、個別に音声状態の解析と、再生のオン/オフを指示できる。
【0189】
(2)再生状態として、各チャンネル別に(2)−1、(2)−3のようにA MICとE MICは非再生であり、(2)−2、(2)−3のようにC MICとD MICは再生中である。
【0190】
(3)解析状態として、(3)−1、(3)−3のようにA MICとD MICは再生推奨状態であり、(3)−2、(3)−4のようにC MICとE MICは非再生推奨状態である。
【0191】
従って、(4)表示状態として、(4)−1、(4)−2のようにA MICとC MICのマイク操作アイコンは表示され、D MICとE MICのマイク操作アイコンは表示されない。
【0192】
タイミングT1において、(1)検出状態が変化していない。しかし、利用者操作により(2)再生状態が(2)−1のようにA MIC再生に変更されて、(3)解析状態は(3)−1のようにA MIC再生推奨状態のままである。これにより、(4)表示状態は(4)−1のようにA MIC操作アイコンは表示されなくなる。
【0193】
タイミングT2において、(1)検出状態が変化していない。しかし、利用者操作により(2)再生状態が(2)−2のようにC MIC非再生とされ、(3)解析状態は(3)−2のようにC MIC非再生推奨状態のままである。これにより、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示されなくなる。
【0194】
図16は、マイク毎の滞在時間の順位表の一例を示す。CPU101は、画角内の被写体の検出時間をカウントし、図16に示すような滞在時間の順位表をメモリ103に書き込む。図12A及び図12Bに示すフローチャートでは、音声解析結果のみで操作アイコンを選択している。図16に示すようにマイク毎の滞在時間として順位を付けておき、音声解析結果と滞在時間が短い順を条件としてなるべく新しい登場人物に絞り込むことも可能である。
【0195】
図17は、画面内での位置に応じて操作アイコン表示数を設定するエリア別表示数制限の概念図である。図12A及び図12Bに示すフローチャートでは、画面全体でマイク操作アイコン表示数を所定数に制限している。しかし、図17に示すように、マイクが検出される画角内の位置に応じて左右エリアは1個ずつ、中央は2個といったような制限を加えることも可能である。
【0196】
CPU101は、操作アイコン表示のための上記条件に加えて、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上を考慮しても良い。
【0197】
以上の説明から容易に理解できるように,本実施例では、音声信号が所定時間、所定音量条件を継続するという条件を満たすときに、追加と解除可能な音声信号の存在を示すアイコンを選択的に表示する。これにより、画面が不必要なアイコンの表示により見にくくなってしまう可能性を低減できる。
【0198】
カメラの再生操作例を説明したが、パソコンやテレビに組み込まれる再生装置に適用可能である。
【技術分野】
【0001】
本発明は、画像処理装置に関し、特に、画像表示装置に画像と当該画像に関連する音声の操作のためのアイコンとを表示させる画像処理に関する。
【背景技術】
【0002】
従来、撮像装置のように撮像した画像を表示装置に表示することが知られている。これらの撮像装置には、マイクにより得られる周囲の音声を画像とともに記録する機能が搭載されている。音声入力手段としてわいやれるマイクも使用するようになった。
【0003】
特許文献1には、被写体を表示する画面上にワイヤレスマイクを示すアイコンを表示し、当該アイコンを操作することにより、音声記録に使用するワイヤレスマイクを選択する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−054567号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の技術では、ワイヤレスマイクが検出すると、無条件にアイコンを画面上に表示するようになっている。この結果、音声記録に使用するワイヤレスマイクのアイコンも、使用しないワイヤレスマイクのアイコンも、撮影中に常時表示されることになり、構図及び被写体を確認しづらくなってしまう。
【0006】
本発明は、このような不都合を解消する画像処理装置を提示することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る表示画像処理装置は、画像信号を取得する画像取得手段と、前記画像信号に関連する複数の音声信号を取得する音声取得手段と、前記画像信号に基づく画像を表示装置に表示させる表示制御手段と、前記画像信号から特定被写体を検出する被写体検出手段と、前記音声信号を解析する音声解析手段と、前記複数の音声信号のうちの、選択した音声信号を記録する記録手段と、前記音声信号の解析結果及び記録状態並びに前記被写体検出手段の検出結果に応じて、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御する制御手段とを備えることを特徴とする。
【発明の効果】
【0008】
本発明によれば、たとえば、ワイヤレスマイク等により得られた音声信号を示すアイコンとして、必要である可能性の高いアイコンを優先して表示することができる。これにより、画面が不必要なアイコンの表示により見にくくなってしまう可能性を低減できる。
【図面の簡単な説明】
【0009】
【図1】本発明に係る画像処理装置の一実施例の概略構成ブロック図を示す。
【図2】顔に関連付けてマイクを予め登録するCPU処理のフローチャートである。
【図3】個人認証データベースの模式図である。
【図4】表示すべき操作アイコンを表示制御するCPU処理のフローチャートである。
【図5A】撮影中に表示するマイクの選択処理のフローチャートである。
【図5B】撮影中に表示するマイクの選択処理のフローチャートである。
【図6】音声解析処理の説明用模式図である。
【図7】タッチパネル上で見た動作説明図である。
【図8】図7で説明する動作状態を示すタイムチャートである。
【図9】通信品質順位例である。
【図10】マイク毎の録音時間の順序付け例である。
【図11】表示条件と結果の分類表である。
【図12A】再生中に表示するマイクの選択処理のフローチャートである。
【図12B】再生中に表示するマイクの選択処理のフローチャートである。
【図13】記録済み音声の音声解析の説明用模式図である。
【図14】表示条件と結果の分類表である。
【図15】タッチパネル上で見た動作説明の画面例とタイムチャートである。
【図16】マイク毎の滞在時間の順位表の一例である。
【図17】画面内での位置に応じて操作アイコン表示数を設定するエリア別表示数制限の概念図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、本発明の実施例を詳細に説明する。
【実施例1】
【0011】
図1は、本発明に係る画像処理装置の一実施例の概略構成ブロック図を示す。撮像装置100に本発明に係る画像処理装置の一実施例が組み込まれているが、一般的な情報処理装置(例えば、パーソナルコンピュータ、携帯電話、スマートフォンなど)にも組み込み可能である。
【0012】
内部バス109に、CPU101、ハードディスク(HDD)102、メモリ103、表示制御部104、操作部105、ドライブ装置106、通信装置107、映像処理部110、音声処理部111及び撮像部120が接続する。内部バス109に接続される各部は、内部バス109を介して互いにデータのやりとりを行うことができる。
【0013】
ハードディスク102には、顔検出パターンデータ、個人認証データベース、映像音声データ、その他のデータ、及びCPU101が動作するための各種プログラムなどが格納される。ハードディスク102の代わりに、不揮発性の記録媒体であればどのようなものであっても良い。顔検出パターンデータとは、顔検出のパターンマッチングに使うデータである。顔検出については後述する。個人認証データベースとは、検出した顔に対して人物認証を行う特徴データが登録されているデータベースである。個人認証については後述する。
【0014】
メモリ103は、例えばRAMからなる。表示制御手段、変更手段および音声解析手段としてのCPU101は、例えばハードディスク102に格納されるプログラムに従い、メモリ103をワークメモリとして用いて、撮像装置100の各部を制御する。CPU101上で動作するプログラムは、ハードディスク102に格納されるのに限られず、例えば図示されないROMに予め記憶しておいてもよい。
【0015】
操作部105は、使用者の操作を受け付け、操作に応じた制御信号を生成し、CPU101に供給する。例えば、操作部105は、使用者の操作を受け付ける入力デバイスとして、キーボードといった文字情報入力デバイス、及び、マウスやタッチパネルといったポインティングデバイスなどを有する。タッチパネルは、例えば平面的に構成された操作部に対して接触された位置に応じた座標情報が出力されるようにした入力デバイスである。
【0016】
CPU101は、入力デバイスに対してなされた使用者の操作に応じて操作部105で生成され供給される制御信号に基づき、プログラムに従い、撮像装置100の各部を制御する。これにより、CPU101は、撮像装置100に対し、使用者の操作に応じた動作を行わせることができる。
【0017】
表示制御部104は、ディスプレイ108に画像を表示させるための表示信号を出力する。例えば、CPU101は、プログラムに従い生成した表示制御信号を表示制御部104に供給する。表示制御部104は、CPU101からの表示制御信号に基づき表示信号を生成してディスプレイ108に出力する。
【0018】
例えば、表示制御部104は、CPU101が生成する表示制御信号に基づき、GUI(Graphical User Interface)を構成するGUI画面をディスプレイ108に表示させる。
【0019】
操作部105としてタッチパネルを用いる場合、操作部105とディスプレイ108とを一体的に構成することができる。例えば、タッチパネルを光の透過率がディスプレイ108の表示を妨げないように構成し、ディスプレイ108の表示面の上層に取り付ける。そして、タッチパネルにおける入力座標と、ディスプレイ108上の表示座標とを対応付ける。これにより、恰も使用者がディスプレイ108上に表示された画面を直接的に操作可能であるかのようなGUIを構成することができる。
【0020】
操作部105がタッチパネルである場合、CPU101は、タッチパネルへの以下の操作を検出できる。タッチパネルを指やペンで触れる操作を、以下、タッチダウンと称する。タッチパネルを指やペンで触れている状態であることを、以下、タッチオンと称する。タッチパネルを指やペンで触れたまま移動することを、以下、ムーブと称する。タッチパネルへ触れていた指やペンを離したことを、以下、タッチアップと称する。タッチパネルに何も触れていない状態を、以下、タッチオフと称する。
【0021】
これらの操作と、タッチパネル上に指やペンが触れている位置座標は、内部バス109を通じて、CPU101に通知され、CPU101は、通知された情報に基づいてタッチパネル上にどのような操作が行なわれたかを判定する。
【0022】
ムーブについては、タッチパネル上で移動する指やペンの移動方向についても、位置座標の変化に基づいて、タッチパネル上の垂直成分・水平成分毎に判定できる。タッチパネル上をタッチダウンから一定のムーブを経てタッチアップをしたとき、ストロークを描いたこととする。素早くストロークを描く操作をフリックと呼ぶ。フリックは、タッチパネル上に指を触れたままある程度の距離だけ素早く動かして、そのまま離すといった操作であり、言い換えればタッチパネル上を指ではじくように素早くなぞる操作である。所定距離以上を、所定速度以上でムーブしたことが検出され、そのままタッチアップが検出されると、フリックが行なわれたと判定できる。また、所定距離以上を、所定速度未満でムーブしたことが検出された場合はドラッグが行なわれたと判定するものとする。
【0023】
ドライブ装置106は、CDやDVDといったディスク状の外部記憶媒体(不図示)を駆動する装置である。ドライブ装置106は、CPU101の制御に基づき、装着された外部記憶媒体にデータを読み書きする。ドライブ装置106の代わりに、例えばメモリカードなどの不揮発性半導体メモリを接続するインターフェース又は接続装置を用いても良い。
【0024】
通信装置107は、CPU101の制御に基づき、ワイヤレスマイク(不図示)との通信を行い、ワイヤレスマイクが取り込んだ音声を示す音声データ(以下、マイク音声データという)をマイクID付きで受信する。CPU101の制御に基づき、通信装置107は、受信したマイク音声データを音声処理部111に転送し、受信したマイクIDはメモリ103に書き込む。通信装置107は、通信エラー発生回数をカウントし、CPU101の制御に基づき、所定時間当たりのエラー発生回数を通信品質としてメモリ103に書き込む。ワイヤレスマイク及び通信装置107は、撮像部120による撮影画像に関連する複数の音声信号を取得する音声取得手段として機能する。
【0025】
撮像部120は画像取得手段として機能し、被写体を撮像し、画像信号を出力する。映像処理部110は、撮影時には、CPU101の制御に基づき、撮像部120により得られる画像信号からなる動画信号をデジタルデータに変換し、メモリ103に書き込む。再生時には、映像処理部110は、CPU101の制御に基づき、ドライブ装置106から動画データを再生してメモリ103に書き込む。
【0026】
音声処理部111は、撮影時には、CPU101の制御に基づき、マイク音声データをデジタルデータへ変換し、メモリ103へ書き込む。再生時には、音声処理部111は、CPU101の制御に基づき、ドライブ装置106からマイク音声データを再生し、メモリ103へ書き込む。
【0027】
撮影時および再生時に、音声処理部111は、CPU101の制御に基づき、所定の濾過周波数特性を持つフィルタ処理を施した後で、マイク音声データの示す音声のレベルの検知を行う。音声処理部111は、検知した音声レベルを示すデータをメモリ103に書き込む。
【0028】
撮像装置100は、2種類の音声記録方法を利用できる。第1の方法では、音声処理部111は、CPU101の制御に基づき、操作部105で任意に選択した複数マイクのマイク音声を合成し、合成音声データをメモリ103に書き込む。撮影時には、CPU101は、メモリ103に書き込まれた画像データ、選択されたマイク音声データ、及びマイク毎の録音時間等の付加情報等のデジタルデータを、必要により圧縮処理して、ドライブ装置106に記録する。
【0029】
第2の方法では、音声処理部111は、CPU101の制御に基づき、受信した複数のマイク音声を別々のままメモリ103に書き込む。撮影時には、CPU101は、メモリ103に書き込まれた画像データ、複数のマイク音声データ及びマイク毎の録音時間等の付加情報等のデジタルデータを、必要により圧縮処理して、ドライブ装置106に記録する。
【0030】
撮影画像の圧縮記録処理と並行に、CPU101は、メモリ103に書き込まれた画像データを最適なサイズにリサイズ処理し、操作アイコンと顔枠等を重畳した表示制御信号を生成する。表示制御部104は、表示制御信号に従い、撮影画像に操作アイコンと顔枠等を重畳してディスプレイ108に表示させる。これにより、撮影者は、リアルタイムで撮影画像と、認識された顔及びその位置とを視覚的に確認でき、操作アイコンによる操作を行える。
【0031】
複数のマイク音声と付加情報等のデジタルデータは、撮影画像からなる動画データのメタデータに関連付けて記録される。再生時には、メタデータによって動画に同期したマイク音声データを検出でき、再生できる。
【0032】
ワイヤレスマイクを被写体人物に関連付けている場合、再生画像データから顔検出して個人認証することにより、マイクIDを判別でき、判別したマイクIDとメタデータからどのマイク音声データを解析すべきかも判別できる。
【0033】
再生時には、CPU101は、ドライブ装置106から記録データ(画像、音声及び付加情報等)を読み出し、必要により伸長処理して、メモリ103に書き込む。すなわち、CPUは、画像信号を取得する画像取得手段として機能し、更には、画像信号に関連する複数の音声信号を取得する音声取得手段として機能する。再生時の伸長処理と並行に、CPU101は、メモリ103に書き込まれた再生画像データを最適なサイズにリサイズ処理し、操作アイコンと顔枠等を重畳した表示制御信号を生成する。表示制御部104は、表示制御信号に従い、再生画像に操作アイコンと顔枠等を重畳してディスプレイ108に表示させる。これにより、撮影者は、再生画像を鑑賞しつつ、認識された顔及びその位置を視覚的に確認でき、操作アイコンによる操作を行える。
【0034】
CPU101は、メモリ103の画像データに顔検出を行い、顔検出結果をメモリ103に書きこむ。顔検出には、パターンマッチング等の公知の顔検出技術を適用できる。顔検出の結果は、例えば、画角内の座標及びサイズからなる。CPU101は、検出した顔画像をハードディスク102に記憶されている個人認証データベースと照合し、結果をメモリ103に書きこむ。この照合には、公知の顔認証技術を用いることができる。個人認証結果は、例えば、顔認識の類似度を示すデータからなる。顔以外の指定物体等の特定被写体を検出して特徴データを抽出する技術を使用することで、顔以外の指定物体の有無を検出できる。顔に限らず、特徴のパターンマッチング等の公知の物体認証を用いることで、形状が既知の特定物体の物体認証も行うことができる。
【0035】
本実施例の特徴的な動作を説明する。本実施例では、認識されているわいやれるマイク中、被写体検出結果と音声解析結果に基づいて決定した1又は複数のマイクに対応するマイク操作アイコンを表示する。ユーザは、表示されたマイク操作アイコンを操作して、記録に使用するマイクを選択する。
【0036】
操作部105又は不図示のリモートコントローラによりユーザが撮像装置100の電源を入れると、不図示の電源部が、撮像装置100の各部に電源を供給する。電源を入れてから記録開始する前に、顔に関連付けてマイクを予め登録しておく。図2は、顔に関連付けてマイクを予め登録するCPU101の処理のフローチャートである。図3は、個人認証データベースの模式図である。図2に示すフローチャートにおける各処理は、CPU101がハードディスク102に格納されたプログラムをメモリ103に展開して実行することにより実現される。
【0037】
S201において、CPU101は、ハードディスク102に記録されている以前に登録した既存マイク登録情報を初期化して、S202に処理を移す。
【0038】
S202において、CPU101は、登録したいワイヤレスマイクの送信を開始するように案内を表示する表示制御信号を表示制御部104に送り、S203に処理を移す。
【0039】
S203において、CPU101は、マイクIDを受信したかどうかを判断し、受信していれば処理をS204に移し、受信していなければS203に処理を移す。無線方式としてBluetooth(登録商標)を使用する場合、認証が行われるので、通信相手を特定できる。マイクIDは、特定したマイクに割り付ける識別情報を示す。
【0040】
S204において、CPU101は、受信したマイクIDと装着者とを対応付けるために、装着者の顔の撮影と確定を案内する表示の表示制御信号を表示制御部104に送り、S205に処理を移す。
【0041】
S205において、CPU101は、確定操作された撮影画像に唯一つの顔を検出したかどうかを判断し、検出していれば処理をS206に移し、検出していなければS204に処理を移す。
【0042】
S206において、CPU101は、検出された顔と個人認証データベースとの照合を行う個人認証処理を行い、S207に処理を移す。
【0043】
S207において、CPU101は、個人認証処理の結果、装着者の顔が既に特定個人の顔として個人認証データベースに登録済みであるかどうかを判断する。そして、登録されていれば処理をS209に移し、登録されていなければS208に処理を移す。
【0044】
S206,S207により、CPU101は、画像信号から特定被写体を検出する被写体検出手段として機能する。
【0045】
S208において、CPU101は、装着者の顔を新たに特定個人の顔として個人認証データベースに追加登録し、S209に処理を移す。
【0046】
S209において、CPU101は、個人認証データベースにマイク装着情報を追加し、S210に処理を移す。
【0047】
図3に示す例では、特徴データX1である人は人物Aであり、人物AはID1のマイクを装着している。特徴データX2である人は人物Bであり、人物Bはマイクを装着していない。このように画像中の人物の顔を個人認証することで、マイクが装着されている場合のマイクIDを特定できる。
【0048】
S210において、CPU101は、他の登録したいワイヤレスマイク送信を開始するように案内を表示させる表示制御信号を表示制御部104に送り、S211に処理を移す。
【0049】
S211において、CPU101は、待ち時間を計るタイマ(不図示)を開始して、S212に処理を移す。
【0050】
S212において、CPU101は、他のマイクIDを受信したかどうかを判断し、受信していれば処理をS204に移し、受信していなければS213に処理を移す。
【0051】
S213において、CPU101は、S211で設定したタイマがタイムアウトであるかどうかを判断し、タイムアウトであれば処理を終了し、タイムアウトでなければS212に処理を移す。
【0052】
以上のように、顔を検出して個人認証が出来る場合に、その人物が装着しているマイクを特定するデータベースを準備できる。顔に限らず、予め登録してある特定の物体として物体認証をすることで、画像内の物体に対するマイクの装着を検出出来る。例えば、ワイヤレスマイクそのものにマイク自体を特定するための模様や文字などが付加しても良い。また、ワイヤレスマイク自体に可視光外の光を発光する発光素子を備え、それぞれのワイヤレスマイクの発光素子がワイヤレスマイクを識別するためのパターン発光を行うようにしても良い。
【0053】
図4は、表示すべき操作アイコンを表示制御するCPU101の処理のフローチャートである。
【0054】
S401において、CPU101は、顔検出結果を読み込み、S402に処理を移す。
【0055】
S402において、CPU101は、検出結果にある顔と個人認証データベースとの照合を行う個人認証処理を行い、S403に処理を移す。
【0056】
S403において、CPU101は、検出結果にある顔に対し全て個人認証処理が終わったかどうかを判断し、終わっていれば処理をS404に移し、終わっていなければS402に処理を移す。
【0057】
S404において、CPU101は、マイク検出数を初期化して、S405に処理を移す。
【0058】
S405において、CPU101は、個人認証データベースを読みこみ、S406に処理を移す。
【0059】
S406において、CPU101は、検出された顔が個人認証データベースでマイク装着と登録されているかどうかを判断し、マイク装着と登録されていれば処理をS407に移し、登録されていなければS408に処理を移す。
【0060】
S407において、CPU101は、個人認証データベースからマイクIDを取得し、S408に処理を移す。
【0061】
S408において、CPU101は、個人認証済み顔全員分のマイク検出処理が終わったかどうかを判断し、終わっていれば処理をS409に移し、終わっていなければS405に処理を移す。
【0062】
S409において、CPU101は、表示が必要なマイクIDの選択処理を行い、S410に処理を移す。
【0063】
S410において、CPU101は、表示が必要であると選択されたマイクIDの操作アイコンを表示する表示制御信号を表示制御部104に送り、処理を終える。
【0064】
図5A及び図5Bは、図4のステップS409における、撮影中に表示が必要なマイクIDの選択処理の詳細なフローチャートである。
【0065】
S501において、CPU101は、前回以前の選択処理で表示すると選択されて、現在既に表示中のマイク操作アイコンのマイクIDを取得し、S502に処理を移す。
【0066】
S502において、CPU101は、今回検出した選択処理対象のマイクIDを取得し、S503に処理を移す。
【0067】
S503において、CPU101は、今回、選択処理対象のマイクIDが検出されているかどうかを判断し、いれば処理をS504に移し、いなければS508に処理を移す。
【0068】
S504において、CPU101は、現在既にマイク操作アイコンを表示中かどうかを判断する。表示していれば処理をS513に移し、表示していなければS505に処理を移す。
【0069】
S505において、CPU101は、今回検出した選択処理対象のマイクIDの検出個数が所定数以下かどうかを判断し、以下ならば処理をS506に移し、以下でなければS519に処理を移す。
【0070】
S506において、CPU101は、今回検出した選択処理対象のマイクIDを今後表示するマイクIDに全て選択し、S507に処理を移す。
【0071】
S507において、CPU101は、今回のマイク選択処理で表示すると選択したマイクIDを保存し、処理を終える。
【0072】
このように、今まで操作アイコンを表示していなかった状態から新たに画角内に検出されたマイク本数が所定本数以下なら、全部の操作アイコンが、表示するように選択される。
【0073】
S508において、CPU101は、現在既にマイク操作アイコンを表示中のマイクIDがあるかどうか判断し、あれば処理をS509に移し、なければS507に処理を移す。
【0074】
S509において、CPU101は、現在既に表示中のマイク操作アイコンのマイクIDが既に録音中かどうかを判断し、既に録音中ならば処理をS510に移し、なければS511に処理を移す。ここで、録音中とは、CPU101がマイク音声データを圧縮処理しているか、又は、生成された圧縮データをドライブ装置106に記録している最中であることを指す。ステップS509では、記録中か否かを示す記録状態に応じて、処理を分岐していることになる。
【0075】
S510において、CPU101は、録音中のマイクIDを今後も表示するマイクIDに選択し、S512に処理を移す。
【0076】
S511において、CPU101は、録音中にないマイクIDを今後表示するマイクIDに選択せず、S512に処理を移す。
【0077】
S512において、CPU101は、現在既に表示中のマイク操作アイコンのマイクIDについて全て表示するか否かの選択が完了したかどうか判断する。CPU101は、完了していれば処理をS507に移し、完了していなければS509に処理を移す。
【0078】
このように、今まで操作アイコンを表示していたが画角外へ消えたマイクのマイク音が現在も録音中なら、記録オフ操作が可能なように、今後も表示するように選択する。他方、非録音中の場合、消えただけなので、今後、表示を消すように選択する。すなわち、記録中か否かを示す記録状態に応じて、表示/非表示を選択する。
【0079】
S513において、CPU101は、S501とS502で取得したマイクIDの中から現在既に表示中だが今回検出されないマイクID、即ち撮影視野から消失した被写体に関連付けられたマイクIDを抽出し、S514に処理を移す。
【0080】
S514において、CPU101は、現在表示中で今回検出されない消失マイクIDは録音中かどうかを判断し、録音中ならば処理をS515に移し、なければS516に処理を移す。すなわち、記録中か否かを示す記録状態に応じて、処理を分岐する。
【0081】
S515において、CPU101は、録音中のマイクIDを今後も表示するマイクIDに選択し、S517に処理を移す。
【0082】
S516において、CPU101は、録音中にないマイクIDを今後表示するマイクIDに選択せず、S517に処理を移す。
【0083】
S517において、CPU101は、今後表示するように選択したマイクIDの個数が所定数以下かどうかを判断し、以下ならば処理をS518に移し、以下でなければS528に処理を移す。
【0084】
S518において、CPU101は、現在表示中で今回検出されない全消失マイクIDについて表示/非表示の選択が完了したかどうか判断し、完了していれば処理をS519に移し、完了していなければS514に処理を移す。
【0085】
このように、今まで操作アイコンを表示していたが画角外へ消えた被写体に対応するマイクIDのマイク音声が現在録音中なら、記録オフ操作できるように、今後表示するように選択する。他方、非録音中なら、消えただけなので、今後表示を消すように選択する。すなわち、記録中か否かを示す記録状態に応じて、表示/非表示を選択する。
【0086】
S519において、CPU101は、検出されたマイクIDの音声解析を行い、S520に処理を移す。図6は、図5BのS519でCPU101が行う音声解析の説明用模式図を示す。
【0087】
図6(1)は、メモリ103に書き込まれるマイクID1のマイク音声データのマイク入力レベル601の変化例を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、メモリ103に書き込まれるマイク音声のマイク入力レベル601を人の声の濾過周波数特性を持つフィルタ処理を施した後、音量レベルを検知する。CPU101又は音声処理部111は、音声信号を解析する音声解析手段として機能する。
【0088】
図6(2)は、検知された音量レベル602を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、音量レベル602を示すデータ(検知レベルデータ)をメモリ103に書き込む。CPU101は、メモリ103に書き込まれた検知レベル602に対して、閾値超えタイマ計測処理を実行する。具体的には、CPU101は、検知レベル602が閾値Thを超えたら計時を開始し、所定時間で計時を停止し、Th未満になると計時値(カウント値)をクリアする。図6(3)は、閾値超えタイマ計測処理で得られるカウント値603の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0089】
また、CPU101は、メモリ103に書き込まれた検知レベル602に対し閾値未満タイマ計測処理を実行する。具体的には、CPU101は、メモリ103に書き込まれた検知レベル602が閾値Th未満になると、計時を開始し、所定時間で計測を停止し、閾値Thを超えると、計時値(カウント値)をクリアする。図6(4)は、閾値未満タイマ計測処理で得られるカウント値604の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0090】
CPU101は、閾値超えタイマカウント値603がTon1を超えると録音推奨条件フラグを1とし、閾値未満タイマカウント値604がToff1を超えると録音推奨条件フラグを0とする。図6(5)は、録音推奨条件フラグ605の変化例を示す。縦軸はフラグ値を示し、横軸は時間を示す。
【0091】
S520において、CPU101は、検出したマイクIDの録音推奨条件フラグが1であるかどうかを判断し、1ならば処理をS521に移し、1でなければS523に処理を移す。
【0092】
S521において、CPU101は、録音推奨条件フラグが1であるマイクIDの音声を現在録音中かどうかを判断し、録音中ならば処理をS522に移し、録音中で無ければS524に処理を移す。すなわち、記録中か否かを示す記録状態に応じて、処理を分岐する
【0093】
S522において、CPU101は、録音中のマイクIDを今後表示するマイクIDに選択せず、S526に処理を移す。
【0094】
S523において、CPU101は、録音推奨条件フラグが0であるマイクIDの音声を現在録音中かどうかを判断し、録音中ならば処理をS524に移し、録音中でなければS525に処理を移す。すなわち、記録中か否かを示す記録状態に応じて、処理を分岐する。
【0095】
S524において、CPU101は、録音中でないマイクIDを今後表示するマイクIDに選択し、S526に処理を移す。
【0096】
S525において、CPU101は、録音中でないマイクIDを今後表示するマイクIDに選択せず、S526に処理を移す。
【0097】
ステップS519〜S521、S523により、CPU101は、所定時間以上継続して所定音量レベル以上の音声が検出されたか否かを判別している。
【0098】
S526において、CPU101は、今後表示するように選択したマイクIDの個数が所定数以下かどうかを判断し、以下ならば処理をS527に移し、以下でなければS528に処理を移す。
【0099】
S527において、CPU101は、今回検出されたマイクIDの全てについて表示/非表示の選択が完了したかどうかを判断し、完了していれば処理をS528に移し、完了していなければS519に処理を移す。
【0100】
S528において、CPU101は、今回のマイク選択処理で表示と選択したマイクIDを保存し、処理を終える。
【0101】
このように、録音推奨条件を満たしているマイクIDが非録音中の場合、記録オン操作できるように操作アイコンの表示を選択する。また、録音推奨条件を満たしていないマイクIDが録音中の場合、記録オフ操作できるように、操作アイコンの表示を選択する。録音推奨条件を満たしているマイクIDが既に録音中の場合、操作の必要が無いので、操作アイコンの非表示を選択する。録音推奨条件を満たしていない非録音中のマイクIDも操作の必要が無いので、操作アイコンの非表示を選択する。
【0102】
図7は、図4、図5A及び図5Bに示すフローチャートに示す処理に対する操作部105とディスプレイ108を兼ねるタッチパネルの動作を視覚的に説明する模式図である。図8は、図7に示す模式図の動作状態を示すタイムチャートである。図7及び図8を参照して説明する動作は、CPU101がハードディスク102に格納されたプログラムをメモリ103に展開して実行し、表示制御部104を制御することにより実現される。
【0103】
図7(1)に示す表示例では、3人の人物(被写体)701,702,703とマイク操作アイコン704,705が表示されている。これは、撮影視野内に人物(被写体)703がいる状態で人物701,702が新たに入った状況である。但し、この表示以前のマイク操作アイコンは非表示であり、検出から非検出へ変化した被写体は無く、検出を継続の被写体は無く、人物703が非検出を継続している。
【0104】
例えば、ステップS505における所定数を2とすると、マイク操作アイコンの最大表示数が2個となる。従って、ステップS505において表示するマイク操作アイコンとしては、人物701,702のマイクが選択される。
【0105】
図7(1)に示す表示例は、S410において、CPU101が表示制御部104に送った、ディスプレイ108上にマイク操作アイコン704,705を撮影映像に重畳して表示する表示制御信号に相当する。
【0106】
CPU101は、人物701に対応するマイク操作アイコン704がタッチされたのを検出すると、表示制御部104を制御して、図7(2)に示すような画面をディスプレイ108に表示させる。図7(2)に示す表示例は、人物701のマイク非録音状態であり、CPU101は、人物701のマイクに対するマイク操作アイコンを、録音開始操作を指示する操作アイコン706に変更する。
【0107】
CPU101は、マイク操作アイコン706がタッチされたのを検出すると、対応するマイクからの音声の録音を開始するように音声処理部111を制御する。他方、CPU101は、所定時間経過してもマイク操作アイコン706がタッチされたのを検出できなければ、図7(1)に示す表示に戻す。
【0108】
図7(3)に示す表示例は、図7(1)に示す状態の後で、人物701のマイク音声を録音していながら、人物701,702が撮影視野から外れた状態を示す。人物701,702が検出から非検出に変化し、非検出から検出へ変化した被写体は無く、検出を継続の被写体は無く、被写体703は非検出を継続している。人物701のマイクからの音声を録音中なので、人物701が撮影視野から外れても、S514において表示中のマイク操作アイコン704が表示用に選択される。仮に、元々非録音の人物703が撮影視野から消えても、人物703に対応するマイク操作アイコンは、S514で表示用には選択されない。
【0109】
CPU101は、図7(3)に示す状態でマイク操作アイコン704がタッチされたのを検出すると、図7(4)に示すような画面になるように表示制御部104を制御する。図7(4)は、図7(3)に示すマイク操作アイコン704を、録音停止を指示するマイク操作アイコン707に切り替えたものになっている。CPU101は、図7(4)のマイク操作アイコン707がタッチされたのを検出すると、対応するマイクからの音声の録音を終了するように音声処理部111を制御する。また、所定時間経過してもマイク操作アイコン707がタッチされたのを検出しない場合、CPU101は、図7(4)に示すマイク操作アイコン707から図7(3)に示すマイク操作アイコン704に戻す。
【0110】
図8(A)は、図7(1)〜(3)に相当するタイムチャートを示す。横軸は時間である。(1)検出状態はマイクが検出されたか、されていないかの状態を示す。(2)録音状態はマイク録音有無の状態を示す。(3)解析状態はマイク音声解析結果の状態を示す。(4)表示状態はアイコン表示有無の状態を示す。
【0111】
タイミングT1までは、(1)検出状態が(1)−1、(1)−2のように非検出、(2)録音状態は(2)−1、(2)−2のように非録音、(3)解析状態は(3)−1、(3)−2のように非解析である。よって(4)表示状態は(4)−1、(4)−2のように非表示となる。
【0112】
タイミングT1から、(1)検出状態が(1)−1、(1)−2のようにA MIC検出とC MIC検出となる。最大表示数の2以下なので、(4)表示状態は(4)−1、(4)−2のようにA MIC操作アイコンとC MIC操作アイコン共に表示され始める。
【0113】
タイミングT2において、(3)解析状態が(3)−1、(3)−2のようにA MIC録音推奨とC MIC録音推奨となる。しかし、以前から表示しているので、(4)表示状態は(4)−1、(4)−2のようにA MIC操作アイコンとC MIC操作アイコン表示で維持される。
【0114】
タイミングT3において、(3)解析状態が(3)−1のようにA MIC録音推奨である。しかし、利用者操作により(2)録音状態が(2)−1のようにA MIC録音にされたので、(4)−1のようにA MIC操作アイコンは表示されなくなる。(3)解析状態が(3)−2のようにC MIC録音推奨であるのに(2)録音状態が(2)−2のようにC MIC非録音のままなので、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示され続ける。
【0115】
タイミングT4において、(1)検出状態が(1)−2のようにC MIC非検出となる。しかし、もともと(2)録音状態が(2)−2のようにC MIC非録音なので、(3)解析状態は(3)−2のように解析を止めるだけとなる。また、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示されなくなる。
【0116】
タイミングT5において、(1)検出状態が(1)−1のようにA MIC非検出となったのに、(2)録音状態が(2)−1のようにA MIC録音を継続している。これにより、(3)解析状態は(3)−2のように解析をやめる一方、(4)表示状態は(4)−1のようにA MIC操作アイコンが表示し続ける。
【0117】
図7(5)に示す表示例では、人物(被写体)701,702,709,710の検出を継続している。また、録音推奨条件フラグが1になっているのは人物701,709である。録音推奨条件フラグが0になっているのは被写体702,710であり、録音中なのは人物702,709である。
【0118】
例としてマイク操作アイコンの最大表示数を2個とすると、録音推奨条件フラグ1であるのに録音していない人物701のマイク操作アイコンは、S521において表示用に選択される。録音推奨条件フラグ0であるのに録音し続けている人物702のマイク操作アイコンは、S523において表示用に選択される。録音推奨条件フラグ1であって既に録音中で状況に変化が無い人物709のマイク操作アイコンは、S521において非表示に選択される。録音推奨条件フラグ0であるが、元々非録音で状況に変化が無い人物710のマイク操作アイコンは、S523において非表示に選択される。
【0119】
図7(5)に示す画面は、CPU101がディスプレイ108上に選択結果に応じてマイク操作アイコン704,705を表示するような表示制御信号を表示制御部104に送ることで実現される。
【0120】
CPU101は、図7(5)に示す画面でマイク操作アイコン704がタッチされたのを検出すると、図7(6)に示す画面になるように表示制御部104を制御する。また、CPU101は、図7(5)に示す画面でマイク操作アイコン705がタッチされたのを検出すると、図7(7)に示す画面になるように表示制御部104を制御する。
【0121】
図7(6)に示す画面は、録音推奨状態であるのに録音をしていない例である。すなわち、CPU101は、ディスプレイ108上にマイク操作アイコン706を表示する表示制御信号を表示制御部104に送り、マイク操作アイコン704,705が録音開始を指示する操作アイコン706に切り替えられる。
【0122】
CPU101は、図7(6)に示す画面でマイク操作アイコン706がタッチされたのを検出すると、対応するマイクからの音声の録音を開始するように音声処理部111を制御する。CPU101は、所定時間経過しても、図7(6)に示す画面のマイク操作アイコン706がタッチされたのを検出できなければ、図7(5)に示す表示状態に戻す。
【0123】
図7(7)に示す画面は、録音非推奨状態なのに録音し続けている例である。すなわち、CPU101は、ディスプレイ108上にマイク操作アイコン711を表示する表示制御信号を表示制御部104に送り、マイク操作アイコン704,705が録音終了を指示する操作アイコンに切り替えられる。
【0124】
CPU101は、図7(7)に示す画面のマイク操作アイコン711がタッチされたのを検出すると、対応するマイクからの音声の録音を終了するように音声処理部111を制御する。CPU101は、所定時間経過しても、マイク操作アイコン711がタッチされたのを検出できなければ、図7(5)に示す表示状態に戻す。
【0125】
図8(B)は、図7(5)に示す画面のタイミング付近に相当するタイムチャートを示す。横軸は時間である。
【0126】
タイミングT6までは、(1)検出状態として、(1)−1、(1)−2、(1)−3、(1)−4のようにA MIC、C MIC、D MIC、E MICと4つのマイクが検出されている。(2)録音状態として、(2)−1、(2)−3のように、A MICとEMICは非録音、(2)−2、(2)−3のようにC MICとD MICは録音している。(3)解析状態として、(3)−1、(3)−3のようにA MICとD MICは録音推奨状態、(3)−2、(3)−4のようにC MICとE MICは非録音推奨状態である。従って(4)表示状態として、(4)−1、(4)−2のようにA MICとC MICは表示、D MICとE MICは表示していない。
【0127】
タイミングT6において、(1)検出状態は変化していない。しかし、利用者操作により、(2)録音状態が(2)−1のようにA MIC録音にされて(3)解析状態は(3)−1のようにA MIC録音推奨状態のままである。従って、(4)表示状態は(4)−1のようにA MIC操作アイコンは表示されなくなる。
【0128】
タイミングT7において、(1)検出状態が変化していないが、利用者操作により(2)録音状態が(2)−2のようにC MIC非録音とされ、(3)解析状態は(3)−2のようにC MIC非録音推奨状態のままである。従って、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示されなくなる。
【0129】
図5A及び図5Bに示すフローチャートでは、音声解析結果のみで表示アイコンを選択している。しかし、図3に示すように個人認証データベース上で優先順位を付けておき、音声解析結果と優先順位の高さを条件として絞り込むことも可能である。
【0130】
図9は、通信品質順位例を示す。通信装置107が通信エラー発生回数をカウントし、CPU101の制御に基づき、図9に示すような通信品質順位表が、メモリ103へ書き込まれる。
【0131】
図5A及び図5Bに示すフローチャートでは、音声解析結果のみで表示アイコンを選択している。しかし、図9に示すように、通信エラー発生回数により通信品質順位を付けておき、音声解析結果と通信品質順位の高さを条件として絞り込むことも可能である。
【0132】
図10は、マイク毎の録音時間の順序付け例を示す。付加情報として映像と共に記録するためにマイク毎の録音時間が、CPU101の制御に基づき、図10に示すような表としてメモリ103に書き込まれる。
【0133】
図5A及び図5Bに示すフローチャートでは、音声解析結果のみで表示アイコンを選択している。しかし、図10に示すように、マイク毎の録音時間として順位を付けておき、音声解析結果と録音機会が少ない順を条件として絞り込むことも可能である。
【0134】
図11は、図5A及び図5Bに示すフローチャートの表示条件と結果の分類表を示す。マイク検出状態、マイク検出数、マイク録音状態、及び、音声解析結果による録音推奨/非推奨により、表示の有無が決定される。
【0135】
CPU101は、操作アイコン表示のための上記条件に加えて、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上を考慮しても良い。
【0136】
以上のように、本実施例では、ワイヤレスマイク等により得られた音声信号を示す操作アイコンを、音声が所定時間、所定音量条件を継続するという条件を満たすときに表示するようにした。これにより、画面に不必要なアイコンが表示され被写体自体を見にくくしてしまう可能性を低減できる。本実施例の制御はまた、タッチパネル操作に限らず、ジョグキー操作でマイク操作する場合にも有効である。
【実施例2】
【0137】
映像再生時に、複数の記録済みの音声の中から被写体検出結果と音声解析結果に基づいて選択的に音声操作アイコンを表示し、アイコン操作により音声を選択的に再生する実施例を説明する。
【0138】
実施例1と同様に図3に示すような個人認証データベースを持つとする。すなわち、特徴データX1である人は人物Aであり、人物AならばID1のマイクを装着している。特徴データX2である人は人物Bであり、人物Bならばマイクを装着していないことが判断できる。これにより、再生映像中に特定個人の顔があるかどうかを個人認証すれば、特定のワイヤレスマイクIDを持つマイクが装着されていたかどうかが判断できる。
【0139】
再生中に表示するべき操作アイコンを表示制御するCPU101における処理は、図4に示すフローチャート同様である。図12A及び図12Bは、図4のS409において、CPU101が行う、再生中に表示が必要なマイクIDの選択処理の詳細フローチャートである。
【0140】
S1201において、CPU101は、前回以前の選択処理で表示と選択され、現在既に表示中のマイク操作アイコンのマイクIDを取得し、S1202に処理を移す。
【0141】
S1202において、CPU101は、今回検出した選択処理対象のマイクIDを取得し、S1203に処理を移す。
【0142】
S1203において、CPU101は、今回、選択処理対象のマイクIDが検出されているかどうかを判断し、いれば処理をS1210に移し、いなければS1204に処理を移す。
【0143】
S1204において、CPU101は、現在既にマイク操作アイコンを表示中かどうか判断し、表示していれば処理をS1205に移し、なければS1209に処理を移す。
【0144】
S1205において、CPU101は、現在表示中のマイク操作アイコンのマイクIDの音声は再生中かどうかを判断し、再生中ならば処理をS1206に移し、なければS1207に処理を移す。ここで再生中とは音声出力中を意味する。すなわち、CPU101によってドライブ装置106から読みとられて伸長処理されてメモリ103に書き込んでいることを指すのではない。再生中は、伸長処理されてメモリ103に書き込まれている再生音声データを音声処理部111がCPU101によって他のマイク音とミキシングし、スピーカ(不図示)に出力していることを指す。他方、再生していない状態とは、CPU101によってドライブ装置106から読みとられて伸長処理されてメモリ103へ書き込んでいないことを指すのではない。伸長処理されてメモリ103へ書き込まれている再生音声データを音声処理部111がCPU101によって他のマイク音とミキシングせず、そのマイク音声がスピーカ(不図示)に出力されていないことを指す。
【0145】
S1206において、CPU101は、再生中のマイクIDを今後も表示するマイクIDに選択し、S1208に処理を移す。
【0146】
S1207において、CPU101は、再生中にないマイクIDを今後表示するマイクIDに選択せず、S1208に処理を移す。
【0147】
S1208において、CPU101は、現在既に表示中の全マイク操作アイコンのマイクIDについて表示/非表示の選択が完了したかどうかを判断する。完了していれば処理をS1209に移し、完了していなければS1205に処理を移す。
【0148】
S1209において、CPU101は、今回のマイク選択処理で表示と選択したマイクIDを保存し、処理を終える。
【0149】
このように今まで操作アイコンを表示していたが画角外へ消えたマイクIDの音が現在再生中なら再生オフ操作できるように表示用に選択する。他方、非再生中なら、消えただけなので、非表示に選択する。
【0150】
S1210において、CPU101は、現在既にマイク操作アイコンを表示中かどうか判断し、していれば処理をS1211に移し、していなければS1217に処理を移す。
【0151】
S1211において、CPU101は、S1201,S1202で取得したマイクIDから現在既に表示中で今回検出されないマイクID、即ち被写体が消失したマイクIDを抽出し、S1212に処理を移す。
【0152】
S1212において、CPU101は、現在表示中で今回検出されない消失マイクIDの音声が再生中かどうかを判断し、再生中ならば処理をS1213に移し、再生中でなければS1214に処理を移す。
【0153】
S1213において、CPU101は、再生中のマイクIDを今後も表示するマイクIDに選択し、S1215に処理を移す。
【0154】
S1214において、CPU101は、再生中でないマイクIDを今後表示するマイクIDに選択せず、S1215に処理を移す。
【0155】
S1215において、CPU101は、表示と選択したマイクIDの個数が所定数以下かどうかを判断する。所定数以下ならば、処理をS1216へ移し、以下でなければS1226に処理を移す。
【0156】
S1216において、CPU101は、現在表示中で今回検出されない全消失マイクIDについて表示/非表示の選択が終わったかどうか判断し、終わっていれば処理をS1217に移し、終わっていなければS1212に処理を移す。
【0157】
このように今まで操作アイコンを表示していたが画角外へ消えた被写体に相当するマイクIDの音声が現在再生中の場合、再生オフ操作できるように表示を選択する。他方、非再生中の場合、消えただけなので、非表示を選択する。
【0158】
S1217において、CPU101は、検出したマイクIDの記録済み音声の音声解析を行い、S1218に処理を移す。
【0159】
図13は図12BのS1217においてCPU101が行う記録済み音声の音声解析の説明に使う模式図である。
【0160】
図13(1)は、メモリ103に書き込まれるマイクID1のマイク再生音声データのマイク再生レベル1301の変化例を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、メモリ103に書き込まれるマイク再生音声のマイク再生レベル1301を人の声の濾過周波数特性を持つフィルタ処理を施した後、音量レベルを検知する。CPU101又は音声処理部111は、音声信号を解析する音声解析手段として機能する。
【0161】
図13(2)は、検知された再生音量レベル1302を示す。縦軸は音量レベルを示し、横軸は時間を示す。音声処理部111は、音量レベル1302を示すデータ(検知レベルデータ)をメモリ103に書き込む。CPU101は、メモリ103に記憶される検知レベル1302に対して、閾値超えタイマ計測処理を実行する。具体的には、CPU101は、検知レベル1302が閾値Thを超えたら計時を開始し、所定時間で計時を停止し、Th未満になると計時値(カウント値)をクリアする。図13(3)は、閾値超えタイマ計測処理で得られるカウント値1303の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0162】
また、CPU101は、メモリ103に書き込まれた検知レベル1302に対し閾値未満タイマ計測処理を実行する。具体的には、CPU101は、メモリ103に書き込まれた検知レベル1302が閾値Th未満になると、計時を開始し、所定時間で計測を停止し、閾値Thを超えると、計時値(カウント値)をクリアする。図13(4)は、閾値未満タイマ計測処理で得られるカウント値1304の変化例を示す。縦軸はカウント値、横軸は時間をそれぞれ示す。
【0163】
CPU101は、閾値超えタイマカウント値1303がTon1を超えると録音推奨条件フラグを1とし、閾値未満タイマカウント値1304がToff1を超えると録音推奨条件フラグを0とする。図13(5)は、録音推奨条件フラグ1305の変化例を示す。縦軸はフラグ値を示し、横軸は時間を示す。
【0164】
S1218において、CPU101は、検出したマイクIDの再生推奨条件フラグが1であるかどうかを判断し、1ならば処理をS1219に移し、1でなければS1221に処理を移す。
【0165】
S1219において、CPU101は、再生推奨条件フラグが1とされた検出したマイクIDの音声が現在、再生中かどうかを判断し、再生中ならば処理をS1220に移し、再生中でなければS1222に処理を移す。
【0166】
S1220において、CPU101は、再生中のマイクIDを今後の表示用に選択せず、S1224に処理を移す。
【0167】
S1222において、CPU101は、再生中でないマイクIDを今後の表示用に選択し、S1224に処理を移す。
【0168】
S1221において、CPU101は、再生推奨条件フラグが0とされた検出マイクIDの音声が現在、再生中かどうかを判断し、再生中ならば処理をS1222へ移し、再生中でなければS1223に処理を移す。
【0169】
S1222において、CPU101は、再生中のマイクIDを今後の表示用に選択し、S1224に処理を移す。
【0170】
S1223において、CPU101は、再生中でないマイクIDを今後の表示用に選択せず、S1224に処理を移す。
【0171】
ステップS1217〜S1219、S1221により、CPU101は、所定時間以上継続して所定音量レベル以上の音声が検出されたか否かを判別している。
【0172】
S1224において、CPU101は、今後の表示用に選択したマイクIDの個数が所定数以下かどうかを判断し、以下ならば処理をS1225に移し、以下でなければS1226に処理を移す。
【0173】
S1225において、CPU101は、検出マイクIDの全てについて表示/非表示の選択が完了したかどうかを判断し、完了していれば処理をS1226に移し、完了していなければS1217に処理を移す。
【0174】
S1226において、CPU101は、今回のマイク選択処理で表示すると選択したマイクIDを保存し、処理を終える。
【0175】
このように、再生推奨条件を満たしているマイクIDの音声が非再生中なら再生オン操作できるように、表示用に選択する。他方、再生推奨条件を満たしていないマイクIDの音声が再生中なら、再生オフ操作できるように、今後表示するように選択する。
【0176】
再生推奨条件を満たしているマイクIDの音声が既に再生中の場合、操作の必要が無いので、今後表示を消すように選択する。他方、再生推奨条件を満たしていない非再生中のマイクIDの音声は、操作の必要が無いので、今後表示を消すように選択する。
【0177】
図14は、図12A及び図12Bに示すフローチャートの表示条件と結果の分類表を示す。マイク検出状態、マイク再生状態、及び、音声解析結果による再生推奨/非推奨の条件に従い、表示の有無が決定される。
【0178】
図15(A)は、図4、図12A及び図12Bのフローチャートを実施した時の操作部105とディスプレイ108を兼ねるタッチパネルの動作イメージ図、図15(B)はその動作状態を示したタイムチャートである。
【0179】
図15(A)(1)は、ディスプレイ108の画面例を示す。この画面例では、人物(被写体)1501,1502,1509,1510のマイク装着の検出を継続になっている。再生推奨条件フラグが1になっているのは人物(被写体)1501,1509である。再生推奨条件フラグが0になっているのは人物(被写体)1502,1510である。再生中なのは人物(被写体)1502,1509の音声である。
【0180】
例としてマイク操作アイコンの最大表示数を2個とすると、再生推奨条件フラグ1であるのに音声を再生していない人物1501のマイク操作アイコンが、S1219において表示用に選択される。再生推奨条件フラグ0であるのに音声を再生し続けている人物1502のマイク操作アイコンは、S1221において表示用に選択される。再生推奨条件フラグ1であって既に再生中で状況に変化が無い人物(被写体)1509のマイク操作アイコンは、S1219において非表示に選択される。再生推奨条件フラグ0であるが、元々非再生で状況に変化が無い人物(被写体)1510のマイク操作アイコンは、S1221において非表示に選択される。
【0181】
図15(A)(1)では、人物1501のマイク操作アイコン1504と、人物1503のマイク操作アイコン1505が表示されている。この画面は、CPU101がディスプレイ108上に選択結果に応じてマイク操作アイコン1504,1505を表示するような表示制御信号を表示制御部104に送ることで実現される。
【0182】
CPU101は、図15(A)(1)に示す画面でマイク操作アイコン1504がタッチされたのを検出すると、図15(A)(2)に示す画面になるように表示制御部104を制御する。CPU101はまた、図15(A)(1)に示す画面でマイク操作アイコン1505がタッチされたのを検出すると、図15(A)(3)に示す画面になるように表示制御部104を制御する。
【0183】
図15(A)(2)は、人物1501(人物A)の音声が非再生状態の画面例を示す。CPU101がディスプレイ108上にマイク操作アイコン1506を表示するような表示制御信号を表示制御部104に送り、マイク操作アイコン1504,1505が、再生開始を指示するマイク操作アイコン1506に切り替えられる。
【0184】
CPU101は、マイク操作アイコン1506がタッチされたのを検出すると、対応するマイクの音声の再生を開始するように音声処理部111を制御する。CPU101は、所定時間経過しても、マイク操作アイコン1506がタッチされたのを検出できなければ、図15(A)(1)に示す表示状態に戻す。
【0185】
図15(A)(3)は、再生推奨状態にないのに人物1501(人物A)の音声を再生し続けているときの画面例を示す。CPU101がディスプレイ108上にマイク操作アイコン1511を表示するような表示制御信号を表示制御部104に送り、マイク操作アイコン1504,1505が、再生終了を指示するマイク操作アイコン1511に切り替えられる。
【0186】
CPU101は、マイク操作アイコン1511がタッチされたのを検出すると、対応する音声の再生を終了するように音声処理部111を制御する。CPU101は、所定時間経過しても、マイク操作アイコン1511がタッチされたのを検出できない場合、図15(A)(1)に示す表示状態に戻す。
【0187】
図15(B)は、図15(A)(1)に示す画面のタイミング付近に相当するタイムチャートを示す。横軸は時間である。
【0188】
タイミングT1までは、(1)検出状態として、(1)−1、(1)−2、(1)−3、(1)−4のようにA MIC、C MIC、D MIC及びE MICの4つのマイク音声が検出されている。なお、撮影時に全チャンネル分の音声が画像ファイルと関連付けた個別ファイルとして記録済みである。再生時には、個別に音声状態の解析と、再生のオン/オフを指示できる。
【0189】
(2)再生状態として、各チャンネル別に(2)−1、(2)−3のようにA MICとE MICは非再生であり、(2)−2、(2)−3のようにC MICとD MICは再生中である。
【0190】
(3)解析状態として、(3)−1、(3)−3のようにA MICとD MICは再生推奨状態であり、(3)−2、(3)−4のようにC MICとE MICは非再生推奨状態である。
【0191】
従って、(4)表示状態として、(4)−1、(4)−2のようにA MICとC MICのマイク操作アイコンは表示され、D MICとE MICのマイク操作アイコンは表示されない。
【0192】
タイミングT1において、(1)検出状態が変化していない。しかし、利用者操作により(2)再生状態が(2)−1のようにA MIC再生に変更されて、(3)解析状態は(3)−1のようにA MIC再生推奨状態のままである。これにより、(4)表示状態は(4)−1のようにA MIC操作アイコンは表示されなくなる。
【0193】
タイミングT2において、(1)検出状態が変化していない。しかし、利用者操作により(2)再生状態が(2)−2のようにC MIC非再生とされ、(3)解析状態は(3)−2のようにC MIC非再生推奨状態のままである。これにより、(4)表示状態は(4)−2のようにC MIC操作アイコンは表示されなくなる。
【0194】
図16は、マイク毎の滞在時間の順位表の一例を示す。CPU101は、画角内の被写体の検出時間をカウントし、図16に示すような滞在時間の順位表をメモリ103に書き込む。図12A及び図12Bに示すフローチャートでは、音声解析結果のみで操作アイコンを選択している。図16に示すようにマイク毎の滞在時間として順位を付けておき、音声解析結果と滞在時間が短い順を条件としてなるべく新しい登場人物に絞り込むことも可能である。
【0195】
図17は、画面内での位置に応じて操作アイコン表示数を設定するエリア別表示数制限の概念図である。図12A及び図12Bに示すフローチャートでは、画面全体でマイク操作アイコン表示数を所定数に制限している。しかし、図17に示すように、マイクが検出される画角内の位置に応じて左右エリアは1個ずつ、中央は2個といったような制限を加えることも可能である。
【0196】
CPU101は、操作アイコン表示のための上記条件に加えて、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上を考慮しても良い。
【0197】
以上の説明から容易に理解できるように,本実施例では、音声信号が所定時間、所定音量条件を継続するという条件を満たすときに、追加と解除可能な音声信号の存在を示すアイコンを選択的に表示する。これにより、画面が不必要なアイコンの表示により見にくくなってしまう可能性を低減できる。
【0198】
カメラの再生操作例を説明したが、パソコンやテレビに組み込まれる再生装置に適用可能である。
【特許請求の範囲】
【請求項1】
画像信号を取得する画像取得手段と、
前記画像信号に関連する複数の音声信号を取得する音声取得手段と、
前記画像信号に基づく画像を表示装置に表示させる表示制御手段と、
前記画像信号から特定被写体を検出する被写体検出手段と、
前記音声信号を解析する音声解析手段と、
前記複数の音声信号のうちの、選択した音声信号を記録する記録手段と、
前記音声信号の解析結果及び記録状態並びに前記被写体検出手段の検出結果に応じて、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御する制御手段
とを備えることを特徴とする画像処理装置。
【請求項2】
前記制御手段は、前記音声信号の記録状態が記録であって、前記被写体検出手段が前記特定被写体を検出しない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記制御手段は、前記被写体検出手段の検出結果が所定数以下の前記特定被写体を検出する場合に、前記音声信号の記録状態によらず、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項4】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たさず、且つ、前記音声信号の記録状態が記録である場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たし、且つ、前記音声信号の記録状態が記録でない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項6】
前記特定の条件は、前記音声解析手段により所定時間以上継続して所定音量レベル以上の音声が検出されたことであることを特徴とする請求項4又は5に記載の画像処理装置。
【請求項7】
前記制御手段は、前記特定の条件、並びに、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上に応じて前記音声信号を示すアイコンを表示装置に表示させることを特徴とする請求項6に記載の画像処理装置。
【請求項8】
画像信号を取得する画像取得手段と、
前記画像信号に関連する複数の音声信号を取得する音声取得手段と、
前記画像信号に基づく画像を表示装置に表示させる表示制御手段と、
前記画像信号から特定被写体を検出する被写体検出手段と、
前記音声信号を解析する音声解析手段と、
前記複数の音声信号のうちの、選択した音声信号を出力する音声出力手段と、
前記音声信号の解析結果及び音声出力の有無、並びに前記被写体検出手段の検出結果に応じて、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御する制御手段
とを備えることを特徴とする画像処理装置。
【請求項9】
前記制御手段は、前記音声信号が音声出力されていて、前記被写体検出手段が前記特定被写体を検出しない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項10】
前記制御手段は、前記被写体検出手段の検出結果が所定数以下の前記特定被写体を検出する場合に、前記音声信号の音声出力の有無によらず、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項11】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たさず、且つ、前記音声信号が音声出力されている場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項12】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たし、且つ、前記音声信号が音声出力されていない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項13】
前記特定の条件は、前記音声解析手段により所定時間以上継続して、所定音量レベル以上の音声が検出されることであることを特徴とする請求項11又は12に記載の画像処理装置。
【請求項14】
前記制御手段は、前記特定の条件、並びに、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上に応じて前記音声信号を示すアイコンを表示装置に表示させることを特徴とする請求項13に記載の画像処理装置。
【請求項1】
画像信号を取得する画像取得手段と、
前記画像信号に関連する複数の音声信号を取得する音声取得手段と、
前記画像信号に基づく画像を表示装置に表示させる表示制御手段と、
前記画像信号から特定被写体を検出する被写体検出手段と、
前記音声信号を解析する音声解析手段と、
前記複数の音声信号のうちの、選択した音声信号を記録する記録手段と、
前記音声信号の解析結果及び記録状態並びに前記被写体検出手段の検出結果に応じて、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御する制御手段
とを備えることを特徴とする画像処理装置。
【請求項2】
前記制御手段は、前記音声信号の記録状態が記録であって、前記被写体検出手段が前記特定被写体を検出しない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記制御手段は、前記被写体検出手段の検出結果が所定数以下の前記特定被写体を検出する場合に、前記音声信号の記録状態によらず、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項4】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たさず、且つ、前記音声信号の記録状態が記録である場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たし、且つ、前記音声信号の記録状態が記録でない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項1に記載の画像処理装置。
【請求項6】
前記特定の条件は、前記音声解析手段により所定時間以上継続して所定音量レベル以上の音声が検出されたことであることを特徴とする請求項4又は5に記載の画像処理装置。
【請求項7】
前記制御手段は、前記特定の条件、並びに、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上に応じて前記音声信号を示すアイコンを表示装置に表示させることを特徴とする請求項6に記載の画像処理装置。
【請求項8】
画像信号を取得する画像取得手段と、
前記画像信号に関連する複数の音声信号を取得する音声取得手段と、
前記画像信号に基づく画像を表示装置に表示させる表示制御手段と、
前記画像信号から特定被写体を検出する被写体検出手段と、
前記音声信号を解析する音声解析手段と、
前記複数の音声信号のうちの、選択した音声信号を出力する音声出力手段と、
前記音声信号の解析結果及び音声出力の有無、並びに前記被写体検出手段の検出結果に応じて、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御する制御手段
とを備えることを特徴とする画像処理装置。
【請求項9】
前記制御手段は、前記音声信号が音声出力されていて、前記被写体検出手段が前記特定被写体を検出しない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項10】
前記制御手段は、前記被写体検出手段の検出結果が所定数以下の前記特定被写体を検出する場合に、前記音声信号の音声出力の有無によらず、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項11】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たさず、且つ、前記音声信号が音声出力されている場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項12】
前記制御手段は、前記被写体検出手段が前記特定被写体を検出し、前記音声解析手段の解析結果が特定の条件を満たし、且つ、前記音声信号が音声出力されていない場合に、前記音声信号を示すアイコンを表示装置に表示させるように前記表示制御手段を制御することを特徴とする請求項8に記載の画像処理装置。
【請求項13】
前記特定の条件は、前記音声解析手段により所定時間以上継続して、所定音量レベル以上の音声が検出されることであることを特徴とする請求項11又は12に記載の画像処理装置。
【請求項14】
前記制御手段は、前記特定の条件、並びに、予め設定した個人毎の優先度、個人毎の記録済み時間の長短順、個人毎の音声取得品質の優劣順、及び個人毎の登場の新旧順の何れか1以上に応じて前記音声信号を示すアイコンを表示装置に表示させることを特徴とする請求項13に記載の画像処理装置。
【図1】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2013−85065(P2013−85065A)
【公開日】平成25年5月9日(2013.5.9)
【国際特許分類】
【出願番号】特願2011−222725(P2011−222725)
【出願日】平成23年10月7日(2011.10.7)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成25年5月9日(2013.5.9)
【国際特許分類】
【出願日】平成23年10月7日(2011.10.7)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]