説明

撮像装置の音声記録法

【課題】ビデオカメラを操作する撮影者の音声と、被写体の音声とを分離して記録する。
【解決手段】ビデオカメラの後方に後方指向性を有するマイクロフォン(マイク1)を設置し、前方に被写体音声を収録するための前方指向性を有するマイクロフォン(マイク2)を設置する。マイク1が取得した音声信号を、すべてビデオカメラの後方から到来したノイズに由来すると見なし、ノイズキャンセル回路によって、マイク2に混入するであろうノイズ信号を予測し、その逆位相波形を生成し、これをマイク2が取得した音声信号波形に重ね合わせることによって、撮影者の音声などのビデオカメラの後方から到来する音声波形を選択的にキャンセルする。

【発明の詳細な説明】
【発明の詳細な説明】

【技術分野】
【0001】
本発明は、ビデオカメラの撮影者の音声を被写体の音声から分離して記録する方法に関するものである。
【背景技術】
【0002】
ビデオカメラで撮影した動画を再生するとき、被写体が発する音声などに混じって、画面に現れない撮影者の音声が再生されると、それを視聴している者は、その音源を視覚的に確認できないため、強い違和感を感じることがある。しかし、手持ち式ビデオカメラでは、撮影者がカメラ付属の音声収録用マイクロフォンに最も近い位置にいるため、カメラの前方に指向性を有するマイクロフォンを用いても、少なからず撮影者の音声が記録されてしまった。それゆえ、撮影者は、被写体に指示を与えたいと思っても、自分の声が記録されるのを回避するために沈黙したまま撮影せざるをえないことがあった。撮影者の音声を撮影後の編集作業で消去することは可能であるが、一般ユーザーが、そのような煩雑な編集作業をすることは現実的には困難であった。また、ユーザーがそのような編集を行ったとしても、撮影者の音声を消すことで背景雑音まで消えてしまう不自然な音声記録となるという問題があった。
【0003】
こうした問題を解決する手段として、音声認識装置をビデオカメラに装備し、撮影者の音声を認識してそれを除去するという方法が提案されている(例えば特許文献1)。しかし、この方法では、事前に撮影者の音声を音声データベースへ登録する必要がある上、特定話者認識率が100パーセントでない限り、必要な音声まで消去したり、不要な音声が部分的に残るなど、かえって大きな問題が生じる可能性がある。また、仮に特定話者認識率が100パーセントであったとしても、この方法では、撮影者の周囲の不特定話者の音声や音声以外の雑音は全く除去できない。
【0004】
別の方法として、撮影者側に指向性を有する専用マイクロフォンを設置し、撮影者の音声を選択的に収録する方法が提案されている(例えば特許文献2)。この方法では、確かに撮影者の音声は鮮明に取得できるであろうが、被写体の音声収録用のマイクロフォンには従来通り撮影者の音声が混入してしまい、被写体の音声と撮影者の音声を分離して記録することはできない。
【0005】
それゆえ、もっと確実に撮影者およびその周囲の不特定話者音声を分離して記録する機能がビデオカメラに備えられることが望まれる。そうすれば、撮影者は、撮影中でも被写体に自由に音声で指示を出すことができるし、撮影状況を気軽に音声でメモすることも可能となる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】 特開2009−122370
【0007】
【特許文献2】 特開2008−306742
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明が解決しようとする課題は、撮影者の音声と、被写体の音声とを分離して記録することができるビデオカメラを提供することである。
【課題を解決するための手段】
【0009】
本発明の方法は、ビデオカメラの後部に設置した後方指向性を有するマイクロフォン(これをマイク1とする)が取得した音声信号を、すべてビデオカメラの後方から到来したノイズに由来するノイズ信号と見なし、この信号を基にノイズキャンセル回路を用いて、被写体音声の収録用マイクロフォン(これをマイク2とする)が取得する信号にも混入するであろうノイズ波形を予測し、その逆位相波形を生成し、これをマイク2の取得した信号に重ね合わせることによって、ビデオカメラの後方から到来した音声信号を選択的にキャンセルすることを最大の特徴とする。
【0010】
マイク1は後方指向性のモノラールタイプまたはステレオタイプ(図1,図2)を設置し、マイク2は、カメラの前方に前方指向性のステレオタイプを設置する。
【0011】
各マイクの出力をアナログ−デジタル変換し、デジタル式のノイズキャンセル回路を用いて、マイク2に混入するであろうノイズ波形を予測し、その波形の逆位相波形の生成およびノイズのキャンセル処理を行う。二つのマイク間の距離が固定されている上、マイクの周波数特性や指向性が概ね一定であるので、マイク1の信号から、ビデオカメラの後方から到来してマイク2が取得した信号に混入するであろうノイズ波形の位相や振幅を高精度で予測することが可能である。こうした信号処理の方式は、デジタル式のノイズキャンセル回路では一般的であり、本発明では、既存のノイズキャンセル回路の多くが利用可能である。
【0012】
本発明の方法では、被写体の音声は、ビデオカメラの前方に設置したマイク2で取得するのであるが、その被写体の音声は、不可避的に後方に設置したマイク1にも混入する。当然、ノイズキャンセル回路は、そのとき混入した被写体音声信号をもビデオカメラの後方から到来したノイズと見なし、そのキャンセル信号を予測生成する。当然、そのキャンセル信号は、マイク2が取得した被写体の音声信号に重ね合わされるので、キャンセルすべきではない被写体の音声信号までもがキャンセルされてしまうという事態が起こりうる。
【0013】
ところが、マイク1がマイク2より後方にあるため、カメラの前方から到来する被写体音声は、マイク1には常に位相が遅れて入力する。しかも、マイクの指向性が逆向きであるから、前方から到来する音声は、マイク1には、とくに高周波数帯域成分が減衰した状態で取得される。一方、撮影者の音声は、逆に、マイク2にマイク1より常に位相が遅れて入力し、かつマイクの指向性が逆であるため高周波数帯域成分が減衰した状態で取得される。それゆえ、ノイズキャンセル回路が、マイク1の取得した被写体音声信号をビデオカメラの後方から到来したノイズに由来すると見なし、それがマイク2に混入した場合を予測してキャンセル波形を生成しても、実際には、予測した位置にキャンセルすべきノイズ波形は存在せず、それゆえ、それをマイク2が直接取得した被写体の音声信号に重ね合わせても、被写体音声がキャンセルされることは無い。
【0014】
マイク1が取得した被写体音声に基づいて生成されたそれらのキャンセルすべき相手のいない逆位相波形は、そのままマイク2の信号に加えられるが、本来の被写体音声より高周波数帯域成分が減衰した波形である上、本来の被写体音声より数十ミリ秒遅れているだけであるので、それがエコーの様に聴取されるなど被写体音声の聴取に障害となることはほとんど無い。
【0015】
このように、前後のマイクロフォンの位置関係および指向性の差違を利用して、ビデオカメラの後方から到来する音を、ノイズキャンセル回路によって広い周波数帯域にわたり効果的にキャンセルするのが本発明の方法である。
【0016】
マイク1が取得した音声信号を記録するチャンネル1には、主として撮影者の音声が収録される。マイク2が取得した音声を記録するチャンネル2には、キャンセル処理後の撮影者の音声と被写体の音声が記録される(図1)。再生時には、チャンネル1とチャンネル2のいずれか一方、または両方の音声データをユーザーがチャンネルセレクタを操作して再生する。両チャンネルのデータをミキサを用いて適当な比率で混合して再生すれば、従来のビデオカメラの場合と同様に、撮影者の音声を含む撮影現場の全ての音を再生することができる。チャンネル2のみを再生すれば、撮影者の音声がキャンセルされた音声が再生される。ノイズキャンセラーの作動を停止しておけば、当然、撮影者の音声はキャンセルされない。チャンネル1のみを再生すれば、主として撮影者の音声が再生される。
【0017】
マイク1とマイク2の音声を何の信号処理も加えないでビデオカメラ内に記録しておき、ビデオカメラから出力する際にノイズキャンセル回路を作動させるという方法(図2)も選択できる。この場合は、ユーザーがチャンネルセレクタを操作して、ノイズキャンセル回路を作動させた場合と作動させない場合での再生音声を聞き比べて、キャンセルレベルを調節したり、いずれの音源を用いるかを選択することができる。この場合も、チャンネル1のみを選択すれば、主として撮影者の音声が出力される。
【発明の効果】
【0018】
本発明によって、撮影者は自分の声を除外した再生音が得られるので、撮影しながら気軽に発声することができる。音声で撮影現場の情報をメモのように記録しておくこともできる。また、撮影者の後方に位置する不特定話者の音声などをキャンセルして、ビデオカメラの前方から到来する音声を選択的に記録することもできる。
【図面の簡単な説明】
【0019】
【図1】本発明の実施例1の装置の構成を示すブロック図である。
【図2】本発明の実施例2の装置の構成を示すブロック図である。
【発明を実施するための形態】
【実施例1】
【0020】
図1は、本発明の実施例1の構成を示すブロック図であって、1〜8は、図2と同様である。矢印は信号の流れる方向を表す。この装置をビデオカメラに組み込んで用いる。本発明の主体は、ビデオカメラの音声の処理の方法あるいは処理の様式にあり、それを実施するための回路等は既存の技術レベル内のもので十分であるから、その詳細な説明は省略する。
【実施例2】
【0021】
図2は、本発明の実施例2の構成を示すブロック図であって、1〜8は、図1と同様である。
【産業上の利用可能性】
【0022】
本発明の方法は、あらゆる音声記録装置を備えたビデオカメラに適用することができる。
【符号の説明】
【0023】
1 撮影者の音声収録用マイクロフォン(マイク1)(右用および左用)
2 被写体の音声収録用マイクロフォン(マイク2)(右用および左用)
3 デジタル式ノイズキャンセル回路
4 チャンネル1の音声記録部(右用および左用)
5 チャンネル2の音声記録部(右用および左用)
6 マイクアンプとアナログ−デジタル変換器
7 ミキサーとチャンネルセレクター回路
8 左右の音声出力

【特許請求の範囲】
【請求項1】
音声記録装置を有するビデオカメラにおいて、ビデオカメラの後方に設置した後方指向性マイクロフォンが取得した音声信号を全てビデオカメラの後方から到来するノイズに由来するノイズ信号であると見なし、この信号を基にノイズキャンセル回路によってビデオカメラの前方に装着した前方指向性マイクロフォンが取得する信号に混入するであろうノイズ波形を予測し、その波形の逆位相波形を生成し、これをビデオカメラの前方に装着した前方指向性マイクロフォンが取得した音声信号に重ね合わせることで、その信号に含まれるビデオカメラ後方から到来した音声波形を選択的にキャンセルする方法。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2012−100235(P2012−100235A)
【公開日】平成24年5月24日(2012.5.24)
【国際特許分類】
【出願番号】特願2010−259474(P2010−259474)
【出願日】平成22年11月2日(2010.11.2)
【出願人】(591192258)
【Fターム(参考)】