説明

音分離装置、及び、それを備えたカメラユニット

【課題】近接音源からの音と遠方音源からの音とを適切に分離できる音分離装置を提供する。
【解決手段】音分離装置15は、入力音を第1の音信号に変換する第1のマイクロホンFFMと、入力音を第2の音信号に変換し、前記第1のマイクロホンと比べて距離減衰率が大きい特性を持つ第2のマイクロホンNFMと、入力された前記第1の音信号及び前記第2の音信号から独立成分分析により分離行列を最適化し、最適化した前記分離行列を用いて近接音源からの音信号として第3の音信号を分離するとともに遠方音源からの音信号として第4の音信号を分離する音信号処理部13と、を備える

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、近接音と遠方音とが混ざった混合音から近接音又は遠方音のみを分離抽出する音分離装置に関する。また、本発明は、そのような音分離装置を備えるカメラユニットに関する。
【背景技術】
【0002】
従来、独立成分分析(ICA;Independent Component Analysis)の技術を利用して、検出対象となる音源からの音(目的音)と、雑音源からの音とが混じり合った混合音から、目的音を分離抽出することが行われている。検出対象となる音源としては、例えば話者音声の音源が挙げられる。
【0003】
例えば、特許文献1には、無指向性マイクロホンに混合音が入力され、単一指向性マイクロホンに検出対象音源からの音又は雑音源からの音のいずれか一方が主に入力されるように構成され、ブラインド音源分離(BBS;Blind Source Separation)をリアルタイムで行うことを可能にする音信号処理装置が開示されている。ブラインド音源分離とは、混合音から目的音を分離するための分離行列をICAの技術を用いて最適化し、最適化された分離行列を用いて混合音の中から目的音を分離抽出する方法のことを指している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−227512号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、近年においては、動画撮影が可能な電子機器(例えば、携帯型のビデオカメラ装置、携帯電話機、携帯型のゲーム機等)が盛んに使用されている。これらの電子機器は、一般に、動画撮影と同時に音声録音処理を行うカメラユニットを備える。このカメラユニットには、通常、被写体に焦点を合わせるためのオートフォーカス機能や、被写体の拡大率を可変させるズーム機能が備えられる。
【0006】
オートフォーカス機能やズーム機能においては、DCモータ、ステッピングモータ等を用いて、レンズ系の移動が行われる。このとき、レンズ系の移動に伴って、モータ音が発生したり、その他メカ系の動作音が発生したりする。また、カメラユニットで動画撮影が行われる場合には、常にフォーカス、ズーム処理が動作するため、モータ音や動作音が録音されてしまうことがある。また、これらの音の他にも、カメラ操作者の操作音等、不要な音が録音されてしまう場合があり、このような不要な音(ノイズ音)が極力録音されないことが望まれる。
【0007】
この点、ノイズ音が取り除かれた目的音のみが録音されるように、例えば特許文献1に示される音信号処理装置の技術をカメラユニットに適用することが考えられる。しかしながら、上記目的で特許文献1の技術がカメラユニットに適用される場合には、次のような問題が生じる。
【0008】
図11は、従来技術の問題点を説明するための図で、カメラユニットに無指向性マイクロホンと単一指向性マイクロホンが搭載された場合における、各マイクロホンの指向特性を示す図である。図11においては、カメラユニットは中心Oに位置する。図11において、実線で囲まれた領域(円形の領域)RR1は無指向性マイクロホンの指向特性を示しており、全方向の音を感度良く均等に集音することを表している。また、破線で囲まれた領域(ハート型の領域)RR2は単一指向性マイクロホンの指向特性を示しており、中心Oに対して特定の方向(Cの方向)の音を感度良く集音することを表している。
【0009】
動画撮影時においては、一般に、被写体の声等、カメラユニットから離れた位置で発生する音が目的音(検出対象の音)であり、カメラユニット近傍で発生する音(上述のモータ音、レンズ系の移動に伴う動作音、操作音等)は不要な音(ノイズ音)であることが多い。
【0010】
単一指向性マイクロホンは、特定の方向からの音をとらえる特性を持ち、その指向性の方位に存在する音源からの音について、カメラユニットの近傍だけでなく、カメラユニットから離れた位置で発生する音も集音する。従来技術にならって、例えば単一指向性マイクロホンの指向特性の感度が得られる方向にカメラユニットのモータなどが存在するようにして雑音源からの音が主に集音されるようにした場合、同方向において遠方に存在する音についても単一指向性マイクロホンに集音される。このため、この構成では、音源分離を行ったときに、遠方音の一部がノイズ音として残留する、あるいは分離行列が収束せず分離できないといった問題があった。
【0011】
以上の点を鑑みて、本発明の目的は、近接音源からの音と遠方音源からの音とを適切に分離できる音分離装置を提供することである。また、本発明の他の目的は、そのような音分離装置を備え、カメラユニット近傍で発生するノイズ音を除去して目的音を適切に録音できるカメラユニットを提供することである。
【課題を解決するための手段】
【0012】
上記目的を達成するために本発明の音分離装置は、入力音を第1の音信号に変換する第1のマイクロホンと、入力音を第2の音信号に変換し前記第1のマイクロホンと比べて距離減衰率の大きい特性を持つ第2のマイクロホンと、入力された前記第1の音信号及び前記第2の音信号から独立成分分析により分離行列を最適化し、最適化した前記分離行列を用いて近接音源からの音信号として第3の音信号を分離するとともに遠方音源からの音信号として第4の音信号を分離する音信号処理部と、を備えることを特徴としている。
【0013】
本構成によれば、近接音源からの音と遠方音源からの音とを適切に分離可能である。このために、本発明は、例えば、動画撮影と同時に音声録音処理を行うカメラユニット等に好適な技術である。
【0014】
上記構成の音分離装置において、前記第2のマイクロホンは差動マイクロホンであるのが好ましく、例えば1次傾度の特性を有する差動マイクロホンが使用可能である。本構成によれば、近接音源あるいは遠方音源からの音のみを高精度で分離抽出できる音分離装置を実現できる。
【0015】
上記構成の音分離装置において、前記第1のマイクロホンが差動マイクロホンである場合には、該差動マイクロホンは、音圧によって振動する振動板を1つのみ有する構成とするのが好ましい。本構成によれば、第1のマイクロホンの小型化を図れ、音分離装置を電子機器に実装し易くなる。
【0016】
上記構成の音分離装置において、前記第1のマイクロホンは、無指向性のマイクロホンであることとしてもよい。本構成は、遠方音源が存在する領域として広い範囲が想定される場合に好適である。
【0017】
上記構成の音分離装置において、前記第1のマイクロホンと前記第2のマイクロホンとが1つのパッケージで形成されているのが好ましい。本構成によれば、2つのマイクロホン間の距離を非常に近いものとできるので、目的音の分離抽出をより適切に行うことが可能になる。
【0018】
また、上記目的を達成するために本発明のカメラユニットは、上記構成の音分離装置を備えることを特徴としている。具体的には、上記構成のカメラユニットは、被写体を撮像して撮像情報を映像信号に変換する撮像部と、前記映像信号と前記第4の音信号とを蓄積する蓄積部と、を更に備えるのが好ましい。
【0019】
本構成では、カメラユニットによって動画撮影を行う場合に、カメラユニットの本体とその近傍とから発生するノイズ音を除去し、目的音であるカメラユニットから離れた周囲音を適切に録音することが可能である。
【0020】
上記構成のカメラユニットにおいて、前記撮像部には、前記被写体方向からの入射光を結像するレンズ部と、前記レンズ部に含まれる可動レンズを駆動するレンズ駆動部と、が含まれ、前記音信号処理部は、前記レンズ駆動部が動作している期間に前記分離行列の最適化処理を行い、前記レンズ駆動部が動作していない期間には前記分離行列の最適化は行わない、こととしてもよい。
【0021】
本構成によれば、カメラユニットの近傍で発生する音のうち、特にレンズ駆動部で発生する音をノイズ音として効果的に分離除去して、目的音を得ることが可能になる。
【発明の効果】
【0022】
本発明の音分離装置によれば、近接音源からの音と遠方音源からの音とを適切に分離できる。また、本発明の音分離装置を備えるカメラユニットにおいては、カメラユニット近傍で発生するメカニカルノイズ等のノイズ音を除去して、目的音(カメラユニットから離れた周囲音)を適切に録音することが可能である。
【図面の簡単な説明】
【0023】
【図1】本実施形態のカメラユニットの構成を示すブロック図
【図2】本実施形態のカメラユニットの構成を示す概略斜視図
【図3】本実施形態のカメラユニットが備えるニアフィールドマイクロホンの構成を示す概略図
【図4】本実施形態のカメラユニットが備えるファーフィールドマイクロホンの構成を示す概略図
【図5】音圧Pと音源からの距離Rとの関係を示すグラフ
【図6】ニアフィールドマイクロホンとファーフィールドマイクロホンの指向特性を示す図
【図7】ニアフィールドマイクロホンとファーフィールドマイクロホンの距離減衰特性を説明するためのグラフ
【図8】本実施形態のカメラユニットが備える各マイクロホンの指向特性を示す図
【図9】本実施形態の変形例を説明するための図で、ニアフィールドマイクロホンとファーフィールドマイクロホンとが1パッケージで形成された構成を示す概略断面図
【図10】本実施形態の変形例を説明するための図で、レンズ駆動部の駆動の有無で分離行列の最適化を行うか否かを切り替えられる構成を備えた音分離装置のブロック図
【図11】従来技術の問題点を説明するための図で、カメラユニットに無指向性マイクロホンと単一指向性マイクロホンが搭載された場合における、各マイクロホンの指向特性を示す図
【発明を実施するための形態】
【0024】
以下、本発明の音分離装置と、それを備えたカメラユニットの実施形態について、図面を参照しながら詳細に説明する。
【0025】
図1は、本実施形態のカメラユニットの構成を示すブロック図である。図2は、本実施形態のカメラユニットの構成を示す概略斜視図である。図1に示すように、本実施形態のカメラユニット1は、動画撮影を可能とする撮像部11と、動画撮影時の周囲音を集音可能とする集音部12と、集音部12で集音した音を処理する音信号処理部13と、撮像部11から出力される映像信号を録画処理するとともに、音信号処理部13から出力される音信号を録音処理する蓄積部14と、を備える。
【0026】
なお、集音部12と音信号処理部13とからなる部分15(図1において破線で囲まれる部分)は、本発明の音分離装置の実施形態である。
【0027】
撮像部11には、図2に示すようにカメラユニット1の本体10に取り付けられ、被写体方向からの入射光を結像するレンズ部111が備えられる。このレンズ部111は、単レンズで構成されてもよいし、複数のレンズ群で構成されてもよい。また、レンズ部111には、オートフォーカス調整やズーム調整を可能とすべく、光軸方向に移動可能な可動レンズが含まれる。
【0028】
撮像部11には、レンズ部111に含まれる可動レンズを駆動するレンズ駆動部112が備えられる。図2においては、レンズ駆動部112の一部が示されている。レンズ駆動部112は、例えばDCモータ、ステッピングモータ、超音波モータ、圧電素子等の駆動源を有する。そして、レンズ駆動部112は、フォーカス調整やズーム調整が行われる際に、この駆動源を駆動させ、例えば可動レンズを保持するホルダをガイドに沿って移動させる。このレンズ駆動部112は、図示しない制御部によって、その動作を制御される。なお、レンズ駆動部112の駆動時には、モータ音やホルダ移動に伴う動作音等が発生する。
【0029】
撮像部11には、被写体方向からの入射光がレンズ部111によって結像される位置に撮像面が配置され、入射光を光電変換して映像信号を出力する撮像処理部113が備えられる。この撮像処理部113は、例えばCCD(Charge Coupled Device)イメージセンサやCMOS(Complementary Metal Oxide Semiconductor)イメージセンサ等とできる。撮像処理部113から出力される映像信号は、蓄積部14の録画処理部141に送られて録画処理される。
【0030】
集音部12は、近接音源(カメラユニット1の近傍にある音源)からの音を主に集音して電気信号に変換するニアフィールドマイクロホンNFMと、近接音源からの音と遠方音源(本実施形態では近接音源以外の音源が該当する)からの音との混合音を電気信号に変換するファーフィールドマイクロホンFFMと、を備える。
【0031】
ファーフィールドマイクロホンFFMとしては、被写体の音を集音可能なマイクロホンを使用する。例えば、無指向性のマイクロホンを選択する。また、ニアフィールドマイクロホンNFMとしては、距離減衰特性の良いマイクロホンを使用する。ニアフィールドマイクロホンNFMとしては、例えば、1次傾度以上の傾度特性を持つ差動マイクロホンを使用することでき、遠方音を抑制して近接音を主に集音するものを選択することが好ましい。なお、ファーフィールドマイクロホンFFMは本発明の第1のマイクロホンの一例であり、ニアフィールドマイクロホンNFMは本発明の第2のマイクロホンの一例である。
【0032】
ニアフィールドマイクロホンNFMとファーフィールドマイクロホンFFMとは、カメラユニット1の本体10内に、実装基板(図示せず)に実装された状態で隣接配置されている。図2においては、これら2つのマイクロホンが本体10内部にあるために破線表示としている。カメラユニット1の本体10には、マイクロホンNFM、FFMに音を導入するための開口が設けられている。これらのマイクロホンをいずれの位置に配置するかは、適宜決定すればよいが、本実施形態では本体10の前面に配置している。ここで、ニアフィールドマイクロホンNFMとして使用される差動マイクロホンが、レンズ駆動部の動作音を効率的に集音できるよう、指向特性の最も感度の高い方向(主軸方向)が、レンズ駆動部の方向を向くように設置することが望ましい。
【0033】
図3は、本実施形態のカメラユニットが備えるニアフィールドマイクロホンの一例の構成を示す概略図で、図3(a)は概略斜視図、図3(b)は図3(a)のA−A位置における断面図である。ニアフィールドマイクロホンNFMは、MEMS(Micro Electro Mechanical System)チップ221及びASIC(Application Specific Integrated Circuit)222が搭載されるマイク基板201に、蓋体211が被せられた構造となっている。
【0034】
MEMSチップ221は、シリコン(Si)を半導体プロセス技術により加工して製造されるコンデンサ型のマイクロホンチップであり、入力音圧によって変位する振動板221a及びこれに対向して配置される固定電極221bとを有する。入力音圧の変化は、振動板221aと固定電極221b間の距離を変化させ、ひいてはコンデンサ容量を変化させる。MEMSチップ221は、振動板221aの両面(上面と下面)に対して音圧が伝達されるように構成されており、固定電極221bは音圧によって振動しないように表面から裏面まで貫通する複数の通気孔が設けられている。また、ASIC222は、MEMSチップ221のコンデンサ容量変化を電気信号(音信号)に変換する回路、及び振動板221a又は固定電極221bにバイアス電圧を印加するための電源回路等を含む集積回路である。
【0035】
なお、本実施形態では、ASIC222がMEMSチップ221と別に設けられる構成としているが、ASIC222に搭載される集積回路はMEMSチップ221を形成するシリコン基板上にモノリシックで形成してもよい。
【0036】
マイク基板201のMEMSチップ221及びASIC222が搭載される基板上面201aには、第1の開口202と第2の開口203とが設けられている。第1の開口202と第2の開口203とは、基板内部空間204を介して連通している。なお、このようなマイク基板201は、複数枚の基板を貼り合わせて得てもよい。
【0037】
MEMSチップ221は、振動板221aがマイク基板201と略平行になるように配置されると共に、第1の開口202を基板上面201a側から塞ぐように配置されている。また、マイク基板201の下面201bには、外部接続用の接続端子205が形成されている。
【0038】
蓋体211の上面211aには、その長手方向の一端部側に第1音孔212が形成され、他端部側に第2音孔213が形成されている。なお、本実施形態では、2つの音孔212、213を長孔形状としているが、この形状に限られる趣旨ではなく、その形状は適宜変更してよい。
【0039】
また、蓋体211には、第1音孔212と繋がる第1空間部214と、第1空間部214とは隔離されて第2音孔213と繋がる第2空間部215と、が形成されている。この蓋体211は、第1空間部214がMEMSチップ221によって基板内部空間204と仕切られるように、マイク基板201に搭載されている。また、蓋体211は、第2空間部215が第2の開口203を介して基板内部空間204と連通するようにマイク基板201に搭載されている。
【0040】
以上のように構成されるニアフィールドマイクロホンNFMは、外部音を、第1音孔212から第1空間部214を通して振動板221aの上面へと導く第1の音道P1と、外部音を、第2音孔213から第2空間部215、第2の開口203、基板内部空間204、第1の開口202の順に通過させて振動板221aの下面へと導く第2の音道P2と、を有する構成となっている。
【0041】
そして、ニアフィールドマイクロホンNFMは、振動板221aの上面に加わる音圧pfと、振動板221aの下面に加わる音圧pbとの差によって振動板221aを振動させて、入力音を電気信号(音信号)に変換するようになっている。すなわち、ニアフィールドマイクロホンNFMは1次傾度の差動マイクロホンとして構成されている。なお、これに限定される趣旨ではないが、本実施形態では、音道P1と音道P2の長さをほぼ同一とし、両音道の位相差が発生しないようにしている。
【0042】
図4は、本実施形態のカメラユニットが備えるファーフィールドマイクロホンの構成を示す概略図で、図4(a)は概略斜視図、図4(b)は図4(a)のB−B位置における断面図である。
【0043】
ファーフィールドマイクロホンFFMは、その上面301aにMEMSチップ321及びASIC322が搭載されるマイク基板301に、MEMSチップ321及びASIC322を覆うように蓋体311が被せられた構造となっている。マイク基板301の下面301bには、外部接続用の接続端子302が形成されている。
【0044】
蓋体311には、その上面311aに音孔312が形成されるとともに、音孔312と繋がる空間部313が形成されている。このように構成されるファーフィールドマイクロホンFFMは、外部音を、音孔312から空間部313を通して振動板321aの上面へと導く音道Pを有する構成となっている。また、振動板321aの下面側はマイク基板301aで塞がれて、閉空間を形成している。
【0045】
なお、MEMSチップ321及びASIC322は、ニアフィールドマイクロホンNFMと同様の構成のものであるので、説明は省略した。
【0046】
ここで、ニアフィールドマイクロホンNFMとファーフィールドマイクロホンFFMとの特性について説明する。この説明に先立って、音波の性質について説明する。図5は、音圧Pと音源からの距離Rとの関係を示すグラフである。図5に示すように、音波は、空気等の媒質中を進行するにつれて減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例して減衰し、音圧Pと距離Rとの関係は、以下の式(1)のように表せる。なお、式(1)におけるkは比例定数である。
P=k/R (1)
【0047】
ファーフィールドマイクロホンFFMの出力は式(1)に従い、音源からの距離に反比例した出力信号が得られる。一方、ニアフィールドマイクロホンNFMにおいては、第1音孔212と第2音孔213から入力される音圧の差圧に比例する出力が得られる。図5及び図3を参照しながらニアフィールドマイクロホンNFMの出力について、以下詳細に説明する。
【0048】
ニアフィールドマイクロホンNFMの第1音孔212と第2音孔213の間の距離をΔdとする。マイクロホンを音源から近距離位置に配置した場合、例えば音源から第1音孔212までの距離がR1、音源から第2音孔213までの距離がR2となるように配置したとき、振動版321aにおいて生じる差圧は(P1−P2)となる。また、マイクロホンを音源から遠距離位置に配置した場合、例えば音源から第1音孔212までの距離がR3、音源から第2音孔213までの距離がR4となるように配置したとき、振動版321aにおいて生じる差圧は(P3−P4)となる。上記により、ニアフィールドマイクロホンNFMの出力は、図5のグラフの傾きを求めるのと等価であり、距離Rで微分したのと等価な特性が得られることになる。
【0049】
図7は、ニアフィールドマイクロホンとファーフィールドマイクロホンの距離減衰特性を説明するためのグラフで、横軸は音源からの距離Rを対数軸で表現したもの、縦軸はマイクロホンの振動板に加わる音圧レベル(dB)を示す。
【0050】
ファーフィールドマイクロホンFFMでは、振動板321aは上面に加わる音圧によって振動するため、マイクロホンの出力レベルは1/Rで減衰する。一方、ニアフィールドマイクロホンNFMでは、振動板221aの上面及び下面に加わる音圧の差によって振動するため、マイクロホンの出力レベルはファーフィールドマイクロホンFFMの特性を距離Rで微分した特性1/Rで減衰する。
【0051】
図7に示すように、ニアフィールドマイクロホンNFMの出力は、ファーフィールドマイクロホンFFMの出力に比べて、音源からの距離に対する減衰率が大きくなる。すなわち、ファーフィールドマイクロホンFFMは、ニアフィールドマイクロホンNFMに比べて、マイクロホンの近傍で発生する音は効率よく集音するが、遠方の音は抑圧される。
【0052】
ニアフィールドマイクロホンNFMの近傍で発生する音の音圧は、第1音孔212と第2音孔213との間で大きく減衰し、振動板221aの上面に伝達される音圧と、振動板221aの下面に伝達される音圧とには、大きな差が生じる。一方、遠方に音源がある音は、第1音孔212と第2音孔213との間ではほとんど減衰せず、振動板221aの上面に伝達される音圧と、振動板221aの下面に伝達される音圧との音圧差は非常に小さくなる。なお、ここでは、音源から第1音孔212までの距離と、音源から第2音孔213までの距離とが異なる場合を前提としている。
【0053】
振動板221aにて受音される遠方音源からの音の音圧差は非常に小さいために、遠方音源からの音の音圧は振動板221aにてほぼ打ち消される。これに対して、振動板221aにて受音される近接音源の音の音圧差は大きいために、近接音源からの音の音圧は振動板221aで打ち消されない。このため、振動板221aの振動によって得られた信号は、近接音源からの音の信号であると見なせる。
【0054】
図6は、ニアフィールドマイクロホンNFM及びファーフィールドマイクロホンFFMの指向特性を示している。図6(a)はニアフィールドマイクロホンNFMの指向特性を示し、図6(b)はファーフィールドマイクロホンFFMの指向特性を示している。図6において、図6(a)はニアフィールドマイクロホンNFMの第1音孔212と第2音孔213を0°及び180°方向に配置した場合、図6(a)はファーフィールドマイクロホンのFFMの音孔312を原点位置に配置した場合を表している。
【0055】
まず、図6(a)に示すニアフィールドマイクロホンNFMの指向特性について説明する。音源からニアフィールドマイクロホンNFMまでの距離が一定であれば、音源が0°又は180°の方向にある時に振動板221aに加わる音圧が最大となる。これは、音源から第1音孔212に至る距離と、音源から第2音孔213に距離との差が最大になるからである。
【0056】
これに対し、音源が90°又は270°の方向にある時に振動板221aに加わる音圧が最小(ほぼ0)になる。これは、音源から第1音孔212に至る距離と、音源から第2音孔213に至る距離が等しくなるからである。
【0057】
すなわち、ニアフィールドマイクロホンNFMとして、1次傾度の差動マイクロホンを使用する場合、0°及び180°の方向から入射される音波に対して感度が高くなり、90°及び270°の方向から入射される音波に対して感度が低くなる、いわゆる両指向性を示す。
【0058】
次に、図6(b)に示すファーフィールドマイクロホンFFMの指向特性について説明する。音源から振動板321aまでの距離が一定であれば、音源がどの方向にあっても振動板321aに加わる音圧は一定となる。すなわち、ファーフィールドマイクロホンFFMは、あらゆる方向から入射される音波を均等な感度で集音する無指向性を示す。
【0059】
図1に戻って、カメラユニット1が備える音信号処理部13について説明する。音信号処理部13は、アナログ音声信号をデジタル音声信号に変換する第1のA/D変換部131と第2のA/D変換部132とを備える。第1のA/D変換部131は、ニアフィールドマイクロホンNFMから出力される音信号(本発明の第2の音信号に該当)を所定時間間隔でサンプリングしてデジタル信号Y1(t)に変換する処理を行う。第2のA/D変換部132は、ファーフィールドマイクロホンFFMから出力される音信号(本発明の第1の音信号に該当)を所定時間間隔でサンプリングしてデジタル信号Y2(t)に変換する処理を行う。
【0060】
音信号処理部13には、第1のA/D変換部131及び第2のA/D変換部132から時分割で出力されるデジタル信号を順次処理するICA(独立成分分析)処理部133を備える。ICAの基本処理については、従来より一般的に用いられる技術を使用する。ICA処理部133は、2つのA/D変換部131、132から入力されたデジタル音声信号をFFT(Fast Fourier Transform)処理した後、周波数領域において独立成分分析の技術を用いて分離行列を求める処理(最適化する処理)を行う。ここで、分離行列は、分離音された信号間の統計的独立性が最大化となるように逐次更新され、最適解に収束するように処理される。
【0061】
或る時間tにおいて、2つの独立した音源から出力される音をS1(t)、S2(t)とする。また、これらの音源から出力される音(S1(t)、S2(t))を2つのマイクロホンで集音し、各マイクロホンで集音してA/D変換して得られた信号をそれぞれY1(t)、Y2(t)とする。この場合、以下に示す式(2)が成り立つ。
【数1】

なお、Aは2×2の混合行列である。
【0062】
WがAの逆行列であるとすると、以下の式(3)が成り立つ。
【数2】

式(3)におけるWが分離行列であり、独立成分分析の技術を用いて、2つの音源から出力される音S1(t)とS2(t)の統計的独立性が最大化されるように分離行列Wの最適化が図られる。なお、本実施形態では、2つの独立した音源は、カメラユニット1の近傍にある近接音源と、カメラユニット1から離れた位置にある遠方音源(近接音源以外の音源)とが該当する。また、2つのマイクロホンは、一方がニアフィールドマイクロホンNFMで、他方がファーフィールドマイクロホンFFMに該当する。
【0063】
ICA処理部133は、最適化した分離行列Wにより、2つのマイクロホンNFM、FFMから入力された音信号(正確にはA/D変換等の処理が行われた後の信号)から分離信号X1(t)、X2(t)を分離抽出する。ここで、分離信号X1(t)は、近接音源からの音(S1(t))の信号として推定される信号であり、本発明の第3の音信号に該当する。また、分離信号X2(t)は、遠方音源からの音(S2(t))の信号として推定される信号であり、本発明の第4の音信号に該当する。
【0064】
ICA処理部133は、目的音と推定される分離信号X2(t)を蓄積部14の録音処理部142に出力し、ノイズ音と推定される分離信号X1(t)は録音処理部142に出力しない。録音処理部142は、時分割でICA処理部133から送られてくる分離信号X2(t)を順次録音処理する。
【0065】
次に、以上のように構成されるカメラユニット1のうち、音分離装置15の作用について説明する。
【0066】
図8は、本実施形態のカメラユニットが備える各マイクロホンの指向特性を示す図である。図8においては、カメラユニット1は中心Oに位置する。図8において、実線R1はファーフィールドマイクロホンFFMの指向特性を示し、8の字形状の破線R2はニアフィールドマイクロホンNFMの指向特性を示している。
【0067】
上述のように、ニアフィールドマイクロホンNFMはカメラユニット1の近傍(図8の中心Oの近傍)にある近接音源からの音を集音する機能に優れ、ファーフィールドマイクロホンFFMはカメラユニット1から離れた位置にある遠方音源からの音を含めて広い範囲からの音を集音する機能に優れる。
【0068】
ニアフィールドマイクロホンNFMは、例えば、カメラユニット1の本体10から発生する機械音(レンズ駆動部112によってレンズを駆動する際に発生する音等)、操作者がカメラユニット1を操作する際に発生する操作音、及び、操作者の音声といったカメラユニット1の近傍で発生する音(S1)を主として集音するように設置される。また、ファーフィールドマイクロホンFFMは、先の3つの音に加えて、カメラユニット1から離れた周囲音(S2)も含んだ音を集音するように設置される。
【0069】
このとき、ニアフィールドマイクロホンNFMの出力は(a1・S1+a2・S2)、ファーフィールドマイクロホンFFMの出力は、(a3・S1+a4・S2)と表せる。ここで、a1、a2、a3、a4は係数であり、a1>>a2が成り立つ。
【0070】
ニアフィールドマイクロホンNFMとファーフィールドマイクロホンFFMとからの信号が入力されたICA処理部133は、適宜最適化された分離行列Wを用いて、近接音源からの音S1と推定される音X1と、遠方音源からの音S2と推定される音X2とを分離抽出する。すなわち、本実施形態の音分離装置15によれば、カメラユニット1の本体10から発生する機械音、操作者の操作音、操作者の音声といった、従来、不要なノイズ音と考えられている近接音源からの音を適切に取り除いて、カメラから離れた周囲の音のみを得ることができる。
【0071】
従来の音源分離技術は、主にマイクロホンに対して異なる方向に存在する2以上の音源を分離するために用いられており、同一方向で距離が異なって存在する音源を分離することが困難であった。これは、音源からの音が2つのマイクロホンに同位相で入ってくるめである。そのため、2以上の音源を分離するためには、集音に用いる2つのマイクロホン間距離を10cm以上離して配置する等が必要であり、マイクロホンの配置に大きなスペースが必要であった。
【0072】
一方、本実施形態の構成のように、距離減衰特性の異なる2つのマイクロホンを用いることにより、同一方向に距離が異なって存在する音源からの振幅差を大きく確保できるため、音源の分離が可能となる。従来、空間的な方位の違いを利用して音源を分離していたところが、距離減衰特性の異なる2つのマイクロホンを用いることで、音源をマイクロホンからの距離の違いを利用して分離することができるようになる。また、本発明の構成においては、2つのマイクロホンを同一位置に配置しても分離が可能であるため、マイクロホンサイズと同等のスペースがあれば配置できるという利点がある。
【0073】
以上に示した実施形態は、本発明の例示にすぎない。すなわち、本発明は、以上に示した実施形態に限定されず、本発明の目的を逸脱しない範囲で、種々の変形が可能である。
【0074】
例えば、以上に示した実施形態では、ニアフィールドマイクロホンNFMとファーフィールドマイクロホンFFMとが別々のパッケージからなる構成とした。しかし、ニアフィールドマイクロホンとファーフィールドマイクロホンとは、入力される音波の位相ずれが発生しないように、できる限り近接配置するのが好ましい。このため、2つのマイクロホンが1パッケージで形成されている構成を採用するのが好ましい。
【0075】
図9は、本実施形態の変形例を説明するための図で、ニアフィールドマイクロホンとファーフィールドマイクロホンとが1パッケージで形成された構成を示す概略断面図である。なお、この変形例のマイクロホンの構成はあくまでも例示であり、種々の変更が可能であるのは言うまでもない。要は、1パッケージでニアフィールドマイクロホンの機能とファーフィールドマイクロホンの機能とが発揮できる構成であればよい。
【0076】
図9で示す変形例のマイクロホン400の構成は、図3に示すニアフィールドマイクロホンNFMの構成とほぼ同様である。図3に示すマイクロホンの構成に、新たにMEMSチップ401(MEMSチップ221と同じ構成を有するもの)を追加した点が異なる。なお、図9においては、図3に示すマイクロホンと重複する部分には同一の符号を付している。
【0077】
マイクロホン400の外部で音が生じると、第1音孔212から入力された音波が第1の音道P1によって第2のMEMSチップ401の振動板401aの上面に到達し、振動板401aが振動する。第2のMEMSチップ401の振動板401aは、この上面に加わる音波によってのみ振動し、この第2のMEMSチップ401から出力される信号を使用すれば、本実施形態のファーフィールドマイクロホンFFMと同様の機能が得られる。
【0078】
また、マイクロホン400の外部で音が生じると、第1音孔212から入力された音波が第1の音道P1によって第1のMEMSチップ221の振動板221aの上面に到達すると共に、第2音孔213から入力された音波が第2の音道P2によって第1のMEMSチップ221の振動板221aの下面に到達する。このために、第1のMEMSチップ221の振動板221aは、上面に加わる音圧と下面に加わる音圧との音圧差によって振動する。このため、第1のMEMSチップ221から出力される信号を使用すれば、本実施形態のニアフィールドマイクロホンNFMと同様の機能が得られる。
【0079】
また、以上に示した実施形態では、レンズ駆動部112の駆動の有無にかかわらず、音分離装置15の音信号処理部(ICA処理部)13は分離行列Wの最適化を行うように構成した。しかし、常時、分離行列Wの最適化を行った場合、主なノイズ源となるレンズ駆動部が動作していない状態においても分離行列Wの最適化の処理が行われるため、分離行列Wが異常な値に収束あるいは発散してしまう場合がある。これを防止するため、レンズ駆動部112が駆動している場合(機械音が発生している場合)に分離行列Wの最適化を行い、レンズ駆動部112が駆動していない場合(機械音が発生していない場合)には分離行列Wの最適化は行わないようにすることが好ましい
【0080】
図10は、本実施形態の変形例を説明するための図で、レンズ駆動部の駆動の有無で分離行列の最適化を行うか否かを切り替えられる構成を備えた音分離装置のブロック図である。図10に示すように、変形例の音分離装置17は、本実施形態の音分離装置15のICA処理部133内に、最適化オンオフ部134が追加された構成となっている。
【0081】
最適化オンオフ部134は、カメラユニット1の制御部18と電気的に接続されている。この制御部18は、レンズ駆動部112の制御も行うものであり、レンズ駆動部112の駆動の有無について把握している。制御部18からレンズ駆動部112を駆動させるという情報が最適化オンオフ部134に入力された場合には、本実施形態の場合と同様に、ICA処理部133は分離行列Wの最適化を行いながら、音信号の分離抽出を行う。一方、制御部18からレンズ駆動部112を駆動させないという情報が最適化オンオフ部134に入力された場合には、ICA処理部133は分離行列Wの最適化を行わず、分離行列W値をホールドする。これにより、ICA処理を安定に動作させることが可能である。
【0082】
このような音分離装置17では、近接音源からの音のうち、カメラユニット1から発生する機械音について効果的に分離抽出し、操作者の声等については分離せずに、遠方音源からの音とともに目的音として抽出されることになる。カメラユニット1で動画撮影する場合に、操作者の音は除去したくないという要望も考えられ、本変形例は、このような要望に対して好適な構成である。
【0083】
また、以上に示した実施形態では、カメラユニット1が備えるマイクロホンNFM、FFMが、半導体製造技術を利用して形成されるMEMSマイクロホンである構成とした。しかし、本発明は、この構成に限定されるものではない。例えば、マイクロホンが、エレクトレック膜を使用したコンデンサマイクロホン(ECM)等であっても構わない。また、カメラユニット1が備えるマイクロホンNFM、FFMは、いわゆるコンデンサ型マイクロホンに限らず、例えば、動電型(ダイナミック型)、電磁型(マグネティック型)、圧電型等のマイクロホン等でも構わない。
【0084】
また、以上に示した実施形態では、ニアフィールドマイクロホンNMFは、1つの振動板221aのみを有する差動マイクロホンとして構成されている。しかし、本発明は、この構成に限られるものではない。すなわち、ニアフィールドマイクロホンは、例えば2つの振動板を有し、それぞれの振動板に基づいて出力される信号の差分を音信号として出力するタイプの差動マイクロホンであっても構わない。
【0085】
また、以上に示した実施形態では、ニアフィールドマイクロホンNMFは、1次傾度の差動マイクロホンとして構成されている。しかし、本発明は、この構成に限られるものではない。すなわち、ニアフィールドマイクロホンは、例えば2次傾度または3次傾度特性を持つ差動マイクロホンであっても構わない。
【0086】
また、以上に示した実施形態では、ファーフィールドマイクロホンFFMは無指向性マイクロホンとした。しかし、本発明は、この構成に限定されるものではない。ファーフィールドマイクロホンが、例えば単一指向性マイクロホン等の指向性マイクロホンであってもよい。例えば、カメラユニット1による動画撮影時に、集音したい音の方向が特定の方向に限られるような場合には、このような構成も有効である。
【0087】
その他、以上においては、本発明の音分離装置がカメラユニットに適用される場合を例に説明した。しかしながら、本発明の音分離装置は、近接音源からの音と、遠方音源からの音を分離したい場合に広く適用できるものであり、その適用対象はカメラユニット以外の電子機器、たとえば携帯電話機における背景雑音の分離用途としても応用が可能である。携帯電話機に応用する場合は、ニアフィールドマイクロホンNMFが話者の音声をとらえるように設置し、ファーフィールドマイクロホンFFMは背景雑音を含んだ音声をとらえるように設置することにより、話者音声と背景雑音を分離することが可能である。
【産業上の利用可能性】
【0088】
本発明は、動画撮影が可能なカメラユニットに好適である。
【符号の説明】
【0089】
1 カメラユニット
11 撮像部
14 蓄積部
13 音信号処理部
15 音分離装置
111 レンズ部
112 レンズ駆動部
221a 振動板
NFM ニアフィールドマイクロホン(第2のマイクロホン)
FFM ファーフィールドマイクロホン(第1のマイクロホン)

【特許請求の範囲】
【請求項1】
入力音を第1の音信号に変換する第1のマイクロホンと、
入力音を第2の音信号に変換し、前記第1のマイクロホンと比べて距離減衰率が大きい特性を持つ第2のマイクロホンと、
入力された前記第1の音信号及び前記第2の音信号から独立成分分析により分離行列を最適化し、最適化した前記分離行列を用いて近接音源からの音信号として第3の音信号を分離するとともに遠方音源からの音信号として第4の音信号を分離する音信号処理部と、
を備える音分離装置。
【請求項2】
前記第2のマイクロホンは差動マイクロホンである、請求項1に記載の音分離装置。
【請求項3】
前記差動マイクロホンは1次傾度特性を持つ、請求項2に記載の音分離装置。
【請求項4】
前記差動マイクロホンは、音圧によって振動する振動板を1つのみ有する、請求項2又は3に記載の音分離装置。
【請求項5】
前記第1のマイクロホンは、無指向性のマイクロホンである、請求項1から4のいずれかに記載の音分離装置。
【請求項6】
前記第1のマイクロホンと前記第2のマイクロホンとが1つのパッケージで形成されている、請求項1から5のいずれかに記載の音分離装置。
【請求項7】
請求項1から6のいずれかに記載の音分離装置を備える、カメラユニット。
【請求項8】
被写体を撮像して撮像情報を映像信号に変換する撮像部と、
前記映像信号と前記第4の音信号とを蓄積する蓄積部と、を更に備える、請求項6に記載のカメラユニット。
【請求項9】
前記撮像部には、前記被写体方向からの入射光を結像するレンズ部と、前記レンズ部に含まれる可動レンズを駆動するレンズ駆動部と、が含まれ、
前記音信号処理部は、前記レンズ駆動部が動作している期間に前記分離行列の最適化を行い、前記レンズ駆動部が動作していない期間は前記分離行列の最適化は行わない、請求項7又は8に記載のカメラユニット。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2012−238964(P2012−238964A)
【公開日】平成24年12月6日(2012.12.6)
【国際特許分類】
【出願番号】特願2011−105404(P2011−105404)
【出願日】平成23年5月10日(2011.5.10)
【出願人】(000201113)船井電機株式会社 (7,855)
【Fターム(参考)】