説明

音声処理装置

【課題】周囲雑音のある中で、ラジオからの交通情報やナビゲーションなどの音声明瞭化や、車載オーディオを使用したハンズフリーフォン通話の明瞭に聞こえるようにする。
【解決手段】音声データをデジタル信号フォーマットで出力する音声信号源手段(1)と、音声信号源手段(1)の出力に対して処理を加えて複数の信号を出力する信号処理手段(2)と、信号処理手段(2)の出力を受けて増幅しアナログ信号として出力する複数の信号増幅手段(4〜7)と、信号増幅手段(4〜7)にそれぞれ接続されてアナログ信号を音声として出力するスピーカ手段(8〜11)とを備え、音声収集手段(12〜15)による収集音声に基づいて信号処理手段(2)における明瞭化信号処理を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声処理装置に関し、特に車載ネットワークに接続した複数の音響機器/通信機器に関連し、これらの機器から発せられる音声の明瞭度を、周囲雑音の観測に基づいて改善する音響制御システムに関するものである。
【背景技術】
【0002】
従来より、車室内で携帯電話機などを使用する際に、オーディオ再生したままで通話音声を明瞭化するために、アッテネータによる音量調整や、オーディオイコライザによる周波数振幅特性調整を行う方法がとられる場合があった。この方法では、通話者以外にも車室内のすべての受聴位置において音量及び周波数振幅特性調整の影響を受けていた。これに対して、特許文献1では特定の座席の受聴位置において、オーディオ信号内の音声帯域信号成分の振幅と位相を変化させて音声帯域信号を調整し、他の座席の受聴位置では変化させないシステムを提案している。
【0003】
また、特許文献2は例えばMOST(Media Oriented Systems Transport:車載ネットワークの欧州規格)に従った光ネットワークをベースとして構築されたシステムにおいて、車載ネットワークに接続されたA/V機器システムの作動方法を提案している。なお、この文献においては、車載ネットワークをベースとした音声の明瞭化については一切触れられていない。
【0004】
【特許文献1】特開平8−205299号公報
【特許文献2】特開2001−223718号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来の装置では、再生しているオーディオ信号に特性調整を加えて、通話者と非通話者との両立を図ろうとするものであり、ラジオからの交通情報やナビゲーションなどの音声明瞭化や、車載オーディオを使用したハンズフリーフォン通話に対応できるものではない。また、車室内における走行雑音など、周囲雑音に由来する通話音声の明瞭度悪化には考慮が及んではいない。
【0006】
本発明の課題は、車室内の周囲雑音観測に基づいてスピーカから再生される音声の明瞭度を改善しうる、音声処理装置を提供することである。
【課題を解決するための手段】
【0007】
本発明は、
音声データをデジタル信号フォーマットで出力する音声信号源手段と、
前記音声信号源手段の出力に対して処理を加えて複数の信号を出力する信号処理手段と、
前記信号処理手段の出力を受けて増幅しアナログ信号として出力する複数の信号増幅手段と、
前記信号増幅手段にそれぞれ接続されて前記アナログ信号を音声として出力するスピーカ手段と、
音声を収集してデジタル信号フォーマットで出力する単数或いは複数の音声収集手段と、
前記音声信号源手段と、前記信号処理手段と、前記信号増幅手段と、前記音声収集手段との間で信号伝達するための伝送媒体とを備え、
前記信号処理手段が、前記音声収集手段により収集した音声に基づいて明瞭化のための信号処理を行う音声処理装置を提供する。
【発明の効果】
【0008】
本発明によれば、音声収集手段により音声を収集し、伝送媒体を通じて信号処理手段に集められて車室内の雑音分布を導出し、また音声信号源手段からの音声信号を周波数分析して音声のホルマント分布を導出し、これらの導出結果の比較に基づいて、雑音分布の振幅が低い領域のホルマント分布を強調する信号処理を行ったり、このホルマント分布強調と合わせて雑音分布の振幅が高い領域のホルマント分布を抑制するなどして、雑音状況と音声信号の特徴に適合した明瞭化を行うことができる。
【発明を実施するための最良の形態】
【0009】
実施の形態1.
図1は本発明の第1の実施の形態に係わる音声処理装置の基本構成を示すブロック図であって、1は音声信号源手段、2は信号処理手段、4〜7は信号増幅手段、8〜11はスピーカ、12〜15は音声収集手段、16〜19はマイクであり、これらは伝送媒体3により互いに結合されている。
【0010】
このように構成された車載ネットワーク及び車載音響システムにおいて、
音声信号源手段1は例えばラジオ受信機であり、伝送媒体3との接続のためにデジタル信号フォーマットの音声データインターフェースを備え、音声データをデジタル信号フォーマットで出力する。
信号処理手段2は音声信号源手段1の出力の音声データを受けて信号処理を加え、複数系統への出力を行う。
信号増幅手段4〜7は、信号処理手段2の複数系統出力のうちそれぞれ自己への割り当てに相当する信号を受けて増幅し、アナログ信号として出力しそれぞれスピーカ8〜11供給する。
スピーカ8〜11は、信号増幅手段4〜7にそれぞれ接続されて、信号増幅手段4〜7からのアナログ信号を音声として出力する。
音声収集手段12〜15はマイク16〜19から取得した音声をデジタル信号フォーマットの音声データとして伝送媒体に出力する。
伝送媒体3は例えばMOSTに従った光ネットワークであり、音声信号源手段1、信号処理手段2、信号増幅手段4〜7、音声収集手段12〜15が接続されている。音声信号源手段1から信号処理手段2へ、音声収集手段12〜15から信号処理手段2へ、信号処理手段2から信号増幅手段4〜7へ、伝送媒体3を介して各信号が伝達される。
【0011】
音声収集手段12〜15により収集された車室内音声は、伝送媒体3を介して信号処理手段2に集められ、信号処理手段2において車室内音声を周波数分析して雑音分布を導出し、音声信号源手段1からの音声信号に対して雑音分布に基づいて明瞭化信号処理を行う。
【0012】
この明瞭化信号処理として、例えば、音声信号源手段1からの音声信号を周波数分析して音声のホルマント分布を導出し、雑音分布とホルマント分布を比較して、雑音分布の振幅が低い領域のホルマント分布を強調する信号処理を行うこととしてもよい。
【0013】
上記の明瞭化信号処理として、さらに、雑音分布とホルマント分布を比較して、雑音分布の振幅が高い領域のホルマント分布を抑制することとしてもよい。
【0014】
図2は本実施の形態に係わる装置の配置構成を説明する図であり、スピーカ8〜11とマイク16〜19が自動車室CB内に配置されている。同図で、FFは自動車室CBのフロント側部分、RRはリア側部分を示す。図示のように、フロント側部分FFの右側の端部にスピーカ8及びマイク16が設けられ、フロント側部分FFの左側の端部にスピーカ9及びマイク17が設けられ、リア側部分RRの右側の端部にスピーカ10及びマイク18が設けられ、リア側部分RRの左側の端部にスピーカ11及びマイク19が設けられている。このように、図示の例では、フロント側部分FFとリア側部分RRの各2系統のスピーカ及びマイクが設けられている。尚、図面では、マイク16〜19がスピーカ8〜11に対してそれぞれ車室CBの内側にあるものとして示されているが、この位置関係に限定するものではなく、それぞれが車室のフロント側部分FF及びリア側部分のRRの左右の隅、即ち車質CBの四隅に配置されていれば良い。
【0015】
図3(a)は音声の周波数スペクトルの一例SP1を示している。人間の声は、声帯から発せられる原音が口腔を経て口から放出されるまでのいわゆる声道空間の形や容積の変化により共振周波数が変わり、それぞれ独特の声として口から発せられる。この声となる過程で、図3(a)に示すようなエネルギーの集中が複数のピークP1、P2、P3となって現れる。このピーク部分をホルマントと呼び、周波数の低い側から順に第1ホルマント、第2ホルマント、第3ホルマントと呼ばれる。図の周波数f1、f2、f3はそれぞれホルマント周波数と呼ぶ。通常の場合、周波数が高くなるほどホルマントの振幅が低くなる性質がある。声の明瞭度はこのホルマントと関係があり、低くなったホルマントの振幅を上げることにより、声の明瞭度を高めることが出来る。即ち、図3(b)に矢印ENで示すようにホルマントを持ち上げて、周波数スペクトルを破線SP2で変更することにより、声の明瞭度が高まる訳である。
【0016】
図4(a)は走行自動車内での走行雑音分布を示した一例である。数百Hz以下の低周波のロードノイズが目立っている。図4(b)は図4(a)の雑音分布NZ1の1kHzから10kHzまでの部分を移記してホルマント分布例SP1と重ねた図であり、明瞭化処理の一例を示す図である。ホルマント分布の左から第1ホルマントP1、第2ホルマントP2までは雑音レベルの高い領域に重なっており、第3ホルマントP3のみが雑音レベルの低い領域と重なっている。同図の例では雑音レベルの低い領域にある第3ホルマントP3を矢印EN3で示すように強調し、第2ホルマントP2は現状を維持し、第1ホルマントP1は矢印AT1で示すように抑制し、周波数スペクトルを破線SP3で示すものに変更している。これは周囲雑音とのレベル差を大きく取れる第3ホルマントを強調し、周囲雑音とのレベル差が小さい第2ホルマントは現状維持し、第1ホルマントは第3ホルマントを強調したことによる全体としての音声レベルの上昇を抑えるために抑制している。このように周囲雑音分布を考慮して、より雑音とのレベル差のとれるホルマントを強調することにより、雑音環境下で効果的な音声の明瞭化を行うことが出来る。
【0017】
図5は雑音分布の他の例NZ2に基づく明瞭化の処理を示している。この例では、第1ホルマントP1及び第3ホルマントP3が雑音レベルの高い領域と重なっており、第2ホルマントP2のみが雑音レベルの低い領域と重なっている。周囲雑音とのレベル差が大きい第2ホルマントP2を矢印EN2で示すように強調し、周囲雑音とのレベル差の小さい第1ホルマントP1を矢印AT1で示すように抑制して全体としての音声レベルの上昇を抑えている。第3ホルマントP3は現状維持とし、周波数スペクトルを破線SP4で示すように変更している。この場合にも、周囲雑音分布を考慮してより雑音とのレベル差のとれるホルマントを強調することにより、雑音環境下で効果的な音声の明瞭化を行うことが出来る。
【0018】
図6は信号処理手段2の構成の一例であり、運転席にいる乗員に対して音声の明瞭化を行う場合として説明する。また、ホルマントの強調/抑制は3系統のフィルタで行う例としている。伝送媒体3を経由して音声収集手段12〜15より入来した車室内のマイク音声信号は、I/F回路2aからFFT回路2bに入力されて周囲雑音のスペクトラム分布が求められる。この時、全てのマイク入力に対してスペクトラム分布を求めても良いが、単純化のために運転席に近いマイク16からの入力に基づく周囲雑音のスペクトラム分布のみを求めるものとする。雑音分布判定回路2cではFFT回路2b出力に基づき、積分するなどして平滑化し、一般に第1ホルマントから第3ホルマントまでが位置する1kHz付近から8kHz付近までの雑音レベル差の分布が把握される。即ち、FFT回路2b及び雑音分布判定回路2cにより図4(b)の実線NZ1に示すような車室内の雑音分布導出のための手段31が構成される。
【0019】
一方、伝送媒体3を経由して音声信号源手段1より入来した音声信号は、I/F回路2aからフィルタ2d及びFFT回路2gに入力される。FFT回路2gでは音声信号のスペクトラム分布(例えば、図4(b)に破線SP1で示される)が求められ、これに基づいてホルマント推定回路2hではスペクトラム分布の包絡線を求めて、そのピークP1〜P3、即ち第1から第3ホルマントまでの周波数f1〜f3を求める。更にホルマント推定回路2hで求められたホルマントの周波数f1〜f3と、雑音分布判定回路2cで求められた車室内の雑音分布NZ1は、フィルタ係数確定回路2iに入力されてホルマント強調のためのフィルタ係数の決定に使用される。
【0020】
フィルタ係数確定回路2iで求められた係数はフィルタ2d〜2fに入力され、I/F回路2a出力の音声信号に対して順次フィルタ処理が行われ、ホルマントの強調/抑制が行われる。
【0021】
以上のうち、フィルタ2d〜2fにより、ホルマントの強調/抑制のための強調/抑圧手段32が構成され、FFT回路2g、ホルマント推定回路2h、及びフィルタ係数確定回路2iにより、強調/抑制の制御のための制御手段33が構成される。
【0022】
図7(a)はフィルタ2d〜2fの各々の構成の一例として2次IIRフィルタを示している。
遅延手段101,102,103,104は、1サンプル時間の遅延時間を有し、係数乗算器110,111,112,113,114の係数a0〜b2はフィルタ係数確定回路2iにより決定される。
総和算出器121は、係数乗算器の出力の総和を求め、総和算出器121の出力がフィルタの出力となる。
図7(a)のフィルタの伝達関数Hzは以下の式で表される。
H(z)=(a2*z−2+a1*z−1+a0)/(b2*z−2+b1*z−1+1)
【0023】
図7(b)はフィルタの特性の一例としてプレゼンスフィルタを示している。ある周波数を中心に実線ELで示すようにゲインを上げるもしくは破線LWで示すようにゲインを下げる、いわゆるイコライザとしての動作を行う。カットオフ周波数fc、ゲインG、クオリティファクタQを与えることにより、所望の強調/抑制を行えるフィルタの係数a0、a1、a2、b1、b2を求め、これによりフィルタの伝達関数が確定する。これらのfc、G、Qの値は、ホルマント推定回路2h出力に基づくホルマント分布と、雑音分布判定回路2c出力に基づく車室内の雑音分布に基づいて決める。例えば図4(b)の例では、第1ホルマントP1に対してはfcを1.5kHz、Gをマイナスに、第3ホルマントP3に対してはfcを6.5kHz、Gをプラスに定めて算出される。Qは図4(b)のホルマント間の谷部分からピークまで滑らかに変化させる適切な数値が選ばれ、Gについては全体の音声レベル上昇とならないようにそれぞれ適切な数値が選ばれる。
【0024】
以上のように、I/F回路2aの音声信号出力RWに対してホルマント強調/抑制を行った結果のフィルタ2f出力AJは、選択処理回路2jに入力される。
また、I/F回路2aの音声信号出力RWは、遅延調整のための遅延手段2kを介して選択処理回路2jに供給される。遅延手段2kは、強調/抑制手段22における信号処理のための遅延にタイミングを合わせるためのものである。
選択処理回路2jでは、運転席に近いスピーカ8に相当する信号増幅手段4に対してはフィルタ2f出力の信号AJを選択して供給し、その他のスピーカに対しては、I/F回路2aの音声信号出力RW(遅延手段2kを介して供給されるもの)を選択して供給する。
選択処理回路2jからの選択出力は、I/F回路2aを経由して伝送媒体3へと出力され、それぞれ目的とするスピーカに供給される。
以上のようにして車室内の雑音観測に基づいた音声の明瞭化が行われる。
【0025】
尚、音声明瞭化処理の開始/終了や対象となる席の指定は、例えば機器の操作ユニット30のスイッチ操作によって行われる。この場合、スイッチ操作の結果発生された信号が選択処理回路2jに供給され、選択処理回路2jが信号に基づき選択処理を行う。このようなスイッチ操作の代わりに、音声収集手段12〜15による集音結果の音声認識や音声信号源手段1からの音声信号ソースの内容分析の結果に基づいて自動的に選択処理回路2jの制御を行ってもよい。
【0026】
また、図8は信号処理手段2以外の構成要素、音声信号源手段1、信号増幅手段4〜7、音声収集手段12〜15の構成を示したもので、それぞれI/F回路を介して伝送媒体3と接続される構成であることを示している。即ち、音声信号源手段1は、音声信号源1aと、伝送媒体3に接続されたI/F回路1bとを有し、信号増幅手段4は、伝送媒体3に接続されたI/F回路4aと、スピーカ8に接続された増幅回路4bとを有し、音声収集手段12は、マイク16に接続されたA/D回路12aと、伝送媒体3に接続されたI/F回路12bとを有する。
他の信号増幅手段5〜7も信号増幅手段4と同様に構成され、他の音声収集手段13〜15も音声収集手段12と同様に構成される。
【0027】
図9は信号増幅手段4〜7と音声収集手段12〜15のI/F部分を共用化した例であり、信号増幅/音声収集手段20〜23にスピーカ8〜11とマイク16〜19が共に接続されている構成である。
即ち、信号増幅/音声収集手段20は、図1の信号増幅手段4及び音声収集手段12の代わりに用いられるものであり、伝送媒体20aに接続されたI/F回路20aと、スピーカ8に接続された増幅回路20bと、マイク16に接続されたA/D回路20cとを有する。
他の信号増幅/音声収集手段21〜23も、信号増幅/音声収集手段20と同様に構成される。
【産業上の利用可能性】
【0028】
本発明の活用例として、自動車室内の騒音環境において、音声の明瞭化を行う上で有益である。
【図面の簡単な説明】
【0029】
【図1】この発明の実施の形態1に係わる装置の基本構成を示すブロック図である。
【図2】この発明の実施の形態1に係わる装置の配置構成を示す図である。
【図3】この発明の実施の形態1の音声明瞭化処理を説明する図である。
【図4】この発明の実施の形態1の音声明瞭化処理を説明する図である。
【図5】この発明の実施の形態1の音声明瞭化処理を説明する図である。
【図6】この発明の実施の形態1の信号処理手段2の構成を示すブロック図である。
【図7】この発明の実施の形態1の信号処理手段2を構成するフィルタ2d〜2fの一例を説明する図である。
【図8】この発明の実施の形態1の信号処理手段2を除く要素の構成を示すブロック図である。
【図9】この発明の実施の形態1に係わる装置の他の基本構成を示すブロック図である。
【符号の説明】
【0030】
1 音声信号源手段、 2 信号処理手段、 3 伝送媒体、 4〜7 信号増幅手段、 8〜11 スピーカ、 12〜15 音声収集手段、 16〜19 マイク。


【特許請求の範囲】
【請求項1】
音声データをデジタル信号フォーマットで出力する音声信号源手段と、
前記音声信号源手段の出力に対して処理を加えて複数の信号を出力する信号処理手段と、
前記信号処理手段の出力を受けて増幅しアナログ信号として出力する複数の信号増幅手段と、
前記信号増幅手段にそれぞれ接続されて前記アナログ信号を音声として出力するスピーカ手段と、
音声を収集してデジタル信号フォーマットで出力する単数或いは複数の音声収集手段と、
前記音声信号源手段と、前記信号処理手段と、前記信号増幅手段と、前記音声収集手段との間で信号伝達するための伝送媒体とを備え、
前記信号処理手段が、前記音声収集手段により収集した音声に基づいて明瞭化のための信号処理を行う音声処理装置。
【請求項2】
前記音声収集手段により収集された車室内音声を、前記伝送媒体を介して前記信号処理手段に集め、
前記信号処理手段において前記車室内音声を周波数分析して雑音分布を導出し、
前記音声信号源手段からの音声信号に対して前記雑音分布に基づいて明瞭化信号処理を行う
ことを特徴とする請求項1に記載の音声処理装置。
【請求項3】
前記明瞭化信号処理として、
前記音声信号源手段からの音声信号を周波数分析して音声のホルマント分布を導出し、
前記雑音分布と前記ホルマント分布を比較して、前記雑音分布の振幅が低い領域のホルマント分布を強調する信号処理を行う
ことを特徴とする請求項1又は2に記載の音声処理装置。
【請求項4】
前記明瞭化信号処理として、さらに、
前記雑音分布と前記ホルマント分布を比較して、前記雑音分布の振幅が高い領域のホルマント分布を抑制することを特徴とする請求項3に記載の音声処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate