説明

音響処理装置

【課題】自然な音色を維持したまま音声を充分に明瞭化する。
【解決手段】音響処理部20は、音響信号ACのうち音声帯域を下回る低域成分CLを可変のゲインGで減衰させる。制御部30は、音響信号ACの音声らしさの指標である音声性指標Iを算定し、音声性指標Iが示す音声らしさが高い場合に、音声らしさが低い場合と比較して低域成分CLが減衰されるようにゲインGを制御する。音声性指標Iは、音響信号ACのうち第1周波数F1を下回る第1成分C1のエネルギーE1と、第1周波数F1よりも高い第2周波数F2を下回る第2成分C2のエネルギーE2との相違に応じて算定される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音響信号を処理する技術に関する。
【背景技術】
【0002】
音響信号に含まれる音声を明瞭化する技術が従来から提案されている。例えば特許文献1には、効果音等の音響を示す左右チャネルの音響信号を中央チャネルの音響信号に対して低減することで、中央チャネルに含まれる音声を明瞭化する技術が開示されている。また、特許文献2には、音声信号のフォルマントを強調することで音声を明瞭化する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特表2011−518520号公報
【特許文献2】特開平11−17778号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1の技術では、中央チャネルの音響信号に音声と効果音とが混在する場合に中央チャネルの効果音が低減されず、音声を充分に明瞭化できない可能性がある。また、特許文献2の技術で音声を充分に明瞭化するためには音声信号のフォルマントを極端に強調する必要があり、音声が不自然な音色になるという問題がある。以上の事情を考慮して、本発明は、自然な音色を維持したまま音声を充分に明瞭化することを目的とする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本発明の音響処理装置は、音響信号のうち音声帯域を下回る低域成分を可変のゲインで減衰させる音響処理部と、音響信号の音声らしさを順次に解析し、音声らしさが高い場合に、音声らしさが低い場合と比較して低域成分が減衰されるようにゲインを制御する制御部とを具備する。以上の構成によれば、音響信号のうち音声らしさが高い区間について低域成分が減衰されるから、自然な音色を維持したまま音声を充分に明瞭化することが可能である。他方、音響信号のうち音声らしさが低い区間については低域成分を維持できるという利点もある。なお、音声とは、声帯の振動により発生する人間の声(voice sound)を意味する。また、「音声らしさ」とは、音響信号における音声の優勢の度合(音響信号が示す音響が音声である尤度)を意味する。
【0006】
本発明の好適な態様において、制御部は、音響信号の音声らしさの指標である音声性指標を順次に算定する指標算定部と、音声性指標に応じてゲインを制御する減衰制御部とを含む。例えば、減衰制御部は、音声性指標を閾値と比較し、当該音声性指標が示す音声らしさが低い場合には、低域成分を通過させるようにゲインを設定し、音声性指標が示す音声らしさが高い場合には低域成分を遮断するようにゲインを設定する。以上の態様では、音響信号の音声らしさが高い場合には低域成分の遮断により音声が明瞭化され、音響信号の音声らしさが低い場合には低域の通過により低域成分が維持される。したがって、音声を明瞭化する効果と低域成分を忠実に再現する効果とは格別に顕著である。
【0007】
他の態様において、減衰制御部は、音声性指標を低域成分の減衰のゲインとして音響処理部に指示する。以上の構成によれば、低域成分の減衰のゲインの急激な変動が抑制されるから、音響信号の振幅の不連続な変動に起因した雑音が抑制されるという利点がある。
【0008】
本発明の好適な態様において、指標算定部は、音響信号のうち第1周波数を下回る第1成分のエネルギーを算定する第1算定部と、音響信号のうち第1周波数よりも高い第2周波数を下回る第2成分のエネルギーを算定する第2算定部と、第1成分のエネルギーと第2成分のエネルギーとの相違に応じた音声性指標を算定する第3算定部とを含む。以上の構成によれば、音響信号の音声らしさを高精度に反映した音声性指標を第1成分のエネルギーと第2成分のエネルギーとに応じて簡便に算定できるという利点がある。なお、音響信号の調波構造の有無に応じて制御部が音声らしさを解析することも可能である。
【0009】
本発明の好適な態様において、音響処理部は、音響信号のうち音声帯域を含む帯域の成分を通過させる第1フィルタ部と、音響信号のうち低域成分を通過させる第2フィルタ部と、第2フィルタの通過成分を可変のゲインで減衰させる減衰部と、第1フィルタ部の処理後の成分と減衰部による処理後の成分とを加算する加算部とを含む。以上の構成では、第2フィルタ部を通過した低域成分が選択的に減衰されるから、音響信号のうち音声帯域内の成分は減衰されずに維持されるという利点がある。
【0010】
以上の各形態に係る音響処理装置は、例えばマルチチャネルの音響システムに好適に採用される。例えば、左右2チャネルと中央チャネルとを含むマルチチャネルの音響システムでは、左右2チャネルの音響信号が効果音等の低域成分を豊富に包含し、中央チャネルの音響信号が会話音等の音声を豊富に包含するという傾向がある。したがって、前述の各形態に係る音響処理装置を中央チャネルの音響信号の処理に適用した音響システムが格別に好適である。
【図面の簡単な説明】
【0011】
【図1】本発明の第1実施形態に係る音響システムのブロック図である。
【図2】音響処理装置のブロック図である。
【図3】指標算定部のブロック図である。
【発明を実施するための形態】
【0012】
<第1実施形態>
図1は、本発明の第1実施形態に係る音響システム10のブロック図である。音響システム10は、信号処理装置12と3個のスピーカ14(14C,14R,14L)とを具備するサラウンドシステムである。スピーカ14Cは受聴者の正面に配置され、スピーカ14Rは受聴者の右前方に配置され、スピーカ14Lは受聴者の左前方に配置される。なお、受聴者の左右後方に位置する一対のリアスピーカや低域用のスピーカ(サブウーハ)を追加することも可能である。
【0013】
図1に示すように、信号処理装置12には3チャネルの音響信号A(AC,AR,AL)が信号供給装置16から供給される。信号供給装置16は、例えばDVD(Digital Versatile Disk)等の記録媒体から各音響信号Aを取得して信号処理装置12に供給する再生装置や、他の通信端末から送信された各音響信号Aを通信網から受信して信号処理装置12に供給する通信装置である。なお、信号供給装置16と信号処理装置12とを一体に構成することも可能である。各音響信号Aは、例えば、出演者の会話音等の音声と爆発音等の効果音(背景音)とを含む映像作品の音声を示す。音響信号ARおよび音響信号ALは、典型的には効果音を豊富に包含する音響信号である。他方、音響信号ACは、典型的には音声を豊富に包含するが、音響信号ARや音響信号ALに存在する効果音も混在する。
【0014】
信号処理装置12は、3チャネルの音響信号Aに対する効果付与等の音響処理で3チャネルの音響信号B(BC,BR,BL)を生成する装置である。音響信号BLはスピーカ14Lに供給され、音響信号BRはスピーカ14Rに供給され、音響信号BCはスピーカ14Cに供給される。各スピーカ14(14C,14R,14L)は各音響信号B(BC,BR,BL)に応じた音波を再生する。なお、各音響信号Bをアナログ信号に変換するD/A変換器や変換後の信号を増幅する増幅器の図示は便宜的に省略されている。
【0015】
信号処理装置12は、音響信号ACを処理する図2の音響処理装置100を含んで構成される。図2に示すように、音響処理装置100は、音響処理部20と制御部30とを具備する。音響処理部20は、音響信号ACのうち人間の音声が含まれる帯域(以下「音声帯域」という)を下回る低域成分CLを可変のゲインGで減衰させることで音響信号BCを生成する。制御部30は、音響信号ACの音声らしさを解析した結果に応じて、音響処理部20による低域成分CLの減衰のゲインGを制御する。具体的には、制御部30は、音響信号ACの音声らしさが高い場合に、音声らしさが低い場合と比較して低域成分CLが減衰されるようにゲインGを順次に制御する。
【0016】
図2に示すように、音響処理部20は、第1フィルタ部22と第2フィルタ部24と減衰部26と加算部28とを具備する。第1フィルタ部22は、音響信号ACのうち音声帯域を含む帯域成分(以下「高域成分」という)CHを選択的に通過させる。音声帯域の下限値が80Hz程度であることを考慮して、第1実施形態では、音響信号ACのうち例えば40Hz以上の成分を高域成分CHとして例示する。したがって、例えば遮断周波数が40Hz程度に設定された高域通過フィルタや、通過帯域の下限値が40Hz程度に設定された帯域通過フィルタが第1フィルタ部22として採用される。
【0017】
第2フィルタ部24は、音響信号ACのうち低域成分CLを選択的に通過させる。第1実施形態では、音響信号ACのうち例えば40Hz以下の成分を低域成分CLとして例示する。したがって、例えば遮断周波数が40Hz程度に設定された低域通過フィルタや通過帯域の上限値が40Hz程度に設定された帯域通過フィルタが第2フィルタ部24として採用され得る。以上のように、第1フィルタ部22および第2フィルタ部24は、音響信号ACを高域成分CHと低域成分CLとに帯域分割する。
【0018】
図2の減衰部26は、第2フィルタ部24を通過した低域成分CLを可変のゲインGで減衰させる。具体的には、低域成分CLにゲイン(調整値)Gを乗算する乗算器が減衰部26として採用される。加算部28は、第1フィルタ部22を通過した高域成分CHと減衰部26による処理後の低域成分CL-Aとを加算することで音響信号BCを生成する。
【0019】
図2に示すように、制御部30は、指標算定部32と減衰制御部34とを具備する。指標算定部32は、音響信号ACの音声らしさの指標である音声性指標Iを所定の周期(例えば40ミリ秒)で順次に算定する。減衰制御部34は、指標算定部32が算定した音声性指標Iに応じて減衰部26のゲインGを制御する。したがって、減衰部26のゲインGは、音声性指標Iに応じて経時的に変化する。
【0020】
図3は、指標算定部32のブロック図である。図3に示すように、指標算定部32は、第1算定部42と第2算定部44と第3算定部46とを具備する。第1算定部42は、音響信号ACのうち第1成分C1のエネルギー(パワー)E1を順次に算定する要素であり、フィルタ部52と演算部54とを含む。フィルタ部52は、音響信号ACのうち第1周波数F1を下回る帯域成分を第1成分C1として選択的に通過させる。第1成分C1は、爆発音等の効果音を含むとともに音声の主要な成分を含まない成分である。音声帯域の下限値は80Hz程度であるから、第1周波数F1は例えば100Hz程度に設定される。例えば、遮断周波数(第1周波数F1)を100Hz程度に設定した低域通過フィルタがフィルタ部52として好適に採用され、音響信号ACのうち0Hzから100Hzの帯域成分が第1成分C1として抽出される。演算部54は、フィルタ部52を通過した第1成分C1の成分値を自乗することで第1成分C1のエネルギーE1を算定する。
【0021】
第2算定部44は、音響信号ACのうち第2成分C2のエネルギーE2を順次に算定する要素であり、フィルタ部62と演算部64とを含む。フィルタ部62は、音響信号ACのうち第2周波数F2を下回る帯域成分を第2成分C2として選択的に通過させる。第1成分C1が音声の主要な成分を含まないのに対し、第2成分C2は効果音および音声の双方を包含する。したがって、第2周波数F2は第1周波数F1を上回る(F2>F1)。具体的には、遮断周波数(第2周波数F2)を250Hz程度に設定した低域通過フィルタがフィルタ部62として採用され、音響信号ACのうち0Hzから250Hzの帯域成分が第2成分C2として抽出される。演算部64は、フィルタ部62を通過した第2成分C2の成分値を自乗して第2成分C2のエネルギーE2を算定する。
【0022】
図3の第3算定部46は、第1成分C1のエネルギーE1と第2成分C2のエネルギーE2との相違に応じた音声性指標Iを順次に算定する。具体的には、第1実施形態の第3算定部46は、エネルギーE2に対するエネルギーE1の比を音声性指標I(I=E1/E2)として算定する。なお、前述のように第2成分C2の帯域(0〜250Hz)は第1成分C1の帯域(0〜100Hz)を包含するから、エネルギーE1はエネルギーE2以下の数値となる。したがって、音声性指標Iは1以下の数値(0≦I≦1)に設定される。
【0023】
音響信号ACのうち音声のみを含む区間では、第1成分C1のエネルギーE1が第2成分C2のエネルギーE2に対して低下する(0に近付く)から、音声性指標Iは0に近付く。他方、音響信号ACのうち爆発音等の効果音が音声と比較して優勢である区間では、エネルギーE1およびエネルギーE2の双方が増大するから、音声性指標Iは1に近付く。すなわち、音響信号ACの音声らしさが高いほど音声性指標Iは減少し、音響信号ACの音声らしさが低いほど音声性指標Iは増加する。以上の説明から理解されるように、音響信号ACの音声らしさの指標として音声性指標Iは利用され得る。
【0024】
図2の減衰制御部34は、指標算定部32(第3算定部46)が算定した音声性指標Iを所定の閾値Thと比較した結果に応じた減衰部26のゲインGを制御する。閾値Thは、音声性指標Iの数値範囲内で事前に設定された数値(例えばTh=0.5)である。第1実施形態の減衰制御部34は、音声性指標Iが閾値Thを上回る(すなわち、音響信号ACの音声らしさが低い)場合に、減衰部26のゲインGを、低域成分CLを通過させる数値(G=1)に設定し、音声性指標Iが閾値Thを下回る(すなわち、音響信号ACの音声らしさが高い)場合には、減衰部26のゲインGを、低域成分CLを遮断させる数値(G=0)に設定する。すなわち、第1実施形態の制御部30は、減衰部26のゲインGを2値的に制御する。したがって、減衰部26は、低域成分CLの通過/遮断を制御するスイッチとして機能する。
【0025】
以上の構成によれば、音響信号ACの音声らしさが高い場合(I<Th)には、低域成分CLが遮断されることで音響信号ACの音声は充分に明瞭化される。他方、音響信号ACの音声らしさが低い場合(I>Th)には、低域成分CLが維持されるから、音響信号ACの効果音の音量が充分に維持された臨場感(サラウンド感)のある音場を形成することが可能である。また、音響信号ACに対するゲインGが可変に制御されるから、例えば音声のフォルマントを選択的に強調する特許文献2の技術と比較すると、音響信号ACの再生音を自然な音色に維持できるという利点もある。
【0026】
なお、特許文献1の技術では、左右チャネルの音響信号が減衰されるから、各チャネルのバランスが変動し、受聴者が知覚する音像が所期の位置に忠実に定位しない可能性がある。第1実施形態では、音響信号ARおよび音響信号ALの減衰が不要であるから、音像の定位感を忠実に再現できるという利点もある。
【0027】
<第2実施形態>
本発明の第2実施形態について説明する。第1実施形態では、ゲインGを2値的に制御する構成を例示したが、第2実施形態ではゲインGを多値的に制御する。なお、以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0028】
指標算定部32が算定する音声性指標Iは0から1までの範囲内で変動する。そこで、第2実施形態の減衰制御部34は、指標算定部32が算定した音声性指標Iを低域成分CLの減衰のゲインGとして音響処理部20(減衰部26)に指示する。すなわち、減衰部26のゲインGは0以上かつ1以下の範囲内で多値的に変化する。具体的には、音響信号ACの音声らしさが経時的に上昇するにつれてゲインGの低下により低域成分CLの減衰の度合が連続的に増加し、音響信号ACの音声らしさが経時的に低下するにつれてゲインGの上昇により低域成分CLの減衰の度合が連続的に減少する。
【0029】
第1実施形態では、低域成分CLの減衰のゲインGが2値的に変動するから、音響処理装置100による処理後の音響信号BCの振幅が不連続に変動し、雑音(「プツ」という雑音)が発生する可能性がある。第2実施形態では、低域成分CLの減衰のゲインGが0から1までの範囲内で連続的に変化するから、音響信号BCの振幅の不連続な変動が防止される。したがって、音響信号BCの振幅の不連続な変動に起因した雑音を抑制できるという利点がある。
【0030】
<変形例>
以上の実施形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
【0031】
(1)前述の各形態では3チャネルの音響システム10を例示したが、左右2チャネルの音響システム(ステレオシステム)にも同様に本発明を適用することが可能である。左右2チャネルの音響システムでは、左右の一方のチャネルの音響信号Aを音響処理装置100で処理する構成や、双方のチャネルの音響信号Aを音響処理装置100で処理する構成が採用され得る。また、モノラルの音響システム(モノラルシステム)に本発明を適用することも可能である。
【0032】
(2)音響処理部20の構成は適宜に変更される。例えば、制御部30から指示されたゲインGに応じて音響信号ACの低域成分CLを選択的に減衰させるパラメトリックイコライザを音響処理部20として利用することも可能である。
【0033】
(3)音声性指標Iを算定する方法や音声性指標Iに応じてゲインGを制御する方法は適宜に変更される。例えば、第1成分C1のエネルギーE1と第2成分C2のエネルギーE2との差分(E2−E1)を音声性指標Iとして算定する構成でも、エネルギーE2がエネルギーE1に対して大きい(すなわち音響信号ACの音声らしさが高い)ほどゲインGを小さい数値に設定することで、前述の各形態と同様の効果が実現される。以上の説明から理解されるように、第1成分C1のエネルギーE1と第2成分C2のエネルギーE2との相違に応じた任意の数値が音声性指標Iとして利用され得る。また、エネルギーE1とエネルギーE2とを変数とする所定の演算によりゲインGを算定することも可能である。
【0034】
(4)制御部30が音響信号ACの音声らしさを解析する方法は適宜に変更される。例えば、爆発音等の効果音と比較すると音声(有声音)では調波構造が顕著になるという傾向を考慮すると、音響信号ACの調波構造(周期性)の有無に応じて制御部30が音声らしさを判定する構成も採用される。調波構造の有無は、例えば音響信号ACの自己相関関数に応じて判定され得る。また、不特定多数の発声者の音声の特徴量をモデル化した音響モデルを用意し、音響信号ACから抽出される特徴量を音響モデルと対比することで音響信号ACの音声らしさを判定することも可能である。
【符号の説明】
【0035】
10……音響システム、12……信号処理装置、14(14C,14R,14L)……スピーカ、16……信号供給装置、100……音響処理装置、20……音響処理部、22……第1フィルタ部、24……第2フィルタ部、26……減衰部、28……加算部、30……制御部、32……指標算定部、34……減衰制御部、42……第1算定部、44……第2算定部、46……第3算定部、52,62……フィルタ部、54,64……演算部、A(AC,AR,AL)……音響信号、B(BC,BR,BL)……音響信号、CH……高域成分、CL……低域成分、E1,E2……エネルギー、G……ゲイン、I……音声性指標。


【特許請求の範囲】
【請求項1】
音響信号のうち音声帯域を下回る低域成分を可変のゲインで減衰させる音響処理部と、
前記音響信号の音声らしさを順次に解析し、音声らしさが高い場合に、音声らしさが低い場合と比較して低域成分が減衰されるように前記ゲインを制御する制御部と
を具備する音響処理装置。
【請求項2】
前記制御部は、
前記音響信号の音声らしさの指標である音声性指標を順次に算定する指標算定部と、
前記音声性指標に応じて前記ゲインを制御する減衰制御部とを含む
請求項1の音響処理装置。
【請求項3】
前記減衰制御部は、
前記音声性指標を閾値と比較し、当該音声性指標が示す音声らしさが低い場合には、前記低域成分を通過させるように前記ゲインを設定し、前記音声性指標が示す音声らしさが高い場合には前記低域成分を遮断するように前記ゲインを設定する
請求項2の音響処理装置。
【請求項4】
前記減衰制御部は、前記音声性指標を前記低域成分の減衰のゲインとして前記音響処理部に指示する
請求項2の音響処理装置。
【請求項5】
前記指標算定部は、
前記音響信号のうち第1周波数を下回る第1成分のエネルギーを算定する第1算定部と、
前記音響信号のうち前記第1周波数よりも高い第2周波数を下回る第2成分のエネルギーを算定する第2算定部と、
前記第1成分のエネルギーと前記第2成分のエネルギーとの相違に応じた前記音声性指標を算定する第3算定部とを含む
請求項2から請求項4の何れかの音響処理装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2013−114242(P2013−114242A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−263322(P2011−263322)
【出願日】平成23年12月1日(2011.12.1)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】