説明

音声処理装置および方法、並びにプログラム

【課題】声主体信号のような集中定位信号と臨場音とのバランスを調整して出力できるようにする。
【解決手段】センターバランス補正部32、およびゲイン制御信号生成部33は、声成分信号の平均レベルと、臨場音成分信号平均レベルとに基づいて、ゲイン制御信号Gvを出力する。臨場音バランス補正部35、およびゲイン制御信号生成部36は、声成分信号の平均レベルと、臨場音成分信号平均レベルとに基づいて、ゲイン制御信号Gyを出力する。臨場音レベル補正ゲイン生成部37は、ゲイン制御信号Gyを補正してゲイン制御信号Gsを生成する。可変ゲインアンプ24は、声主体信号Svを、ゲイン制御信号Gsでゲイン制御する。可変ゲインアンプ25,26は、臨場音成分信号を、ゲイン制御信号Gvでゲイン制御する。本発明は、テレビジョン受像機に適用することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声処理装置および方法、並びにプログラムに関し、特に、入力音声信号のうち、集中定位信号と臨場音とのバランスを調整して、集中定位信号と臨場音とをバランスよく出力できるようにした音声処理装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
テレビジョン受像機で受信する放送チャンネルを切り替えたときや、AV(Audio−Visual)システムにおいて、AVセンタで複数の入力機器の切り替えがなされたとき、コンテンツ間のレベル差により、出力音量に大きなが変化が生じてしてしまうことがある。
【0003】
このような場合、ユーザは、自分が好みの音量にするためには、ボリューム操作をして音量調節する必要があり、わずらわしさを感じる場合がある。
【0004】
また、同一コンテンツ内(例えば、同一の放送チャンネル内や同一の放送番組内)においても、コマーシャル(CM)部分やシーンの変化によって、出力音量が変化し、不快に思うことがある。
【0005】
この問題を解決する音量補正方式が従来から種々提案されている。その一例のAGC(Auto Gain Control;自動利得制御)による音量制御方式が広く知られている。
【0006】
しかしながら、入力音声信号のレベルが大きくレベル変動した場合に、そのレベル変化点での音声信号ゲインの急激な変化を完全に抑えることは困難であり、前記レベル変化点で出力音声音量レベルが揺れるなど、聴取者に、聴感上、違和感を与える場合がある。
【0007】
特に、従来の音量補正方式では、音声信号全体を一律に同様にゲイン制御する方式であるため、前記の急激な変化点での音量レベルの揺れに対する違和感が目立つと言う問題があった。
【0008】
そこで、音声信号の成分のうち、例えば、センター集中定位信号などの平均レベルを求めて、出力信号が平均レベルとなるようにゲイン制御する技術が提案されている(引用文献1参照)。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2010−136173号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、特許文献1の技術においては、センター集中定位信号が、人物の声などの場合、いかなる状態でも平均レベルとされることで、声は一定のレベルに保たれるが、臨場音とセンター集中定位信号とのゲイン制御のレベルのバランスを補正させることができなかった。
【0011】
本発明はこのような状況に鑑みてなされたものであり、特に、声主体信号のような集中定位信号と臨場音とのバランスを調整して出力できるようにするものである。
【課題を解決するための手段】
【0012】
本技術の一側面の音声処理装置は、複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御部と、前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御部と、前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出部と、前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出部と、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力部と、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力部とを含み、前記第1成分主体信号ゲイン制御部は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、前記その他成分信号ゲイン制御部は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する。
【0013】
前記第1成分主体信号ゲイン制御信号出力部には、前記第1成分信号の平均レベルに、前記その他成分信号平均レベルを第1の所定の増幅率で増倍した信号を加算して補正する第1信号成分平均レベル補正部と、前記第1成分出力信号が、前記第1信号成分平均レベル補正部により補正された前記第1成分信号の平均レベルとなるように、前記第1成分信号ゲイン制御信号を生成する第1成分信号ゲイン制御信号生成部とを含ませるようにすることができ、前記その他成分信号ゲイン制御信号出力部には、前記第1成分信号の平均レベルに、前記その他成分信号平均レベルを第2の所定の増幅率で増倍した信号を加算して補正する第1信号成分平均レベル補正部と、前記その他成分出力信号が、前記第1信号成分平均レベル補正部により補正された前記第1成分信号の平均レベルとなるように、前記その他成分信号ゲイン制御信号を生成するその他成分信号ゲイン制御信号生成部とを含ませるようにすることができる。
【0014】
前記第1成分主体信号ゲイン制御信号出力部には、前記第1成分出力信号が、前記第1信号成分平均レベルとなるように、第1成分信号ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、前記その他成分信号平均レベルに対応付けて設定される第1の増幅率で増倍して、前記第1成分信号ゲイン制御信号を補正し、補正した前記第1成分信号ゲイン制御信号を出力する第1信号成分平均レベル補正部とを含ませるようにすることができ、前記その他成分信号ゲイン制御信号出力部には、前記その他成分出力信号が、前記第1信号成分平均レベルとなるように、その他成分信号ゲイン制御信号を生成するその他成分ゲイン制御信号生成部と、前記その他成分信号平均レベルに対応付けて設定される第2の増幅率で増倍して、前記その他成分信号ゲイン制御信号を補正し、補正した前記その他成分信号ゲイン制御信号を出力するその他信号成分平均レベル補正部とを含ませるようにすることができる。
【0015】
第1成分ゲイン制御信号生成部と、前記その他成分信号ゲイン制御信号出力部とは、共通とすることができ、第1成分ゲイン制御信号生成部により生成される第1成分ゲイン制御信号と、前記その他成分信号ゲイン制御信号出力部により生成されるその他成分信号ゲイン制御信号とは、同一とすることができる。
【0016】
前記その他成分信号ゲイン制御信号出力部より出力される、前記その他成分信号ゲイン制御信号を補正するその他信号成分信号ゲイン制御信号補正部を含ませるようにすることができる。
【0017】
前記第1成分信号は、センター集中定位信号とすることができる。
【0018】
前記第1成分出力信号と、前記その他成分出力信号とを加算した加算出力信号を、音量補正後の音声出力信号とする加算手段をさらに含ませるようにすることができる。
【0019】
本技術の一側面の音声処理方法は、複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御部と、前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御部と、前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出部と、前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出部と、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力部と、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力部とを含み、前記第1成分主体信号ゲイン制御部は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、前記その他成分信号ゲイン制御部は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する音声処理装置における音声処理方法であって、前記第1成分主体信号ゲイン制御部における、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御ステップと、前記その他成分信号ゲイン制御部における、前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御ステップと、前記第1成分信号平均レベル検出部における、前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出ステップと、前記その他成分信号平均レベル検出部における、前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出ステップと、前記第1成分主体信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力ステップと、前記その他成分信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力ステップとを含み、前記第1成分主体信号ゲイン制御ステップの処理は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、前記その他成分信号ゲイン制御ステップの処理は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する。
【0020】
本技術の一側面のプログラムは、複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御部と、前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御部と、前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出部と、前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出部と、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力部と、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力部とを含み、前記第1成分主体信号ゲイン制御部は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、前記その他成分信号ゲイン制御部は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する音声処理装置を制御するコンピュータに、前記第1成分主体信号ゲイン制御部における、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御ステップと、前記その他成分信号ゲイン制御部における、前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御ステップと、前記第1成分信号平均レベル検出部における、前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出ステップと、前記その他成分信号平均レベル検出部における、前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出ステップと、前記第1成分主体信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力ステップと、前記その他成分信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力ステップとを含む処理を実行させ、前記第1成分主体信号ゲイン制御ステップの処理は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、前記その他成分信号ゲイン制御ステップの処理は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する。
【0021】
本技術の電子機器は、請求項1乃至7のいずれかの音声処理装置を含む。
【0022】
本技術の一側面においては、複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号が、ゲイン制御されて出力され、前記入力音声信号のうち、前記第1成分以外の、その他成分信号が、ゲイン制御されて出力され、前記第1成分信号の平均レベルが検出され、前記その他成分信号の平均レベルが検出され、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号が出力され、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号が出力され、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号が、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御されて第1成分出力信号として出力され、前記第1成分以外の、その他成分信号が、その他成分信号ゲイン制御信号に基づいて、ゲイン制御されてその他成分出力信号として出力される。
【0023】
本発明の音声処理装置は、独立した装置であっても良いし、音声処理を行うブロックであっても良い。
【発明の効果】
【0024】
本技術の一側面によれば、入力音声信号のうち、センター集中定位信号を含む成分と、それ以外の成分とのバランスを調整して音声補正することが可能となる。
【図面の簡単な説明】
【0025】
【図1】この技術による音量補正装置が適用される電子機器の例を説明するためのブロック図である。
【図2】この技術による音量補正装置の第1の実施形態を説明するためのブロック図である。
【図3】図1の実施形態におけるセンター集中定位信号生成部の構成例を示すブロック図である。
【図4】図1の実施形態におけるセンター集中定位信号生成部の他の構成例を示すブロック図である。
【図5】図4の例のセンター集中定位信号生成部の一部の構成例を説明するためのブロック図である。
【図6】図5の構成例の各部を説明するために用いる図である。
【図7】図5の構成例の各部を説明するために用いる図である。
【図8】図5の構成例の各部を説明するために用いる図である。
【図9】図5の構成例の各部を説明するために用いる図である。
【図10】図5の構成例の各部を説明するために用いる図である。
【図11】図5の構成例の各部を説明するために用いる図である。
【図12】図5の構成例の各部を説明するために用いる図である。
【図13】図2の臨場音平均レベル検出部の構成例を説明するために用いる図である。
【図14】図2のセンターバランス補正部の構成例を説明するために用いる図である。
【図15】図2の臨場音バランス補正部の構成例を説明するために用いる図である。
【図16】図2の臨場音レベル補正ゲイン生成部の構成例を説明するために用いる図である。
【図17】図2の臨場音レベル補正ゲイン生成部の構成例を説明するために用いる図である。
【図18】図2の音量補正装置による音量補正処理を説明するために用いるフローチャートである。
【図19】図2の音量補正装置による臨場音レベル補正ゲイン制御信号生成処理を説明するために用いるフローチャートである。
【図20】この技術による音量補正装置の第2の実施形態を説明するためのブロック図である。
【図21】図20のバランス補正ゲイン生成部の動作を説明するために用いる図である。
【図22】図20の臨場音平均レベル検出部の構成例を説明するために用いる図である。
【図23】図20のセンターバランス補正部の構成例を説明するために用いる図である。
【図24】図20の音量補正装置による音量補正処理を説明するために用いるフローチャートである。
【図25】この技術による音量補正装置の第2の実施形態の変形例を説明するためのブロック図である。
【図26】この技術による音量補正装置の第3の実施形態を説明するためのブロック図である。
【図27】図26の音量補正装置による音量補正処理を説明するために用いるフローチャートである。
【図28】この技術による音量補正装置の第3の実施形態を説明するためのブロック図である。
【図29】図28の音量補正装置による音量補正処理を説明するために用いるフローチャートである。
【図30】汎用のパーソナルコンピュータの構成例を説明する図である。
【発明を実施するための最良の形態】
【0026】
以下、発明を実施するための形態(以下、実施の形態という)について説明する。なお、説明は以下の順序で行う。
1. 第1の実施の形態(ゲイン制御信号を生成する前にバランス補正する場合の一例)
2. 第2の実施の形態(ゲイン制御信号を生成した後でバランス補正する場合の一例)
3. 変形例
4. 第3の実施の形態(第1の実施の形態で臨場音レベル補正ゲイン生成部を削除する場合の一例)
5. 第4の実施の形態(第2の実施の形態で臨場音レベル補正ゲイン生成部を削除する場合の一例)
【0027】
<1.第1の実施の形態>
[テレビジョン受像機の構成例]
以下、本技術による音声処理装置である音量補正装置の実施形態を、図面を参照しながら説明する。尚、以下に説明する音量補正装置の実施形態は、テレビジョン受像機の音声出力部に用いる場合を示している。ただし、音量補正装置の実施形態は、これに限るものではなく、音声を出力する装置であれば、その他の装置であっても適用することができるものである。
【0028】
すなわち、図1は、テレビジョン受像機の構成例を示すブロック図である。この図1の例のテレビジョン受像機は、マイクロコンピュータを具備して構成される制御部10を備える。この制御部10には、リモコン受信部11が接続され、このリモコン受信部11でリモコン送信機12からのリモコン信号を受けて、制御部10に伝達する。制御部10は、受信したリモコン信号に応じた処理制御を実行する。
【0029】
制御部10は、テレビジョン受像機の各部に対して制御信号を供給して、テレビ放送信号の受信およびその映像再生および音声再生の処理を実行する。
【0030】
チューナ部13は、制御部10からのユーザのリモコン操作に応じたチャンネル選択制御信号により指定される放送チャンネルの信号を、テレビ放送波信号から選択抽出する。そして、チューナ部13は、選択抽出した放送チャンネルの信号から、映像信号と、音声信号とを復調デコードし、映像信号は映像信号処理部14に供給し、音声信号は、音声信号処理部15に供給する。
【0031】
映像信号処理部14では、制御部10からの制御を受けて、映像信号についての所定の処理をし、その処理後の映像信号を表示制御部16を通じて、例えばLCD(Liquid Crystal Display)からなるディスプレイ17に供給する。これにより、選択された放送チャンネルの放送番組の画像がディスプレイ17に表示される。
【0032】
また、音声信号処理部15では、制御部10からの制御を受けて、音声信号についての所定の処理をする。この実施形態では、音声信号処理部15では、チューナ部13からの音声信号から、左右2チャンネルの音声信号SiL,SiRを生成し、その処理後の音声信号SiL,SiRを音量補正部18に供給する。
【0033】
音量補正部18は、この実施形態の音量補正装置が適用される部分であり、その入力音声信号SiL,SiRは、後述するようにして、音量補正され、出力音声信号SoLおよびSoRとして出力される。そして、この音量補正部18からの出力音声信号SoLおよびSoRが、スピーカ19Lおよび19Rに供給されて、音響再生される。これにより、選択された放送チャンネルの放送番組の音声がスピーカ19Lおよび19Rから放音される。
【0034】
以下、この音量補正部18の場合として、この実施形態の音量補正装置について説明する。
【0035】
[音量補正装置の第1の実施形態]
図2は、この技術の音量補正部18の第1の実施形態としての音量補正装置の全体の構成例を示すブロック図である。
【0036】
この第1の実施形態では、入力音声信号は、左右2チャンネルの音声信号とされる。そして、第1成分主体信号は、左右2チャンネルの音声信号中の主として人声成分を主体とする信号(以下、声主体信号という)とされる。また、第1成分以外の他の音声成分は、左右2チャンネルの音声信号のうちの、この声主体信号以外の、いわゆる臨場音とされる。この臨場音を主体とする信号を、以下、臨場音主体信号(または臨場音信号)という。
【0037】
この図2に示すように、この第1の実施形態においては、左右2チャンネルの入力音声信号SiL,SiRは、声主体信号と臨場音主体信号との分離部20に供給される。この例の分離部20は、センター集中定位信号検出部21と、2個の減算部22,23とからなる。
【0038】
センター集中定位信号検出部21には、左右2チャンネルの入力音声信号SiL,SiRが共に供給され、左右チャンネルの中央(センター)に定位するセンター集中定位信号として、声主体信号Svを検出する。センター集中定位信号検出部21で検出された声主体信号Svは、減算部22,23、並びに、可変ゲインアンプ24に供給される。
【0039】
減算部22では、左チャンネルの音声信号SiLから、声主体信号Svが減算されて、左チャンネルの臨場音主体信号SsLが得られる。また、減算部23では、右チャンネルの音声信号SiRから、声主体信号Svが減算されて、右チャンネルの臨場音主体信号SsRが得られる。
【0040】
こうして、分離部20では、2チャンネル音声信号SiL,SiRから、声主体信号Svと、左右チャンネルの臨場音主体信号SsL,SsRとが分離されて得られる。
【0041】
そして、この分離部20からの声主体信号Svは、可変ゲインアンプ24を通じて加算部27,28に供給されると共に、補正ゲイン生成部30に供給される。
【0042】
この例では、補正ゲイン生成部30は、平均レベル検出部31、センターバランス補正部32、ゲイン制御信号生成部33、臨場音平均レベル検出部34、臨場音バランス補正部35、およびゲイン制御信号生成部36とからなる。平均レベル検出部31は、声主体信号Svの平均レベルを検出して、その検出した平均レベルをセンターバランス補正部32および臨場音バランス補正部35に供給する。臨場音平均レベル検出部34は、2チャンネル音声信号SiL,SiRから、臨場音主体信号の平均レベルを検出して、その検出した平均レベルをセンターバランス補正部32および臨場音バランス補正部35に供給する。
【0043】
センターバランス補正部32は、声主体信号Svの平均レベルを、臨場音主体信号の平均レベルに基づいて、所定の処理により補正して、ゲイン制御信号生成部33に供給する。臨場音バランス補正部35は、声主体信号Svの平均レベルを、臨場音主体信号の平均レベルに基づいて、所定の処理により補正して、ゲイン制御信号生成部36に供給する。
【0044】
ゲイン制御信号生成部33は、センターバランス補正部32により、臨場音主体信号の平均レベルに基づいて補正された、声主体信号Svの平均レベルが、予め定めた基準レベルとなるようにするためのゲイン制御信号Gvを生成する。そして、ゲイン制御信号生成部33は、生成したゲイン制御信号Gvを可変ゲインアンプ24に供給する。
【0045】
ゲイン制御信号生成部36は、臨場音バランス補正部35により、臨場音主体信号の平均レベルに基づいて補正された、声主体信号Svの平均レベルが、予め定めた基準レベルとなるようにするためのゲイン制御信号Gyを生成する。そして、ゲイン制御信号生成部36は、生成したゲイン制御信号Gyを臨場音レベル補正ゲイン生成部37に供給する。
【0046】
したがって、可変ゲインアンプ24においては、ゲイン制御信号Gvにより、声主体信号Svのレベルが大きく変動しても、声主体信号の平均レベルが一定レベル(基準レベル)になるようにゲイン制御される。また、この際、ゲイン制御信号Gvは、臨場音平均レベルに基づいて、声主体信号と臨場音とのバランスが調整されたものであるので、可変ゲインアンプ24から出力される補正後声主体信号Svcの出力レベルは、臨場音と声主体信号とのバランスが調整されたうえで、一定レベルとされる。そして、この一定レベルとされた補正後声主体信号Svcが、加算部27,28に供給される。
【0047】
臨場音レベル補正ゲイン生成部37は、ゲイン制御信号生成部36からのゲイン制御信号Gyを受けて、このゲイン制御信号Gyに基づく処理を行って、臨場音主体信号をゲイン補正するゲイン制御信号Gsを生成し、可変ゲインアンプ25,26に供給する。
【0048】
すなわち、臨場音レベル補正ゲイン生成部37は、ゲイン制御信号Gyに対して、何らかの処理を加えるので、ゲイン制御信号Gvによる声主体信号Svに対するゲイン制御態様と、ゲイン制御信号Gsによる臨場音主体信号SsL,SsRに対するゲイン制御態様とは、異なるものとなる。
【0049】
可変ゲインアンプ25,26は、臨場音レベル補正ゲイン生成部37からゲイン制御信号Gsの供給を受けて、このゲイン制御信号Gsに基づいて、左右チャンネルの臨場音主体信号SsL,SsRに対して、声主体信号Svとは異なるゲイン制御を行う。
【0050】
加算部27は、補正後の左チャンネルの臨場音主体信号SsLcと補正後声主体信号Svcとを加算し、その加算出力として、音量補正された左チャンネルの出力音声信号SoLを出力する。
【0051】
また、加算部28は、補正後の右チャンネルの臨場音主体信号SsRcと補正後声主体信号Svcとを加算し、その加算出力として、音量補正された右チャンネルの出力音声信号SoRを出力する。
【0052】
ところで、ゲイン制御信号Gyは、臨場音平均レベルに基づいて、臨場音と声主体信号とのバランスが調整されたものである。このため、ゲイン制御信号Gyに基づいて求められる、ゲイン制御信号Gsによる臨場音主体信号SsL,SsRに対するゲイン制御態様は、入力音声信号の大きなレベル変動に対して即座に追従しないようなものにされると共に、臨場音と声主体信号とのバランスが調整されたものにされる。すなわち、声主体信号Svに対するゲイン制御態様は、入力音声信号のレベル変動に即座に追従して、臨場音と声主体信号とのバランスを調整しつつ、出力レベルをある程度一定にする。しかしながら、臨場音主体信号SsL,SsRに対するゲイン制御態様は、それとは異なり、臨場音と声主体信号とのバランスを調整しつつ、入力音声信号の大きなレベル変動に対して即座に追従しない特性のものとされる。
【0053】
したがって、左右チャンネルの臨場音主体信号SsL,SsRは、可変ゲインアンプ25,26で、ゲイン制御されて加算部27,28に供給される。そして、臨場音主体信号SsL,SsRに対するゲイン制御態様は、臨場音と声主体信号とのバランスを調整しつつ、入力音声信号の大きなレベル変動に対して即座に追従しない特性のものとされている。
【0054】
したがって、臨場音主体信号、および声主体信号は、それぞれのバランスを調整しつつ、声主体信号について生じる大きなレベル変化点での音量レベルの揺れが抑制される。
【0055】
このため、加算部27,28からの左右チャンネルの出力音声信号SoL,SoRは、補正後声主体信号Svcの音量レベルの揺れが、左チャンネルおよび右チャンネルの臨場音主体信号SsL,SsRによりマスキングされるようになる。この結果、臨場音と声主体信号とのバランスを調整しつつ、声主体信号Svcの音量レベルの揺れが、目立たなくなり、聴取者に対する違和感が軽減される。
【0056】
以上の構成により、声主体信号は、素早く適正レベルに遷移されることになるので、人声のレベルの一定感を保ち、台詞などの人声を聞き易くすることができる。さらに、臨場音主体信号は、臨場感がある程度一定に保たれるため、レベルを変えることによる違和感が軽減され、これによってより自然なレベル遷移を実現することができるようになる。
【0057】
なお、以上の例では、左右2チャンネル用のスピーカにより音声信号を音響再生する場合であるので、加算部27,28を設けるようにした。しかし、左右2チャンネル用のスピーカに加えて、センターチャンネル用のスピーカを設けた場合には、補正後声主体信号をセンターチャンネル用スピーカに供給し、可変ゲインアンプ25,26の出力音声信号を左右2チャンネル用のスピーカに供給するようにしても良い。この場合には、センターチャンネル用のスピーカの放音音声と、左右2チャンネル用のスピーカの放音音声とが、音響的に合成されることにより、ゲイン制御による音量レベルの揺れがマスキングされ、目立たなくなる。
【0058】
[センター集中定位信号検出部21の構成例]
<第1の例>
図3は、センター集中定位信号検出部21の第1の構成例を示すものである。この例においては、センター集中定位信号検出部21は、加算部211と、固定ゲイン「0.5」のアンプ212とからなる。
【0059】
そして、この例のセンター集中定位信号検出部21においては、左右チャンネルの入力音声信号SiL,SiRが加算部211で加算され、その加算出力信号がアンプ212を通じて出力される。このアンプ212の出力信号が声主体信号Svとされる。
【0060】
なお、この第1の例の場合には、声主体信号Svの平均値は、左右チャンネルの入力音声信号SiL,SiRの加算信号の平均値に等しくなる。そして、補正ゲイン生成部30は、声主体信号Svの平均値が一定レベルとなるようにゲイン制御信号Gvを生成する。よって、この第1の例の場合には、補正ゲイン生成部30は、左右チャンネルの入力音声信号SiL,SiRの加算信号、つまり、入力音声信号全体のレベルが一定レベルとなるようにゲイン制御信号Gvを生成していることにもなる。
【0061】
<第2の例>
図4は、センター集中定位信号検出部21の第2の構成例を示すものである。この第2の例は、第1の例の出力をそのまま出力するのではなく、第1の例の出力よりも、さらにセンター定位成分のみの成分に応じた信号を得るようにする例である。
【0062】
この例においては、センター集中定位信号検出部21は、第1の例の加算部211および固定ゲイン「0.5」のアンプ212に加えて、ゲイン調整アンプ213と、センター集中定位率検出部214とを備える。
【0063】
この例のセンター集中定位信号検出部21においては、アンプ212の出力信号はゲイン調整アンプ213に供給され、このゲイン調整アンプ213の出力信号が声主体信号Svとされる。
【0064】
そして、この例のセンター集中定位信号検出部21において、左右チャンネルの入力音声信号SiL,SiRは、センター集中定位率検出部214にも供給される。このセンター集中定位率検出部214においては、入力音声全体に対するセンターに集中的に定位する信号の割合に応じて、ゲイン調整アンプ213のゲインを制御するゲイン制御信号Gatが生成される。
【0065】
そして、センター集中定位率検出部214からのゲイン制御信号Gatにより、ゲイン調整アンプ213のゲインが制御されることで、声主体信号Svは、アンプ212の出力のうち、センターに集中的に定位する率に応じた信号成分からなるものとなる。つまり、この第2の例の声主体信号Svは、第1の例よりも、さらにセンターに集中的に定位する信号成分からなる信号となる。
【0066】
センター集中定位率検出部214は、例えば図5に示すような構成を有するものとすることができる。
【0067】
すなわち、センター集中定位率検出部214は、帯域制限フィルタ2141,2142と、定位方向検出部2143と、定位方向分布計測部2144と、センターゲイン制御信号生成部2145とを備えて構成される。
【0068】
センター集中定位率検出部214に入力された左右2チャンネルの入力音声信号SiL,SiRは、それぞれ帯域制限フィルタ2141,2142において、例えば低域成分等、定位方向をあまり感じない周波数帯域の成分が除去される。
【0069】
そして、帯域制限フィルタ2141,2142により帯域制限された2チャンネルの入力音声信号SiL,SiRは、定位方向検出部2143に供給される。定位方向検出部2143は、帯域制限された2チャンネルの入力音声信号SiL,SiRのそれぞれのレベルの大きさにより、所定の周期毎の定位方向の検出時点における2チャンネルの入力音声信号SiL,SiRが持つ定位方向を検出する。
【0070】
すなわち、定位方向検出部2143においては、所定のサンプリング周期で、帯域制限された2チャンネルの入力オーディオ信号SiL,SiRのそれぞれのレベル(振幅)をサンプリングする。そして、定位方向検出部2143においては、この例では、最新サンプリング時点における定位方向を現時点における定位方向として検出するようにする。
【0071】
この場合、定位方向検出部2143は、当該最新サンプリング時点における定位方向を、入力音声信号SiL,SiRのそれぞれについての、当該最新サンプリング時点のレベルと、それよりも過去のサンプリング時点のレベルとを用いて検出する。
【0072】
2チャンネルの入力音声信号SiL,SiRが、デジタルオーディオ信号であれば、前記サンプリング周期は、デジタルオーディオ信号のサンプル周期に等しくすることができる。もっとも、前記サンプリング周期を、デジタルオーディオ信号の1サンプル周期と等しくするのではなく、複数サンプル周期とするようにしてもよい。定位方向検出部2143の入力音声信号がアナログ信号である場合には、この定位方向検出部2143の入力段において、デジタルオーディオ信号に変換するようにしても良い。
【0073】
この定位方向検出部2143における定位方向の検出方法を、図6を参照しながら説明する。図6の分布図(A),(B)は、左チャンネルの入力音声信号SiLの振幅をX軸にとり、右チャンネルの入力音声信号SiRの振幅をY軸にとった場合の座標空間を示している。
【0074】
定位方向検出部2143では、まず、各サンプリング周期毎の定位方向の検出時点において2チャンネルの入力音声信号SiL,SiRのそれぞれのレベルを取得して、それに対応する座標点を、図6の分布図(A),(B)の座標空間に、例えばP1,P2,P3,P4のように、プロットしてゆく。この例では、P4が最新の検出時点の座標点であるとする。
【0075】
そして、定位方向検出部2143では、y=k・x(kは定数)で表される直線(X軸とY軸との交点Zを通る直線)を、交点Zを中心として±90°回転させたときに、つまり、定数kを変化させたときに、プロットした座標点P1,P2,P3,P4が、どの定数kの直線(どの傾き角度の直線)の一番近くを移動してゆくかを算出する。つまり、定数kを変えた各直線からの各座標点P1,P2,P3,P4までの距離Da1,Da2,Da3,Da4あるいは距離Db1,Db2,Db3,Db4の総和が最も小さい直線の定数kを算出する。
【0076】
そして、定位方向検出部2143は、算出した直線の定数kに対応する傾き角度を、検出したい現時点における定位方向とする。図7の例では、X軸、つまり、左チャンネルの定位方向(左方向)の角度を0°として、このX軸に対する角度(以下、定位角度という)θを定位方向として検出することとする。
【0077】
図6の分布図(A)の場合の座標点P1,P2,P3,P4の例では、定位角度はθaとして検出され、図6の分布図(B)の場合の座標点P1,P2,P3,P4の例では、定位角度はθbとして検出されるものである。
【0078】
なお、この実施形態では、定位方向検出部2143においては、現時点(最新サンプリング時点)の2チャンネル入力音声信号のレベルと、過去のサンプリング時点における2チャンネル入力音声信号のレベルとは等しい重みで用いてはいない。この実施形態では、定位方向検出部2143においては、現時点に近いサンプリング時点の2チャンネル入力音声信号のレベルほど重みが大きいものとするようにしている。
【0079】
このため、定位方向検出部2143では、2チャンネル入力音声信号のレベルのサンプリング値に対して、図7に示すように、現時点(この例では最新サンプリング時点tn)に近いほど、重みが大きくなるように、指数関数曲線の特性を有する時間ウインドーWD1が用いられている。
【0080】
なお、上述の説明では、処理対象信号時点となる現時点を最新サンプリング時点(最新サンプル時点)とした。しかし、可変ゲインアンプ24乃至26の入力側に所定時間τだけ遅延させる遅延回路を設けて、処理対象となる現時点を、入力音声信号SiL,SiRよりも前記τだけ遅延した時点とすることができる。
【0081】
その場合には、定位方向検出部2143では、処理対象信号時点となる現時点よりも後(未来)の2チャンネル入力音声信号SiL,SiRをも用いて、定位方向を検出するようにすることができる。例えば、図6の例で、処理対象信号時点となる現時点がP2やP3の場合とすることができる。
【0082】
そして、その場合には、前述した時間ウインドーWD1の代わりに、図8に示すような指数関数曲線の特性の時間ウインドーWD2が用いられる。この時間ウインドーWD2は、処理対象信号時点となる現時点tpで最も重みが大きく、現時点tpから離れるにつれ、過去および未来の方向に重みが小さくなるような指数関数曲線の特性を有するものである。
【0083】
なお、現時点の2チャンネル入力オーディオ信号のレベルを、過去および/または未来のサンプリング時点における2チャンネル入力音声信号SiL,SiRのレベルを重み付けせずに、そのままの値で用いても良い。
【0084】
以上のようにして、定位方向検出部2143では、現時点においては、2チャンネル入力音声信号SiL,SiRが、どの方向からの信号であるかを、定位角度θとして検出することができる。
【0085】
しかしながら、検出した現時点における定位角度θは、1時点における入力オーディオ信号の定位方向を一方向に限定したもので、各方向ごとの信号の強さが反映されていない。そこで、この実施形態では、この点にかんがみ、定位方向検出部2143で検出された現時点における2チャンネル入力音声信号SiL,SiRの定位方向の検出結果(定位角度θ)は、定位方向分布計測部2144に供給される。
【0086】
定位方向分布計測部2144では、予め定められた所定時間区間dに渡って定位方向検出部2143で検出された定位角度θの、全方位についての分布を求め、2チャンネル入力音声信号の定位方向が、どの角度方向にどのくらいの割合を持っているかを計測する。
【0087】
この場合、所定時間区間dは、例えば数ミリ秒〜数百ミリ秒、この例では数10ミリ秒に選定されている。そして、この実施形態では、定位方向分布計測部2144では、この所定時間区間dにおける定位方向検出部2143で検出された定位角度θに対して、定位方向検出部2143における重み係数の特性と同様に重み付けをするようにする。
【0088】
すなわち、定位方向分布計測部2144では、現時点tp(この例では、tp=tn(最新サンプリング時点))に近づくほど指数関数的に大きくなるような重み付けをする時間ウインドーWD3(図9参照)をかけて重み付けをするようにする。
【0089】
なお、前述したように、入力オーディオ信号に対して遅延時間τを設けるようにして、定位方向検出部2143での重み付けのための時間ウインドーを、図8のようにする場合には、定位方向分布計測部2144における時間ウインドーも、図8と同様なものとなる。その場合の時間区間dは、現時点tpより未来と過去の両方を含む時間区間となるものである。なお、重み付けをせずに、そのままの値で用いてもよい。
【0090】
図10は、この定位方向分布計測部2144で求められた定位角度θの分布である定位方向分布P(θ)の一例を示すもので、横軸にはX軸(左チャンネル定位方向)を基準にした定位角度θをとり、縦軸には各定位角度の出現度(<1)をとったものである。ここで、この実施形態では、定位方向分布P(θ)をすべての定位角度θについて総和を求めたときに1、すなわち、
ΣP(θ)=1
となるように分布が生成される。
【0091】
また、定位角度θと、音声信号の定位方向との関係は、図11に示すようなものとなる。なお、図11に示されている正面方向、左方向、右方向などは、リスナを基準にした方向名である。
【0092】
以上のようにして、定位方向分布計測部2144からは、現時点(現サンプリング時点あるいは現サンプル時点;処理対象信号時点)ごとに、図10に示すような定位方向分布P(θ)の情報が得られる。
【0093】
この定位方向分布P(θ)の情報は、センターゲイン制御信号生成部2145に供給される。センターゲイン制御信号生成部2145では、定位方向分布計測部2144によって算出された定位方向分布P(θ)から、センターに集中的に定位する信号ほど、ゲインが大きく、その他では、ゲインが小さくなるセンターゲイン制御信号を生成する。
【0094】
センターゲイン制御信号生成部2145は、図示を省略するゲインテーブルメモリを備えている。このゲインテーブルメモリには、ゲイン調整アンプ213に供給するゲイン制御信号を生成するためのゲインテーブル情報K(θ)が予め記憶されている。
【0095】
このゲインテーブル情報K(θ)は、定位角度のすべて(−45°〜135°)に対して、センター定位方向に重み付けが施されたゲイン特性とされている。図12に、このゲインテーブル情報K(θ)の例を示す。
【0096】
すなわち、ゲインテーブル情報K(θ)は、この例では、図12に示すように、正面方向(センター方向;θ=45°)のときにゲインが最大の「1」となる。そして、センター方向よりも左方向の定位角度範囲(0°〜45°)およびセンター方向よりも左方向の定位角度範囲(45°〜90°)では、センター方向から遠ざかるにしたがってゲインが小さくなるようなゲイン特性とされる。
【0097】
センターゲイン制御信号生成部2145では、定位方向分布計測部2144で求められた定位方向分布P(θ)の情報と、ゲインテーブル情報K(θ)のゲイン値との、すべての定位角度についての積の総和を算出する。
【0098】
すなわち、センターゲイン制御信号生成部2145は、
Gat=Σ(K(θ)×P(θ))として、ゲイン制御信号Gatを生成する。
【0099】
こうしてセンターゲイン制御信号生成部2145で生成されたゲイン制御信号Gatは、センター集中定位率検出部214の出力として、ゲイン調整アンプ213に供給される。
【0100】
したがって、ゲイン調整アンプ213からは、第1の例よりも、さらにセンターに集中的に定位する信号成分からなる声主体信号Svが得られる。
【0101】
なお、センター集中定位信号検出部21としては、上述した第1の例および第2の例に限られるものではないことは勿論である。
【0102】
[臨場音平均レベル検出部34の構成例]
次に、図13を参照して、臨場音平均レベル検出部34の構成例について説明する。臨場音平均レベル検出部34は、減算部41、および平均レベル検出部42より構成されている。減算部41は、入力音声信号SiL,SiRの差分を求めて平均レベル検出部42に供給する。平均レベル検出部42は、入力音声信号SiL,SiRの差分の平均レベルを臨場音平均レベルとして検出して、その検出した臨場音平均レベルをセンターバランス補正部32および臨場音バランス補正部35に供給する。尚、臨場音平均レベル検出部34の構成については、臨場音平均レベルとして定義できる値が求められるものであれば他の構成であってもよく、例えば、左右チャンネルの臨場音主体信号SsL,SsRとの差分を用いたものであってもよい。
【0103】
[センターバランス補正部32の構成例]
次に、図14を参照して、センターバランス補正部32の構成例について説明する。センターバランス補正部32は、固定ゲインアンプ51、および加算部52より構成されている。固定ゲインアンプ51は、臨場音平均レベルを固定のゲインK1でゲイン調整し加算部52に供給する。加算部52は、固定ゲインアンプ51より供給されてくるゲインK1でゲイン制御された臨場音平均レベルと、平均レベル検出部31より供給されてくる声主体信号Svの平均レベルとを加算してセンターバランス補正平均レベルとしてゲイン制御信号生成部33に供給する。尚、センターバランス補正部32の構成については、センターバランス補正平均レベルとして定義できる値が求められるものであれば他の構成であってもよい。
【0104】
[臨場音バランス補正部35の構成例]
次に、図15を参照して、臨場音バランス補正部35の構成例について説明する。臨場音バランス補正部35は、固定ゲインアンプ61、および加算部62より構成されている。固定ゲインアンプ61は、臨場音平均レベルを固定のゲインK2でゲイン制御し加算部62に供給する。加算部62は、固定ゲインアンプ61より供給されてくるゲインK2でゲイン制御された臨場音平均レベルと、平均レベル検出部31より供給されてくる声主体信号Svの平均レベルとを加算して臨場音バランス補正平均レベルとしてゲイン制御信号生成部36に供給する。尚、臨場音バランス補正部35の構成については、臨場音バランス補正平均レベルとして定義できる値が求められるものであれば他の構成であってもよい。
【0105】
すなわち、センターバランス補正部32、および臨場音バランス補正部35は、それぞれ異なるゲインK1,K2により臨場音平均レベルを、声主体信号Svの平均レベルに加算することで、それぞれセンターバランス補正平均レベルおよび臨場音バランス補正平均レベルを求めている。したがって、このゲインK1,K2を様々に変化させることにより、声主体信号Svと臨場音とを様々な割合で変化させることができ、声主体信号Svと臨場音とのバランスを調整することが可能となる。
【0106】
[臨場音レベル補正ゲイン生成部37の構成例]
次に、図16を参照して、臨場音レベル補正ゲイン生成部37の構成例について説明する。
【0107】
入力音声信号のレベル変動あるいは声主体信号Svのレベル変動が大きく、声主体信号Svの出力レベルのみを一定レベルにゲイン制御したときには、元の入力音声信号に対するバランスが悪化して、違和感を覚える場合がある。
【0108】
この臨場音レベル補正ゲイン生成部37は、この問題を改善するものである。臨場音レベル補正ゲイン生成部37は、ゲイン値変換テーブル部71からなる。
【0109】
ゲイン値変換テーブル部71は、声主体信号Svに対するゲイン制御信号Gyを入力信号として受けて、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するものであり、ゲイン値変換テーブルメモリ(図示は省略)を有する。
【0110】
ゲイン値変換テーブル部71が備えるゲイン値変換テーブルメモリに記憶されるゲイン値変換テーブル情報の例を説明するための図を図17に示す。
【0111】
声主体信号Svのレベル変動が小さい場合あるいは入力音声信号全体のレベル変動が小さいときには、ゲイン制御信号Gyによる声レベル補正ゲイン値は、Gy=1を中心として大きく変化しない。
【0112】
このような場合には、前述した臨場音主体信号と、声主体信号とのバランスは、元の入力音声信号から大きく外れてはいないので、違和感を覚えることはない。このため、このようなレベル変動が小さい範囲では、臨場音主体信号SsL,SsRは、固定ゲイン「1」のアンプを通じて出力してもよい。
【0113】
そこで、この図17の例においては、0.75≦Gy≦1.25の範囲では、臨場音主体信号に対するゲイン制御信号Gsは、常にGs=1のゲイン値にする。
【0114】
そして、入力音声信号のレベル変動あるいは声主体信号Svのレベル変動が、このような小さいレベル変動範囲から逸脱する場合には、この例では、ゲイン制御信号Gyに対して所定の比を持って、追従して、臨場音主体信号SsL,SsRをゲイン制御する。
【0115】
すなわち、図17の例においては、Gy<0.75となる入力レベルが大きくなる範囲では、Gs/Gy=K11(=1/0.75)の関係を持って、ゲイン制御信号Gyから、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するようにする。
【0116】
また、Gy>1.25となる入力レベルが小さくなる範囲では、Gs/Gy=K12(=2/2.5)の関係を持って、ゲイン制御信号Gyから、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するようにする。
【0117】
このようにすることにより、声レベル補正ゲインが大きく変動した場合でも、臨場音レベル補正ゲインが、声レベル補正ゲインと一定の比を持って追従するので、声主体信号レベルに対する臨場音主体信号レベルのバランスが大きく開いてしまうことを防止できる。したがって、レベル変動が大きい場合においても自然なレベル遷移を実現することができるようになる。
【0118】
ゲイン値変換テーブル部71は、声主体信号Svに対するゲイン制御信号Gyの値をゲイン値変換テーブルメモリの読み出しアドレス入力として、対応する臨場音主体信号に対するゲイン制御信号Gsを読み出して、出力するように構成できる。
【0119】
[図2の音量補正装置による音量補正処理]
音量補正装置は、ソフトウェア処理演算により各構成の機能を実現するようにすることができる。そこで、図18のフローチャートを参照して、図2の音量補正装置による音量補正処理について説明する。
【0120】
ステップS1において、センター集中定位信号検出部21は、左右2チャンネルの入力音声信号SiL,SiRより、左右チャンネルの中央(センター)に定位するセンター集中定位信号を抽出し、声主体信号Svとして検出して減算部22,23に出力する。
【0121】
ステップS2において、減算部22は、左チャンネルの音声信号SiLから、声主体信号Svを減算して、左チャンネルの臨場音主体信号SsLを生成し、可変ゲインアンプ25に供給する。また、減算部23は、右チャンネルの音声信号SiRから、声主体信号Svを減算して、右チャンネルの臨場音主体信号SsRを生成し、可変ゲインアンプ26に供給する。
【0122】
ステップS3において、平均レベル検出部31は、声主体信号Svの平均レベルを検出して、その検出した平均レベルをセンターバランス補正部32および臨場音バランス補正部35に供給する。
【0123】
ステップS4において、臨場音平均レベル検出部34は、2チャンネル音声信号SiL,SiRから、臨場音主体信号の平均レベルを検出して、その検出した臨場音主体信号の平均レベルをセンターバランス補正部32および臨場音バランス補正部35に供給する。
【0124】
ステップS5において、センターバランス補正部32は、声主体信号Svの平均レベルに、臨場音主体信号の平均レベルを所定のゲインK1によりゲイン制御した値を加算することにより補正して、ゲイン制御信号生成部33に供給する。
【0125】
ステップS6において、臨場音バランス補正部35は、声主体信号Svの平均レベルに、臨場音主体信号の平均レベルを所定のゲインK2によりゲイン制御した値を加算することにより補正して、ゲイン制御信号生成部36に供給する。
【0126】
ステップS7において、ゲイン制御信号生成部33は、センターバランス補正部32により、臨場音主体信号の平均レベルに基づいて補正された、声主体信号Svの平均レベルが、予め定めた基準レベルとなるようにするためのゲイン制御信号Gvを生成する。そして、ゲイン制御信号生成部33は、生成したゲイン制御信号Gvを可変ゲインアンプ24に供給する。
【0127】
ステップS8において、ゲイン制御信号生成部36は、臨場音バランス補正部35により、臨場音主体信号の平均レベルに基づいて補正された、声主体信号Svの平均レベルが、予め定めた基準レベルとなるようにするためのゲイン制御信号Gyを生成する。そして、ゲイン制御信号生成部36は、生成したゲイン制御信号Gyを臨場音レベル補正ゲイン生成部37に供給する。
【0128】
ステップS9において、臨場音レベル補正ゲイン生成部37は、ゲイン制御信号生成部36からのゲイン制御信号Gyを受けて、このゲイン制御信号Gyに基づく臨場音レベル補正ゲイン制御信号生成処理を行って、臨場音主体信号をゲイン補正する、臨場音レベル補正ゲインであるゲイン制御信号Gsを生成し、可変ゲインアンプ25,26に供給する。
【0129】
[臨場音レベル補正ゲイン制御信号生成処理]
ここで、図19のフローチャートを参照して、臨場音レベル補正ゲイン制御信号生成処理について説明する。
【0130】
ステップS21において、臨場音レベル補正ゲイン生成部37は、入力された声主体信号についてのゲイン制御信号Gyのゲイン値を検知する
【0131】
ステップS21において、臨場音レベル補正ゲイン生成部37は、ゲイン値変換テーブル部71に基づいて、そのゲイン値Gyが、Gy<0.75であるか否か判定する。ステップS21において、例えば、ゲイン値Gy<0.75である場合、処理は、ステップS23に進む。
【0132】
ステップS23において、臨場音レベル補正ゲイン生成部37は、ゲイン値変換テーブル部71に基づいて、Gs=K11×Gyなる演算により臨場音主体信号SsL,SsRに対する、臨場音レベル補正ゲインであるゲイン制御信号Gsを算出する。
【0133】
一方、ステップS22において、Gy<0.75ではないと判定された場合、ステップS24において、臨場音レベル補正ゲイン生成部37は、ゲイン値変換テーブル部71に基づいて、Gy>1.25であるか否かを判定する。ステップS24において、例えば、Gy>1.25である場合、処理は、ステップS25に進む。ステップS25において、臨場音レベル補正ゲイン生成部37は、ゲイン値変換テーブル部71に基づいて、Gs=K12×Gyなる演算により臨場音主体信号SsL,SsRに対する臨場音レベル補正ゲインであるゲイン制御信号Gsを算出する。
【0134】
ステップS24において、例えば、Gy>1.25ではない場合、ステップS26において、臨場音レベル補正ゲイン生成部37は、ゲイン値変換テーブル部71に基づいて、0.75≦Gy≦1.25であることを確認して、Gs=1とする。
【0135】
そして、ステップS23,S24、およびS26の処理が終了した後、処理は、ステップS21に戻り、それ以降の処理が繰り返される。
【0136】
なお、上述の説明のゲイン値の数値は、一例であり、これに限られるものではないことはいうまでもない。そして、ゲイン値Gy=1を中心とするレベル変動が小さい範囲、すなわち、α≦Gy≦βの範囲においては、上述の例では、1−α=β−1としたが、1−α≠β−1であっても勿論良い。
【0137】
また、Gy<αの範囲での比の値K11と、Gy>βの範囲での比の値K12も、一例であり、また、K11=K12であってもよい。
【0138】
ここで、図18のフローチャートの説明に戻る。
【0139】
ステップS10において、可変ゲインアンプ25,26は、臨場音レベル補正ゲイン生成部37から供給されてくる臨場音レベル補正ゲインであるゲイン制御信号Gsに基づいて、左右チャンネルの臨場音主体信号SsL,SsRに対して、ゲイン制御を行い、それぞれ加算部27,28に供給する。
【0140】
ステップS11において、可変ゲインアンプ24は、ゲイン制御信号生成部33は、生成したゲイン制御信号Gvに基づいて、声主体信号Svに対して、ゲイン制御を行い、補正後の声主体信号Svcを加算部27,28に供給する。
【0141】
ステップS12において、加算部27は、左チャンネルの臨場音主体信号SsLと補正後声主体信号Svcとを加算し、その加算出力として、音量補正された左チャンネルの出力音声信号SoLを出力する。また、加算部28は、右チャンネルの臨場音主体信号SsRと補正後声主体信号Svcとを加算し、その加算出力として、音量補正された右チャンネルの出力音声信号SoRを出力する。
【0142】
以上の処理により、臨場音主体信号、および声主体信号が、ゲインK1,K2の調整により、様々な割合でバランスを取ることが可能になると共に、声主体信号について生じる大きなレベル変化点での音量レベルの揺れを抑制することが可能となる。結果として、臨場音と声主体信号とのバランスを調整しつつ、声主体信号Svcの音量レベルの揺れが、目立たなくなり、聴取者に対する違和感が軽減される。
【0143】
<2.第2の実施の形態>
[音量補正装置の第2の実施形態]
以上においては、声主体信号Svの平均レベルに対して、臨場音平均レベルに基づいたバランス補正を行うことにより、補正された声主体信号Svの平均レベルを用いて、ゲイン制御信号Gv,Gsを生成する例について説明してきたが、バランス補正ができれば、補正する信号は別の信号であってもよい。
【0144】
例えば、声主体信号Svの平均レベルに基づいて求められるゲイン制御信号を、声主体信号、および臨場音主体信号のそれぞれについて、臨場音平均レベルに基づいたバランス補正を行うことによりゲイン制御信号Gv,Gyを生成するようにしてもよい。
【0145】
図20は、声主体信号Svの平均レベルに基づいて求められるゲイン制御信号を、声主体信号、および臨場音主体信号のそれぞれについて、臨場音平均レベルに基づいてバランスを補正することによりゲイン制御信号Gv,Gyを生成する音量補正装置の構成を示している。尚、図20の音量補正装置において、図2の音量補正装置における構成と同一の機能を備えた構成については、同一の符号を付しており、その説明は適宜省略するものとする。図20の音量補正装置において、図2の音量補正装置と異なる構成は、センターバランス補正部32、ゲイン制御信号生成部33、臨場音バランス補正部35、およびゲイン制御信号生成部36に代えて、ゲイン制御信号生成部101−1、センターバランス補正部103、ゲイン制御信号生成部101−2、および臨場音バランス補正部104を設け、さらに、バランス補正ゲイン生成部102を備えていることである。
【0146】
ゲイン制御信号生成部101−1,101−2は、いずれも平均レベル検出部31より供給されてくる声主体信号Svの平均レベルが、予め定めた基準レベルとなるためのゲイン制御信号を生成し、それぞれセンターバランス補正部103、および臨場音バランス補正部104に供給する。
【0147】
バランス補正ゲイン生成部102は、臨場音平均レベル検出部34より供給されてくる臨場音平均レベルに基づいて、声主体信号Svの平均レベルを予め定めた基準レベルとなるためのゲイン制御信号を、声主体信号Svと臨場音主体信号とのバランスを補正するためのバランス補正ゲインK3,K4を生成し、それぞれセンターバランス補正部103、および臨場音バランス補正部104に供給する。より詳細には、バランス補正ゲイン生成部102は、図21で示されるような、臨場音平均レベルに応じて設定されるバランス補正ゲインのテーブルを記憶しており、臨場音平均レベルに応じたバランス補正ゲインK3,K4を読み出して出力している。図21で示されるように、声主体信号Svを補正するゲイン制御信号を補正するためのバランス補正ゲインK3は、臨場音平均レベルに比例して大きくなるように設定されている。これに対して、臨場音信号SiL,SiRを補正するゲイン制御信号を補正するためのバランス補正ゲインK4は、臨場音平均レベルに比例して小さくなるように設定されている。尚、バランス補正ゲインK3,K4については、臨場音平均レベルに対して、図21で示されるような関係とは異なる関係となるものであってもよく、例えば、バランス補正ゲインK3,K4が、それぞれ臨場音平均レベルに対して、それぞれ図21の場合と逆の関係となるようなものであってもよい。
【0148】
センターバランス補正部103は、ゲイン制御信号生成部101−1より供給されてくるゲイン制御信号をバランス補正ゲイン生成部102より供給されてくるバランス補正ゲインK3により補正してゲイン制御信号Gvを生成し、可変ゲインアンプ24に供給する。
【0149】
臨場音バランス補正部104は、ゲイン制御信号生成部101−2より供給されてくるゲイン制御信号を、バランス補正ゲイン生成部102より供給されてくるバランス補正ゲインK4により補正してゲイン制御信号Gyを生成し、臨場音レベル補正ゲイン生成部37に供給する。
【0150】
すなわち、図2の音量調整部18においては、声主体信号Svの平均レベルが、臨場音平均レベルに基づいてバランス補正がなされ、補正後の声主体信号Svの平均レベルからゲイン制御信号が生成されていた。これに対して、図20の音量調整部18においては、声主体信号Svの平均レベルに基づいてゲイン制御信号が生成されて、臨場音平均レベルに基づいて、声主体信号と臨場音とのバランスを調整するために設定されるバランス補正ゲインでバランス補正されている。
【0151】
[センターバランス補正部103の構成例]
次に、図22を参照して、センターバランス補正部103の構成例について説明する。センターバランス補正部103は、可変ゲインアンプ121により構成されている。可変ゲインアンプ121は、バランス補正ゲイン生成部102より供給されてくるバランス補正ゲインK3により、声主体信号Svの平均レベルに基づいて生成されるゲイン制御信号をゲイン制御して、ゲイン制御信号Gvを生成して可変ゲインアンプ24に供給する。
【0152】
[臨場音バランス補正部104の構成例]
次に、図23を参照して、臨場音バランス補正部104の構成例について説明する。臨場音バランス補正部104は、可変ゲインアンプ131により構成されている。可変ゲインアンプ131は、バランス補正ゲイン生成部102より供給されてくるバランス補正ゲインK4により、声主体信号Svの平均レベルに基づいて生成されるゲイン制御信号をゲイン制御して、ゲイン制御信号Gyを生成して臨場音レベル補正ゲイン生成部37に供給する。
【0153】
[図20の音量補正装置による音量補正処理]
図20音量補正装置についても、ソフトウェア処理演算により各構成の機能を実現するようにすることができる。そこで、図24のフローチャートを参照して、図20の音量補正装置による音量補正処理について説明する。尚、図24のフローチャートにおけるステップS31乃至S34、およびS39乃至S42の処理については、図18のフローチャートを参照して説明した処理と同一の処理であるので、その説明は省略する。
【0154】
すなわち、ステップS31乃至S34の処理により、平均レベル検出部31により声主体信号Svの平均レベルが求められ、臨場音平均レベル検出部34により臨場音平均レベルが求められると処理は、ステップS35に進む。
【0155】
ステップS35において、ゲイン制御信号生成部101−1,101−2は、声主体信号Svの平均レベルが、予め定めた基準レベルとなるためのゲイン制御信号を生成し、それぞれセンターバランス補正部103、および臨場音バランス補正部104に供給する。
【0156】
ステップS36において、バランス補正ゲイン生成部102は、臨場音平均レベル検出部34より供給されてくる臨場音平均レベルに基づいて、声主体信号Svの平均レベルを予め定めた基準レベルとなるためのゲイン制御信号を、声主体信号Svと臨場音とのバランスを補正するためのバランス補正ゲインK3,K4を生成し、それぞれセンターバランス補正部103、および臨場音バランス補正部104に供給する。
【0157】
ステップS37において、センターバランス補正部103は、ゲイン制御信号生成部101−1より供給されてくるゲイン制御信号をバランス補正ゲイン生成部102より供給されてくるバランス補正ゲインK3によりゲイン制御することで、バランス補正してゲイン制御信号Gvを生成し、可変ゲインアンプ24に供給する。
【0158】
ステップS38において、臨場音バランス補正部104は、ゲイン制御信号生成部101−2より供給されてくるゲイン制御信号をバランス補正ゲイン生成部102より供給されてくるバランス補正ゲインK4によりゲイン制御することで、バランス補正してゲイン制御信号Gyを生成し、臨場音レベル補正ゲイン生成部37に供給する。
【0159】
そして、ステップS39においては、生成されたゲイン制御信号Gyが、臨場音レベル補正ゲイン生成部37により臨場音レベル補正ゲイン生成処理されることにより、ゲイン制御信号Gsが生成され、可変ゲインアンプ25,26に供給される。これにより、ステップS40において、可変ゲインアンプ25,26が、臨場音主体信号SsL,SsRをそれぞれゲイン制御することで補正し加算部27,28に供給する。ステップS41において、可変ゲインアンプ24は、ゲイン制御信号Gvに基づいて、声主体信号Svをゲイン制御して、加算部27,28に供給する。そして、ステップS42において、加算部27,28は、補正後の左右チャンネルの臨場音主体信号SsLc,SsRcと補正後声主体信号Svcとをそれぞれ加算し、その加算出力として、音量補正された左右チャンネルの出力音声信号SoL,SoRを出力する。
【0160】
以上の処理により、臨場音平均レベルに応じたバランス補正ゲインK3,K4を様々に設定することで、声主体信号Svと臨場音主体信号とのバランスを様々に変化させて調整することが可能になると共に、声主体信号Svの急激な変化においても、自然なレベル遷移を実現し、聴取者に対する違和感を軽減することが可能となる。
【0161】
<3.変形例>
[音量補正装置の第2の実施の形態の変形例]
図20の音量補正装置においては、センターバランス補正部103、および臨場音バランス補正部104のそれぞれの前段にゲイン制御信号生成部101−1,101−2をそれぞれ設けた例について説明してきたが、ゲイン制御信号生成部101−1,101−2はいずれも同一の構成であるので、共通となる1個のゲイン制御信号生成部101とするようにしてもよい。
【0162】
図25は、ゲイン制御信号生成部101−1,101−2を、共通となる1個のゲイン制御信号生成部101とした音量補正装置の構成例を示している。
【0163】
すなわち、図25で示されるように、平均レベル検出部31の後段であって、センターバランス補正部103、および臨場音バランス補正部104のそれぞれに分岐する前の位置に共通のゲイン制御信号生成部101を1個にして設けるようにしてもよい。
【0164】
このような構成により、図25の音量補正装置においても、図20の音量補正装置における場合と同様の効果を奏することが可能となる。
【0165】
<4.第3の実施の形態>
[音量補正装置の第3の実施形態]
以上においては、可変ゲインアンプ25,26のゲイン制御信号Gyを、補正して、臨場音レベル補正ゲインであるゲイン制御信号Gsを生成する臨場音レベル補正ゲイン生成部37を設ける例について説明してきたが、ゲイン制御信号Gy=ゲイン制御信号Gsであっても、声主体信号Svの変化に対して自然にレベルを遷移させて聴取者に対する違和感を軽減しつつ、声主体信号と臨場音とのバランスを補正することが可能である。したがって、臨場音レベル補正ゲイン生成部37を削除しても、第1の実施形態である図2の音量補正装置と同様の効果は得ることができる。
【0166】
図26は、第1の実施形態の音量補正装置より臨場音レベル補正ゲイン生成部37を削除した音量補正装置の構成例を示している。
【0167】
すなわち、図26の音量補正装置においては、ゲイン制御信号生成部36により生成されるゲイン制御信号Gyそのものが、ゲイン制御信号Gsとして可変ゲインアンプ25,26に供給される。
【0168】
[図26の音量補正装置による音量補正処理]
次に、図27のフローチャートを参照して、図26の音量補正装置による音量補正処理について説明する。ただし、図27のフローチャートにおけるステップS51乃至S61の処理は、図18のフローチャートにおけるステップS1乃至S8,S10乃至S12の処理と同様であるので、その説明は省略する。
【0169】
すなわち、以上の処理においても、声主体信号Svの変化に対して自然にレベルを遷移させて聴取者に対する違和感を軽減しつつ、声主体信号と臨場音とのバランスを調整することが可能である。
【0170】
<5.第4の実施の形態>
[音量補正装置の第4の実施形態]
また、第3の実施形態と同様に、第2の実施形態における音量補正装置の臨場音レベル補正ゲイン生成部37を削除しても、その効果は得ることができる。
【0171】
図28は、第2の実施形態の音量補正装置より臨場音レベル補正ゲイン生成部37を削除した音量補正装置の構成例を示している。
【0172】
すなわち、図28の音量補正装置においても、ゲイン制御信号生成部36により生成されるゲイン制御信号Gyそのものが、ゲイン制御信号Gsとして可変ゲインアンプ25,26に供給される。
【0173】
[図26の音量補正装置による音量補正処理]
次に、図29のフローチャートを参照して、図28の音量補正装置による音量補正処理について説明する。ただし、図29のフローチャートにおけるステップS81乃至S91の処理は、図24のフローチャートにおけるステップS31乃至S38,S40乃至S42の処理と同様であるので、その説明は省略する。
【0174】
すなわち、以上の処理においても、声主体信号Svの変化に対して自然にレベルを遷移させて聴取者に対する違和感を軽減しつつ、臨場音声主体信号と臨場音とのバランスを調整することが可能である。
【0175】
尚、以上においては、音声信号が2チャンネルの場合を例とした場合について説明してきたが、それよりも多くのチャンネル、すなわち、マルチチャンネルを扱う場合においても、本技術を適用することができる。すなわち、マルチチャンネルの音声信号に基づいて、センター集中定位信号を検出し、センター集中定位信号について、上述した声主体信号に対する処理と同様に処理し、その他の音声信号については、上述した臨場音と同様に処理することで対応することができる。この際、必要に応じて上述したバランス補正に必要なゲインを調整することで、様々な比率でバランスを補正することが可能である。また、マルチチャンネル毎に臨場音に対応した処理をすることで、バランス補正のバリエーションを増やすことも可能である。さらに、マルチチャンネルをダウンミックスして2チャンネルとし、上述した手法でバランスを補正することも可能である。
【0176】
本技術によれば、複数の成分を含む入力音声信号のうち、声主体信号などのセンター集中低位信号からなる第1成分主体信号の変化に対して自然にレベルを遷移させて聴取者に対する違和感を軽減しつつ、臨場音声主体信号などのセンター集中低位信号以外の信号とのバランスを補正することが可能である。
【0177】
ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
【0178】
図30は、汎用のパーソナルコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)1001を内蔵している。CPU1001にはバス1004を介して、入出力インタ-フェイス1005が接続されている。バス1004には、ROM(Read Only Memory)1002およびRAM(Random Access Memory)1003が接続されている。
【0179】
入出力インタ-フェイス1005には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部1006、処理操作画面や処理結果の画像を表示デバイスに出力する出力部1007、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部1008、LAN(Local Area Network)アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部1009が接続されている。また、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどのリムーバブルメディア1011に対してデータを読み書きするドライブ1010が接続されている。
【0180】
CPU1001は、ROM1002に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディア1011から読み出されて記憶部1008にインストールされ、記憶部1008からRAM1003にロードされたプログラムに従って各種の処理を実行する。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0181】
尚、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理は、もちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理を含むものである。
【符号の説明】
【0182】
20 分離部, 21 センター集中定位信号検出部, 24乃至26 可変ゲインアンプ, 27,28 加算部, 30 補正ゲイン生成部, 37 臨場音レベル補正ゲイン生成部

【特許請求の範囲】
【請求項1】
複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御部と、
前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御部と、
前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出部と、
前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出部と、
前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力部と、
前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力部とを含み、
前記第1成分主体信号ゲイン制御部は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、
前記その他成分信号ゲイン制御部は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する
音声処理装置。
【請求項2】
前記第1成分主体信号ゲイン制御信号出力部は、
前記第1成分信号の平均レベルに、前記その他成分信号平均レベルを第1の所定の増幅率で増倍した信号を加算して補正する第1信号成分平均レベル補正部と、
前記第1成分出力信号が、前記第1信号成分平均レベル補正部により補正された前記第1成分信号の平均レベルとなるように、前記第1成分信号ゲイン制御信号を生成する第1成分信号ゲイン制御信号生成部とを含み、
前記その他成分信号ゲイン制御信号出力部は、
前記第1成分信号の平均レベルに、前記その他成分信号平均レベルを第2の所定の増幅率で増倍した信号を加算して補正する第1信号成分平均レベル補正部と、
前記その他成分出力信号が、前記第1信号成分平均レベル補正部により補正された前記第1成分信号の平均レベルとなるように、前記その他成分信号ゲイン制御信号を生成するその他成分信号ゲイン制御信号生成部とを含む
請求項1に記載の音声処理装置。
【請求項3】
前記第1成分主体信号ゲイン制御信号出力部は、
前記第1成分出力信号が、前記第1信号成分平均レベルとなるように、第1成分信号ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、
前記その他成分信号平均レベルに対応付けて設定される第1の増幅率で増倍して、前記第1成分信号ゲイン制御信号を補正し、補正した前記第1成分信号ゲイン制御信号を出力する第1信号成分平均レベル補正部とを含み、
前記その他成分信号ゲイン制御信号出力部は、
前記その他成分出力信号が、前記第1信号成分平均レベルとなるように、その他成分信号ゲイン制御信号を生成するその他成分ゲイン制御信号生成部と、
前記その他成分信号平均レベルに対応付けて設定される第2の増幅率で増倍して、前記その他成分信号ゲイン制御信号を補正し、補正した前記その他成分信号ゲイン制御信号を出力するその他信号成分平均レベル補正部とを含む
請求項1に記載の音声処理装置。
【請求項4】
第1成分ゲイン制御信号生成部と、前記その他成分信号ゲイン制御信号出力部とは、共通であり、
第1成分ゲイン制御信号生成部により生成される第1成分ゲイン制御信号と、前記その他成分信号ゲイン制御信号出力部により生成されるその他成分信号ゲイン制御信号とは、同一である
請求項3に記載の音声処理装置。
【請求項5】
前記その他成分信号ゲイン制御信号出力部より出力される、前記その他成分信号ゲイン制御信号を補正するその他信号成分信号ゲイン制御信号補正部を含む
請求項1乃至4のいずれかに記載の音声処理装置。
【請求項6】
前記第1成分信号は、センター集中定位信号である
請求項1乃至5のいずれかに記載の音声処理装置。
【請求項7】
前記第1成分出力信号と、前記その他成分出力信号とを加算した加算出力信号を、音量補正後の音声出力信号とする加算手段をさらに含む
請求項1乃至6のいずれかに記載の音声処理装置。
【請求項8】
複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御部と、
前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御部と、
前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出部と、
前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出部と、
前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力部と、
前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力部とを含み、
前記第1成分主体信号ゲイン制御部は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、
前記その他成分信号ゲイン制御部は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する
音声処理装置における音声処理方法であって、
前記第1成分主体信号ゲイン制御部における、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御ステップと、
前記その他成分信号ゲイン制御部における、前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御ステップと、
前記第1成分信号平均レベル検出部における、前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出ステップと、
前記その他成分信号平均レベル検出部における、前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出ステップと、
前記第1成分主体信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力ステップと、
前記その他成分信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力ステップとを含み、
前記第1成分主体信号ゲイン制御ステップの処理は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、
前記その他成分信号ゲイン制御ステップの処理は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する
音声処理方法。
【請求項9】
複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御部と、
前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御部と、
前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出部と、
前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出部と、
前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力部と、
前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力部とを含み、
前記第1成分主体信号ゲイン制御部は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、
前記その他成分信号ゲイン制御部は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する
音声処理装置を制御するコンピュータに、
前記第1成分主体信号ゲイン制御部における、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分主体信号ゲイン制御ステップと、
前記その他成分信号ゲイン制御部における、前記入力音声信号のうち、前記第1成分以外の、その他成分信号を、ゲイン制御して出力するその他成分信号ゲイン制御ステップと、
前記第1成分信号平均レベル検出部における、前記第1成分信号の平均レベルを検出する第1成分信号平均レベル検出ステップと、
前記その他成分信号平均レベル検出部における、前記その他成分信号の平均レベルを検出するその他成分信号平均レベル検出ステップと、
前記第1成分主体信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記第1成分主体信号をゲイン制御する第1成分ゲイン制御信号を出力する第1成分主体信号ゲイン制御信号出力ステップと、
前記その他成分信号ゲイン制御信号出力部における、前記第1成分信号の平均レベルと、前記その他成分信号平均レベルとに基づいて、前記その他成分信号をゲイン制御するその他成分ゲイン制御信号を出力するその他成分信号ゲイン制御信号出力ステップとを含む処理を実行させ、
前記第1成分主体信号ゲイン制御ステップの処理は、前記複数の音声成分からなる入力音声信号のうち、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、前記第1成分主体信号ゲイン制御信号に基づいて、ゲイン制御して第1成分出力信号として出力し、
前記その他成分信号ゲイン制御ステップの処理は、前記第1成分以外の、その他成分信号を、その他成分信号ゲイン制御信号に基づいて、ゲイン制御してその他成分出力信号として出力する
プログラム。
【請求項10】
請求項1乃至7のいずれかの音声処理装置を含む電子機器。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate


【公開番号】特開2012−169781(P2012−169781A)
【公開日】平成24年9月6日(2012.9.6)
【国際特許分類】
【出願番号】特願2011−27781(P2011−27781)
【出願日】平成23年2月10日(2011.2.10)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】