音量補正装置、音量補正方法および音量補正プログラム
【課題】入力音声信号のレベルが大きくレベル変動した場合にも、そのレベル変化点における出力音声音量レベルの揺れを目立たなくして、違和感を軽減する。
【解決手段】複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、を備える。
【解決手段】複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、を備える。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、例えばテレビ放送受信機などに代表される電子機器の音声出力部に適用して好適な音量補正装置、音量補正方法および音量補正プログラムに関する。
【背景技術】
【0002】
テレビ放送受信機で受信する放送チャンネルを切り替えたときや、AV(Audio−Visual)システムにおいて、AVセンタで複数の入力機器の切り替えがなされたとき、コンテンツ間のレベル差により、出力音量に大きな変化が生じてしてしまうことがある。
【0003】
このような場合、ユーザは、自分が好みの音量にするためには、リモコン等を用いてボリューム操作をして音量調節する必要があり、わずらわしさを感じる場合がある。
【0004】
また、同一コンテンツ内(例えば、同一の放送チャンネル内や同一の放送番組内)においても、コマーシャル(CM)部分やシーンの変化によって、出力音量が変化し、不快に思うことがある。
【0005】
この問題を解決する音量補正方式が従来から種々提案されている。その一例のAGC(Auto Gain Control;自動利得制御)による音量制御方式が広く知られている。
【0006】
図28は、このAGCを用いた音量補正部の構成例を示すブロック図である。この図28の例は、左右2チャンネルの入力音声信号SiLおよびSiRについて音量補正をする場合である。
【0007】
すなわち、この例においては、左右2チャンネルの入力音声信号SiLおよびSiRは、それぞれ、ゲイン制御信号によりゲインが可変制御される可変ゲインアンプ1Lおよび1Rに供給される。
【0008】
また、左右2チャンネルの入力音声信号SiLおよびSiRは、加算部2で互いに加算される。そして、加算部2からの加算出力信号は、アンプ3にて1/2ゲイン倍された後、平均レベル検出部4に供給され、この平均レベル検出部4で、加算出力信号の平均レベルが検出される。
【0009】
そして、平均レベル検出部4で検出された平均レベルがゲイン制御信号生成部5に供給される。このゲイン制御信号生成部5では、平均レベル検出部4からの平均レベルと、予め定められている基準レベルと比較し、その比較結果を用いて両レベルの差がゼロとなるようにするゲイン制御信号を生成し、可変ゲインアンプ1L,1Rに供給する。
【0010】
可変ゲインアンプ1L,1Rは、ゲイン制御信号生成部5からのゲイン制御信号によりゲインが可変制御される。この場合、左右2チャンネルの入力音声信号SiLおよびSiRは、この可変ゲインアンプ1L,1Rにおいて、前記加算部2からの加算出力信号の平均レベルが基準レベルと等しくなるようにゲイン制御される。
【0011】
この結果、可変ゲインアンプ1L,1Rから得られる左右2チャンネルの出力音声信号SoLおよびSoRは、小さな音は大きく、大きな音は小さく抑えられて、自動的に一定レベルの音量になるように補正される。
【0012】
上述したAGCによる音量補正方式の他にも、種々の音量補正方式が提案されている。 例えば、特許文献1(特許3321820号公報)には、コンプレッサーを設け、大レベルの音声入力があった場合には、入力レベルに対して出力音声レベルを小さく制御し、音量をある一定の範囲に制御するようにする方式が開示されている。
【先行技術文献】
【特許文献】
【0013】
【特許文献1】特許3321820号公報
【発明の概要】
【発明が解決しようとする課題】
【0014】
上述した従来の音量補正方式は、音声信号全体のレベルを監視して音量制御を行う方式である。例えばAGC方式の場合、音声信号全体の平均レベルを基準にして、音量制御(ゲイン制御)を行った場合、音声信号全体としての音量制御がなされ、うるさい音を出さないようにしたり、聞こえなかった小さな音を聞こえるようにしたりすることができる。
【0015】
ところで、例えばテレビ放送受信におけるチャンネル切り替え時や、AVセンタで複数の入力機器の切り替え時、また、コマーシャル(CM)部分やシーンの変化時には、その変化の前後で音声信号に大きなレベル差が生じることがある。
【0016】
このように、入力音声信号のレベルが大きくレベル変動した場合に、そのレベル変化点での音声信号ゲインの急激な変化を完全に抑えることは困難であり、前記レベル変化点で出力音声音量レベルが揺れるなど、聴取者に、聴感上、違和感を与える場合がある。
【0017】
特に、従来の音量補正方式では、音声信号全体を一律に同様にゲイン制御する方式であるため、前記の急激な変化点での音量レベルの揺れに対する違和感が目立つと言う問題があった。
【0018】
この発明は、上記の点に鑑みて、入力音声信号のレベルが大きくレベル変動した場合にも、そのレベル変化点における出力音声音量レベルの揺れを目立たなくして、違和感を軽減することができる音量補正装置および方法を提供することを目的とする。
【課題を解決するための手段】
【0019】
上記の課題を解決するために、この発明は、複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、を備える音量補正装置を提供する。
【0020】
また、前記音量補正装置において、前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、前記他成分ゲイン制御信号生成部は、前記第1成分ゲイン制御信号による補正ゲイン値が基準範囲内であるときには、前記第1成分以外の他の音声信号をそのままのレベルで出力するように制御し、前記第1成分ゲイン制御信号による補正ゲイン値が前記基準範囲外であるときには、前記他成分ゲイン制御信号の補正ゲインは、前記第1成分ゲイン制御信号による補正ゲインとの比が所定値に調整されたものとする。
【0021】
また、前記音量補正装置において、前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、前記他成分ゲイン制御部は、前記第1成分ゲイン制御信号による前記第1成分主体信号に対するゲイン補正に対して、遅れて追従する時間遅れ特性を持たせる他成分ゲイン制御信号を生成する。
【0022】
また、前記音量補正装置において、前記他成分ゲイン制御部は、前記他成分ゲイン制御信号による補正ゲイン値が、前記第1成分ゲイン制御信号による補正ゲイン値に対して所定の基準値を乗算した設定値を超えている場合には、前記他成分ゲイン制御信号による補正ゲイン値を前記設定値に固定するようにする。
【0023】
また、前記音量補正装置において、前記第1成分ゲイン制御部の出力信号と、前記他成分出力部の出力信号とを加算した加算出力信号を、音量補正後の音声出力信号とする。
【発明の効果】
【0024】
この発明によれば、第1成分主体信号と、第1成分以外の他成分の音声信号とが、異なるゲイン制御態様で出力されるので、入力音声信号のレベルが大きく変動したレベル変化点での音量レベルの揺れが目立たなくなり、違和感が軽減される。
【図面の簡単な説明】
【0025】
【図1】この発明による音量補正装置の第1の実施形態を説明するためのブロック図である。
【図2】この発明による音量補正装置が適用される電子機器の例を説明するためのブロック図である。
【図3】この発明による音量補正装置の第1の実施形態の動作説明のために用いる波形図である。
【図4】図1の実施形態におけるセンター集中定位信号生成部の構成例を示すブロック図である。
【図5】図1の実施形態におけるセンター集中定位信号生成部の他の構成例を示すブロック図である。
【図6】図5の例のセンター集中定位信号生成部の一部の構成例を説明するためのブロック図である。
【図7】図6の構成例の各部を説明するために用いる図である。
【図8】図6の構成例の各部を説明するために用いる図である。
【図9】図6の構成例の各部を説明するために用いる図である。
【図10】図6の構成例の各部を説明するために用いる図である。
【図11】図6の構成例の各部を説明するために用いる図である。
【図12】図6の構成例の各部を説明するために用いる図である。
【図13】図6の構成例の各部を説明するために用いる図である。
【図14】この発明による音量補正装置の第2の実施形態を説明するためのブロック図である。
【図15】第2の実施形態における臨場音レベル補正ゲイン生成部の第1の構成例を示すブロック図である。
【図16】臨場音レベル補正ゲイン生成部の第1の構成例を説明するために用いる図である。
【図17】臨場音レベル補正ゲイン生成部の第1の構成例における処理動作を説明するためのフローチャートを示す図である。
【図18】臨場音レベル補正ゲイン生成部の第1の構成例を用いたこの発明による音量補正装置の第2の実施形態の動作説明のために用いる波形図である。
【図19】臨場音レベル補正ゲイン生成部の第1の構成例を用いたこの発明による音量補正装置の第2の実施形態の変形例を示すブロック図である。
【図20】第2の実施形態における臨場音レベル補正ゲイン生成部の第2の構成例を示すブロック図である。
【図21】臨場音レベル補正ゲイン生成部の第2の構成例を用いたこの発明による音量補正装置の第2の実施形態の動作説明のために用いる波形図である。
【図22】第2の実施形態における臨場音レベル補正ゲイン生成部の第3の構成例を示すブロック図である。
【図23】臨場音レベル補正ゲイン生成部の第3の構成例を用いたこの発明による音量補正装置の第2の実施形態の動作説明のために用いる波形図である。
【図24】この発明による音量補正装置の他の実施形態を説明するためのブロック図である。
【図25】この発明による音量補正装置の他の実施形態を説明するためのブロック図である。
【図26】この発明による音量補正装置の他の実施形態を説明するためのブロック図である。
【図27】この発明による音量補正装置が適用される他の電子機器の例を示す図である。
【図28】従来の音量補正装置を説明するためのブロック図である。
【発明を実施するための形態】
【0026】
以下、この発明による音量補正装置の実施形態を、図面を参照しながら説明する。以下に説明する音量補正装置の実施形態は、テレビ放送受信機の音声出力部に用いられた場合である。
【0027】
すなわち、図2は、テレビ放送受信機の構成例を示すブロック図である。この図2の例のテレビ放送受信機は、マイクロコンピュータを具備して構成される制御部10を備える。この制御部10には、リモコン受信部11が接続され、このリモコン受信部11でリモコン送信機12からのリモコン信号を受けて、制御部10に伝達する。制御部10は、受信したリモコン信号に応じた処理制御を実行する。
【0028】
制御部10は、テレビ放送受信機の各部に対して制御信号を供給して、テレビ放送信号の受信およびその映像再生および音声再生の処理を実行する。
【0029】
チューナ部13は、制御部10からのユーザのリモコン操作に応じたチャンネル選択制御信号により指定される放送チャンネルの信号を、テレビ放送波信号から選択抽出する。そして、チューナ部13は、選択抽出した放送チャンネルの信号から、映像信号と、音声信号とを復調デコードし、映像信号は映像信号処理部14に供給し、音声信号は、音声信号処理部15に供給する。
【0030】
映像信号処理部14では、制御部10からの制御を受けて、映像信号についての所定の処理をし、その処理後の映像信号を表示制御部16を通じて、例えばLCD(Liquid Crystal Display)からなるディスプレイ17に供給する。これにより、選択された放送チャンネルの放送番組の画像がディスプレイ17に表示される。
【0031】
また、音声信号処理部15では、制御部10からの制御を受けて、音声信号についての所定の処理をする。この実施形態では、音声信号処理部15では、チューナ部13からの音声信号から、左右2チャンネルの音声信号SiLおよびSiRを生成し、その処理後の音声信号SiLおよびSiRを音量補正部18に供給する。
【0032】
音量補正部18は、この実施形態の音量補正装置が適用される部分であり、その入力音声信号SiLおよびSiRは、後述するようにして、音量補正され、出力音声信号SoLおよびSoRとし出力される。そして、この音量補正部18からの出力音声信号SoLおよびSoRが、スピーカ19Lおよび19Rに供給されて、音響再生される。これにより、選択された放送チャンネルの放送番組の音声がスピーカ19Lおよび19Rから放音される。
【0033】
以下、この音量補正部18の場合として、この実施形態の音量補正装置について説明する。
【0034】
[音量補正装置の第1の実施形態]
図1は、この発明の音量補正装置の第1の実施形態としての音量補正部18の全体の構成例を示すブロック図である。
【0035】
この第1の実施形態では、入力音声信号は、左右2チャンネルの音声信号とされる。そして、第1成分主体信号は、左右2チャンネルの音声信号中の主として人声成分を主体とする信号(以下、声主体信号という)とされる。また、第1成分以外の他の音声成分は、左右2チャンネルの音声信号のうちの、この声主体信号以外の、いわゆる臨場音とされる。この臨場音を主体とする信号を、以下、臨場音主体信号という。
【0036】
この図1に示すように、この第1の実施形態においては、左右2チャンネルの入力音声信号SiLおよびSiRは、声主体信号と臨場音主体信号との分離部20に供給される。この例の分離部20は、センター集中定位信号検出部21と、2個の減算部22,23とからなる。
【0037】
センター集中定位信号検出部21には、左右2チャンネルの入力音声信号SiLおよびSiRが共に供給され、左右チャンネルの中央(センター)に定位するセンター集中定位信号として、声主体信号Svを検出する。センター集中定位信号検出部21で検出された声主体信号Svは、減算部22および23に供給される。
【0038】
減算部22では、左チャンネルの音声信号SiLから、声主体信号Svが減算されて、左チャンネルの臨場音主体信号SsLが得られる。また、減算部23では、右チャンネルの音声信号SiRから、声主体信号Svが減算されて、右チャンネルの臨場音主体信号SsRが得られる。
【0039】
こうして、分離部20では、2チャンネル音声信号SiLおよびSiRから、声主体信号Svと、左右チャンネルの臨場音主体信号SsLおよびSsRとが分離されて得られる。
【0040】
そして、この分離部20からの声主体信号Svは、第1成分ゲイン制御手段の例としての可変ゲインアンプ24を通じて加算部27および28に供給されると共に、声レベル補正ゲイン生成部30に供給される。
【0041】
この例では、声レベル補正ゲイン生成部30は、平均レベル検出部31と、ゲイン制御信号生成部32とからなる。平均レベル検出部31は、声主体信号Svの平均レベルを検出して、その検出した平均レベルをゲイン制御信号生成部32に供給する。
【0042】
ゲイン制御信号生成部32は、声主体信号Svの平均レベルが、予め定めた基準レベルとなるようにするためのゲイン制御信号(声レベル補正ゲイン値)Gvを生成する。そして、ゲイン制御信号生成部32は、生成したゲイン制御信号Gvを可変ゲインアンプ24に供給する。
【0043】
したがって、可変ゲインアンプ24においては、ゲイン制御信号Gvにより、声主体信号Svのレベルが大きく変動しても、当該声主体信号の平均レベルが一定レベル(基準レベル)になるようにゲイン制御される。こうして、可変ゲインアンプ24から出力される補正後声主体信号Svcの出力レベルは、自動的に一定レベルとされる。そして、この一定レベルとされた補正後声主体信号Svcが、加算部27および28に供給される。
【0044】
一方、減算部22からの左チャンネルの臨場音主体信号SsLは、ゲインが「1」のアンプ25を通じて、そのままのレベルで加算部27に供給される。また、減算部23からの右チャンネルの臨場音主体信号SsRは、ゲインが「1」のアンプ26を通じて、そのままのレベルで加算部28に供給される。
【0045】
そして、加算部27において、左チャンネルの臨場音主体信号SsLと補正後声主体信号Svcとが加算され、その加算出力として、音量補正された左チャンネルの出力音声信号SoLが出力される。
【0046】
また、加算部28において、右チャンネルの臨場音主体信号SsRと補正後声主体信号Svcとが加算され、その加算出力として、音量補正された右チャンネルの出力音声信号SoRが出力される。
【0047】
例えば、センター集中定位信号検出部21からの声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図3(A)および(B)に示すようなレベル変動を有するものとする。
【0048】
このとき、声レベル補正ゲイン生成部30からのゲイン制御信号Gvによる可変ゲインアンプ24での声レベル補正ゲインは、図3(C)に示すようなものとなる。これにより、可変ゲインアンプ24からの補正後声主体信号Svcは、図3(E)に示すような一定レベルの信号になるようにされる。
【0049】
一方、この例では、臨場音主体信号SsLおよびSsRは、図3(D)に示すようなゲイン「1」の固定ゲインのアンプ25,26を通じてそのままのレベルとされるので、アンプ25,26の出力信号は、図3(F)に示すように、図3(B)に示したものと同じレベル変動を有するものとなる。
【0050】
以上のようにして、加算部27および28に、その一方の入力として供給される声主体信号Svcは、出力レベルが一定となるようにする第1のゲイン制御態様でゲイン補正される。このため、課題の欄で述べたように、入力音声信号SiL,SiRに大きなレベル変化があったときには、その変化点において音量レベルに揺れが生じる場合がある。
【0051】
一方、加算部27および28に、その他方の入力として供給される左チャンネルの臨場音主体信号SsLおよび右チャンネルの臨場音主体信号SsRは、この例では、固定ゲイン「1」という第2のゲイン制御態様で、そのままのレベルとなっている。したがって、入力音声信号が有する元々のレベル変動は有するが、第1のゲイン制御態様によるゲイン制御による音量レベルの揺れは発生しない。
【0052】
したがって、加算部27および28からの左右チャンネルの出力音声信号SoL、SoRは、補正後声主体信号Svcの音量レベルの揺れが、左チャンネルの臨場音主体信号SsLおよび右チャンネルの臨場音主体信号SsRによりマスキングされるようになる。このため、声主体信号Svcの音量レベルの揺れが、目立たなくなり、聴取者に対する違和感が軽減される。
【0053】
以上のようにして、この実施形態によれば、声主体信号を、素早く適正レベルに遷移させることによって、人声のレベルの一定感を保ち、台詞などの人声を聞き易くすることができる。さらに、この第1の実施形態では、臨場音主体信号は、ゲイン「1」として、元のレベルを変化させないことによって臨場感が一定に保たれるため、レベルを変えることによる違和感が軽減され、これによってより自然なレベル遷移を実現することができるようになる。
【0054】
なお、この第1の実施形態は、声主体信号レベルの変化量が少ない場合に有効である。
【0055】
なお、以上の例では、左右2チャンネル用のスピーカにより音声信号を音響再生する場合であるので、加算部27,28を設けるようにした。しかし、左右2チャンネル用のスピーカに加えて、センターチャンネル用のスピーカを設けた場合には、補正後声主体信号をセンターチャンネル用スピーカに供給し、アンプ25,26の出力音声信号を左右2チャンネル用のスピーカに供給するようにしても良い。この場合には、センターチャンネル用のスピーカの放音音声と、左右2チャンネル用のスピーカの放音音声とが、音響的に合成されることにより、第1のゲイン制御態様によるゲイン制御による音量レベルの揺れがマスキングされ、目立たなくなる。
【0056】
[センター集中定位信号検出部21の構成例]
<第1の例>
図4は、センター集中定位信号検出部21の第1の構成例を示すものである。この例においては、センター集中定位信号検出部21は、加算部211と、固定ゲイン「0.5」のアンプ212とからなる。
【0057】
そして、この例のセンター集中定位信号検出部21においては、左右チャンネルの入力音声信号SiL,SiRが加算部211で加算され、その加算出力信号がアンプ212を通じて出力される。このアンプ212の出力信号が声主体信号Svとされる。
【0058】
なお、この第1の例の場合には、声主体信号Svの平均値は、左右チャンネルの入力音声信号SiL,SiRの加算信号の平均値に等しくなる。そして、声レベル補正ゲイン生成部30は、声主体信号Svの平均値が一定レベルとなるようにゲイン制御信号Gvを生成する。よって、この第1の例の場合には、声レベル補正ゲイン生成部30は、左右チャンネルの入力音声信号SiL,SiRの加算信号、つまり、入力音声信号全体のレベルが一定レベルとなるようにゲイン制御信号Gvを生成していることにもなる。
【0059】
<第2の例>
図5は、センター集中定位信号検出部21の第2の構成例を示すものである。この第2の例は、第1の例の出力をそのまま出力するのではなく、第1の例の出力よりも、さらにセンター定位成分のみの成分に応じた信号を得るようにする例である。
【0060】
この例においては、センター集中定位信号検出部21は、第1の例の加算部211および固定ゲイン「0.5」のアンプ212に加えて、ゲイン調整アンプ213と、センター集中定位率検出部214とを備える。
【0061】
この例のセンター集中定位信号検出部21においては、アンプ212の出力信号はゲイン調整アンプ213に供給され、このゲイン調整アンプ213の出力信号が声主体信号Svとされる。
【0062】
そして、この例のセンター集中定位信号検出部21においては、左右チャンネルの入力音声信号SiL,SiRは、センター集中定位率検出部214にも供給される。このセンター集中定位率検出部214においては、入力音声全体に対するセンターに集中的に定位する信号の割合に応じて、ゲイン調整アンプ213のゲインを制御するゲイン制御信号Gatが生成される。
【0063】
そして、センター集中定位率検出部214からのゲイン制御信号Gatにより、ゲイン調整アンプ213のゲインが制御されることで、声主体信号Svは、アンプ212の出力のうち、センターに集中的に定位する率に応じた信号成分からなるものとなる。つまり、この第2の例の声主体信号Svは、第1の例よりも、さらにセンターに集中的に定位する信号成分からなる信号となる。
【0064】
センター集中定位率検出部214は、例えば図6に示すような構成を有するものとすることができる。
【0065】
すなわち、センター集中定位率検出部214は、帯域制限フィルタ2141,2142と、定位方向検出部2143と、定位方向分布計測部2144と、センターゲイン制御信号生成部2145とを備えて構成される。
【0066】
センター集中定位率検出部214に入力された左右2チャンネルの入力音声信号SiLおよびSiRは、それぞれ帯域制限フィルタ2141,2142において、例えば低域成分等、定位方向をあまり感じない周波数帯域の成分が除去される。
【0067】
そして、帯域制限フィルタ2141,2142により帯域制限された2チャンネルの入力音声信号SiLおよびSiRは、定位方向検出部2143に供給される。定位方向検出部2143は、帯域制限された2チャンネルの入力音声信号SiLおよびSiRのそれぞれのレベルの大きさにより、所定の周期毎の定位方向の検出時点における2チャンネルの入力音声信号SiLおよびSiRが持つ定位方向を検出する。
【0068】
すなわち、定位方向検出部2143においては、所定のサンプリング周期で、帯域制限された2チャンネルの入力オーディオ信号SiLおよびSiRのそれぞれのレベル(振幅)をサンプリングする。そして、定位方向検出部2143においては、この例では、最新サンプリング時点における定位方向を現時点における定位方向として検出するようにする。
【0069】
この場合、定位方向検出部2143は、当該最新サンプリング時点における定位方向を、入力音声信号SiLおよびSiRのそれぞれについての、当該最新サンプリング時点のレベルと、それよりも過去のサンプリング時点のレベルとを用いて検出する。
【0070】
2チャンネルの入力音声信号SiLおよびSiRが、デジタルオーディオ信号であれば、前記サンプリング周期は、デジタルオーディオ信号のサンプル周期に等しくすることができる。もっとも、前記サンプリング周期を、デジタルオーディオ信号の1サンプル周期と等しくするのではなく、複数サンプル周期とするようにしてもよい。定位方向検出部2143の入力音声信号がアナログ信号である場合には、この定位方向検出部2143の入力段において、デジタルオーディオ信号に変換するようにしても良い。
【0071】
この定位方向検出部2143における定位方向の検出方法を、図7を参照しながら説明する。図7(A),(B)は、左チャンネルの入力音声信号SiLの振幅をX軸にとり、右チャンネルの入力音声信号SiRの振幅をY軸にとった場合の座標空間を示している。
【0072】
定位方向検出部2143では、まず、各サンプリング周期毎の定位方向の検出時点において2チャンネルの入力音声信号SiLおよびSiRのそれぞれのレベルを取得して、それに対応する座標点を、図7(A),(B)の座標空間に、例えばP1,P2,P3,P4のように、プロットしてゆく。この例では、P4が最新の検出時点の座標点であるとする。
【0073】
そして、定位方向検出部2143では、y=k・x(kは定数)で表される直線(X軸とY軸との交点Zを通る直線)を、交点Zを中心として±90°回転させたときに、つまり、定数kを変化させたときに、プロットした座標点P1,P2,P3,P4が、どの定数kの直線(どの傾き角度の直線)の一番近くを移動してゆくかを算出する。つまり、定数kを変えた各直線からの各座標点P1,P2,P3,P4までの距離Da1,Da2,Da3,Da4あるいは距離Db1,Db2,Db3,Db4の総和が最も小さい直線の定数kを算出する。
【0074】
そして、定位方向検出部2143は、算出した直線の定数kに対応する傾き角度を、検出したい現時点における定位方向とする。図7の例では、X軸、つまり、左チャンネルの定位方向(左方向)の角度を0°として、このX軸に対する角度(以下、定位角度という)θを定位方向として検出することとする。
【0075】
図7(A)の場合の座標点P1,P2,P3,P4の例では、定位角度はθaとして検出され、図7(B)の場合の座標点P1,P2,P3,P4の例では、定位角度はθbとして検出されるものである。
【0076】
なお、この実施形態では、定位方向検出部2143においては、現時点(最新サンプリング時点)の2チャンネル入力音声信号のレベルと、過去のサンプリング時点における2チャンネル入力音声信号のレベルとは等しい重みで用いてはいない。この実施形態では、定位方向検出部2143においては、現時点に近いサンプリング時点の2チャンネル入力音声信号のレベルほど重みが大きいものとするようにしている。
【0077】
このため、定位方向検出部2143では、2チャンネル入力音声信号のレベルのサンプリング値に対して、図8に示すように、現時点(この例では最新サンプリング時点tn)に近いほど、重みが大きくなるように、指数関数曲線の特性を有する時間ウインドーWD1が用いられている。
【0078】
なお、上述の説明では、処理対象信号時点となる現時点を最新サンプリング時点(最新サンプル時点)とした。しかし、可変ゲインアンプ24およびアンプ25,26の入力側に所定時間τだけ遅延させる遅延回路を設けて、処理対象となる現時点を、入力音声信号SiL,SiRよりも前記τだけ遅延した時点とすることができる。
【0079】
その場合には、定位方向検出部2143では、処理対象信号時点となる現時点よりも後(未来)の2チャンネル入力音声信号SiL,SiRをも用いて、定位方向を検出するようにすることができる。例えば、図7の例で、処理対象信号時点となる現時点がP2やP3の場合とすることができる。
【0080】
そして、その場合には、前述した時間ウインドーWD1の代わりに、図9に示すような指数関数曲線の特性の時間ウインドーWD2が用いられる。この時間ウインドーWD2は、処理対象信号時点となる現時点tpで最も重みが大きく、現時点tpから離れるにつれ、過去および未来の方向に重みが小さくなるような指数関数曲線の特性を有するものである。
【0081】
なお、現時点の2チャンネル入力オーディオ信号のレベルを、過去および/または未来のサンプリング時点における2チャンネル入力音声信号SiL,SiRのレベルを重み付けせずに、そのままの値で用いても良い。
【0082】
以上のようにして、定位方向検出部2143では、現時点においては、2チャンネル入力音声信号SiL,SiRが、どの方向からの信号であるかを、定位角度θとして検出することができる。
【0083】
しかしながら、検出した現時点における定位角度θは、1時点における入力オーディオ信号の定位方向を一方向に限定したもので、各方向ごとの信号の強さが反映されていない。そこで、この実施形態では、この点にかんがみ、定位方向検出部2143で検出された現時点における2チャンネル入力音声信号SiL,SiRの定位方向の検出結果(定位角度θ)は、定位方向分布計測部2144に供給される。
【0084】
定位方向分布計測部2144では、予め定められた所定時間区間dに渡って定位方向検出部2143で検出された定位角度θの、全方位についての分布を求め、2チャンネル入力音声信号の定位方向が、どの角度方向にどのくらいの割合を持っているかを計測する。
【0085】
この場合、所定時間区間dは、例えば数ミリ秒〜数百ミリ秒、この例では数10ミリ秒に選定されている。そして、この実施形態では、定位方向分布計測部2144では、この所定時間区間dにおける定位方向検出部2143で検出された定位角度θに対して、定位方向検出部2143における重み係数の特性と同様に重み付けをするようにする。
【0086】
すなわち、定位方向分布計測部2144では、現時点tp(この例では、tp=tn(最新サンプリング時点))に近づくほど指数関数的に大きくなるような重み付けをする時間ウインドーWD3(図10参照)をかけて重み付けをするようにする。
【0087】
なお、前述したように、入力オーディオ信号に対して遅延時間τを設けるようにして、定位方向検出部2143での重み付けのための時間ウインドーを、図9のようにする場合には、定位方向分布計測部2144における時間ウインドーも、図9と同様なものとなる。その場合の時間区間dは、現時点tpより未来と過去の両方を含む時間区間となるものである。なお、重み付けをせずに、そのままの値で用いてもよい。
【0088】
図11は、この定位方向分布計測部2144で求められた定位角度θの分布である定位方向分布P(θ)の一例を示すもので、横軸にはX軸(左チャンネル定位方向)を基準にした定位角度θをとり、縦軸には各定位角度の出現度(<1)をとったものである。ここで、この実施形態では、定位方向分布P(θ)をすべての定位角度θについて総和を求めたときに1、すなわち、
ΣP(θ)=1
となるように分布が生成される。
【0089】
また、定位角度θと、音声信号の定位方向との関係は、図12に示すようなものとなる。なお、図12に示されている正面方向、左方向、右方向などは、リスナを基準にした方向名である。
【0090】
以上のようにして、定位方向分布計測部2144からは、現時点(現サンプリング時点あるいは現サンプル時点;処理対象信号時点)ごとに、図11に示すような定位方向分布P(θ)の情報が得られる。
【0091】
この定位方向分布P(θ)の情報は、センターゲイン制御信号生成部2145に供給される。センターゲイン制御信号生成部2145では、定位方向分布計測部2144によって算出された定位方向分布P(θ)から、センターに集中的に定位する信号ほど、ゲインが大きく、その他では、ゲインが小さくなるセンターゲイン制御信号を生成する。
【0092】
センターゲイン制御信号生成部2145は、図示を省略するゲインテーブルメモリを備えている。このゲインテーブルメモリには、ゲイン調整アンプ213に供給するゲイン制御信号を生成するためのゲインテーブル情報K(θ)が予め記憶されている。
【0093】
このゲインテーブル情報K(θ)は、定位角度のすべて(−45°〜135°)に対して、センター定位方向に重み付けが施されたゲイン特性とされている。図13に、このゲインテーブル情報K(θ)の例を示す。
【0094】
すなわち、ゲインテーブル情報K(θ)は、この例では、図13に示すように、正面方向(センター方向;θ=45°)のときにゲインが最大の「1」となる。そして、センター方向よりも左方向の定位角度範囲(0°〜45°)およびセンター方向よりも左方向の定位角度範囲(45°〜90°)では、センター方向から遠ざかるにしたがってゲインが小さくなるようなゲイン特性とされる。
【0095】
センターゲイン制御信号生成部2145では、定位方向分布計測部2144で求められた定位方向分布P(θ)の情報と、ゲインテーブル情報K(θ)のゲイン値との、すべての定位角度についての積の総和を算出する。
【0096】
すなわち、センターゲイン制御信号生成部2145は、
Gat=Σ(K(θ)×P(θ))
として、ゲイン制御信号Gatを生成する。
【0097】
こうしてセンターゲイン制御信号生成部2145で生成されたゲイン制御信号Gatは、センター集中定位率検出部214の出力として、ゲイン調整アンプ213に供給される。
【0098】
したがって、ゲイン調整アンプ213からは、第1の例よりも、さらにセンターに集中的に定位する信号成分からなる声主体信号Svが得られる。
【0099】
なお、センター集中定位信号検出部21としては、上述した第1の例および第2の例に限られるものではないことは勿論である。
【0100】
[音量補正装置の第2の実施形態]
上述した第1の実施形態では、臨場音主体信号については音量補正は行わないゲイン制御態様とした。しかし、例えばチャンネル切り替えによる入力音声信号のレベル変動が大きい場合など、この臨場音主体信号についても、声主体信号と共に、ゲイン制御した方が良い場合もある。第2の実施形態は、このような場合に対処することができる例である。
【0101】
以下に示す第2の実施形態は、第1の実施形態と同様に、図2に示したテレビ放送受信機における音量補正部18に適用した場合である。
【0102】
図14は、この第2の実施形態としての音量補正部18の全体の構成例を示すブロック図である。この図14において、図1に示した第1の実施形態の音量補正部18の場合と同一部分には、同一符号を付すこととする。
【0103】
この第2の実施形態においては、加算部22,23からの左右チャンネルの臨場音主体信号SsL,SsRに対しては、第1の実施形態における固定ゲインのアンプ25および26に代えて、可変ゲインアンプ250および260を設ける。
【0104】
また、この第2の実施形態においては、前述した第1の実施形態における声レベル補正ゲイン生成部30の他に、臨場音主体信号SsL,SsRに対するゲイン制御信号Gs(臨場音レベル補正ゲイン値)を生成する臨場音レベル補正ゲイン生成部40を設ける。
【0105】
そして、可変ゲインアンプ250および260に、臨場音レベル補正ゲイン生成部40からのゲイン制御信号Gsを供給し、左右チャンネルの臨場音主体信号SsL,SsRに対しては、声主体信号Svとは異なるゲイン制御態様のゲイン制御を行うようにする。
【0106】
臨場音レベル補正ゲイン生成部40は、声レベル補正ゲイン生成部30からのゲイン制御信号Gvを受けて、このゲイン制御信号Gvに基づく処理を行って、臨場音主体信号をゲイン補正するゲイン制御信号Gsを生成するようにする。
【0107】
ゲイン制御信号Gvに対して、何らかの処理を加えるので、ゲイン制御信号Gvによる声主体信号Svに対するゲイン制御態様と、ゲイン制御信号Gsによる臨場音主体信号SsL,SsRに対するゲイン制御態様とは、異なるものとなる。
【0108】
ただし、この場合、ゲイン制御信号Gsによる臨場音主体信号SsL,SsRに対するゲイン制御態様は、入力音声信号の大きなレベル変動に対して即座に追従しないようなものとされる。すなわち、第1の実施形態と同様に、この第2の実施形態においても、声主体信号Svに対するゲイン制御態様は、入力音声信号のレベル変動に即座に追従して、常に出力レベルを一定にする。しかし、臨場音主体信号SsL,SsRに対するゲイン制御態様は、それとは異なり、入力音声信号の大きなレベル変動に対して即座に追従しない特性のものとされる。
【0109】
この第2の実施形態における声主体信号Svの処理についての構成は、第1の実施形態と全く同様である。したがって、加算部27および28に、その一方の入力として供給される声主体信号Svcは、出力レベルが一定となるようにする第1のゲイン制御態様でゲイン補正される。このため、課題の欄で述べたように、入力音声信号SiL,SiRに大きなレベル変化があったときには、その変化点において音量レベルに揺れが生じる場合がある。
【0110】
一方、この第2の実施形態では、左および右チャンネルの臨場音主体信号SsLおよびSsRは、可変ゲインアンプ250および260で、第1のゲイン制御態様とは異なる第2のゲイン制御態様でゲイン制御されて加算部27および28に供給される。そして、さらに、この実施形態では、臨場音主体信号SsL,SsRに対するゲイン制御態様は、入力音声信号の大きなレベル変動に対して即座に追従しない特性のものとされている。
【0111】
したがって、第1のゲイン制御態様のゲイン制御によって声主体信号について生じる大きなレベル変化点での音量レベルの揺れは、臨場音主体信号については、発生しない。
【0112】
このため、加算部27および28からの左右チャンネルの出力音声信号SoL、SoRは、補正後声主体信号Svcの音量レベルの揺れが、左チャンネルおよび右チャンネルの臨場音主体信号SsLおよびSsRによりマスキングされるようになる。この結果、声主体信号Svcの音量レベルの揺れが、目立たなくなり、聴取者に対する違和感が軽減される。
【0113】
[臨場音レベル補正ゲイン生成部40の構成例]
<第1の例>
入力音声信号のレベル変動あるいは声主体信号Svのレベル変動が大きく、声主体信号Svの出力レベルのみを一定レベルにゲイン制御したときには、元の入力音声信号に対するバランスが悪化して、違和感を感じる場合がある。
【0114】
この第1の例は、この問題を改善する場合の例である。図15は、この第1の例における臨場音レベル補正ゲイン生成部40の構成例を示すもので、この第1の例においては、臨場音レベル補正ゲイン生成部40は、ゲイン値変換テーブル部41からなる。
【0115】
ゲイン値変換テーブル部41は、声主体信号Svに対するゲイン制御信号Gvを入力信号として受けて、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するものであり、ゲイン値変換テーブルメモリ(図示は省略)を有する。
【0116】
ゲイン値変換テーブル部41が備えるゲイン値変換テーブルメモリに記憶されるゲイン値変換テーブル情報の例を説明するための図を図16に示す。
【0117】
声主体信号Svのレベル変動が小さい場合あるいは入力音声信号全体(センター集中定位信号検出部21が第1の例の場合)のレベル変動が小さいときには、ゲイン制御信号Gvによる声レベル補正ゲイン値は、Gv=1を中心として大きく変化しない。
【0118】
このような場合には、前述した臨場音主体信号と、声主体信号とのバランスは、元の入力音声信号から大きく外れてはいないので、違和感が感じられることはない。このため、このようなレベル変動が小さい範囲では、臨場音主体信号SsL,SsRは、第1の実施形態のように、固定ゲイン「1」のアンプを通じて出力してもよい。
【0119】
そこで、この図16の例においては、0.75≦Gv≦1.25の範囲では、臨場音主体信号に対するゲイン制御信号Gsは、常にGs=1のゲイン値にする。
【0120】
そして、入力音声信号のレベル変動あるいは声主体信号Svのレベル変動が、このような小さいレベル変動範囲から逸脱する場合には、この例では、ゲイン制御信号Gvに対して所定の比を持って、追従して、臨場音主体信号SsL,SsRをゲイン制御する。
【0121】
すなわち、図16の例においては、Gv<0.75となる入力レベルが大きくなる範囲では、Gs/Gv=k1(=1/0.75)の関係を持って、ゲイン制御信号Gvから、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するようにする。
【0122】
また、Gv>1.25となる入力レベルが小さくなる範囲では、Gs/Gv=k2(=2/2.5)の関係を持って、ゲイン制御信号Gvから、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するようにする。
【0123】
このようにすることにより、声レベル補正ゲインが大きく変動した場合でも、臨場音レベル補正ゲインが、声レベル補正ゲインと一定の比を持って追従するので、声主体信号レベルに対する臨場音主体信号レベルのバランスが大きく開いてしまうことを防止できる。したがって、レベル変動が大きい場合においても自然なレベル遷移を実現することができるようになる。
【0124】
ゲイン値変換テーブル部41は、声主体信号Svに対するゲイン制御信号Gvの値をゲイン値変換テーブルメモリの読み出しアドレス入力として、対応する臨場音主体信号に対するゲイン制御信号Gsを読み出して、出力するように構成できる。
【0125】
なお、ゲイン値変換テーブル部41は、ソフトウエア処理演算による機能手段として構成することもできる。図17に、その場合におけるソフトウエア処理演算のフローチャートの例を示す。
【0126】
ゲイン値変換テーブル部41は、入力された声主体信号についてのゲイン制御信号Gvのゲイン値を検知する(ステップS101)。次に、そのゲイン値Gvが、Gv<0.75であるか否か判別し(ステップS102)、Gv<0.75であると判別したときには、Gs=k1×Gvなる演算により臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを算出する(ステップS103)。
【0127】
ステップS102で、Gv<0.75ではないと判別したときには、Gv>1.25であるか否か判別する(ステップS104)。そして、Gv>1.25であると判別したときには、Gs=k2×Gvなる演算により臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを算出する(ステップS105)。
【0128】
さらに、ステップS104で、Gv>1.25ではないと判別したときには、0.75≦Gv≦1.25であることを確認して、Gs=1とする(ステップS106)。
【0129】
そして、ステップS103,104および106の後には、ステップS101に戻り、以上の処理を繰り返す。
【0130】
なお、上述の説明のゲイン値の数値は、一例であり、これに限られるものではないことはいうまでもない。そして、ゲイン値Gv=1を中心とするレベル変動が小さい範囲、すなわち、α≦Gv≦βの範囲においては、上述の例では、1−α=β−1としたが、1−α≠β−1であっても勿論良い。
【0131】
また、Gv<αの範囲での比の値k1と、Gv>βの範囲での比の値k2も、一例であり、また、k1=k2であってもよい。
【0132】
この第1の例の場合における音量補正処理動作を、図18の信号波形のタイミングチャートを参照しながら説明する。
【0133】
この図18は、上述の第1の実施形態の説明に用いた図3と同様のものである。すなわち、声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図18(A)および(B)に示すようなレベル変動を有するとした場合には、ゲイン制御信号Gvによる声主体信号Svに対する声レベル補正ゲインは、図18(C)に示すようなものとなる。
【0134】
このゲイン制御信号Gvにより可変ゲインアンプ24がゲイン制御され、その結果、可変ゲインアンプ24からの補正後声主体信号Svcは、図18(E)に示すような一定レベルの信号になるようにされる。
【0135】
そして、この例では、臨場音主体信号SsLおよびSsRに対するゲイン制御信号Gsは、ゲイン制御信号Gvに基づいて上述のように生成されて、図18(D)に示すようなものとなる。
【0136】
このゲイン制御信号Gsにより可変ゲインアンプ250および260がゲイン制御される。その結果、可変ゲインアンプ250および260からの補正後臨場音主体信号SsLcおよびSsRcは、図18(F)に示すように、図18(B)に示した臨場音主体信号SsLおよびSsRがゲイン制御されたものとなる。
【0137】
なお、上述の説明から明らかなように、この第1の例は、入力音声信号あるいは声主体信号のレベルが大きく変動する場合に有効であり、入力音声信号あるいは声主体信号Svのレベル変動が小さい場合には、第1の実施形態のままでよい。
【0138】
そこで、入力音声信号のレベル変動を検出し、その検出結果を用いて、臨場音主体信号に対するゲイン制御態様を自動的に切り替え制御するように構成することもできる。
【0139】
図19は、その場合の構成例を示すもので、図19に示すように、左右2チャンネルの入力音声信号SiLおよびSiRの全体のレベル変動を検出するレベル変動検出部29を設ける。
【0140】
また、この例の臨場音レベル補正ゲイン生成部40は、第1の実施形態と同様に、臨場音主体信号に対しては、可変ゲインアンプ250および260のゲイン値を固定ゲイン「1」とする状態と、第2の実施形態のようにゲイン制御する状態とを有する。
【0141】
そして、レベル変動検出部29では、例えば左右2チャンネルの入力音声信号SiLおよびSiRを加算し、その加算信号についてレベル変動を検出し、その検出結果から、臨場音レベル補正ゲイン生成部40に切り替え制御信号SWを供給する。
【0142】
レベル変動検出部29は、検出したレベル変動が、予め設定した小レベル範囲であるときには、臨場音レベル補正ゲイン生成部40に対して、可変ゲインアンプ250および260のゲイン値を固定ゲイン「1」とする状態にする切り替え制御信号SWを供給する。
【0143】
また、レベル変動検出部29は、検出したレベル変動が、前記小レベル範囲を逸脱したときには、臨場音レベル補正ゲイン生成部40に対して、可変ゲインアンプ250および260に、ゲイン制御信号Gsを供給する状態にする切り替え制御信号SWを供給する。
【0144】
これにより、この図19の例によれば、入力音声信号のレベル変動が大きいときには、自動的に第2の実施形態の状態になり、第1の実施形態のみの状態の問題点を回避することができる。
【0145】
<第2の例>
この第2の例は、臨場音主体信号SsLおよびSsRに対しては、第1の実施形態の場合や第1の例のように固定ゲインとすることはせず、声主体信号Svのゲイン制御に合わせて、ゲイン制御するようにする。これにより、全体のバランスを元の入力音声信号のままとして、自然な再生音声とすることができるようにする。
【0146】
図20は、この第2の例における臨場音レベル補正ゲイン生成部40の構成例を示すもので、この第2の例においては、臨場音レベル補正ゲイン生成部40は、遅延時定数処理部42からなる。
【0147】
すなわち、この第2の例においては、遅延時定数処理部42において、声主体信号Svに対するゲイン制御信号Gvについて遅延時定数処理がなされて、臨場音主体信号SsLおよびSsRに対するゲイン制御信号Gsが生成される。すなわち、声レベル補正ゲインに遅れて追従する時間遅れ特性を持った臨場音レベル補正ゲインを得ることができる。
【0148】
この第2の例の場合における音量補正処理動作を、図21の信号波形のタイミングチャートを参照しながら説明する。
【0149】
この図21は、上述の第1の例の説明に用いた図18と同様のものである。すなわち、声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図21(A)および(B)に示すようなレベル変動を有するとした場合には、ゲイン制御信号Gvによる声主体信号Svに対する声レベル補正ゲインは、図21(C)に示すようなものとなる。
【0150】
そして、このゲイン制御信号Gvにより可変ゲインアンプ24がゲイン制御され、その結果、可変ゲインアンプ24からの補正後声主体信号Svcは、図21(E)に示すような一定レベルの信号になるようにされる。
【0151】
一方、この第2の例では、臨場音主体信号SsL及びSsRに対するゲイン制御信号Gsは、図21(C)に示されるゲイン制御信号Gvが遅延時定数処理されて、図21(D)に示すように、ゲイン値が所定の時定数を持った時間遅れ特性で変化するものとなる。
【0152】
このゲイン制御信号Gsにより可変ゲインアンプ250および260がゲイン制御されることにより、可変ゲインアンプ250および260からの補正後臨場音主体信号SsLcおよびSsRcは、図21(F)に示すようなものとなる。
【0153】
この第2の例によれば、声主体信号Svを素早く適正レベルに遷移させる瞬間は、臨場音レベル補正ゲインは変化させないで、臨場感が一定に保たれる。また、臨場音主体信号SsL、SsRは、遅れてゆっくりレベルが補正されるようになるので、ゲイン制御により、レベル変化点で大きくレベルを変えることによる違和感を軽減することができる。これにより、自然なレベル遷移を実現することができる。また、声主体信号Svと臨場音主体信号SsL、SsRとのバランスが、元の入力音声信号のバランスへと収束するので、より自然な自動音量補正を実現できる。
【0154】
<第3の例>
上述の第2の例は、臨場音主体信号SsLおよびSsRは、声主体信号Svのゲイン制御に合わせて、ゲイン制御するようにしたものである。したがって、声主体信号Svの補正ゲインが、非常に大きくなったり、また、非常に小さくなったときにも、臨場音主体信号SsLおよびSsRに対する補正ゲインも、それに応じたものとなってしまう。
【0155】
この第3の例は、第2の例の変形例であり、上記問題点を改善するものである。
【0156】
図22は、この第3の例における臨場音レベル補正ゲイン生成部40の構成例を示すもので、遅延時定数処理部42の他に、上限補正ゲイン生成部43と、下限補正ゲイン生成部44とが設けられる。
【0157】
上限補正ゲイン生成部43は、声主体信号Svについてのゲイン制御信号Gvを入力信号として受け、そのゲイン制御信号Gvに、予め定めた基準値Ku(Ku>1)を掛けて上限補正ゲインULを生成する。この例では、前記基準値Kuは、Ku=2とされる。そして、上限補正ゲイン生成部43は、生成した上限補正ゲインULを、遅延時定数処理部42に供給する。
【0158】
また、下限補正ゲイン生成部44は、声主体信号Svについてのゲイン制御信号Gvを入力信号として受け、そのゲイン制御信号Gvに、予め定めた基準値Kb(Kb<1)を掛けて下限補正ゲインBLを生成する。この例では、前記基準値Kbは、Kb=0.5とされる。そして、下限補正ゲイン生成部44は、生成した下限補正ゲインBLを、遅延時定数処理部42に供給する。
【0159】
この第3の例における遅延時定数処理部42においても、これに入力される声主体信号Svに対するゲイン制御信号Gvについて遅延時定数処理を行って、臨場音主体信号に対するゲイン制御信号Gsを得る。ただし、この第3の例においては、遅延時定数処理部42は、上限補正ゲインULおよび下限補正ゲインBLを常に監視し、ゲイン制御信号Gsが、常に、上限補正ゲインUL≧Gs≧下限補正ゲインBLとなるように制限する。
【0160】
この第3の例の場合における音量補正処理動作を、図23の信号波形のタイミングチャートを参照しながら説明する。
【0161】
この図23は、上述の第2の例の説明に用いた図21と同様のものである。すなわち、声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図23(A)および(B)に示すようなレベル変動を有するとした場合には、ゲイン制御信号Gvによる声主体信号Svに対する声レベル補正ゲインは、図23(C)に示すようなものとなる。
【0162】
そして、このゲイン制御信号Gvにより可変ゲインアンプ24がゲイン制御され、その結果、可変ゲインアンプ24からの補正後声主体信号Svcは、図23(E)に示すような一定レベルの信号になるようにされる。
【0163】
一方、この第3の例では、臨場音主体信号SsL及びSsRに対するゲイン制御信号Gsは、図23(C)に示されるゲイン制御信号Gvが遅延時定数処理されて、図23(D)に示すように、ゲイン値が所定の時定数を持った時間遅れ特性で変化するものとなる。そして、図23(D)に示されるように、この場合のゲイン制御信号Gsは、上限補正ゲインULより大きくならず、また、下限補正ゲインBLより小さくならないように制限される。
【0164】
すなわち、図23(D)に示すように、時点t1から時点t2までの区間では、ゲイン制御信号Gsは、上限補正ゲインUL≧Gs≧下限補正ゲインBLを満足しているので、第2の例の場合(図21(D))と同様となる。
【0165】
しかし、時点t2を過ぎた時点になると、下限補正ゲインBLが時点t2前の値よりも大きくなり、ゲイン値Gsが当該下限補正ゲインBL以下となってしまう。そこで、遅延時定数処理部42では、時点t2において、ゲイン値Gsを下限補正ゲインBLとし、当該下限補正ゲインBLを始点としてゲイン制御信号Gvについての遅延時定数処理を開始するようにする。
【0166】
また、図23の例では、時点t3を過ぎた時点になると、上限補正ゲインULが時点t3前の値よりも低くなり、ゲイン値Gsが当該上限補正ゲインUL以上となってしまう。そこで、遅延時定数処理部42では、時点t3において、ゲイン値Gsを上限補正ゲインULとし、当該上限補正ゲインULを始点としてゲイン制御信号Gvについての遅延時定数処理を開始するようにする。
【0167】
このゲイン制御信号Gsにより可変ゲインアンプ250および260がゲイン制御されることにより、可変ゲインアンプ250および260からの補正後臨場音主体信号SsLcおよびSsRcは、図23(F)に示すようなものとなる。
【0168】
この第3の例によれば、声主体信号レベルに対して臨場音主体信号のレベルが大きく開いてしまうことがないため、声レベルの変化量が多い場合にも自然なレベル遷移を実現することができるようになる。また、声主体信号Svと臨場音主体信号SsL、SsRとのバランスが、オリジナルバランスへと収束するため、より自然な自動音量補正を実現できる。
【0169】
さらに、声主体信号Svの補正ゲインが、非常に大きくなったり、また、非常に小さくなったときにも、臨場音主体信号SsLおよびSsRに対する補正ゲインGsは、所定のレベル範囲に制限されるので、これも、自然な自動音量補正の実現に寄与する。
【0170】
なお、上述の第3の例の説明では、上限補正ゲインと、下限補正ゲインの両方を設定するようにしたが、そのいずれか一方のみを設定して、ゲインレベル範囲制限を行うようにしても良い。
【0171】
なお、上述の説明では、臨場音レベル補正ゲイン生成部40の第1の例〜第3の例は、それぞれ単独で設けて、臨場音主体信号に対するゲイン制御信号Gsを生成するようにした。しかし、第1の実施形態における臨場音主体信号については、固定ゲイン「1」にする場合と、前述の臨場音レベル補正ゲイン生成部40の第1の例〜第3の例との4種をそれぞれ音量補正部18に設けておき、それを切り替えることができるようにしてもよい。
【0172】
その切り替え方法としては、操作手段に切り替え操作部を設け、ユーザが適宜、手動で切り替える方法の他、次のように自動的に切り替える方法を採用することができる。
【0173】
例えば、テレビ放送信号に含まれるEPG(Electronic Programming Guide;電子番組ガイド)情報を用いて自動切り替えする方法を採用できる。すなわち、例えばドラマ、スポーツ、バラエテイーなどの放送番組のジャンルに対して、臨場音レベル補正ゲイン生成部40の4種の例のうちの最適と考えられる方法を対応つけるテーブルを作成しておく。そして、テレビ放送信号からEPG情報を検出して、放送番組のジャンルを検出し、前記テーブルを参照することで、4種のうちの最適な臨場音レベル補正ゲイン生成手法に切り替え設定するようにする。
【0174】
また、例えばDVDコンテンツに、予め、前記4種のうちの最適な臨場音レベル補正ゲイン生成手法を特定する識別情報を記録しておく。一方、DVD再生装置には、この識別情報と、4種の臨場音レベル補正ゲイン生成手法との対応情報を保持するようにする。そして、再生時に、DVD再生装置は、DVDから前記識別情報を取得し、その取得した識別情報により前記対応情報を参照することで、いずれの臨場音レベル補正ゲイン生成手法を用いるかを決定するようにする。
【0175】
なお、EPG情報の一部に、放送番組毎に同様の臨場音レベル補正ゲイン生成手法を特定する識別情報を含めておくことにより、テレビ放送番組についても、同様にして、いずれの臨場音レベル補正ゲイン生成手法を用いるかを決定するようにすることができる。
【0176】
[他の実施形態]
<他の分離例>
上述の第1、第2の実施形態では、第1成分主体信号は、声主体信号とし、他の成分を主体とする信号は、臨場音主体信号としたが、この発明は、このような分離の方法に限られるわけではない。例えば、入力音声信号の中域成分と、当該中域成分以外の帯域成分とに分離し、それぞれに対して、互いに異なる第1のゲイン制御態様および第2のゲイン制御態様のゲイン制御を行うようにすることもできる。
【0177】
また、以上の実施形態では、音声信号は、左右2チャンネルの場合であったが、この発明の音量補正対象の音声信号は、モノーラル音声信号であっても良いことは言うまでもない。
【0178】
図24は、入力音声信号の他の分離例を示すものであり、モノーラルの入力音声信号を上記のように周波数帯域により分離する例である。なお、この図24の例は、上述した第2の実施形態に適用した場合の例である。第1の実施形態に適用することも勿論できる。
【0179】
すなわち、図24に示すように、この例の場合の分離部50においては、モノーラル入力音声信号Siは、音声信号の中域成分を抽出するためのバンドパスフィルタ51に供給されて、これより音声信号の中域成分のみからなる中域主体信号Smを得る。この中域主体信号Smは、可変ゲインアンプ53に供給される。
【0180】
そして、バンドパスフィルタ51からの中域主体信号Smを、減算部52に供給して、入力音声信号Siから減算することにより、入力音声信号Siの高域・低域成分主体信号Shlを得る。この高域・低域成分主体信号Shlは、可変ゲインアンプ54を通じて加算部55に供給される。
【0181】
そして、この例においては、バンドパスフィルタ51からの中域主体信号Smを中域レベル補正ゲイン生成部56に供給する。中域レベル補正ゲイン生成部56は、この例では、中域主体信号Smの平均レベルを検出し、当該平均レベルが基準レベルとなるようにすることにより、中域主体信号Smの出力レベルを一定レベルとするようにするためのゲイン制御信号Gmを生成する。このゲイン制御信号Gmは、中域レベル補正ゲインとなる。
【0182】
そして、中域レベル補正ゲイン生成部56は、生成したゲイン制御信号Gmを可変ゲインアンプ53に供給して、中域主体信号Smを、その出力レベルを一定レベルとするようにゲイン制御する。
【0183】
また、この例では、中域レベル補正ゲイン生成部56で生成されたゲイン制御信号Gmは、高域・低域レベル補正ゲイン生成部57に供給される。高域・低域レベル補正ゲイン生成部57では、上述した第2の実施形態の場合と同様にして、高域・低域主体信号についてのゲイン制御信号Ghl(高域・低域レベル補正ゲイン)を生成する。
【0184】
そして、高域・低域レベル補正ゲイン生成部57は、生成したゲイン制御信号Ghlを可変ゲインアンプ54に供給して、高域・低域主体信号Shlを、上述した第2の実施形態と同様にして、ゲイン制御する。
【0185】
こうして、加算部55からは、第1のゲイン制御態様でゲイン補正された中域主体信号と、第2のゲイン制御態様でゲイン補正された高域・低域主体信号とが加算された出力音声信号Soが得られる。
【0186】
したがって、この図24の例においても、上述の実施形態と同様にして、ゲイン制御による音量レベルの揺れを目立たなくした自動音量補正ができる。
【0187】
音声信号の分離例としては、この図24の他にも、例えば低域と高域との2つに周波数帯域分離する方法など、その他種々のものが可能である。また、2つに分離するのではなく、3つ以上に分離するようにして良い。その場合、3つ以上の信号成分のうちの1つについては第1のゲイン制御態様とし、他の信号成分のすべてについては第2のゲイン制御態様とするようにしてもよいし、他の信号成分についても、2つ以上の異なるゲイン制御態様とするようにしても良い。
【0188】
<マルチチャンネルの場合>
また、最近は、音声信号は5.1チャンネルのサラウンド音声信号など、3チャンネル以上のマルチチャンネルの場合もある。このようなマルチチャンネルの場合には、入力音声信号は、既に分離されていることになる。そして、マルチチャンネルのうちに、センターチャンネルが存在する場合には、当該センターチャンネルを上述の実施形態の声主体信号とすることができる。
【0189】
図25は、入力音声信号が5.1チャンネルのサラウンド音声信号である場合における音量補正装置の概要を説明するための図である。
【0190】
すなわち、この例においては、前方左右チャンネルの音声信号FLi,FRiは、可変ゲインアンプ61,62に供給される。また、後方左右チャンネルの音声信号RLi,RRiは、可変ゲインアンプ63,64に供給される。また、センターチャンネルの音声信号Ciは、可変ゲインアンプ65に供給される。さらに、低域専用チャンネルの音声信号LFE(Low Frequency Effect)は、可変ゲインアンプ66に供給される。
【0191】
センターチャンネルの音声信号Ciは、また、声レベル補正ゲイン生成部67に供給される。この声レベル補正ゲイン生成部67は、図14に示した声レベル補正ゲイン生成部30と同様の構成を備え、ゲイン制御信号Gvを生成する。そして、声レベル補正ゲイン生成部67で生成されたゲイン制御信号Gvは、センターチャンネル用の可変ゲインアンプ65に供給される。
【0192】
声レベル補正ゲイン生成部67で生成されたゲイン制御信号Gvは、また、臨場音レベル補正ゲイン生成部68に供給される。この臨場音レベル補正ゲイン生成部68は、図14に示した臨場音レベル補正ゲイン生成部40と同様の構成を備え、ゲイン制御信号Gsを生成する。そして、臨場音レベル補正ゲイン生成部68で生成されたゲイン制御信号Gsは、センターチャンネル以外用の可変ゲインアンプ61〜64、66に供給される。
【0193】
そして、可変ゲインアンプ61〜66のそれぞれから出力音声信号FLo、FRo、RLo、RRo、Co、LFoが得られ、それぞれ用のスピーカにより放音されるようにされる。
【0194】
この図25の例によれば、5.1チャンネルの入力音声信号FLi、FRi、RLi、RRi、Ci、LFiのうちのセンターチャンネルの音声信号Ciが、ゲイン制御信号Gvにより第1のゲイン制御態様でゲイン制御される。一方、5.1チャンネルの入力音声信号FLi、FRi、RLi、RRi、Ci、LFiのうちのセンターチャンネル以外の音声信号は、ゲイン制御信号Gsにより、前記第1のゲイン制御態様とは異なる第2のゲイン制御態様でゲイン制御される。
【0195】
そして、5.1チャンネルの出力音声信号FLo、FRo、RLo、RRo、Co、LFoが、それぞれ別々のスピーカにより音響再生されて、音響的に合成されることにより、第1のゲイン制御態様による音揺れが軽減され、違和感を生じないものとなる。
【0196】
なお、図25の例においては、センターチャンネル以外の音声信号は、すべてゲイン制御信号Gsにより、第2のゲイン制御態様でゲイン制御するようにしたが、各チャンネル毎に、異なる他のゲイン制御態様で、それぞれゲイン制御するようにしても良い。また、センターチャンネル以外の音声信号を2つ以上にグループ分けし、そのグループ毎に異なるゲイン制御態様でゲイン制御するようにしても良い。
【0197】
なお、5.1チャンネルのマルチチャンネルの音声信号がダウンミックスされて、2チャンネルとして2個のスピーカで音響再生する場合もある。その場合には、ダウンミックスの結果得られた2チャンネルの音声信号に対して、上述した第1の実施形態または第2の実施形態を適用すればよい。
【0198】
また、ダウンミックスを行う場合においても、5.1チャンネルの音声信号のセンターチャンネルの音声信号を用いて、ゲイン制御する図26に示すような構成としても良い。
【0199】
図26は、入力音声信号が5.1チャンネルのサラウンド音声信号がダウンミックスされて、出力が2チャンネルとされる場合における音量補正装置の実施形態の概要を説明するための図である。なお、この図24の例は、上述した第2の実施形態に適用した場合の例である。第1の実施形態に適用することも勿論できる。
【0200】
すなわち、図26の例においては、5.1チャンネルのサラウンド音声信号FLi、FRi、RLi、RRi、Ci、LFiのそれぞれが、ダウンミックス部71に供給されて、左右2チャンネルの音声信号Li,Riとされる。また、この例においては、ダウンミックス部71は、センターチャンネルの音声信号Ciは、そのまま出力する。
【0201】
このダウンミックス部71からの左右2チャンネルの音声信号Li,Riは、それぞれ可変ゲインアンプ72,73に供給される。そして、この可変ゲインアンプ72および73の出力信号は、加算部77および78に供給される。
【0202】
また、ダウンミックス部71からのセンターチャンネルの音声信号Ciは、可変ゲインアンプ74に供給される。そして、この可変ゲインアンプ74の出力信号が加算部77及び78に供給される。この加算部77および78から、2チャンネル出力音声信号SoLおよびSoRを出力する。
【0203】
ダウンミックス部71からのセンターチャンネルの音声信号Ciは、さらに、声レベル補正ゲイン生成部75に供給される。この声レベル補正ゲイン生成部75は、図14に示した声レベル補正ゲイン生成部30と同様の構成を備え、ゲイン制御信号Gvを生成する。そして、声レベル補正ゲイン生成部75で生成されたゲイン制御信号Gvは、センターチャンネル用の可変ゲインアンプ74に供給される。
【0204】
声レベル補正ゲイン生成部75で生成されたゲイン制御信号Gvは、また、臨場音レベル補正ゲイン生成部76に供給される。この臨場音レベル補正ゲイン生成部76は、図14に示した臨場音レベル補正ゲイン生成部40と同様の構成を備え、ゲイン制御信号Gsを生成する。そして、臨場音レベル補正ゲイン生成部76で生成されたゲイン制御信号Gsは、可変ゲインアンプ72、73に供給される。
【0205】
この図26の例においても、上述と同様の作用効果を奏する。
【0206】
<非リアルタイム処理>
以上の実施形態は、入力音声信号について、リアルタイムで声平均レベルや声以外平均レベルを検出して、ゲイン制御するようにした場合である。しかし、この発明は、リアルタイム処理の場合のみに適用されるわけではない。
【0207】
例えば記録媒体に記録された音声信号について、ゲイン制御信号GvやGsを生成して、それを記録信号に対応付けて記録するようにすることもできる。その場合には、再生時には、当該記録されているゲイン制御信号GvやGsを用いて、再生音声信号を音量制御するようにすることができる。
【0208】
図27は、例えばハードディスクやDVD(Digital Versatile Disc)などの記録媒体に、テレビ放送信号を記録することができる記録再生装置に、この発明を適用した場合のブロック図である。
【0209】
すなわち、この図27の例の記録再生装置80においては、放送記録系81と、再生系82と、レベル補正ゲイン生成部83と、制御部84と、操作部85とを備える。操作部85は、例えばリモコン送受信部からなる。制御部84は、例えばマイクロコンピュータを搭載して構成され、操作部85からの操作入力に応じた制御を、記録再生装置80の各部に対して行う。
【0210】
レベル補正ゲイン生成部83は、上述した図1に示した第1の実施形態を適用した場合であれば、センター集中定位信号検出部21と、声レベル補正ゲイン生成部30からなる。また、上述の図14に示した第2の実施形態を適用した場合であれば、センター集中定位信号検出部21と、声レベル補正ゲイン生成部30と、臨場音レベル補正ゲイン生成部40とからなる。
【0211】
操作部85を通じてユーザにより記録指示操作があると、制御部84は、放送記録系81を制御して、記録指示された放送番組の記録を実行する。
【0212】
放送記録系81においては、放送受信部811で記録指示された放送番組の放送波信号を受信し、デコード部812に供給する。デコード部812では、この例では、受信信号から映像信号V1と、音声信号A1とがデコードされて出力される。ここで、音声信号A1は、例えば左右2チャンネル音声信号とされる。
【0213】
このデコード部812からの映像信号V1および音声信号A1は、記録エンコード部813で記録エンコードされた後、書き込み部815を通じて記録媒体816に記録される。記録媒体816は、例えばハードディスク装置が用いられる。
【0214】
操作部85には、この例では、記録媒体816に記録されている放送番組コンテンツを指定するためのキーおよびレベル補正ゲイン生成指示キーが設けられている。ユーザにより、記録されている放送番組コンテンツの指定がなされ、レベル補正ゲイン生成指示キーが操作されると、制御部84は、指定された放送番組コンテンツの音声信号についての再生音量を適正にするためのレベル補正ゲイン生成処理を実行するようにする。
【0215】
すなわち、制御部84は、前記レベル補正ゲイン生成指示キーの操作入力に基づき、再生系の読み出し部821と、再生デコード部822と、レベル補正ゲイン生成部83および書き込み部815を動作状態に制御する。
【0216】
そして、制御部84は、読み出し部821を制御して、記録媒体816から指定された放送番組の記録信号を読み出す。読み出し部821は、読み出した記録信号を再生デコード部822に供給する。再生デコード部822は、記録信号を再生デコードして、再生映像信号V2および再生音声信号A2を出力する。
【0217】
この再生デコード部822からの再生音声信号A2は、レベル補正ゲイン生成部83に供給される。このレベル補正ゲイン生成部83では、上述の第1の実施形態または第2の実施形態で説明したようにして、ゲイン制御信号GvやGsが生成される。
【0218】
そして、レベル補正ゲイン生成部83は、生成したゲイン制御信号GvやGsを書き込み部815に供給する。書き込み部815は、制御部84の制御を受けながら、レベル補正ゲイン生成部83からのゲイン制御信号GvやGsを、再生中の記録信号に対応付けて記録媒体816に記録するようにする。
【0219】
次に、操作部85を通じてユーザにより再生指示操作があると、制御部84は、再生系82を制御して、再生指示された放送番組の再生を実行する。
【0220】
すなわち、制御部84は、読み出し部821を制御して、記録媒体816から指定された放送番組の記録信号と、対応付けられて記録されているゲイン制御信号GvやGsとを読み出す。読み出し部821は、読み出した記録信号を再生デコード部822に供給すると共に、読み出したゲイン制御信号GvやGsをゲイン制御信号再生部826に供給する。
【0221】
再生デコード部822は、記録信号を再生デコードして、再生映像信号V2および再生音声信号A2を得る。そして、再生映像信号V2を映像信号処理部823を通じ、映像出力端827を通じて出力する。出力端827には、表示装置が接続され、その表示画面に、放送番組の再生映像が映出される。
【0222】
また、再生デコード部822からの再生音声信号は、音声信号処理部824を通じて音量補正部825に供給される。この音量補正部825は、図1の第1の実施形態の場合であれば、声レベル補正ゲイン発生部30が除去された構成とされ、また、図14の第2の実施形態の場合であれば、声レベル補正ゲイン発生部30および臨場音レベル補正部40が除去された構成とされる。
【0223】
一方、ゲイン制御信号再生部826では、読み出し部821からの信号から、ゲイン制御信号GvやGsが再生される。そして、ゲイン制御信号再生部826は、再生したゲイン制御信号GvやGsを音量補正部825に供給して、上述の実施形態で説明したようにしてゲイン制御するようにする。したがって、音量補正部825から得られる音声信号は、上述した第1の実施形態および第2の実施形態と同様にして、自動音量補正しても違和感の生じないものとなる。
【0224】
この音量補正部825からの再生音声信号は、音声出力端828を通じて、スピーカに供給される。
【0225】
なお、この図27の例においては、レベル補正ゲイン生成部83では、上述した第1の実施形態または第2の実施形態と同様の構成としたが、この図27の例は、リアルタイム処理である必要は無いので、処理時間はかかるが、より高精度の構成とすることもできる。
【0226】
例えば、記録再生装置80が、十分なバッファ容量および処理能力を持った構成である場合には、音声信号の自己相関をとりながら、ピッチ検出をして人声信号が含まれる人声主体信号を検出するようにすることもできる。また、FFT(Fast Fourier Transform)によるスペクトル包絡のケプストラム解析を行なうなどして、より、精密に、人声信号が含まれる人声主体信号を検出することもできる。
【0227】
なお、図27の例では、非リアルタイムでの処理においては、ゲイン制御信号GvやGsを生成して、記録信号に対応付けて記録するようにした。しかし、記録信号のうちの音声信号に対して、非リアルタイム処理により、上述のようなゲイン制御による音量補正処理を実行し、当該音量補正処理をした音声信号を、記録媒体に記録する(記録し直す)ようにしてもよい。この場合には、上述のような高精度の構成を用いて音声信号についてのゲイン制御ができる。
【0228】
また、図27の例は、音声信号について非リアルタイム処理でゲイン制御信号を生成する記録再生装置であるが、記録する音声信号に対して、上述した第1の実施形態や第2の実施形態を適用して、リアルタイムで音量補正処理をする記録再生装置としても良い。
【0229】
その場合の記録再生装置は、デコード部812でデコードした音声信号について、上述した第1の実施形態や第2の実施形態を適用してリアルタイムで音量補正処理をする。そして、その音量補正した音声信号を記録エンコード部813を通じて記録するようにする。このようにする記録再生装置の場合には、ゲイン制御信号GvやGsを記録信号に対応付けて記録する必要はないので、レベル補正ゲイン生成部83は不要となる。また、再生系82にレベル補正ゲイン抽出部826や音量補正部825を設ける必要はない。
【0230】
[その他の実施形態ないし変形例]
上述の第1および第2の実施形態では、声レベル補正ゲイン生成部30では、声主体信号の平均レベルが基準値となるようにすることにより、声主体信号の出力レベルを一定レベルにするようにした。しかし、声主体信号についてのゲイン制御態様としては、入力音声信号の全体レベルが基準値となるようなゲイン制御であってもよい。
【0231】
なお、上述の第2の実施形態では、声レベル補正ゲイン生成部30からの出力ゲイン制御信号Gvを、臨場音レベル補正ゲイン生成部40に供給して、ゲイン制御信号Gvに対して更なる処理を加えることで、ゲイン制御態様を変更するようにした。しかし、第1のゲイン制御態様と、第2のゲイン制御態様とは、このような従属関係にする必要はない。要は、第1成分主体信号についての第1のゲイン制御態様と、第1成分以外の他の音声成分主体信号についての第2のゲイン制御態様とが、上述の例のように異なる態様であればよい。
【0232】
また、分離部における音声分離の他の方法についても説明したように、声主体信号は第1成分主体信号の一例であり、臨場音主体信号は、第1成分以外の他の音声成分主体信号の一例である。第1成分主体信号と第1成分以外の他の音声成分主体信号とは、入力音声信号における、その他、種々の信号を対象とすることができる。上述のマルチチャンネルの1つのチャンネルを第1成分主体信号とし、他のチャネルを第1成分以外の他の音声成分主体信号とするのも、その一例である。
【0233】
なお、上述の説明では、センター集中定位信号検出部21や声レベル補正ゲイン生成部30、臨場音レベル補正ゲイン生成部40は、デスクリートの回路部からなるハードウエア構成としたが、DSP(Digital Signal Processor)を用いた構成としてもよい。
【0234】
また、センター集中定位信号検出部21や声レベル補正ゲイン生成部30、臨場音レベル補正ゲイン生成部40は、コンピュータのプログラムによるソフトウエア処理の構成とすることもできることは言うまでもない。その場合には、例えば図2の例においては、声レベル補正ゲイン生成部30や臨場音レベル補正ゲイン生成部40は、制御部10がソフトウエア処理機能として備える。そして、図2において、点線で示したように、この制御部10からのゲイン制御信号により、音量補正部18が備える可変ゲインアンプをゲイン制御する。
【0235】
なお、音声信号を、デジタル信号処理とするのであれば、可変ゲインアンプを含めた音量補正部18の全てをソフトウエア処理として構成することもできるものである。
【0236】
なお、この発明による音量補正装置が適用される電子機器は、図2に示したテレビ放送受信装置に限られるものではないことは言うまでもない。
【符号の説明】
【0237】
20,50…分離部、21…センター集中定位信号検出部、24,250,260…可変ゲインアンプ、25,26…固定ゲインアンプ、30…声レベル補正ゲイン生成部、40…臨場音レベル補正ゲイン生成部、27,28…加算部
【技術分野】
【0001】
この発明は、例えばテレビ放送受信機などに代表される電子機器の音声出力部に適用して好適な音量補正装置、音量補正方法および音量補正プログラムに関する。
【背景技術】
【0002】
テレビ放送受信機で受信する放送チャンネルを切り替えたときや、AV(Audio−Visual)システムにおいて、AVセンタで複数の入力機器の切り替えがなされたとき、コンテンツ間のレベル差により、出力音量に大きな変化が生じてしてしまうことがある。
【0003】
このような場合、ユーザは、自分が好みの音量にするためには、リモコン等を用いてボリューム操作をして音量調節する必要があり、わずらわしさを感じる場合がある。
【0004】
また、同一コンテンツ内(例えば、同一の放送チャンネル内や同一の放送番組内)においても、コマーシャル(CM)部分やシーンの変化によって、出力音量が変化し、不快に思うことがある。
【0005】
この問題を解決する音量補正方式が従来から種々提案されている。その一例のAGC(Auto Gain Control;自動利得制御)による音量制御方式が広く知られている。
【0006】
図28は、このAGCを用いた音量補正部の構成例を示すブロック図である。この図28の例は、左右2チャンネルの入力音声信号SiLおよびSiRについて音量補正をする場合である。
【0007】
すなわち、この例においては、左右2チャンネルの入力音声信号SiLおよびSiRは、それぞれ、ゲイン制御信号によりゲインが可変制御される可変ゲインアンプ1Lおよび1Rに供給される。
【0008】
また、左右2チャンネルの入力音声信号SiLおよびSiRは、加算部2で互いに加算される。そして、加算部2からの加算出力信号は、アンプ3にて1/2ゲイン倍された後、平均レベル検出部4に供給され、この平均レベル検出部4で、加算出力信号の平均レベルが検出される。
【0009】
そして、平均レベル検出部4で検出された平均レベルがゲイン制御信号生成部5に供給される。このゲイン制御信号生成部5では、平均レベル検出部4からの平均レベルと、予め定められている基準レベルと比較し、その比較結果を用いて両レベルの差がゼロとなるようにするゲイン制御信号を生成し、可変ゲインアンプ1L,1Rに供給する。
【0010】
可変ゲインアンプ1L,1Rは、ゲイン制御信号生成部5からのゲイン制御信号によりゲインが可変制御される。この場合、左右2チャンネルの入力音声信号SiLおよびSiRは、この可変ゲインアンプ1L,1Rにおいて、前記加算部2からの加算出力信号の平均レベルが基準レベルと等しくなるようにゲイン制御される。
【0011】
この結果、可変ゲインアンプ1L,1Rから得られる左右2チャンネルの出力音声信号SoLおよびSoRは、小さな音は大きく、大きな音は小さく抑えられて、自動的に一定レベルの音量になるように補正される。
【0012】
上述したAGCによる音量補正方式の他にも、種々の音量補正方式が提案されている。 例えば、特許文献1(特許3321820号公報)には、コンプレッサーを設け、大レベルの音声入力があった場合には、入力レベルに対して出力音声レベルを小さく制御し、音量をある一定の範囲に制御するようにする方式が開示されている。
【先行技術文献】
【特許文献】
【0013】
【特許文献1】特許3321820号公報
【発明の概要】
【発明が解決しようとする課題】
【0014】
上述した従来の音量補正方式は、音声信号全体のレベルを監視して音量制御を行う方式である。例えばAGC方式の場合、音声信号全体の平均レベルを基準にして、音量制御(ゲイン制御)を行った場合、音声信号全体としての音量制御がなされ、うるさい音を出さないようにしたり、聞こえなかった小さな音を聞こえるようにしたりすることができる。
【0015】
ところで、例えばテレビ放送受信におけるチャンネル切り替え時や、AVセンタで複数の入力機器の切り替え時、また、コマーシャル(CM)部分やシーンの変化時には、その変化の前後で音声信号に大きなレベル差が生じることがある。
【0016】
このように、入力音声信号のレベルが大きくレベル変動した場合に、そのレベル変化点での音声信号ゲインの急激な変化を完全に抑えることは困難であり、前記レベル変化点で出力音声音量レベルが揺れるなど、聴取者に、聴感上、違和感を与える場合がある。
【0017】
特に、従来の音量補正方式では、音声信号全体を一律に同様にゲイン制御する方式であるため、前記の急激な変化点での音量レベルの揺れに対する違和感が目立つと言う問題があった。
【0018】
この発明は、上記の点に鑑みて、入力音声信号のレベルが大きくレベル変動した場合にも、そのレベル変化点における出力音声音量レベルの揺れを目立たなくして、違和感を軽減することができる音量補正装置および方法を提供することを目的とする。
【課題を解決するための手段】
【0019】
上記の課題を解決するために、この発明は、複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、を備える音量補正装置を提供する。
【0020】
また、前記音量補正装置において、前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、前記他成分ゲイン制御信号生成部は、前記第1成分ゲイン制御信号による補正ゲイン値が基準範囲内であるときには、前記第1成分以外の他の音声信号をそのままのレベルで出力するように制御し、前記第1成分ゲイン制御信号による補正ゲイン値が前記基準範囲外であるときには、前記他成分ゲイン制御信号の補正ゲインは、前記第1成分ゲイン制御信号による補正ゲインとの比が所定値に調整されたものとする。
【0021】
また、前記音量補正装置において、前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、前記他成分ゲイン制御部は、前記第1成分ゲイン制御信号による前記第1成分主体信号に対するゲイン補正に対して、遅れて追従する時間遅れ特性を持たせる他成分ゲイン制御信号を生成する。
【0022】
また、前記音量補正装置において、前記他成分ゲイン制御部は、前記他成分ゲイン制御信号による補正ゲイン値が、前記第1成分ゲイン制御信号による補正ゲイン値に対して所定の基準値を乗算した設定値を超えている場合には、前記他成分ゲイン制御信号による補正ゲイン値を前記設定値に固定するようにする。
【0023】
また、前記音量補正装置において、前記第1成分ゲイン制御部の出力信号と、前記他成分出力部の出力信号とを加算した加算出力信号を、音量補正後の音声出力信号とする。
【発明の効果】
【0024】
この発明によれば、第1成分主体信号と、第1成分以外の他成分の音声信号とが、異なるゲイン制御態様で出力されるので、入力音声信号のレベルが大きく変動したレベル変化点での音量レベルの揺れが目立たなくなり、違和感が軽減される。
【図面の簡単な説明】
【0025】
【図1】この発明による音量補正装置の第1の実施形態を説明するためのブロック図である。
【図2】この発明による音量補正装置が適用される電子機器の例を説明するためのブロック図である。
【図3】この発明による音量補正装置の第1の実施形態の動作説明のために用いる波形図である。
【図4】図1の実施形態におけるセンター集中定位信号生成部の構成例を示すブロック図である。
【図5】図1の実施形態におけるセンター集中定位信号生成部の他の構成例を示すブロック図である。
【図6】図5の例のセンター集中定位信号生成部の一部の構成例を説明するためのブロック図である。
【図7】図6の構成例の各部を説明するために用いる図である。
【図8】図6の構成例の各部を説明するために用いる図である。
【図9】図6の構成例の各部を説明するために用いる図である。
【図10】図6の構成例の各部を説明するために用いる図である。
【図11】図6の構成例の各部を説明するために用いる図である。
【図12】図6の構成例の各部を説明するために用いる図である。
【図13】図6の構成例の各部を説明するために用いる図である。
【図14】この発明による音量補正装置の第2の実施形態を説明するためのブロック図である。
【図15】第2の実施形態における臨場音レベル補正ゲイン生成部の第1の構成例を示すブロック図である。
【図16】臨場音レベル補正ゲイン生成部の第1の構成例を説明するために用いる図である。
【図17】臨場音レベル補正ゲイン生成部の第1の構成例における処理動作を説明するためのフローチャートを示す図である。
【図18】臨場音レベル補正ゲイン生成部の第1の構成例を用いたこの発明による音量補正装置の第2の実施形態の動作説明のために用いる波形図である。
【図19】臨場音レベル補正ゲイン生成部の第1の構成例を用いたこの発明による音量補正装置の第2の実施形態の変形例を示すブロック図である。
【図20】第2の実施形態における臨場音レベル補正ゲイン生成部の第2の構成例を示すブロック図である。
【図21】臨場音レベル補正ゲイン生成部の第2の構成例を用いたこの発明による音量補正装置の第2の実施形態の動作説明のために用いる波形図である。
【図22】第2の実施形態における臨場音レベル補正ゲイン生成部の第3の構成例を示すブロック図である。
【図23】臨場音レベル補正ゲイン生成部の第3の構成例を用いたこの発明による音量補正装置の第2の実施形態の動作説明のために用いる波形図である。
【図24】この発明による音量補正装置の他の実施形態を説明するためのブロック図である。
【図25】この発明による音量補正装置の他の実施形態を説明するためのブロック図である。
【図26】この発明による音量補正装置の他の実施形態を説明するためのブロック図である。
【図27】この発明による音量補正装置が適用される他の電子機器の例を示す図である。
【図28】従来の音量補正装置を説明するためのブロック図である。
【発明を実施するための形態】
【0026】
以下、この発明による音量補正装置の実施形態を、図面を参照しながら説明する。以下に説明する音量補正装置の実施形態は、テレビ放送受信機の音声出力部に用いられた場合である。
【0027】
すなわち、図2は、テレビ放送受信機の構成例を示すブロック図である。この図2の例のテレビ放送受信機は、マイクロコンピュータを具備して構成される制御部10を備える。この制御部10には、リモコン受信部11が接続され、このリモコン受信部11でリモコン送信機12からのリモコン信号を受けて、制御部10に伝達する。制御部10は、受信したリモコン信号に応じた処理制御を実行する。
【0028】
制御部10は、テレビ放送受信機の各部に対して制御信号を供給して、テレビ放送信号の受信およびその映像再生および音声再生の処理を実行する。
【0029】
チューナ部13は、制御部10からのユーザのリモコン操作に応じたチャンネル選択制御信号により指定される放送チャンネルの信号を、テレビ放送波信号から選択抽出する。そして、チューナ部13は、選択抽出した放送チャンネルの信号から、映像信号と、音声信号とを復調デコードし、映像信号は映像信号処理部14に供給し、音声信号は、音声信号処理部15に供給する。
【0030】
映像信号処理部14では、制御部10からの制御を受けて、映像信号についての所定の処理をし、その処理後の映像信号を表示制御部16を通じて、例えばLCD(Liquid Crystal Display)からなるディスプレイ17に供給する。これにより、選択された放送チャンネルの放送番組の画像がディスプレイ17に表示される。
【0031】
また、音声信号処理部15では、制御部10からの制御を受けて、音声信号についての所定の処理をする。この実施形態では、音声信号処理部15では、チューナ部13からの音声信号から、左右2チャンネルの音声信号SiLおよびSiRを生成し、その処理後の音声信号SiLおよびSiRを音量補正部18に供給する。
【0032】
音量補正部18は、この実施形態の音量補正装置が適用される部分であり、その入力音声信号SiLおよびSiRは、後述するようにして、音量補正され、出力音声信号SoLおよびSoRとし出力される。そして、この音量補正部18からの出力音声信号SoLおよびSoRが、スピーカ19Lおよび19Rに供給されて、音響再生される。これにより、選択された放送チャンネルの放送番組の音声がスピーカ19Lおよび19Rから放音される。
【0033】
以下、この音量補正部18の場合として、この実施形態の音量補正装置について説明する。
【0034】
[音量補正装置の第1の実施形態]
図1は、この発明の音量補正装置の第1の実施形態としての音量補正部18の全体の構成例を示すブロック図である。
【0035】
この第1の実施形態では、入力音声信号は、左右2チャンネルの音声信号とされる。そして、第1成分主体信号は、左右2チャンネルの音声信号中の主として人声成分を主体とする信号(以下、声主体信号という)とされる。また、第1成分以外の他の音声成分は、左右2チャンネルの音声信号のうちの、この声主体信号以外の、いわゆる臨場音とされる。この臨場音を主体とする信号を、以下、臨場音主体信号という。
【0036】
この図1に示すように、この第1の実施形態においては、左右2チャンネルの入力音声信号SiLおよびSiRは、声主体信号と臨場音主体信号との分離部20に供給される。この例の分離部20は、センター集中定位信号検出部21と、2個の減算部22,23とからなる。
【0037】
センター集中定位信号検出部21には、左右2チャンネルの入力音声信号SiLおよびSiRが共に供給され、左右チャンネルの中央(センター)に定位するセンター集中定位信号として、声主体信号Svを検出する。センター集中定位信号検出部21で検出された声主体信号Svは、減算部22および23に供給される。
【0038】
減算部22では、左チャンネルの音声信号SiLから、声主体信号Svが減算されて、左チャンネルの臨場音主体信号SsLが得られる。また、減算部23では、右チャンネルの音声信号SiRから、声主体信号Svが減算されて、右チャンネルの臨場音主体信号SsRが得られる。
【0039】
こうして、分離部20では、2チャンネル音声信号SiLおよびSiRから、声主体信号Svと、左右チャンネルの臨場音主体信号SsLおよびSsRとが分離されて得られる。
【0040】
そして、この分離部20からの声主体信号Svは、第1成分ゲイン制御手段の例としての可変ゲインアンプ24を通じて加算部27および28に供給されると共に、声レベル補正ゲイン生成部30に供給される。
【0041】
この例では、声レベル補正ゲイン生成部30は、平均レベル検出部31と、ゲイン制御信号生成部32とからなる。平均レベル検出部31は、声主体信号Svの平均レベルを検出して、その検出した平均レベルをゲイン制御信号生成部32に供給する。
【0042】
ゲイン制御信号生成部32は、声主体信号Svの平均レベルが、予め定めた基準レベルとなるようにするためのゲイン制御信号(声レベル補正ゲイン値)Gvを生成する。そして、ゲイン制御信号生成部32は、生成したゲイン制御信号Gvを可変ゲインアンプ24に供給する。
【0043】
したがって、可変ゲインアンプ24においては、ゲイン制御信号Gvにより、声主体信号Svのレベルが大きく変動しても、当該声主体信号の平均レベルが一定レベル(基準レベル)になるようにゲイン制御される。こうして、可変ゲインアンプ24から出力される補正後声主体信号Svcの出力レベルは、自動的に一定レベルとされる。そして、この一定レベルとされた補正後声主体信号Svcが、加算部27および28に供給される。
【0044】
一方、減算部22からの左チャンネルの臨場音主体信号SsLは、ゲインが「1」のアンプ25を通じて、そのままのレベルで加算部27に供給される。また、減算部23からの右チャンネルの臨場音主体信号SsRは、ゲインが「1」のアンプ26を通じて、そのままのレベルで加算部28に供給される。
【0045】
そして、加算部27において、左チャンネルの臨場音主体信号SsLと補正後声主体信号Svcとが加算され、その加算出力として、音量補正された左チャンネルの出力音声信号SoLが出力される。
【0046】
また、加算部28において、右チャンネルの臨場音主体信号SsRと補正後声主体信号Svcとが加算され、その加算出力として、音量補正された右チャンネルの出力音声信号SoRが出力される。
【0047】
例えば、センター集中定位信号検出部21からの声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図3(A)および(B)に示すようなレベル変動を有するものとする。
【0048】
このとき、声レベル補正ゲイン生成部30からのゲイン制御信号Gvによる可変ゲインアンプ24での声レベル補正ゲインは、図3(C)に示すようなものとなる。これにより、可変ゲインアンプ24からの補正後声主体信号Svcは、図3(E)に示すような一定レベルの信号になるようにされる。
【0049】
一方、この例では、臨場音主体信号SsLおよびSsRは、図3(D)に示すようなゲイン「1」の固定ゲインのアンプ25,26を通じてそのままのレベルとされるので、アンプ25,26の出力信号は、図3(F)に示すように、図3(B)に示したものと同じレベル変動を有するものとなる。
【0050】
以上のようにして、加算部27および28に、その一方の入力として供給される声主体信号Svcは、出力レベルが一定となるようにする第1のゲイン制御態様でゲイン補正される。このため、課題の欄で述べたように、入力音声信号SiL,SiRに大きなレベル変化があったときには、その変化点において音量レベルに揺れが生じる場合がある。
【0051】
一方、加算部27および28に、その他方の入力として供給される左チャンネルの臨場音主体信号SsLおよび右チャンネルの臨場音主体信号SsRは、この例では、固定ゲイン「1」という第2のゲイン制御態様で、そのままのレベルとなっている。したがって、入力音声信号が有する元々のレベル変動は有するが、第1のゲイン制御態様によるゲイン制御による音量レベルの揺れは発生しない。
【0052】
したがって、加算部27および28からの左右チャンネルの出力音声信号SoL、SoRは、補正後声主体信号Svcの音量レベルの揺れが、左チャンネルの臨場音主体信号SsLおよび右チャンネルの臨場音主体信号SsRによりマスキングされるようになる。このため、声主体信号Svcの音量レベルの揺れが、目立たなくなり、聴取者に対する違和感が軽減される。
【0053】
以上のようにして、この実施形態によれば、声主体信号を、素早く適正レベルに遷移させることによって、人声のレベルの一定感を保ち、台詞などの人声を聞き易くすることができる。さらに、この第1の実施形態では、臨場音主体信号は、ゲイン「1」として、元のレベルを変化させないことによって臨場感が一定に保たれるため、レベルを変えることによる違和感が軽減され、これによってより自然なレベル遷移を実現することができるようになる。
【0054】
なお、この第1の実施形態は、声主体信号レベルの変化量が少ない場合に有効である。
【0055】
なお、以上の例では、左右2チャンネル用のスピーカにより音声信号を音響再生する場合であるので、加算部27,28を設けるようにした。しかし、左右2チャンネル用のスピーカに加えて、センターチャンネル用のスピーカを設けた場合には、補正後声主体信号をセンターチャンネル用スピーカに供給し、アンプ25,26の出力音声信号を左右2チャンネル用のスピーカに供給するようにしても良い。この場合には、センターチャンネル用のスピーカの放音音声と、左右2チャンネル用のスピーカの放音音声とが、音響的に合成されることにより、第1のゲイン制御態様によるゲイン制御による音量レベルの揺れがマスキングされ、目立たなくなる。
【0056】
[センター集中定位信号検出部21の構成例]
<第1の例>
図4は、センター集中定位信号検出部21の第1の構成例を示すものである。この例においては、センター集中定位信号検出部21は、加算部211と、固定ゲイン「0.5」のアンプ212とからなる。
【0057】
そして、この例のセンター集中定位信号検出部21においては、左右チャンネルの入力音声信号SiL,SiRが加算部211で加算され、その加算出力信号がアンプ212を通じて出力される。このアンプ212の出力信号が声主体信号Svとされる。
【0058】
なお、この第1の例の場合には、声主体信号Svの平均値は、左右チャンネルの入力音声信号SiL,SiRの加算信号の平均値に等しくなる。そして、声レベル補正ゲイン生成部30は、声主体信号Svの平均値が一定レベルとなるようにゲイン制御信号Gvを生成する。よって、この第1の例の場合には、声レベル補正ゲイン生成部30は、左右チャンネルの入力音声信号SiL,SiRの加算信号、つまり、入力音声信号全体のレベルが一定レベルとなるようにゲイン制御信号Gvを生成していることにもなる。
【0059】
<第2の例>
図5は、センター集中定位信号検出部21の第2の構成例を示すものである。この第2の例は、第1の例の出力をそのまま出力するのではなく、第1の例の出力よりも、さらにセンター定位成分のみの成分に応じた信号を得るようにする例である。
【0060】
この例においては、センター集中定位信号検出部21は、第1の例の加算部211および固定ゲイン「0.5」のアンプ212に加えて、ゲイン調整アンプ213と、センター集中定位率検出部214とを備える。
【0061】
この例のセンター集中定位信号検出部21においては、アンプ212の出力信号はゲイン調整アンプ213に供給され、このゲイン調整アンプ213の出力信号が声主体信号Svとされる。
【0062】
そして、この例のセンター集中定位信号検出部21においては、左右チャンネルの入力音声信号SiL,SiRは、センター集中定位率検出部214にも供給される。このセンター集中定位率検出部214においては、入力音声全体に対するセンターに集中的に定位する信号の割合に応じて、ゲイン調整アンプ213のゲインを制御するゲイン制御信号Gatが生成される。
【0063】
そして、センター集中定位率検出部214からのゲイン制御信号Gatにより、ゲイン調整アンプ213のゲインが制御されることで、声主体信号Svは、アンプ212の出力のうち、センターに集中的に定位する率に応じた信号成分からなるものとなる。つまり、この第2の例の声主体信号Svは、第1の例よりも、さらにセンターに集中的に定位する信号成分からなる信号となる。
【0064】
センター集中定位率検出部214は、例えば図6に示すような構成を有するものとすることができる。
【0065】
すなわち、センター集中定位率検出部214は、帯域制限フィルタ2141,2142と、定位方向検出部2143と、定位方向分布計測部2144と、センターゲイン制御信号生成部2145とを備えて構成される。
【0066】
センター集中定位率検出部214に入力された左右2チャンネルの入力音声信号SiLおよびSiRは、それぞれ帯域制限フィルタ2141,2142において、例えば低域成分等、定位方向をあまり感じない周波数帯域の成分が除去される。
【0067】
そして、帯域制限フィルタ2141,2142により帯域制限された2チャンネルの入力音声信号SiLおよびSiRは、定位方向検出部2143に供給される。定位方向検出部2143は、帯域制限された2チャンネルの入力音声信号SiLおよびSiRのそれぞれのレベルの大きさにより、所定の周期毎の定位方向の検出時点における2チャンネルの入力音声信号SiLおよびSiRが持つ定位方向を検出する。
【0068】
すなわち、定位方向検出部2143においては、所定のサンプリング周期で、帯域制限された2チャンネルの入力オーディオ信号SiLおよびSiRのそれぞれのレベル(振幅)をサンプリングする。そして、定位方向検出部2143においては、この例では、最新サンプリング時点における定位方向を現時点における定位方向として検出するようにする。
【0069】
この場合、定位方向検出部2143は、当該最新サンプリング時点における定位方向を、入力音声信号SiLおよびSiRのそれぞれについての、当該最新サンプリング時点のレベルと、それよりも過去のサンプリング時点のレベルとを用いて検出する。
【0070】
2チャンネルの入力音声信号SiLおよびSiRが、デジタルオーディオ信号であれば、前記サンプリング周期は、デジタルオーディオ信号のサンプル周期に等しくすることができる。もっとも、前記サンプリング周期を、デジタルオーディオ信号の1サンプル周期と等しくするのではなく、複数サンプル周期とするようにしてもよい。定位方向検出部2143の入力音声信号がアナログ信号である場合には、この定位方向検出部2143の入力段において、デジタルオーディオ信号に変換するようにしても良い。
【0071】
この定位方向検出部2143における定位方向の検出方法を、図7を参照しながら説明する。図7(A),(B)は、左チャンネルの入力音声信号SiLの振幅をX軸にとり、右チャンネルの入力音声信号SiRの振幅をY軸にとった場合の座標空間を示している。
【0072】
定位方向検出部2143では、まず、各サンプリング周期毎の定位方向の検出時点において2チャンネルの入力音声信号SiLおよびSiRのそれぞれのレベルを取得して、それに対応する座標点を、図7(A),(B)の座標空間に、例えばP1,P2,P3,P4のように、プロットしてゆく。この例では、P4が最新の検出時点の座標点であるとする。
【0073】
そして、定位方向検出部2143では、y=k・x(kは定数)で表される直線(X軸とY軸との交点Zを通る直線)を、交点Zを中心として±90°回転させたときに、つまり、定数kを変化させたときに、プロットした座標点P1,P2,P3,P4が、どの定数kの直線(どの傾き角度の直線)の一番近くを移動してゆくかを算出する。つまり、定数kを変えた各直線からの各座標点P1,P2,P3,P4までの距離Da1,Da2,Da3,Da4あるいは距離Db1,Db2,Db3,Db4の総和が最も小さい直線の定数kを算出する。
【0074】
そして、定位方向検出部2143は、算出した直線の定数kに対応する傾き角度を、検出したい現時点における定位方向とする。図7の例では、X軸、つまり、左チャンネルの定位方向(左方向)の角度を0°として、このX軸に対する角度(以下、定位角度という)θを定位方向として検出することとする。
【0075】
図7(A)の場合の座標点P1,P2,P3,P4の例では、定位角度はθaとして検出され、図7(B)の場合の座標点P1,P2,P3,P4の例では、定位角度はθbとして検出されるものである。
【0076】
なお、この実施形態では、定位方向検出部2143においては、現時点(最新サンプリング時点)の2チャンネル入力音声信号のレベルと、過去のサンプリング時点における2チャンネル入力音声信号のレベルとは等しい重みで用いてはいない。この実施形態では、定位方向検出部2143においては、現時点に近いサンプリング時点の2チャンネル入力音声信号のレベルほど重みが大きいものとするようにしている。
【0077】
このため、定位方向検出部2143では、2チャンネル入力音声信号のレベルのサンプリング値に対して、図8に示すように、現時点(この例では最新サンプリング時点tn)に近いほど、重みが大きくなるように、指数関数曲線の特性を有する時間ウインドーWD1が用いられている。
【0078】
なお、上述の説明では、処理対象信号時点となる現時点を最新サンプリング時点(最新サンプル時点)とした。しかし、可変ゲインアンプ24およびアンプ25,26の入力側に所定時間τだけ遅延させる遅延回路を設けて、処理対象となる現時点を、入力音声信号SiL,SiRよりも前記τだけ遅延した時点とすることができる。
【0079】
その場合には、定位方向検出部2143では、処理対象信号時点となる現時点よりも後(未来)の2チャンネル入力音声信号SiL,SiRをも用いて、定位方向を検出するようにすることができる。例えば、図7の例で、処理対象信号時点となる現時点がP2やP3の場合とすることができる。
【0080】
そして、その場合には、前述した時間ウインドーWD1の代わりに、図9に示すような指数関数曲線の特性の時間ウインドーWD2が用いられる。この時間ウインドーWD2は、処理対象信号時点となる現時点tpで最も重みが大きく、現時点tpから離れるにつれ、過去および未来の方向に重みが小さくなるような指数関数曲線の特性を有するものである。
【0081】
なお、現時点の2チャンネル入力オーディオ信号のレベルを、過去および/または未来のサンプリング時点における2チャンネル入力音声信号SiL,SiRのレベルを重み付けせずに、そのままの値で用いても良い。
【0082】
以上のようにして、定位方向検出部2143では、現時点においては、2チャンネル入力音声信号SiL,SiRが、どの方向からの信号であるかを、定位角度θとして検出することができる。
【0083】
しかしながら、検出した現時点における定位角度θは、1時点における入力オーディオ信号の定位方向を一方向に限定したもので、各方向ごとの信号の強さが反映されていない。そこで、この実施形態では、この点にかんがみ、定位方向検出部2143で検出された現時点における2チャンネル入力音声信号SiL,SiRの定位方向の検出結果(定位角度θ)は、定位方向分布計測部2144に供給される。
【0084】
定位方向分布計測部2144では、予め定められた所定時間区間dに渡って定位方向検出部2143で検出された定位角度θの、全方位についての分布を求め、2チャンネル入力音声信号の定位方向が、どの角度方向にどのくらいの割合を持っているかを計測する。
【0085】
この場合、所定時間区間dは、例えば数ミリ秒〜数百ミリ秒、この例では数10ミリ秒に選定されている。そして、この実施形態では、定位方向分布計測部2144では、この所定時間区間dにおける定位方向検出部2143で検出された定位角度θに対して、定位方向検出部2143における重み係数の特性と同様に重み付けをするようにする。
【0086】
すなわち、定位方向分布計測部2144では、現時点tp(この例では、tp=tn(最新サンプリング時点))に近づくほど指数関数的に大きくなるような重み付けをする時間ウインドーWD3(図10参照)をかけて重み付けをするようにする。
【0087】
なお、前述したように、入力オーディオ信号に対して遅延時間τを設けるようにして、定位方向検出部2143での重み付けのための時間ウインドーを、図9のようにする場合には、定位方向分布計測部2144における時間ウインドーも、図9と同様なものとなる。その場合の時間区間dは、現時点tpより未来と過去の両方を含む時間区間となるものである。なお、重み付けをせずに、そのままの値で用いてもよい。
【0088】
図11は、この定位方向分布計測部2144で求められた定位角度θの分布である定位方向分布P(θ)の一例を示すもので、横軸にはX軸(左チャンネル定位方向)を基準にした定位角度θをとり、縦軸には各定位角度の出現度(<1)をとったものである。ここで、この実施形態では、定位方向分布P(θ)をすべての定位角度θについて総和を求めたときに1、すなわち、
ΣP(θ)=1
となるように分布が生成される。
【0089】
また、定位角度θと、音声信号の定位方向との関係は、図12に示すようなものとなる。なお、図12に示されている正面方向、左方向、右方向などは、リスナを基準にした方向名である。
【0090】
以上のようにして、定位方向分布計測部2144からは、現時点(現サンプリング時点あるいは現サンプル時点;処理対象信号時点)ごとに、図11に示すような定位方向分布P(θ)の情報が得られる。
【0091】
この定位方向分布P(θ)の情報は、センターゲイン制御信号生成部2145に供給される。センターゲイン制御信号生成部2145では、定位方向分布計測部2144によって算出された定位方向分布P(θ)から、センターに集中的に定位する信号ほど、ゲインが大きく、その他では、ゲインが小さくなるセンターゲイン制御信号を生成する。
【0092】
センターゲイン制御信号生成部2145は、図示を省略するゲインテーブルメモリを備えている。このゲインテーブルメモリには、ゲイン調整アンプ213に供給するゲイン制御信号を生成するためのゲインテーブル情報K(θ)が予め記憶されている。
【0093】
このゲインテーブル情報K(θ)は、定位角度のすべて(−45°〜135°)に対して、センター定位方向に重み付けが施されたゲイン特性とされている。図13に、このゲインテーブル情報K(θ)の例を示す。
【0094】
すなわち、ゲインテーブル情報K(θ)は、この例では、図13に示すように、正面方向(センター方向;θ=45°)のときにゲインが最大の「1」となる。そして、センター方向よりも左方向の定位角度範囲(0°〜45°)およびセンター方向よりも左方向の定位角度範囲(45°〜90°)では、センター方向から遠ざかるにしたがってゲインが小さくなるようなゲイン特性とされる。
【0095】
センターゲイン制御信号生成部2145では、定位方向分布計測部2144で求められた定位方向分布P(θ)の情報と、ゲインテーブル情報K(θ)のゲイン値との、すべての定位角度についての積の総和を算出する。
【0096】
すなわち、センターゲイン制御信号生成部2145は、
Gat=Σ(K(θ)×P(θ))
として、ゲイン制御信号Gatを生成する。
【0097】
こうしてセンターゲイン制御信号生成部2145で生成されたゲイン制御信号Gatは、センター集中定位率検出部214の出力として、ゲイン調整アンプ213に供給される。
【0098】
したがって、ゲイン調整アンプ213からは、第1の例よりも、さらにセンターに集中的に定位する信号成分からなる声主体信号Svが得られる。
【0099】
なお、センター集中定位信号検出部21としては、上述した第1の例および第2の例に限られるものではないことは勿論である。
【0100】
[音量補正装置の第2の実施形態]
上述した第1の実施形態では、臨場音主体信号については音量補正は行わないゲイン制御態様とした。しかし、例えばチャンネル切り替えによる入力音声信号のレベル変動が大きい場合など、この臨場音主体信号についても、声主体信号と共に、ゲイン制御した方が良い場合もある。第2の実施形態は、このような場合に対処することができる例である。
【0101】
以下に示す第2の実施形態は、第1の実施形態と同様に、図2に示したテレビ放送受信機における音量補正部18に適用した場合である。
【0102】
図14は、この第2の実施形態としての音量補正部18の全体の構成例を示すブロック図である。この図14において、図1に示した第1の実施形態の音量補正部18の場合と同一部分には、同一符号を付すこととする。
【0103】
この第2の実施形態においては、加算部22,23からの左右チャンネルの臨場音主体信号SsL,SsRに対しては、第1の実施形態における固定ゲインのアンプ25および26に代えて、可変ゲインアンプ250および260を設ける。
【0104】
また、この第2の実施形態においては、前述した第1の実施形態における声レベル補正ゲイン生成部30の他に、臨場音主体信号SsL,SsRに対するゲイン制御信号Gs(臨場音レベル補正ゲイン値)を生成する臨場音レベル補正ゲイン生成部40を設ける。
【0105】
そして、可変ゲインアンプ250および260に、臨場音レベル補正ゲイン生成部40からのゲイン制御信号Gsを供給し、左右チャンネルの臨場音主体信号SsL,SsRに対しては、声主体信号Svとは異なるゲイン制御態様のゲイン制御を行うようにする。
【0106】
臨場音レベル補正ゲイン生成部40は、声レベル補正ゲイン生成部30からのゲイン制御信号Gvを受けて、このゲイン制御信号Gvに基づく処理を行って、臨場音主体信号をゲイン補正するゲイン制御信号Gsを生成するようにする。
【0107】
ゲイン制御信号Gvに対して、何らかの処理を加えるので、ゲイン制御信号Gvによる声主体信号Svに対するゲイン制御態様と、ゲイン制御信号Gsによる臨場音主体信号SsL,SsRに対するゲイン制御態様とは、異なるものとなる。
【0108】
ただし、この場合、ゲイン制御信号Gsによる臨場音主体信号SsL,SsRに対するゲイン制御態様は、入力音声信号の大きなレベル変動に対して即座に追従しないようなものとされる。すなわち、第1の実施形態と同様に、この第2の実施形態においても、声主体信号Svに対するゲイン制御態様は、入力音声信号のレベル変動に即座に追従して、常に出力レベルを一定にする。しかし、臨場音主体信号SsL,SsRに対するゲイン制御態様は、それとは異なり、入力音声信号の大きなレベル変動に対して即座に追従しない特性のものとされる。
【0109】
この第2の実施形態における声主体信号Svの処理についての構成は、第1の実施形態と全く同様である。したがって、加算部27および28に、その一方の入力として供給される声主体信号Svcは、出力レベルが一定となるようにする第1のゲイン制御態様でゲイン補正される。このため、課題の欄で述べたように、入力音声信号SiL,SiRに大きなレベル変化があったときには、その変化点において音量レベルに揺れが生じる場合がある。
【0110】
一方、この第2の実施形態では、左および右チャンネルの臨場音主体信号SsLおよびSsRは、可変ゲインアンプ250および260で、第1のゲイン制御態様とは異なる第2のゲイン制御態様でゲイン制御されて加算部27および28に供給される。そして、さらに、この実施形態では、臨場音主体信号SsL,SsRに対するゲイン制御態様は、入力音声信号の大きなレベル変動に対して即座に追従しない特性のものとされている。
【0111】
したがって、第1のゲイン制御態様のゲイン制御によって声主体信号について生じる大きなレベル変化点での音量レベルの揺れは、臨場音主体信号については、発生しない。
【0112】
このため、加算部27および28からの左右チャンネルの出力音声信号SoL、SoRは、補正後声主体信号Svcの音量レベルの揺れが、左チャンネルおよび右チャンネルの臨場音主体信号SsLおよびSsRによりマスキングされるようになる。この結果、声主体信号Svcの音量レベルの揺れが、目立たなくなり、聴取者に対する違和感が軽減される。
【0113】
[臨場音レベル補正ゲイン生成部40の構成例]
<第1の例>
入力音声信号のレベル変動あるいは声主体信号Svのレベル変動が大きく、声主体信号Svの出力レベルのみを一定レベルにゲイン制御したときには、元の入力音声信号に対するバランスが悪化して、違和感を感じる場合がある。
【0114】
この第1の例は、この問題を改善する場合の例である。図15は、この第1の例における臨場音レベル補正ゲイン生成部40の構成例を示すもので、この第1の例においては、臨場音レベル補正ゲイン生成部40は、ゲイン値変換テーブル部41からなる。
【0115】
ゲイン値変換テーブル部41は、声主体信号Svに対するゲイン制御信号Gvを入力信号として受けて、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するものであり、ゲイン値変換テーブルメモリ(図示は省略)を有する。
【0116】
ゲイン値変換テーブル部41が備えるゲイン値変換テーブルメモリに記憶されるゲイン値変換テーブル情報の例を説明するための図を図16に示す。
【0117】
声主体信号Svのレベル変動が小さい場合あるいは入力音声信号全体(センター集中定位信号検出部21が第1の例の場合)のレベル変動が小さいときには、ゲイン制御信号Gvによる声レベル補正ゲイン値は、Gv=1を中心として大きく変化しない。
【0118】
このような場合には、前述した臨場音主体信号と、声主体信号とのバランスは、元の入力音声信号から大きく外れてはいないので、違和感が感じられることはない。このため、このようなレベル変動が小さい範囲では、臨場音主体信号SsL,SsRは、第1の実施形態のように、固定ゲイン「1」のアンプを通じて出力してもよい。
【0119】
そこで、この図16の例においては、0.75≦Gv≦1.25の範囲では、臨場音主体信号に対するゲイン制御信号Gsは、常にGs=1のゲイン値にする。
【0120】
そして、入力音声信号のレベル変動あるいは声主体信号Svのレベル変動が、このような小さいレベル変動範囲から逸脱する場合には、この例では、ゲイン制御信号Gvに対して所定の比を持って、追従して、臨場音主体信号SsL,SsRをゲイン制御する。
【0121】
すなわち、図16の例においては、Gv<0.75となる入力レベルが大きくなる範囲では、Gs/Gv=k1(=1/0.75)の関係を持って、ゲイン制御信号Gvから、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するようにする。
【0122】
また、Gv>1.25となる入力レベルが小さくなる範囲では、Gs/Gv=k2(=2/2.5)の関係を持って、ゲイン制御信号Gvから、臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを出力するようにする。
【0123】
このようにすることにより、声レベル補正ゲインが大きく変動した場合でも、臨場音レベル補正ゲインが、声レベル補正ゲインと一定の比を持って追従するので、声主体信号レベルに対する臨場音主体信号レベルのバランスが大きく開いてしまうことを防止できる。したがって、レベル変動が大きい場合においても自然なレベル遷移を実現することができるようになる。
【0124】
ゲイン値変換テーブル部41は、声主体信号Svに対するゲイン制御信号Gvの値をゲイン値変換テーブルメモリの読み出しアドレス入力として、対応する臨場音主体信号に対するゲイン制御信号Gsを読み出して、出力するように構成できる。
【0125】
なお、ゲイン値変換テーブル部41は、ソフトウエア処理演算による機能手段として構成することもできる。図17に、その場合におけるソフトウエア処理演算のフローチャートの例を示す。
【0126】
ゲイン値変換テーブル部41は、入力された声主体信号についてのゲイン制御信号Gvのゲイン値を検知する(ステップS101)。次に、そのゲイン値Gvが、Gv<0.75であるか否か判別し(ステップS102)、Gv<0.75であると判別したときには、Gs=k1×Gvなる演算により臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを算出する(ステップS103)。
【0127】
ステップS102で、Gv<0.75ではないと判別したときには、Gv>1.25であるか否か判別する(ステップS104)。そして、Gv>1.25であると判別したときには、Gs=k2×Gvなる演算により臨場音主体信号SsL,SsRに対するゲイン制御信号Gsを算出する(ステップS105)。
【0128】
さらに、ステップS104で、Gv>1.25ではないと判別したときには、0.75≦Gv≦1.25であることを確認して、Gs=1とする(ステップS106)。
【0129】
そして、ステップS103,104および106の後には、ステップS101に戻り、以上の処理を繰り返す。
【0130】
なお、上述の説明のゲイン値の数値は、一例であり、これに限られるものではないことはいうまでもない。そして、ゲイン値Gv=1を中心とするレベル変動が小さい範囲、すなわち、α≦Gv≦βの範囲においては、上述の例では、1−α=β−1としたが、1−α≠β−1であっても勿論良い。
【0131】
また、Gv<αの範囲での比の値k1と、Gv>βの範囲での比の値k2も、一例であり、また、k1=k2であってもよい。
【0132】
この第1の例の場合における音量補正処理動作を、図18の信号波形のタイミングチャートを参照しながら説明する。
【0133】
この図18は、上述の第1の実施形態の説明に用いた図3と同様のものである。すなわち、声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図18(A)および(B)に示すようなレベル変動を有するとした場合には、ゲイン制御信号Gvによる声主体信号Svに対する声レベル補正ゲインは、図18(C)に示すようなものとなる。
【0134】
このゲイン制御信号Gvにより可変ゲインアンプ24がゲイン制御され、その結果、可変ゲインアンプ24からの補正後声主体信号Svcは、図18(E)に示すような一定レベルの信号になるようにされる。
【0135】
そして、この例では、臨場音主体信号SsLおよびSsRに対するゲイン制御信号Gsは、ゲイン制御信号Gvに基づいて上述のように生成されて、図18(D)に示すようなものとなる。
【0136】
このゲイン制御信号Gsにより可変ゲインアンプ250および260がゲイン制御される。その結果、可変ゲインアンプ250および260からの補正後臨場音主体信号SsLcおよびSsRcは、図18(F)に示すように、図18(B)に示した臨場音主体信号SsLおよびSsRがゲイン制御されたものとなる。
【0137】
なお、上述の説明から明らかなように、この第1の例は、入力音声信号あるいは声主体信号のレベルが大きく変動する場合に有効であり、入力音声信号あるいは声主体信号Svのレベル変動が小さい場合には、第1の実施形態のままでよい。
【0138】
そこで、入力音声信号のレベル変動を検出し、その検出結果を用いて、臨場音主体信号に対するゲイン制御態様を自動的に切り替え制御するように構成することもできる。
【0139】
図19は、その場合の構成例を示すもので、図19に示すように、左右2チャンネルの入力音声信号SiLおよびSiRの全体のレベル変動を検出するレベル変動検出部29を設ける。
【0140】
また、この例の臨場音レベル補正ゲイン生成部40は、第1の実施形態と同様に、臨場音主体信号に対しては、可変ゲインアンプ250および260のゲイン値を固定ゲイン「1」とする状態と、第2の実施形態のようにゲイン制御する状態とを有する。
【0141】
そして、レベル変動検出部29では、例えば左右2チャンネルの入力音声信号SiLおよびSiRを加算し、その加算信号についてレベル変動を検出し、その検出結果から、臨場音レベル補正ゲイン生成部40に切り替え制御信号SWを供給する。
【0142】
レベル変動検出部29は、検出したレベル変動が、予め設定した小レベル範囲であるときには、臨場音レベル補正ゲイン生成部40に対して、可変ゲインアンプ250および260のゲイン値を固定ゲイン「1」とする状態にする切り替え制御信号SWを供給する。
【0143】
また、レベル変動検出部29は、検出したレベル変動が、前記小レベル範囲を逸脱したときには、臨場音レベル補正ゲイン生成部40に対して、可変ゲインアンプ250および260に、ゲイン制御信号Gsを供給する状態にする切り替え制御信号SWを供給する。
【0144】
これにより、この図19の例によれば、入力音声信号のレベル変動が大きいときには、自動的に第2の実施形態の状態になり、第1の実施形態のみの状態の問題点を回避することができる。
【0145】
<第2の例>
この第2の例は、臨場音主体信号SsLおよびSsRに対しては、第1の実施形態の場合や第1の例のように固定ゲインとすることはせず、声主体信号Svのゲイン制御に合わせて、ゲイン制御するようにする。これにより、全体のバランスを元の入力音声信号のままとして、自然な再生音声とすることができるようにする。
【0146】
図20は、この第2の例における臨場音レベル補正ゲイン生成部40の構成例を示すもので、この第2の例においては、臨場音レベル補正ゲイン生成部40は、遅延時定数処理部42からなる。
【0147】
すなわち、この第2の例においては、遅延時定数処理部42において、声主体信号Svに対するゲイン制御信号Gvについて遅延時定数処理がなされて、臨場音主体信号SsLおよびSsRに対するゲイン制御信号Gsが生成される。すなわち、声レベル補正ゲインに遅れて追従する時間遅れ特性を持った臨場音レベル補正ゲインを得ることができる。
【0148】
この第2の例の場合における音量補正処理動作を、図21の信号波形のタイミングチャートを参照しながら説明する。
【0149】
この図21は、上述の第1の例の説明に用いた図18と同様のものである。すなわち、声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図21(A)および(B)に示すようなレベル変動を有するとした場合には、ゲイン制御信号Gvによる声主体信号Svに対する声レベル補正ゲインは、図21(C)に示すようなものとなる。
【0150】
そして、このゲイン制御信号Gvにより可変ゲインアンプ24がゲイン制御され、その結果、可変ゲインアンプ24からの補正後声主体信号Svcは、図21(E)に示すような一定レベルの信号になるようにされる。
【0151】
一方、この第2の例では、臨場音主体信号SsL及びSsRに対するゲイン制御信号Gsは、図21(C)に示されるゲイン制御信号Gvが遅延時定数処理されて、図21(D)に示すように、ゲイン値が所定の時定数を持った時間遅れ特性で変化するものとなる。
【0152】
このゲイン制御信号Gsにより可変ゲインアンプ250および260がゲイン制御されることにより、可変ゲインアンプ250および260からの補正後臨場音主体信号SsLcおよびSsRcは、図21(F)に示すようなものとなる。
【0153】
この第2の例によれば、声主体信号Svを素早く適正レベルに遷移させる瞬間は、臨場音レベル補正ゲインは変化させないで、臨場感が一定に保たれる。また、臨場音主体信号SsL、SsRは、遅れてゆっくりレベルが補正されるようになるので、ゲイン制御により、レベル変化点で大きくレベルを変えることによる違和感を軽減することができる。これにより、自然なレベル遷移を実現することができる。また、声主体信号Svと臨場音主体信号SsL、SsRとのバランスが、元の入力音声信号のバランスへと収束するので、より自然な自動音量補正を実現できる。
【0154】
<第3の例>
上述の第2の例は、臨場音主体信号SsLおよびSsRは、声主体信号Svのゲイン制御に合わせて、ゲイン制御するようにしたものである。したがって、声主体信号Svの補正ゲインが、非常に大きくなったり、また、非常に小さくなったときにも、臨場音主体信号SsLおよびSsRに対する補正ゲインも、それに応じたものとなってしまう。
【0155】
この第3の例は、第2の例の変形例であり、上記問題点を改善するものである。
【0156】
図22は、この第3の例における臨場音レベル補正ゲイン生成部40の構成例を示すもので、遅延時定数処理部42の他に、上限補正ゲイン生成部43と、下限補正ゲイン生成部44とが設けられる。
【0157】
上限補正ゲイン生成部43は、声主体信号Svについてのゲイン制御信号Gvを入力信号として受け、そのゲイン制御信号Gvに、予め定めた基準値Ku(Ku>1)を掛けて上限補正ゲインULを生成する。この例では、前記基準値Kuは、Ku=2とされる。そして、上限補正ゲイン生成部43は、生成した上限補正ゲインULを、遅延時定数処理部42に供給する。
【0158】
また、下限補正ゲイン生成部44は、声主体信号Svについてのゲイン制御信号Gvを入力信号として受け、そのゲイン制御信号Gvに、予め定めた基準値Kb(Kb<1)を掛けて下限補正ゲインBLを生成する。この例では、前記基準値Kbは、Kb=0.5とされる。そして、下限補正ゲイン生成部44は、生成した下限補正ゲインBLを、遅延時定数処理部42に供給する。
【0159】
この第3の例における遅延時定数処理部42においても、これに入力される声主体信号Svに対するゲイン制御信号Gvについて遅延時定数処理を行って、臨場音主体信号に対するゲイン制御信号Gsを得る。ただし、この第3の例においては、遅延時定数処理部42は、上限補正ゲインULおよび下限補正ゲインBLを常に監視し、ゲイン制御信号Gsが、常に、上限補正ゲインUL≧Gs≧下限補正ゲインBLとなるように制限する。
【0160】
この第3の例の場合における音量補正処理動作を、図23の信号波形のタイミングチャートを参照しながら説明する。
【0161】
この図23は、上述の第2の例の説明に用いた図21と同様のものである。すなわち、声主体信号Svおよび臨場音主体信号SsLまたはSsRが、図23(A)および(B)に示すようなレベル変動を有するとした場合には、ゲイン制御信号Gvによる声主体信号Svに対する声レベル補正ゲインは、図23(C)に示すようなものとなる。
【0162】
そして、このゲイン制御信号Gvにより可変ゲインアンプ24がゲイン制御され、その結果、可変ゲインアンプ24からの補正後声主体信号Svcは、図23(E)に示すような一定レベルの信号になるようにされる。
【0163】
一方、この第3の例では、臨場音主体信号SsL及びSsRに対するゲイン制御信号Gsは、図23(C)に示されるゲイン制御信号Gvが遅延時定数処理されて、図23(D)に示すように、ゲイン値が所定の時定数を持った時間遅れ特性で変化するものとなる。そして、図23(D)に示されるように、この場合のゲイン制御信号Gsは、上限補正ゲインULより大きくならず、また、下限補正ゲインBLより小さくならないように制限される。
【0164】
すなわち、図23(D)に示すように、時点t1から時点t2までの区間では、ゲイン制御信号Gsは、上限補正ゲインUL≧Gs≧下限補正ゲインBLを満足しているので、第2の例の場合(図21(D))と同様となる。
【0165】
しかし、時点t2を過ぎた時点になると、下限補正ゲインBLが時点t2前の値よりも大きくなり、ゲイン値Gsが当該下限補正ゲインBL以下となってしまう。そこで、遅延時定数処理部42では、時点t2において、ゲイン値Gsを下限補正ゲインBLとし、当該下限補正ゲインBLを始点としてゲイン制御信号Gvについての遅延時定数処理を開始するようにする。
【0166】
また、図23の例では、時点t3を過ぎた時点になると、上限補正ゲインULが時点t3前の値よりも低くなり、ゲイン値Gsが当該上限補正ゲインUL以上となってしまう。そこで、遅延時定数処理部42では、時点t3において、ゲイン値Gsを上限補正ゲインULとし、当該上限補正ゲインULを始点としてゲイン制御信号Gvについての遅延時定数処理を開始するようにする。
【0167】
このゲイン制御信号Gsにより可変ゲインアンプ250および260がゲイン制御されることにより、可変ゲインアンプ250および260からの補正後臨場音主体信号SsLcおよびSsRcは、図23(F)に示すようなものとなる。
【0168】
この第3の例によれば、声主体信号レベルに対して臨場音主体信号のレベルが大きく開いてしまうことがないため、声レベルの変化量が多い場合にも自然なレベル遷移を実現することができるようになる。また、声主体信号Svと臨場音主体信号SsL、SsRとのバランスが、オリジナルバランスへと収束するため、より自然な自動音量補正を実現できる。
【0169】
さらに、声主体信号Svの補正ゲインが、非常に大きくなったり、また、非常に小さくなったときにも、臨場音主体信号SsLおよびSsRに対する補正ゲインGsは、所定のレベル範囲に制限されるので、これも、自然な自動音量補正の実現に寄与する。
【0170】
なお、上述の第3の例の説明では、上限補正ゲインと、下限補正ゲインの両方を設定するようにしたが、そのいずれか一方のみを設定して、ゲインレベル範囲制限を行うようにしても良い。
【0171】
なお、上述の説明では、臨場音レベル補正ゲイン生成部40の第1の例〜第3の例は、それぞれ単独で設けて、臨場音主体信号に対するゲイン制御信号Gsを生成するようにした。しかし、第1の実施形態における臨場音主体信号については、固定ゲイン「1」にする場合と、前述の臨場音レベル補正ゲイン生成部40の第1の例〜第3の例との4種をそれぞれ音量補正部18に設けておき、それを切り替えることができるようにしてもよい。
【0172】
その切り替え方法としては、操作手段に切り替え操作部を設け、ユーザが適宜、手動で切り替える方法の他、次のように自動的に切り替える方法を採用することができる。
【0173】
例えば、テレビ放送信号に含まれるEPG(Electronic Programming Guide;電子番組ガイド)情報を用いて自動切り替えする方法を採用できる。すなわち、例えばドラマ、スポーツ、バラエテイーなどの放送番組のジャンルに対して、臨場音レベル補正ゲイン生成部40の4種の例のうちの最適と考えられる方法を対応つけるテーブルを作成しておく。そして、テレビ放送信号からEPG情報を検出して、放送番組のジャンルを検出し、前記テーブルを参照することで、4種のうちの最適な臨場音レベル補正ゲイン生成手法に切り替え設定するようにする。
【0174】
また、例えばDVDコンテンツに、予め、前記4種のうちの最適な臨場音レベル補正ゲイン生成手法を特定する識別情報を記録しておく。一方、DVD再生装置には、この識別情報と、4種の臨場音レベル補正ゲイン生成手法との対応情報を保持するようにする。そして、再生時に、DVD再生装置は、DVDから前記識別情報を取得し、その取得した識別情報により前記対応情報を参照することで、いずれの臨場音レベル補正ゲイン生成手法を用いるかを決定するようにする。
【0175】
なお、EPG情報の一部に、放送番組毎に同様の臨場音レベル補正ゲイン生成手法を特定する識別情報を含めておくことにより、テレビ放送番組についても、同様にして、いずれの臨場音レベル補正ゲイン生成手法を用いるかを決定するようにすることができる。
【0176】
[他の実施形態]
<他の分離例>
上述の第1、第2の実施形態では、第1成分主体信号は、声主体信号とし、他の成分を主体とする信号は、臨場音主体信号としたが、この発明は、このような分離の方法に限られるわけではない。例えば、入力音声信号の中域成分と、当該中域成分以外の帯域成分とに分離し、それぞれに対して、互いに異なる第1のゲイン制御態様および第2のゲイン制御態様のゲイン制御を行うようにすることもできる。
【0177】
また、以上の実施形態では、音声信号は、左右2チャンネルの場合であったが、この発明の音量補正対象の音声信号は、モノーラル音声信号であっても良いことは言うまでもない。
【0178】
図24は、入力音声信号の他の分離例を示すものであり、モノーラルの入力音声信号を上記のように周波数帯域により分離する例である。なお、この図24の例は、上述した第2の実施形態に適用した場合の例である。第1の実施形態に適用することも勿論できる。
【0179】
すなわち、図24に示すように、この例の場合の分離部50においては、モノーラル入力音声信号Siは、音声信号の中域成分を抽出するためのバンドパスフィルタ51に供給されて、これより音声信号の中域成分のみからなる中域主体信号Smを得る。この中域主体信号Smは、可変ゲインアンプ53に供給される。
【0180】
そして、バンドパスフィルタ51からの中域主体信号Smを、減算部52に供給して、入力音声信号Siから減算することにより、入力音声信号Siの高域・低域成分主体信号Shlを得る。この高域・低域成分主体信号Shlは、可変ゲインアンプ54を通じて加算部55に供給される。
【0181】
そして、この例においては、バンドパスフィルタ51からの中域主体信号Smを中域レベル補正ゲイン生成部56に供給する。中域レベル補正ゲイン生成部56は、この例では、中域主体信号Smの平均レベルを検出し、当該平均レベルが基準レベルとなるようにすることにより、中域主体信号Smの出力レベルを一定レベルとするようにするためのゲイン制御信号Gmを生成する。このゲイン制御信号Gmは、中域レベル補正ゲインとなる。
【0182】
そして、中域レベル補正ゲイン生成部56は、生成したゲイン制御信号Gmを可変ゲインアンプ53に供給して、中域主体信号Smを、その出力レベルを一定レベルとするようにゲイン制御する。
【0183】
また、この例では、中域レベル補正ゲイン生成部56で生成されたゲイン制御信号Gmは、高域・低域レベル補正ゲイン生成部57に供給される。高域・低域レベル補正ゲイン生成部57では、上述した第2の実施形態の場合と同様にして、高域・低域主体信号についてのゲイン制御信号Ghl(高域・低域レベル補正ゲイン)を生成する。
【0184】
そして、高域・低域レベル補正ゲイン生成部57は、生成したゲイン制御信号Ghlを可変ゲインアンプ54に供給して、高域・低域主体信号Shlを、上述した第2の実施形態と同様にして、ゲイン制御する。
【0185】
こうして、加算部55からは、第1のゲイン制御態様でゲイン補正された中域主体信号と、第2のゲイン制御態様でゲイン補正された高域・低域主体信号とが加算された出力音声信号Soが得られる。
【0186】
したがって、この図24の例においても、上述の実施形態と同様にして、ゲイン制御による音量レベルの揺れを目立たなくした自動音量補正ができる。
【0187】
音声信号の分離例としては、この図24の他にも、例えば低域と高域との2つに周波数帯域分離する方法など、その他種々のものが可能である。また、2つに分離するのではなく、3つ以上に分離するようにして良い。その場合、3つ以上の信号成分のうちの1つについては第1のゲイン制御態様とし、他の信号成分のすべてについては第2のゲイン制御態様とするようにしてもよいし、他の信号成分についても、2つ以上の異なるゲイン制御態様とするようにしても良い。
【0188】
<マルチチャンネルの場合>
また、最近は、音声信号は5.1チャンネルのサラウンド音声信号など、3チャンネル以上のマルチチャンネルの場合もある。このようなマルチチャンネルの場合には、入力音声信号は、既に分離されていることになる。そして、マルチチャンネルのうちに、センターチャンネルが存在する場合には、当該センターチャンネルを上述の実施形態の声主体信号とすることができる。
【0189】
図25は、入力音声信号が5.1チャンネルのサラウンド音声信号である場合における音量補正装置の概要を説明するための図である。
【0190】
すなわち、この例においては、前方左右チャンネルの音声信号FLi,FRiは、可変ゲインアンプ61,62に供給される。また、後方左右チャンネルの音声信号RLi,RRiは、可変ゲインアンプ63,64に供給される。また、センターチャンネルの音声信号Ciは、可変ゲインアンプ65に供給される。さらに、低域専用チャンネルの音声信号LFE(Low Frequency Effect)は、可変ゲインアンプ66に供給される。
【0191】
センターチャンネルの音声信号Ciは、また、声レベル補正ゲイン生成部67に供給される。この声レベル補正ゲイン生成部67は、図14に示した声レベル補正ゲイン生成部30と同様の構成を備え、ゲイン制御信号Gvを生成する。そして、声レベル補正ゲイン生成部67で生成されたゲイン制御信号Gvは、センターチャンネル用の可変ゲインアンプ65に供給される。
【0192】
声レベル補正ゲイン生成部67で生成されたゲイン制御信号Gvは、また、臨場音レベル補正ゲイン生成部68に供給される。この臨場音レベル補正ゲイン生成部68は、図14に示した臨場音レベル補正ゲイン生成部40と同様の構成を備え、ゲイン制御信号Gsを生成する。そして、臨場音レベル補正ゲイン生成部68で生成されたゲイン制御信号Gsは、センターチャンネル以外用の可変ゲインアンプ61〜64、66に供給される。
【0193】
そして、可変ゲインアンプ61〜66のそれぞれから出力音声信号FLo、FRo、RLo、RRo、Co、LFoが得られ、それぞれ用のスピーカにより放音されるようにされる。
【0194】
この図25の例によれば、5.1チャンネルの入力音声信号FLi、FRi、RLi、RRi、Ci、LFiのうちのセンターチャンネルの音声信号Ciが、ゲイン制御信号Gvにより第1のゲイン制御態様でゲイン制御される。一方、5.1チャンネルの入力音声信号FLi、FRi、RLi、RRi、Ci、LFiのうちのセンターチャンネル以外の音声信号は、ゲイン制御信号Gsにより、前記第1のゲイン制御態様とは異なる第2のゲイン制御態様でゲイン制御される。
【0195】
そして、5.1チャンネルの出力音声信号FLo、FRo、RLo、RRo、Co、LFoが、それぞれ別々のスピーカにより音響再生されて、音響的に合成されることにより、第1のゲイン制御態様による音揺れが軽減され、違和感を生じないものとなる。
【0196】
なお、図25の例においては、センターチャンネル以外の音声信号は、すべてゲイン制御信号Gsにより、第2のゲイン制御態様でゲイン制御するようにしたが、各チャンネル毎に、異なる他のゲイン制御態様で、それぞれゲイン制御するようにしても良い。また、センターチャンネル以外の音声信号を2つ以上にグループ分けし、そのグループ毎に異なるゲイン制御態様でゲイン制御するようにしても良い。
【0197】
なお、5.1チャンネルのマルチチャンネルの音声信号がダウンミックスされて、2チャンネルとして2個のスピーカで音響再生する場合もある。その場合には、ダウンミックスの結果得られた2チャンネルの音声信号に対して、上述した第1の実施形態または第2の実施形態を適用すればよい。
【0198】
また、ダウンミックスを行う場合においても、5.1チャンネルの音声信号のセンターチャンネルの音声信号を用いて、ゲイン制御する図26に示すような構成としても良い。
【0199】
図26は、入力音声信号が5.1チャンネルのサラウンド音声信号がダウンミックスされて、出力が2チャンネルとされる場合における音量補正装置の実施形態の概要を説明するための図である。なお、この図24の例は、上述した第2の実施形態に適用した場合の例である。第1の実施形態に適用することも勿論できる。
【0200】
すなわち、図26の例においては、5.1チャンネルのサラウンド音声信号FLi、FRi、RLi、RRi、Ci、LFiのそれぞれが、ダウンミックス部71に供給されて、左右2チャンネルの音声信号Li,Riとされる。また、この例においては、ダウンミックス部71は、センターチャンネルの音声信号Ciは、そのまま出力する。
【0201】
このダウンミックス部71からの左右2チャンネルの音声信号Li,Riは、それぞれ可変ゲインアンプ72,73に供給される。そして、この可変ゲインアンプ72および73の出力信号は、加算部77および78に供給される。
【0202】
また、ダウンミックス部71からのセンターチャンネルの音声信号Ciは、可変ゲインアンプ74に供給される。そして、この可変ゲインアンプ74の出力信号が加算部77及び78に供給される。この加算部77および78から、2チャンネル出力音声信号SoLおよびSoRを出力する。
【0203】
ダウンミックス部71からのセンターチャンネルの音声信号Ciは、さらに、声レベル補正ゲイン生成部75に供給される。この声レベル補正ゲイン生成部75は、図14に示した声レベル補正ゲイン生成部30と同様の構成を備え、ゲイン制御信号Gvを生成する。そして、声レベル補正ゲイン生成部75で生成されたゲイン制御信号Gvは、センターチャンネル用の可変ゲインアンプ74に供給される。
【0204】
声レベル補正ゲイン生成部75で生成されたゲイン制御信号Gvは、また、臨場音レベル補正ゲイン生成部76に供給される。この臨場音レベル補正ゲイン生成部76は、図14に示した臨場音レベル補正ゲイン生成部40と同様の構成を備え、ゲイン制御信号Gsを生成する。そして、臨場音レベル補正ゲイン生成部76で生成されたゲイン制御信号Gsは、可変ゲインアンプ72、73に供給される。
【0205】
この図26の例においても、上述と同様の作用効果を奏する。
【0206】
<非リアルタイム処理>
以上の実施形態は、入力音声信号について、リアルタイムで声平均レベルや声以外平均レベルを検出して、ゲイン制御するようにした場合である。しかし、この発明は、リアルタイム処理の場合のみに適用されるわけではない。
【0207】
例えば記録媒体に記録された音声信号について、ゲイン制御信号GvやGsを生成して、それを記録信号に対応付けて記録するようにすることもできる。その場合には、再生時には、当該記録されているゲイン制御信号GvやGsを用いて、再生音声信号を音量制御するようにすることができる。
【0208】
図27は、例えばハードディスクやDVD(Digital Versatile Disc)などの記録媒体に、テレビ放送信号を記録することができる記録再生装置に、この発明を適用した場合のブロック図である。
【0209】
すなわち、この図27の例の記録再生装置80においては、放送記録系81と、再生系82と、レベル補正ゲイン生成部83と、制御部84と、操作部85とを備える。操作部85は、例えばリモコン送受信部からなる。制御部84は、例えばマイクロコンピュータを搭載して構成され、操作部85からの操作入力に応じた制御を、記録再生装置80の各部に対して行う。
【0210】
レベル補正ゲイン生成部83は、上述した図1に示した第1の実施形態を適用した場合であれば、センター集中定位信号検出部21と、声レベル補正ゲイン生成部30からなる。また、上述の図14に示した第2の実施形態を適用した場合であれば、センター集中定位信号検出部21と、声レベル補正ゲイン生成部30と、臨場音レベル補正ゲイン生成部40とからなる。
【0211】
操作部85を通じてユーザにより記録指示操作があると、制御部84は、放送記録系81を制御して、記録指示された放送番組の記録を実行する。
【0212】
放送記録系81においては、放送受信部811で記録指示された放送番組の放送波信号を受信し、デコード部812に供給する。デコード部812では、この例では、受信信号から映像信号V1と、音声信号A1とがデコードされて出力される。ここで、音声信号A1は、例えば左右2チャンネル音声信号とされる。
【0213】
このデコード部812からの映像信号V1および音声信号A1は、記録エンコード部813で記録エンコードされた後、書き込み部815を通じて記録媒体816に記録される。記録媒体816は、例えばハードディスク装置が用いられる。
【0214】
操作部85には、この例では、記録媒体816に記録されている放送番組コンテンツを指定するためのキーおよびレベル補正ゲイン生成指示キーが設けられている。ユーザにより、記録されている放送番組コンテンツの指定がなされ、レベル補正ゲイン生成指示キーが操作されると、制御部84は、指定された放送番組コンテンツの音声信号についての再生音量を適正にするためのレベル補正ゲイン生成処理を実行するようにする。
【0215】
すなわち、制御部84は、前記レベル補正ゲイン生成指示キーの操作入力に基づき、再生系の読み出し部821と、再生デコード部822と、レベル補正ゲイン生成部83および書き込み部815を動作状態に制御する。
【0216】
そして、制御部84は、読み出し部821を制御して、記録媒体816から指定された放送番組の記録信号を読み出す。読み出し部821は、読み出した記録信号を再生デコード部822に供給する。再生デコード部822は、記録信号を再生デコードして、再生映像信号V2および再生音声信号A2を出力する。
【0217】
この再生デコード部822からの再生音声信号A2は、レベル補正ゲイン生成部83に供給される。このレベル補正ゲイン生成部83では、上述の第1の実施形態または第2の実施形態で説明したようにして、ゲイン制御信号GvやGsが生成される。
【0218】
そして、レベル補正ゲイン生成部83は、生成したゲイン制御信号GvやGsを書き込み部815に供給する。書き込み部815は、制御部84の制御を受けながら、レベル補正ゲイン生成部83からのゲイン制御信号GvやGsを、再生中の記録信号に対応付けて記録媒体816に記録するようにする。
【0219】
次に、操作部85を通じてユーザにより再生指示操作があると、制御部84は、再生系82を制御して、再生指示された放送番組の再生を実行する。
【0220】
すなわち、制御部84は、読み出し部821を制御して、記録媒体816から指定された放送番組の記録信号と、対応付けられて記録されているゲイン制御信号GvやGsとを読み出す。読み出し部821は、読み出した記録信号を再生デコード部822に供給すると共に、読み出したゲイン制御信号GvやGsをゲイン制御信号再生部826に供給する。
【0221】
再生デコード部822は、記録信号を再生デコードして、再生映像信号V2および再生音声信号A2を得る。そして、再生映像信号V2を映像信号処理部823を通じ、映像出力端827を通じて出力する。出力端827には、表示装置が接続され、その表示画面に、放送番組の再生映像が映出される。
【0222】
また、再生デコード部822からの再生音声信号は、音声信号処理部824を通じて音量補正部825に供給される。この音量補正部825は、図1の第1の実施形態の場合であれば、声レベル補正ゲイン発生部30が除去された構成とされ、また、図14の第2の実施形態の場合であれば、声レベル補正ゲイン発生部30および臨場音レベル補正部40が除去された構成とされる。
【0223】
一方、ゲイン制御信号再生部826では、読み出し部821からの信号から、ゲイン制御信号GvやGsが再生される。そして、ゲイン制御信号再生部826は、再生したゲイン制御信号GvやGsを音量補正部825に供給して、上述の実施形態で説明したようにしてゲイン制御するようにする。したがって、音量補正部825から得られる音声信号は、上述した第1の実施形態および第2の実施形態と同様にして、自動音量補正しても違和感の生じないものとなる。
【0224】
この音量補正部825からの再生音声信号は、音声出力端828を通じて、スピーカに供給される。
【0225】
なお、この図27の例においては、レベル補正ゲイン生成部83では、上述した第1の実施形態または第2の実施形態と同様の構成としたが、この図27の例は、リアルタイム処理である必要は無いので、処理時間はかかるが、より高精度の構成とすることもできる。
【0226】
例えば、記録再生装置80が、十分なバッファ容量および処理能力を持った構成である場合には、音声信号の自己相関をとりながら、ピッチ検出をして人声信号が含まれる人声主体信号を検出するようにすることもできる。また、FFT(Fast Fourier Transform)によるスペクトル包絡のケプストラム解析を行なうなどして、より、精密に、人声信号が含まれる人声主体信号を検出することもできる。
【0227】
なお、図27の例では、非リアルタイムでの処理においては、ゲイン制御信号GvやGsを生成して、記録信号に対応付けて記録するようにした。しかし、記録信号のうちの音声信号に対して、非リアルタイム処理により、上述のようなゲイン制御による音量補正処理を実行し、当該音量補正処理をした音声信号を、記録媒体に記録する(記録し直す)ようにしてもよい。この場合には、上述のような高精度の構成を用いて音声信号についてのゲイン制御ができる。
【0228】
また、図27の例は、音声信号について非リアルタイム処理でゲイン制御信号を生成する記録再生装置であるが、記録する音声信号に対して、上述した第1の実施形態や第2の実施形態を適用して、リアルタイムで音量補正処理をする記録再生装置としても良い。
【0229】
その場合の記録再生装置は、デコード部812でデコードした音声信号について、上述した第1の実施形態や第2の実施形態を適用してリアルタイムで音量補正処理をする。そして、その音量補正した音声信号を記録エンコード部813を通じて記録するようにする。このようにする記録再生装置の場合には、ゲイン制御信号GvやGsを記録信号に対応付けて記録する必要はないので、レベル補正ゲイン生成部83は不要となる。また、再生系82にレベル補正ゲイン抽出部826や音量補正部825を設ける必要はない。
【0230】
[その他の実施形態ないし変形例]
上述の第1および第2の実施形態では、声レベル補正ゲイン生成部30では、声主体信号の平均レベルが基準値となるようにすることにより、声主体信号の出力レベルを一定レベルにするようにした。しかし、声主体信号についてのゲイン制御態様としては、入力音声信号の全体レベルが基準値となるようなゲイン制御であってもよい。
【0231】
なお、上述の第2の実施形態では、声レベル補正ゲイン生成部30からの出力ゲイン制御信号Gvを、臨場音レベル補正ゲイン生成部40に供給して、ゲイン制御信号Gvに対して更なる処理を加えることで、ゲイン制御態様を変更するようにした。しかし、第1のゲイン制御態様と、第2のゲイン制御態様とは、このような従属関係にする必要はない。要は、第1成分主体信号についての第1のゲイン制御態様と、第1成分以外の他の音声成分主体信号についての第2のゲイン制御態様とが、上述の例のように異なる態様であればよい。
【0232】
また、分離部における音声分離の他の方法についても説明したように、声主体信号は第1成分主体信号の一例であり、臨場音主体信号は、第1成分以外の他の音声成分主体信号の一例である。第1成分主体信号と第1成分以外の他の音声成分主体信号とは、入力音声信号における、その他、種々の信号を対象とすることができる。上述のマルチチャンネルの1つのチャンネルを第1成分主体信号とし、他のチャネルを第1成分以外の他の音声成分主体信号とするのも、その一例である。
【0233】
なお、上述の説明では、センター集中定位信号検出部21や声レベル補正ゲイン生成部30、臨場音レベル補正ゲイン生成部40は、デスクリートの回路部からなるハードウエア構成としたが、DSP(Digital Signal Processor)を用いた構成としてもよい。
【0234】
また、センター集中定位信号検出部21や声レベル補正ゲイン生成部30、臨場音レベル補正ゲイン生成部40は、コンピュータのプログラムによるソフトウエア処理の構成とすることもできることは言うまでもない。その場合には、例えば図2の例においては、声レベル補正ゲイン生成部30や臨場音レベル補正ゲイン生成部40は、制御部10がソフトウエア処理機能として備える。そして、図2において、点線で示したように、この制御部10からのゲイン制御信号により、音量補正部18が備える可変ゲインアンプをゲイン制御する。
【0235】
なお、音声信号を、デジタル信号処理とするのであれば、可変ゲインアンプを含めた音量補正部18の全てをソフトウエア処理として構成することもできるものである。
【0236】
なお、この発明による音量補正装置が適用される電子機器は、図2に示したテレビ放送受信装置に限られるものではないことは言うまでもない。
【符号の説明】
【0237】
20,50…分離部、21…センター集中定位信号検出部、24,250,260…可変ゲインアンプ、25,26…固定ゲインアンプ、30…声レベル補正ゲイン生成部、40…臨場音レベル補正ゲイン生成部、27,28…加算部
【特許請求の範囲】
【請求項1】
複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、
前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、
前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、
を備える音量補正装置。
【請求項2】
請求項1に記載の音量補正装置において、
前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、
前記他成分ゲイン制御信号生成部は、前記第1成分ゲイン制御信号による補正ゲイン値が基準範囲内であるときには、前記第1成分以外の他の音声信号をそのままのレベルで出力するように制御し、前記第1成分ゲイン制御信号による補正ゲイン値が前記基準範囲外であるときには、前記他成分ゲイン制御信号の補正ゲインは、前記第1成分ゲイン制御信号による補正ゲインとの比が所定値に調整されたものとする
音量補正装置。
【請求項3】
請求項1に記載の音量補正装置において、
前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、
前記他成分ゲイン制御部は、前記第1成分ゲイン制御信号による前記第1成分主体信号に対するゲイン補正に対して、遅れて追従する時間遅れ特性を持たせる他成分ゲイン制御信号を生成する
音量補正装置。
【請求項4】
請求項3に記載の音量補正装置において、
前記他成分ゲイン制御部は、前記他成分ゲイン制御信号による補正ゲイン値が、前記第1成分ゲイン制御信号による補正ゲイン値に対して所定の基準値を乗算した設定値を超えている場合には、前記他成分ゲイン制御信号による補正ゲイン値を前記設定値に固定するようにする
音量補正装置。
【請求項5】
請求項1〜4のいずれかに記載の音量補正装置において、
前記第1成分ゲイン制御部の出力信号と、前記他成分出力部の出力信号とを加算した加算出力信号を、音量補正後の音声出力信号とする
音量補正装置。
【請求項6】
請求項1〜4のいずれかに記載の音量補正装置において、
前記入力音声信号から、第1成分主体信号を分離して前記第1成分ゲイン制御部に供給する第1の分離部と、
前記入力音声信号から、前記第1成分主体信号を減算することにより、前記第1成分以外の他の音声成分を主体とする第2成分主体信号を分離して、前記他成分出力部に供給する第2の分離部と、
前記第1成分ゲイン制御部の出力信号と、前記他成分出力部の出力信号とを加算して、その加算出力信号を、音量補正出力信号とする加算部と、
を備える音量補正装置。
【請求項7】
請求項1〜4のいずれかに記載の音量補正装置において、
前記入力音声信号は、複数チャンネルの音声信号からなり、
前記第1成分主体信号は、前記複数チャンネルの音声信号の1チャンネルの信号である
音量補正装置。
【請求項8】
請求項1〜6のいずれかに記載の音量補正装置において、
前記第1成分主体信号は、人声信号を主たる成分とするものである
音量補正装置。
【請求項9】
請求項7に記載の音量補正装置において、
前記第1成分主体信号は、センターチャンネルの信号である
音量補正装置。
【請求項10】
請求項1に記載の音量補正装置において、
前記第1成分主体信号は、前記入力音声信号のセンター集中定位信号である音量補正装置。
【請求項11】
複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、第1のゲイン制御態様でゲイン制御して出力すると共に、
前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成し、
前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する
音量補正方法。
【請求項12】
入力音声信号のゲインを制御して音量補正する音量補正装置であるコンピュータを、
複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、
前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、
前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、
として機能させる音量補正プログラム。
【請求項1】
複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、
前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、
前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、
を備える音量補正装置。
【請求項2】
請求項1に記載の音量補正装置において、
前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、
前記他成分ゲイン制御信号生成部は、前記第1成分ゲイン制御信号による補正ゲイン値が基準範囲内であるときには、前記第1成分以外の他の音声信号をそのままのレベルで出力するように制御し、前記第1成分ゲイン制御信号による補正ゲイン値が前記基準範囲外であるときには、前記他成分ゲイン制御信号の補正ゲインは、前記第1成分ゲイン制御信号による補正ゲインとの比が所定値に調整されたものとする
音量補正装置。
【請求項3】
請求項1に記載の音量補正装置において、
前記第1成分ゲイン制御信号生成部で生成される前記第1成分ゲイン制御信号は、前記第1成分主体信号の出力レベルを、一定レベルにするものであると共に、
前記他成分ゲイン制御部は、前記第1成分ゲイン制御信号による前記第1成分主体信号に対するゲイン補正に対して、遅れて追従する時間遅れ特性を持たせる他成分ゲイン制御信号を生成する
音量補正装置。
【請求項4】
請求項3に記載の音量補正装置において、
前記他成分ゲイン制御部は、前記他成分ゲイン制御信号による補正ゲイン値が、前記第1成分ゲイン制御信号による補正ゲイン値に対して所定の基準値を乗算した設定値を超えている場合には、前記他成分ゲイン制御信号による補正ゲイン値を前記設定値に固定するようにする
音量補正装置。
【請求項5】
請求項1〜4のいずれかに記載の音量補正装置において、
前記第1成分ゲイン制御部の出力信号と、前記他成分出力部の出力信号とを加算した加算出力信号を、音量補正後の音声出力信号とする
音量補正装置。
【請求項6】
請求項1〜4のいずれかに記載の音量補正装置において、
前記入力音声信号から、第1成分主体信号を分離して前記第1成分ゲイン制御部に供給する第1の分離部と、
前記入力音声信号から、前記第1成分主体信号を減算することにより、前記第1成分以外の他の音声成分を主体とする第2成分主体信号を分離して、前記他成分出力部に供給する第2の分離部と、
前記第1成分ゲイン制御部の出力信号と、前記他成分出力部の出力信号とを加算して、その加算出力信号を、音量補正出力信号とする加算部と、
を備える音量補正装置。
【請求項7】
請求項1〜4のいずれかに記載の音量補正装置において、
前記入力音声信号は、複数チャンネルの音声信号からなり、
前記第1成分主体信号は、前記複数チャンネルの音声信号の1チャンネルの信号である
音量補正装置。
【請求項8】
請求項1〜6のいずれかに記載の音量補正装置において、
前記第1成分主体信号は、人声信号を主たる成分とするものである
音量補正装置。
【請求項9】
請求項7に記載の音量補正装置において、
前記第1成分主体信号は、センターチャンネルの信号である
音量補正装置。
【請求項10】
請求項1に記載の音量補正装置において、
前記第1成分主体信号は、前記入力音声信号のセンター集中定位信号である音量補正装置。
【請求項11】
複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、第1のゲイン制御態様でゲイン制御して出力すると共に、
前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成し、
前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する
音量補正方法。
【請求項12】
入力音声信号のゲインを制御して音量補正する音量補正装置であるコンピュータを、
複数の音声成分からなる入力音声信号の、前記複数の音声成分の一部を主たる成分とする第1成分主体信号を、ゲイン制御して出力する第1成分ゲイン制御部と、
前記第1成分ゲイン制御部において、前記第1成分主体信号の出力レベルを一定とするような第1成分ゲイン制御信号を生成する第1成分ゲイン制御信号生成部と、
前記第1成分ゲイン制御信号に基づいて、前記入力音声信号の、前記第1成分以外の音声成分をゲイン制御して出力する他成分ゲイン制御部と、
として機能させる音量補正プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【公開番号】特開2011−135600(P2011−135600A)
【公開日】平成23年7月7日(2011.7.7)
【国際特許分類】
【出願番号】特願2011−23852(P2011−23852)
【出願日】平成23年2月7日(2011.2.7)
【分割の表示】特願2008−310901(P2008−310901)の分割
【原出願日】平成20年12月5日(2008.12.5)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
【公開日】平成23年7月7日(2011.7.7)
【国際特許分類】
【出願日】平成23年2月7日(2011.2.7)
【分割の表示】特願2008−310901(P2008−310901)の分割
【原出願日】平成20年12月5日(2008.12.5)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】
[ Back to top ]