説明

音響処理装置

【課題】定位成分を強調したステレオ形式の音響信号を生成する。
【解決手段】和成分生成部52は、ステレオ形式の音響信号SIN_Lと音響信号SIN_Rとの加算で和成分Mを生成する。差成分生成部54は、特定位置の定位成分を抑圧した差成分Sを音響信号SIN_Lと音響信号SIN_Rとの間の減算で生成する。判定部42は、定位成分の有無を判定する。第1生成部62は、定位成分が強調されるように周波数毎の係数値g[k]が設定された処理係数列GAを、和成分Mと差成分Sとの間の減算を含む減算処理で生成する。第2生成部64は、定位成分が存在しない場合の処理係数列GAと比較して各係数値g[k]の分布が平準な処理係数列GBを生成する。信号処理部38は、音響信号SIN_Lおよび音響信号SIN_Rの各々に対し、定位成分が存在すると判定された場合に処理係数列GAを作用させ、定位成分が存在しないと判定された場合に処理係数列GBを作用させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ステレオ形式の右チャネルおよび左チャネルの各々の音響信号のうち目的の位置(方向)に音像が定位する成分(以下「定位成分」という)を強調する技術に関する。
【背景技術】
【0002】
CD等の記録媒体に収録された音響信号から所定の定位成分を抑圧する技術が従来から提案されている。例えば特許文献1には、ステレオ形式の音響信号の一方から他方を減算(逆相加算)することで、音像が中央方向に定位する成分(典型的には歌唱音)を抑圧する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−079413号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の技術で定位成分を抑圧した音響信号を当初の音響信号から減算すれば、定位成分を強調した音響信号を生成することも可能である。しかし、特許文献1の技術のもとでは、処理後の音響信号がモノラル形式になるという問題がある。以上の事情を考慮して、本発明は、定位成分を強調したステレオ形式の音響信号を生成することを目的とする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本発明の音響処理装置は、ステレオ形式の第1音響信号と第2音響信号との和成分を生成する和成分生成手段と、特定方向の定位成分を抑圧した差成分を第1音響信号と第2音響信号との間の減算で生成する差成分生成手段と、定位成分の有無を判定する判定手段と、定位成分が強調されるように周波数毎の係数値が設定された第1処理係数列(例えば処理係数列GA)を、和成分と差成分との間の減算(例えば後述の数式(5A),数式(7A),数式(5C)の演算)を含む減算処理で生成する第1生成手段と、定位成分が存在しない場合に減算処理で生成される第1処理係数列と比較して各周波数の係数値の分布が平準な第2処理係数列(例えば処理係数列GB)を生成する第2生成手段と、第1音響信号および第2音響信号の各々の各周波数成分に対し、定位成分が存在すると判定手段が判定した場合に第1処理係数列の各係数値を作用させ、定位成分が存在しないと判定手段が判定した場合に第2処理係数列の各係数値を作用させる信号処理手段とを具備する。
【0006】
以上の構成においては、第1音響信号および第2音響信号の各々に処理係数列を作用させるから、定位成分が強調されたステレオ形式の音響信号を生成することが可能である。また、定位成分が存在しない場合には、第1処理係数列と比較して各係数値の分布が平準な第2処理係数列が信号処理手段での処理に適用される。したがって、定位成分の有無に関わらず第1処理係数列を適用する構成と比較すると、定位成分が存在しないにも関わらず第1処理係数列を適用することに起因した雑音(ミュージカルノイズ)を低減することが可能である。
【0007】
定位成分が存在する場合に第1処理係数列の各係数値は広範囲に分散し、定位成分が存在しない場合に第1処理係数列の各係数値は所定値の近傍に偏在するという傾向がある。そこで、本発明の好適な態様の判定手段は、第1生成手段が生成した第1処理係数列の複数の係数値の平均値または散らばりの度合(例えば分散や標準偏差)が閾値を上回る場合には定位成分が存在すると判定し、閾値を下回る場合には定位成分が存在しないと判定する。以上の態様では、信号処理手段での処理に適用され得る第1処理係数列が定位成分の有無の判定に流用されるから、定位成分の有無を判定する独立の要素を設置した構成と比較して音響処理装置の構成や動作が簡素化されるという利点がある。ただし、定位成分の有無の判定に第1処理係数列を利用する構成は本発明において必須ではない。
【0008】
第2生成手段が第2処理係数列を生成する方法は任意であるが、例えば、各係数値を所定値に設定した第2処理係数列を生成する(例えば事前に用意された第2処理係数列を記憶手段から取得する)方法や、第1生成手段が生成した第1処理係数列の各係数値の分布を平滑化することで第2処理係数列を生成する方法が採用され得る。前者の構成によれば、第2処理係数列を生成するための処理や構成が簡素化されるという効果が実現され、後者の構成によれば、第1音響信号や第2音響信号の特性が第2処理係数列に反映されることで聴覚的に自然な音響信号を生成できるという効果が実現される。
【0009】
本発明の好適な態様において、判定手段は、定位成分の有無を単位期間毎に判定し、信号処理手段は、定位成分の存在が所定個の単位期間にわたって連続して否定された場合に第2処理係数列の適用を開始する。以上の態様においては、定位成分の存在が所定個の単位期間にわたって連続して否定された場合に第2処理係数列の適用が開始されるから、信号処理手段での処理に適用される処理係数列が第1処理係数列および第2処理係数列の一方から他方に変更される頻度が減少する。したがって、聴覚的に自然な印象の音響信号を生成できるという利点がある。
【0010】
本発明の好適な態様に係る音響処理装置は、特定位置(方向)を示す定位変数を可変に設定する変数設定手段を具備し、差成分生成手段は、変数設定手段が設定した定位変数に応じた比率で第1音響信号および第2音響信号の一方から他方を減算する。以上の態様においては、差成分生成手段による減算時の第1音響信号および第2音響信号の比率が定位変数に応じて可変に設定される。したがって、強調の対象となる定位成分の位置(方向)を可変に制御できる(中央方向に限定されない)という利点がある。
【0011】
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明のプログラムは、ステレオ形式の第1音響信号と第2音響信号との和成分を生成する和成分生成処理と、特定方向の定位成分を抑圧した差成分を第1音響信号と第2音響信号との間の減算で生成する差成分生成処理と、定位成分の有無を判定する判定処理と、定位成分が強調されるように周波数毎の係数値が設定された第1処理係数列を、和成分と差成分との間の減算を含む減算処理で生成する第1生成処理と、定位成分が存在しない場合に減算処理で生成される第1処理係数列と比較して各周波数の係数値の分布が平準な第2処理係数列を生成する第2生成処理と、第1音響信号および第2音響信号の各々の各周波数成分に対し、定位成分が存在すると判定処理で判定した場合に第1処理係数列の各係数値を作用させ、定位成分が存在しないと判定処理で判定した場合に第2処理係数列の各係数値を作用させる信号処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の音響処理装置と同様の作用および効果が実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
【図面の簡単な説明】
【0012】
【図1】第1実施形態に係る音響処理装置のブロック図である。
【図2】係数設定部のブロック図である。
【図3】係数設定部の動作の説明図である。
【図4】第2実施形態における第2生成部の動作の説明図である。
【発明を実施するための形態】
【0013】
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。音響処理装置100には信号供給装置12と放音装置14と入力装置16とが接続される。信号供給装置12は、音響(音声や楽音)の波形を表す時間領域の音響信号SIN(SIN_L,SIN_R)を音響処理装置100に供給する。
【0014】
左チャネルの音響信号SIN_Lおよび右チャネルの音響信号SIN_Rは、音響を発生する複数の音源の音像が相異なる位置に定位する(すなわち、音響の振幅や位相が各音源の位置に応じて相違する)ように収音または加工されたステレオ形式の信号である。周囲の音響を収音して音響信号SINを生成する収音機器(ステレオマイク)や、可搬型または内蔵型の記録媒体から音響信号SINを取得して音響処理装置100に出力する再生装置や、通信網から音響信号SINを受信して音響処理装置100に出力する通信装置が信号供給装置12として採用され得る。
【0015】
音響処理装置100は、信号供給装置12が供給する音響信号SINから音響信号SOUT(SOUT_L,SOUT_R)を生成する。左チャネルの音響信号SOUT_Lおよび右チャネルの音響信号SOUT_Rは、音響信号SINが表す音響のうち目的の位置(方向)に音像が定位する定位成分を強調したステレオ形式の信号である。放音装置14(例えばステレオスピーカやステレオヘッドホン)は、音響処理装置100が生成した音響信号SOUT(SOUT_L,SOUT_R)に応じた音波を放射する。
【0016】
入力装置16は、音響処理装置100に対する指示を利用者が入力するための機器(例えばマウスやキーボード)である。利用者は、入力装置16を適宜に操作することで、定位成分の位置(方向)を音響処理装置100に対して任意に指示することが可能である。
【0017】
図1に示すように、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムPGや演算処理装置22が使用するデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用される。音響信号SIN(SIN_L,SIN_R)を記憶装置24に記憶した構成(したがって信号供給装置12は省略され得る)も好適である。
【0018】
演算処理装置22は、記憶装置24に格納されたプログラムPGを実行することで、音響信号SINから音響信号SOUTを生成するための複数の機能(変数設定部32,周波数分析部34,係数設定部36,信号処理部38,波形合成部40,判定部42)を実現する。なお、演算処理装置22の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
【0019】
変数設定部32は、定位変数αを可変に設定する。定位変数αは、定位成分の音像の位置(方向)を指定する変数である。本形態の変数設定部32は、入力装置16に対する利用者からの指示に応じて定位変数α(0≦α≦1)を可変に設定する。例えば、定位変数αが0.5(中央値)である場合には中央(正面)方向が指示される。また、定位変数αが1に近いほど右寄りの方向が指示され、定位変数αが0に近いほど左寄りの方向が指示される。利用者は、放音装置14からの再生音を聴取しながら随時に入力装置16の操作で定位変数αを変更することが可能である。
【0020】
周波数分析部34は、音響信号SIN_Lの周波数スペクトル(複素スペクトル)LAと音響信号SIN_Rの周波数スペクトル(複素スペクトル)RAとを時間軸上の単位期間(フレーム)毎に順次に生成する。周波数スペクトルLAは、K個の周波数(周波数帯域)f1〜fKの各々に対応する周波数成分LA[k]の系列(LA[1]〜LA[K])である(k=1〜K)。同様に、周波数スペクトルRAは、周波数f1〜fKの各々に対応する周波数成分RA[k]の系列(RA[1]〜RA[K])である。周波数スペクトルLAおよび周波数スペクトルRAの生成には、短時間フーリエ変換などの公知の周波数分析が任意に採用され得る。なお、通過帯域が相異なるK個の帯域通過フィルタで構成されるフィルタバンクも周波数分析部34として採用され得る。
【0021】
図1の係数設定部36は、音響信号SIN(SIN_L,SIN_R)の定位成分の強調に使用される処理係数列G(GA,GB)を生成する。処理係数列Gは、周波数f1〜fKの各々に対応するg[k]の系列(g[1]〜g[K])であり、周波数スペクトルLAと周波数スペクトルRAとを利用して単位期間毎に順次に生成される。係数値g[k]は、音響信号SIN_Lの周波数成分LA[k]や音響信号SIN_Rの周波数成分RA[k]に対するゲイン(スペクトルゲイン)に相当し、0以上かつ1以下の範囲内で設定される(0≦g[k]≦1)。なお、処理係数列GAと処理係数列GBとの区別については後述する。
【0022】
図1の信号処理部38は、係数設定部36が生成した処理係数列G(GA,GB)を周波数スペクトルLAおよび周波数スペクトルRAの各々に個別に作用させることで周波数スペクトルLBと周波数スペクトルRBとを単位期間毎に順次に生成する。周波数スペクトルLBは、各周波数fkに対応する周波数成分LB[k]の系列(LB[1]〜LB[K])であり、周波数スペクトルRBは、各周波数fkに対応する周波数成分RB[k]の系列(RB[1]〜RB[K])である。
【0023】
具体的には、信号処理部38は、以下の数式(1A)および数式(1B)に示すように、各単位期間の周波数スペクトルLAおよび周波数スペクトルRAの各々に対し、当該単位期間について係数設定部36が生成した共通の処理係数列G(GA,GB)を乗算する。すなわち、周波数スペクトルLBの各周波数fkの周波数成分LB[k]は、その周波数fkの周波数成分LA[k]と係数値g[k]との乗算値に設定され(数式(1A))、周波数スペクトルRBの各周波数成分RB[k]は、周波数成分RA[k]と係数値g[k]との乗算値に設定される(数式(1B))。
【数1】

【0024】
図1の波形合成部40は、信号処理部38による処理後の周波数スペクトルLBおよび周波数スペクトルRBからステレオ形式の音響信号SOUT_Lおよび音響信号SOUT_Rを生成する。具体的には、波形合成部40は、単位期間毎の周波数スペクトルLBを逆フーリエ変換で時間領域の信号に変換するとともに前後の単位期間について相互に連結することで音響信号SOUT_Lを生成する。同様に、波形合成部40は、各周波数スペクトルRBから音響信号SOUT_Rを生成する。波形合成部40が生成した音響信号SOUT(SOUT_L,SOUT_R)が放音装置14に供給されて音波として再生される。
【0025】
以上に説明したように、第1実施形態では、音響信号SIN_L(周波数スペクトルLA)および音響信号SIN_R(周波数スペクトルRA)の各々に対して個別に処理係数列Gを作用させるから、定位成分を強調した音響信号SOUT(SOUT_L,SOUT_R)をステレオ形式のまま生成することが可能である。
【0026】
次に、図2を参照して係数設定部36の詳細を説明する。図2に示すように、係数設定部36は、和成分生成部52と差成分生成部54と係数列生成部60とを含んで構成される。和成分生成部52は、音響信号SIN_Lの周波数成分LA[1]〜LA[K]と音響信号SIN_Rの周波数成分RA[1]〜RA[K]との加算で単位期間毎に順次に和成分(複素スペクトル)Mを生成する。和成分Mは、周波数f1〜fKの各々に対応する周波数成分M[k]の系列(M[1]〜M[K])である。数式(2)に示すように、和成分Mの周波数fkの周波数成分M[k]は、その周波数fkの周波数成分LA[k]と周波数成分RA[k]との加算に相当する。したがって、和成分Mは、全部の音源からの音響を混合したモノラル形式の信号に相当する。なお、周波数成分LA[k]と周波数成分RA[k]との加重和や相加平均を和成分Mとして算定する構成も採用され得る。
【数2】

【0027】
図2の差成分生成部54は、音響信号SIN_Lの周波数成分LA[1]〜LA[K]と音響信号SIN_Rの周波数成分RA[1]〜RA[K]との間の減算で単位期間毎に順次に差成分(複素スペクトル)Sを生成する。差成分Sは、周波数f1〜fKの各々に対応する周波数成分S[k]の系列(S[1]〜S[K])である。差成分生成部54は、変数設定部32が設定した定位変数αを利用した数式(3)の演算(加重減算)で周波数成分S[1]〜S[K]を算定する。
【数3】

【0028】
数式(3)から理解されるように、定位変数αに応じた可変の比率(重み値)で周波数成分LA[k]から周波数成分RA[k]を減算(逆相加算)することで差成分Sの各周波数成分S[k]が生成される。したがって、差成分Sは、音響信号SIN(SIN_L,SIN_R)のうち定位変数αに応じた位置(方向)の定位成分を他の成分に対して相対的に抑圧した信号(すなわち、定位成分以外を相対的に強調した信号)となる。例えば、定位変数αが0.5(中央値)である場合には、中央方向の定位成分を抑圧した差成分Sが生成される。また、定位変数αが0.5を上回るほど、中央方向に対して右寄りの定位成分が差成分Sでは抑圧され、定位変数αが0.5を下回るほど、中央方向に対して左寄りの定位成分が差成分Sでは抑圧される。
【0029】
数式(3)の記号max(α,1−α)は、定位変数αまたは変数(1−α)のうちの最大値を意味する。定位変数αは1以下の数値に設定されるから、数式(3)の分子の演算のみでは周波数成分S[k]のパワー(振幅)が不足する可能性がある。数式(3)のように最大値max(α,1−α)で除算するのは、周波数成分S[k]のパワーを周波数成分LA[k]や周波数成分RA[k]と同等に維持するためである。
【0030】
図2の係数列生成部60は、和成分生成部52が生成した和成分Mと差成分生成部54が生成した差成分Sとを利用して処理係数列G(GA,GB)を単位期間毎に生成する。図2に示すように、係数列生成部60は、処理係数列GAを生成する第1生成部62と、処理係数列GBを生成する第2生成部64とを含んで構成される。
【0031】
処理係数列GAは、音響信号SIN(SIN_L,SIN_R)の定位成分を強調するための数値列である。第1生成部62は、以下の数式(4)の演算で処理係数列GAの各係数値g[k]を算定する。なお、数式(4)において振幅P[k]1/2を周波数成分M[k]の振幅|M[k]|で除算するのは、処理係数列GAの各係数値g[k]を1以下の数値(0≦g[k]≦1)に正規化するためである。
【数4】

【0032】
数式(4)の記号P[k]は、定位成分を強調したパワースペクトルPのうち周波数fkでのパワーを意味する。第1生成部62は、以下の数式(5A)および数式(5B)で表現される演算(以下「減算処理」という)で数式(4)のパワーP[k]を算定する。
【数5】

数式(5A)から理解されるように、周波数成分M[k]のパワー|M[k]|が周波数成分S[k]のパワー|S[k]|を上回る周波数fkでのパワーP[k]は、和成分Mのパワー|M[k]|から差成分Sのパワー|S[k]|を減算した数値に設定される。すなわち、パワースペクトルPは、和成分Mと差成分Sとの間のパワースペクトルの減算(スペクトル減算)で生成される。他方、パワー|M[k]|がパワー|S[k]|を下回る周波数fkでのパワーP[k]は、和成分Mのパワー|M[k]|と所定の係数(フロアリング係数)βとの乗算値に設定される。
【0033】
以上の説明から理解されるように、数式(5A)および数式(5B)で表現される減算処理は、和成分Mを信号成分(目的音)と仮定するとともに差成分Sを雑音成分と仮定した場合に雑音成分を抑圧するためのスペクトル減算(SS:Spectral Subtraction)に相当する。なお、数式(5B)の係数βを可変に制御する構成や、数式(5B)のパワー|M[k]|を差成分Sのパワー|S[k]|2に置換した構成も採用され得る。
【0034】
ところで、音響信号SIN(SIN_L,SIN_R)のなかには、定位成分が存在する区間と定位成分が存在しない区間(定位成分の発音が停止する区間)とが存在する。図3の部分(A)は、定位成分が存在する単位期間について第1生成部62が生成する処理係数列GAの模式図であり、図3の部分(B)は、定位成分が存在しない単位期間について第1生成部62が生成する処理係数列GAの模式図である。図3の部分(A)および部分(B)の所定値bは、数式(5B)の係数βに応じた所定の数値(例えばb=β1/2,0≦b≦1)である。
【0035】
定位成分が有意なパワーで存在する周波数fkについては、和成分Mのパワー|M[k]|2が差成分Sのパワー|S[k]|2を上回ることで数式(5A)の演算が実行される可能性が高い。数式(5A)に適用される差成分Sは、定位成分を相対的に抑圧した成分(定位成分以外を定位成分に対して強調した成分)であるから、数式(5A)で算定されるパワーP[k]の系列は、音響信号SIN(SIN_L,SIN_R)の定位成分を他の成分に対して相対的に強調したパワースペクトルに相当する。したがって、図3の部分(A)に示すように、定位成分が存在する場合に数式(4)で算定される処理係数列GAの各係数値g[k]は、定位成分のパワーが大きい周波数fkの係数値g[k]ほど1に近い数値となり、定位成分のパワーが小さい周波数fkの係数値g[k]ほど所定値bに近い数値(ゼロに近い数値)となるように周波数軸上で分布する。したがって、周波数スペクトルLAおよび周波数スペクトルRAの各々に信号処理部38が処理係数列GAを乗算することで、定位成分を強調したステレオ形式の音響信号SOUT(SOUT_L,SOUT_R)が生成される。
【0036】
他方、定位成分が存在しない単位期間では、数式(3)の差成分Sの演算での抑圧量が少ないから、和成分Mのパワー|M[k]|2が差成分Sのパワー|S[k]|2を上回る周波数fkの個数は、定位成分が存在する場合と比較して減少する。すなわち、数式(5A)に代えて数式(5B)でパワーP[k]が設定される周波数fkが増加する。したがって、図3の部分(B)に示すように、定位成分が存在しない場合に算定される処理係数列GAの各係数値g[k]は、周波数軸の全範囲にわたって所定値bに近い数値(ゼロに近い数値)となるように平坦に分布する。
【0037】
ただし、定位成分が存在しない場合でも、和成分Mのパワー|M[k]|2が差成分Sのパワー|S[k]|2を上回る周波数fk(すなわち数式(5A)が適用される周波数fk)は存在し得るから、定位成分が存在しない場合の処理係数列GAの分布には、係数値g[k]が高い数値(数式(5A)で算定される数値)となる局所的なピークpが周波数軸上に点在する。したがって、定位成分が存在しない場合にも処理係数列GAを音響信号SIN(SIN_L,SIN_R)に作用させるとすれば、処理係数列GAのピークpに対応した高強度の成分が音響信号SOUT(SOUT_L,SOUT_R)の時間軸上および周波数軸上に点在して発生し、人工的で耳障りなミュージカルノイズ(ヒュルヒュルという雑音成分)として受聴者に知覚され得るという問題が発生する。なお、定位成分が存在する場合の処理係数列GAにも係数値g[k]の局所的なピークpは発生し得るが、音響信号SOUT(SOUT_L,SOUT_R)に含まれる強調後の定位成分によってマスクされるから(聴覚マスキング効果)、音響信号SOUTの再生音にミュージカルノイズは殆ど知覚されない。
【0038】
以上の傾向を考慮して、第1実施形態では、音響信号SIN(SIN_L,SIN_R)に定位成分が存在する場合には処理係数列GA(図3の部分(A))を信号処理部38での処理に適用する一方、音響信号SINに定位成分が存在しない場合には、図3の部分(C)に示すように、各係数値g[k]の変動(特に局所的なピークp)を抑制した処理係数列GBを信号処理部38での処理に適用する。すなわち、処理係数列GBは、定位成分が存在しない場合に数式(5A)および数式(5B)の減算処理で生成される処理係数列GA(図3の部分(B))と比較して各係数値g[k]の分布が平準な(すなわち変動が抑制された)数値列である。
【0039】
図1の判定部42は、音響信号SIN(SIN_L,SIN_R)における定位成分の有無を判定する。図3の部分(A)と部分(B)とを参照して前述したように、処理係数列GAの係数値g[1]〜g[K]の分布の態様は、定位成分が存在する場合と存在しない場合とで相違する。そこで、判定部42は、以下に例示するように、第1生成部62が生成する処理係数列GAを利用して定位成分の有無を判定する。
【0040】
具体的には、定位成分が存在しない場合(図3の部分(B))には処理係数列GAの多くの係数値g[k]が所定値bの近傍の数値となるのに対し、定位成分が存在する場合(図3の部分(A))には、定位成分に対応する係数値g[k]が所定値bを上回る。したがって、処理係数列GAの係数値g[1]〜g[K]の平均値μは、定位成分が存在する場合のほうが、定位成分が存在しない場合と比較して大きい数値になるという傾向がある。以上の傾向を考慮して、第1実施形態の判定部42は、第1生成部62が生成した処理係数列GAの係数値g[1]〜g[K]の平均値μが所定の閾値μTHを上回る場合には音響信号SINに定位成分が存在すると判定し、平均値μが閾値μTHを下回る場合には音響信号SINに定位成分が存在しないと判定する。定位成分の有無の判定は、例えば単位期間毎に順次に実行される。
【0041】
音響信号SINに定位成分が存在しないと判定部42が判定した場合、第2生成部64は、図3の部分(C)に示すように、K個の係数値g[1]〜g[K]を同一値γに設定した処理係数列GB(すなわち、各係数値g[k]が平準に分布する数値列)を生成する。所定値γは、0以上かつ1以下の範囲内で設定される(0≦γ≦1)。例えば、所定値γは、数式(5B)の係数βに応じた所定値b(例えばγ=b=0.1)に設定される。
【0042】
定位成分が存在すると判定部42が判定した単位期間の周波数スペクトルLAおよび周波数スペクトルRAの各々に対し、信号処理部38は、第1生成部62が生成した処理係数列GAの各係数値g[k]を作用させる。他方、定位成分が存在しないと判定部42が判定した単位期間の周波数スペクトルLAおよび周波数スペクトルRAの各々に対し、信号処理部38は、第2生成部64が生成した処理係数列GBを作用させる。すなわち、処理係数列GBの係数値g[1]〜g[K]は小さい数値に設定されるから、定位成分が存在しない単位期間については、音響信号SOUTの全帯域(f1〜fK)にわたる音量が定位成分の存在時と比較して低下する。
【0043】
以上の形態では、定位成分が存在する場合に、当該定位成分が強調されるように各係数値g[k]を設定した処理係数列GAが信号処理部38での処理に適用され、定位成分が存在しない場合に、各係数値g[k]が平準に分布する処理係数列GBが信号処理部38での処理に適用される。したがって、音響信号SINの定位成分を有効に強調し、かつ、音響信号SOUTのうち定位成分が存在しない各単位期間でのミュージカルノイズを有効に低減することが可能である。
【0044】
<B:第2実施形態>
本発明の第2実施形態を説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
【0045】
第1実施形態の第2生成部64は、係数値g[1]〜g[K]を共通の所定値γに設定した処理係数列GBを生成した。第2実施形態の第2生成部64は、図4に示すように、第1生成部62が生成した処理係数列GAの係数値g[1]〜g[K]の分布を平滑化(ローパスフィルタ処理)することで処理係数列GBを生成する。例えば、処理係数列GBの係数値g[k]は、処理係数列GAのうち係数値g[k]を含む所定個の係数値g[k1]〜g[k2]の平均値に設定される。
【0046】
以上の構成でも第1実施形態と同様の効果が実現される。また、第1実施形態では処理係数列GBの各係数値g[k]が音響信号SINとは無関係の所定値γに設定されるのに対し、第2実施形態では、処理係数列GBにも音響信号SINの特性が反映されるから、聴感的に自然な印象の音響信号SOUTを生成できるという利点もある。
【0047】
<C:変形例>
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
【0048】
(1)変形例1
判定部42が定位成分の有無を判定する方法は任意である。例えば、処理係数列GAの係数値g[1]〜g[K]の散らばりの度合(分散σ2や標準偏差σ)を定位成分の有無の判定に利用する構成が採用される。すなわち、定位成分が存在する場合(図3の部分(A))には処理係数列GAの各係数値g[k]が広範囲に分散するのに対し、定位成分が存在しない場合(図3の部分(B))には処理係数列GAの多くの係数値g[k]が所定値bの近傍に偏在する。そこで、判定部42は、処理係数列GAの係数値g[1]〜g[K]の分散σ2が閾値σTHを上回る場合には定位成分が存在すると判定し、分散σ2が閾値σTHを下回る場合には定位成分が存在しないと判定する。以上の例示における分散σ2を標準偏差σに置換することも可能である。
【0049】
なお、定位成分の有無の判定に処理係数列GAを利用する構成は必須ではない。例えば、定位成分が歌唱音等の音声である場合には、音響信号SINを音声区間(音声が存在する区間)と非音声区間(音声が存在しない区間)とに区分する音声検出技術(VAD:Voice Activity Detection)が定位成分の有無の判定に利用される。すなわち、判定部42は、音響信号SINを音声区間と非音声区間とに区分し、音声区間内の各単位期間については定位成分の存在を肯定するとともに非音声区間内の各単位期間については定位成分の存在を否定する。
【0050】
なお、第1実施形態や第2実施形態のように定位成分の有無の判定に処理係数列GAを利用する場合には、定位成分の有無に関わらず第1生成部62が処理係数列GAを生成する必要がある。他方、音声検出技術を利用した前述の例示のように定位成分の有無の判定に処理係数列GAを利用しない場合には、定位成分が存在すると判定部42が判定した単位期間についてのみ第1生成部62が処理係数列GAを生成し、定位成分が存在しないと判定部42が判定した単位期間については第1生成部62が処理係数列GAを生成しない構成が採用され得る。
【0051】
(2)変形例2
以上の各形態では、定位成分が存在しないと判定部42が判定した場合に第2生成部64が処理係数列GBを生成したが、定位成分の有無に関わらず第2生成部64が処理係数列GBを生成する構成も採用され得る。定位成分が存在しないと判定された場合には前述の各形態と同様に処理係数列GBが信号処理部38での処理に適用され、定位成分が存在すると判定された場合、第2生成部64が生成した処理係数列GBは信号処理部38での処理に適用されずに破棄される。
【0052】
(3)変形例3
以上の各形態では、処理係数列GAおよび処理係数列GBの一方を単位期間毎に選択したが、判定部42による判定の結果が複数の単位期間にわたって維持される場合に、信号処理部38での処理に適用される処理係数列Gを処理係数列GAおよび処理係数列GBの一方から他方に変更する構成も採用され得る。
【0053】
例えば、信号処理部38は、N個(Nは2以上の自然数)の単位期間にわたって連続して定位成分の存在が否定された場合に、数式(1A)および数式(1B)の処理に適用する処理係数列Gを処理係数列GAから処理係数列GBに変更し、N個の単位期間にわたって連続して定位成分の存在が肯定された場合に、処理に適用する処理係数列Gを処理係数列GBから処理係数列GAに変更する。以上の構成によれば、信号処理部38が処理に適用する処理係数列Gを処理係数列GAと処理係数列GBとの間で変更する頻度が減少するから、音響信号SOUTの特性の時間的な変動が緩和される。したがって、聴感的に自然な印象の音響信号SOUTを生成できるという利点がある。なお、処理係数列GBの適用の条件となる単位期間の個数Nは可変に設定され得る。例えば、定位成分が音声である場合、定位成分が存在しないと判定される頻度は音声区間内で減少するから、音声区間内の各単位期間については個数Nを増加させる構成が採用され得る。
【0054】
(4)変形例4
以上の各形態では、数式(3)から理解されるように、音響信号SIN_L(周波数成分LA[k])と音響信号SIN_R(周波数成分RA[k])との振幅の比率が定位変数αに応じて線形に変化するように差成分Sを算定したが、以下の各態様にて例示するように、和成分Mおよび差成分Sの算定の方法や定位変数αとの関係は適宜に変更される。
【0055】
<第1態様>
音響信号SIN_Lのパワー|LA[k]|および音響信号SIN_Rのパワー|RA[k]|から和成分Mおよび差成分Sを算定する構成が採用され得る。具体的には、和成分生成部52は、以下の数式(6A)の演算で和成分M(周波数成分M[1]〜M[K]で構成される複素スペクトル)を生成し、差成分生成部54は、以下の数式(6B)の演算で差成分S(周波数成分S[1]〜S[K]で構成される複素スペクトル)を生成する。したがって、差成分Sにおいては、音響信号SIN_Lおよび音響信号SIN_Rの各々のパワーの比率が定位変数αに応じて線形に変化する。なお、数式(6A)および数式(6B)における記号ejLは周波数スペクトルLAの位相角を意味し、記号ejRは周波数スペクトルRAの位相角を意味する。
【数6】

【0056】
以上の方法で和成分Mおよび差成分Sが生成されると、係数列生成部60の第1生成部62は、定位成分を強調したパワースペクトルP(パワーP[k])を以下の数式(7A)および数式(7B)の演算で生成し、パワースペクトルPを利用した数式(8)の演算で処理係数列Gの各係数値g[k]を算定する。以上の構成でも第1実施形態と同様の効果が実現される。
【数7】

【0057】
<第2態様>
定位成分の位置(方向)を定位変数αの関数f(α)に応じて制御する構成が採用され得る。具体的には、和成分生成部52は、以下の数式(9A)の演算で和成分M(周波数成分M[1]〜M[K])を生成し、差成分生成部54は、以下の数式(9B)の演算で差成分S(周波数成分S[1]〜S[K])を生成する。したがって、差成分Sにおける音響信号SIN_Lおよび音響信号SIN_Rの各々の振幅の比率が定位変数αの関数f(α)に応じて変化する。第1生成部62は、第1実施形態と同様の方法(数式(4),数式(5A),数式(5B))で、数式(9A)の和成分Mと数式(9B)の差成分Sとから処理係数列GAを生成する。
【数8】

【0058】
なお、数式(5A)では和成分Mのパワー|M[k]|と差成分Sのパワー|S[k]|との差分をパワーP[k]として算定したが、以下の数式(5C)に示すように、和成分Mの振幅|M[k]|と差成分Sの振幅|S[k]|との差分を振幅P[k]として算定する構成も採用され得る。数式(5C)で振幅P[k]を算定する構成では、第1生成部62が以下の数式(4C)の演算で処理係数列GAの係数値g[k]を算定する。
【数9】

【0059】
(5)変形例5
以上の各形態では、パワースペクトルの減算(数式(5A),数式(7A))や振幅スペクトルの減算(数式(5C))で処理係数列GAの各係数値g[k]を算定したが、和成分Mと差成分Sとから処理係数列GAを生成する方法は任意である。例えば、和成分Mに含まれる定位成分を信号成分と仮定するとともに差成分Sを雑音成分と仮定すると、和成分Mおよび差成分Sを利用した処理係数列GAの生成には、雑音成分(差成分S)を抑圧して信号成分(定位成分)を強調するための数値列(処理係数列GA)を生成する公知の音声強調の技術を同様に適用することが可能である。
【0060】
処理係数列GAの生成に適用され得る技術としては、ウィナーフィルタ(Wiener filter)を利用した音声強調や、MMSE-STSA法またはMAP(maximum a posteriori estimation)推定法を利用した音声強調の技術が例示され得る。MMSE-STSA法については、Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator", IEEE ASSP, vol.ASSP-32, no.6, p.1109-1121, Dec. 1984に開示され、MAP推定法については、T. Lotter and P. Vary, "Speech enhancement by MAP spectral amplitude estimation using a Super-Gaussian speech model", EURASIP Journal on Applied Signal Processing, vol.2005, no,7, p.1110-1126, July 2005に開示されている。
【0061】
(6)変形例6
処理係数列G(GA,GB)の生成の周期や定位成分の有無の判定の周期は任意である。例えば、単位期間の複数個を周期TAとして係数設定部36が処理係数列Gを生成(更新)する構成も採用され得る。具体的には、各周期TA内の1個以上の単位期間の音響信号SINから生成される処理係数列G(GA,GB)が当該周期TA内の各単位期間の処理に適用される。また、単位期間の複数個を周期として判定部42が定位成分の有無を判定する構成も採用され得る。
【0062】
(7)変形例7
以上の各形態では、音響信号SINの周波数スペクトル(LA,RA)に処理係数列G(GA,GB)を乗算したが、信号処理部38による処理の内容は処理係数列G(GA,GB)の定義や性質に応じて適宜に変更される。例えば、定位成分のパワーが大きい周波数fkほど係数値g[k]が所定の範囲内の小さい数値に設定されるように処理係数列GAを生成し、処理係数列GBの各係数値g[k]を当該範囲内の大きい数値に設定する構成では、処理係数列G(GA,GB)の各係数値g[k]で周波数成分LA[k]や周波数成分RA[k]を除算する構成(LB[k]=LA[k]/g[k],RB[k]=RA[k]/g[k])も採用され得る。
【0063】
(8)変形例8
所定の周波数帯域内の成分に限定して定位成分の強調を実行する構成も好適である。例えば、音響信号SINのうち人間の音声のパワーが集中する周波数帯域(例えば100kHz〜8kHz)についてのみ以上の各形態の処理が実行される(他の帯域については処理せずに再生する)。
【符号の説明】
【0064】
100……音響処理装置、12……信号供給装置、14……放音装置、16……入力装置、22……演算処理装置、24……記憶装置、32……変数設定部、34……周波数分析部、36……係数設定部、38……信号処理部、40……波形合成部、42……判定部、52……和成分生成部、54……差成分生成部、60……係数列生成部、62……第1生成部、64……第2生成部。


【特許請求の範囲】
【請求項1】
ステレオ形式の第1音響信号と第2音響信号との和成分を生成する和成分生成手段と、
特定方向の定位成分を抑圧した差成分を前記第1音響信号と前記第2音響信号との間の減算で生成する差成分生成手段と、
前記定位成分の有無を判定する判定手段と、
前記定位成分が強調されるように周波数毎の係数値が設定された第1処理係数列を、前記和成分と前記差成分との間の減算を含む減算処理で生成する第1生成手段と、
前記定位成分が存在しない場合に前記減算処理で生成される前記第1処理係数列と比較して各周波数の係数値の分布が平準な第2処理係数列を生成する第2生成手段と、
前記第1音響信号および前記第2音響信号の各々の各周波数成分に対し、前記定位成分が存在すると前記判定手段が判定した場合に前記第1処理係数列の各係数値を作用させ、前記定位成分が存在しないと前記判定手段が判定した場合に前記第2処理係数列の各係数値を作用させる信号処理手段と
を具備する音響処理装置。
【請求項2】
前記判定手段は、前記第1生成手段が生成した前記第1処理係数列の複数の係数値の平均値または散らばりの度合が閾値を上回る場合には前記定位成分が存在すると判定し、前記閾値を下回る場合には前記定位成分が存在しないと判定する
請求項1の音響処理装置。
【請求項3】
前記第2生成手段は、前記各係数値を同一値に設定した前記第2処理係数列を生成する
請求項1または請求項2の音響処理装置。
【請求項4】
前記第2生成手段は、前記第1生成手段が生成した前記第1処理係数列の各係数値の分布を平滑化することで前記第2処理係数列を生成する
請求項1または請求項2の音響処理装置。
【請求項5】
前記判定手段は、前記定位成分の有無を単位期間毎に判定し、
前記信号処理手段は、前記定位成分の存在が所定個の単位期間にわたって連続して否定された場合に前記第2処理係数列の適用を開始する
請求項1から請求項4の何れかの音響処理装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2011−199811(P2011−199811A)
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願番号】特願2010−67407(P2010−67407)
【出願日】平成22年3月24日(2010.3.24)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】