リミッタ・コンプレッサ装置
【課題】リミッタ・コンプレッサ装置において、入力音声が単音音声であるか否かにかかわらず、音量調整後の出力音声において、聴感上、一様な音量感を与えることを可能にする。
【解決手段】音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置1であって、入力音声aが単音音声であるか否かを判別する単音判別部5と、単音判別部5からの判別データdに応じて抑圧量を変更しつつ、遅延音声iに抑圧処理を施す係数生成部6及びリミッタ演算部8とを備え、係数生成部等6、8は、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくするリミッタ・コンプレッサ装置1。また、係数生成部等6、8は、単音判別部5からの判別データdに応じて解放量を変更しつつ、入力音声aに解放処理を施すとともに、単音音声に対する解放量を単音音声以外の音声に対する解放量に比して大きくすることができる。
【解決手段】音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置1であって、入力音声aが単音音声であるか否かを判別する単音判別部5と、単音判別部5からの判別データdに応じて抑圧量を変更しつつ、遅延音声iに抑圧処理を施す係数生成部6及びリミッタ演算部8とを備え、係数生成部等6、8は、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくするリミッタ・コンプレッサ装置1。また、係数生成部等6、8は、単音判別部5からの判別データdに応じて解放量を変更しつつ、入力音声aに解放処理を施すとともに、単音音声に対する解放量を単音音声以外の音声に対する解放量に比して大きくすることができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置に関し、特に、音量調整後の出力音声において、音量感にばらつきが生じるのを抑制するリミッタ・コンプレッサ装置に関する。
【背景技術】
【0002】
従来、出力音声のダイナミックレンジを抑圧制御して音量の変化幅を小さくする装置として、ダイナミックレンジ・コンプレッサ(リミッタ・コンプレッサ)が広く用いられている。
【0003】
この種のリミッタ・コンプレッサ装置では、大きな音量の音声が入力されると、音量を小さくして出力するように作用するため、突発的に過大な音声が入力された場合に音量を減衰させて出力することができる。その一方で、小さな音量の音声が入力されたときには、音量を大きくして出力するように作用するため、小さな楽音等がノイズに埋もれてしまうのも回避することができる。
【0004】
ところで、通常、人の聴感は、音声に含まれる中域周波数成分を強く感受する一方で、低域周波数成分や高域周波数成分に対する感度が弱いという特性を有する。このため、人が感じる音の大きさは、音声の音量レベルのみならず、音声の周波数によっても大きく影響を受けることになる。従って、リミッタ・コンプレッサ装置により出力音声の音量調整を行うに際しては、入力音声の大小だけでなく、人の聴感特性にも配慮することが望ましい。
【0005】
そこで、例えば、特許文献1には、入力音声に聴感補正を施し、その聴感補正後の音声データを用いて出力音声の増幅率を算出する音量調整装置が提案されている。この音量調整装置は、人の聴感に対応するラウドネス曲線に応じて入力信号を補正することで、聴感特性に合わせた音声データを生成し、その音声データを用いて増幅率の算出処理を行うように構成されている。
【0006】
【特許文献1】特許第4050289号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかし、人が感じる音の大きさは、上述した聴感特性による違いが生じるだけでなく、音声が単一の音声からなる場合と複数の音声からなる場合とでも違いが生じる。例えば、音声の最大レベルが同一であったとしても、アカペラのボーカル音声と伴奏のあるボーカル音声とでは、前者の方がボーカル音声を聴き取り易く、音量感があるように感じてしまう。
【0008】
このため、上記の音量調整装置のように、聴感補正を行った上で出力音声の増幅率を求めたとしても、単音音声とそれ以外の音声とに同等のレベル制御が行われるため、依然として音量感にばらつきが生じる虞がある。
【0009】
そこで、本発明は、上記従来の技術における問題点に鑑みてなされたものであって、入力音声が単音音声であるか否かにかかわらず、音量調整後の出力音声において、聴感上、一様な音量感を与えることが可能なリミッタ・コンプレッサ装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記目的を達成するため、本発明は、音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置であって、入力音声が単音音声であるか否かを判別する単音判別部と、該単音判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すリミッタ処理部とを備え、該リミッタ処理部は、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくすることを特徴とする。
【0011】
そして、本発明によれば、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくするため、入力音声の最大レベルが等しくても、単音音声は、単音音声以外の音声に比して音量が減衰されて出力される。これにより、両者の音量感のバランスを取ることができ、入力音声が単音音声であるか否かにかかわらず、聴感上、一様な音量感を与えることが可能になる。
【0012】
上記リミッタ・コンプレッサ装置において、前記リミッタ処理部が、前記単音判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、単音音声に対する解放量を単音音声以外の音声に対する解放量に比して大きくすることができる。これによれば、単音音声に対する抑圧量を大きくした場合でも、抑圧後の解放処理において、出力音声のレベルを適切に解放することが可能になる。
【0013】
上記リミッタ・コンプレッサ装置において、前記入力音声の音声モードがモノラル及びステレオのいずれであるかを判別するモード判別部を備え、前記リミッタ処理部が、該モード判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すとともに、モノラルの音声信号に対する抑圧量をステレオの音声信号に対する抑圧量に比して大きくすることができる。これによれば、入力信号の音声モードの違いに応じて抑圧量を変化させるため、音声モードの違いに起因する音量感のばらつきを抑制することが可能になる。
【0014】
上記リミッタ・コンプレッサ装置において、前記リミッタ処理部が、前記モード判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、モノラルの音声信号に対する解放量をステレオの音声信号に対する解放量に比して大きくすることができる。これによれば、モノラル音声に対する抑圧量を大きくした場合でも、抑圧後の解放処理において、出力音声のレベルを適切に解放することが可能になる。
【0015】
上記リミッタ・コンプレッサ装置において、前記入力音声に聴感補正処理を施す聴感補正処理部と、該聴感補正処理部から出力される聴感補正後の音声信号の周波数分布状態を検出する分布検出部とを備え、前記単音判別部が、該分布検出部で検出される周波数分布状態に基づいて前記入力音声が単音音声であるか否かを判別することができる。
【0016】
上記リミッタ・コンプレッサ装置において、前記入力音声の音声レベルを検出するレベル検出部を備え、前記聴感補正処理部は、該レベル検出部の検出結果に応じて聴感補正処理の補正曲線を変化させることができる。これによれば、人の聴感により即した聴感補正処理を施すことができ、聴感上の自然さを高めた音量制御を行うことが可能になる。
【発明の効果】
【0017】
以上のように、本発明によれば、入力音声が単音音声であるか否かにかかわらず、音量調整後の出力音声において、聴感上、一様な音量感を与えることが可能になる。
【発明を実施するための最良の形態】
【0018】
次に、本発明の実施の形態について図面を参照して詳細に説明する。
【0019】
図1は、本発明に係るリミッタ・コンプレッサ装置の第1の実施形態を示し、このリミッタ・コンプレッサ装置1は、聴感補正処理部3と、周波数分布検出部4と、単音判別部5と、係数生成部6と、音声遅延部7と、リミッタ演算部8とを備える。
【0020】
聴感補正処理部3は、人の聴感に対応するラウドネス曲線に応じて、入力された音声信号(以下、「入力音声」という)aを補正し、聴感補正処理を施した音声データ(以下、「補正データ」という)bを出力する。
【0021】
周波数分布検出部4は、聴感補正処理部3から出力される補正データbを周波数分割し、補正データbの周波数成分の分布状態を検出して検出データcを出力する。尚、周波数の分割方法には、LPF(低域通過フィルタ)、BPF(帯域通過フィルタ)及びHPF(高域通過フィルタ)によるフィルタ処理や、FFT(Fast Fourier Transform)処理等を用いることができる。
【0022】
単音判別部5は、周波数分布検出部4からの検出データcに基づき、入力音声aが単一の音声からなる音声信号(以下、「単音信号」という)であるか、それとも、複数の音声が混在して広い周波数帯域に分布する音声信号(以下、「広帯域信号」という)であるかを判別し、判別データdを出力する。
【0023】
係数生成部6は、単音判別部5の判別結果(判別データd)や、補正データbのピークレベルと閾値データthとの対比結果等に応じて、入力音声aに適した係数データhを生成する。ここで、係数データhは、出力音声nのダイナミックレンジを抑圧する際の抑圧度合い(強さ)、又は抑圧後に解放する際の解放度合いを定めるものである。また、閾値データthは、入力音声aに抑圧処理又は解放処理を施すべきか否かを判別するためのものである。
【0024】
音声遅延部7は、入力音声aを遅延させて遅延音声iを出力する。聴感補正処理部3から係数生成部6までの処理回路において、上述の処理を実行する際、ある程度の処理時間を要するため、係数生成部6から係数データhが出力されるタイミングには遅れが生じる。音声遅延部7は、その遅れに合わせて入力信号aを遅延させるものであり、聴感補正処理部3から係数生成部6までの処理回路で要する処理時間の分だけ、入力信号aを遅延させて出力する。
【0025】
リミッタ演算部8は、音声遅延部7からの遅延音声iに対し、係数生成部6で生成された係数データhを用いて抑圧処理及び解放処理を施す。一般に、抑圧量がある一定の量以上(通常は約90%以上)になるまでの時間を抑圧時間(アタック時間)と称し(図2参照)、また、解放量がある一定の量(通常は解放量が90%以上)となるまでの時間を解放時間(リリース時間)と称するが(図3参照)、通常、抑圧時間は、短めに設定され、解放時間は、聴感上の違和感をなくすために長めに設定される。
【0026】
次に、上記のリミッタ・コンプレッサ装置1の動作について、図1〜図11を参照しながら説明する。尚、以下においては、先ず、抑圧処理の際の動作について説明し、その後に、解放処理の際の動作について説明する。
【0027】
入力音声aがリミッタ・コンプレッサ装置1に入力されると、先ず、図1のノード9において、入力音声aを二手に分岐し、図4に示すように、そのうちの一方を音声遅延部7により遅延させる(ステップS1)。それと併行して、聴感補正処理部3において、分岐した入力音声aの他方に聴感補正処理(ラウドネス処理)を施し、中域部を強調した補正データbを生成する(ステップS2)。
【0028】
ここで、中域部を強調するのは、人が感受し易い音域に対し、後段の抑圧制御処理の結果が強く反映されるようにするためである。すなわち、人の聴感上、低域部及び高域部に対する感受性が低く、それらの音域を抑圧制御しても音量感に与える影響が小さいため、逆に、人が感受し易い中域部を強調し、該音域に対する抑圧制御処理の寄与度を高めることで、抑圧制御処理の有無や度合いが音量感の強弱に強く反映されるようにしている。
【0029】
次いで、周波数分布検出部4において、補正データbを対象に周波数分布の検出処理を実行する(ステップS3)。分布検出処理に際しては、図6に示すように、補正データbをs(2以上の自然数)個のバンドに周波数分割し、その後、分割した複数のデータのうちから、最大の音声レベルを有するバンドs1を検出する。
【0030】
そして、図7に示すように、最大の音声レベルを有するバンドs1のデータを基準にレベル差データpを設定し、各バンドのデータの音声レベルがレベル差データpの範囲内に属するか否かを順次判別していく。その際、レベル差データp内に属するバンドに関しては、値「1」を割り当てるとともに、属さないバンドに関しては、値「0」を割り当て、各々、検出データcとして単音判別部5へ出力する。
【0031】
次いで、図4に示すように、単音判別部5において、周波数分布検出4からの検出データcに基づいて単音判定処理を実行する(ステップS4)。この単音判定処理では、検出データcにおいて、複数の「1」が出力され、それらの合計値が所定数(例えば、5〜7)以上である場合に(図7参照)、入力音声aが広帯域音声であると判定する。
【0032】
一方、図8に示すように、検出データcにおいて、「1」の数が単数である場合や、図9に示すように、例えば、2〜4個の「1」が連続的に出力されている場合(隣り合う2〜4個のバンドで値「1」を取り、単音音声であると推認される場合)には、単音音声であると判定する。
【0033】
次に、図4に示すように、係数生成部6において、係数データhを生成する(ステップS5)。係数データhの生成処理にあたっては、図5に示すように、先ず、抑圧フラグの値が「1」であるか否かを判定する(ステップS11)。尚、抑圧フラグは、抑圧動作が継続中であるか否かを示すものであるが、ここでは、抑圧処理は未だ開始されておらず、抑圧フラグの値が「1」でない(ステップS11:No)として説明を進める。
【0034】
次いで、聴感補正処理部3から出力される補正データbのピークレベルの絶対値(以下、「補正ピーク値b’」という)と、図2や図3に示す閾値レベルthとを対比し(ステップS12)、補正ピーク値b’が閾値レベルth以下の場合には(ステップS12:Yes)、係数データhの値を「1」に設定する(ステップS13)。次に、図4に示すように、リミッタ演算部8において、係数データhを用いてリミッタ演算処理を実行する(ステップS6)。
【0035】
上記のリミッタ演算処理は、音声遅延部7からの遅延音声iに係数データhを乗算して出力音声nを生成するものであるが、ここでは、上述のように、係数データhの値が「1」であるため、遅延音声iがそのまま出力音声nとして出力されることになる。このように、補正ピーク値b’が閾値レベルthの範囲内である場合には、遅延音声iに対して何らの処理も施されることなく、原音の状態が維持されて出力される。
【0036】
図5に戻り、係数生成部6での対比の結果、補正ピーク値b’が閾値レベルthより大きい場合には(図5のステップS12:No)、単音判別部5から出力される判別データdを参照し、入力音声aが単音音声であるか、広帯域音声であるかを判別する(ステップS14)。
【0037】
その結果、判別データdが広帯域音声に対応する値を有する場合には(ステップS14:No)、係数データhの値をATK係数kの値に設定し(ステップS15)、リミッタ演算部8に出力する。ここで、ATK係数kは、抑圧操作の際の抑圧の度合い(強さ)を定めるものであり、ATK係数kが小さくなる程、抑圧の度合いが強くなる。尚、ATK係数k自体は、既存のリミッタ・コンプレッサ装置で用いられるものと同様のものであり、閾値レベルthやアタック時間との関係に応じて定められる。
【0038】
次いで、抑圧フラグの値を「1」に設定するとともに(ステップS16)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(ATK係数k)を乗算する(ステップS6)。その結果、図10(A)に示すように、遅延音声iは、ATK係数kに応じた度合いで抑圧され、最終的には、閾値レベルthと略々同程度のレベルにまで抑圧される。
【0039】
図5に戻り、判別データdが単音音声に対応する値を有する場合には(ステップS14:Yes)、ATK係数kに対して抑圧係数fを乗算し、乗算結果を係数データhの値として設定する(ステップS17)。ここで、抑圧係数fは、係数データhの値をATK係数k以下にするためのものであり、1以下(0<f≦1)に設定される。
【0040】
次いで、上記と同様、抑圧フラグの値を「1」に設定するとともに(ステップS16)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(ATK係数k×抑圧係数f)を乗算する(ステップS6)。
【0041】
上述の如く、ここでの係数データhは、ATK係数kに比して小さい値を有するため、遅延音声iには強い抑圧処理が施されることになる。その結果、図10(B)に示すように、遅延音声iに対する抑圧量は、入力音声aが広帯域音声である場合よりも大きくなり、遅延音声iは、閾値レベルthよりも小さい値にまで抑圧される。
【0042】
このように、本実施の形態においては、入力音声aが単音音声であるか否かを判定し、入力音声aが単音音声であった場合には、広帯域音声の場合よりも抑圧量を大きくするため、入力音声aの最大レベルが等しくても、単音音声は、広帯域音声に比して音量が減衰されて出力される。これにより、両者の音量感のバランスを取ることができ、入力音声aが単音音声及び広帯域音声のいずれであっても、聴感上、一様な音量感を与えることが可能になる。
【0043】
尚、単音音声と広帯域音声の間で抑圧量にどの程度の差を設けるかは、抑圧係数fの大きさを増減することで調整することができ、この抑圧係数fの大きさは、装置の設計仕様やユーザの好み等に応じて適宜設定することが可能である。
【0044】
次に、解放処理の際の動作について説明する。
【0045】
上記のようにして抑圧処理が開始された後も、リミッタ・コンプレッサ装置1では、上述のステップS1〜S6(図4参照)の処理を逐次実行し、また、係数生成部6においても、補正ピーク値b’が閾値レベルth以下となるか否かを監視し続ける(図5参照)。尚、抑圧処理が継続されている間は、抑圧フラグの値が「1」に保持されるため、図5の上での係数生成部6の動作は、ステップS11のYesを経た後に、ステップS18の処理に移行することになる。
【0046】
そして、補正ピーク値b’が閾値レベルthより大きい状態が維持されている場合には(ステップS18:No)、出力音声nのダイナミックレンジを抑圧した状態を維持しつつ、補正ピーク値b’の監視を継続する(ステップS19)。
【0047】
これに対し、補正ピーク値b’が閾値レベルth以下となった場合には(ステップS18:Yes)、上記と同様、単音判別部5から出力される判別データdを参照し、入力音声aが単音音声であるか、広帯域音声であるかを判別する(ステップS20)。
【0048】
そして、判別データdが広帯域音声に対応する値を有する場合には(ステップS20:No)、係数データhの値をREL係数mの値に設定し(ステップS21)、リミッタ演算部8に出力する。ここで、REL係数mは、解放操作の際の解放の度合い(強さ)を定めるものであり、ATK係数kと同様、既存のものである。
【0049】
次いで、抑圧フラグの値を「0」に設定するとともに(ステップS22)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(REL係数m)を乗算する(ステップS6)。その結果、図11(A)に示すように、遅延音声iは、REL係数mに応じた度合いで解放される。
【0050】
図5に戻り、判別データdが単音音声に対応する値を有する場合には(ステップS20:Yes)、REL係数mに対して解放係数gを乗算し、乗算結果を係数データhの値として設定する(ステップS23)。ここで、解放係数gは、係数データhの値をREL係数m以上にするためのものであり、1以上(g≧1)に設定される。
【0051】
そして、抑圧フラグの値を「0」に設定するとともに(ステップS22)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(REL係数m×解放係数g)を乗算する(ステップS6)。この際、係数データhは、REL係数mよりも大きい値を有するため、図11(B)に示すように、遅延音声iには、広帯域音声の場合よりも強い解放処理が施される。
【0052】
尚、入力音声aが単音音声である場合と広帯域音声である場合とで解放度合いに差を設けるのは、両者の間において、解放処理を開始する時点での音量レベルにレベル差が生じていることに起因するものである。すなわち、抑圧処理の際に単音音声が広帯域音声に比べて強く抑圧される結果、解放処理を開始する時点でのダイナミックレンジは、広帯域音声に比べて単音音声の方が狭くなる(図11のC、D参照)。そこで、単音音声に対する解放度合いを強め、これにより、解放不足が生じるのを防止するようにしている。
【0053】
次に、本発明に係るリミッタ・コンプレッサ装置の第2の実施形態について、図12及び図13を参照しながら説明する。尚、図12において、図1と同一の構成要素については同一の符号を付し、その説明を省略する。
【0054】
図12に示すように、リミッタ・コンプレッサ装置10は、聴感補正処理部3と、周波数分布検出部4と、単音判別部5と、係数生成部6と、音声遅延部7と、リミッタ演算部8と、音量検出部11とから構成され、音量検出部11を備える点を除き、第1の実施形態に係るリミッタ・コンプレッサ装置1(図1参照)と同様の構成を有する。
【0055】
音量検出部11は、入力音声aの音量レベルを検出し、聴感補正処理部3での補正量を調整するための補正係数qを出力する。一般に、人の聴感は、音声全体の音量レベルが小さくなる程、その音声に含まれる低域周波数成分が聞き取り難くなる特性を有するため、音量検出部11では、図13に示すように、入力音声aの音量レベルが小さくなる程、低域側の利得を増大するように補正係数qを生成する。
【0056】
本実施の形態においては、上記のとおり、音量検出部11で補正係数qを生成した後、聴感補正処理部3において、補正係数qに応じて聴感補正の補正曲線を変更する。このため、聴感補正処理部3では、入力音声aの音量レベルに応じて低域側の利得を変更しながら補正処理が行われる。
【0057】
その結果、音量レベルの小さい入力音声aが入力された場合には、低域部に高い利得が与えられ(図13のE参照)、一方、音量レベルの大きい入力音声aが入力された場合には、低域部に小さい利得が与えられる(図13のF参照)。これにより、人の聴感特性に即した聴感補正処理を施すことができ、聴感上の自然さを高めた音量制御を行うことが可能になる。
【0058】
次に、本発明に係るリミッタ・コンプレッサ装置の第3の実施形態について、図14を参照しながら説明する。尚、図14において、図1と同一の構成要素については同一の符号を付し、その説明を省略する。
【0059】
図14に示すように、リミッタ・コンプレッサ20は、聴感補正処理部3と、周波数分布検出部4と、単音判別部5と、係数生成部6と、音声遅延部7と、リミッタ演算部8と、音声モード判別部21とから構成され、音声モード判別部21を備える点を除き、第1の実施形態に係るリミッタ・コンプレッサ装置1(図1参照)と同様の構成を有する。
【0060】
音声モード判別部21は、入力音声aがモノラル音声であるかステレオ音声であるかを判別し、モードデータrを出力する。この音声モード判別部21では、L、Rチャネルの一方の音声レベルから他方の音声レベルを減算して差分を算出し、その差分値が所定の閾値よりも大きい場合に、入力音声aがステレオ音声であると判断し、逆に、差分値が閾値よりも小さい場合に、モノラル音声であると判断する。
【0061】
尚、入力信号aの音声モードを判別するのは、人の聴感上、モノラル音声をステレオ音声よりも音量感があるように感じるからである。そこで、本実施の形態においては、それらの音量感の違いに合わせて抑圧処理及び解放処理の度合いを制御する。
【0062】
具体的には、上記のとおり、音声モード判別部21でモードデータrを生成した後、係数生成部6において、判別データd(入力音声aが単音音声であるか広帯域音声であるかを示すデータ)に加え、音声モード判別部21からのモードデータrの値も反映させて係数データhを生成する。その結果、リミッタ演算部8においては、表1に示すように、単音音声であるか否かのみならず、音声モードの違いによっても、抑圧量及び解放量が増減される。
【0063】
【表1】
【0064】
尚、表1においては、モノラル出力の広帯域音声よりもステレオ出力の単音音声の抑圧量等を大きくしているが、両者の音量感に大差はないため、それらの抑圧量等を逆転させてもよいし、或いは、同じ抑圧量等に設定してもよい。
【0065】
このように、本実施の形態によれば、入力信号aの音声モードの違いに応じて抑圧量及び解放量を変化させるため、音声モードの違いに起因する音量感のばらつきを抑制することが可能になる。
【0066】
尚、本実施の形態においては、図12に示す音量検出部11に代えて音声モード判別部21を設けるが、音量検出部11及び音声モード判別部21は、必ずしも選択的なものではないため、それらを併用することも可能である。
【図面の簡単な説明】
【0067】
【図1】本発明に係るリミッタ・コンプレッサ装置の第1の実施形態を示す構成図である。
【図2】一般的な抑圧動作を示す図である。
【図3】一般的な解放動作を示す図である。
【図4】図1のリミッタ・コンプレッサの動作を説明する図である。
【図5】図4の係数データの生成処理を説明する図である。
【図6】周波数分割後のレベル分布の一例を示す図である。
【図7】広帯域音声の判別基準を示す図である。
【図8】単音音声の判別基準を示す図である。
【図9】単音音声の判別基準を示す図である。
【図10】抑圧動作を示す図である。
【図11】解放動作を示す図である。
【図12】本発明に係るリミッタ・コンプレッサ装置の第2の実施形態を示す構成図である。
【図13】入力音声のレベルと利得との関係を示す図である。
【図14】本発明に係るリミッタ・コンプレッサ装置の第3の実施形態を示す構成図である。
【符号の説明】
【0068】
1 リミッタ・コンプレッサ装置
3 聴感補正処理部
4 周波数分布検出部
5 単音判別部
6 係数生成部
7 音声遅延部
8 リミッタ演算部
9 ノード
10 リミッタ・コンプレッサ装置
11 音量検出部
20 リミッタ・コンプレッサ装置
21 音声モード判別部
a 入力音声
b 補正データ
b’ 補正ピーク値
c 検出データ
d 判別データ
f 抑圧係数
g 解放係数
h 係数データ
i 遅延音声
k ATK係数
m REL係数
n 出力音声
p レベル差データ
q 補正係数
r モードデータ
th 閾値データ
【技術分野】
【0001】
本発明は、音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置に関し、特に、音量調整後の出力音声において、音量感にばらつきが生じるのを抑制するリミッタ・コンプレッサ装置に関する。
【背景技術】
【0002】
従来、出力音声のダイナミックレンジを抑圧制御して音量の変化幅を小さくする装置として、ダイナミックレンジ・コンプレッサ(リミッタ・コンプレッサ)が広く用いられている。
【0003】
この種のリミッタ・コンプレッサ装置では、大きな音量の音声が入力されると、音量を小さくして出力するように作用するため、突発的に過大な音声が入力された場合に音量を減衰させて出力することができる。その一方で、小さな音量の音声が入力されたときには、音量を大きくして出力するように作用するため、小さな楽音等がノイズに埋もれてしまうのも回避することができる。
【0004】
ところで、通常、人の聴感は、音声に含まれる中域周波数成分を強く感受する一方で、低域周波数成分や高域周波数成分に対する感度が弱いという特性を有する。このため、人が感じる音の大きさは、音声の音量レベルのみならず、音声の周波数によっても大きく影響を受けることになる。従って、リミッタ・コンプレッサ装置により出力音声の音量調整を行うに際しては、入力音声の大小だけでなく、人の聴感特性にも配慮することが望ましい。
【0005】
そこで、例えば、特許文献1には、入力音声に聴感補正を施し、その聴感補正後の音声データを用いて出力音声の増幅率を算出する音量調整装置が提案されている。この音量調整装置は、人の聴感に対応するラウドネス曲線に応じて入力信号を補正することで、聴感特性に合わせた音声データを生成し、その音声データを用いて増幅率の算出処理を行うように構成されている。
【0006】
【特許文献1】特許第4050289号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかし、人が感じる音の大きさは、上述した聴感特性による違いが生じるだけでなく、音声が単一の音声からなる場合と複数の音声からなる場合とでも違いが生じる。例えば、音声の最大レベルが同一であったとしても、アカペラのボーカル音声と伴奏のあるボーカル音声とでは、前者の方がボーカル音声を聴き取り易く、音量感があるように感じてしまう。
【0008】
このため、上記の音量調整装置のように、聴感補正を行った上で出力音声の増幅率を求めたとしても、単音音声とそれ以外の音声とに同等のレベル制御が行われるため、依然として音量感にばらつきが生じる虞がある。
【0009】
そこで、本発明は、上記従来の技術における問題点に鑑みてなされたものであって、入力音声が単音音声であるか否かにかかわらず、音量調整後の出力音声において、聴感上、一様な音量感を与えることが可能なリミッタ・コンプレッサ装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記目的を達成するため、本発明は、音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置であって、入力音声が単音音声であるか否かを判別する単音判別部と、該単音判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すリミッタ処理部とを備え、該リミッタ処理部は、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくすることを特徴とする。
【0011】
そして、本発明によれば、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくするため、入力音声の最大レベルが等しくても、単音音声は、単音音声以外の音声に比して音量が減衰されて出力される。これにより、両者の音量感のバランスを取ることができ、入力音声が単音音声であるか否かにかかわらず、聴感上、一様な音量感を与えることが可能になる。
【0012】
上記リミッタ・コンプレッサ装置において、前記リミッタ処理部が、前記単音判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、単音音声に対する解放量を単音音声以外の音声に対する解放量に比して大きくすることができる。これによれば、単音音声に対する抑圧量を大きくした場合でも、抑圧後の解放処理において、出力音声のレベルを適切に解放することが可能になる。
【0013】
上記リミッタ・コンプレッサ装置において、前記入力音声の音声モードがモノラル及びステレオのいずれであるかを判別するモード判別部を備え、前記リミッタ処理部が、該モード判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すとともに、モノラルの音声信号に対する抑圧量をステレオの音声信号に対する抑圧量に比して大きくすることができる。これによれば、入力信号の音声モードの違いに応じて抑圧量を変化させるため、音声モードの違いに起因する音量感のばらつきを抑制することが可能になる。
【0014】
上記リミッタ・コンプレッサ装置において、前記リミッタ処理部が、前記モード判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、モノラルの音声信号に対する解放量をステレオの音声信号に対する解放量に比して大きくすることができる。これによれば、モノラル音声に対する抑圧量を大きくした場合でも、抑圧後の解放処理において、出力音声のレベルを適切に解放することが可能になる。
【0015】
上記リミッタ・コンプレッサ装置において、前記入力音声に聴感補正処理を施す聴感補正処理部と、該聴感補正処理部から出力される聴感補正後の音声信号の周波数分布状態を検出する分布検出部とを備え、前記単音判別部が、該分布検出部で検出される周波数分布状態に基づいて前記入力音声が単音音声であるか否かを判別することができる。
【0016】
上記リミッタ・コンプレッサ装置において、前記入力音声の音声レベルを検出するレベル検出部を備え、前記聴感補正処理部は、該レベル検出部の検出結果に応じて聴感補正処理の補正曲線を変化させることができる。これによれば、人の聴感により即した聴感補正処理を施すことができ、聴感上の自然さを高めた音量制御を行うことが可能になる。
【発明の効果】
【0017】
以上のように、本発明によれば、入力音声が単音音声であるか否かにかかわらず、音量調整後の出力音声において、聴感上、一様な音量感を与えることが可能になる。
【発明を実施するための最良の形態】
【0018】
次に、本発明の実施の形態について図面を参照して詳細に説明する。
【0019】
図1は、本発明に係るリミッタ・コンプレッサ装置の第1の実施形態を示し、このリミッタ・コンプレッサ装置1は、聴感補正処理部3と、周波数分布検出部4と、単音判別部5と、係数生成部6と、音声遅延部7と、リミッタ演算部8とを備える。
【0020】
聴感補正処理部3は、人の聴感に対応するラウドネス曲線に応じて、入力された音声信号(以下、「入力音声」という)aを補正し、聴感補正処理を施した音声データ(以下、「補正データ」という)bを出力する。
【0021】
周波数分布検出部4は、聴感補正処理部3から出力される補正データbを周波数分割し、補正データbの周波数成分の分布状態を検出して検出データcを出力する。尚、周波数の分割方法には、LPF(低域通過フィルタ)、BPF(帯域通過フィルタ)及びHPF(高域通過フィルタ)によるフィルタ処理や、FFT(Fast Fourier Transform)処理等を用いることができる。
【0022】
単音判別部5は、周波数分布検出部4からの検出データcに基づき、入力音声aが単一の音声からなる音声信号(以下、「単音信号」という)であるか、それとも、複数の音声が混在して広い周波数帯域に分布する音声信号(以下、「広帯域信号」という)であるかを判別し、判別データdを出力する。
【0023】
係数生成部6は、単音判別部5の判別結果(判別データd)や、補正データbのピークレベルと閾値データthとの対比結果等に応じて、入力音声aに適した係数データhを生成する。ここで、係数データhは、出力音声nのダイナミックレンジを抑圧する際の抑圧度合い(強さ)、又は抑圧後に解放する際の解放度合いを定めるものである。また、閾値データthは、入力音声aに抑圧処理又は解放処理を施すべきか否かを判別するためのものである。
【0024】
音声遅延部7は、入力音声aを遅延させて遅延音声iを出力する。聴感補正処理部3から係数生成部6までの処理回路において、上述の処理を実行する際、ある程度の処理時間を要するため、係数生成部6から係数データhが出力されるタイミングには遅れが生じる。音声遅延部7は、その遅れに合わせて入力信号aを遅延させるものであり、聴感補正処理部3から係数生成部6までの処理回路で要する処理時間の分だけ、入力信号aを遅延させて出力する。
【0025】
リミッタ演算部8は、音声遅延部7からの遅延音声iに対し、係数生成部6で生成された係数データhを用いて抑圧処理及び解放処理を施す。一般に、抑圧量がある一定の量以上(通常は約90%以上)になるまでの時間を抑圧時間(アタック時間)と称し(図2参照)、また、解放量がある一定の量(通常は解放量が90%以上)となるまでの時間を解放時間(リリース時間)と称するが(図3参照)、通常、抑圧時間は、短めに設定され、解放時間は、聴感上の違和感をなくすために長めに設定される。
【0026】
次に、上記のリミッタ・コンプレッサ装置1の動作について、図1〜図11を参照しながら説明する。尚、以下においては、先ず、抑圧処理の際の動作について説明し、その後に、解放処理の際の動作について説明する。
【0027】
入力音声aがリミッタ・コンプレッサ装置1に入力されると、先ず、図1のノード9において、入力音声aを二手に分岐し、図4に示すように、そのうちの一方を音声遅延部7により遅延させる(ステップS1)。それと併行して、聴感補正処理部3において、分岐した入力音声aの他方に聴感補正処理(ラウドネス処理)を施し、中域部を強調した補正データbを生成する(ステップS2)。
【0028】
ここで、中域部を強調するのは、人が感受し易い音域に対し、後段の抑圧制御処理の結果が強く反映されるようにするためである。すなわち、人の聴感上、低域部及び高域部に対する感受性が低く、それらの音域を抑圧制御しても音量感に与える影響が小さいため、逆に、人が感受し易い中域部を強調し、該音域に対する抑圧制御処理の寄与度を高めることで、抑圧制御処理の有無や度合いが音量感の強弱に強く反映されるようにしている。
【0029】
次いで、周波数分布検出部4において、補正データbを対象に周波数分布の検出処理を実行する(ステップS3)。分布検出処理に際しては、図6に示すように、補正データbをs(2以上の自然数)個のバンドに周波数分割し、その後、分割した複数のデータのうちから、最大の音声レベルを有するバンドs1を検出する。
【0030】
そして、図7に示すように、最大の音声レベルを有するバンドs1のデータを基準にレベル差データpを設定し、各バンドのデータの音声レベルがレベル差データpの範囲内に属するか否かを順次判別していく。その際、レベル差データp内に属するバンドに関しては、値「1」を割り当てるとともに、属さないバンドに関しては、値「0」を割り当て、各々、検出データcとして単音判別部5へ出力する。
【0031】
次いで、図4に示すように、単音判別部5において、周波数分布検出4からの検出データcに基づいて単音判定処理を実行する(ステップS4)。この単音判定処理では、検出データcにおいて、複数の「1」が出力され、それらの合計値が所定数(例えば、5〜7)以上である場合に(図7参照)、入力音声aが広帯域音声であると判定する。
【0032】
一方、図8に示すように、検出データcにおいて、「1」の数が単数である場合や、図9に示すように、例えば、2〜4個の「1」が連続的に出力されている場合(隣り合う2〜4個のバンドで値「1」を取り、単音音声であると推認される場合)には、単音音声であると判定する。
【0033】
次に、図4に示すように、係数生成部6において、係数データhを生成する(ステップS5)。係数データhの生成処理にあたっては、図5に示すように、先ず、抑圧フラグの値が「1」であるか否かを判定する(ステップS11)。尚、抑圧フラグは、抑圧動作が継続中であるか否かを示すものであるが、ここでは、抑圧処理は未だ開始されておらず、抑圧フラグの値が「1」でない(ステップS11:No)として説明を進める。
【0034】
次いで、聴感補正処理部3から出力される補正データbのピークレベルの絶対値(以下、「補正ピーク値b’」という)と、図2や図3に示す閾値レベルthとを対比し(ステップS12)、補正ピーク値b’が閾値レベルth以下の場合には(ステップS12:Yes)、係数データhの値を「1」に設定する(ステップS13)。次に、図4に示すように、リミッタ演算部8において、係数データhを用いてリミッタ演算処理を実行する(ステップS6)。
【0035】
上記のリミッタ演算処理は、音声遅延部7からの遅延音声iに係数データhを乗算して出力音声nを生成するものであるが、ここでは、上述のように、係数データhの値が「1」であるため、遅延音声iがそのまま出力音声nとして出力されることになる。このように、補正ピーク値b’が閾値レベルthの範囲内である場合には、遅延音声iに対して何らの処理も施されることなく、原音の状態が維持されて出力される。
【0036】
図5に戻り、係数生成部6での対比の結果、補正ピーク値b’が閾値レベルthより大きい場合には(図5のステップS12:No)、単音判別部5から出力される判別データdを参照し、入力音声aが単音音声であるか、広帯域音声であるかを判別する(ステップS14)。
【0037】
その結果、判別データdが広帯域音声に対応する値を有する場合には(ステップS14:No)、係数データhの値をATK係数kの値に設定し(ステップS15)、リミッタ演算部8に出力する。ここで、ATK係数kは、抑圧操作の際の抑圧の度合い(強さ)を定めるものであり、ATK係数kが小さくなる程、抑圧の度合いが強くなる。尚、ATK係数k自体は、既存のリミッタ・コンプレッサ装置で用いられるものと同様のものであり、閾値レベルthやアタック時間との関係に応じて定められる。
【0038】
次いで、抑圧フラグの値を「1」に設定するとともに(ステップS16)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(ATK係数k)を乗算する(ステップS6)。その結果、図10(A)に示すように、遅延音声iは、ATK係数kに応じた度合いで抑圧され、最終的には、閾値レベルthと略々同程度のレベルにまで抑圧される。
【0039】
図5に戻り、判別データdが単音音声に対応する値を有する場合には(ステップS14:Yes)、ATK係数kに対して抑圧係数fを乗算し、乗算結果を係数データhの値として設定する(ステップS17)。ここで、抑圧係数fは、係数データhの値をATK係数k以下にするためのものであり、1以下(0<f≦1)に設定される。
【0040】
次いで、上記と同様、抑圧フラグの値を「1」に設定するとともに(ステップS16)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(ATK係数k×抑圧係数f)を乗算する(ステップS6)。
【0041】
上述の如く、ここでの係数データhは、ATK係数kに比して小さい値を有するため、遅延音声iには強い抑圧処理が施されることになる。その結果、図10(B)に示すように、遅延音声iに対する抑圧量は、入力音声aが広帯域音声である場合よりも大きくなり、遅延音声iは、閾値レベルthよりも小さい値にまで抑圧される。
【0042】
このように、本実施の形態においては、入力音声aが単音音声であるか否かを判定し、入力音声aが単音音声であった場合には、広帯域音声の場合よりも抑圧量を大きくするため、入力音声aの最大レベルが等しくても、単音音声は、広帯域音声に比して音量が減衰されて出力される。これにより、両者の音量感のバランスを取ることができ、入力音声aが単音音声及び広帯域音声のいずれであっても、聴感上、一様な音量感を与えることが可能になる。
【0043】
尚、単音音声と広帯域音声の間で抑圧量にどの程度の差を設けるかは、抑圧係数fの大きさを増減することで調整することができ、この抑圧係数fの大きさは、装置の設計仕様やユーザの好み等に応じて適宜設定することが可能である。
【0044】
次に、解放処理の際の動作について説明する。
【0045】
上記のようにして抑圧処理が開始された後も、リミッタ・コンプレッサ装置1では、上述のステップS1〜S6(図4参照)の処理を逐次実行し、また、係数生成部6においても、補正ピーク値b’が閾値レベルth以下となるか否かを監視し続ける(図5参照)。尚、抑圧処理が継続されている間は、抑圧フラグの値が「1」に保持されるため、図5の上での係数生成部6の動作は、ステップS11のYesを経た後に、ステップS18の処理に移行することになる。
【0046】
そして、補正ピーク値b’が閾値レベルthより大きい状態が維持されている場合には(ステップS18:No)、出力音声nのダイナミックレンジを抑圧した状態を維持しつつ、補正ピーク値b’の監視を継続する(ステップS19)。
【0047】
これに対し、補正ピーク値b’が閾値レベルth以下となった場合には(ステップS18:Yes)、上記と同様、単音判別部5から出力される判別データdを参照し、入力音声aが単音音声であるか、広帯域音声であるかを判別する(ステップS20)。
【0048】
そして、判別データdが広帯域音声に対応する値を有する場合には(ステップS20:No)、係数データhの値をREL係数mの値に設定し(ステップS21)、リミッタ演算部8に出力する。ここで、REL係数mは、解放操作の際の解放の度合い(強さ)を定めるものであり、ATK係数kと同様、既存のものである。
【0049】
次いで、抑圧フラグの値を「0」に設定するとともに(ステップS22)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(REL係数m)を乗算する(ステップS6)。その結果、図11(A)に示すように、遅延音声iは、REL係数mに応じた度合いで解放される。
【0050】
図5に戻り、判別データdが単音音声に対応する値を有する場合には(ステップS20:Yes)、REL係数mに対して解放係数gを乗算し、乗算結果を係数データhの値として設定する(ステップS23)。ここで、解放係数gは、係数データhの値をREL係数m以上にするためのものであり、1以上(g≧1)に設定される。
【0051】
そして、抑圧フラグの値を「0」に設定するとともに(ステップS22)、図4に示すように、リミッタ演算部8において、遅延音声iに対して係数データh(REL係数m×解放係数g)を乗算する(ステップS6)。この際、係数データhは、REL係数mよりも大きい値を有するため、図11(B)に示すように、遅延音声iには、広帯域音声の場合よりも強い解放処理が施される。
【0052】
尚、入力音声aが単音音声である場合と広帯域音声である場合とで解放度合いに差を設けるのは、両者の間において、解放処理を開始する時点での音量レベルにレベル差が生じていることに起因するものである。すなわち、抑圧処理の際に単音音声が広帯域音声に比べて強く抑圧される結果、解放処理を開始する時点でのダイナミックレンジは、広帯域音声に比べて単音音声の方が狭くなる(図11のC、D参照)。そこで、単音音声に対する解放度合いを強め、これにより、解放不足が生じるのを防止するようにしている。
【0053】
次に、本発明に係るリミッタ・コンプレッサ装置の第2の実施形態について、図12及び図13を参照しながら説明する。尚、図12において、図1と同一の構成要素については同一の符号を付し、その説明を省略する。
【0054】
図12に示すように、リミッタ・コンプレッサ装置10は、聴感補正処理部3と、周波数分布検出部4と、単音判別部5と、係数生成部6と、音声遅延部7と、リミッタ演算部8と、音量検出部11とから構成され、音量検出部11を備える点を除き、第1の実施形態に係るリミッタ・コンプレッサ装置1(図1参照)と同様の構成を有する。
【0055】
音量検出部11は、入力音声aの音量レベルを検出し、聴感補正処理部3での補正量を調整するための補正係数qを出力する。一般に、人の聴感は、音声全体の音量レベルが小さくなる程、その音声に含まれる低域周波数成分が聞き取り難くなる特性を有するため、音量検出部11では、図13に示すように、入力音声aの音量レベルが小さくなる程、低域側の利得を増大するように補正係数qを生成する。
【0056】
本実施の形態においては、上記のとおり、音量検出部11で補正係数qを生成した後、聴感補正処理部3において、補正係数qに応じて聴感補正の補正曲線を変更する。このため、聴感補正処理部3では、入力音声aの音量レベルに応じて低域側の利得を変更しながら補正処理が行われる。
【0057】
その結果、音量レベルの小さい入力音声aが入力された場合には、低域部に高い利得が与えられ(図13のE参照)、一方、音量レベルの大きい入力音声aが入力された場合には、低域部に小さい利得が与えられる(図13のF参照)。これにより、人の聴感特性に即した聴感補正処理を施すことができ、聴感上の自然さを高めた音量制御を行うことが可能になる。
【0058】
次に、本発明に係るリミッタ・コンプレッサ装置の第3の実施形態について、図14を参照しながら説明する。尚、図14において、図1と同一の構成要素については同一の符号を付し、その説明を省略する。
【0059】
図14に示すように、リミッタ・コンプレッサ20は、聴感補正処理部3と、周波数分布検出部4と、単音判別部5と、係数生成部6と、音声遅延部7と、リミッタ演算部8と、音声モード判別部21とから構成され、音声モード判別部21を備える点を除き、第1の実施形態に係るリミッタ・コンプレッサ装置1(図1参照)と同様の構成を有する。
【0060】
音声モード判別部21は、入力音声aがモノラル音声であるかステレオ音声であるかを判別し、モードデータrを出力する。この音声モード判別部21では、L、Rチャネルの一方の音声レベルから他方の音声レベルを減算して差分を算出し、その差分値が所定の閾値よりも大きい場合に、入力音声aがステレオ音声であると判断し、逆に、差分値が閾値よりも小さい場合に、モノラル音声であると判断する。
【0061】
尚、入力信号aの音声モードを判別するのは、人の聴感上、モノラル音声をステレオ音声よりも音量感があるように感じるからである。そこで、本実施の形態においては、それらの音量感の違いに合わせて抑圧処理及び解放処理の度合いを制御する。
【0062】
具体的には、上記のとおり、音声モード判別部21でモードデータrを生成した後、係数生成部6において、判別データd(入力音声aが単音音声であるか広帯域音声であるかを示すデータ)に加え、音声モード判別部21からのモードデータrの値も反映させて係数データhを生成する。その結果、リミッタ演算部8においては、表1に示すように、単音音声であるか否かのみならず、音声モードの違いによっても、抑圧量及び解放量が増減される。
【0063】
【表1】
【0064】
尚、表1においては、モノラル出力の広帯域音声よりもステレオ出力の単音音声の抑圧量等を大きくしているが、両者の音量感に大差はないため、それらの抑圧量等を逆転させてもよいし、或いは、同じ抑圧量等に設定してもよい。
【0065】
このように、本実施の形態によれば、入力信号aの音声モードの違いに応じて抑圧量及び解放量を変化させるため、音声モードの違いに起因する音量感のばらつきを抑制することが可能になる。
【0066】
尚、本実施の形態においては、図12に示す音量検出部11に代えて音声モード判別部21を設けるが、音量検出部11及び音声モード判別部21は、必ずしも選択的なものではないため、それらを併用することも可能である。
【図面の簡単な説明】
【0067】
【図1】本発明に係るリミッタ・コンプレッサ装置の第1の実施形態を示す構成図である。
【図2】一般的な抑圧動作を示す図である。
【図3】一般的な解放動作を示す図である。
【図4】図1のリミッタ・コンプレッサの動作を説明する図である。
【図5】図4の係数データの生成処理を説明する図である。
【図6】周波数分割後のレベル分布の一例を示す図である。
【図7】広帯域音声の判別基準を示す図である。
【図8】単音音声の判別基準を示す図である。
【図9】単音音声の判別基準を示す図である。
【図10】抑圧動作を示す図である。
【図11】解放動作を示す図である。
【図12】本発明に係るリミッタ・コンプレッサ装置の第2の実施形態を示す構成図である。
【図13】入力音声のレベルと利得との関係を示す図である。
【図14】本発明に係るリミッタ・コンプレッサ装置の第3の実施形態を示す構成図である。
【符号の説明】
【0068】
1 リミッタ・コンプレッサ装置
3 聴感補正処理部
4 周波数分布検出部
5 単音判別部
6 係数生成部
7 音声遅延部
8 リミッタ演算部
9 ノード
10 リミッタ・コンプレッサ装置
11 音量検出部
20 リミッタ・コンプレッサ装置
21 音声モード判別部
a 入力音声
b 補正データ
b’ 補正ピーク値
c 検出データ
d 判別データ
f 抑圧係数
g 解放係数
h 係数データ
i 遅延音声
k ATK係数
m REL係数
n 出力音声
p レベル差データ
q 補正係数
r モードデータ
th 閾値データ
【特許請求の範囲】
【請求項1】
音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置であって、
入力音声が単音音声であるか否かを判別する単音判別部と、
該単音判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すリミッタ処理部とを備え、
該リミッタ処理部は、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくすることを特徴とするリミッタ・コンプレッサ装置。
【請求項2】
前記リミッタ処理部は、前記単音判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、単音音声に対する解放量を単音音声以外の音声に対する解放量に比して大きくすることを特徴とする請求項1に記載のリミッタ・コンプレッサ装置。
【請求項3】
前記入力音声の音声モードがモノラル及びステレオのいずれであるかを判別するモード判別部を備え、
前記リミッタ処理部は、該モード判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すとともに、モノラルの音声信号に対する抑圧量をステレオの音声信号に対する抑圧量に比して大きくすることを特徴とする請求項1又は2に記載のリミッタ・コンプレッサ装置。
【請求項4】
前記リミッタ処理部は、前記モード判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、モノラルの音声信号に対する解放量をステレオの音声信号に対する解放量に比して大きくすることを特徴とする請求項3に記載のリミッタ・コンプレッサ装置。
【請求項5】
前記入力音声に聴感補正処理を施す聴感補正処理部と、
該聴感補正処理部から出力される聴感補正後の音声信号の周波数分布状態を検出する分布検出部とを備え、
前記単音判別部は、該分布検出部で検出される周波数分布状態に基づいて前記入力音声が単音音声であるか否かを判別することを特徴とする請求項1乃至4のいずれかに記載のリミッタ・コンプレッサ装置。
【請求項6】
前記入力音声の音声レベルを検出するレベル検出部を備え、
前記聴感補正処理部は、該レベル検出部の検出結果に応じて聴感補正処理の補正曲線を変化させることを特徴とする請求項5に記載のリミッタ・コンプレッサ装置。
【請求項1】
音声信号のダイナミックレンジを抑圧制御するリミッタ・コンプレッサ装置であって、
入力音声が単音音声であるか否かを判別する単音判別部と、
該単音判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すリミッタ処理部とを備え、
該リミッタ処理部は、単音音声に対する抑圧量を単音音声以外の音声に対する抑圧量に比して大きくすることを特徴とするリミッタ・コンプレッサ装置。
【請求項2】
前記リミッタ処理部は、前記単音判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、単音音声に対する解放量を単音音声以外の音声に対する解放量に比して大きくすることを特徴とする請求項1に記載のリミッタ・コンプレッサ装置。
【請求項3】
前記入力音声の音声モードがモノラル及びステレオのいずれであるかを判別するモード判別部を備え、
前記リミッタ処理部は、該モード判別部の判別結果に応じて抑圧量を変更しつつ前記入力音声に抑圧処理を施すとともに、モノラルの音声信号に対する抑圧量をステレオの音声信号に対する抑圧量に比して大きくすることを特徴とする請求項1又は2に記載のリミッタ・コンプレッサ装置。
【請求項4】
前記リミッタ処理部は、前記モード判別部の判別結果に応じて解放量を変更しつつ前記入力音声に解放処理を施すとともに、モノラルの音声信号に対する解放量をステレオの音声信号に対する解放量に比して大きくすることを特徴とする請求項3に記載のリミッタ・コンプレッサ装置。
【請求項5】
前記入力音声に聴感補正処理を施す聴感補正処理部と、
該聴感補正処理部から出力される聴感補正後の音声信号の周波数分布状態を検出する分布検出部とを備え、
前記単音判別部は、該分布検出部で検出される周波数分布状態に基づいて前記入力音声が単音音声であるか否かを判別することを特徴とする請求項1乃至4のいずれかに記載のリミッタ・コンプレッサ装置。
【請求項6】
前記入力音声の音声レベルを検出するレベル検出部を備え、
前記聴感補正処理部は、該レベル検出部の検出結果に応じて聴感補正処理の補正曲線を変化させることを特徴とする請求項5に記載のリミッタ・コンプレッサ装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2009−272926(P2009−272926A)
【公開日】平成21年11月19日(2009.11.19)
【国際特許分類】
【出願番号】特願2008−122145(P2008−122145)
【出願日】平成20年5月8日(2008.5.8)
【出願人】(303013763)NECエンジニアリング株式会社 (651)
【Fターム(参考)】
【公開日】平成21年11月19日(2009.11.19)
【国際特許分類】
【出願日】平成20年5月8日(2008.5.8)
【出願人】(303013763)NECエンジニアリング株式会社 (651)
【Fターム(参考)】
[ Back to top ]