説明

符号化装置、符号化方法、およびプログラム

【課題】所定の帯域にノイズを含むオーディオ信号を精度良く符号化することができるようにする。
【解決手段】ノイズ検出部51は、オーディオ信号に基づいてPDM信号特有のノイズを検出する。ゲイン調整部52は、PDM信号特有のノイズが検出された場合、オーディオ信号の可聴帯域外の高域成分が減衰するように、オーディオ信号のゲイン調整を行う。ビット配分計算部13は、ゲイン調整後のオーディオ信号の正規化情報idsfに基づいて、正規化周波数スペクトルnspecに配分するビット量を計算する。量子化部14は、そのビット量を表す量子化情報idwlに基づいて、正規化周波数スペクトルnspecを量子化する。本発明は、例えば、オーディオ符号化装置に適用することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化装置、符号化方法、およびプログラムに関し、特に、所定の帯域にノイズを含むオーディオ信号を精度良く符号化することができるようにした符号化装置、符号化方法、およびプログラムに関する。
【背景技術】
【0002】
従来、オーディオ信号の符号化方法として、オーディオ信号を時間周波数変換し、得られた周波数スペクトルに対して正規化および量子化を行う方法が知られている(例えば、特許文献1参照)。
【0003】
図1は、このような符号化方法で符号化を行うオーディオ符号化装置の構成の一例を示すブロック図である。
【0004】
図1のオーディオ符号化装置10は、時間周波数変換部11、正規化部12、ビット配分計算部13、量子化部14、および符号列符号化部15により構成される。オーディオ符号化装置10は、時系列信号として入力されるオーディオ信号を符号化し、符号列を出力する。
【0005】
具体的には、オーディオ符号化装置10の時間周波数変換部11は、時系列信号として入力されるオーディオ信号に対して時間周波数変換を行い、周波数スペクトルmdspecを出力する。例えば、時間周波数変換部11は、2Nサンプルの時系列信号に対してMDCT(Modified Discrete Cosine Transform)等の直交変換を用いて時間周波数変換を行い、その結果得られるN個のMDCT係数を周波数スペクトルmdspecとして出力する。
【0006】
正規化部12は、時間周波数変換部11から出力される周波数スペクトルmdspecに対して、所定の処理単位ごとに、周波数スペクトルmdspecの振幅に応じた正規化係数を用いて正規化を行う。正規化部12は、その正規化係数に対応する整数の情報である正規化情報idsfと、正規化後の周波数スペクトルmdspecである正規化周波数スペクトルnspecとを出力する。
【0007】
ビット配分計算部13は、正規化部12から出力される正規化情報idsf等に基づいて、所定の処理単位ごとに、正規化周波数スペクトルnspecに配分するビット量を計算するビット配分計算を行い、そのビット量を表す量子化情報idwlを出力する。また、ビット配分計算部13は、正規化部12から出力される正規化情報idsfを出力する。
【0008】
量子化部14は、ビット配分計算部13から出力される量子化情報idwlに基づいて、正規化部12から出力される正規化周波数スペクトルnspecを量子化する。具体的には、量子化部14は、正規化周波数スペクトルnspecに対して、所定の処理単位ごとに、量子化情報idwlに対応した量子化係数を用いて量子化を行う。量子化部14は、その結果得られる量子化周波数スペクトルqspecを出力する。
【0009】
符号列符号化部15は、ビット配分計算部13から出力される正規化情報idsfおよび量子化情報idwl、並びに、量子化部14から出力される量子化周波数スペクトルqspecを符号化し、その結果得られる符号列を出力する。出力された符号列は、例えば、他の装置に伝送されたり、所定の記録媒体に記録されたりする。
【0010】
また近年、オーディオ符号化装置において扱われるオーディオ信号は、従来のサンプリング周波数44.1kHz/PCM(Pulse Code Modulation)語長16bitや周波数48kHz/PCM語長16bitのPCM信号から、周波数96kHz/PCM語長24bitや周波数192kHz/PCM語長24bitといったより高品位なマルチbit PCM信号へと拡大している。
【0011】
このような高品位なマルチbit PCM信号は、当初からマルチbit PCM信号として作成されるのではなく、DSD(Direct Stream Digital)信号等のPDM(Pulse Density Modulation)信号をソースとして作成される場合が非常に多い。
【0012】
その理由は、近年、アナログオーディオ信号をデジタルオーディオ信号に変換する際に使用されるA/D変換器において、従来の逐次比較型A/D変換器からデルタシグマ型A/D変換器への置換が急速に進んでいるためである。
【0013】
より詳細には、従来の逐次比較型A/D変換器では、直接マルチbit PCM信号を生成することができるが、変換精度は素子精度の制約を大きく受けるため、PCM語長が24bit以上と大きくなるとA/D変換における線形性の確保が困難である。これに対して、デルタシグマ型A/D変換器では、変換精度が素子精度の制約を受けず、特に1bit型のデルタシグマ型A/D変換器では、単一の閾値で高精度なA/D変換が容易に可能である。このような背景から、A/D変換器としては、従来の逐次比較型A/D変換器に代わり、デルタシグマ型A/D変換器が広く使用されるようになっている。
【0014】
図2は、1bit型のデルタシグマ型A/D変換器の入力信号および出力信号を示す図である。図2に示すように、1bit型のデルタシグマ型A/D変換器では、入力信号としてのアナログオーディオ信号が、その振幅が+1の時間的密度で表された1ビットのPDM信号に変換され、出力信号とされる。
【0015】
図3は、デルタシグマ型A/D変換器における量子化ノイズを示す図である。図3に示すように、まず、デルタシグマ型A/D変換器では、オーバーサンプリングによって、可聴帯域(図3の例では、0乃至fs/2)に存在する量子化ノイズが広帯域(図3の例では、0乃至nfs/2)に分散される。次に、ノイズシェーピングによって量子化ノイズが可聴帯域外にシフトされる。以上により、デルタシグマ型A/D変換器では、可聴帯域において高いS/N(signal/noise)を実現することができる。
【0016】
上述したように、高品位なマルチbit PCM信号のソースが、デルタシグマ型A/D変換器によって得られたPDM信号である場合、マルチbit PCM信号は、このPDM信号をLPF(Low Pass Filter)処理することにより生成される。
【0017】
このようにして得られるマルチbit PCM信号は、図4に示すように、デジタルシグマ型A/D変換器による量子化ノイズ、即ちPDM信号特有のノイズを可聴帯域外に多く含むことになる。この量子化ノイズは、マルチbit PCM信号に不要なノイズである。
【先行技術文献】
【特許文献】
【0018】
【特許文献1】特開2006−11170号公報
【発明の概要】
【発明が解決しようとする課題】
【0019】
しかしながら、図1のオーディオ符号化装置10では、入力されたオーディオ信号そのものの正規化情報idsfに基づいてビット配分計算が行われるので、上述したマルチbit PCM信号が入力される場合、不要な量子化ノイズを含む可聴帯域外の正規化周波数スペクトルnspecに対して多くのビットが割り当てられる。
【0020】
従って、聴覚上重要な可聴帯域の正規化周波数スペクトルnspecに割り当てることが可能なビット量が減少し、符号化の精度が劣化する。その結果、符号化対象のオーディオ信号が、高品位なマルチbit PCM信号であるにもかかわらず、十分な品質のオーディオ信号を記録したり、伝送したりすることができない可能性がある。
【0021】
本発明は、このような状況に鑑みてなされたものであり、所定の帯域にノイズを含むオーディオ信号を精度良く符号化することができるようにするものである。
【課題を解決するための手段】
【0022】
本発明の一側面の符号化装置は、オーディオ信号に基づいて所定の帯域に存在するノイズを検出するノイズ検出手段と、前記ノイズ検出手段により前記ノイズが検出された場合、前記オーディオ信号の前記所定の帯域の成分が減衰するように、前記オーディオ信号のゲイン調整を行うゲイン調整手段と、前記ゲイン調整手段によるゲイン調整後の前記オーディオ信号の周波数スペクトルに基づいて、その周波数スペクトルに配分するビット量を計算するビット配分計算手段と、前記ビット量に基づいて、前記ゲイン調整後のオーディオ信号の周波数スペクトルを量子化する量子化手段とを備える符号化装置である。
【0023】
本発明の一側面の符号化方法およびプログラムは、本発明の一側面の符号化装置に対応する。
【0024】
本発明の一側面においては、オーディオ信号に基づいて所定の帯域に存在するノイズが検出され、前記ノイズが検出された場合、前記オーディオ信号の前記所定の帯域の成分が減衰するように、前記オーディオ信号のゲイン調整が行われ、ゲイン調整後の前記オーディオ信号の周波数スペクトルに基づいて、その周波数スペクトルに配分するビット量が計算され、前記ビット量に基づいて、前記ゲイン調整後のオーディオ信号の周波数スペクトルが量子化される。
【0025】
本発明の一側面の符号化装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
【発明の効果】
【0026】
本発明の一側面によれば、所定の帯域にノイズを含むオーディオ信号を精度良く符号化することができる。
【図面の簡単な説明】
【0027】
【図1】従来のオーディオ符号化装置の構成の一例を示すブロック図である。
【図2】1bit型のデルタシグマ型A/D変換器の入力信号および出力信号を示す図である。
【図3】デルタシグマ型A/D変換器における量子化ノイズを示す図である。
【図4】マルチbit PCM信号の例を示す図である。
【図5】本発明を適用したオーディオ符号化装置の第1実施の形態の構成例を示すブロック図である。
【図6】図5のノイズ検出部およびゲイン調整部の詳細構成例を示すブロック図である。
【図7】正規化情報と正規化係数の関係を示す図である。
【図8】図5のオーディオ符号化装置の符号化処理を説明するフローチャートである。
【図9】図8のノイズ削減処理を説明するフローチャートである。
【図10】図5のノイズ検出部およびゲイン調整部の他の詳細構成例を示す図である。
【図11】周波数スペクトルの例を示す図である。
【図12】周波数スペクトルに対するノイズ検出処理の第1の例を説明する図である。
【図13】周波数スペクトルに対するノイズ検出処理の第2の例を説明する図である。
【図14】周波数スペクトルに対するノイズ検出処理の第3の例を説明する図である。
【図15】周波数スペクトルに対するゲイン調整の第1の例を説明する図である。
【図16】周波数スペクトルに対するゲイン調整の第2の例を説明する図である。
【図17】周波数スペクトルに対するゲイン調整の第2の例を説明する図である。
【図18】図8の他のノイズ削減処理を説明するフローチャートである。
【図19】本発明を適用したオーディオ符号化装置の第2実施の形態の構成例を示すブロック図である。
【図20】図19のオーディオ符号化装置の符号化処理を説明するフローチャートである。
【図21】本発明を適用したオーディオ符号化装置の第3実施の形態の構成例を示すブロック図である。
【図22】時間周波数変換部から出力される周波数スペクトルの例を示す図である。
【図23】正規化情報に対するノイズ検出処理の第1の例を説明する図である。
【図24】正規化情報に対するノイズ検出処理の第2の例を説明する図である。
【図25】正規化情報に対するノイズ検出処理の第3の例を説明する図である。
【図26】正規化情報に対するゲイン調整の例を説明する図である。
【図27】図21のオーディオ符号化装置の符号化処理を説明するフローチャートである。
【図28】復号装置の構成例を示すブロック図である。
【図29】正規化情報の例を示す図である。
【図30】逆正規化された結果得られる周波数スペクトルの例を示す図である。
【図31】図28のオーディオ復号装置による復号処理を説明するフローチャートである。
【図32】コンピュータの一実施の形態の構成例を示す図である。
【発明を実施するための形態】
【0028】
<第1実施の形態>
[オーディオ符号化装置の第1実施の形態の構成例]
図5は、本発明を適用したオーディオ符号化装置の第1実施の形態の構成例を示すブロック図である。
【0029】
図5に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
【0030】
図5のオーディオ符号化装置50の構成は、主に、時間周波数変換部11の前段にノイズ検出部51とゲイン調整部52が設けられている点が図1の構成と異なる。オーディオ符号化装置50は、入力されるオーディオ信号に基づいてPDM信号特有のノイズを検出し、PDM信号特有のノイズを検出した場合、PDM信号特有のノイズが存在する可聴帯域外の高域成分を減衰させて符号化する。
【0031】
具体的には、オーディオ符号化装置50のノイズ検出部51は、時系列信号として入力されたオーディオ信号に基づいて、PDM信号特有のノイズを検出するノイズ検出処理を行い、検出結果を表す制御信号cを出力する。なお、PDM信号特有のノイズとは、デジタルシグマ型A/D変換器による量子化ノイズであり、可聴帯域外の高域に時間的に継続して存在すること、比較的大きいこと、単調増加傾向にあること等を特徴としている。
【0032】
ゲイン調整部52は、ノイズ検出部51から出力される制御信号cに基づき、時系列信号として入力されたオーディオ信号に対してゲイン調整を行う。具体的には、ゲイン調整部52は、制御信号cが、ノイズが検出されたことを表す場合、オーディオ信号の可聴帯域外の高域の成分が減衰するようにオーディオ信号のゲインを調整し、その結果得られるオーディオ信号を時間周波数変換部11に供給する。一方、制御信号cが、ノイズが検出されないことを表す場合、ゲイン調整部52は、オーディオ信号をそのまま時間周波数変換部11に供給する。
【0033】
[ノイズ検出部とゲイン調整部の詳細構成例]
図6は、図5のノイズ検出部51およびゲイン調整部52の詳細構成例を示すブロック図である。
【0034】
図6のノイズ検出部51は、HPF(High Pass Filter)部61と検出部62により構成され、ゲイン調整部52は、LPF部71により構成される。図6のノイズ検出部51とゲイン調整部52は、オーディオ信号の時間領域信号に対してノイズ検出処理とゲイン調整を行う。
【0035】
具体的には、図6のノイズ検出部51のHPF部61は、時系列信号として入力されたオーディオ信号に対してHPF処理を行って、オーディオ信号の可聴帯域外の高域成分を抽出し、出力する。
【0036】
検出部62は、HPF部61から出力されるオーディオ信号の可聴帯域外の高域成分のパワー等に基づいてノイズ検出処理を行い、制御信号cを出力する。具体的には、例えば、検出部62は、オーディオ信号の可聴帯域外の高域成分のパワーが所定の閾値以上である場合、ノイズが検出されたことを表す制御信号cを出力する。一方、検出部62は、オーディオ信号の可聴帯域外の高域成分のパワーが所定の閾値より小さい場合、ノイズが検出されないことを表す制御信号cを出力する。
【0037】
ゲイン調整部52のLPF部71は、検出部62から出力される制御信号cに基づき、制御信号cが、ノイズが検出されたことを表す場合、オーディオ信号に対してLPF処理を行い、オーディオ信号の可聴帯域外の高域成分を減衰させる。そして、LPF部71は、可聴帯域外の高域成分が減衰されたオーディオ信号を時間周波数変換部11に供給する。一方、制御信号cが、ノイズが検出されないことを表す場合、LPF部71は、オーディオ信号をそのまま時間周波数変換部11に供給する。
【0038】
[正規化情報と正規化係数の関係の説明]
図7は、正規化情報idsfと正規化係数sf(idsf)の関係を示す図である。
【0039】
図7に示すように、正規化係数sf(idsf)は2のべき乗となっており、正規化情報idsfは、各正規化係数sf(idsf)に固有の整数である。
【0040】
[オーディオ符号化装置の処理の説明]
図8は、図5のオーディオ符号化装置50の符号化処理を説明するフローチャートである。この符号化処理は、例えば、時系列信号としてオーディオ信号がオーディオ符号化装置50に入力されたとき、開始される。
【0041】
図8のステップS11において、オーディオ符号化装置50のノイズ検出部51とゲイン調整部52は、PDM信号特有のノイズを削減するノイズ削減処理を行う。このノイズ削減処理の詳細は、後述する図9や図18を参照して説明する。
【0042】
ステップS12において、時間周波数変換部11は、ステップS11のノイズ削減処理の結果ゲイン調整部52から供給されるオーディオ信号に対して時間周波数変換を行い、その結果得られる周波数スペクトルmdspecを出力する。
【0043】
ステップS13において、正規化部12は、時間周波数変換部11から出力される周波数スペクトルmdspecに対して、所定の処理単位ごとに、周波数スペクトルmdspecの振幅に応じた正規化係数sf(idsf)を用いて正規化を行う。正規化部12は、その正規化係数sf(idsf)に対応する正規化情報idsfと正規化周波数スペクトルnspecを出力する。
【0044】
ステップS14において、ビット配分計算部13は、正規化部12から出力される正規化情報idsf等に基づいて所定の処理単位ごとにビット配分計算を行い、量子化情報idwlを出力する。また、ビット配分計算部13は、正規化部12から出力される正規化情報idsfを出力する。
【0045】
ステップS15において、量子化部14は、正規化部12から出力される正規化周波数スペクトルnspecに対して、所定の処理単位ごとに、ビット配分計算部13から出力される量子化情報idwlに対応した量子化係数を用いて量子化を行う。量子化部14は、その結果得られる量子化周波数スペクトルqspecを出力する。
【0046】
ステップS16において、符号列符号化部15は、ビット配分計算部13から出力される正規化情報idsfおよび量子化情報idwl、並びに、量子化部14から出力される量子化周波数スペクトルqspecを符号化し、その結果得られる符号列を出力する。そして、処理は終了する。
【0047】
図9は、図8のステップS11のノイズ削減処理を説明するフローチャートである。
【0048】
図9のステップS31において、図6のノイズ検出部51のHPF部61は、時系列信号として入力されたオーディオ信号に対してHPF処理を行って、オーディオ信号の可聴帯域外の高域成分を抽出し、出力する。
【0049】
ステップS32において、検出部62は、HPF部61から出力されるオーディオ信号の可聴帯域外の高域成分のパワー等に基づいて、ノイズ検出処理を行い、制御信号cを出力する。
【0050】
ステップS33において、ゲイン調整部52のLPF部71は、検出部62から出力される制御信号cに基づき、ステップS32のノイズ検出処理によりPDM信号特有のノイズが検出されたかどうかを判定する。制御信号cが、ノイズが検出されたことを表す場合、ステップS33でPDM信号特有のノイズが検出されたと判定され、処理はステップS34に進む。
【0051】
ステップS34において、LPF部71は、オーディオ信号に対してLPF処理を行ってオーディオ信号の可聴帯域外の高域成分を減衰させ、時間周波数変換部11(図5)に供給する。そして、処理は図8のステップS11に戻り、ステップS12に進む。
【0052】
一方、制御信号cが、ノイズが検出されないことを表す場合、ステップS33でPDM信号特有のノイズが検出されていないと判定され、LPF部71は、オーディオ信号をそのまま時間周波数変換部11に供給する。そして、処理は図8のステップS11に戻り、ステップS12に進む。
【0053】
[ノイズ検出部とゲイン調整部の他の詳細構成例]
図10は、図5のノイズ検出部51およびゲイン調整部52の他の詳細構成例を示す図である。
【0054】
図10のノイズ検出部51は、時間周波数変換部101と検出部102により構成され、ゲイン調整部52は、調整部111と周波数時間変換部112により構成される。図10のノイズ検出部51とゲイン調整部52は、オーディオ信号の周波数領域信号に対してノイズ検出処理とゲイン調整を行う。
【0055】
具体的には、図10のノイズ検出部51の時間周波数変換部101は、時系列信号として入力されたオーディオ信号に対してFFT(Fast Fourier Transform)やMDCT等の時間周波数変換を行い、その結果得られる周波数スペクトルを出力する。
【0056】
検出部102は、時間周波数変換部101から出力される周波数スペクトルの可聴帯域外の高域成分のパワー等に基づいてノイズ検出処理を行い、制御信号cを出力する。
【0057】
ゲイン調整部52の調整部111は、検出部102から出力される制御信号cに基づき、時間周波数変換部101から出力される周波数スペクトルに対してゲイン調整を行う。具体的には、制御信号cが、ノイズが検出されたことを表す場合、調整部111は、周波数スペクトルに対して、可聴帯域外の高域成分のパワーが所定の傾きで単調減少するようにゲイン調整を行う。そして、調整部111は、ゲイン調整後の周波数スペクトルを出力する。一方、制御信号cが、ノイズが検出されないことを表す場合、調整部111は、周波数スペクトルをそのまま出力する。
【0058】
周波数時間変換部112は、調整部111から出力される周波数スペクトルに対してIFFT(Inverse Fast Fourier transform)やIMDCT(Inverse Modified Discrete Cosine Transform)等の周波数時間変換を行う。これにより、PDM信号特有のノイズが検出された場合、可聴帯域外の高域成分が減衰されたオーディオ信号が得られ、PDM信号特有のノイズが検出されない場合、オーディオ符号化装置50に入力された元のオーディオ信号が得られる。周波数時間変換部112は、周波数時間変換の結果得られるオーディオ信号を図5の時間周波数変換部11に供給する。
【0059】
[ノイズ検出処理の説明]
図11乃至図14は、図10の検出部102によるノイズ検出処理の第1乃至第3の例を説明する図である。なお、図11乃至図14において、横軸は、周波数スペクトルのインデックスを表し、縦軸は、周波数スペクトルのパワーを表している。また、このことは、後述する図15乃至図17においても同様である。
【0060】
図11は、時間周波数変換部101から出力される周波数スペクトルの例を示す図である。
【0061】
図11の例では、時系列信号として入力されるオーディオ信号のサンプリング周波数が96kHzであり、インデックス0乃至N-1のN個の周波数スペクトルのうち、インデックスN/2乃至N-1のN/2個の周波数スペクトルが可聴帯域外の高域成分の周波数スペクトルとなっている。
【0062】
図12は、図11の周波数スペクトルに対するノイズ検出処理の第1の例を説明する図である。なお、図12において、実線は、図11の周波数スペクトルのパワーを表し、中太線は、可聴帯域外の周波数スペクトルの総パワーを表し、太線は、所定の閾値を表している。
【0063】
図12に示すように、ノイズ検出処理の第1の例では、可聴帯域外の周波数スペクトルの総パワーが所定の閾値以上である場合、PDM信号特有のノイズが検出される。
【0064】
図13は、図11の周波数スペクトルに対するノイズ検出処理の第2の例を説明する図である。なお、図13において、実線は、図11の周波数スペクトルのパワーを表し、中太線は、各グループにグルーピングされた複数の周波数スペクトルのパワーの総和を表し、太線は、所定の閾値を表している。
【0065】
図13に示すように、ノイズ検出処理の第2の例では、可聴帯域外のグループ単位の総パワーが全て所定の閾値以上である場合、PDM信号特有のノイズが検出される。
【0066】
図14は、図11の周波数スペクトルに対するノイズ検出処理の第3の例を説明する図である。なお、図14において、実線は、図11の周波数スペクトルのパワーを表し、中太線は、各グループにグルーピングされた複数の周波数スペクトルのパワーの総和を表している。
【0067】
図14に示すように、ノイズ検出処理の第3の例では、可聴帯域外の周波数スペクトルのグループ単位のパワーの総和が単調増加している場合、PDM信号特有のノイズが検出される。
【0068】
なお、ノイズ検出処理の第2および第3の例では、グループ単位の総パワーに基づいて判定が行われたが、周波数スペクトル単位のパワーに基づいて判定が行われるようにしてもよい。
【0069】
また、検出部102によるノイズ検出処理は、上述した第1乃至第3の例単独であってもよいし、第1乃至第3の例の組み合わせであってもよい。さらに、検出部102によるノイズ検出処理は、上述した第1乃至第3の例に限定されない。
【0070】
[ゲイン調整の説明]
図15乃至図17は、図11に示した周波数スペクトルに対する調整部111によるゲイン調整の第1および第2の例を説明する図である。
【0071】
図15は、ゲイン調整の第1の例を説明する図である。なお、図15において、点線は、ゲイン調整前の図11の周波数スペクトルを表し、実線は、ゲイン調整後の周波数スペクトルを表し、太線は、ゲイン調整の傾きを表している。
【0072】
図15に示すように、ゲイン調整の第1の例では、可聴帯域外の周波数スペクトルのパワーが所定の傾きで単調減少するように、周波数スペクトルのゲインが調整される。
【0073】
図16および図17は、ゲイン調整の第2の例を説明する図である。なお、図16および図17において、点線は、ゲイン調整前の図11の周波数スペクトルを表し、太線は、ゲイン調整の傾きを表している。また、図16において、中太線は、各グループにグルーピングされた複数個の周波数スペクトルの総パワーを表し、図17において、実線は、ゲイン調整後の周波数スペクトルを表す。
【0074】
図16に示すように、ゲイン調整の第2の例では、可聴帯域外の周波数スペクトルが、複数個の周波数スペクトルからなるグループにグルーピングされる。そして、図17に示すように、グループ単位の総パワーが所定の傾きで単調減少するように、周波数スペクトルのゲインが調整される。
【0075】
なお、調整部111によるゲイン調整は、上述した第1および第2の例に限定されない。
【0076】
[他のノイズ削減処理の説明]
図18は、図10のノイズ検出部51とゲイン調整部52による図8のステップS11のノイズ削減処理を説明するフローチャートである。
【0077】
図18のステップS51において、図10のノイズ検出部51の時間周波数変換部101は、時系列信号として入力されたオーディオ信号に対して時間周波数変換を行い、その結果得られる周波数スペクトルを出力する。
【0078】
ステップS52において、検出部102は、時間周波数変換部101から出力される周波数スペクトルの可聴帯域外の高域成分のパワー等に基づいて、図11乃至図14で説明したノイズ検出処理を行い、制御信号cを出力する。
【0079】
ステップS53において、ゲイン調整部52の調整部111は、検出部102から出力される制御信号cに基づき、ステップS52のノイズ検出処理によりPDM信号特有のノイズが検出されたかどうかを判定する。制御信号cが、ノイズが検出されたことを表す場合、ステップS53でPDM信号特有のノイズが検出されたと判定され、処理はステップS54に進む。
【0080】
ステップS54において、調整部111は、時間周波数変換部101から出力される周波数スペクトルに対して、図15乃至図17で説明したように、可聴帯域外の高域成分のパワーが所定の傾きで単調減少するようにゲイン調整を行う。そして、調整部111は、ゲイン調整後の周波数スペクトルを出力し、処理をステップS55に進める。
【0081】
一方、制御信号cが、ノイズが検出されないことを表す場合、ステップS53でPDM信号特有のノイズが検出されていないと判定され、調整部111は、時間周波数変換部101から出力される周波数スペクトルをそのまま出力する。そして、処理はステップS55に進む。
【0082】
ステップS55において、周波数時間変換部112は、調整部111から出力される周波数スペクトルに対して周波数時間変換を行う。周波数時間変換部112は、その結果得られるオーディオ信号を図5の時間周波数変換部11に供給する。そして、処理は図8のステップS11に戻り、ステップS12に進む。
【0083】
以上のように、オーディオ符号化装置50は、ビット配分計算の前に、オーディオ信号に基づいてノイズ検出処理を行い、ノイズ検出処理によりPDM信号特有のノイズが検出された場合、オーディオ信号の可聴帯域外の高域成分が減衰するように、オーディオ信号のゲイン調整を行う。これにより、PDM信号特有のノイズに配分されるビット量を削減し、聴覚上重要な可聴帯域に配分されるビット量を増加させることができる。その結果、PDM信号特有のノイズを含む、PDM信号から生成されるマルチbit PCM信号などに対して、高精度の符号化を行うことができる。従って、高品位なマルチbit PCM信号を十分な品質で記録したり伝送したりすることができる。
【0084】
<第2実施の形態>
[オーディオ符号化装置の第2実施の形態の構成例]
図19は、本発明を適用したオーディオ符号化装置の第2実施の形態の構成例を示すブロック図である。
【0085】
図19に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
【0086】
図19のオーディオ符号化装置150の構成は、主に、時間周波数変換部11と正規化部12の間にノイズ検出部151とゲイン調整部152が設けられている点が図1の構成と異なる。オーディオ符号化装置150は、時間周波数変換部11によって得られる周波数スペクトルmdspecに対してノイズ検出処理およびゲイン調整を行う。
【0087】
具体的には、オーディオ符号化装置150のノイズ検出部151は、図10の検出部102と同様に構成される。ノイズ検出部151は、時間周波数変換部11から出力される周波数スペクトルmdspecの可聴帯域外の高域成分のパワー等に基づいて、図11乃至図14で説明したノイズ検出処理を行い、制御信号cを出力する。
【0088】
ゲイン調整部152は、図10の調整部111と同様に構成される。ゲイン調整部152は、ノイズ検出部151から出力される制御信号cに基づき、時間周波数変換部11から出力される周波数スペクトルに対してゲイン調整を行う。具体的には、制御信号cが、ノイズが検出されたことを表す場合、ゲイン調整部152は、周波数スペクトルに対して、可聴帯域外の高域成分のパワーが所定の傾きで単調減少するように図15乃至図17で説明したゲイン調整を行う。そして、ゲイン調整部152は、ゲイン調整後の周波数スペクトルmdspec’を出力する。一方、制御信号cが、ノイズが検出されないことを表す場合、ゲイン調整部152は、周波数スペクトルmdspecをそのまま周波数スペクトルmdspec'として出力する。ゲイン調整部152から出力される周波数スペクトルmdspec’は、正規化部12に入力される。
【0089】
[オーディオ符号化装置の処理の説明]
図20は、図19のオーディオ符号化装置150の符号化処理を説明するフローチャートである。この符号化処理は、例えば、時系列信号としてオーディオ信号がオーディオ符号化装置150に入力されたとき、開始される。
【0090】
図20のステップS71において、時間周波数変換部11は、時系列信号として入力されたオーディオ信号に対して時間周波数変換を行い、その結果得られる周波数スペクトルmdspecを出力する。
【0091】
ステップS72において、ノイズ検出部151は、時間周波数変換部11から出力される周波数スペクトルmdspecの可聴帯域外の高域成分のパワー等に基づいて、図11乃至図14で説明したノイズ検出処理を行い、制御信号cを出力する。
【0092】
ステップS73において、ゲイン調整部152は、ノイズ検出部151から出力される制御信号cに基づき、ステップS72のノイズ検出処理によりPDM信号特有のノイズが検出されたかどうかを判定する。制御信号cが、ノイズが検出されたことを表す場合、ステップS73でPDM信号特有のノイズが検出されたと判定され、処理はステップS74に進む。
【0093】
ステップS74において、ゲイン調整部152は、時間周波数変換部11から出力される周波数スペクトルmdspecに対して、図15乃至図17で説明したように、可聴帯域外の高域成分のパワーが所定の傾きで単調減少するようにゲイン調整を行う。そして、ゲイン調整部152は、ゲイン調整後の周波数スペクトルmdspec’を出力し、処理をステップS75に進める。
【0094】
一方、制御信号cが、ノイズが検出されないことを表す場合、ステップS73でPDM信号特有のノイズが検出されていないと判定され、ゲイン調整部152は、周波数スペクトルmdspecをそのまま周波数スペクトルmdspec’として出力する。そして、処理をステップS75に進む。
【0095】
ステップS75において、正規化部12は、ゲイン調整部152から出力される周波数スペクトルmdspec’に対して、所定の処理単位ごとに、周波数スペクトルmdspec’の振幅に応じた正規化係数sf(idsf)を用いて正規化を行う。正規化部12は、その正規化係数sf(idsf)に対応する正規化情報idsfと、正規化の結果得られる正規化周波数スペクトルnspecを出力する。
【0096】
ステップS76乃至S78の処理は、図8のステップS14乃至S16の処理と同様であるので、説明は省略する。
【0097】
以上のように、オーディオ符号化装置150は、ビット配分計算の前に、オーディオ信号の周波数スペクトルに基づいてノイズ検出処理を行い、ノイズ検出処理によりPDM信号特有のノイズが検出された場合、周波数スペクトルの可聴帯域外の高域成分が減衰するように、周波数スペクトルのゲイン調整を行う。これにより、PDM信号特有のノイズに配分されるビット量を削減し、聴覚上重要な可聴帯域に配分されるビット量を増加させることができる。その結果、PDM信号特有のノイズを含む、PDM信号から生成されるマルチbit PCM信号などに対して、高精度の符号化を行うことができる。従って、高品位なマルチbit PCM信号を十分な品質で記録したり伝送したりすることができる。
【0098】
また、オーディオ符号化装置150は、時間周波数変換部11により得られる周波数スペクトルmdspecを用いてノイズ検出処理およびゲイン調整を行うので、オーディオ符号化装置50に比べて、従来のオーディオ符号化装置10に対して追加するモジュールの数を削減することができる。具体的には、例えば、オーディオ符号化装置50のように、時間周波数変換部101および周波数時間変換部112を追加する必要がない。よって、オーディオ符号化装置150では、従来のオーディオ符号化装置10からの変更を容易に行うことができる。
【0099】
さらに、オーディオ符号化装置150は、符号化処理の途中でノイズ検出処理およびゲイン調整を行うので、オーディオ符号化装置50に比べて、処理遅延を軽減することができる。
【0100】
<第3実施の形態>
[オーディオ符号化装置の第1実施の形態の構成例]
図21は、本発明を適用したオーディオ符号化装置の第3実施の形態の構成例を示すブロック図である。
【0101】
図21に示す構成のうち、図1の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
【0102】
図21のオーディオ符号化装置200の構成は、主に、正規化部12とビット配分計算部13の間にノイズ検出部201とゲイン調整部202が設けられている点が図1の構成と異なる。オーディオ符号化装置200は、入力されるオーディオ信号の正規化情報idsfに対してノイズ検出処理およびゲイン調整を行う。
【0103】
具体的には、オーディオ符号化装置200のノイズ検出部201は、正規化部12から出力される正規化情報idsfに基づいてノイズ検出処理を行い、制御信号cを出力する。
【0104】
ゲイン調整部202は、ノイズ検出部201から出力される制御信号cに基づき、正規化部12から出力される正規化情報idsfに対してゲイン調整を行う。具体的には、制御信号cが、ノイズが検出されたことを表す場合、ゲイン調整部202は、正規化情報idsfに対して、可聴帯域外の高域成分が所定の傾きで単調減少するようにゲイン調整を行う。そして、ゲイン調整部202は、ゲイン調整後の正規化情報idsf’を出力する。一方、制御信号cが、ノイズが検出されないことを表す場合、ゲイン調整部202は、正規化情報idsfをそのまま正規化情報idsf’として出力する。ゲイン調整部202から出力される正規化情報idsf’は、ビット配分計算部13に入力される。
【0105】
[ノイズ検出処理の説明]
図22乃至図25は、図21のノイズ検出部201によるノイズ検出処理の第1乃至第3の例を説明する図である。なお、図22において、横軸は、周波数スペクトルのインデックスを表し、縦軸は、周波数スペクトルのパワーを表している。また、図23乃至図25において、横軸は、正規化情報のインデックスを表し、縦軸は、正規化情報を表している。
【0106】
図22は、時間周波数変換部11から出力される周波数スペクトルmdspecの例を示す図である。なお、図22において、実線は、周波数スペクトルmdspecのパワーを表している。
【0107】
図22の例では、図11の場合と同様に、時系列信号として入力されるオーディオ信号のサンプリング周波数が96kHzであり、インデックス0乃至N-1のN個の周波数スペクトルのうち、インデックスN/2乃至N-1のN/2個の周波数スペクトルmdspecが可聴帯域外の高域成分の周波数スペクトルとなっている。
【0108】
また、周波数スペクトルmdspecの正規化および量子化は、図22の太線で示す、いわゆる臨界帯域幅ごとに行われる。この臨界帯域幅は、一般的に、聴覚特性を反映して低域ほど狭く、高域ほど広くなっている。例えば、図22では、インデックス番号0を含む最も低域の臨界帯域幅は、2本の周波数スペクトルmdspecにより構成され、インデックス番号N-1を含む最も広域の臨界帯域幅は、8本の周波数スペクトルmdspecにより構成されている。
【0109】
なお、ここでは、正規化および量子化の処理単位である臨界帯域幅を量子化ユニットと呼ぶこととし、N個の周波数スペクトルmdspecがM個の量子化ユニットにグルーピングされるものとする。
【0110】
図23は、図22の周波数スペクトルmdspecの量子化ユニット単位の正規化情報idsfに対するノイズ検出処理の第1の例を説明する図である。なお、図23において、実線は、正規化情報idsfを表し、中太線は、可聴帯域外の正規化情報idsfの合計を表し、太線は、閾値を表している。
【0111】
図23に示すように、ノイズ検出処理の第1の例では、可聴帯域外の周波数スペクトルmdspecの正規化情報idsfの合計が所定の閾値以上である場合、PDM信号特有のノイズが検出される。
【0112】
図24は、図22の周波数スペクトルmdspecの正規化情報idsfに対するノイズ検出処理の第2の例を説明する図である。なお、図24において、実線は、正規化情報idsfを表し、太線は、閾値を表している。
【0113】
図24に示すように、ノイズ検出処理の第2の例では、可聴帯域外の周波数スペクトルmdspecの正規化情報idsfが全て所定の閾値以上である場合、PDM信号特有のノイズが検出される。
【0114】
図25は、図22の周波数スペクトルmdspecの正規化情報idsfに対するノイズ検出処理の第3の例を説明する図である。なお、図25において、実線は、正規化情報idsfを表している。
【0115】
図25に示すように、ノイズ検出処理の第3の例では、可聴帯域外の周波数スペクトルmdspecの正規化情報idsfが単調増加している場合、PDM信号特有のノイズが検出される。
【0116】
なお、ノイズ検出処理の第2および第3の例では、個々の正規化情報idsfに基づいて判定が行われたが、複数個の正規化情報idsfをグルーピングし、グループ単位の正規化情報idsfに基づいて判定が行われるようにしてもよい。
【0117】
また、ノイズ検出部201によるノイズ検出処理は、上述した第1乃至第3の例単独であってもよいし、第1乃至第3の例の組み合わせであってもよい。さらに、ノイズ検出部201によるノイズ検出処理は、上述した第1乃至第3の例に限定されない。
【0118】
[ゲイン調整の説明]
図26は、図22に示した周波数スペクトルmdspecの正規化情報idsfに対するゲイン調整部202によるゲイン調整の例を説明する図である。なお、図26において、横軸は、正規化情報のインデックスを表し、縦軸は、正規化情報を表している。また、図26において、点線は、ゲイン調整前の正規化情報idsfを表し、実線は、ゲイン調整後の正規化情報idsf’を表し、太線は、ゲイン調整の傾きを表している。
【0119】
図26に示すように、ゲイン調整部202によるゲイン調整では、可聴帯域外の周波数スペクトルmdspecの正規化情報idsfが所定の傾きで単調減少するように、正規化情報idsfのゲインが調整される。
【0120】
なお、ゲイン調整部202によるゲイン調整は、図26の例に限定されない。
【0121】
[オーディオ符号化装置の処理の説明]
図27は、図21のオーディオ符号化装置200の符号化処理を説明するフローチャートである。この符号化処理は、例えば、時系列信号としてオーディオ信号がオーディオ符号化装置200に入力されたとき、開始される。
【0122】
図27のステップS101において、時間周波数変換部11は、時系列信号として入力されたオーディオ信号に対して時間周波数変換を行い、その結果得られる周波数スペクトルmdspecを出力する。
【0123】
ステップS102において、正規化部12は、時間周波数変換部11から出力される周波数スペクトルmdspecに対して、所定の処理単位ごとに、周波数スペクトルmdspecの振幅に応じた正規化係数sf(idsf)を用いて正規化を行う。正規化部12は、その正規化係数sf(idsf)に対応する正規化情報idsfと、正規化の結果得られる正規化周波数スペクトルnspecを出力する。
【0124】
ステップS103において、ノイズ検出部201は、正規化部12から出力される正規化情報idsfの可聴帯域外の高域成分に基づいて、図22乃至図25で説明したノイズ検出処理を行い、制御信号cを出力する。
【0125】
ステップS104において、ゲイン調整部202は、ノイズ検出部201から出力される制御信号cに基づき、ステップS103のノイズ検出処理によりPDM信号特有のノイズが検出されたかどうかを判定する。制御信号cが、ノイズが検出されたことを表す場合、ステップS103でPDM信号特有のノイズが検出されたと判定され、処理はステップS105に進む。
【0126】
ステップS105において、ゲイン調整部202は、正規化部12から出力される正規化情報idsfに対して、可聴帯域外の高域成分が所定の傾きで単調減少するように、図26で説明したゲイン調整を行う。そして、ゲイン調整部202は、ゲイン調整後の正規化情報idsf’を出力し、処理をステップS106に進める。
【0127】
一方、制御信号cが、ノイズが検出されないことを表す場合、ステップS104でPDM信号特有のノイズが検出されていないと判定され、ゲイン調整部202は、正規化情報idsfをそのまま正規化情報idsf’として出力する。そして、処理をステップS106に進む。
【0128】
ステップS106において、ビット配分計算部13は、ゲイン調整部202から出力される正規化情報idsf’等に基づいて所定の処理単位ごとにビット配分計算を行い、量子化情報idwlを符号列符号化部15に供給する。また、ビット配分計算部13は、ゲイン調整部202から出力される正規化情報idsf’を符号列符号化部15に供給する。
【0129】
ステップS107乃至S108の処理は、図8のステップS15およびS16の処理と同様であるので、説明は省略する。
【0130】
以上のように、オーディオ符号化装置200は、ビット配分計算の前に、オーディオ信号の正規化情報に基づいてノイズ検出処理を行い、ノイズ検出処理によりPDM信号特有のノイズが検出された場合、正規化情報の可聴帯域外の高域成分が減衰するように、正規化情報のゲイン調整を行う。これにより、PDM信号特有のノイズに配分されるビット量を削減し、聴覚上重要な可聴帯域に配分されるビット量を増加させることができる。その結果、PDM信号特有のノイズを含む、PDM信号から生成されるマルチbit PCM信号などに対して、高精度の符号化を行うことができる。従って、高品位なマルチbit PCM信号を十分な品質で記録したり伝送したりすることができる。
【0131】
また、オーディオ符号化装置200は、正規化部12により得られる正規化情報idsfを用いてノイズ検出処理およびゲイン調整を行うので、オーディオ符号化装置150と同様に、オーディオ符号化装置50に比べて、従来のオーディオ符号化装置10に対して追加するモジュールの数を削減することができる。よって、オーディオ符号化装置200では、従来のオーディオ符号化装置10からの変更を容易に行うことができる。
【0132】
さらに、オーディオ符号化装置200は、符号化処理の途中でノイズ検出処理およびゲイン調整を行うので、オーディオ符号化装置50に比べて、処理遅延を軽減することができる。
【0133】
また、正規化情報idsfは整数であるので、オーディオ符号化装置200は、実数である周波数スペクトルを用いてノイズ検出処理およびゲイン調整を行うオーディオ符号化装置150に比べて、より少ない演算量でノイズ検出処理およびゲイン調整を行うことができる。これに対して、オーディオ符号化装置150は、周波数スペクトルmdspecそのものを用いてノイズ検出処理およびゲイン調整を行うので、オーディオ符号化装置200に比べて、より精度良く符号化を行うことができる。
【0134】
[オーディオ復号装置の構成例]
図28は、図21のオーディオ符号化装置200により符号化された符号列を復号するオーディオ復号装置250の構成例を示すブロック図である。
【0135】
図28のオーディオ復号装置250は、符号列復号化部251、逆量子化部252、逆正規化部253、および周波数時間変換部254により構成される。オーディオ復号装置250は、オーディオ符号化装置200により出力された符号列を復号し、時系列信号であるオーディオ信号を得る。
【0136】
具体的には、オーディオ復号装置250の符号列復号化部251は、オーディオ符号化装置200により出力された符号列に対して復号化を行い、正規化情報idsf’、量子化情報idwl、量子化周波数スペクトルqspecを得て、出力する。
【0137】
逆量子化部252は、符号列復号化部251から出力される量子化周波数スペクトルqspecに対して所定の処理単位ごとに、符号列復号化部251から出力される量子化情報idwlに対応した逆量子化係数を用いて逆量子化を行う。逆量子化部252は、その結果得られる正規化周波数スペクトルnspecを出力する。
【0138】
逆正規化部253は、逆量子化部252から出力される正規化周波数スペクトルnspecに対して所定の処理単位ごとに、符号列復号化部251から出力される正規化情報idsf’に対応した逆正規化係数を用いて逆正規化を行う。逆正規化部253は、その結果得られる周波数スペクトルmdspec’’を出力する。
【0139】
周波数時間変換部254は、逆正規化部253から出力される周波数スペクトルmdspec’’に対して周波数時間変換を行い、その結果得られる時系列信号であるオーディオ信号を出力する。例えば、周波数時間変換部254は、周波数スペクトルmdspec’’としてのN個のMDCT係数に対して、IMDCT等の逆直交変換を用いて周波数時間変換を行い、2Nサンプルの時系列信号を出力する。
【0140】
[逆正規化の説明]
図29および図30は、逆正規化部253による逆正規化を説明する図である。なお、図29および図30において、横軸は、周波数スペクトルのインデックスを表し、縦軸は、周波数スペクトルのパワーを表す。
【0141】
図29は、逆正規化部253に入力される正規化情報idsf’の例を示す図である。なお、図29において、点線は、オーディオ符号化装置200に入力されたオーディオ信号の周波数スペクトルmdspecを表し、太線は、正規化情報idsf’に対応する量子化ユニット単位の周波数スペクトルのパワーを表している。
【0142】
図29の正規化情報idsf’は、図26で説明したゲイン調整後の正規化情報idsf’が符号列復号化部251により復元されたものである。
【0143】
図30は、図29の正規化情報idsf’を用いて逆正規化された結果得られる周波数スペクトルmdspec’’の例を示す図である。なお、図30において、点線は、オーディオ符号化装置200に入力されたオーディオ信号の周波数スペクトルmdspecを表し、実線は、逆正規化部253から出力される周波数スペクトルmdspec’’を表している。
【0144】
図30に示すように、逆正規化により、図29に示した正規化情報idsf’に対応する量子化ユニット単位の周波数スペクトルのパワーは、周波数スペクトルごとに、その周波数スペクトルの正規化周波数スペクトルnspecによって変化される。但し、各量子化ユニット単位に含まれる周波数スペクトルmdspec’’のパワーは、その量子化ユニット単位の正規化情報idsf’に対応する周波数スペクトルのパワー以内にされる。
【0145】
従って、オーディオ符号化装置200における正規化情報idsfのゲイン調整による効果は、周波数スペクトルmdspecの量子化ユニットごとのゲイン調整による効果と等しい。
【0146】
[オーディオ復号装置の処理の説明]
図31は、図28のオーディオ復号装置250による復号処理を説明するフローチャートである。この復号処理は、例えば、オーディオ符号化装置200により出力された符号列がオーディオ復号装置250に入力されたとき、開始される。
【0147】
図31のステップS121において、オーディオ復号装置250の符号列復号化部251は、オーディオ符号化装置200により出力された符号列に対して復号化を行い、正規化情報idsf’、量子化情報idwl、量子化周波数スペクトルqspecを得て、出力する。
【0148】
ステップS122において、逆量子化部252は、符号列復号化部251から出力される量子化周波数スペクトルqspecに対して、所定の処理単位ごとに、符号列復号化部251から出力される量子化情報idwlに対応した逆量子化係数を用いて逆量子化を行う。逆量子化部252は、その結果得られる正規化周波数スペクトルnspecを出力する。
【0149】
ステップS123において、逆正規化部253は、逆量子化部252から出力される正規化周波数スペクトルnspecに対して、所定の処理単位ごとに、符号列復号化部251から出力される正規化情報idsf’に対応した逆正規化係数を用いて逆正規化を行う。逆正規化部253は、その結果得られる周波数スペクトルmdspec’’を出力する。
【0150】
ステップS124において、周波数時間変換部254は、逆正規化部253から出力される周波数スペクトルmdspec’’に対して周波数時間変換を行い、その結果得られる時系列信号であるオーディオ信号を出力する。そして、処理は終了する。
【0151】
以上のように、オーディオ復号装置250は、オーディオ符号化装置200から出力された符号列を復号化し、その結果得られる正規化情報idsf'に対応する逆正規化係数を用いて正規化周波数スペクトルnspecに対して逆正規化を行う。これにより、正規化情報idsf’が、可聴帯域外の高域成分が減衰されたものである場合、逆正規化の結果、可聴帯域外の高域成分が減衰された周波数スペクトルmdspec’’を得ることができる。その結果、PDM信号特有のノイズが存在する可聴帯域外の高域成分が減衰された、高精度のマルチbit PCM信号を出力させることができる。
【0152】
なお、図示は省略するが、オーディオ符号化装置50およびオーディオ符号化装置150から出力される符号列を復号化するオーディオ復号装置も、オーディオ復号装置250と同様に構成され、同様の処理を行う。その結果、オーディオ符号化装置50(150)においてPDM信号特有のノイズが検出されている場合には、オーディオ復号装置250と同様に、可聴帯域外の高域成分が減衰された周波数スペクトルを得ることができる。
【0153】
また、上述した図11および図22の例では、入力されるオーディオ信号のサンプリング周波数が96kHzであるものとしたが、サンプリング周波数はこれに限定されず、可聴帯域外の高域成分の周波数スペクトルの個数もN/2個に限定されない。例えば、サンプリング周波数は192kHzであってもよい。この場合には、インデックス0乃至N-1のN個の周波数スペクトルのうち、例えばN/4乃至N-1の3N/4個の周波数スペクトルが可聴帯域外の高域成分の周波数スペクトルとなる。
【0154】
さらに、本実施の形態では、PDM信号特有のノイズが検出されたが、ノイズ検出部により検出されるノイズは、所定の帯域に存在するノイズであれば、他のノイズであってもよい。この場合、ゲイン調整の対象となる帯域は、ノイズ検出部により検出されるノイズが存在する帯域である。
【0155】
<第4実施の形態>
[本発明を適用したコンピュータの説明]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
【0156】
そこで、図32は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
【0157】
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部308やROM(Read Only Memory)302に予め記録しておくことができる。
【0158】
あるいはまた、プログラムは、リムーバブルメディア311に格納(記録)しておくことができる。このようなリムーバブルメディア311は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア311としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
【0159】
なお、プログラムは、上述したようなリムーバブルメディア311からドライブ310を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部308にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
【0160】
コンピュータは、CPU(Central Processing Unit)301を内蔵しており、CPU301には、バス304を介して、入出力インタフェース305が接続されている。
【0161】
CPU301は、入出力インタフェース305を介して、ユーザによって、入力部306が操作等されることにより指令が入力されると、それに従って、ROM302に格納されているプログラムを実行する。あるいは、CPU301は、記憶部308に格納されたプログラムを、RAM(Random Access Memory)303にロードして実行する。
【0162】
これにより、CPU301は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU301は、その処理結果を、必要に応じて、例えば、入出力インタフェース305を介して、出力部307から出力、あるいは、通信部309から送信、さらには、記憶部308に記録等させる。
【0163】
なお、入力部306は、キーボードや、マウス、マイク等で構成される。また、出力部307は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
【0164】
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
【0165】
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
【0166】
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【符号の説明】
【0167】
11 時間周波数変換部, 12 正規化部, 13 ビット配分計算部, 14 量子化部, 50 オーディオ符号化装置, 51 ノイズ検出部, 52 ゲイン調整部, 61 HPF部, 62 検出部, 71 LPF部, 101 時間周波数変換部, 102 検出部, 111 調整部, 112 周波数時間変換部 150 オーディオ符号化装置, 151 ノイズ検出部, 152 ゲイン調整部, 200 オーディオ符号化装置, 201 ノイズ検出部, 202 ゲイン調整部

【特許請求の範囲】
【請求項1】
オーディオ信号に基づいて所定の帯域に存在するノイズを検出するノイズ検出手段と、
前記ノイズ検出手段により前記ノイズが検出された場合、前記オーディオ信号の前記所定の帯域の成分が減衰するように、前記オーディオ信号のゲイン調整を行うゲイン調整手段と、
前記ゲイン調整手段によるゲイン調整後の前記オーディオ信号の周波数スペクトルに基づいて、その周波数スペクトルに配分するビット量を計算するビット配分計算手段と、
前記ビット量に基づいて、前記ゲイン調整後のオーディオ信号の周波数スペクトルを量子化する量子化手段と
を備える符号化装置。
【請求項2】
前記オーディオ信号に対して時間周波数変換を行い、前記オーディオ信号の周波数スペクトルを得る時間周波数変換手段
をさらに備え、
前記ノイズ検出手段は、前記時間周波数変換手段により得られた前記周波数スペクトルに基づいて前記ノイズを検出し、
前記ゲイン調整手段は、前記ノイズ検出手段により前記ノイズが検出された場合、前記時間周波数変換手段により得られた前記周波数スペクトルの前記所定の帯域の成分が減衰するように、その周波数スペクトルのゲイン調整を行い、
前記ビット配分計算手段は、前記ゲイン調整手段によるゲイン調整後の前記周波数スペクトルに基づいて前記ビット量を計算する
請求項1に記載の符号化装置。
【請求項3】
前記ノイズは、前記所定の帯域に存在する単調増加傾向を有するノイズであり、
前記ノイズ検出手段は、前記所定の帯域の所定数の前記周波数スペクトルごとのパワーの総和が単調増加している場合、前記ノイズを検出する
請求項2に記載の符号化装置。
【請求項4】
前記ゲイン調整手段によるゲイン調整後の前記周波数スペクトルを、その周波数スペクトルの振幅に応じた正規化係数を用いて正規化する正規化手段
をさらに備え、
前記ビット配分計算手段は、前記正規化係数に基づいて前記ビット量を計算し、
前記量子化手段は、前記ビット量に基づいて、前記正規化手段により正規化された前記周波数スペクトルを量子化する
請求項2に記載の符号化装置。
【請求項5】
前記オーディオ信号に対して時間周波数変換を行い、前記オーディオ信号の周波数スペクトルを得る時間周波数変換手段と、
前記時間周波数変換手段により得られた前記周波数スペクトルを、その周波数スペクトルの振幅に応じた正規化係数を用いて正規化する正規化手段と
をさらに備え、
前記ノイズ検出手段は、前記正規化係数に対応する整数の情報である正規化情報に基づいて前記ノイズを検出し、
前記ゲイン調整手段は、前記ノイズ検出手段により前記ノイズが検出された場合、前記正規化情報の前記所定の帯域の成分が減衰するように、前記正規化情報のゲイン調整を行い、
前記ビット配分計算手段は、前記ゲイン調整手段によるゲイン調整後の前記正規化情報に基づいて前記ビット量を計算し、
前記量子化手段は、前記ビット量に基づいて、前記正規化手段により正規化された前記周波数スペクトルを量子化する
請求項1に記載の符号化装置。
【請求項6】
前記ノイズは、前記所定の帯域に存在する単調増加傾向を有するノイズであり、
前記ノイズ検出手段は、前記正規化情報が単調増加している場合、前記ノイズを検出する
請求項5に記載の符号化装置。
【請求項7】
前記ゲイン調整手段によるゲイン調整後の前記オーディオ信号に対して時間周波数変換を行い、前記ゲイン調整後のオーディオ信号の周波数スペクトルを得る時間周波数変換手段
をさらに備える
請求項1に記載の符号化装置。
【請求項8】
前記ノイズは、前記所定の帯域に存在する単調増加傾向を有するノイズである
請求項7に記載の符号化装置。
【請求項9】
前記時間周波数変換手段により得られる前記周波数スペクトルを、その周波数スペクトルの振幅に応じた正規化係数を用いて正規化する正規化手段
をさらに備え、
前記ビット配分計算手段は、前記正規化係数に基づいて前記ビット量を計算し、
前記量子化手段は、前記ビット量に基づいて、前記正規化手段により正規化された前記周波数スペクトルを量子化する
請求項7に記載の符号化装置。
【請求項10】
前記ノイズ検出手段は、前記オーディオ信号の前記所定の帯域の成分を抽出し、その成分に基づいて前記ノイズを検出する
請求項7に記載の符号化装置。
【請求項11】
前記ノイズ検出手段は、前記オーディオ信号に対して時間周波数変換を行い、その結果得られる前記オーディオ信号の周波数スペクトルに基づいて前記ノイズを検出し、
前記ゲイン調整手段は、前記ノイズ検出手段により前記ノイズが検出された場合、前記オーディオ信号の周波数スペクトルの前記所定の帯域の成分が減衰するように、その周波数スペクトルのゲイン調整を行い、ゲイン調整後の前記周波数スペクトルを周波数時間変換することにより、前記オーディオ信号のゲイン調整を行う
請求項7に記載の符号化装置。
【請求項12】
前記ノイズは、可聴帯域外の高域に存在するノイズである
請求項1に記載の符号化装置。
【請求項13】
符号化装置が、
オーディオ信号に基づいて所定の帯域に存在するノイズを検出するノイズ検出ステップと、
前記ノイズ検出ステップの処理により前記ノイズが検出された場合、前記オーディオ信号の前記所定の帯域の成分が減衰するように、前記オーディオ信号のゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップの処理によるゲイン調整後の前記オーディオ信号の周波数スペクトルに基づいて、その周波数スペクトルに配分するビット量を計算するビット配分計算ステップと、
前記ビット量に基づいて、前記ゲイン調整後のオーディオ信号の周波数スペクトルを量子化する量子化ステップと
を含む符号化方法。
【請求項14】
コンピュータに、
オーディオ信号に基づいて所定の帯域に存在するノイズを検出するノイズ検出ステップと、
前記ノイズ検出ステップの処理により前記ノイズが検出された場合、前記オーディオ信号の前記所定の帯域の成分が減衰するように、前記オーディオ信号のゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップの処理によるゲイン調整後の前記オーディオ信号の周波数スペクトルに基づいて、その周波数スペクトルに配分するビット量を計算するビット配分計算ステップと、
前記ビット量に基づいて、前記ゲイン調整後のオーディオ信号の周波数スペクトルを量子化する量子化ステップと
を含む処理を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate


【公開番号】特開2012−103395(P2012−103395A)
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願番号】特願2010−250614(P2010−250614)
【出願日】平成22年11月9日(2010.11.9)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】