信号処理装置、信号処理方法、再生装置、再生方法、電子機器

【課題】例えば圧縮符号化により失われた高域部分の信号を補間して高音質化を図る。
【解決手段】所定の周波数以上の帯域において自己相関計算を行い、計算された相関値が最大となるときの相関最大シフト量を求めると共に、この相関最大シフト量だけ離間した周波数ポイント間の信号の比率を計算しておく。その上で、信号成分が失われた以降の各補間対象周波数ポイントの信号を、それら各補間対象周波数ポイントから上記相関最大シフト量だけ離間した信号と上記比率とに基づき計算した値で補間する。これによって相関性を活かしたより自然なかたちで符号化により失われた高域信号を補間できる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、信号処理装置として、特に音声圧縮符号化処理により失われた成分を補正して高音質化を図るための信号処理装置と、その方法とに関する。また、再生装置とその方法、及び電子機器に関する。
【背景技術】
【０００２】
音声信号の圧縮符号化処理は、「量子化（ＰＣＭ：Pulse Code Moduration）」、音声信号の時間的連続性を用いた「時間相関符号化」、人間の聴覚特性を用いた「周波数相関符号化」、これらの符号化から得られた符号の発生確率の偏りを用いた「エントロピー符号化」を組み合わせることで実現することができる。
【０００３】
音声信号の圧縮符号化の手法としては、ＭＰＥＧ（Moving Pictures Experts Group）、ＡＴＲＡＣ（Adaptive TRansform Acoustic Coding：登録商標）、ＡＣ−３（Audio Code Number 3：登録商標）、ＷＭＡ（Windows Media Audio：登録商標）などで規格化され、その符号化信号は現在、デジタルテレビジョン放送、デジタルオーディオプレーヤー、ＷＥＢストリーミングなど広範にわたって使用されている。
【０００４】
ここで、圧縮符号化処理の中でも、周波数相関符号化は、圧縮率や音質に大きな影響を与える符号化処理である。周波数相関符号化とは、量子化されたＰＣＭ信号を、時間領域から周波数領域に直交変換し、周波数領域における信号エネルギーの偏差を求める。この偏差を用いて符号化することで符号化効率を高めることができる。また直交変換後の信号に対して、心理聴覚特性を用いて、周波数帯域をいくつかの帯域に分け、より人間に知覚されやすい帯域の信号劣化を最小とするように、ある種の重み付けを行って量子化することにより、全体的な符号化品質を改善することができる。
心理聴覚特性を用いた符号化は、絶対可聴閾値と、マスキング効果で定まる相対可聴閾値を用いて、補正可聴閾値を求める。この補正可聴閾値に基づいて、分割された帯域ごとにビット割り当てを行う。補正可聴閾値以下の音圧を持つ周波数成分に関しては、人間は知覚できない音として、符号化の際にカットされる。また、絶対可聴閾値は高周波数帯域（以下、単に高域とも呼ぶ）でその振幅値が上昇するため、低周波数帯域（低域とも呼ぶ）に比べて高域の周波数成分はより多くカットされる。これが音声信号圧縮符号化特有の、高域における周波数帯域制限である。
【０００５】
このような心理聴覚特性を用いた音声信号の圧縮符号化方式は、ＭＰＥＧ規格で積極的に取り入られている。音声信号の圧縮符号化は各エンコーダーメーカーの技術力により、その傾向が決められるものではあるが、ＭＰＥＧ規格が採用されているデジタルテレビジョン放送の音声信号においては、上記符号化により、ある周波数を境にそれ以降の高域信号が全てカットされたり、可聴帯域内においても、ある分割帯域の信号が全てカットされてしまうといった現状も確認されている。
すなわち、このような信号成分の欠落により、音質の劣化（低下）が生じるものである。
【０００６】
このような圧縮符号化に伴う高域部分での信号欠落による音質低下を抑制するための先行技術はいくつか存在する。
例えば、下記特許文献１に記載の「周波数補間装置、周波数補間方法及び記録媒体」では、既存の音声信号を使って高域信号を複製する方法が開示されている。
また、特許文献２に記載の「周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体」では、符号化時において、欠落した信号の情報を予め記録しておき、復号時にそれを用いて音質を保ちながら復号する方法が開示されている。
【０００７】
また、圧縮符号化に伴う音質劣化としては、上記のような高域部分の欠落の他にも、割り当てビット数の削減に伴う量子化誤差もその１つの要因として挙げることができる。
つまり、心理聴覚特性を用いた符号化では、聴感上聞こえないとされる周波数帯域については割り当てるビット数を削減することとし、これによって音質の低下を抑えながら効率の良い情報圧縮処理を実現しようとしている。但し、このように低ビット数が割り当てられた周波数帯域では、その低ビット数に起因して復号の際の復号精度が低下し、本来の音声信号との差が大きくなるという現象が確認されている。すなわち、これによって低ビット数が割り当てられた帯域での音質の劣化（低下）が生じやすいものとなる。
【０００８】
このような割り当てビット数の削減に伴う量子化誤差に起因した音質低下を抑制するための先行技術としては、例えば下記の特許文献３を挙げることができる。
この特許文献３に記載の「量子化誤差補正方法及び装置並びにオーディオ情報復号方法」では、補正対象である音声信号の本来とり得る値の範囲を算出し、相隣接する周波数帯域の符号化信号から最小二乗法を使って補正値を算出する。補正値が範囲内の値であれば既存の信号と置き換え、範囲外であれば、範囲の最小値・最大値などを用いて既存の信号との置き換えを行う、という手法が開示されている。
【０００９】
さらに、圧縮符号化に伴う音質劣化の要因としては、上記のような割り当てビット数の削減に伴うバンド間誤差も挙げることができる。すなわち、割り当てビット数を削減されたバンドでは、そこに隣接した割り当てビット数の比較的多いバンドとの境界部分で、それらの割り当てビット数の差に起因してバンド間での量子化誤差が生じる。
このようにバンド間の量子化誤差が生じた部分では、波形の連続性が失われて音質劣化の要因となってしまう。
【００１０】
【特許文献１】特開２００１−３５６７８８号公報
【特許文献２】特開２００２−７３０９６号公報
【特許文献３】特開２００１−１０２９３９号公報
【発明の開示】
【発明が解決しようとする課題】
【００１１】
ここで、先ず、高域部分の信号欠落について対策する上記特許文献１においては、高域信号の生成元となる基準バンドを信号が存在する帯域から特定し、その基準バンドに基づいた情報を用いて高域用の信号を生成し、追加するという手法が開示されている。
しかしながらこの手法では、上記基準バンドを特定するにあたり、信号が存在する帯域を分割し、分割した数だけ組合せを作り相関関係を求めなければならず、その分処理負担が重くなってしまう。
また、相関関係が求まるまでの処理量が各フレームで変化するため、処理量や処理時間が入力信号に左右されて変わってしまうことになる。
【００１２】
また、同じく高域部分の信号欠落について対策する上記特許文献２に記載の発明では、符号器側と復号器側とで共通のアルゴリズムが必要となっており、よって汎用性に乏しいものとなっている。
【００１３】
このようにして、符号化により失われた高域成分を補間（追加）するにあたり採られていた従来の手法では、処理量の偏りや処理負担の増大という問題や、汎用性の面での問題を抱えるものであった。
【００１４】
また、割り当てビット数の削減に伴う量子化誤差について補正する上記特許文献３に記載の手法では、隣接する周波数帯域の符号化信号により、数通りの場合分けが必要となり、その分処理負担が増大する。さらには、上記「補正値」の算出にあたって各信号において二次曲線を求めるものとしているが、このような補正値としてその精度を確保するためには比較的長時間にわたる信号をサンプルして計算を行う必要があり、この点でも処理量が増大化する傾向となる。
すなわち、割り当てビット数の削減に伴う量子化誤差を補正するための従来手法では、補正にあたっての処理負担の軽減が要請される。
【００１５】
さらに、上述したようなバンド間の量子化誤差については、現状ではそれを補正するための技術は確立しておらず、この点での音質改善が図られないものとなっている。
【課題を解決するための手段】
【００１６】
そこで、本発明では、先ずは上記のような高域信号の欠落についての問題点に鑑み、信号処理装置として以下のように構成することとした。
つまり、所定の情報圧縮処理がされたオーディオ信号における所定の周波数以上の帯域の信号について、自己信号に対し自己信号を順次シフトさせていったときの自己相関計算を行う相関計算手段を備える。
また、上記自己相関計算の結果に基づき、相関性が最も高くなるときの相関最大シフト量を求めるシフト量検出手段を備える。
また、上記所定の周波数以上の帯域において、上記シフト量検出手段により求められた上記相関最大シフト量に基づく分だけ離間した各周波数ポイントでの各振幅値の比率を計算する比率計算手段を備える。
さらに、上記所定の周波数以上の帯域内で信号が欠落している各補間対象周波数ポイントの振幅値を、それら各補間対象周波数ポイントから上記相関最大シフト量に基づく分だけ離間した周波数ポイントにおける振幅値と上記比率とに基づき計算した値で補間する補間手段を備えるものである。
【００１７】
上記本発明では、所定の周波数以上の帯域において自己相関計算を行い、その結果得られる相関値を最大とするシフト量（相関最大シフト量）を求めるものとしている。この相関最大シフト量の値としては、上記所定の周波数以上の帯域では、その値だけシフトさせたときに自己相関が最も高いということを示すものとなる。このため、信号成分が失われた以降の各補間対象周波数ポイントの信号を補間するにあたり、上記のようにして先ず相関最大シフト量だけ離間した周波数ポイント間の振幅値の比率を計算した上で、各補間対象周波数ポイントから上記相関最大シフト量だけ離間した周波数ポイントにおける振幅値と上記比率とに基づき計算した値で各補間対象周波数ポイントの信号を補間すれば、相関性のある部分の信号に基づいて生成した違和感のない信号により高域を補間することができる。
【００１８】
また、本発明では、上述した割り当てビット数の削減による量子化誤差についての問題点に鑑み、信号処理装置として以下のように構成することとした。
つまり、所定の情報圧縮処理がされたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段を備える。
また、上記オーディオ信号について、周波数軸上で振幅値が所定の値となっている部分を誤差候補部分として検出する誤差候補部分検出手段を備える。
さらに、上記誤差候補部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記誤差候補部分の振幅値を上記予測信号の値に基づき置換する置換手段を備えるものである。
【００１９】
上記のようにして周波数軸上で所定値となっている部分を検出し、その部分の振幅値を、予測信号の値との比較結果に基づいて上記予測信号の値に基づき置換することで、割り当てビット数の少なさに起因した大きな量子化誤差の生じている部分を適正に検出し、誤差部分の振幅値を予測信号に応じたより確からしい値で補正することができる。
【００２０】
さらに、本発明では、上述したバンド間の量子化誤差の問題に鑑みて、信号処理装置として以下のように構成することとした。
つまり、所定の周波数バンド単位でビット数割り当てのための分解能を定める情報圧縮処理がされたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段を備える。
また、上記オーディオ信号について、それぞれ分解能の値が異なっている連続した周波数バンド間の境界部分を検出する境界部分検出手段を備える。
さらに、上記境界部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記境界部分の振幅値を上記予測信号の値に基づき置換する置換手段を備えるものとした。
【００２１】
上記のようにして分解能の値が異なっている連続した周波数バンド間の境界部分を検出し、その境界部分の振幅値を予測信号と比較した結果に基づいて予測信号の値に基づき置換するものとすれば、割り当てビット数の差によってバンド間で大きな量子化誤差が生じてバンド間の連続性が損なわれた部分を適正に検出し、その部分の振幅値を予測信号に基づくより確からしい値で補正することができる。
【発明の効果】
【００２２】
上記のようにして、高域補間についての本発明によれば、残された高域側の信号についての自己相関計算結果に基づき、さらに高域の信号の失われた部分を補間するものとしたことで、失われた信号成分を正しく補間することができる。
また、このような本発明は、補間処理にあたっては自己相関計算と比率計算、及び相関最大シフト量と比率とを用いた追加すべき信号値の計算といった、比較的簡易な四則演算のみを行えばよい。この点で、従来のようにして、基準バンドを特定するにあたり信号が存在する帯域を分割し、分割した数だけ組合せを作り相関関係を求めるとった手法を採る場合と比較すれば、処理負担は格段に軽くすることができる。
【００２３】
また、上記本発明の補間手法によれば、補間処理にあたっては、常に自己相関計算、比率計算、相関最大シフト量と比率とに基づく信号追加を行うだけでよい。すなわち、所定のフレーム単位ごとの補間処理として、その内容は同じものとすることができる。この点から、従来のように各フレームごとに処理内容が変化し、処理量や処理時間が入力信号に左右されて変わってしまうといった不都合は生じないものとなる。
【００２４】
また、本発明の高域補間手法としては、復号化処理とは独立した処理とできるので、特に符号化側と共通な復号アルゴリズムとする必要はなく、汎用性が失われるといった問題は生じないようにすることができる。
【００２５】
また、上記量子化誤差補正についての本発明によれば、割り当てビット数の少なさに起因した大きな量子化誤差の生じている部分を適正に検出し、誤差部分の振幅値を予測信号に応じたより確からしい値で補正することができる。すなわち、これによって圧縮符号化による音質劣化を効果的に抑圧することができる。
【００２６】
そして、上記本発明によれば、このような音質改善効果を得るにあたっては、予測信号を生成し、その値と音声信号の振幅値とを比較した結果に基づき予測信号の値との置換を行えばよいのみとすることができる。
これによれば、例えば従来のように本来とり得る値の範囲を算出し、相隣接する周波数帯域の符号化信号から最小二乗法を使って補正値を算出し、補正値が範囲内の値であれば既存の信号と置き換え、範囲外であれば、範囲の最小値・最大値などを用いて既存の信号との置き換えを行う、という手法で高音質化を図るとした場合と比較して、処理負担は格段に軽くすることができる。
【００２７】
さらに、バンド間の量子化誤差に関する本発明によれば、割り当てビット数の差によってバンド間で大きな量子化誤差が生じてバンド間の連続性が損なわれた部分を適正に検出し、その部分の振幅値を予測信号に基づくより確からしい値によって補正することができる。すなわち、これによって割り当てビット数の差によって生じるバンド間部分での波形の不連続性を有効に改善することができ、この結果、高音質化を図ることができる。
【発明を実施するための最良の形態】
【００２８】
以下、発明を実施するための最良の形態（以下実施の形態とする）について説明していく。
なお以下、各実施の形態（第１〜第３の実施の形態）の説明にあたっては、音声符号化方式として、ＭＰＥＧ−２ＡＡＣ（Moving Pictures Experts Group-2 Advanced Audio Coding）と呼ばれるＩＳＯ／ＩＥＣ１３８１８−７規格の符号化方式が採用され、その復号処理を行う場合を例に挙げる。
また、以下においては、ＭＰＥＧ−２ＡＡＣを、単にＡＡＣとも呼ぶ。
なお、上記ＩＳＯは、国際標準化機構（International Organization for Standardization）の略称であり、ＩＥＣは、国際電気標準会議（International Electrotechnical Commission）の略称である。
【００２９】
［ＡＡＣ符号化処理の概要］
先ず、実施の形態を説明する上での前提として、ＡＡＣ方式の符号化処理の概要について述べておく。
ＡＡＣ方式による音声符号化処理は、周波数相関符号化処理として、心理聴覚（psycho acoustics）に基づいて、人が知覚できない音の領域はデータ化しないことで、圧縮効果を高めているものである。ＡＡＣ方式の符号化によると、例えば２チャンネルステレオ音声の場合、９６キロビット／秒程度の伝送量でもＣＤ（Compact Disc）なみの音質が得られ、約１／１５（１５分の１）の圧縮率が得られるものとなる。
【００３０】
ＡＡＣ方式では、上述した心理聴覚分析の結果に基づいて、（１）ゲイン調整処理→（２）適応ブロック長切換ＭＤＣＴ処理→（３）ＴＮＳ処理→（４）インテンシティ・ステレオ符号化処理→（５）予測処理→（６）Ｍ／Ｓステレオ処理→（７）スケーリング処理が行われた後に、（８）量子化処理と（９）ハフマン符号化処理とが、割り当てられたビット数を下回るまで反復されて、符号化音声データが形成される。実際には、これらの処理過程において付すべき種々の係数等が付加されることにより最終的な符号化音声信号（ＡＡＣビットストリーム）が形成される。
【００３１】
以下に、具体的な処理内容を示す。
先ず、入力された符号化処理前の音声信号は、ゲイン調整され、所定のサンプル数毎にブロック化されて、これが１フレームとして処理される。符号化装置では、入力フレームを心理聴覚分析部においてＦＦＴ（Fast Fourier Transform）処理して周波数スペクトルを求め、それを元に聴覚のマスキングを計算し、予め設定された周波数帯域毎の許容量子化雑音電力と、そのフレームに対する心理聴覚エントロピー（ＰＥ：Perceptual Entropy）と呼ぶパラメータを求める。
【００３２】
心理聴覚エントロピーは、聴取者が雑音を知覚することがないようにそのフレームを量子化するのに必要な総ビット数に相当する。また、心理エントロピーは、音声信号のアタック部のように信号レベルが急激に増大するところで大きな値を取るという特性がある。そこで、心理エントロピーの値の急変部を元にしてＭＤＣＴ（Modified Discrete Cosine Transform）の変換ブロック長を決定する。
【００３３】
ＭＤＣＴ処理は、心理聴覚分析部で決定されたブロック長で入力された音声信号を周波数スペクトル（以下、ＭＤＣＴ係数という）に変換する。変換ブロック長を、入力信号に応じて適応的に切り換える処理（適応ブロック切り換え）は、プリエコーと呼ばれる聴覚的に有害な雑音を抑制するために必要な処理である。
【００３４】
ＭＤＣＴ処理によって形成されたＭＤＣＴ係数は、ＴＮＳ（Temporal Noise Shaping）処理される。このＴＮＳ処理は、ＭＤＣＴ係数を時間軸上の信号であるかのように見たてて、線形予測を行い、ＭＤＣＴ係数に対して予測フィルタリングを行うものである。このＴＮＳ処理により、復号処理側で逆ＭＤＣＴして得られる波形に含まれる量子化雑音は、信号レベルの大きなところに集まるようになる。
【００３５】
そして、ＴＮＳ処理されたＭＤＣＴ係数に対しては、インテンシティ・ステレオ符号化、すなわち、高い周波数領域の音は左チャンネル（Ｌチャンネル）と右チャンネル（Ｒチャンネル）を合わせた１つのカップリングチャンネルしか伝送しないようにするための処理が施される。
インテンシティ・ステレオ符号化されたＭＤＣＴ係数は、ＭＤＣＴ係数１本毎に、過去２フレームにおける量子化されたＭＤＣＴ係数から現在のＭＤＣＴ係数の値が予測され、その予測残差が求められる。この予測処理されたＭＤＣＴ係数は、Ｍ／Ｓステレオ処理により、左右チャンネルの和信号（Ｍ＝Ｌ＋Ｒ）と差信号（Ｓ＝Ｌ−Ｒ）を伝送するか、左右チャンネルのそれぞれ（ＬチャンネルとＲチャンネルとのそれぞれ）を伝送するかが決定され、出力される。
【００３６】
Ｍ／Ｓステレオ処理により出力されたＭＤＣＴ係数は、予め設定された周波数帯域毎の複数本でグループ化されて（スケーリングされ）、これを単位として量子化が行われる。これらＭＤＣＴ係数のグループをスケールファクタバンド（ｓｆｂ）と呼んでいる。このｓｆｂは、聴覚の特性に合わせて低域側では狭く、高域側では広くなるように設定されている。
【００３７】
量子化処理では、心理聴覚部で求めたｓｆｂ毎の許容量子化雑音電力を下回ることを目標に量子化を行う。量子化されたＭＤＣＴ係数は、さらにハフマン符号化が施されて冗長度が削減される。この量子化・ハフマン符号化の処理は反復ループで行われ、実際に生成される符号量が、フレームに割り当てられたビット数を下回るまで繰り返し行われる。
【００３８】
このように、ＡＡＣ符号化方式は、心理聴覚分析の結果に基づいて、（１）ゲイン調整処理→（２）適応ブロック長切換ＭＤＣＴ処理→（３）ＴＮＳ処理→（４）インテンシティ・ステレオ符号化処理→（５）予測処理→（６）Ｍ／Ｓステレオ処理→（７）スケーリング処理を行った後に、（８）量子化処理と（９）ハフマン符号化処理とを、割り当てられたビット数を下回るまで反復して行うことで、符号化された音声データを形成するようにされている。
【００３９】
なお、上述したＡＡＣ方式の音声符号化処理については、例えば「デジタルテレビ技術入門」高田豊、浅見聡著、米田出版、１１２頁〜１２４頁等の種々の文献、あるいは、Ｗｅｂページなどにおいても詳細に説明されている。
【００４０】
また、ゲイン調整処理、ＴＮＳ処理、インテンシティ・ステレオ符号化処理、予測処理、Ｍ／Ｓステレオ処理は、オプション処理であり、ＡＡＣ符号化全工程で行うものではない。すなわち、ゲイン調整処理、ＴＮＳ処理、インテンシティ・ステレオ符号化処理、予測処理、Ｍ／Ｓステレオ処理は、オプション処理が選択された場合にのみ行われる処理である。以下で説明する実施の形態においては、上述したオプション処理を行うようにされて圧縮符号化された符号化音声信号を処理する場合を例にして説明することとする。
【００４１】
＜第１の実施の形態＞

図１は、本発明の再生装置（電子機器）の第１の実施の形態としての再生装置１の内部構成について示したブロック図である。
この再生装置１は、図示する記憶部２として、例えばＨＤＤ（Hard Disc Drive）やフラッシュメモリ等の記憶デバイスに記憶された圧縮符号化音声信号を復号して再生可能なオーディオプレイヤとして構成される。
再生装置１には、この記憶部２に加え、復調部３、圧縮符号復号化部４、ＤＳＰ（Digital Signal Processor）５、バス６、システムコントローラ７、操作部８、表示部９が備えられている。
【００４２】
先ず、記憶部２においては、圧縮符号化音声信号がランレングスリミテッド符号化処理やエラー訂正コード付加処理等の所定処理が施された状態で記憶されている。復調部３は、記憶部２からの読み出し信号について、上記ランレングスリミテッド符号のデコードや上記エラー訂正コードに基づくエラー訂正処理等、所定の復調処理を行って圧縮符号化音声信号を得る。
【００４３】
復調部３の復調処理により得られた圧縮符号化音声信号は、圧縮符号復号化部４に供給され、ここにおいて圧縮符号の復号化処理が行われる。先の説明から理解されるように、本実施の形態では圧縮符号化音声信号がＡＡＣ圧縮符号化音声信号であることを前提としており、この圧縮符号復号化部４としてはＡＡＣ方式に対応した復号化処理を行うように構成されている。すなわち、ＡＡＣ圧縮符号化音声信号を音声出力可能な状態に復号化するように構成されている。
なお、この圧縮符号復号化部４の内部構成については後述する。
また、第１の実施の形態の場合、この圧縮符号復号化部４内には、図示するようにして高域補間部４ａが備えられるがこれについても後述する。
【００４４】
圧縮符号復号化部４の復号処理を経て得られた音声信号は、ＤＳＰ５に供給され、ここで所要の音声信号処理（例えばボリューム調整や各種音響効果付加処理等）が施された後、図示する出力端子Ｔoutに供給され外部出力される。
【００４５】
システムコントローラ７は、例えばＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、ＲＡＭ（Randam Access Memory）などを備えたマイクロコンピュータで構成され、図示するバス６を介して接続される記憶部２、復調部３、圧縮符号復号化部４、ＤＳＰ５との間で制御信号や各種データのやりとりすることで当該再生装置１の全体制御を行う。
例えばシステムコントローラ７は、後述する操作部８からの操作入力等に応じて記憶部２の信号読み出し制御を実行する。また、例えば操作部８からの操作入力等に応じてＤＳＰ５に音声信号処理の各種パラメータを設定する処理なども行う。
【００４６】
操作部８は、例えば再生装置１の筐体外面に表出するようにして備えられる図示されない操作キー等によるの入力デバイスであって、ユーザが各種操作入力やデータ入力を行う。操作部８で入力された情報はシステムコントローラ７に対して操作又はデータの入力情報として伝達される。システムコントローラ７は入力された情報に対応して必要な演算や制御を行う。
【００４７】
表示部９は、例えば液晶パネルなどの表示パネルを備え、ユーザに対して各種情報表示を行う。この場合は、システムコントローラ７からの指示に基づく各種情報の表示を行う。
【００４８】
［圧縮符号復号化部の構成］
図２は、図１に示した圧縮符号復号化部４の内部構成について示している。
先ず、圧縮符号復号化部４の構成要素としては、大別すると、フォーマット解析部１０、逆量子化処理部１１、ステレオ処理部１２、適応ブロック長切換逆ＭＤＣＴ部１３、ゲイン制御部１４に分けることができる。また、この場合の圧縮符号復号化部４には、図１にも示したように、高域補間部４ａが備えられることになる。
【００４９】
上記逆量子化処理部１１には、ハフマン復号化部１１ａ、逆量子化部１１ｂ、リスケーリング部１１ｃとが備えられる。また、上記ステレオ処理部１２には、Ｍ／Ｓステレオ処理部１２ａ、予測処理部１２ｂ、インテンシティ・ステレオ処理部１２ｃ、ＴＮＳ部１２ｄとが備えられている。
【００５０】
先ず、図１に示した復調部３からの符号化音声信号（ビットストリーム）は、フォーマット解析部１０に供給される。フォーマット解析部１０は、供給された符号化音声信号をＭＤＣＴ係数とそれ以外のパラメータや制御情報とに分離する。ＭＤＣＴ係数については、逆量子化処理部１１内のハフマン復号化部１１ａに供給する。
また、フォーマット解析部１０は、符号化音声信号のビットストリームから抽出したパラメータや制御情報に基づいて、各部に対する制御信号を形成し、これを図中の破線矢印で示すようにして圧縮符号復号化部４内の各部に対して供給することによって、各部における処理が制御される。
【００５１】
上記のようにしてフォーマット解析部１０で分離されたＭＤＣＴ係数については、上述したＡＡＣ符号化時の処理とは言わば逆となる処理を施すことによって、符号化音声信号の復号化処理が行われる。
具体的に、先ず上記ハフマン復号化部１１ａでは、フォーマット解析部１０から供給されるＭＤＣＴ係数についてハフマン復号処理を行う。次に、逆量子化部１１ｂにおいて逆量子化処理を行った後、リスケーリング部１１ｃにおいてリスケーリング処理を行うことで量子化前のＭＤＣＴ係数を復元する。
【００５２】
このようにして逆量子化処理部１１にて量子化前の状態に復元されたＭＤＣＴ係数は、ステレオ処理部１２内のＭ／Ｓステレオ処理部１２ａに供給される。
Ｍ／Ｓステレオ処理部１２ａにおいては、左チャンネル（Ｌｃｈ）と右チャンネル（Ｒｃｈ）のＭＤＣＴ係数が復元される。この左右２チャンネルのＭＤＣＴ係数は、次の予測処理部１２ｂにおいて処理されることで、符号化時の予測処理によるデータ圧縮前のＭＤＣＴ係数に復元され、さらにインテンシティ・ステレオ処理部１２ｃにおいて、インテンシティ・ステレオ復号化処理が施されて、高い周波数領域の音についても、左右のそれぞれのチャンネルのＭＤＣＴ係数に分配される。この後、ＴＮＳ部１２ｄにおいて、予測フィルタリングがはずされ、符号化時においてＭＤＣＴ処理された直後のＭＤＣＴ係数が復元される。
【００５３】
第１の実施の形態の場合、このようにステレオ処理部１２でＭＤＣＴ処理された直後に相当する状態に復元されたＭＤＣＴ係数は、図示するようにして高域補間部４ａによる高域補間を経た後に、適応ブロック長切換逆ＭＤＣＴ部１３に対して供給される。
なお、先にも述べたが、この高域補間部４ａによる高域補間処理の内容、及びその内部構成については後述する。
【００５４】
適応ブロック長切換逆ＭＤＣＴ部１３は、上記のようにして高域補間部４ａを介して供給されるＭＤＣＴ係数（周波数領域の音声信号）を逆ＭＤＣＴ処理することによって時間軸領域の音声信号（時間音声信号：音声出力可能な状態の音声信号）に変換し、これをゲイン制御部１４に供給する。
適応ブロック長切換逆ＭＤＣＴ部１３で得られた時間音声信号は、次段のゲイン制御部１４にてゲイン調整が行われた後、先の図１に示したＤＳＰ５に対して供給される。
【００５５】
[高域補間動作]
上記のようにして圧縮符号復号化部４では、ＡＡＣ方式で符号化されて形成された符号化音声信号の復号処理を行って、音声出力可能な音声信号を得るようにされる。
しかしながら、一般的に音声圧縮符号化は、周波数相関符号化として、上述したような心理聴覚分析などを用いた方式が採られるため、高域の音声信号が失われて音質が劣化する可能性が高いものとなっている。すなわち、このような圧縮符号化された音声信号を復号化して得られる音声信号としても、その音質が劣化している可能性が高いものである。
【００５６】
そこで、第１の実施の形態においては、符号化により失われてしまった高域部分の音声信号を補間することで、音質の改善を図る（つまり高音質化を図る）ようにしている。そしてそのための構成として、先の図２（図１）に示した高域補間部４ａを設けるようにしている。
【００５７】
先ずは、図３〜図７を参照して、第１の実施の形態の高域補間動作について説明する。
なお、以下で説明する動作は、図２に示したステレオ処理部１２から出力されるＡＡＣ１フレーム（１０２４サンプル）のＭＤＣＴ係数について行われるもので、実際においては、この１フレームごとの動作が繰り返されることで、時間音声信号の音質改善が図れることになる。
なお、上記ＡＡＣ１フレーム分のＭＤＣＴ係数は、例えばサンプリング周波数が４４．１kHzの場合、時間に換算すると０．０２３sec（１０２４／４４１００sec）程度となるものである。
【００５８】
先ずは図３により、ＡＡＣ１フレーム分のＭＤＣＴ係数の概要について説明する。図３では縦軸を振幅（ＭＤＣＴ係数の値）、横軸を周波数としたときの１フレーム分のＭＤＣＴ係数について模式的に示している。
ＡＡＣ方式では、サンプリング周波数が４８kHzまたは４４．１kHzの場合、１フレームは４９個のスケールファクタバンド（ｓｆｂ）に分割される。具体的には、低域側から高域側にかけて順にｓｆｂ[０]、ｓｆｂ[１]、ｓｆｂ[２]、・・・ｓｆｂ[４８]までｓｆｂの番号が割り振られる。
先にも述べたように、各スケールファクタバンドのバンド幅は、心理聴覚特性に基づき、低域側ではより狭く高域側では広くなるように設定されている。具体的には、最も低域側となるｓｆｂ[０]のバンド幅＝「４」（ＭＤＣＴ係数４個分）として、高域側にかけて徐々にバンド幅が広がるようになっている。
そして、ＡＡＣの場合、或る程度高域となると、ｓｆｂのバンド幅は一定となるようにされている。具体的には、ｓｆｂ[０]からｓｆｂ[２８]までは徐々にバンド幅が広がるようになっているが、それ以降ｓｆｂ[２９]（ＭＤＣＴ係数番号３２０からのｓｆｂ）からｓｆｂ[４７]（ＭＤＣＴ係数番号９２８までのｓｆｂ）までは、バンド幅は「３２」で一定となるようにされる。但し、図にも示されているように、最後のｓｆｂ[４８]のみはバンド幅＝「９６」とされる。
【００５９】
第１の実施の形態の高域補間動作では、上記のようにしてｓｆｂのバンド幅が一定となった以降、信号が存在する間の帯域（つまり符号化により信号が失われるまでの帯域）を、図示するようにして「高域サブバンド」として設定する。
ちなみに、ＡＡＣ方式（ビットレート１２８ｋbps）の場合、符号化により信号が失われることになるのは、概ねＭＤＣＴ係数番号＝６５０前後以降の帯域となる。
【００６０】
このようにして設定された高域サブバンドについて、第１の実施の形態では、その帯域内の信号を用いて、それ以降における信号が失われた部分についての補間を行う。
補間動作の概要は以下のようになる。
先ずは、特定した高域サブバンド内における自己相関計算を行う。すなわち、高域サブバンド内では、どの程度周波数方向にシフトさせると、自己信号との相関性が最も高くなるかを計算により求める。このように自己相関性が最も高くなるときのシフト量のことを、本明細書においては相関最大シフト量と呼ぶ。
そして、この相関最大シフト量と共に、信号が失われた部分を補間するための追加信号の生成に必要な情報として、Ｒａｔｅ（比率）の値を計算する。具体的には、高域サブバンド内において、上記相関最大シフト量だけ離間した各ＭＤＣＴ係数番号位置の振幅値の比率をＲａｔｅの値として計算する。
その上で、上記相関最大シフト量とＲａｔｅの値とを用いて、信号が失われた部分についての補間を行う。つまり、信号の失われた帯域内の各ＭＤＣＴ係数番号位置（各周波数ポイント）のＭＤＣＴ係数の値を、そのＭＤＣＴ係数番号から上記相関最大シフト量だけ戻った位置のＭＤＣＴ係数と上記Ｒａｔｅの値とに基づき計算した値で補間するものである。
【００６１】
図４〜図７では、第１の実施の形態としての高域補間動作の具体的な手順について説明する。
先ず図４は、自己相関計算を行うにあたって行われるべきピーク値検出動作について模式的に示している。なお、この図４においても、先の図３と同様に縦軸を振幅（ＭＤＣＴ係数の値）、横軸を周波数としたときの１フレーム分のＭＤＣＴ係数を示している。
【００６２】
図４において、先ず、ピーク値検出にあたっては、高域サブバンド内の各ｓｆｂを４等分する。そして、このように各ｓｆｂを４等分して得られることになる、ＭＤＣＴ係数８個分の各バンド（以下分割バンドと呼ぶ）内において、最も値（振幅）の大きいＭＤＣＴ係数を、その分割バンドのピーク値Ｐｅａｋとして検出する。
このピーク値Ｐｅａｋについては、図示するようにして最も低域側となる帯域から順にピーク値Ｐｅａｋ[０]、ピーク値Ｐｅａｋ[１]、ピーク値Ｐｅａｋ[２]、・・・ピーク値Ｐｅａｋ[ｎ]とする。
なお、確認のために述べておくと、上記Ｐｅａｋ[ｎ]の「ｎ」は、振幅がある最後の４等分されたバンドの番号（つまり分割バンドの番号）を指すものである。例えば仮に、ｓｆｂ[３０]よりも高域側で信号が失われたという場合には、３２０／８＝４０より、ピーク値Ｐｅａｋ[４０]までが検出されるといったものである。
【００６３】
このようにしてピーク値Ｐｅａｋを検出すると、それらの値を用いて高域サブバンド内での自己相関計算を行う。
図５は、自己相関計算を説明するための模式図として、先の図３と同様に縦軸を振幅（ＭＤＣＴ係数の値）横軸を周波数としたときの１フレーム分のＭＤＣＴ係数について示している。
【００６４】
図５において、自己相関計算を行うにあたっては、先ずはシフト量ｊを設定することになる。このシフト量ｊの値は、自己信号をどの程度シフトさせた状態から自己相関計算を開始するかを決定付けるための値となる。すなわち、図示するようにして高域サブバンド内の各ピーク値Ｐｅａｋで構成されることになる、高域サブバンドの自己信号に対し、この自己信号をシフト量ｊの値だけシフトさせた位置から自己相関計算を開始するものである。
本例の場合、このシフト量ｊの値としては例えばｊ＝２０を設定することとしている。
【００６５】
自己相関計算の具体的な内容としては、ピーク値Ｐｅａｋが検出された分割バンドの番号を「ｉ」、信号（ＭＤＣＴ係数）が存在する最後の分割バンド番号を「Ｎ」とした場合に、以下の式１で表すことができる。

【数１】

【００６６】
この自己相関計算により、各シフト位置での相関値が求まる。これらの相関値のうち、その値が最大となるときのシフト量ｊの値が、最も相関性が高くなるときの相関最大シフト量の値となる。以下では、この相関最大シフト量の値を「ｋ」とおく。
【００６７】
なお、これまでの説明では、原信号において必ず高域の信号成分が含まれていることを前提としたが、実際においては、原信号は比較的低域の成分のみを含み、高域成分が全く含まれていないといった場合も想定できる。そのような場合に高域補間が行われてしまうと、もともとない部分の信号成分が不自然に追加されてしまうことになり、かえって音質の劣化を招く可能性がある。
そこで第１の実施の形態では、原信号にもともと高域成分が含まれているか否かを判別し、その結果に基づき、以降で説明する高域補間を実行するか否かを判定するものとしている。
この場合、原信号にもともと高域成分が含まれているか否かの判別は、上記のようにして自己相関計算で得られる相関値を利用するものとしている。具体的には、計算された相関値のうちその値が大きい上位５つの相関値を選出し、それらの総和が予め定められた閾値（例えば１．０）以上である場合には、原信号において高域成分が含まれていたとして、以降の高域補間のための動作を実行する。
一方、値の大きい上位５つの相関値の総和が上記閾値（１．０）未満である場合には、原信号において高域がもともと含まれていなかったとして、以降の高域補間のための動作は行わないようにする。
【００６８】
続いて、図６は、Ｒａｔｅの計算手法について示している。この図６においても先の図３と同様に縦軸を振幅（ＭＤＣＴ係数の値）、横軸を周波数としたときの１フレーム分のＭＤＣＴ係数を示している。
上述のようにして求められた相関最大シフト量「ｋ」の値は、高域サブバンド内ではこの値「ｋ」だけシフトさせると自己との相関性が最も高くなるということを示す値となる。そこで、この相関最大シフト量「ｋ」を用いて、高域側に「ｋ」だけシフトさせた位置での振幅の比率（Ｒａｔｅ）を求める。
【００６９】
本実施の形態の場合、このＲａｔｅの計算は、信号が存在する最後の分割バンド（分割バンド[ｎ］）で検出されたＰｅａｋ[ｎ]を基準として行うものとしている。
具体的には、図示するようにして先ずは分割バンド[ｎ]のＰｅａｋ[ｎ]と、この分割バンド[ｎ]から相関最大シフト量「ｋ」だけ低域側に戻った位置の分割バンド[ｍ]のピーク値Ｐｅａｋ[ｍ]との振幅比率を計算により求める。すなわち、Ｐｅａｋ[ｍ]／Ｐｅａｋ[ｎ]を計算する。
同様に、分割バンド[ｎ−１]におけるピーク値Ｐｅａｋ[ｎ−１]と、分割バンド[ｍ−１]のピーク値Ｐｅａｋ[ｍ−１]との振幅比率（Ｐｅａｋ[ｍ−１]／Ｐｅａｋ[ｎ−１]）を計算する。
以降も同様に、所定値ｘとして、分割バンド[ｎ−ｘ]までについて、同様の比率計算を行う。例えば本例の場合、所定値ｘ＝５として、ピーク値Ｐｅａｋ[ｎ−５]と、ピーク値Ｐｅａｋ[ｍ−５]との振幅比率（Ｐｅａｋ[ｍ−５]／Ｐｅａｋ[ｎ−５]）までを計算する。
そして、この結果得られることになる計５つの振幅比率の値を平均化したものを、最終的なＲａｔｅの値として算出する。
【００７０】
上記の手順により、相関最大シフト量「ｋ」とＲａｔｅの値とを計算すると、次の図７に示すようにして、信号がなくなる帯域、すなわち補間対象となるべき帯域における各ＭＤＣＴ係数番号位置に対する実際のＭＤＣＴ係数の補間（追加）を行う。
なお、この図７においても先の図３と同様に縦軸を振幅（ＭＤＣＴ係数の値）、横軸を周波数としたときの１フレーム分のＭＤＣＴ係数を示している。
【００７１】
先ず、先に求めた相関最大シフト量「ｋ」の値は、ピーク値Ｐｅａｋを元に求めた値であり、従って分割バンド単位（つまりＭＤＣＴ係数８個分の単位）で換算したシフト量となっている。これに対し、実際の信号の追加（補間）は、各ＭＤＣＴ係数番号位置について行うことから、これをＭＤＣＴ係数番号単位での値に戻すことが必要となる。具体的には、ｋ×８とすることで、ＭＤＣＴ係数単位での相関最大シフト量に戻すことができる。
そして、具体的な補間動作としては、信号がなくなる帯域内の各ＭＤＣＴ係数番号位置の値を、それら各ＭＤＣＴ係数番号位置からそれぞれｋ×８だけ低域側に戻った位置のＭＤＣＴ係数の値とＲａｔｅの値とに基づき計算した値で補間する。換言すれば、このようにして計算した値で各ＭＤＣＴ係数番号位置にＭＤＣＴ係数を追加するものである。
この場合、Ｒａｔｅの値は、先の図６で説明したようにしてｍ／ｎ、すなわち振幅のより小さい高域側を分母としたので、高域に従って振幅が減衰するという特性に合うように、各ＭＤＣＴ係数位置の値を上記Ｒａｔｅの値で除算した値により、各ＭＤＣＴ係数位置の値を補間する。
【００７２】
［高域補間部の内部構成］
図８は、上記により説明した第１の実施の形態の高域補間動作を実現するための高域補間部４ａ内の構成について示すブロック図である。
図示するようにして高域補間部４ａ内には、Ｐｅａｋ検出部２１、自己相関計算部２２、相関最大シフト量検出部２３、Ｒａｔｅ計算部２４、高域信号追加部２５、補間判定部２６が備えられている。
【００７３】
先ず、この図８においても、先の図２に示したステレオ処理部１２、及び適応ブロック長切り換え逆ＭＤＣＴ部１３が示されている。
ステレオ処理部１２から出力されるＡＡＣ１フレーム単位ごとのＭＤＣＴ係数は、図示するようにしてＰｅａｋ検出部２１に対して入力されると共に、分岐して自己相関計算部２２、Ｒａｔｅ計算部２４、高域信号追加部２５のそれぞれに対しても供給される。
【００７４】
上記Ｐｅａｋ検出部２１では、供給された１フレーム分のＭＤＣＴ係数に基づき、予め定められた所定のｓｆｂ（この場合はｓｆｂ[２９]）から振幅がある最後のｓｆｂまでの帯域を高域サブバンドとして、この高域サブバンド内の各ｓｆｂを４分割して各分割バンドに分けた上で、それら各分割バンド内でのＭＤＣＴ係数のピーク値Ｐｅａｋを検出する。すなわち、先の図４にて説明したようなピーク値Ｐｅａｋ[０]〜ピーク値Ｐｅａｋ[ｎ]を検出する。
検出した各ピーク値Ｐｅａｋ[０]〜ピーク値Ｐｅａｋ[ｎ]は自己相関計算部２２とＲａｔｅ計算部２４に対して供給される。
【００７５】
自己相関計算部２２は、上記Ｐｅａｋ検出部２１から供給されたピーク値Ｐｅａｋ[０]〜ピーク値Ｐｅａｋ[ｎ]を入力し、先に説明したようにしてピーク値Ｐｅａｋが検出された分割バンドの番号を「ｉ」、ＭＤＣＴ係数の振幅が存在する最後の分割バンドの番号を「Ｎ」とした場合に、上述した式１による計算を行って各シフト位置での相関値を算出する。
【００７６】
相関最大シフト量検出部２３は、上記自己相関計算部２２にて計算された各シフト位置での相関値とそのシフト量の情報とを入力し、相関値が最大となるときのシフト量を相関最大シフト量「ｋ」として検出する。検出した相関最大シフト量「ｋ」の値はＲａｔｅ計算部２４と高域信号追加部２５に対して供給される。
【００７７】
また、上記自己相関計算部２２にて計算された各シフト位置での相関値は、補間判定部２６に対しても供給される。補間判定部２６は、自己相関計算部２２からの相関値について、その値が大きい順に上位５つの相関値を選出し、それらの総和が予め定められた所定閾値（この場合は１．０）以上であるか否かを判別する。計算した総和の値が上記閾値以上であると判別した場合は、原信号において高域成分が含まれていたと判定し、Ｒａｔｅ計算部２４、及び高域信号追加部２５に対して動作の実行を指示するための制御信号（実行指示信号）を供給する。一方、計算した総和の値が上記閾値未満であると判別した場合は、原信号にはもともと高域成分が含まれていなかったと判定し、Ｒａｔｅ計算部２４、及び高域信号追加部２５に対して動作を実行しないように指示するための制御信号（非実行指示信号）を供給する。
【００７８】
Ｒａｔｅ計算部２４は、Ｐｅａｋ検出部２１からのピーク値Ｐｅａｋ[０]〜Ｐｅａｋ[ｎ]と、相関最大シフト量検出部２３からの相関最大シフト量「ｋ」とを入力し、先の図６にて説明した手法によりＲａｔｅの値を計算する。つまり、分割バンド[ｎ]〜[ｎ−５]のピーク値Ｐｅａｋについて、相関最大シフト量「ｋ」だけ低域側に戻った分割バンドでのピーク値Ｐｅａｋとの振幅比率をそれぞれ計算した上で、その結果求まった計５つの振幅比率の値を平均化したものを、最終的なＲａｔｅの値として算出する。
また、Ｒａｔｅ計算部２４は、上記補間判定部２６からの制御信号に応じて上記Ｒａｔｅの計算動作を実行／非実行とするように構成される。すなわち、上記実行指示信号に応じては上記Ｒａｔｅ計算動作を行い、上記非実行指示信号に応じては上記Ｒａｔｅ計算動作は実行しないように構成される。
Ｒａｔｅ計算部２４により計算されたＲａｔｅの値は高域信号追加部２５に対して供給される。
【００７９】
高域信号追加部２５は、ステレオ処理部１２からのＭＤＣＴ係数と、相関最大シフト量検出部２３からの相関最大シフト量「ｋ」と、Ｒａｔｅ計算部２４からのＲａｔｅの値とを入力し、先の図７にて説明した手法により信号がなくなる帯域内の各ＭＤＣＴ係数番号位置のＭＤＣＴ係数の値を追加する。
すなわち、信号がなくなる帯域内の各ＭＤＣＴ係数番号位置に対し、それら各ＭＤＣＴ係数番号位置からそれぞれｋ×８だけ低域側に戻った位置のＭＤＣＴ係数の値をＲａｔｅの値で除算した値を追加する処理を行うものである。
【００８０】
なお、ここでの図示は省略したが、実際においては、高域補間部４ａ内の各部では共通のｎフレーム目のＭＤＣＴ係数について処理が実行されるように、必要な部分に遅延回路を設けて各信号の供給タイミングを調整するなどの対策が行われるべきである。
【００８１】
上記のようにして第１の実施の形態では、高域サブバンド内における自己相関計算を行って、相関最大シフト量を求めた上で、高域サブバンド内において、この相関最大シフト量だけ離間した各ＭＤＣＴ係数番号位置間での振幅比率を計算した結果に基づきＲａｔｅの値を計算するようにしている。
その上で、上記相関最大シフト量とＲａｔｅとを用いて、信号の失われた帯域内の各ＭＤＣＴ係数番号位置のＭＤＣＴ係数の値を、そのＭＤＣＴ係数番号位置から上記相関最大シフト量だけ戻った位置のＭＤＣＴ係数を上記Ｒａｔｅの値で除算した値で補間するようにしている。
このようにして自己相関計算結果から求まった相関最大シフト量とＲａｔｅの値とに基づき、符号化で信号が失われた帯域を補間することで、高域サブバンド内での相関性と、高域側に向けての振幅の減衰度合いとを踏襲したかたちで信号を追加することができ、この結果、より自然な信号で信号が失われた帯域を補間することができる。すなわち、これによって音質の向上を図ることができる。
【００８２】
また、第１の実施の形態では、相関最大シフト量を求めるにあたり、高域サブバンド内を所定単位の分割バンドごとに分割して、それぞれの分割バンド内のピーク値Ｐｅａｋを検出し、このピーク値Ｐｅａｋを用いて自己相関計算を行うものとしたが、このことで以下のような効果を得ることができる。
すなわち、このようなピーク値Ｐｅａｋは、その分割バンド内での特徴をよく表したものとなるので、このようにピーク値Ｐｅａｋを用いた自己相関計算とすることで、より信頼性の高い自己相関計算を行うことができ、従ってこの自己相関計算結果に基づき求められる相関最大シフト量「ｋ」の値としても、より信頼性の高い値を得ることができることになる。
【００８３】
また、第１の実施の形態では、シフト量ｊの値としてｊ＝２０を設定し、高域サブバンドの始点から分割バンド２０個分ずらした位置から自己相関計算を開始するものとしたが、このシフト量ｊの値としては、ｊ＝１以外であれば他の値を設定することができる。すなわち、ｊ＝１としたときは、その時点で自己相関計算値が最大となってしまうことから、大前提としてｊ≧２であることが必須となる。
このとき、ｊの値としては、その値が小さければその分最終的なシフト位置に至るまでのシフト量が増え、自己相関計算量が増大化することになる。また、逆に大きければ自己相関計算量は少なくできるという性質をもつ。
この点を考慮すると、シフト量ｊの値は、できるだけ大きくして自己相関計算の処理負担の軽減を図ることが考えられるが、実際には、高域側の信号では高調波が出やすい傾向となるので、シフト量ｊとしてあまりに大きな値を設定した場合には、自己相関計算の結果の信頼性を著しく損なう虞がある。
ここで、一般的に考えて、高域サブバンドの始点となるＭＤＣＴ係数番号＝３２０近傍のピーク値Ｐｅａｋは、３２０の最初の整数倍（２倍）であるＭＤＣＴ係数番号＝６４０付近のピーク値Ｐｅａｋと相関性が高くなるであろうということが予想できる。本実施の形態では、この点に鑑み、ｊ＝２０（ＭＤＣＴ係数番号で換算すると２０×８＝１６０個分のシフト量であり、相関計算開始位置は３２０＋１６０＝４８０付近となる）を設定している。すなわち、相関性が最も高くなると予測されるＭＤＣＴ係数番号＝６４０付近からおよそ１６０個分程度マージンをとった位置から、相関計算を開始するようにしているものである。
このような予測位置から実際の計算開始位置までのマージンは、大きくすればする程、自己相関計算結果、すなわち相関最大シフト量の検出精度を向上させることができる。しかしながらこのマージンをとりすぎると、結果としてｊの値は小さくなり、その分最終的なシフト位置に至るまでのシフト量が増えて自己相関計算量が増大化してしまうことになる。
以上のことから、ｊの値の設定によって自己相関計算の処理負担の軽減を図ることと、相関最大シフト量の検出精度を高めることとはトレードオフの関係にあることがわかる。実際のシフト量ｊの値の設定にあたっては、これら自己相関計算の処理負担の軽減と相関最大シフト量の信頼性確保の双方を考慮した上で、最適とされる値が設定されればよい。その最適点の一例として、本例ではｊ＝２０を例示している。
【００８４】
また、上記により説明した第１の実施の形態の高域補間動作によれば、１フレーム当たりで自己相関計算は１度のみ行えばよく、あとは比率を計算した上で既存の信号を比率で除算するという処理のみで高域の信号を補間できる。この点で、従来の手法のように、基準バンドを特定するにあたり、信号が存在する帯域を分割し、分割した数だけ組合せを作り相関関係を求めるとった処理を行う場合と比較すれば、処理負担は格段に軽くすることができる。
また、第１の実施の形態の高域補間としては、その処理内容はフレーム単位で同じ（自己相関計算・比率計算・相関最大シフト量と比率とに基づく高域信号の追加）であり、従来のように各フレームごとに処理内容が変化して処理量や処理時間が入力信号に左右されて変わってしまうといった不都合は生じない。
また、復号化処理とは独立した処理とできるので、特に符号化側と共通な復号アルゴリズムとする必要はなく、汎用性が失われるといった問題も生じないようにすることができる。
【００８５】
図９には、第１の実施の形態の有効性を実証するための実験結果を示す。この図９においては、ＡＡＣ１フレーム分の音声信号について、図９（ａ）は原信号のスペクトログラムを、図９（ｂ）は上記原信号を符号化した符号化信号を従来通りの復号化処理で復号化した信号のスペクトログラムを、図９（ｃ）は本例の補間処理で生成された高域信号のスペクトログラムを、また図９（ｄ）は上記復号化処理後の信号に上記補間処理で生成された高域信号を追加した信号のスペクトログラムをそれぞれ示している。
なお、図９の各図においては縦軸を周波数、横軸を時間とし、振幅の強さは色の濃さにより表している。また図９では一例として、ＡＡＣ方式・ビットレート＝１２８ｋbpsにより符号化された音声信号について復号化・高域補間を行ったときの結果を示している。
【００８６】
先ず、図９（ａ）と図９（ｂ）とを比較してわかるように、符号化に伴っては、高域信号の欠落が生じる。先に説明した本例の高域補間によっては、図９（ｃ）に示すようにして、符号化により欠落した部分の信号が生成され、これが図９（ｄ）に示されるようにして復号化後の信号における欠落が生じた部分に対して追加されることになる。
この図９（ｄ）より、本例の高域補間が行われることによっては、符号化により欠落しなかった高域部分での相関を活かして、欠落が生じた部分の信号が追加されていることが理解できる。
【００８７】
なお、ここまでの説明では、第１の実施の形態の高域補間動作が、先の図８に示したようなハードウェア構成により実現される場合を例示したが、第１の実施の形態の高域補間動作としてはソフトウェア処理によっても実現することができる。つまり、高域補間部４ａとしては、例えばＣＰＵやメモリを備えた演算処理部で構成することができ、この演算処理部のソフトウェア処理により上述した実施の形態としての高域補間動作を実現するものである。
【００８８】
この場合において実行されるべき処理動作を、次の図１０のフローチャートに示す。
なお、この図に示す処理動作は、上述のような高域補間部４ａとしての演算処理部が、例えば上記メモリ内に格納されるプログラムに従って実行するものである。
先ずステップＳ１０１では、Ｐｅａｋ検出処理を実行する。すなわち、ステレオ処理部１２から供給された１フレーム分のＭＤＣＴ係数に基づき、予め定められた所定のｓｆｂ（この場合はｓｆｂ[２９]）から振幅がある最後のｓｆｂまでの帯域を高域サブバンドとして、この高域サブバンド内の各ｓｆｂを４分割して各分割バンドに分けた上で、それら各分割バンド内でのＭＤＣＴ係数のピーク値Ｐｅａｋを検出する。これによって先の図４にて説明したようなピーク値Ｐｅａｋ[０]〜ピーク値Ｐｅａｋ[ｎ]が検出される。
【００８９】
続くステップＳ１０２では、自己相関計算処理を実行する。つまり、検出したピーク値Ｐｅａｋ[０]〜ピーク値Ｐｅａｋ[ｎ]の情報を用い、ピーク値Ｐｅａｋが検出された分割バンド番号を「ｉ」、振幅が存在する最後の分割バンド番号を「Ｎ」とした場合に、先に示した式１による計算を行って各シフト位置での相関値を算出する。
【００９０】
次のステップＳ１０３では、先ずは計算した相関値について、値が大きい上位５つの相関値を選出する。
そして、続くステップＳ１０４において、補間するか否かの判別処理を実行する。すなわち、選出した上位５つの相関値の総和と、予め定められた所定閾値（１．０）とを比較し、相関値の総和が上記閾値以上となっているか否か（補間するか否か）を判別する。
【００９１】
ステップＳ１０４において、上記相関値の総和が上記閾値以上ではなく、補間しないとの否定結果が得られた場合は、図示するようにしてそのまま「ＲＥＴＵＲＮ」となる。
一方、上記相関値の総和が上記閾値以上であり、補間するとの肯定結果が得られた場合は、ステップＳ１０５に進む。
【００９２】
ステップＳ１０５では、相関最大シフト量「ｋ」の検出処理として、先のステップＳ１０２で計算した相関値が最大となるときのシフト量を相関最大シフト量「ｋ」として検出する。
そして、続くステップＳ１０６では、Ｒａｔｅ計算処理を実行する。すなわち、ステップＳ１０１にて検出したピーク値Ｐｅａｋ[０]〜Ｐｅａｋ[ｎ]と、上記相関最大シフト量「ｋ」とを用いて、先の図６にて説明した手法によりＲａｔｅの値を計算する。具体的には、分割バンド[ｎ]〜[ｎ−５]のピーク値Ｐｅａｋについて、それぞれ相関最大シフト量「ｋ」だけ低域側に戻った分割バンドでのピーク値Ｐｅａｋとの振幅比率を計算した上で、その結果求まった計５つの振幅比率の値を平均化したものを最終的なＲａｔｅの値として算出する。
【００９３】
さらに、続くステップＳ１０７では、相関最大シフト量「ｋ」とＲａｔｅの値とに基づく高域信号追加処理を実行する。すなわち、供給された１フレーム分のＭＤＣＴ係数について、信号（振幅）がなくなる帯域内の各ＭＤＣＴ係数番号位置に対し、それら各ＭＤＣＴ係数番号位置からそれぞれｋ×８だけ低域側に戻った位置のＭＤＣＴ係数の値をＲａｔｅの値で除算した値を追加する処理を行う。
このステップＳ１０７の処理を実行すると、図示するようにして「ＲＥＴＵＲＮ」となり、これによって上記により説明した処理（Ｓ１０１〜Ｓ１０７）が１フレームごとに繰り返し実行されることになる。
【００９４】
なお、図１０では、原信号にもともと高域信号がないか否かに応じてＲａｔｅ計算処理・高域信号追加処理を実行／非実行とするための処理（ステップＳ１０３の選出処理・ステップＳ１０４の判別処理）を、連続した１セットの処理として実行する場合を例示したが、このようなステップＳ１０３・Ｓ１０４の処理は、必ずしも連続した処理として実行される必要はない。例えば、ステップＳ１０３→ステップＳ１０５→ステップＳ１０４の順に処理を実行することもできる。
また、ステップＳ１０４の判別処理が、相関最大シフト量「ｋ」の検出処理前に実行される場合を例示したが、このステップＳ１０４の判別処理としては、Ｒａｔｅ計算処理と高域信号追加処理よりも前であって、上位５つの相関値の選出処理後となるタイミングであれば任意のタイミングで行うことができる。また、ステップＳ１０３の選出処理としては、自己相関計算処理後であって、補間するか否かの判別処理前となるタイミングであれば任意のタイミングで行うことができる。
【００９５】
また、これまでの説明では、高域補間部４ａが圧縮符号復号化部４内に設けられる場合を例示したが、例えば次の図１１に示すようにして、圧縮符号復号化部４の外部に対して高域補間部４ａを設けるようにすることもできる。
【００９６】
図１１において、この場合の圧縮符号復号化部４内においては、高域補間部４ａが省略され、ステレオ処理部１２からのＭＤＣＴ係数は直接的に適応ブロック長切換逆ＭＤＣＴ部１３に供給されるようになっている。
そして、圧縮符号復号化部４から出力される音声信号（時間音声信号）を入力して、これを再度ＭＤＣＴ変換して周波数軸領域の音声信号に変換するＭＤＣＴ変換部３０を追加するものとしている。
その上で、この場合の高域補間部４ａに対しては、このＭＤＣＴ変換部３０にて時間−周波数変換された音声信号（ＭＤＣＴ係数）を、ＡＡＣ１フレーム単位ごとに入力する。
なお、この場合も高域補間部４ａが行う動作としては先に説明したものと同様となるため改めての説明は省略する。
【００９７】
そして、この高域補間部４ａにて高域信号が追加されたＭＤＣＴ係数を、図中逆ＭＤＣＴ変換部３１により再度逆ＭＤＣＴ変換させ、音声出力可能な時間音声信号に戻すようにする。このようにして得られた時間音声信号が、図１に示したＤＳＰ５に対して供給される。
【００９８】
このようにして第１の実施の形態の高域補間動作を行う高域補間部４ａとしては、圧縮符号復号化部４の外部に設けて、復号化処理の完了した音声信号について高音質化を図るようにすることもできる。
但し、上記説明からも理解されるように、このようにして圧縮符号復号化部４外部に設ける場合には、復号化後の時間音声信号を再度周波数変換された状態の音声信号に戻すための構成（ＭＤＣＴ変換部３０）と、高域補間後の周波数軸領域の音声信号を再度時間軸領域の音声信号に戻すための構成（逆ＭＤＣＴ変換部３１）とが別途必要となる。
この点に鑑み、先の図１に示した再生装置１では、高域補間部４ａを圧縮符号復号化部４内に設けて、復号化処理の過程で既に周波数軸領域に変換された状態にある音声信号について高域補間を施すようにしたことで、上記のような別途の構成が不要となるようにしたものである。
【００９９】
以上、第１の実施の形態について説明したが、本発明の高域補間としてはこれまでの具体例に限定されるべきものではない。
例えばこれまでの説明では、Ｒａｔｅの値は、高域サブバンドの終点側（最も高域側）を基準として行ったが、始点側（最も低域側）を基準として行うこともできる。つまり、ピーク値Ｐｅａｋ[ｋ]／ピーク値Ｐｅａｋ[０]、ピーク値Ｐｅａｋ[ｋ＋１]／ピーク値Ｐｅａｋ[１]、・・・ピーク値Ｐｅａｋ[ｋ＋ｘ]／ピーク値Ｐｅａｋ[ｘ]のように、高域サブバンドの始点〜所定値ｘまでの各分割バンドのピーク値Ｐｅａｋについて、それぞれ＋ｋとした分割バンドのピーク値Ｐｅａｋとの振幅比率を計算し、それらの平均値をＲａｔｅの値として算出するといったものである。
但し、先の例のように終点側を基準としたＲａｔｅ計算とすれば、補間すべき部分により近いところでＲａｔｅを計算できる分、始点側で計算する場合よりも信頼性の高いＲａｔｅの値を得ることができる。すなわち、そのようなＲａｔｅの値を使用して高域信号追加を行うことで、より自然な信号で高域の信号を補間することができるようになる。
【０１００】
また、Ｒａｔｅの値は、相関最大シフト量「ｋ」だけ離間した複数組の各ピーク値Ｐｅａｋの振幅比率を平均化した値を計算するものとしたが、ｋだけ離間した１組の各ピーク値Ｐｅａｋの振幅比率をそのままＲａｔｅの値とすることもできる。
但し、複数組の振幅比率を平均化した値とすれば、１組の振幅比率のみからＲａｔｅを計算する場合よりもＲａｔｅの値の信頼性は高めることができる。
【０１０１】
また、ピーク値Ｐｅａｋについては、ＭＤＣＴ係数８個分の分割バンド単位で区切ったときのピーク値としたが、ピーク値Ｐｅａｋを得るための分割バンド幅は「８」以外の他の数値とすることもできる。
【０１０２】
また、これまでの説明では、ピーク値Ｐｅａｋを自己信号として自己相関計算を行うものとしたが、ピーク値Ｐｅａｋは検出せずに、各ＭＤＣＴ係数番号位置のＭＤＣＴ係数を用いて自己相関計算を行うこともできる。また、Ｒａｔｅの計算としても、ピーク値Ｐｅａｋは検出せずに、ＭＤＣＴ係数を用いて行うことができる。
各ＭＤＣＴ係数番号位置のＭＤＣＴ係数を用いた自己相関計算を行った場合、相関最大シフト量としてはＭＤＣＴ係数番号単位での値となる。この場合、仮にＲａｔｅ計算については先の具体例と同様にピーク値Ｐｅａｋを用いて行うとするのであれば、このようなＭＤＣＴ係数番号単位での相関最大シフト量を１／８に除算（つまり分割バンド幅で除算）し、その値だけ離間した各ピーク値Ｐｅａｋの振幅比率を計算した結果に基づきＲａｔｅの値を算出すればよい。
また、このように各ＭＤＣＴ係数番号位置のＭＤＣＴ係数を用いた自己相関計算を行った場合、高域信号追加動作時には、検出された相関最大シフト量の値に敢えて分割バンド幅の値を乗算して用いる必要はなくなる。
但し、ピーク値Ｐｅａｋを用いた自己相関計算とすれば、その分自己相関計算の計算量は削減でき、また上述もしたように信頼性の高い相関値を計算でき、これによって信頼性の高い相関最大シフト量の検出が可能となる。
【０１０３】
また、これまでの説明では、自己相関計算について、先の式１における「Ｎ」を振幅がある最後の分割バンド番号の値とし、高域サブバンドの全範囲を自己信号として自己相関計算を行う場合を例示したが、例えば「Ｎ」の値をより低域側の分割バンド番号の値とすることで、高域サブバンド内の一部を自己信号として自己相関計算を行うこともできる。このようにすることで、自己相関計算量を削減することができる。
【０１０４】
また、これまでの説明では、ＡＡＣ方式により圧縮符号化がされた音声信号（オーディオ信号）について高域補間を行う場合についてのみ説明したが、他の音声圧縮符号化方式で符号化された音声信号について高域補間を行う場合にも本発明は好適に適用することができる。
ここで、ＡＡＣ方式以外では、所定周波数以上の領域のみがバンド幅一定とならず、全域にわたってバンド幅が一定である場合もある。そこで、そのような場合には、高域サブバンドの始点として予め所定の周波数（ＭＤＣＴ係数番号）を設定しておき、同様にその始点から振幅がある最後のバンドまでを高域サブバンドとして設定するものとすればよい。以降は同様の動作とすることで実施の形態の場合と同様の効果を得ることができる。
【０１０５】
＜第２の実施の形態＞

続いて、第２の実施の形態について説明する。
第２の実施の形態は、量子化誤差を補正するためのものである。
図１２は、第２の実施の形態としての再生装置４０の内部構成を示すブロック図である。
図示するようにして第２の実施の形態の再生装置４０では、圧縮符号復号化部４内に、先の高域補間部４ａに代えて量子化誤差補正部４ｂが設けられる。
なお、第２の実施の形態の再生装置４０は、この量子化誤差補正部４ｂが設けられる以外は先の第１の実施の形態の再生装置１と同様の構成となるので、ここでは同一符号を付して説明を省略する。
【０１０６】
図１３は、図１２に示される圧縮符号復号化部４の内部構成を示している。
第２の実施の形態の場合の量子化誤差補正部４ｂとしても、先の高域補間部４ａと同様に、圧縮符号復号化部４内において、ステレオ処理部１２と適応ブロック長切換逆ＭＤＣＴ部１３との間に対して設けられる。すなわち、この量子化誤差補正部４ｂとしても、先の高域補間部４ａと同様に、ステレオ処理部１２によって得られる、符号化時のＭＤＣＴ処理された直後に相当する状態に復元されたＭＤＣＴ係数を入力し、それについて処理を行うようにされている。
なお、圧縮符号復号化部４内の他の構成については先の第１の実施の形態の場合と同様となることから、ここでは同一符号を付して説明を省略する。
【０１０７】
［量子化誤差］
ここで、一般的に音声圧縮符号化は、上述したような周波数相関符号化として、心理聴覚分析を用いた方式が採られている。この心理聴覚特性を用いた符号化では、聴感上聴取することのできないとされる周波数帯域については割り当てるビット数を削減することで、音質の低下を抑えながら効率の良い情報圧縮処理を行うように図られている。
しかしながら、このようにして低ビット数が割り当てられた周波数帯域では、その低ビット数に起因して復号の際の復号精度が低下し、本来の音声信号との差が大きくなるという現象が生じる。このような現象は、量子化誤差と呼ばれる。
【０１０８】
図１４は、このような割り当てビット数に起因して生じる量子化誤差について説明するための図である。
先ず、前提として、圧縮符号化では、上述のようにして所要の周波数帯域については割り当てるビット数を削減するものとしているが、このような帯域ごとのビット割り当て数は、その帯域について設定された分解能の値によって決定される。
図１４では、それぞれ異なる分解能が設定された場合での元データ（原信号のデータ）、符号化による量子化前／後の各データ、及び復号結果としてのデータの関係を示している。具体的に図１４（ａ）では分解能＝２（高分解能）が設定された場合、図１４（ｂ）では分解能＝５（低分解能）が設定された場合について示している。
【０１０９】
これらの図を参照してわかるように、高分解能とされた場合の方が、低分解能とされる場合よりも元データと復号結果との誤差が小さくなる。
具体的に、例えば図中の最左欄の元データ＝８のケースに着目すると、分解能＝２のときは、量子化前の値は８÷２により「４」であり、その量子化結果はこれを整数化したものと捉えることができ、図中量子化後として示すように同じ「４」となる。復号結果は、量子化後の値を分解能の値で戻したものに相当し、４×２により「８」となる。
これに対し、分解能＝５のときは、元データ＝８に対し量子化前の値は「１．６」となり、量子化後の値はこれが整数化されて「１」となってしまう。そして、復号結果は、この「１」を分解能「５」で戻した「５」となり、先の分解能＝２の場合の復号結果「８」と比較して誤差が大きくなる。
【０１１０】
このようにして分解能が低い場合には、量子化前の値と、これが整数化されたものに相当する量子化後の値との誤差が大きくなる傾向にあり、これに応じ復号結果にも元データの値からの大きな誤差を生じさせることとなる。これが、割り当てビット数の少ない部分で量子化誤差が生じやすい所以である。
【０１１１】
ここで、例えば元データがとり得る値を仮に０〜１００までの範囲としたとき、分解能を高くする（値としては小さくする）ことによっては、その分、細かい刻みで元データの値を表現することができるが、それに伴ってより多くのビット数を割り当てる必要がでてくることがわかる。一方で、分解能を低くする（値としては大きくする）ことによっては、元データの値を表現する上での刻み幅を粗くすることができるので、割り当てるビット数はより少なくすることができる。このようなことから、符号化の際に各バンドに設定する分解能の値により、そのバンドについての割り当てビット数が決定付けられることが理解できる。
【０１１２】
図１５は、実際の量子化誤差の発生形態の一例について説明するための図として、図１５（ａ）ではビットレート＝５１２ｋbpsのとき、図１５（ｂ）ではビットレート＝１２８ｋbpsのときのスペクトル分布を示している。なお、この図ではスペクトル分布として、図１３（図２）に示したステレオ処理部１２から出力されるＡＡＣ１フレーム分のＭＤＣＴ係数の分布（図中黒丸）を示している。また、この図では、周波数相関符号化により割り当てビット数の削減率が比較的高くなる中・高域として、例えば７ｋＨｚ以降（〜２２ｋＨｚ）のＭＤＣＴ係数の分布を示している。
【０１１３】
先ず、図１５（ａ）に示す高ビットレートの場合、中・高域においても各バンドの割り当てビット数は比較的多くすることができるため、大きな量子化誤差はほぼ生じていないことが確認できる。
これに対し、図１５（ｂ）の低ビットレートの場合は、中・高域での割り当てビット数の削減率が高くなることに伴って、比較的大きな量子化誤差が生じやすくなる。この大きな量子化誤差部分は、図中の丸印で囲うように、同じ振幅値が連続する部分として確認することができる。これが、量子化誤差による平坦化と呼ばれる現象である。
【０１１４】
このような平坦化が生じた部分は、当然のことながら元の原信号の波形を忠実に再現したものとはならない。すなわち、このように平坦化が生じた部分で特に音質の劣化が生じるものである。
【０１１５】
［量子化誤差の補正］
そこで、第２の実施の形態では、特にこのような平坦化部分による音質劣化を防止し、音質の改善を図る（つまり高音質化を図る）ものとする。そのための構成として、先の図１３（図１２）に示した量子化誤差補正部４ｂを設けるようにしている。
【０１１６】
図１６は、量子化誤差補正部４ｂの内部構成について示すブロック図である。
図示するようにして量子化誤差補正部４ｂには、平坦化部分抽出部４１、置換判定部４２、予測処理部４３、置換部４４が備えられている。
これら量子化誤差補正部４ｂ内の各部に対しては、図１３に示したステレオ処理部１２から出力されるＡＡＣ１フレーム単位ごとのＭＤＣＴ係数が入力される。
【０１１７】
先ず、予測処理部４３では、上記ステレオ処理部１２から供給される１フレーム分ごとのＭＤＣＴ係数に基づき、圧縮符号化前の原信号を予測した予測信号を生成する。
この予測処理部４３が備える予測器として、本実施の形態ではＡＡＣのＭａｉｎプロファイル（ISO/IEC13818-7）で規格化されている予測器を用いるものとしている。なおこの予測器は、先の図２、図１３に示した予測処理部１２ｂが備えるものと同等のものである。
【０１１８】
ここで、図１７は、上記予測器による予測処理のフローを示している。
この予測器は、２次の後方適応格子型予測器である。予測値x est(n)は以下のように求められる。
x est(n) ＝ x est,1(n)＋ x est,2(n)
ここで、
x est,1(n) ＝ bk1(n) r q,0(n-1)
x est,2(n) ＝ bk2(n) r q,1(n-1)
であり、a=b=0.953125である。
r q,0(n) ＝ axrec(n)
r q,1(n) ＝ a(rq,0 (n-1) − bk1(n)eq,0(n))
e q,0(n) ＝ xrec(n)
e q,1(n) ＝ e q,0(n) − xest,1(n)
km(n+1),m=1,2は以下の式により求める。
km(n+1) ＝ CORm(n)/VARm(n)
ここで、
CORm(n) ＝ αCOR m(n-1)＋r q,m-1(n-1) eq,m-1(n)
VARm(n) ＝ αVAR m(n-1)＋0.5(r² q,m-1(n-1)＋ e²q,m-1(n))
であり、α＝0.90625である。
【０１１９】
なお、本例では、上記予測処理部４３として、先の予測処理部１２ｂと同手法により予測処理を行う部分を別途設けるものとしているが、これは、ＡＡＣのオプション処理として、図２、図１３に示すインテンシティステレオ処理部１２ｃ、ＴＮＳ処理部１２ｄとしての処理を行っていることに起因する。すなわち、これらのオプション処理を行う場合、予測処理部１２ｂにおける処理結果は、本例の量子化誤差補正部４ｂで用いることのできるかたちでの予測信号として得ることができないため、別途の予測処理部４３を設けているものである。
【０１２０】
説明を図１６に戻す。
平坦化部分抽出部４１には、上述のようにしてステレオ処理部１２からの１フレーム分のＭＤＣＴ係数が供給されると共に、図１３に示したフォーマット解析部１０から供給されるスケールファクタバンド（ｓｆｂ）ごとの分解能の情報が入力される。
平坦化部分抽出部４１では、これら１フレーム分のＭＤＣＴ係数とｓｆｂごとの分解能の情報とに基づき、ｓｆｂごとに、ＭＤＣＴ係数の値がそのｓｆｂの分解能と同値となっている部分を検出（抽出）する。
多くの場合、このように分解能の値と同値となっているとして検出された部分が、先の図１５（ｂ）に示したような平坦化部分を形成する部分となる。
【０１２１】
ここで、第２の実施の形態では、量子化誤差の補正を行う帯域を、ビット割り当て数が不十分とされる中・高域に限定するものとしている。例えばこの場合は、先の図１５に示されるような７ｋHz〜２２ｋHzまでの帯域のみを対象として補正動作を行うものとしている。
これに応じ平坦化部分抽出部４１では、１フレームを形成する各ｓｆｂのうち、このような７ｋHz以降のｓｆｂのみを対象としてＭＤＣＴ係数の値がそのｓｆｂの分解能と同値となっているＭＤＣＴ係数位置を検出する。
平坦化帯域抽出部４１は、検出したＭＤＣＴ係数位置の情報（ＭＤＣＴ係数番号情報）と、さらにそのＭＤＣＴ係数位置が属するｓｆｂの分解能の情報とを併せて置換判定部４２に供給する。
【０１２２】
置換判定部４２は、上記平坦化部分抽出部４１により検出されたＭＤＣＴ係数番号の情報とそのバンドにおける分解能の情報、及びステレオ処理部１２からのＭＤＣＴ係数、さらに予測処理部４３で生成された予測信号を入力し、それらの情報に基づき置換判定を行う。すなわち、上記平坦化部分抽出部４１からのＭＤＣＴ係数番号によって特定されるＭＤＣＴ係数位置における上記予測信号の値と上記ＭＤＣＴ係数の値と、さらにそのＭＤＣＴ係数位置が属するｓｆｂの分解能の情報とに基づき、置換判定を行う。
具体的には、予測信号の値が、［ＭＤＣＴ係数の値（絶対値）＋分解能／ｎ］以下となっているか否かを判別した結果に基づき、置換判定を行う。例えばこの場合は、ｎ＝２として、予測信号の値がＭＤＣＴ係数の値＋分解能の値／２以下であるか否かを判別する。
予測信号の値がＭＤＣＴ係数の値＋分解能の値／２以下となっていないとした場合、そのＭＤＣＴ係数位置については置換を行わないとの判定結果を示す判定信号を次に説明する置換部４４に対して供給する。一方、予測信号の値がＭＤＣＴ係数の値＋分解能の値／２以下となっているとした場合は、そのＭＤＣＴ係数位置については置換を行うとの判定結果を示す判定信号を置換部４４に対して供給する。
【０１２３】
置換部４４は、ステレオ処理部１２から供給されるＭＤＣＴ係数と、上記置換判定部４２からの判定信号と、さらに予測処理部２３からの予測信号とに基づき、置換処理を行う。
具体的には、上記置換判定部４２からの判定信号により置換を行うとの判定結果が示されたＭＤＣＴ係数位置について、そのＭＤＣＴ係数の値を予測信号の値で置換する。
この置換部４４による置換処理が施された１フレーム分のＭＤＣＴ係数が、先の図１３に示した適応ブロック長切換逆ＭＤＣＴ部１３に対して順次供給されることになる。
【０１２４】
上記のようにして第２の実施の形態では、圧縮符号化がされた音声信号（オーディオ信号）について、周波数軸上でそのバンド（ｓｆｂ）の分解能の値となっているＭＤＣＴ係数位置を検出し、その位置の振幅値を、予測信号の値との比較結果に基づいて予測信号の値で置換するものとしている。
【０１２５】
ここで、上記のようにして本例においては、周波数軸上で分解能と同値となっている部分を検出するものとしているが、先の図１４、図１５の説明からも理解されるように、音質劣化の原因となる平坦化部分は、分解能と同値となっているところで生じやすいことになる。すなわち、分解能と同値（分解能の値×１）の部分は、量子化としての整数化で波数が切り捨てられた際に、その切り捨て率が相対的に高くなる可能性が高く、それに伴い生じる量子化誤差の率も高くなる傾向となって、大きな量子化誤差が生じやすい。
そこで本例では、上記のようにして先ずは分解能の値と同値となっている部分を置換候補部分として検出し、予測信号の値からその候補部分で大きな量子化誤差が生じているか、すなわち置換を行う妥当性があるかを判定した上で、妥当であるとされた場合にはその部分のＭＤＣＴ係数を予測信号の値で置換するものとしている。
これにより、割り当てビット数の少なさに起因して大きな量子化誤差の生じている部分を適正に検出し、その誤差部分の振幅値を予測信号に応じたより確からしい値で補正することができる。この結果、圧縮符号化による音質劣化を効果的に抑圧し、高音質化を図ることができる。
【０１２６】
そして、このような第２の実施の形態としての補正動作によれば、高音質化を図るにあたっては、予測信号を生成し、その値と音声信号の振幅値とを比較した結果に基づき予測信号の値との置換を行えばよいのみとすることができる。
これによれば、例えば従来のように本来とり得る値の範囲を算出し、相隣接する周波数帯域の符号化信号から最小二乗法を使って補正値を算出し、補正値が範囲内の値であれば既存の信号と置き換え、範囲外であれば、範囲の最小値・最大値などを用いて既存の信号との置き換えを行う、という手法で高音質化を図るとした場合と比較して、処理負担は格段に軽くすることができる。
【０１２７】
特に、予測信号の生成にあたり、上述したような２次の後方適応格子型による予測器を採用する本例の場合、その予測アルゴリズムとしては１フレームにつき１回の予測処理関数を呼び出せばよく、従来の如く各バンドで妥当とされる二次曲線などを求める場合のように複数フレーム間にわたって処理を行う必要はないものとでき、その分処理負担を格段に軽減することができる。また、さらには処理負担を音源によらず一定とすることもでき、処理の安定化を図ることができる。
【０１２８】
また、第２の実施の形態では、例えば７ｋHz以降の中・高域の帯域のみを対象として補正動作を行うこととしているが、このことで、不必要な部分で置換が行われてしまうことを効果的に防止することができる。
例えば、先に示した特許文献３に記載の発明では、全周波数帯域を対象として補正を行うことを前提としているが、このように全周波数帯域を対象として補正を行った場合、低域などのビット割り当てが充分であるところで、求めた補正値がかえって本来の振幅値とかけ離れたものとなってしまう可能性があり、結果的に音質向上を図ることができなくなる可能性がある。
これに対し本例のように補正対象帯域をビット割り当てが不十分とされる中・高域に限定すれば、必要な帯域のみについて補正を行うことができ、そのような不具合の発生を効果的に防止できる。
【０１２９】
なお、ここまでの説明では、第２の実施の形態としての量子化誤差の補正動作が、先の図１６に示したようなハードウェア構成により実現される場合を例示したが、第２の実施の形態の補正動作としても、先の第１の実施の形態の場合と同様にソフトウェア処理によっても実現することができる。つまり、この場合も量子化誤差補正部４ｂを例えばＣＰＵやメモリを備えた演算処理部で構成し、この演算処理部としての量子化誤差補正部４ｂのソフトウェア処理により上述した第２の実施の形態としての補正動作を実現するものである。
【０１３０】
この場合において実行されるべき処理動作を、次の図１８のフローチャートに示す。
なお、この図に示す処理動作としても、上述のような演算処理部としての量子化誤差補正部４ｂが、例えば上記メモリ内に格納されるプログラムに従って実行するものである。
また、図示による説明は省略するが、この演算処理部としての量子化誤差補正部４ｂは、この図に示す処理動作と並行して、ステレオ処理部１２からのＭＤＣＴ係数に基づき先の図１７の説明に基づく予測処理を行って予測信号を生成する処理を行っているものとする。
【０１３１】
先ずステップＳ２０１では、分解能情報を取得する。すなわち、先の図１３に示したフォーマット解析部１０からのｓｆｂごとの分解能の情報を取得する。
【０１３２】
続くステップＳ２０２では、平坦化部分を抽出するための処理を行う。すなわち、ステレオ処理部１２から供給される１フレーム分のＭＤＣＴ係数を入力し、この１フレームを形成する各ｓｆｂのうち、例えば７ｋHz以降のｓｆｂのみを対象としてＭＤＣＴ係数の値がそのｓｆｂの分解能と同値となっているＭＤＣＴ係数位置を検出する。
【０１３３】
さらに、次のステップＳ２０３では、予測信号に基づき抽出部分ごとに置換判定を行う。
すなわち、上記ステップＳ２０２によって検出したＭＤＣＴ係数位置ごとに、ＭＤＣＴ係数の値、そのＭＤＣＴ係数位置が属するｓｆｂの分解能の値、予測信号の値に基づき置換判定を行う。具体的には、先にも述べたようにこれらＭＤＣＴ係数の値、予測信号の値、分解能の値について、予測信号の値が、ＭＤＣＴ係数の値＋分解能の値／２以下となっているか否かを判別した結果に基づき、置換判定を行う。
【０１３４】
その上で、続くステップＳ２０４においては、要置換部分のＭＤＣＴ係数を予測信号に基づき置換する処理を行う。つまり、上記ステップＳ２０３の置換判定より、予測信号の値がＭＤＣＴ係数の値＋分解能の値／２以下となっていると判定したＭＤＣＴ係数位置についてのみ、予測信号の値による置換を行う。
このステップＳ２０４を実行すると、図示するようにして「ＲＥＴＵＲＮ」となる。なお確認のために述べておくと、この図に示す処理動作としてもＡＡＣ１フレームごとに実行されるべきものである。
【０１３５】
ここで、これまでの説明では、量子化誤差補正部４ｂが圧縮符号復号化部４内に設けられる場合を例示したが、この場合としても、例えば次の図１９に示すようにして、圧縮符号復号化部４の外部に対して量子化誤差補正部４ｂを設けるようにすることもできる。
図示するようにして、この場合の構成としては、先の図１１に示した構成において高域補間部４ａの代わりに量子化誤差補正部４ｂを設けたものに相当する。但し、量子化誤差補正部４ｂの場合は、ｓｆｂごとの分解能の情報を用いるようにされるので、図中破線矢印により示されるようにしてフォーマット解析部１０からのｓｆｂごとの分解能の情報も入力する。
なお、この場合も量子化誤差補正部４ｂが行う動作としては先に説明したものと同様となるため改めての説明は省略する。
【０１３６】
なお、この図１９に示す変形例では、このように外付けとされた量子化誤差補正部４ｂ（平坦化部分抽出部４１）に対してフォーマット解析部１０からの分解能の情報を入力するように構成したが、このようなフォーマット解析部１０からの分解能の情報の入力は必須ではない。
フォーマット解析部１０からの分解能の情報を入力しない場合、平坦化部分抽出部４１に対し、圧縮符号復号化部４→ＭＤＣＴ変換部３０を介して得られるＭＤＣＴ係数を供給するようにしておく。その上で、この場合の平坦化部分抽出部４１としては、各ｓｆｂにおいて最小の振幅値をそのｓｆｂの分解能の値として検出し、平坦化部分の検出、及びその後の置換判定においては、このようにして検出した値を分解能の値として用いるようにする。或いは、各ｓｆｂごとに頻発する振幅値をそのｓｆｂの分解能の値と見なしてこれを用いるようにすることもできる。
【０１３７】
以上、第２の実施の形態について説明したが、本発明の量子化誤差補正としてはこれまでに説明した具体例に限定されるべきものではない。
例えば、これまでの説明では、所定の帯域のみについて補正処理を行う場合を例示したが、全帯域を対象として補正処理を行うものとしてもよい。
【０１３８】
また、これまでの説明では、予測信号の生成にあたり、２次の後方適応格子型による予測器を用いる例を挙げたが、他の方式による予測器を用いることもできる。或いは、補間多項式や、多次元の近似式など多次元関数による予測処理で予測信号を生成することもできる。
但し、先にも述べたように処理負担の軽減の面では、実施の形態で採用したような２次の後方適応格子型による予測器を用いるのが好ましい。
【０１３９】
また、これまでの説明では、置換の妥当性の判断基準として、誤差候補部分の予測信号の値が、ＭＤＣＴ係数の値＋分解能の値／２以下であるか否かを判別する場合を例示したが、このような判断基準としては少なくとも分解能／ｎとすればよい。但し、量子化誤差はもともと分解能未満となる性質上、ｎの値としては、分解能／ｎの値を分解能の値未満とする値を選定すべきである。
或いは、置換の妥当性の判断としては、予測信号の値がＭＤＣＴ係数の値±分解能の値／ｎ以下であるか否かを判別するようにしてもよい。または、誤差候補部分の振幅値とその予測信号の値との差が、分解能／ｎであるか否か判別することもできる。
【０１４０】
＜第３の実施の形態＞

図２０は、第３の実施の形態としての再生装置５０の内部構成を示すブロック図である。
第３の実施の形態は、バンド間の量子化誤差を補正するためのものである。
図示するようにして第３の実施の形態の再生装置５０では、圧縮符号復号化部４内に、先の高域補間部４ａ（又は量子化誤差補正部４ｂ）に代えて、バンド間量子化誤差補正部４ｃが設けられる。
なお、第３の実施の形態の再生装置５０としても、このようなバンド間量子化誤差補正部４ｃが設けられる以外は、先の第１の実施の形態の再生装置１と同様の構成となるのでここでは同一符号を付して説明を省略する。
【０１４１】
図２１は、図２０に示される圧縮符号復号化部４の内部構成を示している。
第３の実施の形態の場合のバンド間量子化誤差補正部４ｃとしても、先の高域補間部４ａと同様に、圧縮符号復号化部４内において、ステレオ処理部１２と適応ブロック長切換逆ＭＤＣＴ部１３との間に対して設けられる。つまり、このバンド間量子化誤差補正部４ｃとしても、先の高域補間部４ａ、量子化誤差補正部４ｂと同様、ステレオ処理部１２によって得られる、ＭＤＣＴ処理された直後に相当する状態に復元されたＭＤＣＴ係数を入力して処理するようにされている。
なお、この場合も圧縮符号復号化部４内の他の構成については先の第１の実施の形態の場合と同様となることから、同一符号を付して説明を省略する。
【０１４２】
［バンド間の量子化誤差］
ここで、圧縮符号化処理に伴う音質劣化要因としては、これまでで説明してきた高域信号の欠落、量子化誤差による平坦化の他にも、割り当てビット数の削減に伴うバンド間の量子化誤差も挙げることができる。
【０１４３】
図２２、図２３は、このようなバンド間の量子化誤差について説明するための図である。
先ず、図２２では、周波数軸上において、連続するスケールファクタバンド（ｆｓｂ［ｎ］、ｆｓｂ［ｎ＋１］）の一部のＭＤＣＴ係数位置のみを抽出して示している。なお、この図では、横軸にＭＤＣＴ係数番号をとり、図中左側が低域側、右側が高域側としている。
またこの図において、各ＭＤＣＴ係数位置に示す振幅値は、ＭＤＣＴ係数の値ではなく元データ（原信号）の値を示しているとする。
【０１４４】
図示するようにして、連続するｓｆｂのうち低域側のｓｆｂ[ｎ]では、ＭＤＣＴ係数番号［１］の振幅が「１２」、ＭＤＣＴ係数番号［２］の振幅が「１７」、ＭＤＣＴ係数番号［３］の振幅が「１１」である。
また、このｓｆｂ［ｎ］の高域側に隣接するｓｆｂ［ｎ＋１］は、図示するようにしてＭＤＣＴ係数番号［４］から始まる。従ってこのＭＤＣＴ係数番号［４］がこれらｓｆｂ［ｎ］とｓｆｂ［ｎ＋１］との境界部分となる。ｓｆｂ［ｎ＋１］において、ＭＤＣＴ係数番号［４］の振幅は「８」、ＭＤＣＴ係数番号［５］の振幅は「１０」、ＭＤＣＴ係数番号［６］の振幅は「１３」、ＭＤＣＴ係数番号［７］の振幅は「１８」であることが示されている。
【０１４５】
図２３は、図２２に示したｓｆｂ［ｎ］内のＭＤＣＴ係数番号［１］〜［３］と、ｓｆｂ［ｎ＋１］内のＭＤＣＴ係数番号［４］〜［７］について、符号化時にそれぞれのｓｆｂで設定された分解能の値により、元データに対する量子化前／後のデータ及び復号結果が変化する様子を表化して示した図である。
ここで、例えば高ビットレート（例えば５１２ｋｂｐｓ）で圧縮された場合のｃａｓｅ：Ａとして、図示するようにｓｆｂ[ｎ]とｓｆｂ[ｎ＋１]とで同じ分解能＝２が設定されていたとする。一方で、低ビットレート（例えば１２８ｋｂｐｓ）で圧縮された場合のｃａｓｅ：Ｂとしては、ｓｆｂ[ｎ]で分解能＝２、ｓｆｂ[ｎ＋１]で分解能＝５が設定されていたとする。
【０１４６】
ｓｆｂ[ｎ]・ｓｆｂ[ｎ＋１]のバンド間の部分について着目すると、元データは、ｓｆｂ[ｎ]側のＭＤＣＴ係数番号［３］の位置では「１１」、ｓｆｂ[ｎ＋１]側のＭＤＣＴ係数番号［４］の位置では「８」となっている。
高ビットレートのｃａｓｅ：Ａの場合、それぞれ同じ分解能＝２であることから、ｓｆｂ[ｎ]側のＭＤＣＴ係数番号［３］の位置、及びｓｆｂ［ｎ＋１］側のＭＤＣＴ係数番号［４］の位置では、それぞれ上記の元データ「１１」「８」がスケーリングされて「５．５」「４」という数値になり、これらが量子化により小数点以下が丸められて「５」「４」という数値になる。復号結果は、これら量子化後の値がそれぞれ分解能の値に基づき戻された「１０」「８」という数値になる。
このように高ビットレートのｃａｓｅ：Ａの場合、バンド間の振幅は元データ「１１」「８」に対し復号結果「１０」「８」であり、その量子化誤差は「１」となる。
【０１４７】
これに対し、低ビットレートの場合のｃａｓｅ：Ｂでは、分解能がｓｆｂ間で２から５へと変化する。このため、分解能＝５とされるｆｓｂ［ｎ＋１］側のＭＤＣＴ係数番号［４］の位置では、ｃａｓｅ：Ａと比較して量子化誤差が大きくなり、復号結果としては先のｃａｓｅ：Ａでの「８」という数値に対し、図のように「５」に変化してしまう。すなわちｃａｓｅ：Ａでバンド間の量子化誤差が「１」であったのに対し、ｃａｓｅ：Ｂではこれが増大化して「４」となってしまう。
【０１４８】
低分解能により大きな量子化誤差が生じやすいことについては既に先の第２の実施の形態で述べたが、このようにバンド間に着目してみると、バンド間の分解能の差により、復号結果の波形の連続性が悪化する可能性が高くなる。このようにして、バンド間での大きな量子化誤差が不連続性を生じさせ、音質の劣化を助長することになる。
【０１４９】
［バンド間の量子化誤差の補正］
そこで第３の実施の形態では、このようなバンド間での大きな量子化誤差を補正し、高音質化を図るものとしている。そのための構成として、先の図２１（図２０）に示したバンド間量子化誤差補正部４ｃを設けるものとしている。
【０１５０】
図２４は、バンド間量子化誤差補正部４ｃの内部構成を示すブロック図である。
図示するようにして量子化誤差補正部４ｃ内には、誤差境界抽出部５１、置換判定部５２、予測処理部５３、置換部５４が設けられる。
これら量子化誤差補正部４ｃを構成する各部のうち、置換判定部５２、予測処理部５３、置換部５４に対しては、それぞれ図２１に示されるステレオ処理部１２から出力されるＡＡＣ１フレーム単位ごとのＭＤＣＴ係数が入力される。
なお、この場合も予測処理部５３では、上記ステレオ処理部１２から供給される１フレーム分ごとのＭＤＣＴ係数に基づき、圧縮符号化前の原信号を予測した予測信号を生成するが、このような第３の実施の形態での予測処理部５３としても、先に説明したようなＡＡＣのＭａｉｎプロファイルで規格化されている２次の後方適応格子型予測器を用いるものとしている。
【０１５１】
先ず、誤差境界抽出部５１には、図２１に示されるフォーマット解析部１０から供給されるｓｆｂごとの分解能の情報が入力される。
誤差境界抽出部５１では、このｓｆｂごとの分解能の情報に基づき、それぞれで分解能の値が異なっている連続したバンド間の境界部分を検出（抽出）する。
ここで、第３の実施の形態の場合のバンド間量子化誤差の補正は、先の第２の実施の形態とは異なり帯域を限定せず、全体帯域を対象として補正動作を行う。このため誤差境界抽出部５１では、１フレームを形成する全体帯域のｓｆｂを対象として、連続したｓｆｂ間で分解能の値が異なっている境界部分を検出する。
誤差境界抽出部５１は、検出した境界部分としてのＭＤＣＴ係数位置の情報（ＭＤＣＴ係数番号情報）と、さらにそのＭＤＣＴ係数位置が属するｓｆｂの分解能の情報とを置換判定部５２に対して供給する。
【０１５２】
置換判定部５２は、上記誤差境界抽出部５１により検出されたＭＤＣＴ係数番号の情報と分解能の情報、及び上述のようにしてステレオ処理部１２から供給されるＭＤＣＴ係数、さらに予測処理部４３で生成された予測信号に基づき、置換判定を行う。すなわち、上記誤差境界抽出部５１からのＭＤＣＴ係数番号によって特定されるＭＤＣＴ係数位置における上記予測信号の値と上記ＭＤＣＴ係数の値と、さらにそのＭＤＣＴ係数位置が属するｓｆｂの分解能の情報とに基づき置換判定を行う。
具体的には、それらＭＤＣＴ係数の値、予測信号の値、分解能の値について、予測信号の値が、［ＭＤＣＴ係数の値（絶対値）＋分解能／ｎ］以下となっているか否かを判別した結果に基づき、置換判定を行う。例えばこの場合もｎ＝２として、予測信号の値が、［ＭＤＣＴ係数の値＋分解能／２以下であるか否かを判別する。
予測信号の値がＭＤＣＴ係数の値＋分解能／２以下となっていないとした場合、そのＭＤＣＴ係数位置については置換を行わないとの判定結果を示す判定信号を次の置換部５４に対して供給する。一方、予測信号の値がＭＤＣＴ係数の値＋分解能／２以下となっているとした場合は、そのＭＤＣＴ係数位置については置換を行うとの判定結果を示す判定信号を置換部５４に対して供給する。
【０１５３】
置換部５４は、ステレオ処理部１２から供給される１フレーム分のＭＤＣＴ係数と、上記置換判定部５２からの判定信号と、さらに予測処理部５３からの予測信号とに基づき、置換処理を行う。
具体的には、上記置換判定部５２からの判定信号により置換を行うとの判定結果が示されたＭＤＣＴ係数位置について、そのＭＤＣＴ係数の値を予測信号の値で置換する。
この置換部５４による置換処理が施された１フレーム分のＭＤＣＴ係数が、先の図２１に示した適応ブロック長切換逆ＭＤＣＴ部１３に対して順次供給されることになる。
【０１５４】
上記のようにして第３の実施の形態では、所定の周波数バンド単位でビット数割り当てのための分解能を定める情報圧縮処理がされた圧縮符号化がされた音声信号（オーディオ信号）について、周波数軸上で分解能の値が異なっている連続した周波数バンド間の境界部分を検出し、その境界部分の振幅値を予測信号と比較した結果に基づいて予測信号の値で置換するものとしている。これによれば、割り当てビット数の差によってバンド間で大きな量子化誤差が生じてバンド間の連続性が損なわれた部分を適正に検出し、その部分の振幅値を予測信号に基づくより確からしい値で補正することができる。この結果、割り当てビット数の差に起因して生じるバンド間の不連続性による音質劣化を改善することができ、高音質化を図ることができる。
【０１５５】
また、このような第３の実施の形態としての手法では、誤差が生じやすい部分を特定しその部分のみについて補正を行うものとなっているので、例えば従来のような全帯域の信号について一律に補正を行う場合のように、補正の必要の無い部分についてまで補正が行われてかえって音質の劣化を招くといった事態を回避することができる。なお、このことは先の第２の実施の形態についても同様である。
【０１５６】
なお、ここまでの説明では、第３の実施の形態としてのバンド間量子化誤差の補正動作が、先の図２４に示したようなハードウェア構成により実現される場合を例示したが、この第３の実施の形態の補正動作としても、先の各実施の形態の場合と同様にソフトウェア処理によって実現することもできる。すなわち、この場合もバンド間量子化誤差補正部４ｃを例えばＣＰＵやメモリを備えた演算処理部で構成し、この演算処理部としてのバンド間量子化誤差補正部４ｃのソフトウェア処理により上述した第３の実施の形態としての補正動作を実現するものである。
【０１５７】
この場合において実行されるべき処理動作を、次の図２５のフローチャートに示す。
なお、この図に示す処理動作としても、上述のような演算処理部としてのバンド間量子化誤差補正部４ｃが例えば上記メモリ内に格納されるプログラムに従って実行するものである。
また、この場合も、演算処理部としてのバンド間量子化誤差補正部４ｃでは、この図に示す処理動作と並行してステレオ処理部１２からのＭＤＣＴ係数に基づき先の図１７の説明に基づく予測処理を行って予測信号を生成する処理を行っているものとする。
【０１５８】
先ずステップＳ３０１では、バンドごとに分解能情報を取得する。すなわち、先の図２１に示したフォーマット解析部１０からのｓｆｂごとの分解能の情報を取得する。
【０１５９】
続くステップＳ３０２では、分解能差バンド境界部分を抽出するための処理を行う。すなわち、上記ステップＳ３０１にて取得したバンドごとの分解能の情報に基づき、１フレームを形成する全ｓｆｂを対象として、それぞれで分解能の値が異なっている連続したｓｆｂ間の境界部分（ＭＤＣＴ係数位置）を検出する。
【０１６０】
さらに、次のステップＳ３０３では、予測信号に基づき抽出部分ごとに置換判定を行う。
すなわち、上記ステップＳ３０２によって検出した境界部分としてのＭＤＣＴ係数位置ごとに、ＭＤＣＴ係数の値、そのＭＤＣＴ係数位置が属するｓｆｂの分解能の値、予測信号の値に基づき置換判定を行う。具体的には、先にも述べたようにこれらＭＤＣＴ係数の値、予測信号の値、分解能の値について、予測信号の値が、ＭＤＣＴ係数の値＋分解能の値／２以下となっているか否かを判別した結果に基づき、置換判定を行う。
【０１６１】
その上で続くステップＳ３０４においては、要置換部分のＭＤＣＴ係数を予測信号に基づき置換する処理を行う。すなわち、上記ステップＳ３０３の置換判定より、予測信号の値がＭＤＣＴ係数の値＋分解能の値／２以下となっていると判定したＭＤＣＴ係数位置についてのみ、予測信号の値による置換を行う。
このステップＳ３０４を実行すると図示するようにして「ＲＥＴＵＲＮ」となる。なおこの図に示す処理動作としてもＡＡＣ１フレームごとに実行されるべきものである。
【０１６２】
ここで、第３の実施の形態においても、バンド間量子化誤差補正部４ｃが圧縮符号復号化部４内に設けられる場合を例示したが、この場合も例えば次の図２６に示すようにして圧縮符号復号化部４の外部に対して設けることもできる。
すなわち、図示するようにしてこの場合の構成としては、先の図１１に示した構成において高域補間部４ａの代わりにバンド間量子化誤差補正部４ｃを設けたものに相当する。但し、バンド間量子化誤差補正部４ｃとしても、ｓｆｂごとの分解能の情報を用いるので、図中破線矢印により示されるようにしてフォーマット解析部１０からのｓｆｂごとの分解能の情報も入力する。
なお、この場合もバンド間量子化誤差補正部４ｃが行う動作は先に説明したものと同様となるため改めての説明は省略する。
【０１６３】
なお、この図２６に示す変形例においても、先の第２の実施の形態の変形例の場合と同様に、各ｓｆｂにおいて最小の振幅値をそのｓｆｂの分解能の値として検出する、或いは各ｓｆｂごとに頻発する振幅値をそのｓｆｂの分解能の値として検出する等すれば、フォーマット解析部１０からの分解能の情報を入力せずに境界部分の抽出動作、及び置換判定を行うことができる。
【０１６４】
ここで、本発明のバンド間の量子化誤差補正としては、これまでに説明した第３の実施の形態としての具体例に限定されるべきものではない。
例えば、第３の実施の形態としても、予測信号の生成にあたっては２次の後方適応格子型による予測器を用いる例を挙げたが、この場合としても他の方式による予測器や、或いは補間多項式、多次元の近似式など多次元関数による予測処理で予測信号を生成することもできる。
【０１６５】
また、第３の実施の形態としても、置換の妥当性の判断基準として、検出された誤差候補部分の予測信号の値が、ＭＤＣＴ係数の値＋分解能の値／２以下であるか否かを判別する場合を例示したが、この場合としても判断基準は少なくとも分解能／ｎとすればよい。但し、この場合としても量子化誤差の性質上、ｎの値としては、分解能／ｎの値を分解能の値未満とする値を選定すべきである。
また、置換の妥当性の判断としては、この場合も予測信号の値がＭＤＣＴ係数の値±分解能の値／ｎ以内であるか否かを判別するようにしてもよい。または、誤差候補部分の振幅値とその予測信号の値との差が、分解能／ｎであるか否か判別することもできる。
【０１６６】
以上、本発明の各実施の形態について説明したが、本発明としてはこれまでに説明した具体例に限定されるべきものではない。
例えば、これまでの説明では、本発明が、記憶部２としての例えばＨＤＤやフラッシュメモリ等に記憶される音声信号について再生を行う再生装置に適用される場合を例示したが、本発明としては、例えばＭＤ（Mini Disc（登録商標））などの光磁気ディスクやＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）などの光ディスクを記録媒体として用いる再生装置にも適用することができる。
また、このように記録媒体に記憶される音声信号について再生を行う場合以外にも、デジタルテレビジョン放送信号中に含まれる圧縮符号化音声信号について復号化処理を行う機能を有する各種の電子機器や、Ｗｅｂストリームデータ内に含まれる圧縮符号化音声信号について復号化処理を行う機能を有する各種の電子機器に対しても好適に適用することができる。
【０１６７】
また、これまでの説明では、本発明がＬｃｈ（チャンネル）／Ｒｃｈの２ｃｈオーディオ信号に対応する構成を例示したが、例えば５．１ｃｈなどのマルチｃｈオーディオ信号、或いはモノラルオーディオ信号について高音質化のための処理を行う場合にも本発明は好適に適用できる。
【０１６８】
また、これまでの説明では、本発明がＡＡＣ方式により圧縮符号化がされた音声信号（オーディオ信号）について補正処理を行う場合についてのみ説明したが、他の音声圧縮符号化方式で符号化された音声信号について高音質化のための処理を行う場合にも本発明は好適に適用することができる。
【図面の簡単な説明】
【０１６９】
【図１】本発明の第１の実施の形態としての再生装置（電子機器）の内部構成について示したブロック図である。
【図２】第１の実施の形態の再生装置内部に備えられる圧縮符号復号化部の内部構成について示したブロック図である。
【図３】ＡＡＣ１フレーム分のＭＤＣＴ係数の概要について説明するための図である。
【図４】ピーク値検出について説明するための図である。
【図５】自己相関計算について説明するための図である。
【図６】Ｒａｔｅの計算について説明するための図である。
【図７】高域信号の追加について説明するための図である。
【図８】第１の実施の形態の信号処理装置（高域補間部）の内部構成について示したブロック図である。
【図９】第１の実施の形態の高域補間動作の有効性について実証するための実験結果を示した図である。
【図１０】第１の実施の形態としての高域補間動作をソフトウェア処理によって実現するために行われるべき処理動作について示したフローチャートである。
【図１１】第１の実施の形態の再生装置（電子機器）の変形例の構成を示したブロック図である。
【図１２】本発明の第２の実施の形態としての再生装置（電子機器）の内部構成について示したブロック図である。
【図１３】第２の実施の形態の再生装置内部に備えられる圧縮符号復号化部の内部構成について示したブロック図である。
【図１４】量子化誤差について説明するための図である。
【図１５】量子化誤差による平坦化について説明するための図である。
【図１６】第２の実施の形態の信号処理装置（量子化誤差補正部）の内部構成について示したブロック図である。
【図１７】第２、第３の実施の形態で用いる予測器の処理フローを示した図である。
【図１８】第２の実施の形態としての補正動作をソフトウェア処理によって実現するために行われるべき処理動作について示したフローチャートである。
【図１９】第２の実施の形態の再生装置（電子機器）の変形例の構成を示したブロック図である。
【図２０】本発明の第３の実施の形態としての再生装置（電子機器）の内部構成について示したブロック図である。
【図２１】第３の実施の形態の再生装置内部に備えられる圧縮符号復号化部の内部構成について示したブロック図である。
【図２２】バンド間の量子化誤差について説明するための図である。
【図２３】同じく、バンド間の量子化誤差について説明するための図である。
【図２４】第３の実施の形態の信号処理装置（量子化誤差補正部）の内部構成について示したブロック図である。
【図２５】第３の実施の形態としての補正動作をソフトウェア処理によって実現するために行われるべき処理動作について示したフローチャートである。
【図２６】第３の実施の形態の再生装置（電子機器）の変形例の構成を示したブロック図である。
【符号の説明】
【０１７０】
１,４０,５０再生装置、２記憶部、３復調部、４圧縮符号復号化部、４ａ高域補間部、５ＤＳＰ、６バス、７システムコントローラ、８操作部、９表示部、１０フォーマット解析部、１１逆量子化処理部、１１ａハフマン符号化部、１１ｂ逆量子化部、１１ｃリスケーリング部、１２ステレオ処理部、１２ａＭ／Ｓステレオ処理部、１２ｂ予測処理部、１２ｃインテンシティ・ステレオ処理部、１２ｄＴＮＳ部、１３適応ブロック長切換逆ＭＤＣＴ部、１４ゲイン制御部、２１Ｐｅａｋ検出部、２２自己相関計算部、２３相関最大シフト量検出部、２４Ｒａｔｅ計算部、２５高域信号追加部、２６補間判定部、３０ＭＤＣＴ変換部、３１逆ＭＤＣＴ変換部、４１平坦化部分抽出部、４２,５２置換判定部、４３,５３予測処理部、４４,５４置換部、５１誤差境界抽出部

【特許請求の範囲】
【請求項１】
所定の情報圧縮処理がされたオーディオ信号における所定の周波数以上の帯域の信号について、自己信号に対し自己信号を順次シフトさせていったときの自己相関計算を行う相関計算手段と、
上記自己相関計算の結果に基づき、相関性が最も高くなるときの相関最大シフト量を求めるシフト量検出手段と、
上記所定の周波数以上の帯域において、上記シフト量検出手段により求められた上記相関最大シフト量に基づく分だけ離間した各周波数ポイントでの各振幅値の比率を計算する比率計算手段と、
上記所定の周波数以上の帯域内で信号が欠落している各補間対象周波数ポイントの振幅値を、それら各補間対象周波数ポイントから上記相関最大シフト量に基づく分だけ離間した周波数ポイントにおける振幅値と上記比率とに基づき計算した値で補間する補間手段と、
を備えることを特徴とする信号処理装置。
【請求項２】
上記相関計算手段は、
上記所定の周波数以上の帯域をｎ個の周波数ポイントを含む分割バンド単位で区切ったときの、各分割バンド内での振幅値のピーク値をそれぞれ検出した上で、それら各ピーク値を上記自己信号として自己相関計算を行う、
ことを特徴とする請求項１に記載の信号処理装置。
【請求項３】
上記比率計算手段は、
上記相関最大シフト量に基づく分だけ離間した複数組の各周波数ポイントでの各振幅値の比率を平均化して上記比率の値として算出する、
ことを特徴とする請求項１に記載の信号処理装置。
【請求項４】
上記所定の周波数以上の帯域は、ＡＡＣ方式による周波数相関符号化の過程で分割される各サブバンドのうち、そのバンド幅が一定となるサブバンド以降の周波数帯域である、
ことを特徴とする請求項１に記載の信号処理装置。
【請求項５】
さらに、符号化前の原信号における上記所定の周波数以上の帯域に信号が存在したか否かについて判定する判定手段を備え、
少なくとも上記補間手段は、
上記判定手段の判定の結果、上記原信号における上記所定の周波数以上の帯域に信号が存在したとされた場合にのみ補間動作を行うように構成される、
ことを特徴とする請求項１に記載の信号処理装置。
【請求項６】
上記判定手段は、
上記相関計算手段による自己相関計算結果に基づいて上記原信号における上記所定の周波数以上の帯域に信号が存在したか否かについて判定する、
ことを特徴とする請求項５に記載の信号処理装置。
【請求項７】
所定の情報圧縮処理がされたオーディオ信号における所定の周波数以上の帯域の信号について、自己信号に対し自己信号を順次シフトさせていったときの自己相関計算を行う相関計算手順と、
上記自己相関計算の結果に基づき、相関性が最も高くなるときの相関最大シフト量を求めるシフト量検出手順と、
上記所定の周波数以上の帯域において、上記シフト量検出手順により求めた上記相関最大シフト量に基づく分だけ離間した各周波数ポイントでの各振幅値の比率を計算する比率計算手順と、
上記所定の周波数以上の帯域内で信号が欠落している各補間対象周波数ポイントの振幅値を、それら各補間対象周波数ポイントから上記相関最大シフト量に基づく分だけ離間した周波数ポイントにおける振幅値と上記比率とに基づき計算した値で補間する補間手順と、
を備えることを特徴とする信号処理方法。
【請求項８】
記録媒体に記録された少なくともオーディオ信号を再生する再生装置であって、
上記記録媒体からの読み出しを行って所定の情報圧縮処理がされたオーディオ信号を得るオーディオ信号取得手段と、
上記オーディオ信号取得手段により得られた上記オーディオ信号における所定の周波数以上の帯域の信号について、自己信号に対し自己信号を順次シフトさせていったときの自己相関計算を行う相関計算手段と、
上記自己相関計算の結果に基づき、相関性が最も高くなるときの相関最大シフト量を求めるシフト量検出手段と、
上記所定の周波数以上の帯域において、上記シフト量検出手段により求められた上記相関最大シフト量に基づく分だけ離間した各周波数ポイントでの各振幅値の比率を計算する比率計算手段と、
上記所定の周波数以上の帯域内で信号が欠落している各補間対象周波数ポイントの振幅値を、それら各補間対象周波数ポイントから上記相関最大シフト量に基づく分だけ離間した周波数ポイントにおける振幅値と上記比率とに基づき計算した値で補間する補間手段と、
を備えることを特徴とする再生装置。
【請求項９】
記録媒体に記録された少なくともオーディオ信号を再生する再生方法であって、
上記記録媒体からの読み出しを行って所定の情報圧縮処理がされたオーディオ信号を得るオーディオ信号取得手順と、
上記オーディオ信号取得手順により得た上記オーディオ信号における所定の周波数以上の帯域の信号について、自己信号に対し自己信号を順次シフトさせていったときの自己相関計算を行う相関計算手順と、
上記自己相関計算の結果に基づき、相関性が最も高くなるときの相関最大シフト量を求めるシフト量検出手順と、
上記所定の周波数以上の帯域において、上記シフト量検出手順により求めた上記相関最大シフト量に基づく分だけ離間した各周波数ポイントでの各振幅値の比率を計算する比率計算手順と、
上記所定の周波数以上の帯域内で信号が欠落している各補間対象周波数ポイントの振幅値を、それら各補間対象周波数ポイントから上記相関最大シフト量に基づく分だけ離間した周波数ポイントにおける振幅値と上記比率とに基づき計算した値で補間する補間手順と、
を備えることを特徴とする再生方法。
【請求項１０】
所定の情報圧縮処理がされたオーディオ信号を取得する取得手段と、
上記取得手段により取得されたオーディオ信号における所定の周波数以上の帯域の信号について、自己信号に対し自己信号を順次シフトさせていったときの自己相関計算を行う相関計算手段と、
上記自己相関計算の結果に基づき、相関性が最も高くなるときの相関最大シフト量を求めるシフト量検出手段と、
上記所定の周波数以上の帯域において、上記シフト量検出手段により求められた上記相関最大シフト量に基づく分だけ離間した各周波数ポイントでの各振幅値の比率を計算する比率計算手段と、
上記所定の周波数以上の帯域内で信号が欠落している各補間対象周波数ポイントの振幅値を、それら各補間対象周波数ポイントから上記相関最大シフト量に基づく分だけ離間した周波数ポイントにおける振幅値と上記比率とに基づき計算した値で補間する補間手段と、
を備えることを特徴とする電子機器。
【請求項１１】
所定の情報圧縮処理がされたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段と、
上記オーディオ信号について、周波数軸上で振幅値が所定の値となっている部分を誤差候補部分として検出する誤差候補部分検出手段と、
上記誤差候補部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記誤差候補部分の振幅値を上記予測信号の値に基づき置換する置換手段と、
を備えることを特徴とする信号処理装置。
【請求項１２】
上記誤差候補部分検出手段は、帯域を限定して上記誤差候補部分の検出を行うことを特徴とする請求項１１に記載の信号処理装置。
【請求項１３】
上記誤差候補部分検出手段は、上記情報圧縮処理の際に設定された分解能の値と同値となっている部分を検出することを特徴とする請求項１１に記載の信号処理装置。
【請求項１４】
上記置換手段は、
上記情報圧縮処理の際に設定された分解能の値に基づいて上記誤差候補部分の振幅値と予測信号の値とを比較した結果に基づき、その誤差候補部分の振幅値を上記予測信号の値に基づき置換する、
ことを特徴とする請求項１１に記載の信号処理装置。
【請求項１５】
上記予測手段は、２次の後方適応格子型による予測処理によって上記予測信号を生成することを特徴とする請求項１１に記載の信号処理装置。
【請求項１６】
上記予測手段は、近似式又は補間多項式により上記予測信号を生成することを特徴とする請求項１１に記載の信号処理装置。
【請求項１７】
所定の情報圧縮処理がされたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手順と、
上記オーディオ信号について、周波数軸上で振幅値が所定の値となっている部分を誤差候補部分として検出する誤差候補部分検出手順と、
上記誤差候補部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記誤差候補部分の振幅値を上記予測信号の値に基づき置換する置換手順と、
を備えることを特徴とする信号処理方法。
【請求項１８】
記録媒体に記録された少なくともオーディオ信号を再生する再生装置であって、
上記記録媒体からの読み出しを行って所定の情報圧縮処理がされたオーディオ信号を得るオーディオ信号取得手段と、
上記オーディオ信号取得手段により得られた上記オーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段と、
上記オーディオ信号について、周波数軸上で振幅値が所定の値となっている部分を誤差候補部分として検出する誤差候補部分検出手段と、
上記誤差候補部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記誤差候補部分の振幅値を上記予測信号の値に基づき置換する置換手段と、
を備えることを特徴とする再生装置。
【請求項１９】
記録媒体に記録された少なくともオーディオ信号を再生する再生方法であって、
上記記録媒体からの読み出しを行って所定の情報圧縮処理がされたオーディオ信号を得るオーディオ信号取得手順と、
上記オーディオ信号取得手順により得た上記オーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手順と、
上記オーディオ信号について、周波数軸上で振幅値が所定の値となっている部分を誤差候補部分として検出する誤差候補部分検出手順と、
上記誤差候補部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記誤差候補部分の振幅値を上記予測信号の値に基づき置換する置換手順と、
を備えることを特徴とする再生方法。
【請求項２０】
所定の情報圧縮処理がされたオーディオ信号を取得する取得手段と、
上記取得手段により取得されたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段と、
上記オーディオ信号について、周波数軸上で振幅値が所定の値となっている部分を誤差候補部分として検出する誤差候補部分検出手段と、
上記誤差候補部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記誤差候補部分の振幅値を上記予測信号の値に基づき置換する置換手段と、
を備えることを特徴とする電子機器。
【請求項２１】
所定の周波数バンド単位でビット数割り当てのための分解能を定める情報圧縮処理がされたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段と、
上記オーディオ信号について、それぞれ分解能の値が異なっている連続した周波数バンド間の境界部分を検出する境界部分検出手段と、
上記境界部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記境界部分の振幅値を上記予測信号の値に基づき置換する置換手段と、
を備えることを特徴とする信号処理装置。
【請求項２２】
上記置換手段は、
上記境界部分が属する周波数バンドに設定された分解能値に基づいて上記境界部分の振幅値と予測信号の値とを比較した結果に基づき、上記境界部分の振幅値を上記予測信号の値に基づき置換する、
ことを特徴とする請求項２１に記載の信号処理装置。
【請求項２３】
上記予測手段は、２次の後方適応格子型による予測処理によって上記予測信号を生成することを特徴とする請求項２１に記載の信号処理装置。
【請求項２４】
上記予測手段は、近似式又は補間多項式により上記予測信号を生成することを特徴とする請求項２１に記載の信号処理装置。
【請求項２５】
所定の周波数バンド単位でビット数割り当てのための分解能を定める情報圧縮処理がされたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手順と、
上記オーディオ信号について、それぞれ分解能の値が異なっている連続した周波数バンド間の境界部分を検出する境界部分検出手順と、
上記境界部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記境界部分の振幅値を上記予測信号の値に基づき置換する置換手順と、
を備えることを特徴とする信号処理方法。
【請求項２６】
記録媒体に記録された少なくともオーディオ信号を再生する再生装置であって、
上記記録媒体からの読み出しを行って、所定の周波数バンド単位でビット数割り当てのための分解能を定める情報圧縮処理がされたオーディオ信号を得るオーディオ信号取得手段と、
上記オーディオ信号取得手段により得られた上記オーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段と、
上記オーディオ信号について、それぞれ分解能の値が異なっている連続した周波数バンド間の境界部分を検出する境界部分検出手段と、
上記境界部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記境界部分の振幅値を上記予測信号の値に基づき置換する置換手段と、
を備えることを特徴とする再生装置。
【請求項２７】
記録媒体に記録された少なくともオーディオ信号を再生する再生方法であって、
上記記録媒体からの読み出しを行って、所定の周波数バンド単位でビット数割り当てのための分解能を定める情報圧縮処理がされたオーディオ信号を得るオーディオ信号取得手順と、
上記オーディオ信号取得手順により得た上記オーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手順と、
上記オーディオ信号について、それぞれ分解能の値が異なっている連続した周波数バンド間の境界部分を検出する境界部分検出手順と、
上記境界部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記境界部分の振幅値を上記予測信号の値に基づき置換する置換手順と、
を備えることを特徴とする再生方法。
【請求項２８】
所定の周波数バンド単位でビット数割り当てのための分解能を定める情報圧縮処理がされたオーディオ信号を取得する取得手段と、
上記取得手段により取得されたオーディオ信号について、その圧縮前の原信号を予測した予測信号を生成する予測信号生成手段と、
上記オーディオ信号について、それぞれ分解能の値が異なっている連続した周波数バンド間の境界部分を検出する境界部分検出手段と、
上記境界部分における振幅値と上記予測信号の値とを比較した結果に基づき、上記境界部分の振幅値を上記予測信号の値に基づき置換する置換手段と、
を備えることを特徴とする電子機器。

【図１】