説明

音声符号化装置及び音声符号化方法

【課題】時系列の信号に対する符号化の際の情報源符号を無駄にすることをなくし、計算量を抑制するとともに、周波数領域の信号における符号化性能を向上させること。
【解決手段】第1調整部102は、第1周波数スペクトルに対して非線形な振幅調整を行う。CELP符号化部104は、CELP符号化した後に復号して復号信号を生成する。第2MDCT部105は、復号信号に対して直交変換を行って第2周波数スペクトルを生成する。第2調整部106は、第1調整部102における振幅調整の際に第1周波数スペクトルに与えた特性と逆の特性を前記第2周波数スペクトルに与える。減算部107は、第1周波数スペクトルから、前記逆の特性を与えた第2周波数スペクトルを減算して残差スペクトルを生成する。FPC符号化部108は、残差スペクトルをFPC符号化する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多層構造を有するスケーラブルコーデック技術を用いた音声符号化装置及び音声符号化方法に関する。
【背景技術】
【0002】
移動体通信においては、伝送帯域の有効利用のために、音声または画像のディジタル情報の圧縮符号化が必須である。その中でも携帯電話で広く利用されている音声コーデック技術に対する期待は大きく、圧縮率の高い従来の高効率符号化に対して、更により高音質となる符号化への要求が高まっている。また、音声コーデックは、公衆で使用されるため、標準化が必須であり、それに伴って世界の各社で研究開発が盛んに行われている。
【0003】
近年、多層構造を持つスケーラブルコーデックの標準化がITU−T(International Telecommunication Union−Telecommunication Standardization Sector)またはMPEG(Moving Picture Experts Group)で検討されており、ITU−TではG.718が勧告化されている(非特許文献1参照)。この方式では、第1層から第2層まではCELP(Code Excited Linear Prediction)を用いて符号化を行い、第3層以降はMDCT(Modified Discrete Cosine Transform)を用いた変換符号化を行う。また、変換符号化では、音楽信号を効率的に符号化するためにFPC(Factorial Pulse Coding)という方式を用いているのが特徴である。
【0004】
20年前に確立された音声の発声機構をモデル化してベクトル量子化を巧みに応用した基本方式「CELP」によって大きく性能を向上させた音声符号化技術は、非特許文献2に記載の代数的符号帳(Algebraic Codebook)のような少数パルスによる固定音源を発明したことにより、一段とその性能を向上させた。
【0005】
G.718では、CELPを用いる層の符号化残差信号を、FPCで変換符号化する。この場合、CELPの復号信号を減衰させることで、総合的に性能が上がる傾向があり、G.718ではこの傾向を利用して減衰係数を2ビットで伝送している。
【0006】
ここで、ターゲット信号を符号化する際の符号化歪が最少になるようにCELP符号化しているにも関わらず、CELP符号化するよりもCELPの復号信号を減衰した方が、FPC方式で符号化した後の全体的符号化性能が向上する。これは、CELPとFPCとの符号化能力の違いを明らかに示している。
【0007】
即ち、CELPでは、時間軸において局所的に精度良く符号化されるが、周波数スペクトル(単にスペクトルと呼ぶ場合もある)ではすべての周波数に誤差が平均的に乗る。一方、FPCでは、周波数スペクトルを少数パルスで符号化するので、一部のスペクトルで精度よく符号化されるが、その他のスペクトルでは誤差が減らない。従って、CELPの合成音の周波数スペクトルに符号化歪が一律に乗っていることを考慮すると、CELPの復号信号のスペクトルではむしろ符号化歪ごとパワを下げてしまった方が、CELPの復号信号とFPCで符号化されたスペクトルとを合わせた時に、総合的に符号化歪が小さくなる場合が統計的に多いということになる。
【0008】
CELPの復号信号を減衰することにより総合的に符号化歪が小さくなる場合が統計的に多いということは、減衰しない方がよい場合もあるということである。従って、G.718では、FPC符号化器を動かして、4通りの減衰係数のうち、総合的に符号化歪が最も小さくなる減衰係数を求める。
【0009】
また、従来、符号化歪の量をコントロールするノイズシェイピングにより、FPCが符号化しやすい部分にスペクトルを集めるものが知られている(例えば、特許文献1)。特許文献1には、標準符号化方式AAC(Advanced Audio Coding)内で使用されるTNS(Temporal Noise Shaping)という処理が開示されている。特許文献1では、周波数軸の信号であるMDCT係数を時間軸の信号とみなし、LPC(Linear Prediction Coding)フィルタにMDCT係数を通すことにより、時間軸上の振幅の大きいところに雑音を集中させ、男性の音声などの低いピッチ周波数を含む信号の音質を向上させる。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2002−23798号公報
【非特許文献】
【0011】
【非特許文献1】Recommendation ITU-T G.718, 2008/6
【非特許文献2】Salami,Laflamme,Adoul,”8kbit/s ACELP Coding of Speech with 10ms Speech-Frame:aCandidate for CCITT Standardization”,IEEE Proc. ICASSP94,pp.II-97-II-100
【発明の概要】
【発明が解決しようとする課題】
【0012】
しかしながら、従来の装置においては、CELPの復号信号のスペクトルのパワを符号化歪と共に下げることにより総合的に符号化歪を小さくするので、CELP符号化の情報源符号が無駄になるという問題がある。また、従来の装置においては、4通りの減衰係数の全てについて符号器を複数回動かすため、多くの計算量を必要とするという問題がある。また、特許文献1においては、スペクトル符号化におけるノイズシェイピングについての開示はあるものの、CELPのような時間軸の符号化におけるノイズシェイピングについての記載はなく、FPCで符号化性能を向上させる効果のあるノイズシェイピングを、CELPにおいてどのように行うか解明されていないという問題がある。
【0013】
本発明の目的は、時系列の信号に対する符号化の際の情報源符号を無駄にすることをなくすることができ、計算量を抑制することができるとともに、周波数領域の信号における符号化性能を向上させることができる音声符号化装置及び音声符号化方法を提供することである。
【課題を解決するための手段】
【0014】
本発明の音声符号化装置は、符号化対象のターゲット信号に対して直交変換を行って第1周波数スペクトルを生成する第1直交変換手段と、前記第1周波数スペクトルに対して非線形な第1の振幅調整を行う第1調整手段と、前記第1の振幅調整を行った前記第1周波数スペクトルに対して前記直交変換の逆変換を行って時間信号を生成する逆直交変換手段と、前記時間信号を符号化した後に復号して復号信号を生成する第1の符号化手段と、前記復号信号に対して直交変換を行って第2周波数スペクトルを生成する第2直交変換手段と、前記第1の振幅調整の際に前記第1周波数スペクトルに与えた特性と逆の特性を前記第2周波数スペクトルに与える第2調整手段と、前記第1直交変換手段で生成した前記第1周波数スペクトルから、前記第2調整手段で前記逆の特性を与えた前記第2周波数スペクトルを減算して残差スペクトルを生成する減算手段と、前記残差スペクトルを変換符号化する第2の符号化手段と、を有する構成を採る。
【0015】
本発明の音声符号化方法は、符号化対象のターゲット信号に対して直交変換を行って第1周波数スペクトルを生成する第1直交変換ステップと、前記第1周波数スペクトルに対して非線形な振幅調整を行う第1調整ステップと、前記第1調整ステップにより振幅調整された前記第1周波数スペクトルに対して前記直交変換の逆変換を行って時間信号を生成する逆直交変換ステップと、前記時間信号を符号化した後に復号して復号信号を生成する第1の符号化ステップと、前記復号信号に対して直交変換を行って第2周波数スペクトルを生成する第2直交変換ステップと、前記第1調整ステップにより前記第1周波数スペクトルに与えた特性と逆の特性を前記第2周波数スペクトルに与える第2調整ステップと、前記第1直交変換ステップにより生成した前記第1周波数スペクトルから、前記第2調整ステップにより前記逆の特性を与えた前記第2周波数スペクトルを減算して残差スペクトルを生成する減算ステップと、前記残差スペクトルを変換符号化する第2の符号化ステップと、を有するようにした。
【発明の効果】
【0016】
本発明によれば、時系列の信号に対する符号化の際の情報源符号を無駄にすることをなくすることができ、計算量を抑制することができるとともに、周波数領域の信号における符号化性能を向上させることができる。
【図面の簡単な説明】
【0017】
【図1】本発明の実施の形態に係る音声符号化装置の構成を示すブロック図
【図2】本発明の実施の形態における第1調整部の構成例1を示すブロック図
【図3】本発明の実施の形態における第1調整部の構成例2を示すブロック図
【発明を実施するための形態】
【0018】
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
【0019】
(実施の形態)
<音声符号化装置の構成>
図1は、本発明の実施の形態に係る音声符号化装置100の構成を示すブロック図である。図1では、時系列符号化の例としてCELPを、後段の変換符号化の例としてFPCを用いている。
【0020】
第1MDCT部101は、入力した符号化対象のターゲット信号(ターゲットベクトル)に対してMDCTによる直交変換を行うことにより第1周波数スペクトルを取得する。具体的には、第1MDCT部101は、サブフレーム長の2倍の長さのサイン窓をターゲット信号に乗じるとともにMDCTの行列をターゲット信号に乗ずることにより、第1周波数スペクトルを取得する。なお、ターゲット信号は、典型的な例としては音声信号が挙げられるが、音楽信号、または音声信号と音楽信号との双方を含む音響信号でもよく、あるいは、第1MDCT部101に入力される前にこれらの信号に何らかの前処理を施した信号であっても良い。
【0021】
第1MDCT部101は、取得した第1周波数スペクトルを第1調整部102及び減算部107に出力する。なお、DCT(Discrete Cosine Transform)については、計算量削減を目的とした様々な方法が検討されているが、第1MDCT部101ではいずれの方法を用いてもよい。
【0022】
第1調整部102は、第1MDCT部101から入力した第1周波数スペクトルに対して振幅調整を行い、振幅調整した第1周波数スペクトルをIMDCT部103に出力する。第1調整部102は、振幅調整に用いた所定のパラメータの符号を符号化データとして図示しない音声復号装置に送る。なお、振幅調整の具体的な方法については後述する。
【0023】
IMDCT部103は、第1調整部102から入力した第1周波数スペクトルに対して、第1MDCT部101において行った直交変換の逆変換を行って、時系列の信号(以下「時間信号」と記載する)を取得する。IMDCT部103は、取得した時間信号をCELP符号化部104に出力する。
【0024】
CELP符号化部104は、IMDCT部103から入力した時間信号に対して符号化及び復号を行って復号信号を取得し、取得した復号信号を第2MDCT部105に出力する。CELP符号化部104は、CELP符号化により取得した符号を符号化データとして図示しない音声復号装置に送る。
【0025】
第2MDCT部105は、CELP符号化部104から入力した復号信号に対してMDCTによる直交変換を行うことにより第2周波数スペクトルを取得する。第2MDCT部105は、取得した第2周波数スペクトルを第2調整部106に出力する。
【0026】
第2調整部106は、第2MDCT部105から入力した第2周波数スペクトルに対して、前記第1調整部102において第1周波数スペクトルに与えた特性と逆の特性を与える。具体的には、第2調整部106は、第1調整部102において減衰された部分を伸長させる。第2調整部106は、逆の特性を与えた第2周波数スペクトルを減算部107に出力する。なお、逆の特性を与える具体的な方法については後述する。
【0027】
減算部107は、第1MDCT部101から入力した第1周波数スペクトルから、第2調整部106から入力した第2周波数スペクトルを減算して、FPCで符号化し易い残差スペクトルを取得する。減算部107は、取得した残差スペクトルをFPC符号化部108に出力する。
【0028】
FPC符号化部108は、減算部107から入力した残差スペクトルをFPC方式で変換符号化して符号化データを出力する。この符号化データは、図示しない音声復号装置に送られる。なお、FPCの符号化/復号アルゴリズムについてはITU−T規格G.718の規格書に詳細な記載があるのでこの説明を省略する。
【0029】
<第1調整部の構成>
第1調整部102の構成として、構成例1及び構成例2の2つの構成について、以下に説明する。なお、本実施の形態においては、構成例1及び構成例2の何れを用いてもよい。
【0030】
(構成例1)
図2は、第1調整部102の構成例1を示すブロック図である。
【0031】
構成例1では、第1調整部102における振幅調整の方針として、第1周波数スペクトルの各サンプルにおいて、スペクトル値が比較的小さいサンプルは減衰せずにそのままにし、スペクトル値が比較的大きいサンプルほど大きく減衰させる。例えば、第1調整部102は、しきい値未満のスペクトル値を有するサンプルについては減衰させずにそのままにし、しきい値以上のスペクトル値を有するサンプルに対して、スペクトル値が大きいほど大きく減衰させる振幅調整を行う。したがって、構成例1において、第1調整部102における振幅調整は非線形である。
【0032】
平均値算出部201は、第1MDCT部101から出力された第1周波数スペクトルを入力し、下記の(1)式の計算を行って平均値mを求める。
【数1】

【0033】
平均値算出部201は、求めた平均値mを振幅調整部202に出力する。
【0034】
振幅調整部202は、平均値算出部201から入力した平均値mと、定数とを用いて、下記の(2)式によりしきい値を求める。
【数2】

【0035】
振幅調整部202は、第1MDCT部101から入力した第1周波数スペクトルに対して、しきい値tを用いた下記の(3)式に従って振幅調整を行う。
【数3】

【0036】
(3)式は、一次微分まで連続的な関数であり、しきい値を境に線形関数と対数関数とが入れ替わるようになっている。即ち、振幅調整部202は、振幅がしきい値以下のスペクトルはそのままにし、振幅がしきい値より大きいスペクトルは対数関数で減衰させる。
【0037】
また、振幅調整部202は、しきい値を第2調整部106に出力する。また、振幅調整部202は、図示しない音声復号装置でも逆変換を行う必要があるので、振幅調整に用いたパラメータであるしきい値tを符号化し、しきい値tの符号をこの音声復号装置に送る。この際、符号化方法としては、整数化によるスカラ量子化が挙げられる。なお、しきい値tの符号化歪による悪影響を避けるために、(2)式でしきい値tを求めた後、符号化及び復号を行い、復号されたしきい値tを用いて、(3)式の処理、ならびに第2調整部106の処理を行う。
【0038】
そして、振幅調整部202は、振幅調整した第1周波数スペクトルをIMDCT部103に出力する。
【0039】
(構成例2)
図3は、第1調整部102の構成例2を示すブロック図である。
【0040】
構成例2では、第1調整部102における振幅調整の方針として、第1周波数スペクトルの各サンプルにおいて、スペクトル値の変化が比較的になだらかなサンプルはスペクトル値を減衰させずにそのままにし、スペクトル値の変化にパルス性があるサンプルはスペクトル値を減衰させる。例えば、第1調整部102は、第1周波数スペクトルの隣接するサンプル間のスペクトル値の変化量がしきい値未満のサンプルについては減衰させずにそのままにし、前記の変化量がしきい値以上のサンプルに対して、変化量が大きいほど大きく減衰させる振幅調整を行う。したがって、構成例2でも、第1調整部102における振幅調整は非線形である。
【0041】
パルス性分析部301は、第1MDCT部101から入力した第1周波数スペクトルを用いて、減衰係数ベクトルを求める。具体的には、パルス性分析部301は、中心となるサンプルのスペクトル値と、そのサンプルの周辺のサンプルのスペクトル値との関係を分析することによりパルス性を求める。この際、例えば、上記で説明したようにしきい値とスペクトル値の変化量とを比較することによりパルス性を求める。そして、パルス性分析部301は、パルス性有りと判断した場合は、1未満の定数値を格納し、それ以外は「1.0」を値として格納することにより減衰係数ベクトルを求める。即ち、パルス性分析部301は、下記の(4)式に従って減衰係数ベクトルを求める。
【数4】

【0042】
パルス性分析部301は、求めた減衰係数ベクトルを振幅調整部302及び第2調整部106に出力する。ここで、減衰係数ベクトルは、パルス性のあるスペクトル値を減衰させる関数である。
【0043】
また、パルス性分析部301は、音声復号装置でも逆変換を行う必要があるので、振幅調整に用いたパラメータである減衰係数ベクトルを符号化し、減衰係数ベクトルの符号を音声復号装置に送る。この際、符号化方法としては、減衰したサンプルを「1」とし、減衰しないサンプルを「0」としてベクトルをそのまま送る方法、または区間をいくつかに分割してベクトル量子化を行う方法があげられる。また、減衰させる部分の数をあらかじめ制限して、減衰係数ベクトルの一部のみを符号化して伝送するという方法も考えられる。また、極端な例としては、第2調整部106で得られたスペクトルから、(4)式に示す減衰係数ベクトルを作成し、全く情報を送らないという方法でもよい。この場合、減衰係数ベクトルの符号は送らない。
【0044】
振幅調整部302は、パルス性分析部301から入力した減衰係数ベクトルを用いて、下記の(5)式に従って第1周波数スペクトルの振幅調整を行う。
【数5】

【0045】
そして、振幅調整部302は、振幅調整した第1周波数スペクトルをIMDCT部103に出力する。
【0046】
<第2調整部における動作>
第1調整部102が上記の構成例1の構成または構成例2の構成を有する各々の場合における第2調整部106の動作について、以下に説明する。
【0047】
(第1調整部の構成が構成例1である場合の動作)
第2調整部106は、第2周波数スペクトルの振幅の大きさの全体的な傾向に応じて、適応的に振幅を調整する。第2調整部106の調整は第1調整部102の逆変換に相当し、(2)式により求めたしきい値tよりも大きい場合に非線形に振幅を拡大することを特徴としている。
【0048】
第2調整部106は、振幅調整部202から入力したしきい値tに基づいて、下記の(6)式に従って逆変換を行うことにより調整する。
【数6】

【0049】
第2調整部106は、(6)式より、第2周波数スペクトルの各サンプルのうち、しきい値t未満のスペクトル値を有するサンプルは伸長させずにそのままにし、しきい値t以上のスペクトル値を有するサンプルに対して、スペクトル値が大きいほど大きく伸長させる振幅調整を行う。
【0050】
(第1調整部の構成が構成例2である場合の動作)
第2調整部106は、第2周波数スペクトルの振幅の大きさの全体的な傾向に応じて、適応的に振幅を調整する。第2調整部106の調整は第1調整部102の逆変換に相当し、隣接するサンプル間のスペクトル値の変化量がしきい値よりも大きい場合に、非線形に振幅を拡大することを特徴としている。
【0051】
第2調整部106は、パルス性分析部301から入力した減衰係数ベクトルに基づいて、下記の(7)式に従って逆変換を行う。
【数7】

【0052】
第2調整部106は、(7)式より、第2周波数スペクトルの隣接するサンプル間のスペクトル値の変化量がしきい値未満のサンプルは伸長させずにそのままにし、前記の変化量がしきい値以上のサンプルに対して、前記の変化量が大きいほど大きく伸長させる振幅調整を行う。
【0053】
なお、本実施の形態の音声符号化装置に対応した音声復号装置は、伝送されてきたしきい値の符号または減衰係数ベクトルの符号に基づいて、しきい値tまたは減衰係数ベクトルを復号する。そして、この音声復号装置は、音声符号化装置のCELP符号化部104において復号を行う部分、第2MDCT部105、第2調整部106、と同じ動作を行うことで、CELPの合成音の復号された周波数スペクトルを生成する。さらに、音声復号装置は、このCELPの合成音の復号された周波数スペクトルに、FPCの符号を復号して生成される、復号されたFPCの周波数スペクトルを加算する。各ブロックの説明は前述の通りであるので詳細説明を省略する。
【0054】
<本実施の形態の効果>
本発明によれば、CELP符号化の際の情報源符号を無駄にすることをなくすることができ、計算量を抑制することができるとともに、CELP符号化におけるノイズシェイピング処理を実現することにより、FPC符号化性能を向上させることができる。
【0055】
<本実施の形態の変形例>
上記実施の形態において、第1調整部の構成として構成例1及び構成例2を示したが、本発明はこれに限らず、スペクトル値を減衰させる構成及び動作であれば他の構成及び動作を用いてもよい。本発明は、CELP符号化部の前後の調整部の構成及び動作に直接依存するものではないからである。
【0056】
また、上記実施の形態において、第1調整部において平均値を算術平均で求めたが、本発明はこれに限らず、モードまたはメジアンを用いてもよい。メジアンを用いる場合は、あらかじめ指定された順位の振幅値を探索してそれを用いることにより、同様の効果を得ることができる。
【0057】
また、上記実施の形態において、後段の符号器はFPC符号化部にしたが、本発明はこれに限らず、TCX(transform coded excitation)、AMR−WB+(Extended Adaptive Multi-Rate Wideband)、またはAAC(Advanced Audio Coding)などの変換符号化を行う符号化部を設けてもよい。これは、パルス性のある残差スペクトルを効率よく符号化するためにはいずれの符号化方式でもよく、FPC以外でも本発明が有効であるからである。
【0058】
また、上記実施の形態において、CELP符号化部を用いたが、本発明はこれに限らず、MPC(Multiple Pulse Coding)またはADPCMなどの時系列符号化を行う符号化部を設けても良い。これらは、時系列信号を効率よく符号化できるが、後段のスペクトル符号化において復号信号の減衰に効果があるのはCELPと同じであるからである。
【0059】
また、上記実施の形態において、直交変換の方法としてMDCTを用いたが、本発明はこれに限らず、DCT(Discrete Cosine Transform)またはFFTなどの直交変換方法でもよい。その理由は、周波数スペクトルが得られる方法であれば、上記の実施の形態に適用できるからである。
【0060】
なお、上記実施の形態では、装置を音声符号化装置/音声復号装置と称したが、ここでの「音声」とは、広義の意味での音声を示すものである。すなわち、音声符号化装置における入力信号及び音声復号化装置における復号信号は、音声信号、音楽信号、あるいは音声信号と音楽信号との双方を含む音響信号、など、いずれの信号をも示すものである。
【0061】
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はハードウェアとの連携においてソフトウェアでも実現することも可能である。
【0062】
上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
【0063】
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)、または、LSI内部の回路セルの接続または設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
【0064】
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
【産業上の利用可能性】
【0065】
本発明にかかる音声符号化装置及び音声符号化方法は、多層構造を有するスケーラブルコーデック技術を用いるのに好適である。
【符号の説明】
【0066】
100 音声符号化装置
101 第1MDCT部
102 第1調整部
103 IMDCT部
104 CELP符号化部
105 第2MDCT部
106 第2調整部
107 減算部
108 FPC符号化部

【特許請求の範囲】
【請求項1】
符号化対象のターゲット信号に対して直交変換を行って第1周波数スペクトルを生成する第1直交変換手段と、
前記第1周波数スペクトルに対して非線形な第1の振幅調整を行う第1調整手段と、
前記第1の振幅調整を行った前記第1周波数スペクトルに対して前記直交変換の逆変換を行って時間信号を生成する逆直交変換手段と、
前記時間信号を符号化した後に復号して復号信号を生成する第1の符号化手段と、
前記復号信号に対して直交変換を行って第2周波数スペクトルを生成する第2直交変換手段と、
前記第1の振幅調整の際に前記第1周波数スペクトルに与えた特性と逆の特性を前記第2周波数スペクトルに与える第2調整手段と、
前記第1直交変換手段で生成した前記第1周波数スペクトルから、前記第2調整手段で前記逆の特性を与えた前記第2周波数スペクトルを減算して残差スペクトルを生成する減算手段と、
前記残差スペクトルを変換符号化する第2の符号化手段と、
を有する音声符号化装置。
【請求項2】
前記第1調整手段は、前記第1周波数スペクトルの各サンプルのうち、しきい値以上のスペクトル値を有するサンプルに対して、前記スペクトル値が大きいほど大きく減衰させることにより前記第1の振幅調整を行う請求項1記載の音声符号化装置。
【請求項3】
前記第2調整手段は、前記第2周波数スペクトルの各サンプルのうち、しきい値以上のスペクトル値を有するサンプルに対して、前記スペクトル値が大きいほど大きく伸長させる第2の振幅調整を、前記第2周波数スペクトルの振幅に応じて適応的に行うことにより、前記逆の特性を前記第2周波数スペクトルに与える請求項2記載の音声符号化装置。
【請求項4】
前記第1調整手段は、前記第1周波数スペクトルの、隣接するサンプル間のスペクトル値の変化量がしきい値以上のサンプルにおいて、前記変化量が大きいほど大きく減衰させることにより前記第1の振幅調整を行う請求項1記載の音声符号化装置。
【請求項5】
前記第2調整手段は、前記第2周波数スペクトルの隣接するサンプル間のスペクトル値の変化量がしきい値以上のサンプルに対して、前記変化量が大きいほど大きく伸長させる第2の振幅調整を、前記第2周波数スペクトルの振幅に応じて適応的に行うことにより、前記逆の特性を前記第2周波数スペクトルに与える請求項4記載の音声符号化装置。
【請求項6】
符号化対象のターゲット信号に対して直交変換を行って第1周波数スペクトルを生成する第1直交変換ステップと、
前記第1周波数スペクトルに対して非線形な振幅調整を行う第1調整ステップと、
前記第1調整ステップにより振幅調整された前記第1周波数スペクトルに対して前記直交変換の逆変換を行って時間信号を生成する逆直交変換ステップと、
前記時間信号を符号化した後に復号して復号信号を生成する第1の符号化ステップと、
前記復号信号に対して直交変換を行って第2周波数スペクトルを生成する第2直交変換ステップと、
前記第1調整ステップにより前記第1周波数スペクトルに与えた特性と逆の特性を前記第2周波数スペクトルに与える第2調整ステップと、
前記第1直交変換ステップにより生成した前記第1周波数スペクトルから、前記第2調整ステップにより前記逆の特性を与えた前記第2周波数スペクトルを減算して残差スペクトルを生成する減算ステップと、
前記残差スペクトルを変換符号化する第2の符号化ステップと、
を有する音声符号化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2013−57792(P2013−57792A)
【公開日】平成25年3月28日(2013.3.28)
【国際特許分類】
【出願番号】特願2011−195892(P2011−195892)
【出願日】平成23年9月8日(2011.9.8)
【出願人】(000005821)パナソニック株式会社 (73,050)