符号化方法、プログラム
【課題】容易に既存の符号化方式と組み合わせることができ、かつ、送信側だけに機能を
追加するだけで、効果的に量子化ノイズの耳障り感を低減することが可能な符号化装置を
実現する。
【解決手段】第nサンプル目のディジタル音響信号サンプルxnとフィードバック信号サンプルとを加算して加算結果を得るステップと、入力された信号をサンプル毎に符号化する所定の符号化方式により加算結果から符号化信号を生成するステップと、符号化信号から上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するステップと、復号化信号サンプルからディジタル音響信号サンプルを減算して減算結果を得るステップと、減算結果を1サンプリング時間遅延させてフィードバック信号サンプルを得る遅延ステップと、をディジタル音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
追加するだけで、効果的に量子化ノイズの耳障り感を低減することが可能な符号化装置を
実現する。
【解決手段】第nサンプル目のディジタル音響信号サンプルxnとフィードバック信号サンプルとを加算して加算結果を得るステップと、入力された信号をサンプル毎に符号化する所定の符号化方式により加算結果から符号化信号を生成するステップと、符号化信号から上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するステップと、復号化信号サンプルからディジタル音響信号サンプルを減算して減算結果を得るステップと、減算結果を1サンプリング時間遅延させてフィードバック信号サンプルを得る遅延ステップと、をディジタル音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ディジタル化された音声、音楽などの音響信号を符号化し、ディジタル通信網を介して送受信する符号化方法およびプログラムに関する。
【背景技術】
【0002】
パケット通信網をはじめとするディジタル通信網を介して音声を送受信する利用が増えている。IP電話もその例である。図10はディジタル通信網を介したディジタル音声信号送受信の構成例である。送信側において、ディジタル信号は1サンプル毎に符号化装置100に入力されて符号化信号に変換され、ディジタル通信網を介して受信側に送られた
符号化信号は、復号化装置200においてディジタル信号に復号化される。符号化装置・復号化装置における符号化方式には、任意のものが利用できるが、符号化方式と復号化方式は対応したものでなければならない。図11は、符号化装置100にエンコーダ101、復号化装置200にデコーダ201を適用した場合の構成例である。エンコーダ101は、入力されたディジタル信号を所定の符号化方式により符号化信号に変換して出力する。デコーダ201はディジタル通信網を介して転送された上記符号化信号が入力され、所定の復号化方式により復号化してディジタル信号を再生する。なお、上記のとおりエンコーダ101とデコーダ201は両者の方式が対応していれば、例えば世界に広く普及しているITU-T G.711やITU-T G.726など、任意の方式のエンコーダ、デコーダを適用して構わない。
【0003】
もっとも、このような構成において受信側で再生されるディジタル信号は、符号化処理の際に生じる量子化ノイズにより、用途に不十分な程度に品質が劣化してしまう場合がある。そのような場合の品質改善方法の1つとして、図12に示すようにエンコーダ101の前段にプリエンファシス手段102、デコーダ201の後段にディエンファシス手段202を挿入する方法が非特許文献1に開示されている。非特許文献1は、符号化処理時の品質改善方法としてではなくA/D、D/A変換時の品質改善方法として記載されているが、この方法を応用することにより符号化処理においても品質改善の効果を得ることが可能である。
【0004】
しかし、非特許文献1の方法によると符号化装置と復号化装置の双方に機能追加を行う必要があり、既にITU-T G.711方式の機器などが世界中に広く普及しているという現状を踏まえれば、双方に機能の追加(又は機器の更改)を行うことは現実的でない、または品質改善効果が得られる機会が限定的になると考えられる。そこで、送信側だけに機能を追加し受信側は既存のデコーダをそのまま使用できる品質改善方法として、聴覚重み付け、またはノイズシェーピングと呼ばれる手法が非特許文献2に開示されている。この手法は、優れた作用効果を奏するもので、日本の携帯電話用の音声符号化方式にも採用されている。
【非特許文献1】古井貞煕、“ディジタル音声処理、” 東海大学出版会、pp36-37, 1985.
【非特許文献2】三樹聡、守谷健弘、間野一則、大室仲、“ピッチ同期雑音励振源をもつCELP符号化(PSI-CELP)、” 電子情報通信学会論文誌 A Vol.J77-A No.3 pp.314-324,1994.
【発明の概要】
【発明が解決しようとする課題】
【0005】
非特許文献2で開示されている方法は優れた作用効果を奏するものの、構成が複雑であるうえに既存のエンコーダに簡単に機能追加できる形になっていない。すなわち、受信側のデコーダは既存装置を利用できるものの、送信側のエンコーダは新たに設計し直す必要があるため、コストの増加につながる。
【0006】
本発明の目的は、プリエンファシス・ディエンファシスを適用する方法のように、簡便に既存の符号化方式と組み合わせ可能であるという利点と、ノイズシェーピングを適用する方法のように送信側だけに機能を追加すれば受信側は既存装置のままでよいという利点とを両立し、効果的に量子化ノイズの耳障り感を低減することが可能な符号化装置を実現することにある。
【課題を解決するための手段】
【0007】
本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
あるいは、本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
あるいは、本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
あるいは、本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
【発明の効果】
【0008】
本発明によれば、容易に既存の符号化方式と組み合わせ可能であり、かつ、送信側だけに機能を追加すれば受信側は既存装置のままで量子化ノイズの耳障り感を効果的に低減することが可能な符号化装置を実現することができる。
【図面の簡単な説明】
【0009】
【図1】第1実施形態の符号化装置の構成例。
【図2】第1実施形態の符号化装置の処理フロー図。
【図3】第2実施形態の符号化装置の構成例。
【図4】第2実施形態の符号化装置の処理フロー図。
【図5】第3実施形態の符号化装置の構成例。
【図6】第3実施形態の符号化装置の処理フロー図。
【図7】第4実施形態の符号化装置の構成例。
【図8】第4実施形態の符号化装置の処理フロー図。
【図9】第5実施形態の符号化装置の構成例。
【図10】従来の符号化装置の構成例。
【図11】エンコーダ・デコーダを適用した従来の符号化装置の構成例。
【図12】プリエンファシス・ディエンファシスを適用した従来の符号化装置の構成例。
【発明を実施するための形態】
【0010】
〔第1実施形態〕
図1は、本発明の符号化装置10の機能構成例である。また、図2は処理フローである。
符号化装置10は、加算部11、エンコーダ101、デコーダ12、減算部13及び遅延部14から構成され、装置に入力されたディジタル信号を1サンプル毎に符号化する。なお、エンコーダ101は図11に示した従来技術の符号化装置100に用いられるエンコーダ101と同じものであることから同一参照番号を付与している。また、デコーダ12は図11に示した従来技術の復号化装置200に用いられるデコーダ201と同じものである。
【0011】
加算部11は、第nサンプル目のディジタル信号xnが入力される(S1)と共に、後述するフィードバック信号en(=yn−1−xn−1)が入力され、これらを加算して第nサンプル目の加算結果xn+enを出力する(S2)。エンコーダ101は、上記第nサンプル目の加算結果xn+enを所定の符号化方式で符号化し、第nサンプル目の符号化信号cnを生成する(S3)。この第nサンプル目の符号化信号cnは、ディジタル通信網に向けて送信される(S4)とともに、デコーダ12に向けて送信される。ディジタル通信網を介して受信側に届いた第nサンプル目の符号化信号cnは、デコーダ201で上記符号化方式に対応する復号化方式により復号化され、ディジタル信号が再生される。デコーダ12は、上記第nサンプル目の符号化信号cnを上記符号化方式に対応する復号化方式により復号化し、第nサンプル目の復号化信号ynを出力する(S5)。エンコーダ101とデコーダ12(及びデコーダ201)は両者の方式が対応していれば、世界に広く普及しているITU-T G.711やITU-T G.726など、任意の符号化方式の機器を適用して構わない。また、本構成例ではエンコーダ101とデコーダ12とは分離独立しているが、エンコーダが符号化信号だけでなく復号化信号も出力する機能を具備する場合には、デコーダを省略して、エンコーダから出力される復号化信号を減算部に送る一体的な構成としてもよい。減算部13は、上記第nサンプル目の復号化信号ynから上記第nサンプル目のディジタル信号xnを減算して第nサンプル目の減算結果yn−xnを出力する(S6)。遅延部14は、上記第nサンプル目の減算結果yn−xnに1サンプリング時間の遅延を与え、これを第n+1サンプル目のディジタル信号xn+1用のフィードバック信号en+1として出力する(S7)。そして、このフィードバック信号en+1が上記加算部11に帰還的に入力されて、以降ディジタル信号サンプルの入力がxn+1、xn+2、・・・と継続する間、上記S1〜S7の処理を繰り返す。
【0012】
このように、本発明においてはエンコード・デコード処理後の信号とエンコード処理前の入力信号との誤差信号を求め、これをフィードバックしてエンコード処理前の入力信号に加算し、再びエンコーダに入力するといったループ状の信号処理を行う。エンコーダに入力された値xn+yn−1−xn−1との誤差が最小となるようにynを決めるこのようなエンコーダ処理は、xn−xn−1を入力してこれとyn−yn−1との誤差が最小となるようにynを決めるエンコーダ処理と等価とみなすことができる。ここで、xn−xn−1とyn−yn−1はいずれも高域強調処理であることから、このエンコード処理により復号化信号ynに含まれる量子化ノイズの周波数成分は、相対的に高域が減り、低域が増える傾向となり、聴覚特性上、ノイズの耳障り感を低減することができる。また、従来のエンコーダに簡単な機能追加を施すことにより構成することができ、かつ、受信側には何ら機能追加を行う必要は無い。
【0013】
〔第2実施形態〕
図3は、本発明の符号化装置20の機能構成例である。また、図4は処理フローである。
符号化装置20は、加算部11、エンコーダ101、デコーダ12、減算部13、遅延部14、及び補正部21から構成される。補正部21が加わっている以外は、第1実施形態(図1)と同じ構成である。よって、図3の中で図1と対応する部分については同一参照番号を付け、説明は省略する。その他の図面についても同様とする。
【0014】
第2実施形態は、第1実施形態の遅延部14と加算部11との間に補正部21を挿入した構成である。第1実施形態では、遅延部14で1サンプリング時間の遅延が与えられた減算結果yn−xnを、そのままフィードバック信号en+1として加算部11に向けて出力していたが、第2実施形態では、減算結果yn−xnは一旦補正部21に入力され、所定の補正計算を施した上で、その計算結果をフィードバック信号en+1として加算部11に向けて出力する(S8)。補正計算は、例えば次式により行う。
【0015】
en+1=α(yn−xn)+β
ここで、αは人間の聴覚上最も雑音が気にならない値を0<α≦1の範囲で表す定数である。αは実験的に定めても、一定の規則性の下、例えば符号化方式に応じて定めてもよい。一例として、耳障りが大きい符号化方式を用いるときほどαの値を大きくし、例えばITU-T G.726を用いるときはα=1.0、ITU-T G.711のA-lawモードを用いるときはα=0.8、ITU-T G.711のμ-lawモードを用いるときはα=0.6といった具合に設定するとよい。また、βはエンコーダの符号化方式により決定される定数で、例えば、ITU-T G.711のA-lawモードを用いるときはβ=8又は−8、ITU-T G.711のμ-lawモードやITU-T G.726を用いるときはβ=0といった具合に設定するとよい。
【0016】
このように、フィードバック信号として減算結果に補正を施した値を用いることで、より効果的に量子化ノイズの耳障り感を低減することができ、よって再生信号の品質の更なる向上を図ることができる。
【0017】
〔第3実施形態〕
図5は、本発明の符号化装置30の機能構成例である。また、図6は処理フローである。
符号化装置30は、加算部11、エンコーダ101、デコーダ12、第1遅延部31、第2遅延部32、及び減算部33から構成される。なお、加算部11、エンコーダ101
、及びデコーダ12は第1実施形態(図1)と同じ構成であるため、説明は省略する。
【0018】
第1遅延部31は、デコーダ12で復号化された第nサンプル目の復号化信号ynが入力され、これを1サンプリング時間遅延させて出力する(S9)。第2遅延部32は、第nサンプル目のディジタル信号xnが入力され、これを1サンプリング時間遅延させて出力する(S10)。減算部33は、第1遅延部31で1サンプリング時間遅延させた第nサンプル目の復号化信号ynから、第2遅延部32で1サンプリング時間遅延させた第nサンプル目の復号化信号xnを減算して求めた第nサンプル目の減算結果yn−xnを、第n+1サンプル目のディジタル信号xn+1用のフィードバック信号en+1として出力する(S11)。そして、このフィードバック信号en+1が上記加算部11に帰還的に入力されて、以降ディジタル信号サンプルの入力がxn+1、xn+2、・・・と継続する間、図6に示すS1〜S11の処理を繰り返す。
【0019】
第1実施形態においては、遅延部を減算部の後段に設置して一括で遅延処理を行うが、第3実施形態においては、遅延部を減算部の前段に復号化信号用と入力ディジタル信号用とに分けて設置してそれぞれの遅延処理を行う。このように構成しても第1実施形態と同様な作用効果を得ることができるため、柔軟な装置設計に資する。
【0020】
〔第4実施形態〕
図7は、本発明の符号化装置40の機能構成例である。また、図8は処理フローである。
符号化装置40は、加算部11、エンコーダ101、デコーダ12、第1遅延部31、第2遅延部32、減算部33、及び補正部21から構成される。なお、補正部21は第2実施形態(図3)と同じ構成であり、それ以外は第3実施形態(図5)と同じ構成であるため、これらの各構成要素の説明は省略する。
【0021】
第4実施形態は、第3実施形態の減算部33と加算部11との間に補正部21を挿入した構成である。第3実施形態では、減算部33は減算結果yn−xnをそのままフィードバック信号en+1として加算部11に向けて出力していたが、第4実施形態では、減算結果yn−xnは一旦補正部21に入力され、所定の補正計算を施した上で、その計算結果をフィードバック信号en+1として加算部11に向けて出力する(S8)。なお、補正部21における処理の詳細については第2実施形態と同様である。
【0022】
このように、フィードバック信号として減算結果に補正を施した値を用いることで、第3実施形態と比べてより効果的に量子化ノイズの耳障り感を低減することができ、よって再生信号の品質の更なる向上を図ることができる。
【0023】
〔第5実施形態〕
図9は、本発明の符号化装置90の機能構成例である。第5実施形態は、第1〜4実施形態の構成を基礎とし、入力ディジタル信号が広帯域信号の場合にも量子化ノイズを効果的に抑制できるようにするための構成である。
【0024】
符号化装置90は、帯域分割フィルタ91、低域用符号化装置92、高域用符号化装置93、及びマルチプレクサ94から構成される。帯域分割フィルタ91は、入力された広帯域ディジタル信号を低域信号と高域信号に分割して出力する。低域用符号化装置92は、上記低域信号が入力され、これを符号化した信号を出力し、高域用符号化装置93は、上記高域信号が入力され、これを符号化した信号を出力する。ここで、低域用符号化装置92と高域用符号化装置93には、それぞれ、符号化装置10、20、30、40、及びエンコーダ101のいずれかを任意に適用することができる。マルチプレクサ94は、低域用符号化装置92と高域用符号化装置93でそれぞれ符号化された信号を合成して出力する。
【0025】
このような構成により、入力ディジタル信号が広帯域信号の場合にも量子化ノイズを効果的に抑制することができる。
【0026】
本発明における符号化装置及びその方法は、上記の実施形態に限定されるものではなく、本発明を逸脱しない範囲で適宜変更が可能である。また、上記に説明した処理は記載の順に従った時系列において実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0027】
<発明の効果の実験による確認>
電話帯域音声を符号化する場合の、本発明の構成(図3)における主観評価値と、従来の構成(図11)における主観評価値との比較により、本発明の効果の確認を行った結果を表1に示す。主観評価値とは、両方式を適用して出力された音声を防音室においてヘッドフォンで受聴し、被験者が音質を1〜5の五段階評価した値の平均値であり、値が大きいほど品質が優れていることを示す。なお、エンコーダとデコーダにはITU-T G.711 A-law方式のものを用い、補正定数にはα=0.8、β=8を用いた。
【0028】
本実験により、主観評価値が平均で0.19改善することが確認された。
【表1】
また、広帯域音声を符号化する場合に、本発明を適用した場合(図9の構成)の主観評価値と、適用しなかった場合(図9の構成において符号化装置にエンコーダのみを使用)
の主観評価値との比較により本発明の効果の確認を行った結果を表2に示す。
【0029】
本実験により、広帯域符号化においても主観評価値が平均で0.17改善することが確認された。
【0030】
【表2】
【産業上の利用可能性】
【0031】
ディジタル通信網を介して音声通信を行う利用形態において、受信側は既存の機器のままで、送信側の機器のみに簡便な変更を施すことにより、符号化ノイズが低減された高品質の通信を実現したい場合に有用である。
【技術分野】
【0001】
本発明は、ディジタル化された音声、音楽などの音響信号を符号化し、ディジタル通信網を介して送受信する符号化方法およびプログラムに関する。
【背景技術】
【0002】
パケット通信網をはじめとするディジタル通信網を介して音声を送受信する利用が増えている。IP電話もその例である。図10はディジタル通信網を介したディジタル音声信号送受信の構成例である。送信側において、ディジタル信号は1サンプル毎に符号化装置100に入力されて符号化信号に変換され、ディジタル通信網を介して受信側に送られた
符号化信号は、復号化装置200においてディジタル信号に復号化される。符号化装置・復号化装置における符号化方式には、任意のものが利用できるが、符号化方式と復号化方式は対応したものでなければならない。図11は、符号化装置100にエンコーダ101、復号化装置200にデコーダ201を適用した場合の構成例である。エンコーダ101は、入力されたディジタル信号を所定の符号化方式により符号化信号に変換して出力する。デコーダ201はディジタル通信網を介して転送された上記符号化信号が入力され、所定の復号化方式により復号化してディジタル信号を再生する。なお、上記のとおりエンコーダ101とデコーダ201は両者の方式が対応していれば、例えば世界に広く普及しているITU-T G.711やITU-T G.726など、任意の方式のエンコーダ、デコーダを適用して構わない。
【0003】
もっとも、このような構成において受信側で再生されるディジタル信号は、符号化処理の際に生じる量子化ノイズにより、用途に不十分な程度に品質が劣化してしまう場合がある。そのような場合の品質改善方法の1つとして、図12に示すようにエンコーダ101の前段にプリエンファシス手段102、デコーダ201の後段にディエンファシス手段202を挿入する方法が非特許文献1に開示されている。非特許文献1は、符号化処理時の品質改善方法としてではなくA/D、D/A変換時の品質改善方法として記載されているが、この方法を応用することにより符号化処理においても品質改善の効果を得ることが可能である。
【0004】
しかし、非特許文献1の方法によると符号化装置と復号化装置の双方に機能追加を行う必要があり、既にITU-T G.711方式の機器などが世界中に広く普及しているという現状を踏まえれば、双方に機能の追加(又は機器の更改)を行うことは現実的でない、または品質改善効果が得られる機会が限定的になると考えられる。そこで、送信側だけに機能を追加し受信側は既存のデコーダをそのまま使用できる品質改善方法として、聴覚重み付け、またはノイズシェーピングと呼ばれる手法が非特許文献2に開示されている。この手法は、優れた作用効果を奏するもので、日本の携帯電話用の音声符号化方式にも採用されている。
【非特許文献1】古井貞煕、“ディジタル音声処理、” 東海大学出版会、pp36-37, 1985.
【非特許文献2】三樹聡、守谷健弘、間野一則、大室仲、“ピッチ同期雑音励振源をもつCELP符号化(PSI-CELP)、” 電子情報通信学会論文誌 A Vol.J77-A No.3 pp.314-324,1994.
【発明の概要】
【発明が解決しようとする課題】
【0005】
非特許文献2で開示されている方法は優れた作用効果を奏するものの、構成が複雑であるうえに既存のエンコーダに簡単に機能追加できる形になっていない。すなわち、受信側のデコーダは既存装置を利用できるものの、送信側のエンコーダは新たに設計し直す必要があるため、コストの増加につながる。
【0006】
本発明の目的は、プリエンファシス・ディエンファシスを適用する方法のように、簡便に既存の符号化方式と組み合わせ可能であるという利点と、ノイズシェーピングを適用する方法のように送信側だけに機能を追加すれば受信側は既存装置のままでよいという利点とを両立し、効果的に量子化ノイズの耳障り感を低減することが可能な符号化装置を実現することにある。
【課題を解決するための手段】
【0007】
本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
あるいは、本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
あるいは、本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
あるいは、本発明の符号化方法は、第nサンプル目のディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する。
【発明の効果】
【0008】
本発明によれば、容易に既存の符号化方式と組み合わせ可能であり、かつ、送信側だけに機能を追加すれば受信側は既存装置のままで量子化ノイズの耳障り感を効果的に低減することが可能な符号化装置を実現することができる。
【図面の簡単な説明】
【0009】
【図1】第1実施形態の符号化装置の構成例。
【図2】第1実施形態の符号化装置の処理フロー図。
【図3】第2実施形態の符号化装置の構成例。
【図4】第2実施形態の符号化装置の処理フロー図。
【図5】第3実施形態の符号化装置の構成例。
【図6】第3実施形態の符号化装置の処理フロー図。
【図7】第4実施形態の符号化装置の構成例。
【図8】第4実施形態の符号化装置の処理フロー図。
【図9】第5実施形態の符号化装置の構成例。
【図10】従来の符号化装置の構成例。
【図11】エンコーダ・デコーダを適用した従来の符号化装置の構成例。
【図12】プリエンファシス・ディエンファシスを適用した従来の符号化装置の構成例。
【発明を実施するための形態】
【0010】
〔第1実施形態〕
図1は、本発明の符号化装置10の機能構成例である。また、図2は処理フローである。
符号化装置10は、加算部11、エンコーダ101、デコーダ12、減算部13及び遅延部14から構成され、装置に入力されたディジタル信号を1サンプル毎に符号化する。なお、エンコーダ101は図11に示した従来技術の符号化装置100に用いられるエンコーダ101と同じものであることから同一参照番号を付与している。また、デコーダ12は図11に示した従来技術の復号化装置200に用いられるデコーダ201と同じものである。
【0011】
加算部11は、第nサンプル目のディジタル信号xnが入力される(S1)と共に、後述するフィードバック信号en(=yn−1−xn−1)が入力され、これらを加算して第nサンプル目の加算結果xn+enを出力する(S2)。エンコーダ101は、上記第nサンプル目の加算結果xn+enを所定の符号化方式で符号化し、第nサンプル目の符号化信号cnを生成する(S3)。この第nサンプル目の符号化信号cnは、ディジタル通信網に向けて送信される(S4)とともに、デコーダ12に向けて送信される。ディジタル通信網を介して受信側に届いた第nサンプル目の符号化信号cnは、デコーダ201で上記符号化方式に対応する復号化方式により復号化され、ディジタル信号が再生される。デコーダ12は、上記第nサンプル目の符号化信号cnを上記符号化方式に対応する復号化方式により復号化し、第nサンプル目の復号化信号ynを出力する(S5)。エンコーダ101とデコーダ12(及びデコーダ201)は両者の方式が対応していれば、世界に広く普及しているITU-T G.711やITU-T G.726など、任意の符号化方式の機器を適用して構わない。また、本構成例ではエンコーダ101とデコーダ12とは分離独立しているが、エンコーダが符号化信号だけでなく復号化信号も出力する機能を具備する場合には、デコーダを省略して、エンコーダから出力される復号化信号を減算部に送る一体的な構成としてもよい。減算部13は、上記第nサンプル目の復号化信号ynから上記第nサンプル目のディジタル信号xnを減算して第nサンプル目の減算結果yn−xnを出力する(S6)。遅延部14は、上記第nサンプル目の減算結果yn−xnに1サンプリング時間の遅延を与え、これを第n+1サンプル目のディジタル信号xn+1用のフィードバック信号en+1として出力する(S7)。そして、このフィードバック信号en+1が上記加算部11に帰還的に入力されて、以降ディジタル信号サンプルの入力がxn+1、xn+2、・・・と継続する間、上記S1〜S7の処理を繰り返す。
【0012】
このように、本発明においてはエンコード・デコード処理後の信号とエンコード処理前の入力信号との誤差信号を求め、これをフィードバックしてエンコード処理前の入力信号に加算し、再びエンコーダに入力するといったループ状の信号処理を行う。エンコーダに入力された値xn+yn−1−xn−1との誤差が最小となるようにynを決めるこのようなエンコーダ処理は、xn−xn−1を入力してこれとyn−yn−1との誤差が最小となるようにynを決めるエンコーダ処理と等価とみなすことができる。ここで、xn−xn−1とyn−yn−1はいずれも高域強調処理であることから、このエンコード処理により復号化信号ynに含まれる量子化ノイズの周波数成分は、相対的に高域が減り、低域が増える傾向となり、聴覚特性上、ノイズの耳障り感を低減することができる。また、従来のエンコーダに簡単な機能追加を施すことにより構成することができ、かつ、受信側には何ら機能追加を行う必要は無い。
【0013】
〔第2実施形態〕
図3は、本発明の符号化装置20の機能構成例である。また、図4は処理フローである。
符号化装置20は、加算部11、エンコーダ101、デコーダ12、減算部13、遅延部14、及び補正部21から構成される。補正部21が加わっている以外は、第1実施形態(図1)と同じ構成である。よって、図3の中で図1と対応する部分については同一参照番号を付け、説明は省略する。その他の図面についても同様とする。
【0014】
第2実施形態は、第1実施形態の遅延部14と加算部11との間に補正部21を挿入した構成である。第1実施形態では、遅延部14で1サンプリング時間の遅延が与えられた減算結果yn−xnを、そのままフィードバック信号en+1として加算部11に向けて出力していたが、第2実施形態では、減算結果yn−xnは一旦補正部21に入力され、所定の補正計算を施した上で、その計算結果をフィードバック信号en+1として加算部11に向けて出力する(S8)。補正計算は、例えば次式により行う。
【0015】
en+1=α(yn−xn)+β
ここで、αは人間の聴覚上最も雑音が気にならない値を0<α≦1の範囲で表す定数である。αは実験的に定めても、一定の規則性の下、例えば符号化方式に応じて定めてもよい。一例として、耳障りが大きい符号化方式を用いるときほどαの値を大きくし、例えばITU-T G.726を用いるときはα=1.0、ITU-T G.711のA-lawモードを用いるときはα=0.8、ITU-T G.711のμ-lawモードを用いるときはα=0.6といった具合に設定するとよい。また、βはエンコーダの符号化方式により決定される定数で、例えば、ITU-T G.711のA-lawモードを用いるときはβ=8又は−8、ITU-T G.711のμ-lawモードやITU-T G.726を用いるときはβ=0といった具合に設定するとよい。
【0016】
このように、フィードバック信号として減算結果に補正を施した値を用いることで、より効果的に量子化ノイズの耳障り感を低減することができ、よって再生信号の品質の更なる向上を図ることができる。
【0017】
〔第3実施形態〕
図5は、本発明の符号化装置30の機能構成例である。また、図6は処理フローである。
符号化装置30は、加算部11、エンコーダ101、デコーダ12、第1遅延部31、第2遅延部32、及び減算部33から構成される。なお、加算部11、エンコーダ101
、及びデコーダ12は第1実施形態(図1)と同じ構成であるため、説明は省略する。
【0018】
第1遅延部31は、デコーダ12で復号化された第nサンプル目の復号化信号ynが入力され、これを1サンプリング時間遅延させて出力する(S9)。第2遅延部32は、第nサンプル目のディジタル信号xnが入力され、これを1サンプリング時間遅延させて出力する(S10)。減算部33は、第1遅延部31で1サンプリング時間遅延させた第nサンプル目の復号化信号ynから、第2遅延部32で1サンプリング時間遅延させた第nサンプル目の復号化信号xnを減算して求めた第nサンプル目の減算結果yn−xnを、第n+1サンプル目のディジタル信号xn+1用のフィードバック信号en+1として出力する(S11)。そして、このフィードバック信号en+1が上記加算部11に帰還的に入力されて、以降ディジタル信号サンプルの入力がxn+1、xn+2、・・・と継続する間、図6に示すS1〜S11の処理を繰り返す。
【0019】
第1実施形態においては、遅延部を減算部の後段に設置して一括で遅延処理を行うが、第3実施形態においては、遅延部を減算部の前段に復号化信号用と入力ディジタル信号用とに分けて設置してそれぞれの遅延処理を行う。このように構成しても第1実施形態と同様な作用効果を得ることができるため、柔軟な装置設計に資する。
【0020】
〔第4実施形態〕
図7は、本発明の符号化装置40の機能構成例である。また、図8は処理フローである。
符号化装置40は、加算部11、エンコーダ101、デコーダ12、第1遅延部31、第2遅延部32、減算部33、及び補正部21から構成される。なお、補正部21は第2実施形態(図3)と同じ構成であり、それ以外は第3実施形態(図5)と同じ構成であるため、これらの各構成要素の説明は省略する。
【0021】
第4実施形態は、第3実施形態の減算部33と加算部11との間に補正部21を挿入した構成である。第3実施形態では、減算部33は減算結果yn−xnをそのままフィードバック信号en+1として加算部11に向けて出力していたが、第4実施形態では、減算結果yn−xnは一旦補正部21に入力され、所定の補正計算を施した上で、その計算結果をフィードバック信号en+1として加算部11に向けて出力する(S8)。なお、補正部21における処理の詳細については第2実施形態と同様である。
【0022】
このように、フィードバック信号として減算結果に補正を施した値を用いることで、第3実施形態と比べてより効果的に量子化ノイズの耳障り感を低減することができ、よって再生信号の品質の更なる向上を図ることができる。
【0023】
〔第5実施形態〕
図9は、本発明の符号化装置90の機能構成例である。第5実施形態は、第1〜4実施形態の構成を基礎とし、入力ディジタル信号が広帯域信号の場合にも量子化ノイズを効果的に抑制できるようにするための構成である。
【0024】
符号化装置90は、帯域分割フィルタ91、低域用符号化装置92、高域用符号化装置93、及びマルチプレクサ94から構成される。帯域分割フィルタ91は、入力された広帯域ディジタル信号を低域信号と高域信号に分割して出力する。低域用符号化装置92は、上記低域信号が入力され、これを符号化した信号を出力し、高域用符号化装置93は、上記高域信号が入力され、これを符号化した信号を出力する。ここで、低域用符号化装置92と高域用符号化装置93には、それぞれ、符号化装置10、20、30、40、及びエンコーダ101のいずれかを任意に適用することができる。マルチプレクサ94は、低域用符号化装置92と高域用符号化装置93でそれぞれ符号化された信号を合成して出力する。
【0025】
このような構成により、入力ディジタル信号が広帯域信号の場合にも量子化ノイズを効果的に抑制することができる。
【0026】
本発明における符号化装置及びその方法は、上記の実施形態に限定されるものではなく、本発明を逸脱しない範囲で適宜変更が可能である。また、上記に説明した処理は記載の順に従った時系列において実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0027】
<発明の効果の実験による確認>
電話帯域音声を符号化する場合の、本発明の構成(図3)における主観評価値と、従来の構成(図11)における主観評価値との比較により、本発明の効果の確認を行った結果を表1に示す。主観評価値とは、両方式を適用して出力された音声を防音室においてヘッドフォンで受聴し、被験者が音質を1〜5の五段階評価した値の平均値であり、値が大きいほど品質が優れていることを示す。なお、エンコーダとデコーダにはITU-T G.711 A-law方式のものを用い、補正定数にはα=0.8、β=8を用いた。
【0028】
本実験により、主観評価値が平均で0.19改善することが確認された。
【表1】
また、広帯域音声を符号化する場合に、本発明を適用した場合(図9の構成)の主観評価値と、適用しなかった場合(図9の構成において符号化装置にエンコーダのみを使用)
の主観評価値との比較により本発明の効果の確認を行った結果を表2に示す。
【0029】
本実験により、広帯域符号化においても主観評価値が平均で0.17改善することが確認された。
【0030】
【表2】
【産業上の利用可能性】
【0031】
ディジタル通信網を介して音声通信を行う利用形態において、受信側は既存の機器のままで、送信側の機器のみに簡便な変更を施すことにより、符号化ノイズが低減された高品質の通信を実現したい場合に有用である。
【特許請求の範囲】
【請求項1】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、
上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、
上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、
上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項2】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、
上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、
上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項3】
請求項1又は2に記載の符号化方法であって、更に、
上記遅延ステップで1サンプリング時間遅延させた減算結果を補正して、これを上記フィードバック信号サンプルとして提供する補正ステップを実行することを特徴とする符号化方法。
【請求項4】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、
上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、
上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、
上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、
上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項5】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、
上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、
上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、
上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項6】
請求項4又は5に記載の符号化方法であって、更に、
上記減算ステップで得られた減算結果を補正して、これを上記フィードバック信号サンプルとして提供する補正ステップを実行することを特徴とする符号化方法。
【請求項7】
請求項3又は6に記載の符号化方法であって、
上記補正は、上記減算結果に第一の定数を乗算したもの、または、上記減算結果に第二の定数を加算したもの、または、上記減算結果に第一の定数の乗算と第二の定数の加算との両方をおこなったもの、を上記フィードバック信号サンプルとする補正であることを特徴とする符号化方法。
【請求項8】
請求項1から7のいずれかに記載した符号化方法をコンピュータに実行させるためのプログラム。
【請求項1】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、
上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、
上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、
上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項2】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、遅延ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、
上記復号化信号サンプルから上記ディジタル化された音響信号サンプルを減算して減算結果を得る減算ステップと、
上記減算結果を1サンプリング時間遅延させて上記フィードバック信号サンプルとして得る遅延ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項3】
請求項1又は2に記載の符号化方法であって、更に、
上記遅延ステップで1サンプリング時間遅延させた減算結果を補正して、これを上記フィードバック信号サンプルとして提供する補正ステップを実行することを特徴とする符号化方法。
【請求項4】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号を生成するエンコードステップと、
上記符号化信号から、上記符号化方式に対応する復号化方式により復号化信号サンプルを生成するデコードステップと、
上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、
上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、
上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項5】
ディジタル化された音響信号を1サンプル毎に符号化する符号化方法であって、
第nサンプル目の上記ディジタル化された音響信号サンプルxnと、減算ステップで得られたフィードバック信号サンプルと、を加算して加算結果を得る加算ステップと、
上記加算結果から、入力された信号をサンプル毎に符号化する所定の符号化方式により符号化信号及び復号化信号サンプルを生成するエンコードステップと、
上記復号化信号サンプルを1サンプリング時間遅延させて出力する第1遅延ステップと、
上記ディジタル信号化された音響信号サンプルを1サンプリング時間遅延させて出力する第2遅延ステップと、
上記第1遅延ステップでの出力信号から上記第2遅延ステップでの出力信号を減算した減算結果を上記フィードバック信号サンプルとして得る減算ステップと、
を上記ディジタル化された音響信号サンプルxnの入力がxn+1、xn+2、・・・と継続する間、繰り返し実行する符号化方法。
【請求項6】
請求項4又は5に記載の符号化方法であって、更に、
上記減算ステップで得られた減算結果を補正して、これを上記フィードバック信号サンプルとして提供する補正ステップを実行することを特徴とする符号化方法。
【請求項7】
請求項3又は6に記載の符号化方法であって、
上記補正は、上記減算結果に第一の定数を乗算したもの、または、上記減算結果に第二の定数を加算したもの、または、上記減算結果に第一の定数の乗算と第二の定数の加算との両方をおこなったもの、を上記フィードバック信号サンプルとする補正であることを特徴とする符号化方法。
【請求項8】
請求項1から7のいずれかに記載した符号化方法をコンピュータに実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−118408(P2011−118408A)
【公開日】平成23年6月16日(2011.6.16)
【国際特許分類】
【出願番号】特願2011−7985(P2011−7985)
【出願日】平成23年1月18日(2011.1.18)
【分割の表示】特願2007−155413(P2007−155413)の分割
【原出願日】平成19年6月12日(2007.6.12)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
【公開日】平成23年6月16日(2011.6.16)
【国際特許分類】
【出願日】平成23年1月18日(2011.1.18)
【分割の表示】特願2007−155413(P2007−155413)の分割
【原出願日】平成19年6月12日(2007.6.12)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
[ Back to top ]