説明

音声符号化装置および音声復号装置

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声のディジタル有線通信および無線通信において用いられる音声符号化・復号装置に関し、特にDTMF(Dual Tone Multi-Frequency)信号などの、音声周波数帯域を用いた非音声信号を伝送する事の出来る音声符号化・復号装置に関する。
【0002】
【従来の技術】企業内通信においては、通信コストの低減が最も重要な課題である。通信トラヒックの大部分を占める音声信号の高能率伝送を実現するため、近年、8kbit/sCS-ACELP(Conjugate-Structure Algebraic-Code-Excited Linear Prediction: 共役構造代数的符号励振線形予測)音声符号化方式(ITU-T勧告G.729準拠)に代表されるような、音声符号化・復号方式に基づく高能率音声符号化装置を適用する事例が増えつつある。
【0003】伝送速度が8kbit/sクラスの音声符号化アルゴリズムにおいては、少ない情報量で高品質な音声を得るため入力信号を音声信号に特化した構成となっている。この事を上記8kbit/s CS-ACELP方式を例にとって説明する。図20に符号器のブロック図を、図21に復号器のブロック図を示す。本符号化方式は、人間の発声機構をモデル化した符号化アルゴリズムとなっており、即ち、人間の声道情報をモデル化した合成フィルタ412(音声のスペクトル包絡に対応する線形フィルタ)を構成し、人間の声帯音源に相当する符号帳に蓄えられた時系列の信号(励振信号再生部411の出力)で駆動する事によって音声を再生するCELP方式に基づいている。なお、詳細なアルゴリズムの説明は、ITU-T Recommendation G.729, ■Coding of Speech at 8kbit/s using Conjugate-Structure Algebraic-Code-ExcitedLinear Prediction(CS-ACLEP)■を参照されたい。
【0004】符号化アルゴリズムが音声に特化された構造になると、高能率音声符号化装置を用いた伝送路において、音声周波数帯域を用いた音声信号以外の信号(例えば、デュアルトーンで構成されたプッシュボタンに用いられるDTMF信号、No.5シグナリング、モデム信号など)の伝送特性は、伝送効率が高能率になればなるほど低下する傾向がある。
【0005】この事を示す一例として、LSP量子化部の詳細について、図22、図23を用いて説明する。図22R>2は、図20に示した符号器内のLSP量子化部309の詳細構成であり、図23は、図21に示した復号器内のLSP逆量子化部407の詳細構成である。
【0006】CS-ACELP音声符号化方式においては、LSP係数の量子化に3つの処理手順を踏む事で実現している。即ち、LSP量子化部309は、以下に示す3つの処理機能ブロックを有している。
(1)フレーム間で予測可能な成分を差し引いて効率的に量子化するための移動平均(MA)予測成分計算部308(2)ターゲットとなるLSPを、音声により学習された符号帳を用いて大雑把に量子化を行う第1段LSP量子化符号帳335(3)第1段で大雑把に量子化されたターゲットLSPに対して、乱数系列を用いた符号帳で微調整を行う第2段LSP量子化符号帳336
【0007】(1)の移動平均予測を用いる事により周波数特性の急激な変化の少ない、即ちフレーム間で相関性の強い信号を効率的に量子化する事が出来る。また(2)の学習符号帳と、(3)の乱数符号帳との併用により、数学的な厳密性には欠けるものの、スペクトル包絡の概形を効率よく表現する事が出来る。また、(3)の乱数符号帳の存在により、スペクトル包絡の微妙な変化にも柔軟に追随する事が出来る。以上の観点から、LSP量子化部309は音声のスペクトル包絡情報の特徴を効率よく符号化するのに良く適した方式であるといえる。
【0008】一方、非音声信号、特にDTMF信号の符号化においては、以下のような性質を考慮する必要がある。
・スペクトル包絡は音声信号と明らかに異なっている。
・信号継続時間と、ポーズ時間との間でスペクトル特性に急激な変化がある。利得も急激に変化する。ただし、信号継続時間内に限定すれば、スペクトル特性、利得ともに変化量が極めて小さい。
・LSPの量子化歪がそのままDTMF信号の周波数歪に反映されるため、LSP量子化歪は出来るだけ小さくする必要がある。
・DTMF信号が継続する区間においては、周波数特性は極めて安定している。
以上の観点から、上記LSP量子化部309は、DTMF信号のスペクトル包絡情報を符号化するのに効果的な方法であるとは言えない。
【0009】以上の例で示したように、DTMF信号のような非音声信号はいくつかの観点で音声信号とは異なる性質を有しているため、非音声信号の符号化に当たって、特に伝送速度が低く符号化のための冗長性が少ないという条件の下では、音声信号と同じ手法を用いるのは適当とは言えない。
【0010】ところで、企業内通信においては、電話通信における呼接続などのために、シグナリング伝送のための信号線を別途設ける事をせず、DTMF信号等を用いてインチャネルでシグナリング伝送を行う事が多い。この場合、割当てられた伝送路が上記の高能率音声符号化を用いた伝送路であれば、DTMF信号の伝送特性は悪化するため、呼接続が正常に出来なくなるケースが高い頻度で発生するといった弊害がある。
【0011】このような問題を解決する第1の手段として、例えば、特開平9-81199に示されるような図24の装置構成がとられる事がある。この構成においては送信側に、音声信号と、DTMF信号のような非音声信号とを識別する手段と、DTMF信号をあらかじめ符号化したパターンを記憶しているメモリを、送信側と受信側とで有しており、本識別手段においてDTMF信号の入力を識別すると、DTMFの番号に対応する符号化パターンを保持するメモリのインデックスを受信側に送信し、受信側ではそのインデックスを識別して、その番号に対応するDTMF信号を生成するものである。
【0012】また、このような問題を解決する第2の手段として、例えば、特開平9-326772に示されるような図2525の装置構成がとられる事がある。この構成においては、入力音声の符号化に際し、フィルタ係数を得て音声符号化量を算出する聴覚重み付けフィルタと、聴感上の品質を高めるための聴覚重み付けフィルタ適応部で得られる反射係数を設定値と比較する反射係数判定手段と、この反射係数が規定の範囲外であれば聴覚重み付けフィルタを使用し、規定の範囲内であれば聴覚重み付けフィルタを使用しない使用切換手段を備えた。
【0013】また更に、入力信号のレベルの変化を監視する信号レベル監視手段を付加し、使用切換手段は反射係数と入力信号のレベルの変化の組み合わせで聴覚重み付けフィルタの使用切換を行うようにした。また、復号装置側も対応する使用切換手段を備えた。
【0014】
【発明が解決しようとする課題】ところで、音声伝送時において、音声/DTMF識別器が誤識別を起こす事がある。このとき、従来の第1の装置構成では、受信側において、音声伝送の途中に完全なデュアルトーンが生成され、即ち、会話の途中で突然DTMFの「ピー」音が挟まるような状況を呈する事となり、音声品質へのダメージが大きくなる事が予想される。また、DTMFと識別されたときの復号器の入力が不定となるため、通常の音声伝送に復帰後、復号器の内部状態が不連続となり、異音が発生するといった問題もある。
【0015】従って、音声品質をある程度のレベルに維持するためには、音声/DTMF識別器には誤識別率が限りなく0に近い性能の高いものが要求される。これを、例えばDSPなどの信号処理プロセッサで実現する場合通常処理負荷は高くなる。このような識別アルゴリズムに対応する必要から、実現に当たっては高性能のプロセッサを必要とするため実現コストが高くなるなどの問題も発生する。
【0016】また、従来の第2の装置構成においては、伝送速度が比較的高い(16kbit/s程度)符号化アルゴリズムであれば聴覚重み付けフィルタや、ポストフィルタによる周波数歪を改善する事で十分なDTMF伝送特性を得る事が出来るが、これよりも更に低速度(8kbit/s以下)の音声符号化アルゴリズムにおいては、冗長度が少なくなる分音声信号の符号化に特化されているため、上記フィルタ以外の機能ブロックで、上記フィルタによる歪以上の符号化歪が加わってしまう事が知られている。従って、本装置構成においてDTMF信号の伝送特性を十分に改善する事が出来ない。
【0017】本発明は、このような従来の問題を解決するために考えられたものであり、DTMF信号等の非音声信号の伝送特性の改善を図りつつ、符号化アルゴリズムが本来持っている音声伝送品質が維持された高能率音声符号化・復号装置を、より簡便な方法で提供し、DTMF信号等の非音声信号をインチャネルで伝送可能とする事を目的とする。
【0018】
【課題を解決するための手段】本発明に係わる音声符号化装置は、入力される信号が音声信号か、非音声信号かを識別し、判定結果を出力する、音声/非音声識別器と、音声の符号化に適した周波数パラメータに基づき入力信号を符号化し、音声符号化信号を出力する第1の機能ブロックと、上記第1の機能ブロックと同じ符号化方式で、上記周波数パラメータとは異なる非音声の符号化に適した周波数パラメータに基づき入力信号を逐次符号化し、非音声符号化信号を出力する第2の機能ブロックとを有し、入力信号を圧縮符号化する符号器と、上記音声/非音声識別器の判定結果に応じて、入力信号の上記符号器への供給を第1の機能ブロック、または第2の機能ブロックのいずれかを選択する切替手段と、上記符号器の出力と、上記音声/非音声識別器の判定結果とを多重化し、伝送路に出力する多重化部とを備え、上記第1の機能ブロックは、音声の符号化に適したLSP(LineSpectrumPair:線スペクトル対)量子化部、上記第2の機能ブロックは、非音声の符号化に適したLSP量子化部であり、上記第2の機能ブロックを構成するLSP量子化部は、LSPの移動平均予測処理を停止するか、または移動平均予測の効果を軽減する機能を持つものである。
【0019】 また、本発明に係わる音声符号化装置は、入力される信号が音声信号か、非音声信号かを識別し、判定結果を出力する、音声/非音声識別器と、音声の符号化に適した周波数パラメータに基づき入力信号を符号化し、音声符号化信号を出力する第1の機能ブロックと、上記第1の機能ブロックと同じ符号化方式で、上記周波数パラメータとは異なる非音声の符号化に適した周波数パラメータに基づき入力信号を逐次符号化し、非音声符号化信号を出力する第2の機能ブロックとを有し、入力信号を圧縮符号化する符号器と、上記音声/非音声識別器の判定結果に応じて、入力信号の上記符号器への供給を第1の機能ブロック、または第2の機能ブロックのいずれかを選択する切替手段と、上記符号器の出力と、上記音声/非音声識別器の判定結果とを多重化し、伝送路に出力する多重化部とを備え、上記第1の機能ブロックは、音声の符号化に適したLSP量子化部、上記第2の機能ブロックは、非音声の符号化に適したLSP量子化部であり、上記第1及び第2の機能ブロックは、量子化誤差計算に用いる重み付け係数が異なり、ある特定の周波数領域において、上記第2の機能ブロックの重み付け係数を上記第1の機能ブロックの重み付け係数より大きくするものである。
【0020】 また、本発明に係わる音声復号装置は、音声符号化装置で符号化され、伝送された多重化データ列から、符号化信号と、音声/非音声識別信号とに分離する多重分離部と、上記符号化信号を元の信号に復号する復号器とを備え、上記復号器は、伝送された音声符号化信号を符号化した符号器に対応する第3の機能ブロックと、同じく伝送された非音声符号信号を符号化した符号器に対応する第4の機能ブロックとを有し、上記多重データ分離部で分離された、上記音声/非音声識別器の判定結果に応じて、上記第3の機能ブロック、または第4の機能ブロックのいずれかを選択する切替手段を有するものである。
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【発明の実施の形態】実施の形態1.以下、本発明の実施の形態1について図面を参照しながら説明する。図1は本発明の実施の形態1における音声符号化・復号装置の構成を示すブロック図である。図1の送信側において、101は音声信号をあるアルゴリズムに基づき高能率に圧縮符号化する符号器、102は符号器への入力信号が音声信号か、非音声信号(例えば、DTMF信号、No.5シグナリング等)かを識別し、判定結果を出力する音声/非音声信号識別器、103、104は切替スイッチ、105、106はそれぞれ符号器101の一部機能を実行する符号化処理機能ブロック、107は識別器の判定結果と、符号器の出力とを多重化して伝送路に出力する多重化部である。ここで符号化処理機能ブロック105は、音声信号を対象に高能率に圧縮符号化できるように最適化がなされている。一方、符号化処理機能ブロック106は非音声信号、例えばDTMF信号を少ない歪で圧縮符号化できるように最適化がなされている。
【0028】また、図1の受信側において、201は符号器101と同一のアルゴリズムに基づき高能率に圧縮された音声符号を音声信号に復号する復号器、202は多重化部107で多重化された音声/非音声信号識別器102の判定結果と、符号器101の出力とを分離して出力する多重分離部、203、204は切替スイッチ、205、206はそれぞれ復号器201の一部機能を実行する復号処理機能ブロックである。ここで、205、206はそれぞれ符号器101の符号化処理機能ブロック105、106に対応している、または機能的に全く同一のものである。
【0029】次に、この音声符号化・復号装置の動作について説明する。図1の送信側において、音声/非音声信号識別器102は、入力される信号が音声信号か、非音声信号であるかを常に監視し、その判定結果に基づいて符号器101の動作モードを決定する。音声/非音声信号識別器102で「音声」と判定されたときは、切替スイッチ103を端子103A側に、同104を端子104A側にそれぞれ倒す。その結果、符号器101の内部において、符号化処理処理機能ブロック105が選択され、音声信号を高能率に符号化するのに適した動作モード(以下、■音声モード■と称する)となる。このモードにおいて、符号器101は音声信号を符号化アルゴリズムに基づいて符号化処理を実行し、入力音声に対応する符号を出力する。
【0030】また、音声/非音声信号識別器102で「非音声」と判定されたときは、切替スイッチ103を端子103B側に、同104を端子104B側にそれぞれ倒す。その結果、符号器101の内部において、符号化処理機能ブロック106が選択され、非音声信号、例えばDTMF信号等を少ない歪で圧縮符号化するのに適した動作モード(以下■非音声モード■と称する)となる。このモードにおいて、符号器101は非音声信号、例えばDTMF信号等を符号化アルゴリズムに基づいて符号化処理を実行し、入力された非音声信号に対応する符号を出力する。
【0031】音声/非音声信号識別器102の動作について、一例として、識別の対象となる非音声信号にDTMF信号を用いて説明する。DTMF信号はデュアルトーンで構成されており、出力される信号の周波数成分は規定により特定の値に固定されている事から、・FFT等を用いて周波数分析を行う・バンドパスフィルタを用いて特定の周波数成分を濾波する等の方法を用いて、周波数軸上の特徴量を抽出し、DTMF信号の持つ特徴量と一致するか否かを判定する事により識別する事が出来る。
【0032】また、DTMF信号のレベルについても、送出レベルが規定により特定の範囲に限定されている事、レベルの変動が少ない事などから、比較的レベル変動が大きくダイナミックレンジの広い音声信号とは明らかに異なった特徴を示す。従って、入力信号のレベルを監視する事により、DTMF信号識別のための補助情報として用いる事でDTMF信号の検出精度を向上させる事も出来る。音声/非音声信号識別器102では上記のパラメータを入力信号を用いて独自に算出し、それらを基に判定を下して結果を出力する機能を持つ。
【0033】多重化部107では、以上のようにして得られた音声信号、或いは非音声信号が符号化されたもの(以下、音声/非音声符号と称する)と、音声/非音声信号識別器102の出力である入力信号の識別結果(音声信号か、非音声信号か)を多重化して伝送路へ送出する。
【0034】一方、図1の受信側においては、まず伝送路から受信した信号列から、多重分離部202において音声/非音声符号と、音声/非音声信号識別器102の判定結果とに分離する。このように信号列から取り出された音声/非音声信号識別器102の判定結果が、「音声」であれば切替スイッチ203を端子203A側に、同204を端子204A側にそれぞれ倒す。その結果、復号器201の内部において復号処理機能ブロック205が選択され、符号器101の音声モードに対応した復号器の動作モードとなる。このモードにおいて、復号器201は復号アルゴリズムに基づいて復号処理を実行し音声信号を復号する。このとき、符号化・復号処理はいずれも音声モードで実行されているので、復号された音声信号は符号化アルゴリズムがもつ本来の性能に見合った品質となっている。
【0035】また、多重分離部202で信号列から取り出された音声/非音声信号識別器102の判定結果が、「非音声」であれば切替スイッチ203を端子203B側に、同204を端子204B側にそれぞれ倒す。その結果、復号器201の内部において復号処理機能ブロック206が選択され、符号器101の非音声モードに対応した復号器の動作モードとなる。このモードにおいて、復号器201は復号アルゴリズムに基づいて復号処理を実行し非音声信号を復号する。このとき、符号化・復号処理はいずれも非音声モードで実行されているので、復号された非音声信号は音声モードで実行されるよりも一層歪の少ないものとなっている。
【0036】以上のように、本実施の形態に依れば、音声信号伝送時には音声の符号化により適した通常の音声符号化・復号アルゴリズムを用いた方法で、また、非音声信号、特にDTMF信号等の伝送時においては、一部の処理機能ブロックを非音声信号の符号化により適した方法に切替えて符号化・復号処理を実行するので、非音声信号伝送時に伝送速度を上げる事無く、高品質の非音声信号を伝送する事が出来る。
【0037】また、本実施の形態においては、符号化・復号処理の一部に変更を加えるものであり、アルゴリズムの本質に関わるような切替を行うものではないため、例えば、音声信号入力中に、音声/非音声信号識別器102で「非音声」と誤識別した場合でも、多少の劣化はあるものの、ある程度の音声伝送品質は維持できるので、通話中に耳触りとなるような弊害は抑えられるといった利点もある。
【0038】実施の形態2.以下に、本発明に係る実施の形態2について、図2、図3を参照しながら説明する。本実施の形態は実施の形態1のモード切替に関し、符号化処理機能ブロック105、106の一つの動作例について詳細に述べたものである。ここで、説明を判り易くするために、符号化アルゴリズムの一例としてCS-ACELP方式(ITU-T勧告G.729準拠)を用いる事とする。CS-ACELP方式に基づく符号器の詳細なブロック図は上記に示した図2020に、復号器の詳細なブロック図は同じく図21に示した通りである。なお、図1と同一符号を記した構成要素は、上記実施の形態1の項で説明したものと同一の機能を持つ構成要素であるため説明の重複を省く。
【0039】本実施の形態においては、送信側(符号器側)に非音声信号、例えばDTMF信号によって学習されたLSP量子化符号帳2(310A)を別途用意する。即ち、図2に示すように、音声入力に最適化された符号化処理機能ブロック105には、音声により学習されたLSP量子化符号帳1(310)が対応し、非音声信号に最適化された符号化処理機能ブロック106にはLSP量子化符号帳2(310A)が対応する。音声/非音声信号識別器102が「音声」と判定したときは、切替スイッチ103を端子103Aに、同104を端子104Aにそれぞれ倒し、LSP量子化符号帳1(310)に基づくLSPのベクトル量子化を実行する。一方、音声/非音声信号識別器102が「非音声」と判定したときは、切替スイッチ103を端子103Bに、同104を端子104Bにそれぞれ倒し、LSP量子化符号帳2(310A)に基づくLSPのベクトル量子化を実行する。
【0040】受信側(復号器側)においても同様に、図3に示すように、LSP量子化符号帳1(406)に加えて、LSP量子化符号帳2(310A)と全く同一のLSP量子化符号帳2(406A)を用意する。即ち、音声入力に最適化された復号処理機能ブロック205には、LSP量子化符号帳1(406)が対応し、非音声信号に最適化された復号処理機能ブロック206にはLSP量子化符号帳2(406A)が、それぞれ対応する。多重分離部202において、取り出された音声/非音声信号識別器102の判定結果が、「音声」であれば、切替スイッチ203を端子203A側に、同204を端子204A側にそれぞれ倒し、LSP量子化符号帳1(406)から、送信されたインデックスに対応するLSPベクトルを抽出する。一方、多重分離部202で取り出された音声/非音声信号識別器102の判定結果が、「非音声」であれば、切替スイッチ203を端子203B側に、同204を端子204B側にそれぞれ倒し、LSP量子化符号帳2(406A)から、送信されたインデックスに対応するLSPベクトルを抽出する。
【0041】以上のように、本実施の形態に依れば、音声信号が入力された場合は、音声によって学習された符号帳を用いてLSPが量子化され、また、DTMF信号が入力された場合は、DTMF信号によって学習された符号帳を用いてLSPが量子化されるようにしているので、音声信号伝送時には、より音声信号に適した符号化を、DTMF信号伝送時には、よりDTMF信号に適した符号化を行う事が出来る。この手段により、DTMF信号のスペクトル包絡情報を精度良く、かつ効率的に量子化する事が出来るため、DTMF信号伝送時の量子化歪をより低減する事ができる。
【0042】実施の形態3.以下に、本発明に係る実施の形態3について図4〜図8を参照しながら説明する。本実施の形態は実施の形態1のモード切替に関し、符号化処理機能ブロック105、106の一つの動作例について詳細に述べたものである。ここで、説明を判り易くするために、符号化アルゴリズムの一例としてCS-ACELP方式(ITU-T勧告G.729準拠)を用いる事とする。なお、図1と同一符号を記した構成要素は、上記実施の形態1の項で説明したものと同一の機能を持つ構成要素であるため説明の重複を省く。
【0043】本実施の形態は、通常のDTMF信号伝送時において、スペクトル包絡の微妙な揺らぎが発生しない事に着目したものである。符号器の動作について図4を用いて説明する。図4はCS-ACELP方式に基づく本発明の符号器の処理機能ブロックの一部を示したものである。本実施の形態においては、量子化方式の異なるLSP量子化部を2種類持っている。即ち、LSP量子化部1(309)は、例えば、図22に示されたような、音声信号の入力に対して特化された符号帳探索方式を実現する。一方、LSP量子化部2(309A)は、非音声信号の入力に対して特化された符号帳探索方式を実現する。即ち、音声信号に最適化された符号化処理機能ブロック105には、LSP量子化部1(309)が対応し、非音声信号に最適化された符号化処理機能ブロック106にはLSP量子化部2(309A)が対応する。音声/非音声信号識別器102が「音声」と判定したときは、切替スイッチ103を端子103Aに、同104を端子104Aにそれぞれ倒し、LSP量子化部1(309)の量子化方式に基づくLSP量子化を実行する。一方、音声/非音声信号識別器102が「非音声」と判定したときは、切替スイッチ103を端子103Bに、同104を端子104Bにそれぞれ倒し、LSP量子化部2(309A)の量子化方式に基づくLSP量子化を実行する。
【0044】受信側においても同様に、図5に示すように、LSP逆量子化部1(407)に加えて、LSP量子化部2(309A)に対応したLSP逆量子化部2(407A)を用意する。即ち、音声入力に最適化された復号処理機能ブロック205には、LSP逆量子化部1(407)が、非音声信号に最適化された復号処理機能ブロック206にはLSP逆量子化部2(407A)がそれぞれ対応する。多重分離部202において取り出された音声/非音声信号識別器102の判定結果が「音声」であれば切替スイッチ203を端子203A側に、同204を端子204A側にそれぞれ倒しLSP逆量子化部1(407)に基づく方法でLSPを抽出する。LSP逆量子化部1(407)は、例えば、図23に示されたようなLSP量子化部1(309)に対応した逆量子化を実現する。一方、多重分離部202で取り出された音声/非音声信号識別器102の判定結果が「非音声」であれば切替スイッチ203を端子203B側に、同204を端子204B側にそれぞれ倒し、LSP逆量子化部2(407A)に基づく方法でLSPを抽出する。
【0045】LSP量子化部2(309A)の一例として、例えば図6に示すような手段を用いる。これはLSP量子化部1(309)の、第2段LSP量子化符号帳336からの信号入力を無効にしたものである。DTMF信号のような非音声信号については、スペクトル包絡はあらかじめ判っているため、第1段LSP量子化において、入力が想定される非音声信号のスペクトル包絡を少ない量子化歪で表現出来るベクトルを、第1段LSP量子化符号帳335にあらかじめ埋め込んでおく。これにより、第1段量子化で精度良く量子化が可能となる。また、DTMF信号入力時には、包絡情報が微妙に変動する事は通常ありえない。既に、第1段の量子化である程度の精度は確保されているので第2段の微調整は不要であり、逆に周波数歪の原因ともなる事が考えられるため無効にしておく。
【0046】また、送信側において図6に示すような方式を用いた場合、LSP逆量子化部2(407A)の一例として、例えば図7に示すような方式を用いる。これもまた、LSP逆量子化部1(407)の、第2段LSP量子化符号帳336からの信号入力を無効にしたものである。
【0047】以上のように、本発明の実施の形態3に依れば、DTMF信号伝送時において、第1のLSP量子化手段でDTMF信号のスペクトル包絡情報を精度良く量子化し、また、DTMF信号伝送時にはスペクトル包絡情報の揺らぎが少ない事に着目して、第2のLSP量子化手段を省略するようにしているので、上記符号化・復号装置におけるDTMF伝送歪を低減する事が出来る。
【0048】或いは、図8に示すように、実施の形態2で説明した、DTMF信号で学習されたLSP量子化符号帳2(310A)を別途用意し、音声/非音声信号識別器102の判定結果に応じて使用する符号帳を切替えるという手段を併用しても、上記実施の形態と同様の効果を得る事が出来る。
【0049】実施の形態4.上記の実施の形態2及び3では、DTMF信号伝送時において、量子化歪に起因する周波数歪を低減するように工夫したものであるが、次に、DTMF信号の立上り、立ち下がり時に起きるスペクトル包絡情報の急激な変化に追随できるようにするための実施の形態を示す。図9は、この実施の形態4におけるLSP量子化部の内部の構成を示すブロック構成図である。なお、図9において、図4と同一符号を記した構成要素は、上記実施の形態3の項で説明したものと同一の機能を持つ構成要素であるため説明の重複を省く。
【0050】次に、符号器の動作を説明する。本実施の形態において、図4に示したLSP量子化に関わるブロック群の動作は、実施の形態3によるものと全く同一である。実施の形態3と異なるのはLSP量子化部2(309A)の内部のみである。図9によれば、LSP量子化部2(309A)は移動平均予測の機能を外した構成となっている。LSPの量子化には、第1段LSP符号帳のみを用いる。これにより、音声/非音声信号識別器102で入力信号がDTMF信号を識別したら、LSPの移動平均予測処理を停止させるのと同じ効果が得られる。
【0051】一方、復号器201でも、符号器101との対応を取るため、図7に示すLSP逆量子化部2(407A)から、移動平均予測の機能を外した単純な構成とする事で、LSPの復号を実現する事が出来る。
【0052】或いは、図10に示すように、実施の形態2で説明したように、第1段LSP量子化符号帳2(335A)を別途用意する手段を併用する事も出来る。このとき、移動平均の過去のLSPに対する重み付けを軽くするように構成された移動平均予測係数符号帳2(337A)をLSP量子化符号帳2(310A)に盛り込む事で、移動平均予測効果の軽減を実現する事が出来る。
【0053】この時、復号器201でも、符号器101との対応を取るため、図11に示すような構成とする事で、LSPの復号を実現する事が出来る。
【0054】以上のように、本発明の実施の形態4に依れば、DTMF信号伝送時に、LSP量子化における移動平均予測の効果を無くす、または効果を低減するような構成としたのでDTMF信号の立上り、立ち下がり時において、復号されるべきDTMF信号波形の特性を改善する事が出来る。
【0055】実施の形態5.次に、DTMF信号を構成するデュアルトーンの周波数近傍の情報をより正確に符号化する事に着目した実施の形態を示す。図12はこの実施の形態5におけるLSP量子化部2(309A)の内部の構成を示すブロック構成図である。なお、図12において、図6と同一符号を記した構成要素は、上記実施の形態3の項で説明したものと同一の機能を持つ構成要素であるため説明の重複を省く。
【0056】次に、符号器の動作を説明する。本実施の形態において、図12に示したLSP量子化部2(309A)の動作は、実施の形態3によるものと量子化誤差重み付け係数計算部2(338A)の内部動作が異なるが、その他の動作は実施の形態3と同一である。
【0057】量子化誤差計算に用いる重み付け係数は、CS-ACELP方式に依れば、以下の式に示される方法で計算されている。
【0058】
【数1】


【0059】ここで、ωiはi次LSPである。即ち、スペクトルのピークがくる周波数域については重み付け係数を重くし、スペクトルの”谷”になっている周波数域については重み付け係数が軽くなっている。これは、スペクトルのピークを示す周波数域については量子化誤差の寄与分を重くして、誤差に対する感度を鋭くする効果がある。
【0060】ここで、DTMF信号のもつデュアルトーンのスペクトル情報は、1次から6次付近の低次のLSPに集中している事が知られている。量子化誤差重み付け係数計算部2(338A)は、量子化誤差重み付け係数計算部(338)からこの事を利用して改良が加えられたものである。即ち、10次のLSP係数のベクトル量子化において、ベクトル距離算出時に、1次〜6次付近の低次のLSPの誤差については重み付けをさらに重くし(即ち、わずかの誤差にも鋭敏に感応するよう係数感度を高める)、高次のLSPについては重み付けを軽くする(即ち、ある程度の誤差は許容するよう係数感度を低く抑える)構成としてある。これは、例えば、上記式におけるw1〜w6において、1以上の係数を乗じる事によって簡単に実現する事が出来る。
【0061】以上のように、本発明の実施の形態5に依れば、LSP量子化を、DTMF信号を構成するデュアルトーン周波数付近について、より精度を高める事が出来るので、LSPの量子化誤差を低減でき、よって、復号されたDTMF信号の周波数歪を小さくする事ができる。
【0062】実施の形態6.以下に、本発明に係る実施の形態6について、図13を参照しながら説明する。本実施の形態は、実施の形態1の音声/非音声信号識別器102の出力である信号識別情報の多重化、即ち、多重化部107及び多重分離部202に関する。
【0063】次に、動作について説明する。図13は、あるパラメータをターゲットとして量子化するための量子化器の構成の一つの例を示すブロック図である。量子化値の候補となる信号を量子化符号帳340に予め蓄積しておく。量子化の対象となるターゲット信号が入力されたら量子化符号帳の各候補について、ターゲット信号との誤差を最小自乗誤差計算部342で計算する。このように、最小の自乗誤差を与える符号帳の候補を探索し、探し出された候補に付けられたインデックスを引き出し最適符号として量子化器から出力する。
【0064】ここで、本実施の形態においては、最適符号の探索時にある特定の制約条件を用いる。その一例として、音声信号伝送時には、図13の量子化符号帳において白く示した部分(インデックス0000〜1010)のみを探索する。また、DTMF信号伝送時においては、同じく斜線で示した部分(インデックス1011〜1111)のみを探索する。このような制限を設ける事により、受信側の多重分離部において、当該パラメータの量子化値を調べる事によって、音声/非音声信号識別器102の判定結果を知る事が出来、識別パターンが多重化されたのと同等の効果を呈する事が出来る。
【0065】以上のように、本実施の形態6に依れば、識別のためのビットを設ける必要が無いため、伝送速度を増やさずに音声/非音声識別器の判定結果を受信側に送る事が出来る。
【0066】実施の形態7.上記実施の形態6では、音声信号伝送時とDTMF信号伝送時とで異なる量子化符号を用いる事により、音声/非音声信号識別器102の判定結果情報を埋め込む事を可能としたものであるが、次に、ある量子化テーブルの1つを音声/非音声識別パターンとして用いる場合の実例を、図14、15を用いて詳しく説明する。なお、図1〜図13と同一符号を記した構成要素は、上記実施の形態1〜6の項で説明したものと同一の機能を持つ構成要素であるため説明の重複を省く。
【0067】本実施の形態においては、例えば、上記実施の形態3の手段とを併用する事で、より効率の良い音声/非音声信号伝送を実現する事が出来る。ここで、図1414は、音声信号伝送時に用いられるLSP量子化部1(309)、及びLSP量子化符号帳1(310)の内部構造を示すブロック図、図15は、同じくDTMF信号伝送時に用いられるLSP量子化部2(309A)、及びLSP量子化符号帳2(310A)の内部構造を示すブロック図である。実施の形態6における量子化符号帳には、本実施の形態において、第2段LSP量子化符号帳336を対応させる。DTMF信号伝送時に割当てられている量子化の候補は、第2段LSP量子化符号帳336において斜線で示されているただ1つの候補のみである。残りの候補は音声信号伝送時に割当てられ上記候補はこのモードにおいて禁止符号となる。DTMF信号伝送時に割当てられている候補は1つしかないので、そのインデックスはそのままDTMF伝送モードである事を識別するパターンとして取り扱う事が出来る。
【0068】ここで、DTMF信号伝送時に割当てられている第2段LSP符号は1つしか割当てられていないが、図1515に示すように、第1段LSP量子化符号帳2(335A)でDTMF信号のスペクトル包絡情報を十分に表現出来る構成としているので、第2段LSP量子化を実行する必要が無く、従って第2段LSP量子化の情報を送る必要は元々無い。よって、特性の劣化等の問題は発生しない。
【0069】以上説明した符号器の動作の結果、多重化部107が構成する符号器から出力されるフレームフォーマットは図16の通りとなる。DTMF信号伝送モードにおいては、第2段LSP量子化で禁止符号としたインデックスをDTMF信号伝送識別パターンとして送っている事に特徴がある。受信側の多重分離部202においては、第2段LSPを常に監視し、この識別パターンと一致したらDTMF信号伝送モードと解釈して復号器201を制御する。
【0070】以上のように、本実施の形態7に依れば、音声伝送時に選択できなくなる禁止符号(量子化ステップ)を僅か1つに抑えたため、音声伝送時の品質をほとんど劣化させずに、音声/非音声信号識別器102の判定結果を伝送する信号列に埋め込む事が出来るという利点がある。また、DTMF信号伝送時においては、DTMF信号を符号化伝送するために特化されたアルゴリズムとなっており、識別パターンとなる選択禁止符号を送信するための十分なビット数が確保されているためDTMF信号の劣化も無いという優れた利点がある。
【0071】実施の形態8以上の実施の形態7では、分割する量子化符号帳にLSP量子化符号帳を用いた場合について述べたが、次に、図2020における利得量子化部316及び利得量子化符号帳317を用いた場合の実例を、図17及び図18を用いて詳しく説明する。
【0072】本実施の形態8は、DTMF信号伝送時において、DTMF信号の立上り、立ち下がり時を除けば利得の変動が極めて少ない事に着目した手段である。識別情報の多重化手段として、利得量子化ベクトル符号帳の一つを禁止し、そのインデックスを識別パターンに用いる点の他は実施の形態7の場合と同一である。音声信号伝送時において、サブフレーム(5msec)毎に行っている利得の量子化を、利得変動の少ないDTMF信号伝送時においては、フレーム毎(10msec)に間引いて冗長度を減らす代わりに識別パターンを埋め込む事を特徴とする。
【0073】利得量子化部316で実行される、利得量子化のタイムスケジュールを図18に示す。音声信号伝送モードにおいては、1フレームに2回(即ちサブフレーム毎に)利得の量子化を実行する。第1サブフレームでは通常の符号帳探索を行う。第2サブフレームの利得符号帳探索において、実施の形態6で示した量子化方法を用いる。即ち、音声信号伝送時においては唯一の禁止ベクトルを除いて全探索を行い、最適ベクトルのインデックスを利得量子化部316から出力する。
【0074】DTMF信号伝送時においては、利得の量子化は1フレームに1回しか実行しない。これは、例えば、全フレームを対象とした利得の量子化を行う事で、実現する事が出来る。符号帳探索においては、上記音声信号伝送モードにおける第1サブフレーム時と同様、全探索を実行する。そして、1サブフレーム分の利得量子化情報の代わりに、識別情報として音声入力時に探索禁止としたベクトルのインデックスを利得量子化部316から出力する。
【0075】以上説明した符号器の動作の結果、多重化部107が構成する符号器から出力されるフレームフォーマットは図17の通りとなる。DTMF信号伝送モードにおいては、音声信号伝送モードにおいて第1サブフレーム利得量子化情報を送っていた部分に、全フレームに対する利得量子化符号を挿入してある。また、第2サブフレームにおいて利得符号の量子化において禁止符号としたインデックスを、DTMF信号伝送識別パターンとして送っている事に特徴がある。受信側の多重分離部202においては、第2フレーム利得符号を監視しこの識別パターンと一致したら、DTMF信号伝送モードと解釈して復号器201を制御する。
【0076】また、復号器201において、音声伝送モードにおいては、送られてきた利得符号を基に逆量子化を行いサブフレーム毎に利得値を更新して復号処理を行う。一方、DTMF信号伝送モード時には、1フレームに1つの利得符号しか送られてこないため利得の更新もフレーム単位となる。
【0077】以上のように、本実施の形態8に依れば、音声伝送時に選択できなくなる禁止符号(量子化ステップ)を僅か1つに抑えたため、音声伝送時の品質をほとんど劣化させずに、音声/非音声信号識別器102の判定結果を伝送する信号列に埋め込む事が出来るという利点がある。また、DTMF信号伝送時においては、DTMF信号を符号化伝送するために特化されたアルゴリズムとなっており、識別パターンとなる選択禁止符号を送信するための十分なビット数が確保されているため、DTMF信号の劣化をなくする事が出来る。
【0078】実施の形態9.以下に、本発明に係る実施の形態9について、図19を参照しながら説明する。本実施の形態は、音声/非音声信号識別器102の1つの動作例について詳細に述べたものである。なお、図1と同一符号を記した構成要素は、上記実施の形態1の項で説明したものと同一の機能を持つ構成要素であるため説明の重複を省く。
【0079】次に、動作について、図19を用いて説明する。実施の形態1において、DTMF信号の識別手段を数例提示したが、大きく分けて(1)周波数成分、(2)利得成分の2点に特徴があるという事が言える。ここで、例えば符号化方式にCS-ACELP方式(図20,図21)を用いた音声符号化・復号装置においては、入力された音声信号を分析して効率よく符号化するため、線形予測法に基づく音声信号の周波数分析を実行する符号化処理機能ブロックであるLP分析部302を有している。ここで計算されるパラメータ(例えば反射係数等)から、DTMF信号の特徴を示す情報を引き出す事が出来る。音声/非音声信号識別器102は、この機能を備えており、音声/非音声信号識別器102自身が周波数分析を実行する手段を持たない。なお、音声/非音声信号識別器102の詳細については、特開平9-326772に詳細に述べられているので、ここでの説明は省く。
【0080】以上のように、本実施の形態9に依れば、符号化処理で必須のパラメータを流用して、音声/非音声信号の識別に用いている構成となっているため、信号識別のために必要なパラメータを簡単に得る事が出来る。従って、信号識別のための処理負荷が軽くできる。簡便な処理で実現できるため装置構成が簡単に出来る事が期待でき、装置実現のためのコストを低減できるといった利点がある。
【0081】
【発明の効果】以上のように、本発明に依れば、音声信号伝送時には音声の符号化により適した、通常の音声符号化・復号アルゴリズムを用いた方法で、また、非音声信号、特にDTMF信号等の伝送時においては、一部の処理機能ブロックを、非音声信号の符号化により適した方法に切替えて、符号化・復号処理を実行するので、非音声信号伝送時に、伝送速度を上げる事無く、高品質の非音声信号を伝送する事が出来る。
【0082】また、本発明においては、符号化・復号処理の一部に変更を加えるものであり、アルゴリズムの本質に関わるような切替を行うものではないため、例えば、音声信号入力中に、音声/非音声信号識別器102で「非音声」と誤識別した場合でも、多少の劣化はあるものの、ある程度の音声伝送品質は維持できるので、通話中に耳触りとなるような弊害は抑えられる、といった利点もある。
【0083】また、簡便な方法で構成された、識別性能の良くない音声/非音声信号識別器を適用しても、ある程度の音声品質の維持が可能である事から、装置構成を簡単に出来、実現のためのコストが低減できるなどの優れた効果がある。
【図面の簡単な説明】
【図1】 実施の形態1である音声符号化・復号装置のブロック構成図である。
【図2】 実施の形態2である音声符号器内のLSP量子化に関わる部分のブロック構成図である。
【図3】 実施の形態2である音声復号器内のLSP逆量子化に関わる部分のブロック構成図である。
【図4】 実施の形態3である音声符号器内のLSP量子化に関わる部分のブロック構成図である。
【図5】 実施の形態3である音声復号器内のLSP逆量子化に関わる部分のブロック構成図である。
【図6】 実施の形態3である音声符号器内の第2のLSP量子化部、及びLSP量子化符号帳の詳細構成図である。
【図7】 実施の形態3である音声復号器内の第2のLSP逆量子化部、及びLSP量子化符号帳の詳細構成図である。
【図8】 実施の形態3である音声符号器内のLSP量子化に関わる部分のブロック構成図である。
【図9】 実施の形態4である音声符号器内の第2のLSP量子化部、及びLSP量子化符号帳の詳細構成図である。
【図10】 実施の形態4である音声符号器内の第2のLSP量子化部、及びLSP量子化符号帳の詳細構成図である。
【図11】 実施の形態4である音声復号器内の第2のLSP逆量子化部、及びLSP量子化符号帳の詳細構成図である。
【図12】 実施の形態5である音声符号器内の第2のLSP量子化部、及びLSP量子化符号帳の詳細構成図である。
【図13】 実施の形態6である音声符号器内の量子化符号帳の構成例の一つを示す図である。
【図14】 実施の形態7である音声符号器内の第1のLSP量子化部、及び第1のLSP量子化符号帳の詳細構成図である。
【図15】 実施の形態7である音声符号器内の第2のLSP量子化部、及び第2のLSP量子化符号帳の詳細構成図である。
【図16】 実施の形態7である音声符号化・復号装置の信号伝送時のフレームフォーマットを示す図である。
【図17】 実施の形態8である音声符号化・復号装置の信号伝送時のフレームフォーマットを示す図である。
【図18】 実施の形態8である音声符号化・復号装置の利得量子化処理ブロックのタイムスケジュールを記した表である。
【図19】 実施の形態9に係る音声符号化・復号装置のブロック構成図である。
【図20】CS-ACELP方式に基づく符号器の内部構成を示すブロック図である。
【図21】CS-ACELP方式に基づく復号器の内部構成を示すブロック図である。
【図22】CS-ACELP方式における符号器の、LSP量子化部、及びLSP量子化符号帳の内部詳細構成を示すブロック図である。
【図23】CS-ACELP方式における復号器の、LSP逆量子化部、及びLSP量子化符号帳の内部詳細構成を示すブロック図である。
【図24】従来の音声符号化・復号装置の構成を示すブロック図である。
【図25】 従来の音声符号化・復号装置の構成を示すブロック図である。
【符号の説明】
101:符号器、 102:音声/非音声信号識別器、 103、104:切替スイッチ、105、106:符号化処理機能ブロック、 107:多重化部、 201:復号器、202:多重分離部、 203、204:切替スイッチ、205、206:復号処理機能ブロック、 301:符号化前処理部、302:LP分析部、 303:線形予測計算部、 304:聴覚重み付けフィルタ、305:LP-LSP変換部、 306:開ループピッチ探索部、307:非量子化LSP-LP変換部、 308:移動平均予測成分計算部、309、309A:LSP量子化部、 310、310A:LSP量子化符号帳、311:量子化LSP-LP変換部、 312:LP逆フィルタ、 313:ピッチ成分計算部、314:励振信号(周期成分)量子化部(閉ループピッチ探索部)、315、322:インパルス応答計算部、 316:利得量子化部、317:利得量子化符号帳、 318:符号帳探索用ターゲット信号計算部、319:パルス予備選択部、 320:ピッチプレフィルタ、321:励振信号(雑音成分)量子化部(固定符号帳探索部)、323:利得の移動平均予測部、 324:符号計算部、325:ピッチポストフィルタ、 326、331、332、333:加算器、327:量子化された励振信号計算部、 330:利得乗算器、334:最小自乗誤差計算部、 335、335A:第1段LSP量子化符号帳、336:第2段LSP量子化符号帳、 337、337A:移動平均予測係数符号帳、338:量子化誤差重み付け係数計算部、 340:一般的な量子化符号帳、341:加算器、 342:最小自乗誤差計算部、 401:ピッチラグ復号部、402:利得量子化符号帳、 403:利得逆量子化部、 404:利得の移動平均予測部、405:励振信号(雑音成分)逆量子化部、 406、406A:LSP量子化符号帳、407、407A:LSP逆量子化部、 408:ピッチポストフィルタ、409:LSP内挿部、 410:LSP-LP変換部、 411:励振信号計算部、412:合成フィルタ、 413:ポストフィルタ、 414:後処理部。

【特許請求の範囲】
【請求項1】 入力される信号が音声信号か、非音声信号かを識別し、判定結果を出力する、音声/非音声識別器と、音声の符号化に適した周波数パラメータに基づき入力信号を符号化し、音声符号化信号を出力する第1の機能ブロックと、上記第1の機能ブロックと同じ符号化方式で、上記周波数パラメータとは異なる非音声の符号化に適した周波数パラメータに基づき入力信号を逐次符号化し、非音声符号化信号を出力する第2の機能ブロックとを有し、入力信号を圧縮符号化する符号器と、上記音声/非音声識別器の判定結果に応じて、入力信号の上記符号器への供給を第1の機能ブロック、または第2の機能ブロックのいずれかを選択する切替手段と、上記符号器の出力と、上記音声/非音声識別器の判定結果とを多重化し、伝送路に出力する多重化部とを備え、上記第1の機能ブロックは、音声の符号化に適したLSP(LineSpectrumPair:線スペクトル対)量子化部、上記第2の機能ブロックは、非音声の符号化に適したLSP量子化部であり、上記第2の機能ブロックを構成するLSP量子化部は、LSPの移動平均予測処理を停止するか、または移動平均予測の効果を軽減する機能を持つことを特徴とする音声符号化装置。

【請求項2】
入力される信号が音声信号か、非音声信号かを識別し、判定結果を出力する、音声/非音声識別器と、音声の符号化に適した周波数パラメータに基づき入力信号を符号化し、音声符号化信号を出力する第1の機能ブロックと、上記第1の機能ブロックと同じ符号化方式で、上記周波数パラメータとは異なる非音声の符号化に適した周波数パラメータに基づき入力信号を逐次符号化し、非音声符号化信号を出力する第2の機能ブロックとを有し、入力信号を圧縮符号化する符号器と、上記音声/非音声識別器の判定結果に応じて、入力信号の上記符号器への供給を第1の機能ブロック、または第2の機能ブロックのいずれかを選択する切替手段と、上記符号器の出力と、上記音声/非音声識別器の判定結果とを多重化し、伝送路に出力する多重化部とを備え、上記第1の機能ブロックは、音声の符号化に適したLSP量子化部、上記第2の機能ブロックは、非音声の符号化に適したLSP量子化部であり、上記第1及び第2の機能ブロックは、量子化誤差計算に用いる重み付け係数が異なり、ある特定の周波数領域において、上記第2の機能ブロックの重み付け係数を上記第1の機能ブロックの重み付け係数より大きくすることを特徴とする音声符号化装置。

【請求項3】
請求項1又は2の何れか一の音声符号化装置で符号化され、伝送された多重化データ列から、符号化信号と、音声/非音声識別信号とに分離する多重分離部と、上記符号化信号を元の信号に復号する復号器とを備え、上記復号器は、伝送された音声符号化信号を符号化した符号器に対応する第3の機能ブロックと、同じく伝送された非音声符号信号を符号化した符号器に対応する第4の機能ブロックとを有し、上記多重データ分離部で分離された、上記音声/非音声識別器の判定結果に応じて、上記第3の機能ブロック、または第4の機能ブロックのいずれかを選択する切替手段を有する事を特徴とする音声復号装置。

【図6】
image rotate


【図2】
image rotate


【図1】
image rotate


【図7】
image rotate


【図9】
image rotate


【図18】
image rotate


【図3】
image rotate


【図24】
image rotate


【図4】
image rotate


【図5】
image rotate


【図8】
image rotate


【図10】
image rotate


【図11】
image rotate


【図12】
image rotate


【図13】
image rotate


【図15】
image rotate


【図19】
image rotate


【図14】
image rotate


【図16】
image rotate


【図17】
image rotate


【図22】
image rotate


【図23】
image rotate


【図20】
image rotate


【図21】
image rotate


【図25】
image rotate


【特許番号】特許第3475772号(P3475772)
【登録日】平成15年9月26日(2003.9.26)
【発行日】平成15年12月8日(2003.12.8)
【国際特許分類】
【出願番号】特願平10−65418
【出願日】平成10年3月16日(1998.3.16)
【公開番号】特開平11−259099
【公開日】平成11年9月24日(1999.9.24)
【審査請求日】平成13年3月8日(2001.3.8)
【出願人】(000006013)三菱電機株式会社 (33,312)
【参考文献】
【文献】特開 平9−81199(JP,A)
【文献】特開 平7−131514(JP,A)
【文献】特開 平10−51874(JP,A)
【文献】特開 平5−265496(JP,A)