音声符号化伝送システム

【発明の詳細な説明】
【０００１】
【発明の属する技術分野】本発明は、音声信号を高能率に圧縮伝送する音声符号化伝送システムに関し、特に音声品質を向上させることのできる音声符号化伝送システムに関する。
【０００２】
【従来の技術】従来より、音声信号の冗長成分を除いて高能率に符号化する高能率音声符号化技術を用いた音声信号のディジタル伝送技術が、企業内通信や国際通信などの通信コストの低減が強く望まれる分野で盛んに用いられている。高能率音声符号化方式としては、ITU(International Telecommunications Union)勧告G.726 ADPCM(Adaptive Differential Pulse Code Modulation：適応差分パルス符号変調)符号化方式に代表されるような予測差分符号化方式や、ITU勧告G.728 LD-CELP(Low-Delay Code Excited Linear Prediction：低遅延型符号励振線形予測)符号化方式（図２１参照）、およびITU勧告G.729CS-ACELP(Conjugate-Structure Algebraic-Code-Excited Linear Prediction：共役構造代数的符号励振線形予測)符号化方式に代表されるような「合成による分析(Analysis-by-Synthesis）」に基づく符号化方式などがある。
【０００３】なお、これら符号化方式の詳細については、以下の文献を参照されたい。
・CCITT Recommendation G.726, ■40,32,24,16kbit/s adaptive differentialpulse code modulation (ADPCM)■・ITU-T Recommendation G.728, ■Coding of speech at 16kbit/s using Low-Delay Code Excited Linear Prediction(LD-CELP)■・ITU-T Recommendation G.729, ■Coding of speech at 8kbit/s using conjugate-structure algebraic-code-excited linear prediction■
【０００４】ここで、予測差分符号化方式は、過去の信号系列から現在の信号を予測し、その予測パラメータと実際の信号との差分信号を量子化して伝送する方式である。また、「合成による分析」に基づく符号化方式は、過去、及び現在の音声信号に基づいて分析して得られたパラメータを用いて、候補として複数パターンの信号の合成を行い、その中から最も入力音声に近似した信号パターンを選択した上で、選択された合成信号の基となったパラメータを、最適パラメータとして量子化し、伝送する方式である。
【０００５】これらのいずれの方式も、送信側に設けられた符号器と、受信側に設けられた復号器とで実現されている。そして、現在の入力音声信号成分に基づく所謂フォワード適応によって得られる符号器のパラメータについては、復号器でその情報を得る手段がない。このため、符号器と復号器とが同一のパラメータを保持するためには、符号器から復号器に情報を送信する必要がある。一方、過去の音声信号に基づく所謂バックワード適応によって得られるパラメータについては、符号器および復号器の両者が共通のパラメータ算出手段を持つことにより、符号器および復号器を正常に動作させることができる。
【０００６】即ち、予測差分符号化方式では、過去の信号系列を符号器および復号器の内部状態として共有することにより、これに基づいた音声の符号化および復号動作が実現される。また、「合成による分析」に基づく符号化方式では、バックワード適応によって得られた送受信で同一のパラメータの集合を符号器、復号器の内部状態として共有することにより、これらのパラメータに基づいた音声の符号化および復号化が実現される。従って、復号器においては、符号器と全く同じ内部状態を保ちながら音声の復号処理を実行することが前提となる。逆に、何らかの原因で送信側と受信側とで過去の音声信号が異なれば、内部状態も一致しなくなり、復号部で再生される音声の正確さが保証されないおそれがある。
【０００７】一方で、通信網においては、電話に代表される音声以外に、画像やコンピュータデータの伝送といった、マルチメディア伝送への要求が高まっている。このような複数のサービスをネットワーク上で総合的に扱えるように、非同期転送モード(ATM:Asynchronous Transfer Mode)と呼ばれる通信方式が近年、盛んに導入されつつある。ATM伝送網においては、伝送される情報信号（音声・画像等）をディジタル符号化し、得られたビット列をセルと呼ばれる固定長ブロックに分割し、非同期的に通信路に送出する。これにより、伝送速度の異なる情報信号を多元的に取り扱うことが可能になる。
【０００８】最近では、上述のような一層の高能率化への要求から、ATM網の非同期性・可変速度性といった特長を生かした無音圧縮技術（音声信号の無音部分を廃棄して伝送する方式）が併用されるようになりつつある。この無音圧縮技術は、有音区間の音声品質を損なうことなく、伝送路に送出される音声信号の総量を低減することができ、統計多重効果により、一層高能率な音声伝送を可能とする。
【０００９】しかし、この無音圧縮音声伝送システムでは、無音時に伝送される音声情報が皆無であるため、高能率符号化された音声信号である音声符号を受信して復号する復号器の動作は無音時に不定となる。従って、上記で述べたバックワード適応が正常に機能しなくなり、無音状態（トークスパートが“無し”の状態と呼ぶことがある）から有音状態（トークスパートが“有り”の状態と呼ぶことがある）に遷移するときに、音声符号を生成する符号器の内部状態と、音声符号を復号する復号器の内部状態とが一致しなくなる。そのため、復号部では、たとえ伝送路誤りのない正しい高能率符号が与えられたとしても、正しく音声信号を復号できるとは限らない。この現象は、しばしば受信端の再生音における不快な異音、例えばクリック音、発振音等、として表れる。
【００１０】図２２は、これを解決するための第１の音声符号化伝送システムの構成を示すブロック図である。この図は、特開平２−１８１５５２号公報に示された構成図に基づいている。この音声伝送システムは、送信端６０と受信端７０とで一対の構成をなす。トークスパート有りの状態、即ち有音区間においては、送信端６０は音声信号を高能率音声符号器６０１で符号化して、切替スイッチ６０４を経由して、伝送路Ａに音声符号を送出する。送信端６０の切替スイッチ６０４はトークスパート無し、即ち無音区間においては伝送路Ａに対して何も送出しないように切り換えられるので、送信端６０からは無音圧縮された音声符号が送出されることになる。音声検出器６０３は音声信号の有音／無音を検出して、切替スイッチ６０４の切替えを行う。
【００１１】一方、受信端７０では伝送路Ａからの音声符号を復号器７０２で音声信号に復号して出力する。無音圧縮されている間、切替スイッチ７０５は擬似背景雑音生成部７０６側に切り替えられており、受信端７０からは、話者の背景雑音を模した擬似的な信号（以下、擬似背景雑音信号という）が出力される。有／無音情報抽出部７０７は音声符号に基づいて有音／無音を検出して、切替スイッチ７０５の切替えを行う。
【００１２】このシステムでは送信端６０に符号器６０１の所定の内部状態を記憶したメモリ６３０を有し、受信端７０にはこれと同一の内容を格納したメモリ７３０を有している。そして、上述のような問題が発生する音声信号の無音区間から有音区間への遷移時においては、それを音声検出器６０３および有／無音情報抽出部７０７が同期して検出し、送信端６０においてはメモリ６３０から符号器６０１に符号化処理のための内部状態の初期値が設定され、受信端７０においてはメモリ７３０から復号器７０２に復号処理のための内部状態の初期値が設定される。
【００１３】このように、送信端６０及び受信端７０とでトークスパートが検出されるタイミングは同期しており、その時点で両者の内部状態は同一の状態にリセットされる。そのため、符号器６０１と復号器７０２との内部状態は音声の有音区間においては常に一致し、トークスパート先頭における異音の発生を回避することができる。
【００１４】このような技術を用いることによって、高能率符号化を用いた無音圧縮伝送を実現することができる。しかし、現在、これまでに構築された無音圧縮を行わない伝送網が既に存在する。これらの伝送網は多くの場合、多額な費用を投じてインフラストラクチャーとして構築されたものであり、それを直ちに無音圧縮伝送網に置き換えたり、改良したりすることは経済的に困難である。よって、これら従来の伝送網がカバーする範囲も包括した大きな網を構築したい場合には、当面は無音圧縮を行わない網をそのままの状態で、無音圧縮を行う網に併存させなければならない。
【００１５】即ち、無音圧縮を行わない網と無音圧縮を行う網との併存は、これら２種類の網を中継ノードで接続することにより実現される。その方法として、図２３及び図２４に示す２つの方法がある。これらの図は、無音圧縮を行う網から無音圧縮を行わない網への伝送を説明するものである。
【００１６】図２３は、２種類の網を中継ノードを介してタンデム接続する伝送システムの構成図である。この図において、図２２と同一の機能を有する構成要素には同一の符号を付し、その説明を省略する。このシステムの送信端６０が有する符号器６０１は無音圧縮を行った上で、音声符号を伝送路Ａに送出する。
【００１７】中継ノード８０では、伝送路Ａから送信端６０の音声符号（有音部のみ）を受信し、これを復号器８０２で音声信号に復号する。送信端６０の信号は無音圧縮されているため、復号される音声信号は有音部のみとなる。この音声信号の無音区間に擬似背景雑音信号を挿入し、改めて符号器８０１で符号化して受信端７０に伝送する。
【００１８】ここで、送信端６０と中継ノード８０との間の音声信号の処理は、例えば、図２２にて説明した同期リセットを用いた無音圧縮伝送方式で行われる。このように、中継ノード８０で一旦復号し、再度符号化を行うため、音声符号化処理の立場から見ると、相互に独立した２つの伝送路Ａ，Ｂが直列に接続された所謂タンデム接続と称する形態となる。
【００１９】一方、図２４は、２種類の網を中継ノードを介してディジタル１リンクにより接続する伝送システムの構成図である。この図において、図２３と同一の機能を有する構成要素には同一の符号を付し、その説明を省略する。
【００２０】送信端６０から伝送路Ａに送出された、無音圧縮された音声符号は、中継ノード８０により無音符号が補充され、伝送路Ｂを介して受信端７０に伝送される。送信端６０に入力された音声信号は、符号器６０１にて高能率符号化される。音声検出器６０３は、この音声信号を基に有音／無音（トークスパートの有無）を検出し、切替スイッチ６０４を制御する。切替スイッチ６０４は、トークスパート有りの場合のみ、符号器６０１からの音声符号を伝送路Ａに伝送する。トークスパート無しの場合には音声符号は廃棄され、伝送路Ａには何も出力されない。これにより伝送路Ａには無音圧縮された音声符号が送出される。
【００２１】中継ノード８０は、送信端６０から伝送路Ａを介して伝送された無音圧縮された音声符号を受信する。有／無音情報抽出部８０７は、伝送路Ａからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ８０４を制御する。即ち、伝送路Ａから音声符号が入力された場合は、切替スイッチ８０４を８０４ｂ側に倒して、受信した音声符号をそのまま伝送路Ｂにリレーする。
【００２２】一方、伝送路Ａからの信号の受信が検知されなかった場合（即ち無音部と判定された区間）、有／無音情報抽出部８０７が切替スイッチ８０４を擬似背景雑音生成部８０６側に切り替えて、無音区間の信号を擬似背景雑音信号で補充する。なお、遅延器２０９は、有／無音情報抽出部８０７における処理時間だけ伝送路Ａからの音声符号を遅延させ、切替スイッチ８０４を音声符号の入力に同期して動作させるものである。
【００２３】受信端７０では、復号器７０２が伝送路Ｂからの音声符号を復号し、音声信号を取り出す。無音区間の信号は、中継ノード８０で擬似信号が挿入されるため、見掛け上、受信端７０には連続した音声信号が入力しているように見える。
【００２４】このように中継ノード８０は、音声の有無によって単にスイッチングのみを実行しているに過ぎない。このため、受信端７０に伝送される音声符号は、無音区間こそ中継ノードで補間処理がなされているものの、主要な情報となる有音区間については送信端６０から送出されたものに他ならない。そして、伝送路Ａ，Ｂ間を通過する信号は、ディジタル信号のまま加工されずに相手方の網にリレーされることから、この網間伝送方式をディジタル１リンクと一般的に称している。
【００２５】
【発明が解決しようとする課題】しかしながら、上述したタンデム接続及びディジタル１リンクによる伝送路Ａ，Ｂの接続には、以下に述べる問題点がある。即ち、タンデム接続は、送信端６０で無音圧縮された音声符号を、中継ノード８０で音声信号に復号した後に雑音信号を挿入し、その後、再度符号化して伝送路Ｂに送出する。このため、中継ノード８０の符号器８０１の内部状態と、受信端７０の復号器７０２の内部状態とは常に一致し、上述した異音の発生は防止される。
【００２６】しかし、中継ノード８０では、音声符号に対して、復号化した後に再度符号化するという処理を行うため、送信端に入力された音声信号は受信端から出力されるまでに２回の符号化／復号化処理を受けることになる。そのため量子化誤差が蓄積し、受信端７０から出力される音声信号の品質が劣化するという問題があった。この音声品質の劣化は、高いビットレート（l6kbit/s以上）では、ほとんど気にならない程度であるが、圧縮率が高くなればなるほどその劣化傾向は顕著になる。特に、音声伝送システムは低ビットレートであるため、この音声品質の劣化は無視することができない。
【００２７】一方、ディジタル１リンクによる接続では、全く事情は逆である。この場合には受信端７０に伝送される有音部における音声符号は、送信端６０において生成された音声符号と同一であるため、量子化誤差の蓄積による音声信号の品質劣化は防止される。しかし、送信端６０の符号器６０１の内部状態と、受信端７０の復号器７０２の内部状態とでは、無音状態から有音状態に遷移するタイミングで一般に不一致となる。
【００２８】即ち、音声符号自体は同じであるのに、その符号化／復号化処理において内部状態が異なるため、復号器７０２で復号される音声信号は符号器６０１で意図した信号とは異なるものとなり、上述した異音が発生し得るという問題がある。この異音の発生は、受信者に不快感を与えるのみならず、通常、トークスパートの先頭で発生するため、通話内容の理解度を著しく低下させるという問題があった。
【００２９】以上の問題により、従来は、無音圧縮を行わない既存の伝送網側の音声通信システムに改良を加えることなく、この伝送網に無音圧縮伝送網を接続することは困難であった。
【００３０】本発明は、このような問題を解決し、無音圧縮を行わない既存の伝送網に無音圧縮を行った伝送網を接続した音声符号化伝送システムにおいて、高品質な音声伝送を可能とする音声符号化伝送システムを提供することを目的とする。
【００３１】
【課題を解決するための手段】請求項１の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第１の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第１の音声符号を復号化する中継側復号化手段と、背景雑音を模した第２の擬似信号を生成する中継側背景雑音生成手段と、中継側復号化手段で復号化された音声信号の無音区間に第２の擬似信号を挿入する中継側背景雑音挿入手段と、中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された音声符号を第１の音声符号の無音区間に挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【００３２】請求項２の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第１の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第１の音声符号を復号化する中継側復号化手段と、背景雑音を模した第２の擬似信号を生成する中継側背景雑音生成手段と、第２の擬似信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された擬似符号を第１の音声符号の無音区間に挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備え、中継側符号化手段は、中継側復号化手段の内部パラメータを入力して、この内部パラメータを用いて中継側復号化手段と同等の内部状態を保持していることを特徴とする。
【００３３】請求項３の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第１の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音送信手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第２の擬似信号を生成する中継側背景雑音生成手段と、第１の音声符号を復号化すると共に、第２の擬似信号を符号化する補間信号生成手段と、補間信号生成手段で符号化された擬似符号を第１の音声符号の無音区間に挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備え、補間信号生成手段は、復号化処理と符号化処理とで共通した内部状態を保持していることを特徴とする。
【００３４】請求項４の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第１の擬似符号を生成する送信側背景雑音生成手段と、第１の擬似符号を復号化する送信側復号化手段と、送信側復号化手段で復号化された擬似信号を原音声信号の無音区間に挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第２の擬似符号を生成する中継側背景雑音生成手段と、第１の音声符号の無音区間に第２の擬似符号を挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備え、送信側復号化手段は、送信側符号化手段で符号化された音声符号を入力して、有音区間についてはこの音声符号を復号化すると共に、無音区間については第２の擬似符号を復号化していることを特徴とする。
【００３５】請求項５の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第１の擬似符号を生成する送信側背景雑音生成手段と、第１の擬似符号を復号化する送信側復号化手段と、原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第２の擬似符号を生成する中継側背景雑音生成手段と、第１の音声符号の無音区間に第２の擬似符号を挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備え、送信側符号化手段は、送信側復号化手段の内部パラメータを入力して、この内部パラメータを用いて送信側復号化手段と同等の内部状態を保持していることを特徴とする。
【００３６】請求項６の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、第１の擬似信号に基づく内部状態を保持しつつ原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第２の擬似符号を生成する中継側背景雑音生成手段と、第１の音声符号の無音区間に第２の擬似符号を挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【００３７】請求項７の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第１の音声符号を復号化して音声信号を生成する中継側復号化手段と、背景雑音を模した擬似信号を生成する中継側背景雑音生成手段と、中継側復号化手段で生成された音声信号の無音区間に擬似信号を挿入する中継側背景雑音挿入手段と、中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された音声符号を、第１の音声符号の無音区間および無音から有音に切り替わった直後の遷移区間に挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【００３８】請求項８において、中継ノードは、遷移区間をカウントするタイマを更に備え、中継側音声符号生成手段では、タイマのカウント値に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【００３９】請求項９において、中継ノードは、中継側復号化手段の内部状態と中継側符号化手段の内部状態とを比較する比較手段を更に備え、中継側音声符号生成手段では、比較手段の比較結果に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【００４０】請求項１０において、中継ノードは、遷移区間をカウントするタイマと、中継側復号化手段の内部状態と中継側符号化手段の内部状態とを比較する比較手段と、タイマのカウント値および比較手段の比較結果に基づいて遷移区間の終了タイミングを判定する判定手段とを更に備え、中継側音声符号生成手段では、判定手段の判定結果に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【００４１】請求項１１において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、無音区間の背景雑音を模したディジタル信号を疑似音声として生成していることを特徴とする。
【００４２】請求項１２において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする。
【００４３】請求項１３において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、ランダム信号発生器であることを特徴とする。
【００４４】請求項１４において、原音声信号の無音区間の開始を示す同期信号を送信端から中継ノードに伝送させる同期信号伝送手段を更に備え、中継ノードは、同期信号を受信して、送信側背景雑音生成手段と中継側背景雑音生成手段とを同期させていることを特徴とする。
【００４５】請求項１５において、送信端は、原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、中継ノードは、識別パターンを認識して、送信側背景雑音生成手段と中継側背景雑音生成手段とを同期させていることを特徴とする。
【００４６】請求項１６の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、第１の伝送路から受信した第１の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、第２の伝送路から受信した第２の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、擬似背景雑音発生用の第１のパラメータ信号を生成する送信側パラメータ生成手段と、第１のパラメータ信号に基づく内部状態を保持しつつ原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第１の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、擬似背景雑音発生用の第２のパラメータ信号を生成する中継側パラメータ生成手段と、第２のパラメータ信号に基づいて擬似符号を生成する中継側符号化手段と、第１の音声符号の無音区間に擬似符号を挿入して、第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【００４７】請求項１７において、送信側パラメータ生成手段及び中継側パラメータ生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする。
【００４８】請求項１８において、送信側パラメータ生成手段及び中継側パラメータ発生手段は、ランダム符号発生器であることを特徴とする。
【００４９】請求項１９において、送信端は、原音声信号の無音区間の開始を示す同期信号を送出する同期信号送出手段を更に備え、中継ノードは、同期信号を受信して、送信側パラメータ生成手段及び中継側パラメータ発生手段とを同期させていることを特徴とする。
【００５０】請求項２０において、送信端は、原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、中継ノードは、識別パターンを認識して、送信側パラメータ生成手段及び中継側パラメータ発生手段とを同期させていることを特徴とする。
【００５１】
【発明の実施の形態】以下、本発明に係る音声符号化伝送システムの好適な実施形態について添付図面を参照して説明する。
【００５２】実施の形態１．図１は、実施の形態１に係る音声符号化伝送システムの構成を示すブロック図である。図１において、１０は原音声信号の有音区間を符号化すると共に無音圧縮して生成された第１の音声符号を伝送路Ａ（第１の伝送路）に出力する送信端、２０は伝送路Ａから受信した第１の音声符号に基づいて、原音声信号の無音区間に対応する音声符号を補間して生成された第２の音声符号を伝送路Ｂ（第２の伝送路）に出力する中継ノード、３０は伝送路Ｂから受信した第２の音声符号を復号処理して原音声信号を再生する受信端である。
【００５３】また、１０１は入力された音声信号を所定のアルゴリズムに基づいて高能率符号化する符号器（送信側符号化手段）、１０３は送信端１の動作モードを制御するための制御信号１Ａを出力する音声検出器、１０４は符号器１０１で符号化された音声符号を圧縮して、第１の音声符号を生成する切替スイッチ（送信側音声符号生成手段）、１０５は原音声信号の無音区間に背景雑音信号（第１の擬似信号）を挿入する切替スイッチ（送信側背景雑音挿入手段）、１０６はこの背景雑音信号を擬似的に発生させる擬似背景雑音生成部（送信側背景雑音生成手段）である。
【００５４】さらに、２０１は入力された音声信号を所定のアルゴリズムに基づいて高能率符号化する符号器（中継側符号化手段）、２０２は送信端１０から送られた第１の音声符号を復号化する復号器（中継側復号化手段）、２０４は復号器２０２で復号化された音声信号の無音区間に背景雑音信号（第２の擬似信号）を挿入する切替スイッチ（中継側背景雑音挿入手段）、２０６はこの背景雑音信号を擬似的に発生させる擬似背景雑音生成部（中継側背景雑音生成手段）である。
【００５５】さらにまた、２０７は伝送路Ａからの音声符号の受信状況を常に監視し、その結果に応じて制御信号を出力する有／無音情報抽出部、２０９は遅延器、２１４は符号器２０１で符号化された音声符号を第１の音声符号の無音区間に挿入して、第２の音声符号を生成する切替スイッチ（中継側音声符号生成手段）、２０５は符号器２０１で符号化された音声符号を用いて、第１の音声符号の無音区間を補間する切替スイッチ、３０２は第２の音声符号を復号化する復号器である。
【００５６】なお、擬似背景雑音生成部１０６，２０６は、無音区間の背景雑音を模したディジタル信号を擬似音声として生成していることが望ましい。
【００５７】次に、この音声伝送システムの動作について説明する。送信端１０は原音声信号を高能率に符号化した音声符号を生成する。この音声符号は、音声検出器１０３の判定結果により、有音区間では伝送路Ａに送出され、無音区間では伝送路Ａに送出されない。このように、送信端１０ではいわゆる無音圧縮が行われており、伝送路Ａは無音圧縮された音声符号の伝送路である。一方、受信端３０が接続された伝送路Ｂは、無音圧縮されていない音声符号が伝送される伝送路である。そして、中継ノード２０はこれら２つの伝送路を接続して、送信端１０からの音声符号を伝送路Ａから受け取り、無音区間の擬似音声符号を挿入して伝送路Ｂに出力する。受信端３０はこの音声符号を復号して音声信号を出力する。
【００５８】送信端１０において、音声検出器１０３は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端１０の動作モードを制御するための制御信号１Ａを出力する。音声検出器１０３で「有音」と判定された場合には、切替スイッチ１０５を１０５Ｂ側に、切替スイッチ１０４を１０４Ｂ側に倒す。これにより、送信端１０に入力された原音声信号は符号器１０１に入力され、高能率符号化された後、切替スイッチ１０４を経由して伝送路Ａに出力される。
【００５９】一方、音声検出器１０３で「無音」と判定された場合は、切替スイッチ１０５を１０５Ａ側に、切替スイッチ１０４を１０４Ａ側に倒す。これにより、擬似背景雑音生成部１０６から出力された擬似背景雑音信号が符号器１０１に入力される。但し、符号器１０１の出力である擬似背景雑音信号が符号化された信号は、切替スイッチ１０４によって遮断されるため、伝送路Ａには何も出力されない。
【００６０】ここで、擬似背景雑音生成部１０６について説明する。音声検出器１０３の判定が「有音」から「無音」に遷移するタイミングで、音声検出器１０３は、擬似背景雑音生成部１０６の初期化を制御するための初期化信号１Ｂを出力する。擬似背景雑音生成部１０６にはこの初期化信号１Ｂが入力され、擬似背景雑音生成部１０６は初期化信号１Ｂの入力タイミングで内部状態をリセットする。この動作は、以下に述べる中継ノード２０における擬似背景雑音生成部２０６と同期した動作を実現するために必須である。
【００６１】中継ノード２０では、送信端１０から無音圧縮されて送出され、伝送路Ａを介して伝送された第１の音声符号を受信する。有／無音情報抽出部２０７は、伝送路Ａからの第１の音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ２０４，２０５，２１４を制御するための制御信号２Ａを出力する。即ち、伝送路Ａから音声符号が入力された場合は、有音区間と判定して、切替スイッチ２０４を２０４Ｂ側に、切替スイッチ２０５を２０５Ｂ側に、切替スイッチ２１４を２１４Ｂ側にそれぞれ倒す。
【００６２】中継ノード２０で受信した第１の音声符号は、遅延器２０９及びスイッチ２１４を経由してそのまま伝送路Ｂにリレーされる。また第１の音声符号は、スイッチ２０５を経由して復号器２０２にも与えられる。復号器２０２は入力された第１の音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ２０４を経由して符号器２０１に供給される。符号器２０１は入力された音声信号に基づいて符号化処理を実行する。
【００６３】ここで、送信端１０の符号器１０１と、中継ノード２０の符号器２０１とでは、入力される信号にそれぞれ原音声信号と、復号器２０２で復号された復号音声信号という違いはあるものの、音声の性質は極めて近似したものである。従って、音声信号の性質を数値化したものに相当する送信端１０の符号器１０１の内部状態と、中継ノード２０の符号器２０１の内部状態とは、極めて近似したものとなる。
【００６４】一方、有／無音情報抽出部２０７において、伝送路Ａからの信号の受信が検知されなかったとき、即ち「無音」と判定された区間においては、切替スイッチ２０４を２０４Ａ側に、切替スイッチ２０５を２０５Ａ側に、切替スイッチ２１４を２１４Ａ側に、それぞれ倒す。
【００６５】擬似背景雑音生成部２０６の出力信号は、スイッチ２０４を経由して符号器２０１に入力される。符号器２０１は入力された擬似背景雑音信号に基づいて符号化処理を実行し、擬似背景雑音符号を出力する。符号器２０１から出力された擬似背景雑音符号は、スイッチ２１４を経由して伝送路Ｂに送出される。
【００６６】この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。ここで、遅延器２０９は有／無音情報抽出部２０７における処理および符号器２０１における処理に掛かる時間だけ、伝送路Ａから受信して伝送路Ｂに送出される音声符号を遅延させている。この遅延動作によって、遅延器２０９から出力される有声区間の音声符号と、符号器２０１から出力される擬似背景雑音符号との同期が実現される。
【００６７】また、有／無音情報抽出部２０７の判定が「有音」から「無音」に遷移するタイミングで、有／無音情報抽出部２０７は、擬似背景雑音生成部２０６の初期化を制御するための初期化信号２Ｂを出力する。擬似背景雑音生成部２０６にはこの初期化信号２Ｂが入力され、擬似背景雑音生成部２０６は初期化信号２Ｂの入力タイミングで内部状態をリセットする。
【００６８】なお、擬似背景雑音生成部２０６は、送信端１０の擬似背景雑音生成部１０６と同一の動作を実現するものであり、上述した初期化動作についても、送信端１０の擬似背景雑音生成部１０６と同一である。初期化動作は伝送路Ａからの音声信号入力の有無、ひいては送信端１０の音声検出器１０３の判定信号に同期して行われるため、送信端１０の符号器１０１と中継ノード２０の符号器２０１とは、同じタイミングで同一の擬似背景雑音信号が供給されることになる。
【００６９】さらに、有音区間において、送信端１０の符号器１０１の内部状態と中継ノード２０の符号器２０１の内部状態とはほぼ一致しているため、無音区間においてこれらの符号器１０１，２０１から出力される擬似背景雑音符号も極めて近似した値を取ることができる。
【００７０】また、符号器２０１から出力された擬似背景雑音符号は、切替スイッチ２０５を経由して復号器２０２にも供給される。復号器２０２は入力された擬似背景雑音符号を基に復号処理を実行する。この動作により、送信端１０の符号器１０１の内部状態と、中継ノード２０の復号器２０２の内部状態とは常に同一に保持される。このため、再び「有音」と判定され、復号器２０２に伝送路Ａからの音声符号が入力されても、内部状態が送受で一致しているため、音声の復号を正常に実現することができる。
【００７１】受信端３０では、中継ノード２０から伝送路Ｂを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第２の音声符号を受信する。復号器３０２は入力された第２の音声符号を基に復号処理を行い、音声信号に復号して受信端３０から出力する。
【００７２】ここで、受信端３０に入力される第２の音声符号は、有音区間では送信端１０の符号器１０１の出力であるため、有音区間においては、送信端１０の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態とは一致する。また無音区間において受信端３０に入力される第２の音声符号は、中継ノード２０の符号器２０１の出力であるため、中継ノード２０の符号器２０１の内部状態と、受信端３０の復号器３０２の内部状態とは一致する。上述したように、無音区間においても送信端１０の符号器１０１の内部状態と、中継ノード２０の符号器２０１の内部状態とを一致させているため、受信端３０からの見掛け上、あたかも送信端１０から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【００７３】以上述べた通り、送信端１０の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態との一致が常に図られているため、内部状態の不整合に起因して耳障りな音声が復号されるおそれは回避される。
【００７４】実施の形態２．次に、実施の形態２について、図２を参照しながら説明する。本実施の形態は、実施の形態１の音声符号化伝送システムにおける中継ノード２０に改良を加えて中継ノード２１としたものである。なお、実施の形態１と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【００７５】中継ノード２１は、送信端１０から無音圧縮されて送出され、伝送路Ａを介して伝送された第１の音声符号を受信する。有／無音情報抽出部２０７は、伝送路Ａからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ２１４を制御する制御信号２Ａを出力する。
【００７６】即ち、伝送路Ａから音声符号が入力された場合は、有音区間と判定して、切替スイッチ２１４を２１４Ｂ側に倒す。中継ノード２１で受信した第１の音声符号は、スイッチ２１４を経由してそのまま伝送路Ｂにリレーされる。また第１の音声符号は、同時に復号器２０２にも供給される。復号器２０２は入力された第１の音声符号に基づき復号処理を実行する。
【００７７】ここで、送信端１０の符号器１０１と、中継ノード２１の復号器２０２とでは、有音部については共に同一の音声符号に基づいた適応処理がなされるため、送信端符号器１０１の内部状態と、中継符号器２０１の内部状態とは、一致した値に保たれている。
【００７８】次に、有／無音情報抽出部２０７の判定が「有音」から「無音」に遷移するタイミングで、有／無音情報抽出部２０７は、擬似背景雑音生成部２０６の初期化を制御する初期化信号２Ｂを出力する。擬似背景雑音生成部２０６は、この初期化信号２Ｂを受信したタイミングで内部状態をリセットし、擬似背景雑音信号の送出を開始する。
【００７９】なお、擬似背景雑音生成部２０６は、送信端１０の擬似背景雑音生成部１０６と同一の動作を実現するものであり、上記初期化動作についても、送信端１０の擬似背景雑音生成部１０６と同一である。初期化動作は伝送路Ａからの音声信号入力の有無、ひいては送信端１０の音声検出器１０３の判定信号に同期して行われるため、送信端１０の符号器１０１、及び中継ノード２１の符号器２０１へは、同じタイミングで同一の擬似背景雑音信号を供給することができる。
【００８０】同時に、初期化信号２Ｂは符号器２０１及び復号器２０２にも供給される。初期化信号２Ｂを受信した復号器２０２は、内部パラメータを符号器２０１に送出し、動作を停止する。符号器２０１は、初期化信号２Ｂにより復号器２０２から内部パラメータを受取り、これに基づいて、擬似背景雑音生成部２０６から供給される擬似背景雑音信号の符号化処理を開始する。
【００８１】ここで、有音区間において、送信端１０の符号器１０１と中継ノード２１の復号器２０２とで一致させた内部状態が、中継ノード２１の符号器２０１にそのまま継承されているため、互いに直接情報のやり取りがないにも係わらず、無音区間において、送信端１０の符号器１０１と中継ノード２１の符号器２０１との両者から出力される擬似背景雑音符号は一致する。
【００８２】有／無音情報抽出部２０７において、伝送路Ａからの信号が「無音」と判定された区間においては、切替スイッチ２１４を２１４Ａ側に倒す。擬似背景雑音生成部２０６の出力信号を受けて、符号器２０１から出力された擬似背景雑音符号は、スイッチ２１４を経由して伝送路Ａへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。
【００８３】最後に、有／無音情報抽出部２０７の判定が「無音」から「有音」に遷移するタイミングで、有／無音情報抽出部２０７から、制御信号２Ｃを出力する。制御信号２Ｃを受信した符号器２０１は、内部パラメータを復号器２０２へ送出し、動作を停止する。復号器２０２は、制御信号２Ｃにより符号器２０１から内部パラメータを受け取り、これに基づいて、伝送路Ａから受信した第１の音声符号の復号処理を開始する。これらの一連の動作により、無音区間で送信端１０の符号器１０１と中継ノード２１の復号器２０２との間で情報のやり取りがなかったにも係わらず、内部状態は同一に保たれているため、復号処理を正常に再開することができる。
【００８４】受信端３０では、中継ノード２１から伝送路Ｂを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第２の音声符号を受信する。復号器３０２は入力された第２の音声符号を基に復号処理を行い、音声信号に復号して受信端３０から出力する。
【００８５】ここで、受信端３０に入力される第２の音声符号は、有音区間では送信端１０の符号器１０１の出力であるため、有音区間においては、送信端１０の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態とは一致する。また無音区間において受信端３０に入力される第２の音声符号は中継ノード２１の符号器２０１の出力であるため、中継ノード２１の符号器２０１の内部状態と、受信端３０の復号器３０２の内部状態とは一致する。
【００８６】上記で説明したように、無音区間においても送信端１０の符号器１０１の内部状態と、中継ノード２１の符号器２０１の内部状態とを一致させているため、受信端３０からの見掛け上、あたかも送信端１０から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【００８７】以上述べた通り、送信端１０の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード２１において符号器２０１が動作するのは無音区間のみであり、復号器２０２が動作するのは有音区間のみであるため、これらが同時に処理を実行することはなく、プロセッサの負荷削減によるコストの低減および消費電力の低減が実現される。
【００８８】実施の形態３．次に、実施の形態３について、図３，４を参照しながら説明する。本実施の形態は、実施の形態１の音声符号化伝送システムにおいて、その中継ノード２０に改良を加えて中継ノード２２としたものである。ここで、２０８は送信端１０から送られた第１の音声符号を符号化すると共に背景雑音信号（第２の擬似信号）を符号化する補間信号発生器（補間信号生成手段）である。なお、実施の形態１と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【００８９】中継ノード２２は、送信端１０から無音圧縮されて送出され、伝送路Ａを介して伝送された第１の音声符号を受信する。有／無音情報抽出部２０７は、伝送路Ａからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ２１４を制御する制御信号２Ａを出力する。また、有／無音情報抽出部２０７の判定が「有音」から「無音」に遷移するタイミングで、有／無音情報抽出部２０７から、擬似背景雑音生成部２０６の初期化を制御する初期化信号２Ｂを出力する。
【００９０】擬似背景雑音生成部２０６は、この初期化信号２Ｂを受信したタイミングで内部状態をリセットし、擬似背景雑音信号の送出を開始する。なお、擬似背景雑音生成部２０６は、送信端１０の擬似背景雑音生成部１０６と同一の動作を実現するものであり、上記初期化動作についても、送信端１０の擬似背景雑音生成部１０６と同一である。初期化動作は伝送路Ａからの音声信号入力の有無、ひいては送信端音声検出器１０３の判定信号に同期して行われるため、送信端１０の符号器１０１、及び補間信号発生器２０８には、同じタイミングで同一の擬似背景雑音信号が供給される。ここまでの動作は、実施の形態１とほぼ同一である。
【００９１】次に、補間信号発生器２０８の具体的な構成について、図４を参照しながら説明する。同図に示す補間信号発生器２０８は、高能率音声符号化方式にITU勧告G.728を適用したものである。図４と図２１とを比較して判る通り、これはITU勧告G.728に基づく符号器に切替スイッチ４２１，４２２，４２３が追加されたものである。
【００９２】ITU勧告G.728 LD-CELP方式や、同G.729 CS-ACELP方式に代表される「合成による分析」に基づく音声符号化方式においては、最適な音声符号の選択のために、想定される音声符号の候補全てに対して復号処理を行い、これらを入力された音声信号と逐一比較すると共に、入力音声信号に最も近似した合成信号を選択し、その合成信号の基となった音声符号を最適符号として復号器に伝送する。この方式の符号器は、この復号処理を実現するために、通常ローカルデコーダと呼ばれる復号器に相当する機能を備えている。そして、図４に示す機能ブロック４２０は、ローカルデコーダに相当する部分である。
【００９３】有／無音情報抽出部２０７において、伝送路Ａからの信号が「有音」と判定された区間においては、制御信号２Ａにより、切替スイッチ４２１を４２１Ｂ側に、切替スイッチ４２２を４２２Ｂ側に、切替スイッチ４２３を４２３Ｂ側に、それぞれ倒す。この時、ローカルデコーダ部４２０は伝送路Ａからの信号を入力として、通常の復号動作を行う。
【００９４】この動作の目的は、バックワード型利得適応部４１０およびバックワード型合成フィルタ適応部４１１を動作させて、利得乗算器４０４および合成フィルタ４０５の内部状態を、送信端符号器１０１の内部状態と常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。
【００９５】ここで、合成フィルタ４０５の出力経路、即ち復号された音声信号の出力経路はスイッチ４２３で遮断されているため、このローカルデコーダ４２０の出力は、他の機能ブロックから参照されることはない。また、補間信号発生器２０８において、ローカルデコーダ４２０以外の機能ブロック、即ちＰＣＭ伸長部４０１、ベクトルバッファ部４０２、加算器４０６、聴覚重み付けフィルタ４０７および最小自乗誤差探索部４０８は、入力すべき信号がないため停止状態を保持する。
【００９６】有／無音情報抽出部２０７において、伝送路Ａからの信号が無音区間と判定された区間においては、制御信号２Ａにより、切替スイッチ４２１を４２１Ａ側に、切替スイッチ４２２を４２２Ａ側に、切替スイッチ４２３を４２３Ａ側に、それぞれ倒す。この時の補間信号発生器２０８の構造は、符号器の構造と全く同一となる。その動作も、符号器のそれと全く同一である。即ち、疑似背景雑音発生部２０６から出力される疑似背景雑音信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、補間信号発生器２０８から出力する。
【００９７】ここで、有音区間において利得乗算器４０４および合成フィルタ４０５の内部状態は、送信端符号器１０１の内部状態と一致させており、また、無音区間においても疑似背景雑音生成部２０６から入力される信号は、送信端１０の疑似背景雑音生成部１０６と全く同一であるため、補間信号発生器２０８から出力される疑似背景雑音符号は、送信端符号器１０１から出力される（但し切替スイッチ１０４により伝送路Ａには出力されない）疑似背景雑音符号と全く同一となる。これら一連の動作により、無音区間において送信端符号器１０１と、補間信号発生器２０８とは、直接信号のやり取りがなかったにも係わらず、内部状態の一致は常に保たれている。
【００９８】受信端３０では、中継ノード２２から伝送路Ｂを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第２の音声符号を受信する。復号器３０２は入力された第２の音声符号を基に復号処理を行い、音声信号に復号して受信端３０から出力する。
【００９９】ここで、受信端３０に入力される第２の音声符号は、有音区間では送信端１０の符号器１０１の出力であるため、有音区間においては、送信端１０の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態とは一致する。また無音区間において、受信端３０に入力される第２の音声符号は補間信号発生器２０８の出力であるため、補間信号発生器２０８の内部状態と、受信端復号器３０２の内部状態とは一致する。
【０１００】上記で説明したように、無音区間においても送信端符号器１０１の内部状態と、補間信号発生器２０８の内部状態を一致させているため、受信端３０からの見掛け上、あたかも送信端１０から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【０１０１】以上述べた通り、送信端符号器１０１の内部状態と、受信端復号器３０２の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード２２において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【０１０２】実施の形態４．次に、実施の形態４について、図５を参照しながら説明する。本実施の形態において、実施の形態１の音声符号化伝送システムにおける送信端１０および中継ノード２０に改良を加えて、送信端１１および中継ノード２３としたものである。
【０１０３】ここで、１０２は符号器１０１で高能率符号化された音声符号を音声信号に復号する復号器（送信側復号化手段）、１１２は疑似背景雑音信号が高能率符号化方式で符号化された符号（第１の擬似信号）を発生させる擬似背景雑音生成部（送信側背景雑音生成手段）、１１４は復号器１０２への入力を切り替えるスイッチ、２１２は疑似背景雑音信号が高能率符号化方式で符号化された符号（第２の擬似符号）を発生させる擬似背景雑音生成部（中継側背景雑音生成手段）である。なお、実施の形態１と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１０４】この音声伝送システムは、上記実施の形態１に係る音声符号化伝送システムにおける中継ノード２０に実施した改良を、送信端１１に適用することによって、上記課題を解決した高品質な音声伝送を可能とする音声符号化伝送システムを構築しようとするものである。
【０１０５】次に、本実施の形態に係る音声符号化伝送システムの動作について説明する。送信端１１において、音声検出器１０３は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端１１の動作モードを制御する制御信号１Ａを出力する。音声検出器１０３で「有音」と判定された場合は、切替スイッチ１１４を１１４Ｂ側に、切替スイッチ１０５を１０５Ｂ側に、切替スイッチ１０４を１０４Ｂ側に、それぞれ倒す。これにより、送信端１１に入力された音声信号は、切替スイッチ１０５を経由して符号器１０１に入力され、高能率符号化された後、切替スイッチ１０４を経由して伝送路Ａに出力される。
【０１０６】また同時に、符号器１０１から出力された入力音声が高能率符号化された音声符号は、切替スイッチ１１４を経由して復号器１０２にも供給される。復号器１０２は、符号器１０１からの音声信号を入力として、通常の復号動作を行う。この動作の目的は、復号器１０２の内部状態を、送信端符号器１０１の内部状態と常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。そして、得られた復号音声信号が他の機能ブロックに出力されるのを阻止するように、切替スイッチ１１５が切り替えられる。
【０１０７】音声検出器１０３の判定が「有音」から「無音」に遷移するタイミングで、音声検出器１０３は、擬似背景雑音生成部１１２の初期化を制御する初期化信号１Ｂを出力する。擬似背景雑音生成部１１２は、この初期化信号１Ｂを受信したタイミングで内部状態をリセットする。この動作は、実施の形態１で説明したものと全く同一目的でなされるものである。
【０１０８】音声検出器１０３で「無音」と判定された場合は、切替スイッチ１１４を１４Ａ側に、切替スイッチ１０５を１０５Ａ側に、切替スイッチ１０４を１０４Ｂ側に、それぞれ倒す。これにより、擬似背景雑音生成部１１２から出力された擬似背景雑音符号は、切替スイッチ１１４を経由して復号器１０２に入力され、復号処理された後、得られた復号擬似背景雑音信号は切替スイッチ１０５を経由して、符号器１０１に出力される。符号器１０１は、復号器１０２で復号された擬似背景雑音信号を入力として、通常の符号化動作を行う。この動作の目的は、符号器１０１の内部状態を、復号器１０２の内部状態と常に一致した状態に保つためにあり、符号化された音声信号を得るためではない。そして、得られた音声符号が伝送路Ａに出力されるのを阻止するように、切替スイッチ１０４が切り替えられる。これら一連の動作により、符号器１０１の内部状態と、復号器１０２の内部状態は、常に一致した状態に保たれる。
【０１０９】ここで、符号器１０１と復号器１０２とでは、入力される信号にそれぞれ、原音声信号と、符号器１０１でいったん符号化された音声符号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する符号器１０１の内部状態と、復号器１０２の内部状態とは、極めて近似した値に保持される。
【０１１０】中継ノード２３は、送信端１１から伝送路Ａを介して伝送された無音圧縮された第１の音声符号を受信する。有／無音情報抽出部２０７は、伝送路Ａからの第１の音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ２１４を制御する制御信号２Ａを出力する。即ち、伝送路Ａから第１の音声符号が入力された場合は、有音区間と判定して、切替スイッチ２１４を２１４Ｂ側に倒す。中継ノード２３で受信した第１の音声符号は、スイッチ２１４を経由してそのまま伝送路Ｂにリレーされる。
【０１１１】一方、有／無音情報抽出部２０７において、伝送路Ａからの信号の受信が検知されなかったとき、即ち「無音」と判定された区間においては、制御信号２Ａによって、切替スイッチ２１４を２１４Ａ側に倒す。擬似背景雑音信号が符号化されたデータが補充され、伝送路Ｂに出力される。勿論、実施例１と同様に、有／無音情報抽出部２０７の判定が「有音」から「無音」に遷移するタイミングで、有／無音情報抽出部２０７から、擬似背景雑音生成部２１２の初期化を制御する初期化信号２Ｂを出力する。擬似背景雑音生成部２１２は、この初期化信号２Ｂを受信したタイミングで状態をリセットする。
【０１１２】受信端３０では、中継ノード２３から伝送路Ｂを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第２の音声符号を受信する。復号器３０２は入力された第２の音声符号を基に復号処理を行い、音声信号に復号して受信端３０から出力する。
【０１１３】ここで、受信端３０に入力される第２の音声符号は、有音区間では送信端１１の符号器１０１の出力であるため、有音区間においては、送信端１１の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態は一致する。また、無音区間において受信端３０に入力される第２の音声符号は中継ノード２３の擬似背景雑音生成部２１２の出力である。先に説明したように、中継ノード２３の擬似背景雑音生成部２１２の出力は、送信端１１の擬似背景雑音生成部１１２の出力と一致しているため、受信端３０からの見掛け上、あたかも送信端１１から無音圧縮されていない擬似背景雑音符号を直接受信しているかの如き効果を得ることができる。
【０１１４】しかも、「無音」から「有音」に遷移し復号器３０２に入力される第２の音声符号が符号器１０１の出力信号に切り替わっても、送信端１１の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態は極めてよく一致しているため、復号器３０２から出力される信号から、内部状態の相違による異音の発生を防止することができる。
【０１１５】以上述べた通り、送信端１１の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。また、中継ノード２３において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【０１１６】実施の形態５．次に、実施の形態５について、図６を参照しながら説明する。本実施の形態は、実施の形態４で示した送信端１１に対して、実施の形態２で示した中継ノード２１における改良を加えて送信端１２としたものである。なお、実施の形態４と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１１７】送信端１２において、音声検出器１０３は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端１２の動作モードを制御する制御信号１Ａを出力する。音声検出器１０３で「有音」と判定された場合は、切替スイッチ１０４を１０４Ｂ側に倒す。これにより、送信端１２に入力された音声信号は、符号器１０１に入力され、高能率符号化された後、切替スイッチ１０４を経由して伝送路Ａに出力される。
【０１１８】次に、音声検出器１０３の判定が「有音」から「無音」に遷移するタイミングで、音声検出器１０３は、擬似背景雑音生成部１１２の初期化を制御する初期化信号１Ｂを出力する。擬似背景雑音生成部１１２は、この初期化信号１Ｂを受信したタイミングで内部状態をリセットし、擬似背景雑音符号（第１の擬似符号）の送出を開始する。
【０１１９】なお、擬似背景雑音生成部１１２は、中継ノード２３の擬似背景雑音生成部２１２と同一の動作を実現するものであり、上記初期化動作についても、中継ノード２３の擬似背景雑音生成部２１２と同一である。初期化動作は伝送路Ａからの音声信号入力の有無、ひいては送信端１２の音声検出器１０３の判定信号に同期して行われるため、送信端１２の復号器１０２、及び中継ノード２３の切替スイッチ２１４へは、同じタイミングで同一の擬似背景雑音符号を供給することができる。
【０１２０】同時に、初期化信号１Ｂは符号器１０１及び復号器１０２にも供給される。初期化信号１Ｂを受信した符号器１０１は、内部パラメータを復号器１０２に送出し、動作を停止する。復号器１０２は、初期化信号２Ｂにより符号器１０１から内部パラメータを受取り、これに基づいて、擬似背景雑音生成部１１２から供給される擬似背景雑音符号の復号化処理を開始する。
【０１２１】最後に、音声検出器１０３の判定が「無音」から「有音」に遷移するタイミングで、音声検出器１０３から、制御信号１Ｃを出力する。制御信号１Ｃを受信した復号器１０２は、内部パラメータを符号器１０１へ送出し、動作を停止する。符号器１０１は、制御信号１Ｃにより復号器１０２から内部パラメータを受取り、これに基づいて、原音声信号の符号化処理を開始する。これらの一連の動作により、符号器１０１の内部状態と、復号器１０２の内部状態とは、常に一致した状態に保たれるため、符号化処理を正常に再開することができる。
【０１２２】中継ノード２３においては、実施の形態４で示した動作と同一の動作を行う。さらに、受信端３０では、中継ノード２３から伝送路Ｂを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第２の音声符号を受信する。復号器３０２は入力された第２の音声符号を基に復号処理を行い、音声信号に復号して受信端３０から出力する。
【０１２３】ここで、受信端３０に入力される第２の音声符号は、有音区間では送信端１２の符号器１０１の出力であるため、有音区間においては、送信端１２の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態とは一致する。また無音区間において受信端３０に入力される第２の音声符号は中継ノード２３の擬似背景雑音生成部２１２の出力である。先に説明したように、中継ノード２３の擬似背景雑音生成部２１２の出力は、送信端１２の擬似背景雑音生成部１１２の出力と一致しているため、受信端３０からの見掛け上、あたかも送信端１２から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【０１２４】以上述べた通り、送信端１２の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、送信端１２において符号器１０１が動作するのは無音区間のみであり、復号器１０２が動作するのは有音区間のみであるため、これらが同時に処理を実行することはなく、プロセッサの負荷削減によるコストの低減および消費電力の低減が実現される。また、中継ノード２３において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【０１２５】実施の形態６．次に、実施の形態６について、図７，８を参照しながら説明する。本実施の形態は、実施の形態４で示した送信端１１に対して、実施の形態３で示した中継ノード２２における改良を加えて送信端１３としたものである。ここで、１０８は実施の形態３における補間信号発生器２０８と同等の機能を有する内部状態保持機能付き符号器（送信側符号化手段）である。なお、実施の形態４と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１２６】まず、内部状態保持機能付き符号器１０８の動作を、図８を参照しながら説明する。これは、内部状態保持機能付き符号器１０８の具体的な構成を示すため、一例として高能率音声符号化方式にITU勧告G.728を適用したものである。図８と図４とを比較して判る通り、これは実施の形態３における補間信号発生器２０８の構造と何ら変わる点はない。このため、各機能ブロックの説明は省略する。
【０１２７】次に、図７を用いて、実施の形態６の音声伝送システムの動作について説明する。音声検出器１０３において、伝送路Ａからの信号が「有音」と判定された区間においては、制御信号１Ａにより、切替スイッチ４２１を４２１Ｂ側に、切替スイッチ４２２を４２２Ｂ側に、切替スイッチ４２３を４２３Ｂ側に、それぞれ倒す。この時の内部状態保持機能付き符号器１０８の構造および動作は、実施の形態１における符号器１０１の構造および動作と同一である。即ち、入力された原音声信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、内部状態保持機能付き符号器１０８から出力する。この出力信号が伝送路Ａに送出される。
【０１２８】音声検出器１０３において、伝送路Ａからの信号が「無音」と判定された区間においては、制御信号１Ａにより、切替スイッチ４２１を４２１Ａ側に、切替スイッチ４２２を４２２Ａ側に、切替スイッチ４２３を４２３Ａ側に、それぞれ倒す。ローカルデコーダ部４２０は擬似背景雑音生成部１１２からの信号を入力として、通常の復号動作を行う。この動作の目的は、バックワード型利得適応部４１０、及びバックワード型合成フィルタ適応部４１１を動作させて、利得乗算器４０４、合成フィルタ４０５の内部状態を、受信端復号器３０２の内部状態と、常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。
【０１２９】ここで、合成フィルタ４０５の出力、即ち復号された音声信号の出力経路はスイッチ４２３で遮断されているため、このローカルデコーダ４２０の出力は、他の機能ブロックから参照されることはない。また、内部状態保持機能付き符号器１０８において、ローカルデコーダ４２０以外の機能ブロック、即ちＰＣＭ伸長部４０１、ベクトルバッファ部４０２、加算器４０６、聴覚重み付けフィルタ４０７、最小自乗誤差探索部４０８は、入力すべき信号がないため停止させておく。
【０１３０】中継ノード２３においては、実施の形態４で示した動作と同一の動作を行う。さらに、受信端３０では、中継ノード２３から伝送路Ｂを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第２の音声符号を受信する。復号器３０２は入力された第２の音声符号を基に復号処理を行い、音声信号に復号して受信端３０から出力する。
【０１３１】ここで、受信端３０に入力される第２の音声符号は、有音区間では送信端１３の内部状態保持機能付き符号器１０８の出力であるため、有音区間においては、送信端１３の内部状態保持機能付き符号器１０８の内部状態と、受信端３０の復号器３０２の内部状態は一致する。また無音区間において受信端３０に入力される第２の音声符号は、中継ノード２３の擬似背景雑音生成部２１２の出力である。これは送信端１３の擬似背景雑音生成部１１２の出力と同一であるため、送信端１３の内部状態保持機能付き符号器１０８の内部状態と、受信端３０の復号器３０２の内部状態は一致する。以上のように、受信端３０からの見掛け上、あたかも送信端１３から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【０１３２】以上述べた通り、送信端１３の内部状態保持機能付き符号器１０８の内部状態と、受信端３０の復号器３０２の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード２３において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【０１３３】実施の形態７．次に、実施の形態７について、図９〜１１を参照しながら説明する。本実施の形態は、実施の形態６で示した送信端１３に対して、実施の形態３で示した中継ノード２２における改良を加えて、送信端１４としたものである。また、実施の形態６で示した中継ノード２３に改良を加えて、中継ノード２４としたものである。
【０１３４】ここで、１１０は実施の形態６における送信端１３の内部状態保持機能付き符号器１０８に改良を加えた内部状態保持機能付き符号器（送信側符号化手段）、１１１は擬似背景雑音発生用パラメータ生成部（送信側パラメータ生成手段）、２１１は擬似背景雑音発生用パラメータ生成部（中継側パラメータ生成手段）、２１０は実施の形態６における符号器の一部機能を有する簡易符号器である。なお、実施の形態６と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１３５】まず、内部状態保持機能付き符号器１１０の動作を、図１０を参照しながら説明する。これは、内部状態保持機能付き符号器１１０の具体的な構成を示すため、一例として高能率音声符号化方式にITU勧告G.728を適用したものである。図１０と図８とを比較して判る通り、これは実施の形態６における内部状態保持機能付き符号器１０８の構造と、切替スイッチ４２１の位置が異なる以外はほぼ同一である。このため、各機能ブロックの説明は省略する。
【０１３６】また、符号化方式にITU勧告G.728 LD-CELP方式を用いた場合、擬似背景雑音発生用パラメータ生成部１１１から出力される信号の一つの例として、合成フィルタ駆動のための励振信号を用いる。LD-CELP音声符号化方式に基づく復号器においては、丁度人間の発生機構をモデル化した構造となっている。即ち人間の声帯音源に相当する励振信号を駆動源として用い、人間の声道情報をモデル化した合成フィルタによって調音し、音声を合成する構造となっている。音声符号として、励振信号をベクトル量子化した波形コードブックを用いている。擬似背景雑音発生用パラメータ生成部１１１は、量子化される前の励振信号を何らかの手段で発生させる機能ブロックである。
【０１３７】次に、図９を用いて、実施の形態７の音声伝送システムの動作について説明する。音声検出器１０３において、音声信号が「有音」と判定された区間においては、制御信号１Ａにより、切替スイッチ４２１を４２１Ｂ側に、切替スイッチ４２２を４２２Ｂ側に、切替スイッチ４２３を４２３Ｂ側に、それぞれ倒す。この時の内部状態保持機能付き符号器１１０の構造および動作は、実施の形態１における通常の符号器１０１の構造および動作と同一となる。即ち、入力された原音声信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、内部状態保持機能付き符号器１１０から出力する。この出力信号が伝送路Ａに送出される。
【０１３８】音声検出器１０３において、音声信号が「無音」と判定された区間においては、制御信号１Ａにより、切替スイッチ４２１を４２１Ａ側に、切替スイッチ４２２を４２２Ａ側に、切替スイッチ４２３を４２３Ａ側に、それぞれ倒す。ローカルデコーダ部４２０は擬似背景雑音発生用パラメータ生成部１１１から出力される励振信号（第１のパラメータ信号）を入力とし、この信号を用いて復号動作を行う。この復号処理は通常の復号処理から丁度逆量子化手段４０３を飛ばしたものと同じである。
【０１３９】この動作の目的は、バックワード型利得適応部４１０、及びバックワード型合成フィルタ適応部４１１を動作させて、利得乗算器４０４、合成フィルタ４０５の内部状態を、受信端復号器３０２の内部状態と、常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。そして、合成フィルタ４０５の出力、即ち復号された音声信号の出力経路はスイッチ４２３で遮断されているため、このローカルデコーダ４２０の出力は、他の機能ブロックから参照されることはない。また、内部状態保持機能付き符号器１１０において、ローカルデコーダ４２０以外の機能ブロック、即ちＰＣＭ伸長部４０１、ベクトルバッファ部４０２、加算器４０６、聴覚重み付けフィルタ４０７、最小自乗誤差探索部４０８は、入力とすべき信号がないため停止させておく。
【０１４０】中継ノード２４において、送信端１４と同じ擬似背景雑音発生用パラメータ生成部２１１を備えており、送信端１４の擬似背景雑音発生用パラメータ生成部１１１と、同期して動作する。この方法は、実施の形態１における擬似背景雑音生成部１０６，２０６と同様な手法を用いることによって実現される。中継ノード２４において欠落した無音区間の音声符号を補間するため、擬似背景雑音発生用パラメータ生成部２１１から出力された励振信号（第２のパラメータ信号）を符号化する機能を有する簡易符号器２１０によって、擬似背景雑音符号が補間される。
【０１４１】次に、簡易符号器２１０の構造を図１１に示す。ベクトルバッファ４３１において時間的に連続する励振信号を５サンプル分蓄積してベクトル化し、加算器４３４に出力する。一方、波形コードブックに蓄積されたすべての符号の候補について逆量子化器４３２において逆量子化を行って励振信号の候補を生成する。これら励振信号候補のすべてに対して加算器４３４に入力し、入力された励振信号との自乗誤差をとり、その中からもっとも近似した励振信号候補を生成した符号を、最適符号として出力する。これにより、LD-CELP方式に基づく符号と同等の擬似背景雑音符号を生成することができる。
【０１４２】さらに、受信端３０では、中継ノード２４から伝送路Ｂを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第２の音声符号を受信する。復号器３０２は入力された第２の音声符号を基に復号処理を行い、音声信号に復号して受信端３０から出力する。
【０１４３】ここで、受信端３０に入力される第２の音声符号は、有音区間では送信端１４の内部状態保持機能付き符号器１１０の出力であるため、有音区間においては、送信端１４の内部状態保持機能付き符号器１１０の内部状態と、受信端３０の復号器３０２の内部状態は一致する。また無音区間において受信端３０に入力される第２の音声符号は、中継ノード２４の擬似背景雑音発生用パラメータ生成部２１１の出力である。これは送信端１４の擬似背景雑音発生用パラメータ生成部１１１の出力と同一であるため、送信端１４の内部状態保持機能付き符号器１１０の内部状態と、受信端３０の復号器３０２の内部状態は一致する。以上のように、受信端３０からの見掛け上、あたかも送信端１４から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【０１４４】以上述べた通り、送信端１４の内部状態保持機能付き符号器１１０の内部状態と、受信端３０の復号器３０２の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード２４において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【０１４５】実施の形態８．以下、実施の形態８について、図１２〜１４を参照しながら説明する。本実施の形態において、実施の形態１の音声符号化伝送システムにおける送信端１０および中継ノード２０に改良を加えて、送信端１５および中継ノード２５としたものである。ここで、２１３は送信端１５から出力された第１の音声信号が「無音」から「有音」に切り替わった直後の遷移区間をカウントするタイマである。なお、実施の形態１と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１４６】次に、実施の形態８の動作を説明する。送信端１５において、音声検出器１０３は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端１５の動作モードを制御する制御信号１Ａを出力する。音声検出器１０３で「有音」と判定された場合は、切替スイッチ１０４を１０４Ｂ側に倒す。これにより、送信端１５に入力された原音声信号は符号器１０１に入力され、高能率符号化された後、切替スイッチ１０４を経由して伝送路Ａに出力される。
【０１４７】一方、音声検出器１０３で「無音」と判定された場合は、切替スイッチ１０４を１０４Ａ側に倒す。このとき、符号器１０１から出力される音声符号は切替スイッチ１０４で遮断され、伝送路Ａには何も出力されない。また、「無音」状態から「有音」状態へ遷移したことを音声検出器１０３が検出したタイミングで、符号器１０１を初期化するための初期化信号１Ｂを符号器へ出力する。符号器１０１はこの初期化信号１Ｂを受信したタイミングで、内部状態の初期化動作を実行する。
【０１４８】本実施の形態に関し、中継ノード２５の動作は、有／無音情報抽出部２０７から出力される制御信号の状態によって、３つのモードを有している。この動作モードについて、図１３に基づいて説明する。図１３は送信端１５の符号器１０１に入力される原音声信号の波形図である。縦軸は信号レベル、横軸は時間を表している。有音／無音情報抽出部２０７は、送信端１５の音声検出器１０３の動作を反映する伝送路Ａからの音声符号の受信状況を常に監視し、その結果動作モードに対応した３つの区間に区分し、中継ノード２５の動作を制御する。
【０１４９】第１に、中継ノード２５に人力された高能率音声符号から、トークスパートが検出されない期間(無音区間)をモード１とする。第２に、中継ノード２５に入力された高能率音声符号から、トークスパートが検出され始めてから数１０msec〜数１００msecの間（遷移期間、又は過渡期間と称する）をモード２とする。第３に、モード２以降、引続きトークスパートが検出される間をモード３とする。有音／無音情報抽出部２０７、及びタイマ２１３は、以上述べた動作モード判定結果を反映した制御信号２Ａ，２Ｆを出力し、中継ノード２５の各機能ブロックに供給する。
【０１５０】ここで、モード２の継続時間（遷移期間）として数１０msec〜１００msecという値を提示したが、この値の根拠は以下の経験則によっている。まず前提条件として、高能率符号化方式としてITU勧告G.728(LD-CELP方式)を用い、中継ノード２５の符号器２０１の内部状態と、受信端３０の復号器３０２の内部状態とが全く異なっているものとする。この前提条件の基で符号器２０１と復号器３０２とで伝送路を介して符号化／復号を行う。LD-CELP方式で使用するフィルタはすべて安定性が保証されているので、送受の内部状態は送受で同一になる方向に次第に収束していく。
【０１５１】そのまま符号化／復号を継続する内、異音の発生するおそれがなくなる程度にまで内部状態が十分一致する。モード遷移から内部状態の十分一致するまでに要する時間が、数１０msec〜１００msecである。もちろん、使用する高能率符号化方式によって、この値は変化することが予想されることはいうまでもなく、それぞれの符号化方式に応じた遷移期間の設定を行うことは重要である。
【０１５２】図１４は、以上説明した各モードの遷移をまとめたモード遷移図である。３つのモード間の遷移は、矢印で示した方向のみ許されており、それ以外の遷移は禁止された遷移であるか、または物理的にあり得ない遷移である。
【０１５３】次に、各モード別に中継ノード２５の動作を説明する。まず、モード１、即ち有音／無音情報抽出部２０７において「無音」と判定された区間においては、切替スイッチ２０５を２０５Ａ側に、切替スイッチ２１４を２１４Ａに、それぞれ倒す。この時、擬似背景雑音生成部２０６側の出力信号は、切替スイッチ２０５を経由して符号器２０１に入力される。符号器２０１は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器２０１から出力された擬似背景雑音符号は、切替スイッチ２１４を経由して伝送路Ａへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器２０２は入力信号を失うため、動作を停止させる。
【０１５４】モード１からモード２に遷移するとき、即ち、有音／無音情報抽出部２０７において、音声符号が検知されはじめたとき、復号器２０２にリセット信号２Ｂを発行する。有音／無音情報抽出部２０７の動作は音声検出器１０３の動作を忠実に反映していることから、これは送信端１５の符号器１０１の初期化と同期して実行される。
【０１５５】モード２においては、切替スイッチ２０５を２０５Ｂに倒し、切替スイッチ２１４は２１４Ａに接続したままとする。中継ノード２５で受信した音声符号は、復号器２０２に供給される。符号器２０２は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ２０５を経由して、符号器２０１に供給される。符号器２０１は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ２１４を経由して伝送路Ｂに出力される。即ち、中継ノード２５においてタンデム接続を行ったのと同じ形となる。
【０１５６】モード３においては、タイマ２１３からの制御信号２Ｆを受信した切替スイッチ２１４が２１４Ｂ側に倒れる。また、切替スイッチ２０５は２０５Ｂ側に接続したままとする。中継ノード２５で受信した音声符号は、切替スイッチ２１４を経由してそのまま伝送路Ｂにリレーされる。また当該音声符号は、復号器２０２にも供給される。復号器２０２は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ２０５を経由して符号器２０１に供給される。符号器２０１は入力された音声信号に基づき符号化処理を実行する。
【０１５７】ここで、送信端１５の符号器１０１と、中継ノード２５の符号器２０１とでは、入力される信号にそれぞれ原音声信号と、復号器２０２で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器１０１の内部状態と、中継符号器２０１の内部状態とは、極めて近似した値に保持される。
【０１５８】本実施の形態において、モード１からいきなりモード３に遷移させた場合について考察する。取り敢えず、送信端符号器１０１と中継復号器２０２の内部状態、及び中継符号器２０１の内部状態と受信端復号器３０２の内部状態とは、それぞれ一致していることが保障されている。ところが、送信端符号器１０１と受信端復号器３０２の内部状態については、その一致については全く保証されない。従ってモード１からモード３に一足飛びに遷移すると、ちょうど従来例で示したディジタル１リンクの形と同様になり、内部状態の不一致に起因する異音発生を引き起こす。ここで、モード１からモード３に遷移する間に遷移区間としてモード２を設けることにより、送信端符号器１０１の内部状態と受信端復号器３０２の内部状態とが十分一致するため、この段階でモード３に遷移させても異音の発生を回避することが可能となる。
【０１５９】この実施の形態に係る音声符号化伝送システムは、音声の品質劣化を引き起こすことが知られているタンデム接続を許す期間を無音状態から有音状態に遷移する過渡期のわずかな時間に制限し、大部分のトークスパートは１リンクの符号化／復号で接続することによって、品質劣化を回避することができ、高能率音声符号化方式の性能をフルに引き出すことが可能となる。また、中継ノードでのプロセッサの処理負荷、及びハードウエア規模の低減が可能となる。なお、本実施の形態では、高能率符号化方式にITU勧告G.728 LD−CELP方式を適用したシステムについて述べたが、本発明の適用例がこの符号化方式に限定されるということを示している訳ではなく、過去の符号化／復号結果を利用する、あらゆる音声符号化方式に適用できることは容易に推察できる。
【０１６０】実施の形態９．以下、実施の形態９について、図１５を参照しながら説明する。本実施の形態において、実施の形態８で示した中継ノード２５に対して、タイマ２１３を比較器（比較手段）２１５に置き換えて、中継ノード２６としたものである。ここで、比較器２１５は、復号器２０２の内部状態と符号器２０１の内部状態とを数値的に比較するものである。なお、実施の形態８と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１６１】次に、中継ノード２６の動作を説明する。まず、モード１、即ち有音／無音情報抽出部２０７において「無音」と判定された区間においては、切替スイッチ２０５を２０５Ａ側に、切替スイッチ２１４を２１４Ａ側に、それぞれ倒す。この時、擬似背景雑音生成部２０６側の出力信号は、切替スイッチ２０５を経由して符号器２０１に入力される。符号器２０１は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器２０１から出力された擬似背景雑音符号は、切替スイッチ２１４を経由して伝送路Ａへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器２０２は入力信号を失うため、動作を停止させる。
【０１６２】モード１からモード２に遷移するとき、即ち、有音／無音情報抽出部２０７において、音声符号が検知されはじめたとき、復号器２０２にリセット信号２Ｂを発行する。有音／無音情報抽出部２０７の動作は音声検出器１０３の動作を忠実に反映していることから、これは送信端１５の符号器１０１の初期化と同期して実行される。
【０１６３】モード２においては、切替スイッチ２０５を２０５Ｂに倒し、切替スイッチ２１４は２１４Ａに接続したままとする。中継ノード２５で受信した音声符号は、復号器２０２に供給される。符号器２０２は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ２０５を経由して、符号器２０１に供給される。符号器２０１は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ２１４を経由して伝送路Ｂに出力される。即ち、中継ノード２５においてタンデム接続を行ったのと同じ形となる。
【０１６４】モード３においては、符号器２０１の内部パラメータと復号器２０２の内部パラメータとが比較器２１５に与えられる。比較器２１５では、これらの内部パラメータが所定のレベル内で一致しているか判定し、このレベル内で一致している場合に制御信号２Ｄを切替スイッチ２１４に出力する。そして、この制御信号２Ｆを受信した切替スイッチ２１４が２１４Ｂ側に倒れる。また、切替スイッチ２０５は２０５Ｂ側に接続したままとする。
【０１６５】中継ノード２５で受信した音声符号は、切替スイッチ２１４を経由してそのまま伝送路Ｂにリレーされる。また当該音声符号は、復号器２０２にも供給される。復号器２０２は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ２０５を経由して符号器２０１に供給される。符号器２０１は入力された音声信号に基づき符号化処理を実行する。
【０１６６】ここで、送信端１５の符号器１０１と、中継ノード２５の符号器２０１とでは、入力される信号にそれぞれ原音声信号と、復号器２０２で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器１０１の内部状態と、中継符号器２０１の内部状態とは、極めて近似した値に保持される。
【０１６７】以上のように、モード２からモード３への遷移タイミングの決定を比較器２１５の判定結果によって制御することにより、送信端１５の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態とをより確実に一致させることができ、異音の発生するおそれを更に減少させる効果がある。
【０１６８】実施の形態１０．以下、実施の形態１０について、図１６を参照しながら説明する。本実施の形態において、実施の形態８で示した中継ノード２５に対して、比較器（比較手段）２１５と判定回路（判定手段）２１６とを追加して、中継ノード２７としたものである。ここで、比較器２１５は、復号器２０２の内部状態と符号器２０１の内部状態とを数値的に比較するものであり、判定回路２１６は、タイマ２１３から出力された制御信号２Ｆと比較器２１５から出力された制御信号２Ｄとに基づいて、モード３への遷移タイミングを判定するものである。なお、実施の形態８と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１６９】次に、中継ノード２７の動作を説明する。まず、モード１、即ち有音／無音情報抽出部２０７において「無音」と判定された区間においては、切替スイッチ２０５を２０５Ａ側に、切替スイッチ２１４を２１４Ａ側に、それぞれ倒す。この時、擬似背景雑音生成部２０６側の出力信号は、切替スイッチ２０５を経由して符号器２０１に入力される。符号器２０１は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器２０１から出力された擬似背景雑音符号は、切替スイッチ２１４を経由して伝送路Ａへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器２０２は入力信号を失うため、動作を停止させる。
【０１７０】モード１からモード２に遷移するとき、即ち、有音／無音情報抽出部２０７において、音声符号が検知されはじめたとき、復号器２０２にリセット信号２Ｂを発行する。有音／無音情報抽出部２０７の動作は音声検出器１０３の動作を忠実に反映していることから、これは送信端１５の符号器１０１の初期化と同期して実行される。
【０１７１】モード２においては、切替スイッチ２０５を２０５Ｂに倒し、切替スイッチ２１４は２１４Ａに接続したままとする。中継ノード２５で受信した音声符号は、復号器２０２に供給される。符号器２０２は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ２０５を経由して、符号器２０１に供給される。符号器２０１は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ２１４を経由して伝送路Ｂに出力される。即ち、中継ノード２５においてタンデム接続を行ったのと同じ形となる。
【０１７２】モード３においては、符号器２０１の内部パラメータと復号器２０２の内部パラメータとが比較器２１５に与えられる。比較器２１５では、これらの内部パラメータが所定のレベル内で一致しているか判定し、このレベル内で一致している場合に制御信号２Ｄを判定回路２１６に出力する。また、タイマ２１３では、モード３への遷移タイミングをカウントし、所定のカウント値で制御信号２Ｆを判定回路２１６に出力する。
【０１７３】判定回路２１６では、これらの制御信号２Ｄ，２Ｆの入力を受け付けて、両者の制御信号２Ｄ，２Ｆが入力された場合に、制御信号２Ｅを切替スイッチ２１４に出力する。そして、この制御信号２Ｅを受信した切替スイッチ２１４が２１４Ｂ側に倒れる。また、切替スイッチ２０５は２０５Ｂ側に接続したままとする。
【０１７４】中継ノード２５で受信した音声符号は、切替スイッチ２１４を経由してそのまま伝送路Ｂにリレーされる。また当該音声符号は、復号器２０２にも供給される。復号器２０２は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ２０５を経由して符号器２０１に供給される。符号器２０１は入力された音声信号に基づき符号化処理を実行する。
【０１７５】ここで、送信端１５の符号器１０１と、中継ノード２５の符号器２０１とでは、入力される信号にそれぞれ原音声信号と、復号器２０２で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器１０１の内部状態と、中継符号器２０１の内部状態とは、極めて近似した値に保持される。
【０１７６】以上のように、モード２からモード３への遷移タイミングの決定を、この判定部の判定結果によって制御することにより、送信端１５の符号器１０１の内部状態と、受信端３０の復号器３０２の内部状態とをより確実に一致させることができる。その結果、異音の発生するおそれを減少させつつ、タンデム時間が長時間に及んで音声品質が低下するのを防止することができる。
【０１７７】実施の形態１１．図１７は、実施の形態１〜６，８〜１０における擬似背景雑音生成部１０６，２０６、実施の形態７における擬似背景雑音発生用パラメータ生成部１１１，２１１の構造の一例を詳細に記したものである。補間信号は同図に示す巡回型のメモリに格納されている。擬似背景雑音信号シーケンスはサンプル単位（あるいは、擬似背景雑音符号についてはフレーム単位）でメモリ空間の所定のアドレスに順番に格納されている。擬似背景雑音信号出力時は、アドレスポインタが示すサンプルを出力し、ポインタを１アドレス分進める。
【０１７８】メモリを巡回型にすることにより、あらゆる長さの無音区間にも対応することができるが、メモリサイズを小さくすると、巡回メモリによる周期性により擬似背景雑音信号に特定の周波数の信号成分が乗ってしまう弊害が出るため、メモリサイズは十分に大きくすべきである。ここで、これら擬似背景雑音生成部１０６，２０６または擬似背景雑音発生用パラメータ生成部１１１，２１１が初期化信号２Ｂを受信したときは、ポインタの位置をアドレス０に設定し直す。この動作によって、送信端１０〜１５と中継ノード２０〜２７の擬似背景雑音生成部１０６，２０６間で、無音圧縮による断絶状態が発生しても、両端で同期した動作を実現することができる。
【０１７９】実施の形態１２．図１８は実施の形態１〜６，８〜１０における擬似背景雑音生成部１０６，２０６、実施の形態７における擬似背景雑音発生用パラメータ生成部１１１，２１１の構造の一例を詳細に記したものであり、４４１は白色雑音発生部（ランダム信号発生器）、４４２はフィルタである。白色雑音発生部４４１は、通常の音声通信において生じる背景雑音の成分が、白色性（ランダム性）が強いことに着目して、無音区間に補間する背景雑音信号を乱数発生器の出力信号で擬似的に実現しようというものである。乱数の発生方法は、例えばＰＮパターンによる方法、剰余を取る方法などがある。
【０１８０】ここで、これらの擬似背景雑音生成部１０６，２０６または擬似背景雑音発生用パラメータ生成部１１１，２１１が初期化信号２Ｂを受信したときは、この乱数発生器の初期値である種（ｓｅｅｄ）として、送信端１０〜１５、中継ノード２０〜２７の両者にあらかじめ設定しておいた値を与える。この動作によって、送信端１０〜１５と中継ノード２０〜２７の擬似背景雑音信号生成部１０６，２０６間で、無音圧縮による断絶状態が発生しても、両端で同期した動作を実現することができる。また、乱数発生器の出力端に、自然な背景雑音の周波数特性に近い特性を持つフィルタ４４２（例えば、１／ｆ特性を持つフィルタなど）を挿入することにより、より違和感の無い擬似背景雑音信号を得ることができる。
【０１８１】実施の形態１３．次に、実施の形態１３について、図１９を参照しながら説明する。本実施の形態は、実施の形態１に示した送信端１０の音声検出器１０３と中継ノード２０の有音／無音情報抽出部２０７との間にシグナリングチャネル（同期信号送出手段）１０３Ａ（たとえば、ＩＳＤＮのＤチャネル等）を接続したものである。なお、実施の形態１と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１８２】実施の形態１で説明した通り、有音区間及び無音区間の判定基準として、音声符号の有無を調べる方法がある。例えば、伝送路ＡがＡＴＭネットワークである場合、送信端１０から送信されるセルが来なかったら無音区間に遷移したと判定するのも一つのやり方である。
【０１８３】ところが、ＡＴＭ網内で、ネットワーク特有の劣化要因であるセル廃棄が発生した場合、中継ノード２０で誤って無音区間と認識してしまうおそれがある。これを回避するために、送信端１０の音声検出器１０３と中継ノード２０の有音／無音情報抽出部２０７との間にシグナリングチャネル１０３Ａを接続する。そして、有音区間から無音区間に遷移したことを知らせる情報を、このシグナリングチャネル１０３Ａを用いて送信端１０から中継ノード２０へ別途通知することによって、無音遷移の誤認識を防止する上でより高品質な音声伝送を実現することができる。
【０１８４】なお、実施の形態２〜９においても、送信端１０〜１５の音声検出器１０３と中継ノード２１〜２７の有音／無音情報抽出部２０７との間にシグナリングチャネル１０３Ａを接続して、送信端１０〜１５から中継ノード２１〜２７へ情報を別途通知する本方式が適用できることはいうまでもない。
【０１８５】実施の形態１４．次に、実施の形態１４について、図２０を参照しながら説明する。本実施の形態は、実施の形態１で示した送信端１０に対して、識別パターン生成部（識別パターン発生手段）２１７を追加して、送信端１６としたものである。ここで、識別パターン生成部２１７は、有音区間の最終であることを示すシグナリング伝送用符号パターンを生成するものである。なお、実施の形態１と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【０１８６】本実施の形態は、有音区間から無音区間に遷移したことを、送信端１０から中継ノード２０へ知らせるシグナリングの伝送方法に改良を加えたものである。本実施の形態においては、このシグナリング情報をインチャネルで伝送する。即ち、送信端１０において、音声検出器１０３が有音区間から無音区間に遷移したことを検出したタイミングで、最終の音声符号の伝送後、切替スイッチ１０４を１０４Ｃ側に切替る。この切替えによって、識別パターン生成部２１７で生成されたシグナリング伝送用符号パターンが中継ノード２０に送出される。シグナリング伝送用符号パターンの送出後、切替スイッチ１０４を１０４Ａ側に切替え、シグナリング伝送用符号パターンの送出を停止する。
【０１８７】中継ノード２０の有音／無音情報抽出部２０７は、伝送路Ａから入力される信号を常に監視し、このシグナリング伝送用符号パターンを認識したタイミングで、「有音」から「無音」に遷移したことを知らせる制御信号２Ａを出力する。この方式を用いることにより、無音遷移の誤認識を防ぎ、高品質な音声伝送を実現することができるのはもとより、信号方式を変更することなく、機能ブロックの追加だけで実現できるという利点がある。
【０１８８】なお、実施の形態２〜９においても、送信端１０〜１５に識別パターン生成部２１７を追加して、シグナリング情報をインチャネルで伝送する本方式が適用できることはいうまでもない。
【０１８９】
【発明の効果】本発明による音声符号化伝送システムであれば、タンデム接続による音声品質の劣化を回避することができ、、送信端で符号化処理する際の内部状態と、受信端で復号処理する際の内部状態との一致が常に図られているため、内部状態の不整合に起因する異音や耳障り感を減少させることができる。
【図面の簡単な説明】
【図１】実施の形態１に係る音声符号化伝送システムの構成を示すブロック図である。
【図２】実施の形態２に係る音声符号化伝送システムの構成を示すブロック図である。
【図３】実施の形態３に係る音声符号化伝送システムの構成を示すブロック図である。
【図４】実施の形態３に係る補間信号発生器の構成を詳細に示すブロック図である。
【図５】実施の形態４に係る音声符号化伝送システムの構成を示すブロック図である。
【図６】実施の形態５に係る音声符号化伝送システムの構成を示すブロック図である。
【図７】実施の形態６に係る音声符号化伝送システムの構成を示すブロック図である。
【図８】実施の形態６に係る内部状態保持機能付き符号器の構成を詳細に示すブロック図である。
【図９】実施の形態７に係る音声符号化伝送システムの構成を示すブロック図である。
【図１０】実施の形態７に係る内部状態保持機能付き符号器の構成を詳細に示すブロック図である。
【図１１】実施の形態７に係る簡易符号器の構成を詳細に示すブロック図である。
【図１２】実施の形態８に係る音声符号化伝送システムの構成を示すブロック図である。
【図１３】実施の形態８に係る送信端の符号器に入力される原音声信号の波形図である。
【図１４】実施の形態８に係る動作モード間の遷移を示す状態遷移図である。
【図１５】実施の形態９に係る音声符号化伝送システムの構成を示すブロック図である。
【図１６】実施の形態１０に係る音声符号化伝送システムの構成を示すブロック図である。
【図１７】実施の形態１１に係る擬似背景雑音信号発生部の構成を示す図である。
【図１８】実施の形態１２に係る擬似背景雑音信号発生部の構成を示す図である。
【図１９】実施の形態１３に係る音声符号化伝送システムの構成を示すブロック図である。
【図２０】実施の形態１４に係る音声符号化伝送システムの構成を示すブロック図である。
【図２１】符号化方式の一例であるITU-T勧告G.728 LD-CELP音声符号化方式のシステム構成を示すブロック図である。
【図２２】従来の音声符号化伝送システムの構成を示すブロック図である。
【図２３】従来のタンデム接続による音声符号化伝送システムの構成を示すブロック図である。
【図２４】従来のディジタル1リンク接続による音声符号化伝送システムの構成を示すブロック図である。
【符号の説明】
１〜１６…送信端、２０〜２７…中継ノード、３０…受信端、１０１…符号器（送信側符号化手段）、１０２…復号器（送信側復号化手段）、１０３Ａ…シグナリングチャネル（同期信号伝送手段）、１０４…切替スイッチ（送信側音声符号生成手段）、１０５…切替スイッチ（送信側背景雑音挿入手段）、１０６，１１２…擬似背景雑音生成部（送信側背景雑音生成手段）、１０８，１１０…内部状態保持機能付き符号器（送信側符号化手段）、１１１…擬似背景雑音発生用パラメータ生成部（送信側パラメータ生成手段）、２０１…符号器（中継側符号化手段）、２０２…復号器（中継側復号化手段）、２０４…切替スイッチ（中継側背景雑音挿入手段）、２０６，２１２…擬似背景雑音生成部（中継側背景雑音生成手段）、２０８…補間信号発生器（補間信号生成手段）、２１０…簡易符号器（中継側符号化手段）、２１１…擬似背景雑音発生用パラメータ生成部（中継側パラメータ生成手段）、２１３…タイマ、２１４…切替スイッチ（中継側音声符号生成手段）、２１５…比較器（比較手段）、２１６…判定回路（判定手段）、２１７…識別パターン生成部（識別パターン発生手段）、Ａ…伝送路（第１の伝送路）、Ｂ…伝送路（第２の伝送路）。

【特許請求の範囲】
【請求項１】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第１の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第１の音声符号を復号化する中継側復号化手段と、背景雑音を模した第２の擬似信号を生成する中継側背景雑音生成手段と、前記中継側復号化手段で復号化された音声信号の無音区間に前記第２の擬似信号を挿入する中継側背景雑音挿入手段と、前記中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された音声符号を前記第１の音声符号の無音区間に挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項２】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第１の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第１の音声符号を復号化する中継側復号化手段と、背景雑音を模した第２の擬似信号を生成する中継側背景雑音生成手段と、前記第２の擬似信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された擬似符号を前記第１の音声符号の無音区間に挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備え、前記中継側符号化手段は、前記中継側復号化手段の内部パラメータを入力して、この内部パラメータを用いて前記中継側復号化手段と同等の内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項３】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第１の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音送信手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第２の擬似信号を生成する中継側背景雑音生成手段と、前記第１の音声符号を復号化すると共に、前記第２の擬似信号を符号化する補間信号生成手段と、前記補間信号生成手段で符号化された擬似符号を前記第１の音声符号の無音区間に挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備え、前記補間信号生成手段は、復号化処理と符号化処理とで共通した内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項４】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第１の擬似符号を生成する送信側背景雑音生成手段と、前記第１の擬似符号を復号化する送信側復号化手段と、前記送信側復号化手段で復号化された擬似信号を前記原音声信号の無音区間に挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第２の擬似符号を生成する中継側背景雑音生成手段と、前記第１の音声符号の無音区間に前記第２の擬似符号を挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備え、前記送信側復号化手段は、前記送信側符号化手段で符号化された音声符号を入力して、有音区間についてはこの音声符号を復号化すると共に、無音区間については前記第２の擬似符号を復号化していることを特徴とする音声符号化伝送システム。
【請求項５】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第１の擬似符号を生成する送信側背景雑音生成手段と、前記第１の擬似符号を復号化する送信側復号化手段と、前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第２の擬似符号を生成する中継側背景雑音生成手段と、前記第１の音声符号の無音区間に前記第２の擬似符号を挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備え、前記送信側符号化手段は、前記送信側復号化手段の内部パラメータを入力して、この内部パラメータを用いて前記送信側復号化手段と同等の内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項６】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第１の擬似信号を生成する送信側背景雑音生成手段と、前記第１の擬似信号に基づく内部状態を保持しつつ前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第２の擬似符号を生成する中継側背景雑音生成手段と、前記第１の音声符号の無音区間に前記第２の擬似符号を挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項７】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第１の音声符号を復号化して音声信号を生成する中継側復号化手段と、背景雑音を模した擬似信号を生成する中継側背景雑音生成手段と、前記中継側復号化手段で生成された音声信号の無音区間に前記擬似信号を挿入する中継側背景雑音挿入手段と、前記中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された音声符号を、前記第１の音声符号の無音区間および無音から有音に切り替わった直後の遷移区間に挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項８】前記中継ノードは、前記遷移区間をカウントするタイマを更に備え、前記中継側音声符号生成手段では、前記タイマのカウント値に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項７記載の音声符号化伝送システム。
【請求項９】前記中継ノードは、前記中継側復号化手段の内部状態と前記中継側符号化手段の内部状態とを比較する比較手段を更に備え、前記中継側音声符号生成手段では、前記比較手段の比較結果に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項７記載の音声符号化伝送システム。
【請求項１０】前記中継ノードは、前記遷移区間をカウントするタイマと、前記中継側復号化手段の内部状態と前記中継側符号化手段の内部状態とを比較する比較手段と、前記タイマのカウント値および前記比較手段の比較結果に基づいて前記遷移区間の終了タイミングを判定する判定手段とを更に備え、前記中継側音声符号生成手段では、前記判定手段の判定結果に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項７記載の音声符号化伝送システム。
【請求項１１】前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、無音区間の背景雑音を模したディジタル信号を疑似音声として生成していることを特徴とする請求項１から請求項１０のいずれか一項に記載の音声符号化伝送システム。
【請求項１２】前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする請求項１から請求項１０のいずれか一項に記載の音声符号化伝送システム。
【請求項１３】前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、ランダム信号発生器であることを特徴とする請求項１から請求項１０のいずれか一項に記載の音声符号化伝送システム。
【請求項１４】前記原音声信号の無音区間の開始を示す同期信号を前記送信端から前記中継ノードに伝送させる同期信号伝送手段を更に備え、前記中継ノードは、前記同期信号を受信して、前記送信側背景雑音生成手段と前記中継側背景雑音生成手段とを同期させていることを特徴とする請求項１から請求項１０のいずれか一項に記載の音声符号化伝送システム。
【請求項１５】前記送信端は、前記原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、前記中継ノードは、前記識別パターンを認識して、前記送信側背景雑音生成手段と前記中継側背景雑音生成手段とを同期させていることを特徴とする請求項１から請求項１０のいずれか一項に記載の音声符号化伝送システム。
【請求項１６】原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第１の音声符号を第１の伝送路に出力する送信端と、前記第１の伝送路から受信した第１の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第２の音声符号を第２の伝送路に出力する中継ノードと、前記第２の伝送路から受信した第２の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、擬似背景雑音発生用の第１のパラメータ信号を生成する送信側パラメータ生成手段と、前記第１のパラメータ信号に基づく内部状態を保持しつつ前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第１の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、擬似背景雑音発生用の第２のパラメータ信号を生成する中継側パラメータ生成手段と、前記第２のパラメータ信号に基づいて擬似符号を生成する中継側符号化手段と、前記第１の音声符号の無音区間に前記擬似符号を挿入して、前記第２の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項１７】前記送信側パラメータ生成手段及び前記中継側パラメータ生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする請求項１６記載の音声符号化伝送システム。
【請求項１８】前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段は、ランダム符号発生器であることを特徴とする請求項１６記載の音声符号化伝送システム。
【請求項１９】前記送信端は、前記原音声信号の無音区間の開始を示す同期信号を送出する同期信号送出手段を更に備え、前記中継ノードは、前記同期信号を受信して、前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段とを同期させていることを特徴とする請求項１６記載の音声符号化伝送システム。
【請求項２０】前記送信端は、前記原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、前記中継ノードは、前記識別パターンを認識して、前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段とを同期させていることを特徴とする請求項１６記載の音声符号化伝送システム。

【図１】

【図２】

【図１８】

【図３】

【図４】

【図５】

【図７】

【図６】

【図８】

【図９】

【図１７】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４】

【図１５】

【図１６】

【図２２】

【図１９】

【図２０】

【図２１】

【図２３】

【図２４】

【特許番号】特許第３４８７１５８号（Ｐ３４８７１５８）
【登録日】平成１５年１０月３１日（２００３．１０．３１）
【発行日】平成１６年１月１３日（２００４．１．１３）
【国際特許分類】

【出願番号】特願平１０−４４８１９
【出願日】平成１０年２月２６日（１９９８．２．２６）
【公開番号】特開平１１−２４３３９６
【公開日】平成１１年９月７日（１９９９．９．７）
【審査請求日】平成１３年２月１６日（２００１．２．１６）
【出願人】（０００００６０１３）三菱電機株式会社 (33,312)
【参考文献】
【文献】特開平９−３２１７８３（ＪＰ，Ａ）
【文献】特開平５−４９０５４（ＪＰ，Ａ）
【文献】特開平４−３６２８３０（ＪＰ，Ａ）
【文献】特開平９−３３１３３０（ＪＰ，Ａ）
【文献】特開平６−６９９５０（ＪＰ，Ａ）
【文献】特開平４−２４９４４６（ＪＰ，Ａ）
【文献】特開平４−９２３（ＪＰ，Ａ）

[ Back to top ]

音声符号化伝送システム

メニュー

スポンサーリンク

次の公報 »

« 前の公報

音声符号化伝送システム

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク