音声符号化伝送システム
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を高能率に圧縮伝送する音声符号化伝送システムに関し、特に音声品質を向上させることのできる音声符号化伝送システムに関する。
【0002】
【従来の技術】従来より、音声信号の冗長成分を除いて高能率に符号化する高能率音声符号化技術を用いた音声信号のディジタル伝送技術が、企業内通信や国際通信などの通信コストの低減が強く望まれる分野で盛んに用いられている。高能率音声符号化方式としては、ITU(International Telecommunications Union)勧告G.726 ADPCM(Adaptive Differential Pulse Code Modulation:適応差分パルス符号変調)符号化方式に代表されるような予測差分符号化方式や、ITU勧告G.728 LD-CELP(Low-Delay Code Excited Linear Prediction:低遅延型符号励振線形予測)符号化方式(図21参照)、およびITU勧告G.729CS-ACELP(Conjugate-Structure Algebraic-Code-Excited Linear Prediction:共役構造代数的符号励振線形予測)符号化方式に代表されるような「合成による分析(Analysis-by-Synthesis)」に基づく符号化方式などがある。
【0003】なお、これら符号化方式の詳細については、以下の文献を参照されたい。
・CCITT Recommendation G.726, ■40,32,24,16kbit/s adaptive differentialpulse code modulation (ADPCM)■・ITU-T Recommendation G.728, ■Coding of speech at 16kbit/s using Low-Delay Code Excited Linear Prediction(LD-CELP)■・ITU-T Recommendation G.729, ■Coding of speech at 8kbit/s using conjugate-structure algebraic-code-excited linear prediction■
【0004】ここで、予測差分符号化方式は、過去の信号系列から現在の信号を予測し、その予測パラメータと実際の信号との差分信号を量子化して伝送する方式である。また、「合成による分析」に基づく符号化方式は、過去、及び現在の音声信号に基づいて分析して得られたパラメータを用いて、候補として複数パターンの信号の合成を行い、その中から最も入力音声に近似した信号パターンを選択した上で、選択された合成信号の基となったパラメータを、最適パラメータとして量子化し、伝送する方式である。
【0005】これらのいずれの方式も、送信側に設けられた符号器と、受信側に設けられた復号器とで実現されている。そして、現在の入力音声信号成分に基づく所謂フォワード適応によって得られる符号器のパラメータについては、復号器でその情報を得る手段がない。このため、符号器と復号器とが同一のパラメータを保持するためには、符号器から復号器に情報を送信する必要がある。一方、過去の音声信号に基づく所謂バックワード適応によって得られるパラメータについては、符号器および復号器の両者が共通のパラメータ算出手段を持つことにより、符号器および復号器を正常に動作させることができる。
【0006】即ち、予測差分符号化方式では、過去の信号系列を符号器および復号器の内部状態として共有することにより、これに基づいた音声の符号化および復号動作が実現される。また、「合成による分析」に基づく符号化方式では、バックワード適応によって得られた送受信で同一のパラメータの集合を符号器、復号器の内部状態として共有することにより、これらのパラメータに基づいた音声の符号化および復号化が実現される。従って、復号器においては、符号器と全く同じ内部状態を保ちながら音声の復号処理を実行することが前提となる。逆に、何らかの原因で送信側と受信側とで過去の音声信号が異なれば、内部状態も一致しなくなり、復号部で再生される音声の正確さが保証されないおそれがある。
【0007】一方で、通信網においては、電話に代表される音声以外に、画像やコンピュータデータの伝送といった、マルチメディア伝送への要求が高まっている。このような複数のサービスをネットワーク上で総合的に扱えるように、非同期転送モード(ATM:Asynchronous Transfer Mode)と呼ばれる通信方式が近年、盛んに導入されつつある。ATM伝送網においては、伝送される情報信号(音声・画像等)をディジタル符号化し、得られたビット列をセルと呼ばれる固定長ブロックに分割し、非同期的に通信路に送出する。これにより、伝送速度の異なる情報信号を多元的に取り扱うことが可能になる。
【0008】最近では、上述のような一層の高能率化への要求から、ATM網の非同期性・可変速度性といった特長を生かした無音圧縮技術(音声信号の無音部分を廃棄して伝送する方式)が併用されるようになりつつある。この無音圧縮技術は、有音区間の音声品質を損なうことなく、伝送路に送出される音声信号の総量を低減することができ、統計多重効果により、一層高能率な音声伝送を可能とする。
【0009】しかし、この無音圧縮音声伝送システムでは、無音時に伝送される音声情報が皆無であるため、高能率符号化された音声信号である音声符号を受信して復号する復号器の動作は無音時に不定となる。従って、上記で述べたバックワード適応が正常に機能しなくなり、無音状態(トークスパートが“無し”の状態と呼ぶことがある)から有音状態(トークスパートが“有り”の状態と呼ぶことがある)に遷移するときに、音声符号を生成する符号器の内部状態と、音声符号を復号する復号器の内部状態とが一致しなくなる。そのため、復号部では、たとえ伝送路誤りのない正しい高能率符号が与えられたとしても、正しく音声信号を復号できるとは限らない。この現象は、しばしば受信端の再生音における不快な異音、例えばクリック音、発振音等、として表れる。
【0010】図22は、これを解決するための第1の音声符号化伝送システムの構成を示すブロック図である。この図は、特開平2−181552号公報に示された構成図に基づいている。この音声伝送システムは、送信端60と受信端70とで一対の構成をなす。トークスパート有りの状態、即ち有音区間においては、送信端60は音声信号を高能率音声符号器601で符号化して、切替スイッチ604を経由して、伝送路Aに音声符号を送出する。送信端60の切替スイッチ604はトークスパート無し、即ち無音区間においては伝送路Aに対して何も送出しないように切り換えられるので、送信端60からは無音圧縮された音声符号が送出されることになる。音声検出器603は音声信号の有音/無音を検出して、切替スイッチ604の切替えを行う。
【0011】一方、受信端70では伝送路Aからの音声符号を復号器702で音声信号に復号して出力する。無音圧縮されている間、切替スイッチ705は擬似背景雑音生成部706側に切り替えられており、受信端70からは、話者の背景雑音を模した擬似的な信号(以下、擬似背景雑音信号という)が出力される。有/無音情報抽出部707は音声符号に基づいて有音/無音を検出して、切替スイッチ705の切替えを行う。
【0012】このシステムでは送信端60に符号器601の所定の内部状態を記憶したメモリ630を有し、受信端70にはこれと同一の内容を格納したメモリ730を有している。そして、上述のような問題が発生する音声信号の無音区間から有音区間への遷移時においては、それを音声検出器603および有/無音情報抽出部707が同期して検出し、送信端60においてはメモリ630から符号器601に符号化処理のための内部状態の初期値が設定され、受信端70においてはメモリ730から復号器702に復号処理のための内部状態の初期値が設定される。
【0013】このように、送信端60及び受信端70とでトークスパートが検出されるタイミングは同期しており、その時点で両者の内部状態は同一の状態にリセットされる。そのため、符号器601と復号器702との内部状態は音声の有音区間においては常に一致し、トークスパート先頭における異音の発生を回避することができる。
【0014】このような技術を用いることによって、高能率符号化を用いた無音圧縮伝送を実現することができる。しかし、現在、これまでに構築された無音圧縮を行わない伝送網が既に存在する。これらの伝送網は多くの場合、多額な費用を投じてインフラストラクチャーとして構築されたものであり、それを直ちに無音圧縮伝送網に置き換えたり、改良したりすることは経済的に困難である。よって、これら従来の伝送網がカバーする範囲も包括した大きな網を構築したい場合には、当面は無音圧縮を行わない網をそのままの状態で、無音圧縮を行う網に併存させなければならない。
【0015】即ち、無音圧縮を行わない網と無音圧縮を行う網との併存は、これら2種類の網を中継ノードで接続することにより実現される。その方法として、図23及び図24に示す2つの方法がある。これらの図は、無音圧縮を行う網から無音圧縮を行わない網への伝送を説明するものである。
【0016】図23は、2種類の網を中継ノードを介してタンデム接続する伝送システムの構成図である。この図において、図22と同一の機能を有する構成要素には同一の符号を付し、その説明を省略する。このシステムの送信端60が有する符号器601は無音圧縮を行った上で、音声符号を伝送路Aに送出する。
【0017】中継ノード80では、伝送路Aから送信端60の音声符号(有音部のみ)を受信し、これを復号器802で音声信号に復号する。送信端60の信号は無音圧縮されているため、復号される音声信号は有音部のみとなる。この音声信号の無音区間に擬似背景雑音信号を挿入し、改めて符号器801で符号化して受信端70に伝送する。
【0018】ここで、送信端60と中継ノード80との間の音声信号の処理は、例えば、図22にて説明した同期リセットを用いた無音圧縮伝送方式で行われる。このように、中継ノード80で一旦復号し、再度符号化を行うため、音声符号化処理の立場から見ると、相互に独立した2つの伝送路A,Bが直列に接続された所謂タンデム接続と称する形態となる。
【0019】一方、図24は、2種類の網を中継ノードを介してディジタル1リンクにより接続する伝送システムの構成図である。この図において、図23と同一の機能を有する構成要素には同一の符号を付し、その説明を省略する。
【0020】送信端60から伝送路Aに送出された、無音圧縮された音声符号は、中継ノード80により無音符号が補充され、伝送路Bを介して受信端70に伝送される。送信端60に入力された音声信号は、符号器601にて高能率符号化される。音声検出器603は、この音声信号を基に有音/無音(トークスパートの有無)を検出し、切替スイッチ604を制御する。切替スイッチ604は、トークスパート有りの場合のみ、符号器601からの音声符号を伝送路Aに伝送する。トークスパート無しの場合には音声符号は廃棄され、伝送路Aには何も出力されない。これにより伝送路Aには無音圧縮された音声符号が送出される。
【0021】中継ノード80は、送信端60から伝送路Aを介して伝送された無音圧縮された音声符号を受信する。有/無音情報抽出部807は、伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ804を制御する。即ち、伝送路Aから音声符号が入力された場合は、切替スイッチ804を804b側に倒して、受信した音声符号をそのまま伝送路Bにリレーする。
【0022】一方、伝送路Aからの信号の受信が検知されなかった場合(即ち無音部と判定された区間)、有/無音情報抽出部807が切替スイッチ804を擬似背景雑音生成部806側に切り替えて、無音区間の信号を擬似背景雑音信号で補充する。なお、遅延器209は、有/無音情報抽出部807における処理時間だけ伝送路Aからの音声符号を遅延させ、切替スイッチ804を音声符号の入力に同期して動作させるものである。
【0023】受信端70では、復号器702が伝送路Bからの音声符号を復号し、音声信号を取り出す。無音区間の信号は、中継ノード80で擬似信号が挿入されるため、見掛け上、受信端70には連続した音声信号が入力しているように見える。
【0024】このように中継ノード80は、音声の有無によって単にスイッチングのみを実行しているに過ぎない。このため、受信端70に伝送される音声符号は、無音区間こそ中継ノードで補間処理がなされているものの、主要な情報となる有音区間については送信端60から送出されたものに他ならない。そして、伝送路A,B間を通過する信号は、ディジタル信号のまま加工されずに相手方の網にリレーされることから、この網間伝送方式をディジタル1リンクと一般的に称している。
【0025】
【発明が解決しようとする課題】しかしながら、上述したタンデム接続及びディジタル1リンクによる伝送路A,Bの接続には、以下に述べる問題点がある。即ち、タンデム接続は、送信端60で無音圧縮された音声符号を、中継ノード80で音声信号に復号した後に雑音信号を挿入し、その後、再度符号化して伝送路Bに送出する。このため、中継ノード80の符号器801の内部状態と、受信端70の復号器702の内部状態とは常に一致し、上述した異音の発生は防止される。
【0026】しかし、中継ノード80では、音声符号に対して、復号化した後に再度符号化するという処理を行うため、送信端に入力された音声信号は受信端から出力されるまでに2回の符号化/復号化処理を受けることになる。そのため量子化誤差が蓄積し、受信端70から出力される音声信号の品質が劣化するという問題があった。この音声品質の劣化は、高いビットレート(l6kbit/s以上)では、ほとんど気にならない程度であるが、圧縮率が高くなればなるほどその劣化傾向は顕著になる。特に、音声伝送システムは低ビットレートであるため、この音声品質の劣化は無視することができない。
【0027】一方、ディジタル1リンクによる接続では、全く事情は逆である。この場合には受信端70に伝送される有音部における音声符号は、送信端60において生成された音声符号と同一であるため、量子化誤差の蓄積による音声信号の品質劣化は防止される。しかし、送信端60の符号器601の内部状態と、受信端70の復号器702の内部状態とでは、無音状態から有音状態に遷移するタイミングで一般に不一致となる。
【0028】即ち、音声符号自体は同じであるのに、その符号化/復号化処理において内部状態が異なるため、復号器702で復号される音声信号は符号器601で意図した信号とは異なるものとなり、上述した異音が発生し得るという問題がある。この異音の発生は、受信者に不快感を与えるのみならず、通常、トークスパートの先頭で発生するため、通話内容の理解度を著しく低下させるという問題があった。
【0029】以上の問題により、従来は、無音圧縮を行わない既存の伝送網側の音声通信システムに改良を加えることなく、この伝送網に無音圧縮伝送網を接続することは困難であった。
【0030】本発明は、このような問題を解決し、無音圧縮を行わない既存の伝送網に無音圧縮を行った伝送網を接続した音声符号化伝送システムにおいて、高品質な音声伝送を可能とする音声符号化伝送システムを提供することを目的とする。
【0031】
【課題を解決するための手段】請求項1の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第1の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、中継側復号化手段で復号化された音声信号の無音区間に第2の擬似信号を挿入する中継側背景雑音挿入手段と、中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された音声符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0032】請求項2の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第1の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、第2の擬似信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された擬似符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、中継側符号化手段は、中継側復号化手段の内部パラメータを入力して、この内部パラメータを用いて中継側復号化手段と同等の内部状態を保持していることを特徴とする。
【0033】請求項3の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第1の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音送信手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、第1の音声符号を復号化すると共に、第2の擬似信号を符号化する補間信号生成手段と、補間信号生成手段で符号化された擬似符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、補間信号生成手段は、復号化処理と符号化処理とで共通した内部状態を保持していることを特徴とする。
【0034】請求項4の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、第1の擬似符号を復号化する送信側復号化手段と、送信側復号化手段で復号化された擬似信号を原音声信号の無音区間に挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、第1の音声符号の無音区間に第2の擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、送信側復号化手段は、送信側符号化手段で符号化された音声符号を入力して、有音区間についてはこの音声符号を復号化すると共に、無音区間については第2の擬似符号を復号化していることを特徴とする。
【0035】請求項5の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、第1の擬似符号を復号化する送信側復号化手段と、原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、第1の音声符号の無音区間に第2の擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、送信側符号化手段は、送信側復号化手段の内部パラメータを入力して、この内部パラメータを用いて送信側復号化手段と同等の内部状態を保持していることを特徴とする。
【0036】請求項6の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、第1の擬似信号に基づく内部状態を保持しつつ原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、第1の音声符号の無音区間に第2の擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0037】請求項7の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第1の音声符号を復号化して音声信号を生成する中継側復号化手段と、背景雑音を模した擬似信号を生成する中継側背景雑音生成手段と、中継側復号化手段で生成された音声信号の無音区間に擬似信号を挿入する中継側背景雑音挿入手段と、中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された音声符号を、第1の音声符号の無音区間および無音から有音に切り替わった直後の遷移区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0038】請求項8において、中継ノードは、遷移区間をカウントするタイマを更に備え、中継側音声符号生成手段では、タイマのカウント値に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【0039】請求項9において、中継ノードは、中継側復号化手段の内部状態と中継側符号化手段の内部状態とを比較する比較手段を更に備え、中継側音声符号生成手段では、比較手段の比較結果に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【0040】請求項10において、中継ノードは、遷移区間をカウントするタイマと、中継側復号化手段の内部状態と中継側符号化手段の内部状態とを比較する比較手段と、タイマのカウント値および比較手段の比較結果に基づいて遷移区間の終了タイミングを判定する判定手段とを更に備え、中継側音声符号生成手段では、判定手段の判定結果に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【0041】請求項11において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、無音区間の背景雑音を模したディジタル信号を疑似音声として生成していることを特徴とする。
【0042】請求項12において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする。
【0043】請求項13において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、ランダム信号発生器であることを特徴とする。
【0044】請求項14において、原音声信号の無音区間の開始を示す同期信号を送信端から中継ノードに伝送させる同期信号伝送手段を更に備え、中継ノードは、同期信号を受信して、送信側背景雑音生成手段と中継側背景雑音生成手段とを同期させていることを特徴とする。
【0045】請求項15において、送信端は、原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、中継ノードは、識別パターンを認識して、送信側背景雑音生成手段と中継側背景雑音生成手段とを同期させていることを特徴とする。
【0046】請求項16の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、擬似背景雑音発生用の第1のパラメータ信号を生成する送信側パラメータ生成手段と、第1のパラメータ信号に基づく内部状態を保持しつつ原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、擬似背景雑音発生用の第2のパラメータ信号を生成する中継側パラメータ生成手段と、第2のパラメータ信号に基づいて擬似符号を生成する中継側符号化手段と、第1の音声符号の無音区間に擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0047】請求項17において、送信側パラメータ生成手段及び中継側パラメータ生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする。
【0048】請求項18において、送信側パラメータ生成手段及び中継側パラメータ発生手段は、ランダム符号発生器であることを特徴とする。
【0049】請求項19において、送信端は、原音声信号の無音区間の開始を示す同期信号を送出する同期信号送出手段を更に備え、中継ノードは、同期信号を受信して、送信側パラメータ生成手段及び中継側パラメータ発生手段とを同期させていることを特徴とする。
【0050】請求項20において、送信端は、原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、中継ノードは、識別パターンを認識して、送信側パラメータ生成手段及び中継側パラメータ発生手段とを同期させていることを特徴とする。
【0051】
【発明の実施の形態】以下、本発明に係る音声符号化伝送システムの好適な実施形態について添付図面を参照して説明する。
【0052】実施の形態1.図1は、実施の形態1に係る音声符号化伝送システムの構成を示すブロック図である。図1において、10は原音声信号の有音区間を符号化すると共に無音圧縮して生成された第1の音声符号を伝送路A(第1の伝送路)に出力する送信端、20は伝送路Aから受信した第1の音声符号に基づいて、原音声信号の無音区間に対応する音声符号を補間して生成された第2の音声符号を伝送路B(第2の伝送路)に出力する中継ノード、30は伝送路Bから受信した第2の音声符号を復号処理して原音声信号を再生する受信端である。
【0053】また、101は入力された音声信号を所定のアルゴリズムに基づいて高能率符号化する符号器(送信側符号化手段)、103は送信端1の動作モードを制御するための制御信号1Aを出力する音声検出器、104は符号器101で符号化された音声符号を圧縮して、第1の音声符号を生成する切替スイッチ(送信側音声符号生成手段)、105は原音声信号の無音区間に背景雑音信号(第1の擬似信号)を挿入する切替スイッチ(送信側背景雑音挿入手段)、106はこの背景雑音信号を擬似的に発生させる擬似背景雑音生成部(送信側背景雑音生成手段)である。
【0054】さらに、201は入力された音声信号を所定のアルゴリズムに基づいて高能率符号化する符号器(中継側符号化手段)、202は送信端10から送られた第1の音声符号を復号化する復号器(中継側復号化手段)、204は復号器202で復号化された音声信号の無音区間に背景雑音信号(第2の擬似信号)を挿入する切替スイッチ(中継側背景雑音挿入手段)、206はこの背景雑音信号を擬似的に発生させる擬似背景雑音生成部(中継側背景雑音生成手段)である。
【0055】さらにまた、207は伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて制御信号を出力する有/無音情報抽出部、209は遅延器、214は符号器201で符号化された音声符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する切替スイッチ(中継側音声符号生成手段)、205は符号器201で符号化された音声符号を用いて、第1の音声符号の無音区間を補間する切替スイッチ、302は第2の音声符号を復号化する復号器である。
【0056】なお、擬似背景雑音生成部106,206は、無音区間の背景雑音を模したディジタル信号を擬似音声として生成していることが望ましい。
【0057】次に、この音声伝送システムの動作について説明する。送信端10は原音声信号を高能率に符号化した音声符号を生成する。この音声符号は、音声検出器103の判定結果により、有音区間では伝送路Aに送出され、無音区間では伝送路Aに送出されない。このように、送信端10ではいわゆる無音圧縮が行われており、伝送路Aは無音圧縮された音声符号の伝送路である。一方、受信端30が接続された伝送路Bは、無音圧縮されていない音声符号が伝送される伝送路である。そして、中継ノード20はこれら2つの伝送路を接続して、送信端10からの音声符号を伝送路Aから受け取り、無音区間の擬似音声符号を挿入して伝送路Bに出力する。受信端30はこの音声符号を復号して音声信号を出力する。
【0058】送信端10において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端10の動作モードを制御するための制御信号1Aを出力する。音声検出器103で「有音」と判定された場合には、切替スイッチ105を105B側に、切替スイッチ104を104B側に倒す。これにより、送信端10に入力された原音声信号は符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0059】一方、音声検出器103で「無音」と判定された場合は、切替スイッチ105を105A側に、切替スイッチ104を104A側に倒す。これにより、擬似背景雑音生成部106から出力された擬似背景雑音信号が符号器101に入力される。但し、符号器101の出力である擬似背景雑音信号が符号化された信号は、切替スイッチ104によって遮断されるため、伝送路Aには何も出力されない。
【0060】ここで、擬似背景雑音生成部106について説明する。音声検出器103の判定が「有音」から「無音」に遷移するタイミングで、音声検出器103は、擬似背景雑音生成部106の初期化を制御するための初期化信号1Bを出力する。擬似背景雑音生成部106にはこの初期化信号1Bが入力され、擬似背景雑音生成部106は初期化信号1Bの入力タイミングで内部状態をリセットする。この動作は、以下に述べる中継ノード20における擬似背景雑音生成部206と同期した動作を実現するために必須である。
【0061】中継ノード20では、送信端10から無音圧縮されて送出され、伝送路Aを介して伝送された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの第1の音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ204,205,214を制御するための制御信号2Aを出力する。即ち、伝送路Aから音声符号が入力された場合は、有音区間と判定して、切替スイッチ204を204B側に、切替スイッチ205を205B側に、切替スイッチ214を214B側にそれぞれ倒す。
【0062】中継ノード20で受信した第1の音声符号は、遅延器209及びスイッチ214を経由してそのまま伝送路Bにリレーされる。また第1の音声符号は、スイッチ205を経由して復号器202にも与えられる。復号器202は入力された第1の音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ204を経由して符号器201に供給される。符号器201は入力された音声信号に基づいて符号化処理を実行する。
【0063】ここで、送信端10の符号器101と、中継ノード20の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質は極めて近似したものである。従って、音声信号の性質を数値化したものに相当する送信端10の符号器101の内部状態と、中継ノード20の符号器201の内部状態とは、極めて近似したものとなる。
【0064】一方、有/無音情報抽出部207において、伝送路Aからの信号の受信が検知されなかったとき、即ち「無音」と判定された区間においては、切替スイッチ204を204A側に、切替スイッチ205を205A側に、切替スイッチ214を214A側に、それぞれ倒す。
【0065】擬似背景雑音生成部206の出力信号は、スイッチ204を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づいて符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、スイッチ214を経由して伝送路Bに送出される。
【0066】この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。ここで、遅延器209は有/無音情報抽出部207における処理および符号器201における処理に掛かる時間だけ、伝送路Aから受信して伝送路Bに送出される音声符号を遅延させている。この遅延動作によって、遅延器209から出力される有声区間の音声符号と、符号器201から出力される擬似背景雑音符号との同期が実現される。
【0067】また、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207は、擬似背景雑音生成部206の初期化を制御するための初期化信号2Bを出力する。擬似背景雑音生成部206にはこの初期化信号2Bが入力され、擬似背景雑音生成部206は初期化信号2Bの入力タイミングで内部状態をリセットする。
【0068】なお、擬似背景雑音生成部206は、送信端10の擬似背景雑音生成部106と同一の動作を実現するものであり、上述した初期化動作についても、送信端10の擬似背景雑音生成部106と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端10の音声検出器103の判定信号に同期して行われるため、送信端10の符号器101と中継ノード20の符号器201とは、同じタイミングで同一の擬似背景雑音信号が供給されることになる。
【0069】さらに、有音区間において、送信端10の符号器101の内部状態と中継ノード20の符号器201の内部状態とはほぼ一致しているため、無音区間においてこれらの符号器101,201から出力される擬似背景雑音符号も極めて近似した値を取ることができる。
【0070】また、符号器201から出力された擬似背景雑音符号は、切替スイッチ205を経由して復号器202にも供給される。復号器202は入力された擬似背景雑音符号を基に復号処理を実行する。この動作により、送信端10の符号器101の内部状態と、中継ノード20の復号器202の内部状態とは常に同一に保持される。このため、再び「有音」と判定され、復号器202に伝送路Aからの音声符号が入力されても、内部状態が送受で一致しているため、音声の復号を正常に実現することができる。
【0071】受信端30では、中継ノード20から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0072】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端10の符号器101の出力であるため、有音区間においては、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において受信端30に入力される第2の音声符号は、中継ノード20の符号器201の出力であるため、中継ノード20の符号器201の内部状態と、受信端30の復号器302の内部状態とは一致する。上述したように、無音区間においても送信端10の符号器101の内部状態と、中継ノード20の符号器201の内部状態とを一致させているため、受信端30からの見掛け上、あたかも送信端10から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0073】以上述べた通り、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態との一致が常に図られているため、内部状態の不整合に起因して耳障りな音声が復号されるおそれは回避される。
【0074】実施の形態2.次に、実施の形態2について、図2を参照しながら説明する。本実施の形態は、実施の形態1の音声符号化伝送システムにおける中継ノード20に改良を加えて中継ノード21としたものである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0075】中継ノード21は、送信端10から無音圧縮されて送出され、伝送路Aを介して伝送された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ214を制御する制御信号2Aを出力する。
【0076】即ち、伝送路Aから音声符号が入力された場合は、有音区間と判定して、切替スイッチ214を214B側に倒す。中継ノード21で受信した第1の音声符号は、スイッチ214を経由してそのまま伝送路Bにリレーされる。また第1の音声符号は、同時に復号器202にも供給される。復号器202は入力された第1の音声符号に基づき復号処理を実行する。
【0077】ここで、送信端10の符号器101と、中継ノード21の復号器202とでは、有音部については共に同一の音声符号に基づいた適応処理がなされるため、送信端符号器101の内部状態と、中継符号器201の内部状態とは、一致した値に保たれている。
【0078】次に、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207は、擬似背景雑音生成部206の初期化を制御する初期化信号2Bを出力する。擬似背景雑音生成部206は、この初期化信号2Bを受信したタイミングで内部状態をリセットし、擬似背景雑音信号の送出を開始する。
【0079】なお、擬似背景雑音生成部206は、送信端10の擬似背景雑音生成部106と同一の動作を実現するものであり、上記初期化動作についても、送信端10の擬似背景雑音生成部106と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端10の音声検出器103の判定信号に同期して行われるため、送信端10の符号器101、及び中継ノード21の符号器201へは、同じタイミングで同一の擬似背景雑音信号を供給することができる。
【0080】同時に、初期化信号2Bは符号器201及び復号器202にも供給される。初期化信号2Bを受信した復号器202は、内部パラメータを符号器201に送出し、動作を停止する。符号器201は、初期化信号2Bにより復号器202から内部パラメータを受取り、これに基づいて、擬似背景雑音生成部206から供給される擬似背景雑音信号の符号化処理を開始する。
【0081】ここで、有音区間において、送信端10の符号器101と中継ノード21の復号器202とで一致させた内部状態が、中継ノード21の符号器201にそのまま継承されているため、互いに直接情報のやり取りがないにも係わらず、無音区間において、送信端10の符号器101と中継ノード21の符号器201との両者から出力される擬似背景雑音符号は一致する。
【0082】有/無音情報抽出部207において、伝送路Aからの信号が「無音」と判定された区間においては、切替スイッチ214を214A側に倒す。擬似背景雑音生成部206の出力信号を受けて、符号器201から出力された擬似背景雑音符号は、スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。
【0083】最後に、有/無音情報抽出部207の判定が「無音」から「有音」に遷移するタイミングで、有/無音情報抽出部207から、制御信号2Cを出力する。制御信号2Cを受信した符号器201は、内部パラメータを復号器202へ送出し、動作を停止する。復号器202は、制御信号2Cにより符号器201から内部パラメータを受け取り、これに基づいて、伝送路Aから受信した第1の音声符号の復号処理を開始する。これらの一連の動作により、無音区間で送信端10の符号器101と中継ノード21の復号器202との間で情報のやり取りがなかったにも係わらず、内部状態は同一に保たれているため、復号処理を正常に再開することができる。
【0084】受信端30では、中継ノード21から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0085】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端10の符号器101の出力であるため、有音区間においては、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において受信端30に入力される第2の音声符号は中継ノード21の符号器201の出力であるため、中継ノード21の符号器201の内部状態と、受信端30の復号器302の内部状態とは一致する。
【0086】上記で説明したように、無音区間においても送信端10の符号器101の内部状態と、中継ノード21の符号器201の内部状態とを一致させているため、受信端30からの見掛け上、あたかも送信端10から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0087】以上述べた通り、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード21において符号器201が動作するのは無音区間のみであり、復号器202が動作するのは有音区間のみであるため、これらが同時に処理を実行することはなく、プロセッサの負荷削減によるコストの低減および消費電力の低減が実現される。
【0088】実施の形態3.次に、実施の形態3について、図3,4を参照しながら説明する。本実施の形態は、実施の形態1の音声符号化伝送システムにおいて、その中継ノード20に改良を加えて中継ノード22としたものである。ここで、208は送信端10から送られた第1の音声符号を符号化すると共に背景雑音信号(第2の擬似信号)を符号化する補間信号発生器(補間信号生成手段)である。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0089】中継ノード22は、送信端10から無音圧縮されて送出され、伝送路Aを介して伝送された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ214を制御する制御信号2Aを出力する。また、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207から、擬似背景雑音生成部206の初期化を制御する初期化信号2Bを出力する。
【0090】擬似背景雑音生成部206は、この初期化信号2Bを受信したタイミングで内部状態をリセットし、擬似背景雑音信号の送出を開始する。なお、擬似背景雑音生成部206は、送信端10の擬似背景雑音生成部106と同一の動作を実現するものであり、上記初期化動作についても、送信端10の擬似背景雑音生成部106と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端音声検出器103の判定信号に同期して行われるため、送信端10の符号器101、及び補間信号発生器208には、同じタイミングで同一の擬似背景雑音信号が供給される。ここまでの動作は、実施の形態1とほぼ同一である。
【0091】次に、補間信号発生器208の具体的な構成について、図4を参照しながら説明する。同図に示す補間信号発生器208は、高能率音声符号化方式にITU勧告G.728を適用したものである。図4と図21とを比較して判る通り、これはITU勧告G.728に基づく符号器に切替スイッチ421,422,423が追加されたものである。
【0092】ITU勧告G.728 LD-CELP方式や、同G.729 CS-ACELP方式に代表される「合成による分析」に基づく音声符号化方式においては、最適な音声符号の選択のために、想定される音声符号の候補全てに対して復号処理を行い、これらを入力された音声信号と逐一比較すると共に、入力音声信号に最も近似した合成信号を選択し、その合成信号の基となった音声符号を最適符号として復号器に伝送する。この方式の符号器は、この復号処理を実現するために、通常ローカルデコーダと呼ばれる復号器に相当する機能を備えている。そして、図4に示す機能ブロック420は、ローカルデコーダに相当する部分である。
【0093】有/無音情報抽出部207において、伝送路Aからの信号が「有音」と判定された区間においては、制御信号2Aにより、切替スイッチ421を421B側に、切替スイッチ422を422B側に、切替スイッチ423を423B側に、それぞれ倒す。この時、ローカルデコーダ部420は伝送路Aからの信号を入力として、通常の復号動作を行う。
【0094】この動作の目的は、バックワード型利得適応部410およびバックワード型合成フィルタ適応部411を動作させて、利得乗算器404および合成フィルタ405の内部状態を、送信端符号器101の内部状態と常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。
【0095】ここで、合成フィルタ405の出力経路、即ち復号された音声信号の出力経路はスイッチ423で遮断されているため、このローカルデコーダ420の出力は、他の機能ブロックから参照されることはない。また、補間信号発生器208において、ローカルデコーダ420以外の機能ブロック、即ちPCM伸長部401、ベクトルバッファ部402、加算器406、聴覚重み付けフィルタ407および最小自乗誤差探索部408は、入力すべき信号がないため停止状態を保持する。
【0096】有/無音情報抽出部207において、伝送路Aからの信号が無音区間と判定された区間においては、制御信号2Aにより、切替スイッチ421を421A側に、切替スイッチ422を422A側に、切替スイッチ423を423A側に、それぞれ倒す。この時の補間信号発生器208の構造は、符号器の構造と全く同一となる。その動作も、符号器のそれと全く同一である。即ち、疑似背景雑音発生部206から出力される疑似背景雑音信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、補間信号発生器208から出力する。
【0097】ここで、有音区間において利得乗算器404および合成フィルタ405の内部状態は、送信端符号器101の内部状態と一致させており、また、無音区間においても疑似背景雑音生成部206から入力される信号は、送信端10の疑似背景雑音生成部106と全く同一であるため、補間信号発生器208から出力される疑似背景雑音符号は、送信端符号器101から出力される(但し切替スイッチ104により伝送路Aには出力されない)疑似背景雑音符号と全く同一となる。これら一連の動作により、無音区間において送信端符号器101と、補間信号発生器208とは、直接信号のやり取りがなかったにも係わらず、内部状態の一致は常に保たれている。
【0098】受信端30では、中継ノード22から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0099】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端10の符号器101の出力であるため、有音区間においては、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において、受信端30に入力される第2の音声符号は補間信号発生器208の出力であるため、補間信号発生器208の内部状態と、受信端復号器302の内部状態とは一致する。
【0100】上記で説明したように、無音区間においても送信端符号器101の内部状態と、補間信号発生器208の内部状態を一致させているため、受信端30からの見掛け上、あたかも送信端10から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0101】以上述べた通り、送信端符号器101の内部状態と、受信端復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード22において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0102】実施の形態4.次に、実施の形態4について、図5を参照しながら説明する。本実施の形態において、実施の形態1の音声符号化伝送システムにおける送信端10および中継ノード20に改良を加えて、送信端11および中継ノード23としたものである。
【0103】ここで、102は符号器101で高能率符号化された音声符号を音声信号に復号する復号器(送信側復号化手段)、112は疑似背景雑音信号が高能率符号化方式で符号化された符号(第1の擬似信号)を発生させる擬似背景雑音生成部(送信側背景雑音生成手段)、114は復号器102への入力を切り替えるスイッチ、212は疑似背景雑音信号が高能率符号化方式で符号化された符号(第2の擬似符号)を発生させる擬似背景雑音生成部(中継側背景雑音生成手段)である。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0104】この音声伝送システムは、上記実施の形態1に係る音声符号化伝送システムにおける中継ノード20に実施した改良を、送信端11に適用することによって、上記課題を解決した高品質な音声伝送を可能とする音声符号化伝送システムを構築しようとするものである。
【0105】次に、本実施の形態に係る音声符号化伝送システムの動作について説明する。送信端11において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端11の動作モードを制御する制御信号1Aを出力する。音声検出器103で「有音」と判定された場合は、切替スイッチ114を114B側に、切替スイッチ105を105B側に、切替スイッチ104を104B側に、それぞれ倒す。これにより、送信端11に入力された音声信号は、切替スイッチ105を経由して符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0106】また同時に、符号器101から出力された入力音声が高能率符号化された音声符号は、切替スイッチ114を経由して復号器102にも供給される。復号器102は、符号器101からの音声信号を入力として、通常の復号動作を行う。この動作の目的は、復号器102の内部状態を、送信端符号器101の内部状態と常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。そして、得られた復号音声信号が他の機能ブロックに出力されるのを阻止するように、切替スイッチ115が切り替えられる。
【0107】音声検出器103の判定が「有音」から「無音」に遷移するタイミングで、音声検出器103は、擬似背景雑音生成部112の初期化を制御する初期化信号1Bを出力する。擬似背景雑音生成部112は、この初期化信号1Bを受信したタイミングで内部状態をリセットする。この動作は、実施の形態1で説明したものと全く同一目的でなされるものである。
【0108】音声検出器103で「無音」と判定された場合は、切替スイッチ114を14A側に、切替スイッチ105を105A側に、切替スイッチ104を104B側に、それぞれ倒す。これにより、擬似背景雑音生成部112から出力された擬似背景雑音符号は、切替スイッチ114を経由して復号器102に入力され、復号処理された後、得られた復号擬似背景雑音信号は切替スイッチ105を経由して、符号器101に出力される。符号器101は、復号器102で復号された擬似背景雑音信号を入力として、通常の符号化動作を行う。この動作の目的は、符号器101の内部状態を、復号器102の内部状態と常に一致した状態に保つためにあり、符号化された音声信号を得るためではない。そして、得られた音声符号が伝送路Aに出力されるのを阻止するように、切替スイッチ104が切り替えられる。これら一連の動作により、符号器101の内部状態と、復号器102の内部状態は、常に一致した状態に保たれる。
【0109】ここで、符号器101と復号器102とでは、入力される信号にそれぞれ、原音声信号と、符号器101でいったん符号化された音声符号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する符号器101の内部状態と、復号器102の内部状態とは、極めて近似した値に保持される。
【0110】中継ノード23は、送信端11から伝送路Aを介して伝送された無音圧縮された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの第1の音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ214を制御する制御信号2Aを出力する。即ち、伝送路Aから第1の音声符号が入力された場合は、有音区間と判定して、切替スイッチ214を214B側に倒す。中継ノード23で受信した第1の音声符号は、スイッチ214を経由してそのまま伝送路Bにリレーされる。
【0111】一方、有/無音情報抽出部207において、伝送路Aからの信号の受信が検知されなかったとき、即ち「無音」と判定された区間においては、制御信号2Aによって、切替スイッチ214を214A側に倒す。擬似背景雑音信号が符号化されたデータが補充され、伝送路Bに出力される。勿論、実施例1と同様に、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207から、擬似背景雑音生成部212の初期化を制御する初期化信号2Bを出力する。擬似背景雑音生成部212は、この初期化信号2Bを受信したタイミングで状態をリセットする。
【0112】受信端30では、中継ノード23から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0113】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端11の符号器101の出力であるため、有音区間においては、送信端11の符号器101の内部状態と、受信端30の復号器302の内部状態は一致する。また、無音区間において受信端30に入力される第2の音声符号は中継ノード23の擬似背景雑音生成部212の出力である。先に説明したように、中継ノード23の擬似背景雑音生成部212の出力は、送信端11の擬似背景雑音生成部112の出力と一致しているため、受信端30からの見掛け上、あたかも送信端11から無音圧縮されていない擬似背景雑音符号を直接受信しているかの如き効果を得ることができる。
【0114】しかも、「無音」から「有音」に遷移し復号器302に入力される第2の音声符号が符号器101の出力信号に切り替わっても、送信端11の符号器101の内部状態と、受信端30の復号器302の内部状態は極めてよく一致しているため、復号器302から出力される信号から、内部状態の相違による異音の発生を防止することができる。
【0115】以上述べた通り、送信端11の符号器101の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。また、中継ノード23において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0116】実施の形態5.次に、実施の形態5について、図6を参照しながら説明する。本実施の形態は、実施の形態4で示した送信端11に対して、実施の形態2で示した中継ノード21における改良を加えて送信端12としたものである。なお、実施の形態4と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0117】送信端12において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端12の動作モードを制御する制御信号1Aを出力する。音声検出器103で「有音」と判定された場合は、切替スイッチ104を104B側に倒す。これにより、送信端12に入力された音声信号は、符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0118】次に、音声検出器103の判定が「有音」から「無音」に遷移するタイミングで、音声検出器103は、擬似背景雑音生成部112の初期化を制御する初期化信号1Bを出力する。擬似背景雑音生成部112は、この初期化信号1Bを受信したタイミングで内部状態をリセットし、擬似背景雑音符号(第1の擬似符号)の送出を開始する。
【0119】なお、擬似背景雑音生成部112は、中継ノード23の擬似背景雑音生成部212と同一の動作を実現するものであり、上記初期化動作についても、中継ノード23の擬似背景雑音生成部212と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端12の音声検出器103の判定信号に同期して行われるため、送信端12の復号器102、及び中継ノード23の切替スイッチ214へは、同じタイミングで同一の擬似背景雑音符号を供給することができる。
【0120】同時に、初期化信号1Bは符号器101及び復号器102にも供給される。初期化信号1Bを受信した符号器101は、内部パラメータを復号器102に送出し、動作を停止する。復号器102は、初期化信号2Bにより符号器101から内部パラメータを受取り、これに基づいて、擬似背景雑音生成部112から供給される擬似背景雑音符号の復号化処理を開始する。
【0121】最後に、音声検出器103の判定が「無音」から「有音」に遷移するタイミングで、音声検出器103から、制御信号1Cを出力する。制御信号1Cを受信した復号器102は、内部パラメータを符号器101へ送出し、動作を停止する。符号器101は、制御信号1Cにより復号器102から内部パラメータを受取り、これに基づいて、原音声信号の符号化処理を開始する。これらの一連の動作により、符号器101の内部状態と、復号器102の内部状態とは、常に一致した状態に保たれるため、符号化処理を正常に再開することができる。
【0122】中継ノード23においては、実施の形態4で示した動作と同一の動作を行う。さらに、受信端30では、中継ノード23から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0123】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端12の符号器101の出力であるため、有音区間においては、送信端12の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において受信端30に入力される第2の音声符号は中継ノード23の擬似背景雑音生成部212の出力である。先に説明したように、中継ノード23の擬似背景雑音生成部212の出力は、送信端12の擬似背景雑音生成部112の出力と一致しているため、受信端30からの見掛け上、あたかも送信端12から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0124】以上述べた通り、送信端12の符号器101の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、送信端12において符号器101が動作するのは無音区間のみであり、復号器102が動作するのは有音区間のみであるため、これらが同時に処理を実行することはなく、プロセッサの負荷削減によるコストの低減および消費電力の低減が実現される。また、中継ノード23において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0125】実施の形態6.次に、実施の形態6について、図7,8を参照しながら説明する。本実施の形態は、実施の形態4で示した送信端11に対して、実施の形態3で示した中継ノード22における改良を加えて送信端13としたものである。ここで、108は実施の形態3における補間信号発生器208と同等の機能を有する内部状態保持機能付き符号器(送信側符号化手段)である。なお、実施の形態4と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0126】まず、内部状態保持機能付き符号器108の動作を、図8を参照しながら説明する。これは、内部状態保持機能付き符号器108の具体的な構成を示すため、一例として高能率音声符号化方式にITU勧告G.728を適用したものである。図8と図4とを比較して判る通り、これは実施の形態3における補間信号発生器208の構造と何ら変わる点はない。このため、各機能ブロックの説明は省略する。
【0127】次に、図7を用いて、実施の形態6の音声伝送システムの動作について説明する。音声検出器103において、伝送路Aからの信号が「有音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421B側に、切替スイッチ422を422B側に、切替スイッチ423を423B側に、それぞれ倒す。この時の内部状態保持機能付き符号器108の構造および動作は、実施の形態1における符号器101の構造および動作と同一である。即ち、入力された原音声信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、内部状態保持機能付き符号器108から出力する。この出力信号が伝送路Aに送出される。
【0128】音声検出器103において、伝送路Aからの信号が「無音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421A側に、切替スイッチ422を422A側に、切替スイッチ423を423A側に、それぞれ倒す。ローカルデコーダ部420は擬似背景雑音生成部112からの信号を入力として、通常の復号動作を行う。この動作の目的は、バックワード型利得適応部410、及びバックワード型合成フィルタ適応部411を動作させて、利得乗算器404、合成フィルタ405の内部状態を、受信端復号器302の内部状態と、常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。
【0129】ここで、合成フィルタ405の出力、即ち復号された音声信号の出力経路はスイッチ423で遮断されているため、このローカルデコーダ420の出力は、他の機能ブロックから参照されることはない。また、内部状態保持機能付き符号器108において、ローカルデコーダ420以外の機能ブロック、即ちPCM伸長部401、ベクトルバッファ部402、加算器406、聴覚重み付けフィルタ407、最小自乗誤差探索部408は、入力すべき信号がないため停止させておく。
【0130】中継ノード23においては、実施の形態4で示した動作と同一の動作を行う。さらに、受信端30では、中継ノード23から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0131】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端13の内部状態保持機能付き符号器108の出力であるため、有音区間においては、送信端13の内部状態保持機能付き符号器108の内部状態と、受信端30の復号器302の内部状態は一致する。また無音区間において受信端30に入力される第2の音声符号は、中継ノード23の擬似背景雑音生成部212の出力である。これは送信端13の擬似背景雑音生成部112の出力と同一であるため、送信端13の内部状態保持機能付き符号器108の内部状態と、受信端30の復号器302の内部状態は一致する。以上のように、受信端30からの見掛け上、あたかも送信端13から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0132】以上述べた通り、送信端13の内部状態保持機能付き符号器108の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード23において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0133】実施の形態7.次に、実施の形態7について、図9〜11を参照しながら説明する。本実施の形態は、実施の形態6で示した送信端13に対して、実施の形態3で示した中継ノード22における改良を加えて、送信端14としたものである。また、実施の形態6で示した中継ノード23に改良を加えて、中継ノード24としたものである。
【0134】ここで、110は実施の形態6における送信端13の内部状態保持機能付き符号器108に改良を加えた内部状態保持機能付き符号器(送信側符号化手段)、111は擬似背景雑音発生用パラメータ生成部(送信側パラメータ生成手段)、211は擬似背景雑音発生用パラメータ生成部(中継側パラメータ生成手段)、210は実施の形態6における符号器の一部機能を有する簡易符号器である。なお、実施の形態6と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0135】まず、内部状態保持機能付き符号器110の動作を、図10を参照しながら説明する。これは、内部状態保持機能付き符号器110の具体的な構成を示すため、一例として高能率音声符号化方式にITU勧告G.728を適用したものである。図10と図8とを比較して判る通り、これは実施の形態6における内部状態保持機能付き符号器108の構造と、切替スイッチ421の位置が異なる以外はほぼ同一である。このため、各機能ブロックの説明は省略する。
【0136】また、符号化方式にITU勧告G.728 LD-CELP方式を用いた場合、擬似背景雑音発生用パラメータ生成部111から出力される信号の一つの例として、合成フィルタ駆動のための励振信号を用いる。LD-CELP音声符号化方式に基づく復号器においては、丁度人間の発生機構をモデル化した構造となっている。即ち人間の声帯音源に相当する励振信号を駆動源として用い、人間の声道情報をモデル化した合成フィルタによって調音し、音声を合成する構造となっている。音声符号として、励振信号をベクトル量子化した波形コードブックを用いている。擬似背景雑音発生用パラメータ生成部111は、量子化される前の励振信号を何らかの手段で発生させる機能ブロックである。
【0137】次に、図9を用いて、実施の形態7の音声伝送システムの動作について説明する。音声検出器103において、音声信号が「有音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421B側に、切替スイッチ422を422B側に、切替スイッチ423を423B側に、それぞれ倒す。この時の内部状態保持機能付き符号器110の構造および動作は、実施の形態1における通常の符号器101の構造および動作と同一となる。即ち、入力された原音声信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、内部状態保持機能付き符号器110から出力する。この出力信号が伝送路Aに送出される。
【0138】音声検出器103において、音声信号が「無音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421A側に、切替スイッチ422を422A側に、切替スイッチ423を423A側に、それぞれ倒す。ローカルデコーダ部420は擬似背景雑音発生用パラメータ生成部111から出力される励振信号(第1のパラメータ信号)を入力とし、この信号を用いて復号動作を行う。この復号処理は通常の復号処理から丁度逆量子化手段403を飛ばしたものと同じである。
【0139】この動作の目的は、バックワード型利得適応部410、及びバックワード型合成フィルタ適応部411を動作させて、利得乗算器404、合成フィルタ405の内部状態を、受信端復号器302の内部状態と、常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。そして、合成フィルタ405の出力、即ち復号された音声信号の出力経路はスイッチ423で遮断されているため、このローカルデコーダ420の出力は、他の機能ブロックから参照されることはない。また、内部状態保持機能付き符号器110において、ローカルデコーダ420以外の機能ブロック、即ちPCM伸長部401、ベクトルバッファ部402、加算器406、聴覚重み付けフィルタ407、最小自乗誤差探索部408は、入力とすべき信号がないため停止させておく。
【0140】中継ノード24において、送信端14と同じ擬似背景雑音発生用パラメータ生成部211を備えており、送信端14の擬似背景雑音発生用パラメータ生成部111と、同期して動作する。この方法は、実施の形態1における擬似背景雑音生成部106,206と同様な手法を用いることによって実現される。中継ノード24において欠落した無音区間の音声符号を補間するため、擬似背景雑音発生用パラメータ生成部211から出力された励振信号(第2のパラメータ信号)を符号化する機能を有する簡易符号器210によって、擬似背景雑音符号が補間される。
【0141】次に、簡易符号器210の構造を図11に示す。ベクトルバッファ431において時間的に連続する励振信号を5サンプル分蓄積してベクトル化し、加算器434に出力する。一方、波形コードブックに蓄積されたすべての符号の候補について逆量子化器432において逆量子化を行って励振信号の候補を生成する。これら励振信号候補のすべてに対して加算器434に入力し、入力された励振信号との自乗誤差をとり、その中からもっとも近似した励振信号候補を生成した符号を、最適符号として出力する。これにより、LD-CELP方式に基づく符号と同等の擬似背景雑音符号を生成することができる。
【0142】さらに、受信端30では、中継ノード24から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0143】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端14の内部状態保持機能付き符号器110の出力であるため、有音区間においては、送信端14の内部状態保持機能付き符号器110の内部状態と、受信端30の復号器302の内部状態は一致する。また無音区間において受信端30に入力される第2の音声符号は、中継ノード24の擬似背景雑音発生用パラメータ生成部211の出力である。これは送信端14の擬似背景雑音発生用パラメータ生成部111の出力と同一であるため、送信端14の内部状態保持機能付き符号器110の内部状態と、受信端30の復号器302の内部状態は一致する。以上のように、受信端30からの見掛け上、あたかも送信端14から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0144】以上述べた通り、送信端14の内部状態保持機能付き符号器110の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード24において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0145】実施の形態8.以下、実施の形態8について、図12〜14を参照しながら説明する。本実施の形態において、実施の形態1の音声符号化伝送システムにおける送信端10および中継ノード20に改良を加えて、送信端15および中継ノード25としたものである。ここで、213は送信端15から出力された第1の音声信号が「無音」から「有音」に切り替わった直後の遷移区間をカウントするタイマである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0146】次に、実施の形態8の動作を説明する。送信端15において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端15の動作モードを制御する制御信号1Aを出力する。音声検出器103で「有音」と判定された場合は、切替スイッチ104を104B側に倒す。これにより、送信端15に入力された原音声信号は符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0147】一方、音声検出器103で「無音」と判定された場合は、切替スイッチ104を104A側に倒す。このとき、符号器101から出力される音声符号は切替スイッチ104で遮断され、伝送路Aには何も出力されない。また、「無音」状態から「有音」状態へ遷移したことを音声検出器103が検出したタイミングで、符号器101を初期化するための初期化信号1Bを符号器へ出力する。符号器101はこの初期化信号1Bを受信したタイミングで、内部状態の初期化動作を実行する。
【0148】本実施の形態に関し、中継ノード25の動作は、有/無音情報抽出部207から出力される制御信号の状態によって、3つのモードを有している。この動作モードについて、図13に基づいて説明する。図13は送信端15の符号器101に入力される原音声信号の波形図である。縦軸は信号レベル、横軸は時間を表している。有音/無音情報抽出部207は、送信端15の音声検出器103の動作を反映する伝送路Aからの音声符号の受信状況を常に監視し、その結果動作モードに対応した3つの区間に区分し、中継ノード25の動作を制御する。
【0149】第1に、中継ノード25に人力された高能率音声符号から、トークスパートが検出されない期間(無音区間)をモード1とする。第2に、中継ノード25に入力された高能率音声符号から、トークスパートが検出され始めてから数10msec〜数100msecの間(遷移期間、又は過渡期間と称する)をモード2とする。第3に、モード2以降、引続きトークスパートが検出される間をモード3とする。有音/無音情報抽出部207、及びタイマ213は、以上述べた動作モード判定結果を反映した制御信号2A,2Fを出力し、中継ノード25の各機能ブロックに供給する。
【0150】ここで、モード2の継続時間(遷移期間)として数10msec〜100msecという値を提示したが、この値の根拠は以下の経験則によっている。まず前提条件として、高能率符号化方式としてITU勧告G.728(LD-CELP方式)を用い、中継ノード25の符号器201の内部状態と、受信端30の復号器302の内部状態とが全く異なっているものとする。この前提条件の基で符号器201と復号器302とで伝送路を介して符号化/復号を行う。LD-CELP方式で使用するフィルタはすべて安定性が保証されているので、送受の内部状態は送受で同一になる方向に次第に収束していく。
【0151】そのまま符号化/復号を継続する内、異音の発生するおそれがなくなる程度にまで内部状態が十分一致する。モード遷移から内部状態の十分一致するまでに要する時間が、数10msec〜100msecである。もちろん、使用する高能率符号化方式によって、この値は変化することが予想されることはいうまでもなく、それぞれの符号化方式に応じた遷移期間の設定を行うことは重要である。
【0152】図14は、以上説明した各モードの遷移をまとめたモード遷移図である。3つのモード間の遷移は、矢印で示した方向のみ許されており、それ以外の遷移は禁止された遷移であるか、または物理的にあり得ない遷移である。
【0153】次に、各モード別に中継ノード25の動作を説明する。まず、モード1、即ち有音/無音情報抽出部207において「無音」と判定された区間においては、切替スイッチ205を205A側に、切替スイッチ214を214Aに、それぞれ倒す。この時、擬似背景雑音生成部206側の出力信号は、切替スイッチ205を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、切替スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器202は入力信号を失うため、動作を停止させる。
【0154】モード1からモード2に遷移するとき、即ち、有音/無音情報抽出部207において、音声符号が検知されはじめたとき、復号器202にリセット信号2Bを発行する。有音/無音情報抽出部207の動作は音声検出器103の動作を忠実に反映していることから、これは送信端15の符号器101の初期化と同期して実行される。
【0155】モード2においては、切替スイッチ205を205Bに倒し、切替スイッチ214は214Aに接続したままとする。中継ノード25で受信した音声符号は、復号器202に供給される。符号器202は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して、符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ214を経由して伝送路Bに出力される。即ち、中継ノード25においてタンデム接続を行ったのと同じ形となる。
【0156】モード3においては、タイマ213からの制御信号2Fを受信した切替スイッチ214が214B側に倒れる。また、切替スイッチ205は205B側に接続したままとする。中継ノード25で受信した音声符号は、切替スイッチ214を経由してそのまま伝送路Bにリレーされる。また当該音声符号は、復号器202にも供給される。復号器202は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。
【0157】ここで、送信端15の符号器101と、中継ノード25の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器101の内部状態と、中継符号器201の内部状態とは、極めて近似した値に保持される。
【0158】本実施の形態において、モード1からいきなりモード3に遷移させた場合について考察する。取り敢えず、送信端符号器101と中継復号器202の内部状態、及び中継符号器201の内部状態と受信端復号器302の内部状態とは、それぞれ一致していることが保障されている。ところが、送信端符号器101と受信端復号器302の内部状態については、その一致については全く保証されない。従ってモード1からモード3に一足飛びに遷移すると、ちょうど従来例で示したディジタル1リンクの形と同様になり、内部状態の不一致に起因する異音発生を引き起こす。ここで、モード1からモード3に遷移する間に遷移区間としてモード2を設けることにより、送信端符号器101の内部状態と受信端復号器302の内部状態とが十分一致するため、この段階でモード3に遷移させても異音の発生を回避することが可能となる。
【0159】この実施の形態に係る音声符号化伝送システムは、音声の品質劣化を引き起こすことが知られているタンデム接続を許す期間を無音状態から有音状態に遷移する過渡期のわずかな時間に制限し、大部分のトークスパートは1リンクの符号化/復号で接続することによって、品質劣化を回避することができ、高能率音声符号化方式の性能をフルに引き出すことが可能となる。また、中継ノードでのプロセッサの処理負荷、及びハードウエア規模の低減が可能となる。なお、本実施の形態では、高能率符号化方式にITU勧告G.728 LD−CELP方式を適用したシステムについて述べたが、本発明の適用例がこの符号化方式に限定されるということを示している訳ではなく、過去の符号化/復号結果を利用する、あらゆる音声符号化方式に適用できることは容易に推察できる。
【0160】実施の形態9.以下、実施の形態9について、図15を参照しながら説明する。本実施の形態において、実施の形態8で示した中継ノード25に対して、タイマ213を比較器(比較手段)215に置き換えて、中継ノード26としたものである。ここで、比較器215は、復号器202の内部状態と符号器201の内部状態とを数値的に比較するものである。なお、実施の形態8と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0161】次に、中継ノード26の動作を説明する。まず、モード1、即ち有音/無音情報抽出部207において「無音」と判定された区間においては、切替スイッチ205を205A側に、切替スイッチ214を214A側に、それぞれ倒す。この時、擬似背景雑音生成部206側の出力信号は、切替スイッチ205を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、切替スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器202は入力信号を失うため、動作を停止させる。
【0162】モード1からモード2に遷移するとき、即ち、有音/無音情報抽出部207において、音声符号が検知されはじめたとき、復号器202にリセット信号2Bを発行する。有音/無音情報抽出部207の動作は音声検出器103の動作を忠実に反映していることから、これは送信端15の符号器101の初期化と同期して実行される。
【0163】モード2においては、切替スイッチ205を205Bに倒し、切替スイッチ214は214Aに接続したままとする。中継ノード25で受信した音声符号は、復号器202に供給される。符号器202は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して、符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ214を経由して伝送路Bに出力される。即ち、中継ノード25においてタンデム接続を行ったのと同じ形となる。
【0164】モード3においては、符号器201の内部パラメータと復号器202の内部パラメータとが比較器215に与えられる。比較器215では、これらの内部パラメータが所定のレベル内で一致しているか判定し、このレベル内で一致している場合に制御信号2Dを切替スイッチ214に出力する。そして、この制御信号2Fを受信した切替スイッチ214が214B側に倒れる。また、切替スイッチ205は205B側に接続したままとする。
【0165】中継ノード25で受信した音声符号は、切替スイッチ214を経由してそのまま伝送路Bにリレーされる。また当該音声符号は、復号器202にも供給される。復号器202は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。
【0166】ここで、送信端15の符号器101と、中継ノード25の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器101の内部状態と、中継符号器201の内部状態とは、極めて近似した値に保持される。
【0167】以上のように、モード2からモード3への遷移タイミングの決定を比較器215の判定結果によって制御することにより、送信端15の符号器101の内部状態と、受信端30の復号器302の内部状態とをより確実に一致させることができ、異音の発生するおそれを更に減少させる効果がある。
【0168】実施の形態10.以下、実施の形態10について、図16を参照しながら説明する。本実施の形態において、実施の形態8で示した中継ノード25に対して、比較器(比較手段)215と判定回路(判定手段)216とを追加して、中継ノード27としたものである。ここで、比較器215は、復号器202の内部状態と符号器201の内部状態とを数値的に比較するものであり、判定回路216は、タイマ213から出力された制御信号2Fと比較器215から出力された制御信号2Dとに基づいて、モード3への遷移タイミングを判定するものである。なお、実施の形態8と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0169】次に、中継ノード27の動作を説明する。まず、モード1、即ち有音/無音情報抽出部207において「無音」と判定された区間においては、切替スイッチ205を205A側に、切替スイッチ214を214A側に、それぞれ倒す。この時、擬似背景雑音生成部206側の出力信号は、切替スイッチ205を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、切替スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器202は入力信号を失うため、動作を停止させる。
【0170】モード1からモード2に遷移するとき、即ち、有音/無音情報抽出部207において、音声符号が検知されはじめたとき、復号器202にリセット信号2Bを発行する。有音/無音情報抽出部207の動作は音声検出器103の動作を忠実に反映していることから、これは送信端15の符号器101の初期化と同期して実行される。
【0171】モード2においては、切替スイッチ205を205Bに倒し、切替スイッチ214は214Aに接続したままとする。中継ノード25で受信した音声符号は、復号器202に供給される。符号器202は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して、符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ214を経由して伝送路Bに出力される。即ち、中継ノード25においてタンデム接続を行ったのと同じ形となる。
【0172】モード3においては、符号器201の内部パラメータと復号器202の内部パラメータとが比較器215に与えられる。比較器215では、これらの内部パラメータが所定のレベル内で一致しているか判定し、このレベル内で一致している場合に制御信号2Dを判定回路216に出力する。また、タイマ213では、モード3への遷移タイミングをカウントし、所定のカウント値で制御信号2Fを判定回路216に出力する。
【0173】判定回路216では、これらの制御信号2D,2Fの入力を受け付けて、両者の制御信号2D,2Fが入力された場合に、制御信号2Eを切替スイッチ214に出力する。そして、この制御信号2Eを受信した切替スイッチ214が214B側に倒れる。また、切替スイッチ205は205B側に接続したままとする。
【0174】中継ノード25で受信した音声符号は、切替スイッチ214を経由してそのまま伝送路Bにリレーされる。また当該音声符号は、復号器202にも供給される。復号器202は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。
【0175】ここで、送信端15の符号器101と、中継ノード25の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器101の内部状態と、中継符号器201の内部状態とは、極めて近似した値に保持される。
【0176】以上のように、モード2からモード3への遷移タイミングの決定を、この判定部の判定結果によって制御することにより、送信端15の符号器101の内部状態と、受信端30の復号器302の内部状態とをより確実に一致させることができる。その結果、異音の発生するおそれを減少させつつ、タンデム時間が長時間に及んで音声品質が低下するのを防止することができる。
【0177】実施の形態11.図17は、実施の形態1〜6,8〜10における擬似背景雑音生成部106,206、実施の形態7における擬似背景雑音発生用パラメータ生成部111,211の構造の一例を詳細に記したものである。補間信号は同図に示す巡回型のメモリに格納されている。擬似背景雑音信号シーケンスはサンプル単位(あるいは、擬似背景雑音符号についてはフレーム単位)でメモリ空間の所定のアドレスに順番に格納されている。擬似背景雑音信号出力時は、アドレスポインタが示すサンプルを出力し、ポインタを1アドレス分進める。
【0178】メモリを巡回型にすることにより、あらゆる長さの無音区間にも対応することができるが、メモリサイズを小さくすると、巡回メモリによる周期性により擬似背景雑音信号に特定の周波数の信号成分が乗ってしまう弊害が出るため、メモリサイズは十分に大きくすべきである。ここで、これら擬似背景雑音生成部106,206または擬似背景雑音発生用パラメータ生成部111,211が初期化信号2Bを受信したときは、ポインタの位置をアドレス0に設定し直す。この動作によって、送信端10〜15と中継ノード20〜27の擬似背景雑音生成部106,206間で、無音圧縮による断絶状態が発生しても、両端で同期した動作を実現することができる。
【0179】実施の形態12.図18は実施の形態1〜6,8〜10における擬似背景雑音生成部106,206、実施の形態7における擬似背景雑音発生用パラメータ生成部111,211の構造の一例を詳細に記したものであり、441は白色雑音発生部(ランダム信号発生器)、442はフィルタである。白色雑音発生部441は、通常の音声通信において生じる背景雑音の成分が、白色性(ランダム性)が強いことに着目して、無音区間に補間する背景雑音信号を乱数発生器の出力信号で擬似的に実現しようというものである。乱数の発生方法は、例えばPNパターンによる方法、剰余を取る方法などがある。
【0180】ここで、これらの擬似背景雑音生成部106,206または擬似背景雑音発生用パラメータ生成部111,211が初期化信号2Bを受信したときは、この乱数発生器の初期値である種(seed)として、送信端10〜15、中継ノード20〜27の両者にあらかじめ設定しておいた値を与える。この動作によって、送信端10〜15と中継ノード20〜27の擬似背景雑音信号生成部106,206間で、無音圧縮による断絶状態が発生しても、両端で同期した動作を実現することができる。また、乱数発生器の出力端に、自然な背景雑音の周波数特性に近い特性を持つフィルタ442(例えば、1/f特性を持つフィルタなど)を挿入することにより、より違和感の無い擬似背景雑音信号を得ることができる。
【0181】実施の形態13.次に、実施の形態13について、図19を参照しながら説明する。本実施の形態は、実施の形態1に示した送信端10の音声検出器103と中継ノード20の有音/無音情報抽出部207との間にシグナリングチャネル(同期信号送出手段)103A(たとえば、ISDNのDチャネル等)を接続したものである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0182】実施の形態1で説明した通り、有音区間及び無音区間の判定基準として、音声符号の有無を調べる方法がある。例えば、伝送路AがATMネットワークである場合、送信端10から送信されるセルが来なかったら無音区間に遷移したと判定するのも一つのやり方である。
【0183】ところが、ATM網内で、ネットワーク特有の劣化要因であるセル廃棄が発生した場合、中継ノード20で誤って無音区間と認識してしまうおそれがある。これを回避するために、送信端10の音声検出器103と中継ノード20の有音/無音情報抽出部207との間にシグナリングチャネル103Aを接続する。そして、有音区間から無音区間に遷移したことを知らせる情報を、このシグナリングチャネル103Aを用いて送信端10から中継ノード20へ別途通知することによって、無音遷移の誤認識を防止する上でより高品質な音声伝送を実現することができる。
【0184】なお、実施の形態2〜9においても、送信端10〜15の音声検出器103と中継ノード21〜27の有音/無音情報抽出部207との間にシグナリングチャネル103Aを接続して、送信端10〜15から中継ノード21〜27へ情報を別途通知する本方式が適用できることはいうまでもない。
【0185】実施の形態14.次に、実施の形態14について、図20を参照しながら説明する。本実施の形態は、実施の形態1で示した送信端10に対して、識別パターン生成部(識別パターン発生手段)217を追加して、送信端16としたものである。ここで、識別パターン生成部217は、有音区間の最終であることを示すシグナリング伝送用符号パターンを生成するものである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0186】本実施の形態は、有音区間から無音区間に遷移したことを、送信端10から中継ノード20へ知らせるシグナリングの伝送方法に改良を加えたものである。本実施の形態においては、このシグナリング情報をインチャネルで伝送する。即ち、送信端10において、音声検出器103が有音区間から無音区間に遷移したことを検出したタイミングで、最終の音声符号の伝送後、切替スイッチ104を104C側に切替る。この切替えによって、識別パターン生成部217で生成されたシグナリング伝送用符号パターンが中継ノード20に送出される。シグナリング伝送用符号パターンの送出後、切替スイッチ104を104A側に切替え、シグナリング伝送用符号パターンの送出を停止する。
【0187】中継ノード20の有音/無音情報抽出部207は、伝送路Aから入力される信号を常に監視し、このシグナリング伝送用符号パターンを認識したタイミングで、「有音」から「無音」に遷移したことを知らせる制御信号2Aを出力する。この方式を用いることにより、無音遷移の誤認識を防ぎ、高品質な音声伝送を実現することができるのはもとより、信号方式を変更することなく、機能ブロックの追加だけで実現できるという利点がある。
【0188】なお、実施の形態2〜9においても、送信端10〜15に識別パターン生成部217を追加して、シグナリング情報をインチャネルで伝送する本方式が適用できることはいうまでもない。
【0189】
【発明の効果】本発明による音声符号化伝送システムであれば、タンデム接続による音声品質の劣化を回避することができ、、送信端で符号化処理する際の内部状態と、受信端で復号処理する際の内部状態との一致が常に図られているため、内部状態の不整合に起因する異音や耳障り感を減少させることができる。
【図面の簡単な説明】
【図1】実施の形態1に係る音声符号化伝送システムの構成を示すブロック図である。
【図2】実施の形態2に係る音声符号化伝送システムの構成を示すブロック図である。
【図3】実施の形態3に係る音声符号化伝送システムの構成を示すブロック図である。
【図4】実施の形態3に係る補間信号発生器の構成を詳細に示すブロック図である。
【図5】実施の形態4に係る音声符号化伝送システムの構成を示すブロック図である。
【図6】実施の形態5に係る音声符号化伝送システムの構成を示すブロック図である。
【図7】実施の形態6に係る音声符号化伝送システムの構成を示すブロック図である。
【図8】実施の形態6に係る内部状態保持機能付き符号器の構成を詳細に示すブロック図である。
【図9】実施の形態7に係る音声符号化伝送システムの構成を示すブロック図である。
【図10】実施の形態7に係る内部状態保持機能付き符号器の構成を詳細に示すブロック図である。
【図11】実施の形態7に係る簡易符号器の構成を詳細に示すブロック図である。
【図12】実施の形態8に係る音声符号化伝送システムの構成を示すブロック図である。
【図13】実施の形態8に係る送信端の符号器に入力される原音声信号の波形図である。
【図14】実施の形態8に係る動作モード間の遷移を示す状態遷移図である。
【図15】実施の形態9に係る音声符号化伝送システムの構成を示すブロック図である。
【図16】実施の形態10に係る音声符号化伝送システムの構成を示すブロック図である。
【図17】実施の形態11に係る擬似背景雑音信号発生部の構成を示す図である。
【図18】実施の形態12に係る擬似背景雑音信号発生部の構成を示す図である。
【図19】実施の形態13に係る音声符号化伝送システムの構成を示すブロック図である。
【図20】実施の形態14に係る音声符号化伝送システムの構成を示すブロック図である。
【図21】符号化方式の一例であるITU-T勧告G.728 LD-CELP音声符号化方式のシステム構成を示すブロック図である。
【図22】従来の音声符号化伝送システムの構成を示すブロック図である。
【図23】従来のタンデム接続による音声符号化伝送システムの構成を示すブロック図である。
【図24】従来のディジタル1リンク接続による音声符号化伝送システムの構成を示すブロック図である。
【符号の説明】
1〜16…送信端、20〜27…中継ノード、30…受信端、101…符号器(送信側符号化手段)、102…復号器(送信側復号化手段)、103A…シグナリングチャネル(同期信号伝送手段)、104…切替スイッチ(送信側音声符号生成手段)、105…切替スイッチ(送信側背景雑音挿入手段)、106,112…擬似背景雑音生成部(送信側背景雑音生成手段)、108,110…内部状態保持機能付き符号器(送信側符号化手段)、111…擬似背景雑音発生用パラメータ生成部(送信側パラメータ生成手段)、201…符号器(中継側符号化手段)、202…復号器(中継側復号化手段)、204…切替スイッチ(中継側背景雑音挿入手段)、206,212…擬似背景雑音生成部(中継側背景雑音生成手段)、208…補間信号発生器(補間信号生成手段)、210…簡易符号器(中継側符号化手段)、211…擬似背景雑音発生用パラメータ生成部(中継側パラメータ生成手段)、213…タイマ、214…切替スイッチ(中継側音声符号生成手段)、215…比較器(比較手段)、216…判定回路(判定手段)、217…識別パターン生成部(識別パターン発生手段)、A…伝送路(第1の伝送路)、B…伝送路(第2の伝送路)。
【0001】
【発明の属する技術分野】本発明は、音声信号を高能率に圧縮伝送する音声符号化伝送システムに関し、特に音声品質を向上させることのできる音声符号化伝送システムに関する。
【0002】
【従来の技術】従来より、音声信号の冗長成分を除いて高能率に符号化する高能率音声符号化技術を用いた音声信号のディジタル伝送技術が、企業内通信や国際通信などの通信コストの低減が強く望まれる分野で盛んに用いられている。高能率音声符号化方式としては、ITU(International Telecommunications Union)勧告G.726 ADPCM(Adaptive Differential Pulse Code Modulation:適応差分パルス符号変調)符号化方式に代表されるような予測差分符号化方式や、ITU勧告G.728 LD-CELP(Low-Delay Code Excited Linear Prediction:低遅延型符号励振線形予測)符号化方式(図21参照)、およびITU勧告G.729CS-ACELP(Conjugate-Structure Algebraic-Code-Excited Linear Prediction:共役構造代数的符号励振線形予測)符号化方式に代表されるような「合成による分析(Analysis-by-Synthesis)」に基づく符号化方式などがある。
【0003】なお、これら符号化方式の詳細については、以下の文献を参照されたい。
・CCITT Recommendation G.726, ■40,32,24,16kbit/s adaptive differentialpulse code modulation (ADPCM)■・ITU-T Recommendation G.728, ■Coding of speech at 16kbit/s using Low-Delay Code Excited Linear Prediction(LD-CELP)■・ITU-T Recommendation G.729, ■Coding of speech at 8kbit/s using conjugate-structure algebraic-code-excited linear prediction■
【0004】ここで、予測差分符号化方式は、過去の信号系列から現在の信号を予測し、その予測パラメータと実際の信号との差分信号を量子化して伝送する方式である。また、「合成による分析」に基づく符号化方式は、過去、及び現在の音声信号に基づいて分析して得られたパラメータを用いて、候補として複数パターンの信号の合成を行い、その中から最も入力音声に近似した信号パターンを選択した上で、選択された合成信号の基となったパラメータを、最適パラメータとして量子化し、伝送する方式である。
【0005】これらのいずれの方式も、送信側に設けられた符号器と、受信側に設けられた復号器とで実現されている。そして、現在の入力音声信号成分に基づく所謂フォワード適応によって得られる符号器のパラメータについては、復号器でその情報を得る手段がない。このため、符号器と復号器とが同一のパラメータを保持するためには、符号器から復号器に情報を送信する必要がある。一方、過去の音声信号に基づく所謂バックワード適応によって得られるパラメータについては、符号器および復号器の両者が共通のパラメータ算出手段を持つことにより、符号器および復号器を正常に動作させることができる。
【0006】即ち、予測差分符号化方式では、過去の信号系列を符号器および復号器の内部状態として共有することにより、これに基づいた音声の符号化および復号動作が実現される。また、「合成による分析」に基づく符号化方式では、バックワード適応によって得られた送受信で同一のパラメータの集合を符号器、復号器の内部状態として共有することにより、これらのパラメータに基づいた音声の符号化および復号化が実現される。従って、復号器においては、符号器と全く同じ内部状態を保ちながら音声の復号処理を実行することが前提となる。逆に、何らかの原因で送信側と受信側とで過去の音声信号が異なれば、内部状態も一致しなくなり、復号部で再生される音声の正確さが保証されないおそれがある。
【0007】一方で、通信網においては、電話に代表される音声以外に、画像やコンピュータデータの伝送といった、マルチメディア伝送への要求が高まっている。このような複数のサービスをネットワーク上で総合的に扱えるように、非同期転送モード(ATM:Asynchronous Transfer Mode)と呼ばれる通信方式が近年、盛んに導入されつつある。ATM伝送網においては、伝送される情報信号(音声・画像等)をディジタル符号化し、得られたビット列をセルと呼ばれる固定長ブロックに分割し、非同期的に通信路に送出する。これにより、伝送速度の異なる情報信号を多元的に取り扱うことが可能になる。
【0008】最近では、上述のような一層の高能率化への要求から、ATM網の非同期性・可変速度性といった特長を生かした無音圧縮技術(音声信号の無音部分を廃棄して伝送する方式)が併用されるようになりつつある。この無音圧縮技術は、有音区間の音声品質を損なうことなく、伝送路に送出される音声信号の総量を低減することができ、統計多重効果により、一層高能率な音声伝送を可能とする。
【0009】しかし、この無音圧縮音声伝送システムでは、無音時に伝送される音声情報が皆無であるため、高能率符号化された音声信号である音声符号を受信して復号する復号器の動作は無音時に不定となる。従って、上記で述べたバックワード適応が正常に機能しなくなり、無音状態(トークスパートが“無し”の状態と呼ぶことがある)から有音状態(トークスパートが“有り”の状態と呼ぶことがある)に遷移するときに、音声符号を生成する符号器の内部状態と、音声符号を復号する復号器の内部状態とが一致しなくなる。そのため、復号部では、たとえ伝送路誤りのない正しい高能率符号が与えられたとしても、正しく音声信号を復号できるとは限らない。この現象は、しばしば受信端の再生音における不快な異音、例えばクリック音、発振音等、として表れる。
【0010】図22は、これを解決するための第1の音声符号化伝送システムの構成を示すブロック図である。この図は、特開平2−181552号公報に示された構成図に基づいている。この音声伝送システムは、送信端60と受信端70とで一対の構成をなす。トークスパート有りの状態、即ち有音区間においては、送信端60は音声信号を高能率音声符号器601で符号化して、切替スイッチ604を経由して、伝送路Aに音声符号を送出する。送信端60の切替スイッチ604はトークスパート無し、即ち無音区間においては伝送路Aに対して何も送出しないように切り換えられるので、送信端60からは無音圧縮された音声符号が送出されることになる。音声検出器603は音声信号の有音/無音を検出して、切替スイッチ604の切替えを行う。
【0011】一方、受信端70では伝送路Aからの音声符号を復号器702で音声信号に復号して出力する。無音圧縮されている間、切替スイッチ705は擬似背景雑音生成部706側に切り替えられており、受信端70からは、話者の背景雑音を模した擬似的な信号(以下、擬似背景雑音信号という)が出力される。有/無音情報抽出部707は音声符号に基づいて有音/無音を検出して、切替スイッチ705の切替えを行う。
【0012】このシステムでは送信端60に符号器601の所定の内部状態を記憶したメモリ630を有し、受信端70にはこれと同一の内容を格納したメモリ730を有している。そして、上述のような問題が発生する音声信号の無音区間から有音区間への遷移時においては、それを音声検出器603および有/無音情報抽出部707が同期して検出し、送信端60においてはメモリ630から符号器601に符号化処理のための内部状態の初期値が設定され、受信端70においてはメモリ730から復号器702に復号処理のための内部状態の初期値が設定される。
【0013】このように、送信端60及び受信端70とでトークスパートが検出されるタイミングは同期しており、その時点で両者の内部状態は同一の状態にリセットされる。そのため、符号器601と復号器702との内部状態は音声の有音区間においては常に一致し、トークスパート先頭における異音の発生を回避することができる。
【0014】このような技術を用いることによって、高能率符号化を用いた無音圧縮伝送を実現することができる。しかし、現在、これまでに構築された無音圧縮を行わない伝送網が既に存在する。これらの伝送網は多くの場合、多額な費用を投じてインフラストラクチャーとして構築されたものであり、それを直ちに無音圧縮伝送網に置き換えたり、改良したりすることは経済的に困難である。よって、これら従来の伝送網がカバーする範囲も包括した大きな網を構築したい場合には、当面は無音圧縮を行わない網をそのままの状態で、無音圧縮を行う網に併存させなければならない。
【0015】即ち、無音圧縮を行わない網と無音圧縮を行う網との併存は、これら2種類の網を中継ノードで接続することにより実現される。その方法として、図23及び図24に示す2つの方法がある。これらの図は、無音圧縮を行う網から無音圧縮を行わない網への伝送を説明するものである。
【0016】図23は、2種類の網を中継ノードを介してタンデム接続する伝送システムの構成図である。この図において、図22と同一の機能を有する構成要素には同一の符号を付し、その説明を省略する。このシステムの送信端60が有する符号器601は無音圧縮を行った上で、音声符号を伝送路Aに送出する。
【0017】中継ノード80では、伝送路Aから送信端60の音声符号(有音部のみ)を受信し、これを復号器802で音声信号に復号する。送信端60の信号は無音圧縮されているため、復号される音声信号は有音部のみとなる。この音声信号の無音区間に擬似背景雑音信号を挿入し、改めて符号器801で符号化して受信端70に伝送する。
【0018】ここで、送信端60と中継ノード80との間の音声信号の処理は、例えば、図22にて説明した同期リセットを用いた無音圧縮伝送方式で行われる。このように、中継ノード80で一旦復号し、再度符号化を行うため、音声符号化処理の立場から見ると、相互に独立した2つの伝送路A,Bが直列に接続された所謂タンデム接続と称する形態となる。
【0019】一方、図24は、2種類の網を中継ノードを介してディジタル1リンクにより接続する伝送システムの構成図である。この図において、図23と同一の機能を有する構成要素には同一の符号を付し、その説明を省略する。
【0020】送信端60から伝送路Aに送出された、無音圧縮された音声符号は、中継ノード80により無音符号が補充され、伝送路Bを介して受信端70に伝送される。送信端60に入力された音声信号は、符号器601にて高能率符号化される。音声検出器603は、この音声信号を基に有音/無音(トークスパートの有無)を検出し、切替スイッチ604を制御する。切替スイッチ604は、トークスパート有りの場合のみ、符号器601からの音声符号を伝送路Aに伝送する。トークスパート無しの場合には音声符号は廃棄され、伝送路Aには何も出力されない。これにより伝送路Aには無音圧縮された音声符号が送出される。
【0021】中継ノード80は、送信端60から伝送路Aを介して伝送された無音圧縮された音声符号を受信する。有/無音情報抽出部807は、伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ804を制御する。即ち、伝送路Aから音声符号が入力された場合は、切替スイッチ804を804b側に倒して、受信した音声符号をそのまま伝送路Bにリレーする。
【0022】一方、伝送路Aからの信号の受信が検知されなかった場合(即ち無音部と判定された区間)、有/無音情報抽出部807が切替スイッチ804を擬似背景雑音生成部806側に切り替えて、無音区間の信号を擬似背景雑音信号で補充する。なお、遅延器209は、有/無音情報抽出部807における処理時間だけ伝送路Aからの音声符号を遅延させ、切替スイッチ804を音声符号の入力に同期して動作させるものである。
【0023】受信端70では、復号器702が伝送路Bからの音声符号を復号し、音声信号を取り出す。無音区間の信号は、中継ノード80で擬似信号が挿入されるため、見掛け上、受信端70には連続した音声信号が入力しているように見える。
【0024】このように中継ノード80は、音声の有無によって単にスイッチングのみを実行しているに過ぎない。このため、受信端70に伝送される音声符号は、無音区間こそ中継ノードで補間処理がなされているものの、主要な情報となる有音区間については送信端60から送出されたものに他ならない。そして、伝送路A,B間を通過する信号は、ディジタル信号のまま加工されずに相手方の網にリレーされることから、この網間伝送方式をディジタル1リンクと一般的に称している。
【0025】
【発明が解決しようとする課題】しかしながら、上述したタンデム接続及びディジタル1リンクによる伝送路A,Bの接続には、以下に述べる問題点がある。即ち、タンデム接続は、送信端60で無音圧縮された音声符号を、中継ノード80で音声信号に復号した後に雑音信号を挿入し、その後、再度符号化して伝送路Bに送出する。このため、中継ノード80の符号器801の内部状態と、受信端70の復号器702の内部状態とは常に一致し、上述した異音の発生は防止される。
【0026】しかし、中継ノード80では、音声符号に対して、復号化した後に再度符号化するという処理を行うため、送信端に入力された音声信号は受信端から出力されるまでに2回の符号化/復号化処理を受けることになる。そのため量子化誤差が蓄積し、受信端70から出力される音声信号の品質が劣化するという問題があった。この音声品質の劣化は、高いビットレート(l6kbit/s以上)では、ほとんど気にならない程度であるが、圧縮率が高くなればなるほどその劣化傾向は顕著になる。特に、音声伝送システムは低ビットレートであるため、この音声品質の劣化は無視することができない。
【0027】一方、ディジタル1リンクによる接続では、全く事情は逆である。この場合には受信端70に伝送される有音部における音声符号は、送信端60において生成された音声符号と同一であるため、量子化誤差の蓄積による音声信号の品質劣化は防止される。しかし、送信端60の符号器601の内部状態と、受信端70の復号器702の内部状態とでは、無音状態から有音状態に遷移するタイミングで一般に不一致となる。
【0028】即ち、音声符号自体は同じであるのに、その符号化/復号化処理において内部状態が異なるため、復号器702で復号される音声信号は符号器601で意図した信号とは異なるものとなり、上述した異音が発生し得るという問題がある。この異音の発生は、受信者に不快感を与えるのみならず、通常、トークスパートの先頭で発生するため、通話内容の理解度を著しく低下させるという問題があった。
【0029】以上の問題により、従来は、無音圧縮を行わない既存の伝送網側の音声通信システムに改良を加えることなく、この伝送網に無音圧縮伝送網を接続することは困難であった。
【0030】本発明は、このような問題を解決し、無音圧縮を行わない既存の伝送網に無音圧縮を行った伝送網を接続した音声符号化伝送システムにおいて、高品質な音声伝送を可能とする音声符号化伝送システムを提供することを目的とする。
【0031】
【課題を解決するための手段】請求項1の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第1の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、中継側復号化手段で復号化された音声信号の無音区間に第2の擬似信号を挿入する中継側背景雑音挿入手段と、中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された音声符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0032】請求項2の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第1の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、第2の擬似信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された擬似符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、中継側符号化手段は、中継側復号化手段の内部パラメータを入力して、この内部パラメータを用いて中継側復号化手段と同等の内部状態を保持していることを特徴とする。
【0033】請求項3の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、原音声信号の無音区間に第1の擬似信号を挿入する送信側背景雑音挿入手段と、送信側背景雑音送信手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、第1の音声符号を復号化すると共に、第2の擬似信号を符号化する補間信号生成手段と、補間信号生成手段で符号化された擬似符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、補間信号生成手段は、復号化処理と符号化処理とで共通した内部状態を保持していることを特徴とする。
【0034】請求項4の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、第1の擬似符号を復号化する送信側復号化手段と、送信側復号化手段で復号化された擬似信号を原音声信号の無音区間に挿入する送信側背景雑音挿入手段と、送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、第1の音声符号の無音区間に第2の擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、送信側復号化手段は、送信側符号化手段で符号化された音声符号を入力して、有音区間についてはこの音声符号を復号化すると共に、無音区間については第2の擬似符号を復号化していることを特徴とする。
【0035】請求項5の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、第1の擬似符号を復号化する送信側復号化手段と、原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、第1の音声符号の無音区間に第2の擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備え、送信側符号化手段は、送信側復号化手段の内部パラメータを入力して、この内部パラメータを用いて送信側復号化手段と同等の内部状態を保持していることを特徴とする。
【0036】請求項6の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、第1の擬似信号に基づく内部状態を保持しつつ原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、第1の音声符号の無音区間に第2の擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0037】請求項7の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、第1の音声符号を復号化して音声信号を生成する中継側復号化手段と、背景雑音を模した擬似信号を生成する中継側背景雑音生成手段と、中継側復号化手段で生成された音声信号の無音区間に擬似信号を挿入する中継側背景雑音挿入手段と、中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、中継側符号化手段で符号化された音声符号を、第1の音声符号の無音区間および無音から有音に切り替わった直後の遷移区間に挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0038】請求項8において、中継ノードは、遷移区間をカウントするタイマを更に備え、中継側音声符号生成手段では、タイマのカウント値に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【0039】請求項9において、中継ノードは、中継側復号化手段の内部状態と中継側符号化手段の内部状態とを比較する比較手段を更に備え、中継側音声符号生成手段では、比較手段の比較結果に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【0040】請求項10において、中継ノードは、遷移区間をカウントするタイマと、中継側復号化手段の内部状態と中継側符号化手段の内部状態とを比較する比較手段と、タイマのカウント値および比較手段の比較結果に基づいて遷移区間の終了タイミングを判定する判定手段とを更に備え、中継側音声符号生成手段では、判定手段の判定結果に基づいて、遷移区間の終了タイミングを決定していることを特徴とする。
【0041】請求項11において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、無音区間の背景雑音を模したディジタル信号を疑似音声として生成していることを特徴とする。
【0042】請求項12において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする。
【0043】請求項13において、送信側背景雑音生成手段及び中継側背景雑音生成手段は、ランダム信号発生器であることを特徴とする。
【0044】請求項14において、原音声信号の無音区間の開始を示す同期信号を送信端から中継ノードに伝送させる同期信号伝送手段を更に備え、中継ノードは、同期信号を受信して、送信側背景雑音生成手段と中継側背景雑音生成手段とを同期させていることを特徴とする。
【0045】請求項15において、送信端は、原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、中継ノードは、識別パターンを認識して、送信側背景雑音生成手段と中継側背景雑音生成手段とを同期させていることを特徴とする。
【0046】請求項16の音声符号化伝送システムは、原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、第1の伝送路から受信した第1の音声符号に基づいて、原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、第2の伝送路から受信した第2の音声符号を復号処理して原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、送信端は、擬似背景雑音発生用の第1のパラメータ信号を生成する送信側パラメータ生成手段と、第1のパラメータ信号に基づく内部状態を保持しつつ原音声信号を符号化する送信側符号化手段と、送信側符号化手段で符号化された音声符号の無音区間を圧縮して、第1の音声符号を生成する送信側音声符号生成手段とを備え、中継ノードは、擬似背景雑音発生用の第2のパラメータ信号を生成する中継側パラメータ生成手段と、第2のパラメータ信号に基づいて擬似符号を生成する中継側符号化手段と、第1の音声符号の無音区間に擬似符号を挿入して、第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする。
【0047】請求項17において、送信側パラメータ生成手段及び中継側パラメータ生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする。
【0048】請求項18において、送信側パラメータ生成手段及び中継側パラメータ発生手段は、ランダム符号発生器であることを特徴とする。
【0049】請求項19において、送信端は、原音声信号の無音区間の開始を示す同期信号を送出する同期信号送出手段を更に備え、中継ノードは、同期信号を受信して、送信側パラメータ生成手段及び中継側パラメータ発生手段とを同期させていることを特徴とする。
【0050】請求項20において、送信端は、原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、中継ノードは、識別パターンを認識して、送信側パラメータ生成手段及び中継側パラメータ発生手段とを同期させていることを特徴とする。
【0051】
【発明の実施の形態】以下、本発明に係る音声符号化伝送システムの好適な実施形態について添付図面を参照して説明する。
【0052】実施の形態1.図1は、実施の形態1に係る音声符号化伝送システムの構成を示すブロック図である。図1において、10は原音声信号の有音区間を符号化すると共に無音圧縮して生成された第1の音声符号を伝送路A(第1の伝送路)に出力する送信端、20は伝送路Aから受信した第1の音声符号に基づいて、原音声信号の無音区間に対応する音声符号を補間して生成された第2の音声符号を伝送路B(第2の伝送路)に出力する中継ノード、30は伝送路Bから受信した第2の音声符号を復号処理して原音声信号を再生する受信端である。
【0053】また、101は入力された音声信号を所定のアルゴリズムに基づいて高能率符号化する符号器(送信側符号化手段)、103は送信端1の動作モードを制御するための制御信号1Aを出力する音声検出器、104は符号器101で符号化された音声符号を圧縮して、第1の音声符号を生成する切替スイッチ(送信側音声符号生成手段)、105は原音声信号の無音区間に背景雑音信号(第1の擬似信号)を挿入する切替スイッチ(送信側背景雑音挿入手段)、106はこの背景雑音信号を擬似的に発生させる擬似背景雑音生成部(送信側背景雑音生成手段)である。
【0054】さらに、201は入力された音声信号を所定のアルゴリズムに基づいて高能率符号化する符号器(中継側符号化手段)、202は送信端10から送られた第1の音声符号を復号化する復号器(中継側復号化手段)、204は復号器202で復号化された音声信号の無音区間に背景雑音信号(第2の擬似信号)を挿入する切替スイッチ(中継側背景雑音挿入手段)、206はこの背景雑音信号を擬似的に発生させる擬似背景雑音生成部(中継側背景雑音生成手段)である。
【0055】さらにまた、207は伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて制御信号を出力する有/無音情報抽出部、209は遅延器、214は符号器201で符号化された音声符号を第1の音声符号の無音区間に挿入して、第2の音声符号を生成する切替スイッチ(中継側音声符号生成手段)、205は符号器201で符号化された音声符号を用いて、第1の音声符号の無音区間を補間する切替スイッチ、302は第2の音声符号を復号化する復号器である。
【0056】なお、擬似背景雑音生成部106,206は、無音区間の背景雑音を模したディジタル信号を擬似音声として生成していることが望ましい。
【0057】次に、この音声伝送システムの動作について説明する。送信端10は原音声信号を高能率に符号化した音声符号を生成する。この音声符号は、音声検出器103の判定結果により、有音区間では伝送路Aに送出され、無音区間では伝送路Aに送出されない。このように、送信端10ではいわゆる無音圧縮が行われており、伝送路Aは無音圧縮された音声符号の伝送路である。一方、受信端30が接続された伝送路Bは、無音圧縮されていない音声符号が伝送される伝送路である。そして、中継ノード20はこれら2つの伝送路を接続して、送信端10からの音声符号を伝送路Aから受け取り、無音区間の擬似音声符号を挿入して伝送路Bに出力する。受信端30はこの音声符号を復号して音声信号を出力する。
【0058】送信端10において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端10の動作モードを制御するための制御信号1Aを出力する。音声検出器103で「有音」と判定された場合には、切替スイッチ105を105B側に、切替スイッチ104を104B側に倒す。これにより、送信端10に入力された原音声信号は符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0059】一方、音声検出器103で「無音」と判定された場合は、切替スイッチ105を105A側に、切替スイッチ104を104A側に倒す。これにより、擬似背景雑音生成部106から出力された擬似背景雑音信号が符号器101に入力される。但し、符号器101の出力である擬似背景雑音信号が符号化された信号は、切替スイッチ104によって遮断されるため、伝送路Aには何も出力されない。
【0060】ここで、擬似背景雑音生成部106について説明する。音声検出器103の判定が「有音」から「無音」に遷移するタイミングで、音声検出器103は、擬似背景雑音生成部106の初期化を制御するための初期化信号1Bを出力する。擬似背景雑音生成部106にはこの初期化信号1Bが入力され、擬似背景雑音生成部106は初期化信号1Bの入力タイミングで内部状態をリセットする。この動作は、以下に述べる中継ノード20における擬似背景雑音生成部206と同期した動作を実現するために必須である。
【0061】中継ノード20では、送信端10から無音圧縮されて送出され、伝送路Aを介して伝送された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの第1の音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ204,205,214を制御するための制御信号2Aを出力する。即ち、伝送路Aから音声符号が入力された場合は、有音区間と判定して、切替スイッチ204を204B側に、切替スイッチ205を205B側に、切替スイッチ214を214B側にそれぞれ倒す。
【0062】中継ノード20で受信した第1の音声符号は、遅延器209及びスイッチ214を経由してそのまま伝送路Bにリレーされる。また第1の音声符号は、スイッチ205を経由して復号器202にも与えられる。復号器202は入力された第1の音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ204を経由して符号器201に供給される。符号器201は入力された音声信号に基づいて符号化処理を実行する。
【0063】ここで、送信端10の符号器101と、中継ノード20の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質は極めて近似したものである。従って、音声信号の性質を数値化したものに相当する送信端10の符号器101の内部状態と、中継ノード20の符号器201の内部状態とは、極めて近似したものとなる。
【0064】一方、有/無音情報抽出部207において、伝送路Aからの信号の受信が検知されなかったとき、即ち「無音」と判定された区間においては、切替スイッチ204を204A側に、切替スイッチ205を205A側に、切替スイッチ214を214A側に、それぞれ倒す。
【0065】擬似背景雑音生成部206の出力信号は、スイッチ204を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づいて符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、スイッチ214を経由して伝送路Bに送出される。
【0066】この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。ここで、遅延器209は有/無音情報抽出部207における処理および符号器201における処理に掛かる時間だけ、伝送路Aから受信して伝送路Bに送出される音声符号を遅延させている。この遅延動作によって、遅延器209から出力される有声区間の音声符号と、符号器201から出力される擬似背景雑音符号との同期が実現される。
【0067】また、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207は、擬似背景雑音生成部206の初期化を制御するための初期化信号2Bを出力する。擬似背景雑音生成部206にはこの初期化信号2Bが入力され、擬似背景雑音生成部206は初期化信号2Bの入力タイミングで内部状態をリセットする。
【0068】なお、擬似背景雑音生成部206は、送信端10の擬似背景雑音生成部106と同一の動作を実現するものであり、上述した初期化動作についても、送信端10の擬似背景雑音生成部106と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端10の音声検出器103の判定信号に同期して行われるため、送信端10の符号器101と中継ノード20の符号器201とは、同じタイミングで同一の擬似背景雑音信号が供給されることになる。
【0069】さらに、有音区間において、送信端10の符号器101の内部状態と中継ノード20の符号器201の内部状態とはほぼ一致しているため、無音区間においてこれらの符号器101,201から出力される擬似背景雑音符号も極めて近似した値を取ることができる。
【0070】また、符号器201から出力された擬似背景雑音符号は、切替スイッチ205を経由して復号器202にも供給される。復号器202は入力された擬似背景雑音符号を基に復号処理を実行する。この動作により、送信端10の符号器101の内部状態と、中継ノード20の復号器202の内部状態とは常に同一に保持される。このため、再び「有音」と判定され、復号器202に伝送路Aからの音声符号が入力されても、内部状態が送受で一致しているため、音声の復号を正常に実現することができる。
【0071】受信端30では、中継ノード20から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0072】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端10の符号器101の出力であるため、有音区間においては、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において受信端30に入力される第2の音声符号は、中継ノード20の符号器201の出力であるため、中継ノード20の符号器201の内部状態と、受信端30の復号器302の内部状態とは一致する。上述したように、無音区間においても送信端10の符号器101の内部状態と、中継ノード20の符号器201の内部状態とを一致させているため、受信端30からの見掛け上、あたかも送信端10から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0073】以上述べた通り、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態との一致が常に図られているため、内部状態の不整合に起因して耳障りな音声が復号されるおそれは回避される。
【0074】実施の形態2.次に、実施の形態2について、図2を参照しながら説明する。本実施の形態は、実施の形態1の音声符号化伝送システムにおける中継ノード20に改良を加えて中継ノード21としたものである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0075】中継ノード21は、送信端10から無音圧縮されて送出され、伝送路Aを介して伝送された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ214を制御する制御信号2Aを出力する。
【0076】即ち、伝送路Aから音声符号が入力された場合は、有音区間と判定して、切替スイッチ214を214B側に倒す。中継ノード21で受信した第1の音声符号は、スイッチ214を経由してそのまま伝送路Bにリレーされる。また第1の音声符号は、同時に復号器202にも供給される。復号器202は入力された第1の音声符号に基づき復号処理を実行する。
【0077】ここで、送信端10の符号器101と、中継ノード21の復号器202とでは、有音部については共に同一の音声符号に基づいた適応処理がなされるため、送信端符号器101の内部状態と、中継符号器201の内部状態とは、一致した値に保たれている。
【0078】次に、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207は、擬似背景雑音生成部206の初期化を制御する初期化信号2Bを出力する。擬似背景雑音生成部206は、この初期化信号2Bを受信したタイミングで内部状態をリセットし、擬似背景雑音信号の送出を開始する。
【0079】なお、擬似背景雑音生成部206は、送信端10の擬似背景雑音生成部106と同一の動作を実現するものであり、上記初期化動作についても、送信端10の擬似背景雑音生成部106と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端10の音声検出器103の判定信号に同期して行われるため、送信端10の符号器101、及び中継ノード21の符号器201へは、同じタイミングで同一の擬似背景雑音信号を供給することができる。
【0080】同時に、初期化信号2Bは符号器201及び復号器202にも供給される。初期化信号2Bを受信した復号器202は、内部パラメータを符号器201に送出し、動作を停止する。符号器201は、初期化信号2Bにより復号器202から内部パラメータを受取り、これに基づいて、擬似背景雑音生成部206から供給される擬似背景雑音信号の符号化処理を開始する。
【0081】ここで、有音区間において、送信端10の符号器101と中継ノード21の復号器202とで一致させた内部状態が、中継ノード21の符号器201にそのまま継承されているため、互いに直接情報のやり取りがないにも係わらず、無音区間において、送信端10の符号器101と中継ノード21の符号器201との両者から出力される擬似背景雑音符号は一致する。
【0082】有/無音情報抽出部207において、伝送路Aからの信号が「無音」と判定された区間においては、切替スイッチ214を214A側に倒す。擬似背景雑音生成部206の出力信号を受けて、符号器201から出力された擬似背景雑音符号は、スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。
【0083】最後に、有/無音情報抽出部207の判定が「無音」から「有音」に遷移するタイミングで、有/無音情報抽出部207から、制御信号2Cを出力する。制御信号2Cを受信した符号器201は、内部パラメータを復号器202へ送出し、動作を停止する。復号器202は、制御信号2Cにより符号器201から内部パラメータを受け取り、これに基づいて、伝送路Aから受信した第1の音声符号の復号処理を開始する。これらの一連の動作により、無音区間で送信端10の符号器101と中継ノード21の復号器202との間で情報のやり取りがなかったにも係わらず、内部状態は同一に保たれているため、復号処理を正常に再開することができる。
【0084】受信端30では、中継ノード21から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0085】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端10の符号器101の出力であるため、有音区間においては、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において受信端30に入力される第2の音声符号は中継ノード21の符号器201の出力であるため、中継ノード21の符号器201の内部状態と、受信端30の復号器302の内部状態とは一致する。
【0086】上記で説明したように、無音区間においても送信端10の符号器101の内部状態と、中継ノード21の符号器201の内部状態とを一致させているため、受信端30からの見掛け上、あたかも送信端10から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0087】以上述べた通り、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード21において符号器201が動作するのは無音区間のみであり、復号器202が動作するのは有音区間のみであるため、これらが同時に処理を実行することはなく、プロセッサの負荷削減によるコストの低減および消費電力の低減が実現される。
【0088】実施の形態3.次に、実施の形態3について、図3,4を参照しながら説明する。本実施の形態は、実施の形態1の音声符号化伝送システムにおいて、その中継ノード20に改良を加えて中継ノード22としたものである。ここで、208は送信端10から送られた第1の音声符号を符号化すると共に背景雑音信号(第2の擬似信号)を符号化する補間信号発生器(補間信号生成手段)である。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0089】中継ノード22は、送信端10から無音圧縮されて送出され、伝送路Aを介して伝送された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ214を制御する制御信号2Aを出力する。また、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207から、擬似背景雑音生成部206の初期化を制御する初期化信号2Bを出力する。
【0090】擬似背景雑音生成部206は、この初期化信号2Bを受信したタイミングで内部状態をリセットし、擬似背景雑音信号の送出を開始する。なお、擬似背景雑音生成部206は、送信端10の擬似背景雑音生成部106と同一の動作を実現するものであり、上記初期化動作についても、送信端10の擬似背景雑音生成部106と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端音声検出器103の判定信号に同期して行われるため、送信端10の符号器101、及び補間信号発生器208には、同じタイミングで同一の擬似背景雑音信号が供給される。ここまでの動作は、実施の形態1とほぼ同一である。
【0091】次に、補間信号発生器208の具体的な構成について、図4を参照しながら説明する。同図に示す補間信号発生器208は、高能率音声符号化方式にITU勧告G.728を適用したものである。図4と図21とを比較して判る通り、これはITU勧告G.728に基づく符号器に切替スイッチ421,422,423が追加されたものである。
【0092】ITU勧告G.728 LD-CELP方式や、同G.729 CS-ACELP方式に代表される「合成による分析」に基づく音声符号化方式においては、最適な音声符号の選択のために、想定される音声符号の候補全てに対して復号処理を行い、これらを入力された音声信号と逐一比較すると共に、入力音声信号に最も近似した合成信号を選択し、その合成信号の基となった音声符号を最適符号として復号器に伝送する。この方式の符号器は、この復号処理を実現するために、通常ローカルデコーダと呼ばれる復号器に相当する機能を備えている。そして、図4に示す機能ブロック420は、ローカルデコーダに相当する部分である。
【0093】有/無音情報抽出部207において、伝送路Aからの信号が「有音」と判定された区間においては、制御信号2Aにより、切替スイッチ421を421B側に、切替スイッチ422を422B側に、切替スイッチ423を423B側に、それぞれ倒す。この時、ローカルデコーダ部420は伝送路Aからの信号を入力として、通常の復号動作を行う。
【0094】この動作の目的は、バックワード型利得適応部410およびバックワード型合成フィルタ適応部411を動作させて、利得乗算器404および合成フィルタ405の内部状態を、送信端符号器101の内部状態と常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。
【0095】ここで、合成フィルタ405の出力経路、即ち復号された音声信号の出力経路はスイッチ423で遮断されているため、このローカルデコーダ420の出力は、他の機能ブロックから参照されることはない。また、補間信号発生器208において、ローカルデコーダ420以外の機能ブロック、即ちPCM伸長部401、ベクトルバッファ部402、加算器406、聴覚重み付けフィルタ407および最小自乗誤差探索部408は、入力すべき信号がないため停止状態を保持する。
【0096】有/無音情報抽出部207において、伝送路Aからの信号が無音区間と判定された区間においては、制御信号2Aにより、切替スイッチ421を421A側に、切替スイッチ422を422A側に、切替スイッチ423を423A側に、それぞれ倒す。この時の補間信号発生器208の構造は、符号器の構造と全く同一となる。その動作も、符号器のそれと全く同一である。即ち、疑似背景雑音発生部206から出力される疑似背景雑音信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、補間信号発生器208から出力する。
【0097】ここで、有音区間において利得乗算器404および合成フィルタ405の内部状態は、送信端符号器101の内部状態と一致させており、また、無音区間においても疑似背景雑音生成部206から入力される信号は、送信端10の疑似背景雑音生成部106と全く同一であるため、補間信号発生器208から出力される疑似背景雑音符号は、送信端符号器101から出力される(但し切替スイッチ104により伝送路Aには出力されない)疑似背景雑音符号と全く同一となる。これら一連の動作により、無音区間において送信端符号器101と、補間信号発生器208とは、直接信号のやり取りがなかったにも係わらず、内部状態の一致は常に保たれている。
【0098】受信端30では、中継ノード22から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0099】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端10の符号器101の出力であるため、有音区間においては、送信端10の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において、受信端30に入力される第2の音声符号は補間信号発生器208の出力であるため、補間信号発生器208の内部状態と、受信端復号器302の内部状態とは一致する。
【0100】上記で説明したように、無音区間においても送信端符号器101の内部状態と、補間信号発生器208の内部状態を一致させているため、受信端30からの見掛け上、あたかも送信端10から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0101】以上述べた通り、送信端符号器101の内部状態と、受信端復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード22において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0102】実施の形態4.次に、実施の形態4について、図5を参照しながら説明する。本実施の形態において、実施の形態1の音声符号化伝送システムにおける送信端10および中継ノード20に改良を加えて、送信端11および中継ノード23としたものである。
【0103】ここで、102は符号器101で高能率符号化された音声符号を音声信号に復号する復号器(送信側復号化手段)、112は疑似背景雑音信号が高能率符号化方式で符号化された符号(第1の擬似信号)を発生させる擬似背景雑音生成部(送信側背景雑音生成手段)、114は復号器102への入力を切り替えるスイッチ、212は疑似背景雑音信号が高能率符号化方式で符号化された符号(第2の擬似符号)を発生させる擬似背景雑音生成部(中継側背景雑音生成手段)である。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0104】この音声伝送システムは、上記実施の形態1に係る音声符号化伝送システムにおける中継ノード20に実施した改良を、送信端11に適用することによって、上記課題を解決した高品質な音声伝送を可能とする音声符号化伝送システムを構築しようとするものである。
【0105】次に、本実施の形態に係る音声符号化伝送システムの動作について説明する。送信端11において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端11の動作モードを制御する制御信号1Aを出力する。音声検出器103で「有音」と判定された場合は、切替スイッチ114を114B側に、切替スイッチ105を105B側に、切替スイッチ104を104B側に、それぞれ倒す。これにより、送信端11に入力された音声信号は、切替スイッチ105を経由して符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0106】また同時に、符号器101から出力された入力音声が高能率符号化された音声符号は、切替スイッチ114を経由して復号器102にも供給される。復号器102は、符号器101からの音声信号を入力として、通常の復号動作を行う。この動作の目的は、復号器102の内部状態を、送信端符号器101の内部状態と常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。そして、得られた復号音声信号が他の機能ブロックに出力されるのを阻止するように、切替スイッチ115が切り替えられる。
【0107】音声検出器103の判定が「有音」から「無音」に遷移するタイミングで、音声検出器103は、擬似背景雑音生成部112の初期化を制御する初期化信号1Bを出力する。擬似背景雑音生成部112は、この初期化信号1Bを受信したタイミングで内部状態をリセットする。この動作は、実施の形態1で説明したものと全く同一目的でなされるものである。
【0108】音声検出器103で「無音」と判定された場合は、切替スイッチ114を14A側に、切替スイッチ105を105A側に、切替スイッチ104を104B側に、それぞれ倒す。これにより、擬似背景雑音生成部112から出力された擬似背景雑音符号は、切替スイッチ114を経由して復号器102に入力され、復号処理された後、得られた復号擬似背景雑音信号は切替スイッチ105を経由して、符号器101に出力される。符号器101は、復号器102で復号された擬似背景雑音信号を入力として、通常の符号化動作を行う。この動作の目的は、符号器101の内部状態を、復号器102の内部状態と常に一致した状態に保つためにあり、符号化された音声信号を得るためではない。そして、得られた音声符号が伝送路Aに出力されるのを阻止するように、切替スイッチ104が切り替えられる。これら一連の動作により、符号器101の内部状態と、復号器102の内部状態は、常に一致した状態に保たれる。
【0109】ここで、符号器101と復号器102とでは、入力される信号にそれぞれ、原音声信号と、符号器101でいったん符号化された音声符号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する符号器101の内部状態と、復号器102の内部状態とは、極めて近似した値に保持される。
【0110】中継ノード23は、送信端11から伝送路Aを介して伝送された無音圧縮された第1の音声符号を受信する。有/無音情報抽出部207は、伝送路Aからの第1の音声符号の受信状況を常に監視し、その結果に応じて切替スイッチ214を制御する制御信号2Aを出力する。即ち、伝送路Aから第1の音声符号が入力された場合は、有音区間と判定して、切替スイッチ214を214B側に倒す。中継ノード23で受信した第1の音声符号は、スイッチ214を経由してそのまま伝送路Bにリレーされる。
【0111】一方、有/無音情報抽出部207において、伝送路Aからの信号の受信が検知されなかったとき、即ち「無音」と判定された区間においては、制御信号2Aによって、切替スイッチ214を214A側に倒す。擬似背景雑音信号が符号化されたデータが補充され、伝送路Bに出力される。勿論、実施例1と同様に、有/無音情報抽出部207の判定が「有音」から「無音」に遷移するタイミングで、有/無音情報抽出部207から、擬似背景雑音生成部212の初期化を制御する初期化信号2Bを出力する。擬似背景雑音生成部212は、この初期化信号2Bを受信したタイミングで状態をリセットする。
【0112】受信端30では、中継ノード23から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0113】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端11の符号器101の出力であるため、有音区間においては、送信端11の符号器101の内部状態と、受信端30の復号器302の内部状態は一致する。また、無音区間において受信端30に入力される第2の音声符号は中継ノード23の擬似背景雑音生成部212の出力である。先に説明したように、中継ノード23の擬似背景雑音生成部212の出力は、送信端11の擬似背景雑音生成部112の出力と一致しているため、受信端30からの見掛け上、あたかも送信端11から無音圧縮されていない擬似背景雑音符号を直接受信しているかの如き効果を得ることができる。
【0114】しかも、「無音」から「有音」に遷移し復号器302に入力される第2の音声符号が符号器101の出力信号に切り替わっても、送信端11の符号器101の内部状態と、受信端30の復号器302の内部状態は極めてよく一致しているため、復号器302から出力される信号から、内部状態の相違による異音の発生を防止することができる。
【0115】以上述べた通り、送信端11の符号器101の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。また、中継ノード23において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0116】実施の形態5.次に、実施の形態5について、図6を参照しながら説明する。本実施の形態は、実施の形態4で示した送信端11に対して、実施の形態2で示した中継ノード21における改良を加えて送信端12としたものである。なお、実施の形態4と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0117】送信端12において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端12の動作モードを制御する制御信号1Aを出力する。音声検出器103で「有音」と判定された場合は、切替スイッチ104を104B側に倒す。これにより、送信端12に入力された音声信号は、符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0118】次に、音声検出器103の判定が「有音」から「無音」に遷移するタイミングで、音声検出器103は、擬似背景雑音生成部112の初期化を制御する初期化信号1Bを出力する。擬似背景雑音生成部112は、この初期化信号1Bを受信したタイミングで内部状態をリセットし、擬似背景雑音符号(第1の擬似符号)の送出を開始する。
【0119】なお、擬似背景雑音生成部112は、中継ノード23の擬似背景雑音生成部212と同一の動作を実現するものであり、上記初期化動作についても、中継ノード23の擬似背景雑音生成部212と同一である。初期化動作は伝送路Aからの音声信号入力の有無、ひいては送信端12の音声検出器103の判定信号に同期して行われるため、送信端12の復号器102、及び中継ノード23の切替スイッチ214へは、同じタイミングで同一の擬似背景雑音符号を供給することができる。
【0120】同時に、初期化信号1Bは符号器101及び復号器102にも供給される。初期化信号1Bを受信した符号器101は、内部パラメータを復号器102に送出し、動作を停止する。復号器102は、初期化信号2Bにより符号器101から内部パラメータを受取り、これに基づいて、擬似背景雑音生成部112から供給される擬似背景雑音符号の復号化処理を開始する。
【0121】最後に、音声検出器103の判定が「無音」から「有音」に遷移するタイミングで、音声検出器103から、制御信号1Cを出力する。制御信号1Cを受信した復号器102は、内部パラメータを符号器101へ送出し、動作を停止する。符号器101は、制御信号1Cにより復号器102から内部パラメータを受取り、これに基づいて、原音声信号の符号化処理を開始する。これらの一連の動作により、符号器101の内部状態と、復号器102の内部状態とは、常に一致した状態に保たれるため、符号化処理を正常に再開することができる。
【0122】中継ノード23においては、実施の形態4で示した動作と同一の動作を行う。さらに、受信端30では、中継ノード23から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0123】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端12の符号器101の出力であるため、有音区間においては、送信端12の符号器101の内部状態と、受信端30の復号器302の内部状態とは一致する。また無音区間において受信端30に入力される第2の音声符号は中継ノード23の擬似背景雑音生成部212の出力である。先に説明したように、中継ノード23の擬似背景雑音生成部212の出力は、送信端12の擬似背景雑音生成部112の出力と一致しているため、受信端30からの見掛け上、あたかも送信端12から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0124】以上述べた通り、送信端12の符号器101の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、送信端12において符号器101が動作するのは無音区間のみであり、復号器102が動作するのは有音区間のみであるため、これらが同時に処理を実行することはなく、プロセッサの負荷削減によるコストの低減および消費電力の低減が実現される。また、中継ノード23において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0125】実施の形態6.次に、実施の形態6について、図7,8を参照しながら説明する。本実施の形態は、実施の形態4で示した送信端11に対して、実施の形態3で示した中継ノード22における改良を加えて送信端13としたものである。ここで、108は実施の形態3における補間信号発生器208と同等の機能を有する内部状態保持機能付き符号器(送信側符号化手段)である。なお、実施の形態4と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0126】まず、内部状態保持機能付き符号器108の動作を、図8を参照しながら説明する。これは、内部状態保持機能付き符号器108の具体的な構成を示すため、一例として高能率音声符号化方式にITU勧告G.728を適用したものである。図8と図4とを比較して判る通り、これは実施の形態3における補間信号発生器208の構造と何ら変わる点はない。このため、各機能ブロックの説明は省略する。
【0127】次に、図7を用いて、実施の形態6の音声伝送システムの動作について説明する。音声検出器103において、伝送路Aからの信号が「有音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421B側に、切替スイッチ422を422B側に、切替スイッチ423を423B側に、それぞれ倒す。この時の内部状態保持機能付き符号器108の構造および動作は、実施の形態1における符号器101の構造および動作と同一である。即ち、入力された原音声信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、内部状態保持機能付き符号器108から出力する。この出力信号が伝送路Aに送出される。
【0128】音声検出器103において、伝送路Aからの信号が「無音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421A側に、切替スイッチ422を422A側に、切替スイッチ423を423A側に、それぞれ倒す。ローカルデコーダ部420は擬似背景雑音生成部112からの信号を入力として、通常の復号動作を行う。この動作の目的は、バックワード型利得適応部410、及びバックワード型合成フィルタ適応部411を動作させて、利得乗算器404、合成フィルタ405の内部状態を、受信端復号器302の内部状態と、常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。
【0129】ここで、合成フィルタ405の出力、即ち復号された音声信号の出力経路はスイッチ423で遮断されているため、このローカルデコーダ420の出力は、他の機能ブロックから参照されることはない。また、内部状態保持機能付き符号器108において、ローカルデコーダ420以外の機能ブロック、即ちPCM伸長部401、ベクトルバッファ部402、加算器406、聴覚重み付けフィルタ407、最小自乗誤差探索部408は、入力すべき信号がないため停止させておく。
【0130】中継ノード23においては、実施の形態4で示した動作と同一の動作を行う。さらに、受信端30では、中継ノード23から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0131】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端13の内部状態保持機能付き符号器108の出力であるため、有音区間においては、送信端13の内部状態保持機能付き符号器108の内部状態と、受信端30の復号器302の内部状態は一致する。また無音区間において受信端30に入力される第2の音声符号は、中継ノード23の擬似背景雑音生成部212の出力である。これは送信端13の擬似背景雑音生成部112の出力と同一であるため、送信端13の内部状態保持機能付き符号器108の内部状態と、受信端30の復号器302の内部状態は一致する。以上のように、受信端30からの見掛け上、あたかも送信端13から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0132】以上述べた通り、送信端13の内部状態保持機能付き符号器108の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード23において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0133】実施の形態7.次に、実施の形態7について、図9〜11を参照しながら説明する。本実施の形態は、実施の形態6で示した送信端13に対して、実施の形態3で示した中継ノード22における改良を加えて、送信端14としたものである。また、実施の形態6で示した中継ノード23に改良を加えて、中継ノード24としたものである。
【0134】ここで、110は実施の形態6における送信端13の内部状態保持機能付き符号器108に改良を加えた内部状態保持機能付き符号器(送信側符号化手段)、111は擬似背景雑音発生用パラメータ生成部(送信側パラメータ生成手段)、211は擬似背景雑音発生用パラメータ生成部(中継側パラメータ生成手段)、210は実施の形態6における符号器の一部機能を有する簡易符号器である。なお、実施の形態6と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0135】まず、内部状態保持機能付き符号器110の動作を、図10を参照しながら説明する。これは、内部状態保持機能付き符号器110の具体的な構成を示すため、一例として高能率音声符号化方式にITU勧告G.728を適用したものである。図10と図8とを比較して判る通り、これは実施の形態6における内部状態保持機能付き符号器108の構造と、切替スイッチ421の位置が異なる以外はほぼ同一である。このため、各機能ブロックの説明は省略する。
【0136】また、符号化方式にITU勧告G.728 LD-CELP方式を用いた場合、擬似背景雑音発生用パラメータ生成部111から出力される信号の一つの例として、合成フィルタ駆動のための励振信号を用いる。LD-CELP音声符号化方式に基づく復号器においては、丁度人間の発生機構をモデル化した構造となっている。即ち人間の声帯音源に相当する励振信号を駆動源として用い、人間の声道情報をモデル化した合成フィルタによって調音し、音声を合成する構造となっている。音声符号として、励振信号をベクトル量子化した波形コードブックを用いている。擬似背景雑音発生用パラメータ生成部111は、量子化される前の励振信号を何らかの手段で発生させる機能ブロックである。
【0137】次に、図9を用いて、実施の形態7の音声伝送システムの動作について説明する。音声検出器103において、音声信号が「有音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421B側に、切替スイッチ422を422B側に、切替スイッチ423を423B側に、それぞれ倒す。この時の内部状態保持機能付き符号器110の構造および動作は、実施の形態1における通常の符号器101の構造および動作と同一となる。即ち、入力された原音声信号を入力として、ローカルデコーダで合成された合成音声信号の候補から最も近似した合成信号を選択し、その合成信号の元となった背景雑音符号を最適符号として、内部状態保持機能付き符号器110から出力する。この出力信号が伝送路Aに送出される。
【0138】音声検出器103において、音声信号が「無音」と判定された区間においては、制御信号1Aにより、切替スイッチ421を421A側に、切替スイッチ422を422A側に、切替スイッチ423を423A側に、それぞれ倒す。ローカルデコーダ部420は擬似背景雑音発生用パラメータ生成部111から出力される励振信号(第1のパラメータ信号)を入力とし、この信号を用いて復号動作を行う。この復号処理は通常の復号処理から丁度逆量子化手段403を飛ばしたものと同じである。
【0139】この動作の目的は、バックワード型利得適応部410、及びバックワード型合成フィルタ適応部411を動作させて、利得乗算器404、合成フィルタ405の内部状態を、受信端復号器302の内部状態と、常に一致させた状態に保つためにあり、復号された音声信号を得るためではない。そして、合成フィルタ405の出力、即ち復号された音声信号の出力経路はスイッチ423で遮断されているため、このローカルデコーダ420の出力は、他の機能ブロックから参照されることはない。また、内部状態保持機能付き符号器110において、ローカルデコーダ420以外の機能ブロック、即ちPCM伸長部401、ベクトルバッファ部402、加算器406、聴覚重み付けフィルタ407、最小自乗誤差探索部408は、入力とすべき信号がないため停止させておく。
【0140】中継ノード24において、送信端14と同じ擬似背景雑音発生用パラメータ生成部211を備えており、送信端14の擬似背景雑音発生用パラメータ生成部111と、同期して動作する。この方法は、実施の形態1における擬似背景雑音生成部106,206と同様な手法を用いることによって実現される。中継ノード24において欠落した無音区間の音声符号を補間するため、擬似背景雑音発生用パラメータ生成部211から出力された励振信号(第2のパラメータ信号)を符号化する機能を有する簡易符号器210によって、擬似背景雑音符号が補間される。
【0141】次に、簡易符号器210の構造を図11に示す。ベクトルバッファ431において時間的に連続する励振信号を5サンプル分蓄積してベクトル化し、加算器434に出力する。一方、波形コードブックに蓄積されたすべての符号の候補について逆量子化器432において逆量子化を行って励振信号の候補を生成する。これら励振信号候補のすべてに対して加算器434に入力し、入力された励振信号との自乗誤差をとり、その中からもっとも近似した励振信号候補を生成した符号を、最適符号として出力する。これにより、LD-CELP方式に基づく符号と同等の擬似背景雑音符号を生成することができる。
【0142】さらに、受信端30では、中継ノード24から伝送路Bを介して連続して伝送され、無音区間が擬似背景雑音符号で補間された第2の音声符号を受信する。復号器302は入力された第2の音声符号を基に復号処理を行い、音声信号に復号して受信端30から出力する。
【0143】ここで、受信端30に入力される第2の音声符号は、有音区間では送信端14の内部状態保持機能付き符号器110の出力であるため、有音区間においては、送信端14の内部状態保持機能付き符号器110の内部状態と、受信端30の復号器302の内部状態は一致する。また無音区間において受信端30に入力される第2の音声符号は、中継ノード24の擬似背景雑音発生用パラメータ生成部211の出力である。これは送信端14の擬似背景雑音発生用パラメータ生成部111の出力と同一であるため、送信端14の内部状態保持機能付き符号器110の内部状態と、受信端30の復号器302の内部状態は一致する。以上のように、受信端30からの見掛け上、あたかも送信端14から無音圧縮されていない音声符号を直接受信しているかの如き効果を得ることができる。
【0144】以上述べた通り、送信端14の内部状態保持機能付き符号器110の内部状態と、受信端30の復号器302の内部状態との一致は常に図られているため、内部状態の不整合に起因する耳障りな音声を復号するおそれは回避される。さらに、中継ノード24において追加する機能ブロックが少なくて済み、経済的に高品質な音声伝送を実現することができる。
【0145】実施の形態8.以下、実施の形態8について、図12〜14を参照しながら説明する。本実施の形態において、実施の形態1の音声符号化伝送システムにおける送信端10および中継ノード20に改良を加えて、送信端15および中継ノード25としたものである。ここで、213は送信端15から出力された第1の音声信号が「無音」から「有音」に切り替わった直後の遷移区間をカウントするタイマである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0146】次に、実施の形態8の動作を説明する。送信端15において、音声検出器103は、入力された原音声信号を基に有音区間・無音区間の識別を行い、その結果に基づいて送信端15の動作モードを制御する制御信号1Aを出力する。音声検出器103で「有音」と判定された場合は、切替スイッチ104を104B側に倒す。これにより、送信端15に入力された原音声信号は符号器101に入力され、高能率符号化された後、切替スイッチ104を経由して伝送路Aに出力される。
【0147】一方、音声検出器103で「無音」と判定された場合は、切替スイッチ104を104A側に倒す。このとき、符号器101から出力される音声符号は切替スイッチ104で遮断され、伝送路Aには何も出力されない。また、「無音」状態から「有音」状態へ遷移したことを音声検出器103が検出したタイミングで、符号器101を初期化するための初期化信号1Bを符号器へ出力する。符号器101はこの初期化信号1Bを受信したタイミングで、内部状態の初期化動作を実行する。
【0148】本実施の形態に関し、中継ノード25の動作は、有/無音情報抽出部207から出力される制御信号の状態によって、3つのモードを有している。この動作モードについて、図13に基づいて説明する。図13は送信端15の符号器101に入力される原音声信号の波形図である。縦軸は信号レベル、横軸は時間を表している。有音/無音情報抽出部207は、送信端15の音声検出器103の動作を反映する伝送路Aからの音声符号の受信状況を常に監視し、その結果動作モードに対応した3つの区間に区分し、中継ノード25の動作を制御する。
【0149】第1に、中継ノード25に人力された高能率音声符号から、トークスパートが検出されない期間(無音区間)をモード1とする。第2に、中継ノード25に入力された高能率音声符号から、トークスパートが検出され始めてから数10msec〜数100msecの間(遷移期間、又は過渡期間と称する)をモード2とする。第3に、モード2以降、引続きトークスパートが検出される間をモード3とする。有音/無音情報抽出部207、及びタイマ213は、以上述べた動作モード判定結果を反映した制御信号2A,2Fを出力し、中継ノード25の各機能ブロックに供給する。
【0150】ここで、モード2の継続時間(遷移期間)として数10msec〜100msecという値を提示したが、この値の根拠は以下の経験則によっている。まず前提条件として、高能率符号化方式としてITU勧告G.728(LD-CELP方式)を用い、中継ノード25の符号器201の内部状態と、受信端30の復号器302の内部状態とが全く異なっているものとする。この前提条件の基で符号器201と復号器302とで伝送路を介して符号化/復号を行う。LD-CELP方式で使用するフィルタはすべて安定性が保証されているので、送受の内部状態は送受で同一になる方向に次第に収束していく。
【0151】そのまま符号化/復号を継続する内、異音の発生するおそれがなくなる程度にまで内部状態が十分一致する。モード遷移から内部状態の十分一致するまでに要する時間が、数10msec〜100msecである。もちろん、使用する高能率符号化方式によって、この値は変化することが予想されることはいうまでもなく、それぞれの符号化方式に応じた遷移期間の設定を行うことは重要である。
【0152】図14は、以上説明した各モードの遷移をまとめたモード遷移図である。3つのモード間の遷移は、矢印で示した方向のみ許されており、それ以外の遷移は禁止された遷移であるか、または物理的にあり得ない遷移である。
【0153】次に、各モード別に中継ノード25の動作を説明する。まず、モード1、即ち有音/無音情報抽出部207において「無音」と判定された区間においては、切替スイッチ205を205A側に、切替スイッチ214を214Aに、それぞれ倒す。この時、擬似背景雑音生成部206側の出力信号は、切替スイッチ205を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、切替スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器202は入力信号を失うため、動作を停止させる。
【0154】モード1からモード2に遷移するとき、即ち、有音/無音情報抽出部207において、音声符号が検知されはじめたとき、復号器202にリセット信号2Bを発行する。有音/無音情報抽出部207の動作は音声検出器103の動作を忠実に反映していることから、これは送信端15の符号器101の初期化と同期して実行される。
【0155】モード2においては、切替スイッチ205を205Bに倒し、切替スイッチ214は214Aに接続したままとする。中継ノード25で受信した音声符号は、復号器202に供給される。符号器202は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して、符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ214を経由して伝送路Bに出力される。即ち、中継ノード25においてタンデム接続を行ったのと同じ形となる。
【0156】モード3においては、タイマ213からの制御信号2Fを受信した切替スイッチ214が214B側に倒れる。また、切替スイッチ205は205B側に接続したままとする。中継ノード25で受信した音声符号は、切替スイッチ214を経由してそのまま伝送路Bにリレーされる。また当該音声符号は、復号器202にも供給される。復号器202は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。
【0157】ここで、送信端15の符号器101と、中継ノード25の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器101の内部状態と、中継符号器201の内部状態とは、極めて近似した値に保持される。
【0158】本実施の形態において、モード1からいきなりモード3に遷移させた場合について考察する。取り敢えず、送信端符号器101と中継復号器202の内部状態、及び中継符号器201の内部状態と受信端復号器302の内部状態とは、それぞれ一致していることが保障されている。ところが、送信端符号器101と受信端復号器302の内部状態については、その一致については全く保証されない。従ってモード1からモード3に一足飛びに遷移すると、ちょうど従来例で示したディジタル1リンクの形と同様になり、内部状態の不一致に起因する異音発生を引き起こす。ここで、モード1からモード3に遷移する間に遷移区間としてモード2を設けることにより、送信端符号器101の内部状態と受信端復号器302の内部状態とが十分一致するため、この段階でモード3に遷移させても異音の発生を回避することが可能となる。
【0159】この実施の形態に係る音声符号化伝送システムは、音声の品質劣化を引き起こすことが知られているタンデム接続を許す期間を無音状態から有音状態に遷移する過渡期のわずかな時間に制限し、大部分のトークスパートは1リンクの符号化/復号で接続することによって、品質劣化を回避することができ、高能率音声符号化方式の性能をフルに引き出すことが可能となる。また、中継ノードでのプロセッサの処理負荷、及びハードウエア規模の低減が可能となる。なお、本実施の形態では、高能率符号化方式にITU勧告G.728 LD−CELP方式を適用したシステムについて述べたが、本発明の適用例がこの符号化方式に限定されるということを示している訳ではなく、過去の符号化/復号結果を利用する、あらゆる音声符号化方式に適用できることは容易に推察できる。
【0160】実施の形態9.以下、実施の形態9について、図15を参照しながら説明する。本実施の形態において、実施の形態8で示した中継ノード25に対して、タイマ213を比較器(比較手段)215に置き換えて、中継ノード26としたものである。ここで、比較器215は、復号器202の内部状態と符号器201の内部状態とを数値的に比較するものである。なお、実施の形態8と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0161】次に、中継ノード26の動作を説明する。まず、モード1、即ち有音/無音情報抽出部207において「無音」と判定された区間においては、切替スイッチ205を205A側に、切替スイッチ214を214A側に、それぞれ倒す。この時、擬似背景雑音生成部206側の出力信号は、切替スイッチ205を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、切替スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器202は入力信号を失うため、動作を停止させる。
【0162】モード1からモード2に遷移するとき、即ち、有音/無音情報抽出部207において、音声符号が検知されはじめたとき、復号器202にリセット信号2Bを発行する。有音/無音情報抽出部207の動作は音声検出器103の動作を忠実に反映していることから、これは送信端15の符号器101の初期化と同期して実行される。
【0163】モード2においては、切替スイッチ205を205Bに倒し、切替スイッチ214は214Aに接続したままとする。中継ノード25で受信した音声符号は、復号器202に供給される。符号器202は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して、符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ214を経由して伝送路Bに出力される。即ち、中継ノード25においてタンデム接続を行ったのと同じ形となる。
【0164】モード3においては、符号器201の内部パラメータと復号器202の内部パラメータとが比較器215に与えられる。比較器215では、これらの内部パラメータが所定のレベル内で一致しているか判定し、このレベル内で一致している場合に制御信号2Dを切替スイッチ214に出力する。そして、この制御信号2Fを受信した切替スイッチ214が214B側に倒れる。また、切替スイッチ205は205B側に接続したままとする。
【0165】中継ノード25で受信した音声符号は、切替スイッチ214を経由してそのまま伝送路Bにリレーされる。また当該音声符号は、復号器202にも供給される。復号器202は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。
【0166】ここで、送信端15の符号器101と、中継ノード25の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器101の内部状態と、中継符号器201の内部状態とは、極めて近似した値に保持される。
【0167】以上のように、モード2からモード3への遷移タイミングの決定を比較器215の判定結果によって制御することにより、送信端15の符号器101の内部状態と、受信端30の復号器302の内部状態とをより確実に一致させることができ、異音の発生するおそれを更に減少させる効果がある。
【0168】実施の形態10.以下、実施の形態10について、図16を参照しながら説明する。本実施の形態において、実施の形態8で示した中継ノード25に対して、比較器(比較手段)215と判定回路(判定手段)216とを追加して、中継ノード27としたものである。ここで、比較器215は、復号器202の内部状態と符号器201の内部状態とを数値的に比較するものであり、判定回路216は、タイマ213から出力された制御信号2Fと比較器215から出力された制御信号2Dとに基づいて、モード3への遷移タイミングを判定するものである。なお、実施の形態8と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0169】次に、中継ノード27の動作を説明する。まず、モード1、即ち有音/無音情報抽出部207において「無音」と判定された区間においては、切替スイッチ205を205A側に、切替スイッチ214を214A側に、それぞれ倒す。この時、擬似背景雑音生成部206側の出力信号は、切替スイッチ205を経由して符号器201に入力される。符号器201は入力された擬似背景雑音信号に基づき符号化処理を実行し、擬似背景雑音符号を出力する。符号器201から出力された擬似背景雑音符号は、切替スイッチ214を経由して伝送路Aへ送出される。この一連の動作により、無音区間の信号を擬似背景雑音信号で補充することができる。そしてこの時、復号器202は入力信号を失うため、動作を停止させる。
【0170】モード1からモード2に遷移するとき、即ち、有音/無音情報抽出部207において、音声符号が検知されはじめたとき、復号器202にリセット信号2Bを発行する。有音/無音情報抽出部207の動作は音声検出器103の動作を忠実に反映していることから、これは送信端15の符号器101の初期化と同期して実行される。
【0171】モード2においては、切替スイッチ205を205Bに倒し、切替スイッチ214は214Aに接続したままとする。中継ノード25で受信した音声符号は、復号器202に供給される。符号器202は入力された音声符号に基づいて復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して、符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。この音声符号は、切替スイッチ214を経由して伝送路Bに出力される。即ち、中継ノード25においてタンデム接続を行ったのと同じ形となる。
【0172】モード3においては、符号器201の内部パラメータと復号器202の内部パラメータとが比較器215に与えられる。比較器215では、これらの内部パラメータが所定のレベル内で一致しているか判定し、このレベル内で一致している場合に制御信号2Dを判定回路216に出力する。また、タイマ213では、モード3への遷移タイミングをカウントし、所定のカウント値で制御信号2Fを判定回路216に出力する。
【0173】判定回路216では、これらの制御信号2D,2Fの入力を受け付けて、両者の制御信号2D,2Fが入力された場合に、制御信号2Eを切替スイッチ214に出力する。そして、この制御信号2Eを受信した切替スイッチ214が214B側に倒れる。また、切替スイッチ205は205B側に接続したままとする。
【0174】中継ノード25で受信した音声符号は、切替スイッチ214を経由してそのまま伝送路Bにリレーされる。また当該音声符号は、復号器202にも供給される。復号器202は入力された音声符号に基づき復号処理を実行し、音声信号を復号する。復号された音声信号は、切替スイッチ205を経由して符号器201に供給される。符号器201は入力された音声信号に基づき符号化処理を実行する。
【0175】ここで、送信端15の符号器101と、中継ノード25の符号器201とでは、入力される信号にそれぞれ原音声信号と、復号器202で復号された復号音声信号という違いはあるものの、音声の性質はきわめて似通ったものである。従って、音声信号の性質を数値化したものに相当する、送信端符号器101の内部状態と、中継符号器201の内部状態とは、極めて近似した値に保持される。
【0176】以上のように、モード2からモード3への遷移タイミングの決定を、この判定部の判定結果によって制御することにより、送信端15の符号器101の内部状態と、受信端30の復号器302の内部状態とをより確実に一致させることができる。その結果、異音の発生するおそれを減少させつつ、タンデム時間が長時間に及んで音声品質が低下するのを防止することができる。
【0177】実施の形態11.図17は、実施の形態1〜6,8〜10における擬似背景雑音生成部106,206、実施の形態7における擬似背景雑音発生用パラメータ生成部111,211の構造の一例を詳細に記したものである。補間信号は同図に示す巡回型のメモリに格納されている。擬似背景雑音信号シーケンスはサンプル単位(あるいは、擬似背景雑音符号についてはフレーム単位)でメモリ空間の所定のアドレスに順番に格納されている。擬似背景雑音信号出力時は、アドレスポインタが示すサンプルを出力し、ポインタを1アドレス分進める。
【0178】メモリを巡回型にすることにより、あらゆる長さの無音区間にも対応することができるが、メモリサイズを小さくすると、巡回メモリによる周期性により擬似背景雑音信号に特定の周波数の信号成分が乗ってしまう弊害が出るため、メモリサイズは十分に大きくすべきである。ここで、これら擬似背景雑音生成部106,206または擬似背景雑音発生用パラメータ生成部111,211が初期化信号2Bを受信したときは、ポインタの位置をアドレス0に設定し直す。この動作によって、送信端10〜15と中継ノード20〜27の擬似背景雑音生成部106,206間で、無音圧縮による断絶状態が発生しても、両端で同期した動作を実現することができる。
【0179】実施の形態12.図18は実施の形態1〜6,8〜10における擬似背景雑音生成部106,206、実施の形態7における擬似背景雑音発生用パラメータ生成部111,211の構造の一例を詳細に記したものであり、441は白色雑音発生部(ランダム信号発生器)、442はフィルタである。白色雑音発生部441は、通常の音声通信において生じる背景雑音の成分が、白色性(ランダム性)が強いことに着目して、無音区間に補間する背景雑音信号を乱数発生器の出力信号で擬似的に実現しようというものである。乱数の発生方法は、例えばPNパターンによる方法、剰余を取る方法などがある。
【0180】ここで、これらの擬似背景雑音生成部106,206または擬似背景雑音発生用パラメータ生成部111,211が初期化信号2Bを受信したときは、この乱数発生器の初期値である種(seed)として、送信端10〜15、中継ノード20〜27の両者にあらかじめ設定しておいた値を与える。この動作によって、送信端10〜15と中継ノード20〜27の擬似背景雑音信号生成部106,206間で、無音圧縮による断絶状態が発生しても、両端で同期した動作を実現することができる。また、乱数発生器の出力端に、自然な背景雑音の周波数特性に近い特性を持つフィルタ442(例えば、1/f特性を持つフィルタなど)を挿入することにより、より違和感の無い擬似背景雑音信号を得ることができる。
【0181】実施の形態13.次に、実施の形態13について、図19を参照しながら説明する。本実施の形態は、実施の形態1に示した送信端10の音声検出器103と中継ノード20の有音/無音情報抽出部207との間にシグナリングチャネル(同期信号送出手段)103A(たとえば、ISDNのDチャネル等)を接続したものである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0182】実施の形態1で説明した通り、有音区間及び無音区間の判定基準として、音声符号の有無を調べる方法がある。例えば、伝送路AがATMネットワークである場合、送信端10から送信されるセルが来なかったら無音区間に遷移したと判定するのも一つのやり方である。
【0183】ところが、ATM網内で、ネットワーク特有の劣化要因であるセル廃棄が発生した場合、中継ノード20で誤って無音区間と認識してしまうおそれがある。これを回避するために、送信端10の音声検出器103と中継ノード20の有音/無音情報抽出部207との間にシグナリングチャネル103Aを接続する。そして、有音区間から無音区間に遷移したことを知らせる情報を、このシグナリングチャネル103Aを用いて送信端10から中継ノード20へ別途通知することによって、無音遷移の誤認識を防止する上でより高品質な音声伝送を実現することができる。
【0184】なお、実施の形態2〜9においても、送信端10〜15の音声検出器103と中継ノード21〜27の有音/無音情報抽出部207との間にシグナリングチャネル103Aを接続して、送信端10〜15から中継ノード21〜27へ情報を別途通知する本方式が適用できることはいうまでもない。
【0185】実施の形態14.次に、実施の形態14について、図20を参照しながら説明する。本実施の形態は、実施の形態1で示した送信端10に対して、識別パターン生成部(識別パターン発生手段)217を追加して、送信端16としたものである。ここで、識別パターン生成部217は、有音区間の最終であることを示すシグナリング伝送用符号パターンを生成するものである。なお、実施の形態1と同一又は同等な構成部分については同一符号を付し、その説明を省略する。
【0186】本実施の形態は、有音区間から無音区間に遷移したことを、送信端10から中継ノード20へ知らせるシグナリングの伝送方法に改良を加えたものである。本実施の形態においては、このシグナリング情報をインチャネルで伝送する。即ち、送信端10において、音声検出器103が有音区間から無音区間に遷移したことを検出したタイミングで、最終の音声符号の伝送後、切替スイッチ104を104C側に切替る。この切替えによって、識別パターン生成部217で生成されたシグナリング伝送用符号パターンが中継ノード20に送出される。シグナリング伝送用符号パターンの送出後、切替スイッチ104を104A側に切替え、シグナリング伝送用符号パターンの送出を停止する。
【0187】中継ノード20の有音/無音情報抽出部207は、伝送路Aから入力される信号を常に監視し、このシグナリング伝送用符号パターンを認識したタイミングで、「有音」から「無音」に遷移したことを知らせる制御信号2Aを出力する。この方式を用いることにより、無音遷移の誤認識を防ぎ、高品質な音声伝送を実現することができるのはもとより、信号方式を変更することなく、機能ブロックの追加だけで実現できるという利点がある。
【0188】なお、実施の形態2〜9においても、送信端10〜15に識別パターン生成部217を追加して、シグナリング情報をインチャネルで伝送する本方式が適用できることはいうまでもない。
【0189】
【発明の効果】本発明による音声符号化伝送システムであれば、タンデム接続による音声品質の劣化を回避することができ、、送信端で符号化処理する際の内部状態と、受信端で復号処理する際の内部状態との一致が常に図られているため、内部状態の不整合に起因する異音や耳障り感を減少させることができる。
【図面の簡単な説明】
【図1】実施の形態1に係る音声符号化伝送システムの構成を示すブロック図である。
【図2】実施の形態2に係る音声符号化伝送システムの構成を示すブロック図である。
【図3】実施の形態3に係る音声符号化伝送システムの構成を示すブロック図である。
【図4】実施の形態3に係る補間信号発生器の構成を詳細に示すブロック図である。
【図5】実施の形態4に係る音声符号化伝送システムの構成を示すブロック図である。
【図6】実施の形態5に係る音声符号化伝送システムの構成を示すブロック図である。
【図7】実施の形態6に係る音声符号化伝送システムの構成を示すブロック図である。
【図8】実施の形態6に係る内部状態保持機能付き符号器の構成を詳細に示すブロック図である。
【図9】実施の形態7に係る音声符号化伝送システムの構成を示すブロック図である。
【図10】実施の形態7に係る内部状態保持機能付き符号器の構成を詳細に示すブロック図である。
【図11】実施の形態7に係る簡易符号器の構成を詳細に示すブロック図である。
【図12】実施の形態8に係る音声符号化伝送システムの構成を示すブロック図である。
【図13】実施の形態8に係る送信端の符号器に入力される原音声信号の波形図である。
【図14】実施の形態8に係る動作モード間の遷移を示す状態遷移図である。
【図15】実施の形態9に係る音声符号化伝送システムの構成を示すブロック図である。
【図16】実施の形態10に係る音声符号化伝送システムの構成を示すブロック図である。
【図17】実施の形態11に係る擬似背景雑音信号発生部の構成を示す図である。
【図18】実施の形態12に係る擬似背景雑音信号発生部の構成を示す図である。
【図19】実施の形態13に係る音声符号化伝送システムの構成を示すブロック図である。
【図20】実施の形態14に係る音声符号化伝送システムの構成を示すブロック図である。
【図21】符号化方式の一例であるITU-T勧告G.728 LD-CELP音声符号化方式のシステム構成を示すブロック図である。
【図22】従来の音声符号化伝送システムの構成を示すブロック図である。
【図23】従来のタンデム接続による音声符号化伝送システムの構成を示すブロック図である。
【図24】従来のディジタル1リンク接続による音声符号化伝送システムの構成を示すブロック図である。
【符号の説明】
1〜16…送信端、20〜27…中継ノード、30…受信端、101…符号器(送信側符号化手段)、102…復号器(送信側復号化手段)、103A…シグナリングチャネル(同期信号伝送手段)、104…切替スイッチ(送信側音声符号生成手段)、105…切替スイッチ(送信側背景雑音挿入手段)、106,112…擬似背景雑音生成部(送信側背景雑音生成手段)、108,110…内部状態保持機能付き符号器(送信側符号化手段)、111…擬似背景雑音発生用パラメータ生成部(送信側パラメータ生成手段)、201…符号器(中継側符号化手段)、202…復号器(中継側復号化手段)、204…切替スイッチ(中継側背景雑音挿入手段)、206,212…擬似背景雑音生成部(中継側背景雑音生成手段)、208…補間信号発生器(補間信号生成手段)、210…簡易符号器(中継側符号化手段)、211…擬似背景雑音発生用パラメータ生成部(中継側パラメータ生成手段)、213…タイマ、214…切替スイッチ(中継側音声符号生成手段)、215…比較器(比較手段)、216…判定回路(判定手段)、217…識別パターン生成部(識別パターン発生手段)、A…伝送路(第1の伝送路)、B…伝送路(第2の伝送路)。
【特許請求の範囲】
【請求項1】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第1の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、前記中継側復号化手段で復号化された音声信号の無音区間に前記第2の擬似信号を挿入する中継側背景雑音挿入手段と、前記中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された音声符号を前記第1の音声符号の無音区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項2】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第1の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、前記第2の擬似信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された擬似符号を前記第1の音声符号の無音区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記中継側符号化手段は、前記中継側復号化手段の内部パラメータを入力して、この内部パラメータを用いて前記中継側復号化手段と同等の内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項3】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第1の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音送信手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、前記第1の音声符号を復号化すると共に、前記第2の擬似信号を符号化する補間信号生成手段と、前記補間信号生成手段で符号化された擬似符号を前記第1の音声符号の無音区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記補間信号生成手段は、復号化処理と符号化処理とで共通した内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項4】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、前記第1の擬似符号を復号化する送信側復号化手段と、前記送信側復号化手段で復号化された擬似信号を前記原音声信号の無音区間に挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、前記第1の音声符号の無音区間に前記第2の擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記送信側復号化手段は、前記送信側符号化手段で符号化された音声符号を入力して、有音区間についてはこの音声符号を復号化すると共に、無音区間については前記第2の擬似符号を復号化していることを特徴とする音声符号化伝送システム。
【請求項5】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、前記第1の擬似符号を復号化する送信側復号化手段と、前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、前記第1の音声符号の無音区間に前記第2の擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記送信側符号化手段は、前記送信側復号化手段の内部パラメータを入力して、この内部パラメータを用いて前記送信側復号化手段と同等の内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項6】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記第1の擬似信号に基づく内部状態を保持しつつ前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、前記第1の音声符号の無音区間に前記第2の擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項7】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第1の音声符号を復号化して音声信号を生成する中継側復号化手段と、背景雑音を模した擬似信号を生成する中継側背景雑音生成手段と、前記中継側復号化手段で生成された音声信号の無音区間に前記擬似信号を挿入する中継側背景雑音挿入手段と、前記中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された音声符号を、前記第1の音声符号の無音区間および無音から有音に切り替わった直後の遷移区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項8】 前記中継ノードは、前記遷移区間をカウントするタイマを更に備え、前記中継側音声符号生成手段では、前記タイマのカウント値に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項7記載の音声符号化伝送システム。
【請求項9】 前記中継ノードは、前記中継側復号化手段の内部状態と前記中継側符号化手段の内部状態とを比較する比較手段を更に備え、前記中継側音声符号生成手段では、前記比較手段の比較結果に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項7記載の音声符号化伝送システム。
【請求項10】 前記中継ノードは、前記遷移区間をカウントするタイマと、前記中継側復号化手段の内部状態と前記中継側符号化手段の内部状態とを比較する比較手段と、前記タイマのカウント値および前記比較手段の比較結果に基づいて前記遷移区間の終了タイミングを判定する判定手段とを更に備え、前記中継側音声符号生成手段では、前記判定手段の判定結果に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項7記載の音声符号化伝送システム。
【請求項11】 前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、無音区間の背景雑音を模したディジタル信号を疑似音声として生成していることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項12】 前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項13】 前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、ランダム信号発生器であることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項14】 前記原音声信号の無音区間の開始を示す同期信号を前記送信端から前記中継ノードに伝送させる同期信号伝送手段を更に備え、前記中継ノードは、前記同期信号を受信して、前記送信側背景雑音生成手段と前記中継側背景雑音生成手段とを同期させていることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項15】 前記送信端は、前記原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、前記中継ノードは、前記識別パターンを認識して、前記送信側背景雑音生成手段と前記中継側背景雑音生成手段とを同期させていることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項16】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、擬似背景雑音発生用の第1のパラメータ信号を生成する送信側パラメータ生成手段と、前記第1のパラメータ信号に基づく内部状態を保持しつつ前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、擬似背景雑音発生用の第2のパラメータ信号を生成する中継側パラメータ生成手段と、前記第2のパラメータ信号に基づいて擬似符号を生成する中継側符号化手段と、前記第1の音声符号の無音区間に前記擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項17】 前記送信側パラメータ生成手段及び前記中継側パラメータ生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする請求項16記載の音声符号化伝送システム。
【請求項18】 前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段は、ランダム符号発生器であることを特徴とする請求項16記載の音声符号化伝送システム。
【請求項19】 前記送信端は、前記原音声信号の無音区間の開始を示す同期信号を送出する同期信号送出手段を更に備え、前記中継ノードは、前記同期信号を受信して、前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段とを同期させていることを特徴とする請求項16記載の音声符号化伝送システム。
【請求項20】 前記送信端は、前記原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、前記中継ノードは、前記識別パターンを認識して、前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段とを同期させていることを特徴とする請求項16記載の音声符号化伝送システム。
【請求項1】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第1の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、前記中継側復号化手段で復号化された音声信号の無音区間に前記第2の擬似信号を挿入する中継側背景雑音挿入手段と、前記中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された音声符号を前記第1の音声符号の無音区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項2】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第1の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第1の音声符号を復号化する中継側復号化手段と、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、前記第2の擬似信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された擬似符号を前記第1の音声符号の無音区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記中継側符号化手段は、前記中継側復号化手段の内部パラメータを入力して、この内部パラメータを用いて前記中継側復号化手段と同等の内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項3】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記原音声信号の無音区間に前記第1の擬似信号を挿入する送信側背景雑音挿入手段と、前記送信側背景雑音送信手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似信号を生成する中継側背景雑音生成手段と、前記第1の音声符号を復号化すると共に、前記第2の擬似信号を符号化する補間信号生成手段と、前記補間信号生成手段で符号化された擬似符号を前記第1の音声符号の無音区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記補間信号生成手段は、復号化処理と符号化処理とで共通した内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項4】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、前記第1の擬似符号を復号化する送信側復号化手段と、前記送信側復号化手段で復号化された擬似信号を前記原音声信号の無音区間に挿入する送信側背景雑音挿入手段と、前記送信側背景雑音挿入手段によって得られた音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、前記第1の音声符号の無音区間に前記第2の擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記送信側復号化手段は、前記送信側符号化手段で符号化された音声符号を入力して、有音区間についてはこの音声符号を復号化すると共に、無音区間については前記第2の擬似符号を復号化していることを特徴とする音声符号化伝送システム。
【請求項5】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似符号を生成する送信側背景雑音生成手段と、前記第1の擬似符号を復号化する送信側復号化手段と、前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、前記第1の音声符号の無音区間に前記第2の擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備え、前記送信側符号化手段は、前記送信側復号化手段の内部パラメータを入力して、この内部パラメータを用いて前記送信側復号化手段と同等の内部状態を保持していることを特徴とする音声符号化伝送システム。
【請求項6】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、背景雑音を模した第1の擬似信号を生成する送信側背景雑音生成手段と、前記第1の擬似信号に基づく内部状態を保持しつつ前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、背景雑音を模した第2の擬似符号を生成する中継側背景雑音生成手段と、前記第1の音声符号の無音区間に前記第2の擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項7】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、前記第1の音声符号を復号化して音声信号を生成する中継側復号化手段と、背景雑音を模した擬似信号を生成する中継側背景雑音生成手段と、前記中継側復号化手段で生成された音声信号の無音区間に前記擬似信号を挿入する中継側背景雑音挿入手段と、前記中継側背景雑音挿入手段によって得られた音声信号を符号化する中継側符号化手段と、前記中継側符号化手段で符号化された音声符号を、前記第1の音声符号の無音区間および無音から有音に切り替わった直後の遷移区間に挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項8】 前記中継ノードは、前記遷移区間をカウントするタイマを更に備え、前記中継側音声符号生成手段では、前記タイマのカウント値に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項7記載の音声符号化伝送システム。
【請求項9】 前記中継ノードは、前記中継側復号化手段の内部状態と前記中継側符号化手段の内部状態とを比較する比較手段を更に備え、前記中継側音声符号生成手段では、前記比較手段の比較結果に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項7記載の音声符号化伝送システム。
【請求項10】 前記中継ノードは、前記遷移区間をカウントするタイマと、前記中継側復号化手段の内部状態と前記中継側符号化手段の内部状態とを比較する比較手段と、前記タイマのカウント値および前記比較手段の比較結果に基づいて前記遷移区間の終了タイミングを判定する判定手段とを更に備え、前記中継側音声符号生成手段では、前記判定手段の判定結果に基づいて、前記遷移区間の終了タイミングを決定していることを特徴とする請求項7記載の音声符号化伝送システム。
【請求項11】 前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、無音区間の背景雑音を模したディジタル信号を疑似音声として生成していることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項12】 前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項13】 前記送信側背景雑音生成手段及び前記中継側背景雑音生成手段は、ランダム信号発生器であることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項14】 前記原音声信号の無音区間の開始を示す同期信号を前記送信端から前記中継ノードに伝送させる同期信号伝送手段を更に備え、前記中継ノードは、前記同期信号を受信して、前記送信側背景雑音生成手段と前記中継側背景雑音生成手段とを同期させていることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項15】 前記送信端は、前記原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、前記中継ノードは、前記識別パターンを認識して、前記送信側背景雑音生成手段と前記中継側背景雑音生成手段とを同期させていることを特徴とする請求項1から請求項10のいずれか一項に記載の音声符号化伝送システム。
【請求項16】 原音声信号の有音区間を符号化処理すると共に無音圧縮して生成された第1の音声符号を第1の伝送路に出力する送信端と、前記第1の伝送路から受信した第1の音声符号に基づいて、前記原音声信号の無音区間に背景雑音を補間して生成された第2の音声符号を第2の伝送路に出力する中継ノードと、前記第2の伝送路から受信した第2の音声符号を復号処理して前記原音声信号を再生する受信端とを備える音声符号化伝送システムにおいて、前記送信端は、擬似背景雑音発生用の第1のパラメータ信号を生成する送信側パラメータ生成手段と、前記第1のパラメータ信号に基づく内部状態を保持しつつ前記原音声信号を符号化する送信側符号化手段と、前記送信側符号化手段で符号化された音声符号の無音区間を圧縮して、前記第1の音声符号を生成する送信側音声符号生成手段とを備え、前記中継ノードは、擬似背景雑音発生用の第2のパラメータ信号を生成する中継側パラメータ生成手段と、前記第2のパラメータ信号に基づいて擬似符号を生成する中継側符号化手段と、前記第1の音声符号の無音区間に前記擬似符号を挿入して、前記第2の音声符号を生成する中継側音声符号生成手段とを備えることを特徴とする音声符号化伝送システム。
【請求項17】 前記送信側パラメータ生成手段及び前記中継側パラメータ生成手段は、所定のディジタル信号を蓄積したメモリであることを特徴とする請求項16記載の音声符号化伝送システム。
【請求項18】 前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段は、ランダム符号発生器であることを特徴とする請求項16記載の音声符号化伝送システム。
【請求項19】 前記送信端は、前記原音声信号の無音区間の開始を示す同期信号を送出する同期信号送出手段を更に備え、前記中継ノードは、前記同期信号を受信して、前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段とを同期させていることを特徴とする請求項16記載の音声符号化伝送システム。
【請求項20】 前記送信端は、前記原音声信号の無音区間に重畳させる識別パターンを発生させる識別パターン発生手段を更に備え、前記中継ノードは、前記識別パターンを認識して、前記送信側パラメータ生成手段及び前記中継側パラメータ発生手段とを同期させていることを特徴とする請求項16記載の音声符号化伝送システム。
【図1】
【図2】
【図18】
【図3】
【図4】
【図5】
【図7】
【図6】
【図8】
【図9】
【図17】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図22】
【図19】
【図20】
【図21】
【図23】
【図24】
【図2】
【図18】
【図3】
【図4】
【図5】
【図7】
【図6】
【図8】
【図9】
【図17】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図22】
【図19】
【図20】
【図21】
【図23】
【図24】
【特許番号】特許第3487158号(P3487158)
【登録日】平成15年10月31日(2003.10.31)
【発行日】平成16年1月13日(2004.1.13)
【国際特許分類】
【出願番号】特願平10−44819
【出願日】平成10年2月26日(1998.2.26)
【公開番号】特開平11−243396
【公開日】平成11年9月7日(1999.9.7)
【審査請求日】平成13年2月16日(2001.2.16)
【出願人】(000006013)三菱電機株式会社 (33,312)
【参考文献】
【文献】特開 平9−321783(JP,A)
【文献】特開 平5−49054(JP,A)
【文献】特開 平4−362830(JP,A)
【文献】特開 平9−331330(JP,A)
【文献】特開 平6−69950(JP,A)
【文献】特開 平4−249446(JP,A)
【文献】特開 平4−923(JP,A)
【登録日】平成15年10月31日(2003.10.31)
【発行日】平成16年1月13日(2004.1.13)
【国際特許分類】
【出願日】平成10年2月26日(1998.2.26)
【公開番号】特開平11−243396
【公開日】平成11年9月7日(1999.9.7)
【審査請求日】平成13年2月16日(2001.2.16)
【出願人】(000006013)三菱電機株式会社 (33,312)
【参考文献】
【文献】特開 平9−321783(JP,A)
【文献】特開 平5−49054(JP,A)
【文献】特開 平4−362830(JP,A)
【文献】特開 平9−331330(JP,A)
【文献】特開 平6−69950(JP,A)
【文献】特開 平4−249446(JP,A)
【文献】特開 平4−923(JP,A)
[ Back to top ]