説明

背景雑音情報の断続伝送及び正確な再生の方法

【課題】帯域幅要求を低減すると同時に無線通信システムにおける音声品質を改善し、経費を下げ、且つ効率を増加させる新規の改良された方法及び装置を提供する。
【解決手段】背景雑音を伝送すること、背景雑音を通信するために使用される次の背景雑音データ比率フレームを削除すること、背景雑音を受信すること及び背景雑音を更新することのステップを含む背景雑音を通信する方法を含む。

【発明の詳細な説明】
【技術分野】
【0001】
35U.S.C.§119に基づく優先権主張
この出願は2005年2月1日出願の「背景雑音情報の断続伝送及び正確な再生の方法(Method for Discontinuous Transmission and Accurate Reproduction of Background Noise Information)」と題する米国仮出願番号第60/649,192号の特典を主張するものであり、この出願の全体の開示はこの出願の開示の一部であると考えられ、引用によりここに組込まれている。
【0002】
本発明は一般にネットワーク通信に関係する。特に、本発明は帯域幅要求を低減すると同時に無線通信システムにおける音声品質を改善し、経費を下げ、且つ効率を増加させる新規の改良された方法及び装置に関係する。
【背景技術】
【0003】
CDMAボコーダは背景雑音情報を通信するために既知の比率(rate)で1/8フレームの連続伝送を使用する。通話品質に影響を与えないでシステム容量を向上させるために、これら1/8フレームの大部分を省略(drop)し、或いは「削除する(blank)」ことが望ましい。従って、背景雑音の通信のために必要とされるオーバーヘッドを低減させるために、既知の比率のフレームを適切に選択し、且つ省略する方法が当技術において必要である。
【発明の概要】
【0004】
上記を考慮して、本発明の記載された特徴は一般に背景雑音を通信する一以上の改良されたシステム、方法及び/または装置に関係する。
【0005】
一実施例では、本発明は背景雑音を伝送すること、背景雑音を伝送するために使用される次の背景雑音データ比率フレームを削除すること、背景雑音を受信すること、及び背景雑音を更新することのステップを含む背景雑音を通信する方法を含む。
【0006】
別の実施例では、背景雑音を通信する方法は背景雑音が新しい原型(prototype)の比率フレームを伝送することによって変化するとき背景雑音の更新を始動させるステップをさらに含む。
【0007】
別の実施例では、背景雑音を通信する方法は背景雑音データ比率フレームをフィルタすることによって始動すること、背景雑音データ比率フレームのエネルギーを背景雑音データ比率フレームの平均エネルギーと比較すること、及び差分が閾値(threshold)を越えるならば更新背景雑音データ比率フレームを伝送することのステップをさらに含む。
【0008】
別の実施例では、背景雑音を通信する方法は背景雑音データ比率フレームをフィルタすることによって始動すること、背景雑音データ比率フレームのスペクトルを背景雑音データ比率フレームの平均スペクトルと比較すること、及び差分が閾値を越えるならば更新背景雑音データ比率フレームを伝送することのステップをさらに含む。
【0009】
別の実施例では、本発明は少なくとも一つの入力と少なくとも一つの出力を持つボコーダ(そこでは前記ボコーダは少なくとも一つの入力と少なくとも一つの出力を持つ復号器及び少なくとも一つの入力と少なくとも一つの出力を持つ符号器を含む)、メモリと少なくとも一つの入力及び少なくとも一つの出力を持つ少なくとも一つの高性能(smart)削除装置(そこでは第一の少なくとも一つの入力はボコーダの少なくとも一つの出力に機能的に接続され、少なくとも一つの出力はボコーダの少なくとも一つの入力に機能的に接続される)、少なくとも一つの入力と少なくとも一つの出力を持つジッター補正バッファ(de-jitter buffer)(そこでは少なくとも一つの出力は高性能削除装置の第二の少なくとも一つの入力に機能的に接続される)を含む背景雑音を通信するための装置;及び少なくとも一つの入力と少なくとも一つの出力を持つネットワーク・スタック(そこでは少なくとも一つの入力はジッター補正バッファの少なくとも一つの入力に機能的に接続され、少なくとも一つの入力は高性能削除装置の少なくとも一つの出力に機能的に接続される)を含む。
【0010】
別の実施例では、高性能削除装置は、背景雑音を伝送すること、背景雑音を通信するために使用される次の背景雑音データ比率フレームを削除すること、背景雑音を受信すること、及び背景雑音を更新することを含むメモリに記憶された命令(instructions)を実行するように適応される。
【0011】
本発明の適用のさらなる範囲は次の詳細な記述、請求項、及び図面から明白になるであろう。しかしながら、発明の精神及び範囲の中での様々な変更及び修正は当業者にとって明白になるので、詳細な記述及び特定の例は、発明の好ましい実施例を示すとともに、例示の目的のみとして与えられていることは理解されなければならない。
【0012】
本発明はここで下記に与えられる詳細な記述、付加請求項、及び付随の図面から十分に理解されることになるであろう。
【図面の簡単な説明】
【0013】
【図1】図1は、背景雑音発生器のブロック図である。
【図2】図2は、雑音を利用(play)するために1/8比率のフレームを使用する復号器の最上位の図である。
【図3】図3は、符号器の一つの実施例を例示する。
【図4】図4は、三つの符号帳入力(codebook entries)、FGIDX、LSPIDX1、及びLSPIDX2を含む1/8フレームを例示する。
【図5a】5aは、高性能削除を使用するシステムの論理ブロック図である。
【図5b】図5bは、高性能削除を使用するシステムの論理ブロック図である(高性能削除装置はボコーダに集積される)。
【図5c】図5cは、高性能削除を使用するシステムの論理ブロック図である(高性能削除装置は本発明の伝送と受信の両方のステップを行う一つのブロック或いは装置を含む)。
【図5d】図5dは、時間軸圧縮(time warping)を用いて圧縮された通話セグメントの例である。
【図5e】図5eは、時間軸圧縮を用いて伸張された通話セグメントの例である。
【図5f】図5fは、高性能削除及び時間軸圧縮を使用するシステムの論理ブロック図である。
【図6】図6は、コンピュータ・ラック上の無言の始まりにおける平均エネルギー対フレーム数に関するフレーム・エネルギーのグラフである。
【図7】図7は、強風環境において無言の始まりにおける平均エネルギー対フレーム数に関するフレーム・エネルギーのグラフである。
【図8】図8は、送信機によって実行される本発明の高性能削除方法及び装置のステップを例示するフローチャートである。
【図9】図9は、受信機によって実行される本発明の高性能削除方法及び装置のステップを例示するフローチャートである。
【図10】図10は、更新比率フレームの伝送及び抹消の利用を例示する。
【図11】図11は、前の1/8比率フレーム更新が新しい、或いは次の1/8比率フレーム更新と混合されるエネルギー値対時間のグラフである。
【図12】図12は、前の1/8比率フレーム更新が符号帳入力を使用して新しい、或いは次の1/8比率フレーム更新と混合される混合を例示する。
【図13】図13は、フレーム・エネルギーにおける差分に基づいて1/8比率フレーム更新を始動するとき実行されるステップを例示するフローチャートである。
【図14】図14は、周波数エネルギーにおける差分に基づいて1/8比率フレーム更新を始動するとき実行されるステップを例示するフローチャートである。
【図15】図15は、「低周波」LSP及び「高周波」LSPに関する周波数スペクトル符号帳入力の変化を示すLSPスペクトル差分のグラフである。
【図16】図16は、賦活(keep alive)パケットを送るとき実行されるステップを例示するフローチャートである。
【図17】図17は、ボコーダに位置する符号器及び復号器が初期化されるとき実行されるステップを例示するフローチャートである。
【詳細な説明】
【0014】
用語「例示の(illustrative)」は「例(example)、場合(instance)、または実例(illustration)として役立つ」ことを意味することにここに使用される。「例示の」としてここに記載された実施例は他の実施例に対して好ましいか、或いは有利であるとして必ずしも解釈されるとは限らない。
【0015】
全二重通話の間、通話者(parties)の少なくとも一方が「無言である(silent)」多くの場合がある。これらの「無言(silence)」間隔の間、そのチャネルは背景雑音情報を通信する。背景雑音情報の適切な通信は会話に含まれる通話者によって知覚される音声品質に影響を及ぼす要素である。IP準拠の通信では、一方の通話者が無言であるとき、パケットはその話し手が無言になったこと、及び背景雑音が再現、或いは再生されるべきことを示す聞き手へのメッセージを送るために使用される。パケットは全ての無言間隔の始まりに送られる。CDMAボコーダは背景雑音情報を通信するために既知の比率で1/8比率フレームの連続伝送を使用する。
【0016】
地上線(landline)または有線(wireline)システムは他のシステムと同様に帯域幅に関する多くの制限がないために大部分の通話データを送信する。従って、データは全比率フレームを連続して送信することによって通信される。無線通信システムでは、しかしながら帯域幅を節約する必要性がある。無線システムにおいて帯域幅を節約する一つの方法は伝送されるフレームの大きさ(サイズ)を低減することである。例えば、多くのCDMAシステムは背景雑音を通信するために1/8比率フレームを連続して送信する。1/8比率フレームは無言指標フレームとして振る舞う。完全な、或いは半フレームと対照的に、小さなフレームを送信することによって、帯域幅は節約される。
【0017】
本発明は「無言」フレームを省略すること、或いは「削除すること」を含む帯域幅を節約する装置及び方法を含む。これらの1/8比率フレームの大部分を省略すること、或いは「削除すること」は許容レベルで通話品質を維持すると同時にシステム容量を改善する。本発明の装置及び方法は1/8比率フレームに限定されないが、背景雑音の通信のために必要なオーバーヘッドを低減するために背景雑音を通信するのに使用される既知の比率のフレームを選択し、且つ省略するために使用される。背景雑音を通信するために使用されるあらゆる比率フレームは背景雑音比率フレームとして知られ、そして本発明において使用される。このように、本発明は背景雑音を通信するために使用される限り、あらゆるサイズのフレームと共に使用される。さらに、背景雑音が無言間隔の中間で変化するならば、本高性能削除装置は通話品質に著しく影響を及ぼすことなく背景雑音の変更を反映するために通信システムを更新する。
【0018】
CDMA通信では、既知比率のフレームは話し手が無言になるとき背景雑音を符号化するために使用される。例示の実施例では、1/8比率フレームは高データ比率(High Data Rate:HDR)上でのインターネット・プロトコル上音声(Voice over Internet Protocol:VoIP)システムにおいて使用される。HDRは電気通信工業会(Telecommunications Industry Association:TIA)規格IS-856によって記述され、そしてCDMA2000 1×EV-DOとしても知られている。この実施例では、1/8比率フレームの連続系列は無言期間の間に20msec毎に送信される。これは全比率(比率1)、半比率(比率1/2)または4分の1比率(比率1/4)とは異なり、それは音声データを送信するために使用される。1/8比率パケットは全比率フレームと較べて比較的小さく、即ち、少ないビットを持つけれども、通信システムにおけるパケットのオーバーヘッドはなお多量である。スケジューラは音声パケット比率を区別しないのでこのことは特に真実である。スケジューラは資源の効率的な利用を行うためにシステム資源を移動局に割当てる。例えば、最大の処理能力のスケジューラは最良の無線条件にある移動局を予定計画することによってセル処理能力を最大にする。ラウンドロビン(総当たり)スケジューラは一つづつシステム移動局に同数の予定計画スロットを割当てる。比例公平スケジューラは伝送時間を比例的に(ユーザー無線条件)公平な方法において移動局に割当てる。本方法及び装置は多くの型式のスケジューラと共に使用され、一つの特定のスケジューラに限定されない。話し手は一般に会話の約60%について無言であるので、無言期間の間に背景雑音を伝送するために使用されるこれらの1/8比率フレームの大部分を省略することはこれらの無言期間の間に伝送されるデータの総量を低減することによってシステム容量利得を提供する。
【0019】
通話品質が殆ど影響を受けない理由は必要なときに背景雑音情報が更新されるように高性能削除が行われるという事実から来ている。容量の強化に加えて、1/8比率フレーム高性能削除を使用することは帯域幅要求が少なくなるので伝送の全体コストを低減する。全てのこれらの改善は知覚音声品質への影響を最小にしながら行われる。
【0020】
本発明の高性能削除装置は多くの音声通信システムのようにパケットが転送されるあらゆるシステムによって使用される。これは他の有線システムと通信する有線システム、他の無線システムと通信する無線システム、及び無線システムと通信する有線システムを含むが、それに限定されない。
【0021】
背景雑音の生成
ここに述べた例示の実施例では、背景雑音生成に対する二つの要素(components)がある。これらの要素は雑音のエネルギー・レベルまたは音量(volume)、及び雑音のスペクトル周波数特性または「色」を含む。図1は背景雑音35を生成する装置、背景雑音発生器10を例示する。信号エネルギー15は雑音発生器20に入力される。雑音発生器20は小さなプロセッサである。それは平均値がゼロである乱数系列の形で白色雑音25を出力するソフトウェアを実行する。この白色雑音は線形予測係数(Linear Prediction Coefficient:LPC)フィルタまたは線形予測符号化(Linear Predictive Coding)フィルタ30に入力される。同じく、LPCフィルタ30への入力はLPC係数72である。これらの係数72は符号帳入力71に由来する。LPCフィルタ30は背景雑音35の周波数特性を成形する。背景雑音35を表すために音量及び周波数を使う限り、背景雑音発生器10は背景雑音35を伝送する全てのシステムに関する一般化である。好ましい実施例では、背景雑音発生器10はボコーダ60の復号器50中にある緩和符号励起線形予測(RCELP)復号器40に位置する。雑音を利用するために1/8比率フレーム70を使用する復号器40の最高部の図である図2を見よ。
【0022】
図2において、パケット・フレーム41及びパケット形式信号42はフレーム誤り検出装置43へ入力される。パケット・フレーム41はまたRCELP復号器40へ入力される。フレーム誤り検出装置43は比率決定信号44及びフレーム抹消フラグ信号45をRCELP復号器40へ出力する。RCELP復号器40は未加工の合成通話ベクトル46をポスト・フィルタ47に出力する。ポスト・フィルタ47はポスト・フィルタ合成通話ベクトル信号48を出力する。
【0023】
背景雑音を生成するこの方法はCDMAボコーダに限定されない。強化全比率(Enhanced Full Rate:FER)、適応多比率(Adaptive Multi Rate:AMR)、強化可変比率コーデック(Enhanced Variable Rate CODEC:EVRC)、G.727、G.728及びG.722といった様々な他の通話ボコーダは背景雑音を通信するこの方法を適用する。
【0024】
無言間隔の間の背景雑音89について、及び会話の間の音声について無限のエネルギー・レベル及びスペクトル周波数特性があるけれども、無言間隔の間の背景雑音89は有限の(比較的小さい)数値によって通常記述される。背景雑音情報の通信に必要とされる帯域幅を低減するために、特定のシステムのためのスペクトル及びエネルギー雑音情報は一以上の符号帳65に記憶される符号帳入力71、73に量子化され、且つ符号化される。このように、無言間隔の間に現れる背景雑音35は通常これらの符号帳65における無限数の入力71、73によって記述される。例えば、強化可変比率コーデック(EVRC)システムに使用される符号帳入力73は電力に関して256の異なる1/8比率定数を含む。一般的に、EVRCシステム内で伝送されるあらゆる雑音はこれらの256の値の一つに対応する電力レベルを持つ。さらに、各数はEVRCフレーム内部の各サブフレームについて一つ、3電力レベルに復号する。同様に、EVRCシステムは符号化背景雑音35に関連する周波数スペクトルに対応する有限量の入力71を含むであろう。
【0025】
一実施例では、ボコーダ60中に在る符号器80は符号帳入力71、73を生成する。これは図3に例示される。符号帳入力71、73は元の値の近い近似値に結局は復号される。多くのボコーダ60は雑音情報を伝送するために同等のモードを使用するので、雑音符号化及び再生について符号帳65におけるエネルギー量15及び周波数「色」係数72の使用はいくつかの型式のボコーダ60に拡張されることを当業者はまた理解するであろ
う。
【0026】
図3は本発明に使用される符号器80の一実施例を例示する。図3において、二つの信号(通話信号85及び外部比率命令107)は符号器80に入力される。通話信号またはパルス符号変調(PCM)通話標本(或いは、ディジタル・フレーム)85は信号85を高域フィルタ及び適応雑音抑制フィルタの両方を行うであろうボコーダ60中の信号プロセッサ90に入力される。処理またはフィルタされたパルス符号変調(PCM)通話標本95は音声標本が検出されたかどうかを判定するモデル・パラメータ推定器100に入力される。モデル・パラメータ推定器100はモデル・パラメータ105を第一のスイッチ110に出力する。通話は音声及び無言の組合せとして定義される。音声(通話)標本が検出されれば、第一のスイッチ110はモデル・パラメータ105を全比率または1/2比率符号器115に送り、そしてボコーダ60はフォーマットされたパケット125において全または半比率フレーム117で標本を出力する。
【0027】
モデル・パラメータ推定器100からの入力をもつ比率判定器122が無言フレームを符号化することを判定すれば、第一のスイッチ110はモデル・パラメータ105を1/8比率符号器120に送り、そしてボコーダ60は1/8比率フレーム・パラメータ119を出力する。パケット・フォーマット・モジュール124はそれらのパラメータ119をフォーマット・パケット125に入れる装置を含む。1/8比率フレーム70が例示されたように生成されれば、ボコーダ60は音声または無言標本85のエネルギー値(FGIDX)73、またはスペクトル・エネルギー値(LSPIDX1またはLSPIDX2)71に対応する符号帳入力を含むパケット125を出力する。
【0028】
比率判定器122はどんな型式のパケットを生成させるかを判定するために音声稼働検出(voice activity detection:VAD)方法及び比率選択論理を適用する。モデル・パラメータ105及び外部比率命令信号107は比率判定器122に入力される。比率判定器122は比率判定信号109を出力する。
【0029】
1/8比率フレーム
図4において、160のPCM標本はこの場合に背景雑音の20msec標本化から作られた通話セグメント89を表す。160のPCM標本は三つのブロック86、87及び88に分割される。ブロック86及び87は53PCM標本長であり、一方、ブロック88は54PCM標本長である。160のPCM標本及び、従って、20msecの背景雑音89は1/8比率フレーム70で表される。例示の実施例において、1/8比率フレーム70は最高16ビットの情報を含む。しかしながら、ビット数はシステムの特定の使用及び要求に応じて変動する。EVRCボコーダ60は16ビットを三つの符号帳65に分配する典型的実施例において使用される。これは図4に例示される。最初の8ビット(LSPIDX1(4ビット)及びLSPIDX2(4ビット))は符号化された雑音35の周波数内容、即ち、背景雑音35の再生のために必要なスペクトル情報を表す。8ビットの第二の集合(FGIDX(8ビット))は雑音35の音量内容、即ち、背景雑音35の再生のために必要とされるエネルギーを表す。有限数のポテンシャル・エネルギー量のみが符号帳に含まれるので、各々のこれらの音量は符号帳における8ビット長の入力73によって表される。同様に、スペクトル周波数情報はサイズが4ビット長である二つの異なる符号帳からの二つの入力71によって表される。従って、 16ビットの情報は雑音35の音量及び周波数特性を表すために使用される符号帳入力71、73である。
【0030】
図4で示した例示の実施例において、FGIDX符号帳入力73は無言標本におけるエネルギーを表すために使用されるエネルギー値を含む。LSPIDX1符号帳入力71は「低周波」スペクトル情報を含み、そしてLSPIDX2符号帳入力71は無言標本におけるスペクトルを表すために使用される「高周波」スペクトル情報を含む。別の好ましい実施例では、符号帳はボコーダ60に在るメモリ130に記憶される。メモリ130はまたボコーダ60の外部に置くことができる。別の好ましい実施例では、符号帳を含むメモリ130は高性能削除装置または高性能削除器140に在る。これは図5aに例示される。符号帳における値は変わらないので、メモリ130はROMメモリでもよく、RAM、CD、DVD、磁気コア等といったいくつかの異なる型式のメモリを使用してもよい。
【0031】
1/8比率フレームの削除
典型的な実施例では、1/8比率フレーム70を削除する方法のステップは送信デバイス150と受信デバイス160に分割される。これは図5aに示される。この実施例において、送信機150は背景雑音の最良の表現を選択し、そしてこの情報を受信機160に伝送する。送信機150は標本化入力背景雑音89における変化を追跡し、そして雑音信号70を更新すべき時を決定するために制動器(trigger)175(または、他の形の通知)を使用し、そしてこれらの変化を受信機160に通信する。受信機160は会話の状態(話中、無言)を追跡し、そして送信機150によって提供された情報によって「正確な」背景雑音35を生じさせる。1/8比率フレーム70を削除する方法は論理回路、アナログ及びディジタル電子回路、コンピュータ実行命令、ソフトウェア、ファームウェア、等々を使用して、様々な方法で実施される。
【0032】
図5aはまた復号器50及び符号器80が機能的に一つの装置において接続された実施例を例示する。点線は双方のデバイスがボコーダ60内にあることを示すために復号器50及び符号器80の周辺に置いた。符号器80及び復号器50はまた別々の装置に存在する。復号器50はディジタル表現からの信号を合成通話信号へ変換するためのデバイスである。好ましい実施例では、それは音声のディジタル表現を合成通話信号または等価なPCM表現に変換する。符号器80は標本化通話信号を通常に圧縮、且つ詰込まれたディジタル表現に変換する。好ましい実施例では、それは標本化通話または等価なPCM表現をボコーダ・パケット125に変換する。そのような一つの符号化表現はディジタル表現である。その上、EVRCシステムでは、多くのボコーダ60は符号器80に位置する約120Hzの切断周波数を持つ高帯域通過フィルタを有する。切断周波数はボコーダ60が異なれば異なる。
【0033】
さらに、図5aでは、高性能削除装置140はボコーダ60の外部に在る。しかしながら、別の実施例では、高性能削除装置140はボコーダ60内にある。図5bを見よ。このように、削除装置140はボコーダ装置60の一部であるとしてボコーダ60に統合されるか、別個の装置として設置される。図5aに示したように、高性能削除装置140はジッター補正バッファ180から音声及び無言パケットを受信する。ジッター補正バッファ180はいくつかの機能を実行し、その一つはそれらが受取られる順序で通話パケットを整理することである。ネットワーク・スタック185は受信機160のジッター補正バッファ180及び送信機150からの符号器80に接続された高性能削除装置論理ブロック140を機能的に接続する。それは入来フレームをそれがその一部であるデバイスの復号器50に送り、或いはフレームを別のデバイスのスイッチ回路構成に送り出すことに役立つ。好ましい実施例では、スタック185はIPスタックである。IPスタックは好ましい実施例における異なる通信のチャネル、無線通信チャネル上で実施される。
【0034】
図5aに示した両方のセル電話は通話を伝送するか、或いは通話を受信するかのいずれかであるから、高性能削除装置は各電話について二つのブロックに分割される。下で論じるように、通話の送信機150及び受信機160の両方は本発明の高性能削除方法のステップを実行する。このように、復号器50に機能的に接続された高性能削除装置140は受信機160に関する本方法のステップを実行し、一方、符号器に機能的に接続された高性能削除装置140は送信機150に関する本方法のステップを実行する。
【0035】
各セル電話ユーザーは双方共に通話を伝送し(話す)、通話を受信する(聴く)。このように、高性能削除装置140はまた伝送ステップ及び受信ステップの両方を実行する各セル電話における一つのブロックまたは装置である。これは図5cに例示される。好ましい実施例では、高性能削除装置140はマイクロプロセッサであり、または情報を処理し、命令を実行する、等々のために使用できるアナログ及びディジタルの両方のいくつかの装置のいずれかである。
【0036】
最後に、時間軸圧縮器(time warper)190は高性能削除装置140と共に使用される。通話時間軸圧縮は顕著にその品質を下げることなく通話セグメントの期間を伸張、或いは圧縮する行為である。時間軸圧縮は図5d及び5eに例示され、それは圧縮通話セグメント192及び伸張通話セグメント194の例をそれぞれ示す。図5fは時間軸圧縮器190を持つ本発明の実施例を示す。
【0037】
図5dにおいて、195は最大の相関がオフセットされた場所である。通話標本を圧縮するために、いくつかのセグメントは加算-オーバーラップされ(196)、一方、残りの標本は元のセグメントから現状のまま複製される(197)。図5eにおいて、200は最大の相関があった(オフセットされた)場所である。89aは、前のフレーム(160PCM標本)からの通話セグメントである、一方、89bは現在のフレーム(160PCM標本)からの通話セグメントである。通話セグメントを伸張するために、セグメントは加算-オーバーラップされる(202)。伸張通話セグメント194は160−オフセット標本+160である。
【0038】
1/8比率フレームの分類
1. 一時的1/8比率フレーム
例示の実施例では、フレームは話出し(talk spurt)の後のそれらの位置決めに従って分類される。話出しの直後のフレームは「一時的である(transitory)」と称される。それらは背景雑音89に加えていくらかの残余音声エネルギーを含み、或いはそれらはボコーダの収斂動作のために不正確である(符号器はなお背景雑音を推定している)。このように、これらのフレーム内に含まれる情報は「雑音」の現在の平均音量レベルとは異なる。これらの一時的フレーム205は無言期間の間の「真の背景雑音(true background no
ise)」の良き例ではない。一方、安定フレーム210は最小の平均音量レベルにおいて反映される音声残余を含む。
【0039】
図6及び7は二つの異なる通話環境に関する無言期間の始まりを示す。図6はいくつかの無言期間の始まりが示されているコンピュータ・ラックからの雑音の19のグラフを含む。各グラフは試行の結果を表す。y軸は平均エネルギー212に関するフレーム・エネルギー変化量を表す。x軸はフレーム番号214を表す。図7はいくつかの無言期間について無言の始まりが示されている強風の日における歩きからの9個の雑音のグラフを含む。y軸は平均エネルギー212に関するフレーム・エネルギー変化量を表す。x軸はフレーム番号214を表す。
【0040】
図6は1/8比率フレーム70のエネルギーが第二フレームの後で「安定している(stable)」と考えられるであろう通話標本を示す。図7は多数のグラフにおいて標本が無言間隔を表す値に収斂するためにフレームのエネルギーに関して4以上のフレームを取ったことを示す。人が通話を止めるとき、それらの音声は急には止まらず、徐々に静かになる。従って雑音信号が一定値に落ち着くには数フレームを要する。このように、最初の数フレームはボコーダ設計のせいでいくらかの音声残余を含むために一時的である。
【0041】
2.安定な雑音フレーム
無言間隔の間に一時的な雑音フレーム205の後に続くそれらのフレームは「安定な」雑音フレーム210と呼ばれる。上で述べたように、これらのフレームは最後の話出しからの最小の影響を示し、従って標本化入力背景雑音89を良く表現する。背景雑音はかなり変化するので安定な背景雑音35は相対的な用語であることを当業者は認識するであろう。
【0042】
安定なフレームからの一時的フレームの区別
安定な1/8比率フレームから一時的な1/8比率フレームを区別するいくつかの方法である。それらの方法の二つは下記に記述される。
【0043】
固定タイマ区別
一実施例では、既知比率の最初のNフレームは一時的であると考えられる。例えば、多数の通話セグメント89の分析は1/8比率フレーム70が第五フレームの後で安定していると考えられる高い可能性があることを示した。図6及び7を見よ。
【0044】
差分的区別
別の実施例では、送信機150は安定な1/8比率フレーム210のフィルタされたエネルギー値を記憶し、そしてそれを基準(reference)として使用する。話出しの後で、符号化1/8比率フレーム70はそれらのエネルギーがフィルタされた値の変化量内に収まるまで一時的であると考えられる。フレーム70のエネルギーが収斂したならば、一般にそのスペクトルの情報が同様に収斂したという高い可能性があるので、スペクトルは通常比較されない。
【0045】
しかしながら、背景雑音35特性が一無言期間から別の無言期間へ大幅に変化し、送信機150によって現在記憶されたものより安定なフレーム210に関する異なるフィルタされたエネルギー値を生じるであろう可能性がある。従って、符号化された1/8比率フレームのエネルギーはフィルタされた値の変化量内に収まらない。この問題を解決するために、収斂の中断がまた差分的な区別方法を更に強固にするために使用される。従って、差分的方法は固定タイマ手法に対する強化であると考えられる。
【0046】
高性能削除方法
一実施例では、1/8データ比率フレームまたは一時的なフレーム値205を使用する1/8データ比率フレームを削除する方法が使用される。別の実施例では、安定なフレーム値210が使用される。第三の実施例では、削除の方法は「原型1/8比率フレーム」215を使用して行う。この第三の実施例では、原型1/8比率フレーム215は受信機側160における背景雑音35の再生のために使用される。例示として、初期化手続きの間、最初の伝送或いは受信1/8比率フレーム70は「原型(prototype)」215であると考えられる。原型フレーム215は送信機150によって削除されつつある他の1/8比率フレーム70を表す。標本化入力背景雑音89が変化するときはいつでも、送信機150は既知の値の新しい原型フレーム215を受信機160に送信する。比較的少ないフレームが送られるために各ユーザーは比較的少ない帯域幅を必要とするので、全体容量は増加する。
【0047】
送信機側高性能削除方法
例示の実施例では、送信機側150は話出しの後少なくとも最初のN個の一時的1/8比率フレーム205を伝送する。そして、それは無言間隔に残りの1/8比率フレーム70を削除する。試験結果はほんの一フレームを送ることが良い結果をもたらし、そして一以上のフレームを送ることは僅かしか品質を改良しないということを示す。別の実施例では、次の一時的フレーム205は、最初の一または二に加えて、伝送される。
【0048】
信頼できないチャネル(高いPER)における動作に関して、送信機150は最後の一時的1/8比率フレーム205を送信した後、原型1/8比率フレーム215を送信することができる。好ましい実施例では、原型1/8比率フレーム215は最後の一時的1/8比率フレーム205の後の(40〜100)msecに送信される。別の好ましい実施例では、それは最後の一時的1/8比率フレーム205の後の80msecに送信される。この遅延伝送は無言期間の始まり及び無言状態への移行を検出する受信機160の信頼性を改善することの目標を有する。
【0049】
例示の実施例では、背景雑音35の更新が始動されれば、そして新しい原型1/8比率フレーム215が送信された最後のものと異なれば、無言間隔の残りの間に、送信機150は新しい原型1/8比率フレーム215を送信する。従って、1/8フレーム70が20msec毎に伝送される従来技術に開示されたシステムと異なり、標本化入力背景雑音89が知覚通話品質において影響を与え、且つ背景雑音35を更新するため受信機160において使用する1/8フレーム70を始動するのに十分に変化したとき本発明は1/8フレーム70を伝送する。従って、1/8フレーム70は必要なときに伝送され、帯域幅
において莫大な節約を生み出す。図8は送信機によって実行される本発明の高性能削除方法及び装置のステップを例示するフローチャートである。図8に例示されたステップはメモリ130に存在するソフトウェアまたはファームウェアに存在する命令として記憶される。メモリ130は高性能削除装置140中、或いは別々に置くことができる。
【0050】
図8において、送信機はフレームを受取る(300)。次に、受信機はそのフレームが無言フレームであるかどうかを判定する(305)。無言を通信し、或いは含むフレームが検出されなければ、即ち、それが音声フレームであれば、システムは稼働状態への移行し(310)、そしてそのフレームは受信機へ伝送される(315)。
フレームが無言フレームであれば、システムはシステムが無言状態にあるかどうかを調べる(320)。システムが無言状態にないのであれば、即ち、無言状態=偽であれば、それは無言状態へ移行し(325)、そして無言フレームを受信機に送信するであろう(330)。システムが無言状態にあれば、無言状態=真であり、それはフレームが安定であるかどうかを調べるであろう(335)。
【0051】
フレームが安定なフレーム210であれば、システムは統計(stats)を更新し(340)、そして更新212が始動されるかどうかを見て調べるであろう(345)。更新212が始動されれば、システムは原型フレームを作り(350)、そして新しい原型フレーム215を受信機160に送信するであろう(355)。更新212が始動されないならば、送信機150はフレームを受信機160に送信しないで、フレームを受信するために戻るであろう(300)。
【0052】
フレームが安定でないならば、そのシステムは一時的1/8比率フレーム205を伝送する(360)。しかしながら、この機能は任意である。
【0053】
受信機側高性能削除
例示の実施例では、受信機側160上で、高性能削除装置140は通話の状態の追跡を保持する。フレームを受信すると、受信機160は受信フレームを復号器50に提供する。1/8比率フレーム70が受信されると受信機160は無言状態へ移行する。別の実施例では、受信機160による無言状態への移行は中断(time out)に基づく。さらに別の実施例では、受信機160による無言状態への移行は1/8比率フレーム70と中断の両方に基づく。1/8比率より異なる比率が受信されると受信機160は稼働状態へ移行する。 例えば、全比率フレームまたは半比率フレームがいずれか受信されると受信機160は稼働状態へ移行する。
【0054】
例示の実施例では、受信機160が無言状態にあるとき、それは原型1/8比率フレーム215を再生する。無言状態の間に1/8比率フレームが受信されるならば、受信機160は受信フレームによって原型フレーム215を更新する。別の実施例では、受信機160が無言状態にあるとき、1/8比率フレームが利用可能でなければ、受信機160は最後に受信した1/8比率フレーム70を利用する。
【0055】
図9は受信機160によって実行される高性能削除方法及び装置のステップを例示するフローチャートである。図9に例示したステップはメモリ130中に存在するソフトウェアまたはファームウェア220に存在する命令230として記憶される。メモリ130は高性能削除装置140中、或いは別に置かれる。さらに、高性能削除方法の多数のステップはメモリ130に存在するソフトウェアまたはファームウェアに存在する命令として記憶される。
【0056】
受信機160はフレームを受取る(400)。最初に、それはそれが音声フレームであるかどうかを判定する(405)。それが[yes]であれば、それはその無言状態=偽を設定し(410)、受信機は音声フレームを利用する(415)。受信フレームが音声フレームでないならば、受信機160はそれが無言フレームであるかどうかを調べる(420)。その回答が[yes]であれば、受信機160はその状態が無言であるかどうかを調べる(425)。受信機160が無言フレームを検出すれば、しかし無言状態が偽、即ち、受信機160が音声状態にあれば、受信機160は無言状態へ移行し(430)、そして受信フレームを利用する(435)。受信機160が無言フレームを検出し、且つ無言状態が真であるならば、受信機は原型フレーム215を更新し、そして原型フレーム215を利用する(445)。
上で述べたように、受信フレームが音声フレームではないならば、受信機160はそれが無言フレームであるかどうかを調べる。回答が[no]であれば、フレームは受信されなかった(即ち、それは、n抹消指示である) 、そして受信機160はその状態が無言であるかどうかを調べる(450)。状態が無言であるならば、即ち、無言状態=真であれば、原型フレーム215が利用される(455)。状態が無言でないならば、即ち、無言状態=偽であれば、N個の連続した抹消240が発生した(460)。(高性能削除において、抹消240は本質的にフラグである。フレームが予期されるが、受信されないとき、抹消240は受信機によって代用される)。回答が[no]であれば、N個の連続した抹消240は発生しなかった、そして受信機160の復号器50に接続された高性能削除装置140は(パケット損失隠匿のために)復号器50に抹消240を利用する(465)。回答が[yes]であるならば、N個の連続した抹消240が発生して、受信機160は無言状態へ移行し、そして原型フレーム215を利用する(475)。
【0057】
一実施例では、高性能削除装置140及び方法が使用されるシステムはIP上音声(Voice over IP)システムであり、そこでは受信機160は適応性が高いタイマを有し、そして送信機150はフレームを20msec毎に送信する固定タイマを使用する。これは受信機160と送信機150の両方が固定タイマを使用する回路基本のシステムとは異なる。このように、適応性が高いタイマが使用されるので、高性能削除装置140は20msec毎にフレームを調べない。その代りに、そうすることが要求されたときは、高性能削除装置140はフレームを調べるであろう。
【0058】
前に述べたように、時間軸圧縮が使用されると、通話セグメント89は伸張或いは圧縮される。話し手235が再生すべき情報を使い果たしているとき、復号器50が作動する。復号器50が作動する必要があるならば、それはジッター補正バッファ180から新しいフレームを得ようとするであろう。そして高性能削除方法が実行される。
【0059】
図10は1/8比率フレーム70が符号器80によって送信機150中の高性能削除装置140に連続的に送信されることを示す。同様に、1/8比率フレーム70は受信機160中の復号器50に機能的に接続された高性能削除装置140によって連続的に送信される。しかしながら、受信機160及び送信機150の間で、フレームの連続系列は送信されない。その代りに、必要なとき、更新212が送信される。高性能削除装置140は送信機150からフレームを受信しなかったならば抹消240を利用し、そして原型フレーム215を利用することがができる。マイクロホン250は送信機150中の符号器80に取付けられ、スピーカー235は受信機160中の復号器50に取付けられる。
【0060】
背景雑音の平坦性
例示の実施例では、復号器50が1/8比率フレーム70を検出すると、受信機160は全体の無言間隔について背景雑音35を再生するためにただ一つの1/8比率フレーム70を使用する。即ち、背景雑音35は繰返される。更新212があれば、同じ更新1/8比率フレーム212は背景雑音35を生成するために20msec毎に送信される。同じ1/8比率フレームは拡張期間の間使用され、そして聞き手には厄介であるから、これは再構築された背景雑音35の分散(variance)または「平坦性(flatness)」の明白な欠如につながる。
【0061】
一実施例では、「平坦性」を回避するために、抹消240が原型1/8比率フレーム215の代わりに受信機160の復号器50に供給される。これは図10に例示される。復号器50が抹消212にいくらかの無作為性(randomness)を加えて抹消の前にそれが持っていたものを再現しようとするので、抹消は背景雑音35に無作為性を導入し、それによって再構築背景雑音35を変化させる。時間0と50%の間の抹消212を利用ことは背景雑音35に所望の無作為性を作り出すであろう。
【0062】
別の実施例では、無作為背景雑音35は共に「混合される(blended)」。このことは前の1/8比率フレーム更新212aを新しい、または次の1/8比率フレーム更新212bと混合することを意味し、背景雑音35を前の1/8比率フレーム値212aから新しい1/8比率フレーム値212bに徐々に変化させる。従って、無作為性または変化が背景雑音35に加えられる。図示したように、新しい更新比率フレーム212bにおけるエネルギー値が前の比率更新フレーム212aにおけるエネルギー値より大きいか、小さいかによって、背景雑音エネルギー・レベルは徐々に増加し(矢は前の1/8フレーム更新値212aから新しい1/8フレーム更新値212bへ上方を指す)、或いは減少する(矢は前の1/8フレーム更新値212aから新しい1/8フレーム更新値212bへ下方を指す)。これは図11に例示される。
【0063】
この漸進的な背景雑音35の変化はまた送信されるフレームが前の1/8フレーム更新値212aと新しい1/8フレーム更新値212bとの間にある符号帳入力値に基づいて取る符号帳入力70a、70bを用いて達成され、前の1/8更新フレームを表す前の符号帳入力70aから新しい1/8更新フレームを表す符号帳入力70bへ徐々に移動する。各暫定符号帳入力70aa、70abは前の更新フレーム212aから新しい更新フレーム212bへの増加的変化Aをまねるように選択される。例えば、図12において、前の1/8データ比率更新フレーム212aは符号帳入力70aによって表される。次のフ
レームは前の符号帳入力70aから増加的変化Aを表す70aaで表される。最初の増加的変化を持つフレームの後に続くフレームは前の符号帳入力70aから2Aの増加的変化を表す70abによって表される。前の更新212aから増加的変化を持つ符号帳入力70aa、70abは送信機150から送信されないが、受信機160中の復号器50に機能的に接続された高性能削除装置140から伝送されることを図12は示す。それらが送信機150によって送信されたならば、送信機150によって送信される更新212における低減はないであろう。増加的変化は伝送されない。それらは一つの背景雑音35から
別のものへの移行を円滑にするために、二つの連続更新の間に受信機において自動的に生成される。
【0064】
1/8比率原型フレームの始動
例示の実施例では、背景雑音35の更新が始動されたならば、そして新しい1/8比率フレーム70が送信された最後のものと異なる雑音値を含むならば、送信機150は無言期間の間に更新212を受信機160に送信する。このように、背景雑音情報は必要なとき更新される。始動はいくつかの要素に依存する。一実施例では、始動はフレーム・エネルギーにおける差分に基づく。
【0065】
図13は始動がフレーム・エネルギーにおける差分に基づく実施例を例示する。この実施例では、送信機150は符号器80によって作られた全ての安定な1/8比率フレーム210の平均エネルギーのフィルタされた値を維持する(500)。次に、最後に送信された原型フレーム215に含まれるエネルギーと現在のフィルタされた全ての安定な1/8データ比率フレームの平均エネルギーが比較される(510)。次に、最後に送信された原型フレーム215に含まれるエネルギーと現在のフィルタされた平均エネルギーとの間の差分が閾値245より大きいかどうかが判定される(520)。回答が[yes]であるならば、更新212が始動され、そして新しい雑音値を含む新しい1/8比率フレーム70が伝送される(530)。背景雑音35の現行の平均は更新フレーム212の伝送を始動することからスパイクを回避するために差分を計算するために使用される。使用される差分は品質または処理能力に基づいて決定、或いは適応される。
【0066】
別の実施例では、始動はスペクトルの差に基づく。この実施例では、送信機150は符号器80によって作られた安定な1/8比率フレーム210に含まれる符号帳入力71、73間のスペクトル差の符号帳ごとのフィルタされた値を保持する(600)。次に、このフィルタされたスペクトル差は閾値に対して比較される(610)。次に、最後に伝送された原型215のスペクトルの間の差分または変化量、及び安定な1/8比率フレーム210に含まれる符号帳入力71、73間のフィルタされたスペクトル差分がその閾値(SDT1及びSDT2)235より大きいかどうかが判定される(620)。それであれば、更新212が始動される(630)。これは図14に例示される。
【0067】
上に述べたように、背景雑音35音量またはエネルギーの変化及び背景雑音35周波数スペクトルの変化の両方が引き金(trigger)175として使用される。以前に作動させた高性能削除方法及び装置の試行において、音量における2dbの変化が更新フレーム212を始動させた。同じく、40%の周波数スペクトルにおける変化は周波数変化212を始動するために使用された。
【0068】
スペクトル差分の計算
前に述べたように、線形予測係数(Linear Prediction Coefficient :LPC)フィルタ(或いは、線形予測符号化フィルタ)は背景雑音35の周波数特性を抽出するために使用される。線形予測符号化は同じ系列の前の標本の一次結合によって系列の将来の標本を予測する方法である。スペクトルの情報は通常二つの異なる符号帳65によって作られる係数72の線形差分が符号帳65のスペクトル差分と比例する方法で符号化される。図3に示したモデル・パラメータ推定器100は一組の線形予測係数(LPC)72及び最適ピッチ遅延(τ)を作るためにLPC分析を行う。それはまたLPC72を線スペクトル対(LSP)に変換する。線スペクトル対(LSP)は疑似周波数領域におけるディジタル・フィルタ係数72の表現である。この表現は良い量子化及び内挿特性を有する。
【0069】
ECRVボコーダ60を実施する例示の実施例では、スペクトル差分は次の二つの数式を用いて計算される。
【数1】

【0070】
上の数式において、LSPIDX1は「低周波」スペクトル情報を含む符号帳65であり、そしてLSPIDX2は「高周波」スペクトル情報である。n及びmは二の異なる符号帳入力である。qrate は量子化されたLSPパラメータである。それは三つの指数k、i、jを持つ。kはLSPIDX1及びLSPIDX2について変化する表番号で、k=1、2である。iは同じ符号帳入力71に属する一量子化要素であり、i=1、2、3、4、5である。jは符号帳入力71、即ち、通信チャネル上で実際に伝送される番号であり、jはm及びnに対応する。m及びnはjの代わりに上の数式において使用される。それは二つの符号帳の間の差が計算されつつあるので二つの変数が必要とされるからである。図4において、符号帳LSPIDX1及びLSPIDX2は符号帳入力71によって表され、そしてFGIDXは73によって表される。
【0071】
各符号帳入力71は五つの数に復号する。異なるフレームからの二つの符号帳入力71を比較するために、各五つの数の絶対差分の和が取られる。その結果はこれら二つの符号帳入力71の間の周波数/スペクトル「距離」である。
【0072】
「低周波」LSP及び「高周波」LSPに関する周波数スペクトル符号帳入力71の変化は図15のグラフで表される。x軸は符号帳入力71の間の差分を表す。y軸はx軸上で表される差分を持つ符号帳入力71の割合(percentage)を表す。
【0073】
新しい原型1/8比率フレームの構築
更新が要求されると、新しい原型1/8比率フレーム70が符号帳65に含まれる情報に基づいて構築される。図4は先に論じた三つの符号帳65からの入力FGIDX、LSPIDX1、及びLSPIDX2を含む1/8比率フレーム70を例示する。新しい原型215を構築する間に、選択された符号帳65は現在の背景雑音35を表す。
【0074】
一実施例では、送信機150 はメモリ130に記憶されたFGIDX符号帳のような「エネルギー符号帳」中の符号器によって作られた全ての安定な1/8比率フレーム210の平均エネルギーのフィルタされた値を保持する。更新が要求されると、フィルタされた値に最も近いFGIDX符号帳65における平均エネルギー値が原型1/8比率フレーム215を使用して受信機160に伝送される。
【0075】
別の実施例では、送信機150は符号器80によって生成されたスペクトル情報を含む符号帳65のフィルタされたヒストグラムを保持する。スペクトル情報はメモリ130に記憶されたLSPIDX1(低周波)またはLSPIDX2(高周波)符号帳65といった「低周波」または「高周波」情報である。1/8比率フレーム更新212に関して、「最もポピュラーな」符号帳65はそのヒストグラムがフィルタされた値に最も近いスペクトル情報符号帳65において平均エネルギー値を選択することによって背景雑音35に関する更新値を作り出すために使用される。
【0076】
最後のN符号帳入力71のヒストグラムを保持することによって、本方法及び装置は1/8比率フレームの最新の平均を表す符号帳入力71の計算を回避する。これは操作時間の低減を表す。
【0077】
始動閾値
原型更新始動閾値245はいくつかの方法で設定される。これらの方法は「固定の」及び「適応できる」閾値245を使用することを含むが、それに制限されない。固定の閾値を実施する実施例において、固定の値が異なる閾値245に割当てられる。この固定値はオーバーヘッドと背景雑音35品質の間で所望の妥協(tradeoff)を目標にする。適応閾値を実施する実施例において、制御ループが各々の閾値245に関して使用される。制御ループは各々の閾値245によって始動される更新212の特定の割合(percentage)を目標にする。
【0078】
目標として使用される割合は目標グローバル・オーバーヘッドを越えない目的地によって定義される。このオーバーヘッドは符号器80によって作られた安定な1/8比率フレーム210の総数上で伝送られる更新212の割合として定義される。制御ループは閾値245毎のフィルタされたオーバーヘッドの追跡を維持するであろう。オーバーヘッドが目標以上あれば、それは変化量(delta)だけ閾値245を増加させ、さもなければ変化量だけ閾値245を減少させる。
【0079】
賦活パケット始動
パケットが送信されない時間期間が限界時間を越えるならば、通信が行われているネットワークまたは音声通信を実施するアプリケーションは混乱し、そして二つの通話者間の通信が終了したと考える。そして、それは二つの通話者を不通にするであろう。この状況が発生することを回避するために、賦活パケットは原型を更新するために限界時間が満期になる前に送信される。そのステップは図16に例示される。最後の更新212が送信されてからの経過時間を測る(700)。閾値245より大きい時間が経過したか(710)? それであれば、更新212を始動する(720)。
【0080】
初期化
図17はボコーダ60に位置する符号器80及び復号器50が初期化されるとき実行されるステップを例示するフローチャートである。符号器80は非無言または音声状態、即ち、Silence_State = FALSE に初期化される(800)。復号器50は二つのパラメータによって初期化される:i)状態=無言、即ち、Silence_State = TRUE(810)、及びii)原型フレームは静(低音量)フレーム、例えば、1/8フレームに設定される(820)。その結果、復号器50は背景雑音を最初に出力する。その理由は、呼出が開始されると、接続が完了するまで送信機は情報を送信しないであろうが、受信機加入者はその接続が完了するまで何か(背景雑音)を利用する必要がある。
【0081】
高性能削除方法に関する追加アプリケーション
この文書において定義したアルゴリズムはRFC 3389によって使用され、そしてこのアプリケーションに記載されない他のボコーダを網羅するように容易に拡張される。これらはG.711、G.727、G.728、G.722、等々を含むが、それに限定されない。
【0082】
当業者は情報及び信号は様々な異なる技術及び技法を使用して表されることを理解するであろう。例えば、上記の記述の至る所で引用されたデータ、指示、命令、情報、信号、ビット、シンボル、及びチップは電圧、電流、電磁波、磁界または粒子、光学場または粒子、またはそのあらゆる組合せよって表される。
【0083】
当業者はここに開示された実施例に関連して記述された様々な例示の論理的ブロック、モジュール、回路、及びアルゴリズム・ステップが電子ハードウェア、コンピュータ・ソフトウェア、または両方の組合せとして実施されることを認識するであろう。ハードウェア及びソフトウェアのこの互換性を明確に例示するために、実例となる様々な例示の要素部品、ブロック、モジュール、回路、及びステップが一般にそれらの機能性に関して上で述べられてきた。そのような機能性がハードウェアまたはソフトウェアとして実施されるかどうかは全体システムに課せられた特定アプリケーション及び設計の制約に依存する。熟練者は特定の各アプリケーションに関して様々な方法でここに記述された機能性を実施するが、そのような実施の決定は本発明の範囲から逸脱するものと解釈されるべきでない。
【0084】
ここに開示された実施例に関連して記述された様々な例示の論理的ブロック、モジュール、及び回路はここに記述された機能を実行するように設計された汎用プロセッサ、ディジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲートアレイ(FPGA)または他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア部品、或いはその組合せによって実施または実行される。汎用プロセッサはマイクロプロセッサであるが、これに代るものでは、プロセッサはあらゆる従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械である。プロセッサはまたコンピュータ・デバイスの組合せ、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、DSPコアと連結した一以上のマイクロプロセッサ、またはあらゆる他のそのような構成として実施される。
【0085】
ここに開示された実施例に関連して記述された方法またはアルゴリズムのステップはハードウェアにおいて、プロセッサによって実行されるソフトウェア・モジュールにおいて、或いは二つの組合せにおいて直接具体化される。ソフトウェア・モジュールはRAMメモリ、フラッシュ・メモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、交換可能ディスク、CD-ROM、または当分野において既知の他の形式の記憶媒体に在駐する。例示の記憶媒体はそのようなプロセッサが記憶媒体から情報を読取り、且つ記憶媒体へ情報を書込むことができるプロセッサに接続される。これに代るものでは、記憶媒体はプロセッサと一体化される。プロセッサ及び記憶媒体はASICに在駐する。ASICはユーザー端末に在駐する。これに代るものでは、プロセッサ及び記憶媒体はユーザー端末において個別の構成部品として在駐する。
【0086】
開示実施例の前の記述は当業者が本発明を行い、或いは使用することを可能にするために提供される。これらの実施例への様々な修正は当業者には直ちに明白であり、そしてここに定義された一般原理は発明の精神または範囲から逸脱するることなしに他の実施例に適用される。従って、本発明はここに示した実施例に限定されることを意図するものではないが、ここに開示された原理及び新規な特徴と一致する最も広い範囲を与えられるべきである。

【特許請求の範囲】
【請求項1】
背景雑音を通信する方法であって、
背景雑音を伝送すること、
背景雑音を通信するために使用される次の背景雑音データ比率フレームを削除すること、背景雑音を受信すること、及び
背景雑音を更新することを含む方法。
【請求項2】
始動するステップをさらに含む、請求項1記載の背景雑音を通信する方法。
【請求項3】
背景雑音を利用することをさらに含み、背景雑音を利用する前記ステップは、
無作為の数列の形で白色雑音を出力すること、及び
前記白色雑音の周波数特性を抽出することを含む、請求項1記載の背景雑音を通信する方法。
【請求項4】
前記背景雑音データ比率フレームの少なくとも一つが更新背景雑音データ比率フレームを送信する前に送信されてしまうまで待機するステップをさらに含み、それによって安定な背景雑音比率フレームが伝送される、請求項1記載の方法。
【請求項5】
最後の一時的背景雑音データ比率フレームが更新背景雑音データ比率フレームを送信する前に送信された後、40〜100msまで待機するステップをさらに含み、それによって安定な背景雑音比率フレームが伝送される、請求項1記載の方法。
【請求項6】
限界時間が満了してしまう前に賦活パケット(keep alive packet)を伝送するステップをさらに含む、請求項1記載の背景雑音を通信する方法。
【請求項7】
符号器及び復号器を初期化するステップをさらに含み、符号器及び復号器を初期化する前記ステップは、
前記符号器の状態を音声状態に設定すること、
前記復号器の状態を無言状態に設定すること、及び
原型フレームを1/8データ比率フレームに設定することを含む、請求項1記載の背景雑音を通信する方法。
【請求項8】
背景雑音を混合するステップをさらに含む、請求項1記載の背景雑音を通信する方法。
【請求項9】
前記背景雑音データ比率フレームが受信されなければ、抹消を利用するステップをさらに含む、請求項1記載の背景雑音を通信する方法。
【請求項10】
背景雑音を更新する前記ステップは少なくとも一つの符号帳入力を持つ更新背景雑音データ比率フレームを伝送することを含む、請求項1記載の背景雑音を通信する方法。
【請求項11】
背景雑音を伝送する前記ステップは、
フレームを受信すること、
前記フレームが無言フレームであるかどうかを判定すること、
前記フレームが前記無言フレームでないならば、稼働状態に移行し、そして前記フレームを伝送すること、
前記フレームが前記無言フレームであるならば、状態が無言状態であるかどうかを判定すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にないならば、前記前記無言状態に移行し、そして前記無言フレームを受信機に送信すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にあるならば、前記フレームが安定であるかどうかを判定すること、
前記フレームが安定であるならば、統計を更新し、そして更新が始動されたかどうかを判定すること、及び
前記更新が始動されたならば、原型フレームを構築し、且つ送信することを含む、請求項1記載の背景雑音を通信する方法。
【請求項12】
前記フレームが安定でないならば、背景雑音を伝送する前記ステップは一時的背景雑音データ比率フレームを伝送するステップを含む、請求項11記載の背景雑音を通信する方法。
【請求項13】
背景雑音を受信する前記ステップは、
フレームを受信すること、
前記フレームが音声フレームであるかどうかを判定すること、
前記フレームが前記音声フレームであるならば、状態が音声状態であるかどうかを判定すること、
前記状態が音声状態であり、且つ前記フレームが前記音声フレームであるならば、前記フレームを利用すること、
前記フレームが前記音声フレームでないならば、前記フレームが無言フレームであるかどうかを調べること、
前記フレームが前記無言フレームであるならば、状態が無言状態であるかどうかを調べること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態でないならば、前記無言状態へ移行し、且つ前記フレームを利用すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態であるならば、更新を生成し、且つ前記更新を利用すること、
前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記状態が前記無言状態であるかどうかを調べること、
前記状態が前記無言状態であり、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、原型フレームを利用すること、
前記状態が前記無言状態でなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、N個の連続した抹消が送信されたかどうかを調べること、
N個の連続した抹消が送信されてなく、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、抹消を利用すること、及び
N個の連続した抹消が送信されており、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記無言状態に移行し、且つ前記原型フレームを利用することのステップを含む、請求項1記載の背景雑音を通信する方法。
【請求項14】
前記始動するステップは、
前記背景雑音データ比率フレームをフィルタリングすること、
前記背景雑音データ比率フレームのエネルギーを前記背景雑音データ比率フレームの平均エネルギーと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含む、請求項2記載の背景雑音を通信する方法。
【請求項15】
前記始動するステップは、
前記背景雑音データ比率フレームをフィルタリングすること、
前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含む、請求項2記載の背景雑音を通信する方法。
【請求項16】
フレームが受信されないならば、抹消を利用するステップをさらに含む、請求項2記載の背景雑音を通信する方法。
【請求項17】
混合する前記ステップは前記背景雑音を前の更新値から新しい更新値へ徐々に変えることを含む、請求項8記載の背景雑音を通信する方法。
【請求項18】
前記抹消は時間の50パーセント以下で利用される、請求項9記載の背景雑音を通信する方法。
【請求項19】
前記閾値は1db以上である、請求項14記載の背景雑音を通信する方法。
【請求項20】
更新背景雑音データ比率フレームを伝送する前記ステップは少なくとも一つの符号帳入力を伝送することを含む、請求項14記載の背景雑音を通信する方法。
【請求項21】
前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと比較するステップは、前記前記背景雑音データ比率フレームに関する符号帳入力の要素(elements)の絶対差分の和を取ることを含む、請求項15記載の背景雑音を通信する方法。
【請求項22】
前記閾値は40パーセント以上である、請求項15記載の背景雑音を通信する方法。
【請求項23】
更新背景雑音データ比率フレームを伝送する前記ステップは少なくとも一つの符号帳入力を伝送することを含む、請求項15記載の背景雑音を通信する方法。
【請求項24】
前記抹消は時間の50パーセント以下で利用される、請求項16記載の背景雑音を通信する方法。
【請求項25】
前記少なくとも一つの符号帳入力は少なくとも一つのエネルギー符号帳入力及び少なくとも一つのスペクトル符号帳入力を含む、請求項20記載の背景雑音を通信する方法。
【請求項26】
前記更新は最も頻繁に使用される符号帳入力を含む、請求項25記載の背景雑音を通信する方法。
【請求項27】
背景雑音を通信する方法であって、その方法は背景雑音を伝送するステップ及び背景雑音を受信するステップを含み、
背景雑音を伝送するステップは、
フレームを受信すること、
前記フレームが無言フレームであるかどうかを判定すること、
前記フレームが無言フレームでないならば、稼働状態に移行し、且つ前記フレームを伝送すること、
前記フレームが前記無言フレームであるならば、状態が無言状態であるかどうかを判定すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にないならば、前記無言状態に移行し、且つ前記無言フレームを受信機に送信すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にあるならば、前記フレームが安定であるかどうかを判定すること、
前記フレームが安定であるならば、統計を更新し、且つ更新が始動されたかどうかを判定すること、
前記更新が始動されていたならば、原型フレームを構築し、且つ送信することのステップを含み、そして
背景雑音を受信するステップは、
前記フレームを受信すること、
前記フレームが音声フレームであるかどうかを判定すること、
前記フレームが前記音声フレームであるならば、前記状態が音声状態であるかどうかを判定すること、
前記状態が前記音声状態であり、且つ前記フレームが前記音声フレームであるならば、前記フレームを利用すること、
前記フレームが前記音声フレームでないならば、前記フレームが前記無言フレームであるかどうかを調べること、
前記フレームが前記無言フレームであるならば、前記状態が前記無言状態であるかどうかを調べること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態でないならば
、前記無言状態に移行し、且つ前記フレームを利用すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態であるならば、更新を生成し、且つ前記更新を利用すること、
前記フレームが前記音声フレームまたは前記無言フレームでないならば、状態が前記無言状態であるかどうかを調べること、
前記状態が前記無言状態であり、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記原型フレームを利用すること、
前記状態が前記無言状態でなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、N個の連続した抹消が送信されていたかどうかを調べること、
N個の連続した抹消が送信されてなく、前記状態が前記無言状態でなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、抹消を利用すること、及び
N個の連続した抹消が送信されていて、前記状態が前記無言状態でなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記無言状態に移行し、且つ前記原型フレームを利用することのステップを含む方法。
【請求項28】
少なくとも一つの入力及び少なくとも一つの出力を持つ少なくとも一つのボコーダであって、ボコーダは少なくとも一つの入力及び少なくとも一つの出力を持つ復号器、及び少なくとも一つの入力及び少なくとも一つの出力を持つ符号器を具備し、
メモリと少なくとも一つの入力及び少なくとも一つの出力を持つ少なくとも一つの高性能(smart)削除装置であって、第一の前記少なくとも一つの入力は前記ボコーダの前記少なくとも一つの出力に機能的に接続され、そして前記少なくとも一つの出力は前記ボコーダの前記少なくとも一つの入力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つジッター補正バッファであって、前記少なくとも一つの出力は前記高性能削除装置の第二の前記少なくとも一つの入力に機能的に接続され、及び
少なくとも一つの入力及び少なくとも一つの出力を持つネットワーク・スタックであって、前記少なくとも一つの入力は前記ジッター補正バッファの前記少なくとも一つの入力に機能的に接続され、そして前記少なくとも一つの入力は前記高性能削除装置の前記少なくとも一つの出力に機能的に接続される、を具備する背景雑音を通信するための装置。
【請求項29】
前記復号器は、
複数の入力と少なくとも一つの出力を持つ緩和符号-励起線形予測復号器であって、前記緩和符号-励起線形予測復号器は背景雑音発生器を具備し、
複数の入力と少なくとも一つの出力を持つフレーム誤り検出探知装置であって、前記フレーム誤り検出探知装置の第一の前記複数の入力は前記緩和符号-励起線形予測復号器の第一の前記複数の入力に機能的に接続され、前記フレーム誤り検出探知装置の第二の前記複数の入力は前記緩和符号-励起線形予測復号器の第二の前記複数の入力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つポスト・フィルタであって、前記少なくとも一つの入力は前記緩和符号-励起線形予測復号器の前記少なくとも一つの出力に機能的に接続される、を具備する請求項28記載の背景雑音を通信する装置。
【請求項30】
前記符号器は、
少なくとも一つの入力及び少なくとも一つの出力を持つ信号プロセッサ、
少なくとも一つの入力及び少なくとも一つの出力を持つモデル・パラメータ推定器であって、前記少なくとも一つの入力は前記信号プロセッサの前記少なくとも一つの出力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つ比率判定器(rate determinator)であって、前記少なくとも一つの入力は前記モデル・パラメータ推定器の第一の前記少なくとも一つの出力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つ1/8比率符号器、
少なくとも一つの入力及び少なくとも一つの出力を持つ全比率符号器、
少なくとも一つの入力及び少なくとも一つの出力を持つ第一のスイッチであって、前記少なくとも一つの入力は前記モデル・パラメータ推定器の前記少なくとも一つの出力に機能的に接続され、第一の前記少なくとも一つの出力は前記1/8比率符号器の前記少なくとも一つの入力に機能的に接続され、そして第二の前記少なくとも一つの出力は前記全比率符号器の前記少なくとも一つの入力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つ第二のスイッチであって、第一の前記少なくとも一つの入力は前記1/8比率符号器の前記少なくとも一つの出力に機能的に接続され、そして第二の前記少なくとも一つの入力は前記全比率符号器の前記少なくとも一つの出力に機能的に接続され、及び
少なくとも一つの入力及び少なくとも一つの出力を持つパケット・フォーマット器であって、前記少なくとも一つの入力は前記第二のスイッチの少なくとも一つの出力に機能的に接続される、を具備する、請求項28記載の背景雑音を通信する装置。
【請求項31】
前記符号器は、
少なくとも一つの入力及び少なくとも一つの出力を持つ信号プロセッサ、
少なくとも一つの入力及び少なくとも一つの出力を持つモデル・パラメータ推定器であって、前記少なくとも一つの入力は前記信号プロセッサの前記少なくとも一つの出力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つ比率判定器(rate determinator)であって、前記少なくとも一つの入力は前記モデル・パラメータ推定器の第一の前記少なくとも一つの出力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つ1/8比率符号器、
少なくとも一つの入力及び少なくとも一つの出力を持つ1/2比率符号器、
少なくとも一つの入力及び少なくとも一つの出力を持つ第一のスイッチであって、前記少なくとも一つの入力は前記モデル・パラメータ推定器の前記少なくとも一つの出力に機能的に接続され、第一の前記少なくとも一つの出力は前記1/8比率符号器の前記少なくとも一つの入力に機能的に接続され、そして第二の前記少なくとも一つの出力は前記1/2比率符号器の前記少なくとも一つの入力に機能的に接続され、
少なくとも一つの入力及び少なくとも一つの出力を持つ第二のスイッチであって、第一の前記少なくとも一つの入力は前記1/8比率符号器の前記少なくとも一つの出力に機能的に接続され、そして第二の前記少なくとも一つの入力は前記1/2比率符号器の前記少なくとも一つの出力に機能的に接続され、及び
少なくとも一つの入力及び少なくとも一つの出力を持つパケット・フォーマット器であって、前記少なくとも一つの入力は前記第二のスイッチの少なくとも一つの出力に機能的に接続される、を具備する、請求項28記載の背景雑音を通信する装置。
【請求項32】
前記メモリは背景エネルギー符号帳入力及び背景スペクトル符号帳入力を有する符号帳入力を含む符号帳を含む、請求項28記載の背景雑音を通信する装置。
【請求項33】
前記高性能削除装置は、
背景雑音を伝送すること、
背景雑音を通信するために使用される次の背景雑音データ比率フレームを削除すること、
背景雑音を受信すること、及び
背景雑音を更新すること、を含む前記メモリに記憶された命令を実行するように適応される、請求項28記載の背景雑音を通信する装置。
【請求項34】
前記フレームを受信すること、
前記高性能削除装置は背景雑音を伝送すること及び背景雑音を受信することを含む前記メモリに記憶された命令を実行するように適応され、
背景雑音を伝送することは、
フレームを受信すること、
前記フレームが無言フレームであるかどうかを判定すること、
前記フレームが前記無言フレームでないならば、稼働状態に移行し、且つ前記フレームを伝送すること、
前記フレームが前記無言フレームであるならば、前記状態が無言状態であるかどうかを判定すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にないならば、前記無言状態に移行し、且つ前記無言フレームを送信すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にあるならば、前記フレームが安定であるかどうかを判定すること、
前記フレームが安定であるならば、統計を更新し、且つ更新が始動されたかどうかを判定すること、
前記更新が始動されていたならば、原型フレームを構築し、且つ送信することのステップを含み、
前記背景雑音を受信することは、
前記フレームが音声フレームであるかどうかを判定すること、
前記フレームが前記音声フレームであるならば、前記状態が音声状態であるかどうかを判定すること、
前記状態が前記音声状態であり、且つ前記フレームが前記音声フレームであるならば、前記フレームを利用すること、
前記フレームが前記音声フレームでないならば、前記フレームが前記無言フレームであるかどうかを調べること、
前記フレームが前記無言フレームであるならば、前記状態が前記無言状態であるかどうかを調べること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態でないならば、前記無言状態に移行し、且つ前記フレームを利用すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態であるならば、更新を生成し、且つ前記更新を利用すること、
前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記状態が前記無言状態であるかどうかを調べること、
前記状態が前記無言状態であり、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記原型フレームを利用すること、
前記状態が前記無言状態でなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、N個の連続した抹消が送信されたかどうかを調べること、
N個の連続した抹消が送信されてなく、前記状態が前記無言状態でなく且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、抹消を利用すること、及び
N個の連続した抹消が送信されており、前記状態が前記無言状態でなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記無言状態に移行し、且つ前記原型フレームを利用すること
のステップを含む、請求項28記載の背景雑音を通信する装置。
【請求項35】
前記背景雑音発生器は、
少なくとも一つの入力及び少なくとも一つを持つ雑音発生器、及び
少なくとも一つの入力及び少なくとも一つの出力を持つLPCフィルタであって、前記LPCフィルタの前記少なくとも一つの入力は前記雑音発生器の前記少なくとも一つの出力に機能的に接続される、を具備する請求項29記載の背景雑音を通信する装置。
【請求項36】
前記高性能削除装置は、
背景雑音を伝送すること、
背景雑音を通信するために使用される次の背景雑音データ比率フレームを削除すること、
背景雑音を受信すること、及び
前記符号帳入力の少なくとも一つを持つ更新背景雑音データ比率フレームを伝送することによって背景雑音を更新すること、を含む前記メモリに記憶された命令を実行するように適応された、請求項32記載の背景雑音を通信する装置。
【請求項37】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応された、請求項33記載の背景雑音を通信する装置。
【請求項38】
前記高性能削除装置はさらに前記メモリに記憶された利用背景雑音命令を実行するように適応され、前記利用背景雑音命令は、
無作為の数列の形で白色雑音を出力すること、及び
前記白色雑音の周波数特性を抽出すること、を含む請求項33記載の背景雑音を通信する装置。
【請求項39】
前記高性能削除装置はさらに、
更新背景雑音データ比率フレームを送信する前に、前記背景雑音データ比率フレームの少なくとも一つが送信されるまで待機し、それにより安定な背景雑音データ比率フレームが伝送されることを含む、前記メモリに記憶された命令を実行するように適応される、請求項33記載の背景雑音を通信する装置。
【請求項40】
前記高性能削除装置はさらに、
更新背景雑音データ比率フレームを送信する前に、最後の一時的背景雑音データ比率フレームが送信された後40〜100msまで待機し、それにより安定な背景雑音データ比率フレームが伝送されることを含む、前記メモリに記憶された命令を実行するように適応される、請求項33記載の背景雑音を通信する装置。
【請求項41】
前記高性能削除装置はさらに、
限界時間が満了する前に賦活パケットを伝送することを含む前記メモリに記憶された命令を実行するように適応される、請求項33記載の背景雑音を通信する装置。
【請求項42】
前記高性能削除装置はさらに符号器及び復号器を初期化することを含む前記メモリに記憶された命令を実行するように適応され、符号器及び復号器を前記初期化する命令は、
前記符号器の状態を音声に設定すること、
前記復号器の状態を無言に設定すること、及び
原型フレームを1/8データ比率フレームに設定することを含む、請求項33記載の背景雑音を通信する装置。
【請求項43】
前記高性能削除装置はさらに前記背景雑音を混合することを含む前記メモリに記憶された命令を実行するように適応される、請求項33記載の背景雑音を通信する装置。
【請求項44】
前記高性能削除装置はさらに、前記背景雑音データ比率フレームが受信されなければ抹消を利用することを含む前記メモリに記憶された命令を実行するように適応される、請求項33記載の背景雑音を通信する装置。
【請求項45】
前記高性能削除装置はさらに背景雑音を伝送することを含む、前記メモリに記憶された前記命令を実行するように適応され、前記命令はさらに、
フレームを受信すること、
前記フレームが無言フレームであるかどうかを判定すること、
前記フレームが前記無言フレームでないならば、稼働状態に移行し、且つ前記フレームを伝送すること、
前記フレームが前記無言フレームであるならば、状態が無言状態であるかどうかを判定すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にないならば、前記無言状態へ移行し、且つ前記無言フレームを受信機へ送信すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にあるならば、前記フレームが安定であるかどうかを判定すること、
前記フレームが安定であるならば、統計を更新し、且つ更新が始動されたかどうかを判定すること、及び
前記更新が始動されていたならば、原型フレームを構築し、且つ送信することを含む、請求項33記載の背景雑音を通信する装置。
【請求項46】
前記高性能削除装置はさらに背景雑音を受信することを含む前記メモリに記憶された前記命令を実行するように適応され、前記命令はさらに、
フレームを受信すること、
前記フレームが音声フレームであるかどうかを判定すること、
前記フレームが前記音声フレームであるならば、状態が音声状態であるかどうかを判定すること、
前記状態が前記音声状態であり、且つ前記フレームが前記音声フレームであるならば、前記フレームを利用すること、
前記フレームが音声フレームでないならば、前記フレームが無言フレームであるかどうかを調べること、
前記フレームが前記無言フレームであるならば、前記状態が無言状態であるかどうかを調べること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態でないならば、無言状態に移行し、且つ前記フレームを利用すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態であるならば、更新を生成し、且つ前記更新を利用すること、
前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記状態が前記無言状態であるかどうかを調べること、
前記状態が前記無言状態であり、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、原型フレームを利用すること、
前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、N個の連続した抹消が送信されたかどうかを調べること、
N個の連続した抹消が送信されてなく、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、抹消を利用すること、
及び
N個の連続した抹消が送信されており、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記無言状態に移行し、且つ前記原型フレームを利用することを含む、請求項33記載の背景雑音を通信する装置。
【請求項47】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応され、前記始動命令は、
背景雑音比率フレームをフィルタすること、
前記背景雑音データ比率フレームのエネルギーを前記背景雑音データ比率フレームの平均エネルギーと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含み、前記更新背景雑音データ比率フレームは前記符号帳入力の少なくとも一つを含む、請求項36記載の背景雑音を通信する装置。
【請求項48】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応され、前記始動命令は、
背景雑音比率フレームをフィルタすること、
前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含み、前記更新背景雑音データ比率フレームは前記符号帳入力の少なくとも一つを含む、請求項36記載の背景雑音を通信する装置。
【請求項49】
前記高性能削除装置はさらに前記メモリに記憶された前記始動命令を実行するように適応され、前記始動命令は、
前記背景雑音比率フレームをフィルタすること、
前記背景雑音データ比率フレームのエネルギーを前記背景雑音データ比率フレームの平均エネルギーと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含む、請求項37記載の背景雑音を通信する装置。
【請求項50】
前記高性能削除装置はさらに前記メモリに記憶された前記始動命令を実行するように適応され、前記始動命令は、
背景雑音比率フレームをフィルタすること、
前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含む、請求項37記載の背景雑音を通信する装置。
【請求項51】
前記高性能削除装置はさらに、フレームが受信されなければ抹消を利用することを含む前記メモリに記憶された命令を実行するように適応される、請求項37記載の背景雑音を通信する装置。
【請求項52】
前記高性能削除装置はさらに前記メモリに記憶された前記混合命令を実行するように適応され、前記混合命令はさらに背景雑音を前の更新値から新しい更新値へ徐々に変えることを含む、請求項43記載の背景雑音を通信する装置。
【請求項53】
前記抹消は時間の50パーセント以下で利用される、請求項44記載の背景雑音を通信する装置。
【請求項54】
前記高性能削除装置はさらに背景雑音を伝送することを含む前記メモリに記憶された前記命令を実行するように適応され、前記命令はさらに、
前記フレームが安定でないならば、一時的背景雑音データ比率フレームを伝送することを含む、請求項45記載の背景雑音を通信する装置。
【請求項55】
前記符号帳入力の少なくとも一つは少なくとも一つのエネルギー符号帳入力及び少なくとも一つのスペクトル符号帳入力を含む、請求項47記載の背景雑音を通信する装置。
【請求項56】
前記閾値は1db以上である、請求項49記載の背景雑音を通信する装置。
【請求項57】
前記高性能削除装置はさらに、前記背景雑音データ比率フレームに関する符号帳入力の要素(elements)の絶対差分の和を取ることによって前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと比較する命令を実行するように適応される、請求項50記載の背景雑音を通信する装置。
【請求項58】
前記閾値は40パーセント以上である、請求項50記載の背景雑音を通信する装置。
【請求項59】
前記抹消は時間の50パーセント以下で利用される、請求項55記載の背景雑音を通信する装置。
【請求項60】
前記更新背景雑音データ比率フレームは最も頻繁に使用される符号帳入力を含む、請求項57記載の背景雑音を通信する装置。
【請求項61】
高性能削除装置であって、
メモリ、
前記メモリに記憶された命令を含むソフトウェア、及び
少なくとも一つの入力及び少なくとも一つの出力を含み、前記高性能削除装置は、
背景雑音を伝送すること、
背景雑音を通信するために使用される次の背景雑音データ比率フレームを削除すること、
背景雑音を受信すること、及び
背景雑音を更新することを含む前記メモリに記憶された命令を実行するように適応される、高性能削除装置。
【請求項62】
前記高性能削除装置はさらに背景雑音を伝送することを含む前記メモリに記憶された前記命令を実行するように適応され、前記命令はさらに、
フレームを受信すること、
前記フレームが無言フレームであるかどうかを判定すること、
前記フレームが前記無言フレームでないならば、稼働状態に移行し、且つ前記フレームを伝送すること、
前記フレームが前記無言フレームであるならば、状態が無言状態であるかどうかを判定すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にないならば、前記無言状態へ移行し、且つ前記無言フレームを受信機へ送信すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にあるならば、前記フレームが安定であるかどうかを判定すること、
前記フレームが安定であるならば、統計を更新し、且つ更新が始動されたかどうかを判定する、及び
前記更新が始動されていたならば、原型フレームを構築し、且つ送信することを含み、そして
前記高性能削除装置はさらに背景雑音を受信することを含むメモリに記憶された前記命令を実行するように適応され、前記命令はさらに、
フレームを受信すること、
前記フレームが音声フレームであるかどうかを判定すること、
前記フレームが前記音声フレームであるならば、状態が音声状態であるかどうかを判定すること、
前記状態が前記音声状態であり、且つ前記フレームが前記音声フレームであるならば、
前記フレームを利用すること、
前記フレームが音声フレームでないならば、前記フレームが無言フレームであるかどうかを調べること、
前記フレームが前記無言フレームであるならば、前記状態が無言状態であるかどうかを調べること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態でないならば、無言状態に移行し、且つ前記フレームを利用すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態であるならば、更新を生成し、且つ前記更新を利用すること、
前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記状態が前記無言状態であるかどうかを調べること、
前記状態が前記無言状態であり、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記原型フレームを利用すること、
前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、N個の連続した抹消が送信されたかどうかを調べること、
N個の連続した抹消が送信されてなく、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、抹消を利用すること、及び
N個の連続した抹消が送信されており、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記無言状態に移行し、且つ前記原型フレームを利用することを含む、請求項61記載の背景雑音を通信する装置。
【請求項63】
前記メモリはさらに、
背景エネルギー符号帳入力及び背景スペクトル符号帳入力を持つ符号帳入力を含む符号帳を含み、そして
高性能削除装置はさらに背景雑音を更新することを含む前記メモリに記憶された前記命令を実行するように適応され、前記命令はさらに少なくとも一つの符号帳入力を持つ更新背景雑音データ比率フレームを伝送することを含む、請求項61記載の背景雑音を通信する装置。
【請求項64】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応される、請求項61記載の背景雑音を通信する装置。
【請求項65】
前記高性能削除装置はさらに前記メモリに記憶された利用前記背景雑音命令を実行するように適応され、前記利用背景雑音命令は、
無作為の数列の形で白色雑音を出力すること、及び
白色雑音の周波数特性を抽出することを含む、請求項61記載の背景雑音を通信する装置。
【請求項66】
前記高性能削除装置はさらに、
更新背景雑音データ比率フレームを送信する前に、前記背景雑音データ比率フレームの少なくとも一つが送信されてしまうまで待機し、それによって安定な背景雑音比率フレームが伝送されることを含む前記メモリに記憶された命令を実行するように適応される、請求項61記載の背景雑音を通信する装置。
【請求項67】
前記高性能削除装置はさらに、
更新背景雑音データ比率フレームを送信する前に、最後の一時的背景雑音データ比率フレームが送信された後、40〜100msまで待機し、それによって安定な背景雑音比率フレームが伝送されることを含む前記メモリに記憶された命令を実行するように適応される、請求項61記載の背景雑音を通信する装置。
【請求項68】
前記高性能削除装置はさらに、
限界時間が満了してしまう前に賦活パケットを伝送することを含む前記メモリに記憶された命令を実行するように適応される、請求項61記載の背景雑音を通信する装置。
【請求項69】
前記高性能削除装置はさらに、符号器及び復号器を初期化することを含む前記メモリに記憶された命令を実行するように適応され、符号器及び復号器を前記初期化する命令は、
前記符号器の状態を音声に設定すること、
前記復号器の状態を無言に設定すること、及び
原型を1/8データ比率フレームに設定することを含む、請求項61記載の背景雑音を通信する装置。
【請求項70】
前記高性能削除装置はさらに、前記背景雑音を混合することを含む前記メモリに記憶された命令を実行するように適応される、請求項61記載の背景雑音を通信する装置。
【請求項71】
前記高性能削除装置はさらに、前記背景雑音データ比率フレームが受信されなければ、抹消を利用することを含む前記メモリに記憶された命令を実行するように適応される、請求項61記載の背景雑音を通信する装置。
【請求項72】
前記高性能削除装置はさらに背景雑音を伝送することを含む前記メモリに記憶された命令を実行するように適応され、前記命令はさらに、
フレームを受信すること、
前記フレームが無言フレームであるかどうかを判定すること、
前記フレームが前記無言フレームでないならば、稼働状態に移行し、且つ前記フレームを伝送すること、
前記フレームが前記無言フレームであるならば、状態が無言状態であるかどうかを判定すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にないならば、前記無言状態へ移行し、且つ前記無言フレームを受信機へ送信すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態にあるならば、前記フレームが安定であるかどうかを判定すること、
前記フレームが安定であるならば、統計を更新し、且つ更新が始動されたかどうかを判定する、及び
前記更新が始動されていたならば、原型フレームを構築し、且つ送信することを含む、請求項61記載の背景雑音を通信する装置。
【請求項73】
前記高性能削除装置はさらに背景雑音を受信することを含む前記メモリに記憶された命令を実行するように適応され、前記命令はさらに、
フレームを受信すること、
前記フレームが音声フレームであるかどうかを判定すること、
前記フレームが前記音声フレームであるならば、状態が音声状態であるかどうかを判定すること、
前記状態が前記音声状態であり、且つ前記フレームが前記音声フレームであるならば、前記フレームを利用すること、
前記フレームが音声フレームでないならば、前記フレームが無言フレームであるかどうかを調べること、
前記フレームが前記無言フレームであるならば、前記状態が無言状態であるかどうかを調べること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態でないならば、無言状態に移行し、且つ前記フレームを利用すること、
前記フレームが前記無言フレームであり、且つ前記状態が前記無言状態であるならば、
更新を生成し、且つ前記更新を利用すること、
前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記状態が前記無言状態であるかどうかを調べること、
前記状態が前記無言状態であり、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、原型フレームを利用すること、
前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、N個の連続した抹消が送信されたかどうかを調べること、
N個の連続した抹消が送信されてなく、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、抹消を利用すること、及び
N個の連続した抹消が送信されており、前記状態が前記無言状態ではなく、且つ前記フレームが前記音声フレームまたは前記無言フレームでないならば、前記無言状態に移行し、且つ前記原型フレームを利用することを含む、請求項61記載の背景雑音を通信する装置。
【請求項74】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応され、前記始動命令はさらに、
背景雑音データ比率フレームをフィルタすること、
前記背景雑音データ比率フレームのエネルギーを前記背景雑音データ比率フレームの平均エネルギーと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含み、前記更新背景雑音データ比率フレームは前記符号帳入力の少なくとも一つを含む、請求項63記載の背景雑音を通信する装置。
【請求項75】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応され、前記始動命令はさらに、
背景雑音データ比率フレームをフィルタすること、
前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含み、前記更新背景雑音データ比率フレームは前記符号帳入力の少なくとも一つを含む、請求項63記載の背景雑音を通信する装置。
【請求項76】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応され、前記始動命令はさらに、
前記背景雑音データ比率フレームをフィルタすること、
前記背景雑音データ比率フレームのエネルギーを前記背景雑音データ比率フレームの平均エネルギーと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含む、請求項64記載の背景雑音を通信する装置。
【請求項77】
前記高性能削除装置はさらに前記メモリに記憶された始動命令を実行するように適応され、前記始動命令はさらに、
背景雑音データ比率フレームをフィルタすること、
前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと比較すること、及び
差分が閾値を越えるならば、更新背景雑音データ比率フレームを伝送することを含む、請求項64記載の背景雑音を通信する装置。
【請求項78】
前記高性能削除装置はさらに、フレームが受信されなければ抹消を利用することを含む前記メモリに記憶された命令を実行するように適応される、請求項64記載の背景雑音を通信する装置。
【請求項79】
前記高性能削除装置はさらに、前記メモリに記憶された前記混合命令を実行するように適応され、前記混合命令はさらに背景雑音を前の更新値から新しい更新値へ徐々に変えることを含む、請求項70記載の背景雑音を通信する装置。
【請求項80】
前記抹消は時間の50パーセント以下で利用される、請求項71記載の背景雑音を通信する装置。
【請求項81】
前記高性能削除装置はさらに、背景雑音を伝送することを含む前記メモリに記憶された命令を実行するように適応され、前記命令はさらに、
前記フレームが安定でないならば、一時的背景雑音データ比率フレームを伝送することを含む、請求項72記載の背景雑音を通信する装置。
【請求項82】
前記符号帳入力の少なくとも一つは少なくとも一つのエネルギー符号帳入力、及び少なくとも一つのスペクトル符号帳入力を含む、請求項47記載の背景雑音を通信する装置。
【請求項83】
前記閾値は1db以上である、請求項76記載の背景雑音を通信する装置。
【請求項84】
前記高性能削除装置はさらに、前記背景雑音データ比率フレームに関する符号帳入力の要素(elements)の絶対差分の和を取ることによって前記背景雑音データ比率フレームのスペクトルを前記背景雑音データ比率フレームの平均スペクトルと前記比較することを実行するように適応される、請求項77記載の背景雑音を通信する装置。
【請求項85】
前記閾値は40パーセント以上である、請求項77記載の背景雑音を通信する装置。
【請求項86】
前記抹消は時間の50パーセント以下で利用される、請求項82記載の背景雑音を通信する装置。
【請求項87】
前記更新背景雑音データ比率フレームは最も頻繁に使用される符号帳入力を含む、請求項84記載の背景雑音を通信する装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5a】
image rotate

【図5b】
image rotate

【図5c】
image rotate

【図5d】
image rotate

【図5e】
image rotate

【図5f】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2011−250430(P2011−250430A)
【公開日】平成23年12月8日(2011.12.8)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−138322(P2011−138322)
【出願日】平成23年6月22日(2011.6.22)
【分割の表示】特願2007−554203(P2007−554203)の分割
【原出願日】平成18年2月1日(2006.2.1)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】