スピーチフレーム内の情報のロスを防ぐためのシステムおよび方法

スピーチフレーム内の情報のロスを防ぐ方法が説明される。
符号化されるべき第１のスピーチフレームが選択される。
第２のスピーチフレームおよび１つまたは複数の近接スピーチフレーム内の情報に基づいて第２のスピーチフレームがクリティカルかどうかについての判断が行われる。
第２のスピーチフレームがクリティカルスピーチフレームである場合、第２のスピーチフレームの符号化バージョンの少なくとも一部は、選択された前方誤り訂正（ＦＥＣ）モードに従って生成される。
第１のスピーチフレームおよび第２のスピーチフレームの符号化バージョンの少なくとも一部が送信される。

【発明の詳細な説明】
【技術分野】
【０００１】
本システムおよび方法は、通信および無線関連技術に関する。詳細には、本システムおよび方法は、スピーチフレーム内の情報ロスを防ぐためのシステムおよび方法に関する。
【背景技術】
【０００２】
デジタル音声通信は、回線交換ネットワークを介して実行されている。回線交換ネットワークは、呼の期間の間、２つの端末間で物理的パスが確立されるネットワークである。回線交換アプリケーションでは、送信端末は、物理的パスを介して、音声情報を含むパケットのシーケンスを受信端末に送る。受信端末は、スピーチを合成するために、パケット内に含まれた音声情報を使用する。
【０００３】
デジタル音声通信は、パケット交換ネットワークを介して実行され始めた。パケット交換ネットワークは、パケットが宛先アドレスに基づいて、その中でそのネットワークの一定のルートで送られるネットワークである。パケット交換通信の場合、ルータは、それぞれのパケットに関するパスを個々に判断して、それをその宛先に至るまで任意の利用可能なパスに送る。結果として、パケットは、同時にまたは同じ順序で受信端末に到着しない。パケットを順序よく戻し、それらのパケットを連続的な順序で再生するために、デジッタバッファを受信端末内で使用できる。
【０００４】
場合によっては、パケットは、送信端末から受信端末への伝送途中に失われる。失われたパケットは、合成スピーチの品質を劣化させる可能性がある。したがって、スピーチフレーム内の情報ロスを防ぐためのシステムおよび方法を提供することによって、利益を実現することが可能である。
【図面の簡単な説明】
【０００５】
【図１】伝送媒体を介した送信端末および受信端末の一例を示すブロック図。
【図２】送信端末のさらなる構成を例示するブロック図。
【図３】前方誤り訂正（ＦＥＣ）モジュールの１つの構成を例示するブロック図。
【図４】クリティカルフレーム識別モジュールの１つの構成を例示するブロック図。
【図５】ＦＥＣモード選択アルゴリズムの１つの例を例示するブロック図。
【図６】チャネル状態フィードバックモジュールの１つの構成を例示するブロック図。
【図７】動的レート制御モジュールの１つの例を例示するブロック図。
【図８】受信端末の１つの構成を例示するブロック図。
【図９】ボイスオーバインターネットプロトコル（ＶｏＩＰ）のために前方誤り訂正（ＦＥＣ）の方法の１つの例を例示するフローチャート。
【図１０】図９に示される方法に対応するミーンズプラスファンクションブロックを例示する。
【図１１】無線通信デバイスで利用される様々なコンポーネントを例示する。
【図１２】開示されたシステムおよび方法の１つの例に従う基地局のブロック図。
【発明を実施するための形態】
【０００６】
音声アプリケーションは、パケット交換ネットワーク内で実装可能である。音声アプリケーションは、ボイスオーバインターネットプロトコル（ＶｏＩＰ）ネットワークで実装可能である。音声情報を伴うパケットは、ネットワーク上で第１のデバイスから第２のデバイスに送信可能である。しかしながら、パケットのうちのいくつかは、パケットの伝送の間に失われる可能性がある。例えば、（バースト的なパケットロスと呼ばれることがある）複数のパケットのロスは、受信デバイスにおいて認知されたスピーチ品質の劣化の原因であり得る。１つの構成において、パケットは、１つまたは複数のフレームを含み得る。
【０００７】
ＶｏＩＰネットワークにおけるパケットロスに起因する認知されたスピーチ品質の劣化を軽減するために、２つのタイプの解が存在する。第１の解は、受信機ベースのパケットロス補償（ＰＬＣ：packet loss concealment）方法であり得る。ＰＬＣ方法は、ＶｏＩＰ通信におけるパケットロスの影響をマスクする技術であり得る。例えば、ＰＬＣ方法は、送信の間に失われたものの代わりに代替パケットを生成するように実装され得る。ＰＬＣ方法は、失われたものにできるだけ類似したパケットを生成することを試み得る。受信機ベースのＰＬＣ方法は、代替パケットを生成するために送信機からの追加リソースまたは助けを必要とし得ない。しかしながら、重要なスピーチフレームが失われる場合、ＰＬＣ方法は、効果的にパケットロスの影響をマスクし得ない。
【０００８】
第２の解は、送信機ベースの弾力的なスキームであり得る。そのようなスキームの一例は、前方誤り訂正（ＦＥＣ）方法であり得る。ＦＥＣ方法は、各パケットのある追加データを送ることを含み得る。追加データは、送信の間にデータのロスによって生じた誤りを回復するために使用され得る。例えば、ＦＥＣスキームは、冗長スピーチフレームを送信し得る。言いかえれば、スピーチフレームの１つより多いコピー（典型的に２つ）は、送信機によって送信される。これらの２つのフレームは、主要コピーおよび冗長コピーと称され得る。
【０００９】
送信機ベースのパケットロス弾力的スキームが復号化スピーチの知覚品質を改善するが、これらのスキームは、さらにスピーチの送信の間に使用される帯域幅を増大させ得る。従来のＦＥＣスキームは、さらにリアルタイムの会話に耐えられないエンドツーエンド遅延を増大させ得る。例えば、従来の送信機ベースのスキームは、２つの異なる期間で同じスピーチフレームを２度送る。これは、データレートを少なくとも２倍にし得る。いくつかの従来のスキームは、データレートを低減するために低ビットレートコーデックを冗長コピーのために使用し得る。しかしながら、低ビットレートコーデックの使用は、符号器での複雑性を増大させ得る。さらに、いくつかの従来のスキームは、フレームの主要コピーとフレームの冗長コピーとの両方のために同じ低ビットレートコーデックを使用し得る。これは、符号器での複雑さを低減するとともにデータレートを低減し得るが、基本スピーチ品質（つまり、フレームが失わない場合のスピーチ品質）は、大幅に劣化する。さらに、従来の送信機ベースのスキームは、少なくとも１つのフレーム間隔の追加遅延の仮定の下で動作する。
【００１０】
本システムおよび方法は、スピーチ品質と、遅延と、データレートソースとの間の最適なトレードオフを取得するためにソースおよびチャネル制御ＦＥＣスキームを提供する。１つの構成において、いかなる追加の遅延もこのＦＥＣスキームに導入されない。適度なデータレートの増大の下のスピーチ品質の高品質改良が達成され得る。以下で説明されるＦＥＣスキームは、さらに任意のターゲットデータレートで動作し得る。１つの例において、ＦＥＣスキームおよびターゲットデータレートは、送信チャネルの条件とともに外部制御に基づいて適応的して調整され得る。提案されたＦＥＣスキームは、さらにレガシ通信デバイス（例えばレガシハンドセット）と互換性を有し得る。
【００１１】
スピーチ信号内の情報のロスを防ぐ方法が開示される。方法は、符号化されるべき第１のスピーチフレームを選択することを含み得る。方法は、さらに第２のスピーチフレームおよび１つまたは複数の近接スピーチフレーム内の情報に基づいて第２のスピーチフレームがクリティカルスピーチフレームであるかどうか判断することを含み得る。方法は、さらに第２のスピーチフレームがクリティカルスピーチフレームである場合に第２のスピーチフレームの符号化バージョンの少なくとも一部を生成することを含み得る。方法は、さらに第１のスピーチフレームおよび第２のスピーチフレームの符号化バージョンの少なくとも一部を送信することを含み得る。
【００１２】
スピーチ信号内の情報のロスを防ぐための無線デバイスが開示される。無線デバイスは、第２のスピーチフレームがクリティカルスピーチフレームかどうか判断するために第２のスピーチフレームおよび１つまたは複数の近接したスピーチフレーム内の情報を使用するように構成されたクリティカルフレーム識別モジュールを含み得る。無線デバイスは、さらに第２のスピーチフレームがクリティカルスピーチフレームである場合に選択された前方誤り訂正モードに従う第２のスピーチフレームの符号化バージョンの少なくとも一部を生成するように構成された前方誤り訂正（ＦＥＣ）モジュールを含み得る。無線デバイスは、さらに第１のスピーチフレーム、および第２のスピーチフレームの符号化バージョンの少なくとも一部を送信するように構成された送信機を含み得る。
【００１３】
スピーチ信号内の情報のロスを防ぐための装置が開示される。装置は、符号化されるべき第１のスピーチフレームを選択するための手段を含み得る。装置は、さらに第２のスピーチフレーム内の情報および１つまたは複数の近接したスピーチフレーム内の情報に基づいて第２のスピーチフレームがクリティカルフレームであるか判断するための手段を含み得る。装置は、さらに第２のスピーチフレームがクリティカルスピーチフレームである場合に選択された前方誤り訂正モードに従う第２のスピーチフレームの符号化バージョンの少なくとも一部を生成するための手段を含み得る。装置は、第１のスピーチフレームおよび第２のスピーチフレームの符号化バージョンの少なくとも一部を送信するための手段をさらに含み得る。
【００１４】
スピーチ信号内の情報のロスを防ぐためのコンピュータプログラムプロダクトが開示される。コンピュータプログラムプロダクトは、その上に命令を有するコンピュータ可読媒体を含み得る。その命令は、符号化されるべき第１のスピーチフレームの選択のためのコードを含み得る。命令は、さらに第２のスピーチフレームおよび近接したスピーチフレームに基づいて第２のスピーチフレームがクリティカルスピーチフレームかどうか判断するためのコードを含み得る。その命令は、さらに第２のスピーチフレームがクリティカルスピーチフレームである場合に選択された前方誤り訂正モードに従う第２のスピーチフレームの符号化バージョンの少なくとも一部を生成するためのコードを含み得る。その命令は、さらに第１のスピーチフレームおよび第２のスピーチフレームの符号化バージョンの少なくとも一部の送信のためのコードを含み得る。
【００１５】
図１は、伝送媒体１１４を介した送信端末１０２および受信端末１０４の一例を示すブロック図１００である。送信端末１０２および受信端末１０４は、電話、コンピュータ、音声ブロードキャストおよび受信装置、ビデオ会議装置などを含む音声通信をサポートすることが可能な任意のデバイスであってよい。１つの構成では、送信端末１０２および受信端末１０４は、符号分割多元接続（ＣＤＭＡ）機能など、無線多元接続技術を用いて実施可能である。ＣＤＭＡは、スペクトル拡散通信に基づく変調および多元接続スキームである。
【００１６】
送信端末１０２は、音声符号器１０６を含むことが可能であり、受信端末１０４は、音声復号器１０８を含むことが可能である。音声符号器１０６は、人の発話生成のモデルに基づいてパラメータを抽出することによって、第１のユーザインターフェース１１０からスピーチを圧縮するために使用可能である。送信機１１２は、伝送媒体１１４を通してこれらのパラメータを含むパケットを送信するために使用可能である。伝送媒体１１４は、インターネット、もしくは企業イントラネット、または任意のその他の伝送媒体などパケットベースのネットワークであってよい。伝送媒体１１４のもう一方の終端の受信機１１６は、パケットを受信するために使用可能である。音声復号器１０８は、パケット内のパラメータを使用して、スピーチを合成できる。合成スピーチは、受信端末１０４上の第２のユーザインターフェース１１８に提供され得る。図示されないが、巡回冗長検査（ＣＲＣ）機能、インタリーブ、デジタル変調、スペクトル拡散処理などを含む、畳み込み符号化など、様々な信号処理機能を送信機１１２と受信機１１６の両方において実行することが可能である。
【００１７】
通信に対するそれぞれの当事者は、送信、ならびに受信が可能である。それぞれの端末は、音声符号器と音声復号器とを含み得る。音声符号器および音声復号器は、別個のデバイスであってよく、または「ボコーダ」として知られている、単一のデバイス内に統合されてもよい。以下の詳細な説明では、端末１０２、１０４は、伝送媒体１１４の一方の終端における音声符号器１０６と、もう一方の終端における音声復号器１０８とを用いて説明される。
【００１８】
送信端末１０２の少なくとも１つの構成では、スピーチは、それぞれがサブフレームにさらに区分化された状態で、フレーム内の第１のユーザインターフェース１１０から音声符号器１０６への入力であってよい。何らかのブロック処理が実行される場合、これらの任意のフレーム境界を使用できる。しかしながら、ブロック処理ではなく連続的な処理が実施される場合、音声サンプルは、フレーム（および、サブフレーム）に区分化されなくてもよい。説明される例では、伝送媒体１１４を通して送信されるそれぞれのパケットは、特定の用途、および全体的な設計制約に応じて、１つまたは複数のフレームを含み得る。
【００１９】
音声符号器１０６は、可変レート符号器、または固定レート符号器であってもよい。可変レート符号器は、スピーチコンテンツに応じて、フレームからフレームに複数の符号器モード間で動的に切り替えることが可能である。音声復号器１０８は、さらにフレームからフレームに対応する復号器モード間で動的に切り替えることが可能である。受信端末１０４において許容信号再生を維持しながら、それぞれのフレームが利用可能な最低のビットレートを達成するために特定のモードを選ぶことが可能である。
【００２０】
１つの構成において、受信端末１０４は、さらに送信端末１０２にチャネル状態情報１２０をフィードバックし得る。１つの例において、受信端末１０４は、送信端末１０２からパケットを送信するために使用されるチャネル品質に関する情報を収集する。受信端末１０４は、チャネル品質を推定するために収集情報を使用し得る。その後、この推定値は、チャネル状態情報１２０として送信端末１０２にフィードバックされ得る。送信端末１０２は、送信機ベースのパケットロス弾力性スキーム（つまり、ＦＥＣスキーム）に関連した１つまたは複数の機能に適応するためにチャネル状態情報１２０を使用し得る受信チャネル状態情報１２０に基づいたＦＥＣスキームの適応に関する詳細は、以下により十分に説明される。
【００２１】
音声符号器１０６および音声復号器１０８は、線形予測符号（ＬＰＣ）を使用できる。ＬＰＣ符号化の場合、スピーチは、その強度とピッチとによって特徴付けられるスピーチソース（声帯）によってモデル形成され得る。声帯からのスピーチは、「フォルマント」と呼ばれるその共振によって特徴付けられる声道（喉および口）を介して移動する。ＬＰＣ音声符号器は、フォルマントを推定して、スピーチからその効果を除去し、残差スピーチの強度とピッチとを推定することによってスピーチを解析できる。受信終端におけるＬＰＣ音声復号器は、このプロセスを反転することによって、そのスピーチを合成することが可能である。詳細には、ＬＰＣ音声復号器は、スピーチソースを作成するために残差スピーチを使用して、（声道を表す）フィルタを作成するためにフォルマントを使用し、そのスピーチを合成するために、そのフィルタを介してそのスピーチソースを実行することが可能である。
【００２２】
図２は、ＬＰＣ音声符号器２０６の例を説明するブロック図である。ＬＰＣ音声符号器２０６は、ＬＰＣモジュール２０２を含み得る。それは、現在またはＮ番目のスピーチフレーム２１６におけるスピーチからのフォルマントを推定する。基本的ソリューションは、差分方程式であり得る。それは、先のスピーチサンプルの線形結合（スピーチサンプルの短期間の関係）としてフレームの各スピーチサンプルを表す。差分方程式の係数は、フォルマントの特徴を示す。ＬＰＣ係数２２２は、逆フィルタ２１４に適用され得る。それは、スピーチからのフォルマントの影響を取り除き得る。ＬＰＣ係数とともに残差スピーチは、スピーチが受信側で再構成できるように伝送媒体を通じて送信され得るＬＰＣ音声符号器２０６の少なくとも１つの構成において、ＬＰＣ係数は、変換モジュール２０４によって線スペクトル対（ＬＳＰ）に転換される。係数は、よりよい送信および数学的な操作効率のために変形され得る。
【００２３】
さらなる圧縮技術は、冗長マテリアルを除去することによってスピーチを表わすために要求された情報を減少させるために使用され得る。これは、人間の声帯の周期振動によって生じるある基本周波数があるという事実を有効に使うことによって達成され得る。これらの基本周波数は、しばしば「ピッチ」と呼ばれる。このピッチは、（１）スピーチセグメントの自己相関関数を最大限にするスピーチサンプルの数の「遅延」、および（２）「適応可能なコードブック利得」２１８を含む「適応可能なコードブックパラメータ」、によって定量化されることができる。適応可能なコードブック利得は、スピーチの長期的な周期性がサブフレーム基準（sub-frame basis）でどれくらい強いかを測定２１８する。これらの長期的な周期性は、受信端末に送信される前の残差スピーチから引かれ得る。
【００２４】
減算器２１０からの残差スピーチは、多くの方法でさらに符号化され得る。例えば、最も典型的なスピーチ残差信号にパラメータを割り当てるテーブルであるコードブック２１２が使用され得る。動作において、減算器２１０からの残差スピーチは、コードブック２１２におけるすべてのエントリと比較される。最近接の一致を備えるエントリのためのパラメータが選択される。固定コードブックパラメータは、「固定コードブックインデックス」および「固定コードブック利得」を含む。固定コードブック係数は、フレームのために新しい情報（エネルギ）を包含する。それは、基本的にフレーム間の違い（difference）の符号化表現である。固定コードブック利得は、受信端末１０４の音声復号器１０８がスピーチの現在のサブフレームに新しい情報（固定コードブック係数）を適用するために使用されるべき利得を表わす。
【００２５】
ピッチ推定器２０８は、さらに「デルタ遅延」または「ＤＤｅｌａｙ」と称される追加の適応可能なコードブックパラメータを生成するために使用され得る。ＤＤｅｌａｙは、現在のフレームと先のフレームとの間で測定された遅延の差である。しかしながら、それは制限された範囲を有し、２つのフレーム間の遅延の差がオーバーフローする場合に０にセットされ得る。このパラメータは、スピーチを合成するために受信端末１０４の音声デコーダ１０８によって使用され得ない。代わりに、それは失われたフレームまたは破損したフレームのためにスピーチサンプルのピッチを計算するために使用される。
【００２６】
１つの構成において、符号器２０６は、さらにＦＥＣモジュール２２０を含み得る。ＦＥＣモジュール２２０は、Ｋ番目のスピーチフレーム２１５を受信し得る。ここで、Ｋは、Ｎ未満である。ＦＥＣモジュール２２０がＫ番目のフレーム２１５を分析した際にこれらの符号化フレーム２１７が存在する場合、ＦＥＣモジュール２２０は、Ｋ番目のスピーチフレーム２１７より前の１つまたは複数の符号化フレームおよび／またはＫ番目のスピーチフレーム２１５の後に生じる１つまたは複数の符号化フレーム２１７をさらに受信し得る。
【００２７】
ＦＥＣモジュール２２０は、Ｋ番目のスピーチフレームを分析し得る。ＦＥＣモジュール２２０は、Ｋ番目のスピーチフレーム２１５がクリティカルフレームかどうか判断し得る。分析されたＫ番目のスピーチフレーム２１５は、ＦＥＣモジュール２２０によって受信されるＫ番目のスピーチフレーム２１５の後および／または先に生じる１つまたは複数の符号化フレーム２１７およびＫ番目のスピーチフレーム２１５に含まれる情報に基づいてクリティカルフレームとみなされ得る。Ｋ番目のスピーチフレーム２１５がクリティカルフレームであると判断された場合、ＦＥＣモジュール２２０は、さらにＫ番目のスピーチフレーム２１５を「保護する」ことになる実施に対するプロセスを決定し得る。
【００２８】
クリティカルフレームを保護するプロセスは、クリティカルフレームの冗長コピーを生成することを含み得る。クリティカルフレームの冗長コピーは、クリティカルフレームのパラメータのうちのいくつかまたはすべてを含み得る。Ｋ番目のスピーチフレーム２１５がクリティカルフレームであり、受信端末１０４に送信する間に失われる場合に、ＦＥＣモジュール２２０は、Ｋ番目のスピーチフレーム２１５を保護することを決定し得る。ＦＥＣモジュール２２０に関するより多くの詳細が以下で説明される。
【００２９】
図３は、ＦＥＣモジュール３２０の１つの構成を例示するブロック図である。ＦＥＣモジュール３２０は、スピーチフレームを分析し、スピーチフレームがクリティカルフレームかどうか判断し、スピーチフレームの冗長コピーを生成することによってスピーチフレームを保護するために使用される、１つまたは複数の追加モジュールを含み得る。コピーされるべきフレームは、本明細書に主要フレームと呼ばれ得る。冗長コピーは、主要フレームのパラメータのうちのいくつかまたはすべてを複製することによって生成される、または主要フレームを符号化するために使用されるものと異なるコーディング方法を使用して、主要フレームを符号化することによって生成され得る。通常、このコーディング方法は、主要フレームより低レートを有する。
【００３０】
１つの例示において、ＦＥＣモジュール３２０は、クリティカルフレーム識別（ＩＤ）モジュール３０２（図４に関係して議論される）、部分フレーム保護モジュール３０４（図５に関係して議論される）、完全フレーム保護モジュール３０６（図５に関係して議論される）、ＦＥＣモード選択アルゴリズム３０８（図５に関係して議論される）、チャネル状態フィードバックモジュール３１０（図６に関係して議論される）、および動的レート制御モジュール３１２（図７に関係して議論される）を含む。クリティカルフレームＩＤモジュール３０２は、スピーチフレームがクリティカルフレームかどうか判断し得る。１つの構成において、このモジュール３０２は、パケットロス条件の下での最もクリティカルフレームを識別するために使用されてもよい。
【００３１】
図４は、クリティカルフレーム識別モジュール４０２の１つの構成を説明するブロック図である。モジュール４０２は、フレームがフレームのプロパティ４３０とともに近接フレームプロパティ４３２も分析することによってクリティカルフレームかどうか判断し得る。クリティカルフレームは、そのフレームが失われた場合に重大な品質低下を引き起こすフレームであり得る。例えば、いくつかの重要なパラメータが先のフレームから現在のフレームにおいて大きく（ある所定のしきい値より大きく）変化する場合、現在のフレームは、先のフレームから容易に予測されないので、現在のフレームは、クリティカルフレームになり得る。さらに、クリティカルフレームＩＤモジュール４０２は、スピーチフレームがフレームおよび近隣フレームのスピーチモード４３４に基づいてクリティカルフレームかどうか判断し得る。クリティカルフレーム判断は、さらにフレームおよび近隣フレームのコーディングタイプ４３５に基づき得る。例えば、スピーチモード４３４は、フレームごとの特徴を示し得る。スピーチフレームコーディングタイプは、現在のフレームを符号化するために使用される符号化プロセスを示し得る。スピーチフレームコーディングタイプの例は、コード励起線形予測（ＣＥＬＰ）、ノイズ励起線形予測（ＮＥＬＰ）、プロトタイプピッチ周期（ＰＰＰ）などを含み得る。スピーチモードの例は、有声、無声、沈黙、過渡（transient）、声の出だし（voiced onset）、などを含み得る。例えば、クリティカルＣＥＬＰフレームは、クリティカルＮＥＬＰフレームよりクリティカルであるが、声の出だしフレームは、安定した音声フレームよりクリティカルであり得る。１つの構成において、クリティカルフレーム識別モジュール４０２は、スピーチフレームがクリティカルフレームかどうか判断するためにいかなる追加の符号化遅延を要求し得ない。
【００３２】
クリティカルフレーム識別モジュールは、フレームがクリティカルフレームかどうか判断するだけでなく、フレームのクリティカルネスレベル（criticalness level）を判断し得る。これは、スピーチフレームおよびその近接フレームのパラメータ、特徴、コーディングタイプ、およびモードに基づき得る。異なるクリティカルフレームは、異なるクリティカルネスレベルを有し得る。例えば、２つのクリティカルフレーム、ＡおよびＢのために、Ａの次のフレームがＡから十分予測可能であり、Ｂの次のフレームがＢに全く依存しない場合、Ａを失うことは、１つのフレームより多くのフレームにわたって品質低下を引き起こすので、Ａは、Ｂよりさらにクリティカルであり得る。
【００３３】
図３に戻り、ＦＥＣモジュール３２０は、さらにＦＥＣモード選択アルゴリズム３０８を含み得る。セレクションアルゴリズム３０８は、フレームがクリティカルフレームであると判断する場合に実施する保護モードを選択し得る。保護モードは、クリティカルフレームの冗長コピーにコピーされることになる、クリティカルフレームのパラメータの量を示し得る。保護モードの例は、完全保護モードおよび１つまたは複数の部分保護モードを含み得る。例えば、部分保護モードは、パラメータの１つのセットまたはパラメータの複数のセットのみを保護し得る。
【００３４】
１つの例示において、完全保護モードは、完全フレーム保護モジュール３０６によって実施され得る。完全保護モードは、クリティカルフレームにおけるすべてのパラメータがコピーされフレームの冗長コピーに含まれることを示し得る。１つの構成において、部分保護モードは、部分フレーム保護モジュール３０４によって実装され得る。部分保護モードは、クリティカルフレームのパラメータの一部のみがコピーされ、クリティカルフレームの冗長コピーに含まれることを示し得る。部分保護モードは、さらにフレームが低レート符号化方法によって符号化することを示し得る。
【００３５】
図５に例示されるように、ＦＥＣモード選択アルゴリズム５０８は、選択された保護モードを実施するために部分フレーム保護モジュール５０４または完全フレーム保護モジュール５０６のいずれかを選択し得る。完全保護モードおよび部分保護モードは、利用可能な帯域幅を有効に利用し、レガシ通信デバイスとの下位互換性を提供し得る。１つの構成において、完全保護モードが選択されている場合、部分保護モードは、無効になり得る。ＦＥＣモード選択アルゴリズム５０８は、送信端末１０２から受信端末１０４への送信パケットに使用される送信チャネルの物理的プロパティに基づいて実施する保護モードを選択し得る。使用するモードの選択は、さらにフレームの特徴に基づき得る。たとえパラメータのサブセットが先のフレームと現在のフレームとの間で大きく変化する場合でさえも、パラメータのこのサブセットだけは、保護される必要がある。この場合において、フレームロスが起こる場合、保護されない他のパラメータは、先のフレームから予測され得る。さらに、ＦＥＣモード選択アルゴリズム５０８は、送信端末１０２によってサポートされる保護モードに基づいて保護モードを選択し得る。
【００３６】
図３に戻って、ＦＥＣモジュール３２０は、さらにチャネル状態フィードバックモジュール３１０を含み得る。図６に示されるように、チャネル状態フィードバックモジュール６１０は、チャネル状態情報６２０を受信し得る。以前説明されたように、チャネル状態情報６２０は、受信端末１０４で収集され、と推定され得る。チャネル状態情報６２０は、送信端末１０２に送信し返され得る。１つの構成において、チャネル状態フィードバックモジュール６２０は、受信チャネル状態情報６２０を分析する。情報６２０は、送信端末１０２および受信端末１０４との間の送信のために使用されたチャネルの品質を示し得る。フィードバックモジュール６１０は、チャネルの品質を分析し、ＦＥＣモード選択アルゴリズム３０８にその結果を提供し得る。
【００３７】
（チャネル状態フィードバックモジュール６１０によって提供された）チャネルの品質に基づいて、選択アルゴリズム３０８は、選択された保護モードを適応的に変更し得る。言いかえれば、チャネルの品質が劣化するときに、ＦＥＣモード選択アルゴリズム３０８は、受信端末１０４へのクリティカルフレームの冗長コピーを送るために必要とされるデータレートを低減するために部分保護モードを選択し得る。チャネルの品質が増加するときに、ＦＥＣモード選択アルゴリズム３０８は、完全保護モードを適応させ選択し得る。完全保護モードにより、クリティカルフレームのパラメータ各々は、フレームの冗長コピーにコピーされ含まれる。チャネル品質の増加は、より高いデータレートが達成されことを示し得る。
【００３８】
１つの構成において、チャネル状態フィードバックモジュール６１０は、さらにオフセット計算機６２２を含み得る。１つの例において、オフセット計算機６２２は、ＦＥＣオフセットの値を決定する。オフセットは、フレームの主要コピーの送信時間とフレームの冗長コピーの送信時間との間隔であり得る。言いかえれば、オフセット計算機６２２は、クリティカルフレームの冗長コピーが受信端末１０４へいつ送信されるか決定し得る。通常、パケット交換ネットワークにおけるパケットロスは、バースト的であり、バーストの長さは、異なるネットワーク状態の下で異なり得る。したがって、動的に調整されたオフセットを使用することは、よりよい誤り保護性能が得られる。最適なオフセットは、受信機によるチャネル状態データ送信を使用して推定され得る。
【００３９】
図３に戻って、ＦＥＣモジュール３２０は、動的なレート制御モジュール３１２をさらに含み得る。レート制御モジュール３１２は、目標データレートに合わせるために各フレームのための最終保護モードを決定し得る。図７に説明されるように、動的レート制御モジュール７１２は、チャネル状態フィードバックモジュール７１０から受信したチャネル状態情報および指定された目標データレート７３４に基づいて最終保護モードを決定し得る。
【００４０】
最終保護モードを決定するために、レート制御モジュール７１２は、所定の目標レートに近づけるための２つのステップを実行し得る。第１のステップにおいて、２つの近接した動作ポイントが決定され得る。動作ポイントは、データレートであり得る。目標データレート７３４の値が２つの動作ポイントの値の間にあるように、これらの二つの近接動作ポイントは、選択され得る。１つの構成において、動作ポイントは、スピーチフレーム誤り弾性プロパティ（speech frame error-resilience properties）に基づく所定の保護決定であり得る。第１の動作ポイントが第２の動作ポイントより高いデータレートを有する場合、第１の動作ポイントに関連した保護決定の性能は、第２の動作点に関連した保護決定よりパケットロス状態の下でよりよくなり得る。
【００４１】
第２のステップにおいて、第１のステップで２つの近接動作ポイントによって定義された保護決定の範囲内で、動的レート制御モジュール７１２は、目標データレート７３４に合わせるように保護決定を調整し得る。１つの構成において、２つの動的制御アルゴリズム、例えば、ランダムレート制御アルゴリズム７３０、および動的レート制御アルゴリズム７３２が提供され得る。ランダムレート制御アルゴリズム７３０は、各フレームの保護決定を決定するためにランダムアルゴリズムを使用し得る。ランダムアルゴリズムは、平均データレートが目標データレート７３４に近づくように構成され得る。代替として、決定論的レート制御アルゴリズムは、決定論的方法を通じて各フレームの保護決定を決定し得る。平均レートは、すべてのフレームのために計算され得る。平均レートが目標レートを越えるものである場合、より低いデータレート保護または非保護は、現在のフレームのために使用され；そうでなければ、より高いデータレート保護は、現在のフレームのために使用され得る。現在のフレームの保護決定は、さらに第１のステップにおいて２つの近接動作ポイントによって定義された保護決定の範囲で制限され得る。目標データレート７３４は、容量要求に基づいて外部から指定され得る。代替として、目標データレート７３４は、チャネル状態情報１２０のフィードバックに基づいて内部で指定され得る。
【００４２】
図８は、受信端末８０４のブロック図である。この構成では、ＶｏＩＰクライアント２３０は、デジッタバッファ２０２を含む。受信端末２０４は、さらに１つまたは複数の音声復号器２０８を含む。復号器８０８は、スピーチ生成器８３２を含み得る。音声復号器８０８は、独立型のエンティティとしてボコーダの一部として実装可能であり、または受信端末８０４内の１つもしくは複数のエンティティを通して分散することも可能である。音声復号器８０８は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組合せとして実装可能である。例として、音声復号器８０８は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、プログラマブル論理、専用ハードウェア、または任意のその他のハードウェアベースおよび／もしくはソフトウェアベースの処理エンティティを用いて実装可能である。音声復号器８０８は、以下でその機能性の点から説明される。音声復号器８０８が実装される様式は、その特定の用途と、システム全体に課された設計制約とに依存する。
【００４３】
デジッタバッファ８０２は、ネットワーク輻輳、タイミングドリフト、およびルート変更に起因するパケット到着時間の変動によって引き起こされるジッタを除去するハードウェアデバイスまたはソフトウェアプロセスであってよい。デジッタバッファ８０２は、音声パケット内でスピーチフレーム８４２を受信することが可能である。加えて、デジッタバッファ８０２は、先に到着したパケットが正しい順序でスピーチ生成器８３２に継続的に提供され、その結果、音声ひずみをほとんど伴わずにクリアな接続をもたらすことができるように、新しく到着したパケットを遅延させることが可能である。デジッタバッファ８０２は、固定されてよく、または適応型であってもよい。固定デジッタバッファは、パケットに固定遅延をもたらすことができる。他方で、適応型デジッタバッファは、ネットワークの遅延内の変化に適応できる。デジッタバッファ８０２は、復号器８０８にスピーチフレームを提供することが可能である。
【００４４】
フレームの主要コピーがデジッタバッファによって受信されない場合、フレームロスは、ＦＥＣが使用されないかどうかによって生じる。ＦＥＣが使用され、現在のフレームとして振る舞うべきフレームの主要コピーが失われた場合、デジッタバッファは、バッファにフレームの冗長コピーがあるかどうかチェックし得る。現在のフレームのための冗長コピーがある場合、冗長コピーは、スピーチサンプルを生成するために復号され得る。冗長コピーは、完全フレームまたは部分フレームであり得る。
【００４５】
さらに、デジッタバッファ８０２は、主要フレーム（つまり、オリジナルのクリティカルフレーム）および冗長フレーム（つまり、オリジナルのクリティカルフレームのある部分またはすべてのコピー）を異なって処理するために修正され得る。ＦＥＣモジュール２２０の機能が実施されない場合にＦＥＣモジュール２２０の機能の実施に関連した平均遅延時間が平均遅延時間と比べわずかでも大きくならないように、バッファ８０２は、これらの２つのフレームを異なって処理し得る。主要コピーのパラメータのうちのいくつか（つまり、一部）を含むフレームの冗長コピーは、デジッタバッファ８０２から部分フレーム復号モジュール８５０に渡され得る。
【００４６】
先に述べたように、巡回冗長検査（ＣＲＣ）機能、インタリーブ、デジタル変調、スペクトル拡散処理を含めて、畳み込み符号化など、様々な信号処理機能を送信端末１０２によって実行することが可能である。
【００４７】
デジッタバッファ８０２から解放されたスピーチフレーム８４２は、合成スピーチ８４４を生成するために、スピーチ生成器８３２に提供され得る。スピーチ生成器８３２は、合成スピーチ２４４を生成するためのいくつかの機能を含み得る。当業者に既知の合成スピーチにスピーチを復号する任意の方法が使用され得る。示された実施形態において、スピーチ生成器は、ＣＥＬＰ復号化方法を使用し得る。ここで、逆コードブック８１２は、固定コードブックパラメータ８３８を使用し得る。例えば、固定コードブックインデックスを残差スピーチに変換して、固定コードブック利得をその残差スピーチに適用するために、逆コードブック８１２を使用できる。ピッチ情報を残差スピーチに追加し戻す８１８ことが可能である。ピッチ情報は、「遅延」からピッチ復号器２１４によって計算できる。ピッチ復号器２１４は、スピーチサンプルの先のフレームを作成した情報のメモリであり得る。適応コードブック利得など、適応コードブックパラメータ８３６は、残差スピーチに追加される（８１８）前に、ピッチ復号器８１４によってそれぞれのサブフレーム内のメモリ情報に適用され得る。残差スピーチは、フォルマントをスピーチに追加するために、逆変換２２２からのＬＰＣ係数など、線スペクトル対２３４を使用して、フィルタ２２０を通じて実行可能である。未処理の合成スピーチは、次いで、フィルタ８２０からポストフィルタ８２４に提供可能である。ポストフィルタ２２４は、スピーチを平滑化して、帯域外成分を削減することができる音声帯域内のデジタルフィルタであり得る。代替として、そして限定ではなく、スピーチ生成器は、ＮＥＬＰまたはＰＰＰ完全フレーム復号化方法を使用し得る。
【００４８】
図９は、ＶｏＩＰのために前方誤り訂正（ＦＥＣ）の方法９００の１つの例を例示するフローチャートである。方法９００は、送信端末１０２によって実装され得る。送信端末１０２および受信端末１０４との間のＶｏＩＰ通話のセットアップ中に、適切なＦＥＣモード（例えば完全保護モードまたは部分保護モード）が、選択され得る９０２。モードは、物理送信チャンネルと送信端末１０２および受信端末１０４のサポートとに基づいて選択され得る。目標データレートがさらに決定され得る。１つの例において、目標データレートは、容量要求に従って決定され得る９０４。ＦＥＣオフセット値がさらに決定され得る。１つの例において、ＦＥＣオフセット値は、所定の値である。別の例において、ＦＥＣオフセット値は、チャネル状態に基づいて適切に調整されることができる。
【００４９】
符号化されるべきスピーチフレーム、フレームＮが選択され得る９０６。その後、Ｋ番目（Ｋ≦Ｎ）のスピーチフレームは、分析され９０６、判断は、Ｋ番目のスピーチフレームがクリティカルフレームかどうかに応じて行われ得る９０８。どのフレームを分析すべきであるか選択することは、ＦＥＣオフセットによって決まる。例えば、ＦＥＣオフセットが２である場合、Ｎ−２のフレームが分析され得る。１つの構成において、ＶｏＩＰ通話の間、符号化フレームすべてのために、送信端末１０２内の符号器１０６は、Ｋ番目のスピーチフレームが保護されるべきかどうか（つまり、Ｋ番目のスピーチフレームがクリティカルフレームかどうか）決定し得る。符号器１０６は、さらにＫ番目のスピーチフレームが、目標データレート、決定の結果、および選択されたＦＥＣモードに基づいてどのように保護されるべきか判断し得る。１つの構成において、目標データレートおよびＦＥＣオフセット値は、受信端末１０４からフィードバックされたチャネル状態情報１２０に基づいてランタイム中に調整され得る。
【００５０】
Ｋ番目のスピーチフレームがクリティカルフレームでない場合、符号化スピーチフレームＮのみが受信端末に送信される９１４。Ｋ番目のスピーチフレームがクリティカルフレームであると決定された場合９０８、Ｋ番目のスピーチフレームの冗長コピーが生成され得る９１０。Ｋ番目のスピーチフレームの冗長コピーの生成は、選択されたＦＥＣモードに基づき得る。例えば、冗長コピーは、選択されたＦＥＣモードが完全保護モードまたは部分保護モードかどうかに依存するクリティカルＫ番目のスピーチフレームに含まれたパラメータのうちのいくつかまたはすべてにより生成され得る。代替として、冗長コピーは、主要コピーのためのコーディング方法より低いレートを有する、別のコーディングスキームを使用して、生成され得る。
【００５１】
１つの構成において、主要コピー（つまり、現在のスピーチフレームＮ）およびクリティカルＫ番目のスピーチフレームの冗長コピーは、リアルタイムプロトコル（ＲＴＰ）パケットにパケット化され、受信端末１０４へ送信される９１２および９１４。別の構成において、フレームの主要コピーおよびＫ番目のスピーチフレームの冗長コピーは、同時に生成されるが、２つの異なるＲＴＰパケットに個別にパケット化され、受信端末へ送信され得る。いずれのフォーマットを使用するかの決定は、両端末の能力に基づき得る。両方のフォーマットが各端末にサポートされる場合、より低いデータレートを生じるフォーマットが使用される。受信機側では、スピーチフレームは、適応可能なデジッタバッファ８０２に格納され得る。先で述べたように、スピーチフレームのための平均遅延時間がＦＥＣ技術のない平均遅延時間と比べわずかでも大きくならないように、デジッタバッファ８０２が設計され得る。フレームは、デジッタバッファ８０２から適切な順序で復号器１０８に送られ得る。スピーチフレームが主要コピーのパラメータのうちのいくつかを有する冗長コピーである場合、部分フレーム復号化モジュール８５０が使用される。
【００５２】
ソースおよびチャネルは、以上で説明されたＦＥＣスキームを制御した、データレートの適度な増加を単に引き起こす一方でパケットロスの数およびロスのバースティネス（burstiness）を減らしてもよい。クリティカルフレーム識別モードおよび部分フレーム保護モードは、スピーチ知覚品質とデータレートとの間のよいトレードオフを保証し得る。デジッタバッファへの修正は、追加の末端間遅延を導入しないことができる。動的レート制御モジュール３１２は、オペレーターが容量要求に基づいてデータレートを判断するように、以上で説明したＦＥＣスキームが任意の指定されたデータレートで実行されるように許容され得る。最後に、ＦＥＣモード選択アルゴリズム３０８によって実行されたＦＥＣモード選択は、部分フレーム保護モードがハンドセット（例えば、送信端末１０２および受信端末１０４）の物理チャネルプロパティおよび能力に基づいて使用されるかどうか決定し得る。以上で説明されたＦＥＣスキームは、利用可能な帯域幅を浪費せず、レガシ通信デバイスと下位互換性がある。
【００５３】
ＦＥＣ機能性を持った端末が（完全フレームのみ復号化することができる）レガシ端末と通信する場合、部分フレーム保護は、無効になるので、レガシハンドセットは、ＦＥＣ冗長性からの恩恵を受け得る。部分フレームがレガシ端末へ送られる場合、レガシ端末は、部分フレームのフォーマットが理解されないので部分フレームを無視する結果、潜在的に利用可能な帯域幅の浪費を引き起こすことになる。
【００５４】
上で説明された図９の方法は、図１０に例示されるミーンズプラスファンクションブロックに対応する、様々な（１つもしくは複数の）ハードウェアコンポーネントおよび／または（１つもしくは複数の）ソフトウェアコンポーネント、ならびに／あるいは（１つもしくは複数の）ハードウェアモジュールおよび／または（１つもしくは複数の）ソフトウェアモジュールによって実行可能である。すなわち、図９に例示されるブロック９０２から９１４は、図１０に例示されるミーンズプラスファンクションブロック１００２から１０１４に対応する。
【００５５】
図１１は、無線デバイス１１０２内で利用可能な様々なコンポーネントを例示する。無線デバイス１１０２は、本明細書で説明される様々な方法を実施するように構成されたデバイスの一例である。無線デバイス１１０２は、遠隔局、アクセス端末、ハンドセット、携帯情報端末（ＰＤＡ）、携帯電話などであり得る。
【００５６】
無線デバイス１１０２は、無線デバイス１１０２の動作を制御するプロセッサ１１０４を含み得る。プロセッサ１１０４は、中央処理装置（ＣＰＵ）と呼ばれる場合もある。読出し専用メモリ（ＲＯＭ）とランダムアクセスメモリ（ＲＡＭ）の両方を含み得るメモリ１１０６は、命令とデータとをプロセッサ１１０４に提供する。メモリ１１０６の一部は、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）を含むことも可能である。プロセッサ１１０４は、通常、メモリ１１０６内に格納されたプログラム命令に基づいて、論理演算と算術演算とを実行する。メモリ１１０６内の命令は、本明細書で説明される方法を実施するために実行可能であり得る。
【００５７】
無線デバイス１１０２は、無線デバイス１１０２と遠隔位置との間のデータの送受信を可能にするために、送信機１１１０と受信機１１１２とを含み得るハウジング１１０８を含むことも可能である。送信機１１１０と受信機１１１２とを組み合わせてトランシーバ１１１４にすることができる。アンテナ１１１６は、ハウジング１１０８に取り付け可能であり、トランシーバ１１１４に電気的に結合可能である。無線デバイス１１０２は、（図示されないが）複数の送信機、複数の受信機、複数のトランシーバ、および／または複数のアンテナを含むことも可能である。
【００５８】
無線デバイス１１０２は、トランシーバ１１１４によって受信された信号のレベルを検出して、定量化するために使用可能な信号検出器１１１８を含むことも可能である。信号検出器１１１８は、全エネルギ、擬似雑音（ＰＮ）当たりのパイロットエネルギーチップ（pilot energy per pseudonoise（PN）chips）、電力スペクトル密度（power spectral density）、およびその他の信号などの信号を検出することが可能である。無線デバイス１１０２は、信号を処理する際に使用するためのデジタル信号プロセッサ（ＤＳＰ）１１２０を含むことも可能である。
【００５９】
ワイヤレスデバイス１１０２の様々なコンポーネントは、データバスに加えて、電力バスと、制御信号バスと、状態信号バスとを含み得るバスシステム１１２２によって一緒に結合され得る。しかしながら、分かりやすくするために、様々なバスは、図１１においてバスシステム１１２２として例示される。
【００６０】
図１２は、開示されたシステムおよび方法の１つの例に従う基地局１２０８のブロック図である。基地局１２０８の異なる実装の例は、発展ノードＢ（ｅＮＢ）、基地局制御器、基地局トランシーバ、アクセスルータなどを含むがこれらに限定されない。基地局１２０８は、送信機１２１０および受信機１２１２を含むトランシーバ１２２０を含む。トランシーバ１２２０は、アンテナ１２１８に接続し得る。基地局１２０８は、デジタル信号プロセッサ（ＤＳＰ）１２１４、汎用プロセッサ１２０２、メモリ１２０４、および通信インタフェース１２０６をさらに含む。基地局１２０８の様々なコンポーネントは、ハウジング１２２２内に含まれ得る。
【００６１】
プロセッサ１２０２は、基地局１２０８の動作を制御し得る。プロセッサ１２０２は、さらにＣＰＵと称され得る。読み出し専用メモリ（ＲＯＭ）およびランダムアクセスメモリ（ＲＡＭ）の両方を含み得る、メモリ１２０４は、プロセッサ１２０２に命令およびデータを提供する。メモリ１２０４の一部は、さらに不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）を含むことができる。メモリ１２０４は、格納する電子情報に有能な任意の電子部品も含み、ＲＯＭ、ＲＡＭ、磁気ディスク記憶媒体、光学的記憶媒体、フラッシュメモリ、プロセッサ１２０２に含まれるオンボードメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、リムーバブルディスク、ＣＤ−ＲＯＭなどとして具体化され得る。メモリ１２０４は、プログラム命令および他のタイプのデータを格納し得る。本明細書に開示された方法のうちのいくつかまたはすべてを実施するために、プログラム命令は、プロセッサ１２０２によって実行され得る。
【００６２】
開示されたシステムおよび方法に従うアンテナ１２１８は、近くの通信デバイス１１０２から送信されたリバースリンク信号を受信し得る。アンテナ１２１８は、信号をフィルタに掛けて増幅するトランシーバ１２２０にこれらの受信信号を提供する。信号は、復調、復号、さらにフィルタに掛けるなどのためにトランシーバ１２２０からＤＳＰ１２１４、および汎用プロセッサ１２０２に提供される。
【００６３】
基地局１２０８の様々なコンポーネントは、データバスに加えて電力バス、制御信号バス、およびステータス信号バスを含むバスシステム１２２６によって連結される。しかしながら、明瞭さのために、様々なバスは、バスシステム１２２６として図１２に説明される。
【００６４】
本明細書で使用される場合、用語「決定すること」は幅広い様々な動作を包含しており、したがって、「決定すること」は、計算すること、演算すること、処理すること、導出すること、調査すること、調べること（例えば、表、データベース、または別のデータ構造の中を調べること）、確認することなどを含み得る。また、「決定すること」は、受信すること（例えば、情報を受信すること）、アクセスすること（例えば、メモリ中のデータにアクセスすること）などを含み得る。また、「決定すること」は、解決すること、選択すること、選ぶこと、確立することなどを含み得る。
【００６５】
「基づいて」という句は、特に具体的にその他の指定がない限り、「だけに基づいて」を意味しない。すなわち、「基づいて」という句は、「だけに基づいて」と「に少なくとも基づいて」の両方を表す。
【００６６】
本開示に関して説明された様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ信号（ＦＰＧＡ）もしくはその他のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタロジック、ディスクリートハードウェアコンポーネント、または本明細書で説明された機能を実行するように設計されたそれらの任意の組合せを用いて実施あるいは実行されることが可能である。汎用プロセッサはマイクロプロセッサであってよいが、代替では、プロセッサは任意の市販のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であってもよい。プロセッサはまた、コンピューティングデバイスの組合せ、例えば、ＤＳＰとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと共に１つもしくは複数のマイクロプロセッサ、または任意のその他のそのような構成として実施されることも可能である。
【００６７】
本開示に関して説明される方法またはアルゴリズムのステップは、ハードウェアの形で直接的に、プロセッサによって実行されるソフトウェアモジュールの形で、またはそれら２つの組合せの形で具体化されることが可能である。ソフトウェアモジュールは、技術分野において知られている任意の形態の記憶媒体の中に常駐することが可能である。使用され得る記憶媒体のいくつかの例は、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、着脱可能ディスク、ＣＤ−ＲＯＭなどを含む。ソフトウェアモジュールは、単一の命令、または多くの命令を備えてよく、いくつかの異なるコード区分上、異なるプログラム間、および複数の記憶媒体の全域で分散されてもよい。記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことが可能であるようにプロセッサに結合される。代替では、記憶媒体は、プロセッサと一体であってもよい。
【００６８】
本明細書で開示された方法は、説明された方法を達成するための１つもしくは複数のステップまたは動作を備える。これらの方法ステップおよび／または方法動作は、請求項の範囲から逸脱することなく互いに交換可能である。すなわち、ステップまたは動作の特定の順序が指定されていない限り、特定のステップおよび／もしくは動作の順序ならびに／または使用は、請求項の範囲から逸脱せずに修正可能である。
【００６９】
説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せの形で実装可能である。ソフトウェアの形で実装される場合、これらの機能は、コンピュータ可読媒体上の１つもしくは複数の命令として格納可能である。コンピュータ可読媒体は、コンピュータによってアクセス可能な任意の利用可能な媒体であってよい。限定ではなく、例として、コンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭもしくはその他の光ディスク記憶装置、磁気ディスク記憶装置もしくはその他の磁気記憶デバイス、あるいは所望されるプログラムコードを命令もしくはデータ構造の形で搬送または格納するために使用可能であり、コンピュータによってアクセス可能な任意のその他の媒体を備えることが可能である。本明細書で使用される場合、ディスク（Ｄｉｓｋ）およびディスク（ｄｉｓｃ）は、コンパクトディスク（ＣＤ）と、レーザディスクと、光ディスクと、デジタル多用途ディスク（ＤＶＤ）と、フロッピー（登録商標）ディスクと、Ｂｌｕ−ｒａｙ（登録商標）ディスクとを含み、この場合、ディスク（ｄｉｓｋｓ）は、通常、データを磁気的に再生し、一方、ディスク（ｄｉｓｃｓ）は、レーザを用いて、データを光学的に再生する。
【００７０】
ソフトウェアまたは命令は、伝送媒体上で送信されることも可能である。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、より対線、デジタル加入者線（ＤＳＬ）、もしくは赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、またはその他の遠隔ソースから送信される場合、その同軸ケーブル、光ファイバケーブル、より対線、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、伝送媒体の定義の中に含まれる。
【００７１】
さらに、図９〜１０によって例示された方法および技法など、本明細書で説明された方法および技法を実行するためのモジュールならびに／またはその他の適切な手段は、適用可能な場合、モバイルデバイスおよび／もしくは基地局によってダウンロード可能でありかつ／または取得可能である点を理解されたい。例えば、かかるデバイスは、本明細書で説明された方法を実行するための手段の転送を円滑にするためにサーバに結合できる。あるいは、本明細書で説明された様々な方法は、デバイスに記憶手段を結合または提供するとすぐに、モバイルデバイスおよび／または基地局が様々な方法を取得できるように、記憶手段（例えば、ランダムアクセスメモリ（ＲＡＭ）、読出し専用メモリ（ＲＯＭ）、コンパクトディスク（ＣＤ）またはフロッピーディスクなどの物理的記憶媒体など）を経由して提供可能である。さらに、本明細書で説明された方法および技法をデバイスに提供するための任意のその他の適切な技法を利用することも可能である。
【００７２】
特許請求の範囲は、上で例示されたまさにその構成およびコンポーネントに限定されない点を理解されたい。請求項の範囲から逸脱せずに、本明細書で説明されたシステム、方法、および装置の構成、動作、および詳細に様々な修正、変更、ならびに改変を行うことが可能である。

【特許請求の範囲】
【請求項１】
スピーチ信号内の情報のロスを防ぐための方法であって、
符号化されるべき第１のフレームを選択することと、
第２のスピーチフレームおよび１つまたは複数の近接スピーチフレーム内の前記情報に基づいて前記第２のスピーチフレームがクリティカルスピーチフレームかどうか判断することと、
前記第２のスピーチフレームがクリティカルスピーチフレームである場合、前記第２のスピーチフレームの符号化バージョンの少なくとも一部を生成することと、
前記第１のスピーチフレームおよび前記第２のスピーチフレームの前記符号化バージョンの少なくとも一部を送信することと
を備える、方法
【請求項２】
目標データレートを決定することと、
前記決定された目標データレートに従って前方誤り訂正（ＦＥＣ）モードを選択することと
をさらに備える、請求項１に記載の方法。
【請求項３】
前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第２のスピーチフレームと同一である、
請求項１に記載の方法。
【請求項４】
前記前方誤り訂正（ＦＥＣ）モードは、完全保護モードを備える、
請求項２に記載の方法。
【請求項５】
前記前方誤り訂正（ＦＥＣ）モードは、１つまたは複数の部分保護モードを備える、
請求項２に記載の方法。
【請求項６】
前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第２のスピーチフレーム内の前記情報のサブセットを含む
請求項１に記載の方法。
【請求項７】
前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第２のスピーチフレームを符号化するために使用されるより低いビットレート符号化タイプを使用して構成される、
請求項６に記載の方法。
【請求項８】
前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部が送信されたときを示すオフセット値を決定することをさらに備える、
請求項１に記載の方法。
【請求項９】
前記第２のスピーチフレームがクリティカルフレームかどうか判断することは、前記第２のスピーチフレームおよび１つまたは複数の近接スピーチフレームのプロパティを分析することをさらに備える、
請求項１に記載の方法。
【請求項１０】
前記第２のスピーチフレームがクリティカルスピーチフレームかどうか判断することは、前記第２のスピーチフレームを符号化するために使用されたスピーチモードにさらに基づく、
請求項１に記載の方法。
【請求項１１】
前記スピーチフレームの前記スピーチモードは、有声、無声、安定した音声、または声の出だしである、
請求項１０に記載の方法。
【請求項１２】
前記第２のスピーチフレームがクリティカルスピーチフレームかどうか判断することは、前記第２のスピーチフレームを符号化するために使用されたスピーチ符号化タイプに基づく、
請求項１に記載の方法。
【請求項１３】
前記スピーチ符号化タイプは、コード励起線形予測（ＣＥＬＰ）、ノイズ励起線形予測（ＮＥＬＰ）、またはプロトタイプピッチ周期（ＰＰＰ）を備える、
請求項１２に記載の方法。
【請求項１４】
完全保護モードが選択された場合に前記部分保護モードを無効にすることをさらに備える、
請求項５に記載の方法。
【請求項１５】
前記第１のスピーチフレームおよび前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するために使用されたチャネルのチャネル状態情報に基づいて前記目標データレートを調整することをさらに備える、
請求項２に記載の方法。
【請求項１６】
前記第２のスピーチフレームの送信時間と前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部の送信時間との間の測定されたオフセットが存在する、
請求項１に記載の方法。
【請求項１７】
前記オフセットは、スピーチフレームを送信するために使用されたチャネルのチャネル状態情報を使用して推定され、前記オフセットは、動的に調節される、
請求項１６に記載の方法。
【請求項１８】
目標データレートを前記決定することは、容量要求に基づく、
請求項２に記載の方法。
【請求項１９】
目標データレートを前記決定することは、チャネル状態情報のフィードバックに基づく、
請求項２に記載の方法。
【請求項２０】
前方誤り訂正（ＦＥＣ）モードを前記選択することは、
前記第２のスピーチフレームのクリティカルネスレベルを決定することと、
前記目標データレートより高い第１の操作のデータレートを決定することと、
前記目標データレートより低い第２の操作のデータレートの決定することと、
前記目標データレートに合わせるようにＦＥＣモードを選択することと
を備える、請求項２に記載の方法。
【請求項２１】
前記前方誤り訂正（ＦＥＣ）モードは、前記モードを実施しているスピーチフレームのデータレートの前記平均値が前記目標データレートに近づくようにランダムに選択される、
請求項２に記載の方法。
【請求項２２】
前記前方誤り訂正（ＦＥＣ）モードは、前記モードを実施している前記スピーチフレームの前記データレートが前記目標データレートに近づくように選択される、
請求項２に記載の方法。
【請求項２３】
前記第２のスピーチフレームがクリティカルかどうか判断することは、前記第２のスピーチフレームと１つまたは複数の近接したスピーチフレームとの間の差を計算することを備え、前記差が所定の閾値より大きい場合、前記第２のスピーチフレームはクリティカルである、
請求項１に記載の方法。
【請求項２４】
前記第２のスピーチフレームがクリティカルかどうか判断することは、前記第２のスピーチフレームの前記スピーチモードに基づく、
請求項１０に記載の方法。
【請求項２５】
クリティカルスピーチフレームのクリティカルネスは、前記クリティカル第２のスピーチフレームおよび近接スピーチフレームのパラメータ、特性、コーディングタイプおよびモードに基づいて判断される、
請求項１に記載の方法。
【請求項２６】
１つまたは複数のリアルタイムプロトコル（ＲＴＰ）パケットに、前記第１のスピーチフレームおよび前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部をパッキングすることをさらに備える、
請求項１に記載の方法。
【請求項２７】
前記１つまたは複数のＲＴＰパケットのフォーマットは、送信端末および受信端末の能力に基づく、
請求項２６に記載の方法。
【請求項２８】
前記部分保護モードの選択は、利用可能な帯域幅、目標データレート、前記第１のスピーチフレームの特性、前記第２のスピーチフレームの特性、および前記近接スピーチフレームの特性に基づく、
請求項５に記載の方法。
【請求項２９】
スピーチフレーム内の情報のロスを防ぐための無線デバイスであって、
第２のスピーチフレームがクリティカルスピーチフレームかどうか判断するために前記第２のスピーチフレームおよび１つまたは複数の隣接したスピーチフレーム内の前記情報を使用するように構成されたクリティカルフレーム識別モジュールと、
前記第２のスピーチフレームがクリティカルスピーチフレームである場合に、選択された前方誤り訂正モードに従う前記第２のスピーチフレームの符号化バージョンの少なくとも一部を生成するように構成された前方誤り訂正（ＦＥＣ）モジュールと、
前記第１のスピーチフレームおよび前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するように構成された送信機と
を備える無線デバイス。
【請求項３０】
目標データレートと、
前記目標データレートに従って前記前方誤り訂正モードを選択するように構成されたレート制御モジュールと
をさらに備える、請求項２９に記載の無線デバイス。
【請求項３１】
前記前方誤り訂正（ＦＥＣ）モジュールは、前記選択された前方誤り訂正モードに従う前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部を生成するように構成される、
請求項３０に記載の無線デバイス。
【請求項３２】
前記前方誤り訂正（ＦＥＣ）モードは、完全保護モードを備える、
請求項３０に記載の無線デバイス。
【請求項３３】
前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第２のスピーチフレームと同一である、
請求項２９に記載の無線デバイス。
【請求項３４】
前方誤り訂正（ＦＥＣ）モードは、１つまたは複数の部分保護モードを備える、
請求項３０に記載の無線デバイス。
【請求項３５】
前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第２のスピーチフレーム内の前記情報のサブセットを含む、
請求項２９に記載の無線デバイス。
【請求項３６】
前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第２のスピーチフレームを符号化するために使用されるより低いビットレート符号化タイプを使用して構成される、
請求項２９に記載の無線デバイス。
【請求項３７】
前記無線デバイスは、ハンドセットである、
請求項２９に記載の無線デバイス。
【請求項３８】
前記無線デバイスは、基地局である、
請求項２９に記載の無線デバイス。
【請求項３９】
前記第２のスピーチフレームの送信時間と前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部の送信時間との間の測定されたオフセットが存在する、
請求項２９に記載の無線デバイス。
【請求項４０】
前記オフセットは、スピーチフレームを送信するために使用されたチャネルのチャネル状態情報を使用して推定され、前記オフセットは、動的に調節される、
請求項３９の無線デバイス、
【請求項４１】
目標データレートを前記決定することは、容量要求に基づく、
請求項３０に記載の無線デバイス。
【請求項４２】
前記目標データレートを決定することは、チャネル状態情報のフィードバックに基づく、
請求項３０に記載の無線デバイス。
【請求項４３】
前記レート制御モジュールは、
前記第２のスピーチフレームのクリティカルネスレベルを決定し、
前記目標データレートより高い第１の操作のデータレートを決定し、
前記目標データレートより低い第２の操作のデータレートの決定し、
前記目標データレートに合わせるようにＦＥＣモードを選択する
ようにさらに構成される、請求項３０に記載の無線デバイス。
【請求項４４】
前記前方誤り訂正（ＦＥＣ）モードは、前記モードを実施しているスピーチフレームのデータレートの前記平均値が前記目標データレートに近づくようにランダムに選択される、
請求項３０に記載の無線デバイス。
【請求項４５】
前記前方誤り訂正（ＦＥＣ）モードは、前記モードを実施している前記スピーチフレームの前記データレートが前記目標データレートに近づくように選択される、
請求項３０に記載の無線デバイス。
【請求項４６】
前記第２のスピーチフレームがクリティカルかどうか判断することは、前記第２のスピーチフレームと１つまたは複数の近接したスピーチフレームとの間の差を計算することを備え、前記差が所定の閾値より大きい場合、前記第２のスピーチフレームはクリティカルである、
請求項２９に記載の無線デバイス。
【請求項４７】
前記第２のスピーチフレームがクリティカルかどうか判断することは、前記第２のスピーチフレームの前記スピーチフレームに基づく、
請求項２９に記載の無線デバイス。
【請求項４８】
前記スピーチフレームの前記スピーチモードは、有声、無声、安定した音声、または声の出だしである、
請求項４７に記載の無線デバイス。
【請求項４９】
クリティカルスピーチフレームのクリティカルネスは、前記クリティカル第２のスピーチフレームおよび近接スピーチフレームのパラメータ、特性、コーディングタイプおよびモードに基づいて判断される、
請求項２９に記載の無線デバイス。
【請求項５０】
１つまたは複数のリアルタイムプロトコル（ＲＴＰ）パケットに、前記第１のスピーチフレームおよび前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部をパッキングすることをさらに備える、
請求項２９に記載の無線デバイス。
【請求項５１】
前記１つまたは複数のＲＴＰパケットの前記フォーマットは、送信端末および受信端末の能力に基づく、
請求項５０に記載の無線デバイス。
【請求項５２】
前記部分保護モードの選択は、利用可能な帯域幅、目標データレート、前記第１のスピーチフレームの特性、前記第２のスピーチフレームの特性、および前記近接スピーチフレームの特性に基づく、
請求項３４に記載の無線デバイス。
【請求項５３】
スピーチフレームおよび前記スピーチフレームと異なるある部分またはすべてのコピーを処理するように修正されるデジッタバッファをさらに備える、
請求項２９に記載の無線デバイス。
【請求項５４】
スピーチ信号内の前記情報のロスを防ぐための装置であって、
符号化されるべき第１のスピーチフレームを選択するための手段と、
第２のスピーチフレームおよび１つまたは複数の近接スピーチフレーム内の前記情報に基づいて前記第２のスピーチフレームがクリティカルスピーチフレームかどうか判断するための手段と、
前記第２のスピーチフレームがクリティカルスピーチフレームである場合、前記第２のスピーチフレームの符号化バージョンの少なくとも一部を生成するための手段と、
前記第１のスピーチフレームおよび前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するための手段と
を備える装置。
【請求項５５】
スピーチ信号内の情報のロスを防ぐためのコンピュータプログラムプロダクトであって、前記コンピュータプロダクトは、その上に命令を有するコンピュータ可読媒体を備え、
前記命令は、
符号化されるべき第１のフレームを選択するためのコードと、
第２のスピーチフレームおよび１つまたは複数の近接スピーチフレーム内の前記情報に基づいて前記第２のスピーチフレームがクリティカルスピーチフレームかどうか判断するためのコードと、
前記第２のスピーチフレームがクリティカルスピーチフレームである場合、第２のスピーチフレームの符号化バージョンの少なくとも一部を生成するためのコードと、
前記第１のスピーチフレームおよび前記第２のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するためのコードと
を備える、コンピュータプログラムプロダクト。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図１２】

【公表番号】特表２０１２−５２９２４３（Ｐ２０１２−５２９２４３Ａ）
【公表日】平成２４年１１月１５日（２０１２．１１．１５）
【国際特許分類】

電気 (1,674,590)
- 電気通信技術 (544,871)

【出願番号】特願２０１２−５１４１４５（Ｐ２０１２−５１４１４５）
【出願日】平成２２年６月３日（２０１０．６．３）
【国際出願番号】ＰＣＴ／ＵＳ２０１０／０３７３１０
【国際公開番号】ＷＯ２０１０／１４１７６２
【国際公開日】平成２２年１２月９日（２０１０．１２．９）
【出願人】（５９５０２０６４３）クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】ＱＵＡＬＣＯＭＭ　ＩＮＣＯＲＰＯＲＡＴＥＤ
【Ｆターム（参考）】

[ Back to top ]

スピーチフレーム内の情報のロスを防ぐためのシステムおよび方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

スピーチフレーム内の情報のロスを防ぐためのシステムおよび方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク