説明

スピーチフレーム内の情報のロスを防ぐためのシステムおよび方法

スピーチフレーム内の情報のロスを防ぐ方法が説明される。
符号化されるべき第1のスピーチフレームが選択される。
第2のスピーチフレームおよび1つまたは複数の近接スピーチフレーム内の情報に基づいて第2のスピーチフレームがクリティカルかどうかについての判断が行われる。
第2のスピーチフレームがクリティカルスピーチフレームである場合、第2のスピーチフレームの符号化バージョンの少なくとも一部は、選択された前方誤り訂正(FEC)モードに従って生成される。
第1のスピーチフレームおよび第2のスピーチフレームの符号化バージョンの少なくとも一部が送信される。

【発明の詳細な説明】
【技術分野】
【0001】
本システムおよび方法は、通信および無線関連技術に関する。詳細には、本システムおよび方法は、スピーチフレーム内の情報ロスを防ぐためのシステムおよび方法に関する。
【背景技術】
【0002】
デジタル音声通信は、回線交換ネットワークを介して実行されている。回線交換ネットワークは、呼の期間の間、2つの端末間で物理的パスが確立されるネットワークである。回線交換アプリケーションでは、送信端末は、物理的パスを介して、音声情報を含むパケットのシーケンスを受信端末に送る。受信端末は、スピーチを合成するために、パケット内に含まれた音声情報を使用する。
【0003】
デジタル音声通信は、パケット交換ネットワークを介して実行され始めた。パケット交換ネットワークは、パケットが宛先アドレスに基づいて、その中でそのネットワークの一定のルートで送られるネットワークである。パケット交換通信の場合、ルータは、それぞれのパケットに関するパスを個々に判断して、それをその宛先に至るまで任意の利用可能なパスに送る。結果として、パケットは、同時にまたは同じ順序で受信端末に到着しない。パケットを順序よく戻し、それらのパケットを連続的な順序で再生するために、デジッタバッファを受信端末内で使用できる。
【0004】
場合によっては、パケットは、送信端末から受信端末への伝送途中に失われる。失われたパケットは、合成スピーチの品質を劣化させる可能性がある。したがって、スピーチフレーム内の情報ロスを防ぐためのシステムおよび方法を提供することによって、利益を実現することが可能である。
【図面の簡単な説明】
【0005】
【図1】伝送媒体を介した送信端末および受信端末の一例を示すブロック図。
【図2】送信端末のさらなる構成を例示するブロック図。
【図3】前方誤り訂正(FEC)モジュールの1つの構成を例示するブロック図。
【図4】クリティカルフレーム識別モジュールの1つの構成を例示するブロック図。
【図5】FECモード選択アルゴリズムの1つの例を例示するブロック図。
【図6】チャネル状態フィードバックモジュールの1つの構成を例示するブロック図。
【図7】動的レート制御モジュールの1つの例を例示するブロック図。
【図8】受信端末の1つの構成を例示するブロック図。
【図9】ボイスオーバインターネットプロトコル(VoIP)のために前方誤り訂正(FEC)の方法の1つの例を例示するフローチャート。
【図10】図9に示される方法に対応するミーンズプラスファンクションブロックを例示する。
【図11】無線通信デバイスで利用される様々なコンポーネントを例示する。
【図12】開示されたシステムおよび方法の1つの例に従う基地局のブロック図。
【発明を実施するための形態】
【0006】
音声アプリケーションは、パケット交換ネットワーク内で実装可能である。音声アプリケーションは、ボイスオーバインターネットプロトコル(VoIP)ネットワークで実装可能である。音声情報を伴うパケットは、ネットワーク上で第1のデバイスから第2のデバイスに送信可能である。しかしながら、パケットのうちのいくつかは、パケットの伝送の間に失われる可能性がある。例えば、(バースト的なパケットロスと呼ばれることがある)複数のパケットのロスは、受信デバイスにおいて認知されたスピーチ品質の劣化の原因であり得る。1つの構成において、パケットは、1つまたは複数のフレームを含み得る。
【0007】
VoIPネットワークにおけるパケットロスに起因する認知されたスピーチ品質の劣化を軽減するために、2つのタイプの解が存在する。第1の解は、受信機ベースのパケットロス補償(PLC:packet loss concealment)方法であり得る。PLC方法は、VoIP通信におけるパケットロスの影響をマスクする技術であり得る。例えば、PLC方法は、送信の間に失われたものの代わりに代替パケットを生成するように実装され得る。PLC方法は、失われたものにできるだけ類似したパケットを生成することを試み得る。受信機ベースのPLC方法は、代替パケットを生成するために送信機からの追加リソースまたは助けを必要とし得ない。しかしながら、重要なスピーチフレームが失われる場合、PLC方法は、効果的にパケットロスの影響をマスクし得ない。
【0008】
第2の解は、送信機ベースの弾力的なスキームであり得る。そのようなスキームの一例は、前方誤り訂正(FEC)方法であり得る。FEC方法は、各パケットのある追加データを送ることを含み得る。追加データは、送信の間にデータのロスによって生じた誤りを回復するために使用され得る。例えば、FECスキームは、冗長スピーチフレームを送信し得る。言いかえれば、スピーチフレームの1つより多いコピー(典型的に2つ)は、送信機によって送信される。これらの2つのフレームは、主要コピーおよび冗長コピーと称され得る。
【0009】
送信機ベースのパケットロス弾力的スキームが復号化スピーチの知覚品質を改善するが、これらのスキームは、さらにスピーチの送信の間に使用される帯域幅を増大させ得る。従来のFECスキームは、さらにリアルタイムの会話に耐えられないエンドツーエンド遅延を増大させ得る。例えば、従来の送信機ベースのスキームは、2つの異なる期間で同じスピーチフレームを2度送る。これは、データレートを少なくとも2倍にし得る。いくつかの従来のスキームは、データレートを低減するために低ビットレートコーデックを冗長コピーのために使用し得る。しかしながら、低ビットレートコーデックの使用は、符号器での複雑性を増大させ得る。さらに、いくつかの従来のスキームは、フレームの主要コピーとフレームの冗長コピーとの両方のために同じ低ビットレートコーデックを使用し得る。これは、符号器での複雑さを低減するとともにデータレートを低減し得るが、基本スピーチ品質(つまり、フレームが失わない場合のスピーチ品質)は、大幅に劣化する。さらに、従来の送信機ベースのスキームは、少なくとも1つのフレーム間隔の追加遅延の仮定の下で動作する。
【0010】
本システムおよび方法は、スピーチ品質と、遅延と、データレートソースとの間の最適なトレードオフを取得するためにソースおよびチャネル制御FECスキームを提供する。1つの構成において、いかなる追加の遅延もこのFECスキームに導入されない。適度なデータレートの増大の下のスピーチ品質の高品質改良が達成され得る。以下で説明されるFECスキームは、さらに任意のターゲットデータレートで動作し得る。1つの例において、FECスキームおよびターゲットデータレートは、送信チャネルの条件とともに外部制御に基づいて適応的して調整され得る。提案されたFECスキームは、さらにレガシ通信デバイス(例えばレガシハンドセット)と互換性を有し得る。
【0011】
スピーチ信号内の情報のロスを防ぐ方法が開示される。方法は、符号化されるべき第1のスピーチフレームを選択することを含み得る。方法は、さらに第2のスピーチフレームおよび1つまたは複数の近接スピーチフレーム内の情報に基づいて第2のスピーチフレームがクリティカルスピーチフレームであるかどうか判断することを含み得る。方法は、さらに第2のスピーチフレームがクリティカルスピーチフレームである場合に第2のスピーチフレームの符号化バージョンの少なくとも一部を生成することを含み得る。方法は、さらに第1のスピーチフレームおよび第2のスピーチフレームの符号化バージョンの少なくとも一部を送信することを含み得る。
【0012】
スピーチ信号内の情報のロスを防ぐための無線デバイスが開示される。無線デバイスは、第2のスピーチフレームがクリティカルスピーチフレームかどうか判断するために第2のスピーチフレームおよび1つまたは複数の近接したスピーチフレーム内の情報を使用するように構成されたクリティカルフレーム識別モジュールを含み得る。無線デバイスは、さらに第2のスピーチフレームがクリティカルスピーチフレームである場合に選択された前方誤り訂正モードに従う第2のスピーチフレームの符号化バージョンの少なくとも一部を生成するように構成された前方誤り訂正(FEC)モジュールを含み得る。無線デバイスは、さらに第1のスピーチフレーム、および第2のスピーチフレームの符号化バージョンの少なくとも一部を送信するように構成された送信機を含み得る。
【0013】
スピーチ信号内の情報のロスを防ぐための装置が開示される。装置は、符号化されるべき第1のスピーチフレームを選択するための手段を含み得る。装置は、さらに第2のスピーチフレーム内の情報および1つまたは複数の近接したスピーチフレーム内の情報に基づいて第2のスピーチフレームがクリティカルフレームであるか判断するための手段を含み得る。装置は、さらに第2のスピーチフレームがクリティカルスピーチフレームである場合に選択された前方誤り訂正モードに従う第2のスピーチフレームの符号化バージョンの少なくとも一部を生成するための手段を含み得る。装置は、第1のスピーチフレームおよび第2のスピーチフレームの符号化バージョンの少なくとも一部を送信するための手段をさらに含み得る。
【0014】
スピーチ信号内の情報のロスを防ぐためのコンピュータプログラムプロダクトが開示される。コンピュータプログラムプロダクトは、その上に命令を有するコンピュータ可読媒体を含み得る。その命令は、符号化されるべき第1のスピーチフレームの選択のためのコードを含み得る。命令は、さらに第2のスピーチフレームおよび近接したスピーチフレームに基づいて第2のスピーチフレームがクリティカルスピーチフレームかどうか判断するためのコードを含み得る。その命令は、さらに第2のスピーチフレームがクリティカルスピーチフレームである場合に選択された前方誤り訂正モードに従う第2のスピーチフレームの符号化バージョンの少なくとも一部を生成するためのコードを含み得る。その命令は、さらに第1のスピーチフレームおよび第2のスピーチフレームの符号化バージョンの少なくとも一部の送信のためのコードを含み得る。
【0015】
図1は、伝送媒体114を介した送信端末102および受信端末104の一例を示すブロック図100である。送信端末102および受信端末104は、電話、コンピュータ、音声ブロードキャストおよび受信装置、ビデオ会議装置などを含む音声通信をサポートすることが可能な任意のデバイスであってよい。1つの構成では、送信端末102および受信端末104は、符号分割多元接続(CDMA)機能など、無線多元接続技術を用いて実施可能である。CDMAは、スペクトル拡散通信に基づく変調および多元接続スキームである。
【0016】
送信端末102は、音声符号器106を含むことが可能であり、受信端末104は、音声復号器108を含むことが可能である。音声符号器106は、人の発話生成のモデルに基づいてパラメータを抽出することによって、第1のユーザインターフェース110からスピーチを圧縮するために使用可能である。送信機112は、伝送媒体114を通してこれらのパラメータを含むパケットを送信するために使用可能である。伝送媒体114は、インターネット、もしくは企業イントラネット、または任意のその他の伝送媒体などパケットベースのネットワークであってよい。伝送媒体114のもう一方の終端の受信機116は、パケットを受信するために使用可能である。音声復号器108は、パケット内のパラメータを使用して、スピーチを合成できる。合成スピーチは、受信端末104上の第2のユーザインターフェース118に提供され得る。図示されないが、巡回冗長検査(CRC)機能、インタリーブ、デジタル変調、スペクトル拡散処理などを含む、畳み込み符号化など、様々な信号処理機能を送信機112と受信機116の両方において実行することが可能である。
【0017】
通信に対するそれぞれの当事者は、送信、ならびに受信が可能である。それぞれの端末は、音声符号器と音声復号器とを含み得る。音声符号器および音声復号器は、別個のデバイスであってよく、または「ボコーダ」として知られている、単一のデバイス内に統合されてもよい。以下の詳細な説明では、端末102、104は、伝送媒体114の一方の終端における音声符号器106と、もう一方の終端における音声復号器108とを用いて説明される。
【0018】
送信端末102の少なくとも1つの構成では、スピーチは、それぞれがサブフレームにさらに区分化された状態で、フレーム内の第1のユーザインターフェース110から音声符号器106への入力であってよい。何らかのブロック処理が実行される場合、これらの任意のフレーム境界を使用できる。しかしながら、ブロック処理ではなく連続的な処理が実施される場合、音声サンプルは、フレーム(および、サブフレーム)に区分化されなくてもよい。説明される例では、伝送媒体114を通して送信されるそれぞれのパケットは、特定の用途、および全体的な設計制約に応じて、1つまたは複数のフレームを含み得る。
【0019】
音声符号器106は、可変レート符号器、または固定レート符号器であってもよい。可変レート符号器は、スピーチコンテンツに応じて、フレームからフレームに複数の符号器モード間で動的に切り替えることが可能である。音声復号器108は、さらにフレームからフレームに対応する復号器モード間で動的に切り替えることが可能である。受信端末104において許容信号再生を維持しながら、それぞれのフレームが利用可能な最低のビットレートを達成するために特定のモードを選ぶことが可能である。
【0020】
1つの構成において、受信端末104は、さらに送信端末102にチャネル状態情報120をフィードバックし得る。1つの例において、受信端末104は、送信端末102からパケットを送信するために使用されるチャネル品質に関する情報を収集する。受信端末104は、チャネル品質を推定するために収集情報を使用し得る。その後、この推定値は、チャネル状態情報120として送信端末102にフィードバックされ得る。送信端末102は、送信機ベースのパケットロス弾力性スキーム(つまり、FECスキーム)に関連した1つまたは複数の機能に適応するためにチャネル状態情報120を使用し得る受信チャネル状態情報120に基づいたFECスキームの適応に関する詳細は、以下により十分に説明される。
【0021】
音声符号器106および音声復号器108は、線形予測符号(LPC)を使用できる。LPC符号化の場合、スピーチは、その強度とピッチとによって特徴付けられるスピーチソース(声帯)によってモデル形成され得る。声帯からのスピーチは、「フォルマント」と呼ばれるその共振によって特徴付けられる声道(喉および口)を介して移動する。LPC音声符号器は、フォルマントを推定して、スピーチからその効果を除去し、残差スピーチの強度とピッチとを推定することによってスピーチを解析できる。受信終端におけるLPC音声復号器は、このプロセスを反転することによって、そのスピーチを合成することが可能である。詳細には、LPC音声復号器は、スピーチソースを作成するために残差スピーチを使用して、(声道を表す)フィルタを作成するためにフォルマントを使用し、そのスピーチを合成するために、そのフィルタを介してそのスピーチソースを実行することが可能である。
【0022】
図2は、LPC音声符号器206の例を説明するブロック図である。LPC音声符号器206は、LPCモジュール202を含み得る。それは、現在またはN番目のスピーチフレーム216におけるスピーチからのフォルマントを推定する。基本的ソリューションは、差分方程式であり得る。それは、先のスピーチサンプルの線形結合(スピーチサンプルの短期間の関係)としてフレームの各スピーチサンプルを表す。差分方程式の係数は、フォルマントの特徴を示す。LPC係数222は、逆フィルタ214に適用され得る。それは、スピーチからのフォルマントの影響を取り除き得る。LPC係数とともに残差スピーチは、スピーチが受信側で再構成できるように伝送媒体を通じて送信され得るLPC音声符号器206の少なくとも1つの構成において、LPC係数は、変換モジュール204によって線スペクトル対(LSP)に転換される。係数は、よりよい送信および数学的な操作効率のために変形され得る。
【0023】
さらなる圧縮技術は、冗長マテリアルを除去することによってスピーチを表わすために要求された情報を減少させるために使用され得る。これは、人間の声帯の周期振動によって生じるある基本周波数があるという事実を有効に使うことによって達成され得る。これらの基本周波数は、しばしば「ピッチ」と呼ばれる。このピッチは、(1)スピーチセグメントの自己相関関数を最大限にするスピーチサンプルの数の「遅延」、および(2)「適応可能なコードブック利得」218を含む「適応可能なコードブックパラメータ」、によって定量化されることができる。適応可能なコードブック利得は、スピーチの長期的な周期性がサブフレーム基準(sub-frame basis)でどれくらい強いかを測定218する。これらの長期的な周期性は、受信端末に送信される前の残差スピーチから引かれ得る。
【0024】
減算器210からの残差スピーチは、多くの方法でさらに符号化され得る。例えば、最も典型的なスピーチ残差信号にパラメータを割り当てるテーブルであるコードブック212が使用され得る。動作において、減算器210からの残差スピーチは、コードブック212におけるすべてのエントリと比較される。最近接の一致を備えるエントリのためのパラメータが選択される。固定コードブックパラメータは、「固定コードブックインデックス」および「固定コードブック利得」を含む。固定コードブック係数は、フレームのために新しい情報(エネルギ)を包含する。それは、基本的にフレーム間の違い(difference)の符号化表現である。固定コードブック利得は、受信端末104の音声復号器108がスピーチの現在のサブフレームに新しい情報(固定コードブック係数)を適用するために使用されるべき利得を表わす。
【0025】
ピッチ推定器208は、さらに「デルタ遅延」または「DDelay」と称される追加の適応可能なコードブックパラメータを生成するために使用され得る。DDelayは、現在のフレームと先のフレームとの間で測定された遅延の差である。しかしながら、それは制限された範囲を有し、2つのフレーム間の遅延の差がオーバーフローする場合に0にセットされ得る。このパラメータは、スピーチを合成するために受信端末104の音声デコーダ108によって使用され得ない。代わりに、それは失われたフレームまたは破損したフレームのためにスピーチサンプルのピッチを計算するために使用される。
【0026】
1つの構成において、符号器206は、さらにFECモジュール220を含み得る。FECモジュール220は、K番目のスピーチフレーム215を受信し得る。ここで、Kは、N未満である。FECモジュール220がK番目のフレーム215を分析した際にこれらの符号化フレーム217が存在する場合、FECモジュール220は、K番目のスピーチフレーム217より前の1つまたは複数の符号化フレームおよび/またはK番目のスピーチフレーム215の後に生じる1つまたは複数の符号化フレーム217をさらに受信し得る。
【0027】
FECモジュール220は、K番目のスピーチフレームを分析し得る。FECモジュール220は、K番目のスピーチフレーム215がクリティカルフレームかどうか判断し得る。分析されたK番目のスピーチフレーム215は、FECモジュール220によって受信されるK番目のスピーチフレーム215の後および/または先に生じる1つまたは複数の符号化フレーム217およびK番目のスピーチフレーム215に含まれる情報に基づいてクリティカルフレームとみなされ得る。K番目のスピーチフレーム215がクリティカルフレームであると判断された場合、FECモジュール220は、さらにK番目のスピーチフレーム215を「保護する」ことになる実施に対するプロセスを決定し得る。
【0028】
クリティカルフレームを保護するプロセスは、クリティカルフレームの冗長コピーを生成することを含み得る。クリティカルフレームの冗長コピーは、クリティカルフレームのパラメータのうちのいくつかまたはすべてを含み得る。K番目のスピーチフレーム215がクリティカルフレームであり、受信端末104に送信する間に失われる場合に、FECモジュール220は、K番目のスピーチフレーム215を保護することを決定し得る。FECモジュール220に関するより多くの詳細が以下で説明される。
【0029】
図3は、FECモジュール320の1つの構成を例示するブロック図である。FECモジュール320は、スピーチフレームを分析し、スピーチフレームがクリティカルフレームかどうか判断し、スピーチフレームの冗長コピーを生成することによってスピーチフレームを保護するために使用される、1つまたは複数の追加モジュールを含み得る。コピーされるべきフレームは、本明細書に主要フレームと呼ばれ得る。冗長コピーは、主要フレームのパラメータのうちのいくつかまたはすべてを複製することによって生成される、または主要フレームを符号化するために使用されるものと異なるコーディング方法を使用して、主要フレームを符号化することによって生成され得る。通常、このコーディング方法は、主要フレームより低レートを有する。
【0030】
1つの例示において、FECモジュール320は、クリティカルフレーム識別(ID)モジュール302(図4に関係して議論される)、部分フレーム保護モジュール304(図5に関係して議論される)、完全フレーム保護モジュール306(図5に関係して議論される)、FECモード選択アルゴリズム308(図5に関係して議論される)、チャネル状態フィードバックモジュール310(図6に関係して議論される)、および動的レート制御モジュール312(図7に関係して議論される)を含む。クリティカルフレームIDモジュール302は、スピーチフレームがクリティカルフレームかどうか判断し得る。1つの構成において、このモジュール302は、パケットロス条件の下での最もクリティカルフレームを識別するために使用されてもよい。
【0031】
図4は、クリティカルフレーム識別モジュール402の1つの構成を説明するブロック図である。モジュール402は、フレームがフレームのプロパティ430とともに近接フレームプロパティ432も分析することによってクリティカルフレームかどうか判断し得る。クリティカルフレームは、そのフレームが失われた場合に重大な品質低下を引き起こすフレームであり得る。例えば、いくつかの重要なパラメータが先のフレームから現在のフレームにおいて大きく(ある所定のしきい値より大きく)変化する場合、現在のフレームは、先のフレームから容易に予測されないので、現在のフレームは、クリティカルフレームになり得る。さらに、クリティカルフレームIDモジュール402は、スピーチフレームがフレームおよび近隣フレームのスピーチモード434に基づいてクリティカルフレームかどうか判断し得る。クリティカルフレーム判断は、さらにフレームおよび近隣フレームのコーディングタイプ435に基づき得る。例えば、スピーチモード434は、フレームごとの特徴を示し得る。スピーチフレームコーディングタイプは、現在のフレームを符号化するために使用される符号化プロセスを示し得る。スピーチフレームコーディングタイプの例は、コード励起線形予測(CELP)、ノイズ励起線形予測(NELP)、プロトタイプピッチ周期(PPP)などを含み得る。スピーチモードの例は、有声、無声、沈黙、過渡(transient)、声の出だし(voiced onset)、などを含み得る。例えば、クリティカルCELPフレームは、クリティカルNELPフレームよりクリティカルであるが、声の出だしフレームは、安定した音声フレームよりクリティカルであり得る。1つの構成において、クリティカルフレーム識別モジュール402は、スピーチフレームがクリティカルフレームかどうか判断するためにいかなる追加の符号化遅延を要求し得ない。
【0032】
クリティカルフレーム識別モジュールは、フレームがクリティカルフレームかどうか判断するだけでなく、フレームのクリティカルネスレベル(criticalness level)を判断し得る。これは、スピーチフレームおよびその近接フレームのパラメータ、特徴、コーディングタイプ、およびモードに基づき得る。異なるクリティカルフレームは、異なるクリティカルネスレベルを有し得る。例えば、2つのクリティカルフレーム、AおよびBのために、Aの次のフレームがAから十分予測可能であり、Bの次のフレームがBに全く依存しない場合、Aを失うことは、1つのフレームより多くのフレームにわたって品質低下を引き起こすので、Aは、Bよりさらにクリティカルであり得る。
【0033】
図3に戻り、FECモジュール320は、さらにFECモード選択アルゴリズム308を含み得る。セレクションアルゴリズム308は、フレームがクリティカルフレームであると判断する場合に実施する保護モードを選択し得る。保護モードは、クリティカルフレームの冗長コピーにコピーされることになる、クリティカルフレームのパラメータの量を示し得る。保護モードの例は、完全保護モードおよび1つまたは複数の部分保護モードを含み得る。例えば、部分保護モードは、パラメータの1つのセットまたはパラメータの複数のセットのみを保護し得る。
【0034】
1つの例示において、完全保護モードは、完全フレーム保護モジュール306によって実施され得る。完全保護モードは、クリティカルフレームにおけるすべてのパラメータがコピーされフレームの冗長コピーに含まれることを示し得る。1つの構成において、部分保護モードは、部分フレーム保護モジュール304によって実装され得る。部分保護モードは、クリティカルフレームのパラメータの一部のみがコピーされ、クリティカルフレームの冗長コピーに含まれることを示し得る。部分保護モードは、さらにフレームが低レート符号化方法によって符号化することを示し得る。
【0035】
図5に例示されるように、FECモード選択アルゴリズム508は、選択された保護モードを実施するために部分フレーム保護モジュール504または完全フレーム保護モジュール506のいずれかを選択し得る。完全保護モードおよび部分保護モードは、利用可能な帯域幅を有効に利用し、レガシ通信デバイスとの下位互換性を提供し得る。1つの構成において、完全保護モードが選択されている場合、部分保護モードは、無効になり得る。FECモード選択アルゴリズム508は、送信端末102から受信端末104への送信パケットに使用される送信チャネルの物理的プロパティに基づいて実施する保護モードを選択し得る。使用するモードの選択は、さらにフレームの特徴に基づき得る。たとえパラメータのサブセットが先のフレームと現在のフレームとの間で大きく変化する場合でさえも、パラメータのこのサブセットだけは、保護される必要がある。この場合において、フレームロスが起こる場合、保護されない他のパラメータは、先のフレームから予測され得る。さらに、FECモード選択アルゴリズム508は、送信端末102によってサポートされる保護モードに基づいて保護モードを選択し得る。
【0036】
図3に戻って、FECモジュール320は、さらにチャネル状態フィードバックモジュール310を含み得る。図6に示されるように、チャネル状態フィードバックモジュール610は、チャネル状態情報620を受信し得る。以前説明されたように、チャネル状態情報620は、受信端末104で収集され、と推定され得る。チャネル状態情報620は、送信端末102に送信し返され得る。1つの構成において、チャネル状態フィードバックモジュール620は、受信チャネル状態情報620を分析する。情報620は、送信端末102および受信端末104との間の送信のために使用されたチャネルの品質を示し得る。フィードバックモジュール610は、チャネルの品質を分析し、FECモード選択アルゴリズム308にその結果を提供し得る。
【0037】
(チャネル状態フィードバックモジュール610によって提供された)チャネルの品質に基づいて、選択アルゴリズム308は、選択された保護モードを適応的に変更し得る。言いかえれば、チャネルの品質が劣化するときに、FECモード選択アルゴリズム308は、受信端末104へのクリティカルフレームの冗長コピーを送るために必要とされるデータレートを低減するために部分保護モードを選択し得る。チャネルの品質が増加するときに、FECモード選択アルゴリズム308は、完全保護モードを適応させ選択し得る。完全保護モードにより、クリティカルフレームのパラメータ各々は、フレームの冗長コピーにコピーされ含まれる。チャネル品質の増加は、より高いデータレートが達成されことを示し得る。
【0038】
1つの構成において、チャネル状態フィードバックモジュール610は、さらにオフセット計算機622を含み得る。1つの例において、オフセット計算機622は、FECオフセットの値を決定する。オフセットは、フレームの主要コピーの送信時間とフレームの冗長コピーの送信時間との間隔であり得る。言いかえれば、オフセット計算機622は、クリティカルフレームの冗長コピーが受信端末104へいつ送信されるか決定し得る。通常、パケット交換ネットワークにおけるパケットロスは、バースト的であり、バーストの長さは、異なるネットワーク状態の下で異なり得る。したがって、動的に調整されたオフセットを使用することは、よりよい誤り保護性能が得られる。最適なオフセットは、受信機によるチャネル状態データ送信を使用して推定され得る。
【0039】
図3に戻って、FECモジュール320は、動的なレート制御モジュール312をさらに含み得る。レート制御モジュール312は、目標データレートに合わせるために各フレームのための最終保護モードを決定し得る。図7に説明されるように、動的レート制御モジュール712は、チャネル状態フィードバックモジュール710から受信したチャネル状態情報および指定された目標データレート734に基づいて最終保護モードを決定し得る。
【0040】
最終保護モードを決定するために、レート制御モジュール712は、所定の目標レートに近づけるための2つのステップを実行し得る。第1のステップにおいて、2つの近接した動作ポイントが決定され得る。動作ポイントは、データレートであり得る。目標データレート734の値が2つの動作ポイントの値の間にあるように、これらの二つの近接動作ポイントは、選択され得る。1つの構成において、動作ポイントは、スピーチフレーム誤り弾性プロパティ(speech frame error-resilience properties)に基づく所定の保護決定であり得る。第1の動作ポイントが第2の動作ポイントより高いデータレートを有する場合、第1の動作ポイントに関連した保護決定の性能は、第2の動作点に関連した保護決定よりパケットロス状態の下でよりよくなり得る。
【0041】
第2のステップにおいて、第1のステップで2つの近接動作ポイントによって定義された保護決定の範囲内で、動的レート制御モジュール712は、目標データレート734に合わせるように保護決定を調整し得る。1つの構成において、2つの動的制御アルゴリズム、例えば、ランダムレート制御アルゴリズム730、および動的レート制御アルゴリズム732が提供され得る。ランダムレート制御アルゴリズム730は、各フレームの保護決定を決定するためにランダムアルゴリズムを使用し得る。ランダムアルゴリズムは、平均データレートが目標データレート734に近づくように構成され得る。代替として、決定論的レート制御アルゴリズムは、決定論的方法を通じて各フレームの保護決定を決定し得る。平均レートは、すべてのフレームのために計算され得る。平均レートが目標レートを越えるものである場合、より低いデータレート保護または非保護は、現在のフレームのために使用され;そうでなければ、より高いデータレート保護は、現在のフレームのために使用され得る。現在のフレームの保護決定は、さらに第1のステップにおいて2つの近接動作ポイントによって定義された保護決定の範囲で制限され得る。目標データレート734は、容量要求に基づいて外部から指定され得る。代替として、目標データレート734は、チャネル状態情報120のフィードバックに基づいて内部で指定され得る。
【0042】
図8は、受信端末804のブロック図である。この構成では、VoIPクライアント230は、デジッタバッファ202を含む。受信端末204は、さらに1つまたは複数の音声復号器208を含む。復号器808は、スピーチ生成器832を含み得る。音声復号器808は、独立型のエンティティとしてボコーダの一部として実装可能であり、または受信端末804内の1つもしくは複数のエンティティを通して分散することも可能である。音声復号器808は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組合せとして実装可能である。例として、音声復号器808は、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、プログラマブル論理、専用ハードウェア、または任意のその他のハードウェアベースおよび/もしくはソフトウェアベースの処理エンティティを用いて実装可能である。音声復号器808は、以下でその機能性の点から説明される。音声復号器808が実装される様式は、その特定の用途と、システム全体に課された設計制約とに依存する。
【0043】
デジッタバッファ802は、ネットワーク輻輳、タイミングドリフト、およびルート変更に起因するパケット到着時間の変動によって引き起こされるジッタを除去するハードウェアデバイスまたはソフトウェアプロセスであってよい。デジッタバッファ802は、音声パケット内でスピーチフレーム842を受信することが可能である。加えて、デジッタバッファ802は、先に到着したパケットが正しい順序でスピーチ生成器832に継続的に提供され、その結果、音声ひずみをほとんど伴わずにクリアな接続をもたらすことができるように、新しく到着したパケットを遅延させることが可能である。デジッタバッファ802は、固定されてよく、または適応型であってもよい。固定デジッタバッファは、パケットに固定遅延をもたらすことができる。他方で、適応型デジッタバッファは、ネットワークの遅延内の変化に適応できる。デジッタバッファ802は、復号器808にスピーチフレームを提供することが可能である。
【0044】
フレームの主要コピーがデジッタバッファによって受信されない場合、フレームロスは、FECが使用されないかどうかによって生じる。FECが使用され、現在のフレームとして振る舞うべきフレームの主要コピーが失われた場合、デジッタバッファは、バッファにフレームの冗長コピーがあるかどうかチェックし得る。現在のフレームのための冗長コピーがある場合、冗長コピーは、スピーチサンプルを生成するために復号され得る。冗長コピーは、完全フレームまたは部分フレームであり得る。
【0045】
さらに、デジッタバッファ802は、主要フレーム(つまり、オリジナルのクリティカルフレーム)および冗長フレーム(つまり、オリジナルのクリティカルフレームのある部分またはすべてのコピー)を異なって処理するために修正され得る。FECモジュール220の機能が実施されない場合にFECモジュール220の機能の実施に関連した平均遅延時間が平均遅延時間と比べわずかでも大きくならないように、バッファ802は、これらの2つのフレームを異なって処理し得る。主要コピーのパラメータのうちのいくつか(つまり、一部)を含むフレームの冗長コピーは、デジッタバッファ802から部分フレーム復号モジュール850に渡され得る。
【0046】
先に述べたように、巡回冗長検査(CRC)機能、インタリーブ、デジタル変調、スペクトル拡散処理を含めて、畳み込み符号化など、様々な信号処理機能を送信端末102によって実行することが可能である。
【0047】
デジッタバッファ802から解放されたスピーチフレーム842は、合成スピーチ844を生成するために、スピーチ生成器832に提供され得る。スピーチ生成器832は、合成スピーチ244を生成するためのいくつかの機能を含み得る。当業者に既知の合成スピーチにスピーチを復号する任意の方法が使用され得る。示された実施形態において、スピーチ生成器は、CELP復号化方法を使用し得る。ここで、逆コードブック812は、固定コードブックパラメータ838を使用し得る。例えば、固定コードブックインデックスを残差スピーチに変換して、固定コードブック利得をその残差スピーチに適用するために、逆コードブック812を使用できる。ピッチ情報を残差スピーチに追加し戻す818ことが可能である。ピッチ情報は、「遅延」からピッチ復号器214によって計算できる。ピッチ復号器214は、スピーチサンプルの先のフレームを作成した情報のメモリであり得る。適応コードブック利得など、適応コードブックパラメータ836は、残差スピーチに追加される(818)前に、ピッチ復号器814によってそれぞれのサブフレーム内のメモリ情報に適用され得る。残差スピーチは、フォルマントをスピーチに追加するために、逆変換222からのLPC係数など、線スペクトル対234を使用して、フィルタ220を通じて実行可能である。未処理の合成スピーチは、次いで、フィルタ820からポストフィルタ824に提供可能である。ポストフィルタ224は、スピーチを平滑化して、帯域外成分を削減することができる音声帯域内のデジタルフィルタであり得る。代替として、そして限定ではなく、スピーチ生成器は、NELPまたはPPP完全フレーム復号化方法を使用し得る。
【0048】
図9は、VoIPのために前方誤り訂正(FEC)の方法900の1つの例を例示するフローチャートである。方法900は、送信端末102によって実装され得る。送信端末102および受信端末104との間のVoIP通話のセットアップ中に、適切なFECモード(例えば完全保護モードまたは部分保護モード)が、選択され得る902。モードは、物理送信チャンネルと送信端末102および受信端末104のサポートとに基づいて選択され得る。目標データレートがさらに決定され得る。1つの例において、目標データレートは、容量要求に従って決定され得る904。FECオフセット値がさらに決定され得る。1つの例において、FECオフセット値は、所定の値である。別の例において、FECオフセット値は、チャネル状態に基づいて適切に調整されることができる。
【0049】
符号化されるべきスピーチフレーム、フレームNが選択され得る906。その後、K番目(K≦N)のスピーチフレームは、分析され906、判断は、K番目のスピーチフレームがクリティカルフレームかどうかに応じて行われ得る908。どのフレームを分析すべきであるか選択することは、FECオフセットによって決まる。例えば、FECオフセットが2である場合、N−2のフレームが分析され得る。1つの構成において、VoIP通話の間、符号化フレームすべてのために、送信端末102内の符号器106は、K番目のスピーチフレームが保護されるべきかどうか(つまり、K番目のスピーチフレームがクリティカルフレームかどうか)決定し得る。符号器106は、さらにK番目のスピーチフレームが、目標データレート、決定の結果、および選択されたFECモードに基づいてどのように保護されるべきか判断し得る。1つの構成において、目標データレートおよびFECオフセット値は、受信端末104からフィードバックされたチャネル状態情報120に基づいてランタイム中に調整され得る。
【0050】
K番目のスピーチフレームがクリティカルフレームでない場合、符号化スピーチフレームNのみが受信端末に送信される914。K番目のスピーチフレームがクリティカルフレームであると決定された場合908、K番目のスピーチフレームの冗長コピーが生成され得る910。K番目のスピーチフレームの冗長コピーの生成は、選択されたFECモードに基づき得る。例えば、冗長コピーは、選択されたFECモードが完全保護モードまたは部分保護モードかどうかに依存するクリティカルK番目のスピーチフレームに含まれたパラメータのうちのいくつかまたはすべてにより生成され得る。代替として、冗長コピーは、主要コピーのためのコーディング方法より低いレートを有する、別のコーディングスキームを使用して、生成され得る。
【0051】
1つの構成において、主要コピー(つまり、現在のスピーチフレームN)およびクリティカルK番目のスピーチフレームの冗長コピーは、リアルタイムプロトコル(RTP)パケットにパケット化され、受信端末104へ送信される912および914。別の構成において、フレームの主要コピーおよびK番目のスピーチフレームの冗長コピーは、同時に生成されるが、2つの異なるRTPパケットに個別にパケット化され、受信端末へ送信され得る。いずれのフォーマットを使用するかの決定は、両端末の能力に基づき得る。両方のフォーマットが各端末にサポートされる場合、より低いデータレートを生じるフォーマットが使用される。受信機側では、スピーチフレームは、適応可能なデジッタバッファ802に格納され得る。先で述べたように、スピーチフレームのための平均遅延時間がFEC技術のない平均遅延時間と比べわずかでも大きくならないように、デジッタバッファ802が設計され得る。フレームは、デジッタバッファ802から適切な順序で復号器108に送られ得る。スピーチフレームが主要コピーのパラメータのうちのいくつかを有する冗長コピーである場合、部分フレーム復号化モジュール850が使用される。
【0052】
ソースおよびチャネルは、以上で説明されたFECスキームを制御した、データレートの適度な増加を単に引き起こす一方でパケットロスの数およびロスのバースティネス(burstiness)を減らしてもよい。クリティカルフレーム識別モードおよび部分フレーム保護モードは、スピーチ知覚品質とデータレートとの間のよいトレードオフを保証し得る。デジッタバッファへの修正は、追加の末端間遅延を導入しないことができる。動的レート制御モジュール312は、オペレーターが容量要求に基づいてデータレートを判断するように、以上で説明したFECスキームが任意の指定されたデータレートで実行されるように許容され得る。最後に、FECモード選択アルゴリズム308によって実行されたFECモード選択は、部分フレーム保護モードがハンドセット(例えば、送信端末102および受信端末104)の物理チャネルプロパティおよび能力に基づいて使用されるかどうか決定し得る。以上で説明されたFECスキームは、利用可能な帯域幅を浪費せず、レガシ通信デバイスと下位互換性がある。
【0053】
FEC機能性を持った端末が(完全フレームのみ復号化することができる)レガシ端末と通信する場合、部分フレーム保護は、無効になるので、レガシハンドセットは、FEC冗長性からの恩恵を受け得る。部分フレームがレガシ端末へ送られる場合、レガシ端末は、部分フレームのフォーマットが理解されないので部分フレームを無視する結果、潜在的に利用可能な帯域幅の浪費を引き起こすことになる。
【0054】
上で説明された図9の方法は、図10に例示されるミーンズプラスファンクションブロックに対応する、様々な(1つもしくは複数の)ハードウェアコンポーネントおよび/または(1つもしくは複数の)ソフトウェアコンポーネント、ならびに/あるいは(1つもしくは複数の)ハードウェアモジュールおよび/または(1つもしくは複数の)ソフトウェアモジュールによって実行可能である。すなわち、図9に例示されるブロック902から914は、図10に例示されるミーンズプラスファンクションブロック1002から1014に対応する。
【0055】
図11は、無線デバイス1102内で利用可能な様々なコンポーネントを例示する。無線デバイス1102は、本明細書で説明される様々な方法を実施するように構成されたデバイスの一例である。無線デバイス1102は、遠隔局、アクセス端末、ハンドセット、携帯情報端末(PDA)、携帯電話などであり得る。
【0056】
無線デバイス1102は、無線デバイス1102の動作を制御するプロセッサ1104を含み得る。プロセッサ1104は、中央処理装置(CPU)と呼ばれる場合もある。読出し専用メモリ(ROM)とランダムアクセスメモリ(RAM)の両方を含み得るメモリ1106は、命令とデータとをプロセッサ1104に提供する。メモリ1106の一部は、不揮発性ランダムアクセスメモリ(NVRAM)を含むことも可能である。プロセッサ1104は、通常、メモリ1106内に格納されたプログラム命令に基づいて、論理演算と算術演算とを実行する。メモリ1106内の命令は、本明細書で説明される方法を実施するために実行可能であり得る。
【0057】
無線デバイス1102は、無線デバイス1102と遠隔位置との間のデータの送受信を可能にするために、送信機1110と受信機1112とを含み得るハウジング1108を含むことも可能である。送信機1110と受信機1112とを組み合わせてトランシーバ1114にすることができる。アンテナ1116は、ハウジング1108に取り付け可能であり、トランシーバ1114に電気的に結合可能である。無線デバイス1102は、(図示されないが)複数の送信機、複数の受信機、複数のトランシーバ、および/または複数のアンテナを含むことも可能である。
【0058】
無線デバイス1102は、トランシーバ1114によって受信された信号のレベルを検出して、定量化するために使用可能な信号検出器1118を含むことも可能である。信号検出器1118は、全エネルギ、擬似雑音(PN)当たりのパイロットエネルギーチップ(pilot energy per pseudonoise(PN)chips)、電力スペクトル密度(power spectral density)、およびその他の信号などの信号を検出することが可能である。無線デバイス1102は、信号を処理する際に使用するためのデジタル信号プロセッサ(DSP)1120を含むことも可能である。
【0059】
ワイヤレスデバイス1102の様々なコンポーネントは、データバスに加えて、電力バスと、制御信号バスと、状態信号バスとを含み得るバスシステム1122によって一緒に結合され得る。しかしながら、分かりやすくするために、様々なバスは、図11においてバスシステム1122として例示される。
【0060】
図12は、開示されたシステムおよび方法の1つの例に従う基地局1208のブロック図である。基地局1208の異なる実装の例は、発展ノードB(eNB)、基地局制御器、基地局トランシーバ、アクセスルータなどを含むがこれらに限定されない。基地局1208は、送信機1210および受信機1212を含むトランシーバ1220を含む。トランシーバ1220は、アンテナ1218に接続し得る。基地局1208は、デジタル信号プロセッサ(DSP)1214、汎用プロセッサ1202、メモリ1204、および通信インタフェース1206をさらに含む。基地局1208の様々なコンポーネントは、ハウジング1222内に含まれ得る。
【0061】
プロセッサ1202は、基地局1208の動作を制御し得る。プロセッサ1202は、さらにCPUと称され得る。読み出し専用メモリ(ROM)およびランダムアクセスメモリ(RAM)の両方を含み得る、メモリ1204は、プロセッサ1202に命令およびデータを提供する。メモリ1204の一部は、さらに不揮発性ランダムアクセスメモリ(NVRAM)を含むことができる。メモリ1204は、格納する電子情報に有能な任意の電子部品も含み、ROM、RAM、磁気ディスク記憶媒体、光学的記憶媒体、フラッシュメモリ、プロセッサ1202に含まれるオンボードメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROMなどとして具体化され得る。メモリ1204は、プログラム命令および他のタイプのデータを格納し得る。本明細書に開示された方法のうちのいくつかまたはすべてを実施するために、プログラム命令は、プロセッサ1202によって実行され得る。
【0062】
開示されたシステムおよび方法に従うアンテナ1218は、近くの通信デバイス1102から送信されたリバースリンク信号を受信し得る。アンテナ1218は、信号をフィルタに掛けて増幅するトランシーバ1220にこれらの受信信号を提供する。信号は、復調、復号、さらにフィルタに掛けるなどのためにトランシーバ1220からDSP 1214、および汎用プロセッサ1202に提供される。
【0063】
基地局1208の様々なコンポーネントは、データバスに加えて電力バス、制御信号バス、およびステータス信号バスを含むバスシステム1226によって連結される。しかしながら、明瞭さのために、様々なバスは、バスシステム1226として図12に説明される。
【0064】
本明細書で使用される場合、用語「決定すること」は幅広い様々な動作を包含しており、したがって、「決定すること」は、計算すること、演算すること、処理すること、導出すること、調査すること、調べること(例えば、表、データベース、または別のデータ構造の中を調べること)、確認することなどを含み得る。また、「決定すること」は、受信すること(例えば、情報を受信すること)、アクセスすること(例えば、メモリ中のデータにアクセスすること)などを含み得る。また、「決定すること」は、解決すること、選択すること、選ぶこと、確立することなどを含み得る。
【0065】
「基づいて」という句は、特に具体的にその他の指定がない限り、「だけに基づいて」を意味しない。すなわち、「基づいて」という句は、「だけに基づいて」と「に少なくとも基づいて」の両方を表す。
【0066】
本開示に関して説明された様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ信号(FPGA)もしくはその他のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタロジック、ディスクリートハードウェアコンポーネント、または本明細書で説明された機能を実行するように設計されたそれらの任意の組合せを用いて実施あるいは実行されることが可能である。汎用プロセッサはマイクロプロセッサであってよいが、代替では、プロセッサは任意の市販のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であってもよい。プロセッサはまた、コンピューティングデバイスの組合せ、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、DSPコアと共に1つもしくは複数のマイクロプロセッサ、または任意のその他のそのような構成として実施されることも可能である。
【0067】
本開示に関して説明される方法またはアルゴリズムのステップは、ハードウェアの形で直接的に、プロセッサによって実行されるソフトウェアモジュールの形で、またはそれら2つの組合せの形で具体化されることが可能である。ソフトウェアモジュールは、技術分野において知られている任意の形態の記憶媒体の中に常駐することが可能である。使用され得る記憶媒体のいくつかの例は、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、着脱可能ディスク、CD−ROMなどを含む。ソフトウェアモジュールは、単一の命令、または多くの命令を備えてよく、いくつかの異なるコード区分上、異なるプログラム間、および複数の記憶媒体の全域で分散されてもよい。記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことが可能であるようにプロセッサに結合される。代替では、記憶媒体は、プロセッサと一体であってもよい。
【0068】
本明細書で開示された方法は、説明された方法を達成するための1つもしくは複数のステップまたは動作を備える。これらの方法ステップおよび/または方法動作は、請求項の範囲から逸脱することなく互いに交換可能である。すなわち、ステップまたは動作の特定の順序が指定されていない限り、特定のステップおよび/もしくは動作の順序ならびに/または使用は、請求項の範囲から逸脱せずに修正可能である。
【0069】
説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せの形で実装可能である。ソフトウェアの形で実装される場合、これらの機能は、コンピュータ可読媒体上の1つもしくは複数の命令として格納可能である。コンピュータ可読媒体は、コンピュータによってアクセス可能な任意の利用可能な媒体であってよい。限定ではなく、例として、コンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROMもしくはその他の光ディスク記憶装置、磁気ディスク記憶装置もしくはその他の磁気記憶デバイス、あるいは所望されるプログラムコードを命令もしくはデータ構造の形で搬送または格納するために使用可能であり、コンピュータによってアクセス可能な任意のその他の媒体を備えることが可能である。本明細書で使用される場合、ディスク(Disk)およびディスク(disc)は、コンパクトディスク(CD)と、レーザディスクと、光ディスクと、デジタル多用途ディスク(DVD)と、フロッピー(登録商標)ディスクと、Blu−ray(登録商標)ディスクとを含み、この場合、ディスク(disks)は、通常、データを磁気的に再生し、一方、ディスク(discs)は、レーザを用いて、データを光学的に再生する。
【0070】
ソフトウェアまたは命令は、伝送媒体上で送信されることも可能である。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、より対線、デジタル加入者線(DSL)、もしくは赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、またはその他の遠隔ソースから送信される場合、その同軸ケーブル、光ファイバケーブル、より対線、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、伝送媒体の定義の中に含まれる。
【0071】
さらに、図9〜10によって例示された方法および技法など、本明細書で説明された方法および技法を実行するためのモジュールならびに/またはその他の適切な手段は、適用可能な場合、モバイルデバイスおよび/もしくは基地局によってダウンロード可能でありかつ/または取得可能である点を理解されたい。例えば、かかるデバイスは、本明細書で説明された方法を実行するための手段の転送を円滑にするためにサーバに結合できる。あるいは、本明細書で説明された様々な方法は、デバイスに記憶手段を結合または提供するとすぐに、モバイルデバイスおよび/または基地局が様々な方法を取得できるように、記憶手段(例えば、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、コンパクトディスク(CD)またはフロッピーディスクなどの物理的記憶媒体など)を経由して提供可能である。さらに、本明細書で説明された方法および技法をデバイスに提供するための任意のその他の適切な技法を利用することも可能である。
【0072】
特許請求の範囲は、上で例示されたまさにその構成およびコンポーネントに限定されない点を理解されたい。請求項の範囲から逸脱せずに、本明細書で説明されたシステム、方法、および装置の構成、動作、および詳細に様々な修正、変更、ならびに改変を行うことが可能である。

【特許請求の範囲】
【請求項1】
スピーチ信号内の情報のロスを防ぐための方法であって、
符号化されるべき第1のフレームを選択することと、
第2のスピーチフレームおよび1つまたは複数の近接スピーチフレーム内の前記情報に基づいて前記第2のスピーチフレームがクリティカルスピーチフレームかどうか判断することと、
前記第2のスピーチフレームがクリティカルスピーチフレームである場合、前記第2のスピーチフレームの符号化バージョンの少なくとも一部を生成することと、
前記第1のスピーチフレームおよび前記第2のスピーチフレームの前記符号化バージョンの少なくとも一部を送信することと
を備える、方法
【請求項2】
目標データレートを決定することと、
前記決定された目標データレートに従って前方誤り訂正(FEC)モードを選択することと
をさらに備える、請求項1に記載の方法。
【請求項3】
前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第2のスピーチフレームと同一である、
請求項1に記載の方法。
【請求項4】
前記前方誤り訂正(FEC)モードは、完全保護モードを備える、
請求項2に記載の方法。
【請求項5】
前記前方誤り訂正(FEC)モードは、1つまたは複数の部分保護モードを備える、
請求項2に記載の方法。
【請求項6】
前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第2のスピーチフレーム内の前記情報のサブセットを含む
請求項1に記載の方法。
【請求項7】
前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第2のスピーチフレームを符号化するために使用されるより低いビットレート符号化タイプを使用して構成される、
請求項6に記載の方法。
【請求項8】
前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部が送信されたときを示すオフセット値を決定することをさらに備える、
請求項1に記載の方法。
【請求項9】
前記第2のスピーチフレームがクリティカルフレームかどうか判断することは、前記第2のスピーチフレームおよび1つまたは複数の近接スピーチフレームのプロパティを分析することをさらに備える、
請求項1に記載の方法。
【請求項10】
前記第2のスピーチフレームがクリティカルスピーチフレームかどうか判断することは、前記第2のスピーチフレームを符号化するために使用されたスピーチモードにさらに基づく、
請求項1に記載の方法。
【請求項11】
前記スピーチフレームの前記スピーチモードは、有声、無声、安定した音声、または声の出だしである、
請求項10に記載の方法。
【請求項12】
前記第2のスピーチフレームがクリティカルスピーチフレームかどうか判断することは、前記第2のスピーチフレームを符号化するために使用されたスピーチ符号化タイプに基づく、
請求項1に記載の方法。
【請求項13】
前記スピーチ符号化タイプは、コード励起線形予測(CELP)、ノイズ励起線形予測(NELP)、またはプロトタイプピッチ周期(PPP)を備える、
請求項12に記載の方法。
【請求項14】
完全保護モードが選択された場合に前記部分保護モードを無効にすることをさらに備える、
請求項5に記載の方法。
【請求項15】
前記第1のスピーチフレームおよび前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するために使用されたチャネルのチャネル状態情報に基づいて前記目標データレートを調整することをさらに備える、
請求項2に記載の方法。
【請求項16】
前記第2のスピーチフレームの送信時間と前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部の送信時間との間の測定されたオフセットが存在する、
請求項1に記載の方法。
【請求項17】
前記オフセットは、スピーチフレームを送信するために使用されたチャネルのチャネル状態情報を使用して推定され、前記オフセットは、動的に調節される、
請求項16に記載の方法。
【請求項18】
目標データレートを前記決定することは、容量要求に基づく、
請求項2に記載の方法。
【請求項19】
目標データレートを前記決定することは、チャネル状態情報のフィードバックに基づく、
請求項2に記載の方法。
【請求項20】
前方誤り訂正(FEC)モードを前記選択することは、
前記第2のスピーチフレームのクリティカルネスレベルを決定することと、
前記目標データレートより高い第1の操作のデータレートを決定することと、
前記目標データレートより低い第2の操作のデータレートの決定することと、
前記目標データレートに合わせるようにFECモードを選択することと
を備える、請求項2に記載の方法。
【請求項21】
前記前方誤り訂正(FEC)モードは、前記モードを実施しているスピーチフレームのデータレートの前記平均値が前記目標データレートに近づくようにランダムに選択される、
請求項2に記載の方法。
【請求項22】
前記前方誤り訂正(FEC)モードは、前記モードを実施している前記スピーチフレームの前記データレートが前記目標データレートに近づくように選択される、
請求項2に記載の方法。
【請求項23】
前記第2のスピーチフレームがクリティカルかどうか判断することは、前記第2のスピーチフレームと1つまたは複数の近接したスピーチフレームとの間の差を計算することを備え、前記差が所定の閾値より大きい場合、前記第2のスピーチフレームはクリティカルである、
請求項1に記載の方法。
【請求項24】
前記第2のスピーチフレームがクリティカルかどうか判断することは、前記第2のスピーチフレームの前記スピーチモードに基づく、
請求項10に記載の方法。
【請求項25】
クリティカルスピーチフレームのクリティカルネスは、前記クリティカル第2のスピーチフレームおよび近接スピーチフレームのパラメータ、特性、コーディングタイプおよびモードに基づいて判断される、
請求項1に記載の方法。
【請求項26】
1つまたは複数のリアルタイムプロトコル(RTP)パケットに、前記第1のスピーチフレームおよび前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部をパッキングすることをさらに備える、
請求項1に記載の方法。
【請求項27】
前記1つまたは複数のRTPパケットのフォーマットは、送信端末および受信端末の能力に基づく、
請求項26に記載の方法。
【請求項28】
前記部分保護モードの選択は、利用可能な帯域幅、目標データレート、前記第1のスピーチフレームの特性、前記第2のスピーチフレームの特性、および前記近接スピーチフレームの特性に基づく、
請求項5に記載の方法。
【請求項29】
スピーチフレーム内の情報のロスを防ぐための無線デバイスであって、
第2のスピーチフレームがクリティカルスピーチフレームかどうか判断するために前記第2のスピーチフレームおよび1つまたは複数の隣接したスピーチフレーム内の前記情報を使用するように構成されたクリティカルフレーム識別モジュールと、
前記第2のスピーチフレームがクリティカルスピーチフレームである場合に、選択された前方誤り訂正モードに従う前記第2のスピーチフレームの符号化バージョンの少なくとも一部を生成するように構成された前方誤り訂正(FEC)モジュールと、
前記第1のスピーチフレームおよび前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するように構成された送信機と
を備える無線デバイス。
【請求項30】
目標データレートと、
前記目標データレートに従って前記前方誤り訂正モードを選択するように構成されたレート制御モジュールと
をさらに備える、請求項29に記載の無線デバイス。
【請求項31】
前記前方誤り訂正(FEC)モジュールは、前記選択された前方誤り訂正モードに従う前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部を生成するように構成される、
請求項30に記載の無線デバイス。
【請求項32】
前記前方誤り訂正(FEC)モードは、完全保護モードを備える、
請求項30に記載の無線デバイス。
【請求項33】
前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第2のスピーチフレームと同一である、
請求項29に記載の無線デバイス。
【請求項34】
前方誤り訂正(FEC)モードは、1つまたは複数の部分保護モードを備える、
請求項30に記載の無線デバイス。
【請求項35】
前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第2のスピーチフレーム内の前記情報のサブセットを含む、
請求項29に記載の無線デバイス。
【請求項36】
前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部は、前記第2のスピーチフレームを符号化するために使用されるより低いビットレート符号化タイプを使用して構成される、
請求項29に記載の無線デバイス。
【請求項37】
前記無線デバイスは、ハンドセットである、
請求項29に記載の無線デバイス。
【請求項38】
前記無線デバイスは、基地局である、
請求項29に記載の無線デバイス。
【請求項39】
前記第2のスピーチフレームの送信時間と前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部の送信時間との間の測定されたオフセットが存在する、
請求項29に記載の無線デバイス。
【請求項40】
前記オフセットは、スピーチフレームを送信するために使用されたチャネルのチャネル状態情報を使用して推定され、前記オフセットは、動的に調節される、
請求項39の無線デバイス、
【請求項41】
目標データレートを前記決定することは、容量要求に基づく、
請求項30に記載の無線デバイス。
【請求項42】
前記目標データレートを決定することは、チャネル状態情報のフィードバックに基づく、
請求項30に記載の無線デバイス。
【請求項43】
前記レート制御モジュールは、
前記第2のスピーチフレームのクリティカルネスレベルを決定し、
前記目標データレートより高い第1の操作のデータレートを決定し、
前記目標データレートより低い第2の操作のデータレートの決定し、
前記目標データレートに合わせるようにFECモードを選択する
ようにさらに構成される、請求項30に記載の無線デバイス。
【請求項44】
前記前方誤り訂正(FEC)モードは、前記モードを実施しているスピーチフレームのデータレートの前記平均値が前記目標データレートに近づくようにランダムに選択される、
請求項30に記載の無線デバイス。
【請求項45】
前記前方誤り訂正(FEC)モードは、前記モードを実施している前記スピーチフレームの前記データレートが前記目標データレートに近づくように選択される、
請求項30に記載の無線デバイス。
【請求項46】
前記第2のスピーチフレームがクリティカルかどうか判断することは、前記第2のスピーチフレームと1つまたは複数の近接したスピーチフレームとの間の差を計算することを備え、前記差が所定の閾値より大きい場合、前記第2のスピーチフレームはクリティカルである、
請求項29に記載の無線デバイス。
【請求項47】
前記第2のスピーチフレームがクリティカルかどうか判断することは、前記第2のスピーチフレームの前記スピーチフレームに基づく、
請求項29に記載の無線デバイス。
【請求項48】
前記スピーチフレームの前記スピーチモードは、有声、無声、安定した音声、または声の出だしである、
請求項47に記載の無線デバイス。
【請求項49】
クリティカルスピーチフレームのクリティカルネスは、前記クリティカル第2のスピーチフレームおよび近接スピーチフレームのパラメータ、特性、コーディングタイプおよびモードに基づいて判断される、
請求項29に記載の無線デバイス。
【請求項50】
1つまたは複数のリアルタイムプロトコル(RTP)パケットに、前記第1のスピーチフレームおよび前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部をパッキングすることをさらに備える、
請求項29に記載の無線デバイス。
【請求項51】
前記1つまたは複数のRTPパケットの前記フォーマットは、送信端末および受信端末の能力に基づく、
請求項50に記載の無線デバイス。
【請求項52】
前記部分保護モードの選択は、利用可能な帯域幅、目標データレート、前記第1のスピーチフレームの特性、前記第2のスピーチフレームの特性、および前記近接スピーチフレームの特性に基づく、
請求項34に記載の無線デバイス。
【請求項53】
スピーチフレームおよび前記スピーチフレームと異なるある部分またはすべてのコピーを処理するように修正されるデジッタバッファをさらに備える、
請求項29に記載の無線デバイス。
【請求項54】
スピーチ信号内の前記情報のロスを防ぐための装置であって、
符号化されるべき第1のスピーチフレームを選択するための手段と、
第2のスピーチフレームおよび1つまたは複数の近接スピーチフレーム内の前記情報に基づいて前記第2のスピーチフレームがクリティカルスピーチフレームかどうか判断するための手段と、
前記第2のスピーチフレームがクリティカルスピーチフレームである場合、前記第2のスピーチフレームの符号化バージョンの少なくとも一部を生成するための手段と、
前記第1のスピーチフレームおよび前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するための手段と
を備える装置。
【請求項55】
スピーチ信号内の情報のロスを防ぐためのコンピュータプログラムプロダクトであって、前記コンピュータプロダクトは、その上に命令を有するコンピュータ可読媒体を備え、
前記命令は、
符号化されるべき第1のフレームを選択するためのコードと、
第2のスピーチフレームおよび1つまたは複数の近接スピーチフレーム内の前記情報に基づいて前記第2のスピーチフレームがクリティカルスピーチフレームかどうか判断するためのコードと、
前記第2のスピーチフレームがクリティカルスピーチフレームである場合、第2のスピーチフレームの符号化バージョンの少なくとも一部を生成するためのコードと、
前記第1のスピーチフレームおよび前記第2のスピーチフレームの前記符号化バージョンの前記少なくとも一部を送信するためのコードと
を備える、コンピュータプログラムプロダクト。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公表番号】特表2012−529243(P2012−529243A)
【公表日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2012−514145(P2012−514145)
【出願日】平成22年6月3日(2010.6.3)
【国際出願番号】PCT/US2010/037310
【国際公開番号】WO2010/141762
【国際公開日】平成22年12月9日(2010.12.9)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】