わかりやすさに影響を及ぼすことなくセンテンス内のトークスパートの再生タイミングを変更するための方法および装置

パケット交換通信のためのボイスオーバーＩＰ（ＶｏＩＰ）のための適応型デジッタバッファ。提示したデジッタバッファ方法および装置は、通信システムにおけるボイス品質を最適化するために、無音期間がセンテンス間で検出されたのか、センテンス内で検出されたのかに応じてパケットの再生を変更する。一例では、デジッタバッファは、複数の受信パケットに関連する少なくとも１つの無音期間の長さを決定し、該無音期間の該決定された長さに基づいて該複数のパケットの一部分を送信する時間を決定する。別の例では、無音キャラクタライザユニットがこの機能を実行する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、無線通信システムに関し、詳細には、パケット交換通信のためのＶｏＩＰ（Voice over Internet Protocol）のための適応型デジッタ（de-jitter）バッファにおけるパケットの再生に関する。
【背景技術】
【０００２】
通信システムでは、パケットの終端間遅延は、ソースにおけるその生成から、パケットがその宛先に到達するまでの時間と定義される。パケット交換通信システムでは、パケットがソースから宛先まで移動するための遅延は、これに限定するものではないが、チャネル状態およびネットワーク負荷を含む、様々な動作条件に応じて変化する。チャネル状態は無線リンクの品質に関係する。
【０００３】
パケットの終端間遅延は、ネットワークおよびパケットが通過する様々な要素に導入される遅延を含む。多くのファクタが終端間遅延に寄与する。終端間遅延の変動はジッタと呼ばれる。ジッタなどのファクタは通信品質の劣化につながる。デジッタバッファを実装すれば、ジッタを修正し、通信システムの全体的な品質を改善することができる。
【図面の簡単な説明】
【０００４】
【図１】アクセス端末が適応型デジッタバッファを含む、通信システムのブロック図。
【図２】デジッタバッファの一例を示す図。
【図３】一例におけるデジッタバッファ遅延を示す図。
【図４】ｉ）音声セグメントの無音部分の圧縮の例、およびｉｉ）音声セグメントの無音部分の伸長の例を示すタイミング図である。
【図５】トークスパートおよび無音期間を有する音声セグメントを示す図である。
【図６】短いセンテンスにおける無音期間の圧縮および伸長の一例を示す図である。
【図７】ＲＴＰタイムスタンプをもつ連続するパケットを示す図。
【図８Ａ】開示する方法の一例を示す図。
【図８Ｂ】開示する方法の別の例を示す図。
【図８Ｃ】開示する方法の別の例を示す図。
【図９】開示する方法および装置の一例の流れ図。
【図１０】アクセス端末（ＡＴ）が適応型デジッタバッファと無音キャラクタライザユニットとを含む、通信システムのブロック図。
【図１１】開示する方法および装置の一例を組み込んだ通信システムにおける受信機の一部分のブロック図。
【図１２】適応型デジッタバッファと無音キャラクタライザユニットとを含む、一例による通信システムを示すブロック図。
【図１３】開示する方法および装置の一例の流れ図。
【発明を実施するための形態】
【０００５】
一般に、音声は、トークスパート期間と無音期間とを有するセンテンスからなる。個々のセンテンスは無音期間によって分離され、センテンスは、無音期間によって分離された複数のトークスパートを備えることができる。センテンスは長くても短くてもよく、センテンス中（または「センテンス内」）の無音期間は、一般に、センテンスを分離している無音期間よりも短くてもよい。本明細書で使用するトークスパートは、一般に、複数のデータパケットから構成される。多くのサービスおよびアプリケーション、たとえばボイスオーバーＩＰ（ＶｏＩＰ）、ビデオ電話、対話型ゲーム、メッセージングなどでは、データはパケットに形成され、ネットワークに送られる。
【０００６】
一般に、無線通信システムでは、特に、チャネル状態、ネットワーク負荷、システムのサービス品質（ＱｏＳ）機能、異なるフローによる資源の競合が、ネットワークにおけるパケットの終端間遅延に影響を及ぼす。パケットの終端間遅延は、パケットがネットワーク中を「送信側」から「受信側」に移動するのに要する時間と定義することができる。各パケットは固有の送信元宛先間遅延を招き、その結果、一般に「ジッタ」と呼ばれる状態を生じることがある。受信側がジッタを修正することができない場合、パケットが再構築されるとき、受信されたメッセージはひずみを受けることになる。受信側に到達するパケットが一定の間隔で到着することができないとき、デジッタバッファを使用して、着信データの不規則性を調整することができる。デジッタバッファは、パケットが受けたジッタを平滑化し、受信側におけるパケット到着時間の変動を隠す。一部のシステムでは、この平滑化効果は、適応型デジッタバッファを使用して、各トークスパートの第１のパケットの再生を遅延させることによって達成される。「デジッタ遅延」は、アルゴリズムを使用して計算することができ、または、デジッタバッファ遅延の長さに等しいボイスデータを受信するのに要する時間に等しくすることができる。
【０００７】
チャネル状態、したがってジッタは変動することがあり、デジッタバッファの遅延は、トークスパートごとに変化して、これらの変化する状態に適応することができる。デジッタ遅延を適応させながら、（音声と無音の両方を表す）パケットを、ここでは「タイムワープ」と呼ばれる方法で、伸長または圧縮することができる。音声パケットをタイムワープした場合、通信の知覚されるボイス品質は影響を受けない。しかし、いくつかのシナリオでは、タイムワープを無音期間に適用した場合、ボイス品質が劣化したように見えることがある。したがって、本発明の目的は、わかりやすさに影響を及ぼすことなく、センテンス中のトークスパートの再生タイミングを変更するための方法および装置を提供することである。
【０００８】
以下の説明は、パケット化通信に適用可能であり、特にボイス通信について詳述し、こここでは、データ、またはスピーチおよび無声は、送信元（ソース）で発生し、再生のために宛先に送信される。音声通信は本議論の一適用例である。他の適用例としては、ビデオ通信、ゲーム通信、または音声通信のものと同様の特性、仕様および／または要件を有する他の通信がある。分かり易くするために、以下の議論では、これらに限定するものではないが、符号分割多元接続（ＣＤＭＡ：Code Division Multiple Access）システム、直交周波数分割多元接続（ＯＦＤＭＡ：Orthogonal Frequency Division Multiple Access）、広帯域符号分割多元接続（Ｗ−ＣＤＭＡ：Wideband Code Division Multiple Access）、広域移動体通信（ＧＳＭ:Grobal System for Mobile Communication）システム、８０２．１１（Ａ、Ｂ、Ｇ）、８０２．１６、ＷｉＭａｘなどのＩＥＥＥ規格をサポートするシステムを含む、パケットデータ通信をサポートするスペクトラム拡散通信システムについて説明する。
【０００９】
図１は、デジタル通信システム１００を示すブロック図である。２つのアクセス端末（ＡＴ）１３０および１４０が基地局（ＢＳ）１１０を介して通信する。ＡＴ１３０内では、送信処理ユニット１１２がボイスデータをエンコーダ１１４に送信し、エンコーダ１１４は、ボイスデータを符号化およびパケット化し、パケット化されたデータを下位レイヤ処理ユニット１０８に送信する。次いで、送信のために、データがＢＳ１１０に送信される。ＢＳ１１０は、受信されたデータを処理し、データをＡＴ１４０に送信し、データは下位レイヤ処理ユニット１２０において受信される。次いで、データはデジッタバッファ１２２に供給され、デジッタバッファ１２２は、ジッタの衝撃を隠すまたは減じるようにデータを格納する。データは、デジッタバッファ１２２からデコーダ１２４に送信され、さらに受信処理ユニット１２６に送信される。
【００１０】
ＡＴ１４０からの送信のために、データ／ボイスが送信処理ユニット１１６からエンコーダ１１８に供給される。下位レイヤ処理ユニット１２０は、ＢＳ１１０に送信するためのデータを処理する。ＡＴ１３０においてＢＳ１１０からのデータを受信するために、データが下位レイヤ処理ユニット１０８において受信される。次いで、データのパケットがデジッタバッファ１０６に送信され、そこでパケットは、必要とされるバッファ長または遅延に達するまで格納される。この長さまたは遅延が達成されると、デジッタバッファ１０６はデータをデコーダ１０４に送信し始める。デコーダ１０４は、パケット化されたデータをサンプリング済みボイスに変換し、それらのパケットを受信処理ユニット１０２に送信する。本例では、ＡＴ１３０の挙動はＡＴ１４０に類似している。
【００１１】
ジッタの影響を隠すために、上記のような記憶装置またはデジッタバッファがＡＴにおいて使用される。図２は、デジッタバッフの一例を示す。入来する符号化されたパケットは、バッファに蓄積され、格納される。一例では、バッファは先入れ先出し（ＦＩＦＯ）バッファであり、データは特定の順序で受信され、その同じ順序で処理される。すなわち、処理される第１のデータは受信された第１のデータである。別の例では、デジッタバッファは、次に処理すべきパケットを記録する順序付きリストである。
【００１２】
図３は、様々なシナリオにおけるパケットのための送信、受信、および再生のタイムラインを示す。第１のパケット（ＰＫＴ１）は、時間ｔ_０に送信され、時間ｔ_１に受信時に再生される。後続のパケットＰＫＴ２、ＰＫＴ３、およびＰＫＴ４は、ＰＫＴ１の後に２０ミリ秒の間隔で送信される。タイムワープがない場合、デコーダは、第１のパケットの再生時間から、一定の時間間隔（たとえば２０ミリ秒）でパケットを再生する。たとえば、デコーダが一定の２０ミリ秒の間隔でパケットを再生する場合、第１の受信されたパケットは時間ｔ_１に再生され、後続のパケットは、時間ｔ_１の２０ミリ秒後、時間ｔ_１の４０ミリ秒後、時間ｔ_１の６０ミリ秒後などに再生されることになる。図３に示すように、ＰＫＴ２の（デジッタバッファ遅延なしの）予想再生時間は、ｔ_２＝ｔ_１＋２０ミリ秒である。ここで、ＰＫＴ２は、その予想再生時間、ｔ_２の前に受信される。一方、パケット３は、その予想再生時間ｔ_３＝ｔ_２＋２０ミリ秒後に受信される。この状態はアンダーフローと呼ばれる。アンダーフローは、再生ユーティリティがパケットを再生する準備ができているが、パケットはデジッタバッファ中に存在しないときに発生する。アンダーフローは、一般に、デコーダに消去を発生させ、再生品質を劣化させる。
【００１３】
図３は、デジッタバッファが第１のパケットの再生の前に、遅延ｔ_djbを導入する、第２のシナリオをさらに示す。このシナリオでは、デジッタバッファ遅延が追加され、再生ユーティリティは２０ミリ秒ごとにパケット（またはサンプル）を受信することができる。このシナリオでは、ＰＫＴ３がその予想再生時間ｔ_３の後に受信されたとしても、デジッタバッファ遅延の追加により、ＰＫＴ３をＰＫＴ２の再生の２０ミリ秒後に再生することができる。ＰＫＴ１は、時間ｔ_０に送信され、時間ｔ_１に受信され、前のときのように時間ｔ_１に再生される代わりに、今度は時間ｔ_１＋ｔ_djb＝ｔ_１’に再生される。再生ユーティリティは、ＰＫＴ１の後に所定の間隔、たとえば２０ミリ秒で、すなわち時間ｔ_２’＝ｔ_１＋ｔ_djb＋２０＝ｔ_２＋ｔ_djbにＰＫＴ２を再生し、時間ｔ_３’＝ｔ_３＋ｔ_djbにＰＫＴ３を再生する。再生をｔ_djbだけ遅延させることにより、アンダーフローを生じることなく第３のパケットをプレイアウト（play out）することができる。したがって、図３に示すように、デジッタバッファ遅延の導入により、アンダーフローを低減し、音声品質が劣化するのを防ぐことができる。
【００１４】
一例では、デジッタバッファは、適応型バッファメモリを有し、音声タイムワープを使用して、可変遅延およびジッタを追跡するその能力を強化する。この例では、デジッタバッファの処理はデコーダの処理と調整され、デジッタバッファは、パケットをタイムワープする機会または必要を識別し、デコーダにパケットをタイムワープするよう指示する。デコーダは、デジッタバッファによって指示されたように、パケットを圧縮または伸長することによってパケットをタイムワープする。さらに、適応型デジッタバッファは、２００５年８月３０日に出願され、本開示の譲受人に譲渡された「ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＡＮＡＤＡＰＴＩＶＥＤＥ−ＪＩＴＴＥＲＢＵＦＦＥＲ」と題する同時係属の米国出願第１１／２１５，９３１号において議論されている。適応型デジッタバッファはメモリ記憶ユニットとすることができ、デジッタバッファの状態は、適応型デジッタバッファに格納されたデータの量（またはパケットの数）である。デジッタバッファによって処理されたデータは、デジッタバッファからデコーダまたは別のユーティリティに送信される。符号化されたパケットは、固定量の音声データ、たとえば、８ｋＨｚサンプリングレートでの音声データ１６０個のサンプルに対応する２０ミリ秒に対応する。
【００１５】
図４は、１つのトークスパートから他のトークスパートへのデジッタ遅延の差による「無音圧縮」および「無音伸長」の例を示す。図４において、影つき領域４２０、４２４および４２８はトークスパートを表し、影なし領域４２２および４２６は受信された情報の無音期間を表す。受信されると、トークスパート４２０は時間ｔ_１に始まり、時間ｔ_２に終了する。受信機において、デジッタバッファ遅延が導入され、したがってトークスパート４２０の再生が時間ｔ_１’に始まる。デジッタバッファ遅延は、時間ｔ_１’と時間ｔ_１との間の差として確認される。受信されると、無音期間４２２は時間ｔ_２に始まり、時間ｔ_３に終了する。無音期間４２２は、時間ｔ_２’からｔ_３’までの無音期間４３２として圧縮及び再生され、これは、受信された無音期間４２２の元の持続時間よりも小さい。トークスパート４２４は、時間ｔ_３に始まり、ソースで時間ｔ_４に終了する。トークスパート４２４は、受信機において時間ｔ_３’から時間ｔ_４’まで再生される。無音期間４２６（時間ｔ_４〜ｔ_５）は、受信機において再生時に無音期間４３６として伸長され、（ｔ_５’−ｔ_４’）は（ｔ_５−ｔ_４）よりも大きい。無音期間は、デジッタバッファがパケットをすぐに再生する必要があるときは圧縮され、デジッタバッファがパケットの再生を遅延させる必要があるときは伸長される。
【００１６】
無音期間がわずか数個のフレームからなる場合、たとえば無音期間がセンテンス内で発生したとき、ボイス品質は無音期間の伸長または圧縮によって影響されることがある。図５は、複数のワードセンテンス、たとえば「ＰＲＥＳＳＴＨＥＰＡＮＴＳ．」のための無音フレームおよび音声フレームの分解を示す。図５では、「Ａ」はアクティブな音声を示し、「Ｓ」は無音を示す。ここで、トークスパート間の無音の長さは、音声部分の長さと比較して短い。無音期間の長さを圧縮または伸長した場合、センテンスが加速または減速されたように見えることがある。これをさらに図６に示す。わずか１つの語からなるセンテンス「ＣＨＩＮＡ」が示されている。「ＣＨＩ」と「ＮＡ」の間に無音期間が発生し、無音期間は元は送信機において４０ミリ秒であったと仮定する。ここで、無音が受信機において２０ミリ秒に圧縮された場合、「Ｉ」の音はひずみ、その結果、語が見かけ上「ＣＨ−ＮＡ」に加速されることになる。一方、無音期間が８０ミリ秒に伸長された場合、「Ｉ」の音は過度に強調されたように見え、その結果、センテンスがひずむか、または見かけ上、たとえば「ＣＨ−Ｉ−Ｉ−Ｉ−Ｉ−Ｉ−ＮＡ」に減速されることになる。そのようなひずみの結果、全体的なボイス品質の知覚される劣化が生じる。
【００１７】
短い無音期間の伸長または圧縮の結果、劣化が生じるので、送信された無音期間の長さが受信機において維持される。１つのシナリオでは、図５および図６に示す無音期間など、センテンス内無音期間が検出されたときに、送信された無音の長さを判断し、次いで受信機において維持する。したがって、本開示の１つの目的は、センテンス中またはセンテンス内で無音が発生するときを判断することである。一例では、１つのセンテンスの終了の検出に基づいて複数のセンテンスを互いに区別することができる。センテンスの終了が検出されたとき、センテンスの終了の前に発生する無音期間がセンテンス内で発生し、圧縮も伸長もされないと判断される。一定数の連続する無音パケットが検出された場合、センテンスは終わったと判断される。たとえば、センテンスの終了を示す連続する無音パケットの数は１０に等しいとすることができる。別の例では、送信された無音期間の長さが特定の量、たとえば２００ミリ秒よりも短いと判断された場合、無音期間はセンテンス内で発生すると仮定することができる。このシナリオでは、検出された無音の長さが２００ミリ秒である場合、２００ミリ秒の無音期間が受信機において維持される。無音の圧縮も伸長も適応型デジッタバッファによって実行されない。一例では、無音時間の検出された長さが２００ミリ秒よりも短い場合、またはセンテンスの終了時に、無音圧縮または無音伸長のトリガを無効化することができる。対照的に、センテンスの間（「センテンス間」）で無音が検出されたとき、デジッタバッファは正常に作動し、これらの間隔中に検出された無音パケットを圧縮または伸長する。
【００１８】
本開示の別の態様では、トークスパートの最後のパケットと次のトークスパートの第１のパケットとの間のＲＴＰタイムスタンプの差を使用して、トークスパート間の無音期間の長さを計算することができる。リアルタイムトランスポートプロトコル（ＲＴＰ）パケットのシーケンス番号（ＳＮ）は、送信されたパケットごとに１つ増分する。ＳＮは、パケットシーケンスを復元し、パケット損失を検出するために受信機が使用する。タイムスタンプ（ＴＳ）は、ＲＴＰデータパケット中の第１のオクテットのサンプリングインスタントを反映することができる。サンプリングインスタントは、時間的に単調かつ線形に増分するクロックから得られる。音声を処理する適用例では、ＴＳを、各音声パケット中のサンプルの数に対応する定数デルタだけ増分することができる。たとえば、入力デバイスが、１６０個のサンプリング間隔を有する音声パケットを受信し、したがってＴＳはパケットごとに１６０だけ増分される。
【００１９】
図７は、連続するＳＮおよび１６０ずつ増分するＴＳをもつストリーム中の一連のパケットを示す。ＴＳ増分は、パケットが音声セグメントを搬送するか無音セグメントを表すかにかかわらず、同じ、すなわち１６０である。たとえば、８ｋＨｚのサンプリングレートをもつ２０ミリ秒のフレームを発生するＥＶＲＣのようなボコーダの場合、ＲＴＰＴＳは、連続するパケットに対して２０ミリ秒ごとに１６０だけ増分する（８０００×０．０２＝１６０個のサンプル）。図７に示すように、第１のパケットのＲＴＰＴＳは１６０、第２のパケットのＲＴＰＴＳは３２０、第３のパケットのＲＴＰＴＳは４８０、などである。一例を使用して、トークスパート間の無音期間の長さの決定を説明することができる。トークスパートの最後のフレームのＲＴＰタイムスタンプは３０００であり、次のトークスパートの第１のフレームのＲＴＰタイムスタンプは３６４０であると仮定する。したがって、ＲＴＰＴＳの差（ΔＲＴＰ）は３６４０−３０００＝６４０となる。さらに、６４０は、８ｋＨｚの２０ミリ秒フレームの場合、長さ２０×（６４０／１６０）すなわち８０ミリ秒の無音期間に対応する。
【００２０】
別の例では、無音の長さがあまりに厳しく維持される場合、デジッタバッファの動作から自由度を取り除くことができる。デジッタバッファの目標は、ジッタを修正するために最適な遅延を導入することである。この遅延は、チャネル状態の変化とともに、フレーム誤り率などのファクタを考慮して更新される。無音の長さが厳しく維持され、デジッタバッファがセンテンス間にしか適応しないように設計されている場合、非効率がもたらされることがある。たとえば、いくつかの最初のチャネル状態の間、デジッタバッファのセンテンス間適合は十分であることある。しかしながら、ジッタ状態の急激な変化の結果、一層短いセンテンスの間に適応する必要が生じることがある。この機能が無効化された場合、デジッタバッファは、全体的に変化するジッタ状態に十分迅速に適応することができなくなる。
【００２１】
ボイス品質の完全性を維持しながら必要な自由度でデジッタバッファを作動させるために、開示する本発明の一例は、センテンス内に発生するトークスパートの間に無音長を粗く維持することを目的とする。この目的を達成するために、チャネル状態やユーザ入力などに基づくアルゴリズムを使用して計算された量によってセンテンス内無音長を調整することができる。得られる無音の長さは、調整されてはいるが、ボイスソースの元の無音の長さに近似する。調整された無音の長さを決定する際、無音圧縮および無音伸長の効果を考慮に入れる。いくつかのシナリオでは、たとえば、無音圧縮が無音伸長よりも顕著であり、したがって伸長のみをトリガすることができる。考慮に入れる別のファクタは、元の無音の長さである。たとえば、ボイスソースにおける元の無音が比較的長くなると、調整量の柔軟性が増す。たとえば、元の無音の長さが２０ミリ秒である場合、受信機における無音の４０ミリ秒の伸長は顕著になる。一方、元の無音の長さが１００ミリ秒である場合、受信機における無音の４０ミリ秒の伸長はあまり顕著にならない。ボイスソースにおける元の無音の長さがＸ秒であると仮定すると、本開示の一例は、次の無音間隔を維持する。
【数１】

【００２２】
本一例によれば、受信された各センテンスの第１のトークスパートについて、第１のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。各センテンスの後続のトークスパートについて、第１のパケットの再生は、以下のアルゴリズムの例に従って遅延される。
【００２３】
arrival_timeを第１のパケットの到着時間とする。depth_playout_timeを、第１のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第１のパケットがプレイアウトされているであろう時間とする。また、spacing_playout_time(n)を、第１パケットが前のトークスパートの終了とともに間隔ｎを維持した場合に第１のパケットがプレイアウトされているであろう時間とする。Ｘを、前のトークスパートの最後のパケットと現在のパケットとの間の実際の間隔とする。actual_delayを、パケットがプレイアウトされる時間とする。すると、次のようになる。
【数２】

【００２４】
これらの状態を図８Ａ〜図８Ｃに示す。図８Ａでは、センテンスの第１のトークスパートの第１のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。センテンスの次のトークスパートについて、次のトークスパートの第１のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第１のパケットがプレイアウトされているであろう時間が、第１のパケットが前のトークスパートの終了とともに間隔（Ｘ−ａ）を維持した場合に第１のパケットがプレイアウトされているであろう時間よりも小さい場合、パケットがプレイアウトされる時間は（Ｘ−ａ）の値に等しい。
【００２５】
図８Ｂでは、センテンスの第１のトークスパートの第１のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。センテンスの次のトークスパートについて、次のトークスパートの第１のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第１のパケットがプレイアウトされているであろう時間が、第１のパケットが前のトークスパートの終了とともに間隔（Ｘ−ａ）を維持した場合に第１のパケットがプレイアウトされているであろう時間よりも大きいかまたは等しい場合、および、次のトークスパートの第１のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第１のパケットがプレイアウトされているであろう時間が、第１のパケットが間隔（Ｘ＋ｂ）を維持した場合に第１のパケットがプレイアウトされているであろう時間よりも小さいかまたは等しい場合、パケットがプレイアウトされる時間は、第１のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第１のパケットがプレイアウトされているであろう時間の値に等しい。
【００２６】
図８Ｃでは、センテンスの第１のトークスパートの第１のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。センテンスの次のトークスパートについて、次のトークスパートの第１のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第１のパケットがプレイアウトされているであろう時間が、第１のパケットが前のトークスパートの終了とともに間隔（Ｘ＋ｂ）を維持した場合に第１のパケットがプレイアウトされているであろう時間よりも大きい場合、パケットがプレイアウトされる時間は、次のトークスパートの第１のパケットの到着時間または（Ｘ＋ｂ）の大きい方に等しい。
【００２７】
上記の方法をさらに図９の流れ図に示す。ブロック９００において、無音期間がセンテンス中で発生しているかどうかを決定する。無音期間が発生していない場合、プロセスはブロック９００に戻る。無音期間がセンテンス中で発生している場合、プロセスはブロック９１０に進み、depth_playout_timeがspacing_playout_time(X-a)よりも小さいかどうかを決定する。そうである場合、ブロック９７０において、無音に適用される実際の遅延は（Ｘ−ａ）の値に等しい。そうでない場合、プロセスは９２０に進み、depth_playout_timeがspacing_playout_time(X+b)よりも大きいかまたはそれに等しいかどうかを決定する。そうである場合、プロセスはブロック９４０に進み、無音に適用される実際の遅延はdepth_playout_timeの値に等しい。プロセスはブロック９８０において終了する。次にブロック９２０に戻り、depth_playout_timeがspacing_playout_time(X+b)よりも大きくないかまたはそれに等しくないと判断された場合、無音に適用される実際の遅延はarrival_timeおよびspacing_playout_time(X+b)のうち大きな方に等しい。プロセスはブロック９８０において終了する。
【００２８】
図１０は、ネットワークエレメント、ここではＢＳ１０１０を通じて通信する２つの端末、ＡＴ１０３０、１０４０を含むシステムのブロック図である。ＡＴ１０３０において、送信処理ユニット１０１２は音声データをエンコーダ１０１４に送信し、エンコーダ１０１４は音声データをデジタル化し、パケット化されたデータを下位レイヤ処理ユニット１００８に送信する。次いで、パケットはＢＳ１０１０に送信される。ＡＴ１０３０がＢＳ１０１０からデータを受信すると、データはまず下位レイヤ処理ユニット１００８において処理されて、そこからデータのパケットが適応型デジッタバッファ１００６に供給される。無音は、たとえば無音キャラクタライザ１００５において、デジッタバッファ内または別個のモジュールの一部として、センテンス間またはセンテンス内として特徴づけることができる。一例では、無音キャラクタライザ１００５は、無音期間がセンテンス内で発生するのかセンテンス間で発生するのかを決定する。無音がセンテンス間で発生した場合、たとえば、２００５年８月３０日に出願され、本開示の譲受人に譲渡される同時係属の出願第１１／２１５，９３１号「ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＡＮＡＤＡＰＴＩＶＥＤＥ−ＪＩＴＴＥＲＢＵＦＦＥＲ」に開示されているように、無音期間を伸長または圧縮することができる。ＡＴ１０３０の挙動はＡＴ１０４０の挙動と同様である。ＡＴ１０４０は、データを送信処理ユニット１０１６からエンコーダ１０１８、下位レイヤ処理ユニット１０２０、最後にＢＳ１０１０への経路上で送信する。ＡＴ１０４０は、データを下位レイヤ処理ユニット１０２０から適応型デジッタバッファ１０２２および無音キャラクタライザ１０２１、デコーダ１０２４、受信処理ユニット１０２６への経路上で受信する。さらなる処理は、図示されていないが、ボイスなどのデータの再生に影響を及ぼし、オーディオ処理や画面表示などを含む。
【００２９】
図１１は、開示する本発明の一例を組み込んだ通信システムにおける受信機の一部分のブロック図である。物理レイヤ処理ユニット１１０４はデータスタック１１０６にデータを供給する。データスタック１１０６はデジッタバッファおよび制御ユニット１１０８にパケットを出力する。無音キャラクタライザ１１１０は、検出された無音期間がセンテンス内で発生するのかセンテンス間で発生するのかを決定する。無音がセンテンス内で発生した場合、デジッタバッファは、本発明の例に開示されているように無音を維持する。順方向リンク（ＦＬ）媒体アクセス制御（ＭＡＣ）処理ユニット１１０２はハンドオフインジケータをデジッタバッファおよび制御ユニット１１０８に供給する。ＭＡＣレイヤは、物理レイヤ上で、すなわちオーバージエア（over the air）でデータを受信および送信するためのプロトコルを実装する。ＭＡＣレイヤは、セキュリティ、暗号化、認証、および接続情報を含む。ＩＳ−８５６をサポートするシステムでは、ＭＡＣレイヤは、制御チャネル、アクセスチャネル、ならびに順方向および逆方向トラフィックチャネルを統制する規則を含む。
【００３０】
無音間隔中、パケットは適応型デジッタバッファおよび制御ユニット１１０８から不連続送信（ＤＴＸ）ユニット１１１２に送信され、ＤＴＸユニット１１１２は背景雑音情報をデコーダ１１１４に供給する。デジッタバッファおよび制御ユニット１１０８によって供給されたパケットは、デコード処理の準備ができており、ボコーダパケットと呼ぶことができる。デコーダ１１１４はパケットをデコードする。本開示の別の態様では、２００５年８月３０日に出願され、本開示の譲受人に譲渡される同時係属の出願第１１／２１５，９３１号「ＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＡＮＡＤＡＰＴＩＶＥＤＥ−ＪＩＴＴＥＲＢＵＦＦＥＲ」に開示されているように、タイムワーピングユニットが音声パケットをタイムワープすることができる。パルス符号変調（ＰＣＭ）音声サンプルがデコーダ１１１４からタイムワーピングユニット１１１６に供給される。タイムワーピングユニット１１１６はデジッタバッファおよび制御ユニット１１０８からタイムワーピングインジケータを受信する。インジケータは、上述の特許出願に開示されているように、音声パケットの伸長、圧縮、またはワーピングなしを示すことができる。
【００３１】
図１２は、適応型デジッタバッファ１２０４と無音キャラクタライザユニット１２２４とを含む、一例によるアクセス端末（ＡＴ）を示すブロック図である。一例では、デジッタバッファは、図１２に示すように無音キャラクタライザユニット１２２４を含む。別の例では、デジッタバッファ１２０４および無音キャラクタライザユニット１２２４は別個の要素である。デジッタバッファ１２０４、タイムワープ制御ユニット１２１８、受信回路１２１４、無音キャラクタライザユニット１２２４、制御プロセッサ１２２２、メモリ１２０８、送信回路１２１０、デコーダ１２０６、Ｈ−ＡＲＱ制御１２２０、エンコーダ１２１６、音声処理１２２８、誤り訂正１２０２は、前の例に示すように一緒に結合できる。さらに、それらは、図１２に示すコミュニケーションバス１２１２を介して一緒に結合できる。
【００３２】
上記の図９の方法は、図１３に示す対応するミーンズプラスファンクションブロックによって実行できる。言い換えれば、図９に示すブロック９００〜９８０は、図１３に示すミーンズプラスファンクションブロック１３００〜１３８０に対応する。
【００３３】
本明細書は本発明の特定の例を記載しているが、当業者は、発明の概念を逸脱することなく本発明の変形物を考案することができる。たとえば、本明細書における教示は、回路交換ネットワーク要素に関するが、パケット交換ドメインネットワーク要素にも等しく適用できる。また、本明細書における教示は、認証トリプレット対に限定されず、２つのＳＲＥＳ値（慣習的なフォーマットの１つおよび本明細書で開示するより新規のフォーマットの１つ）を含む単一のトリプレットの使用にも適用できる。
【００３４】
情報および信号は、様々な異なる技術および技法のいずれを使用しても表現できることを、当業者にはいうまでもない。たとえば、上記の説明の全体にわたって言及されるデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表現できる。
【００３５】
さらに、本明細書で開示した例に関連して説明した様々な例示的な論理ブロック、モジュール、回路、方法およびアルゴリズムは、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実施できることを、当業者は理解されよう。ハードウェアとソフトウェアのこの互換性を明確に説明するために、様々な例示的な構成部分、ブロック、モジュール、回路、方法、およびアルゴリズムについて、概してそれらの機能に関して上記で説明した。そのような機能をハードウェアで実装するかソフトウェアで実装するかは、システム全体に課せられた特定の適用および設計上の制約に依存する。当業者は、記載した機能を各特定の適用例ごとに異なる方法で実装することができるが、そのような実装の決定は、本発明の範囲からの逸脱を生じるものと解釈すべきではない。
【００３６】
本明細書で開示した例に関連して説明した様々な例示的な論理ブロック、モジュール、および回路は、本明細書で説明した機能を実施するように設計された、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、または他のプログラマブル論理デバイス、個別のゲートまたはトランジスタ論理、個別のハードウェア構成要素、あるいはそれらの任意の組合せで実装または実施できる。汎用プロセッサはマイクロプロセッサとすることができるが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることができる。プロセッサは、コンピューティングデバイスの組合せとして、たとえば、ＤＳＰとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいはそのような他の任意の構成として実施できる。
【００３７】
本明細書で開示した例に関して説明した方法またはアルゴリズムは、直接ハードウェアで、プロセッサによって実行されるソフトウェアモジュールで、またはその２つの組合せで実施できる。ソフトウェアモジュールは、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、リムーバブルディスク、ＣＤ−ＲＯＭ、または当技術分野で知られている他の任意の形態の記憶媒体中に常駐することができる。記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合できる。代替として、記憶媒体はプロセッサに一体化することができる。プロセッサおよび記憶媒体はＡＳＩＣ中に常駐することができる。
【００３８】
１つまたは複数の例示的な実施形態では、記載した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装できる。ソフトウェアで実施した場合、機能は１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶でき、あるいはコンピュータ可読媒体を介して送信できる。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体と通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスできる任意の使用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶装置、または、命令もしくはデータ構造の形態の所望のプログラムコードを運搬または記憶するために使用でき、コンピュータによってアクセスできる他の任意の媒体を備えることができる。また、いかなる接続も正確にはコンピュータ可読媒体と呼ばれる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などの無線技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などの無線技術は、媒体の定義に含まれる。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイディスク（disc）を含み、この場合、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）はデータをレーザで光学的に再生する。上記のものの組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
【００３９】
開示した例の前述の説明は、当業者が本発明を製作または使用できるように与えられている。これらの例の様々な変更形態は、当業者には容易に明らかになるものであり、本明細書で定義した一般原理は、本開示の趣旨または範囲から逸脱することなく他の変形形態に適用できる。したがって、本開示は、本明細書で示した例に限定されるものではなく、本明細書で開示した原理および新規の特徴と合致する最も広い範囲が与えられるべきである。

【特許請求の範囲】
【請求項１】
複数のパケットを受信することと、
前記受信された複数のパケットを記憶することと、
前記受信された複数のパケットに関連する少なくとも１つの無音期間の長さを決定することと、
前記少なくとも１つの無音期間の前記決定された長さに基づいて、前記記憶された複数のパケットの一部分を送信する時間を決定することと、
を含む方法。
【請求項２】
前記受信された複数のパケットは適応型デジッタバッファに記憶される、請求項１記載の方法。
【請求項３】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定すること、
をさらに含む請求項２記載の方法。
【請求項４】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定することは、受信された無音パケットの最大連続数が、特定の数よりも小さいかどうかを決定すること、
をさらに含む請求項３記載の方法。
【請求項５】
前記数が１０に等しい、請求項４記載の方法。
【請求項６】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定することは、前記受信された複数のパケットに関連する前記少なくとも１つの無音期間の最大長が、特定の時間フレームよりも短いかどうかを決定すること、
をさらに含む請求項３記載の方法。
【請求項７】
前記受信された複数のパケットがセンテンス中で発生する場合、送信された無音期間の元の長さを維持するようにデジッタバッファを適応させることと、
前記維持された長さで前記記憶された複数のパケットの前記一部分を送信することと、
をさらに含む請求項３記載の方法。
【請求項８】
前記維持された無音の長さが［Ｘ−ａ，Ｘ＋ｂ］である、請求項７記載の方法。
【請求項９】
［Ｘ−ａ，Ｘ＋ｂ］が、前記送信された無音期間の元の長さに比例する、請求項８記載の方法。
【請求項１０】
前記デジッタバッファを適応させることは、
デジッタバッファ遅延を決定することと、
前記記憶された複数のパケットの第１の部分を前記デジッタバッファ遅延に等しい時間に送信することと、
前記記憶された複数のパケットの第２部分を前記値［Ｘ−ａ，Ｘ＋ｂ］に基づいて計算された時間に送信することと、
をさらに含む請求項８記載の方法。
【請求項１１】
前記デジッタバッファ遅延が（Ｘ−ａ）に対応する時間よりも小さい場合、前記記憶された複数のパケットの前記第２部分を（Ｘ−ａ）に対応する時間に送信すること、
をさらに含む請求項１０記載の方法。
【請求項１２】
前記デジッタバッファ遅延が（Ｘ−ａ）に対応する時間よりも大きいかまたはそれに等しく、かつ、前記デジッタバッフ遅延が（Ｘ＋ｂ）に対応する時間よりも小さいかこれに等しい場合、前記記憶された複数のパケットの前記第２の部分を前記デジッタバッファ遅延に対応する時間に送信すること、
をさらに含む請求項１０記載の方法。
【請求項１３】
前記デジッタバッファ遅延が（Ｘ＋ｂ）に対応する時間よりも大きい場合、前記記憶された複数のパケットの前記第２の部分を、到着時間に対応する時間または（Ｘ＋ｂ）に対応する時間の大きい方に等しい時間に送信すること、
をさらに含む請求項１０記載の方法。
【請求項１４】
複数のパケットを受信する受信機と、
前記受信された複数のパケットを記憶するデジッタバッファと、
前記記憶された複数のパケットに関連する少なくとも１つの無音期間の長さと、前記少なくとも１つの無音期間の前記決定された長さに基づいて前記記憶された複数のパケットの一部分を送信する時間と、を決定する無音キャラクタライザユニットと、
を備える装置。
【請求項１５】
複数のパケットを受信する手段と、
前記受信された複数のパケットを記憶する手段と、
前記受信された複数のパケットに関連する少なくとも１つの無音期間の長さを決定する手段と、
前記少なくとも１つの無音期間の前記決定された長さに基づいて前記記憶された複数のパケットの一部分を送信する時間を決定する手段と、
を備える装置。
【請求項１６】
前記受信された複数のパケットを記憶する前記手段は、適応型デジッタバッファを含む請求項１５記載の装置。
【請求項１７】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定する手段、
をさらに備える請求項１５記載の装置。
【請求項１８】
前記決定する手段がデジッタバッファ手段を含む請求項１７記載の装置。
【請求項１９】
前記デジッタバッファ手段がキャラクタライザ手段をさらに含む請求項１８記載の装置。
【請求項２０】
コンピュータに、第１の複数のパケットおよび第２の複数のパケットを受信させるためのコードと、
前記コンピュータに、前記受信された複数のパケットを記憶させるためのコードと、
前記コンピュータに、前記受信された複数のパケットに関連する少なくとも１つの無音期間の長さを決定させるためのコードと、
前記コンピュータに、前記少なくとも１つの無音期間の前記決定された長さに基づいて前記記憶された複数のパケットの一部分を送信する時間を決定させるコードと、
を備えたコンピュータ可読媒体を含むコンピュータプログラム製品。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８Ａ】

【図８Ｂ】

【図８Ｃ】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【公表番号】特表２０１０−５３０６５３（Ｐ２０１０−５３０６５３Ａ）
【公表日】平成２２年９月９日（２０１０．９．９）
【国際特許分類】

電気 (1,674,590)
- 電気通信技術 (544,871)
  - デジタル情報の伝送，例．電信通信 (61,356)
  - 電話通信 (58,612)
    - サブステーション装置，例．加入者が使用するもの (30,275)
    - 他の電気システムとの結合のために特に適合した電話通信方式 (13,904)

【出願番号】特願２０１０−５０６４８１（Ｐ２０１０−５０６４８１）
【出願日】平成２０年４月２３日（２００８．４．２３）
【国際出願番号】ＰＣＴ／ＵＳ２００８／０６１３４８
【国際公開番号】ＷＯ２００８／１３４３８４
【国際公開日】平成２０年１１月６日（２００８．１１．６）
【公序良俗違反の表示】
（特許庁注：以下のものは登録商標）
１．ＧＳＭ
【出願人】（５９５０２０６４３）クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】ＱＵＡＬＣＯＭＭ　ＩＮＣＯＲＰＯＲＡＴＥＤ
【Ｆターム（参考）】

[ Back to top ]

わかりやすさに影響を及ぼすことなくセンテンス内のトークスパートの再生タイミングを変更するための方法および装置

メニュー

スポンサーリンク

次の公報 »

« 前の公報

わかりやすさに影響を及ぼすことなくセンテンス内のトークスパートの再生タイミングを変更するための方法および装置

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク