説明

わかりやすさに影響を及ぼすことなくセンテンス内のトークスパートの再生タイミングを変更するための方法および装置

パケット交換通信のためのボイスオーバーIP(VoIP)のための適応型デジッタバッファ。提示したデジッタバッファ方法および装置は、通信システムにおけるボイス品質を最適化するために、無音期間がセンテンス間で検出されたのか、センテンス内で検出されたのかに応じてパケットの再生を変更する。一例では、デジッタバッファは、複数の受信パケットに関連する少なくとも1つの無音期間の長さを決定し、該無音期間の該決定された長さに基づいて該複数のパケットの一部分を送信する時間を決定する。別の例では、無音キャラクタライザユニットがこの機能を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、無線通信システムに関し、詳細には、パケット交換通信のためのVoIP(Voice over Internet Protocol)のための適応型デジッタ(de-jitter)バッファにおけるパケットの再生に関する。
【背景技術】
【0002】
通信システムでは、パケットの終端間遅延は、ソースにおけるその生成から、パケットがその宛先に到達するまでの時間と定義される。パケット交換通信システムでは、パケットがソースから宛先まで移動するための遅延は、これに限定するものではないが、チャネル状態およびネットワーク負荷を含む、様々な動作条件に応じて変化する。チャネル状態は無線リンクの品質に関係する。
【0003】
パケットの終端間遅延は、ネットワークおよびパケットが通過する様々な要素に導入される遅延を含む。多くのファクタが終端間遅延に寄与する。終端間遅延の変動はジッタと呼ばれる。ジッタなどのファクタは通信品質の劣化につながる。デジッタバッファを実装すれば、ジッタを修正し、通信システムの全体的な品質を改善することができる。
【図面の簡単な説明】
【0004】
【図1】アクセス端末が適応型デジッタバッファを含む、通信システムのブロック図。
【図2】デジッタバッファの一例を示す図。
【図3】一例におけるデジッタバッファ遅延を示す図。
【図4】i)音声セグメントの無音部分の圧縮の例、およびii)音声セグメントの無音部分の伸長の例を示すタイミング図である。
【図5】トークスパートおよび無音期間を有する音声セグメントを示す図である。
【図6】短いセンテンスにおける無音期間の圧縮および伸長の一例を示す図である。
【図7】RTPタイムスタンプをもつ連続するパケットを示す図。
【図8A】開示する方法の一例を示す図。
【図8B】開示する方法の別の例を示す図。
【図8C】開示する方法の別の例を示す図。
【図9】開示する方法および装置の一例の流れ図。
【図10】アクセス端末(AT)が適応型デジッタバッファと無音キャラクタライザユニットとを含む、通信システムのブロック図。
【図11】開示する方法および装置の一例を組み込んだ通信システムにおける受信機の一部分のブロック図。
【図12】適応型デジッタバッファと無音キャラクタライザユニットとを含む、一例による通信システムを示すブロック図。
【図13】開示する方法および装置の一例の流れ図。
【発明を実施するための形態】
【0005】
一般に、音声は、トークスパート期間と無音期間とを有するセンテンスからなる。個々のセンテンスは無音期間によって分離され、センテンスは、無音期間によって分離された複数のトークスパートを備えることができる。センテンスは長くても短くてもよく、センテンス中(または「センテンス内」)の無音期間は、一般に、センテンスを分離している無音期間よりも短くてもよい。本明細書で使用するトークスパートは、一般に、複数のデータパケットから構成される。多くのサービスおよびアプリケーション、たとえばボイスオーバーIP(VoIP)、ビデオ電話、対話型ゲーム、メッセージングなどでは、データはパケットに形成され、ネットワークに送られる。
【0006】
一般に、無線通信システムでは、特に、チャネル状態、ネットワーク負荷、システムのサービス品質(QoS)機能、異なるフローによる資源の競合が、ネットワークにおけるパケットの終端間遅延に影響を及ぼす。パケットの終端間遅延は、パケットがネットワーク中を「送信側」から「受信側」に移動するのに要する時間と定義することができる。各パケットは固有の送信元宛先間遅延を招き、その結果、一般に「ジッタ」と呼ばれる状態を生じることがある。受信側がジッタを修正することができない場合、パケットが再構築されるとき、受信されたメッセージはひずみを受けることになる。受信側に到達するパケットが一定の間隔で到着することができないとき、デジッタバッファを使用して、着信データの不規則性を調整することができる。デジッタバッファは、パケットが受けたジッタを平滑化し、受信側におけるパケット到着時間の変動を隠す。一部のシステムでは、この平滑化効果は、適応型デジッタバッファを使用して、各トークスパートの第1のパケットの再生を遅延させることによって達成される。「デジッタ遅延」は、アルゴリズムを使用して計算することができ、または、デジッタバッファ遅延の長さに等しいボイスデータを受信するのに要する時間に等しくすることができる。
【0007】
チャネル状態、したがってジッタは変動することがあり、デジッタバッファの遅延は、トークスパートごとに変化して、これらの変化する状態に適応することができる。デジッタ遅延を適応させながら、(音声と無音の両方を表す)パケットを、ここでは「タイムワープ」と呼ばれる方法で、伸長または圧縮することができる。音声パケットをタイムワープした場合、通信の知覚されるボイス品質は影響を受けない。しかし、いくつかのシナリオでは、タイムワープを無音期間に適用した場合、ボイス品質が劣化したように見えることがある。したがって、本発明の目的は、わかりやすさに影響を及ぼすことなく、センテンス中のトークスパートの再生タイミングを変更するための方法および装置を提供することである。
【0008】
以下の説明は、パケット化通信に適用可能であり、特にボイス通信について詳述し、こここでは、データ、またはスピーチおよび無声は、送信元(ソース)で発生し、再生のために宛先に送信される。音声通信は本議論の一適用例である。他の適用例としては、ビデオ通信、ゲーム通信、または音声通信のものと同様の特性、仕様および/または要件を有する他の通信がある。分かり易くするために、以下の議論では、これらに限定するものではないが、符号分割多元接続(CDMA:Code Division Multiple Access)システム、直交周波数分割多元接続(OFDMA:Orthogonal Frequency Division Multiple Access)、広帯域符号分割多元接続(W−CDMA:Wideband Code Division Multiple Access)、広域移動体通信(GSM:Grobal System for Mobile Communication)システム、802.11(A、B、G)、802.16、WiMaxなどのIEEE規格をサポートするシステムを含む、パケットデータ通信をサポートするスペクトラム拡散通信システムについて説明する。
【0009】
図1は、デジタル通信システム100を示すブロック図である。2つのアクセス端末(AT)130および140が基地局(BS)110を介して通信する。AT130内では、送信処理ユニット112がボイスデータをエンコーダ114に送信し、エンコーダ114は、ボイスデータを符号化およびパケット化し、パケット化されたデータを下位レイヤ処理ユニット108に送信する。次いで、送信のために、データがBS110に送信される。BS110は、受信されたデータを処理し、データをAT140に送信し、データは下位レイヤ処理ユニット120において受信される。次いで、データはデジッタバッファ122に供給され、デジッタバッファ122は、ジッタの衝撃を隠すまたは減じるようにデータを格納する。データは、デジッタバッファ122からデコーダ124に送信され、さらに受信処理ユニット126に送信される。
【0010】
AT140からの送信のために、データ/ボイスが送信処理ユニット116からエンコーダ118に供給される。下位レイヤ処理ユニット120は、BS110に送信するためのデータを処理する。AT130においてBS110からのデータを受信するために、データが下位レイヤ処理ユニット108において受信される。次いで、データのパケットがデジッタバッファ106に送信され、そこでパケットは、必要とされるバッファ長または遅延に達するまで格納される。この長さまたは遅延が達成されると、デジッタバッファ106はデータをデコーダ104に送信し始める。デコーダ104は、パケット化されたデータをサンプリング済みボイスに変換し、それらのパケットを受信処理ユニット102に送信する。本例では、AT130の挙動はAT140に類似している。
【0011】
ジッタの影響を隠すために、上記のような記憶装置またはデジッタバッファがATにおいて使用される。図2は、デジッタバッフの一例を示す。入来する符号化されたパケットは、バッファに蓄積され、格納される。一例では、バッファは先入れ先出し(FIFO)バッファであり、データは特定の順序で受信され、その同じ順序で処理される。すなわち、処理される第1のデータは受信された第1のデータである。別の例では、デジッタバッファは、次に処理すべきパケットを記録する順序付きリストである。
【0012】
図3は、様々なシナリオにおけるパケットのための送信、受信、および再生のタイムラインを示す。第1のパケット(PKT1)は、時間tに送信され、時間tに受信時に再生される。後続のパケットPKT2、PKT3、およびPKT4は、PKT1の後に20ミリ秒の間隔で送信される。タイムワープがない場合、デコーダは、第1のパケットの再生時間から、一定の時間間隔(たとえば20ミリ秒)でパケットを再生する。たとえば、デコーダが一定の20ミリ秒の間隔でパケットを再生する場合、第1の受信されたパケットは時間tに再生され、後続のパケットは、時間tの20ミリ秒後、時間tの40ミリ秒後、時間tの60ミリ秒後などに再生されることになる。図3に示すように、PKT2の(デジッタバッファ遅延なしの)予想再生時間は、t=t+20ミリ秒である。ここで、PKT2は、その予想再生時間、tの前に受信される。一方、パケット3は、その予想再生時間t=t+20ミリ秒後に受信される。この状態はアンダーフローと呼ばれる。アンダーフローは、再生ユーティリティがパケットを再生する準備ができているが、パケットはデジッタバッファ中に存在しないときに発生する。アンダーフローは、一般に、デコーダに消去を発生させ、再生品質を劣化させる。
【0013】
図3は、デジッタバッファが第1のパケットの再生の前に、遅延tdjbを導入する、第2のシナリオをさらに示す。このシナリオでは、デジッタバッファ遅延が追加され、再生ユーティリティは20ミリ秒ごとにパケット(またはサンプル)を受信することができる。このシナリオでは、PKT3がその予想再生時間tの後に受信されたとしても、デジッタバッファ遅延の追加により、PKT3をPKT2の再生の20ミリ秒後に再生することができる。PKT1は、時間tに送信され、時間tに受信され、前のときのように時間tに再生される代わりに、今度は時間t+tdjb=t’に再生される。再生ユーティリティは、PKT1の後に所定の間隔、たとえば20ミリ秒で、すなわち時間t’=t+tdjb+20=t+tdjbにPKT2を再生し、時間t’=t+tdjbにPKT3を再生する。再生をtdjbだけ遅延させることにより、アンダーフローを生じることなく第3のパケットをプレイアウト(play out)することができる。したがって、図3に示すように、デジッタバッファ遅延の導入により、アンダーフローを低減し、音声品質が劣化するのを防ぐことができる。
【0014】
一例では、デジッタバッファは、適応型バッファメモリを有し、音声タイムワープを使用して、可変遅延およびジッタを追跡するその能力を強化する。この例では、デジッタバッファの処理はデコーダの処理と調整され、デジッタバッファは、パケットをタイムワープする機会または必要を識別し、デコーダにパケットをタイムワープするよう指示する。デコーダは、デジッタバッファによって指示されたように、パケットを圧縮または伸長することによってパケットをタイムワープする。さらに、適応型デジッタバッファは、2005年8月30日に出願され、本開示の譲受人に譲渡された「METHOD AND APPARATUS FOR AN ADAPTIVE DE−JITTER BUFFER」と題する同時係属の米国出願第11/215,931号において議論されている。適応型デジッタバッファはメモリ記憶ユニットとすることができ、デジッタバッファの状態は、適応型デジッタバッファに格納されたデータの量(またはパケットの数)である。デジッタバッファによって処理されたデータは、デジッタバッファからデコーダまたは別のユーティリティに送信される。符号化されたパケットは、固定量の音声データ、たとえば、8kHzサンプリングレートでの音声データ160個のサンプルに対応する20ミリ秒に対応する。
【0015】
図4は、1つのトークスパートから他のトークスパートへのデジッタ遅延の差による「無音圧縮」および「無音伸長」の例を示す。図4において、影つき領域420、424および428はトークスパートを表し、影なし領域422および426は受信された情報の無音期間を表す。受信されると、トークスパート420は時間tに始まり、時間tに終了する。受信機において、デジッタバッファ遅延が導入され、したがってトークスパート420の再生が時間t’に始まる。デジッタバッファ遅延は、時間t’と時間tとの間の差として確認される。受信されると、無音期間422は時間tに始まり、時間tに終了する。無音期間422は、時間t’からt’までの無音期間432として圧縮及び再生され、これは、受信された無音期間422の元の持続時間よりも小さい。トークスパート424は、時間tに始まり、ソースで時間tに終了する。トークスパート424は、受信機において時間t’から時間t’まで再生される。無音期間426(時間t〜t)は、受信機において再生時に無音期間436として伸長され、(t’−t’)は(t−t)よりも大きい。無音期間は、デジッタバッファがパケットをすぐに再生する必要があるときは圧縮され、デジッタバッファがパケットの再生を遅延させる必要があるときは伸長される。
【0016】
無音期間がわずか数個のフレームからなる場合、たとえば無音期間がセンテンス内で発生したとき、ボイス品質は無音期間の伸長または圧縮によって影響されることがある。図5は、複数のワードセンテンス、たとえば「PRESS THE PANTS.」のための無音フレームおよび音声フレームの分解を示す。図5では、「A」はアクティブな音声を示し、「S」は無音を示す。ここで、トークスパート間の無音の長さは、音声部分の長さと比較して短い。無音期間の長さを圧縮または伸長した場合、センテンスが加速または減速されたように見えることがある。これをさらに図6に示す。わずか1つの語からなるセンテンス「CHINA」が示されている。「CHI」と「NA」の間に無音期間が発生し、無音期間は元は送信機において40ミリ秒であったと仮定する。ここで、無音が受信機において20ミリ秒に圧縮された場合、「I」の音はひずみ、その結果、語が見かけ上「CH−NA」に加速されることになる。一方、無音期間が80ミリ秒に伸長された場合、「I」の音は過度に強調されたように見え、その結果、センテンスがひずむか、または見かけ上、たとえば「CH−I−I−I−I−I−NA」に減速されることになる。そのようなひずみの結果、全体的なボイス品質の知覚される劣化が生じる。
【0017】
短い無音期間の伸長または圧縮の結果、劣化が生じるので、送信された無音期間の長さが受信機において維持される。1つのシナリオでは、図5および図6に示す無音期間など、センテンス内無音期間が検出されたときに、送信された無音の長さを判断し、次いで受信機において維持する。したがって、本開示の1つの目的は、センテンス中またはセンテンス内で無音が発生するときを判断することである。一例では、1つのセンテンスの終了の検出に基づいて複数のセンテンスを互いに区別することができる。センテンスの終了が検出されたとき、センテンスの終了の前に発生する無音期間がセンテンス内で発生し、圧縮も伸長もされないと判断される。一定数の連続する無音パケットが検出された場合、センテンスは終わったと判断される。たとえば、センテンスの終了を示す連続する無音パケットの数は10に等しいとすることができる。別の例では、送信された無音期間の長さが特定の量、たとえば200ミリ秒よりも短いと判断された場合、無音期間はセンテンス内で発生すると仮定することができる。このシナリオでは、検出された無音の長さが200ミリ秒である場合、200ミリ秒の無音期間が受信機において維持される。無音の圧縮も伸長も適応型デジッタバッファによって実行されない。一例では、無音時間の検出された長さが200ミリ秒よりも短い場合、またはセンテンスの終了時に、無音圧縮または無音伸長のトリガを無効化することができる。対照的に、センテンスの間(「センテンス間」)で無音が検出されたとき、デジッタバッファは正常に作動し、これらの間隔中に検出された無音パケットを圧縮または伸長する。
【0018】
本開示の別の態様では、トークスパートの最後のパケットと次のトークスパートの第1のパケットとの間のRTPタイムスタンプの差を使用して、トークスパート間の無音期間の長さを計算することができる。リアルタイムトランスポートプロトコル(RTP)パケットのシーケンス番号(SN)は、送信されたパケットごとに1つ増分する。SNは、パケットシーケンスを復元し、パケット損失を検出するために受信機が使用する。タイムスタンプ(TS)は、RTPデータパケット中の第1のオクテットのサンプリングインスタントを反映することができる。サンプリングインスタントは、時間的に単調かつ線形に増分するクロックから得られる。音声を処理する適用例では、TSを、各音声パケット中のサンプルの数に対応する定数デルタだけ増分することができる。たとえば、入力デバイスが、160個のサンプリング間隔を有する音声パケットを受信し、したがってTSはパケットごとに160だけ増分される。
【0019】
図7は、連続するSNおよび160ずつ増分するTSをもつストリーム中の一連のパケットを示す。TS増分は、パケットが音声セグメントを搬送するか無音セグメントを表すかにかかわらず、同じ、すなわち160である。たとえば、8kHzのサンプリングレートをもつ20ミリ秒のフレームを発生するEVRCのようなボコーダの場合、RTP TSは、連続するパケットに対して20ミリ秒ごとに160だけ増分する(8000×0.02=160個のサンプル)。図7に示すように、第1のパケットのRTP TSは160、第2のパケットのRTP TSは320、第3のパケットのRTP TSは480、などである。一例を使用して、トークスパート間の無音期間の長さの決定を説明することができる。トークスパートの最後のフレームのRTPタイムスタンプは3000であり、次のトークスパートの第1のフレームのRTPタイムスタンプは3640であると仮定する。したがって、RTP TSの差(ΔRTP)は3640−3000=640となる。さらに、640は、8kHzの20ミリ秒フレームの場合、長さ20×(640/160)すなわち80ミリ秒の無音期間に対応する。
【0020】
別の例では、無音の長さがあまりに厳しく維持される場合、デジッタバッファの動作から自由度を取り除くことができる。デジッタバッファの目標は、ジッタを修正するために最適な遅延を導入することである。この遅延は、チャネル状態の変化とともに、フレーム誤り率などのファクタを考慮して更新される。無音の長さが厳しく維持され、デジッタバッファがセンテンス間にしか適応しないように設計されている場合、非効率がもたらされることがある。たとえば、いくつかの最初のチャネル状態の間、デジッタバッファのセンテンス間適合は十分であることある。しかしながら、ジッタ状態の急激な変化の結果、一層短いセンテンスの間に適応する必要が生じることがある。この機能が無効化された場合、デジッタバッファは、全体的に変化するジッタ状態に十分迅速に適応することができなくなる。
【0021】
ボイス品質の完全性を維持しながら必要な自由度でデジッタバッファを作動させるために、開示する本発明の一例は、センテンス内に発生するトークスパートの間に無音長を粗く維持することを目的とする。この目的を達成するために、チャネル状態やユーザ入力などに基づくアルゴリズムを使用して計算された量によってセンテンス内無音長を調整することができる。得られる無音の長さは、調整されてはいるが、ボイスソースの元の無音の長さに近似する。調整された無音の長さを決定する際、無音圧縮および無音伸長の効果を考慮に入れる。いくつかのシナリオでは、たとえば、無音圧縮が無音伸長よりも顕著であり、したがって伸長のみをトリガすることができる。考慮に入れる別のファクタは、元の無音の長さである。たとえば、ボイスソースにおける元の無音が比較的長くなると、調整量の柔軟性が増す。たとえば、元の無音の長さが20ミリ秒である場合、受信機における無音の40ミリ秒の伸長は顕著になる。一方、元の無音の長さが100ミリ秒である場合、受信機における無音の40ミリ秒の伸長はあまり顕著にならない。ボイスソースにおける元の無音の長さがX秒であると仮定すると、本開示の一例は、次の無音間隔を維持する。
【数1】

【0022】
本一例によれば、受信された各センテンスの第1のトークスパートについて、第1のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。各センテンスの後続のトークスパートについて、第1のパケットの再生は、以下のアルゴリズムの例に従って遅延される。
【0023】
arrival_timeを第1のパケットの到着時間とする。depth_playout_timeを、第1のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第1のパケットがプレイアウトされているであろう時間とする。また、spacing_playout_time(n)を、第1パケットが前のトークスパートの終了とともに間隔nを維持した場合に第1のパケットがプレイアウトされているであろう時間とする。Xを、前のトークスパートの最後のパケットと現在のパケットとの間の実際の間隔とする。actual_delayを、パケットがプレイアウトされる時間とする。すると、次のようになる。
【数2】

【0024】
これらの状態を図8A〜図8Cに示す。図8Aでは、センテンスの第1のトークスパートの第1のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。センテンスの次のトークスパートについて、次のトークスパートの第1のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第1のパケットがプレイアウトされているであろう時間が、第1のパケットが前のトークスパートの終了とともに間隔(X−a)を維持した場合に第1のパケットがプレイアウトされているであろう時間よりも小さい場合、パケットがプレイアウトされる時間は(X−a)の値に等しい。
【0025】
図8Bでは、センテンスの第1のトークスパートの第1のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。センテンスの次のトークスパートについて、次のトークスパートの第1のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第1のパケットがプレイアウトされているであろう時間が、第1のパケットが前のトークスパートの終了とともに間隔(X−a)を維持した場合に第1のパケットがプレイアウトされているであろう時間よりも大きいかまたは等しい場合、および、次のトークスパートの第1のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第1のパケットがプレイアウトされているであろう時間が、第1のパケットが間隔(X+b)を維持した場合に第1のパケットがプレイアウトされているであろう時間よりも小さいかまたは等しい場合、パケットがプレイアウトされる時間は、第1のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第1のパケットがプレイアウトされているであろう時間の値に等しい。
【0026】
図8Cでは、センテンスの第1のトークスパートの第1のパケットの再生はΔだけ遅延され、ここで、Δはデジッタバッファ遅延に等しい。センテンスの次のトークスパートについて、次のトークスパートの第1のパケットがその到着の後にデジッタバッファ遅延だけ遅延された場合に第1のパケットがプレイアウトされているであろう時間が、第1のパケットが前のトークスパートの終了とともに間隔(X+b)を維持した場合に第1のパケットがプレイアウトされているであろう時間よりも大きい場合、パケットがプレイアウトされる時間は、次のトークスパートの第1のパケットの到着時間または(X+b)の大きい方に等しい。
【0027】
上記の方法をさらに図9の流れ図に示す。ブロック900において、無音期間がセンテンス中で発生しているかどうかを決定する。無音期間が発生していない場合、プロセスはブロック900に戻る。無音期間がセンテンス中で発生している場合、プロセスはブロック910に進み、depth_playout_timeがspacing_playout_time(X-a)よりも小さいかどうかを決定する。そうである場合、ブロック970において、無音に適用される実際の遅延は(X−a)の値に等しい。そうでない場合、プロセスは920に進み、depth_playout_timeがspacing_playout_time(X+b)よりも大きいかまたはそれに等しいかどうかを決定する。そうである場合、プロセスはブロック940に進み、無音に適用される実際の遅延はdepth_playout_timeの値に等しい。プロセスはブロック980において終了する。次にブロック920に戻り、depth_playout_timeがspacing_playout_time(X+b)よりも大きくないかまたはそれに等しくないと判断された場合、無音に適用される実際の遅延はarrival_timeおよびspacing_playout_time(X+b)のうち大きな方に等しい。プロセスはブロック980において終了する。
【0028】
図10は、ネットワークエレメント、ここではBS1010を通じて通信する2つの端末、AT1030、1040を含むシステムのブロック図である。AT1030において、送信処理ユニット1012は音声データをエンコーダ1014に送信し、エンコーダ1014は音声データをデジタル化し、パケット化されたデータを下位レイヤ処理ユニット1008に送信する。次いで、パケットはBS1010に送信される。AT1030がBS1010からデータを受信すると、データはまず下位レイヤ処理ユニット1008において処理されて、そこからデータのパケットが適応型デジッタバッファ1006に供給される。無音は、たとえば無音キャラクタライザ1005において、デジッタバッファ内または別個のモジュールの一部として、センテンス間またはセンテンス内として特徴づけることができる。一例では、無音キャラクタライザ1005は、無音期間がセンテンス内で発生するのかセンテンス間で発生するのかを決定する。無音がセンテンス間で発生した場合、たとえば、2005年8月30日に出願され、本開示の譲受人に譲渡される同時係属の出願第11/215,931号「METHOD AND APPARATUS FOR AN ADAPTIVE DE−JITTER BUFFER」に開示されているように、無音期間を伸長または圧縮することができる。AT1030の挙動はAT1040の挙動と同様である。AT1040は、データを送信処理ユニット1016からエンコーダ1018、下位レイヤ処理ユニット1020、最後にBS1010への経路上で送信する。AT1040は、データを下位レイヤ処理ユニット1020から適応型デジッタバッファ1022および無音キャラクタライザ1021、デコーダ1024、受信処理ユニット1026への経路上で受信する。さらなる処理は、図示されていないが、ボイスなどのデータの再生に影響を及ぼし、オーディオ処理や画面表示などを含む。
【0029】
図11は、開示する本発明の一例を組み込んだ通信システムにおける受信機の一部分のブロック図である。物理レイヤ処理ユニット1104はデータスタック1106にデータを供給する。データスタック1106はデジッタバッファおよび制御ユニット1108にパケットを出力する。無音キャラクタライザ1110は、検出された無音期間がセンテンス内で発生するのかセンテンス間で発生するのかを決定する。無音がセンテンス内で発生した場合、デジッタバッファは、本発明の例に開示されているように無音を維持する。順方向リンク(FL)媒体アクセス制御(MAC)処理ユニット1102はハンドオフインジケータをデジッタバッファおよび制御ユニット1108に供給する。MACレイヤは、物理レイヤ上で、すなわちオーバージエア(over the air)でデータを受信および送信するためのプロトコルを実装する。MACレイヤは、セキュリティ、暗号化、認証、および接続情報を含む。IS−856をサポートするシステムでは、MACレイヤは、制御チャネル、アクセスチャネル、ならびに順方向および逆方向トラフィックチャネルを統制する規則を含む。
【0030】
無音間隔中、パケットは適応型デジッタバッファおよび制御ユニット1108から不連続送信(DTX)ユニット1112に送信され、DTXユニット1112は背景雑音情報をデコーダ1114に供給する。デジッタバッファおよび制御ユニット1108によって供給されたパケットは、デコード処理の準備ができており、ボコーダパケットと呼ぶことができる。デコーダ1114はパケットをデコードする。本開示の別の態様では、2005年8月30日に出願され、本開示の譲受人に譲渡される同時係属の出願第11/215,931号「METHOD AND APPARATUS FOR AN ADAPTIVE DE−JITTER BUFFER」に開示されているように、タイムワーピングユニットが音声パケットをタイムワープすることができる。パルス符号変調(PCM)音声サンプルがデコーダ1114からタイムワーピングユニット1116に供給される。タイムワーピングユニット1116はデジッタバッファおよび制御ユニット1108からタイムワーピングインジケータを受信する。インジケータは、上述の特許出願に開示されているように、音声パケットの伸長、圧縮、またはワーピングなしを示すことができる。
【0031】
図12は、適応型デジッタバッファ1204と無音キャラクタライザユニット1224とを含む、一例によるアクセス端末(AT)を示すブロック図である。一例では、デジッタバッファは、図12に示すように無音キャラクタライザユニット1224を含む。別の例では、デジッタバッファ1204および無音キャラクタライザユニット1224は別個の要素である。デジッタバッファ1204、タイムワープ制御ユニット1218、受信回路1214、無音キャラクタライザユニット1224、制御プロセッサ1222、メモリ1208、送信回路1210、デコーダ1206、H−ARQ制御1220、エンコーダ1216、音声処理1228、誤り訂正1202は、前の例に示すように一緒に結合できる。さらに、それらは、図12に示すコミュニケーションバス1212を介して一緒に結合できる。
【0032】
上記の図9の方法は、図13に示す対応するミーンズプラスファンクションブロックによって実行できる。言い換えれば、図9に示すブロック900〜980は、図13に示すミーンズプラスファンクションブロック1300〜1380に対応する。
【0033】
本明細書は本発明の特定の例を記載しているが、当業者は、発明の概念を逸脱することなく本発明の変形物を考案することができる。たとえば、本明細書における教示は、回路交換ネットワーク要素に関するが、パケット交換ドメインネットワーク要素にも等しく適用できる。また、本明細書における教示は、認証トリプレット対に限定されず、2つのSRES値(慣習的なフォーマットの1つおよび本明細書で開示するより新規のフォーマットの1つ)を含む単一のトリプレットの使用にも適用できる。
【0034】
情報および信号は、様々な異なる技術および技法のいずれを使用しても表現できることを、当業者にはいうまでもない。たとえば、上記の説明の全体にわたって言及されるデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表現できる。
【0035】
さらに、本明細書で開示した例に関連して説明した様々な例示的な論理ブロック、モジュール、回路、方法およびアルゴリズムは、電子ハードウェア、コンピュータソフトウェア、または両方の組合せとして実施できることを、当業者は理解されよう。ハードウェアとソフトウェアのこの互換性を明確に説明するために、様々な例示的な構成部分、ブロック、モジュール、回路、方法、およびアルゴリズムについて、概してそれらの機能に関して上記で説明した。そのような機能をハードウェアで実装するかソフトウェアで実装するかは、システム全体に課せられた特定の適用および設計上の制約に依存する。当業者は、記載した機能を各特定の適用例ごとに異なる方法で実装することができるが、そのような実装の決定は、本発明の範囲からの逸脱を生じるものと解釈すべきではない。
【0036】
本明細書で開示した例に関連して説明した様々な例示的な論理ブロック、モジュール、および回路は、本明細書で説明した機能を実施するように設計された、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または他のプログラマブル論理デバイス、個別のゲートまたはトランジスタ論理、個別のハードウェア構成要素、あるいはそれらの任意の組合せで実装または実施できる。汎用プロセッサはマイクロプロセッサとすることができるが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることができる。プロセッサは、コンピューティングデバイスの組合せとして、たとえば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つまたは複数のマイクロプロセッサ、あるいはそのような他の任意の構成として実施できる。
【0037】
本明細書で開示した例に関して説明した方法またはアルゴリズムは、直接ハードウェアで、プロセッサによって実行されるソフトウェアモジュールで、またはその2つの組合せで実施できる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、または当技術分野で知られている他の任意の形態の記憶媒体中に常駐することができる。記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合できる。代替として、記憶媒体はプロセッサに一体化することができる。プロセッサおよび記憶媒体はASIC中に常駐することができる。
【0038】
1つまたは複数の例示的な実施形態では、記載した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装できる。ソフトウェアで実施した場合、機能は1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶でき、あるいはコンピュータ可読媒体を介して送信できる。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、コンピュータ記憶媒体と通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスできる任意の使用可能な媒体とすることができる。限定ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROMもしくは他の光ディスク記憶装置、磁気ディスク記憶装置もしくは他の磁気記憶装置、または、命令もしくはデータ構造の形態の所望のプログラムコードを運搬または記憶するために使用でき、コンピュータによってアクセスできる他の任意の媒体を備えることができる。また、いかなる接続も正確にはコンピュータ可読媒体と呼ばれる。たとえば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などの無線技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などの無線技術は、媒体の定義に含まれる。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびブルーレイディスク(disc)を含み、この場合、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)はデータをレーザで光学的に再生する。上記のものの組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
【0039】
開示した例の前述の説明は、当業者が本発明を製作または使用できるように与えられている。これらの例の様々な変更形態は、当業者には容易に明らかになるものであり、本明細書で定義した一般原理は、本開示の趣旨または範囲から逸脱することなく他の変形形態に適用できる。したがって、本開示は、本明細書で示した例に限定されるものではなく、本明細書で開示した原理および新規の特徴と合致する最も広い範囲が与えられるべきである。

【特許請求の範囲】
【請求項1】
複数のパケットを受信することと、
前記受信された複数のパケットを記憶することと、
前記受信された複数のパケットに関連する少なくとも1つの無音期間の長さを決定することと、
前記少なくとも1つの無音期間の前記決定された長さに基づいて、前記記憶された複数のパケットの一部分を送信する時間を決定することと、
を含む方法。
【請求項2】
前記受信された複数のパケットは適応型デジッタバッファに記憶される、請求項1記載の方法。
【請求項3】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定すること、
をさらに含む請求項2記載の方法。
【請求項4】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定することは、受信された無音パケットの最大連続数が、特定の数よりも小さいかどうかを決定すること、
をさらに含む請求項3記載の方法。
【請求項5】
前記数が10に等しい、請求項4記載の方法。
【請求項6】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定することは、前記受信された複数のパケットに関連する前記少なくとも1つの無音期間の最大長が、特定の時間フレームよりも短いかどうかを決定すること、
をさらに含む請求項3記載の方法。
【請求項7】
前記受信された複数のパケットがセンテンス中で発生する場合、送信された無音期間の元の長さを維持するようにデジッタバッファを適応させることと、
前記維持された長さで前記記憶された複数のパケットの前記一部分を送信することと、
をさらに含む請求項3記載の方法。
【請求項8】
前記維持された無音の長さが[X−a,X+b]である、請求項7記載の方法。
【請求項9】
[X−a,X+b]が、前記送信された無音期間の元の長さに比例する、請求項8記載の方法。
【請求項10】
前記デジッタバッファを適応させることは、
デジッタバッファ遅延を決定することと、
前記記憶された複数のパケットの第1の部分を前記デジッタバッファ遅延に等しい時間に送信することと、
前記記憶された複数のパケットの第2部分を前記値[X−a,X+b]に基づいて計算された時間に送信することと、
をさらに含む請求項8記載の方法。
【請求項11】
前記デジッタバッファ遅延が(X−a)に対応する時間よりも小さい場合、前記記憶された複数のパケットの前記第2部分を(X−a)に対応する時間に送信すること、
をさらに含む請求項10記載の方法。
【請求項12】
前記デジッタバッファ遅延が(X−a)に対応する時間よりも大きいかまたはそれに等しく、かつ、前記デジッタバッフ遅延が(X+b)に対応する時間よりも小さいかこれに等しい場合、前記記憶された複数のパケットの前記第2の部分を前記デジッタバッファ遅延に対応する時間に送信すること、
をさらに含む請求項10記載の方法。
【請求項13】
前記デジッタバッファ遅延が(X+b)に対応する時間よりも大きい場合、前記記憶された複数のパケットの前記第2の部分を、到着時間に対応する時間または(X+b)に対応する時間の大きい方に等しい時間に送信すること、
をさらに含む請求項10記載の方法。
【請求項14】
複数のパケットを受信する受信機と、
前記受信された複数のパケットを記憶するデジッタバッファと、
前記記憶された複数のパケットに関連する少なくとも1つの無音期間の長さと、前記少なくとも1つの無音期間の前記決定された長さに基づいて前記記憶された複数のパケットの一部分を送信する時間と、を決定する無音キャラクタライザユニットと、
を備える装置。
【請求項15】
複数のパケットを受信する手段と、
前記受信された複数のパケットを記憶する手段と、
前記受信された複数のパケットに関連する少なくとも1つの無音期間の長さを決定する手段と、
前記少なくとも1つの無音期間の前記決定された長さに基づいて前記記憶された複数のパケットの一部分を送信する時間を決定する手段と、
を備える装置。
【請求項16】
前記受信された複数のパケットを記憶する前記手段は、適応型デジッタバッファを含む請求項15記載の装置。
【請求項17】
前記受信された複数のパケットがセンテンス中で発生するかどうかを決定する手段、
をさらに備える請求項15記載の装置。
【請求項18】
前記決定する手段がデジッタバッファ手段を含む請求項17記載の装置。
【請求項19】
前記デジッタバッファ手段がキャラクタライザ手段をさらに含む請求項18記載の装置。
【請求項20】
コンピュータに、第1の複数のパケットおよび第2の複数のパケットを受信させるためのコードと、
前記コンピュータに、前記受信された複数のパケットを記憶させるためのコードと、
前記コンピュータに、前記受信された複数のパケットに関連する少なくとも1つの無音期間の長さを決定させるためのコードと、
前記コンピュータに、前記少なくとも1つの無音期間の前記決定された長さに基づいて前記記憶された複数のパケットの一部分を送信する時間を決定させるコードと、
を備えたコンピュータ可読媒体を含むコンピュータプログラム製品。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図8C】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公表番号】特表2010−530653(P2010−530653A)
【公表日】平成22年9月9日(2010.9.9)
【国際特許分類】
【出願番号】特願2010−506481(P2010−506481)
【出願日】平成20年4月23日(2008.4.23)
【国際出願番号】PCT/US2008/061348
【国際公開番号】WO2008/134384
【国際公開日】平成20年11月6日(2008.11.6)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.GSM
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】