説明

適応デジッタバッファの方法及び装置

【課題】適応デジッタバッファの方法及び装置
【解決手段】パケット交換通信用のIP上の音声(VoIP)のための適応デジッタバッファ。提示するデジッタバッファの方法及び装置は、エンドツーエンド遅延のバランスを保ちながらアンダーフローの再生を回避する。一例において、デジッタバッファは、各有音部の開始時に再計算される。別の例では、有音部パケットが、すべての残りのパケットを受け取り次第圧縮される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、無線通信システムに関し、詳細には、パケット交換通信用のインターネットプロトコル上の音声(VoIP)のための適応デジッタバッファに関する。本発明は、パケットが失われ得る任意のシステムに適用される。
【背景技術】
【0002】
通信システムにおいて、パケットのエンドツーエンド遅延は、発信元におけるパケットの生成からパケットがこれの宛先に到達するまでの時間であると定義され得る。パケット交換通信システムにおいて、パケットが発信元から宛先まで移動する際の遅延は、これだけに限らないが、チャネル条件やネットワーク負荷を含む様々な動作条件に応じて異なり得る。チャネル条件とは、無線リンクの品質を指す。無線リンクの品質を決定する要因の中には、信号強度、モバイルの速度、及び/又は物理的障害がある。
【0003】
エンドツーエンド遅延は、ネットワーク、及びパケットが通過する様々な要素において導入される遅延を含む。多くの要因がエンドツーエンド遅延の原因となる。エンドツーエンド遅延の変動をジッタという。ジッタは、パケットを、もはや無用になった後で受けとらせることがある。例えば、音声などの低待ち時間用途では、パケットがあまりにも遅く受け取られると、受信側によってドロップされることがある。かかる条件は、通信品質の低下につながる。
【図面の簡単な説明】
【0004】
【図1】アクセス端末がデジッタバッファを含む従来技術の通信システムを示すブロック図である。
【図2】従来技術のデジッタバッファを示す図である。
【図3】「アンダーフロー」をもたらすパケットの送信、受信、及び再生を示すタイミング図である。
【図4A】1つのシナリオにおける最適なデジッタバッファ長の計算を示すタイミング図である。
【図4B】1つのシナリオにおける最適なデジッタバッファ長の計算を示すタイミング図である。
【図5】遅延パケットから生じる一連の「アンダーフロー」を示すタイミング図である。
【図6】目標デジッタバッファ長の計算を示す流れ図である。
【図7A】第1のシナリオにおけるパケットの送信を示すタイミング図である。
【図7B】デジッタバッファ適応なしでのパケットの受信を示すタイミング図である。
【図7C】受信側がパケットを、パケットの期待される時刻の後で受け取り得る、デジッタバッファ適応ありでのパケットの受信を示す。
【図8A】受信側がパケットを、パケットの期待される時刻の後で受け取ることができるようにする暗黙的バッファ適応の一例を示す流れ図である。
【図8B】適応デジッタバッファの動作モードを示す状態図である。
【図9】別の例によるデジッタバッファ適応の適用を示すタイミング図である。
【図10】デジッタバッファ遅延がデータの衝突を回避するのに十分ではない一例による、有音部における音声情報の送信を示す図である。
【図11】適応デジッタバッファを組み込んでいる通信システムを示すブロック図である。
【図12】適応デジッタバッファと時間伸縮ユニットを含む受信機の一部分を示すブロック図である。
【図13A】圧縮及び拡張閾値を含む適応デジッタバッファの一例を示す図である。
【図13B】複数の圧縮及び拡張閾値を含む適応デジッタバッファの一例を示す図である。
【図14】様々な遅延を有するパケットの受信時の時間伸縮を示すタイミング図である。
【図15】i)音声セグメントの無音部分の圧縮例と、ii)音声セグメントの無音部分の拡張例を示すタイミング図である。
【図16】音声信号の部分が反復し得る音声信号を示すタイミング図である。
【図17A】Rウインドウサイズと呼ばれる、追加/オーバーラップ操作のための参照窓内のPCMサンプルの数が識別され、セグメントと呼ばれる、目標又は所望のセグメントサイズが識別される音声セグメントを示す図である。
【図17B】一例による、音声セグメントを圧縮する追加/オーバーラップ操作の適用を示す図である。
【図18A】Rウインドウサイズと呼ばれる、追加/オーバーラップ操作のための参照窓内のPCMサンプルの数が識別され、現在の音声セグメントの拡張に備えて、セグメントと呼ばれる、目標又は所望のセグメントサイズが識別される複数の音声セグメントを示す図である。
【図18B】一例による、音声サンプルを拡張する追加/オーバーラップ操作の適用を示す図である。
【図18C】代替例による、音声サンプルを拡張する操作の適用を示す図である。
【図19】遅延パケット、及びハイブリッドARQ再送信の場合のように順序が乱れて到着するパケットの到着を可能にするパケットの拡張を示す図である。
【図20】2人のユーザ間の会話の時間軸を示す図である。
【図21】一例による、有音部の先頭における改善を示す流れ図である。
【図22】代替例による、有音部の先頭における改善を示す図である。
【図23】有音部の末尾の改善を示す図である。
【図24】一例による有音部の末尾における改善を示す流れ図である。
【図25】デジッタバッファが、一定の時間間隔でパケットを復号器に配信する、従来技術のデジッタバッファ復号器システムの動作を示す図である。
【図26】適応デジッタバッファが、不規則な時間間隔でパケットを復号器に配信する一例による、適応デジッタバッファ及び復号器の動作を示す図である。
【図27】適応デジッタバッファと時間伸縮制御ユニットを含む、一例によるアクセス端末(AT)を示すブロック図である。
【図28】一例による、適応デジッタバッファを含み、パケットを時間伸縮させるように適合されている受信機の一部分を示す図である。
【図29】別の例による、適用デジッタバッファを含み、パケットを時間伸縮させるように適合されている受信機の代替例を示す図である。
【図30】一例による、適応デジッタバッファを含み、パケットを時間伸縮させるように適合されている受信機の一例における、復号器内のスケジューラの一例を示す流れ図である。
【図31】受信機の一例におけるオーディオインターフェースユニット内のスケジューラを示す流れ図である。
【図32】スケジューリングが復号器の外部で計算される時間伸縮ユニットを示す図である。
【図33】スケジューリングが復号器内の時間伸縮ユニットにおいて計算される時間伸縮ユニットを示す図である。
【発明を実施するための形態】
【0005】
米国特許法第119条による優先権の主張
本特許出願は、本出願の譲受人に譲渡されている、2004年8月30日に出願された、「パケット交換通信用のIP上の音声(VoIP)のための適応デジッタバッファ(Adaptive De−Jitter Buffer For Voice Over IP for Packet Switched Communications)」という名称の、米国特許仮出願第60/606,036号の優先権を主張するものである。
【0006】
パケット交換システムでは、データがパケットに形成され、ネットワークを介して経路指定される。各パケットは、パケット内、通常は、ヘッダに含まれる割り当てアドレスに基づいて、ネットワーク内の宛先に送られる。パケットのエンドツーエンド遅延、すなわち、パケットがネットワーク内で第1のユーザ又は「送信者」から第2のユーザ又は「受信者」まで移動するのに要する時間は、チャネル条件、ネットワーク負荷、システムのサービス品質(QoS)機能、及び、中でも特に、リソースを求めて競合する他のフローに応じて変動する。なお、明確にするために、以下の考察は、これだけに限らないが、符号分割多元接続(CDMA)システム、直交周波数分割多元接続(OFDMA)、広帯域周波数分割多元接続(W−CDMA)、広域自動車電話システム(GSM(登録商標))によるシステム、802.11(A、B、G)、802.16といったIEEE標準をサポートするシステムなどを含む、パケットデータ通信をサポートするスペクトラム拡散通信システムを説明するものであることに留意されたい。
【0007】
無線通信システムでは、各パケットが、同じフローに属する他のパケットに発生する遅延とは異なる、発信元から宛先までの遅延を被ることがある。この遅延のばらつきを「ジッタ」という。ジッタは、受信側アプリケーションにとってさらに厄介な問題を生み出す。受信側がジッタを訂正しない場合、受信したメッセージは、パケットが再アセンブルされるときに、歪みを被ることになる。システムの中には、受信パケットからメッセージを再構築するときに、ジッタを修正するものがある。かかるシステムは、デジッタバッファ遅延と呼ばれる待ち時間を追加するデジッタバッファを組み込んでいる。デジッタバッファは、固定の、大きなデジッタバッファ遅延を適用するとき、パケットの到着に際して、大量のジッタに対応し得る。しかしながら、これの使用は効率的ではない。というのは、より小さい遅延を有するパケットが、これらのパケットがより早く処理され得るはずの場合でも、やはり大きいデジッタバッファ遅延を使って処理されるからである。これは、これらのパケットについて、より小さいデジッタバッファ遅延を使って達成され得るものよりも大きいエンドツーエンド遅延をもたらす。
【0008】
これを防ぐために、デジッタバッファを組み込んだVoIPシステムは、パケット遅延の変化に対応しようとすることがある。例えば、デジッタバッファは、パケット到着統計を解析することによって、パケット遅延の変化を検出し得る。多くのデジッタバッファ実装形態は、これらの遅延を全く適応させず、保守的に大きい遅延を有するように構成されている。この場合、デジッタバッファは、パケットに余分の遅延を追加し、ユーザに最適には及ばない状態を経験させることがある。
【0009】
以下の考察では、デジッタバッファ遅延を変更することによって、パケット遅延挙動の変化に適応する適応デジッタバッファを説明する。このデジッタバッファは、音声時間伸縮を利用して、このデジッタバッファの、パケットの可変遅延を追跡できる機能を改善する。以下の考察は、周期的データ送信、低待ち時間要件、データの順次処理、又は指定再生速度を有する通信など、パケット化通信に適用可能である。特に、以下の考察では、データ又は音声及び無音が発信元で発生し、再生のために宛先に送信される音声通信を詳述する。元のデータは、パケット化され、知られている符号化方式を使って符号化される。受信側において、符号化方式は、データの各パケットごとに判定される。音声通信では、例えば、音声の符号化の種類は、無音部の符号化の種類と異なる。これは、通信システムが、無音部分を含む音声の周期的性質を利用することを可能にする。音声通信では、データがバースト性を呈し、音声内容は、反復するように見えることがある。パケット化音声通信は低待ち時間要件を有する。というのは、音声通信への参加者が、遅延を嫌い、通信の品質が限られて遅延だけしか許容しないからである。パケット化音声は、異なるパスをたどって受信側に到達し得るが、受信時に、各パケットは、元の順序で再コンパイルされる。したがって、受信したパケット化音声は、順次再生される。パケットが、無線通信に際して、又は物理層処理に際して失われた場合、このパケットは回復されず、受信側は、パケットの内容が何であったか推定し、又は憶測し得る。加えて、音声通信の再生速度は、所定の再生速度又は範囲を有する。再生がこの範囲外である場合、受信側における品質は低下する。音声通信への適用は、本考察の適用の一例である。他の適用には、ビデオ通信、ゲーム通信、又は音声通信のものに類似した特性、仕様、及び/又は要件を有する他の通信が含まれ得る。例えば、ビデオ通信は、再生の速度を上げたり下げたりしようとする。本考察は、かかる用途に望ましいことがある。本明細書で示すように、適応デジッタバッファは、受信側が、システムのジッタ要件によって指定されるサービス品質を達成することを可能にし得る。適応デジッタバッファは、例えば、デジッタバッファに格納されるデータ量など、目標デジッタバッファ長を、適応デジッタバッファにおいて受け取られるデータのタイミング及び量に適応させる。さらに、適応デジッタバッファは、例えば、適応デジッタバッファに格納されるデータの大きさなど、デジッタバッファの状況又はサイズを使って、時間伸縮が、受信データの処理及び再生に有利であるときを判定する。例えば、データが低速で適応デジッタバッファに到着している場合、適応デジッタバッファは、この情報を時間伸縮ユニットに提供し、時間伸縮ユニットが受信パケットを拡張することができるようにする。適応デジッタバッファに格納されるデータが閾値を超える場合、適応デジッタバッファは、時間伸縮ユニットに、着信データに実質的に追いつくためにパケットを圧縮するよう警告する。なお、時間伸縮は、通信のアプリケーション及び種類によって定義され得る限界内であることに留意されたい。例えば、音声通信では、時間伸縮は、聞く人が通信を理解することができなくなるほど、音声を圧縮する、すなわち、ピッチを上げるべきではない。同様に、時間伸縮は、限界を超えて音声を拡張すべきでもない。理想的には、時間伸縮限界は、聞く人をほとんど、又は全く不快にさせないように定義される。
【0010】
通信システム
図1は、デジタル通信システム50を示すブロック図である。2つのアクセス端末(AT)52、82が、基地局(BS)70を介してやりとりする。AT52内部では、送信処理ユニット64が符号器60に音声データを送り、符号器60は、音声データを符号化し、パケット化して、パケット化データを下位層処理ユニット58に送る。次いでデータは、送信のために、BS70に送られる。BS70は、受信データを処理して、このデータをAT82に送信し、AT82でデータは、下位層処理ユニット88において受け取られる。次いで、データは、デジッタバッファ86に提供され、デジッタバッファ86は、ジッタの影響を隠し、又は低減するようにデータを格納する。データは、デジッタバッファ86から復号器84に送られ、さらに受信処理ユニット92に送られる。
【0011】
AT82からの送信では、データ/音声が、送信処理ユニット94から符号器90に提供される。下位層処理ユニット88が、BS70への送信のためにデータを処理する。AT52におけるBS70からのデータの受信では、データが、下位層処理ユニット58において受け取られる。次いで、データのパケットが、デジッタバッファ56に送られ、必要なバッファ長又は遅延に到達するまで、デジッタバッファ56で格納される。この長さ又は遅延が達成されると、デジッタバッファ56は、データを復号器54に送り始める。復号器54は、パケット化データを音声データパケットに変換し、パケットを受信処理ユニット62に送る。本例では、AT52の挙動は、AT82と同様である。
【0012】
デジッタバッファ
前述のようなATでは、記憶又はデジッタバッファを使って、ジッタの影響が隠蔽される。一例では、適応デジッタバッファが、VoIP通信などの、パケット交換通信に使用される。デジッタバッファは、適応バッファメモリを有し、音声時間伸縮を使って、これの可変遅延及びジッタを追跡できる機能を改善する。この例では、デジッタバッファの処理が復号器の処理と合わせて調整され、デジッタバッファは、パケットを時間伸縮させる機会又は必要を識別し、復号器に、パケットを時間伸縮させるよう指示する。復号器は、デジッタバッファによって指示されるように、パケットを圧縮し、又は拡張することによってパケットを時間伸縮させる。
【0013】
図2に、デジッタバッファの一例を示す。着信符号化パケットが蓄積され、バッファに格納される。一例では、バッファは、データが、特定の順序で受け取られ、同じ順序で処理される先入れ先出し(FIFO)バッファであり、最初に処理されるデータは最初に受け取られるデータである。別の例では、デジッタバッファは、どのパケットを次に処理すべきか追跡する順序付きリストである。適応デジッタバッファは、デジッタバッファの状況が、適応デジッタバッファに格納されているデータの大きさ(又はパケットの数)である、記憶装置とすることができる。デジッタバッファによって処理されるデータは、デジッタバッファから復号器又は他のユーティリティに送られてもよい。符号化パケットは、例えば、8KHzのサンプリング速度で、160サンプルの音声データに対応する20ミリ秒など、固定量の音声データに対応し得る。本発明の一例では、復号器によって生成されるサンプルの数は、時間伸縮機能を有する場合、パケットが時間伸縮されるか否かに基づいて変化し得る。デジッタバッファが復号器/時間伸縮に、パケットを拡張するよう指示するとき、復号器/時間伸縮器は、160を上回るサンプルを生成し得る。他方、デジッタバッファが、復号器/時間伸縮に、パケットを圧縮するよう指示するとき、復号器/時間伸縮は、160を下回るサンプルを生成し得る。なお、代替のシステムは、20ミリ秒以外のボコーディングなど、異なる再生方式を有し得ることに留意されたい。
【0014】
デジッタバッファに到着するパケットは、一定の間隔で到着しないこともある。したがって、デジッタバッファの設計目標の1つは、着信データの不規則さを調整することである。本発明の一例では、デジッタバッファが、目標デジッタバッファ長を有する。目標デジッタバッファ長は、最初のパケットを再生し始める前に、デジッタバッファ内に蓄積されるべき必要データ量を指す。別の例では、目標デジッタバッファ長は、デジッタバッファ内の最初のパケットが、再生される前に遅延される必要のある時間量を指すこともある。目標デジッタバッファ長は、図2に示されている。パケットの再生を開始する前に、デジッタバッファ内に十分なパケットを蓄積することによって、デジッタバッファは、後続のパケットを一定の間隔で再生すると同時に、パケットが枯渇する可能性を最小限に抑えることができる。図2には、デジッタバッファに最初に受け取られるボコーダパケットが、デジッタバッファからの出力が予定される次のパケットであるデジッタバッファが示されている。デジッタバッファは、必要なデジッタバッファ遅延を達成するのに十分なパケットを含む。このように、デジッタバッファは、パケットがこうむるジッタを円滑化し、受信側におけるパケット到着時刻のばらつきを隠蔽する。
【0015】
図3に、様々なシナリオでのパケットの送信、受信、及び再生の時間軸を示す。第1のパケットPKT1は、時刻tに送信され、時刻tに受信され次第再生される。後続のパケットPKT2、PKT3及びPKT4は、PKT1の後20ミリ秒間隔で送信される。時間伸縮なしの場合、復号器が、第1のパケットの再生時刻から一定の時間間隔(20ミリ秒など)でパケットを再生する。例えば、復号器が規則的な20ミリ秒間隔でパケットを再生する場合、第1の受信パケットが時刻tに再生され、後続のパケットが時刻tの20ミリ秒後、時刻tの40ミリ秒後、時刻tの60ミリ秒後、以下同様に再生される。図3に示すように、PKT2の(デジッタバッファ遅延なしの)予期される再生時刻は、t=t+20ミリ秒である。PKT2は、これの予期される再生時刻t前に受け取られる。他方、パケット3は、これの予期される再生時刻t=t+20ミリ秒の後で受け取られる。この状態をアンダーフローという。アンダーフローは、再生ユーティリティはパケットを再生する用意ができているが、パケットがデジッタバッファ内に存在していないときに発生する。アンダーフローは、通常、復号器に消去を生成させ、再生品質を低下させる。
【0016】
図3に、さらに、デジッタバッファが、第1のパケットの再生前に、遅延tdjbを導入する第2のシナリオを示す。このシナリオでは、再生ユーティリティが、20ミリ秒ごとにパケット(又はサンプル)を受け取ることができるようにデジッタバッファ遅延が追加される。このシナリオでは、PKT3がこれの予期される再生時刻tの後で受け取られたとしても、デジッタバッファ遅延の追加により、PKT3を、PKT2の再生の20ミリ秒後に再生することが可能になる。
【0017】
PKT1は、時刻tに送信され、時刻tに受け取られ、時刻tに再生されるのではなく、先に行ったように、今度は、時刻t+tdjb=t’に再生される。再生ユーティリティは、PKT1の後、所定の間隔、例えば20ミリ秒などで、すなわち時刻t’=t+tdjb+20=t+tdjbにPKT2を再生し、t’=t+tdjbにPKT3を再生する。再生をtdjbだけ遅延させることにより、第3のパケットを、アンダーフローを生じさせずに再生することが可能になる。よって、図3に示すように、デジッタバッファ遅延の導入は、アンダーフローを低減し、音声品質が劣化するのを防ぐことができる。
【0018】
音声は、有音部の期間と無音期間とからなる。無音期間の拡張/圧縮は、音声品質にほとんど、又は全く影響を及ぼさない。これは、デジッタバッファが、第1のパケットの再生を、各有音部ごとに、異なったやり方で遅延させることを可能にする。
【0019】
図4A及び4Bに、異なる有音部の送信及び受信の時間軸を示す。なお、デジッタバッファ遅延の量は、アンダーフローを防ぐように決定される。これを、「最適デジッタバッファ遅延」という。最適デジッタバッファ遅延は、目標デジッタバッファ長に関連する。言い換えると、目標デジッタバッファ長は、バッファ内に、パケットが再生ユーティリティ仕様に合わせて再生されるのに十分なデータを格納させるように決定される。最適デジッタバッファ遅延は、システムがこうむる最大エンドツーエンド遅延によって決定され得る。代替として、最適デジッタバッファ遅延は、システムがこうむる平均遅延に基づくものすることもできる。また、所与の基準又はシステム設計に特有の、最適デジッタバッファ遅延を決定する他の方法も実施され得る。さらに、目標デジッタバッファ長は、最適デジッタバッファ遅延を有効にするように決定され、したがって、目標デジッタバッファ長は、受信パケット速度、パケット誤り率(PER)又は他の動作統計に基づいて計算されてもよい。
【0020】
図4A及び4Bには、2つの例での最適デジッタバッファ遅延が示されている。図示のように、順次パケットの送信と受信の間の時間は、時間が経つにつれて変動する。PKT3は、送信から受信まで最長の遅延を有するため、この差を使ってデジッタ処理の最適遅延が決定される。
【0021】
デジッタバッファを目標デジッタバッファ長と共に使用すれば、少なくとも一部のアンダーフロー条件を回避し得る。図3に戻ると、第2のシナリオでは、(復号器がパケットを予期しており、再生ユーティリティはパケットを再生する用意ができていたが、パケット記憶バッファにパケットが存在しなかったときに発生した)アンダーフローを未然に防いだ。ここで、PKT2は、tをPKT1の再生時刻とすると、tから所定間隔、すなわち20ミリ秒後に再生される。PKT3は、時刻tにおける再生が予定され、又は予期されるが、PKT3は、時刻tの後まで受け取られない。すなわち、再生ユーティリティはPKT3を再生する用意はできているが、このパケットは、記憶バッファ内に存在しない。PKT3は、予期される時刻に再生に利用できず、再生されないため、PKT3に関して大量のジッタ及びアンダーフローが生じる。PKT4は、PKT4の予期される再生時刻であるtに再生される。なお、予期される時刻tは、時刻tから計算されることに留意されたい。各パケットは、複数の音声パケットを含み得るため、アンダーフローによるパケットの喪失は、音声品質を低下させる。
【0022】
考察のための別のシナリオには、図5に示すような一連の「遅延パケットによるアンダーフロー」が伴い、図5には、パケットの送信、受信及び予期される再生時刻が時間で示されている。このシナリオでは、各パケットが、各パケットの予期される再生時刻の少し後に受け取られる。例えば、PKT50の予期される再生時刻はtであるが、PKT50は、t後の時刻t’まで受け取られない。次のパケット51は、tに予期されているが、t後の時刻t’まで受け取られない。これは、高率の「遅延アンダーフロー」、すなわち遅延パケットによるアンダーフローをもたらし、よって、より高いエンドツーエンド遅延をもたらす一連のアンダーフローを引き起こす。
【0023】
明らかに、再生を大幅に遅延させるデジッタバッファは、アンダーフローを最低限に保つのに役立つ。しかしながら、かかるデジッタバッファは、パケットのエンドツーエンド遅延に大きなデジッタバッファ遅延を導入する。大きなエンドツーエンド遅延は、会話の流れを維持するのを困難にすることがある。100ミリ秒を上回る遅延は、聞き手に、話し手が会話を終えていないと思わせることがある。したがって、良好な品質とは、理想的には、アンダーフローの回避とエンドツーエンド遅延の低減の両方を考慮したものである。一方の問題の解決が他方を悪化させ得るという問題が存在する。言い換えると、より小さいエンドツーエンド遅延は、一般に、より多くのアンダーフローをもたらし、逆もまた同様である。したがって、これらの競合する目標のバランスを取る必要がある。具体的には、デジッタバッファが、アンダーフローを追跡し、回避すると同時に、エンドツーエンド遅延を低減することが求められている。
【0024】
デジッタバッファ目標長
適応デジッタバッファの設計目標は、システムに、音声パケットの特定の「アンダーフロー率」を目標とすると同時に、低いエンドツーエンド遅延を達成させることである。知覚される品質は、アンダーフローのパーセンテージの関数であるため、アンダーフローの特定のパーセンテージを目標とすることができれば、音声品質の制御が可能になる。デジッタバッファにおけるパケットアンダーフローは、欠落したパケットがあるときに発生し得る。パケットは、これが失われ、又は遅延したときに欠落し得る。喪失パケットは、受信側に到達する前にドロップされたとき、例えば、物理層や順方向リンクスケジューラなど、アクセスネットワーク内のどこかでドロップされたときに、アンダーフローを引き起こす。このシナリオでは、パケットが、決してデジッタバッファに到着しないため、アンダーフローは、デジッタバッファ遅延を使って修正することができない。一方、アンダーフローは、パケットが遅延し、これの再生時刻後に到着した結果として発生することもある。遅延パケットによるアンダーフローを追跡することに加えて、適応デジッタバッファは、喪失パケットによるアンダーフローも追跡し得る。
【0025】
遅延パケットによるアンダーフローの数は、デジッタバッファ遅延でのアンダーフローをトレードオフすることによって制御され得る。遅延パケットによるアンダーフローの目標パーセンテージを表す値を、「アンダーフロー目標」という。この値は、デジッタバッファの操作の目標値であり、エンドツーエンド遅延を妥当な限度内に保持するように選択される。一例では、1%(0.01)の値が「アンダーフロー目標」として使用され得る。別の例では、0.5%(0.005)の値を使用する。「アンダーフロー目標」を達成するために、デジッタバッファ遅延が適合され得る。
【0026】
本発明の一例では、遅延パケットによるアンダーフローのパーセンテージのフィルタリングされた値(以後、「遅延アンダーフロー」という)を使って、デジッタバッファ遅延が調整され得る。各無音期間の終了(又は各有音部の開始)時に、図6に示すようにデジッタバッファ遅延が更新される。図6に示すように、アルゴリズムは、以下を指定する。
【0027】
1)If(PERdelay<TARGET_VALUE)then
DEJITTER_DELAY=DEJITTER_DELAY−CONSTANT;
2)If(PERdelay>TARGET_VALUE&&PERdelay>=last_PERdelay)then
DEJTTTER_DELAY=DEJITTER_DELAY+CONSTANT;
3)Set DEJITTER_DELAY=MAX(MIN_JITTER,DEJITTER_DELAY);
AND
4)DEJTTER_DELAY=MIN(MAX_JITTER,DEJITTER_DELAY)(1)
本例では、初期デジッタバッファ遅延は、40ミリ秒などの定数に設定され得る。TARGET_VALUEは、「遅延アンダーフロー」の目標値(1%など)である。PERdelayは、パケットの「遅延アンダーフロー」率のフィルタリングされた値であり、フィルタのパラメータは、TARGET_VALUEが達成されるようにする。last_PERdelayは、デジッタバッファ遅延の前の更新時におけるPERdelayの値である。DEJITTER_DELAYは、前に定義した目標デジッタバッファ長である。本例では、CONSTANTは20ミリ秒に相当する。MIN_JITTERとMAX_JITTERは、デジッタバッファ遅延の最小値と最大値であり、一例によれば、これらは、それぞれ、20ミリ秒と80ミリ秒に設定される。MIN_JITTERとMAX_JITTERは、システムシミュレションに基づいて推定され得る。各値(MIN_JITTER、MAX_JITTER、CONSTANT)は、デジッタバッファが配置される通信システムに応じて最適化され得る。
【0028】
PERdelayは、各無音期間の終了時、又は各有音部の開始時に更新されてもよく、以下のように計算される。
【数1】

【0029】
PER_CONSTANTは、PERdelayを推定するのに使用されるフィルタの時間定数である。この定数の値は、フィルタのメモリを決定し、TARGET_VALUEが達成されるようにする。Current_PERdelayは、PERdelayの最後の更新から現在の更新までの間に観測される「遅延アンダーフロー」の割合である。
【0030】
Current_PERdelayは、遅延アンダーフローパケットの数と、PERdelayの最後の更新から現在の更新までの間に受け取られたパケットの合計数の比として定義される。
【数2】

【0031】
図6を参照すると、デジッタバッファ遅延を計算し、更新するプロセス100は、ステップ101で開始してDEJITTER_DELAYを初期設定する。比較として、ステップ102で、PERdelayがTARGET_VALUEと比較される。PERdelayがTARGET_VALUEより小さい場合、ステップ104で、CONSTANT値がDEJITTER_DELAYから差し引かれる。ステップ102でPERdelayがTARGET_VALUEより大きく、ステップ103で、PERdelayがTARGET_VALUEより大きく、かつLAST_PERDELAY以上であり、ステップ102で最後のPERdelay以上である場合、処理は判断108に進む。ステップ108で、DEJITTER_DELAYは、DEJITTER_DELAY+CONSTANT値に設定される。ステップ103に続いて、PERdelayがTARGET_VALUE以下であり、LAST_PERDELAY未満である場合、処理はステップ110に進む。また、ステップ104に続いて、DEJITTER_DELAYは、ステップ110で、MIN_JITTERとDEJITTER_DELAYの最大値に設定される。ステップ110から、処理は、ステップ112に進み、ステップ112で、DEJITTER_DELAYを、MAX_JITTERとDEJITTER_DELAYの最大値に設定する。
【0032】
遅延追跡
デジッタバッファは、(アンダーフロー率を追跡するのではなく)遅延を追跡するモードに入ることもできる。追跡される遅延は、エンドツーエンド遅延でもデジッタバッファ遅延でもよい。一例では、デジッタバッファは、目標アンダーフロー率が容易に満たされ得るときに、「遅延追跡」モードに入る。これは、デジッタバッファが、ある期間にわたって、目標アンダーフロー率より低いアンダーフロー率を達成することができることを意味する。この期間は、数百ミリ秒から数秒までの期間とすることができる。
【0033】
このモードでは、デジッタバッファは、目標遅延値を有する。これは、前述のアンダーフロー目標値に類似したものである。アンダーフロー率を目標とするのに使用され得る前述の式(1)は、類似のやり方で、目標遅延値を計算するのにも使用され得る。デジッタバッファが、目標遅延値を目標とするこのモードに入ると、このモードは、目標遅延が維持されている限り、デジッタバッファがこれの目標アンダーフロー率を低減することを可能にする。
【0034】
暗黙的バッファ適応
状況によっては、復号器は、まだ受け取られていないパケットの再生を期待することがある。図5に、この状況が示されており、PKT50の予期される再生時刻はtであるが、PKT50は、この時刻の後で受け取られる。同様に、PKT51も、これの予期される再生時刻tの後で受け取られ、PKT52も、これの予期される再生時刻t後で受け取られ、以下同様である。ここでは、パケットは、ほとんど規則的に到着するが、PKT50がこれの予期される再生時刻のわずか後で受け取られたために、すべての後続のパケットもこれらの再生時刻を外すことになったことに留意すべきである。他方、復号器が、時刻tに消去を挿入し、しかも、PKT50をtに再生することができた場合には、すべてのパケットがこれらの再生時刻を満たすことが可能になるはずである。PKT50の代わりの消去が再生された後でPKT50を再生することによって、デジッタバッファ長は、事実上適合される。
【0035】
PKT50の消去後のPKT50の再生は、不連続を引き起こすことがあり、これは、2005年7月7日に出願された、「ボコーダにおける位相整合(PHASE MATCHING IN VOCODERS)」という名称の、同時係属中の出願第11/192,231号明細書に記載されている位相整合技術を使って除去され得ることに留意されたい。
【0036】
図7Aに示すように、パケットの受信に際しては、PKT3とPKT4の間の時間の間隙のようなギャップが発生し得る。パケット到着の際の遅延は、各パケットごとに異なり得る。デジッタバッファは、遅延を補償するための調整と共に直ちに応答し得る。図示のように、PKT1、PKT2及びPKT3は、それぞれ、時刻t、t、及びtに受け取られる。時刻tには、PKT4が受け取られると予期されているが、PKT4は、まだ到着していない。図7Aでは、パケットが20ミリ秒ごとに受け取られることになっている。本図では、PKT2は、PKT1の20ミリ秒後に受け取られ、PKT3はPKT1の40ミリ秒後に受け取られる。PKT4は、PKT1の60ミリ秒後に受け取られると期待されているが、PKT1の80ミリ秒後まで到着しない。
【0037】
図7Bでは、最初の受信パケットPKT1の再生前に、デジッタバッファにおいて初期遅延が導入される。ここでは初期遅延をDinitとする。この場合、PKT1はバッファによって時刻Dinitに、PKT2は時刻Dinit+20ミリ秒に、PKT3は時刻Dinit+40ミリ秒に再生され、以下同様である。図7Bでは、PKT4が期待される時刻Dinit+60ミリ秒に到着できないとき、デジッタバッファによって消去が再生され得る。次のパケット再生時に、デジッタバッファは、PKT4を再生しようとする。PKT4がまだ到着していない場合、時刻Dinit+80ミリ秒に別の消去が送られ得る。消去は、PKT4がデジッタバッファに到着するまで再生され続ける。PKT4がデジッタバッファに到着すると、PKT4が再生される。このような処理は、PKT4が受け取られるまで他のパケットが再生されないため、遅延を生じる。システムが回復することができない、すなわち、PKT4を全く受け取らないとき、システムは、プロセスのリセットを適用し、PKT4を再生せずに、PKT4に続くパケットを再生させてもよい。前述のシナリオでは、PKT4が到着する前に、消去が長期間にわたって送られ続けることになり得るため、デジッタバッファのエンドツーエンド遅延が増大する可能性がある。
【0038】
これに対して、図7Cに示す例によれば、パケットが到着できなかった場合、又はパケットの受信が遅れた場合、PKT4の期待される再生時刻に消去が再生される。これは、システムがPKT4の到着を待つ、上記図7Bとの関連で説明したシナリオと類似している。次の再生時刻に、PKT4がまだ到着しておらず、次のパケットPKT5が到着している場合には、PKT5が再生される。さらに説明するために、PKT4の受信が遅延し、デジッタバッファが、PKT4を、時刻Dinit+80ミリ秒に受け取ることになっていると仮定する。PKT4が遅延すると、消去が再生される。時刻Dinit+100ミリ秒に、PKT4がまだ到着していない場合には、別の消去を再生するのでなく、PKT5が再生される。この第2のシナリオでは、遅延のための調整が直ちに行われ、通信ネットワークにおける過剰なエンドツーエンド遅延が回避される。再生前にバッファに格納されるデータのサイズが、データの受信に従って増減するため、このプロセスをIBAという。
【0039】
暗黙的バッファ適応(IBA)プロセス200を図8Aの流れ図で示す。プロセス200は、出力コントローラ760やデジッタバッファコントローラ756など、適応デジッタバッファ内のコントローラで実施され得る。プロセス200は、適応デジッタバッファをサポートするシステム内の別の部分にあってもよい。ステップ202で、適応デジッタバッファで、次の再生用パケットを提供するよう求める要求が受け取られる。次のパケットが、シーケンス中のインデックスiを有するパケット、具体的にはPKT[i]として識別される。204で、暗黙的バッファ適応(IBA)モードが使用可能にされている場合、処理は、206に進んで、IBAモードに従って処理を行う。IBAモードが使用不可にされている場合、処理は、226に進んで、IBAモードなしで処理を行う。
【0040】
206でPKT[i]が受け取られた場合、適応デジッタバッファは、ステップ208で、再生のためにPKT[i]を提供する。ステップ210でIBAモードが使用不可にされ、インデックスiの増分、すなわち、(i=i+1)が行われる。さらに、206でPKT[i]が受け取られず、ステップ214でPKT[i+1]が受け取られた場合、処理はステップ216に進んでPKT[i+1]を再生する。ステップ218でIBAモードが使用不可にされ、ステップ220でインデックスiの2回増分、すなわち(i=i+2)が行われる。
【0041】
214で、PKT[i]とPKT[i+1]が受け取られない場合、コントローラは、ステップ222で消去の再生を開始し、ステップ224でインデックスiが増分される。なお、本例では、IBAモードにあるとき、コントローラは、ステップ202で受け取られるような、次のパケットを求める要求に応答して、最大2つまでのパケットの有無をチェックすることに留意されたい。これにより、事実上、コントローラが受信パケットをサーチするためのパケット窓が実施される。代替例では、例えば3つのパケットをサーチするなど、異なる窓サイズを実施してもよく、本例では、これは、パケット連番i、i+1、及びi+2になる。
【0042】
204に戻って、IBAモードが使用可能にされない場合、処理は226に進んで、PKT[i]が受け取られたどうか判定する。受け取られた場合、ステップ228で、PKT[i]が再生のために提供され、ステップ230でインデックスiが増分される。226でPKT[i]が受け取られない場合、適応デジッタバッファは、ステップ232で、再生のために消去を提供する。PKT[i]が受け取られず、代わりに消去が再生されたため、IBAモードが使用可能とされる。
【0043】
図8Bは、IBAモードに関連する状態図である。通常モード242にあるとき、適応デジッタバッファが再生のためにPKT[i]を提供する場合、コントローラは、通常モードのままである。コントローラは、消去が再生されるときに、通常モード242からIBAモード240に遷移する。IBAモード240になると、コントローラは、消去の再生時にIBAモード240のまま留まる。コントローラは、PKT[i]又はPKT[i+l]の再生時にIBAモード240から通常モード242に遷移する。
【0044】
図9は、図8A及び8Bに示すようなIBAを実施するデジッタバッファの一例である。本図において、再生ユーティリティは、復号器に再生のためのサンプルを要求する。次いで、復号器は、デジッタバッファに、再生ユーティリティによる中断なしの再生を可能にするのに十分なパケットを要求する。本図では、パケットは、音声通信を搬送し、再生ユーティリティは、20ミリ秒ごとにサンプルを再生する。代替システムは、他の構成によって、デジッタバッファから再生ユーティリティにパケット化データを提供してもよく、パケット化データは、音声通信以外でもよい。
【0045】
図9で、デジッタバッファは、パケットのスタックとして示されている。この図では、バッファは、まず、PKT49を受け取り、続いて、PKT50、51、PKT52、PKT53、以下同様に受け取る。この図におけるパケット番号は、パケットの順序を指す。しかしながら、パケット化システムでは、パケットがこの順序で受け取られる保証はない。理解を明確にするために、この図では、パケットが、送信されたのと同じ番号順に受け取られ、これは、再生の順序でもあるものとする。説明のために、図9では、デジッタバッファ内で、後で受け取られるパケットが、前に受け取られるパケットの上に積み重ねられ、すなわち、例えば、PKT49は、PKT50の上に積み重ねられ、PKT51は、PKT50の上に積み重ねられ、以下同様であるものとする。デジッタバッファ内のスタックの最下部にあるパケットは、再生ユーティリティに送られる最初のパケットである。また、本図では、目標デジッタバッファ長が示されていないことにも留意されたい。
【0046】
図9では、パケットの受信、パケットの予期される受信時刻、及びパケットの再生時刻が時間に対してグラフで表されている。パケットが受け取られる都度の更新バッファ状況が示されている。例えば、PKT49は、時刻tに受け取られ、時刻tに再生されると予期されている。PKT49受信時のバッファ状況は、PKT49の受信時刻である時刻tの上の、グラフ最上部に示されている。デジッタバッファで受け取られる各パケットごとの受信時刻は、「受信済み」として表されている。「予期される再生」時刻は、「受信済み」時刻のすぐ下に表されている。再生時刻は、「再生」として識別されている。
【0047】
この例では、最初、次の再生用パケットは、PKT49であり、これは、時刻tに再生されると予期されている。次の順次パケットは、時刻tなどに期待される。最初のパケットPKT49は、予期される再生時刻tの前に受け取られる。したがって、PKT49は、予期されるように時刻tに再生される。次のパケットPKT50は、時刻tに予期されている。しかしながら、PKT50の受信は遅延し、PKT50の代わりに消去が再生ユーティリティに送られる。PKT50の遅延は、前述のようにアンダーフローを引き起こす。PKT50は、予期される再生時刻tの後、次の予期される再生時刻tの前に受け取られる。受け取られると、PKT50は、デジッタバッファに格納される。したがって、時刻tに再生すべきパケットを求める次の要求が受け取られたとき、システムは、デジッタバッファ内で最も低い順番のパケットを探し、時刻tに再生するために、PKT50が再生ユーティリティに提供される。なお、IBAを使用すると、PKT50は、予定通りに再生するのに間に合うように受け取られなくても、遅れて再生され、シーケンスの残りの部分が、この時点から再開される。図示のように、後続のパケットPKT51、PKT52などが受け取られ、時間通りに再生されて、消去が回避される。
【0048】
IBAは、パケットのエンドツーエンド遅延を増大させるように見えることもあるが、これは、実際にはそうではない。IBAは、より少数のアンダーフローをもたらすため、前述の式1から推定されるデジッタバッファの値は、より低い値に維持される。したがって、IBAの全体的な効果は、全体としてのパケットの平均エンドツーエンド遅延の低減とすることができる。
【0049】
IBAは、有音部を有する通信の処理を向上させることができる。有音部とは、音声通信の音声部分を指し、音声通信は、通常の発話パターンに呼応して、音声部分と無音部分を含む。音声処理では、ボコーダが、ある種類の音声用のパケットと、別の種類の無音用のパケットとを生成する。音声パケットは、ある符号化率で符号化され、無音部は、異なる符号化率で符号化される。符号化パケットがデジッタバッファで受け取られるとき、デジッタバッファは、符号化率からパケットの種類を識別する。デジッタバッファは、音声フレームが有音部の一部であると仮定する。最初の非無音フレームが、有音部の先頭である。有音部は、無音パケットが受け取られたときに終了する。不連続送信では、すべての無音パケットが送信されるとは限らない。というのは、受信側は、通信の無音部分を説明するために擬似雑音を実施することがあるからである。連続送信では、すべての無音パケットが送信され、受信される。一例では、デジッタバッファは、受け取られるパケットの種類に従ってデジッタバッファ長を調整する。言い換えると、システムは、通信の無音部分に必用とされるデジッタバッファの長さを低減しようとし得る。なお、IBAの方法は、再生が、定率など、所定のタイミング方式によるものである任意の通信に適用できることに留意されたい。
【0050】
時間伸縮
有音部は、一般に、複数のデータパケットからなる。一例では、有音部の第1のパケットの再生が、デジッタバッファ遅延に等しい長さだけ遅延され得る。デジッタバッファ遅延は、様々なやり方で決定され得る。1つのシナリオでは、デジッタバッファ遅延は、上記式(1)などのアルゴリズムに基づく、計算されたデジッタバッファ遅延とすることができる。別のシナリオでは、デジッタバッファ遅延は、デジッタバッファ遅延の長さに等しい音声データを受け取るのに要する時間とすることができる。代替として、デジッタバッファ遅延は、前述の値の小さい方として選択されてもよい。この例では、デジッタバッファ遅延が、式1を使って60ミリ秒と計算され、有音部の第1のパケットが、第1の時刻tに受け取られるものと仮定する。第1のパケットの50ミリ秒後に有音部の次のパケットが受け取られるとき、適応デジッタバッファデータは、デジッタ遅延60ミリ秒に等しい。すなわち、適応デジッタバッファでのパケットの受信から再生までの時間は60ミリ秒である。なお、適応デジッタバッファの目標長は、60ミリ秒の遅延を達成するように設定され得ることに留意されたい。かかる計算により、遅延時間を満たすためにいくつのパケットを格納すべきかが求められる。
【0051】
適応デジッタバッファは、バッファからのデータの出し入れを監視し、バッファを、目標遅延長、すなわち、目標遅延時間を達成するデータ量に維持するように、バッファの出力を調整する。デジッタバッファが有音部の第1のパケットを再生に送るときには、Δ=MIN(デジッタバッファ遅延,デジッタ遅延に等しい音声データを受け取るのに要する時間)である、Δに相当する遅延が生じる。有音の後続のパケットは、Δ+前のパケットを再生するのに要する時間だけ遅延される。よって、同じ有音部の後続パケットのデジッタバッファ遅延は、第1のパケットのデジッタバッファ遅延が定義された後で、暗黙的に定義される。実際には、このデジッタバッファ遅延の定義は、図10に示すような状況に対応するためのさらなる考慮事項を必要とし得る。
【0052】
図10に、有音部中の音声情報の送信を示す。有音部150は時刻tに受け取られ、有音部154は、時刻tに受け取られる。有音部150と有音部154の間に受け取られる、20ミリ秒の無音期間時間152がある。受け取り次第、適応デジッタバッファは、受信データを格納し、各有音部の再生のための遅延を決定し得る。この例では、有音部150が時刻tに適応デジッタバッファで受け取られ、適応デジッタバッファ遅延時間は、80ミリ秒と計算される。デジッタバッファ遅延が受信時刻に加えられて、再生時刻を生じる。このように、有音部150は、再生の前に、適応デジッタバッファによって80ミリ秒だけ遅延される。有音部150は、t=t+80ミリ秒、すなわち、有音部150が受け取られてから80ミリ秒後である、時刻tに再生を開始し、時刻tに再生を完了する。式1などのアルゴリズムを使って前述のように目標デジッタバッファ長を計算すると、有音部154に適用されるデジッタバッファ遅延は40ミリ秒である。これは、有音部154の第1のパケットが、t=t+40ミリ秒、すなわち有音部154が受け取られてから40ミリ秒後である、時刻tに再生されるべきであることを意味する。しかしながら、時刻tにおけるパケット154の再生は、tに再生を終了する有音部150の最後のパケットの再生と競合する。したがって、(パケット154の)計算されたデジッタバッファ遅延40ミリ秒は、有音部150が再生を終えるのに十分な時間を許容しない。かかる競合を回避し、両方のパケットが正しく再生されるようにするために、有音部154の第1のパケットは、有音部150の最後のパケットが、合間に無音期間を挟んで再生された後で、再生されるべきである。この例では、有音部150と有音部154が、時刻tからtまで重なり合う。したがって、このシナリオにおける再生方法は望ましくない。本明細書で説明するパケットの再生の間のオーバーラップを防ぐためには、前の有音部の最後のパケットがいつ再生されるか検出することが必要である。よって、パケットのデジッタバッファ遅延の計算では、オーバーラップ又は競合を回避するために、前に再生されるパケットの再生タイミングを考慮し得る。
【0053】
前述のように、一例では、デジッタバッファ遅延は、有音部の開始時に計算され、又は更新される。しかしながら、デジッタバッファ遅延の更新を有音部の開始時だけに制限すると、限界が生じることがある。というのは、有音部は、しばしば、長さが変動し、有音部の間の動作条件が変化し得るからである。図10の例を考察する。よって、有音部の間にデジッタバッファ遅延を更新する必要が生じ得る。
【0054】
なお、目標遅延長を維持するように適応デジッタバッファからのデータの流れを制御することが望ましいことに留意されたい。このように、適応デジッタバッファが様々な遅延でデータを受け取る場合、適応デジッタバッファからのデータは、バッファが、目標適応デジッタバッファ長を満たすのに十分なデータで満たされるように調整される。適応デジッタバッファが目標遅延長を維持するには不十分なパケットを受け取ることになるときには、時間伸縮を使ってパケットが拡張され得る。同様に、適応デジッタバッファが、過剰なパケットを受け取り、目標遅延長を上回るパケットを格納することになるときにも、時間伸縮を使って、パケットが圧縮され得る。適応デジッタバッファは、復号器と協働して、本明細書で説明するようにパケットを時間伸縮させてもよい。
【0055】
図11は、ネットワーク要素を介してやりとりする2つの受信機を含むシステムのブロック図である。受信機はAT252とAT282であり、図示のように、AT252及びAT282は、BS270を介した通信のために適合されている。AT252では、送信処理ユニット264が符号器260に音声データを送り、符号器260は、音声データをデジタル化し、パケット化されたデータを下位層処理ユニット258に送る。次いで、パケットがBS270に送信される。AT252がBS270からデータを受信するとき、データは、まず、下位層処理ユニット258で処理され、ここからデータのパケットが適応デジッタバッファ256に提供される。受信パケットは、目標デジッタバッファ長に到達するまで適応デジッタバッファ256に格納される。目標デジッタバッファ長に到達すると、適応デジッタバッファ256は、データを復号器254に送る。図示の例では、時間伸縮を実施する圧縮及び拡張が復号器254で行われてもよく、復号器254は、パケット化データを音声データに変換し、音声データを受信処理ユニット262に送る。本発明の別の例では、時間圧縮及び拡張(時間伸縮)が、コントローラ(図示せず)によって適応デジッタバッファ内で行われることもある。AT282の挙動は、AT252の挙動と類似している。AT282は、送信処理ユニット294から符号器290、下位層処理ユニット288、最後にBS270までのパス上でデータを送信する。AT282は、下位層処理ユニット288から適応デジッタバッファ286、復号器284、受信処理ユニット292までのパス上でデータを受信する。これ以上の処理は図示されてはいないが、音声などのデータの再生に影響を及ぼすこともあり、オーディオ処理、画面表示などが関与し得る。
【0056】
式1で与えられるデジッタバッファの式では、有音部の開始時にデジッタバッファ遅延を計算する。デジッタバッファ遅延は、例えば、有音部数によって決まる特定のパケットの数を表すこともあり、音声データなどのデータの再生に相当する期待される時間を表すこともある。なお、デジッタバッファは目標サイズを有し、これが、デジッタバッファがあらゆる時点において格納されるものと期待するデータ量を決定することに留意されたい。
【0057】
チャネル条件や、他の動作条件によるパケット遅延のばらつきは、適応デジッタバッファにおけるパケット到着時刻の差異をもたらし得る。したがって、適応デジッタバッファ内のデータ量(パケット数)は、計算されたデジッタバッファ遅延値、DEJITTER_DELAYより大きいことも小さいこともある。例えば、パケットは、パケットが最初に符号器で生成された速度より低速で、又は高速でデジッタバッファに到着することもある。パケットが期待されるより低速でデジッタバッファに到着したとき、デジッタバッファは、着信パケットが同時に発信パケットを補充しなくなるため、枯渇し始める。一方、パケットが符号器での生成速度より高速で到着した場合、デジッタバッファは、パケットが、入ってくるのと同じ速度でデジッタバッファから出て行かないため、サイズが増大し始めることがある。前者の条件はアンダーフローをもたらし得るものであり、後者の条件は、デジッタバッファにおけるバッファリング時間がより大きくなるために、高いエンドツーエンド遅延を引き起こし得る。後者は重要である。というのは、パケットデータシステムのエンドツーエンド遅延が減少する場合(ATが負荷のより低い領域に移動し、又はユーザがチャネル品質のより良い領域に移動する場合)、音声の再生にこの遅延低減を組み込むことが望ましいからである。エンドツーエンド遅延は、重要な音声品質要因であり、再生遅延のいかなる低減も、会話又は音声品質の向上として知覚される。
【0058】
デジッタバッファにおいて、DEJITTER_DELAYと、デジッタバッファに実際に存在するデータ量の間の不一致を修正するために、デジッタバッファの一例は時間伸縮を用いる。時間伸縮は、音声パケットの期間を拡張し、又は圧縮することを伴う。デジッタバッファは、適応デジッタバッファが枯渇し始めるときに音声パケットを拡張し、適応デジッタバッファがDEJITTER_DELAYより大きくなるときに音声パケットを圧縮することによって時間伸縮を実施する。適応デジッタバッファは、復号器と協働してパケットを時間伸縮させてもよい。時間伸縮は、エンドツーエンド遅延を増大させずに、音声品質の実質的改善を実現する。
【0059】
図12は、時間伸縮を実施する適応デジッタバッファの一例のブロック図である。物理層処理ユニット302は、データスタック304にデータを提供する。データスタック304は、適応デジッタバッファ及び制御ユニット306にパケットを出力する。順方向リンク(FL)媒体アクセス制御(MAC)処理ユニット300は、デジッタ処理ユニット306にハンドオフ指示を提供する。MAC層は、物理層上で、すなわち、無線を介してデータを送受信するプロトコルを実施する。MAC層は、セキュリティ、暗号化、認証、及び接続情報を含み得る。IS−856をサポートするシステムでは、MAC層は、制御チャネル、アクセスチャネル、ならびに順方向及び逆方向トラフィックチャネルを管理する規則を含む。目標長推定器314は、式1で与えられる計算を使ってデジッタバッファに目標デジッタバッファ長を提供する。目標長推定器314への入力は、パケット到着情報及び現在のパケット誤り率(PER)を含む。なお、代替構成は、適応デジッタバッファ制御ユニット306内に目標長推定器314を含んでいてもよいことに留意されたい。
【0060】
一例では、適応デジッタバッファ制御ユニット306が、再生のために提供されるデータの速度を制御する再生制御をさらに含む。適応デジッタバッファ制御ユニット306から、パケットが不連続送信(DTX)ユニット308に送られ、DTXユニット308は、音声データが受け取られていないときに、復号器310に背景雑音を提供する。なお、適応デジッタバッファ制御ユニット306によって提供されるパケットは、復号化処理を受ける用意ができており、これをボコーダパケットと呼んでもよい。復号器310は、パケットを復号化し、パルス符号変調(PCM)音声サンプルを時間伸縮ユニット312に提供する。代替例では、時間伸縮ユニット312は、復号器310内で実施され得る。時間伸縮ユニット312は、適応デジッタバッファ制御ユニット306から時間伸縮標識を受け取る。時間伸縮標識は、制御信号でも、命令信号でも、フラグでもよい。一例では、時間伸縮標識を、例えば、圧縮、拡張、及び時間伸縮なしを有する多状態標識とすることができる。様々な圧縮レベル及び/又は様々な拡張レベルの様々な値があってもよい。一例では、時間伸縮標識は、時間伸縮ユニット312に、データを拡張し、又は圧縮するよう命令する。時間伸縮標識は、拡張、圧縮、又は伸縮なしを指示する。時間伸縮標識は、時間伸縮ユニット312における処置を開始する制御信号とみなされ得る。時間伸縮標識は、パケットをどのようにして拡張し、又は圧縮すべきか指定するメッセージとすることもできる。時間伸縮標識は、拡張と圧縮のどちらの処置を講じるべきかのみならず、時間伸縮すべきパケットも識別し得る。さらに、時間伸縮標識は、時間伸縮ユニット312に選択肢からの選択も提供し得る。無音間隔の間に、DTXモジュールは、デジッタバッファによって提供される消去のストリームを、復号器が、より正確で、高品質の背景雑音を再構築するのに使用する消去及び無音フレームのストリームに変更する。代替例では、時間伸縮標識は、時間伸縮をオンとオフにする。別の例では、標識は、再生に使用される圧縮及び拡張の量を識別する。時間伸縮ユニット312は、復号器からのサンプルを変更して、サンプルをオーディオ処理316に提供してもよく、オーディオ処理316は、オーディオドライバ及びスピーカのみならず、インターフェース変換ユニットを含んでいてもよい。
【0061】
時間伸縮標識は、圧縮すべきとき、又は拡張すべきときを識別するが、所与のパケットにどれ程の時間伸縮を適用すべきか決定する必要がある。一実施形態では、時間伸縮の量が固定されており、パケットが、音声サイクル又はピッチに従って時間伸縮される。
【0062】
一実施形態では、時間伸縮標識は、目標拡張又は目標圧縮レベルのパーセンテージとして伝えられる。すなわち、時間伸縮標識は、所与のパーセントだけ圧縮し、又は所与のパーセントだけ拡張するよう指示する。
【0063】
1つのシナリオでは、着信データの知られている特性を認識することが必要とされ得る。例えば、符号器が、知られているトーンの、あるいは例えば、特定の長さの特性を有するデータを予期することがある。この状況では、特定の特性が予期されているため、時間伸縮を使って受信データを変更することは望ましくないはずである。例えば、符号器は、着信データが特定のトーンの長さを有することを期待し得る。しかしながら、時間伸縮が使用可能にされている場合、トーンの長さは、時間伸縮によって変更され得る。したがって、このシナリオでは、時間伸縮が使用可能にされるべきではない。トーンベースの通信には、これだけに限らないが、テレタイプライタ/聾唖者用通信機器(TTY/TDD)情報、キーパッド入力を使用する用途、又はトーンベースの通信を使った他の用途が含まれる。かかる通信では、トーンキャリア情報の長さ、したがって、再生時の圧縮又は拡張など、ピッチ又はトーンの長さを変更することは、この情報の損失をもたらし得る。TTY、TDD、及び聴覚障害を有する受け手による受信を可能にする他の用途では、復号器は、復号器によるかかる通信の帯域内処理の状況も提供する。この指示は、デジッタバッファによって提供される時間伸縮指示にマスクするのに使用される。復号器がTTY/TDD情報を有するパケットを処理する場合、時間伸縮は使用不可とされるべきである。これは、デジッタバッファコントローラにTTY/TDD状況を提供する、又は時間伸縮ユニットにTTY/TDD状況を提供するという、2通りのやり方で行われ得る。復号器のTTY/TDD状況がデジッタバッファコントローラに提供される場合、コントローラは、ボコーダがTTY/TDDの処理を指示するときに、どんな拡張指示も圧縮指示も指示すべきでない。復号器のTTY/TDD状況が時間伸縮ユニットに提供される場合、これはフィルタとして働き、時間伸縮ユニットは、復号器がTTY/TDD情報を処理している場合には、時間伸縮指示に従って動作しない。
【0064】
図12に示すシステムでは、適応デジッタバッファ制御ユニット306は、着信データの速度を監視し、過多な、又は過少なパケットが利用可能であり、又はバッファに入れられているときに、時間伸縮標識を生成する。適応デジッタバッファ制御ユニット306は、時間伸縮を行うべきときと、講じるべき処置を決定する。図13Aに、圧縮及び拡張閾値を使って時間伸縮決定を行う適応デジッタバッファの一例の動作を示す。デジッタバッファは、不規則な時間間隔で到着していることのあるパケットを蓄積する。デジッタ目標長推定器314は、目標デジッタバッファ長を生成し、次いで、目標デジッタバッファ長がデジッタバッファに適用される。実際には、適応デジッタバッファ制御ユニット306は、デジッタバッファ長の値を使って、デジッタバッファ操作に関する制御決定を行い、再生を制御する。圧縮閾値及び拡張閾値は、それぞれ、いつ圧縮又は拡張がトリガされるべきか指示する。これらの閾値は、デジッタ目標長のある一定の割合として指定され得る。
【0065】
図13Aに示すように、目標デジッタバッファ長は、LTargetとして与えられる。圧縮閾値は、Tcompressとして与えられ、拡張閾値はTExpandとして与えられる。デジッタバッファ長が圧縮閾値Tcompressを上回るまで増大すると、デジッタバッファは、復号器に、パケットが圧縮されるべきであると指示する。
【0066】
同様に、デジッタバッファ長が拡張閾値TExpandを下回るまで枯渇すると、デジッタバッファは、復号器に、パケットが拡張され、事実上、より低速で再生されるべきであると指示する。
【0067】
拡張閾値と圧縮閾値の間の動作点が、アンダーフローと、エンドツーエンド遅延の過度な増大を回避する。したがって、目標動作は、TcompressとTExpandの間にある。一例では、拡張閾値及び圧縮閾値の値は、それぞれ、デジッタバッファの目標値の50%と100%に設定される。一例では、時間伸縮が復号器内部で行われ得るが、代替例では、この機能が、復号器の外部、例えば、復号化の後で行われてもよい。しかしながら、信号を同期させる前に信号を時間伸縮させた方がより簡単になり得る。かかる時間伸縮方法が、信号の復号化後に適用された場合、信号のピッチ周期を推定する必要があるはずである。
【0068】
いくつかのシナリオ、例えば、W−CDMA方式などでは、デジッタバッファ長がより長いことがある。時間伸縮閾値発生器が、複数の圧縮閾値及び拡張閾値を生成し得る。これらの閾値は、動作条件に応答して計算され得る。図13Bに、多重レベルの閾値を示す。TC1は第1の圧縮閾値であり、TC2は第2の圧縮閾値であり、TC3は第3の圧縮閾値である。また、3つの異なる拡張閾値の値を表すTE1、TE2及びTE3も示されている。これらの閾値は、時間伸縮のパーセンテージ(いくつのパケットが時間伸縮されるか)、圧縮されるパケット、拡張されるパケットのパーセンテージ又はこれら2つの値の比率に基づくものとすることができる。閾値の数は、必要に応じて変更されてもよく、言い換えると、より多くの、又は少ない閾値が必要とされることもある。閾値のそれぞれは、異なる圧縮率又は拡張率に関連し、例えば、より細かい粒度を必要とするシステムでは、より多くの閾値が使用され、より粗い粒度では、より少ない閾値が使用され得る。TE1、TE2、TE3などは、目標遅延長の関数とすることができる。閾値は、遅延アンダーフローを追跡することにより、PERなどの誤り統計に基づいて変更され得る。
【0069】
図14に、時間伸縮ありとなしでのパケットの再生を示す。図14では、PKT1が時刻tに送信され、PKT2が時刻tに送信され、以下同様である。各パケットは、指示されるように受信側に到着し、PKT1はt’に到着し、PKT2はt”に到着する。各パケットごとに、時間伸縮を使用しない再生時刻が「伸縮なしの再生」として与えられる。これに対して、時間伸縮を使用する再生時刻が「伸縮ありの再生」として与えられる。本例は、音声通信など、リアルタイムデータのものであるため、パケットの予期される再生時刻は、固定された時間間隔にある。再生時、理想的には、各パケットは予期される再生時刻の前に到着する。パケットが予期される時刻の再生に間に合わずに到着した場合、再生品質に影響を及ぼし得る。
【0070】
PKT1及びPKT2は、予定時刻に受け取られ、時間伸縮なしで再生される。PKT3及びPKT4は、両方とも、同時に、t’に受け取られる。両パケットの受信時刻は、十分間に合うものである。というのは、各パケットが、PKT3に関連付けられた予期される再生時刻であるt”とPKTに関連付けられた予期される再生時刻であるt’の前に受け取られるからである。PKT3及び4は、伸縮なしで、予定どおり再生される。問題は、PKT5が、予期される再生時刻後の、時刻t’に受け取られるときに発生する。予期される再生時刻には、PKT5の代わりに消去が再生される。PKT5は、消去が再生し始まった後で、送れて到着する。
【0071】
伸縮なしの第1のシナリオでは、PKT5はドロップされ、PKT6は、次の予期される再生時刻に、受け取られ、再生される。なお、この場合、PKT6は、再生に間に合うように受け取られたことに留意されたい。第2のシナリオでは、PKT5及びPKT5に続くすべてのパケットが遅延する場合、各パケットが予期される再生には間に合わずに到着し、消去のストリングを生じることがある。これらのシナリオのどちらでも、情報が失われる。すなわち、第1のシナリオではPKT5がドロップされ、第2のシナリオでは、PKT5及び後続のパケットが失われる。
【0072】
代替として、IBA技術を使用すると、PKT5を次の予期される再生時刻に再生させることができ、後続のパケットがこの時点から続行する。IBAは、データの喪失を防ぐが、パケットのストリームを遅延させる。
【0073】
かかる時間伸縮なしの再生は、通信システムにおけるエンドツーエンド遅延全体を増大させることがある。図14に示すように、パケット間遅延は、情報喪失、又は再生の遅延を生じ得る。
【0074】
時間伸縮を実施することによって、PKT5がこれの予期される再生時刻の後で到着したときに、パケットが拡張され、消去が回避され得る。例えば、PKT4を拡張すると、再生を、20ミリ秒ではなく23ミリ秒で行わせることができる。PKT5は、これが受け取られたときに再生される。これは、(図14で説明している時間伸縮なしIBAありの再生の代替例に示すように)代わりに消去が送られた場合に再生されたはずの時刻より早い。消去を送る代わりにPKT4を拡張すると、再生品質の劣化がより少なくなる。よって、時間伸縮は、待ち時間低減のみならず、より良い全般的な再生品質を実現する。図14に示すように、PKT5に続くパケットは、時間伸縮を使うと、時間伸縮技術を使わない場合よりも早く再生される。この具体例では、時間伸縮が使用されるとき、PKT7が、時刻tに再生され、これは、時間伸縮なしの場合より早い。
【0075】
時間伸縮の1つの適用は、変化する動作条件と、音声の伝送に際しての送信情報の特性の変化を考慮しながら再生品質を改善するものである。音声特性は変動し、有音部と無音期間があるため、目標デジッタバッファ遅延長、ならびに各種のデータごとの圧縮閾値及び拡張閾値は異なり得る。
【0076】
図15に、ある有音部から別の有音部までのデジッタ遅延の差による、「無音圧縮」及び「無音拡張」の例を示す。図15では、影付きの領域120、124及び128は有音部を表し、影なしの領域122及び126は、受信情報の無音期間を表す。受け取られる際に、有音部120は、時刻tから開始し、時刻tに終了する。受信側で、デジッタバッファ遅延が導入され、したがって、有音部120の再生は、時刻t’に開始する。デジッタバッファ遅延は、時刻t’と時刻tの間の差として識別される。受け取られる際に、無音期間122は、時刻tに開始し、時刻tに終了する。無音期間122は、圧縮され、受け取られた無音期間122の元の期間より短い、時刻t’からt’までの無音期間132として再生される。有音部124は、発信元で、時刻tに開始し、時刻tに終了する。有音部104は、受信側で、時刻t’から時刻t’まで再生される。無音期間126(時刻tからtまで)は、再生時に受信側で無音期間136として拡張され、(t’−t’)は(t−t)より大きい。無音期間は、デジッタバッファがパケットをより早く再生する必要があるときに圧縮され、デジッタバッファがパケットの再生を遅延させる必要があるときに拡張され得る。一例では、無音期間の圧縮又は拡張が、音声品質のごくわずかな低下しか引き起こさない。よって、適応デジッタ遅延が音声品質を低下させずに達成され得る。図15の例では、適応デジッタバッファは、適応デジッタバッファによって識別され、制御されるように無音期間を圧縮し、拡張する。
【0077】
なお、本明細書で使用する場合、時間伸縮とは、受信データの到着時刻及び長さに応答した再生の適応制御をいう。時間伸縮は、再生時のデータの圧縮、再生時のデータの拡張を使って、又は再生時のデータの圧縮と拡張両方を使って実施され得る。一例では、閾値を使って圧縮がトリガされる。別の例では、閾値を使って拡張がトリガされる。別の例では、圧縮のためのトリガと、拡張のためのトリガの2つのトリガが使用される。さらに別の例では、様々なレベルの時間伸縮、例えば、様々な速度での高速再生などを含む複数のトリガを用いることもある。
【0078】
また、時間伸縮は、復号器内部で実行されてもよい。復号器時間伸縮を実行する技法は、2005年5月5日に出願された、「残差変更によるボコーダ内部の時間伸縮フレーム(Time Warping Frames Inside the Vocoder by Modifying the Residual)」という名称の、同時係属中の出願第11/123,467号に記載されている。
【0079】
一例では、時間伸縮は、音声のセグメントを「マージする」方法を組み込んでいる。音声セグメントのマージは、少なくとも2つの連続する音声セグメントにおける音声サンプルを比較し、比較されたセグメント間に相関が見つかった場合、少なくとも2つの連続するセグメントの単一セグメントを作成することを伴う。音声のマージは、音声品質を保持しようとしながら行われる。音声品質を保持し、「クリック音」や「ポップ音」を含めて、ユーザにとっての品質を低下させる音などのアーチファクトの出力音声への導入を最小限に抑えることは、マージすべきセグメントを慎重に選択することによって達成される。音声セグメントの選択は、セグメント類似性又は相関に基づくものである。音声セグメントの類似性が大きいほど、結果として生じる音声品質は良好になり、音声アーチファクトを導入する可能性が低くなる。
【0080】
図16に、時間の経過に対してグラフ化した音声信号を示す。縦軸は、信号の振幅を表し、横軸は、時間を表す。なお、音声信号は、特徴的なパターンを有し、音声信号の部分が時間の経過と共に反復することに留意されたい。この例では、音声信号は、時刻tからtまでの第1のセグメントを含み、これは、tからtまでの間の第2のセグメントとして反復する。かかるセグメントの反復が見られるとき、時刻tから時刻tまでのセグメントなど、セグメントの1つ又は複数が、サンプルの再生品質にほとんど、又は事実上全く影響を及ぼさずに除去され得る。
【0081】
一例では、以下に示す式4を使って、2つの音声セグメントの間の関係が検出され得る。相関は、2つのセグメントの間の関係の強さの尺度である。式4は、関係の強さの尺度として絶対的で有界の相関係数(−1から+1まで)を提供し、低い負の数は、より強い関係、すなわち、より大きい相関を反映する高い正の数よりも弱い関係、すなわち、より小さい相関を反映する。式4の適用で「十分な類似性」が示される場合、時間伸縮が行われる。式4の適用でほとんど類似性が示されない場合、マージされた音声セグメントにアーチファクトが存在し得る。相関は、以下の式で与えられる。
【数3】

【0082】
式4において、x及びyは、2つの音声セグメントを表し、mは2つのセグメント間の相関が計算される窓を表し、dは相関部分を表し、iはインデックスである。式4の適用が、各セグメントがアーチファクトを導入せずにマージされ得ることを示している場合、マージが、「追加/オーバーラップ」技法を使って行われ得る。追加/オーバーラップ技法は、比較されたセグメントを組み合わせ、2つの別々の音声セグメントから1つの音声セグメントを生成する。追加/オーバーラップを使った組み合わせは、以下に示す式5などの式に基づくものとすることができる。
【数4】

【0083】
結果として生じるサンプルは、パルス符号変調(PCM)サンプルとすることができる。各PCMサンプルは、このPCMサンプルのビット長及びフォーマットを定義する所定のフォーマットを有する。例えば、16ビット符号付き数を、PCMサンプルを表すフォーマットとすることができる。式5の適用によって生じる追加/オーバーラップ技法は、セグメント1の第1のPCMサンプルとセグメント2の最後のPCMサンプルの間の円滑な遷移を提供するための重み付けを含む。式5において、「Rウインドウサイズ」は、参照窓内のPCMサンプルの数であり、「アウトセグメント」は、結果として生じる追加/オーバーラップセグメントのサイズである。「ウインドウサイズ」は参照窓サイズに等しく、「セグメント」は、目標セグメントサイズである。これらの変数は、サンプリング速度、音声の周波数内容、及び品質と計算の複雑さの間の所望のトレードオフに応じて決まる。
【0084】
前述の追加/オーバーラップ技法を図17A及び17Bに示す。図17Aには、160PCMサンプルからなる音声セグメントが示されている。この例では、Rウインドウサイズが、PCMサンプル0〜47で表される。言い換えると、PCMサンプル0〜47は、サイズウインドウサイズの参照窓内のサンプル数に対応する。セグメントは、目標サーチ領域のサイズをいい、PCMサンプル10〜104で表される。この例では、PCMサンプル0〜47が、サンプル10〜104と、1度に1PCMサンプルずつ比較されて、参照サンプルと目標サーチ領域の間の最大の相関が検出される。最大相関が検出される目標サーチ領域内の場所を「オフセット」という。オフセットの点において、Rウインドウサイズは、Rウインドウサイズのサイズに対応するセグメントの部分と組み合わされ得る。PCMサンプル104〜160に対応する音声セグメントはそのままとされる。
【0085】
図17Bでは、音声セグメントの最初のRウインドウサイズサンプルが音声セグメントの後続部分と、一度に1PCMサンプルずつ比較される。Rウインドウサイズと目標サーチ領域(セグメント)内のサンプルの対応する長さの間で最大相関が検出される場所が「オフセット」である。オフセットの長さは、音声セグメントの先頭から、Rウインドウサイズとセグメントの間の最大相関点までの距離である。最大相関が検出されると、Rウインドウサイズが、(オフセットの点において)対応する長さのセグメントとマージされる。言い換えると、Rウインドウサイズを、同じ長さのセグメントの部分に追加することによって追加/オーバーラップが行われる。これは、図示のようにオフセットの点において行われる。残りのサンプルは、図示のように、元のセグメントからコピーされる。結果として生じる音声セグメントは、残りのサンプルが元の音声セグメントからそのままコピーされ、図示のようにマージされたセグメントに付加されたものからなる。結果として生じるパケットは、オフセットの長さ分だけ、元のセグメントより短い。このプロセスを音声圧縮という。音声セグメントがより小さく圧縮されるほど、人が品質低下を検出し得る可能性も低くなる。
【0086】
音声拡張は、デジッタバッファが少数の音声パケットを含むときに行われる。アンダーフローの確率は、デジッタバッファが少数のパケットを有する場合に増大する。デジッタバッファは、アンダーフローが発生するとき、復号器に消去を供給してもよい。しかしながら、これは、音声品質の低下をもたらす。かかる音声品質の低下を防ぐために、デジッタバッファ内の最後のいくつかのパケットの再生が遅延され得る。これは、パケットを拡張することによって達成される。
【0087】
音声拡張は、音声セグメントの複数のPCMサンプルを反復することによって達成され得る。アーチファクトやピッチの平坦性を回避しつつ複数のPCMサンプルを反復することは、音声時間圧縮が行われるときよりも多くのPCM音声サンプルを処理することによって達成される。例えば、音声拡張を実施するのに使用されるPCMサンプルの数は、音声時間圧縮で使用されるPCMサンプルの数の2倍とすることができる。追加のPCMサンプルは、前に再生された音声のパケットから獲得され得る。
【0088】
図18Aに、各パケット又は音声セグメントが160PCMサンプルの長さであり、「事前拡張」音声セグメントが生成される、音声拡張の一例を示す。この例では、2つの音声のセグメント、すなわち、「現在の」音声セグメントと「以前の」音声セグメントとが比較される。現在の音声セグメントの最初のRウインドウサイズPCMサンプルが、参照サンプルとして選択される。これらのRウインドウサイズサンプルは、最大相関(又はオフセット)の点が決定されている、音声の前のパケットのセグメントと比較される。RウインドウサイズPCMサンプルは、オフセット点における前のパケット内の対応するサイズのセグメントを用いて追加/オーバーラップされる。図18Aに示すように、前の音声セグメントから、追加/オーバーラップされたセグメントにサンプルの残りの部分をコピーし、付加することによって事前拡張音声セグメントが作成される。この場合、拡張音声セグメントの長さは、図18Aに示すように、事前拡張セグメントの長さ+現在の音声セグメントの長さである。この例では、PCMサンプルが、音声セグメントの先頭からオフセットされる。
【0089】
別の例では、現在のパケット又は音声サンプルが、図18Bに示すように拡張される。参照サンプルRウインドウサイズは、現在の音声セグメントの先頭に位置する。Rウインドウサイズが、最大相関(オフセット)の点が突き止められるまで、現在の音声パケットの残りの部分と比較される。参照サンプルは、現在の音声セグメント内で最大相関を有することが分かっている対応するPCMサンプルを用いて追加/オーバーラップされる。次いで、拡張音声セグメントは、パケットの先頭から開始するPCMサンプルをオフセットの点にコピーし、追加/オーバーラップされたセグメントをこれに付加し、残りのPCMサンプルを、変更せずに、現在のパケットからコピーし、付加することによって作成される。拡張音声セグメントの長さは、オフセット+元のパケットの長さの和に等しい。
【0090】
別の例では、音声が、図18Cに示すように拡張され、Rウインドウサイズが現在のパケット又は音声セグメント内に埋め込まれ、パケットの先頭では発生しない。Roffsetは、現在のパケットの先頭と、Rウインドウサイズが開始する点の間の距離に対応する音声セグメントの長さである。Rウインドウサイズは、最大相関の点において検出される現在のパケット内の対応するサイズのPCMサンプルを用いて追加/オーバーラップされる。次いで、拡張音声セグメントは、元の、又は現在のパケットの先頭から開始し、オフセットのところで終わるPCMサンプルをコピーし、追加/オーバーラップされたセグメントと、元のパケットからの残りのPCMサンプルを付加することによって作成される。結果として生じる拡張音声セグメントの長さは、元のパケットの長さ+オフセット−Roffsetサンプル、すなわち、前述のRoffset内のPCMサンプルの数である。
【0091】
フィルタリングされた時間伸縮閾値
圧縮及び拡張の決定が動揺するのを回避するために、適用デジッタバッファ内に格納されているパケットの数が急速に変動するときには、一例では、適応デジッタバッファの状況、すなわち、適応デジッタバッファ内に格納されたパケットの数を評価するのに使用される変数を、サンプリング窓上でフィルタリングする。適応デジッタバッファの状況は、適応デジッタバッファ内に格納されているパケットの数とすることもでき、又は適応デジッタバッファ内に格納されているデータを評価するのに使用される任意の変数とすることもできる。1xEV−DOと呼ばれるIS−856であるバーストデータ配信をサポートするシステムにおいて、所与の受信側へのパケット配信は、順方向リンク上で時分割多重化され、受信側は、いくつかのパケットを1つのインスタンスにおいて受け取り、続いてしばらくの間全くパケットを受け取らないことがある。この結果、受信側の適応デジッタバッファにおいてデータがバーストとして受け取られることになる。受信データは、事実上、「バンドル」されることになり、時間的に近接して到着する2つ以上のパケットのインスタンスが生じ得る。かかるバンドルは、パケットの拡張と圧縮の間での動揺を生じやすく、適応デジッタバッファは、受信データの速度とバッファの状況に応じて時間伸縮命令を提供する。例えば、計算されるデジッタバッファの値(遅延又は長さ)が、有音部の開始時に40ミリ秒である例を考える。後刻、デジッタバッファ負荷は、拡張閾値を下回り、データパケットを拡張する決定を下すことになる。このパケットの再生の直後、3つのパケットのバンドルが到着する。到着データは、デジッタバッファサイズを埋めて、圧縮閾値を上回るようになる。これは、パケットを圧縮させることになる。パケットのバンドルの到着後は、しばらくの間、全くパケットが到着しないことがあるため、デジッタバッファは、再度枯渇し、パケットを拡張させることになり得る。拡張と圧縮の間でのこの種の切り換わりは、高率のパケットを時間伸縮させることになり得る。時間伸縮により信号情報が変更されるパケットのパーセンテージは小さい値に制限された方がよいので、これは望ましくない。
【0092】
一例では、かかる動揺を、バンドルが、適応デジッタバッファの適応制御ならびにデータの時間伸縮及び再生に及ぼし得る影響を平滑化することによって回避する。この例では、いつ時間伸縮を行うべきか決定するに際して平均値を使用する。平均値は、かかる計算で使用される変数をフィルタリングすることによって計算される。一例では、圧縮及び拡張閾値は、デジッタバッファのサイズをフィルタリングし、又は平均することによって求められる。なお、バッファのサイズは、バッファの現在の状況を指すことに留意されたい。
【0093】
バッファのサイズのフィルタリングされた値を、拡張閾値と比較することにより、より多数のアンダーフローがもたらされ得る。というのは、フィルタリングされていない値を使った場合には拡張されたはずのパケットが、フィルタリングされた値を使うと拡張されないからである。他方、フィルタリングされた値を圧縮閾値と比較すると、ほとんど、又は事実上全く悪影響を受けずに、大部分の動揺(又は時間伸縮制御間の切り換わり)を抑制するのに役立ち得る。したがって、圧縮及び拡張閾値は、異なるやり方で処理され得る。
【0094】
一例では、適応デジッタバッファのサイズの瞬間値が、拡張閾値に対してチェックされる。これに対して、デジッタバッファのフィルタリングされた値は、圧縮閾値に対してチェックされる。1つの構成では、無限インパルス応答(IIR)フィルタを使って、適応デジッタバッファの平均サイズを決定し、適応デジッタバッファは、例えば、60ミリ秒ごとに1回など、周期的に再計算され得る、フィルタリングされた値を有する。フィルタ時間定数は、バンドル統計から導出されてもよく、これの1xEV−DO Rev.Aでの一例は、60ミリ秒とすることができる。バンドル統計がフィルタ時間定数を導出するのに使用されるのは、バンドル統計が、動作時に瞬間デジッタバッファサイズがどのように変動するかと強い相関性を有するためである。
【0095】
パケットの欠落による拡張
前述のように、適応デジッタバッファ、及び適応デジッタバッファを制御し、受信データの時間伸縮を制御する様々な方法は、特定のシステム仕様及び動作条件に適合させることができる。ハイブリッド自動再送要求(H−ARQ)方式など、性能を向上させる反復要求方式を実施する通信システムでは、かかる反復処理は、音声パケットがどのようにして拡張されるかに関する含意を有する。具体的には、H−ARQは、パケットを、並べ替えて(すなわち乱れた順序で)到着させることがある。ある長さと、目標デジッタバッファ長の50%として与えられる拡張閾値TExpandのデジッタバッファを示す図19を考察する。現在再生中のパケットは、連番20、すなわちPKT20を有する。デジッタバッファは、それぞれ、PKT21、PKT23及びPKT24と識別される、連番21、23及び24を有する3つのパケットを含む。再生ユーティリティが、PKT20の再生後に、次のパケットを要求するとき、拡張閾値はトリガしない。というのは、デジッタバッファが、バッファ長を、計算されるデジッタバッファ長の50%を超える長さに維持するのに十分なパケットを含むからである。したがって、本例では、PKT21が拡張されない。これは、PKT21が再生を終了する時刻までPKT22が到着しない場合、アンダーフローを引き起こし得る。というのは、パケットは順次に再生され、したがって、再生ユーティリティは、PKT22の前にPKT23を再生しない可能性があるからである。拡張閾値がトリガしなかった場合であっても、一例では、受信パケットの不連続を予期し、PKT22が到着するまでより長い時間を許容するようにPKT21を拡張するよう選択する。このようにして、PKT21の拡張は、欠落パケット及び消去を回避し得る。よって、パケットは、デジッタバッファ長が拡張閾値TExpandを上回る場合でさえも拡張され得る。
【0096】
パケットが拡張されるべき条件は、改善され得る。前述のように、パケットは、デジッタバッファサイズが拡張閾値を下回る場合に拡張され得る。別のシナリオでは、パケットは、次の連番を有するパケットがデジッタバッファに存在しない場合に拡張され得る。
【0097】
前述のように、デジッタバッファ遅延は、有音部の開始時に計算され得る。これだけに限らないが、チャネル条件及び付加条件を含むネットワーク条件は、有音部の間、特に、長い有音部の間に変化することがあるため、一例は、有音部の間にデジッタバッファ遅延を変更するように構成される。よって、前述のデジッタバッファ式は、有音部の間、CHANGE_JITTER_TIME秒ごとに、周期的に再計算され得る。代替として、変数は、動作条件、負荷、無線インターフェース指示又は他のイベントにおける有意な変化など、トリガイベント時に再計算されてもよい。一例では、CHANGE_JITTER_TIMEの値は、0.2秒(200ミリ秒)に設定され得る。
【0098】
時間伸縮閾値、例えば圧縮及び拡張閾値などは、有音部の間にどのようにして値を変更すべきかに関する指針を提供し得る。通常の動作とは、適応デジッタバッファ状況が圧縮閾値と拡張閾値の間の、目標デジッタバッファ長前後であるときの受信側の動作を指す。各閾値は、トリガとして働く。閾値に達し、又は閾値に違反したとき、適応デジッタバッファ内のパケットは、閾値に応じて拡張され、又は圧縮され得る。適応デジッタバッファのサイズは、パケットを受信しながら拡張し、又は収縮し続けてもよい。この適応デジッタバッファサイズの一定の変化は、通信の間に拡張及び圧縮閾値に絶えず近づきつつあることを示し得る。一般に、システムは、適応デジッタバッファサイズを、安定状態とみなされる、拡張閾値と圧縮閾値の間に保持しようとする。安定状態では、適応デジッタバッファのサイズが変更されず、パケットの受信に際しての変更、よって、適応デジッタバッファサイズの変更が、自動的に、圧縮閾値又は拡張閾値をトリガさせ、新しい適応デジッタバッファ遅延が達成されるまで、それぞれ、パケットを圧縮又は拡張させてもよい。このシナリオでは、適応デジッタバッファ目標遅延長は、CHANGE_JITTER_TIMEに従って更新される。デジッタバッファの実際のサイズは、必ずしも、計算され得るとは限らない。というのは、デジッタバッファサイズは、時間伸縮拡張閾値又は圧縮閾値のどちらかに到達した結果としてトリガされたときに自動的に変化するからである。一例では、CHANGE_JITTER_TIMEの値は、0.2(200ミリ秒)に設定され得る。
【0099】
ハンドオフ事前伸縮
ハンドオフは、通常、短期間にわたるカバレージの喪失によって達成される。ハンドオフが間近に迫っているとき、ATは、不良なチャネル条件及びパケット遅延の増大をこうむることがある。一例では、ハンドオフ条件を、音声パケットに時間伸縮を適用する特別なやり方で処理する。ATが新しい基地局にハンドオフしようとするや否や、この情報を使ってデジッタバッファが制御され得る。このハンドオフ信号を受け取り次第、ATは、図8Bの事前伸縮モード244に示すような、「事前伸縮」モードに入る。このモードでは、ATは、2つの条件の1つが満たされるまでパケットを拡張する。第1の条件の下では、デジッタバッファは、パケットを蓄積し続け、累積的な拡張の結果として、PRE_WARPING_EXPANSIONのデジッタバッファサイズがもたらされる。言い換えると、パケットの拡張は、PRE_WARPING_EXPANSIONに到達するまで実行される。代替として、第2の条件の下では、期間WARPING_TIMEが満たされている。ハンドオフ信号又は減量指標を受け取り次第タイマが開始する。タイマは、WARPING_TIMEで満了する。これら2つの条件の一方が満たされた後、ATは、事前伸縮モードを終了する。事前伸縮モードの間、(後述する)End_Talkspurt条件が満たされない限り、どんなパケットも圧縮されない。というのは、デジッタバッファが、パケットを一定の間隔で再生ユーティリティに送るのに十分なパケットを蓄積しようとするからである。パケットが一定の間隔、例えば、20ミリ秒間隔で期待される例では、PRE_WARPING_EXPANSIONの値は、40ミリ秒に設定され、WARPING_TIMEの値は、100スロット(166ミリ秒)に等しくなるように設定され得る。
【0100】
ハンドオフは、減量イベントの1つの形にすぎない。デジッタバッファは、ハンドオフ又は他の種類の減量を処理する機構を実施してもよい。このために必要とされる情報は、減量を処理するのに、どの程度のデジッタ超過が必要とされるか(PRE_WARPING_EXPANSION)、及びデジッタバッファが、どの程度の時間この減量回避モードを処理し続けるか(WARPING_TIME)である。
【0101】
遅延アンダーフローのカウント
前述の適応デジッタバッファ式は、遅延アンダーフローのパーセンテージを目標とするように設計されているため、遅延アンダーフローの数を正確に測定することが望ましい。アンダーフローが発生するときには、アンダーフローがパケット遅延のために引き起こされたか、それともネットワーク内のどこかで、すなわち、伝送パス内でドロップされたパケットによって引き起こされたかは分からない。したがって、アンダーフローの種類を正確に説明することが求められる。
【0102】
一例では、RTP/UDP/IPを使った通信のために、各パケットが、RTP連番を含む。連番は、受信パケットを、これらが送信された順序に整列させるのに使用される。アンダーフローが発生したとき、アンダーフローを生じさせたパケットのRTP連番は、メモリアレイなどのメモリに格納され得る。識別された連番を有するパケットが後で到着した場合、このアンダーフローは、「遅延アンダーフロー」としてカウントされる。
【0103】
「遅延アンダーフロー率」は、アンダーフローの数と合計受信パケットの数との比である。アンダーフローの数も受信パケットの数も、デジッタバッファ式が更新されるたびにゼロに設定される。
【0104】
有音部の先頭と末尾の改善
2人のユーザの間の会話の時間軸を示す図20を考察する。このグラフでは、縦軸が時間を表す。各ユーザは、有音部及び無音期間を送信し、次いで、これらが相手のユーザによって受け取られる。明確にするために、影付きブロックセグメント400及び410は、ユーザ1の有音部(音声セグメント)を表すものとする。影なしブロックセグメント405は、ユーザ2の有音部を表すものとする。時間軸上の有音部の外部の領域は、ユーザが話しておらず、相手のユーザの話を聴いており、又は無音期間を受け取っている可能性のある時間を表す。セグメント400がユーザ2側で再生される。音声セグメント400がユーザ2側で再生し終わると、ユーザ2は、話し始める前に短期間待機する。続いて、ユーザ2の第1の音声セグメント405の先頭が、ユーザ1によって聞き取られる。ユーザ1によって知覚される会話往復遅延(RTD)は、ユーザ1が話終えたときから、ユーザ1がユーザ2の音声セグメントの先頭を聞いた時刻までの間隙である。会話RTDは、一方向エンドツーエンド遅延ではなく、ユーザ特有の、ユーザの側から見て有意なものである。例えば、会話RTDがユーザ1にとって大きすぎる場合、この会話RTDは、ユーザ1に、ユーザ2の音声セグメントが再生されるのを待たずに、再度話始めるよう促すことになる。これは、会話の流れを断ち切り、会話品質低下として知覚される。
【0105】
ユーザ1によって経験される会話RTDは、様々に変更され得る。一例では、ユーザ1の音声セグメントの末尾がユーザ2に対して再生される時刻が変更され得る。第2の例では、ユーザ2の音声セグメントの先頭がユーザ1に対して再生される時刻が変更される。なお、有音部の先頭及び末尾の遅延だけが、会話の音声品質に影響を及ぼすことに留意されたい。1つの設計目標は、有音部の先頭及び末尾の遅延をさらに低減することである。
【0106】
一例では、目標は、有音部の先頭を改善することである。この改善は、ユーザ1の有音部の第1のパケットを、聞き手であるユーザ2が、このパケットを、デフォルトの適応デジッタバッファ遅延が実施された場合よりも早く受け取るように操作することによって、達成され得る。適応デジッタバッファ内のパケットに適用される遅延は、デフォルトの適応デジッタバッファ遅延、計算された値、又は、聞き手が特定の時刻にパケットを受け取ることになるように選択された値とすることができる。一例では、有音部の第1のパケットのタイミングは、各受信有音部の開始時に適応デジッタバッファ遅延を再計算することによって変動する。有音部の第1のパケットに適用される適応デジッタバッファ遅延が低減されるとき、この第1のパケットは、聞き手にとって早められる。適用される遅延が増大されるとき、第1のパケットは、聞き手によって、より遅い時刻に受け取られる。第1のパケットのデフォルトのデジッタバッファ遅延は、計算されたデジッタバッファ遅延より小さいことも、大きいこともある。図示の例では、各有音部の第1のパケットのデジッタ遅延は、秒単位で測られる、MAX_BEGINNING_DELAYという値によって制限される。この値は、再計算されたデジッタバッファ遅延とすることも、聞き手が指定された時刻にパケットを受け取るように設計された遅延とすることもできる。MAX_BEGINNING_DELAYの値は、実際に計算されたデジッタバッファ遅延より小さくてもよい。MAX_BEGINNING_DELAYがデジッタバッファの計算された遅延より小さく、有音部の第1のパケットに適用されるとき、有音部の後続パケットは、自動的に拡張される。後続パケットの自動拡張が行われるのは、デジッタバッファが、パケットを再生するのと同じ速度でパケットを受け取らない可能性があるからである。デジッタバッファは、パケットを再生する際に、サイズが減少し、拡張閾値に接近する。拡張閾値に到達すると、拡張がトリガされ、デジッタバッファが拡張閾値を十分に上回る着信パケットを受け取るまで、有音部中の後続パケットが拡張される。MAX_BEGINNING_DELAY値を実施することによって、有音部の第1のパケットが、聞き手によってより早く受け取られると共に、後続パケットが拡張される。聞き手は、最初のパケットをより早く受信することで満足する。有音部の先頭を改善することは、アンダーフローの数をわずかに増大させる可能性を有する。しかしながら、MAX_BEGINNING_DELAYの適切な値によってこの影響が軽減される。一例では、MAX_BEGINNING_DELAYの値が、実際のデジッタ目標のある一定の割合として計算される。例えば、TARGET DE−JITTER BUFFER LENGTHの0.7のMAX_BEGINNING_DELAYの値は、アンダーフローのごくわずかな増大しかもたらさない。別の例では、MAX_BEGINNING_DELAYの値を40ミリ秒などの固定数とすることができ、これは、例えば、1xEV−DO Rev Aをサポートするシステムなどでは、アンダーフローのごくわずかな増大しかもたらさない。
【0107】
有音部中の後続パケットの拡張は、全体的な音声品質を低下させない。これは、図20に示されている。図20では、ユーザ2がユーザ1からの有音部の第1のパケットを受け取り、初期又は「一方向遅延」がTd1に制限されている。図示のように、音声セグメント400は、拡張も圧縮もなしで、ユーザ2側で受け取られるが、音声セグメント405は、受信時に、ユーザ1側で圧縮される。
【0108】
図21は、有音部の先頭への改善を示す流れ図である。まず、ステップ510で、システムが無音モードであるかどうか判定される。無音モードは、有音部の間の無音の期間、又はパケットがデジッタバッファによって受け取られていない期間に対応し得る。システムが無音モードにない場合、プロセスは終了する。無音モードにある場合、ステップ520で、目標デジッタ長推定が行われる。次いで、ステップ530で、システムが改善されるかどうか判定される。改善は、一例によれば、目標適応デジッタ長が、一例ではMAX_BEGINNING_DELAYなどの改善係数として与えられる所与の値より大きいことを示す。システムは、ステップ540で、改善係数又は目標長のある一定の割合に相当する期間待機してから再生する。システムが改善されない場合、システムは、ステップ550で、新しい目標が再生し始めるのを待つ。新しい目標の値は、計算される目標デジッタバッファ長又は最大デジッタバッファ長とすることができる。
【0109】
また、図22に、有音部の先頭の改善も示す。プロセス580は、有音部の識別時に開始するものとして示されている。2つのシナリオ、i)時間伸縮ありと、ii)時間伸縮なしを考察する。この例では、20ミリ秒の長さの音声パケットが使用される。任意の長さの音声パケットが実施され得る。ここで、適応デジッタバッファは、パケットを再生する前に、120ミリ秒間待機する。この値が適応目標デジッタバッファ長であり、ステップ582で、適応デジッタバッファ目標推定器から受け取られる。本例では、120ミリ秒は、時間伸縮なしで、それぞれ20ミリ秒の長さの6パケットを受け取ることに相当する。584で時間伸縮が使用されない場合、6パケットが120ミリ秒間で提供される。したがって、第1のシナリオでは、デジッタバッファは、6パケットの受信後に、パケットを再生し始めることになる。これは、時間的に、120ミリ秒の遅延に相当する。第2のシナリオでは、時間伸縮が実施され、デジッタバッファは、受け取った最初の4パケットを拡張し、4パケットを受け取り次第パケットを再生し始め得る。よって、この場合の80ミリ秒のデジッタバッファ遅延が、推定される120ミリ秒のデジッタバッファ遅延より小さくても、最初のいくつかのパケットを拡張することによって潜在的アンダーフローはが回避され得る。言い換えると、パケットの再生は、時間伸縮ありの場合、時間伸縮なしの場合よりも早く開始し得る。よって、時間伸縮は、アンダーフローの数に影響を及ぼさずに、有音部の先頭を改善するのに使用され得る。
【0110】
別の例では、有音部の末尾が改善され得る。これは、有音部の最後のいくつかのパケットを圧縮することによって達成され、よって、エンドツーエンド遅延が低減される。言い換えると、有音部の末尾の遅延がより縮小され、第2のユーザには、第1のユーザからの話がより速く聞こえる。有音部の末尾の改善は図23に示されている。図23で、1/8レートのパケットは、有音部の末尾を示す。これは、音声データの送信に使用され得る、フルレート(レート1)、ハーフレート(レート1/2)又はクォータレート(レート1/4)のパケットとは異なる。また、他の速度のパケットも、無音期間の間、又は有音部の末尾での送信に使用され得る。音声通信における無音標識パケットとしての1/8レートパケットの実施については、「背景雑音情報の不連続送信及び正確な再生の方法(METHOD FOR DISCONTINUOUS TRANSMISSION AND ACCURATE REPRODUCTION OF BACKGROUND NOISE INFORMATION)」という名称の、優先日2005年2月1日の同時係属中の米国特許出願第11/123,478号明細書に詳細に記載されている。
【0111】
図23に示すように、時間伸縮なしでは、パケットNからN+4までが、100ミリ秒で再生される。有音部の最後のいくつかのパケットを圧縮することによって、同じパケットNからN+4までが、100ミリ秒ではなく70ミリ秒で再生され得る。時間圧縮が実施されるときに、音声の品質は、ほとんど、又は全く劣化しない。有音部の末尾への改善では、受信側が、有音部の末尾を識別し、末尾に接近しつつあるときを予期する知識を有しているものと仮定する。
【0112】
一例では、リアルタイムトランスポートプロトコル(RTP)を介して音声パケットを送っている間に、「有音部の末尾」標識が、各有音部の最後のパケットに設定され得る。パケットが再生のために提供されているとき、デジッタバッファ内のパケットは、「有音部の末尾」標識の有無をチェックされる。パケットの1つでこの標識が設定されており、再生のために提供されている現在のパケットと「有音部の末尾」パケットの間に欠落した連番がない場合、再生のために提供されているパケットが圧縮され、現在の有音部の後のすべてのパケットも圧縮される。
【0113】
別の例では、システムが有音部にあって、1/8レートのパケット又は無音標識記述(SID)ビットが設定されているパケットが再生ユーティリティに配信された場合に、システムが無音に遷移する。1/8レートのパケットは、これのサイズをチェックすることによって検出され得る。SIDビットは、RTPヘッダで搬送される。システムは、システムが無音部にあって、1/8レートでもなく、SIDビットも設定されていないパケットが再生のために配信された場合に、有音部に遷移する。なお、一例では、本明細書で提示する適応デジッタバッファリング方法が、システムが有音状態にあるときに実行され、無音期間には無視され得ることに留意されたい。
【0114】
なお、この方法は、後で到着した重複するパケットを正しく廃棄し得ることに留意されたい。重複するパケットが到着した場合、これは、そのまま廃棄されることになる。というのは、パケットの最初のインスタンスが適切な時刻に再生され、これのシーケンスが、「遅延アンダーフロー」候補を含む配列に保存されなかったからである。
【0115】
一例では、RTPを介して音声パケットを送っている間に、「有音部の末尾」標識が、各有音部の最後のパケットで設定され得る。パケットが再生のために提供されているとき、デジッタバッファ内のパケットは、「有音部の末尾」標識の有無をチェックされる。この標識がパケットの1つで設定されており、再生のために提供されている現在のパケットと、「有音部の末尾」パケットの間に欠落した連番がない場合、再生に提供されているパケットは圧縮され、現在の有音部の後のすべてのパケットも圧縮される。
【0116】
一例による、有音部の末尾の改善を示す流れ図を図24に示す。ステップ600で新しいパケットが開始する。ステップ605で、デジッタバッファ長が圧縮閾値以上である場合、ステップ635で圧縮指示が生成され、ステップ600でテールが新しいパケットに提供される。ステップ605で、デジッタバッファが圧縮閾値未満である場合、ステップ610で、デジッタバッファ長が拡張閾値以下であるかどうか判定される。そうである場合、ステップ615で、テールが、無音期間又は有音部の末尾を表し得るパケットレートに等しいかどうか判定する。一例では、一連の1/8レートパケットが、無音期間に、又は有音部の末尾に、一定の間隔、例えば、20ミリ秒間隔で送られ得る。図24では、ステップ615で、テールが1/8レートパケットに等しくないと判定された場合、ステップ620でセグメントが拡張され、ステップ600で新しいパケットに戻る。ステップ625では、テールが1/8に等しいかどうか判定する。ステップ625で、テールが1/8レートに等しい場合、ステップ635で圧縮指示が生成される。1/8レートに等しくない場合、ステップ630で、再生は、どんな時間伸縮もなしの、通常の再生になる。
【0117】
時間伸縮品質オプティマイザ
いくつかの連続するパケットが圧縮される(又は拡張される)とき、これは、オーディオを著しく加速(又は減速)させ、品質低下を引き起こし得る。かかる劣化は、時間伸縮パケットの間隔を空ける、すなわち、ある時間伸縮パケットに続けて、いくつかの非時間伸縮パケットを、別のパケットが伸縮される前に置くことによって回避され得る。
【0118】
前述の伸縮パケットの間隔空けを拡張に適用すると、通常は拡張されるはずのいくつかのパケットを拡張させないようにすることができる。これは、デジッタバッファのパケットが枯渇するときにパケットの拡張が実行されるため、アンダーフローをもたらし得る。よって、一例では、前述の伸縮パケットの間隔空けは、圧縮パケットに適用されてもよい。すなわち、圧縮パケットの後、別のパケットが圧縮される前に、いくつかの圧縮されないパケットを続けさせてもよい。このような、2つの圧縮パケット間の圧縮すべきでないパケットの数は、通常、2から3に設定され得る。
【0119】
時間伸縮をトリガする条件の組
本明細書で説明するのは、音声パケットの時間伸縮(拡張/圧縮)をトリガするいくつかの条件についてである。以下は、パケットが圧縮されるべきか、拡張されるべきか、それともどちらでもないか決定する(擬似コードの形の)規則の組み合わせである。
【0120】
If(事前伸縮(ハンドオフ検出)フェーズにあり、かつ有音部の末尾が検出されず、かつDEJITTER_TARGET+PRE_WARPING EXPANSIONに到達していない)
パケットを拡張する
End If
Else
If(有音部の末尾が検出された)
圧縮する
End If
Else
If(圧縮閾値がトリガされた)
圧縮する
End If
Else If(拡張閾値がトリガされた、又は、待ち行列に次のパケットがない)
拡張する
End If
End If
End If.
図25に、復号器機能と結合された従来のデジッタバッファの実現形態を示す。図25で、パケットは、20ミリ秒間隔でデジッタバッファに到着すると期待されている。この例では、パケットが、不規則な間隔で、すなわち、ジッタを伴って到着することが見て取れる。デジッタバッファは、デジッタバッファが、20ミリ秒など一定の間隔でパケットを送出し始めた後で、枯渇しないように、特定のデジッタバッファ長に到達するまでパケットを蓄積する。必要とされるデジッタバッファ長において、デジッタバッファは、20ミリ秒の一定間隔でパケットを再生し始める。復号器が、これらのパケットを一定の間隔で受け取り、各パケットを、1パケット当たり20ミリ秒の音声に変換する。代替例では、他の時間間隔も選択し得る。
【0121】
これに対して、図26に、時間伸縮をサポートしている適応デジッタバッファの例を示す。この場合、パケットは、不規則な間隔で適応デジッタバッファに到着する。しかしながら、この場合、目標デジッタバッファ長は、ずっと小さい。これは、デジッタバッファが枯渇し始めると、時間伸縮がパケットを拡張させて、適応デジッタバッファが補充される時間が考慮されるからである。復号器は、適応デジッタバッファが枯渇し始めるとパケットを拡張し、適応デジッタバッファが過剰なパケットを蓄積しはじめるとパケットを圧縮し得る。適応デジッタバッファから、音声パケットの不均等な配信が、復号器及び時間伸縮ユニットに入力されることがわかる。これらのパケットに、不規則な間隔で到着することが許容されるのは、時間伸縮を用いれば、復号器が、元のパケットの到着時刻に応じて、各パケットを異なる長さの音声パケットに変換するからである。例えば、この例では、復号器は、各パケットを、1パケットあたり15〜35ミリ秒の音声に変換する。パケットが時間伸縮によってより早く再生され得るため、必要なバッファサイズがより小さくなり、結果としてネットワークにおける待ち時間がより短くなる。
【0122】
図27は、一例によるATを示すブロック図である。前述の実施形態に示すように、適応デジッタバッファ706、時間伸縮制御ユニット718、受信回路714、プロセッサ722の制御、メモリ710、送信回路712、復号器708、H−ARQ制御720、符号器716、音声処理724、有音部識別726、誤り訂正704が相互に結合され得る。加えて、これらは、図27に示す通信バス702を介しても結合され得る。
【0123】
図28に、パケットがデジッタバッファによって受け取られ、最終的に、スピーカによって再生される一例におけるパケット処理を示す。図示ように、パケットがデジッタバッファで受け取られる。デジッタバッファは、復号器からパケット要求を受け取り次第、パケットを及び時間伸縮情報を復号器に送る。復号器は、出力ドライバからの要求があり次第、出力ドライバにサンプルを送る。
【0124】
デジッタバッファ内の入力コントローラは、着信パケットを追跡し、着信パケットに誤りがあるかどうか指示する。デジッタバッファは、連番を有するパケットを受け取り得る。例えば、着信パケットが、前のパケットの連番より低い連番を有するときに、入力コントローラによって誤りが検出され得る。図28の入力コントローラ内に位置する分類ユニットが、着信パケットを分類する。分類ユニットによって定義される様々なカテゴリは、「良好なパケット」、「遅延パケット」、「不良なパケット」などを含み得る。また、入力制御ユニットは、パケットを比較し、この情報をデジッタバッファコントローラに送ってもよい。
【0125】
図28に示すデジッタバッファコントローラは、デジッタバッファの入力及び出力コントローラからの双方向入力を受け取る。デジッタバッファコントローラは、入力コントローラから、受け取られる良好なパケットの数、受け取られる不良なパケットの数といった、着信データの特性を指示するデータを受け取る。デジッタバッファは、この情報を使って、デジッタバッファが縮小し、又は拡大する必要があるかを決定し、これによって、時間伸縮コントローラへの圧縮又は拡張信号が生じ得る。デジッタバッファコントローラ内のパケット誤り率(PER)ユニットが、PER遅延を計算する。デジッタバッファの出力コントローラは、デジッタバッファにパケットを要求する。また、デジッタバッファの出力コントローラは、再生された最後のパケットが何であったかも指示し得る。
【0126】
復号器は、デジッタバッファにパケット要求を送り、要求に応じてデジッタバッファからパケットを受け取る。復号器内の時間伸縮コントローラユニットが、デジッタバッファの出力コントローラから時間伸縮制御情報を受け取る。時間伸縮制御情報は、パケットが圧縮されるべきか、拡張されるべきか、それともそのままにされるべきか指示する。復号器によって受け取られるパケットは、復号化され、音声サンプルに変換される。次いで、出力ドライバ内のバッファから要求があり次第、サンプルが出力ドライバに送られる。出力ドライバからのサンプル要求は、復号器内の出力コントローラによって受け取られる。
【0127】
位相整合
前述のように、パケットをこれの予期される再生時刻後に受け取ると、遅延パケットの代わりに消去が再生されることになり得る。適応デジッタバッファで消去又は欠落したパケットを受け取ると、復号化音声の不連続を生じさせることがある。適応デジッタバッファによって潜在的な不連続が認識されると、適応デジッタバッファは、復号器に、位相整合を実行するよう要求し得る。図28に示すように、適応デジッタバッファ750は、出力コントローラ760から入力を受け取る位相整合コントローラを含み得る。位相整合制御情報は、復号器762に位置し得る位相整合ユニットに送られる。一例では、位相整合制御情報は、「位相オフセット」及び「ランレングス」情報を含み得る。位相オフセットは、復号器が復号化しているパケットの数と、符号器が符号化しているパケットの数の差である。ランレングスは、復号器が、現在のパケットを復号化する直前に復号化している連続した消去の数をいう。
【0128】
一例では、位相整合と時間伸縮が、両方とも、共通の制御コード又はソフトウェアを有する復号器で実施される。一例では、復号器が、以下のように波形補間を実施する。
【0129】
a)時間伸縮も位相整合も使用されない場合、ボコーディングが、160サンプルでの波形_補間を使って行われる。
【0130】
b)時間伸縮が使用され、位相整合が使用されない場合、ボコーディングが、Nを1又は2とし得る、(160+/−N*ピッチ周期)サンプルでの波形_補間_復号化を使って行われる。
【0131】
c)時間伸縮が使用されず、位相整合が使用される場合、ボコーディングが、Δを位相整合の量とする、(160−Δ)サンプルでの波形_補間_復号化を使って行われる。
【0132】
d)位相整合と時間伸縮の両方が使用される場合、ボコーディングが、Δを位相整合の量とする、(160−Δ+/−N*ピッチ周期)サンプルでの波形_補間_復号化を使って行われる。
【0133】
出力ドライバへのクロック入力が、出力ドライバ内のバッファによってどれほどの頻度でデータを要求されるか決定する。これは、システムにおけるメインクロックであり、多種多様なやり方で実施され得る。システムの主クロックは、PCMサンプルのサンプリング速度によって導出され得る。例えば、狭帯域音声が送られている場合、システムは、毎秒8000PCMサンプル(8KHz)を再生する。このクロックがシステムの残りの部分を駆動してもよい。1つの手法は、オーディオインターフェース770に、必要とされるときに復号器により多くのサンプルを要求させることである。別の手法は、復号器/時間伸縮を独立して動作させることであり、このモジュールは、以前にいくつのPCMサンプルが配信されたか知っているので、次により多くのサンプルを提供すべきときを知っている。
【0134】
復号器762、又はオーディオインターフェース制御ユニット810に、スケジューラが位置していてもよい。オーディオインターフェース制御ユニット810に位置しているとき、スケジューラは、次のパケット要求を、受け取ったPCMサンプルの数に基づかせる。スケジューラが復号器に位置しているとき、スケジューラは、tミリ秒ごとにパケットを要求し得る。例えば、復号器スケジューラは、2ミリ秒ごとに適応デジッタバッファ750にパケットを要求し得る。復号器で時間伸縮が使用可能とされていない場合、又は復号器762に時間伸縮ユニットが位置していない場合、スケジューラは、オーディオインターフェース制御ユニット770に、1パケット中の正確なサンプル数に対応するサンプルの組を送る。例えば、オーディオインターフェースユニット770が2ミリ秒ごとにサンプルを要求する場合、復号器の出力コントローラ766は、16PCMサンプルを送る(1パケットは、8Khzのサンプリング速度において、20ミリ秒160サンプルの音声データに対応する)。言い換えると、時間伸縮コントローラが復号器の外部にあるとき、復号器の出力は、通常のパケット/サンプル変換である。オーディオインターフェースユニット770は、サンプルの数を、復号器が時間伸縮を実行した場合に受け取られたはずのサンプル数に変換する。
【0135】
別のシナリオでは、時間伸縮コントローラが復号器内に位置しており、時間伸縮が使用可能とされているとき、圧縮モードでは、復号器は、より少ないサンプルを出力し、拡張モードでは、復号器は、より多くのサンプルを出力し得る。
【0136】
図30に、さらに、スケジューリング機能が復号器によって行われる場合のシナリオを示す。ステップ902で、復号器がデジッタバッファにパケットを要求する。ステップ904でパケットが受け取られる。ステップ906で、パケットが「N」サンプルに変換される。生成された「N」サンプルは、ステップ908でオーディオインターフェース制御ユニットに配信され、ステップ910で、次のパケット要求がNの関数としてスケジュールされる。
【0137】
図31に、復号器外部の、オーディオインターフェース制御ユニットにおけるスケジューリングを示す。オーディオインターフェースユニットは、まず、ステップ1002で、PCMサンプルの組を要求する。ステップ1004で、要求されたPCMサンプルが受け取られ、ステップ1006で、次のパケット要求がNの関数としてスケジュールされる。
【0138】
時間伸縮標識は、時間伸縮なし標識など、適応デジッタバッファからの命令の一部とすることができる。図32に、スケジューリングが、復号器の外部、例えば、オーディオインターフェース制御ユニットなどで計算される時間伸縮ユニットを示す。パケットの種類、時間伸縮標識及び行われるべき伸縮の量が、時間伸縮ユニットに入力される。
【0139】
図33に、スケジューリングが復号器内の時間伸縮ユニットで計算される時間伸縮ユニットを示す。時間伸縮ユニットへの入力は、パケットの種類、時間伸縮標識及び行われるべき伸縮の量を含む。伸縮の量及びイネーブルが、時間伸縮ユニットの品質最適化ユニットに入力される。時間伸縮情報が出力される。
【0140】
本明細書では、本発明の特定の例について説明しているが、当業者は、本発明の概念を逸脱することなく、本発明の変形を考案することができる。例えば、本明細書の教示は、回線交換網要素に言及しているが、パケット交換ドメインネットワーク要素にも等しく適用され得る。また、本明細書での教示は、認証トリプレット対だけに限定されず、2つのSRES値(通常フォーマットの1つと、本明細書で開示するより新しいフォーマットの1つ)を含む単一のトリプレットの使用にも適用することができる。
【0141】
情報及び信号が、多種多様な技術及び技法のいずれを使って表されてもよいことを当業者は理解するであろう。例えば、上記の説明を通して参照され得るデータ、命令、コマンド、情報、信号、ビット、記号、及びチップは、電圧、電流、電磁波、磁界又は磁性粒子、光学界又は光学粒子、又はこれらの任意の組み合わせによって表され得る。
【0142】
さらに、本明細書で開示する例に関連して説明している様々な例示的論理ブロック、モジュール、回路、方法及びアルゴリズムが、電子回路ハードウェア、コンピュータソフトウェア、又は両者の組み合わせとして実施され得ることも、当業者は理解するであろう。このハードウェアとソフトウェアの交換可能性を明確に説明するために、本明細書では、様々な例示的コンポーネント、ブロック、モジュール、回路、方法及びアルゴリズムを、これらの機能の観点から一般的に説明している。かかる機能がハードウェアとして実施されるか、それともソフトウェアとして実施されるかは、システム全体に課せられる個々の用途及び設計制約条件によって決まる。当業者は、説明している機能を、各個別用途ごとに様々なやり方で実施し得るが、かかる実施に際しての決定は、本発明の範囲からの逸脱を生じるものと解釈されるべきではない。
【0143】
本明細書で開示する例に関連して説明している様々な例示的論理ブロック、モジュール、及び回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)又は他のプログラマブル論理回路、ディスクリートゲート又はトランジスタ論理、ディスクリートハードウェア部品、又は本明細書で説明する機能を実行するように設計されたこれらの任意の組み合わせを用いて実施され、又は実行され得る。汎用プロセッサは、マイクロプロセッサとすることもできるが、代替として、プロセッサは、任意の通常のプロセッサ、コントローラ、マイクロコントローラ、又は状態機械とすることもできる。また、プロセッサは、コンピュータ装置の組み合わせ、例えば、DSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアと連動する1つ又は複数のマイクロプロセッサ、又はこのような他の任意の組み合わせとして実施されてもよい。
【0144】
本明細書で開示する例との関連で説明している方法又はアルゴリズムは、直接ハードウェアとして、プロセッサによって実行されるソフトウェアモジュールとして、又はこれら2つの組み合わせとして実施され得る。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、取り外し可能ディスク、CD−ROM、又は当分野で知られている他の任意の形の記憶媒体とすることができる。記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合され得る。代替として、記憶媒体は、プロセッサと一体とすることもできる。プロセッサ及び記憶媒体は、ASIC内にあってもよい。
【0145】
開示の例の以上の説明は、任意の当業者が本発明を作成し、又は使用することを可能にするために提供するものである。これらの例への様々な変更は、当業者には容易に明らかになるはずであり、本明細書で定義する一般原理は、本発明の精神又は範囲を逸脱することなく他の例にも適用され得る。よって、本発明は、本明細書で示す例だけに限定されるべきでなく、本発明には、本明細書で開示する原理及び新規な特徴と整合性を有する最大限の範囲が許容されるべきである。

【特許請求の範囲】
【請求項1】
データのパケットを格納するように構成されている記憶装置と、
前記記憶装置内に格納されているパケットの数を、前記記憶装置の第1の時間伸縮閾値と比較するように構成されている第1のコントローラであり、さらに、格納されているパケットの前記数が前記第1の時間伸縮閾値に違反するときに、時間伸縮標識を生成するように適合されている前記第1のコントローラと、
を備える、装置。
【請求項2】
パケットを受け取り、パケットを前記記憶装置に格納するように構成されている入力コントローラと、
前記第1のコントローラに結合されており、前記第1のコントローラから前記時間伸縮標識を受け取るように構成されている出力コントローラと、
をさらに備える、請求項1に記載の装置。
【請求項3】
前記時間伸縮標識に応答してパケットを時間伸縮させる手段をさらに備え、前記出力コントローラは、パケットを時間伸縮させる前記手段に前記時間伸縮標識を提供するように適合されている、請求項2に記載の装置。
【請求項4】
前記第1のコントローラは、さらに、前記記憶装置に格納されているパケットの前記数を、前記記憶装置の第2の時間伸縮閾値と比較し、格納されているパケットの前記数が前記第2の時間伸縮閾値を超えたときに前記時間伸縮標識を生成するように構成されている、請求項3に記載の装置。
【請求項5】
前記第1のコントローラは、さらに、パケット拡張のための前記時間伸縮標識の第1の値を生成するように構成されている、請求項4に記載の装置。
【請求項6】
前記第1のコントローラは、さらに、パケット圧縮のための前記時間伸縮標識の第2の値を生成するように構成されている、請求項5に記載の装置。
【請求項7】
前記第1の値は、目標遅延長の第1のパーセンテージである、請求項6に記載の装置。
【請求項8】
前記第2の値は、前記目標遅延長の第2のパーセンテージである、請求項7に記載の装置。
【請求項9】
前記第1のコントローラは、さらに、次の順次パケットが、前の順次パケットの後の第1の期間内に受け取られない場合に前記第1の値を生成するように構成されている、請求項6に記載の装置。
【請求項10】
前記第1のコントローラは、さらに、ある時間窓にわたる前記記憶装置の状況を平均するように構成されている、請求項6に記載の装置。
【請求項11】
前記第1のコントローラは、さらに、ある時間窓にわたって前記記憶装置に格納されているパケットの前記数をフィルタリングするように構成されている、請求項10に記載の装置。
【請求項12】
前記第1のコントローラは、さらに、目標デジッタバッファ遅延長を決定し、前記時間窓を、前記目標デジッタバッファ遅延長の関数として決定するように構成されている、請求項11に記載の装置。
【請求項13】
前記第1のコントローラは、さらに、前記目標デジッタバッファ遅延長を、前記記憶装置に格納されるべきパケットの目標数として決定するように構成されている、請求項12に記載の装置。
【請求項14】
前記第1のコントローラは、さらに、前記記憶装置に格納されているパケットの前記フィルタリングされた数を、前記第1及び第2の時間伸縮閾値と比較するように構成されている、請求項10に記載の装置。
【請求項15】
前記第1のコントローラは、さらに、前記時間伸縮標識を、前記パケットを圧縮し、前記パケットを拡張し、又は前記パケットを時間伸縮なしで処理する命令として生成するように構成されている、請求項1に記載の装置。
【請求項16】
前記記憶装置は適応デジッタバッファである、請求項1に記載の装置。
【請求項17】
データのパケットを処理する方法であって、
データのパケットを記憶装置に格納することと、
前記記憶装置に格納されているパケットの数を第1の時間伸縮閾値と比較することと、
前記記憶装置に格納されているパケットの前記数が前記第1の時間伸縮閾値に違反するときに時間伸縮標識を生成することと、
を備える、方法。
【請求項18】
前記時間伸縮標識に応答して、少なくとも1つのパケットを時間伸縮させることをさらに備える、請求項17に記載の方法。
【請求項19】
前記記憶装置に格納されているパケットの前記数を第2の時間伸縮閾値と比較することと、
前記記憶装置に格納されているパケットの前記数が前記第1の時間伸縮閾値より小さいときには第1の値で、前記記憶装置に格納されているパケットの前記数が前記第2の時間伸縮閾値を超えるときには第2の値で時間伸縮標識を生成することと、
をさらに備える、請求項18に記載の方法。
【請求項20】
前記時間伸縮標識が前記第1の値であるときに少なくとも1つのパケットを拡張することと、
前記時間伸縮標識が第2の値であるときに少なくとも1つのパケットを圧縮することと、
をさらに備える、請求項17に記載の方法。
【請求項21】
複数の順次パケットを受け取ることと、
前記時間伸縮標識に応答して、前記順次パケットのセグメントを追加/オーバーラップさせることと、
をさらに備える、請求項20に記載の方法。
【請求項22】
前記追加/オーバーラップさせることは、さらに、
前記複数のセグメントのうちの少なくとも2つを、
【数5】

として組み合わせることをさらに備え、
式中、アウトセグメントは、結果として生じる追加/オーバーラップセグメントであり、
セグメント1及びセグメント2は、追加/オーバーラップされるべき前記複数のセグメントのうちの前記少なくとも2つであり、
ウインドウサイズは第1のセグメントに対応し、
Rウインドウサイズは第2のセグメントに対応する、
請求項21に記載の方法。
【請求項23】
遅延パケットの数を追跡することによって第1の時間伸縮閾値を決定することをさらに備える、請求項17記載の方法。
【請求項24】
遅延パケットが、前記パケットに関連付けられた予期される再生時刻の後で受け取られるパケットである、請求項23に記載の方法。
【請求項25】
少なくとも1つのパケットを時間伸縮させることと、
前記少なくとも1つの時間伸縮パケットを再生することと、
をさらに備える、請求項17に記載の方法。
【請求項26】
命令の組を含むコンピュータ可読記憶媒体であって、前記命令の組が、
データのパケットを記憶装置に格納する入力ルーチンと、
前記記憶装置に格納されているパケットの前記数を、第2の時間伸縮閾値と比較する第1のルーチンと、
前記記憶装置に格納されているパケットの前記数が第1の時間伸縮閾値より小さいときに第1の値で、前記記憶装置に格納されているパケットの前記数が前記第2の時間伸縮閾値を超えるときに第2の値で時間伸縮標識を生成する第2のルーチンと、
を備える、コンピュータ可読記憶媒体。
【請求項27】
データのパケットを格納するように構成されている記憶装置と、
前記記憶装置に格納されているパケットの数を、前記記憶装置の第1の圧縮時間伸縮閾値及び第1の拡張時間伸縮閾値と比較するように構成されている第1のコントローラであり、さらに、格納されているパケットの前記数が、前記第1の圧縮時間伸縮閾値を超える場合には圧縮を指示する時間伸縮制御信号を生成し、格納されているパケットの前記数が、前記第1の拡張時間伸縮閾値を超える場合には拡張を指示する時間伸縮制御信号を生成するように適合されている前記第1のコントローラと、
を備える、装置。
【請求項28】
前記第1のコントローラは、さらに、格納されているパケットの前記数を、圧縮時間伸縮閾値の組及び拡張時間伸縮閾値の組と比較するように適合されており、前記圧縮時間伸縮閾値の組のそれぞれ、及び前記拡張時間伸縮閾値の組のそれぞれが、前記記憶装置での目標遅延長の一意のパーセンテージに対応する、請求項27に記載の装置。
【請求項29】
前記第1のコントローラは、さらに、次の順次パケットが、前記次の順次パケットの予期される再生時刻の後で受け取られる場合に、拡張のための前記時間伸縮制御信号を生成するように構成されている、請求項27に記載の装置。
【請求項30】
前記第1のコントローラは、さらに、格納されているパケットの前記数を時間伸縮閾値と比較する前に、ある時間窓にわたる前記記憶装置の状況を平均するように構成されている、請求項29に記載の装置。
【請求項31】
前記第1のコントローラは、さらに、ある時間窓にわたって前記記憶装置に格納されているパケットの前記数をフィルタリングするように構成されている、請求項30に記載の装置。
【請求項32】
前記第1のコントローラは、さらに、目標遅延長を決定し、前記時間窓を、前記目標遅延長の関数として決定するように構成されている、請求項31に記載の装置。
【請求項33】
前記第1のコントローラは、さらに、前記目標遅延長を、前記記憶装置に格納されるべきパケットの目標数として決定されるように構成されている、請求項32に記載の装置。
【請求項34】
前記第1のコントローラは、さらに、前記記憶装置に格納されているパケットの平均数を時間伸縮閾値と比較するように構成されている、請求項30に記載の装置。
【請求項35】
前記第1のコントローラは、さらに、多状態制御信号である前記時間伸縮制御信号を生成するように構成されている、請求項27に記載の装置。
【請求項36】
前記第1のコントローラは、さらに、前記記憶装置の目標遅延長を決定するように構成されており、前記記憶装置は適応デジッタバッファであり、前記目標遅延長は目標デジッタバッファ遅延である、請求項35に記載の装置。
【請求項37】
データのパケットを格納するように構成されている記憶装置と、
前記記憶装置の目標遅延長を決定し、格納されているパケットの数が前記目標遅延長を超えるときに、少なくとも1つのパケットの圧縮を開始するように適合されている第1のコントローラと、
を備える、装置。
【請求項38】
前記第1のコントローラは、さらに、遅延パケットによる所与のパーセンテージのアンダーフローを維持するように構成されている、請求項37に記載の装置。
【請求項39】
前記第1のコントローラは、さらに、前記目標遅延長を、
If(PERdelay<TARGET_VALUE)then
DEJITTER_DELAY=DEJITTER_DELAY−CONSTANT;
If(PERdelay>TARGET_VALUE&&PERdelay>=last_PERdelay)then
DEJITTER_DELAY=DEJITTER_DELAY+CONSTANT;
Set DEJITTER_DELAY=MAX(MIN_JITTER,DEJITTER_DELAY);
and
DEJITTER_DELAY=MIN(MAX_JITTER,DEJITTER_DELAY)
として計算するように構成されており、式中、PERdelayは、遅延パケットによるアンダーフローの比率であり、TARGET_VALUEは、目標とされる遅延パケットの比率であり、DEJITTER_DELAYは、前記適応デジッタバッファの前記目標遅延長であり、CONSTANTは、事前定義値であり、MAX_JITTER及びMIN_JITTERは、それぞれ、最大及び最小目標遅延長を表す事前定義値である、請求項38に記載の装置。
【請求項40】
前記第1のコントローラは、前記PERdelayを、
【数6】

として計算するように構成されており、式中、PER_CONSTANTは、PERdelayを推定するのに使用されるフィルタの時間定数である、請求項39に記載の装置。
【請求項41】
前記第1のコントローラは、
前記Current_PERdelayを、予期される再生時刻の後で受け取られる遅延パケットの比率として計算するように構成されているパケット誤り計算ユニットを備える、請求項40に記載の装置。
【請求項42】
前記パケット誤り計算ユニットは、前記Current_PERdelayを、遅延パケットと、PERdelayの最後の更新から現在の更新まで測定される、遅延パケットを含む、受け取られる合計パケットとの比として計算するように構成されており、
【数7】

として計算する、請求項41に記載の装置。
【請求項43】
前記第1のコントローラは、受信パケットの第1の部分を識別するように構成されており、前記第1の部分が有音部に対応し、前記有音部が複数の順次パケットを備える、請求項42に記載の装置。
【請求項44】
前記第1のコントローラは、前記第1の部分の符号化によって前記第1の部分を識別するように構成されている、請求項43に記載の装置。
【請求項45】
前記第1のコントローラは、前記有音部の第1のパケットの予期される再生時刻を決定し、前記予期される再生時刻の前に、前記有音部の前記第1のパケットの再生を開始するように構成されている、請求項44に記載の装置。
【請求項46】
前記第1のコントローラは、さらに、前記第1のパケットの再生後に後続パケットの拡張を開始するように構成されている、請求項45に記載の装置。
【請求項47】
前記第1のコントローラは、有音部の先頭と末尾とを識別するように構成されている、請求項46に記載の装置。
【請求項48】
前記第1のコントローラは、前記有音部の前記末尾部分を識別し、前記有音部の前記末尾部分の少なくとも1つのパケットを圧縮するように構成されている、請求項47に記載の装置。
【請求項49】
前記第1のコントローラは、受信パケットの符号化率によって前記有音部の前記末尾部分を識別するように構成されている、請求項48に記載の装置。
【請求項50】
前記第1のコントローラは、無音標識によって前記有音部の前記末尾部分を識別するように構成されている、請求項49に記載の装置。
【請求項51】
前記第1のコントローラは、有音部終了標識によって前記有音部の前記末尾部分を識別するように構成されている、請求項50に記載の装置。
【請求項56】
パケット化データを処理する方法であって、
データのパケットを記憶装置に格納することと、
前記記憶装置の目標遅延長を決定することと、
前記目標遅延長に対して、前記記憶装置に格納されているデータの大きさである前記記憶装置の状況を評価することと、
前記記憶装置の前記状況が前記目標遅延長に違反する場合、前記記憶装置からの少なくとも1つのパケットの時間伸縮を開始することと、
を備える、方法。
【請求項57】
前記目標遅延長を、
If(PERdelay<TARGET_VALUE)then
DEJITTER_DELAY=DEJITTER_DELAY−CONSTANT;
If(PERdelay>TARGET_VALUE&&PERdelay>=last_PERdelay)then
DEJITTER_DELAY=DEJITTER_DELAY+CONSTANT;
Set DEJITTER_DELAY=MAX(MIN_JITTER,DEJITTER_DELAY);
and
DEJITTER_DELAY=MIN(MAX_JITTER,DEJITTER_DELAY)
として計算することをさらに備え、式中、PERdelayは、遅延パケットによるアンダーフローの比率であり、TARGET_VALUEは、目標とされる遅延パケットの比率であり、DEJITTER_DELAYは、前記適応デジッタバッファの前記目標遅延長であり、CONSTANTは事前定義値であり、MAX_JITTER及びMIN_JITTERは、それぞれ、最大及び最小目標遅延長である事前定義値である、請求項52に記載の方法。
【請求項54】
時間伸縮制御信号を生成することと、
複数の順次パケットを受け取ることと、
前記時間伸縮制御信号に応答して、セグメントを追加/オーバーラップさせることと、
をさらに備える、請求項53に記載の方法。
【請求項55】
前記追加/オーバーラップさせることは、
前記複数のセグメントのうちの少なくとも2つを、
【数8】

として組み合わせることを備え、式中、アウトセグメントは、結果として生じる追加/オーバーラップセグメントであり、セグメント1及びセグメント2は、追加/オーバーラップされるべき前記セグメントであり、ウインドウサイズは第1のセグメントに対応し、Rウインドウサイズは第2のセグメントに対応する、請求項54に記載の方法。
【請求項56】
前記追加/オーバーラップさせることは、
前記第1のセグメントと前記第2のセグメントの間の最大相関の部分を識別することをさらに備える、請求項55に記載の方法。
【請求項57】
前記第1のセグメントと前記第2のセグメントの間の最大相関の前記部分を識別することは、
最大相関の前記部分を、
【数9】

として最大相関を計算することによって識別することをさらに備え、
式中、xは前記第1のセグメントを表し、yは前記第2の音声セグメントを表し、
mは相関窓を表し、iはインデックス値であり、
dは前記相関部分を表す、
請求項56に記載の方法。
【請求項58】
複数の順次パケットを時間伸縮させることと、
前記複数の順次パケットに続く少なくとも1つの順次パケットの時間伸縮を禁止することと、
前記少なくとも1つの順次パケットの後で時間伸縮を使用可能にすることと、
をさらに備える、請求項52に記載の方法。
【請求項59】
ある時間窓にわたる時間伸縮パケットの数である時間伸縮率を計算することと、
パケットの時間伸縮を、前記時間伸縮率の関数として開始することと、
をさらに備える、請求項52に記載の方法。
【請求項60】
命令の組を含むコンピュータ可読記憶媒体であって、前記命令の組が、
データのパケットを記憶装置に格納する入力ルーチンと、
前記記憶装置の目標遅延長を求める目標遅延長計算ルーチンと、
前記目標遅延長に対して、前記記憶装置に格納されているデータの大きさである前記記憶装置の状況を評価する第1のルーチンと、
前記記憶装置の前記状況が前記目標遅延長に違反する場合に、前記記憶装置からの少なくとも1つのパケットの時間伸縮を開始する第2のルーチンと、
を備える、コンピュータ可読記憶媒体。
【請求項61】
データのパケットを格納するように構成されているバッファ記憶装置と、
データの受信パケットの順序識別子を再生順序と比較するように構成されているバッファ適合手段であり、前記受信パケットの少なくとも1つを再生のために選択するように構成されている前記第1のコントローラと、
を備える、装置。
【請求項62】
前記バッファ適合手段は、さらに、予期される再生順序識別子を有する予期されるパケットが受け取られない場合に、消去の再生を開始するように構成されており、前記消去が、前記予期されるパケットの予期される再生時刻に再生される、請求項1に記載の装置。
【請求項63】
前記バッファ適合手段は、さらに、
次の予期される再生時刻を決定し、
受信パケットの順序識別子を、前記予期される再生順序識別子を含む複数の順序識別子と比較し、
前記予期されるパケットと前記次の順次パケットが受け取られない場合に、前記予期されるパケットの次の予期される再生時刻に再生される消去の再生を開始する、
ように構成されている、請求項61に記載の装置。
【請求項64】
復号器に結合されている時間伸縮制御ユニットであり、時間伸縮標識を受け取り、前記時間伸縮標識に応答して、少なくとも1つのパケットの時間伸縮を開始するように適合されている前記時間伸縮ユニットと、
前記時間伸縮制御ユニットに結合されている復号化回路であり、受信したデータのパケットからサンプルの組を生成するように構成されており、さらに、前記時間伸縮標識の第1の値に応答して第1のサンプルの組を生成し、前記時間伸縮標識の第2の値に応答して第2のサンプルの組を生成するように構成されている前記復号化回路と、
前記時間伸縮制御ユニットに結合されており、サンプルを出力するように構成されている出力制御ユニットと、
を備える、装置。
【請求項65】
前記時間伸縮ユニットに結合されており、受信パケットを復号化するように構成されている復号化回路と、
前記復号器と前記時間伸縮制御ユニットに結合されている出力コントローラであり、前記時間伸縮制御ユニットによって決定されたようにパケットを出力するように構成されている前記出力コントローラと、
をさらに備える、請求項64に記載の装置。
【請求項66】
前記時間伸縮制御ユニットは、パケット内容のおおよその重複部分を検出するように構成されている、請求項65に記載の装置。
【請求項67】
前記時間伸縮制御ユニットは、パケットを拡張するために重複部分を反復し、パケットを圧縮するために重複部分を低減するように構成されている、請求項66に記載の装置。
【請求項68】
前記重複部分は、音声信号の反復する部分である、請求項67に記載の装置。
【請求項69】
前記第1のサンプルの組はパケットの圧縮のために生成され、前記第2のサンプルの組は拡張のために生成され、前記第1のサンプルの組は前記第2のサンプルの組より小さい、請求項68に記載の装置。
【請求項70】
前記時間伸縮標識は多状態標識であり、第1の値が圧縮に対応し、第2の値が拡張に対応し、第3の値が時間伸縮なしの処理に対応する、請求項69に記載の装置。
【請求項71】
前記時間伸縮標識の第3の値に応答して、前記復号化回路は、前記第1のサンプルの組より大きく、前記第2のサンプルの組より小さい第3のサンプルの組を生成する、請求項70に記載の装置。
【請求項72】
前記時間伸縮標識の第4の値が第2の圧縮レベルに対応し、前記第4の値を受け取ったことに応答して、前記復号化回路は、前記第1のサンプルの組より小さい第4のサンプルの組を生成する、請求項71に記載の装置。
【請求項73】
前記時間伸縮標識の第5の値が第2の拡張レベルに対応し、前記第5の値を受け取ったことに応答して、前記復号化回路は、前記第2のサンプルの組より大きい第5のサンプルの組を生成する、請求項72に記載の装置。
【請求項74】
復号化パケットのサンプルを受け取るように構成されている時間伸縮制御ユニットであり、時間伸縮標識を受け取り、前記時間伸縮標識に応答して少なくとも1つのパケットの時間伸縮を開始するように適合されており、複数の受信サンプルを変換して出力サンプルの組を生成するように構成されており、さらに、受信サンプルを、前記時間伸縮標識の第1の値に応答して第1の出力サンプルの組に、前記時間伸縮標識の第2の値に応答して第2のサンプルの組に変換するように構成されており、前記第1の出力サンプルの組が前記第2のサンプルの組より小さい前記時間伸縮制御ユニットを備える、装置。
【請求項75】
前記第1の出力サンプルの組は前記受信サンプルから圧縮され、前記第2のサンプルの組は前記受信サンプルから拡張される、請求項74に記載の装置。
【請求項76】
前記時間伸縮制御ユニットは、パケット内容のおおよその重複部分を検出するように構成されている、請求項75に記載の装置。
【請求項77】
前記時間伸縮制御ユニットは、パケットを拡張するために重複部分を反復し、パケットを圧縮するために重複部分を低減するように構成されている、請求項76に記載の装置。
【請求項78】
前記重複部分は音声信号の反復する部分である、請求項77に記載の装置。
【請求項79】
前記第1のサンプルの組はパケットの圧縮のために生成され、前記第2のサンプルの組は拡張のために生成され、前記第1のサンプルの組は、前記第2のサンプルの組より小さい、請求項78に記載の装置。
【請求項80】
前記時間伸縮標識は多状態標識であり、第1の値が圧縮に対応し、第2の値が拡張に対応し、第3の値が時間伸縮なしの処理に対応する、請求項79に記載の装置。
【請求項81】
前記時間伸縮標識の第3の値に応答して、前記復号化回路は、前記第1のサンプルの組より大きく、前記第2のサンプルの組より小さい第3のサンプルの組を生成する、請求項80に記載の装置。
【請求項82】
前記時間伸縮標識の第4の値が第2の圧縮レベルに対応し、前記第4の値を受け取ったことに応答して、前記復号化回路は、前記第1のサンプルの組より小さい第4のサンプルの組を生成する、請求項81に記載の装置。
【請求項83】
前記時間伸縮標識の第5の値が第2の拡張レベルに対応し、前記第5の値を受け取ったことに応答して、前記復号化回路は、前記第2のサンプルの組より大きい第5のサンプルの組を生成する、請求項82に記載の装置。
【請求項84】
パケット化データを処理する方法であって、
時間伸縮標識を受け取ることと、
前記時間伸縮標識に応答して少なくとも1つのパケットの時間伸縮を開始することと、
受信したデータのパケットからサンプルの組を生成することであって、
前記時間伸縮標識の第1の値に応答して第1のサンプルの組を生成すること、及び
前記時間伸縮標識の第2の値に応答して第2のサンプルの組を生成することと、
前記サンプルの組を出力することと、
を備える、方法。
【請求項85】
命令の組を格納するコンピュータ可読媒体であって、前記命令の組は、
時間伸縮標識を受け取る第1のルーチンと、
前記時間伸縮標識に応答して、少なくとも1つのパケットの時間伸縮を開始する第2のルーチンと、
受信したデータのパケットからサンプルの組を生成する第3のルーチンであって、
前記時間伸縮標識の第1の値に応答して第1のサンプルの組を生成する第4のルーチン、
前記時間伸縮標識の第2の値に応答して第2のサンプルの組を生成する第5のルーチン、及び
前記サンプルの組を出力する第6のルーチン、
を備える前記第3のルーチンと、
を備える、コンピュータ可読媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図7C】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13A】
image rotate

【図13B】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17A】
image rotate

【図17B】
image rotate

【図18A】
image rotate

【図18B】
image rotate

【図18C】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate


【公開番号】特開2013−31222(P2013−31222A)
【公開日】平成25年2月7日(2013.2.7)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−223579(P2012−223579)
【出願日】平成24年10月5日(2012.10.5)
【分割の表示】特願2010−110176(P2010−110176)の分割
【原出願日】平成17年8月30日(2005.8.30)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED
【Fターム(参考)】