説明

データ・フローを同期化する方法

【課題】
【解決手段】第1データ・フローが、受信器でバッファリングされ、バッファ内容が、メタデータについてスキャンされる。まだ到着していない第2データ・フローを示すメタデータが見つかる場合には、システムは、ストール・フェーズに入り、このストール・フェーズ中には、第1データ・フロー内のすべての沈黙時間の長さが延ばされる。第2データ・フローが必要である第1データ・フロー内の点が近くなる時に、沈黙時間がそれによって延ばされる係数が、指数関数的に増やされる。期待される第2データ・フローが実際に到着した後に、この2つのデータ・フローの再生は、ストール・フェーズ中にバッファ内で蓄積された追加データのバックログをクリアするために沈黙時間を圧縮することによって加速される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、全般的にはデータ処理に関し、より具体的には、データ・フロー(オーディオ、イメージ、ビデオ、またはコンピュータ・プログラムなど)を同期化するシステムおよび方法に関する。
【背景技術】
【0002】
増加した帯域幅、ストレージ容量、および計算容量のせいで、コンピュータ・プログラムのユーザは、ますます多くのマルチメディア・コンテンツを制作し、消費する傾向がある。時々リッチ・メディア環境と呼ばれるこれらの環境は、それぞれが異なる性質を有する複数のメディアの使用の特徴がある。これらのコンテンツは、たとえば、プレゼンテーションのスライド、イメージ、ビデオ、アニメーション、グラフィックス、地図、ウェブ・ぺージ、または任意の他のメディア・オブジェクト(アニメーション付きまたはなし)とすることができ、実行可能プログラムおよびその結果のディスプレイさえ含む。したがって、ユーザに表示される最終的な結果のデータ・フローは、複数のメディア・オブジェクトからなる可能性がある。これらのオブジェクトのいずれをも、互いに同期化でき、オブジェクト間の関係を、経時的に変更できることが観察される。
【0003】
これらのメディア・オブジェクトは、さまざまな手段によって送達される。これらのコンテンツを、ストリーミングすることができ、これらを、しばしば、プログレッシブ・ダウンロード・モードを使用して取り出すことができ、あるいは、前もって完全にダウンロードすることさえできる。実際に、ほとんどの場合に、1つの単一のコンテンツについてさえ、送達のこれらのモードに関して複数のネットワークを使用することができる。制御されないネットワーク遅延は、異なるフローの間の脱同期化(de-synchronization)を意味し、不完全なまたは表示可能ではない最終的なデータ・フローをもたらし得ると思われる。サービス品質に関しては、インターネット上では、経時的なサービスの送達を保証することはできない。状況は、複数のネットワークが使用されるときにさらに悪くなる。その結果、これらすべてのデータ・フローを同期化する手段の必要がある。
【0004】
技術的現状では、これらの脱同期化を救済する複数の技法が説明されている。
【0005】
多くの手法は、同期化情報自体を生成する特定の方法に単純に関する。
【0006】
他の手法は、ネットワーク・トラフィックの不確かさとその輻輳またはボトルネックとを相殺するために、バッファリング機構に焦点を合わせたものである。実際に、古典的手法は、表示に十分なデータを得るためにバッファを使用することである。たとえばストリーミング環境で使用される時に、所定のしきい値は、メディア・プレイヤ内でファイルの再生を開始する前に、絶対的(メガバイト単位)または相対的(ファイル・サイズのパーセンテージ)な量のデータが受信され、蓄積されることを必要とする。これらのしきい値のセットアップは、異なる技法(統計、ルールベースなど)を使用することができる。ネットワーク遅延を動的に予測することを試みる機構およびそれに応じてバッファの深さを適合させることによる機構をも使用することができる。メディア・ストリーミングは、そのようなバッファ機構を利用するが、もう1つの幅広く使用されている手法が、プログレッシブ・ダウンロードとして知られている。ファイルは、古典的にダウンロードされるが、ファイルの再生は、デーが受信されるや否や開始され得、この場合に、古典的な意味でのバッファはもうない。
【0007】
他の手法は、主にバッファ調整および補償による、オーディオ・データ・フロー(またはストリーム)の、それに関連するビデオ・ストリームとの同期化または再同期化に焦点を合わせたものである。たとえば、Laurence Kelvin Griffitsの出願した米国特許第6262776号、名称「System and method formaintaining synchronization between audio and video」には、オーディオ・データとビデオ・データとの間の同期化を維持するのを助けるためにビデオ・データのフレームを選択的に捨てるシステムおよび方法が記載されている。この手法に関する主な問題は、オーディオとビデオとの間の同期化にのみ対処し、他の種類のフローに対処しないことである。
【0008】
同様に、Sirbu,Mihai G.の出願した米国特許出願第20070019931A1号、名称「Systemsand methods for re-synchronizing video and audio data」は、ビデオ・データおよびオーディオ・データを再同期化するシステムおよび方法に関する。このシステムおよび方法は、ビデオ・ジッタ・バッファに関連するビデオ・カウントを、事前定義のビデオ・カウントと比較する。オーディオ・ジッタ・バッファに関連するオーディオ・データ内の所与のオーディオ沈黙時間が、ビデオ・カウントが事前定義のビデオ・カウントから所定の量以内になるまで、ビデオ・ジッタ・バッファのビデオ・カウントが事前定義のビデオ・カウントから所定の量の外であることに応答して調整される。主な問題は、前の特許と同一であり、オーディオとビデオとの間の同期化にのみ対処し、他の種類のフローに対処しないことである。
【0009】
複数のコンテンツおよびネットワークを伴う、上で説明した複雑なメディア環境には、さまざまな着信データ・フローを同期化する手段がない。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】米国特許第6262776号
【特許文献2】米国特許出願第20070019931A1号
【発明の概要】
【発明が解決しようとする課題】
【0011】
メディア・プレイヤ・ソフトウェア・プログラムのユーザは、まさに1つの瞬間に多数のビデオを見ることができるが、同等のことは、サウンドに関しては不可能でないとしてもむずかしい。したがって、オーディオは、同期化の鍵であり、同期化は、オーディオ駆動でなければならない。
【課題を解決するための手段】
【0012】
したがって、人間の知覚機能のこの特定のプロパティを使用する、具体的には、オーディオ沈黙時間の使用を活用する方法の必要がある。
【0013】
本発明の第1の態様によれば、バッファ内のデータ・フローを同期化する方法が提供される。オーディオ・データを含む第1データ・フローを受信している間に、第1データ・フローの第1データを第2データ・フローの第2データに関連付ける同期化マークが受信されるや否や、少なくとも1つのオーディオ沈黙時間が、第1データ・フロー内で検出される。同期化マークが、第2データ・フローの関連する第2データの受信の前に受信される場合には、第1データ・フローは、少なくとも1つのオーディオ沈黙時間の持続時間を増やすことによって、バッファ内で変更される。
【0014】
第1の利益は、オーディオ沈黙時間の使用が、本発明の1つの目的である第2データ・フローの取出のために時間を得ることを可能にすることである。この利益は、ひいては、複数のネットワークから来る複数のデータ・フローに対処するときに非常に興味深い。
【0015】
オーディオ沈黙を変更すること(非沈黙オーディオ時間を変更しないことによって)の間接的な利益は、変更されたデータ・フローを再生する場合に、それがユーザによって感じ取られる可能性が低いことである。
【0016】
もう1つの利益は、説明される実施態様が、クライアント側のみであることである。前記方法は、メディア・プレイヤ・アプリケーションによって実行されるのみである。これは、この方法が、クライアント・プレイヤ・ソフトウェアに影響するのみである(サーバ・アーキテクチャでの変更なし、メディア・オーサリング・ツールでの変更なし、ネットワーク・アーキテクチャでの変更なしなど)を意味する。
【0017】
したがって、さらなる利益は、この方法が、未知のエラー(ネットワーク挙動の不確かさに起因する)の影響を最小にする手段を提供するが、従来技術が、既知のエラー(ジッタなど。ジッタは非常に小さくなる可能性が高い)を補正することだけに関することである。
【0018】
第2の開発では、前記オーディオ沈黙時間の持続時間は、第2データ・フローが取り出される時に減らされる。
【0019】
本発明の目的は、フロー変更を補償することである。
【0020】
第1の利益は、第2データ・フローが間に合って(バッファ・ランニング・ポジション(bufferrunning position)内で)受信される場合に、ゼロサム変更が可能であることである。言い換えると、結果の変更は、互いに打ち消し合う。
【0021】
さらなる利益は、バッファ内のフローがメディア・プレイヤで演奏されている時に、これらのフローに対して行われる変更を最小化できることである。
【0022】
第3の開発では、第1データ・フローは、複数のオーディオ沈黙時間を含む。最後に受信されたオーディオ沈黙時間の持続時間は、第2データ・フローの前記第2データが受信されるまで増やされる。
【0023】
この指数関数的変更の利益は、それが最後の瞬間に行われることである。言い換えると、データがバッファリングされるときに同期化マークがバッファ限度に近くなればなるほど(前記限度は、2つのデータ・フローの2つの同期化された特定のデータの再生に対応する)、第1データ・フローはより大きく変更される。その結果、第2データ・フローの取出のための時間が得られ、処理時間が最適化される。
【0024】
この開発の第2の利益は、オーディオ沈黙の持続時間が乗算されまたは除算される係数に関する可能性の広い範囲に存する。具体的に言うと、この係数の展開を、線形、指数関数、または任意の他の数学的関数に従うものとすることができる。
【0025】
第4の開発では、第1データ・フローが複数のオーディオ沈黙時間を含む場合に、少なくとも1つのオーディオ沈黙時間の持続時間は、第2データ・フローの第2データが受信されるまで増やされる。
【0026】
この開発の利益は、実施態様の可能性の広い範囲を提供することである。第1データ・フローに対して行われる変更を、複数のオーディオ沈黙時間にまたがって分散することができ、使用可能コンピューティング・リソースまたはユーザ経験の質などのパラメータのバランスをとることができる。
【0027】
この可能な分散のもう1つの利益は、人間の可聴品質知覚または可視品質知覚さえあるいはその両方などのパラメータを考慮に入れることができることである。
【0028】
もう1つの利益は、コンピューティング・リソースを最適化できることである。たとえば、具体的に言うと、複数のうちの唯一の期間を変更することができる。
【0029】
この開発のもう1つの利益は、送達制御を間接的に可能にすることである。この利益は、図6の説明で詳細に述べる。
【0030】
第5の開発では、少なくとも1つのオーディオ沈黙時間の持続時間は、タイムアウト期間が満了するまで増やされる。
【0031】
利益は、タイムアウトの導入が、先行するものと正確に反対の形で2つの同期化されたフローの再生を制御することを可能にすることである。
【0032】
第6の開発では、第1データ・フローは、オーディオ/ビデオ・データ・フローである。
【0033】
第7の開発では、ビデオ・データが挿入される。
【0034】
本発明の目的は、オーディオ/ビデオ・データ・フローを低速化するのにオーディオ沈黙時間を利用することである。
【0035】
利益は、第1データ・フローがオーディオ・データのみではなく、オーディオ/ビデオ・データである場合であっても、オーディオ沈黙時間を増やすことができることである。
【0036】
第8の開発では、ビデオ・データが省略される。
【0037】
本発明の目的は、オーディオ/ビデオ・データ・フローを高速化するのにオーディオ沈黙時間を利用することである。
【0038】
利益は、第1データ・フローがオーディオ・データのみではなく、オーディオ/ビデオ・データである場合であっても、オーディオ沈黙時間を減らすことができることである。
【0039】
第9の開発では、挿入されるビデオ・データは、複製されたフレームまたは補間されたフレームである。
【0040】
利益は、複製されたフレームが、さらなる計算リソースを全く必要としないことである。これらの複製されたフレームは、たとえば変更の視覚的効果を最小にするように選択することができる(ビデオ・フレームの不連続性は、スタッタをもたらすはずである)。補間されたフレームを使用する場合には、広い範囲の方法を選択することができ、ビデオ品質をさらに高めることができる。
【0041】
第10の開発では、検討されるオーディオ沈黙時間は、人間の声オーディオ沈黙または合成音声オーディオ沈黙である。
【0042】
利益は、説明される方法が、変更されてはならない、または少なくともユーザの知覚に対するより少ない影響を有するために、最も重要なプロパティと考えることのできる声(実際の人間の声であれ、シミュレートされた声または合成音声であれ)に焦点を合わせることである。特に口頭の理解のために、これらの特権付きオーディオ沈黙時間を使用することが、安全であると思われる。
【0043】
第11の開発では、オーディオ沈黙時間は、バッファのユーザのオーディオ環境に従って検出され、オーディオ環境は、ソフトウェア・データによって判定されまたはシミュレートされ、あるいはマイクロホンを使用することによって測定される。
【0044】
利益は、ユーザの実際のオーディオ環境を考慮に入れることができることである。
【0045】
もう1つの利益は、ソフトウェア・データが、簡単にアクセス可能であることと、非常に単純なしきい値を用いて、オーディオ沈黙時間を判定できることである。
【0046】
上のパラメータ(沈黙の分布、フレーム挿入の分布、挿入されるフレームの性質、声特性、測定の点・・・)を組み合わせることの利益は、ユーザの視覚的知覚または可聴知覚あるいはその両方を最適化することを可能にすることである。
【0047】
本発明の第2の態様によれば、本発明の第1の態様による方法の各ステップを実行するように適合された手段を含む装置が提供される。
【0048】
この装置を非常に簡単に入手でき、したがってこの方法を実行しやすくなることが利点である。
【0049】
本発明の第3の態様によれば、本発明の第1または第2の態様による方法の各ステップを実行する命令を含むコンピュータリンクド可読媒体が提供される。
【0050】
この媒体を使用して、さまざまな装置でこの方法を簡単にインストールできることが利点である。
【0051】
本発明のさらなる利益は、図面および詳細な説明を調べた時に、当業者に明瞭になるであろう。すべての利益が本明細書に組み込まれることが意図されている。
【0052】
本発明の実施形態を、添付図面を参照してこれから説明する。
【図面の簡単な説明】
【0053】
【図1】本発明の大域的環境を示す図である。
【図2】本発明が動作するレベルで同期化ユニットを説明するブロック図である。
【図3】本方法を説明する流れ図である。
【図4】データ・フロー、オーディオ沈黙時間、バッファ、および同期化マークを示す図である。
【図5】オーディオ沈黙時間の持続時間の増減の結果の動作の補償を示す図である。
【図6】第2データ・フローが絶対に取り出されない場合を示す図である。
【図7】第1データ・フローがオーディオ/ビデオ・データ・フローである、本発明の実施態様を示す図である。
【図8】オーディオ沈黙時間の検出を示す図である。
【図9】オーディオ沈黙時間検出用の測定諸態様を示す図である。
【発明を実施するための形態】
【0054】
データ・フローは、イメージ(写真、地図、またはグラフィックス・データなどのスチール・イメージ・・・)、テキスト(電子メール、プレゼンテーション・スライド、チャット・セッション、宣誓証言写し、ウェブ・ページ、クイズ・・・)、ビデオ(アニメーション付きイメージ、フレームのシーケンス、ウェブカム・ビデオ、TV番組・・・)、マルチメディア文書(リッチ・メディア文書、・・・)、またはプログラム・データ(3Dアニメーション、ゲーム、・・・)など、ネットワークによって送信されるデータに対応することができる。ほとんどの場合に、表現データ・フローは、データ・ストリームと同等である。
【0055】
オーディオ沈黙時間は、たとえば穏やか、静か、平和、または無音もしくは無騒音とさえ特徴を表すことができるサウンドラックの部分またはサウンド・システムを指す。沈黙は、客観的測定が当業者に明白である(低域フィルタ、利得・・・)相対的概念である。
【0056】
同期化は、本願の目的であり、さまざまな状況にあてはまり得る。非網羅的リストは、タイプ(括弧内の例)すなわち、テキストを伴うオーディオ(歌詞の写しを伴うMP3ソング)、オーディオを伴うオーディオ(MP3ミキシングまたは電話会話多重化)、イメージを伴うオーディオ(MP3およびアルバム・ジャケット・イメージ)、ビデオを伴うオーディオ(ポッドキャストおよび話者のビデオ)、テキストを伴うオーディオ−ビデオ(音楽クリップおよび歌詞)、オーディオ−ビデオおよびオーディオ(映画および追加の音楽サウンドトラック)、オーディオ−ビデオおよびイメージ(ビデオキャストおよびスライド、グラフィックス、地図、または任意の他の隣接文書)、ビデオを伴うオーディオ−ビデオ(ビデオキャストおよびflashアニメーション)、プログラムを伴うオーディオ−ビデオ(ビデオキャストおよび対話型アニメーション)、またはオーディオ−ビデオを伴うオーディオ−ビデオ(芸術、ビデオ・ウォール、ビデオ編集のための2つのビデオの同期化・・・)さえ含む。対向する沈黙時間および非沈黙時間を有する2つのビデオを、本発明を用いて同期できることが観察される。ほとんどの場合に、同期化は、リッチ・メディア・オブジェクトに適用される。リッチ・メディアは、ビデオ、オーディオ、およびアニメーションなどの高められた感覚特徴を利用する、ダイナミックな動きを示す広い範囲の対話型ディジタル・メディアを記述するのに使用される用語である。この動きは、経時的に(たとえば継続的に更新する株式相場表示器)またはユーザ対話に直接応答して(ユーザ制御を可能にするスライドショーと同期化されたウェブキャスト)発生し得る。いわゆるリッチ・メディア・ファイルは、同期化されたおよび同期化されていないデータ・フローの集まりと考えることができる。
【0057】
バッファは、制御できないネットワーク遅延に起因するフリーズを避けるためにデータを蓄積するのに使用される。バッファ深さ(または長さ)は、通常、これらの遅延を予想し、デバイス制約に対処するサイズにされる。ほとんどの場合に、バッファは、予測されたネットワーク遅延に対処するサイズにされる。非常に予測可能な挙動を有するネットワークでは、バッファを小さくすることができる。逆に(たとえば、インターネット上、または疎結合システムの文脈で、またはサービス品質機構(QoS)を有しない任意の他のネットワーク)、ネットワーク遅延は、広い範囲で変化する可能性があり、バッファのサイズは、より重要である必要がある。本発明では、バッファのサイズは、問題ではない。バッファが、経時的に可変深さを有する場合であっても、請求される技術的機構の実施態様が変更されないままになると考えることができる。したがって、図面では、バッファが固定サイズを有すると考えられる。さらに重要なことに、このケースは、現在、バッファを組み込んでいる多数のシステムの現実に対応する。バッファは、ハードウェアまたはソフトウェアのいずれかで実施できるが、バッファの大多数が、現在ソフトウェア実施されていることが観察される。バッファは、通常、FIFO(先入れ先出し)法で使用され、入ってきた順番でデータを出力する。最後に、キャッシュまたはデータ・キャッシング機構は、バッファと同一の機能性に到達することができることが観察される(ほとんどの場合に、キャッシュは、RAMなどのより高速のアクセスを有する位置にデータを格納する)。
【0058】
説明を容易にするために、ある図面である要素を識別する符号は、すべての他の図面で同一の要素を表す。
【0059】
図1に、本発明の大域的環境を示す。
【0060】
諸実施形態の環境を示す図1に示されているように、データのストレージ手段(100)、データ・フローがそれを介して送信されるネットワーク(120)、本発明がそのレベルで動作する同期化ユニット(140)、および同期化されたデータ・フローを解釈するのに使用されるメディア・プレイヤ(160)が設けられる。
【0061】
ストレージ手段(100)は、複数のサーバにデータを格納するのに使用される。これらのコンポーネントは、すべてがまたは部分的に、暗号化されまたはDRM保護され得る。データ・キャッシング機構を使用して、コンテンツの送達を加速することもできる。具体的に言うと、単一のコンポーネントを、複数のサーバにまたがってフラグメント化するか分散させることができることが観察される。すべてのデータ・フローは、要求され、異なるネットワーク(120)を介して同期化ユニット(140)に送信される。同期化の後に、データ・フローは、データ・フローを解釈(たとえば、オーディオ再生またはビデオ表示)する手段を含むメディア・プレイヤ(160)に送られる。
【0062】
格納されたデータをストリーミングすることができるが、いくつかの場合に、FTP転送またはデータを転送する他の形をも使用できることが観察される。具体的に言うと、データの送信を、ストリーミングまたはプログレッシブ・ダウンロードのいずれかによって行うことができる。両方の形が、バッファリング機構を必要とする。しかし、ストリーミングの形が、表示されるフレームだけを要求する(ビデオの再生カーソルに従って)のに対して、プログレッシブ・ダウンロードの形は、データ・ファイルのダウンロードを開始することおよび既にダウンロードされたデータを見ることを即座に可能にすることからなる。唯一のネットワークを使用することができるが、複数のネットワークが使用される可能性がより高いことも観察される。ネットワークは、異なる性質を有することができ、動的に変更され得る。たとえば、あるコンポーネントを、まずGSMネットワークを介して要求し、部分的に送信し、使用可能な時に、ファイルの残りの部分をWIFIネットワークを介して要求することができる。したがって、ファイバ(光および他)、ケーブル(ADSLおよび他)、無線(Wifi、Wimax、および他)など、すべての種類のネットワークを、さまざまなプロトコル(FTP、UDPストリーミング、および他)と共に使用することができる。
【0063】
図2に、本発明が動作するレベルで同期化ユニットを説明するブロック図を示す。
【0064】
ここで図2を参照するが、図2には、同期化ユニット(140)の詳細な構造が示されている。同期化ユニット(140)は、データ・フロー・バッファ(200)、オーディオ沈黙時間検出器(202)、同期化マーク受信器(204)、データ・フロー変更ユニット(206)、およびネットワーク・コントローラ(208)を含む。
【0065】
データ・フロー・バッファ(200)は、ネットワーク(120)によって送信されたデータを受信する。データ・フロー・バッファ(200)は、複数のデータ・フローをバッファリングし、バッファリングされたデータをオーディオ沈黙時間検出器(202)に送るように適合される。前記オーディオ沈黙時間検出器(202)は、1つまたは複数のデータ・フロー内のオーディオ沈黙時間を検出するように適合される。オーディオ沈黙時間検出器(202)は、同期化マーク受信器(204)に接続され、データ・フロー変更ユニット(206)に結合される。同期化マーク受信器(204)は、1つまたは複数の同期化マークを受信するためにネットワーク(120)をリスンする。同期化マーク受信器(204)は、オーディオ沈黙時間検出器(202)に接続される。データ・フロー変更ユニット(206)は、オーディオ沈黙時間検出器(202)と相互作用し、オプションで、ネットワーク・コントローラ(208)にも結合される。データ・フロー変更ユニット(206)は、オーディオ沈黙時間を増やすか減らすことによって、受信されたデータ・フローを変更するように適合される。ネットワーク・コントローラ(208)は、データ・フロー・バッファ(200)およびデータ・フロー変更ユニット(206)と相互作用する。ネットワーク・コントローラ(208)は、データ・フロー・バッファからネットワーク遅延を測定し、データ・フロー変更ユニット(206)を制御するように適合される。
【0066】
好ましい実施形態では、データ・フロー・バッファ(200)は、第1着信データ・フローをバッファリングする。同期化マーク受信器(204)が第1データ・フローに伴う同期化マークを受信するや否や、オーディオ沈黙時間検出器(202)は、オーディオ沈黙時間の分析および検出を開始する。その間に、データ・フロー・バッファ(200)は、同期化マークによって決定されるとおりに、保留中の必要な第2データ・フローをリスンする。バッファリングされたデータは、データ・フロー変更ユニット(206)内で変更される。オーディオ沈黙時間持続時間は、ネットワーク・コントローラとの相互作用に従って増やされ、または減らされる。第1データ・フローの第1データと同期化されなければならない第2データ・フローの第2データと、第1データ・フローの前記第1データとの両方が受信される時に、バッファリングされ同期化されたデータが、メディア・プレイヤ(160)での再生のためにバッファ・ランニング・ポジションから出る。
【0067】
ネットワーク・コントローラ(208)がオプションである(同期化は、前記ネットワーク・コントローラなしで働くことができ、データ・フロー・バッファ(200)とデータ・フロー変更ユニット(206)との両方とのネットワーク・コントローラ(208)の相互作用は、本発明の性能を改善するのを助ける)ことが強調される。ネットワーク・コントローラ(208)を、データ・フロー・バッファ(200)からのみではなく、ネットワーク遅延を測定するように適合された他の手段(この図には図示せず)に接続できることが観察される。最後に、データ・フロー変更ユニット(206)は、そのようなコントローラによって制御されるように適合される(たとえば、遅延が重要である場合に、変更が重要になる)。
【0068】
図3に、本方法を説明する流れ図を示す。
【0069】
図3に示されているように、
−第2データ・フローの第2データと同期化される第1データを有する第1データ・フローと、
−第1データ・フローの第1データと第2データ・フローの第2データとの間に同期化マークを受信するステップ(300)と、
−同期化マークが不在の場合に第1データ・フローを普通にバッファリングし、これを再生するステップ(302)と、
−1つまたは複数のオーディオ沈黙時間を検出するステップ(304)と、
−第2データ・フローの第2データが受信されるかどうかを確立するステップ(306)と、
−検出されたオーディオ沈黙時間の持続時間のうちの1つまたは複数を増やすステップ(308)と、
−検出されたオーディオ沈黙時間の持続時間のうちの1つまたは複数を減らすステップ(310)と
が提供される。
【0070】
第1データ・フローは、それに対応するファイルが1つまたは複数のストレージ手段(100)に格納され、1つまたは複数のネットワーク(120)を介して送信されるが、メディア・プレイヤ(160)の同期化ユニット(140)で受信される。第1データ・フロー内の第1データと第2の保留中のデータ・フローの第2データとの間の同期化マークがステップ(300)で受信されるや否や、オーディオ沈黙時間が、ステップ(304)で検出されつつある。そうでない場合には、第1データ・フローは、ステップ(302)に対応して普通にバッファリングされ、再生される。沈黙時間の検出は、第2データ・フローの第2データ(第1データ・フローの第1データと同期化されなければならない)がステップ(306)でバッファに受信されるまで継続される。前記第2データ・フローが保留中である間には、バッファリングされた第1データ・フローの検出されたオーディオ沈黙時間のうちの1つまたは複数の持続時間が、ステップ(308)で増やされる。同期化されなければならない第2データを含む第2データ・フローのデータが同期化ユニット(140)で受信される時には、バッファリングされた第1データ・フローの検出されたオーディオ沈黙時間のうちの1つまたは複数の持続時間が、ステップ(310)で減らされる。バッファのストレージ限度に達するまで、データ・フローは、バッファリングされ続ける。その後、同期化されたデータ・フローが、メディア・プレイヤ(160)での再生のためにバッファ・ランニング・ポジションから出る。
【0071】
同期化マークを、必須ではないが、第1データ・フローに埋め込む(たとえばメタ・データ内に)ことができることが観察される。実際に、同期化マークを、タイムコードに基づくものとすることができ、1つまたは複数の独立の他のチャネルによって受信することができる。たとえば、第2ソースから来るスライドショーと同期化される第1ソースからストリーミングされる話者のビデオを含むリアルタイム・ウェブキャストの場合に、同期化マークは、第3ソース(またはネットワーク)を利用することができる。これらの同期化マークは、生イベントの場合に、オン・デマンドで要求され(たとえば、話者自身によって送信され)得る。ほとんどの場合に、そのような同期化マークには、ウェブ・ページのURLおよび時刻値が封入される。これらを、ブラウザ環境内でクッキーに封入することもできる。
【0072】
第2データ・フローを、単純に受信でき(送信が外部の独立のサーバによって衝撃を与えられるので)、あるいは、埋め込まれたメタデータによって要求できる(たとえば、第1データ・フロー内または同期化マーク自体内にさえのいずれか)ことをも観察することができる。
【0073】
図4に、データ・フロー、オーディオ沈黙時間、バッファ、および同期化マークを示す。
【0074】
図4に示されているように、
−データ・フロー(400)と、
−白でマークされたオーディオ沈黙時間(402)と、
−黒でマークされた非沈黙オーディオ時間(404)と、
−同期化マーク(406)と、
−バッファ(408)の表現と
が提供される。
【0075】
(402)のようなオーディオ沈黙時間と(404)のような非沈黙オーディオ時間とを含むデータ・フロー(400)が、受信され、これらの時間の検出は、図8に関してより詳細に説明する。
【0076】
バッファは、(408)の破線のブロックで表される。バッファ(408)の左側は、前記バッファのメモリ限度すなわち、データが再生のためにバッファから解放される点に対応する。バッファ(408)の右側は、バッファの入口に対応する。データがバッファリングされる時に、バッファ(408)ランニング・ポジションは、この図の左から右へ移動する。
【0077】
同期化マーク(406)は、特定の瞬間に受信される。この同期化マークは、データ・フローの特定のデータを別のデータ・フロー(図示せず)の他の特定のデータと同期化しなければならないことを示す。
【0078】
図5に、オーディオ沈黙時間の持続時間の増減の結果の動作の補償を示す。
【0079】
図5に示されているように、追加要素すなわち、
−白でマークされたオーディオ沈黙時間(500)と、
−白でマークされた変更されたオーディオ沈黙時間(502)と、
−処理タスクに関する非常に短い時間期間に対応するεと
と共に、図4と同一の表現が提供される。
【0080】
時刻t1に、同期化マークが受信される。この同期化マークは、第2データ・フローの第2データを現在のデータ・フローの特定のデータと同期化することを要求する。オーディオ沈黙時間(500)が検出される。時刻t1+εに、前記オーディオ沈黙時間の持続時間が、第1時間だけ増やされ、変更されたオーディオ沈黙時間(502)がもたらされる。時刻t2に、第2データ・フローの必要なデータが受信される。したがって、時刻t2+εに、変更されたオーディオ沈黙時間(502)の持続時間が、減分によって、もう一度変更され、正確に以前のオーディオ沈黙時間(500)がもたらされる。したがって、結果の説明された動作は、ゼロサム動作である。
【0081】
この図では、説明を明瞭にするために、唯一のオーディオ沈黙が図示され、変更される。類似する補償を、複数のオーディオ沈黙時間がある場合に、それらを使用して得ることができることが観察される。これらの時間のいくつかの持続時間を増やすことができ、他の持続時間を減らすことができ、その結果、最終結果は、変更されない総持続時間になる。補償は、正確または不正確にすることができる。これは、データ・フローに対して行われる変更を最小にするための本発明のもう1つの態様である。
【0082】
図6に、第2データ・フローが絶対に取り出されない場合を示す。
【0083】
前の図は、必要なデータが間に合って受信される場合に対応し、この図は、求められる(必要な)データが絶対に受信されない、反対の状況を示す。図6に示されているように、追加要素すなわち、
−白でマークされたオーディオ沈黙時間(600)と、
−白でマークされた変更されたオーディオ沈黙時間(602)と、
−白でマークされた再変更されたオーディオ沈黙時間(604)と、
−処理タスクに関する非常に短い時間期間に対応するεと
と共に、図4と同一の表現が提供される。
【0084】
前の図と同様に、時刻t1に、同期化マークが受信される。唯一のオーディオ沈黙時間(600)の持続時間が、時刻t1+εに増やされ、変更されたオーディオ沈黙時間(602)がもたらされる。時刻t2に、必要なデータが受信されなかったので、持続時間がもう一度増やされる。着信第1データ・フローは、バッファリングされ続け、バッファは、図の左から右へ移動する。沈黙が再生されつつある(図示のバッファの左側)。その後、このプロセスは、それ相応に継続する(604)。言い換えると、オーディオ沈黙は、指数関数的に増やされる。
【0085】
最後に、前の図と同様に、説明を明瞭にするために、唯一のオーディオ沈黙が図示され、変更されることが観察される。この方法の実施態様がどの時間を増やすべきかの選択から利益を得ることができることを除いて同一の機構が、複数のオーディオ沈黙時間が存在する場合に観察されるはずである。好ましい実施形態では、最後に受信されたオーディオ沈黙時間(言い換えると、最後にバッファリングされたオーディオ沈黙時間;図4を参照されたく、図示のバッファの左端に関して図示されている)が増やされる。したがって、増加モデルは、任意の数学関数(線形、定数、指数など)に従うことができる。
【0086】
この開発の利益は、送達制御を間接的に可能にすることである。同期化されたフローの再生は、必要なデータが受信されない場合には可能ではない(1つまたは複数のオーディオ沈黙が、第2データ・フローの第2データが受信されるまで増やされる。第2データ・フローのこの第2データが絶対に受信されない場合には、第1データ・フローは、バッファのサイズにおける制限に起因して、フリーズしているように見える)。そのような制御は、コンテンツの保護に関して非常に貴重でありえる。第2データ・フローの第2データが、DRM(ディジタル著作権管理)権利を付加され、バッファ内に受信されない(たとえば、取り出されず、正しく復号されない)場合には、これは、第1データ・フローの回復を妨げる。そのような保護の頑健性は、多数の類似する必要なデータ・フローの使用からも利益を得る。
【0087】
必要なデータが絶対に受信されない、このシナリオの結果を救済するために、タイムアウト機構を使用することができる。このタイムアウトは、所定の遅延を使用することができ、あるいは、動的にセット・アップされ得る。1つまたは複数のサーバ(データを送信する)、クライアント(対応するルールを有するメディア・プレイヤ)、ユーザ(同期化されたフローの取出のドロップを指示することができる可能性がある)、または第1データ・フロー自体(埋め込まれたデータを伴う)さえのいずれかが、そのようなタイムアウト機構を含むか、これに衝撃を与えることができることが観察される。
【0088】
図7に、第1データ・フローがオーディオ/ビデオ・データ・フローである、本発明の実施態様を示す。
【0089】
図7に示されているように、
−非沈黙オーディオ沈黙時間(700)と、
−オーディオ沈黙時間(702)と、
−変更されたオーディオ沈黙時間(704)と、
−ビデオ・データのフレーム(710)と、
−挿入された追加のビデオ・フレーム(712)と
が提供される。
【0090】
図7に、オーディオ・データおよびビデオ・データを含むデータ・フローを示す。前記オーディオ・データは、(702)に似たオーディオ沈黙時間および(700)に似た非沈黙オーディオ沈黙時間を含む。前記ビデオ・データは、さらに、(710)に似た複数の順次ビデオ・フレームを含み、各フレームは、前記第1データ・フローに属する特定のオーディオ・データに関連する。前記データ・フローを、オーディオ/ビデオ・データ・フローと称する。時刻t1+εに、オーディオ沈黙時間(702)の持続時間が増やされ、変更されたオーディオ沈黙時間(704)がもたらされる。(この変更されたオーディオ・データに)対応するビデオ・データは、前記オーディオ沈黙時間に属する前記オーディオ・データに関連するすべてのビデオ・フレームの間に(712)に似た追加ビデオ・フレームを挿入することによって変更される。
【0091】
この図は、実際に、オーディオ沈黙時間が増やされる時に何が起きるのかを示す。視覚的効果(変更されたデータ・フローがたまたま再生される場合の)は、そのオーディオ沈黙時間中のビデオの低速化またはフリーズである。
【0092】
オーディオ沈黙時間が減らされる(たとえば、必要なデータが受信される時または前の変更を補償するため)、反対のステップ(図面には示さず)について、前に挿入されたフレームが、削除または省略され、いくつかの他の場合には、視覚的効果(変更されたデータを再生する時の)は、ビデオ・リプレイの低速化またはフリーズにすらなる。
【0093】
したがって、前の図に関して説明し、図示した本発明の諸態様に関するすべての所見は、同様にあてはまる(補償、複数のオーディオ沈黙時間の使用、タイムアウト機構など)。具体的に言うと、図5では、バッファ内の挿入されたフレームと削除されたフレームとの間に補償が見られ、リプレイ(再生)中の視覚的影響がない可能性が高い。図6では、ビデオ・リプレイにおけるフリーズが見られる(タイムアウト機構が使用されない限り)。
【0094】
追加のビデオ・フレームを挿入するための幅広い選択があることが観察される。たとえば、これらのフレームを、複製されたフレーム(たとえば既存のバッファリングされたフレームの中で選択される)または補間されたフレーム(言い換えると、生成されるフレーム)とすることすらできる。最小の視覚的影響を有するために、ビデオの分析は、挿入すべきフレームの性質とこれらのビデオ・フレームを挿入すべき時間との両方に関して、追加フレームの分配を判断するのを助けることができる。この分析は、オンザフライ(たとえば、バッファ内)で処理することができ、あるいは、所定(この判断ステップを助けるためにメタ・データに埋め込まれる)とすることができる。高ビットレートの特徴があるシーン(たとえば、オーディオ沈黙時間がない場合に少数を伴うアクション・シーン)は、より低いビットレートのシーン(たとえば話のオーディオ沈黙時間を伴うテレビジョン・スピーカ)より使用可能である可能性がより低い。したがって、バッファリングされたデータの分析は、ビデオ・フレームを挿入すべき最良の沈黙時間を判断するのを助けることができる。これらの追加フレームを、複数の使用可能なオーディオ沈黙時間にまたがって分散させることができる(1つの唯一のオーディオ沈黙時間にまたがってさえ、均等に分散させまたはさせない)。
【0095】
本発明の目的は、最終出力に対する影響を最小にするためにバッファ内のデータに対して行われる大域的変更を最小にすることである。無音の複数の期間にわたる分布は、このケースへの関心を表すことができる。オーディオ沈黙中のバッファ・データ変更を多数の他の要因によって駆動できることが観察される。複数のオーディオ沈黙の中に、好ましくはどの沈黙時間を延長しなければならないのかを判断するために考慮に入れるべき他の要因がある可能性がある。そのうちの1つが、対応するビデオ・データ変更の最小化である。たとえば、爆発のようなアクション・シーンから始まるドキュメンタリーを紹介するじっとしている話者を示すビデオ・シーケンスでは、アクション・シーンのオーディオ沈黙がある場合でも、それらよりも、話者部分のオーディオ沈黙を延長することがはるかにより興味深い可能性がある。
【0096】
多数の実施態様が可能である。第2データ・フローの取出のための時間を得る必要と出力されるデータに対するできる限り少ない影響を有する必要(以前に行われた変更の補償)との間の妥協を得るために、さまざまな異なるアルゴリズムを選択することができる。すべてのアルゴリズムは、残された時間を考慮に入れなければならず、これは、同期化マークの前のバッファ内に残っている時間が、2つの同期化されたデータ・フローが実際に演奏される必要がある瞬間に対応するバッファの最大サイズに達することを意味する。単純な可能性は、再生の前にバッファ内に残っている時間に対応するしきい値をセットアップすることに存する。保留中のオブジェクト(受信されるべき第2データ・フロー)があり、再生の前の残された時間が前記しきい値を超える場合には、ビデオ・データまたはオーディオ・データは、バッファ内で変更されず、次のビデオ・フレームがプレイされる。対照的に、残された時間がしきい値より小さい場合には、別のテストが実行され、残された時間がしきい値を2で割ったものより小さい場合には、ビデオ・リプレイ速度も2で割られ(これは、現在のフレームを1回リプレイすることによって達成される)残された時間がしきい値を2で割ったものを超える場合には、ビデオ・リプレイ速度を4で割る(これは、ビデオ・フレームを3回リプレイすることによって達成される)。フレームのリプレイおよびフレームのコピーの追加が、同一の意味を有することが観察される。
【0097】
最後に、同一の観察(フレームの性質、分布、視覚的影響、ビットレートなど)を、フレームが削除されまたは省略される反対の動作について行うことができる。やはり、削除されるフレームが、必ずしも以前に挿入されたフレームではないことが強調される。
【0098】
図8に、オーディオ沈黙時間の検出を示す。
【0099】
図8に示されているように、
−データ・フロー(400)と、
−非沈黙オーディオ時間(402)および(800)と、
−オーディオ沈黙時間(404)および(810)と
が提供される。
【0100】
説明を明瞭にするために、古典的オーディオ・スペクトルを示す別の表現が使用されている。前に使用された図との対応が、示されている。
【0101】
オーディオ沈黙時間は、明らかに相対的であり、測定可能性に依存する。人が、何がオーディオ沈黙時間と考えられるべきかを判断しなければならない。したがって、オーディオ沈黙時間の検出は、前記沈黙を判定するのに当業者によって使用される通常の形を指す。これは、複数の既知の方法によって達成でき、最も単純な解決策は、しきい値が選択され、しきい値未満のオーディオ・シーケンスがオーディオ沈黙と考えられることを特徴とする。しきい値は、デシベル(dB)単位、ワット単位などとすることができる。
【0102】
図8に関して示されているように、データ・フロー(400)が分析され、所定のしきい値より小さい値を有する非沈黙オーディオ時間(800)は、オーディオ沈黙時間(404または810)と考えられる。したがって、ステップ(a)での分析の前に、データ・フロー(400)は、未分析オーディオ・データを含み、ステップ(b)での分析の後に、このデータ・フローは、オーディオ沈黙時間(404)を含み、残りのデータは、まだ非沈黙オーディオ時間(402)と考えられる。
【0103】
大きい値(たとえば、オーディオ信号のピークまたは平均値と比較して)を有するしきい値の使用は、興味深い。というのは、これが、多数のオーディオ・シーケンスがオーディオ沈黙と考えられ、その結果、同期化されたフローの取出のための時間を得るより多くの機会が生じることを暗示するからである。逆に、相対的に少数の沈黙時間が判断される場合には、本発明の説明される機構を使用する、より少数の機会が生じる。
【0104】
スプリッタの使用が、本発明の実施態様のために必要になる場合があることが観察される。たとえば、MPEG2またはMPEG4データ・フロー(ストリーム)内では、オーディオ・データおよびビデオ・データは、同一ストリームに埋め込まれる。オーディオ沈黙時間を検出しまたは判定することができるために、オーディオ・データをビデオ・データから分離することが必要になる場合がある。
【0105】
図9に、オーディオ沈黙時間検出用の測定諸態様を示す。
【0106】
図9に示されているように、
−サウンド・カード、スクリーン・ディスプレイ、キーボード、およびポインティング・デバイスを有する中央ユニットを
−メディア・プレイヤ・アプリケーションのディスプレイ(900)
と共に含むコンピュータと、
−オーディオ・プラグ出力(910)と、
−オーディオ・スピーカ(920)と、
−マイクロホン・オーディオ入力(930)と、
−ユーザ(940)と
が提供される。
【0107】
コンピュータの中央ユニットは、メディア・プレイヤ(160)を実行し、このメディア・プレイヤは、ディスプレイ(900)に表示される。前記コンピュータ内に組み込まれたオーディオ・カードは、オーディオ信号をオーディオ・プラグ出力(910)に送達する。代替案では、オーディオ・カードは、オーディオ・スピーカ(920)に接続され、マイクロホン・オーディオ入力(930)も、前記オーディオ・カードに接続される。ユーザ(940)は、オーディオを聞いているかビデオを見ている。
【0108】
この図が、デスクトップ・パーソナル・コンピュータを用いる実施態様の一例を示すのみであることが観察される。諸実施形態を、携帯電話機、ハンドヘルド・オーガナイザ、携帯情報端末(PDA)、「パームトップ」デバイス、ラップトップ機、スマートホン、マルチメディア・プレイヤ、TVセットトップ・ボックス、ゲーム機、ウェアラブル・コンピュータなどの他のハイテク・デバイスに簡単に適用しまたは適合させることができる。サウンド回復(すべてのタイプのヘッドホンまたはスピーカ)または視覚的表示(LCD、oled、レーザ網膜ディスプレイなど)あるいはその両方を含むすべての手段が、本発明を実施することができる。
【0109】
本発明のキー・ポイントは、オーディオ沈黙時間を検出するためのオーディオ・レベルをどのようにどこで測定するかの判断である。多数のオーディオ・レベルを、実際に考慮することができる。最初の可能性は、ユーザが実際に知覚するオーディオ・レベルを測定することである(理想的な解決策は、ユーザ(940)の耳での測定になるはずである)。さらによい解決策は、ユーザの聴取能力を考慮に入れることに存するはずである。対応するレベルを、できる限りユーザ(940)の耳に近いマイクロホン・オーディオ入力(930)を用いて測定することができる。第2の可能性は、オーディオ・スピーカ(920)でオーディオ・レベルを測定することである。第3の解決策は、オーディオ・プラグ出力(910)で基準としてとることである。第4の解決策は、ディスプレイ(900)に表示されたメディア・プレイヤ・アプリケーション自体から直接にオーディオ・レベルを取り出すことであり(これは、関連する値がソフトウェア・データ内で簡単にアクセス可能なので、より便利な解決策である)、この解決策は、コンピュータに接続されたオーディオ・システムの抽象化を行う。
【0110】
オーディオ・レベルを、測定することができるが、シミュレートしまたは予測することもできることが観察される。さらなる開発は、音響環境の予測を考慮に入れることを可能にすることができる(したがって、環境雑音および音響心理学パラメータの測定として)。
【0111】
したがって、理想的にはユーザの耳の近くに配置されるマイクロホン・オーディオ入力(930)によって実行されるユーザのオーディオ環境の測定および分析は、データの変更に関する最良の時間を判断するのを助けることができる(必要なデータが受信されない場合にデータが解釈され、再生される危険を冒して)。マイクロホンが、特定の重要性を有することが観察され、実際のオーディオ測定またはフィードバックの実行なしにユーザの実際のオーディオ環境を評価する形がないことが既知である。DRMすなわちディジタル著作権管理は、アナログ信号(スピーカ、ユーザ)を考慮に入れまたは制御することができないことを強調するために「アナログ・ホール(analog hole)」という特定の語彙の下でこの点を指す(チェーンは、HDMIのように、正しく制御されるためにフル・ディジタルでなければならない)。実際に、一連の特定のシナリオを想像することができ、スピーカがオフにされている場合に、データ・フロー全体が沈黙であると考えることができる。同一の結論が、スピーカのサウンド・レベルが、ユーザが聞き取ることができないほどに低い場合にも現れる。
【0112】
もう1つの実施形態では、本発明は、第2の必要な同期化されたリッチ・メディア・コンポーネントが取り出されるまで第1リッチ・メディア・コンポーネントのオーディオ沈黙中にビデオ再生を低速化することと、前記第2コンポーネントが取り出された時に前記オーディオ沈黙中のビデオ再生を高速化することとによって、同期化されたリッチ・メディア・コンポーネントをメディア・プレイヤ内でバッファリングする方法を開示する。
【0113】
さらなる実施形態で、本発明は、データ・フロー、たとえばオーディオ/ビデオ・ストリームを有する隣接文書フレームの同期化に関する。新しいフレームを表示しなければならない瞬間を示すメタデータが、オーディオ/ビデオ・フレームに挿入される。ストリームは、受信器でバッファリングされ、バッファ内容は、メタデータについてスキャンされる。まだ到達していないスライドを示すメタデータが見つかる場合に、システムは、ストール・フェーズに入り、このストール・フェーズ中には、オーディオ/ビデオ・ストリーム内の任意の沈黙時間の長さが延ばされる。オーディオ/ビデオ・ストリーム内で、欠けているスライドにより近くなる点で、沈黙時間が延ばされる係数が、指数関数的に増やされる(すなわち、ビデオ・ストリームは、オーディオ沈黙時間中に複製されたビデオ・フレームを追加することによって低速化される)。期待されるスライドが実際に到着したならば、オーディオ/ビデオ・ストリームの再生は、ストール・フェーズ中にバッファ内に蓄積されたオーディオ/ビデオ・データのバックログをクリアするために、沈黙時間を圧縮することによって高速化される(すなわち、ビデオ・ストリームは、オーディオ沈黙時間中のビデオ・フレームをスキップすることによって高速化される)。言い換えると、本発明は、リッチ・メディア・ファイルの他のメディア要素を取り出している間のオーディオの知覚可能な変更を伴わずにビデオのプレイを低速化または高速化する方法を説明するものである。
【0114】
もう1つの実施形態では、本発明は、第2フローの送達レートの変動について補償するためにオーディオ・フローを含む第1フローを加速しまたは減速するためにそのフローの沈黙の時間を延長しまたは圧縮することによる2つのデータ・フローの同期化に関する。本発明は、オーディオ沈黙中にビデオおよびオーディオのフローまたはストリームの両方を低速化し、または高速化する。
【0115】
さらなる実施形態で、第1データ・フローは、受信器でバッファリングされ、バッファ内容は、メタデータについてスキャンされる。まだ到着していない第2データ・フローを示すメタデータが見つかる場合には、システムは、ストール・フェーズに入り、このストール・フェーズ中には、第1データ・フロー内のすべての沈黙時間の長さが延ばされる。第2データ・フローが必要である第1データ・フロー内の点が近くなる時に、沈黙時間がそれによって延ばされる係数が、指数関数的に増やされる。期待される第2データ・フローが実際に到着した後に、この2つのデータ・フローの再生は、ストール・フェーズ中にバッファ内で蓄積された追加データのバックログをクリアするために沈黙時間を圧縮することによって加速される。

【特許請求の範囲】
【請求項1】
第1データ・フローを受信するステップであって、前記第1データ・フローは、オーディオ・データを含む、ステップと、
同期化マークを受信するステップであって、前記同期化マークは、前記第1データ・フローの第1データを第2データ・フローの第2データに関連付ける、ステップと、
前記第1データ・フロー内の少なくとも1つのオーディオ沈黙時間を検出するステップと、
前記同期化マークが前記第2データ・フローの前記第2データの受信の前に受信される時に前記少なくとも1つのオーディオ沈黙時間の持続時間を増やすステップと
を含む、データ・フローを同期化する方法。
【請求項2】
少なくとも1つの前記オーディオ沈黙時間の持続時間を減らすステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記第1データ・フローが、複数のオーディオ沈黙時間を含み、最後に受信されたオーディオ沈黙時間の持続時間が、前記第2データ・フローの前記第2データが受信されるまで増やされる、請求項1ないし2のいずれかに記載の方法。
【請求項4】
前記少なくとも1つのオーディオ沈黙時間の持続時間が、前記第2データ・フローの前記第2データが受信されるまで増やされる、請求項1ないし3のいずれかに記載の方法。
【請求項5】
前記少なくとも1つのオーディオ沈黙時間の持続時間が、タイムアウト期間が満了するまで増やされる、請求項1ないし4のいずれかに記載の方法。
【請求項6】
前記第1データ・フローが、オーディオ/ビデオ・データ・フローである、請求項1ないし5のいずれかに記載の方法。
【請求項7】
ビデオ・データを挿入するステップをさらに含む、請求項6に記載の方法。
【請求項8】
ビデオ・データを省略するステップをさらに含む、請求項6に記載の方法。
【請求項9】
追加されるビデオ・データが、複製されたフレームまたは補間されたフレームである、請求項7に記載の方法。
【請求項10】
前記オーディオ沈黙時間が、人間の声オーディオ沈黙または合成音声オーディオ沈黙である、請求項1ないし9のいずれかに記載の方法。
【請求項11】
前記オーディオ沈黙時間が、バッファのユーザのオーディオ環境に従って検出され、前記環境が、ソフトウェア・データによって判定されまたはシミュレートされ、あるいはマイクロホンを使用して測定される、請求項1ないし10のいずれかに記載の方法。
【請求項12】
請求項1ないし11のいずれか一項に記載の方法の各ステップを実行するように適合された手段を含む装置。
【請求項13】
前記手段が、バッファをさらに含み、前記第1データ・フローが、前記バッファによって受信され、少なくとも1つの前記オーディオ沈黙時間が、前記バッファ内に受信された前記第1データ・フロー内で検出され、前記同期化マークが前記第2データ・フローの前記第2データの受信の前に受信される時に前記少なくとも1つのオーディオ沈黙時間の持続時間を増やす前記ステップが、前記バッファ内で実施される、請求項12に記載の装置。
【請求項14】
前記手段が、ネットワーク・コントローラをさらに含み、前記ネットワーク・コントローラが、ネットワーク遅延を測定し、1つまたは複数の前記オーディオ沈黙時間の持続時間の増加または減少を制御する、請求項13に記載の装置。
【請求項15】
コンピュータ上で実行される時に請求項1ないし11のいずれか一項に記載の方法のステップを実行する命令を含むコンピュータ・プログラムであって、前記コンピュータ・プログラムがコンピュータ上で実行される時の、コンピュータ・プログラム。
【請求項16】
請求項15に記載のコンピュータ・プログラムをその上に符号化されたコンピュータ可読媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2010−539739(P2010−539739A)
【公表日】平成22年12月16日(2010.12.16)
【国際特許分類】
【出願番号】特願2010−522274(P2010−522274)
【出願日】平成20年6月17日(2008.6.17)
【国際出願番号】PCT/EP2008/057593
【国際公開番号】WO2009/027128
【国際公開日】平成21年3月5日(2009.3.5)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.FLASH
2.GSM
【出願人】(390009531)インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MASCHINES CORPORATION
【Fターム(参考)】