説明

ビデオデータをストリーミングするための方法

【課題】ビデオデータをストリーミングするための方法を提供する。
【解決手段】ビデオデータをストリーミングするための方法。ビデオデータを受信する。ビデオデータの少なくとも1つのフレームを複数の領域に分割する。複数の領域の第1の領域に対応するビデオデータを、ネットワークを介して送信する。複数の領域の第2の領域に対応するビデオデータを、対話型入力に従って変更する。第2の領域の変更バージョンに対応するビデオデータを、ネットワークを介して送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の様々な実施の形態は、ビデオストリーミングの分野に関する。
【背景技術】
【0002】
ストリーミングビデオアプリケーションは、異なるタイプのビデオストリームの送信を容易にするために使用される。
たとえば、対話型ストリーミングビデオアプリケーションでは、ビデオストリームのコンテンツは、たとえばユーザ動作に応答してリアルタイムで感知される変化の影響下にある。
そのような対話型のアプリケーションの一例はビデオ会議である。
対照的に、非対話型ストリーミングビデオアプリケーション、たとえばビデオ・オン・デマンド(VoD)システムでは、ビデオコンテンツは対話性に起因して変化しない。
対話型ストリーミングビデオの送信は、非対話型ストリーミングビデオよりもはるかに厳しい処理要件及びタイミング要件、したがって、並びにコストに関連することが理解される。
特に、活発なユーザ対話性を提供するために、通常、終端間遅延が少ないことが要求される。
【発明の概要】
【0003】
本発明の実施の形態は、ビデオデータをストリーミングするための方法に関する。
【0004】
本明細書に組み込まれ、その一部を成す添付の図面は、本発明の実施形態を説明し、詳細な説明と併せて、本発明の原理を説明するのに役立つ。
【図面の簡単な説明】
【0005】
【図1】本発明の一実施形態による、ビデオデータをストリーミングするためのシステムのブロック図である。
【図2】本発明の一実施形態による、対話型入力に従って媒体のフレームの一部分を変更するためのシステムのブロック図である。
【図3A】本発明の一実施形態による、ビデオフレームの独立して復号可能な領域を生成するための分割操作例を示す図である。
【図3B】本発明の一実施形態による、2つの領域を有するフレーム例を示す図である。
【図4】本発明の一実施形態による、ビデオデータを表示するためのシステムのブロック図である。
【図5】本発明の一実施形態による、ビデオデータをストリーミングするためのプロセスを示すフローチャートである。
【図6】本発明の一実施形態による、ビデオデータを表示するためのプロセスを示すフローチャートである。
【発明を実施するための形態】
【0006】
この詳細な説明において参照される図面は、特に記載される場合を除いて、一定の縮尺で描かれたものとして理解されるべきではない。
【0007】
ビデオデータをストリーミングする、本発明の様々な実施形態を本明細書において説明する。
一実施形態において、ビデオデータをストリーミングするための方法を説明する。
ビデオデータを受信する。
ビデオデータの少なくとも1つのフレームを複数の領域に分割する。
複数の領域の第1の領域に対応するビデオデータを、ネットワークを介して送信する。
複数の領域の第2の領域に対応するビデオデータを、対話型入力に従って変更する。
第2の領域の変更バージョンに対応するビデオデータを、ネットワークを介して送信する。
【0008】
本発明の実施形態は、主要表現の一部分のみが対話性に従って変更される、局所的対話性を含むビデオデータをストリーミングするための方法を提供する。
たとえば、パーソナライズされた広告挿入、対話型テレビ、ビデオ対応遠隔協調ツールのような多くの対話型ストリーミングビデオアプリケーションは、局所的対話性を利用する。
本発明の実施形態は、局所的対話性を有するアプリケーションが、該アプリケーションのデータの非対話型部分、たとえばビデオフレームの1つの領域に対応するビデオデータを、遅延の長いストリーミング方法を使用して送信し、一方、データの対話型部分、たとえばビデオフレームの別の領域に対応するビデオデータを、遅延の短い方法を使用して送信し、対話性を容易にすることを可能にする。
本発明の実施形態は、遅延の短い送信方法を使用することなくビデオデータの非対話型部分を送信することによって、送信コスト及びリソース処理コストの低減を提供することができることを理解されたい。
【0009】
ここで、本発明の様々な実施形態を詳細に参照する。
本発明の様々な実施形態の例は添付の図面に示される。
本発明を、様々な実施形態と併せて説明するが、これらの実施形態は、本発明を該実施形態に限定することを意図するものではないことが理解されよう。
それどころか、本発明の実施形態は、代替形態、変更形態、及び均等物を包含するように意図され、それらは添付の特許請求の範囲の精神及び範囲内に含むことができる。
さらに、本発明の様々な実施形態の以下の詳細な説明において、本発明の実施形態の完全な理解を提供するために、多数の特定の詳細を示す。
他の例では、本発明の実施形態の態様を不必要に不明確にしないようにするために、既知の方法、手順、構成要素、及び回路については詳細に説明されていない。
【0010】
本発明の実施形態を、ビデオデータのストリーミングに関して説明するが、本発明の実施形態はビデオデータのストリーミングに限定されないことを理解されたい。
本発明の実施形態は、音声ベースのデータ、画像ベースのデータ、グラフィックデータ、ビデオベースのデータ、テキストベースのデータ、ウェブページベースのデータ等を含むがこれらに限定されない他のタイプの媒体にも当てはまることを理解されたい。
さらに、本発明の実施形態は、同期(たとえばライブ)、非同期(たとえばタイムシフト)を含むオンデマンドの送信、又はダウンロードにも適用することができることを理解されたい。
【0011】
図1は、本発明の一実施形態による、ビデオデータをストリーミングするためのシステム100のブロック図である。
システム100は、フレーム分割器110と、遅延モジュール120と、変更モジュール130(たとえば図2)と、送信機140とを備える。
一実施形態では、システム100は、ネットワーク接続(図示せず)を介して通信することが可能な演算装置内に実装される。
たとえば、システム100は、コンピュータ、携帯電話、携帯情報端末、テレビ、セットトップボックス、及びネットワークを介してデータを送受信することが可能な任意の他の演算装置を含むがそれらに限定されない任意のタイプの演算装置とすることができる。
【0012】
フレーム分割器110、遅延モジュール120、変更モジュール130、及び送信機140は、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組み合わせとして実装することができることを理解されたい。
さらに、システム100は、本発明の実施形態の態様を不必要に不明確にしないようにするために図示されない、さらなる構成要素を備えることができることを理解されたい。
【0013】
フレーム分割器110はビデオデータ105を受信する。
ビデオデータ105は複数のフレームを含む。
ビデオデータ105は、任意の種類のストリーミングビデオデータを含むことができることを理解されたい。
たとえば、ビデオデータ105は、リアルタイムビデオデータ又は予め記録されたビデオデータを含むことができる。
リアルタイムビデオデータは固有の遅延を含む場合があるが、ビデオデータは鑑賞者の観点からは概ねリアルタイムであることを理解されたい。
【0014】
一実施形態では、ビデオデータ105をH.263ビデオ符号化標準規格を使用して符号化する。
しかしながら、本発明の実施形態は、H.264/AVCビデオ符号化標準規格及びMPEG−4ビデオ符号化標準規格を含むがこれらに限定されない他のビデオ符号化標準規格を使用して符号化されたビデオデータ105も含むことができることを理解されたい。
【0015】
本発明の実施形態は、局所的対話性を含むビデオデータをストリーミングするために使用される。
たとえば、パーソナライズされた広告挿入、対話型TV、及びビデオ対応遠隔協調ツールのようなアプリケーションでは、主要表現の小さなサブセットのみが対話型入力に従って変更される。
【0016】
フレーム分割器110は、ビデオデータ105の少なくとも1つのフレームを複数の領域に分割するように動作可能である。
一実施形態では、フレームの2つの領域が識別され、ここで、フレームの一方の領域は固定領域として識別され、残りの領域は変更可能な領域である。
非対話型領域から独立した変更可能な領域の変更を容易にするために、フレーム分割器110は、フレームを複数の独立して復号可能な領域に分解する。
【0017】
図3Aは、本発明の一実施形態による、ビデオフレーム300の独立して復号可能な領域を生成するための分割動作例を示している。
即時に明確化する目的で、対話型領域は、ビデオフレームの底部における多数のマクロブロック(MB)行として定義される。
しかしながら、対話型領域は、ビデオフレーム内の任意の形状として定義することができ、MBの粒度レベルに制限されないことを理解されたい。
たとえば、対話型領域は、ピクセルレベルにおいて定義することができる。
さらに、本発明の実施形態は、複数の対話型領域を含むことができることを理解されたい。
【0018】
一実施形態では、フレーム分割器110は、2つの独立して復号可能な領域、すなわち、上部の幾つかのMB行から成る固定領域310と、残りのMB行から成る変更可能な領域320を生成するように構成される。
独立して復号可能な領域とは、固定領域310を変更可能な領域320に依存せずに復号することができ、変更可能な領域320を固定領域310に依存せずに復号することができる関係を指すことを理解されたい。
【0019】
他の実施形態によれば、フレーム分割器110は、一方の領域のみが独立して復号可能である2つの別個の領域を生成するように構成されることを理解されたい。
一実施形態では、固定領域310は変更可能な領域320から独立して復号可能であるが、変更可能な領域320は固定領域310に依存して復号を行い得る。
たとえば、対応するフレームの固定領域310は同じフレームの変更可能な領域320の前に送信されるため、変更可能な領域320は固定領域310に依存して復号を行い得る。
【0020】
一実施形態では、固定領域310及び変更可能な領域320内のMBは、図3Aにおいて矢印で示されるMBの動きベクトル(MV)が、該MBが属する領域外を指さないように符号化される。
図3Aに示すように、たとえば、固定領域310の最下MB行内のMB330a及び330bは、下方向を指すMV340a及び340bを有しないように制限され、一方、変更可能な領域320の最上MB行内のMB330c、330d、及び330eは、上方向を指すMV340c、340d、及び340eを有しないように制限される。
一実施形態では、ブロックグループ(GOB)ヘッダ350(H.263の構文において定義される)を変更可能な領域320内の最初のMB行の開始部に挿入して、変更可能な領域320に対応するビットストリームの識別を容易にすると共に、変更可能な領域320が独立して復号可能であることを確実にする。
【0021】
図3Bは、本発明の一実施形態による、2つの独立して復号可能な領域を有するフレーム例360を示している。
フレーム分割器110は、固定領域310及び変更可能な領域320を生成するように構成される。
図1を参照すると、フレーム分割器110は、固定領域を含むビデオデータの第1の部分112を送信機140に送信し、変更可能な領域を含むビデオデータの第2の部分115を変更モジュール130に送信する。
したがって、変更モジュール130は、固定領域310を復号することなく、変更可能な領域320に対してのみ操作する。
【0022】
図1を参照すると、別の実施形態では、変更可能な領域から固定領域に依存して(しかし逆は同様ではない)、分解可能なビデオが作成される。
本実施形態では、圧縮された固定領域を復号する必要がある。
この手法によって、システム100における計算オーバヘッドが大きくなる。
しかしながら、分解可能なビデオを作成する際のMVに対する制限がより少ないため、これは符号化性能における利得につながり得る。
本実施形態では、1つのみの領域が独立して復号可能であり、固定領域内のMBは固定領域外を指さず、変更可能な領域内のMBは変更可能な領域外を指すことができる。
【0023】
別の実施形態では、変更可能な領域の符号化は、ゼロMVを使用するようにさらに制限され得る。
この手法では、変更可能な部分を変更する際に要求される演算がより少ない。
これは、先行する復号器において動き補償を行うことなく、内部データ又は残余データに対する全てのオーバレイ操作をここで完了させることができるためである。
【0024】
一実施形態では、第2の部分115は、変更モジュール130の前に遅延モジュール120において受信される。
遅延モジュール120は、第2の部分115を所定の時間遅延させ、変更モジュール130における対話型入力132の受信を可能にするように構成される。
遅延モジュール120は通常、変更モジュール130に対する第2の部分115の送信を或る時間量遅延させ、対話型入力132との同期を可能にするように構成されることを理解されたい。
一実施形態では、遅延量は約数ミリ秒である。
【0025】
変更モジュール130は第2の部分115を受信し、対話型入力132に従って該第2の部分を変更するように構成される。
図2は、本発明の一実施形態による、対話型入力132に従って媒体のフレームの一部分を変更するための変更モジュール120のブロック図である。
変更モジュール130は、復号器210と、部分変更器220と、符号化器230とを備える。
復号器210、部分変更器220、及び符号化器230は、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組み合わせとして実装することができることを理解されたい。
さらに、変更モジュール130は、本発明の実施形態の態様を不必要に不明確にしないようにするために図示されない、さらなる構成要素を備えることができることを理解されたい。
【0026】
一実施形態では、変更モジュール130はネットワークノードに配置される。
別の実施形態では、無線セルラネットワーク配置の場合、変更モジュール130は、3GPPリリース6以降の無線コアネットワーク内のIPマルチメディアサブシステム(IMS)の構成要素として実装することができる。
【0027】
本発明の実施形態は、ユーザグループに集合的な対話型経験を提供することを理解されたい。
したがって、ユーザグループは、変更モジュール130にアクセスすることができる。
本実施形態では、グループの各ユーザは、個々の対話型入力132を提供することが可能である場合があり、集合的な対話型入力に従ってビデオデータが変更される。
複数のユーザが、対話型入力132をビデオデータ105に与え、グループの各ユーザが全ての対話型入力を鑑賞するようにすることができる。
たとえば、テレビ番組の各鑑賞者は、対話型入力132をシステム100に送信することによって、該番組にコメントを提供することができる。
【0028】
復号器210は第2の部分115を受信し、該復号器210は該第2の部分115を復号するように構成される。
復号された第2の部分215は、部分変更器220において受信される。
部分変更器220は、復号された第2の部分215を対話型入力132に従って変更するように構成される。
対話型入力132を様々な形式で受信することができることを理解されたい。
一実施形態では、対話型入力132はビデオストリームを含み、該ビデオストリームは復号された第2の部分215の上にオーバレイされる。
一実施形態では、ビデオストリームは部分変更器220において受信される前に復号される。
部分変更器220は、復号された第2の部分225を変更することによって、変更された、復号された第2の部分225を生成するように構成される。
【0029】
対話型入力132を、ビデオストリームの局所的対話性を利用するための、パーソナライズされた広告挿入、対話型テレビ、ビデオ対応遠隔協調ツールのような多数の異なる対話型ストリーミングビデオアプリケーションと関連付けることができることを理解されたい。
たとえば、図1のビデオデータ105を、テレビ番組に関連付けることができる。
テレビ番組の鑑賞者は、ビデオデータ105の変更可能な部分を変更するために、対話型入力132をシステム100に送信することができる。
たとえば、対話型入力132は、テキストコメント、個人アバターのようなグラフィック、及び音声部分を含むことができる。
【0030】
別の実施形態では、対話型入力132は、デュアルトーンマルチ周波数によって制御されるアバターを含み、説明される実施形態の使用を、一般的なビデオストリーミングか可能な携帯電話に拡張する。
別の例では、対話型入力は、パーソナライズされた広告を含むことができる。
【0031】
一実施形態では、部分変更器220は、第2の部分215の上に対話型入力132をオーバレイすることによって、復号された第2の部分215を変更する。
一実施形態では、鑑賞者は、対話型入力132をリアルタイムで送信することによって、変更をビデオデータ105に与えることができる。
部分変更器220は、対応する対話型入力132とオーバレイされた新たなビデオストリームを構築する。
一実施形態では、部分変更器220は、ピクセルドメインにおいて対話型入力132をオーバレイする。
ピクセルドメイン動作は、アバターの位置、速度、サイズ、及び不透明度の変化のような豊富な対話型入力のセットをサポートする。
部分的符号化の使用は、関連付けられる計算の複雑度全体を低減するのに役立つ。
【0032】
本発明の実施形態は、ビデオデータ105の一部分のみの変更を提供する。
たとえば、鑑賞者の主な目的がビデオデータ105を閲覧することである場合、ビデオデータ105の変更可能な領域はフレームの一部分しか占有しない。
フレームの一部分の変更しか必要としない局所的対話性を提供することによって、局所的対話性の影響下にない部分を復号、変更、及び再符号化する必要がない。
様々な実施形態は部分トランスコーディングを提供し、それによって、ビデオストリームの必要な部分のみが処理される。
【0033】
本発明の実施形態は、ビデオデータ105の一部分のみの復号、変更、及び再符号化を実施することを理解されたい。
これによって計算が節約される。
これは、ビデオデータの変更されない部分が、復号、変更、及び再符号化されることなくネットワークを介して送信されるためである。
【0034】
変更された、復号された第2の部分225を、符号化器230において符号化し、変更された第2の部分125を生成する。
【0035】
送信機140は、第1の部分112及び第2の部分125を、ビデオデータ145として示される単一のストリーム内で送信するように構成される。
上述するように、第1の部分112は、復号、変更、及び再符号化の影響下にない。
一実施形態では、対応するフレームの第1の部分112は、送信機140において、該対応するフレームの第2の部分125の前に受信される。
したがって、所与のフレームについて、第1の部分112を、ストリーム内で、第2の部分125の前に送信することができる。
【0036】
所与のフレームについて、第1の部分112を第2の部分125の前に送信することによって、システム100は、ビデオストリームのレイテンシ要件を活用することができる。
換言すれば、本発明の実施形態は、パケットを、同じビデオフレーム内の異なる複数のレイテンシ要件と組み合わせることを提供する。
具体的には、変更されない領域に対応する情報を高レイテンシモードで配信することができる。
これは、ビデオデータ105と対話しない鑑賞者は、過度の起動レイテンシが生じないという制限のみで、かなりの遅延を伴った該ビデオデータを閲覧することができるためである。
逆に、観察者によって発行される対話型入力132に応じて変更されている領域は、対話型コミュニティ経験を提供するために、全ての鑑賞者に低レイテンシモードで迅速に伝達される必要がある。
【0037】
さらに、全てのパケットに厳密な期限に従うことを強制することは、潜在的に非効率である可能性がある。
特に、長いレイテンシは一方向ストリーミングを使用することを可能にし、パケット損失回復のためのオーバヘッドの必要を少なくする(たとえば、損失パケットは常に再送信することができるため、オーバヘッドが実際のネットワーク動作と一致する)。
【0038】
パケット損失を考慮する必要がない場合であっても、統計的多重化を利用することによって利得が可能である。
たとえば、一実施形態では、符号化器を可変ビットレート(VBR)モードにおいて操作するとき、より良好なビデオ品質を達成することができる。
VBR符号化ビデオを送信するために、VBR送信をサポートする(たとえば可変帯域幅を可能にする)か、又は時間にわたってレート需要の平均を取ることによって、レート平均化を可能にすることが必要である。
本発明の実施形態は双方の様式をサポートし、品質を改善させる。
第1に、長いレイテンシによって、ストリームの変更されていない部分が、大容量のバッファリングから利益を受けることが可能になり、それによってVBR符号化データを一定又はほぼ一定の帯域幅を用いて送信することができる。
第2に、ストリームの変更された部分は厳しい期限の下で送信されるが、帯域幅を変動させることによって、より良好な性能を達成することができる。
このため、帯域幅全体は一定とすることができるが、ストリームの低レイテンシ部分は可変レートで送信することができる。
ストリームの高レイテンシ部分は、バッファリングを使用して、(自身のレートにおいて、及び帯域幅において)これらの変動を吸収することができる。
【0039】
システム100を、ビデオデータ105の複数の変更例をサポートするように変更することができることを理解されたい。
一実施形態では、変更モジュールは対話型入力132の異なる複数の例を受信し、該異なる複数の例に基づいて、第2の部分125の複数の例を生成することができる。
本実施形態では、第2の部分125の各例を、異なる複数の宛先に送信するすることができ、一方、各宛先は第1の部分112を受信する。
別の実施形態では、システム100は、それぞれがビデオデータ105の異なる変更に専用である複数の変更モジュール130を備える。
【0040】
図4は、本発明の一実施形態による、ビデオデータを表示するためのシステム400のブロック図である。
システム400は、受信機410と、復号器420と、ディスプレイ430とを備える。
様々な実施形態では、システム400はバッファ440a及び/又はバッファ440bも備える場合がある。
一実施形態では、システム400は、ネットワーク接続(図示せず)を介して通信することが可能な演算装置内に実装される。
たとえば、システム400は、コンピュータ、携帯電話、携帯情報端末、テレビ、セットトップボックス、及びネットワークを介してデータを送受信することが可能な任意の他の演算装置を含むがそれらに限定されない任意のタイプの演算装置とすることができる。
【0041】
受信機410、復号器420、ディスプレイ430、並びにバッファ440a及び440bは、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組み合わせとして実装することができることを理解されたい。
さらに、システム400は、本発明の実施形態の態様を不必要に不明確にしないようにするために図示されない、さらなる構成要素を備えることができることを理解されたい。
【0042】
受信機410は、ビデオデータの複数の部分、たとえば図1の第1の部分112及び第2の部分125を含むビデオデータ145を、単一のストリーム内で受信するように構成される。
本発明の実施形態では、第1の部分112は第2の部分125の前に受信されることを理解されたい。
一実施形態では、第1の部分112は、バッファ440aにおいて、第2の部分125の受信の前にバッファリングされる。
次に、第1の部分112及び第2の部分125は、復号器420において復号される。
第2の部分125が第1の部分112から独立して復号可能でない一実施形態では、復号器420は、第1の部分112を使用して第2の部分125を復号する。
一実施形態では、第1の部分112を第2の部分125から独立して復号することができ、復号された第1の部分422をバッファ440bにおいてバッファリングすることができ、一方、第1の部分112は、第2の部分125が受信及び復号されるまで、バッファ440aにおいてバッファリングされることを理解されたい。
【0043】
一実施形態では、第1の部分112を復号し、復号された第1の部分422を、受信機410において第2の部分125を受信する前に生成し、第2の部分125が復号されるまで、復号された第1の部分422をバッファ440bにおいてバッファリングする。
第2の部分125を復号器420において復号し、復号された第2の部分425を生成する。
対応するフレームの復号された第1の部分422及び復号された第2の部分425は、ディスプレイ430に表示される。
【0044】
図5は、本発明の一実施形態による、ビデオデータをストリーミングするためのプロセス500を示すフローチャートである。
一実施形態では、プロセス500は、コンピュータ可読命令及びコンピュータ実行可能命令の制御下で、プロセッサ及び電気部品によって実行される。
コンピュータ可読命令及びコンピュータ実行可能命令は、たとえば、コンピュータ使用可能揮発性メモリ及びコンピュータ使用可能不揮発性メモリのようなデータストレージ機構内に存在する。
しかしながら、コンピュータ可読命令及びコンピュータ実行可能命令は、任意のタイプのコンピュータ可読媒体内に存在することができる。
一実施形態では、プロセス500は図1のシステム100によって実施される。
【0045】
プロセス500のブロック505において、ビデオデータを受信する。
一実施形態では、ビデオデータを、H.263ビデオ符号化標準規格を使用して符号化する。
【0046】
ブロック510において、ビデオデータの少なくとも1つのフレームを複数の領域に分割する。
一実施形態では、ブロック512に示すように、フレーム内の複数の領域を識別する。
ブロック514において、複数の領域を、該複数の領域のうちの少なくとも1つの領域が独立して復号可能な領域になるように分解する。
一実施形態では、複数の領域のうちの少なくとも2つの領域が独立して復号可能な領域である。
【0047】
ブロック520において、複数の領域の第1の領域に対応するビデオデータをネットワークを介して送信する。
【0048】
一実施形態では、ブロック530に示すように、第2の領域に対応するビデオデータの変更を所定の時間遅延させる。
【0049】
ブロック540において、複数の領域の第2の領域に対応するビデオデータを、対話型入力に従って変更する。
一実施形態では、対話型入力は、フレームの一部分を提示のために変更するように構成される情報を含む。
【0050】
一実施形態では、ブロック542に示すように、対話型入力を受信する。
ブロック544において、第2の領域を復号する。
ブロック546において、第2の領域を対話型入力に従って変更する。
一実施形態では、ピクセルドメインにおいて、対話型入力を第2の領域の上にオーバレイする。
ブロック548において、対話型入力に従って変更された第2の領域を符号化し、第2の領域の変更バージョンを生成する。
【0051】
本発明の実施形態によれば、ブロック540を対話型入力の異なる複数の例について実施することができることを理解されたい。
本実施形態では、複数の領域の第2の領域に対応するビデオデータを、第2の対話型入力に従って変更する。
【0052】
ブロック550において、第2の領域の変更バージョンに対応するビデオデータを、ネットワークを介して送信する。
一実施形態では、ブロック550の第2の領域の変更バージョンに対応するビデオデータの送信を、ブロック520の第1の領域に対応するビデオデータの送信の後に実施する。
一実施形態では、第1の領域に対応するビデオデータを高レイテンシモードを使用して送信し、第2の領域に対応するビデオデータを低レイテンシモードを使用して送信する。
【0053】
第2の領域の変更バーション及び第2の変更バージョンが存在する一実施形態では、第2の領域の第2の変更バージョンに対応するビデオデータをネットワークを介して送信する。
本実施形態では、第2の領域の変更バージョンに対応するビデオデータ、及び第2の領域の第2の変更バージョンに対応するビデオデータを、異なる宛先に送信する。
【0054】
図6は、本発明の一実施形態による、ビデオデータを表示するためのプロセス600を示すフローチャートである。
一実施形態では、プロセス600は、コンピュータ可読命令及びコンピュータ実行可能命令の制御下で、プロセッサ及び電気部品によって実行される。
コンピュータ可読命令及びコンピュータ実行可能命令は、たとえば、コンピュータ使用可能揮発性メモリ及びコンピュータ使用可能不揮発性メモリのようなデータストレージ機構内に存在する。
しかしながら、コンピュータ可読命令及びコンピュータ実行可能命令は、任意のタイプのコンピュータ可読媒体内に存在することができる。
一実施形態では、プロセス600は図4のシステム400によって実施される。
【0055】
プロセス600のブロック610において、フレームの第1の領域に対応するビデオデータの第1の部分を受信する。
ここで、フレームは複数の領域を含み、第1の部分は独立して復号可能である。
ブロック620において、フレームの第2の領域に対応するビデオデータの第2の部分を受信する。
ここで、第2の部分は対話型入力に従って変更されている。
一実施形態では、第2の部分は独立して復号可能である。
ブロック610及びブロック620は、任意の順序で実施することができることを理解されたい。
一実施形態ではブロック610をブロック620の前に実施する。
【0056】
ブロック630において、第1の部分を復号する。
一実施形態では、ブロック612に示すように、第1の部分をブロック630の前にバッファリングする。
一実施形態では、ブロック632に示すように、第1の部分をブロック630の後にバッファリングする。
様々な実施形態によれば、ブロック612及び/又はブロック632のバッファリングは、ブロック620における第2の部分の受信に依拠することを理解されたい。
【0057】
ブロック640において、第2の部分を復号する。
第2の部分が独立して復号可能でない一実施形態では、第2の部分を、第1の部分に少なくとも部分的に基づいて復号する。
ブロック650において、第1の部分及び第2の部分を含むフレームを表示する。
【0058】
本発明の実施形態は、ビットストリーム構文解析を(復号することなく)実施し、圧縮されたビットストリームを少なくとも2つの領域、すなわち、変更されないままであるもの(固定領域)、及び対話型入力による変更の影響下にあるもの(変更可能な領域)に分ける。
復号、変更、及び後続の符号化は、変更可能な領域に対してのみ実施される。
したがって、システム100における計算負荷は、ビットストリーム全体の復号、変更、及び再符号化を必要とするシステムよりも低減される。
分解可能なビデオの使用は通常、圧縮効率に不利益を招くが、固定領域の再符号化を回避することによって、受信側のビデオ品質を高めることができることを理解されたい。
【0059】
本発明の実施形態は、フレームを、異なるレイテンシ要件を使用して送信することができる固定の領域及び変更可能な領域に分解することを提供する。
一実施形態では、本発明は、固定領域に関連付けられるデータの部分を高レイテンシモードを使用して送信すること、及び変更可能な領域に関連付けられるデータの部分を低レイテンシモードを使用して送信することを提供する。
高レイテンシモードは低レイテンシモードよりも低い処理要件及びタイミング要件を有するため、ビデオデータの送信コストは、全ビデオデータを低レイテンシモードを使用して送信するよりも低減される。
【0060】
このように、本発明の様々な実施形態、ビデオデータをストリーミングするための方法説明した。
本発明を、特定の実施形態において説明してきたが、本発明はそのような実施形態によって限定されるものと見なされるべきではなく、以下の特許請求の範囲に従うものと見なされるべきであることを理解されたい。
【符号の説明】
【0061】
100・・・システム,
110・・・フレーム分割器,
120・・・遅延モジュール,
130・・・変更モジュール,
140・・・送信機,
210・・・復号器,
220・・・部分変更器,
230・・・符号化器,
300・・・ビデオフレーム,
310・・・固定領域,
320・・・変更可能領域,
330・・・マクロブロック(MB),
340・・・動きベクトル(MV),
350・・・ヘッダ,
400・・・システム,
410・・・受信機,
420・・・復号器,
430・・・ディスプレイ,
440・・・バッファ

【特許請求の範囲】
【請求項1】
ビデオデータをストリーミングするための方法であって、
前記ビデオデータを受信することと、
前記ビデオデータの少なくとも1つのフレームを複数の領域に分割することと、
前記複数の領域の第1の領域に対応する前記ビデオデータを、ネットワークを介して送信することと、
前記複数の領域の第2の領域に対応する前記ビデオデータを、対話型入力に従って変更することと、
前記第2の領域の変更バージョンに対応する前記ビデオデータを、前記ネットワークを介して送信することと
を含む方法。
【請求項2】
前記第2の領域の前記変更バージョンに対応する前記ビデオデータを前記送信することは、前記第1の領域に対応する前記ビデオデータを前記送信することの後に実施される 請求項1に記載の方法。
【請求項3】
前記第2の領域に対応する前記ビデオデータを前記変更することの前に、前記方法は、
所定の時間、前記第2の領域に対応する前記ビデオデータを前記変更することを遅延させることを含む
請求項2に記載の方法。
【請求項4】
前記ビデオデータの少なくとも1つのフレームを前記複数の領域に前記分割することは、
前記フレーム内の前記複数の領域を識別することと、
前記複数の領域を、前記複数の領域のうちの少なくとも1つの領域が独立して復号可能な領域になるように分解することと
を含む請求項1に記載の方法。
【請求項5】
前記複数の領域の前記第2の領域に対応する前記ビデオデータを前記対話型入力に従って前記変更することは、
前記対話型入力を受信することと、
前記第2の領域を復号することと、
前記第2の領域を、前記対話型入力に従って変更することと、
前記対話型入力に従って変更された前記第2の領域を符号化することであって、前記第2の領域の前記変更バージョンを生成する、符号化することと
を含む請求項1に記載の方法。
【請求項6】
前記ビデオデータはH.263ビデオ符号化標準規格を使用して符号化される
請求項1に記載の方法。
【請求項7】
前記複数の領域の前記第2の領域に対応する前記ビデオデータを、第2の対話型入力に従って変更することと、
前記第2の領域の第2の変更バージョンに対応する前記ビデオデータを、前記ネットワークを介して送信することと、
をさらに含み、
前記第2の領域の前記変更バージョンに対応する前記ビデオデータ、および、前記第2の領域の前記第2の変更バージョンに対応する前記ビデオデータは、異なる宛先に送信される
請求項1に記載の方法。
【請求項8】
前記対話型入力は、前記フレームの一部分を提示のために変更するように構成される情報を含む
請求項1に記載の方法。
【請求項9】
前記第1の領域に対応する前記ビデオデータは、高レイテンシモードを使用して送信され、
前記第2の領域に対応する前記ビデオデータは、低レイテンシモードを使用して送信される
請求項1に記載の方法。
【請求項10】
ビデオデータを復号するための方法であって、
フレームの第1の領域に対応するビデオデータの第1の部分を受信することであって、前記フレームは複数の領域を含み、前記第1の部分は独立して復号可能である、受信することと、
前記フレームの第2の領域に対応するビデオデータの第2の部分を受信することであって、前記第2の部分は対話型入力に従って変更されている、受信することと、
前記第1の部分を復号することと、
前記第2の部分を復号することと、
前記第1の部分および前記第2の部分を含む前記フレームを表示することと
を含む方法。
【請求項11】
前記第1の部分は前記第2の部分の前に受信される
請求項10に記載の方法。
【請求項12】
前記第1の部分を、前記第2の部分の前記受信することの前にバッファリングすることをさらに含む
請求項10に記載の方法。
【請求項13】
前記第1の部分を前記復号することの後、前記第2の部分を前記復号することの前に、前記第1の部分をバッファリングすることをさらに含む
請求項10に記載の方法。
【請求項14】
前記第2の部分は独立して復号可能である
請求項10に記載の方法。
【請求項15】
1つ又は複数のプロセッサによって実行されると、ビデオデータをストリーミングするための方法を実施する命令を記憶するための1つまたは複数の演算装置可読媒体であって、前記方法は、
前記ビデオデータを受信することと、
前記ビデオデータの少なくとも1つのフレームを複数の領域に分割することと、
前記複数の領域の第1の領域に対応する前記ビデオデータの第1の部分を、ネットワークを介して送信することと、
前記複数の領域の第2の領域に対応する前記ビデオデータの第2の部分を、対話型入力に従って変更することと、
前記第2の部分の変更バージョンを、前記ネットワークを介して送信することと
を含む1つまたは複数の演算装置可読媒体。
【請求項16】
前記第2の部分の前記変更バージョンを前記送信することは、前記第1の部分を前記送信することの後に実施される
請求項15に記載の1つまたは複数の演算装置可読媒体。
【請求項17】
前記第2の部分を前記変更することの前に、前記方法は、
所定の時間、前記第2の部分を前記変更することを遅延させることを含む
請求項16に記載の1つ又は複数の演算装置可読媒体。
【請求項18】
前記ビデオデータの少なくとも1つのフレームを前記複数の領域に前記分割することは、
前記フレーム内の前記複数の領域を識別することと、
前記複数の領域を、前記複数の領域のうちの少なくとも1つの領域が独立して復号可能な領域になるように分解することと
を含む請求項15に記載の1つ又は複数の演算装置可読媒体。
【請求項19】
前記複数の領域の前記第2の領域に対応する前記ビデオデータの前記第2の部分を、前記対話型入力に従って前記変更することは、
前記対話型入力を受信することと、
前記第2の部分を復号することと、
前記第2の部分を、前記対話型入力に従って変更することと、
前記対話型入力に従って変更された前記第2の部分を符号化することであって、前記第2の部分の前記変更バージョンを生成する、符号化することと
を含む請求項15に記載の1つまたは複数の演算装置可読媒体。
【請求項20】
前記方法は、
前記複数の領域の前記第2の領域に対応する前記ビデオデータの前記第2の部分を、第2の対話型入力に従って変更することと、
前記第2の部分の第2の変更バージョンを、前記ネットワークを介して送信することと
を含み、
前記第2の部分の前記変更バージョンに対応する前記ビデオデータ、および、前記第2の部分の前記第2の変更バージョンに対応する前記ビデオデータは、異なる宛先に送信される
請求項15に記載の1つまたは複数の演算装置可読媒体。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2011−511554(P2011−511554A)
【公表日】平成23年4月7日(2011.4.7)
【国際特許分類】
【出願番号】特願2010−544942(P2010−544942)
【出願日】平成20年1月30日(2008.1.30)
【国際出願番号】PCT/US2008/052463
【国際公開番号】WO2009/096959
【国際公開日】平成21年8月6日(2009.8.6)
【出願人】(503003854)ヒューレット−パッカード デベロップメント カンパニー エル.ピー. (1,145)
【Fターム(参考)】