説明

複数のフレームから成るマルチビューストリーミングビデオデータを管理するシステム及び方法

【課題】複数のフレームから成るマルチビューストリーミングビデオデータを管理するシステム及び方法を提供する。
【解決手段】複数のフレームから成るマルチビューストリーミングビデオデータを管理するシステムは、複数のビューに対応する複数のフレームのうちの少なくとも1つのフレームの多重表現を、該多重表現ごとに異なる参照フレームを使用して符号化するように構成されるエンコーダを備える。本システムは、複数のフレーム及び多重表現を含む符号化木を作成するように構成されるコントローラも備える。本システムは、符号化木を記憶するように構成されるデータ記憶装置をさらに備える。コントローラは、データ記憶装置の記憶制約を特定すると共に、符号化木から多重表現のうちの少なくとも1つを省略して、データ記憶装置内に記憶される複数のフレームが記憶制約内に留まるようにするようにさらに構成される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施の形態は、複数のフレームから成るマルチビューストリーミングビデオデータを管理するシステム及び方法に関する。
【背景技術】
【0002】
ビデオは通常、イントラ符号化フレーム(Iフレーム)及びインターフレーム又は予測フレーム(Pフレーム)を使用して圧縮される。
Iフレームは、他のフレームからの予測無しで符号化されるため参照フレームを必要としないフレームである。
Pフレームは、参照フレームからの予測を使用するフレームである。
Iフレームはまたイントラマクロブロックのみを含み、一方、Pフレームはイントラマクロブロック又は予測マクロブロックのいずれかを含む。
Pフレームは、復号化されるために何らかの他の参照フレームを先行して復号化することを必要とし、多くの場合に、符号化のためにIフレームよりも少ないビットを必要とする。
【0003】
1つのシーンの複数のビュー(マルチビュー)が、同時に取り込まれ、Iフレーム及び/又はPフレームを使用して符号化され、そしてユーザに送られるビデオアプリケーションがますます開発されるようになってきている。
これらのタイプのビデオアプリケーションでは、ユーザは、複数のビューをリアルタイムで切り替えることができ、したがって、従来のビデオアプリケーションを用いる場合よりも高いレベルの対話性を与えられる。
マルチビュービデオ符号化(MVC)ツールのためのアプリケーションの中には、ユーザが再生のために、これらのビュー、又は潜在的には、実際に取り込まれたビデオデータから生成される仮想ビューのサブセットのみを選択することが可能なアプリケーションもある。
【0004】
サーバにおいて符号化されてクライアントに通信されるIフレーム(I(i,j))に基づく従来の符号化木100の概略図を図1に示す。
ここで、iは時間インデックスであり、jはビューである。
この図内に示されているように、符号化木100はIフレームのみに基づいて符号化され、したがってIフレームのうちの幾つかは、差分符号化のための参照フレームを必要とすることなく、他のIフレームと比較して異なるビューを生成することができる。
しかしながら、図1に示されている符号化木100は大きな送信コストを必要とする。
これは、Iフレームは通常、上述したようにPフレームよりも数倍大きいためである。
【0005】
MVCにおける最近の活動のうちの多くは画像取り込み及び圧縮に重点を置いてきた。
たとえば、MVC標準化過程は、レート歪みが最適であるように、マルチビューシーケンスにおける全てのフレームを符号化するための新たな圧縮アルゴリズムの開発に集中してきた。
したがって、ストリーミングビデオのより効率的なマルチビュー制御をクライアントに提供することはあまり考慮されてこなかった。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】MERKLE, P.他, 「Efficient Prediction Structures for Multiview Coding」, IEEE Transactions on Circuits and Systems for Video Technology, 2007年11月
【非特許文献2】FLIERL, M. 他, 「Motion and Disparity Compensated Coding for Multiview Video」, IEEE Transactions on Circuits and Systems for Video Technology, 2007年11月
【非特許文献3】「Second life: Official site of the 3D online virtual world」, , downloaded 2008年10月6日
【非特許文献4】「Warsow-A Fast Paced First Person Shooter Game」, , downloaded 2008年10月6日
【非特許文献5】「Half-Life TV」, downloaded 2008年10月6日
【非特許文献6】「Serious Games Initiative」, downloaded 2008年10月6日
【非特許文献7】CHEUNG, G. 他,「Graphics-to-video encoding for 3G mobile game viewer multicast using depth values」, IEEE international Conf. on Image Processing, 2004年10月, Abstract
【非特許文献8】CHEUNG, G. 他,「ECHO: A Community Video Streaming System with Interactive Visual Overlays」, 2008年1月
【非特許文献9】CHEUNG, G. 他,「Fast H.264 Mode Selection Using Depth Information for Distributed Game Viewing」, 2008年1月
【非特許文献10】SCHULZRINE, H.他, Real Time Streaming Protocol (RTSP)」, 1998年4月
【非特許文献11】CHEUNG, N. 他,「Distributed Source Coding Application to Low-Delay Free Viewpoint Switching in Multiview Compression」,2007年11月
【非特許文献12】KARCZEWICZ, M.他,「The SP-and SI-frames design for H.264/AVC」, IEEE Transactions on Circuits and Systems for Technology, 2003年7月
【非特許文献13】「The TML Project Web-Page and Archive」, downloaded 2008年10月6日
【非特許文献14】「Test Squares at MERL」, ftp://ftp.merl.com/pub/avetro/mvc-testseq, downloaded 2008年10月6日
【発明の概要】
【0007】
本発明は、複数のフレームから成るマルチビューストリーミングビデオデータを管理するシステム及び方法を提供する。
【0008】
当業者には、本発明の特徴は図面を参照する以下の説明から明らかとなるであろう。
【図面の簡単な説明】
【0009】
【図1】Iフレームに基づく従来の符号化木の概略図である。
【図2】本発明の一実施形態による、マルチビューストリームデータコンテンツがサーバからクライアントにおいて消費されることを可能にするシステムの単純なブロック図を示す。
【図3】本発明の一実施形態による、複数のフレームから成る対話的マルチビューストリーミングビデオデータを可能にするための符号化木であって、該複数のフレームは根Iフレーム及び複数のPフレームに基づいて該複数のフレームの多重表現として符号化されている、符号化木を示す。
【図4】本発明の一実施形態による、幾つかのフレームが省略又は除去されており、それによって符号化フレームの記憶空間要件が低減される符号化木を示す。
【図5】本発明の一実施形態による、幾つかのフレームが省略又は除去されており、それによって符号化フレームの記憶空間要件が低減される符号化木を示す。
【図6】本発明の一実施形態による、複数のフレームから成るマルチビューストリーミングビデオデータを管理する方法のフロー図を示す。
【図7】本発明の一実施形態による、複数のフレームから成るマルチビューストリーミングビデオデータを管理する方法のフロー図を示す。
【図8】本発明の一実施形態による、図6及び図7において示される方法を実装又は実行するように構成される計算装置のブロック図を示す。
【発明を実施するための形態】
【0010】
単純にする目的及び例示する目的のために、本発明を、主に本発明の例示的な一実施形態を参照して説明する。
以下の説明では、本発明の完全な理解を提供するために多数の具体的な詳細を述べる。
しかしながら、当業者には、本発明をこれらの具体的な詳細に限定することなく実践することができることが明らかであろう。
他の例においては、既知の方法及び構造は、不必要に本発明を不明瞭にしないように詳細に説明していない。
【0011】
本明細書には、複数のフレームから成るビデオデータを管理するシステム及び方法が開示される。
本明細書に開示されるシステム及び方法は、符号化フレームの記憶コストと送信コストとの間の最適なトレードオフを可能にする符号化構造を作成するように構成される。
或る点においては、トレードオフは、特定のフレームを1回よりも多く選択的に符号化し、それによって、符号化構造が、異なる参照フレームを使用して生成される、これらの選択されたフレームの多重表現を含むことによって為される場合がある。
全てのフレームではなく、フレームのうちの選択されたフレームを選択的に符号化することによって、本発明の符号化構造は、フレームの多重表現の全てが符号化されている符号化木と比較してはるかに少ない空間を必要とする。
【0012】
符号化構造を使用して、マルチビュービデオストリーミングデータがクライアントに通信されることを可能にし、クライアントのユーザが対話的にサーバからフレームを受け取ることを可能にすることができる。
例として、符号化木を使用して、フレームの最も効率的な通信を提供する、複数のフレームを経由するルートを特定して、クライアントが所望のフレームを再構築することを可能にすることができる。
【0013】
図2を参照すると、一実施例による、マルチビューストリーミングデータコンテンツがサーバ202からクライアント220において消費されることを可能にするシステム200の単純なブロック図が示されている。
或る点においては、以下において本明細書に開示される方法は、本明細書において以下でより詳細に論じるように、システム200において実施することができる。
システム200は追加の構成要素を含むことができること、並びに、本明細書において説明される該構成要素のうちの幾つかは、システム200の範囲から逸脱することなく除去及び/又は変更することができることを理解されたい。
【0014】
図2に示すように、システム200は、ネットワーク230を介してクライアント220と通信するサーバ202を備える。
単一のサーバ202、単一のクライアント220、及び単一のネットワーク230が図2に示されているが、システム200は、任意の数のサーバ202、クライアント220、及びネットワーク230を備えることができる。
ネットワーク230は、イントラネットのようなローカルエリアネットワーク、又はインターネットのようなワイドエリアネットワークを含むことができる。
【0015】
いかなる点においても、サーバ202は概して、符号化コンテンツをクライアント220に提供するように構成されるウェブベースコンテンツプロバイダのようなコンテンツプロバイダを含む。
符号化コンテンツはストリーミングビデオの符号化フレームを含む。
一実施例によれば、サーバ202は、ストリーミングビデオにおける共通のシーンの複数のビューを選択すること及び見ることを可能にする。
ユーザはしたがって、互いに対して異なるロケーションに位置決めされた複数のカメラによって取り込まれたコンテンツ、コンピュータ生成データから導出された仮想の複数のビュー等のような、複数のビューから取り込まれるか又は見られる同じシナリオを対話的に見るようにクライアント220を実装することができる。
したがって、サーバ202は映画、説明ビデオ、コンピュータゲーム等における同じシーンの複数のビューを示す複数のフレームをクライアント220に提供することができる。
したがって、たとえば、ユーザは、複数のビューからの特定のシーンを見ることを対話的に制御するようにクライアント220を実装することができる。
【0016】
サーバ202はエンコーダ204を備える。
該エンコーダは、サーバ202における全ての予め符号化されているビデオデータの記憶コスト制約下で、フレームデータを符号化して、ビデオの対話的ストリーミングに関連付けられる送信コストを実質的に最小化するように構成される。
エンコーダ202が動作して、ビデオを符号化し、これらの目的を達成する様々な方法を本明細書において以下でより詳細に説明する。
エンコーダ204は概して、本明細書において後述する機能を実施するように構成されるソフトウェア及び/又はハードウェアを含む。
【0017】
サーバ202はまた、送受信機206、コントローラ208、及びデータ記憶装置210を備える。
送受信機206は概して、1つ又は複数のクライアント220との通信を可能にするように構成されるソフトウェア及び/又はハードウェアを含む。
送受信機206はしたがって、選択されたビデオがクライアント(複数可)220に通信され、命令がクライアント(複数可)220から受信されることを可能にする。
コントローラ208は概して、エンコーダ204、送受信機206、及びデータ記憶装置210を含むサーバ構成要素の動作を制御するように構成されるプロセッサ、ASIC、マイクロコントローラ等を含む。
【0018】
データ記憶装置210は、EEPROM又はCDROM等のような半導体素子、磁気ディスクメモリ装置、不揮発性メモリ装置のような、情報の記憶が可能な任意の装置又は情報の記憶が可能な装置の任意の組み合わせを含む。
データ記憶装置210はまた、固定式の又は着脱可能なデータ記憶装置を含むことができる。
符号化ビデオの記憶に加えて、データ記憶装置210はまた、コントローラ208が、たとえばエンコーダ204及び送受信機206における様々な動作の実施時に実行することができる1つ又は複数のプログラム命令を記憶することができる。
データ記憶装置210をサーバ202とは別個の構成要素を形成するものとして示したが、データ記憶装置210は、本明細書において論じられるシステム200の範囲から逸脱することなく、サーバ202と一体化することができる。
【0019】
クライアント220は、送受信機222、デコーダ224、及びインタフェース226を備える。
図示されていないが、クライアント220は、コントローラ、データ記憶装置、及び他の構成要素のような複数の追加の構成要素を備えることができる。
例として、クライアント220は、インターネットを介してサーバ202にネットワーク接続される計算装置を備えることができる。
別の例として、クライアント220は、ケーブル又は衛星接続を介してサーバ202からコンテンツを受信するように構成されるテレビジョン受信機を備えることができる。
【0020】
いかなる点においても、送受信機222は、1つ又は複数のサーバ202との通信を可能にするように構成されるソフトウェア及び/又はハードウェアを含む。
送受信機222はしたがって、ユーザが対話的にサーバ(複数可)202と通信すること、たとえば、サーバ(複数可)202から現在受信しているコンテンツのビューを変えるための命令を通信することを可能にする。
デコーダ224は、サーバ(複数可)202から受信される符号化ビデオを復号化するように構成されるソフトウェア及び/又はハードウェアを含む。
【0021】
インタフェース226は、クライアント220とユーザとの間の対話を可能にするように構成されるソフトウェア及び/又はハードウェアを含む。
インタフェース226は、入力228を通じてユーザからの命令を受信するように構成される。
該インタフェースは、キーボード、マウス、タッチパッド、遠隔制御装置、マイクロフォン等のようなユーザインタフェースを含むことができる。
インタフェース226はまた、コンピュータモニタ、テレビモニタ等のような出力230上での復号化ビデオの表示を可能にするように構成される。
【0022】
動作時に、ユーザは、サーバ202との対話的マルチビューストリーミングセッションを開始する前に、ビデオストリーミングデータを受信するようにクライアント220を実装することができる。
この動作において、クライアント220は、時刻i及びビューjに対応するフレーム(Fi,j)を受信済みであることができる。
このフレーム(Fi,j)の受信に続いて、クライアント220は、時刻i+1及びビューkにおけるフレーム(Fi+1,k)の受信をリアルタイムで要求することができる。
ここで、ビューkはビューjに等しい場合もあるし、等しくない場合もある。
応答において、サーバ202は、デコーダ224がフレーム(Fi+1,k)を復号化することができるように、データ記憶装置210内に準備及び記憶されている符号化データの適切なセットをクライアント220に送信する。
符号化データの適切なセットの送信は、1つ又は複数の参照フレーム(Pフレーム又はIフレーム)の送信を含み、デコーダ224が適切にフレーム(Fi+1,k)を復号化することを可能にすることができる。
【0023】
一実施例によれば、エンコーダ204は、マルチビュービデオのフレーム(F)の送信に関連付けられるコストを大幅に削減するようにマルチビュービデオのフレーム(F)を符号化するように構成される。
サーバ202が動作してこの目的を達成する1つの方法を図3を参照して説明する。
別の実施例によれば、エンコーダ204は、符号化フレームを送信することに関連付けられるコストと、フレームの予測シーケンスと共に符号化フレームを記憶することに関連付けられるコストとの間のトレードオフを実質的に最適化するように、マルチビュービデオのフレーム(F)を符号化するように構成される。
サーバ202が動作してこの目的を達成する1つの方法を図4を参照して説明する。
サーバ202が動作してこの目的を達成する別の方法を図5を参照して説明する。
以下の図面の全てにおいて、各時間インデックスにおける各ビューの少なくとも1つのフレームを符号化し、デコーダが適切にフレームの全てを復号化するのを可能にするためにエンコーダ204が必要とされることを理解されたい。
【0024】
まず図3を参照すると、符号化木300の概略図が示されている。
該符号化木は基本Iフレーム302及び複数のPフレームを含む。
図示されているように、Pフレームは、差分符号化のための参照フレームとして先行するPフレーム又はIフレーム302に依拠する。
加えて、符号化木300は、フレームのうちの幾つかの多重表現を含む。
ここで、多重表現のそれぞれは、差分符号化のための異なる参照フレームに依拠する。
図3に示されている符号化木300によれば、クライアントは、複数のビューから選択を行うことができ、事前に準備された一連の適切なPフレームを選択されたビューに従って受信することができる。
或る点においては、Pフレームの通信に関連付けられる送信コストは、図1を参照して上述したIフレームの送信に関連付けられる送信コストよりも比較的小さい。
図3に示されている符号化木300を記憶することの1つの欠点は、Iフレーム及びPフレームの記憶に関連付けられるコストが、全てのあり得るビュー走査(traversal)の予測フレームシーケンスの準備及び記憶に起因して、Iフレームの記憶と比較して指数関数的に増大することである。
記憶要件は、本明細書において後述する符号化木400及び500の使用を通じて低減される。
【0025】
まず図4を参照すると、一実施例による、幾つかのフレームが省略又は除去されており、それによって符号化フレームの記憶空間要件が低減される符号化木400が示されている。
図4に示されている符号化木400は、あり得る符号化木の例示的な実施例に過ぎず、したがって、いかなる点においても本発明を限定するものと解釈されるべきではないことを理解されたい。
【0026】
符号化木400は、フレームの適切な復号化を可能にするために必要なそれぞれのシーケンスに従って配置される複数のフレームを含む符号化木の一実施例を示している。
符号化木400は、異なる参照フレームを使用して符号化されたフレームの多重表現を含む。
図4内に示されているように、フレームの幾つかの多重表現が破線で示されており、エンコーダ204がこれらのフレームを符号化していないこと及び/又はこれらのフレームがデータ記憶装置210に記憶されていないことを示している。
したがって、データ記憶装置210内にフレーム及び予測フレームシーケンスを記憶するのに必要とされる空間の量は、図3に示されている符号化木300によって必要とされる空間と比較して大幅に低減される。
図3では、要求が特定のフレームに関して受信されると、複数の経路のうちのいずれかを辿って、クライアントに適切なフレームシーケンスを提供し、クライアントがその特定のフレームを復号化することを可能にすることができる。
加えて、図3における符号化木300に示されている選択される経路のそれぞれは、同じ送信コストを必要とする。
【0027】
しかしながら、図4を参照すると、送信コストは経路に依存している。
すなわち、経路のうちの幾つかは、いずれのフレームが既にクライアント220に送信されているかによって、より大きな送信コストを必要とする。
この点をさらに示すために、クライアント220が現在P(2,1)を見ており、フレームP(1,1)及びI(0,0)を受信済みであると仮定する。
加えて、クライアント220がフレームP(3,2)を要求済みであると仮定する。
図示されているように、フレームP(2,1)及びP(1,1)からの経路を辿ると、フレームP(3,2)は符号化及び記憶されていない。
この状況において、コントローラ208は、フレームP(3,2)の適切な復号化を可能にするために、符号化木400の全体にわたって代替のルートを捜し求める。
【0028】
コントローラ208が選択し得るルートのうちの1つは、再ルーティングA402であり、別のルートは再ルーティングB404である。
再ルーティングA402では、コントローラ208は、フレームP(1,1)及びI(0,0)が既にクライアント220に送信されているため、フレームP(2,2)及びP(3,2)を送信する必要がある。
再ルーティングB404では、コントローラ208は、フレームI(0,0)が既にクライアント220に送信されたため、フレームP(1,2)、P(2,1)、及びP(3,2)を送信する必要がある。
フレームP(2,1)はフレームP(2,1)とは異なることに留意されたい。
これは、これらのフレームがそれぞれ、異なる参照フレームP(1,1)及びP(1,2)を使用して作成されたためである。
加えて、コントローラ208は、実質的に最小の送信コストを要求する再ルーティング経路を選択するように構成される。
この例では、再ルーティング経路404は、再ルーティング経路402よりも多くの送信コストを要求する。
これは、経路404がさらなるフレーム(P(2,1))の送信を要求するためである。
【0029】
したがって、フレームのうちの少なくとも幾つかが除去又は省略されており且つ本明細書に開示されるような最小送信コストを必要とする経路の選択が行われる符号化木400は、データ記憶装置210の記憶コスト制約内に留まりながら、クライアントがストリーミングビデオと対話する、たとえばマルチビューストリーミングビデオ内のビューを変更することができる1つの方法である。
【0030】
ここで図5を参照すると、一実施例による、幾つかのフレームが省略又は除去されており、それによって符号化フレームの記憶空間要件が低減され、且つPフレームがIフレームに置き換えられている符号化木500が示されている。
図5に示されている符号化木500は、あり得る符号化木の例示的な実施例に過ぎず、したがって、いかなる点においても本発明を限定するものと解釈されるべきではないことを理解されたい。
【0031】
図5に図示されているように、破線によって示されているように且つ図4と比較すると、符号化木500からフレームP(2,2)の多重表現が省略又は除去されている。
加えて、IフレームI(2,2)が、それらの以前の位置において符号化木500内に置かれている。
IフレームI(2,2)は、単一のPフレームP(2,2)よりも大きな記憶コスト及び送信コストを必要とし得るが、IフレームI(2,2)の使用は結果的に、単一のPフレームP(2,2)からの派生Pフレーム及び単一のPフレームP(2,2)自体の数の減少に起因して、記憶コストを低減することができる。
加えて、符号化木500を通る再ルーティングも、IフレームI(2,2)が独立フレームを含むため、より小さい送信コストを必要とし得る。
【0032】
この点をさらに示すために、クライアント220が現在P(2,1)を見ており、フレームP(1,1)及びI(0,0)を受信済みであると仮定する。
加えて、クライアント220がフレームP(3,2)を要求済みであると仮定する。
図示されているように、フレームP(2,1)及びP(1,1)からの経路を辿ると、フレームP(3,2)は符号化及び記憶されていない。
この状況において、コントローラ208は、フレームP(3,2)の適切な符号化を可能にするために、符号化木500の全体にわたって代替のルートを探索する。
【0033】
コントローラ208が選択し得るルートのうちの1つは、再ルーティングA502であり、別のルートは再ルーティングB504である。
再ルーティングA502では、コントローラ208は、フレームI(2,2)がイントラ符号化フレームであり、したがって参照フレームを必要としないため、フレームI(2,2)及びP(3,2)を送信する必要がある。
再ルーティングB504では、コントローラ208は、フレームI(0,0)が既にクライアント220に送信されたため、フレームP(1,2)、P(2,1)、及びP(3,2)を送信する必要がある。
この例では、したがって、2つの根ノード、フレームI(0,0)及びフレームI(2,2)が存在する。
コントローラ208は、再ルーティング経路502及び504のそれぞれに関連付けられる送信コストを求めると共に、最小送信コストを必要とする再ルーティング経路を選択するように構成される。
この例では、再ルーティングA502は、必ずしも最小送信コストを必要としなくてもよい。
これは、IフレームI(2,2)が複数のPフレームの代わりに通信されるためである。
【0034】
これより、システム200を使用して複数のフレームから成るビデオデータを管理することができる方法の例を、それぞれ図6及び図7に示されている方法600及び700の以下のフロー図を参照して説明する。
方法600及び700の範囲から逸脱することなく他のステップを追加することができるか又は既存のステップを除去、変更、若しくは再構成することができることが当業者には明らかであるはずである。
【0035】
方法600及び700を図2に示されているシステム200を参照して説明する。
したがって、該システムに挙げられている要素をこの説明において参照する。
しかしながら、方法600及び700は、システム200に記載されている要素に限定されないことを理解されたい。
そうではなく、方法600及び700は、システム200に記載されている構成とは異なる構成を有するシステムによって実践することができることを理解されたい。
【0036】
方法600及び700に記載されている動作のうちの幾つか又は全ては、任意の所望のコンピュータアクセス可能媒体内に、ユーティリティ、プログラム、又はサブプログラムとして含むことができる。
加えて、方法600及び700は、アクティブ及び非アクティブの双方の様々な形態で存在することができるコンピュータプログラムによって具現化することができる。
たとえば、これらの方法は、ソースコード、オブジェクトコード、実行可能コード、又は他のフォーマットのプログラム命令から成るソフトウェアプログラム(複数可)として存在することができる。
上記のうちのいずれも、コンピュータ可読媒体上で具現化することができる。
【0037】
例示的なコンピュータ可読記憶装置は、従来のコンピュータシステムRAM、ROM、EPROM、EEPROM、及び磁気又は光ディスク又はテープを含む。
上記のものの具体的な例は、CD ROM上での又はインターネットダウンロードを介するプログラムの配布を含む。
したがって、上記で説明した機能を実行することができる任意の電子装置が上記で列挙した機能を実施することができることを理解されたい。
【0038】
図6を参照すると、一実施例による、複数のフレームから成るマルチビューストリーミングビデオデータを管理する方法600のフロー図が示されている。
上述したように、ビデオデータは、ビデオデータの符号化フレームを送信することに関連付けられるコストと、フレームの予測シーケンスと共に符号化フレームを記憶することに関連付けられるコストとの間のトレードオフを最適化するように管理することができる。
或る点においては、フレームは、共通のシーンの複数のビューのような、クライアント220によって受信されるコンテンツに対する比較的効率的な対話的制御を可能にするように符号化される。
【0039】
ステップ602において、複数のフレームから成るマルチビューストリーミングビデオデータを、たとえば、データ記憶装置210、又は、複数のロケーションに位置決めされると共に共通のシーンを取り込むように構成される複数のビデオカメラのような他のソースから取得する。
ステップ604において、コントローラ208は、データ記憶装置210の記憶制約を特定する。
データ記憶装置210の記憶制約は、データ記憶装置210の最大記憶容量のような物理的記憶制約を含む場合がある。
付加的に又は代替的に、記憶制約は、データ記憶装置210内での符号化フレームの記憶に関して設定される、課せられる制限を含む場合がある。
【0040】
ステップ606において、エンコーダ204は、複数のフレームのうちの少なくとも1つのフレームの多重表現を、該多重表現ごとに異なる参照フレームを使用して符号化する。
ここで、多重表現は共通の時間インデックス及び共通のビューに対応する。
加えて、ステップ608において、コントローラ208は、データ記憶装置210の記憶制約を考慮して、たとえば図4及び図5に図示されているような、複数のフレーム及び多重表現を含む符号化木を作成する。
より詳細には、コントローラ208は、符号化木が記憶要件よりも少ない空間を必要とするように多重表現のうちの少なくとも1つが符号化木から省略されている符号化木を作成する。
【0041】
一実施例によれば、多重表現のうちのいずれを符号化木から省略するかの決定において、コントローラ208は、クライアント220が時刻(i)及びビュー(j)を有するフレームを見た後に時刻(i+1)及びビュー(k)を有する特定のフレームを要求する確率を記述する対話モデルを実装するように構成される。
対話モデルは、たとえば他の参照フレームの受信に続いていずれのフレームが選択されたかに関する履歴情報に基づいてこの確率を求めることができる。
加えて、コントローラ208は、データ記憶装置の記憶制約内に留まるために、まず、要求される可能性が最も少ないフレームが符号化木から省略されるように、対話モデルに基づいて符号化木内の複数のフレームを配置するように構成される。
【0042】
ステップ608において符号化木を作成する際、コントローラ208は、少なくとも1つのフレームの多重表現をクライアント220に通信することに関連付けられる送信コストを計算するようにさらに構成することができる。
加えて、コントローラ208は、記憶コストを削減するために、存在する場合にはいずれのPフレームをIフレームで置き換えるかを決定すると共に、データ記憶装置210の記憶制約内に留まりながら、計算される送信コストを実質的に最小化する送信Pフレーム及びIフレームの組み合わせを決定するように構成することができる。
【0043】
ステップ610において、コントローラ208はデータ記憶装置210内に符号化木を記憶する。
【0044】
コントローラ208を、特定のフレームを省略するように符号化木を作成するものとして説明したが、コントローラ208は、データ記憶装置210の記憶制約内に留まるために、多重表現(複数可)を、それらが符号化木内に含まれた後に除去することができることを理解されたい。
【0045】
方法600の実施を通じて、コントローラ208は、図4及び図5に示されている符号化木と同様の符号化木を生成するように構成される。
したがって、コントローラ208は、少なくとも1つのフレームの多重表現のうちの少なくとも1つが各時間インデックスにおける各ビューに対応する符号化木を作成するように構成される。
コントローラ208によって作成される符号化木はまた、符号化木を通る2つ以上のルートが利用可能となることを可能にし、それによって、クライアント220が、符号化木から選択されたフレームを受信すると共に適切に復号化することを可能にすることができる。
符号化木を通るルートを選択して送信コストを実質的に最小化することができる方法の一例を図7を参照して説明する。
【0046】
より詳細には図7は、一実施例による、方法600に対する促進のための、複数のフレームから成るビデオデータを管理する方法700のフロー図を示している。
より詳細には図7は、送信コストを実質的に最小化するように、方法600を通じて生成された符号化木を実装するステップを示している。
実際には方法700は、上述したフレーム及び経路の再ルーティングと同様である。
【0047】
ステップ702において、コントローラ208は第1のフレームをクライアント220に通信する。
ステップ704において、コントローラ208は、第2のフレームを求める要求をクライアント220から受信する。
ステップ706において、コントローラ208は、第2のフレームがクライアント220において適切に復号化されるために、少なくとも1つのフレームの多重表現のうちの1つが必要とされると判断する。
ステップ708において、コントローラ208は、多重表現のそれぞれを通信することに関連付けられる送信コストを求める。
加えて、ステップ710において、コントローラ208は、最低送信コストに関連付けられる少なくとも1つのフレームの多重表現のうちの1つをクライアント220に送信する。
【0048】
これより、コントローラ208が符号化木を作成することができる方法の一例を説明する。
大まかに述べると、エンコーダ204は、マルチビュービデオの個別のフレームを符号化すると共に、データ記憶装置210内に個別の符号化フレームを記憶するように構成される。
所与のフレーム取り込み時刻における取り込まれたビューの数は定数Kである。
換言すると、シーンのK個の異なるビューが同時に周期的に取り込まれる。
上述したように、所与のフレームの異なるビューは、複数のカメラによって、又は、フレームバッファからの複数のフレームから、たとえば仮想世界表現から取り込むことができる。
【0049】
冗長符号化構造400を再び参照して、IフレームI(0,0)によって示される、時間インデックス0の第1のフレーム取り込みインスタンスは単一のビュー[K/2]のものであり、合計でN個のフレーム取り込みインスタンスが存在すると仮定する。
符号化構造400は、該符号化構造が同じフレームの多重表現を含み、多重表現のそれぞれが異なる参照フレームを有するため、冗長とみなされる。
【0050】
図4は異なる2つのビュー(K=2)と、4つのフレーム取り込みインスタンス(N=4)を示している。
加えて、根がI(0,0)にある1つの基本依存木が存在する。
冗長符号化構造400は、フレームのほとんどが、それぞれが異なる参照フレームを使用してIフレーム及び/又はPフレーム(複数可)として多重表現に符号化されることを示している。
したがって、クライアント220が時間インデックスi及びビューjのフレームFi,jの特定の表現を見た後に次の時間インデックスi+1のビューkを要求する場合、コントローラ208は、利用可能であればIフレームIi+1,k、利用可能であればFi,jを使用して動き補償されたPフレームPi+1,k、又は異なる参照フレームF≠Fi,jを使用して動き補償された代替のPフレームPi+1,kのうちのいずれかを選択する。
この最後の代替フレームでは、Fを含む参照フレーム(複数可)も、Pi+1,kの正確な復号化のためにクライアント220に送信しなければならない。
【0051】
時間インデックスi及びビューjの元のフレーム
【0052】
【数1】

【0053】
は、多数の表現Fi,jに、また、IフレームIi,jとして又は複数の異なる参照Fを使用して動き補償されたPフレームPi,j(F)として少なくとも1つの表現に符号化することができる。
単純にするために、PフレームPi,j(F)を、時間インデックスi−1、及びmax(1,j−1)とmin(K,j+1)との間のビューの符号化フレームFを参照として使用して動き補償されるものとしてのみ仮定する。
【0054】
特定の表現の符号化フレームの全ては、異なる根フレームのS個の基本依存木から成る集合
【0055】
【数2】

【0056】
に編成することができる。
固有の根Iフレーム
【0057】
【数4】

【0058】
を有する木
【0059】
【数3】

【0060】
は以下のように再帰的に定義される。
【0061】
【数5】

式(1)
【0062】
式(1)は、フレームFを根とする木T(F)が、フレームFと、フレームFから分岐する(部分)木とから成るフレーム集合であることを示す。
基本依存木は、Iフレームとして符号化される根フレームを有する木である。
木集合τを使用して、フレームFの依存経路p(F)を、Fが属する基本依存木において根IフレームからフレームFまで進む全てのフレームの順序集合とする。
より詳細には、依存経路
【0063】
【数6】

【0064】
はIフレームである。
【0065】
実際的な目的のために、各元フレーム
【0066】
【数7】

【0067】
をM個を超える表現に符号化することはできないと仮定する。
したがって、基本依存木の集合内の最大ノード数はMNKによって制限される。
そうでない場合、基本依存木の集合は、元フレームNKの関数として指数関数的に大きいノード数を有し得る。実際的な目的のために、各元フレーム
【0068】
【数8】

【0069】
をM個を超える表現に符号化することはできないと仮定する。
したがって、基本依存木の集合内の最大ノード数はMNKによって制限される。
そうでない場合、基本依存木の集合は、元フレームNKの関数として指数関数的に大きいノード数を有し得る。
【0070】
マルチビュービデオの表現のための実現可能な空間
【0071】
【数9】

【0072】
は、各元フレーム
【0073】
【数10】

【0074】
が、Iフレームとして又は
【0075】
【数11】

【0076】
の場合に符号化フレームFi−1,Kを使用してPフレームとして、M回を超えないように、しかし少なくとも1回符号化されるように、式(1)に記載されているように、基本依存木の集合τとして定義することができる。
それぞれの選択された木集合
【0077】
【数12】

【0078】
は記憶コスト及び送信コストの双方を暗示する。
【0079】
これより、データ記憶装置210内に記憶される符号化木400の記憶コストを計算することができる方法の一例を論じる。
Iフレームに関して、|Ii,j|は、Iフレームとして元のフレーム
【0080】
【数13】

【0081】
を符号化することのバイト数を表すものとする。
|Ii,j|=∞は、
【0082】
【数14】

【0083】
がIフレームとして符号化されなかった場合を表す。
同様に、Pフレームに関して、|Pi,j(F)|は、フレームFを動き補償のために使用して
【0084】
【数15】

【0085】
をPフレームとして符号化するのに必要とされるバイト数を表す。
|Pi,j(F)|=∞は、
【0086】
【数16】

【0087】
が、Fを動き補償のために使用してPフレームとして符号化されなかった場合を表す。
表現τの記憶コストB(τ)は以下のように記述することができる。
【0088】
【数17】

式(2)
【0089】
換言すると、Fを根とする符号化木τ(F)を符号化する記憶コストは、根フレームのサイズ|F|にFから分岐する木を加算したものである。
【0090】
これより、フレーム間送信コストを計算することができる方法の一例を論じる。
ユーザが、依存経路p=p(Fi,j)を有する符号化フレームFi,jを見た後、ビューkの時刻i+1におけるフレームを見ることを選択すると仮定する。
コントローラ208は、以下のように、Fi,j及びkに基づいてクライアント220に送信するフレーム
【0091】
【数18】

【0092】
の符号化表現を決定論的に判断する。
まず、符号化IフレームIi+1,k又はPフレームPi+1,k(Fi,j)のいずれかが利用可能である場合、コントローラ208は、復号化及び表示のためにクライアント220にそれらのうちのいずれかを送信することができる。
【0093】
これらのフレームのうちのいずれもが利用可能でない場合、コントローラ208は、代替のPフレームPi+1,k(F'),F'≠Fi,j、たとえばその参照フレームがクライアント220において利用可能でないPフレームを、代替の経路q=p(F')を用いて求める。
ここで、i)経路p及びqは重なり合わない経路であるか、又はii)経路p及びqは重なり合い、経路qのフレーム
【0094】
【数19】

【0095】
後に初めて分かれる。
ここで、「重なり合わない」とは、動き補償されたFi,j及びFが共通の復号化履歴を共有しないことを意味するように意図されている。
そして「重なり合う」とは、Fi,j及びFが
【0096】
【数20】

【0097】
まで復号化履歴を共有することを意味するように意図されている。
この第1の場合では、コントローラ208は、時間インデックスi+1及びビューkを有するフレームの正確な復号化のために、依存経路
【0098】
【数21】

【0099】
における全てのフレームとPフレームPi+1,k(F')自体とを送信する必要があり、この場合、デコーダ224は復号化PフレームPi+1,k(F')のみを表示する。
第2の場合では、コントローラ208は、経路qの部分経路
【0100】
【数22】

【0101】
とPフレームPi+1,k(F')とを送信する必要がある。
したがって、これらの2つの場合のそれぞれに関して、pからqへ依存経路を再ルーティングする総送信コストr(p,q)は以下のようになる。
【0102】
【数23】

式(3)
【0103】
異なる複数の参照F'及び代替の経路p(F')に関して複数の代替のPフレームPi+1,k(F')が存在し得る。
したがって、コントローラ208は、以下のように、依存経路p(Fi,j)及び所望のビューkを所与として、最低送信コストφ(p,k)を有する経路を求める必要がある。
【0104】
【数24】

式(4)
【0105】
したがって、ユーザが符号化フレームFi,j,Φ(Fi,j,k)の観察後にビューkを選択することに関する送信コストは、場合によっては利用可能なIフレーム、Pフレーム、及び代替のPフレーム(複数可)の最小送信コストである。
【0106】
【数25】

式(5)
【0107】
これより、記憶コスト及び送信コストの最適化を求めることができる方法の一例を説明する。
C(τ)は、木集合τを所与とした、Nフレーム対話的マルチビューストリーミングの予想送信コストを表すものとする。
元のフレーム
【0108】
【数26】

【0109】
の符号化表現の観察後、ユーザが、確率αi,j(k)で次の時間インデックスi+1において次のビューkを見ると仮定する。
ここで、Σαi,j(k)=1である。
式(5)からのフレーム間送信コストの導出を使用して、予想送信コストC(τ)を以下のように記述することができる。
【0110】
【数27】

式(6)
【0111】
式(6)は、再帰的に効率的に計算することができる。
第1に、c(Fi,j)は最大で3項の総和である。
第2に、Φ(Fi,j,k)におけるφ(p(Fi,j),k)は、試験用に最大でM個の参照F'(Fi+1,kの最大M個の表現)を有する。
参照F'ごとに、再ルーティングコストr(p(Fi,j),p(F'))は最大でN回の加算を有する。
最初に計算されたc(Fi,j)は、後のc(Fi,j)に対する再帰呼び出しが単に計算された値を返すことができるように、テーブルに記憶される。
式(6)の計算量はしたがって、木集合τ内の最大ノード数のM×N倍であり、すなわちO(MK)である。
【0112】
記憶コストの計算は、元のフレームの全ての可能な符号化表現のPフレームの正確な符号化コストを求める代わりに、Ii,j=ri,jであること、且つ、元のフレーム
【0113】
【数28】

【0114】
の任意の符号化表現Fi−1,kに関してPi,j(Fi−1,k)=ri,j(k)であることを仮定することによって単純化することができる。
ここで、IMVSとして表される対話的マルチビューストリーミング最適化を以下のように形式化することができる。
K個のビューから成るマルチビュービデオのN個のフレームの場合の推移確率αi,j(k)及び符号化レートri,j及び
【0115】
【数29】

【0116】
を所与として、記憶制約
【0117】
【数31】

【0118】
下で予想送信コストC(τ)を最小化する実現可能空間
【0119】
【数30】

【0120】
において最適な木集合τを求める。
これは以下のように数学的に記述することができる。
【0121】
【数32】

式(7)
【0122】
これより、近似アルゴリズムを使用してIMVSを最適化することができる方法の一例を論じる。
初期解τとして、各ビューの各フレームが1回だけ符号化される、全てのビューの全てのフレームのための最小記憶空間を必要とする最小記憶解を求める。
Iフレーム|Ii,j|のサイズがその対応するPフレームのサイズ|Pi,j(Fi−1,k)|よりも大きいと仮定すると、最小記憶解τは全てのPフレームが後続するIフレームである。
最小記憶解τは以下のように数学的に求めることができる。
【0123】
【数33】

式(8)
【0124】
式(8)において、節(clause)cが真である場合U(c)=1であり、そうでない場合は0である。
加えて、式(8)は基本的に、元のフレーム
【0125】
【数34】

【0126】
ごとに最小PフレームPi,j(Fi−1,k)を求める。
【0127】
次のステップは、τから局所最適解を求めることである。
これは、一連の拡大(augmentation)を定義すると共に、選択されたコスト関数においてより大きな低減を提供する拡大をこれらのうちから選択することによって反復的に行うことができる。
適切な拡大の例は、PフレームPi,j(Fi−1,k)をIフレームIi,jに変更すること、異なる参照フレームF'をPフレームPi,j(Fi−1,k)のために選択すること、新たなIフレームIi,jを追加すること、及び新たなPフレームPi,j(Fi−1,k)を追加することを含む。
最初の2つの拡大は所与のフレームの表現の数を増加させず、一方、次の2つの拡大のそれぞれは表現の数を1だけ増加させる。
したがって、最後の2つの拡大は、そのフレームの表現の数がMより小さい場合に実施することができる。
結果的に得られる解は常に、各ビューの各フレームの少なくとも1つの表現を有する。
【0128】
新たなIフレームIi,jを加えて既存のPフレーム(複数可)を「補償する」場合、既存のPフレーム(複数可)のいずれの子が親を新たに加えられたIフレームに切り替えるべきかが判断される。
これは貪欲に行われ得る。
すなわち、切り替えによって送信コストが低下する場合、既存のPフレームの子が切り替えられる。
同様に、新たなPフレームを追加する場合の最適な親及び子ノード選択も貪欲に実施される。
【0129】
上述した拡大を所与として、2つの呼び出し関数を有する2つのアルゴリズムを提案する。
第1の提案はラグランジュコストである。
【0130】
【数35】

式(9)
【0131】
式(9)において、λ≧0はラグランジュ乗数である。
各反復において、ラグランジュコストにおいて最大低減を提供する拡大を選択する。
加えて、本アルゴリズムは、λを所与としてさらなるコスト低減が可能でないときに停止する。
さらに、記憶コストと送信コストとの間のトレードオフは、複数の異なるλの使用を通じて変化することができる。
【0132】
代替的に、各反復において、現在解τにおける全てのフレームFi,jの拡大は、送信コストの低減ΔC(τ)と、記憶コストの増加ΔB(τ)との比が最大であるように選択することができる。
このアルゴリズムは、次のこのような有益な拡大が記憶制約
【0133】
【数36】

【0134】
を超える場合に停止することができる。
【0135】
図8は、一実施例による、図6及び図7に示されている方法600及び700を実装又は実行するように構成される計算装置800のブロック図を示している。
この点において、計算装置800は、図1に示されているサーバ202に関して上記で説明した機能のうちの1つ又は複数を実行するためのプラットフォームとして使用することができる。
【0136】
計算装置800は、方法600及び700において説明されたステップのうちの幾つかまたは全てを実装又は実行することができるプロセッサ802を備える。
プロセッサ802からのコマンド及びデータは通信バス804を介して通信される。
計算装置800はまた、ランダムアクセスメモリ(RAM)のようなメインメモリ806を備える。
該メインメモリにおいて、プロセッサ802に対するプログラムコードが実行時間中に実行されることができる。
また該計算装置は2次メモリ808を備える。
2次メモリ808は、たとえば、フロッピー(登録商標)ディスクドライブ、磁気テープドライブ、コンパクトディスクドライブ等を表す1つ又は複数のハードディスクドライブ810及び/又は着脱可能記憶ドライブ812を含み、これらにおいて、方法600及び700のプログラムコードのコピーを記憶することができる。
【0137】
着脱可能記憶ドライブ812は、既知の方法で着脱可能記憶ユニット814との間で読み書きを行う。
ユーザ入力及び出力装置は、キーボード816、マウス818、及びディスプレイ820を含むことができる。
ディスプレイアダプタ822は、通信バス804及びディスプレイ820とインタフェースすることができ、プロセッサ802から表示データを受信して、該表示データをディスプレイ820に対する表示コマンドに変換することができる。
加えて、プロセッサ(複数可)802は、ネットワークアダプタ824を通じてネットワーク、たとえばインターネット、LAN等を介して通信することができる。
【0138】
当業者には、計算装置800において他の既知の電子部品を追加するか又は代わりに用いることができることが明らかであろう。
図8に示されている部品のうちの1つ又は複数は任意選択とすることができる(たとえば、ユーザ入力装置、2次メモリ等)ことも明らかであるはずである。
【0139】
本明細書において説明及び例示してきたものは、本発明の好ましい一実施形態、及びその変形形態のうちの幾つかである。
本明細書において使用される用語、説明、及び図面は、例示のためにのみ記載され、限定を意味するものではない。
当業者は、別途指示されない限り全ての用語がその最も広い適切な意味を有するように意図されている以下の特許請求の範囲及びその均等物によって規定されるように意図されている本発明の範囲内で多数の変形形態が可能であることを認識するであろう。
【符号の説明】
【0140】
100・・・符号化木,
200・・・システム,
202・・・サーバ,
204・・・エンコーダ,
206,222・・・送受信機,
208・・・コントローラ,
210・・・データ記憶装置,
220・・・クライアント,
224・・・デコーダ,
226・・・インタフェース,
228・・・入力,
300・・・符号化木,
302・・・基本Iフレーム,
400・・・符号化木,
402・・・再ルーティングA,
404・・・再ルーティングB,
500・・・符号化木,
502・・・再ルーティングA,
504・・・再ルーティングB,
800・・・計算装置,
802・・・プロセッサ,
804・・・通信バス,
806・・・メインメモリ,
808・・・2次メモリ,
810・・・ハードディスクドライブ,
812・・・着脱可能記憶装置,
814・・・着脱可能記憶ユニット,
816・・・キーボード,
818・・・マウス,
820・・・ディスプレイ,
822・・・ディスプレイアダプタ,
824・・・ネットワークアダプタ,

【特許請求の範囲】
【請求項1】
複数のフレームから成るマルチビューストリーミングビデオデータを管理するシステムであって、
複数のビューに対応する前記複数のフレームのうちの少なくとも1つのフレームの多重表現を、前記多重表現ごとに異なる参照フレームを使用して符号化するように構成されるエンコーダであって、前記少なくとも1つのフレームの前記多重表現は共通時刻及び共通ビューに対応する、エンコーダと、
前記複数のフレーム及び前記多重表現を含む符号化木を作成するように構成されるコントローラであって、前記符号化木は、前記フレームのうちのいずれが他のフレームのための参照フレームを含むかを特定するフレーム経路を前記複数の符号化フレームごとに示し、前記コントローラは、前記多重表現のうちの少なくとも1つを、各時刻における各ビューに対応する、Pフレーム及びIフレームのうちの一方として維持するようにさらに構成される、コントローラと、
前記符号化木を記憶するように構成されるデータ記憶装置であって、前記コントローラは、前記データ記憶装置の記憶制約を特定すると共に、前記多重表現のうちの少なくとも1つを前記符号化木から省略して、前記データ記憶装置内に記憶される前記複数のフレームが前記記憶制約内に留まるようにするようにさらに構成される、データ記憶装置と
を備えるシステム。
【請求項2】
前記コントローラは、クライアントが時刻(i)及びビュー(j)を有するフレームを見た後に時刻(i+1)及びビュー(k)を有する特定のフレームを要求する確率を記述する対話モデルを実装すると共に、要求される可能性が最も少ないフレームを前記符号化木からまず省略して前記データ記憶装置の前記記憶制約内に留まるように、前記対話モデルに基づいて前記複数のフレームを配置するようにさらに構成される
請求項1に記載のシステム。
【請求項3】
前記コントローラは、前記多重表現をクライアントに通信することに関連付けられる送信コストを計算するようにさらに構成され、
前記複数のフレームの前記多重表現はPフレームを含み、
前記コントローラは、前記少なくとも1つフレームの前記多重表現の前記PフレームをIフレームで置き換えると共に、前記Iフレームを前記符号化木内の前記少なくとも1つのフレームのノードとして記憶し、それによって、前記データ記憶装置の前記記憶制約内に留まりながら、前記計算された送信コストを最小化するようにさらに構成される
請求項1に記載のシステム。
【請求項4】
前記コントローラは、第1のフレームをクライアントに通信し、前記クライアントから第2のフレームを求める要求を受信し、前記第2のフレームが前記クライアントにおいて適切に復号化されるために前記少なくとも1つのフレームの前記多重表現のうちの1つの表現が必要とされると判断し、前記クライアントにおける前記第2のフレームの適切な復号化のために、前記符号化木を通る複数の経路に沿って、前記少なくとも1つのフレームの前記多重表現のそれぞれを通信することに関連付けられる送信コストを求め、最低送信コストに関連付けられる前記少なくとも1つのフレームの前記多重表現のうちの前記1つの表現を前記クライアントに通信するようにさらに構成される
請求項1に記載のシステム。
【請求項5】
複数のフレームから成るマルチビューストリーミングビデオデータを管理する方法であって、
前記マルチビューストリーミングビデオを記憶するように構成されるデータ記憶装置の記憶制約を特定することと、
複数のビューに対応する前記複数のフレームのうちの少なくとも1つのフレームの多重表現を、前記多重表現ごとに異なる参照フレームを使用して符号化することであって、前記多重表現は共通時刻及び共通ビューに対応する、符号化することと、
前記多重表現のうちの少なくとも1つを省略することによって、前記データ記憶装置の前記記憶制約を考慮して、前記複数のフレーム及び前記多重表現を含む符号化木を作成することであって、前記符号化木は、前記多重表現のうちの少なくとも1つを、各時刻における各ビューに対応する、Pフレーム及びIフレームのうちの一方として維持する、作成することと、
前記符号化木を前記データ記憶装置内に記憶することと
を含む方法。
【請求項6】
前記方法は、クライアントが時刻(i)及びビュー(j)を有するフレームを見た後に時刻(i+1)及びビュー(k)を有する特定のフレームを要求する確率を記述する対話モデルを実装することをさらに含み、
前記符号化木を作成することは、要求される可能性が最も少ないフレームを前記符号化木からまず省略して前記データ記憶装置の前記記憶制約内に留まるように、前記対話モデルに基づいて前記複数のフレームを配置することをさらに含む
請求項5に記載の方法。
【請求項7】
前記複数のフレームの前記多重表現はPフレームを含み、前記方法は、
前記多重表現をクライアントに通信することに関連付けられる送信コストを計算することと、
前記少なくとも1つのフレームの前記多重表現の前記PフレームをIフレームで置き換えることと、
前記Iフレームを前記符号化木内の前記少なくとも1つのフレームのノードとして記憶することであって、それによって、前記データ記憶装置の前記記憶制約内に留まりながら、前記計算された送信コストを最小化する、記憶することと
をさらに含む請求項5に方法。
【請求項8】
第1のフレームをクライアントに通信することと、
前記クライアントから第2のフレームを求める要求を受信することと、
前記第2のフレームが前記クライアントにおいて適切に復号化されるために前記少なくとも1つのフレームの前記多重表現のうちの1つの表現が必要とされると判断することと、
前記クライアントにおける前記第2のフレームの適切な復号化のために、前記符号化木を通る複数の経路に沿って前記多重表現のそれぞれを通信することに関連付けられる送信コストを求めることと、
最低送信コストに関連付けられる前記多重表現のうちの前記1つの表現を前記クライアントに通信することと
をさらに含む請求項5に記載の方法。
【請求項9】
1つ又は複数のプログラムが組み込まれているコンピュータ可読記憶媒体であって、前記1つ又は複数のコンピュータプログラムは、複数のフレームから成るマルチビューストリーミングビデオデータを管理する方法を実装し、前記1つ又は複数のコンピュータプログラムは、
前記マルチビューストリーミングビデオを記憶するように構成される前記データ記憶装置の記憶制約を特定することと、
複数のビューに対応する前記複数のフレームのうちの少なくとも1つのフレームの多重表現を、前記複数のバージョンごとに異なる参照フレームを使用して符号化することであって、前記多重表現は共通時刻及び共通ビューに対応する、符号化することと、
前記多重表現のうちの少なくとも1つを省略することによって、前記データ記憶装置の前記記憶制約を考慮して、前記複数のフレーム及び前記多重表現を含む符号化木を作成することであって、前記符号化木は、前記多重表現のうちの少なくとも1つを、各時刻における各ビューに対応する、Pフレーム及びIフレームのうちの一方として維持する、作成することと、
前記符号化木を前記データ記憶装置内に記憶することと
のためのコンピュータ可読コードを含むコンピュータ可読記憶媒体。
【請求項10】
前記1つ又は複数のコンピュータプログラムは、
クライアントが時刻(i)及びビュー(j)を有するフレームを見た後に時刻(i+1)及びビュー(k)を有する特定のフレームを要求する確率を記述する対話モデルを実装することのためのコンピュータ可読コードをさらに含み、
前記符号化木を作成することは、要求される可能性が最も少ないフレームを前記符号化木からまず省略して前記データ記憶装置の前記記憶制約内に留まるように、前記対話モデルに基づいて前記複数のフレームを配置することをさらに含む
請求項9に記載のコンピュータ可読記憶媒体。
【請求項11】
前記1つ又は複数のコンピュータプログラムは、
前記多重表現をクライアントに通信することに関連付けられる送信コストを計算することと、
前記少なくとも1つのフレームの前記多重表現の前記PフレームをIフレームで置き換えることと、
前記Iフレームを前記符号化木内の前記少なくとも1つのフレームのノードとして記憶することであって、それによって、前記データ記憶装置の前記記憶制約内に留まりながら、前記計算された送信コストを最小化する、記憶することと
のためのコンピュータ可読コードをさらに含む請求項9に記載のコンピュータ可読記憶媒体。
【請求項12】
前記1つ又は複数のコンピュータプログラムは、
第1のフレームをクライアントに通信することと、
前記クライアントから第2のフレームを求める要求を受信することと、
前記第2のフレームが前記クライアントにおいて適切に復号化されるために前記少なくとも1つのフレームの前記多重表現のうちの1つの表現が必要とされると判断することと、
前記クライアントにおける前記第2のフレームの適切な復号化のために、前記符号化木を通る複数の経路に沿って、前記多重表現のそれぞれを通信することに関連付けられる送信コストを求めることと、
最低送信コストに関連付けられる前記多重表現のうちの前記1つの表現を前記クライアントに通信することと
のためのコンピュータ可読コードをさらに含む請求項9に記載のコンピュータ可読記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2010−93807(P2010−93807A)
【公開日】平成22年4月22日(2010.4.22)
【国際特許分類】
【外国語出願】
【出願番号】特願2009−230666(P2009−230666)
【出願日】平成21年10月2日(2009.10.2)
【出願人】(503003854)ヒューレット−パッカード デベロップメント カンパニー エル.ピー. (1,145)
【Fターム(参考)】