説明

デジタルビデオストリーム内の情報及び/又はアプリケーションデータを転送する方法、及び、ビデオストリームを生成及び再生するための関連装置

本発明は、デジタルビデオコンテンツ作成、配布及び表示を行うシステムに関する。デジタルビデオストリーム内にデータを転送する方法であって、デジタルビデオストリームは、表示されない情報及び/又はアプリケーションデータを含み、少なくとも1つのフレームは表示される画像を含み、少なくとも1つのフレームは、画像の画素数よりも多い数の画素数を有する。方法では、上記フレームの画像に占有されていない画素に、情報及びアプリケーションデータを入力する。方法はまた、フレーム内に情報及び/又はアプリケーションデータを搬送するビデオストリームを再生する方法に関する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、概して、デジタルビデオコンテンツの生成及び表示に関する。
【0002】
より詳細には、本発明は、デジタルビデオコンテンツ内の情報及びアプリケーションデータを転送するためのビデオ符号化及び復号化技術の使用、及び、このようなコンテンツを生成及び再生するのに使用される装置に関する。本発明は、好ましくは、デジタル立体視ビデオストリームの符号化及び復号化に適用可能であり、また、当該立体視ビデオストリームの生成及び再生に使用されるデバイスに実装される。
【背景技術】
【0003】
周知のように、デジタル形式のビデオコンテンツを配布するには、ブロードキャストの前に又は当該コンテンツを大容量メモリに格納する前に、ビットレートを低くするべく、符号化(圧縮)技術の適用を必要とする。
【0004】
コンテンツを再生するには、ユーザは、通常、エンコーダによって実行されるオペレーションの逆を行う展開(decompression)技術が適用される好適なデコーディング(復号化)装置が使用される。
【0005】
ビデオコンテンツは、異なるフォーマットを有する場合がある。例えば、アーカイブ型のコンテンツは、従来の4:3形式の特徴を有するのに対して、最近のコンテンツでは、16:9形式の場合がある。映画作品からのコンテンツは、様々なフォーマットを有する。コンテンツは、異なるスクリーン形式を有する表示装置で再生される。その結果、特定の転送ネットワーク又は大容量メモリ上のコンテンツの配布は、視聴者の好みに依存するが、表示適用化及び最適化技術の適用が伴う。
【0006】
例えば、4:3のコンテンツは、視聴者が変形されていない画像を観察することを望む場合には、2つの縦の黒色の帯を挿入することにより、16:9の表示装置で表示させることができる。
【0007】
このような適応化及び最適化技術を適切に適用可能な表示装置に対して、受信される画像のフォーマットについての情報が提供される必要がある。
【0008】
これは、2次元(2D)コンテンツの世界のみで必要なのではなく、立体視(3D)コンテンツでは、なお更必要となる。
【0009】
例えば、立体視ビデオストリームは、ビデオを観察するユーザの右目及び左目をそれぞれ対象として好適に配置される右画像及び左画像を含む複合画像を含んでもよい。"横並び"のフォーマットでは、右画像及び左画像の2つが水平方向にサブサンプリングされて、複合画像の左半部及び右半分をそれぞれ占めるように配置される。"縦並び"のフォーマットでは、右画像及び左画像が縦方向にサブサンプリングされて、複合画像の上半分及び下半分にそれぞれ配置される。
【0010】
一方で、表示装置の中には、立体視画像を表示するのに様々に異なる技術を採用する場合がある。表示装置が、使用されている技術に応じて正しくビデオを表示することを可能にするためには、表示するビデオストリーム内の複合画像のフォーマットを信号で通知することが適切であると考えられる。実際に、右画像及び左画像を再構築することを可能とするために、デコーダは、これら画像が複合画像内でどのように配置されているかを知る必要があり、この情報がなければ、画像を再構築することができず、3Dコンテンツを正しく表示することができない。
【0011】
現在では、情報及び/又はアプリケーションデータをビデオストリームに入力するための様々な方法が存在する。
【0012】
例えば、アナログテレビでは、この種のデータは、垂直帰線区間に入力されている。デジタルテレビでは、この垂直帰線区間は存在しないため、データは、ビデオ部分とは別のビデオストリームの好適なセクションで転送される。例えば、MPEG2転送ストリームでは、2D画像のフォーマットについての情報を含む好適な信号通知テーブルが知られている。
【0013】
符号化されたデジタルビデオストリーム内の信号通知データを転送するのに、ヘッダを使用することが知られている。
【0014】
この情報及び/又はアプリケーションデータは、エンコーダとデコーダとの間の配信網の該当部分にのみ存在し、その部分のみで使用可能である。低い周波数(スローモーション表示)であっても、映像品質を損なうことなく処理を行う又は再生させることを可能にするために、画像生成(プロダクション)レベルでは、実際にはビデオコンテンツは圧縮されていない(又は、低い圧縮率で圧縮されている)。
【発明の概要】
【発明が解決しようとする課題】
【0015】
本発明の課題は、デジタルビデオコンテンツ内の情報及び/又はアプリケーションデータを転送する代替の方法及び代替のシステムを提供することである。より詳細には、本発明は、2Dコンテンツと3Dコンテンツの区別なく適用可能なデータ転送方法を提供することを目的とする。
【0016】
本発明の別の課題は、デジタルビデオコンテンツを生成中であっても、データを利用可能とする情報及びアプリケーションデータの転送を行うための方法及びシステムを提供することである。
【課題を解決するための手段】
【0017】
本発明のこれら及びその他の目的は、本明細書の一部を構成する添付の特許請求の範囲に記載された特徴を組み込んだ、ビデオストリーム内の情報及び/又はアプリケーションデータを転送する方法及びシステム(並びに、このような方法を実装する装置)により達成される。
【0018】
詳細には、本発明の基本となる1つの着想は、デジタル立体視ビデオストリームの特徴についての情報、例えば、ビデオストリームのフォーマットのようなデータを、ビデオストリームを構成するフレームの一部領域に入力することである。詳細には、情報及び/又はアプリケーションデータが、有効な視覚情報、すなわち表示される画像に属する情報を含まないフレーム行(ライン)に入力される。このようにして、情報及び/又はアプリケーションデータが、(フレームに含まれる)画像と共に移動するので、送信システムの変更によりビデオに関連付けられているメタデータが失われるのを防ぐことができる。
【0019】
情報及び/又はアプリケーションデータが、表示される画像の画素と混合されないので、当該情報及び/又はアプリケーションデータは、不可視であり、視聴者の画像の観察を妨げない。
【0020】
より詳細には、情報及び/又はアプリケーションデータは、フレームの最初の行(ライン)又は最後の行に入力されるので、視覚情報(例えば、複合画像)は、不可視情報(情報及び/又はアプリケーションデータ)から容易に分離可能である。情報及び/又はアプリケーションデータを、最初の8つのラインに入れるか、又は、最後の8つのラインに入れるかの選択は、高画質コンテンツのH.264圧縮(2D又は3Dの何れか)の場合に特に好適である。H.264符号化については、ITU−Tドキュメント"H.264 Advanced video coding for generic audiovisual services(一般的な視聴覚サービスのためのH.264アドバンストビデオコーディング)"に記載されている。
【0021】
H.264符号化フォーマットによれば、ビデオストリームを構成する各画像は、いわゆる16×16画素の大きさの"マクロブロック"へと分割される。マクロブロックはそれぞれ、16×16画素輝度行列を含み、当該輝度行列と同じ領域をカバーする8×8画素行列は、2つのクロミナンス信号(低い解像度を有する)に使用される。その結果、1920×1080画素の画像が、下部に8つの行を加えた1920×1088画素の行列によって表される、すなわち、各画像は、マクロブロックの整数値に分割される必要があり、1080は16で割りきれないことから、8つの行が付加される。本発明では、実際の画像で占有されていないこの8つの行を使用して、情報及び/又はアプリケーションデータを送信する。
【0022】
本発明の更なる目的及び利点が、以下に記す実施形態を含む詳細な説明から明らかとなるであろう。なお、実施形態は、例示のために提供されており、本発明を限定することを意図していない。
【0023】
幾つかの好ましい及び有効な実施形態が、添付の図面を参照して、非制限的な例として、以下に記載される。
【0024】
図面は、本発明の様々な側面及び実施形態を示しており、適切であると考えられる場合には、同様な構造、構成要素、材料及び/又は要素には、複数の図面間において、同様な参照番号が付与されている。
【図面の簡単な説明】
【0025】
【図1】図1は、ビデオコンテンツの生成から実現までの様々な段階を示したフローチャートである。
【図2】本発明の第1実施形態に係る、立体視ビデオストリームを生成及び配信するためのシステムを示した図である。
【図3a】本発明に係る立体視ビデオストリームを再生するシステムの一例が示されている。
【図3b】本発明に係る立体視ビデオストリームを再生するシステムの一例が示されている。
【図4】本発明の第2実施形態に係る、立体視ビデオストリームを生成及び配信するシステムを示した図である。
【図5】本発明の第3実施形態に係る、立体視ビデオストリームを生成及び配信するシステムを示した図である。
【図6】本発明の第4実施形態に係る、立体視ビデオストリームを生成及び配信するシステムを示した図である。
【図7】本発明の第5実施形態に係る、立体視ビデオストリームを生成及び配信するシステムを示した図である。
【図8】本発明の第6実施形態に係る、立体視ビデオストリームを生成及び配信するシステムを示した図である。
【図9】本発明の第7実施形態に係る、立体視ビデオストリームを生成及び配信するシステムを示した図である。
【発明を実施するための形態】
【0026】
図1には、デジタルビデオコンテンツの生成から実現までのプロセスが概略的に示されている。第1段階100では、コンテンツが生成及び処理される。この段階は、プロダクションと称され、ビデオカメラによって画像を取得する、コンピュータグラフィックスによってビデオコンテンツを作成する、得られた画像をミックス及び編集する、並びに、編集した画像を高品質マスタに(すなわち、圧縮しない又は低圧縮で)記録するといった段階が含まれる。
【0027】
続いて、ビットレートを下げてユーザが(例えば、DVD又はブルーレイのような光媒体に)画像を記憶可能とするように、又は、放送又は情報ネットワークを介して配信可能となるように、このように作成されたビデオコンテンツが符号化(エンコード)される。この段階は、配信と称され、図1では参照番号200で示されている。
【0028】
本明細書の目的によれば、最後に実行される段階は、実現段階300と称され、配信されたビデオコンテンツが、好適なデコーダ(例えば、DVDリーダ又はセットトップボックス)により復号化(デコード)されて、画面に表示される。
【0029】
図2には、本発明の第1実施形態に係る立体視ビデオストリーム2を生成するシステムが示されている。図2には、図1を参照して説明した生成段階及び配信段階に関する技術的項目が幾つか描かれている。
【0030】
システムは、1対のビデオカメラを2組、3a、3b備えているが、ビデオカメラの組の数は一例に過ぎず、1対のビデオカメラが1組だけ備えられていてもよいし、10組以上備えられてもよい。また、1対のカメラではなく、2つの画像を取得可能な1つの装置として統合してもよい。
【0031】
各組の2つのビデオカメラは、2つの異なる奥行きの画像を取得する。そして、ビデオカメラは、右画像シーケンス4及び左画像シーケンス5を生成し、生成されたシーケンスをマルチプレクサ6が受信し、対応するビデオストリームのフレームに入力する。マルチプレクサ6は、シーケンス4及びシーケンス5に属する右画像及び左画像の1対を結合して、複合画像Cとし、複合画像をディレクションミキサ10へと出力する。一実施形態において、マルチプレクサ6によって生成される複合画像Cは、1080×1920画素の画像である。
【0032】
ミキサ10の出力信号は、圧縮のために直接エンコーダ8に送信されてもよいし、又は、符号化の前に、記憶されて更なるポストプロダクション処理が行われてもよい。図2では、複合画像を処理するために使用される編集及びポストプロダクションシステム7は、点線で示されている。
【0033】
システム7によって処理されてもよい複合画像は、エンコーダ8に供給されて、そこで画像が圧縮されて、送信及び/又は記憶に適したフォーマットに符号化される。望ましい実施形態では、エンコーダ8は、以下に詳細に説明するように、データをビデオストリームに入力するべく好適に改良されたH.264エンコーダである。そして、エンコーダ8は、1088×1920の行列によって送信されるフレームのシーケンスを含むビデオストリームを生成する。最初の1080行は、受信された入力複画像(C0)を含み、最後の8行のうちの1以上は、情報及び/又はアプリケーションデータを含む。
【0034】
図2の例では、システムは、情報及び/又はアプリケーションデータとして、フレームに入力される情報をエンコーダ8に提供する手段を備える。
【0035】
一実施形態では、手段9は、情報及び/又はアプリケーションデータを手動でフレームに入力可能とする手段である。例えば、このような手段は、ユーザが手動でフレームに配置するべきデータを入力するパーソナルコンピュータであってもよい。これに替えて、挿入手段9は、エンコーダ8に好適に接続されるキーボード又はタッチスクリーン入力周辺機器のようなデータ入力デバイスであってもよく、それにより、ビデオストリームによりフレーム内に搬送されるべき情報をユーザが提供可能としてもよい。
【0036】
エンコーダ8に供給される情報は、様々な種類であってもよく、また、異なる機能を有していてもよい。具体的には、このような情報は、右画像及び左画像を再構築するべくデコーダによって使用され、フレームパッケージ情報(すなわち、複合画像内における右画像及び左画像の配置)を含んでもよい。
【0037】
挿入手段9から上記のような情報が受信されると、エンコーダ8は、入力複合画像、及び、デコーダが右目及び左画像を再構築可能とし正しく表示されるような情報及び/又はアプリケーションデータの両方を含むビデオストリームを出力する。
【0038】
エンコーダ8により生成された立体視ビデオストリーム2は、好適な媒体(DVD、ブルーレイ、大容量メモリ、ハードディスク等)に記憶される、又は、放送又は情報通信ネットワークのような通信ネットワークを介して送信される。
【0039】
図2の例において、現在のH.264規格の仕様に従って符号化される出力信号は、復号化時に画像を適切に区切る(切り出す)ようにデコーダに指示する情報(クロッピングウィンドウ(cropping window)、すなわち、画像を区切るウィンドウ)を含む。好ましい実施形態では、エンコーダ8は、デコーダに破棄する前に付加された行を分析するべきだと知らせるための好適な情報をメタデータに挿入する。このようなメタデータは、例えば、H.264符号化のNAL(Network Abstraction Layer)ユニットのような好適なデータパケットに配置されてもよい。次に、配信網の他端について、すなわち、受信及び表示/再生側について説明する。図3aには、図2のシステムによって生成及び配信されたビデオコンテンツを再生するためのシステム3000が概略的に示されている。
【0040】
システム3000は、取得ブロック3110を介してビデオストリーム2を取得するデコーダ3100を備える。取得ブロック3110は、無線(例えば、地上ネットワーク又は衛星ネットワークを介して)ブロードキャストされるビデオストリームを受信するためのチューナ、ケーブル(同軸ケーブル、光ファイバ、重信ケーブル等)で送信されるビデオストリームを受信するためのデータ入力装置、及び、光学媒体(例えば、DVD又はブルーレイ)又は大容量メモリにビデオ信号として記録されたビデオストリームを読み出すためのリーダのうちの1以上を含んでもよい。ブロック3110で取得されたビデオストリームは、復号化ブロック3120で復号化され、具体的には、復号化されたビデオストリーム2から抽出された2つの画像(右画像及び左画像)シーケンスを出力する改良されたH.264デコーダによって復号化される。
【0041】
復号化ブロック3120は、ビデオストリームに含まれるメタデータを分析するユニット3121、受信したフレーム(例えば、H.264符号化のI、B又はP型の画像)を一時的に格納するための1以上のレジスタ3122、フレームに含まれる複合画像を再構築し、それらを正しい時間的順番に並べるフレーム再構築ユニット3123、受信したフレームに含まれる不可視情報(情報及び/又はアプリケーションデータ)に基づいて、再構築された複合画像に含まれる右画像及び左画像を抽出する右及び左画像抽出ユニット3124を有する。デコーダ3100は、ビデオストリーム2から抽出された右画像及び左画像シーケンスを表示装置3200に供給する出力インターフェース3130を有する。
【0042】
インターフェース3130は、HDMI(High Definition Multimedia Interface)、2つのビデオストリーム(1つは右画像シーケンス、もう1つは左画像シーケンス)を出力するインターフェース、例えば、VGA又はXVGAストリーム、又は、2つのRGBストリームを出力するインターフェースであってもよい。図2及び図3aを参照して説明した上記の実施形態では、メタデータは、付加された行に含まれる情報及び/又はアプリケーションデータの存在についての情報を含むので、このようなデータが存在しない場合には、デコーダは分析を省略してもよい。一方で、この方法は、エンコーダが実行するオペレーションの複雑性が増すことを意味し、ストリームの復号化プロセスではより複雑となる。別の実施形態では、エンコーダは、符号化されたストリームにメタデータを付加せず、データを破棄する前に付加された行の中身の解析をデコーダに任せる。この方法では、エンコーダ及び符号化ビデオストリームの構造が単純化されるが、デコーダによる計算負荷が増加し、特に、右画像及び左画像を抽出する抽出ユニット3124は、最初に、情報及び/又はアプリケーションが含まれる付加された行及び/又は列の内容を解析しなければならない。
【0043】
専用のメタデータが存在しない場合には、例えば、デコーダレベルで画像の再構築と同時に発生しないフレームの行及び/又は列(クロッピングウィンドウ・メタデータのようなメタデータによって示される)に、情報及び/又はアプリケーションデータが存在しないか探す。一実施形態では、不均一な画素を含む付加された行及び/又は列に、データが存在しないか探索する。
【0044】
更なる実施形態では、図3bに示すように、デコーダ3100は、図3aに示したものとは異なり、抽出ユニット3124を含まない。この実施形態では、デコーダは、右画像及び左画像を抽出することなくビデオストリームを復号化するだけであり、右画像及び左画像は、複合画像で多重化されたままである。
【0045】
複合画像は、インターフェース3130と同様であるが、圧縮されていない複合画像がフレームに含まれる1つのビデオストリームを出力するインターフェース3131によって送信される。この実施形態では、右画像及び左画像の抽出は、表示装置3200によって実行されるタスクであり、表示装置はそのために好適な手段を有する。
【0046】
図2のシステムの複数の変形例について以下に記載するが、これらは全て、本発明に従ってビデオストリームを生成及び配信するのに適している。
【0047】
図4の例では、ビデオカメラは、1080×1920画素の画像を生成し、マルチプレクサ60は、1088×1920画素の行列からなる複数のフレームC1のシーケンスを生成する。複合画像は、最初の1080行を占め、最後の8行の画素は、例えば、全て黒又はグレーである。
【0048】
詳細には、情報及び/又はアプリケーションデータを搬送することを可能とする付加されている8行は、マルチプレクサ60の回路基板内で生成され、マルチプレクサは、右ビデオストリーム及び左ビデオストリームの2つを受信して、複合画像C1を含む立体視ビデオストリームを出力する。
【0049】
システム内の異なる複数のマルチプレクサ60によって生成されたフレームC1は、ディレクションミキサ10によって受信され、ミキサは、H.264圧縮フォーマットに準拠した1088×1920画素の画像のシーケンスを出力する。
【0050】
表示されない情報(すなわち、複合画像を含まない)を含むClの8行は、生成段階で形成され、ミキサ10の出力で入力された転送データが信号通知データ入力システム90を介して使用される。図2の手段9のように、システム90により、オペレータが手動で情報及び/又はアプリケーションデータを入力する(例えば、コンピュータ又はキーボードを介して)ことが可能となる。多重化段階において、データは、複合画像C1に付加された8行のうちの1以上に入力される。このように、システム90は1088×1920フレームC1aを出力するが、1080行には視覚情報、すなわち、表示されるべき画像が含まれており、残りの8行には、システム90によって入力されたデータを含む不可視情報(すなわち、表示されない情報)が含まれる。
【0051】
システム90によって出力される画像C1aは、編集及びポストプロダクションシステム70(省略可能な構成であることから、点線4で示されている)によって処理されてもよく、画像C2へと修正されるが、大きさは1088×1920画素のままである。
【0052】
システム70は、1088×1920画素の画像を扱うことができること以外は、システム7と同じ構成を有する。
【0053】
エンコーダ80(望ましくは、H.264型のエンコーダ)画像C1a又はシステム70によって修正された画像C2を受信し、これら画像を圧縮して、立体視ビデオストリーム2を生成する。ビデオストリームの符号化の時に、情報及び/又はアプリケーションデータがフレームに入力される図2の例とは異なり、図4の例では、データが画像生成段階で入力される。
【0054】
望ましくは、情報及び/又はアプリケーションデータが生成段階で入力される場合には、このデータが様々な種類のデータであってもよく、また、異なる機能を有してもよい。具体的には、デコーダは、このようなデータを使用して右画像及び左画像を再構築するため、データは特に、フレームパッケージング情報(すなわち、複合画像における右画像及び左画像の配置に関する情報)を含んでもよく、また、撮影パラメータに関する情報も含んでもよい。ビデオカメラが撮影した画像を、コンピュータグラフィックス法を使用して生成された画像と組み合わせることができることから、情報及び/又はアプリケーションデータは、ビデオカメラ撮影がどのように行われたかに関する情報を含んでもよく、これにより、実際の画像と人工的な画像との間の適切なマッチングを確実にすることができる。例えば、上記の情報は、人間の目の間の平均距離とは常に等しくならない、2つのビデオカメラ(右及び左)間の距離に関する情報が含まれてもよく、また、2つのビデオカメラが平行である又は収束しているかを示す情報(人間の目の振る舞いを模倣する場合が存在し、その場合、近い被写体に焦点を合わせる場合には収束する傾向がある)が含まれてもよい。
【0055】
必ずしもコンピュータではなく、ビデオカメラの場合もあるように、異なるソースから入力される2つの画像が組み合わせられる場合には、上記の情報が有用であり、組み合わせて生成された画像がコヒーレントであり見やすい画像であるかの検証に役立つ。異なる撮影パラメータを有して生成される画像を組み合わせると、違和感のある不愉快な視覚効果が生じる可能性がある。
【0056】
図5には、図4の変形例が示されており、複合画像の入力に必要な行(ライン)の数(規定されたフォーマット、例えば、1080行及び1920列)よりも多い数の行を使用することに加えて、変形例では、マルチプレクサ600が、付加された行に情報及び/又はアプリケーションデータを入力する。
【0057】
図5の1以上のデータ入力システム900(図5の例では1つシステムのみが示されているが、最大でマルチプレクサ毎に設けられてもよい)は、マルチプレクサ600に接続されて、入力されるべき情報及び/又はアプリケーションデータは、マルチプレクサ600の出力において、フレームC1aの不可視の行(ライン)に供給される。このデータは、図4のシステム90によって入力されるデータと同様な種類であってもよい。このように、マルチプレクサ600によって出力されるフレームC1aは、実質的に図4のシステム90によって出力されるフレームに対応しており、圧縮及び必要に応じた編集及びポストプロダクションプロセスにおいて同様に扱うことができる。
【0058】
図6の例では、マルチプレクサ6は、図2に示した例と同様なマルチプレクサであり、ビデオカメラからビデオストリームを受信して、フレームが複合画像を含む立体視ビデオストリームへと受信したビデオストリームを組み合わせる。
【0059】
情報及び/又はアプリケーションデータのための8行は、編集及びポストプロダクションシステム70によって生成され、複合画像並びに情報及び/又はアプリケーションデータの両方を含むフレームのシーケンスを生成する。情報及び/又はアプリケーションデータは、図4を参照して説明した手段90と同様な、手段9000によって提供される情報を使用して生成される。
【0060】
図2の例のように、エンコーダ80は、フレームC2のシーケンスを圧縮し、それらを記憶及び/又は送信するべく出力する。
【0061】
別の実施形態では、図示していないが、情報及び/又はアプリケーションデータのための8行が、編集システムにより複合画像に付加されるが、情報及び/又はアプリケーションデータは、エンコーダレベル、例えば、図2を参照して説明したタイプの手段により、この8行に入力される。
【0062】
更なる別の実施形態では、情報及び/又はアプリケーションデータとして使用されるデータは、ビデオカメラが生成したビデオストリーム、又は、マルチプレクサから出力されるビデオストリーム、又は、編集及びポストプロダクションシステムが出力するビデオストリームと関連付けられるメタデータから自動的に取得される。この方法は、特に、手動での入力を必要としない場合に有効である。この方法は、視聴覚コンテンツを専門的に生成するのに使用されるツール、例えば、撮像システム(ビデオカメラ)から搬送システム(ファイルフォーマット、例えば、MXF(Material Exchange Format))及びワークフロー管理/ファイリングシステム(Digital Asset Management)までにわたるツールは、"エッセンス"(すなわち、実際のビデオ信号)を書き留める及び記載するためにメタデータを利用する。したがって、立体視ストリームを生成する基板、又は、エンコーダは、このようなメタデータを利用可能である。
【0063】
明瞭化のためであって限定することを意図していないが、図7には、情報及び/又はアプリケーションデータに関する情報を挿入手段9を必要とせずに自動的入力する図2のシステムが示されている。エンコーダ800は、入力において複合画像C及び関連するメタデータを受信し、メタデータを抽出して、複合画像に付加された8行に入力され立体視ビデオストリームのフレームで送信されるべき情報及び/又はアプリケーションデータを生成するべく抽出したメタデータを処理する。
【0064】
例えば、一部の画像はアーカイブから発生、又は、異なるフレームパッケージフォーマット(右目及び左画像の2つの複合画像におけるパッケージング)を使用して異なる放送局から発生するといったように、異なるソースからの画像を組み合わせるような生成環境では、複雑な処理動作が実行される。異なるフレームパッケージフォーマットが使用される場合には、画像を1つに組み合わせるには、フォーマットの変換が必要となる。
【0065】
画像生成環境において配布される全てのビデオ信号上の上記のような情報及び/又はアプリケーションデータ(フレームパッケージングフォーマットを指定する情報)を利用することにより、変換プロセスを自動化することができる。
【0066】
生成環境に存在し変換されたビデオストリームは、配信環境に送られるが、その段階で、関連する信号について1つのフレームパッケージングフォーマットを有するようになる。
【0067】
上記の例では、2つのビデオカメラ3a又は3bによって取得された右画像及び左画像は、直ぐに複合画像へと組み合わせられる。しかしながら、このことは本発明の目的において必須の構成ではなく、右画像及び左画像シーケンスは、別々にエンコーダに送信されてもよい。
【0068】
これは、図8に例示されており、一対のビデオカメラの組3a、3bによって取得された右画像及び左画像を、ディレクションミキサ10が受信し、ミキサは、右画像及び左画像について2つの別々のビデオストリームを出力する。
【0069】
ディレクションミキサ10によって選択された右画像及び左画像は、編集及びポストプロダクションシステム7000に送られて、例えば、特殊効果が付与されるといったような処理が画像に対して行われる。これに替えて、画像を直接エンコーダ/マルチプレクサ8000に送信してもよい。存在する場合には、編集及びポストプロダクションシステム7000は、右ビデオストリーム及び左ビデオストリームを別々にエンコーダ/マルチプレクサ8000に送信してもよい。
【0070】
エンコーダ/マルチプレクサは、入力されたビデオストリームを1つの立体視ビデオストリーム2へと一体化させ、一体化されたビデオストリームのフレームには、複合画像、及び、視覚情報すなわち表示される情報を搬送しない特定の数の行(具体的には、8行)に配置される情報及び/又はアプリケーションデータ(本例では、挿入手段9から受信されるが、上記のように自動的に取得されてもよい)が含まれる。エンコーダ/マルチプレクサ8000は、例えば、任意のフォーマット(上下、横並び等)に従って右画像及び左画像を結合し、H.264符号化に従って符号化する。
【0071】
図9を参照して記載される別の実施形態では、エンコーダ8001は、H.264規格のアペンディクスHに記載されているMVC(Multi View Coding)に従って立体視ストリームを符号化する。実際の複合画像を生成する替わりに、この規格では、基本画像(基本レイヤ)、例えば、右画像、及び、右画像と左画像との間の差分(拡張レイヤ)が送信される。この技術の一例として、いわゆる2Dプラスデルタコーディングが挙げられる。本実施形態では、フレームパッケージングが行われないことから、フレームパッケージングに関する情報及び/又はアプリケーションデータは必要ない。更に、H.264圧縮信号は、必要なメタデータを全て含むことから、表示装置にとって有用な情報を入力するために付加される8行を必ずしも必要とするわけではない。しかしながら、本発明者は、信号を、一方のレイヤのみ又は両方のレイヤの画像に入力することが、有用及び有益であると考える。具体的には、画像生成レベルにおいて、情報及び/又はアプリケーションデータを入力することが有益である。
【0072】
図9の例では、ミキサ10が出力したビデオストリームを、データエントリシステム9000が受信し、システムは、入力されたビデオストリームの各フレームの行の数を増やして、付加した行に情報及び/又はアプリケーションデータを入力する。好ましくは、ビデオカメラは、1080×1920画素の大きさのフレームを有するビデオストリームを生成し、システム9000はこのフレームを1088×1920にまで大きくし、付加した行に情報及び/又はアプリケーションデータを入力する。データは、フレームに含まれる画像が、右目又は左目の何れかを対象とした画像であるかに関する情報、また、画像がどのように取得されたかについての情報(例えば、1対のビデオカメラ間の空間的関係)、画像フォーマット(4:3、16:9)等についても提供されてもよい。このような情報は、望ましくは、配信環境において保存される。これは、プログラムが作成された後何年か経過すると、高品質マスタがもはや利用可能でなくなり、復元すべきプログラムが、例えば、いわゆる"ノスタルジアプログラム"で使用される場合には、撮影パラメータが分かれば古いプログラムであっても新しいコンテンツと適切に組み合わせ可能となることから、保存されることが望ましいと考えられる。
【0073】
システム9000は、上記したように自動的に入力ビデオストリームからデータを取得してもよい、又は、データを手動で入力するオペレータによって制御される好適なデータ入力周辺機器からデータを受信してもよい。
【0074】
データ入力システム9000によって修正された画像は、エンコーダ8001又は図9に示したような編集及びポストプロダクションシステムに送信されてもよい。
【0075】
上記の例から、本発明に係る方法で生成された立体視ビデオストリーム2は、有用な視覚情報(複合画像又はMVC画像)及び有用な視覚情報を含まないフレームの一領域に入力された情報及び/又はアプリケーションデータを含む。一実施形態において、情報及び/又はアプリケーションデータは、立体視ビデオストリームの全てのフレームに入力される。
【0076】
別の実施形態では、情報及び/又はアプリケーションデータは、立体視ビデオストリームの一部のフレームにのみ入力される。情報及び/又はアプリケーションデータを含まないフレームにおいて、有用な視覚情報を含まない行は、同じ色の画素で満たされることが望ましく、特に、グレー又は黒色で満たされることが望ましい。同様に、このようなデータを含むフレームにおいても、データのために使用されない付加された行(又はその部分)は、同じ色の画素で満たされることが望ましく、特に、グレー又は黒色で満たされることが望ましい。
【0077】
全てのフレームに含まれるか、一部のフレームのみに含まれるかに関わらず、情報及び/又はアプリケーションデータは、デコーダによって使用されて、デコーダは信号を復号し、表示を行うべく、適切に右画像及び左画像を再構築する。
【0078】
デコーダが、例えば、H.264符号化に従って圧縮された立体視ストリーム2を受信する時、デコーダは立体視ストリームを展開(decompress)して、フレームから情報/アプリケーションデータを抽出する。そして、上記データに含まれる情報が、ビデオストリームによって転送される画像の抽出及び/又は再構築のために使用されてもよい。具体的には、このデータは、右画像及び左画像を再構築するのに有用であり、両画像が表示システム、例えば、3Dコンテンツを適切に観察者に適用できるテレビ又はビデオプロジェクタに供給されてもよい。
【0079】
一実施形態では、デコーダは、表示フォーマット、すなわち、表示に使用されるフォーマットとは同じ場合も異なる場合も存在する(例えば、行切り替え、フレーム切り替え等)表示装置の入力に必要とされるフォーマットを知っている。この場合、デコーダは、必要であれば、付加された行に入力されている情報及び/又はアプリケーションデータに基づいて、転送フォーマットを表示フォーマットに変換してもよい。
【0080】
第1実施形態において、表示装置の入力において必要なフォーマットが、デコーダ又は表示装置が製造された時に、例えば、専用メモリ領域に永久的にその情報がプログラム及び入力されていることによって、デコーダはフォーマットを知ることができる。デコーダが表示装置に組み込まれており、表示装置とデコーダが厳密に関連付けられている場合に、特に、この方法が有益である。
【0081】
別の実施形態では、表示フォーマット情報は、表示装置によってデコーダに送信され、専用メモリ領域に読み込まれる。デコーダが表示装置と別個に設けられるデバイスであり、双方向データ交換を可能とするインターフェースによりデコーダと表示装置を容易に関連付けられる場合に、この方法が有益である。このように、エラーが発生するリスクもなく、また、ユーザの介入も必要とせずに、3Dコンテンツを正しく表示させることができる。
【0082】
別の実施形態では、このような情報は、ユーザにより手動でデコーダに提供される。本発明の特徴及び利点が、幾つかの実施形態の説明から明らかとなった。本発明が保護するべき範囲は、添付の特許請求の範囲によって規定される。したがって、当業者であれば、ビデオストリーム内のデータを転送し符号化するための上記の方法及びシステムに対して、多くの改良及び変形例を考え得る。
【0083】
本明細書に記載されたシステムは、以下に説明するような2D又は3Dビデオコンテンツを生成及び配布するためのその他の専門的でない装置又はモデルに対しても適用可能であることは明らかである。例えば、本発明を実装する撮像装置は、動画を撮影しデータを大容量メモリに格納して、同装置又は別の装置で表示させるよう構成されたフォトカメラ、ビデオカメラ又は携帯電話に組み込まれてもよい。この場合、撮影されたビデオストリームは、異なる再生及び可視化装置(例えば、モニタを備えるPC、テレビ、携帯型マルチメディアプレーヤ等)に、様々な態様で(例えば、無線又は有線LANネットワーク、インターネット、Bluetooth(登録商標)を介して一の装置から別の装置のデータ記憶媒体へと転送される、又は、携帯電話ネットワークを介してMMSとして送信される)転送されてもよい。このフレームでも、上記したようなビデオコンテンツの生成、配信及び実現段階を備える同様なモデルが適用でき、解決するべき技術的課題は同じであり、本発明の同様な技術的解決方法を、当業者にとって明らかな僅かな変更を加えるだけで適用可能である。
【0084】
更に、技術者は、本発明の異なる実施形態を参照して説明した異なる方法、システム及び装置の特徴を組み合わせてもよい。
【0085】
具体的には、ビデオストリームを生成する方法の様々な段階(編集、多重化、符号化等)は、別個の複数の装置又は任意の手段によって一体化された及び/又は共に接続された装置を介して実装可能である。例えば、撮影されたビデオを受信する2つのビデオカメラ及びマルチプレクサは、1以上のレンズを備える1つの立体視ビデオカメラに内蔵されていてもよい。
【0086】
より一般的には、1以上のビデオストリームを受信するための入力ユニット、1以上のビデオストリームの画像を含むフレームを生成するための処理ユニット、フレームに入力されるべき情報及び/又はアプリケーションデータを取得するよう構成された取得手段、及び、画像に占有されていないフレームの画素に情報及び/又はアプリケーションデータを入力するたように構成された挿入手段を備え、上記フレームは、ソース画像の画素数よりも多い画素数を有する、ビデオストリームにデータを入力するシステムを提供することができる。上記の画素は、上記フレームの周辺行及び/又は周辺列を占めてもよい。このシステムのユニット及び手段は、1つの装置に一体化されていてもよい、又は、異なる複数の装置に属してもよい。
【0087】
上記で例示された実施形態は、1920×1080フォーマット、すなわち、符号化された画像のサイズを大きくする必要があるH.264符号化で最も一般的なフォーマットに関する。このような状況は、異なる画像フォーマット及び異なるコーディング形式でも同様に発生する。
【0088】
本発明がH.264符号化のみを参照して説明されたが、元の画像サイズがマクロブロックの倍数でない又はその他の理由から、エンコーダに供給される画像サイズを増加させる必要があるその他のビデオ圧縮技術にも等しく適用可能である。例えば、現在研究開発中のH.264符号化(いわゆるH.265/HVC等)の後継でも、同様な状況が発生すると考えられる。フレームフォーマットに応じて、情報及び/又はアプリケーションデータを、視覚情報、すなわち、表示すべき画像の画素を含まない限り、フレームの任意の行及び/又は列に、情報及び/又はアプリケーションデータを入力してもよい。
【0089】
情報及び/又はアプリケーションデータは、立体視画像のフォーマット及び/又は立体視撮影モードに関さない情報を含め、様々な種類の情報を転送してもよい。例えば、情報及び/又はアプリケーションデータは、ビデオストリームの意図された使用を通知するのに使用されてもよく、それにより、例えば、USAのみ又はヨーロッパのみといったように、世界の所定の地域に分布する又は位置するデコーダでのみでコードすることを許可してもよい。情報及び/又はアプリケーションデータは、入力される画像に関係している又は関係していないあらゆる種類の情報を搬送してもよく、例えば、デコーダで又は表示装置レベルで実行可能なアプリケーションのために使用されてもよい。
【0090】
更に、上記した実施形態では、情報及び/又はアプリケーションデータを搬送するフレームは、立体視画像を含んでいたが、上記の説明から、本発明は同様に2D画像又はいわゆる"マルチビュー"表示にも適用可能である。実際に、情報及び/又はアプリケーションデータを、デジタル2Dビデオストリームで表示される画像の画素を含まない行及び/又は列に入力してもよい。

【特許請求の範囲】
【請求項1】
デジタルビデオストリーム内にデータを転送する方法であって、
前記デジタルビデオストリームは、表示されない情報及び表示されないアプリケーションデータの少なくとも一方を含み、
少なくとも1つのフレームは、表示される画像を含み、
前記少なくとも1つのフレームは、前記画像の画素数よりも多い画素数を有し、
前記情報及び前記アプリケーションデータの少なくとも一方は、前記画像に占有されていない前記フレームの画素に入力される方法。
【請求項2】
前記画像を第1フレームに挿入する段階と、
前記第1フレームよりも大きなフレームを得るべく、複数の行及び複数の列の少なくとも一方を前記第1フレームに付加する段階と、
前記情報及び前記アプリケーションデータの少なくとも一方を、前記大きなフレームに挿入する段階と
を備える請求項1に記載の方法。
【請求項3】
前記複数の行及び複数の列の少なくとも一方は、前記データを挿入したのと同じ装置によって付加される請求項1又は2に記載の方法。
【請求項4】
前記複数の行及び複数の列の少なくとも一方は、前記データを入力した装置とは異なる装置によって付加される請求項1又は2に記載の方法。
【請求項5】
付加された前記複数の行及び複数の列の少なくとも一方は、前記大きなフレームの周辺部の行及び複数の列の少なくとも一方である請求項2から4の何れか一項に記載の方法。
【請求項6】
付加された前記複数の行及び複数の列の少なくとも一方は、前記大きなフレームの隣接部の複数の行及び複数の列の少なくとも一方である請求項2から5の何れか一項に記載の方法。
【請求項7】
前記情報及び前記アプリケーションデータの少なくとも一方は、付加された前記複数の行及び複数の列の少なくとも一方の全て又は一部のみを占有する請求項2から6の何れか一項に記載の方法。
【請求項8】
前記ビデオストリームを符号化するのに使用される符号化アルゴリズムに依存するサイズの整数個のマクロブロックに分割可能であるように、前記大きなフレームの大きさが決定される請求項2から7の何れか一項に記載の方法。
【請求項9】
前記表示される画像は、立体視ビデオストリームの複合画像である請求項1から8の何れか一項に記載の方法。
【請求項10】
前記画像は、右画像又は左画像であり、
前記ビデオストリームは、前記右画像と前記左画像との間の差分を含む少なくとも1つの第2フレームを含む請求項1から8の何れか一項に記載の方法。
【請求項11】
前記複数の行及び複数の列の少なくとも一方は、前記ビデオストリームを圧縮するエンコーダの上流に位置する装置によって付加される請求項2から10の何れか一項に記載の方法。
【請求項12】
前記データは、前記ビデオストリームを圧縮するエンコーダによって入力される請求項2から10の何れか一項に記載の方法。
【請求項13】
前記エンコーダは、前記ビデオストリームにメタデータを入力し、
前記メタデータは、付加された前記複数の行及び複数の列の少なくとも一方にデータが存在することを示す情報を含む請求項12に記載の方法。
【請求項14】
前記ビデオストリームのフレームフォーマットが、転送フォーマットから表示フォーマットへと自動的に処理及び変換の少なくとも一方されることを可能とするべく前記データが適用されている請求項1から13の何れか一項に記載の方法。
【請求項15】
前記データは、前記画像のフォーマットに関し、特に、前記画像が2D画像又は3D画像であるかを示す識別子、アスペクト比、フレームパッケージング及び撮影モードからなる一群に含まれる1以上の項目を含む請求項1から14の何れか一項に記載の方法。
【請求項16】
前記データは自動的に入力される請求項2から15の何れか一項に記載の方法。
【請求項17】
前記データは、前記画像が取得されるビデオストリームと関連付けられたメタデータから取得される請求項16に記載の方法。
【請求項18】
前記データは、オペレータにより手動で入力される請求項2から15の何れか一項に記載の方法。
【請求項19】
ビデオストリームにデータを入力する装置であって、
画像を受信する入力ユニットと、
前記ビデオストリームのフレームを生成する処理ユニットと、
前記ビデオストリームに入力する情報及びアプリケーションデータの少なくとも一方を取得する取得手段と、
前記情報及びアプリケーションデータの少なくとも一方を、前記画像により占有されていない前記フレームの複数の画素に入力する挿入手段と
を備え、
前記フレームは前記画像を含み、
前記フレームは、前記画像の画素の数よりも多い画素数を有する装置。
【請求項20】
前記入力ユニットは、前記画像を含む第1フレームを受信し、
前記処理ユニットは、前記第1フレームよりも大きなフレームを取得するべく、前記第1フレームに複数の行及び複数の列の少なくとも一方を付加し、
前記挿入手段は、前記情報及びアプリケーションデータの少なくとも一方を前記大きなフレームに入力する請求項19に記載の装置。
【請求項21】
付加された前記複数の行及び複数の列の少なくとも一方は、前記大きなフレームの周辺部及び隣接部の少なくとも一方における複数の行及び複数の列の少なくとも一方である請求項19又は20に記載の装置。
【請求項22】
前記情報及びアプリケーションデータの少なくとも一方は、付加された前記複数の行及び複数の列の少なくとも一方の全て又は一部のみを占有する請求項19から21の何れか一項に記載の装置。
【請求項23】
前記取得手段は、前記画像が取得されたビデオストリームに関連付けられたメタデータから前記情報及びアプリケーションデータの少なくとも一方を取得する請求項19から22の何れか一項に記載の装置。
【請求項24】
手動で操作されるデータ入力ユニットと接続するためのインターフェースを更に備える請求項19から23の何れか一項に記載の装置。
【請求項25】
符号化アルゴリズムに従って前記ビデオストリームを符号化する符号化手段を更に備え、
前記符号化アルゴリズムに依存するサイズのマクロブロックの整数個に分割可能であるように、前記大きなフレームの大きさが決定される請求項19から24の何れか一項に記載の装置。
【請求項26】
前記符号化手段は、前記符号化されたビデオストリームにメタデータを入力し、
前記メタデータは、付加された前記複数の行及び複数の列の少なくとも一方にデータが存在することを示す情報を含む請求項25に記載の装置。
【請求項27】
請求項19から26の何れか一項に記載の装置を含むマルチプレクサデバイス。
【請求項28】
請求項19から27の何れか一項に記載の装置を含む撮像装置、特に、ビデオカメラ又はフォトカメラ。
【請求項29】
表示されない情報及び表示されないアプリケーションデータの少なくとも一方、及び、表示される画像を含む少なくとも1つのフレームを備えるデジタルビデオストリームであって、
前記少なくとも1つのフレームは、前記画像の画素の数よりも多い画素数を有し、
前記情報及びアプリケーションデータの少なくとも一方は、前記画像によって占有されていない前記フレームの画素に割り当てられるデジタルビデオストリーム。
【請求項30】
前記画像は、共に多重化された右画像及び左画像を含む複合画像である請求項29に記載のデジタルビデオストリーム。
【請求項31】
前記ビデオストリームは、ITU−T H.264符号化規格、"オーディオビジュアルサービス全般のための高度ビデオ符号化方式(H.264 Advanced video coding for generic audiovisual services)"に従って符号化される請求項29又は30に記載のデジタルビデオストリーム。
【請求項32】
前記ビデオストリームは、ITU−T H.264符号化規格、"オーディオビジュアルサービス全般のための高度ビデオ符号化方式(H.264 Advanced video coding for generic audiovisual services)"のアペンディクスHに従って符号化される請求項31に記載のデジタルビデオストリーム。
【請求項33】
前記データは、前記少なくとも1つのフレームの周辺部の行及び複数の列の少なくとも一方に配置される請求項29から32の何れか一項に記載のデジタルビデオストリーム。
【請求項34】
前記画像によって占有されていない前記フレームの前記画素にデータが存在するかを示す情報を含むメタデータを更に備える請求項29から33の何れか一項に記載のデジタルビデオストリーム。
【請求項35】
請求項29から34のいずれか一項に記載のデジタルビデオストリームを復号化する方法であって、
前記情報及びアプリケーションデータの少なくとも一方を抽出する段階と、
前記画像を抽出する段階と
を備える方法。
【請求項36】
前記情報及びアプリケーションデータの少なくとも一方は、前記ビデオストリームに入力されるメタデータに含まれる情報を使用して抽出される請求項35に記載の方法。
【請求項37】
特に、クロッピングウィンドウ情報により、前記フレームの切り取られるべき複数の行及び複数の列の少なくとも一方を見つける段階と、
前記切り取られるべき複数の行及び複数の列の少なくとも一方に、前記情報及びアプリケーションデータの少なくとも一方を探す段階と、
前記情報及びアプリケーションデータの少なくとも一方を抽出する段階とを更に備える請求項36に記載の方法。
【請求項38】
前記情報及びアプリケーションデータの少なくとも一方は、画素値により符号化され、
前記方法は、
付加された前記複数の行及び複数の列の少なくとも一方から、不均一な画素を含む行及び複数の列の少なくとも一方を探す段階と、
不均一な画素を含む前記複数の行及び複数の列の少なくとも一方から、前記情報及びアプリケーションデータの少なくとも一方を抽出する段階とを更に備える請求項35から37の何れか一項に記載の方法。
【請求項39】
前記ビデオストリームは、立体視ビデオストリームであり、特に、少なくとも1つの複合画像又は一対の右画像及び左画像を含む請求項35から38の何れか一項に記載の方法。
【請求項40】
復号化される前記ビデオストリームの前記フレームは、転送フォーマットであり、
前記転送フォーマットは、前記抽出されたデータに基づいて決定され、
前記ビデオストリームの前記フレームの前記フォーマットは、前記転送フォーマットから表示フォーマットへと自動的に変換される請求項35から39の何れか一項に記載の方法。
【請求項41】
請求項35から40の何れか一項に記載の方法を実装する手段を備える立体視ビデオストリームを復号化する装置。
【請求項42】
請求項41に記載の方法を実装するビデオストリームを表示する装置。
【請求項43】
入力ビデオストリームのフレームのフォーマットを、表示装置に表示される出力ビデオストリームのフレームのフォーマットへと変換する装置であって、
請求項1から18のいずれか一項に記載された方法に従って、前記入力ビデオストリームに入力された情報及びアプリケーションデータの少なくとも一方に基づいて、前記入力ビデオストリームを前記出力ビデオストリームへと変換する手段を備える装置。
【請求項44】
前記装置は、前記装置が製造又は組立てられた時に入力された設定に基づいて、前記表示装置の入力において使用されるフォーマットのナレッジを取得する請求項43に記載の装置。
【請求項45】
前記装置は、前記表示装置から受信された情報に基づいて、前記表示装置の入力において使用される表示フォーマットのナレッジを取得する請求項43に記載の装置。
【請求項46】
前記装置は、ユーザによって手動で入力された情報に基づいて、前記表示装置の入力において使用される表示フォーマットのナレッジを取得する請求項43に記載の装置。

【図1】
image rotate

【図2】
image rotate

【図3a】
image rotate

【図3b】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2013−518458(P2013−518458A)
【公表日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2012−549452(P2012−549452)
【出願日】平成23年1月19日(2011.1.19)
【国際出願番号】PCT/IB2011/050243
【国際公開番号】WO2011/089556
【国際公開日】平成23年7月28日(2011.7.28)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.HDMI
【出願人】(511022203)シズベル テクノロジー エス.アール.エル. (4)
【Fターム(参考)】