説明

立体3Dビデオイメージディジタルデコーディングのシステムおよび方法

【課題】独自の分類アルゴリズムを有するMPEG2互換3D立体ビデオイメージをディジタルデコードする方法およびシステムを提供する。
【解決手段】ディジタルビデオストリーム内の3Dイメージを得るために、デコーディングプロセスの異なる部分でハードウェア変更およびソフトウェア変更を行うことによって、ビデオストリームの構造およびビデオシーケンスが、ビットレベルでTDVision(R)テクノロジイメージのタイプを識別する必要なフラグを含めるために変更される。変更は、デコーディングプロセスで、例えばソフトウェアおよびハードウェアを介して情報をデコードする間に行われ、二重出力バッファがアクティブ化され、平行デコーディングセレクタおよび差デコーディングセレクタがアクティブ化され、圧縮解除プロセスが実行され、イメージが対応する出力バッファで表示される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、3DVisor(登録商標)デバイスでの立体ビデオイメージ表示に関し、具体的には、標準化された圧縮技法を使用することによって3次元情報の保管を可能にする、ディジタルデータ圧縮システムによるビデオイメージデコーディング方法に関する。
【背景技術】
【0002】
現在、データ圧縮技法は、1つのイメージまたは一連のイメージの表現のビット消費を減らすために使用されている。標準化作業が、国際標準化機構の専門家のグループによって実行された。現在、これらの方法を、通常、JPEG(Joint Photographic Expert Group)、およびMPEG(Moving Pictures Expert Group)と称する。
【0003】
これらの技法の共通の特性は、イメージブロックが、通常は離散コサイン変換(DCT)と称する、ブロックに適当な変換の適用によって処理されることである。形成されたブロックが、量子化プロセスにサブミットされ、その後、可変長コードを用いてコード化される。
【0004】
可変長コードは、可逆プロセスであり、可変長コードを用いてコーディングされたものの正確な再構成を可能にする。
【0005】
ディジタルビデオ信号の表示に、30Hzから75Hzの周波数で連続して表示されまたは提示される、ある個数のイメージフレーム(30fpsから96fps)が含まれる。各イメージフレームは、それでも、特定のシステムのディスプレイ解像度に従って、画素アレイによって形成されたイメージである。たとえば、VHSシステムは、320列480行のディスプレイ解像度を有し、NTSCシステムは、720列486行のディスプレイ解像度を有し、高品位テレビジョンシステム(HDTV)は、1360列1020行のディスプレイ解像度を有する。低解像度のディジタル化された形式である320列480行VHSフォーマットに関して、2時間のムービーは、100ギガバイトのディジタルビデオ情報と同等とすることができる。これと比較して、従来のコンパクト光ディスクは、約0.6ギガバイトの容量を有し、磁気ハードディスクは、1〜2ギガバイトの容量を有し、現在のコンパクト光ディスクは、8ギガバイト以上の容量を有する。
【0006】
我々が映画またはTVの画面で見るすべてのイメージが、高い速度で完全なイメージ(写真に似た静止画)を提示するという原理に基づく。これらが、30フレーム毎秒速度(30fps)ですばやく順次の形で提示される時に、我々は、人間の目の保持力に起因して、これらを動画として知覚する。
【0007】
順次の形で提示されるイメージを分類し、ビデオ信号を形成するために、各イメージを行に分割する必要があり、ここで、各行は、画素またはピクセルに分割され、各画素は、2つの関連する値すなわちルマおよびクロマを有する。ルマは、各点での光強度を表し、ルマは、定義された色空間(RGB)の関数として色を表し、この色空間は、3バイトによって表すことができる。
【0008】
イメージは、水平垂直ラスタで上から下へ、左から右へと周期的に画面に表示される。走査線の本数および表示の周波数は、NTSC、PAL、またはSECAMなどのフォーマットの関数として変化し得る。
【0009】
ビデオ信号を、送出、受取、および通常のテレビジョンセットまたは3DVisor(登録商標)などのディスプレイデバイスでの表示のためのデコードの後に、ディジタルフォーマットで保管するためにディジタル化することができ、このプロセスを、アナログ−ディジタルビデオ信号コーディング−デコーディングと称する。
【0010】
定義により、MPEGは、システムストリームにビデオおよびオーディオをインターレースする2つの異なる方法を有する。
【0011】
トランスポートストリームは、干渉を受けやすい衛星システムなど、より高い誤りの可能性を有するシステムで使用される。各パッケージは、188バイト長であり、識別ヘッダから始まり、この識別ヘッダが、ギャップの認識および誤りの修復を可能にする。さまざまなオーディオプログラムおよびビデオプログラムを、単一のトランスポートストリーム上でトランスポートストリームを介して同時に伝送することができ、ヘッダに起因して、これらを独立に個別にデコードし、多数のプログラムに統合することができる。
【0012】
プログラムストリームは、DVD再生時など、より低い誤りの可能性を有するシステムで使用される。この場合に、パッケージは、可変長を有し、トランスポートストリームで使用されるパッケージより実質的に大きいサイズを有する。主要な特性として、プログラムストリームは、単一のプログラム内容だけを許容する。
【0013】
トランスポートストリームおよびプログラムストリームが異なるパッケージを扱う時であっても、ビデオフォーマットおよびオーディオフォーマットは、同一の形でデコードされる。
【0014】
次に、上のパッケージに適用される、たとえば時間予測、圧縮、および空間圧縮など、3つの圧縮タイプがある。
【0015】
デコーディングは、長々しい数学プロセスに関連し、その目的は、情報量を減らすことである。フルフレームの完全なイメージが、マクロブロックと呼ばれる単位に分割され、各マクロブロックは、16画素×16画素のマトリックスから構成され、上から下、左から右に順序付けられ、名前を付けられる。画面上のマトリックスアレイを用いる場合であっても、情報ストリームを介して送られる情報は、特殊な順次シーケンスに従う、すなわち、マクロブロックは、昇順で順序付けられる、すなわち、macroblock0、macroblock1、などである。
【0016】
連続するマクロブロックの組は、スライスを表す。マクロブロックが単一の行に関係するならば、1スライス内に任意の個数のマクロブロックを設けることができる。マクロブロックと同様に、スライスは、左から右、下から上に番号を付けられる。スライスは、イメージ全体をカバーしなければならない。というのは、これが、MPEG2がビデオを圧縮する形であるからであり、コーディングされたイメージは、必ずしも、画素ごとのサンプルを必要としない。一部のMPEGプロファイルは、固定したスライス構造の処理を必要とし、このスライス構造によって、イメージ全体がカバーされなければならない。
【0017】
Katata他に1999年10月5日に与えられた米国特許第5963257号は、位置区域およびイメージ形式、下レイヤコード、予測コーディング上レイヤコードによって、コーディングされたデータを分離し、したがってコーディングされたデータの階層構造を得る手段を有するフラットビデオイメージデコーディングデバイスを保護し、このデコーダは、高品質イメージを得るために、階層構造でコーディングされたデータを分離する手段を有する。
【0018】
Shen他に2001年9月18日に与えられた米国特許第6292588号は、再構成されたフラットイメージのデータが小さい領域のイメージデータおよび前記イメージの最適予測データの合計から生成される形で、小さい領域から再構成され、デコードされる予測フラットイメージをコーディングするデバイスおよび方法を保護する。イメージデータストリーム用の前記予測デコーディングデバイスには、単一次元DCT係数の可変長コードが含まれる。Boonに2002年4月9日に与えられた米国特許第6370276号は、上記に類似するデコーディング方法を使用する。
【0019】
Lazzaro他に2002年9月24日に与えられた米国特許第6456432号は、立体3Dイメージディスプレイシステムを保護し、このシステムは、2つの透視図からイメージをとり、これらをCRTに表示し、観察者の両目に関するフリッカなしで、これらのイメージをフィールドシーケンシャルな形で多重化する。
【0020】
Duruoz他に2003年12月2日に与えられた米国特許第6658056号は、指定された位置のディジタルビデオフィールドを出力メモリ内に得るために「隣接フィールド」コマンドに対応する論理表示セクションを含むディジタルビデオデコーダを保護する。ディジタルビデオ表示システムは、MPEG2ビデオデコーダを備える。イメージは、メモリバッファとしてデコードされ、このメモリバッファは、最適化され、補償変数テーブルを維持し、データフィールドとして表示される固定メモリポインタテーブルにアクセスする。
【0021】
Boonに2003年12月16日に与えられた米国特許第6665445号は、イメージ伝送用のデータ構造、フラットイメージコーディング方法、およびフラットイメージデコーディング方法を保護する。このデコーディング方法は、2つの部分からなり、第1部分は、イメージ形式情報データストリームを分類し、第2部分は、イメージデータストリームの画素値に関するデコーディングプロセスであり、両方の部分を、フラットイメージ信号コーディングに従って切り替えることができる。
【0022】
Moutin他に2004年1月13日に与えられた米国特許第6678331号は、共用メモリを使用するMPEGデコーダを保護する。実際には、回路に、マイクロプロセッサ、フラットイメージシーケンスをデコードするMPEGデコーダ、マイクロプロセッサ用の共通メモリ、およびデコーダが含まれる。この回路に、デコーダ遅延を評価する回路と、マイクロプロセッサまたはデコーダに関するメモリ優先順位を判定する制御回路も含まれる。
【0023】
Fergusonに2004年1月13日に与えられた米国特許第6678424号は、リアルタイムヒューマンビジョンシステムの挙動モデルを保護する。実際には、このモデルは、異なるチャネル内の、一方が他方から導出される、2次元の2つのイメージ信号を処理する。
【発明の概要】
【0024】
本発明の目的は、ソフトウェアの変更およびハードウェアの変更からなる、立体3Dビデオイメージディジタルデコーディングのシステムおよび方法を提供することである。
【0025】
本発明の追加の目的は、通常のvideo_sequenceプロセスが、コーディングされたイメージデータすなわち、variable_length_decoding(VLD)、inverse_scan、inverse_quantization、inverse_discrete_cosine_transform(IDCT)、およびmotion_compensationに適用されるデコーディング方法を提供することである。
【0026】
本発明のもう1つの目的は、ビデオフォーマットの識別のデコーディング、2DイメージMPEG2後方互換性、TDVision(登録商標)タイプイメージの区別、最後のイメージバッファの保管、情報デコーディングの適用、誤り訂正の適用、および各々のチャネルバッファへの結果の保管に関するソフトウェア情報の変更を行うことである。
【0027】
本発明のもう1つの目的は、TDVision(登録商標)タイプイメージが見つかった時に、最後の完全なイメージのバッファが左または右のチャネルバッファに保管される形で、video_sequenceプロセスの通常の形を有するデコーディング方法を提供することである。
【0028】
本発明のもう1つの目的は、2つの互いに依存する(異なる)ビデオ信号を同一のvideo_sequence内で送ることができ、その情報デコーディングがBタイプフレームとして適用され、保管される、デコーディングプロセスを提供することである。
【0029】
本発明のもう1つの目的は、動きベクトルおよび色訂正ベクトルが適用される時に、誤り訂正が最後に得られたイメージに適用されるデコーディングプロセスを提供することである。
【0030】
本発明のもう1つの目的は、2つの独立のプログラムストリームを同時に受け取り、分類するためにソフトウェアによってデコーダをプログラムすることである。
【0031】
本発明のもう1つの目的は、二重出力バッファがアクティブ化されるハードウェアを介して3Dイメージ情報をデコードするデコーディングシステムを提供することである。
【0032】
本発明のもう1つの目的は、イメージデコーディングセレクタを並列に差によってアクティブ化する、3Dイメージ情報のデコーディングシステムを提供することである。
【0033】
本発明のもう1つの目的は、圧縮解除プロセスを実行し、対応する出力バッファを表示する、3Dイメージ情報デコーディングシステムを提供することである。
【図面の簡単な説明】
【0034】
【図1】本発明の対象目的が関係するテクノロジマップを表す。
【図2】本プロセスのステップの概要が示された流れ図を示す。
【図3】ビットレベルでTDVision(登録商標)テクノロジイメージタイプを識別するための、変更されなければならない構造と、データストリームのvideo_sequenceとの概略を示す。
【図4】TDVision(登録商標)デコーディング方法のコンパイルソフトウェアフォーマット(40)を示す。
【図5】ハードウェアセクションでのデコーディングコンパイルフォーマットを示す。
【発明を実施するための形態】
【0035】
ハードウェアとソフトウェアアルゴリズムの組合せは、立体3Dイメージ情報圧縮を可能にし、この情報は、立体対識別子を有する2つの同時プログラムを送り、したがってコーディング−デコーディングプロセスをはかどらせることによって、3Dvision(登録商標)カメラから来る左右の信号に対応する2つの独立だが同一のtime_codeを有するビデオ信号として受け取られる。また、2つの互いに依存するビデオ信号を、その差を入手することによって処理することができ、この差は、イメージタイプ識別子を有する「B」タイプフレームとして保管される。コーディングプロセスは、技術開発を促進するためにオープンにされているので、このデコーディングプロセスすなわち、コーディングされたデータに可変長デコーディングを適用し(実質的な削減が得られるが、ルックアップテーブルを使用してデコーディングを実行しなければならない)、逆スキャンプロセスを適用し、各データにスカラをかける逆量子化プロセスを適用し、逆コサイン変換関数を適用し、誤り訂正または動き補償ステージを適用し、デコードされたイメージを最終的に得ることに従うことだけが必要である。
【0036】
構造および動作方法に関する本発明の新規の特性は、添付明細書と一緒に添付図面の説明からよりよく理解されるが、添付図面では、類似する符号が類似する部分およびステップを指す。
【0037】
図1は、本発明の対象目的が関係するテクノロジマップを表す。図1には、立体3Dイメージのコーディングおよびデコーディングのシステムと、対応する方法とが示されている。イメージは、立体カメラ(32)から来て、情報は適当なシステム(30)または(33)でコンパイルされ(31)、表示される。情報は、(34)でコーディングされ、これを、(35)などの適当な以前のデコーディングステージを有するシステムに伝送することができ、(35)は、ケーブルシステム(36)、衛星システム(37)、高品位テレビジョンシステム(38)、またはTDVision(登録商標)社の3DVisors(登録商標)(39)などの立体視システムとすることができる。
【0038】
図2に、本プロセスのステップの概要が示された流れ図を示す。目的は、現在のMPEG2デコーダに対する変更と、デコーディングプロセス(2)のソフトウェア(3)およびハードウェア(4)に対する変更を行うことによってディジタルビデオストリームから3次元イメージを得ることであり、デコーダ(1)は、MPEG2−4と互換でなければならない。
【0039】
図3は、ビットレベルでTDVision(登録商標)テクノロジイメージタイプを識別するための、変更されなければならない構造と、データストリームのvideo_sequenceとの概略を示す。
【0040】
デコーディングプロセスのステージのそれぞれを、下で詳細に説明する(20)。
【0041】
コーディングされたデータ(10)は、ブロック情報、マクロブロック、フィールド、フレーム、およびMPEG2フォーマットビデオイメージを有するバイトである。
【0042】
Variable_length_decoding(11)(VLC、可変長デコーダ)は、最も頻繁なパターンがより短いコードによって置換され、頻繁に発生しないパターンがより長いコードによって置換される圧縮アルゴリズムである。この情報の圧縮された版は、より少ないスペースを占め、ネットワークによってより高速に伝送することができる。しかし、これは、簡単に編集可能なフォーマットではなく、ルックアップテーブルを使用する圧縮解除を必要とする。
【0043】
たとえば、語BEETLEは、次のようになる
文字 ASCIIコード VLS
B 0100 0010 0000 0010 10
E 0110 0101 11
L 0110 1100 0001 01
T 0111 0100 0100
【0044】
したがって、この語のASCIIコードは、0100 0010 0110 0101 0110 0101 0111 01000 0110 1100 0110 0101であり、VLCでは0000 0010 10 11 11 0100 00010 01 11である。
【0045】
実質的な減少が認められるが、VLCから語「Beetle」に戻すためには、ルックアップテーブル内の検索が、ビットストリームをデコードするために必要であり、これは、読取ビットの正確な比較によって行われる。
【0046】
逆スキャン(12):情報を、ブロックによってグループ化しなければならず、VLCを用いて情報をコーディングすることによって、線形ストリームが得られる。ブロックは、8×8データ行列であり、したがって、線形情報を正方形の8×8行列に変換する必要がある。これは、プログレッシブイメージまたはインターレースイメージのどちらであるかに応じて、両方のシーケンスタイプで上から下、左から右への降下するジグザグの形で行われる。
【0047】
逆量子化(13):これは、単純に、各データ値に係数をかけることからなる。分類された時に、ブロック内のデータの大半が、人間の目が知覚できない情報を除去するために量子化され、この量子化は、より大きいMPEG2ストリーム変換を得ることを可能にし、デコーディングプロセスで逆プロセス(逆量子化)を実行することも必要とする。
【0048】
逆コサイン変換(14)(IDCT、inverse_discrete_cosine_transform):各ブロック内で処理されるデータは、周波数領域に関係し、この逆コサイン変換は、空間領域のサンプルに戻すことを可能にする。IDCTでデータを変換したならば、画素、色、および色訂正を得ることができる。
【0049】
動き補償(15)は、MPEGフォーマットのデコーディングステージの前に生成されたいくつかの誤りを訂正することを可能にし、動き補償は、基準として前のフレームをとり、画素に関する動きベクトルを計算し(4つまでのベクトルを計算することができる)、これらを使用して新しいイメージを作成する。この動き補償は、PタイプイメージおよびBタイプイメージに適用され、ここで、イメージ位置が、基準イメージからの「t」時間に対して突き止められる。動き補償のほかに、誤り訂正も適用される。というのは、特定の画素の位置を予測することは不十分であり、その色の変化も存在し得るからである。したがって、デコードされたイメージが得られる(16)。
【0050】
PタイプイメージまたはBタイプイメージをデコードするために、基準イメージがとられ、動きベクトルが、代数的に加算されて、次のイメージが計算され、最後に、誤り訂正データが適用され、したがって、デコードされたイメージが成功裡に生成される。実際には、video_sequence内で、2つの互いに依存するビデオ信号「R−L=デルタが存在し、デルタ差は、TDVision(登録商標)識別子を有するBタイプ立体対フレームとして保管されるものであり、デコーディングの瞬間に、イメージからの差によって構成される。すなわち、R−delta=LおよびL−delta=Rであり、左イメージは、右イメージとの差から構成され、右イメージは、左イメージとの差から構成される。
【0051】
前のプロセスは、左または右の信号がとられ、両方が一時バッファに保管され、その後、左信号と右信号の間の差が計算され、その後、前記イメージからの差によって後にデコードされる、video_sequenceに保管されたBタイプイメージとしてコーディングされる形で概要を示された。
【0052】
デコーディングプロセスでは、VLCステージによって入力されたデータが、同一ステージによって出力されるデータよりはるかに小さいことを演繹することができる。
【0053】
MPEGビデオシーケンス構造 これは、MPEG2フォーマットで使用される最大の構造であり、次のフォーマットを有する。
ビデオシーケンス(Video_Sequence)
シーケンスヘッダ(Sequence_Header)
シーケンス拡張(Sequence_Extension)
ユーザデータ(0)および拡張(Extension_and_User_Data(0))
イメージグループヘッダ(Group_of_Picture_Header)
ユーザデータ(1)および拡張(Extension_and_User_Data(1))
イメージヘッダ(Picture_Header)
コーディングされたイメージ拡張(Picture_Coding_Extension)
ユーザデータ(2)および拡張(Extension_and_User_Data(2))
イメージデータ(Picture_Data)
スライス(Slice)
マクロブロック(Macroblock)
動きベクトル(Motion_Vectors)
コーディングされたブロックパターン(Coded_Block_Pattern)
ブロック(Block)
最終シーケンスコード(Sequence_end_Code)
【0054】
これらの構造が、ビデオシーケンスを構成する。ビデオシーケンスは、MPEGフォーマットについて適用され、各バージョンを区別するために、シーケンスヘッダの直後にシーケンス拡張が存在することの検証がなければならず、シーケンス拡張がヘッダに続かない場合には、そのストリームはMPEG1フォーマットである。
【0055】
ビデオシーケンスの始めに、sequence_headerおよびsequence_extensionがvideo_sequenceに現れる。sequence_extensionは、最初の試行で同一でなければならず、sequence_headerの「s」回の反復は、最初の出現と比較してほとんど変化せず、量子化行列を定義する部分だけが変化しなければならない。シーケンス反復を有することによって、ビデオストリームへのランダムアクセスが可能になる、すなわち、デコーダがビデオストリームの途中から再生を開始することを望む場合に、これを行うことができる。というのは、次のイメージをデコードするために、その瞬間の前のsequence_headerおよびsequence_extensionを見つけることだけが必要になるからである。これは、伝送時刻の後に同調された衛星デコーダなど、先頭から開始できないビデオストリームについても発生する。
【0056】
フルビデオ信号コーディング−デコーディングプロセスは、次のステップからなる。
ビデオ信号をディジタル化すること。これは、NTSCフォーマット、PALフォーマット、またはSECAMフォーマットで行うことができる。
ディジタル形式でビデオ信号を保管すること
信号を送ること
ディジタルビデオストリームを物理媒体(DVD、VCD、MiniDV)に記録すること
信号を受け取ること
ビデオストリームを再生すること
信号をデコードすること
信号を表示すること
【0057】
適当なDSPによって処理されるメモリを2倍にし、8つまでの出力バッファを配置する可能性を有することが必須であり、これによって、TDVision(登録商標)社の3DVisor(登録商標)などのデバイスで立体イメージの以前の表現および同時表現が可能になる。
【0058】
実際には、たとえば、Texas Instruments社のTMS320C62X DSPの例示的な事例で、DSPのプログラミングAPIを呼び出す時に、2チャネルを初期化しなければならない。
MPEG2VDEC_create(const IMPEG2VDEC_fxns*fxns,const MEPG2VDEC_Params* params)
【0059】
ここで、IMPEG2VDEC_fxns y MEPG2VDEC_Paramsは、各ビデオチャネルの動作パラメータを定義するポインタ構造であり、たとえば、
3DLhandle=MPEG2VDEC_create(fxns3DLEFT,Params3DLEFT)
3DRhandle=MPEG2VDEC_create(fxns3DRIGHT,Params3DRIGHT
である。
【0060】
これによって、左右の立体チャネルごとに1つずつの、2つのビデオチャネルをデコードできるようになり、2つのビデオハンドラが得られる。
【0061】
二重表示出力バッファが必要であり、ソフトウェアによって、AP関数を呼び出すことによって、2つのバッファのうちのどちらが出力を表示しなければならないかが定義される。
すなわち、MPEG2VDEC_APPLY(3DRhandle,inputR1,inputR2,inputR3,3doutright_pb,3doutright_fb)
MPEG2VDEC_APPLY(3DLhandle,inputL1,inputL2,inputL3,3doutleft_pb,3doutleft_fb)
【0062】
これと同一の手順を、類似する機能を有するすべてのDSP、マイクロプロセッサ、または電子デバイスについて実施することができる。
【0063】
ここで、3DLhandleは、DSPの作成関数によって返されるハンドルへのポインタであり、input1パラメータは、FUNC_DECODE_FRAMEまたはFUNC_START_PARAのアドレスであり、input2は、外部入力バッファアドレスへのポインタであり、input3は、外部入力バッファのサイズである。
【0064】
3doutleft_pbは、パラメータバッファのアドレスであり、3doutleft_fbは、デコードされたイメージが保管される出力バッファの先頭である。
【0065】
timecodeおよびtimestampは、順次同期式の形での最終デバイスへの出力に使用される。
【0066】
DSPによって処理されるメモリを2倍にし、8つまでの出力バッファを配置する可能性を有することが必須であり、これによって、TDVision(登録商標)Corporation社の3DVisor(登録商標)などのデバイスで立体イメージの以前の表示および同時表示が可能になる。
【0067】
ソフトウェアプロセスおよびハードウェアプロセスの統合は、DSPと称するデバイスによって実行され、このDSPは、ハードウェアプロセスのほとんどを実行する。これらのDSPは、製造業者によって供給されるC言語およびアセンブリ言語のハイブリッドによってプログラムされる。各DSPは、DSP内に置かれ、ソフトウェアによって呼び出される関数リストまたは手続き呼出しからなる、それ自体のAPIを有する。
【0068】
この参照情報を用いて、MPEG2フォーマット互換3Dイメージデコーディングに関する本願が作られる。
【0069】
実際には、ビデオシーケンスの始めに、シーケンスヘッダ(sequence_header)およびシーケンス拡張が必ず現れる。シーケンス拡張の反復は、最初と同一でなければならない。対照的に、シーケンスヘッダ反復は、最初の出現と比較してほとんど変化せず、量子化行列を定義する部分だけが変化しなければならない。
【0070】
図4に、TDVision(登録商標)デコーディング方法のコンパイルソフトウェアフォーマット(40)を示すが、ここで、sequence_header(42)内でディジタル立体イメージビデオストリームのvideo_sequence(41)が識別され、これは、依存または独立(平行イメージ)とすることができる。イメージがTDVision(登録商標)である場合に、2重バッファがアクティブ化され、aspect_ratio_informationの変更が識別される。ここで見つけることができる、イメージに対応する情報が、user_data(43)に読み取られる。sequence_scalable_extension(44)は、それとベースレイヤとエンハンスメントレイヤとに含まれる情報を定義し、video_sequenceをここで突き止めることができ、scalable_modeおよびレイヤ識別子を定義し、extra_bit_picture(45)は、picture_estructureおよびpicture_headerを定義し、picture_coding_extension(46)は、「B」タイプイメージを読み取り、それがTDVision(登録商標)タイプイメージである場合に、第2バッファをデコードする。picture_temporal_scalable_extension()(47)は、時間スケーラビリティを有する場合に、Bタイプイメージをデコードするのに使用される。
【0071】
すなわち、シーケンスヘッダ(sequence_header)は、ビデオストリームに対する上位情報レベルを提供し、わかりやすくするために、それぞれに対応するビット数も示され、上位ビットは、シーケンス拡張(Sequence_Extension)構造内に置かれ、次の構造によって形成される。
【表1】


【表2】

【0072】
Picture_temporal_scalable_extension()
時間スケーラビリティを有する場合に、2つの空間解像度ストリームが存在し、下レイヤは、ビデオフレームのより小さいインデックスの版を提供し、上レイヤは、同一ビデオのフレームのより大きいインデックスの版を導出するのに使用することができる。時間スケーラビリティは、低品質、低コスト、または無料のデコーダによって使用することができ、より高いフレーム毎秒は、有料で使用される。
【表3】

【0073】
イメージ空間スケーラビリティの場合に、エンハンスメントレイヤにデータが含まれ、このデータは、ベースレイヤのよりよい解像度を可能にし、したがって、ベースレイヤのよりよい解像度を再構築することができる。エンハンスメントレイヤが、動き補償の基準としてのベースレイヤの関数として使用される時に、エンハンスメントレイヤのより高い解像度を得るために、下レイヤをエスカレートし、オフセットしなければならない。
【表4】

【0074】
EXTENSION_AND_USER_DATA(2)
イメージは、
DVD(ディジタル多用途ディスク)
DTV(ディジタルテレビジョン)
HDTV(高品位テレビジョン)
ケーブル(DVB、ディジタルビデオ放送)
衛星(DDS、ディジタル衛星システム)
で表示することができ、これはソフトウェアプロセスとハードウェアプロセスの統合である。
【0075】
図5のハードウェアセクションでのデコーディングコンパイルフォーマット(50)は、DSP入力メモリに複製され、それと同時に、立体TDVision(登録商標)カメラによって撮影された左右の立体の既存信号に対応する2つの独立のまたは依存するビデオ信号の同時入力が許容される。この手順では、video_sequence(51)が、左右のフレームを交番させるかこれらを並列に送るために検出され、sequence_header(52)識別、イメージタイプ(53)が識別され、通常ビデオストリーム(54)に渡され、次に、誤り訂正プロセス(55)にサブミットされ、ビデオイメージ情報が、出力バッファ(56)に送られ、出力バッファ(56)は、この情報を共用し、ビデオストリーム情報が3Dまたは2Dで表示される前記チャネル内の左チャネル(57)および右チャネル(58)に分配する。
【0076】
2つの独立だが同一のtime_codeに同期化されたビデオストリームとしての同時形式でL(左)とR(右)の両方のビデオストリームを保管することにあり、したがって、これらを、後にデコードし、より大きい出力バッファ内で並列に再生することができる。これらを、従属とし、差によって分類解除(decodify)することもできる。
【0077】
ハードウェアに関して、プロセスのほとんどが、DSP(ディジタル信号プロセッサ)と称するデバイスによって実行される。例として、たとえば、Motorola社のモデルおよびTexas Instruments社のモデル(TMS320C62X)を使用することができる。
【0078】
これらのDSPは、当の製造業者によって供給されるC言語およびアセンブリ言語のハイブリッドによってプログラムされる。各DSPは、DSP内に置かれ、ソフトウェアによって呼び出される関数リストまたは手続き呼出しからなる、それ自体のAPIを有する。この参照情報から、3Dイメージがコーディングされ、このコードは、MPEG2フォーマットおよびそれ自体のコーディングアルゴリズムと互換である。情報がコーディングされる時に、DSPは、MPEG2圧縮されたビデオストリームを形成するために、予測プロセス、比較プロセス、量子化プロセス、およびDCT関数適用プロセスを実行する責任を負う。
【0079】
ディジタルビデオストリームから3次元イメージを得るために、デコーディングプロセスの異なる部分のソフトウェア変更およびハードウェア変更によって、現在のMPEG2デコーダに対するある種の変更が行われた。ビデオデータストリームの構造およびvideo_sequenceを、TDVision(登録商標)テクノロジイメージタイプをビットレベルで識別するのに必要なフラグを含めるために変更しなければならない。
【0080】
この変更は、次のデコーディングステップで行われる。
【0081】
ソフトウェア
−ビデオフォーマット識別。
− TDVision(登録商標)ビデオでない場合のMPEG2後方互換性のための論理「and」の適用。
− video_sequenceをスキャンする、通常の形(前の技法)でのイメージデコーディング。
− TDVision(登録商標)タイプイメージの場合に、
_ それらが従属または独立のどちらのビデオ信号であるかの区別。
_ 最後の完全なイメージバッファを左または右のチャネルバッファに保管する。
_ Bタイプフレーム情報デコーディングを適用する。
_ 動きベクトルおよび色訂正ベクトルを適用することによって、最後に得られたイメージに誤り訂正を適用する。
_ その結果を各々のチャネルバッファに保管する。
_ ビデオシーケンス読取を継続する。
【0082】
ハードウェア
情報がハードウェアを介してデコードされる時に、
_イメージが2Dまたは3Dのどちらであるかを区別する。
_二重出力バッファをアクティブ化する(メモリを増やす)。
_差デコーディングセレクタをアクティブ化する。
_平行デコーディングセレクタをアクティブ化する。
_圧縮解除プロセスを実行する。
_イメージをそれに対応する出力バッファ内で表示する。
【0083】
次の構造、副構造、およびシーケンスドは、特定の形で使用され、MPEG2後方互換TDVision(登録商標)テクノロジのハードウェア実施のvideo_sequence構造に属する。
実際には、
Sequence_header
Aspect_ratio_information
1001 TDVision(登録商標)で該当なし
1010 TDVision(登録商標)の4:3
1011 TDVision(登録商標)の16:9
1100 TDVision(登録商標)の2.21:1
【0084】
0111との論理「and」を実行して、2Dシステムとの後方互換性を得るが、これが行われる時に、立体対(左または右)のバッファをソースに対して等しくしなければならないことの指示がDSPに送られ、したがって、デコードされるすべてのイメージが、すべてのデバイスでのイメージ表示を可能にするために両方の出力バッファに送られる。
Frame_rate_code
1001 TDVision(登録商標)フォーマットの24000/101 (23.976)
1010 TDVision(登録商標)フォーマットの24
1011 TDVision(登録商標)フォーマットの25
1100 TDVision(登録商標)フォーマットの30000/1001 (29.97)
1101 TDVision(登録商標)フォーマットの30
1110 TDVision(登録商標)フォーマットの50
1111 TDVision(登録商標)フォーマットの60000/1001 (59.94)
【0085】
2Dシステムとの後方互換性を得るために、0111との論理「and」を実行する。
User_data()
Sequence_scalable_extension
Picture_header
Extra_bit_picture
0=TDVision(登録商標)
1=通常
Picture_coding_extension
ピクチャ構造
00=TDVision(登録商標)フォーマットのイメージ
Picture_temporal_scalable_extension()
【0086】
情報をコーディングする瞬間に、DPSが使用され、このDPSは、予測プロセス、比較プロセス、および量子化プロセスを実行する責任を負い、DCTを適用してMPEG2圧縮されたビデオストリームを形成し、2Dイメージと3Dイメージの間で区別する。
【0087】
2つのビデオ信号が、独立だが同一のtime_codeを有する形式でコーディングされ、これらの信号は、3DVision(登録商標)カメラから来る左信号および右信号に対応し、両方のプログラムがTDVision(登録商標)立体対識別子と共に同時に送られる。このタイプのデコーディングは、「平行イメージによる(by parallel images)」と称し、左と右(LとR)の両方のビデオストリームを2つの独立だがtime_code同期化されたビデオストリームとして同時に保管することにある。これらは、後に、並列にデコードされ、再生される。デコーディングソフトウェアだけをデコードする必要があり、トランスポートストリームのコーディングおよび圧縮アルゴリズムは、現在のものと同一である。
【0088】
デコーダでのソフトウェア変更
【0089】
デコーダでは、この例の事例ではTMS320C62XファミリのTexas Instruments社のDSPの使用でプログラミングAPIに従って、2つのプログラムストリームまたは、2つの互いに依存するビデオ信号すなわち識別子と共にBタイプフレームとして保管された両方の間の差から構成されたビデオ信号を、同時にプログラムしなければならない。
【0090】
DSPのプログラミングアルゴリズムおよび方法
−DSPを始動する時に2つのプロセスチャネル(主バッファおよび副バッファまたはAPIを呼び出す時には左右)を作成する。
−各チャネルのRAMメモリポインタ(メモリマップ内のRAMアドレス)を得る。
−TDVision(登録商標)タイプビデオシーケンスを得た時に
これをBタイプと解釈し
イメージをリアルタイムでデコードし
変更または差を相補バッファに適用し
結果を副バッファに保管する。
【0091】
video_sequenceデータストリームでソフトウェアに関して、次の2つのオプションが実施される。
1.一方は、ソフトウェアだけを変更し、user_data()セクションを使用して、立体信号を再生成できるようにする誤り訂正を保管する。
2.他方は、ハードウェアによってPICTURE_DATA3D()関数をイネーブルし、この関数は、MPEG2互換リーダに透過的であり、TDVision(登録商標)互換DSPによってデコードすることができる。
【0092】
MPEG2デコーダは、user_data()コードを検出した瞬間に、3DVISION_START_IDENTIFIER=0X000ABCD 32ビット識別子を検索し、これは、コードを再作成するのが極端に高く、むずかしいか、データを表さない。次に、読み取るべき3Dブロック長を考慮に入れるが、これは32ビット「n」データである。この情報がUSER_DATA()内で検出された時に、特殊なデコーディング関数への呼出しが行われ、これが、その後、出力バッファと比較され、Bタイプフレームに関する通常の訂正として、video_sequenceの現在の読取オフセットすなわちnバイトから適用される。この訂正の出力が、他の出力アドレスに送られ、この出力アドレスは、電子表示デバイスに存在するものに追加されるビデオ出力に直接に関連する。
【0093】
PICTURE_DATA3D()構造が認識される場合に、直接にデコーダによる情報の読取に進むが、情報は第2出力バッファに書き込まれ、第2出力バッファは、電子表示デバイスに存在するものに追加されるビデオ出力にも接続される。
【0094】
プログラムストリームの場合に、2つの信号(左および右)が、time_codeによって同期化され、これらの信号は、十分な同時複数ビデオチャネルデコーディング能力を有するMPEGデコーダによって並列にデコードされるか、同一video_sequence内の2つの互いに依存するビデオ信号、たとえば「R−L=デルタ」を送ることができ、ここで、デルタは、立体対TDVision(登録商標)識別子と共に「B」タイプフレームとして保管された差であり、2つの信号は、前述のTexas Instruments社のDSPの場合と同様に、イメージからの差によってデコーディングの瞬間に再構成することができる、すなわち、「R−デルタ=L」または「L−デルタ=R」であるが、これは、例示的であって制限的な例ではないと考えられる。
【0095】
単一のビデオシーケンスを含むビデオも、実施されるが、60フレーム毎秒で左右のフレームが交番し(それぞれ30フレーム)、デコードされた時に、ビデオバッファイメージが対応する左チャネルまたは右チャネルに置かれる。
【0096】
ハードウェアを介して、信号がTDVision(登録商標)タイプであるかどうかを検出する能力もあり、そうである場合には、その信号がトランスポートストリーム、プログラムストリーム、または60フレーム毎秒の左右多重化であるかどうかが識別される。
【0097】
トランスポートストリームの場合に、後方互換性システムが、3D特性なしで2Dでのみ同一のビデオを表示する能力を有する、現在のデコーダ内で使用可能であり、この場合に、DSPは、TDVision(登録商標)または以前の技法のデバイスでイメージを表示するためにディスエーブルされる。
【0098】
プログラムストリームの場合に、現在衛星伝送システムで使用されているものなどの無変更のコーダが使用されるが、レセプタおよびデコーダは、TDVision(登録商標)フラグ識別システムを有し、したがって、左右対を形成するために第2ビデオバッファをイネーブルする。
【0099】
最後に、多重化されたビデオの場合に、2つのビデオバッファ(左右)を有するMPEGデコーダがイネーブルされ、適当なフレームを識別し、各信号を30フレーム毎秒で分離し、したがって、フリッカレスイメージがもたらされ、ビデオストリームが一定なので、また、人間の目の特性保持波(characteristic retention wave)に起因して、多重化効果は知覚されない。
【0100】
本発明の特定の実施形態を図示し、説明したが、当業者には、本発明の範囲から逸脱せずに複数の修正または変更を作ることができることは明白であろう。そのような修正および変更のすべてが、添付の特許請求の範囲に含まれ、その結果、すべての変更および修正が、本発明の範囲に含まれるようになることが意図されている。

【特許請求の範囲】
【請求項1】
ユーザに対して立体デジタルビデオを表示するシステムであって、
第1の視野画像と第2の視野画像との差から導出されるデルタイメージが存在するか否かを示すデータをそれぞれが有する複数のヘッダと、それぞれが対応する前記ヘッダを有する複数の前記第1の視野画像とを有する一以上のビデオストリームを受信する受信手段と、
前記データを有する前記ヘッダを読み出して、前記一以上のビデオストリームが前記第1の視野画像と前記第2の視野画像との差から導出される前記デルタイメージも有するか否かを判定し、前記デルタイメージが存在することを前記ヘッダの前記データが示している場合には前記デルタイメージおよび前記第1の視野画像から前記第2の視野画像を構成するデコーダと、
前記第1の視野画像および前記第2の視野画像による立体デジタルビデオを出力するビデオ出力手段と、
を備えるシステム。
【請求項2】
前記システムが、ケーブルシステム、高品位テレビジョンシステム、衛星テレビジョンシステム、光ディスクシステム、DVDシステム、およびデジタルテレビシステムのうちの少なくとも一つの一部である、
請求項1に記載のシステム。
【請求項3】
前記一以上のビデオストリームがタイムコードを有する、
請求項1に記載のシステム。
【請求項4】
前記第1の視野画像のフレームおよび前記第2の視野画像のフレームが高品位ディスプレイまたは立体視覚システムに出力される、
請求項1に記載のシステム。
【請求項5】
前記デコーダが前記デルタイメージを前記第1の視野画像に加算することで前記第2の視野画像を構成する、
請求項1に記載のシステム。
【請求項6】
前記デコーダが前記ヘッダの所定のビット集合を読み出して、前記一以上のビデオストリームがデルタイメージを有するか否かを判定する、
請求項1に記載のシステム。
【請求項7】
前記デルタイメージが、デルタイメージに特有のビデオストリームデータ内に格納される、
請求項1に記載のシステム。
【請求項8】
前記デルタイメージがPタイプイメージまたはBタイプイメージのフレームを有する、
請求項1に記載のシステム。
【請求項9】
前記一以上のビデオストリームが複数のビデオストリームを有する、
請求項1に記載のシステム。
【請求項10】
前記デコーダが前記ヘッダおよび前記第1の視野画像を第1のビデオストリームから読み出し、前記デルタイメージを所定のデータ構造から読み出す、
請求項1に記載のシステム。
【請求項11】
前記デルタイメージが、前記第1の視野画像と前記第2の視野画像との差を測定することで算出される複数の動きベクトルを含む、
請求項1に記載のシステム。
【請求項12】
立体デジタルビデオを復号するシステムであって、
第1の視野画像と第2の視野画像との差から導出されるデルタイメージが存在するか否かを示すデータをそれぞれが有する複数のヘッダと、それぞれが対応する前記ヘッダを有する複数の前記第1の視野画像とを有する一以上のビデオストリームを受信する受信手段と、
前記データを有する前記ヘッダを読み出して、前記一以上のビデオストリームが前記第1の視野画像と前記第2の視野画像との差から導出される前記デルタイメージも有するか否かを判定し、前記デルタイメージが存在することを前記ヘッダの前記データが示している場合には前記デルタイメージおよび前記第1の視野画像から前記第2の視野画像を構成する構成手段と、
前記第1の視野画像および前記第2の視野画像による立体デジタルビデオを出力するビデオ出力手段と、
を備えるシステム。
【請求項13】
前記ビデオ出力手段が、前記立体デジタルビデオを高品位ディスプレイまたは立体視覚システムに出力する、
請求項12に記載のシステム。
【請求項14】
前記構成手段が、前記ヘッダおよび前記第1の視野画像を第1のビデオストリームから読み出し、前記デルタイメージを所定のデータ構造から読み出す、
請求項12に記載のシステム。
【請求項15】
前記構成手段が前記デルタイメージを前記第1の視野画像に加算することで前記第2の視野画像を構成する、
請求項12に記載のシステム。
【請求項16】
前記デルタイメージがPタイプイメージまたはBタイプイメージを有する、
請求項12に記載のシステム。
【請求項17】
前記一以上のビデオストリームがMPEG互換のビデオストリームである、
請求項12に記載のシステム。
【請求項18】
前記一以上のビデオストリームが複数のビデオストリームを有する、
請求項12に記載のシステム。
【請求項19】
前記デルタイメージが、デルタイメージに特有の所定の構造体に格納される、
請求項12に記載のシステム。
【請求項20】
前記第1の視野画像がPタイプイメージである、
請求項12に記載のシステム。
【請求項21】
前記構成手段がディジタル信号プロセッサにより実行される、
請求項12に記載のシステム。
【請求項22】
前記デルタイメージが、前記第1の視野画像と前記第2の視野画像との差を測定することで算出される複数の動きベクトルを含む、
請求項1に記載のシステム。
【請求項23】
立体デジタルビデオを復号する方法であって、
第1の視野画像と第2の視野画像との差から導出されるデルタイメージが存在するか否かを示すデータをそれぞれが有する複数のヘッダと、それぞれが対応する前記ヘッダを有する複数の前記第1の視野画像とを有する一以上のビデオストリームを受信する受信ステップと、
前記データを有する前記ヘッダを読み出して、前記一以上のビデオストリームが前記第1の視野画像と前記第2の視野画像との差から導出される前記デルタイメージも有するか否かを判定し、前記デルタイメージが存在することを前記ヘッダの前記データが示している場合には前記デルタイメージおよび前記第1の視野画像から前記第2の視野画像を構成する構成ステップと、
前記第1の視野画像および前記第2の視野画像による立体デジタルビデオを出力する出力ステップと、
を含む方法。
【請求項24】
前記立体デジタルビデオが高品位ディスプレイまたは立体視覚システムに出力される、
請求項23に記載の方法。
【請求項25】
前記ヘッダおよび前記第1の視野画像が第1のビデオストリームから読み出され、前記デルタイメージが所定のデータ構造から読み出される、
請求項23に記載の方法。
【請求項26】
前記デルタイメージが前記第1の視野画像に加算されることで前記第2の視野画像が構成される、
請求項23に記載の方法。
【請求項27】
前記一以上のビデオストリームがMPEG互換のビデオストリームである、
請求項23に記載の方法。
【請求項28】
前記デルタイメージがPタイプイメージまたはBタイプイメージを有する、
請求項27に記載の方法。
【請求項29】
前記一以上のビデオストリームが複数のビデオストリームを有する、
請求項23に記載の方法。
【請求項30】
前記デルタイメージが、デルタイメージに特有の所定の構造体に格納される、
請求項23に記載の方法。
【請求項31】
前記第1の視野画像がPタイプイメージである、
請求項23に記載の方法。
【請求項32】
前記デルタイメージが、前記第1の視野画像と前記第2の視野画像との差を測定することで算出される複数の動きベクトルを含む、
請求項23に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2011−193486(P2011−193486A)
【公開日】平成23年9月29日(2011.9.29)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−90295(P2011−90295)
【出願日】平成23年4月14日(2011.4.14)
【分割の表示】特願2007−500701(P2007−500701)の分割
【原出願日】平成16年2月27日(2004.2.27)
【出願人】(506210370)ティディヴィジョン コーポレイション エス.エー. デ シー.ヴィ. (6)
【Fターム(参考)】