説明

画像処理装置、情報記録媒体、および画像処理方法、並びにプログラム

【課題】MP4ファイルの格納データに対するデータ処理に必要となる情報をMP4ファイルの管理情報から取得可能とする構成を提供する。
【解決手段】MP4ファイルに格納されたデータの再生処理において実行する様々なデータ処理、例えば3次元画像表示処理や、暗号化データの復号処理など、様々な異なるカテゴリのデータ処理に適用する情報をMP4ファイルの管理情報中に階層化して記録する構成とした。この構成により、MP4ファイルに格納されたデータの再生、例えば暗号化された3次元画像データの表示処理などにおいて実行が必要となる異なるカテゴリのデータ処理の各々に必要となる様々な情報を、MP4ファイルの管理情報から確実に取得することが可能となり、スムーズなデータ再生処理が可能となる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、情報記録媒体、および画像処理方法、並びにプログラムに関する。さらに詳細には、3次元画像(3D画像)表示用の画像の記録や再生を行う画像処理装置、情報記録媒体、および画像処理方法、並びにプログラムに関する。
【背景技術】
【0002】
立体視可能な画像、いわゆる3次元画像(3D画像またはステレオ画像とも呼ばれる)を生成するためには、異なる視点から撮影した画像、すなわち左目用画像と右目用画像が必要となる。これらの異なる視点からの撮影画像を利用することで3次元画像の表示が可能となる。
【0003】
3次元画像(3D画像)の表示方式には様々な方式がある。例えば偏光フィルタや、色フィルタにより左右の眼各々によって観察する画像を分離するパッシブ眼鏡方式に対応した表示方式、あるいは、液晶シャッターを左右交互に開閉して観察する画像を左右の眼交互に時間的に分離するアクティブ眼鏡方式に対応した表示方式などがある。いずれの表示方式においても、左目用画像と右目用画像が利用される。
【0004】
3次元画像(3D画像)に限らず、カメラによって撮影された静止画や動画等の画像データはメディアに対する記録処理に際して、あるいはデータ送信に際して様々な符号化(圧縮)フォーマットに従って符号化される。すなわちデータ量を削減して記録あるいは送信される。
【0005】
符号化フォーマットには、例えば静止画符号化フォーマットを規定したJPEGや、主に動画を対象とした符号化フォーマットであるMPEGなど様々な規格がある。例えば引用文献1(特開2004−334833)の図10には、3次元静止画画像の記録処理に用いるフォーマット例が記載されている。
【0006】
昨今は、HD(High Definition)画像など高精細画像の利用が進み、圧縮率の高い符号化方式が利用されている。それらの符号化データの格納ファイル形式の1つの方式としてMP4ファイルフォーマット(ISO/IEC 14496-14)(以下、MP4という)がある。
MP4は、MPEG(Moving Picture Experts Group)4形式の圧縮動画データの格納ファイル形式である。MP4はISO/IEC14496に規定された規格である。MP4はMPEG−4形式の動画のみならず、MPEG−2やMPEG−1の動画、AACやMP3などの音声、JPEGやPNGなどの静止画など、様々な形式の画像および音声データを格納可能としたフォーマットである。
【0007】
このようにMP4ファイルには様々な形式の符号化データを格納可能であり、MP4では、MP4ファイルに格納した符号化データの形式や種類についての管理情報を記録する領域が設定されている。符号化データの復号処理を行なう場合には、MP4ファイル内の管理情報の確認処理が実行される。
【0008】
しかし、現行のMP4フォーマットの管理情報規定には、MP4ファイルに格納された画像が3次元(3D)画像であるのか、2次元(2D)画像であるかを識別するための情報の格納領域が規定されていないという問題がある。
【0009】
MP4ファイルを記録メディアから読み出して再生しようとする装置、あるいは通信手段を介して受信して再生しようとする装置は、MP4ファイルの管理情報から格納画像が3次元(3D)画像であるのか、2次元(2D)画像であるかを識別することができない。従って、実際に画像を取得し解析または再生しなければ3次元画像データであるか2次元画データであるかが把握できない。結果として例えば3次元画像の表示機能を持たない表示装置に3次元画像データが誤って表示されてしまうといった事態が発生する。
【0010】
また、上述したように3次元画像の表示方式には様々な方式があるが、再生装置や表示装置の多くは、一部の方式のみに対応した画像再生または表示が可能な構成を持つ。従って、現行のMP4フォーマットに従った管理情報のみでは、自装置において再生または表示可能な3次元画像であるか否かについての確認もできない。
すなわち、現行のMP4ファイルの管理情報のみでは、画像データを取得してデータ構成を確認するか、あるいは、実際に再生や表示処理を実行してみないと、自装置が処理可能なデータであるか否かについて確認できないといった問題がある。
【先行技術文献】
【特許文献】
【0011】
【特許文献1】特開2004−334833号公報
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明は、例えば、上述の問題点に鑑みてなされたものであり、MP4フォーマットに従ったファイルの管理情報中に、MP4ファイルに格納された画像データに3次元画像が含まれるか、あるいは3次元画像の方式等の3次元画像管理情報を記録する。この構成により、再生装置や表示装置において、MP4ファイルから実データを取得する以前に格納データが3次元画像であるか2次元画像であるかを把握可能とし、さらに3次元画像の方式等を確認することを可能として、誤った再生処理や表示処理を防止し、正しい再生処理を実行可能とした画像処理装置、情報記録媒体、および画像処理方法、並びにプログラムを提供することを目的とするものである。
【0013】
また、本発明は、MP4ファイルに格納されたデータの再生処理において実行する様々なデータ処理、例えば上記の3次元画像表示処理の他、暗号化データの復号処理など、様々な異なるカテゴリのデータ処理に適用する情報をMP4ファイルの管理情報中に階層化して記録することで、各データ処理に必要となる情報を確実に提供することを可能とした画像処理装置、情報記録媒体、および画像処理方法、並びにプログラムを提供することを目的とするものである。
【課題を解決するための手段】
【0014】
本発明の第1の側面は、
画像データの符号化処理を実行するエンコード部と、
前記エンコード部の生成した符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを生成するファイル生成部を有し、
前記ファイル生成部は、
前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を生成し、複数のカテゴリ単位のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成する画像処理装置にある。
【0015】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データに3次元画像データが含まれるか否かを判別可能とした3次元画像管理情報である。
【0016】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式を判別可能とした3次元画像管理情報である。
【0017】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式が、
(a)フレームシーケンシャル方式、
(b)サイドバイサイド方式、
(c)トップアンドボトム方式、
上記(a)〜(c)のいずれの方式に従った3次元画像データであるかを判別可能とした3次元画像管理情報である。
【0018】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データの暗号化態様情報であり、前記ファイル生成部は、暗号化態様情報を含む第1のデータ構成情報と、3次元画像管理情報を含む第2のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成する。
【0019】
さらに、本発明の画像処理装置の一実施態様において、前記ファイル生成部は、MP4ファイルの生成を実行する構成であり、MP4ファイルのAVコーデックボックスの下位に前記データ構成情報を階層化して記録したファイルを生成する。
【0020】
さらに、本発明の画像処理装置の一実施態様において、前記ファイル生成部は、MP4ファイルのAVコーデックボックスの下位に前記データ構成情報を含むスキーム情報ボックスを階層化して記録したファイルを生成する。
【0021】
さらに、本発明の画像処理装置の一実施態様において、前記ファイル生成部は、MP4ファイルに格納する画像データの区分データであるトラック単位またはサンプル単位の区分データ単位で前記スキーム情報ボックスを設定して記録する処理を行う。
【0022】
さらに、本発明の第2の側面は、
画像データの符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを解析するファイル解析部と、
前記ファイルに格納された画像データの再生処理に際して複数の異なるカテゴリのデータ処理を実行するデータ処理部を有し、
前記ファイルの管理情報は、データ処理のカテゴリ単位で各処理の実行に必要となるデータ構成情報を階層化して記録した構成を有し、
前記ファイル解析部は、前記ファイルの管理情報の階層化されたデータ構成情報を取得し、
前記データ処理部は、前記ファイル解析部の取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行する画像処理装置にある。
【0023】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイルの格納画像データに3次元画像データが含まれるか否かを判別可能とした3次元画像管理情報である。
【0024】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式を判別可能とした3次元画像管理情報である。
【0025】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式が、
(a)フレームシーケンシャル方式、
(b)サイドバイサイド方式、
(c)トップアンドボトム方式、
上記(a)〜(c)のいずれの方式に従った3次元画像データであるかを判別可能とした3次元画像管理情報である。
【0026】
さらに、本発明の画像処理装置の一実施態様において、前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データの暗号化態様情報であり、前記ファイル解析部は、暗号化態様情報を含む第1のデータ構成情報と、3次元画像管理情報を含む第2のデータ構成情報を前記管理情報から取得する。
【0027】
さらに、本発明の画像処理装置の一実施態様において、前記ファイルは、MP4ファイルであり、前記ファイル解析部は、MP4ファイルのAVコーデックボックスの下位に階層化して記録されたスキーム情報ボックスから各データ処理カテゴリ単位のデータ構成情報を取得する。
【0028】
さらに、本発明の画像処理装置の一実施態様において、前記ファイル解析部は、MP4ファイルに格納された画像データの区分データであるトラック単位またはサンプル単位の区分データ単位で前記スキーム情報ボックスを取得する。
【0029】
さらに、本発明の第3の側面は、
画像データの符号化データと、該符号化データの管理情報を含むMP4ファイルを記録した情報記録媒体であり、
前記管理情報は、前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を階層化して記録した構成であり、
MP4ファイルを読み取り再生する装置において、階層化されたデータ構成情報を順次取得して、取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行することを可能としたことを特徴とする情報記録媒体にある。
【0030】
さらに、本発明の第4の側面は、
画像処理装置において実行する画像処理方法であり、
エンコード部が、画像データの符号化処理を実行するエンコード処理ステップと、
ファイル生成部が、前記エンコード部の生成した符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを生成するファイル生成ステップを有し、
前記ファイル生成ステップは、
前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を生成し、複数のカテゴリ単位のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成するステップを含む画像処理方法にある。
【0031】
さらに、本発明の第5の側面は、
画像処理装置において実行する画像処理方法であり、
ファイル解析部が、画像データの符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを解析するファイル解析ステップと、
データ処理部が、前記ファイルに格納された画像データの再生処理に際して複数の異なるカテゴリのデータ処理を実行するデータ処理ステップを有し、
前記ファイルの管理情報は、データ処理のカテゴリ単位で各処理の実行に必要となるデータ構成情報を階層化して記録した構成を有し、
前記ファイル解析ステップは、前記ファイルの管理情報の階層化されたデータ構成情報を取得するステップを含み、
前記データ処理ステップは、前記ファイル解析部の取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行するステップを含む画像処理方法にある。
【0032】
さらに、本発明の第6の側面は、
画像処理装置において画像処理を実行させるプログラムであり、
エンコード部に、画像データの符号化処理を実行させるエンコード処理ステップと、
ファイル生成部に、前記エンコード部の生成した符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを生成させるファイル生成ステップを有し、
前記ファイル生成ステップは、
前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を生成し、複数のカテゴリ単位のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成するステップを含むプログラムにある。
【0033】
さらに、本発明の第7の側面は、
画像処理装置において画像処理を実行させるプログラムであり、
ファイル解析部に、画像データの符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを解析させるファイル解析ステップと、
データ処理部に、前記ファイルに格納された画像データの再生処理に際して複数の異なるカテゴリのデータ処理を実行させるデータ処理ステップを有し、
前記ファイルの管理情報は、データ処理のカテゴリ単位で各処理の実行に必要となるデータ構成情報を階層化して記録した構成を有し、
前記ファイル解析ステップは、前記ファイルの管理情報の階層化されたデータ構成情報を取得するステップを含み、
前記データ処理ステップは、前記ファイル解析部の取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行するステップを含むプログラムにある。
【0034】
なお、本発明のプログラムは、例えば、様々なプログラム・コードを実行可能な情報処理装置やコンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体によって提供可能なプログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、情報処理装置やコンピュータ・システム上でプログラムに応じた処理が実現される。
【0035】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
【発明の効果】
【0036】
本発明の一実施例の構成によれば、MP4ファイルに格納されたデータの再生処理において実行する様々なデータ処理、例えば3次元画像表示処理や、暗号化データの復号処理など、様々な異なるカテゴリのデータ処理に適用する情報をMP4ファイルの管理情報中に階層化して記録する構成とした。この構成により、MP4ファイルに格納されたデータの再生、例えば暗号化された3次元画像データの表示処理などにおいて実行が必要となる異なるカテゴリのデータ処理の各々に必要となる様々な情報を、MP4ファイルの管理情報から確実に取得することが可能となり、スムーズなデータ再生処理が可能となる。
【図面の簡単な説明】
【0037】
【図1】MP4ファイルフォーマットの基本構成について説明する図である。
【図2】MP4ファイルのプロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例について説明する図である。
【図3】MP4ファイルのプロファイルボックス(uuid(PROF))に記録する3次元画像識別情報の具体的なフラグの設定例について説明する図である。
【図4】MP4ファイルのAVコーデックボックス(avc1)に3次元画像識別情報を記録する実施例について説明する図である。
【図5】フレームシーケンシャル方式[FS:Frame Sequential]に従ったデータ復元処理と再生処理方法を説明する図である。
【図6】サイドバイサイド方式[SbS:Side by Side]に従ったデータ復元処理と再生処理方法を説明する図である。
【図7】トップアンドボトム方式[T&B:Top&Bottom]に従ったデータ復元処理と再生処理方法を説明する図である。
【図8】AVコーデックボックス内に設定するステレオビデオ情報ボックスに記録する3次元画像詳細情報としてのフレーム構成情報のデータ設定例について説明する図である。
【図9】AVコーデックボックス内に設定するステレオビデオ情報ボックスに記録する3次元画像詳細情報としてのフレーム構成情報のデータ設定例について説明する図である。
【図10】MP4ファイルのAVコーデックボックスの拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像識別情報を記録する実施例について説明する図である。
【図11】MP4ファイルのAVコーデックボックスの拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像識別情報を記録する実施例について説明する図である。
【図12】本発明の画像処理装置の実行する画像データの記録処理シーケンスを説明するフローチャートを示す図である。
【図13】本発明の画像処理装置の実行する画像データの再生処理シーケンスを説明するフローチャートを示す図である。
【図14】本発明の画像処理装置の構成例について説明する図である。
【発明を実施するための形態】
【0038】
以下、図面を参照しながら、本発明の画像処理装置、情報記録媒体、および画像処理方法、並びにプログラムについて説明する。説明は以下の項目順に行う。
1.MP4ファイルフォーマットの基本構成について
2.3次元画像管理情報をMP4ファイルの管理情報中に記録する構成について
2A.(1)プロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例(実施例1)
2B.(2)AVコーデックボックス(avc1)に3次元画像詳細情報を記録する実施例(実施例2)
2C.(3)AVコーデックボックス(avc1)の拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像詳細情報を記録する実施例(実施例3)
3.画像処理装置の実行する画像処理シーケンスについて
4.本発明の画像処理装置の構成例について
【0039】
[1.MP4ファイルフォーマットの基本構成について]
まず、図1を参照して現行のMP4ファイルフォーマットの基本構成について説明する。前述したように、MP4は、MPEG(Moving Picture Experts Group)4形式の符号化データの格納ファイル形式であり、ISO/IEC14496に規定されている。MP4はMPEG−4形式の動画のみならず、MPEG−2やMPEG−1の動画、AACやMP3などの音声、JPEGやPNGなどの静止画など、様々な形式の画像および音声データを格納可能な構成を持つ。
【0040】
ISO/IEC14496に規定されたMP4ファイルフォーマットは、オブジェクト指向のデータ構造を有する。各オブジェクトはボックス(box)と呼ばれる。図1は一般的な画像および音声データからなるAV(Audio Video)データを格納したMP4ファイル100の構成例を示す図である。MP4ファイル100は、図1に示すように以下の各ボックスを有する。
(1)ファイルタイプボックス(ftyp)101、
(2)プロファイルボックス(uuid(PROF))102、
(3)ムービーボックス(moov)103、
(4)実データボックス(mdat)104、
これらのボックスを有する。
【0041】
(1)ファイルタイプボックス(ftyp)101には、ファイルタイプについての記録情報が含まれる。
(2)プロファイルボックス(uuid(PROF))102には、例えば、フレームレートなどのファイル情報が記録される。
(3)ムービーボックス(moov)103には、格納データの管理情報(メタデータ)が記録される。
(4)実データボックス(mdat)104には、符号化された(圧縮)画像や音声データなど実データが記録される。
【0042】
実際の再生対象となる画像データや音声データは、(4)実データボックス(mdat)104に格納される。(1)〜(3)の各情報、すなわち、ファイルタイプボックス(ftyp)101、(2)プロファイルボックス(uuid(PROF))102、(3)ムービーボックス(moov)103、これらの各ボックスには、実データの索引情報や属性情報等の管理情報が格納される。なお、属性情報には実データボックス(mdat)104に格納される実データの復号処理(伸張処理)に適用するための情報などが含まれる。また実データが暗号化されている場合は、その復号処理に適用する情報等も記録される。
【0043】
なお、ムービーボックス(moov)103には、実データボックス(mdat)104に格納された実データの区分データであるトラック単位で管理データ(メタデータ)が記録される。
トラックは、例えば、画像データに対応するビデオトラック、音声データに対応するオーディオトラック等がある。なお、日本語対応の第1オーディオトラック、英語対応の第2オーディオトラックなどの設定も可能である。また、異なる画像に対応する第1ビデオトラック、第2ビデオトラック等、細分化したトラック設定も可能である。
【0044】
なお、図1に示すムービーボックス(moov)103には、1つのトラック(trak(video track))に対応するメタデータを格納した1つのトラックボックス111のみを示しているが、これはトラックボックスの代表例を示したものである。実際には、ムービーボックス(moov)103には、図1に示すトラックボックス111と同じ形式のボックスがトラック数に応じて格納される。
【0045】
トラックボックス111には実データの区分領域として設定されるトラック単位のデータ対応のメタデータが記録される。
トラックボックス111内には、サンプルディスクリプションボックス(stsd)112、さらにその下位にAVコーデックボックス(avc1)113が格納される。
【0046】
トラックをさらに区分した領域がサンプルであり、1以上のサンプルによって1つのトラックが設定される。
すなわち実データは1以上のトラックによって構成され、1トラックはさらに1以上のサンプルによって構成される。
【0047】
図1には、トラックボックス111の中に1つのサンプルディスクリプションボックス(stsd)112を示している。トラックボックスには必ず1つのサンプルディスクリプションボックス(stsd)が存在する。
【0048】
サンプルディスクリプションボックス(stsd)112の下位ボックスが、AVコーデックボックス(avc1)113であり、AVコーデックボックス(avc1)113にサンプル対応の実データのコーデック詳細情報、すなわち、実データの要素であるサンプルの復号再生処理に必要とする詳細情報(コーデック情報)が記録される。なお、このAVコーデックボックス(avc1)113には、MP4の復号処理に関する情報のみならず、例えば暗号化態様に関する情報などの記録も可能である。
【0049】
MP4ファイルをDVD等のメディアから読み出して再生する装置、あるいはMP4ファイルを、通信手段を介して受信して再生する装置は図1に示す構成を持つMP4ファイルの管理情報、すなわち、ファイルタイプボックス(ftyp)101、プロファイルボックス(uuid(PROF))、ムービーボックス(moov)103の少なくともいずれかに格納された管理情報を読み取り、実データボックス(mdat)104に格納された実データの詳細について確認する。この管理情報の確認処理によってトラックおよびサンプル単位で詳細なコーデック情報を取得して、その情報に従った復号処理を実行する。このような処理によりMP4データの復号および再生処理を行うことができる。
【0050】
しかし、前述したように、現行のMP4フォーマットの管理情報には、MP4ファイルに格納された画像が3次元(3D)画像であるのか、2次元(2D)画像であるかを識別するための情報を記録する領域が規定されていない。
【0051】
従って、MP4ファイルを記録メディアから読み出して再生しようとする装置、あるいは通信手段を介して受信して再生しようとする装置は、実際に画像を取得し解析または再生しなければMP4ファイルの格納データが3次元画像データであるのか2次元画データであるのかを把握できない。結果として例えば3次元画像の表示機能を持たない表示装置に3次元画像データが誤って表示されてしまうといった事態が発生する。また、前述したように現行の管理情報のみでは自装置において再生または表示可能な3次元画像であるか否かについての確認もできない。
【0052】
このように現行のMP4のフォーマットを利用した場合、MP4ファイルに格納された画像が3次元画像である場合、実際に実データボックス(mdat)104から画像データを取得してデータ構成を確認するか、あるいは、実際に再生や表示処理を実行してみないと、自装置が処理可能なデータであるか否かについて確認できないといった問題がある。
【0053】
[2.3次元画像管理情報をMP4ファイルの管理情報中に記録する構成について]
以下では、上述した問題を解決する構成として、3次元画像についての管理情報をMP4ファイルの管理情報中に記録する複数の実施例について、以下説明する。
以下に示す3つの実施例について、順次説明する。
(1)プロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例(実施例1)
(2)AVコーデックボックス(avc1)に3次元画像識別情報を記録する実施例(実施例2)
(3)AVコーデックボックス(avc1)の拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像識別情報を記録する実施例(実施例3)
なお、これらの各実施例は単独の構成としても実施可能であるが、複数の実施例を組み合わせて利用する構成も可能である。
【0054】
[2A.(1)プロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例(実施例1)]
まず、図2を参照してプロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例について説明する。
【0055】
図2は、本実施例で提案するプロファイルボックス(uuid(PROF))に含まれるビデオ管理フラグ(video_attribute_flag)の上位16ビット(0001h〜0010h)の構成を示す図である。なお(h)は16進数の表記であることを意味している。
【0056】
図2に示すビデオ管理フラグ(video_attribute_flag)の上位16ビット中、前半(0001h〜0004h)のデータは、従来のMP4において既に規定されているフィールドであり、例えば以下のデータ領域として規定されている。
0001h:IDR(Instantaneous Decoder Refresh)フレーム間隔情報、
0002h:リカバリポイントSEIメッセージの有無情報、
これらはMP4の復号に適用する情報である。
0004h〜はリザーブ領域である。
【0057】
本実施例では、ビデオ管理フラグ(video_attribute_flag)の上位16ビット(0001h〜0010h)の後半部にMP4ファイルの実データボックス(mdat)(図1参照)に格納された画像データが3次元画像を含むか否かの情報を格納する。
【0058】
具体的には、図2に示すように以下の3次元画像識別情報を格納する。
0008h:ステレオビデオフラグ(stereo video flag)201、
0010h:ミックスステレオビデオフラグ(Mixed stereo video flag)202、
これらの各フラグを3次元画像識別情報として設定する。
【0059】
各フラグの値の具体的な内容について図3を参照して説明する。
MP4ファイルに格納される画像データの態様としては、図3に示すように3パターンある。
(a)MP4ファイルに格納された画像データが全て3次元画像(ステレオ画像)
(b)MP4ファイルに格納された画像データが全て2次元画像
(c)MP4ファイルに格納された画像データが3次元画像(ステレオ画像)と2次元画像の混在データ
これらの3パターンである。
【0060】
ステレオビデオフラグ201は、MP4ファイルに格納されたすべての画像データに3次元画像が含まれる場合はビット値=1、含まれない場合はビット値=0との設定とする。
従って、図3に示す
(a)MP4ファイルに格納された画像データが全て3次元画像(ステレオ画像)
この(a)の場合にのみ、ビット値=1となる。
また、
(b)MP4ファイルに格納された画像データが全て2次元画像
(c)MP4ファイルに格納された画像データが3次元画像(ステレオ画像)と2次元画像の混在データ
これら(b),(c)の場合はビット値=0となる。
【0061】
一方、ミックスステレオビデオフラグ202は、MP4ファイルに格納された画像データが3次元画像と2次元画像の混在データである場合はビット値=1、それ以外は、ビット値=0との設定とする。
従って、図3に示す
(c)MP4ファイルに格納された画像データが3次元画像(ステレオ画像)と2次元画像の混在データ
この(c)の場合にのみビット値=1となる。
また、
(a)MP4ファイルに格納された画像データが全て3次元画像(ステレオ画像)
(b)MP4ファイルに格納された画像データが全て2次元画像
これら(a),(b)の場合には、ビット値=0となる。
【0062】
これらのフラグ設定により、以下のデータ識別が可能となる。
(ケース1)
ステレオビデオフラグ=1、ミックスステレオビデオフラグ=0、
この場合は、
(a)MP4ファイルに格納された画像データが全て3次元画像(ステレオ画像)
であると判定する。
【0063】
(ケース2)
ステレオビデオフラグ=0、ミックスステレオビデオフラグ=0、
この場合は、
(b)MP4ファイルに格納された画像データが全て2次元画像
であると判定する。
【0064】
(ケース3)
ステレオビデオフラグ=0、ミックスステレオビデオフラグ=1、
この場合は、
(c)MP4ファイルに格納された画像データが3次元画像(ステレオ画像)と2次元画像の混在データ
であると判定する。
【0065】
このように、本実施例の構成により、MP4ファイルのプロファイルボックス(uuid(PROF))のビデオ管理フラグ(video_attribute_flag)に設けられたステレオビデオフラグ201と、ミックスステレオビデオフラグ202のフラグ設定を確認するのみで、MP4ファイルに格納された画像データの3次元画像情報を得ることができる。具体的には、MP4ファイルに格納された画像データが下記のいずれのタイプであるかを確認することが可能となる。
(タイプa)3次元画像のみから構成されている、
(タイプb)2次元画像のみから構成されている、
(タイプc)3次元画像と2次元画像の混在データである、
これらの各タイプを判別することが可能となる。
【0066】
なお、図3に示すビット値の設定例は一例であり、この逆のビット値の設定としてもよく、上記の各タイプの判別が可能なビット値設定とする様々な設定が可能である。
【0067】
MP4ファイルを記録メディアから読み出して再生しようとする装置、あるいは通信手段を介してMP4ファイルを受信して再生しようとする装置は、MP4ファイルの実データボックス(mdat)から実際に画像を取得する以前にプロファイルボックス(uuid(PROF))内に設定されたステレオビデオフラグ201と、ミックスステレオビデオフラグ202のフラグ設定を確認することで、MP4ファイルの格納データの3次元画像情報を取得することが可能となる。従って、例えば3次元画像の表示機能を持たない表示装置に3次元画像データが誤って表示されてしまうといった事態を防止できる。
【0068】
[2B.(2)AVコーデックボックス(avc1)に3次元画像詳細情報を記録する実施例(実施例2)]
次に、図4を参照してAVコーデックボックス(avc1)に3次元画像詳細情報を記録する実施例について説明する。
【0069】
なお、先に図1を参照して説明したように、AVコーデックボックス(avc1)は、ムービーボックス(moov)の下位のトラックボックス111のさらに下位のサンプルディスクリプションボックス(stsd)の下位に設定されるボックスである。
AVコーデックボックス(avc1)は、先に説明したように、実データボックス(mdat)に格納される実データを区分した区分データであるサンプルのコーデック情報等が記録されるボックスである。
【0070】
なお、この場合はトラックに含まれるサンプルの全てのコーデック情報がAVコーデックボックス(avc1)に設定されることになる。サンプルディスクリプションボックス(stsd)の下位には1または複数のAVコーデックボックス(avc1)の設定が可能である。ただし、内容が同じ場合は複数設定する必要はない。つまり、サンプル数とAVコーデックボックスの数は一致する必要はなく、サンプル数が複数でもAVコーデックボックスを1つとする設定などが可能である。
【0071】
本実施例2では、このAVコーデックボックス(avc1)に3次元画像詳細情報を記録する。図4に、本実施例に係るAVコーデックボックス(avc1)のデータ構成例を示す。
【0072】
図4に示すデータ領域301の情報は、従来のMP4ファイルフォーマットに既に規定されているコーデック情報格納領域である。このデータ領域301には、以下の各情報ボックスが設定される。
AVCConfigurationBox
MPEG4BitRateBox
MPEG4ExtentionDescriptorBox
これらのボックスにはMP4符号化データの復号処理に必要となる情報、すなわちコーデック情報が記録される。これらのコーデック情報は2次元画像にも3次元画像に共通に利用される。
【0073】
本実施例では、これら既存のコーデック情報ボックスに加え、図4に示すように、
ステレオビデオ情報ボックス(Stereo Video Description Box)302
を追加する。
ステレオビデオ情報ボックス302には、MP4ファイルの実データボックス(mdat)(図1参照)に格納された画像データに3次元画像が含まれるか否かの情報や、3次元画像が含まれる場合、その3次元画像データに関する詳細情報を記録する。詳細情報には例えば3次元画像の表示方式情報などが含まれる。
【0074】
前述したように、3次元画像(3D画像)の表示方式には様々な方式がある。例えば、偏光フィルタや、色フィルタにより左右の眼各々によって観察する画像を分離するパッシブ眼鏡方式に対応した方式、あるいは、液晶シャッターを左右交互に開閉して観察する画像を左右の眼交互に時間的に分離するアクティブ眼鏡方式に対応した方式などがある。例えばこれらの各表示方式に応じて、MP4ファイルに格納される記録データの記録形式も異なってくる。
ステレオビデオ情報ボックス302には、MP4ファイルの実データボックス(mdat)(図1参照)に格納された画像データがいずれの方式に対応した記録データであるかについての情報も含まれる。
【0075】
なお、3次元画像データの記録方式としては、例えば、
フレームシーケンシャル(Frame Sequential)方式、
サイドバイサイド(Side by Side)方式、
トップアンドボトム(Top&Bottom)方式、
などがある。
【0076】
フレームシーケンシャル(Frame Sequential)方式は、左目用画像(L画像)と右目用画像(R画像)のフレームをL、R、L、R、・・・と交互に記録した方式である。
サイドバイサイド(Side by Side)方式は、LR画像を1フレーム画像中の左右に分割して記録した方式である。
トップアンドボトム(Top&Bottom)方式は、LR画像を1フレーム画像中の上下に分割して記録した方式である。
これらの画像記録方式など、3次元画像の再生や表示処理に利用される3次元画像詳細情報がステレオビデオ情報ボックス302に記録される。
【0077】
MP4ファイルを記録メディアまたは通信手段等を介して取得して再生しようとする装置は、MP4ファイルの実データボックス(mdat)から実際に画像を取得する以前に、AVコーデックボックス(avc1)に設定されたステレオビデオ情報ボックス302の3次元画像情報を取得することで、MP4ファイルの格納データの3次元画像データがどのような記録方式や表示方式に対応したデータであるか等の3次元画像の再生や表示処理に適用する詳細情報を取得することが可能となる。
【0078】
従って、例えば3次元画像の表示機能を持たない表示装置に3次元画像データが誤って表示されてしまうといった事態を防止できる。また、自装置において再生または表示可能な3次元画像であるか否かについての確認も可能となるので、自装置が処理可能なデータであることの確認を行った後に、MP4ファイルの格納データを取り出して復号、再生処理を開始することが可能となり、無駄な処理の実行を排除することが可能となる。
【0079】
AVコーデックボックス(avc1)に対する3次元画像詳細情報の記録形式としては様々な設定が可能であるが、以下、その一例について説明する。
Advanced Video Coding(MPEG4−AVC)を規定したISO/IEC14496においては、既に通常のコーデック情報として、再生用の各画像フレームを構築するためのフレーム構成情報(Frame Packing Arangement SEI)を規定している。
【0080】
以下、説明する3次元画像詳細情報の記録形式の一例は、この既存のフレーム構成情報(Frame Packing Arrangement SEI)とほぼ同様の形式を用いた例である。
【0081】
ステレオビデオ情報ボックス302に記録する3次元画像詳細情報の一例であるフレーム構成情報(Frame Packing Arrangement SEI)の具体的なデータ設定例について、以下説明する。
なお、以下の例では、3次元画像の以下の記録方式、すなわち、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これら、異なる3次元画像の記録方式に対応するフレーム構成情報の設定例について説明する。
【0082】
3次元画像詳細情報の設定例の説明の前に、まず図5〜図7を参照して以下の3次元画像のデータ復元処理と再生処理方法について説明する。
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
【0083】
図5は、(a)フレームシーケンシャル方式[FS:Frame Sequential]に従ったデータ復元処理と再生処理方法を説明する図である。
図5にはMP4のデコード結果として得られるデコード画像フレーム321と、表示画像フレーム322を示している。
フレームシーケンシャル方式では左目用画像(L画像)と、右目用画像(R画像)がLRLRLR・・・と交互に記録される。従って、MP4デコード結果から得られる画像は。表示画像フレーム322としてのL画像、R画像として利用される。
【0084】
図6は、(b)サイドバイサイド方式[SbS:Side by Side]に従ったデータ復元処理と再生処理方法を説明する図である。
図6には、
MP4デコード結果画像331、
アンパックL画像(フレーム0)332、
アンパックR画像(フレーム1)333、
表示用L画像(フレーム0)334、
表示用R画像(フレーム1)335、
これらの画像データを示している。
【0085】
サイドバイサイド方式[SbS:Side by Side]では、MP4デコード結果画像331に示すように、左目用画像(L画像)と、右目用画像(R画像)が1つの画像フレームの左右に区分された領域に格納される。
この画像から、まず、アンパック処理を実行して、アンパックL画像(フレーム0)332、アンパックR画像(フレーム1)333を生成する。さらに、伸張処理(アップコンバート)を実行して表示用L画像(フレーム0)334と、表示用R画像(フレーム1)335を生成する。
このようにフレーム0,フレーム1が1組の画像フレームとして設定される、
【0086】
図7は、(c)トップアンドボトム方式[T&B:Top&Bottom]に従ったデータ復元処理と再生処理方法を説明する図である。
図7には、
MP4デコード結果画像341、
アンパックL画像(フレーム0)342、
アンパックR画像(フレーム1)343、
表示用L画像(フレーム0)344、
表示用R画像(フレーム1)345、
これらの画像データを示している。
【0087】
トップアンドボトム方式[T&B:Top&Bottom]では、MP4デコード結果画像341に示すように、左目用画像(L画像)と、右目用画像(R画像)が1つの画像フレームの上下に区分された領域に格納される。
この画像から、まず、アンパック処理を実行して、アンパックL画像(フレーム0)342、アンパックR画像(フレーム1)343を生成する。さらに、伸張処理(アップコンバート)を実行して表示用L画像(フレーム0)344と、表示用R画像(フレーム1)345を生成する。
トップアンドボトム方式でも、フレーム0,フレーム1が1組の画像フレームとして設定される、
【0088】
このように、3次元画像の再生、表示を実行する装置では3次元画像の方式に従った処理を行うことが必要である。本実施例の構成では、MP4ファイルに格納された画像がどの方式に従った3次元画像であるかを識別するための詳細情報をステレオビデオ情報ボックス302内にフレーム構成情報(Frame Packing Arrangement SEI)として記録する。
【0089】
図8、図9を参照して、AVコーデックボックス内に設定するステレオビデオ情報ボックス302に記録する3次元画像詳細情報としてのフレーム構成情報のデータ設定例について説明する。
図8、図9は、MP4ファイルに格納された3次元画像が以下の3種類の方式に対応する場合のデータ設定例を示す図である。
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に対応するフレーム構成(Frame Packing Arrangement SEI)情報のデータ設定例である。
【0090】
以下、図8に示す3次元画像詳細情報としてのフレーム構成情報の各データについて説明する。
フレームパッキングアレンジメントキャンセルフラグ
(frame_packing_arrangement_cancel_flag)
このフラグが1の場合、フレーム構成情報を使用しないことを示す。
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合、フレームシーケンシャル方式[FS]、サイドバイサイド方式[SbS]、トップアンドボトム方式[T&B]、いずれの方式においても、このフレーム構成情報を使用することを示す0を設定する。なお、[0b]の(b)は、2進数の表記であることを意味している。
【0091】
5点系サンプリングフラグ
(quincux_sampling_flag)
このフラグが1の場合、画像フレームのサンプリングポイントが3×3画素の5点に設定されていることを示す。
このフラグは主に復号処理におけるサンプリング位置を示す情報として用いられる。
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合、フレームシーケンシャル方式[FS]、サイドバイサイド方式[SbS]、トップアンドボトム方式[T&B]、いずれの方式においても、このフラグは0に設定する。
【0092】
コンテンツ説明タイプ
(content_interpretation_type)
このフィールドの値としては例えば0〜2の各値をとり、
0=フレーム相互の関係がない場合の設定値、
1=3次元(ステレオ)画像用のフレーム構成情報であり、フレーム0が左目用フレーム、フレーム1が右目用フレームである場合の設定値、
2=3次元(ステレオ)画像用のフレーム構成情報であり、フレーム0が右目用フレーム、フレーム1が左目用フレームである場合の設定値、
これらのコンテンツ説明タイプ情報が記録される。
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合、フレームシーケンシャル方式[FS]、サイドバイサイド方式[SbS]、トップアンドボトム方式[T&B]、いずれの方式においても、このフラグは1に設定する。
【0093】
スペーシャルフリッピングフラグ
(spatial_fliping_flag)
スペーシャルフリップフラグ
(frame0_flipped_flag)
これらのフラグは、画像フレームの構成方向、例えば水平方向または垂直方向に連結してフレームを構成するかの情報を格納する。
このフラグ設定は2次元画像のアップコンバート(伸張処理)の態様を決定するために用いられる。
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合、これらのフラグは利用せず、これらのフラグ値は0に設定する。
【0094】
フィールドビューフラグ
(field_views_flag)
フレームのインターリービング処理の態様についての情報が記録される。
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合、このフラグは利用せず、このフラグ値は0に設定する。
【0095】
フレームパッキングアレンジメントリザーブバイト
(frame_packing_arrangement_reserved_byte)
フレームパッキングアレンジメントリピテーションバイト
(frame_packing_arrangement_repetition_period)
フレームパッキングアレンジメントエクステンションバイト
(frame_packing_arrangement_extension_flag)
これらのフィールドは、リザーブ、繰り返しデータ、拡張データの記録フィールドである。
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合、これらのフラグは利用せず、これらのフラグ値は0に設定する。
【0096】
図9も、以下の3次元画像の3つの記録タイプ、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの3つの形式に対応するフレーム構成(Frame Packing Arrangement SEI)情報の設定例を示す図である。
【0097】
フレーム構成タイプ
(frame_packing_arrangement_type)
このフィールドには、3次元画像のタイプによって異なる値を設定する。
例えば、
(a)フレームシーケンシャル方式[FS]=000101b(5)、
(b)サイドバイサイド方式[SbS]=0000011b(3)、
(c)トップアンドボトム方式[T&B]=0000100b(4)、
再生装置は、このフィールドの設定値に基づいて、トラックに格納された3次元画像が、どの方式の3次元画像データであるかを判別することができる。すなわち、トラックに格納された3次元画像が、フレームシーケンシャル方式[FS]、サイバイサイド方式[SbS]、トップアンドボトム方式[T&B]、いずれの方式の3次元画像データであるかについて判別することが可能となる。
【0098】
現フレーム=フレーム0フラグ
(current_frame_is_frame0_flag)
このフィールドにはMP4デコード結果として得られる現フレームがフレーム0に対応するフレームであるか否かの情報が記録される。
3次元画像がL画像,R画像,L画像,R画像フレームの繰り返しとして記録される「(a)フレームシーケンシャル方式[FS]」の場合は、デコード結果として得られるフレーム単位で左目用画像(L画像)であるか右目用画像(R画像)であるかを判別することが必要となる。
従って、(a)フレームシーケンシャル方式[FS]の場合は、このフィールドに、
右目用画像(R画像)=0、
左目用画像(L画像)=1、
例えば上記の値を設定する。
【0099】
その他の方式、(b)サイドバイサイド方式[SbS]と、(c)トップアンドボトム方式[T&B]の各方式では、図6、図7を参照して説明したようにMP4デコード結果として得られるフレームに基づいて、左目用画像(L画像=フレーム0)と右目用画像(R画像=フレーム1)の双方を生成するので、MP4デコード結果に対する判別処理は不要となるので、このフィールドの値は0に設定する。
【0100】
フレーム0セルフコンテインドフラグ
(frame0_self_contained_flag)
フレーム1セルフコンテインドフラグ
(frame1_self_contained_flag)
これらはフレーム0,1の設定されたフレーム間で相互のフレームを参照すべきである場合にフラグの値として1を設定する。
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合、フレームシーケンシャル方式[FS]、サイドバイサイド方式[SbS]、トップアンドボトム方式[T&B]、いずれの方式においてもこの情報は不要であり、このフラグの値は0に設定する。
【0101】
フレーム0グリッドポジションX
(frame0_grid_position_x)
フレーム0グリッドポジションY
(frame0_grid_position_y)
フレーム1グリッドポジションX
(frame1_grid_position_x)
フレーム1グリッドポジションY
(frame1_grid_position_y)
これらは画像フレームの構成処理に際して参照する画素位置を示すためのデータフィールドである。
【0102】
ステレオビデオ情報ボックス302内に記録する3次元画像情報としてのフレーム構成情報の場合は、フレームシーケンシャル方式[FS]ではN/A(無効値)、サイドバイサイド方式[SbS]、トップアンドボトム方式[T&B]ではフラグ値=0を設定する。
例えば、図6、図7を参照して説明したサイドバイサイド方式[SbS]、トップアンドボトム方式[T&B]ではすべてフラグ値=0を設定する。これは、フレーム0,1とも(X,Y)=(0,0)で指定される左上端の座標位置に参照位置が設定されていることを示している。
【0103】
図8、図9を参照して説明したように、ステレオビデオ情報ボックス302内のフレーム構成(Frame Packing Arrangement SEI)情報には、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に対応するフレーム構成情報(Frame Packing Arrangement SEI)の設定値がそれぞれ設定される。
【0104】
3次元画像の再生、表示を実行する装置は、ステレオビデオ情報ボックス302内の3次元画像詳細情報を参照することで、MP4ファイルに格納された画像がどの方式に従った3次元画像であるかを識別することが可能となる。
すなわち、例えば図8、図9を参照して説明したフレーム構成情報(Frame Packing Arrangement SEI)の設定値を参照することで、MP4ファイルに格納された画像がどの方式に従った3次元画像であるかを識別可能となり、格納画像の方式に対応した復元処理を実行して正しい3次元画像表示用データを生成して再生、表示することが可能となる。
【0105】
従って、例えば3次元画像の表示機能を持たない表示装置に3次元画像データが誤って表示されてしまうといった事態を防止できる。
また、自装置の実行可能な3次元画像表示処理に応じたデータが記録されているかについても予め知ることが可能となり、自装置において処理可能であると判断された場合にのみ、実データボックス(mdat)104(図1参照)に格納された実データを取得してエンコード等の処理を開始することができ、無駄な処理を実行してしまう事態を避けることが可能となる。
【0106】
なお、上記実施例では、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に対応する3次元画像詳細情報を記録した例について説明したが、その他の方式に従った情報を記録する構成としてもよい。また、図8、図9を参照して説明したフレーム構成情報(Frame Packing Arrangement SEI)に限らず、その他の形式で3次元画像詳細情報を作成してAVコーデックボックス(avc1)に記録する構成としてもよい。
【0107】
[2C.(3)AVコーデックボックス(avc1)の拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像詳細情報を記録する実施例(実施例3)]
次に、図10以下を参照してMP4ファイルのAVコーデックボックス(avc1)の拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像詳細情報を記録する実施例について説明する。
【0108】
なお、先に図1を参照して説明したように、AVコーデックボックス(avc1)は、ムービーボックス(moov)の下位のトラックボックス111のさらに下位のサンプルディスクリプションボックス(stsd)の下位に設定されるボックスである。
AVコーデックボックス(avc1)は、先に説明したように、実データボックス(mdat)に格納される実データを区分したデータであるサンプルのコーデック情報等が記録されるボックスである。
【0109】
なお、この場合はトラックに含まれるサンプルの全てのコーデック情報がAVコーデックボックス(avc1)に設定されることになる。サンプルディスクリプションボックス(stsd)の下位には1または複数のAVコーデックボックス(avc1)の設定が可能である。ただし、内容が同じ場合は複数設定する必要はない。つまり、サンプル数とAVコーデックボックスの数は一致する必要はなく、サンプル数が複数でもAVコーデックボックスを1つとする設定などが可能である。
【0110】
本実施例3では、実施例2と同様、このAVコーデックボックス(avc1)に3次元画像詳細情報を記録する。ただし、本実施例3ではAVコーデックボックス(avc1)の拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像詳細情報を記録する。
【0111】
MP4のファイルフォーマットを規定するISO/IEC14496では、MP4に格納されるデータが例えば暗号化データとして格納されるなど、MP4ファイルの格納データが何らかの変換データとして記録されている場合、そのデータについてのデータ構成情報を記録するための領域としてスキーム情報ボックス(sinf)を規定している。例えば、MP4ファイルの格納データが暗号化された変換データとして記録されている場合、その暗号化態様情報を記録するための領域としてスキーム情報ボックス(sinf)を規定している。
【0112】
なお、MP4のファイルフォーマットを規定するISO/IEC14496の現行規定においては、データ構成情報を格納するスキーム情報ボックス(sinf)は、AVコーデックボックス(avc1)の下位に1つ設定することができると規定している。
例えばMP4格納データが暗号化データである場合、再生装置はAVコーデックボックス(avc1)内に設定されたスキーム情報ボックス(sinf)を参照することで、暗号化データの復号に必要となる情報を得ることが可能となる。
【0113】
本実施例では、このスキーム情報ボックスを利用する。すなわち、3次元(ステレオ)画像についてのデータ構成情報を格納したスキーム情報ボックスを定義する。
図10を参照して、3次元(ステレオ)画像についてのデータ構成情報、すなわち3次元画像詳細情報をスキーム情報ボックス(sinf)に格納する例について説明する。
【0114】
図10には、
(a)MP4ファイル400、
(b)AVコーデックボックス(avc1)401、
(c)3次元画像情報スキーム情報ボックス410を含むAVコーデックボックス405、
これらのデータ構成を示している。
【0115】
例えばMP4ファイル400に3次元画像が含まれない場合、3次元画像詳細情報を記録したスキーム情報ボックス(sinf)は設定されず、MP4ファイル内のAVコーデックボックス(avc1)は、例えば図10(b)に示すようなAVコーデックボックス(avc1)401、すなわちAVCデータ構成情報を格納したAVCデータ構成情報ボックス[AVCConfigurationBox]402のみを有するデータ構成となる。AVCデータ構成情報ボックス[AVCConfigurationBox]402には、MP4データの復号処理に必要となるコーデック情報が記録される。
【0116】
MP4ファイルに3次元画像が含まれる場合、図10(b)に示すAVコーデックボックス(avc1)401は、図10(c)に示す3次元画像情報スキーム情報ボックス410を含むAVコーデックボックス405として設定する。
【0117】
なお、図10(b)に示す3次元画像情報スキーム情報ボックスを含まないAVコーデックボックス(avc1)401のボックス名に相当するコード(4CC:four−character−code)は[avc1]であるが、
図10(c)に示す3次元画像情報スキーム情報ボックス410を含むAVコーデックボックス405は、ボックス名に相当するコード(4CC:four−character−code)をステレオビデオデータに関する情報を含むことを示す[stev]に変更する。すなわち、ボックス名(4CC)から3次元画像情報スキーム情報ボックス410を含むAVコーデックボックス405であることが判別可能となる。なお、ボックス名(4CC)はAVコーデックボックス405のファイル名に対応しており、再生装置は、ファイル名から3次元画像情報スキーム情報ボックスを含むAVコーデックボックスであることを判別できる。
【0118】
3次元画像情報スキーム情報ボックス410は、
フォーマット情報ボックス(frma)411、
スキームタイプボックス(SchemeTypeBox)412、
スキーム詳細情報ボックス(SchemeInformationBox)413、
これらの各ボックスを有する。
【0119】
フォーマット情報ボックス(frma)411はフォーマット情報を記録している、例えばAVCフォーマットに従ったデータであることを示す場合、
data_format='avc1'
このようなフォーマット情報が記録される。
【0120】
スキームタイプボックス(SchemeTypeBox)412には、このスキーム情報ボックス410のタイプを示す情報が記録される。本例では、スキーム情報ボックス410は3次元画像の詳細情報を格納したスキーム情報ボックスであるので、スキームタイプボックス(SchemeTypeBox)412には、3次元画像詳細情報を格納したスキーム情報ボックスであることを示すタイプ情報が記録される。
【0121】
スキーム詳細情報ボックス(SchemeInformationBox)413には、具体的な3次元画像の詳細情報が記録される。スキーム詳細情報ボックス(SchemeInformationBox)413に格納される3次元画像詳細情報は、先の実施例2において説明したフレーム構成情報(Frame Packing Arrangement SEI)と同様の情報を含むものである。3次元画像の再生、表示処理を実行する際に必要となる情報が記録されている。
具体的には、例えば、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に対応する3次元画像詳細情報が記録される。
【0122】
3次元画像の再生、表示を実行する装置は、AVコーデックボックス(avc1)の下位情報として設定された3次元画像情報スキーム情報ボックス410のスキーム詳細情報ボックス(SchemeInformationBox)413から3次元画像詳細情報を取得することで、MP4ファイルに格納された画像がどの方式に従った3次元画像であるかを識別することが可能となる。再生装置は、3次元画像情報スキーム情報ボックス410のスキーム詳細情報ボックス(SchemeInformationBox)413の記録情報を参照して、格納画像の方式に対応した復元処理を実行して正しい3次元画像表示用データを生成して再生、表示することが可能となる。
【0123】
従って、例えば3次元画像の表示機能を持たない表示装置に3次元画像データが誤って表示されてしまうといった事態を防止できる。
また、自装置の実行可能な3次元画像表示処理に応じたデータが記録されているかについても予め知ることが可能となり、自装置において処理可能であると判断された場合にのみ、実データボックス(mdat)104(図1参照)に格納された実データを取得してエンコード等の処理を開始することができ、無駄な処理を実行してしまう事態を避けることが可能となる。
【0124】
次に、図11を参照して、MP4ファイルの実データボックス(mdat)に格納されたデータが3次元画像データであり、さらに暗号化データでもある場合のスキーム情報ボックスの利用構成について説明する。
【0125】
図11には、
(c)3次元画像情報スキーム情報ボックス410を含むAVコーデックボックス405、
(d)3次元画像情報スキーム情報ボックス410を入れ子として階層化して設定した暗号化情報スキーム情報ボックス420を持つAVコーデックボックス407、
これらのデータ構成を示している。
(c)のデータは、図10(c)のデータと同じ構成を持つAVコーデックボックス405である。
【0126】
MP4ファイルに格納された実データが3次元画像であり、さらに暗号化されている場合、再生装置は、第1のデータ構成情報(3次元画像詳細情報)のみならず、第2のデータ構成情報(暗号化情報)が必要となる。
図11に示す例では、これらの個別のデータ構成情報を個別のスキーム情報ボックスとして設定して、これらを階層化して記録する構成としている。
【0127】
図11に示す例では、複数のスキーム情報ボックス(sinf)を階層化(入れ子状態)してAVコーデックボックスに格納している。
すなわち、図11(d)に示すAVコーデックボックス(encv)407に示すように、
(1)3次元(ステレオ)画像についてのデータ構成情報(3次元画像詳細情報)を格納する第1のスキーム情報ボックス(sinf)410、
(2)暗号化処理についてのデータ構成情報(暗号化態様情報)を格納する第2のスキーム情報ボックス(sinf)420、
これら2つのスキーム情報ボックスを階層化、すなわち入れ子状態に設定してAVコーデックボックスに格納している。
【0128】
本実施例では、図11(d)に示すように、3次元(ステレオ)画像についてのデータ構成情報(3次元画像詳細情報)を格納した第1のスキーム情報ボックス(sinf)410を、暗号化処理についてのデータ構成情報(暗号化態様情報)を格納した第2のスキーム情報ボックス(sinf)420のフォーマット情報ボックス(frma)の下位に設定したボックスとしている。
【0129】
なお、図10(b)に示す3次元画像情報スキーム情報ボックスを含まないAVコーデックボックス(avc1)401のボックス名に相当するコード(4CC:four−character−code)は[avc1]であり、図11(c)に示す3次元画像情報スキーム情報ボックス410を含むAVコーデックボックス405は、ボックス名に相当するコード(4CC:four−character−code)がステレオビデオデータに関する情報を含むことを示す[stev]である。
【0130】
さらに、図11(d)に示す3次元画像情報スキーム情報ボックス410を入れ子として含む暗号化情報スキーム情報ボックス420を持つAVコーデックボックス407は、ボックス名に相当するコード(4CC:four−character−code)を暗号化ビデオデータに関する情報を含むことを示す[encv]として設定する。これにより、ボックス名(4CC)から暗号化情報スキーム情報ボックス420を含むAVコーデックボックス405であることが判別可能となる。
【0131】
第1のスキーム情報ボックス(sinf)410には、3次元(ステレオ)画像についてのデータ構成情報(3次元画像詳細情報)を格納する。
第1のスキーム情報ボックス(sinf)410は、先に図10を参照して説明したと同様のボックス、すなわち、
フォーマット情報ボックス(frma)411、
スキームタイプボックス(SchemeTypeBox)412、
スキーム詳細情報ボックス(SchemeInformationBox)413、
これらの各ボックスを有する。
【0132】
フォーマット情報ボックス(frma)411はフォーマット情報を記録している、例えばAVCフォーマットに従ったデータであることを示す場合、
data_format='avc1'
このようなフォーマット情報が記録される。
【0133】
スキームタイプボックス(SchemeTypeBox)412には、このスキーム情報ボックス410のタイプを示す情報が記録される。本例では、スキーム情報ボックス410は3次元画像の詳細情報を格納したスキーム情報ボックスであるので、スキームタイプボックス(SchemeTypeBox)412には、3次元画像の詳細情報を格納したスキーム情報ボックスであることを示すタイプ情報が記録される。
【0134】
スキーム詳細情報ボックス(SchemeInformationBox)413には、具体的な3次元画像の詳細情報が記録される。スキーム詳細情報ボックス(SchemeInformationBox)413に格納される3次元画像詳細情報は、先の実施例2において説明したフレーム構成情報(Frame Packing Arrangement SEI)と同様の情報を含むものである。
すなわち、例えば、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に対応する3次元画像詳細情報を記録する。
【0135】
再生装置は、この第1のスキーム情報ボックス(sinf)410に格納された3次元画像詳細情報を参照することで、MP4ファイルの実データボックス(mdat)に格納された3次元画像の詳細情報を得ることが可能となる。
【0136】
また、第2のスキーム情報ボックス(sinf)420には、暗号化処理についてのデータ構成情報(暗号化態様情報)を格納する。
第2のスキーム情報ボックス(sinf)420は、
フォーマット情報ボックス(frma)421、
スキームタイプボックス(SchemeTypeBox)422、
スキーム詳細情報ボックス(SchemeInformationBox)423、
これらの各ボックスを有する。
【0137】
フォーマット情報ボックス(frma)421は、3次元(ステレオ)画像についてのデータ構成情報(3次元画像詳細情報)を格納した第1のスキーム情報ボックス(sinf)410を下位階層のデータ、すなわち入れ子状態として保持している。
さらに、フォーマット情報を記録している。この例では、3次元(ステレオ)画像についてのデータ構成情報(3次元画像詳細情報)を格納した第1のスキーム情報ボックス(sinf)410を格納していることを示すフォーマットデータとして、
data_format='stev'
このようなフォーマット情報が記録される。
【0138】
スキームタイプボックス(SchemeTypeBox)422には、このスキーム情報ボックス420のタイプを示す情報が記録される。本例では、スキーム情報ボックス420は暗号化処理についての詳細情報を格納したスキーム情報ボックスであるので、スキームタイプボックス(SchemeTypeBox)422には、暗号化詳細情報を格納したスキーム情報ボックスであることを示す情報が記録される。
【0139】
スキーム詳細情報ボックス(SchemeInformationBox)423には、具体的な暗号化処理の詳細情報が記録される。スキーム詳細情報ボックス(SchemeInformationBox)423に格納される暗号化情報は、再生装置において暗号化データを復号するために必要となる情報が記録される。
【0140】
再生装置は、この第2のスキーム情報ボックス(sinf)420に格納された暗号化態様情報を参照して、MP4ファイルの実データボックス(mdat)に格納されたデータの復号処理に必要な情報を得ることが可能となる。
【0141】
再生処理や表示処理を行う場合に、異なるデータ構成情報、すなわち3次元画像情報や暗号化情報等のように、異なるデータ構成情報が必要となる場合、図11(d)に示すようにそれぞれのデータ構成情報に対応するスキーム情報ボックスを設定し、これらを階層化構成(入れ子)としてAVコーデックボックス内に記録する。
このようなデータ構成情報記録処理を行うことで、MP4ファイルに格納された実データの再生、表示処理に必要となる全ての情報をAVコーデックボックスから取得することが可能となる。
【0142】
なお、図11を参照して説明した例は、以下の2つのスキーム情報ボックス、すなわち、
(1)3次元(ステレオ)画像についてのデータ構成情報(3次元画像詳細情報)を格納する第1のスキーム情報ボックス(sinf)410、
(2)暗号化処理についてのデータ構成情報(暗号化態様情報)を格納する第2のスキーム情報ボックス(sinf)420、
これら2つの異なるデータ構成情報に対応するスキーム情報ボックスを階層化、すなわち入れ子状態に設定してAVコーデックボックスに格納した例である。
【0143】
この他にもMP4ファイルに格納した実データに関する様々なデータ構成情報について、例えば3以上の複数階層に設定した多数のスキーム情報ボックスを設定することが可能である。本実施例のようにスキーム情報ボックスの階層化(入れ子)構成を用いることで、再生、表示処理の際に必要となる様々なデータ構成情報やデータ変換情報をいくつでも設定して管理情報として記録することが可能となる。
【0144】
再生装置は、これらの管理情報を取得することで、MP4ファイルに格納された実データを誤りなく再生、表示することが可能となる。
【0145】
[3.画像処理装置の実行する画像処理シーケンスについて]
次に、本発明の一実施例に係る画像処理装置の実行する画像処理シーケンスについて、図12、図13に示すフローチャートを参照して説明する。
図12は、画像データの記録処理シーケンスを説明するフローチャートである。
図13は、画像データの再生処理シーケンスを説明するフローチャートである。
【0146】
まず、図12に示すフローチャートを参照して画像データの記録処理シーケンスについて説明する。
この図12に示すフローチャートに従った処理は、例えば画像を撮影し記録メディアに記録する処理を実行するカメラ等の撮像装置において実行される。例えば撮像装置に備えられたCPU等の制御部の制御の下で実行される処理である。
図12に示すフローチャートの各ステップの処理について説明する。
【0147】
ステップS101において、例えば撮影処理によって取得され記録メディアに記録する予定のデータが3次元画像データを含むか否かを判定する。
ステップS101において、メディアへの記録予定データに3次元画像データが含まれる場合は、ステップS101の判定はYesとなり、ステップS102に進む。
【0148】
ステップS102では、MP4ファイルのプロファイルボックスに3次元画像識別情報を記録する。
この処理は、先に説明した[[3−1.(1)プロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例(実施例1)]に対応する処理である。すなわち、図2、図3を参照して説明した処理である。
【0149】
図2を参照して説明した以下のフラグ、すなわち、
ステレオビデオフラグ(stereo video flag)201、
ミックスステレオビデオフラグ(Mixed stereo video flag)202、
これらの各フラグの値として、記録予定データの種類に応じて図3に示すフラグの値を設定する。
【0150】
次に、ステップS103において、記録予定の3次元画像データの方式を判定する。なお、このフローでは、A、B、Cの3タイプについて判別する例としている。これらは、例えば、先の実施例2,3において説明した以下の3タイプに対応する。
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に対応する。
【0151】
ステップS103の判定が方式Aと判定された場合は、ステップS104に進み、MP4ファイルのAVコーデックボックスに方式Aに対応する3次元画像詳細情報を記録する。
また、ステップS103の判定が方式Bと判定された場合は、ステップS105に進み、MP4ファイルのAVコーデックボックスに方式Bに対応する3次元画像詳細情報を記録する。
また、ステップS103の判定が方式Cと判定された場合は、ステップS106に進み、MP4ファイルのAVコーデックボックスに方式Cに対応する3次元画像詳細情報を記録する。
【0152】
このステップS104〜S106の処理は、先に説明した実施例2または実施例3の処理に対応する。
すなわち、前述の[3−2.(2)AVコーデックボックス(avc1)に3次元画像詳細情報を記録する実施例(実施例2)]、または、[3−3.(3)AVコーデックボックス(avc1)の拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像詳細情報を記録する実施例(実施例3)]、これらの処理に対応する。
なお、実施例2の処理または実施例3の処理のいずれかを実行する構成としてもよいし、両者を実行する構成としてもよい。
【0153】
なお、AVコーデックボックスは図1を参照して説明したように、ムービーボックス(moov)の下位のトラックボックスのさらに下位のサンプルディスクリプションボックス(stsd)の下位に設定されるコーデック情報を格納したボックスである。
【0154】
実施例2の処理では、図4〜図9を参照して説明したように、AVコーデックボックスにステレオビデオ情報ボックス302(図4参照)を設定し、ここに、例えば図8、図9を参照して説明した3次元画像詳細情報としてのフレーム構成情報を記録する。図8、図9を参照して説明したように、3次元画像の方式に応じて異なるデータが記録される。
【0155】
また、実施例3の処理を行う場合は、図10、図11を参照して説明したようにスキーム情報ボックスを設定して、スキーム情報ボックス内に3次元画像詳細情報を記録する。この場合も3次元画像の方式に応じて異なるデータが記録される。
【0156】
これらステップS104〜S106の処理の完了後、ステップS107に進み、MP4ファイルを完成させて、メディアに対する記録処理を実行する。
【0157】
なお、ステップS101において、取得データに3次元画像データを含まないと判定した場合は、ステップS101の判定はNoの判定となり、ステップS110に進む。ステップS110では、MP4ファイルのプロファイルボックスに2次元画像識別情報を記録する。
【0158】
この処理は、先に説明した[[3−1.(1)プロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例(実施例1)]に対応する処理である。すなわち、図2、図3を参照して説明した処理である。すなわち、図2に示す、以下のフラグ、
ステレオビデオフラグ(stereo video flag)201、
ミックスステレオビデオフラグ(Mixed stereo video flag)202、
これらの各フラグの値として、記録予定データが2次元画像データのみであることを示すフラグの値を設定する。その後、ステップS107に進み、MP4ファイルを完成させて、メディアに対する記録処理を実行する。
【0159】
なお、図12に示すフローは、記録メディアに対するデータ記録処理におけるMP4ファイルの作成処理例として説明したが、通信データとしてMP4ファイルを生成する場合も同様の処理シーケンスでMP4ファイルの作成処理を行えばよい。
【0160】
また、図12に示すフローでは、前述の実施例1のプロファイルボックスの3次元画像識別情報と、実施例2または3のAVコーデックボックスの3次元画像詳細情報の双方を読み取る設定例として説明したが、実施例1のプロファイルボックスの3次元画像識別情報のみを読み取って利用する処理を行う構成としてもよいし、実施例2または3のAVコーデックボックスの3次元画像詳細情報のみを読み取って利用する処理を行う構成としてもよい。
【0161】
次に、図13に示すフローチャートを参照して画像データの再生処理シーケンスについて説明する。
この図13に示すフローチャートに従った処理は、例えば記録メディアから読み取ったMP4ファイル、あるいは通信データとして受信したMP4ファイルに対する処理を実行する再生装置において実行される。例えば再生装置に備えられたCPU等の制御部の制御の下に実行される処理である。
図13に示すフローチャートの各ステップの処理について説明する。
【0162】
まず、ステップS201においてMP4ファイルのプロファイルボックス(PROF)の情報を取得する。
この処理は、先に説明した[[3−1.(1)プロファイルボックス(uuid(PROF))に3次元画像識別情報を記録する実施例(実施例1)]に対応する処理である。すなわち、図2、図3を参照して説明したMP4ファイルのプロファイルボックス(PROF)の情報を取得する処理である。
【0163】
具体的には、図2に示す以下のフラグ、すなわち、
ステレオビデオフラグ(stereo video flag)201、
ミックスステレオビデオフラグ(Mixed stereo video flag)202、
これらの各フラグの値を読み取る。
【0164】
先に図3を参照して説明したように、フラグ設定値により、以下のデータ識別が可能となる。
(ケース1)
ステレオビデオフラグ=1、ミックスステレオビデオフラグ=0、
この場合は、
(a)MP4ファイルに格納された画像データが全て3次元画像(ステレオ画像)
であると判定する。
【0165】
(ケース2)
ステレオビデオフラグ=0、ミックスステレオビデオフラグ=0、
この場合は、
(b)MP4ファイルに格納された画像データが全て2次元画像
であると判定する。
【0166】
(ケース3)
ステレオビデオフラグ=0、ミックスステレオビデオフラグ=1、
この場合は、
(c)MP4ファイルに格納された画像データが3次元画像(ステレオ画像)と2次元画像の混在データ
であると判定する。
【0167】
ステップS201におけるプロファイルボックスの3次元画像識別情報としてのフラグ読み取りにより、ステップS202において、3次元画像データが含まれないと判定した場合は、ステップS210に進み、MP4ファイルから2次元画像データを取得して再生、表示を実行する。
【0168】
一方、ステップS202において、3次元画像データが含まれると判定した場合は、ステップS203に進む。
ステップS203では、MP4ファイルのAVコーデックボックスの情報を取得する。
この処理は、前述の[3−2.(2)AVコーデックボックス(avc1)に3次元画像詳細情報を記録する実施例(実施例2)]、または、[3−3.(3)AVコーデックボックス(avc1)の拡張構成として規定されるスキーム情報ボックス(sinf)を利用して3次元画像詳細情報を記録する実施例(実施例3)]、これらの記録データを読み取る処理に対応する。
【0169】
例えば、実施例2に対応する3次元情報記録処理が行われている場合、図4〜図9を参照して説明したように、AVコーデックボックスにステレオビデオ情報ボックス302(図4参照)が設定され、ここに、例えば図8、図9を参照して説明した3次元画像詳細情報としてのフレーム構成情報が記録されている。ステップS203では、このステレオビデオ情報ボックス302(図4参照)から3次元画像詳細情報を読み取る。
【0170】
例えば、例えば図8、図9を参照して説明した3次元画像詳細情報としてのフレーム構成情報の設定値を読み取ることで、再生予定データが、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらのいずれの方式に従ったデータであるかを判別することが可能となる。
【0171】
また、実施例3に対応する3次元情報記録処理が行われている場合、図10、図11を参照して説明したようにスキーム情報ボックスがAVコーデックボックスの下位データとして記録されており、このスキーム情報ボックスから3次元画像詳細情報を読み取る。
【0172】
少なくとも実施例2または実施例3のいずれかの方式に従って記録された3次元画像詳細情報を取得して、再生予定データの3次元画像方式を確認することが可能となる。この確認により、ステップS204の方式判定処理を実行する。すなわち、AVコーデックボックスから取得した3次元画像詳細情報に基づいて、ステップS204において、再生予定データが方式A,B,Cのいずれであるかを判定する。
【0173】
方式Aに対応する3次元画像データであると判定した場合は、ステップS205に進み、方式Aに対応する画像のデコード(復号、復元処理)を行い、再生、表示処理を実行する。
方式Bに対応する3次元画像データであると判定した場合は、ステップS206に進み、方式Bに対応する画像のデコード(復号、復元処理)を行い、再生、表示処理を実行する。
方式Cに対応する3次元画像データであると判定した場合は、ステップS207に進み、方式Cに対応する画像のデコード(復号、復元処理)を行い、再生、表示処理を実行する。
【0174】
このように、本発明に従った処理を行うことで、画像処理装置は、MP4ファイルに格納されたデータに3次元画像が含まれるか否か、さらに3次元画像データが含まれる場合、その記録再生方式について、MP4ファイル内の管理情報としてのプロファイルボックスやAVコーデックボックスから取得することが可能となる。
従って、MP4ファイルの実データを取得して解析、あるいは再生処理を実行する前に、自装置の再生可能な3次元画像データであるか否かを確認することが可能となり、再生可能であると判定した場合にのみ実データを取得し、方式に応じた処理に従って、正しいデコード、再生処理を実行することが可能となる。
【0175】
なお、図13に示すフローでは、前述の実施例1〜3において説明したMP4ファイルにおいて、実施例1のプロファイルボックスの3次元画像識別情報と、実施例2または3のAVコーデックボックスの3次元画像詳細情報の双方を記録したMP4ファイルを生成する例として説明したが、実施例1のプロファイルボックスの3次元画像識別情報のみを記録する処理を行う構成としてもよいし、実施例2または3のAVコーデックボックスの3次元画像詳細情報のみを記録する処理を行う構成としてもよい。
【0176】
[4.本発明の画像処理装置の構成例について]
次に、本発明の画像処理装置の構成例について図14を参照して説明する。図14に示すのは本発明の画像処理装置の一実施例としての撮像装置500の構成例である。撮像装置500は、3次元画像表示に適用する異なる視点からの画像を撮影する機能を持ち、ユーザのモード設定により、2次元画像と3次元画像の撮影を切り替え可能な構成を持つ。
【0177】
撮像部501は、例えば異なる位置に設定された複数のレンズ部を有し、同時に異なる視点からの画像を撮影可能な構成である。3次元画像撮影モードの設定時には、複数のレンズ部を介して撮影した画像を入力する。2次元画像撮影モードの設定時には、1つのレンズ部を介して撮影した画像のみを入力する。
【0178】
画像信号処理部502はホワイトバランス調整などの撮影画像データの信号処理を実行する。
データ符号化部503は、MP4ファイルを生成する。入力データが3次元画像である場合は、前処理部511において各方式に従って前処理を実行する。具体的には、例えば図5〜図7を参照して説明した各方式、すなわち、
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に従って、撮影画像からMP4デコード用画像を生成する。例えば、図6に示すサイドバイサイド方式[SbS]に従って記録データを生成する場合、撮影画像は図6の右側に示す表示用L画像(フレーム0)334と、表示用R画像(フレーム1)335に対応する2つの画像であり、これらの画像を適用して図6の左側に示すMP4デコード結果画像331に対応する画像フレームを生成する。
【0179】
このデータをエンコード部512に入力してMP4フォーマットに従った符号化(エンコード)処理を実行する。さらに、ファイル生成部513は、先に実施例1〜実施例3において説明した3次元画像識別情報のプロファイルボックスに対する記録処理や、3次元画像詳細情報のAVコーデックボックスに対する記録処理等を実行してMP4ファイルを生成する。
【0180】
ファイル生成部513は、エンコード部512の生成した画像データの符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルであるMP4ファイルを生成する。
ファイル生成部513は、MP4ファイル生成に際して、ファイルに格納する画像データに3次元画像データが含まれるか否かを示す3次元画像識別情報をMP4ファイルのプロファイルボックスに記録する。
3次元画像識別情報をMP4ファイルのプロファイルボックスに記録する処理は先に実施例1を参照して説明した処理に対応する。
【0181】
また、ファイル生成部513は、ファイル格納画像データに3次元画像データが含まれる場合、3次元画像の方式を判別可能とする3次元画像詳細情報をAVコーデックボックスに記録する。
3次元画像詳細情報をAVコーデックボックスに記録する処理は先に実施例2,3を参照して説明した処理に対応する。
【0182】
例えば、実施例3に対応する処理を実行する場合、ファイル生成部513は、符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を含むスキーム情報ボックスを生成し、複数のカテゴリ単位のスキーム情報ボックスを階層化して管理情報中に記録したファイルを生成する。
なお、ファイル生成部513は、MP4ファイルに格納する画像データの区分データであるトラック単位またはサンプル単位の区分データ単位で3次元画像詳細情報を記録する処理を行う
【0183】
データ符号化部503において生成したMP4ファイルは、記録部504に提供され、フラッシュメモリやHDD、DVD等の記録メディア530に記録される。
あるいは、データ符号化部503において生成したMP4ファイルは、通信部505に提供され、パケット化されて送信処理が行われる。
【0184】
なお、このデータ記録処理によって記録メディア530には、画像データの符号化データと、符号化データの管理情報を含むMP4ファイルが記録される。MP4ファイルに含まれる管理情報には、画像データに3次元画像データが含まれるか否かを示す3次元画像識別情報や、3次元画像の方式を判別可能な3次元画像詳細情報が含まれる。従って、この記録メディア530からMP4ファイルを読み取り再生する装置は、管理情報を参照して自装置における再生可能性を判定することが可能となる。
【0185】
例えば、記録メディア530には、先に説明した実施例3のスキーム情報ボックスの階層化構成を持つ管理情報が含まれるMP4ファイルが記録される。すなわち、記録メディア530に記録されるMP4ファィルの管理情報は、符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を階層化して記録した構成となる。このような情報記録媒体である記録メディア530からMP4ファイルを読み取り再生する装置は、階層化されたデータ構成情報を順次取得して、取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行することが可能となる。
【0186】
次に、記録メディア530に記録されたMP4ファイル、あるいは通信部505を介して受信したMP4ファイルの再生処理について説明する。フラッシュメモリやHDD、DVD等の記録メディア530に記録されたMP4ファイルは、再生部506を介して読み取られてデータ復号部507に提供される。同様に、通信部505を介して受信したMP4ファイルもデータ復号部507に提供される。
【0187】
データ復号部507のファイル解析部521は、まず受領したMP4ファイルの管理情報、すなわち、先に図1を参照して説明したファイルタイプボックス(ftyp)、プロファイルボックス(uuid(PROF))、ムービーボックス(moov)、これらの各ボックスに記録された管理情報を取得する。
【0188】
先に実施例1を参照して説明したように、プロファイルボックス(uuid(PROF))にはMP4ファイルの実データボックス(mdat)に格納された画像データに3次元画像が含まれるか否かを示す3次元画像識別情報が記録されている。図2、図3を参照して説明した情報である。
【0189】
また、実施例2,3を参照して説明したように、ムービーボックス(moov)の下位にあるAVコーデックボックスには、3次元画像詳細情報、すなわち、MP4ファイルの実データボックス(mdat)に格納された画像データが3次元画像データである場合、その3次元画像データの記録、再生方式に関する詳細情報が記録されている。これは、図4〜図11を参照して説明した情報である。例えば実施例2,3の構成が利用されたMP4ファイルの解析を行う場合、ファイル解析部521は、例えばMP4ファイルに格納された画像データの区分データであるトラック単位またはサンプル単位の区分データ単位で情報を取得する。
【0190】
データ復号部507のファイル解析部521は、これらMP4ファイル内の管理情報を解析してMP4ファイルの実データボックス(mdat)に格納された画像データに3次元画像が含まれるか否か、さらに、3次元画像が含まれる場合、その方式について確認する。
【0191】
その後、確認情報とともに、MP4ファイルはデコード部522に提供される。なお、ファイル解析部521のMP4ファイル解析結果から、MP4ファイルの格納データが撮像装置500において再生可能な方式に対応しないと判断された場合は、その後の処理、すなわちデコード処理等は実行されない。これらの処理制御は制御部570においてメモリ571に格納されたプログラムに従って実行される。制御部570は、MP4ファイルの3次元画像管理情報を適用して自装置における再生可能性を判定し、再生可能と判定した後にデコード部522における画像データの復号処理を開始させる制御を行う。
【0192】
ファイル解析部521のMP4ファイル解析結果に基づいて、MP4ファイルの格納データが撮像装置500において再生可能な方式に対応すると判断された場合は、デコード部522において、MP4データの復号(テコード)処理が開始される。さらに、3次元画像方式情報、およびデコード結果が表示情報生成部523に提供される。
【0193】
表示情報生成部523は、3次元画像方式情報、すなわち、MP4ファイル格納データが、例えば、下記のいずれの方式に対応するかに応じて、各方式に従った画像の復元処理(図5〜図7参照)を実行する。
(a)フレームシーケンシャル方式[FS]、
(b)サイドバイサイド方式[SbS]、
(c)トップアンドボトム方式[T&B]、
これらの各方式に従って、左目用画像(L画像)、右目用画像(R画像)をせいせいする。
データ復号部507の生成した表示用画像は表示部550に提供されて、画像表示が行われる。
【0194】
なお、表示情報生成部523は、3次元画像表示に適用するための左目用画像と右目用画像の生成を行うデータ処理部のた、例えば暗号化データの復号処理を実行するデータ処理部など、様々なカテゴリのデータ処理を実行するデータ処理部によって構成される。表示情報生成部523は、MP4ファイルに格納された画像データの再生処理に際して実行される複数の異なるカテゴリのデータ処理を実行するデータ処理部によって構成される。
【0195】
先に説明した実施例3の階層化されたスキーム情報ボックスを持つ管理情報を含むMP4ファイルを利用した処理では、ファイル解析部521は、MP4ファイルの管理情報の階層化されたデータ構成情報を取得し、デコード部522や表示情報生成部523は、ファイル解析部521の取得したカテゴリ単位のデータ構成情報からなスキーム情報ボックスに含まれる情報を適用して複数の異なるカテゴリのデータ処理を実行する。
【0196】
なお、これらの各構成部の処理の制御は制御部570において実行される。制御部580はメモリ571に予め格納されたプログラムに従って、撮影処理データ記録処理、通信データの生成、データ送受信処理、データ再生処理、表示処理等の制御を実行する。データ記録あるいはデータ送信処理に際しては、先に図12のフローチャートを参照して説明した処理シーケンスに従った処理制御を実行し、データ再生処理に際しては、先に図13のフローチャートを参照して説明した処理シーケンスに従った処理制御を実行する。
【0197】
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
【0198】
また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
【0199】
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
【産業上の利用可能性】
【0200】
以上、説明したように、本発明の一実施例の構成によれば、MP4ファイルに格納されたデータの再生処理において実行する様々なデータ処理、例えば3次元画像表示処理や、暗号化データの復号処理など、様々な異なるカテゴリのデータ処理に適用する情報をMP4ファイルの管理情報中に階層化して記録する構成とした。この構成により、MP4ファイルに格納されたデータの再生、例えば暗号化された3次元画像データの表示処理などにおいて実行が必要となる異なるカテゴリのデータ処理の各々に必要となる様々な情報を、MP4ファイルの管理情報から確実に取得することが可能となり、スムーズなデータ再生処理が可能となる。
【符号の説明】
【0201】
100 MP4ファイル
101 ファイルタイプボックス(ftyp)
102 プロファイルボックス(uuid(prof))
103 ムービーボックス(moov)
104 実データボックス(mdat)
111 トラックボックス(trak)
112 サンプルディスクリプションボックス(stsd)
113 AVコーデックボックス
201 ステレオビデオフラグ(stereo video flag)
202 ミックスステレオビデオフラグ(Mixed stereo video flag)
301 データ領域
302 ステレオビデオ情報ボックス(Stereo Video Description Box)
321 デコード画像フレーム
322 表示画像フレーム
331 MP4デコード結果画像
332 アンパックL画像(フレーム0)
333 アンパックR画像(フレーム1)
334 表示用L画像(フレーム0)
335 表示用R画像(フレーム1)
341 MP4デコード結果画像
342 アンパックL画像(フレーム0)
343 アンパックR画像(フレーム1)
344 表示用L画像(フレーム0)
345 表示用R画像(フレーム1)
400 MP4ファイル
401 AVコーデックボックス(avc1)
402 AVCデータ構成情報ボックス[AVCConfigurationBox]
405 AVコーデックボックス
407 AVコーデックボックス(encv)
410 3次元画像情報スキーム情報ボックス
411 フォーマット情報ボックス(frma)
412 スキームタイプボックス(SchemeTypeBox)
413 スキーム詳細情報ボックス(SchemeInformationBox)
420 暗号化情報スキーム情報ボックス
421 フォーマット情報ボックス(frma)
422 スキームタイプボックス(SchemeTypeBox)
423 スキーム詳細情報ボックス(SchemeInformationBox)
500 撮像装置
501 撮像部
502 画像信号処理部
503 データ符号化部
504 記録部
505 通信部
506 再生部
507 データ復号部
511 前処理部
512 エンコード部
513 ファイル生成部
521 ファイル解析部
522 デコード部
523 表示情報生成部
530 記録メディア
550 表示部
570 制御部
571 メモリ

【特許請求の範囲】
【請求項1】
画像データの符号化処理を実行するエンコード部と、
前記エンコード部の生成した符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを生成するファイル生成部を有し、
前記ファイル生成部は、
前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を生成し、複数のカテゴリ単位のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成する画像処理装置。
【請求項2】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データに3次元画像データが含まれるか否かを判別可能とした3次元画像管理情報である請求項1に記載の画像処理装置。
【請求項3】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式を判別可能とした3次元画像管理情報である請求項1に記載の画像処理装置。
【請求項4】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式が、
(a)フレームシーケンシャル方式、
(b)サイドバイサイド方式、
(c)トップアンドボトム方式、
上記(a)〜(c)のいずれの方式に従った3次元画像データであるかを判別可能とした3次元画像管理情報である請求項3に記載の画像処理装置。
【請求項5】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データの暗号化態様情報であり、
前記ファイル生成部は、
暗号化態様情報を含む第1のデータ構成情報と、3次元画像管理情報を含む第2のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成する請求項2〜4いずれかに記載の画像処理装置。
【請求項6】
前記ファイル生成部は、
MP4ファイルの生成を実行する構成であり、MP4ファイルのAVコーデックボックスの下位に前記データ構成情報を階層化して記録したファイルを生成する請求項1〜5いずれかに記載の画像処理装置。
【請求項7】
前記ファイル生成部は、
MP4ファイルのAVコーデックボックスの下位に前記データ構成情報を含むスキーム情報ボックスを階層化して記録したファイルを生成する請求項6に記載の画像処理装置。
【請求項8】
前記ファイル生成部は、
MP4ファイルに格納する画像データの区分データであるトラック単位またはサンプル単位の区分データ単位で前記スキーム情報ボックスを設定して記録する処理を行う請求項7に記載の画像処理装置。
【請求項9】
画像データの符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを解析するファイル解析部と、
前記ファイルに格納された画像データの再生処理に際して複数の異なるカテゴリのデータ処理を実行するデータ処理部を有し、
前記ファイルの管理情報は、データ処理のカテゴリ単位で各処理の実行に必要となるデータ構成情報を階層化して記録した構成を有し、
前記ファイル解析部は、前記ファイルの管理情報の階層化されたデータ構成情報を取得し、
前記データ処理部は、前記ファイル解析部の取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行する画像処理装置。
【請求項10】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイルの格納画像データに3次元画像データが含まれるか否かを判別可能とした3次元画像管理情報である請求項9に記載の画像処理装置。
【請求項11】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式を判別可能とした3次元画像管理情報である請求項9に記載の画像処理装置。
【請求項12】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイルの格納画像データに含まれる3次元画像データの3次元画像記録方式が、
(a)フレームシーケンシャル方式、
(b)サイドバイサイド方式、
(c)トップアンドボトム方式、
上記(a)〜(c)のいずれの方式に従った3次元画像データであるかを判別可能とした3次元画像管理情報である請求項11に記載の画像処理装置。
【請求項13】
前記カテゴリ単位のデータ構成情報の少なくとも1つは、前記ファイル生成部の生成ファイルの格納画像データの暗号化態様情報であり、
前記ファイル解析部は、
暗号化態様情報を含む第1のデータ構成情報と、3次元画像管理情報を含む第2のデータ構成情報を前記管理情報から取得する請求項10〜12いずれかに記載の画像処理装置。
【請求項14】
前記ファイルは、MP4ファイルであり、
前記ファイル解析部は、
MP4ファイルのAVコーデックボックスの下位に階層化して記録されたスキーム情報ボックスから各データ処理カテゴリ単位のデータ構成情報を取得する請求項9〜13いずれかに記載の画像処理装置。
【請求項15】
前記ファイル解析部は、
MP4ファイルに格納された画像データの区分データであるトラック単位またはサンプル単位の区分データ単位で前記スキーム情報ボックスを取得する請求項14に記載の画像処理装置。
【請求項16】
画像データの符号化データと、該符号化データの管理情報を含むMP4ファイルを記録した情報記録媒体であり、
前記管理情報は、前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を階層化して記録した構成であり、
MP4ファイルを読み取り再生する装置において、階層化されたデータ構成情報を順次取得して、取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行することを可能としたことを特徴とする情報記録媒体。
【請求項17】
画像処理装置において実行する画像処理方法であり、
エンコード部が、画像データの符号化処理を実行するエンコード処理ステップと、
ファイル生成部が、前記エンコード部の生成した符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを生成するファイル生成ステップを有し、
前記ファイル生成ステップは、
前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を生成し、複数のカテゴリ単位のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成するステップを含む画像処理方法。
【請求項18】
画像処理装置において実行する画像処理方法であり、
ファイル解析部が、画像データの符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを解析するファイル解析ステップと、
データ処理部が、前記ファイルに格納された画像データの再生処理に際して複数の異なるカテゴリのデータ処理を実行するデータ処理ステップを有し、
前記ファイルの管理情報は、データ処理のカテゴリ単位で各処理の実行に必要となるデータ構成情報を階層化して記録した構成を有し、
前記ファイル解析ステップは、前記ファイルの管理情報の階層化されたデータ構成情報を取得するステップを含み、
前記データ処理ステップは、前記ファイル解析部の取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行するステップを含む画像処理方法。
【請求項19】
画像処理装置において画像処理を実行させるプログラムであり、
エンコード部に、画像データの符号化処理を実行させるエンコード処理ステップと、
ファイル生成部に、前記エンコード部の生成した符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを生成させるファイル生成ステップを有し、
前記ファイル生成ステップは、
前記符号化データの再生処理時のデータ処理に適用する情報をデータ処理のカテゴリ単位で設定したデータ構成情報を生成し、複数のカテゴリ単位のデータ構成情報を階層化して前記管理情報中に記録したファイルを生成するステップを含むプログラム。
【請求項20】
画像処理装置において画像処理を実行させるプログラムであり、
ファイル解析部に、画像データの符号化データと、該符号化データの管理情報を含む符号化データ格納ファイルを解析させるファイル解析ステップと、
データ処理部に、前記ファイルに格納された画像データの再生処理に際して複数の異なるカテゴリのデータ処理を実行させるデータ処理ステップを有し、
前記ファイルの管理情報は、データ処理のカテゴリ単位で各処理の実行に必要となるデータ構成情報を階層化して記録した構成を有し、
前記ファイル解析ステップは、前記ファイルの管理情報の階層化されたデータ構成情報を取得するステップを含み、
前記データ処理ステップは、前記ファイル解析部の取得したデータ構成情報を適用して複数の異なるカテゴリのデータ処理を実行するステップを含むプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2011−142586(P2011−142586A)
【公開日】平成23年7月21日(2011.7.21)
【国際特許分類】
【出願番号】特願2010−3275(P2010−3275)
【出願日】平成22年1月8日(2010.1.8)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】