映像データ符号化装置および方法、記録媒体、並びにプログラム

【課題】記録媒体に記録する情報の管理を容易にできるようにする。
【解決手段】ステップＳ２０で、トランスポートストリームの多重化ビットレートTS_recording_rateおよびビデオ符号化の平均ビットレートが設定される。ステップＳ２１で、ビデオストリームを、あらかじめ設定した所定の時間区間毎に所定の平均ビットレートが保証される様に、可変ビットレートでエンコードするようにビデオエンコーダが制御される。ステップＳ２２で、トランスポートパケット化するエレメンタリストリームがない場合にヌルパケットを発生しないようにマルチプレクサが制御される。ステップＳ２３で、各トランスポートパケットにアライバルタイムスタンプを付加して、ソースパケット化するように、ソースパケッタイザ１９が制御される。本技術は、例えばＨＤＤレコーダに適用できる。

【発明の詳細な説明】
【技術分野】
【０００１】
本技術は映像データ符号化装置および方法、記録媒体、並びにプログラムに関し、特に、記録媒体に記録されているデータの内容の管理情報をファイル化して記録する映像データ符号化装置および方法、記録媒体、並びにプログラムに関する。
【背景技術】
【０００２】
近年、記録再生装置から取り外し可能なディスク型の記録媒体として、各種の光ディスクが提案されつつある。このような記録可能な光ディスクは、数ギガバイトの大容量メディアとして提案されており、ビデオ信号等のAV(Audio Visual)信号を記録するメディアとしての期待が高い。この記録可能な光デイスクに記録するデジタルのAV信号のソース（供給源）としては、CSデジタル衛星放送やBSデジタル放送があり、また、将来はデジタル方式の地上波テレビジョン放送等も提案されている。
【０００３】
ここで、これらのソースから供給されるデジタルビデオ信号は、通常MPEG（Moving Picture Experts Group）２方式で画像圧縮されているのが一般的である。また、記録装置には、その装置固有の記録レートが定められている。従来の民生用映像蓄積メディアで、デジタル放送由来のデジタルビデオ信号を記録する場合、アナログ記録方式であれば、デジタルビデオ信号をデコード後、帯域制限をして記録する。あるいは、MPEG１ Video、MPEG２ Video、DV方式をはじめとするデジタル記録方式であれば、１度デコードされた後に、その装置固有の記録レート・符号化方式で再エンコードされて記録される。
【０００４】
しかしながら、このような記録方法は、供給されたビットストリームを１度デコードし、その後で帯域制限や再エンコードを行って記録するため、画質の劣化を伴う。画像圧縮されたデジタル信号の記録をする場合、入力されたデジタル信号の伝送レートが記録再生装置の記録レートを超えない場合には、供給されたビットストリームをデコードや再エンコードすることなく、そのまま記録する方法が最も画質の劣化が少ない。ただし、画像圧縮されたデジタル信号の伝送レートが記録媒体としてのディスクの記録レートを超える場合には、記録再生装置でデコード後、伝送レートがディスクの記録レートの上限以下になるように、再エンコードをして記録する必要はある。
【０００５】
また、入力デジタル信号のビットレートが時間により増減する可変レート方式によって伝送されている場合には、回転ヘッドが固定回転数であるために記録レートが固定レートになるテープ記録方式に比べ、１度バッファにデータを蓄積し、バースト的に記録ができるディスク記録装置が記録媒体の容量をより無駄なく利用できる。
【０００６】
以上のように、デジタル放送が主流となる将来においては、データストリーマのように放送信号をデジタル信号のまま、デコードや再エンコードすることなく記録し、記録媒体としてディスクを使用した記録再生装置が求められると予測される。
【発明の開示】
【発明が解決しようとする課題】
【０００７】
上述したように、記録媒体の容量が増大することにより、その記録媒体には、多くのデータ（この場合、番組に関する映像や音声など）が記録できるようになる。従って、１枚のディスクに多くの番組が記録されることになり、ユーザが、それらのディスク内に記録されている多くの番組から視聴したい１番組を選択するといったような操作が煩雑になってしまう。そこで、ユーザがディスクの再生時に、簡便に記録されているデータを確認し、所望の番組（データ）が選択できるようにする必要があるといった課題があった。
【０００８】
本技術はこのような状況に鑑みてなされたものであり、記録媒体に記録されているデータの内容の管理情報をファイル化して記録する事により、記録媒体に記録されているデータ内容、および、再生情報を適切に管理することができるようにする。
【課題を解決するための手段】
【０００９】
本技術の一側面の映像データ符号化装置は、映像データを、所定の時間毎にビットレートを変更する可変ビットレートにより符号化する符号化器と、記録してからの時間経過に対して符号化される前記映像データのファイルサイズが比例するように、前記所定の時間内では固定ビットレートとし、単位時間あたりの映像符号化データ発生量が所定量に満たない場合、スタッフィングバイトを符号化し映像符号化データに挿入してＶＢＶ制御を行う制御部とを有する。
【００１０】
前記所定の時間はＧＯＰであるようにすることができる。
【００１１】
前記制御部は、前記所定の時間区間毎の時間経過に対して符号化データ量が所定の誤差の範囲内で比例するような符号化制御を行う第１の符号化モードと、前記符号化制御を行わない第２の符号化モードのどちらか一方で符号化するように制御することができる。
【００１２】
前記制御部は、前記所定の時間区間毎の時間経過に対して前記符号化データ量が前記所定の誤差の範囲内で比例するように符号化する前記第１の符号化モードか否かを示す付加情報を生成することができる。
【００１３】
本技術の一側面の映像データ符号化方法、記録媒体、またはプログラムは、映像データを、所定の時間毎にビットレートを変更する可変ビットレートにより符号化する符号化ステップと、記録してからの時間経過に対して符号化される前記映像データのファイルサイズが比例するように、前記所定の時間内では固定ビットレートとし、単位時間あたりの映像符号化データ発生量が所定量に満たない場合、スタッフィングバイトを符号化し映像符号化データに挿入してＶＢＶ制御を行う制御ステップとを含む映像データ符号化方法、コンピュータに実行させるコンピュータが読み取り可能なプログラムが記録されている記録媒体、またはプログラムである。
【００１４】
本技術の一側面においては、映像データが、所定の時間毎にビットレートを変更する可変ビットレートにより符号化され、記録してからの時間経過に対して符号化される映像データのファイルサイズが比例するように、所定の時間内では固定ビットレートとし、単位時間あたりの映像符号化データ発生量が所定量に満たない場合、スタッフィングバイトを符号化し映像符号化データに挿入してＶＢＶ制御が行われる。
【発明の効果】
【００１５】
本技術の側面によれば、記録媒体に記録する情報の管理を容易にすることが可能になる。
【図面の簡単な説明】
【００１６】
【図１】本技術を適用した記録再生装置の一実施の形態の構成を示す図である。
【図２】記録再生装置により記録媒体に記録されるデータのフォーマットについて説明する図である。
【図３】Real PlayListとVirtual PlayListについて説明する図である。
【図４】Real PlayListの作成について説明する図である。
【図５】Real PlayListの削除について説明する図である。
【図６】アセンブル編集について説明する図である。
【図７】Virtual PlayListにサブパスを設ける場合について説明する図である。
【図８】PlayListの再生順序の変更について説明する図である。
【図９】PlayList上のマークとClip上のマークについて説明する図である。
【図１０】メニューサムネイルについて説明する図である。
【図１１】PlayListに付加されるマークについて説明する図である。
【図１２】クリップに付加されるマークについて説明する図である。
【図１３】PlayList、Clip、サムネイルファイルの関係について説明する図である。
【図１４】ディレクトリ構造について説明する図である。
【図１５】info.dvrのシンタクスを示す図である。
【図１６】DVR volumeのシンタクスを示す図である。
【図１７】Resumevolumeのシンタクスを示す図である。
【図１８】UIAppInfovolumeのシンタクスを示す図である。
【図１９】Character set valueのテーブルを示す図である。
【図２０】TableOfPlayListのシンタクスを示す図である。
【図２１】TableOfPlayListの他のシンタクスを示す図である。
【図２２】MakersPrivateDataのシンタクスを示す図である。
【図２３】xxxxx.rplsとyyyyy.vplsのシンタクスを示す図である。
【図２４】PlayListについて説明する図である。
【図２５】PlayListのシンタクスを示す図である。
【図２６】PlayList_typeのテーブルを示す図である。
【図２７】UIAppinfoPlayListのシンタクスを示す図である。
【図２８】UIAppinfoPlayListのシンタクス内のフラグについて説明する図である。
【図２９】PlayItemについて説明する図である。
【図３０】PlayItemについて説明する図である。
【図３１】PlayItemについて説明する図である。
【図３２】PlayItemのシンタクスを示す図である。
【図３３】IN_timeについて説明する図である。
【図３４】OUT_timeについて説明する図である。
【図３５】Connection_Conditionのテーブルを示す図である。
【図３６】Connection_Conditionについて説明する図である。
【図３７】BridgeSequenceInfoを説明する図である。
【図３８】BridgeSequenceInfoのシンタクスを示す図である。
【図３９】SubPlayItemについて説明する図である。
【図４０】SubPlayItemのシンタクスを示す図である。
【図４１】SubPath_typeのテーブルを示す図である。
【図４２】PlayListMarkのシンタクスを示す図である。
【図４３】Mark_typeのテーブルを示す図である。
【図４４】Mark_time_stampを説明する図である。
【図４５】zzzzz.clipのシンタクスを示す図である。
【図４６】ClipInfoのシンタクスを示す図である。
【図４７】Clip_stream_typeのテーブルを示す図である。
【図４８】offset_SPNについて説明する図である。
【図４９】offset_SPNについて説明する図である。
【図５０】ＳＴＣ区間について説明する図である。
【図５１】STC_Infoについて説明する図である。
【図５２】STC_Infoのシンタクスを示す図である。
【図５３】ProgramInfoを説明する図である。
【図５４】ProgramInfoのシンタクスを示す図である。
【図５５】VideoCondingInfoのシンタクスを示す図である。
【図５６】Video_formatのテーブルを示す図である。
【図５７】frame_rateのテーブルを示す図である。
【図５８】display_aspect_ratioのテーブルを示す図である。
【図５９】AudioCondingInfoのシンタクスを示す図である。
【図６０】audio_codingのテーブルを示す図である。
【図６１】audio_component_typeのテーブルを示す図である。
【図６２】sampling_frequencyのテーブルを示す図である。
【図６３】CPIについて説明する図である。
【図６４】CPIについて説明する図である。
【図６５】CPIのシンタクスを示す図である。
【図６６】CPI_typeのテーブルを示す図である。
【図６７】ビデオEP_mapについて説明する図である。
【図６８】EP_mapについて説明する図である。
【図６９】EP_mapについて説明する図である。
【図７０】EP_mapのシンタクスを示す図である。
【図７１】EP_type valuesのテーブルを示す図である。
【図７２】EP_map_for_one_stream_PIDのシンタクスを示す図である。
【図７３】TU_mapについて説明する図である。
【図７４】TU_mapのシンタクスを示す図である。
【図７５】ClipMarkのシンタクスを示す図である。
【図７６】mark_typeのテーブルを示す図である。
【図７７】mark_type_stampのテーブルを示す図である。
【図７８】menu.thmbとmark.thmbのシンタクスを示す図である。
【図７９】Thumbnailのシンタクスを示す図である。
【図８０】thumbnail_picture_formatのテーブルを示す図である。
【図８１】tn_blockについて説明する図である。
【図８２】DVR MPEG２のトランスポートストリームの構造について説明する図である。
【図８３】DVR MPEG２のトランスポートストリームのレコーダモデルを示す図である。
【図８４】DVR MPEG２のトランスポートストリームのプレーヤモデルを示す図である。
【図８５】source packetのシンタクスを示す図である。
【図８６】TP_extra_headerのシンタクスを示す図である。
【図８７】copy permission indicatorのテーブルを示す図である。
【図８８】シームレス接続について説明する図である。
【図８９】シームレス接続について説明する図である。
【図９０】シームレス接続について説明する図である
【図９１】シームレス接続について説明する図である。
【図９２】シームレス接続について説明する図である
【図９３】オーディオのオーバーラップについて説明する図である。
【図９４】BridgeSequenceを用いたシームレス接続について説明する図である。
【図９５】BridgeSequenceを用いないシームレス接続について説明する図である。
【図９６】DVR STDモデルを示す図である。
【図９７】復号、表示のタイミングチャートを示す図である。
【図９８】図１のAVエンコーダの動作を説明する図である。
【図９９】ビデオを可変ビットレート符号化して、AVストリームを記録する動作を説明するフローチャートである。
【図１００】Video Buffering Verifierを説明する図である。
【図１０１】VBV制御を説明する図である。
【図１０２】VBV制御を説明する図である。
【図１０３】可変ビットレートを制御する場合の例を示す図である。
【図１０４】可変ビットレート制御の場合の例を示す図である。
【図１０５】図９９のステップＳ２１の詳細を説明するフローチャートである。
【図１０６】図１０６のステップＳ２０５の詳細を説明するフローチャートである。
【図１０７】ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係を説明する図である。
【図１０８】ビデオを可変ビットレート符号化して、AVストリームを記録する動作を説明するフローチャートである。
【図１０９】図１０８のステップＳ４００の詳細を説明するフローチャートである。
【図１１０】ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、比例することを保証する符号化モードを説明するフローチャートである。
【図１１１】ミニマイズのオペレーションの例を示す図である。
【図１１２】ミニマイズの時にIN_timeの前の不要なストリームデータを消去する例を示す図である。
【図１１３】ミニマイズの時にOUT_timeの後ろの不要なストリームデータを消去する例を示す図である。
【図１１４】EP_mapの作成の動作例を示すフローチャートである。
【図１１５】媒体を説明する図である。
【発明を実施するための最良の形態】
【００１７】
以下に、本技術の実施の形態について、図面を参照して説明する。図１は、本技術を適用した記録再生装置１の内部構成例を示す図である。まず、外部から入力された信号を記録媒体に記録する動作を行う部分の構成について説明する。記録再生装置１は、アナログデータ、または、デジタルデータを入力し、記録することができる構成とされている。
【００１８】
端子１１には、アナログのビデオ信号が、端子１２には、アナログのオーディオ信号が、それぞれ入力される。端子１１に入力されたビデオ信号は、解析部１４とAVエンコーダ１５に、それぞれ出力される。端子１２に入力されたオーディオ信号は、AVエンコーダ１５に出力される。解析部１４は、入力されたビデオ信号からシーンチェンジなどの特徴点を抽出する。
【００１９】
AVエンコーダ１５は、入力されたビデオ信号とオーディオ信号を、それぞれ符号化し、符号化ビデオストリーム(V)、符号化オーディオストリーム(A)、およびAV同期等のシステム情報(S)をマルチプレクサ１６に出力する。
【００２０】
符号化ビデオストリームは、例えば、MPEG（Moving Picture Expert Group）２方式により符号化されたビデオストリームであり、符号化オーディオストリームは、例えば、MPEG１方式により符号化されたオーディオストリームや、ドルビーAC3方式により符号化されたオーディオストリーム等である。マルチプレクサ１６は、入力されたビデオおよびオーディオのストリームを、入力システム情報に基づいて多重化して、スイッチ１７を介して多重化ストリーム解析部１８とソースパケッタイザ１９に出力する。
【００２１】
多重化ストリームは、例えば、MPEG2トランスポートストリームやMPEG2プログラムストリームである。ソースパケッタイザ１９は、入力された多重化ストリームを、そのストリームを記録させる記録媒体１００のアプリケーションフォーマットに従って、ソースパケットから構成されるAVストリームを符号化する。AVストリームは、ECC（誤り訂正）符号化部２０、変調部２１で所定の処理が施され、書き込み部２２に出力される。書き込み部２２は、制御部２３から出力される制御信号に基づいて、記録媒体１００にAVストリームファイルを書き込む（記録する）。
【００２２】
デジタルインタフェースまたはデジタルテレビジョンチューナから入力されるデジタルテレビジョン放送等のトランスポートストリームは、端子１３に入力される。端子１３に入力されたトランスポートストリームの記録方式には、２通りあり、それらは、トランスペアレントに記録する方式と、記録ビットレートを下げるなどの目的のために再エンコードをした後に記録する方式である。記録方式の指示情報は、ユーザインタフェースとしての端子２４から制御部２３へ入力される。
【００２３】
入力トランスポートストリームをトランスペアレントに記録する場合、端子１３に入力されたトランスポートストリームは、多重化ストリーム解析部１８と、ソースパケッタイザ１９に出力される。これ以降の記録媒体１００へAVストリームが記録されるまでの処理は、上述の入力オーディオ浸透とビデオ信号を符号化して記録する場合と同一の処理なので、その説明は省略する。
【００２４】
入力トランスポートストリームを再エンコードした後に記録する場合、端子１３に入力されたトランスポートストリームは、デマルチプレクサ２６に入力される。デマルチプレクサ２６は、入力されたトランスポートストリームに対してデマルチプレクス処理を施し、ビデオストリーム(V)、オーディオストリーム(A)、およびシステム情報(S)を抽出する。
【００２５】
デマルチプレクサ２６により抽出されたストリーム（情報）のうち、ビデオストリームはAVデコーダ２７に、オーディオストリームとシステム情報はマルチプレクサ１６に、それぞれ出力される。AVデコーダ２７は、入力されたビデオストリームを復号し、その再生ビデオ信号をAVエンコーダ１５に出力する。AVエンコーダ１５は、入力ビデオ信号を符号化し、符号化ビデオストリーム(V)をマルチプレクサ１６に出力する。
【００２６】
一方、デマルチプレクサ２６から出力され、マルチプレクサ１６に入力されたオーディオストリームとシステム情報、および、AVエンコーダ１５から出力されたビデオストリームは、入力システム情報に基づいて、多重化されて、多重化ストリームとして多重化ストリーム解析部１８とソースパケットタイザ１９にスイッチ１７を介して出力される。これ以後の記録媒体１００へAVストリームが記録されるまでの処理は、上述の入力オーディオ信号とビデオ信号を符号化して記録する場合と同一の処理なので、その説明は省略する。
【００２７】
本実施の形態の記録再生装置１は、AVストリームのファイルを記録媒体１００に記録すると共に、そのファイルを説明するアプリケーションデータベース情報も記録する。アプリケーションデータベース情報は、制御部２３により作成される。制御部２３への入力情報は、解析部１４からの動画像の特徴情報、多重化ストリーム解析部１８からのAVストリームの特徴情報、および端子２４から入力されるユーザからの指示情報である。
【００２８】
解析部１４から供給される動画像の特徴情報は、入力動画像信号の中の特徴的な画像に関係する情報であり、例えば、プログラムの開始点、シーンチェンジ点、コマーシャル（ＣＭ）の開始・終了点などの指定情報（マーク）であり、また、その指定場所の画像のサムネイル画像の情報も含まれる。
【００２９】
多重化ストリーム解析部１８からのAVストリームの特徴情報は、記録されるAVストリームの符号化情報に関係する情報であり、例えば、AVストリーム内のIピクチャのアドレス情報、AVストリームの符号化パラメータ、AVストリームの中の符号化パラメータの変化点情報、ビデオストリームの中の特徴的な画像に関係する情報（マーク）などである。
【００３０】
端子２４からのユーザの指示情報は、AVストリームの中の、ユーザが指定した再生区間の指定情報、その再生区間の内容を説明するキャラクター文字、ユーザが好みのシーンにセットするブックマークやリジューム点の情報などである。
【００３１】
制御部２３は、上記の入力情報に基づいて、AVストリームのデータベース(Clip)、 AVストリームの再生区間(PlayItem)をグループ化したもの（PlayList）のデータベース、記録媒体１００の記録内容の管理情報(info.dvr)、およびサムネイル画像の情報を作成する。これらの情報から構成されるアプリケーションデータベース情報は、AVストリームと同様にして、ECC符号化部２０、変調部２１で処理されて、書き込み部２２へ入力される。書き込み部２２は、制御部２３から出力される制御信号に基づいて、記録媒体１００へデータベースファイルを記録する。
【００３２】
上述したアプリケーションデータベース情報についての詳細は後述する。
【００３３】
このようにして記録媒体１００に記録されたAVストリームファイル（画像データと音声データのファイル）と、アプリケーションデータベース情報が再生される場合、まず、制御部２３は、読み出し部２８に対して、記録媒体１００からアプリケーションデータベース情報を読み出すように指示する。そして、読み出し部２８は、記録媒体１００からアプリケーションデータベース情報を読み出し、そのアプリケーションデータベース情報は、復調部２９、ECC復号部３０の処理を経て、制御部２３へ入力される。
【００３４】
制御部２３は、アプリケーションデータベース情報に基づいて、記録媒体１００に記録されているPlayListの一覧を端子２４のユーザインタフェースへ出力する。ユーザは、PlayListの一覧から再生したいPlayListを選択し、再生を指定されたPlayListに関する情報が制御部２３へ入力される。制御部２３は、そのPlayListの再生に必要なAVストリームファイルの読み出しを、読み出し部２８に指示する。読み出し部２８は、その指示に従い、記録媒体１００から対応するAVストリームを読み出し復調部２９に出力する。復調部２９に入力されたAVストリームは、所定の処理が施されることにより復調され、さらにECC復号部３０の処理を経て、ソースデパケッタイザ３１出力される。
【００３５】
ソースデパケッタイザ３１は、記録媒体１００から読み出され、所定の処理が施されたアプリケーションフォーマットのAVストリームを、デマルチプレクサ２６に出力できるストリームに変換する。デマルチプレクサ２６は、制御部２３により指定されたAVストリームの再生区間(PlayItem)を構成するビデオストリーム(V)、オーディオストリーム(A)、およびAV同期等のシステム情報(S)を、AVデコーダ２７に出力する。AVデコーダ２７は、ビデオストリームとオーディオストリームを復号し、再生ビデオ信号と再生オーディオ信号を、それぞれ対応する端子３２と端子３３から出力する。
【００３６】
また、ユーザインタフェースとしての端子２４から、ランダムアクセス再生や特殊再生を指示する情報が入力された場合、制御部２３は、AVストリームのデータベース(Clip)の内容に基づいて、記憶媒体１００からのAVストリームの読み出し位置を決定し、そのAVストリームの読み出しを、読み出し部２８に指示する。例えば、ユーザにより選択されたPlayListを、所定の時刻から再生する場合、制御部２３は、指定された時刻に最も近いタイムスタンプを持つIピクチャからのデータを読み出すように読み出し部２８に指示する。
【００３７】
また、ユーザによって高速再生(Fast-forward playback)が指示された場合、制御部２３は、AVストリームのデータベース(Clip)に基づいて、AVストリームの中のI-ピクチャデータを順次連続して読み出すように読み出し部２８に指示する。
【００３８】
読み出し部２８は、指定されたランダムアクセスポイントからAVストリームのデータを読み出し、読み出されたデータは、後段の各部の処理を経て再生される。
【００３９】
次に、ユーザが、記録媒体１００に記録されているAVストリームの編集をする場合を説明する。ユーザが、記録媒体１００に記録されているAVストリームの再生区間を指定して新しい再生経路を作成したい場合、例えば、番組Ａという歌番組から歌手Ａの部分を再生し、その後続けて、番組Ｂという歌番組の歌手Ａの部分を再生したいといった再生経路を作成したい場合、ユーザインタフェースとしての端子２４から再生区間の開始点（イン点）と終了点（アウト点）の情報が制御部２３に入力される。制御部２３は、AVストリームの再生区間(PlayItem)をグループ化したもの（PlayList）のデータベースを作成する。
【００４０】
ユーザが、記録媒体１００に記録されているAVストリームの一部を消去したい場合、ユーザインタフェースとしての端子２４から消去区間のイン点とアウト点の情報が制御部２３に入力される。制御部２３は、必要なAVストリーム部分だけを参照するようにPlayListのデータベースを変更する。また、AVストリームの不必要なストリーム部分を消去するように、書き込み部２２に指示する。
【００４１】
ユーザが、記録媒体１００に記録されているAVストリームの再生区間を指定して新しい再生経路を作成したい場合であり、かつ、それぞれの再生区間をシームレスに接続したい場合について説明する。このような場合、制御部２３は、AVストリームの再生区間(PlayItem)をグループ化したもの（PlayList）のデータベースを作成し、さらに、再生区間の接続点付近のビデオストリームの部分的な再エンコードと再多重化を行う。
【００４２】
まず、端子２４から再生区間のイン点のピクチャの情報と、アウト点のピクチャの情報が制御部２３へ入力される。制御部２３は、読み出し部２８にイン点側ピクチャとアウト点側のピクチャを再生するために必要なデータの読み出しを指示する。そして、読み出し部２８は、記録媒体１００からデータを読み出し、そのデータは、復調部２９、ECC復号部３０、ソースデパケッタイザ３１を経て、デマルチプレクサ２６に出力される。
【００４３】
制御部２３は、デマルチプレクサ２６に入力されたデータを解析して、ビデオストリームの再エンコード方法（picture_coding_typeの変更、再エンコードする符号化ビット量の割り当て）と、再多重化方式を決定し、その方式をAVエンコーダ１５とマルチプレクサ１６に供給する。
【００４４】
次に、デマルチプレクサ２６は、入力されたストリームをビデオストリーム(V)、オーディオストリーム(A)、およびシステム情報(S)に分離する。ビデオストリームは、「AVデコーダ２７に入力されるデータ」と「マルチプレクサ１６に入力されるデータ」がある。前者のデータは、再エンコードするために必要なデータであり、これはAVデコーダ２７で復号され、復号されたピクチャはAVエンコーダ１５で再エンコードされて、ビデオストリームにされる。後者のデータは、再エンコードをしないで、オリジナルのストリームからコピーされるデータである。オーディオストリーム、システム情報については、直接、マルチプレクサ１６に入力される。
【００４５】
マルチプレクサ１６は、制御部２３から入力された情報に基づいて、入力ストリームを多重化し、多重化ストリームを出力する。多重化ストリームは、ECC符号化部２０、変調部２１で処理されて、書き込み部２２に入力される。書き込み部２２は、制御部２３から供給される制御信号に基づいて、記録媒体１００にAVストリームを記録する。
【００４６】
以下に、アプリケーションデータベース情報や、その情報に基づく再生、編集といった操作に関する説明をする。図２は、アプリケーションフォーマットの構造を説明する図である。アプリケーションフォーマットは、AVストリームの管理のためにPlayListとClipの２つのレイヤをもつ。Volume Informationは、ディスク内のすべてのClipとPlayListの管理をする。ここでは、１つのAVストリームとその付属情報のペアを１つのオブジェクトと考え、それをClipと称する。AVストリームファイルはClip AV stream fileと称し、その付属情報は、Clip Information fileと称する。
【００４７】
１つのClip AV stream fileは、MPEG2トランスポートストリームをアプリケーションフォーマットによって規定される構造に配置したデータをストアする。一般的に、ファイルは、バイト列として扱われるが、Clip AV stream fileのコンテンツは、時間軸上に展開され、Clipの中のエントリーポイントは、主に時間ベースで指定される。所定のClipへのアクセスポイントのタイムスタンプが与えられた時、Clip Information fileは、Clip AV stream fileの中でデータの読み出しを開始すべきアドレス情報を見つけるために役立つ。
【００４８】
PlayListについて、図３を参照して説明する。PlayListは、Clipの中からユーザが見たい再生区間を選択し、それを簡単に編集することができるようにするために設けられている。１つのPlayListは、Clipの中の再生区間の集まりである。所定のClipの中の１つの再生区間は、PlayItemと呼ばれ、それは、時間軸上のイン点（IN）とアウト点（OUT）の対で表される。従って、PlayListは、複数のPlayItemが集まることにより構成される。
【００４９】
PlayListには、２つのタイプがある。１つは、Real PlayListであり、もう１つは、Virtual PlayListである。Real PlayListは、それが参照しているClipのストリーム部分を共有している。すなわち、Real PlayListは、それの参照しているClipのストリーム部分に相当するデータ容量をディスクの中で占め、Real PlayListが消去された場合、それが参照しているClipのストリーム部分もまたデータが消去される。
【００５０】
Virtual PlayListは、Clipのデータを共有していない。従って、Virtual PlayListが変更または消去されたとしても、Clipの内容には何も変化が生じない。
【００５１】
次に、Real PlayListの編集について説明する。図４（Ａ）は、Real PlayListのクリエイト(create：作成)に関する図であり、AVストリームが新しいClipとして記録される場合、そのClip全体を参照するReal PlayListが新たに作成される操作である。
【００５２】
図４（Ｂ）は、Real PlayListのディバイド(divide：分割)に関する図であり、Real PlayListが所望な点で分けられて、２つのReal PlayListに分割される操作である。この分割という操作は、例えば、１つのPlayListにより管理される１つのクリップ内に、２つの番組が管理されているような場合に、ユーザが１つ１つの番組として登録（記録）し直したいといったようなときに行われる。この操作により、Clipの内容が変更される（Clip自体が分割される）ことはない。
【００５３】
図４（Ｃ）は、Real PlayListのコンバイン(combine：結合)に関する図であり、２つのReal PlayListを結合して、１つの新しいReal PlayListにする操作である。この結合という操作は、例えば、ユーザが２つの番組を１つの番組として登録し直したいといったようなときに行われる。この操作により、Clipが変更される（Clip自体が１つにされる）ことはない。
【００５４】
図５（Ａ）は、Real PlayList全体のデリート(delete：削除)に関する図であり、所定のReal PlayList全体を消去する操作がされた場合、削除されたReal PlayListが参照するClipの、対応するストリーム部分も削除される。
【００５５】
図５（Ｂ）は、Real PlayListの部分的な削除に関する図であり、Real PlayListの所望な部分が削除された場合、対応するPlayItemが、必要なClipのストリーム部分だけを参照するように変更される。そして、Clipの対応するストリーム部分は削除される。
【００５６】
図５（Ｃ）は、Real PlayListのミニマイズ(Minimize：最小化)に関する図であり、Real PlayListに対応するPlayItemを、Virtual PlayListに必要なClipのストリーム部分だけを参照するようにする操作である。Virtual PlayList にとって不必要なClipの、対応するストリーム部分は削除される。
【００５７】
上述したような操作により、Real PlayListが変更されて、そのReal PlayListが参照するClipのストリーム部分が削除された場合、その削除されたClipを使用しているVirtual PlayListが存在し、そのVirtual PlayListにおいて、削除されたClipにより問題が生じる可能性がある。
【００５８】
そのようなことが生じないように、ユーザに、削除という操作に対して、「そのReal PlayListが参照しているClipのストリーム部分を参照しているVirtual PlayListが存在し、もし、そのReal PlayListが消去されると、そのVirtual PlayListもまた消去されることになるが、それでも良いか？」といったメッセージなどを表示させることにより、確認（警告）を促した後に、ユーザの指示により削除の処理を実行、または、キャンセルする。または、Virtual PlayListを削除する代わりに、Real PlayListに対してミニマイズの操作が行われるようにする。
【００５９】
次にVirtual PlayListに対する操作について説明する。Virtual PlayListに対して操作が行われたとしても、Clipの内容が変更されることはない。図６は、アセンブル(Assemble) 編集 (IN-OUT 編集)に関する図であり、ユーザが見たいと所望した再生区間のPlayItemを作り、Virtual PlayListを作成するといった操作である。PlayItem間のシームレス接続が、アプリケーションフォーマットによりサポートされている（後述）。
【００６０】
図６（Ａ）に示したように、２つのReal PlayList１，２と、それぞれのRealPlayListに対応するClip１，２が存在している場合に、ユーザがReal PlayList１内の所定の区間（In１乃至Out１までの区間：PlayItem１）を再生区間として指示し、続けて再生する区間として、Real PlayList２内の所定の区間（In２乃至Out２までの区間：PlayItem２）を再生区間として指示したとき、図６（Ｂ）に示すように、PlayItem１とPlayItem２から構成される１つのVirtual PlayListが作成される。
【００６１】
次に、Virtual PlayList の再編集(Re-editing)について説明する。再編集には、Virtual PlayListの中のイン点やアウト点の変更、Virtual PlayListへの新しいPlayItemの挿入(insert)や追加(append)、Virtual PlayListの中のPlayItemの削除などがある。また、Virtual PlayListそのものを削除することもできる。
【００６２】
図７は、Virtual PlayListへのオーディオのアフレコ(Audio dubbing (post recording))に関する図であり、Virtual PlayListへのオーディオのアフレコをサブパスとして登録する操作のことである。このオーディオのアフレコは、アプリケーションフォーマットによりサポートされている。Virtual PlayListのメインパスのAVストリームに、付加的なオーディオストリームが、サブパスとして付加される。
【００６３】
Real PlayListとVirtual PlayListで共通の操作として、図８に示すようなPlayListの再生順序の変更(Moving)がある。この操作は、ディスク(ボリューム)の中でのPlayListの再生順序の変更であり、アプリケーションフォーマットにおいて定義されるTable Of PlayList（図２０などを参照して後述する）によってサポートされる。この操作により、Clipの内容が変更されるようなことはない。
【００６４】
次に、マーク（Mark）について説明する。マークは、ClipおよびPlayListの中のハイライトや特徴的な時間を指定するために設けられている。Clipに付加されるマークは、AVストリームの内容に起因する特徴的なシーンを指定する、例えば、シーンチェンジ点などである。PlayListを再生する時、そのPlayListが参照するClipのマークを参照して、使用する事ができる。
【００６５】
PlayListに付加されるマークは、主にユーザによってセットされる、例えば、ブックマークやリジューム点などである。ClipまたはPlayListにマークをセットすることは、マークの時刻を示すタイムスタンプをマークリストに追加することにより行われる。また、マークを削除することは、マークリストの中から、そのマークのタイムスタンプを除去する事である。従って、マークの設定や削除により、AVストリームは何の変更もされない。
【００６６】
次にサムネイルについて説明する。サムネイルは、Volume、PlayList、およびClipに付加される静止画である。サムネイルには、２つの種類があり、１つは、内容を表す代表画としてのサムネイルである。これは主としてユーザがカーソル（不図示）などを操作して見たいものを選択するためのメニュー画面で使われるものである。もう１つは、マークが指しているシーンを表す画像である。
【００６７】
Volumeと各Playlistは代表画を持つことができるようにする必要がある。Volumeの代表画は、ディスク（記録媒体１００、以下、記録媒体１００はディスク状のものであるとし、適宜、ディスクと記述する）を記録再生装置１の所定の場所にセットした時に、そのディスクの内容を表す静止画を最初に表示する場合などに用いられることを想定している。Playlistの代表画は、Playlistを選択するメニュー画面において、Playlistの内容を表すための静止画として用いられることを想定している。
【００６８】
Playlistの代表画として、Playlistの最初の画像をサムネイル（代表画）にすることが考えられるが、必ずしも再生時刻０の先頭の画像が内容を表す上で最適な画像とは限らない。そこで、Playlistのサムネイルとして、任意の画像をユーザが設定できるようにする。以上２種類のサムネイルをメニューサムネイルと称する。メニューサムネイルは頻繁に表示されるため、ディスクから高速に読み出される必要がある。このため、すべてのメニューサムネイルを１つのファイルに格納することが効率的である。メニューサムネイルは、必ずしもボリューム内の動画から抜き出したピクチャである必要はなく、図１０に示すように、パーソナルコンピュータやデジタルスチルカメラから取り込こまれた画像でもよい。
【００６９】
一方、ClipとPlaylistには、複数個のマークを打てる必要があり、マーク位置の内容を知るためにマーク点の画像を容易に見ることが出来るようにする必要がある。このようなマーク点を表すピクチャをマークサムネイル（Mark Thumbnails）と称する。従って、サムネイルの元となる画像は、外部から取り込んだ画像よりも、マーク点の画像を抜き出したものが主となる。
【００７０】
図１１は、PlayListに付けられるマークと、そのマークサムネイルの関係について示す図であり、図１２は、Clipに付けられるマークと、そのマークサムネイルの関係について示す図である。マークサムネイルは、メニューサムネイルと異なり、Playlistの詳細を表す時に、サブメニュー等で使われるため、短いアクセス時間で読み出されるようなことは要求されない。そのため、サムネイルが必要になる度に、記録再生装置１がファイルを開き、そのファイルの一部を読み出すことで多少時間がかかっても、問題にはならない。
【００７１】
また、ボリューム内に存在するファイル数を減らすために、すべてのマークサムネイルは１つのファイルに格納するのがよい。Playlistはメニューサムネイル１つと複数のマークサムネイルを有することができるが、Clipは直接ユーザが選択する必要性がない（通常、Playlist経由で指定する）ため、メニューサムネイルを設ける必要はない。
【００７２】
図１３は、上述したことを考慮した場合のメニューサムネイル、マークサムネイル、PlayList、およびClipの関係について示した図である。メニューサムネイルファイルには、PlayList毎に設けられたメニューサムネイルがファイルされている。メニューサムネイルファイルには、ディスクに記録されているデータの内容を代表するボリュームサムネイルが含まれている。マークサムネイルファイルは、各PlayList毎と各Clip毎に作成されたサムネイルがファイルされている。
【００７３】
次に、CPI（Characteristic Point Information）について説明する。CPIは、Clipインフォメーションファイルに含まれるデータであり、主に、それはClipへのアクセスポイントのタイムスタンプが与えられた時、Clip AV stream fileの中でデータの読み出しを開始すべきデータアドレスを見つけるために用いられる。本実施の形態では、２種類のCPIを用いる。１つは、EP_mapであり、もう一つは、TU_mapである。
【００７４】
EP_mapは、エントリーポイント(EP)データのリストであり、それはエレメンタリストリームおよびトランスポートストリームから抽出されたものである。これは、AVストリームの中でデコードを開始すべきエントリーポイントの場所を見つけるためのアドレス情報を持つ。１つのEPデータは、プレゼンテーションタイムスタンプ（PTS）と、そのPTSに対応するアクセスユニットのAVストリームの中のデータアドレスの対で構成される。
【００７５】
EP_mapは、主に２つの目的のために使用される。第１に、PlayListの中でプレゼンテーションタイムスタンプによって参照されるアクセスユニットのAVストリームの中のデータアドレスを見つけるために使用される。第２に、ファーストフォワード再生やファーストリバース再生のために使用される。記録再生装置１が、入力AVストリームを記録する場合、そのストリームのシンタクスを解析することができるとき、EP_mapが作成され、ディスクに記録される。
【００７６】
TU_mapは、デジタルインタフェースを通して入力されるトランスポートパケットの到着時刻に基づいたタイムユニット（TU）データのリストを持つ。これは、到着時刻ベースの時間とAVストリームの中のデータアドレスとの関係を与える。記録再生装置１が、入力AVストリームを記録する場合、そのストリームのシンタクスを解析することができないとき、TU_mapが作成され、ディスクに記録される。
【００７７】
本実施の形態では、セルフエンコードのストリームフォーマット（SESF）を定義する。SESFは、アナログ入力信号を符号化する目的、およびデジタル入力信号（例えばDV）をデコードしてからMPEG2トランスポートストリームに符号化する場合に用いられる。
【００７８】
SESFは、MPEG-2トランスポートストリームおよびAVストリームについてのエレメンタリストリームの符号化制限を定義する。記録再生装置１が、SESFストリームをエンコードし、記録する場合、EP_mapが作成され、ディスクに記録される。
【００７９】
デジタル放送のストリームは、次に示す方式のうちのいずれかが用いられて記録媒体１００に記録される。まず、デジタル放送のストリームをSESFストリームにトランスコーディングする。この場合、記録されたストリームは、SESFに準拠しなければならない。この場合、EP_mapが作成されて、ディスクに記録されなければならない。
【００８０】
あるいは、デジタル放送ストリームを構成するエレメンタリストリームを新しいエレメンタリストリームにトランスコーディングし、そのデジタル放送ストリームの規格化組織が定めるストリームフォーマットに準拠した新しいトランスポートストリームに再多重化する。この場合、EP_mapが作成されて、ディスクに記録されなければならない。
【００８１】
例えば、入力ストリームがISDB（日本のデジタルBS放送の規格名称）準拠のMPEG-2トランスポートストリームであり、それがHDTVビデオストリームとMPEG AACオーディオストリームを含むとする。HDTVビデオストリームをSDTVビデオストリームにトランスコーディングし、そのSDTVビデオストリームとオリジナルのAACオーディオストリームをTSに再多重化する。SDTVストリームと記録されるトランスポートストリームは、共にISDBフォーマットに準拠しなければならない。
【００８２】
デジタル放送のストリームが、記録媒体１００に記録される際の他の方式として、入力トランスポートストリームをトランスペアレントに記録する（入力トランスポートストリームを何も変更しないで記録する）場合であり、その時にEP_mapが作成されてディスクに記録される。
【００８３】
または、入力トランスポートストリームをトランスペアレントに記録する（入力トランスポートストリームを何も変更しないで記録する）場合であり、その時にTU_mapが作成されてディスクに記録される。
【００８４】
次にディレクトリとファイルについて説明する。以下、記録再生装置１をDVR（Digital Video Recording）と適宜記述する。図１４はディスク上のディレクトリ構造の一例を示す図である。DVRのディスク上に必要なディレクトリは、図１４に示したように、"DVR"ディレクトリを含むrootディレクトリ、"PLAYLIST"ディレクトリ、"CLIPINF"ディレクトリ、"M2TS"ディレクトリ、および"DATA"ディレクトリを含む"DVR"ディレクトリである。rootディレクトリの下に、これら以外のディレクトリを作成されるようにしても良いが、それらは、本実施の形態のアプリケーションフォーマットでは、無視されるとする。
【００８５】
"DVR"ディレクトリの下には、 DVRアプリケーションフォーマットによって規定される全てのファイルとディレクトリがストアされる。"DVR"ディレクトリは、４個のディレクトリを含む。"PLAYLIST"ディレクトリの下には、Real PlayListとVirtual PlayListのデータベースファイルが置かれる。このディレクトリは、PlayListが１つもなくても存在する。
【００８６】
"CLIPINF"ディレクトリの下には、Clipのデータベースが置かれる。このディレクトリも、Clipが１つもなくても存在する。"M2TS"ディレクトリの下には、AVストリームファイルが置かれる。このディレクトリは、AVストリームファイルが１つもなくても存在する。"DATA"ディレクトリは、デジタルTV放送などのデータ放送のファイルがストアされる。
【００８７】
"DVR"ディレクトリは、次に示すファイルをストアする。"info.dvr"ファイルは、 DVRディレクトリの下に作られ、アプリケーションレイヤの全体的な情報をストアする。DVRディレクトリの下には、ただ一つのinfo.dvrがなければならない。ファイル名は、info.dvrに固定されるとする。"menu.thmb"ファイルは、メニューサムネイル画像に関連する情報をストアする。DVRディレクトリの下には、ゼロまたは１つのメニューサムネイルがなければならない。ファイル名は、memu.thmbに固定されるとする。メニューサムネイル画像が１つもない場合、このファイルは、存在しなくても良い。
【００８８】
"mark.thmb"ファイルは、マークサムネイル画像に関連する情報をストアする。DVRディレクトリの下には、ゼロまたは１つのマークサムネイルがなければならない。ファイル名は、mark.thmbに固定されるとする。メニューサムネイル画像が１つもない場合、このファイルは、存在しなくても良い。
【００８９】
"PLAYLIST"ディレクトリは、２種類のPlayListファイルをストアするものであり、それらは、Real PlayListとVirtual PlayListである。”xxxxx.rpls" ファイルは、１つのReal PlayListに関連する情報をストアする。それぞれのReal PlayList毎に、１つのファイルが作られる。ファイル名は、"xxxxx.rpls"である。ここで、"xxxxx"は、５個の０乃至９まで数字である。ファイル拡張子は、"rpls"でなければならないとする。
【００９０】
"yyyyy.vpls"ファイルは、１つのVirtual PlayListに関連する情報をストアする。それぞれのVirtual PlayList毎に、１つのファイルが作られる。ファイル名は、"yyyyy.vpls"である。ここで、"yyyyy"は、５個の０乃至９まで数字である。ファイル拡張子は、"vpls"でなければならないとする。
【００９１】
"CLIPINF"ディレクトリは、それぞれのAVストリームファイルに対応して、１つのファイルをストアする。"zzzzz.clpi" ファイルは、１つのAVストリームファイル(Clip AV stream file または Bridge-Clip AV stream file)に対応するClip Information fileである。ファイル名は、"zzzzz.clpi"であり、"zzzzz"は、５個の０乃至９までの数字である。ファイル拡張子は、"clpi"でなければならないとする。
【００９２】
"M2TS"ディレクトリは、AVストリームのファイルをストアする。"zzzzz.m2ts"ファイルは、DVRシステムにより扱われるAVストリームファイルである。これは、Clip AV stream fileまたはBridge-Clip AV streamである。ファイル名は、"zzzzz.m2ts"であり、"zzzzz"は、５個の０乃至９までの数字である。ファイル拡張子は、"m2ts"でなければならないとする。
【００９３】
”DATA”ディレクトリは、データ放送から伝送されるデータをストアするものであり、データとは、例えば、XML fileやMHEGファイルなどである。
【００９４】
次に、各ディレクトリ（ファイル）のシンタクスとセマンティクスを説明する。まず、”info.dvr”ファイルについて説明する。図１５は、”info.dvr”ファイルのシンタクスを示す図である。”info.dvr”ファイルは、３個のオブジェクトから構成され、それらは、DVRVolume()、TableOfPlayLists()、およびMakerPrivateData()である。
【００９５】
図１５に示したinfo.dvrのシンタクスについて説明するに、TableOfPlayLists_Start_addressは、info.dvrファイルの先頭のバイトからの相対バイト数を単位として、TableOfPlayList()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。
【００９６】
MakerPrivateData_Start_addressは、info.dvrファイルの先頭のバイトからの相対バイト数を単位として、MakerPrivateData()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。padding_word（パディングワード）は、info.dvrのシンタクスに従って挿入される。Ｎ１とＮ２は、ゼロまたは任意の正の整数である。それぞれのパディングワードは、任意の値を取るようにしても良い。
【００９７】
DVRVolume()は、ボリューム（ディスク）の内容を記述する情報をストアする。図１６は、DVRVolume()のシンタクスを示す図である。図１６に示したDVR Volume()のシンタクスを説明するに、version_numberは、このDVRVolume()のバージョンナンバーを示す４個のキャラクター文字を示す。version_numberは、ISO 646に従って、"0045"と符号化される。
【００９８】
lengthは、このlengthフィールドの直後からDVRVolume()の最後までのDVRVolume()のバイト数を示す３２ビットの符号なし整数で表される。
【００９９】
ResumeVolume()は、ボリュームの中で最後に再生したReal PlayListまたはVirtual PlayListのファイル名を記憶している。ただし、Real PlayListまたはVirtual PlayListの再生をユーザが中断した時の再生位置は、PlayListMark()において定義されるresume-markにストアされる。
【０１００】
図１７は、ResumeVolume()のシンタクスを示す図である。図１７に示したResumeVolume()のシンタクスを説明するに、valid_flagは、この1ビットのフラグが1にセットされている場合、resume_PlayList_nameフィールドが有効であることを示し、このフラグが０にセットされている場合、resume_PlayList_nameフィールドが無効であることを示す。
【０１０１】
resume_PlayList_nameの１０バイトのフィールドは、リジュームされるべきReal PlayListまたはVirtual PlayListのファイル名を示す。
【０１０２】
図１６に示したDVRVolume()のシンタクスのなかの、UIAppInfoVolume は、ボリュームについてのユーザインタフェースアプリケーションのパラメータをストアする。図１８は、UIAppInfoVolumeのシンタクスを示す図であり、そのセマンティクスを説明するに、character_setの８ビットのフィールドは、Volume_nameフィールドに符号化されているキャラクター文字の符号化方法を示す。その符号化方法は、図１９に示される値に対応する。
【０１０３】
name_lengthの８ビットフィールドは、Volume_nameフィールドの中に示されるボリューム名のバイト長を示す。Volume_nameのフィールドは、ボリュームの名称を示す。このフィールドの中の左からname_length数のバイト数が、有効なキャラクター文字であり、それはボリュームの名称を示す。Volume_nameフィールドの中で、それら有効なキャラクター文字の後の値は、どんな値が入っていても良い。
【０１０４】
Volume_protect_flagは、ボリュームの中のコンテンツを、ユーザに制限することなしに見せてよいかどうかを示すフラグである。このフラグが１にセットされている場合、ユーザが正しくPIN番号（パスワード）を入力できたときだけ、そのボリュームのコンテンツを、ユーザに見せる事（再生される事）が許可される。このフラグが０にセットされている場合、ユーザがPIN番号を入力しなくても、そのボリュームのコンテンツを、ユーザに見せる事が許可される。
【０１０５】
最初に、ユーザが、ディスクをプレーヤへ挿入した時点において、もしこのフラグが０にセットされているか、または、このフラグが１にセットされていてもユーザがPIN番号を正しく入力できたならば、記録再生装置１は、そのディスクの中のPlayListの一覧を表示させる。それぞれのPlayListの再生制限は、volume_protect_flagとは無関係であり、それはUIAppInfoPlayList()の中に定義されるplayback_control_flagによって示される。
【０１０６】
PINは、４個の０乃至９までの数字で構成され、それぞれの数字は、ISO/IEC 646に従って符号化される。ref_thumbnail_indexのフィールドは、ボリュームに付加されるサムネイル画像の情報を示す。ref_thumbnail_indexフィールドが、0xFFFFでない値の場合、そのボリュームにはサムネイル画像が付加されており、そのサムネイル画像は、menu.thumファイルの中にストアされている。その画像は、menu.thumファイルの中でref_thumbnail_indexの値を用いて参照される。ref_thumbnail_indexフィールドが、0xFFFF である場合、そのボリュームにはサムネイル画像が付加されていないことを示す。
【０１０７】
次に図１５に示したinfo.dvrのシンタクス内のTableOfPlayLists()について説明する。TableOfPlayLists()は、PlayList(Real PlayListとVirtual PlayList)のファイル名をストアする。ボリュームに記録されているすべてのPlayListファイルは、TableOfPlayList()の中に含まれる。TableOfPlayLists()は、ボリュームの中のPlayListのデフォルトの再生順序を示す。
【０１０８】
図２０は、TableOfPlayLists()のシンタクスを示す図であり、そのシンタクスについて説明するに、TableOfPlayListsのversion_numberは、このTableOfPlayListsのバージョンナンバーを示す４個のキャラクター文字を示す。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。
【０１０９】
lengthは、このlengthフィールドの直後からTableOfPlayLists()の最後までのTableOfPlayLists()のバイト数を示す３２ビットの符号なしの整数である。number_of_PlayListsの１６ビットのフィールドは、PlayList_file_nameを含むfor-loopのループ回数を示す。この数字は、ボリュームに記録されているPlayListの数に等しくなければならない。PlayList_file_nameの１０バイトの数字は、PlayListのファイル名を示す。
【０１１０】
図２１は、TableOfPlayLists()のシンタクスを別実施の構成を示す図である。図２１に示したシンタクスは、図２０に示したシンタクスに、UIAppinfoPlayList（後述）を含ませた構成とされている。このように、UIAppinfoPlayListを含ませた構成とすることで、TableOfPlayListsを読み出すだけで、メニュー画面を作成することが可能となる。ここでは、図２０に示したシンタクスを用いるとして以下の説明をする。
【０１１１】
図１５に示したinfo.dvrのシンタクス内のMakersPrivateDataについて説明する。MakersPrivateDataは、記録再生装置１のメーカが、各社の特別なアプリケーションのために、MakersPrivateData()の中にメーカのプライベートデータを挿入できるように設けられている。各メーカのプライベートデータは、それを定義したメーカを識別するために標準化されたmaker_IDを持つ。MakersPrivateData()は、１つ以上のmaker_IDを含んでも良い。
【０１１２】
所定のメーカが、プライベートデータを挿入したい時に、すでに他のメーカのプライベートデータがMakersPrivateData()に含まれていた場合、他のメーカは、既にある古いプライベートデータを消去するのではなく、新しいプライベートデータをMakersPrivateData()の中に追加するようにする。このように、本実施の形態においては、複数のメーカのプライベートデータが、１つのMakersPrivateData()に含まれることが可能であるようにする。
【０１１３】
図２２は、MakersPrivateDataのシンタクスを示す図である。図２２に示したMakersPrivateDataのシンタクスについて説明するに、version_numberは、このMakersPrivateData()のバージョンナンバーを示す４個のキャラクター文字を示す。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。lengthは、このlengthフィールドの直後からMakersPrivateData()の最後までのMakersPrivateData()のバイト数を示す３２ビットの符号なし整数を示す。
【０１１４】
mpd_blocks_start_addressは、MakersPrivateData()の先頭のバイトからの相対バイト数を単位として、最初のmpd_block()の先頭バイトアドレスを示す。相対バイト数はゼロからカウントされる。number_of_maker_entriesは、MakersPrivateData()の中に含まれているメーカプライベートデータのエントリー数を与える１６ビットの符号なし整数である。MakersPrivateData()の中に、同じmaker_IDの値を持つメーカプライベートデータが２個以上存在してはならない。
【０１１５】
mpd_block_sizeは、１０２４バイトを単位として、１つのmpd_blockの大きさを与える１６ビットの符号なし整数である。例えば、mpd_block_size=１ならば、それは１つのmpd_blockの大きさが１０２４バイトであることを示す。number_of_mpd_blocksは、MakersPrivateData()の中に含まれるmpd_blockの数を与える１６ビットの符号なし整数である。maker_IDは、そのメーカプライベートデータを作成したDVRシステムの製造メーカを示す１６ビットの符号なし整数である。maker_IDに符号化される値は、このDVRフォーマットのライセンサによって指定される。
【０１１６】
maker_model_codeは、そのメーカプライベートデータを作成したDVRシステムのモデルナンバーコードを示す１６ビットの符号なし整数である。maker_model_codeに符号化される値は、このフォーマットのライセンスを受けた製造メーカによって設定される。start_mpd_block_numberは、そのメーカプライベートデータが開始されるmpd_blockの番号を示す１６ビットの符号なし整数である。メーカプライベートデータの先頭データは、mpd_blockの先頭にアラインされなければならない。start_mpd_block_numberは、mpd_blockのfor-loopの中の変数jに対応する。
【０１１７】
mpd_lengthは、バイト単位でメーカプライベートデータの大きさを示す３２ビットの符号なし整数である。mpd_blockは、メーカプライベートデータがストアされる領域である。MakersPrivateData()の中のすべてのmpd_blockは、同じサイズでなければならない。
【０１１８】
次に、Real PlayList fileとVirtual PlayList fileについて、換言すれば、xxxxx.rplsとyyyyy.vplsについて説明する。図２３は、xxxxx.rpls（Real PlayList）、または、yyyyy.vpls（Virtual PlayList）のシンタクスを示す図である。xxxxx.rplsとyyyyy.vplsは、同一のシンタクス構成をもつ。xxxxx.rplsとyyyyy.vplsは、それぞれ、３個のオブジェクトから構成され、それらは、PlayList()、PlayListMark()、およびMakerPrivateData()である。
【０１１９】
PlayListMark_Start_addressは、PlayListファイルの先頭のバイトからの相対バイト数を単位として、PlayListMark()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。
【０１２０】
MakerPrivateData_Start_addressは、PlayListファイルの先頭のバイトからの相対バイト数を単位として、MakerPrivateData()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。
【０１２１】
padding_word（パディングワード）は、PlayListファイルのシンタクスにしたがって挿入され、Ｎ１とＮ２は、ゼロまたは任意の正の整数である。それぞれのパディングワードは、任意の値を取るようにしても良い。
【０１２２】
ここで、既に、簡便に説明したが、PlayListについてさらに説明する。ディスク内にあるすべてのReal PlayListによって、Bridge-Clip（後述）を除くすべてのClipの中の再生区間が参照されていなければならない。かつ、２つ以上のReal PlayListが、それらのPlayItemで示される再生区間を同一のClipの中でオーバーラップさせてはならない。
【０１２３】
図２４を参照してさらに説明するに、図２４（Ａ）に示したように、全てのClipは、対応するReal PlayListが存在する。この規則は、図２４（Ｂ）に示したように、編集作業が行われた後においても守られる。従って、全てのClipは、どれかしらのReal PlayListを参照することにより、必ず視聴することが可能である。
【０１２４】
図２４（Ｃ）に示したように、Virtual PlayListの再生区間は、Real PlayListの再生区間またはBridge-Clipの再生区間の中に含まれていなければならない。どのVirtual PlayListにも参照されないBridge-Clipがディスクの中に存在してはならない。
【０１２５】
Real PlayListは、PlayItemのリストを含むが、SubPlayItemを含んではならない。Virtual PlayListは、PlayItemのリストを含み、PlayList()の中に示されるCPI_typeがEP_map typeであり、かつPlayList_typeが０（ビデオとオーディオを含むPlayList）である場合、Virtual PlayListは、ひとつのSubPlayItemを含む事ができる。本実施の形態におけるPlayList()では、SubPlayIteはオーディオのアフレコの目的にだけに使用される、そして、１つのVirtual PlayListが持つSubPlayItemの数は、０または１でなければならない。
【０１２６】
次に、PlayListについて説明する。図２５は、PlayListのシンタクスを示す図である。図２５に示したPlayListのシンタクスを説明するに、version_numberは、このPlayList()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。lengthは、このlengthフィールドの直後からPlayList()の最後までのPlayList()のバイト数を示す３２ビットの符号なし整数である。PlayList_typeは、このPlayListのタイプを示す８ビットのフィールドであり、その一例を図２６に示す。
【０１２７】
CPI_typeは、１ビットのフラグであり、PlayItem()およびSubPlayItem()によって参照されるClipのCPI_typeの値を示す。１つのPlayListによって参照される全てのClipは、それらのCPI()の中に定義されるCPI_typeの値が同じでなければならない。number_of_PlayItemsは、PlayListの中にあるPlayItemの数を示す１６ビットのフィールドである。
【０１２８】
所定のPlayItem()に対応するPlayItem_idは、PlayItem()を含むfor-loopの中で、そのPlayItem()の現れる順番により定義される。PlayItem_idは、０から開始される。number_of_SubPlayItemsは、PlayListの中にあるSubPlayItemの数を示す１６ビットのフィールドである。この値は、０または１である。付加的なオーディオストリームのパス(オーディオストリームパス）は、サブパスの一種である。
【０１２９】
次に、図２５に示したPlayListのシンタクスのUIAppInfoPlayListについて説明する。UIAppInfoPlayListは、PlayListについてのユーザインタフェースアプリケーションのパラメータをストアする。図２７は、UIAppInfoPlayListのシンタクスを示す図である。図２７に示したUIAppInfoPlayListのシンタクスを説明するに、character_setは、８ビットのフィールドであり、PlayList_nameフィールドに符号化されているキャラクター文字の符号化方法を示す。その符号化方法は、図１９に示したテーブルに準拠する値に対応する。
【０１３０】
name_lengthは、８ビットフィールドであり、PlayList_nameフィールドの中に示されるPlayList名のバイト長を示す。PlayList_nameのフィールドは、PlayListの名称を示す。このフィールドの中の左からname_length数のバイト数が、有効なキャラクター文字であり、それはPlayListの名称を示す。PlayList_nameフィールドの中で、それら有効なキャラクター文字の後の値は、どんな値が入っていても良い。
【０１３１】
record_time_and_dateは、PlayListが記録された時の日時をストアする５６ビットのフィールドである。このフィールドは、年／月／日／時／分／秒について、１４個の数字を４ビットのBinary Coded Decimal(BCD)で符号化したものである。例えば、2001/12/23:01:02:03 は、"0x20011223010203"と符号化される。
【０１３２】
durationは、PlayListの総再生時間を時間／分／秒の単位で示した２４ビットのフィールドである。このフィールドは、６個の数字を４ビットのBinary Coded Decimal(BCD)で符号化したものである。例えば、01:45:30は、"0x014530"と符号化される。
【０１３３】
valid_periodは、PlayListが有効である期間を示す３２ビットのフィールドである。このフィールドは、８個の数字を４ビットのBinary Coded Decimal(BCD)で符号化したものである。例えば、記録再生装置１は、この有効期間の過ぎたPlayListを自動消去する、といったように用いられる。例えば、2001/05/07 は、"0x20010507"と符号化される。
【０１３４】
maker_idは、そのPlayListを最後に更新したDVRプレーヤ（記録再生装置１）の製造者を示す１６ビットの符号なし整数である。maker_idに符号化される値は、DVRフォーマットのライセンサによって割り当てられる。maker_codeは、そのPlayListを最後に更新したDVRプレーヤのモデル番号を示す１６ビットの符号なし整数である。maker_codeに符号化される値は、DVRフォーマットのライセンスを受けた製造者によって決められる。
【０１３５】
playback_control_flagのフラグが１にセットされている場合、ユーザが正しくPIN番号を入力できた場合にだけ、そのPlayListは再生される。このフラグが０にセットされている場合、ユーザがPIN番号を入力しなくても、ユーザは、そのPlayListを視聴することができる。
【０１３６】
write_protect_flagは、図２８（Ａ）にテーブルを示すように、１にセットされている場合、write_protect_flagを除いて、そのPlayListの内容は、消去および変更されない。このフラグが０にセットされている場合、ユーザは、そのPlayListを自由に消去および変更できる。このフラグが１にセットされている場合、ユーザが、そのPlayListを消去、編集、または上書きする前に、記録再生装置１はユーザに再確認するようなメッセージを表示させる。
【０１３７】
write_protect_flagが０にセットされているReal PlayListが存在し、かつ、そのReal PlayListのClipを参照するVirtual PlayListが存在し、そのVirtual PlayListのwrite_protect_flagが１にセットされていても良い。ユーザが、RealPlayListを消去しようとする場合、記録再生装置１は、そのReal PlayListを消去する前に、上記Virtual PlayListの存在をユーザに警告するか、または、そのReal PlayListを"Minimize”する。
【０１３８】
is_played_flagは、図２８（Ｂ）に示すように、フラグが１にセットされている場合、そのPlayListは、記録されてから一度は再生されたことを示し、０にセットされている場合、そのPlayListは、記録されてから一度も再生されたことがないことを示す。
【０１３９】
archiveは、図２８（Ｃ）に示すように、そのPlayListがオリジナルであるか、コピーされたものであるかを示す２ビットのフィールドである。ref_thumbnail_index のフィールドは、PlayListを代表するサムネイル画像の情報を示す。ref_thumbnail_indexフィールドが、0xFFFFでない値の場合、そのPlayListには、PlayListを代表するサムネイル画像が付加されており、そのサムネイル画像は、menu.thum ファイルの中にストアされている。その画像は、menu.thumファイルの中でref_thumbnail_indexの値を用いて参照される。ref_thumbnail_indexフィールドが、0xFFFF である場合、そのPlayListには、PlayListを代表するサムネイル画像が付加されていない。
【０１４０】
次にPlayItemについて説明する。１つのPlayItem()は、基本的に次のデータを含む。Clipのファイル名を指定するためのClip_information_file_name、Clipの再生区間を特定するためのIN_timeとOUT_timeのペア、PlayList()において定義されるCPI_typeがEP_map typeである場合、IN_timeとOUT_timeが参照するところのSTC_sequence_id、および、先行するPlayItemと現在のPlayItemとの接続の状態を示すところのconnection_conditionである。
【０１４１】
PlayListが２つ以上のPlayItemから構成される時、それらのPlayItemはPlayListのグローバル時間軸上に、時間のギャップまたはオーバーラップなしに一列に並べられる。PlayList()において定義されるCPI_typeがEP_map typeであり、かつ現在のPlayItemがBridgeSequence()を持たない時、そのPlayItemにおいて定義されるIN_timeとOUT_timeのペアは、STC_sequence_idによって指定される同じSTC連続区間上の時間を指していなければならない。そのような例を図２９に示す。
【０１４２】
図３０は、PlayList()において定義されるCPI_typeがEP_map typeであり、かつ現在のPlayItemがBridgeSequence()を持つ時、次に説明する規則が適用される場合を示している。現在のPlayItemに先行するPlayItemのIN_time (図の中でIN_time1と示されているもの)は、先行するPlayItemのSTC_sequence_idによって指定されるSTC連続区間上の時間を指している。先行するPlayItemのOUT_time（図の中でOUT_time1と示されているもの）は、現在のPlayItemのBridgeSequenceInfo()の中で指定されるBridge-Clipの中の時間を指している。このOUT_timeは、後述する符号化制限に従っていなければならない。
【０１４３】
現在のPlayItemのIN_time（図の中でIN_time2と示されているもの）は、現在のPlayItemのBridgeSequenceInfo()の中で指定されるBridge-Clipの中の時間を指している。このIN_timeも、後述する符号化制限に従っていなければならない。現在のPlayItemのPlayItemのOUT_time (図の中でOUT_time2と示されているもの)は、現在のPlayItemのSTC_sequence_idによって指定されるSTC連続区間上の時間を指している。
【０１４４】
図３１に示すように、PlayList()のCPI_typeがTU_map typeである場合、PlayItemのIN_timeとOUT_timeのペアは、同じClip AVストリーム上の時間を指している。
【０１４５】
PlayItemのシンタクスは、図３２に示すようになる。図３２に示したPlayItemのシンタクスを説明するに、Clip_Information_file_nameのフィールドは、Clip Information fileのファイル名を示す。このClip Information fileのClipInfo()において定義されるClip_stream_typeは、Clip AV streamを示していなければならない。
【０１４６】
STC_sequence_idは、８ビットのフィールドであり、PlayItemが参照するSTC連続区間のSTC_sequence_idを示す。PlayList()の中で指定されるCPI_typeがTU_map typeである場合、この８ビットフィールドは何も意味を持たず、０にセットされる。IN_timeは、３２ビットフィールドであり、PlayItemの再生開始時刻をストアする。IN_timeのセマンティクスは、図３３に示すように、PlayList()において定義されるCPI_typeによって異なる。
【０１４７】
OUT_timeは、３２ビットフィールドであり、PlayItemの再生終了時刻をストアする。OUT_timeのセマンティクスは、図３４に示すように、PlayList()において定義されるCPI_typeによって異なる。
【０１４８】
Connection_Conditionは、図３５に示したような先行するPlayItemと、現在のPlayItemとの間の接続状態を示す２ビットのフィールドである。図３６は、図３５に示したConnection_Conditionの各状態について説明する図である。
【０１４９】
次に、BridgeSequenceInfoについて、図３７を参照して説明する。BridgeSequenceInfo()は、現在のPlayItemの付属情報であり、次に示す情報を持つ。Bridge-Clip AV streamファイルとそれに対応するClip Information fileを指定するBridge_Clip_Information_file_nameを含む。
【０１５０】
また、先行するPlayItemが参照するClip AV stream上のソースパケットのアドレスであり、このソースパケットに続いてBridge-Clip AV streamファイルの最初のソースパケットが接続される。このアドレスは、RSPN_exit_from_previous_Clipと称される。さらに現在のPlayItemが参照するClip AV stream上のソースパケットのアドレスであり、このソースパケットの前にBridge-Clip AV streamファイルの最後のソースパケットが接続される。このアドレスは、RSPN_enter_to_current_Clipと称される。
【０１５１】
図３７において、RSPN_arrival_time_discontinuityは、the Bridge-Clip AVstreamファイルの中でアライバルタイムベースの不連続点があるところのソースパケットのアドレスを示す。このアドレスは、ClipInfo()の中において定義される。
【０１５２】
図３８は、BridgeSequenceinfoのシンタクスを示す図である。図３８に示したBridgeSequenceinfoのシンタクスを説明するに、Bridge_Clip_Information_file_nameのフィールドは、Bridge-Clip AV streamファイルに対応するClip Information fileのファイル名を示す。このClip Information fileのClipInfo()において定義されるClip_stream_typeは、'Bridge-Clip AV stream'を示していなければならない。
【０１５３】
RSPN_exit_from_previous_Clipの３２ビットフィールドは、先行するPlayItemが参照するClip AV stream上のソースパケットの相対アドレスであり、このソースパケットに続いてBridge-Clip AV streamファイルの最初のソースパケットが接続される。RSPN_exit_from_previous_Clipは、ソースパケット番号を単位とする大きさであり、先行するPlayItemが参照するClip AV streamファイルの最初のソースパケットからClipInfo()において定義されるoffset_SPNの値を初期値としてカウントされる。
【０１５４】
RSPN_enter_to_current_Clipの３２ビットフィールドは、現在のPlayItemが参照するClip AV stream上のソースパケットの相対アドレスであり、このソースパケットの前にBridge-Clip AV streamファイルの最後のソースパケットが接続される。RSPN_exit_from_previous_Clipは、ソースパケット番号を単位とする大きさであり、現在のPlayItemが参照するClip AV streamファイルの最初のソースパケットからClipInfo()において定義されるoffset_SPNの値を初期値としてカウントされる。
【０１５５】
次に、SubPlayItemについて、図３９を参照して説明する。SubPlayItem()の使用は、PlayList()のCPI_typeがEP_map typeである場合だけに許される。本実施の形態においては、SubPlayItemはオーディオのアフレコの目的のためだけに使用されるとする。SubPlayItem()は、次に示すデータを含む。まず、PlayListの中のsub pathが参照するClipを指定するためのClip_information_file_ nameを含む。
【０１５６】
また、Clipの中のsub pathの再生区間を指定するためのSubPath_IN_time と SubPath_OUT_timeを含む。さらに、main pathの時間軸上でsub pathが再生開始する時刻を指定するためのsync_PlayItem_id と sync_start_PTS_of_PlayItemを含む。sub pathに参照されるオーディオのClip AV streamは、STC不連続点（システムタイムベースの不連続点）を含んではならない。sub pathに使われるClipのオーディオサンプルのクロックは、main pathのオーディオサンプルのクロックにロックされている。
【０１５７】
図４０は、SubPlayItemのシンタクスを示す図である。図４０に示したSubPlayItemのシンタクスを説明するに、Clip_Information_file_nameのフィールドは、Clip Information fileのファイル名を示し、それはPlayListの中でsub pathによって使用される。このClip Information fileのClipInfo()において定義されるClip_stream_typeは、Clip AV streamを示していなければならない。
【０１５８】
SubPath_typeの８ビットのフィールドは、sub pathのタイプを示す。ここでは、図４１に示すように、'0x00'しか設定されておらず、他の値は、将来のために確保されている。
【０１５９】
sync_PlayItem_idの８ビットのフィールドは、main pathの時間軸上でsub pathが再生開始する時刻が含まれるPlayItemのPlayItem_idを示す。所定のPlayItemに対応するPlayItem_idの値は、PlayList()において定義される（図２５参照）。
【０１６０】
sync_start_PTS_of_PlayItemの３２ビットのフィールドは、main pathの時間軸上でsub pathが再生開始する時刻を示し、sync_PlayItem_idで参照されるPlayItem上のPTS(Presentaiotn Time Stamp)の上位３２ビットを示す。SubPath_IN_timeの３２ビットフィールドは、Sub pathの再生開始時刻をストアする。SubPath_IN_timeは、Sub Pathの中で最初のプレゼンテーションユニットに対応する３３ビット長のPTSの上位３２ビットを示す。
【０１６１】
SubPath_OUT_timeの３２ビットフィールドは、Sub pathの再生終了時刻をストアする。SubPath_OUT_timeは、次式によって算出されるPresenation_end_TSの値の上位３２ビットを示す。
Presentation_end_TS = PTS_out + AU_duration
ここで、PTS_outは、SubPathの最後のプレゼンテーションユニットに対応する33ビット長のPTSである。AU_durationは、SubPathの最後のプレゼンテーションユニットの９０kHz単位の表示期間である。
【０１６２】
次に、図２３に示したxxxxx.rplsとyyyyy.vplsのシンタクス内のPlayListMark()について説明する。PlayListについてのマーク情報は、このPlayListMarkにストアされる。図４２は、PlayListMarkのシンタクスを示す図である。図４２に示したPlayListMarkのシンタクスについて説明するに、version_numberは、このPlayListMark()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。
【０１６３】
lengthは、このlengthフィールドの直後からPlayListMark()の最後までのPlayListMark()のバイト数を示す３２ビットの符号なし整数である。number_of_PlayList_marksは、PlayListMarkの中にストアされているマークの個数を示す１６ビットの符号なし整数である。number_of_PlayList_marks は、０であってもよい。mark_typeは、マークのタイプを示す８ビットのフィールドであり、図４３に示すテーブルに従って符号化される。
【０１６４】
mark_time_stampの３２ビットフィールドは、マークが指定されたポイントを示すタイムスタンプをストアする。mark_time_stampのセマンティクスは、図４４に示すように、PlayList()において定義されるCPI_typeによって異なる。PlayItem_idは、マークが置かれているところのPlayItemを指定する８ビットのフィールドである。所定のPlayItemに対応するPlayItem_idの値は、PlayList()において定義される（図２５参照）。
【０１６５】
character_setの８ビットのフィールドは、mark_nameフィールドに符号化されているキャラクター文字の符号化方法を示す。その符号化方法は、図１９に示した値に対応する。name_lengthの８ビットフィールドは、Mark_nameフィールドの中に示されるマーク名のバイト長を示す。mark_nameのフィールドは、マークの名称を示す。このフィールドの中の左からname_length数のバイト数が、有効なキャラクター文字であり、それはマークの名称を示す。Mark_nameフィールドの中で、それら有効なキャラクター文字の後の値は、どのような値が設定されても良い。
【０１６６】
ref_thumbnail_indexのフィールドは、マークに付加されるサムネイル画像の情報を示す。ref_thumbnail_indexフィールドが、0xFFFFでない値の場合、そのマークにはサムネイル画像が付加されており、そのサムネイル画像は、mark.thmbファイルの中にストアされている。その画像は、mark.thmbファイルの中でref_thumbnail_indexの値を用いて参照される（後述）。ref_thumbnail_indexフィールドが、0xFFFF である場合、そのマークにはサムネイル画像が付加されていない事を示す。
【０１６７】
次に、Clip information fileについて説明する。zzzzz.clpi（Clip information fileファイル）は、図４５に示すように６個のオブジェクトから構成される。それらは、ClipInfo()、STC_Info()、ProgramInfo()、CPI()、ClipMark()、およびMakerPrivateData()である。AVストリーム(Clip AVストリームまたはBridge-Clip AV stream)とそれに対応するClip Informationファイルは、同じ数字列の"zzzzz"が使用される。
【０１６８】
図４５に示したzzzzz.clpi（Clip information fileファイル）のシンタクスについて説明するに、ClipInfo_Start_addressは、zzzzz.clpiファイルの先頭のバイトからの相対バイト数を単位として、ClipInfo()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。
【０１６９】
STC_Info_Start_addressは、zzzzz.clpiファイルの先頭のバイトからの相対バイト数を単位として、STC_Info()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。ProgramInfo_Start_addressは、zzzzz.clpiファイルの先頭のバイトからの相対バイト数を単位として、ProgramInfo()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。CPI_Start_addressは、zzzzz.clpiファイルの先頭のバイトからの相対バイト数を単位として、CPI()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。
【０１７０】
ClipMark_Start_addressは、zzzzz.clpiファイルの先頭のバイトからの相対バイト数を単位として、ClipMark()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。MakerPrivateData_Start_addressは、zzzzz.clpiファイルの先頭のバイトからの相対バイト数を単位として、MakerPrivateData ()の先頭アドレスを示す。相対バイト数はゼロからカウントされる。padding_word（パディングワード）は、zzzzz.clpiファイルのシンタクスにしたがって挿入される。Ｎ１，Ｎ２，Ｎ３，Ｎ４、およびＮ５は、ゼロまたは任意の正の整数でなければならない。それぞれのパディングワードは、任意の値がとられるようにしても良い。
【０１７１】
次に、ClipInfoについて説明する。図４６は、ClipInfoのシンタクスを示す図である。ClipInfo()は、それに対応するAVストリームファイル（Clip AVストリームまたはBridge-Clip AVストリームファイル）の属性情報をストアする。
【０１７２】
図４６に示したClipInfoのシンタクスについて説明するに、version_numberは、このClipInfo()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。lengthは、このlengthフィールドの直後からClipInfo()の最後までのClipInfo()のバイト数を示す３２ビットの符号なし整数である。Clip_stream_typeの８ビットのフィールドは、図４７に示すように、Clip Informationファイルに対応するAVストリームのタイプを示す。それぞれのタイプのAVストリームのストリームタイプについては後述する。
【０１７３】
offset_SPNの３２ビットのフィールドは、AVストリーム（Clip AVストリームまたはBridge-Clip AVストリーム）ファイルの最初のソースパケットについてのソースパケット番号のオフセット値を与える。AVストリームファイルが最初にディスクに記録される時、このoffset_SPNは０でなければならない。
【０１７４】
図４８に示すように、AVストリームファイルのはじめの部分が編集によって消去された時、offset_SPNは、ゼロ以外の値をとっても良い。本実施の形態では、offset_SPNを参照する相対ソースパケット番号（相対アドレス）が、しばしば、RSPN_xxx（xxxは変形する。例．RSPN_EP_start）の形式でシンタクスの中に記述されている。相対ソースパケット番号は、ソースパケット番号を単位とする大きさであり、AVストリームファイルの最初のソースパケットからoffset_SPNの値を初期値としてカウントされる。
【０１７５】
AVストリームファイルの最初のソースパケットから相対ソースパケット番号で参照されるソースパケットまでのソースパケットの数（SPN_xxx）は、次式で算出される。
SPN_xxx = RSPN_xxx - offset_SPN
図４８に、offset_SPN が、４である場合の例を示す。
【０１７６】
TS_recording_rateは、２４ビットの符号なし整数であり、この値は、DVRドライブ（書き込み部２２）へまたはDVRドライブ（読み出し部２８）からのAVストリームの必要な入出力のビットレートを与える。record_time_and_dateは、Clipに対応するAVストリームが記録された時の日時をストアする５６ビットのフィールドであり、年／月／日／時／分／秒について、１４個の数字を４ビットのBinary Coded Decimal(BCD)で符号化したものである。例えば、2001/12/23:01:02:03 は、0x20011223010203"と符号化される。
【０１７７】
durationは、Clipの総再生時間をアライバルタイムクロックに基づいた時間／分／秒の単位で示した２４ビットのフィールドである。このフィールドは、６個の数字を４ビットのBinary Coded Decimal(BCD)で符号化したものである。例えば、01:45:30は、0x014530"と符号化される。
【０１７８】
time_controlled_flag:のフラグは、AVストリームファイルの記録モードを示す。このtime_controlled_flagが１である場合、記録モードは、記録してからの時間経過に対してファイルサイズが比例するようにして記録されるモードであることを示し、次式に示す条件を満たさなければならない。
TS_average_rate^＊192/188^＊(t - start_time)−α <= size_clip(t)
<= TS_average_rate^＊192/188^＊(t - start_time)＋α
ここで、TS_average_rateは、AVストリームファイルのトランスポートストリームの平均ビットレートをbytes/second の単位で表したものである。
【０１７９】
また、上式において、ｔは、秒単位で表される時間を示し、start_timeは、AVストリームファイルの最初のソースパケットが記録された時の時刻であり、秒単位で表される。size_clip(t)は、時刻ｔにおけるAVストリームファイルのサイズをバイト単位で表したものであり、例えば、start_timeから時刻tまでに１０個のソースパケットが記録された場合、size_clip(t)は10^＊192バイトである。αは、TS_average_rateに依存する定数である。
【０１８０】
time_controlled_flagが０にセットされている場合、記録モードは、記録の時間経過とAVストリームのファイルサイズが比例するように制御していないことを示す。例えば、これは入力トランスポートストリームをトランスペアレント記録する場合である。
【０１８１】
TS_average_rateは、time_controlled_flagが１にセットされている場合、この２４ビットのフィールドは、上式で用いているTS_average_rateの値を示す。time_controlled_flagが０にセットされている場合、このフィールドは、何も意味を持たず、０にセットされなければならない。例えば、可変ビットレートのトランスポートストリームは、次に示す手順により符号化される。まずトランスポートレートをTS_recording_rateの値にセットする。次に、ビデオストリームを可変ビットレートで符号化する。そして、ヌルパケットを使用しない事によって、間欠的にトランスポートパケットを符号化する。
【０１８２】
RSPN_arrival_time_discontinuityの３２ビットフィールドは、Bridge-Clip AV streamファイル上でアライバルタイムベースの不連続が発生する場所の相対アドレスである。RSPN_arrival_time_discontinuityは、ソースパケット番号を単位とする大きさであり、Bridge-Clip AV streamファイルの最初のソースパケットからClipInfo() において定義されるoffset_SPNの値を初期値としてカウントされる。そのBridge-Clip AV streamファイルの中での絶対アドレスは、上述した
SPN_xxx = RSPN_xxx - offset_SPN
に基づいて算出される。
【０１８３】
reserved_for_system_useの１４４ビットのフィールドは、システム用にリザーブされている。is_format_identifier_validのフラグが１である時、format_identifierのフィールドが有効であることを示す。is_original_network_ID_validのフラグが１である場合、original_network_IDのフィールドが有効であることを示す。is_transport_stream_ID_validのフラグが１である場合、transport_stream_IDのフィールドが有効であることを示す。is_servece_ID_validのフラグが１である場合、servece_IDのフィールドが有効であることを示す。
【０１８４】
is_ country_code_validのフラグが１である時、country_codeのフィールドが有効であることを示す。format_identifierの３２ビットフィールドは、トランスポートストリームの中でregistration deascriotor（ISO/IEC13818-1で定義されている）が持つformat_identifierの値を示す。original_network_IDの１６ビットフィールドは、トランスポートストリームの中で定義されているoriginal_network_IDの値を示す。transport_stream_IDの１６ビットフィールドは、トランスポートストリームの中で定義されているtransport_stream_IDの値を示す。
【０１８５】
servece_IDの１６ビットフィールドは、トランスポートストリームの中で定義されているservece_IDの値を示す。country_codeの２４ビットのフィールドは、ISO3166によって定義されるカントリーコードを示す。それぞれのキャラクター文字は、ISO8859-1で符号化される。例えば、日本は"JPN"と表され、"0x4A 0x50 0x4E"と符号化される。stream_format_nameは、トランスポートストリームのストリーム定義をしているフォーマット機関の名称を示すISO-646の１６個のキャラクターコードである。このフィールドの中の無効なバイトは、値'0xFF'がセットされる。
【０１８６】
format_identifier、original_network_ID、transport_stream_ID、 servece_ID,country_code 、およびstream_format_nameは、トランスポートストリームのサービスプロバイダを示すものであり、これにより、オーディオやビデオストリームの符号化制限、SI(サービスインフォメーション)の規格やオーディオビデオストリーム以外のプライベートデータストリームのストリーム定義を認識することができる。これらの情報は、デコーダが、そのストリームをデコードできるか否か、そしてデコードできる場合にデコード開始前にデコーダシステムの初期設定を行うために用いることが可能である。
【０１８７】
次に、STC_Infoについて説明する。ここでは、MPEG-2トランスポートストリームの中でSTCの不連続点（システムタイムベースの不連続点）を含まない時間区間をSTC_sequenceと称し、Clipの中で、STC_sequenceは、STC_sequence_idの値によって特定される。図５０は、連続なＳＴＣ区間について説明する図である。同じSTC_sequenceの中で同じSTCの値は、決して現れない（ただし、後述するように、Clipの最大時間長は制限されている）。従って、同じSTC_sequenceの中で同じPTSの値もまた、決して現れない。AVストリームが、N(N>0)個のSTC不連続点を含む場合、Clipのシステムタイムベースは、(N+1)個のSTC_sequenceに分割される。
【０１８８】
STC_Infoは、STCの不連続（システムタイムベースの不連続）が発生する場所のアドレスをストアする。図５１を参照して説明するように、RSPN_STC_startが、そのアドレスを示し、最後のSTC_sequenceを除くk番目（k>=0）のSTC_sequenceは、k番目のRSPN_STC_startで参照されるソースパケットが到着した時刻から始まり、(k+1)番目のRSPN_STC_startで参照されるソースパケットが到着した時刻で終わる。最後のSTC_sequenceは、最後のRSPN_STC_startで参照されるソースパケットが到着した時刻から始まり、最後のソースパケットが到着した時刻で終了する。
【０１８９】
図５２は、STC_Infoのシンタクスを示す図である。図５２に示したSTC_Infoのシンタクスについて説明するに、version_numberは、このSTC_Info()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。
【０１９０】
lengthは、このlengthフィールドの直後からSTC_Info()の最後までのSTC_Info()のバイト数を示す３２ビットの符号なし整数である。CPI()のCPI_typeがTU_map typeを示す場合、このlengthフィールドはゼロをセットしても良い。CPI()のCPI_typeがEP_map typeを示す場合、num_of_STC_sequencesは1以上の値でなければならない。
【０１９１】
num_of_STC_sequencesの８ビットの符号なし整数は、Clipの中でのSTC_sequenceの数を示す。この値は、このフィールドに続くfor-loopのループ回数を示す。所定のSTC_sequenceに対応するSTC_sequence_idは、RSPN_STC_startを含むfor-loopの中で、そのSTC_sequenceに対応するRSPN_STC_startの現れる順番により定義されるものである。STC_sequence_idは、０から開始される。
【０１９２】
RSPN_STC_startの３２ビットフィールドは、AVストリームファイル上でSTC_sequenceが開始するアドレスを示す。RSPN_STC_startは、AVストリームファイルの中でシステムタイムベースの不連続点が発生するアドレスを示す。RSPN_STC_startは、AVストリームの中で新しいシステムタイムベースの最初のPCRを持つソースパケットの相対アドレスとしても良い。RSPN_STC_startは、ソースパケット番号を単位とする大きさであり、AVストリームファイルの最初のソースパケットからClipInfo()において定義されるoffset_SPNの値を初期値としてカウントされる。そのAV streamファイルの中での絶対アドレスは、既に上述した
SPN_xxx = RSPN_xxx - offset_SPN
により算出される。
【０１９３】
次に、図４５に示したzzzzz.clipのシンタクス内のProgramInfoについて説明する。図５３を参照しながら説明するに、ここでは、Clipの中で次の特徴をもつ時間区間をprogram_sequenceと呼ぶ。まず、PCR_PIDの値が変わらない。次に、ビデオエレメンタリストリームの数が変化しない。また、それぞれのビデオストリームについてのPIDの値とそのVideoCodingInfoによって定義される符号化情報が変化しない。さらに、オーディオエレメンタリストリームの数が変化しない。また、それぞれのオーディオストリームについてのPIDの値とそのAudioCodingInfoによって定義される符号化情報が変化しない。
【０１９４】
program_sequenceは、同一の時刻において、ただ１つのシステムタイムベースを持つ。program_sequenceは、同一の時刻において、ただ１つのPMTを持つ。ProgramInfo()は、program_sequenceが開始する場所のアドレスをストアする。RSPN_program_sequence_startが、そのアドレスを示す。
【０１９５】
図５４は、ProgramInfoのシンタクスを示す図である。図５４に示したProgramInfoのシンタクを説明するに、version_numberは、このProgramInfo()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。
【０１９６】
lengthは、このlengthフィールドの直後からProgramInfo()の最後までのProgramInfo()のバイト数を示す３２ビットの符号なし整数である。CPI()のCPI_typeがTU_map typeを示す場合、このlengthフィールドはゼロにセットされても良い。CPI()のCPI_typeがEP_map typeを示す場合、number_of_programsは１以上の値でなければならない。
【０１９７】
number_of_program_sequencesの８ビットの符号なし整数は、Clipの中でのprogram_sequenceの数を示す。この値は、このフィールドに続くfor-loopのループ回数を示す。Clipの中でprogram_sequenceが変化しない場合、number_of_program_sequencesは１をセットされなければならない。RSPN_program_sequence_startの３２ビットフィールドは、AVストリームファイル上でプログラムシーケンスが開始する場所の相対アドレスである。
【０１９８】
RSPN_program_sequence_startは、ソースパケット番号を単位とする大きさであり、AVストリームファイルの最初のソースパケットからClipInfo()において定義されるoffset_SPNの値を初期値としてカウントされる。そのAVストリームファイルの中での絶対アドレスは、
SPN_xxx = RSPN_xxx - offset_SPN
により算出される。シンタクスのfor-loopの中でRSPN_program_sequence_start値は、昇順に現れなければならない。
【０１９９】
PCR_PIDの１６ビットフィールドは、そのprogram_sequenceに有効なPCRフィールドを含むトランスポートパケットのPIDを示す。number_of_videosの８ビットフィールドは、video_stream_PIDとVideoCodingInfo()を含むfor-loopのループ回数を示す。number_of_audiosの８ビットフィールドは、audio_stream_PIDとAudioCodingInfo()を含むfor-loopのループ回数を示す。video_stream_PIDの１６ビットフィールドは、そのprogram_sequenceに有効なビデオストリームを含むトランスポートパケットのPIDを示す。このフィールドに続くVideoCodingInfo()は、そのvideo_stream_PIDで参照されるビデオストリームの内容を説明しなければならない。
【０２００】
audio_stream_PIDの１６ビットフィールドは、そのprogram_sequenceに有効なオーディオストリームを含むトランスポートパケットのPIDを示す。このフィールドに続くAudioCodingInfo()は、そのaudio_stream_PIDで参照されるビデオストリームの内容を説明しなければならない。
【０２０１】
なお、シンタクスのfor-loopの中でvideo_stream_PIDの値の現れる順番は、そのprogram_sequenceに有効なPMTの中でビデオストリームのPIDが符号化されている順番に等しくなければならない。また、シンタクスのfor-loopの中でaudio_stream_PIDの値の現れる順番は、そのprogram_sequenceに有効なPMTの中でオーディオストリームのPIDが符号化されている順番に等しくなければならない。
【０２０２】
図５５は、図５４に示したPrograminfoのシンタクス内のVideoCodingInfoのシンタクスを示す図である。図５５に示したVideoCodingInfoのシンタクスを説明するに、video_formatの８ビットフィールドは、図５６に示すように、ProgramInfo()の中のvideo_stream_PIDに対応するビデオフォーマットを示す。
【０２０３】
frame_rateの８ビットフィールドは、図５７に示すように、ProgramInfo()の中のvideo_stream_PIDに対応するビデオのフレームレートを示す。display_aspect_ratioの８ビットフィールドは、図５８に示すように、ProgramInfo()の中のvideo_stream_PIDに対応するビデオの表示アスペクト比を示す。
【０２０４】
図５９は、図５４に示したPrograminfoのシンタクス内のAudioCodingInfoのシンタクスを示す図である。図５９に示したAudioCodingInfoのシンタクスを説明するに、audio_codingの８ビットフィールドは、図６０に示すように、ProgramInfo()の中のaudio_stream_PIDに対応するオーディオの符号化方法を示す。
【０２０５】
audio_component_typeの８ビットフィールドは、図６１に示すように、ProgramInfo()の中のaudio_stream_PIDに対応するオーディオのコンポーネントタイプを示す。sampling_frequencyの８ビットフィールドは、図６２に示すように、ProgramInfo()の中のaudio_stream_PIDに対応するオーディオのサンプリング周波数を示す。
【０２０６】
次に、図４５に示したzzzzz.clipのシンタクス内のCPI (Characteristic Point Information)について説明する。CPIは、AVストリームの中の時間情報とそのファイルの中のアドレスとを関連づけるためにある。CPIには２つのタイプがあり、それらはEP_mapとTU_mapである。図６３に示すように、CPI()の中のCPI_typeがEP_map typeの場合、そのCPI()はEP_mapを含む。図６４に示すように、CPI()の中のCPI_typeがTU_map typeの場合、そのCPI()はTU_mapを含む。１つのAVストリームは、１つのEP_mapまたは一つのTU_mapを持つ。AVストリームがSESFトランスポートストリームの場合、それに対応するClipはEP_mapを持たなければならない。
【０２０７】
図６５は、CPIのシンタクスを示す図である。図６５に示したCPIのシンタクスを説明するに、version_numberは、このCPI()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。lengthは、このlengthフィールドの直後からCPI()の最後までのCPI()のバイト数を示す３２ビットの符号なし整数である。CPI_typeは、図６６に示すように、１ビットのフラグであり、ClipのCPIのタイプを表す。
【０２０８】
次に、図６５に示したCPIのシンタクス内のEP_mapについて説明する。EP_mapには、２つのタイプがあり、それはビデオストリーム用のEP_mapとオーディオストリーム用のEP_mapである。EP_mapの中のEP_map_typeが、EP_mapのタイプを区別する。Clipが１つ以上のビデオストリームを含む場合、ビデオストリーム用のEP_mapが使用されなければならない。Clipがビデオストリームを含まず、１つ以上のオーディオストリームを含む場合、オーディオストリーム用のEP_mapが使用されなければならない。
【０２０９】
ビデオストリーム用のEP_mapについて図６７を参照して説明する。ビデオストリーム用のEP_mapは、stream_PID、PTS_EP_start、および、RSPN_EP_startというデータを持つ。stream_PIDは、ビデオストリームを伝送するトランスポートパケットのPIDを示す。PTS_EP_startは、ビデオストリームのシーケンスヘッダから始めるアクセスユニットのPTSを示す。RSPN_EP_startは、AVストリームの中でPTS_EP_startにより参照されるアクセスユニットの第１バイト目を含むソースポケットのアドレスを示す。
【０２１０】
EP_map_for_one_stream_PID()と呼ばれるサブテーブルは、同じPIDを持つトランスポートパケットによって伝送されるビデオストリーム毎に作られる。Clipの中に複数のビデオストリームが存在する場合、EP_mapは複数のEP_map_for_one_stream_PID()を含んでも良い。
【０２１１】
オーディオストリーム用のEP_mapは、stream_PID、PTS_EP_start、およびRSPN_EP_startというデータを持つ。stream_PIDは、オーディオストリームを伝送するトランスポートパケットのPIDを示す。PTS_EP_startは、オーディオストリームのアクセスユニットのPTSを示す。RSPN_EP_startは、AVストリームの中でPTS_EP_startで参照されるアクセスユニットの第１バイト目を含むソースポケットのアドレスを示す。
【０２１２】
EP_map_for_one_stream_PID()と呼ばれるサブテーブルは、同じPIDを持つトランスポートパケットによって伝送されるオーディオストリーム毎に作られる。Clipの中に複数のオーディオストリームが存在する場合、EP_mapは複数のEP_map_for_one_stream_PID()を含んでも良い。
【０２１３】
EP_mapとSTC_Infoの関係を説明するに、１つのEP_map_for_one_stream_PID()は、STCの不連続点に関係なく１つのテーブルに作られる。RSPN_EP_startの値とSTC_Info()において定義されるRSPN_STC_startの値を比較する事により、それぞれのSTC_sequenceに属するEP_mapのデータの境界が分かる（図６８を参照）。EP_mapは、同じPIDで伝送される連続したストリームの範囲に対して、１つのEP_map_for_one_stream_PIDを持たねばならない。図６９に示したような場合、program#1とprogram#3は、同じビデオPIDを持つが、データ範囲が連続していないので、それぞれのプログラム毎にEP_map_for_one_stream_PIDを持たねばならない。
【０２１４】
図７０は、EP_mapのシンタクスを示す図である。図７０に示したEP_mapのシンタクスを説明するに、EP_typeは、４ビットのフィールドであり、図７１に示すように、EP_mapのエントリーポイントタイプを示す。EP_typeは、このフィールドに続くデータフィールドのセマンティクスを示す。Clipが１つ以上のビデオストリームを含む場合、EP_typeは0('video')にセットされなければならない。または、Clipがビデオストリームを含まず、１つ以上のオーディオストリームを含む場合、EP_typeは1('audio')にセットされなければならない。
【０２１５】
number_of_stream_PIDsの１６ビットのフィールドは、EP_map()の中のnumber_of_stream_PIDsを変数にもつfor-loopのループ回数を示す。stream_PID(k)の１６ビットのフィールドは、EP_map_for_one_stream_PID(num_EP_entries(k))によって参照されるk番目のエレメンタリストリーム（ビデオまたはオーディオストリーム）を伝送するトランスポートパケットのPIDを示す。EP_typeが0 ('video')に等しい場合、そのエレメンタリストリームはビデオストリームでなけれならない。また、EP_typeが1('audio')に等しい場合、そのエレメンタリストリームはオーディオストリームでなければならない。
【０２１６】
num_EP_entries(k)の１６ビットのフィールドは、EP_map_for_one_stream_PID(num_EP_entries(k))によって参照されるnum_EP_entries(k)を示す。EP_map_for_one_stream_PID_Start_address(k): この３２ビットのフィールドは、EP_map()の中でEP_map_for_one_stream_PID(num_EP_entries(k))が始まる相対バイト位置を示す。この値は、EP_map()の第１バイト目からの大きさで示される。
【０２１７】
padding_wordは、EP_map()のシンタクスにしたがって挿入されなければならない。XとYは、ゼロまたは任意の正の整数でなければならない。それぞれのパディングワードは、任意の値を取っても良い。
【０２１８】
図７２は、EP_map_for_one_stream_PIDのシンタクスを示す図である。図７２に示したEP_map_for_one_stream_PIDのシンタクスを説明するに、PTS_EP_startの３２ビットのフィールドのセマンティクスは、EP_map()において定義されるEP_typeにより異なる。EP_typeが０('video')に等しい場合、このフィールドは、ビデオストリームのシーケンスヘッダで始まるアクセスユニットの３３ビット精度のPTSの上位３２ビットを持つ。EP_typeが１('audio')に等しい場合、このフィールドは、オーディオストリームのアクセスユニットの３３ビット精度のPTSの上位３２ビットを持つ。
【０２１９】
RSPN_EP_startの３２ビットのフィールドのセマンティクスは、EP_map()において定義されるEP_typeにより異なる。EP_typeが０('video')に等しい場合、このフィールドは、AVストリームの中でPTS_EP_startにより参照されるアクセスユニットのシーケンスヘッダの第１バイト目を含むソースポケットの相対アドレスを示す。または、EP_typeが１('audio')に等しい場合、このフィールドは、AVストリームの中でPTS_EP_startにより参照されるアクセスユニットのオーディオフレームの第一バイト目を含むソースポケットの相対アドレスを示す。
【０２２０】
RSPN_EP_startは、ソースパケット番号を単位とする大きさであり、AVストリームファイルの最初のソースパケットからClipInfo()において定義されるoffset_SPNの値を初期値としてカウントされる。そのAVストリームファイルの中での絶対アドレスは、
SPN_xxx = RSPN_xxx - offset_SPN
により算出される。シンタクスのfor-loopの中でRSPN_EP_startの値は、昇順に現れなければならない。
【０２２１】
次に、TU_mapについて、図７３を参照して説明する。TU_mapは、ソースパケットのアライバルタイムクロック（到着時刻ベースの時計）に基づいて、１つの時間軸を作る。その時間軸は、TU_map_time_axisと呼ばれる。TU_map_time_axisの原点は、TU_map()の中のoffset_timeによって示される。TU_map_time_axisは、offset_timeから一定の単位に分割される。その単位を、time_unitと称する。
【０２２２】
AVストリームの中の各々のtime_unitの中で、最初の完全な形のソースパケットのAVストリームファイル上のアドレスが、TU_mapにストアされる。これらのアドレスを、RSPN_time_unit_startと称する。TU_map_time_axis上において、k (k>=０)番目のtime_unitが始まる時刻は、TU_start_time(k)と呼ばれる。この値は次式に基づいて算出される。
TU_start_time(k) = offset_time + k^＊time_unit_size
TU_start_time(k)は、45kHzの精度を持つ。
【０２２３】
図７４は、TU_mapのシンタクスを示す図である。図７４に示したTU_mapのシンタクスを説明するに、offset_timeの３２bit長のフィールドは、TU_map_time_axisに対するオフセットタイムを与える。この値は、Clipの中の最初のtime_unitに対するオフセット時刻を示す。offset_timeは、２７MHz精度のアライバルタイムクロックから導き出される４５kHzクロックを単位とする大きさである。AVストリームが新しいClipとして記録される場合、offset_timeはゼロにセットされなければならない。
【０２２４】
time_unit_sizeの３２ビットフィールドは、time_unitの大きさを与えるものであり、それは２７MHz精度のアライバルタイムクロックから導き出される45kHzクロックを単位とする大きさである。time_unit_sizeは、１秒以下（time_unit_size<=45000）にすることが良い。number_of_time_unit_entriesの３２ビットフィールドは、TU_map()の中にストアされているtime_unitのエントリー数を示す。
【０２２５】
RSPN_time_unit_startの３２ビットフィールドは、AVストリームの中でそれぞれのtime_unitが開始する場所の相対アドレスを示す。RSPN_time_unit_startは、ソースパケット番号を単位とする大きさであり、AV streamファイルの最初のソースパケットからClipInfo()において定義されるoffset_SPNの値を初期値としてカウントされる。そのAV streamファイルの中での絶対アドレスは、
SPN_xxx = RSPN_xxx - offset_SPN
により算出される。シンタクスのfor-loopの中でRSPN_time_unit_startの値は、昇順に現れなければならない。(k+１)番目のtime_unitの中にソースパケットが何もない場合、(k+1)番目のRSPN_time_unit_startは、k番目のRSPN_time_unit_startと等しくなければならない。
【０２２６】
図４５に示したzzzzz.clipのシンタクス内のClipMarkについて説明する。ClipMarkは、クリップについてのマーク情報であり、ClipMarkの中にストアされる。このマークは、記録器（記録再生装置１）によってセットされるものであり、ユーザによってセットされるものではない。
【０２２７】
図７５は、ClipMarkのシンタクスを示す図である。図７５に示したClipMarkのシンタクスを説明するに、version_numberは、このClipMark()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。
【０２２８】
lengthは、このlengthフィールドの直後からClipMark()の最後までのClipMark()のバイト数を示す３２ビットの符号なし整数である。number_of_Clip_marksは、 ClipMarkの中にストアされているマークの個数を示す１６ビットの符号なし整数である。number_of_Clip_marks は、０であってもよい。mark_typeは、マークのタイプを示す８ビットのフィールドであり、図７６に示すテーブルに従って符号化される。
【０２２９】
mark_time_stampは、３２ビットフィールドであり、マークが指定されたポイントを示すタイムスタンプをストアする。mark_time_stampのセマンティクスは、図７７に示すように、PlayList()の中のCPI_typeにより異なる。
【０２３０】
STC_sequence_idは、CPI()の中のCPI_typeがEP_map typeを示す場合、この８ビットのフィールドは、マークが置かれているところのSTC連続区間のSTC_sequence_idを示す。CPI()の中のCPI_typeがTU_map typeを示す場合、この８ビットのフィールドは何も意味を持たず、ゼロにセットされる。character_setの８ビットのフィールドは、mark_nameフィールドに符号化されているキャラクター文字の符号化方法を示す。その符号化方法は、図１９に示される値に対応する。
【０２３１】
name_lengthの８ビットフィールドは、Mark_nameフィールドの中に示されるマーク名のバイト長を示す。mark_nameのフィールドは、マークの名称を示す。このフィールドの中の左からname_length数のバイト数が、有効なキャラクター文字であり、それはマークの名称を示す。mark_nameフィールドの中で、それら有効なキャラクター文字の後の値は、どんな値が入っていても良い。
【０２３２】
ref_thumbnail_indexのフィールドは、マークに付加されるサムネイル画像の情報を示す。ref_thumbnail_indexフィールドが、0xFFFFでない値の場合、そのマークにはサムネイル画像が付加されており、そのサムネイル画像は、mark.thmbファイルの中にストアされている。その画像は、mark.thmbファイルの中でref_thumbnail_indexの値を用いて参照される。ref_thumbnail_indexフィールドが、0xFFFF である場合、そのマークにはサムネイル画像が付加されていない。
【０２３３】
MakersPrivateDataについては、図２２を参照して既に説明したので、その説明は省略する。
【０２３４】
次に、サムネイルインフォメーション（Thumbnail Information）について説明する。サムネイル画像は、menu.thmbファイルまたはmark.thmbファイルにストアされる。これらのファイルは同じシンタクス構造であり、ただ１つのThumbnail()を持つ。menu.thmbファイルは、メニューサムネイル画像，すなわちVolumeを代表する画像、および、それぞれのPlayListを代表する画像をストアする。すべてのメニューサムネイルは、ただ１つのmenu.thmbファイルにストアされる。
【０２３５】
mark.thmbファイルは、マークサムネイル画像，すなわちマーク点を表すピクチャをストアする。すべてのPlayListおよびClipに対するすべてのマークサムネイルは、ただ１つのmark.thmbファイルにストアされる。サムネイルは頻繁に追加、削除されるので、追加操作と部分削除の操作は容易に高速に実行できなければならない。この理由のため、Thumbnail()はブロック構造を有する。画像のデータはいくつかの部分に分割され、各部分は一つのtn_blockに格納される。１つの画像データはは連続したtn_blockに格納される。tn_blockの列には、使用されていないtn_blockが存在してもよい。１つのサムネイル画像のバイト長は可変である。
【０２３６】
図７８は、menu.thmbとmark.thmbのシンタクスを示す図であり、図７９は、図７８に示したmenu.thmbとmark.thmbのシンタクス内のThumbnailのシンタクスを示す図である。図７９に示したThumbnailのシンタクスについて説明するに、version_numberは、このThumbnail()のバージョンナンバーを示す４個のキャラクター文字である。version_numberは、ISO 646に従って、"0045"と符号化されなければならない。
【０２３７】
lengthは、このlengthフィールドの直後からThumbnail()の最後までのMakersPrivateData()のバイト数を示す３２ビットの符号なし整数である。tn_blocks_start_addressは、Thumbnail()の先頭のバイトからの相対バイト数を単位として、最初のtn_blockの先頭バイトアドレスを示す３２ビットの符号なし整数である。相対バイト数はゼロからカウントされる。number_of_thumbnailsは、Thumbnail()の中に含まれているサムネイル画像のエントリー数を与える１６ビットの符号なし整数である。
【０２３８】
tn_block_sizeは、１０２４バイトを単位として、１つのtn_blockの大きさを与える１６ビットの符号なし整数である。例えば、tn_block_size＝１ならば、それは１つのtn_blockの大きさが１０２４バイトであることを示す。number_of_tn_blocksは、このThumbnail()中のtn_blockのエントリ数を表す１６ビットの符号なし整数である。thumbnail_indexは、このthumbnail_indexフィールドから始まるforループ一回分のサムネイル情報で表されるサムネイル画像のインデクス番号を表す１６ビットの符号なし整数である。thumbnail_index として、0xFFFFという値を使用してはならない。thumbnail_index はUIAppInfoVolume()、UIAppInfoPlayList()、PlayListMark()、およびClipMark()の中のref_thumbnail_indexによって参照される。
【０２３９】
thumbnail_picture_formatは、サムネイル画像のピクチャフォーマットを表す８ビットの符号なし整数で、図８０に示すような値をとる。表中のDCFとPNGは”menu.thmb”内でのみ許される。マークサムネイルは、値"0x00" (MPEG-2 Video I-picture)をとらなければならない。
【０２４０】
picture_data_sizeは、サムネイル画像のバイト長をバイト単位で示す３２ビットの符号なし整数である。start_tn_block_numberは、サムネイル画像のデータが始まるtn_blockのtn_block番号を表す１６ビットの符号なし整数である。サムネイル画像データの先頭は、tb_blockの先頭と一致していなければならない。tn_block番号は、０から始まり、tn_blockのfor-ループ中の変数ｋの値に関係する。
【０２４１】
x_picture_lengthは、サムネイル画像のフレーム画枠の水平方向のピクセル数を表す１６ビットの符号なし整数である。y_picture_lengthは、サムネイル画像のフレーム画枠の垂直方向のピクセル数を表す１６ビットの符号なし整数である。tn_blockは、サムネイル画像がストアされる領域である。Thumbnail()の中のすべてのtn_blockは、同じサイズ（固定長）であり、その大きさはtn_block_sizeによって定義される。
【０２４２】
図８１は、サムネイル画像データがどのようにtn_blockに格納されるかを模式的に表した図である。図８１のように、各サムネイル画像データはtn_blockの先頭から始まり、1 tn_blockを超える大きさの場合は、連続する次のtn_blockを使用してストアされる。このようにすることにより、可変長であるピクチャデータが、固定長のデータとして管理することが可能となり、削除といった編集に対して簡便な処理により対応する事ができるようになる。
【０２４３】
次に、AVストリームファイルについて説明する。AVストリームファイルは、"M2TS"ディレクトリ（図１４）にストアされる。AVストリームファイルには、２つのタイプがあり、それらは、Clip AVストリームとBridge-Clip AVストリームファイルである。両方のAVストリーム共に、これ以降で定義されるDVR MPEG-2トランスポートストリームファイルの構造でなければならない。
【０２４４】
まず、DVR MPEG-2 トランスポートストリームについて説明する。DVR MPEG-2トランスポートストリームの構造は、図８２に示すようになっている。AVストリームファイルは、DVR MPEG2トランスポートストリームの構造を持つ。DVR MPEG2トランスポートストリームは、整数個のAligned unitから構成される。Alignedunitの大きさは、６１４４バイト (2048^＊3 バイト)である。Aligned unitは、ソースパケットの第１バイト目から始まる。ソースパケットは、１９２バイト長である。一つのソースパケットは、TP_extra_headerとトランスポートパケットから成る。TP_extra_headerは、４バイト長であり、またトランスポートパケットは、１８８バイト長である。
【０２４５】
１つのAligned unitは、３２個のソースパケットから成る。DVR MPEG２トランスポートストリームの中の最後のAligned unitも、また３２個のソースパケットから成る。よって、DVR MPEG2トランスポートストリームは、Aligned unitの境界で終端する。ディスクに記録される入力トランスポートストリームのトランスポートパケットの数が３２の倍数でない時、ヌルパケット（PID=0x1FFFのトランスポートパケット）を持ったソースパケットを最後のAligned unitに使用しなければならない。ファイルシステムは、DVR MPEG２トランスポートストリームに余分な情報を付加してはならない。
【０２４６】
図８３に、DVR MPEG-2トランスポートストリームのレコーダモデルを示す。図８３に示したレコーダは、レコーディングプロセスを規定するための概念上のモデルである。DVR MPEG-2トランスポートストリームは、このモデルに従う。
【０２４７】
MPEG-2トランスポートストリームの入力タイミングについて説明する。入力MPEG2トランスポートストリームは、フルトランスポートストリームまたはパーシャルトランスポートストリームである。入力されるMPEG2トランスポートストリームは、ISO/IEC13818-1またはISO/IEC13818-9に従っていなければならない。MPEG2トランスポートストリームのi番目のバイトは、T-STD(ISO/IEC13818-1で規定されるTransport stream system target decoder)とソースパケッタイザへ、時刻t(i)に同時に入力される。Rpkは、トランスポートパケットの入力レートの瞬時的な最大値である。
【０２４８】
２７MHz PLL５２は、２７MHzクロックの周波数を発生する。２７MHzクロックの周波数は、MPEG-2トランスポートストリームのPCR (Program Clock Reference)の値にロックされる。arrival time clock counter５３は、２７MHzの周波数のパルスをカウントするバイナリーカウンターである。Arrival_time_clock(i)は、時刻t(i)におけるArrival time clock counterのカウント値である。
【０２４９】
source packetizer５４は、すべてのトランスポートパケットにTP_extra_headerを付加し、ソースパケットを作る。Arrival_time_stampは、トランスポートパケットの第１バイト目がT-STDとソースパケッタイザの両方へ到着する時刻を表す。Arrival_time_stamp(k)は、次式で示されるようにArrival_time_clock(k)のサンプル値であり、ここで、kはトランスポートパケットの第１バイト目を示す。
arrival_time_stamp(k) = arrival_time_clock(k)% 2³⁰
【０２５０】
２つの連続して入力されるトランスポートパケットの時間間隔が、2³⁰/27000000秒（約40秒）以上になる場合、その２つのトランスポートパケットのarrival_time_stampの差分は、2³⁰/27000000秒になるようにセットされるべきである。レコーダは、そのようになる場合に備えてある。
【０２５１】
smoothing buffer５５は、入力トランスポートストリームのビットレートをスムージングする。スムージングバッファは、オーバーフロウしてはならない。Rmaxは、スムージングバッファが空でない時のスムージングバッファからのソースパケットの出力ビットレートである。スムージングバッファが空である時、スムージングバッファからの出力ビットレートはゼロである。
【０２５２】
次に、DVR MPEG-2トランスポートストリームのレコーダモデルのパラメータについて説明する。Rmaxという値は、AVストリームファイルに対応するClipInfo()において定義されるTS_recording_rateによって与えられる。この値は、次式により算出される。
Rmax = TS_recording_rate ^＊ 192/188
TS_recording_rateの値は、bytes/secondを単位とする大きさである。
【０２５３】
入力トランスポートストリームがSESFトランスポートストリームの場合、Rpkは、AVストリームファイルに対応するClipInfo()において定義されるTS_recording_rateに等しくなければならない。入力トランスポートストリームがSESFトランスポートストリームでない場合、この値はMPEG-2 transport streamのデスクリプター，例えばmaximum_bitrate_descriptorやpartial_transport_stream_descriptorなど、において定義される値を参照しても良い。
【０２５４】
smoothing buffer sizeは、入力トランスポートストリームがSESFトランスポートストリームの場合、スムージングバッファの大きさはゼロである。入力トランスポートストリームがSESFトランスポートストリームでない場合、スムージングバッファの大きさはMPEG-2 transport streamのデスクリプター、例えばsmoothing_buffer_descriptor、short_smoothing_buffer_descriptor、partial_transport_stream_descriptorなどにおいて定義される値を参照しても良い。
【０２５５】
記録機（レコーダ）および再生機（プレーヤ）は、十分なサイズのバッファを用意しなければならない。デフォールトのバッファサイズは、1536 bytes である。
【０２５６】
次に、DVR MPEG-2トランスポートストリームのプレーヤモデルについて説明する。図８４は、DVR MPEG-2トランスポートストリームのプレーヤモデルを示す図である。これは、再生プロセスを規定するための概念上のモデルである。DVR MPEG-2トランスポートストリームは、このモデルに従う。
【０２５７】
27MHz X-tal６１は、２７Mhzの周波数を発生する。２７MHz周波数の誤差範囲は、+/-30 ppm (27000000 +/- 810 Hz)でなければならない。arrival time clock counter６２は、２７MHzの周波数のパルスをカウントするバイナリーカウンターである。Arrival_time_clock(i)は、時刻t(i)におけるArrival time clock counterのカウント値である。
【０２５８】
smoothing buffer６４において、Rmaxは、スムージングバッファがフルでない時のスムージングバッファへのソースパケットの入力ビットレートである。スムージングバッファがフルである時、スムージングバッファへの入力ビットレートはゼロである。
【０２５９】
MPEG-2トランスポートストリームの出力タイミングを説明するに、現在のソースパケットのarrival_time_stampがarrival_time_clock(i)のLSB ３０ビットの値と等しい時、そのソースパケットのトランスポートパケットは、スムージングバッファから引き抜かれる。Rpkは、トランスポートパケットレートの瞬時的な最大値である。スムージングバッファは、アンダーフロウしてはならない。
【０２６０】
DVR MPEG-2トランスポートストリームのプレーヤモデルのパラメータについては、上述したDVR MPEG-2トランスポートストリームのレコーダモデルのパラメータと同一である。
【０２６１】
図８５は、Source packetのシンタクスを示す図である。transport_packet()は、ISO/IEC 13818-1で規定されるMPEG-2トランスポートパケットである。図８５に示したSource packetのシンタクス内のTP_Extra_headerのシンタクスを図８６に示す。図８６に示したTP_Extra_headerのシンタクスについて説明するに、copy_permission_indicatorは、トランスポートパケットのペイロードのコピー制限を表す整数である。コピー制限は、copy free、no more copy、copy once、またはcopy prohibitedとすることができる。図８７は、copy_permission_indicatorの値と、それらによって指定されるモードの関係を示す。
【０２６２】
copy_permission_indicatorは、すべてのトランスポートパケットに付加される。IEEE1394デジタルインタフェースを使用して入力トランスポートストリームを記録する場合、copy_permission_indicatorの値は、IEEE1394 isochronouspacket headerの中のEMI (Encryption Mode Indicator)の値に関連付けても良い。IEEE1394デジタルインタフェースを使用しないで入力トランスポートストリームを記録する場合、copy_permission_indicatorの値は、トランスポートパケットの中に埋め込まれたCCIの値に関連付けても良い。アナログ信号入力をセルフエンコードする場合、copy_permission_indicatorの値は、アナログ信号のCGMS-Aの値に関連付けても良い。
【０２６３】
arrival_time_stampは、次式
arrival_time_stamp(k) = arrival_time_clock(k)% 2³⁰
において、arrival_time_stampによって指定される値を持つ整数値である。
【０２６４】
Clip AVストリームの定義をするに、Clip AVストリームは、上述したような定義がされるDVR MPEG-2トランスポートストリームの構造を持たねばならない。arrival_time_clock(i)は、Clip AVストリームの中で連続して増加しなければならない。Clip AVストリームの中にシステムタイムベース（STCベース）の不連続点が存在したとしても、そのClip AVストリームのarrival_time_clock(i)は、連続して増加しなければならない。
【０２６５】
Clip AVストリームの中の開始と終了の間のarrival_time_clock(i)の差分の最大値は、２６時間でなければならない。この制限は、MPEG2トランスポートストリームの中にシステムタイムベース（STCベース）の不連続点が存在しない場合に、Clip AVストリームの中で同じ値のPTS(Presentation Time Stamp)が決して現れないことを保証する。MPEG2システムズ規格は、PTSのラップアラウンド周期を233/90000秒(約26.5時間).と規定している。
【０２６６】
Bridge-Clip AVストリームの定義をするに、Bridge-Clip AVストリームは、上述したような定義がされるDVR MPEG-2トランスポートストリームの構造を持たねばならない。Bridge-Clip AVストリームは、１つのアライバルタイムベースの不連続点を含まなければならない。アライバルタイムベースの不連続点の前後のトランスポートストリームは、後述する符号化の制限に従わなければならず、かつ後述するDVR-STDに従わなければならない。
【０２６７】
本実施の形態においては、編集におけるPlayItem間のビデオとオーディオのシームレス接続をサポートする。PlayItem間をシームレス接続にすることは、プレーヤ／レコーダに"データの連続供給"と"シームレスな復号処理"を保証する。"データの連続供給"とは、ファイルシステムが、デコーダにバッファのアンダーフロウを起こさせる事のないように必要なビットレートでデータを供給する事を保証できることである。データのリアルタイム性を保証して、データをディスクから読み出すことができるように、データが十分な大きさの連続したブロック単位でストアされるようにする。
【０２６８】
"シームレスな復号処理"とは、プレーヤが、デコーダの再生出力にポーズやギャップを起こさせる事なく、ディスクに記録されたオーディオビデオデータを表示できることである。
【０２６９】
シームレス接続されているPlayItemが参照するAVストリームについて説明する。先行するPlayItemと現在のPlayItemの接続が、シームレス表示できるように保証されているかどうかは、現在のPlayItemにおいて定義されているconnection_conditionフィールドから判断することができる。PlayItem間のシームレス接続は、Bridge-Clipを使用する方法と使用しない方法がある。
【０２７０】
図８８は、Bridge-Clipを使用する場合の先行するPlayItemと現在のPlayItemの関係を示している。図８８においては、プレーヤが読み出すストリームデータが、影をつけて示されている。図８８に示したTS1は、Clip1（Clip AVストリーム）の影を付けられたストリームデータとBridge-ClipのRSPN_arrival_time_discontinuityより前の影を付けられたストリームデータから成る。
【０２７１】
TS1のClip1の影を付けられたストリームデータは、先行するPlayItemのIN_time（図８８においてIN_time1で図示されている）に対応するプレゼンテーションユニットを復号する為に必要なストリームのアドレスから、RSPN_exit_from_previous_Clipで参照されるソースパケットまでのストリームデータである。TS1に含まれるBridge-ClipのRSPN_arrival_time_discontinuityより前の影を付けられたストリームデータは、Bridge-Clipの最初のソースパケットから、RSPN_arrival_time_discontinuityで参照されるソースパケットの直前のソースパケットまでのストリームデータである。
【０２７２】
また、図８８におけるTS2は、Clip2（Clip AVストリーム）の影を付けられたストリームデータとBridge-ClipのRSPN_arrival_time_discontinuity以後の影を付けられたストリームデータから成る。TS2に含まれるBridge-ClipのRSPN_arrival_time_discontinuity以後の影を付けられたストリームデータは、RSPN_arrival_time_discontinuityで参照されるソースパケットから、Bridge-Clipの最後のソースパケットまでのストリームデータである。TS2のClip2の影を付けられたストリームデータは、RSPN_enter_to_current_Clipで参照されるソースパケットから、現在のPlayItemのOUT_time（図８８においてOUT_time2で図示されている）に対応するプレゼンテーションユニットを復号する為に必要なストリームのアドレスまでのストリームデータである。
【０２７３】
図８９は、Bridge-Clipを使用しない場合の先行するPlayItemと現在のPlayItemの関係を示している。この場合、プレーヤが読み出すストリームデータは、影をつけて示されている。図８９におけるTS1は、Clip1 (Clip AVストリーム)の影を付けられたストリームデータから成る。TS1のClip1の影を付けられたストリームデータは、先行するPlayItemのIN_time（図８９においてIN_time1で図示されている）に対応するプレゼンテーションユニットを復号する為に必要なストリームのアドレスから始まり、Clip1の最後のソースパケットまでのデータである。また、図８９におけるTS2は、Clip2 (Clip AVストリーム)の影を付けられたストリームデータから成る。
【０２７４】
TS2のClip2の影を付けられたストリームデータは、Clip2の最初のソースパケットから始まり、現在のPlayItemのOUT_time（図８９においてOUT_time2で図示されている）に対応するプレゼンテーションユニットを復号する為に必要なストリームのアドレスまでのストリームデータである。
【０２７５】
図８８と図８９において、TS1とT2は、ソースパケットの連続したストリームである。次に、TS1とTS2のストリーム規定と、それらの間の接続条件について考える。まず、シームレス接続のための符号化制限について考える。トランスポートストリームの符号化構造の制限として、まず、TS1とTS2の中に含まれるプログラムの数は、１でなければならない。TS1とTS2の中に含まれるビデオストリームの数は、１でなければならない。TS1とTS2の中に含まれるオーディオストリームの数は、２以下でなければならない。TS1とTS2の中に含まれるオーディオストリームの数は、等しくなければならない。TS1および／またはTS2の中に、上記以外のエレメンタリストリームまたはプライベートストリームが含まれていても良い。
【０２７６】
ビデオビットストリームの制限について説明する。図９０は、ピクチャの表示順序で示すシームレス接続の例を示す図である。接続点においてビデオストリームをシームレスに表示できるためには、OUT_time1（Clip1のOUT_time）の後とIN_time2（Clip2のIN_time）の前に表示される不必要なピクチャは、接続点付近のClipの部分的なストリームを再エンコードするプロセスにより、除去されなければならない。
【０２７７】
図９０に示したような場合において、BridgeSequenceを使用してシームレス接続を実現する例を、図９１に示す。RSPN_arrival_time_discontinuityより前のBridge-Clipのビデオストリームは、図９０のClip1のOUT_time1に対応するピクチャまでの符号化ビデオストリームから成る。そして、そのビデオストリームは先行するClip1のビデオストリームに接続され、１つの連続でMPEG２規格に従ったエレメンタリストリームとなるように再エンコードされている。
【０２７８】
同様にして、RSPN_arrival_time_discontinuity以後のBridge-Clipのビデオストリームは、図９０のClip2のIN_time2に対応するピクチャ以後の符号化ビデオストリームから成る。そして、そのビデオストリームは、正しくデコード開始する事ができて、これに続くClip2のビデオストリームに接続され、１つの連続でMPEG2規格に従ったエレメンタリストリームとなるように再エンコードされている。Bridge-Clipを作るためには、一般に、数枚のピクチャは再エンコードしなければならず、それ以外のピクチャはオリジナルのClipからコピーすることができる。
【０２７９】
図９０に示した例の場合にBridgeSequenceを使用しないでシームレス接続を実現する例を図９２に示す。Clip1のビデオストリームは、図９０のOUT_time1に対応するピクチャまでの符号化ビデオストリームから成り、それは、１つの連続でMPEG２規格に従ったエレメンタリストリームとなるように再エンコードされている。同様にして、Clip2のビデオストリームは、図９０のClip2のIN_time2に対応するピクチャ以後の符号化ビデオストリームから成り、それは、一つの連続でMPEG２規格に従ったエレメンタリストリームとなるように再エンコードされている。
【０２８０】
ビデオストリームの符号化制限について説明するに、まず、TS1とTS2のビデオストリームのフレームレートは、等しくなければならない。TS1のビデオストリームは、sequence_end_codeで終端しなければならない。TS2のビデオストリームは、Sequence Header、GOP Header、そしてI-ピクチャで開始しなければならない。TS2のビデオストリームは、クローズドGOPで開始しなければならない。
【０２８１】
ビットストリームの中で定義されるビデオプレゼンテーションユニット（フレームまたはフィールド）は、接続点を挟んで連続でなければならない。接続点において、フレームまたはフィールドのギャップがあってはならない。接続点において、トップ―ボトムのフィールドシーケンスは連続でなければならない。3-2プルダウンを使用するエンコードの場合は、"top_field_first" および "repeat_first_field"フラグを書き換える必要があるかもしれない，またはフィールドギャップの発生を防ぐために局所的に再エンコードするようにしても良い。
【０２８２】
オーディオビットストリームの符号化制限について説明するに、TS1とTS2のオーディオのサンプリング周波数は、同じでなければならない。TS1とTS2のオーディオの符号化方法（例．MPEG1レイヤ2, AC-3, SESF LPCM, AAC）は、同じでなければならない。
【０２８３】
次に、MPEG-2トランスポートストリームの符号化制限について説明するに、TS1のオーディオストリームの最後のオーディオフレームは、TS1の最後の表示ピクチャの表示終了時に等しい表示時刻を持つオーディオサンプルを含んでいなければならない。TS2のオーディオストリームの最初のオーディオフレームは、TS2の最初の表示ピクチャの表示開始時に等しい表示時刻を持つオーディオサンプルを含んでいなければならない。
【０２８４】
接続点において、オーディオプレゼンテーションユニットのシーケンスにギャップがあってはならない。図９３に示すように、２オーディオフレーム区間未満のオーディオプレゼンテーションユニットの長さで定義されるオーバーラップがあっても良い。TS2のエレメンタリストリームを伝送する最初のパケットは、ビデオパケットでなければならない。接続点におけるトランスポートストリームは、後述するDVR-STDに従わなくてはならない。
【０２８５】
ClipおよびBridge-Clipの制限について説明するに、TS1とTS2は、それぞれの中にアライバルタイムベースの不連続点を含んではならない。
【０２８６】
以下の制限は、Bridge-Clipを使用する場合にのみ適用される。TS1の最後のソースパケットとTS2の最初のソースパケットの接続点においてのみ、Bridge-Clip AVストリームは、ただ１つのアライバルタイムベースの不連続点を持つ。ClipInfo()において定義されるRSPN_arrival_time_discontinuityが、その不連続点のアドレスを示し、それはTS2の最初のソースパケットを参照するアドレスを示さなければならない。
【０２８７】
BridgeSequenceInfo()において定義されるRSPN_exit_from_previous_Clipによって参照されるソースパケットは、Clip1の中のどのソースパケットでも良い。それは、Aligned unitの境界である必要はない。BridgeSequenceInfo()において定義されるRSPN_enter_to_current_Clipによって参照されるソースパケットは、Clip2の中のどのソースパケットでも良い。それは、Aligned unitの境界である必要はない。
【０２８８】
PlayItemの制限について説明するに、先行するPlayItemのOUT_time（図８８、図８９において示されるOUT_time1）は、TS1の最後のビデオプレゼンテーションユニットの表示終了時刻を示さなければならない。現在のPlayItemのIN_time（図８８、図８９において示されるIN_time2）は、TS2の最初のビデオプレゼンテーションユニットの表示開始時刻を示さなければならない。
【０２８９】
Bridge-Clipを使用する場合のデータアロケーションの制限について、図９４を参照して説明するに、シームレス接続は、ファイルシステムによってデータの連続供給が保証されるように作られなければならない。これは、Clip1（Clip AVストリームファイル）とClip2（Clip AVストリームファイル）に接続されるBridge-Clip AVストリームを、データアロケーション規定を満たすように配置することによって行われなければならない。
【０２９０】
RSPN_exit_from_previous_Clip以前のClip1（Clip AVストリームファイル）のストリーム部分が、ハーフフラグメント以上の連続領域に配置されているように、RSPN_exit_from_previous_Clipが選択されなければならない。Bridge-Clip AVストリームのデータ長は、ハーフフラグメント以上の連続領域に配置されるように、選択されなければならない。RSPN_enter_to_current_Clip以後のClip2（Clip AVストリームファイル）のストリーム部分が、ハーフフラグメント以上の連続領域に配置されているように、RSPN_enter_to_current_Clipが選択されなければならない。
【０２９１】
Bridge-Clipを使用しないでシームレス接続する場合のデータアロケーションの制限について、図９５を参照して説明するに、シームレス接続は、ファイルシステムによってデータの連続供給が保証されるように作られなければならない。これは、Clip1（Clip AVストリームファイル）の最後の部分とClip2（Clip AVストリームファイル）の最初の部分を、データアロケーション規定を満たすように配置することによって行われなければならない。
【０２９２】
Clip1（Clip AVストリームファイル）の最後のストリーム部分が、ハーフフラグメント以上の連続領域に配置されていなければならない。Clip2（Clip AVストリームファイル）の最初のストリーム部分が、ハーフフラグメント以上の連続領域に配置されていなければならない。
【０２９３】
次に、DVR-STDについて説明する。DVR-STDは、DVR MPEG2トランスポートストリームの生成および検証の際におけるデコード処理をモデル化するための概念モデルである。また、DVR-STDは、上述したシームレス接続された２つのPlayItemによって参照されるAVストリームの生成および検証の際におけるデコード処理をモデル化するための概念モデルでもある。
【０２９４】
DVR-STDモデルを図９６に示す。図９６に示したモデルには、DVR MPEG-2トランスポートストリームプレーヤモデルが構成要素として含まれている。n, TBn,MBn, EBn, TBsys, Bsys, Rxn, Rbxn, Rxsys, Dn, Dsys, OnおよびPn(k)の表記方法は、ISO/IEC13818-1のT-STDに定義されているものと同じである。すなわち、次の通りである。nは、エレメンタリストリームのインデクス番号である。TBnは、エレメンタリストリームnのトランスポートバッファでる。
【０２９５】
MBnは、エレメンタリストリームnの多重バッファである。ビデオストリームについてのみ存在する。EBnは、エレメンタリストリームnのエレメンタリストリームバッファである。ビデオストリームについてのみ存在する。TBsysは、復号中のプログラムのシステム情報のための入力バッファである。Bsysは、復号中のプログラムのシステム情報のためのシステムターゲットデコーダ内のメインバッファである。Rxnは、データがTBnから取り除かれる伝送レートである。Rbxnは、PESパケットペイロードがMBnから取り除かれる伝送レートである。ビデオストリームについてのみ存在する。
【０２９６】
Rxsysは、データがTBsysから取り除かれる伝送レートである。Dnは、エレメンタリストリームnのデコーダである。Dsysは、復号中のプログラムのシステム情報に関するデコーダである。Onは、ビデオストリームnのre-ordering bufferである。Pn(k)は、エレメンタリストリームnのk番目のプレゼンテーションユニットである。
【０２９７】
DVR-STDのデコーディングプロセスについて説明する。単一のDVR MPEG-2トランスポートストリームを再生している間は、トランスポートパケットをTB1, TBnまたはTBsysのバッファへ入力するタイミングは、ソースパケットのarrival_time_stampにより決定される。TB1, MB1, EB1, TBn, Bn, BsysおよびTBsysのバッファリング動作の規定は、ISO/IEC 13818-1に規定されているT-STDと同じである。復号動作と表示動作の規定もまた、ISO/IEC 13818-1に規定されているT-STDと同じである。
【０２９８】
シームレス接続されたPlayItemを再生している間のデコーディングプロセスについて説明する。ここでは、シームレス接続されたPlayItemによって参照される２つのAVストリームの再生について説明をすることにし、以後の説明では、上述した（例えば、図８８に示した）TS1とTS2の再生について説明する。TS1は、先行するストリームであり、TS2は、現在のストリームである。
【０２９９】
図９７は、あるAVストリーム（TS1）からそれにシームレスに接続された次のAVストリーム（TS2）へと移る時のトランスポートパケットの入力，復号，表示のタイミングチャートを示す。所定のAVストリーム（TS1）からそれにシームレスに接続された次のAVストリーム（TS2）へと移る間には、TS2のアライバルタイムベースの時間軸（図９７においてATC2で示される）は、TS1のアライバルタイムベースの時間軸（図９７においてATC1で示される）と同じでない。
【０３００】
また、TS2のシステムタイムベースの時間軸（図９７においてSTC2で示される）は、TS1のシステムタイムベースの時間軸（図９７においてSTC1で示される）と同じでない。ビデオの表示は、シームレスに連続していることが要求される。オーディオのプレゼンテーションユニットの表示時間にはオーバーラップがあっても良い。
【０３０１】
DVR-STD への入力タイミングについて説明する。時刻Ｔ₁までの時間、すなわち、TS1の最後のビデオパケットがDVR-STDのTB1に入力終了するまでは、DVR-STDのTB1、TBn またはTBsysのバッファへの入力タイミングは、TS1のソースパケットのarrival_time_stampによって決定される。
【０３０２】
TS1の残りのパケットは、TS_recording_rate(TS1)のビットレートでDVR-STDのTBnまたはTBsysのバッファへ入力されなければならない。ここで、TS_recording_rate(TS1)は、Clip1に対応するClipInfo()において定義されるTS_recording_rateの値である。TS1の最後のバイトがバッファへ入力する時刻は、時刻Ｔ₂である。従って、時刻Ｔ₁からＴ₂までの区間では、ソースパケットのarrival_time_stampは無視される。
【０３０３】
N1をTS1の最後のビデオパケットに続くTS1のトランスポートパケットのバイト数とすると、時刻Ｔ₁乃至Ｔ₂までの時間DT1は、N1バイトがTS_recording_rate(TS1)のビットレートで入力終了するために必要な時間であり、次式により算出される。
ΔT1＝Ｔ₂−Ｔ₁＝N1 / TS_recording_rate (TS1)
時刻Ｔ₁乃至Ｔ₂までの間は、RXnとRXsysの値は共に、TS_recording_rate(TS1)の値に変化する。このルール以外のバッファリング動作は、T-STDと同じである。
【０３０４】
Ｔ₂の時刻において、arrival time clock counterは、TS2の最初のソースパケットのarrival_time_stampの値にリセットされる。DVR-STDのTB1, TBn またはTBsysのバッファへの入力タイミングは、TS2のソースパケットのarrival_time_stampによって決定される。RXnとRXsysは共に、T-STDにおいて定義されている値に変化する。
【０３０５】
付加的なオーディオバッファリングおよびシステムデータバッファリングについて説明するに、オーディオデコーダとシステムデコーダは、時刻Ｔ₁からT₂までの区間の入力データを処理することができるように、T-STDで定義されるバッファ量に加えて付加的なバッファ量（約1秒分のデータ量）が必要である。
【０３０６】
ビデオのプレゼンテーションタイミングについて説明するに、ビデオプレゼンテーションユニットの表示は、接続点を通して、ギャップなしに連続でなければならない。ここで、STC1は、TS1のシステムタイムベースの時間軸（図９７ではSTC1と図示されている）とし、STC2は、TS2のシステムタイムベースの時間軸（図９７ではSTC2と図示されている。正確には、STC2は、TS2の最初のPCRがT-STDに入力した時刻から開始する。）とする。
【０３０７】
STC1とSTC2の間のオフセットは、次のように決定される。PTS¹_endは、TS1の最後のビデオプレゼンテーションユニットに対応するSTC1上のPTSであり、PTS²_startは、TS2の最初のビデオプレゼンテーションユニットに対応するSTC2上のPTSであり、T_ppは、TS1の最後のビデオプレゼンテーションユニットの表示期間とすると、２つのシステムタイムベースの間のオフセットSTC_deltaは、次式により算出される。
STC_delta = PTS¹_end + T_pp - PTS²_start
【０３０８】
オーディオのプレゼンテーションのタイミングについて説明するに、接続点において、オーディオプレゼンテーションユニットの表示タイミングのオーバーラップがあっても良く、それは０乃至２オーディオフレーム未満である（図９７に図示されている"audio overlap"を参照）。どちらのオーディオサンプルを選択するかということと、オーディオプレゼンテーションユニットの表示を接続点の後の補正されたタイムベースに再同期することは、プレーヤ側により設定されることである。
【０３０９】
DVR-STDのシステムタイムクロックについて説明するに、時刻Ｔ₅において、TS1の最後のオーディオプレゼンテーションユニットが表示される。システムタイムクロックは、時刻Ｔ₂からＴ₅の間にオーバーラップしていても良い。この区間では、DVR-STDは、システムタイムクロックを古いタイムベースの値（STC1）と新しいタイムベースの値（STC2）の間で切り替える。STC2の値は、次式により算出される。
STC2＝STC1−STC_delta
【０３１０】
バッファリングの連続性について説明する。STC1¹_{video_end}は、TS1の最後のビデオパケットの最後のバイトがDVR-STDのTB1へ到着する時のシステムタイムベースSTC1上のSTCの値である。STC2²_{video_start}は、TS2の最初のビデオパケットの最初のバイトがDVR-STDのTB1へ到着する時のシステムタイムベースSTC2上のSTCの値である。STC2¹_{video_end}は、STC1¹_{video_end} の値をシステムタイムベースSTC2上の値に換算した値である。STC2¹_{video_end}は、次式により算出される。
STC2¹_{video_end} = STC1¹_{video_end} - STC_delta
【０３１１】
DVR-STDに従うために、次の２つの条件を満たす事が要求される。まず、TS2の最初のビデオパケットのTB1への到着タイミングは、次に示す不等式を満たさなければならない。そして、次に示す不等式を満たさなければならない。
STC2²_{video_start} > STC2¹_{video_end} + ΔT1
この不等式が満たされるように、Clip１および、または、Clip２の部分的なストリームを再エンコードおよび、または、再多重化する必要がある場合は、その必要に応じて行われる。
【０３１２】
次に、STC1とSTC2を同じ時間軸上に換算したシステムタイムベースの時間軸上において、TS1からのビデオパケットの入力とそれに続くTS2からのビデオパケットの入力は、ビデオバッファをオーバーフローおよびアンダーフローさせてはならない。
【０３１３】
このようなシンタクス、データ構造、規則に基づく事により、記録媒体に記録されているデータの内容、再生情報などを適切に管理することができ、もって、ユーザが再生時に適切に記録媒体に記録されているデータの内容を確認したり、所望のデータを簡便に再生できるようにすることができる。
【０３１４】
次に、図４６で示したClipInfoのシンタクスの中にあるtime_controlled_flagを1にセットする場合のＡＶストリームファイルの記録について、詳細な内容を説明する。time_controlled_flagを1にセットする場合、ＡＶストリームの時間経過とＡＶストリームのデータバイト量が、次の関係にあることを示す。すなわち、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、所定の誤差の範囲内で比例する、ことを保証する。
TS_average_rate^＊192/188 ^＊ (t -α)<= AV_file_size(t)
<= TS_average_rate^＊192/188 ^＊ (t +α)
...式（１）
【０３１５】
上記の式は、図４６のClipInfoのtime_controlled_flagの説明の中で示した式とは、すこし形式が違うが本質的には同じである。
【０３１６】
ここで、TS_average_rateは、AVストリームファイル（ＤＶＲトランスポートストリームファイル）の平均ビットレートをbytes/second の単位で表したものであり、ClipInfoの中の同名のフィールドにより示される。また、ｔは、AVストリームファイルの最初のソースパケットからのアライバルライムベースの経過時刻を秒単位で示す。AV_file_size(t)は、時刻ｔにおけるAVストリームファイルのサイズをバイト単位で表したものである。αは、所定の一定値であり、例えば、300秒である。
【０３１７】
TS_average_rateは、記録器のアプリケーションによって所定に値に決める。例えば、長時間録画モード（ＬＰモード），標準録画モード（ＳＰモード）、高画質録画モード（ＨＱモード）といった記録モードに応じて、それぞれのモード用のTS_average_rate値を決める。
【０３１８】
式(1)を満たすように、ＡＶストリームファイルが記録されている場合、そのストリームのある時間分だけ部分的にストリームを消去すると、消去した時間分だけ前記ストリームのTS_average_rateで示されるビットレートで記録可能な空き領域をディスク上に作れることを保証できる。例えば、ＳＰモードのＡＶストリームファイルのある時間分だけ部分的にストリームを消去すると、消去した時間分だけ、同じＳＰモードで記録可能な空き領域をディスク上に作ることができる。
【０３１９】
図９８は、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、所定の誤差の範囲内で比例するように、可変ビットレートを制御する場合の、図１の記録再生装置1のAVエンコーダ１５の動作を説明するブロック図である。図９８と図１で、同じ番号がつけられているブロックは同一のものである。
【０３２０】
まず、ユーザインタフェース２４を通して、ユーザーからLP, SPモードなどの記録モードが制御部２３に入力される。制御部２３は記録モードに応じて、記録するAVストリーム（ＤＶＲトランスポートストリーム）の多重化ビットレート、およびビデオ符号化の平均ビットレートを設定する（図９９のフローチャートのステップＳ２０参照）。
【０３２１】
制御部２３は、time_controlled_flagを１にセットし、多重化ストリームの平均ビットレートをTS_average_rateとし、また多重化ビットレートをTS_recording_rateとする。制御部２３は、time_controlled_flag,TS_recording_rateとTS_average_rateをClipInfoに設定したClip Informationファイルのデータベースを出力する。Clip Informationファイルは、図１で説明したようにECC符号化部２０の処理を通して、記録媒体に記録される。
【０３２２】
アナログのビデオ入力をエンコードする場合は、端子１１からビデオが入力される。または、ディジタル放送入力のビデオをトランスコードする場合は、AVデコーダ２７からのビデオが入力される。入力ビデオは、ビデオエンコーダ１５１へ入力される。制御部２３は、所定時間あたりのビデオに対する割り当て符号化ビット量を計算して、それをビデオエンコーダに指定する。ビデオエンコーダ１５１は、所定時間あたりのビデオをエンコードして、実際に発生した符号化ビット量を制御部２３へ入力する。例えば、所定時間の大きさは、ビデオのＧＯＰであり、０.５秒である。制御部２３は、エンコーダから入力される実際に発生した符号化ビット量のエンコード開始後の累計値に基づいて、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、所定の誤差の範囲内で比例するように、ビデオ符号化の可変ビットレートの制御をして、次の所定時間あたりのビデオに対する割り当て符号化ビット量を計算する。また、この時に、制御部２３が、エンコーダからビデオの符号化難易度（動きベクトル予測の予測残差の大きさ、ＤＣＴ係数の量子化スケールの大きさ、など）を供給されることができれば、さらに高画質な可変ビットレートを実現できる。すなわち、ビデオの符号化難易度が高いほど、所定時間あたりのビデオに対する割り当て符号化ビット量を大きくするように制御する。
【０３２３】
ビデオエンコーダ１５１は、ビデオストリームをマルチプレクサ１６へ入力する。マルチプレクサ１６へはまた、オーディオストリームとAV同期等のシステム情報(S)が入力される。また、オーディオ入力のエンコード処理の流れ、および、AV同期等のシステム情報(S)については、図１の説明と同じである。
【０３２４】
マルチプレクサ１６は、ビデオおよびオーディオストリームを、所定の多重化ビットレートのトランスポートストリームに多重化する。この時、ビデオとオーディオのパケット化は、ＭＰＥＧ２トランスポートストリームのシステムターゲットデコーダ（Ｔ−ＳＴＤ）を破綻させないように制御しなければならない。Ｔ−ＳＴＤの制限によって、ビデオのアクセスユニット（符号化されたI, P, Bのピクチャ）およびオーディオのアクセスユニット（オーディオフレーム）をパケット化することができない場合、マルチプレクサ１６は、ヌルパケット（パケットＩＤが、0x1FFFであるパケット）を発生しないように多重化する。この多重化制御により、連続するトランスポートパケットの時間間隔は不規則になり、パケットは間欠的に発生する。
【０３２５】
マルチプレクサ１６から出力されるトランスポートパケットは、ソースパケッタイザ１９へ入力される。ソースパケッタイザ１９は、各トランスポートパケットにアライバルタイムスタンプを付加して、ソースパケット化する。そして、ソースパケット列を前詰して、AVストリームファイルを生成する。AVストリームファイルは、図１で説明したようにECC符号化部２０の処理を通して、記録媒体に記録される。
【０３２６】
図９９は、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、所定の誤差の範囲内で比例することを保証する符号化モード（time_controlled_flag=１）において、ビデオを可変ビットレート符号化して、AVストリームを記録する動作を説明するフローチャートである。
【０３２７】
ステップＳ２０で、制御部２３は、トランスポートストリームの多重化ビットレートTS_recording_rateおよびビデオ符号化の平均ビットレートを設定する。
【０３２８】
ビデオ符号化の平均ビットレートは、TS_average_rateから、オーディオ符号化の一定のビットレートと多重化のオーバヘッドのビットレートを差し引いた値とする。ここで、TS_average_rateは、記録器のアプリケーション（LP, SPモードなど）によって所定に値に決められる。
【０３２９】
TS_recording_rateは、ビデオの可変ビットレート符号化の最大ビットレートに、オーディオ符号化の一定のビットレートと多重化のオーバヘッドのビットレートを加えた値よりも大きい値である。
【０３３０】
ステップＳ２１で、制御部２３は、ビデオストリームを、あらかじめ設定した所定の時間区間毎に所定の平均ビットレートが保証される様に、可変ビットレートでエンコードするようにビデオエンコーダ１５１を制御する。
【０３３１】
ステップＳ２２で、制御部２３は、トランスポートパケット化するエレメンタリストリームがない場合にヌルパケットを発生しないようにマルチプレクサ１６を制御する。この多重化制御により、連続する２個のトランスポートパケットの時間間隔は不規則になり、パケットは間欠的に発生する。
【０３３２】
ステップＳ２３で、制御部２３は、各トランスポートパケットにアライバルタイムスタンプを付加して、ソースパケット化するように、ソースパケッタイザ１９を制御し、そして、ソースパケット列を前詰して、AVストリームファイルとして記録するように制御する。
【０３３３】
次に、ビデオの可変ビットレート符号化をする場合のＭＰＥＧのＶＢＶ（ＶｉｄｅｏＢｕｆｆｅｒｉｎｇＶｅｒｉｆｉｅｒ）の制御方法について説明する。ＶＢＶは、MPEGが規定する理論的なデコーダモデルである（図１００を参照）。ＭＰＥＧビデオエンコーダは、ＶＢＶを正しく動作させるようにビデオストリームをエンコードしなければならない。これにより、エンコード方法を制限する（主に量子化制御およびピクチャのビット量の制限）。VBVの持つバッファをVBVバッファと呼ぶ。これは現実のデコーダに理論上、最低必要なバッファサイズである。ＭＰＥＧ２メインプロファイルメインレベルの場合、VBVバッファサイズは、1.75 Mbitsである。
【０３３４】
可変ビットレート時のＭＰＥＧのＶＢＶは、一般に、図１０１で示す方法が広く知られている。すなわち、図１０１は、VBVバッファに空きがあるときは、バッファへの入力ビットレートがVBR(Variable Bit-Rate、可変ビットレート)の最大ビットレートであり、VBVバッファのビット占有量がフルの場合は、バッファへの入力ビットレートがゼロになる場合のVBV制御を説明する図である。図１０１において、右上がりの線の傾きは、VBRの最大ビットレートを示し、VBVバッファに空きがあるときは、VBRの最大ビットレートでバッファ占有量が増える。また、VBVバッファのビット占有量がフルの場合は、バッファへの入力ビットレートがゼロとなり、バッファ占有量は変わらない。横軸は時間軸であり、T1は一つのデコード時刻を示し、時刻T₁において図示するＴ₁の時刻のピクチャが瞬時にデコードされて、バッファ占有量が減少する。以後、所定の時間間隔で同様にして、ピクチャがデコードされて、バッファ占有量が減少する。この図１０１で示す方法では、ビデオエンコーダがビデオストリーム中にスタッフィングバイトを発生することはない。
【０３３５】
これに対して、本技術では、ＶＢＶを図１０２に示すように制御する。すなわち、所定の時間（例えば、ＧＯＰ）毎にビットレートを変更する可変ビットレートにおいて、所定の時間内ではCBR(Constant Bit-Rate、固定ビットレート)のＶＢＶ制御を行う。図１０２は、GOP（例えば、0.5秒のビデオシーケンス）内でCBRの場合のVBV制御を示す。すなわち、VBVバッファへの入力ビットレートが、現在のGOPの符号化ビットレートであり、VBVバッファがオーバーフローしないようにスタッフィングバイトを挿入する場合のVBV制御を説明する図である。
【０３３６】
スタッフィングバイトの挿入するかどうかの判断と、挿入する場合のスタッフィングバイトの量の計算は、次の手順で行う。以下の説明において、
VBV_BUFFER_SIZE = 1.75^＊1024^＊1024 bit
gop_bit_rate: GOP毎のビットレート [bit/second]
とする。
【０３３７】
(1) 現在、符号化するピクチャの最低ビット量の計算。
図１０２の時刻d1のピクチャを例として説明する。まず、時刻d1のピクチャをＶＢＶがデコードする直前のＶＢＶバッファのビット占有量vbv_bを得る。次に、ビット占有量vbv_bに、時刻d1からその次のピクチャのデコード時刻d2までの間（tau）にビットレートgop_bit_rateで入力されるビット量を加えた値tmpを計算する。現在、符号化するピクチャの最低ビット量min_picture_bitは、tmp と VBV_BUFFER_SIZEから次のように計算できる。
tmp = vbv_b + gop_bit_rate^＊tau
min_picture_bit = tmp - VBV_BUFFER_SIZE
【０３３８】
(2) pictureの符号化後に、byte stuffingが必要かのチェック。現在のピクチャの実際の符号化ビットgen_picture_bitが、min_picture_bitより小さい場合は、次に示す計算式で示す大きさのスタッフィングバイト発生する。現在符号化したpictureの後にnum_stuffing_byteの数のstuffing bytesをビデオエンコーダが符号化する。一つのスタッフィングバイトは、８ビットの"0000 0000"の符号である。
if (gen_picture_bit < min_picture_bit)
num_stuffing_byte=(min_picture_bit-gen_picture_bit+4)/8
【０３３９】
この図１０２で示す方法では、ビデオエンコーダが所定時間のビデオに割り当てられたビット量を使うように制御することを目的として、VBVバッファへの入力ビットレートが現在のGOPの符号化ビットレートであり、VBVバッファがオーバーフローしないようにビデオエンコーダがスタッフィングバイトを発生する。
【０３４０】
図１０２に示すＶＢＶ制御は、本技術のコンセプトである、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が図１０３に示すように、所定の誤差範囲内で比例することを保証するために、有効である。図１０１に示すＶＢＶ制御を使うと、入力ビデオの中に長い時間の静止画像があると、図１０３の関係を保証できなくなる。すなわち、静止画像は情報量が比較的小さいため、その情報量よりも符号化の割り当てビット量を大きくしても、実際に符号化して発生するビット量はある比較的小さな値に飽和してしまう。したがって、この場合、ＡＶストリームの時間経過とＡＶストリームのデータバイト量の関係が図１０４に示すように、比例しない。このような場合でも、図１０２に示すＶＢＶ制御を使えば、ビデオエンコーダが所定時間のビデオに割り当てられたビット量を使うように制御することを目的として、VBVバッファへの入力ビットレートが現在のGOPの符号化ビットレートであり、VBVバッファがオーバーフローしないようにビデオエンコーダがスタッフィングバイトを発生するので、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が図１０３に示すように、所定の誤差範囲内でほぼ比例することを保証できる。
【０３４１】
図１０４の場合、静止画像部分の時間部分のＡＶストリームを消去しても、その部分の占めるデータバイト量は、平均ビットレートに消去時間を掛けたデータサイズよりも小さいため、消去した時間分だけ前記ストリームのTS_average_rateで示されるビットレートで記録可能な空き領域をディスク上に作れることができない。一方、図１０３の場合、ＡＶストリームのある時間分だけ部分的にストリームを消去すると、消去した時間分だけ前記ストリームのTS_average_rateで示されるビットレートで記録可能な空き領域をディスク上に作れることができる。
【０３４２】
図１０５は、上述の図９９のステップＳ２１の処理における、ビデオの可変ビットレート制御の処理の詳細を説明するフローチャートである。
【０３４３】
ステップＳ２００で、VBRの余裕量sv_nowに初期値SV1をセットする。本技術の可変ビットレート制御は、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が所定の誤差範囲内で比例することを保証するために、VBRの余裕量sv_nowが、ゼロから最大値SVMAXになるように制御を行う。
【０３４４】
例えば、上記の式（１）において、α＝３００秒の場合、SV1, SVMAXは次の値である。ここで、ビデオの平均符号化ビットレートは、図９９のステップＳ２０で決定された値である（図１０７を参照）。
SV1 = (ビデオの平均符号化ビットレート) ^＊ 300
SVMAX = SV1 ^＊ 2
【０３４５】
ステップＳ２０１で、現GOPの符号化の割り当てビットb_allocの計算する。
【０３４６】
ステップＳ２０２で、以下の不等式が成り立つかを調べる。このステップＳ２０２は、VBRの余裕量がマイナスにならないかどうかチェックである。
sv_now + b_av - b_alloc >= 0
【０３４７】
ここで、b_avは、ビデオの平均符号化ビットレートから計算される、GOPあたりの符号化の割り当てビット量の平均値である。ＧＯＰの時間長を、0.5秒とするとb_avは次の値である。
b_av = （ビデオの平均ビットレート）^＊ 0.5
【０３４８】
ステップＳ２０２でＹｅｓの場合は、ステップＳ２０３へ進む。ステップＳ２０２でＮｏの場合は、ステップＳ２０４へ進み、b_allocをb_avとし、ステップＳ２０５へ進む。
【０３４９】
ステップＳ２０３では、以下の不等式が成り立つかを調べる。このステップＳは、VBRの余裕量が最大値SVMAXを超えないかどうかチェックである。
sv_now + b_av - b_alloc <= SVMAX
【０３５０】
ステップＳ２０３でＹｅｓの場合は、ステップＳ２０５へ進む。ステップＳ２０３でＮｏの場合は、ステップＳ２０４へ進み、b_allocをb_avとし、ステップＳ２０５へ進む。
【０３５１】
ステップＳ２０５で、現在のGOPのエンコードする。そして、現在のGOPを割り当てビット量b_allocでエンコードし、その時のVBV制御は、VBVバッファへの入力ビットレートを現在のGOPの符号化ビットレートとし、VBVバッファがオーバーフローしないようにスタッフィングバイトを挿入するように制御する。この処理の詳細については、図１０６で説明する。
【０３５２】
ステップＳ２０６で、ＶＢＲの余裕量sv_nowを次式のように更新する。ここで、b_genは、ステップＳ２０５で、現在のGOPのエンコードした結果、得られた現GOPの符号化ビット量である。
sv_now += b_av - b_gen
【０３５３】
ステップＳ２０７で、現GOPが最後のGOPであるか調べる。ステップＳ２０７で、Ｙｅｓの場合は、処理を終了する。ステップＳ２０７で、Ｎｏの場合は、ステップＳ２０１へ戻る。
【０３５４】
図１０６は、上述の図１０５のステップＳ２０５の処理における、ＶＢＶ制御の処理の詳細を説明するフローチャートである。
【０３５５】
ステップＳ３００で、次式のように現GOPに割り当てられた符号化ビット量を符号化ビットレートgop_bit_rateに変換する。
gop_bit_rate = b_alloc / (15/ 29.97)
【０３５６】
ステップＳ３０１で、現GOPの中で、現在符号化するピクチャの最低ビット量 min_picture_bitを次式により計算する。
tmp = vbv_b + gop_bit_rate^＊tau
min_picture_bit = tmp - VBV_BUFFER_SIZE
【０３５７】
ここで、vbv_bは、ＶＢＶが、現在符号化するピクチャをデコードする直前のＶＢＶバッファのビット占有量である（図１０２参照）。
【０３５８】
tauは、現在符号化するピクチャのデコード時刻とその次のピクチャのデコード時刻の差である（図１０２参照）。
【０３５９】
VBV_BUFFER_SIZEは、VBVバッファサイズであり、ＭＰＥＧ２ＭＰ＠ＭＬの場合、1.75 Mbitである。
【０３６０】
ステップＳ３０２で、現在のピクチャのエンコードし、その発生ビット量gen_picture_bitを得る。
【０３６１】
ステップＳ３０３で、次の不等式を調べる。
gen_picture_bit < min_picture_bit
【０３６２】
ステップＳ３０３でＹｅｓの場合は、ステップＳ３０４へ進む。ステップＳ３０３でＮｏの場合は、ステップＳ３０５へ進む。
【０３６３】
ステップＳ３０４で、現在符号化したpictureの後にnum_stuffing_byteの数のスタッフィングバイトをビデオエンコーダが現在符号化し、それらを符号化ピクチャの後ろに付加する（図１０２参照）。
num_stuffing_byte=(min_picture_bit-gen_picture_bit+4)/8
【０３６４】
ステップＳ３０５で、GOPの最後のピクチャかどうか調べる。ステップＳ３０５で、Ｙｅｓの場合は、処理を終了する。ステップＳ３０５で、Ｎｏの場合は、ステップＳ３０１へ戻る。
【０３６５】
以上のようにして、ビデオストリームの可変ビットレート符号化を制御し、ＡＶストリームファイルを生成することにより、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、所定の誤差の範囲内で比例することを保証することできる。これにより、そのストリームのある時間分だけ部分的にストリームを消去すると、消去した時間分だけ前記ストリームのTS_average_rateで示されるビットレートで記録可能な空き領域をディスク上に作れることを保証できる。
【０３６６】
次に、比較のため、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が比例することを保証しない符号化モード（time_controlled_flag=０）におけるAVストリームの記録方法の例を２つ示す。
【０３６７】
一つ目のtime_controlled_flag=０の場合の例は、ディジタル放送のＡＶストリーム（プログラム）のトランスポートストリームをトランスペアレント記録する場合である。ディジタル放送が統計多重を用いている場合、一般に、その中のＡＶストリームは可変ビットレートである。一般に、この場合のＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が比例することは保証されないので、このＡＶストリームをトランスペアレント記録してClipを作成した場合、そのClipのtime_controlled_flagをゼロにセットする。
【０３６８】
二つ目のtime_controlled_flag=０の場合の例は、ビデオを可変ビットレート符号化する場合に、ビデオストリームを、あらかじめ設定した所定の時間区間毎に所定の平均ビットレート以下になる様に、可変ビットレートでエンコードする場合である。これは、図１０１で説明したように、ビデオ符号化のVBV制御が、VBVバッファに空きがあるときは、バッファへの入力ビットレートをVariable Bit-Rateの最大ビットレートにし、VBVバッファのビット占有量がフルの場合は、バッファへの入力ビットレートをゼロにする場合である。図１０８と図１０９を用いて、この場合のＡＶストリームの記録方法を説明する。
【０３６９】
図１０８は、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、比例することを保証しない符号化モード（time_controlled_flag=０）において、ビデオを可変ビットレート符号化して、AVストリームを記録する動作を説明するフローチャートを示す。
【０３７０】
ステップＳ４００以外は、図９９と同じである。
【０３７１】
ステップＳ４００で、ビデオストリームを、あらかじめ設定した所定の時間区間毎に所定の平均ビットレート以下になる様に、可変ビットレートでエンコードするようにビデオエンコーダ１５１を制御する。
【０３７２】
図１０９は、上述の図１０８のステップＳ４００の処理における、ビデオの可変ビットレート制御の処理の詳細を説明するフローチャートである。
【０３７３】
ステップＳ５００で、VBRの余裕量sv_nowに初期値SV1をセットする。この場合の可変ビットレート制御は、VBRの余裕量sv_nowが、負の値にならないように制御を行う。
【０３７４】
ステップＳ５０１で、現GOPの符号化の割り当てビットb_allocの計算する。
【０３７５】
ステップＳ５０２で、以下の不等式が成り立つかを調べる。このステップＳ５０２は、VBRの余裕量がマイナスにならないかどうかチェックである。
sv_now + b_av - b_alloc >= 0
【０３７６】
ここで、b_avは、ビデオの平均符号化ビットレートから計算される、GOPあたりの符号化の割り当てビット量の平均値である。ＧＯＰの時間長を、0.5秒とするとb_avは次の値である。
b_av = （ビデオの平均ビットレート）^＊ 0.5
【０３７７】
ステップＳ５０２でＹｅｓの場合は、ステップＳ５０４へ進む。ステップＳ５０２でＮｏの場合は、ステップＳ５０４へ進み、b_allocをb_avとし、ステップＳ５０４へ進む。
【０３７８】
ステップＳ５０４で、現在のGOPのエンコードする。そして、現在のGOPを割り当てビット量b_allocでエンコードし、その時のVBV制御は、その時のVBV制御は、VBVバッファに空きがあるときは、バッファへの入力ビットレートをVBR(Variable Bit-Rate)の最大ビットレートにし、VBVバッファのビット占有量がフルの場合は、バッファへの入力ビットレートをゼロにする場合のVBV制御とする（図１０１参照）。このステップＳでは、ビデオストリームにスタッフィングバイトを符号化しない。
【０３７９】
ステップＳ５０５で、ＶＢＲの余裕量sv_nowを次式のように更新する。ここで、b_genは、ステップＳ５０４で、現在のGOPのエンコードした結果、得られた現GOPの符号化ビット量である。
sv_now += b_av - b_gen
【０３８０】
ステップＳ５０６で、現GOPが最後のGOPであるか調べる。ステップＳ５０６で、Ｙｅｓの場合は、処理を終了する。ステップＳ５０６で、Ｎｏの場合は、ステップＳ５０１へ戻る。
【０３８１】
上記の図１０８および図１０９の記録方法の場合、前述したようにＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が所定の誤差範囲内で比例することを保証しない。例えば、入力ビデオの中に長い時間の静止画像があると、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が図１０４に示したようになる。すなわち、静止画像は情報量が比較的小さいため、その情報量よりも符号化の割り当てビット量を大きくしても、実際に符号化して発生するビット量はある比較的小さな値に飽和してしまう。したがって、この場合、ＡＶストリームの時間経過とＡＶストリームのデータバイト量の関係が、比例しない。
【０３８２】
一方、ビデオエンコーダが所定時間のビデオに割り当てられたビット量を使うように制御することを目的として、VBVバッファへの入力ビットレートが現在のGOPの符号化ビットレートであり、VBVバッファがオーバーフローしないようにビデオエンコーダがスタッフィングバイトを発生するように制御すれば、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、所定の誤差範囲内でほぼ比例することを保証できる。
【０３８３】
また、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、比例することを保証する符号化モード（time_controlled_flag=１）を簡単に実現する方法として、トランスポートストリームを多重化する時にヌルパケットを挿入して、一定ビットレートのトランスポートストリームを記録することも考えられる。これは、主にテープ記録媒体（Ｄ−ＶＨＳ等）で用いられている符号化方法である。ここで、ヌルパケットは、そのパケットＩＤ（ＰＩＤ）が、0x1FFFにセットされている、情報としては何も意味をもたないトランスポートパケットである。
【０３８４】
図９９の方法と比較する参考のために、図１１０に、所定の一定ビットレートのトランスポートストリームを符号化することによって、ＡＶストリームの時間経過とＡＶストリームのデータバイト量との関係が、比例することを保証する符号化モードのフローチャートを示す。
【０３８５】
ステップＳ６００で、トランスポートストリームの多重化ビットレートおよびビデオ符号化のビットレートを設定する。ステップＳ６０１で、ビデオストリームを、所定の一定のビットレート、または、そのビットレート以下で、エンコードする。
【０３８６】
ステップＳ６０２で、トランスポートパケット化するエレメンタリストリームがない場合にヌルパケット（情報としては意味をもたないトランスポートパケット）を発生して多重化し、所定の一定の多重化ビットレートのトランスポートストリームを符号化する。
【０３８７】
ステップＳ６０３で、各トランスポートパケットにアライバルタイムスタンプを付加して、ソースパケット化する。ソースパケットを記録媒体に記録する。
【０３８８】
上記の記録方法でＡＶストリームをClipとして記録した場合、そのClipのtime_controlled_flagは１にセットされる。しかしながら、この方法は、ヌルパケットを使用するため、ビデオ符号化に効率良く符号ビットを使用していないので、図９９の符号化方法よりもビデオの画質が劣る問題がある（このことについては、例えば特願平11-220727の従来の技術の欄に詳しく述べている）。そのため、本技術では上記の図１１０の記録方法を推奨しない。
【０３８９】
次に、ＡＶストリームファイルのある時間分だけ部分的にストリームを消去する方法について説明する。
【０３９０】
図１１１は、オリジナルのＡＶストリームファイルと、そのストリームの部分的な再生範囲のストリームを消去する編集を行った後のＡＶストリームファイルの例を示す。編集前に、Virtual PlayListは、オリジナルAVストリーム上のIN_timeとOUT_timeを指しているとする。この時、Virtual PlayListが使用していないストリーム部分を消去する編集（ミニマイズ編集）をした場合、それはオリジナルAVストリームを図１１１に示す編集後のストリームへ変える。オリジナルAVストリームの先頭からＸ点までのデータと、Ｙ点から最後までのデータが消去される。以下の説明では、このＸ点とＹ点を決める方法の例を説明する。
【０３９１】
図１１２は、AVストリームの内容を解析することをしないで、IN点の前の不要なデータを消去する方法を説明する図である。PlayListはオリジナルAVストリーム上のIN点を指す。また、そのAVストリームのEP_mapを図示する。IN点が指すピクチャをデコードするためには、アドレスISA2から開始するＩピクチャが必要である。
【０３９２】
また、Ｘ点の後で、PAT,PMTおよびPCRパケットが必要である。RSPN_EP_start=ISA1のPTSはpts1であり、RSPN_EP_start=ISA2のPTSはpts2である。pts1とpts2のシステムタイムベースの時間差が100 msec以上ならば、アドレスISA1とISA2の間にはPAT, PMTおよびPCRパケットが存在する（少なくとも、SESF, DVB, ATSC, ISDBの場合はそうである）。
【０３９３】
したがって、Ｘ点はアドレスISA1の前に決められる。そして、X点はアラインドユニットの境界でなければならない。記録装置は、AVストリームの内容を解析することをしないで、X点をEP_mapを使用して次のステップＳで決めることができる。
（Ｓ１）システムタイムベース上でIN timeのPTSに最も近く、かつそれよりも過去の表示時刻のPTSの値を持つSPN_EP_startを見つける。
（Ｓ２）ステップＳ１で見つけたSPN_EP_startのPTSの値よりも少なくとも100 msec過去の表示時刻のPTSの値を持つSPN_EP_startを見つける。
（Ｓ３）Ｘ点は、ステップＳ２で見つけたSPN_EP_startよりも前に決められる。
そして、Ｘ点はアラインドユニットの境界でなければならない。
【０３９４】
この方法は、Ｘ点を決めるためにＡＶストリームのデータを読み出し、その内容を解析することを必要としないので、簡単である。しかし、編集後のAVストリームは、そのPlayListの再生には不要なデータを残してしまう場合がある。もし、Ｘ点を決めるためにＡＶストリームのデータを読み出し、その内容を解析するならば、そのPlayListの再生には不要なデータをより効率良く消去できる。
【０３９５】
図１１３は、AVストリームの内容を解析することをしないで、OUT点の後ろの不要なデータを消去する方法を説明する図である。PlayListはオリジナルAVストリーム上のOUT点を指す。また、そのAVストリームのEP_mapを図示する。
【０３９６】
SPN_EP_start=ISA4から開始するビデオシーケンスは次に示すものであることを前提とする。
I2 B0 B1 P5 …
ここで、I,P,BはそれぞれIピクチャ，PピクチャそしてBピクチャを表す。数字は表示順序を表す。この処理において、記録装置がAVストリームの内容を解析しない場合、記録装置はOUT_timeのPTSが参照するところのピクチャの情報（ピクチャコーディングタイプ，テンポラル・レファレンスなど）がわからない。OUT_timeのPTSはピクチャB0またはB1を参照しているかもしれない（記録装置がAVストリームの内容を解析しない場合、このことはわからない）、この場合、ピクチャB0,B1をデコードするためにはI2が必要である。I2のPTSはOUT timeのPTSよりも大きい（OUT_time < pts4, ここでpts4はI2のPTSである）。I2のPTSはOUT_timeのPTSよりも大きいが、B0, B1のためにI2が必要である。
【０３９７】
したがって、Y点は図に示すアドレスISA5の後ろに決められる。ISA5は、EP_mapの中でISA4の直後にあるSPN_EP_startの値である。Y点はまたアラインドユニットの境界でなければならない。
【０３９８】
記録装置は、AVストリームの内容を解析することをしないで、Y点をEP_mapを使用して次のステップＳで決めることができる。
（Ｓ１）システムタイムベース上でOUT timeのPTSに最も近く、かつそれよりも未来の表示時刻のPTSの値を持つSPN_EP_startを見つける。
（Ｓ２）ステップＳ1で見つけたSPN_EP_startの直後にあるSPN_EP_start を見つける。
（Ｓ３）Y点は、ステップＳ２で見つけたSPN_EP_startよりも後ろに決められる。そして、Y点はアラインドユニットの境界でなければならない。
【０３９９】
この方法は、Y点を決めるためにＡＶストリームのデータを読み出し、その内容を解析することを必要としないので、簡単である。しかし、編集後のAVストリームは、そのPlayListの再生には不要なデータを残してしまう場合がある。もし、Y点を決めるためにＡＶストリームのデータを読み出し、その内容を解析するならば、そのPlayListの再生には不要なデータをより効率良く消去できる。
【０４００】
次に、EP_mapの作成の動作例を図１１４のフローチャートを用いて説明する。この処理は図１の記録再生装置の多重化ストリーム解析部１８で行われる。
【０４０１】
ステップＳ１１でストリーム解析部１８は、記録するAVプログラムのビデオのPIDをセットする。トランスポートストリームの中に複数のビデオが含まれている場合は、それぞれのビデオPIDをセットする。
【０４０２】
ステップＳ１２でストリーム解析部１８は、ビデオのトランスポートパケットを受信する。
【０４０３】
ステップＳ１３でストリーム解析部は、トランスポートパケットのペイロード（パケットヘッダーに続くデータ部）がPESパケットの第一バイト目から開始しているかを調べる（PESパケットは、MPEG2で規定されているパケットであり、エレメンタリストリームをパケット化するものである）。これは、トランスポートパケットヘッダにある"payload_unit_start_indicator"の値を調べることによりわかり、この値が１である場合、トランスポートパケットのペイロードがPESパケットの第一バイト目から開始する。ステップＳ１３でNoの場合は、ステップＳ１２へ戻り、Yesの場合は、ステップＳ14へ進む。
【０４０４】
ステップＳ１４でストリーム解析部は、PESパケットのペイロードが、MPEGビデオのsequence_header_code(32ビット長で"0x000001B3"の符号)の第一バイト目から開始しているかを調べる。ステップＳ１４でNoの場合は、ステップＳ１２へ戻り、Yesの場合は、ステップＳ１５へ進む。
【０４０５】
ステップＳ１５へ進んだ場合、現在のトランスポートパケットをエントリーポイントとする。ステップＳ１６でストリーム解析部は、上記パケットのパケット番号と上記sequence_header_code から開始するIピクチャのPTSとそのエントリーポイントが属するビデオのPIDを取得し、制御部２３へ入力する。制御部２３はEP_mapを作成する。
【０４０６】
ステップＳ１７で、現在のパケットが最後に入力されるトランスポートパケットであるかどうかを判定する。最後のパケットでない場合、ステップＳ１２へ戻る。最後のパケットである場合、処理を終了する。
【０４０７】
上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
【０４０８】
この記録媒体は、図１１５に示すように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク２２１（フロッピディスクを含む）、光ディスク２２２（CD-ROM（Compact Disk-Read Only Memory），DVD（Digital Versatile Disk）を含む）、光磁気ディスク２２３（MD（Mini-Disk）を含む）、若しくは半導体メモリ２２４などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記憶されているROM２０２や記憶部２０８が含まれるハードディスクなどで構成される。
【０４０９】
なお、本明細書において、媒体により提供されるプログラムを記述するステップＳは、記載された順序に従って、時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【０４１０】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【符号の説明】
【０４１１】
１記録再生装置，１１乃至１３端子，１４解析部，１５ AVエンコーダ，１６マルチプレクサ，１７スイッチ，１８多重化ストリーム解析部，１９ソースパケッタイザ，２０ ECC符号化部，２１変調部，２２書き込み部，２３制御部，２４ユーザインタフェース，２６デマルチプレクサ，２７ AVデコーダ，２８読み出し部，２９復調部，３０ ECC復号部，３１ソースパケッタイザ，３２，３３端子

【特許請求の範囲】
【請求項１】
映像データを、所定の時間毎にビットレートを変更する可変ビットレートにより符号化する符号化器と、
記録してからの時間経過に対して符号化される前記映像データのファイルサイズが比例するように、前記所定の時間内では固定ビットレートとし、単位時間あたりの映像符号化データ発生量が所定量に満たない場合、スタッフィングバイトを符号化し映像符号化データに挿入してＶＢＶ制御を行う制御部と
を有する映像データ符号化装置。
【請求項２】
前記所定の時間はＧＯＰである
請求項１に記載の映像データ符号化装置。
【請求項３】
前記制御部は、前記所定の時間区間毎の時間経過に対して符号化データ量が所定の誤差の範囲内で比例するような符号化制御を行う第１の符号化モードと、前記符号化制御を行わない第２の符号化モードのどちらか一方で符号化するように制御する
請求項１に記載の映像データ符号化装置。
【請求項４】
前記制御部は、前記所定の時間区間毎の時間経過に対して前記符号化データ量が前記所定の誤差の範囲内で比例するように符号化する前記第１の符号化モードか否かを示す付加情報を生成する
請求項３に記載の映像データ符号化装置。
【請求項５】
映像データを、所定の時間毎にビットレートを変更する可変ビットレートにより符号化する符号化ステップと、
記録してからの時間経過に対して符号化される前記映像データのファイルサイズが比例するように、前記所定の時間内では固定ビットレートとし、単位時間あたりの映像符号化データ発生量が所定量に満たない場合、スタッフィングバイトを符号化し映像符号化データに挿入してＶＢＶ制御を行う制御ステップと
を含む映像データ符号化方法。
【請求項６】
映像データを、所定の時間毎にビットレートを変更する可変ビットレートにより符号化する符号化ステップと、
記録してからの時間経過に対して符号化される前記映像データのファイルサイズが比例するように、前記所定の時間内では固定ビットレートとし、単位時間あたりの映像符号化データ発生量が所定量に満たない場合、スタッフィングバイトを符号化し映像符号化データに挿入してＶＢＶ制御を行う制御ステップと
をコンピュータに実行させるコンピュータが読み取り可能なプログラムが記録されている記録媒体。
【請求項７】
映像データを、所定の時間毎にビットレートを変更する可変ビットレートにより符号化する符号化ステップと、
記録してからの時間経過に対して符号化される前記映像データのファイルサイズが比例するように、前記所定の時間内では固定ビットレートとし、単位時間あたりの映像符号化データ発生量が所定量に満たない場合、スタッフィングバイトを符号化し映像符号化データに挿入してＶＢＶ制御を行う制御ステップと
を実行させるプログラム。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４】

【図１５】

【図１６】

【図１７】

【図１８】

【図１９】

【図２０】

【図２１】

【図２２】

【図２３】

【図２４】

【図２５】

【図２６】

【図２７】

【図２８】

【図２９】

【図３０】

【図３１】

【図３２】

【図３３】

【図３４】

【図３５】

【図３６】

【図３７】

【図３８】

【図３９】

【図４０】

【図４１】

【図４２】

【図４３】

【図４４】

【図４５】

【図４６】

【図４７】

【図４８】

【図４９】

【図５０】

【図５１】

【図５２】

【図５３】

【図５４】

【図５５】

【図５６】

【図５７】

【図５８】

【図５９】

【図６０】

【図６１】

【図６２】

【図６３】

【図６４】

【図６５】

【図６６】

【図６７】

【図６８】

【図６９】

【図７０】

【図７１】

【図７２】

【図７３】

【図７４】

【図７５】

【図７６】

【図７７】

【図７８】

【図７９】

【図８０】

【図８１】

【図８２】

【図８３】

【図８４】

【図８５】

【図８６】

【図８７】

【図８８】

【図８９】

【図９０】

【図９１】

【図９２】

【図９３】

【図９４】

【図９５】

【図９６】

【図９７】

【図９８】

【図９９】

【図１００】

【図１０１】

【図１０２】

【図１０３】

【図１０４】

【図１０５】

【図１０６】

【図１０７】

【図１０８】

【図１０９】

【図１１０】

【図１１１】

【図１１２】

【図１１３】

【図１１４】

【図１１５】

【公開番号】特開２０１１−１３５５８９（Ｐ２０１１−１３５５８９Ａ）
【公開日】平成２３年７月７日（２０１１．７．７）
【国際特許分類】

【出願番号】特願２０１１−１２１０７（Ｐ２０１１−１２１０７）
【出願日】平成２３年１月２４日（２０１１．１．２４）
【分割の表示】特願２００１−１１２７５６（Ｐ２００１−１１２７５６）の分割
【原出願日】平成１３年４月１１日（２００１．４．１１）
【出願人】（０００００２１８５）ソニー株式会社 (34,172)
【Ｆターム（参考）】

[ Back to top ]

映像データ符号化装置および方法、記録媒体、並びにプログラム

メニュー

スポンサーリンク

次の公報 »

« 前の公報

映像データ符号化装置および方法、記録媒体、並びにプログラム

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク