テキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法
動画データと、動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含み、サブタイトル用のデータは、ビットマップイメージに変換されたピクセルデータを生成するためのテキストデータ、及びピクセルデータがリアルタイムで出力されるように制御するための制御情報を含むことを特徴とする記録媒体と、その記録媒体を利用した再生装置及び再生方法である。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、記録媒体の再生に係り、さらに詳細には、DVD(Digital Versatile Disc)のサブピクチャ方式及びブルーレイディスクのプレゼンテーション方式と互換性を有するテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法に関する。
【背景技術】
【0002】
従来に使用された字幕技術としては、PCで主に使用されるテキスト基盤の字幕技術と、DVDで使用されるサブピクチャグラフィック基盤の字幕技術とがある。
【0003】
まず、従来PCに主に使用されるテキスト基盤の字幕技術の例としては、マイクロソフト社のSAMI(Synchronized Accessible Media Interchange)技術や、リアルネットワーク社のReal−text技術などがある。従来のテキスト基盤の字幕技術は、ビデオストリームデータが記録されたファイルまたはネットワーク上で提供されるビデオストリームデータに対して同期時間情報を基準に字幕を出力させる構造を有する。
【0004】
図1は、従来のPCで主に使用されるテキスト基盤の字幕技術に使用される字幕ファイルの構造を示す図である。図1に示すように、ビデオストリームデータに対してテキスト基盤の字幕ファイルが存在し、字幕ファイルに含まれた同期時間情報、例えば、<sync time 00:00>を基準にビデオストリームデータに対する字幕を出力する。ビデオストリームの連続再生を前提として構成された字幕ファイルの一例を示す。
【0005】
図2は、従来のテキスト基盤の字幕を再生する再生装置の構造を示す図である。図2に示すように、テキスト字幕ファイルは、記録媒体200から読み出されてテキスト字幕データ及びフォントデータバッファ220に保存された後、テキスト字幕デコーダ222を通じてビットマップイメージグラフィックデータに変換され、変換されたグラフィックデータは、グラフィック制御器224の制御を受けて、ビデオデコーダ212でデコーディングされたビデオフレームバッファ214からのビデオフレームデータとオーバーラップされて画面232に出力される。
【0006】
しかし、図面に示すように、従来のテキスト基盤の字幕ファイルの構造は、単に、字幕が画面に表示される同期時間(<sync time=00:00>)と、字幕を画面に出力するときのフォントの模様、サイズ、色の情報のみを考慮しており、テキスト字幕データをデコーディングしてビットマップイメージにした後、ビットマップイメージをバッファ内にどれくらい保管するかを考慮していない。したがって、低速のプロセッサが使用される再生装置では、従来のDVD再生装置から提供するレベルのリアルタイムで字幕を画面に出力できないという問題点があった。
【0007】
一方、従来のDVDで使用されるサブピクチャグラフィック基盤の字幕技術を説明すれば、次の通りである。
【0008】
DVDは、サブタイトルにビットマップイメージを使用する。ビットマップイメージのサブタイトルデータは、無損失符号化されて最大32個までDVDに記録されている。
【0009】
図3は、従来のDVDで使用されるサブピクチャグラフィック基盤の字幕技術に使用される字幕ファイルの構造を説明するために、従来のDVDのデータ構造を示す図である。図3に示すように、DVDは、ディスクをVMG(Video Manager)領域と複数のVTS(Video Title Set)領域とに分け、タイトル情報及びタイトルメニューについての情報をVMG領域に、タイトルについての情報を複数のVTS領域に保存する。VMG領域は、2〜3個のファイルから構成されており、各VTS領域は、3〜12個のファイルから構成されている。VMG領域には、VMGに対する付加情報を保存するVMGI領域、メニューに関する動画情報を保存するVOBS領域、そして、VMGIのバックアップ領域(BUP)がある。これらは、一つのファイルとして存在するが、このうち、VOBS領域の存在は選択的である。
【0010】
VTS領域には再生単位のタイトルについての情報及び動画データであるVOBSが保存されている。一つのVTSには、少なくとも一つのタイトルが記録される。VTS領域は、ビデオタイトルセット情報であるVTSI(Video Title Set Information)、メニュー画面用の動画データであるVOBS(Video Object Set)、ビデオタイトルセットの動画データであるVOBS、及びVTSIのバックアップデータを含む。メニュー画面を表示するためのVOBSの存否は選択的である。各VOBSは、さらに記録単位であるVOBとCELLとに区分される。一つのVOBは、複数のCELLから構成される。本発明で言及される最下位記録単位はCELLである。
【0011】
図4は、図3に示す従来のDVDのデータ構造のうち、動画データであるVOBSの詳細構造を示す図である。図4に示すように、一つのVOBSは、複数のVOBから構成され、一つのVOBは、複数のCELLから構成される。CELLは、さらに複数のVOBUから構成される。VOBUは、DVDで使用する動画符号化方法であるMPEG(Motion Picture Experts Group)により符号化されたデータである。MPEGによると、映像を時空間圧縮符号化するため、何れかの映像を復号化するためには、以前あるいは以後の映像が必要である。したがって、任意の地点で再生を始めるランダムアクセスの機能を支援するために、以前あるいは以後の映像が不要なイントラ符号化を一定の映像ごとに行っている。これを、MPEGではイントラピクチャあるいはIピクチャと呼び、このIピクチャと次のIピクチャとの間をGOP(Group Of Picture)と呼ぶ。通常のGOPは、12〜15個の映像からなる。
【0012】
一方、MPEGは、ビデオデータとオーディオデータとを一つのビットストリームにまとめるためのシステム符号化(ISO/IEC13818−1)も規定している。システム符号化には、一つのプログラムを作って情報記録媒体に保存するために、最適化されたプログラムストリーム(Program Stream:PS)多重化方法と、複数のプログラムを作って伝送するために適したトランスポートストリーム(Transport Stream:TS)多重化方法の2つの多重化方法を規定している。一般的に、DVDでは、そのうちPS符号化方法を採用している。PS符号化方法によれば、ビデオデータあるいはオーディオデータをそれぞれパック(Pack:以下、PCKと言う)という単位に分割した後、これを時分割して多重化する。MPEGで定義したビデオ及びオーディオデータ以外のデータは、プライベートストリームと名付けて、やはりPCKに含めてビデオデータ及びオーディオデータと共に多重化できる。
【0013】
VOBUは、複数のPCKから構成される。複数のPCKのうち第1のPCKは、ナビゲーションパック(NV_PCK)であり、その他にビデオパック(V_PCK)、オーディオパック(A_PCK)、そしてSP_PCKから構成される。ビデオパックに含まれたビデオデータは、複数のGOPからなっている。
【0014】
SP_PCKは、2次元グラフィックデータ及び字幕データのためのものである。すなわち、DVDでは、ビデオ映像にオーバーラップされて表示される字幕データを、2次元グラフィックデータと同じ方法で符号化する。DVDの場合、多国語支援のための別途の符号化方法は採用せず、各字幕データをグラフィックデータに変換した後、一つの符号化方法で処理して記録する。字幕のためのグラフィックデータをサブピクチャと呼ぶ。サブピクチャは、サブピクチャユニット(Subpicture Unit:SPU)から構成され、サブピクチャユニットは、一枚のグラフィックデータに該当する。
【0015】
図5は、図4に示す動画データであるVOBSの構造のうち、サブピクチャパック(SP_PCK)とSPUとの相関関係を表示した図である。図5に示すように、一つのSPUは、サブピクチャユニットヘッダ(SPUH)、ピクセルデータ(PXD)及びサブピクチャディスプレイコントロールシーケンステーブル(SP_DCSQT)から構成される。これらは、順に2048バイトサイズのSP_PCKに分割されて記録される。このとき、SPUの最後のデータが一つのSP_PCKを完全に満たせないときには、最後のSP_PCKは、残りの部分をパッディング処理する。したがって、一つのSPUは、複数のSP_PCKから構成される。
【0016】
SPUHには、全体SPUのサイズと、SPU内でディスプレイ制御情報であるSP_DCSQTが始まる位置とが記録されている。PXDは、サブピクチャを圧縮符号化した符号化データである。サブピクチャを構成するPXDは、4種類の値を有しうる。バックグラウンド、パターンピクセル、エンファシスピクセル−1、エンファシスピクセル−2が含まれ、2ビット値で示し、それぞれ二進数であって、00、01、10、11値を有する。したがって、サブピクチャは、複数のラインから構成された前記4種類のピクセル値を有するデータの集合であり、各ライン別に符号化される。
【0017】
図6は、図5に示すサブピクチャの符号化方法のうち、ラン−レングス符号化方法を説明するための図である。図6に示すように、ラン−レングス符号化方法が示されている。特定のPXDが1〜3個連続されるときには、2ビットで連続されたピクセル数(No_P)を示し、その後に2ビットのPXD値(Pixel Data Value:PD)を記録する。4〜15個連続されるときには、最初の2ビットを0と記録し、4ビットとしてNo_Pを記録し、2ビットとしてPDを記録する。16〜63個連続されるときには、最初の4ビットを0と記録し、6ビットとしてNo_Pを記録し、2ビットとしてPDを記録する。64〜255個連続されるときには、最初の6ビットを0と記録し、8ビットとしてNo_Pを記録し、2ビットとしてPDを記録する。ラインの最後まで同じピクセルが続くときには、最初の14ビットを0と記録し、2ビットとしてPDを記録する。このように、1ラインの符号化が終わったとき、バイト単位が配列されなければ、4ビットの0を記録する。1ラインの符号化データは、1440ビットを超過できない。
【0018】
図7は、図5に示すPXDについての出力制御情報であるSP_DCSQTのデータ構造を示す図である。図7に示すように、SP_DCSQTは、前述のPXDを出力させるための出力制御情報を含んでいる。SP_DCSQTは、複数のサブピクチャディスプレイ制御シーケンス(SP_DCSQ)から構成される。一つのSP_DCSQは、一つの時間に行われる出力制御命令語(SP_DCCMD)の集合であって、開始時間を表すSP_DCSQ_STM、次のSP_DCSQの位置情報を含んでいるSP_NXT_DCSQ_SAと、複数のSP_DCCMDとから構成されている。
【0019】
SP_DCCMDは、前述のPXDがビデオ映像とどのように合わせられて出力されるかについての制御情報であって、PXDの色情報、ビデオデータについての透明度情報(または、コントラスト情報)、出力開始時間及び終了時間についての情報などを含む。
【0020】
図8は、前述のデータ構造によって、サブピクチャが動画データと共に出力された結果を示す図である。図8に示すように、PXD自体は、PXDに無損失符号化されており、出力制御情報としてビデオ映像の領域であるVideo display Area内のサブピクチャが出力される位置であるサブピクチャディスプレイ領域であるSub picture Display Areaについての情報及び出力開始時間、終了時間などについての情報はSP_DCSQTに含まれている。
【0021】
DVDでは、最大32ヶ国語の字幕データのためのサブピクチャデータが動画データと共に多重化されて記録され得る。このように各言語の区別は、MPEGシステム符号化で提供するストリームidと、DVDで定義したサブストリームidとに区分される。したがって、ユーザが一つの言語を選択すれば、当該ストリームidとサブストリームidとを有するSP_PCKのみを対象としてSPUを抽出した後、復号化(デコーディング)して字幕データを抽出し、出力制御情報によって出力を制御する。
【0022】
このような従来のDVDで使用されるビットマップイメージから構成されたサブピクチャグラフィック基盤の字幕技術は、次のような問題点を有する。
【0023】
第一に、ビットマップ基盤の字幕データが動画データと多重化されて記録される場合、動画データの符号化時にサブピクチャデータが占めるビットの発生量をあらかじめ考慮しなければならないという点である。すなわち、字幕データがグラフィックデータに変換されて処理されることにより、各言語別に発生するデータ量が異なり、その量も膨大である。通常、動画符号化は、一回のみ実施した後、その出力に加えて各言語別のサブピクチャデータを再び多重化して、各地域に合うDVDを製作する。しかし、言語によっては、サブピクチャデータ量が膨大であり、動画データとの多重化時に総ビットの発生量が最大の限界を超える場合が発生する。また、サブピクチャデータが動画データの間に多重化されることによって、各VOBUの開始位置も地域別に変わる。DVDでは、VOBUの開始位置が別途に管理されるため、多重化の過程を新たに始める度に、これらの情報も更新されなければならない。
【0024】
第二に、各サブピクチャの内容が分からないため、二つの言語を同時に出力するか、または動画鑑賞ではない字幕データのみを出力して言語の習得に利用する等の別途の目的のために使用できないという点である。
【0025】
前述のように、PCに使用されるテキスト基盤の字幕技術、及びDVDのようなサブピクチャグラフィックを利用する字幕技術は、相異なるように設計されているので、テキスト基盤の字幕データ情報をそのままDVDの再生装置に適用するには、リアルタイムの再生保証やサブピクチャデータバッファの管理上の問題点が発生する。
【発明の開示】
【発明が解決しようとする課題】
【0026】
したがって、前述の問題点を解決するために、本発明の目的は、テキスト基盤の字幕技術、及びDVDで使用されるサブピクチャグラフィック基盤の字幕技術の問題点を補完したテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法を提供するところにある。
【0027】
追加的な観点及び/または利点は、以下の説明で開示されるか、当該説明から自明であり、または発明の実施によって理解される。
【課題を解決するための手段】
【0028】
前記目的は、動画データと、前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含み、前記サブタイトル用のデータは、ビットマップイメージに変換されたピクセルデータを生成するためのテキストデータ、及び前記ピクセルデータがリアルタイムで出力されるように制御するための制御情報を含むことを特徴とする記録媒体により達成される。
【0029】
前記テキストデータは、字幕の内容をオーバーラップするグラフィックとして出力するために、前記ビットマップイメージに変換するための前記ピクセルデータを生成することが望ましい。
【0030】
前記テキストデータは、オーバーラップされるグラフィックとして出力される字幕のスタイルを指定するスタイル情報をさらに含み、前記スタイル情報は、ピクセルデータ領域、背景画面色、テキストの最初の字が始まる原点、行間情報、出力方向、フォントの種類、字の色、文字コードのうち少なくとも一つを含むことが望ましい。
【0031】
前記制御情報は、前記ピクセルデータがバッファメモリで生成及び削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を記録した位置情報を含むことが望ましい。
【0032】
前記サブタイトル用のデータは、前記サブピクチャ情報に含まれたピクセルデータ(PXD)に対応する前記テキストデータと、ディスプレイ制御情報(SP_DCSQT)に対応する前記制御情報と、を含むことが望ましい。前記サブタイトル用のデータは、テキスト形式のデータまたはパケット形式のデータであるであることが望ましい。
【0033】
前記サブタイトル用のデータは、前記プレゼンテーションデータに含まれたプレゼンテーション構成セグメント(Presentation Composition Segment:PCS)に対応する前記テキストデータと、オブジェクト定義セグメント(Object Definition Segment:ODS)に対応する前記制御情報と、を含むことが望ましい。前記サブタイトル用のデータは、テキスト形式のデータまたはパケット形式のデータであることが望ましい。
【0034】
一方、本発明の他の分野によれば、前記目的は、動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する装置において、前記サブタイトル用のデータに含まれたテキストデータをデコーディングして、ビットマップイメージに変換されたピクセルデータを生成し、字幕がリアルタイムで表示されるように制御するために、前記サブタイトル用のデータに含まれた制御情報をデコーディングして解析するテキスト字幕デコーダと、前記制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御するグラフィック制御器と、を備えることを特徴とする再生装置により達成される。
【0035】
前記テキスト字幕デコーダは、前記テキストデータ及び前記制御情報をデコーディングして解析するテキスト字幕パーサと、解析されたテキストデータをオーバーラップするグラフィックとして出力するために、ビットマップイメージに変換するフォントレンダラーと、を備えることが望ましい。
【0036】
前記テキスト字幕パーサは、前記テキストデータにさらに含まれた字幕の出力スタイルを指定するスタイル情報をデコーディングして解析し、前記フォントレンダラーは、前記テキストデータを前記解析されたスタイル情報を反映したビットマップイメージに変換させることが望ましい。
【0037】
前記テキスト字幕パーサは、前記テキストデータを解析して前記フォントレンダラーに伝達することが望ましい。前記テキスト字幕パーサは、前記制御情報のうち前記ピクセルデータがバッファメモリで生成されて削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を指示する位置情報を解析して前記グラフィック制御器に伝達し、前記グラフィック制御器は、前記解析された時間情報及び位置情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することが望ましい。
【0038】
前記サブタイトル用のデータは、ビットマップイメージ再生方式で生成されたDVDのサブピクチャ情報に含まれたピクセルデータに対応する前記テキストデータと、SP_DCSQTに対応する前記制御情報とを含むことが望ましい。前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、前記グラフィック制御器は、前記伝えられた制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することが望ましい。
【0039】
前記サブタイトル用のデータは、ビットマップイメージの再生方式で生成されたブルーレイディスクのプレゼンテーションデータに含まれたPCSに対応する前記テキストデータと、ODSに対応する前記制御情報とを含むことが望ましい。前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、前記グラフィック制御器は、前記伝えられた制御情報を利用して前記PXDがリアルタイムで出力されるように制御することが望ましい。
【0040】
一方、本発明の他の分野によれば、前記目的は、動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する方法において、前記記録媒体からテキストデータ及び制御情報を含む前記サブタイトル用のデータを読み取るステップと、前記テキストデータをデコーディングして字幕内容及び出力スタイル情報を解析し、解析されたスタイル情報に基づいて字幕内容をビットマップイメージからなるピクセルデータに変換するステップと、前記制御情報をデコーディングして、前記ピクセルデータがリアルタイムで出力されるように制御する時間情報、及び字幕が出力される位置を制御するパーシング位置情報を解析するステップと、前記解析された時間情報及び位置情報によって前記変換されたピクセルデータをリアルタイムで出力するステップと、を含むことを特徴とする再生方法により達成される。
【発明の効果】
【0041】
本発明によれば、テキスト基盤の字幕技術と、DVDで使用されるサブピクチャグラフィック基盤の字幕技術の問題点を補完したテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法が提供される。
【0042】
これにより、バッファの管理が便利であり、二つの言語の字幕を同時に出力するか、または字幕のみを別途に出力できると共に、ハードウェアにより制御される字幕のリアルタイム再生を保証できる。
【0043】
また、本発明に係るサブタイトル用のデータは、従来のビットマップイメージ基盤のサブピクチャ方式の字幕データより、符号化されたデータ量が相対的に少ないので、多国言語処理のために再符号化する場合にも、VOBUのアドレス管理が容易である。
【発明を実施するための最良の形態】
【0044】
本発明の具現例によって詳細に参照され、その具現例は、図面によって説明され、同じ部材には同じ符号を付ける。
【0045】
以下、図面を参照して本発明に係る望ましい実施形態を詳細に説明する。
【0046】
図9は、本発明の望ましい実施形態に係るテキスト字幕を処理する再生装置のブロック図である。図9に示すように、本発明の望ましい実施形態に係るテキスト基盤の字幕を処理する再生装置は、バッファ部902、906、ビデオデータ処理部910、テキスト字幕データ処理部920、オーディオデータ処理部930及びブレンダー940を備える。
【0047】
バッファ部902、906は、保存されるデータの種類によって、動画データが保存されるAVデータバッファ902及びテキスト基盤の字幕データが保存されるテキスト字幕データ及びフォントデータバッファ906を備える。光ディスクのような着脱式記録媒体、ローカルストレージ、インターネットなどの多様な記録媒体900から読み取りされたデータは、データの種類によって各バッファに一時保存される。
【0048】
ビデオデータ処理部910は、ビデオデコーダ914及びビデオフレームバッファ916を備える。ビデオデコーダ914は、前述のAVデータバッファ902から圧縮符号化された動画データを伝達されてデコーディングする。デコーディングされたビデオデータは、ビデオフレームバッファ916を経て画面942に出力される。
【0049】
テキスト字幕データ処理部920は、テキスト字幕デコーダ922、サブピクチャデコーダ924及びグラフィック制御器926を備える。本発明に係る再生装置は、従来の多重化されたサブピクチャ方式のサブタイトルを処理できるようにサブピクチャデコーダ924を備えるだけでなく、本発明に係るテキスト基盤の字幕データを処理できるようにテキスト字幕デコーダ922を備える。テキスト字幕デコーダ922は、サブタイトル用のデータのうち、字幕に対するビットマップイメージを生成するためのテキストデータと、字幕のリアルタイム再生を制御するための制御情報とをデコーディングして、ビットマップイメージに変換されたPXDを生成する。デコーディングされたデータのうち制御情報は、グラフィック制御器926に伝えられて生成されたPXDがリアルタイムで出力されるように制御する。
【0050】
オーディオデータ処理部930は、オーディオデコーダ930を備え、オーディオデータをデコーディングしてスピーカー932を通じて出力する。
【0051】
ブレンダー940は、動画データがデコーディングされたビデオデータと、字幕データがレンダリングされたビットマップイメージグラフィックデータとをオーバーラップして画面942に出力する。
【0052】
図10は、図9に示すテキスト基盤の字幕を処理するための再生装置の詳細ブロック図である。図10には、図9に説明したテキスト字幕データ処理部920の構造が詳細に示されている。
【0053】
本発明に係る再生装置は、バッファ部1010ないし1040、ビデオデータ処理部910、テキスト字幕データ処理部920及びブレンダー1039を備える。図9で前述のオーディオ処理部についての説明は省略する。
【0054】
バッファ部1010ないし1040は、ビデオデータバッファ1010、サブピクチャデータバッファ1020、テキスト字幕データバッファ1030及びフォントデータバッファ1040を備える。光ディスクのような着脱式記録媒体、ローカルストレージ、インターネットなどの記録媒体1000から動画データ及びサブタイトル用のデータを読み取って、各データの種類によって各バッファに一時保存する。動画データ(AVデータ)は、逆多重化されて、ビデオデータは、ビデオデータバッファ1010に、サブタイトル用のサブピクチャデータは、サブピクチャデータバッファ1020に、オーディオデータは、オーディオデータバッファ(図示せず)に一時保存される。一方、テキスト基盤の字幕のためのサブタイトル用のデータとして、PXDを生成するためのテキストデータ及び字幕がリアルタイムで出力されるように制御するための制御情報は、テキスト字幕データバッファ1030に、サブタイトル用のフォントデータは、フォントデータバッファ1040に一時保存される。
【0055】
ビデオデータ処理部910は、ビデオデコーダ1012及びビデオフレームバッファ1014を備え、図9で説明した通りである。
【0056】
テキスト字幕データ処理部920は、テキスト字幕パーサ1031、フォントレンダラー1034、サブピクチャデコーダ1032、グラフィック制御器1038、各種バッファ1032,1035,1036及び色参照テーブル(Color Lookup Table:CLUT)1037を備える。
【0057】
テキスト字幕パーサ1031は、サブタイトル用のデータに含まれるテキストデータ及び制御情報をデコーディングして解析する。また、テキストデータにさらに含まれる字幕の出力スタイルを指定するスタイル情報をデコーディングして解析する。解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝えられる。
【0058】
フォントレンダラー1034は、解析されたテキストデータをオーバーラップするグラフィックとして出力するために、ビットマップイメージを生成する。このとき、解析されたスタイル情報を反映してビットマップイメージを生成し、生成されたグラフィックデータを経路(3)を通じてPXDバッファ1035に一時保存する。テキストデータ及びスタイル情報のデータ構造については後述する。
【0059】
サブピクチャデコーダ1033は、動画データから逆多重化されたサブタイトル用のサブピクチャデータをデコーディングする。これは、従来のDVDサブピクチャ方式の字幕データと互換のために提供される。本発明の他の実施形態によって、本発明に係るテキスト基盤のサブタイトル用のデータがパケット化されて動画データに含まれた場合、テキストデータ及び制御情報を逆多重化して経路(9)を通じてテキスト字幕パーサ1031に伝達する。
【0060】
グラフィック制御器1038は、制御情報を利用して字幕がリアルタイムで出力されるように制御する。前述のマイクロソフト社のSAMIのような従来のテキスト基盤の字幕技術の場合、字幕が出力される時間を指定するだけであり、もし、低速のプロセッサが使用されるハードウェアで再生されれば、動画データ及び字幕を同期化して出力するリアルタイム再生が保証されないこともある。しかし、本発明に係る再生装置の場合、前述の制御情報のうちビットマップイメージからなるPXDがバッファメモリで生成及び削除される時間を記録した時間情報、及び前記PXDが出力される位置を記録した位置情報を解析して、PXDバッファの出力を制御することによって、動画データ及び字幕が同期化されてリアルタイムで再生され得る。
【0061】
各種のバッファ1032、1035、1036には、グラフィック制御情報バッファ1032、PXDバッファ1035及びサブピクチャフレームバッファ1036が含まれる。グラフィック制御情報バッファ1032は、テキスト字幕パーサ1031で解析された制御情報を一時保存し、PXDバッファ1035は、ビットマップイメージに変換されたグラフィックデータを一時保存し、サブピクチャフレームバッファ1036は、グラフィック制御器1038から制御情報に含まれた時間情報によってPXDの出力を制御して、字幕用のサブピクチャを出力するためにPXDを一時保存する。
【0062】
CLUT 1037は、制御情報内に含まれたパレット情報を利用して出力される字幕の色を制御する。
【0063】
ブレンダー1039は、ビデオデータ処理部910から出力される映像と、テキスト字幕データ処理部920から出力される字幕のグラフィックイメージとをオーバーラップして画面1040に出力する。
【0064】
前述の本発明に係る再生装置の各ブロックの動作を整理すれば、次の通りである。
【0065】
まず、記録媒体1000から読み取られた動画データは逆多重化され、ビデオデータは、ビデオデータバッファ1010を経てビデオデコーダ1012によりデコーディングされる。デコーディングされたビデオデータは、ビデオフレームバッファ1014を通じて出力された後、テキスト字幕処理部920から出力される字幕のグラフィックデータとオーバーラップされて出力される。動画データのうちオーディオデータは、オーディオデータ処理器930のオーディオデコーダを通じてデコーディングされて、スピーカー932を通じて出力される。
【0066】
一方、記録媒体1000から読み取りされた本発明に係るテキスト基盤のサブタイトル用のデータは、テキスト字幕データバッファ1030を経てテキスト字幕パーサ1031でテキストデータと制御情報とに解析される。解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝達される。ここで、字幕データがビットマップイメージから構成されたグラフィックデータに変換され、グラフィックデータはPXDバッファ1035に保存される。
【0067】
一方、字幕のリアルタイム出力のための時間情報と字幕の出力位置情報とに解析された制御情報は、経路(1)を通じてグラフィック制御情報バッファ1032を経て経路(7)を通じてグラフィック制御器1038に伝えられる。グラフィック制御器1038は、制御情報を利用してPXDバッファ1035に保存されたグラフィックデータの出力速度を調整し、グラフィックデータをサブピクチャフレームバッファ1036に出力し、CLUT 1037を参照して色を反映する。グラフィック制御器1038は、ブレンダー1039を通じてグラフィックデータを動画ビデオデータとオーバーラップして画面に出力する。
【0068】
一方、本発明の他の実施形態として、テキスト基盤のサブタイトル用のデータがパケット化されて動画データに多重化された場合には、サブタイトル用のデータは、サブピクチャデコーダ1033を通じてデコーディングされて、経路(9)を通じてテキスト字幕パーサ1031に伝えられる。その後、サブタイトル用のデータが処理される過程は、前述の通りである。
【0069】
本発明の一実施形態として、サブタイトル用のデータが、ビットマップデータ再生方式で生成されたDVDのサブピクチャ情報のうち、PXDに対応する前記テキストデータと、SP_DCSQTに対応する前記制御情報とを含む場合、サブピクチャデコーダ1033によりデコーディングされたサブタイトル用のデータは、テキスト字幕パーサ1031に伝えられ、ここでテキストデータは、フォントレンダラー1034に伝えられ、制御情報は、グラフィック制御器1038に伝えられ、グラフィック制御器から伝えられた制御情報を利用して、字幕がリアルタイムで出力されるように制御される。
【0070】
本発明の他の実施形態として、サブタイトル用のデータが、ビットマップデータ再生方式で生成されたブルーレイディスクのプレゼンテーションデータのうち、PCSに対応する前記テキストデータと、ODSに対応する前記制御情報を含む場合、サブピクチャデコーダ1033によりデコーディングされたサブタイトル用のデータは、テキスト字幕パーサ1031に伝えられて、ここでテキストデータは、フォントレンダラーに伝えられ、制御情報は、グラフィック制御器1038に伝えられ、グラフィック制御器1038から伝えられた制御情報を利用して、字幕がリアルタイムで出力されるように制御される。
【0071】
以下では、本発明に係るテキスト基盤のサブタイトル用のデータが記録された記録媒体について説明する。
【0072】
本発明に係る記録媒体には、動画データ及び動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータが含まれる。サブタイトル用のデータには、PXDを生成するためのテキストデータ、及び字幕がリアルタイムで出力されるように制御するための制御情報が含まれる。
【0073】
テキストデータは、字幕内容をオーバーラップするグラフィックとして出力するために、ビットマップイメージに変換するためのテキストデータであって、字幕のスタイルを指定するスタイル情報をさらに含み、スタイル情報は、PXD領域、背景画面色、テキストの最初の字が始まる原点、行間情報、出力方向、フォントの種類、字の色、文字コードのうち少なくとも一つを含むことが望ましい。
【0074】
一方、制御情報には、テキストデータがレンダリングされたPXDがバッファメモリで生成及び削除される時間を記録した時間情報、及びPXDが出力される位置を記録した位置情報が含まれる。
【0075】
本発明に係る記録媒体の一実施形態として、サブタイトル用のデータは、ビットマップデータの再生方式で生成されたDVDのサブピクチャ情報と類似した所定の内容が含まれるように、サブピクチャ情報のうちPXDに対応するテキストデータと、SP_DCSQTに対応する制御情報と、を含んでもよい。サブタイトル用のデータは、テキスト形式のデータで具現されてもよく、パケット形式のデータで具現されてもよい。
【0076】
また、本発明に係る記録媒体の他の実施形態として、サブタイトル用のデータは、ビットマップデータの再生方式で生成されたブルーレイディスクのプレゼンテーションデータと類似した所定の内容が含まれるように、プレゼンテーションデータのうちPCSに対応するテキストデータと、ODSに対応する制御情報と、を含んでもよい。サブタイトル用のデータは、テキスト形式のデータで具現されてもよく、パケット形式のデータで具現されてもよい。
【0077】
図11Aは、本発明の望ましい実施形態に係るPXDを生成するためのテキストデータの一例を示す図である。
【0078】
図11Aに示すように、テキストデータには、ビットマップイメージであるPXDに生成されるために必要な情報である字幕内容及びスタイル情報が含まれたテキスト情報が記録される。
【0079】
すなわち、テキスト情報は、出力される字幕の内容を含んだテキスト情報と、字幕の出力スタイルを指定するスタイル情報とが含まれる。スタイル情報としては、複数行のテキストを出力する場合、行間に関する情報が含まれ、テキストの出力方向(左→右、右→左、上→下)を指示する情報が含まれ得る。また、テキストのサイズ、太さ、傾斜、下線のようなフォントの種類についての情報が含まれ、テキストを次の行から新たに描き示す改行情報が含まれ、テキストの色に関する情報が含まれ得る。また、エンコーディングのための文字コード情報が含まれ得るが、例えば、使用される文字コードが8859−1であるか、またはUTF−16であるか等についての情報が含まれる。
【0080】
以上のテキスト情報は、本発明に係る一例であり、DVDまたはブルーレイディスク等の適用される媒体の特性に合わせて変形されて具現され得る。
【0081】
図11Bは、本発明の望ましい実施形態に字幕のリアルタイム表示を制御するためのグラフィック制御情報の一例である。図11Bに示すように、ビットマップイメージに変換されたPXDの出力を制御するための制御情報が図示されている。
【0082】
すなわち、テキストデータがビットマップイメージに変換されて描かれるPXD領域のサイズを示すために、PXD領域の幅情報とPXD領域の高さ情報とが記録され得る。また、PXDの背景画面の色に関する情報が含まれ、PXDのPXDバッファメモリに生成及び削除される時間を記録した時間情報が記録され、テキストの字の1行が始まる位置を指示する原点情報が記録され得る。前述のデータは、制御情報としてサブタイトル用のデータに含まれて、字幕がリアルタイムで出力されるように制御する役割を行う。
【0083】
また、制御データは、ブルーレイディスクに適用される場合、複数のPXDを一つの画面に集めて出力するために、複数のPXD領域を一つのページに集める構成情報が含まれてもよく、ページに使用される字幕テキストの背景色及び前景色に使用するCLUT情報が含まれ得る。PXD情報のうち指定された領域が画面に出力されるので、領域指定情報((Xs,Ys)及びPXD領域の幅、高さ情報または開始点(Xs,Ys)及び終了点(Xe,Ye)情報))が含まれ得る。また、図8で説明したSub Picture Display Areaの第1の開始点に対応するPXD領域内の開始点情報が含まれてもよい。一方、バッファに一時保存されたPXDが出力される時間及びバッファで削除される時間を指示する時間情報が含まれることが望ましい。
【0084】
以上の制御情報は、本発明に係る一例であり、DVDまたはブルーレイディスク等の適用される媒体の特性に合わせて変形されて具現され得る。
【0085】
図12は、DVDのサブピクチャデータ構造を利用した本発明に係る字幕データの一実施形態である。図12に示すように、本発明に係るサブタイトル用のデータは、DVDのサブピクチャデータストリームの構成方式であるMPEGのパケット形式で具現され得る。すなわち、PES(Packetized Element Stream)構造にヘッダ情報であるSPUHの他に、PXDであるPXD領域に本発明に係るテキスト字幕データを、出力制御情報であるSP_DCSQT領域に本発明に係る制御情報を記録させ得る。もちろん、本発明に係るサブタイトル用のデータは、パケット形式のバイナリデータで具現されてもよいが、前述のサブピクチャデータストリームと類似した内容を含むテキスト形式で具現できる。テキストまたはバイナリ形式のうち何れかのデータでも、図10で説明したテキスト字幕パーサ1031で解析され、解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝えられ、制御情報は、経路(1)を通じてグラフィック制御器1038に伝えられ、制御情報に基づいてビットマップイメージに変換された字幕をリアルタイムで出力できる。
【0086】
図13は、ブルーレイディスクのプレゼンテーションデータ構造を利用した本発明に係る字幕データの一実施形態である。図13に示すように、本発明に係るサブタイトル用のデータは、ブルーレイディスクのプレゼンテーションデータストリームの構成方式であるMPEGのパケット形式で具現され得る。すなわち、PES構造にPCS領域に対応するように制御情報を記録し、ODS領域に対応するようにテキスト字幕データを記録できる。その他に、パレット定義セグメント(Pallette DefinitionSegment:PDSと略称する)及び終了セグメント(End Segment:ENDと略称する)がさらに含まれ得る。もちろん、本発明に係るサブタイトル用のデータは、パケット形式のバイナリデータで具現されてもよいが、前述のプレゼンテーションデータストリームと類似した内容を含むテキスト形式で具現できる。
【0087】
テキストまたはバイナリ形式のうち何れのデータでも、図10で説明したテキスト字幕パーサ1031で解析され、解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝えられ、制御情報は、経路(1)を通じてグラフィック制御器1038に伝えられ、制御情報に基づいてビットマップイメージに変換された字幕をリアルタイムで出力できる。
【0088】
図14及び図15は、テキスト形式で具現された本発明に係るサブタイトル用のデータの一実施形態を表す。特に、図14は、DVDに適用可能なテキスト形式のサブタイトル用のデータの一実施形態であって、テキストデータ及び制御情報が含まれる。また、図15は、ブルーレイディスクに適用可能なテキスト形式のサブタイトル用のデータの一実施形態であって、テキストデータ及び制御情報が含まれ、色相情報がさらに含まれ得る。ただし、図14及び図15は、本発明の望ましい実施形態に係る記録媒体のデータ構造の一例であり、多様な形態に変形されて具現され得る。
【0089】
前述の本発明に係るサブタイトル用のデータのスタイルを指定するために、次のような文字列を使用できる。
【0090】
\c[n]\:テキストに使用される色を指定する。基本値は、0である。
【0091】
\b[n]\:テキストの背景に使用される背景色を指定する。文字列の一番に使用しなければならず、基本値は、0である。
【0092】
\f[n]\:テキストに使用されるフォントの種類を指定する。基本値は、0である。
【0093】
\s[n]\:テキストに使用されるフォントのサイズを指定する。単位は、ピクセルであり、基本値は、0である。
【0094】
\e[n]\:テキストのエンコーディングに使用される文字コードを指定する。エンコーディング方式が変更され得る。0であれば、ISO−8859−1であり、1であれば、UTF−16が使用され、基本値は、0である。
【0095】
\o[n]\:PXD領域のうちテキストが描かれる原点の位置を指定する。基本値は、0である。
【0096】
\l[n]\:テキスト文字列が改行をする場合、行間を指定する。nの単位は、ピクセルであり、基本値は、0である。
【0097】
\d[n]\:テキストの出力方向を指定する。nが0であれば、左から右へ水平方向に出力され、1であれば、右から左へ水平方向に出力される。2であれば、垂直方向に出力され、改行があれば、右から左へ改行される。3であれば、垂直方向に出力され、改行があれば、左から右へ改行される。基本値は、0である。
【0098】
\b[n]\:テキストの字を太字または標準に選択する。太字は、1であり、標準は、0であり、基本値は、0である。
【0099】
\i[n]\:テキストの字を斜体または標準に選択する。斜体は、1であり、標準は、0であり、基本値は、0である。
【0100】
\u[n]\:テキストの字に下線の表示如何を指定する。下線は、1であり、標準は、0であり、基本値は、0である。
【0101】
\n\:改行を行う。基本値は、0である。
【0102】
\\:\文字を出力する。基本値は、0である。
【0103】
図16は、本発明の望ましい実施形態に係る字幕データの出力結果を示す図である。図16に示すように、例えば、スタイル情報として次の文字列が使用された場合、画面に出力される結果が示されている。すなわち、\o2000\\b0\\c1\\f0\\s20\\l20\Hello,\b1\Subtitle\b0\\i1\\n\Worldというスタイル情報が使用された場合、これを解析して生成されたPXDの出力結果である。テキストデータで使用するフォントに関する情報は、サブタイトル用のデータと別途に記録されたフォント情報をディスクまたはネットワークから受信し、当該フォント情報をフォントバッファメモリに保存して使用できる。
【0104】
以下では、前述の再生装置及び記録媒体の構成を基にテキスト字幕を処理する方法を説明する。
【0105】
図17は、本発明の望ましい実施形態に係るテキスト字幕を処理する方法を示すフローチャートである。図17に示すように、動画データ及び動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体を再生するために、まず、記録媒体からテキストデータ及び制御情報を含むサブタイトル用のデータを読み取る(ステップ1502)。読み取りされたテキストデータをデコーディングして、字幕の内容及び出力スタイルの情報を解析し、解析されたスタイル情報に基づいて字幕内容をPXDに変換する(ステップ1504)。読み取られた制御情報をデコーディングして、字幕がリアルタイムで出力されるように制御する時間情報及び位置情報を解析し(ステップ1506)、解析された時間情報及び位置情報によって変換されたPXDをリアルタイムで出力する(ステップ1508)。
【0106】
また、本発明は、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られ得るデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM(Read Only Memory)、RAM(Random Access Memory)、CD−ROM、磁気テープ、ハードディスク、フロッピー(登録商標)ディスク、フラッシュメモリ、光データ保存装置などがあり、また、キャリアウェーブ(例えば、インターネットを介した伝送)の形態で具現されるものも含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードとして保存され、かつ実行され得る。
【0107】
本発明は、図面に示された実施形態を参考に説明されたが、これは例示的なものに過ぎず、当業者ならば、これから多様な変形及び均等な他の実施形態が可能であるという点を理解できるであろう。したがって、本発明の真の技術的な保護範囲は、特許請求の範囲の技術的な思想によって決まらねばならない。
【産業上の利用可能性】
【0108】
本発明は、記録媒体の再生、さらに詳細には、DVD(Digital Versatile Disc)のサブピクチャ方式及びブルーレイディスクのプレゼンテーション方式と互換性を有するテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法に適用可能である。
【図面の簡単な説明】
【0109】
【図1】従来のPCで使用されるテキスト基盤の字幕技術に使用される字幕ファイルの構造を示す図である。
【図2】従来のテキスト基盤の字幕を再生する再生装置の構造を示す図である。
【図3】従来のDVDで使用されるサブピクチャグラフィック基盤の字幕技術に使用される字幕ファイルの構造を説明するために、従来のDVDのデータ構造を示す図である。
【図4】図3に示す従来のDVDのデータ構造のうち動画データであるVOBSの詳細構造を示す図である。
【図5】図4に示す動画データであるVOBSの構造のうち、SP_PCKとSPUとの相関関係を表示した図である。
【図6】図5に示すサブピクチャの符号化方法のうち、ラン−レングス符号化方法を説明するための図である。
【図7】図5に示すPXDに対する出力制御情報であるSP_DCSQTのデータ構造を示す図である。
【図8】従来のDVDのデータ構造によって、サブピクチャが動画データと共に出力された結果を示す図である。
【図9】本発明の望ましい実施形態に係るテキスト字幕を処理する再生装置のブロック図である。
【図10】図9に示す再生装置の詳細ブロック図である。
【図11A】本発明の望ましい実施形態に係るPXDを生成するためのテキストデータの一例を示す図である。
【図11B】本発明の望ましい実施形態に係る字幕のリアルタイムの表示を制御するためのグラフィック制御情報の一例を示す図である。
【図12】DVDのサブピクチャデータの構造を利用した本発明に係るサブタイトル用のデータの一実施形態を示す図である。
【図13】ブルーレイディスクのプレゼンテーションデータの構造を利用した本発明に係るサブタイトル用のデータの一実施形態を示す図である。
【図14】DVDに適用可能なテキスト形式のサブタイトル用のデータの一実施形態を示す図である。
【図15】ブルーレイディスクに適用可能なテキスト形式のサブタイトル用のデータの一実施形態を示す図である。
【図16】本発明の望ましい実施形態に係る字幕データの出力結果を示す図である。
【図17】本発明の望ましい実施形態に係るテキスト字幕を処理する方法を示すフローチャートである。
【技術分野】
【0001】
本発明は、記録媒体の再生に係り、さらに詳細には、DVD(Digital Versatile Disc)のサブピクチャ方式及びブルーレイディスクのプレゼンテーション方式と互換性を有するテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法に関する。
【背景技術】
【0002】
従来に使用された字幕技術としては、PCで主に使用されるテキスト基盤の字幕技術と、DVDで使用されるサブピクチャグラフィック基盤の字幕技術とがある。
【0003】
まず、従来PCに主に使用されるテキスト基盤の字幕技術の例としては、マイクロソフト社のSAMI(Synchronized Accessible Media Interchange)技術や、リアルネットワーク社のReal−text技術などがある。従来のテキスト基盤の字幕技術は、ビデオストリームデータが記録されたファイルまたはネットワーク上で提供されるビデオストリームデータに対して同期時間情報を基準に字幕を出力させる構造を有する。
【0004】
図1は、従来のPCで主に使用されるテキスト基盤の字幕技術に使用される字幕ファイルの構造を示す図である。図1に示すように、ビデオストリームデータに対してテキスト基盤の字幕ファイルが存在し、字幕ファイルに含まれた同期時間情報、例えば、<sync time 00:00>を基準にビデオストリームデータに対する字幕を出力する。ビデオストリームの連続再生を前提として構成された字幕ファイルの一例を示す。
【0005】
図2は、従来のテキスト基盤の字幕を再生する再生装置の構造を示す図である。図2に示すように、テキスト字幕ファイルは、記録媒体200から読み出されてテキスト字幕データ及びフォントデータバッファ220に保存された後、テキスト字幕デコーダ222を通じてビットマップイメージグラフィックデータに変換され、変換されたグラフィックデータは、グラフィック制御器224の制御を受けて、ビデオデコーダ212でデコーディングされたビデオフレームバッファ214からのビデオフレームデータとオーバーラップされて画面232に出力される。
【0006】
しかし、図面に示すように、従来のテキスト基盤の字幕ファイルの構造は、単に、字幕が画面に表示される同期時間(<sync time=00:00>)と、字幕を画面に出力するときのフォントの模様、サイズ、色の情報のみを考慮しており、テキスト字幕データをデコーディングしてビットマップイメージにした後、ビットマップイメージをバッファ内にどれくらい保管するかを考慮していない。したがって、低速のプロセッサが使用される再生装置では、従来のDVD再生装置から提供するレベルのリアルタイムで字幕を画面に出力できないという問題点があった。
【0007】
一方、従来のDVDで使用されるサブピクチャグラフィック基盤の字幕技術を説明すれば、次の通りである。
【0008】
DVDは、サブタイトルにビットマップイメージを使用する。ビットマップイメージのサブタイトルデータは、無損失符号化されて最大32個までDVDに記録されている。
【0009】
図3は、従来のDVDで使用されるサブピクチャグラフィック基盤の字幕技術に使用される字幕ファイルの構造を説明するために、従来のDVDのデータ構造を示す図である。図3に示すように、DVDは、ディスクをVMG(Video Manager)領域と複数のVTS(Video Title Set)領域とに分け、タイトル情報及びタイトルメニューについての情報をVMG領域に、タイトルについての情報を複数のVTS領域に保存する。VMG領域は、2〜3個のファイルから構成されており、各VTS領域は、3〜12個のファイルから構成されている。VMG領域には、VMGに対する付加情報を保存するVMGI領域、メニューに関する動画情報を保存するVOBS領域、そして、VMGIのバックアップ領域(BUP)がある。これらは、一つのファイルとして存在するが、このうち、VOBS領域の存在は選択的である。
【0010】
VTS領域には再生単位のタイトルについての情報及び動画データであるVOBSが保存されている。一つのVTSには、少なくとも一つのタイトルが記録される。VTS領域は、ビデオタイトルセット情報であるVTSI(Video Title Set Information)、メニュー画面用の動画データであるVOBS(Video Object Set)、ビデオタイトルセットの動画データであるVOBS、及びVTSIのバックアップデータを含む。メニュー画面を表示するためのVOBSの存否は選択的である。各VOBSは、さらに記録単位であるVOBとCELLとに区分される。一つのVOBは、複数のCELLから構成される。本発明で言及される最下位記録単位はCELLである。
【0011】
図4は、図3に示す従来のDVDのデータ構造のうち、動画データであるVOBSの詳細構造を示す図である。図4に示すように、一つのVOBSは、複数のVOBから構成され、一つのVOBは、複数のCELLから構成される。CELLは、さらに複数のVOBUから構成される。VOBUは、DVDで使用する動画符号化方法であるMPEG(Motion Picture Experts Group)により符号化されたデータである。MPEGによると、映像を時空間圧縮符号化するため、何れかの映像を復号化するためには、以前あるいは以後の映像が必要である。したがって、任意の地点で再生を始めるランダムアクセスの機能を支援するために、以前あるいは以後の映像が不要なイントラ符号化を一定の映像ごとに行っている。これを、MPEGではイントラピクチャあるいはIピクチャと呼び、このIピクチャと次のIピクチャとの間をGOP(Group Of Picture)と呼ぶ。通常のGOPは、12〜15個の映像からなる。
【0012】
一方、MPEGは、ビデオデータとオーディオデータとを一つのビットストリームにまとめるためのシステム符号化(ISO/IEC13818−1)も規定している。システム符号化には、一つのプログラムを作って情報記録媒体に保存するために、最適化されたプログラムストリーム(Program Stream:PS)多重化方法と、複数のプログラムを作って伝送するために適したトランスポートストリーム(Transport Stream:TS)多重化方法の2つの多重化方法を規定している。一般的に、DVDでは、そのうちPS符号化方法を採用している。PS符号化方法によれば、ビデオデータあるいはオーディオデータをそれぞれパック(Pack:以下、PCKと言う)という単位に分割した後、これを時分割して多重化する。MPEGで定義したビデオ及びオーディオデータ以外のデータは、プライベートストリームと名付けて、やはりPCKに含めてビデオデータ及びオーディオデータと共に多重化できる。
【0013】
VOBUは、複数のPCKから構成される。複数のPCKのうち第1のPCKは、ナビゲーションパック(NV_PCK)であり、その他にビデオパック(V_PCK)、オーディオパック(A_PCK)、そしてSP_PCKから構成される。ビデオパックに含まれたビデオデータは、複数のGOPからなっている。
【0014】
SP_PCKは、2次元グラフィックデータ及び字幕データのためのものである。すなわち、DVDでは、ビデオ映像にオーバーラップされて表示される字幕データを、2次元グラフィックデータと同じ方法で符号化する。DVDの場合、多国語支援のための別途の符号化方法は採用せず、各字幕データをグラフィックデータに変換した後、一つの符号化方法で処理して記録する。字幕のためのグラフィックデータをサブピクチャと呼ぶ。サブピクチャは、サブピクチャユニット(Subpicture Unit:SPU)から構成され、サブピクチャユニットは、一枚のグラフィックデータに該当する。
【0015】
図5は、図4に示す動画データであるVOBSの構造のうち、サブピクチャパック(SP_PCK)とSPUとの相関関係を表示した図である。図5に示すように、一つのSPUは、サブピクチャユニットヘッダ(SPUH)、ピクセルデータ(PXD)及びサブピクチャディスプレイコントロールシーケンステーブル(SP_DCSQT)から構成される。これらは、順に2048バイトサイズのSP_PCKに分割されて記録される。このとき、SPUの最後のデータが一つのSP_PCKを完全に満たせないときには、最後のSP_PCKは、残りの部分をパッディング処理する。したがって、一つのSPUは、複数のSP_PCKから構成される。
【0016】
SPUHには、全体SPUのサイズと、SPU内でディスプレイ制御情報であるSP_DCSQTが始まる位置とが記録されている。PXDは、サブピクチャを圧縮符号化した符号化データである。サブピクチャを構成するPXDは、4種類の値を有しうる。バックグラウンド、パターンピクセル、エンファシスピクセル−1、エンファシスピクセル−2が含まれ、2ビット値で示し、それぞれ二進数であって、00、01、10、11値を有する。したがって、サブピクチャは、複数のラインから構成された前記4種類のピクセル値を有するデータの集合であり、各ライン別に符号化される。
【0017】
図6は、図5に示すサブピクチャの符号化方法のうち、ラン−レングス符号化方法を説明するための図である。図6に示すように、ラン−レングス符号化方法が示されている。特定のPXDが1〜3個連続されるときには、2ビットで連続されたピクセル数(No_P)を示し、その後に2ビットのPXD値(Pixel Data Value:PD)を記録する。4〜15個連続されるときには、最初の2ビットを0と記録し、4ビットとしてNo_Pを記録し、2ビットとしてPDを記録する。16〜63個連続されるときには、最初の4ビットを0と記録し、6ビットとしてNo_Pを記録し、2ビットとしてPDを記録する。64〜255個連続されるときには、最初の6ビットを0と記録し、8ビットとしてNo_Pを記録し、2ビットとしてPDを記録する。ラインの最後まで同じピクセルが続くときには、最初の14ビットを0と記録し、2ビットとしてPDを記録する。このように、1ラインの符号化が終わったとき、バイト単位が配列されなければ、4ビットの0を記録する。1ラインの符号化データは、1440ビットを超過できない。
【0018】
図7は、図5に示すPXDについての出力制御情報であるSP_DCSQTのデータ構造を示す図である。図7に示すように、SP_DCSQTは、前述のPXDを出力させるための出力制御情報を含んでいる。SP_DCSQTは、複数のサブピクチャディスプレイ制御シーケンス(SP_DCSQ)から構成される。一つのSP_DCSQは、一つの時間に行われる出力制御命令語(SP_DCCMD)の集合であって、開始時間を表すSP_DCSQ_STM、次のSP_DCSQの位置情報を含んでいるSP_NXT_DCSQ_SAと、複数のSP_DCCMDとから構成されている。
【0019】
SP_DCCMDは、前述のPXDがビデオ映像とどのように合わせられて出力されるかについての制御情報であって、PXDの色情報、ビデオデータについての透明度情報(または、コントラスト情報)、出力開始時間及び終了時間についての情報などを含む。
【0020】
図8は、前述のデータ構造によって、サブピクチャが動画データと共に出力された結果を示す図である。図8に示すように、PXD自体は、PXDに無損失符号化されており、出力制御情報としてビデオ映像の領域であるVideo display Area内のサブピクチャが出力される位置であるサブピクチャディスプレイ領域であるSub picture Display Areaについての情報及び出力開始時間、終了時間などについての情報はSP_DCSQTに含まれている。
【0021】
DVDでは、最大32ヶ国語の字幕データのためのサブピクチャデータが動画データと共に多重化されて記録され得る。このように各言語の区別は、MPEGシステム符号化で提供するストリームidと、DVDで定義したサブストリームidとに区分される。したがって、ユーザが一つの言語を選択すれば、当該ストリームidとサブストリームidとを有するSP_PCKのみを対象としてSPUを抽出した後、復号化(デコーディング)して字幕データを抽出し、出力制御情報によって出力を制御する。
【0022】
このような従来のDVDで使用されるビットマップイメージから構成されたサブピクチャグラフィック基盤の字幕技術は、次のような問題点を有する。
【0023】
第一に、ビットマップ基盤の字幕データが動画データと多重化されて記録される場合、動画データの符号化時にサブピクチャデータが占めるビットの発生量をあらかじめ考慮しなければならないという点である。すなわち、字幕データがグラフィックデータに変換されて処理されることにより、各言語別に発生するデータ量が異なり、その量も膨大である。通常、動画符号化は、一回のみ実施した後、その出力に加えて各言語別のサブピクチャデータを再び多重化して、各地域に合うDVDを製作する。しかし、言語によっては、サブピクチャデータ量が膨大であり、動画データとの多重化時に総ビットの発生量が最大の限界を超える場合が発生する。また、サブピクチャデータが動画データの間に多重化されることによって、各VOBUの開始位置も地域別に変わる。DVDでは、VOBUの開始位置が別途に管理されるため、多重化の過程を新たに始める度に、これらの情報も更新されなければならない。
【0024】
第二に、各サブピクチャの内容が分からないため、二つの言語を同時に出力するか、または動画鑑賞ではない字幕データのみを出力して言語の習得に利用する等の別途の目的のために使用できないという点である。
【0025】
前述のように、PCに使用されるテキスト基盤の字幕技術、及びDVDのようなサブピクチャグラフィックを利用する字幕技術は、相異なるように設計されているので、テキスト基盤の字幕データ情報をそのままDVDの再生装置に適用するには、リアルタイムの再生保証やサブピクチャデータバッファの管理上の問題点が発生する。
【発明の開示】
【発明が解決しようとする課題】
【0026】
したがって、前述の問題点を解決するために、本発明の目的は、テキスト基盤の字幕技術、及びDVDで使用されるサブピクチャグラフィック基盤の字幕技術の問題点を補完したテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法を提供するところにある。
【0027】
追加的な観点及び/または利点は、以下の説明で開示されるか、当該説明から自明であり、または発明の実施によって理解される。
【課題を解決するための手段】
【0028】
前記目的は、動画データと、前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含み、前記サブタイトル用のデータは、ビットマップイメージに変換されたピクセルデータを生成するためのテキストデータ、及び前記ピクセルデータがリアルタイムで出力されるように制御するための制御情報を含むことを特徴とする記録媒体により達成される。
【0029】
前記テキストデータは、字幕の内容をオーバーラップするグラフィックとして出力するために、前記ビットマップイメージに変換するための前記ピクセルデータを生成することが望ましい。
【0030】
前記テキストデータは、オーバーラップされるグラフィックとして出力される字幕のスタイルを指定するスタイル情報をさらに含み、前記スタイル情報は、ピクセルデータ領域、背景画面色、テキストの最初の字が始まる原点、行間情報、出力方向、フォントの種類、字の色、文字コードのうち少なくとも一つを含むことが望ましい。
【0031】
前記制御情報は、前記ピクセルデータがバッファメモリで生成及び削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を記録した位置情報を含むことが望ましい。
【0032】
前記サブタイトル用のデータは、前記サブピクチャ情報に含まれたピクセルデータ(PXD)に対応する前記テキストデータと、ディスプレイ制御情報(SP_DCSQT)に対応する前記制御情報と、を含むことが望ましい。前記サブタイトル用のデータは、テキスト形式のデータまたはパケット形式のデータであるであることが望ましい。
【0033】
前記サブタイトル用のデータは、前記プレゼンテーションデータに含まれたプレゼンテーション構成セグメント(Presentation Composition Segment:PCS)に対応する前記テキストデータと、オブジェクト定義セグメント(Object Definition Segment:ODS)に対応する前記制御情報と、を含むことが望ましい。前記サブタイトル用のデータは、テキスト形式のデータまたはパケット形式のデータであることが望ましい。
【0034】
一方、本発明の他の分野によれば、前記目的は、動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する装置において、前記サブタイトル用のデータに含まれたテキストデータをデコーディングして、ビットマップイメージに変換されたピクセルデータを生成し、字幕がリアルタイムで表示されるように制御するために、前記サブタイトル用のデータに含まれた制御情報をデコーディングして解析するテキスト字幕デコーダと、前記制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御するグラフィック制御器と、を備えることを特徴とする再生装置により達成される。
【0035】
前記テキスト字幕デコーダは、前記テキストデータ及び前記制御情報をデコーディングして解析するテキスト字幕パーサと、解析されたテキストデータをオーバーラップするグラフィックとして出力するために、ビットマップイメージに変換するフォントレンダラーと、を備えることが望ましい。
【0036】
前記テキスト字幕パーサは、前記テキストデータにさらに含まれた字幕の出力スタイルを指定するスタイル情報をデコーディングして解析し、前記フォントレンダラーは、前記テキストデータを前記解析されたスタイル情報を反映したビットマップイメージに変換させることが望ましい。
【0037】
前記テキスト字幕パーサは、前記テキストデータを解析して前記フォントレンダラーに伝達することが望ましい。前記テキスト字幕パーサは、前記制御情報のうち前記ピクセルデータがバッファメモリで生成されて削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を指示する位置情報を解析して前記グラフィック制御器に伝達し、前記グラフィック制御器は、前記解析された時間情報及び位置情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することが望ましい。
【0038】
前記サブタイトル用のデータは、ビットマップイメージ再生方式で生成されたDVDのサブピクチャ情報に含まれたピクセルデータに対応する前記テキストデータと、SP_DCSQTに対応する前記制御情報とを含むことが望ましい。前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、前記グラフィック制御器は、前記伝えられた制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することが望ましい。
【0039】
前記サブタイトル用のデータは、ビットマップイメージの再生方式で生成されたブルーレイディスクのプレゼンテーションデータに含まれたPCSに対応する前記テキストデータと、ODSに対応する前記制御情報とを含むことが望ましい。前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、前記グラフィック制御器は、前記伝えられた制御情報を利用して前記PXDがリアルタイムで出力されるように制御することが望ましい。
【0040】
一方、本発明の他の分野によれば、前記目的は、動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する方法において、前記記録媒体からテキストデータ及び制御情報を含む前記サブタイトル用のデータを読み取るステップと、前記テキストデータをデコーディングして字幕内容及び出力スタイル情報を解析し、解析されたスタイル情報に基づいて字幕内容をビットマップイメージからなるピクセルデータに変換するステップと、前記制御情報をデコーディングして、前記ピクセルデータがリアルタイムで出力されるように制御する時間情報、及び字幕が出力される位置を制御するパーシング位置情報を解析するステップと、前記解析された時間情報及び位置情報によって前記変換されたピクセルデータをリアルタイムで出力するステップと、を含むことを特徴とする再生方法により達成される。
【発明の効果】
【0041】
本発明によれば、テキスト基盤の字幕技術と、DVDで使用されるサブピクチャグラフィック基盤の字幕技術の問題点を補完したテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法が提供される。
【0042】
これにより、バッファの管理が便利であり、二つの言語の字幕を同時に出力するか、または字幕のみを別途に出力できると共に、ハードウェアにより制御される字幕のリアルタイム再生を保証できる。
【0043】
また、本発明に係るサブタイトル用のデータは、従来のビットマップイメージ基盤のサブピクチャ方式の字幕データより、符号化されたデータ量が相対的に少ないので、多国言語処理のために再符号化する場合にも、VOBUのアドレス管理が容易である。
【発明を実施するための最良の形態】
【0044】
本発明の具現例によって詳細に参照され、その具現例は、図面によって説明され、同じ部材には同じ符号を付ける。
【0045】
以下、図面を参照して本発明に係る望ましい実施形態を詳細に説明する。
【0046】
図9は、本発明の望ましい実施形態に係るテキスト字幕を処理する再生装置のブロック図である。図9に示すように、本発明の望ましい実施形態に係るテキスト基盤の字幕を処理する再生装置は、バッファ部902、906、ビデオデータ処理部910、テキスト字幕データ処理部920、オーディオデータ処理部930及びブレンダー940を備える。
【0047】
バッファ部902、906は、保存されるデータの種類によって、動画データが保存されるAVデータバッファ902及びテキスト基盤の字幕データが保存されるテキスト字幕データ及びフォントデータバッファ906を備える。光ディスクのような着脱式記録媒体、ローカルストレージ、インターネットなどの多様な記録媒体900から読み取りされたデータは、データの種類によって各バッファに一時保存される。
【0048】
ビデオデータ処理部910は、ビデオデコーダ914及びビデオフレームバッファ916を備える。ビデオデコーダ914は、前述のAVデータバッファ902から圧縮符号化された動画データを伝達されてデコーディングする。デコーディングされたビデオデータは、ビデオフレームバッファ916を経て画面942に出力される。
【0049】
テキスト字幕データ処理部920は、テキスト字幕デコーダ922、サブピクチャデコーダ924及びグラフィック制御器926を備える。本発明に係る再生装置は、従来の多重化されたサブピクチャ方式のサブタイトルを処理できるようにサブピクチャデコーダ924を備えるだけでなく、本発明に係るテキスト基盤の字幕データを処理できるようにテキスト字幕デコーダ922を備える。テキスト字幕デコーダ922は、サブタイトル用のデータのうち、字幕に対するビットマップイメージを生成するためのテキストデータと、字幕のリアルタイム再生を制御するための制御情報とをデコーディングして、ビットマップイメージに変換されたPXDを生成する。デコーディングされたデータのうち制御情報は、グラフィック制御器926に伝えられて生成されたPXDがリアルタイムで出力されるように制御する。
【0050】
オーディオデータ処理部930は、オーディオデコーダ930を備え、オーディオデータをデコーディングしてスピーカー932を通じて出力する。
【0051】
ブレンダー940は、動画データがデコーディングされたビデオデータと、字幕データがレンダリングされたビットマップイメージグラフィックデータとをオーバーラップして画面942に出力する。
【0052】
図10は、図9に示すテキスト基盤の字幕を処理するための再生装置の詳細ブロック図である。図10には、図9に説明したテキスト字幕データ処理部920の構造が詳細に示されている。
【0053】
本発明に係る再生装置は、バッファ部1010ないし1040、ビデオデータ処理部910、テキスト字幕データ処理部920及びブレンダー1039を備える。図9で前述のオーディオ処理部についての説明は省略する。
【0054】
バッファ部1010ないし1040は、ビデオデータバッファ1010、サブピクチャデータバッファ1020、テキスト字幕データバッファ1030及びフォントデータバッファ1040を備える。光ディスクのような着脱式記録媒体、ローカルストレージ、インターネットなどの記録媒体1000から動画データ及びサブタイトル用のデータを読み取って、各データの種類によって各バッファに一時保存する。動画データ(AVデータ)は、逆多重化されて、ビデオデータは、ビデオデータバッファ1010に、サブタイトル用のサブピクチャデータは、サブピクチャデータバッファ1020に、オーディオデータは、オーディオデータバッファ(図示せず)に一時保存される。一方、テキスト基盤の字幕のためのサブタイトル用のデータとして、PXDを生成するためのテキストデータ及び字幕がリアルタイムで出力されるように制御するための制御情報は、テキスト字幕データバッファ1030に、サブタイトル用のフォントデータは、フォントデータバッファ1040に一時保存される。
【0055】
ビデオデータ処理部910は、ビデオデコーダ1012及びビデオフレームバッファ1014を備え、図9で説明した通りである。
【0056】
テキスト字幕データ処理部920は、テキスト字幕パーサ1031、フォントレンダラー1034、サブピクチャデコーダ1032、グラフィック制御器1038、各種バッファ1032,1035,1036及び色参照テーブル(Color Lookup Table:CLUT)1037を備える。
【0057】
テキスト字幕パーサ1031は、サブタイトル用のデータに含まれるテキストデータ及び制御情報をデコーディングして解析する。また、テキストデータにさらに含まれる字幕の出力スタイルを指定するスタイル情報をデコーディングして解析する。解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝えられる。
【0058】
フォントレンダラー1034は、解析されたテキストデータをオーバーラップするグラフィックとして出力するために、ビットマップイメージを生成する。このとき、解析されたスタイル情報を反映してビットマップイメージを生成し、生成されたグラフィックデータを経路(3)を通じてPXDバッファ1035に一時保存する。テキストデータ及びスタイル情報のデータ構造については後述する。
【0059】
サブピクチャデコーダ1033は、動画データから逆多重化されたサブタイトル用のサブピクチャデータをデコーディングする。これは、従来のDVDサブピクチャ方式の字幕データと互換のために提供される。本発明の他の実施形態によって、本発明に係るテキスト基盤のサブタイトル用のデータがパケット化されて動画データに含まれた場合、テキストデータ及び制御情報を逆多重化して経路(9)を通じてテキスト字幕パーサ1031に伝達する。
【0060】
グラフィック制御器1038は、制御情報を利用して字幕がリアルタイムで出力されるように制御する。前述のマイクロソフト社のSAMIのような従来のテキスト基盤の字幕技術の場合、字幕が出力される時間を指定するだけであり、もし、低速のプロセッサが使用されるハードウェアで再生されれば、動画データ及び字幕を同期化して出力するリアルタイム再生が保証されないこともある。しかし、本発明に係る再生装置の場合、前述の制御情報のうちビットマップイメージからなるPXDがバッファメモリで生成及び削除される時間を記録した時間情報、及び前記PXDが出力される位置を記録した位置情報を解析して、PXDバッファの出力を制御することによって、動画データ及び字幕が同期化されてリアルタイムで再生され得る。
【0061】
各種のバッファ1032、1035、1036には、グラフィック制御情報バッファ1032、PXDバッファ1035及びサブピクチャフレームバッファ1036が含まれる。グラフィック制御情報バッファ1032は、テキスト字幕パーサ1031で解析された制御情報を一時保存し、PXDバッファ1035は、ビットマップイメージに変換されたグラフィックデータを一時保存し、サブピクチャフレームバッファ1036は、グラフィック制御器1038から制御情報に含まれた時間情報によってPXDの出力を制御して、字幕用のサブピクチャを出力するためにPXDを一時保存する。
【0062】
CLUT 1037は、制御情報内に含まれたパレット情報を利用して出力される字幕の色を制御する。
【0063】
ブレンダー1039は、ビデオデータ処理部910から出力される映像と、テキスト字幕データ処理部920から出力される字幕のグラフィックイメージとをオーバーラップして画面1040に出力する。
【0064】
前述の本発明に係る再生装置の各ブロックの動作を整理すれば、次の通りである。
【0065】
まず、記録媒体1000から読み取られた動画データは逆多重化され、ビデオデータは、ビデオデータバッファ1010を経てビデオデコーダ1012によりデコーディングされる。デコーディングされたビデオデータは、ビデオフレームバッファ1014を通じて出力された後、テキスト字幕処理部920から出力される字幕のグラフィックデータとオーバーラップされて出力される。動画データのうちオーディオデータは、オーディオデータ処理器930のオーディオデコーダを通じてデコーディングされて、スピーカー932を通じて出力される。
【0066】
一方、記録媒体1000から読み取りされた本発明に係るテキスト基盤のサブタイトル用のデータは、テキスト字幕データバッファ1030を経てテキスト字幕パーサ1031でテキストデータと制御情報とに解析される。解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝達される。ここで、字幕データがビットマップイメージから構成されたグラフィックデータに変換され、グラフィックデータはPXDバッファ1035に保存される。
【0067】
一方、字幕のリアルタイム出力のための時間情報と字幕の出力位置情報とに解析された制御情報は、経路(1)を通じてグラフィック制御情報バッファ1032を経て経路(7)を通じてグラフィック制御器1038に伝えられる。グラフィック制御器1038は、制御情報を利用してPXDバッファ1035に保存されたグラフィックデータの出力速度を調整し、グラフィックデータをサブピクチャフレームバッファ1036に出力し、CLUT 1037を参照して色を反映する。グラフィック制御器1038は、ブレンダー1039を通じてグラフィックデータを動画ビデオデータとオーバーラップして画面に出力する。
【0068】
一方、本発明の他の実施形態として、テキスト基盤のサブタイトル用のデータがパケット化されて動画データに多重化された場合には、サブタイトル用のデータは、サブピクチャデコーダ1033を通じてデコーディングされて、経路(9)を通じてテキスト字幕パーサ1031に伝えられる。その後、サブタイトル用のデータが処理される過程は、前述の通りである。
【0069】
本発明の一実施形態として、サブタイトル用のデータが、ビットマップデータ再生方式で生成されたDVDのサブピクチャ情報のうち、PXDに対応する前記テキストデータと、SP_DCSQTに対応する前記制御情報とを含む場合、サブピクチャデコーダ1033によりデコーディングされたサブタイトル用のデータは、テキスト字幕パーサ1031に伝えられ、ここでテキストデータは、フォントレンダラー1034に伝えられ、制御情報は、グラフィック制御器1038に伝えられ、グラフィック制御器から伝えられた制御情報を利用して、字幕がリアルタイムで出力されるように制御される。
【0070】
本発明の他の実施形態として、サブタイトル用のデータが、ビットマップデータ再生方式で生成されたブルーレイディスクのプレゼンテーションデータのうち、PCSに対応する前記テキストデータと、ODSに対応する前記制御情報を含む場合、サブピクチャデコーダ1033によりデコーディングされたサブタイトル用のデータは、テキスト字幕パーサ1031に伝えられて、ここでテキストデータは、フォントレンダラーに伝えられ、制御情報は、グラフィック制御器1038に伝えられ、グラフィック制御器1038から伝えられた制御情報を利用して、字幕がリアルタイムで出力されるように制御される。
【0071】
以下では、本発明に係るテキスト基盤のサブタイトル用のデータが記録された記録媒体について説明する。
【0072】
本発明に係る記録媒体には、動画データ及び動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータが含まれる。サブタイトル用のデータには、PXDを生成するためのテキストデータ、及び字幕がリアルタイムで出力されるように制御するための制御情報が含まれる。
【0073】
テキストデータは、字幕内容をオーバーラップするグラフィックとして出力するために、ビットマップイメージに変換するためのテキストデータであって、字幕のスタイルを指定するスタイル情報をさらに含み、スタイル情報は、PXD領域、背景画面色、テキストの最初の字が始まる原点、行間情報、出力方向、フォントの種類、字の色、文字コードのうち少なくとも一つを含むことが望ましい。
【0074】
一方、制御情報には、テキストデータがレンダリングされたPXDがバッファメモリで生成及び削除される時間を記録した時間情報、及びPXDが出力される位置を記録した位置情報が含まれる。
【0075】
本発明に係る記録媒体の一実施形態として、サブタイトル用のデータは、ビットマップデータの再生方式で生成されたDVDのサブピクチャ情報と類似した所定の内容が含まれるように、サブピクチャ情報のうちPXDに対応するテキストデータと、SP_DCSQTに対応する制御情報と、を含んでもよい。サブタイトル用のデータは、テキスト形式のデータで具現されてもよく、パケット形式のデータで具現されてもよい。
【0076】
また、本発明に係る記録媒体の他の実施形態として、サブタイトル用のデータは、ビットマップデータの再生方式で生成されたブルーレイディスクのプレゼンテーションデータと類似した所定の内容が含まれるように、プレゼンテーションデータのうちPCSに対応するテキストデータと、ODSに対応する制御情報と、を含んでもよい。サブタイトル用のデータは、テキスト形式のデータで具現されてもよく、パケット形式のデータで具現されてもよい。
【0077】
図11Aは、本発明の望ましい実施形態に係るPXDを生成するためのテキストデータの一例を示す図である。
【0078】
図11Aに示すように、テキストデータには、ビットマップイメージであるPXDに生成されるために必要な情報である字幕内容及びスタイル情報が含まれたテキスト情報が記録される。
【0079】
すなわち、テキスト情報は、出力される字幕の内容を含んだテキスト情報と、字幕の出力スタイルを指定するスタイル情報とが含まれる。スタイル情報としては、複数行のテキストを出力する場合、行間に関する情報が含まれ、テキストの出力方向(左→右、右→左、上→下)を指示する情報が含まれ得る。また、テキストのサイズ、太さ、傾斜、下線のようなフォントの種類についての情報が含まれ、テキストを次の行から新たに描き示す改行情報が含まれ、テキストの色に関する情報が含まれ得る。また、エンコーディングのための文字コード情報が含まれ得るが、例えば、使用される文字コードが8859−1であるか、またはUTF−16であるか等についての情報が含まれる。
【0080】
以上のテキスト情報は、本発明に係る一例であり、DVDまたはブルーレイディスク等の適用される媒体の特性に合わせて変形されて具現され得る。
【0081】
図11Bは、本発明の望ましい実施形態に字幕のリアルタイム表示を制御するためのグラフィック制御情報の一例である。図11Bに示すように、ビットマップイメージに変換されたPXDの出力を制御するための制御情報が図示されている。
【0082】
すなわち、テキストデータがビットマップイメージに変換されて描かれるPXD領域のサイズを示すために、PXD領域の幅情報とPXD領域の高さ情報とが記録され得る。また、PXDの背景画面の色に関する情報が含まれ、PXDのPXDバッファメモリに生成及び削除される時間を記録した時間情報が記録され、テキストの字の1行が始まる位置を指示する原点情報が記録され得る。前述のデータは、制御情報としてサブタイトル用のデータに含まれて、字幕がリアルタイムで出力されるように制御する役割を行う。
【0083】
また、制御データは、ブルーレイディスクに適用される場合、複数のPXDを一つの画面に集めて出力するために、複数のPXD領域を一つのページに集める構成情報が含まれてもよく、ページに使用される字幕テキストの背景色及び前景色に使用するCLUT情報が含まれ得る。PXD情報のうち指定された領域が画面に出力されるので、領域指定情報((Xs,Ys)及びPXD領域の幅、高さ情報または開始点(Xs,Ys)及び終了点(Xe,Ye)情報))が含まれ得る。また、図8で説明したSub Picture Display Areaの第1の開始点に対応するPXD領域内の開始点情報が含まれてもよい。一方、バッファに一時保存されたPXDが出力される時間及びバッファで削除される時間を指示する時間情報が含まれることが望ましい。
【0084】
以上の制御情報は、本発明に係る一例であり、DVDまたはブルーレイディスク等の適用される媒体の特性に合わせて変形されて具現され得る。
【0085】
図12は、DVDのサブピクチャデータ構造を利用した本発明に係る字幕データの一実施形態である。図12に示すように、本発明に係るサブタイトル用のデータは、DVDのサブピクチャデータストリームの構成方式であるMPEGのパケット形式で具現され得る。すなわち、PES(Packetized Element Stream)構造にヘッダ情報であるSPUHの他に、PXDであるPXD領域に本発明に係るテキスト字幕データを、出力制御情報であるSP_DCSQT領域に本発明に係る制御情報を記録させ得る。もちろん、本発明に係るサブタイトル用のデータは、パケット形式のバイナリデータで具現されてもよいが、前述のサブピクチャデータストリームと類似した内容を含むテキスト形式で具現できる。テキストまたはバイナリ形式のうち何れかのデータでも、図10で説明したテキスト字幕パーサ1031で解析され、解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝えられ、制御情報は、経路(1)を通じてグラフィック制御器1038に伝えられ、制御情報に基づいてビットマップイメージに変換された字幕をリアルタイムで出力できる。
【0086】
図13は、ブルーレイディスクのプレゼンテーションデータ構造を利用した本発明に係る字幕データの一実施形態である。図13に示すように、本発明に係るサブタイトル用のデータは、ブルーレイディスクのプレゼンテーションデータストリームの構成方式であるMPEGのパケット形式で具現され得る。すなわち、PES構造にPCS領域に対応するように制御情報を記録し、ODS領域に対応するようにテキスト字幕データを記録できる。その他に、パレット定義セグメント(Pallette DefinitionSegment:PDSと略称する)及び終了セグメント(End Segment:ENDと略称する)がさらに含まれ得る。もちろん、本発明に係るサブタイトル用のデータは、パケット形式のバイナリデータで具現されてもよいが、前述のプレゼンテーションデータストリームと類似した内容を含むテキスト形式で具現できる。
【0087】
テキストまたはバイナリ形式のうち何れのデータでも、図10で説明したテキスト字幕パーサ1031で解析され、解析されたテキストデータは、経路(2)を通じてフォントレンダラー1034に伝えられ、制御情報は、経路(1)を通じてグラフィック制御器1038に伝えられ、制御情報に基づいてビットマップイメージに変換された字幕をリアルタイムで出力できる。
【0088】
図14及び図15は、テキスト形式で具現された本発明に係るサブタイトル用のデータの一実施形態を表す。特に、図14は、DVDに適用可能なテキスト形式のサブタイトル用のデータの一実施形態であって、テキストデータ及び制御情報が含まれる。また、図15は、ブルーレイディスクに適用可能なテキスト形式のサブタイトル用のデータの一実施形態であって、テキストデータ及び制御情報が含まれ、色相情報がさらに含まれ得る。ただし、図14及び図15は、本発明の望ましい実施形態に係る記録媒体のデータ構造の一例であり、多様な形態に変形されて具現され得る。
【0089】
前述の本発明に係るサブタイトル用のデータのスタイルを指定するために、次のような文字列を使用できる。
【0090】
\c[n]\:テキストに使用される色を指定する。基本値は、0である。
【0091】
\b[n]\:テキストの背景に使用される背景色を指定する。文字列の一番に使用しなければならず、基本値は、0である。
【0092】
\f[n]\:テキストに使用されるフォントの種類を指定する。基本値は、0である。
【0093】
\s[n]\:テキストに使用されるフォントのサイズを指定する。単位は、ピクセルであり、基本値は、0である。
【0094】
\e[n]\:テキストのエンコーディングに使用される文字コードを指定する。エンコーディング方式が変更され得る。0であれば、ISO−8859−1であり、1であれば、UTF−16が使用され、基本値は、0である。
【0095】
\o[n]\:PXD領域のうちテキストが描かれる原点の位置を指定する。基本値は、0である。
【0096】
\l[n]\:テキスト文字列が改行をする場合、行間を指定する。nの単位は、ピクセルであり、基本値は、0である。
【0097】
\d[n]\:テキストの出力方向を指定する。nが0であれば、左から右へ水平方向に出力され、1であれば、右から左へ水平方向に出力される。2であれば、垂直方向に出力され、改行があれば、右から左へ改行される。3であれば、垂直方向に出力され、改行があれば、左から右へ改行される。基本値は、0である。
【0098】
\b[n]\:テキストの字を太字または標準に選択する。太字は、1であり、標準は、0であり、基本値は、0である。
【0099】
\i[n]\:テキストの字を斜体または標準に選択する。斜体は、1であり、標準は、0であり、基本値は、0である。
【0100】
\u[n]\:テキストの字に下線の表示如何を指定する。下線は、1であり、標準は、0であり、基本値は、0である。
【0101】
\n\:改行を行う。基本値は、0である。
【0102】
\\:\文字を出力する。基本値は、0である。
【0103】
図16は、本発明の望ましい実施形態に係る字幕データの出力結果を示す図である。図16に示すように、例えば、スタイル情報として次の文字列が使用された場合、画面に出力される結果が示されている。すなわち、\o2000\\b0\\c1\\f0\\s20\\l20\Hello,\b1\Subtitle\b0\\i1\\n\Worldというスタイル情報が使用された場合、これを解析して生成されたPXDの出力結果である。テキストデータで使用するフォントに関する情報は、サブタイトル用のデータと別途に記録されたフォント情報をディスクまたはネットワークから受信し、当該フォント情報をフォントバッファメモリに保存して使用できる。
【0104】
以下では、前述の再生装置及び記録媒体の構成を基にテキスト字幕を処理する方法を説明する。
【0105】
図17は、本発明の望ましい実施形態に係るテキスト字幕を処理する方法を示すフローチャートである。図17に示すように、動画データ及び動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体を再生するために、まず、記録媒体からテキストデータ及び制御情報を含むサブタイトル用のデータを読み取る(ステップ1502)。読み取りされたテキストデータをデコーディングして、字幕の内容及び出力スタイルの情報を解析し、解析されたスタイル情報に基づいて字幕内容をPXDに変換する(ステップ1504)。読み取られた制御情報をデコーディングして、字幕がリアルタイムで出力されるように制御する時間情報及び位置情報を解析し(ステップ1506)、解析された時間情報及び位置情報によって変換されたPXDをリアルタイムで出力する(ステップ1508)。
【0106】
また、本発明は、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られ得るデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM(Read Only Memory)、RAM(Random Access Memory)、CD−ROM、磁気テープ、ハードディスク、フロッピー(登録商標)ディスク、フラッシュメモリ、光データ保存装置などがあり、また、キャリアウェーブ(例えば、インターネットを介した伝送)の形態で具現されるものも含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードとして保存され、かつ実行され得る。
【0107】
本発明は、図面に示された実施形態を参考に説明されたが、これは例示的なものに過ぎず、当業者ならば、これから多様な変形及び均等な他の実施形態が可能であるという点を理解できるであろう。したがって、本発明の真の技術的な保護範囲は、特許請求の範囲の技術的な思想によって決まらねばならない。
【産業上の利用可能性】
【0108】
本発明は、記録媒体の再生、さらに詳細には、DVD(Digital Versatile Disc)のサブピクチャ方式及びブルーレイディスクのプレゼンテーション方式と互換性を有するテキスト基盤の字幕情報を含む記録媒体、再生装置及びその再生方法に適用可能である。
【図面の簡単な説明】
【0109】
【図1】従来のPCで使用されるテキスト基盤の字幕技術に使用される字幕ファイルの構造を示す図である。
【図2】従来のテキスト基盤の字幕を再生する再生装置の構造を示す図である。
【図3】従来のDVDで使用されるサブピクチャグラフィック基盤の字幕技術に使用される字幕ファイルの構造を説明するために、従来のDVDのデータ構造を示す図である。
【図4】図3に示す従来のDVDのデータ構造のうち動画データであるVOBSの詳細構造を示す図である。
【図5】図4に示す動画データであるVOBSの構造のうち、SP_PCKとSPUとの相関関係を表示した図である。
【図6】図5に示すサブピクチャの符号化方法のうち、ラン−レングス符号化方法を説明するための図である。
【図7】図5に示すPXDに対する出力制御情報であるSP_DCSQTのデータ構造を示す図である。
【図8】従来のDVDのデータ構造によって、サブピクチャが動画データと共に出力された結果を示す図である。
【図9】本発明の望ましい実施形態に係るテキスト字幕を処理する再生装置のブロック図である。
【図10】図9に示す再生装置の詳細ブロック図である。
【図11A】本発明の望ましい実施形態に係るPXDを生成するためのテキストデータの一例を示す図である。
【図11B】本発明の望ましい実施形態に係る字幕のリアルタイムの表示を制御するためのグラフィック制御情報の一例を示す図である。
【図12】DVDのサブピクチャデータの構造を利用した本発明に係るサブタイトル用のデータの一実施形態を示す図である。
【図13】ブルーレイディスクのプレゼンテーションデータの構造を利用した本発明に係るサブタイトル用のデータの一実施形態を示す図である。
【図14】DVDに適用可能なテキスト形式のサブタイトル用のデータの一実施形態を示す図である。
【図15】ブルーレイディスクに適用可能なテキスト形式のサブタイトル用のデータの一実施形態を示す図である。
【図16】本発明の望ましい実施形態に係る字幕データの出力結果を示す図である。
【図17】本発明の望ましい実施形態に係るテキスト字幕を処理する方法を示すフローチャートである。
【特許請求の範囲】
【請求項1】
動画データと、
前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含み、
前記サブタイトル用のデータは、ビットマップイメージに変換されたピクセルデータを生成するためのテキストデータ、及び前記ピクセルデータがリアルタイムで出力されるように制御するための制御情報を含むことを特徴とする記録媒体。
【請求項2】
前記テキストデータは、字幕の内容をオーバーラップするグラフィックとして出力するために、前記ビットマップイメージに変換するための前記ピクセルデータを生成することを特徴とする請求項1に記載の記録媒体。
【請求項3】
前記テキストデータは、オーバーラップされるグラフィックとして出力される字幕のスタイルを指定するスタイル情報をさらに含み、前記スタイル情報は、ピクセルデータ領域、背景画面色、テキストの最初の字が始まる原点、行間情報、出力方向、フォントの種類、字の色、文字コードのうち少なくとも一つを含むことを特徴とする請求項2に記載の記録媒体。
【請求項4】
前記制御情報は、前記ピクセルデータがバッファメモリで生成及び削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を記録した位置情報を含むことを特徴とする請求項1に記載の記録媒体。
【請求項5】
前記サブタイトル用のデータは、前記サブピクチャ情報に含まれたピクセルデータに対応する前記テキストデータと、ディスプレイ制御情報(SP_DCSQT)に対応する前記制御情報と、を含むことを特徴とする請求項1に記載の記録媒体。
【請求項6】
前記サブタイトル用のデータは、テキスト形式のデータであることを特徴とする請求項5に記載の記録媒体。
【請求項7】
前記サブタイトル用のデータは、パケット形式のデータであることを特徴とする請求項5に記載の記録媒体。
【請求項8】
前記サブタイトル用のデータは、前記プレゼンテーションデータに含まれたプレゼンテーション構成セグメントに対応する前記テキストデータと、オブジェクト定義セグメントに対応する前記制御情報と、を含むことを特徴とする請求項1に記載の記録媒体。
【請求項9】
前記サブタイトル用のデータは、テキスト形式のデータであることを特徴とする請求項8に記載の記録媒体。
【請求項10】
前記サブタイトル用のデータは、パケット形式のデータであることを特徴とする請求項8に記載の記録媒体。
【請求項11】
動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する装置において、
前記サブタイトル用のデータに含まれたテキストデータをデコーディングして、ビットマップイメージに変換されたピクセルデータを生成し、字幕がリアルタイムで表示されるように制御するために、前記サブタイトル用のデータに含まれた制御情報をデコーディングして解析するテキスト字幕デコーダと、
前記制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御するグラフィック制御器と、を備えることを特徴とする再生装置。
【請求項12】
前記テキスト字幕デコーダは、前記テキストデータ及び前記制御情報をデコーディングして解析するテキスト字幕パーサと、解析されたテキストデータをオーバーラップするグラフィックとして出力するために、ビットマップイメージに変換するフォントレンダラーと、を備えることを特徴とする請求項11に記載の再生装置。
【請求項13】
前記テキスト字幕パーサは、前記テキストデータにさらに含まれた字幕の出力スタイルを指定するスタイル情報をデコーディングして解析し、前記フォントレンダラーは、前記テキストデータを前記解析されたスタイル情報を反映したビットマップイメージに変換させることを特徴とする請求項12に記載の再生装置。
【請求項14】
前記テキスト字幕パーサは、前記テキストデータを解析して前記フォントレンダラーに伝達することを特徴とする請求項12に記載の再生装置。
【請求項15】
前記テキスト字幕パーサは、前記制御情報のうち前記ピクセルデータがバッファメモリで生成されて削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を指示する位置情報を解析して前記グラフィック制御器に伝達し、
前記グラフィック制御器は、前記解析された時間情報及び位置情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することを特徴とする請求項12に記載の再生装置。
【請求項16】
前記サブタイトル用のデータは、ビットマップイメージ再生方式で生成されたDVDのサブピクチャ情報に含まれたピクセルデータに対応する前記テキストデータと、ディスプレイ制御情報(SP_DCSQT)に対応する前記制御情報と、を含むことを特徴とする請求項11に記載の再生装置。
【請求項17】
前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、
前記グラフィック制御器は、前記伝えられた制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することを特徴とする請求項16に記載の再生装置。
【請求項18】
前記サブタイトル用のデータは、ビットマップイメージ再生方式で生成されたブルーレイディスクのプレゼンテーションデータに含まれたプレゼンテーション構成セグメントに対応する前記テキストデータと、オブジェクト定義セグメントに対応する前記制御情報と、を含むことを特徴とする請求項11に記載の再生装置。
【請求項19】
前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、
前記グラフィック制御器は、前記伝えられた制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することを特徴とする請求項18に記載の再生装置。
【請求項20】
動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する方法において、
前記記録媒体からテキストデータ及び制御情報を含む前記サブタイトル用のデータを読み取りするステップと、
前記テキストデータをデコーディングして字幕内容及び出力スタイル情報を解析し、解析されたスタイル情報に基づいて字幕内容をビットマップイメージからなるピクセルデータに変換するステップと、
前記制御情報をデコーディングして、前記ピクセルデータがリアルタイムで出力されるように制御する時間情報、及び字幕が出力される位置を制御するパーシング位置情報を解析するステップと、
前記解析された時間情報及び位置情報によって前記変換されたピクセルデータをリアルタイムで出力するステップと、を含むことを特徴とする再生方法。
【請求項21】
字幕をディスプレイするためのサブタイトル情報を含む記録媒体において、前記サブタイトル情報は、
ビットマップイメージに変換されるピクセルデータを生成するためのテキストデータと、
前記ピクセルデータがリアルタイムで出力されるように制御するための制御情報と、を含むことを特徴とする記録媒体。
【請求項22】
サブタイトル情報を含む記録媒体から情報を再生する装置において、
前記サブタイトル情報からテキストデータをデコーディングしてビットマップイメージを生成し、字幕をリアルタイムで出力させるために、前記サブタイトル情報から制御情報をデコーディング及び解析するデコーダを備えることを特徴とする再生装置。
【請求項23】
前記制御情報によって、前記字幕がリアルタイムで出力されるように制御するグラフィック制御器をさらに備えることを特徴とする請求項22に記載の再生装置。
【請求項24】
記録媒体からサブタイトル情報を再生する方法において、
前記サブタイトル情報からテキストデータ及び制御情報をデコーディングするステップと、
前記テキストデータ及び制御情報から字幕内容、出力スタイル情報、時間情報、字幕が出力される位置を制御するための位置情報を解析するステップと、
前記出力スタイル情報に基づいて前記字幕内容を字幕に変換するステップと、
前記時間情報及び位置情報によって前記字幕をリアルタイムで出力するステップと、を含むことを特徴とする再生方法。
【請求項25】
動画データ及びサブタイトル用のデータを含む記録媒体から情報を再生する装置のテキスト字幕デコーダにおいて、
前記サブタイトル用のデータからテキストデータ及び制御情報をデコーディングして解析するテキスト字幕パーサと、
前記解析されたテキストデータが、前記動画データを基にした映像にオーバーラップされるグラフィックとして出力されるように、前記解析されたテキストデータをビットマップイメージに変換するフォントレンダラーと、を備えることを特徴とするテキスト字幕デコーダ。
【請求項26】
前記映像にオーバーラップされるグラフィックとしての前記テキストデータは、リアルタイムで出力されることを特徴とする請求項25に記載のテキスト字幕デコーダ。
【請求項1】
動画データと、
前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含み、
前記サブタイトル用のデータは、ビットマップイメージに変換されたピクセルデータを生成するためのテキストデータ、及び前記ピクセルデータがリアルタイムで出力されるように制御するための制御情報を含むことを特徴とする記録媒体。
【請求項2】
前記テキストデータは、字幕の内容をオーバーラップするグラフィックとして出力するために、前記ビットマップイメージに変換するための前記ピクセルデータを生成することを特徴とする請求項1に記載の記録媒体。
【請求項3】
前記テキストデータは、オーバーラップされるグラフィックとして出力される字幕のスタイルを指定するスタイル情報をさらに含み、前記スタイル情報は、ピクセルデータ領域、背景画面色、テキストの最初の字が始まる原点、行間情報、出力方向、フォントの種類、字の色、文字コードのうち少なくとも一つを含むことを特徴とする請求項2に記載の記録媒体。
【請求項4】
前記制御情報は、前記ピクセルデータがバッファメモリで生成及び削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を記録した位置情報を含むことを特徴とする請求項1に記載の記録媒体。
【請求項5】
前記サブタイトル用のデータは、前記サブピクチャ情報に含まれたピクセルデータに対応する前記テキストデータと、ディスプレイ制御情報(SP_DCSQT)に対応する前記制御情報と、を含むことを特徴とする請求項1に記載の記録媒体。
【請求項6】
前記サブタイトル用のデータは、テキスト形式のデータであることを特徴とする請求項5に記載の記録媒体。
【請求項7】
前記サブタイトル用のデータは、パケット形式のデータであることを特徴とする請求項5に記載の記録媒体。
【請求項8】
前記サブタイトル用のデータは、前記プレゼンテーションデータに含まれたプレゼンテーション構成セグメントに対応する前記テキストデータと、オブジェクト定義セグメントに対応する前記制御情報と、を含むことを特徴とする請求項1に記載の記録媒体。
【請求項9】
前記サブタイトル用のデータは、テキスト形式のデータであることを特徴とする請求項8に記載の記録媒体。
【請求項10】
前記サブタイトル用のデータは、パケット形式のデータであることを特徴とする請求項8に記載の記録媒体。
【請求項11】
動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する装置において、
前記サブタイトル用のデータに含まれたテキストデータをデコーディングして、ビットマップイメージに変換されたピクセルデータを生成し、字幕がリアルタイムで表示されるように制御するために、前記サブタイトル用のデータに含まれた制御情報をデコーディングして解析するテキスト字幕デコーダと、
前記制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御するグラフィック制御器と、を備えることを特徴とする再生装置。
【請求項12】
前記テキスト字幕デコーダは、前記テキストデータ及び前記制御情報をデコーディングして解析するテキスト字幕パーサと、解析されたテキストデータをオーバーラップするグラフィックとして出力するために、ビットマップイメージに変換するフォントレンダラーと、を備えることを特徴とする請求項11に記載の再生装置。
【請求項13】
前記テキスト字幕パーサは、前記テキストデータにさらに含まれた字幕の出力スタイルを指定するスタイル情報をデコーディングして解析し、前記フォントレンダラーは、前記テキストデータを前記解析されたスタイル情報を反映したビットマップイメージに変換させることを特徴とする請求項12に記載の再生装置。
【請求項14】
前記テキスト字幕パーサは、前記テキストデータを解析して前記フォントレンダラーに伝達することを特徴とする請求項12に記載の再生装置。
【請求項15】
前記テキスト字幕パーサは、前記制御情報のうち前記ピクセルデータがバッファメモリで生成されて削除される時間を指示する時間情報、及び前記ピクセルデータが出力される位置を指示する位置情報を解析して前記グラフィック制御器に伝達し、
前記グラフィック制御器は、前記解析された時間情報及び位置情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することを特徴とする請求項12に記載の再生装置。
【請求項16】
前記サブタイトル用のデータは、ビットマップイメージ再生方式で生成されたDVDのサブピクチャ情報に含まれたピクセルデータに対応する前記テキストデータと、ディスプレイ制御情報(SP_DCSQT)に対応する前記制御情報と、を含むことを特徴とする請求項11に記載の再生装置。
【請求項17】
前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、
前記グラフィック制御器は、前記伝えられた制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することを特徴とする請求項16に記載の再生装置。
【請求項18】
前記サブタイトル用のデータは、ビットマップイメージ再生方式で生成されたブルーレイディスクのプレゼンテーションデータに含まれたプレゼンテーション構成セグメントに対応する前記テキストデータと、オブジェクト定義セグメントに対応する前記制御情報と、を含むことを特徴とする請求項11に記載の再生装置。
【請求項19】
前記テキスト字幕パーサは、前記テキストデータを前記フォントレンダラーに伝達し、前記制御情報を前記グラフィック制御器に伝達し、
前記グラフィック制御器は、前記伝えられた制御情報を利用して、前記ピクセルデータがリアルタイムで出力されるように制御することを特徴とする請求項18に記載の再生装置。
【請求項20】
動画データ及び前記動画データに基づいた映像上にオーバーラップされるグラフィックとして出力されるサブタイトル用のデータを含む記録媒体から情報を再生する方法において、
前記記録媒体からテキストデータ及び制御情報を含む前記サブタイトル用のデータを読み取りするステップと、
前記テキストデータをデコーディングして字幕内容及び出力スタイル情報を解析し、解析されたスタイル情報に基づいて字幕内容をビットマップイメージからなるピクセルデータに変換するステップと、
前記制御情報をデコーディングして、前記ピクセルデータがリアルタイムで出力されるように制御する時間情報、及び字幕が出力される位置を制御するパーシング位置情報を解析するステップと、
前記解析された時間情報及び位置情報によって前記変換されたピクセルデータをリアルタイムで出力するステップと、を含むことを特徴とする再生方法。
【請求項21】
字幕をディスプレイするためのサブタイトル情報を含む記録媒体において、前記サブタイトル情報は、
ビットマップイメージに変換されるピクセルデータを生成するためのテキストデータと、
前記ピクセルデータがリアルタイムで出力されるように制御するための制御情報と、を含むことを特徴とする記録媒体。
【請求項22】
サブタイトル情報を含む記録媒体から情報を再生する装置において、
前記サブタイトル情報からテキストデータをデコーディングしてビットマップイメージを生成し、字幕をリアルタイムで出力させるために、前記サブタイトル情報から制御情報をデコーディング及び解析するデコーダを備えることを特徴とする再生装置。
【請求項23】
前記制御情報によって、前記字幕がリアルタイムで出力されるように制御するグラフィック制御器をさらに備えることを特徴とする請求項22に記載の再生装置。
【請求項24】
記録媒体からサブタイトル情報を再生する方法において、
前記サブタイトル情報からテキストデータ及び制御情報をデコーディングするステップと、
前記テキストデータ及び制御情報から字幕内容、出力スタイル情報、時間情報、字幕が出力される位置を制御するための位置情報を解析するステップと、
前記出力スタイル情報に基づいて前記字幕内容を字幕に変換するステップと、
前記時間情報及び位置情報によって前記字幕をリアルタイムで出力するステップと、を含むことを特徴とする再生方法。
【請求項25】
動画データ及びサブタイトル用のデータを含む記録媒体から情報を再生する装置のテキスト字幕デコーダにおいて、
前記サブタイトル用のデータからテキストデータ及び制御情報をデコーディングして解析するテキスト字幕パーサと、
前記解析されたテキストデータが、前記動画データを基にした映像にオーバーラップされるグラフィックとして出力されるように、前記解析されたテキストデータをビットマップイメージに変換するフォントレンダラーと、を備えることを特徴とするテキスト字幕デコーダ。
【請求項26】
前記映像にオーバーラップされるグラフィックとしての前記テキストデータは、リアルタイムで出力されることを特徴とする請求項25に記載のテキスト字幕デコーダ。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11A】
【図11B】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11A】
【図11B】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公表番号】特表2007−507973(P2007−507973A)
【公表日】平成19年3月29日(2007.3.29)
【国際特許分類】
【出願番号】特願2006−532085(P2006−532085)
【出願日】平成16年10月1日(2004.10.1)
【国際出願番号】PCT/KR2004/002519
【国際公開番号】WO2005/031740
【国際公開日】平成17年4月7日(2005.4.7)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】
【公表日】平成19年3月29日(2007.3.29)
【国際特許分類】
【出願日】平成16年10月1日(2004.10.1)
【国際出願番号】PCT/KR2004/002519
【国際公開番号】WO2005/031740
【国際公開日】平成17年4月7日(2005.4.7)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】
[ Back to top ]