説明

テキスト基盤のサブタイトルを提供する方法

【課題】 テキスト基盤のサブタイトルを提供する方法を提供する。
【解決手段】 本発明によるテキスト基盤のサブタイトル情報を記録した情報記録媒体を用いることによりサブタイトルを提供するための方法において、前記スタイルセット及び前記ダイアログセットを抽出する抽出ステップ、及び前記スタイルセット及び前記ダイアログセットを用いることにより前記サブタイトルを出力する出力ステップを含み、前記スタイルセットは、前記再生装置を介して表現されるべき字幕テキストのレンダリングに使われる第1スタイル情報及び前記第1スタイル情報を変更させる第2スタイル情報を含み、且つ前記ダイアログセットは、前記サブタイトルの字幕テキスト情報を含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サブタイトルに係り、具体的には、テキスト基盤のサブタイトルを提供する方法に関する。
【背景技術】
【0002】
従来のサブタイトルは、ビットマップイメージ形態に作られてMPEGストリーム内に含まれている。ビットマップイメージ形態であるため、サブタイトルを作ることが不便であるだけでなく、サブタイトル製作者によって定義されて提供されたサブタイトルの多様な属性をユーザは選択できなくて受動的に受容するしかない。すなわち、サブタイトルの色相、テキストサイズ、テキスト出力方向などの出力スタイルをユーザが選択できない。したがって、単調なスタイルのサブタイトルを見るしかないという問題点がある。
【0003】
一般的に、映画のサブタイトルは、テキスト色相、テキスト位置、テキストサイズ、テキスト形態などの出力スタイルの変化が頻繁でなく、幾つかの定形化された形式が使われる。そして、テキストのレンダリングのためには、各テキストごとにレンダリングに必要な前記色々な情報が必要である。しかし、サブタイトルの各文章ごとにこのようなレンダリング情報を付加する場合、文章ごとに異なるスタイルを指定して出力できるという長所があるが、幾つかの定形化されたスタイルを使用する映画字幕では、多様なスタイルを提供するという長所よりは、サブタイトルのデータ量及び処理せねばならないデータが多くなるという問題点がある。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明が解決しようとする技術的課題は、テキスト基盤のサブタイトルを記録した情報記録媒体を提供し、また、前記サブタイトルを多様な形態に出力できるサブタイトルの処理装置及び方法を提供することである。
【課題を解決するための手段】
【0005】
前記課題を達成するために、スタイルセット及びダイアログセットを保存するための情報記録媒体を用いることによりサブタイトルを提供するための方法において、前記スタイルセット及び前記ダイアログセットを抽出する抽出ステップ;及び前記スタイルセット及び前記ダイアログセットを用いることにより前記サブタイトルを出力する出力ステップを含み、前記スタイルセットは、前記再生装置を介して表現されるべき字幕テキストのレンダリングに使われる第1スタイル情報及び前記第1スタイル情報を変更させる第2スタイル情報(又は複数の第2スタイル情報)を含み、且つ前記ダイアログセットは、前記サブタイトルの字幕テキスト情報を含む。
【0006】
前記課題を達成するために、スタイルセット及びダイアログセットを保存するための情報記録媒体を用いることによりサブタイトルを提供するための方法において、前記スタイルセット及び前記ダイアログセットを抽出する抽出ステップ;及び前記スタイルセット及びダイアログセットを用いることにより前記サブタイトルを出力する出力ステップを含み、前記スタイルセットは、IDにより同一確認され、前記再生装置を介して表現されるべき字幕テキストのレンダリングに使われる第1スタイル情報、及び前記第1スタイル情報を変更させる第2スタイル情報(又は複数の第2スタイル情報)を含み、且つ前記ダイアログセットは、前記サブタイトルの字幕テキスト情報及び前記第1スタイル情報の前記IDの情報を含む。
【0007】
前記課題を達成するために、本発明によるマルチメディアデータを記録した情報記録媒体は、AV(オーディオ/ビデオ)データと、及び前記AVデータに同期されて出力される字幕テキストデータと前記字幕テキストの出力形態を指定する出力スタイル情報をテキスト形式に保存しているサブタイトルデータとを含む。
【0008】
また、前記サブタイトルデータは、マークアップ文書の形態に記録されているか、または二進形態に記録されていることが望ましい。
【0009】
前記課題を達成するために、本発明によるテキスト基盤のサブタイトル情報を記録した情報記録媒体は、前記サブタイトルの字幕テキスト情報及び前記字幕テキストの出力形態を指定する情報を含むダイアログ情報と、前記字幕テキストをレンダリングしてディスプレイするのに使われるスタイル情報とを含むプレゼンテーション情報を含む。
【0010】
前記ダイアログ情報及び/またはプレゼンテーション情報は、マークアップ文書の形態に記録されているか、または二進形態に記録されていることが望ましい。
【0011】
前記ダイアログ情報は、字幕テキストデータと、前記字幕テキストがディスプレイされ始める時間である開始時間データと、前記字幕テキストのディスプレイが終了する時間である終了時間データと、前記字幕テキストをレンダリングする時に使用するディスプレイスタイルを指定するスタイルデータとを含む。
【0012】
また、前記プレゼンテーション情報は、ディスプレイスタイル情報を記録したstylegroupを少なくとも一つ含み、前記stylegroupは、字幕テキストのレンダリング及びディスプレイスタイルに使われる情報を記録したstyleを少なくとも一つ以上含んでいることが望ましい。
【0013】
前記stylegroupは、ユーザによって変更されない一部スタイル情報を含んでおり、前記styleは、ユーザによって変更されるスタイル情報を含んでいることが望ましい。
【0014】
また、ユーザによって選択された前記styleに含まれたスタイル情報が、前記stylegroupに含まれているスタイル情報に適用されて字幕テキストの出力形態を変更することが望ましい。
【0015】
また、前記stylegroupに含まれているスタイル情報を、前記選択されたstyleに含まれているスタイル情報に代替または加減することが望ましい。
【0016】
前記ダイアログ情報に含まれた字幕テキストが前記stylegroupのうち一つを指定し、ユーザは、指定されたstylegroupに含まれたstyleのうち一つを選択して、前記指定されたstylegroupに記録されている情報と前記選択されたstyleに記録されている情報とを利用して前記字幕テキストをディスプレイすることが望ましい。
【0017】
前記ダイアログ情報に含まれた字幕テキストが前記stylegroupに含まれたstyleのうち一つを指定し、ユーザは、stylegroupのうち一つを選択して、前記指定されたstyleに記録されている情報と前記選択されたstylegroupに記録されている情報とを利用して前記字幕テキストをディスプレイすることを特徴とすることが望ましい。
【0018】
前記課題を達成するために、本発明によるテキストサブタイトルの処理装置は、テキスト基盤のサブタイトルデータからプレゼンテーション情報とダイアログ情報とを抽出するテストサブタイトルパーサと、前記抽出されたダイアログ情報を前記プレゼンテーション情報を参照してレンダリングして字幕テキストのイメージを生成するテキストイメージ生成部とを備える。
【0019】
望ましくは、テキスト基盤のサブタイトルデータとフォントデータとをディスクから読出して保存するバッファと、前記レンダリングされた字幕テキストイメージとビットマップ形式の字幕テキストデータとを読出して、これらを組合わせてグラフィックイメージを生成するプレゼンテーションエンジンと、をさらに備える。
【0020】
前記課題を達成するために、本発明によるテキストサブタイトルの処理方法は、(a)テキスト基盤のサブタイトルデータとフォントデータとを読出して保存するステップと、(b)前記サブタイトルデータからプレゼンテーション情報とダイアログ情報とを抽出するステップと、(c)前記抽出されたプレゼンテーション情報とダイアログ情報とを利用して字幕テキストをレンダリングしてテキストイメージを生成するステップと、(d)ビットマップイメージ形態のサブタイトルデータを読出して前記レンダリングされたテキストイメージと組合わせて出力するステップとを含む。
【0021】
前記課題を達成するために、本発明では、前記方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【発明の効果】
【0022】
本発明によれば、上記課題の解決、つまり、テキスト基盤のサブタイトルを記録した情報記録媒体を提供し、また、前記サブタイトルを多様な形態に出力できるサブタイトルの処理装置及び方法を提供できる。
【図面の簡単な説明】
【0023】
【図1】テキスト基盤のサブタイトルファイルの構造を示す図である。
【図2】字幕テキストのレンダリングに必要な情報と、その情報によってレンダリングされて出力されたテキストを示す図である。
【図3A】プレゼンテーション情報の一実施形態を示す図である。
【図3B】プレゼンテーション情報の他の一実施形態を示す図である。
【図4A】基本的なスタイル情報をstylegroupに記録したプレゼンテーション情報の一実施形態を示す図である。
【図4B】基本的なスタイル情報をstylegroupに記録したプレゼンテーション情報の他の一実施形態を示す図である。
【図5A】ダイアログ情報の一実施形態を示す図である。
【図5B】ダイアログ情報の他の一実施形態を示す図である。
【図6A】ダイアログ情報とプレゼンテーション情報との対応関係の一実施形態を示す図である。
【図6B】ダイアログ情報とプレゼンテーション情報との対応関係の他の一実施形態を示す図である。
【図7A】style変更命令によってstyleが変更されることを説明する図である。
【図7B】stylegroup変更命令によってstylegroupが変更されることを説明する図である。
【図8A】図4Aのように構成されたプレゼンテーション情報で、各字幕項目をレンダリングするために必要なスタイル情報を選択することを示す図である。
【図8B】図4Bのように構成されたプレゼンテーション情報で、各字幕項目をレンダリングするために必要なスタイル情報を選択することを示す図である。
【図8C】図4Bのように構成されたプレゼンテーション情報で、各字幕項目をレンダリングするために必要なスタイル情報を選択することを示す図である。
【図9】本発明のテキスト基盤のサブタイトルの処理装置のブロック図である。
【図10】本発明のテキスト基盤のサブタイトル処理方法のフローチャートである。
【発明を実施するための形態】
【0024】
以下、添付された図面を参照して、本発明による望ましい一実施形態を詳細に説明する。
【0025】
図1は、テキスト基盤のサブタイトルファイルの構造を示す図である。テキスト基盤のサブタイトルファイル100は、ダイアログ情報110、プレゼンテーション情報120及びメタデータ130a,130bを含む。
【0026】
ダイアログ情報110は、字幕テキストとそのテキストの出力開始時間、出力終了時間、テキストレンダリングに使用するstylegroupまたはスタイル情報、フェードイン/フェードアウトのようなテキスト変化効果情報、そしてテキストに対するフォーマッティングコードを含む。フォーマッティングコードは、テキストを太く表示するコード、イタリック体で表示するコード、アンダーラインを表すコード、改行を表すコードなどを含んでいる。
【0027】
プレゼンテーション情報120は、字幕テキストのレンダリングに使われるスタイル情報を含み、複数のstylegroupで構成される。stylegroupは、スタイル情報が記録されているstyleの束である。styleは、字幕テキストのレンダリング及び画面出力に使われる情報を含んでいる。その情報の例としては、style名、フォント、テキスト色相、背景色、テキストサイズ、行間隔、テキスト出力領域、テキスト出力の開始位置、出力方向、整列方式などがある。いかなる情報をstyleと定義し、いかなる情報をstylegroupと定義するかによって、ユーザが属性を変更できることが変わるが、スタイル情報を指定する方法については後述する。
【0028】
メタデータ130a,130bは、動画についての付加情報であって、サブタイトルの出力以外の付加機能を行うのに必要な情報を含んでいる。
【0029】
図2は、字幕テキストのレンダリングに必要な情報と、その情報によってレンダリングされて出力された画面を示す図である。
【0030】
出力領域(Region)(l,t,w,h)210は、テキストが出力される領域情報であって、(l,t)座標を開始位置とし、広さw、高さhほどの領域を有することを意味する。出力開始位置(Position)(x,y)220は、テキストの画面出力時に基準点を表す情報であって、Region(l,t,w,h)の領域内に存在せねばならない。テキスト整列222は、テキストの整列方式を指定する。テキスト整列方式には、左側整列、中間整列、右側整列方式がある。左側整列方式は、テキスト出力の出力開始位置であるPosition(x,y)座標を基準として左側方向にテキストを出力することであり、中間整列方式は、出力開始位置Position(x,y)座標を基準として左右に同じ距離ほど離れてテキストを出力する方式である。そして、右側整列方式は、出力開始位置Position(x,y)座標を基準として右側方向にテキストを出力する方式である。図2では、出力開始位置Position(x,y)座標を基準点として、左側整列方式でテキストを出力した例を示した。
【0031】
フォントサイズ230は、出力されるテキストのサイズ情報を表す。行間隔240は、テキストの行間の間隔情報を表す。背景色250は、Region(l,t,w,h)によって定義されたテキスト出力領域内の背景色を定義する。テキスト色260は、出力されるテキストの色を定義する。フォント名270は、テキストレンダリングに使用するフォントの種類を指定する。
【0032】
フォーマッティングコード280及びキャラクタデータ290は、ダイアログ情報に含まれているものであって、フォーマッティングコード280は、改行コード、テキスト太さ表示コード、イタリック体で表示するコード、アンダーラインコードなどを含み、キャラクタデータ290は、サブタイトルでディスプレイされる実際字幕テキスト情報を意味する。出力方向は、テキストの出力方向を表す情報であって、(左→右、上→下)、(上→下、右→左)などと定義されうる。図2では、(左→右、上→下)の出力方向を例として示した。前述した色々な情報のうち、フォーマッティングコード280及びキャラクタデータ290を除外した残りの情報は、プレゼンテーション情報に含まれる。
【0033】
テキスト基盤のサブタイトルでテキストレンダリングに必要な情報を表現する方法として色々なものがある。各情報が記録される構造体を定義して二進形式に構成でき、または前記構造体の形式に対応するマークアップ形式に構成してもよい。二進形式とは、マークアップ文書のようにテキスト基盤で記録することではなく、一連の二進データに対して一定のバイト別に意味を付与してレンダリングに必要な情報を保存する方式を称す。すなわち、最初の幾つかのバイトはstyle名、その次の幾つかのバイトはフォント、その次の幾つかのバイトはテキスト色相など、このような式でレンダリングに必要な情報を記録する方式である。以下では、マークアップ形式の情報記録方法を例として説明する。
【0034】
ダイアログ情報に含まれた各字幕文章がレンダリングされてディスプレイされるのに使われるスタイル情報を指示するためのstyleとstylegroupとを構成する方法に色々な方法がある。
【0035】
第一には、ダイアログ情報に含まれた各字幕文章がstylegroupを指定し、ユーザは、指定されたstylegroupに含まれたstyleのうち一つを選択する方法であり、第二は、ユーザがstylegroupを選択し、ダイアログ情報の各字幕文章がstylegroupに含まれたstyleのうち一つを指定する方法である。これにより、字幕文章のレンダリングに必要な全ての情報がstyleに含まれていて、製作者は、ユーザの選択によって、出力される字幕のレンダリングに使われるスタイル情報のうち何れかのものでも変更できる。すなわち、ユーザが字幕の出力スタイルを変更すれば、製作者が提供したスタイル情報によって全ての情報が変更されうる。
【0036】
以下では、前述した色々な場合について、図3Aないし図6Bを参照して詳細に説明する。
【0037】
図3Aは、プレゼンテーション情報の一実施形態を示す図である。プレゼンテーション情報は、stylesetの形態に記録され、stylesetは、製作者が定義した複数のstylegroupを含む。stylegroupは、各グループの名称を表すname属性を有し、その値が表すstylegroupの名称で各グループを区分する。stylegroupは、動画の再生時に、製作者が所望するスタイルの通りにサブタイトルを出力するための属性情報の束である。
【0038】
例えば、映画の題目についてのサブタイトルは、画面の中央に大きいテキストとして出力し、映画台詞についてのサブタイトルは、画面の下段に映画の視聴を妨害しないほどのサイズで出力し、映画の終わり部分で、登場人物についてのサブタイトルは、画面全体に中間整列方式で出力することを所望する場合に、製作者は、stylegroupをTitle、Script、Castingの3部分に分けて定義し、サブタイトルファイルのダイアログ情報に記録されるそれぞれの字幕には、プレゼンテーション情報に定義された3つのstylegroupのうち一つを指定される。このstylegroupは、映画を視聴するユーザによって任意に変更されない。
【0039】
stylegroupは、テキストのレンダリングに必要な情報を記録しているstyleを含む。styleには、それぞれのstyleを区分するためのnameとテキストのレンダリングに必要な色々な情報とを含む。また、stylegroupには、複数のstyleが定義され、それぞれのstylegroupに定義されたstyleの数及びstylenameは、全てのstylegroupで同一に構成されねばならないということが望ましい。stylegroup内に定義されている複数のstyleのうち、最初のstyleがデフォルトに選択されるか、または製作者によってデフォルトstyleが定義されて、最初サブタイトルが画面上に出力される時には、デフォルトに選択されているstyleがテキストのレンダリングに適用され、映画再生中にユーザによって任意にstyleが変更された場合、その以後には、ユーザによって指定されたstyleがテキストのレンダリングに適用される。
【0040】
図3Bは、プレゼンテーション情報の他の一実施形態を示す図である。図3Bを参照するに、サブタイトルの3つの区分単位であるTitle、Script、Castingがstyleと定義されており、この3つのstyleを含んでいるstylegroupは、字幕テキストの出力styleによってSmall、Normal、Largeに区分されており、ダイアログ情報の各字幕文章には、プレゼンテーション情報に定義されたstyleが指定されている。この場合、最初のstylegroupがデフォルトに選択されるか、または製作者によってデフォルトstylegroupが定義されて、最初サブタイトルが画面上に出力される時には、デフォルトに選択されているstylegroupに含まれているstyleのうち、ダイアログ情報の各字幕文章が指示しているstyleが字幕テキストのレンダリングに適用され、映画再生中にユーザによって任意にstylegroupが変更された場合、その以後には、ユーザによって指定されたstylegroupが含んでいるstyleのうち一つのstyleがテキストレンダリングに適用される。
【0041】
前記図3A及び図3Bのように、プレゼンテーション情報を構成する場合には、ユーザによるstyleの変更時に全てのスタイル情報が変更される。しかし、場合によっては、スタイル情報の一部のみ変更されることが効率的である時もあるので、このために、次の図4A及び図4Bに示したように、プレゼンテーション情報を構成してもよい。
【0042】
図4Aは、基本的なスタイル情報をstylegroupに記録したプレゼンテーション情報の一実施形態を示す図である。
【0043】
図3Aないし図3Bで示したプレゼンテーション情報とは違って、stylegroupは、ユーザによって字幕出力スタイルが変更された場合にも変更されない一部の情報を含む。また、stylegroupは、ユーザの選択によって変更可能な一部のスタイル情報を含んでいる一つ以上のstyleを含んでおり、各styleは、name属性によって区分される。
【0044】
図4Aを参照するに、stylesetは、“Title”、“Script”、“Casting”に区分される三つのstylegroupを含んでいる。また、各stylegroupは、字幕のレンダリングに使われるスタイル情報のうち、ユーザによるスタイル変更時にも同じ値を維持するfont、color、background、align、region、lineheightスタイル情報を含み、また、ユーザによるスタイル変更時にその値が変更されるsize、position、directionスタイル情報を含んでいるstyleとして“normal font”、“small font”、“large font”の三つを含んでいる。styleはまた、ユーザによって一つのstyleが選択される前にdefaultとして適用されるstyleを選択するための方法でdefault属性を有するか、または最初のstyleがdefaultとして選択されうる。
【0045】
この場合、字幕テキストをレンダリングするのに使われる一つの完全なスタイル情報を構成するために、stylegroupが含んでいるfont、color、background、align、region、lineheightスタイル情報と、ユーザによって選択されたstyle、またはdefault styleが含んでいるsize、position、directionスタイル情報とが参照される。
【0046】
図4Bは、基本的なスタイル情報をstylegroupに記録したプレゼンテーション情報の他の一実施形態を示す図である。
【0047】
図4Aの場合と同様に、図4Bに示したプレゼンテーション情報でも、stylegroupは、字幕テキストをレンダリングするために必要な全てのスタイル情報を含む。また、stylegroupは、ユーザの選択によって変更可能な一部スタイル情報を含んでいる一つ以上のstyleを含んでおり、各styleは、name属性によって区分される。
【0048】
図4Bを参照するに、stylesetは、“Title”、“Script”、“Casting”に区分される三つのstylegroupを含んでいる。また、各stylegroupは、字幕のレンダリングに使われるスタイル情報としてfont、color、background、align、region、lineheight、size、position、directionスタイル情報を含み、ユーザによるスタイル変更時にその値が変更されるsize、position、directionスタイル情報を含んでいるstyleとして“small font”、“large font”の2つを含んでいる。
【0049】
ユーザによってスタイル変更がない場合、字幕テキストをレンダリングするのに使われる一つの完全なスタイル情報を構成するために、stylegroupが含んでいるfont、color、background、align、region、lineheight、size、position、directionスタイル情報のみを使用し、ユーザによってstyleが変更された場合、選択されたstyleが含んでいるsize、position、directionスタイル情報が、stylegroupが含んでいる情報のうちsize、position、directionの情報に適用されて字幕の出力スタイルが変更される。
【0050】
このとき、ユーザによって選択されたスタイル情報がstylegroupに適用される方法としては、stylegroupが含んでいる値をstyleが含んでいる値に代替する方法と、stylegroupが含んでいる値にstyleが含んでいる値を加算する方法とがありうる。stylegroupが含んでいる値にstyleが含んでいる値を加算する方法を使用する場合、styleが含んでいるsize、position、direction属性の値は、正数や負数で表現されて、stylegroupが含んでいる値を加減する形態となりうる。
【0051】
図5Aは、ダイアログ情報の一実施形態を示す図である。
【0052】
ダイアログ情報は、画面に出力される字幕の区分単位として<text>を使用する。<text>は、画面に出力される時間情報であって、テキストの出力が始まる時間であるstart、出力が終わる時間であるendとフェードイン/フェードアウトなどのテキストに適用される変化効果情報としてeffect、テキストレンダリングに使われるスタイル情報としてstylegroupなどを属性情報に含み、また画面に出力される字幕のテキスト情報を記録している。
【0053】
図5Aを参照するに、“John! ride...”という字幕テキストがstylegroupの“Script”が含んでいる複数のstyleのうちデフォルトstyleまたはユーザによって指定されたstyle情報を利用してレンダリングされ、“fade−in”効果が適用されて開始時間“00:10:00”から開始して終了時間“00:10:15”までテキストが次第に明確に出力される。
【0054】
図5Bは、ダイアログ情報の他の一実施形態を示す図である。図5Bを参照するに、<text>が字幕テキストのレンダリングのための情報としてstylegroupの代わりにstyleを指定している。この場合、<text>が含んでいる字幕テキストは、デフォルトstylegroupまたはユーザによって指定されたstylegroupに含まれている複数のstyleのうち、style“Script”を使用してレンダリングされる。
【0055】
図6Aは、ダイアログ情報とプレゼンテーション情報との対応関係の一実施形態を示す図である。
【0056】
図5Aを参照して説明したように、ダイアログ情報の各<text>は、テキストのレンダリングに使われるスタイル情報を指示するためにstylegroupを属性として有するが、この属性値は、プレゼンテーション情報のstylesetに保存されたstylegroupのうち一つを指示しており、指示されたstylegroupに含まれているstyleのうち、デフォルトstyleまたはユーザによって指定されたstyleがテキストレンダリングに必要な情報を提供する。
【0057】
図6Aを参照するに、ダイアログ情報に記録された二つの<text>は、それぞれstylegroup“Title”と“Script”とを指示している。各<text>は、プレゼンテーション情報に記録されたstylegroup“Title”と“Script”とに含まれているstyleのうち一つがそれぞれ対応する。
【0058】
図6Bは、ダイアログ情報とプレゼンテーション情報との対応関係の他の一実施形態を示す図である。
【0059】
ダイアログ情報の各<text>がテキストのレンダリング情報としてstylegroupでないstyleを指示しており、当該スタイル情報は、プレゼンテーション情報に保存された複数のstylegroupに含まれている複数のstyleのうち一つとして記録されている。図6Bを参照するに、ダイアログ情報に記録された二つの<text>は、それぞれstyle“Title”と“Script”とを指示している。各<text>は、プレゼンテーション情報に記録されたstylegroup“Small”及び“Normal”のうち一つのstylegroupが含んでいるstyle“Title”と“Script”とがそれぞれ対応する。
【0060】
以下、図7Aないし図7Bを参照して、styleをユーザが変更するためのユーザオペレーションまたはAPI(Application Program Interface)について詳細に説明する。
【0061】
図7Aは、style変更命令によってstyleが変更されることを説明する図である。図7Aを参照するに、stylegroup“Title”、“Script”、“Casting”が定義されており、各stylegroupは、style“Small”、“Normal”、“Large”を含む。stylegroup“Title”は、中間整列方式を使用し、青色でテキストを出力し、stylegroup“Script”という左側下段を基準として左側整列方式を使用し、黒色でテキストを出力し、stylegroup“Casting”は、右側上段を基準として右側整列方式を使用し、赤色でテキストを出力する。各stylegroupに含まれたスタイル情報を見れば、style“Small”は小さな文字、style“Normal”は中間文字、style“Large”という大きい文字で出力せよというスタイル情報を有している。
【0062】
時間“00:10:00”では、テキストのレンダリングに使われる情報としてstylegroup“Title”が使われ、stylegroup“Title”が含むstyle“Small”、“Normal”、“Large”のうちデフォルトstyle“Small”のスタイル情報が使われている。映画再生中にユーザによってテキストスタイルがstyle“Normal”に変更される瞬間からは、stylegroup“Title”のstyle“Normal”のスタイル情報が使われる。また、映画が進められて時間“00:10:20”となってstylegroupが変わる場合、stylegroup“Script”のstyle“Normal”が使われ、時間“01:10:25”でstylegroup“Casting”に変更された場合にも、stylegroup“Casting”のstyleのうち、ユーザによって選択されたstyle“Normal”が継続的に適用される。
【0063】
図7Bは、stylegroup変更命令によってstylegroupが変更されることを説明する図である。図7Bを参照するに、stylegroup“Small”、“Normal”、“Large”が定義されており、各stylegroupは、style“Title”、“Script”、“Casting”を含む。時間“00:10:00”では、テキストのレンダリングに使われる情報としてデフォルトstylegroup“Small”が含むstyleのうち、style“Title”のスタイル情報が使われている。映画再生中にユーザによってstylegroupが“Small”から“Normal”に変更される瞬間からは、stylegroup“Normal”のstyle“Title”のスタイル情報が使われる。また、映画が進められて時間“00:10:20”となってstyleが“Title”から“Script”に変わる場合、stylegroup“Normal”のstyle“Script”が使われ、時間“01:10:25”でstyleが“Casting”に変更された場合にも、ユーザによって指定されたstylegroup“Normal”が含んでいるstyle“Casting”が適用される。
【0064】
図8Aは、図4Aのように構成されたプレゼンテーション情報で、各字幕項目をレンダリングするために必要なスタイル情報を選択することを示す図である。
【0065】
Dialog情報の各字幕は、stylesetに含まれている一つ以上のstylegroupのうち一つを指示している。そして、各stylegroupが含んでいる一つ以上のstyleのうち一つが選択されるが、ユーザの選択がない場合には、default styleとして“Normal”styleが選択され、ユーザの選択がある場合には、当該styleが選択される。
【0066】
字幕“Text1”をレンダリングするのに使われるスタイル情報を構成する過程を説明すれば、まず字幕“Text1”は、“Title”stylegroupを指示しているので、stylegroup“Title”が含んでいる、ユーザの選択によって変更されないnon−selectable informationが選択され、またユーザによってstyle“Large”が選択されたので、stylegroup“Title”に含まれているstyleのうち、style“Large”が含んでいるユーザの選択によって変更されるselectable informationが選択されて、stylegroup“Title”のnon−selectable informationとstylegroup“Title”のstyle“Large”のselectable informationとが合わせられて完全なスタイル情報を構成する。
【0067】
また、字幕“Text2”をレンダリングするのに使われるスタイル情報を構成する過程を説明すれば、まず字幕“Text2”は、“Script”stylegroupを指示しているので、stylegroup“Script”が含んでいる、ユーザの選択によって変更されないnon−selectable informationが選択され、またユーザによってstyle“Large”が選択されたので、stylegroup“Title”に含まれているstyleのうち、style“Large”が含んでいるユーザの選択によって変更されるselectable informationが選択されて、stylegroup“Script”のnon−selectable informationとstylegroup“Script”のstyle“Large”のselectable informationとが合わせられて完全なスタイル情報を構成する。
【0068】
以下、図8B及び図8Cを参照して、図4Bのように構成されたプレゼンテーション情報で、各字幕項目をレンダリングするために必要なスタイル情報を構成する過程を説明する。
【0069】
図8B及び図8Cは、図4Bのように構成されたプレゼンテーション情報で、各字幕項目をレンダリングするために必要なスタイル情報を選択することを示す図である。
【0070】
図8Bは、ユーザによってstyleが変更されない場合、字幕テキストをレンダリングするために必要な一つの完全なスタイル情報を構成する過程を説明するものであって、Dialog情報の各字幕は、stylesetに含まれている一つ以上のstylegroupのうち一つを指示している。ユーザによるスタイル変更のない場合には、各字幕が指示しているstylegroupが含んでいる字幕テキストをレンダリングするために必要な全てのスタイル情報(Text Renderingのための情報)が使われて、一つの完全なスタイル情報を構成し、ユーザによるスタイル変更のある場合には、各stylegroupが含んでいる一つ以上のstyleのうち一つが選択されて、stylegroupが含んでいるText Renderingのための情報にユーザによって選択されたstyleが含んでいる情報が適用されて、一つの完全なスタイル情報を構成する。
【0071】
図8Bを参照するに、字幕“Text1”は、“Title”stylegroupを指示しているので、stylegroup“Title”が含んでいるText Renderingのための情報が選択されて、字幕テキストをレンダリングするのに使われる一つの完全なスタイル情報を構成する。
【0072】
そして、字幕“Text2”は、“Script”stylegroupを指示しているので、stylegroup“Script”が含んでいるText Renderingのための情報が選択されて、字幕テキストをレンダリングするのに使われる一つの完全なスタイル情報を構成する。
【0073】
図8Cは、ユーザによってstyleが変更された場合、字幕テキストをレンダリングするために必要な一つの完全なスタイル情報を構成する過程を示す図であって、字幕“Text1”は、“Title”stylegroupを指示しているので、stylegroup“Title”が含んでいるText Renderingのための情報が選択され、またユーザによってstyle“Large”が選択されたので、stylegroup“Title”に含まれているstyleのうち、style“Large”が含んでいる、ユーザの選択によって変更されるselectable informationが選択されて、stylegroup“Title”のText Renderingのための情報にstylegroup“Title”のstyle“Large”のselectable informationが適用されて完全なスタイル情報を構成する。
【0074】
また、字幕“Text2”をレンダリングするのに使われるスタイル情報を構成する過程を説明すれば、まず字幕“Text2”は、“Script”stylegroupを指示しているので、stylegroup“Script”が含んでいるText Renderingのための情報が選択され、またユーザによってstyle“Large”が選択されたので、stylegroup“Title”に含まれているstyleのうち、style“Large”が含んでいるユーザの選択によって変更されるselectable informationが選択されて、stylegroup“Script”のText Renderingのための情報にstylegroup“Script”のstyle“Large”のselectable informationが適用されて完全なスタイル情報を構成する。
【0075】
図9は、本発明のテキスト基盤のサブタイトルの処理装置のブロック図である。
【0076】
テキスト基盤のサブタイトルを処理するためには、テキストをレンダリングするためのテキストサブタイトル処理部920が必要である。テキストサブタイトル処理部920は、サブタイトルからプレゼンテーション情報とダイアログ情報とを抽出するためのテキストサブタイトルパーサ921と、抽出されたプレゼンテーション情報によってテキストをレンダリングして出力されるイメージを生成するテキストイメージ生成部922とを備える。
【0077】
テキスト基盤のサブタイトル情報とフォント情報とがディスク900から読出されてバッファ910にロードされた後、サブタイトルは、サブタイトル処理部920内のテキストサブタイトルパーサ921に伝送されて、プレゼンテーション情報とダイアログ情報とが抽出される。抽出された情報は、テキストイメージ生成部922とプレゼンテーションエンジン930との構成バッファ933に伝送される。テキストイメージ生成部922は、テキストサブタイトルパーサ921から伝送されたスタイル情報とフォント情報とを利用して、テキストをレンダリングしてディスプレイ装置に出力されるイメージを生成し、これをプレゼンテーションエンジン930のオブジェクトバッファ934に伝送する。
【0078】
一方、ディスク900から読出されたビットマップイメージ形態のサブタイトルは、コーデッドデータバッファ931に入力され、グラフィック処理部932によって処理されて構成バッファ933とオブジェクトバッファ934とに伝送される。構成バッファ933は、テキストサブタイトルパーサ921から伝送されたオブジェクト構成情報と、グラフィック処理部932によって処理されたビットマップサブタイトルデータとを入力されて、画面出力用制御情報をグラフィック制御部935に伝送する。オブジェクトバッファ934は、グラフィック処理部932によって処理されたビットマップサブタイトルデータとテキストイメージ生成部922から受信したレンダリングされたテキストサブタイトルオブジェクトとを合わせて、グラフィックプレーン940に作ってCLUT(Color LookUp Table)950を参照してディスプレイ装置に出力される。
【0079】
図10は、本発明のテキスト基盤のサブタイトル処理方法のフローチャートである。
【0080】
ディスクからテキスト基盤のサブタイトルデータとフォントデータとを読出してバッファに保存する(S1010)。一方、ビットマップイメージ形態のサブタイトルデータは、プレゼンテーションエンジンに伝達する。保存されたサブタイトルデータからプレゼンテーション情報とダイアログ情報とを抽出する(S1020)。プレゼンテーション情報とダイアログ情報とは、前述した通りである。抽出されたプレゼンテーション情報とダイアログ情報とを利用して、テキストをレンダリングしてイメージを生成する(S1030)。前記プレゼンテーションエンジンに伝えられたビットマップイメージ形態のサブタイトルデータと前記レンダリングされて生成されたイメージとを組合わせて出力する(S1040)。プレゼンテーションエンジンで組合わせる過程は、図9を参照して説明した通りである。
【0081】
以上で、動画についての字幕をディスプレイするために、テキスト形式に構成されたテキストサブタイトルでテキストをレンダリングして画面上に出力するためのスタイルを構成することについて説明した。本発明では、ユーザによって選択可能な複数のスタイルを製作者が提供し、字幕の出力時にユーザが複数のスタイルのうち一つを選択して字幕の出力スタイルを変更する。
【0082】
したがって、本発明の意図に違反されない範囲内で、本発明で言及したstyleset、stylegroup、styleには、動画についての字幕を提供するために必要な情報を記録するためのフィールドが追加的に含まれうる。すなわち、本発明で説明したstylesetには、stylegroupのみを含んでいるが、stylegroup以外にスタイル情報を表すための情報の付加的なデータを記録するためのフィールドが追加され、本発明で説明したstylegroup及びstyleも他のフィールドを追加的に有し、stylegroupとstyleとが含んでいる各フィールドは、テキストサブタイトルの具現方式によってその位置が変更されうる。
【0083】
本発明はまた、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現することができる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読取られるデータが保存される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがあり、またキャリアウェーブ(例えば、インターネットを通じた伝送)の形態に具現されるものも含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードが保存されかつ実行されうる。
【0084】
以上、本発明についてその望ましい実施形態を中心に説明した。当業者は、本発明が本発明の本質的な特性から逸脱しない範囲内で変形された形態に具現されうるということが分かる。したがって、開示された実施形態は、限定的な観点でなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明でなく、特許請求の範囲に現れており、それと同等な範囲内にある全ての差異点は、本発明に含まれていると解釈されねばならない。
【産業上の利用可能性】
【0085】
本発明は、サブタイトルの出力スタイルをstylegroup及びstylegroupに含まれたstyleと定義し、映画字幕の各文章があらかじめ定義されているstylegroupを指定する方式またはstyleを指定する方式を使用してサブタイトルのデータ量とサブタイトルの出力時に処理せねばならないデータ量とを大きく減らせる。
【0086】
また、サブタイトルの出力形式をstylegroupに指定するか、またはstyleに指定して、ユーザによって任意に変更されないようにできて、製作者の意図を効果的に反映できる。そして、styleをユーザが選択するか、またはstylegroupをユーザが選択するようにできて、ユーザの所望する出力スタイルをユーザが選択できる。
【符号の説明】
【0087】
100 テキストサブタイトルファイル
110 ダイアローグ情報
120 プレゼンテーション情報
130 メタデータ
210 出力領域
221 出力開始位置
222 テキスト整列
230 フォントサイズ
240 行間隔
250 背景色
260 テキスト色
270 フォント名
280 フォーマッティングコード
290 キャラクタデータ
900 ディスク
910 バッファ
920 テキストサブタイトル処理部
921 テキストサブタイトルパーサ
922 テキストイメージ生成部
930 プレゼンテーションエンジン
931 コーデッドデータバッファ
932 グラフィック処理部
933 構成バッファ
934 オブジェクトバッファ
935 グラフィック制御部
940 グラフィックプレーン
950 CLUT

【特許請求の範囲】
【請求項1】
スタイルセット及びダイアログセットを保存するための情報記録媒体を用いることによりサブタイトルを提供するための方法において、
前記スタイルセット及び前記ダイアログセットを抽出する抽出ステップ;及び
前記スタイルセット及び前記ダイアログセットを用いることにより前記サブタイトルを出力する出力ステップを含み、
前記スタイルセットは、前記再生装置を介して表現されるべき字幕テキストのレンダリングに使われる第1スタイル情報及び前記第1スタイル情報を変更させる第2スタイル情報を含み、且つ
前記ダイアログセットは、前記サブタイトルの字幕テキスト情報を含むことを特徴とする方法。
【請求項2】
前記複数の第2スタイル情報は、ユーザーの選択により変えられることを特徴とする請求項1に記載の方法。
【請求項3】
前記第2スタイル情報は、前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値に加えることにより又は前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値から引き算することにより前記第1スタイル情報を変えることを特徴とする請求項1に記載の方法。
【請求項4】
スタイルセット及びダイアログセットを保存するための情報記録媒体を用いることによりサブタイトルを提供するための方法において、
前記スタイルセット及び前記ダイアログセットを抽出する抽出ステップ;及び
前記スタイルセット及び前記ダイアログセットを用いることによりサブタイトルを出力する出力ステップを含み、
前記スタイルセットは、前記再生装置を介して表現されるべき字幕テキストのレンダリングに使われる第1スタイル情報及び前記第1スタイル情報を変更させる複数の第2スタイル情報を含み、且つ
前記ダイアログセットは、前記サブタイトルの字幕テキスト情報を含むことを特徴とする方法。
【請求項5】
前記複数の第2スタイル情報は、ユーザーの選択により変えられることを特徴とする請求項4に記載の方法。
【請求項6】
前記複数の第2スタイル情報は、前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値に加えることにより又は前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値から引き算することにより前記第1スタイル情報を変えることを特徴とする請求項4に記載の方法。
【請求項7】
スタイルセット及びダイアログセットを保存するための情報記録媒体を用いることによりサブタイトルを提供するための方法において、
前記スタイルセット及び前記ダイアログセットを抽出する抽出ステップ;及び
前記スタイルセット及びダイアログセットを用いることにより前記サブタイトルを出力する出力ステップを含み、
前記スタイルセットは、IDにより同一確認され、前記再生装置を介して表現されるべき字幕テキストのレンダリングに使われる第1スタイル情報、及び前記第1スタイル情報を変更させる第2スタイル情報を含み、且つ
前記ダイアログセットは、前記サブタイトルの字幕テキスト情報及び前記第1スタイル情報の前記IDの情報を含むことを特徴とする方法。
【請求項8】
前記第2スタイル情報は、ユーザーの選択により変えられることを特徴とする請求項7に記載の方法。
【請求項9】
前記第2スタイル情報は、前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値に加えることにより又は前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値から引き算することにより前記第1スタイル情報を変えることを特徴とする請求項7に記載の方法。
【請求項10】
スタイルセット及びダイアログセットを保存するための情報記録媒体を用いることによりサブタイトルを提供するための方法において、
前記スタイルセット及び前記ダイアログセットを抽出する抽出ステップ;及び
前記スタイルセット及び前記ダイアログセットを用いることにより前記サブタイトルを出力する出力ステップを含み、
前記スタイルセットは、IDにより同一確認され、前記再生装置を介して表現されるべき字幕テキストのレンダリングに使われる第1スタイル情報、及び前記第1スタイル情報を変更させる複数の第2スタイル情報を含み、且つ
前記ダイアログセットは、前記サブタイトルの字幕テキスト情報及び前記第1スタイル情報の前記IDの情報を含むことを特徴とする方法。
【請求項11】
前記複数の第2スタイル情報は、ユーザーの選択により変えられることを特徴とする請求項10に記載の方法。
【請求項12】
前記複数の第2スタイル情報は、前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値に加えることにより又は前記第2スタイル情報に含まれた値を前記第2スタイル情報に含まれた値から引き算することにより前記第1スタイル情報を変えることを特徴とする請求項10に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図8C】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2009−301704(P2009−301704A)
【公開日】平成21年12月24日(2009.12.24)
【国際特許分類】
【出願番号】特願2009−219744(P2009−219744)
【出願日】平成21年9月24日(2009.9.24)
【分割の表示】特願2006−532080(P2006−532080)の分割
【原出願日】平成16年9月30日(2004.9.30)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】