説明

受信装置、通信システム、立体画像への字幕合成方法、プログラム、及びデータ構造

【課題】立体映像に対して字幕の奥行き方向の位置を最適に設定する。
【解決手段】放送信号に含まれる立体映像のデータを取得するビデオデコーダ108と、放送信号に含まれる字幕オブジェクトのデータを取得する字幕デコーダ110と、前記立体映像の奥行き方向の位置に関する位置情報を取得する番組情報処理部106と、立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する字幕3D変換部120と、を備える。これにより、立体映像に対して字幕の奥行き方向の位置を最適に設定することが可能となる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、受信装置、通信システム、立体画像への字幕合成方法、プログラム、及びデータ構造に関する。
【背景技術】
【0002】
従来、例えば下記の特許文献1には、字幕データに基づく字幕をユーザからどの位の位置に表示するかを示す距離パラメータを発生し、復号側の立体表示装置において、字幕をユーザから所定の奥行き方向の位置にあるように表示する手法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−274125号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、立体映像に字幕を挿入する場合、表示画面の奥行き方向において、映像に対する字幕の表示位置が重要となる。映像に対する字幕の表示位置が適切でない場合、例えば立体映像よりも奥に字幕が表示されるような場合は、字幕が映像の中に埋め込まれているように感じるため、視聴者に違和感を与えてしまう問題がある。
【0005】
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、立体映像に対して字幕の奥行き方向の位置を最適に設定することが可能な、新規かつ改良された受信装置、通信システム、立体画像への字幕合成方法、プログラム、及びデータ構造を提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明のある観点によれば、放送信号に含まれる立体映像のデータを取得する立体映像取得部と、前記放送信号に含まれる字幕オブジェクトのデータを取得する字幕取得部と、前記立体映像の奥行き方向の位置に関する位置情報を取得する位置情報取得部と、前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する字幕位置処理部と、を備える、受信装置が提供される。
【0007】
また、前記位置情報は、前記立体映像を構成する右目用映像と左目用映像のオフセット量であってもよい。
【0008】
また、前記位置情報は、前記放送信号の番組情報に含まれるものであってもよい。
【0009】
また、前記位置情報は、前記放送信号の配信側において番組コンテンツ毎に予め設定されるものであってもよい。
【0010】
また、前記位置情報は、前記立体映像を構成する映像信号のストリームに含まれるものであってもよい。
【0011】
また、前記位置情報は、字幕オブジェクトの奥行き方向の位置を指定する情報であり、字幕オブジェクトのテキスト情報を規定する字幕情報に含まれるものであってもよい。
【0012】
また、複数の前記位置情報に基づいて、1つの字幕オブジェクトの中で奥行き方向の位置が可変されるものであってもよい。
【0013】
また、複数の前記位置情報に基づいて字幕オブジェクトの奥行き方向の位置が動的に変化するものであってもよい。
【0014】
また、前記字幕オブジェクトの奥行き方向の位置が動的に変化する際の拡大率が前記位置情報によって規定されるものであってもよい。
【0015】
また、上記課題を解決するために、本発明の別の観点によれば、立体映像の奥行き方向の位置に関する位置情報を含む放送信号を送出する送信装置と、前記放送信号に含まれる立体映像のデータを取得する立体映像取得部と、前記放送信号に含まれる字幕オブジェクトのデータを取得する字幕取得部と、前記位置情報を取得する位置情報取得部と、前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する字幕位置処理部と、を有する、受信装置と、を備える通信システムが提供される。
【0016】
また、上記課題を解決するために、本発明の別の観点によれば、放送信号に含まれる立体映像のデータを取得するステップと、前記放送信号に含まれる字幕オブジェクトのデータを取得するステップと、前記立体映像の奥行き方向の位置に関する位置情報を取得するステップと、前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定するステップと、を備える、立体画像への字幕合成方法が提供される。
【0017】
また、上記課題を解決するために、本発明の別の観点によれば、放送信号に含まれる立体映像のデータを取得する手段、前記放送信号に含まれる字幕オブジェクトのデータを取得する手段、前記立体映像の奥行き方向の位置に関する位置情報を取得する手段、前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する手段、としてコンピュータを機能させるためのプログラムが提供される。
【0018】
また、上記課題を解決するために、本発明の別の観点によれば、放送する立体映像コンテンツに係る映像信号と字幕オブジェクトのデータとを含むデジタル放送信号のデータ構造であって、放送信号に含まれる立体映像のデータを取得する手段、前記放送信号に含まれる字幕オブジェクトのデータを取得する手段、前記立体映像の奥行き方向の位置に関する位置情報を取得する手段、前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する手段、として受信装置を機能させるためのデジタル放送信号のデータ構造が提供される。
【発明の効果】
【0019】
本発明によれば、立体映像に対して字幕の奥行き方向の位置を最適に設定することが可能となる。
【図面の簡単な説明】
【0020】
【図1】第1の実施形態に係る受信装置100の構成を示す模式図である。
【図2】字幕3D変換処理部及び合成部で行われる処理を示す模式図である。
【図3】表示ディスプレイの表示画面に右目用映像Rと左目用映像Lが表示された際に、3D映像の奥行き方向の位置(飛び出し量)とオフセット量Soとの関係を示す図である。
【図4】字幕の最適な奥行き方向の位置について説明するための模式図である。
【図5】オフセット値Soと深さDoとの関係を示す模式図である。
【図6】オフセット値Soと深さDoとの関係を示す模式図である。
【図7】映像の最大のオフセット情報に基づいて字幕のオフセット量を設定する手法を示す模式図である。
【図8】デジタル放送信号における映像情報ストリーム、番組情報ストリーム、及び字幕情報ストリームを示す模式図である。
【図9】番組単位ではなく、GOP単位で、Video ESのヘッダまたはPESヘッダの拡張領域に、最大オフセット値を記述する例を示す模式図である。
【図10】第2の実施形態に係る字幕の3D表示の一例を示す模式図である。
【図11】字幕の位置制御の手法を示す模式図である。
【図12】第2の実施形態に係る受信装置の構成を示す模式図である。
【図13】第2の実施形態にかかる字幕3Dの特殊効果を示す模式図である。
【図14】字幕3D特殊効果の他の例を示す模式図である。
【図15】字幕3D特殊効果として、字幕オブジェクトを表示画面の奥から手前側に移動させる例を示す模式図である。
【図16】図15の例において、字幕オブジェクトのダイナミックな移動による表示サイズの変化を説明するための模式図である。
【図17】特殊効果指定も含む字幕情報のフォーマット例を示す模式図である。
【図18】放送局200側で3D映像の右目用映像R、左目用映像Lを撮影する手法を示す模式図である。
【発明を実施するための形態】
【0021】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0022】
なお、説明は以下の順序で行うものとする。
1.第1の実施形態
(1)本実施形態に係るシステムの構成
(2)字幕3D変換処理部及び合成部で行われる処理
(3)オフセット量Soを設定する具体的手法
2.第2の実施形態
(1)字幕オブジェクト単位でのオフセット量の設定
(2)第2の実施形態に係る受信装置の構成
(3)字幕3D特殊効果について
(4)放送局側で3D映像を撮影する手法
【0023】
1.第1の実施形態
(1)本実施形態に係るシステムの構成
図1は、第1の実施形態に係る受信装置100の構成を示す模式図である。受信装置100は、例えば、デジタル放送信号によって受信したテレビ番組などのコンテンツを視聴するためのユーザ側の装置であり、受信した映像を表示画面上に表示し、音声を出力する。受信装置100は、例えば、サイド・バイ・サイド方式、トップ・アンド・ボトム方式による3D映像と、通常の2D映像を受信して表示することができる。なお、3D映像の方式については、サイド・バイ・サイド方式、トップ・アンド・ボトム方式以外のものであってもよい。
【0024】
図1に示すように、受信装置100は、復調処理部(デモジュレータ;Demod)102、Demux104、番組情報処理部106、ビデオデコーダ(Video Decoder)108、字幕デコーダ(Caption Decoder)110を備える。また、受信装置100は、オーディオデコーダ(Audio Decoder)112、アプリOSD処理部114,合成部116、3D変換処理部118、字幕(Caption)3D変換処理部120、ディスプレイ122、スピーカ(SP)124を備える。
【0025】
図1に示すように、放送局200から送信された放送波はアンテナ250で受信されて、受信装置100のデモジュレータ102に送られる。本実施形態では、放送波によって所定の3D方式による3Dの映像データが受信装置100に送られるものとする。ここで、3D方式としては、トップ・アンド・ボトム方式、サイド・バイ・サイド方式などが挙げられるが、これらに限定されるものではない。
【0026】
デジタル放送の場合は、例えばH.222 ISO/IEC IS 13818-1 Information Technology − Generic Coding of Moving Pictures and Associated Audio Information: Systemのトランスポートストリーム(Transport Stream)を使用して、ビデオ、オーディオ、EPGデータ等を送出し、受信装置はそれを受信して画像、音声、システムデータに分離して、画像、音声を表示する。
【0027】
受信装置100のデモジュレータ102では、変調された信号を復調し、データストリームを生成する。これにより、パケット列のデータがDEMUX104に送られる。
【0028】
DEMUX104では、データストリームをフィルタリングし、番組情報データ、映像データ、字幕データ、音声データに分ける。そして、DEMUX104は、映像データをビデオデコーダ108に送るとともに、音声データをオーディオデコーダ112へ送る。また、DEMUX104は、番組情報データを番組情報処理部106へ送るとともに、字幕データを字幕デコーダ110へ送る。
【0029】
ビデオデコーダ108は、入力された映像データをデコードして、合成部116に送る。また、字幕デコーダ110は、字幕データをデコードして字幕3D変換部120に送る。また、番組情報処理部106は、番組情報をデコードし、番組情報に含まれるオフセット量Soを字幕3D変換部120に送る。なお、オフセット量Soについては後で詳細に説明する。
【0030】
オーディオデコーダ112は、入力された音声データをデコードして、スピーカ124に送る。スピーカ124は、入力された音声データにより音声を発生させる。
【0031】
上述したように放送局200からは、トップ・アンド・ボトム方式などによる3D映像の映像データが送られる。このため、ビデオデコーダ108でデコードされた映像は、トップ・アンド・ボトム方式の場合、図1に示すように、右目用映像Rと左目用映像Lが縦方向に配列された映像400となる。また、サイド・バイ・サイド方式の場合、ビデオデコーダ108でデコードされた映像は、右目用映像Rと左目用映像Lが水平方向に配列された映像450となる。
【0032】
合成部116では、トップ・アンド・ボトム方式などによる3D映像に対して字幕データを付加する処理を行う。この際、右目用映像Rと左目用映像Lのそれぞれに同じ字幕が付加され、後で詳細に説明するが、右目用映像Rと左目用映像Lのそれぞれに付加される字幕は、オフセット量Soに基づいてその位置が互いにオフセットされる。
【0033】
また、番組情報処理部106は、番組情報に含まれるオフセット量SoをアプリOSD処理部114に送る。アプリOSD処理部114では、映像に挿入するロゴ、メッセージなどを作成し、合成部116に送る。合成部116は、3D映像に対してアプリOSD処理部114で作成されたロゴ、メッセージ等を付加する処理を行う。この際、右目用映像Rと左目用映像Lのそれぞれに同じロゴ、メッセージ等を付加し、右目用映像Rと左目用映像Lのそれぞれに付加されるロゴ、メッセージ等は、オフセット量Soに基づいてその位置が互いにオフセットさせる。
【0034】
字幕、またはロゴ、メッセージ等が付加された映像データは、3D変換処理部118に送られる。3D変換処理部118では、映像データを例えば240kHzなどのハイフレームレートで表示するようにフレームレートを設定し、表示ディスプレイ122へ出力する。表示ディスプレイ122は、例えば液晶パネルなどから構成されるディスプレイであり、入力されたハイフレームレートの3D映像を表示する。
【0035】
なお、図1に示す各構成要素は、ハードウェア(回路)、または中央演算処理装置(CPU)とこれを機能させるためのプログラム(ソフトウェア)によって構成することができる。
【0036】
(2)字幕3D変換処理部及び合成部で行われる処理
次に、字幕3D変換処理部120及び合成部116で行われる処理について詳細に説明する。図2は、字幕3D変換処理部120及び合成部116で行われる処理を示す模式図である。図2に示すように、字幕デコーダ110でデコードされて得られた字幕オブジェクト150は、右目用映像Rと左目用映像Lのそれぞれに付加される。ここでは、右目用映像Rに字幕オブジェクト150Rが付加され、左目用映像Lに字幕オブジェクト150Lが付加されるものとする。なお、図2では、サイド・バイ・サイド方式の場合と、トップ・アンド・ボトム方式のそれぞれにおいて、字幕オブジェクト150が付加される様子を示している。
【0037】
字幕3D変換処理部120では、3D映像における字幕の奥行き方向の位置(飛び出し量)を調整するため、右目用映像Rに付加される字幕オブジェクト150Rと左目用映像Lに付加される字幕オブジェクト150Lとをオフセット量Soだけオフセットさせる。上述したように、オフセット量Soは、番組情報処理部106にて番組情報EITから抽出されて字幕3D変換部120へ送られる。そして、このオフセット量Soの値を適宜設定することで、視聴者が3D映像を見た際に、表示ディスプレイ122の表示画面に対する字幕の奥行き方向の位置を自在に設定することができる。合成部116は、字幕3D変換部120で指定されたオフセット量Soに基づいて字幕オブジェクト150Rと字幕オブジェクト150Lをオフセットして、右目用映像R及び左目用映像Lのそれぞれに付加する。
【0038】
以下、オフセット量Soにより表示画面に対する字幕の奥行き方向の位置を設定する手法について詳細に説明する。図3は、表示ディスプレイ122の表示画面に右目用映像Rと左目用映像Lが表示された際に、3D映像の奥行き方向の位置(飛び出し量)とオフセット量Soとの関係を示す図である。また、図3は、表示ディスプレイ122の表示画面及び視聴者(Man)を上方向から見た状態を模式的に示した図である。図3に示すように、立体映像を表示するため、表示画面には右目用映像Rと左目用映像Lが表示される。
【0039】
図3において、表示画面上で右目用映像Rが左目用映像Lよりも左にオフセットしている場合は、ユーザには、3D映像が表示ディスプレイ122の表示画面よりも前に飛び出しているように見える。また、表示画面上で右目用映像Rが左目用映像Lよりも右にオフセットしている場合は、ユーザには、3D映像が表示画面よりも奥に位置しているように見える。また、右目用映像と左目用映像Rとがオフセットしていない場合は、映像が表示画面の位置に見える。
【0040】
従って、図3において、右目用映像R1と左目用映像L1によって表示される立体映像3D1は、視聴者にとっては表示画面上に位置するように見える。また、右目用映像R2と左目用映像L2によって表示される立体映像3D2は、表示画面よりも手前側に飛び出して見える。また、右目用映像R3と左目用映像L3によって表示される立体映像3D3は、表示画面よりも奥側に位置しているように見える。従って、視聴者には、図3中に曲線で示す位置に3D映像によって表示された物体が位置しているように見える。このように、表示画面上で右目用映像R1と左目用映像L1との間にオフセットを持たせることで、図2中の実線の曲線で示すように、立体映像の表示画面に対する奥行き方向の位置を規定することができる。
【0041】
3D映像の奥行き方向の位置は、ユーザの右目と右目用映像Rを結ぶ直線LRと、ユーザの左目と左目用映像Rを結ぶ直線LLとの交点の位置となる。従って、オフセット量Soにより、物体の位置を表示画面からの飛び出し量を自由に設定することが可能である。なお、以下の説明では、立体映像の表示画面の奥行き方向の位置を深さDoで表すものとし、Do>0の場合は映像の位置が表示画面よりも手前に見えるものとし、Do<0の場合は映像の位置が表示画面よりも奥に見えるものとする。
【0042】
本実施形態において、字幕3D変換処理部120は、番組情報から抽出されたオフセット量Soを用いて字幕の奥行き方向の位置を決定して表示する。オフセット量Soは、放送局200側で映像のコンテンツに応じて決定され、番組情報に挿入される。
【0043】
図4は、字幕の最適な奥行き方向の位置について説明するための模式図である。図4に示すように、字幕は3D映像の最も飛び出した位置よりも手前(ユーザ側)に表示することが望ましい。これは、字幕が3D映像の最も飛び出した位置よりも奥に位置していると、映像に字幕が埋め込まれて見えるため、映像が不自然になるためである。
【0044】
図5及び図6は、オフセット値Soと深さDoとの関係を示す模式図である。ここで、図5は、3D映像で表示された物体が表示画面よりも手前に位置して見える場合を示している。また、図6は、3D映像で表示された物体が表示画面よりも奥に位置して見える場合を示している。
【0045】
オフセット量Soは、表示ディスプレイ122の画素数で表すものとすると、以下の数式(1)によりオフセット量Soを求めることができる。
So=Do×(We/(Dm−Do))×(Ss/Ws) ・・・(1)
数式(1)において、Weは視聴者の左右の眼の距離、Dmは視聴者の眼から表示ディスク122の表示画面までの距離、Ssは表示ディスプレイ122の横方向の画素数、Wsは表示ディスプレイ122の横幅をそれぞれ示している。
【0046】
数式(1)において、Doは物体の奥行き方向の位置を示しており、Do>0の場合は、物体が表示画面よりも手前側に位置している状態となる。また、Do<0の場合は、物体が表示画面よりも奥に位置している状態となる。また、Do=0の場合は、物体が表示画面上に位置している状態となる。また、オフセット量Soは、左目用映像Lを基準とし、左目用映像Lから右目用映像Rまでの距離を表すものとし、図5及び図6において、右から左に向かう方向をプラス方向とする。従って、図5の場合はSo≧0であり、図6の場合はSo<0である。このようにDoとSoの符号+,−を設定することで、物体が表示画面の手前側に表示される場合と奥側に表示される場合の双方において、数式(1)によりオフセット量Soを求めることができる。以上のように、数式(1)によれば、表示画面に対する字幕の奥行き方向の位置Doとオフセット量Soの関係を規定することができる。
【0047】
(3)オフセット量Soを設定する具体的手法
次に、字幕のオフセット量Soを設定する具体的手法について説明する。図7は、映像の最大のオフセット情報に基づいて字幕のオフセット量を設定する手法を示す模式図である。図7は、ある番組の映像が表示されている最中に、ビデオデコーダ108でデコードされて表示ディスプレイ122に表示される映像コンテンツについて、曲線で示す表示位置の奥行きDoの最大値が時系列に変化する様子を示している。図7は、図3等と同様に、表示ディスプレイ122の表示画面を上方向から見た状態を示している。
【0048】
図7に示すように、時間の経過に伴って映像コンテンツの奥行きはDo1、Do2、Do3、Do4、Do5のように順次変化する。また、これに伴い、右目用映像Rと左目用映像Lのオフセット量も、So1、So2、So3、So4、So5のように順次変化する。
【0049】
そして、図7に示す手法では、放送局200側において、ある番組内で最も奥行きの位置が手前になる映像(3D映像として最も手前に飛び出した映像)を抽出する。図7の例では、奥行きがDo3となる映像が最も手前に位置する映像となり、So3の値がプラス側に最も大きいオフセット量として抽出される。抽出された最大のオフセット量So3は、デジタル放送フォーマットの番組情報(例えばEITpf、EPGデータ等)の中に挿入され、映像データ等とともに受信装置100に伝送される。
【0050】
受信装置100は、番組情報処理部106において、番組情報をデコードし、番組情報の中からオフセット量So3を抽出すると、字幕3D変換部120にてこのオフセットSo3よりもプラス側に大きいオフセット量を設定する。合成部116は、設定されたオフセット量に基づいて、字幕を右目用映像R及び左目用映像Lに合成する。このようにして、放送局200から送られたオフセット量So3よりも大きいオフセット量で字幕を表示することにより、字幕を映像コンテンツよりも手前側に表示することができ、視聴者が違和感をもつことがなく、適正な表示を実現できる。
【0051】
図8は、デジタル放送信号における映像情報ストリーム、番組情報ストリーム、及び字幕情報ストリームを示す模式図である。図8に示すように、番組1の映像情報ストリームを受信している場合、これに対応して番組1の番組情報と、番組1の次に放送される番組2の番組情報が受信される。従って、受信装置100は、番組情報から現在視聴している番組のオフセット量Soと、次に視聴する番組のオフセット情報を取得することができる。従って、現在視聴している番組の3D映像内の適正な奥行き方向の位置に字幕オブジェクトを表示できるとともに、次に視聴する番組についても、3D映像内の適正な奥行き方向の位置に字幕オブジェクトを表示できる。
【0052】
また、図8に示す字幕ストリームの字幕データ内にもオフセット量Soを挿入することが可能である。これについては、後述する第2の実施形態で詳細に説明する。
【0053】
また、図9は、番組単位ではなく、GOP単位で、Video ESのヘッダまたはPESヘッダの拡張領域に、最大オフセット値を記述する例を示す模式図である。例えばMPEG2 video(H.222 ISO/IEC IS 13818-1 Information Technology − Generic Coding of Moving Picture and Associated Audio Information: Video)に挿入する場合、同フォーマットで定義されるpicture headerのUser dataエリアに入れることができる。また、シーケンスヘッダ、スライスヘッダ、またはマクロブロックヘッダに3D映像に関するデータを挿入しても良い。この場合、各GOPに記述されるオフセット量Soの値は、So1、So2、So3、So4、So5のように時系列に刻々と変化する。
【0054】
ビデオデコーダ108では、各GOPからオフセット量を逐次取得し、字幕3D変換部120へ送る。字幕3D変換部120では、取得したオフセットSoよりもプラス側に大きいオフセット量を設定し、合成部116にて字幕を右目用映像R及び左目用映像Lに合成する。以上のような構成によれば、GOPのヘッダ毎にオフセット量を切り換えることができるため、映像に応じて字幕の奥行き方向の位置を逐次設定することが可能となる。従って、受信装置100では、映像と同じタイミングで表示される字幕表示において、映像のオフセット値より大きいオフセットで字幕を表示することにより、視聴者に違和感を与えることなく、適正な表示を確保できる。
【0055】
以上説明したように第1の実施形態によれば、放送局200側で放送信号の中に字幕オブジェクト150のオフセット量Soを挿入するようにした。このため、受信装置100側ではオフセット量Soを抽出することによって、3D映像中の最適な奥行き位置に字幕オブジェクト150を配置することが可能となる。
【0056】
2.第2の実施形態
次に、本発明の第2の実施形態について説明する。第2の実施形態は、字幕データに含まれる情報に基づいてオブジェクト単位で3Dの位置制御、特殊効果を行うものである。
【0057】
(1)字幕オブジェクト単位でのオフセット量の設定
図10は、第2の実施形態に係る字幕の3D表示の一例を示す模式図である。図10に示す例では、映像として2人の人物A,Bが表示ディスプレイ122の表示画面に3D表示されている。また、人物A,Bの近傍には、人物A,Bのそれぞれが発している言葉が字幕A,Bとして表示されている。表示画面の下に示された曲線は、各人物A,Bの表示画面位置に対する奥行き方向の位置を示しており、図3等と同様に表示ディスプレイ122を上方向から見た場合の映像の奥行き方向の位置を示している。
【0058】
図10に示すように、人物Aは表示画面よりも手前に位置し、人物Bは表示画面よりも奥に位置している。このような場合において、図10の例では、表示画面内で奥行き位置が異なるそれぞれの映像に合わせて字幕の奥行き位置を設定する。図10の例では、人物Aに関係する字幕Aは、その奥行き方向の位置が人物Aよりも手前側に3D表示される。また、人物Bに関係する字幕Bは、その奥行き方向の位置が人物Bよりも手前側に3D表示される。
【0059】
このように、表示画面に字幕を表示する場合に、字幕が関係する映像のオブジェクト単位で3Dの奥行き方向の位置を制御し、コンテンツに合わせて放送局200(事業者)側で字幕の表示位置を制御するための情報を放送信号の中に挿入する。これにより、映像の各コンテンツの奥行き位置と字幕の奥行き位置を一致させることができるため、視聴者に対して自然な映像を提供することができる。
【0060】
図11は、字幕の位置制御の手法を示す模式図である。字幕オブジェクト150は、水平方向位置Soh、垂直方向位置Sovの2つもパラメータによって表示画面の面方向の位置が制御される。また、第1の実施形態と同様に、オフセット量Sodによって奥行き方向の位置が制御される。図11に示すように、第2の実施形態では、水平方向位置Soh、垂直方向位置Sov、及びオフセット量Sodは、デジタル放送フォーマットの中の字幕情報(字幕データ)の中に含まれている。
【0061】
(2)第2の実施形態に係る受信装置の構成
図12は、第2の実施形態に係る受信装置100の構成を示す模式図である。第2の実施形態に係る受信装置100の基本的な構成は、第1の実施形態に係る受信装置100と同様である。第2の実施形態では、字幕情報の中に含まれる水平方向位置Soh、垂直方向位置Sov、及びオフセット量Sodは、字幕デコーダ110において抽出され、字幕3D変換部120に送られる。水平方向位置Soh及び垂直方向位置Sovは、字幕オブジェクト150の画面内での位置を指定する情報である。図11に示すように、水平方向位置Sohは字幕オブジェクト150の水平方向の位置を、垂直方向位置Sovは字幕オブジェクト150の垂直方向の位置を規定する。また、オフセット量Sodは、第1の実施形態のオフセット量Soに対応し、字幕オブジェクト150の奥行き方向の位置を指定する。字幕3D変換部は、オフセット量Sodに基づいて左右映像の字幕オブジェクト150R,150Lのオフセットを設定することで、字幕オブジェクト150の奥行き位置を指定する。また、字幕3D変換部120は、Soh,Sovに基づいて左右映像の字幕オブジェクト150R,150Lの表示画面内の位置を指定する。合成部116は、字幕3D変換部120で指定されたSoh,Sov,Soに基づいて、字幕オブジェクト150R,150Lを右目用映像R及び左目用映像Lのそれぞれに付加する。これにより、図11に示すように、字幕デコーダ110でデコードされた字幕オブジェクト150は、右目用映像Rと左目用映像Lのそれぞれに対して、水平方向位置Soh、垂直方向位置Sov、及びオフセット量Sodに基づいて、適正な位置に付加される。このように、字幕オブジェクト150の画面位置と共に、3Dの奥行き方向の深さ(depth)をサンプルオフセット値Sodにより字幕データ上で指定することができる。
【0062】
従って、複数の字幕オブジェクト150を表示する場合は、各字幕オブジェクト150について水平方向位置Soh、垂直方向位置Sov、オフセット量Sodを設定する。これにより、各字幕オブジェクト150を映像に合わせた最適な位置に配置することができる。
【0063】
(3)字幕3D特殊効果について
図13は、第2の実施形態にかかる字幕3Dの特殊効果を示す模式図である。上述したように、第2の実施形態では、字幕データの中に含まれるSoh,Sov,Sodにより、左右映像中の字幕オブジェクト150R,150Lの位置を指定する。図13の例は、これを応用して、2つの異なるオフセット量により字幕オブジェクト150の位置を指定するものである。
【0064】
図13に示す例では、「CAPTION」という字幕オブジェクト150を表示する際に、字幕の左側ほど視聴者から見て表示画面よりも手前側に表示されるように3D表示を行う。このため、字幕データの中には、2つのオフセット量Sod11,Sod12が含まれている。
【0065】
図13に示すように、字幕オブジェクト150の左端では、オフセット量Sod11により左右映像中の字幕オブジェクト150のオフセットが規定され、表示画面に対する奥行き方向の位置はDo11となる。一方、字幕オブジェクト150の右側では、オフセット量Sod12により左右映像中の字幕オブジェクト150のオフセットが規定され、表示画面に対する奥行き方向の位置はDo12となる。そして、字幕オブジェクト150の左端と右端の間では、左端または右端からの水平方向の距離に応じて、リニアに奥行き位置が変化するようにオフセット量が受信装置100側で規定される。従って、視聴者は、「CAPTION」の左側ほど手前側に表示され、右側ほど奥に表示された字幕オブジェクト150を見ることができる。
【0066】
また、図14は、字幕3D特殊効果の他の例を示す模式図である。図14に示す例では、字幕オブジェクト150の左右の端部が最も奥側に表示され、字幕オブジェクト150の中央が最も手前側に表示される。このため、図14の例においても、2つの異なるオフセット量により字幕オブジェクトの位置が指定される。
【0067】
図14に示すように、字幕オブジェクト150の左端及び右端では、オフセット量Sod11により左右映像中の字幕オブジェクトのオフセットが規定され、表示画面に対する奥行き方向の位置はDo11となる。一方、字幕オブジェクト150の中央では、オフセット量Sod12により左右映像中の字幕オブジェクト150のオフセットが規定され、表示画面に対する奥行き方向の位置はDo12となる。そして、字幕オブジェクト150の左端と中央の間、及び中央と右端の間では、所定の曲線、またはリニアに奥行き方向の位置が変化するようオフセット量が受信装置100側で規定される。従って、視聴者は、「CAPTION」の左側及び右側ほど奥側に表示され、中央ほど手前側に表示された字幕オブジェクト150を見ることができる。
【0068】
図15は、字幕3D特殊効果として、字幕オブジェクト150を表示画面の奥から手前側に移動させる例を示す模式図である。図15に示す例では、「CAPTION」という字幕オブジェクト150を表示する際に、ある時間内で位置Aから位置Bに移動させ、奥行き方向の位置を奥側から手前側に移動させる。
【0069】
より詳細には、字幕データに含まれる情報により、移動開始位置Aの画面上の位置情報(水平方向位置Soh1、垂直方向位置Sov1)とオフセット量Sod11、及び、移動終了位置Bの画面上の位置情報(水平方向位置Soh2、垂直方向位置Sov2)とオフセット量Sod21、移動スピード(または移動時間moving_time))が指定される。受信装置100側では、さらに、後述する数式(3)で字幕オブジェクト150をスケーリングして、適切な大きさでレンダリングする。
【0070】
図15に示すように、受信装置100では、Soh1,Sov1,Soh2,Sov2に基づいて字幕オブジェクト150を左右映像に合成することにより、字幕オブジェクト150を位置Aから位置Bへ移動させる。また、位置Aでは、オフセット量Sod11により字幕オブジェクト150の奥行き方向の位置がDod11とされ、位置Bではオフセット量Sod21により字幕オブジェクト150の奥行き方向の位置がDo21とされる。これにより、字幕オブジェクト150が位置Aから位置Bへ移動させた際に、奥行き方向の位置を表示画面の奥側から手前側に移動させることができる。
【0071】
図16は、図15の例において、字幕オブジェクト150のダイナミックな移動による表示サイズの変化を説明するための模式図である。字幕等のオブジェクトを奥行き方向で移動させた場合、表示画面上での表示サイズを一定にすると、オブジェクトの手前側への移動に伴って、オブジェクトの見た目のサイズが小さくなる。3Dの奥行き方向の移動に伴う、オブジェクトの見た目でのサイズを不変とするためには、表示画面上での表示領域において、サイズのスケーリングが必要となる。図16は、このスケーリングを説明するための模式図である。
【0072】
ここで、図16(A)は、オブジェクト(ここでは物体Xとする)が表示画面よりも奥に位置している場合を示している(図15の位置Aに相当)。また、図16(B)は、図16(A)の状態から手前側に移動してきた物体Xが、表示画面よりも手前側に位置している場合を示している(図16の位置Bに相当)。図16(A)及び図16(B)において、Trは物体Aの見かけ上の大きさ(横幅)、Toは表示画面上での物体Aの大きさ(横幅)をそれぞれ示している。図16(A)及び図16(B)において、Toは以下の数式(2)で表すことができる。
To=(Dm*Tr)/(Dm−Do) ・・・(2)
【0073】
ここで、位置Aにおける物体Xの横幅をTo1、位置Bにおける物体Xの横幅をTo2とし、To1の値に対するTo2の値をスケーリング率とする。この場合、図16(A)と図16(B)において、見かけ上の物体Xの横幅Trを一定に保つためのスケーリング率は、位置Aと位置Bにおける左右映像のオフセット量So1,So2とその他の固定パラメータより以下の数式(3)で求められる。
To2/To1=(Dm−Do1)/(Dm−Do2)=(Do1・So2)/(Do2・So1)=(We・Ss+Ws・So2)/(We・Ss+Ws・So1)
【0074】
以上のように、スケーリング率はオフセット量So1,So2で規定することができるため、字幕データの中にスケーリング率として新たなパラメータを含める必要はない。但し、位置Aと位置Bにおいて、見かけ上の物体Aの大きさを拡大したい場合等は、その拡大率を表すパラメータを字幕データの中に含めても良い。
【0075】
図17は、以上説明した特殊効果指定も含む字幕情報のフォーマット例を示す模式図である。特殊効果を使う場合は、Sov1,Soh1、text(字幕オブジェクト自体の情報)の情報の他に、3D拡張領域が設けられる。
【0076】
以下、3D拡張領域に含まれる情報について詳細に説明すると、3D拡張領域には、オフセット量Sod11,Sod12,Sod21、スタティック効果フラグ(Static_Effect_flag)、などの情報が含まれる。また、3D拡張領域には、ダイナミック効果フラグ(Dynamic_Effect_flag)、スタティック効果モード(Static_Effect_mode)、ダイナミック効果モード(Dynamic_Effect_mode)、終端垂直方向位置Sov2、終端水平方向位置Soh2、移動時間(moving_time)などの情報が含まれる。
【0077】
スタティック効果フラグが“1”の場合は、図13、図14で説明した特殊効果が実現される。この場合、例えばスタティック効果モードが“0”の場合は図14の特殊効果が実現され、スタティック効果モードが“1”の場合は図15の特殊効果が実現されるものとすることができる。また、この場合、2つのオフセット量Sod11,Sod12が用いられる。
【0078】
また、ダイナミック効果フラグが“1”の場合は、図15、図16で説明した特殊効果が実現される。この場合、例えばダイナミック効果モードが“0”の場合は、図15で説明したような、字幕オブジェクト150が奥側から手前側に移動する特殊効果が実現される。また、例えばダイナミック効果モードが“1”の場合は、字幕オブジェクト150が手前側から奥側に移動する特殊効果が実現される。また、ダイナミック効果モードの値により左右への字幕オブジェクト150の移動を規定しても良い。また、この場合、オフセット量Sod11、オフセット量Sod21は、位置A、位置Bでのオフセット量をそれぞれ規定する。また、終端垂直方向位置Sov2、終端水平方向位置Soh2は、図15の位置Bにおける位置情報である。また、移動時間(moving_time)は、図15で位置Aから位置Bへ移動する時間を規定する情報である。
【0079】
以上のように、受信装置100は、図17に示す字幕データを受信することにより、図13〜図16で説明したような特殊効果を3D映像中で実現することができる。
【0080】
(4)放送局側で3D映像を撮影する手法
図18は、放送局200側で3D映像の右目用映像R、左目用映像Lを撮影する手法を示す模式図である。ここでは、例えばスタジオ内の人物Cを撮影する場合について説明する。図18に示すように、人物Cの手前には、右目用映像Rを撮影するカメラRと左目用映像Lを撮影するカメラLが配置される。そして、カメラRの光軸ORとカメラLの光軸OLとの交点を表示画面位置とする。また、表示画面の横幅をWsとし、表示画面の横方向画素数をSsとし、カメラR,Lから表示画面位置までの距離をDsとし、カメラR,Lから人物Cまでの距離をDoとし、カメラRとカメラLの距離をWcとする。このとき、表示画面位置でのオフセットSoは、以下の数式(4)で表すことができる。
So=Wc*((Ds−Do)/Do)*(Ss/Ws) ・・・(4)
従って、カメラR,Lで撮影した右目用映像R、左目用映像Lを上式で求めたオフセットSoだけオフセットすることにより、表示画面から手前側に飛び出した人物Cの映像を立体映像で表示することができる。
【0081】
以上説明したように第2の実施形態によれば、字幕データの中に字幕オブジェクト150の水平方向位置Soh、垂直方向位置Sov、オフセット量Sodの情報を挿入する。これにより、受信装置100側では、これらの情報に基づいて字幕オブジェクト150を最適に表示することが可能となる。
【0082】
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0083】
100 受信装置
106 番組情報処理部
108 ビデオデコーダ
110 字幕デコーダ
120 字幕3D変換部
200 放送局

【特許請求の範囲】
【請求項1】
放送信号に含まれる立体映像のデータを取得する立体映像取得部と、
前記放送信号に含まれる字幕オブジェクトのデータを取得する字幕取得部と、
前記立体映像の奥行き方向の位置に関する位置情報を取得する位置情報取得部と、
前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する字幕位置処理部と、
を備える、受信装置。
【請求項2】
前記位置情報は、前記立体映像を構成する右目用映像と左目用映像のオフセット量である、請求項1に記載の受信装置。
【請求項3】
前記位置情報は、前記放送信号の番組情報に含まれる、請求項1に記載の受信装置。
【請求項4】
前記位置情報は、前記放送信号の配信側において番組コンテンツ毎に予め設定される、請求項3に記載の受信装置。
【請求項5】
前記位置情報は、前記立体映像を構成する映像信号のストリームに含まれる、請求項1に記載の受信装置。
【請求項6】
前記位置情報は、字幕オブジェクトの奥行き方向の位置を指定する情報であり、字幕オブジェクトのテキスト情報を規定する字幕情報に含まれる、請求項1に記載の受信装置。
【請求項7】
複数の前記位置情報に基づいて、1つの字幕オブジェクトの中で奥行き方向の位置が可変される、請求項6に記載の受信装置。
【請求項8】
複数の前記位置情報に基づいて字幕オブジェクトの奥行き方向の位置が動的に変化する、請求項6に記載の受信装置。
【請求項9】
前記字幕オブジェクトの奥行き方向の位置が動的に変化する際の拡大率が前記位置情報によって規定される、請求項8に記載の受信装置。
【請求項10】
立体映像の奥行き方向の位置に関する位置情報を含む放送信号を送出する送信装置と、
前記放送信号に含まれる立体映像のデータを取得する立体映像取得部と、前記放送信号に含まれる字幕オブジェクトのデータを取得する字幕取得部と、前記位置情報を取得する位置情報取得部と、前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する字幕位置処理部と、を有する、受信装置と、
を備える通信システム。
【請求項11】
放送信号に含まれる立体映像のデータを取得するステップと、
前記放送信号に含まれる字幕オブジェクトのデータを取得するステップと、
前記立体映像の奥行き方向の位置に関する位置情報を取得するステップと、
前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定するステップと、
を備える、立体画像への字幕合成方法。
【請求項12】
放送信号に含まれる立体映像のデータを取得する手段、
前記放送信号に含まれる字幕オブジェクトのデータを取得する手段、
前記立体映像の奥行き方向の位置に関する位置情報を取得する手段、
前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する手段、
としてコンピュータを機能させるためのプログラム。
【請求項13】
放送する立体映像コンテンツに係る映像信号と字幕オブジェクトのデータとを含むデジタル放送信号のデータ構造であって、
放送信号に含まれる立体映像のデータを取得する手段、
前記放送信号に含まれる字幕オブジェクトのデータを取得する手段、
前記立体映像の奥行き方向の位置に関する位置情報を取得する手段、
前記位置情報に基づいて立体映像に対する字幕オブジェクトの奥行き方向の位置を設定する手段、
として受信装置を機能させるためのデジタル放送信号のデータ構造。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公開番号】特開2011−29849(P2011−29849A)
【公開日】平成23年2月10日(2011.2.10)
【国際特許分類】
【出願番号】特願2009−172490(P2009−172490)
【出願日】平成21年7月23日(2009.7.23)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】