説明

受信装置及びその制御方法

【課題】受信装置の能力や機能に応じて、画面の一部(放送局が指定する代表画面やユーザが選択する画面)を切り出して視聴しても、切り出し視聴している画面の位置や画角に応じてマルチチャンネル音像を適切に保つことができる受信装置およびその制御方法を提供する。
【解決手段】受信装置が、複数チャンネルの音声を伴う第1の映像を受信する受信部102と、前記第1の映像の一部を切り出して第2の映像を出力する映像出力制御部109と、前記第2の映像と共に出力するための出力音声を生成する音声出力制御部111と、を備える。受信装置は、前記第2の映像の切り出し位置に基づいて、前記第1の映像の音声である複数チャンネルの入力音声の中から、前記出力音声の合成に用いる入力音声の組み合わせを決定し、決定した組み合わせの入力音声を合成して前記出力音声を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マルチチャンネル音声を伴う映像の一部を切り出し視聴可能な受信装置及びその制御方法に関する。
【背景技術】
【0002】
デジタル放送ではハイビジョン映像(2k×1k:1920×1024(以下、HDと記す場合あり))が一般的となっている。また、高度衛星デジタル放送においては、さらに高解像度(4k×2k:デジタルシネマ、8k×4k:スーパーハイビジョン(以下SHVと記す場合あり))の映像や22.2チャンネルのマルチチャンネル音声を送る方式が検討されている。
【0003】
これら従来の解像度を超えるスーパーハイビジョンなどの放送においては、受信装置の能力や機能に応じた表示を行うことも併せて検討されている。例えば、画面全体をダウンコンバートして視聴するケースのほかに、放送局が指定した代表画面(SHV画面の一部)やユーザが選択した画面を受信機側で切り出して視聴する形態が検討されている(以下、トリミング視聴と記す場合あり)。このとき、切り出して視聴している代表画面の位置や画角(サイズ)とマルチチャンネル音像との関係を適切に保つことが必要になってくる。
【0004】
従来、ユーザが視聴している画面に応じて、音声を切り替えるものとしては、次のものがある。特許文献1には、マルチ画面表示においてユーザがどの画面を見ているかを検出し、見ている画面に対応する音声に切り替えて出力する方法が開示されている。また特許文献2には、ユーザが指定した画面上の位置に近い音源を重み付けして合成出力することにより、音声のズームイン効果を得る方法が開示されている。
【0005】
他方、聴取位置がスピーカに対して非対称である環境において正しい音像を提供するものとして、聴取者近傍に置かれる音声検出手段により聴取者と各スピーカまでの距離を測定し、音場を聴取者の聴取位置に定位させる音像位置補正装置がある(特許文献3)。
【特許文献1】特開2000−278626号公報
【特許文献2】特開平8−298635号公報
【特許文献3】特開平7−75200号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
通常、高解像度映像とともに送出されるマルチチャンネル音声は、その高解像度映像をフル解像度で表示し、画面の正面中央の位置で視聴する場合に最適となるよう音像が調整されている。しかし、上述のように画面の一部を切り出し視聴するような場合、その切り出し位置が画面中央部ではないケースが存在する。このとき、マルチチャンネル音声の出力バランスがオリジナルのままであると、視聴している画面と音像とにずれが生じ、違和感が発生するという問題がある。
【0007】
上述した従来の技術は、マルチ画面表示においてユーザが見ている画面の音声に完全に切り替えて出力するもの(特許文献1)や、ユーザが指定した画面の位置に音声をズームインさせるもの(特許文献2)である。よって、ユーザが画面の一部を切り出して視聴している場合において、マルチチャンネルの音像を最適な位置に補正することは出来なかった。一方、聴取位置に対して、適切な音像を得る従来の技術(特許文献3)は、ユーザとスピーカとの位置関係に基づく音声補正処理のみであり、視聴画面との関係が考慮されて
いなかった。
【0008】
そこで、本発明は、画面の一部を切り出し視聴する場合において、切り出された画面に応じて、適切なマルチチャンネル音像定位を得ることができる受信装置およびその制御方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために本発明では、以下の構成を採用する。
【0010】
本発明に係る受信装置は、複数チャンネルの音声を伴う第1の映像を受信する受信手段と、前記第1の映像の一部を切り出して第2の映像を出力する映像出力制御手段と、前記第2の映像と共に出力するための出力音声を生成する音声出力制御手段と、を備える受信装置において、前記第2の映像の切り出し位置に基づいて、前記第1の映像の音声である複数チャンネルの入力音声の中から、前記出力音声の合成に用いる入力音声の組み合わせを決定する決定手段をさらに備え、前記音声出力制御手段は、前記決定手段で決定された前記入力音声を合成して前記出力音声を生成することを特徴とする受信装置である。
【0011】
本発明に係る受信装置の制御方法は、複数チャンネルの音声を伴う第1の映像を受信する工程と、前記第1の映像の一部を切り出して第2の映像を出力する工程と、前記第2の映像と共に出力するための出力音声を生成する工程と、を備え、前記出力音声を生成する工程が、前記第2の映像の切り出し位置に基づいて、前記第1の映像の音声である複数チャンネルの入力音声の中から、前記出力音声の合成に用いる入力音声の組み合わせを決定する工程と、前記決定された前記入力音声を合成して前記出力音声を生成する工程と、を含むことを特徴とする受信装置の制御方法である。
【発明の効果】
【0012】
本発明によれば、受信装置の能力や機能に応じて、画面の一部を切り出して視聴しても、切り出された視聴画面に対して、適切なマルチチャンネル音像定位を実現することが可能となる。
【発明を実施するための最良の形態】
【0013】
以下、図を参照しながら、本発明による装置、方法の一実施の形態について説明する。以下に説明する実施の形態は、ハイビジョン放送の映像、音声(映像フォーマット:1920×1080/60/i、音声モード:5.1ch)が出力可能なデジタル放送受信装置において、スーパーハイビジョン放送(7680×4320/60/p、音声モード:22.2ch)を受信処理する場合の例である。
【0014】
[実施例1]
図1は本発明のデジタル放送受信装置のブロック図である。
【0015】
アンテナ101は、複数の映像データ、音声データ、メタデータなどが多重化されデジタル変調されたデジタルテレビジョン放送信号を受信する。より具体的には、映像フォーマットとして7680×4320/60/p(トリミング指定あり)、音声モードとして22.2chのマルチチャンネルステレオのデジタル放送番組を受信する。
【0016】
受信部102は、デジタルテレビジョン放送信号の復調、誤り訂正処理などを行い、MPEG−2 TS(Transport Stream:トランスポートストリーム)信号を出力する。
【0017】
信号分離部103は、ユーザが選局を行った番組のパケットIDに従って、多重化され
たMPEG−2 TS信号から映像データ、音声データ、メタデータを分離し、それぞれ映像再生部104、音声再生部105、メタデータ処理部106に送る。なお、多重化されたMPEG−2 TS信号には、データ放送(マルチメディア)データを含む場合もあるが、図1ではその処理部については図示していない。
【0018】
映像再生部104は、ITU−T H.264|ISO/IEC14496−10(MPEG−4 AVC)(以下、H.264)で符号化された映像データの復号を行う。
【0019】
音声再生部105は、MPEG−2 AACで符号化された音声データの復号を行う。マルチチャンネルの音声データが含まれる場合、合成することなく独立に音声出力制御部111に送る。
【0020】
メタデータ処理部106は、信号分離部103でMPEG2−TS信号をフィルタリング処理するための情報を、PSI/SI(Program Specific Information/Service Information)データから取り出す。また、メタデータ処理部106は、電子番組表などに利用される番組情報、さらに本発明に係わる映像フォーマットやトリミング(切り出し位置、およびサイズ)情報、音声モードなどの情報も、PSI/SIデータから取り出す。
【0021】
表示位置検出部107は、メタデータ処理部106からのトリミング情報に基づき、SHV(7680×4320)画面のどの部分を切り出すか、その座標を求め、映像出力制御部109に送る。また表示位置検出部107は、切り出し画面の座標から音声モードとして5.1ch出力可能な本受信装置のフロントスピーカ(3箇所)の座標を決定する。そして、表示位置検出部107は、3つのフロントスピーカの各々に対し、受信したSHVの音声モード(22.2ch)におけるフロントスピーカ(11箇所)のうち、どのスピーカの音声出力を合成して出力するか、その組み合わせを決定する。
【0022】
補正データ算出部108は、本受信装置におけるスピーカ位置と、オリジナルのSHVの音声モード(22.2ch)におけるスピーカ位置と切り出し画面の視聴位置との位置関係から、切り出し画面視聴時の適正な音像を形成するための補正データを算出する。
【0023】
本実施例では、SHV映像が複数チャンネル(22.2ch)の音声を伴う第1の映像に該当し、受信部102が第1の映像を受信する受信手段に該当する。また、映像出力制御部109が、SHV映像の一部を切り出して第2の映像(HD解像度の切り出し画面)を出力する映像出力制御手段に該当する。また、音声出力制御部111が、第2の映像と共に出力するための出力音声(ここでは5.1ch)を生成する音声出力制御手段に該当する。また、表示位置検出部107が、第2の映像の切り出し位置に基づいて、SHVの入力音声の中から、出力音声の合成に用いる入力音声の組み合わせを決定する決定手段に該当する。
【0024】
ここで、補正データ算出部108について少し詳しく説明する。
【0025】
図2は、補正データ算出部108の構成例である。補正データ算出部108は、角度解析部201、混合ゲインデータ算出部202、距離解析部203、ゲイン補正データ算出部204、遅延量補正データ算出部205で構成される。角度解析部201は、本受信装置のフロントスピーカと、それぞれに出力する22.2chのフロントスピーカとの角度を算出する。以下、本受信装置のフロント左スピーカをTFL、フロントセンタースピーカをTFC、フロント右スピーカをTFRと略記し、22.2chのフロントスピーカをソースと略記する。混合ゲインデータ算出部202は、算出された角度に基づき、切り出し視聴している画面に対して視聴者が感じる音声の到来方向が適正になるよう合成すべき
各ソースの音声データの混合比(ゲイン)を決定する。距離解析部203は、角度解析部201で算出された角度に基づき、22.2chの各ソースと本受信装置のフロントスピーカ(TFL/TFC/TFR)との距離の違いを算出する。ゲイン補正データ算出部204は、算出された距離の違いの情報に基づき、本受信装置のフロントスピーカ(TFL/TFC/TFR)の音声信号のゲイン(音量レベル)補正データを算出する。遅延量補正データ算出部205は、算出された距離の違いの情報に基づき、本受信装置のフロントスピーカ(TFL/TFC/TFR)の音声信号の遅延量補正データを算出する。ゲイン補正データおよび遅延量補正データは、切り出し視聴している画面に対して視聴者が感じる音声の音量と音源までの距離感が適正になるよう、決定される。
【0026】
説明を図1に戻す。図1において映像出力制御部109は、表示位置検出部107からの切り出し画面の位置情報に基づき、SHV画面からHD解像度の画面を切り出して表示部110に送る。
【0027】
表示部110は、HD(1920×1080)を表示できる解像度を有する表示装置である。
【0028】
音声出力制御部111は、音声再生部105から出力される22.2chのフロントスピーカの各音声データを、補正データ解析部108からの混合ゲインデータに基づいて所定の割合で合成する。その後、音声出力制御部111は、ゲイン補正データ、遅延量補正データに従ってゲイン調整、遅延量調整を行い、本受信装置のフロントスピーカ(TFL/TFC/TFR)の音声データを生成する。生成された音声データはD/A(Digital−Analog)コンバータとアンプを介してTFL/TFC/TFRの各スピーカ112に出力される。合成、ゲイン調整、遅延量調整の詳細については後述する。
【0029】
図3は、実施例1における切り出し視聴画面の位置を示す図である。実施例1では、スーパーハイビジョン画面301の中央部をハイビジョン解像度302で切り出し(トリミング)視聴する例を示している。
【0030】
図4は、スーパーハイビジョンの画面中央部を切り出し視聴する実施例1における音声出力制御部111の構成例である。画面中央を中心に切り出しているため、本受信装置のフロントセンタースピーカ(TFC)には、22.2chのフロントセンタースピーカ(FC)の音声データを出力する。フロント左スピーカ(TFL)には、22.2chのフロント左スピーカ(FL)、フロント左センタースピーカ(FLc)、フロントセンタースピーカ(FC)の3つのソースを混合した音声データを出力する。フロント右スピーカ(TFR)には、22.2chのフロント右スピーカ(FR)、フロント右センタースピーカ(FRc)、フロントセンタースピーカ(FC)の3つのソースを混合した音声データを出力する。
【0031】
図5は、22.2chシステムにおける標準的なスピーカ配置を示したものである。22.2chシステムは、フロントに11ch、サイドに4ch、リアに6ch、上部に1chの22chに、低音域用のLFE(Low Frequency Effects)を2ch(0.2chとして扱う)加えたスピーカ構成になっている。5.1chや6.1ch/7.1chシステムは、前後左右方向の音の広がりには対応できるが上下の音像表現が困難であった。22.2chシステムでは、視聴者と同じ高さの中間層のスピーカを10チャンネルに増やすとともに、上層に9チャンネル、下層に3チャンネルを配することにより、垂直方向の音像移動にも対応することが可能な構成になっている。
【0032】
本明細書における実施例では、説明を簡単にするため22.2chシステム(SHV放送の音声モードの1つ)と、5.1chシステム(HD放送の音声モードの1つ)におけ
る、それぞれのフロントスピーカの関係についてのみ説明する。リアスピーカやサイドスピーカ、低域スピーカについての記載は省略する。また、実施例1及び2は、画面の上下方向に対しては中央部分をトリミング視聴する構成であるため、22.2chシステムにおける中間層のフロントスピーカについてのみ説明する。上層のフロントスピーカ(図5におけるTpFL/TpFC/TpFR)、下層のフロントスピーカ(BtFL/BtFC/BtFR)についての記載は省略する。
【0033】
次に本発明に係わるブロックについて、フローチャートを用いてその動作を説明する。
【0034】
図6は、メタデータ処理部106の処理フローの一実施例である。
【0035】
デジタル放送においては、映像や音声、番組に関する種々の情報をPSI/SIデータ内に各種テーブルとして埋め込み、送出することが可能である。詳細は、(社)電波産業会(以下、ARIB)の発行する「デジタル放送に使用する番組配列情報」の標準規格(ARIB STD−B10)を参照のこと。
【0036】
本実施例においては、PMT(Program Map Table)もしくはEIT(Event Information Table)に挿入されるコンポーネント記述子を用いて、スーパーハイビジョン映像(7680×4320/60/Pの映像フォーマット)であること、さらに放送局によるトリミング情報があることを伝送する。EITは、番組名、放送日時、番組内容など番組に関する情報を送るテーブルである。
【0037】
コンポーネント記述子は、図7のようなデータ構造を持っており、その中のコンポーネント種別(component_type)という8ビットのフィールドに映像コンポーネントや音声コンポーネントの種別を示すことが出来る。
【0038】
図8は、コンポーネント記述子内をより詳細に示したもので、コンポーネント種別が0x00から0xC0までは、現在規格化されている映像コンポーネントを示している。本実施例で想定している映像ストリームは、ハイビジョン映像を超えるより高解像度の映像フォーマットであり、現在は規定されていない。本実施例では、デジタルシネマやスーパーハイビジョンの映像フォーマットであることを示すコンポーネント種別として、0xE1から0xF3を割り当てている(図8)。
【0039】
コンポーネント種別として、トリミング指定ありの映像フォーマットの場合、さらにトリミング(切り出し)情報を伝送する。トリミング情報はEITなどに挿入される拡張形式イベント記述子を用いて伝送することができる。拡張形式イベント記述子は、図9のようなデータ構造を持っており、その中のitem_description_charの1つとしてトリミング情報を追加する。図10のように、item_description_charにトリミングサイズやアドレスを示し、item_charにてその値を送る。
【0040】
このようなメタデータが多重化されたデジタル放送を受信することを前提に説明を行う。
【0041】
図6のステップS602にて、メタデータ処理部106は、PMTのコンポーネント記述子から、コンポーネント識別情報を抽出する。次に、メタデータ処理部106は、コンポーネント識別情報から、受信している番組がスーパーハイビジョン(SHV)映像であるかを判定する(S603)。ここで、SHV映像モードではなく通常のハイビジョン映像モードであった場合(図8のコンポーネント種別が0xB2など)は、画面の一部を切り出すことなく、そのままの解像度で表示する(S604)。
【0042】
ステップS603にてSHV映像モードであると判定された場合、メタデータ処理部106はステップS605にて放送局によるトリミング指定があるか否かを判定する。ここでトリミング指定ありの映像モード(例えば、図8の0xF2)であった場合は、ステップS606に進む。一方、同じSHV映像であってもトリミング指定なしであった場合は、ステップS607に進む。
【0043】
ステップS606では、メタデータ処理部106は、EITの拡張形式イベント記述子から、トリミング情報を抽出する。図10は、トリミングサイズ“1”(HD解像度:1920×1080であることを表す)、左上(X,Y)アドレスが(−960、+540)と記述されたトリミング情報の例である。本実施例においては画面中央の座標を(0,0)としているので、図10のトリミング情報は、SHV画面の中央部をHD解像度でトリミング(切り出す)指定をしていることになる。ステップS606にて抽出されたトリミング情報は、表示位置検出部107に送られる(S610)。
【0044】
ステップS605にて放送局によるトリミング指定がなかった場合、メタデータ処理部106は、ユーザ操作によるトリミング指定があるか否かを判定する(S607)。ここで受信装置の機能としてユーザが任意の位置をトリミング視聴でき、実際にトリミング視聴している場合は、受信装置内で管理されている切り出し位置、およびサイズの情報をトリミング情報として抽出し(S608)、ステップS610に進む。一方、ユーザによるトリミング指定がなかった場合は、メタデータ処理部106は、全画面をダウンコンバートして表示するよう映像出力制御部に指示する(S609)。
【0045】
図11は、表示位置検出部107の処理フローの一実施例である。
【0046】
まず、ステップS1102にて、表示位置検出部107は、メタデータ処理部106で抽出されたトリミング情報を読み込む。次に、表示位置検出部107は、図10に示したようなトリミング情報に基づき、切り出し画面の座標を求める(S1103)。切り出し画面の座標データは、図1における映像出力制御部109に送られ(S1104)、所定の位置が(本実施例ではSHVの画面中央部をHD解像度で)切り出され表示部110にて表示される。
【0047】
ステップS1105にて、表示位置検出部107は、切り出し画面の位置に応じて5.1chシステムにおけるフロントスピーカの位置を算出する。
【0048】
図12は、視聴位置1201において、SHVの画面中央部をHD解像度でトリミング視聴する場合のフロントスピーカの配置を示したものである。上述したように、FL、FLc、FC、FRc、FRは、それぞれ22.2chシステムにおける中間層のフロント左スピーカ、フロント左センタースピーカ、フロントセンタースピーカ、フロント右センタースピーカ、フロント右スピーカを表している。また、TFL、TFC、TFRは、それぞれトリミング視聴時の5.1chシステムにおけるフロントスピーカを表している。図12に示したように、本実施例では、TFL、TFC、TFRの座標は、それぞれ、(−960,0)、(0,0)、(+960,0)となる。ちなみに、TFLとTFRの位置については、ユーザの広がり感に関する好みや視聴するコンテンツなどに応じて、切り出し画面の両端とFL、FRとの間の任意の位置に設置することが可能である(図13)。ここでは説明を簡単にするため、切り出し画面の左端にTFRを、右端にTFRを設置することとする。
【0049】
次に、図11のステップS1106において、表示位置検出部107は、TFL、TFC、TFRのy座標が0(ゼロ)であるか否かを判定する。ここで、y座標が0の場合は
、図12のようにSHV画面の上下方向のちょうど中央の高さで切り出されたことになる。本実施例では、y座標が0であるゆえ、ステップS1107に進む。
【0050】
ステップS1107で、表示位置検出部107は、TFL、TFC、TFRと、FL、FLc、FC、TRc、FRのx座標上の位置関係を判定する。本実施例では、例えばTFLの位置は、FLcとFCとの間に位置していると判定される。
【0051】
ステップS1108〜S1110において、表示位置検出部107は、ステップS1107で判定された位置関係に従い、TFL、TFC、TFRそれぞれに、FL、FLc、FC、TRc、FRのどのスピーカからの音声を合成して出力するかを決定する。表示位置検出部107は、まずTFLと同じ位置のソースの有無を調べ、同じ位置のソースがあればそれを選択し、同じ位置のソースがなければ、表示位置検出部107は、TFLに最も近いN個(Nは2以上の整数)のソースを選択する。Nが3の場合、本実施例では、TFLに対して、FL、FLc、FCの組み合わせが選ばれる。同様にして、TFRにはFR、FRc、FCの組み合わせが選ばれる。そして本実施例は画面中央での切り出しのため、TFCとFCの座標は一致し、TFCにはFCのみが選ばれる。なお組み合わせ決定のルール(アルゴリズム)は上記の例に限らず、どのようなものを採用してもよい。例えば、TFL、TFC、TFRそれぞれの位置(x、y座標)に対応するソースの組み合わせが予め規定されたテーブルを参照することも好ましい。また、TFL等とソースとの距離に応じて、組み合わせるソースの数を動的に変化させてもよい。
【0052】
表示位置検出部107は、ステップS1105にて算出されたTFL、TFC、TFRの位置情報(座標)とステップS1108〜S1110で決定されたFL、FLc、FC、TRc、FRの組み合わせ情報を補正データ算出部108に出力する(S1111)。
【0053】
なお、図11のステップS1112〜S1122は、切り出し位置が異なる場合の処理フローである。ステップS1113〜S1117は、切り出し位置が上下方向のみ変化する場合の処理例である。その場合、TpFCとBtFCの2つのソースも音声合成に利用される。ステップS1112、S1118〜S1122については、他の実施例(実施例4)にて説明する。
【0054】
図14は補正データ算出部108における処理フローの一実施例である。
【0055】
まず、ステップS1402にて、補正データ算出部108は、表示位置検出部107にて算出、決定されたTFL、TFC、TFRの位置情報(座標)とそれぞれに出力するFL、FLc、FC、TRc、FRの組み合わせ情報を読み込む。
【0056】
次に、ステップS1403にて、補正データ算出部108は、視聴位置からみた各スピーカの角度を算出する。本実施例における視聴位置(図12の1201)は、SHV視聴において視聴角100度、視聴距離0.75H(Hは画面上下サイズ)、HD視聴においては視聴角30度、視聴距離3Hとしている。これは、SHV視聴およびHD視聴の標準視聴パラメータに相当し、それぞれの標準視聴角で視聴した場合、SHVの0.75HとHDの3Hは同じ視聴距離となる。
【0057】
ステップS1404では、補正データ算出部108は、ステップS1403で算出された視聴位置と各スピーカとの角度から、TFL、TFC、TFRそれぞれに対するFL、FLc、FC、FRc、FRの混合比を算出する。ステップS1405にて、補正データ算出部108は、算出した混合比を混合ゲインデータとして図1の音声出力制御部111に出力する。
【0058】
図15は、TFLから出力する音声を、FL、FLc、FCの音声を混合して生成する一例を示した図である。本実施例における視聴位置と各スピーカとの角度は、視聴位置を標準視聴位置(視聴角SHV:100度、HD:30度)とした場合の値である。各スピーカとの角度に対し余弦定理等を用いることによりFL、FLc、FCの各音声ベクトルを合成し、音声の到来方向がTFLの角度となる音声ベクトルVTFLを生成する。VTFL=1として正規化することにより、FL、FLc、FCそれぞれの音声ベクトルの混合比を求めることができる。図15では、FLの出力をVFL、FLcの出力をVFLc、FCの出力をVFCの割合で合成することで、TFLからの音声ベクトルVTFLを生成している。なお、図15の例のように2次元において3つ以上のソースのベクトルを合成する場合は、必要に応じて他の拘束条件(例えばベクトルの大きさの範囲など)を追加すればよい。ここでは、合成ベクトルVTFLの一方の分解成分ベクトルであるベクトルVFCの大きさを、他方の分解ベクトルの方向がベクトルVFLcとベクトルVFLとにより合成できる範囲とすることができる。
【0059】
図16は、図15に対してTFLの位置をよりFL側に変更した例である。図16においては、TFLの位置がFL側になったことにより、FL、FLc、FCの各音声ベクトル混合比として、VFCの割合が減り、VFL、VFLcの割合が増加することを示している。
【0060】
図14に戻り処理フローの説明を続ける。
【0061】
ステップS1406では、補正データ算出部108は、ステップS1403にて算出された視聴位置からみた各スピーカの角度から、FL、FLc、FC、FRc、FRとTFL、TFC、TFRの距離の差を算出する。図17は、FLとTFLの距離の差を求める一例である。標準視聴位置の場合、FLは正面から左に50度、本実施例のTFLの位置は同じく左に15度となる。
【0062】
視聴者とFLとの距離をLFL、視聴者とTFLとの距離をLTFLとすると、LFL・cos50°=LTFL・cos15°の関係が成り立つゆえ、LTFL=LFL×cos50°/cos15°となる。
【0063】
次にステップS1407にて、補正データ算出部108は、ステップS1406で求めた距離関係に基づいてゲイン補正データを算出する。例えば図17において、TFLのFLに対するゲインをG(TFL_FL)、FLのゲインをG(FL)とおく。音量は距離の2乗に反比例するため、トリミング視聴においても同じ音量で聞こえるようにするには、G(TFL_FL)=G(FL)×(LTFL/(LFLとなるようゲイン補正データを生成する。さらに、本実施例においてTFLに合成出力する他の音声チャンネル(FLc、FC)についても同様にゲイン補正データを算出し、FL、FLc、FCトータルのゲイン補正データを決定し、図1の音声出力制御部111に送る(S1408)。
【0064】
ステップS1409では、補正データ算出部108は、ステップS1406で求めた距離関係に基づいて遅延量補正データを算出する。ステップS1407の説明と同じく図17を用いて説明する。図17において、TFLのFLに対する遅延量をD(TFL_FL)、FLの遅延量をD(FL)とおく。遅延量は距離に比例するため、トリミング視聴においても、視聴者が感じる音源までの距離感が同じとなるようにするには、D(TFL_FL)=D(FL)×LTFL/LFLとなるよう遅延量補正データを生成する。さらに、本実施例においてTFLに合成出力する他の音声チャンネル(FLc、FC)についても同様に遅延量補正データを算出し、FL、FLc、FCトータルの遅延量補正データを決定し、図1の音声出力制御部111に送る(S1410)。
【0065】
メタデータ処理部106(図6)、表示位置検出部107(図11)、補正データ算出部108(図14)の処理を経て得られた、トリミング視聴における、混合ゲイン補正データ、ゲイン補正データ、遅延量補正データは、音声出力制御部111に入力される。
【0066】
音声出力制御部111はFL、FLc、FC、FRc、FRからTFL、TFC、TFRを生成する。一例として図4を参照して、TFLを生成する流れについて説明する。まず、音声出力制御部111は、混合ゲイン補正データに基づき、FL、FLc、FCを所定の混合比で合成する。次に音声出力制御部111は、音量がほぼ同じとなるようゲイン補正データに基づきゲインを調整し、さらに音源までの距離感がほぼ同じとなるよう遅延量補正データに基づき遅延量を調整する。これらの調整が完了したデータは、D/A、AMP(アンプ)を介してTFLスピーカへと送られる。TFRについては、FC、FRc、FRを所定の混合比で合成する以外は、TFLの流れと同様である。なお、本実施例においては、画面中央部切り出し視聴のため、TFC=FCの関係になり、TFCに関して特段の補正は行わない。(図4においては、ゲイン補正部、遅延量補正部を経由しているが、ともに補正量は0(ゼロ)である。)
【0067】
本実施例における音声出力制御部(図4)は、混合ゲイン調整部により音の到来方向(角度)の補正を行った後に、音量を調整するゲイン補正、ならびに音源までの距離感を調整する遅延量補正を行う構成とした。しかし、先にゲイン補正、遅延量補正を行ってから、到来方向(角度)の補正を行う構成とすることで、ゲイン、遅延量の補正をより正確に行うことも可能である。
【0068】
本実施例によれば、スーパーハイビジョン(SHV)画面の中央部をハイビジョン(HD)解像度でトリミング視聴する場合、切り出された視聴画面に対して、音声の到来方向、音量、距離感が適切に補正されたマルチチャンネル音声を提供することが可能となる。
【0069】
[実施例2]
次に、本発明に係わる実施例2について説明する。
【0070】
図18は、実施例2における切り出し視聴画面の位置を示す図である。実施例2では、スーパーハイビジョン画面1701の一部をハイビジョン解像度1702で切り出し(トリミング)視聴する例である。実施例1との違いは、x軸方向の切り出し位置が画面中央部ではない点である。
【0071】
実施例2のデジタル放送受信装置のブロック構成(図1)、ならびにメタデータ処理部、表示位置検出部、補正データ算出部の処理フロー(図6、図11、図14)は実施例1と基本的に同じである。
【0072】
以下、実施例1との差分を中心に説明する。
【0073】
図19は、実施例2におけるトリミング視聴時のフロントスピーカTFL、TFC、TFRの位置ならびに、TFLに合成して出力するFL、FLc、FC、FRc、FRの組み合わせを示したものである。実施例2において、TFLにはFC、FRcの音声データを組み合わせて出力する。これは切り出した画面周辺の音を中心に合成することを基本としている為であるが、さらに一定の比率でFL、FLcを加えても良い。
【0074】
混合比率は、実施例1と同様、各スピーカとの角度に基づいて求めるが、実施例2では、視聴位置が原点(x,y)=(0,0)でないため、各スピーカとの角度は切り出し位置座標を加味して算出する必要がある。
【0075】
視聴位置のx座標をa、SHV画面右端のx座標をb、原点座標におけるFLとの角度を50度(実施例1と同じく標準視聴位置)、視聴位置におけるFLとの角度をK度とした場合、角度Kは、以下の関係式で表すことができる。
tanK°=((a+b)/b)tan50°
【0076】
このようにして、視聴位置と画面端の座標から視聴位置における各スピーカとの角度を求めることができる(図20)。
【0077】
図21は、実施例2におけるTFCに合成して出力するFL、FLc、FC、FRc、FRの組み合わせを示したものである。実施例2におけるフロントセンタースピーカTFCには、FRc、FRの音声データを組み合わせて出力している。これは上述のように、切り出した画面周辺の音を中心に出力するようにしている為である。
【0078】
図22は、実施例2における音声出力制御部111の一例である。実施例1と同様、切り出し画面位置から算出された、混合ゲインデータ、ゲイン補正データ、遅延量補正データに基づいてトリミング視聴時のフロントスピーカTFL、TFC、TFRのそれぞれの音声データを生成する。図19、ならびに図21にて説明したように実施例2においては、TFLにはFC、FRcを、TFCには、FRc、FRを合成して出力する構成になっている。またTFRについても、TFCと同じくFRc、FRを合成して出力する構成となっている。これは、図18からもわかるように、実施例2における切り出し画面位置の場合、TFC、TFRともにFRc、FRという2つのスピーカの間に位置しているためである。このため、TFC、TFRともにFRc、FRの音声データを合成しているが、各スピーカとの角度関係が異なるため、その混合比は異なっている。合成後は、実施例1と同様、音量調整のためのゲイン補正、距離感調整のための遅延量補正を行い、D/A、AMPを通してトリミング視聴時のフロントスピーカTFL、TFC、TFRに出力する。
【0079】
本実施例によれば、SHV画面の一部(上下中央、左右中央部以外)をHD解像度でトリミング視聴する場合、切り出された視聴画面に対して、音声の到来方向、音量、距離感が適切に補正されたマルチチャンネル音声を提供することが可能となる。
【0080】
[実施例3]
次に、本発明に係わる実施例3について説明する。
【0081】
実施例3において、デジタル放送受信装置のブロック構成(図1)、ならびにメタデータ処理部、表示位置検出部、補正データ算出部の処理フロー(図6、図11、図14)は実施例1と基本的に同じである。
【0082】
実施例3は、実施例2の切り出し画面構成における、他の実施の形態であり、番組の音声イベントのうち、ナレーションやBGMなどを、切り出し画面位置に関係なくフロントセンタースピーカTFCから出力させる構成の一例である。
【0083】
図23は実施例3を適用する音声モードに関するコンポーネント記述子の一例を示したものである。これは、実施例1で説明したコンポーネント記述子(図7)、ならびにその映像コンポーネントに関する記述(図8)にさらに追加されて記述されることを想定している。図23において、コンポーネント内容の0x02は、音声コンポーネントであることを示し、コンポーネント種別が0x00から0x09までは、現在規格化されている音声モードを示している。実施例3では説明のため、デジタルシネマやスーパーハイビジョンの音声フォーマットのコンポーネント種別として、0x0Aから0x0Fを割り当て、
コンポーネント種別0x0Fには、音声チャンネル種別情報ありの音声モードを設けている。音声チャンネル種別情報ありの音声モードとは、登場人物やナレーション、BGMなどの音声イベントごとに特定の音声チャンネルを割り当てるモードである。22.2chシステムなどにおいて、特定の音声チャンネルに特定の音声イベントを割り当てることを想定している。
【0084】
コンポーネント種別として、音声チャンネル種別情報ありの音声モードの場合、どの音声イベントがどの音声チャンネルで伝送されているかの情報を送る必要がある。これは、実施例1におけるトリミング情報を伝送する例と同様、EITなどに挿入される拡張形式イベント記述子を用いて伝送することができる。図24は、拡張形式イベント記述子の中のitem_description_charの1つとして音声イベントを追加し、そのitem_charにて音声イベントに対応する音声チャンネルを示した一例である。
【0085】
このようなメタデータを多重化して送ることにより実施例3を実現することができる。実施例3のデジタル放送受信装置における、この音声コンポーネントに係わるメタデータの処理については、実施例1におけるトリミング情報ありの場合の処理(図6)と類似しているため、本項での説明は省略する。
【0086】
図25は、実施例3における音声出力制御部111の一例である。実施例2と同様、切り出し画面位置から算出された、混合ゲインデータ、ゲイン補正データ、遅延量補正データに基づいてトリミング視聴時のフロントスピーカTFL、TFC、TFRのそれぞれの音声データを生成する。さらに実施例3においては、拡張形式イベント記述子にて伝送される音声イベントに対応する音声チャンネル情報に基づき、ナレーションやBGMの音声チャンネル(図24におけるチャンネル番号5や6)をトリミング視聴時のTFCに合成する構成となっている。(図25においては、特定chと表記)
【0087】
本実施例によれば、実施例1、2の効果に加え、ナレーションやBGMのような、通常は切り出し位置に依存しない音声についても、安定して聴取することが可能となる。
【0088】
[実施例4]
次に、本発明に係わる実施例4について説明する。
【0089】
これまでの実施例は、説明を簡単にするため、画面上下方向にオフセットがない(y座標が0の)トリミング視聴のケースについて説明してきたが、実施例4では画面上下方向についてもオフセットがついて切り出されるケースについて簡単に説明する。
【0090】
図26は、実施例4における切り出し視聴画面の位置を示す図である。実施例4では、これまでの実施例と同様、スーパーハイビジョン画面2501の一部をハイビジョン解像度2502で切り出して視聴する例であるが、x軸方向、y軸方向とも切り出し位置が中央ではない点が、これまでの実施例と異なっている。
【0091】
図26のように切り出し視聴する場合は、22.2chシステムにおける中間層のスピーカだけでなく、上層および下層のスピーカを含め、トリミング視聴におけるフロントスピーカTFL、TFC、TFLに出力する組み合わせを決定する。
【0092】
表示位置検出部107の処理フロー(図11)のステップS1118からステップS1122の処理がそれにあたる。これまでの実施例1から3では、中間層のFL、FLc、FC、FRc、FRのみの組み合わせを決定していたが、実施例4では、さらに上層のTpFL、TpFC、TpFR、および下層のBtFL、BtFC、BtFRまで含めて組み合わせを決定する。
【0093】
組み合わせ決定後の補正データ算出部108における処理や、音声出力制御部111における処理は、合成対象となるチャンネル数が増加する以外、基本的な動作は実施例1から3と同じである。
【0094】
以上、複数の実施例を挙げて本発明の具体的に構成を説明したが、本発明の範囲は上記実施例に限られることはない。例えば、上記実施例は、切り出し視聴前の音声モードに22.2chシステム、切り出し視聴時の音声モードに5.1chシステムを例に説明したが、本発明は他の音声モードの組み合わせにも適用可能である。
【0095】
また上記実施例では、アンテナ101から放送波を受信する構成を例に説明したが、インターネットなどのIPネットワーク網からコンテンツ(番組)を受信する場合にも本発明を適用することが可能である。この場合であっても、表示位置を検出し、その位置とサイズに基づき、マルチチャンネルの音声出力を制御する処理は同じである。
【0096】
さらに、上記実施例では、画面の切り出し位置の指定方法として、放送局からメタデータを送ることにより指定する方法と受信装置の機能によってユーザ指定する方法について説明した。しかし、放送局から受信装置上で動作するアプリケーションを送り、そのアプリケーションが切り出し位置を制御するような場合であっても、本発明を適用することが可能である。
【図面の簡単な説明】
【0097】
【図1】本発明に係わるデジタル放送受信装置の構成を示すブロック図
【図2】本発明に係わる補正データ算出部の構成を示すブロック図
【図3】本発明の実施例1における切り出し画面位置を示す図
【図4】本発明の実施例1に係わる音声出力制御部の構成を示すブロック図
【図5】22.2ch音声システムのスピーカ配置を示す図
【図6】本発明に係わるメタデータ処理について説明するためのフローチャート
【図7】デジタル放送で運用されるコンポーネント記述子のデータ構造を示す図
【図8】本発明に係わる映像コンポーネント種別の一例
【図9】デジタル放送で運用される拡張形式イベント記述子のデータ構造を示す図
【図10】本発明の実施例1に係わるトリミング情報の一例
【図11】本発明に係わる表示位置検出処理について説明するためのフローチャート
【図12】本発明の実施例1に係わる切り出し画面位置とスピーカ位置の関係を示す図
【図13】本発明の実施例1に係わる切り出し画面位置とスピーカ位置の関係を示す図
【図14】本発明に係わる補正データ算出処理について説明するためのフローチャート
【図15】本発明の実施例1に係わるTFL(切り出し画面のフロント左スピーカ)に出力する音声データの合成処理を説明するための図
【図16】本発明の実施例1に係わるTFL(切り出し画面のフロント左スピーカ)に出力する音声データの合成処理を説明するための図(他の例)
【図17】本発明の実施例1に係わるTFL(切り出し画面のフロント左スピーカ)とFL(オリジナル画面のフロント左スピーカ)との距離関係を説明するための図
【図18】本発明の実施例2における切り出し画面位置を示す図
【図19】本発明の実施例2に係わるTFL(切り出し画面のフロント左スピーカ)に出力する音声データの合成処理を説明するための図
【図20】本発明に係わる視聴位置における各スピーカとの角度計算について説明するための図
【図21】本発明の実施例2に係わるTFC(切り出し画面のフロントセンタースピーカ)に出力する音声データの合成処理を説明するための図
【図22】本発明の実施例2に係わる音声出力制御部の構成を示すブロック図
【図23】本発明の実施例3に係わる音声コンポーネント種別の一例
【図24】本発明の実施例3に係わる音声イベント情報の一例
【図25】本発明の実施例3に係わる音声出力制御部の構成を示すブロック図
【図26】本発明の実施例4における切り出し画面位置を示す図
【符号の説明】
【0098】
106 メタデータ処理部
107 表示位置検出部
108 補正データ算出部
111 音声出力制御部
201 角度解析部
202 混合ゲインデータ算出部
203 距離解析部
204 ゲイン補正データ算出部
205 遅延量補正データ算出部

【特許請求の範囲】
【請求項1】
複数チャンネルの音声を伴う第1の映像を受信する受信手段と、
前記第1の映像の一部を切り出して第2の映像を出力する映像出力制御手段と、
前記第2の映像と共に出力するための出力音声を生成する音声出力制御手段と、を備える受信装置において、
前記第2の映像の切り出し位置に基づいて、前記第1の映像の音声である複数チャンネルの入力音声の中から、前記出力音声の合成に用いる入力音声の組み合わせを決定する決定手段をさらに備え、
前記音声出力制御手段は、前記決定手段で決定された前記入力音声を合成して前記出力音声を生成することを特徴とする受信装置。
【請求項2】
前記第2の映像の切り出し位置に応じて定まる、前記入力音声のスピーカ位置と前記出力音声のスピーカ位置と前記第2の映像の視聴位置との位置関係に基づいて、前記視聴位置における音像を補正するための補正データを算出する補正データ算出手段をさらに備え、
前記音声出力制御手段は、前記補正データを用いて前記出力音声を生成することを特徴とする請求項1に記載の受信装置。
【請求項3】
前記補正データは、前記視聴位置における音声の到来方向を補正するためのデータとして、前記出力音声の生成に用いる前記入力音声の混合比を決めるデータを含むことを特徴とする請求項2に記載の受信装置。
【請求項4】
前記補正データは、前記視聴位置における音量を補正するためのデータとして、前記出力音声に与えるゲインを決めるデータを含むことを特徴とする請求項2または3に記載の受信装置。
【請求項5】
前記補正データは、前記視聴位置における音源までの距離を補正するためのデータとして、前記出力音声に与える遅延量を決めるデータを含むことを特徴とする請求項2〜4のうちいずれか1項に記載の受信装置。
【請求項6】
前記複数チャンネルの入力音声の中に所定の種別の入力音声が含まれている場合に、
前記音声出力制御手段は、前記第2の映像の切り出し位置にかかわらず、前記所定の種別の入力音声を所定のチャンネルの出力音声に合成することを特徴とする請求項1〜5のうちいずれか1項に記載の受信装置。
【請求項7】
複数チャンネルの音声を伴う第1の映像を受信する工程と、
前記第1の映像の一部を切り出して第2の映像を出力する工程と、
前記第2の映像と共に出力するための出力音声を生成する工程と、を備え、
前記出力音声を生成する工程が、
前記第2の映像の切り出し位置に基づいて、前記第1の映像の音声である複数チャンネルの入力音声の中から、前記出力音声の合成に用いる入力音声の組み合わせを決定する工程と、
前記決定された前記入力音声を合成して前記出力音声を生成する工程と、を含むことを特徴とする受信装置の制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate


【公開番号】特開2010−74238(P2010−74238A)
【公開日】平成22年4月2日(2010.4.2)
【国際特許分類】
【出願番号】特願2008−236277(P2008−236277)
【出願日】平成20年9月16日(2008.9.16)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】