説明

ストリーム処理装置

【課題】マルチストリームのストリーム処理装置において、同時に処理するストリーム数が増加しても、音声処理手段の演算処理能力の範囲内に演算量が収まるように、各ストリームに対する音声処理を選択する。
【解決手段】マルチストリームのトランスポートストリームを受信して音声データと番組付随情報とを抽出するトランスポートストリームデコーダと、音声データを同時に復号するデコード手段と、デコード手段が復号した音声データに対して音声チャンネルの拡張及びデジタルフィルタ演算処理を含む音響効果の演算を行う音声処理手段と、デコード手段の単位時間あたりの演算量を測定する演算量測定部と、番組付随情報と演算量測定部で測定した演算量に応じて、音声処理手段の処理能力を超えないように、マルチストリームのそれぞれのストリームに対して、音声処理手段における処理を切り替えるように制御する制御手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタル放送等の技術分野において、圧縮符号化された映像信号のビットストリームを復号し、復号された映像信号を表示するストリーム処理装置に関する。特に複数のチャンネルの映像を復号して同時に表示するストリーム処理装置に関する。
【背景技術】
【0002】
デジタル放送では、映像音声データはMPEG(Moving Picture Experts Group)等の方式によって圧縮符号化され、複数のチャンネルの映像が多重化されて配信されている。デジタル放送受信機は、多重化されたビットストリームを受信すると、ビットストリームのうち受信するように指定されたチャンネルの映像ストリームおよび音声ストリームを分離し、これらを復号して出力する。
【0003】
近年のテレビ受信機の多くは、複数のチャンネルの符号化データを同時に復号し、それら複数の映像ストリームを同時に表示することが可能である。例えば特許文献1では、複数のデコーダを用いて、複数のビットストリームを同時に復号させる装置が開示されている。
【0004】
従来、複数のストリームを同時にテレビに表示させる際には、画面を右画面と左画面や、親画面と子画面のように、画面を2つに分割した2画面形式で表示され、これらを視聴することが主流であった。しかし近年、2つのストリームに含まれる映像を交互に表示し、交互に表示される映像の一つのストリームに同期して開閉するシャッター方式のメガネ等を使用して、複数のユーザーが同じコンテンツ、または、異なるコンテンツを全画面で同時に視聴する方法が提案されている。今後、さらに3本以上の映像ストリームを、複数のユーザーが全画面で同時視聴可能な環境が提供されることが考えられる。
【0005】
一方で、複数のストリームの映像処理や音声処理を同時に行う場合には、CPUの演算量やメモリバンド幅など、受信機の処理負荷が増大する。特に音声処理を全てソフトウェアで行う場合には、ストリームの同時処理本数が増えると音声処理におけるCPUの処理負荷も比例して高くなる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平9−93131号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
デジタル放送等を受信して再生するストリーム処理装置において、同時に処理するストリームの本数が増加すると、映像処理や音声処理等の演算処理が増加して、CPU処理能力などの性能不足が発生する。
【0008】
ユーザーが複数のストリームに対して、各演算処理の配分を細かく設定することによってCPU能力の効果的な配分が可能だが、ストリームの同時処理本数が増え、ストリームに対する処理に応じて機能が複雑になるとユーザーの負担が増加する。
【課題を解決するための手段】
【0009】
上記課題を解決するため、本発明のストリーム処理装置は、マルチストリームのトランスポートストリームを受信して音声データと番組付随情報とを抽出するトランスポートストリームデコーダと、前記音声データを同時に復号するデコード手段と、前記デコード手段が復号した音声データに対して音声チャンネルの拡張及びデジタルフィルタ演算処理を含む音響効果の演算を行う音声処理手段と、前記デコード手段の単位時間あたりの演算量を測定する演算量測定部と、前記番組付随情報と前記演算量測定部で測定した演算量に応じて、前記音声処理手段の処理能力を超えないように、前記マルチストリームのそれぞれのストリームに対して、前記音声処理手段における音響処理を切り替えるように制御する制御手段とを備える。
【発明の効果】
【0010】
本発明のストリーム処理装置は、同時に処理するストリーム本数が増加して、ストリーム処理装置におけるCPUの処理能力が限界を超える場合に、番組情報やユーザーの情報等を用いて音響処理性能の割り当てを行い、ユーザーに対してより高い臨場感を提供可能とする。
【0011】
例えば、同時視聴している映像ストリームの番組種別(例えば、ニュース、スポーツ、コンサート、映画など)に応じて、各ストリームの音響処理性能を効果的に割り当てることが可能になる。
【図面の簡単な説明】
【0012】
【図1】実施の形態1におけるストリーム処理装置の構成図
【図2】実施の形態1における音声チャンネル拡張部とデジタルフィルタ演算部の構成図
【図3】重複保持法の演算内容の概念図
【図4】番組ジャンルとフィルタ処理との関係図
【図5】音声チャンネル拡張部の構成図
【図6】デジタルフィルタ演算部の動作のフローチャート
【図7】サラウンドモードに要するフィルタタップ数と演算量の関係図
【図8】フィルタタップ数とフィルタの周波数特性の関係図
【図9】実施の形態1におけるマルチストリーム処理におけるサラウンドモードの選択例を示す図
【図10】実施の形態2におけるストリーム処理装置の構成図
【図11】実施の形態2における音声出力部と音声増幅部の構成図
【図12】実施の形態2における視聴位置を表す図
【図13】実施の形態2における視聴位置とサラウンドモードの選択例を示す図
【発明を実施するための形態】
【0013】
(実施の形態1)
図1は、実施の形態1におけるストリーム処理装置の構成図である。
【0014】
実施の形態1におけるストリーム処理装置は、チューナー部101、トランスポートデコーダ部102、番組情報取得部103、AVデコーダ部104、フレームメモリA105、音声チャンネル拡張部106、デジタルフィルタ演算部107、音声出力部109、フレームメモリV110、映像出力部111、演算量測定部112、CPU113で構成される。
【0015】
以下、図1を用いて説明する。
【0016】
チューナー部101は、アンテナ等で受信されたデジタル放送信号(IF)を入力し、復調し、トランスポートストリーム(TS)として出力する。
【0017】
トランスポートデコーダ部102は、チューナー部101の出力したトランスポートストリームを受けて、トランスポートストリーム中に含まれるPSI(Program Specific Information)/SI(Service Information)からトランスポートストリームパケットの解析を行う。そして、トランスポートストリームに多重化されたデータから、目的の番組の映像、音声の各ES(Elementary Stream)を分離し、音声PES(Packetized Elementary Stream)(AP)と映像PES(VP)とを出力する。
【0018】
番組情報取得部103は、トランスポートストリームに含まれるPSI/SIを抽出する。PSI/SIに含まれるEIT(Event Information Table)には放送番組の名称、ジャンル、放送日、放送内容、放送開始時間、放送継続時間などの情報が含まれる。
【0019】
AVデコーダ部104は、CPU113から指示される制御信号(AVD)を受けて、音声PESに含まれている、圧縮された音声符号化信号の復号と、映像PESに含まれている映像符号化信号の復号を行う。AVデコーダ部104において、圧縮された音声符号化信号は、ステレオ音声信号、または5.1ch〜7.1chのマルチチャンネルの音声信号へ復号されて、音声信号(AO1)として出力される。
【0020】
マルチチャンネル音声信号の5.1chは、AAC(Advanced Audio Coding)で採用されている方式で、それぞれセンタースピーカー、フロント・レフトスピーカー、フロント・ライトスピーカー、リア・レフトスピーカー、リア・ライトスピーカー、サブウーファーの音声信号に対応する。
【0021】
マルチチャンネル音声信号の6.1ch、7,1chはDolby/dtsで提唱されるサラウンド方式で、さらにバック・レフトスピーカー、バック・ライトスピーカーが加わり高い臨場感と包囲感を高めた方式である。
【0022】
AVデコーダ部104において、映像符号化信号は復号されて、映像信号VO1として出力される。AVデコーダ部104は、CPU113の制御信号AVDによって、2本以上の複数の映像ストリームを時分割で復号することにより、複数本のストリームを同時処理することが可能である。
【0023】
フレームメモリA105は、AVデコーダ部104から出力された音声信号(AO1)を受けて、バッファリングを行い、音声信号AO2として出力する。
【0024】
音声チャンネル拡張部106は、入力された音声信号AO2に対して、必要に応じて、マルチチャンネルの音声信号への拡張を行い、デジタルフィルタ演算部107に対して音声信号AO3として出力する。このマルチチャンネルの音声信号への拡張は、入力された音声信号AO2が2chの場合に、仮想的なサラウンドスピーカから音声出力されたように効果を付加する。
【0025】
例えば、音声チャンネル拡張部106は、入力された音声信号AO2がステレオ音声信号である場合に、L/Rの2chの音声信号から5.1ch、または7.1chのマルチチャンネル音声信号への拡張処理を行う。また、音声チャンネル拡張部106は、必要に応じてフロント・レフトとフロント・ライトの2chの信号成分から、仮想的にセンター、リア・レフト、リア・ライト、バック・レフト、バック・ライトの信号成分を生成する。
【0026】
また音声チャンネル拡張部106は、入力された音声信号AO2がステレオ音声信号の場合には、デジタルフィルタ演算部107で演算を行わずに、そのまま音声出力部109へ渡す信号経路を持つ。
【0027】
デジタルフィルタ演算部107は、音声チャンネル拡張部106からの出力である音声信号AO3に対して、音響効果を得るためのデジタルフィルタ演算を行う。この処理は、専用のDSPやハードウエアを用いてもよく、またソフトエアプログラムとそのソフトエアプログラムを実行するCPUを用いて構成しても構わない。
【0028】
デジタルフィルタは、一般的に音を任意の位置に定位させるAVシアターシステムや音響再生システムや、音に反射音を付加して拡がり感を持たせる音響再生システムや映像再生システム等で多く使用されている。デジタルフィルタの構成は、フィードバック部を有するIIRフィルタと、フィードバック部を持たないFIRフィルタとに分類される。FIRフィルタは安定性と位相歪のない特性により映像音響機器の分野で広く用いられており、本実施の形態1によるストリーム処理装置でもFIRフィルタを用いる。
【0029】
また、デジタルフィルタの演算は時間領域の処理ではなく周波数領域での処理を行うと、ベクトルの積算になり、単位時間辺りの演算回数(乗算/加減算)が少なくなることが知られている。よってデジタルフィルタ演算部107は、フーリエ変換を用いて周波数領域での演算を行い、その積を逆高速フーリエ変換(IFFT)し、時間領域に戻し、音声信号AO4を出力する。
【0030】
音声出力部109は、入力されるストリームが複数の場合には、出力端子に出力する音声信号を選択し、D/A変換処理等を行ってアナログ音声信号AOUTを出力する。
【0031】
演算量測定部112は、AVデコーダ部104の処理内容に応じて、ストリーム処理の単位時間あたりの演算量を計算する。AVデコーダ部104の演算量は、MPEG2やH.264等のように圧縮符号化の種類や、1080iや720pなどの映像フォーマットによって異なるが、本実施の形態1では同時に処理するストリームの本数で負荷を判断する。
【0032】
CPU113は、番組情報取得部103の出力SI2と、演算量測定部112の出力CONTとを受けてサラウンド処理の種類を判断し、音声チャンネル拡張部106とデジタルフィルタ演算部107とに、サラウンド処理の種類を通知する制御信号(サラウンドモード信号)SMODEを出力する。
【0033】
フレームメモリV110はAVデコーダ部104にて出力された映像信号を一旦蓄積し、音声出力部109から出力される音声信号と同期をとるように調整してから、映像出力部111で画面などに映像として出力する。
【0034】
続いて本実施の形態1における動作例を説明する。
【0035】
実施の形態1におけるストリーム処理装置において、トランスポートストリームから映像、音声信号を復号するまでの一連の処理、および放送で多重されるトランスポートデコーダから、番組情報SI/PSIを抽出する技術は一般的に知られている技術であるため、その動作説明は省略する。
【0036】
CPU113は、入力ストリームに対して、SIに含まれる番組情報(番組のジャンル)を解析し、音声チャンネル拡張部106、デジタルフィルタ演算部107におけるサラウンド処理の演算内容を決定する。例えば、映像ストリームAと映像ストリームBの2chのストリームを同時に復号する場合、CPU113は映像ストリームAと映像ストリームBの2つの番組情報を、番組情報取得部103より入手して解析を行い、映像ストリームAとBのそれぞれに対する、音声チャンネル拡張部106による音声信号の拡張処理と、デジタルフィルタ演算部107におけるサラウンド処理の方式を決定し、制御信号SMODEとして音声チャンネル拡張部106とデジタルフィルタ演算部107とに対して出力する。
【0037】
以下、図2を用いてサラウンド処理の動作内容について説明する。
【0038】
図2は、図1で示した音声チャンネル拡張部106、デジタルフィルタ演算部107の構成例を示した図である。
【0039】
デジタルフィルタ演算部107は、フーリエ変換部201、畳み込み演算部202、逆フーリエ変換部203とで構成される。
【0040】
フーリエ変換部201は、時間領域で表された音声信号AO3を入力し、時間領域の信号をある定められた時間窓毎に高速フーリエ変換処理(FFT)を行うことによって周波数領域に変換し、音声信号ベクトルFA1を出力する。この処理の際に、フーリエ変換部201は、フロントチャンネル(フロント・レフト、フロント・ライト)に対してFFTの処理を行い、次にCPUからの指示に応じてリアチャンネル(リア・レフト、リア・ライト)とバックチャンネル(バック・ライト、バック・レフト)に対してFFTの処理を行い、周波数領域の信号を得る。
【0041】
畳み込み演算部202、逆フーリエ変換部203も同様に、CPU113からの指示に応じてフロントチャンネル、およびリアチャンネル、バックチャンネルに対して畳み込み演算と逆フーリエ変換とを行う。
【0042】
フーリエ変換処理、および畳み込み処理は、一般的に重複保持法と重複加算法などが知られているが、本実施の形態1では、重複保持法を用いる。
【0043】
以下に重複保持法の演算内容について、図3を用いて説明する。
【0044】
図3は、入力信号系列xにフィルタ係数hを畳み込み、出力信号系列yを求める場合の処理の流れを示した図である。FFT処理は、入力音声信号に対してフーリエ変換するFFT_Aと、フィルタ係数に対してフーリエ変換処理するFFT_Bとで構成される。
【0045】
図3の中で時間窓Wn−1は、現在処理を行っている時間窓Wnの一つ前の時間窓であり、時間窓Wn+1は、次の時間窓である。時間窓Wn−1、Wn、Wn+1は、同じ窓長を持ち、互いに係数長Lサンプルだけ重なり合うように設定される。現在の時間窓Wnの窓長をNサンプル、係数長をLサンプル、データの更新長をMサンプルとすると、N=L+Mの関係が成り立つ。
【0046】
入力信号系列xのうち、直前の時間窓Wn−1で使用したデータの後ろからLサンプル取り、現在の時間窓Wnのデータの後ろからMサンプルのデータを取り、長さNの実数信号系列としたものをFFT_Aに入力する。FFT_Aの虚数入力は0のみのデータ(Nサンプル)が入力される。そして、FFT_Aにより、FFT処理を行うと長さNのデータベクトルX(複素数、周波数領域)が出力される。
【0047】
フィルタ係数hについては、長さLの係数を前詰めし、後ろに長さMのゼロを付加し、長さNの時間領域の実数係数を作る。フィルタ係数hの実数系列は、FFT_Bの実数入力B01に入力され、FFT_Bの虚数入力は、0のみのデータ(Nサンプル)が虚数入力に入力される。この実数係数に対し、FFT_Bにより、窓長NのFFTを行うと、長さNの係数ベクトルH(複素数、周波数領域)が出力される。
【0048】
次に、複素乗算部MULTは、係数ベクトルHとデータベクトルXとについて、要素毎に複素乗算を行う。
【0049】
すなわち、係数ベクトルHをH=[H(1),H(2),…,H(N)]とし、データベクトルXをX=[X(1),X(2),…,X(N)]としたとき、複素乗算部MULTは、複素乗算結果Yが(数1)となるように演算を行い、この演算結果をIFFTへ出力する。
【0050】
【数1】

【0051】
IFFT部は、演算結果Yに対して、窓長Nの逆フーリエ変換(IFFT)を行い時間領域に戻し、出力信号系列yを出力する。なお、IFFTの虚数出力は使用しない。
【0052】
求められた出力信号系列yのうち、先頭のLサンプルは、循環畳み込みの影響を受けているため廃棄する。残ったMサンプルの信号データが、求める出力信号系列yとされる。
【0053】
以上が、重複保持法におけるFFT処理、および畳み込み処理であり、デジタルフィルタ演算部107は上記の一連の信号処理を行い、音声信号(AO4)を出力する。
【0054】
続いてCPU113が、番組情報を受けてデジタルフィルタ演算部107を制御する動作を説明する。
【0055】
図2において、番組情報SI2を受信したCPU113は、番組のジャンルを識別し、番組の種類に応じてフィルタ処理の種類を決定し、音声チャンネル拡張部106へ制御信号SMODEを出力する。CPU113が決定する番組ジャンルとフィルタ処理の関係の例を図4に示す。
【0056】
図4において、番組のジャンルをニュース、バラエティなど10種類に区分し、それぞれの番組の特徴に応じてサラウンドのモードを「ノーマル」、「サラウンドタイプ1」、「サラウンドタイプ2」、「サラウンドタイプ3」の4種類に分類している。サラウンドモードは、入力ストリームに対して、音声チャンネル拡張部106とデジタルフィルタ演算部107の処理内容、およびフィルタ係数108を決定する。
【0057】
以下、図4に示したサラウンドモードの処理内容について説明する。
【0058】
サラウンドモードのノーマルは、入力音声信号に対して、フィルタ処理を行わずに音声出力するモードである。サラウンドモードのノーマルでは、音声信号は、デジタルフィルタ演算部107を通らずに、音声チャンネル拡張部106から音声出力部109へと出力される。本モードは2chで再生するためサラウンドチャンネルによる臨場感は得られないが、フィルタ演算が無いので処理の負荷が軽減される。本モードに適する番組は、臨場感よりも情報の取得を目的としたニュースや情報番組等が考えられる。
【0059】
サラウンドモードのサラウンドタイプ1は、2chのステレオ音声に対して、5.1chへの音声チャンネルの拡張を行い、フィルタの畳み込み演算をフロントチャンネル、リアチャンネルに対して、それぞれ512タップを用いて処理を行うモードである。ステレオ入力に対して、5.1chへの拡張を行うため、サラウンド感が得られるようになる。
【0060】
サラウンドモードのサラウンドタイプ2は、2chのステレオ音声に対して、5.1chへの音声チャンネル拡張を行い、デジタルフィルタの畳み込み演算を、フロントチャンネル、リアチャンネルに対して1024タップを用いて演算するモードである。サラウンドタイプ1に比べて、音声処理に演算資源を使用するが、より強い広がり感が得られるようになる。ステレオ音声ではあるがコンサートのようなサラウンド処理の効果的なコンテンツに適する。
【0061】
サラウンドモードのサラウンドタイプ3は、5.1chのステレオ音声に対して、7.1chへの音声チャンネル拡張を行い、デジタルフィルタの畳み込み演算を、フロントチャンネル、リアチャンネル、バックチャンネルに対して1024タップを用いて処理を行う。本モードはバックチャンネルが加わるため、さらに強い広がり感が得られる。5.1chの映画やオーケストラ等の収録された音楽コンテンツが考えられる。
【0062】
実施の形態1では、各サラウンドモードに適した4種類のフィルタ係数をメモリに格納し、畳み込み演算部202は、指定されたサラウンドモードに対応するタップ数のフィルタ係数を使用してフィルタ演算を行う。
【0063】
次に図4の各サラウンドモードにおける音声チャンネル拡張部106とデジタルフィルタ演算部107の動作について、図5、図6を用いて説明する。
【0064】
図5は、音声チャンネル拡張部106の構成例を示した図である。サラウンドモードがノーマルの場合、音声チャンネル拡張部106は、入力された音声信号AO2を受けて、信号処理を行わずに音声信号AO2_1を音声出力部109へ出力する。
【0065】
サラウンドモードがサラウンドタイプ1、またはサラウンドタイプ2の場合、音声チャンネル拡張部106は入力された音声信号AO2を受けて、音声信号AO2_2の経路を通り、2ch入力信号(LF_in、RF_in)から5ch(LF_out、LS_out、CF_out、RS_out、RF_out)への拡張処理を行う。実施の形態1では、(数2)のようなマトリクス演算を行う。
【0066】
【数2】

【0067】
サラウンドモードがサラウンドタイプ3の場合には、入力された5.1chの音声信号AO2に対して、さらに、AO2_3の経路で示す、(数3)で示すバックチャンネル信号を生成する。
【0068】
【数3】

【0069】
(数3)においてDelayは、512サンプル分の時間遅延を意味する。上記の処理によって本モードでは、5.1chを7.1chの音声信号に拡張して出力する。
【0070】
図6は、デジタルフィルタ演算部107の動作内容についてのフローチャートである。
【0071】
サラウンドモードがノーマルの場合、音声チャンネル拡張部106の出力はデジタルフィルタ演算部107を介さずに音声出力部109へ直接入力されるため、デジタルフィルタ演算部107は演算を行わずにそのまま終了する(S11でYへ進む)。
【0072】
サラウンドモードがノーマル以外の場合には、デジタルフィルタのタップ数を決定する(S12)。サラウンドモードがサラウンドタイプ1の場合には、デジタルフィルタのタップ数を512タップに設定する。サラウンドモードがサラウンドタイプ2の場合には、デジタルフィルタのタップ数を1024タップに設定する。サラウンドモードがサラウンドタイプ3の場合には、デジタルフィルタのタップ数を1024タップに設定する。
【0073】
続いて、フロントチャンネルの音声信号に対してFFTを行い(S13)、リアチャンネルの音声信号に対してFFTを行う(S14)。
【0074】
続いて、サラウンドモードがサラウンドタイプ3であるか否かを判断する(S15)。サラウンドモードがサラウンドタイプ3である場合には、バックチャンネルの音声信号に対してFFTを行う(S15でYへ進み、S16)。サラウンドタイプ3でない場合には、S17へ進む(S15でNへ進む)。
【0075】
続いてフロントチャンネルのFFTの出力結果に対してフロントチャンネルの畳み込みを行う(S17)。
【0076】
さらに、リアチャンネルのFFTの出力結果に対してリアチャンネルの畳み込みを行う(S18)。
【0077】
さらに、サラウンドモードがサラウンドタイプ3であるか否かを判断する(S19)。サラウンドモードがサラウンドタイプ3の場合には、バックチャンネルのFFTの出力結果に対してバックチャンネルの畳み込みを行う(S20)。サラウンドタイプ3でない場合には、S19でNへ進む。
【0078】
そして、各チャンネルに対して逆FFTを行う(S21)。
【0079】
なお、各チャンネルに対して、FFT、畳み込み、逆FFTの処理を順番に行えばよいため図6に示したフロー以外にも、異なる順番で行ってもよい。例えば、リアチャンネル、フロントチャンネルの順に行ってもよく、フロントチャンネルのFFT、畳み込み、逆FFTと手順を進めてから、リアチャンネルのFFT、畳み込み、逆FFTと手順を進めても構わない。また、各チャンネルの処理を並列に実施しても構わない。
【0080】
次に、それぞれのサラウンドモードに要するフィルタタップ数と演算量について図7に示す。
【0081】
サラウンド処理における演算量は、フーリエ変換および畳み込み演算における乗算処理が支配的であり、Nタップの重複保持法における演算量は、約(N/2)・log2Nであることが知られている。従って、512タップのFFTの演算回数は2304回であり、フロントチャンネルとリアチャンネルとを合わせた演算回数は4608回となる。
【0082】
また、1024タップのFFTの演算回数は5120回であり、フロントチャンネルとリアチャンネルとを合わせた演算回数は10240回である。さらに、フロントチャンネルとリアチャンネルとバックチャンネルとを合わせた演算回数は15360回となる。
【0083】
すなわち、サラウンドタイプ1の場合の演算量(4608回)をXとおくと、サラウンドタイプ2の場合の演算量(10240回)は、2.22X、サラウンドタイプ3の場合の演算量(15356回)は3.33Xとなる。
【0084】
次に、フィルタのタップ数と音質の関係について、図8を用いて説明を行う。
【0085】
デジタルフィルタはフィルタのタップ数を増やせば、それだけ高い周波数分解能での処理ができるが、それに要する積和演算の回数もタップ数だけ必要となる。一般的にFIRフィルタは、無限のタップ数を持つ場合、目的の周波数特性を得られることが知られているが、実際にハードウェアやソフトウェアで実装する場合は、有限長のタップ数でフィルタを構成する必要がある。
【0086】
図8は、デジタルフィルタのタップ数とフィルタの周波数特性の関係を示す図であり、横軸は周波数ω、縦軸はフィルタの振幅特性のデシベル量(dB)である減衰量A(e)を示している。伝達関数H(e)とおくと、A(e)は(数4)のように表される。
【0087】
【数4】

【0088】
図8はフィルタのタップ数が異なる場合の周波数特性を示している。曲線(A)はタップ数の少ないフィルタの周波数特性であり、曲線(B)はタップ数の多いフィルタの周波数特性を示している。フィルタのタップ数と周波数特性との関係を示すパラメータとして以下の3つが挙げられる。
(1)通過域 [0,ωp]
通過域とは、入力信号を通過させる周波数帯域であり、図8において通過域[0,ωp]が広いほど高い周波数を再生することができる。タップ数が多いほど通過域が広いため、多タップの方がより高い音を再生することができる。
【0089】
曲線(A)の通過域[0,ωp-A]は、曲線(B)の通過域[0,ωp-B]より狭くなっている。
(2)通過域リップルδ
デジタルフィルタは、通過域では振幅特性が許容範囲δの範囲である必要がある。このδを通過域リップルといい、通過域リップルが小さい程、ゲインの変動が無いため安定した音圧で再生できる。タップ数が多いほどリップルが小さいため、多タップフィルタの方が安定した音量で再生できる。
【0090】
曲線(A)の通過域リップルδAの範囲は、曲線(B)の通過域リップルδBの範囲より広くなっている。
(3)遷移域[ωp、ωs]
入力信号を阻止する周波数[ωs、π]を阻止域といい、通過域から阻止域の周波数の中間の周波数[ωp、ωs]を遷移域という。タップ数が多いほど、遷移域[ωp、ωs]が短く、より急峻なフィルタ特性を得ることができるため、再生信号は低雑音となる。
【0091】
曲線(A)の遷移域[ωp_As_A]は、曲線(B)の通過域[ωp_Bs_B]より広くなっている。
【0092】
このように、タップ数が多い曲線(B)の方が、タップ数の少ない曲線(A)よりも良好であり、タップ数が多いほど高音質で周波数変換を行うことができる。
【0093】
続いて本実施の形態1において、2本以上のストリームを同時処理する場合の動作について説明する。
【0094】
図9は、マルチストリーム処理におけるサラウンドモードの選択例を示す図である。図9を用いて、3ch同時復号時と、4ch同時復号時における動作例を示す。
【0095】
CPU113は、演算量測定部112によって、同時処理するストリーム本数を検出し、音声チャンネル拡張部106、およびデジタルフィルタ演算部107へ、制御信号SMODEを出力する。
【0096】
本実施の形態1におけるストリーム処理装置では、デジタルフィルタ演算部107におけるサラウンド処理の最大処理能力として、サラウンドタイプ3のストリーム2本を処理する性能を割り当てる場合を考える。この場合、デジタルフィルタ演算部107で処理可能なサラウンド処理は、3.33X×2=6.66Xの演算量までが可能となる。
【0097】
同時に処理するストリーム本数が増えると、デジタルフィルタ演算部107の処理負荷が高くなり最大演算量である6.66Xを超えるため、サラウンド処理の割り当てを削減する必要がある。
【0098】
図9において、入力ストリームをストリームA、B、C、Dと順に加えていくことで、同時に再生させる本数を1チャンネルから4チャンネルと増加させた場合の、各ストリームの復号処理に割り当てるサラウンドタイプについて示している。
【0099】
ストリームAのみの場合、または、ストリームAとBの2つのストリームを同時に再生させた場合には、それらに要するFFT演算量は、それぞれXと、4.33Xであり、デジタルフィルタ演算部107の最大処理能力の範囲内である。このため、これらの場合には、入力ストリームに適したサラウンドモード(図9において「1ch時」と示す)そのままで再生させることができる。
【0100】
一方、ストリームA、B、Cを同時に再生させる場合には、入力ストリームで指定されたそのままのサラウンドモードで再生させるには、FFT演算量は7.66Xが必要となり、このままではデジタルフィルタ演算部107の最大処理能力を超えてしまう。
【0101】
このため、デジタルフィルタ演算部107においてFFT演算量を、サラウンド効果の高い番組から順に割り当てて、その総和がデジタルフィルタ演算部107の最大処理能力に収まる範囲となるように決定する。
【0102】
ストリームA、B、Cを同時に再生させる場合に、サラウンド効果が高いのは、サラウンドモードがサラウンドタイプ3であるストリームBとストリームCとである。そこで、これら2つに対して優先的にデジタルフィルタ演算部107における処理能力を割り当て、ストリームAについてはサラウンドモードを下げ、ノーマルとすること(図9の3chのストリームAの箇所、ハッチングで示す)で、ストリームA、B、Cの同時再生に要するFFT演算量が6.66Xとなり、デジタルフィルタ演算部107で最大処理能力の範囲内である。
【0103】
また、ストリームA、B、C、Dを同時に再生させる場合にも、サラウンド効果が高いのは、サラウンドモードがサラウンドタイプ3であるストリームBとストリームCとである。そこで、これら2つに対して優先的にデジタルフィルタ演算部107における処理能力を割り当て、ストリームA、Dについてはサラウンドモードを下げ、ノーマルとすること(図9の4chのストリームA、Dの箇所、ハッチングで示す)で、ストリームA、B、C、Dの同時再生に要するFFT演算量が6.66Xとなり、デジタルフィルタ演算部107で最大処理能力の範囲内である。
【0104】
本実施の形態1によれば、ストリーム処理本数が増えてデジタルフィルタ演算部107での処理負荷が増えた場合には、視聴している映像ストリームの番組種別(例えば、ニュース、スポーツ、コンサート、映画など)に応じて、各ストリームに対して音響処理能力を効果的に割り当てることが可能になる。
【0105】
(実施の形態2)
図10は、実施の形態2におけるストリーム処理装置の構成図である。
【0106】
実施の形態2において、実施の形態1のストリーム処理装置と異なる箇所は、実施の形態1のストリーム処理装置に加え、さらにカメラ301と音声増幅部302とを備える。
【0107】
カメラ301は、CCD等の撮像素子を介して映像ストリームを視聴するユーザーの映像を取り込み、映像信号VINを出力する。CPU113は、カメラ301の出力を受けて、映像ストリームを視聴しているユーザーの位置を検出する。
【0108】
音声増幅部302は、音声出力部109から出力される音声信号AO5を受けて、一定の電圧まで音声信号の増幅を行い、接続されたスピーカーをドライブするために必要なエネルギーを供給する。
【0109】
音声出力部109、および音声増幅部302の構成例を、図11に示す。
【0110】
実施の形態2では、4本のストリームA、B、C、Dの同時再生処理を行い、4系統のスピーカーからは、互いに異なるストリームの音声を同時に出力する。
【0111】
音声出力部109は、デジタルフィルタ演算部107から出力された、4本のストリームA、B、C、Dの音声信号である音声信号AO5_A、AO5_B、AO5_C、AO5_Dを入力すると同時に、CPU113から送信された制御信号CONT2の指示を受ける。そして、各スピーカーに対して出力するストリームA、B、C、Dを決定し、音声増幅部302に対してそれぞれのストリームに対応する音声信号AO6_A、AO6_B、AO6_C、AO6_Dを出力する。
【0112】
音声増幅部302は、これら4本の音声信号を受けて、接続されたスピーカーをドライブするために必要なエネルギーまで音声信号を増幅し、音声信号AO7_A、AO7_B、AO7_C、AO7_Dとして出力する。
【0113】
以下に実施の形態2における動作例を説明する。
【0114】
実施の形態2において、4本のストリームの音声信号を同時に出力するストリーム再生処理装置を例に説明する。複数の映像ストリームを複数のユーザーが同時に視聴を行う場合に、出力される音声はスピーカーと、ヘッドホンとが同時に使用される。実施の形態2において、1本のストリームは7.1chスピーカーに出力し、その他3本のストリームは2chヘッドホンに出力するものとする。
【0115】
このときに表示される映像信号は、画面を分割して同時に視聴する形態でも構わないし、4つの映像ストリームが順次表示され、それらの表示に同期したシャッター付きメガネを用いて視聴する形態でも構わない。後者の場合には、映像表示の垂直同期周波数を高速化して、4つのメガネのシャッターを4つのストリームのいずれかが表示されている際にシャッターが開放されるように連動させるように構成することができる。各メガネと、表示するストリームとは、図示しない対応付け手段により割り当てるものとする。
【0116】
この場合、ヘッドホンを使用しているユーザーについては、視聴位置によって得られる音響効果は変化しないが、スピーカーを使用しているユーザーが得られる音響効果は、視聴位置によって異なることが想定される。
【0117】
CPU113は、5.1chスピーカーへの入力が、4本のストリームA〜Dのいずれかを判断する。さらに、カメラ301により撮影した情報から、5.1chスピーカシステムに出力されているストリームを視聴しているユーザー位置の検出を行う。ユーザー位置の検出は、ユーザーの頭の位置とヘッドホンの装着の有無を画像から識別することにより行う。この際に、ヘッドホンを装着していないユーザーが、5.1chスピーカから出力されたストリームを視聴していると判断し、このユーザーの位置を検出する。ユーザーを特定する際に、リモコン等の装置を用いて、スピーカーを使用しているユーザーの情報をユーザーが入力するようにしても構わない。
【0118】
例えば、5.1スピーカーシステムに出力するストリームが、ストリームCであった場合には、CPU113はストリームCを視聴しているユーザーの視聴位置情報を用いてサラウンドモードの選択を行う。一方、ストリームA、B、Dは2chヘッドホンに出力するため、5.1ch等へのサラウンド拡張を行っても効果がないと判断し、サラウンドモードをノーマルに固定する。
【0119】
以下に、5.1スピーカーシステムを視聴しているユーザーの位置とサラウンド処理の決定の説明を行う。
【0120】
5.1スピーカーシステムからの出力を聴いているユーザーの位置が、画面中央の場合(センター)、画面中央に対して左より(レフト)、または右より(ライト)、位置検出不可(圏外)の4種類のいずれかの識別を行う。
【0121】
図12は、ユーザーの視聴位置の概念を示す図である。
【0122】
図12において、テレビ1301と、サラウンドスピーカ1302、1303とからストリーム処理装置が構成されている。ユーザーは、ストリーム再生装置により構成されるサラウンド空間について、1311〜1315のような位置で視聴することができる。テレビ1301の画面の中央部に相当する位置がセンター1311である。画面中央に対して左よりの位置がレフト1312である。また、画面中央に対して右よりの位置がライト1313である。センター1311の位置はサラウンド感が高く、レフト1312やライト1313の位置はややサラウンド感が低いものの比較的サラウンド感が感じられる位置であるとし、それよりも離れた位置が圏外1314、1315に相当する。
【0123】
このような状況で、ユーザーの位置がレフト1312、ライト1313、圏外1314、1315の場合には、音響処理に対するサラウンド処理の演算量を削減するようにする。
【0124】
図13には、入力ストリームCが映画5.1chの場合の動作を示したものである。音声チャンネル拡張部106、デジタルフィルタ演算部107の処理内容を決めるサラウンドモードは実施の形態1と同じであるため説明を省略する。
【0125】
図13に示したように、ユーザーの視聴位置がセンターの場合には、サラウンドモードしてサラウンドタイプ3を選択し、フロントチャンネル、リアチャンネル、バックチャンネルに対して1024タップを用いてフィルタ処理を行う。
【0126】
ユーザーの視聴位置がレフトまたはライトの場合には、センター位置に比べて音場の臨場感が乏しく、サラウンド処理を簡易化してもユーザーが識別しにくいため、サラウンドモードはサラウンドタイプ2に変更して演算量を削減することができる。
【0127】
視聴位置が圏外の場合は、音響効果が得られるエリアから外れている場合、またはカメラからユーザーが識別できない場合であり、正常な音響効果が得られないと判断して、演算量を最大限に削減し、サラウンドモードをノーマルに変更する。
【0128】
以上のように、実施の形態2によれば、ユーザーの位置情報、および視聴しているスピーカーシステムの種別に応じて、サラウンド処理性能を削減する制御が実現可能になる。デジタルフィルタ演算部107の処理をCPUを用いて行っている場合などには、適正な音響処理範囲内に押さえることで、その余った処理能力を他の処理に割り当てることが可能になる。
【産業上の利用可能性】
【0129】
本発明のストリーム処理装置は、マルチストリームの音声信号を再生する際に、各ストリームのデジタルフィルタ処理の演算量を番組情報などに応じて適切に調整することにより、デジタルフィルタ演算部の処理能力の範囲内で処理ができるため、特にサラウンドストリームのマルチストリームの再生に有用である。
【符号の説明】
【0130】
101 チューナー部
102 トランスポートデコーダ部
103 番組情報取得部
104 AVデコーダ部
105 フレームメモリA
106 音声チャンネル拡張部
107 デジタルフィルタ演算部
109 音声出力部
110 フレームメモリV
111 映像出力部
112 演算量測定部
113 CPU

【特許請求の範囲】
【請求項1】
マルチストリームのトランスポートストリームを受信して音声データと番組付随情報とを抽出するトランスポートストリームデコーダと、
前記音声データを同時に復号するデコード手段と、
前記デコード手段が復号した音声データに対して音声チャンネルの拡張及びデジタルフィルタ演算処理を含む音響効果の演算を行う音声処理手段と、
前記デコード手段の単位時間あたりの演算量を測定する演算量測定部と、
前記番組付随情報と前記演算量測定部で測定した演算量に応じて、前記音声処理手段の処理能力を超えないように、前記マルチストリームのそれぞれのストリームに対して、前記音声処理手段における音響処理を切り替えるように制御する制御手段とを備えることを特徴とするストリーム処理装置。
【請求項2】
前記制御手段は、
前記番組付随情報のうちの番組種別に応じた音響効果演算のタイプを複数保持し、
前記番組種別に応じた前記音響効果演算の優先度を保持し、
前記音声処理手段の処理能力が越える音響効果演算が想定される場合には、優先度の低い前記番組種別に対応するストリームに対しては、より音響効果演算が低くなる音響効果演算を選択するように、前記マルチストリームのそれぞれに対して音響効果演算を選択して、前記音声処理手段の処理能力を超えないように制御する請求項1記載のストリーム処理装置。
【請求項3】
前記音響効果演算は、前記マルチストリームのそれぞれのストリームを構成する音声信号のチャンネルに対して、FFT演算、畳み込み演算、逆FFT演算を順に行う処理を含むことを特徴とする請求項2記載のストリーム処理装置。
【請求項4】
さらに視聴するユーザーの位置を検出する位置識別手段を備え、
前記制御手段は、さらに、前記位置識別手段により識別した位置と、前記音声処理手段に接続されるスピーカーの種別に応じて、前記音声処理手段における音響処理を切り替えるように制御することを特徴とする請求項2記載のストリーム処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2013−12884(P2013−12884A)
【公開日】平成25年1月17日(2013.1.17)
【国際特許分類】
【出願番号】特願2011−144024(P2011−144024)
【出願日】平成23年6月29日(2011.6.29)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】