説明

音声処理装置

【課題】映画番組などの記録で、5.1チャンネルのサラウンド音声の本編と、本編の間の2チャンネルのCMでのステレオ音声を1番組として、1番組記録中にチャンネル数を変化させることなくエンコードすることを目的とする。
【解決手段】番組情報を入力手段1からの音声信号を、利用者からのエンコードの指定手段2により指定されたチャンネル数の出力音声に配分手段4にて配分し、配分された音声信号のゲイン設定手段5にて、ゲイン設定を行ったうえで、エンコード手段6にて、指定手段2にて指定されたチャンネル数でエンコードする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、圧縮符号化された音声信号を伸張後、再度符号化する音声処理装置に関するものである。
【背景技術】
【0002】
従来、圧縮符号化されて記録されたビデオ信号およびオーディオ信号をCD−ROM、DVD−ROM、半導体メモリ、ハードディスク等の記録媒体から読み出し、デコード(伸張)して出力するデータ再生装置が知られている。データ再生装置が伸張されたデータを装置に接続された映像モニタ、音響スピーカ等に送ることにより、ビデオおよびオーディオの再生が実現される。デジタル放送もまた圧縮符号化されたビデオ信号およびオーディオ信号を受信し、記録媒体からの再生同様に、デコード出力することで再生を実現することができる。
【0003】
圧縮符号化に関しては、多くの規格が規定されている。例えばMPEG(MotionPicture Experts Group)は、ビデオ信号およびオーディオ信号
の両方を圧縮符号化する規格として知られている。
【0004】
以下従来のデジタル放送を受信再生するシステムや記録媒体からの再生システム、及び再生方法について説明する。なお、出願人は、特許文献1、及び特許文献2に開示されているデジタル放送の受信装置を認識しており、本発明の課題を明確にするために、先行技術の内容を従来例として、簡単に説明する。
【0005】
まず特許文献1における従来のデジタル放送用信号の受信装置について説明する。複数の音声チャンネルからなる音声信号が入力されるデジタル放送受信装置において、入力する複数の音声チャンネルに対して、番組中の音声イベントを抽出することにより、付加情報としてダウンミックス係数を送り、再生機側でダウンミックスすることで、音量バランス調整する機能を有するものである。これは、デジタル放送のマルチチャンネル放送による多チャンネル送信の技術を利用し、音声イベント毎に、チャンネルをひとつずつ割り当て、送信を行い、再生機側で、割り当てられた音声のあるチャンネルと、イベント毎の付加情報を元に、ダウンミックスを実行して、音量バランスを実行するものである。
【0006】
次に特許文献2における従来の放送受信装置について説明する。装置の起動時、番組再生用のチャンネル変更時において、チャンネル毎に異なる放送言語や、音声チャンネル情報に対応し、利用者が入力した最大音声チャンネル数を超えない範囲で、チャンネル数を自動的に選択し、再生決定するものである。
【特許文献1】特開2001−298680号公報(第3−6頁、第1図、第13図)
【特許文献2】特許第3525913号公報(第3−6頁、第1図、第3図)
【発明の開示】
【発明が解決しようとする課題】
【0007】
先行例である特許文献1の装置では、複数の音声チャンネルからなる音声信号を復号し、各チャンネルに分離するとともに、音声イベントに起因して、ダウンミックス係数を元に音量調整を行い、出力すべき合成音声を作り出すものである。
【0008】
放送番組に、音声イベントなる情報が存在しない場合は、放送されているチャンネル数情報を元に、あらかじめ定められたダウンミックス係数で再生を行う。放送番組には、本編と本編以外の宣伝用番組(以下CMと記す)からなるタイトルがある。そこで、本編とCMで、再生チャンネル数が変わることがある。例えば、本編が映画タイトルなどで5.1チャンネルのサラウンド音声であり、CMが2チャンネルのステレオ音声からなるタイトルを想定して、説明する。
【0009】
そこで、映画タイトルを再生するとともに、再生素材のチャンネル数を維持しながら記録しようとすれば、本編と本編以外で、再生チャンネル数に合わせて記録するチャンネル数を変更して記録することが必要である。CM部分を含んだ映画タイトル全編を、一本の映画タイトルとして、連続記録する場合には、放送チャンネル数(5.1チャンネルから2チャンネルへ)の変化に応じて、記録するチャンネル数を変化させて記録する必要がある。しかしながら、DVDなどの番組記録方式(例えばDVDビデオ規格に互換性のある記録方式)によっては、タイトル内で、記録する音声のチャンネル数の変更を許さない場合がある。
【0010】
このため、記録するチャンネル数を2チャンネルと固定した場合は、5.1チャンネル区間は、予め定められたダウンミックス係数を用いて、2チャンネルにダウンミックスすることによって2チャンネル化して記録する。CMなどの2チャンネル区間は、そのまま2チャンネルとして記録する。つまり、2チャンネルにダウンミックスして記録する方式をとれば、番組途中のCMなどで、チャンネル数の変更があっても、2チャンネルのまま記録し続けることができる。
【0011】
ところが、記録するチャンネル数を5.1チャンネルとして固定したい場合は問題がある。5.1チャンネル区間はそのまま5.1チャンネルとして記録すればよいが、それより少ないチャンネル数の区間について、チャンネル数を変更せずに記録を継続する手段が必要である。
【0012】
そこで、特許文献1の装置の構成では、5.1チャンネルのサラウンドで放送される番組で、途中でCMなど、チャンネル数が少なくなった場合の、チャンネル数を維持して再生する手段が明示されていない。この文献に明示されている方法では、再生チャンネルを維持することができないので、再生音声から、音声のチャンネル数を変更することなく固定のチャンネル数で記録することもできない。
【0013】
また特許文献2は、利用者が設定した音声チャンネル数を、装置側で選択決定するものである。これも利用者が、音声チャンネル数を3チャンネルと設定すれば、3チャンネル以上のものは3チャンネルに変更され、2チャンネルの場合は2チャンネルで再生されるものである。
【0014】
しかしながら、特許文献2の装置を記録に想定すると、先の特許文献1の場合と同じく、再生元音声より少ないチャンネル数に配分(4チャンネルから3チャンネル)する場合は詳しく説明されているが、放送される元のチャンネル数が、記録されるチャンネル数より少ない場合の再生方法が明示されていない。つまり、5.1チャンネルで記録する場合のCMなどで2チャンネルになった場合において、いかにして5.1チャンネルで記録するかについては、明示されていない。
【0015】
本発明は、以上のような課題を解決するためになされたもので、デジタル放送のサラウンドチャンネルを有する放送番組を記録する場合に、番組内で再生チャンネル数の変化を伴った場合においても、サラウンドチャンネルの一部のチャンネルに記録するチャンネルを割り当てて、チャンネル数を変更させることなく記録し続けるものある。さらに、この記録番組の再生時においても、元の再生チャンネル数の変化前後で、再生音量がかわらない装置を提供するものである。
【課題を解決するための手段】
【0016】
第1の本発明(請求項1に対応)による音声処理装置は、番組に付随する番組情報を有する音声信号を入手する入力手段と、利用者により番組を記録するチャンネル数を指定する指定手段と、前記入力手段からの音声信号を前記指定手段により指定されたチャンネル数の出力音声に配分する配分手段と、前記配分手段の出力音声信号のうちで、前記配分手段で配分された音声信号のゲイン設定を行うゲイン設定手段と、前記ゲイン設定手段で設定されたゲイン設定により、前記配分手段から出力される複数の番組の音声信号を、前記指定手段により指定された固定のチャンネル数でエンコードするエンコード手段を備えるもので、番組内で再生チャンネル数の変化を伴った場合においても、配分手段によりサラウンドチャンネルの一部のチャンネルに記録チャンネルを割り当てて記録し続けるため、記録チャンネル数が変わらない記録し続けるとともに、ゲイン設定により記録番組の再生時に、チャンネル数の変化前後で、再生音量がかわらないように記録する手段を提供するものである
第2の本発明(請求項2に対応)による音声処理装置は、前記指定手段が、前記入力手段が入力した番組情報に所定のチャンネル数以下の音声情報をもつ番組を含んでいるか否かを判別する判別手段を有し、前記判別手段の判別情報を基にして、前記配分手段にて、該番組の音声信号を所定チャンネル数の出力音声に配分し、前記配分手段から出力される複数の番組の音声信号を、前記判別手段で判別された所定の固定のチャンネル数でエンコードするエンコード手段を備えるもので、番組情報をみることにより、5.1cチャンネルなどとサラウンド放送があると判断された場合には、サラウンドチャンネル数で固定された番組を行い、2チャンネルのステレオ放送しかないと判断された場合には、2で固定されたチャンネル数で記録する手段を提供するものである。
【0017】
第3の本発明(請求項3に対応)による音声処理装置は、ゲイン設定手段が、エンコードする番組の再生時における各チャンネルをミキシングするためのダイナミックレンジコントロール係数を設定する機能を有するもので、サラウンドの再生音声を、音量を変えることなくエンコード手段に入力し、エンコード記録する際に、再生チャンネル数の変化に応じて記録用のダイナミックレンジコントロール係数を変更して記録するため、記録音声をモニタ出力する場合においても、途中で音量がかわることのない手段を提供するものである。
【0018】
第4の本発明(請求項4に対応)による音声処理装置は、ゲイン設定手段が、エンコードする番組の再生時における各チャンネルをミキシングするためのダウンミキシング係数を変更する機能を有するもので、第3の発明とは異なる手段で、サラウンドの再生音声を、音量を変えることなくエンコード手段に入力し、エンコード記録する際に、再生チャンネル数の変化に応じてダウンミキシング係数を変更して記録するため、記録音声をモニタ出力する場合においても、途中で音量がかわることのない手段を提供するものである。
【発明の効果】
【0019】
本発明の音声処理装置は、デジタル放送のサラウンドチャンネルを有する放送番組を記録する場合に、番組内で再生チャンネル数の変化を伴った場合においても、配分手段にてサラウンドチャンネルの一部のチャンネルに記録チャンネルを割り当ててチャンネル数を変化させることなく記録し続けるとともに、記録番組を再生時において、記録時の再生チャンネル数の変化前後で、ゲイン設定手段によって設定されたゲインにて再生音量がかわらないような記録をし続けるために、サラウンドチャンネルの番組を聴きながら、サラウンドチャンネル数のまま記録するに適した装置を提供するものである。
【発明を実施するための最良の形態】
【0020】
(実施の形態1)
はじめに、本発明の実施の形態1による音声処理装置の構成を示すブロック図である図1を主として参照しながら説明する。図1は、デジタル放送を受信する入力手段1と、利用者により番組を記録する音声チャンネル数を指定する指定手段2と、入力手段1からの音声信号をデコードするデコード手段3と、デコード手段3でデコードされた音声を、指定手段2により指定されたチャンネル数の出力音声に配分する配分手段4と、配分手段4で配分された音声信号の記録用のゲイン設定を行うゲイン設定手段5と、配分手段4から出力される番組の音声信号を外部に出力する再生出力手段7と、同じ音声信号を、ゲイン設定手段5で設定されたゲイン設定によりエンコードするエンコード手段6とからなる音声処理装置を示している。
【0021】
入力手段1は、セットトップボックス(以下STBと略す)や、デジタル放送レコーダなどで衛星デジタル放送を受信する部位、パーソナルコンピュータ(以下PCと略す)のチューナ部位だけでなく、光ディスクやハードディスクなどの記録機器からの再生入力部位から構成され、エンコード手段6とは、入力された信号を圧縮符号化するものである。エンコード手段6は、エンコード音声をそのまま外部出力信号として出力するエンコード音声出力手段(図示せず)や、エンコード音声をハードディスクや光ディスク、半導体メモリなどにエンコード記録する記録手段(図示せず)から構成される。
【0022】
入力手段1が、複数のデジタル放送局の送出する電波を受信し、受信した放送電波から利用者が選局したひとつの放送局を選ぶ復調部内で復調し、エラー訂正を行い、トランスポートストリームを出力する。トランスポートストリームは、デコード手段3で、パケットID別に、映像、音声、番組情報など各々のデータにフィルタリングされたあと、映像、音声に分割されてデコードされる。
【0023】
配分手段4は、デコードされた音声信号を指定手段2に指定されたチャンネル数に配分する。例えば、利用者が2チャンネルか、5.1チャンネルかを指定するかの選択メニューによりエンコード配分チャンネル数が指示される。
【0024】
2チャンネルでのエンコードが指示された場合のデコード音声とエンコード音声の関係について図3と図4を用いて説明する。図3において、FLとはフロント左チャンネル、FRとはフロント右チャンネル、Cとはセンターチャンネル、SLとは、サラウンド左チャンネル、SRとはサラウンド右チャンネル、SWとはサブウーハチャンネルを指す。
【0025】
配分手段4は、利用者により2チャンネルへの配分が指示されているため、入力チャンネル数がいかなる場合でも出力が2チャンネルになるように配分する。
【0026】
放送番組がステレオ放送の2チャンネル音声(図3の2ch再生区間)ならそのままFRとFLの2チャンネルに配分する。5.1サラウンド番組等の3チャンネル以上のサラウンド信号のデコード音声(図4のデコード音声を参照)なら、3チャンネル以上の音声信号を、図4のエンコード音声のDMIXLとDMIXRに該当する2チャンネルにダウンミックスする。
【0027】
チャンネル数を減らすためのダウンミックス信号処理としては、ダウンミックス加算係数が規定されている。例えば、日本国内のデジタル放送で利用されているAAC(Advanced Audio Coding)方式などでは、5.1チャンネルの各チャンネルからステレオ2チャンネルへのダウンミックス係数が指示されており、ダウンミックス係数を用いた各チャンネル加算により、各位相がずれないように加算される。
【0028】
2ヶ国語放送時の記録の場合は、デュアルモノラルといわれる方式で符号化されているので、一方のチャンネル(例えば日本語/英語が記録され、日本語のみ再生など)を記録するという選択手段を持つ場合は、選択された側のモノラルの音声信号を2チャンネルでエンコードする処理を行えばよい。例えば、一方の選択チャンネル音声を位相がずれないように、もう一方のチャンネルへデータ複写することでも実現できる。元がモノラル音声信号なら、2つの左右のチャンネル信号に同じ音声信号を複写する配分を行えばよい。
【0029】
次に、指示手段2により3チャンネル以上の場合をサラウンドとして、サラウンドチャンネルでのエンコードが指示された場合について、図5を用いて説明する。デコード手段3からの音声信号チャンネルは、配分手段4からそのまま出力され、エンコード手段6に入力される。ステレオ2チャンネル番組の音声信号は、FLと、FRの2チャンネルに割り当てる。その他のデコード音声がないチャンネルは、配分手段4から音量レベル0を出力するチャンネルとして割り当てて、音量0を示すデータを出力する。このとき、エンコード手段6は、FRとFLのみ音量があり、他のチャンネルは音量0としたサラウンド音声信号としてエンコードを行う。
【0030】
デュアルモノラルでの2チャンネル番組は、2チャンネル配分の場合と同じく左右の一方の音声を選択し、他方の音声を複写したあとで、FRとFLの2チャンネルに割り当てる。その他のチャンネルは、配分手段4から音量レベル0を出力する。モノラル音声信号は、2チャンネル配分と同じく左右に同じ信号を複写し、FLとFRの2チャンネルに割り当てるか、センターチャンネルの1チャンネルのみに割り当てる。その他のチャンネルは、配分手段4から音量レベル0を出力し、エンコード手段6は、サラウンド音声信号としてエンコードを行う。
【0031】
配分手段4にて、エンコードするための音声チャンネル配分を決定したあとで、エンコードするための各音声信号の音量係数を定める必要がある。これを行うのがゲイン設定手段5である。ドルビーデジタル方式(AC−3方式と記す)と呼ばれる符号化方式でエンコードする場合、ダイナミックレンジコンプレッション(以下DRCと略す)の係数を設定する必要がある。これは、AC−3方式でエンコードされた音声信号をデコード再生する場合に有効となるものである。DRCは、マルチチャンネルエンコードされた音声信号をデコード側の再生チャンネル数などの環境により、2チャンネルでダウンミックス再生する場合に、音量を押さえて加算するように指示する係数のことである。これを設定せずにダウンミックスした場合は、特定のチャンネルの音量が、あふれるような加算になってしまう場合があり、音声歪みとなる恐れがある。
【0032】
指定手段2によりサラウンドチャンネルでのエンコードが指示され、5.1チャンネル番組をエンコードの場合は、DRC設定をON(図5参照)にする必要がある。これは、既に説明したとおり、デコード再生時に音声歪みを防ぐような設定を施す必要があるからである。一方、ステレオ音声番組など元が2チャンネル以下の場合は、DRC設定をOFFとする。ステレオ信号の場合は、DRC設定をOFFにするが、音量あふれになるようなFRとFL以外のチャンネルからの加算信号はない(0レベルであるから、加算しても元の信号の音量と変わらない)。ステレオ信号の場合、DRC設定をONにすれば、他のチャンネルからの信号があっても音量あふれがないように、信号再生レベルを下げることになってしまうので、DRC設定をOFFにしてエンコードすることが必要である。
【0033】
指定手段2により、2チャンネルへのエンコードするための配分を行う場合は、配分手段4のなかで、ダウンミックス加算係数による配分を行っているので、もとのデコード音声のチャンネル数に連動することなく、DRC設定をOFFとする(図4参照)。もちろんステレオ音声の2チャンネルを、そのまま2チャンネルでエンコードずる場合もDRC設定をOFFとする(図3参照)。
【0034】
指定手段2により、サラウンドでのエンコードが指定されている場合には、配分手段4からの各信号の音量を変更することなくエンコード手段6へ入力されるとともに、再生出力手段7へも入力されるように構成すれば、以下のような効果が得られる。
【0035】
再生出力手段7に、アナログ音声出力用DAコンバータや、HDMI端子等からなる出力端子が接続されていることを想定して説明する。DAコンバータからの音声出力、もしくはHDMIケーブルを接続した外部のAVアンプからの出力により、音声出力がなされる場合、エンコード記録が始まった途端に、記録音量の都合で出力音量が変更されるのは、好ましくない。もし、配分手段4から出力する音量が、エンコード手段6への都合により、音量を変化させる構成とすると、同じ配分手段4から出力される再生出力手段7の音量にも影響がでてしまう。もちろん、配分手段4が、エンコード手段6と再生出力手段7の各々個別に音声出力を配分すればよいが、回路規模や信号処理演算の簡易化を目的として、配分手段4からの出力を共通とした場合には、音量が変化することは好ましくない。そこで、本発明の構成例では、これを共通化した構成で示している。サラウンドエンコードの場合、チャンネルの音量を元の音量を損なうことなく出力することにより、エンコードと音声出力を両立できる効果がある。
【0036】
なお、2チャンネルエンコードモードを指定した場合は、2チャンネルのモニタ音声として再生出力手段7から出力する。配分手段4は、ダウンミックス係数を用いて、3チャンネル以上の元音声信号を、2チャンネルにダウンミックスする。もと2チャンネルの場合は、そのまま出力される。つまり配分手段4からは、再生出力手段7と、エンコード手段6には、同じ音量の2チャンネルの信号が出力される。
【0037】
一方、サラウンドチャンネルを有する番組をエンコード記録する場合において、途中で宣伝番組(CMと略す)をはさむ場合がある。図5のように、利用者がある一定期間のひとつの番組時間枠を指定し、サラウンドエンコード記録を指定した場合に、本編のクラシック音楽部は5.1チャンネル放送であり、CM部は2チャンネルステレオ放送である場合がある。CMが終わればまた5.1チャンネルのクラシック音楽部の続きがある。この場合、デコード部3で、デコードするチャンネル数の情報により、配分手段4は、5.1チャンネル区間は5.1チャンネルの音声信号をそのまま出力し、2チャンネル区間は、FLとFRの音声信号と、その他のチャンネルは0レベルの音声信号を出力する。さらにゲイン設定手段5が、5.1チャンネル区間はDRC設定をONにして、2チャンネル区間はDRC設定をOFFにしてエンコード記録を行う。この間、再生出力手段7からは、5.1チャンネル区間と2チャンネル区間で再生音量がかわることなしで(出力される音声は5.1チャンネルから2チャンネルに変わるが、これは放送音声と同じ)、音声出力することができる。
【0038】
エンコード手段6は、5.1チャンネル区間も2チャンネル区間も全て、5.1チャンネルとして記録する。またDRC設定は、5.1チャンネル区間のみONとして記録される。このようにエンコード記録された番組を、デコーダ機能を有する再生機によって、デコード再生する場合、このDRC設定を生かしてデコードすることにより、再生時の音量歪みを防ぐことができる。5.1チャンネル区間で、5.1チャンネルのスピーカ環境で再生する場合は、素材そのままの音量で再生すればよい。素材より少ないスピーカ環境で再生する場合は、ダウンミックス係数と、DRC設定を用いれば、音声歪みを起こすことなく再生が可能である。
【0039】
なお、音声チャンネル数が変化したときの情報は、デコード手段3によるデコード結果からわかるので、変化時のプレイリスト情報として、エンコード記録番組に一緒に記録する構成が望ましい。プレイリストをエンコード記録に付与することで、再生時に、プレイリストを参照すれば、再生チャンネル数が変更した場所を特定することができる。これは、すべて5.1チャンネルとして記録し続けることにより、元のチャンネル数情報が、DRC設定以外になくなってしまうので、これを補完する目的でつけるものである。チャンネル数変更情報によるプレイリスト情報を残せば、CM区間などチャンネル数がかわったところを特定できるので、タイトル再生中のスキップなどに便利である。
【0040】
5.1チャンネル区間のエンコード記録再生は、マルチチャンネルエンコードされた音声信号をデコード側の再生チャンネル数などの環境により、ダウンミックス再生する場合に、DRC設定がONになっているので、音量を押さえて加算するように指示するため、音声歪みを発生することなく再生する。このDRC設定は元来マルチチャンネルエンコード音声をダウンミックスする際に使う設定であるので、もともとの主旨にあわせた適用をおこなっている。一方2チャンネル区間のエンコード記録再生は、DRC設定がOFFとなっている。マルチチャンネルエンコード(FRとFLは音量あるが、残りは音量レベル0)された音声信号をデコード側の再生チャンネル数などの環境により、ダウンミックス再生する場合に、DRC設定がOFFになっているので、音量を押さえずに加算するように指示される。しかしFRとFL以外の音量レベルが0であるため、音声歪みを発生することなく再生することが可能である。
【0041】
もしこの2チャンネル区間もDRC設定をONにしてエンコード記録してしまうと、デコード再生時にDRCを有効とし、必要がないのに音量を押さえてしまうため、結果としてこの2チャンネル区間の音量が下がってしまう。これは放送時の音量とは異なることになってしまう。5.1チャンネルと2チャンネルの各々の区間により音量が変化しないように記録するためには、エンコード記録時に、元のチャンネル数の変化に合わせてDRC設定を変更して記録することが必要である。AC−3方式と呼ばれる符号化方式にはこのDRC設定による適用が有効である。
【0042】
なお元のデコード音声が、サブウーハチャンネルを除いて3チャンネル以上である場合は、すべてDRC設定をONにしてエンコードすることが好ましい。なぜならばFLとFR以外のチャンネルが1チャンネル以上あれば、その音声チャンネルを加算することにより音声歪みが発生する可能性があり、それを回避する必要があるためである。
【0043】
利用者が設定手段2により、2チャンネルでエンコードを設定した場合は、エンコード記録される音声が、いかなるチャンネル数の音声番組であっても、配分手段4によりダウンミックス処理で2チャンネル化され、かつDRC設定はOFFでエンコード記録される。2チャンネルエンコード記録番組の再生時は、もともと2チャンネルの音声信号しかないので、DRC設定もOFFで、もとの記録音量のままでのデコード再生が可能である。
【0044】
本実施の形態をとることにより、番組途中のCMなどで、チャンネル数が変わった場合においても、同じチャンネル数のままで記録が続けられることにより、DVDビデオ規格との互換をとった方式での番組記録が可能となる。チャンネル数が変わるごとに番組を分割して記録する必要はない。
【0045】
なお、入力手段1、指定手段2、デコード手段3、配分手段4、ゲイン設定手段5、エンコード手段6、再生出力手段7は、各々別々の半導体集積回路等とその制御用のプログラムにより実現することができる。しかし、それぞれの機能を実現できる限り、1つの半導体集積回路等とその制御用のプログラムによって実現してもよい。
【0046】
本実施の形態では、ゲイン設定手段5して、DRC設定を行う方法による実現手段について、説明してきたが、別の手段をとることもできる。他の実現手段として、ダウンミックス係数を変更するという実現手段について、以下に説明する。
【0047】
元のデコード音声が、サブウーハチャンネルを除いて3チャンネル以上である場合は、通常のダウンミックス係数を使うようにエンコードする。一方、元のデコード音声が2チャンネル以下であれば、通常のダウンミックス係数ではない専用のダウンミックス係数を設定する。5.1チャンネルとしてエンコードする場合でも、元音声が2チャンネルしかない場合は、例えば、センターチャンネルや、サラウンドチャンネルのダウンミックス係数を0とし、フロントチャンネルのダウンミックス係数を1倍とすればよい。はじめは5.1チャンネルの通常のダウンミックス係数で再生し、元2チャンネル音声部分(専用のダウンミックス係数指定部分)に差し掛かれば、フロント音声の2チャンネル部分のみが再生されることとなり、記録前の再生音量を損なうことなく再生を継続することができる。ダウンミックス係数はオーディオフレーム単位などの区切りで、設定を変更する構成とすればよい。
【0048】
再生時に、デコードはオーディオフレーム単位で実施されるが、このオーディオフレーム単位で、ダウンミックス係数を変更すれば、デコード処理単位で係数が変更されることとなる。エンコード手段6は、指定手段2により指定されたチャンネル数でエンコードを継続し、ゲイン設定手段5により発せられるダウンミックス係数を、エンコードするオーディオフレーム単位でエンコード情報に付加すればよい。DTS方式と呼ばれる符号化方式には、このダウンミックス係数の変更による適用が有効である。
【0049】
(実施の形態2)
本発明の実施の形態2による音声処理装置の構成を示すブロック図である図2を主として参照しながら、本実施の形態2の構成について説明する。実施の形態1との違いは、指定手段2が、判別手段20に変更される。
【0050】
デジタル放送を受信する入力手段1と、利用者により番組を記録するチャンネル数を指定されるとともに、入力手段1から入力された番組情報に所定のチャンネル数以下の音声情報をもつ番組を含んでいるか否かを判別する判別手段20と、入力手段1からの音声信号をデコードするデコード手段3と、デコード手段3でデコードされた音声を、判別手段20により指定されたチャンネル数の出力音声に配分する配分手段4と、配分手段4で配分された音声信号の記録用のゲイン設定を行うゲイン設定手段5と、配分手段4から出力される番組の音声信号を外部に出力する再生出力手段7と、同じ音声信号を、ゲイン設定手段5から生成される値にてエンコードするエンコード手段6とからなる音声処理装置を示している。
【0051】
これは、判別手段20が、利用者からの指定だけでなく、入力手段1から入力された番組情報をみて、所定のチャンネル数以下の音声情報をもつ番組を含んでいるか否かを判別するものである。
【0052】
例えば、利用者からサラウンド放送記録と指定されていた場合、記録する番組情報をみて、5.1チャンネルなどとサラウンド放送がある番組を含んでいる場合は、サラウンド記録を行う指示を配分手段4に出す。利用者からサラウンド放送記録と指定されていても、記録する番組情報をみて、ステレオ放送など2チャンネルの放送のみである場合には、サラウンド記録を行う指示をだすことなく、2チャンネルでの記録を行う指示を配分手段4にだすものである。入力手段1からの判別手段20が番組情報を取得する方法としては、電子プログラムガイド(Electronic Program Guide:EPGと略す)情報などを用いて、番組予約時に、予約番組のチャンネル数情報を獲得することにより、実現できる。また予め、ハードディスクなどに記録された番組を、再度DVDディスクに書き出す場合には、ハードディスクの記録された番組情報を読み取ればよい。一般的に各チャンネルに対する圧縮符号化を一定とした場合には、5.1チャンネルでの圧縮符号化記録を行う場合より、2チャンネルでの圧縮符号化記録を行う場合のほうが、記録するデータ量が少なくてすむ。もしくは音声の符号化情報量全体を一定とする場合には、2チャンネルでの圧縮符号化を行うほうが、1チャンネルあたりの信号配分を増加させることができるため、より高音質で記録できる。記録する番組中に、2チャンネルの放送しか含まれない場合には、あえてサラウンド音声チャンネルまで記録する必要はない。
【0053】
EPG情報は、BSデジタル放送や、地上デジタル放送で送出されている。これは番組情報を送るもので、個々の番組時間や映像の解像度情報や、音声のチャンネル情報などを含んでいる。記録機器の場合、このEPG情報を用いることで、番組録画予約を行うことができる。判別手段20は、利用者からの番組予約があれば、該当番組の音声チャンネル情報を取得し、サラウンドエンコードが必要か、2チャンネルエンコードが必要かを判断することができる。EPG情報を獲得することにより、録画を開始する前に、チャンネル数の情報取得が可能である。よって、判別手段20が、利用者からの指定だけでなく、入力手段1から入力された番組情報をみて、所定のチャンネル数以下の音声情報をもつ番組を含んでいるか否かを判別することができる。
【0054】
(実施の形態3)
本発明の実施の形態3による音声処理装置の構成を示すブロック図である図6を主として参照しながら、本実施の形態3の構成について説明する。BDROMのメディアからア圧縮データを入力手段1に読み込む場合について説明する。
【0055】
BDROMを再生する場合、プライマリとセカンダリの2つのデコードデータを同期して再生するように求められている。例えば、プライマリは本編の音声を、セカンダリは本編を解説するようなコメンタリ音声や、特殊効果音声などの副音声を収める。またBDROMディスクや、不揮発性メモリからの再生を想定した場合、プライマリの本編音声や、セカンダリの副音声に各々複数の音声が記録されている場合がある。利用者は本編音声及び副音声の特定の音声を選択し、再生を指示する。
【0056】
BDROMは、複数の音声を同期しながらミキシングして再生するというミキシング機能を有している。本編再生中に、ユーザメニューをクリックすれば、その本編の解説用のコメンタリ音声を、本編のシーンにあわせて同期再生する機能や、ゲームアプリケーションに、本編の特定シーンを再生し、ゲームのシューティング音声にあわせて本編シーンを再生するものである。これらは本編の音声と、副音声をミキシングして再生するものである。
【0057】
第1音声が5.1チャンネルであり、第2音声が2チャンネルで記録されていて、セカンダリの副音声として、5.1チャンネルで記録されている場合について以下に説明する。図6の構成では、プライマリデコード用のデコード手段A31と、セカンダリデコード用のデコード手段B32、及び各々のデコード手段でデコードされた音声を合成する合成手段33にて、ミキシングを実行する。ミキシングされた音声は、配分手段41に入力される。そして、配分手段41で配分された音声信号のエンコード出力用のゲイン設定を行うゲイン設定手段51と、光端子などから外部のAVアンプ等に、ゲイン設定手段51から生成される値にてエンコード符号化してストリームデータの形式で出力するエンコード手段61とからなる音声処理装置を示している。
【0058】
BDROMのミキシングは、図7で示すように、プライマリ側のチャンネル数にあわせてセカンダリ側をミキシングするように規定されている。例えばプライマリが5.1チャンネルであれば、セカンダリは、5.1チャンネルでのミキシングが許可される。プライマリが2チャンネルであれば、セカンダリは、5.1チャンネルから2チャンネルに一旦ダウンミックスしたあとで、合成手段33にて2チャンネルでミキシングされる。合成手段33は、ミキシングされた音声データを配分手段4に入力する。
【0059】
利用者が、BDROMを、プライマリとセカンダリをミキシングして聞いている場合を想定して説明を続ける。プライマリの第1音声を5.1チャンネルで聞いていながら、利用者のリモコン等で第2音声に切り替える指示をだすと、デコード手段A31は、第2音声の2チャンネルの音声再生に切り替える。すると、プライマリ音声チャンネル数が2チャンネルに変更されたため、デコード手段B32は、セカンダリ側も2チャンネルにダウンミックスし、合成手段33がプライマリ音声2チャンネルと、セカンダリ音声2チャンネルのミキシングを実施し、エンコード手段61へ音声を出力する。
【0060】
配分手段41は、5.1チャンネルから2チャンネルに変わった場合には、図7に示すように残りの4チャンネルには0データを出力する。2チャンネル再生区間も、残り4チャンネルは0データとして、5.1チャンネルでの再生データとして、エンコード手段61に入力する。そしてゲイン設定手段51は、5.1チャンネル再生区間はDRC設定をONにし、2チャンネル再生区間は、DRC設定をOFFにする。つまり、プライマリが5.1チャンネルだろうと、2チャンネルだろうと、配分手段41にて、すべて5.1チャンネルの形態に整えられて、エンコード手段61に入力される。
【0061】
プライマリがモノラル音声(センターチャンネルに該当)の1チャンネルの場合は、セカンダリも1チャンネルにダウンミックスして、合成手段33にて合成し、配分手段41にて、他のチャンネルは0データを出力して、エンコード手段61から5.1チャンネルのデータとして出力される。
【0062】
エンコード手段61は、ドルビーの圧縮符号化方式等を用い、DRC情報を付加して符号化データにエンコードし、光出力端子から出力する。光ケーブルなどで接続されたAVアンプは、この圧縮符号化された音声データをデコードすることによって、プライマリとセカンダリがミキシングされた音声を聞くことができる。AVアンプは、もともとのプライマリの音声が5.1チャンネルから2チャンネルに変わった場合でも、エンコード手段61からストリーム出力される音声は5.1チャンネルの音声信号として出力される。音声出力フォーマットが途中で変更されることはない。
【0063】
配分手段4は、5.1チャンネル区間は5.1チャンネルの音声信号をそのまま出力し、2チャンネル区間は、FLとFRの音声信号と、その他の0レベルの音声信号を出力する。さらにゲイン設定手段5が、5.1チャンネル区間はDRC設定をONにして、2チャンネル区間はDRC設定をOFFにしてエンコードを行う。このようにエンコードすることにより、再生出力手段7からは、5.1チャンネル区間と2チャンネル区間で再生音量がかわることなしで(出力される音声は5.1チャンネルから2チャンネルに変わるが、これは放送音声と同じ)、エンコード出力をすることができる。
【0064】
エンコード手段61は、DRCの制御情報をつけて、5.1チャンネル区間も2チャンネル区間も全て、5.1チャンネルとしてエンコードし、出力し続ける。このようにエンコードされた音声信号を、接続されたAVアンプにてデコーダ再生する場合には、このDRC設定を生かしてデコードすることにより、再生時の音量歪みを防ぐことができる。
【0065】
5.1チャンネル区間のエンコード出力信号の再生は、マルチチャンネルエンコードされた音声信号を、AVアンプ側などスピーカ接続情報により、ダウンミックス再生されるが、ダウンミックス係数に加えて、DRC設定つけられており、ダウンミックスが必要な場合は、DRC設定もONにしているので、音量を押さえて加算するように指示するため、音声歪みを発生することなく再生することができる。
【0066】
一方2チャンネル区間のエンコードは、DRC設定をOFFとする。2チャンネル区間のAVアンプ側での再生は、マルチチャンネルエンコード(FRとFLは音量あるが、残りは音量レベル0)された音声信号を、DRC設定がOFFで再生するように指定する。結果、音量を押さえずに加算するように指示される。しかしFRとFL以外の音量レベルが0であるため、音声歪みを発生することなく再生することが可能である。
【0067】
実施の形態3においては、エンコード手段61が、メディア等への記録ではなく、外部機器への出力のためのエンコード信号生成にも適用できることを説明した。つまり外部のAVアンプ等への信号出力に、圧縮符号化したエンコード信号を用いることによって、光ケーブルやHDMIケーブルを用いて信号を伝送する形式とすることができる。
【0068】
以上は、配分手段41から、エンコード手段61への出力について説明してきたが、実施の形態1同様に、配分手段41に再生出力手段71なるものを設け、そこからミキシングされた音声を出力する構成としてもよい。このように構成すれば、配分手段41からの各信号の音量を変更することなくエンコード手段61へ入力されるとともに、再生出力手段71へも入力される。再生出力手段71が有する出力端子からは、HDMIケーブルもしくは、アナログ音声出力用DAコンバータを経由して音声出力がなされる。配分手段41が、エンコード手段61への音声出力音量を調整すると、再生出力手段71の音量にも影響がでてしまう。そこで、配分手段41からは、チャンネル元の音量を損なうことなく、外部へのエンコード出力と、本体機器からの音声出力を両立することができる。
【産業上の利用可能性】
【0069】
本発明における音声処理装置は、デジタル放送のサラウンドチャンネルを有する放送番組を記録する場合に、番組内で再生チャンネル数の変化を伴った場合においても、再生音量を変化させることなく、サラウンドチャンネルを記録し続けるといった用途に使用することができる。
【図面の簡単な説明】
【0070】
【図1】本発明の実施の形態1に於ける装置の構成を示す図
【図2】本発明の実施の形態2に於ける装置の構成を示す図
【図3】本発明の実施の形態1における装置の2チャンネル記録時におけるデコード音声とエンコード音声の関係を示す図
【図4】本発明の実施の形態1における装置のサラウンド放送時の2チャンネル記録におけるデコード音声とエンコード音声の関係を示す図
【図5】本発明の実施の形態1における装置のサラウンドチャンネル記録時におけるデコード音声とエンコード音声の関係を示す図
【図6】本発明の実施の形態3に於ける装置の構成を示す図
【図7】本発明の実施の形態3における装置のBDROM再生時におけるデコード音声とエンコード音声の関係を示す図
【符号の説明】
【0071】
1 入力手段
2 指定手段
3 デコード手段
4 配分手段
5 ゲイン設定手段
6 エンコード手段
7 再生出力手段
20 判別手段

【特許請求の範囲】
【請求項1】
番組に付随する番組情報を有する音声信号を入手する入力手段と、利用者により番組を記録するチャンネル数を指定する指定手段と、前記入力手段からの音声信号を前記指定手段により指定されたチャンネル数の出力音声に配分する配分手段と、前記配分手段の出力音声信号のうちで、前記配分手段で配分された音声信号のゲイン設定を行うゲイン設定手段と、前記ゲイン設定手段で設定されたゲイン設定により、前記配分手段から出力される複数の番組の音声信号を、前記指定手段により指定された固定のチャンネル数でエンコードするエンコード手段を備えることを特徴とする音声処理装置。
【請求項2】
前記指定手段が、前記入力手段が入力した番組情報に所定のチャンネル数以下の音声情報をもつ番組を含んでいるか否かを判別する判別手段を有し、前記判別手段の判別情報を基にして、前記配分手段にて、該番組の音声信号を所定チャンネル数の出力音声に配分し、前記配分手段から出力される複数の番組の音声信号を、前記判別手段で判別された所定の固定のチャンネル数でエンコードするエンコード手段を備えることを特徴とする、請求項1に記載の音声処理装置。
【請求項3】
前記ゲイン設定手段が、エンコードする番組の再生時における各チャンネルをミキシングするためのダイナミックレンジコントロール係数を設定する機能を有することを特徴とする、請求項1に記載の音声処理装置。
【請求項4】
前記ゲイン設定手段が、エンコードする番組の再生時における各チャンネルをミキシングするためのダウンミキシング係数を変更する機能を有することを特徴とする、請求項1に記載の音声処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−288935(P2008−288935A)
【公開日】平成20年11月27日(2008.11.27)
【国際特許分類】
【出願番号】特願2007−132503(P2007−132503)
【出願日】平成19年5月18日(2007.5.18)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】