説明

音量調整装置

【課題】本発明は、ユーザに対してより最適な音量の音声データを提供できる。
【解決手段】音量調整装置は、音声データを取得する取得手段と、前記取得した音声データの音量レベルをゲイン値で調整する音量調整手段と、を備える。そして前記音量調整手段は、前記音声データの音量レベルが第3範囲に含まれる場合、前記第2目標値に音量レベルが変換されるようゲイン値を算出し、当該算出したゲイン値が所定範囲に含まれる場合、所定範囲に満たないゲイン値で前記音声データの音量レベルを調整する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声データ(例えば、コンテンツ)の音量レベルを調整する装置に関する。より詳しくは、音声データの音量レベルを自動調整して、外部装置により音声として出力させる装置に関する。
【背景技術】
【0002】
従来の特許文献1には、ネットワークからコンテンツを受信して再生する再生装置が記載されている。この再生装置では、音声レベルの異なるコンテンツの再生音量を自動調整する機能を有している。
【0003】
この再生音量を自動調整する機能は、以下のように実現されている。まず、再生装置は、コンテンツの音量を音量検出部で検出する。そして再生装置は、音量検出部で検出した音量が閾値Th1を超えているか否かを音量判断部で判断する。再生装置は、閾値Th1を超えている場合、音量検出部で検出された音量に応じて、コンテンツの音量を調整する。これによって、再生装置では、出力されるコンテンツの音量が、ユーザにとって大きくなりすぎないように調整している。
【0004】
また、この再生装置では、音量検出部で検出した音量が閾値Th2を下回るか否かを判断する。再生装置は、閾値Th2を下回っている場合、音量検出部で検出された音量に応じて、コンテンツの音量を調整する。これによって、再生装置では、出力されるコンテンツの音量がユーザにとって小さくなりすぎないように調整している。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2003−134419号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1には、以下の3つの課題がある。
【0007】
第1の課題は、出力される音量レベルを一定閾値以内に合わせようとするため、音声データが本来持つ音量レベルの強弱が失われてしまう。このため、ユーザには、出力された音声が不自然に聞こえてしまう。
【0008】
第2の課題は、音声データの音量レベルが閾値を下回る場合、少なくとも閾値になるように音量が調整されると考えられるため、音声データに含まれる雑音(例えば、背景雑音)部分についても音量レベルを調整してしまう。このため、ユーザには、出力された音声が雑音の多い音声に聞こえてしまう。
【0009】
第3の課題は、上記特許文献1に外部装置の出力形態が複数あると仮定した場合に発生する課題である。例えば、外部装置において2chと5.1chの出力形態で音声が出力可能な場合、音声データの音量レベルに応じて、音声データ全体(2chと5.1chのオーディオ信号)の音量を調整してしまうと、複数のオーディオ信号間で音量差を補償することができない。これでは、2chと5.1chのオーディオ信号を音声として出力する場合において、一方の音量が、ユーザにとって小さくなりすぎたり、大きくなりすぎたりしてしまう。
【0010】
この第3の課題が発生する原理を、2chと5.1chのオーディオ信号を例にして説明する。例えば、2chのオーディオ信号は、5.1chのオーディオ信号からダウンミックスして生成される。この際、5.1chのオーディオ信号を2chのオーディオ信号に変更するには、オーバーフローを防止するため、2chのオーディオ信号の音量レベルが5.1chのオーディオ信号の音量レベルと比べて小さくなる。
【0011】
具体的に説明する。例えば、センター(C)、レフト(L)、ライト(R)、レフトサラウンド(Ls)、ライトサラウンド(Rs)の5チャンネルの信号を2チャンネル(Lo/Ro)にダウンミックスする場合、以下の式で表現できる。
[数式1]
Lo= 1/X ×( L + r1×C + r2×Ls )
Ro= 1/X ×( R + r1×C + r3×Rs )
1/X:正規化係数
r1:センターのダウンミックス係数
r2:Lsのダウンミックス係数
r3:Rsのダウンミックス係数
したがって、各チャンネルの最大振幅を1とした場合であって、5チャンネルの信号がそれぞれ C=0.5、L=1、R=1、Ls=0.2、Rs=0.2 であり、係数がそれぞれ 1/X=0.3、r1=r2=r3=0.7 とすると、Loは、以下のようになる。
[数式2]
Lo=0.3×(1+0.7×0.5+0.7×0.2)
=0.3× 1.49
=0.447
つまり、Loは、0.447となり、L=1に対して1/2未満の振幅になってしまう。
【0012】
このため、例えば、5.1chのオーディオ信号の音量レベル(L=1)に応じて、5.1chと2chのオーディオ信号の音量レベルを調整してしまうと、2chのオーディオ信号の音量レベルが小さくなりすぎてしまう。
【0013】
そこで本発明は、ユーザにとってより最適な音量の音声データを提供できる音量調整装置を提供することを目的とする。
【課題を解決するための手段】
【0014】
第1の課題を解決する手段として、請求項1に記載の発明は、音声データを取得する取得手段と、前記取得した音声データの音量レベルをゲイン値で調整する音量調整手段と、
を備える。そして前記音量調整手段は、前記音声データの音量レベルが第3範囲に含まれる場合、前記第2目標値に音量レベルが変換されるようゲイン値を算出し、当該算出したゲイン値が所定範囲に含まれる場合、所定範囲に満たないゲイン値で前記音声データの音量レベルを調整する。
【0015】
また、第2の課題を解決する手段として、請求項3に記載の発明は、音声データを取得する取得手段と、前記取得した音声データの音量レベルをゲイン値で調整する音量調整手段と、を備え、前記音量調整手段は、前記音声データの音量レベルが第4範囲に含まれる場合、前記音声データの音量レベルが大きくならないような第3ゲイン値で調整し、前記音声データの音量レベルが第4範囲よりも大きな値で構成される第3範囲に含まれる場合、前記音声データの音量レベルが大きくなるような第2ゲイン値で音量を調整する。
【0016】
また、第3の課題を解決する手段として、請求項5に記載の発明は、第1の出力形態で音声出力可能な第1オーディオ信号及び第2の出力形態で音声出力可能な第2オーディオ信号を取得可能な取得手段と、前記取得手段で取得したオーディオ信号の音量レベルをゲイン値で調整する音量調整手段と、を備える。そして前記音量調整手段は、前記第1オーディオ信号の音量レベルを調整する場合において、当該第1オーディオ信号の音量レベルに応じたゲイン値で調整する一方、前記第2オーディオ信号の音量レベルを調整する場合において、当該第2オーディオ信号の音量レベルに応じたゲイン値で調整する。
【0017】
また、他の手段の音量調整装置は、多チャンネルの音声データを取得可能な取得手段と、前記取得した多チャンネルの音声データの内、チャンネル単位で最も大きく、かつ、チャンネル間で最も大きい音量レベルを検出する検出手段と、前記検出した音量レベルに基づいて、前記マルチチャンネル全体の音声データの音量レベルを調整する音量調整手段と、を備える。
【0018】
このように構成すれば、多チャンネルの音声データにおいて、チャンネル単位で最も大きく、かつ、チャンネル間で最も大きい音量レベル(ピーク音量レベル)を検出できる。これによって、音量調整手段が、ピーク音量レベルに基づいてマルチチャンネル全体の音声データを調整する場合であっても、あるチャンネルの音声データの音声出力がクリップしてしまうことを回避できる。つまり、あるチャンネルの音声データの音声出力が一部飽和してしまうことを回避できる。
【発明の効果】
【0019】
本発明によれば、ユーザに対してより最適な音量の音声データを提供できる。
【図面の簡単な説明】
【0020】
【図1】本実施の形態に係るレコーダーの構成を示す図
【図2】本実施の形態に係るLSIの機能ブロック図
【図3】本実施の形態に係る音量調整手段の機能ブロック図
【図4】本実施の形態に係る音量調整例(入力信号に応じた出力信号)を示す図
【図5】本実施の形態に係る音量調整動作を示すフローチャート
【図6】本実施の形態に係る音量調整動作を示すフローチャート
【図7】本実施の形態に係る音量調整動作を示すフローチャート
【図8】本実施の形態に係る最大ピーク値の算出動作を説明するための図
【図9】本実施の形態に係る設定ゲイン値を説明するための図
【発明を実施するための形態】
【0021】
(実施の形態1)
本実施の形態について、図面を参照して説明を行なう。本実施の形態では、レコーダー1の構成及び動作を説明する。以下、具体的に説明する。
【0022】
<1.本実施の形態の概要>
レコーダー1は、外部又は内部から音声データを取得する。レコーダー1は、音声データに音量調整処理を施す。レコーダー1は、音量調整した音声データを、外部装置を介して出力する。
【0023】
<2.音声データ>
音声データには、7.1ch又は5.1ch、2chのオーディオ信号等が考えられる。ここで本実施の形態では、レコーダー1が、7.1chのオーディオ信号を符号化したオーディオ符号化信号を受信した場合を例にして説明を行なうが、他の実施の形態では、これに限られない。
【0024】
なお、本実施の形態では、音声データと映像データを含めて音声映像データと称する。
【0025】
<3.レコーダー1の構成(図1、図2)>
レコーダー1の構成を説明する前に、レコーダー1と他の装置の関係を、図1を用いて説明する。
【0026】
レコーダー1は、外部に接続されたアンテナ2、インターネット100及び光ディスク4から音声映像データを取得可能である。また、レコーダー1は、内部に設けられたHDD5から音声映像データを取得可能である。
【0027】
アンテナ2は、テレビ放送の電波を受信して、受信した信号をレコーダー1に送信する。また、インターネット100は、レコーダー1からの音声映像データの取得要求を外部端末に伝送し、外部端末から返信される音声映像データをレコーダー1に伝送する。光ディスク4は、CD,DVD、Blu−rayなどの光ディスクであり、レコーダー1に設けられた光学ドライブに挿入可能である。レコーダー1は、この光学ドライブを介して光ディスク4から音声映像データを取得できる。さらにHDD5は、レコーダー1に設けられ、音声映像データを記録した記録装置である。したがってレコーダー1は、HDD5から音声映像データを取得可能である。このようにしてレコーダー1は、音声映像データを取得できる。
【0028】
レコーダー1は、取得した音声映像データに含まれる音声データの音量調整処理を施して、外部に音声を出力する。レコーダー1では、サラウンドシステム10、スピーカー11やテレビ12を介して音声を出力する。
【0029】
サラウンドシステム10は、レコーダー1からの音声データの出力信号(HDMI信号)を音声として出力可能である。サラウンドシステム10は、7つのスピーカーと1つのウーハーにより、7.1chの出力形態で音声を出力可能である。スピーカー11は、レコーダー1からの音声データの出力信号(アナログ信号)を音声として出力可能である。スピーカー11は、5つのスピーカーと1つのウーハーにより、5.1chの出力形態で音声を出力可能である。さらに、テレビ12は、レコーダー1からの音声データの出力信号(光デジタル信号)を音声として出力可能である。テレビ12は、2つのスピーカーにより、2chの出力形態で音声を出力可能である。なお、テレビ12には、ディスプレイが設けられ、レコーダー1からの映像データの出力信号を映像として出力可能である。
【0030】
次に、レコーダー1の構成を図1、図2に基づいて説明する。チューナー3は、アンテナ2から受信した信号を変調する。チューナー3は、変調した信号を、LSI6に入力する。光学ドライブは、光ディスク4から読み出した信号をLSI6に入力する。HDD5は、記録した音声映像データをLSI6に入力する。通信部は、インターネット100に接続された外部端末と情報のやり取りを行なう。通信部は、LSI6から外部端末に対して情報が送信されると、その情報をネットワーク100に送信する。一方、通信部は、インターネット100から情報を受信すると、受信した音声映像データをLSI6に送信する。
【0031】
ここでLSI6は、どの情報源から音声映像データを取得するかを選択することが可能である。例えば、LSI6は、ユーザの操作によって放送波から情報を得るよう指示された場合、チューナー3を制御して、放送波から所望のチャンネルの音声映像データを取得する。
【0032】
LSI6は、音声映像データに含まれる音声データに音量調整処理を施す半導体チップである。なお、LSI6の処理については、後述する。
【0033】
HDMI出力端子7は、LSI6から入力された信号をサラウンドシステム10に出力する端子である。また、アナログ音声出力端子8は、LSI6から入力された信号をスピーカー11に出力する端子である。光デジタル音声出力端子9は、LSI6から入力された信号をテレビ12に出力する端子である。なお、図示しないが、アナログ音声出力端子8とLSI6の間には、DAコンバーダーが設けられ、LSIからのデジタル出力をアナログ出力に変換している。
【0034】
<4.LSI6の機能ブロック>
LSI6は、入力された音声映像データに含まれる音声データに音量調整処理を施すため、以下の機能ブロックを有する。以下、具体的に説明する。
【0035】
ストリーム入力部13は、入力された音声映像データを、ビデオ符号化信号(映像データの一例)とオーディオ符号化信号(音声データの一例)に分離する。ストリーム入力部13は、分離したビデオ符号化信号をビデオ入力バッファ14に格納する。また、ストリーム入力部13は、分離したオーディオ符号化信号をオーディオ入力バッファ18に格納する。ビデオ入力バッファ14及びオーディオ入力バッファ18は、符号化信号を一時的に格納するバッファである。
【0036】
ビデオデコーダ15は、ビデオ入力バッファ14から読み出したビデオ符号化信号を復号化する。そしてビデオデコーダ15は、復号化したビデオ信号をビデオ出力バッファ16に格納する。ビデオ出力バッファ16は、復号化されたビデオ信号を一時的に格納するバッファである。ビデオ出力部17は、ビデオ出力バッファ16からビデオ信号を取り出し、テレビ12に出力する。
【0037】
オーディオデコーダ19は、オーディオ入力バッファ18から読み出したオーディオ符号化信号を復号化する。そしてオーディオデコーダ19は、復号化したオーディオ信号をオーディオ出力バッファ20に格納する。オーディオ出力バッファ20は、復号化されたオーディオ信号を一時的に格納するバッファである。オーディオ出力部21は、制御部101からの制御に応じて、オーディオ出力バッファ20からオーディオ信号を取り出し、第1音量調整部22又は第2音量調整部23、第3音量調整部24に出力する。第1音量調整部22及び第2音量調整部23、第3音量調整部24は、オーディオ信号に音量調整処理を施す。そして第1音量調整部22及び第2音量調整部23、第3音量調整部24は、音声調整処理を施したオーディオ信号を、外部装置(サラウンドシステム10、スピーカー11、テレビ12)に出力する。
【0038】
制御部101は、ビデオデコーダ15及びオーディオデコーダ19を制御して、ビデオ符号化信号及びオーディオ符号化信号を、復号化するタイミングを制御する。また、制御部101は、ビデオ出力部17及びオーディオ出力部21を制御して、ビデオ信号及びオーディオ信号を出力するタイミングを制御する。また、制御部101は、オーディオ出力部21を制御して、オーディオ信号の出力先を制御する。
【0039】
〔オーディオデコーダ19に対する制御部101の制御〕
ここでオーディオデコーダ19に対する制御部101の制御を説明する。
【0040】
制御部101は、オーディオ符号化信号を復号化するようオーディオデコーダ19を制御する。また、制御部101は、復号化したオーディオ信号に基づいて、新たなチャンネル数のオーディオ信号を生成するよう、オーディオデコーダ19を制御する。
【0041】
制御部101が、新たなチャンネル数のオーディオ信号を生成するようにオーディオデータ19を制御する際の具体的な処理を説明する。
【0042】
まず、制御部101は、各々の出力端子7、8,9からどのようなオーディオ信号(チャンネル・サンプリング周波数)を出力するように設定されたかを検知する。出力端子毎に説明する。
【0043】
HDMI出力端子7の例を説明する。HDMI出力端子7では、接続された外部装置(サラウンドシステム10)から接続先の情報を取得できるように構成されている。したがって、制御部101では、HDMI出力端子7を介して、外部装置から接続先の情報を取得する。接続先の情報には、例えば、7.1chのオーディオ信号が出力可能であることを示す情報が含まれている。そして、制御部101は、HDMI出力端子7で出力するオーディオ信号のチャンネル数を、接続先に応じた候補の中からユーザに選択させる。ユーザが選択できるチャンネル数の候補には、例えば、「7.1ch」、「出力なし」が含まれる。これによって、HDMI出力端子7から出力されるオーディオ信号のチャンネル数がユーザによって設定される。本実施の形態では、HDMI出力端子7の出力信号として「7.1ch」が選択されているものとする。
【0044】
次に、アナログ音声出力端子8では、HDMI出力端子7のように双方向通信が可能でないため、接続された外部装置の情報を取ることができない。したがって、制御部101は、アナログ音声出力端子8で出力するオーディオ信号のチャンネル数を、所定の候補の中から、ユーザに選択させる。ユーザが選択できるチャンネル数の所定の候補には、例えば、「5.1ch」、「出力なし」が含まれる。これによって、アナログ音声出力端子8から出力されるオーディオ信号のチャンネル数がユーザによって設定される。本実施の形態では、アナログ音声出力端子の出力信号として「5.1ch」が選択されているものとする。
【0045】
次に、光デジタル音声出力端子9では、同様に、HDMI出力端子7のように双方向通信が可能でないため、接続された外部装置の情報を取ることができない。したがって、制御部101は、光デジタル音声出力端子9で出力するオーディオ信号のチャンネル数を、所定の候補の中からユーザに選択させる。ユーザが選択できるチャンネル数の所定の候補には、例えば、「PCM出力(2.0ch)」、「出力なし」が含まれる。これによって、光デジタル音声出力端子9から出力されるオーディオ信号のチャンネル数がユーザによって設定される。本実施の形態では、光デジタル音声出力端子の出力信号として「PCM(2.0ch)」が選択されているものとする。
【0046】
このようにして制御部101は、各々の出力端子7、8,9からどのようなオーディオ信号(チャンネル数)を出力するように設定されたかを検知できる。
【0047】
次に、制御部101は、オーディオ信号のチャンネル情報を取得する。例えば、制御部101は、オーディオデコーダ19に対して、オーディオ信号のチャンネル数を問い合わせる。オーディオデコーダ19は、制御部101の問い合わせに応じて、オーディオ入力バッファ18に記録されたオーディオ符号化信号のヘッダ情報から、オーディオ信号のチャンネル数を示す情報(以下、チャンネル情報と称する)を読み出して、制御部101に送信する。例えば、本実施の形態では、制御部101は、チャンネル数を示す情報として7.1chの情報を得ることができる。
【0048】
そして、制御部101は、各々の出力端子7,8,9で出力するように設定されたチャンネル数(7.1ch、5.1ch、2ch)、及び、オーディオ符号化信号に含まれるオーディオ信号のチャンネル情報(7.1ch)により、新たなチャンネル数(5.1ch及び2ch)のオーディオ信号を生成するようオーディオデコーダ19を制御する。これは、オーディオ符号化信号を復号化することで、7.1chのオーディオ信号が得られるため、5.1chと2chのオーディオ信号を新たに生成する必要があるためである。
【0049】
制御部101によって制御されたオーディオデコーダ19の処理を説明する。以下では、制御部101が、オーディオデコーダ19に対してチャンネル数(5.1chと2ch)のオーディオ信号を生成するよう指示した場合の処理を説明する。
【0050】
まず、オーディオデコーダ19は、オーディオ符号化信号を復号化する。例えば、オーディオデコーダ19は、オーディオ符号化信号を復号化して、7.1chのオーディオ信号を生成する。
【0051】
そして、オーディオデコーダ19は、復号化したオーディオ信号に基づいて、制御部101の制御に応じた生成に必要なオーディオ信号を生成する。例えば、オーディオデコーダ19は、7.1chのオーディオ信号に基づき、5.1ch及び2chのオーディオ信号をダウンミックスによって新たに生成する。
【0052】
オーディオデコーダ19は、生成したオーディオ信号を、チャンネル毎にオーディオ出力バッファ20に記録する。この際オーディオデコーダ19は、制御部101に対して、チャンネル数を示す情報と、このチャンネル数に対応するオーディオ信号を記録したオーディオ出力バッファ20のアドレスを示す情報と、を対の情報として送信する。つまり、本実施の形態では、オーディオデコーダ19は、7.1ch、5.1ch、2chのオーディオ信号をオーディオ出力バッファ20に格納するので、3つの対にした情報が送信される。例えば、オーディオ出力バッファ20のアドレスが1〜30000まで存在する場合において、オーディオデコーダ19が、7.1chのオーディオ信号をアドレス1〜0500、5.1chのオーディオ信号をアドレス10001〜10500、2chのオーディオ信号を20001〜20500に記録した場合、オーディオデコーダ19は、以下の情報(チャンネル情報及び格納先のアドレス)を制御部101に送信する。
【0053】
送信情報(1):チャンネル情報「7.1」、アドレス「00001」
送信情報(2):チャンネル情報「5.1」、アドレス「10001」
送信情報(3):チャンネル情報「2.0」、アドレス「20001」
ここでオーディオデコーダ19は、フレーム単位でオーディオ符号化信号を復号化する。フレームは、例えば、1536サンプルを1単位としている。なお、オーディオデコーダ19は、フレーム単位の復号化処理を行う毎に、上記送信情報を制御部101に送信するとよい。
【0054】
〔オーディオ出力部21に対する制御部101の制御〕
次に、オーディオ出力部21に対する制御部101の制御を説明する。制御部101は、オーディオデコーダ19から送信情報を取得している。制御部101は、この送信情報に基づいて、オーディオ出力部21を制御する。つまり、オーディオ出力部21は、オーディオデコーダ19の送信情報に応じて、処理を行う音量調整部(第1音量調整部22、第2音量調整部23、第3音量調整部24)及び端子(HDMI出力端子7、アナログ音声出力端子8、光デジタル音声出力端子9)を決定する。そしてオーディオ出力部21は、オーディオ出力バッファ20から順次オーディオ信号を読み出して、対応するブロックで処理を行う。例えば、チャンネル情報「7.1」のオーディオ信号は、サラウンドシステム10に出力する設定となっているため、第1音量調整部22で処理を行う。チャンネル情報「5.1」のオーディオ信号は、スピーカー11に出力する設定となっているため、第2音量調整部23で処理を行う。チャンネル情報「2.0」のオーディオ信号は、テレビ12に出力する設定となっているため、第3音量調整部24で処理を行う。
【0055】
ここでオーディオ出力部21は、制御部101の制御に応じて、オーディオ出力バッファ20から1ブロックずつオーディオ信号を読み出し、第1音量調整部22等(第1音量調整部22、第2音量調整部23又は第3音量調整部24)に入力する。ここでブロックは、複数のサンプルデータの塊である。本実施の形態では、64サンプルを1ブロックとしている。したがって、例えば、オーディオ出力部21は、送信情報を受け取ると、アドレス情報に対応する位置からサンプルデータをブロック単位で順次読み出して、第1音量調整部22等に入力する。オーディオ出力部21では、1つの送信情報に対して、ブロック単位の順次読み出しを、1フレーム(1536サンプル=24ブロック)分読み終わるまで行なう。
【0056】
次に、第1音量調整部22、第2音量調整部23、及び、第3音量調整部24での処理を説明する(図3)。図3は、第1音量調整部22の処理を説明している。この動作では、あるブロック「N+1」のオーディオ信号に対する音量調整処理を説明している。
【0057】
レベル検出部221は、所定時間内における入力信号のピーク音量レベルを検出する。レベル検出部221の処理を、図8を用いて説明する。再生開始時と再生途中の各々で説明する。
【0058】
再生開始時の処理を説明する。レベル検出部221は、入力されたブロック単位内のピーク音量を算出する。ブロックは、64サンプルで構成されているため、64サンプルの内で最も音量レベルの大きい値を抽出する。ここで、7.1chの音声には、「C」「L」「R」「Lss(レフトサイドサラウンド)」「Rss(ライトサイドサラウンド)」「Lsb(レフトサイドバック)」「Rsb(ライトサイドバック)」が存在する。したがって、ブロック内のピーク音量を算出する場合には、チャンネル単位で最も大きく、かつ、チャンネル間で最も大きい音量レベルを抽出するとよい。例えば、64サンプルの内、25サンプル目の「L」の音量レベル値が最大である場合、その値がブロック単位内のピーク値となる。このように構成すれば、多チャンネルの音声データにおいて、チャンネル単位で最も大きく、かつ、チャンネル間で最も大きい音量レベル(ピーク音量レベル)を検出できる。これによって、音量調整部22,23,24が、ピーク音量レベルに基づいてマルチチャンネル全体の音声データを調整する場合であっても、あるチャンネルの音声データの音声出力がクリップしてしまうことを回避できる。つまり、あるチャンネルの音声データの音声出力が一部飽和してしまうことを回避できる。
【0059】
このように求めたブロック単位内のピーク音量に基づきレベル検出部221は、所定期間内のピーク音量を求めるわけであるが、再生開始時は、過去のブロックが存在しない。このため、レベル検出部221は、この算出されたブロック単位内のピーク音量を所定期間内のピーク音量とする。なお、レベル検出部221は、算出したブロック単位内のピーク音量を記憶する。
【0060】
次に、再生途中の処理を説明する。レベル検出部221は、入力されたブロック単位内のピーク音量を算出する。例えば、レベル検出部221では、ブロック「N+1」のピーク音量を算出する。レベル検出部221は、再生途中になると、過去に取得されたブロック単位内のピーク音量が記録されているので、現在算出したブロック単位内のピーク音量(図8のブロック「N+1」)と過去算出したブロック単位内の複数のピーク音量(図8のブロック「N」〜「N−118」)を用いて、所定期間内で最も大きい音量のピーク音量を算出する。このようにして、レベル検出部221は、所定期間内のピーク音量を算出する。
【0061】
ゲイン設定方法判定部222は、レベル検出部221で検出されたピーク音量レベルと、予め指定された複数の閾値とを比較する。ゲイン算出部223は、比較結果に応じたゲイン値を設定する。
【0062】
本実施の形態においてゲイン設定方法は、4つの方法が存在する。
【0063】
第1の方法は、ピーク音量レベルが第1閾値よりも大きい場合、ピーク音量レベルが第1閾値になるようなゲイン値を設定する。
【0064】
第2の方法は、ピーク音量レベルが第1閾値以下であって、第2閾値よりも大きい場合、入力音量レベルと出力音量レベルが一致するようなゲイン値を設定する。つまり、入力された音量レベルに手を加えないゲイン値を設定する。
【0065】
第3の方法は、ピーク音量レベルが第2閾値以下であって、第3閾値よりも大きい場合、ピーク音量レベルが第2閾値になるようなゲイン値を設定する。
【0066】
第4の方法は、ピーク音量レベルが第3閾値以下である場合、入力音量レベルと出力音量レベルが一致するようなゲイン値を設定する。つまり、入力された音量レベルに手を加えないゲイン値を設定する。
【0067】
このようにゲイン算出部223は、ゲイン設定方法判定部222の比較結果に応じて、ゲイン値を設定する。
【0068】
ここでゲイン算出部223では、1つ前のブロック「N」が入力された際に設定されたゲイン値に対して、今回のブロック「N+1」が入力された際に設定されたゲイン値が、所定値以上変化した場合、スムージングの処理を行う。以下、スムージングの処理の具体例を説明する(図9)。
【0069】
図9において、ブロック「N」が入力された際に設定されたゲイン値が「Y」であり、ブロック「N+1」が入力された際に設定されたゲイン値が「X」であるとする。
【0070】
この場合、ゲイン算出部223は、ブロック「N+5」が入力された際に設定されるゲイン値が「X」になるよう、ブロック「N+1」のタイミングでの設定ゲインを調整する。このようにすれば、音量レベルが大きく変わった場合において、出力音量が大きく変化してしまうことを防止できる。これによって、出力音量レベルの変化をより滑らかにして、自然な音量調整をできるようにしている。
【0071】
最大ゲイン判定処理部224は、ゲイン算出部223で設定されたゲイン値と、所定のゲイン値(最大ゲイン)を比較し、所定のゲインを超えている場合、設定されたゲイン値を所定のゲイン値に補正する。このように構成することで、音量レベルのゲイン調整の幅を制限することができ、音量レベルの変化が一定の範囲に収まってしまうことを軽減している。
【0072】
オーバーフロー判定部225は、レベル検出部221で検出したピーク音量レベルを、最大ゲイン判定処理部224で算出された補正後ゲイン値を用いて調整した場合、調整後のピーク音量レベルが上限値を超えるか否かを判別する。オーバーフロー判定部225は、調整後のピーク音量レベルが上限値を超えると判断した場合、調整後のピーク音量レベルが上限値になるよう補正後ゲイン値を調整する。本実施の形態において、上限値は、出力音量レベルの最大値を示す値である。
【0073】
ゲイン調整部226は、このようにして算出した調整後のゲイン値に基づいて、ゲイン調整部226に入力されるブロック単位のオーディオ信号を調整する。例えば、ゲイン調整部226は、ブロック「N+1」に対するレベル検出部221〜オーバーフロー判定部225の処理を待って、調整後のゲイン値に基づいて、ブロック「N+1」のオーディオ信号の音量調整を行なう。これによって、ブロック「N+1」のブロック単位内のオーディオ信号のゲイン調整に対しては、ブロック「N+1」のオーディオ信号のピーク値が反映されたゲイン値を用いることができる。
【0074】
<5.動作例>
本実施の形態のLSI6の音量調整の動作を、図5、6、7を用いて説明する。
【0075】
制御部101は、HDMI出力端子7、アナログ音声出力端子8、光デジタル音声出力端子9に接続されているか否かの情報、及び、オーディオデコーダ19からのオーディオ符号化信号のチャンネル情報に基づいて、生成が必要なチャンネル数のオーディオ信号を判断する。制御部101は、オーディオデコーダ19を制御して、生成が必要なチャンネル数のオーディオ信号を生成させる。例えば、本実施の形態では、オーディオデコーダ19において、7.1ch、5.1ch、2chのオーディオ信号が生成される。この際、制御部101は、オーディオデコーダ19から、送信情報(チャンネル情報及び格納先のアドレス情報)を取得する。
【0076】
制御部101は、オーディオ出力部21に対して、送信情報を送る。具体的に制御部101は、ビデオ信号に同期したタイミングで、送信情報を使って、オーディオ出力部21を制御する。例えば、制御部101は、再生開始時において、送信情報(1):チャンネル情報「7.1」アドレス「00001」、送信情報(2):チャンネル情報「5.1」アドレス「10001」、送信情報(3):チャンネル情報「2.0」アドレス情報「20001」を送信する。このようにして、制御部101は、ビデオ信号に対する同期を取りつつ、各チャンネル情報の音声を出力できるようにしている。
【0077】
なお、制御部101は、次のビデオ信号に対する同期のタイミングで、次の送信情報をオーディオ出力部21に送信する。制御部101が次のタイミングに送信する情報は、例えば、送信情報(1):チャンネル情報「7.1」アドレス「00501」、送信情報(2):チャンネル情報「5.1」アドレス「10501」、送信情報(3):チャンネル情報「2.0」アドレス情報「20501」のようになる。
【0078】
オーディオ出力部21では、取得した送信情報を基に、7.1ch、5.1ch及び2chのオーディオ信号が存在するか否かを判定する。オーディオ出力部21は、存在するチャンネル情報に応じて、アドレス情報で指定されるデータを、オーディオ出力バッファ20から取得する。そしてオーディオ出力部21は、対応する音声調整部に送信する。
【0079】
オーディオ出力部21の処理動作を説明する(図5)。図5において、オーディオ出力部21は、オーディオ出力バッファからサンプルデータをブロック単位で読み出し、音量調整部22,23,24の何れかに入力する。
【0080】
オーディオ出力部21は、制御部101からの送信情報に基づいて、チャンネル情報「7.1」が含まれるか否かを判別する(S1)。オーディオ出力部21は、チャンネル情報「7.1」が含まれる場合、対応するアドレス情報に基づいて、ブロック単位でオーディオ信号を取得する(S2)。また、オーディオ出力部21は、取得したオーディオ信号を、第1音量調整部22へ出力する(S3)。
【0081】
オーディオ出力部21は、制御部101からの送信情報に基づいて、チャンネル情報「5.1」が含まれるか否かを判別する(S4)。オーディオ出力部21は、チャンネル情報「5.1」が含まれる場合、対応するアドレス情報に基づいて、ブロック単位でオーディオ信号を取得する(S5)。また、オーディオ出力部21は、取得したオーディオ信号を、第2音量調整部23へ出力する(S6)。
【0082】
オーディオ出力部21は、制御部101からの送信情報に基づいて、チャンネル情報「2.0」が含まれるか否かを判別する(S7)。オーディオ出力部21は、チャンネル情報「2.0」が含まれる場合、対応するアドレス情報に基づいて、ブロック単位でオーディオ信号を取得する(S8)。また、オーディオ出力部21は、取得したオーディオ信号を、第3音量調整部24へ出力する(S9)。
【0083】
第1音量調整部22、第2音量調整部23及び第3音量調整部24の各々では、音量調整処理が行なわれる。第1音量調整部22、第2音量調整部23及び第3音量調整部24の動作は同じ流れであるので、第1音量調整部22の動作例を代表例として説明する(図6)。本実施の形態では、第1音量調整部22に、ブロック「N+1」のオーディオ信号が入力された例を説明する。なお、第1音量調整部22、第2音量調整部23、第3音量調整部24では、例えば、オーディオ信号のチャンネル数やサンプリング周波数が異なる場合がある。
【0084】
まず、第1音量調整部22は、ブロック単位内(ブロック「N+1」)におけるピーク音量レベルを検出する(T1)。
【0085】
次に、第1音量調整部22は、ブロック単位内のピーク音量レベルと、過去のブロック単位内のビーク音量レベルから、所定期間内のピーク音量レベルを検出する(T2)。第1音量調整部22は、予め指定された所定期間(例えば100msec、ブロック単位では、120個)分のブロック単位内のピーク音量レベルを履歴として保持している。ここで第1音量調整部22は、ピーク音量レベルの履歴をリングバッファに格納している。したがって、第1音量調整部22は、新たなブロック単位内のピーク音量レベルを検出すると、最も古い履歴を削除し、代わりに履歴に登録する。例えば、図8のブロック「N−119」のブロック単位内ピーク音量の代わりに、ブロック「N+1」のブロック単位内ピーク音量を登録する。
【0086】
次に、第1音量調整部22は、検出した所定期間内のピーク音量レベルと閾値とを比較し、ゲイン設定方法を判定する(T3)。
【0087】
ゲイン設定方法の判定動作を説明する(図7)。ゲイン設定方法判定動作では3つの閾値を用いる。レベルの高い順に第1閾値、第2閾値、第3閾値とする。
【0088】
まず、第1音量調整部22は、ピーク音量レベルと第1閾値を比較する(U1)。第1音量調整部22は、ピーク音量レベル>第1閾値がYESの場合、出力音量レベル=第1閾値になるようなゲイン設定方法を選択する(U2)。第1音量調整部22は、U1がNOの場合、ピーク音量レベルと第2閾値を比較する(U3)。第1音量調整部22は、ピーク音量レベル>=第2閾値がYESの場合、出力音量レベル=入力音量レベルとなるようなゲイン設定方法を選択する(U4)。第1音量調整部22は、U3がNOの場合は、ピーク音量レベルと第3閾値を比較する(U5)第1音量調整部22は、ピーク音量レベル>=第3閾値がYESの場合は、出力音量レベル=第2閾値になるようなゲイン設定方法を選択する(U6)。
第1音量調整部22は、U5がNOの場合は、出力音量レベル=入力音量レベルとなるようなゲイン設定方法を選択する(U7)。
【0089】
第1音量調整部22は、ステップT3によって選択されたゲイン設定方法に基づいて、ゲイン値を算出する(T4)。第1音量調整部22は、ゲイン算出を行う際、ある時間(たとえば4sec)で上述したようなスムージングの処理を行う。これにより出力音量レベルを滑らかに変化させ、自然な音量調整を実現する。
【0090】
次に、第1音量調整部22は、算出したゲイン値と予め指定された最大ゲイン値とを比較する(T5)。
第1音量調整部22は、ゲイン値>最大ゲイン値がYESの場合、ゲイン値=最大ゲイン値となるようにゲイン値を補正する(T6)。
【0091】
次に、第1音量調整部22は、ゲイン値とピーク音量レベルをかけた値と上限値を比較する(T7)。第1音量調整部22は、ゲイン値とピーク音量レベルをかけた値>上限値がYESの場合は、出力音量レベル=上限値となるようにゲイン値を調整する(T8)。最後に第1音量調整部22は、上記ステップT1〜T7で設定されたゲイン値をかけて、入力信号であるブロック「N+1」のオーディオ信号の音量を調整する(T9)。
【0092】
<6.第1音量調整部22において設定されるゲイン値の設定例>
上述した動作によって、本実施の形態に設定されるゲイン値の設定例を説明する。なお、図4の設定値には、上記で説明したスムージング処理を考慮(適用)していない。図4は、横軸が入力音量レベル(ピーク音量レベル)を示し、縦軸が出力音量レベルを示す。
【0093】
例えば、ピーク音量レベルが第1閾値よりも大きな値である場合(範囲I)、ピーク音量レベルが、第1目標値になるようなゲイン調整が行なわれていることがわかる。範囲Iは、第1範囲の一例である。
【0094】
また、ピーク音量レベルが第2閾値よりも大きく、第1閾値以下である場合(範囲II)、入力音量レベル=出力音量レベルになるようなゲイン調整が行なわれていることがわかる。範囲IIは、第2範囲の一例である。
【0095】
さらに、ピーク音量レベルが第3閾値よりも大きく、第2閾値以下である場合において(範囲III)、以下のゲイン調整が行われていることがわかる。つまり、ピーク音量レベルを第2目標値になるようにゲイン値を調整した場合、ゲイン値が最大ゲイン値以下で調整できる時、第2目標値になるようなゲイン値で設定し、ゲイン値が最大ゲイン値よりも大きい時、最大ゲイン値で設定する。範囲IIIは、第3範囲の一例である。また、最大ゲイン値よりも大きいゲイン値の範囲が、所定範囲の一例である。
【0096】
加えて、ピーク音量レベルが第3閾値以下である場合(範囲IV)、入力音量レベル=出力音量レベルになるようなゲイン調整が行なわれていることがわかる。範囲IVは、第4範囲の一例である。
【0097】
<7.まとめ>
本実施の形態では、音声データを取得するLSI6と、取得した音声データの音量レベルをゲイン値で調整するLSI6と、を備える。そして、LSI6は、音声データの音量レベルが第2閾値よりも小さい場合、第2目標値に音量レベルが変換されるようゲイン値を算出し、算出したゲイン値が最大ゲイン値よりも大きい場合、最大ゲイン値で音声データの音量レベルを調整する。
【0098】
このようにすれば、最大ゲイン値よりも大きい範囲でのゲイン調整がなくなるため、音声データが本来持つ音量レベルの強弱が失われることを軽減できる。
【0099】
本実施の形態では、LSI6は、音声データの音量レベルが第3閾値以下である場合、音声データの音量レベルが入力と出力で同じになるようなゲイン値で調整する。そして、LSI6は、音声データの音量レベルが第3閾値よりも大きく、第2閾値以下に存在する場合、音声データの音量レベルが大きくなるようなゲイン値で音量を調整する。
【0100】
このようにすれば、第3閾値以下の音声データを大きくしてしまって、背景雑音が大きくなるといったことを軽減できる。
【0101】
本実施の形態では、7.1chの第1オーディオ信号及び5.1chの第2オーディオ信号を取得可能なオーディオ出力部21と、取得したオーディオ信号の音量レベルをゲイン値で調整する音量調整部22、23、24と、を備える。そして音量調整部22、23,24は、第1オーディオ信号の音量レベルを調整する場合において、第1オーディオ信号の音量レベルに応じたゲイン値で調整する一方、第2オーディオ信号の音量レベルを調整する場合において、第2オーディオ信号の音量レベルに応じたゲイン値で調整する。
【0102】
このようにすれば、複数のオーディオ信号間で音量差を補償することができるようになる。
(他の実施の形態)
本実施の形態として、実施の形態1を例示した。しかし、本発明はこれに限られない。そこで本発明の他の実施の形態を以下まとめて説明する。なお、本発明は、これらには限定されず、適宜修正された実施の形態に対しても適用可能である。
【0103】
実施の形態1では、各出力端子(HDMI出力端子7、アナログ音声出力端子8、光デジタル音声出力端子9)から出力するオーディオ信号は、各々の調整処理部を介して出力するようにした。しかし、これに限れず、同じチャンネル数や、同じサンプリング周波数を持つ音声データに対しては、同じ調整処理部を介して各出力端子に出力するようにしてもよい。このようにすれば、同じ出力を行なう場合、複数の音声調整処理を行う必要がなくなる。
【0104】
なお、本実施の形態では、図5に示すように、オーディオ出力部21が、チャンネルに対応する形で、調整処理部及び出力端子を選択できるように構成した。しかし、これに限られない。
【0105】
なお、各出力端子に必要な音声データ(5.1ch、2ch)を新たに生成するとしたが、オーディオ符号化信号に予め複数のチャンネル構成、例えば7.1chと2chが符号化されている場合は、5.1chのみを生成し、2ch信号は復号して用いてもよい。
【0106】
また、本実施の形態1では、レコーダ(図1,2)を用いて説明したが、HDDやチューナーが存在しないプレーヤーや光学ドライブが存在しないセットトップボックスでもよい。
【0107】
また、図1の各端子の接続先はこれに限らない。
【産業上の利用可能性】
【0108】
本発明は、レコーダーやプレーヤー、テレビ、パーソナルコンピュータなどに適用可能である。
【符号の説明】
【0109】
1 レコーダー
2 アンテナ
3 チューナー
4 光ディスク
5 HDD
6 LSI
7 HDMI出力端子
8 アナログ音声出力端子
9 光デジタル音声出力端子
10 サラウンドシステム(7.1ch)(アンプ及びスピーカー)
11 スピーカー
12 テレビ
13 ストリーム入力部
14 ビデオ入力バッファ
15 ビデオデコーダ
16 ビデオ出力バッファ
17 ビデオ出力部
18 オーディオ入力バッファ
19 オーディオデコーダ
20 オーディオ出力バッファ
21 オーディオ出力部
22 第1音量調整部
221 レベル検出部
222 ゲイン設定方法判定部
223 ゲイン算出部
224 最大ゲイン判定処理部
225 オーバーフロー判定部
226 ゲイン調整部
23 第2音量調整部
24 第3音量調整部
100 ネットワーク
101 制御部

【特許請求の範囲】
【請求項1】
音声データを取得する取得手段と、
前記取得した音声データの音量レベルをゲイン値で調整する音量調整手段と、
を備え、
前記音量調整手段は、
前記音声データの音量レベルが第3範囲に含まれる場合、前記第2目標値に音量レベルが変換されるようゲイン値を算出し、
当該算出したゲイン値が所定範囲に含まれる場合、所定範囲に満たないゲイン値で前記音声データの音量レベルを調整する、
音量調整装置。
【請求項2】
前記所定範囲は、所定のゲイン値よりも大きい範囲であり、
前記所定範囲に満たないゲイン値は、所定のゲイン値である、
請求項1に記載の音量調整装置。
【請求項3】
音声データを取得する取得手段と、
前記取得した音声データの音量レベルをゲイン値で調整する音量調整手段と、
を備え、
前記音量調整手段は、
前記音声データの音量レベルが第4範囲に含まれる場合、前記音声データの音量レベルが大きくならないような第3ゲイン値で調整し、
前記音声データの音量レベルが第4範囲よりも大きな値で構成される第3範囲に含まれる場合、前記音声データの音量レベルが大きくなるような第2ゲイン値で音量を調整する、
音量調整装置。
【請求項4】
前記第4範囲は、第3閾値以下の範囲であり、
前記第3範囲は、前記第3閾値よりも大きく、当該第3閾値よりも大きい第2閾値以下の範囲である、
請求項3に記載の音量調整装置。
【請求項5】
第1の出力形態で音声出力可能な第1オーディオ信号及び第2の出力形態で音声出力可能な第2オーディオ信号を取得可能な取得手段と、
前記取得手段で取得したオーディオ信号の音量レベルをゲイン値で調整する音量調整手段と、
を備え、
前記音量調整手段は、
前記第1オーディオ信号の音量レベルを調整する場合において、当該第1オーディオ信号の音量レベルに応じたゲイン値で調整する一方、
前記第2オーディオ信号の音量レベルを調整する場合において、当該第2オーディオ信号の音量レベルに応じたゲイン値で調整する、
音量調整装置。
【請求項6】
前記第1オーディオ信号及び第2オーディオ信号は、同じオーディオ信号に基づいて、生成される、
請求項5に記載の音量調整装置。
【請求項7】
音声データを取得する取得手段と、
前記取得した音声データの音量レベルをゲイン値で調整する音量調整手段と、
を備え、
前記音量調整手段は、
前記音声データの音量レベルが第2閾値よりも小さい場合、前記第2目標値に音量レベルが変換されるようゲイン値を算出し、
当該算出したゲイン値が所定のゲイン値よりも大きい場合、所定のゲイン値で前記音声データの音量レベルを調整する、
音量調整装置。
【請求項8】
音声データを取得する取得手段と、
前記取得した音声データの音量レベルをゲイン値で調整する音量調整手段と、
を備え、
前記音量調整手段は、
前記音声データの音量レベルが第3閾値以下である場合、前記音声データの音量レベルが大きくならないような第3ゲイン値で調整し、
前記音声データの音量レベルが前記第3閾値よりも大きく、当該第3閾値よりも大きい第2閾値以下である場合、前記音声データの音量レベルが大きくなるような第2ゲイン値で音量を調整する、
音量調整装置。
【請求項9】
多チャンネルの音声データを取得可能な取得手段と、
前記取得した多チャンネルの音声データの内、最大の音量レベルを検出する検出手段と、
前記検出した最大の音量レベルに基づいて、前記マルチチャンネルの音声データの音量レベルを調整する音量調整手段と、
を備える音量調整装置。
【請求項10】
多チャンネルの音声データを取得可能な取得手段と、
前記取得した多チャンネルの音声データの内、チャンネル単位で最も大きく、かつ、チャンネル間で最も大きい音量レベルを検出する検出手段と、
前記検出した音量レベルに基づいて、前記マルチチャンネル全体の音声データの音量レベルを調整する音量調整手段と、
を備える音量調整装置。
【請求項11】
音声データを取得する取得手段と、
前記取得した音声データのある期間における最大の音量レベルを検出する検出手段と、
前記検出した最大の音量レベルに基づいて、前記取得した前記期間における音声データの音量レベルを調整する音量調整手段と、
を備え、
前記音量調整手段は、
前記最大の音量レベルが第1範囲に含まれる場合、第1目標値に音量レベルが変換されるよう前記音声データの音量レベルを調整し、
前記最大の音量レベルが前記第1範囲よりも小さな値で構成される第2範囲に含まれる場合、前記音声データの音量レベルが当該音量調整前と調整後で一致するよう前記音声データの音量レベルを調整し、
前記最大の音量レベルが前記第2範囲よりも小さな値で構成される第3範囲に含まれる場合、前記第1目標値よりも小さい第2目標値に音量レベルが変換されるようゲイン値を算出し、当該ゲイン値が所定のゲイン値よりも大きい場合、算出されたゲイン値を所定のゲイン値に補正し、当該補正したゲイン値に基づいて前記音声データの音量レベルを調整し、
前記最大の音量レベルが前記第3範囲よりも小さな値で構成される第4範囲に含まれる場合、前記音声データの音量レベルが当該音量調整前と調整後で一致するよう前記音声データの音量レベルを調整する、
音量調整装置。
【請求項12】
前記第1範囲は、第1閾値よりも大きい範囲であり、
前記第2範囲は、前記第1閾値よりも小さい第2閾値よりも大きく、前記第1閾値以下の範囲であり、
前記第3範囲は、前記第2閾値よりも小さい第3閾値よりも大きく、当該第2閾値以下の範囲であり、
前記第4範囲は、前記第3閾値よりも小さい第4閾値以下の範囲である、
請求項11に記載の音量調整装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−15266(P2011−15266A)
【公開日】平成23年1月20日(2011.1.20)
【国際特許分類】
【出願番号】特願2009−158745(P2009−158745)
【出願日】平成21年7月3日(2009.7.3)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】