説明

頭部伝達関数の補正方法

【課題】 頭部伝達関数の場所依存性を低減させ、臨場感などの音響効果を得つつも、聴取者が頭を動かした場合の違和感を低減することが可能な頭部伝達関数の補正方法を提供することを目的としている。
【解決手段】複数のインパルス応答の音データを採取し、前記複数の音データについて第1のピークの到達時間を一致させる補正を行い、前記複数の音データを振幅および位相をあわせて平均化処理を行い、平均化処理後の音データを用いて頭部伝達関数を算出することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、頭部伝達関数を求めるにあたり、頭部の移動による影響を緩和するための補正方法に関する。
【背景技術】
【0002】
一般に、スピーカから出力した音声は再生環境内で複雑に反射や減衰してから、受音点に到達する。このため、フラットな特性を有する基準音(所定範囲の周波数において同等の音圧(dB)を有する音)を録音した場合であっても、周波数によって減衰の度合いが異なり、また遅れ方にも差が生じる。これは、周波数解析した場合に、音圧(dB)のピーク(山)やディップ(谷)、波形の遅れ(ずれ)として定量的に表すことができる。このような、周波数(帯域)に応じた振幅の変化や遅れの度合いを、その環境における周波数特性という。
【0003】
人間は頭の両側についている二つの耳によって音を聞いている。そのため、音響が人間にどのように聞こえるかを考える場合、人間の位置まで到達した音の周波数特性のみならず、両耳が外側に開いているその指向性、音が頬や鼻に当たって回り込む影響、耳たぶや頭部、外耳道の反響や伝達の影響もあわせて考慮する必要がある。この音源から聴取者の鼓膜までの音の伝達特性を頭部伝達関数(HRTF:Head-Related Transfer Function)といい、人が音像を判断するための物理的情報を包含しているといえる。頭部伝達関数を求める一般的な手法は、スピーカから基準音を出力し、耳の位置で実際に録音した音データから周波数特性を算出し、これを関数化する。
【0004】
音の採取にあたって、二つの耳による聞こえ方を勘案するために、単に2つのマイクを用いることも考えられる。しかしこれでは指向性や回り込みなどが再現されないため、実際に人間の耳部にマイクを取り付けたり、特に耳部を忠実に再現したダミーヘッド(ヘッドトルソ)といわれる人形を用いて、両耳の鼓膜位置にマイクを設置し、サンプリングを行うことが一般的に行われている。
【0005】
上記のようにして求めた頭部伝達関数を用いれば、音楽ホールなどの特定環境における周波数特性を再現して臨場感のある音響効果を加えたり、クロストークキャンセル処理を行ったりすることが可能となる。なおクロストークキャンセル処理とは、例えば右のスピーカから出て左の耳に入る音に対し、これと逆位相の音を左のスピーカから出力して打ち消す処理である。
【0006】
しかし、頭部伝達関数は音データ採取時のスピーカとマイクの位置関係に強く依存する。このため、ヘッドホンを使っている場合や、モニタを見るために頭の位置をほぼ固定している場合には問題は生じないが、例えば車載オーディオなどのように聴取者が頭を様々に動かす状況においては、頭部伝達関数の場所依存性が問題となる。言い換えれば、頭部伝達関数は頭の位置および方向が最適化されすぎており、頭を動かすと却って聞こえ方に違和感が生じてしまうおそれがある。
【0007】
従来からも頭部伝達関数を用いた音響効果を補正する手法は種々考案されており、例えば特許文献1(特開平05−037994号公報)には、椅子背部の傾斜角変化と座部の回動とに対応して、頭部伝達関数を補正する提案が記載されている。
【特許文献1】特開平05−037994号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
本発明は、上記課題を鑑みて、頭部伝達関数の場所依存性を低減させ、臨場感などの音響効果を得つつも、聴取者が頭を動かした場合の違和感を低減することが可能な頭部伝達関数の補正方法を提供することを目的としている。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明に係る頭部伝達関数の補正方法の代表的な構成は、複数のインパルス応答の音データを採取し、前記複数の音データについて第1のピークの到達時間を一致させる補正を行い、前記複数の音データを振幅および位相をあわせて平均化処理を行い、平均化処理後の音データを用いて頭部伝達関数を算出することを特徴とする。
【0010】
前記複数のインパルス応答データは、スピーカとマイクとの位置関係を変更することにより採取されたものであることが好ましい。
【0011】
さらに、平均化処理後の音データにおいて、高音域を増幅する補正を行うことが好ましい。
【発明の効果】
【0012】
本発明によれば、頭部伝達関数の場所依存性を緩和することができるため、聴取者が頭部を動かした場合に生じる違和感を軽減することができる。
【発明を実施するための最良の形態】
【0013】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0014】
図1は本実施例における頭部伝達関数を算出するためのシステムを説明する概略構成図、図2は本実施例の特徴的な処理を説明する図である。図1に示すシステムは、インパルス応答を得るための特定環境、例えばコンサートホールなどに設置されているものとする。
【0015】
図1(a)に示すように、音源として左スピーカLと、右スピーカRが設置されている。音源と対向する位置には、ダミーヘッド1が設置されている。ダミーヘッド1の左右の鼓膜位置にはマイク2L、2Rが取り付けられており、録音部3へと接続されている。録音部には演算部4が接続されており、さらにデータや演算結果を記録するための記録部5、これらをシートまたは画面上に出力するための出力部6、各種操作やデータ入力のための操作入力部7が備えられている。演算部4には、後述する平均化処理を行う平均化処理部、および頭部伝達関数を算出する頭部伝達関数算出部が備えられている。
【0016】
録音(サンプリング)は、左右のスピーカL、Rのそれぞれ一方のみからパルス波(基準音)を出力し、ダミーヘッド1の左右のマイク2L、2Rからそれぞれ録音する(インパルス応答)。そしてインパルス応答を基に頭部伝達関数を求め、これを再現するフィルタを生成することにより、特定環境の周波数特性の再現やクロストークキャンセル処理に用いることができる。
【0017】
なお、上記構成において録音のパターンはスピーカとマイクの組み合わせにより4パターンあるが、本発明はそれぞれのパターンに付き独立に行う処理である。そこで説明の簡便のため、以下においてはいずれか1つのパターンにおける処理を説明する。
【0018】
さて従来の技術においても説明したとおり、頭部伝達関数は音データ採取時のスピーカとマイクの位置関係に強く依存し、聴取者が頭を様々に頭を動かすと、却って聞こえ方に違和感が生じてしまうおそれがある。図1(b)は、車載オーディオのヘッドレストスピーカに対し、聴取者が頭を動かしたことによる耳の位置の移動を説明する図である。この図から頭部を少し動かしただけでスピーカと耳の位置の関係は大きく異なってしまうことがわかる。
【0019】
そこで、頭の位置を所定範囲内で様々に変えて複数のインパルス応答の音データを採取し、平均化処理を行うことが考えられる。ここで平均化とは、振幅および位相をあわせて平均化処理することをいう。これにより、頭部伝達関数の場所依存性をある程度緩和させることが可能になると考えられる。
【0020】
しかし、採取したインパルス応答を単に平均化処理すると、高音が著しく減衰してしまう。これは、人間の可聴域は20〜20000Hz程度といわれるところ、音速は標準状態で約343m/sであるから、例えば1KHzであれば波長が34.3Cm程度となり、10KHzであれば波長が3.4Cmとなる。平均化処理をする場合、位相が半分ずれた2つの音を重ね合わせれば打ち消し合ってしまうため、より高音であるほど、よりわずかな耳の移動でも影響を受けてしまう(減衰してしまう)ことがわかる。高音域が打ち消し合って失われてしまった音データを用いて頭部伝達関数を求め、フィルタを生成すれば、そのフィルタを介して再生すると高音域が出力されないこととなってしまう。
【0021】
そこで本実施例においては、図2に示すように、まず同一のスピーカとマイクの組み合わせ(例えば左スピーカLと左耳のマイク2Lの組み合わせ)において、スピーカとマイクとの位置関係を、頭の位置および方向を所定範囲内で位置Aから位置Dまで変更しつつ、複数の音データの採取を行う。所定範囲とは頭を動かすであろう範囲であるが、あまりに大きく範囲を取っては頭部伝達関数が意味をなさなくなってしまうため、例えば30cm立方程度とする。ただしこの範囲の設定は、対象とする再生環境に応じて適宜決定するべきものである。
【0022】
次に、振幅波形における正方向の最初のピークを第1パスと称すると、第1パスの開始時間が一致するように音データを補正する。それから、これら複数の音データを、振幅および位相をあわせて平均化処理を行う。これにより、波長の短い高音域においても、打ち消し合って減衰してしまうことを極力防止することができる。
【0023】
しかし、上記構成によっても、やはり高音域の音はある程度減衰してしまう。そのため本実施例では、さらに高音域を増幅し、減衰を補正している。なお、第1パスの開始時間を一致させずに平均化処理を行った場合には、高音域の減衰があまりにも著しいため、音の特性が失われており、増幅してもノイズにしかならない。本実施例では、高音域の減衰が抑えられているからこそ、増幅して補正することも可能となっている。
【0024】
上記の頭部伝達関数の補正は、スピーカとマイクの組み合わせのそれぞれについて行う。これにより、頭部伝達関数を用いたフィルタの効果(特定環境の周波数特性の再現やクロストークキャンセル処理)は薄れるものの、聴取者が頭を動かした際の違和感の発生を抑えることができるという効果を得ることができ、バランスの取れたフィルタを生成可能な頭部伝達関数とすることができる。
【0025】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことはいうまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到しうることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【産業上の利用可能性】
【0026】
本発明は、頭部伝達関数の補正方法として利用することができる。
【図面の簡単な説明】
【0027】
【図1】頭部伝達関数を算出するためのシステムを説明する概略構成図である。
【図2】本実施例の特徴的な処理を説明する図である。
【符号の説明】
【0028】
L …左スピーカ
R …右スピーカ
1 …ダミーヘッド
2L …マイク
2R …マイク
3 …録音部
4 …演算部
5 …記録部
6 …出力部
7 …操作入力部

【特許請求の範囲】
【請求項1】
複数のインパルス応答の音データを採取し、
前記複数の音データについて第1のピークの到達時間を一致させる補正を行い、
前記複数の音データを振幅および位相をあわせて平均化処理を行い、
平均化処理後の音データを用いて頭部伝達関数を算出することを特徴とする、頭部伝達関数の補正方法。
【請求項2】
前記複数のインパルス応答データは、スピーカとマイクとの位置関係を変更することにより採取されたものであることを特徴とする請求項1記載の頭部伝達関数の補正方法。
【請求項3】
平均化処理後の音データにおいて、高音域を増幅する補正を行うことを特徴とする請求項1記載の頭部伝達関数の補正方法。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2006−279863(P2006−279863A)
【公開日】平成18年10月12日(2006.10.12)
【国際特許分類】
【出願番号】特願2005−99680(P2005−99680)
【出願日】平成17年3月30日(2005.3.30)
【出願人】(000001487)クラリオン株式会社 (1,722)
【Fターム(参考)】