説明

聴覚特性模擬装置、ミキシングバランス表示システム及びそれらのプログラム

【課題】健聴者に不快感を与えることなく、感音性難聴者の聴覚特性を正確に模擬することができるという効果を有する聴覚特性模擬装置、ミキシングバランス表示システム及びそれらのプログラムを提供すること。
【解決手段】高齢者聴覚模擬装置100は、時間領域の信号を周波数領域の信号に変換する時間周波数変換部13及び14と、周波数領域の信号のエネルギレベルを周波数バンド毎に算出するエネルギレベル算出部15及び16と、マスキング補正量を算出するマスキング補正量算出部17と、高齢性リクルートメント現象を模擬するリクルートメント模擬部18と、周波数特性を補正する周波数特性補正部19と、周波数領域の信号を時間領域の信号に変換する周波数時間変換部20及び21とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、高齢者の聴覚特性を模擬する聴覚特性模擬装置、それを備えたミキシングバランス表示システム及びそれらのプログラムに関する。
【背景技術】
【0002】
従来、例えばナレーション(以下「NR」と表す。)信号とバックグラウンドミュージック(以下「BGM」と表す。)信号とのミキシングを行う際に、訓練された音声調整者が実際に音を聞きながら音声調整卓を操作し、NR信号とBGM信号とのミキシングバランスが最適になるよう手動で調整していた。この手法では、熟練した音声調整者が必要となるという課題があり、この課題の解決を図ることを目的として音声レベルバランス指示装置が提案されている(例えば、特許文献1参照)。
【0003】
特許文献1に示されたものは、NR用及びBGM用の聴覚モデルに基づいた聴覚マスキング曲線を求める手段と、NRの聴覚マスキング曲線とBGMの聴覚マスキング曲線とのレベル差を求める手段と、両者のレベル差からミキシングバランスを制御する制御信号を生成する手段とを備え、NR信号とBGM信号とのミキシングバランスの状態を指示することができるようになっている。
【特許文献1】特開平10−308999号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に示された従来のものは、熟練した音声調整者が必要となるという課題を解決できるものではあったが、NR信号の立ち上がり部及び立ち下がり部においてBGM信号がNR信号よりも大き過ぎるという不適切な表示が頻繁に起こるので、ミキシングバランスの状態の表示値と聴感とが一致し難いものであり、その改善が望まれていた。特に、従来のものは、例えば高齢性難聴のような感音性難聴に起因して聴力が低下した者(以下「感音性難聴者」という。)の聴感によく合うミキシングバランスが表示できるものではなかった。
【0005】
また、B.C.J.ムーアらの報告によれば、雑音信号成分を音声信号成分に付加することによって感音性難聴者の聴覚特性の模擬を実現できることが示されているが、正常な聴覚を有する健聴者には雑音信号成分が心理的に邪魔なものとなって健聴者に不快感を与えることがあるという課題があった。
【0006】
本発明は、このような事情に鑑みてなされたものであり、健聴者に不快感を与えることなく、感音性難聴者の聴覚特性を正確に模擬することができる聴覚特性模擬装置、それを備えたミキシングバランス表示システム及びそれらのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の聴覚特性模擬装置は、第1及び第2の音信号のエネルギレベルを周波数バンド毎に算出するエネルギレベル算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの差に基づいて感音性難聴者の聴覚マスキング特性を模擬するためのマスキング補正量を前記周波数バンド毎に算出するマスキング補正量算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの和に基づいて前記感音性難聴者のリクルートメント現象を模擬するためのリクルートメント補正量を前記周波数バンド毎に算出するリクルートメント補正量算出手段と、前記マスキング補正量及び前記リクルートメント補正量に基づいて前記第1及び前記第2の音信号にそれぞれ対応する前記感音性難聴者の聴覚特性を模擬した第1及び第2の聴覚特性模擬信号を算出する聴覚特性模擬信号算出手段とを備えた構成を有している。
【0008】
この構成により、本発明の聴覚特性模擬装置は、従来のものとは異なり、雑音信号成分を健聴者に与えることなく、マスキング補正量及びリクルートメント補正量に基づいて第1及び第2の音信号にそれぞれ対応する感音性難聴者の聴覚特性を模擬することができるので、健聴者に不快感を与えることなく、感音性難聴者の聴覚特性を正確に模擬することができる。
【0009】
また、本発明の聴覚特性模擬装置は、前記マスキング補正量算出手段が、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの差が、予め定められた第1の閾値以上のとき予め定められた第1のマスキング補正量を示す信号を出力し、予め定められた第2の閾値以下のとき予め定められた第2のマスキング補正量を示す信号を出力し、前記第1の閾値と前記第2の閾値との間にあるとき前記第1のマスキング補正量と前記第2のマスキング補正量とを単調に結ぶ関数で得られる値を示す信号を出力するものであり、前記第1の閾値は、前記第2の閾値よりも大きく、前記第1のマスキング補正量は、前記第2のマスキング補正量よりも大きい構成を有している。
【0010】
この構成により、本発明の聴覚特性模擬装置は、感音性難聴者の聴覚マスキング特性を模擬するためのマスキング補正量を前記周波数バンド毎に正確に算出することができる。
【0011】
さらに、本発明の聴覚特性模擬装置は、前記リクルートメント補正量算出手段が、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの和を示すエネルギレベル加算値が、予め定められた第1及び第2の年齢層の人間が相互にラウドネスを等しく感じる最小の音圧レベルを示す最小音圧レベル閾値以上のとき予め定められたリクルートメント補正量を示す信号を出力し、前記最小音圧レベル閾値よりも小さいとき予め定められた関数で得られるリクルートメント補正量を示す信号を出力するものであり、前記関数は、前記第1及び前記第2の年齢層の人間がそれぞれ聞き取ることのできる最小の音圧と周波数との関係を示す最小可聴限特性からそれぞれ導出される第1及び第2の最小可聴限値と、前記エネルギレベル加算値と、前記最小音圧レベル閾値とに基づいて決められたものであり、前記第1の最小可聴限値は、前記第2の最小可聴限値よりも小さい構成を有している。
【0012】
この構成により、本発明の聴覚特性模擬装置は、感音性難聴者のリクルートメント現象を模擬するためのリクルートメント補正量を前記周波数バンド毎に正確に算出することができる。
【0013】
さらに、本発明の聴覚特性模擬装置は、前記リクルートメント補正量算出手段が、前記第1の最小可聴限値、前記第2の最小可聴限値及び前記最小音圧レベル閾値のそれぞれを可変可能である構成を有している。
【0014】
この構成により、本発明の聴覚特性模擬装置は、模擬対象者の聴覚特性に合わせてより正確に模擬することができる。
【0015】
さらに、本発明の聴覚特性模擬装置は、前記聴覚特性模擬信号算出手段が、前記第1の音信号のエネルギレベルと、前記マスキング補正量と、前記リクルートメント補正量とに基づいて前記第1の聴覚特性模擬信号を算出し、前記第2の音信号のエネルギレベルと、前記リクルートメント補正量とに基づいて前記第2の聴覚特性模擬信号を算出する構成を有している。
【0016】
この構成により、本発明の聴覚特性模擬装置は、健聴者に不快感を与えることなく、感音性難聴者の聴覚特性を正確に模擬することができる。
【0017】
さらに、本発明の聴覚特性模擬装置は、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とを混合する模擬信号混合手段を備えた構成を有している。
【0018】
この構成により、本発明の聴覚特性模擬装置は、模擬信号混合手段が出力する模擬混合音信号を再生することによって、その再生音の聴取者に感音性難聴者の聴覚特性を把握させることができる。
【0019】
本発明のミキシングバランス表示システムは、聴覚特性模擬装置と、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を表示するミキシングバランス表示装置とを備え、前記ミキシングバランス表示装置は、前記第1及び前記第2の聴覚特性模擬信号のレベルを所定時間間隔のフレーム毎に検出するレベル検出手段と、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのレベル差を算出するレベル差算出手段と、前記レベル差に対して前記第1の聴覚特性模擬信号のレベルに応じた重み付けを行って重み付きレベル差を算出する重み付きレベル差算出手段と、現フレームから過去のn個のフレームまでの間において前記重み付きレベル差の値の大きいものから順にm個の値の平均値を算出する平均レベル差算出手段と、現フレームから過去の所定数のフレームまでの間における前記第1の聴覚特性模擬信号のレベル平均値を算出する第1聴覚特性模擬信号平均値算出手段と、前記平均レベル差算出手段及び前記第1聴覚特性模擬信号平均値算出手段の算出結果に基づいて前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を示す表示値を決定する表示値決定手段と、前記第1の聴覚特性模擬信号のレベルに基づいて前記表示値決定手段の出力を制御する表示制御信号を生成する表示制御信号生成手段と、前記表示制御信号に基づいて前記ミキシングバランスの状態を表示するミキシングバランス表示手段とを備えた構成を有している。
【0020】
この構成により、本発明のミキシングバランス表示システムは、模擬BGM信号のレベルが模擬NR信号のレベルよりも大き過ぎる場合は模擬BGM信号のレベルを下げるよう音声ミキサに促すことができ、模擬BGM信号のレベルが大き過ぎてNRが聴き取りにくいといった現象を未然に防ぐことができるので、番組の音響効果の向上を支援することができる。
【0021】
本発明の聴覚特性模擬プログラムは、感音性難聴者の聴覚特性を模擬する聴覚特性模擬装置としてコンピュータを機能させるための聴覚特性模擬プログラムであって、前記コンピュータを、第1及び第2の音信号のエネルギレベルを周波数バンド毎に算出するエネルギレベル算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの差に基づいて前記感音性難聴者の聴覚マスキング特性を模擬するためのマスキング補正量を前記周波数バンド毎に算出するマスキング補正量算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの和に基づいて前記感音性難聴者のリクルートメント現象を模擬するためのリクルートメント補正量を前記周波数バンド毎に算出するリクルートメント補正量算出手段と、前記マスキング補正量及び前記リクルートメント補正量に基づいて前記第1及び前記第2の音信号にそれぞれ対応する前記感音性難聴者の聴覚特性を模擬した第1及び第2の聴覚特性模擬信号を算出する聴覚特性模擬信号算出手段として機能させる構成を有している。
【0022】
この構成により、本発明の聴覚特性模擬プログラムは、従来のものとは異なり、雑音信号成分を健聴者に与えることなく、マスキング補正量及びリクルートメント補正量に基づいて第1及び第2の音信号にそれぞれ対応する感音性難聴者の聴覚特性を模擬することができるので、健聴者に不快感を与えることなく、感音性難聴者の聴覚特性を正確に模擬することができる。
【0023】
また、本発明の聴覚特性模擬プログラムは、前記コンピュータを、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とを混合する模擬信号混合手段として機能させる構成を有している。
【0024】
この構成により、本発明の聴覚特性模擬プログラムは、模擬信号混合手段が出力する模擬混合音信号を再生することによって、その再生音の聴取者に感音性難聴者の聴覚特性を把握させることができる。
【0025】
本発明のミキシングバランス表示プログラムは、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を表示するミキシングバランス表示装置としてコンピュータを機能させるためのミキシングバランス表示プログラムであって、前記コンピュータを、前記第1及び前記第2の聴覚特性模擬信号のレベルを所定時間間隔のフレーム毎に検出するレベル検出手段と、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのレベル差を算出するレベル差算出手段と、前記レベル差に対して前記第1の聴覚特性模擬信号のレベルに応じた重み付けを行って重み付きレベル差を算出する重み付きレベル差算出手段と、現フレームから過去のn個のフレームまでの間において前記重み付きレベル差の値の大きいものから順にm個の値の平均値を算出する平均レベル差算出手段と、現フレームから過去の所定数のフレームまでの間における前記第1の聴覚特性模擬信号のレベル平均値を算出する第1聴覚特性模擬信号平均値算出手段と、前記平均レベル差算出手段及び前記第1聴覚特性模擬信号平均値算出手段の算出結果に基づいて前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を示す表示値を決定する表示値決定手段と、前記第1の聴覚特性模擬信号のレベルに基づいて前記表示値決定手段の出力を制御する表示制御信号を生成する表示制御信号生成手段と、前記表示制御信号に基づいて前記ミキシングバランスの状態を表示するミキシングバランス表示手段として機能させる構成を有している。
【0026】
この構成により、本発明のミキシングバランス表示プログラムは、模擬BGM信号のレベルが模擬NR信号のレベルよりも大き過ぎる場合は模擬BGM信号のレベルを下げるよう音声ミキサに促すことができ、模擬BGM信号のレベルが大き過ぎてNRが聴き取りにくいといった現象を未然に防ぐことができるので、番組の音響効果の向上を支援することができる。
【発明の効果】
【0027】
本発明は、健聴者に不快感を与えることなく、感音性難聴者の聴覚特性を正確に模擬することができるという効果を有する聴覚特性模擬装置、ミキシングバランス表示システム及びそれらのプログラムを提供することができるものである。
【発明を実施するための最良の形態】
【0028】
以下、本発明の実施の形態について図面を用いて説明する。なお、本発明の聴覚特性模擬装置を、高齢者の聴覚特性を模擬する装置(以下「高齢者聴覚模擬装置」という。)であって、テレビやラジオ等の番組制作時におけるNR信号及びBGM信号を模擬するものに適用した例を挙げて説明する。実施の形態におけるNR信号及びBGM信号は、それぞれ、特許請求の範囲に記載の第1及び第2の音信号に対応する。
【0029】
(第1の実施の形態)
図1は、本発明の第1の実施の形態における高齢者聴覚模擬装置を示すブロック図である。
【0030】
図1に示すように、本実施の形態における高齢者聴覚模擬装置100は、アナログ信号をデジタル信号に変換するAD変換部11及び12と、時間領域の信号を周波数領域の信号に変換する時間周波数変換部13及び14と、周波数領域の信号のエネルギレベルを周波数バンド毎に算出するエネルギレベル算出部15及び16と、マスキング補正量を算出するマスキング補正量算出部17とを備えている。
【0031】
また、高齢者聴覚模擬装置100は、高齢性リクルートメント現象を模擬するリクルートメント模擬部18と、周波数特性を補正する周波数特性補正部19と、周波数領域の信号を時間領域の信号に変換する周波数時間変換部20及び21と、デジタル信号をアナログ信号に変換するDA変換部22及び23とを備えている。
【0032】
AD変換部11及び12は、それぞれ、アナログ信号であるNR信号及びBGM信号を入力し、アナログ値からデジタル値に変換するようになっている。尤も、入力されるNR信号及びBGM信号がデジタル信号である場合は、AD変換部11及び12は不要である。
【0033】
時間周波数変換部13及び14は、それぞれ、時間領域のNR信号及びBGM信号を周波数領域の信号に変換して、それぞれの周波数係数のデータを出力するようになっている。例えば、時間周波数変換部13及び14は、1024サンプル毎にFFT(高速フーリエ変換)処理を実行し、FFT係数を周波数係数として算出し、この周波数係数からFFTパワースペクトル係数を算出するようになっている。なお、時間周波数変換はFFTによるものに限定されず、例えばDCT(離散コサイン変換)を用いてもよい。
【0034】
エネルギレベル算出部15及び16は、それぞれ、周波数領域のNR信号及びBGM信号のエネルギレベルを周波数バンド毎に算出するようになっている。なお、エネルギレベル算出部15及び16は、本発明に係るエネルギレベル算出手段を構成する。
【0035】
マスキング補正量算出部17は、周波数バンド毎のNR信号及びBGM信号のエネルギレベル差に基づいて、NRに対するBGMによる妨害量をマスキング補正量として算出するようになっている。聴覚マスキング特性は加齢に伴って変化するので、マスキング補正量算出部17は、高齢者独特の聴覚マスキング特性を模擬するためにマスキング補正量を算出するものである。なお、マスキング補正量算出部17は、図示しないメモリを備え、マスキング補正量を算出する際に用いるデータをこのメモリに記憶している。このデータは、所望の聴覚特性に応じて任意に変更できるようになっている。なお、マスキング補正量算出部17は、本発明に係るマスキング補正量算出手段を構成する。
【0036】
リクルートメント模擬部18は、NR信号のエネルギレベルとBGM信号のエネルギレベルとの和に基づき、高齢者のリクルートメント現象を模擬するためのリクルートメント補正量を周波数バンド毎に算出するようになっている。なお、リクルートメント模擬部18は、図示しないメモリを備え、リクルートメント補正量を算出する際に用いるデータをこのメモリに記憶している。このデータは、所望の聴覚特性に応じて任意に変更できるようになっている。なお、リクルートメント模擬部18は、本発明に係るリクルートメント補正量算出手段及び聴覚特性模擬信号算出手段を構成する。
【0037】
ここで、リクルートメント補正量とは、加齢により聴力が低下すると、高い周波数において聞こえない物理的な音圧レベルが上昇する一方、聞こえる最大の音圧レベルが変わらないという高齢性リクルートメント現象を模擬するためのものであり、高齢者に知覚される音の大きさの減衰量を示すものをいう。高齢性リクルートメント現象についてさらに具体的には、小さな音から大きな音まで大きさを徐々に大きくしていくと、小さな音では聞こえないが、あるレベルの音から急に聞こえて、すぐに大きな音に感じられてしまう現象である。
【0038】
また、リクルートメント模擬部18は、周波数バンド毎のマスキング補正量と、周波数バンド毎のリクルートメント補正量とに基づいて、周波数バンド毎のNR信号及びBGM信号のエネルギレベルを補正し、高齢者の聴力劣化特性を模擬したNR信号及びBGM信号を出力するようになっている。
【0039】
周波数特性補正部19は、リクルートメント模擬部18が高齢性リクルートメント現象を模擬した、NR信号及びBGM信号のエネルギレベルのFFTパワースペクトル係数を周波数バンド毎に補正するようになっている。
【0040】
周波数時間変換部20及び21は、それぞれ、周波数特性補正部19が補正したNR信号及びBGM信号のFFTパワースペクトル係数を示す信号を時間領域の信号に変換するようになっている。
【0041】
DA変換部22及び23は、それぞれ、時間領域の信号に変換されたデジタル信号であるNR信号及びBGM信号をアナログ信号に変換して出力するようになっている。尤も、NR信号及びBGM信号をデジタル信号として出力する場合は、DA変換部22及び23は不要である。
【0042】
次に、本実施の形態における高齢者聴覚模擬装置100の動作について説明する。
【0043】
まず、AD変換部11及び12は、それぞれ、アナログ信号であるNR信号及びBGM信号を入力し、例えば、サンプリング周波数が32kHz、量子化精度が16ビットのデジタル信号にNR信号及びBGM信号を変換する。なお、本実施の形態におけるサンプリング周波数は、32kHzとして以下説明する。
【0044】
時間周波数変換部13及び14は、それぞれ、時間領域のNR信号及びBGM信号を周波数領域の信号に変換する。例えば、時間周波数変換部13及び14は、1024サンプル毎にFFT処理を実行し、16本ずつのFFT係数を1グループとして決定することにより、このFFT係数を500Hz毎の周波数バンドにおける周波数係数として扱うことができる。また、時間周波数変換部13及び14は、周波数係数の2乗をFFTパワースペクトル係数として出力する。
【0045】
ここで、k番目の周波数バンドにおけるNR信号及びBGM信号の周波数係数を、それぞれ、NR_FFT[k][i]及びBGM_FFT[k][i]で表し、k番目の周波数バンドにおけるNR信号及びBGM信号のFFTパワースペクトル係数を、それぞれ、NR_pow[k][i]及びBGM_pow[k][i]で表す。ただし、k=1、2、・・・、32であり、i=1、2、・・・、16である。時間周波数変換部13及び14は、それぞれ、[数1]及び[数2]に基づいてFFTパワースペクトル係数NR_pow[k][i]及びBGM_pow[k][i]を算出する。
【0046】
【数1】

【数2】

【0047】
なお、[数1]及び[数2]を用いる方法に代えて、周波数係数を電力換算することによってFFTパワースペクトル係数を算出してもよい。
【0048】
エネルギレベル算出部15及び16は、それぞれ、NR信号及びBGM信号の、500Hz毎の周波数バンドにおけるエネルギレベルを以下のように算出する。ここで、NR信号及びBGM信号の、500Hz毎の周波数バンドにおけるエネルギレベルを、それぞれ、N(k)及びB(k)(k=1、2、・・・、32)で表すと、N(k)及びB(k)は、それぞれ、[数3]及び[数4]で示され、FFTパワースペクトル係数の和を算出した後にdB(デシベル)変換したものとなっている。
【0049】
【数3】

【数4】

【0050】
マスキング補正量算出部17は、N(k)とB(k)との差に基づいてマスキング補正量D_m(k)を算出する。発明者の検討結果によれば、N(k)とB(k)との差と、予め定められた2つの閾値との関係により、マスキング補正量D_m(k)を所定値に設定するのが好ましいことがわかった。具体的には、図2に示すように、予め定められた2つの閾値をそれぞれR1(k)及びR2(k)で表し、これらにそれぞれ対応するマスキング補正量D_m(k)をL_YM(k)及びL_OM(k)で表すと、R1(k)=12dB、R2(k)=0dBとするのが好ましく、また、L_YM(k)=0dB、L_OM(k)=−9dBとするのが好ましい。この場合、マスキング補正量D_m(k)は[数5]で表される。
【0051】
【数5】

【0052】
なお、[数5]に示した数式は一例であって、マスキング補正量D_m(k)を算出するための各閾値の値に応じて変形することができる、また、図2においては、L_YM(k)とL_OM(k)とを直線で結んだ例を挙げて説明したが、本発明はこれに限定されるものではなく、この2点を単調な関数で結んだものであればよい。
【0053】
リクルートメント模擬部18は、以下に示すように、リクルートメント補正量を算出する。
【0054】
まず、リクルートメント模擬部18は、[数6]に基づいてN(k)とB(k)とをdB加算し、NR信号とBGM信号とのエネルギ和を示すNpB(k)を算出する。
【0055】
【数6】

【0056】
次に、リクルートメント模擬部18は、予め定められた互いに異なる年齢層の人間、例えば20歳代及び60歳代の人間がそれぞれ聞き取ることのできる最小の音圧と周波数との関係を示す最小可聴限特性からそれぞれ導出される値、具体的には、図3に示すような特性に基づいてリクルートメント補正量D_r(k)を算出する。
【0057】
ここで、図3は、NpB(k)に対する、リクルートメント現象により高齢者が知覚する音圧レベルの関係を示している。図3において、L_Th(k)は、リクルートメント現象が発生している領域からNpB(k)を増加させたとき、リクルートメント現象が起こらなくなる音圧レベル(以下「飽和レベル」という。)を示しており、例えば20歳代及び60歳代の人間が相互に等しく感じるラウドネスレベルである。また、図3において、Y_MAF(k)及びO_MAF(k)は、それぞれ、20歳代及び60歳代の最小可聴限から導出して定めた閾値であって、周波数バンド毎に最適値で設定するのが好ましい。例えば、発明者の検討結果によれば、500Hz〜1000Hz(周波数バンドk=2とする。)においては、Y_MAF(2)=0dB、O_MAF(2)=30dB、飽和レベルL_Th(2)=90dBとするのが好ましい。
【0058】
リクルートメント補正量D_r(k)は、例えば図4に示すような関数に基づいて算出される。図4に示すように、リクルートメント模擬部18は、NpB(k)が飽和レベルL_Th(k)以上のとき、予め定められた閾値L_0(k)(例えば0dB)をリクルートメント補正量D_r(k)として出力し、NpB(k)が飽和レベルL_Th(k)未満のとき、予め定められた閾値αに応じて定められた一次関数に従ってリクルートメント補正量D_r(k)を出力する。すなわち、リクルートメント補正量D_r(k)は、[数7]で示される。なお、閾値αは[数8]で示される。
【0059】
【数7】

【数8】

【0060】
さらに、リクルートメント模擬部18は、マスキング補正量算出部17が算出したマスキング補正量D_m(k)と、[数7]に基づいて算出したリクルートメント補正量D_r(k)とにより、[数9]及び[数10]に基づいてNR信号及びBGM信号のそれぞれの模擬信号を示すN'(k)及びB'(k)を算出して出力する。
【0061】
【数9】

【数10】

【0062】
したがって、リクルートメント模擬部18は、マスキング補正量D_m(k)及びリクルートメント補正量D_r(k)により、高齢者の聴力劣化特性をよく模擬したN'(k)及びB'(k)を出力することができる。
【0063】
なお、リクルートメント模擬部18が、例えば、模擬対象者の年齢における平均的な聴覚特性や、聴覚模擬対象者自身の聴覚特性の測定値に応じて、閾値O_MAF(k)及び飽和レベルL_TH(k)を周波数バンド毎に可変できる構成とするのが好ましく、この構成により、模擬対象者の聴覚特性に合わせてより正確に模擬することができる。
【0064】
周波数特性補正部19は、k番目の周波数バンドにおけるN'(k)及びB'(k)のエネルギの補正を[数11]及び[数12]に基づいて行う。ここで、N'(k)のFFTパワースペクトル係数をNR_pow'[k][i](i=1、2、・・・、16)、B'(k)のFFTパワースペクトル係数をBGM_pow'[k][i](i=1、2、・・・、16)で表す。
【0065】
【数11】

【数12】

【0066】
図5は、周波数特性補正部19による特性補正を概念的に示す図であって、図5(a)は、各周波数バンドにおいて一定量となるFFTパワースペクトル係数の補正量の大きさを示している。図5(a)に示した補正量は、NR信号ではD_m(k)+D_r(k)に相当し、BGM信号ではD_r(k)に相当する。
【0067】
また、図5(b)は、近似計算になるが、FFTパワースペクトル係数のエネルギ補正を移動平均により平滑化した一例を示している。この手法は、例えば、FFTパワースペクトル係数の補正量に関して、隣接する周波数バンドの境界にあるFFTパワースペクトル係数の補正量の差を小さくすることで、周波数時間変換部20及び21において周波数時間変換を行った際に、聴覚的に検知される歪みを小さくすることが期待される手法である。
【0068】
具体的には、例えば、FFTパワースペクトル5本毎に移動平均計算を行う場合は、隣接する周波数バンドの境界にある、4本のFFTパワースペクトル(図5(b)の矩形枠内)の補正量に関して移動平均計算を行えば十分である。
【0069】
すなわち、周波数特性補正部19は、NR信号に関し、k=2、3、・・・、32の周波数バンドにおいて、例えば、NR_pow'[k][1]を[数13]で求める。
【0070】
【数13】

【0071】
また、NR_pow'[k][2]を[数14]で求める。
【0072】
【数14】

【0073】
次に、k=1、2、・・・、31の周波数バンドにおいて、例えば、NR_pow'[k][15]を[数15]で求める。
【0074】
【数15】

【0075】
また、NR_pow'[k][16]を[数16]で求める。
【0076】
【数16】

【0077】
BGM信号に関しても同様に、k=2、3、・・・、32の周波数バンドにおいて、例えば、BGM_pow'[k][1]を[数17]で求める。
【0078】
【数17】

【0079】
また、BGM_pow'[k][2]を[数18]で求める。
【0080】
【数18】

【0081】
次に、k=1、2、・・・、31の周波数バンドにおいて、例えば、BGM_pow'[k][15]を[数19]で求める。
【0082】
【数19】

【0083】
また、BGM_pow'[k][16]を[数20]で求める。
【0084】
【数20】

【0085】
以上のように、周波数特性補正部19が各計算を行うことによって、各周波数バンド間の補正量を平滑化することができる。
【0086】
なお、前述の例では、5つのFFTパワースペクトル係数毎の移動平均処理を行ったが、平滑化する係数の本数は任意である。また、移動平均処理に代えて例えばスプライン補間による平滑化処理を行う構成としてもよい。また、FFTパワースペクトル係数の補正処理方法を例に挙げて説明したが、例えば周波数時間変換部20及び21において時間周波数変換を行うブロック単位での時変フィルタ処理による方法でも周波数特性の補正は実現できる。
【0087】
引き続き、動作説明を行う。周波数時間変換部20及び21は、それぞれ、NR信号及びBGM信号の周波数時間変換を行ってDA変換部22及び23に出力する。
【0088】
DA変換部22及び23は、それぞれ、デジタル信号のNR信号及びBGM信号をアナログ信号に変換して出力する。
【0089】
なお、動作説明において述べた各処理をプログラミングし、当該プログラムによってコンピュータを動作させることにより、当該プログラムは、コンピュータを高齢者聴覚模擬装置100として機能させることができる。この場合、コンピュータは、図1に示した構成を有することとなる。
【0090】
以上のように、本実施の形態における高齢者聴覚模擬装置100によれば、マスキング補正量算出部17は、周波数バンド毎のNR信号及びBGM信号のエネルギレベル差に基づいてNRに対するBGMによる妨害量をマスキング補正量として算出し、リクルートメント模擬部18は、NR信号のエネルギレベルとBGM信号のエネルギレベルとの和に基づいて高齢者のリクルートメント現象を模擬するためのリクルートメント補正量を周波数バンド毎に算出する構成としたので、高齢者の聴覚特性を正確に模擬することができる。
【0091】
また、本実施の形態における高齢者聴覚模擬装置100は、従来のものとは異なり、雑音信号成分を健聴者に与える構成を有するものではないので、健聴者に不快感を与えることなく、高齢者の聴覚特性を正確に模擬することができる。
【0092】
したがって、本実施の形態における高齢者聴覚模擬装置100は、NR信号とBGM信号とをミキシングするミキシング装置に、高齢者の聴覚特性を正確に模擬したNR信号及びBGM信号を提供することができるので、高齢者にとって適正な音響効果が得られる番組制作を支援することができる。
【0093】
なお、本発明の実施の形態を、高齢者の聴覚特性を模擬する高齢者聴覚模擬装置100を例に挙げて説明したが、本発明はこれに限定されるものではなく、高齢者以外の感音性難聴者の聴覚特性を模擬する装置に適用しても、同様の効果が得られる。
【0094】
また、前述の実施の形態において、高齢者聴覚模擬装置100が、NR信号及びBGM信号を対象とした例を挙げて説明したが、本発明はこれに限定されるものではなく、例えば、台詞の音声信号及び効果音の信号を対象とするものに適用しても同様な効果が得られる。
【0095】
(第2の実施の形態)
図6は、本発明の第2の実施の形態における高齢者聴覚模擬装置を示すブロック図である。
【0096】
図6に示すように、本実施の形態における高齢者聴覚模擬装置200は、第1の実施の形態における高齢者聴覚模擬装置100(図1参照)と、混合器201とを備えている。
【0097】
混合器201は、高齢者聴覚模擬装置100のDA変換部22及び23から、それぞれ、高齢者の聴覚を模擬したNR信号とBGM信号とを入力し、それらを混合して高齢者模擬混合音信号を出力するようになっている。なお、混合器201は、本発明に係る模擬信号混合手段を構成する。
【0098】
本実施の形態における高齢者聴覚模擬装置200は、前述のように構成されているので、高齢者模擬混合音信号を再生することによって、その再生音の聴取者に高齢者の聴覚特性を把握させることができる。例えば、高齢者聴覚模擬装置200は、20〜30歳代の若い音声ミキサに高齢者模擬混合音信号を再生して聴取させることにより、BGMが大き過ぎてNRが聴き取り難いといった現象を体験させることができるので、高齢者にとって適正な音響効果の必要性を若い音声ミキサに認識させることができる。
【0099】
また、高齢者聴覚模擬装置200が出力する高齢者模擬混合音信号を若年者に聴取させることによって、若い音声ミキサのみならず、高齢者に対する若年者の理解を促進することができ、よりバリアフリーな社会を実現するためのきっかけとすることができる。
【0100】
(第3の実施の形態)
図7は、本発明の第3の実施の形態におけるミキシングバランス表示システムを示すブロック図である。ここで、本実施の形態におけるミキシングバランス表示システムは、テレビやラジオ等の番組制作時にNR信号とBGM信号とのミキシングバランスを監視し、例えばBGM信号のレベルが大き過ぎてNRが聞きにくい場合には「BGM信号のレベルが大き過ぎる」、逆に、BGM信号のレベルが小さ過ぎて音響効果が得られない場合には「BGM信号のレベルが小さ過ぎる」というような注意又は警告を音声ミキサに対して行うものである。
【0101】
まず、本実施の形態におけるミキシングバランス表示システム300の構成について説明する。
【0102】
図7に示すように、本実施の形態におけるミキシングバランス表示システム300は、第1の実施の形態における高齢者聴覚模擬装置100(図1参照)と、ミキシングバランス表示装置310とを備えている。なお、高齢者聴覚模擬装置100の構成の説明は省略する。また、高齢者聴覚模擬装置100が出力する高齢者の聴覚特性を模擬したNR信号及びBGM信号を、それぞれ、以下「模擬NR信号」及び「模擬BGM信号」という。
【0103】
ミキシングバランス表示装置310は、アナログ信号である模擬NR信号をデジタル信号に変換するAD変換部311と、アナログ信号である模擬BGM信号をデジタル信号に変換するAD変換部312と、模擬NR信号のレベルを検出するNRレベル検出部313と、模擬BGM信号のレベルを検出するBGMレベル検出部314と、模擬NR信号と模擬BGM信号とのレベル差を算出するレベル差算出部315と、レベル差に対して所定の重み付けを行って重み付きレベル差を算出する重み付きレベル差算出部316と、重み付きレベル差の値の平均値を算出する平均レベル差算出部317と、模擬NR信号のレベルの平均値を算出するNR平均値算出部318と、ミキシングバランスの状態を示す表示値を決定する表示値決定部319と、表示値決定部319の出力を制御するための表示制御信号を生成する表示制御信号生成部320と、例えばVU(Volume Unit)メータのようなレベルメータを有し、ミキシングバランスの状態を表示する表示部321とを備えている。
【0104】
AD変換部311及び12は、それぞれ、模擬NR信号及び模擬BGM信号を入力し、アナログ値からデジタル値に変換するようになっている。例えば、AD変換部311及び12は、それぞれ、サンプリング周波数が48kHz、量子化精度が16ビットのデジタル信号にアナログ信号を変換するようになっている。尤も、入力される模擬NR信号及び模擬BGM信号がデジタル信号である場合は、AD変換部311及び312は不要である。なお、本実施の形態におけるサンプリング周波数を48kHzとして以下説明する。
【0105】
NRレベル検出部313は、模擬NR信号のラウドネスレベル(phon)を一定の短時間ΔT毎に検出するようになっている。ここで、一定の短時間ΔTは、サンプリング周波数48kHzで例えば1024サンプルを取得する場合は、約21.3ms(=1024/48000s)となる。なお、NRレベル検出部313は、サンプリング周波数48kHzで1024サンプルを取得するものとし、以下の説明において、1024サンプルの取得単位をフレームという。
【0106】
BGMレベル検出部314は、NRレベル検出部313と同様に、模擬BGM信号のラウドネスレベルをフレーム毎に検出するようになっている。
【0107】
なお、NRレベル検出部313及びBGMレベル検出部314は、本発明に係るレベル検出手段を構成する。また、NRレベル検出部313及びBGMレベル検出部314が各信号のラウドネスレベルを検出する方法としては、例えばISO532に規格化されたものがある。また、ラウドネスレベルに代えて各信号の平均エネルギレベル(dB)を算出する構成としてもよく、この場合は、例えばサンプル値の2乗平均値を算出し、dB変換すればよい。
【0108】
以下の説明においては、適正なレベルでミキシングされた模擬NR信号のラウドネスレベル(phon)を0で正規化した相対レベルを用いて表すことにする。また、模擬BGM信号のレベルも模擬NR信号と同一のレベルで正規化した相対レベルを用いて表すことにする。一例を挙げれば、適正なレベルでミキシングされた模擬NR信号のラウドネスレベルが70(phon)の場合では、模擬NR信号又は模擬BGM信号のラウドネスレベルが、70(phon)のときは当該信号の相対レベルは0であり、75(phon)のときは当該信号の相対レベルは+5である。
【0109】
また、正規化後の相対レベルが例えば−50程度以下の場合は、模擬NR信号及び模擬BGM信号のラウドネスレベルは聴感的に非常に小さいものであるので、−50以下の値を全て−50で置き換えても実用上は十分である。なお、0で正規化しないで後述する処理を行うこともできるが、その場合には各閾値の値が相対的に変わってくる。以下、正規化された模擬NR信号の相対レベルを「N」、正規化された模擬BGM信号の相対レベルを「B」と表す。
【0110】
レベル差算出部315は、NRレベル検出部313及びBGMレベル検出部314から、それぞれ、模擬NR信号の相対レベルN及び模擬BGM信号の相対レベルBの情報をフレーム毎に入力し、両者の相対レベルの差(以下「相対レベル差」という。)B−Nを算出するようになっている。なお、レベル差算出部315は、本発明に係るレベル差算出手段を構成する。
【0111】
重み付きレベル差算出部316は、レベル差算出部315が算出した相対レベル差B−Nに対し、模擬NR信号の相対レベルNの大きさに応じた重み付けを行って重み付きレベル差を算出するようになっている。なお、重み付きレベル差算出部316は、図示しないメモリを備えており、このメモリは、算出された重み付きレベル差の各値を逐次記憶するようになっている。
【0112】
具体的には、重み付きレベル差算出部316は、例えば図8に示すようなレベル重み付け関数によって相対レベル差B−Nに対する重み付けを行う。図8において、重み付きレベル差算出部316は、N<−30のときは相対レベルが−50の信号を出力し、N>−15のときは相対レベルがB−Nである信号を出力し、−30≦N≦−15のときは相対レベルがN(B−N+50)/15+2(B−N)+50である信号を出力するようになっている。
【0113】
なお、図8においては、座標(−30,−50)と(−15,B−N)との2点を直線で結んだ例で説明したが、本発明はこれに限定されるものではなく、この2点を単調な関数で結んだものであれば実用上は十分である。また、重み付きレベル差算出部316は、本発明に係る重み付きレベル差算出手段を構成する。また、図8において、N=−30及びN=−15は、特許請求の範囲に記載の第1の閾値T及び第2の閾値Tにそれぞれ対応するものである。
【0114】
次に、レベル差算出部315及び重み付きレベル差算出部316が出力する信号について図9の模式図を用いて説明する。レベル差算出部315に入力される模擬NR信号及び模擬BGM信号の各相対レベルが図9(a)に示すような関係にある場合、レベル差算出部315は、まず、図9(b)に示すような相対レベル差B−Nを算出する。次に、重み付きレベル差算出部316は、算出した相対レベル差B−Nの値に、図8に例示した重み付け関数で重み付けすることにより、図9(b)に示すような重み付き相対レベル差B−Nを算出する。
【0115】
図9(b)に示すように、相対レベル差B−Nは、模擬BGM信号の相対レベルBが大きいほど、又は模擬NR信号の相対レベルNが小さいほど大きくなる。模擬NR信号の相対レベルNが小さい場合、すなわち、模擬NR信号がほとんど存在しない場合には、「模擬BGM信号が大き過ぎる」という表示を行う必要はないので、図8に例示したような重み関数で重み付けして、図9(c)に示すように、模擬NR信号の相対レベルNが小さい場合には重み付き相対レベル差B−Nの値を小さくしている。すなわち、重み付けを行う前の相対レベル差B−Nの値(図9(b))の大小では「模擬BGM信号が大き過ぎる」か否かの判断を行うことはできないが、重み付き相対レベル差B−Nの値(図9(c))の大小を用いれば「模擬BGM信号が大き過ぎる」か否かの判断を行うことができることになる。
【0116】
平均レベル差算出部317は、現フレームから過去のn個のフレームまでの間において、重み付きレベル差B−Nの値の大きいものから順にm個の値の平均値(以下「パーセント時間率平均レベル差」という。)を算出するようになっている。ここで、n及びmは正の整数であり、n≧mの関係がある。なお、平均レベル差算出部317は、本発明に係る平均レベル差算出手段を構成する。
【0117】
nを大きくするほど、長時間の無音区間を除くことができるので、表示部321が有するレベルメータの指示値の変化を緩やかにすることができるが、nが大き過ぎると無音区間が長時間続いても0でない指示値を長時間指示するので、適当な長さに設定する必要がある。また、mを大きくするほど、レベルメータの指示値の変化を緩やかにすることができるが、指示値の立ち上がり時間が遅くなるので、mをある程度小さくして、指示値の立ち上がり時間を短くする必要がある。実用上は、例えばn=100、m=4として、4%に相当するパーセント時間率平均レベル差を求める構成とするのが好ましい。
【0118】
n及びmを適切に設定して算出したパーセント時間率平均レベル差を用いることにより、模擬NR信号と模擬BGM信号とのラウドネスの差に関し、高齢者の聴感とよく合った判断ができるようになる。なお、パーセント時間率平均レベル差に関しては、特許3462390号公報に詳述されている。
【0119】
なお、発明者の検討結果によれば、ステレオ信号の場合には音素材の種類に関わらず、模擬NR信号と模擬BGM信号とのミキシングバランスが適正であれば、平均レベル差算出部317の出力信号の相対レベルは概ね0となる。
【0120】
次に、模擬NR信号が存在するフレームのみにおいて、パーセント時間率平均レベル差が大きいほど「模擬BGM信号が大き過ぎる」、逆に、小さいほど「模擬BGM信号が小さ過ぎる(BGMの効果がない)」という表示を行おうとする場合、模擬NR信号が存在しないフレームでは「模擬BGM信号が大き過ぎる」あるいは、「模擬BGM信号が小さ過ぎる」と表示されるよりも「模擬BGM信号のレベルが適正である」と表示される方が聴感的に好ましい。そこで、本実施の形態におけるNR平均値算出部318及び表示値決定部319は以下のように構成されている。
【0121】
すなわち、NR平均値算出部318は、現フレームから過去の所定数(例えば数個〜数十個)のフレームまでの間における模擬NR信号のレベル平均値NAを算出するようになっている。なお、NR平均値算出部318は、本発明に係る第1聴覚特性模擬信号平均値算出手段を構成する。
【0122】
また、表示値決定部319は、模擬NR信号のレベル平均値NAを予め定められた閾値Lと比較してミキシングバランスの状態を示す表示値を決定するようになっている。具体的には、表示値決定部319は、模擬NR信号のレベル平均値NAが、NA≧Lのときは平均レベル差算出部317の出力値を表示値とし、NA<Lのときは平均レベル差算出部317の出力値をミキシングバランスが適正な場合の値に変換して表示値とするようになっている。なお、表示値決定部319は、本発明に係る表示値決定手段を構成する。
【0123】
ここで、模擬NR信号の相対レベルNではなく平均値NAを用いることにより、パーセント時間率平均レベル差の立ち上がり部及び立ち下がり部における不適切な判定を防ぐことができる。なお、不適切な判定をより確実に防ぐためには、NR平均値算出部318が平均する個数を平均レベル差算出部317における個数mより大きくした方がよい。なお、ミキシングバランスが適正な場合のパーセント時間率平均レベル差の値は心理実験を行って測定する必要があるが、ステレオ信号の場合には、当該値の相対レベルとしては概ね0程度である。
【0124】
実用的には、NR平均値算出部318は、平均値NAを算出するためのフレーム個数を例えば14個(21.3ms×14=298ms)として模擬NR信号の相対レベルの平均値を算出するものであればよい。その結果、平均値NAの値は、VUメータの立ち上がり時間(約300ms)とほぼ等しい立ち上がり時間で変動することとなる。また、閾値Lとしては相対レベルで−15程度の値にすればよい。この場合、表示値決定部319は、平均値NAが約−15以上の場合には平均レベル差算出部317の出力値をそのまま出力し、平均値NAが約−15未満の場合には平均レベル差算出部317の出力値をミキシングバランスが適正な場合の値(例えば相対レベル=0)に変換することとなる。したがって、平均値NAが約−15未満の場合、すなわち、模擬NR信号が存在しないとみなせるフレームでは、「模擬BGM信号のレベルは適正である」と表示され、高齢者の聴感と対応がとれた表示が得られることとなる。
【0125】
ここで、表示値決定部319が決定した出力値を表示部321で常時表示したのでは、模擬NR信号が長時間(例えば5s)に渡り存在しない場合においても、表示部321は「模擬BGM信号のレベルは適正である」と表示することになる。そこで、模擬NR信号が長時間に渡って存在しない場合には表示そのものを消した方が聴感的によく合うので、本実施の形態における表示制御信号生成部320は、以下のように構成されている。
【0126】
すなわち、表示制御信号生成部320は、模擬NR信号の相対レベルNと予め定められた閾値Lとをフレーム毎に比較し、模擬NR信号の相対レベルNが、N≧Lとなったフレームのうち現フレームに最も近いフレームから所定個数分のフレームにおける表示値決定部319からの出力信号を表示部321に入力させるよう制御するとともに、所定個数を超えたときは表示値決定部319からの出力信号を遮断して表示を行わないよう制御する表示制御信号を生成するようになっている。なお、表示制御信号生成部320は、本発明に係る表示制御信号生成手段を構成する。
【0127】
実用的には、閾値Lとしては相対レベルで−15程度であればよい。また、模擬NR信号の相対レベルが瞬間的に低下した場合、例えば数100ms程度低下した場合の影響を除くためには、前述の所定個数としては50〜100個程度が適当である。なお、所定個数を100個とした場合の時間は、21.3ms×100=2.13sである。
【0128】
表示部321は、例えばレベルメータを備え、表示制御信号生成部320が生成した表示制御信号に基づいて、表示値決定部319の出力値を表示するようになっている。この表示部321は、本発明に係るミキシングバランス表示手段を構成する。
【0129】
なお、表示部321は、表示値決定部319の出力値を例えば数〜十数段階に分類して表示するものであってもよい。具体的には、模擬BGM信号のレベルを例えば7段階に分類して表示部321に表示させる場合は、表示値決定部319の出力の値を大きい方から順に7段階に分類し、模擬BGM信号のレベルが「非常に大き過ぎる」、「大き過ぎる」、「やや大きい」、「適正」、「やや小さい」、「小さ過ぎる」、「非常に小さ過ぎる」等と表示させればよい。模擬BGM信号のレベルを前述のように7段階に分類するための6つの境界値は心理実験を行って求める必要があるが、6つの境界値の相対レベルとしては、概ね、6、4、2、−3、−6、−9程度が好ましい。この構成により、ミキシングバランスの状態を高齢者の聴感に対応させて視認性よく表示することができる。
【0130】
次に、本実施の形態におけるミキシングバランス表示装置310の動作について説明する。
【0131】
まず、AD変換部311は、模擬NR信号を入力してデジタル信号に変換し、AD変換部312は、模擬BGM信号を入力してデジタル信号に変換する。
【0132】
NRレベル検出部313は、模擬NR信号のレベルをフレーム毎に検出し、BGMレベル検出部314は、模擬BGM信号のレベルをフレーム毎に検出する。
【0133】
レベル差算出部315は、模擬NR信号と模擬BGM信号とのレベル差を算出した後、重み付きレベル差算出部316は、レベル差算出部315が算出したレベル差に対して、例えば図8に示す重み付け関数に基づいて重み付けを行うことにより重み付きレベル差を算出する。
【0134】
平均レベル差算出部317は、パーセント時間率平均レベル差の算出、すなわち、現フレームから過去のn個のフレームまでの間において、重み付きレベル差B−Nの値の大きいものから順にm個の値の平均値を算出する。
【0135】
NR平均値算出部318は、現フレームから過去の所定数(例えば数個〜数十個)のフレームまでの間における模擬NR信号のレベル平均値NAを算出する。
【0136】
表示値決定部319は、模擬NR信号のレベル平均値NAが、NA≧Lのときは平均レベル差算出部317の出力値を表示値とし、NA<Lのときは平均レベル差算出部317の出力値を、ミキシングバランスが適正な場合の値に変換して表示値とされる。
【0137】
表示制御信号生成部320は、模擬NR信号の相対レベルNと予め定められた閾値Lとをフレーム毎に比較し、表示値決定部319の出力を制御するための表示制御信号を生成する。具体的には、表示制御信号生成部320は、模擬NR信号の相対レベルNが、N≧Lとなったフレームのうち現フレームに最も近いフレームから所定個数分のフレームにおける表示値決定部319からの出力信号を表示部321に入力させるよう制御するとともに、所定個数を超えたときは表示値決定部319からの出力信号を遮断して表示を行わないよう制御する表示制御信号を生成する。
【0138】
そして、表示部321は、表示制御信号生成部320が生成した表示制御信号に基づいて、模擬NR信号と模擬BGM信号とのミキシングバランスの状態を表示する。
【0139】
なお、動作説明において述べた各処理をプログラミングし、当該プログラムによってコンピュータを動作させることにより、当該プログラムは、コンピュータをミキシングバランス表示システム300として機能させることができる。この場合、コンピュータは、図7に示した構成を有することとなる。
【0140】
以上のように、本実施の形態におけるミキシングバランス表示システム300によれば、ミキシングバランス表示装置310において、重み付きレベル差算出部316は、模擬NR信号と模擬BGM信号とのレベル差に対して所定の重み付けを行って重み付きレベル差を算出し、平均レベル差算出部317は、パーセント時間率平均レベル差を算出し、NR平均値算出部318は、現フレームから過去の所定数のフレームまでの間における模擬NR信号のレベル平均値NAを算出し、表示値決定部319は、模擬NR信号のレベル平均値NAを閾値Lと比較してミキシングバランスの状態を示す表示値を決定し、表示制御信号生成部320は、表示値決定部319の出力を制御するための表示制御信号を生成し、表示部321は、表示制御信号に基づいてミキシングバランスの状態を表示する構成としたので、ミキシングバランスの状態を高齢者の聴感に対応させて表示することができる。
【0141】
したがって、本実施の形態におけるミキシングバランス表示システム300は、例えば模擬BGM信号のレベルが模擬NR信号のレベルよりも大き過ぎる場合は模擬BGM信号のレベルを下げるよう音声ミキサに促すことができ、模擬BGM信号のレベルが大き過ぎてNRが聴き取りにくいといった現象を未然に防ぐことができるので、番組の音響効果の向上を支援することができる。また、本実施の形態におけるミキシングバランス表示装置310は、例えば模擬BGM信号のレベルが模擬NR信号のレベルよりも小さ過ぎて音響効果が得られない場合は模擬BGM信号のレベルを上げるよう音声ミキサに促すことができるので、番組の音響効果の向上を支援することができる。
【0142】
なお、前述の実施の形態において、ミキシングバランス表示システム300が、NR信号及びBGM信号を対象とした例を挙げて説明したが、本発明はこれに限定されるものではなく、例えば、台詞の音声信号と効果音の信号とのミキシングを対象とするものに適用しても同様な効果が得られる。
【0143】
また、高齢者聴覚模擬装置100(図1参照)のリクルートメント模擬部18が、例えば、高齢者の模擬音を聴く人物や音声ミキサの年齢における平均的な最小可聴限界値や、模擬音を聴く人物自身の最小可聴下限値の測定値や音声ミキサ自身の最小可聴下限値の測定値に応じて、閾値Y_MAFを周波数バンド毎に可変可能な構成とするのが好ましく、この構成により、模擬対象者の聴覚特性をより正確に模擬することができる。
【0144】
次に、本実施の形態の他の態様について説明する。図10に示すように、ミキシングバランス表示システム400は、高齢者聴覚模擬装置410と、ミキシングバランス表示装置420とを備えている。
【0145】
高齢者聴覚模擬装置410は、第1の実施の形態における高齢者聴覚模擬装置100(図1参照)の構成に対し、周波数特性補正部19と、周波数時間変換部20及び21と、DA変換部22及び23とを省略したものである。
【0146】
ミキシングバランス表示装置420は、本実施の形態におけるミキシングバランス表示装置310(図7参照)の構成に対し、AD変換部311及び312を省略したものである。なお、図10において、ミキシングバランス表示装置420の構成の一部を省略して図示している。
【0147】
高齢者聴覚模擬装置410において、エネルギレベル算出部15及び16は、それぞれ、例えば1/3オクターブの周波数バンド毎にNR信号及びBGM信号のエネルギレベルを算出し、マスキング補正量算出部17及びリクルートメント模擬部18では、高齢者の聴力劣化特性を模擬したN'(k)及びB'(k)を出力する。
【0148】
次に、ミキシングバランス表示装置420において、N'(k)及びB'(k)を入力し、これらに基づいて例えばISO532に準拠したラウドネスレベルを算出する。
【0149】
この結果、ミキシングバランス表示システム400は、ミキシングバランスの状態を高齢者の聴感に対応させて表示することができる。
【産業上の利用可能性】
【0150】
以上のように、本発明に係る聴覚特性模擬装置、ミキシングバランス表示システム及びそれらのプログラムは、健聴者に不快感を与えることなく、感音性難聴者の聴覚特性を正確に模擬することができるという効果を有し、高齢者のような感音性難聴者を対象としたテレビ番組やラジオ番組等の制作に用いる聴覚特性模擬装置、ミキシングバランス表示システム及びそれらのプログラム等として有用である。
【図面の簡単な説明】
【0151】
【図1】本発明の第1の実施の形態における高齢者聴覚模擬装置の構成を示すブロック図
【図2】本発明の第1の実施の形態における高齢者聴覚模擬装置において、マスキング補正量の設定例の説明図
【図3】本発明の第1の実施の形態における高齢者聴覚模擬装置において、NpB(k)と、リクルートメント現象により高齢者が知覚する音圧レベルとの関係を示す図
【図4】本発明の第1の実施の形態における高齢者聴覚模擬装置において、リクルートメント補正量の設定例の説明図
【図5】本発明の第1の実施の形態における高齢者聴覚模擬装置において、周波数特性補正部による特性補正を概念的に示す図 (a)各周波数バンドにおいて一定量となるFFTパワースペクトル係数の補正量の大きさを示す概念図 (b)各周波数バンドにおいてFFTパワースペクトル係数のエネルギ補正を移動平均により平滑化した例を示す概念図
【図6】本発明の第2の実施の形態における高齢者聴覚模擬装置の構成を示すブロック図
【図7】本発明の第3の実施の形態におけるミキシングバランス表示システムの構成を示すブロック図
【図8】本発明の第3の実施の形態におけるミキシングバランス表示システムにおいて、レベル重み付け関数の一例を示す図
【図9】本発明の第3の実施の形態におけるミキシングバランス表示システムにおいて、NR信号及びBGM信号の相対レベル差を説明するための模式図 (a)入力されるNR信号及びBGM信号の相対レベルの一例を示す図 (b)相対レベル差B−Nの一例を示す図 (c)重み付き相対レベル差B−Nの一例を示す図
【図10】本発明の第3の実施の形態におけるミキシングバランス表示システムの他の態様の構成を示すブロック図
【符号の説明】
【0152】
11、12、311、312 AD変換部
13、14 時間周波数変換部
15、16 エネルギレベル算出部(エネルギレベル算出手段)
17 マスキング補正量算出部(マスキング補正量算出手段)
18 リクルートメント模擬部(リクルートメント補正量算出手段、聴覚特性模擬信号算出手段)
19 周波数特性補正部
20、21 周波数時間変換部
22、23 DA変換部
100、200、410 高齢者聴覚模擬装置(聴覚特性模擬装置)
201 混合器(模擬信号混合手段)
300、400 ミキシングバランス表示システム
310、420 ミキシングバランス表示装置
313 NRレベル検出部(レベル検出手段)
314 BGMレベル検出部(レベル検出手段)
315 レベル差算出部(レベル差算出手段)
316 重み付きレベル差算出部(重み付きレベル差算出手段)
317 平均レベル差算出部(平均レベル差算出手段)
318 NR平均値算出部(第1聴覚特性模擬信号平均値算出手段)
319 表示値決定部(表示値決定手段)
320 表示制御信号生成部(表示制御信号生成手段)
321 表示部(ミキシングバランス表示手段)

【特許請求の範囲】
【請求項1】
第1及び第2の音信号のエネルギレベルを周波数バンド毎に算出するエネルギレベル算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの差に基づいて感音性難聴者の聴覚マスキング特性を模擬するためのマスキング補正量を前記周波数バンド毎に算出するマスキング補正量算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの和に基づいて前記感音性難聴者のリクルートメント現象を模擬するためのリクルートメント補正量を前記周波数バンド毎に算出するリクルートメント補正量算出手段と、前記マスキング補正量及び前記リクルートメント補正量に基づいて前記第1及び前記第2の音信号にそれぞれ対応する前記感音性難聴者の聴覚特性を模擬した第1及び第2の聴覚特性模擬信号を算出する聴覚特性模擬信号算出手段とを備えたことを特徴とする聴覚特性模擬装置。
【請求項2】
前記マスキング補正量算出手段は、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの差が、予め定められた第1の閾値以上のとき予め定められた第1のマスキング補正量を示す信号を出力し、予め定められた第2の閾値以下のとき予め定められた第2のマスキング補正量を示す信号を出力し、前記第1の閾値と前記第2の閾値との間にあるとき前記第1のマスキング補正量と前記第2のマスキング補正量とを単調に結ぶ関数で得られる値を示す信号を出力するものであり、前記第1の閾値は、前記第2の閾値よりも大きく、前記第1のマスキング補正量は、前記第2のマスキング補正量よりも大きいことを特徴とする請求項1に記載の聴覚特性模擬装置。
【請求項3】
前記リクルートメント補正量算出手段は、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの和を示すエネルギレベル加算値が、予め定められた第1及び第2の年齢層の人間が相互にラウドネスを等しく感じる最小の音圧レベルを示す最小音圧レベル閾値以上のとき予め定められたリクルートメント補正量を示す信号を出力し、前記最小音圧レベル閾値よりも小さいとき予め定められた関数で得られるリクルートメント補正量を示す信号を出力するものであり、
前記関数は、前記第1及び前記第2の年齢層の人間がそれぞれ聞き取ることのできる最小の音圧と周波数との関係を示す最小可聴限特性からそれぞれ導出される第1及び第2の最小可聴限値と、前記エネルギレベル加算値と、前記最小音圧レベル閾値とに基づいて決められたものであり、
前記第1の最小可聴限値は、前記第2の最小可聴限値よりも小さいことを特徴とする請求項1又は請求項2に記載の聴覚特性模擬装置。
【請求項4】
前記リクルートメント補正量算出手段は、前記第1の最小可聴限値、前記第2の最小可聴限値及び前記最小音圧レベル閾値のそれぞれを可変可能であることを特徴とする請求項3に記載の聴覚特性模擬装置。
【請求項5】
前記聴覚特性模擬信号算出手段は、前記第1の音信号のエネルギレベルと、前記マスキング補正量と、前記リクルートメント補正量とに基づいて前記第1の聴覚特性模擬信号を算出し、前記第2の音信号のエネルギレベルと、前記リクルートメント補正量とに基づいて前記第2の聴覚特性模擬信号を算出することを特徴とする請求項1から請求項4までのいずれか1項に記載の聴覚特性模擬装置。
【請求項6】
前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とを混合する模擬信号混合手段を備えたことを特徴とする請求項1から請求項5までのいずれか1項に記載の聴覚特性模擬装置。
【請求項7】
請求項1から請求項6までのいずれか1項に記載の聴覚特性模擬装置と、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を表示するミキシングバランス表示装置とを備え、
前記ミキシングバランス表示装置は、前記第1及び前記第2の聴覚特性模擬信号のレベルを所定時間間隔のフレーム毎に検出するレベル検出手段と、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのレベル差を算出するレベル差算出手段と、前記レベル差に対して前記第1の聴覚特性模擬信号のレベルに応じた重み付けを行って重み付きレベル差を算出する重み付きレベル差算出手段と、現フレームから過去のn個のフレームまでの間において前記重み付きレベル差の値の大きいものから順にm個の値の平均値を算出する平均レベル差算出手段と、現フレームから過去の所定数のフレームまでの間における前記第1の聴覚特性模擬信号のレベル平均値を算出する第1聴覚特性模擬信号平均値算出手段と、前記平均レベル差算出手段及び前記第1聴覚特性模擬信号平均値算出手段の算出結果に基づいて前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を示す表示値を決定する表示値決定手段と、前記第1の聴覚特性模擬信号のレベルに基づいて前記表示値決定手段の出力を制御する表示制御信号を生成する表示制御信号生成手段と、前記表示制御信号に基づいて前記ミキシングバランスの状態を表示するミキシングバランス表示手段とを備えたことを特徴とするミキシングバランス表示システム。
【請求項8】
感音性難聴者の聴覚特性を模擬する聴覚特性模擬装置としてコンピュータを機能させるための聴覚特性模擬プログラムであって、
前記コンピュータを、第1及び第2の音信号のエネルギレベルを周波数バンド毎に算出するエネルギレベル算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの差に基づいて前記感音性難聴者の聴覚マスキング特性を模擬するためのマスキング補正量を前記周波数バンド毎に算出するマスキング補正量算出手段と、前記第1の音信号のエネルギレベルと前記第2の音信号のエネルギレベルとの和に基づいて前記感音性難聴者のリクルートメント現象を模擬するためのリクルートメント補正量を前記周波数バンド毎に算出するリクルートメント補正量算出手段と、前記マスキング補正量及び前記リクルートメント補正量に基づいて前記第1及び前記第2の音信号にそれぞれ対応する前記感音性難聴者の聴覚特性を模擬した第1及び第2の聴覚特性模擬信号を算出する聴覚特性模擬信号算出手段として機能させることを特徴とする聴覚特性模擬プログラム。
【請求項9】
前記コンピュータを、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とを混合する模擬信号混合手段として機能させることを特徴とする請求項8に記載の聴覚特性模擬プログラム。
【請求項10】
請求項8に記載の前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を表示するミキシングバランス表示装置としてコンピュータを機能させるためのミキシングバランス表示プログラムであって、
前記コンピュータを、前記第1及び前記第2の聴覚特性模擬信号のレベルを所定時間間隔のフレーム毎に検出するレベル検出手段と、前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのレベル差を算出するレベル差算出手段と、前記レベル差に対して前記第1の聴覚特性模擬信号のレベルに応じた重み付けを行って重み付きレベル差を算出する重み付きレベル差算出手段と、現フレームから過去のn個のフレームまでの間において前記重み付きレベル差の値の大きいものから順にm個の値の平均値を算出する平均レベル差算出手段と、現フレームから過去の所定数のフレームまでの間における前記第1の聴覚特性模擬信号のレベル平均値を算出する第1聴覚特性模擬信号平均値算出手段と、前記平均レベル差算出手段及び前記第1聴覚特性模擬信号平均値算出手段の算出結果に基づいて前記第1の聴覚特性模擬信号と前記第2の聴覚特性模擬信号とのミキシングバランスの状態を示す表示値を決定する表示値決定手段と、前記第1の聴覚特性模擬信号のレベルに基づいて前記表示値決定手段の出力を制御する表示制御信号を生成する表示制御信号生成手段と、前記表示制御信号に基づいて前記ミキシングバランスの状態を表示するミキシングバランス表示手段として機能させることを特徴とするミキシングバランス表示プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2009−159083(P2009−159083A)
【公開日】平成21年7月16日(2009.7.16)
【国際特許分類】
【出願番号】特願2007−332686(P2007−332686)
【出願日】平成19年12月25日(2007.12.25)
【出願人】(000004352)日本放送協会 (2,206)
【出願人】(000114765)ヤマキ電気株式会社 (4)
【Fターム(参考)】