説明

自動音量制御装置

【課題】運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うこと。
【解決手段】自動音量制御装置1は、マイクM1、M2で集音された音声信号に音声帯域成分の帯域制限処理と適応アルゴリズムとを適用して音響信号を抽出する音声信号抽出手段2、3と、音楽信号における音量の変動感を低減させる音量補正手段4と、音響信号における音声検出部分の重み付けを行った音声分析ゲインを求める音声分析手段6と、音響信号に対して音声分析ゲインを適用させることにより音声検出部分を顕在化させて音声検出信号を求める音声検出手段7と、音声検出信号に基づいて音楽信号の出力レベルを音声信号の検出時に低減させる音量制御手段8とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は自動音量制御装置に関し、より詳細には、音楽が流されている空間において会話が行われた場合に、発話に応じて音楽の出力レベルを低減させることにより円滑な会話を実現することが可能な自動音量制御装置に関する。
【背景技術】
【0002】
走行中の車両の室内では、運転(走行)に音楽やラジオ番組等を流すことが多い。このような状況において、運転手と同乗者とが会話を行う場合には、音楽等の再生音によって、円滑な会話(会話の聞き取り等)が妨げられてしまうおそれがあった。
【0003】
一般的な車載用オーディオ装置には、音量を調節するための音量調節スイッチや、音量を一時的に低減させるためのミュートスイッチなどが設けられている(例えば、特許文献1および特許文献2参照)。このため、運転者等は、音量調節スイッチやミュートスイッチを操作することにより、会話を妨げない程度まで音楽等の再生音量を低減させることが多かった。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008−62906号公報
【特許文献2】特開2006−67490号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、会話を行う度に音量調節スイッチを操作して再生音を低減する方法では、操作が煩雑になり、かえって円滑な会話を妨げてしまうおそれがあるという問題があった。一方で、ミュートスイッチを用いて音楽の再生音を低減させる方法では、会話が途切れた状態においてもそのまま音楽の再生音が低減された状態となってしまい、音楽やラジオ番組等を楽しむことができないという問題があった。
【0006】
このため、音量調節スイッチやミュートスイッチを操作することなく、発話者が会話の成立するような大きな声を発することにより、音楽等を再生させた状態で会話を行うこともしばしば行われるが、会話が続く場合には、発話者はもちろんのこと会話の相手側においても会話に疲労を感じてしまうおそれがあるという問題があった。
【0007】
本発明は、上記問題に鑑みてなされたものであり、運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うことが可能な自動音量制御装置を提供することを課題とする。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本発明に係る自動音量制御装置は、マイクにより集音された音声信号に対して音声帯域成分の帯域制限処理を適用するとともに適応アルゴリズムを適用することにより音声帯域に係る音声信号を音響信号として抽出する音声信号抽出手段と、音源からの音楽信号を帯域毎に分割し、音楽信号の信号レベルが一定レベル以上の場合において、分割された各帯域における信号レベルを一定値に維持することにより前記音楽信号の音量補正を行う音量補正手段と、前記音声信号抽出手段によって抽出された音響信号より、音声検出部分の重み付けが行われた音声分析ゲインを求める音声分析手段と、前記音声信号抽出手段によって抽出された音響信号に対して前記音声分析手段により求められた音声分析ゲインを適用することにより、音響信号における音声検出部分を顕在化させて、音声検出の有無を示す音声検出信号を求める音声検出手段と、前記音声検出手段により求められた音声検出信号に基づいて、前記音量補正手段により音量補正が行われた音楽信号の出力レベルを、音声検出時に低減させる音量制御手段とを備えることを特徴とする。
【0009】
本発明に係る自動音量制御装置によれば、音声検出手段により求められた音声検出信号に基づいて、前記音量補正手段により音量補正が行われた音楽信号の出力レベルが音声検出時に低減されるので、会話者の会話(発話)に応じて、自動的に音楽信号の信号レベルを低減させることができる。このため、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
【0010】
特に、音量補正手段では、音源からの音楽信号を帯域毎に分割し、音楽信号の信号レベルが一定レベル以上の場合において、分割された各帯域における信号レベルを一定値に維持するので、音楽信号における音量の変動感を低減させることができる。このように音量の変動感を低減させた音楽信号に対して、音声信号の検出時において出力レベルの低減処理が行われるので、音源のソースやジャンルに依存することなく、精度良くかつ違和感なく音楽の音量を低減させることが可能となる。
【0011】
さらに、音声検出手段において音声検出の有無を示す音声検出信号を求める場合には、音声信号抽出手段によって抽出された音声帯域に係る音声信号に対して、さらに、音声検出部分の重み付けが行われた音声分析ゲインを適用させることにより、音響信号における音声検出部分を顕在化させて音声検出の有無を検出するため、音声検出信号の検出精度を高めることができる。
【0012】
また、上述した自動音量制御装置において、前記音声検出手段は、更に、前記音声検出信号に基づいて前記音声検出部分における所定時間毎の音声検出値を積分処理することにより、所定時間における音声の検出状態変化を求め、求められた積分値に基づいて、発話者の発話スピードを判断するテンポ検出値を算出するテンポ検出手段と、該テンポ検出手段により求められたテンポ検出値に基づいて、音声の検出時間に該当するアタック時間と、音声検出の保持時間に該当するリリース時間とを決定し、決定されたアタック時間およびリリース時間を前記音声検出信号に対して設定する適応アタックリリースフィルタ手段とを有するものであってもよい。
【0013】
このように、音声検出手段のテンポ検出手段により、所定時間における音声の検出状態変化に基づいてテンポ検出値を算出することにより、テンポ検出値に基づいて発話者の発話スピードを判断することが可能となる。従って、適応アタックリリースフィルタ手段においてアタック時間およびリリース時間をテンポ検出値に基づいて決定することにより、発話者の発話スピード(テンポ)に応じて音声検出時間(フェードイン時間)および保持時間(フェードアウト時間)を変動することができ、違和感のない音量制御を行うことが可能となる。
【0014】
また、上述した自動音量制御装置において、前記テンポ検出手段は、前記積分処理により求められた積分値を、リセット信号の入力に基づいてクリアにすることにより、発話者の発話スピードを判断するためのテンポ検出値を算出し直すものであってもよい。
【0015】
このように、リセット信号の入力に基づいて発話者の発話スピードを判断するテンポ検出値を算出し直すことにより、テンポ検出値に基づいて決定される音声検出時間(フェードイン時間)および保持時間(フェードアウト時間)の決定内容が再度計算(学習)されることになるので、音声検出および保持時間が適切に変更されるように制御することができ、不意の音量変化に対する違和感を低減させることが可能となる。
【0016】
また、上述した自動音量制御装置において、前記適応アタックリリースフィルタ手段は、前記アタック時間および前記リリース時間を前記テンポ検出値に基づいて設定する可変モードと、前記アタック時間および前記リリース時間を前記テンポ検出値に拘わらず所定の値に設定する固定モードとを有するものであってもよい。
【0017】
このように、本発明に係る自動音量制御装置では、適応アタックリリースフィルタ手段により決定される音声検出時間(フェードイン時間)および保持時間(フェードアウト時間)を、発話者の発話スピードに応じて変更させるか、発話者の発話スピードに拘わらず所定の値に設定するかをユーザの好みにより変更することができる。このため、ユーザの使用状況や好みに応じて、最適な音声検出時間(フェードイン時間)および保持時間(フェードアウト時間)を設定することが可能となる。特に、固定モードの場合において、音声検出時間(フェードイン時間)および保持時間(フェードアウト時間)をユーザの好みで適宜設定することが可能な構成とすることにより、ユーザのニーズに細かく対応することが可能となる。
【0018】
また、上述した自動音量制御装置において、前記音声信号抽出手段は、前記マイクにより集音された前記音声信号に対して音声帯域成分に対応する第1の帯域制限処理を行った後にNLMS適応アルゴリズムを適用することにより音声帯域に係る音声信号を抽出するアレイマイク手段と、アレイマイク手段において抽出された音声帯域に係る前記音声信号に対して、音声帯域成分に対応する第2の帯域制限処理を行った後に、前記音楽信号のチャンネル数に対応させてカスケード接続される適応フィルタを用いて、前記第2の帯域制限処理が行われた音声信号に対して多段のLMS適応アルゴリズムを適用するオーディオキャンセラ手段とを備えるものであってもよい。
【0019】
このように、アレイマイク手段においてNLMS適応アルゴリズムを適用し、さらにオーディオキャンセラ手段において、音楽信号のチャンネル数に対応させてカスケード接続される適応フィルタを用いて多段的にLMS適応アルゴリズムを適用することにより、音声信号における音声信号成分以外の信号成分(ノイズ成分)を効果的かつ高い収束性を確保した上で低減させることができ、音声帯域における音声信号の検出精度の向上を図ることが可能となる。
【0020】
また、上述した自動音量制御装置において、前記オーディオキャンセラ手段における第2の帯域制限処理の帯域制限幅は、前記アレイマイク手段における第1の帯域制限処理の帯域制限幅の上限値および下限値を含み、第1の帯域制限処理の帯域制限幅よりもわずかに広い帯域幅となるように設定されるものであってもよい。
【0021】
このように、第2の帯域制限処理の帯域制限幅が、第1の帯域制限処理の帯域制限幅の上限値および下限値を含み、第1の帯域制限処理の帯域制限幅よりもわずかに広い帯域幅となるように設定されることにより、帯域制限のカットオフ周波数付近のオーディオキャンセル性能を向上させることが可能となる。
【0022】
また、上述した自動音量制御装置において、前記音量制御手段は、前記音源の音量状態に応じて、前記音楽信号における出力レベルの低減量を変化させるものであってもよい。
【0023】
このように、音源の音量状態に応じて、音楽信号における出力レベルの低減量を変化させることにより、音源の音量状態に応じて、音量制御を行うことができるので、適切に音楽信号の信号レベル(音量)を変化させることが可能となる。
【発明の効果】
【0024】
本発明に係る自動音量制御装置によれば、音楽信号の出力レベルが、音声検出時に低減されるので、会話者の会話(発話)に応じて、自動的に音楽信号の信号レベルを低減させることができる。このため、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
【図面の簡単な説明】
【0025】
【図1】本実施の形態に係る自動音量制御装置の概略構成を示したブロック図である。
【図2】本実施の形態に係るアレイマイク部の概略構成を示したブロック図である。
【図3】車両の室内にマイクおよびスピーカが設置された状態を示した図である。
【図4】本実施の形態に係るマイクM1およびマイクM2の指向性と、それぞれのマイクの指向性の違いにより求められる強調された指向性を視覚的に示した図である。
【図5】本実施の形態に係るオーディオキャンセラ部の概略構成を示したブロック図である。
【図6】本実施の形態に係るマイクで集音された音響信号(無指向性マイク)と、アレイマイク部の適応フィルタ部が適用された後の音響信号(アレイマイク部)と、オーディオキャンセラ部において第1適応フィルタ部が適用された後の音響信号(アレイマイク部+オーディオキャンセラ部(L))と、第2適応フィルタ部が適用された後の音響信号(アレイマイク部+オーディオキャンセラ部(L+R))の周波数特性を示した図である。
【図7】(a)は、アレイマイク部の適応フィルタ部で適用されるフィルタ係数を示し、(b)は、オーディオキャンセラ部の第1適応フィルタ部で適用されるフィルタ係数を示し、(c)は、オーディオキャンセラ部の第2適応フィルタ部で適用されるフィルタ係数を示した図である。
【図8】本実施の形態に係る音量補正部の概略構成を示したブロック図である。
【図9】本実施の形態に係る3バンドバンドパスフィルタ部においてLチャンネルの音楽信号L1を、低域、中域、高域の3つの帯域に周波数分割する処理に用いられる機能部を示したブロック図である。
【図10】本実施の形態に係る3バンドバンドパスフィルタ部の第1ローパスフィルタ部および第2ローパスフィルタ部のフィルタ特性を示した図である。
【図11】本実施の形態に係る最大値検出及び最大値ホールド部において、入力された信号に対して2msec毎の最大値検出を行い、さらに最大値を16msecだけホールドした状態を示した図である。
【図12】本実施の形態に係るゲイン計算部の概略構成を示したブロック図である。
【図13】本実施の形態に係る第1ルックアップテーブル部〜第3ルックアップテーブル部のレベル変換動作の一例を示した図である。
【図14】本実施の形態に係るゲイン設定部の概略構成を示したブロック図である。
【図15】本実施の形態に係る音量補正部の低域信号を基準として、最大値検出及び最大値ホールド部より出力される最大値ホールド信号(制御信号)と、ゲイン計算部の第1アタックリリースフィルタ部より出力される出力信号と、ゲイン計算部より出力される低域制御信号とを示した図である。
【図16】本実施の形態に係る音量補正部の中域信号を基準として、最大値検出及び最大値ホールド部より出力される最大値ホールド信号(制御信号)と、ゲイン計算部の第2アタックリリースフィルタ部より出力される出力信号と、ゲイン計算部より出力される中域制御信号とを示した図である。
【図17】音源の信号レベルが低い場合における図15の内容を示した図である。
【図18】(a)は、本実施の形態に係る音量補正部において音量補正が行われなかった場合の信号状態を示し、(b)は、本実施の形態に係る音量補正部において音量補正が行われた場合の信号状態を示した図である。
【図19】本実施の形態に係る音声分析部の概略構成を示したブロック図である。
【図20】(a)は、本実施の形態に係る音源から出力される音楽信号を示し、(b)は、本実施の形態に係るマイクから集音される音声信号を示し、(c)は、本実施の形態に係る自動音量制御装置において音量制御が行われた後の音楽信号を示した図である。
【図21】(a)は、図20(a)に示す音楽信号と、図20(b)に示すような音声信号とが、マイクに入力された場合において、オーディオキャンセラ部より音声分析部へ入力された信号に対する音声分析値を示しており、(b)は、同様の場合において、音声分析部より出力される音声分析ゲインを示している。
【図22】本実施の形態に係る音声検出部の概略構成を示したブロック図である。
【図23】図20(a)に示すような音楽信号と、図20(b)に示すような音声信号とが、マイクに入力された場合における、音声検出スレッショルド部の入力信号(音声信号×音声分析ゲイン)と、音声検出スレッショルド部で設定される音声検出スレッショルドとを示した図である。
【図24】本実施の形態に係るテンポ検出部の概略構成を示したブロック図である。
【図25】(a)は、本実施の形態に係る音声検出スレッショルド部における音声検出スレッショルドの検出により2値化された音声検出信号を示し、(b)は、2値化された音声検出信号に基づいて、テンポゲイン部より出力される信号を示し、(c)は、本実施の形態に係るローパスフィルタ部において求められる積分値(積分出力)と、ゲインオフセット部により出力されるテンポ検出値とを示している。
【図26】(a)は、固定モードにおいて本実施の形態に係る音声検出スレッショルド部より入力された音声検出信号を示し、(b)は、適応アタックリリースフィルタ部における音声保持フィルタと音声保持スレッショルド部における音声保持スレッショルドとを示した図である。
【図27】(a)は、図26(a)(b)に示した信号状態に基づいて求められた音声間隔検出値を示し、(b)は、(a)に示した音声検出信号に対するアタックリリースフィルタ部の出力信号を示し、(c)は、レベルリミッタ部における音量制御値を示している。
【図28】本実施の形態に係る音量制御部の概略構成を示したブロック図である。
【図29】本実施の形態に係るレベル計算部において、音量情報(ボリュームの調整量)の増減に対応して変化する音量制御レベルを複数種類示した図である。
【図30】本実施の形態に係るテンポ検出部において、テンポ検出値に応じて決定されるアタック時間(音声検出時間)とリリース時間(保持時間)との関係を示した図である。
【図31】(a)は、音声信号の検出状態において、音声速度が短く、音声間隔が非常に長い場合における音声検出信号の検出状態を示し、(b)は、固定モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適用動作例を示し、(c)は、可変モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適応動作例を示した図である。
【図32】(a)は、音声信号の検出状態において、音声速度がやや短く、音声間隔がやや長い場合における音声検出値の検出状態を示し、(b)は、固定モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適用動作例を示し、(c)は、可変モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適応動作例を示した図である。
【発明を実施するための形態】
【0026】
以下、本発明に係る自動音量制御装置について、図面を用いて詳細に説明を行う。
【0027】
図1は、本実施の形態に係る自動音量制御装置1の概略構成を示したブロック図である。なお、本実施の形態では、自動音量制御装置1が車両に設置される場合を一例として示して説明する。本発明に係る自動音量制御装置を車両に設置することにより、会話の有無に応じて、車載用オーディオ装置より出力される音楽の音量を自動的に低減させることが可能になる。
【0028】
本実施の形態に係る自動音量制御装置1は、図1に示すように、アレイマイク部(アレイマイク手段、音声信号抽出手段)2と、オーディオキャンセラ部(オーディオキャンセラ手段、音声信号抽出手段)3と、音量補正部(音量補正手段)4と、メインボリューム部5と、音声分析部(音声分析手段)6と、音声検出部(音声検出手段)7と、音量制御部(音量制御手段)8と、パワーアンプ部9と、マイクM1,M2と、スピーカ10a,10bとにより概略構成されている。
【0029】
[アレイマイク部]
図2は、アレイマイク部2の概略構成を示したブロック図である。アレイマイク部2は、図2に示すように、第1バンドパスフィルタ部21と、第2バンドパスフィルタ部22と、遅延部23と、適応フィルタ部24とを有している。
【0030】
第1バンドパスフィルタ部21および第2バンドパスフィルタ部22は、マイクM1とマイクM2を介して入力される音響信号に対して400Hz〜2.4kHz程度の帯域制限を行う役割を有している。従って、第1バンドパスフィルタ部21および第2バンドパスフィルタ部22を通過する音響信号は、マイクM1,M2を介して入力される音響信号のうち音声帯域に対応する信号だけになる。
【0031】
遅延部23は、適応フィルタ部24における信号の減算処理に対応させるべく、マイクM1側の音響信号の遅延を行う役割を有している。このため、遅延部23は、第1バンドパスフィルタ部21により帯域制限が行われたマイクM1の音響信号に対してのみ適用される。遅延部23により遅延処理が行われた音響信号は、適応フィルタ部24に入力される。
【0032】
適応フィルタ部24は、マイクM1より入力されて遅延部23により遅延処理が行われた音響信号から、マイクM2より入力された音響信号の減算処理を行う。
【0033】
適応フィルタ部24は、FIR(Finite Impulse Response Filter)部25とNLMS(Normalized Least Mean Square)部26と、加算部27とを有している。
【0034】
FIR部25は、有限のインパルス応答フィルタを備えており、NLMS部26によって行われる係数制御に基づいて、マイクM2で集音された音響信号に対してフィルタ処理を施す機能を有している。加算部27は、FIR部25によりフィルタ処理が行われたマイクM2からの音響信号を、位相を反転させた状態で、遅延部23により遅延処理が行われたマイクM1からの音響信号に対して加算する(実質的には、マイクM1の音響信号から、フィルタ処理が行われたマイクM2の音響信号を減算する)。加算部27により加算処理された音響信号は、適応フィルタ部24から出力されるとともに、NLMS部26へ出力される。
【0035】
NLMS部26は、加算部27より取得した音響信号(マイクM1の音響信号からフィルタ処理が行われたマイクM2の音響信号が減算された信号)と、マイクM2によって集音された音響信号とに基づいて、最小二乗アルゴリズムに基づいてFIR部25におけるフィルタの係数制御を行う。このようにNLMS部26を適応フィルタ部24に設けることによって、適応速度が入力信号の大きさに依存しないという特徴を備えたNLMSアルゴリズムを適用することが可能となる。
【0036】
マイクM1とマイクM2とは、図3に示すように、車両28の運転席28aおよび助手席28bの上方位置に設けられたサンバイザーに設置されている。マイクM1およびマイクM2は、車両室内における会話を取得するために用いられるものであり、図4に示すように、マイクM1には、無指向性のマイクが用いられ、マイクM2には、単一指向性のマイクが用いられている。このようにして、無指向性のマイクM1により集音された音と、指向性を備えたマイクM2により集音された音とが、それぞれアレイマイク部2に入力される。
【0037】
無指向性のマイクM1により集音された音と、指向性を備えたマイクM2により集音された音とが、それぞれアレイマイク部2に入力されると、アレイマイク部2の適応フィルタ部24において、マイクM1の音響信号からマイクM2の音響信号が減算されるため、減算結果はマイクM2のヌル方向(マイクM2における指向範囲以外の方向)が残り、結果として、該当する方向の指向性が強調されることになる。
【0038】
従って、指向性が強調される方向に発話者が位置するようにして、マイクM1とマイクM2とを設置することによって、発話者の音声を効果的に取得することが可能となる。このように発話者の音声を効果的に取得することにより、取得される音声が強調されることになるので、アレイマイク部2において求められる音響信号は、発話者の音声(希望信号D)と車載用オーディオ信号から出力される音楽(非希望信号U)との相対的な比率、すなわちD/Uが改善された信号となる。
【0039】
なお、アレイマイク部2、マイクM1およびマイクM2の構成は、本実施の形態において説明した構成には限定されず、発話者の音声に対する指向性が強調されて、D/Uを改善することが可能な方式を実現するものであれば、異なる構成となるものであってもよい。
【0040】
また、図3に示すように、車両28にはスピーカが4カ所、具体的には、右フロントドア、左フロントドア、右リアドア、左リアドアの4カ所にそれぞれ設けられており、右フロントドアおよび右リアドアに設けられるスピーカ(このスピーカがスピーカ10aに該当する)からは、パワーアンプ部9において右側成分の音響効果が強調された音楽信号(右側音楽信号R5)が出力され、左フロントドアおよび左リアドアに設けられるスピーカ(このスピーカがスピーカ10bに該当する)からは、パワーアンプ部9において左側成分の音響効果が強調された音楽信号(左側音楽信号L5)が出力される。
【0041】
[オーディオキャンセラ部]
次に、オーディオキャンセラ部3について説明を行う。図5は、オーディオキャンセラ部3の概略構成を示したブロック図である。オーディオキャンセラ部3は、図5に示すように、第1バンドパスフィルタ部31と、第2バンドパスフィルタ部32と、第1遅延部33と、第2遅延部34と、第1適応フィルタ部35と、第2適応フィルタ部36とを有している。
【0042】
第1バンドパスフィルタ部31および第2バンドパスフィルタ部32は、音量補正部4を通過した2チャンネルの音楽信号、すなわち左側の音楽信号L2および右側の音楽信号R2において、200Hz〜2.6kHz程度の帯域制限を行うことにより、音響信号のうち主に音声帯域の信号のみを通過させる役割を有している。
【0043】
なお、オーディオキャンセラ部3では、第1バンドパスフィルタ部31および第2バンドパスフィルタ部32において設定される帯域制限幅(200Hz〜2.6kHz程度)を、アレイマイク部2の第1バンドパスフィルタ部21および第2バンドパスフィルタ部22で設定される帯域制限幅(400Hz〜2.4kHz程度)よりも広い帯域幅(但し、400Hz〜2.4kHzを含む)に設定することにより、アレイマイク部2の帯域制限のカットオフ付近、すなわち400Hzや2.4kHzにおけるオーディオキャンセル性能の向上を図っている。
【0044】
第1遅延部33および第2遅延部34は、第1バンドパスフィルタ部31および第2バンドパスフィルタ部32により帯域制限処理が行われた音響信号に対して遅延処理を施す役割を有している。第1遅延部33および第2遅延部34による遅延処理によって、アレイマイク部2を通して入力される音響信号の伝搬遅延の補正を行うことが可能となる。
【0045】
第1適応フィルタ部35は、第1FIR部37、第1LMS部39、第1加算部41により概略構成されており、第2適応フィルタ部36は、第2FIR部38、第2LMS部40、第2加算部42により概略構成されている。第1適応フィルタ部35および第2適応フィルタ部36は、アレイマイク部2の適応フィルタ部24におけるNLMS部26を第1LMS部39および第2LMS部40に置き換えた構成に該当する。
【0046】
第1適応フィルタ部35および第2適応フィルタ部36では、第1LMS部39および第2LMS部40において、一般的なLMS(Least Mean Square)アルゴリズムを用いることによって、アレイマイク部2から入力される音響信号から、音量補正部4によって音量補正が行われた音楽信号L2および音楽信号R2を順番に減算する処理を行う。具体的な第1適応フィルタ部35および第2適応フィルタ部36の構成については、図2に示すように、アレイマイク部2の適応フィルタ部24と同様の構成であるため、ここでの詳細な説明を省略する。
【0047】
なお、オーディオキャンセラ部3では、図5に示すように、第1適応フィルタ部35および第2適応フィルタ部36がカスケード接続されている。従って、オーディオキャンセラ部3では、第1適応フィルタ部35においてアレイマイク部2から入力された音響信号を音楽信号L2で減算処理した後に、第2適応フィルタ部36において第1適応フィルタ部35で減算処理された音響信号を音楽信号R2で減算処理する構成となっている。この場合において、第1適応フィルタ部35は第2適応フィルタ部36よりも早く収束させることが必要となるため、適応速度を大きく設定している。なお、音源が2チャンネル以上ある場合は、チャンネル数に応じて適応フィルタ部の設置数を増加することにより同様の効果を奏することが可能である。
【0048】
図6は、図3に示すような車両28において、マイクM1により集音された音響信号の周波数特性と、アレイマイク部2およびオーディオキャンセラ部3を動作させた場合における適応フィルタ部24、第1適応フィルタ部35および第2適応フィルタ部36の出力信号の周波数特性を示した図である。具体的に図6には、アレイマイク部2の適応フィルタ部24を適用させる前のマイクM1の音響信号(図6において「無指向性マイク」で示すグラフ)と、アレイマイク部2の適応フィルタ部24が適用された後の音響信号(図6において「アレイマイク部」で示すグラフ)と、オーディオキャンセラ部3において第1適応フィルタ部35を適用した後の音響信号(図6において「アレイマイク部+オーディオキャンセラ部(L)」で示すグラフ)と、オーディオキャンセラ部3において第2適応フィルタ部36を適用した後の音響信号(図6において「アレイマイク部+オーディオキャンセラ部(L+R)」で示すグラフ)とが示されている。
【0049】
なお、図6に示す場合において、車載用オーディオ装置より出力される音楽信号L1および音楽信号R1には長周期のM系列信号が用いられ、音楽信号L1と音楽信号R1とは無相関な信号となっている。また、図7(a)は、アレイマイク部2の適応フィルタ部24で適用されるフィルタ係数を示し、図7(b)は、オーディオキャンセラ部3の第1適応フィルタ部35で適用されるフィルタ係数を示し、図7(c)は、オーディオキャンセラ部3の第2適応フィルタ部36で適用されるフィルタ係数を示している。具体的には、アレイマイク部2の適応フィルタ部24におけるFIR部25のFIRフィルタ長は128tap、オーディオキャンセラ部3の第1適応フィルタ部35におけるFIRフィルタ長および第2適応フィルタ部36のFIRフィルタ長は、それぞれ192tap、また、各FIR部におけるサンプリング周波数は6kHzに設定されている。
【0050】
それぞれの適応フィルタ部24、35、36を適用する前後の周波数特性を比較すると、図6に示すように、無指向性マイクM1の出力信号レベルに対して、アレイマイク部2における出力信号レベルは、出力値が約10dB程度減衰している。さらに、オーディオキャンセラ部3の第1適応フィルタ部35の出力レベルでは、アレイマイク部2における出力信号レベルに対して、約8dB程度減衰し、さらに第2適応フィルタ部36における出力信号レベルでは、第1適応フィルタ部35の出力レベルに対して約11dB程度減衰している。
【0051】
このように、適応フィルタ部24を適用するまでの信号レベルに比べて、適応フィルタ部24、第1適応フィルタ部35および第2適応フィルタ部36を全て適用した後の信号レベルは、トータルで30dB近く出力値が減衰しており、結果としてD/Uが大きく改善されている。なお、図7(a)〜(c)に示す各適応フィルタのフィルタ係数においては、FIRフィルタの応答が続いていることから、フィルタタップ長をより長くすることにより、さらなるD/Uの改善を期待することができる。
【0052】
[音量補正部]
次に、音量補正部4について説明を行う。図8は、音量補正部4の概略構成を示したブロック図である。音量補正部4は、図8に示すように、3バンドバンドパスフィルタ部51と、最大値検出及び最大値ホールド部52と、ゲイン計算部53と、遅延部54と、ゲイン設定部55とを有している。
【0053】
3バンドバンドパスフィルタ部51は、車載用オーディオ信号より出力されるLチャンネルの音楽信号L1およびRチャンネルの音楽信号R1を、それぞれ低域、中域、高域の3つの帯域に周波数分割を行う役割を有している。
【0054】
図9は、3バンドバンドパスフィルタ部51においてLチャンネルの音楽信号L1を、低域、中域、高域の3つの帯域に周波数分割する処理に用いられる機能部を示したブロック図である。3バンドバンドパスフィルタ部51の音楽信号L1を周波数分割するための機能部は、第1ローパスフィルタ部56と、第2ローパスフィルタ部57と、遅延部58と、2つの加算部59、60とで概略構成されている。なお、図9には、便宜上、Lチャンネルの音楽信号L1を周波数分割するための3バンドバンドパスフィルタ部51の機能部だけが示されているが、実際の3バンドバンドパスフィルタ部51は、図9に示したLチャンネルの音楽信号L1を周波数分割するための構成だけでなく、Rチャンネルの音楽信号R1を周波数分割するための構成をも備えている。
【0055】
第1ローパスフィルタ部56と第2ローパスフィルタ部57とは、FIR型のローパスフィルタで構成されており、第1ローパスフィルタ部56および第2ローパスフィルタ部57のそれぞれは、図10に示すようなフィルタ特性を備えている。本実施の形態では、サンプリング周波数を48kHzに設定し、第1ローパスフィルタ部56のフィルタ特性は、FIRフィルタ長が128tapでカットオフ周波数が400Hz、第2ローパスフィルタ部57のフィルタ特性は、FIRフィルタ長が128tapでカットオフ周波数が4kHzに設定されている。また、遅延部58は、第1ローパスフィルタ部56および第2ローパスフィルタ部57の適用による遅延の調整を図るために設けられるものであり、遅延部58は、第1ローパスフィルタ部56および第2ローパスフィルタ部57のフィルタ長の半分の64tapに設定される。
【0056】
図9に示す構成に基づいて、遅延部58で遅延処理を施した音楽信号(全帯域(ALL)の信号)に対して、加算部60において、第2ローパスフィルタ部57からの出力信号を減算することにより、4kHz〜24kHzの高域信号(High)が生成される。また、第2ローパスフィルタ部57からの出力信号に対して、加算部59において、第1ローパスフィルタ部56からの出力信号(低域信号)を減算することにより、中域信号(Mid)が生成される。また、第1ローパスフィルタ部56におけるフィルタ処理により、低域信号(Low)が生成され、さらに、遅延部58において遅延処理が行われた全帯域の信号が生成される。従って、3バンドバンドパスフィルタ部51において入力されたLチャンネルの音楽信号L1は、低域の音楽信号と、中域の音楽信号と、高域の音楽信号と、全帯域の音楽信号とに分離されて出力されることになる。
【0057】
なお、上述したように、3バンドバンドパスフィルタ部51は、音楽信号L1(Lチャンネル)用の構成だけでなく、音楽信号R1(Rチャンネル)用の構成を合わせた機能部を備えているため、上述したようなLチャンネル側のみの動作だけでなく、Rチャンネル側でも同様の動作が行われる。
【0058】
最大値検出及び最大値ホールド部52は、3バンドバンドパスフィルタ部51からの音楽信号L1(Lチャンネル)用および音楽信号R1(Rチャンネル)用の全帯域の音楽信号(ALL)の合成を行った後、所定区間の最大値の検出を行い、さらに最大値を所定時間ホールドし、制御信号(最大値ホールド信号)として出力する役割を有している。
【0059】
本実施の形態では、所定区間を2msecに設定し、ホールド時間を所定区間の8倍とする。本実施の形態では、図11に示すように、サンプリング周波数が48kHzであり、96サンプルの区間の最大値を算出して2msec毎に出力し、最大で32msecの保持(ホールド)を行う。
【0060】
次に、ゲイン計算部53について説明を行う。図12はゲイン計算部53の概略構成を示したブロック図である。ゲイン計算部53は、図12に示すように、第1アタックリリースフィルタ部63と、第2アタックリリースフィルタ部64と、第3アタックリリースフィルタ部65と、第1ルックアップテーブル部67と、第2ルックアップテーブル部68と、第3ルックアップテーブル部69と、第1ローパスフィルタ部71と、第2ローパスフィルタ部72と、第3ローパスフィルタ部73とを有している。
【0061】
第1アタックリリースフィルタ部63〜第3アタックリリースフィルタ部65は、最大値検出及び最大値ホールド部52より受信した制御信号の応答速度を設定する役割を有しており、応答速度の設定方法として、具体的には、アタック時間とリリース時間とによる設定が行われる。なお、アタック時間とリリース時間とは、任意に設定することが可能となっており、本実施の形態では、高域信号および低域信号用のアタック時間およびリリース時間よりも、中域信号用のアタック時間およびリリース時間の方が設定時間が長くなるように(制御速度が遅くなるように)設定されている。
【0062】
第1ルックアップテーブル部67〜第3ルックアップテーブル部69は、最大値検出及び最大値ホールド部52より受信した制御信号のレベル変換を行う役割を有しており、入力された入力信号を一定の出力値にレベル変換した後に、出力信号として出力する。
【0063】
図13は、本実施の形態に係る第1ルックアップテーブル部67〜第3ルックアップテーブル部69のレベル変換動作の一例を示した図である。最大値検出及び最大値ホールド部52より受信した入力信号(制御信号)の信号レベルが−30dB〜0dBの場合には、第1ルックアップテーブル部67において出力レベルが−16dB(低域制御信号)に制御され、第2ルックアップテーブル部68において出力レベルが−20dB(中域制御信号)に制御され、さらに、第3ルックアップテーブル部69において出力レベルが−18dB(高域制御信号)に制御される。また、最大値検出及び最大値ホールド部52より受信した入力信号(制御信号)の信号レベルが−30dB以下の場合には、第1ルックアップテーブル部67〜第3ルックアップテーブル部69において、入力された制御信号に対して所定のゲインを保持したまま減衰するように出力レベルの設定が行われる。
【0064】
このように、入力信号(制御信号)の信号レベルが−30dB〜0dBの場合において、低域制御信号、中域制御信号および高域制御信号のそれぞれの出力信号の信号レベルが一定の値に変換され、−30dB以下の場合には、入力信号に対応するようにして出力信号の値が減衰するので、音量の変動感が低減されて違和感がなくなり、一定の振幅になるように音量の補正を行うことが可能となる。
【0065】
なお、第1ルックアップテーブル部67〜第3ルックアップテーブル部69におけるレベル変換の内容は、図13に示した入力信号と出力信号との関係には限定されず、図13に示した関係とは異なるレベル変換に基づいて出力レベルの変換を行ってもよい
【0066】
第1ローパスフィルタ部71〜第3ローパスフィルタ部73は、第1ルックアップテーブル部67〜第3ルックアップテーブル部69より受信したそれぞれの制御信号(低域制御信号、中域制御信号、高域制御信号)の平滑化処理を行う役割を有しており、平滑化された制御信号(低域制御信号2、中域制御信号2、高域制御信号2)は、ゲイン計算部53からゲイン設定部55へと出力される。
【0067】
遅延部54は、3バンドバンドパスフィルタ部51において低域、中域、高域の3つの帯域に周波数分割されたLチャンネルおよびRチャンネルの信号(LチャンネルおよびRチャンネルの低域信号、中域信号、高域信号)に対して遅延処理を施す役割を有している。遅延部54による遅延処理により、ゲイン計算部53の第1アタックリリースフィルタ部63〜第3アタックリリースフィルタ部65におけるアタック時間に対する遅延補正を行うことが可能となる。
【0068】
ゲイン設定部55は、遅延部54において遅延処理が施されたLチャンネルおよびRチャンネルの信号(LチャンネルおよびRチャンネルの低域信号、中域信号、高域信号)に対して、ゲイン計算部53よりゲイン設定部55に向けて出力された制御信号(低域制御信号2、中域制御信号2、高域制御信号2)を合成することにより振幅が一定になるように補正を行う役割を有している。
【0069】
図14は、ゲイン設定部55の概略構成を示したブロック図である。ゲイン設定部55は、図14に示すように、低域信号に対して低域制御信号2を乗算する乗算部74aと、中域信号に対して中域制御信号2を乗算する乗算部74bと、高域信号に対して高域制御信号2を乗算する乗算部74cと、乗算部74a〜74cにおいてそれぞれの制御信号が乗算された信号を足し合わせる加算部74dとを有しており、加算部74dにおいて足し合わされた信号は、音楽信号L2としてメインボリューム部5およびオーディオキャンセラ部3に対して出力される。なお、図14には、便宜上、Lチャンネル側の構成(乗算部74a〜74cおよび加算部74d)のみしか示されていないが、ゲイン設定部55は、Lチャンネル側の構成に対応したRチャンネル側の構成を備えており、LチャンネルだけでなくRチャンネルの信号に対しても各制御信号を乗算・加算することにより、音楽信号R2の出力を行っている。
【0070】
図15は、音量補正部4における低域信号を基準として、最大値検出及び最大値ホールド部52より出力される最大値ホールド信号(制御信号)と、ゲイン計算部53の第1アタックリリースフィルタ部63より出力される出力信号(低域制御信号)と、ゲイン計算部53より出力される(第1ローパスフィルタ部71より出力された)低域制御信号2とを示した図であり、図16は、音量補正部4における中域信号を基準として、最大値検出及び最大値ホールド部52より出力される最大値ホールド信号(制御信号)と、ゲイン計算部53の第2アタックリリースフィルタ部64より出力される出力信号(中域制御信号)と、ゲイン計算部53より出力される(第2ローパスフィルタ部72より出力された)中域制御信号2とを示した図である。
【0071】
なお、図15示した低域信号に対する第1アタックリリースフィルタ部63でのアタック時間とリリース時間との設定値として、アタック時間として10msec、リリース時間として0.5secが設定されている。なお、高域信号の場合における第3アタックリリースフィルタ部65でのアタック時間とリリース時間との設定は、第1アタックリリースフィルタ部63の場合(低域信号の場合)と同様に、アタック時間として10msec、リリース時間として0.5secが設定される。
【0072】
一方で、図16示した中域信号に対する第2アタックリリースフィルタ部64でのアタック時間とリリース時間との設定は、アタック時間として2sec、リリース時間として2secが設定されている。このように、中域信号における制御速度を遅くすることにより、聴覚的に敏感に聴取される(聞き取りやすい)音楽のボーカル(音声)領域(主として中域音)の音量の変動感が低減されて違和感がなくなり、一定の振幅になるような音量の補正を行うことが可能となる。
【0073】
なお、図15および図16に示した図は、比較的音源の信号レベルが高い場合を例として示している。一方で、音源の信号レベルが低い場合における低域信号(あるいは高域信号)は、図17のように示される。音源の信号レベルが低い場合には、図17に示すように、第1ルックアップテーブル部67〜第3ルックアップテーブル部69において出力信号の値が入力信号よりも高い値にレベル変換されるため、ゲイン計算部53より出力される制御信号が0dB以上となり、音量が積極的に増加されることになる。
【0074】
図18(a)は、音量補正部4において音量補正が行われなかった場合の信号状態を示し、図18(b)は、音量補正部4において音量補正が行われた場合の信号状態を示した図である。図18(a)と図18(b)とを比較すると、音量補正が行われなかった場合(図18(a))に比べて、音量補正が行われた場合(図18(b))には、大きな振幅の音源に対しては信号レベルが小さく制御され、小さな振幅の音源に対しては信号レベルが大きくなるように制御されていることがわかる。
【0075】
このように、音量補正部4において音量補正を行うことによって、音量の変動感が低減されて違和感がなくなり、一定の振幅になるように音量の補正を行うことができる。なお、本実施の形態では適用しなかったが、音量補正部4における音量補正において、リミッタを組み合わせて適応することにより、さらなる振幅の一定化を図ることが可能である。
【0076】
[メインボリューム部]
メインボリューム部5は、搭乗者などにより設定された音量(音量調節スイッチの操作量)に応じて、音量補正部4により音量補正が行われた音楽信号の音量調整を行う役割を有している。
【0077】
メインボリューム部5による音量調整は、車載用オーディオ装置において設定される音量に連動して、あるいは、車載用オーディオ装置とは別に設けられるボリュームスイッチの設定に基づいて行われる。また、メインボリューム部5において行われる音量調整に関する情報(以下、音量情報という)は、音声検出部7へ出力される。
【0078】
[音声分析部]
次に、音声分析部6について説明を行う。図19は、音声分析部6の概略構成を示したブロック図である。音声分析部6は、図19に示すように、実効値検出部75と、標準偏差検出部76と、平均部77と、第1移動平均部78と、第2移動平均部79と、除算部80と、レベル変換部81とを有している。
【0079】
実効値検出部75は、オーディオキャンセラ部3の出力信号において、所定区間の実効値の検出を行う役割を有している。また、標準偏差検出部76は、実効値検出部75で実効値検出が行われた信号に対して、所定区間の標準偏差を検出する役割を有し、さらに、平均部77は、実効値検出部75で実効値検出が行われた信号に対して平均値の検出を行う役割を有している。
【0080】
第1移動平均部78および第2移動平均部79は、入力された信号の所定区間の移動平均をとる役割を有しており、除算部80は、第1移動平均部78において移動平均された標準偏差を、第2移動平均部79において移動平均された平均値で除算することにより、音声分析値を算出する役割を有している。
【0081】
レベル変換部81は、除算部80において算出された音声分析値に対して、ゲインとオフセットを設定することにより音声分析ゲインとして出力する役割を有している。ここで、ゲインとオフセットは、音声検出部7の音声検出において、音声分析の重み付けを設定するものである。
【0082】
図21(a)は、図20(a)に示すような音楽信号(図20(a)には便宜上、Lチャンネルの音楽信号しか示していないが、実際にはRチャンネルの音楽信号も存在する)と、図20(b)に示すような音声信号とが、マイクM1およびマイクM2に入力された場合において、オーディオキャンセラ部3より音声分析部6へ入力された信号に対する音声分析値を示しており、図21(b)は、同様の音楽信号(図20(a))および音声信号(図20(b))がマイクM1およびマイクM2に入力された場合において、音声分析部6のレベル変換部81より出力される出力信号(音声分析ゲイン)を示している。
【0083】
なお、図21(a)(b)に示す状態において、音声分析部6でのサンプリング周波数は6kHz、実効値検出部75における実効値の検出区間は2.7msec、標準偏差検出部76の標準偏差と平均部77の平均値との検出区間は約340msec、第1移動平均部78と第2移動平均部79との移動平均区間は、約2.7secに設定されている。
【0084】
図21(a)に示す音声分析値を、図20(a)に示す音楽信号の状態および図20(b)に示す音声信号の状態と対比させつつ観察すると、図20(b)において音声信号が検出された区間に対応する図21(a)の区間(例えば、図21(a)に矢印で示した区間)では、音声の存在を示すように音声分析値が増加して示されており、音声の検出を確認することができる。
【0085】
一方で、図21(b)に示す音声分析ゲインは、図21(a)に示す音声分析値に対して、ゲインを0.5、オフセットを1に設定したものであり、この音声分析ゲインの値が、次述する音声検出部7における音声検出の重み付けとなって利用される。
【0086】
[音声検出部]
次に、音声検出部7について説明する。図22は、音声検出部7の概略構成を示したブロック図である。音声検出部7は、実効値検出部85と、移動平均部86と、音声分析ゲイン乗算部87と、音声検出スレッショルド部88と、適応アタックリリースフィルタ部89(適応アタックリリースフィルタ手段)と、テンポ検出部(テンポ検出手段)90と、音声保持スレッショルド部91とを有している。
【0087】
実効値検出部85は、オーディオキャンセラ部3の出力信号において所定区間の実効値の検出を行う役割を有している。移動平均部86は、実効値検出部85において実効値の検出が行われた信号に対して、所定区間の移動平均を求める役割を有している。音声分析ゲイン乗算部87は、音声分析部6より入力された音声分析ゲインと、実効値検出部85において移動平均が求められた信号との乗算を行う役割を有している。
【0088】
音声検出スレッショルド部88は、あらかじめ設定された音声検出スレッショルド(閾値)に基づいて、音声信号の検出を行う役割を有している。なお、音声検出スレッショルド部88における音声検出スレッショルドの値は、メインボリューム部5より入力される音量情報に応じて変化する構成となっており、例えば、メインボリューム部5の音量が5dBアップすると、音声検出スレッショルドも連動して5dBアップすることになる。
【0089】
図23は、図20(a)に示すような音楽信号(Lチャンネルの音楽信号だけでなく、Rチャンネルの音楽信号も含む)と図20(b)に示すような音声信号とが、マイクM1およびM2から入力された場合における、音声検出スレッショルド部88の入力信号(音声信号×音声分析ゲイン)と、音声検出スレッショルド部88において設定される音声検出スレッショルドとを示している。
【0090】
図23に示す状況において、音声検出部7でのサンプリング周波数は6kHz、実効値検出部85における実効値の検出区間は約21msec、移動平均部86における移動平均区間は約42msecに設定されている。図23をみると、アレイマイク部2とオーディオキャンセラ部3において、D/Uが大きく改善されることにより音声信号が強調され、さらに音声分析部6より入力された音声分析ゲインによって音声検出部分が顕在化(強調)されているので、音声検出スレッショルドの検出が容易になっている。なお、音量補正部4における音量補正処理により、大きな振幅の音源に対しては信号レベルが小さくなるように制御され、小さな振幅の音源に対しては信号レベルが大きくなるように制御されて、振幅の一定化が図られているので、音源のソースやジャンルに依存することなく、音声検出スレッショルドを設定できることが可能になっている。
【0091】
テンポ検出部90は、発話者の発話スピード(音声信号の入力スピード)に応じて、次述する適応アタックリリースフィルタ部89における音声検出時間と保持時間とを変化させる役割を有している。このように発話者の発話スピードに応じて検出精度を調整することにより最適な音量制御を行うことが可能となる。
【0092】
図24は、テンポ検出部90の概略構成を示したブロック図である。テンポ検出部90は、図24に示すように、スレッショルドクロッシング検出部94と、クロッシングゲイン部95と、移動平均部96と、乗算部97と、テンポゲイン部98と、ローパスフィルタ部99と、ゲインオフセット部100とを有している。
【0093】
スレッショルドクロッシング検出部94は、音声検出スレッショルド部88で音声検出スレッショルドに基づいて検出された音声検出信号に対して、所定区間を1サンプルずつシフトしながらパルス数を検出する役割を有している。クロッシングゲイン部95は、スレッショルドクロッシング検出部94において検出されたパルス数の重み付けを行う役割を有している。移動平均部96は、音声検出スレッショルド部88で音声検出スレッショルドに基づいて検出された音声検出信号に対して、所定区間の移動平均を求める役割を有しており、乗算部97は、クロッシングゲイン部95の出力と移動平均部96の出力との乗算を行う役割を有している。
【0094】
テンポゲイン部98は、乗算部97において乗算処理された出力の重み付けを行う役割を有しており、ローパスフィルタ部99では乗算部97において重み付けされた出力信号(つまりローパスフィルタ部99に入力される信号)における所定時間の変化状態を、積分値を用いて求める処理(積分処理)を行う役割を有し、さらに、ゲインオフセット部100は、ゲインのオフセット処理と丸め処理とを行い、テンポ検出値を出力する役割を有している。ここで、ローパスフィルタ部99の積分処理には、1次のIIR(Infinite Impulse Response)フィルタを用いるものとし、さらに、外部からリセット信号が入力された場合には、積分処理により求められていた積分値をクリアすることが可能となっている。このように、積分処理により求められる積分値をリセット信号に応じてクリアにすることにより、音量制御における学習機能を実現することが可能となっている。
【0095】
テンポ検出部90の動作例を、図25(c)に示す。図25(a)は、音声検出スレッショルド部88における音声検出スレッショルドの検出により2値化された音声検出信号を示し、図25(b)は、2値化された音声検出信号に基づいて、テンポゲイン部98より出力される信号を示し、図25(c)は、ローパスフィルタ部99において求められる積分値(積分出力)と、ゲインオフセット部100により出力されるテンポ検出値とを示している。
【0096】
なお、本実施の形態に係るテンポ検出部90では、クロッシングゲイン部95においてパルスを検出する所定区間を約1secとし、移動平均部96における移動平均の区間を約1secとし、クロッシングゲイン部95におけるクロッシングゲインを0.5とし、テンポゲイン部98におけるテンポゲインを20とし、ローパスフィルタ部99におけるフィルタの正規化カットオフ周波数を0.0002とし、さらに、ゲインオフセット部100におけるゲインオフセットを1として設定する。図25(a)〜図25(c)を検討すると、図25(a)に示す音声検出信号に応じて、図25(c)に示すテンポ検出値が変化していることが理解できる。
【0097】
なお、リセット信号は、どのようなタイミングで入力されるものであってもよく、例えば、車の搭乗者の人数やメンバーが変わり、変わる前の会話状態に変化が生じそうな場合において、搭乗者が操作スイッチなどを操作してリセット(リセット信号の出力を)するものであってもよく、または、車の始動毎(エンジンを始動する毎)にリセットされるものであってもよい。
【0098】
次に、適応アタックリリースフィルタ部89について説明する。適応アタックリリースフィルタ部89は、マイクM1、M2において検出された音声信号に基づいて、会話の開始時にアタック時間を設定し、会話の終了時にリリース時間を設定する役割を有している。適応アタックリリースフィルタ部89は、テンポ検出部90において求められるテンポ検出値に応じて適応アタックリリースフィルタ部89において設定されるアタック時間とリリース時間、すなわち音声検出時間と保持時間を可変にする「可変モード」と、テンポ検出部90において求められるテンポ検出値に依存することなく、音声検出時間と保持時間を固定値にする「固定モード」との2つのモードを備えている。
【0099】
まず、固定モードの場合について説明し、可変モードについては後に説明する。
【0100】
図26(a)は、固定モードにおいて、音声検出スレッショルド部88より入力された音声検出信号を示し、図26(b)は、適応アタックリリースフィルタ部89における音声保持フィルタの適用動作例を示した図である。図26(b)に示す場合は、アタック時間とリリース時間とが固定された場合(固定モード)示しており、具体的には、アタック時間は0.2secに固定され、リリース時間は4secに固定されている。従って、音声信号を検出した場合には音声保持フィルタの適用により、0.2secで信号出力値が上昇し、音声信号の検出が終了した場合には、4secの時間をかけて信号出力が低減される。
【0101】
音声保持スレッショルド部91は、あらかじめ設定された音声保持スレッショルド(閾値)に基づいて、音声間隔時間の検出を行う役割を有している。図26(b)には、音声保持スレッショルド部91において設定される音声保持スレッショルド値が示されており、本実施の形態では0.3に設定されている。
【0102】
固定モードでは、上述したように、音声検出スレッショルド部88の音声検出スレッショルド検出に基づいて、図26(a)に示すような2値化された音声検出信号が適応アタックリリースフィルタ部89に入力されると、適応アタックリリースフィルタ部89では、音声検出信号に対してアタック時間とリリース時間とを適用する。そして、アタック時間とリリース時間とが適用された音声検出信号(音声保持フィルタ)のうち、音声保持スレッショルド部91において設定される音声保持スレッショルド値を超える時間が、音声間隔時間(音声検出と保持時間)として、音声保持スレッショルド部91により求められる。図27(a)は、図26(a)(b)の信号状態に基づいて求められた音声間隔時間(音声間隔検出値)である。なお、上述したように、適応アタックリリースフィルタ部89が可変モードの場合については後述する。
【0103】
[音量制御部]
次に、音量制御部8について説明する。図28は、音量制御部8の概略構成を示したブロック図である。音量制御部8は、図28に示すように、アタックリリースフィルタ部101と、レベルリミッタ部102と、レベル計算部103と、乗算部104、105とを有している。
【0104】
アタックリリースフィルタ部101は音声検出部7において検出された音声間隔時間に基づいて、再生している音楽のフェードイン時間とフェードアウト時間の設定を行う役割を有している。
【0105】
レベル計算部103は、メインボリューム部5より入力される音量情報に応じて、レベルリミッタ部102に対する音量の制御量を計算する役割を有している。具体的に、本実施の形態に係るレベル計算部103では、図29に示すように、音量情報(ボリュームの調整量)の増減に対応して変化する音量制御レベルの変化を、聴取者の好みに応じて複数種類(図29においては、一例として4種類示されている)の中から設定することが可能となっている。このように音量情報(ボリュームの調整量)に対する音量制御レベルの変化状態が任意に選択され、選択された変化状態に基づいて、レベル計算部103では、メインボリューム部5からの音量情報に対応する音量制御レベルを決定する。
【0106】
また、レベルリミッタ部102は、レベル計算部103において求められた音量制御レベルに基づいて、アタックリリースフィルタ部101の出力信号に対する調整処理を行う役割を有している。
【0107】
図27(b)は、(a)に示すような音声検出信号(音声間隔時間)における、アタックリリースフィルタ部101の出力信号の変化状態を示し、図27(c)は、レベルリミッタ部102における出力信号(音量制御値)の変化を示している。なお、本実施の形態では、アタックリリースフィルタ部101のアタック時間を0.1secに設定し、リリース時間を5.0secに設定し、音量制御量を24dB(リニアでは0.0631)に設定している。また、アタックリリースフィルタ部101において設定されるアタック時間は音楽のフェードアウト時間に該当し、リリース時間は音楽のフェードイン時間に該当する。
【0108】
図27(b)(c)に示すように、レベルリミッタ部102は、アタックリリースフィルタ部101の出力信号の増減変化を反転させて、音声が検出されない区間では音量制御値が1になるように変換させ、音声が検出される区間で音量制御値が0.05程度まで低減されるように調整を行う。図27(c)に示すように、レベルリミッタ部102において、音声の検出時に音量制御値を1より低い値(例えば0に近い値)に変化・設定し、音声の検出時に音量制御値を1の値に変化・設定することにより、音声検出のタイミングに連動させて音楽信号の信号レベルを低減させることが可能となる。
【0109】
乗算部104、105は、レベルリミッタ部102の信号出力(音量制御値)と、メインボリューム部5における2チャンネルの音楽信号(音楽信号L3および音楽信号R3)との乗算処理を行う役割を有している。乗算部104、105では、図27(c)に示される音量制御信号が、音楽信号L3および音楽信号R3のそれぞれに掛け合わされて、音量が制御された音楽信号L4および音楽信号R4がパワーアンプ部9へと出力される。乗算部104、105において音量制御が施された音楽信号L4およびR4は、パワーアンプ部9を介してスピーカ10a,10bから出力される。
【0110】
図20(c)は、図20(a)に示すような音楽信号(図20(a)には便宜上、Lチャンネルの音楽信号しか示していないが、実際にはRチャンネルの音楽信号も存在する)が車載用オーディオ装置で再生される状態において、図20(b)に示すような音声信号がマイクM1およびマイクM2に入力された場合に、スピーカ10a、10bより出力される音楽信号(音量制御部8において音量制御が行われた音楽信号)を示している。図20(a)〜図20(c)を比較して比べるとわかるように、会話が行われて、マイクM1およびマイクM2において、発話者の音声が集音された場合には、その集音された音声のタイミングに応じて、音楽信号の信号レベルが低減された状態で出力されることになる。このため、会話を行っている当事者は、会話に応じて低減制御される音楽によって会話を阻害されることなく、違和感のない会話を車内で楽しむことが可能となる。
【0111】
また、上述したように、音声検出部7において検出された音声間隔時間(音声検出時間と保持時間)は固定値となっており、この音声間隔時間に基づいて、音楽のフェードアウト時間(アタックリリースフィルタ部101のアタック時間)が0.1secに設定され、音楽のフェードイン時間(アタックリリースフィルタ部101のリリース時間)が5.0secに設定されているため、図20(c)に示すように、音声信号がマイクM1,M2で取得された時には素早く音楽情報の信号レベルを低減させ、一方で、音声信号の取得が終了したときには、暫く時間を保って(5.0sec)ゆっくりと音楽信号の信号レベルを復帰される。
【0112】
次に、音声検出部7の適応アタックリリースフィルタ部89における設定が「可変モード」である場合について説明する。
【0113】
可変モードの場合には、テンポ検出部90のテンポ検出値に応じて、適応アタックリリースフィルタ部89において設定されるアタック時間およびリリース時間、すなわち音声検出時間および保持時間が変化することになる。
【0114】
図30は、テンポ検出部90において求められたテンポ検出値に応じて決定されるアタック時間(音声検出時間)とリリース時間(保持時間)との関係を示した図である。図30において、テンポ検出時間が3未満の場合、つまり車両走行時の一瞬の路面変化音がマイクM1、M2で取得された場合や、独り言などの短い発話がマイクM1、M2で取得された場合のように、音声信号の音声速度が速く、音声間隔が長いものと判断できる場合(図30に示した「(A)路面変化音、短い発話」に該当する場合)には、音声信号の検出を行わず、仮に検出した場合であっても、保持時間を短くすることにより、路面変化音や短い発話が行われた場合において不用意に音楽信号の信号レベルが低減されてしまうことを防止し、さらに、もしも信号レベルの低減などが行われた場合であっても、音楽情報を短い時間で元の信号レベルに復帰させることが可能となる。
【0115】
また、テンポ検出部90において求められるテンポ検出時間が3以上であって7以下である場合、つまり、発話の速度がゆっくりで発話間隔がやや長いと判断できる場合(図30に示した「(B)音声速度:遅い、音声間隔:やや長い」に該当する場合)には、音声検出を行うアタック時間は短く、音声保持を行うリリース時間は長くなるように、アタック時間およびリリース時間を設定する。このように、アタック時間およびリリース時間を設定することにより、会話の開始に応じて音楽信号の信号レベルを低減させることができ、さらに、音声間隔が長い状態と判断されるので,音楽信号の信号レベルの復帰を違和感のないように緩やかに行うことができる。
【0116】
さらに、テンポ検出部90において求められるテンポ検出時間が7以上である場合、つまり、音声速度が速く、さらに、音声間隔が短いと判断できる場合(図30に示した「(C)音声速度:早い、音声間隔:短い」に該当する場合)には、テンポ検出時間が3以上であって7以下である場合に比べて、リリース時間を短くすることにより音声保持時間を短くし、音楽信号の信号レベルの復帰における応答性を良好にすることが可能である。
【0117】
図31(a)は、音声信号の検出状態において、音声速度が短く(検出時間が短く)、音声間隔が非常に長い(検出間隔が非常に長い)場合(図30に示した「(A)路面変化音、短い発話」に該当する場合)における音声検出信号の検出状態を示し、図31(b)は、固定モードの場合における、適応アタックリリースフィルタ部89の音声保持フィルタの適用動作例を示し、図31(c)は、図31(a)と同じ可変モードにおける、適応アタックリリースフィルタ部89の音声保持フィルタの適応動作例を示している。
【0118】
図31(b)に示すように、固定モードでは、音声保持フィルタの値が音声保持スレッショルドを超えた値となるため、音声保持が行われて所定時間の音量制御が実行されることになる。一方で、図31(c)に示すように、可変モードでは、音声保持フィルタの値が音声保持スレッショルドを超えることはないため、音量制御が行われない。このため、車両走行時の一瞬の路面変化音や独り言などの短い発話には、自動音量制御装置1による音量制御が行われず、不意の音量変化に対応する音量補正を抑制することができるので、車内の乗員に対して違和感のあるような音楽信号の出力が行われてしまうことを防止することが可能となる。
【0119】
一方で、図32(a)は、音声信号の検出状態において、音声速度がやや短く(検出時間がやや短く)、音声間隔がやや長い(検出間隔がやや長い)場合における音声検出値の検出状態を示し、図32(b)は、固定モードの場合における、適応アタックリリースフィルタ部89の音声保持フィルタの適用動作例を示し、図32(c)は、図32(a)と同じ可変モードにおける、適応アタックリリースフィルタ部89の音声保持フィルタの適応動作例を示している。
【0120】
図32(b)に示すように、固定モードでは、音声保持フィルタの値が音声保持スレッショルドを下回る場合があるため、音量制御が時々解除された状態となりやすいが、一方で、図32(c)に示すように、可変モードでは、最初の段階において音量制御が行われるが、テンポ検出部90における検出値の積分結果、すなわち学習機能に基づいて、次第に発話中と判断することができ、音声保持スレッショルドを下回ることがなくなるので、音量制御が保持されることが可能となり、不意に音量変化が生じてしまって聴取者に違和感を生じさせることを防止することが可能となる。
【0121】
上述したように本実施の形態に係る自動音量制御装置1では、マイクM1およびマイクM2において音声が検出された場合に、車載用オーディオ装置より出力される音楽の出力音量が自動的に低減されるので、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
【0122】
特に、本実施の形態に係る自動音量制御装置1では、無指向性のマイクM1と単一指向性のマイクM2とを用いることにより指向性を強調させる構成を採用しているので、発話者の音声を精度良く取得することが可能である。
【0123】
さらに、アレイマイク部2の適応フィルタ部24においてNLMS適応アルゴリズムを適用し、さらにオーディオキャンセラ部3の第1適応フィルタ部35および第2適応フィルタ部36においてLMS適応アルゴリズムを適用することにより、音声信号における音声信号成分以外の信号成分(ノイズ成分)を効果的かつ高い収束性を確保した上で低減させることができ、音声帯域における音声信号の検出精度の向上を図ることが可能となる。
【0124】
特に、アレイマイク部2の適応フィルタ部24において、NLMS適応アルゴリズムを適用してノイズ成分の低減を図った上で、さらに音源のチャンネル数に応じて、オーディオキャンセラ部3の第1適応フィルタ部35および第2適応フィルタ部36において、適応フィルタ部をカスケード接続する構成を採用し、各適応フィルタ部でのフィルタ処理においてより早くフィルタ処理を適用する部分毎に適応速度を大きくしているので、フィルタ処理が適用される信号の収束を素早くすることが可能となる。
【0125】
また、オーディオキャンセラ部3の第1バンドパスフィルタ部31および第2バンドパスフィルタ部32において設定される帯域制限幅が、アレイマイク部2の第1バンドパスフィルタ部21において設定される帯域制限幅よりも広い帯域幅に設定されているため、帯域制限のカットオフ周波数付近のオーディオキャンセル性能を向上させることが可能となる。
【0126】
上述したような複数の適応アルゴリズムの適用やバンドパスフィルタの適応制限幅の設定により、D(希望信号:音声信号)/U(非希望信号:音楽信号)に優れた信号を求めることができる。
【0127】
また、音量補正部4のゲイン計算部53において、第1アタックリリースフィルタ部63および第3アタックリリースフィルタ部65で低域制御信号および高域制御信号を対象として設定されるアタック時間およびリリース時間に比べて、第2アタックリリースフィルタ部64で中域制御信号を対象として設定されるアタック時間およびリリース時間を長い時間に設定することにより、中域信号における制御処理を遅くすることができる。このため、聴覚的に敏感に聴取される(聞き取りやすい)音楽のボーカル音領域の音量の変動感が低減されて違和感がなくなり、一定の振幅になるように音量補正を行うことが可能となる。
【0128】
さらに、音量補正部4のゲイン計算部53において、第1ルックアップテーブル部67〜第3ルックアップテーブル部69で低域制御信号、中域制御信号、高域制御信号の出力信号レベルを入力信号の信号レベルが所定値以上(本実施の形態に場合には、−30dB以上)の場合には出力信号の信号レベルを一定値に設定し、入力信号の信号レベルが所定値(本実施の形態の場合には、−20dB〜−16dB)以下の場合には、入力信号よりも信号レベルが高い値を示すように出力信号の信号レベルを変換するので、音楽信号における音量の変動感を低減させる音量補正を行うことができる。
【0129】
また、音声検出部7の音声検出スレッショルド部88で音声間隔時間の検出を行う場合において、上述したアレイマイク部2およびオーディオキャンセラ部3の処理により優れたD/Uを備えた出力信号に対して、音声検出部分に重み付けが施された音声分析ゲインが適用されるので、出力信号における音声検出部分の顕在化(強調)を図ることができ、音声の有無を用意かつ確実に判断することが可能となる。さらに、音声検出部分の顕在化が図られた信号に対して音声検出スレッショルドが設定されて、音声が聴取された際の音声間隔時間の検出が行われるので、音源のソースやジャンルに依存することなく、容易に音声検出スレッショルドを設定することが可能となり、音声間隔時間の検出精度を高めることが可能となる。
【0130】
さらに、音声検出部7の音声検出スレッショルド部88において設定される音声検出スレッショルドは、メインボリューム部5より入力される音量情報に基づいて決定されるので、音声検出スレッショルドを音量調節スイッチ操作に応じたボリューム調整量(音量情報)に連動させて最適化することが可能になる。従って、音声信号の制御量を音量に応じて制御することが可能となり、制御量を任意に設定することが可能になる
【0131】
また、音声のテンポ(発話者の発語スピード)を検出し、テンポに応じて音量制御における音声検出時間(フェードイン時間)および保持時間(フェードアウト時間)を変動することができるので、違和感のない音量制御を行うことができる。
【0132】
さらに、リセット入力の有無に応じて、音声検出時間(フェードイン時間)および保持時間(フェードアウト時間)の決定内容を再度計算(学習)させることができるので、音声検出および保持時間が適切に変更されるように制御することができ、不意の音量変化に対する違和感を低減させることが可能となる。
【0133】
さらに、メインボリューム部5の音量情報に応じて、音量制御部8のレベル計算部103における音量制御を行うことができるので、メインボリューム部5の音量に応じて適切に音楽信号の信号レベル(音量)を変化させることが可能となる。
【0134】
また、自動音量制御装置1では、音量制御部8のアタックリリースフィルタ部101において音声検出部7より取得した音声検出信号に応じて音楽のフェードアウト時間に該当するアタック時間と、音楽のフェードイン時間に該当するリリース時間とが設定されるため、この時間設定を変更することにより、音楽のフェードアウト、フェードイン時間を任意に設定することが可能となる。
【0135】
以上、本発明に係る自動音量制御装置について、図面を用いて詳細に説明した、本発明に係る自動音量制御装置は、上述した実施の形態に限定されるものではない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到しうることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0136】
1 …自動音量制御装置
2 …アレイマイク部(アレイマイク手段、音声信号抽出手段)
3 …オーディオキャンセラ部(オーディオキャンセラ手段、音声信号抽出手段)
4 …音量補正部(音量補正手段)
5 …メインボリューム部
6 …音声分析部(音声分析手段)
7 …音声検出部(音声検出手段)
8 …音量制御部(音量制御手段)
9 …パワーアンプ部
10a、10b …スピーカ
21 …(アレイマイク部の)第1バンドパスフィルタ部
22 …(アレイマイク部の)第2バンドパスフィルタ部
23 …(アレイマイク部の)遅延部
24 …(アレイマイク部の)適応フィルタ部
25 …(適応フィルタ部の)FIR部
26 …(適応フィルタ部の)NLMS部
27 …(適応フィルタ部の)加算部
28 …車両
28a …運転席
28b …助手席
31 …(オーディオキャンセラ部の)第1バンドパスフィルタ部
32 …(オーディオキャンセラ部の)第2バンドパスフィルタ部
33 …(オーディオキャンセラ部の)第1遅延部
34 …(オーディオキャンセラ部の)第2遅延部
35 …(オーディオキャンセラ部の)第1適応フィルタ部
36 …(オーディオキャンセラ部の)第2適応フィルタ部
37 …(第1適応フィルタ部の)第1FIR部
38 …(第2適応フィルタ部の)第2FIR部
39 …(第1適応フィルタ部の)第1LMS部
40 …(第2適応フィルタ部の)第2LMS部
41 …(第1適応フィルタ部の)第1加算部
42 …(第2適応フィルタ部の)第2加算部
51 …(音量補正部の)3バンドバンドパスフィルタ部
52 …(音量補正部の)最大値検出及び最大値ホールド部
53 …(音量補正部の)ゲイン計算部
54 …(音量補正部の)遅延部
55 …(音量補正部の)ゲイン設定部
56 …(3バンドバンドパスフィルタ部の)第1ローパスフィルタ部
57 …(3バンドバンドパスフィルタ部の)第2ローパスフィルタ部
58 …(3バンドバンドパスフィルタ部の)遅延部
59、60 …(3バンドバンドパスフィルタ部の)加算部
63 …(ゲイン計算部の)第1アタックリリースフィルタ部
64 …(ゲイン計算部の)第2アタックリリースフィルタ部
65 …(ゲイン計算部の)第3アタックリリースフィルタ部
67 …(ゲイン計算部の)第1ルックアップテーブル部
68 …(ゲイン計算部の)第2ルックアップテーブル部
69 …(ゲイン計算部の)第3ルックアップテーブル部
71 …(ゲイン計算部の)第1ローパスフィルタ部
72 …(ゲイン計算部の)第2ローパスフィルタ部
73 …(ゲイン計算部の)第3ローパスフィルタ部
74a、74b、74c …(ゲイン設定部の)乗算部
74d …(ゲイン設定部の)加算部
75 …(音声分析部の)実効値検出部
76 …(音声分析部の)標準偏差検出部
77 …(音声分析部の)平均部
78 …(音声分析部の)第1移動平均部
79 …(音声分析部の)第2移動平均部
80 …(音声分析部の)除算部
81 …(音声分析部の)レベル変換部
85 …(音声検出部の)実効値検出部
86 …(音声検出部の)移動平均部
87 …(音声検出部の)音声分析ゲイン乗算部
88 …(音声検出部の)音声検出スレッショルド部
89 …(音声検出部の)適応アタックリリースフィルタ部(適応アタックリリースフィルタ手段)
90 …(音声検出部の)テンポ検出部(テンポ検出手段)
91 …(音声検出部の)音声保持スレッショルド部
94 …(テンポ検出部の)スレッショルドクロッシング検出部
95 …(テンポ検出部の)クロッシングゲイン部
96 …(テンポ検出部の)移動平均部
97 …(テンポ検出部の)乗算部
98 …(テンポ検出部の)テンポゲイン部
99 …(テンポ検出部の)ローパスフィルタ部
100 …(テンポ検出部の)ゲインオフセット部
101 …(音量制御部の)アタックリリースフィルタ部
102 …(音量制御部の)レベルリミッタ部
103 …(音量制御部の)レベル計算部
104、105 …(音量制御部の)乗算部
M1、M2 …マイク

【特許請求の範囲】
【請求項1】
マイクにより集音された音声信号に対して音声帯域成分の帯域制限処理を適用するとともに適応アルゴリズムを適用することにより音声帯域に係る音声信号を音響信号として抽出する音声信号抽出手段と、
音源からの音楽信号を帯域毎に分割し、音楽信号の信号レベルが一定レベル以上の場合において、分割された各帯域における信号レベルを一定値に維持することにより前記音楽信号の音量補正を行う音量補正手段と、
前記音声信号抽出手段によって抽出された音響信号より、音声検出部分の重み付けが行われた音声分析ゲインを求める音声分析手段と、
前記音声信号抽出手段によって抽出された音響信号に対して前記音声分析手段により求められた音声分析ゲインを適用することにより、音響信号における音声検出部分を顕在化させて、音声検出の有無を示す音声検出信号を求める音声検出手段と、
前記音声検出手段により求められた音声検出信号に基づいて、前記音量補正手段により音量補正が行われた音楽信号の出力レベルを、音声検出時に低減させる音量制御手段と
を備えることを特徴とする自動音量制御装置。
【請求項2】
前記音声検出手段は、更に、
前記音声検出信号に基づいて前記音声検出部分における所定時間毎の音声検出値を積分処理することにより、所定時間における音声の検出状態変化を求め、求められた積分値に基づいて、発話者の発話スピードを判断するテンポ検出値を算出するテンポ検出手段と、
該テンポ検出手段により求められたテンポ検出値に基づいて、音声の検出時間に該当するアタック時間と、音声検出の保持時間に該当するリリース時間とを決定し、決定されたアタック時間およびリリース時間を前記音声検出信号に対して設定する適応アタックリリースフィルタ手段と
を有することを特徴とする請求項1に記載の自動音量制御装置。
【請求項3】
前記テンポ検出手段は、前記積分処理により求められた積分値を、リセット信号の入力に基づいてクリアにすることにより、発話者の発話スピードを判断するためのテンポ検出値を算出し直すこと
を特徴とする請求項2に記載の自動音量制御装置。
【請求項4】
前記適応アタックリリースフィルタ手段は、
前記アタック時間および前記リリース時間を前記テンポ検出値に基づいて設定する可変モードと、前記アタック時間および前記リリース時間を前記テンポ検出値に拘わらず所定の値に設定する固定モードとを有すること
を特徴とする請求項2又は請求項3に記載の自動音量制御装置。
【請求項5】
前記音声信号抽出手段は、
前記マイクにより集音された前記音声信号に対して音声帯域成分に対応する第1の帯域制限処理を行った後にNLMS適応アルゴリズムを適用することにより音声帯域に係る音声信号を抽出するアレイマイク手段と、
アレイマイク手段において抽出された音声帯域に係る前記音声信号に対して、音声帯域成分に対応する第2の帯域制限処理を行った後に、前記音楽信号のチャンネル数に対応させてカスケード接続される適応フィルタを用いて、前記第2の帯域制限処理が行われた音声信号に対して多段のLMS適応アルゴリズムを適用するオーディオキャンセラ手段と
を備えることを特徴とする請求項1乃至請求項4のいずれか1項に記載の自動音量制御装置。
【請求項6】
前記オーディオキャンセラ手段における第2の帯域制限処理の帯域制限幅は、前記アレイマイク手段における第1の帯域制限処理の帯域制限幅の上限値および下限値を含み、第1の帯域制限処理の帯域制限幅よりもわずかに広い帯域幅となるように設定されること
を特徴とする請求項5に記載の自動音量制御装置。
【請求項7】
前記音量制御手段は、前記音源の音量状態に応じて、前記音楽信号における出力レベルの低減量を変化させること
を特徴とする請求項1乃至請求項6のいずれか1項に記載の自動音量制御装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate


【公開番号】特開2011−15018(P2011−15018A)
【公開日】平成23年1月20日(2011.1.20)
【国際特許分類】
【出願番号】特願2009−155488(P2009−155488)
【出願日】平成21年6月30日(2009.6.30)
【出願人】(000001487)クラリオン株式会社 (1,722)
【Fターム(参考)】