自動音量制御装置

【課題】運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うこと。
【解決手段】自動音量制御装置１は、マイクＭ１、Ｍ２で集音された音声信号に音声帯域成分の帯域制限処理と適応アルゴリズムとを適用して音響信号を抽出する音声信号抽出手段２、３と、音楽信号における音量の変動感を低減させる音量補正手段４と、音響信号における音声検出部分の重み付けを行った音声分析ゲインを求める音声分析手段６と、音響信号に対して音声分析ゲインを適用させることにより音声検出部分を顕在化させて音声検出信号を求める音声検出手段７と、音声検出信号に基づいて音楽信号の出力レベルを音声信号の検出時に低減させる音量制御手段８とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は自動音量制御装置に関し、より詳細には、音楽が流されている空間において会話が行われた場合に、発話に応じて音楽の出力レベルを低減させることにより円滑な会話を実現することが可能な自動音量制御装置に関する。
【背景技術】
【０００２】
走行中の車両の室内では、運転（走行）に音楽やラジオ番組等を流すことが多い。このような状況において、運転手と同乗者とが会話を行う場合には、音楽等の再生音によって、円滑な会話（会話の聞き取り等）が妨げられてしまうおそれがあった。
【０００３】
一般的な車載用オーディオ装置には、音量を調節するための音量調節スイッチや、音量を一時的に低減させるためのミュートスイッチなどが設けられている（例えば、特許文献１および特許文献２参照）。このため、運転者等は、音量調節スイッチやミュートスイッチを操作することにより、会話を妨げない程度まで音楽等の再生音量を低減させることが多かった。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】特開２００８−６２９０６号公報
【特許文献２】特開２００６−６７４９０号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
しかしながら、会話を行う度に音量調節スイッチを操作して再生音を低減する方法では、操作が煩雑になり、かえって円滑な会話を妨げてしまうおそれがあるという問題があった。一方で、ミュートスイッチを用いて音楽の再生音を低減させる方法では、会話が途切れた状態においてもそのまま音楽の再生音が低減された状態となってしまい、音楽やラジオ番組等を楽しむことができないという問題があった。
【０００６】
このため、音量調節スイッチやミュートスイッチを操作することなく、発話者が会話の成立するような大きな声を発することにより、音楽等を再生させた状態で会話を行うこともしばしば行われるが、会話が続く場合には、発話者はもちろんのこと会話の相手側においても会話に疲労を感じてしまうおそれがあるという問題があった。
【０００７】
本発明は、上記問題に鑑みてなされたものであり、運転者又は同乗者が音量調節スイッチやミュートスイッチを操作することなく、さらに、大きな声を発することなく通常の状態で円滑な会話を行うことが可能な自動音量制御装置を提供することを課題とする。
【課題を解決するための手段】
【０００８】
上記課題を解決するために、本発明に係る自動音量制御装置は、マイクにより集音された音声信号に対して音声帯域成分の帯域制限処理を適用するとともに適応アルゴリズムを適用することにより音声帯域に係る音声信号を音響信号として抽出する音声信号抽出手段と、音源からの音楽信号を帯域毎に分割し、音楽信号の信号レベルが一定レベル以上の場合において、分割された各帯域における信号レベルを一定値に維持することにより前記音楽信号の音量補正を行う音量補正手段と、前記音声信号抽出手段によって抽出された音響信号より、音声検出部分の重み付けが行われた音声分析ゲインを求める音声分析手段と、前記音声信号抽出手段によって抽出された音響信号に対して前記音声分析手段により求められた音声分析ゲインを適用することにより、音響信号における音声検出部分を顕在化させて、音声検出の有無を示す音声検出信号を求める音声検出手段と、前記音声検出手段により求められた音声検出信号に基づいて、前記音量補正手段により音量補正が行われた音楽信号の出力レベルを、音声検出時に低減させる音量制御手段とを備えることを特徴とする。
【０００９】
本発明に係る自動音量制御装置によれば、音声検出手段により求められた音声検出信号に基づいて、前記音量補正手段により音量補正が行われた音楽信号の出力レベルが音声検出時に低減されるので、会話者の会話（発話）に応じて、自動的に音楽信号の信号レベルを低減させることができる。このため、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
【００１０】
特に、音量補正手段では、音源からの音楽信号を帯域毎に分割し、音楽信号の信号レベルが一定レベル以上の場合において、分割された各帯域における信号レベルを一定値に維持するので、音楽信号における音量の変動感を低減させることができる。このように音量の変動感を低減させた音楽信号に対して、音声信号の検出時において出力レベルの低減処理が行われるので、音源のソースやジャンルに依存することなく、精度良くかつ違和感なく音楽の音量を低減させることが可能となる。
【００１１】
さらに、音声検出手段において音声検出の有無を示す音声検出信号を求める場合には、音声信号抽出手段によって抽出された音声帯域に係る音声信号に対して、さらに、音声検出部分の重み付けが行われた音声分析ゲインを適用させることにより、音響信号における音声検出部分を顕在化させて音声検出の有無を検出するため、音声検出信号の検出精度を高めることができる。
【００１２】
また、上述した自動音量制御装置において、前記音声検出手段は、更に、前記音声検出信号に基づいて前記音声検出部分における所定時間毎の音声検出値を積分処理することにより、所定時間における音声の検出状態変化を求め、求められた積分値に基づいて、発話者の発話スピードを判断するテンポ検出値を算出するテンポ検出手段と、該テンポ検出手段により求められたテンポ検出値に基づいて、音声の検出時間に該当するアタック時間と、音声検出の保持時間に該当するリリース時間とを決定し、決定されたアタック時間およびリリース時間を前記音声検出信号に対して設定する適応アタックリリースフィルタ手段とを有するものであってもよい。
【００１３】
このように、音声検出手段のテンポ検出手段により、所定時間における音声の検出状態変化に基づいてテンポ検出値を算出することにより、テンポ検出値に基づいて発話者の発話スピードを判断することが可能となる。従って、適応アタックリリースフィルタ手段においてアタック時間およびリリース時間をテンポ検出値に基づいて決定することにより、発話者の発話スピード（テンポ）に応じて音声検出時間（フェードイン時間）および保持時間（フェードアウト時間）を変動することができ、違和感のない音量制御を行うことが可能となる。
【００１４】
また、上述した自動音量制御装置において、前記テンポ検出手段は、前記積分処理により求められた積分値を、リセット信号の入力に基づいてクリアにすることにより、発話者の発話スピードを判断するためのテンポ検出値を算出し直すものであってもよい。
【００１５】
このように、リセット信号の入力に基づいて発話者の発話スピードを判断するテンポ検出値を算出し直すことにより、テンポ検出値に基づいて決定される音声検出時間（フェードイン時間）および保持時間（フェードアウト時間）の決定内容が再度計算（学習）されることになるので、音声検出および保持時間が適切に変更されるように制御することができ、不意の音量変化に対する違和感を低減させることが可能となる。
【００１６】
また、上述した自動音量制御装置において、前記適応アタックリリースフィルタ手段は、前記アタック時間および前記リリース時間を前記テンポ検出値に基づいて設定する可変モードと、前記アタック時間および前記リリース時間を前記テンポ検出値に拘わらず所定の値に設定する固定モードとを有するものであってもよい。
【００１７】
このように、本発明に係る自動音量制御装置では、適応アタックリリースフィルタ手段により決定される音声検出時間（フェードイン時間）および保持時間（フェードアウト時間）を、発話者の発話スピードに応じて変更させるか、発話者の発話スピードに拘わらず所定の値に設定するかをユーザの好みにより変更することができる。このため、ユーザの使用状況や好みに応じて、最適な音声検出時間（フェードイン時間）および保持時間（フェードアウト時間）を設定することが可能となる。特に、固定モードの場合において、音声検出時間（フェードイン時間）および保持時間（フェードアウト時間）をユーザの好みで適宜設定することが可能な構成とすることにより、ユーザのニーズに細かく対応することが可能となる。
【００１８】
また、上述した自動音量制御装置において、前記音声信号抽出手段は、前記マイクにより集音された前記音声信号に対して音声帯域成分に対応する第１の帯域制限処理を行った後にＮＬＭＳ適応アルゴリズムを適用することにより音声帯域に係る音声信号を抽出するアレイマイク手段と、アレイマイク手段において抽出された音声帯域に係る前記音声信号に対して、音声帯域成分に対応する第２の帯域制限処理を行った後に、前記音楽信号のチャンネル数に対応させてカスケード接続される適応フィルタを用いて、前記第２の帯域制限処理が行われた音声信号に対して多段のＬＭＳ適応アルゴリズムを適用するオーディオキャンセラ手段とを備えるものであってもよい。
【００１９】
このように、アレイマイク手段においてＮＬＭＳ適応アルゴリズムを適用し、さらにオーディオキャンセラ手段において、音楽信号のチャンネル数に対応させてカスケード接続される適応フィルタを用いて多段的にＬＭＳ適応アルゴリズムを適用することにより、音声信号における音声信号成分以外の信号成分（ノイズ成分）を効果的かつ高い収束性を確保した上で低減させることができ、音声帯域における音声信号の検出精度の向上を図ることが可能となる。
【００２０】
また、上述した自動音量制御装置において、前記オーディオキャンセラ手段における第２の帯域制限処理の帯域制限幅は、前記アレイマイク手段における第１の帯域制限処理の帯域制限幅の上限値および下限値を含み、第１の帯域制限処理の帯域制限幅よりもわずかに広い帯域幅となるように設定されるものであってもよい。
【００２１】
このように、第２の帯域制限処理の帯域制限幅が、第１の帯域制限処理の帯域制限幅の上限値および下限値を含み、第１の帯域制限処理の帯域制限幅よりもわずかに広い帯域幅となるように設定されることにより、帯域制限のカットオフ周波数付近のオーディオキャンセル性能を向上させることが可能となる。
【００２２】
また、上述した自動音量制御装置において、前記音量制御手段は、前記音源の音量状態に応じて、前記音楽信号における出力レベルの低減量を変化させるものであってもよい。
【００２３】
このように、音源の音量状態に応じて、音楽信号における出力レベルの低減量を変化させることにより、音源の音量状態に応じて、音量制御を行うことができるので、適切に音楽信号の信号レベル（音量）を変化させることが可能となる。
【発明の効果】
【００２４】
本発明に係る自動音量制御装置によれば、音楽信号の出力レベルが、音声検出時に低減されるので、会話者の会話（発話）に応じて、自動的に音楽信号の信号レベルを低減させることができる。このため、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
【図面の簡単な説明】
【００２５】
【図１】本実施の形態に係る自動音量制御装置の概略構成を示したブロック図である。
【図２】本実施の形態に係るアレイマイク部の概略構成を示したブロック図である。
【図３】車両の室内にマイクおよびスピーカが設置された状態を示した図である。
【図４】本実施の形態に係るマイクＭ１およびマイクＭ２の指向性と、それぞれのマイクの指向性の違いにより求められる強調された指向性を視覚的に示した図である。
【図５】本実施の形態に係るオーディオキャンセラ部の概略構成を示したブロック図である。
【図６】本実施の形態に係るマイクで集音された音響信号（無指向性マイク）と、アレイマイク部の適応フィルタ部が適用された後の音響信号（アレイマイク部）と、オーディオキャンセラ部において第１適応フィルタ部が適用された後の音響信号（アレイマイク部＋オーディオキャンセラ部（Ｌ））と、第２適応フィルタ部が適用された後の音響信号（アレイマイク部＋オーディオキャンセラ部（Ｌ＋Ｒ））の周波数特性を示した図である。
【図７】（ａ）は、アレイマイク部の適応フィルタ部で適用されるフィルタ係数を示し、（ｂ）は、オーディオキャンセラ部の第１適応フィルタ部で適用されるフィルタ係数を示し、（ｃ）は、オーディオキャンセラ部の第２適応フィルタ部で適用されるフィルタ係数を示した図である。
【図８】本実施の形態に係る音量補正部の概略構成を示したブロック図である。
【図９】本実施の形態に係る３バンドバンドパスフィルタ部においてＬチャンネルの音楽信号Ｌ１を、低域、中域、高域の３つの帯域に周波数分割する処理に用いられる機能部を示したブロック図である。
【図１０】本実施の形態に係る３バンドバンドパスフィルタ部の第１ローパスフィルタ部および第２ローパスフィルタ部のフィルタ特性を示した図である。
【図１１】本実施の形態に係る最大値検出及び最大値ホールド部において、入力された信号に対して２ｍｓｅｃ毎の最大値検出を行い、さらに最大値を１６ｍｓｅｃだけホールドした状態を示した図である。
【図１２】本実施の形態に係るゲイン計算部の概略構成を示したブロック図である。
【図１３】本実施の形態に係る第１ルックアップテーブル部〜第３ルックアップテーブル部のレベル変換動作の一例を示した図である。
【図１４】本実施の形態に係るゲイン設定部の概略構成を示したブロック図である。
【図１５】本実施の形態に係る音量補正部の低域信号を基準として、最大値検出及び最大値ホールド部より出力される最大値ホールド信号（制御信号）と、ゲイン計算部の第１アタックリリースフィルタ部より出力される出力信号と、ゲイン計算部より出力される低域制御信号とを示した図である。
【図１６】本実施の形態に係る音量補正部の中域信号を基準として、最大値検出及び最大値ホールド部より出力される最大値ホールド信号（制御信号）と、ゲイン計算部の第２アタックリリースフィルタ部より出力される出力信号と、ゲイン計算部より出力される中域制御信号とを示した図である。
【図１７】音源の信号レベルが低い場合における図１５の内容を示した図である。
【図１８】（ａ）は、本実施の形態に係る音量補正部において音量補正が行われなかった場合の信号状態を示し、（ｂ）は、本実施の形態に係る音量補正部において音量補正が行われた場合の信号状態を示した図である。
【図１９】本実施の形態に係る音声分析部の概略構成を示したブロック図である。
【図２０】（ａ）は、本実施の形態に係る音源から出力される音楽信号を示し、（ｂ）は、本実施の形態に係るマイクから集音される音声信号を示し、（ｃ）は、本実施の形態に係る自動音量制御装置において音量制御が行われた後の音楽信号を示した図である。
【図２１】（ａ）は、図２０（ａ）に示す音楽信号と、図２０（ｂ）に示すような音声信号とが、マイクに入力された場合において、オーディオキャンセラ部より音声分析部へ入力された信号に対する音声分析値を示しており、（ｂ）は、同様の場合において、音声分析部より出力される音声分析ゲインを示している。
【図２２】本実施の形態に係る音声検出部の概略構成を示したブロック図である。
【図２３】図２０（ａ）に示すような音楽信号と、図２０（ｂ）に示すような音声信号とが、マイクに入力された場合における、音声検出スレッショルド部の入力信号（音声信号×音声分析ゲイン）と、音声検出スレッショルド部で設定される音声検出スレッショルドとを示した図である。
【図２４】本実施の形態に係るテンポ検出部の概略構成を示したブロック図である。
【図２５】（ａ）は、本実施の形態に係る音声検出スレッショルド部における音声検出スレッショルドの検出により２値化された音声検出信号を示し、（ｂ）は、２値化された音声検出信号に基づいて、テンポゲイン部より出力される信号を示し、（ｃ）は、本実施の形態に係るローパスフィルタ部において求められる積分値（積分出力）と、ゲインオフセット部により出力されるテンポ検出値とを示している。
【図２６】（ａ）は、固定モードにおいて本実施の形態に係る音声検出スレッショルド部より入力された音声検出信号を示し、（ｂ）は、適応アタックリリースフィルタ部における音声保持フィルタと音声保持スレッショルド部における音声保持スレッショルドとを示した図である。
【図２７】（ａ）は、図２６（ａ）（ｂ）に示した信号状態に基づいて求められた音声間隔検出値を示し、（ｂ）は、（ａ）に示した音声検出信号に対するアタックリリースフィルタ部の出力信号を示し、（ｃ）は、レベルリミッタ部における音量制御値を示している。
【図２８】本実施の形態に係る音量制御部の概略構成を示したブロック図である。
【図２９】本実施の形態に係るレベル計算部において、音量情報（ボリュームの調整量）の増減に対応して変化する音量制御レベルを複数種類示した図である。
【図３０】本実施の形態に係るテンポ検出部において、テンポ検出値に応じて決定されるアタック時間（音声検出時間）とリリース時間（保持時間）との関係を示した図である。
【図３１】（ａ）は、音声信号の検出状態において、音声速度が短く、音声間隔が非常に長い場合における音声検出信号の検出状態を示し、（ｂ）は、固定モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適用動作例を示し、（ｃ）は、可変モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適応動作例を示した図である。
【図３２】（ａ）は、音声信号の検出状態において、音声速度がやや短く、音声間隔がやや長い場合における音声検出値の検出状態を示し、（ｂ）は、固定モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適用動作例を示し、（ｃ）は、可変モードにおける適応アタックリリースフィルタ部の音声保持フィルタの適応動作例を示した図である。
【発明を実施するための形態】
【００２６】
以下、本発明に係る自動音量制御装置について、図面を用いて詳細に説明を行う。
【００２７】
図１は、本実施の形態に係る自動音量制御装置１の概略構成を示したブロック図である。なお、本実施の形態では、自動音量制御装置１が車両に設置される場合を一例として示して説明する。本発明に係る自動音量制御装置を車両に設置することにより、会話の有無に応じて、車載用オーディオ装置より出力される音楽の音量を自動的に低減させることが可能になる。
【００２８】
本実施の形態に係る自動音量制御装置１は、図１に示すように、アレイマイク部（アレイマイク手段、音声信号抽出手段）２と、オーディオキャンセラ部（オーディオキャンセラ手段、音声信号抽出手段）３と、音量補正部（音量補正手段）４と、メインボリューム部５と、音声分析部（音声分析手段）６と、音声検出部（音声検出手段）７と、音量制御部（音量制御手段）８と、パワーアンプ部９と、マイクＭ１，Ｍ２と、スピーカ１０ａ，１０ｂとにより概略構成されている。
【００２９】
［アレイマイク部］
図２は、アレイマイク部２の概略構成を示したブロック図である。アレイマイク部２は、図２に示すように、第１バンドパスフィルタ部２１と、第２バンドパスフィルタ部２２と、遅延部２３と、適応フィルタ部２４とを有している。
【００３０】
第１バンドパスフィルタ部２１および第２バンドパスフィルタ部２２は、マイクＭ１とマイクＭ２を介して入力される音響信号に対して４００Ｈｚ〜２．４ｋＨｚ程度の帯域制限を行う役割を有している。従って、第１バンドパスフィルタ部２１および第２バンドパスフィルタ部２２を通過する音響信号は、マイクＭ１，Ｍ２を介して入力される音響信号のうち音声帯域に対応する信号だけになる。
【００３１】
遅延部２３は、適応フィルタ部２４における信号の減算処理に対応させるべく、マイクＭ１側の音響信号の遅延を行う役割を有している。このため、遅延部２３は、第１バンドパスフィルタ部２１により帯域制限が行われたマイクＭ１の音響信号に対してのみ適用される。遅延部２３により遅延処理が行われた音響信号は、適応フィルタ部２４に入力される。
【００３２】
適応フィルタ部２４は、マイクＭ１より入力されて遅延部２３により遅延処理が行われた音響信号から、マイクＭ２より入力された音響信号の減算処理を行う。
【００３３】
適応フィルタ部２４は、ＦＩＲ（Finite Impulse Response Filter）部２５とＮＬＭＳ(Normalized Least Mean Square)部２６と、加算部２７とを有している。
【００３４】
ＦＩＲ部２５は、有限のインパルス応答フィルタを備えており、ＮＬＭＳ部２６によって行われる係数制御に基づいて、マイクＭ２で集音された音響信号に対してフィルタ処理を施す機能を有している。加算部２７は、ＦＩＲ部２５によりフィルタ処理が行われたマイクＭ２からの音響信号を、位相を反転させた状態で、遅延部２３により遅延処理が行われたマイクＭ１からの音響信号に対して加算する（実質的には、マイクＭ１の音響信号から、フィルタ処理が行われたマイクＭ２の音響信号を減算する）。加算部２７により加算処理された音響信号は、適応フィルタ部２４から出力されるとともに、ＮＬＭＳ部２６へ出力される。
【００３５】
ＮＬＭＳ部２６は、加算部２７より取得した音響信号（マイクＭ１の音響信号からフィルタ処理が行われたマイクＭ２の音響信号が減算された信号）と、マイクＭ２によって集音された音響信号とに基づいて、最小二乗アルゴリズムに基づいてＦＩＲ部２５におけるフィルタの係数制御を行う。このようにＮＬＭＳ部２６を適応フィルタ部２４に設けることによって、適応速度が入力信号の大きさに依存しないという特徴を備えたＮＬＭＳアルゴリズムを適用することが可能となる。
【００３６】
マイクＭ１とマイクＭ２とは、図３に示すように、車両２８の運転席２８ａおよび助手席２８ｂの上方位置に設けられたサンバイザーに設置されている。マイクＭ１およびマイクＭ２は、車両室内における会話を取得するために用いられるものであり、図４に示すように、マイクＭ１には、無指向性のマイクが用いられ、マイクＭ２には、単一指向性のマイクが用いられている。このようにして、無指向性のマイクＭ１により集音された音と、指向性を備えたマイクＭ２により集音された音とが、それぞれアレイマイク部２に入力される。
【００３７】
無指向性のマイクＭ１により集音された音と、指向性を備えたマイクＭ２により集音された音とが、それぞれアレイマイク部２に入力されると、アレイマイク部２の適応フィルタ部２４において、マイクＭ１の音響信号からマイクＭ２の音響信号が減算されるため、減算結果はマイクＭ２のヌル方向（マイクＭ２における指向範囲以外の方向）が残り、結果として、該当する方向の指向性が強調されることになる。
【００３８】
従って、指向性が強調される方向に発話者が位置するようにして、マイクＭ１とマイクＭ２とを設置することによって、発話者の音声を効果的に取得することが可能となる。このように発話者の音声を効果的に取得することにより、取得される音声が強調されることになるので、アレイマイク部２において求められる音響信号は、発話者の音声（希望信号Ｄ）と車載用オーディオ信号から出力される音楽（非希望信号Ｕ）との相対的な比率、すなわちＤ／Ｕが改善された信号となる。
【００３９】
なお、アレイマイク部２、マイクＭ１およびマイクＭ２の構成は、本実施の形態において説明した構成には限定されず、発話者の音声に対する指向性が強調されて、Ｄ／Ｕを改善することが可能な方式を実現するものであれば、異なる構成となるものであってもよい。
【００４０】
また、図３に示すように、車両２８にはスピーカが４カ所、具体的には、右フロントドア、左フロントドア、右リアドア、左リアドアの４カ所にそれぞれ設けられており、右フロントドアおよび右リアドアに設けられるスピーカ（このスピーカがスピーカ１０ａに該当する）からは、パワーアンプ部９において右側成分の音響効果が強調された音楽信号（右側音楽信号Ｒ５）が出力され、左フロントドアおよび左リアドアに設けられるスピーカ（このスピーカがスピーカ１０ｂに該当する）からは、パワーアンプ部９において左側成分の音響効果が強調された音楽信号（左側音楽信号Ｌ５）が出力される。
【００４１】
［オーディオキャンセラ部］
次に、オーディオキャンセラ部３について説明を行う。図５は、オーディオキャンセラ部３の概略構成を示したブロック図である。オーディオキャンセラ部３は、図５に示すように、第１バンドパスフィルタ部３１と、第２バンドパスフィルタ部３２と、第１遅延部３３と、第２遅延部３４と、第１適応フィルタ部３５と、第２適応フィルタ部３６とを有している。
【００４２】
第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２は、音量補正部４を通過した２チャンネルの音楽信号、すなわち左側の音楽信号Ｌ２および右側の音楽信号Ｒ２において、２００Ｈｚ〜２．６ｋＨｚ程度の帯域制限を行うことにより、音響信号のうち主に音声帯域の信号のみを通過させる役割を有している。
【００４３】
なお、オーディオキャンセラ部３では、第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２において設定される帯域制限幅（２００Ｈｚ〜２．６ｋＨｚ程度）を、アレイマイク部２の第１バンドパスフィルタ部２１および第２バンドパスフィルタ部２２で設定される帯域制限幅（４００Ｈｚ〜２．４ｋＨｚ程度）よりも広い帯域幅（但し、４００Ｈｚ〜２．４ｋＨｚを含む）に設定することにより、アレイマイク部２の帯域制限のカットオフ付近、すなわち４００Ｈｚや２．４ｋＨｚにおけるオーディオキャンセル性能の向上を図っている。
【００４４】
第１遅延部３３および第２遅延部３４は、第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２により帯域制限処理が行われた音響信号に対して遅延処理を施す役割を有している。第１遅延部３３および第２遅延部３４による遅延処理によって、アレイマイク部２を通して入力される音響信号の伝搬遅延の補正を行うことが可能となる。
【００４５】
第１適応フィルタ部３５は、第１ＦＩＲ部３７、第１ＬＭＳ部３９、第１加算部４１により概略構成されており、第２適応フィルタ部３６は、第２ＦＩＲ部３８、第２ＬＭＳ部４０、第２加算部４２により概略構成されている。第１適応フィルタ部３５および第２適応フィルタ部３６は、アレイマイク部２の適応フィルタ部２４におけるＮＬＭＳ部２６を第１ＬＭＳ部３９および第２ＬＭＳ部４０に置き換えた構成に該当する。
【００４６】
第１適応フィルタ部３５および第２適応フィルタ部３６では、第１ＬＭＳ部３９および第２ＬＭＳ部４０において、一般的なＬＭＳ(Least Mean Square)アルゴリズムを用いることによって、アレイマイク部２から入力される音響信号から、音量補正部４によって音量補正が行われた音楽信号Ｌ２および音楽信号Ｒ２を順番に減算する処理を行う。具体的な第１適応フィルタ部３５および第２適応フィルタ部３６の構成については、図２に示すように、アレイマイク部２の適応フィルタ部２４と同様の構成であるため、ここでの詳細な説明を省略する。
【００４７】
なお、オーディオキャンセラ部３では、図５に示すように、第１適応フィルタ部３５および第２適応フィルタ部３６がカスケード接続されている。従って、オーディオキャンセラ部３では、第１適応フィルタ部３５においてアレイマイク部２から入力された音響信号を音楽信号Ｌ２で減算処理した後に、第２適応フィルタ部３６において第１適応フィルタ部３５で減算処理された音響信号を音楽信号Ｒ２で減算処理する構成となっている。この場合において、第１適応フィルタ部３５は第２適応フィルタ部３６よりも早く収束させることが必要となるため、適応速度を大きく設定している。なお、音源が２チャンネル以上ある場合は、チャンネル数に応じて適応フィルタ部の設置数を増加することにより同様の効果を奏することが可能である。
【００４８】
図６は、図３に示すような車両２８において、マイクＭ１により集音された音響信号の周波数特性と、アレイマイク部２およびオーディオキャンセラ部３を動作させた場合における適応フィルタ部２４、第１適応フィルタ部３５および第２適応フィルタ部３６の出力信号の周波数特性を示した図である。具体的に図６には、アレイマイク部２の適応フィルタ部２４を適用させる前のマイクＭ１の音響信号（図６において「無指向性マイク」で示すグラフ）と、アレイマイク部２の適応フィルタ部２４が適用された後の音響信号（図６において「アレイマイク部」で示すグラフ）と、オーディオキャンセラ部３において第１適応フィルタ部３５を適用した後の音響信号（図６において「アレイマイク部＋オーディオキャンセラ部（Ｌ）」で示すグラフ）と、オーディオキャンセラ部３において第２適応フィルタ部３６を適用した後の音響信号（図６において「アレイマイク部＋オーディオキャンセラ部（Ｌ＋Ｒ）」で示すグラフ）とが示されている。
【００４９】
なお、図６に示す場合において、車載用オーディオ装置より出力される音楽信号Ｌ１および音楽信号Ｒ１には長周期のＭ系列信号が用いられ、音楽信号Ｌ１と音楽信号Ｒ１とは無相関な信号となっている。また、図７（ａ）は、アレイマイク部２の適応フィルタ部２４で適用されるフィルタ係数を示し、図７（ｂ）は、オーディオキャンセラ部３の第１適応フィルタ部３５で適用されるフィルタ係数を示し、図７（ｃ）は、オーディオキャンセラ部３の第２適応フィルタ部３６で適用されるフィルタ係数を示している。具体的には、アレイマイク部２の適応フィルタ部２４におけるＦＩＲ部２５のＦＩＲフィルタ長は１２８ｔａｐ、オーディオキャンセラ部３の第１適応フィルタ部３５におけるＦＩＲフィルタ長および第２適応フィルタ部３６のＦＩＲフィルタ長は、それぞれ１９２ｔａｐ、また、各ＦＩＲ部におけるサンプリング周波数は６ｋＨｚに設定されている。
【００５０】
それぞれの適応フィルタ部２４、３５、３６を適用する前後の周波数特性を比較すると、図６に示すように、無指向性マイクＭ１の出力信号レベルに対して、アレイマイク部２における出力信号レベルは、出力値が約１０ｄＢ程度減衰している。さらに、オーディオキャンセラ部３の第１適応フィルタ部３５の出力レベルでは、アレイマイク部２における出力信号レベルに対して、約８ｄＢ程度減衰し、さらに第２適応フィルタ部３６における出力信号レベルでは、第１適応フィルタ部３５の出力レベルに対して約１１ｄＢ程度減衰している。
【００５１】
このように、適応フィルタ部２４を適用するまでの信号レベルに比べて、適応フィルタ部２４、第１適応フィルタ部３５および第２適応フィルタ部３６を全て適用した後の信号レベルは、トータルで３０ｄＢ近く出力値が減衰しており、結果としてＤ／Ｕが大きく改善されている。なお、図７（ａ）〜（ｃ）に示す各適応フィルタのフィルタ係数においては、ＦＩＲフィルタの応答が続いていることから、フィルタタップ長をより長くすることにより、さらなるＤ／Ｕの改善を期待することができる。
【００５２】
［音量補正部］
次に、音量補正部４について説明を行う。図８は、音量補正部４の概略構成を示したブロック図である。音量補正部４は、図８に示すように、３バンドバンドパスフィルタ部５１と、最大値検出及び最大値ホールド部５２と、ゲイン計算部５３と、遅延部５４と、ゲイン設定部５５とを有している。
【００５３】
３バンドバンドパスフィルタ部５１は、車載用オーディオ信号より出力されるＬチャンネルの音楽信号Ｌ１およびＲチャンネルの音楽信号Ｒ１を、それぞれ低域、中域、高域の３つの帯域に周波数分割を行う役割を有している。
【００５４】
図９は、３バンドバンドパスフィルタ部５１においてＬチャンネルの音楽信号Ｌ１を、低域、中域、高域の３つの帯域に周波数分割する処理に用いられる機能部を示したブロック図である。３バンドバンドパスフィルタ部５１の音楽信号Ｌ１を周波数分割するための機能部は、第１ローパスフィルタ部５６と、第２ローパスフィルタ部５７と、遅延部５８と、２つの加算部５９、６０とで概略構成されている。なお、図９には、便宜上、Ｌチャンネルの音楽信号Ｌ１を周波数分割するための３バンドバンドパスフィルタ部５１の機能部だけが示されているが、実際の３バンドバンドパスフィルタ部５１は、図９に示したＬチャンネルの音楽信号Ｌ１を周波数分割するための構成だけでなく、Ｒチャンネルの音楽信号Ｒ１を周波数分割するための構成をも備えている。
【００５５】
第１ローパスフィルタ部５６と第２ローパスフィルタ部５７とは、ＦＩＲ型のローパスフィルタで構成されており、第１ローパスフィルタ部５６および第２ローパスフィルタ部５７のそれぞれは、図１０に示すようなフィルタ特性を備えている。本実施の形態では、サンプリング周波数を４８ｋＨｚに設定し、第１ローパスフィルタ部５６のフィルタ特性は、ＦＩＲフィルタ長が１２８ｔａｐでカットオフ周波数が４００Ｈｚ、第２ローパスフィルタ部５７のフィルタ特性は、ＦＩＲフィルタ長が１２８ｔａｐでカットオフ周波数が４ｋＨｚに設定されている。また、遅延部５８は、第１ローパスフィルタ部５６および第２ローパスフィルタ部５７の適用による遅延の調整を図るために設けられるものであり、遅延部５８は、第１ローパスフィルタ部５６および第２ローパスフィルタ部５７のフィルタ長の半分の６４ｔａｐに設定される。
【００５６】
図９に示す構成に基づいて、遅延部５８で遅延処理を施した音楽信号（全帯域（ＡＬＬ）の信号）に対して、加算部６０において、第２ローパスフィルタ部５７からの出力信号を減算することにより、４ｋＨｚ〜２４ｋＨｚの高域信号（Ｈｉｇｈ）が生成される。また、第２ローパスフィルタ部５７からの出力信号に対して、加算部５９において、第１ローパスフィルタ部５６からの出力信号（低域信号）を減算することにより、中域信号（Ｍｉｄ）が生成される。また、第１ローパスフィルタ部５６におけるフィルタ処理により、低域信号（Ｌｏｗ）が生成され、さらに、遅延部５８において遅延処理が行われた全帯域の信号が生成される。従って、３バンドバンドパスフィルタ部５１において入力されたＬチャンネルの音楽信号Ｌ１は、低域の音楽信号と、中域の音楽信号と、高域の音楽信号と、全帯域の音楽信号とに分離されて出力されることになる。
【００５７】
なお、上述したように、３バンドバンドパスフィルタ部５１は、音楽信号Ｌ１（Ｌチャンネル）用の構成だけでなく、音楽信号Ｒ１（Ｒチャンネル）用の構成を合わせた機能部を備えているため、上述したようなＬチャンネル側のみの動作だけでなく、Ｒチャンネル側でも同様の動作が行われる。
【００５８】
最大値検出及び最大値ホールド部５２は、３バンドバンドパスフィルタ部５１からの音楽信号Ｌ１（Ｌチャンネル）用および音楽信号Ｒ１（Ｒチャンネル）用の全帯域の音楽信号（ＡＬＬ）の合成を行った後、所定区間の最大値の検出を行い、さらに最大値を所定時間ホールドし、制御信号（最大値ホールド信号）として出力する役割を有している。
【００５９】
本実施の形態では、所定区間を２ｍｓｅｃに設定し、ホールド時間を所定区間の８倍とする。本実施の形態では、図１１に示すように、サンプリング周波数が４８ｋＨｚであり、９６サンプルの区間の最大値を算出して２ｍｓｅｃ毎に出力し、最大で３２ｍｓｅｃの保持（ホールド）を行う。
【００６０】
次に、ゲイン計算部５３について説明を行う。図１２はゲイン計算部５３の概略構成を示したブロック図である。ゲイン計算部５３は、図１２に示すように、第１アタックリリースフィルタ部６３と、第２アタックリリースフィルタ部６４と、第３アタックリリースフィルタ部６５と、第１ルックアップテーブル部６７と、第２ルックアップテーブル部６８と、第３ルックアップテーブル部６９と、第１ローパスフィルタ部７１と、第２ローパスフィルタ部７２と、第３ローパスフィルタ部７３とを有している。
【００６１】
第１アタックリリースフィルタ部６３〜第３アタックリリースフィルタ部６５は、最大値検出及び最大値ホールド部５２より受信した制御信号の応答速度を設定する役割を有しており、応答速度の設定方法として、具体的には、アタック時間とリリース時間とによる設定が行われる。なお、アタック時間とリリース時間とは、任意に設定することが可能となっており、本実施の形態では、高域信号および低域信号用のアタック時間およびリリース時間よりも、中域信号用のアタック時間およびリリース時間の方が設定時間が長くなるように（制御速度が遅くなるように）設定されている。
【００６２】
第１ルックアップテーブル部６７〜第３ルックアップテーブル部６９は、最大値検出及び最大値ホールド部５２より受信した制御信号のレベル変換を行う役割を有しており、入力された入力信号を一定の出力値にレベル変換した後に、出力信号として出力する。
【００６３】
図１３は、本実施の形態に係る第１ルックアップテーブル部６７〜第３ルックアップテーブル部６９のレベル変換動作の一例を示した図である。最大値検出及び最大値ホールド部５２より受信した入力信号（制御信号）の信号レベルが−３０ｄＢ〜０ｄＢの場合には、第１ルックアップテーブル部６７において出力レベルが−１６ｄＢ（低域制御信号）に制御され、第２ルックアップテーブル部６８において出力レベルが−２０ｄＢ（中域制御信号）に制御され、さらに、第３ルックアップテーブル部６９において出力レベルが−１８ｄＢ（高域制御信号）に制御される。また、最大値検出及び最大値ホールド部５２より受信した入力信号（制御信号）の信号レベルが−３０ｄＢ以下の場合には、第１ルックアップテーブル部６７〜第３ルックアップテーブル部６９において、入力された制御信号に対して所定のゲインを保持したまま減衰するように出力レベルの設定が行われる。
【００６４】
このように、入力信号（制御信号）の信号レベルが−３０ｄＢ〜０ｄＢの場合において、低域制御信号、中域制御信号および高域制御信号のそれぞれの出力信号の信号レベルが一定の値に変換され、−３０ｄＢ以下の場合には、入力信号に対応するようにして出力信号の値が減衰するので、音量の変動感が低減されて違和感がなくなり、一定の振幅になるように音量の補正を行うことが可能となる。
【００６５】
なお、第１ルックアップテーブル部６７〜第３ルックアップテーブル部６９におけるレベル変換の内容は、図１３に示した入力信号と出力信号との関係には限定されず、図１３に示した関係とは異なるレベル変換に基づいて出力レベルの変換を行ってもよい
【００６６】
第１ローパスフィルタ部７１〜第３ローパスフィルタ部７３は、第１ルックアップテーブル部６７〜第３ルックアップテーブル部６９より受信したそれぞれの制御信号（低域制御信号、中域制御信号、高域制御信号）の平滑化処理を行う役割を有しており、平滑化された制御信号（低域制御信号２、中域制御信号２、高域制御信号２）は、ゲイン計算部５３からゲイン設定部５５へと出力される。
【００６７】
遅延部５４は、３バンドバンドパスフィルタ部５１において低域、中域、高域の３つの帯域に周波数分割されたＬチャンネルおよびＲチャンネルの信号（ＬチャンネルおよびＲチャンネルの低域信号、中域信号、高域信号）に対して遅延処理を施す役割を有している。遅延部５４による遅延処理により、ゲイン計算部５３の第１アタックリリースフィルタ部６３〜第３アタックリリースフィルタ部６５におけるアタック時間に対する遅延補正を行うことが可能となる。
【００６８】
ゲイン設定部５５は、遅延部５４において遅延処理が施されたＬチャンネルおよびＲチャンネルの信号（ＬチャンネルおよびＲチャンネルの低域信号、中域信号、高域信号）に対して、ゲイン計算部５３よりゲイン設定部５５に向けて出力された制御信号（低域制御信号２、中域制御信号２、高域制御信号２）を合成することにより振幅が一定になるように補正を行う役割を有している。
【００６９】
図１４は、ゲイン設定部５５の概略構成を示したブロック図である。ゲイン設定部５５は、図１４に示すように、低域信号に対して低域制御信号２を乗算する乗算部７４ａと、中域信号に対して中域制御信号２を乗算する乗算部７４ｂと、高域信号に対して高域制御信号２を乗算する乗算部７４ｃと、乗算部７４ａ〜７４ｃにおいてそれぞれの制御信号が乗算された信号を足し合わせる加算部７４ｄとを有しており、加算部７４ｄにおいて足し合わされた信号は、音楽信号Ｌ２としてメインボリューム部５およびオーディオキャンセラ部３に対して出力される。なお、図１４には、便宜上、Ｌチャンネル側の構成（乗算部７４ａ〜７４ｃおよび加算部７４ｄ）のみしか示されていないが、ゲイン設定部５５は、Ｌチャンネル側の構成に対応したＲチャンネル側の構成を備えており、ＬチャンネルだけでなくＲチャンネルの信号に対しても各制御信号を乗算・加算することにより、音楽信号Ｒ２の出力を行っている。
【００７０】
図１５は、音量補正部４における低域信号を基準として、最大値検出及び最大値ホールド部５２より出力される最大値ホールド信号（制御信号）と、ゲイン計算部５３の第１アタックリリースフィルタ部６３より出力される出力信号（低域制御信号）と、ゲイン計算部５３より出力される（第１ローパスフィルタ部７１より出力された）低域制御信号２とを示した図であり、図１６は、音量補正部４における中域信号を基準として、最大値検出及び最大値ホールド部５２より出力される最大値ホールド信号（制御信号）と、ゲイン計算部５３の第２アタックリリースフィルタ部６４より出力される出力信号（中域制御信号）と、ゲイン計算部５３より出力される（第２ローパスフィルタ部７２より出力された）中域制御信号２とを示した図である。
【００７１】
なお、図１５示した低域信号に対する第１アタックリリースフィルタ部６３でのアタック時間とリリース時間との設定値として、アタック時間として１０ｍｓｅｃ、リリース時間として０．５ｓｅｃが設定されている。なお、高域信号の場合における第３アタックリリースフィルタ部６５でのアタック時間とリリース時間との設定は、第１アタックリリースフィルタ部６３の場合（低域信号の場合）と同様に、アタック時間として１０ｍｓｅｃ、リリース時間として０．５ｓｅｃが設定される。
【００７２】
一方で、図１６示した中域信号に対する第２アタックリリースフィルタ部６４でのアタック時間とリリース時間との設定は、アタック時間として２ｓｅｃ、リリース時間として２ｓｅｃが設定されている。このように、中域信号における制御速度を遅くすることにより、聴覚的に敏感に聴取される（聞き取りやすい）音楽のボーカル（音声）領域（主として中域音）の音量の変動感が低減されて違和感がなくなり、一定の振幅になるような音量の補正を行うことが可能となる。
【００７３】
なお、図１５および図１６に示した図は、比較的音源の信号レベルが高い場合を例として示している。一方で、音源の信号レベルが低い場合における低域信号（あるいは高域信号）は、図１７のように示される。音源の信号レベルが低い場合には、図１７に示すように、第１ルックアップテーブル部６７〜第３ルックアップテーブル部６９において出力信号の値が入力信号よりも高い値にレベル変換されるため、ゲイン計算部５３より出力される制御信号が０ｄＢ以上となり、音量が積極的に増加されることになる。
【００７４】
図１８（ａ）は、音量補正部４において音量補正が行われなかった場合の信号状態を示し、図１８（ｂ）は、音量補正部４において音量補正が行われた場合の信号状態を示した図である。図１８（ａ）と図１８（ｂ）とを比較すると、音量補正が行われなかった場合（図１８（ａ））に比べて、音量補正が行われた場合（図１８（ｂ））には、大きな振幅の音源に対しては信号レベルが小さく制御され、小さな振幅の音源に対しては信号レベルが大きくなるように制御されていることがわかる。
【００７５】
このように、音量補正部４において音量補正を行うことによって、音量の変動感が低減されて違和感がなくなり、一定の振幅になるように音量の補正を行うことができる。なお、本実施の形態では適用しなかったが、音量補正部４における音量補正において、リミッタを組み合わせて適応することにより、さらなる振幅の一定化を図ることが可能である。
【００７６】
［メインボリューム部］
メインボリューム部５は、搭乗者などにより設定された音量（音量調節スイッチの操作量）に応じて、音量補正部４により音量補正が行われた音楽信号の音量調整を行う役割を有している。
【００７７】
メインボリューム部５による音量調整は、車載用オーディオ装置において設定される音量に連動して、あるいは、車載用オーディオ装置とは別に設けられるボリュームスイッチの設定に基づいて行われる。また、メインボリューム部５において行われる音量調整に関する情報（以下、音量情報という）は、音声検出部７へ出力される。
【００７８】
［音声分析部］
次に、音声分析部６について説明を行う。図１９は、音声分析部６の概略構成を示したブロック図である。音声分析部６は、図１９に示すように、実効値検出部７５と、標準偏差検出部７６と、平均部７７と、第１移動平均部７８と、第２移動平均部７９と、除算部８０と、レベル変換部８１とを有している。
【００７９】
実効値検出部７５は、オーディオキャンセラ部３の出力信号において、所定区間の実効値の検出を行う役割を有している。また、標準偏差検出部７６は、実効値検出部７５で実効値検出が行われた信号に対して、所定区間の標準偏差を検出する役割を有し、さらに、平均部７７は、実効値検出部７５で実効値検出が行われた信号に対して平均値の検出を行う役割を有している。
【００８０】
第１移動平均部７８および第２移動平均部７９は、入力された信号の所定区間の移動平均をとる役割を有しており、除算部８０は、第１移動平均部７８において移動平均された標準偏差を、第２移動平均部７９において移動平均された平均値で除算することにより、音声分析値を算出する役割を有している。
【００８１】
レベル変換部８１は、除算部８０において算出された音声分析値に対して、ゲインとオフセットを設定することにより音声分析ゲインとして出力する役割を有している。ここで、ゲインとオフセットは、音声検出部７の音声検出において、音声分析の重み付けを設定するものである。
【００８２】
図２１（ａ）は、図２０（ａ）に示すような音楽信号（図２０（ａ）には便宜上、Ｌチャンネルの音楽信号しか示していないが、実際にはＲチャンネルの音楽信号も存在する）と、図２０（ｂ）に示すような音声信号とが、マイクＭ１およびマイクＭ２に入力された場合において、オーディオキャンセラ部３より音声分析部６へ入力された信号に対する音声分析値を示しており、図２１（ｂ）は、同様の音楽信号（図２０（ａ））および音声信号（図２０（ｂ））がマイクＭ１およびマイクＭ２に入力された場合において、音声分析部６のレベル変換部８１より出力される出力信号（音声分析ゲイン）を示している。
【００８３】
なお、図２１（ａ）（ｂ）に示す状態において、音声分析部６でのサンプリング周波数は６ｋＨｚ、実効値検出部７５における実効値の検出区間は２．７ｍｓｅｃ、標準偏差検出部７６の標準偏差と平均部７７の平均値との検出区間は約３４０ｍｓｅｃ、第１移動平均部７８と第２移動平均部７９との移動平均区間は、約２．７ｓｅｃに設定されている。
【００８４】
図２１（ａ）に示す音声分析値を、図２０（ａ）に示す音楽信号の状態および図２０（ｂ）に示す音声信号の状態と対比させつつ観察すると、図２０（ｂ）において音声信号が検出された区間に対応する図２１（ａ）の区間（例えば、図２１（ａ）に矢印で示した区間）では、音声の存在を示すように音声分析値が増加して示されており、音声の検出を確認することができる。
【００８５】
一方で、図２１（ｂ）に示す音声分析ゲインは、図２１（ａ）に示す音声分析値に対して、ゲインを０．５、オフセットを１に設定したものであり、この音声分析ゲインの値が、次述する音声検出部７における音声検出の重み付けとなって利用される。
【００８６】
［音声検出部］
次に、音声検出部７について説明する。図２２は、音声検出部７の概略構成を示したブロック図である。音声検出部７は、実効値検出部８５と、移動平均部８６と、音声分析ゲイン乗算部８７と、音声検出スレッショルド部８８と、適応アタックリリースフィルタ部８９（適応アタックリリースフィルタ手段）と、テンポ検出部（テンポ検出手段）９０と、音声保持スレッショルド部９１とを有している。
【００８７】
実効値検出部８５は、オーディオキャンセラ部３の出力信号において所定区間の実効値の検出を行う役割を有している。移動平均部８６は、実効値検出部８５において実効値の検出が行われた信号に対して、所定区間の移動平均を求める役割を有している。音声分析ゲイン乗算部８７は、音声分析部６より入力された音声分析ゲインと、実効値検出部８５において移動平均が求められた信号との乗算を行う役割を有している。
【００８８】
音声検出スレッショルド部８８は、あらかじめ設定された音声検出スレッショルド（閾値）に基づいて、音声信号の検出を行う役割を有している。なお、音声検出スレッショルド部８８における音声検出スレッショルドの値は、メインボリューム部５より入力される音量情報に応じて変化する構成となっており、例えば、メインボリューム部５の音量が５ｄＢアップすると、音声検出スレッショルドも連動して５ｄＢアップすることになる。
【００８９】
図２３は、図２０（ａ）に示すような音楽信号（Ｌチャンネルの音楽信号だけでなく、Ｒチャンネルの音楽信号も含む）と図２０（ｂ）に示すような音声信号とが、マイクＭ１およびＭ２から入力された場合における、音声検出スレッショルド部８８の入力信号（音声信号×音声分析ゲイン）と、音声検出スレッショルド部８８において設定される音声検出スレッショルドとを示している。
【００９０】
図２３に示す状況において、音声検出部７でのサンプリング周波数は６ｋＨｚ、実効値検出部８５における実効値の検出区間は約２１ｍｓｅｃ、移動平均部８６における移動平均区間は約４２ｍｓｅｃに設定されている。図２３をみると、アレイマイク部２とオーディオキャンセラ部３において、Ｄ／Ｕが大きく改善されることにより音声信号が強調され、さらに音声分析部６より入力された音声分析ゲインによって音声検出部分が顕在化（強調）されているので、音声検出スレッショルドの検出が容易になっている。なお、音量補正部４における音量補正処理により、大きな振幅の音源に対しては信号レベルが小さくなるように制御され、小さな振幅の音源に対しては信号レベルが大きくなるように制御されて、振幅の一定化が図られているので、音源のソースやジャンルに依存することなく、音声検出スレッショルドを設定できることが可能になっている。
【００９１】
テンポ検出部９０は、発話者の発話スピード（音声信号の入力スピード）に応じて、次述する適応アタックリリースフィルタ部８９における音声検出時間と保持時間とを変化させる役割を有している。このように発話者の発話スピードに応じて検出精度を調整することにより最適な音量制御を行うことが可能となる。
【００９２】
図２４は、テンポ検出部９０の概略構成を示したブロック図である。テンポ検出部９０は、図２４に示すように、スレッショルドクロッシング検出部９４と、クロッシングゲイン部９５と、移動平均部９６と、乗算部９７と、テンポゲイン部９８と、ローパスフィルタ部９９と、ゲインオフセット部１００とを有している。
【００９３】
スレッショルドクロッシング検出部９４は、音声検出スレッショルド部８８で音声検出スレッショルドに基づいて検出された音声検出信号に対して、所定区間を１サンプルずつシフトしながらパルス数を検出する役割を有している。クロッシングゲイン部９５は、スレッショルドクロッシング検出部９４において検出されたパルス数の重み付けを行う役割を有している。移動平均部９６は、音声検出スレッショルド部８８で音声検出スレッショルドに基づいて検出された音声検出信号に対して、所定区間の移動平均を求める役割を有しており、乗算部９７は、クロッシングゲイン部９５の出力と移動平均部９６の出力との乗算を行う役割を有している。
【００９４】
テンポゲイン部９８は、乗算部９７において乗算処理された出力の重み付けを行う役割を有しており、ローパスフィルタ部９９では乗算部９７において重み付けされた出力信号（つまりローパスフィルタ部９９に入力される信号）における所定時間の変化状態を、積分値を用いて求める処理（積分処理）を行う役割を有し、さらに、ゲインオフセット部１００は、ゲインのオフセット処理と丸め処理とを行い、テンポ検出値を出力する役割を有している。ここで、ローパスフィルタ部９９の積分処理には、１次のＩＩＲ（Infinite Impulse Response）フィルタを用いるものとし、さらに、外部からリセット信号が入力された場合には、積分処理により求められていた積分値をクリアすることが可能となっている。このように、積分処理により求められる積分値をリセット信号に応じてクリアにすることにより、音量制御における学習機能を実現することが可能となっている。
【００９５】
テンポ検出部９０の動作例を、図２５（ｃ）に示す。図２５（ａ）は、音声検出スレッショルド部８８における音声検出スレッショルドの検出により２値化された音声検出信号を示し、図２５（ｂ）は、２値化された音声検出信号に基づいて、テンポゲイン部９８より出力される信号を示し、図２５（ｃ）は、ローパスフィルタ部９９において求められる積分値（積分出力）と、ゲインオフセット部１００により出力されるテンポ検出値とを示している。
【００９６】
なお、本実施の形態に係るテンポ検出部９０では、クロッシングゲイン部９５においてパルスを検出する所定区間を約１ｓｅｃとし、移動平均部９６における移動平均の区間を約１ｓｅｃとし、クロッシングゲイン部９５におけるクロッシングゲインを０．５とし、テンポゲイン部９８におけるテンポゲインを２０とし、ローパスフィルタ部９９におけるフィルタの正規化カットオフ周波数を０．０００２とし、さらに、ゲインオフセット部１００におけるゲインオフセットを１として設定する。図２５（ａ）〜図２５（ｃ）を検討すると、図２５（ａ）に示す音声検出信号に応じて、図２５（ｃ）に示すテンポ検出値が変化していることが理解できる。
【００９７】
なお、リセット信号は、どのようなタイミングで入力されるものであってもよく、例えば、車の搭乗者の人数やメンバーが変わり、変わる前の会話状態に変化が生じそうな場合において、搭乗者が操作スイッチなどを操作してリセット（リセット信号の出力を）するものであってもよく、または、車の始動毎（エンジンを始動する毎）にリセットされるものであってもよい。
【００９８】
次に、適応アタックリリースフィルタ部８９について説明する。適応アタックリリースフィルタ部８９は、マイクＭ１、Ｍ２において検出された音声信号に基づいて、会話の開始時にアタック時間を設定し、会話の終了時にリリース時間を設定する役割を有している。適応アタックリリースフィルタ部８９は、テンポ検出部９０において求められるテンポ検出値に応じて適応アタックリリースフィルタ部８９において設定されるアタック時間とリリース時間、すなわち音声検出時間と保持時間を可変にする「可変モード」と、テンポ検出部９０において求められるテンポ検出値に依存することなく、音声検出時間と保持時間を固定値にする「固定モード」との２つのモードを備えている。
【００９９】
まず、固定モードの場合について説明し、可変モードについては後に説明する。
【０１００】
図２６（ａ）は、固定モードにおいて、音声検出スレッショルド部８８より入力された音声検出信号を示し、図２６（ｂ）は、適応アタックリリースフィルタ部８９における音声保持フィルタの適用動作例を示した図である。図２６（ｂ）に示す場合は、アタック時間とリリース時間とが固定された場合（固定モード）示しており、具体的には、アタック時間は０．２ｓｅｃに固定され、リリース時間は４ｓｅｃに固定されている。従って、音声信号を検出した場合には音声保持フィルタの適用により、０．２ｓｅｃで信号出力値が上昇し、音声信号の検出が終了した場合には、４ｓｅｃの時間をかけて信号出力が低減される。
【０１０１】
音声保持スレッショルド部９１は、あらかじめ設定された音声保持スレッショルド（閾値）に基づいて、音声間隔時間の検出を行う役割を有している。図２６（ｂ）には、音声保持スレッショルド部９１において設定される音声保持スレッショルド値が示されており、本実施の形態では０．３に設定されている。
【０１０２】
固定モードでは、上述したように、音声検出スレッショルド部８８の音声検出スレッショルド検出に基づいて、図２６（ａ）に示すような２値化された音声検出信号が適応アタックリリースフィルタ部８９に入力されると、適応アタックリリースフィルタ部８９では、音声検出信号に対してアタック時間とリリース時間とを適用する。そして、アタック時間とリリース時間とが適用された音声検出信号（音声保持フィルタ）のうち、音声保持スレッショルド部９１において設定される音声保持スレッショルド値を超える時間が、音声間隔時間（音声検出と保持時間）として、音声保持スレッショルド部９１により求められる。図２７（ａ）は、図２６（ａ）（ｂ）の信号状態に基づいて求められた音声間隔時間（音声間隔検出値）である。なお、上述したように、適応アタックリリースフィルタ部８９が可変モードの場合については後述する。
【０１０３】
［音量制御部］
次に、音量制御部８について説明する。図２８は、音量制御部８の概略構成を示したブロック図である。音量制御部８は、図２８に示すように、アタックリリースフィルタ部１０１と、レベルリミッタ部１０２と、レベル計算部１０３と、乗算部１０４、１０５とを有している。
【０１０４】
アタックリリースフィルタ部１０１は音声検出部７において検出された音声間隔時間に基づいて、再生している音楽のフェードイン時間とフェードアウト時間の設定を行う役割を有している。
【０１０５】
レベル計算部１０３は、メインボリューム部５より入力される音量情報に応じて、レベルリミッタ部１０２に対する音量の制御量を計算する役割を有している。具体的に、本実施の形態に係るレベル計算部１０３では、図２９に示すように、音量情報（ボリュームの調整量）の増減に対応して変化する音量制御レベルの変化を、聴取者の好みに応じて複数種類（図２９においては、一例として４種類示されている）の中から設定することが可能となっている。このように音量情報（ボリュームの調整量）に対する音量制御レベルの変化状態が任意に選択され、選択された変化状態に基づいて、レベル計算部１０３では、メインボリューム部５からの音量情報に対応する音量制御レベルを決定する。
【０１０６】
また、レベルリミッタ部１０２は、レベル計算部１０３において求められた音量制御レベルに基づいて、アタックリリースフィルタ部１０１の出力信号に対する調整処理を行う役割を有している。
【０１０７】
図２７（ｂ）は、（ａ）に示すような音声検出信号（音声間隔時間）における、アタックリリースフィルタ部１０１の出力信号の変化状態を示し、図２７（ｃ）は、レベルリミッタ部１０２における出力信号（音量制御値）の変化を示している。なお、本実施の形態では、アタックリリースフィルタ部１０１のアタック時間を０．１ｓｅｃに設定し、リリース時間を５．０ｓｅｃに設定し、音量制御量を２４ｄＢ（リニアでは０．０６３１）に設定している。また、アタックリリースフィルタ部１０１において設定されるアタック時間は音楽のフェードアウト時間に該当し、リリース時間は音楽のフェードイン時間に該当する。
【０１０８】
図２７（ｂ）（ｃ）に示すように、レベルリミッタ部１０２は、アタックリリースフィルタ部１０１の出力信号の増減変化を反転させて、音声が検出されない区間では音量制御値が１になるように変換させ、音声が検出される区間で音量制御値が０．０５程度まで低減されるように調整を行う。図２７（ｃ）に示すように、レベルリミッタ部１０２において、音声の検出時に音量制御値を１より低い値（例えば０に近い値）に変化・設定し、音声の検出時に音量制御値を１の値に変化・設定することにより、音声検出のタイミングに連動させて音楽信号の信号レベルを低減させることが可能となる。
【０１０９】
乗算部１０４、１０５は、レベルリミッタ部１０２の信号出力（音量制御値）と、メインボリューム部５における２チャンネルの音楽信号（音楽信号Ｌ３および音楽信号Ｒ３）との乗算処理を行う役割を有している。乗算部１０４、１０５では、図２７（ｃ）に示される音量制御信号が、音楽信号Ｌ３および音楽信号Ｒ３のそれぞれに掛け合わされて、音量が制御された音楽信号Ｌ４および音楽信号Ｒ４がパワーアンプ部９へと出力される。乗算部１０４、１０５において音量制御が施された音楽信号Ｌ４およびＲ４は、パワーアンプ部９を介してスピーカ１０ａ，１０ｂから出力される。
【０１１０】
図２０（ｃ）は、図２０（ａ）に示すような音楽信号（図２０（ａ）には便宜上、Ｌチャンネルの音楽信号しか示していないが、実際にはＲチャンネルの音楽信号も存在する）が車載用オーディオ装置で再生される状態において、図２０（ｂ）に示すような音声信号がマイクＭ１およびマイクＭ２に入力された場合に、スピーカ１０ａ、１０ｂより出力される音楽信号（音量制御部８において音量制御が行われた音楽信号）を示している。図２０（ａ）〜図２０（ｃ）を比較して比べるとわかるように、会話が行われて、マイクＭ１およびマイクＭ２において、発話者の音声が集音された場合には、その集音された音声のタイミングに応じて、音楽信号の信号レベルが低減された状態で出力されることになる。このため、会話を行っている当事者は、会話に応じて低減制御される音楽によって会話を阻害されることなく、違和感のない会話を車内で楽しむことが可能となる。
【０１１１】
また、上述したように、音声検出部７において検出された音声間隔時間（音声検出時間と保持時間）は固定値となっており、この音声間隔時間に基づいて、音楽のフェードアウト時間（アタックリリースフィルタ部１０１のアタック時間）が０．１ｓｅｃに設定され、音楽のフェードイン時間（アタックリリースフィルタ部１０１のリリース時間）が５．０ｓｅｃに設定されているため、図２０（ｃ）に示すように、音声信号がマイクＭ１，Ｍ２で取得された時には素早く音楽情報の信号レベルを低減させ、一方で、音声信号の取得が終了したときには、暫く時間を保って（５．０ｓｅｃ）ゆっくりと音楽信号の信号レベルを復帰される。
【０１１２】
次に、音声検出部７の適応アタックリリースフィルタ部８９における設定が「可変モード」である場合について説明する。
【０１１３】
可変モードの場合には、テンポ検出部９０のテンポ検出値に応じて、適応アタックリリースフィルタ部８９において設定されるアタック時間およびリリース時間、すなわち音声検出時間および保持時間が変化することになる。
【０１１４】
図３０は、テンポ検出部９０において求められたテンポ検出値に応じて決定されるアタック時間（音声検出時間）とリリース時間（保持時間）との関係を示した図である。図３０において、テンポ検出時間が３未満の場合、つまり車両走行時の一瞬の路面変化音がマイクＭ１、Ｍ２で取得された場合や、独り言などの短い発話がマイクＭ１、Ｍ２で取得された場合のように、音声信号の音声速度が速く、音声間隔が長いものと判断できる場合（図３０に示した「（Ａ）路面変化音、短い発話」に該当する場合）には、音声信号の検出を行わず、仮に検出した場合であっても、保持時間を短くすることにより、路面変化音や短い発話が行われた場合において不用意に音楽信号の信号レベルが低減されてしまうことを防止し、さらに、もしも信号レベルの低減などが行われた場合であっても、音楽情報を短い時間で元の信号レベルに復帰させることが可能となる。
【０１１５】
また、テンポ検出部９０において求められるテンポ検出時間が３以上であって７以下である場合、つまり、発話の速度がゆっくりで発話間隔がやや長いと判断できる場合（図３０に示した「（Ｂ）音声速度：遅い、音声間隔：やや長い」に該当する場合）には、音声検出を行うアタック時間は短く、音声保持を行うリリース時間は長くなるように、アタック時間およびリリース時間を設定する。このように、アタック時間およびリリース時間を設定することにより、会話の開始に応じて音楽信号の信号レベルを低減させることができ、さらに、音声間隔が長い状態と判断されるので，音楽信号の信号レベルの復帰を違和感のないように緩やかに行うことができる。
【０１１６】
さらに、テンポ検出部９０において求められるテンポ検出時間が７以上である場合、つまり、音声速度が速く、さらに、音声間隔が短いと判断できる場合（図３０に示した「（Ｃ）音声速度：早い、音声間隔：短い」に該当する場合）には、テンポ検出時間が３以上であって７以下である場合に比べて、リリース時間を短くすることにより音声保持時間を短くし、音楽信号の信号レベルの復帰における応答性を良好にすることが可能である。
【０１１７】
図３１（ａ）は、音声信号の検出状態において、音声速度が短く（検出時間が短く）、音声間隔が非常に長い（検出間隔が非常に長い）場合（図３０に示した「（Ａ）路面変化音、短い発話」に該当する場合）における音声検出信号の検出状態を示し、図３１（ｂ）は、固定モードの場合における、適応アタックリリースフィルタ部８９の音声保持フィルタの適用動作例を示し、図３１（ｃ）は、図３１（ａ）と同じ可変モードにおける、適応アタックリリースフィルタ部８９の音声保持フィルタの適応動作例を示している。
【０１１８】
図３１（ｂ）に示すように、固定モードでは、音声保持フィルタの値が音声保持スレッショルドを超えた値となるため、音声保持が行われて所定時間の音量制御が実行されることになる。一方で、図３１（ｃ）に示すように、可変モードでは、音声保持フィルタの値が音声保持スレッショルドを超えることはないため、音量制御が行われない。このため、車両走行時の一瞬の路面変化音や独り言などの短い発話には、自動音量制御装置１による音量制御が行われず、不意の音量変化に対応する音量補正を抑制することができるので、車内の乗員に対して違和感のあるような音楽信号の出力が行われてしまうことを防止することが可能となる。
【０１１９】
一方で、図３２（ａ）は、音声信号の検出状態において、音声速度がやや短く（検出時間がやや短く）、音声間隔がやや長い（検出間隔がやや長い）場合における音声検出値の検出状態を示し、図３２（ｂ）は、固定モードの場合における、適応アタックリリースフィルタ部８９の音声保持フィルタの適用動作例を示し、図３２（ｃ）は、図３２（ａ）と同じ可変モードにおける、適応アタックリリースフィルタ部８９の音声保持フィルタの適応動作例を示している。
【０１２０】
図３２（ｂ）に示すように、固定モードでは、音声保持フィルタの値が音声保持スレッショルドを下回る場合があるため、音量制御が時々解除された状態となりやすいが、一方で、図３２（ｃ）に示すように、可変モードでは、最初の段階において音量制御が行われるが、テンポ検出部９０における検出値の積分結果、すなわち学習機能に基づいて、次第に発話中と判断することができ、音声保持スレッショルドを下回ることがなくなるので、音量制御が保持されることが可能となり、不意に音量変化が生じてしまって聴取者に違和感を生じさせることを防止することが可能となる。
【０１２１】
上述したように本実施の形態に係る自動音量制御装置１では、マイクＭ１およびマイクＭ２において音声が検出された場合に、車載用オーディオ装置より出力される音楽の出力音量が自動的に低減されるので、会話を行う毎に音量調節スイッチやミュートスイッチを操作することなく、円滑な会話を行うことが可能となる。
【０１２２】
特に、本実施の形態に係る自動音量制御装置１では、無指向性のマイクＭ１と単一指向性のマイクＭ２とを用いることにより指向性を強調させる構成を採用しているので、発話者の音声を精度良く取得することが可能である。
【０１２３】
さらに、アレイマイク部２の適応フィルタ部２４においてＮＬＭＳ適応アルゴリズムを適用し、さらにオーディオキャンセラ部３の第１適応フィルタ部３５および第２適応フィルタ部３６においてＬＭＳ適応アルゴリズムを適用することにより、音声信号における音声信号成分以外の信号成分（ノイズ成分）を効果的かつ高い収束性を確保した上で低減させることができ、音声帯域における音声信号の検出精度の向上を図ることが可能となる。
【０１２４】
特に、アレイマイク部２の適応フィルタ部２４において、ＮＬＭＳ適応アルゴリズムを適用してノイズ成分の低減を図った上で、さらに音源のチャンネル数に応じて、オーディオキャンセラ部３の第１適応フィルタ部３５および第２適応フィルタ部３６において、適応フィルタ部をカスケード接続する構成を採用し、各適応フィルタ部でのフィルタ処理においてより早くフィルタ処理を適用する部分毎に適応速度を大きくしているので、フィルタ処理が適用される信号の収束を素早くすることが可能となる。
【０１２５】
また、オーディオキャンセラ部３の第１バンドパスフィルタ部３１および第２バンドパスフィルタ部３２において設定される帯域制限幅が、アレイマイク部２の第１バンドパスフィルタ部２１において設定される帯域制限幅よりも広い帯域幅に設定されているため、帯域制限のカットオフ周波数付近のオーディオキャンセル性能を向上させることが可能となる。
【０１２６】
上述したような複数の適応アルゴリズムの適用やバンドパスフィルタの適応制限幅の設定により、Ｄ（希望信号：音声信号）／Ｕ（非希望信号：音楽信号）に優れた信号を求めることができる。
【０１２７】
また、音量補正部４のゲイン計算部５３において、第１アタックリリースフィルタ部６３および第３アタックリリースフィルタ部６５で低域制御信号および高域制御信号を対象として設定されるアタック時間およびリリース時間に比べて、第２アタックリリースフィルタ部６４で中域制御信号を対象として設定されるアタック時間およびリリース時間を長い時間に設定することにより、中域信号における制御処理を遅くすることができる。このため、聴覚的に敏感に聴取される（聞き取りやすい）音楽のボーカル音領域の音量の変動感が低減されて違和感がなくなり、一定の振幅になるように音量補正を行うことが可能となる。
【０１２８】
さらに、音量補正部４のゲイン計算部５３において、第１ルックアップテーブル部６７〜第３ルックアップテーブル部６９で低域制御信号、中域制御信号、高域制御信号の出力信号レベルを入力信号の信号レベルが所定値以上（本実施の形態に場合には、−３０ｄＢ以上）の場合には出力信号の信号レベルを一定値に設定し、入力信号の信号レベルが所定値（本実施の形態の場合には、−２０ｄＢ〜−１６ｄＢ）以下の場合には、入力信号よりも信号レベルが高い値を示すように出力信号の信号レベルを変換するので、音楽信号における音量の変動感を低減させる音量補正を行うことができる。
【０１２９】
また、音声検出部７の音声検出スレッショルド部８８で音声間隔時間の検出を行う場合において、上述したアレイマイク部２およびオーディオキャンセラ部３の処理により優れたＤ／Ｕを備えた出力信号に対して、音声検出部分に重み付けが施された音声分析ゲインが適用されるので、出力信号における音声検出部分の顕在化（強調）を図ることができ、音声の有無を用意かつ確実に判断することが可能となる。さらに、音声検出部分の顕在化が図られた信号に対して音声検出スレッショルドが設定されて、音声が聴取された際の音声間隔時間の検出が行われるので、音源のソースやジャンルに依存することなく、容易に音声検出スレッショルドを設定することが可能となり、音声間隔時間の検出精度を高めることが可能となる。
【０１３０】
さらに、音声検出部７の音声検出スレッショルド部８８において設定される音声検出スレッショルドは、メインボリューム部５より入力される音量情報に基づいて決定されるので、音声検出スレッショルドを音量調節スイッチ操作に応じたボリューム調整量（音量情報）に連動させて最適化することが可能になる。従って、音声信号の制御量を音量に応じて制御することが可能となり、制御量を任意に設定することが可能になる
【０１３１】
また、音声のテンポ（発話者の発語スピード）を検出し、テンポに応じて音量制御における音声検出時間（フェードイン時間）および保持時間（フェードアウト時間）を変動することができるので、違和感のない音量制御を行うことができる。
【０１３２】
さらに、リセット入力の有無に応じて、音声検出時間（フェードイン時間）および保持時間（フェードアウト時間）の決定内容を再度計算（学習）させることができるので、音声検出および保持時間が適切に変更されるように制御することができ、不意の音量変化に対する違和感を低減させることが可能となる。
【０１３３】
さらに、メインボリューム部５の音量情報に応じて、音量制御部８のレベル計算部１０３における音量制御を行うことができるので、メインボリューム部５の音量に応じて適切に音楽信号の信号レベル（音量）を変化させることが可能となる。
【０１３４】
また、自動音量制御装置１では、音量制御部８のアタックリリースフィルタ部１０１において音声検出部７より取得した音声検出信号に応じて音楽のフェードアウト時間に該当するアタック時間と、音楽のフェードイン時間に該当するリリース時間とが設定されるため、この時間設定を変更することにより、音楽のフェードアウト、フェードイン時間を任意に設定することが可能となる。
【０１３５】
以上、本発明に係る自動音量制御装置について、図面を用いて詳細に説明した、本発明に係る自動音量制御装置は、上述した実施の形態に限定されるものではない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到しうることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【０１３６】
１ …自動音量制御装置
２ …アレイマイク部（アレイマイク手段、音声信号抽出手段）
３ …オーディオキャンセラ部（オーディオキャンセラ手段、音声信号抽出手段）
４ …音量補正部（音量補正手段）
５ …メインボリューム部
６ …音声分析部（音声分析手段）
７ …音声検出部（音声検出手段）
８ …音量制御部（音量制御手段）
９ …パワーアンプ部
１０ａ、１０ｂ …スピーカ
２１ …（アレイマイク部の）第１バンドパスフィルタ部
２２ …（アレイマイク部の）第２バンドパスフィルタ部
２３ …（アレイマイク部の）遅延部
２４ …（アレイマイク部の）適応フィルタ部
２５ …（適応フィルタ部の）ＦＩＲ部
２６ …（適応フィルタ部の）ＮＬＭＳ部
２７ …（適応フィルタ部の）加算部
２８ …車両
２８ａ …運転席
２８ｂ …助手席
３１ …（オーディオキャンセラ部の）第１バンドパスフィルタ部
３２ …（オーディオキャンセラ部の）第２バンドパスフィルタ部
３３ …（オーディオキャンセラ部の）第１遅延部
３４ …（オーディオキャンセラ部の）第２遅延部
３５ …（オーディオキャンセラ部の）第１適応フィルタ部
３６ …（オーディオキャンセラ部の）第２適応フィルタ部
３７ …（第１適応フィルタ部の）第１ＦＩＲ部
３８ …（第２適応フィルタ部の）第２ＦＩＲ部
３９ …（第１適応フィルタ部の）第１ＬＭＳ部
４０ …（第２適応フィルタ部の）第２ＬＭＳ部
４１ …（第１適応フィルタ部の）第１加算部
４２ …（第２適応フィルタ部の）第２加算部
５１ …（音量補正部の）３バンドバンドパスフィルタ部
５２ …（音量補正部の）最大値検出及び最大値ホールド部
５３ …（音量補正部の）ゲイン計算部
５４ …（音量補正部の）遅延部
５５ …（音量補正部の）ゲイン設定部
５６ …（３バンドバンドパスフィルタ部の）第１ローパスフィルタ部
５７ …（３バンドバンドパスフィルタ部の）第２ローパスフィルタ部
５８ …（３バンドバンドパスフィルタ部の）遅延部
５９、６０ …（３バンドバンドパスフィルタ部の）加算部
６３ …（ゲイン計算部の）第１アタックリリースフィルタ部
６４ …（ゲイン計算部の）第２アタックリリースフィルタ部
６５ …（ゲイン計算部の）第３アタックリリースフィルタ部
６７ …（ゲイン計算部の）第１ルックアップテーブル部
６８ …（ゲイン計算部の）第２ルックアップテーブル部
６９ …（ゲイン計算部の）第３ルックアップテーブル部
７１ …（ゲイン計算部の）第１ローパスフィルタ部
７２ …（ゲイン計算部の）第２ローパスフィルタ部
７３ …（ゲイン計算部の）第３ローパスフィルタ部
７４ａ、７４ｂ、７４ｃ …（ゲイン設定部の）乗算部
７４ｄ …（ゲイン設定部の）加算部
７５ …（音声分析部の）実効値検出部
７６ …（音声分析部の）標準偏差検出部
７７ …（音声分析部の）平均部
７８ …（音声分析部の）第１移動平均部
７９ …（音声分析部の）第２移動平均部
８０ …（音声分析部の）除算部
８１ …（音声分析部の）レベル変換部
８５ …（音声検出部の）実効値検出部
８６ …（音声検出部の）移動平均部
８７ …（音声検出部の）音声分析ゲイン乗算部
８８ …（音声検出部の）音声検出スレッショルド部
８９ …（音声検出部の）適応アタックリリースフィルタ部（適応アタックリリースフィルタ手段）
９０ …（音声検出部の）テンポ検出部（テンポ検出手段）
９１ …（音声検出部の）音声保持スレッショルド部
９４ …（テンポ検出部の）スレッショルドクロッシング検出部
９５ …（テンポ検出部の）クロッシングゲイン部
９６ …（テンポ検出部の）移動平均部
９７ …（テンポ検出部の）乗算部
９８ …（テンポ検出部の）テンポゲイン部
９９ …（テンポ検出部の）ローパスフィルタ部
１００ …（テンポ検出部の）ゲインオフセット部
１０１ …（音量制御部の）アタックリリースフィルタ部
１０２ …（音量制御部の）レベルリミッタ部
１０３ …（音量制御部の）レベル計算部
１０４、１０５ …（音量制御部の）乗算部
Ｍ１、Ｍ２ …マイク

【特許請求の範囲】
【請求項１】
マイクにより集音された音声信号に対して音声帯域成分の帯域制限処理を適用するとともに適応アルゴリズムを適用することにより音声帯域に係る音声信号を音響信号として抽出する音声信号抽出手段と、
音源からの音楽信号を帯域毎に分割し、音楽信号の信号レベルが一定レベル以上の場合において、分割された各帯域における信号レベルを一定値に維持することにより前記音楽信号の音量補正を行う音量補正手段と、
前記音声信号抽出手段によって抽出された音響信号より、音声検出部分の重み付けが行われた音声分析ゲインを求める音声分析手段と、
前記音声信号抽出手段によって抽出された音響信号に対して前記音声分析手段により求められた音声分析ゲインを適用することにより、音響信号における音声検出部分を顕在化させて、音声検出の有無を示す音声検出信号を求める音声検出手段と、
前記音声検出手段により求められた音声検出信号に基づいて、前記音量補正手段により音量補正が行われた音楽信号の出力レベルを、音声検出時に低減させる音量制御手段と
を備えることを特徴とする自動音量制御装置。
【請求項２】
前記音声検出手段は、更に、
前記音声検出信号に基づいて前記音声検出部分における所定時間毎の音声検出値を積分処理することにより、所定時間における音声の検出状態変化を求め、求められた積分値に基づいて、発話者の発話スピードを判断するテンポ検出値を算出するテンポ検出手段と、
該テンポ検出手段により求められたテンポ検出値に基づいて、音声の検出時間に該当するアタック時間と、音声検出の保持時間に該当するリリース時間とを決定し、決定されたアタック時間およびリリース時間を前記音声検出信号に対して設定する適応アタックリリースフィルタ手段と
を有することを特徴とする請求項１に記載の自動音量制御装置。
【請求項３】
前記テンポ検出手段は、前記積分処理により求められた積分値を、リセット信号の入力に基づいてクリアにすることにより、発話者の発話スピードを判断するためのテンポ検出値を算出し直すこと
を特徴とする請求項２に記載の自動音量制御装置。
【請求項４】
前記適応アタックリリースフィルタ手段は、
前記アタック時間および前記リリース時間を前記テンポ検出値に基づいて設定する可変モードと、前記アタック時間および前記リリース時間を前記テンポ検出値に拘わらず所定の値に設定する固定モードとを有すること
を特徴とする請求項２又は請求項３に記載の自動音量制御装置。
【請求項５】
前記音声信号抽出手段は、
前記マイクにより集音された前記音声信号に対して音声帯域成分に対応する第１の帯域制限処理を行った後にＮＬＭＳ適応アルゴリズムを適用することにより音声帯域に係る音声信号を抽出するアレイマイク手段と、
アレイマイク手段において抽出された音声帯域に係る前記音声信号に対して、音声帯域成分に対応する第２の帯域制限処理を行った後に、前記音楽信号のチャンネル数に対応させてカスケード接続される適応フィルタを用いて、前記第２の帯域制限処理が行われた音声信号に対して多段のＬＭＳ適応アルゴリズムを適用するオーディオキャンセラ手段と
を備えることを特徴とする請求項１乃至請求項４のいずれか１項に記載の自動音量制御装置。
【請求項６】
前記オーディオキャンセラ手段における第２の帯域制限処理の帯域制限幅は、前記アレイマイク手段における第１の帯域制限処理の帯域制限幅の上限値および下限値を含み、第１の帯域制限処理の帯域制限幅よりもわずかに広い帯域幅となるように設定されること
を特徴とする請求項５に記載の自動音量制御装置。
【請求項７】
前記音量制御手段は、前記音源の音量状態に応じて、前記音楽信号における出力レベルの低減量を変化させること
を特徴とする請求項１乃至請求項６のいずれか１項に記載の自動音量制御装置。

【図１】