説明

音検知装置

【課題】 多くの種類の音を容易に検知することが可能な音検知装置を提供する。
【解決手段】 音検知装置1は、音源からの音を伝える音響管7の開口部に出力される音の振幅を検出し、これに基づいて音源における音の振幅を順次推定する振幅推定部2と、音源における音の振幅波形信号の自己相関関数を求める自己相関器3と、自己相関関数の振幅波形信号において所定時間内での極大値を抽出し、その極大値を時刻0での振幅値で正規化し、その正規化極大値により音源における音の雑音比を決定する雑音比決定部4と、音の雑音比に基づいて、音源から発する音の種類を判別する音種判別部5とを有している。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音の種類を検知する音検知装置に関するものである。
【背景技術】
【0002】
従来の音検知装置としては、例えば特許文献1に記載されているように、騒音源からの音響信号を採取し、この音響信号に基づき自己相関関数(ACF)を計算し、このACFに基づきACFファクターを計算し、このACFファクターとデータベースに格納されたテンプレートとを比較して、騒音源の種類を特定するものが知られている。
【特許文献1】特開2004−294444号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記従来技術においては、人間の聴覚―大脳機能システムのモデルを利用して音の評価を行うので、騒音源の種類を特定するための計算処理が複雑になるという問題がある。
【0004】
本発明の目的は、多くの種類の音を容易に検知することが可能な音検知装置を提供することである。
【課題を解決するための手段】
【0005】
本発明は、音源から発した音の種類を検知する音検知装置であって、音源における音の振幅を推定する振幅推定手段と、振幅推定手段により推定された音の振幅の自己相関関数を求め、自己相関関数に基づいて音の雑音比を決定する雑音比決定手段と、音の雑音比を用いて音の種類を判定する音種判定手段とを備えることを特徴とするものである。
【0006】
音の雑音比は、音の種類によってばらつくため、音の種類を検知するための有効な特徴量となり得る。そこで本発明では、まず音源における音の振幅を推定し、その音源における音の振幅の自己相関関数を求め、この自己相関関数に基づいて音の雑音比を求める。そして、音の雑音比を用いて音の種類を判定することにより、多くの種類の音を容易に検知することができる。
【0007】
好ましくは、振幅推定手段は、音源からの音を伝える音響管の開口側に出力される音の振幅に基づいて、音源における音の振幅を推定する。殆どの音は、形状はどうあれ、1つの音響管により作り出されるものが多い。従って、音響管の開口側に出力される音の振幅を取り出すことで、音源における音の振幅を確実に推定することができる。
【発明の効果】
【0008】
本発明によれば、音の雑音比というパラメータを用いるので、多くの種類の音を容易に検知することができる。
【発明を実施するための最良の形態】
【0009】
以下、本発明に係わる音検知装置の好適な実施形態について、図面を参照して詳細に説明する。
【0010】
図1は、本発明に係わる音検知装置の一実施形態を示す概略構成図である。同図において、本実施形態の音検知装置1は、音源から発する音の種類(例えば自動車の音、ベルの音、泣き声の音など)を検知する装置である。
【0011】
音検知装置1は、振幅推定部2と、自己相関器3と、雑音比決定部4と、音種判別部5と、特徴量メモリ6とを有している。
【0012】
振幅推定部2は、音源からの音を伝える音響管7の開口部に出力される音の振幅レベル(音圧)を検出し、これに基づいて音源における音の振幅レベル(音圧)を順次推定していく。なお、音響管7の音源側は人間の口の中の声帯(声門)側に相当し、音響管7の開口側は人間の口唇側に相当している。
【0013】
図2は、音響管7の物理的モデルを示したものである。同図において、音響管7は、模式的には、等幅Lでカットされた複数の管部7aから構成されている。互いに隣り合う管部7aの直径は異なっている。各管部7aは、図2に示すように、音圧を電圧に変換した格子型フィルタ回路8を形成している。各格子型フィルタ回路8は、直列に接続されている。また、格子型フィルタ回路8は、複数の増幅器8a、遅延素子8b及び加算器8cを有している。
【0014】
このような音響管7の中では、障害物が無ければ、音は管自身からの吸収を受けずに前向き(ここでは開口側の向き)に進み、障害物がある場合には、そのままの音圧が跳ね返されて後向き(ここでは音源側の向き)に進むようになる。
【0015】
振幅推定部2は、音響管7の開口部に出てくる目に見える音圧を基にして、格子型フィルタ回路8における前向き(ここでは開口側の向き)の増幅器8aの増幅率と後向き(ここでは音源側の向き)の増幅器8aの増幅率の相関係数を順次推定しながら、音源における音の振幅を時系列に推定していく。これにより、音源における音の振幅波形信号が得られることとなる。
【0016】
ここで、音源における音の振幅の推定に先立ち、音響管7の開口部から取り出される音に対する前処理を実行する。まず、音源から音を発していると考えられる時間(音発生区間)を確定する。例えば、図3に示すように、音の振幅が閾値Aを越えた時刻をt、その300ms後の時刻をti+1、更に300ms後の時刻をti+2とする。時刻ti+1から時刻ti+2までの中で閾値B(A<B)を越える振幅値がある場合には、時刻tを音発生開始時刻tとする。また、上記と同様の処理を行い、振幅値が減少して閾値A以下になったときの時刻を音発生終了時刻とする。
【0017】
次いで、音の信号の高周波成分が人間の耳に大きく聴こえるように高域強調を行うことで、音の信号を実際に人間が受けとるような信号に変換する。また、音の信号の低周波成分の除去を行い、高周波成分のスペクトルを強調することで、高周波成分を分析しやすくする。
【0018】
次いで、音の信号の全データの重みを同じにするためにフレームシフトを行う。つまり、音の信号から、フレーム周期でシフトしながら音の波形をフレーム長分だけ切り出す。このとき、1フレームの長さを例えば30ms程度にし、フレームを移動するフレーム周期を例えば10ms程度にする。フレーム周期をフレーム長の30%程度にすることで、窓掛け(後述)における音の信号の全データの重みを同じにし、無駄なフレーム数の増加を防ぐことができる。
【0019】
次いで、各フレームの振幅の形を実際の音の信号波形に近づけるために、各フレームにハミング窓関数を掛け合わせる、いわゆる窓掛けを行う。
【0020】
このような前処理によって得られた音の振幅レベルに対して、音響管7を形成する各段の管部7aを模擬した格子型フィルタ回路8における連立一次方程式を順次解くことで、音源レベルにおける音の振幅を推定する。
【0021】
自己相関器3は、音源レベルにおける音の振幅波形信号の自己相関関数を求める。つまり、自己相関器3は、音源レベルにおける音の振幅波形信号とそれを所定時間ずつ順次シフトした信号とを足し合わせた関数を求める。これにより、図4(a)に示すような自己相関関数の振幅波形信号が得られる。このような自己相関関数を求めることで、周期性が強調され、雑音か否かの区別がつけやすくなる。
【0022】
雑音比決定部4は、自己相関器3により得られた自己相関関数の振幅波形信号において、所定時間(例えば30ms)内における極大値ACFεを抽出し、その極大値ACFεを時刻0での振幅値Mで正規化する。これにより、図4(b)に示すような正規化極大値R(ACFε/M)が得られる。そして、その正規化極大値Rにより音源レベルにおける音の雑音比を決定する。このとき、正規化極大値Rが高ければ、音の雑音比が小さくなり、音源レベルにおける音の振幅波形信号が周期性を有していることとなり、正規化極大値Rが低ければ、音の雑音比が大きくなり、音源レベルにおける音の振幅波形信号の周期性が低いということとなる。
【0023】
音種判別部5は、雑音比決定部4により得られた音の雑音比に基づいて、音源から発する音の種類を判別する。特徴量メモリ6には、例えば図5に示すような、音の種類と紐付けされた音種番号と雑音比との関係を表すデータが記憶されている。ここでは、50種類の音に関する雑音比のデータが記憶されている。音種判別部5は、そのような特徴量メモリ6に記憶されたデータを用いて、音源から発する音の種類を判別する。
【0024】
以上において、振幅推定部2は、音源における音の振幅を推定する振幅推定手段を構成する。自己相関器3及び雑音比決定部4は、振幅推定手段により推定された音の振幅の自己相関関数を求め、自己相関関数に基づいて音の雑音比を決定する雑音比決定手段を構成する。音種判別部5及び特徴量メモリ6は、音の雑音比を用いて音の種類を判定する音種判定手段を構成する。
【0025】
ところで、音の種類を検知するには、パワーの強い中心周波数を捉えるのが主流とされている。しかし、この手法では、例えば5音種くらいの音を推定する分には問題はないが、数十種類の音を検知することは困難である。
【0026】
これに対し本実施形態では、音響管7の開口部から出力される音圧に基づいて音源レベルでの音の振幅を順次推定し、その音源レベルでの音の振幅波形の自己相関関数を求め、所定時間内での極大値ACFεを時刻0での振幅値Mで正規化することで、音の雑音比を求める。音の雑音比は、音の中心周波数に比し、音の種類によってばらつきやすい特徴量である。従って、そのような音の雑音比という有効なパラメータを用いることで、数十種類の音を容易に検知することが可能となる。
【図面の簡単な説明】
【0027】
【図1】本発明に係わる音検知装置の一実施形態を示す概略構成図である。
【図2】音響管の物理的モデルを格子型回路と共に示す図である。
【図3】音発生区間を決定する手法を表すグラフである。
【図4】音の振幅波形の自己相関関数を表すグラフである。
【図5】音の種類と音の雑音比との関係を表すグラフである。
【符号の説明】
【0028】
1…音検知装置、2…振幅推定部(振幅推定手段)、3…自己相関器(雑音比決定手段)、4…雑音比決定部(雑音比決定手段)、5…音種判別部(音種判定手段)、6…特徴量メモリ(音種判定手段)、7…音響管。



【特許請求の範囲】
【請求項1】
音源から発した音の種類を検知する音検知装置であって、
前記音源における音の振幅を推定する振幅推定手段と、
前記振幅推定手段により推定された前記音の振幅の自己相関関数を求め、前記自己相関関数に基づいて音の雑音比を決定する雑音比決定手段と、
前記音の雑音比を用いて前記音の種類を判定する音種判定手段とを備えることを特徴とする音検知装置。
【請求項2】
前記振幅推定手段は、前記音源からの音を伝える音響管の開口側に出力される音の振幅に基づいて、前記音源における音の振幅を推定することを特徴とする請求項1記載の音検知装置。





【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2009−186273(P2009−186273A)
【公開日】平成21年8月20日(2009.8.20)
【国際特許分類】
【出願番号】特願2008−25375(P2008−25375)
【出願日】平成20年2月5日(2008.2.5)
【出願人】(000003207)トヨタ自動車株式会社 (59,920)
【Fターム(参考)】