特定音声認識装置および特定音声認識方法
【課題】自治体などの地理的領域毎に、当該地理的領域で使用されている領域固有音声データ(サイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定し、一致する場合には、その旨を車両内に報知することを可能にする。
【解決手段】本発明の特定音声認識装置は、入力される周辺の音声を取得してデジタル音声データとして出力する音声取得部と、自らの現在位置を算出して出力する現在位置生成部を含んでいる。また、所定の地理的領域でのみ聞かれる領域固有音声を記憶する領域固有音声記憶部と、現在位置が属する特定地理的領域を出力する現在位置認識特定部を含んでいる。さらに、特定地理的領域の領域固有音声と、デジタル音声データを比較し、両者が一致すると判定した場合、その旨を報知する音声認識結果報知部を含んでいる。
【解決手段】本発明の特定音声認識装置は、入力される周辺の音声を取得してデジタル音声データとして出力する音声取得部と、自らの現在位置を算出して出力する現在位置生成部を含んでいる。また、所定の地理的領域でのみ聞かれる領域固有音声を記憶する領域固有音声記憶部と、現在位置が属する特定地理的領域を出力する現在位置認識特定部を含んでいる。さらに、特定地理的領域の領域固有音声と、デジタル音声データを比較し、両者が一致すると判定した場合、その旨を報知する音声認識結果報知部を含んでいる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、緊急車両のサイレン音等、ある地理的領域に固有な音声が検出された場合、その旨を報知する特定音声認識装置および特定音声認識方法に関する。
【背景技術】
【0002】
近年の道路交通法においては、緊急自動車(消防用自動車、救急用自動車その他の政令で定める自動車)がサイレン等を吹鳴しながら接近してきたときは、車両は、道路の左側に寄って、これに進路を譲らなければならない。また、交差点又はその附近においては、車両は、交差点を避けて、道路の左側(或いは、必要な場合は右側)に寄って一時停止しなければならない、と定められている。なお、ここで、緊急自動車とは、当該緊急用務のため、政令で定めるところにより、運転中のものをいう。以下、緊急自動車を緊急車両とも称することとする。
【0003】
しかし、自家用車などで車両内のオーディオ機器等による音量が大きな場合、或いは、車両内外の騒音が大きな場合には、車両外の緊急車両のサイレン音を聞き逃す場合もありうる状態となり、車両の運転者が適切な行動をとれないこともあり得る。
【0004】
そこで、緊急車両のサイレン音を聞き逃さないようにするための一つの手法を提案しているものがある(例えば、特許文献1参照。)。
【0005】
上述した特許文献1「車外音導入装置」には、以下の記載がなされている。
【0006】
すなわち、車両の上面、後面及び左右外側面にそれぞれ車外音を収集する複数のマイクロホンが取り付けられている。そして、各マイクロホンから収集された車外音がマイクロコンピュータにより選別され、アンプにより増幅される。増幅された車外音は、それぞれマイクロホンの取り付け位置に対応して車両内に設置されているスピーカから車室内に放出されるように構成されている。このことにより、車両の運転者にとって有益な車外音を運転者が確実に聞き取ることができるようになる、としている。
【0007】
また、窓を閉め切ってカーステレオ等の音量を高くして聞いている場合にも、緊急自動車接近の状況を運転者に知らせる、ようにしているものもある(例えば、特許文献2参照。)。
【0008】
上述した特許文献2「緊急車両検知警報装置および位置表示装置」には、以下の記載がなされている。
【0009】
すなわち、マイクロホンの信号が緊急車両認識装置に入力され、緊急車両認識装置は緊急車両のサイレン音を検知し信号を表示コントローラと音声コントローラに出力する。表示コントローラは緊急車両認識装置から信号が入力したときは、内蔵する映像信号発生装置から警報画面の映像信号を発生させディスプレイに警報画面を表示させる。音声コントローラは内蔵する音声合成装置から警報のアナウンスを発生させてスピーカを駆動する、としている。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開平08−002339号公報(第2〜4頁、図1〜5)
【特許文献2】特開平06−325291号公報(第4〜6頁、図1〜5)
【発明の概要】
【発明が解決しようとする課題】
【0011】
上述した特許文献1、2に記載の手法においては、車外のマイクロホンにより収集された車外音が、事前に車両内の記憶手段に登録された緊急車両のサイレン音などの音声と一致するかの比較を行う。そして、一致した場合、緊急車両が接近していると認識し、車内の画面やスピーカで、運転者に報知するようになっている。特許文献2においては、車両内の記憶手段に登録された緊急車両のサイレン音などの音声は、消防用自動車、救急用自動車、警察関係自動車(パトカー、など)などに分かれて記憶されている。
【0012】
しかし、緊急車両のサイレン音などの音声データは、自治体などにより異なる場合があるにも拘らず、上述した特許文献1、2においては、このことが考慮されていない、という課題を有している。
【0013】
すなわち、モーターサイレンを使用する消防用自動車などの場合、サイレン音の周波数は連続して所定の時間の間で変化するようになっている。そして、使用する周波数の目安は、250〜850Hz程度となっている場合が多い。また、交差点等を通過するときに鳴らす場合のサイレンの周波数は900Hz程度となっている。なお、モーターサイレンとは、モーターで羽を回して音を出す仕組みのサイレンであるが、近年においては、モーターサイレンの音を電子音で代替するようにしている場合もある。
【0014】
そして、サイレン音の周波数の変化の程度や、音の継続時間などに関しては、目安が示されているだけであるため、自治体毎に異なるサイレン音を使用する場合があり得るものとなっている。
【0015】
本発明は上述した課題を解決するためになされたものである。従って、本発明の目的は、
自治体などの地理的領域毎に、当該地理的領域で使用されている領域固有音声データ(サイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定することを可能とし、一致する場合には、その旨を車両内に報知することを可能とする、特定音声認識装置および特定音声認識方法、を提供することにある。
【課題を解決するための手段】
【0016】
上記の目的を達成するため、本発明の特定音声認識装置は、入力される周辺の音声を一定時間長の単位で取得し、デジタル音声データとして出力する音声取得部と、入力される所定の信号に基づき、自らの現在位置を算出して出力する現在位置生成部と、所定の地理的領域でのみ聞かれる領域固有音声を前記一定時間長以上の単位で前記地理的領域に対応付けて記憶する領域固有音声記憶部と、前記現在位置生成部から入力される前記現在位置が属する前記地理的領域である特定地理的領域を示す情報を出力する現在位置認識特定部と、入力される前記特定地理的領域につき前記領域固有音声記憶部から抽出した前記領域固有音声と、前記音声取得部から入力される前記デジタル音声データを比較し、両者が一致すると判定した場合、その旨を報知する報知信号を出力する音声認識結果報知部と
を含む。
【0017】
また、本発明の特定音声認識方法は、周辺の音声を一定時間長の単位でアナログ音声データとして取得し、前記アナログ音声データをA/D変換によってデジタル音声データに変換し、一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出し、前記現在位置に基づき、現在位置近傍の複数の自治体を特定し、前記特定した複数の自治体が用いている複数の緊急車両音声データを抽出し、前記デジタル音声データが、前記現在位置近傍の複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定し、一致すると判定した場合、緊急車両が近づいている旨を音声、メッセージデータ、或いは画像データにより出力し、報知する。
【発明の効果】
【0018】
本発明によれば、地理的領域(自治体など)毎に当該地理的領域が使用している領域固有音声(緊急車両の吹鳴するサイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定できる。そして、一致する場合、その旨を車両内に報知することが可能となる。
【図面の簡単な説明】
【0019】
【図1】本発明の特定音声認識装置の第1の実施形態を示すブロック図である。
【図2】本発明の特定音声認識装置の第2の実施形態を示すブロック図である。
【図3】特定音声認識装置の第2の実施形態の動作を説明するシーケンス図である。
【図4】本発明の特定音声認識装置の第3の実施形態を示すブロック図である。
【図5】デジタル音声データの波形の一例を示す図である。
【図6】周波数毎のパワースペクトルの波形データの一例を示す図である。
【図7】ソナグラムパターンデータのデータ形式の一例を示す図である。
【図8】ソナグラムのパターンデータの表示例の一例を示す図である。
【図9】特定音声認識装置の第3の実施形態の動作を説明するシーケンス図である。
【図10】本発明の特定音声認識装置の第4の実施形態を示すブロック図である。
【図11】特定音声認識装置の第3実施形態の動作を説明するシーケンス図ある。
【発明を実施するための形態】
【0020】
次に、本発明の実施形態について図面を参照して説明する。
[第1の実施形態]
【0021】
図1は、本発明の特定音声認識装置の第1の実施形態を示すブロック図である。
【0022】
図1に示す特定音声認識装置100は、音声取得部2と、現在位置生成部4と、領域固有音声記憶部6を含んでいる。また、特定音声認識装置100は、現在位置認識特定部3−2と、音声認識結果報知部3−6を含んでいる。
【0023】
音声取得部2は、特定音声認識装置100を搭載する車両の周辺の音声を、一定時間長の単位で取得し、デジタル音声データとして音声認識結果報知部3−6へ出力する。
【0024】
現在位置生成部4は、GPS衛星から受信する電波信号に基づき、特定音声認識装置100の現在位置を算出し、現在位置認識特定部3−2へ出力する。
【0025】
領域固有音声記憶部6は、自治体などの特定の地理的領域でのみ聞かれる緊急車両の吹鳴するサイレン音などを、領域固有音声として記憶する。なお、前記の領域固有音声は、前記の地理的領域と対応付けを行って記憶する。
【0026】
現在位置認識特定部3−2は、現在位置生成部4から入力された現在位置が、前記の地理的領域の内の何れに位置するかを特定し、特定地理的領域の情報として音声認識結果報知部3−6へ出力する。
【0027】
音声認識結果報知部3−6は、現在位置認識特定部3−2から入力した特定地理的領域に基づき、領域固有音声記憶部6を検索し、特定地理的領域に対応する領域固有音声を抽出する。そして、抽出した領域固有音声と、音声取得部2から入力したデジタル音声データを比較する。比較の結果、両者が一致する場合、特定音声認識装置100を搭載する車両に、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨を報知する報知信号を、特定音声認識装置100を搭載する車両内に出力する。
【0028】
以上説明したように、本実施形態の特定音声認識装置100は、入力される周辺の音声を一定時間長の単位で取得し、デジタル音声データとして出力する音声取得部2を含んでいる。
【0029】
また、入力される所定の信号に基づき、自らの現在位置を算出して出力する現在位置生成部4を含んでいる。
【0030】
さらに、所定の地理的領域でのみ聞かれる領域固有音声を前記一定時間長以上の単位で前記地理的領域に対応付けて記憶する領域固有音声記憶部6を含んでいる。
【0031】
また、前記現在位置生成部4から入力される前記現在位置が属する前記地理的領域である特定地理的領域を示す情報を出力する現在位置認識特定部3−2を含んでいる。
【0032】
さらに、入力される前記特定地理的領域につき前記領域固有音声記憶部6から抽出した前記領域固有音声と、前記音声取得部2から入力される前記デジタル音声データを比較する音声認識結果報知部3−6を含んでいる。また、前記音声認識結果報知部3−6は、前記領域固有音声と前記デジタル音声データの両者が一致すると判定した場合、その旨を報知する報知信号を出力する、ようになっている。
【0033】
従って、本実施形態によれば、地理的領域(自治体など)毎に当該地理的領域が使用している領域固有音声(緊急車両の吹鳴するサイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定できる。そして、一致する場合、その旨を車両内に報知することが可能となる。
[第2の実施形態]
図2は、本発明の特定音声認識装置の第2の実施形態を示すブロック図である。
【0034】
図2に示す特定音声認識装置100は、図1の音声取得部2に相当するマイク10と、音声データ抽出部20と、を含んでいる。また、制御部30を含んでいる。
【0035】
さらに、図1の現在位置生成部4に相当するGPS(Global Positioning System:全地球測位システム)受信部40を含んでいる。
【0036】
また、図1の領域固有音声記憶部6に相当する制御部30に接続された緊急車両音声データ記憶部60を含んでいる。
【0037】
さらに、特定音声認識装置100は、図1の現在位置認識特定部3−2に相当する制御部30に接続された地図データ記憶部50と、制御部30に含まれる現在位置特定部32と、を含んでいる。
【0038】
また、図1の音声認識結果報知部3−6に相当する緊急車両音声データ選択部34と、警報音認識部36を含んでいる。さらに、特定音声認識装置100は、制御部30に接続される警報出力部70を含んでいる。
【0039】
マイク10は、特定音声認識装置100を搭載する車両の外部に設置され、マイク10周辺の音声を取得し、音声データ抽出部20に送出する。
【0040】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをデジタル音声データに変換し、制御部30に送出する。
【0041】
GPS受信部40は、GPS衛星からの電波を受信し、特定音声認識装置100の現在位置データを、例えば、緯度、経度のデータとして算出し、制御部30に送出する。
【0042】
地図データ記憶部50は、例えば、日本全土の地図データを、緯度、経度のデータと共に記憶しており、さらに、当該緯度、経度の地点が日本のどの自治体(□□県、○○市、△△町、など)に属しているかの情報も記憶している。
【0043】
緊急車両音声データ記憶部60は、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶している。緊急車両の種類は、例えば、消防用自動車、救急用自動車、パトロールカー、などに分け、緊急車両音声データ記憶部60は、緊急車両の種類毎の緊急車両音声データを記憶している。なお、本実施形態における緊急車両の音声データは、音声波形の情報を、時間、周波数、強度の3次元で表現したソナグラム(sonagram:声紋)の形で記憶されているものとする。ソナグラムの詳細については、第3の実施形態において後述する。
【0044】
制御部30の現在位置特定部32は、GPS受信部40から特定音声認識装置100の現在位置データを受信する。そして、現在位置特定部32は、受信した現在位置データが、どの自治体の中の位置に相当するかについて、地図データ記憶部50を参照して特定する。なお、現在位置特定部32は、特定した自治体の近辺の他の2〜3の自治体も特定する。これは、特定音声認識装置100が、或る自治体の境界あたりに位置している場合、現在位置データが示す自治体の緊急車両の他に、当該自治体の近辺の他の自治体の緊急車両の緊急車両音声データを取得する場合も有り得ることを考慮したためである。現在位置特定部32は、現在位置特定部32が特定した複数の自治体の情報を、緊急車両音声データ選択部34に送出する。
【0045】
制御部30の緊急車両音声データ選択部34は、現在位置特定部32から受信した複数の自治体の情報に基づき、当該複数の自治体の緊急車両の緊急車両音声データを、緊急車両音声データ記憶部60から抽出し、警報音認識部36に送出する。
【0046】
制御部30の警報音認識部36は、音声データ抽出部20から受信したデジタル音声データを、先ず、ソナグラムの形の3次元データに変換する(以降、受信ソナグラムデータと称するものとする)。次に、受信ソナグラムデータと、緊急車両音声データ選択部34から受信した複数の自治体の緊急車両の緊急車両音声データ(ソナグラムの形になっている)とを比較する。緊急車両音声データ選択部34から受信した複数の自治体の緊急車両音声データの何れかが、受信ソナグラムデータと一致した場合、その受信ソナグラムデータは緊急車両が吹鳴している音声データであると判断する。そして、緊急車両の緊急車両音声データであると判断した場合、警報音認識部36は、緊急車両が近づいている旨を、警報出力部70に送出する。
【0047】
警報出力部70は、緊急車両が特定音声認識装置100に近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する。
【0048】
次に、図3を参照して、本実施形態の動作について説明する。
【0049】
図3は、本実施形態の動作を説明するシーケンス図である。
【0050】
図3において、特定音声認識装置100のマイク10は、マイク10周辺の音声を一定時間長の単位で取得し、音声データ抽出部20に送出する(図3のステップS1)。その後、次の時間長の音声を取得するためステップS1を繰り返す。
【0051】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをデジタル音声データに変換(A/D変換:Analogue to Digital Conversion)する(ステップS2)。そして、変換したデジタル音声データを制御部30に送出する。
【0052】
一方、特定音声認識装置100のGPS受信部40は、一定時間間隔で、複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、特定音声認識装置100の現在位置を算出する(ステップS3)。そして、算出した現在位置の情報を制御部30に送出する。その後、次の時間間隔でのGPS衛星からの電波を受信するため、ステップS3を繰り返す。
【0053】
GPS受信部40から現在位置を受信した制御部30は、受信した現在位置が、どの自治体の中の位置に相当するかについて、図2に示した地図データ記憶部50を参照して特定する。さらに、制御部30は、特定した自治体の近辺の他の2〜3の自治体も特定する(ステップS4)。
【0054】
次に、制御部30は、特定した複数の自治体が用いている緊急車両音声データを、図2に示した緊急車両音声データ記憶部60から抽出する(ステップS5)。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0055】
一方、制御部30は、音声データ抽出部20から受信したデジタル音声データを、先ず、
ソナグラムの形の3次元データに変換する(受信ソナグラムデータと称している)。
【0056】
次に、制御部30は、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データ(これらもソナグラムで表されるデータとなっている)の何れかと一致するかを比較する(ステップS6)。そして、制御部30は、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する(ステップS7)。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行うと良い。
【0057】
ここで、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致すると判定した場合(ステップS7で「一致」)、制御部30は、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨を、特定音声認識装置100の警報出力部70に通知する。警報出力部70は、緊急車両が近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する(ステップS8)。そして、特定音声認識装置100の利用者がこの報知に気づき、報知の停止操作(例えば、図示しない報知停止釦の押下など)を行った場合、警報出力部70は警報の報知を停止し、もとの初期状態に戻る。
【0058】
ステップS7で、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データの何れとも一致しない場合(ステップS7で「不一致」)、制御部30は、何もせず、もとの初期状態に戻る。
【0059】
以上、本発明の第2の実施形態の動作について説明した。
【0060】
以上説明したように、本実施形態の特定音声認識装置100は、周辺の音声を一定時間長の単位で取得するマイク10と、前記マイク10が取得したアナログ音声データをA/D変換しデジタル音声データとして制御部30に送出する音声データ抽出部20と、を含んでいる。
【0061】
また、一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出して前記制御部30に送出するGPS受信部40と、を含んでいる。
【0062】
さらに、前記制御部30に接続され、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ記憶部60と、を含んでいる。
【0063】
また、前記制御部に接続され、地図データを記憶する地図データ記憶部50を含んでいる。
【0064】
さらに、前記制御部30に含まれ、前記GPS受信部40から受信した現在位置に基づき、現在位置近傍の複数の自治体を、前記地図データ記憶部50を参照して特定する現在位置特定部32、を含んでいる。
【0065】
また、前記制御部30に含まれ、前記現在位置特定部が特定した複数の自治体が用いている緊急車両音声データを、前記緊急車両音声データ記憶部60から抽出する緊急車両音声データ選択部34と、を含んでいる。
【0066】
さらに、前記音声データ抽出部20から受信したデジタル音声データが、前記緊急車両音声データ選択部34が抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する警報音認識部36を含んでいる。そして、前記警報音認識部36は、一致すると判定した場合、緊急車両が近づいている旨を前記制御部30に接続された警報出力部70に通知する。
【0067】
そして、前記警報出力部70は、緊急車両が近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する、ようになっている。
【0068】
従って、本実施形態によれば、自治体毎に、当該自治体が使用している緊急車両音声データ(サイレン音など)が異なっている場合であっても、車両外の音声データが緊急車両の吹鳴する緊急車両音声データに一致するかを判定できる。そして、一致する場合には、緊急車両が近づいている旨を車両内に報知することが可能となる。
[第3の実施形態]
次に、図2に示した第2の実施形態をさらに具体化した本発明による第3の実施形態について説明する。
【0069】
図4は、本発明の特定音声認識装置の第3の実施形態を示すブロック図である。図4は、図2に示した特定音声認識装置についてさらに詳細に説明するブロック図である。従って、図4において、図2の構成要素に対応するものは同一の参照数字または符号を付し、その説明を極力省略するものとする。
【0070】
図4に示す特定音声認識装置100は、図2と同様に、マイク10と、音声データ抽出部20と、制御部30と、GPS受信部40を含んでいる。また、特定音声認識装置100は、制御部30に接続された地図データ記憶部50と、緊急車両音声データ記憶部60と、警報出力部70を含んでいる。
【0071】
マイク10は、マイク10周辺の音声を取得し、音声データ抽出部20に送出する。マイク10は、特定音声認識装置100を搭載する車両の外部で、かつ、外部の音声データを取得しやすい場所に設置されているものとする。
【0072】
音声データ抽出部20は、アンプ(amplifier)22と、バンドパスフィルタ(Band Pass Filter)24と、A/Dコンバータ(Analogue to Digital Converter:A/D変換器)26とを含んでいる。
【0073】
アンプ22は、マイク10から送出されたアナログ音声データを増幅し、バンドパスフィルタ24に送出する。
【0074】
バンドパスフィルタ24は、通常、必要な範囲の周波数のみ通し、他の周波数は通さないフィルタ回路である。本実施形態のバンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲(例えば、250〜900Hz)のみの音声データを通すものとし、
当該音声データをA/Dコンバータ26に送出する。
【0075】
A/Dコンバータ26は、バンドパスフィルタ24から受信したアナログの音声データをデジタル音声データに変換し、制御部30に送出する。
【0076】
制御部30は、特定音声認識装置100の演算処理を行うCPU(Central Processing Unit:中央処理装置)37を含んでいる。また、制御部30は、CPU37を動作させるプログラムや、緊急車両接近警告画像データ、緊急車両接近警メッセージデータ等を記憶するROM(Read Only Memory:ロム)38を含んでいる。ROM38に記憶されCPU37を動作させるプログラムとしては、第2の実施形態で説明した現在位置特定部32、緊急車両音声データ選択部34、及び、警報音認識部36の機能を実行するプログラムも含まれている。
【0077】
さらに、制御部30は、CPU37のワークエリアとして各種のデータを記憶するRAM(Random Access Memory:ラム)39を含んでいる。
【0078】
GPS受信部40は、GPS衛星からの電波を受信するGPSアンテナ42と、GPSアンテナ42から受信した電波に基づいて、特定音声認識装置100の現在位置データを、例えば、緯度、経度のデータとして算出するGPSレシーバ44を含んでいる。GPSレシーバ44は、算出した現在位置データを制御部30に送出する。
【0079】
地図データ記憶部50は、例えば、日本全土の地図データを、緯度、経度のデータと共に記憶する地図データ52を含んでいる。地図データ52は、さらに、当該緯度、経度の地点が日本のどの自治体(□□県、○○市、△△町、など)に属しているかの情報も記憶している。
【0080】
緊急車両音声データ記憶部60は、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ62を含んでいる。緊急車両音声データ62は、緊急車両の種類として、例えば、消防用自動車、救急用自動車、パトロールカー、などに分けてそれぞれの音声データを記憶している。なお、本実施形態における緊急車両の音声データは、音声波形の情報を、時間、周波数、強度の3次元で表現したソナグラムの形で記憶されているものとする。
【0081】
ここで、図5、図6、図7、図8を参照して、本実施形態で使用するソナグラムについて説明しておく。
【0082】
図5は、音声データ抽出部20のA/Dコンバータ26が、制御部30に送出したデジタル音声データの波形の一例を示す図である。制御部30のCPU37はこのデジタル音声データをRAM39に記憶させる。図5に示すデジタル音声データは、一定時間の間隔に区切っておくものとし、各一定時間を「T1」〜「Tn」として表す。そして、CPU37はこのデジタル音声データを以下の手順でソナグラムの形のデータに変換する。
【0083】
すなわち、CPU37は、RAM39に記憶したデジタル音声データ(図5)を、一定時間「T1」〜「Tn」毎にフーリエ変換し、周波数毎のパワースペクトルの波形データを求める。図6は、例えば、一定時間「T1」における周波数毎のパワースペクトルの波形データの一例を示す図である。図6に示す波形データの周波数の範囲は、本実施形態の場合には、例えば、250〜900Hz(バンドパスフィルタ24でフィルタリングしたため)である。なお、フーリエ変換には、FFT(Fast Fourier Transform:高速フーリエ変換)を使用すれば、高速処理が可能となり、好都合である。
【0084】
次に、周波数毎のパワースペクトルの波形データ(図6)について、図6の中程に示す閾値200を越える周波数を求め、周波数と時間との対応データを求め、図7のような形でRAM39に記憶させる。ここで、図6は、前述したように、一定時間「T1」における周波数毎のパワースペクトルの波形データを示している。そして、図6の閾値200は、パワー、すなわち、各周波数の強度を、閾値200の上側(強度が強い)か下側(強度が弱い)かの2値に分類するための値となっている。閾値200の上側にある周波数を「1」で表し、閾値200の下側にある周波数を「0」で表せば、図7の最下行(「T1」時間の行601)のように、周波数「f1」〜「fm」(図7の641〜64m列)のデータとして示すことが出来る。
【0085】
一定時間「T2」〜「Tn」についても、図6と同様に、周波数毎のパワースペクトルの波形データを求める。そして、上記と同様に、それぞれ「閾値」の上側か下側かを「1」と「0」で表せば、図7の602行(「T2」時間の行)〜60n行(「Tn」時間の行)のような、周波数「f1」〜「fm」(図7の641〜64m列)のデータとして示すことが出来る。
【0086】
つまり、図7においては、図5に示したデジタル音声データを、時間(「T1」〜「Tn」)
、周波数(「f1」〜「fm」)、強度(「1」又は「0」)で表現したものである。従って、図7は、ソナグラムパターンデータのデータ形式の一例を示す図となっている。
【0087】
なお、図6に示した閾値200は、その値を変更可能なように構成しておくものとする。このように構成することにより、周波数毎の強度として表す値を、周囲の状況(騒音の大きさなど)に応じて変更することが可能となる。また、上記においては、閾値200を1つだけ設定し、強度を2値に分類する、として説明したが、これを、4値や8値など複数の強度に分類できよう、複数の閾値を設定できるようにしておいても良い。このように構成することにより、図7のソナグラムパターンデータ(第一例)600に示した強度を、2値だけでなく、4値や8値に変更し、より詳細なソナグラムのデータを得ることが可能となる。
【0088】
また、図8は、ソナグラムのパターンデータの表示例の一例を示す図であり、ソナグラムパターンデータ(第二例)700と称するものとする。つまり、図7に示した「1」の部分を、図8の「斜線部」として表し、図7の「0」の部分を、図8の「空白部」として表したものである。ソナグラムのパターンデータとしては、図7、図8の何れを用いても良い。しかし、後述するパターンマッチングの方法によっては、図7、図8の何れが適しているか異なる場合もあるため、図7、図8の何れかでパターンマッチングを行えるように構成しておくと良い。
【0089】
図4に戻り、特定音声認識装置100の警報出力部70は、ディスプレイ72とスピーカ74を含んでいる。そして、制御部30のCPU37から送出された、緊急車両が特定音声認識装置100に近づいている旨につき、メッセージデータ、或いは、画像データをディスプレイ72により出力し、報知する。また、緊急車両が特定音声認識装置100に近づいている旨につき、スピーカ74から音声で出力し、報知する。
【0090】
次に、図9を参照して、第3の実施形態の動作について説明する。
【0091】
本発明の第3の実施形態は、図2に示した特定音声認識装置100の機能構成を、図4に示すようなハードウェア構成として図示表現を変更したものである。従って、図9に示す動作は、図3に示した動作とほぼ同一であり、図9において図3に示す動作には同一の参照数字又は符号を付し、その説明を極力省略するものとする。
【0092】
図9は、第3の実施形態の動作を説明するシーケンス図である。
【0093】
図9において、特定音声認識装置100のマイク10は、マイク10周辺の音声を一定時間長の単位で取得し、音声データ抽出部20に送出する(図9のステップS1)。その後、次の時間長の音声を取得するためステップS1を繰り返す。
【0094】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをアンプ22で増幅し、バンドパスフィルタ24に送出する。バンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲(例えば、250〜900Hz)のみの音声データを通し、A/Dコンバータ26に送出する。A/Dコンバータ26は、バンドパスフィルタ24から受信したアナログ音声データをデジタル音声データに変換する(ステップS2−1)。そして、変換したデジタル音声データを制御部30に送出する。
【0095】
一方、特定音声認識装置100のGPS受信部40は、一定時間間隔で、複数のGPS衛星が送出する電波をGPSアンテナ42で受信する。そして、GPSアンテナ42で受信した電波情報に基づき、GPSレシーバ44は、特定音声認識装置100の現在位置を算出する(ステップS3−1)。そして、算出した現在位置の情報を制御部30に送出する。その後、次の時間間隔でのGPS衛星からの電波を受信するため、ステップS3−1を繰り返す。
【0096】
GPS受信部40のGPSレシーバ44から現在位置を受信した制御部30のCPU37は、現在位置特定部(図2の現在位置特定部32)のプログラムを実行させる。そして、CPU37は受信した現在位置が、どの自治体の中の位置に相当するかについて、図4に示した地図データ記憶部50の地図データ52を参照して特定する。さらに、CPU37は、特定した自治体の近辺の他の2〜3の自治体も特定する(ステップS4−1)。
【0097】
次に、制御部30のCPU37は、緊急車両音声データ選択部(図2の緊急車両音声データ選択部34)のプログラムを実行させる。そして、ステップS4−1で特定した複数の自治体が用いている緊急車両音声データを、図4に示した緊急車両音声データ記憶部60の緊急車両音声データ62から抽出する(ステップS5−1)。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0098】
一方、制御部30のCPU37は、音声データ抽出部20のA/Dコンバータ26からデジタル音声データを受信すると、警報音認識部(図2の警報音認識部36)のプログラムを実行させる。そして、CPU37は先ず、デジタル音声データをソナグラムの形の3次元データに変換し(受信ソナグラムデータと称している)、RAM39に記憶させる。次に、CPU37は、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを比較する(ステップS6−1)。そして、CPU37は、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する(ステップS7−1)。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行う。
【0099】
図9のステップS7−1における判定で、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致すると判定した場合(ステップS7−1で「一致」)、制御部30のCPU37は、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨の緊急車両接近警告画像データ、緊急車両接近警告メッセージデータ等を、ROM38から読み出し、特定音声認識装置100の警報出力部70に通知する。警報出力部70は、緊急車両が近づいている旨を、画像データ、或いはメッセージデータによりディスプレイ72に出力し、報知する。又は、緊急車両が近づいている旨を、スピーカ74からメッセージデータとして音声で出力し、報知する(ステップS8−1)。そして、特定音声認識装置100の利用者がこの報知に気づき、報知の停止操作(例えば、図示しない報知停止釦の押下など)を行った場合、警報出力部70は警報の報知を停止し、もとの初期状態に戻る。
【0100】
ステップS7−1で、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れとも一致しない場合(ステップS7−1で「不一致」)、制御部30のCPU37は、何もせず、もとの初期状態に戻る。
【0101】
以上、本発明の第3の実施形態の動作について説明した。
【0102】
前述したように、本発明の第3の実施形態は、図2に示した第2の実施形態の特定音声認識装置の機能構成を、図4に示したようなハードウェア構成として詳細化したものである。従って、以下において第3の実施形態の全体の機能説明は省略し、第3の実施形態に特有の箇所に関してのみ説明するものとする。
【0103】
以上説明したように、本実施形態の特定音声認識装置100の音声データ抽出部20は、アンプ22とバンドパスフィルタ24とA/Dコンバータ26を含んでいる。そして、バンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲のみの音声データを通すようになっている。
【0104】
また、特定音声認識装置100の制御部30に接続される地図データ記憶部50は、緯度、経度のデータと共に、当該緯度、経度の地点がどの自治体に属しているかの情報も併せて表現する地図データ52を含んでいる。
【0105】
さらに、特定音声認識装置100の制御部30に接続される緊急車両音声データ記憶部60は、自治体毎に、当該自治体の緊急車両が吹鳴する緊急車両音声データをソナグラムの形で記憶する緊急車両音声データ62を含んでいる。
【0106】
また、制御部30に含まれるCPU37は、ROM38に記憶されている現在位置特定部プログラム、緊急車両音声データ選択部プログラム、警報音認識部プログラムなどを実行させ、以下に示す動作を行う。
【0107】
すなわち、CPU37は、GPS受信部40のGPSレシーバ44から現在位置を受信した場合、受信した現在位置が、どの自治体の中の位置に相当するかについて、地図データ記憶部50の地図データ52を参照して特定する。また、CPU37は、特定した自治体の近辺の他の2〜3の自治体も特定する。
【0108】
次に、CPU37は、特定した複数の自治体が用いている緊急車両音声データを、緊急車両音声データ記憶部60の緊急車両音声データ62から、抽出する。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0109】
一方、CPU37は、音声データ抽出部20のA/Dコンバータ26からデジタル音声データを受信すると、先ず、デジタル音声データをソナグラムの形の3次元データに変換する(受信ソナグラムデータと称している)。次に、CPU37は、受信ソナグラムデータが、現在位置近辺の複数の自治体の複数の緊急車両音声データ(これらもソナグラムで表されるデータとなっている)の何れかと一致するかを判定する。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行う。
【0110】
そして、CPU37は、受信ソナグラムデータが、現在位置近辺の複数の自治体の複数の緊急車両音声データの何れかと一致すると判定した場合、緊急車両が近づいている旨を制御部30に接続された警報出力部70に通知する。
【0111】
そして、CPU37から緊急車両が近づいている旨の通知を受けた場合、警報出力部70は、緊急車両が近づいている旨を、画像データ、メッセージデータ、或いは音声により、ディスプレイ72やスピーカ74により出力し、報知する、ようになっている。
【0112】
従って、本実施形態によれば、自治体毎に、当該自治体が使用している緊急車両音声データ(サイレン音など)が異なっている場合であっても、車両外の音声データが緊急車両の吹鳴する緊急車両音声データに一致するかを判定できる。そして、一致する場合には、緊急車両が近づいている旨を車両内に報知することが可能となる。
【0113】
また、バンドパスフィルタ24により、緊急車両が吹鳴する周波数範囲の音声データのみを抽出可能となり、受信した音声データを効率よくソナグラムに変換できる。
【0114】
さらに、緊急車両音声データ62には、全自治体の緊急車両が吹鳴する音声データが多数記憶されているが、特定音声認識装置100を搭載する車両の現在位置近傍のいくつかの自治体の緊急車両音声データだけを抽出できる。従って、ソナグラムのデータ形のパターンマッチングの回数を大幅に削減可能となる。
[第4の実施形態]
次に、図4に示した第3の実施形態の構成要素の一部を、カーナビゲーションシステムに代替させるよう構成した本発明の第4の実施形態について説明する。
【0115】
図10は、本発明の特定音声認識装置の第4の実施形態を示すブロック図である。なお、図10において図4の構成要素に対応するものは同一の参照数字または符号を付し、その説明を極力省略するものとする。
【0116】
図10に示す特定音声認識装置100−1は、マイク10と、音声データ抽出部20と、制御部30と、制御部30に接続された緊急車両音声データ記憶部60を含んでいる。
【0117】
マイク10は、図4と同様であり、マイク10周辺の音声を取得し、音声データ抽出部20に送出する。マイク10は、特定音声認識装置100−1を搭載する車両の外部で、かつ、外部の音声データを取得しやすい場所に設置されているものとする。
【0118】
音声データ抽出部20は、図4と同様であり、アンプ22と、バンドパスフィルタ24と、A/Dコンバータ26とを含んでいる。そして、各構成要素の機能も図4で示したと同様であるため、これ以上の説明は省略する。
【0119】
制御部30は、特定音声認識装置100−1の演算処理を行うCPU37−1を含んでいる。また、制御部30は、CPU37−1を動作させるプログラム等を記憶するROM38−1を含んでいる。ROM38−1に記憶されCPU37−1を動作させるプログラムとしては、第2の実施形態で説明した緊急車両音声データ選択部34、警報音認識部36の機能を実行するプログラムも含まれている。
【0120】
さらに、制御部30は、CPU37−1のワークエリアとして各種のデータを記憶するRAM39−1を含んでいる。
【0121】
また、制御部30に接続される緊急車両音声データ記憶部60は、図4と同様であり、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ62を含んでいる。そして、緊急車両音声データ62は、図4と同様に、緊急車両の音声データをソナグラムの形で記憶している。
【0122】
また、図10に示す特定音声認識装置100−1は、カーナビゲーションシステム80を含んでいる。
【0123】
カーナビゲーションシステム80は、GPS受信部40−1と、カーナビゲーションシステム80の演算処理を行うCPU82を含み、CPU82に接続される地図データ記憶部50−1を含んでいる。
【0124】
GPS受信部40−1は、GPS衛星からの電波を受信するGPSアンテナ42−1を含んでいる。また、GPSアンテナ42−1から受信した電波に基づいて、特定音声認識装置100−1の現在位置データを、例えば、緯度、経度のデータとして算出するGPSレシーバ44−1を含んでいる。GPSレシーバ44−1は、算出した現在位置データをCPU82に送出する。
【0125】
CPU82には、CPU82を動作させるプログラムや、緊急車両接近警告画像データ、緊急車両接近警告メッセージデータ等を記憶するROM84と、CPU82のワークエリアとして各種のデータを記憶するRAM86が接続されている。ROM84に記憶されCPU82を動作させるプログラムとしては、カーナビゲーションの機能や、第2の実施形態で説明した現在位置特定部32の機能を実行するプログラムも含まれている。
【0126】
また、CPU82には、カーナビゲーションを行うためのディスプレイ72−1や、音声を出力するスピーカ74−1も接続されている。
【0127】
地図データ記憶部50−1は、例えば、日本全土の地図データを、緯度、経度のデータと共に記憶する地図データ52−1を含んでいる。地図データ52−1は、さらに、当該緯度、経度の地点が日本のどの自治体(□□県、○○市、△△町、など)に属しているかの情報も記憶している。
【0128】
なお、上述したCPU37−1と、カーナビゲーションシステム80のCPU82は図示しないバス(bus)で接続されており、各種情報の送受信を相互に行うことが可能となっている。
【0129】
次に、図11を参照して、第4の実施形態の動作について説明する。
【0130】
本発明の第4の実施形態は、図4に示した第3の実施形態の構成要素の一部を、カーナビゲーションシステムに代替させるよう構成したものである。従って、図11に示す動作は、図9に示した動作とほぼ同一であり、図11において図9に示す動作には同一の参照数字又は符号を付し、その説明を極力省略するものとする。
【0131】
図11は、第3実施形態の動作を説明するシーケンス図である。
【0132】
図11において、特定音声認識装置100−1のマイク10は、マイク10周辺の音声を一定時間長の単位で取得し、音声データ抽出部20に送出する(図11のステップS1)。その後、次の時間長の音声を取得するためステップS1を繰り返す。
【0133】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをアンプ22で増幅し、バンドパスフィルタ24に送出する。バンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲(例えば、250〜900Hz)のみの音声データを通し、A/Dコンバータ26に送出する。A/Dコンバータ26は、バンドパスフィルタ24から受信したアナログ音声データをデジタル音声データに変換する(ステップS2−1)。そして、変換したデジタル音声データを制御部30に送出する。
【0134】
一方、特定音声認識装置100−1のカーナビゲーションシステム80のGPS受信部40−1は、一定時間間隔で、複数のGPS衛星が送出する電波をGPSアンテナ42−1で受信する。そして、GPSアンテナ42−1で受信した電波情報に基づき、GPSレシーバ44−1は、特定音声認識装置100−1の現在位置を算出する(ステップS3−2)。そして、算出した現在位置の情報をCPU82に送出する。その後、次の時間間隔でのGPS衛星からの電波を受信するため、ステップS3−2を繰り返す。
【0135】
GPS受信部40−1のGPSレシーバ44−1から現在位置を受信したカーナビゲーションシステム80のCPU82は、現在位置特定部(図2の現在位置特定部32)のプログラムを実行させる。そして、CPU82は受信した現在位置が、どの自治体の中の位置に相当するかについて、図10に示した地図データ記憶部50−1の地図データ52−1を参照して特定する。さらに、CPU82は、特定した自治体の近辺の他の2〜3の自治体も特定する(ステップS4−2)。そして、CPU82は、特定した複数の自治体の情報を、制御部30のCPU37−1に送出する。
【0136】
CPU82から、特定した複数の自治体情報を受信したCPU37−1は、緊急車両音声データ選択部(図2の緊急車両音声データ選択部34)のプログラムを実行させる。そして、ステップS4−2で特定した複数の自治体が用いている緊急車両音声データを、図10に示した緊急車両音声データ記憶部60の緊急車両音声データ62から抽出する(ステップS5−2)。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0137】
また、制御部30のCPU37−1は、音声データ抽出部20のA/Dコンバータ26からデジタル音声データを受信すると、警報音認識部(図2の警報音認識部36)のプログラムを実行させる。そして、CPU37−1は先ず、デジタル音声データをソナグラムの形の3次元データに変換し(受信ソナグラムデータと称している)、RAM39−1に記憶させる。次に、CPU37−1は、受信ソナグラムデータが、ステップS5−2で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを比較する(ステップS6−2)。そして、CPU37−1は、受信ソナグラムデータが、ステップS5−2で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する(ステップS7−2)。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行う。CPU37−1は、判定結果(「一致」、又は、「不一致」)をカーナビゲーションシステム80のCPU82に返送する。
【0138】
カーナビゲーションシステム80のCPU82は、判定結果が「一致」又は「不一致」を判定する(ステップS71−2)。
【0139】
図11のステップS71−2における判定結果が、「一致」である場合(ステップS71−2で「一致」)、カーナビゲーションシステム80のCPU82は、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨の緊急車両接近警告画像データ、緊急車両接近警告メッセージデータ等を、ROM84から読み出し、ディスプレイ72−1、スピーカ74−1に通知する。ディスプレイ72−1は、緊急車両が近づいている旨を、画像データとして出力し、報知する。同時に/又は、スピーカ74−1は、緊急車両が近づいている旨を、音声で出力し、報知する(ステップS8−2)。そして、特定音声認識装置100−1の利用者がこの報知に気づき、報知の停止操作を行った場合、ディスプレイ72−1やスピーカ74−1は報知を停止し、もとの状態に戻る。
【0140】
ステップS71−2における判定結果が「不一致」(ステップS71−2「不一致」)、の場合、カーナビゲーションシステム80のCPU82は、何もせず、もとの状態に戻る。
【0141】
以上、本発明の第4の実施形態の動作について説明した。
【0142】
前述したように、本発明の第4の実施形態は、図4に示した第3の実施形態の構成要素の一部を、カーナビゲーションシステム80に代替させるように構成したものである。
【0143】
従って、本実施形態によれば、第3の実施形態におけると同様の、以下のような効果を奏することができる。
【0144】
すなわち、自治体毎に、当該自治体が使用している緊急車両音声データ(サイレン音など)が異なっている場合であっても、車両外の音声データが緊急車両の吹鳴する緊急車両音声データに一致するかを判定できる。そして、一致する場合には、緊急車両が近づいている旨を車両内に報知することが可能となる。
【0145】
また、バンドパスフィルタ24により、緊急車両が吹鳴する周波数範囲の音声データのみを抽出可能となり、受信した音声データを効率よくソナグラムに変換できる。
【0146】
さらに、緊急車両音声データ62には、全自治体の緊急車両が吹鳴する音声データが多数記憶されているが、特定音声認識装置100−1を搭載する車両の現在位置近傍のいくつかの自治体の緊急車両音声データだけを抽出できる。従って、ソナグラムのデータ形のパターンマッチングの回数を大幅に削減可能となる。
【0147】
加えて、第4の実施形態によれば、既存のカーナビゲーションシステム80を利用するようにしているため、特定音声認識装置100−1のコスト低減を図ることが可能となる。
【0148】
以上の各実施形態では、領域固有音声として主に緊急車両の吹鳴するサイレン音を例として説明してきたが、これに限られない。上記各実施形態は、地理的領域に固有な音声について適用可能である。また、地理的領域として自治体を代表的な例として説明してきたが、これに限られない。領域固有音声が聞かれる範囲として予め定められていれば、これを地理的領域とみなして各実施形態を適用することができる。
【符号の説明】
【0149】
2 音声取得部
3−2 現在位置認識特定部
3−6 音声認識結果報知部
4 現在位置生成部
6 領域固有音声記憶部
10 マイク
20 音声データ抽出部
22 アンプ
24 バンドパスフィルタ
26 A/Dコンバータ
30 制御部
32 現在位置特定部
34 緊急車両音声データ選択部
36 警報音認識部
37 CPU
37−1 CPU
38 ROM
38−1 ROM
39 RAM
39−1 RAM
40 GPS受信部
40−1 GPS受信部
42 GPSアンテナ
42−1 GPSアンテナ
44 GPSレシーバ
44−1 GPSレシーバ
50 地図データ記憶部
50−1 地図データ記憶部
52 地図データ
52−1 地図データ
60 緊急車両音声データ記憶部
62 緊急車両音声データ
70 警報出力部
72 ディスプレイ
72−1 ディスプレイ
74 スピーカ
74−1 スピーカ
80 カーナビゲーションシステム
82 CPU
84 ROM
86 RAM
100 特定音声認識装置
100−1 特定音声認識装置
600 ソナグラムパターンデータ(第一例)
700 ソナグラムパターンデータ(第二例)
【技術分野】
【0001】
本発明は、緊急車両のサイレン音等、ある地理的領域に固有な音声が検出された場合、その旨を報知する特定音声認識装置および特定音声認識方法に関する。
【背景技術】
【0002】
近年の道路交通法においては、緊急自動車(消防用自動車、救急用自動車その他の政令で定める自動車)がサイレン等を吹鳴しながら接近してきたときは、車両は、道路の左側に寄って、これに進路を譲らなければならない。また、交差点又はその附近においては、車両は、交差点を避けて、道路の左側(或いは、必要な場合は右側)に寄って一時停止しなければならない、と定められている。なお、ここで、緊急自動車とは、当該緊急用務のため、政令で定めるところにより、運転中のものをいう。以下、緊急自動車を緊急車両とも称することとする。
【0003】
しかし、自家用車などで車両内のオーディオ機器等による音量が大きな場合、或いは、車両内外の騒音が大きな場合には、車両外の緊急車両のサイレン音を聞き逃す場合もありうる状態となり、車両の運転者が適切な行動をとれないこともあり得る。
【0004】
そこで、緊急車両のサイレン音を聞き逃さないようにするための一つの手法を提案しているものがある(例えば、特許文献1参照。)。
【0005】
上述した特許文献1「車外音導入装置」には、以下の記載がなされている。
【0006】
すなわち、車両の上面、後面及び左右外側面にそれぞれ車外音を収集する複数のマイクロホンが取り付けられている。そして、各マイクロホンから収集された車外音がマイクロコンピュータにより選別され、アンプにより増幅される。増幅された車外音は、それぞれマイクロホンの取り付け位置に対応して車両内に設置されているスピーカから車室内に放出されるように構成されている。このことにより、車両の運転者にとって有益な車外音を運転者が確実に聞き取ることができるようになる、としている。
【0007】
また、窓を閉め切ってカーステレオ等の音量を高くして聞いている場合にも、緊急自動車接近の状況を運転者に知らせる、ようにしているものもある(例えば、特許文献2参照。)。
【0008】
上述した特許文献2「緊急車両検知警報装置および位置表示装置」には、以下の記載がなされている。
【0009】
すなわち、マイクロホンの信号が緊急車両認識装置に入力され、緊急車両認識装置は緊急車両のサイレン音を検知し信号を表示コントローラと音声コントローラに出力する。表示コントローラは緊急車両認識装置から信号が入力したときは、内蔵する映像信号発生装置から警報画面の映像信号を発生させディスプレイに警報画面を表示させる。音声コントローラは内蔵する音声合成装置から警報のアナウンスを発生させてスピーカを駆動する、としている。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開平08−002339号公報(第2〜4頁、図1〜5)
【特許文献2】特開平06−325291号公報(第4〜6頁、図1〜5)
【発明の概要】
【発明が解決しようとする課題】
【0011】
上述した特許文献1、2に記載の手法においては、車外のマイクロホンにより収集された車外音が、事前に車両内の記憶手段に登録された緊急車両のサイレン音などの音声と一致するかの比較を行う。そして、一致した場合、緊急車両が接近していると認識し、車内の画面やスピーカで、運転者に報知するようになっている。特許文献2においては、車両内の記憶手段に登録された緊急車両のサイレン音などの音声は、消防用自動車、救急用自動車、警察関係自動車(パトカー、など)などに分かれて記憶されている。
【0012】
しかし、緊急車両のサイレン音などの音声データは、自治体などにより異なる場合があるにも拘らず、上述した特許文献1、2においては、このことが考慮されていない、という課題を有している。
【0013】
すなわち、モーターサイレンを使用する消防用自動車などの場合、サイレン音の周波数は連続して所定の時間の間で変化するようになっている。そして、使用する周波数の目安は、250〜850Hz程度となっている場合が多い。また、交差点等を通過するときに鳴らす場合のサイレンの周波数は900Hz程度となっている。なお、モーターサイレンとは、モーターで羽を回して音を出す仕組みのサイレンであるが、近年においては、モーターサイレンの音を電子音で代替するようにしている場合もある。
【0014】
そして、サイレン音の周波数の変化の程度や、音の継続時間などに関しては、目安が示されているだけであるため、自治体毎に異なるサイレン音を使用する場合があり得るものとなっている。
【0015】
本発明は上述した課題を解決するためになされたものである。従って、本発明の目的は、
自治体などの地理的領域毎に、当該地理的領域で使用されている領域固有音声データ(サイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定することを可能とし、一致する場合には、その旨を車両内に報知することを可能とする、特定音声認識装置および特定音声認識方法、を提供することにある。
【課題を解決するための手段】
【0016】
上記の目的を達成するため、本発明の特定音声認識装置は、入力される周辺の音声を一定時間長の単位で取得し、デジタル音声データとして出力する音声取得部と、入力される所定の信号に基づき、自らの現在位置を算出して出力する現在位置生成部と、所定の地理的領域でのみ聞かれる領域固有音声を前記一定時間長以上の単位で前記地理的領域に対応付けて記憶する領域固有音声記憶部と、前記現在位置生成部から入力される前記現在位置が属する前記地理的領域である特定地理的領域を示す情報を出力する現在位置認識特定部と、入力される前記特定地理的領域につき前記領域固有音声記憶部から抽出した前記領域固有音声と、前記音声取得部から入力される前記デジタル音声データを比較し、両者が一致すると判定した場合、その旨を報知する報知信号を出力する音声認識結果報知部と
を含む。
【0017】
また、本発明の特定音声認識方法は、周辺の音声を一定時間長の単位でアナログ音声データとして取得し、前記アナログ音声データをA/D変換によってデジタル音声データに変換し、一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出し、前記現在位置に基づき、現在位置近傍の複数の自治体を特定し、前記特定した複数の自治体が用いている複数の緊急車両音声データを抽出し、前記デジタル音声データが、前記現在位置近傍の複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定し、一致すると判定した場合、緊急車両が近づいている旨を音声、メッセージデータ、或いは画像データにより出力し、報知する。
【発明の効果】
【0018】
本発明によれば、地理的領域(自治体など)毎に当該地理的領域が使用している領域固有音声(緊急車両の吹鳴するサイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定できる。そして、一致する場合、その旨を車両内に報知することが可能となる。
【図面の簡単な説明】
【0019】
【図1】本発明の特定音声認識装置の第1の実施形態を示すブロック図である。
【図2】本発明の特定音声認識装置の第2の実施形態を示すブロック図である。
【図3】特定音声認識装置の第2の実施形態の動作を説明するシーケンス図である。
【図4】本発明の特定音声認識装置の第3の実施形態を示すブロック図である。
【図5】デジタル音声データの波形の一例を示す図である。
【図6】周波数毎のパワースペクトルの波形データの一例を示す図である。
【図7】ソナグラムパターンデータのデータ形式の一例を示す図である。
【図8】ソナグラムのパターンデータの表示例の一例を示す図である。
【図9】特定音声認識装置の第3の実施形態の動作を説明するシーケンス図である。
【図10】本発明の特定音声認識装置の第4の実施形態を示すブロック図である。
【図11】特定音声認識装置の第3実施形態の動作を説明するシーケンス図ある。
【発明を実施するための形態】
【0020】
次に、本発明の実施形態について図面を参照して説明する。
[第1の実施形態]
【0021】
図1は、本発明の特定音声認識装置の第1の実施形態を示すブロック図である。
【0022】
図1に示す特定音声認識装置100は、音声取得部2と、現在位置生成部4と、領域固有音声記憶部6を含んでいる。また、特定音声認識装置100は、現在位置認識特定部3−2と、音声認識結果報知部3−6を含んでいる。
【0023】
音声取得部2は、特定音声認識装置100を搭載する車両の周辺の音声を、一定時間長の単位で取得し、デジタル音声データとして音声認識結果報知部3−6へ出力する。
【0024】
現在位置生成部4は、GPS衛星から受信する電波信号に基づき、特定音声認識装置100の現在位置を算出し、現在位置認識特定部3−2へ出力する。
【0025】
領域固有音声記憶部6は、自治体などの特定の地理的領域でのみ聞かれる緊急車両の吹鳴するサイレン音などを、領域固有音声として記憶する。なお、前記の領域固有音声は、前記の地理的領域と対応付けを行って記憶する。
【0026】
現在位置認識特定部3−2は、現在位置生成部4から入力された現在位置が、前記の地理的領域の内の何れに位置するかを特定し、特定地理的領域の情報として音声認識結果報知部3−6へ出力する。
【0027】
音声認識結果報知部3−6は、現在位置認識特定部3−2から入力した特定地理的領域に基づき、領域固有音声記憶部6を検索し、特定地理的領域に対応する領域固有音声を抽出する。そして、抽出した領域固有音声と、音声取得部2から入力したデジタル音声データを比較する。比較の結果、両者が一致する場合、特定音声認識装置100を搭載する車両に、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨を報知する報知信号を、特定音声認識装置100を搭載する車両内に出力する。
【0028】
以上説明したように、本実施形態の特定音声認識装置100は、入力される周辺の音声を一定時間長の単位で取得し、デジタル音声データとして出力する音声取得部2を含んでいる。
【0029】
また、入力される所定の信号に基づき、自らの現在位置を算出して出力する現在位置生成部4を含んでいる。
【0030】
さらに、所定の地理的領域でのみ聞かれる領域固有音声を前記一定時間長以上の単位で前記地理的領域に対応付けて記憶する領域固有音声記憶部6を含んでいる。
【0031】
また、前記現在位置生成部4から入力される前記現在位置が属する前記地理的領域である特定地理的領域を示す情報を出力する現在位置認識特定部3−2を含んでいる。
【0032】
さらに、入力される前記特定地理的領域につき前記領域固有音声記憶部6から抽出した前記領域固有音声と、前記音声取得部2から入力される前記デジタル音声データを比較する音声認識結果報知部3−6を含んでいる。また、前記音声認識結果報知部3−6は、前記領域固有音声と前記デジタル音声データの両者が一致すると判定した場合、その旨を報知する報知信号を出力する、ようになっている。
【0033】
従って、本実施形態によれば、地理的領域(自治体など)毎に当該地理的領域が使用している領域固有音声(緊急車両の吹鳴するサイレン音など)が異なっている場合であっても、取得した周辺の音声が特定の地理的領域の領域固有音声に一致するかを判定できる。そして、一致する場合、その旨を車両内に報知することが可能となる。
[第2の実施形態]
図2は、本発明の特定音声認識装置の第2の実施形態を示すブロック図である。
【0034】
図2に示す特定音声認識装置100は、図1の音声取得部2に相当するマイク10と、音声データ抽出部20と、を含んでいる。また、制御部30を含んでいる。
【0035】
さらに、図1の現在位置生成部4に相当するGPS(Global Positioning System:全地球測位システム)受信部40を含んでいる。
【0036】
また、図1の領域固有音声記憶部6に相当する制御部30に接続された緊急車両音声データ記憶部60を含んでいる。
【0037】
さらに、特定音声認識装置100は、図1の現在位置認識特定部3−2に相当する制御部30に接続された地図データ記憶部50と、制御部30に含まれる現在位置特定部32と、を含んでいる。
【0038】
また、図1の音声認識結果報知部3−6に相当する緊急車両音声データ選択部34と、警報音認識部36を含んでいる。さらに、特定音声認識装置100は、制御部30に接続される警報出力部70を含んでいる。
【0039】
マイク10は、特定音声認識装置100を搭載する車両の外部に設置され、マイク10周辺の音声を取得し、音声データ抽出部20に送出する。
【0040】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをデジタル音声データに変換し、制御部30に送出する。
【0041】
GPS受信部40は、GPS衛星からの電波を受信し、特定音声認識装置100の現在位置データを、例えば、緯度、経度のデータとして算出し、制御部30に送出する。
【0042】
地図データ記憶部50は、例えば、日本全土の地図データを、緯度、経度のデータと共に記憶しており、さらに、当該緯度、経度の地点が日本のどの自治体(□□県、○○市、△△町、など)に属しているかの情報も記憶している。
【0043】
緊急車両音声データ記憶部60は、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶している。緊急車両の種類は、例えば、消防用自動車、救急用自動車、パトロールカー、などに分け、緊急車両音声データ記憶部60は、緊急車両の種類毎の緊急車両音声データを記憶している。なお、本実施形態における緊急車両の音声データは、音声波形の情報を、時間、周波数、強度の3次元で表現したソナグラム(sonagram:声紋)の形で記憶されているものとする。ソナグラムの詳細については、第3の実施形態において後述する。
【0044】
制御部30の現在位置特定部32は、GPS受信部40から特定音声認識装置100の現在位置データを受信する。そして、現在位置特定部32は、受信した現在位置データが、どの自治体の中の位置に相当するかについて、地図データ記憶部50を参照して特定する。なお、現在位置特定部32は、特定した自治体の近辺の他の2〜3の自治体も特定する。これは、特定音声認識装置100が、或る自治体の境界あたりに位置している場合、現在位置データが示す自治体の緊急車両の他に、当該自治体の近辺の他の自治体の緊急車両の緊急車両音声データを取得する場合も有り得ることを考慮したためである。現在位置特定部32は、現在位置特定部32が特定した複数の自治体の情報を、緊急車両音声データ選択部34に送出する。
【0045】
制御部30の緊急車両音声データ選択部34は、現在位置特定部32から受信した複数の自治体の情報に基づき、当該複数の自治体の緊急車両の緊急車両音声データを、緊急車両音声データ記憶部60から抽出し、警報音認識部36に送出する。
【0046】
制御部30の警報音認識部36は、音声データ抽出部20から受信したデジタル音声データを、先ず、ソナグラムの形の3次元データに変換する(以降、受信ソナグラムデータと称するものとする)。次に、受信ソナグラムデータと、緊急車両音声データ選択部34から受信した複数の自治体の緊急車両の緊急車両音声データ(ソナグラムの形になっている)とを比較する。緊急車両音声データ選択部34から受信した複数の自治体の緊急車両音声データの何れかが、受信ソナグラムデータと一致した場合、その受信ソナグラムデータは緊急車両が吹鳴している音声データであると判断する。そして、緊急車両の緊急車両音声データであると判断した場合、警報音認識部36は、緊急車両が近づいている旨を、警報出力部70に送出する。
【0047】
警報出力部70は、緊急車両が特定音声認識装置100に近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する。
【0048】
次に、図3を参照して、本実施形態の動作について説明する。
【0049】
図3は、本実施形態の動作を説明するシーケンス図である。
【0050】
図3において、特定音声認識装置100のマイク10は、マイク10周辺の音声を一定時間長の単位で取得し、音声データ抽出部20に送出する(図3のステップS1)。その後、次の時間長の音声を取得するためステップS1を繰り返す。
【0051】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをデジタル音声データに変換(A/D変換:Analogue to Digital Conversion)する(ステップS2)。そして、変換したデジタル音声データを制御部30に送出する。
【0052】
一方、特定音声認識装置100のGPS受信部40は、一定時間間隔で、複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、特定音声認識装置100の現在位置を算出する(ステップS3)。そして、算出した現在位置の情報を制御部30に送出する。その後、次の時間間隔でのGPS衛星からの電波を受信するため、ステップS3を繰り返す。
【0053】
GPS受信部40から現在位置を受信した制御部30は、受信した現在位置が、どの自治体の中の位置に相当するかについて、図2に示した地図データ記憶部50を参照して特定する。さらに、制御部30は、特定した自治体の近辺の他の2〜3の自治体も特定する(ステップS4)。
【0054】
次に、制御部30は、特定した複数の自治体が用いている緊急車両音声データを、図2に示した緊急車両音声データ記憶部60から抽出する(ステップS5)。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0055】
一方、制御部30は、音声データ抽出部20から受信したデジタル音声データを、先ず、
ソナグラムの形の3次元データに変換する(受信ソナグラムデータと称している)。
【0056】
次に、制御部30は、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データ(これらもソナグラムで表されるデータとなっている)の何れかと一致するかを比較する(ステップS6)。そして、制御部30は、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する(ステップS7)。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行うと良い。
【0057】
ここで、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致すると判定した場合(ステップS7で「一致」)、制御部30は、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨を、特定音声認識装置100の警報出力部70に通知する。警報出力部70は、緊急車両が近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する(ステップS8)。そして、特定音声認識装置100の利用者がこの報知に気づき、報知の停止操作(例えば、図示しない報知停止釦の押下など)を行った場合、警報出力部70は警報の報知を停止し、もとの初期状態に戻る。
【0058】
ステップS7で、受信ソナグラムデータが、ステップS5で抽出した複数の自治体の複数の緊急車両音声データの何れとも一致しない場合(ステップS7で「不一致」)、制御部30は、何もせず、もとの初期状態に戻る。
【0059】
以上、本発明の第2の実施形態の動作について説明した。
【0060】
以上説明したように、本実施形態の特定音声認識装置100は、周辺の音声を一定時間長の単位で取得するマイク10と、前記マイク10が取得したアナログ音声データをA/D変換しデジタル音声データとして制御部30に送出する音声データ抽出部20と、を含んでいる。
【0061】
また、一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出して前記制御部30に送出するGPS受信部40と、を含んでいる。
【0062】
さらに、前記制御部30に接続され、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ記憶部60と、を含んでいる。
【0063】
また、前記制御部に接続され、地図データを記憶する地図データ記憶部50を含んでいる。
【0064】
さらに、前記制御部30に含まれ、前記GPS受信部40から受信した現在位置に基づき、現在位置近傍の複数の自治体を、前記地図データ記憶部50を参照して特定する現在位置特定部32、を含んでいる。
【0065】
また、前記制御部30に含まれ、前記現在位置特定部が特定した複数の自治体が用いている緊急車両音声データを、前記緊急車両音声データ記憶部60から抽出する緊急車両音声データ選択部34と、を含んでいる。
【0066】
さらに、前記音声データ抽出部20から受信したデジタル音声データが、前記緊急車両音声データ選択部34が抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する警報音認識部36を含んでいる。そして、前記警報音認識部36は、一致すると判定した場合、緊急車両が近づいている旨を前記制御部30に接続された警報出力部70に通知する。
【0067】
そして、前記警報出力部70は、緊急車両が近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する、ようになっている。
【0068】
従って、本実施形態によれば、自治体毎に、当該自治体が使用している緊急車両音声データ(サイレン音など)が異なっている場合であっても、車両外の音声データが緊急車両の吹鳴する緊急車両音声データに一致するかを判定できる。そして、一致する場合には、緊急車両が近づいている旨を車両内に報知することが可能となる。
[第3の実施形態]
次に、図2に示した第2の実施形態をさらに具体化した本発明による第3の実施形態について説明する。
【0069】
図4は、本発明の特定音声認識装置の第3の実施形態を示すブロック図である。図4は、図2に示した特定音声認識装置についてさらに詳細に説明するブロック図である。従って、図4において、図2の構成要素に対応するものは同一の参照数字または符号を付し、その説明を極力省略するものとする。
【0070】
図4に示す特定音声認識装置100は、図2と同様に、マイク10と、音声データ抽出部20と、制御部30と、GPS受信部40を含んでいる。また、特定音声認識装置100は、制御部30に接続された地図データ記憶部50と、緊急車両音声データ記憶部60と、警報出力部70を含んでいる。
【0071】
マイク10は、マイク10周辺の音声を取得し、音声データ抽出部20に送出する。マイク10は、特定音声認識装置100を搭載する車両の外部で、かつ、外部の音声データを取得しやすい場所に設置されているものとする。
【0072】
音声データ抽出部20は、アンプ(amplifier)22と、バンドパスフィルタ(Band Pass Filter)24と、A/Dコンバータ(Analogue to Digital Converter:A/D変換器)26とを含んでいる。
【0073】
アンプ22は、マイク10から送出されたアナログ音声データを増幅し、バンドパスフィルタ24に送出する。
【0074】
バンドパスフィルタ24は、通常、必要な範囲の周波数のみ通し、他の周波数は通さないフィルタ回路である。本実施形態のバンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲(例えば、250〜900Hz)のみの音声データを通すものとし、
当該音声データをA/Dコンバータ26に送出する。
【0075】
A/Dコンバータ26は、バンドパスフィルタ24から受信したアナログの音声データをデジタル音声データに変換し、制御部30に送出する。
【0076】
制御部30は、特定音声認識装置100の演算処理を行うCPU(Central Processing Unit:中央処理装置)37を含んでいる。また、制御部30は、CPU37を動作させるプログラムや、緊急車両接近警告画像データ、緊急車両接近警メッセージデータ等を記憶するROM(Read Only Memory:ロム)38を含んでいる。ROM38に記憶されCPU37を動作させるプログラムとしては、第2の実施形態で説明した現在位置特定部32、緊急車両音声データ選択部34、及び、警報音認識部36の機能を実行するプログラムも含まれている。
【0077】
さらに、制御部30は、CPU37のワークエリアとして各種のデータを記憶するRAM(Random Access Memory:ラム)39を含んでいる。
【0078】
GPS受信部40は、GPS衛星からの電波を受信するGPSアンテナ42と、GPSアンテナ42から受信した電波に基づいて、特定音声認識装置100の現在位置データを、例えば、緯度、経度のデータとして算出するGPSレシーバ44を含んでいる。GPSレシーバ44は、算出した現在位置データを制御部30に送出する。
【0079】
地図データ記憶部50は、例えば、日本全土の地図データを、緯度、経度のデータと共に記憶する地図データ52を含んでいる。地図データ52は、さらに、当該緯度、経度の地点が日本のどの自治体(□□県、○○市、△△町、など)に属しているかの情報も記憶している。
【0080】
緊急車両音声データ記憶部60は、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ62を含んでいる。緊急車両音声データ62は、緊急車両の種類として、例えば、消防用自動車、救急用自動車、パトロールカー、などに分けてそれぞれの音声データを記憶している。なお、本実施形態における緊急車両の音声データは、音声波形の情報を、時間、周波数、強度の3次元で表現したソナグラムの形で記憶されているものとする。
【0081】
ここで、図5、図6、図7、図8を参照して、本実施形態で使用するソナグラムについて説明しておく。
【0082】
図5は、音声データ抽出部20のA/Dコンバータ26が、制御部30に送出したデジタル音声データの波形の一例を示す図である。制御部30のCPU37はこのデジタル音声データをRAM39に記憶させる。図5に示すデジタル音声データは、一定時間の間隔に区切っておくものとし、各一定時間を「T1」〜「Tn」として表す。そして、CPU37はこのデジタル音声データを以下の手順でソナグラムの形のデータに変換する。
【0083】
すなわち、CPU37は、RAM39に記憶したデジタル音声データ(図5)を、一定時間「T1」〜「Tn」毎にフーリエ変換し、周波数毎のパワースペクトルの波形データを求める。図6は、例えば、一定時間「T1」における周波数毎のパワースペクトルの波形データの一例を示す図である。図6に示す波形データの周波数の範囲は、本実施形態の場合には、例えば、250〜900Hz(バンドパスフィルタ24でフィルタリングしたため)である。なお、フーリエ変換には、FFT(Fast Fourier Transform:高速フーリエ変換)を使用すれば、高速処理が可能となり、好都合である。
【0084】
次に、周波数毎のパワースペクトルの波形データ(図6)について、図6の中程に示す閾値200を越える周波数を求め、周波数と時間との対応データを求め、図7のような形でRAM39に記憶させる。ここで、図6は、前述したように、一定時間「T1」における周波数毎のパワースペクトルの波形データを示している。そして、図6の閾値200は、パワー、すなわち、各周波数の強度を、閾値200の上側(強度が強い)か下側(強度が弱い)かの2値に分類するための値となっている。閾値200の上側にある周波数を「1」で表し、閾値200の下側にある周波数を「0」で表せば、図7の最下行(「T1」時間の行601)のように、周波数「f1」〜「fm」(図7の641〜64m列)のデータとして示すことが出来る。
【0085】
一定時間「T2」〜「Tn」についても、図6と同様に、周波数毎のパワースペクトルの波形データを求める。そして、上記と同様に、それぞれ「閾値」の上側か下側かを「1」と「0」で表せば、図7の602行(「T2」時間の行)〜60n行(「Tn」時間の行)のような、周波数「f1」〜「fm」(図7の641〜64m列)のデータとして示すことが出来る。
【0086】
つまり、図7においては、図5に示したデジタル音声データを、時間(「T1」〜「Tn」)
、周波数(「f1」〜「fm」)、強度(「1」又は「0」)で表現したものである。従って、図7は、ソナグラムパターンデータのデータ形式の一例を示す図となっている。
【0087】
なお、図6に示した閾値200は、その値を変更可能なように構成しておくものとする。このように構成することにより、周波数毎の強度として表す値を、周囲の状況(騒音の大きさなど)に応じて変更することが可能となる。また、上記においては、閾値200を1つだけ設定し、強度を2値に分類する、として説明したが、これを、4値や8値など複数の強度に分類できよう、複数の閾値を設定できるようにしておいても良い。このように構成することにより、図7のソナグラムパターンデータ(第一例)600に示した強度を、2値だけでなく、4値や8値に変更し、より詳細なソナグラムのデータを得ることが可能となる。
【0088】
また、図8は、ソナグラムのパターンデータの表示例の一例を示す図であり、ソナグラムパターンデータ(第二例)700と称するものとする。つまり、図7に示した「1」の部分を、図8の「斜線部」として表し、図7の「0」の部分を、図8の「空白部」として表したものである。ソナグラムのパターンデータとしては、図7、図8の何れを用いても良い。しかし、後述するパターンマッチングの方法によっては、図7、図8の何れが適しているか異なる場合もあるため、図7、図8の何れかでパターンマッチングを行えるように構成しておくと良い。
【0089】
図4に戻り、特定音声認識装置100の警報出力部70は、ディスプレイ72とスピーカ74を含んでいる。そして、制御部30のCPU37から送出された、緊急車両が特定音声認識装置100に近づいている旨につき、メッセージデータ、或いは、画像データをディスプレイ72により出力し、報知する。また、緊急車両が特定音声認識装置100に近づいている旨につき、スピーカ74から音声で出力し、報知する。
【0090】
次に、図9を参照して、第3の実施形態の動作について説明する。
【0091】
本発明の第3の実施形態は、図2に示した特定音声認識装置100の機能構成を、図4に示すようなハードウェア構成として図示表現を変更したものである。従って、図9に示す動作は、図3に示した動作とほぼ同一であり、図9において図3に示す動作には同一の参照数字又は符号を付し、その説明を極力省略するものとする。
【0092】
図9は、第3の実施形態の動作を説明するシーケンス図である。
【0093】
図9において、特定音声認識装置100のマイク10は、マイク10周辺の音声を一定時間長の単位で取得し、音声データ抽出部20に送出する(図9のステップS1)。その後、次の時間長の音声を取得するためステップS1を繰り返す。
【0094】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをアンプ22で増幅し、バンドパスフィルタ24に送出する。バンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲(例えば、250〜900Hz)のみの音声データを通し、A/Dコンバータ26に送出する。A/Dコンバータ26は、バンドパスフィルタ24から受信したアナログ音声データをデジタル音声データに変換する(ステップS2−1)。そして、変換したデジタル音声データを制御部30に送出する。
【0095】
一方、特定音声認識装置100のGPS受信部40は、一定時間間隔で、複数のGPS衛星が送出する電波をGPSアンテナ42で受信する。そして、GPSアンテナ42で受信した電波情報に基づき、GPSレシーバ44は、特定音声認識装置100の現在位置を算出する(ステップS3−1)。そして、算出した現在位置の情報を制御部30に送出する。その後、次の時間間隔でのGPS衛星からの電波を受信するため、ステップS3−1を繰り返す。
【0096】
GPS受信部40のGPSレシーバ44から現在位置を受信した制御部30のCPU37は、現在位置特定部(図2の現在位置特定部32)のプログラムを実行させる。そして、CPU37は受信した現在位置が、どの自治体の中の位置に相当するかについて、図4に示した地図データ記憶部50の地図データ52を参照して特定する。さらに、CPU37は、特定した自治体の近辺の他の2〜3の自治体も特定する(ステップS4−1)。
【0097】
次に、制御部30のCPU37は、緊急車両音声データ選択部(図2の緊急車両音声データ選択部34)のプログラムを実行させる。そして、ステップS4−1で特定した複数の自治体が用いている緊急車両音声データを、図4に示した緊急車両音声データ記憶部60の緊急車両音声データ62から抽出する(ステップS5−1)。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0098】
一方、制御部30のCPU37は、音声データ抽出部20のA/Dコンバータ26からデジタル音声データを受信すると、警報音認識部(図2の警報音認識部36)のプログラムを実行させる。そして、CPU37は先ず、デジタル音声データをソナグラムの形の3次元データに変換し(受信ソナグラムデータと称している)、RAM39に記憶させる。次に、CPU37は、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを比較する(ステップS6−1)。そして、CPU37は、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する(ステップS7−1)。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行う。
【0099】
図9のステップS7−1における判定で、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致すると判定した場合(ステップS7−1で「一致」)、制御部30のCPU37は、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨の緊急車両接近警告画像データ、緊急車両接近警告メッセージデータ等を、ROM38から読み出し、特定音声認識装置100の警報出力部70に通知する。警報出力部70は、緊急車両が近づいている旨を、画像データ、或いはメッセージデータによりディスプレイ72に出力し、報知する。又は、緊急車両が近づいている旨を、スピーカ74からメッセージデータとして音声で出力し、報知する(ステップS8−1)。そして、特定音声認識装置100の利用者がこの報知に気づき、報知の停止操作(例えば、図示しない報知停止釦の押下など)を行った場合、警報出力部70は警報の報知を停止し、もとの初期状態に戻る。
【0100】
ステップS7−1で、受信ソナグラムデータが、ステップS5−1で抽出した複数の自治体の複数の緊急車両音声データの何れとも一致しない場合(ステップS7−1で「不一致」)、制御部30のCPU37は、何もせず、もとの初期状態に戻る。
【0101】
以上、本発明の第3の実施形態の動作について説明した。
【0102】
前述したように、本発明の第3の実施形態は、図2に示した第2の実施形態の特定音声認識装置の機能構成を、図4に示したようなハードウェア構成として詳細化したものである。従って、以下において第3の実施形態の全体の機能説明は省略し、第3の実施形態に特有の箇所に関してのみ説明するものとする。
【0103】
以上説明したように、本実施形態の特定音声認識装置100の音声データ抽出部20は、アンプ22とバンドパスフィルタ24とA/Dコンバータ26を含んでいる。そして、バンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲のみの音声データを通すようになっている。
【0104】
また、特定音声認識装置100の制御部30に接続される地図データ記憶部50は、緯度、経度のデータと共に、当該緯度、経度の地点がどの自治体に属しているかの情報も併せて表現する地図データ52を含んでいる。
【0105】
さらに、特定音声認識装置100の制御部30に接続される緊急車両音声データ記憶部60は、自治体毎に、当該自治体の緊急車両が吹鳴する緊急車両音声データをソナグラムの形で記憶する緊急車両音声データ62を含んでいる。
【0106】
また、制御部30に含まれるCPU37は、ROM38に記憶されている現在位置特定部プログラム、緊急車両音声データ選択部プログラム、警報音認識部プログラムなどを実行させ、以下に示す動作を行う。
【0107】
すなわち、CPU37は、GPS受信部40のGPSレシーバ44から現在位置を受信した場合、受信した現在位置が、どの自治体の中の位置に相当するかについて、地図データ記憶部50の地図データ52を参照して特定する。また、CPU37は、特定した自治体の近辺の他の2〜3の自治体も特定する。
【0108】
次に、CPU37は、特定した複数の自治体が用いている緊急車両音声データを、緊急車両音声データ記憶部60の緊急車両音声データ62から、抽出する。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0109】
一方、CPU37は、音声データ抽出部20のA/Dコンバータ26からデジタル音声データを受信すると、先ず、デジタル音声データをソナグラムの形の3次元データに変換する(受信ソナグラムデータと称している)。次に、CPU37は、受信ソナグラムデータが、現在位置近辺の複数の自治体の複数の緊急車両音声データ(これらもソナグラムで表されるデータとなっている)の何れかと一致するかを判定する。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行う。
【0110】
そして、CPU37は、受信ソナグラムデータが、現在位置近辺の複数の自治体の複数の緊急車両音声データの何れかと一致すると判定した場合、緊急車両が近づいている旨を制御部30に接続された警報出力部70に通知する。
【0111】
そして、CPU37から緊急車両が近づいている旨の通知を受けた場合、警報出力部70は、緊急車両が近づいている旨を、画像データ、メッセージデータ、或いは音声により、ディスプレイ72やスピーカ74により出力し、報知する、ようになっている。
【0112】
従って、本実施形態によれば、自治体毎に、当該自治体が使用している緊急車両音声データ(サイレン音など)が異なっている場合であっても、車両外の音声データが緊急車両の吹鳴する緊急車両音声データに一致するかを判定できる。そして、一致する場合には、緊急車両が近づいている旨を車両内に報知することが可能となる。
【0113】
また、バンドパスフィルタ24により、緊急車両が吹鳴する周波数範囲の音声データのみを抽出可能となり、受信した音声データを効率よくソナグラムに変換できる。
【0114】
さらに、緊急車両音声データ62には、全自治体の緊急車両が吹鳴する音声データが多数記憶されているが、特定音声認識装置100を搭載する車両の現在位置近傍のいくつかの自治体の緊急車両音声データだけを抽出できる。従って、ソナグラムのデータ形のパターンマッチングの回数を大幅に削減可能となる。
[第4の実施形態]
次に、図4に示した第3の実施形態の構成要素の一部を、カーナビゲーションシステムに代替させるよう構成した本発明の第4の実施形態について説明する。
【0115】
図10は、本発明の特定音声認識装置の第4の実施形態を示すブロック図である。なお、図10において図4の構成要素に対応するものは同一の参照数字または符号を付し、その説明を極力省略するものとする。
【0116】
図10に示す特定音声認識装置100−1は、マイク10と、音声データ抽出部20と、制御部30と、制御部30に接続された緊急車両音声データ記憶部60を含んでいる。
【0117】
マイク10は、図4と同様であり、マイク10周辺の音声を取得し、音声データ抽出部20に送出する。マイク10は、特定音声認識装置100−1を搭載する車両の外部で、かつ、外部の音声データを取得しやすい場所に設置されているものとする。
【0118】
音声データ抽出部20は、図4と同様であり、アンプ22と、バンドパスフィルタ24と、A/Dコンバータ26とを含んでいる。そして、各構成要素の機能も図4で示したと同様であるため、これ以上の説明は省略する。
【0119】
制御部30は、特定音声認識装置100−1の演算処理を行うCPU37−1を含んでいる。また、制御部30は、CPU37−1を動作させるプログラム等を記憶するROM38−1を含んでいる。ROM38−1に記憶されCPU37−1を動作させるプログラムとしては、第2の実施形態で説明した緊急車両音声データ選択部34、警報音認識部36の機能を実行するプログラムも含まれている。
【0120】
さらに、制御部30は、CPU37−1のワークエリアとして各種のデータを記憶するRAM39−1を含んでいる。
【0121】
また、制御部30に接続される緊急車両音声データ記憶部60は、図4と同様であり、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ62を含んでいる。そして、緊急車両音声データ62は、図4と同様に、緊急車両の音声データをソナグラムの形で記憶している。
【0122】
また、図10に示す特定音声認識装置100−1は、カーナビゲーションシステム80を含んでいる。
【0123】
カーナビゲーションシステム80は、GPS受信部40−1と、カーナビゲーションシステム80の演算処理を行うCPU82を含み、CPU82に接続される地図データ記憶部50−1を含んでいる。
【0124】
GPS受信部40−1は、GPS衛星からの電波を受信するGPSアンテナ42−1を含んでいる。また、GPSアンテナ42−1から受信した電波に基づいて、特定音声認識装置100−1の現在位置データを、例えば、緯度、経度のデータとして算出するGPSレシーバ44−1を含んでいる。GPSレシーバ44−1は、算出した現在位置データをCPU82に送出する。
【0125】
CPU82には、CPU82を動作させるプログラムや、緊急車両接近警告画像データ、緊急車両接近警告メッセージデータ等を記憶するROM84と、CPU82のワークエリアとして各種のデータを記憶するRAM86が接続されている。ROM84に記憶されCPU82を動作させるプログラムとしては、カーナビゲーションの機能や、第2の実施形態で説明した現在位置特定部32の機能を実行するプログラムも含まれている。
【0126】
また、CPU82には、カーナビゲーションを行うためのディスプレイ72−1や、音声を出力するスピーカ74−1も接続されている。
【0127】
地図データ記憶部50−1は、例えば、日本全土の地図データを、緯度、経度のデータと共に記憶する地図データ52−1を含んでいる。地図データ52−1は、さらに、当該緯度、経度の地点が日本のどの自治体(□□県、○○市、△△町、など)に属しているかの情報も記憶している。
【0128】
なお、上述したCPU37−1と、カーナビゲーションシステム80のCPU82は図示しないバス(bus)で接続されており、各種情報の送受信を相互に行うことが可能となっている。
【0129】
次に、図11を参照して、第4の実施形態の動作について説明する。
【0130】
本発明の第4の実施形態は、図4に示した第3の実施形態の構成要素の一部を、カーナビゲーションシステムに代替させるよう構成したものである。従って、図11に示す動作は、図9に示した動作とほぼ同一であり、図11において図9に示す動作には同一の参照数字又は符号を付し、その説明を極力省略するものとする。
【0131】
図11は、第3実施形態の動作を説明するシーケンス図である。
【0132】
図11において、特定音声認識装置100−1のマイク10は、マイク10周辺の音声を一定時間長の単位で取得し、音声データ抽出部20に送出する(図11のステップS1)。その後、次の時間長の音声を取得するためステップS1を繰り返す。
【0133】
音声データ抽出部20は、マイク10から送出されたアナログ音声データをアンプ22で増幅し、バンドパスフィルタ24に送出する。バンドパスフィルタ24は、緊急車両が吹鳴するサイレン音の周波数範囲(例えば、250〜900Hz)のみの音声データを通し、A/Dコンバータ26に送出する。A/Dコンバータ26は、バンドパスフィルタ24から受信したアナログ音声データをデジタル音声データに変換する(ステップS2−1)。そして、変換したデジタル音声データを制御部30に送出する。
【0134】
一方、特定音声認識装置100−1のカーナビゲーションシステム80のGPS受信部40−1は、一定時間間隔で、複数のGPS衛星が送出する電波をGPSアンテナ42−1で受信する。そして、GPSアンテナ42−1で受信した電波情報に基づき、GPSレシーバ44−1は、特定音声認識装置100−1の現在位置を算出する(ステップS3−2)。そして、算出した現在位置の情報をCPU82に送出する。その後、次の時間間隔でのGPS衛星からの電波を受信するため、ステップS3−2を繰り返す。
【0135】
GPS受信部40−1のGPSレシーバ44−1から現在位置を受信したカーナビゲーションシステム80のCPU82は、現在位置特定部(図2の現在位置特定部32)のプログラムを実行させる。そして、CPU82は受信した現在位置が、どの自治体の中の位置に相当するかについて、図10に示した地図データ記憶部50−1の地図データ52−1を参照して特定する。さらに、CPU82は、特定した自治体の近辺の他の2〜3の自治体も特定する(ステップS4−2)。そして、CPU82は、特定した複数の自治体の情報を、制御部30のCPU37−1に送出する。
【0136】
CPU82から、特定した複数の自治体情報を受信したCPU37−1は、緊急車両音声データ選択部(図2の緊急車両音声データ選択部34)のプログラムを実行させる。そして、ステップS4−2で特定した複数の自治体が用いている緊急車両音声データを、図10に示した緊急車両音声データ記憶部60の緊急車両音声データ62から抽出する(ステップS5−2)。ここで抽出した緊急車両音声データの数は、複数の自治体における複数の緊急車両の種類分有り、かつ、緊急車両音声データはソナグラムの形の3次元データとなっている。
【0137】
また、制御部30のCPU37−1は、音声データ抽出部20のA/Dコンバータ26からデジタル音声データを受信すると、警報音認識部(図2の警報音認識部36)のプログラムを実行させる。そして、CPU37−1は先ず、デジタル音声データをソナグラムの形の3次元データに変換し(受信ソナグラムデータと称している)、RAM39−1に記憶させる。次に、CPU37−1は、受信ソナグラムデータが、ステップS5−2で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを比較する(ステップS6−2)。そして、CPU37−1は、受信ソナグラムデータが、ステップS5−2で抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定する(ステップS7−2)。一致の判定は、ソナグラムで表されたデータ同士のパターンマッチングにより行う。CPU37−1は、判定結果(「一致」、又は、「不一致」)をカーナビゲーションシステム80のCPU82に返送する。
【0138】
カーナビゲーションシステム80のCPU82は、判定結果が「一致」又は「不一致」を判定する(ステップS71−2)。
【0139】
図11のステップS71−2における判定結果が、「一致」である場合(ステップS71−2で「一致」)、カーナビゲーションシステム80のCPU82は、緊急車両が近づいているものと判断する。そして、緊急車両が近づいている旨の緊急車両接近警告画像データ、緊急車両接近警告メッセージデータ等を、ROM84から読み出し、ディスプレイ72−1、スピーカ74−1に通知する。ディスプレイ72−1は、緊急車両が近づいている旨を、画像データとして出力し、報知する。同時に/又は、スピーカ74−1は、緊急車両が近づいている旨を、音声で出力し、報知する(ステップS8−2)。そして、特定音声認識装置100−1の利用者がこの報知に気づき、報知の停止操作を行った場合、ディスプレイ72−1やスピーカ74−1は報知を停止し、もとの状態に戻る。
【0140】
ステップS71−2における判定結果が「不一致」(ステップS71−2「不一致」)、の場合、カーナビゲーションシステム80のCPU82は、何もせず、もとの状態に戻る。
【0141】
以上、本発明の第4の実施形態の動作について説明した。
【0142】
前述したように、本発明の第4の実施形態は、図4に示した第3の実施形態の構成要素の一部を、カーナビゲーションシステム80に代替させるように構成したものである。
【0143】
従って、本実施形態によれば、第3の実施形態におけると同様の、以下のような効果を奏することができる。
【0144】
すなわち、自治体毎に、当該自治体が使用している緊急車両音声データ(サイレン音など)が異なっている場合であっても、車両外の音声データが緊急車両の吹鳴する緊急車両音声データに一致するかを判定できる。そして、一致する場合には、緊急車両が近づいている旨を車両内に報知することが可能となる。
【0145】
また、バンドパスフィルタ24により、緊急車両が吹鳴する周波数範囲の音声データのみを抽出可能となり、受信した音声データを効率よくソナグラムに変換できる。
【0146】
さらに、緊急車両音声データ62には、全自治体の緊急車両が吹鳴する音声データが多数記憶されているが、特定音声認識装置100−1を搭載する車両の現在位置近傍のいくつかの自治体の緊急車両音声データだけを抽出できる。従って、ソナグラムのデータ形のパターンマッチングの回数を大幅に削減可能となる。
【0147】
加えて、第4の実施形態によれば、既存のカーナビゲーションシステム80を利用するようにしているため、特定音声認識装置100−1のコスト低減を図ることが可能となる。
【0148】
以上の各実施形態では、領域固有音声として主に緊急車両の吹鳴するサイレン音を例として説明してきたが、これに限られない。上記各実施形態は、地理的領域に固有な音声について適用可能である。また、地理的領域として自治体を代表的な例として説明してきたが、これに限られない。領域固有音声が聞かれる範囲として予め定められていれば、これを地理的領域とみなして各実施形態を適用することができる。
【符号の説明】
【0149】
2 音声取得部
3−2 現在位置認識特定部
3−6 音声認識結果報知部
4 現在位置生成部
6 領域固有音声記憶部
10 マイク
20 音声データ抽出部
22 アンプ
24 バンドパスフィルタ
26 A/Dコンバータ
30 制御部
32 現在位置特定部
34 緊急車両音声データ選択部
36 警報音認識部
37 CPU
37−1 CPU
38 ROM
38−1 ROM
39 RAM
39−1 RAM
40 GPS受信部
40−1 GPS受信部
42 GPSアンテナ
42−1 GPSアンテナ
44 GPSレシーバ
44−1 GPSレシーバ
50 地図データ記憶部
50−1 地図データ記憶部
52 地図データ
52−1 地図データ
60 緊急車両音声データ記憶部
62 緊急車両音声データ
70 警報出力部
72 ディスプレイ
72−1 ディスプレイ
74 スピーカ
74−1 スピーカ
80 カーナビゲーションシステム
82 CPU
84 ROM
86 RAM
100 特定音声認識装置
100−1 特定音声認識装置
600 ソナグラムパターンデータ(第一例)
700 ソナグラムパターンデータ(第二例)
【特許請求の範囲】
【請求項1】
入力される周辺の音声を一定時間長の単位で取得し、デジタル音声データとして出力する音声取得部と、
入力される所定の信号に基づき、自らの現在位置を算出して出力する現在位置生成部と、
所定の地理的領域でのみ聞かれる領域固有音声を前記一定時間長以上の単位で前記地理的領域に対応付けて記憶する領域固有音声記憶部と、
前記現在位置生成部から入力される前記現在位置が属する前記地理的領域である特定地理的領域を示す情報を出力する現在位置認識特定部と、
入力される前記特定地理的領域につき前記領域固有音声記憶部から抽出した前記領域固有音声と、前記音声取得部から入力される前記デジタル音声データを比較し、両者が一致すると判定した場合、その旨を報知する報知信号を出力する音声認識結果報知部と
を含むことを特徴とする特定音声認識装置。
【請求項2】
前記音声取得部は、周辺の音声を一定時間長の単位で取得するマイクと、
前記マイクが取得したアナログ音声データをA/D変換しデジタル音声データとして制御部に送出する音声データ抽出部とを含み、
前記現在位置生成部は、一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出して前記制御部に送出するGPS受信部を含み、
前記領域固有音声記憶部は、前記制御部に接続され、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ記憶部、を含み、
前記現在位置認識特定部は、前記制御部に接続され、地図データを記憶する地図データ記憶部と、前記制御部に含まれ、前記GPS受信部から受信した現在位置に基づき、現在位置近傍の複数の自治体を、前記地図データ記憶部を参照して特定する現在位置特定部とを含み、
前記音声認識結果報知部は、前記制御部に含まれ、前記現在位置特定部が特定した複数の自治体が用いている緊急車両音声データを、前記緊急車両音声データ記憶部から抽出する緊急車両音声データ選択部と、
前記制御部に含まれ、前記音声データ抽出部から受信したデジタル音声データが、前記緊急車両音声データ選択部が抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定し、一致すると判定した場合、緊急車両が近づいている旨を前記制御部に接続された警報出力部に通知する警報音認識部と、を含み、
前記警報出力部は、前記警報音認識部からの通知が有った場合、緊急車両が近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する、
ことを特徴とする請求項1に記載の特定音声認識装置。
【請求項3】
前記音声データ抽出部は、バンドパスフィルタを含み、前記バンドパスフィルタは、自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データの周波数範囲の音声データのみを抽出する、
ことを特徴とする請求項2に記載の特定音声認識装置。
【請求項4】
前記緊急車両音声データ記憶部が記憶する音声データはソナグラムの形の音声データであり、
前記警報音認識部は、前記音声データ抽出部から受信したデジタル音声データをソナグラムの形の音声データに変換した後、前記緊急車両音声データ選択部が抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかをパターンマッチングにより判定する、
ことを特徴とする請求項2或いは請求項3の何れかに記載の特定音声認識装置。
【請求項5】
前記地図データをカーナビゲーションシステムに搭載し、前記カーナビゲーションシステムは、前記GPS受信部と前記現在位置特定部と前記警報出力部の機能を実行する、
ことを特徴とする、請求項2から請求項4の何れかに記載の特定音声認識装置。
【請求項6】
周辺の音声を一定時間長の単位でアナログ音声データとして取得し、
前記アナログ音声データをA/D変換によってデジタル音声データに変換し、
一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出し、
前記現在位置に基づき、現在位置近傍の複数の自治体を特定し、
前記特定した複数の自治体が用いている複数の緊急車両音声データを抽出し、
前記デジタル音声データが、前記現在位置近傍の複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定し、一致すると判定した場合、緊急車両が近づいている旨を音声、メッセージデータ、或いは画像データにより出力し、報知する、
ことを特徴とする特定音声認識方法。
【請求項7】
自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データの周波数範囲の音声データのみを前記アナログ音声データから抽出した後に前記A/D変換を行う、
ことを特徴とする請求項6に記載の特定音声認識方法。
【請求項8】
前記緊急車両音声データはソナグラムの形の音声データであり、
前記デジタル音声データをソナグラムの形の音声データに変換した後、前記現在位置近傍の複数の自治体の複数の緊急車両音声データの何れかと一致するかをパターンマッチングにより判定する、
ことを特徴とする請求項6或いは請求項7の何れかに記載の特定音声認識方法。
【請求項1】
入力される周辺の音声を一定時間長の単位で取得し、デジタル音声データとして出力する音声取得部と、
入力される所定の信号に基づき、自らの現在位置を算出して出力する現在位置生成部と、
所定の地理的領域でのみ聞かれる領域固有音声を前記一定時間長以上の単位で前記地理的領域に対応付けて記憶する領域固有音声記憶部と、
前記現在位置生成部から入力される前記現在位置が属する前記地理的領域である特定地理的領域を示す情報を出力する現在位置認識特定部と、
入力される前記特定地理的領域につき前記領域固有音声記憶部から抽出した前記領域固有音声と、前記音声取得部から入力される前記デジタル音声データを比較し、両者が一致すると判定した場合、その旨を報知する報知信号を出力する音声認識結果報知部と
を含むことを特徴とする特定音声認識装置。
【請求項2】
前記音声取得部は、周辺の音声を一定時間長の単位で取得するマイクと、
前記マイクが取得したアナログ音声データをA/D変換しデジタル音声データとして制御部に送出する音声データ抽出部とを含み、
前記現在位置生成部は、一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出して前記制御部に送出するGPS受信部を含み、
前記領域固有音声記憶部は、前記制御部に接続され、自治体毎に、当該自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データを記憶する緊急車両音声データ記憶部、を含み、
前記現在位置認識特定部は、前記制御部に接続され、地図データを記憶する地図データ記憶部と、前記制御部に含まれ、前記GPS受信部から受信した現在位置に基づき、現在位置近傍の複数の自治体を、前記地図データ記憶部を参照して特定する現在位置特定部とを含み、
前記音声認識結果報知部は、前記制御部に含まれ、前記現在位置特定部が特定した複数の自治体が用いている緊急車両音声データを、前記緊急車両音声データ記憶部から抽出する緊急車両音声データ選択部と、
前記制御部に含まれ、前記音声データ抽出部から受信したデジタル音声データが、前記緊急車両音声データ選択部が抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定し、一致すると判定した場合、緊急車両が近づいている旨を前記制御部に接続された警報出力部に通知する警報音認識部と、を含み、
前記警報出力部は、前記警報音認識部からの通知が有った場合、緊急車両が近づいている旨を、音声、メッセージデータ、或いは画像データにより出力し、報知する、
ことを特徴とする請求項1に記載の特定音声認識装置。
【請求項3】
前記音声データ抽出部は、バンドパスフィルタを含み、前記バンドパスフィルタは、自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データの周波数範囲の音声データのみを抽出する、
ことを特徴とする請求項2に記載の特定音声認識装置。
【請求項4】
前記緊急車両音声データ記憶部が記憶する音声データはソナグラムの形の音声データであり、
前記警報音認識部は、前記音声データ抽出部から受信したデジタル音声データをソナグラムの形の音声データに変換した後、前記緊急車両音声データ選択部が抽出した複数の自治体の複数の緊急車両音声データの何れかと一致するかをパターンマッチングにより判定する、
ことを特徴とする請求項2或いは請求項3の何れかに記載の特定音声認識装置。
【請求項5】
前記地図データをカーナビゲーションシステムに搭載し、前記カーナビゲーションシステムは、前記GPS受信部と前記現在位置特定部と前記警報出力部の機能を実行する、
ことを特徴とする、請求項2から請求項4の何れかに記載の特定音声認識装置。
【請求項6】
周辺の音声を一定時間長の単位でアナログ音声データとして取得し、
前記アナログ音声データをA/D変換によってデジタル音声データに変換し、
一定時間間隔で複数のGPS衛星が送出する電波を受信し、受信した電波情報に基づき、現在位置を算出し、
前記現在位置に基づき、現在位置近傍の複数の自治体を特定し、
前記特定した複数の自治体が用いている複数の緊急車両音声データを抽出し、
前記デジタル音声データが、前記現在位置近傍の複数の自治体の複数の緊急車両音声データの何れかと一致するかを判定し、一致すると判定した場合、緊急車両が近づいている旨を音声、メッセージデータ、或いは画像データにより出力し、報知する、
ことを特徴とする特定音声認識方法。
【請求項7】
自治体の緊急車両が吹鳴するサイレン音などの緊急車両音声データの周波数範囲の音声データのみを前記アナログ音声データから抽出した後に前記A/D変換を行う、
ことを特徴とする請求項6に記載の特定音声認識方法。
【請求項8】
前記緊急車両音声データはソナグラムの形の音声データであり、
前記デジタル音声データをソナグラムの形の音声データに変換した後、前記現在位置近傍の複数の自治体の複数の緊急車両音声データの何れかと一致するかをパターンマッチングにより判定する、
ことを特徴とする請求項6或いは請求項7の何れかに記載の特定音声認識方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2012−59203(P2012−59203A)
【公開日】平成24年3月22日(2012.3.22)
【国際特許分類】
【出願番号】特願2010−204440(P2010−204440)
【出願日】平成22年9月13日(2010.9.13)
【出願人】(000197366)NECアクセステクニカ株式会社 (1,236)
【Fターム(参考)】
【公開日】平成24年3月22日(2012.3.22)
【国際特許分類】
【出願日】平成22年9月13日(2010.9.13)
【出願人】(000197366)NECアクセステクニカ株式会社 (1,236)
【Fターム(参考)】
[ Back to top ]