説明

音声認識用マイクロホンシステム

【課題】本来音声認識用マイクロホンによってのみ受信されるべき音声が騒音除去用の騒音信号に混入してしまうことを抑制する。
【解決手段】騒音源11を内包するロボット筐体10の表面に設置された騒音用マイクロホン12は、エンクロージャー13によって覆われることにより、オペレータが発声した音声が入らぬ様、遮音されている。ロボット筐体10外部には、音声用マイクロホン14が設置されている。騒音用マイクロホン12が受信した振動音を騒音に変換するための周波数特性補正用フィルタ25の伝達が、騒音推定手段26にセットされている。騒音推定手段26は、騒音用マイクロホン12からの振動音観測信号に周波数特性補正用フィルタ25を施すことにより、騒音を推定する。騒音除去手段27は、音声用マイクロホン14からの観測信号及び推定された騒音に基づいて2チャンネルスペクトルサブトラクション法による処理を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識用マイクロホンからの音声信号から騒音成分を除去することができる音声認識用マイクロホンシステムに、関する。
【背景技術】
【0002】
音声認識の技術は、例えば、産業用ロボットやヒューマノイドのようなロボットや、冷蔵庫,洗濯機等の家電製品において、オペレータの肉声によって命令を入力できるようにするために、用いられる。即ち、オペレータが発声を行うと、音声認識用マイクロホンが音声を受信して音声信号に変換し、音声解析部が、音声信号を文字列に変換し、当該文字列中に含まれる何れかのコマンド相当の文字列を抽出することにより、入力されたコマンドを認識する。そして、認識されたコマンドに応じて、制御部が上記各機械の動作を制御するのである。
【0003】
従って、音声認識用マイクロホンは、上記各機械の筐体上又は筐体表面近傍に設置されざるを得ないので、不可避的に、上記各機械自身によって発生する騒音(モーター動作駆動音等)をも、受信してしまうことになる。
【0004】
斯様にしてオペレータの音声が乗った音声信号に混入した騒音成分は、上述した音声解析部における音声認識性能を劣化させてしまうので、予め、音声信号から除去する必要がある。そのために、従来様々な技術が開発されている。
【0005】
その一つが、音声及び雑音を受信することによって音声認識用マイクロホンから出力された観測信号Y(ω,t)から、予めサンプリングしておいた雑音成分N(ω,t)を振幅スペクトル上で減算する「(1チャンネル)スペクトルサブトラクション(SS)法」と呼ばれる方式である。もう一つが、上記(1チャンネル)SS法におけるミッシングに因る音声の歪みを改良すべく、音声認識用マイクロホンと騒音用のマイクロホンとを併用し、音声及び雑音を受信することによって前者から出力された観測信号Y(ω,t)から、雑音のみを受信することによって後者から出力された観測信号N(ω,t)を振幅スペクトル上で減算することによって雑音抑制を行う、「2チャンネルスペクトルサブトラクション(SS)法」と呼ばれる方式である(特許文献1参照)。当該2チャンネルSS法によると、1チャンネルSS法では抑制が困難であった非定常雑音をも、効果的に削減することができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平6-233376号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記2チャンネルSS法によると、騒音用のマイクロホンに音声が混入してしまうと、音声認識用マイクロホンから出力された観測信号Y(ω,t)から音声成分も減算されてしまうので、やはり音声が歪んでしまうという問題がある。
【0008】
この問題を解決するには、騒音用マイクロホンが音声を受信せぬように、音声用マイクロホンから十分に離して設置することが考えられる。
【0009】
しかしながら、騒音用マイクロホンは、音声認識用マイクロホンが受信する雑音と同じ
の音を受信しなければならないところ、音声認識用マイクロホンは、上述した機械の筐体上又はその表面近傍に設置しなければならないという制約があるために、騒音用のマイクロホンも、当該機械の筐体上又はその表面近傍に配置せざるを得ない。
【0010】
そのため、特に小型ロボット等の小型機械の場合、騒音用のマイクロホンを音声認識用マイクロホンの近傍に配置せざるを得ないので、やはり、騒音用マイクロホンに音声が混入してしまい、上述した如き音声の歪みの問題が生じ、その結果、音声認識性能が劣化してしまうという問題を、避け得なかった。
【0011】
そこで、本案は、本来音声認識用マイクロホンによってのみ受信されるべき音声が騒音除去用の信号にも混入してしまうことを抑制し、もって、音声認識性能の劣化を防止することができる音声認識用マイクロホンシステムの提供を、課題とする。
【課題を解決するための手段】
【0012】
本案では、騒音源から発した振動音を検知して振動音観測信号に変換する振動音検知器が、騒音源を有する装置に設置される。また、装置外部の音を受信して音声観測信号に変換する音声用マイクロホンが、設けられる。そして、騒音推定手段が、振動音検知器から出力された振動音観測信号を、騒音(音声用マイクロホンに混入する、振動音に因る気伝導音および振動音自体の合成音)に相当する推定騒音信号に変換し、騒音除去手段が、音声用マイクロホンから出力された音声観測信号から、前記騒音推定手段によって変換された推定騒音信号に相当する成分を除去する。
【0013】
以上のように構成されると、所謂騒音である気伝導音が騒音用のマイクロホンによって直接受信されるのではなく、振動音が振動音検知器によって検知され、検知された振動音を表す振動音観測信号が、騒音推定手段によって騒音(音声用マイクロホンに混入する、振動音に因る気伝導音および振動音自体の合成音)に相当する推定騒音信号に変換され、かかる推定騒音信号に基づいて、音声用マイクロホンからの音声観測信号から騒音成分が除去される。従って、推定騒音信号には、音声の成分が含まれないので、騒音成分除去後における音声観測信号の劣化が、防止されるのである。
【発明の効果】
【0014】
本案によると、本来音声認識用マイクロホンによってのみ受信されるべき音声が騒音除去用の騒音信号に混入してしまうことを抑制し、もって、音声認識性能の劣化を防止することが、可能となる。
【図面の簡単な説明】
【0015】
【図1】実施例1による音声認識用マイクロホンシステムを含むロボットシステムを示すブロック図
【図2】実施例2による音声認識用マイクロホンシステムの要部を示す構造図
【発明を実施するための形態】
【0016】
以下、図面に基づいて、本案の実施の形態を説明する。以下の何れの実施例も、音声認識用マイクロホンシステムを、ロボットの制御コマンド入力用に適用したものである。
[実施例1]
図1は、実施例1の概略構成を示すブロック図である。図1に示されるように、実施例1は、概略、ロボット1と、コントローラ2とから、構成されている。もっとも、コントローラ2は、ロボット1内部又は表面に取り付けられていても良い。
【0017】
ロボット1は、例えば、ヒューマノイド・ロボットであり、モーター駆動部や油圧機構,更には、歯車列やリンク機構といったメカニズムからなるロボット機構11が筐体10
内に内蔵された構造を有している。当該ロボット機構11を構成するモーター駆動部や油圧機構は、コントローラ2によって制御されており、当該制御に従ってロボット機構11全体が動作することによって機械振動が生じ、ロボット機構11自体ないしロボット筐体10自体が共鳴することに因り、固体を伝わって伝導する振動音が発生する。即ち、当該ロボット機構11が、騒音源である。また、当該振動音は、ロボット筐体10表面から空気を伝導して、外部まで伝わっていく(気伝導音)。ロボット1の外部において聞こえる騒音は、かかる気伝導音である。
【0018】
ロボット筐体10の表面上には、上記振動音を受信して電気信号(振動音観測信号:Nn(ω,t),但し、ωは角周波数,tは時間)に変換するために、振動音検知器として
の騒音用マイクロホン12が、取り付けられている。そして、当該騒音用マイクロホン12の周囲は、当該騒音用マイクロホン12にオペレータが発声した音声が混入しないように、遮音用の容器(遮音部材)であるエンクロージャー13によって覆われている。かかるエンクロージャー13は、本来、騒音用マイクロホン12を密閉することが望ましいが、マイクロホン12の構造によっては、振動板の自由運動を確保する為、エンクロージャー13内部の気圧分布を均等にするための通気口を、穿つ場合がある。もっとも、かかる通気口は微小なもので良いので、かかる通気口からの音声の侵入は僅かで済む。
【0019】
上記エンクロージャー13の表面には、主に、オペレータが発声した音声を受信して電気信号(音声観測信号:Y(ω,t))に変換するために、音声用マイクロホン14が取り付けられている。但し、当該音声用マイクロホン14は、上述した騒音(音声用マイクロホンに混入する、振動音に因る気伝導音および振動音自体の合成音)も受信してしまうので、上記観測信号Y(ω,t)には、かかる騒音の成分も混入してしまう。
【0020】
これら両マイクロホン12,14としては、相互に同一の周波数特性を有しているものがマッチングされて採用されることが、望ましい。両者の周波数特性が異なる場合、後述するコントローラ2でのスペクトルサブトラクション(SS)の処理を行っても、雑音を抑制し難くなる場合があるからである。
【0021】
そして、両マイクロホン12,14から出力された各観測信号は、夫々、コントローラ2に入力される。
【0022】
コントローラ2は、各マイクロホン12,14からの入力信号(観測信号:N(ω,t),観測信号:Y(ω,t))を夫々A/D変換する第1及び第2の入力インタフェース21,22,各入力インタフェース21,22に接続されたCPU20,当該CPU20に接続されたフラッシュROM24及び出力インタフェース23を主要要素として、構成されている。
【0023】
フラッシュROM24は、CPU20により読み込まれて実行されるプログラム(ファームウェア)が格納された不揮発性書換可能リードオンリーメモリである。
【0024】
CPU20は、上記フラッシュROM24から上記プログラムを読み出して実行することにより、その内部に、周波数特性補正用フィルタ設計部25,騒音推定手段26,騒音除去手段27,音声解析部28及び制御部29の各機能を、生じる。
【0025】
周波数特性補正用フィルタ設計部25は、事前(オペレータが発声する前)に、ロボット機構11を稼働させることにより、騒音(振動音,気伝導音)を発生させた状態で、騒音用マイクロホン12が振動音を受信することによってCPU20に入力された観測信号:Nn(ω,t)、及び音声用マイクロホン14が騒音(気伝導音と振動音の合成音)を
受信することによってCPU20に入力された観測信号:Yn(ω,t)の相関を調べ、
フィルタ伝達関数を求める機能である。具体的には、周波数特性補正用フィルタ設計部25は、同時にサンプリングされた両信号Nn(ω,t),Yn(ω,t)に対して、振幅スペクトル上で、下記式(1)に示す演算を実行することにより、周波数特性補正用フィルタのフィルタ伝達関数H(ω,t)を算出する。なお、下記式におけるアペンディックスnは、騒音成分を含む信号であることを示す付加記号である。
【0026】
H(ω,t)=Yn(ω,t)/Nn(ω,t) ……(1)
周波数特性補正用フィルタ設計部25は、斯様に算出した周波数特性補正用フィルタ:H(ω,t)を、騒音推定手段26にセットする。
【0027】
騒音推定手段26は、実際の使用時(オペレータが発声をしている時)において、第2のインタフェース22を通じて入力された観測信号:Nn(ω,t)に対して、振幅スペ
クトル上で、周波数特性補正用フィルタの伝達関数H(ω,t)を乗じることにより、音声用マイクロホン14が受信する騒音に相当する推定騒音信号(H(ω,t)・Nn(ω
,t))を生成する。騒音推定手段26は、生成した推定騒音信号(H(ω,t)・Nn
(ω,t))を、騒音除去手段27に入力する。
【0028】
騒音除去手段27は、第1入力インタフェース21を通じて入力された観測信号:Ys+n(ω,t)及び騒音推定手段26によって入力された推定騒音信号(H(ω,t)・Nn(ω,t))に基づいて、2チャンネルスペクトルサブトラクション法に従った演算を、振幅スペクトル上で行うことにより、下記式(2),(3)に示すように、騒音成分を除去した出力信号S(ω,t)を得る。ただし、Ys+n(ω,t)>α・H(ω,t)・Nn(ω,t)である場合には、式(2)に従って出力信号S(ω,t)を算出し、それ以外の場合には、式(3)に従って出力信号S(ω,t)を算出する。なお、下記式におけるアペンディックスs+nは、音声成分及び騒音成分を含む信号であることを示す付加記号で
ある。
【0029】
S(ω,t)=Ys+n(ω,t)−α・H(ω,t)・Nn(ω,t)……(2)
S(ω,t)=β・Ys+n(ω,t)……(3)
式(2)において、αは、観測信号Ys+n(ω,t)から推定騒音信号H(ω,t)・
Nn(ω,t)を、どの程度差し引くかを調整するための係数である。また、βは、Ys+n(ω,t)≦α・H(ω,t)・Nn(ω,t)の場合に式(2)を実行すると出力信号
S(ω,t)がマイナスになるが、マイナスの出力信号S(ω,t)はあり得ないので、代替として、Ys+n(ω,t)を十分に抑えて出力信号S(ω,t)とすべく、十分に小
さい値に設定された、係数である。以上の処理を経て出力された出力信号S(ω,t)は、理想的には、観測信号Ys+n(ω,t)から騒音成分のみを除去して、音声成分のみを
含むものとなっている。そこで、騒音除去手段27は、生成した出力信号S(ω,t)を、音声解析部28に入力する。
【0030】
音声解析部28は、入力された出力信号S(ω,t)を言語的に解析することにより、その音声の内容を文字列に変換する。そして、得られた文字列を、予め登録された多数のコマンドと夫々マッチングすることにより、文字列に含まれるコマンド(及び、その前後に付加されるべきパラメータ)を抽出する。音声解析部28は、斯様にして抽出したコマンドを、制御部29に入力する。
【0031】
制御部29は、音声解析部28から入力されたコマンドに応じて、ロボット機構11を制御するための制御信号を生成して、出力する。このようにして制御部29によって生成されてCPU20から出力された制御信号は、出力インタフェース23を通じて、ロボット機構11に入力されて、当該ロボット機構11を動作させる。
【0032】
以上のように構成された本実施例による音声認識用マイクロホンシステムによると、オペレータがロボット1に対するコマンドとして発声した音声を主として受信する音声用マイクロホン14によって出力された観測信号:Ys+n(ω,t)が、騒音成分が除去され
ることによって音声成分のみを含む出力信号S(ω,t)に変換された状態で、音声解析部28に入力されるが、観測信号:Ys+n(ω,t)から実際に(振幅スペクトル上で)
減算される騒音推定信号(H(ω,t)・Nn(ω,t))には、音声成分が含まれてい
ない。従って、騒音除去手段27において、音声用マイクロホンからの観測信号:Ys+n
(ω,t)から、2チャンネルスペクトルサブトラクション法によって騒音成分を除去するに際して、出力信号S(ω,t)として音声解析部28に入力される音声が歪んでしまうことがない。よって、音声解析部28での音声解析が、正確になる。
【0033】
なお、本実施例では、音声用マイクロホン14と同一の周波数特性を有する騒音用マイクロホン12によって振動音を受信していたが、騒音用マイクロホン12を使用せずに、加速度センサによって振動を直接検出しても良い。
【0034】
以上述べたように、本実施例によれば、ロボット1(等の機械)内部で駆動により生じる騒音の元となる振動音を振動音検出手段としての音声用マイクロホン12により検出し、その検出音に基づいて騒音推定手段26によって騒音を推定し、その推定値に基づいて騒音を抑圧するため、目的音声(オペレータ音声)の歪みを最小限に止めることができる。従って、出力信号S(ω,t)が表す音声の品質を劣化させることなく、ロボット1の内部騒音を抑圧できるため、音声解析部28での音声認識率を劣化させない内部騒音抑圧が可能となる。また、騒音用マイクロホン12を使用した2チャンネルスペクトルサブトラクション法を用いるため、ロボット1の内部騒音に多く含まれる衝突音などの突発的な雑音も抑圧することが可能である。即ち、極めて効果的に、ロボット1の内部騒音を抑圧する騒音抑圧装置が実現でき、ロボット1の音声認識を飛躍的に高めることに寄与できる。
[実施例2]
上述する実施例1は、騒音用マイクロホン12によって受信された振動音Nn(ω,t
)のみから推定騒音信号(H(ω,t)・Nn(ω,t))を生成していたが、振動音Nn(ω,t)が気伝導音に変化する途中では様々なファクターの影響を受けるので、実際には、振動音Nn(ω,t)のみから推定騒音信号(H(ω,t)・Nn(ω,t))を生成するには、周波数補正用フィルタのフィルタ次数が非常に高次となり、周波数特性補正用フィルタ設計部25の計算負荷が増大してしまうという難点がある。かかる難点は、CPU20の計算能力が高ければ問題とならないものの、CPU20の計算能力が低い場合には顕在化し、これを回避するために敢えてフィルタ次数を下げると、十分高精度の推定騒音信号(H(ω,t)・Nn(ω,t))が得られなくなってしまうという問題が生じる

【0035】
そこで、実施例2では、音声解析部28における音声解析の上で問題とならない範囲で音声の歪み(出力信号S(ω,t)の劣化)を許容しつつ、周波数補正用フィルタのフィルタ次数が高くなるのを抑えることができる構成を、提案するものである。
【0036】
図2は、実施例2におけるロボット1’の概略構成を示す構成図である。この図2に示すように、実施例2におけるロボット1’は、エンクロージャー13’の構成のみを実施例2と異にし、他の構成を同一としている。そのため、図2では、実施例1と同じ構成については、同じ参照番号を付している。また、図2では、コントローラ2の図示を省略している。
【0037】
図2に示すエンクロージャー13’には、気伝導音を若干量騒音用マイクロホン12に入力させるための微小穴12aが開けられている。当該微小穴12aの径dは、大きけれ
ば大きいほど、周波数補正用フィルタのフィルタ次数(計算負荷)を削減することができるが、あまり大きすぎると、音声が騒音用マイクロホン12に受信されて、出力信号S(ω,t)の劣化を引き起こしてしまう。そこで、微小穴12aの径dを決定するに当たっては、周波数補正用フィルタのフィルタ次数(計算負荷)の削減,騒音推定性能の高精度化,出力信号S(ω,t)の劣化度合の間のトレードオフを図り、微小穴12aの径dを最適化する。
【0038】
以上のように構成される実施例2によると、エンクロージャー13’に最適化設計した径dを有す微小穴12aを形成したため、騒音推定手段26のフィルタ次数(周波数特定補正用フィルタ設計部25の計算負荷)の削減,雑音推定手段26における雑音推定性能の高精度化,目的音声品質の劣化度合との間のトレードオフが図られ、実用的な騒音抑制装置を構成できる。
【0039】
(付記1)
オペレータが発した音声を受信したマイクロホンの観測信号を音声認識用に処理する音声認識用マイクロホンシステムであって、
騒音源を有する装置に設置され、前記騒音源から発した振動音を検知して振動音観測信号に変換する振動音検知器と、
前記装置外部の音を受信して音声観測信号に変換する音声用マイクロホンと、
前記振動音検知器から出力された振動音観測信号を、前記騒音に相当する推定騒音信号に変換する騒音推定手段と、
前記音声用マイクロホンから出力された音声観測信号から、前記騒音推定手段によって変換された推定騒音信号に相当する成分を除去する騒音除去手段と
を備えることを特徴とする音声認識用マイクロホンシステム。
【0040】
(付記2)
前記振動音検知器は、
振動音用マイクロホンと、
前記振動音用マイクロホンに外部の音が入らぬように遮音する遮音部材と
を有することを特徴とする付記1記載の音声認識用マイクロホンシステム。
【0041】
(付記3)
前記遮音部材は、前記振動音用マイクロホンを収容する内部空間と外部とを連通する穴を設けた容器である
ことを特徴とする付記2記載の音声認識用マイクロホンシステム。
【0042】
(付記4)
前記騒音推定手段は、前記振動音検知器から出力された振動音観測信号に対して、所定のフィルタ伝達関数を実行することによって、前記騒音に相当する推定騒音信号に変換する
ことを特徴とする付記1記載の音声認識用マイクロホンシステム。
【0043】
(付記5)
前記フィルタ伝達関数は、予め、前記音声がない状態で前記振動音検知器から出力された振動音観測信号,及び前記音声用マイクロホンから出力された音声観測信号に基づき算出された、前記振動音観測信号を前記音声観測信号に変換する特性を有するフィルタ伝達関数である
ことを特徴とする付記4記載の音声認識用マイクロホンシステム。
【0044】
(付記6)
前記騒音除去手段は、前記音声用マイクロホンから出力された音声観測信号に対して、前記騒音推定手段によって変換された推定騒音信号に基づく2チャンネルスペクトルサブトラクション法に基づく演算を実行する
ことを特徴とする付記1記載の音声認識用マイクロホンシステム。
【符号の説明】
【0045】
1 ロボット
2 コントローラ
10 ロボット筐体
11 ロボット機構
12 騒音用マイクロホン
13 エンクロージャー
14 音声用マイクロホン
20 CPU
25 周波数特性補正用フィルタ設計部
26 騒音推定手段
27 騒音除去手段
28 音声解析部

【特許請求の範囲】
【請求項1】
オペレータが発した音声を受信したマイクロホンの観測信号を音声認識用に処理する音声認識用マイクロホンシステムであって、
騒音源を有する装置に設置され、前記騒音源から発した振動音を検知して振動音観測信号に変換する振動音検知器と、
前記装置外部の音を受信して音声観測信号に変換する音声用マイクロホンと、
前記振動音検知器から出力された振動音観測信号を、前記騒音に相当する推定騒音信号に変換する騒音推定手段と、
前記音声用マイクロホンから出力された音声観測信号から、前記騒音推定手段によって変換された推定騒音信号に相当する成分を除去する騒音除去手段と
を備えることを特徴とする音声認識用マイクロホンシステム。
【請求項2】
前記振動音検知器は、
振動音用マイクロホンと、
前記振動音用マイクロホンに外部の音が入らぬように遮音する遮音部材と
を有することを特徴とする請求項1記載の音声認識用マイクロホンシステム。
【請求項3】
前記騒音推定手段は、前記振動音検知器から出力された振動音観測信号に対して、所定のフィルタ伝達関数を実行することによって、前記騒音に相当する推定騒音信号に変換する
ことを特徴とする請求項1記載の音声認識用マイクロホンシステム。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2010−217453(P2010−217453A)
【公開日】平成22年9月30日(2010.9.30)
【国際特許分類】
【出願番号】特願2009−63583(P2009−63583)
【出願日】平成21年3月16日(2009.3.16)
【出願人】(000005223)富士通株式会社 (25,993)
【出願人】(593006630)学校法人立命館 (359)
【Fターム(参考)】