説明

残響抑制装置および残響抑制方法並びに残響抑制プログラム

【課題】携帯端末に搭載されたスピーカとマイクロホンを用いて測定したインパルス応答を利用して残響音を抑制する。
【解決手段】携帯端末に搭載されたスピーカ又はマイクロホンの指向性に基づいて配置された音源がインパルスを出力した際にマイクロホンが出力する信号から得られる第1インパルス応答を示す情報を予め保持する第1保持部と、残響音を抑制する対象となる室内において、携帯端末に搭載されたスピーカがインパルスを出力した際にマイクロホンが出力する信号から得られる第2インパルス応答を示す情報を保持する第2保持部と、第1インパルス応答を示す情報を用いて、第2保持部に保持された情報で示される第2インパルス応答を補正することにより、室内の環境を反映した補正インパルス応答を求める応答補正部と、補正インパルス応答に基づいて、室内においてマイクロホンに音声が入力される際に当該マイクロホンによって得られる音声信号を補正する音声補正部とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本件開示は、マイクロホンとスピーカを有する携帯端末のマイクロホンへの入力音声について残響を抑制する残響抑制装置および残響抑制方法並びに残響抑制プログラムに関する。
【背景技術】
【0002】
利用者が室内において携帯端末の通話機能を利用する際に、利用者が発した音声は、直接的にマイクロホンに到達する他に、周囲の壁や天井などで反射した後にもマイクロホンに到達する。以下の説明では、マイクロホンに直接的に到達する音声を直接音と称し、周囲の壁や天井などで反射した後にマイクロホンに到達する音声を残響音と称する。また、音声の到達に応じてマイクロホンによって出力される、当該音声に対応する出力信号を音声信号と称する。
【0003】
例えば、浴室のような比較的狭い室内では、居間などの他の場所に比べて、周囲から反射された残響音が大きい。このため、浴室などで携帯端末の通話機能を利用する場合には、直接音に重畳された残響音のために、マイクロホンで得られる音声信号から明瞭な音声を再生することが困難になる場合がある。
【0004】
マイクロホンで得られる音声信号から残響音の成分を除去する技術として、例えば、個々の利用形態に応じて配置した音源とマイクロホンによって予めインパルス応答を測定し、このインパルス応答を利用する技術が提案されている(非特許文献1参照)。非特許文献1に開示された技術は、例えば、残響音の除去を適用する各室内において測定したインパルス応答に基づいて逆フィルタを求め、この逆フィルタを、マイクロホンによって得られた観測信号に適用することにより、残響音を抑制する。
【0005】
また、音声信号の時系列に関する確率モデルに基づいて、音声信号がより音声信号らしい信号になるように逆フィルタを推定することによって、個々の環境で測定したインパルス応答によらずに逆フィルタを求める技術も提案されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2008−292845号公報
【非特許文献】
【0007】
【非特許文献1】Miyoshi, M., and Kaneda, Y., “Inverse filtering of room acous-tics,” IEEE Trans. ASSP, 36(2), pp. 145-152, 1988.
【発明の概要】
【発明が解決しようとする課題】
【0008】
防水機能を有する携帯端末の普及に伴って、携帯端末の通話機能が利用される環境は、浴室などにも拡大している。一方、浴室などで携帯端末の通話機能を利用する場合に、残響音による通話音声の明瞭性の低下が顕著であるため、良好な通話のためには、残響音を除去することが望ましい。
【0009】
ところで、上述した非特許文献1の技術を用いるためには、利用者それぞれの浴室での利用を想定して音源とマイクロホンとを配置した上で、当該浴室におけるインパルス応答を測定することが望ましい。しかし、個々の利用者が、インパルス応答の測定に適した音源を準備し、しかも、携帯端末に搭載されたマイクロホンの指向性などを考慮して適切に配置することは困難である。
【0010】
一方、特許文献1の技術では、室内インパルス応答の測定が不要である代わりに、残響音の抑制に先立って、逆フィルタを収束させる時間が必要となる。
【0011】
本件開示は、携帯端末に搭載されたスピーカとマイクロホンを用いて測定したインパルス応答を利用して残響音を抑制する残響抑制装置および残響抑制方法並びに残響抑制プログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
一つの観点による残響抑制装置は、携帯端末に搭載されたスピーカ又はマイクロホンの指向性に基づいて配置された音源がインパルスを出力した際に前記マイクロホンが出力する信号から得られる第1インパルス応答を示す情報を予め保持する第1保持部と、残響音を抑制する対象となる室内において、前記携帯端末に搭載されたスピーカがインパルスを出力した際に前記マイクロホンが出力する信号から得られる第2インパルス応答を示す情報を保持する第2保持部と、前記第1インパルス応答を示す情報を用いて、前記第2保持部に保持された情報で示される前記第2インパルス応答を補正することにより、前記室内の環境を反映した補正インパルス応答を求める応答補正部と、前記補正インパルス応答に基づいて、前記室内において前記マイクロホンに音声が入力される際に当該マイクロホンによって得られる音声信号を補正する音声補正部とを有する。
【0013】
また、別の観点による残響抑制方法は、携帯端末に搭載されたスピーカ又はマイクロホンの指向性に基づいて配置された音源がインパルスを出力した際に前記マイクロホンが出力する信号から得られる第1インパルス応答を示す情報を用いて、残響音を抑制する対象となる室内において前記携帯端末に搭載されたスピーカがインパルスを出力した際に前記マイクロホンが出力する信号から得られる第2インパルス応答を補正することにより、前記室内の環境を反映した補正インパルス応答を求め、前記補正インパルス応答に基づいて、前記室内において前記マイクロホンに音声が入力される際に当該マイクロホンによって得られる音声信号を補正する。
【0014】
更に別の観点による残響抑制プログラムは、携帯端末に搭載されたスピーカ又はマイクロホンの指向性に基づいて配置された音源がインパルスを出力した際に前記マイクロホンが出力する信号から得られる第1インパルス応答を示す情報を用いて、残響音を抑制する対象となる室内において前記携帯端末に搭載されたスピーカがインパルスを出力した際に前記マイクロホンが出力する信号から得られる第2インパルス応答を補正することにより、前記室内の環境を反映した補正インパルス応答を求め、前記補正インパルス応答に基づいて、前記室内において前記マイクロホンに音声が入力される際に当該マイクロホンによって得られる音声信号を補正する処理をコンピュータに実行させる。
【発明の効果】
【0015】
本件開示の残響抑制装置および残響抑制方法並びに残響抑制プログラムによれば、携帯端末に搭載されたスピーカとマイクロホンを用いて測定したインパルス応答を利用して残響音を抑制することができる。
【図面の簡単な説明】
【0016】
【図1】残響抑制装置の一実施形態を示す図である。
【図2】スピーカとマイクロホンの配置を説明する図である。
【図3】インパルス応答の例を示す図である。
【図4】残響抑制装置の別実施形態を示す図である。
【図5】重み関数の例を示す図である。
【図6】インパルス応答の合成を説明する図である。
【図7】推定残響音成分スペクトルの例を示す図である。
【図8】携帯端末のハードウェア構成の一例を示す図である。
【図9】残響抑制装置を有する携帯端末のフローチャートの一例を示す図である。
【図10】残響特性を推定するための測定処理のフローチャートである。
【図11】周波数領域で残響を抑制する処理のフローチャートである。
【図12】ゲインの算出処理を説明する図である。
【図13】残響抑制装置の別実施形態を示す図である。
【図14】重み関数の例を示す図である。
【図15】残響抑制装置を有する携帯端末のフローチャートの別例を示す図である。
【図16】特性係数ベクトルCを算出する処理のフローチャートである。
【図17】時間領域で残響を抑制する処理のフローチャートである。
【発明を実施するための形態】
【0017】
以下、図面に基づいて、本発明の実施形態について詳細に説明する。
【0018】
図1は、残響抑制装置の一実施形態を示している。図1に例示した残響抑制装置100は、例えば、携帯電話などの通話機能を持つ携帯端末に搭載されたマイクロホン104によって得られた音声信号y(t)に含まれる残響成分を抑制することにより、補正音声信号y’(t)を生成する。そして、残響抑制装置100は、この補正音声信号y’(t)を通信処理部105に渡すことにより、浴室などにおいて、利用者が携帯端末の通話機能を利用する際の通話音声の明瞭化を図る。なお、本件開示の残響抑制装置100は、通話機能を持つ携帯型の情報端末や携帯ゲーム機、また、電話機の子機などにも適用することができる。
【0019】
図1に例示した残響抑制装置100は、第1保持部101と、第2保持部102と、応答補正部103と、音声補正部110とを含んでいる。
【0020】
第1保持部101は、例えば、携帯端末の初期設定データの一部として、後述する第1インパルス応答h1(t)を保持している。この第1インパルス応答h1(t)は、例えば、標準的な残響特性を持つ浴室内において、音源をマイクロホン104の指向性に合わせて配置した状態で、この音源によってインパルスを出力させた際に、マイクロホン104によって観測される信号である。
【0021】
また、第2保持部102は、マイクロホン104を介して入力される音声信号y(t)に対する残響抑制処理に先立って、後述する第2インパルス応答h2(t)を保持する。第2インパルス応答h2(t)は、例えば、図1に示した入力端子Pinを介して携帯端末100に搭載されたスピーカ106に入力信号δ(t)を与えた際に、このスピーカ106が出力するインパルスに応じて、マイクロホン104によって観測される信号である。なお、入力信号δ(t)は、例えば、時刻t=T0で所定の値dを持ち、時刻T0以外の時刻tにおいてδ(t)=0となるように変化する信号でもよい。
【0022】
図2は、マイクロホン104とスピーカ106の配置を説明する図である。図2(A)は、携帯端末の正面におけるマイクロホン104とスピーカ106の配置の一例を示す。また、図2(B)に示した符号V1は、スピーカ106によって出力される音声が持つ指向性の向きを示し、また、符号V2は、マイクロホン104の感度が持つ指向性の方向を示す。
【0023】
図2(A),(B)に例示したように、マイクロホン104は、利用者が携帯端末を用いて通話する際に、利用者の口元に近接し、利用者が発した音声に対して指向性を持つように配置される。同様に、スピーカ106は、利用者が携帯端末を用いて通話する際に、利用者の耳元に近接し、利用者の耳に向かう方向に指向性を持つように配置される。このように、携帯端末に搭載されたスピーカ106は、利用者が携帯端末を用いて通話する際のマイクロホン104と利用者の口元との距離に比べて遠くに配置されている。しかも、スピーカ106から出力される音波の方向もマイクロホン104に向かう方向から外れている。
【0024】
スピーカ106からマイクロホン104に直接的に到達する直接音は、スピーカ106とマイクロホン104との距離および指向性の影響を受ける。このため、携帯端末に搭載されたスピーカ106を用いてインパルスを発生させた場合の直接音は、利用者の口元に当たる位置に配置した音源でインパルスを発生させた場合に比べて大きく減衰する。
【0025】
一方、インパルスに応じて生じる残響音は、スピーカ106とマイクロホン104との距離や指向性の影響が少ない。このため、携帯端末に搭載されたスピーカ106を用いてインパルスを発生させた場合にマイクロホン104に到達する残響音は、利用者の口元に当たる位置に配置した音源でインパルスを発生させた場合にマイクロホン104に到達する残響音とほぼ同等である。
【0026】
なお、図2(B)に、図3で説明するインパルス応答h(t)−A、h(t)−Bの取得に好適な音源の配置例を示した。図2(B)に音源として例示したスピーカ107の位置は、利用者が携帯端末の通話機能を利用する際に利用者の口元に当たる位置である。
【0027】
図3は、インパルス応答の例を示している。図3に示した符号h(t)−Aは、浴室Aにおけるインパルス応答の例である。また、符号h(t)−Bで示したグラフは、浴室Bにおけるインパルス応答の例である。一方、図3に符号h2(t)−Aは、浴室Aにおいて携帯端末のスピーカ106およびマイクロホン104を用いて得た第2インパルス応答の例である。また、符号h2(t)−Bで示したグラフは、別の浴室Bにおいて携帯端末のスピーカ106およびマイクロホン104を用いて得た第2インパルス応答の例である。
【0028】
インパルス応答h(t)−Aは、浴室Aにおいて、マイクロホン104に対向させて音源を配置し、この音源に入力信号δ(t)を与えてインパルスを発生させた際に、マイクロホン104の出力信号として得られる。同様に、インパルス応答h(t)−Bは、浴室Bにおいて、マイクロホン104に対向させて音源を配置し、この音源に入力信号δ(t)を与えてインパルスを発生させた際に、マイクロホン104の出力信号として得られる。
【0029】
図3に例示したインパルス応答h(t)−Aと第2インパルス応答h2(t)−Aとを比較すると、インパルスの発生時刻から約20msecが経過した時刻T1以降の期間においては、インパルス応答h(t)−Aと第2インパルス応答h2(t)−Aとは、ほぼ同様に変化している。これに対して、上述した時刻T1までの期間において、各時刻における電力の差が大きくなっている。また、図3に例示したインパルス応答h(t)−Bと第2インパルス応答h2(t)−Bとを比較した場合にも、同様の傾向が認められる。
【0030】
ここで、図3に例示したインパルス応答において、インパルスの発生時刻から時刻T1までの期間は、マイクロホン104に主として直接音が到達する期間であり、時刻T1以降の期間は、マイクロホン104に主として残響音が到達する期間である。以下の説明では、マイクロホン104に主として直接音が到達する期間を第1期間P1と称し、また、マイクロホン104に主として残響音が到達する期間を第2期間P2と称する。なお、第2期間P2は、例えば、インパルスの発生時刻から所定の時間が経過した時刻T2までの期間に制限してもよい。この所定の時間は、例えば、標準的な浴室において残響音が減衰するまでに要する時間(例えば、400msec)に基づいて、予め決定しておいてもよい。
【0031】
第2インパルス応答h2(t)−Aとインパルス応答h(t)−Aとの第1期間P1の部分における電力の差異は、携帯端末においてスピーカ106とマイクロホン104とが離れて配置されていることによる減衰を示している。同様に、第2インパルス応答h2(t)−Bの第1期間P1の部分における電力は、インパルス応答h(t)−Bの第1期間P1の部分における電力に比べて減衰していることが分かる。このような減衰があることが、携帯端末のスピーカ106を音源として、残響音の抑制の対象となる部屋ごとにインパルス応答を取得する場合の課題となっていた。
【0032】
ところで、図3に例示した2つのインパルス応答h(t)−A、h(t)−Bとを比較すると、上述した第2期間P2の電力は大きく異なっているにもかかわらず、第1期間P1においては、2つのグラフがほぼ重なり合っていることが分かる。
【0033】
このように、第1期間P1において、インパルス応答を示す波形は、測定対象となる室内の環境にかかわらず、ほぼ同一の特徴を持つ。つまり、互いに特徴の異なる浴室Aのインパルス応答h(t)−Aの第1期間P1の部分と浴室Bのインパルス応答h(t)−Bの第1期間P1の部分とは、互いに置き換えが可能である。したがって、例えば、浴室Aのインパルス応答h(t)−Aと、浴室Bの第2インパルス応答h2(t)−Bとを組み合わせることにより、浴室Bのインパルス応答h(t)−Bとほぼ同等の補正インパルス応答を得ることができる。
【0034】
このことを利用することにより、携帯端末のスピーカ106とマイクロホン104とを用いた測定に基づいて個々の利用環境における正確なインパルス応答を取得することを妨げていた課題を解決することができる。
【0035】
つまり、図1に示した第1保持部101に保持された第1インパルス応答h1(t)と、所望の室内において取得される第2インパルス応答h2(t)とから、この室内における直接音および残響音の伝達特性を反映した補正インパルス応答hw(t)を得ることができる。
【0036】
図1に示した応答補正部103は、第1保持部101に保持された第1インパルス応答h1(t)を示す情報を用いて、第2保持部に保持された情報で示される第2インパルス応答h2(t)を補正することにより、補正インパルス応答hw(t)を生成する。応答補正部103は、第1インパルス応答h1(t)と第2インパルス応答h2(t)とを後述するようにして合成することによって、補正インパルス応答hw(t)を生成してもよい。また、応答補正部103は、第1インパルス応答h1(t)の第1期間P1における電力に一致するように、第2インパルス応答h2(t)の第1期間P1の部分を増幅することにより、補正インパルス応答hw(t)を生成してもよい。
【0037】
このように、本件開示の残響抑制装置100によれば、携帯端末に搭載されたスピーカ106とマイクロホン104を用いて得られる第2インパルス応答h2(t)を利用して、所望の室内における残響音の抑制に有用な補正インパルス応答hw(t)を得ることができる。
【0038】
なお、図1に示した第1保持部101に保持させる第1インパルス応答h1(t)を示す情報は、携帯端末の開発段階などにおいて、マイクロホン104を用いて第1インパルス応答h1(t)を実測することによって取得してもよい。例えば、図2(B)に示したように、利用者の口元に当たる位置に配置したスピーカ107にインパルスを出力させ、この際に、マイクロホン104で得られる音声信号を、第1インパルス応答h1(t)として抽出してもよい。
【0039】
上述したようにして、応答補正部103によって生成された補正インパルス応答hw(t)に基づいて、図1に示した音声補正部110は、マイクロホン104からの音声信号y(t)に含まれる残響音を抑制する処理を行う。
【0040】
図1に例示した音声補正部110は、変換部111と、推定部112と、ゲイン算出部113と、乗算部114と、逆変換部115とを含んでいる。
【0041】
変換部111は、音声信号y(t)を周波数領域の音声信号スペクトルY(ω)に変換する。ここで、ωは角周波数である。推定部112は、上述した補正インパルス応答hw(t)を補正インパルス応答スペクトルHw(ω)に変換し、補正インパルス応答スペクトルHw(ω)と、上述した周波数領域の信号Y(ω)とに基づいて、音声信号スペクトルY(ω)に含まれる残響音の成分の周波数特性を推定する。なお、図1および以下の説明では、推定部112により、音声信号スペクトルY(ω)に含まれると推定された残響音の成分の周波数特性を、推定残響音成分スペクトルYe(ω)と称する。
【0042】
このようにして得られた推定残響音成分スペクトルYe(ω)に基づいて、ゲイン算出部113は、残響音成分を抑制するように、音声信号スペクトルY(ω)に適用するゲインg(ω)を算出する。そして、乗算部114は、音声信号スペクトルY(ω)にゲインg(ω)を乗算する処理を行うことにより、残響音成分が抑制された補正音声信号スペクトルY’(ω)を得る。
【0043】
この補正音声信号スペクトルY’(ω)に対して、逆変換部115は、変換部111による変換の逆変換処理を行うことにより、残響成分が抑制された時間領域の補正音声信号y’(t)を得る。
【0044】
上述したように、図1に例示した音声補正部110を有する残響抑制装置100によれば、音声信号y(t)に含まれる残響音の成分を、上述した補正インパルス応答スペクトルHw(ω)に基づく周波数領域における処理によって抑制することができる。
【0045】
図4は、残響抑制装置の別実施形態を示している。なお、図4に示した構成要素のうち、図1に示した構成要素と同等のものについては、同一の符号を付して示し、その説明は省略する。
【0046】
図4に示した加重加算部121は、図1に示した応答補正部103の一例である。この加重加算部121は、第1保持部101に保持された第1インパルス応答h1(t)の波形を示す情報と、第2保持部102に保持された第2インパルス応答h2(t)の波形を示す情報とを加重加算することにより、補正インパルス応答hw(t)を生成する。
【0047】
加重加算部121は、加重加算処理として、例えば、式(1)に示すように、重み関数α(t)を用いて重み付けした第1インパルス応答h1(t)と、重み関数β(t)を用いて重み付けした第2インパルス応答h2(t)とを足し合わせる処理を行ってもよい。
hw(t)=α(t)・h1(t)+β(t)・h2(t) ・・・(1)
なお、上述した第1期間P1において、重み関数α(t)は、重み関数β(t)が第2インパルス応答h2(t)に与える重みよりも大きい重みを、第1インパルス応答h1(t)に与えることが望ましい。一方、第2期間P2においては、重み関数β(t)は、重み関数α(t)が第1インパルス応答h1(t)に与える重みよりも大きい重みを、第2インパルス応答に与えることが望ましい。
【0048】
図5は、重み関数α(t)、β(t)の例を示している。図5(A),(B),(C)において、横軸はインパルスの発生時刻からの経過時間を示し、縦軸は、重みの値を示す。また、図5(A),(C)において、第1インパルス応答h1(t)に適用する重み関数α(t)の例を実線のグラフで示す。また、図5(B),(C)において、第2インパルス応答h2(t)に適用する重み関数β(t)の例を、破線のグラフで示す。
【0049】
図5(A)に示した重み関数α(t)が与える重みの値は、インパルスの発生時刻から時刻T1までの第1期間P1において1であり、時刻T1以降の第2期間P2において0である。逆に、図5(B)に示した重み関数β(t)が与える重みの値は、上述した第1期間P1において0であり、第2期間P2において1である。
【0050】
また、加重加算部121は、図5(C)に示すように、第1期間P1において1から0に単調に減少する重みを与える重み関数α(t)と、第1期間P1において0から1に単調に増加する重みを与える重み関数β(t)とを用いて加重加算処理を行ってもよい。また、加重加算部121は、例えば、標準的な浴室内などの環境において残響音の電力が消失する時刻T2などに基づいて、第2期間P2の長さを限定してもよい。つまり、加重加算部121は、上述した第1期間P1と、例えば、時刻T1〜時刻T2までの有限長の第2期間P2について、重み関数α(t)、β(t)によって与える重みの値を定義してもよい。なお、時刻T1は、例えば、インパルスの発生時刻から約20ミリ秒が経過した時刻であり、時刻T2は、例えば、インパルスの発生時刻から約400ミリ秒が経過した時刻である。
【0051】
図5(A)に示した重み関数α(t)によって第1インパルス応答h1(t)に重み付けすることにより、加重加算部121は、第1インパルス応答h1(t)の第1期間P1の部分を抽出することができる。また、図5(B)に示した重み関数β(t)によって第2インパルス応答h2(t)に重み付けすることにより、加重加算部121は、第2インパルス応答h2(t)の第2期間P2の部分を抽出することができる。
【0052】
図6は、第1インパルス応答h1(t)と第2インパルス応答h2(t)との合成を説明する図である。図6(A),(B)において、横軸はインパルスの発生時刻からの経過時間を示し、縦軸は、信号電力を示す。
【0053】
図6(A)において、第1インパルス応答h1(t)の例を破線で示し、第1インパルス応答h2(t)の例を実線で示した。また、図6(B)に、このような第1インパルス応答h1(t)および第2インパルス応答h2(t)に対して、加重加算部121による加重加算処理を行うことによって合成される補正インパルス応答hw(t)の例を示す。なお、図6(B)に例示した補正インパルス応答hw(t)は、加重加算処理に図5(A),(B)に示した重み関数α(t)、β(t)を用いた場合の例である。
【0054】
このようにして得られた補正インパルス応答hw(t)は、第1インパルス応答h1(t)の第1期間P1の部分と第2インパルス応答h2(t)の第2期間P2の部分との合成である。したがって、この補正インパルス応答hw(t)は、上述したように、第2インパルス応答h2(t)が得られた室内において携帯端末のマイクロホン104の指向性を考慮した理想的な位置に音源を配置した際に得られるインパルス応答とほぼ同等である。
【0055】
なお、上述したように、第2インパルス応答h2(t)は、所望の室内において、携帯端末10に搭載されたスピーカ106によってインパルスを出力したときのマイクロホン104の出力信号として得ることができる。このような第2インパルス応答h2(t)の測定は、携帯端末10の利用者が簡単な操作を行うことによって実現可能である。
【0056】
また、図4に例示した音声補正部110において、高速フーリエ変換(FFT:Fast Fourier Transform)演算部122は、図1に示した変換部111の一例である。また、逆FFT演算部127は、図1に示した逆変換部115の一例である。
【0057】
FFT演算部122は、例えば、式(2)に基づいて、複素数である周波数領域の信号Y(ω)の代わりに、音声信号y(t)の電力スペクトル|Y(ω)|を求めてもよい。なお、式(2)において、FFT(y(t))は、音声信号y(t)のフーリエ変換結果を示す。また、式(2)において、Re{FFT(y(t))}は音声信号y(t)のフーリエ変換結果の実部を示し、Im{FFT(y(t))}は音声信号y(t)のフーリエ変換結果の虚部を示す。
|Y(ω)|=Re{FFT(y(t))}+Im{FFT(y(t))} ・・・(2)
また、図4に示した音声補正部110は、図1に示した推定部112の一例として、抽出部123と、部分応答変換部124と、特性算出部125と、補正応答変換部126とを含む。
【0058】
図4に示した音声補正部110は、音声X(ω)の入力に応じて入力音声スペクトルY(ω)を得る系の伝達特性H(ω)を式(3)のように表すモデルに基づいて、この入力音声スペクトルY(ω)に含まれる残響音の成分の周波数特性を推定する。式(3)において、音源とマイクロホン104とを含む室内の空間の伝達特性H(ω)は、音源からマイクロホン104に直接的に到達する経路の伝達特性Hd(ω)と、周囲の壁などによって反射されてから到達する経路の伝達特性Hr(ω)との和である。
H(ω)=Hd(ω)+Hr(ω) ・・・(3)
このモデルにおいて、上述した伝達特性Hd(ω)を用いて、入力音声スペクトルY(ω)に含まれる直接音成分スペクトルYd(ω)は式(4)のように表される。また、入力音声スペクトルY(ω)に含まれる残響音成分スペクトルYr(ω)は、伝達特性Hr(ω)を用いて式(5)のように表される。
Yd(ω)=Hd(ω)X(ω) ・・・(4)
Yr(ω)=Hr(ω)X(ω) ・・・(5)
これらの式(2)〜(4)を、入力音声スペクトルY(ω)が直接音成分スペクトルYd(ω)と残響音成分スペクトルYr(ω)との和であることを利用して整理することにより、残響音成分スペクトルYr(ω)を表す式(6)が得られる。
【0059】
【数1】

【0060】
式(6)に示したように、任意の音声信号y(t)に含まれる残響成分を示す残響音成分スペクトルYr(ω)は、室内空間の伝達特性H(ω)に対する残響音の伝達特性Hr(ω)の比を入力音声スペクトルY(ω)に乗算することによって得ることができる。
【0061】
ここで、応答補正部103の一例である加重加算部121によって得られる補正インパルス応答hw(t)は、時間領域における室内空間の伝達関数である。したがって、図4に示した補正応答変換部126がこの補正インパルス応答hw(t)をフーリエ変換して得られる結果Hw(ω)は、室内空間の周波数領域の伝達特性H(ω)を示している。
【0062】
補正応答変換部126は、例えば、式(7)に基づいて、補正インパルス応答hw(t)を高速フーリエ変換して得られる複素数の補正インパルス応答スペクトルHw(ω)に代えて、その電力|Hw(ω)|を求めてもよい。なお、式(7)に示すFFT(hw(t))は、補正インパルス応答hw(t)のフーリエ変換結果である。また、式(7)において、Re{FFT(hw(t))}は補正インパルス応答hw(t)のフーリエ変換結果の実部を示し、Im{FFT(hw(t))}は補正インパルス応答hw(t)のフーリエ変換結果の虚部を示す。
|Hw(ω)|=Re{FFT(hw(t))}+Im{FFT(hw(t))} ・・・(7)
図4に示した抽出部123は、補正インパルス応答hw(t)から、残響音の成分を示す部分インパルス応答hp(t)を抽出する。例えば、抽出部123は、図6(B)に示した補正インパルス応答hw(t)に含まれる上述した第2期間P2の部分を、部分インパルス応答hp(t)として抽出してもよい。なお、抽出部123は、例えば、第2インパルス応答h2(t)に、図5(B)に示したように、第1期間P1において重み0を与え、第2期間P2において重み1を与える重み関数を適用することにより、部分インパルス応答hp(t)を抽出してもよい。また、抽出部123は、上述した加重加算部121による加重加算処理の過程で、図5(B)に示した重み関数β(t)によって重み付けされた第2インパルス応答h2(t)を部分インパルス応答hp(t)として受け取ってもよい。
【0063】
この部分インパルス応答hp(t)は、音源から周囲の壁などによって反射されてからマイクロホン104に到達する経路の時間領域の伝達関数を示している。したがって、図4に示した部分応答変換部124がこの部分インパルス応答hp(t)を高速フーリエ変換して得られる結果は、残響成分の伝達特性Hr(ω)を示している。
【0064】
部分応答変換部124は、例えば、式(8)に基づいて、部分インパルス応答hp(t)をフーリエ変換して得られる複素数の部分インパルス応答スペクトルHp(ω)の代わりに、その電力|Hp(ω)|を求めてもよい。なお、式(8)において、FFT(hp(t))は、部分インパルス応答hp(t)のフーリエ変換結果を示す。また、式(8)において、Re{FFT(hp(t))}は部分インパルス応答hp(t)のフーリエ変換結果の実部を示し、Im{FFT(hp(t))}は部分インパルス応答hp(t)のフーリエ変換結果の虚部を示す。
|Hp(ω)|=Re{FFT(hp(t))}+Im{FFT(hp(t))} ・・・(8)
上述した補正インパルス応答スペクトルHw(ω)の電力|Hw(ω)|に対する部分インパルス応答スペクトルHp(ω)の電力|Hp(ω)|との比は、式(6)に示した室内空間の伝達特性H(ω)に対する残響音についての伝達特性Hr(ω)の比に相当する。
【0065】
したがって、推定残響音成分スペクトルYe(ω)は、式(9)に示すように、補正インパルス応答スペクトルHw(ω)の電力|Hw(ω)|と部分インパルス応答スペクトルHp(ω)の電力|Hp(ω)|との比を用いて表すことができる。したがって、特性算出部125は、この式(9)に基づいて、推定残響音成分スペクトルYe(ω)を求めてもよい。
【0066】
【数2】

【0067】
なお、特性算出部125は、上述した式(9)の代わりに、式(10)を用いて、推定残響音成分スペクトルYe(ω)を推定してもよい。
【0068】
【数3】

【0069】
また、特性算出部125は、式(9)あるいは式(10)において音声信号スペクトルY(ω)に乗算される残響特性係数を、残響抑制処理の対象となる音声がマイクロホン104に入力されるのに先立って算出しておいてもよい。
【0070】
上述したように、図4に例示した音声補正部110が推定残響音成分スペクトルYe(ω)の算出に用いる部分インパルス応答スペクトルHp(ω)は、残響音の伝達関数を示す部分インパルス応答hp(t)のフーリエ変換結果である。したがって、この部分インパルス応答スペクトルHp(ω)は、残響音の周波数特性を忠実に反映している。また、上述したように、補正インパルス応答hw(t)をフーリエ変換して得られる補正インパルス応答スペクトルHw(ω)は、第2インパルス応答h2(t)が取得された室内の伝達特性を忠実に反映している。
【0071】
したがって、式(9)あるいは式(10)を適用した推定処理により、特性算出部125は、高い精度を持つ推定残響音成分スペクトルYe(ω)を得ることができる。
【0072】
図7は、推定残響音成分スペクトルYe(ω)の例を示している。なお、図7(A),(B)において、符号Ye(ω)−0で示した点線のグラフは、理想的な配置で測定したインパルス応答に基づく推定処理で得られた推定残響音成分スペクトルYe(ω)を示す。
【0073】
図7(A)において符号A1で示した実線のグラフは、図4に例示した音声補正部110の特性算出部125により、補正インパルス応答hw(t)を用いた推定処理によって得られた推定残響音成分スペクトルYe(ω)を示す。一方、図7(B)において符号B1で示した実線のグラフは、特性算出部125によって、第2インパルス応答h2(t)をそのまま用いた推定処理によって得られる推定残響音成分スペクトルYe(ω)を示す。
【0074】
図7(B)に示した補正前の第2インパルス応答h2(t)を用いて得られた推定残響音成分スペクトルYe(ω)は、ほとんどの周波数帯域において、理想的な配置で測定したインパルス応答を用いて得られた推定残響音成分スペクトルYe(ω)を大きく上回っている。
【0075】
一方、図7(A)に示した補正インパルス応答hw(t)を用いて得られた推定残響音成分スペクトルYe(ω)のグラフと、理想的な配置で測定したインパルス応答を用いて得られた推定残響音成分スペクトルYe(ω)のグラフとは、ほぼ同等の傾向を示している。
【0076】
このようにして得られた推定残響音成分スペクトルYe(ω)を、図4に例示したゲイン算出部113に入力することにより、このゲイン算出部113により、残響音成分の抑制に好適な周波数特性を持つゲインg(ω)を求めることができる。
【0077】
乗算器114は、このようにして求められたゲインg(ω)を入力音声スペクトルY(ω)に乗算することにより、残響音成分が選択的に抑制された補正音声信号スペクトルY’(ω)を得る。そして、逆FFT演算処理部127は、この補正音声信号スペクトルY’(ω)に対して逆FFT処理を行うことにより、残響音成分が選択的に抑制された補正音声信号y’(t)を生成する。
【0078】
このようにして生成された補正音声信号y’(t)においては、残響音成分が抑制されていながら、携帯端末のマイクロホン104に直接に到達する利用者の音声の成分はそのまま維持されている。したがって、浴室のように周囲の壁などからの反射が多い環境においても、本件開示の残響抑制装置100を有する携帯端末の音声通話機能を使用している人物の音声を、通話中の相手に対して明瞭に伝達することができる。また、これにより、本件開示の残響抑制装置100を有する携帯端末の利用者が浴室などにいることを、通話中の相手に対して秘匿することも可能である。
【0079】
本件開示の残響抑制装置100は、携帯端末のハードウェアを用いて実現することができる。
【0080】
図8は、携帯端末10のハードウェア構成の一例を示している。なお、図8に示した構成要素のうち、図1に示した構成要素と同等のものについては、同一の符号を付して示す。
【0081】
携帯端末10は、プロセッサ21と、メモリ22と、通信処理部105と、マイクロホン104と、スピーカ106とを含んでいる。また、携帯端末10は、更に、記録処理部24と、着脱自在のメモリカード25と、表示制御部26と、液晶表示部27と、入力インタフェース(I/F:Interface)部28と、操作パネル29とを含んでいる。
【0082】
プロセッサ21と、メモリ22と、通信処理部105と、マイクロホン104と、スピーカ106と、記録処理部24と、表示制御部26と、入力I/F部28とは、バスを介して互いに接続されている。記録処理部24は、メモリカード25からのデータの読出処理およびメモリカード25へのデータの書込処理を行う。また、表示制御部26は、液晶表示部27による表示処理を制御する。入力I/F部28は、操作パネル29に対する操作を示す情報をプロセッサ21に伝達する処理を行う。
【0083】
メモリ22は、携帯端末10のオペレーティングシステムとともに、プロセッサ21が残響抑制処理を実行するためのアプリケーションプログラムを格納している。このアプリケーションプログラムは、本件開示の残響抑制方法に含まれる応答を補正する処理と音声信号を補正する処理とを実行するためのプログラムを含む。なお、上述した残響抑制処理を実行するためのアプリケーションプログラムは、例えば、メモリカード25に記録して頒布することができる。そして、このメモリカードを記録処理部24に装着して読み込み処理を行うことにより、残響抑制処理を実行するためのアプリケーションプログラムは、メモリ22に格納される。また、インターネットなどのネットワークと通信処理部105を介して、残響抑制処理を実行するためのアプリケーションプログラムをメモリ22に読み込ませることもできる。
【0084】
また、上述したアプリケーションプログラムなどとともに、メモリ22に、第1インパルス応答h1(t)を示す情報を格納しておくことにより、図1に示した第1保持部101を実現してもよい。例えば、標準的な浴室において測定したインパルス応答の波形を表す情報を、第1インパルス応答h1(t)を示す情報としてメモリ22に保持させておいてもよい。なお、インパルス応答の波形を表す情報は、例えば、携帯端末10のマイクロホン104の指向性を考慮して配置した音源にインパルスを出力させたときのマイクロホン104の出力信号を適切な周期でサンプリングすることによって得てもよい。
【0085】
一方、図1に示した第2保持部102は、後述するようにして、第2インパルス応答h2(t)の測定を行ったときに、測定結果として得られた第2インパルス応答h2(t)を示す情報をメモリ22に保持することによって実現してもよい。
【0086】
また、プロセッサ21は、メモリ22に格納されたアプリケーションプログラムに含まれる応答を補正する処理のプログラムを実行することにより、図1に示した応答補正部103の機能を果たしてもよい。また、プロセッサ21は、メモリ22に格納されたアプリケーションプログラムに含まれる音声信号を補正する処理のプログラムを実行することにより、図1に示した音声補正部110の機能を果たしてもよい。このように、プロセッサ21が、メモリ22に格納されたアプリケーションプログラムを実行することにより、図1に示した残響抑制装置100の機能を果たしてもよい。
【0087】
図9は、本件開示の残響抑制装置100を有する携帯端末のフローチャートの一例である。図9に示したフローチャートに含まれるステップS1〜ステップS10の処理を、図8に示したプロセッサ21は、各部と協働して実行する。
【0088】
ステップS1において、プロセッサ21は、入力I/F部28を介して、利用者が操作パネル29を操作することによって入力した指示を受け取る。次に、プロセッサ21は、受け取った指示が、残響特性を推定するための測定を行う旨の指示であるか否かを判定する(ステップS2)。
【0089】
例えば、プロセッサ21は、携帯端末10の詳細設定メニューに含まれる選択肢の一つとして、所望の室内におけるインパルス応答の測定を指示する項目を、表示制御部26を介して液晶表示部27に表示させてもよい。また、プロセッサ21は、浴室などにおいて携帯端末10の通話機能を利用する前に、当該浴室におけるインパルス応答の測定を促すメッセージなどを、表示制御部26を介して液晶表示部27に表示させてもよい。そして、入力I/F部28からの通知により、この項目を選択する旨の操作が為されたことが示されたときに、プロセッサ21は、ステップS2の肯定判定として、残響特性を推定するための測定処理を行う(ステップS3)。
【0090】
図10は、残響特性を推定するための測定処理のフローチャートである。図10に示したステップS11〜ステップS18の処理は、図9に示したステップS3の処理の一例である。これらのステップS11〜ステップS18の処理を、図8に示したプロセッサ21は、各部と協働して実行する。
【0091】
ステップS11において、プロセッサ21は、図8に示したスピーカ106にインパルスを出力させることにより、第2インパルス応答h2(t)の測定を開始する。スピーカ106によって出力されたインパルスに応じて、マイクロホン104によって出力される音声信号から、プロセッサ21は、第2インパルス応答h2(t)を表す情報を取得する(ステップS12)。ステップS12において、プロセッサ21は、例えば、適切なサンプリング周期でマイクロホンの出力信号をサンプリングすることにより、第2インパルス応答h2(t)の波形を示す情報を取得してもよい。
【0092】
次いで、プロセッサ21は、ステップS12で取得した第2インパルス応答h2(t)を示す情報をメモリ22に保持する(ステップS13)。
【0093】
次に、プロセッサ21は、予めメモリ22に保持された情報で示される第1インパルス応答h1(t)と、ステップS13で保持した情報で示される第2インパルス応答h2(t)とを合成することにより、補正インパルス応答hw(t)を求める(ステップS14)。プロセッサ21は、例えば、図5(A),(B)に示した重み関数α(t)、β(t)を用いて、上述した式(1)で示した加重加算処理を行うことにより、補正インパルス応答hw(t)を求めてもよい。このように、プロセッサ21が、ステップS14の処理を実行することにより、図1に示した応答補正部103の機能を実現してもよい。
【0094】
なお、プロセッサ21は、上述した加重加算処理に先立って、第1期間P1と第2期間P2との境界を示す時刻T1として、第1インパルス応答h1(t)と第2インパルス応答h2(t)とが同一の値となる時刻を検出してもよい。このようにして検出された時刻T1を境界として定義された重み関数α(t)、β(t)を用いた加重加算処理を行うことにより、プロセッサ21は、第1期間P1と第2期間P2との境界付近における補正インパルス応答hw(t)の連続性を保証することができる。
【0095】
次いで、プロセッサ21は、ステップS14で得られた補正インパルス応答hw(t)から、時間領域における残響音の伝達特性を示す部分インパルス応答hp(t)を抽出する(ステップS15)。プロセッサ21は、例えば、ステップS14で求めた補正インパルス応答hw(t)に含まれる第2期間P2の部分を、部分インパルス応答hp(t)として抽出してもよい。なお、プロセッサ21は、ステップS14の処理の過程で、重み関数β(t)によって重み付けされた第2インパルス応答h2(t)を、部分インパルス応答hp(t)として保持しておいてもよい。このように、プロセッサ21が、ステップS15の処理を実行することにより、図4に示した抽出部123の機能を実現してもよい。
【0096】
次に、プロセッサ21は、補正インパルス応答hw(t)および部分インパルス応答hp(t)をフーリエ変換する処理を行う(ステップS16)。この処理により、プロセッサ21は、例えば、補正インパルス応答スペクトルHw(ω)の電力|Hw(ω)|と部分インパルス応答スペクトルHp(ω)の電力|Hp(ω)|とを求める。プロセッサ21は、ステップS16の処理で、補正インパルス応答スペクトルHw(ω)の絶対値|Hw(ω)|と、部分インパルス応答スペクトルHp(ω)の絶対値|Hp(ω)|とを求めてもよい。このように、プロセッサ21が、ステップS16処理を実行することにより、図4に示した補正応答変換部126と部分応答変換部124とを実現してもよい。
【0097】
ステップS16で得られたフーリエ変換結果に基づいて、プロセッサ21は、式(9)または式(10)で示される残響特性係数として、比|Hp(ω)|/|Hw(ω)|あるいは比|Hp(ω)|/|Hw(ω)|を算出する(ステップS17)。
【0098】
このようにして、本件開示の残響抑制装置100を有する携帯端末10によれば、浴室などにおいて通話機能を利用するのに先立って、携帯端末10を用いた測定によって得られた第2インパルス応答h2(t)に基づいて残響特性係数を算出しておくことができる。
【0099】
その後、プロセッサ21は、ステップS17で算出した残響特性係数をメモリ22に保持する処理を行う(ステップS18)。
【0100】
なお、プロセッサ21は、複数の異なる特徴を持つ室内における残響を抑制する場合を考慮して、メモリ22に、複数の異なる残響特性係数を保持させてもよい。例えば、プロセッサ21は、第2インパルス応答h2(t)を測定した部屋を示す情報に対応して、ステップS17の処理において算出した残響特性係数をメモリ22に保持してもよい。また、ステップS17の残響特性係数の算出処理が完了した後は、第2インパルス応答h2(t)を示す情報は不要となるので、メモリ22内の第2インパルス応答h2(t)を示す情報を削除してもよい。一方、第1インパルス応答h1(t)を示す情報は、別の室内に対応する残響特性係数の算出に用いられる可能性があるので、プロセッサ21は、ステップS17の処理の完了後も、メモリ22内の第1インパルス応答h1(t)を示す情報を維持する。
【0101】
このようにして、残響特性を推定するための測定処理を終了した後に、プロセッサ21は、図9に示したステップS4の処理に進む。
【0102】
ステップS4において、プロセッサ21は、携帯端末10の電源をオフする操作が為されたか否かを判定する。携帯端末10の電源をオフする操作が為されていない場合に(ステップS4の否定判定)、プロセッサ21は、ステップS1の処理に戻る。そして、プロセッサ21は、新たに入力される指示を受け取る。
【0103】
ステップS1で受け取った指示が、残響特性を推定するための測定を行う旨の指示でない場合に(ステップS2の否定判定)、プロセッサ21は、ステップS5の処理に進む。そして、プロセッサ21は、入力された指示が、携帯端末10の通話機能を起動する指示であるか否かを判定する(ステップS5)。
【0104】
入力I/F部28を介して受け取った指示が、通話機能を起動する指示ではない場合に(ステップS5の否定判定)、プロセッサ21は、ステップS1で受け取った指示に対応する処理を行う(ステップS6)。そして、ステップS6の処理の終了後に、ステップS4の処理に進む。
【0105】
一方、発信処理を指示する操作など、通話機能を起動する指示が入力された場合に(ステップS5の肯定判定)、プロセッサ21は、残響抑制対象の通話であるか否かを判定する(ステップS7)。例えば、入力I/F部28を介して、通話機能を起動する旨の指示とともに、残響抑制モードを指定する旨の指示を受け取った場合に、プロセッサ21は、以降の通話は、残響抑制対象の通話であると判断する(ステップS7の肯定判定)。そして、この場合に、プロセッサ21は、ステップS8の残響を抑制する処理に進む。
【0106】
図11は、周波数領域で残響を抑制する処理のフローチャートである。図11に示したステップS21〜ステップS27の処理は、図9に示したステップS8の処理の一例である。これらのステップS21〜ステップS27の処理を、図8に示したプロセッサ21は、各部と協働して実行する。
【0107】
プロセッサ21は、まず、マイクロホン104から音声信号y(t)を取得する(ステップS21)。プロセッサ21は、例えば、高速フーリエ変換処理の処理単位となる1フレームに相当する時間分の音声信号y(t)を、所定のサンプリング周期でサンプリングすることにより、音声信号y(t)の波形を表す情報を得てもよい。
【0108】
次に、プロセッサ21は、ステップS21で取得した音声信号y(t)について、高速フーリエ変換処理を適用することにより、音声信号スペクトルY(ω)を求める(ステップS22)。このように、プロセッサ21が、ステップS22の処理を実行することにより、図4に示したFFT演算処理部122の機能を実現してもよい。
【0109】
次いで、プロセッサ21は、図10に示したステップS18でメモリ22に保持した残響特性係数を音声信号スペクトルY(ω)に乗算することにより、推定残響音成分スペクトルYe(ω)を求める(ステップS23)。このように、プロセッサ21が、図10に示したステップS17の処理と図11に示したステップS23の処理とをそれぞれ異なるタイミングで実行することにより、図4に示した特性算出部124の機能を実現してもよい。
【0110】
なお、メモリ22に複数の部屋に対応して残響特性係数が保持されている場合に、プロセッサ21は、例えば、上述した残響抑制モードを指定する旨の指示で指定された部屋に対応する残響特性係数を用いて、ステップS23の処理を実行してもよい。
【0111】
次に、プロセッサ21は、ステップS23で求めた推定残響音成分スペクトルYe(ω)に基づいて、音声信号スペクトルY(ω)に適用するゲインg(ω)を算出する(ステップS24)。プロセッサ21は、例えば、推定残響音成分スペクトルYe(ω)の値で示される残響音の各周波数成分の大きさに基づいて、次に述べるようにして、当該周波数におけるゲインg(ω)の値を算出してもよい。
【0112】
ゲイン(ω)の値は、推定残響音成分スペクトルYe(ω)の値で示される残響音の各周波数成分が大きいほど小さい値となることが望ましい。これにより、残響音成分の大きさに応じて、残響音を抑制する作用を調整することができる。なお、ゲインg(ω)の値に、以下に述べるようにして、上限と下限を設けてもよい。
【0113】
図12は、ゲインの算出処理を説明する図である。図12に示した実線のグラフは、推定残響音成分スペクトルYe(ω)の値で示される残響音成分の大きさとゲインg(ω)の値との関係の一例を示す。
【0114】
図12に例示したグラフにおいて、残響音成分の大きさが後述する閾値Th1未満である範囲に対応するゲインg(ω)は、ゲインの上限値1である。また、残響音成分の大きさが閾値Th1以上であって別の閾値Th2以下である範囲に対応するゲインg(ω)の値は、残響音成分の大きさに応じて、上限値1から下限値g0まで単調に減少する。一方、残響音成分の大きさが閾値Th2を超える範囲に対応するゲインg(ω)は、ゲインの下限値g0である。
【0115】
プロセッサ21は、図12に示したような関係に基づいて、推定残響音成分スペクトルYe(ω)の値で示される残響音成分の大きさに対応するゲインg(ω)を決定することにより、図1に示したゲイン算出部113の機能を果たしてもよい。
【0116】
なお、図12に示した閾値Th1は、例えば、携帯端末10の通話機能が利用される環境において想定される背景雑音の大きさを示す値に基づいて、予め決定しておいてもよい。なお、閾値Th1の値は、騒音レベルを尺度に用いて表してもよい。また、閾値Th2は、上述したゲインの下限値g0を適用して残響抑制を行った場合に、残響抑制後の音声に歪が現れる残響音成分の大きさを調べる実験を行って得られた結果などに基づいて予め決定しておいてもよい。
【0117】
このようにしてゲインg(ω)を算出した後に、プロセッサ21は、図11に示したステップS25の処理に進む。ステップS25で、プロセッサ21は、音声信号スペクトルY(ω)と、ステップS24で求めたゲインg(ω)とを乗算することにより、補正音声信号スペクトルY’(ω)を求める処理を行う。このように、プロセッサ21が、ステップS25の処理を実行することにより、図1に示した乗算部114の機能を実現してもよい。
【0118】
次いで、プロセッサ21は、補正音声信号スペクトルY’(ω)に対して、高速逆フーリエ変換処理を適用することにより、補正音声信号y’(t)を求める(ステップS26)。そして、プロセッサ21は、ステップS26で求めた補正音声信号y’(t)を、マイクロホン104で得られた音声信号y(t)の代わりに通信処理部105に入力する(ステップS27)。このように、プロセッサ21が、ステップS26、S27の処理を実行することにより、図4に示した逆FFT演算処理部127の機能を実現してもよい。
【0119】
上述したステップS21〜ステップS27の処理の実行を完了した後に、プロセッサ21は、図9に示したステップS10において、通話の終了が指示されたか否かを判定する。
【0120】
プロセッサ21は、例えば、入力I/F部28から通話を終了する操作が行われた旨の通知を受け取るまで、ステップS7、ステップS8およびステップS10の処理を繰り返す。これにより、利用者が浴室などの残響音が大きくなる環境において携帯端末10の通話機能を利用する際に、マイクロホン104で得られる音声信号y(t)に含まれる残響音成分を適切に抑制することができる。
【0121】
一方、図9に示したステップS7において、入力I/F部28を介して、通話機能を起動する旨の指示のみを受け取った場合に、プロセッサ21は、以降の通話は、残響抑制処理が不要な通常の通話であると判断する(ステップS7の否定判定)。この場合に、プロセッサ21は、従来と同様に、マイクロホン104で得られた音声信号y(t)をそのまま通信処理部105に渡す通常通話処理を実行する。そして、ステップS10で通話が終了したと判定されるまで、プロセッサ21は、ステップS7、ステップS9およびステップS10の処理を繰り返す。
【0122】
そして、入力I/F部28から通話を終了する操作が行われた旨の通知を受け取ったときに、プロセッサ21は、ステップS10の肯定判定として、ステップS4の処理に進む。
【0123】
このようにして、本件開示の残響抑制装置100を有する携帯端末10は、利用者からの指示に応じて、利用者が携帯端末10の通話機能を利用する環境が残響抑制の対象である場合に限って、適切な残響抑制を適用することができる。
【0124】
なお、図1に示した応答補正部103が補正インパルス応答hw(t)を求める手法は、第1インパルス応答h1(t)の第1期間P1の部分を、第2インパルス応答h2(t)の波形に反映する手法であれば他の手法でもよい。例えば、第2インパルス応答h2(t)の第1期間P1の部分を第1インパルス応答h1(t)の対応する部分に一致させるように補正することにより、補正インパルス応答hw(t)を求めてもよい。
【0125】
また、補正インパルス応答hw(t)に基づいて、音声信号y(t)に含まれる残響音成分を時間領域において抑制することも可能である。
【0126】
図13は、残響抑制装置100の別実施形態を示している。なお、図13に示した構成要素のうち、図1に示した構成要素と同等のものについては、同一の符号を付して示し、その説明は省略する。
【0127】
図13に例示した応答増幅部131は、第2保持部102に保持された情報で示される第2インパルス応答h2(t)から補正インパルス応答hw(t)を生成する応答補正部103の一例である。また、図13に例示した音声補正部110は、係数算出部133と残響抑制フィルタ134とを含んでいる。
【0128】
また、図13に示した第1保持部101は、第1インパルス応答h1(t)を示す情報として、第2インパルス応答h2(t)の第1期間P1の部分の波形を第1インパルス応答h1(t)の波形に近づけるための重み関数γ(t)を表す情報を保持している。
【0129】
図14(A),(B)は、重み関数γ(t)の例を示している。なお、図14に示した要素のうち、図5に示した要素と同等のものについては、同一の符号を付して示し、その説明は省略する。
【0130】
図14(A)に示したグラフは、第1期間P1において、第1インパルス応答h1(t)のピークと第2インパルス応答h2(t)のピークとの比に相当する初期値a1を維持する重み関数γ(t)の一例である。一方、図14(B)に示したグラフは、第1期間P1において、初期値a1から数値1まで単調に減少する重み関数γ(t)の一例である。
【0131】
なお、重み関数γ(t)の値は、第2期間P2においては、第2インパルス応答h2(t)の波形を補正インパルス応答hw(t)にそのまま反映させるために、固定値1とすることが望ましい。
【0132】
また、初期値a1は、例えば、次のようにして求めることができる。同一の室内において、理想的な位置に配置した音源でインパルス発生させた場合と、携帯端末10のスピーカ106でインパルスを発生させた場合とに付き、マイクロホン104の出力信号の波形をそれぞれ取得する。そして、例えば、理想的な配置でのインパルスに対応する出力信号の波形のピークと、第2インパルス応答h2(t)の取得と同様の配置でのインパルスに対応する出力信号の波形のピークとの比に基づいて、上述した初期値a1を決定してもよい。
【0133】
また、図13に示した応答増幅部131は、このような重み関数γ(t)を第2インパルス応答h2(t)の波形に対して乗算する処理を行う。これにより、図6(A)に示したような第2インパルス応答h2(t)の第1期間P1の部分を選択的に増幅し、図6(B)に示した補正インパルス応答hw(t)に近似した補正インパルス応答hw(t)を生成することができる。
【0134】
図13に示した残響抑制フィルタ134は、特性係数ベクトルC[c(0),c(1),…c(T2)]によって示される残響抑圧フィルタである。また、係数算出部133は、式(11)に基づいて、残響抑制フィルタ134の特性を示す特性係数ベクトルCに含まれる各要素c(0),c(1),…c(T2)を算出する。
C=R−1・q ・・・(11)
なお、式(11)において、特性係数ベクトルCは、補正インパルス応答hw(t)を示す行列hwの自己相関行列Rの逆行列と、インパルスIpと行列hwとの相互相関ベクトルqとの積で表される。なお、行列hwの自己相関行列Rの定義を式(12)に示し、また、インパルスIpと行列hwとの相互相関ベクトルqの定義を式(13)に示す。
R=hw・hw ・・・(12)
q=Ip・hw ・・・(13)
図13に示した音声補正部110は、マイクロホン104からの音声信号y(t)を、上述した式(11)で示される特性係数ベクトルCが設定された残響抑制フィルタ134に入力することにより、残響音成分が抑制された補正音声信号y’(t)を得る。
【0135】
なお、残響抑制フィルタ134の出力として得られる補正音声信号y’(t)は、特性係数ベクトルCに含まれる各要素c(0),c(1),…c(T2)と音声信号y(t)とを用いて、式(14)のように表される。
【0136】
【数4】

【0137】
図13に例示した残響抑制装置100も、図8に例示したプロセッサ21およびメモリ22を含む携帯端末10のハードウェアと、メモリ22に格納されたプログラムとを協働させることによって実現することができる。
【0138】
図13に例示した残響抑制装置100を、図8に例示した携帯端末10のハードウェアを用いて実現する場合に、メモリ22に格納されるアプリケーションプログラムは、応答増幅部131の処理をプロセッサ21に実行させるためのプログラムを含む。また、メモリ22に格納されるアプリケーションプログラムは、係数算出部133の処理および残響抑制フィルタ134の処理をプロセッサ21に実行させるためのプログラムを含んでもよい。
【0139】
また、上述した重み関数γ(t)は、上述したアプリケーションプログラムなどとともに、第1インパルス応答h1(t)を示す情報として、メモリ22に保持させることができる。
【0140】
なお、図14(A),(B)に示したような重み関数γ(t)は、第1インパルス応答h1(t)の波形に比べて少ない情報量で表すことができるので、本件開示の残響抑制装置100のために、携帯端末10のメモリ22に保持させる情報の容量を抑制することができる。
【0141】
図15は、本件開示の残響抑制装置を有する携帯端末のフローチャートの一例である。なお、図15に示すステップのうち、図9に示したフローチャートに含まれるステップと同等の処理を行うものについては、同一の符号を付して示し、その説明を省略する。
【0142】
図15のフローチャートに従って処理を実行する場合に、プロセッサ21は、ステップS2の肯定判定に応じて、図9に示したステップS3の処理の代わりに、ステップS31において、上述した特性係数ベクトルCを算出する処理を行う。
【0143】
図16は、特性係数ベクトルCを算出する処理のフローチャートの一例である。なお、図16に示すステップのうち、図10に示したフローチャートに含まれるステップと同等の処理を行うものについては、同一の符号を付して示し、その説明を省略する。
【0144】
図16に示したステップS11〜ステップS13およびステップS33〜ステップS35の処理は、図15に示したステップS31の処理の一例である。図8に示したプロセッサ21は、これらのステップS11〜ステップS13およびステップS33〜ステップS35の処理を、携帯端末10に含まれる各部と協働して実行する。
【0145】
プロセッサ21は、ステップS11〜ステップS13の処理によって第2インパルス応答h2(t)を取得した後に、ステップS33の処理に進む。このステップS33において、プロセッサ21は、第2インパルス応答h2(t)に上述した重み関数γ(t)を乗算して適用することにより、補正インパルス応答hw(t)を生成する。このように、プロセッサ21が、ステップS33の処理を実行することにより、図13に示した応答増幅部131の機能を実現してもよい。
【0146】
次に、プロセッサ21は、上述した式(11)〜式(13)に基づいて、特性係数ベクトルCを算出する処理を行う(ステップS34)。そして、プロセッサ21は、ステップS34で算出した特性係数ベクトルCをメモリ22に保持する処理を行い(ステップS35)、この処理の完了後に、図15に示したステップS4の処理に進む。
【0147】
図15に示したステップS7の肯定判定の場合に、プロセッサ21は、マイクロホン104で取得される音声信号y(t)に含まれる残響音成分を時間領域で抑制する処理を実行する(ステップS32)。
【0148】
図17は、時間領域で残響を抑制する処理のフローチャートである。なお、図17に示すステップのうち、図11に示したフローチャートに含まれるステップと同等の処理を行うものについては、同一の符号を付して示し、その説明を省略する。
【0149】
図17に示したステップS21、ステップS36およびステップS27の処理は、図15に示したステップS32の処理の一例である。図8に示したプロセッサ21は、これらのステップS21、ステップS36およびステップS27の処理を、携帯端末10に含まれる各部と協働して実行する。
【0150】
図17に示したステップS36において、プロセッサ21は、上述した式(14)に基づき、ステップS21で取得した音声信号y(t)と特性係数ベクトルCとの畳み込みとして、補正音声信号y’(t)を算出する処理を行う。このように、プロセッサ21が、ステップS36の処理を実行することにより、残響抑制フィルタ134の機能を実現してもよい。
【0151】
補正音声信号y’(t)の算出に用いられる特性係数ベクトルCは、式(11)〜式(13)から明らかなように、補正インパルス応答hw(t)で表される残響音成分が音声信号y(t)に与える影響をキャンセルするように求められている。
【0152】
したがって、本件開示の残響抑制装置100の応答補正部103により、第2インパルス応答h2(t)に基づいて、精密な測定で得られるインパルス応答と同等の補正インパルス応答hw(t)を取得可能としたことは、時間領域での残響抑制にも有用である。
【0153】
なお、応答補正部103において、補正インパルス応答hw(t)を求める手法として例示した2つの手法と、音声補正部110において、補正音声信号y’(t)を求めるための2つの手法とは、以上に説明した例に限らず、如何様にも組み合わせることができる。例えば、第2インパルス応答h2(t)の第1期間P1の部分を増幅する手法と、音声補正部110において、音声信号y(t)に含まれる残響音成分を周波数領域で抑制する手法とを組み合わせてもよい。
【符号の説明】
【0154】
10…携帯端末;21…プロセッサ;22…メモリ;24…記録処理部;25…メモリカード;26…表示制御部;27…液晶表示部;28…入力インタフェース(I/F)部;29…操作パネル;100…残響抑制装置;101…第1保持部;102…第2保持部;103…応答補正部;104…マイクロホン;105…通信処理部;106,107…スピーカ;110…音声補正部;111…変換部;112…推定部;113…ゲイン算出部;114…乗算部;115…逆変換部;121…加重加算部;122…高速フーリエ変換(FFT)演算部;123…抽出部;124…部分応答変換部;125…特性算出部;126…補正応答変換部;127…逆FFT演算部;131…応答増幅部;133…係数算出部;134…残響抑制フィルタ

【特許請求の範囲】
【請求項1】
携帯端末に搭載されたスピーカ又はマイクロホンの指向性に基づいて配置された音源がインパルスを出力した際に前記マイクロホンが出力する信号から得られる第1インパルス応答を示す情報を予め保持する第1保持部と、
残響音を抑制する対象となる室内において、前記携帯端末に搭載されたスピーカがインパルスを出力した際に前記マイクロホンが出力する信号から得られる第2インパルス応答を示す情報を保持する第2保持部と、
前記第1インパルス応答を示す情報を用いて、前記第2保持部に保持された情報で示される前記第2インパルス応答を補正することにより、前記室内の環境を反映した補正インパルス応答を求める応答補正部と、
前記補正インパルス応答に基づいて、前記室内において前記マイクロホンに音声が入力される際に当該マイクロホンによって得られる音声信号を補正する音声補正部と、
を備えたことを特徴とする残響抑制装置。
【請求項2】
請求項1に記載の残響抑制装置において、
前記第1保持部は、前記第1インパルス応答の波形を示す情報を保持し、
前記第2保持部は、前記第2インパルス応答の波形を示す情報を保持し、
前記応答補正部は、前記第1インパルス応答の波形を示す情報と前記第2インパルス応答の波形を示す情報とに、前記インパルスが出力された時刻から所定の第1時刻までの第1期間と前記第1時刻以降の第2期間とについてそれぞれ異なる重みを適用して加重加算することにより、前記補正インパルス応答を求める
ことを特徴とする残響抑制装置。
【請求項3】
請求項1に記載の残響抑制装置において、
前記第1保持部は、前記第1インパルス応答の前記第1期間における音声のパワーと、前記携帯端末に搭載されたスピーカによってインパルスを出力した際に前記第1期間において前記マイクロホンに到来する音声のパワーとの比を示す情報を、前記第1インパルスを示す情報として予め保持し、
前記第2保持部は、前記第2インパルス応答の波形を示す情報を保持し、
前記応答補正部は、前記第2インパルス応答の第1期間における波形を、前記比を示す情報を用いて増幅する補正を行うことにより、前記補正インパルス応答を求める
ことを特徴とする残響抑制装置。
【請求項4】
請求項1または請求項2に記載の残響抑制装置において、
前記音声補正部は、
前記音声信号を周波数領域の信号に変換する変換部と、
前記補正インパルス応答と前記周波数領域の信号とに基づいて、前記音声信号に含まれる残響音の周波数特性を示す残響特性を推定する推定部と、
前記推定部によって推定された残響特性に基づいて、前記残響音の各周波数成分を抑制するためのゲインを算出するゲイン算出部と、
前記周波数領域の信号に前記ゲインを乗算する乗算部とを有する
ことを特徴とする残響抑制装置。
【請求項5】
請求項4に記載の残響抑制装置において、
前記推定部は、
前記補正インパルス応答から残響音の成分を示す部分インパルス応答を抽出する抽出部と、
前記補正インパルス応答に対応する補正インパルス応答スペクトルと、前記部分インパルス応答に対応する部分インパルス応答スペクトルとの比を、前記周波数領域の信号に乗算することにより前記残響特性を算出する特性算出部とを有する
ことを特徴とする残響抑制装置。
【請求項6】
請求項4に記載の残響抑制装置において、
前記ゲイン算出部は、
所定の第1閾値を超える残響特性が得られた周波数成分に対応するゲインにあらかじめ決定したゲインの下限値を設定し、別の第2閾値未満の残響特性が得られた周波数成分に対応するゲインに前記下限値よりも大きい上限値を設定し、前記第2閾値以上であって前記第1閾値以下の残響特性が得られた周波数成分に対応するゲインとして、前記残響特性の値に応じて、前記上限値から前記下限値に単調に減少するようなゲインを設定する
ことを特徴とする残響抑制装置。
【請求項7】
携帯端末に搭載されたスピーカ又はマイクロホンの指向性に基づいて配置された音源がインパルスを出力した際に前記マイクロホンが出力する信号から得られる第1インパルス応答を示す情報を用いて、
残響音を抑制する対象となる室内において前記携帯端末に搭載されたスピーカがインパルスを出力した際に前記マイクロホンが出力する信号から得られる第2インパルス応答を補正することにより、前記室内の環境を反映した補正インパルス応答を求め、
前記補正インパルス応答に基づいて、前記室内において前記マイクロホンに音声が入力される際に当該マイクロホンによって得られる音声信号を補正する、
ことを特徴とする残響抑制方法。
【請求項8】
携帯端末に搭載されたスピーカ又はマイクロホンの指向性に基づいて配置された音源がインパルスを出力した際に前記マイクロホンが出力する信号から得られる第1インパルス応答を示す情報を用いて、
残響音を抑制する対象となる室内において前記携帯端末に搭載されたスピーカがインパルスを出力した際に前記マイクロホンが出力する信号から得られる第2インパルス応答を補正することにより、前記室内の環境を反映した補正インパルス応答を求め、
前記補正インパルス応答に基づいて、前記室内において前記マイクロホンに音声が入力される際に当該マイクロホンによって得られる音声信号を補正する、
処理をコンピュータに実行させる残響抑制プログラム。
【請求項9】
請求項8に記載の残響抑制プログラムにおいて、
前記補正インパルス応答を求める処理として、
前記第1インパルス応答の波形を示す情報と前記第2インパルス応答の波形を示す情報とに、前記インパルスが出力された時刻から所定の第1時刻までの第1期間と前記第1時刻以降の第2期間とについてそれぞれ異なる重みを適用して加重加算する処理を含む、
処理をコンピュータに実行させる残響抑制プログラム。
【請求項10】
請求項8に記載の残響抑制プログラムにおいて、
前記補正インパルス応答を求める処理として、
前記第1インパルス応答の前記第1期間における音声のパワーと、前記携帯端末に搭載されたスピーカによってインパルスを出力した際に前記第1期間において前記マイクロホンに到来する音声のパワーとの比を示す情報を用いて、前記第2インパルス応答の第1期間における波形を増幅する処理を含む、
処理をコンピュータに実行させる残響抑制プログラム。
【請求項11】
請求項8に記載の残響抑制プログラムにおいて、
音声信号を補正する処理として、
前記音声信号を周波数領域の信号に変換し、
前記補正インパルス応答と前記周波数領域の信号とに基づいて、前記音声信号に含まれる残響音の周波数特性を示す残響特性を推定し、
前記推定された残響特性に基づいて、前記残響音に含まれる各周波数成分を抑制するためのゲインを算出し、
前記周波数領域の信号に前記ゲインを乗算する処理を含む
処理をコンピュータに実行させる残響抑制プログラム。
【請求項12】
請求項11に記載の残響抑制プログラムにおいて、
前記残響特性を推定する処理として、
前記補正インパルス応答から残響音の成分を示す部分インパルス応答を抽出し、
前記補正インパルス応答に対応する補正インパルス応答スペクトルと、前記部分インパルス応答に対応する部分インパルス応答スペクトルとの比を、前記周波数領域の信号に乗算することにより前記残響特性を算出する処理を含む、
処理をコンピュータに実行させる残響抑制プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2013−30956(P2013−30956A)
【公開日】平成25年2月7日(2013.2.7)
【国際特許分類】
【出願番号】特願2011−165274(P2011−165274)
【出願日】平成23年7月28日(2011.7.28)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】