フィルタ設計における反射物の配置決定方法、装置、プログラム

【課題】音声に基づく情報に対して適用されるフィルタの設計において音声を反射する反射物の配置を決定する技術を提供する。
【解決手段】音声に基づく情報に対して適用されるフィルタが、空間中における複数の方向の伝達特性によって表される空間相関行列を用いて所定の評価関数に基づいて設計される場合であって、各伝達特性は、直接音の伝達特性と反射物で反射する一つの反射音の各伝達特性との和で表されており、評価関数は少なくとも目的方向の音声が強調されるほど小さな値をとる関数である。記憶部にはマイクロホンアレーまたはスピーカアレーに対する反射物の配置の候補が記憶されており、配置決定部が、反射物の各候補について、当該候補に基づいて特定される伝達特性によって表される空間相関行列を用いて評価関数の値を求め、当該値のうち最小のものに対応する候補を反射物の配置として決定する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声に基づく情報に対して適用されるフィルタの設計において音声を反射する反射物の配置を決定する技術に関する。
【背景技術】
【０００２】
例えばマイクロホンを備えた動画撮影装置（ビデオカメラやカムコーダ）で被写体をズームイン撮影する場合を考えると、ズームイン撮影に連動して被写体近傍のみからの音声が強調されることが動画撮影にとって好ましい。このような、所望の方向（目的方向）を含む狭い範囲の音声を強調する技術（音声強調技術）は、従来から研究・開発されている。なお、マイクロホンの周囲の方向とマイクロホンの感度との関係は指向性と呼ばれ、或る方向への指向性が鋭いほど、当該方向を含む狭い範囲の音声を強調し、当該範囲以外の範囲の音声を抑圧することができる。なお、この明細書では、「音声」は、人の発する声に限定されるものではなく、人や動物の声はもとより楽音や環境雑音など「音」一般を指す。
【０００３】
反射音を選択収音することによる音声強調技術として、例えばマルチビームフォーミング法がある（非特許文献１参照）。マルチビームフォーミング法は、直接音や反射音という個々の音を寄せ集めることで、高SN比で目的方向の音声を収音することができる音声強調技術であり、音声分野よりも無線分野でよく研究されている。
【０００４】
以下、周波数領域でのマルチビームフォーミング法の処理内容を説明する。説明に先立ち、記号を定義する。周波数のインデックスをω、フレーム番号のインデックスをkとする。M個のマイクロホンで受音したアナログ信号の周波数領域表現をX^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^T、方向θ_sにある強調したい音源からの直接音の到来方向をθ_s1、反射音の到来方向をθ_s2,…,θ_sRとする。Tは転置を表し、R-1は反射音の総数である。方向θ_srの音声を強調するフィルタをW^→(ω,θ_sr)とする。ここで、rは1≦r≦Rを満たす各整数である。
【０００５】
マルチビームフォーミング法では、直接音および反射音の到来方向や到来時間が既知であることが前提である。つまり、音の反射が明らかに予想できる壁、床、反射板といった物体の数がR-1に等しい。また、反射音数R-1は３あるいは４という比較的小さな値に設定されることが多い。これは、直接音と低次の反射音との間に高い相関性が認められることに基づく。マルチビームフォーミング法は、各々の音声を個別に強調して同期加算する方式なので、出力信号Y(ω,k,θ_s)は式（１）で与えられる。Hはエルミート転置を表す。
【数１】

【０００６】
フィルタW^→(ω,θ_sr)の設計法として遅延合成法を説明する。直接音や反射音が平面波到来すると仮定すると、フィルタW^→(ω,θ_sr)は式（２）で与えられる。h^→(ω,θ_sr)=[h₁(ω,θ_sr),…,h_M(ω,θ_sr)]^Tは、方向θ_srから到来する音声の伝搬ベクトルである。
【数２】

【０００７】
線形マイクロホンアレー（M個のマイクロホンが直線状に並べられたマイクロホンアレー）に平面波が到来することを仮定すると、h^→(ω,θ_sr)を構成する要素h_m(ω,θ_sr)は式（３）で与えられる。mは1≦m≦Mを満たす各整数である。cは音速を、uは隣り合うマイクロホン間の距離を表す。ｊは虚数単位である。τ(θ_sr)は、方向θ_srから到来する反射音の直接音に対する時間遅延を表す。
【数３】

【０００８】
最後に、出力信号Y(ω,k,θ_s)を時間領域に変換することによって、目的方向θ_sにある音源の音声を強調した信号が得られる。
【先行技術文献】
【非特許文献】
【０００９】
【非特許文献１】J.L.Flanagan, A.C.Surendran, E.E.Jan, "Spatially selective sound capture for speech and audio processing," Speech Communication, Volume 13, Issue 1-2, pp.207-222, October 1993.
【発明の概要】
【発明が解決しようとする課題】
【００１０】
マルチビームフォーミング法では、直接音および反射音の到来方向や到来時間が既知であることが前提である。また、或る方向θ_srからの音声を強調するフィルタW^→(ω,θ_sr)を設計する際、式（２）で表されるように、当該方向θ_srの音声だけを単独で考慮していた。
【００１１】
しかし、詳しくは本発明の実施形態で後述するが、フィルタ設計の段階にて、或る方向に関する音声を直接音と反射音の混合音声として考慮することが好ましい場合があり、この場合、マイクロホンアレーまたはスピーカアレーとの関係で、音声を反射する反射物の適切な配置を決定することが求められる場合がある。
【００１２】
そこで本発明は、音声に基づく情報に対して適用されるフィルタの設計において音声を反射する反射物のマイクロホンアレーまたはスピーカアレーに対する配置を決定する技術を提供することを目的とする。
【課題を解決するための手段】
【００１３】
音声に基づく情報に対して適用されるフィルタが、空間中における複数の方向の伝達特性によって表される空間相関行列を用いて所定の評価関数に基づいて設計される場合であって、各伝達特性は、直接音の伝達特性と反射物で反射する一つの反射音の各伝達特性との和で表されており、評価関数は少なくとも目的方向の音声が強調されるほど小さな値をとる関数である。記憶部にはマイクロホンアレーまたはスピーカアレーに対する反射物の配置関係を表す情報（以下、配置情報という）が記憶されており、配置決定部が、配置情報に基づく反射物の各候補について、当該候補に基づいて特定される伝達特性によって表される空間相関行列を用いて評価関数の値を求め、当該値のうち最小のものに対応する候補を反射物の配置として決定する。
【発明の効果】
【００１４】
本発明に拠ると、音声に基づく情報に対して適用されるフィルタの設計において音声を反射する反射物のマイクロホンアレーまたはスピーカアレーに対する配置を決定することができる。
【図面の簡単な説明】
【００１５】
【図１】実施形態に係る反射物配置決定装置の機能構成を示す図。
【図２】適用形態１の音声処理装置の機能構成を示す図。
【図３】適用形態１の音声処理方法の処理手順を示す図。
【図４】適用形態２の音声処理装置の機能構成を示す図。
【図５】適用形態２の音声処理方法の処理手順を示す図。
【図６】適用形態３の音声処理装置の機能構成を示す図。
【図７】適用形態３の音声処理方法の処理手順を示す図。
【図８】適用形態４の音声処理装置の機能構成を示す図。
【図９】適用形態４の音声処理方法の処理手順を示す図。
【図１０】マイクロホンアレーと反射板との位置関係等を示す図（その１）。
【図１１】マイクロホンアレーと反射板との位置関係等を示す図（その２）。
【図１２】スピーカアレーと反射板との位置関係等を示す図（その１）。
【図１３】スピーカアレーと反射板との位置関係等を示す図（その２）。
【発明を実施するための形態】
【００１６】
本発明の実施形態を、図１を参照して説明する。予め概略を述べると、本発明は、或る方向に関する音声を直接音と反射音の混合音声として考慮する場合に、音声に基づく情報（実施形態の例では、音声信号が周波数領域に変換された周波数領域信号）に対して適用されるフィルタの設計において音声を反射する反射物のマイクロホンアレーまたはスピーカアレーに対する配置を決定する技術であり、フィルタの設計コンセプト自体には影響を与えない。従って、本発明が適用されるフィルタ設計手法として格別の限定はない。フィルタの設計コンセプトは、統計的最適化規範であり、例えば、入力サンプル列にフィルタを適用して得られる出力と希望応答との差（推定誤差）について、推定誤差の平均２乗値、推定誤差の絶対値の期待値、推定誤差の絶対値に関する３次以上のべき乗の期待値、などを評価関数として挙げることができ、この評価関数を最小化（評価関数やその表現によっては最大化）することによりフィルタを設計する。ここでは説明を一貫させるため、評価関数は、少なくともマイクロホンアレーまたはスピーカアレーから見た目的方向の音声が強調されるほど絶対値の小さい値を出力する関数とする。「少なくとも・・・目的方向」とした理由は、後の＜距離の導入＞で説明するように、いずれの設計法においても、目的方向のみならず、マイクロホンアレーまたはスピーカアレーから音源までの距離も考慮してフィルタを設計することも可能であるからである。ここでは、フィルタ設計手法として、最小分散無歪応答法（MVDR method;minimum variance distortion response method）、SN比最大化規準によるフィルタ設計法、パワーインバージョン(Power Inversion)に基づくフィルタ設計法の３種類を例示する。最小分散無歪応答法については参考文献１を、SN比最大化規準によるフィルタ設計法とパワーインバージョンに基づくフィルタ設計法については参考文献２を参照されたい。
（参考文献１）大賀寿郎、山崎芳男、金田豊著、「音響システムとディジタル処理」、社団法人電子情報通信学会、1995、pp.203-209
（参考文献２）菊間信良著、「アダプティブアンテナ技術」、第１版、株式会社オーム社、２００３年、pp.35-90
【００１７】
本発明の実施形態である反射物配置決定装置１００は、それ単体で独立に存在するよりは、例えば後述する音声処理装置１，２，３，４を構成するエンティティとして存在するのが一般的である。さらに云えば、反射物配置決定装置１００は、音声処理装置１，２，３，４とは容易に分離可能に音声処理装置１，２，３，４を構成するエンティティではなく、音声処理装置１，２，３，４自体の一部の機能に着眼して片面的に評価したものと云うこともできる。要するに、反射物配置決定装置１００は、音声処理装置１，２，３，４そのものであることが一般的である。具体的には、反射物配置決定装置１００の機能を中央演算装置や専用ＬＳＩに実装して、反射物配置決定装置１００を実現することができる。
ただし、反射物配置決定装置１００が、単体独立のエンティティとして存在すること、音声処理装置１，２，３，４とは容易に分離可能に音声処理装置１，２，３，４を構成するエンティティであることを排除する趣旨ではない。例えば反射物の配置決定それ自体を目的とするならば、反射物配置決定装置１００を単体独立のエンティティとして実現することに何らの妨げは無い。
ここで音声処理装置１，２，３，４は、例えば専用のハードウェアで構成された専用機やパーソナルコンピュータのような汎用機といったコンピュータで実現されるとし、単体独立のエンティティとして反射物配置決定装置１００を実現する場合も同様である。
【００１８】
<１>最小分散無歪応答法によるフィルタ設計法
説明に先立ち、改めて記号を定義する。離散周波数のインデックスをω（周波数ｆと角周波数ωとの間にはω=2πfの関係があるから、離散周波数のインデックスωをこの角周波数ωと同一視してもかまわない。ωに関して「離散周波数のインデックス」を単に「周波数」ともいう）、フレーム番号のインデックスをkとする。M個のマイクロホンで受音したアナログ信号の第kフレームの周波数領域表現をX^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^T、マイクロホンアレーの中心から見て目的方向θ_sの音声の周波数領域表現を周波数ωで強調するフィルタをW^→(ω,θ_s)とする。Mは2以上の整数とする。Tは転置を表す。このとき、目的方向θ_sの音声の周波数領域表現が周波数ωで強調された周波数領域信号（以下、出力信号と呼ぶ）Y(ω,k,θ_s)は式（４）で与えられる。Hはエルミート転置を表す。
【数４】

【００１９】
「マイクロホンアレーの中心」は任意に定めることができるが、一般的にはM個のマイクロホンの配置の幾何学的中心が「マイクロホンアレーの中心」とされ、例えば線形マイクロホンアレーであれば両端のマイクロホンの中間点が「マイクロホンアレーの中心」とされ、例えばm×m（m²=M）の正方マトリックス状に配置された平面マイクロホンアレーであれば、四隅のマイクロホンの対角線が交わる位置が「マイクロホンアレーの中心」とされる。
【００２０】
フィルタW^→(ω,θ_s)の設計法として最小分散無歪応答法に拠る場合、フィルタW^→(ω,θ_s)は、式（６）の拘束条件の下、空間相関行列Q(ω)を用いて目的方向θ_s以外の方向の音声（以下、「目的方向θ_s以外の方向の音声」を「雑音」とも呼ぶ）のパワーが周波数ωで最小となるように設計される（式（５）参照）。a^→(ω,θ_s)＝[a₁(ω,θ_s),…,a_M(ω,θ_s)]^Tは、方向θ_sに音源が在ると仮定した場合の、当該音源とM本のマイクロホンとの間の周波数ωでの伝達特性である。換言すれば、a^→(ω,θ_s)＝[a₁(ω,θ_s),…,a_M(ω,θ_s)]^Tは、マイクロホンアレーに含まれる各マイクロホンへの方向θ_sの音声の周波数ωでの伝達特性である。
【数５】

【００２１】
式（５）の最適解であるフィルタW^→(ω,θ_s)は式（７）で与えられることが知られている（参考文献１参照）。
【数６】

【００２２】
式（５）から、雑音のパワーは空間相関行列Q(ω)の構造に依存することがわかる。そこで、空間相関行列Q(ω)の構造について説明する。雑音の到来方向のインデックスpが属する集合を{1,2,…,P-1}とする。目的方向θ_sのインデックスsは集合{1,2,…,P-1}に属さないとする。P-1個の雑音が任意の方向から到来すると仮定すると、空間相関行列Q(ω)は式（８ａ）で与えられる。多くの雑音が存在する中でも十分に機能するフィルタを作る観点から、Pはある程度大きい値であることが好ましく、M程度の整数であるとする。なお、ここでは発明の原理を分かり易く説明する観点から目的方向θ_sがあたかも特定の方向の如く説明しているが（それ故、目的方向θ_s以外の方向を「雑音」の方向としている）、実際には、目的方向θ_sは音声強調の対象となりえる任意の方向であり、目的方向θ_sになりえる方向として一般的に複数の方向が想定される。このような観点からすると、目的方向θ_sと雑音の方向との区別は凡そ主観的なものであり、目的音か雑音かの区別なく音声の到来方向として想定される複数の方向としてP個の異なる方向を予め決めておき、P個の方向のうち選択された一つの方向が目的方向であり、それ以外の方向が雑音の方向であると理解することがより正確である。そこで、集合{1,2,…,P-1}と集合{s}との和集合をΦとすると、空間相関行列Q(ω)は、音声の到来方向として想定される複数の方向に含まれる各方向θ_φの音声の各マイクロホンへの伝達特性a^→(ω,θ_φ)＝[a₁(ω,θ_φ),…,a_M(ω,θ_φ)]^T（φ∈Φ）によって表される空間相関行列であり、式（８ｂ）で表される。なお、|Φ|=Pである。|Φ|は集合Φの要素数を表す。
【数７】

【００２３】
マイクロホンアレーの各マイクロホンには、音源からの直接音と、当該音源からの音が反射物で反射した反射音との二種類の音波（ここでは説明の便宜で平面波と仮定するが、球面波であってもよい）が混入することになる。反射音の数をΞとする。Ξは１以上の予め定められた整数である。このとき、伝達特性a^→(ω,θ)＝[a₁(ω,θ),…,a_M(ω,θ)]^Tは、音声強調の対象となりえる方向の音声がマイクロホンアレーに直接届く直接音の伝達特性と当該音声が反射物で反射してマイクロホンアレーに届く一つ以上の反射音の各伝達特性との和、具体的には、直接音とξ番目（1≦ξ≦Ξ）の反射音との到来時間差をτ_ξ(θ)とし、α_ξ（1≦ξ≦Ξ）を反射による音の減衰を考慮するための係数とすると、式（９ａ）のように、直接音のステアリングベクトルと、反射による音の減衰および直接音に対する到来時間差が補正されたΞ個の反射音のステアリングベクトルの和で表現できる。h^→_d(ω,θ)=[h_d1(ω,θ),…,h_dM(ω,θ)]^Tは方向θの直接音のステアリングベクトルを、h^→_rξ(ω,θ)=[h_r1ξ(ω,θ),…,h_rMξ(ω,θ)]^Tは方向θの直接音に対応する反射音のステアリングベクトルを表す。なお、ステアリングベクトルは、マイクロホンアレーの中心から見て方向θの音波について、基準点に対する各マイクロホンの周波数ωでの位相応答特性を並べた複素ベクトルである。α_ξ（1≦ξ≦Ξ）は、通常、α_ξ≦1（1≦ξ≦Ξ）である。各反射音について、音源からマイクロホンに到達するまでの反射回数が１回であるならば、α_ξ（1≦ξ≦Ξ）は、ξ番目の反射音が反射した物体の音の反射率を表していると考えて差し支えない。
【数８】

【００２４】
Ｍ個のマイクロホンで構成されるマイクロホンアレーに対して一つ以上の反射音を与えることが望まれるので、一つ以上の反射物が存在することが好ましい。このような観点からすると、目的方向に音源が在るとして、当該音源とマイクロホンアレーと一つ以上の反射物との位置関係は、当該音源からの音が少なくとも一つの反射物で反射してマイクロホンアレーに届くように、各反射物が配置されていることが好ましい。各反射物の形状は、２次元形状（例えば平板）または３次元形状（例えばパラボラ形状）である。また、各反射物の大きさはマイクロホンアレーと同等かそれ以上（１〜２倍程度）の大きさを持つことが好ましい。反射音を効果的に活用するためには、各反射物の反射率α_ξ（1≦ξ≦Ξ）は少なくとも０よりも大きく、さらに言えば、マイクロホンアレーに届いた反射音の振幅が直接音の振幅の例えば0.2倍以上であることが望ましく、例えば各反射物は剛性を有する固体とされる。反射物は移動可能な物体（例えばマイクロホンアレーを設置している支持体に対して可動に組み合わされた反射板）であっても移動不能な物体（例えばマイクロホンアレーを設置している支持体に固定された反射板）であってもよい。反射物の配置関係の決定については後述する。
【００２５】
線形マイクロホンアレーに音声が平面波として到来すると仮定すると、直接音のステアリングベクトルh^→_d(ω,θ)を構成するm番目の要素h_dm(ω,θ)は例えば式（１０ａ）で与えられる。mは1≦m≦Mを満たす各整数である。cは音速を、uは隣り合うマイクロホン間の距離を表す。ｊは虚数単位である。基準点は線形マイクロホンアレーの全長の半分の位置（線形マイクロホンアレーの中心）である。方向θは線形マイクロホンアレーの中心から見て直接音の到来方向と線形マイクロホンアレーに含まれるマイクロホンの配列方向とがなす角度として定義した（図１０、図１１参照）。なお、ステアリングベクトルの表し方は種々あり、例えば、基準点を線形マイクロホンアレーの一端にあるマイクロホンの位置とすれば、直接音のステアリングベクトルh^→_d(ω,θ)を構成するm番目の要素h_dm(ω,θ)は例えば式（１０ｂ）で与えられる。以下、直接音のステアリングベクトルh^→_d(ω,θ)を構成するm番目の要素h_dm(ω,θ)は式（１０ａ）で与えられるとして説明する。
【数９】

【００２６】
反射音のステアリングベクトルh^→_r(ω,θ)=[h_r1(ω,θ),…,h_rM(ω,θ)]^Tのm番目の要素は、直接音のステアリングベクトルの表し方と同様に（式（１０ａ）参照）、式（１１ａ）で表される。関数Ψ(θ)は反射音の到来方向を出力する。なお、直接音のステアリングベクトルを式（１０ｂ）で表す場合には、反射音のステアリングベクトルh^→_r(ω,θ)=[h_r1(ω,θ),…,h_rM(ω,θ)]^Tのm番目の要素は式（１１ｂ）で表される。一般的に、ξ番目（1≦ξ≦Ξ）のステアリングベクトルh^→_rξ(ω,θ)=[h_r1ξ(ω,θ),…,h_rMξ(ω,θ)]^Tのm番目の要素は、式（１１ｃ）や式（１１ｄ）で表される。関数Ψ_ξ(θ)はξ番目（1≦ξ≦Ξ）の反射音の到来方向を出力する。
【数１０】

【００２７】
さて、到来時間差τ_ξ(θ)と関数Ψ_ξ(θ)は、マイクロホンアレーに対する反射物の配置関係によって定まる。到来時間差τ_ξ(θ)と関数Ψ_ξ(θ)が定まると、直接音のステアリングベクトルh^→_d(ω,θ)と反射音のステアリングベクトルh^→_rξ(ω,θ)が定まる。直接音のステアリングベクトルh^→_d(ω,θ)と反射音のステアリングベクトルh^→_rξ(ω,θ)が定まると、伝達特性a^→(ω,θ)が定まる。伝達特性a^→(ω,θ)が定まると、空間相関行列Q(ω)が定まる。そして、既述のとおり、雑音のパワーは空間相関行列Q(ω)の構造に依存する。よって、マイクロホンアレーに対する反射物の配置関係を決定することが重要である。ここでは、具体例として、マイクロホンアレーに対する角度（線形マイクロホンアレーに含まれるマイクロホンの配列方向と反射物とがなす角度）とマイクロホンアレーの中心からの距離をもって、マイクロホンアレーに対する反射物の配置関係を特定することとする（図１０、図１１、図１２、図１３参照）。
【００２８】
以下、具体的に説明する観点から、Ξ=1とし、反射音の反射回数は１回であって、マイクロホンアレーの中心から離れた位置に一つの反射物が存在すると仮定する。反射物は厚みのある剛体平板とする。以下、反射物を反射板と呼称する。この場合、Ξ=1であるからこれを表す添え字を略することとして、式（９ａ）は式（９ｂ）のように表すことができる。
【数１１】

【００２９】
反射物配置決定装置の記憶部１０１には、マイクロホンアレーに対する反射板の配置関係を表す情報がデータとして記憶されている（後述するように実施形態によっては、「スピーカアレーに対する反射板の配置関係を表す情報」であるが、ここではマイクロホンアレーの場合を代表して説明する）。マイクロホンアレーに対する反射板の配置関係を表す情報の一例は、マイクロホンアレーに対する反射板の配置に関する予め定められた候補の集合であり、この集合をＵとする。集合Ｕに含まれる候補は、例えば、マイクロホンアレーに対する反射板の角度の候補の数をJとし、マイクロホンアレーの中心から反射板までの距離の候補の数をKとすると、角度の候補と距離の候補との組み合わせによって表され、集合Ｕに含まれる候補の総数はJ×K（以下、JKと略記する）となる。
【００３０】
マイクロホンアレーに対する反射板の配置関係を表す情報の他の例として、関数を表す情報でもよい。例えば、マイクロホンアレーに対する反射板の角度の候補C_Angle，j=j×Δθ[j=1,2,…，J]を与える離散関数と、マイクロホンアレーの中心から反射板までの距離の候補C_distance，k=k×ΔL[k=1,2,…，K]を与える離散関数を、マイクロホンアレーに対する反射板の配置関係を表す情報として反射物配置決定装置の記憶部１０１が記憶する構成でもよい。ここで、Δθは予め定められた角度、ΔLは予め定められた長さである。ここでは、等間隔に角度と距離の候補を与える離散関数を例示したが、非等間隔に角度と距離の候補を与える離散関数や、あるいは連続関数であってもよいことはもちろんである（連続関数の場合は例えば入力値を離散的に設定すればよい）。
【００３１】
反射物配置決定装置１００の配置決定部１１０は、記憶部１０１から取得したJK個の候補、あるいは記憶部１０１に記憶された関数に従って配置決定部１１０が計算して得たJK個の候補、のそれぞれ（候補インデックスをｎとする）について、式（１２）によるパワー（評価関数）p_nを計算する。Ωは周波数ωの集合である。空間相関行列Q_n(ω)は、候補インデックスｎに対応する反射板の配置関係に基づく空間相関行列であり（式（８ａ）または式（８ｂ）参照）、フィルタW_n^→(ω,θ_s)は、候補インデックスｎに対応する反射板の配置関係に基づくフィルタである（式（７）参照）。
【数１２】

【００３２】
目的方向θ_sが一つの場合は式（１２）に拠るが、目的方向が複数である場合は、配置決定部１１０は、式（１３）によるパワー（評価関数）p_nを計算する。複数の目的方向をθ_s1，…，θ_sAとする。ただし、その総数|{θ_s1，…，θ_sA}|=AはPを超えない。この処理は、複数の目的方向について、これらの目的方向のうちいずれかに特化して良好な音声強調を実現するフィルタを設計する観点ではなく、これらの目的方向のうちのどの方向であってもバランス良く良好な音声強調を実現するフィルタを設計する観点によるものである。
【数１３】

【００３３】
次に、配置決定部１１０は、JK個の候補の対応するパワーp₁，…，p_JKのうち最小のパワーを探索する。例えば、最小のパワーがp_gであれば、そのインデックスｇで特定される「マイクロホンアレーに対する反射板の角度とマイクロホンアレーの中心から反射板までの距離」がマイクロホンアレーに対する最適な反射板の配置条件として決定される。
【００３４】
<２>SN比最大化規準によるフィルタ設計法
SN比最大化規準によるフィルタ設計法では、目的方向θ_sでのSN比（SNR）を最大化する規準でフィルタW^→(ω,θ_s)を決定する。目的方向θ_sの音声の空間相関行列をR_ss(ω)、目的方向θ_s以外の方向の音声の空間相関行列をR_nn(ω)とする。このとき、評価関数であるSNRは式（１４）で表される。なお、R_ss(ω)は式（１５）、R_nn(ω)は式（１６）で表される。伝達特性a^→(ω,θ_s)＝[a₁(ω,θ_s),…,a_M(ω,θ_s)]^Tは式（９ａ）で表される（正確には、式（９ａ）のθをθ_sとしたものである）。
【数１４】

【００３５】
式（１４）のSNRを最大にするフィルタW^→(ω,θ_s)は、フィルタW^→(ω,θ_s)に関する勾配をゼロとすること、つまり式（１７）によって求めることができる。
【数１５】

【００３６】
これにより、式（１４）のSNRを最大にするフィルタW^→(ω,θ_s)は式（１８）で与えられる。
【数１６】

【００３７】
式（１８）には目的方向θ_s以外の方向の音声の空間相関行列R_nn(ω)の逆行列が含まれているが、R_nn(ω)の逆行列を、目的方向θ_sの音声と目的方向θ_s以外の方向の音声を含む入力全体の空間相関行列R_xx(ω)の逆行列に置換してもよいことが知られている。なお、R_xx(ω)=R_ss(ω)+R_nn(ω)=Q(ω)である。つまり、式（１４）のSNRを最大にするフィルタW^→(ω,θ_s)を式（１９）で求めてもよい。
【数１７】

【００３８】
反射物配置決定装置の記憶部１０１には、マイクロホンアレーに対する反射板の配置関係を表す情報がデータとして記憶されている（後述するように実施形態によっては、「スピーカアレーに対する反射板の配置関係を表す情報」であるが、ここではマイクロホンアレーの場合を代表して説明する）。マイクロホンアレーに対する反射板の配置関係を表す情報の一例は、マイクロホンアレーに対する反射板の配置に関する予め定められた候補の集合であり、この集合をＵとする。集合Ｕに含まれる候補は、例えば、マイクロホンアレーに対する反射板の角度の候補の数をJとし、マイクロホンアレーの中心から反射板までの距離の候補の数をKとすると、角度の候補と距離の候補との組み合わせによって表され、集合Ｕに含まれる候補の総数はJKとなる。
【００３９】
マイクロホンアレーに対する反射板の配置関係を表す情報の他の例として、関数を表す情報でもよい。例えば、マイクロホンアレーに対する反射板の角度の候補C_Angle，j=j×Δθ[j=1,2,…，J]を与える離散関数と、マイクロホンアレーの中心から反射板までの距離の候補C_distance，k=k×ΔL[k=1,2,…，K]を与える離散関数を、マイクロホンアレーに対する反射板の配置関係を表す情報として反射物配置決定装置の記憶部１０１が記憶する構成でもよい。ここで、Δθは予め定められた角度、ΔLは予め定められた長さである。ここでは、等間隔に角度と距離の候補を与える離散関数を例示したが、非等間隔に角度と距離の候補を与える離散関数や、あるいは連続関数であってもよいことはもちろんである（連続関数の場合は例えば入力値を離散的に設定すればよい）。
【００４０】
反射物配置決定装置１００の配置決定部１１０は、記憶部１０１から取得したJK個の候補、あるいは記憶部１０１に記憶された関数に従って配置決定部１１０が計算して得たJK個の候補、のそれぞれ（候補インデックスをｎとする）について、式（２０）によるSN比（評価関数）p_nを計算する。Ωは周波数ωの集合である。空間相関行列R_ss⁽ⁿ⁾(ω)，R_nn⁽ⁿ⁾(ω)は、候補インデックスｎに対応する反射板の配置関係に基づく空間相関行列であり（式（１５）、式（１６）参照）、フィルタW_n^→(ω,θ_s)は、候補インデックスｎに対応する反射板の配置関係に基づくフィルタである（式（１８）または式（１９）参照）。
【数１８】

【００４１】
目的方向θ_sが一つの場合は式（２０）に拠るが、目的方向が複数である場合は、配置決定部１１０は、式（２１）によるSN比（評価関数）p_nを計算する。複数の目的方向をθ_s1，…，θ_sAとする。ただし、その総数|{θ_s1，…，θ_sA}|=AはPを超えない。この処理は、複数の目的方向について、これらの目的方向のうちいずれかに特化して良好な音声強調を実現するフィルタを設計する観点ではなく、これらの目的方向のうちのどの方向であってもバランス良く良好な音声強調を実現するフィルタを設計する観点によるものである。
【数１９】

【００４２】
次に、配置決定部１１０は、JK個の候補の対応するSN比p₁，…，p_JKのうち最小のSN比を探索する。例えば、最小のSN比がp_gであれば、そのインデックスｇで特定される「マイクロホンアレーに対する反射板の角度とマイクロホンアレーの中心から反射板までの距離」がマイクロホンアレーに対する最適な反射板の配置条件として決定される。
【００４３】
<３>パワーインバージョンに基づくフィルタ設計法
パワーインバージョンに基づくフィルタ設計法では、一つのマイクロホンに対するフィルタ係数を一定値に固定した状態で出力のパワーを最小化する基準でフィルタW^→(ω,θ_s)を決定する。ここでは、一例として、M個のマイクロホンのうち1番目のマイクロホンに対するフィルタ係数を固定するとして説明する。この設計法では、フィルタW^→(ω,θ_s)は、式（２３）の拘束条件の下、空間相関行列R_xx(ω)を用いて全方向（音声の到来方向として想定される全ての方向）の音声のパワーが最小となるように設計される（式（２２）参照）。伝達特性a^→(ω,θ_s)＝[a₁(ω,θ_s),…,a_M(ω,θ_s)]^Tは式（９ａ）で表される（正確には、式（９ａ）のθをθ_sとしたものである）。なお、R_xx(ω)=Q(ω)である。
【数２０】

【００４４】
式（２２）の最適解であるフィルタW^→(ω,θ_s)は式（２４）で与えられることが知られている（参考文献２参照）。
【数２１】

【００４５】
反射物配置決定装置の記憶部１０１には、マイクロホンアレーに対する反射板の配置関係を表す情報がデータとして記憶されている（後述するように実施形態によっては、「スピーカアレーに対する反射板の配置関係を表す情報」であるが、ここではマイクロホンアレーの場合を代表して説明する）。マイクロホンアレーに対する反射板の配置関係を表す情報の一例は、マイクロホンアレーに対する反射板の配置に関する予め定められた候補の集合であり、この集合をＵとする。集合Ｕに含まれる候補は、例えば、マイクロホンアレーに対する反射板の角度の候補の数をJとし、マイクロホンアレーの中心から反射板までの距離の候補の数をKとすると、角度の候補と距離の候補との組み合わせによって表され、集合Ｕに含まれる候補の総数はJKとなる。
【００４６】
マイクロホンアレーに対する反射板の配置関係を表す情報の他の例として、関数を表す情報でもよい。例えば、マイクロホンアレーに対する反射板の角度の候補C_Angle，j=j×Δθ[j=1,2,…，J]を与える離散関数と、マイクロホンアレーの中心から反射板までの距離の候補C_distance，k=k×ΔL[k=1,2,…，K]を与える離散関数を、マイクロホンアレーに対する反射板の配置関係を表す情報として反射物配置決定装置の記憶部１０１が記憶する構成でもよい。ここで、Δθは予め定められた角度、ΔLは予め定められた長さである。ここでは、等間隔に角度と距離の候補を与える離散関数を例示したが、非等間隔に角度と距離の候補を与える離散関数や、あるいは連続関数であってもよいことはもちろんである（連続関数の場合は例えば入力値を離散的に設定すればよい）。
【００４７】
反射物配置決定装置１００の配置決定部１１０は、記憶部１０１から取得したJK個の候補、あるいは記憶部１０１に記憶された関数に従って配置決定部１１０が計算して得たJK個の候補、のそれぞれ（候補インデックスをｎとする）について、式（２５）によるパワー（評価関数）p_nを計算する。Ωは周波数ωの集合である。空間相関行列Q_n(ω)=R_xx(ω)は、候補インデックスｎに対応する反射板の配置関係に基づく空間相関行列であり（式（８ａ）または式（８ｂ）参照）、フィルタW_n^→(ω,θ_s)は、候補インデックスｎに対応する反射板の配置関係に基づくフィルタである（式（２４）参照）。
【数２２】

【００４８】
目的方向θ_sが一つの場合は式（２５）に拠るが、目的方向が複数である場合は、配置決定部１１０は、式（２６）によるパワー（評価関数）p_nを計算する。複数の目的方向をθ_s1，…，θ_sAとする。ただし、その総数|{θ_s1，…，θ_sA}|=AはPを超えない。この処理は、複数の目的方向について、これらの目的方向のうちいずれかに特化して良好な音声強調を実現するフィルタを設計する観点ではなく、これらの目的方向のうちのどの方向であってもバランス良く良好な音声強調を実現するフィルタを設計する観点によるものである。
【数２３】

【００４９】
次に、配置決定部１１０は、JK個の候補の対応するパワーp₁，…，p_JKのうち最小のパワーを探索する。例えば、最小のパワーがp_gであれば、そのインデックスｇで特定される「マイクロホンアレーに対する反射板の角度とマイクロホンアレーの中心から反射板までの距離」がマイクロホンアレーに対する最適な反射板の配置条件として決定される。
【００５０】
＜距離の導入＞
上述の説明では、いずれの設計法においても、目的方向のみを考慮していたが、音源までの距離（後述するようにスピーカアレーによる音声再生の場合では、スポット再生までの距離）も考慮してフィルタを設計することも可能である。この場合、各設計法において、マイクロホンアレーの中心からの距離をDと表す（特に目的方向への距離をD_hと表す）と、上記各式は下記のように修正される。
【００５１】
<１>最小分散無歪応答法によるフィルタ設計法の場合
式（４）：
【数２４】

【００５２】
式（５）、式（６）：
【数２５】

【００５３】
式（７）：
【数２６】

【００５４】
式（８ａ）、式（８ｂ）：雑音の到来距離のインデックスzが属する集合を{1,2,…,Z-1}とする。目的距離D_hのインデックスhは集合{1,2,…,Z-1}に属さないとする。また、集合{1,2,…,Z-1}と集合{h}との和集合をΓとすると、|Γ|=Zである。|Γ|は集合Γの要素数を表す。
【数２７】

【００５５】
式（９ａ）、式（９ｂ）：
【数２８】

【００５６】
式（１０ａ）、式（１０ｂ）：ただし、音波が球面波として到来する場合の例である。mは1≦m≦Mを満たす各整数である。cは音速を表す。ｊは虚数単位である。適宜に設定した空間座標系において、v^→_θ,D^(d)は位置(θ,D)の位置ベクトルを、u^→_mはm番目のマイクロホンの位置ベクトルを表す。記号‖・‖はノルムを表す。f(‖v^→_θ,D^(d)-u^→_m‖)は音波の距離減衰を表す関数である。例えばf(‖v^→_θ,D^(d)-u^→_m‖)=1/‖v^→_θ,D^(d)-u^→_m‖である（置換後の式（１０ｂ）参照）。
【数２９】

【００５７】
式（１１ｃ）、式（１１ｄ）：ただし、音波が球面波として到来する場合の例である。mは1≦m≦Mを満たす各整数である。cは音速を表す。ｊは虚数単位である。上記空間座標系において、v^→_θ,D^(ξ)は位置(θ,D)がξ番目の反射物の反射面で鏡像対象に移された位置の位置ベクトルを、u^→_mはm番目のマイクロホンの位置ベクトルを表す。記号‖・‖はノルムを表す。f(‖v^→_θ,D^(ξ)-u^→_m‖)は音波の距離減衰を表す関数である。例えばf(‖v^→_θ,D^(ξ)-u^→_m‖)=1/‖v^→_θ,D^(ξ)-u^→_m‖である（置換後の式（１１ｄ）参照）。
【数３０】

【００５８】
式（１２）：
【数３１】

【００５９】
式（１３）：目的距離が複数である場合は、複数の目的距離をD_h1，…，θ_hBとする。その総数|{D_h1，…，θ_hB}|=Bとする。ただし、その総数|{D_h1，…，θ_hB}|=BはZを超えない。
【数３２】

【００６０】
式（１４）、式（１５）、式（１６）：
【数３３】

【００６１】
式（１７）：
【数３４】

【００６２】
式（１８）：
【数３５】

【００６３】
式（１９）：
【数３６】

【００６４】
式（２０）：
【数３７】

【００６５】
式（２１）：
【数３８】

【００６６】
式（２２）、式（２３）：
【数３９】

【００６７】
式（２４）：
【数４０】

【００６８】
式（２５）：
【数４１】

【００６９】
式（２６）：
【数４２】

【００７０】
上述の説明では、いずれの設計法においても、マイクロホンアレーによる収音を前提としていたが、スピーカアレーによって音声を再生する場合であっても全く同じ議論が成立する。なお、音声再生の場合の反射音を考慮するため、「双対音」を定義する。（１）スピーカアレーから放射された音声であって、（２）当該音声が反射物で反射して、反射音の進行方向が目的方向となる、という条件を満たす音声を「双対音」と呼ぶ（図１２、図１３参照）。マイクロホンアレーによる収音を前提として上述の説明において、マイクロホンアレーをスピーカアレー、雑音を漏れ音声、反射音を双対音と読み替えればよい。
【００７１】
以下、本発明の適用形態を説明する。適用形態の概要は下記のとおりである。
適用形態１：
マイクロホンアレーで収音した音声について所望の方向についての音声を狭指向で強調する。
適用形態２：
マイクロホンアレーで収音した音声について所望の方向および距離の音声を狭指向で強調する。
適用形態３：
スピーカアレーで所望の方向に音声を狭指向で再生する。
適用形態４：
スピーカアレーで所望の方向と距離の場所に音声を狭指向でスポット再生する。
【００７２】
《適用形態１》
適用形態１の機能構成および処理フローを図２と図３に示す。この適用形態１の音声処理装置１は、ＡＤ変換部２１０、フレーム生成部２２０、周波数領域変換部２３０、フィルタ適用部２４０、時間領域変換部２５０、フィルタ設計部２６０、記憶部２９０を含む。
【００７３】
まず、反射板の位置は、上述の本発明の実施形態によって決定される。続いて、下記の処理が続行する（図１０、図１１も参照のこと）。
【００７４】
ステップＳ１
予め、フィルタ設計部２６０が音声強調の対象となりえる離散的な方向ごとに、周波数ごとのフィルタW^→(ω,θ_i)を計算しておく。音声強調の対象となりえる離散的な方向の総数をI（Iは１以上の予め定められた整数であり、I≦Pを満たす）とすると、W^→(ω,θ₁)，…，W^→(ω,θ_i)，…，W^→(ω,θ_I)（1≦i≦I, ω∈Ω; iは整数、Ωは周波数ωの集合）を事前に計算しておくのである。このためには、伝達特性a^→(ω,θ_i)＝[a₁(ω,θ_i),…,a_M(ω,θ_i)]^T（1≦i≦I, ω∈Ω）を求める必要があるが、これは、マイクロホンアレーにおけるマイクロホンの配置、反射物である例えば反射板のマイクロホンアレーに対する位置関係（これは既に決定されている）、直接音とξ番目（1≦ξ≦Ξ）の反射音との到来時間差、反射物の音の反射率などの環境情報を基に式（９ａ）によって具体的に計算できる（正確には、式（９ａ）のθをθ_iとしたものである）。反射音の数Ξは１≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ＝１であり、一つの反射板３００をマイクロホンアレーの近傍に設置するので、伝達特性a^→(ω,θ_i)は式（９ｂ）によって具体的に計算できる（正確には、式（９ｂ）のθをθ_iとしたものである）。ステアリングベクトルの計算には、例えば式（１０ａ）、式（１０ｂ）、式（１１ａ）、式（１１ｂ）、式（１１ｃ）、式（１１ｄ）を用いることができる。なお、式（９ａ）や式（９ｂ）に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a^→(ω,θ_i)を用いて、例えば式（７）、式（１８）、式（１９）、式（２４）のいずれかによってW^→(ω,θ_i)（1≦i≦I）を求める。なお、式（７）または式（１９）または式（２４）を用いる場合には空間相関行列Q(ω)（あるいはR_xx(ω)）は式（８ｂ）で計算できる。式（１８）を用いる場合には空間相関行列R_nn(ω)は式（１６）で計算できる。I×|Ω|個のフィルタW^→(ω,θ_i)（1≦i≦I,ω∈Ω）は記憶部２９０に記憶される。|Ω|は集合Ωの要素数を表す。
【００７５】
ステップＳ２
マイクロホンアレーを構成するM個のマイクロホン２００−１，…，２００−Ｍを用いて収音する。Mは２以上の整数である。
【００７６】
M個のマイクロホンの並べ方に制限は無い。ただし、２次元または３次元的にM個のマイクロホンを配置することによって、音声強調する方向の不確定性がなくなるという利点がある。つまり、M個のマイクロホンを水平方向に直線状に並べたときに例えば正面方向から到来する音声と真上から到来する音声との区別ができなくなるという問題を、マイクロホンを平面的ないし立体的に並べることで防ぐことができる。また、収音方向として設定できる方向を広くとるためには、各マイクロホンの指向性は、収音方向である目的方向θ_sになり得る方向にある程度の音圧で音声を収音可能な指向性を持っていたほうがよい。したがって、無指向性マイクロホンや単一指向性マイクロホンといった指向性が比較的緩やかなマイクロホンが好適である。
【００７７】
ステップＳ３
ＡＤ変換部２１０が、M個のマイクロホン２００−１，…，２００−Ｍで収音されたアナログ信号（収音信号）をディジタル信号x^→(t)＝[x₁(t),…,x_M(t)]^Tへ変換する。ｔは離散時間のインデックスを表す。
【００７８】
ステップＳ４
フレーム生成部２２０は、ＡＤ変換部２１０が出力したディジタル信号x^→(t)＝[x₁(t),…,x_M(t)]^Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x^→(k)＝[x^→₁(k),…,x^→_M(k)]^Tを出力する。kはフレーム番号のインデックスである。x^→_m(k)=[x_m((k-1)N+1),…,x_m(kN)]（1≦m≦M）である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
【００７９】
ステップＳ５
周波数領域変換部２３０は、各フレームのディジタル信号x^→(k)を周波数領域の信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tに変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X^→(ω,k)は、各周波数ω、フレームkごとに出力される。
【００８０】
ステップＳ６
フィルタ適用部２４０は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tに、強調したい目的方向θ_sに対応するフィルタW^→(ω,θ_s)を適用して、出力信号Y(ω,k,θ_s)を出力する（式（２７）参照）。目的方向θ_sのインデックスsは、s∈{1,…,I}であり、フィルタW^→(ω,θ_s)は記憶部２９０に記憶されているので、例えば、ステップＳ６の処理の都度、フィルタ適用部２４０は、強調したい目的方向θ_sに対応するフィルタW^→(ω,θ_s)を記憶部２９０から取得すればよい。目的方向θ_sのインデックスsが集合{1,…,I}に属さない場合、つまり、目的方向θ_sに対応するフィルタW^→(ω,θ_s)がステップＳ１の処理で計算されていない場合、臨時に目的方向θ_sに対応するフィルタW^→(ω,θ_s)をフィルタ設計部２６０に計算させてもよいし、あるいは目的方向θ_sに近い方向θ_s'に対応するフィルタW^→(ω,θ_s')を用いてよい。
【数４３】

【００８１】
ステップＳ７
時間領域変換部２５０は、第kフレームの各周波数ω∈Ωの出力信号Y(ω,k,θ_s)を時間領域に変換して第kフレームのフレーム単位時間領域信号y(k)を得て、さらに、得られたフレーム単位時間領域信号y(k)をフレーム番号のインデックスの順番に連結して目的方向θ_sの音声が強調された時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、ステップＳ５の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
【００８２】
ここでは、ステップＳ１の処理で予めフィルタW^→(ω,θ_i)を計算しておく実施形態を説明したが、狭指向音声強調装置１の計算処理能力などに応じて、目的方向θ_sが定まってからフィルタ設計部２６０が周波数ごとのフィルタW^→(ω,θ_s)を計算する実施形態を採用することもできる。
【００８３】
《適用形態２》
適用形態２の機能構成および処理フローを図４と図５に示す。この適用形態２の音声処理装置２は、ＡＤ変換部２１０、フレーム生成部２２０、周波数領域変換部２３０、フィルタ適用部２４０、時間領域変換部２５０、フィルタ設計部２６０、記憶部２９０を含む。
【００８４】
まず、反射板の位置は、上述の本発明の実施形態によって決定される。続いて、下記の処理が続行する（図１０、図１１も参照のこと）。なお、適用形態２において引用する式は＜距離の導入＞欄の式とする。
【００８５】
ステップＳ１
予め、フィルタ設計部２６０が音声強調の対象となりえる離散的な位置(θ_i,D_g)ごとに、周波数ごとのフィルタW^→(ω,θ_i,D_g)を計算しておく。音声強調の対象となりえる離散的な方向の総数をI（Iは１以上の予め定められた整数であり、I≦Pを満たす）、離散的な距離の総数をG（Gは１以上の予め定められた整数であり、G≦Zを満たす）とすると、W^→(ω,θ₁,D₁)，…，W^→(ω,θ_i,D₁)，…，W^→(ω,θ_I,D₁),W^→(ω,θ₁,D₂)，…，W^→(ω,θ_i,D₂)，…，W^→(ω,θ_I,D₂)，…，W^→(ω,θ₁,D_g)，…，W^→(ω,θ_i,D_g)，…，W^→(ω,θ_I,D_g)，…，W^→(ω,θ₁,D_G)，…，W^→(ω,θ_i,D_G)，…，W^→(ω,θ_I,D_G)（1≦i≦I, 1≦g≦G, ω∈Ω; iは整数、Ωは周波数ωの集合）を事前に計算しておくのである。このためには、伝達特性a^→(ω,θ_i,D_g)＝[a₁(ω,θ_i,D_g),…,a_M(ω,θ_i,D_g)]^T（1≦i≦I, 1≦g≦G, ω∈Ω）を求める必要があるが、これは、マイクロホンアレーにおけるマイクロホンの配置、反射物である例えば反射板のマイクロホンアレーに対する位置関係（これは既に決定されている）、直接音とξ番目（1≦ξ≦Ξ）の反射音との到来時間差、反射物の音の反射率などの環境情報を基に式（９ａ）によって具体的に計算できる（正確には、式（９ａ）のθをθ_i、DをD_gとしたものである）。反射音の数Ξは１≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ＝１であり、一つの反射板３００をマイクロホンアレーの近傍に設置するので、伝達特性a^→(ω,θ_i)は式（９ｂ）によって具体的に計算できる（正確には、式（９ｂ）のθをθ_iとしたものである）。ステアリングベクトルの計算には、例えば式（１０ａ）、式（１０ｂ）、式（１１ａ）、式（１１ｂ）、式（１１ｃ）、式（１１ｄ）を用いることができる。なお、式（９ａ）に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a^→(ω,θ_i,D_g)を用いて、例えば式（７）、式（１８）、式（１９）、式（２４）のいずれかによってW^→(ω,θ_i,D_g)（1≦i≦I, 1≦g≦G）を求める。なお、式（７）または式（１９）または式（２４）を用いる場合には空間相関行列Q(ω,D_g)（あるいはR_xx(ω,D_g)）は式（８ｂ）で計算できる（正確には、式（８ｂ）のDをD_gとしたものである）。式（１８）を用いる場合には空間相関行列R_nn(ω,D_g)は式（１６）で計算できる（正確には、式（１６）のDをD_gとしたものである）。I×G×|Ω|個のフィルタW^→(ω,θ_i,D_g)（1≦i≦I, 1≦g≦G, ω∈Ω）は記憶部２９０に記憶される。|Ω|は集合Ωの要素数を表す。
【００８６】
ステップＳ２
マイクロホンアレーを構成するM個のマイクロホン２００−１，…，２００−Ｍを用いて収音する。Mは２以上の整数である。
【００８７】
M個のマイクロホンの並べ方に制限は無い。ただし、２次元または３次元的にM個のマイクロホンを配置することによって、音声強調する方向の不確定性がなくなるという利点がある。つまり、M個のマイクロホンを水平方向に直線状に並べたときに例えば正面方向から到来する音声と真上から到来する音声との区別ができなくなるという問題を、マイクロホンを平面的ないし立体的に並べることで防ぐことができる。また、収音方向として設定できる方向を広くとるためには、各マイクロホンの指向性は、収音方向である目的方向θ_sになり得る方向にある程度の音圧で音声を収音可能な指向性を持っていたほうがよい。したがって、無指向性マイクロホンや単一指向性マイクロホンといった指向性が比較的緩やかなマイクロホンが好適である。
【００８８】
ステップＳ３
ＡＤ変換部２１０が、M個のマイクロホン２００−１，…，２００−Ｍで収音されたアナログ信号（収音信号）をディジタル信号x^→(t)＝[x₁(t),…,x_M(t)]^Tへ変換する。ｔは離散時間のインデックスを表す。
【００８９】
ステップＳ４
フレーム生成部２２０は、ＡＤ変換部２１０が出力したディジタル信号x^→(t)＝[x₁(t),…,x_M(t)]^Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x^→(k)＝[x^→₁(k),…,x^→_M(k)]^Tを出力する。kはフレーム番号のインデックスである。x^→_m(k)=[x_m((k-1)N+1),…,x_m(kN)]（1≦m≦M）である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
【００９０】
ステップＳ５
周波数領域変換部２３０は、各フレームのディジタル信号x^→(k)を周波数領域の信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tに変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X^→(ω,k)は、各周波数ω、フレームkごとに出力される。
【００９１】
ステップＳ６
フィルタ適用部２４０は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tに、強調したい位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)を適用して、出力信号Y(ω,k,θ_s,D_h)を出力する（式（２８）参照）。位置(θ_s,D_h)のインデックスs, hは、s∈{1,…,I}, h∈{1,…,G}であり、フィルタW^→(ω,θ_s,D_h)は記憶部２９０に記憶されているので、例えば、ステップＳ６の処理の都度、フィルタ適用部２４０は、強調したい位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)を記憶部２９０から取得すればよい。方向θ_sのインデックスsが集合{1,…,I}に属さない場合あるいは距離D_hのインデックスhが集合{1,…,G}に属さない場合、つまり、位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)がステップＳ１の処理で計算されていない場合、臨時に位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)をフィルタ設計部２６０に計算させてもよいし、あるいは方向θ_sに近い方向θ_s'や距離D_hに近い距離D_h'に対応するフィルタW^→(ω,θ_s',D_h)やW^→(ω,θ_s,D_h')やW^→(ω,θ_s',D_h')を用いてよい。
【数４４】

【００９２】
ステップＳ７
時間領域変換部２５０は、第kフレームの各周波数ω∈Ωの出力信号Y(ω,k,θ_s,D_h)を時間領域に変換して第kフレームのフレーム単位時間領域信号y(k)を得て、さらに、得られたフレーム単位時間領域信号y(k)をフレーム番号のインデックスの順番に連結して位置(θ_s,D_h)からの音声が強調された時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、ステップＳ５の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
【００９３】
ここでは、ステップＳ１の処理で予めフィルタW^→(ω,θ_i,D_g)を計算しておく実施形態を説明したが、音声処理装置２の計算処理能力などに応じて、位置(θ_s,D_h)が定まってからフィルタ設計部２６０が周波数ごとのフィルタW^→(ω,θ_s,D_h)を計算する実施形態を採用することもできる。
【００９４】
《適用形態３》
適用形態３の機能構成および処理フローを図６と図７に示す。この適用形態３の音声処理装置３は、ＡＤ変換部２１０、フレーム生成部２２０、周波数領域変換部２３０、フィルタ適用部２４０、時間領域変換部２５０、フィルタ設計部２６０、記憶部２９０を含む。
【００９５】
まず、反射板の位置は、上述の本発明の実施形態によって決定される。続いて、下記の処理が続行する（図１２、図１３も参照のこと）。
【００９６】
ステップＳ１
予め、フィルタ設計部２６０が音声再生の対象となりえる離散的な方向ごとに、周波数ごとのフィルタW^→(ω,θ_i)を計算しておく。音声再生の対象となりえる離散的な方向の総数をI（Iは１以上の予め定められた整数であり、I≦Pを満たす）とすると、W^→(ω,θ₁)，…，W^→(ω,θ_i)，…，W^→(ω,θ_I)（1≦i≦I, ω∈Ω; iは整数、Ωは周波数ωの集合）を事前に計算しておくのである。このためには、伝達特性a^→(ω,θ_i)＝[a₁(ω,θ_i),…,a_M(ω,θ_i)]^T（1≦i≦I, ω∈Ω）を求める必要があるが、これは、スピーカアレーにおけるスピーカの配置、反射物である例えば反射板のスピーカアレーに対する位置関係（これは既に決定されている）、直接音とξ番目（1≦ξ≦Ξ）の双対音との時間差、反射物の音の反射率などの環境情報を基に式（９ａ）によって具体的に計算できる（正確には、式（９ａ）のθをθ_iとしたものである）。双対音の数Ξは１≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ＝１であり、一つの反射板３００をマイクロホンアレーの近傍に設置するので、伝達特性a^→(ω,θ_i)は式（９ｂ）によって具体的に計算できる（正確には、式（９ｂ）のθをθ_iとしたものである）。ステアリングベクトルの計算には、例えば式（１０ａ）、式（１０ｂ）、式（１１ａ）、式（１１ｂ）、式（１１ｃ）、式（１１ｄ）を用いることができる。なお、式（１０ａ）や式（１０ｂ）に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a^→(ω,θ_i)を用いて、例えば式（７）、式（１８）、式（１９）、式（２４）のいずれかによってW^→(ω,θ_i)（1≦i≦I）を求める。なお、式（７）または式（１９）または式（２４）を用いる場合には空間相関行列Q(ω)（あるいはR_xx(ω)）は式（８ｂ）で計算できる。式（１８）を用いる場合には空間相関行列R_nn(ω)は式（１６）で計算できる。I×|Ω|個のフィルタW^→(ω,θ_i)（1≦i≦I,ω∈Ω）は記憶部２９０に記憶される。|Ω|は集合Ωの要素数を表す。
【００９７】
ステップＳ２
音源２００が音源信号ss(t)を出力する。この実施形態では、音源２００からの音源信号ss(t)はアナログ信号であるとする。ただし、音源信号としてディジタル信号を用いることもできる。
【００９８】
ステップＳ３
ＡＤ変換部２１０が、音源信号ss(t)をディジタル信号s(t)へAD変換する。ここでｔは離散時間のインデックスを表す。なお、ディジタル信号が音源信号である場合には、ステップＳ３の処理を行う必要がなく、音源信号をＡＤ変換部２１０の出力信号であるs(t)と見なすことができる。
【００９９】
ステップＳ４
フレーム生成部２２０は、ＡＤ変換部２１０が出力したディジタル信号s(t)を入力とし、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(k)を出力する。kはフレーム番号のインデックスである。s(k)=[s((k-1)N+1),…,s(kN)]である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
【０１００】
ステップＳ５
周波数領域変換部２３０は、各フレームのディジタル信号s(k)を周波数領域の信号S(ω,k)に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号S(ω,k)は、各周波数ω、フレームkごとに出力される。
【０１０１】
ステップＳ６
フィルタ適用部２４０は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,k)に、再生したい目的方向θ_sに対応するフィルタW^→(ω,θ_s)を適用して、再生信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tを出力する（式（２９）参照）。目的方向θ_sのインデックスsは、s∈{1,…,I}であり、フィルタW^→(ω,θ_s)は記憶部２９０に記憶されているので、例えば、ステップＳ６の処理の都度、フィルタ適用部２４０は、再生したい目的方向θ_sに対応するフィルタW^→(ω,θ_s)を記憶部２９０から取得すればよい。目的方向θ_sのインデックスsが集合{1,…,I}に属さない場合、つまり、目的方向θ_sに対応するフィルタW^→(ω,θ_s)がステップＳ１の処理で計算されていない場合、臨時に目的方向θ_sに対応するフィルタW^→(ω,θ_s)をフィルタ設計部２６０に計算させてもよいし、あるいは目的方向θ_sに近い方向θ_s'に対応するフィルタW^→(ω,θ_s')を用いてよい。
【数４５】

【０１０２】
ステップＳ７
時間領域変換部２５０は、第kフレームの各周波数ω∈Ωの再生信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tを時間領域に変換して第kフレームのフレーム単位時間領域信号x^→(k)＝[x₁(k),…,x_M(k)]^Tを得て、さらに、得られたフレーム単位時間領域信号x^→(k)＝[x₁(k),…,x_M(k)]^Tをフレーム番号のインデックスの順番に連結して再生方向である目的方向θ_sに向けて音声が強調された時間領域信号x^→(t)＝[x₁(t),…,x_M(t)]^Tを出力する。周波数領域信号を時間領域信号に変換する方法は、ステップＳ５の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
【０１０３】
ステップＳ８
Mチャネルの時間領域信号x₁(t),…,x_M(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ２８０−１，…，２８０−Ｍのうち、チャネルに対応するスピーカで再生される。つまり、ｍ番目(1≦m≦M)のチャネルの時間領域信号x_m(t)はｍ番目のスピーカ２８０−ｍで再生される。
【０１０４】
なお、M個のスピーカの並べ方に制限は無い。線形スピーカアレーのように直線状にスピーカを配置するアレー構成でもよいし、２次元または３次元的にM個のスピーカを配置するアレー構成でもよい。また、再生方向として設定できる方向を広くとるためには、各スピーカの指向性は、再生方向である目的方向θ_sになり得る方向に或る程度の音圧で音声を再生可能な指向性を持っていたほうがよい。したがって、無指向性スピーカや単一指向性スピーカといった指向性が比較的緩やかなスピーカが好適である。
【０１０５】
ここでは、ステップＳ１の処理で予めフィルタW^→(ω,θ_i)を計算しておく実施形態を説明したが、音声処理装置３の計算処理能力などに応じて、再生方向である目的方向θ_sが定まってからフィルタ設計部２６０が周波数ごとのフィルタW^→(ω,θ_s)を計算する実施形態を採用することもできる。
【０１０６】
《適用形態４》
適用形態４の機能構成および処理フローを図８と図９に示す。この適用形態４の音声処理装置４は、ＡＤ変換部２１０、フレーム生成部２２０、周波数領域変換部２３０、フィルタ適用部２４０、時間領域変換部２５０、フィルタ設計部２６０、記憶部２９０を含む。
【０１０７】
まず、反射板の位置は、上述の本発明の実施形態によって決定される。続いて、下記の処理が続行する（図１２、図１３も参照のこと）。なお、適用形態４において引用する式は＜距離の導入＞欄の式とする。
【０１０８】
ステップＳ１
予め、フィルタ設計部２６０が音声スポット再生の対象となりえる離散的な位置(θ_i,D_g)ごとに、周波数ごとのフィルタW^→(ω,θ_i,D_g)を計算しておく。音声スポット再生の対象となりえる離散的な方向の総数をI（Iは１以上の予め定められた整数であり、I≦Pを満たす）、離散的な距離の総数をG（Gは１以上の予め定められた整数であり、G≦Zを満たす）とすると、W^→(ω,θ₁,D₁)，…，W^→(ω,θ_i,D₁)，…，W^→(ω,θ_I,D₁),W^→(ω,θ₁,D₂)，…，W^→(ω,θ_i,D₂)，…，W^→(ω,θ_I,D₂)，…，W^→(ω,θ₁,D_g)，…，W^→(ω,θ_i,D_g)，…，W^→(ω,θ_I,D_g)，…，W^→(ω,θ₁,D_G)，…，W^→(ω,θ_i,D_G)，…，W^→(ω,θ_I,D_G)（1≦i≦I, 1≦g≦G, ω∈Ω; iは整数、Ωは周波数ωの集合）を事前に計算しておくのである。このためには、伝達特性a^→(ω,θ_i,D_g)＝[a₁(ω,θ_i,D_g),…,a_M(ω,θ_i,D_g)]^T（1≦i≦I, 1≦g≦G, ω∈Ω）を求める必要があるが、これは、スピーカアレーにおけるスピーカの配置、反射物である例えば反射板のスピーカアレーに対する位置関係（これは既に決定されている）、直接音とξ番目（1≦ξ≦Ξ）の双対音との時間差、反射物の音の反射率などの環境情報を基に式（９ａ）によって具体的に計算できる（正確には、式（９ａ）のθをθ_i、DをD_gとしたものである）。双対音の数Ξは１≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ＝１であり、一つの反射板３００をマイクロホンアレーの近傍に設置するので、伝達特性a^→(ω,θ_i)は式（９ｂ）によって具体的に計算できる（正確には、式（９ｂ）のθをθ_iとしたものである）。ステアリングベクトルの計算には、例えば式（１０ａ）、式（１０ｂ）、式（１１ａ）、式（１１ｂ）、式（１１ｃ）、式（１１ｄ）を用いることができる。なお、式（１０ａ）、式（１０ｂ）に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a^→(ω,θ_i,D_g)を用いて、例えば式（７）、式（１８）、式（１９）、式（２４）のいずれかによってW^→(ω,θ_i,D_g)（1≦i≦I, 1≦g≦G）を求める。なお、式（７）または式（１９）または式（２４）を用いる場合には空間相関行列Q(ω,D_g)（あるいはR_xx(ω,D_g)）は式（８ｂ）で計算できる（正確には、式（８ｂ）のDをD_gとしたものである）。式（１８）を用いる場合には空間相関行列R_nn(ω,D_g)は式（１６）で計算できる（正確には、式（１６）のDをD_gとしたものである）。I×G×|Ω|個のフィルタW^→(ω,θ_i,D_g)（1≦i≦I, 1≦g≦G, ω∈Ω）は記憶部２９０に記憶される。|Ω|は集合Ωの要素数を表す。
【０１０９】
ステップＳ２
音源２００が音源信号ss(t)を出力する。この実施形態では、音源２００からの音源信号ss(t)はアナログ信号であるとする。ただし、音源信号としてディジタル信号を用いることもできる。
【０１１０】
ステップＳ３
ＡＤ変換部２１０が、音源信号ss(t)をディジタル信号s(t)へAD変換する。ここでｔは離散時間のインデックスを表す。なお、ディジタル信号が音源信号である場合には、ステップＳ３の処理を行う必要がなく、音源信号をＡＤ変換部２１０の出力信号であるs(t)と見なすことができる。
【０１１１】
ステップＳ４
フレーム生成部２２０は、ＡＤ変換部２１０が出力したディジタル信号s(t)を入力とし、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(k)を出力する。kはフレーム番号のインデックスである。s(k)=[s((k-1)N+1),…,s(kN)]である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
【０１１２】
ステップＳ５
周波数領域変換部２３０は、各フレームのディジタル信号s(k)を周波数領域の信号S(ω,k)に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号S(ω,k)は、各周波数ω、フレームkごとに出力される。
【０１１３】
ステップＳ６
フィルタ適用部２４０は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,k)に、スポット再生したい位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)を適用して、再生信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tを出力する（式（３０）参照）。位置(θ_s,D_h)のインデックスs, hは、s∈{1,…,I}, h∈{1,…,G}であり、フィルタW^→(ω,θ_s,D_h)は記憶部２９０に記憶されているので、例えば、ステップＳ６の処理の都度、フィルタ適用部２４０は、スポット再生したい位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)を記憶部２９０から取得すればよい。方向θ_sのインデックスsが集合{1,…,I}に属さない場合あるいは距離D_hのインデックスhが集合{1,…,G}に属さない場合、つまり、位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)がステップＳ１の処理で計算されていない場合、臨時に位置(θ_s,D_h)に対応するフィルタW^→(ω,θ_s,D_h)をフィルタ設計部２６０に計算させてもよいし、あるいは方向θ_sに近い方向θ_s'や距離D_hに近い距離D_h'に対応するフィルタW^→(ω,θ_s',D_h)やW^→(ω,θ_s,D_h')やW^→(ω,θ_s',D_h')を用いてよい。
【数４６】

【０１１４】
ステップＳ７
時間領域変換部２５０は、第kフレームの各周波数ω∈Ωの再生信号X^→(ω,k)＝[X₁(ω,k),…,X_M(ω,k)]^Tを時間領域に変換して第kフレームのフレーム単位時間領域信号x^→(k)＝[x₁(k),…,x_M(k)]^Tを得て、さらに、得られたフレーム単位時間領域信号x^→(k)＝[x₁(k),…,x_M(k)]^Tをフレーム番号のインデックスの順番に連結してスポット再生したい位置(θ_s,D_h)に向けて音声が強調された時間領域信号x^→(t)＝[x₁(t),…,x_M(t)]^Tを出力する。周波数領域信号を時間領域信号に変換する方法は、ステップＳ５の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
ステップＳ８
Mチャネルの時間領域信号x₁(t),…,x_M(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ２８０−１，…，２８０−Ｍのうち、チャネルに対応するスピーカで再生される。つまり、ｍ番目(1≦m≦M)のチャネルの時間領域信号x_m(t)はｍ番目のスピーカ２８０−ｍで再生される。
【０１１５】
なお、M個のスピーカの並べ方に制限は無い。線形スピーカアレーのように直線状にスピーカを配置するアレー構成でもよいし、２次元または３次元的にM個のスピーカを配置するアレー構成でもよい。また、収音方向として設定できる方向を広くとるためには、各スピーカの指向性は、再生方向である目的方向θ_sになり得る方向に或る程度の音圧で音声を再生可能な指向性を持っていたほうがよい。したがって、無指向性スピーカや単一指向性スピーカといった指向性が比較的緩やかなスピーカが好適である。
【０１１６】
ここでは、ステップＳ１の処理で予めフィルタW^→(ω,θ_i,D_g)を計算しておく実施形態を説明したが、音声処理装置４の計算処理能力などに応じて、位置(θ_s,D_h)が定まってからフィルタ設計部２６０が周波数ごとのフィルタW^→(ω,θ_s,D_h)を計算する実施形態を採用することもできる。
【０１１７】
＜反射物配置決定装置のハードウェア構成例＞
上述の実施形態に関わる反射物配置決定装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ＣＰＵ（Central Processing Unit）〔キャッシュメモリなどを備えていてもよい。〕、メモリであるＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、反射物配置決定装置に、ＣＤ−ＲＯＭなどの記憶媒体を読み書きできる装置（ドライブ）などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
【０１１８】
反射物配置決定装置の外部記憶装置には、反射物の配置を決定するためのプログラム並びにこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。
【０１１９】
反射物配置決定装置の記憶部には、反射板の配置に関する候補（JK個）、式（１２）や式（１３）などに基づいて反射板の配置を決定するためのプログラムが記憶されている。
【０１２０】
反射物配置決定装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてＲＡＭに読み込まれて、ＣＰＵで解釈実行・処理される。この結果、ＣＰＵが所定の機能（配置決定部）を実現することで反射物の配置決定が実現される。
【０１２１】
また、音声処理装置についても同様のハードウェア構成とすることができ、音声処理装置の記憶部には、空間相関行列を用いて周波数ごとにフィルタを求めるためのプログラムと、アナログ信号に対してＡＤ変換を行うためのプログラム、フレーム生成処理を行うためのプログラム、フレームごとのディジタル信号を周波数領域の周波数領域信号に変換するためのプログラム、所望方向（および所望距離）に対応するフィルタを周波数ごとに周波数領域信号に適用して出力信号を得るためのプログラムと、出力信号を時間領域信号に変換するためのプログラムが記憶されている。
【０１２２】
音声処理装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてＲＡＭに読み込まれて、ＣＰＵで解釈実行・処理される。この結果、ＣＰＵが所定の機能（フィルタ設計部、ＡＤ変換部、フレーム生成部、周波数領域変換部、フィルタ適用部、時間領域変換部）を実現することで上述の音声処理が実現される。
【０１２３】
＜補記＞
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【０１２４】
また、上記実施形態において説明したハードウェアエンティティ（反射物配置決定装置／音声処理装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
【０１２５】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ−ＲＡＭ（Random Access Memory）、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ−Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ−ＲＯＭ（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。
【０１２６】
また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【０１２７】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。
【０１２８】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【特許請求の範囲】
【請求項１】
音声に基づく情報に対して適用されるフィルタが、空間中における複数の方向の伝達特性によって表される空間相関行列を用いて所定の評価関数に基づいて設計される場合であって、
各上記伝達特性は、直接音の伝達特性と反射物で反射する一つの反射音の各伝達特性との和で表されており、
上記評価関数は少なくとも目的方向の音声が強調されるほど小さな値をとる関数であり、
記憶部には、マイクロホンアレーまたはスピーカアレーに対する上記反射物の配置関係を表す情報（以下、配置情報という）が記憶されており、
配置決定部が、上記配置情報に基づく上記反射物の各候補について、当該候補に基づいて特定される上記伝達特性によって表される上記空間相関行列を用いて上記評価関数の値を求め、当該値のうち最小のものに対応する候補を上記反射物の配置として決定する配置決定ステップ
を有する反射物の配置決定方法。
【請求項２】
請求項１に記載の配置決定方法において、
上記評価関数は最小分散無歪応答法に基づく評価関数である
ことを特徴とする反射物の配置決定方法。
【請求項３】
請求項１に記載の配置決定方法において、
上記評価関数はSN比最大化規準に基づく評価関数である
ことを特徴とする反射物の配置決定方法。
【請求項４】
請求項１に記載の配置決定方法において、
上記評価関数はパワーインバージョンに基づく評価関数である
ことを特徴とする反射物の配置決定方法。
【請求項５】
音声に基づく情報に対して適用されるフィルタが、空間中における複数の方向の伝達特性によって表される空間相関行列を用いて所定の評価関数に基づいて設計される場合であって、
各上記伝達特性は、直接音の伝達特性と反射物で反射する一つの反射音の各伝達特性との和で表されており、
上記評価関数は少なくとも目的方向の音声が強調されるほど小さな値をとる関数であり、
マイクロホンアレーまたはスピーカアレーに対する上記反射物の配置関係を表す情報（以下、配置情報という）を記憶する記憶部と、
上記配置情報に基づく上記反射物の各候補について、当該候補に基づいて特定される上記伝達特性によって表される上記空間相関行列を用いて上記評価関数の値を求め、当該値のうち最小のものに対応する候補を上記反射物の配置として決定する配置決定部と
を含む反射物の配置決定装置。
【請求項６】
コンピュータに、請求項１から請求項４のいずれかに記載の反射物の配置決定方法の処理を実行させるためのプログラム。

【図１】