説明

マルチチャネルエコー消去方法、マルチチャネルエコー消去装置、およびプログラム

【課題】マルチチャネルエコー消去処理における演算量を低減することができるマルチチャネルエコー消去装置を提供する。
【解決手段】本発明のマルチチャネルエコー消去装置20は、受話信号ベクトル変換部100が受話信号を周波数領域に変換する。エコーレプリカ生成部220が空間サンプリング間隔に基づいて選択されたマイクロホンについて空間的に間引かれたエコーレプリカを生成する。エコーレプリカ空間補間部300が空間的に間引かれたエコーレプリカから空間補間を行い、エコーレプリカを生成する。逆FFT部400がエコーレプリカを時間領域に変換する。エコー消去部510が送話信号とエコーレプリカから誤差信号を生成する。FFT部600が誤差信号を周波数領域に変換する。エコーレプリカ生成部220が空間サンプリング間隔に基づいて選択されたマイクロホンについて修正量を求めフィルタ係数を更新する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マルチチャネル拡声通話系において音響エコーを消去するマルチチャネルエコー消去方法、マルチチャネルエコー消去装置、およびプログラムに関する。
【背景技術】
【0002】
近年、マルチチャネル再生技術は、ステレオから5.1チャネルへとチャネル数拡大の方向に進んでいる。しかし、音が高い立体感を持って再生されるリスニングエリアは狭く、スィートスポット化しており、スィートスポットの外では音の立体感がかなり低減することが知られている。マルチチャネル再生をもちいるテレプレゼンスTV会議は、10人以上の参加者にも均しく音の立体感を提供可能なリスニングエリアの広い再生が求められている。このようなマルチチャネル再生技術として、Wave Field Synthesis(以下、WFSと略す。)の研究開発が盛んに進められている(非特許文献1参照)。
【0003】
テレプレゼンス会議のようなマルチチャネル拡声型の双方向通信会議システムでは、受話音声がスピーカから再生されマイクロホンに収音されて音響エコーが生じるため、そのまま送信されると通話の障害や不快感などの問題が生じる。快適な通話環境を実現するために、スピーカからマイクロホンに音響的に回り込む信号成分を、マイクロホン収音信号から消去する音響エコーキャンセラを備えることがある。
【0004】
マルチチャネル通信会議システムがM(≧2)チャネル再生系とN(≧1)チャネル収音系からなるとき、音響エコーキャンセラは、図1の構成によりエコー消去を行う。図1を参照して従来のマルチチャネルエコー消去装置10の動作を説明する。従来のマルチチャネルエコー消去装置10は、M(1≦m≦M)個のスピーカ2〜2、N(1≦n≦N)個のマイクロホン3〜3、受話信号ベクトル変換部100、N個のエコーレプリカ生成部200〜200、エコー消去部500を備える。受話信号はスピーカ2〜2で音響信号として再生され、音響エコー経路を経てマイクロホン3〜3に回り込む。受話信号は受話信号ベクトル変換部100でベクトル化され、エコーレプリカ生成部200〜200はベクトル化された受話信号とエコー経路推定値からエコーレプリカを生成する。エコー消去部500は、マイクロホン収音信号からエコーレプリカを引くことでエコー消去を行う。エコー消去部500の出力である誤差信号は、エコーレプリカ生成部200〜200に入力される。エコーレプリカ生成部200〜200は、受話信号と誤差信号から、エコー経路推定値を更新する。エコー経路が精度よく推定された状態では、エコー信号とエコーレプリカ信号がほぼ等しくなり、誤差信号中にエコーは殆ど含まれなくなる。
【0005】
演算量を削減するために、時間領域ではなく周波数領域でエコー計算とフィルタ係数更新を行うアルゴリズムが提案されている(非特許文献2参照)。図2は非特許文献2のアルゴリズムをマルチチャネルに適用したマルチチャネルエコー消去装置11の構成を示すブロック図である。図3は従来のマルチチャネルエコー消去装置11の動作を示すフローチャートである。以下、図2,3を参照しながら、マルチチャネルエコー消去装置11の動作を詳細に説明する。なお、以下の説明では、kは時間を表し、fは周波数を表し、jはフレーム番号を表す。
【0006】
従来のマルチチャネルエコー消去装置11は、M(1≦m≦M)個のスピーカ2〜2と、N(1≦n≦N)個のマイクロホン3〜3と、受話信号ベクトル変換部110と、N個のエコーレプリカ生成部210〜210と、逆FFT部400と、エコー消去部510と、FFT部600を備える。
【0007】
受話信号ベクトル変換部110は、Mチャネルの受話信号x(k)をLサンプルごとにブロック化し、1フレーム=2Lサンプルとして、1フレーム分を高速フーリエ変換により周波数領域に変換し、式(1)のように受話信号X(f,j)を生成する(S110)。ここで、Lは自然数であり、フレーム分割数DはLを割り切る自然数であり、高速フーリエ変換を簡略化・高速化するために、Lを2のべき乗にとることが多い。
【0008】
【数1】

【0009】
エコーレプリカ生成部210は、周波数fごとに、式(2)のように、受話信号X(f,j)とフィルタ係数Hm,n(f,j)を掛けることで、受話信号X(f,j)をフィルタ処理し、これをMチャネル分加算する。これによりエコーレプリカY^(f,j)を求める(S210)。
【0010】
【数2】

【0011】
逆FFT部400は、エコーレプリカY^(f,j)を逆高速フーリエ変換により時間領域に変換し、式(3)のようにエコーレプリカy^(j)を求める(S400)。
【0012】
【数3】

【0013】
ここで、0はL×Lの零行列、IはL×Lの単位行列である。
【0014】
エコー消去部510は、時間領域でN個のマイクロホン3〜3から収音されるNチャネルの送話信号y(j)とエコーレプリカy^(j)から誤差信号e(j)を求める(S510)。
【0015】
FFT部600は、誤差信号e(j)を高速フーリエ変換により周波数領域に変換し、式(4)のように誤差信号E(f,j)を求める(S600)。
【0016】
【数4】

【0017】
エコーレプリカ生成部210は、誤差信号E(f,j)と受話信号X(f,j)から、式(5)のようにフィルタ係数の修正量dHm,n(f,j)を求める。
【0018】
【数5】

【0019】
ただし、(上付きアスタリスク)は、複素共役を表す。
【0020】
次に、各チャネルのフィルタ係数Hm,n(f,j)を、式(6)のように更新する(S700)。
【0021】
【数6】

【0022】
ここで、p(f,j)は、周波数成分ごとに、Nチャネル分の送話信号パワーの総和を、式(7)のように計算することで求めたものであり、修正量dHm,n(f,j)を補正している。
【0023】
【数7】

【0024】
ただし、μは0〜1の値をとるステップサイズであり、δは分母が0になることを防止するための微小な正定数であり、βは0〜1の値をとるパワー計算で短時間平均をとるための平滑化定数である。
【先行技術文献】
【非特許文献】
【0025】
【非特許文献1】A. J. Berkhout, D. de Vries, and P. Vogel, “Acoustic control by wave field synthesis”, Journal of Acoustic Society of America, vol. 93, no. 5, pp.2764-2778 (1993).
【非特許文献2】D. Mansour and A. H. Gray, “Unconstrained Frequency-Domain Adaptive Filter”, IEEE Trans. on Acoust., Speech, Signal Processing, vol. ASSP-30, No. 5, pp.726-734 (1982).
【発明の概要】
【発明が解決しようとする課題】
【0026】
しかしながら、非特許文献1に記載されたWFSは、ある地点での音波面を取得し別の地点で再合成するために、数十以上のマイクロホンと数十以上のスピーカを必要とする。そのため、WFSを双方向テレビ会議に導入しようとする場合、スピーカ・マイクロホンの間の音響パスはチャネル数の二乗になるため、エコーキャンセラが推定する音響パス数はチャネル数の二乗で急激に増大する。
【0027】
また、エコーキャンセラの演算量を下げるために、非特許文献2に記載された周波数領域でエコー計算とフィルタ係数更新を行う方法を用いても、エコーレプリカ生成とフィルタ係数更新の処理は、入力チャネル数と出力チャネル数の積、すなわちM×Nで増大してしまう。
【0028】
本発明はこのような点に鑑みてなされたものであり、マルチチャネル拡声通話系において音響エコーを消去するマルチチャネルエコー消去処理における演算量を低減することができるマルチチャネルエコー消去装置を提供することを目的とする。
【課題を解決するための手段】
【0029】
上記の課題を解決するために、本発明のマルチチャネルエコー消去装置は、M(1≦m≦M)個のスピーカと直線上に等間隔に配置されたN(3≦n≦N)個のマイクロホンと受話信号ベクトル変換部とエコーレプリカ生成部とエコーレプリカ空間補間部と逆FFT部とエコー消去部とFFT部を備える。kは時間を表し、fは周波数を表し、jはフレーム番号を表し、iは適応フィルタのタップ番号を表し、mはスピーカの番号を表し、nはマイクロホンの番号を表し、SetN(f)は周波数fにおいて空間サンプリング間隔に基づいて選択されるマイクロホンの番号の集合を表すとする。受話信号ベクトル変換部は、スピーカから出力されるMチャネルの受話信号x(k)を、チャネルmごとに、周波数領域に変換して、受話信号X(f,j)を生成する。エコーレプリカ生成部は、受話信号X(f,j)が入力されると、当該受話信号X(f,j)から、周波数fごとに、SetN(f)に含まれるマイクロホンnについて、タップ数がI(1≦i≦I、Iは1以上)のフィルタ係数Hm,n,i(f,j)を用いて、空間的に間引かれたエコーレプリカY^SetN(f)(f,j)を生成する。エコーレプリカ空間補間部は、空間的に間引かれたエコーレプリカY^SetN(f)(f,j)から、周波数fごとに、空間補間を行い、エコーレプリカY^(f,j)を生成する。逆FFT部は、エコーレプリカY^(f,j)を、時間領域に変換して、エコーレプリカy^(j)を生成する。エコー消去部は、マイクロホンから収音されるNチャネルの送話信号y(j)とエコーレプリカy^(j)から、誤差信号e(k)を生成する。FFT部は、誤差信号e(k)を、周波数領域に変換して、誤差信号E(f,j)を生成する。エコーレプリカ生成部は、誤差信号E(f,j)が入力されると、当該誤差信号E(f,j)と受話信号X(f,j)から、周波数fごとに、SetN(f)に含まれるマイクロホンnについて、修正量dHm,n,i(f,j)を求め、当該修正量dHm,n,i(f,j)を用いて、フィルタ係数Hm,n,i(f,j)を更新する。
【発明の効果】
【0030】
本発明のマルチチャネルエコー消去装置によれば、周波数ごとにエコー信号の空間方向形状に着目し、低い周波数では空間補間を用いてエコーレプリカを生成することで、エコーレプリカの生成とフィルタ係数の更新における演算回数を低減し、マルチチャネル拡声通話系におけるエコー消去処理全体での演算量を低減することができる。
【図面の簡単な説明】
【0031】
【図1】従来のマルチチャネルエコー消去装置10の構成を示すブロック図。
【図2】従来のマルチチャネルエコー消去装置11の構成を示すブロック図。
【図3】従来のマルチチャネルエコー消去装置11の動作を示すフローチャート。
【図4】エコー信号の周波数ごとの空間形状を示した図。
【図5】周波数ごとの間引きパターンを示した図。
【図6】実施例1のマルチチャネルエコー消去装置20の構成を示すブロック図。
【図7】実施例1のマルチチャネルエコー消去装置20の動作を示すフローチャート。
【図8】エコーレプリカの空間補間方法を示した図。
【図9】誤差信号の合成方法を示した図。
【図10】実施例1の実験結果を示した図。
【図11】実施例2のマルチチャネルエコー消去装置30の構成を示すブロック図。
【図12】実施例2のマルチチャネルエコー消去装置30の動作を示すフローチャート。
【図13】実施例2の実験結果を示した図。
【図14】実施例3のマルチチャネルエコー消去装置40の構成を示すブロック図。
【図15】実施例3の帯域分割音声スイッチ部700の構成を示すブロック図。
【図16】実施例3のマルチチャネルエコー消去装置40の動作を示すフローチャート。
【発明を実施するための形態】
【0032】
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
【0033】
[本発明の原理]
実施例の説明に先立ち、本発明のマルチチャネルエコー消去方法の原理を説明する。本発明は、周波数ごとのエコー信号の空間方向の形状に着目し、低い周波数では空間補間を用いてエコーレプリカを生成することで、エコーキャンセラ演算量の急激な増大を抑えることができる。マイクロホンが等間隔に直線状に並んでいる場合、各周波数でのエコー信号の空間形状は、周波数が低いほど滑らかになる。それは、音波の波長λと周波数fの間に、波長λ×周波数f=音速c(一定)の関係があるために、周波数fが低いほど波長λは長くなるためである。さらにナイキスト定理によれば、低い周波数ではサンプリング間隔をマイクロホン間隔よりもずっと大きくすることができる。これは、低い周波数では空間サンプリングの間隔を広げられること、すなわちサンプリングを間引けること、を意味する。
【0034】
ここではWFS収音再生系の一例として、直線状スピーカアレーと直線状マイクロホンアレーをサンプリング周波数16kHzで動作させることを考える。ナイキスト定理より、マイクロホン間隔すなわち空間波のサンプリング間隔はλ/2以下である必要がある。帯域上限8kHzの波をサンプリングするには、音速を330[m/s]として、マイクロホン間隔を2cmにする必要がある。しかし周波数が低くなるほど波形は滑らかになる。図4にこの状況を示す。33本のマイクロホンで収音したエコー信号1フレーム分を高速フーリエ変換により周波数分解して得られた、4kHz,2kHz,1kHz,500Hz,250Hz,125Hzのエコー信号の空間形状をそれぞれプロットしている。なお、実線は実数成分を表し、点線は虚数成分を表している。滑らかな波形に対して空間サンプリングを間引きすることができる。すなわち低い周波数については、全マイクロホンではなく一部のマイクロホンでエコー消去処理を行い、残りのマイクロホンについては適応フィルタを用いずに一部のマイクロホンのエコー消去済み信号から、空間補間によって全マイクロホンのエコー消去済み信号を求めることができる。
【0035】
図5に、マイクロホン数9、周波数帯域分割数8の場合について、周波数fごとの送話信号の間引きパターンSetN(f)を示す。横軸はマイク位置であり、縦軸は周波数である。fの値が大きいほど周波数が高いことを表している。f=3,4では、空間サンプリングが1/2に間引かれている。f=1,2では空間サンプリングが1/4に間引かれている。
【0036】
送話信号の間引きパターンSetN(f)は、周波数fの波長λ(f)=c(音速)/fから求められる。マイクロホンが等間隔に並んでいる場合、Sはマイクロホン間隔を表すとして、S×Q≦λ(f)/2を満たす最大の自然数Qを求め、間引き間隔Q(f)をQ以下に設定する。例えば、マイクロホン数N=9、間引き間隔Q(f)=4の場合、SetN(f)={1,5,9}と設定することができる。また、間引き間隔Q(f)=2の場合、SetN(f)={1,3,5,7,9}と設定することができる。
【0037】
上記の原理に基づいて、低い周波数でエコーレプリカの生成処理とフィルタ係数の更新処理を間引くことで演算量を下げることが可能になる。
【実施例1】
【0038】
図6、図7を参照して、本発明の実施例1に係るマルチチャネルエコー消去装置20の動作を詳細に説明する。図6は本発明の実施例1に係るマルチチャネルエコー消去装置20の構成を示すブロック図である。図7は本発明の実施例1に係るマルチチャネルエコー消去装置20の動作を示すフローチャートである。本実施例では、周波数領域適応アルゴリズムとして、「E. Moulines, O. A. Amrane, and Y. Grenier, “The Generalized Multidelay Adaptive Filter: Structure and Convergence Analysis”, IEEE Trans. on SP, vol. 43, no. 1 (1995).」に記載された方法を用いた場合について説明する。以下では、適応フィルタは時間方向I個(Iは1以上)に分割されているものとして説明する。
【0039】
以下、実際に行われる手続きの順に説明してゆく。本実施例のマルチチャネルエコー消去装置20は、M(1≦m≦M)個のスピーカ2〜2と、N(3≦n≦N)個のマイクロホン3〜3と、受話信号ベクトル変換部110と、N個のエコーレプリカ生成部220〜220と、エコーレプリカ空間補間部300と、逆FFT部400と、エコー消去部510と、FFT部600を備える。
【0040】
受話信号ベクトル変換部110は、Mチャネルの受話信号x(k)をLサンプルごとにブロック化し、1フレーム=2Lサンプルとして、1フレーム分を高速フーリエ変換により周波数領域に変換し、上記式(1)のように受話信号X(f,j)を生成する(S110)。
【0041】
エコーレプリカ生成部220は、周波数f≦L+1について、周波数fごとに、SetN(f)に含まれるnについて、式(8)のように、受話信号X(f,j)とフィルタ係数Hm,n,i(f,j)を掛けることで、受話信号X(f,j)をフィルタ処理し、Mチャネル分加算する。これにより空間的に間引きされたエコーレプリカY^SetN(f)(f,j)を求める(S220)。
【0042】
【数8】

【0043】
エコーレプリカ空間補間部300は、周波数f≦L+1について、周波数fごとに、エコーレプリカ生成部210の生成する空間的に間引きされたエコーレプリカY^SetN(f)(f,j)を用いて、空間補間によりエコーレプリカY^(f,j)を求める(S300)。より具体的には、間引きによりスキップされたチャネルn、すなわちSetN(f)に含まれないnについて、SetN(f)に含まれるチャネルのエコー消去済み信号を空間補間することでエコーレプリカY^(f,j)を求める。マイクロホンが等間隔で直線状に配置されているときは、空間的に間引きされたエコーレプリカY^SetN(f)(f,j)とsinc関数を使って、式(9)のように空間補間が可能である。
【0044】
【数9】

【0045】
なお、実際の計算では、sinc関数を有限長で打ち切る必要がある。sinc関数を打ち切る範囲としては、間引き間隔Q(f)に基づいて、式(10)もしくは式(11)のように設定することができる。この場合には、sinc関数と乗算するエコーレプリカは4点もしくは6点で済む。
【0046】
【数10】

【0047】
続いて、エコーレプリカ空間補間部300は、周波数f>L+1について、周波数fごとに、実数信号の高速フーリエ変換結果に関する対称性を用いて、式(12)のようにエコーレプリカY^(f,j)を求める(S300)。ここで、conjは複素共役を取ることを表している。
【0048】
【数11】

【0049】
逆FFT部400は、エコーレプリカY^(f,j)を逆高速フーリエ変換により時間領域に変換し、上記式(3)のようにエコーレプリカy^(j)を求める(S400)。
【0050】
エコー消去部510は、時間領域でN個のマイクロホン3〜3から収音されるNチャネルの送話信号y(j)とエコーレプリカy^(j)から誤差信号e(j)を求める(S510)。
【0051】
FFT部600は、誤差信号e(j)を高速フーリエ変換により周波数領域に変換し、上記式(4)のように誤差信号E(f,j)を求める(S600)。受信信号x(k)をフレーム化するときフレーム分割数DをD≧2に設定した場合には、フレーム番号jで求めた誤差信号E(k,j)と、一つ前のフレーム番号j−1で求めた誤差信号E(k,j−1)を窓かけ処理を経て合成して出力する。図9はD=2の場合の合成処理を示す図である。具体的には、jフレーム目で求めた誤差信号e(k+t,j)を式(13)のように表し、Wは長さ2L/Dのハニング窓を表すとして、合成後の誤差信号e’(k+t)は、式(14)のように表すことができる。
【0052】
【数12】

【0053】
エコーレプリカ生成部220は、SetN(f)に含まれるnについてのみ、誤差信号E(f,j)と受話信号X(f,j)から、式(15)のように、フィルタ係数の修正量dHm,n,i(f,j)を求める。
【0054】
【数13】

【0055】
次に、SetN(f)に含まれるnについてのみ、各チャネルのフィルタ係数Hm,n,i(f,j)を、式(16)のように更新する(S710)。
【0056】
【数14】

【0057】
ここで、p(f,j)は、周波数成分ごとに、Nチャネル分の送話信号パワーの総和を、式(17)のように計算することで求めたものであり、修正量dHm,n,i(f,j)を補正している。
【0058】
【数15】

【0059】
ここで、μは0〜1の値をとるステップサイズであり、δは分母が0になることを防止するための微小な正定数であり、βは0〜1の値をとるパワー計算で短時間平均をとるための平滑化定数である。
【0060】
上記から明らかなように、本実施例では、SetN(f)に含まれないnについては、エコーレプリカy^(j)も修正量dHm,n,i(f,j)もフィルタ係数Hm,n,i(f,j)も計算されないため、マルチチャネルエコー消去処理全体での演算量を低減することができる。
【0061】
[実施例1の実験結果]
本実施例の効果を確認するために、シミュレーションを行った。残響時間200msの部屋で、直線状スピーカアレー(33素子、間隔2cm)と直線状マイクロホンアレー(33素子、間隔2cm)を2m離して平行に配置し、スピーカ・マイク間の全エコー経路インパルス応答をシミュレータにより生成した。サンプリング周波数は16kHzに設定した。空間補間でエコーレプリカを求める際に、間引き間隔Q(f)に基づいて上記式(10)を使用した。
【0062】
受話信号は、別途ピンクノイズを音源として、33マイクロホンによる収音を模擬して生成した。図10に本実施例の構成によるエコー消去処理結果を示す。図10では33チャネル中の第1,5,11,17,19チャネルについて、送話信号と誤差信号のレベルを、受話信号を実線で、誤差信号を破線でプロットしている。実線と破線の差だけエコーが消去されていることを表している。いずれもエコーを良好に消去していることが分かる。
【0063】
[変形例]
本実施例では、周波数領域のフィルタ係数Hm,n,i(f,j)が、どの周波数fでもIタップを持つ場合を説明している。本実施例の変形例として、フィルタ係数の高域部分でタップ数をIタップより減らすことが考えられる。例えば、人の声の成分が相対的に小さい4kHzを超える周波数ではタップ数を1とすることなどが考えられる。これにより、全体の演算量をさらに下げることが可能になる。
【実施例2】
【0064】
演算量をさらに下げるために、適応フィルタに入力する受話信号についても低い周波数で間引きを行ってもよい。周波数fごとの受話信号の間引きパターンSetM(f)は、SetN(f)と同様に、周波数fの波長λ(f)=c/fから求められる。スピーカが等間隔に並んでいる場合、Sはスピーカ間隔を表すとして、S×Q≦λ(f)/2を満たす最大の自然数Qを求め、間引き間隔Q(f)をQ以下に設定する。
【0065】
図11、図12を参照して、本発明の実施例2に係るマルチチャネルエコー消去装置30の動作を詳細に説明する。図11は本発明の実施例2に係るマルチチャネルエコー消去装置30の構成を示すブロック図である。図12は本発明の実施例2に係るマルチチャネルエコー消去装置30の動作を示すフローチャートである。実施例2のマルチチャネルエコー消去装置30は、実施例1のマルチチャネルエコー消去装置20と比較して、エコーレプリカ生成部220の替わりに、エコーレプリカ生成部230を備える点が相違する。
【0066】
エコーレプリカ生成部230は、周波数f≦L+1について、周波数fごとに、mがSetM(f)に含まれる受話信号X(f,j)を抽出する(S231)。続いて、エコーレプリカ生成部230は、周波数f≦L+1について、周波数fごとに、SetN(f)に含まれるnについて、式(18)のように、受話信号X(f,j)とフィルタ係数Hm,n,i(f,j)を掛けることで、受話信号X(f,j)をフィルタ処理し、Mチャネル分加算する。これにより空間的に間引きされたエコーレプリカY^SetN(f)(f,j)を求める(S232)。
【0067】
【数16】

【0068】
また、エコーレプリカ生成部230は、mがSetM(f)に含まれ、かつnがSetN(f)に含まれる場合にのみ、誤差信号E(f,j)と受話信号X(f,j)から、上記式(15)のように、フィルタ係数の修正量dHm,n,i(f,j)を求める。次に、mがSetM(f)に含まれ、かつnがSetN(f)に含まれる場合にのみ、各チャネルのフィルタ係数Hm,n,i(f,j)を、上記式(16)のように更新する(S720)。ただし、修正量dHm,n,i(f,j)を補正するp(f,j)は、式(19)のように計算して求める。
【0069】
【数17】

【0070】
ここで、μは0〜1の値をとるステップサイズであり、δは分母が0になることを防止するための微小な正定数であり、βは0〜1の値をとるパワー計算で短時間平均をとるための平滑化定数である。
【0071】
上記から明らかなように、本実施例では、m∈SetM(f)かつn∈SetN(f)のm,nについてのみ、エコーレプリカY^(f,j)と修正量dHm,n,i(f,j)が計算され、フィルタ係数Hm,n,i(f,j)が更新される。このため、上記以外のm,nについては、エコーレプリカY^(f,j)も修正量dHm,n,i(f,j)もフィルタ係数Hm,n,i(f,j)も計算されないため、演算量をさらに低減することができる。
【0072】
なお、本実施例では、受話側の信号が間引かれているため、フィルタ係数と特定スピーカ・特定マイク間のエコー経路特性は1対1に対応しなくなる。
【0073】
[実施例2の実験結果]
本実施例の効果を確認するために、実施例1と同一の設定でシミュレーションを行った。図13に本実施例の構成によるエコー消去処理結果を示す。図13では33チャネル中の第1、5、11、17、19チャネルについて、送話信号と誤差信号のレベルを、受話信号を実線で、誤差信号を破線でプロットしている。実線と破線の差だけエコーが消去されていることを表している。いずれもエコーを良好に消去していることが分かる。
【実施例3】
【0074】
図14、図15、図16を参照して、本発明の実施例3に係るマルチチャネルエコー消去装置40の動作を詳細に説明する。図14は本発明の実施例3に係るマルチチャネルエコー消去装置40の構成を示すブロック図である。図16は本発明の実施例3に係るマルチチャネルエコー消去装置40の動作を示すフローチャートである。実施例3のマルチチャネルエコー消去装置40は、実施例1のマルチチャネルエコー消去装置20と比較して、さらに帯域分割音声スイッチ部800を備える点が相違する。図15は帯域分割音声スイッチ部800の構成を示すブロック図である。受話信号および送話信号を帯域分割音声スイッチ部800で低域成分と高域成分に分け、高域成分のエコーを送受話状態に応じて減衰させることで制御し、低域成分のエコーを適応フィルタで消去して制御する。
【0075】
帯域分割音声スイッチ部800は、送受話判定部810と、M個の受話側高域減衰部820〜820と、N個の受話側高域減衰部830〜830を備える。受話側高域減衰部820は、ハイパスフィルタ(以下、HPFと略す。)8210と、ローパスフィルタ(以下、LPFと略す。)8220と、信号減衰器8230と、信号加算器8240を備える。送話側高域減衰部830は、HPF8310と、LPF8320と、信号減衰器8330と、信号加算器8340を備える。
【0076】
受話側高域減衰部820は、受話信号にHPF8210とLPF8220を適用し、低域信号と高域信号に分割する。信号減衰器8230は、HPF8210の出力する高域信号を指定分減衰する。信号加算器8240は、信号減衰器8230の出力する信号とLPF8220の出力する信号を加算する。送話側高域減衰部820は、送話信号にHPF8310とLPF8320を適用し、低域信号と高域信号に分割する。信号減衰器8330は、HPF8310の出力する高域信号を指定分減衰する。信号加算器8340は、信号減衰器8330の出力する信号と、LPF8320の出力する信号を加算する。
【0077】
送受話判定部810は、LPF8220の出力するMチャネルの信号とLPF8320の出力するNチャネルの信号を用いて、送受話判定を行う(S810)。受話状態と判定したときには受話側高域信号のみを減衰させる(S820)。送話状態と判定したときには送話側高域信号のみを減衰させる(S830)。信号減衰器8220および信号減衰器8320に指定する減衰量は、残留エコーが気にならないレベルになるように、3〜40dBの範囲で設定する。
【0078】
本実施例によると、エコーレプリカ生成部220が高域成分に対応するフィルタ係数Hm,n(f,j)をエコーレプリカ生成に使用しないため、全体での演算量を低減することができる。ただし、フレーム間で異音が生じないことを保証するために受話信号ベクトル変換部110が受話信号をフレーム化する際に、フレーム分割数DをD≧2に設定する必要がある。
【0079】
<プログラム、記録媒体>
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0080】
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0081】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0082】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0083】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0084】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【産業上の利用可能性】
【0085】
この発明によるマルチチャネルエコー消去装置は、複数チャネルの再生系と複数チャネルの収音系からなるマルチチャネル通信会議システムに利用することができる。
【符号の説明】
【0086】
10,20,30,40 マルチチャネルエコー消去装置
2 スピーカ
3 マイクロホン
100,110 受話信号ベクトル変換部
200,210,220,230 エコーレプリカ生成部
300 エコーレプリカ空間補間部
400 逆FFT部
500,510 エコー消去部
600 FFT部
800 帯域分割音声スイッチ部
810 送受話判定部
820 受話側高域減衰部
830 送話側高域減衰部
8210,8310 ハイパスフィルタ
8220,8320 ローパスフィルタ
8230,8330 信号減衰器
8240,8340 信号加算器

【特許請求の範囲】
【請求項1】
kは時間を表し、fは周波数を表し、jはフレーム番号を表し、iは適応フィルタのタップ番号を表し、mはスピーカの番号を表し、nはマイクロホンの番号を表し、SetN(f)は周波数fにおいて空間サンプリング間隔に基づいて選択されるマイクロホンの番号の集合を表すとして、
受話信号ベクトル変換部が、M(1≦m≦M)個のスピーカから出力されるMチャネルの受話信号x(k)を、チャネルmごとに、周波数領域に変換して、受話信号X(f,j)を生成する受話信号ベクトル変換ステップと、
エコーレプリカ生成部が、前記受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnについて、タップ数がI(1≦i≦I、Iは1以上)のフィルタ係数Hm,n,i(f,j)を用いて、空間的に間引かれたエコーレプリカY^SetN(f)(f,j)を生成するエコーレプリカ生成ステップと、
エコーレプリカ空間補間部が、前記空間的に間引かれたエコーレプリカY^SetN(f)(f,j)から、周波数fごとに、空間補間を行い、エコーレプリカY^(f,j)を生成するエコーレプリカ空間補間ステップと、
逆FFT部が、前記エコーレプリカY^(f,j)を、時間領域に変換して、エコーレプリカy^(j)を生成する逆FFTステップと、
エコー消去部が、直線上に等間隔に配置されたN(3≦n≦N)個のマイクロホンから収音されるNチャネルの送話信号y(j)と前記エコーレプリカy^(j)から、誤差信号e(k)を生成するエコー消去ステップと、
FFT部が、前記誤差信号e(k)を、周波数領域に変換して、誤差信号E(f,j)を生成するFFTステップと、
前記エコーレプリカ生成部が、前記誤差信号E(f,j)と前記受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnについて、修正量dHm,n,i(f,j)を求め、当該修正量dHm,n,i(f,j)を用いて、前記フィルタ係数Hm,n,i(f,j)を更新するフィルタ係数更新ステップと、
を含むことを特徴とするマルチチャネルエコー消去方法。
【請求項2】
kは時間を表し、fは周波数を表し、jはフレーム番号を表し、iは適応フィルタのタップ番号を表し、mはスピーカの番号を表し、SetM(f)は周波数fにおいて空間サンプリング間隔に基づいて選択されるスピーカの番号の集合を表し、nはマイクロホンの番号を表し、SetN(f)は周波数fにおいて空間サンプリング間隔に基づいて選択されるマイクロホンの番号の集合を表すとして、
受話信号ベクトル変換部が、直線上に等間隔に配置されたM(3≦m≦M)個のスピーカから出力されるMチャネルの受話信号x(k)を、チャネルmごとに、周波数領域に変換して、受話信号X(f,j)を生成する受話信号ベクトル変換ステップと、
エコーレプリカ生成部が、前記受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnと前記SetM(f)に含まれるスピーカmの組み合わせについて、タップ数がI(1≦i≦I、Iは1以上)のフィルタ係数Hm,n,i(f,j)を用いて、空間的に間引かれたエコーレプリカY^SetN(f)(f,j)を生成するエコーレプリカ生成ステップと、
エコーレプリカ空間補間部が、前記空間的に間引かれたエコーレプリカY^SetN(f)(f,j)から、周波数fごとに、空間補間を行い、エコーレプリカY^(f,j)を生成するエコーレプリカ空間補間ステップと、
逆FFT部が、前記エコーレプリカY^(f,j)を、時間領域に変換して、エコーレプリカy^(j)を生成する逆FFTステップと、
エコー消去部が、直線上に等間隔に配置されたN(3≦n≦N)個のマイクロホンから収音されるNチャネルの送話信号y(j)と前記エコーレプリカy^(j)から、誤差信号e(k)を生成するエコー消去ステップと、
FFT部が、前記誤差信号e(k)を、周波数領域に変換して、誤差信号E(f,j)を生成するFFTステップと、
前記エコーレプリカ生成部が、前記誤差信号E(f,j)と前記受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnと前記SetM(f)に含まれるスピーカmの組み合わせについて、修正量dHm,n,i(f,j)を求め、当該修正量dHm,n,i(f,j)を用いて、前記フィルタ係数Hm,n,i(f,j)を更新するフィルタ係数更新ステップと、
を含むことを特徴とするマルチチャネルエコー消去方法。
【請求項3】
請求項1または2に記載のマルチチャネルエコー消去方法であって、
Sはマイクロホン間隔を表し、λ(f)は周波数fの波長を表すとして、
前記SetN(f)は、S×Q≦λ(f)/2を満たす最大の自然数Qを求め、当該Q以下である間引き間隔Q(f)を決定し、当該間引き間隔Q(f)に基づいて選択される
ことを特徴とするマルチチャネルエコー消去方法。
【請求項4】
請求項1から3のいずれかに記載のマルチチャネルエコー消去方法であって、
Sはマイクロホン間隔を表し、λ(f)は周波数fの波長を表すとして、
前記エコーレプリカ空間補間ステップは、周波数fごとに、S×Q≦λ(f)/2を満たす最大の自然数Qを求め、当該Q以下である間引き間隔Q(f)を決定し、
【数18】


のように、空間補間を行う
ことを特徴とするマルチチャネルエコー消去方法。
【請求項5】
請求項1から4のいずれかに記載のマルチチャネルエコー消去方法であって、
前記フィルタ係数Hm,n,i(f,j)は、周波数fごとに可変であり、所定の周波数を超える周波数に対応するフィルタ係数のタップ数が、所定の周波数以下の周波数に対応するフィルタ係数のタップ数よりも少なく設定されている
ことを特徴とするマルチチャネルエコー消去方法。
【請求項6】
請求項1から5のいずれかに記載のマルチチャネルエコー消去方法であって、
帯域分割音声スイッチ部が、前記受話信号x(k)を、チャネルmごとに、高域成分を減衰する受話側高域減衰ステップと、
前記帯域分割音声スイッチ部が、前記誤差信号e(k)を、チャネルnごとに、高域成分を減衰する送話側高域減衰ステップと、
前記帯域分割音声スイッチ部が、前記受話信号x(k)の低域成分と前記誤差信号e(k)の低域成分を用いて、送受話判定を行う送受話判定ステップを、さらに有し、
前記送受話判定ステップにおいて、受話状態と判定した場合には、前記受話側高域減衰ステップを実行し、送話状態と判定した場合には、前記送話側高域減衰ステップを実行する
ことを特徴とするマルチチャネルエコー消去方法。
【請求項7】
kは時間を表し、fは周波数を表し、jはフレーム番号を表し、iは適応フィルタのタップ番号を表し、mはスピーカの番号を表し、nはマイクロホンの番号を表し、SetN(f)は周波数fにおいて空間サンプリング間隔に基づいて選択されるマイクロホンの番号の集合を表すとして、
M(1≦m≦M)個のスピーカと、
直線上に等間隔に配置されたN(3≦n≦N)個のマイクロホンと、
前記スピーカから出力されるMチャネルの受話信号x(k)を、チャネルmごとに、周波数領域に変換して、受話信号X(f,j)を生成する受話信号ベクトル変換部と、
前記受話信号X(f,j)が入力されると、当該受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnについて、タップ数がI(1≦i≦I、Iは1以上)のフィルタ係数Hm,n,i(f,j)を用いて、空間的に間引かれたエコーレプリカY^SetN(f)(f,j)を生成し、誤差信号E(f,j)が入力されると、当該誤差信号E(f,j)と前記受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnについて、修正量dHm,n,i(f,j)を求め、当該修正量dHm,n,i(f,j)を用いて、前記フィルタ係数Hm,n,i(f,j)を更新するエコーレプリカ生成部と、
前記空間的に間引かれたエコーレプリカY^SetN(f)(f,j)から、周波数fごとに、空間補間を行い、エコーレプリカY^(f,j)を生成するエコーレプリカ空間補間部と、
前記エコーレプリカY^(f,j)を、時間領域に変換して、エコーレプリカy^(j)を生成する逆FFT部と、
前記マイクロホンから収音されるNチャネルの送話信号y(j)と前記エコーレプリカy^(j)から、誤差信号e(k)を生成するエコー消去部と、
前記誤差信号e(k)を、周波数領域に変換して、前記誤差信号E(f,j)を生成するFFT部と、
を備えることを特徴とするマルチチャネルエコー消去装置。
【請求項8】
kは時間を表し、fは周波数を表し、jはフレーム番号を表し、iは適応フィルタのタップ番号を表し、mはスピーカの番号を表し、SetM(f)は周波数fにおいて空間サンプリング間隔に基づいて選択されるスピーカの番号の集合を表し、nはマイクロホンの番号を表し、SetN(f)は周波数fにおいて空間サンプリング間隔に基づいて選択されるマイクロホンの番号の集合を表すとして、
直線上に等間隔に配置されたM(3≦m≦M)個のスピーカと、
直線上に等間隔に配置されたN(3≦n≦N)個のマイクロホンと、
前記スピーカから出力されるMチャネルの受話信号x(k)を、チャネルmごとに、周波数領域に変換して、受話信号X(f,j)を生成する受話信号ベクトル変換部と、
前記受話信号X(f,j)が入力されると、当該受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnと前記SetM(f)に含まれるスピーカmの組み合わせについて、タップ数がI(1≦i≦I、Iは1以上)のフィルタ係数Hm,n,i(f,j)を用いて、空間的に間引かれたエコーレプリカY^SetN(f)(f,j)を生成し、誤差信号E(f,j)が入力されると、当該誤差信号E(f,j)と前記受話信号X(f,j)から、周波数fごとに、前記SetN(f)に含まれるマイクロホンnと前記SetM(f)に含まれるスピーカmの組み合わせについて、修正量dHm,n,i(f,j)を求め、当該修正量dHm,n,i(f,j)を用いて、前記フィルタ係数Hm,n,i(f,j)を更新するエコーレプリカ生成部と、
前記空間的に間引かれたエコーレプリカY^SetN(f)(f,j)から、周波数fごとに、空間補間を行い、エコーレプリカY^(f,j)を生成するエコーレプリカ空間補間部と、
前記エコーレプリカY^(f,j)を、時間領域に変換して、エコーレプリカy^(j)を生成する逆FFT部と、
前記マイクロホンから収音されるNチャネルの送話信号y(j)と前記エコーレプリカy^(j)から、誤差信号e(k)を生成するエコー消去部と、
前記誤差信号e(k)を、周波数領域に変換して、前記誤差信号E(f,j)を生成するFFT部と、
を備えることを特徴とするマルチチャネルエコー消去装置。
【請求項9】
請求項1から6のいずれかに記載されたマルチチャネルエコー消去方法の各ステップをコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2013−115681(P2013−115681A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−261375(P2011−261375)
【出願日】平成23年11月30日(2011.11.30)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】