説明

伝搬遅延時間推定器、プログラム及び方法、並びにエコーキャンセラ

【課題】 伝搬遅延時間の推定において、誤った時間を推定結果としてしまう頻度を低減することができる。
【解決手段】 本発明は、当初は同一信号であった第1の離散的時間信号と、第2の離散的時間信号との時間差である伝搬遅延時間を推定する伝搬遅延時間推定器に関する。そして、伝搬遅延時間推定器は、第1の離散的時間信号を、より少ない量子化ビット数で表現される第3の離散的時間信号に変換し、第2の離散的時間信号を、より少ない量子化ビット数で表現される第4の離散的時間信号に変換する手段と、第3の離散的時間信号及び上記第4の離散的時間信号を利用して、上記伝搬遅延時間の推定値を算出する手段とを有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、伝搬遅延時間推定器、方法及びプログラム、並びに、エコーキャンセラに関し、例えば、回線エコーを消去するエコーキャンセラに適用し得る。
【背景技術】
【0002】
エコー発生点までの往復伝搬遅延時間(以下、単に「伝搬遅延時間」ともいう)が大きな回線エコーキャンセラの配備例を、図8に示す。なお、図8においては、2線伝送路401、402、403、404を便宜上1本の線で描いている。
【0003】
伝送路401は、電話機408に対向する図示しない対向側の電話機から送信されてくる音声信号x(n)の伝搬経路であり、回線エコーキャンセラ405並びに中継網406を介して2線/4線変換器407に接続されている。音声信号x(n)は、2線/4線変換器407を介して電話機408に到達し、また、これと同時に、2線/4線変換器407でのインピーダンス不整合のため、その一部が反射し、信号y(n)として2線伝送路403及び中継網406を介して、回線エコーキャンセラ405に与えられる。このエコー信号y(n)は、回線エコーキャンセラ405で消去されるが、一般には、完全消去することは不可能なので残留エコー信号e(n)が2線伝送路404を介して、対向側の電話機に戻っていく。
【0004】
次に、回線エコーキャンセラ405で一般的に実用されている代表的なエコー消去アルゴリズムである学習同定法について説明する。なお、これ以降、特に断らない限り、信号は、ある標本化レートで量子化された離散値系信号と見なし、時間は標本化周期を1単位時間とする離散時間nで表記することとする。
【0005】
エコー消去アルゴリズムにおいて、回線エコーキャンセラ405から見た電話機408側のエコー経路を線形シフト不変システムと見なし、具体的には、N次の有限インパルス応答型フィルタと見なす。当該フィルタのタップ係数をh(k)、また、回線エコーキャンセラ405が推定する当該フィルタの時刻nの時点でのタップ係数をg(k)、回線エコーキャンセラ405が推定するエコー信号をy’(n)と表すと、当該アルゴリズムは(1)式で表すことができる。
【数1】

【0006】
(1)式において、μはg(k)の収束速度を決定するパラメータであり、通常、0<μ<2の範囲に設定される。
【0007】
次に、回線エコーキャンセラ405とエコー発生点である2線/4線変換器407との間の往復伝搬距離は長く、また、中継網406の内部に配置されている各種ネットワーク装置による処理遅延により、回線エコーキャンセラ405と2線/4線変換器407との間の往復伝搬遅延時間Trtは十分に大きいものとする。ここで、Trtは、離散時間換算でNDLY単位時間に相当するものとし、この遅延をz関数による伝達関数HDLY(z)で表すと、(2)式に示すようになる。
【0008】
また、2線/4線変換器407を有限インパルス応答型フィルタと見なしたときのフィルタ次数をNHYB、当該フィルタのタップ係数をh(0)、h(1)、…、h(NHYB)とし、当該フィルタのz関数による伝達関数をHHYB(z)で表すと、(3)式に示すようになる。
【数2】

【0009】
従って、このときのエコー経路のz関数による伝達関数をHEP(z)と表すと、(4)式に示すようになる。(4)式で表されるエコー経路の伝達関数の入出力信号をそれぞれx(n),y(n)とし、これらのz変換をX(z)、Y(z)とすると、(5)式に示す関係が成立する。(5)式において、z−NDLYX(z)は時間領域において、入力信号x(n)をNDLY単位時間だけ遅延させることを意味する。実際、(5)式を逆z変換により時間領域に変換すると(6)式を得る。
【数3】

【0010】
図9は、HEP(z)を逆z変換した離散時間領域の信号hEP(n)の具体例について示した説明図である。
【0011】
EP(n)の時間的な振る舞いは上述した説明に従っており、(7)式で表される。
【数4】

【0012】
ここで、(1)式に従ってエコー推定を実施する回線エコーキャンセラ405の推定器のフィルタ次数Nとし、NDLY、NHYBとの関係を(8)式のように想定し、(6)式で表されるエコー信号y(n)と(1)式で表せるエコー推定信号y’(n)とを、(9)式に示すように比較する。
【数5】

【0013】
(9)式において、推定エコー信号y’(n)の右辺のx(n)の係数g(k)は、学習によりエコー信号y(n)の右辺のx(n)の係数h(k)に(10)式に示すように収束する。
【数6】

【0014】
(10)式は、次のことを示唆している。仮に、前もって、エコー経路の伝搬遅延時間が判明しているならば、回線エコーキャンセラ405はフィルタ係数g(0)〜g(NDLY−1)の算出を省略できると同時にg(0)〜g(NDLY−1)を格納するメモリ領域も節約することができる。実際のところ、2線/4線変換器407のインパルス応答時間は、非特許文献1による実測結果によると16msec以内となることが判明しているに対して、エコー経路の伝搬遅延時間はネットワークトポロジー、並びに、通信事業者の設備運用方針に依存することとなり、前もって知ることは不可能である。従って、この場合、エコー経路の遅延を推定できる機能を回線エコーキャンセラに具備することが望ましい。これにより、回線エコーキャンセラのエコー推定に関する処理量の低減を可能とし、とりわけ、通信事業者向けVoIP(Voice over IP)ゲートウェイ装置のように多数の音声呼を収容する装置にとっては大きなメリットとなる。
【0015】
[従来技術による伝搬遅延時間推定]
従来の、エコー経路の遅延時間を推定する方法としては以下のようなものがある。
【0016】
第1の従来方法は、特許文献1などに開示されているものであり、この方法は音声パケットの中に時刻情報を付加し、これにより、伝搬遅延時間を算出するものである。この方法について、IP(Internet Protocol)においては、非特許文献2によってさらに汎用的に往復伝搬遅延時間を算出するメカニズムが規定されている。これにより、回線エコーキャンセラに伝搬遅延時間推定器を具備しなくても良いことになる。
【0017】
第2の従来方法は、特許文献2、特許文献3、特許文献4などに開示されているものであり、伝搬遅延時間推定専用の機能を具備することなく、通常のエコー推定処理を実施する。つまり、エコー経路を線形シフト不変システムと見なし、上述した学習同定法などのアルゴリズムを利用してエコー経路の伝達関数を推定し、具体的には(10)式に示す伝達関数の推定係数g(k)を算出し、例えば、0≦k≦dの範囲でg(k)≒0に収束するならば、このdをエコー経路の伝搬遅延時間と見なす。純粋遅延と見なされた推定係数はエコー推定処理から排除することで、エコーキャンセラの処理量の低減を図るものである。
【0018】
第3の従来方法は、特許文献5、特許文献6に開示されているものであり、エコーキャンセラが電話機側に送信する音声信号と電話機側から反射されて戻ってくるエコー信号の相互相関を取り伝搬遅延時間を決定するものである。
【特許文献1】特開2001−333000号公報
【特許文献2】特開平9−55687号公報
【特許文献3】特表2001−501413号公報
【特許文献4】特開平7−283859号公報
【特許文献5】特開平7−303061号公報
【特許文献6】特表2005−528039号公報
【非特許文献1】ITU−T勧告G.168 Appendix II
【非特許文献2】IETF RFC 3550,RTP/RTCP
【発明の開示】
【発明が解決しようとする課題】
【0019】
第1の従来方法に関する非特許文献2の規定方法の適用条件は、エコーを発生する箇所と音声信号をパケット化する箇所の伝搬遅延時間が無視できる場合、かつ、エコー消去対象となる電話機側のインタフェースがIPパケットインタフェースである場合に限定される。しかしながら、エコーキャンセラとエコー反射点の間にIP網が介在することは極めて稀である。また、既存固定電話を時分割多重(TDM)インタフェースで収容することが一般的となっているVoIP装置に搭載する回線エコーキャンセラには、この方式の適用は不可能である。
【0020】
また、第2の従来方法は初期のエコー推定の学習においては処理量の低減化を図ることが一切できず、これは、多数の電話呼を収容するVoIPゲートウェイ装置仕様には耐えられない。理由としては、これらの通信装置においては、収容呼を全チャネル同時に通話状態に遷移させるまでに要する時間がサービス稼働率を決定する要因として重要視されているからである。よって、これらの通信装置に第2の従来方法を採用すると、エコー経路の往復伝搬遅延時間も含めたエコー推定を全チャネル同時に実施するだけの処理量を具備させるか、若しくは、それだけの処理量を確保できないときは収容呼を幾つかのグループに分け時系列的に何回かに分けてエコー推定を実施することとなる。いずれにしても、第2の従来方法は、多数の音声呼を収容する装置に実装するエコーキャンセラに適していない。
【0021】
第3の従来方法では、エコーキャンセラが電話機側に送信する音声信号と電話機側から反射されて戻ってくるエコー信号の相互相関を取ることが必要となっている。一般的に相互相関演算の処理量はエコー推定処理のそれとそれほど変わらず、また、特許文献5や特許文献6は相関演算の具体的な処理方法については言及していない。
【0022】
本発明は、以上の点に鑑みなされたものであり、わずかな処理量や小規模のハードウェアで効率よく伝搬遅延時間を推定することを目的としている。
【課題を解決するための手段】
【0023】
第1の本発明の伝搬遅延時間推定器は、(1)当初は同一信号であった第1の離散的時間信号と、第2の離散的時間信号との時間差である伝搬遅延時間を推定する伝搬遅延時間推定器において、(2)上記第1の離散的時間信号を、より少ない量子化ビット数で表現される第3の離散的時間信号に変換し、上記第2の離散的時間信号を、より少ない量子化ビット数で表現される第4の離散的時間信号に変換する量子化ビット数変換手段と、(3)上記第3の離散的時間信号及び上記第4の離散的時間信号を利用して、上記伝搬遅延時間の推定値を算出する遅延時間算出手段とを有することを特徴とする。
【0024】
第2の本発明の伝搬遅延時間推定プログラムは、(1)当初は同一信号であった第1の離散的時間信号と、第2の離散的時間信号との時間差である伝搬遅延時間を推定する伝搬遅延時間推定器において、(2)上記第1の離散的時間信号を、より少ない量子化ビット数で表現される第3の離散的時間信号に変換し、上記第2の離散的時間信号を、より少ない量子化ビット数で表現される第4の離散的時間信号に変換する量子化ビット数変換手段と、(3)上記第3の離散的時間信号及び上記第4の離散的時間信号を利用して、上記伝搬遅延時間の推定値を算出する遅延時間算出手段として機能させることを特徴とする。
【0025】
第3の本発明の伝搬遅延時間推定方法は、(1)当初は同一信号であった第1の離散的時間信号と、第2の離散的時間信号との時間差である伝搬遅延時間を推定する伝搬遅延時間推定方法において、(2)量子化ビット数変換手段、遅延時間算出手段を有し、(3)上記量子化ビット数変換手段は、上記第1の離散的時間信号を、より少ない量子化ビット数で表現される第3の離散的時間信号に変換し、上記第2の離散的時間信号を、より少ない量子化ビット数で表現される第4の離散的時間信号に変換し、(4)上記遅延時間算出手段は、上記第3の離散的時間信号及び上記第4の離散的時間信号を利用して、上記伝搬遅延時間の推定値を算出することを有することを特徴とする。
【発明の効果】
【0026】
本発明によれば、伝搬遅延時間の推定において、誤った時間を推定結果としてしまう頻度を低減することができる。
【発明を実施するための最良の形態】
【0027】
(A)主たる実施形態
以下、本発明による伝搬遅延時間推定器、プログラム及び方法の一実施形態を、図面を参照しながら詳述する。
【0028】
(A−1)実施形態の構成
以下では、この実施形態の伝搬遅延時間推定器が、回線エコーキャンセラと関連して電話通信システムに設けられているものとして説明する。
【0029】
図1は、この実施形態の伝搬遅延時間推定器の詳細構成及び電話通信システムにおける位置づけを示すブロック図である。図1において、実施形態に係る電話通信システム1は、伝搬遅延時間推定器10、エコーキャンセラ11及び擬似遅延器12を有している。
【0030】
なお、以降の説明において、図1において図示は省略しているが、エコー経路13に接続されている電話端末の話者を、「近端話者」という。これに対して、同様に図1において図示は省略しているが、近端話者の対向者を「遠端話者」というものとする。また、2線伝送路14を介してエコー経路13に送出される信号を「遠端信号」ともいう。また、近端側の2線伝送路15に流れ対向話者に送出される信号を「近端信号」というものとする。
【0031】
回線エコーキャンセラ11は、遠端信号が2線伝送路14を介してエコー経路13に送出され、エコー経路13において反射され、2線伝送路15を介してもどってきたエコーを、近端信号から除去するものである。回線エコーキャンセラ11は、後述する擬似遅延器12を介して与えられた遠端信号に基づいて、適応フィルタなどを用いて擬似エコーを生成し、生成した擬似エコーを用いてエコーを除去する。
【0032】
伝搬遅延時間推定器10は、遠端信号が、2線伝送路14を介してエコー経路13に送出され、エコーが反射されて、2線伝送路15を介して戻ってきた場合の時間差、すなわち、エコー経路13の伝搬遅延時間を推定する。そして、伝搬遅延時間推定器10は、推定した伝搬遅延時間に係る情報を、後述する擬似遅延器12に通知する。
【0033】
伝搬遅延時間推定器10は、復号化器111、112、絶対値化器121、122、低域ろ波器131、132、間引器141、142、レベル判別器151、152、一時記憶部161、162、最小自乗演算器170、有意性判定器180、判定保護器190を有している。また、伝搬遅延時間推定器10は、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)に、実施形態の伝搬遅延時間推定プログラム等をインストールすることにより構築しても良く、その場合でも機能的には図1により示すことができる。また、伝搬遅延時間推定器10は、全ての構成要素をハードウェアにより実現しても良いし、一部の構成要素を上述のようにプログラム(ソフトウェア)を用いて実現するようにしても良い。
【0034】
次に、復号化器111、112について説明する。
【0035】
復号化器112は、2線伝送路14を介して与えられる遠端信号を、ディジタル信号処理において頻繁に実施されることになる加減乗除演算に適用可能な線形符号に変換し、変換したものを絶対値化器122に与えるものである。復号化器111は、2線伝送路15を介して与えられる近端信号を、復号化器112と同様に、線形符号に変換し、変換したものを絶対値化器121に与えるものである。
【0036】
既存電話網では音声信号を伝送する際には、ITU−T勧告G.711に準拠したPCM(パルス符号変調)符号で伝送することが一般的である。復号化器111、112は、この符号化された音声信号を加減乗除演算が可能な線形符号、例えば、2の補数の固定小数点などに変換するものである。復号化器111、112における復号化処理としては、例えばITU−T勧告G.711のPCM符号は8ビット符号程度であるので、256ワードの変換テーブル、すなわち、変換ROMを用意し、PCM符号をアドレスとし、当該アドレスに線形符号を格納しておくことで、復号化処理は、単なる変換ROMのリードだけで完了することとなる。復号化アルゴリズムに従って計算して求めても良いが、今日のハードウェアの集積技術およびゲートあたりのコストからすれば、変換ROMを用意するほうが、低コストであると考えられる。
【0037】
また、復号化器111、112は、ITU−T勧告G.711以外の符号化の場合は、復号化処理は当該符号化で規定されているアルゴリズムに準拠した処理を実施しても良い。
【0038】
次に、絶対値化器121、122について説明する。
【0039】
絶対値化器121、122は、復号化器111、112から与えられた信号を絶対値化、すなわち、与えられた信号が負数のときに限り、大きさが等しく符号を反転させた正数に変換し、与えられた信号が正数の場合には特に変換は行わない。そして、絶対値化器121、122は、絶対値化した信号を、低域ろ波器131、132に与える。
【0040】
この実施形態では、遠端信号の包絡線信号と、近端信号の包絡線信号について、後述する最小自乗演算器170により伝搬遅延時間を算出する。音声信号の包絡線の簡易な算出法としては、音声信号の局所的極大値を抽出してこれらを接続することで得られる。これは、音声信号の絶対値を取り、低域ろ波器を通すことで実現されるものであるため、伝搬遅延時間推定器10では、包絡線を抽出するために絶対値化器121、122と、後述する低域ろ波器131、132を備えている。
【0041】
次に、低域ろ波器131、132について説明する。
【0042】
低域ろ波器131、132は、絶対値化器121、122から与えられた絶対値化された信号について、信号の高域周波数成分を遮断し、間引器141、142に与える。
【0043】
低域ろ波器131、132は、予め設定された遮断周波数よりも低い信号は通過させ、その周波数よりも高い信号は遮断する。上述した絶対値化器121、122と共に包絡線信号を抽出するために具備されているものである。
【0044】
次に、間引器141、142について説明する。
【0045】
間引器141、142は、低域ろ波器131、132から与えられた信号の一部を間引きし、標本化周波数(標本化速度)を低下させた信号を生成して、レベル判別器151、152に与える。
【0046】
包絡線信号は元の信号と比較して、高域周波数成分が除去されているため、標本化周波数が実効的に低くなっており、間引器141、142により、幾つかの標本毎に1つの標本に間引くことができる。一般的に、音声の包絡線信号の帯域は100Hz程度であり、実効的な標本化周波数は低減しているので、複数の包絡線信号を1つの包絡線信号に間引くことが可能となる。例えば、電話の音声信号の標本化周波数は一般的に8kHz程度であり、包絡線信号の実効標本化周波数を最大200Hzと想定すると、40個の包絡線信号を1つの包絡線信号に間引くことが可能となる。以下の説明において、間引器141、142によって間引きされた後のサンプル周期(サンプル時間)を「M」と表すものとする。
【0047】
次に、レベル判別器151、152について説明する。
【0048】
レベル判別器151、152は、包絡線信号が設定された閾値より大なる時を正、小なる時を負と判別する。図2では閾値を零に近い値に設定し、無音に近い状態のとき負と判別する例を示す。
【0049】
図2は、レベル判別器151、152において、単純に閾値を基準としてレベル判定をする場合の例について示した説明図である。
【0050】
図2に示すように、レベル判別器151、152では、音声信号が、閾値(以下、「TH」という)を基準として正又は負と判定しても良い。例えば、音声信号が、TH以上を正、TH未満を負とするようにしても良い。ここで、例えば、負値から正値、もしくは、正値から負値にレベル変化する際に、参照する閾値を変化させるといった、閾値にヒステリシス特性を持たせたレベルの判定を実施してもよい。なお、遠端信号と近端信号とで適用する閾値THの値は異なるものとしても良い。
【0051】
図3は、レベル判別器151、152において、ヒステリシス特性を用いたレベル判定を行う例について示した説明図である。
【0052】
例えば、図3に示すように、信号レベルが−TH未満の音声信号が+TH以上に遷移してから−TH以下に遷移するまでの間を正、または、信号レベルが+TH超過の音声信号が−TH以下に遷移してから+TH以上に遷移するまでの間を負とするようにしても良い。
【0053】
次に、一時記憶部161、162について説明する。
【0054】
一時記憶部161、162は、レベル判別器151、152から与えられた信号に係る情報を、一定時間記憶し、記憶した情報(信号)を、それぞれ最小自乗演算器170に与える。
【0055】
図4は、近端側の一時記憶部161の構成例について示した説明図である。
【0056】
一時記憶部161は、図4に示すように、レベル判別器151の出力をMサンプルごとにL個、すなわち、LMサンプル時間のサンプル値を保持するものであり、シフトレジスタ、や、循環キューを用いて構築しても良い。なお、Mサンプル時間は、伝搬遅延時間推定器10における信号の時間分解能に相当する。なお、図4において、S(n)は、時刻nからNサンプル時間前までの近端信号のサンプル値を表している。
【0057】
図5は、一時記憶部161の構成を図4に、一時記憶部161に与えられるレベル判別器151によるレベル判別結果の時間関係について示した説明図である。
【0058】
図6は、遠端側の一時記憶部162の構成例について示した説明図である。
【0059】
一時記憶部162は、レベル判別器152の出力をMサンプルごとに(L+K−1)個、つまり、(L+K−1)Mサンプル時間保持するシフトレジスタ、もしくは、循環キューである。本記憶素子の構成を図6に示す。なお、図6において、R(n)は、時刻nからNサンプル時間前までの遠端信号のサンプル値を表している。
【0060】
次に、最小自乗演算器170について説明する。
【0061】
最小自乗演算器170は、一時記憶部161に一定時間記憶されている近端信号の包絡線信号と、一時記憶部162に一定時間記憶されている遠端信号の包絡線信号との時間差(伝搬遅延時間)の推定値を算出し、算出した結果を有意性判定器180に与えるものである。最小自乗演算器170は、例えば、レベル判別器151、152によるレベル判別結果の自乗差を、時間差を変数にして算出する。この場合、両者のレベル判別結果の自乗差が最小(以下、「最小自乗差」という)となるときの時間差が、遅延時間推定器から見たときのエコー経路の伝搬遅延時間に相当する。
【0062】
以下、最小自乗演算器170における時間差(伝搬遅延時間)の推定値の算出方法の具体例について説明する。なお、以降の説明では、時間は離散時間nで表記し、サンプル時間Mを1単位時間とする。
【0063】
S(n)とR(n)の時間差τをパラメータとして、時刻nにおけるS(n)とR(n)との自乗差D(n,τ)を計算すると、以下の式(11)のようになる。
【数7】

【0064】
以下の(12)式に示すように、時刻nにおいて「D(n,τ),0≦τ≦K−1」を最小化するτ(以下、「τmin」という)が、時間差(伝搬遅延時間)に対応する。このように、最小自乗演算器170では、例えば、以下の式(11)のように、時間差(τ)ごとにS(n)とR(n)の差分に係る値を算出し、その算出結果に基づいて時間差(伝搬遅延時間)を推定するようにしても良い。
【数8】

【0065】
nが更新されるたびに「D(n,τ),0≦τ≦K−1」を計算することになるが、ここでは、D(n,τ)を効率よく算出することを考える。時刻n+1でのD(n,τ)は、上記の(11)式と同様に下記の(13)式のように表現できる。
【数9】

【0066】
なお、S(n)とR(n)には、レベル判別器151、152の結果、すなわち正か負かの判定結果が保持される、正の判定結果を1、負の判定結果を0とした場合、上記の(11)を以下の(14)式、上記の(13)式を以下の(15)式のように変形することが可能である。
【数10】

【0067】
しかしながら、(14)式と(15)式の類和Σには多くの共通項が存在する。異なる項だけに着目して上記の(15)式を表現しなおすと、以下の(16)式のようになる。これにより、N回の差分の自乗和演算を加算のみで実現することが可能になる。最小自乗演算器170では、τminの算出において、以下の(16)式を用いるようにしても良い。
【数11】

【0068】
次に、有意性判定器180について説明する。
【0069】
有意性判定器180は、最小自乗演算器170から演算の結果が与えられると、その演算の有意性を判定するものである。演算の有意性を低下させる要因には、以下の第1〜第4の要因が想定される。有意性判定器180は、以下の第1〜第4の要因に係る有意性検査の全部に合格したときに、最小自乗演算器170による演算結果を有意とみなし、このときのエコー経路13の伝搬遅延時間に対応するτminを判定保護器190に与える。また、有意性判定器180は、以下の第1〜第4の要因に係る有意性検査以外に他の検査を行うようにしても良い。なお、第1の実施形態では、有意性判定器180は、第1〜第4の要因に係る有意性検査の全部に合格したときに、最小自乗演算器170による演算結果を有意とみなすものとするが、以下の第1〜第4の要因に係る有意性検査の一部に合格したときに演算結果を有意とみなすようにしても良い。
【0070】
有意性判定器180において判定される第1の要因としては、遠端話者の音声包絡線信号電力(遠端信号の包絡線信号電力)がある。図1の2線伝送路14を介して伝搬遅延時間推定器10に入力される遠端話者の音声包絡線信号の電力つまり、低域ろ波器132の出力である遠端信号の包絡線信号の値が小さいときは、遠端話者包絡線信号の信号対雑音比(SN比)が悪くなり、最小自乗演算器170の演算結果の信頼性が劣化するので、このときの演算結果は無効化される必要がある。図1においては、低域ろ波器132の出力について閾値を設けて監視するものとする。
【0071】
有意性判定器180において判定される第2の要因としては、ダブルトーク状態がある。
【0072】
ダブルトーク状態とは、遠端話者と近端話者が同時に話中状態にあることをいう。当然のことながら、この場合、エコー経路13の遅延時間を算出するための演算は意味をなさないので、最小自乗演算器170の演算結果は無効化される必要がある。ダブルトーク状態の検出は、例えば、近端側の低域ろ波器131の出力(DC(S))と、遠端側の低域ろ波器132の出力(DC(R))の比率に適当な閾値を設けて判定しても良い。例えば、ITU−T勧告G.168ではエコー経路のエコー反射減衰量は6dBm以上であることを想定しているので、音声の包絡線信号にもこの関係が適用できると想定すると、この場合「DC(S)>(1/2)・DC(R)」が成立するならば、ダブルトーク状態とみなすことができる。なお、この間値として実際に採用する値に関しては、各通信事業者が加入者回路で規定しているエコー反射減衰量に応じた値に設定しても良い。
【0073】
有意性判定器180において判定される第3の要因としては、最小自乗演算器170が算出する最小の自乗差がある。
【0074】
最小自乗演算器170は時間nが更新される毎に、上記の(16)式などを0≦k≦Mについて演算し、M個のD(n,τ)を、有意性判定器180に与える。この中からD(n,τ)を最小化するτの値であるτminが求めようとしている遅延時間に相当する。ただし、D(n,τ)が閾値を超過してしまう場合は、遠端信号と近端信号との相関性が不十分とみなして最小自乗演算器170の演算結果は廃棄しても良い。
【0075】
有意性判定器180において判定される第4の要因としては、包絡線信号の周期性がある。遠端側のレベル判別器152において、Mサンプルごとのレベル判定結果をR(n)、R(n−1)、…、R(n−L+n)とし、このレベル判定結果の列において、正、負、正、負、…といった規則性を持った変動がある場合、これは繰り返し波形、すなわち狭帯域信号であるとみなすことができる。狭帯域の判定はR(n)の分散を算出し、この分散がある閾値よりも大きい場合に、狭帯域信号が発生していると判定しても良い。この分散は以下の(17)式により求めることができる。なお、(17)式において、R(n)の平均値はMEAN_R(n)である。
【0076】
MEN_R(n+1)=
(1・L){MEAN_R(n)−R(n−(L−1))+R(n+1)}…(17)
次に、判定保護器190について説明する。
【0077】
電話網の回線エコーキャンセラに採用される伝搬遅延時間推定器は、通信中の遠端信号を試験信号として用いて遅延時間を推定しなければならない。このため、話者信号自身の非定常性、話者周辺の環境騒音、ダブルトークなどの影響により、上述した有意性判定器180だけでは完璧な有意性判定を下すことは不可能である。このため、伝搬遅延時間推定器10では、判定保護器190を設けて、有意性判定器180から与えられたτminの統計的信頼性の評価を行う。判定保護器190では、実用的で簡易な統計的信頼性評価として、例えば、多数決論理を適用しても良い。
【0078】
図7は、判定保護器190において、統計的信頼性の評価を多数決論理に基づいて行う場合の第1の方式、及び、第2の方式の状態遷移について示した説明図である。
【0079】
図7(a)は、判定保護器190において、統計的信頼性の評価を多数決論理に基づいて行う第1の方式における状態遷移の例について示した説明図である。
【0080】
図7(a)の状態遷移図において、まず最初に、各種変数を初期化した後に、有意性判定器180から遅延時間τminが報告されるのを待つ(S100)。そして、有意性判定器180からτminが報告されると、これを変数Delayに格納し、次の報告を待つ(S101)。
【0081】
上述のステップS101の状態において、有意性判定器180からτminが報告されると、Delayとτminの値を比較し、同一なら次のステップ(後述するステップS102)に遷移する。なお、図7(a)では、Delay=τminが成立し、次のステップへ進む場合には「Yes」と表記している。
【0082】
上述のステップS101の状態において、有意性判定器180から報告されたτminとDelayの値が異なっているときは、一つ前のステップ(上述のステップS100)に戻って動作する。なお、図7(a)では、Delay=τminが成立せず、一つ前のステップへ戻る場合には「No」と表記している。
【0083】
以下同様に処理を進めていき、ステップSm(「m1」は、予め設定された所定の値)に到達した時点で、統計的信頼性は得られたと想定し、擬似遅延器12にエコー経路までの推定伝搬遅延時間を報告すると同時に、上述のステップS100に戻って動作し、以後、上述した処理を繰り返す。
【0084】
図7(b)は、判定保護器190において、統計的信頼性の評価を多数決論理に基づいて行う第2の方式における状態遷移の例について示した説明図である。
【0085】
図7(b)において、判定保護器190は、まず各種変数を初期化した後に、有意性判定器180から遅延時間τminが報告されるのを待つ(S200)。そして、有意性判定器180からτminが報告されるとこれを変数Delayに格納し、次の報告を待つ(S201)。
【0086】
上述のステップS201の状態において、有意性判定器180からτminが報告されると、Delayとτminの値を比較し、同−なら次のステップ(後述するステップS202)に遷移する。なお、図7(b)では、Delay=τminが成立し、次のステップへ進む場合には「Yes」と表記している。
【0087】
上述のステップS201の状態において、有意性判定器180から報告されたτminとDelayの値が異なっているときは、最初のステップ(上述のステップS200)に戻って動作する。なお、図7(b)では、Delay=τminが成立せず、最初のステップへ戻る場合には「No」と表記している。
【0088】
以下同様に処理を進めていき、ステップSm(「m2」は、予め設定された所定の値)に到達した時点で、統計的信頼性は得られたと想定し、擬似遅延器12にエコー経路までの推定伝搬遅延時間を報告すると同時に、上述のステップS200から動作し、以後、上述した処理を繰り返す。
【0089】
なお、上述の図7(a)及び、図7(b)において示した2種類の保護論理において、Yesの条件は、Delay=τmin、すなわち、Delayと今回報告されたτminが同一であることにしたが、同一でない場合でも、差異が閾値以下であれば同一とみなすようにしてもよい。例えば、実際の遅延時間が、τminと、τminに1を加算した値(τmin+1)の中間の値であるときは、有意性判定器180が、判定保護器190に報告する推定遅延時間はτminの値とτmin+1の値が、例えば50%の頻度で現われる可能性がある。この場合、Yesの条件をDelay≦τmin≦Delay+1としてもよい。
【0090】
次に、擬似遅延器12について説明する。擬似遅延器12は、2線伝送路14を介してエコー経路13に送出されてから、エコー経路13を経由して、2線伝送路15を介して回線エコーキャンセラ11に戻ってくるまでに要する伝搬遅延時間に相当する遅延時間を遠端信号に与えたあとで、その信号を回線エコーキャンセラ11に提供するものである。
【0091】
次に、擬似遅延器12について説明する。擬似遅延器12は、既存のシフトレジスタを用いて実現してもよいし、汎用メモリ空間上に循環キューを作成して論理シフトレジスタにより実現してもよい。擬似遅延器12において設定される遅延量は、伝搬遅延時間推定器10から与えられる推定値に従うものとする。ただし、伝搬遅延時間推定器10の推定値には時間分解能、すなわち、包絡線信号の標本化間隔に相当する誤差を含むので、当該擬似遅延器で作成する遅延時間は、伝搬遅延時間推定器10が報告する値よりも少なくとも1単位時間分解能だけ短い遅延時間に設定するようにしても良い。
【0092】
(A−2)実施形態の動作
次に、以上のような構成を有する、この実施形態の伝搬遅延時間推定器の動作(実施形態の伝搬遅延時間推定方法)及び第1の実施形態に係る電話通信システムの全体の動作を説明する。
【0093】
まず、復号化器111に2線伝送路14を介して、遠端信号が与えられると、加減乗除演算に適用可能な線形符号に変換され、変換されたものを絶対値化器121に与える。一方、復号化器112には、2線伝送路15を介してエコーが与えられ、エコーは同様に線形符号に変換され、絶対値化器122に与えられる。
【0094】
復号化器111、112から変換された信号が与えられると、絶対値化器121、122では、その信号が絶対値化され、低域ろ波器131、132に与えられる。
【0095】
次に、絶対値化器121、122から絶対値化された信号が与えられると、低域ろ波器131、132では、与えられ信号の高域周波数成分が遮断され、間引器141、142に与えられる。
【0096】
低域ろ波器131、132から、低域周波数成分が遮断された信号が、間引器141、142に与えられると、間引器141、142では、その与えられた信号の一部が間引きされ、標本化周波数が低下された信号が生成され、レベル判別器151、152に与えられる。
【0097】
間引器141、142から標本化周波数が低下された信号が与えられると、レベル判別器151、152では、レベル判定が行われ、正又は負の判定結果が、一時記憶部161、162に与えられる。
【0098】
間引器141、142から標本化周波数が低下された信号が与えられると、一時記憶部161、162では、その信号に係る情報が、一定時間記憶され、記憶された情報(信号)が最小自乗演算器170に与えられる。
【0099】
一時記憶部161、162に記憶された情報(信号)が、最小自乗演算器170に与えられると、一時記憶部161から与えられた近端信号の包絡線信号と、一時記憶部162から与えられた遠端信号の包絡線信号との自乗差が、上述の(16)式などを用いて時間差を変数にして算出され、算出された自乗差がそれぞれ有意性判定器180に与えられる。
【0100】
最小自乗演算器170において算出された相互相関係数が、有意性判定器180に与えられると、有意性判定器180では、自乗差が最小となるときの時間差(τmin)について、有意性の検査が上述の第1〜第4の要因について行われ、有意と判定されたτminのみが、判定保護器190に与えられる。
【0101】
有意性判定器180からτminが与えられると、判定保護器190では、そのτminの統計的信頼性の評価が上述の図7に示すフローチャート(多数決論理)に基づいて行われ、統計的信頼性を有すると判定された場合のみ、そのτminが、擬似遅延器12に通知される。
【0102】
そして、擬似遅延器12では、伝搬遅延時間推定器10(判定保護器190)から報告されたτminにより示される時間に相当する遅延時間が遠端信号に与えられ、その信号が回線エコーキャンセラ11に提供される。そして、回線エコーキャンセラ11では、擬似遅延器12を介して与えられた遠端信号に基づいて、適応フィルタなどを用いて擬似エコーが生成され、生成された擬似エコーを用いてエコーが除去される。
【0103】
(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
【0104】
(A−1−1)この実施形態では、音声信号からその振る舞いが元の音声信号に対して緩慢な包路線信号を抽出し、間引器141、142により信号を間引きすることで、標本化速度を包路線信号を抽出する前の信号よりも低減することができ、エコー経路の伝搬遅延時間推定に要する相関演算の処理量とメモリ容量を、低減することができる。例えば、標本化周波数が8kHzの電話の音声信号の包絡線信号の実効標本化周波数を、最大200Hzと想定すると、40個の包絡線信号を1つの包絡線信号に間引くことが可能となる。このように、この実施形態では、音声信号から包絡線信号を抽出し間引くことにより、標本化速度を音声信号の数十分の1程度に低減し、エコー経路の伝搬遅延時間推定に要する相関演算の処理量とメモリ容量を音声信号自身を使用して実施する場合と比較して、数十分の1程度に低減することができる。
【0105】
(A−1−2)この実施形態では、音声信号の包絡線信号レベルに基づいた伝搬遅延時間推定を実施している。包絡線信号レベルによる伝搬遅延時間推定は、例えば、上記の式(16)などに示すように、絶対値演算と加算により算出できるため、平方根処理や除算を実施する相互相関演算と比較して演算量の低減が可能である。
【0106】
(A−1−3)レベル判別器151、152により、音声の包絡線信号のレベル判別結果を計算するため、信号のエネルギーを正と負の2値に限定することができる。よって、最小自乗演算器170では、正規化処理を省略して、2つの音声波形の相関性を求めることが可能である。また、2値符号に変換したことにより、最小自乗演算器170では、2値の符号に係る演算を行えば良いので、2値符号に変換前の信号について演算を行う場合と比較して、演算の処理量とメモリ容量を低減することができる。
【0107】
(A−1−4)有意性判定器180では、上述第1〜第4の要因に係る有意性検査の全部又は一部に合格したときに、最小自乗演算器170による演算結果を有意とみなし、このときのエコー経路13の伝搬遅延時間に対応するτminを判定保護器190に与えているため、誤動作により、誤った時間を遅延時間として推定する頻度の低減を図ることができる。例えば、近端話者包絡線電力と遠端話者包絡線電力を監視することで、遠端話者のみが話中状態にあり、かつ、そのエコーが戻ってきているときのみ相関演算を有意とみなすことがきる。また、近端話者包絡線電力と遠端話者包絡線電力を監視するだけではその検出が不完全となるダブルトーク状態での誤動作を回避するため、レベル判別結果の最小自乗和に閾値を設け、当該閾値を超過する最小自乗和のみを有意とみなす。さらに、レベル判別器151、152によるレベル判別結果の分散を検出する方法を設け、レベル判別結果の分散が閾値より大きい場合には最小自乗演算器170による演算結果を無効化することで、例えば、音声包絡線信号への空調設備などの低周波雑音の重畳に対する誤動作を防止している。
【0108】
(A−1−5)有意性判定器180による短時間的な有意性評価だけでは防御しきれない誤動作に対して、判定保護器190において、有意性評価に長時間的な多数決論理の保護をとることで、推定結果の信頼性を高めている。
【0109】
(A−1−6)エコー経路までの伝搬遅延時間の推定を通話中も実施することで、転送サービスなどのように、通話中にエコー経路が別のエコー経路に切り替わっても、新しいエコ一経路までの伝搬遅延時間の推定を可能とし、擬似遅延器での遅延量を再設定することで、回線エコーキヤンセラでのエコー消去動作を維持可能とし、その結果、通話品質の劣化を最小化することができる。
【0110】
(B)他の実施形態
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
【0111】
(B−1)上記の実施形態では、本発明の伝搬遅延時間推定器を、電話回線における回線エコーを消去するエコーキャンセラに適用した例について説明したが、音響エコー(例えば、会議システムなどでスピーカとマイク間の音響結合で発生するエコー)を消去するエコーキャンセラに適用しても良い。
【0112】
(B−2)上記の実施形態では、伝搬遅延時間推定器を、エコーキャンセラに適用した例について説明したが、探査信号を発射し目標物で反射されて戻ってくるまでの伝搬遅延時間を測定するシステムなどにも適用可能である。例えばこのようなシステムには、レーダやソナーを使用した遠隔探査システムなどがある。
【0113】
(B−3)上記の実施形態においては、伝搬遅延時間推定器とエコーキャンセラは、別の装置として説明しているが、伝搬遅延時間推定器をエコーキャンセラ自体に搭載するようにしても良い。
【0114】
(B−4)上記の実施形態においては、絶対値化器121、122、低域ろ波器131、132などを用いて、遠端信号及び近端信号の包絡線信号を生成し、その包絡線信号について、レベル判別器によるレベル判別を行った結果について、最小自乗演算器170による演算や、有意性判定器180における有意性判定などを行っているが、包絡線信号ではなく元の信号そのままについて、レベル判別器151、152によるレベル判別を行った結果を相関係数の算出や有意性判定に用いても良い。
【0115】
例えば、上述の図1に示す絶対値化器121、122、低域ろ波器131、132、間引器141、142を省き、復号化器111、112から出力された信号を、そのままレベル判別器151、152に入力するようにしても良い。
【0116】
また、上記の実施形態においては、最小自乗演算器170の演算結果について、有意性判定器180による有意性判定や、判定保護器190による判定保護などを行っているが、一方の構成を省略して、伝搬遅延時間推定器10における推定結果として出力するようにしても良いし、両方を省略して、最小自乗演算器170の演算結果をそのまま伝搬遅延時間推定器10における推定結果として出力するようにしても良い。
【0117】
(B−5)上記の各実施形態においては、絶対値化器や低域ろ波器などを用いて、遠端信号及び近端信号の包絡線信号を抽出することにより、より低い周波数帯域の信号を生成しているが、より低い周波数帯域の信号を生成する構成は、包絡線信号を抽出することに限定されないものである。例えば、帯域通過フィルタを用いて、遠端信号及び近端信号の一部の周波数帯域を抽出することで、より低い周波数帯域の信号を生成し、間引器により間引きするようにしても良い。
【0118】
(B−6)上記の実施形態において、レベル判別器151、152では、上述の図2、図3に示すように、入力された信号の信号値を、閾値を基準として2値符号、すなわち、量子化ビットが1ビットで表される符号に変換しているが、例えば、3値以上の符号(量子化ビットが2ビット以上)であっても良く、入力された信号よりも少ない量子化ビット数で表現されるものであれば、変換の内容は限定されないものである。
【0119】
例えば、0、1、2、3のいずれかで表される4値の符号(量子化ビット数が2ビット)に変換する場合には、閾値を3つ設け(「第1の閾値<第2の閾値<第3の閾値」の関係であるものとする)、入力された信号値が、第1の閾値未満であれば「0」、第1の閾値以上第2の閾値未満であれば「1」、第2の閾値以上第3の閾値未満であれば「2」、第3の閾値以上であれば「3」というように変換するようにしても良い。また、これらの複数の閾値の、全部又は一部について上述の図3に示すようなヒステリシス特性を持たせるようにしても良い。
【0120】
(B−7)上記の実施形態における伝搬遅延時間推定は、最小自乗演算器170を用いて、例えば、上記の(16)式などに示すように、絶対値演算と加算により算出しているが、例えば、相互相関係数を、時間差を変数にして算出し、相互相関係数を最大とするときの時間差を、伝搬遅延時間の推定値として、有意性判定器180に与えても良く、伝搬遅延時間の推定値を算出する演算方法は限定されないものである。
【図面の簡単な説明】
【0121】
【図1】実施形態に係る伝搬遅延時間推定器の詳細構成及び電話通信システムにおける位置づけを示すブロック図である。
【図2】実施形態に係るレベル判別器において、単純に閾値を基準としてレベル判定をする場合の例について示した説明図である。
【図3】実施形態に係るレベル判別器において、ヒステリシス特性を用いたレベル判定を行う例について示した説明図である。
【図4】実施形態に係る近端側の一時記憶部の構成例について示した説明図である。
【図5】実施形態に係る一時記憶部に与えられるレベル判別器によるレベル判別結果の時間関係を示した説明図である。
【図6】実施形態に係る遠端側の一時記憶部の構成例について示した説明図である。
【図7】実施形態に係る判定保護器において、統計的信頼性の評価を多数決論理に基づいて行う場合の第1の方式、及び、第2の方式の状態遷移について示した説明図である。
【図8】従来の、エコー発生点までの伝搬遅延時間が大きな回線エコーキャンセラの配備例を示したブロック図である。
【図9】従来の、エコー反射点までの伝搬遅延時間が大きな回線エコーキャンセラにおけるインパルス応答の例について示した説明図である。
【符号の説明】
【0122】
1…電話通信システム、10…伝搬遅延時間推定器、111、112…復号化器、121、122…、絶対値化器、131、132…低域ろ波器、141、142…間引器、151、152…レベル判別器、161、162…一時記憶部、170…最小自乗演算器、180…有意性判定器、190…判定保護器、11…回線エコーキャンセラ、12…擬似遅延器、13…エコー経路、15、14…2線伝送路。

【特許請求の範囲】
【請求項1】
当初は同一信号であった第1の離散的時間信号と、第2の離散的時間信号との時間差である伝搬遅延時間を推定する伝搬遅延時間推定器において、
上記第1の離散的時間信号を、より少ない量子化ビット数で表現される第3の離散的時間信号に変換し、上記第2の離散的時間信号を、より少ない量子化ビット数で表現される第4の離散的時間信号に変換する量子化ビット数変換手段と、
上記第3の離散的時間信号及び上記第4の離散的時間信号を利用して、上記伝搬遅延時間の推定値を算出する遅延時間算出手段と
を有することを特徴とする伝搬遅延時間推定器。
【請求項2】
上記量子化ビット数変換手段は、上記第1の離散的時間信号の各信号値を、第1の閾値との比較結果に基づいて、第1の値又は第2の値のいずれかに置き換えることにより、上記第3の離散的時間信号に変換し、上記第2の離散的時間信号の各信号値を、第2の閾値との比較結果に基づいて、第1の値又は第2の値のいずれかに置き換えることにより、上記第4の離散的時間信号に変換することを特徴とする請求項1に記載の伝搬遅延時間推定器。
【請求項3】
上記第1の閾値は、上記第1の離散的時間信号の変化に対してヒステリシス特性を持ち、
上記第2の閾値は、上記第2の離散的時間信号の変化に対してヒステリシス特性を持つ
ことを特徴とする請求項2に記載の伝搬遅延時間推定器。
【請求項4】
上記遅延時間算出手段は、上記第3の離散的時間信号と上記第4の離散的時間信号の自乗差が最小となる時間差を、上記伝搬遅延時間の推定値として算出することを特徴とする請求項1〜3のいずれかに記載の伝搬遅延時間推定器。
【請求項5】
当初は同一信号であった第1の離散的時間信号と、第2の離散的時間信号との時間差である伝搬遅延時間を推定する伝搬遅延時間推定器に搭載されたコンピュータを、
上記第1の離散的時間信号を、より少ない量子化ビット数で表現される第3の離散的時間信号に変換し、上記第2の離散的時間信号を、より少ない量子化ビット数で表現される第4の離散的時間信号に変換する量子化ビット数変換手段と、
上記第3の離散的時間信号及び上記第4の離散的時間信号を利用して、上記伝搬遅延時間の推定値を算出する遅延時間算出手段と
して機能させることを特徴とする伝搬遅延時間推定プログラム。
【請求項6】
当初は同一信号であった第1の離散的時間信号と、第2の離散的時間信号との時間差である伝搬遅延時間を推定する伝搬遅延時間推定方法において、
量子化ビット数変換手段、遅延時間算出手段を有し、
上記量子化ビット数変換手段は、上記第1の離散的時間信号を、より少ない量子化ビット数で表現される第3の離散的時間信号に変換し、上記第2の離散的時間信号を、より少ない量子化ビット数で表現される第4の離散的時間信号に変換し、
上記遅延時間算出手段は、上記第3の離散的時間信号及び上記第4の離散的時間信号を利用して、上記伝搬遅延時間の推定値を算出する
ことを有することを特徴とする伝搬遅延時間推定方法。
【請求項7】
請求項1〜4のいずれかに記載の伝搬遅延時間推定器を搭載し、
上記伝搬遅延時間推定器を用いて、エコー経路に送出する信号とエコーとの時間差である伝搬遅延時間を推定し、推定した伝搬遅延時間を利用して、エコーを消去する
ことを特徴とするエコーキャンセラ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2010−118793(P2010−118793A)
【公開日】平成22年5月27日(2010.5.27)
【国際特許分類】
【出願番号】特願2008−289213(P2008−289213)
【出願日】平成20年11月11日(2008.11.11)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【出願人】(593065844)株式会社沖コムテック (127)
【Fターム(参考)】