説明

複数感知の音声強調のための方法および機器

【課題】気導マイクロホン以外のセンサから受信した補助センサ信号を利用して、クリーンな音声値を推定する方法およびシステムを提供すること。
【解決手段】クリーンな音声値の推定では、補助センサ信号のみ、または補助センサ信号を気導マイクロホン信号とともに使用する。クリーンな音声値は、気導マイクロホンから収集された雑音のあるトレーニング用データによってトレーニングされたモデルを使わずに推定される。一実施形態では、フィルタを形成するために補助センサ信号から形成されたベクトルに補正ベクトルが加えられ、このフィルタは、気導マイクロホン信号に適用されて、クリーンな音声推定値を作成する。他の実施形態では、音声信号のピッチが、補助センサ信号から判定され、気導マイクロホン信号を分解するのに用いられる。分解された信号は次いで、クリーン信号推定値を決定するのに用いられる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ノイズリダクションに関する。特に、本発明は、音声信号からの雑音の除去に関する。
【背景技術】
【0002】
音声認識および音声伝送に共通の問題は、加法性雑音による、音声信号の汚染である。特に、別の話者の音声による汚染は、検出および/または補正するのが困難であることがわかっている。
【0003】
雑音を除去する一技術では、様々な条件下で収集された、ある1組の雑音のトレーニング信号(training signals)を用いて、雑音のモデル化を試みる。こうしたトレーニング信号は、復号されまたは伝送されるテスト信号の前に受信され、トレーニング目的でのみ使用される。このようなシステムは、雑音を考慮に入れるモデルの構築を試みるが、こうしたモデルは、トレーニング信号の雑音条件がテスト信号の雑音条件と一致する場合にのみ効果的である。可能な多数の雑音、および雑音のおそらく無限の組合せのため、雑音モデルを、あらゆるテスト条件を扱うことができるトレーニング信号から構築することは非常に難しい。
【0004】
雑音を除去する別の技術は、テスト信号中の雑音を推定し、次いで、その雑音を雑音のある音声信号から取り去ることである。典型的には、このようなシステムは、テスト信号に先行するフレームから雑音を推定する。したがって、雑音が時間とともに変化している場合、現在のフレームに対する雑音の推定値は不正確になる。
【0005】
音声信号中の雑音を推定する、従来技術の1つのシステムは、人間の音声の高調波を利用する。人間の音声の高調波は、周波数スペクトル中にピークを生じさせる。こうしたピーク間のヌル(nulls)を識別することにより、こうしたシステムは、雑音のスペクトルを識別する。このスペクトルは次いで、雑音のある音声信号のスペクトルから減算されて、クリーンな音声信号を提供する。
【0006】
音声の高調波は、音声符号化において、デジタル通信パスを介した伝送のために音声をエンコードするとき、送信しなければならないデータ量を削減するのにも利用されている。このようなシステムは、音声信号を高調波成分およびランダム成分に分離することを試みる。各コンポーネントは次いで、伝送のために別個にエンコードされる。あるシステムでは、特に、分解を実行するための音声信号に正弦波の和というモデルが適合される、高調波+雑音モデルを利用した。
【0007】
音声符号化において、分解は、入力された、雑音のある音声信号を正確に表す音声信号のパラメータ化を見つけるために行われる。分解は、ノイズリダクション性能をもたない。
【0008】
最近、骨伝導マイクロホンなどの補助センサおよび気導マイクロホンの組合せを用いることによって雑音の除去を試みるシステムが開発された。このシステムは、3つのトレーニング用チャネル、すなわち雑音のある補助センサトレーニング信号、雑音のある気導マイクロホントレーニング信号、およびクリーンな気導マイクロホントレーニング信号を用いてトレーニングされる。信号はそれぞれ、特徴領域に変換される。雑音のある補助センサ信号および雑音のある気導マイクロホン信号に関する特徴は、雑音のある信号を表す単一のベクトルに結合される。クリーンな気導マイクロホン信号に関する特徴は、単一のクリーンなベクトルを形成する。こうしたベクトルは次いで、雑音のあるベクトルとクリーンなベクトルの間のマッピングをトレーニングするのに用いられる。一度トレーニングされると、マッピングは、雑音のある補助センサテスト信号および雑音のある気導マイクロホンテスト信号の結合から形成された、雑音のあるベクトルに適用される。このマッピングは、クリーンな信号ベクトルを生じる。
【0009】
マッピングは、トレーニング信号の雑音条件に合わせて設計されるので、テスト信号の雑音条件がトレーニング信号の雑音条件と一致しないとき、このシステムは全く最適ではない。
【発明の概要】
【0010】
一方法およびシステムでは、気導マイクロホン以外のセンサから受信した補助センサ信号を利用して、クリーンな音声値を推定する。クリーンな音声値は、気導マイクロホンから収集された雑音のあるトレーニング用データからトレーニングされたモデルを使わずに推定される。一実施形態では、フィルタを形成するために補助センサ信号から形成されたベクトルに補正ベクトルが加算され、このフィルタは、気導マイクロホン信号に適用されて、クリーンな音声推定値を生じる。他の実施形態では、音声信号のピッチが、補助センサ信号から決定され、気導マイクロホン信号を分解するのに用いられる。分解された信号は次いで、クリーン信号推定値を特定するのに用いられる。
【図面の簡単な説明】
【0011】
【図1】本発明を実施することができる一コンピューティング環境を示すブロック図である。
【図2】本発明を実施することができる別のコンピューティング環境を示すブロック図である。
【図3】本発明の概略的な音声処理システムを示すブロック図である。
【図4】本発明の一実施形態におけるノイズリダクションパラメータをトレーニングするシステムを示すブロック図である。
【図5】図4のシステムを用いたノイズリダクションパラメータのトレーニングを示すフロー図である。
【図6】本発明の一実施形態における、雑音のあるテスト音声信号からクリーンな音声信号の推定値を特定するシステムを示すブロック図である。
【図7】図6のシステムを用いて、クリーンな音声信号の推定値を特定する方法を示すフロー図である。
【図8】クリーンな音声信号の推定値を特定する代替システムを示すブロック図である。
【図9】クリーンな音声信号の推定値を特定する第2の代替システムを示すブロック図である。
【図10】図9のシステムを用いて、クリーンな音声信号の推定値を特定する方法を示すフロー図である。
【図11】骨伝導マイクロホンを示すブロック図である。
【発明を実施するための形態】
【0012】
図1は、本発明を実施することができる、適切なコンピューティングシステム環境100の一例を示す。コンピューティングシステム環境100は、適切なコンピューティング環境の一例に過ぎず、本発明の使用または機能の範囲に対するどのような限定を示唆することも意図していない。コンピューティング環境100は、例示的な動作環境100に示されるどの構成要素またはその組合せに関するどのような依存も要件も有していると解釈されるべきではない。
【0013】
本発明は、他の数多くの汎用または専用のコンピューティングシステムまたは構成とも動作する。本発明とともに使用するのに適切であり得る周知のコンピューティングシステム、環境、および/または構成の例は、パーソナルコンピュータ、サーバコンピュータ、携帯型装置またはラップトップ装置、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能な家電製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、電話システム、上記のシステムまたは装置のいずれをも含む分散コンピューティング環境などを含むが、それに限定されない。
【0014】
本発明は、コンピュータによって実行される、プログラムモジュールなどのコンピュータ実行可能命令の一般的なコンテキストで説明することができる。概して、プログラムモジュールは、特定のタスクを実施しまたは特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。本発明は、通信ネットワークを介してリンクされるリモート処理装置によってタスクが実行される分散コンピューティング環境において実施されるように設計される。分散コンピューティング環境では、プログラムモジュールは、メモリ記憶装置を含むローカルおよびリモートコンピュータ記憶媒体両方に置かれる。
【0015】
図1を参照すると、本発明を実施する例示的なシステムは、汎用コンピューティング装置を、コンピュータ110の形で含む。コンピュータ110のコンポーネントは、処理装置120と、システムメモリ130と、システムメモリなど様々なシステムの構成要素を処理装置120に結合するシステムバス121とを含むことができるが、それに限定されない。システムバス121は、様々なバスアーキテクチャのいずれかを使用するメモリバスまたはメモリコントローラ、周辺バス、およびローカルバスなどいくつかの種類のバス構造のいずれでもよい。限定ではなく例として、このようなアーキテクチャは、ISA(Industry Standard Architecture)バス、MCA(Micro Channel Architecture)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics Standards Association)ローカルバス、およびメザニン(Mezzanine)バスとしても知られるPCI(周辺装置相互接続)バスを含む。
【0016】
コンピュータ110は通常、様々なコンピュータ読み取り可能な媒体を含む。コンピュータ読み取り可能媒体は、コンピュータ110によってアクセスすることができる任意の利用可能な媒体であり、揮発性媒体および不揮発性媒体両方、取外し可能媒体および固定の媒体を含む、利用可能などの媒体でもよい。限定ではなく例として、コンピュータ読み取り可能な媒体は、コンピュータ記憶媒体および通信媒体を含むことができる。コンピュータ記憶媒体は、コンピュータ読取可能命令、データ構造、プログラムモジュール、または他のデータなどの情報を格納するためのどの方法でも技術でも実施される揮発性媒体および不揮発性媒体の両方、取外し可能媒体および固定の媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、DVD(digital versatile disks)または他の光学ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、あるいは、所望の情報を格納するのに使用することができるとともにコンピュータ110によってアクセスすることができる他の任意の媒体も含むが、それに限定されない。通信媒体は、典型的には、搬送波やその他の搬送メカニズムなどの変調されたデータ信号中のコンピュータ読み取り可能な命令、データ構造、プログラムモジュール、またはその他のデータなどを具現化するものであり、任意の情報伝達媒体を含む。「変調されたデータ信号」という用語は、信号内に情報を符号化するような方法で、1つまたは複数の特性が設定または変更された信号を意味する。限定するものではないが、通信媒体には、例として、有線ネットワーク、直接ワイヤ接続などの有線媒体と、音響、無線、赤外線などの無線媒体が挙げられる。上記の任意の組合せも、コンピュータ読み取り可能な媒体の範囲内に含まれるものとする。
【0017】
システムメモリ130は、コンピュータ記憶媒体を、ROM(読出し専用メモリ)131およびRAM(ランダムアクセスメモリ)132など、揮発性および/または不揮発性メモリの形で含む。BIOS(基本入出力システム)133は、たとえば起動中にコンピュータ110内部の構成要素間で情報を転送するのを支援する基本ルーチンを含み、通常はROM131に格納される。RAM132は通常、処理装置120に対してただちにアクセス可能な、および/または処理装置120によって現在操作されているデータおよび/またはプログラムモジュールを含む。限定ではなく例として、図1は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137を示す。
【0018】
コンピュータ110は、他の取外し可能/固定の、揮発性/不揮発性コンピュータ記憶媒体を含むこともできる。単なる例として、図1では、固定の不揮発性磁気媒体の読み出しまたは書き込みを行うハードディスクドライブ141、取外し可能な不揮発性磁気ディスク152の読み出しまたは書き込みを行う磁気ディスクドライブ151、および、CD ROMや他の光学媒体など取外し可能な不揮発性光ディスク156の読み出しまたは書き込みを行う光ディスクドライブ155を示す。例示的な動作環境で使用することができる、他の取外し可能/固定の、揮発性/不揮発性のコンピュータ記憶媒体は、磁気テープカセット、フラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ、固体RAM、固体ROMなどを含むが、それに限定されない。ハードディスクドライブ141は通常、インターフェイス140などの固定のメモリインターフェイスを介してシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は通常、インターフェイス150などの取外し可能メモリインターフェイスを介して、システムバス121に接続される。
【0019】
上述し、かつ図1に示すドライブおよびそれに関連するコンピュータ記憶媒体は、コンピュータ読み取り可能な命令、データ構造、プログラムモジュール、およびコンピュータ110用の他のデータの記憶装置を提供する。図1では、たとえば、ハードディスクドライブ141は、オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147を格納するものとして示してある。こうしたコンポーネントは、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137と同じでも、異なってもよいことに留意されたい。オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147には、少なくとも異なるものであることを示すために、ここでは異なる番号を付与している。
【0020】
ユーザは、キーボード162、マイクロホン163、および、マウス、トラックボール、またはタッチパッドなどのポインティングデバイス161などの入力装置を介して、コマンドおよび情報をコンピュータ110に入力することができる。他の入力装置(図示せず)は、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナなどを含むことができる。こうしたおよび他の入力装置はしばしば、システムバスに接続されるユーザ入力インターフェイス160を介して処理装置120に接続されるが、他のインターフェイスおよびバス構造、たとえば並列ポート、ゲームポート、USB(ユニバーサルシリアルバス)などによって接続することもできる。モニタ191または他の種類の表示装置も、ビデオインターフェイス190などのインターフェイスを介してシステムバス121に接続される。モニタに加え、コンピュータは、出力周辺インターフェイス195を介して接続することができるスピーカ197およびプリンタ196など、他の周辺出力装置も含むことができる。
【0021】
コンピュータ110は、リモートコンピュータ180など、1つまたは複数のリモートコンピュータへの論理接続を使用してネットワーク環境で動作する。リモートコンピュータ180は、パーソナルコンピュータ、携帯型装置、サーバ、ルータ、ネットワークPC、ピア装置(peer device)、または他の共通ネットワークノードでよく、通常、コンピュータ110に関連して上述した構成要素の多くまたはすべてを含む。図1に示される論理接続は、LAN(ローカルエリアネットワーク)171およびWAN(ワイドエリアネットワーク)173を含むが、他のネットワークを含むこともできる。このようなネットワーク環境は、会社、企業規模のコンピュータネットワーク、イントラネットおよびインターネットにおいて一般的である。
【0022】
LANネットワーク環境において使用される場合、コンピュータ110は、ネットワークインターフェイスまたはアダプタ170を介してLAN171に接続される。WANネットワーク環境において使用される場合、コンピュータ110は通常、モデム172、または、たとえばインターネットなどのWAN173を介して通信を確立する他の手段を含む。モデム172は、内部にあっても外部にあってもよく、ユーザ入力インターフェイス160または他の適切な機構を介してシステムバス121に接続することができる。ネットワーク環境では、コンピュータ110に関連して図示したプログラムモジュールまたはその一部は、リモートメモリ記憶装置に格納することができる。限定ではなく例として、図1は、リモートアプリケーションプログラム185を、リモートコンピュータ180にあるように示している。図示したネットワーク接続は例示的なものであり、コンピュータ間の通信リンクを確立する他の手段も使用できることが理解されよう。
【0023】
図2は、例示的なコンピューティング環境であるモバイル装置200のブロック図である。モバイル装置200は、マイクロプロセッサ202、メモリ204、入出力(I/O)装置206、およびリモートコンピュータまたは他のモバイル装置と通信するための通信インターフェイス208を含む。一実施形態では、上述した構成要素は、適切なバス210を介して互いに通信するために接続される。
【0024】
メモリ204は、モバイル装置200への全体の電源がシャットダウンされたとき、メモリ204に格納された情報が失われないように、不揮発性電子メモリ、たとえばバッテリバックアップモジュール(図示せず)を有するRAM(ランダムアクセスメモリ)として実装される。メモリ204の一部分は、好ましくはプログラム実行用にアドレス指定可能なメモリとして割り当てられ、メモリ204の別の部分は、好ましくは記憶用に、たとえばディスクドライブ上で記憶をシミュレートするために用いられる。
【0025】
メモリ204は、オペレーティングシステム212、アプリケーションプログラム214、ならびにオブジェクトストア216を含む。動作中、オペレーティングシステム212は、好ましくは、メモリ204から、プロセッサ202によって実行される。オペレーティングシステム212は、好ましい一実施形態では、マイクロソフトコーポレーションから市販されているWINDOWS(登録商標)CEブランドのオペレーティングシステムである。オペレーティングシステム212は、好ましくは、モバイル装置用に設計され、公開されている1組のアプリケーションプログラミングインターフェイスおよびメソッドを介してアプリケーション214によって利用することができるデータベース機能を実装する。オブジェクトストア216内のオブジェクトは、公開されているアプリケーションプログラミングインターフェイスおよびメソッドに対する呼出しに少なくとも部分的に応答して、アプリケーション214およびオペレーティングシステム212によって維持される。
【0026】
通信インターフェイス208は、モバイル装置200が情報を送受信することを可能にする多数の装置および技術を表す。このような装置は、いくつか例を挙げると、有線モデムおよび無線モデム、衛星受信機、ならびに放送チューナを含む。モバイル装置200は、データ交換を行うコンピュータに直接接続することもできる。このような場合、通信インターフェイス208は、赤外線送受信機でも、シリアルまたはパラレルの通信接続でもよく、これらはすべて、ストリーム情報を伝送することができる。
【0027】
入力/出力装置206は、タッチ画面(touch−sensitive screen)、ボタン、ローラ、およびマイクロホンなどの様々な入力装置、ならびに音声ジェネレータ、振動装置、およびディスプレイを含む様々な出力装置を含む。上に列挙した装置は例であり、すべてがモバイル装置200上になくてもよい。さらに、他の入力/出力装置が、本発明の範囲内において、モバイル装置200に取り付けられてもよく、モバイル装置200に備わっていてもよい。
【0028】
図3は、本発明の実施形態の基本的なブロック図を提供している。図3において、話者300は、音声信号302を生成し、この音声信号302は、気導マイクロホン304および補助センサ306によって検出される。補助センサの例には、ユーザの喉の振動を測定する咽喉マイクロホン、ユーザの顔の骨または頭蓋骨の上またはその付近(たとえば顎の骨)、あるいはユーザの耳の中に配置され、ユーザによって生成された音声に対応する頭蓋および顎の振動を感知する骨伝導センサがある。気導マイクロホン304は、音波を電気信号に変換するのに一般に使われる種類のマイクロホンである。
【0029】
気導マイクロホン304は、1つまたは複数の雑音発生源310によって生成された雑音308も受ける。補助センサの種類および雑音のレベルによっては、雑音308は、補助センサ306によって検出することもできる。しかし、本発明の実施形態では、補助センサ306は通常、気導マイクロホン304よりも周囲の雑音に対して鈍感である。したがって、補助センサ306によって生成された補助センサ信号312は概して、気導マイクロホン304によって生成された気導マイクロホン信号314より少ない雑音を含む。
【0030】
補助センサ信号312および気導マイクロホン信号314は、クリーン信号推定器316に与えられ、推定装置316は、クリーンな信号318を推定する。クリーン信号推定値318は、音声処理320に与えられる。クリーン信号推定値318は、フィルタリングされた時間領域信号でも、特徴領域ベクトルでもよい。クリーン信号推定値318が時間領域信号である場合、音声処理320は、聴者、音声符号化システム、または音声認識システムの形をとることができる。クリーン信号推定値318が特徴領域ベクトルである場合、音声処理320は通常、音声認識システムであろう。
【0031】
本発明は、気導マイクロホン信号314および補助センサ信号312を用いてクリーンな音声を推定するいくつかの方法およびシステムを提供する。あるシステムでは、ステレオトレーニング用データを用いて、補助センサ信号用の補正ベクトルをトレーニングする。こうした補正ベクトルは、後でテスト用補助センサベクトルに加算されると、クリーンな信号ベクトルの推定値を与える。このシステムのさらなる拡張の1つは、時間によって変化するひずみを最初に追跡し、次いで、この情報を補正ベクトルの計算およびクリーンな音声の推定に組み込むことである。
【0032】
第2のシステムは、補正ベクトルによって生成されたクリーン信号推定値と、気導信号から気導テスト信号中の現在の雑音の推定値を減算することによって形成された推定値との間の補間を提供する。第3のシステムは、補助センサ信号を用いて音声信号のピッチを推定し、次いで、推定したピッチを用いて、クリーンな信号に対する推定値を特定する。こうしたシステムはそれぞれ、後で個別に説明する。
【0033】
(ステレオ補正ベクトルのトレーニング)
図4および5は、クリーンな音声の推定値を生成するために補正ベクトルに依拠する本発明の2つの実施形態用の、ステレオ補正ベクトルをトレーニングすることについてのブロック図およびフロー図を提供する。
【0034】
補正ベクトルを特定する方法は、図5のステップ500で始まり、ここで、「クリーンな」気導マイクロホン信号が特徴ベクトルの列に変換される。この変換を行うために、図4の話者400は、気導マイクロホン410に向かって話し、マイクロホン410は、オーディオ波を電気信号に変換する。電気信号は次いで、アナログ−デジタルコンバータ414によってサンプリングされて、デジタル値の列を生成し、こうしたデジタル値は、フレームコンストラクタ416により値からなるフレームにグループ化される。一実施形態では、A/Dコンバータ414は、16kHz、かつ1サンプルごとに16ビットでアナログ信号をサンプリングし、そうすることによって毎秒32キロバイトの発話データを作成し、フレームコンストラクタ416は、25ミリ秒分のデータを含む新規フレームを10ミリ秒毎に作成する。
【0035】
フレームコンストラクタ416によって提供される各データフレームは、特徴抽出器418によって特徴ベクトルに変換される。一実施形態では、特徴抽出器418が、ケプストラム特徴を形成する。このような特徴の例には、LPC派生ケプストラム、およびメル(Mel)周波数ケプストラム係数がある。本発明とともに使用することができる他の可能な特徴抽出モジュールの例には、線形予測符号化(LPC)、知覚線形予測(PLP)、および聴覚モデル特徴抽出を実施するモジュールがある。本発明はこうした特徴抽出モジュールに限定されず、他のモジュールも本発明のコンテキストの範囲内において使用できることに留意されたい。
【0036】
図5のステップ502で、補助センサ信号が、特徴ベクトルに変換される。ステップ502の変換は、ステップ500の変換の後に起こるものと示してあるが、本発明では、変換のどの部分も、ステップ500の前、ステップ500の間、またはその後に実施することができる。ステップ502の変換は、ステップ500に関して上述したものと同様の処理を介して実行される。
【0037】
図4の実施形態において、この処理は、骨の振動や顔の動きなど、話者400による音声の生成に関連づけられた物理的な事象を補助センサ402が検出したときに始まる。図11に示すように、骨伝導センサ1100の一実施形態では、柔らかいエラストマブリッジ(elastomer bridge)1102が、通常の気導マイクロホン1106の振動板1104に接着される。この柔らかいブリッジ1102は、ユーザの皮膚接触部分1108から、マイクロホン1106の振動板1104に直接、振動を伝導する。振動板1104の動きは、マイクロホン1106内のトランスデューサ1110によって電気信号に変換される。補助センサ402は、物理的な事象をアナログ電気信号に変換し、この信号は、アナログ−デジタルコンバータ404によってサンプリングされる。A/Dコンバータ404に関するサンプリング特性は、A/Dコンバータ414に関して上述したものと同じである。A/Dコンバータ404によって提供されたサンプルは、フレームコンストラクタ406によってフレーム中に集められ、フレームコンストラクタ406は、フレームコンストラクタ416と同様の方法で動作する。こうしたサンプルフレームは次いで、特徴抽出器408によって特徴ベクトルに変換され、特徴抽出器408は、特徴抽出器418と同じ特徴抽出方法を用いる。
【0038】
補助センサ信号および気導信号に対する特徴ベクトルは、図4のノイズリダクショントレーナ420に与えられる。図5のステップ504で、ノイズリダクショントレーナ420は、補助センサ信号に対する特徴ベクトルを混合成分にグループ化する。このグループ化は、最大尤度トレーニング技術を用いて類似の特徴ベクトルを同じグループにすることによって、または、音声信号の時間セクションを表す特徴ベクトルを同じグループにすることによって行うことができる。特徴ベクトルをグループ化する他の技術も用いることができ、上に挙げた2つの技術は例として挙げられるに過ぎないことが当業者には理解されよう。
【0039】
ノイズリダクショントレーナ420は次いで、図5のステップ508で、各混合成分sに対する補正ベクトルrを決定する。一実施形態では、各混合成分に対する補正ベクトルは、最大尤度基準を用いて決定される。この技術では、補正ベクトルは、以下のように計算される。
【0040】
【数1】

【0041】
上式で、xは、フレームtに対する気導ベクトルの値であり、bは、フレームtに対する補助センサベクトルの値である。式1において、
【0042】
【数2】

【0043】
であり、p(s)は、混合成分の数に対して単に1であり、p(b|s)は、ガウス分布:
p(b|s)=N(b;μ,Γ) 式3
としてモデル化され、平均値μおよび分散Γは期待値最大化(EM)アルゴリズムを用いてトレーニングされており、各反復は、以下のステップからからなる。
【0044】
γ(t)=p(s|b) 式4
【0045】
【数3】

【0046】
式4は、EMアルゴリズムにおけるEステップであり、Eステップは、予め推定されたパラメータを使用する。式5および式6はMステップであり、Mステップは、Eステップの結果を用いてパラメータをアップデートする。
【0047】
アルゴリズムのEおよびMステップは、モデルパラメータ用の安定した値が決定されるまで反復される。こうしたパラメータは次いで、補正ベクトルを形成するために式1を評価するのに使用される。次いで、補正ベクトルおよびモデルパラメータは、ノイズリダクションパラメータ記憶装置422に格納される。
【0048】
ステップ508で、各混合成分に対する補正ベクトルが決定された後、本発明のノイズリダクションシステムをトレーニングする処理が完了する。各混合物に対して補正ベクトルが決定されると、補正ベクトルは、本発明のノイズリダクション技術において使用することができる。補正ベクトルを使用する2つの別個のノイズリダクション技術については、以下に説明する。
【0049】
(補正ベクトルおよび雑音推定値を用いたノイズリダクション)
補正ベクトルおよび雑音推定値に基づいて、雑音のある音声信号中の雑音を低減するシステムおよび方法を、図6のブロック図および図7のフロー図にそれぞれ示す。
【0050】
ステップ700で、気導マイクロホン604によって検出されたオーディオテスト信号が、特徴ベクトルに変換される。マイクロホン604によって受信されたオーディオテスト信号は、話者600からの音声、および1つまたは複数の雑音発生源602からの加法性雑音を含む。マイクロホン604によって検出されたオーディオテスト信号は、電気信号に変換され、この電気信号は、アナログ−デジタルコンバータ606に与えられる。
【0051】
A/Dコンバータ606は、マイクロホン604からのアナログ信号をデジタル値の列に変換する。いくつかの実施形態において、A/Dコンバータ606は、16kHz、かつ1サンプルごとに16ビットでアナログ信号をサンプリングし、そうすることによって毎秒32キロバイトの発話データを作成する。こうしたデジタル値は、フレームコンストラクタ607に与えられ、コンストラクタ607は、一実施形態では、10ミリ秒おきに別々に開始される25ミリ秒のフレームに値をグループ化する。
【0052】
フレームコンストラクタ607によって作成された、データからなるフレームは、特徴抽出器610に与えられ、特徴抽出器610は、各フレームから特徴を抽出する。一実施形態では、この特徴抽出器は、補正ベクトルをトレーニングするのに使われた特徴抽出器408および418とは異なる。具体的に言うと、本実施形態では、特徴抽出器610は、ケプストラム値ではなくパワースペクトル値を生じる。抽出された特徴は、クリーン信号推定器622、音声検出装置626および雑音モデルトレーナ624に与えられる。
【0053】
ステップ702で、話者600による音声の生成に関連づけられた骨の振動や顔の動きなどの物理的な事象が、特徴ベクトルに変換される。図7では別個のステップとして示してあるが、このステップの一部は、ステップ700と同時に行うことができることが当業者には理解されよう。ステップ702の間、物理的な事象は、補助センサ614によって検出される。補助センサ614は、物理的な事象に基づいてアナログ電気信号を生成する。このアナログ信号は、アナログ−デジタルコンバータ616によってデジタル信号に変換され、その結果生じるデジタルサンプルは、フレームコンストラクタ617によってフレームにグループ化される。一実施形態では、アナログ−デジタルコンバータ616およびフレームコンストラクタ617は、アナログ−デジタルコンバータ606およびフレームコンストラクタ607と同様の方法で動作する。
【0054】
デジタル値からなるフレームは、特徴抽出器620に与えられ、特徴抽出器620は、補正ベクトルをトレーニングするのに利用されたものと同じ特徴抽出技術を利用する。上述したように、このような特徴抽出モジュールの例は、線形予測符号化(LPC)、LPC派生ケプストラム、知覚線形予測(PLP)、聴覚モデル特徴抽出、およびメル周波数ケプストラム係数(MFCC)特徴抽出を実施するモジュールを含む。ただし、多くの実施形態において、ケプストラム特徴を生じる特徴抽出技術が用いられる。
【0055】
特徴抽出モジュールは、音声信号の別個のフレームにそれぞれ関連づけられた特徴ベクトルからなるストリームを生じる。この特徴ベクトルストリームは、クリーン信号推定器622に与えられる。
【0056】
フレームコンストラクタ617からの値からなるフレームは、特徴抽出器621にも与えられ、特徴抽出器621は、一実施形態では、各フレームのエネルギーを抽出する。各フレームに対するエネルギー値は、音声検出装置626に与えられる。
【0057】
ステップ704で、音声検出ユニット626は、補助センサ信号のエネルギー特徴を用いて、音声がおそらく存在するときを判定する。この情報は、雑音モデルトレーナ624に渡され、雑音モデルトレーナ624は、ステップ706で、音声がない期間に雑音をモデル化するように試みる。
【0058】
一実施形態では、音声検出装置626は最初に、エネルギーのピークを見つけるために、フレームのエネルギー値からなる列を検索する。音声検出装置626は次いで、ピークの後の谷を求めて検索を行う。この谷のエネルギーは、エネルギーセパレータdと呼ばれる。
【0059】
フレームが音声を含むかどうか判定するために、エネルギーセパレータdに対するフレームeのエネルギーの比率kが次いで、k=e/dとして決定される。フレームに対する音声の信頼性qが次いで、
【0060】
【数4】

【0061】
のように決定される。上式で、αは、2つの状態の間の遷移を定義し、一実施例では2に設定される。最後に、隣接する5個のフレーム(それ自体を含む)の平均の信頼値を、このフレームに対する最終的な信頼値として用いる。
【0062】
一実施形態では、信頼値が閾値を超える場合はフレームが音声を含むとみなし、信頼値が閾値を超えない場合はフレームが非音声を含むとみなすというように音声が存在するかどうか判定するのに、固定閾値が用いられる。一実施形態では、0.1という閾値が使用される。
【0063】
音声検出装置626によって検出された各非音声フレームに対して、雑音モデルトレーナ624は、ステップ706で雑音モデル625をアップデートする。一実施形態では、雑音モデル625は、平均値μおよび分散Σを有するガウスモデルである。このモデルは、非音声の最新フレームからなる移動ウィンドウ(moving window)に基づく。ウィンドウ中の非音声フレームから平均値および分散を決定する技術は、当該分野において公知である。
【0064】
パラメータ記憶装置422中の補正ベクトルおよびモデルパラメータ、および雑音モデル625が、補助センサに対する特徴ベクトルb、および雑音のある気導マイクロホン信号に対する特徴ベクトルSとともに、クリーン信号推定器622に与えられる。
【0065】
ステップ708で、クリーン信号推定器622は、補助センサの特徴ベクトル、補正ベクトル、および補助センサに対するモデルパラメータに基づいて、クリーンな音声信号用の初期値を推定する。具体的には、クリーンな信号の補助センサ推定値は、
【0066】
【数5】

【0067】
のように計算され、上式で、
【0068】
【数6】

【0069】
は、ケプストラム領域におけるクリーン信号推定値であり、bは、補助センサの特徴ベクトルであり、p(s|b)は、上記の式2を用いて決定され、rは、混合成分sに対する補正ベクトルである。したがって、式8におけるクリーンな信号の推定値は、補正ベクトルの重みづけ和(weighted sum)に補助センサの特徴ベクトルを加算することによって形成され、重みは、補助センサの特徴ベクトルを与えられた混合成分の確率に基づく。
【0070】
ステップ710で、補助センサの初期クリーン音声推定値が、雑音のある気導マイクロホンベクトルおよび雑音モデルから形成されたクリーン音声推定値と結合されることによって改善(refine)される。この結果、改善されたクリーン音声推定値628を得る。初期クリーン信号推定値のケプストラム値を雑音のある気導マイクロホンのパワースペクトル特徴ベクトルと結合するために、ケプストラム値は、
【0071】
【数7】

【0072】
を用いてパワースペクトル領域に変換される。上式で、C−1は逆離散コサイン変換であり、
【0073】
【数8】

【0074】
は、補助センサに基づくクリーンな信号のパワースペクトル推定値である。
【0075】
補助センサからの初期クリーン信号推定値は、パワースペクトル領域内に置かれると、
【0076】
【数9】

【0077】
のように、雑音のある気導マイクロホンのベクトルおよび雑音モデルと結合することができ、上式で、
【0078】
【数10】

【0079】
は、パワースペクトル領域における改善されたクリーン信号推定値であり、Sは、雑音のある気導マイクロホンの特徴ベクトルであり、(μ,Σ)は、以前の雑音モデルの平均値および共分散(624を参照されたい)であり、
【0080】
【数11】

【0081】
は、補助センサに基づく初期クリーン信号推定値であり、Σx|bは、補助センサの測定結果を与えられた、クリーンな音声に対する条件つき確率分布の共分散行列である。Σx|bは、以下のように計算することができる。Jは、式9の右辺における関数のヤコビアンを示すものとする。Σは、
【0082】
【数12】

【0083】
の共分散行列であるとする。この場合、
【0084】
【数13】

【0085】
の共分散は、
Σx|b=JΣJ 式11
である。
【0086】
簡略化した実施形態において、式10を、以下の式のように書き換える。
【0087】
【数14】

【0088】
上式で、α(f)は、時間および周波数帯両方の関数である。我々が現在使用している補助センサは、最大3KHzの帯域幅をもつので、3KHz未満の周波数帯に対して、0となるようなα(f)を選ぶ。基本的に、低周波数帯に対しては、補助センサからの初期クリーン信号推定値を信頼する。高周波数帯に対しては、補助センサからの初期クリーン信号推定値はあまり信頼性がない。直観的に、雑音が、現在のフレームにおける周波数帯に対して小さい場合、この周波数帯に対して気導マイクロホンからより多くの情報を使うために、大きいα(f)を選びたい。それ以外の場合は、小さいα(f)を選ぶことによって、補助センサからより多くの情報を使用したい。一実施形態では、補助センサからの初期クリーン信号推定値のエネルギーを用いて、各周波数帯に対する雑音レベルを判定する。E(f)は、周波数帯fに対するエネルギーを示すものとする。M=MaxE(f).α(f)は、fの関数として、以下のように定義されるものとする。
【0089】
【数15】

【0090】
上式で、α(f)の平滑を補償するために、3Kから4Kへの遷移に線形補間を用いる。
【0091】
パワースペクトル領域における改善されたクリーン信号推定値は、雑音のある気導マイクロホン信号をフィルタリングするためのウィーナフィルタを構築するのに用いることができる。具体的には、ウィーナフィルタHは、
【0092】
【数16】

【0093】
となるように設定される。
【0094】
このフィルタは次いで、時間領域の雑音のある気導マイクロホン信号に対して適用されて、雑音が低減された、またはクリーンな時間領域信号を作ることができる。雑音が低減された信号は、聴者に提供したり、音声認識装置に与えたりすることができる。
【0095】
式12は、2つの因子の重みづけ和である、改善されたクリーン信号推定値をもたらし、因子の1つは、補助センサのクリーン信号推定値であることに留意されたい。この重みづけ和は、追加の補助センサ用の追加因子を含むように拡張することができる。したがって、クリーンな信号の独立推定値を生成するのに、複数の補助センサを使用することができる。こうした多数の推定値は次いで、式12を用いて結合することができる。
【0096】
(雑音推定値のない補正ベクトルを用いたノイズリダクション)
図8は、本発明においてクリーンな音声値を推定する補助システムのブロック図を提供する。図8のシステムは、クリーンな音声値の推定値が気導マイクロホンまたは雑音モデルを必要とせずに形成されること以外は、図6のシステムと同様である。
【0097】
図8において、音声を生じる話者800に関連づけられた物理的な事象が、補助センサ802、アナログ−デジタルコンバータ804、フレームコンストラクタ806、および特徴抽出器808によって、図6の補助センサ614、アナログ−デジタルコンバータ616、フレームコンストラクタ617、および特徴抽出器620に対して上述したのと同様の方法で、特徴ベクトルに変換される。特徴抽出器808およびノイズリダクションパラメータ422からの特徴ベクトルは、クリーン信号推定器810に与えられ、推定装置810は、上記の式8および9を用いて、クリーンな信号値の推定値812である、
【0098】
【数17】

【0099】
を決定する。
【0100】
パワースペクトル領域におけるクリーン信号推定値、すなわち
【0101】
【数18】

【0102】
は、雑音のある気導マイクロホンの信号をフィルタリングするためのウィーナフィルタを構築するのに用いることができる。具体的には、ウィーナフィルタHは、
【0103】
【数19】

【0104】
となるように設定される。
【0105】
このフィルタは次いで、時間領域の雑音のある気導マイクロホンの信号に対して適用されて、雑音が低減された、またはクリーンな信号を作ることができる。雑音が低減された信号は、聴者に提供したり、音声認識装置に与えたりすることができる。
【0106】
あるいは、式8で計算される、ケプストラム領域におけるクリーン信号推定値、すなわち
【0107】
【数20】

【0108】
を、音声認識システムに直接適用することもできる。
【0109】
(ピッチの追跡を用いたノイズリダクション)
クリーンな音声信号の推定値を生成する代替技術を、図9のブロック図および図10のフロー図に示す。具体的には、図9および10の実施形態は、補助センサを用いて音声信号に対するピッチを識別し、次いで、このピッチを用いて雑音のある気導マイクロホンの信号を高調波成分およびランダム成分に分解することによって、クリーン音声推定値を決定する。したがって、雑音のある信号は、以下のように表される。
【0110】
y=y+y 式16
上式で、yは雑音のある信号であり、yは高調波成分であり、yはランダム成分である。高調波成分およびランダム成分の、重みづけ和は、雑音が低減された音声信号を表す、雑音が低減された特徴ベクトルを形成するのに用いられる。
【0111】
一実施形態では、高調波成分は、高調波正弦波の和として、
【0112】
【数21】

【0113】
のようにモデル化され、上式で、ωは、基本またはピッチ周波数であり、Kは、信号中の高調波の総数である。
【0114】
したがって、高調波成分を識別するために、ピッチ周波数の推定値および振幅パラメータ{a...a...b}が決定されなければならない。
【0115】
ステップ1000で、雑音のある音声信号が集められ、デジタルサンプルに変換される。これを行うために、気導マイクロホン904は、話者900および1つまたは複数の加法性雑音発生源902からのオーディオ波を電気信号に変換する。電気信号は次いで、アナログ−デジタルコンバータ906によってサンプリングされて、デジタル値の列を生成する。一実施形態では、A/Dコンバータ906は、16kHz、かつ1サンプルごとに16ビットでアナログ信号をサンプリングし、そうすることによって毎秒32キロバイトの発話データを作成する。ステップ1002で、デジタルサンプルは、フレームコンストラクタ908によってフレームにグループ化される。一実施形態では、フレームコンストラクタ908は、25ミリ秒分のデータを含む新規フレームを10ミリ秒おきに作成する。
【0116】
ステップ1004で、音声の生成に関連づけられた物理的な事象が、補助センサ944によって検出される。この実施形態では、骨伝導センサなど、高調波成分を検出することができる補助センサが、補助センサ944として使用されるのに最適である。ステップ1004は、ステップ1000とは別個に示してあるが、こうしたステップは、同時に実行することができることが当業者には理解されることに留意されたい。補助センサ944によって生成されたアナログ信号は、アナログ−デジタルコンバータ946によってデジタルサンプルに変換される。デジタルサンプルは次いで、ステップ1006で、フレームコンストラクタ948によってフレームにグループ化される。
【0117】
ステップ1008で、補助センサ信号からなるフレームが、ピッチ追跡装置950によって、音声のピッチまたは基本周波数を識別するのに用いられる。
【0118】
ピッチ周波数に対する推定値は、使用可能な任意の数のピッチ追跡システムを用いて決定することができる。こうしたシステムの多くにおいて、補助センサ信号のセグメントの中心間の可能な間隔を識別するのに、候補のピッチが用いられる。各候補ピッチごとに、連続する音声のセグメント間で相関関係が決定される。概して、最良の相関関係をもたらす候補ピッチは、フレームのピッチ周波数であろう。一部のシステムでは、信号のエネルギーおよび/または予期されるピッチトラック(pitch track)などの付加情報が、ピッチ選択を改善するのに用いられる。
【0119】
ピッチ追跡装置950からピッチの推定値が与えられると、気導信号ベクトルは、ステップ1010で、高調波成分およびランダム成分に分解することができる。このような分解を行うために、式17は、
y=Ab 式18
のように書き換えられ、上式で、yは、雑音のある音声信号のN個のサンプルのベクトルであり、Aは、
A=[Acossin] 式19
によって与えられるN×2Kの行列であり、式19の要素は
cos(k,t)=cos(kωt) Asin(k,t)=sin(kωt) 式20
であり、bは、
=[a...a...b] 式21
によって与えられる2K×1のベクトルである。この場合、振幅係数に対する最小二乗解は、
【0120】
【数22】

【0121】
である。
【0122】
雑音のある音声信号の高調波成分に対する推定値は、
【0123】
【数23】

【0124】
を用いて、
【0125】
【数24】

【0126】
のように決定することができる。
【0127】
ランダム成分の推定値は次いで、
=y−y 式24
のように計算される。
【0128】
したがって、上記の式18〜24を用いて、高調波分解装置910は、高調波成分サンプルのベクトル912、すなわちy、およびランダム成分サンプルのベクトル914、すなわちyを作ることができる。
【0129】
フレームのサンプルが高調波サンプルおよびランダムサンプルに分解された後、ステップ1012で、スケーリングパラメータすなわち重みが、高調波成分に対して決定される。このスケーリングパラメータは、以下にさらに説明するように、雑音が低減された音声信号の計算の一部として用いられる。一実施形態では、スケーリングパラメータは、
【0130】
【数25】

【0131】
のように計算され、上式で、αはスケーリングパラメータであり、y(i)は、高調波成分サンプルyのベクトル中のi番目のサンプルであり、y(i)は、このフレームに対する、雑音のある音声信号のi番目のサンプルである。式25において、分子は、高調波成分の各サンプルのエネルギーの和であり、分母は、雑音のある音声信号の各サンプルのエネルギーの和である。したがって、スケーリングパラメータは、フレームの総エネルギーに対するフレームの高調波エネルギーの比率である。
【0132】
別の実施形態では、スケーリングパラメータは、確率的な有声−無声検出ユニットを用いて設定される。このようなユニットは、音声からなるある特定のフレームが無声ではなく有声(声帯がフレーム期間中に共鳴することを意味する)である確率を提供する。フレームが音声の有声域からである確率は、スケーリングパラメータとしてそのまま用いることができる。
【0133】
スケーリングパラメータが決定された後、または決定されている間、高調波成分サンプルのベクトルおよびランダム成分サンプルのベクトルに対するメルスペクトルが、ステップ1014で決定される。これは、サンプルの各ベクトルを離散フーリエ変換(DFT)918に通して、高調波成分周波数値のベクトル922およびランダム成分周波数値のベクトル920を作ることを含む。周波数値のベクトルによって表されるパワースペクトルは次いで、メル重みづけユニット924によって、メルスケールとともに適用される一連の三角重みづけ関数(triangular weighting function)を用いて平滑化される。この結果、高調波成分メルスペクトルベクトル928、すなわちY、およびランダム成分メルスペクトルベクトル926、すなわちYが得られる。
【0134】
ステップ1016で、高調波成分およびランダム成分に対するメルスペクトルが、重みづけ和として組み合わされて、雑音が低減されたメルスペクトルの推定値を形成する。このステップは、重みづけ和計算器930によって実行され、以下の式において上記にて決定されたスケーリング因子を用いる。
【0135】
【数26】

【0136】
上式で、
【0137】
【数27】

【0138】
は、雑音が低減されたメルスペクトルの推定値であり、Y(t)は、高調波成分メルスペクトルであり、Y(t)は、ランダム成分メルスペクトルであり、α(t)は、上記にて決定されたスケーリング因子であり、αは、ランダム成分に対する固定スケーリング因子であって、一実施形態では0.1に等しく設定され、時間インデックスtは、高調波成分に対するスケーリング因子は各フレームごとに決定されるが、ランダム成分に対するスケーリング因子は固定のままであることを強調するのに用いられる。他の実施形態では、ランダム成分に対するスケーリング因子は、各フレームごとに決定できることに留意されたい。
【0139】
雑音が低減されたメルスペクトルがステップ1016で計算された後、ステップ1018で、メルスペクトルのログ932が決定され、次いで、離散コサイン変換934に適用される。離散コサイン変換934は、雑音が低減された音声信号を表すメル周波数ケプストラム係数(MFCC)特徴ベクトル936を作成する。
【0140】
雑音が低減された別個のMFCC特徴ベクトルが、雑音のある信号からなる各フレームに対して作成される。こうした特徴ベクトルは、音声強調および音声認識を含む任意の所望の目的に使うことができる。音声強調に対しては、MFCC特徴ベクトルは、パワースペクトル領域に変換することができ、雑音のある気導信号とともに用いて、ウィーナフィルタを形成することができる。
【0141】
本発明を、特定の実施形態を参照して説明したが、本発明の精神および範囲から逸脱することなく、形体および細部において変更を行うことができることが当業者には理解されよう。
【符号の説明】
【0142】
100 コンピューティングシステム環境
110 コンピュータ
120 処理装置
121 システムバス
130 システムメモリ
131 ROM
132 RAM
133 BIOS
134 オペレーティングシステム
135 アプリケーションプログラム
136 他のプログラムモジュール
137 プログラムデータ
140 固定の不揮発性メモリインターフェイス
144 オペレーティングシステム
145 アプリケーションプログラム
146 他のプログラムモジュール
147 プログラムデータ
150 取外し可能不揮発性メモリインターフェイス
160 ユーザ入力インターフェイス
161 ポインティングデバイス
162 キーボード
163 マイクロホン
170 ネットワークインターフェイス
171 ローカルエリアネットワーク
172 モデム
173 ワイドエリアネットワーク
180 リモートコンピュータ
185 リモートアプリケーションプログラム
190 ビデオインターフェイス
191 モニタ
195 出力周辺インターフェイス
196 プリンタ
197 スピーカ
200 モバイル装置
202 プロセッサ(マイクロプロセッサ)
204 メモリ
208 通信インターフェイス
214 アプリケーション
216 オブジェクトストア

【特許請求の範囲】
【請求項1】
気導マイクロホン以外のセンサから補助センサ信号を受けるステップと、
気導マイクロホンから雑音のある気導マイクロホン信号を受けるステップと、
前記補助センサ信号に基づいて、候補周波数のグループの中のいずれの周波数が音声信号に対するピッチ周波数であるかを識別するステップと、
高調波成分を前記ピッチに関連する正弦波の和としてモデルすることによって、前記ピッチ周波数を用いて、前記雑音のある気導マイクロホン信号を高調波成分および残余成分に分解するステップと、
前記高調波成分および前記残余成分の重みづけ和を判定することによって、前記高調波成分および前記残余成分を用いて、前記クリーン音声値を推定するステップであって、前記クリーン音声値は、前記雑音のある気導マイクロホン信号と比較して低減された雑音を有する、雑音が低減された信号を表す、ステップと
を備えることを特徴とする、クリーン音声値の推定値を決定する方法。
【請求項2】
前記補助センサ信号を受けるステップは、骨伝導マイクロホンから補助センサ信号を受けるステップを含むことを特徴とする請求項1に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2011−203759(P2011−203759A)
【公開日】平成23年10月13日(2011.10.13)
【国際特許分類】
【出願番号】特願2011−153225(P2011−153225)
【出願日】平成23年7月11日(2011.7.11)
【分割の表示】特願2004−332159(P2004−332159)の分割
【原出願日】平成16年11月16日(2004.11.16)
【出願人】(500046438)マイクロソフト コーポレーション (3,165)
【Fターム(参考)】