説明

モバイル装置における多感覚応用の音声強調のための方法および装置

【課題】多感覚応用の強調された音声信号を提供できるモバイル装置の提供。
【解決手段】モバイル装置は、気導マイクロホンおよび音声に関する情報を含む電子補助センサ信号を供給する補助センサを含む。モバイル装置は、複数のタイプの通信を許容する通信インターフェイスによって、他のモバイル装置と直接通信することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はモバイル装置に関する。より詳細には、本発明は多感覚応用の音声強調(multi−sensory speech enhancement)のためのモバイル装置に関する。
【背景技術】
【0002】
電話機能を提供したり、音声入力を受け付けたりする携帯電話やPDA(携帯情報端末)などのモバイルハンドヘルド装置は、にぎやかな通り、レストラン、空港、車などの劣悪な雑音環境で使用されることが多い。こうした環境における激しい周囲雑音は、ユーザの音声を不明瞭にし、人が何を話しているかをわかりにくくする可能性がある。さらに、音声認識の精度を極度に低下させる。
【0003】
雑音のモデルに基づいて雑音の除去を試みるノイズフィルタリングシステムが開発されているが、こうしたシステムは、すべての雑音を除去することはできない。特に、こうしたシステムの多くは、背景での他の人の話から成る雑音を除去するのが困難であることがわかっている。その1つの理由は、マイクロホンによって受信された音声信号がモバイル装置を使用している人以外の誰かによって発せられたことを、このようなシステムが判断することは、不可能でないにしても、極端に難しいからである。
【0004】
ユーザの頭または耳の上にヘッドセットをかけることによって、ユーザの頭の所定の位置に保持される電話ヘッドセットの場合には、ヘッドセットの追加型センサに依存することによって、より頑強なノイズフィルタリングを提供するシステムが開発されている。一例では、骨伝導センサは、ヘッドセットの一端に配置されており、ヘッドセットの弾力によってユーザの頭蓋骨、耳、または下顎を覆う皮膚に圧接される。骨伝導センサは、ユーザが話をするときに生じる頭蓋骨、耳、または下顎の振動を検出する。このシステムは、骨伝導センサからの信号を使用して、ユーザが話をしているときを、よりよく識別することができ、その結果、音声信号内の雑音をよりよく除去することができる。
【発明の開示】
【発明が解決しようとする課題】
【0005】
こうしたシステムはヘッドセットの場合はよく働くが、ヘッドセットは、電話への有線接続に沿った通信に限られている。したがって、広範な通信アプリケーションでの使用は限られている。さらに、ヘッドセットは、見た目が悪く(大きくかさばる)、一日中着用しているのは不快であり、その結果ユーザは、一日中ヘッドセットを所定の位置に着けたままにしておきたいという可能性は少ない。このことが、ヘッドセットの使用を扱いにくい、煩わしいものにしている。
【課題を解決するための手段】
【0006】
気導マイクロホン、および音声を示す補助センサ信号を提供する補助センサを含むモバイル装置が提供される。モバイル装置は、通信インターフェイスによって、他のモバイル装置と直接通信することができる。
【発明を実施するための最良の形態】
【0007】
本発明の実施形態は、音声検出およびノイズフィルタリングに使用できる気導マイクロホンおよび補助センサを含むモバイル装置を提供する。本発明のモバイル装置の例は、セル電話(セル方式の携帯電話)、PDA、宝飾品、および腕時計を含む。図1は、一実施形態の例を示しており、ここではモバイル装置(mobile device)は携帯電話(mobile phone)100である。携帯電話100は、キーパッド102、ディスプレイ(表示画面)104、カーソルコントロール106、気導マイクロホン108、スピーカ110、2つの骨伝導マイクロホン112および114、およびオプションの近接センサ116を含む。携帯電話100は、バッテリなどの電源、プロセッサ、全地球測位衛星信号検出器(global positioning satellite signal detector)およびプロセッサ(図示しない)も含んでおり、これらは電話の外部からは見えない。任意選択で、携帯電話100は、脈拍センサ、酸素濃度センサ、体温センサ、およびビデオカメラを含んでいてもよい。
【0008】
タッチパッド102は、ユーザが携帯電話に数字および文字を入力することを可能にする。他の実施形態では、タッチパッド102は、タッチ画面の形態でディスプレイ104と一体化している。カーソルコントロール106は、ユーザが、ディスプレイ104上の情報を強調表示し、選択したり、ディスプレイ104よりも大きい画像およびページをスクロールしたりすることを可能にする。
【0009】
図2および図3で示すように、携帯電話100が電話で話をする標準の位置に置かれているとき、スピーカ110は、ユーザの左耳200または右耳300の近くに配置されており、気導マイクロホン108は、ユーザの口202の近くに配置されている。図2のように電話がユーザの左耳の近くに配置されているとき、骨伝導マイクロホン114は、ユーザの頭蓋骨または耳に接し、気導マイクロホン108によって受信された音声信号から雑音を除去するために使用できる音声についての情報を提供する補助センサ信号を生成する。例えば、補助センサ信号で提供された情報は、ユーザが話をしているかどうか、およびユーザの音声に関連する低周波情報を含むことができる。図3のように電話がユーザの右耳の近くに配置されているとき、骨伝導マイクロホン112は、ユーザの頭蓋骨または耳に接し、音声信号から雑音を除去するために使用できる補助センサ信号を生成する。
【0010】
オプションの近接センサ116は、電話(器)がユーザにどれだけ近いかを示す。下記で詳述するように、この情報は、クリーンな音声値を生成する際に骨伝導マイクロホンの寄与に重みを付けるために使用される。一般に、電話がユーザ隣接にしていることを近接検出器が検出した場合、電話がユーザから多少離れている場合よりも、骨伝導マイクロホン信号に重みがかけられる。この調整は、骨伝導マイクロホン信号は、電話がユーザに接しているとき、ユーザが話をしていることをより指示しているという事実を反映している。電話がユーザから離れているとき、周囲雑音であることがより多い。ユーザは常に頭に電話を押しつけたままであるとは限らないため、本発明のいくつかの実施形態では近接センサが使用されている。
【0011】
図4は、本発明の骨伝導センサ400の一実施形態を示している。センサ400では、柔らかいエラストマのブリッジ(elastomer bridge)402が標準的な気導マイクロホン406の振動板404に接着されている。この柔らかいブリッジ402は、ユーザの皮膚接触部分408からマイクロホン406の振動板404に直接振動を伝導する。振動板404の動きは、マイクロホン406内のトランデューサ410によって電気信号に変換される。
【0012】
図5は、本発明のハンドヘルドモバイル装置の代替の携帯電話の実施形態500を示している。携帯電話500は、キーパッド502、ディスプレイ504、カーソルコントロール506、気導マイクロホン508、スピーカ510、骨伝導マイクロホンと近接センサとの組合せ512を含む。
【0013】
図6の断面図に示すように、骨伝導マイクロホンと近接センサとの組合せ512は、ユーザが電話を耳に当てたときにユーザに接するように設計されている外面602を有する柔らかい媒体(流体またはエラストマで)充填されたパッド600から成る。パッド600は、電話500内の開口部または開口部のすぐ下に配置されているスピーカ510からの音声の通路を提供するその開口部の周りのリングを形成する。パッド600はこの形状に限定されず、任意の形状のパッドを使用することができる。ただし、一般には、パッド600がスピーカ510の左と右の部分を含んでおり、ユーザがどちらの耳に電話を当てるかに関係なく、パッド600の少なくとも一部分がユーザに接するようにしてあると好ましい。パッドの部分は、外面的に連続していても、外面的には離れているが電話内で互いに滑らかに接続されていてもよい。
【0014】
電子式圧力トランデューサ604は、パッド600内の液体またはエラストマに油圧式に接続され、パッド600内の液体の圧力を導線606上で電気信号に変換する。電子式圧力トランデューサ604の例には、MEMSベースのトランデューサなどがある。一般に、圧力トランデューサ604は、高周波応答を有していなければならない。
【0015】
導線606上の電気信号は、DC(直流)成分およびAC(交流)成分の2つの成分を含む。DC成分は、近接センサ信号を提供する。というのは、パッド600内の静圧は、電話がユーザの耳から多少離れているときより、ユーザの耳に押し当てられたときにより高くなるからである。電気信号のAC成分は、骨伝導マイクロホン信号を提供する。というのは、ユーザの頭蓋骨、顎、または耳の骨の振動は、圧力トランデューサ604によってAC電気信号に変換されるパッド600内の圧力の変動を作り出すからである。一実施形態では、最低周波数を上回る信号のDC成分およびAC成分が通過するのを可能にするために、電気信号にフィルタがかけられる。
【0016】
骨伝導センサの2つの例を上述したが、他の形態の骨伝導センサも本発明の範囲内に含まれる。
【0017】
図7および図8は、本発明によるモバイル装置の代替実施形態の正面図および背面図を示している。図7および図8では、モバイル装置700は、ネックレスまたはチョーカー(首の回りにぴったりする短い首飾り)702およびイヤーバッド(耳に差し込む小型イヤホン)704から成る。ネックレス702は、ひもまたはワイヤなどの首との接触部分(neck engaging piece)708からつり下げられている装飾用/飾りの円板またはペンダント706を含む。首との接触部分は、ユーザ上でモバイル装置を支え、ユーザの首の周りに取り付けられるようにデザインされている。装飾用の円板706は、マイクロホン開口孔709およびビデオ開口孔710を含む。
【0018】
図8の背面図からわかるように、モバイル装置700は、気導マイクロホン712に電力を供給するバッテリ710、補助センサ714、ビデオカメラ716、処理チップセット718、および全地球測位衛星(GPS)受信機720を含む。処理チップセット718は、気導マイクロホン712、補助センサ714、ビデオカメラ716、およびGPS受信機720に接続されている。処理チップセット718は、プロセッサ、メモリ記憶装置、および入出力インターフェイスおよび通信インターフェイス(図示しない)を含む。通信インターフェイスは、プロセッサがイヤーバッド704内のプロセッサ(図示しない)と通信するのを可能にし、それによって処理チップセット718内のプロセッサが音響情報(音声情報)を表す電気信号をイヤーバッド704に送信するのを可能にする。また、処理チップセット718の通信インターフェイスは、ビデオディスプレイ、パーソナルコンピュータ、ルータ、および他のモバイル装置を含む他の装置の集まりと無線通信することもできる。これらの通信に使用されるプロトコルは、802.11プロトコルの任意のバリエーションを含む任意の既知のプロトコルを含むことができる。
【0019】
イヤーバッド704は、外側部分730、耳管部分732、およびスピーカ開口孔734を含む。イヤーバッド704は、処理チップセット718から信号を受信し、その信号を、イヤーバッド704内のスピーカを通して聴覚信号に変換する。この聴覚信号は、スピーカ開口孔734を通ってユーザの耳に入る。イヤーバッド704は、バッテリ(図示せず)、および処理チップセット718の通信インターフェイスとの通信を可能にする通信インターフェイスを含む。
【0020】
図9に示すように、首との接触部分708は、ペンダント706が一般に「喉ぼとけ」と呼ばれる咽頭の甲状軟骨のやや下のユーザの首の前に接するように、ユーザの首904を周回する。イヤーバッド704は、外側部分730が外耳の耳珠900と耳の裏902との間に延びるように、ユーザの耳に取り付けられる。
【0021】
図10は、本発明によるモバイル装置の別の実施形態の図を示している。図10では、このモバイル装置は、腕時計またはブレスレット1000およびイヤーバッド1002を含む。腕時計1000は、ユーザの手首の周りに固定されるようにデザインされている、バンドなどの手首との接触部分1006に取り付けられるエンクロージャ(封入物)1001を含む。エンクロージャ1001は、バッテリ、プロセッサ、メモリ、通信インターフェイス、入出力インターフェイス、GPS受信機、ビデオカメラ、スピーカ、気導マイクロホン、脈拍センサ、酸素濃度センサ、および体温センサを含む1組の電子装置を保持する内部を有する。これらの装置は、図11でより詳しく説明している。通信インターフェイスは、プロセッサがイヤーバッド1002内のプロセッサと通信し、それによって音響情報をイヤーバッド1002に送信し、イヤーバッド1002内の補助センサ1018からデータを受信するのを可能にする。さらに、通信インターフェイスは、ルータ、パーソナルコンピュータ、および他のモバイル装置のうちの1つまたは複数との無線通信を可能にする。エンクロージャ1001は、脈拍および酸素濃度メータ1008、気導マイクロホン1010、およびビデオカメラ1012を含むエンクロージャ内の電子装置の一部に対応する開口部分を含む。脈拍および酸素濃度メータ1008は、ユーザが指をメータの上に置いたとき、ユーザの脈拍を測定するとともに、光源および光センサを使用してユーザの血液の酸素含有量も測定する。エンクロージャ1001の片側の外部は、ディスプレイ1004も含む。
【0022】
イヤーバッド1002は、ユーザの耳管に配置されるように設計されている耳部分1014およびスピーカ開口孔1016を含む。さらに、イヤーバッド1002は、イヤーバッド1002がユーザの耳管内にあるときにユーザの顎(あご)に支えられる補助センサ1018を含む。
【0023】
図11は、本発明のいくつかの実施形態によるモバイル装置1100のブロック図である。モバイル装置1100は、電源装置1152、マイクロプロセッサ1102、メモリ1104、入出力(I/O)インターフェイス1106、および遠隔地のコンピュータ(リモートコンピュータ)、通信ネットワーク、または他のモバイル装置と通信するための通信インターフェイス1108を含む。一実施形態では、上記の構成要素は、適切なバス1110を介して互いに通信するように結合されている。さらに、電力を必要とするすべての構成要素は、一般にバッテリである電源装置1152に接続される。図11において、図を不必要に複雑にするのを避けるために、電源装置1152と残りの構成要素との間の接続は示していない。
【0024】
メモリ1104は、モバイル装置1100への全体の電源がシャットダウンされたときにメモリ1104に格納されている情報が失われないように、不揮発性電子メモリ、例えばバッテリバックアップモジュール(図示せず)を備えるランダムアクセスメモリ(RAM)として実装される。あるいは、メモリ1104のすべてまたは一部は、揮発性または不揮発性の取り外し可能なメモリとすることができる。メモリ1104の一部分は、プログラムの実行用にアドレス指定可能なメモリとして割り当てられ、メモリ1104の別の部分は、ディスクドライブ上で記憶をシミュレートするなど、記憶用に使用されることが好ましい。
【0025】
メモリ1104は、オペレーティングシステム1112、アプリケーションプログラム1114、およびオブジェクトストア1116を含む。動作中、オペレーティングシステム1112は、メモリ1104からプロセッサ1102によって実行されることが好ましい。オペレーティングシステム1112は、好ましい一実施形態では、マイクロソフトコーポレーションから市販されているWINDOWS(登録商標)CEブランドのオペレーティングシステムである。オペレーティングシステム1112は、好ましくは、モバイル装置用に設計され、公開されている1組のアプリケーションプログラミングインターフェイスおよびメソッドを介してアプリケーション1114によって使用することができるデータベース機能を実施する。オブジェクトストア1116内のオブジェクトは、公開されているアプリケーションプログラミングインターフェイスおよびメソッドに対する呼出しに少なくとも部分的に応答して、アプリケーション1114およびオペレーティングシステム1112によって維持される。
【0026】
通信インターフェイス1108は、モバイル装置1100が情報を送受信するのを可能にする多数の装置および技術を表す。一部の実施形態では、通信インターフェイス1108は、電話をかけ、受けるのを可能にするためにセル電話ネットワークと対話するセル電話ネットワークインターフェイスを含む。他のインターフェイスには、2、3例を挙げると、PBx電話インターフェイス、802.11およびそのバリエーションなどの無線プロトコルインターフェイス、衛星放送受信機および放送チューナなどがある。モバイル装置1100は、データ交換を行うコンピュータに直接接続することもできる。このような場合、通信インターフェイス1108は、赤外線送受信装置でも、シリアルまたはパラレルの通信接続でもよく、これらはすべて、ストリーム情報を伝送することができる。
【0027】
通信インターフェイス1108は、モバイル装置1100が、他のモバイル装置への直接的な接続を含めて、外部サーバ1154および遠隔地の装置(リモート装置)1156と通信するのを可能にする。
【0028】
本発明を実施するためにプロセッサ1102によって実行されるコンピュータ実行可能命令は、メモリ1104に格納したり、通信インターフェイス1108を介して受信したりすることができる。これらの命令は、それだけには限定されないが、コンピュータ記憶媒体および通信媒体を含み得るコンピュータ読み取り可能な媒体にある。
【0029】
コンピュータ記憶媒体には、コンピュータ読取可能命令、データ構造、プログラムモジュール、他のデータなどの情報を格納するための任意の方法または技術で実施される揮発性および不揮発性の取外し可能および固定の媒体がある。コンピュータ記憶媒体には、それだけには限定されないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、または所望の情報の格納に使用でき、アクセスできる他の任意の媒体などがある。
【0030】
通信媒体は一般に、コンピュータ読取可能命令、データ構造、プログラムモジュール、または他のデータを搬送波やその他の搬送機構などの変調されたデータ信号に組み込む。これには任意の情報伝達媒体がある。「変調されたデータ信号」という用語は、信号内に情報を符号化するように1つまたは複数のその特性が設定または変更された信号を意味する。通信媒体には、それだけには限定されないが一例として、有線ネットワーク、直接配線された接続などの有線媒体、および音波、RF(無線周波数)、赤外線、その他の無線媒体などのワイヤレス媒体がある。また、上記のどんな組合せでもコンピュータ読み取り可能な媒体の範囲内に含まれるものとする。
【0031】
入出力インターフェイス1106は、全地球測位衛星(GPS)受信機1148、ビデオカメラ1150、スピーカ1130、指入力1132(1つまたは1組のボタン、タッチセンサ、トラックボール、マウスパッド、ローラ、またはユーザの指によって操作することができるこれらの構成要素の組合せなど)、ディスプレイ1134、気導マイクロホン1136、補助センサ1138、脈拍センサ1142、酸素濃度センサ1144および体温センサ1146を含む入力装置および出力装置の集まりとのインターフェイスを表す。一実施形態では、補助センサ1138は、骨伝導または喉伝導のマイクロホンである。上述した装置は、一例であり、モバイル装置1100にすべてが所在している必要はない。さらに、本発明の範囲内で、他の入出力装置がモバイル装置1100に取り付けられていたり、モバイル装置1100に所在していたりしてもよい。
【0032】
気導マイクロホンおよび補助センサを使用することによって、本発明の実施形態は、強調された音声信号を提供することができる。図12は、強調された音声信号を提供する本発明の実施形態の音声処理システムの基本的なブロック図を示している。
【0033】
図12において、スピーカ1200は、気導マイクロホン1204および補助センサ1206によって検出される音声信号1202を生成する。補助センサの例には、ユーザの顔の骨または頭蓋骨の上またはその付近(顎の骨など)、またはユーザの耳の中に配置され、ユーザによって発声された音声に対応する耳、頭蓋骨または顎の振動を感知する骨伝導センサがある。補助センサの別の例には、ユーザの口に向けられ、ユーザの口の動きを検出する赤外線センサがある。補助センサのさらに別の例には、ユーザによって発声された音声に対応するユーザの喉の振動を感知する喉センサがある。気導マイクロホン1204は、一般に音声音波(可聴周波の音波)を電気信号に変換するために使用されるマイクロホンの一種である。
【0034】
また、気導マイクロホン1204は、1つまたは複数の雑音源1210によって生成された雑音1208も受ける。補助センサの種類および雑音のレベルによっては、雑音1208は、補助センサ1206によって検出することもできる。しかし、本発明のほとんどの実施形態では、補助センサ1206は通常、気導マイクロホン1204よりも周囲雑音に対して鈍感である。したがって、補助センサ1206によって生成された補助センサ信号1212は、一般に、気導マイクロホン1204によって生成された気導マイクロホン信号1214よりも少ない雑音を含む。
【0035】
補助センサ信号1212および気導マイクロホン信号1214は、クリーン信号推定器1216に供給され、推定器1216は、補助センサ信号1212と気導マイクロホン信号1214とからクリーンな音声信号1218を推定する。クリーン信号推定値1218は、音声処理1220に供給される。クリーンな音声信号1218は、フィルタリングされた時間領域信号でも、特徴領域ベクトルでもよい。クリーン信号推定値1218が時間領域信号である場合、音声処理1220は、聞き手(リスナー)、セル電話送信器、音声符号化システム、音声認識システムの形をとることができる。クリーンな音声信号1218が特徴領域ベクトルである場合には、音声処理1220は、通常、音声認識システムである。
【0036】
本発明は、気導マイクロホン信号1214および補助センサ信号1212を使用してクリーンな音声を推定するいくつかの方法およびシステムを用いる。あるシステムでは、ステレオトレーニング用データを使用して、補助センサ信号用の補正ベクトルをトレーニング(訓練)する。こうした補正ベクトルは、後でテスト用補助センサベクトルに加算されると、クリーンな信号ベクトルの推定値を提供する。このシステムの他の拡張の1つは、まず、時間によって変化するひずみを追跡し、次いでこの情報を補正ベクトルの計算およびクリーンな音声の推定に組み込むことである。
【0037】
第2のシステムは、補正ベクトルによって生成されたクリーン信号推定値と、気導信号から気導テスト信号中の現在の雑音の推定値を減算することによって形成された推定値との間の補間を提供する。第3のシステムは、補助センサ信号を使用して音声信号のピッチを推定し、次いで推定されたピッチを使用して、クリーンな音声信号に対する推定値を特定する。第4のシステムは、補助センサ信号および気導信号を使用して、補助センサの1つまたは複数のチャネル応答を割出しする直接フィルタリングを使用する。次いでチャネル応答を使用して、クリーンな音声信号を推定する。
【0038】
通信インターフェイス1108を使用すると、本発明のモバイル装置は、図13のブロック図に示すように多数の異なるネットワークを介して多数の他の装置と通信することができる。図13では、3つのモバイル装置1300、1302、および1304を示している。これらのモバイル装置は、通信インターフェイス1108を介して互いに通信することができる。特定の一実施形態では、802.11通信プロトコルを使用して、モバイル装置間の通信を行う。そのモバイル装置は、例えば、モバイル装置1304とは通信せずに、モバイル装置1300と1302とだけが通信するなど、1対1ベースで互いに通信することができる。モバイル装置は、モバイル装置のうちの1つはその他のすべてのモバイル装置と通信するが、該その他のモバイル装置は互いに通信しない、1対多数の構成で通信することもできる。例えば、モバイル装置1300はモバイル装置1302および1304と通信し、しかしモバイル装置1302はモバイル装置1304と通信しない。モバイル装置は、すべてのモバイル装置が互いに通信することができる多対多ベースで通信することもできる。
【0039】
各モバイル装置は、セル電話ネットワーク1306、PBx電話ネットワーク1308、およびローカルエリアネットワーク/ワイドエリアネットワーク(LAN/WAN)1310など、複数のネットワークのうちの1つまたは複数と通信することもできる。セル電話ネットワーク1306と通信するために、モバイル装置は、通信インターフェイス1108を介したセル電話塔(cell phone tower)への直接リンクを使用したり、802.11などのローカルプロトコルを使用してセル電話と通信したりすることができる。次いでセル電話は、モバイル装置通信をセル電話ネットワーク1306のセル電話塔に中継する。
【0040】
モバイル装置1300、1302、および1304は、無線信号をPBx電話ネットワーク用のワイヤーライン信号に変換するPBxハブを介してPBx電話ネットワーク1308と通信することができる。本発明では、こうしたハブに適した任意のプロトコルを使用することができる。モバイル装置は、ラップトップコンピュータ、パーソナルコンピュータ、LAN/WANの一部である無線ルータへの無線接続を通じてLAN/WAN1310と通信することができる。
【0041】
モバイル装置は、ネットワーク1306、1308、および1310を介して、装置1312および1314など他の装置と通信することができる。これらの他の装置は、モバイル装置にサービスを提供するラップトップコンピュータ、パーソナルコンピュータ、またはサーバを含み得る。こうしたサーバは、一部の実施形態では、音声信号および/またはある言語のテキストを別の言語のテキストまたは音声に翻訳する翻訳サーバからのテキストを識別する音声認識サーバを含む。サーバは、インスタントメッセージングを可能にし、ユーザが打ち合わせに参加可能であるかどうかなどのプレゼンス情報を追跡し、音声通信およびビデオ通信を含むライブ打ち合わせ中にドキュメント上でのリアルタイムの共同作業を可能にするように通信を調整するライブ通信サーバも含み得る。サーバは、対象の他のポイントに対するモバイル装置の位置を示す地図など、モバイル装置に関する位置情報を提供する位置ベースサーバも含み得る。
【0042】
本発明のモバイル装置は、気導マイクロホンおよび補助センサを使用して音声信号を感知するため、いくつかのアプリケーションにおいて改善されたパフォーマンスを可能にする強調された音声信号を提供する。さらに、GPS受信機、ビデオカメラ、ならびに脈拍センサ、酸素濃度センサ、および体温センサなどのヘルスセンサなどの他の装置とこれらのマイクロホンおよび補助センサとの組合せは、本発明のモバイル装置を複数のサーバとともに使用することを可能にし、複数の当事者間の通信を容易にする統合されたソリューションを提供する。
【0043】
図14は、モバイル装置を携帯している人を探し出し、打ち合わせ(会議)を行うことを要求するインスタントメッセージをモバイル装置に送って、ライブ通信サーバを使用して打ち合わせを開催する機能を提供する、サーバとモバイル装置との間の接続のブロック図を示している。
【0044】
図14では、モバイル装置1400はGPS受信機を備えている。GPS受信機からの情報を使用して、モバイル装置1400は、自身の位置を、セル電話ネットワークやLAN/WANなどのネットワーク接続1404を介して位置ベースサーバ1402に定期的に伝えている。これは、遠隔地のユーザが、その遠隔地のユーザのコンピューティング装置1406上の人物探索アプリケーション(locate person application)1408を使用して、ネットワーク接続1410を介して位置ベースサーバ1402から、モバイル装置1400についての位置情報を取得するのを可能にする。この位置情報は、住所、または地図上で位置を示すなど、モバイル装置の位置の図形表現を含み得る。
【0045】
モバイル装置1400は、ネットワーク通信1404を介して、ライブ(生)通信サーバ1412と通信することもできる。ネットワーク通信1404は、位置ベースサーバ1402への接続に使用される同じネットワーク接続でも、異なるネットワーク接続でもよい。この接続を通じて、ユーザが所持しているモバイル装置1400は、自身が空きでオンラインであるかどうか、またオフィスにあるか、オッフィスの外にあるかを示すことができる。これは一般に、「プレゼンス(所在)」情報として知られている。
【0046】
さらに、モバイル装置1400は、ライブ通信サーバ1412を介してインスタントメッセージを送受信することができる。こうしたメッセージは、インスタントメッセージアプリケーション1414を使用してメッセージを送受信する遠隔地のユーザ装置1406との間でやりとりされる。これは、例えば、モバイル装置1400のユーザがライブ(生)打ち合わせに参加することを遠隔地のユーザが要求することを可能にする。
【0047】
遠隔地のユーザは、ライブ打ち合わせアプリケーション1418を使用してライブ打ち合わせを確立することができる。ライブ打ち合わせアプリケーション1418は、ライブ通信サーバ1412によって提供されるサービスを使用して、複数のクライアントが音声信号およびビデオ信号と通信し、モバイル装置1400上で行われたドキュメントへの変更が遠隔地のユーザのコンピューティング装置1406のディスプレイにリアルタイムで表示されるように、共有ドキュメントを操作するのを可能にする。
【0048】
モバイル装置1400は、無線通信を使用して、ラップトップコンピュータ1420と通信することができる。モバイル装置1400は、気導マイクロホン信号と補助センサ信号の両方を有することによって得られる強調された音声信号を使用して、ラップトップ1420へコマンドを表す音声信号を送信することができる。ラップトップ1420のコマンド/制御アプリケーション1422は、ネットワーク接続1426を介して音声信号を音声認識サーバ1424に転送する。音声認識サーバ1424は、音声信号をテキスト(文章)に変換し、テキストをコマンド/制御アプリケーション1422に戻す。認識されたコマンドに基づいて、コマンド/制御アプリケーション1422は、1つまたは複数のアプリケーション1428を開始し、その動作を制御する。
【0049】
コマンド/制御ユニット1422を介して開始されるアプリケーションのうちの1つは、モバイル装置のユーザが遠隔地のユーザ1406によって引き起こされたライブ打ち合わせに参加するのを可能にするライブ打ち合わせアプリケーションを含み得る。ラップトップ1420は、ネットワーク接続1430を介してライブ通信サーバ1412と通信することができる。ユーザは、ラップトップ1420上で直接、またはモバイル装置1400を介してラップトップ1420に音声コマンドを発行することによって、ライブ打ち合わせと対話することができる。さらに、ラップトップ1420は、モバイル装置1400によって発声された音声信号を、ライブ通信サーバ1412を介して遠隔地のユーザ装置1406に中継し、それによってライブ打ち合わせの音声部分を提供することができる。モバイル装置のユーザは、ライブ打ち合わせアプリケーションを使用して、音声、ビデオ、およびドキュメントを遠隔地のユーザと共有することができる。これは、モバイル装置のユーザおよび遠隔地のユーザがリアルタイムで同じドキュメントを操作する機能を含む。
【0050】
したがって、図14のブロック図を使用して、遠隔地のユーザは、モバイル装置1400を着用している人が、まだ飛行機に搭乗にしておらず、依然として空港にいることを割出しすることができる。次いで遠隔地のユーザは、インスタントメッセージをモバイル装置1400の携帯者に送信して、モバイル装置の携帯者にライブ打ち合わせに参加するよう要求することができる。モバイル装置の携帯者は、打ち合わせに参加できるときには、自身のラップトップ(ノート型パソコン)1420をオンにし、モバイル装置1400を介してコマンドを発行し、遠隔地のユーザ1406によって立ち上げられたライブ打ち合わせに参加することができる。打ち合わせ中、ユーザは、モバイル装置1400を介して話をして、ライブ打ち合わせに音声入力を提供することができる。音声がモバイル装置1400で強調されるため、ラップトップ1420に供給されたコマンドは、より効率よく確実に動作し、モバイル装置1400によって送出された音声は、ライブ打ち合わせ中、より明瞭となる。
【0051】
図15は、本発明のモバイル装置を配車係(ディスパッチャ)が使用して、仕事を1人または複数の作業員に割り当て、作業員と対話して、仕事を実行するのに必要な情報を作業員に提供する代替実施形態を示している。特に、配車係は、図15のモバイル装置1500を着用している。配車係は、PBx(構内交換機)基地局1502を介してモバイル装置1500と通信するPBx電話ネットワーク1504を介して顧客から通話を受信する。特に、PBx基地局1502は、無線通信をモバイル装置1500に提供し、無線接続に従った通信を、PBx電話ネットワーク1504で伝えることができるアナログ信号に変換する。
【0052】
仕事の要求を受信した後、配車係は、複数の外勤のうちの誰が空いており、現場に最も近いかを割出し(判断)する。どの作業員が空いているかを割出しするために、配車係は、モバイル装置1500に向かって声を出して、コマンド/制御ユニット1506に提供される音声コマンドを生成する。コマンド制御ユニット1506は、モバイル装置1500内に所在していても、ラップトップまたはパーソナルコンピュータなどの別個の装置にあってもよい。コマンド/制御ユニット1506は、音声信号を1つまたは複数のコマンドに変換する。一実施形態で、コマンド/制御ユニット1506は、ネットワーク1510を介して音声信号を音声認識サーバ1508に渡すことによってこの変換を実行する。音声認識サーバ1508は、音声信号をコマンドを表すテキストに変換し、そのテキストをコマンド/制御ユニット1506に戻す。
【0053】
作業員が空いているかどうかを割出しするために、コマンド制御ユニット1506に提供されたコマンドは、プレゼンスアプリケーション1512を使用して各作業員の「プレゼンス(所在)」状況をチェックする旨のコマンドとする。プレゼンスアプリケーションは、ネットワーク接続1516を介してライブ通信サーバ1514と通信する。ライブ通信サーバは、各作業員のプレゼンス状況を格納し、更新する。特に、各作業員は、ネットワーク接続1524を介してライブ通信サーバ1514に接続されるモバイル装置1518、1520、1522などのモバイル装置を持っている。図15には単一のネットワーク接続1524しか示していないが、各モバイル装置は、異なるネットワーク接続、さらには異なるタイプのネットワーク接続を通じて接続することができることに留意されたい。モバイル装置1518、1520、および1522は、ネットワーク接続1524を介して、モバイル装置と一体の作業員のそれぞれの所在状態を更新することができる。
【0054】
空いている作業員については、配車係は、モバイル装置1500を使用して、音声コマンドをコマンド/制御1506に発行して人物探索アプリケーション1530を開くことによって各作業員の現在の位置を見つける。人物探索アプリケーション1530は、ネットワーク接続1532を介して位置ベースサーバ1534と通信する。位置ベースサーバ1534は、ネットワーク1536を介して位置情報を受信することによって、モバイル装置1518、1520、1522の位置を追跡する。ネットワーク1536は、セル電話ネットワークのどの塔によってモバイル装置が通信しているかによってモバイル装置の位置が割出しされるセル電話ネットワークを含むことができる。別の実施形態では、各モバイル装置1518、1520、および1522はGPS受信機を含むことができ、GPS受信機によって割出しされた位置情報は、ネットワーク1536を介して位置ベースサーバ1534に伝えることができる。
【0055】
人物探索アプリケーション1530による要求に応答して、位置ベースサーバ1534は、モバイル装置ごとに位置情報を提供することができる。この位置情報は、住所の形式、または各モバイル装置の位置が地図上に示される図形表示の形式とすることができる。
【0056】
各作業員の位置に基づいて、配車係は、仕事を割り当てる作業員のうちの1人を選択する。一実施形態では、配車係は、コマンド/制御1506を介して音声コマンドを発行して、インスタントメッセージアプリケーション1538を開始し、ネットワーク1516、ライブ通信サーバ1514、ネットワーク1524を介してモバイル装置1518、1520、1522のうちの1つに届くように送られるインスタントメッセージを作成することによって、インスタントメッセージをその作業員に送信する。別の実施形態では、配車係は、モバイル装置1500およびコマンド/制御1506を介してコマンドを発行して、連絡先データベース1542にアクセスして、作業員と一体のモバイル装置の電話番号を探し出すアシスタント(補助)アプリケーション1540を開始する。モバイル装置1500は、この電話番号を使用して、セル電話ネットワーク1544を介して作業員のモバイル装置に接続する。配車係は、このセル電話接続を使用して、現場に向かうように作業員に指示する。
【0057】
作業員が現場への道順を必要とする場合、配車係は、モバイル装置1500を介して音声コマンドを発行して、道順アプリケーション1546のインスタンスを作成する。道順アプリケーションは、位置ベースサーバ1534を使用して、モバイル装置1518、1520、および1522を通じて作業員のうちの1人に道順を提供する。特に、位置ベースサーバ1534は、モバイル装置の位置、および配車係によってモバイル装置1500を介して提供された作業場所を使用して、作業員の現在位置から作業現場の位置に至るまでの地図および運転道順を生成する。
【0058】
作業員は、その位置に到着すると、モバイル装置1518、1520、および1522などそのモバイル装置を使用して、配車係とのライブ打ち合わせを立ち上げて、仕事の明細を受信することができる。これは、配車係にモバイル装置1500を使用させてライブ打ち合わせアプリケーションを呼び出すことによって達成することができる。ライブ打ち合わせアプリケーションは、リアルタイムの共同作業およびプロジェクトの注文書や計画書などのドキュメントの共有を可能にするために、ライブ通信サーバ1514と通信する。
【0059】
本発明の他の実施形態では、モバイル装置は、通信の様々なモード間の切り替えを行うことができる。例えば、図16では、モバイル装置1600は、1対多数ベースで最初に情報を直接他のモバイル装置1602および1604に一斉送信することができる。例えば、モバイル装置1600は、音声、ビデオ、GPS位置情報などの情報、ならびに脈拍、酸素濃度、および体温などの健康情報をモバイル装置1602および1604に提供することができる。この通信モード中、モバイル装置1604は、モバイル装置1600からの位置情報を使用して、モバイル装置1600の携帯者の位置の図形表現を取得することができる。特定の一実施形態で、モバイル装置1604は、ネットワーク1610への無線接続を通じてモバイル装置1600から位置ベースサーバ1608に位置情報を提供することができる。次いで位置ベースサーバ1608は、位置情報を使用して、モバイル装置1604に戻される地図を生成する。こうした実施形態では、ネットワーク1610への無線接続は、ルータ、パーソナルコンピュータ、ラップトップコンピュータを介して行うことができる。
【0060】
モバイル装置1600は、上記のピアツーピア(peer―to―peer)通信からネットワーク接続1612を介した1つまたは複数のサーバとの通信に切り替えることができる。例えば、モバイル装置1600の携帯者が運動中に被害者に遭遇した場合、その携帯者は、モバイル装置1600をモバイル装置との1対多数通信からネットワーク1612を介した通信に切り替えることができる。モバイル装置1600の携帯者は、ネットワーク接続を使用して、ネットワーク1612に接続されているWebサーバ1614に格納されているWebページにアクセスして、救助隊(レスキュー隊)1616を探し出して通信することができる。
【0061】
救助隊1616は、連絡を受けると、被害者の救助に役立たせるために、救助アプリケーション1620を開始して、モバイル装置1600から情報を収集することができる。この情報は、ネットワーク1612を介してモバイル装置1600から位置ベースサーバ1618に提供されたGPS位置情報を含み得る。救助アプリケーション1620は、位置ベースサーバ1618に、モバイル装置1600の位置の図形表現を取得する旨の要求を送信することができ、それによって救助隊1616がモバイル装置の携帯者を探し出すことが容易になる。また、救助アプリケーション1620は、ライブ通信サーバ1622を使用して、救助隊の現在の位置、予想到着時刻、および被害者の手当の指示などの情報をモバイル装置1600の携帯者と共有することもできる。これらの指示は、被害者の手当の方法を示すビデオ、およびモバイル装置1600によってキャプチャー(捕捉)された被害者のビデオを含むことができる。
【0062】
被害者もモバイル装置1624などのモバイル装置を着用している場合、モバイル装置が被害者についての健康情報を提供することができるように、そのモバイル装置をライブ通信サーバ1622を通じての打ち合わせに含めることができる。
【0063】
重傷と思われる場合、救助隊は、遠隔地の(リモート)救急アプリケーション1628を使用して、病院1626の医療チームにライブ打ち合わせに参加するように要求することができる。この遠隔地の救急アプリケーションは、モバイル装置1624によって提供された健康状況情報を収集し、医療チームが音声による指示および視覚的な指示を救助隊1616に与えるのを可能にすることができる。また、遠隔地の救急アプリケーション1628は、医療チームが、診断用機器や手術室などの、患者を看護するのに必要な病院内のリソース(資源)のスケジュール設定を開始するのを可能にすることもできる。
【0064】
本発明のモバイル装置をゲームのコンテキストに使用して、ユーザがチームのメンバおよびゲームの相手と通信することを可能にすることもできる。図17に示すように、それぞれのモバイル装置1704および1706を着用しているプレイヤ1700および1702などのプレイヤは、ゲーム基地局1708と対話する。
【0065】
一実施形態で、遠隔地の(リモート)プレイヤ1710は、ネットワーク1716を介したモバイル装置1704とライブ通信サーバ1714との間の接続を通じてプレイヤ1700の所在または利用できるかどうか(availability)を割出しするために、ネットワーク接続1713を介してライブ通信サーバ1714に接続するプレイヤリストアプリケーション1712にアクセスすることによってそのプレイヤ1700が空いているかどうかを割出しする。ライブ通信サーバ1714がそのプレイヤ1700は空いていることを示す場合、プレイヤ1710は、ライブ通信サーバ1714を介してインスタントメッセージをモバイル装置1704に送信して、そのプレイヤがゲームに参加することを要求することができる。一実施形態では、このゲームは、ネットワーク1720を介してゲーム基地局1708に接続され、またネットワーク1722を介してプレイヤ1710に接続されるゲームサーバ1718によって制御される。
【0066】
ゲーム中、プレイヤ1700および1702からの音声およびビデオは、それぞれモバイル装置1704および1706によってキャプチャーされ、無線接続を通じてゲーム基地局/PC1708に提供される。この音声および/またはビデオは、ネットワーク接続1720を通じてゲームサーバ1718に提供され、ゲームサーバ1718によってプレイヤ1710に転送される。
【0067】
一実施形態では、ネットワーク1720を介して分配される音声情報の帯域幅を低減するために、モバイル装置1704および1706は、モバイル装置と一体のプレイヤが話をしている間に生じていないすべての音を除去する。特に、モバイル装置の補助センサを使用することによって、モバイル装置は、プレイヤが実際に話をしているときを割出しすることができる。プレイヤが話をしていないとき、モバイル装置は、どんな音声データも送信しない。その結果、部屋にいる他のプレイヤからの音声信号、またはスピーカ1724を介してゲームステーションによって生成される音声信号は、モバイル装置1704および1706によって音声データとして出力されない。これによって、ゲーム基地局1708に送信される情報量が低減し、したがってネットワーク1720を介して渡される情報量が低減する。モバイル装置1704および1706によって出力される情報量を低減することによって、本発明は、不要な音声データをフィルタにかけ、一斉送信することをモバイル装置に求めないことによって、モバイル装置1704および1706の消費電力を低減する。消費電力を節約する別のより直接的な方法は、ユーザが話をしていないときに(マイクロホン内の)処理をオフにすることである。
【0068】
また、本発明のモバイル装置は、後で調べることができるように、より良質の音声(特に音声信号)を記録し、格納することを可能にする。図18は、音声データおよびビデオデータの格納および調査を可能にするシステムのブロック図を示している。
【0069】
図18では、モバイル装置1800は、音声データおよびビデオデータを、音声/ビデオメモリ記憶装置1802にローカル(局所的)に格納する。パーソナルコンピュータ1804への無線接続を使用して、メモリ記憶装置1802に格納されている音声データおよびビデオデータをPC1804にダウンロードして、ダウンロード済みデータ1806とすることができる。音声データおよびビデオデータが音声/ビデオ記憶装置1802に格納されているとき、モバイル装置1800は、音声およびビデオがキャプチャーされた日時を示すタイムスタンプ、および音声データおよびビデオデータが収集されたときのモバイル装置1800の位置を示す位置スタンプを含む。一実施形態では、タイムスタンプは、クロック1801から生成され、位置スタンプは、GPS受信機1803によって生成される。タイムスタンプおよび位置スタンプは、それぞれの音声クリップおよびビデオクリップとともにダウンロードデータ1806にダウンロードされる。
【0070】
時間ベースのオーガナイザ(time−based organizer)1808は、タイムスタンプを使用して、時間に基づいてデータをまとめて時間別データ1810を編成する。位置ベースのオーガナイザ(location−based organizer)1812は、データに関連付けられた位置スタンプに基づいて音声データおよびビデオデータをまとめて位置別データ1814を編成する。次いでユーザは、パーソナルコンピュータ1804のディスプレイを使用して、時間別データ1810または位置別データ1814を調べる。
【0071】
ダウンロード済みデータ1806内の音声データは、転写アプリケーション1816によって転写することもできる。音声データを転写するために、転写アプリケーション1816は、パーソナルコンピュータ1804にローカルに見つけることができる音声認識サーバ1818を使用しても、ネットワーク接続1820を介してパーソナルコンピュータ1804に接続してもよい。転写アプリケーション1816は、音声データをテキストに変換する音声認識サーバ1818に、音声信号を表す音声データを送信する。次いでそのテキストは転写アプリケーション1816に戻され、転写アプリケーション1816は、このテキストを使用して写し(transcripts)1822を生成する。モバイル装置1800は補助センサおよび気導マイクロホンを使用して音声データを収集するため、音声認識サーバ1818によって実行される認識がかなり改善され、写し1822は、モバイル装置1800によって収集された実際の音声をよりよく反映する。
【0072】
写し1822が形成されると、ユーザは、特定の会話を探し出すためのキーワードについて写し1822を検索することができる音声アプリケーション1824を呼び出すことができる。
【0073】
本発明のモバイル装置を使用して、モバイル装置を身に付けている子供および老人を探し出し、子供および老人と通信することもできる。例えば、図19では、モバイル装置1900は、子供または老人の身に付けられている。そのモバイル装置は、ネットワーク1902を介して位置ベースサーバ1904にGPS位置情報を提供する。別のユーザは、パーソナルコンピュータ1906を使用して位置ベースサーバ1904に連絡して、モバイル装置1900の携帯者(着用者)の位置情報を取得することができる。この位置情報は、住所、または地図内で携帯者の位置を示す地図の図形表現の形で提供されることができる。他のユーザは、モバイル装置1900と通信する電話ネットワーク1910を介して、電話1908を使用してモバイル装置の携帯者に連絡することもできる。こうした電話ネットワークの一例には、セル電話ネットワークがある。補助センサおよび気導マイクロホンセンサを使用することによって、モバイル装置1900は、電話ネットワーク1910を介して通信するためのより良い音声信号を提供する。これは、モバイル装置1900の携帯者が子供または老人であるときは特に重要である。というのは、子供および老人の音声信号の振幅はかなり低い傾向があり、したがって騒がしい環境では見分けにくいからである。
【0074】
本発明のモバイル装置は、自動翻訳サービスを向上させるために使用することもできる。例えば、図20で、モバイル装置2000は、モバイル装置の携帯者2002および外国語の話者2004からの音声入力を受信する。モバイル装置は携帯者2002によって着用されているため、モバイル装置2000は、携帯者2002によって発声された音声と、外国語の話者2004によって発声された音声とを区別することができる。したがって、外国語の話者2004によって発声された音声を、自動的にモバイル装置2000によって、ネットワーク接続2008を通じて翻訳サーバ2006に送ることができる。次いで翻訳サーバ2006は、外国語の話者2004によって発声された音声の翻訳された音声、または翻訳されたテキストを戻すことができる。したがって、モバイル装置2000上のディスプレイまたはモバイル装置2000上のスピーカを使用して、携帯者2002は、外国語の話者2004の音声の内容を理解することができる。モバイル装置2000は2つの音声信号を自動的に分けることができるため、翻訳はより容易に得られる。
【0075】
また、モバイル装置2000は、外人の音声、翻訳された音声または翻訳されたテキスト、およびモバイル装置2000によってキャプチャーされた外国語の話者のビデオを遠隔地のユーザ2010と共有することもできる。一実施形態では、この情報は、ネットワーク接続2014を介して遠隔地のユーザ2010に接続され、またネットワーク接続2008を介してモバイル装置2000に接続されるライブ通信サーバ2012を介して共有される。ライブ通信サーバ2012を介した接続を使用して、遠隔地のユーザ2010は、外国語の話者2004と話をすることができ、またモバイル装置2000上のディスプレイを介してビデオデータ(画像情報)を外国語の話者2004に提供することができる。遠隔地のユーザ2010によって提供された音声を、モバイル装置2000によって翻訳サーバ2006に送って、外国語の話者の言語に翻訳することができる。この翻訳に基づく音声信号は、次いでモバイル装置2000のスピーカを介して外国語の話者に提供される。
【0076】
図21は、自動翻訳サービスを向上させる本発明の代替実施形態を示している。図21では、モバイル装置2100は、モバイル装置2102の携帯者および外国語の話者2104から音声入力を受け取る。モバイル装置は携帯者2102によって着用されているため、モバイル装置2100は、携帯者2102により発声された音声と、外国語の話者2104により発声された音声とを区別することができる。したがって外国語の話者2104によって発声された音声は、そのモバイル装置2100と別のモバイル装置2105との間の通信において識別可能であり得る。モバイル装置2105は、識別された音声データをモバイル装置2100によって外国語の話者から入ってくるものとみなし、それをネットワーク通信2108を介して翻訳サーバ2106に提供することができる。次いで翻訳サーバ2106は、外国語の話者2104によって発声された音声の翻訳された音声、または翻訳されたテキストを戻すことができる。したがって、モバイル装置2100上のディスプレイまたはモバイル装置2100上のスピーカを使用して、携帯者2102は、外国語の話者2104の音声の内容を理解することができる。モバイル装置2100は2つの音声信号を自動的に分けることができるため、翻訳はより容易に得られる。
【0077】
また、モバイル装置2105は、外人の音声、翻訳された音声または翻訳されたテキスト、およびモバイル装置2100によってキャプチャーされた外国語の話者のビデオ(画像)を複数の遠隔地のユーザ2110、2120、2130と共有することもできる。一実施形態では、この情報は、ネットワーク接続2114を介して遠隔地のユーザ2110、2120、2130に接続され、またネットワーク接続2108を介してモバイル装置2105に接続されるライブ通信サーバ2112を介して共有される。遠隔地のユーザ2110、2120、および2130は、ライブ通信サーバ2112を介した接続を使用して、外国語の話者2104と話をすることができ、またモバイル装置2100上のディスプレイを介してビデオデータを外国語の話者2104に提供することができる。遠隔地のユーザ2110、2120、2130によって提供された音声を、モバイル装置2105によって翻訳サーバ2106に送って、外国語の話者の言語に翻訳することができる。この翻訳に基づく音声信号は、次いでモバイル装置2100のスピーカを介して外国語の話者に提供される。
【0078】
本発明のモバイル装置は、ピアツーピアモードで、プリンタ、機器、メディアレコーダ、メディアプレイヤ、および自動車など、他の装置と通信することもできる。図22は、装置2202、2204、2206など、他の装置と通信するモバイル装置2200を示す図である。
【0079】
特定の一実施形態では、802.11通信プロトコルを使用して、モバイル装置と他の装置との間の通信を行う。モバイル装置は、例えば、装置2204および2206とは通信せずに、モバイル装置2200と装置2202とだけが通信するなど、1対1ベースで他の装置と通信することができる。このモバイル装置は、モバイル装置またはその他の装置のうちの1つがモバイル装置およびその他のすべての装置と通信し、その他の装置は互いに通信しない1対多数の構成で通信することもできる。例えば、モバイル装置2200は装置2202および2204と通信し、装置2202は装置2204と通信しない。装置は、すべての装置およびモバイル装置が互いに通信することができる多対多ベースで通信することもできる。
【0080】
本発明は、特定の実施形態を参照して説明してきたが、本発明の趣旨および請求の範囲から逸脱することなく、それら形態および詳細に変更を加えることができることは、当業者であれば理解されよう。
【図面の簡単な説明】
【0081】
【図1】本発明の一実施形態を示す透視図である。
【図2】図1の電話がユーザの頭部の左側にあるところを示す図である。
【図3】図1の電話がユーザの頭部の右側にあるところを示す図である。
【図4】骨伝導マイクロホンを示すブロック図である。
【図5】本発明の代替実施形態を示す透視図である。
【図6】本発明の一実施形態による代替の骨伝導マイクロホンを示す断面図である。
【図7】本発明のモバイル装置のネックレス型の具体例を示す正面図である。
【図8】図7のネックレス型の具体例を示す背面図である。
【図9】図7のネックレス型の具体例がユーザに着用されたところを示す図である。
【図10】本発明のモバイル装置のブレスレット/腕時計型の具体例を示す透視図である。
【図11】本発明の一実施形態によるモバイル装置を示すブロック図である。
【図12】本発明の一般の音声処理システムを示すブロック図である。
【図13】本発明のモバイル装置の考え得る通信接続を示すブロック図である。
【図14】打ち合わせを容易にするための本発明のモバイル装置との複数の通信接続を示すブロック図である。
【図15】作業命令の発送を容易にするための本発明のモバイル装置との複数の通信接続を示すブロック図である。
【図16】グループ通信を容易にし、救助に役立つ本発明のモバイル装置との複数の通信接続を示すブロック図である。
【図17】ゲームを容易にするための本発明のモバイル装置との複数の通信接続を示すブロック図である。
【図18】本発明のモバイル装置を使用してビデオおよび音声を格納し、整理し、調べる構成を示すブロック図である。
【図19】子供/老人を探し出し、子供/老人と通信することを容易にするための本発明のモバイル装置との複数の通信接続を示すブロック図である。
【図20】音声の翻訳を必要とする打ち合わせを容易にするための本発明のモバイル装置との複数の通信接続を示すブロック図である。
【図21】音声の翻訳を必要とする打ち合わせを容易にするための本発明のモバイル装置との複数の通信接続を示すブロック図である。
【図22】本発明のモバイル装置と他の装置との間の複数のピアツーピア通信接続を示すブロック図である。
【符号の説明】
【0082】
100,500 携帯電話
102,502 キーパッド
104,504,1004,1134 ディスプレイ
106,506 カーソルコントロール
108,406,712,1010,1136,1294 気導マイクロホン
110,510,1130,1200,1724 スピーカ
112,114 骨伝導マイクロホン
116 近接センサ
200 左耳
202 口
300 右耳
400 骨伝導センサ
402 エラストマのブリッジ
403 振動板
408 皮膚接触部分
410,604 トランデューサ
512 骨伝導マイクロホンと近接センサの組み合わせ
600 パッド
606 導線
700 モバイル装置
702 ネックレスまたはチョーカー
704,1002 イヤーバッド
706 円板
708 首との接触部分
709 マイクロホン開口孔
710 バッテリ
714,1018,1138,1206 補助センサ
716,1012 ビデオカメラ
718 処理チップセット
720,1148,1803 GPS受信機
730 外側部分
732,1014 耳管部分
734,1016 スピーカ開口孔
900 耳珠
902 耳の裏
904 首
1000 ブレスレット
1001 封入物(エンクロージャ)
1006 手首はめ込み部分
1008 酸素濃度メータ
1102 プロセッサ
1104 メモリ
1108 通信インターフェイス
1116 オブジェクトストア
1132 指入力
1142 脈拍センサ
1144 酸素濃度センサ
1146 体温センサ
1150 ビデオ
1152 電力
1154 外部サーバ
1156 遠隔地の装置
1204 気導マイクロホン
1206 補助センサ
1210 雑音
1216 クリーン信号推定器
1220 音声処理
1300,1300,1302,1304,1400,1500,1518、1520、1522,1600,1602,1604,1624,1704,1706,1800,1900,2000,2100,2105,2200 モバイル装置
1306,1544 セル電話ネットワーク
1308,1504 PBx電話ネットワーク
1312,1314 他のユーザ/サーバ
1402,1618,1904 位置ベースサーバ
1404,1410,1416,1426,1430,1510,1713,1716、1720,1724,1902 ネットワーク
1406,2010,2110,2120,2130 遠隔地のユーザ装置
1408,1408,1530 人物探索アプリケーション
1412,1514、1622、1714 ライブ通信サーバ
1420 ラップトップ
1422,1506 コマンド制御
1424,1508,1818 音声認識サーバ
1502 PBx基地局
1512 プレゼンス
1540 アシスタント
1542 連絡先DB
1546 道順
1550 ライブ打ち合わせ
1614 Webサーバ
1616 救助隊
1620 救助アプリケーション
1626 病院
1628 遠隔地の救急アプリケーション
1700,1702,1710 プレイヤ
1708 ゲーム基地局/PC
1710 遠隔地のプレイヤ
1712 プレイヤリストアプリケーション
1718 ゲームサーバ
1801 クロック
1802 音声/ビデオ記憶装置
1806 ダウンロード済みデータ
1808 時間ベースのオーガナイザ
1810 時間別データ
1812 位置ベースのオーガナイザ
1814 位置別データ
1816 転写アプリケーション
1822 転写
1824 音声アプリケーション
1908 電話
1910 電話ネットワーク
2002,2102 携帯者
2004,2104 外国語の話者
2006,2106 翻訳サーバ
2010,2110,2120,2130 遠隔地のユーザ
2012,2112 ライブ通信
2202,2204,2206 装置

【特許請求の範囲】
【請求項1】
音波を電子マイクロホン信号に変換する気導マイクロホンと、
音声に関する情報を含む電子補助センサ信号を供給する補助センサと、
当該モバイル装置が他のモバイル装置と直接通信するのを許容する通信インターフェイスと
を具備することを特徴とするモバイル装置。
【請求項2】
前記通信インターフェイスは他のモバイル装置との複数のタイプの通信を許容することを特徴とする請求項1に記載のモバイル装置。
【請求項3】
前記複数のタイプの通信のうちの1つは、他の複数のモバイル装置が通信に応じられるときでさえ、他のモバイル装置の1つだけとする1対1通信を含むことを特徴とする請求項2に記載のモバイル装置。
【請求項4】
前記複数のタイプの通信のうちの1つは、他の複数のモバイル装置との1対多数通信を含むことを特徴とする請求項2に記載のモバイル装置。
【請求項5】
前記複数のタイプの通信のうちの1つは多対多通信を含むことを特徴とする請求項2に記載のモバイル装置。
【請求項6】
前記通信インターフェイスはネットワークへの通信をさらに許容することを特徴とする請求項1に記載のモバイル装置。
【請求項7】
前記通信インターフェイスはネットワーク上のサーバとの通信をさらに許容することを特徴とする請求項6に記載のモバイル装置。
【請求項8】
前記サーバとの前記通信は音声およびビデオを含むことを特徴とする請求項7に記載のモバイル装置。
【請求項9】
前記サーバとの通信は、他のコンピューティング装置と共有されるドキュメントの画像に対応するデータをさらに含むことを特徴とする請求項8に記載のモバイル装置。
【請求項10】
前記サーバとの通信は、前記ドキュメントを変更する指示をさらに含み、前記指示に基づいて、前記サーバは、前記ドキュメントを変更し、前記ドキュメントの変更に対応するデータを前記他のコンピューティング装置に提供することを特徴とする請求項9に記載のモバイル装置。
【請求項11】
前記モバイル装置は、該モバイル装置の位置を示す位置数値データ(position value)を生成することができる全地球測位衛星受信機をさらに含むことを特徴とする請求項7に記載のモバイル装置。
【請求項12】
サーバとの通信は、該サーバに前記位置数値データを提供するステップを含むことを特徴とする請求項11に記載のモバイル装置。
【請求項13】
前記サーバは音声認識プログラムをホストし、該サーバと通信することは、該サーバに音声データを提供し、該サーバから認識されたテキストを受信することを含むことを特徴とする請求項7に記載のモバイル装置。
【請求項14】
前記サーバは翻訳プログラムをホストし、該サーバと通信することは、ある言語の内容を該サーバに提供し、該サーバから別の言語の翻訳を受信することを含むことを特徴とする請求項7に記載のモバイル装置。
【請求項15】
前記モバイル装置はセル電話(セル方式の携帯電話)を含むことを特徴とする請求項1に記載のモバイル装置。
【請求項16】
前記モバイル装置はPDAを含むことを特徴とする請求項1に記載のモバイル装置。
【請求項17】
前記通信インターフェイスは別の装置への直接的な通信をさらに許容することを特徴とする請求項1に記載のモバイル装置。
【請求項18】
気導マイクロホン信号を受信するステップと、
音声に関する情報を含む補助センサ信号を受信するステップと、
前記気導マイクロホン信号および前記補助センサ信号に基づいて、強調したクリーン音声値を推定するステップと、
前記強調したクリーン音声値を他のモバイル装置に直接提供するステップと
を含むことを特徴とするモバイル装置における方法。
【請求項19】
前記強調したクリーン音声値を他のモバイル装置に直接提供するステップは、当該モバイル装置と前記他のモバイル装置との間の1対1通信中に前記強調したクリーン音声値を提供するステップを含むことを特徴とする請求項18に記載の方法。
【請求項20】
前記強調したクリーン音声値を他のモバイル装置に直接提供するステップは、前記モバイル装置と複数の他のモバイル装置との間の1対多数通信中に前記強調したクリーン音声値を提供するステップを含むことを特徴とする請求項18に記載の方法。
【請求項21】
前記強調したクリーン音声値を他のモバイル装置に直接提供するステップは、複数のモバイル装置間の多対多通信中に前記強調したクリーン音声値を提供するステップを含むことを特徴とする請求項18に記載の方法。
【請求項22】
前記モバイル装置とコンピューティング装置のネットワークとの間の通信を行うステップをさらに含むことを特徴とする請求項18に記載の方法。
【請求項23】
前記モバイル装置とコンピューティング装置の前記ネットワーク上のサーバとの間の通信を行うステップをさらに含むことを特徴とする請求項22に記載の方法。
【請求項24】
前記モバイル装置と前記サーバとの間の通信を行うステップは、インスタントメッセージを通信するステップを含むことを特徴とする請求項23に記載の方法。
【請求項25】
前記モバイル装置と前記サーバとの間の通信を行うステップは、前記サーバと通信する他のコンピューティング装置と共有される情報を通信するステップを含むことを特徴とする請求項23に記載の方法。
【請求項26】
共有される前記情報は、前記モバイル装置および前記他のコンピューティング装置に表示されるオブジェクトへの変更を含むことを特徴とする請求項25に記載の方法。
【請求項27】
共有される前記情報は音声情報をさらに含むことを特徴とする請求項26に記載の方法。
【請求項28】
共有される前記情報はビデオ情報をさらに含むことを特徴とする請求項27に記載の方法。
【請求項29】
前記モバイル装置の位置を割出しし、該モバイル装置の前記位置を該モバイル装置から前記サーバに伝えるステップをさらに含むことを特徴とする請求項23に記載の方法。
【請求項30】
前記モバイル装置の前記位置を使用して地図を生成し、該地図を前記サーバから他のコンピューティング装置に伝えるステップをさらに含むことを特徴とする請求項29に記載の方法。
【請求項31】
前記サーバにおいて翻訳サービスを使用して、前記モバイル装置から前記サーバに送信されたデータに基づいて、テキストをある言語から別の言語に翻訳するステップをさらに含むことを特徴とする請求項23に記載の方法。
【請求項32】
前記テキストの前記翻訳を表す音声信号を表す値を前記サーバから前記モバイル装置に戻すステップをさらに含むことを特徴とする請求項31に記載の方法。
【請求項33】
前記テキストの前記翻訳を表すテキストを前記サーバから前記モバイル装置に戻すステップをさらに含むことを特徴とする請求項31に記載の方法。
【請求項34】
前記モバイル装置と他の装置との間の通信を行うステップをさらに含むことを特徴とする請求項18に記載の方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate


【公開番号】特開2006−115476(P2006−115476A)
【公開日】平成18年4月27日(2006.4.27)
【国際特許分類】
【出願番号】特願2005−257895(P2005−257895)
【出願日】平成17年9月6日(2005.9.6)
【出願人】(500046438)マイクロソフト コーポレーション (3,165)
【Fターム(参考)】