ｎ−Ｗａｙ選択的言語処理を用いたリアルタイムＶｏＩＰコミュニケーションのためのシステムおよび方法

【課題】選択的同報通信プロトコルを用いて、複数の参加者の間で同時リアルタイム多言語コミュニケーションを可能にするコンピュータ実行の方法およびシステムを提供する。
【解決手段】該方法は、第一参加者からのリアルタイム・コミュニケーションを第一サーバで受信するステップを含み、該リアルタイム・コミュニケーションは、第一会話言語で構成され第二参加者に宛てられている。第二参加者が、リアルタイム・コミュニケーション受信の選好会話言語を識別する。該受信の選好会話言語がリアルタイム・コミュニケーションの第一会話言語と異なっているかどうかの判定が行われる。該選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは、第一会話言語から第二参加者の受信選好会話言語に翻訳されて配信され、翻訳されたリアルタイム・コミュニケーションが生成され、第二参加者の選好会話言語が第一参加者の選好会話言語と同じ場合は翻訳しないで転送される。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明の実施形態は、ｎ−Ｗａｙ（ウエイ）選択的音声プロトコルを用い、フレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイス、システム、および方法に関する。
【背景技術】
【０００２】
インターネット・プロトコル（ＩＰ：ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）構内交換装置（ＰＢＸ：ＰｒｉｖａｔｅＢｒａｎｃｈＥｘｃｈａｎｇｅ）は、内部参加者のためＩＰネットワークを介した電話を経路設定し、外線へのアクセスを提供する、構内交換装置または構内電話交換システムである。また、通常、ＩＰＰＢＸは、ＶｏＩＰ参加者と従来式電話システムの通話者との間の電話も交換する。こういった製品は、通常、サーバまたは専用の機器上で作動するソフトウエア・パッケージである。ＩＰＰＢＸは、別個の音声ネットワークの必要性を排除し、代わりに、同じネットワークに音声およびデータのトラフィックを一つにまとめる。既存の製品は、音声メニュー・システム、電話会議、クリックツーコール、通話記録および追跡、音声メール、および自動転送など、多様な電話マネジメント機能を提供している。ＩＰＰＢＸを用いて、企業は、参加者のデスクトップで作動、またはＩＰネットワーク上で機能するよう設計された従来式の机上電話セットで作動する、ソフトウエア実装だけのＩＰ電話である「ソフトフォン」を選択することができる。
【０００３】
ＮｅｍｅｒｔｅｓＲｅｓｅａｒｃｈ社のロビン・ガレイス（ＲｏｂｉｎＧａｒｅｉｓｓ）によれば、諸組織は、ＶｏＩＰに移行することによって、ＷＡＮコストを１５％〜４０％節約し、節約の平均は２３％である。主な節約分野は以下の３分野である。
【０００４】
１．典型的にはフレーム・リレー、非同期伝送モード、または専用回線ネットワークから、マルチプロトコル・ラベル・スイッチング（ＭＰＬＳ：ＭｕｌｔｉｐｒｏｔｏｃｏｌＬａｂｅｌＳｗｉｔｃｈｉｎｇ）への移行。ＶｏＩＰは、ＭＰＬＳへの転換の推進要因であるが、同速度の回線に対する全体的コストはより低い。を参照。
【０００５】
２．統合アクセス、これによって、企業は、音声とデータとを同一のアクセス・ラインに組み合わせ、利用度の低い回線を排除する。
【０００６】
３．統合コア回線。組織は、音声およびデータネットワークを組み合わせ、６０％の平均使用率、非常にうまく管理されているネットワークでは７５％から８５％に達するピーク使用率を得ている。これら組織は、コアに低使用率の高速回線を使う必要性を排除している。
【発明の概要】
【発明が解決しようとする課題】
【０００７】
ＭＰＬＳは、Ｉｐｓｉｌｏｎ（商標）のＩＰスイッチング、Ｃｉｓｃｏ（商標）のＴａｇスイッチング、ＩＢＭ（ＩＢＭ社の登録商標）のＡＲＩＳ（ＩＢＭ社の登録商標）技術、並びに、コネクション型の非同期伝送モードおよびフレーム・リレー・ネットワークに見られるトラフィック技術の類からコネクションレスＩＰネットワークへの移行についての、他のいくつかの提案に起源している。ＩＰトラフィックを、単一ルートに換えて多様なルートで送るという着想は、ボーダ・ゲートウェイ・プロトコルなどの内部ゲートウェイ・プロトコルによって、混雑または障害を回避するため、あるいは特定クラスのサービスまたは保証されたサービス・レベルを可能にするため考え出されたものである。ＭＰＬＳスイッチおよびルータは、宛先、サービス・パラメータの種類、仮想プライベート・ネットワーク会員資格、または他の基準に基づいて、パケットにラベルを添付する。パケットがネットワークを進むにつれ、他のスイッチおよびルータは、パケットおよび経路をラベルと関連付けるテーブルを作成する。ラベル・スイッチ・ルータとも呼ばれるＭＰＬＳスイッチおよびルータ群は、各パケットに、ネットワークを通る特定の経路に対応するラベルをあてがう。同じラベルの全パケットは、同じ経路、いわゆるラベル・スイッチ・パス（ＬＳＰ：ＬａｂｅｌＳｗｉｔｃｈｅｄＰａｔｈ）、を使う。ラベルはエンドポイントでなく経路を示しているので、同じエンドポイントに宛てられたパケット群は、そこに到達するためにさまざまなＬＳＰと使うことができる。既存のインターネット・スイッチング・システム（ＩＰＰＢＸ）は、パケットを一つのエンドポイントから別のエンドポイントにルーティングするように最適化されている。しかしながら、ＶｏＩＰパケットを使うアプリケーションは、リアルタイム・ルーティング要件に加え、リアルタイム処理の要件も必要とする。今日、異なる言語を話す人々の間でのボイス・オーバーＩＰ（ＶｏＩＰ：ＶｏｉｃｅｏｖｅｒＩＰ）を使ったコミュニケーションは、発呼および受呼当事者の両方が理解し話すことのできる言語を使ってだけ行うことができる。企業が世界的な人的資源を自社の労働力に組み込むにつれ、言語バリアが益々重大な障害になっている。本発明は、ｎ−Ｗａｙ選択的音声プロトコルを用いてフレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイスおよび方法に関する。
【０００８】
開発プロジェクトにおいて、地理的に分散されたチームの間の非効率的なコミュニケーションがプロジェクトのリスクおよびコストを増大させている。今日、異なる言語を話す人々の間での、ボイス・オーバーＩＰを介した（ＶｏＩＰ）コミュニケーションは、発呼および受呼当事者の両方が理解し話すことのできる言語使うか、または通訳を介してだけ行うことができる。
【０００９】
本発明は、既存のＶｏＩＰネットワークを拡張し、複数参加者の同時翻訳機能およびサービスを可能にする。
【課題を解決するための手段】
【００１０】
従来の方法および構造の前述および他の典型的な問題、欠点および不利点をかんがみ、本発明の実施形態の例示的態様は、選択的同報通信プロトコルを用い複数の参加者の間でのリアルタイム・コミュニケーションを可能にするコンピュータ実行の方法を提供し、該方法は、第一サーバが第一参加者からのリアルタイム・コミュニケーションを受信するステップを含み、該リアルタイム・コミュニケーションは、第一会話言語で構成され、第二参加者に宛てられている。第二参加者がリアルタイム・コミュニケーション受信に選好する会話言語を識別する。該選好受信会話言語が、該リアルタイム・コミュニケーションの第一会話言語と異なっているかどうかが判定される。選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは第一会話言語から第二参加者の受信選好会話言語に翻訳され、翻訳されたリアルタイム・コミュニケーションが生成される。翻訳されたリアルタイム・コミュニケーションは第二参加者に配信される。
【００１１】
本発明の別の例示的実施形態は、少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル（ＶｏＩＰ：ＶｏｉｃｅＯｖｅｒＩｎｔｅｒｎｅｔｐｒｏｔｏｃｏｌ）サーバと、少なくとも一つの受信ＶｏＩＰサーバと、送信ＶｏＩＰサーバと受信ＶｏＩＰサーバとの間の通信を提供する少なくとも一つのＶｏＩＰ通信ネットワークとを含む通信システムを提供する。翻訳モジュールは、該少なくとも一つのＶｏＩＰ通信ネットワークを通して、送信および受信ＶｏＩＰサーバ間にアクティブなｎ−Ｗａｙ双方向自動音声翻訳チャネルを確立する。特定の場所にある処理ＶｏＩＰサーバは、少なくとも一つのＶｏＩＰ通信ネットワーク上の相異なる会話言語の参加者間の少なくとも一つの会話言語を翻訳する。該少なくとも一つの会話言語の処理は、処理ＶｏＩＰサーバのある特定の場所で、それぞれの参加者の場所およびプロフィールに基づいて行われるよう設定される。
【００１２】
本発明の別の例示的実施形態は、複数場所、複数参加者の音声翻訳セッションを開始するステップと、次いで参加者に基づいて音声翻訳処理が必要かどうかを判定するステップとを含む、コンピュータ実行の方法を提供する。複数場所の各々における利用可能な翻訳リソースが判定され、該複数の場所の各々において利用可能な翻訳リソースと、コミュニケーション・セッションのリアルタイム要件とに基づいて、同時翻訳処理の可能最大数が計算される。デフォルト・サーバが、音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の両方を満たすことができるかどうかの判定が行われ、次いで、話し手参加者と聞き手参加者との参加者プロフィールの対比に基づいて、翻訳処理サービスが利用可能な翻訳リソースに割り当てられる。
【００１３】
これらの新規な特長により、本発明のある実施形態は、話し手ＶｏＩＰサーバが、発話元言語および標的言語コンテントを同時処理するために最適な場所にある利用可能なリソースを探し出して識別し、これにより、終端の参加者（達）が聞き手ＶｏＩＰサーバから処理済みのデータをリアルタイムで受信し、オンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持されるようにすることができる、プロトコル方法およびシステムを提供することができる。
【００１４】
前述のおよび他の典型的な目的、態様および利点は、以下の本発明の例示的実施形態の詳細な説明を、図面を参照しながら読むことによってより良く理解することができよう。
【図面の簡単な説明】
【００１５】
【図１】ボイス・オーバー・インターネット・プロトコル（ＶｏＩＰ）に基づいた、セッション開始プロトコル（ＳＩＰ：ＳｅｓｓｉｏｎＩｎｉｔｉａｔｉｏｎＰｒｏｔｏｃｏｌ）を示す。
【図２】本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図３】図３Ａは４つのプロフィール設定用ディスプレイ・ページの一組を示し、図３Ｂは、翻訳の質問のため表示された、ユーザ／参加者プロンプト・ウィンドウを示し、これらは、本発明のある実施形態にサポートされているＳＩＰ方法を示す。
【図４】本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図５】最適の場所で処理をするためのサーバ割当手順を含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図６】ＶｏＩＰセッションの例を含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図７】ＶｏＩＰネットワーク上の複数参加者の音声処理を含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図８】遊休時モードを含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図９】選択的プロトコルを用いるコミュニケーションを含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図１０】本発明の一つの実施形態の方法についての論理フローチャートを含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図１１】本発明の一つの実施形態のシステム略図を含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図１２】本発明の一つの実施形態の方法に対する論理フローチャートを含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示す。
【図１３】本発明のある実施形態の例示的態様によるコンピュータ・システムおよび方法を実装するため用いることのできる、典型的なハードウエア構成システムを示す。
【図１４】発明のある実施形態の例示的態様によるコンピュータ・システムおよび方法を実装するため用いることのできる、プログラム可能な記憶媒体を示す。
【発明を実施するための形態】
【００１６】
ここで、図面、さらに具体的には図１〜図１４を参照すると、本発明の方法の典型的実施形態群およびある実施形態の構造が示されている。
【００１７】
概観
参照により本明細書に組み込まれる米国特許第６，４３４，５２６号は、スピーチ認識能力を含有するネットワーク・アプリケーション・ソフトウエア・サービスについて記載している。スピーチ認識ソフトウエアは、通信ネットワーク上のアプリケーション特有のソフトウエアと組み合わせて提供される。アナログ音声データは、ユーザの場所でデジタル化され、音声データとして識別され、中央となる場所に所在するアプリケーション・ソフトウエアに送信される。ネットワーク・サーバが、音声データとして識別されたデータを受信し、それをスピーチ・サーバに送信する。スピーチ・サーバに常駐するスピーチ認識ソフトウエアは、辞書、および該スピーチ認識ソフトウエアのユーザの各々の声にあわせたモジュールを包含している。ユーザが話すにつれ、口述の翻訳がユーザの場所に返信され、点検および必要な場合音声または印字による内容訂正のため、ユーザのコンピュータ画面に印字で表示される。複数のユーザは、ユーザの各々に対する返信が同時ベースで行われるようにするため、スピーチ認識ソフトウエアに交互にアクセスする。
【００１８】
参照により本明細書に組み込まれる米国特許第７，０５８，０４６号は、拡張性のある電話管理システムについて記載している。該システムには、一つ以上の音声ブラウザをホストする少なくとも一つの音声サーバを含めることができ、該音声サーバは、音声ブラウザが音声電話要求を通して処理することができる単一の通信ポートを有し、各音声ブラウザは、音声電話要求を通して処理することができるポート・エイリアスを有する。また、該システムには、公衆交換式電話ネットワーク（ＰＳＴＮ：ｐｕｂｌｉｃｓｗｉｔｃｈｅｄｔｅｌｅｐｈｏｎｅｎｅｔｗｏｒｋ）中の回線エンドポイントを音声サーバにリンクする電話処理ゲートウェイを含めることができる。最後に、該システムには、それぞれの音声ブラウザへのポート・エイリアスをマップする転換テーブルを含めることができる。
【００１９】
参照により本明細書に組み込まれる米国特許第７，４０６，４１４号は、音声ストリームの中で翻訳を提供する方法について記載しており、該方法は、第一言語のスピーチ信号を受信するステップと、該スピーチ信号からテキストを設定するステップと、該テキストを第二の異なる言語に翻訳するステップと、翻訳されたテキストをスピーチ信号内に符号化するステップとを包含することができる。
【００２０】
企業が世界的な人的資源を自社の労働力に組み込むにつれ、言語バリアが益々重大な障害になっている。本発明は、ｎ−Ｗａｙ選択的音声プロトコルを使うＶｏＩＰチャネルを用いて、フレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイスおよび方法に関する。
【００２１】
普通、複数の言語翻訳が要求される場合、ＶｏＩＰリアルタイム要件が所与のサーバ・アプリケーションの設計能力を超えることがあり得る。課題は、どのサーバが、本発明が対象とする同時的プロフィール・ベースのＶｏＩＰ処理の所与の数に対し、リアルタイム処理要件およびルーティング要件を満たすことができるかを判定することである。
【００２２】
本発明のある実施形態は、話し手ＶｏＩＰサーバが、発話元言語および標的言語コンテントを同時処理するため最適な場所にある利用可能なリソースを探し出して識別し、これにより、少なくとも一人のエンド参加者が聞き手ＶｏＩＰサーバから処理済みのデータをリアルタイムで受信し、選択的同報通信プロトコルに基づくオンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持されるようすることができる、システムおよび方法を提供する。
【００２３】
例示的態様
再度、図面を参照すると、図１には、ボイス・オーバー・インターネット・プロトコル（ＶｏＩＰ）に基づいた、セッション開始プロトコル（ＳＩＰ）が示されている。ＳＩＰアプリケーション層は、コンテントが音声、映像、データ、またはウェブ・ベースのもののいずれかに関わらず、一人以上の参加者のエンド・デバイスがどのように接続を生成し、変更し、終了することができるかを定義する。しかしながら、ＳＩＰの限界は、電話会議セッションでは、全ＳＩＰパケットが参加者全員に同報通信され、従い同時参加者に対する計算およびピアツーピア（Ｐ２Ｐ）処理能力の拡張性が制限されることにある。図１には、コミュニケーションの開始１００と、その後の同報通信パケットの生成または受信１０２が示されている。コミュニケーションを終了する決定がされなければ１０４、同報通信パケットが続けて生成、受信され、終了決定されれば終了される１０６。
【００２４】
図２には、本発明のある実施形態の新規なＳＩＰベースのＶｏＩＰが示されており、電話会議のセッションにおいては、拡張ＳＩＰパケットが、参加者の言語プロフィールおよび利用可能な計算および通信リソースに基づいた選択的同報通信コミュニケーション・チャネルを流れ、参加者間のまとまりを維持する。２００においてコミュニケーションの開始が起動され、その後コミュニケーションがｎ−Ｗａｙ通信かどうかの判定がされる２０２。少なくとも２つの言語が関わる単一のコミュニケーション・セッションに２人を超える参加者がいる場合は、ｎ−Ｗａｙ通信である。ｎ−Ｗａｙユーザ／参加者コミュニケーションがなく、例えば２方向性コミュニケーションだけであると判定された場合は、同報通信パケットが生成されまたは受信され２０４、コミュニケーションを終了すると決められ２０６該コミュニケーションが完全に終了する２０８まで生成または受信が続けられる。なお、エレメント２０４、２０６、および２０８は、図１のエレメント１０２、１０４、および１０６と同じである。
【００２５】
ｎ−Ｗａｙ通信が、あるユーザ／参加者によって起動されたと判定された場合２０２、同報通信パケットが生成または受信される２１０。コミュニケーションの間に、ユーザ／参加者の発話要求が受信されたと判定された場合２１２、アービタ・サービス２１４は、同期ポイントで同報通信パケットに割り込むことができる。コミュニケーション・セッションを終了するとの決定がなされるまで２１６、コミュニケーション・セッションが続く。コミュニケーション・セッションを終了するとの決定がなされた後２１６、コミュニケーション・セッションは終了される２１８。
【００２６】
図３Ａは４つのプロフィール設定用ディスプレイ・ページの一組３００を示し、ユーザ／参加者は、コミュニケーション・セッションを開始するに先立って、これらページにおいてユーザ／参加者プロフィール設定を初期選択することができる。「言語設定」ページ３０２は、ユーザ／参加者が、言語翻訳を有効にし、選好および代替翻訳言語を選択し、ユーザ／参加者コンタクト・プロフィールに基づいて特定のユーザ／参加者に固有の選好言語を選択し、各ユーザ／参加者コンタクトとの直近使用言語を用いるかどうか、およびコミュニケーションが翻訳されている間ユーザ／参加者に警告表示させるかどうかを選定できるページを示す。「音声識別」ページ３０４は、ユーザ／参加者が、ユーザ／参加者の写真、または氏名、または身分証明を表示させることによって、翻訳された合成音声を識別することを選定できるページを示す。「翻訳エンジン」ページ３０６は、ユーザ／参加者が、サーバ翻訳を行う場合の選択を行えるページを示す。例えば、ユーザ／参加者のサーバで翻訳してもよいし、ユーザ／参加者のデバイスで翻訳してもよいし、もしくは、サーバの負荷、ユーザ／参加者のデバイスの能力、またはユーザ／参加者の数および翻訳対象言語の数、あるいはこれらの複数に基づいて、自動的に翻訳デバイスを決定することもできる。「テキスト」ページ３０８は、ユーザ／参加者が、ユーザ／参加者の元々のまたは選好する言語のいずれかを使って、翻訳されたテキスト・インプットをスピーチに変換したり、入来する翻訳音声をテキストに変換したりすること、および、テキストに変換されている場合入来する翻訳音声を消音することができるページを示す。
【００２７】
図３Ｂは、コミュニケーション・セッションが開始されたとき、翻訳問い合わせについて表示されるユーザ／参加者プロンプト・ウィンドウ３１０を示す。例えば、あるユーザ／参加者が、ある特定の言語で音声コミュニケーションを開始したことが識別される。ユーザ／参加者プロンプト・ウィンドウ３１０は、該コミュニケーションの、図３Ａの「言語設定」ページ３０２で選定されたユーザ／参加者の選好言語への翻訳を起動するようにうながす。
【００２８】
図４は、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示し、ＶｏＩＰネットワーク４００が、複数のサーバ４０２、４０６、４０８、４１０、４１２、および４１４を含む円で表されている。ネィティブ言語が例えば英語である、ＳＩＰベースのユーザ／参加者１４０４によって、話し手サーバ４０２を使いｎ−Ｗａｙ通信セッションが開始される。話し手サーバ１４０２は、複数のチャネルＣｈ１、Ｃｈ２、Ｃｈ３、…、Ｃｈｎを介して複数の聞き手サーバ２〜６４０６〜４１４に転送する。各聞き手サーバは、英語の同報通信音声パケットと、それに加え、ユーザ／参加者１４０４のユーザ／参加者プロフィール情報および聞き手サーバそれぞれのユーザ／参加者のユーザ／参加者プロフィール情報と、を受信する。例えば、ＳＩＰベースのユーザ／参加者２は、スペイン語の選好翻訳言語を有するユーザ／参加者プロフィールとして設定される。聞き手サーバ２４０６は、ユーザ／参加者１およびユーザ／参加者２の２つのユーザ／参加者プロフィールの間の言語の違いを識別し、ユーザ／参加者２４２６のため、聞き手サーバ２４０６の英語同報通信音声パケットを処理し合成スピーチ音声のスペイン語に翻訳する。同様に、ユーザ／参加者３４２８は聞き手サーバ３４０８からフランス語ベースの翻訳を受信し、同じように、ユーザ／参加者５４３２は聞き手サーバ５４１２からロシア語ベースの翻訳を受信し、ユーザ／参加者６は聞き手サーバ６４１４からアラビア語ベースの翻訳を受信する。
【００２９】
しかしながら、ＳＩＰベースのユーザ／参加者４４３０のユーザ／参加者プロフィール情報には、英語が選好翻訳言語として設定されている。話し手サーバ１４０２から送信される英語の同報通信音声パケットは翻訳する必要がないので、聞き手サーバ４４１０は、コミュニケーション送信を翻訳する必要がなく、英語の同報通信音声パケットを直接ユーザ／参加者４４３０に転送するだけである。
【００３０】
同期ポイント４１６、４１８、４２０、４２２、および４２４は、ＶｏＩＰネットワーク４００中のコミュニケーション・チャネルＣｈ１、…、Ｃｈｎ沿いにそれぞれ配置される。これらの同期ポイントは、まとまりを確実にするため、特定のユーザ／参加者に対する翻訳が完了した時点で、話し手ユーザ／参加者以外のユーザ／参加者がコミュニケーション・セッション中への対話を開始することを可能にする。例えば、ユーザ／参加者定義プロフィールに基づいて、通信リソースに対する音声サービス要求が生成される。これらの音声サービス要求は、一群のアクション、すなわち、ｎ−Ｗａｙ通信セッション中の一人の参加者が同期境界のアクション実行を要求する場合に行われる一連のイベントを指定することができる。これは、該ユーザ／参加者が、進行中のコミュニケーション・セッションの中で対話の開始を所望していることの通知であり得る。音声サービス要求に関連する特定の制御パケット情報は、１）話し手サーバが聞き手サーバに情報を送信する、２）あるサーバが聞き手モードから話し手モードに移行する、というシナリオに関係する。これらのサービス要求は、ユーザ／参加者間の翻訳／転送が行われていないとき、同期境界ポイントにおいて受理される。該サービス要求は、これら同期ポイントにおいて新規のコミュニケーションを開始するため、同期ポイントと同期ポイントとの間で処理される。翻訳の一定割合部分が完了次第、ユーザ・プロフィールを構成し、同期境界４２５にサービス要求を発行することができる。一方の極端として、ネィティブ言語による最初の言葉の反応を検知するとすぐ、翻訳が行われる前に、聞き手が次の話し手になれるためのサービス要求が発行されることがあり得る。このやり方で、話をしたい最初のＳＩＰベースのユーザは、翻訳を聴取するまでの遅延を要する、他の全参加者を聞き手にして、次の話し手サーバになることができよう。他方の極端として、ユーザ設定によって、翻訳が完了した後でしかサービス要求を出せないようにすることもできよう。あるいは、妥協的モードとして、ユーザ設定によって言葉のコミュニケーションの最初のｎ個の単語の翻訳がうまく行き次第サービス要求が出せるようすることも可能であろう。このような仕方で、ユーザ設定を会話に対し最適化することができる。
【００３１】
図５は、最適の場所で処理をするためのサーバ割当手順を含む、本発明のある実施形態のＳＩＰベースのＶｏＩＰを示してしており、該実施形態では、ｎ−Ｗａｙ複数ユーザ／参加者音声翻訳セッションが開始され５００ユーザ／参加者、プロフィールが読み出される５０２。音声処理／翻訳が必要ないと判定された場合５０４、サーバは、図４の聞き手サーバ４４１０の場合と同様な転送サービスを割り当てる５０６。処理／翻訳が必要であると判定された場合５０４、サーバは、特定の言語に対し必要な同時処理／翻訳の最大数を計算する５０８。該サーバは、次いでそれぞれの翻訳サーバの場所に基づいて利用可能なリソースを調べることができる５１０。デフォルト／話し手サーバが処理要件とルーティング・リアルタイム要件とを満たすことができるかどうかの判定が行われ５１２、満たせれば、デフォルト／話し手サーバに処理／翻訳サービスが割り当てられる５１６。デフォルト発信／話し手サーバが処理要件とルーティング・リアルタイム要件とを満たせない場合は、該処理要件とルーティング・リアルタイム要件とを満たすことができる聞き手サーバ（群）に、プロフィール・ベースの処理およびルーティングがスケジュールされる。
【００３２】
さらに、原語の音声データ・ファイル／パケットを地理的にサーバ近くの同一言語のユーザ／参加者の多数により近接した、異なる場所にある翻訳サーバに送信することができる。しかして、参加者定義プロフィールに基づいて、別のサーバには、実際のパケットを送信しないで音声ファイルのある場所を送信することができる。
【００３３】
翻訳処理のため最適のサーバを識別するサーバは、参加者定義プロフィールに基づき、アクティブなｎ−Ｗａｙ通信セッション中のそれぞれの参加者の衛星利用測位システム（ＧＰＳ：ＧｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）場所情報に基づいて、サーバを識別することができる。しかして、該サーバは、転送／翻訳参加者の場所を判定し、特定のユーザ／参加者群により近いサーバ群を用いて、通信トラフィック混雑および送信遅延が最小化されるように翻訳サーバを割り当てる。
【００３４】
図６は、ＶｏＩＰ２方向セッションの例を含む、本発明の実施形態のＳＩＰベースのＶｏＩＰを示す。ボイス・オーバーＩＰサーバ６００は、英語を話すユーザ／参加者１６０２およびフランス語を話すユーザ／参加者２６０６からのコミュニケーションを受信する。英語を話すユーザ／参加者１の会話６０４は、ユーザ／参加者１の会話の開始、およびユーザ／参加者２からのフランス語から英語に翻訳された応答を示す。フランス語を話すユーザ／参加者２の会話６０８は、ユーザ／参加者１の対話への応答およびユーザ／参加者１からの英語からフランス語に翻訳された応答を示す。「Ｎ番目の言語」を話すユーザ／参加者「Ｎ］は、ユーザ／参加者１とユーザ／参加者２との全会話の翻訳をユーザ／参加者「Ｎ」の「Ｎ番目の言語」で受信することになろう。
【００３５】
図７は、ＶｏＩＰネットワーク上のｎ−Ｗａｙ複数参加者音声処理を含む、本発明の実施形態のＳＩＰベースのＶｏＩＰを示す。ｎ−Ｗａｙ多言語コミュニケーションのためのＶｏＩＰサーバ７００は、音声またはテキストあるいはその両方による多言語コミュニケーションのため、サーバでのｎ−Ｗａｙ言語翻訳に対するユーザ／参加者の選好言語を検出する。翻訳または転送あるいはその両方の対象となる音声およびテキスト・データに加えて、補助的な、音声、テキストを含むドキュメント、音声を含む映像データをｎ−Ｗａｙ通信に組み入れ、ユーザ／参加者定義プロフィール・データに基づき、同様な翻訳または転送あるいはその両方の対象とすることができる。
【００３６】
ＶｏＩＰサーバには、異なる地理的場所群に亘って分散可能な複数のサーバを含めることができる。ユーザ／参加者Ｎｏ．１、ユーザ／参加者Ｎｏ．２、ユーザ／参加者Ｎｏ．３、およびユーザ／参加者Ｎｏ．４は、例えば、それぞれ、英語、スペイン語、フランス語、および英語の選好言語を有する。音声およびテキスト・データは、聞き手ユーザ／参加者の選好する言語に翻訳されるか、あるいは、例えば、双方の選考言語が同じ英語のユーザ／参加者Ｎｏ．１とユーザ／参加者Ｎｏ．４と間のコミュニケーションなど翻訳が不必要な場合には、ユーザ／参加者に直接転送することができる。
【００３７】
図８は、ＶｏＩＰサーバ８００が、ユーザ／参加者の選好言語を検出し、ユーザ／参加者プロフィール・データを使ってユーザ／参加者プロフィール・データベース８０６を更新する遊休時モードを含む、本発明の実施形態のＳＩＰベースのＶｏＩＰを示す。ユーザ／参加者プロフィール・データベース８０６は、ＳＩＰプロトコルを拡張し、ユーザ／参加者プロフィール・データの間の類似点あるいは相違点の対比と判定とに基づいてコミュニケーションを行うために用いられる。ユーザ／参加者１８０２は話し手サーバ（ＴＳ：ｔａｌｋｉｎｇｓｅｒｖｅｒ）によって識別され、ユーザ／参加者２８０４は聞き手サーバによって識別される。
【００３８】
図９は、選択的プロトコルを用いるコミュニケーションを含む、本発明の実施形態のＳＩＰベースのＶｏＩＰを示す。ユーザ／参加者１が、少なくとも２つの言語を使う複数のユーザ／参加者とｎ−Ｗａｙ通信を開始する９００。ユーザ／参加者１および意図された受信者であるユーザ／参加者２の選好言語９０４のチェック９０２が行われ、言語の翻訳を行うかどうかが判定される。翻訳の必要がなく、コミュニケーションが同じ言語を話す受信者への転送だけの場合、原語の音声データはユーザ／参加者に直接送信され９０６、ｎ−Ｗａｙ通信でユーザ／参加者２によって受信される９０８。
【００３９】
ユーザ／参加者プロフィール・データベース９０４からのユーザ／参加者プロフィール・データの違いに基づき翻訳が必要と判定された場合９０２、サーバ負荷、通信ルーティング、および同一言語プロフィールを有する他のユーザ／参加者への地理的近接度に基づいて、最適の場所で音声およびテキスト・データの翻訳を行う設定がされる９１０。送信される９１４合成音声翻訳またはテキスト翻訳を受信することになるユーザ／参加者２に対し通知が行われる９１２。
【００４０】
ユーザ／参加者２は、翻訳された音声／テキスト・データまたは翻訳されていない原語の音声／テキスト・データを受信し、ユーザ／参加者１、またはコミュニケーション・セッション中の別のユーザ／参加者（図示せず）に応答することができる。ユーザ／参加者２は、翻訳サーバが、例えば９００におけるユーザ／参加者１など前回のコミュニケーション・ユーザ／参加者からのデータを翻訳した後で、遊休状態に入っているとき、同期ポイントにおいて応答する９１６。ユーザ／参加者２に対する聞き手／転送サーバは、今や話し手サーバとなり、ユーザ／参加者プロフィール・データベース９０４に基づいて言語翻訳が必要かどうかをチェックする９１８。翻訳が必要ない場合、原語の音声テキスト・データがユーザ／参加者１、またはユーザ／参加者２が宛てた別の違うユーザ／参加者に送信される。
【００４１】
ユーザ／参加者プロフィール・データベース９０４からのユーザ／参加者プロフィール・データの違いに基づき翻訳が必要と判定された場合９１８、サーバ負荷、通信ルーティング、および同一言語プロフィールを有する他のユーザ／参加者への地理的近接度に基づいて、最適の場所で音声およびテキスト・データの翻訳を行う設定がされる９２０。送信される９２４合成音声翻訳またはテキスト翻訳を受信することになるユーザ／参加者１に対し通知が行われる９２２。
【００４２】
図１０は、複数参加者間のリアルタイム・コミュニケーションを可能にするコンピュータ実行の例示的実施形態を示し、この方法は、第一サーバが、第一参加者から第二参加者に宛てられた、第一会話言語で構成されるリアルタイム・コミュニケーションを受信するステップ１０００を含む。第二参加者が、リアルタイム・コミュニケーション受信の選好会話言語を識別する１００２。該受信の選好会話言語が、リアルタイム・コミュニケーションの第一会話言語と異なっているかどうかの判定が行われる１００４。該選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは第一会話言語から第二参加者の受信選好会話言語に翻訳され、翻訳されたリアルタイム・コミュニケーションが生成される１００６。翻訳されたリアルタイム・コミュニケーションが、第二参加者に配信される１００８。
【００４３】
通信リソースに対する音声サービス要求が生成され、参加者定義プロフィールに基づいて、第一参加者と第二参加者との間の音声コミュニケーションがオンデマンドで処理される。
【００４４】
また、参加者定義プロフィールに基づいて、翻訳されたテキスト、補助的な翻訳された音声、翻訳されたドキュメント・テキスト、および翻訳された音声を含む映像データを参加者コミュニケーション中に組み入れることができる。参加者定義プロフィールに基づき、ドキュメントの実際の送信をしないで、音声ファイルの場所の連絡で済ますことができる。加えて、翻訳するステップには、参加者定義プロフィールに基づいて、実行中のコミュニケーション・チャネル中のそれぞれの参加者の衛星利用測位システム（ＧＰＳ）場所情報を識別するステップをさらに含めることができる。リアルタイム・コミュニケーションを処理するステップには、参加者定義プロフィールに基づいて、リアルタイム・コミュニケーションを処理するための最適の場所を判定するステップをさらに含めることができる。
【００４５】
図１１は、少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル（ＶｏＩＰ）サーバ１１０２と、少なくとも一つの受信ＶｏＩＰサーバ１１０４と、送信ＶｏＩＰサーバ１１０２と受信ＶｏＩＰサーバ１１０４との間の通信を提供する、少なくとも一つのＶｏＩＰ通信ネットワーク１１０６とを包含する通信システム１１００を含む別の例示的実施形態を示す。翻訳モジュールが、少なくとも一つのＶｏＩＰ通信ネットワーク１１０６を通して、送信ＶｏＩＰサーバ１１０２と受信ＶｏＩＰサーバ１１０４との間にアクティブなｎ−Ｗａｙ双方向自動音声翻訳チャネルを確立する。特定の場所１１１０にある処理ＶｏＩＰサーバ１１０８は、少なくとも一つのＶｏＩＰ通信ネットワーク１１０６上の相異なる会話言語の参加者の間で少なくとも一つの会話言語を翻訳する。少なくとも一つの会話言語の処理は、相異なる会話言語の参加者それぞれの参加者プロフィールに基づいて、処理ＶｏＩＰサーバ１１０８のある特定の場所１１１０で実施するよう設定される。送信ＶｏＩＰサーバ１１０２または受信ＶｏＩＰサーバ１１０４のいずれかが、翻訳処理を取り扱う特定の場所１１１０の中にあると判定される場合、該いずれかのサーバ（１１０２／１１０４）を処理ＶｏＩＰサーバ１１０８に含めることができる。
【００４６】
参加者プロフィール・データベースに格納されている各参加者プロフィールは、参加者の会話言語プロフィールを含む。音声サービス要求モジュールは、参加者プロフィールに基づき、利用可能な通信リソースに対する要求を生成する。メディア・インテグレータは、参加者プロフィールに基づき、少なくとも一つの翻訳されている会話言語を使って、テキスト、音声、ドキュメント、および映像データを包含する情報を集成する。
【００４７】
複数の聞き手ＶｏＩＰサーバが、相異なる参加者会話言語を有する参加者をホストすることができる。処理ＶｏＩＰサーバは、複数のＶｏＩＰ話し手サーバ、および複数のＶｏＩＰ聞き手サーバを含む。
【００４８】
図１２は、コンピュータ実行の方法を含む別の例示的実施形態を示し、該方法は、複数場所、複数参加者の音声翻訳セッションを開始し１２００、次いで、該音声翻訳セッションへのセッション参加者の参加者プロフィールに基づいて、音声翻訳処理が必要かどうかを判定するステップ１２０２を含む。複数場所の各々において利用可能な翻訳リソースが判定され１２０４、該複数場所の各々において利用可能な翻訳リソースに基づいて、可能な同時翻訳処理の最大数が計算される１２０６。デフォルト・サーバが、該音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の両方を満たせるかどうかの判定が行われ１２０８、話し手参加者と聞き手参加者との参加者プロフィールの対比に基づいて、翻訳処理サービスが利用可能な翻訳リソースに割り当てられる１２１０。
【００４９】
転送サービスの割り当ては、参加者プロフィールよる音声翻訳処理が必要かどうかの判定に基づいて行われる。少なくとも一つの聞き手サーバにおける参加者プロフィール・ベースの翻訳処理サービスのスケジューリングは、話し手参加者および聞き手参加者の参加者プロフィールの対比による判定に基づいて行われる。
【００５０】
本発明のある実施形態は、その固有の新規な特長により、話し手ＶｏＩＰサーバが、発話元言語および標的言語コンテントを同時処理するため最適な場所にある利用可能なリソースを探し出して識別し、これにより、終端の参加者（達）が聞き手ＶｏＩＰサーバから処理済みのデータをリアルタイムで受信し、オンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持される、ようにすることができる、プロトコル方法およびシステムを提供する。
【００５１】
当業者がよく理解しているであろうように、本発明の態様は、システム、方法、またはコンピュータ・プログラムとして具現することができる。従って、本発明の態様は、全体がハードウエアの実施形態、全体がソフトウエアの実施形態（ファームウエア、常駐ソフトウエア、マイクロコードなどを含む）、または、本明細書では全て一般的に「回路」、「モジュール」、または「システム」ということもある、ソフトウエアおよびハードウエア態様を組み合わせた実施形態の形を取り得る。さらに、本発明の態様は、体内に具現されたコンピュータ可読プログラム・コードを有する一つ以上のコンピュータ可読媒体（群）中に具現されたコンピュータ・プログラムの形を取ることができる。
【００５２】
一つ以上のコンピュータ可読媒体（群）の任意の組み合わせを用いることができる。該コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体とすることができる。コンピュータ可読記憶媒体は、例えば、以下に限らないが、電子的、磁気的、光学的、電磁気的、赤外的、または半導体の、システム、装置、またはデバイス、あるいは上記の任意の適切な組み合わせとすることができる。コンピュータ可読記憶媒体のさらに具体的な例（限定的リスト）には、一つ以上の配線を有する電気接続、携帯コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ：ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、固体素子（ＳＳＤ：ｓｏｌｉｄ−ｓｔａｔｅｄｅｖｉｃｅ）、読み取り専用メモリ（ＲＯＭ：ｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ）、消去およびプログラム可能読み取り専用メモリ（ＥＰＲＯＭ：ｅｒａｓａｂｌｅｐｒｏｇｒａｍｍａｂｌｅｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ、またはフラッシュ・メモリ）、光ファイバ、携帯コンパクト・ディスク読み取り専用メモリ（ＣＤ−ＲＯＭ：ｃｏｍｐａｃｔｄｉｓｃｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ）、光記憶デバイス、磁気記憶デバイス、または上記の任意の適切な組み合わせが含まれよう。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、またはデバイスによって、またはこれらに関連させて使うためのプログラムを、包含または格納できる任意の有形媒体であり得る。
【００５３】
コンピュータ可読信号媒体には、例えばベースバンド中にもしくは搬送波の一部として具現されたコンピュータ可読のプログラム・コードを有する、伝播データ信号を含めることができる。かかる伝播信号は、以下に限らないが、電磁気的、光学的、またはこれらの任意の組み合わせを含め、さまざまな形態の任意の形を取ることができる。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体でなく、命令実行システム、装置、またはデバイスによって、またはこれらに関連させて使うためのプログラムを通信、伝播、または移送可能な任意のコンピュータ可読媒体であり得る。
【００５４】
コンピュータ可読媒体に具現されたプログラム・コードは、以下に限らないが、無線、有線、光ファイバ・ケーブル、ＲＦなど、またはこれらの任意の適切な組合せ、を含む任意の適切な媒体を使って送信することができる。
【００５５】
本発明の態様のためのオペレーションを実施するコンピュータ・プログラム・コードは、Ｊａｖａ（Ｒ）、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語、および、“Ｃ”プログラミング言語または類似のプログラミング言語などの従来式手続き型プログラミング言語を含め、一つ以上のプログラミング言語の任意の組み合わせで書くことができる。該プログラム・コードは、全体をユーザのコンピュータで、一部をユーザのコンピュータで単独型ソフトウエア・パッケージとして実行することができ、一部をユーザのコンピュータで他の部分を遠隔コンピュータで、または全体を遠隔コンピュータまたはサーバで実行することができる。後者のシナリオでは、ローカル・エリア・ネットワーク（ＬＡＮ：ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ）または広域ネットワーク（ＷＡＮ：ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ）を含む任意の種類のネットワークを介して、遠隔コンピュータをユーザのコンピュータに接続することができ、あるいは（例えばインターネット・サービス・プロバイダを使いインターネットを介し）外部のコンピュータへの接続を行うことができる。
【００５６】
以下に、本発明の実施形態による方法、装置（システム）、およびコンピュータ・プログラムのフローチャート説明図またはブロック図あるいはその両方を参照しながら、本発明の態様を説明する。フローチャート説明図またはブロック図あるいはその両方の各ブロック、および、フローチャート説明図またはブロック図あるいはその両方のブロックの組み合わせは、コンピュータ・プログラム命令によって実行可能であることが理解されよう。これらのコンピュータ・プログラム命令を、汎用コンピュータ、特殊用途コンピュータ、または他のプログラム可能データ処理装置、のプロセッサに供給してマシンを形成し、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行されるこれらの命令が、該フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能／処理を実施するための手段を生成するようにすることができる。
【００５７】
また、これらのコンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、または他の特定の仕方で機能するデバイス、に命令できるコンピュータ可読媒体に格納し、該コンピュータ可読媒体に格納された命令が、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能／処理を実施する命令を包含する製品を形成するようにすることができる。
【００５８】
さらに、該コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、または、他のデバイスにロードして、該コンピュータ、他のプログラム可能装置、または他のデバイス上で一連のオペレーション・ステップを実施させてコンピュータ実行のプロセスを生成し、該コンピュータまたは他のプログラム可能装置で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能／処理を実行するためのプロセスを提供するようにすることもできる。
【００５９】
図１３は、本発明の実施形態の例示的態様によるコンピュータ・システムおよび方法を実行するために用いることのできる典型的なハードウエア構成のシステムを示す。
【００６０】
ここで図１３を参照すると、システム１３００は、本発明のシステムおよび方法を実行するために用いることのできる［方法／システムの概要説明］のための典型的なハードウエア構成を図示している。該構成は、望ましくは、少なくとも一つのプロセッサまたは中央プロセッシング・ユニット（ＣＰＵ：ｃｅｎｔｒａｌｐｒｏｃｅｓｓｉｎｇｕｎｉｔ）１３１０ａ、１３１０ｂを含む。ＣＰＵ１３１０ａ、１３１０ｂは、システム・バス１３１２を介して、ランダム・アクセス・メモリ（ＲＡＭ）または固体素子（ＳＳＤ）あるいはその両方１３１４と、読み取り専用メモリ（ＲＯＭ）１３１６と、（ディスク装置１３２１およびテープ・ドライブ１３４０などの周辺デバイスをシステム・バス１３１２に連結するための）入力／出力（Ｉ／Ｏ：ｉｎｐｕｔ／ｏｕｔｐｕｔ）アダプタ１３１８と、（キーボード１３２４、マウス１３２６、スピーカ１３２８、マイクロフォン１３３２、または他の参加者インタフェース・デバイス、あるいはこれらの複数を、システム・バス１３１２に連結するための）ユーザ（参加者）インタフェース・アダプタ１３２２と、情報処理システムをデータ処理ネットワーク、インターネット、イントラネット、パーソナル・エリア・ネットワーク（ＰＡＮ：ｐｅｒｓｏｎａｌａｒｅａｎｅｔｗｏｒｋ）などに接続するための通信アダプタ１３３４と、システム・バス１３１２をディスプレイ・デバイス１３３８またはプリンタ１３３９あるいはその両方に連結するためのディスプレイ・アダプタ１３３６と、に相互連結されている。さらに、自動リーダ／スキャナ１３４１を含めることができる。かかるリーダ／スキャナは、多くのメーカから販売されている。
【００６１】
前述のシステムに加え、本発明のある異なる態様は、前述した方法を実施するためのコンピュータ実行の方法を含む。一例として、この方法は、上述の特定の環境で実行することができる。
【００６２】
かかる方法は、例えば、デジタル・データ処理装置として具体化されたコンピュータを作動し、マシン可読の命令のシーケンスを実行することによって遂行することができる。これらの命令は、さまざまな種類の信号担持媒体中に在置することができる。
【００６３】
しかして、本発明の実施形態のこの態様は、デジタル・データ・プロセッサが実行して上記の方法を遂行可能な、マシン可読命令のプログラムを有形に具現化する信号担持媒体を含むプログラム製品を対象とする。
【００６４】
かかる方法は、例えば、ＣＰＵ１３１０を作動し、マシン可読命令のシーケンスを実行させることによって遂行することができる。これらの命令は、さまざまな種類の信号担持媒体中に在置することができる。
【００６５】
しかして、本発明の実施形態の態様は、ＣＰＵ１３１０および上記のハードウエアを組み込んだデジタル・データ・プロセッサが実行して上記の方法を遂行することが可能な、マシン可読命令のプログラムを有形に具現化する信号担持媒体を含むプログラム製品を対象とする。
【００６６】
この信号担持媒体には、例として、高速アクセス記憶装置に代表される、例えばＣＰＵ１３１０内に包含されたＲＡＭまたはＳＳＤあるいはその両方を含めることができる。あるいは、これら命令は、磁気データ記憶ディスケット１４００、ＣＤ−ＲＯＭ１４０２、または、ＵＳＢフラッシュ・ドライブのような「プラグ・アンド・プレイ」メモリ・デバイス１４０４（図１４参照）など、ＣＰＵ１４１０が直接または間接的にアクセス可能な別の信号担持媒体に収納することができる。
【００６７】
コンピュータ・サーバ／ＣＰＵ１３１０に包含されているか他の場所かを問わず、これら命令は、例えば、ＤＡＳＤ記憶装置（例、従来型の「ハード・ドライブ」またはＲＡＩＤアレイ）、磁気テープ、電子読み取り専用メモリ（例、ＲＯＭ、ＳＳＤ、ＥＰＲＯＭ、またはＥＥＰＲＯＭ）、光記憶デバイス（例、ＣＤ−ＲＯＭ、ＷＯＲＭ、ＤＶＤ、デジタル光テープなど）、紙「パンチ」カード、または、デジタルおよびアナログ通信リンクおよび無線などの送信媒体を含む他の適切な信号担持媒体などの、多様なマシン可読のデータ記憶媒体に格納することができる。本発明のある例示的実施形態において、該マシン可読命令には、“Ｃ”などの言語からコンパイルされた、ソフトウエア・オブジェクト・コードを含めることができる。
【００６８】
図中のフローチャートおよびブロック図は、本発明のさまざまな実施形態による、システム、方法、およびコンピュータ・プログラムの、可能な実装のアーキテクチャ、機能、およびオペレーションを示す。この点において、フローチャート中またはブロック図中の各ブロックは、規定された論理機能（群）を実施するための一つ以上の実行可能命令を含む、コードのモジュール、セグメント、または部分に相当し得る。また、いくつかの別の実装において、ブロック中に記載された機能を、図に記載されたのと違った順序で実施できることに留意すべきである。例えば、逐次的に示された２つのブロックが、実際は、実質的に同時に実行されることがあり得、または、関連する機能により時によっては、これらブロックが逆の順序で実行されることがあり得る。さらに、ブロック図またはフローチャート説明図あるいはその両方の各ブロック、および、ブロック図またはフローチャート説明図あるいはその両方のブロックの組み合わせは、特定の機能または処理を遂行する特別用途のハードウエア・ベースのシステム、または特別用途ハードウエアとコンピュータ命令との組み合わせによっても実施できることに留意すべきである。
【符号の説明】
【００６９】
１３００システム
１３１０ａＣＰＵ
１３１０ｂＣＰＵ
１３１２システム・バス
１３１４ＲＡＭまたはＳＳＤあるいはその両方
１３１６ＲＯＭ
１３１８Ｉ／Ｏアダプタ
１３２１ディスク装置
１３２２ユーザ・インタフェース・アダプタ
１３２４キーボード
１３２６マウス
１３２８スピーカ
１３３２マイクロフォン
１３３４通信アダプタ
１３３６ディスプレイ・アダプタ
１３３８ディスプレイ
１３３９プリンタ
１３４０テープ・ドライブ
１３４１リーダ／スキャナ

【特許請求の範囲】
【請求項１】
複数の参加者の間でリアルタイム・コミュニケーションを可能にする、コンピュータ実行の方法であって、前記方法は、
第一参加者からのリアルタイム・コミュニケーションを第一サーバで受信するステップであって、前記リアルタイム・コミュニケーションは、第一会話言語で構成され第二参加者に宛てられている、前記受信ステップと、
コンピューティング・デバイスが、前記第二参加者がリアルタイム・コミュニケーションの受信に選好する会話言語を識別するステップと、
前記コンピューティング・デバイスが、前記受信に選好する会話言語が前記リアルタイム・コミュニケーションの前記第一会話言語と異なっているかどうかを判定するステップと、
前記選好する会話言語が前記第一会話言語と異なる場合は常に、前記コンピューティング・デバイスが、前記リアルタイム・コミュニケーションを、前記第一会話言語から、前記第二参加者が前記受信に選好する会話言語に翻訳し、翻訳されたリアルタイム・コミュニケーションを生成するステップと、
前記コンピューティング・デバイスが、前記翻訳されたリアルタイム・コミュニケーションを前記第二参加者に配信するステップと、
を含む、前記方法。
【請求項２】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、通信リソースに対する音声サービス要求を生成するステップをさらに含む、請求項１に記載の方法。
【請求項３】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、第一および第二参加者間の音声コミュニケーションをオンデマンドで処理するステップをさらに含む、請求項１に記載の方法。
【請求項４】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、翻訳されたテキスト、補助的な翻訳された音声、翻訳されたドキュメント・テキスト、および翻訳された音声を含む映像データを前記コミュニケーションに組み入れるステップをさらに含む、請求項１に記載の方法。
【請求項５】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、音声データの実際の送信をせずに前記音声データの場所を通信するステップをさらに含む、請求項４に記載の方法。
【請求項６】
前記翻訳をするステップは、前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、アクティブなコミュニケーション・チャネル中のそれぞれの参加者の衛星利用測位システム（ＧＰＳ）場所情報を識別するステップを含む、請求項１に記載の方法。
【請求項７】
前記コンピューティング・デバイスが、前記リアルタイム・コミュニケーションを処理するのに最適な場所を判定するステップをさらに含む、請求項１に記載の方法。
【請求項８】
少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル（ＶｏＩＰ）サーバと、
少なくとも一つの受信ＶｏＩＰサーバと、
前記送信ＶｏＩＰサーバと前記受信ＶｏＩＰサーバとの間の通信を提供する少なくとも一つのＶｏＩＰ通信ネットワークと、
前記少なくとも一つのＶｏＩＰ通信ネットワークを通して、前記少なくとも一つの送信ＶｏＩＰサーバと前記少なくとも一つの受信ＶｏＩＰサーバとの間に、アクティブなｎ−Ｗａｙ双方向自動音声翻訳チャネルを確立する、少なくとも一つの翻訳モジュールと、
前記少なくとも一つのＶｏＩＰ通信ネットワーク上の相異なる会話言語の参加者の間で少なくとも一つの会話言語を翻訳する、特定の場所にある処理ＶｏＩＰサーバと、
を含む通信システムであって、
前記少なくとも一つの会話言語の処理は、相異なる会話言語の前記参加者のそれぞれの参加者プロフィールに基づいて、前記処理ＶｏＩＰサーバのある前記特定の場所で実施されるよう設定される、
前記通信システム。
【請求項９】
前記参加者プロフィールは、各々、参加者の会話言語プロフィールを含む、請求項８に記載のシステム。
【請求項１０】
前記参加者プロフィールに基づいて、利用可能な通信リソースに対する要求を生成する音声サービス要求モジュールをさらに含む、請求項８に記載のシステム。
【請求項１１】
前記参加者プロフィールに基づき、前記少なくとも一つの翻訳されている会話言語を使って、テキスト、音声、ドキュメント、および映像データを包含する情報を集成するメディア・インテグレータをさらに含む、請求項８に記載のシステム。
【請求項１２】
参加者プロフィール・データベースをさらに含む、請求項８に記載のシステム。
【請求項１３】
相異なる参加者の会話言語プロフィールを有する参加者をホストする、複数の聞き手ＶｏＩＰサーバをさらに含む、請求項８に記載のシステム。
【請求項１４】
前記処理ＶｏＩＰサーバは、複数のＶｏＩＰ話し手サーバおよび複数のＶｏＩＰ聞き手サーバのうちの少なくとも一つを含む、請求項８に記載のシステム。
【請求項１５】
コンピューティング・デバイスが、複数場所、複数参加者の音声翻訳セッションを開始するステップと、
前記コンピューティング・デバイスが、前記音声翻訳セッション中のセッション参加者の参加者プロフィールに基づいて、音声翻訳処理が必要かどうかを判定するステップと、
前記複数場所の各々において利用可能な翻訳リソースを判定するステップと、
前記コンピューティング・デバイスが、前記複数場所の各々において利用可能な前記翻訳リソースに基づいて可能な同時翻訳処理の最大数を計算するステップと、
前記コンピューティング・デバイスが、デフォルト・サーバは前記音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の双方を満たすことができるかどうかを判定するステップと、
前記コンピューティング・デバイスが、話し手参加者および聞き手参加者の前記参加者プロフィールの対比に基づいて、翻訳処理サービスを前記利用可能な翻訳リソースに割り当てるステップと、
を含むコンピュータ実行の方法。
【請求項１６】
前記コンピューティング・デバイスが、参加者プロフィールに基づいて行った音声翻訳処理が必要かどうかの前記判定に基づいて転送サービスを割り当てるステップをさらに含む、請求項１５に記載の方法。
【請求項１７】
前記話し手参加者および前記聞き手参加者の前記参加者プロフィールの対比に基づいて行った前記判定に基づいて、少なくとも一つの聞き手サーバにおいて参加者プロフィール・ベースの翻訳処理サービスをスケジュールするステップをさらに含む、請求項１５に記載の方法。
【請求項１８】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、前記音声翻訳セッションにテキスト、音声、ドキュメント、および映像データを組み入れるステップをさらに含む、請求項１５に記載の方法。
【請求項１９】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、前記音声翻訳セッションに参加者の衛星利用測位システム（ＧＰＳ）場所情報を組み入れるステップをさらに含む、請求項１５に記載の方法。
【請求項２０】
前記参加者プロフィールの各々は、参加者の会話言語プロフィールを含む、請求項１５に記載の方法。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４】

【公開番号】特開２０１１−１２５００６（Ｐ２０１１−１２５００６Ａ）
【公開日】平成２３年６月２３日（２０１１．６．２３）
【国際特許分類】

【出願番号】特願２０１０−２６８９３８（Ｐ２０１０−２６８９３８）
【出願日】平成２２年１２月２日（２０１０．１２．２）
【出願人】（３９０００９５３１）インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】ＩＮＴＥＲＮＡＴＩＯＮＡＬ　ＢＵＳＩＮＥＳＳ　ＭＡＳＣＨＩＮＥＳ　ＣＯＲＰＯＲＡＴＩＯＮ
【Ｆターム（参考）】

[ Back to top ]

ｎ−Ｗａｙ選択的言語処理を用いたリアルタイムＶｏＩＰコミュニケーションのためのシステムおよび方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

ｎ−Ｗａｙ選択的言語処理を用いたリアルタイムＶｏＩＰコミュニケーションのためのシステムおよび方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク