n−Way選択的言語処理を用いたリアルタイムVoIPコミュニケーションのためのシステムおよび方法
【課題】選択的同報通信プロトコルを用いて、複数の参加者の間で同時リアルタイム多言語コミュニケーションを可能にするコンピュータ実行の方法およびシステムを提供する。
【解決手段】該方法は、第一参加者からのリアルタイム・コミュニケーションを第一サーバで受信するステップを含み、該リアルタイム・コミュニケーションは、第一会話言語で構成され第二参加者に宛てられている。第二参加者が、リアルタイム・コミュニケーション受信の選好会話言語を識別する。該受信の選好会話言語がリアルタイム・コミュニケーションの第一会話言語と異なっているかどうかの判定が行われる。該選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは、第一会話言語から第二参加者の受信選好会話言語に翻訳されて配信され、翻訳されたリアルタイム・コミュニケーションが生成され、第二参加者の選好会話言語が第一参加者の選好会話言語と同じ場合は翻訳しないで転送される。
【解決手段】該方法は、第一参加者からのリアルタイム・コミュニケーションを第一サーバで受信するステップを含み、該リアルタイム・コミュニケーションは、第一会話言語で構成され第二参加者に宛てられている。第二参加者が、リアルタイム・コミュニケーション受信の選好会話言語を識別する。該受信の選好会話言語がリアルタイム・コミュニケーションの第一会話言語と異なっているかどうかの判定が行われる。該選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは、第一会話言語から第二参加者の受信選好会話言語に翻訳されて配信され、翻訳されたリアルタイム・コミュニケーションが生成され、第二参加者の選好会話言語が第一参加者の選好会話言語と同じ場合は翻訳しないで転送される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、n−Way(ウエイ)選択的音声プロトコルを用い、フレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイス、システム、および方法に関する。
【背景技術】
【0002】
インターネット・プロトコル(IP:Internet Protocol)構内交換装置(PBX:Private Branch Exchange)は、内部参加者のためIPネットワークを介した電話を経路設定し、外線へのアクセスを提供する、構内交換装置または構内電話交換システムである。また、通常、IP PBXは、VoIP参加者と従来式電話システムの通話者との間の電話も交換する。こういった製品は、通常、サーバまたは専用の機器上で作動するソフトウエア・パッケージである。IP PBXは、別個の音声ネットワークの必要性を排除し、代わりに、同じネットワークに音声およびデータのトラフィックを一つにまとめる。既存の製品は、音声メニュー・システム、電話会議、クリックツーコール、通話記録および追跡、音声メール、および自動転送など、多様な電話マネジメント機能を提供している。IP PBXを用いて、企業は、参加者のデスクトップで作動、またはIPネットワーク上で機能するよう設計された従来式の机上電話セットで作動する、ソフトウエア実装だけのIP電話である「ソフトフォン」を選択することができる。
【0003】
Nemertes Research社のロビン・ガレイス(Robin Gareiss)によれば、諸組織は、VoIPに移行することによって、WANコストを15%〜40%節約し、節約の平均は23%である。主な節約分野は以下の3分野である。
【0004】
1. 典型的にはフレーム・リレー、非同期伝送モード、または専用回線ネットワークから、マルチプロトコル・ラベル・スイッチング(MPLS:Multiprotocol Label Switching)への移行。VoIPは、MPLSへの転換の推進要因であるが、同速度の回線に対する全体的コストはより低い。を参照。
【0005】
2. 統合アクセス、これによって、企業は、音声とデータとを同一のアクセス・ラインに組み合わせ、利用度の低い回線を排除する。
【0006】
3. 統合コア回線。組織は、音声およびデータネットワークを組み合わせ、60%の平均使用率、非常にうまく管理されているネットワークでは75%から85%に達するピーク使用率を得ている。これら組織は、コアに低使用率の高速回線を使う必要性を排除している。
【発明の概要】
【発明が解決しようとする課題】
【0007】
MPLSは、Ipsilon(商標)のIPスイッチング、Cisco(商標)のTagスイッチング、IBM(IBM社の登録商標)のARIS(IBM社の登録商標)技術、並びに、コネクション型の非同期伝送モードおよびフレーム・リレー・ネットワークに見られるトラフィック技術の類からコネクションレスIPネットワークへの移行についての、他のいくつかの提案に起源している。IPトラフィックを、単一ルートに換えて多様なルートで送るという着想は、ボーダ・ゲートウェイ・プロトコルなどの内部ゲートウェイ・プロトコルによって、混雑または障害を回避するため、あるいは特定クラスのサービスまたは保証されたサービス・レベルを可能にするため考え出されたものである。MPLSスイッチおよびルータは、宛先、サービス・パラメータの種類、仮想プライベート・ネットワーク会員資格、または他の基準に基づいて、パケットにラベルを添付する。パケットがネットワークを進むにつれ、他のスイッチおよびルータは、パケットおよび経路をラベルと関連付けるテーブルを作成する。ラベル・スイッチ・ルータとも呼ばれるMPLSスイッチおよびルータ群は、各パケットに、ネットワークを通る特定の経路に対応するラベルをあてがう。同じラベルの全パケットは、同じ経路、いわゆるラベル・スイッチ・パス(LSP:Label Switched Path)、を使う。ラベルはエンドポイントでなく経路を示しているので、同じエンドポイントに宛てられたパケット群は、そこに到達するためにさまざまなLSPと使うことができる。既存のインターネット・スイッチング・システム(IP PBX)は、パケットを一つのエンドポイントから別のエンドポイントにルーティングするように最適化されている。しかしながら、VoIPパケットを使うアプリケーションは、リアルタイム・ルーティング要件に加え、リアルタイム処理の要件も必要とする。今日、異なる言語を話す人々の間でのボイス・オーバーIP(VoIP:Voice over IP)を使ったコミュニケーションは、発呼および受呼当事者の両方が理解し話すことのできる言語を使ってだけ行うことができる。企業が世界的な人的資源を自社の労働力に組み込むにつれ、言語バリアが益々重大な障害になっている。本発明は、n−Way選択的音声プロトコルを用いてフレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイスおよび方法に関する。
【0008】
開発プロジェクトにおいて、地理的に分散されたチームの間の非効率的なコミュニケーションがプロジェクトのリスクおよびコストを増大させている。今日、異なる言語を話す人々の間での、ボイス・オーバーIPを介した(VoIP)コミュニケーションは、発呼および受呼当事者の両方が理解し話すことのできる言語使うか、または通訳を介してだけ行うことができる。
【0009】
本発明は、既存のVoIPネットワークを拡張し、複数参加者の同時翻訳機能およびサービスを可能にする。
【課題を解決するための手段】
【0010】
従来の方法および構造の前述および他の典型的な問題、欠点および不利点をかんがみ、本発明の実施形態の例示的態様は、選択的同報通信プロトコルを用い複数の参加者の間でのリアルタイム・コミュニケーションを可能にするコンピュータ実行の方法を提供し、該方法は、第一サーバが第一参加者からのリアルタイム・コミュニケーションを受信するステップを含み、該リアルタイム・コミュニケーションは、第一会話言語で構成され、第二参加者に宛てられている。第二参加者がリアルタイム・コミュニケーション受信に選好する会話言語を識別する。該選好受信会話言語が、該リアルタイム・コミュニケーションの第一会話言語と異なっているかどうかが判定される。選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは第一会話言語から第二参加者の受信選好会話言語に翻訳され、翻訳されたリアルタイム・コミュニケーションが生成される。翻訳されたリアルタイム・コミュニケーションは第二参加者に配信される。
【0011】
本発明の別の例示的実施形態は、少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル(VoIP:Voice Over Internet protocol)サーバと、少なくとも一つの受信VoIPサーバと、送信VoIPサーバと受信VoIPサーバとの間の通信を提供する少なくとも一つのVoIP通信ネットワークとを含む通信システムを提供する。翻訳モジュールは、該少なくとも一つのVoIP通信ネットワークを通して、送信および受信VoIPサーバ間にアクティブなn−Way双方向自動音声翻訳チャネルを確立する。特定の場所にある処理VoIPサーバは、少なくとも一つのVoIP通信ネットワーク上の相異なる会話言語の参加者間の少なくとも一つの会話言語を翻訳する。該少なくとも一つの会話言語の処理は、処理VoIPサーバのある特定の場所で、それぞれの参加者の場所およびプロフィールに基づいて行われるよう設定される。
【0012】
本発明の別の例示的実施形態は、複数場所、複数参加者の音声翻訳セッションを開始するステップと、次いで参加者に基づいて音声翻訳処理が必要かどうかを判定するステップとを含む、コンピュータ実行の方法を提供する。複数場所の各々における利用可能な翻訳リソースが判定され、該複数の場所の各々において利用可能な翻訳リソースと、コミュニケーション・セッションのリアルタイム要件とに基づいて、同時翻訳処理の可能最大数が計算される。デフォルト・サーバが、音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の両方を満たすことができるかどうかの判定が行われ、次いで、話し手参加者と聞き手参加者との参加者プロフィールの対比に基づいて、翻訳処理サービスが利用可能な翻訳リソースに割り当てられる。
【0013】
これらの新規な特長により、本発明のある実施形態は、話し手VoIPサーバが、発話元言語および標的言語コンテントを同時処理するために最適な場所にある利用可能なリソースを探し出して識別し、これにより、終端の参加者(達)が聞き手VoIPサーバから処理済みのデータをリアルタイムで受信し、オンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持されるようにすることができる、プロトコル方法およびシステムを提供することができる。
【0014】
前述のおよび他の典型的な目的、態様および利点は、以下の本発明の例示的実施形態の詳細な説明を、図面を参照しながら読むことによってより良く理解することができよう。
【図面の簡単な説明】
【0015】
【図1】ボイス・オーバー・インターネット・プロトコル(VoIP)に基づいた、セッション開始プロトコル(SIP:Session Initiation Protocol)を示す。
【図2】本発明のある実施形態のSIPベースのVoIPを示す。
【図3】図3Aは4つのプロフィール設定用ディスプレイ・ページの一組を示し、図3Bは、翻訳の質問のため表示された、ユーザ/参加者プロンプト・ウィンドウを示し、これらは、本発明のある実施形態にサポートされているSIP方法を示す。
【図4】本発明のある実施形態のSIPベースのVoIPを示す。
【図5】最適の場所で処理をするためのサーバ割当手順を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図6】VoIPセッションの例を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図7】VoIPネットワーク上の複数参加者の音声処理を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図8】遊休時モードを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図9】選択的プロトコルを用いるコミュニケーションを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図10】本発明の一つの実施形態の方法についての論理フローチャートを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図11】本発明の一つの実施形態のシステム略図を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図12】本発明の一つの実施形態の方法に対する論理フローチャートを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図13】本発明のある実施形態の例示的態様によるコンピュータ・システムおよび方法を実装するため用いることのできる、典型的なハードウエア構成システムを示す。
【図14】発明のある実施形態の例示的態様によるコンピュータ・システムおよび方法を実装するため用いることのできる、プログラム可能な記憶媒体を示す。
【発明を実施するための形態】
【0016】
ここで、図面、さらに具体的には図1〜図14を参照すると、本発明の方法の典型的実施形態群およびある実施形態の構造が示されている。
【0017】
概観
参照により本明細書に組み込まれる米国特許第6,434,526号は、スピーチ認識能力を含有するネットワーク・アプリケーション・ソフトウエア・サービスについて記載している。スピーチ認識ソフトウエアは、通信ネットワーク上のアプリケーション特有のソフトウエアと組み合わせて提供される。アナログ音声データは、ユーザの場所でデジタル化され、音声データとして識別され、中央となる場所に所在するアプリケーション・ソフトウエアに送信される。ネットワーク・サーバが、音声データとして識別されたデータを受信し、それをスピーチ・サーバに送信する。スピーチ・サーバに常駐するスピーチ認識ソフトウエアは、辞書、および該スピーチ認識ソフトウエアのユーザの各々の声にあわせたモジュールを包含している。ユーザが話すにつれ、口述の翻訳がユーザの場所に返信され、点検および必要な場合音声または印字による内容訂正のため、ユーザのコンピュータ画面に印字で表示される。複数のユーザは、ユーザの各々に対する返信が同時ベースで行われるようにするため、スピーチ認識ソフトウエアに交互にアクセスする。
【0018】
参照により本明細書に組み込まれる米国特許第7,058,046号は、拡張性のある電話管理システムについて記載している。該システムには、一つ以上の音声ブラウザをホストする少なくとも一つの音声サーバを含めることができ、該音声サーバは、音声ブラウザが音声電話要求を通して処理することができる単一の通信ポートを有し、各音声ブラウザは、音声電話要求を通して処理することができるポート・エイリアスを有する。また、該システムには、公衆交換式電話ネットワーク(PSTN:public switched telephone network)中の回線エンドポイントを音声サーバにリンクする電話処理ゲートウェイを含めることができる。最後に、該システムには、それぞれの音声ブラウザへのポート・エイリアスをマップする転換テーブルを含めることができる。
【0019】
参照により本明細書に組み込まれる米国特許第7,406,414号は、音声ストリームの中で翻訳を提供する方法について記載しており、該方法は、第一言語のスピーチ信号を受信するステップと、該スピーチ信号からテキストを設定するステップと、該テキストを第二の異なる言語に翻訳するステップと、翻訳されたテキストをスピーチ信号内に符号化するステップとを包含することができる。
【0020】
企業が世界的な人的資源を自社の労働力に組み込むにつれ、言語バリアが益々重大な障害になっている。本発明は、n−Way選択的音声プロトコルを使うVoIPチャネルを用いて、フレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイスおよび方法に関する。
【0021】
普通、複数の言語翻訳が要求される場合、VoIPリアルタイム要件が所与のサーバ・アプリケーションの設計能力を超えることがあり得る。課題は、どのサーバが、本発明が対象とする同時的プロフィール・ベースのVoIP処理の所与の数に対し、リアルタイム処理要件およびルーティング要件を満たすことができるかを判定することである。
【0022】
本発明のある実施形態は、話し手VoIPサーバが、発話元言語および標的言語コンテントを同時処理するため最適な場所にある利用可能なリソースを探し出して識別し、これにより、少なくとも一人のエンド参加者が聞き手VoIPサーバから処理済みのデータをリアルタイムで受信し、選択的同報通信プロトコルに基づくオンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持されるようすることができる、システムおよび方法を提供する。
【0023】
例示的態様
再度、図面を参照すると、図1には、ボイス・オーバー・インターネット・プロトコル(VoIP)に基づいた、セッション開始プロトコル(SIP)が示されている。SIPアプリケーション層は、コンテントが音声、映像、データ、またはウェブ・ベースのもののいずれかに関わらず、一人以上の参加者のエンド・デバイスがどのように接続を生成し、変更し、終了することができるかを定義する。しかしながら、SIPの限界は、電話会議セッションでは、全SIPパケットが参加者全員に同報通信され、従い同時参加者に対する計算およびピアツーピア(P2P)処理能力の拡張性が制限されることにある。図1には、コミュニケーションの開始100と、その後の同報通信パケットの生成または受信102が示されている。コミュニケーションを終了する決定がされなければ104、同報通信パケットが続けて生成、受信され、終了決定されれば終了される106。
【0024】
図2には、本発明のある実施形態の新規なSIPベースのVoIPが示されており、電話会議のセッションにおいては、拡張SIPパケットが、参加者の言語プロフィールおよび利用可能な計算および通信リソースに基づいた選択的同報通信コミュニケーション・チャネルを流れ、参加者間のまとまりを維持する。200においてコミュニケーションの開始が起動され、その後コミュニケーションがn−Way通信かどうかの判定がされる202。少なくとも2つの言語が関わる単一のコミュニケーション・セッションに2人を超える参加者がいる場合は、n−Way通信である。n−Wayユーザ/参加者コミュニケーションがなく、例えば2方向性コミュニケーションだけであると判定された場合は、同報通信パケットが生成されまたは受信され204、コミュニケーションを終了すると決められ206該コミュニケーションが完全に終了する208まで生成または受信が続けられる。なお、エレメント204、206、および208は、図1のエレメント102、104、および106と同じである。
【0025】
n−Way通信が、あるユーザ/参加者によって起動されたと判定された場合202、同報通信パケットが生成または受信される210。コミュニケーションの間に、ユーザ/参加者の発話要求が受信されたと判定された場合212、アービタ・サービス214は、同期ポイントで同報通信パケットに割り込むことができる。コミュニケーション・セッションを終了するとの決定がなされるまで216、コミュニケーション・セッションが続く。コミュニケーション・セッションを終了するとの決定がなされた後216、コミュニケーション・セッションは終了される218。
【0026】
図3Aは4つのプロフィール設定用ディスプレイ・ページの一組300を示し、ユーザ/参加者は、コミュニケーション・セッションを開始するに先立って、これらページにおいてユーザ/参加者プロフィール設定を初期選択することができる。「言語設定」ページ302は、ユーザ/参加者が、言語翻訳を有効にし、選好および代替翻訳言語を選択し、ユーザ/参加者コンタクト・プロフィールに基づいて特定のユーザ/参加者に固有の選好言語を選択し、各ユーザ/参加者コンタクトとの直近使用言語を用いるかどうか、およびコミュニケーションが翻訳されている間ユーザ/参加者に警告表示させるかどうかを選定できるページを示す。「音声識別」ページ304は、ユーザ/参加者が、ユーザ/参加者の写真、または氏名、または身分証明を表示させることによって、翻訳された合成音声を識別することを選定できるページを示す。「翻訳エンジン」ページ306は、ユーザ/参加者が、サーバ翻訳を行う場合の選択を行えるページを示す。例えば、ユーザ/参加者のサーバで翻訳してもよいし、ユーザ/参加者のデバイスで翻訳してもよいし、もしくは、サーバの負荷、ユーザ/参加者のデバイスの能力、またはユーザ/参加者の数および翻訳対象言語の数、あるいはこれらの複数に基づいて、自動的に翻訳デバイスを決定することもできる。「テキスト」ページ308は、ユーザ/参加者が、ユーザ/参加者の元々のまたは選好する言語のいずれかを使って、翻訳されたテキスト・インプットをスピーチに変換したり、入来する翻訳音声をテキストに変換したりすること、および、テキストに変換されている場合入来する翻訳音声を消音することができるページを示す。
【0027】
図3Bは、コミュニケーション・セッションが開始されたとき、翻訳問い合わせについて表示されるユーザ/参加者プロンプト・ウィンドウ310を示す。例えば、あるユーザ/参加者が、ある特定の言語で音声コミュニケーションを開始したことが識別される。ユーザ/参加者プロンプト・ウィンドウ310は、該コミュニケーションの、図3Aの「言語設定」ページ302で選定されたユーザ/参加者の選好言語への翻訳を起動するようにうながす。
【0028】
図4は、本発明のある実施形態のSIPベースのVoIPを示し、VoIPネットワーク400が、複数のサーバ402、406、408、410、412、および414を含む円で表されている。ネィティブ言語が例えば英語である、SIPベースのユーザ/参加者1 404によって、話し手サーバ402を使いn−Way通信セッションが開始される。話し手サーバ1 402は、複数のチャネルCh1、Ch2、Ch3、…、Chnを介して複数の聞き手サーバ2〜6 406〜414に転送する。各聞き手サーバは、英語の同報通信音声パケットと、それに加え、ユーザ/参加者1 404のユーザ/参加者プロフィール情報および聞き手サーバそれぞれのユーザ/参加者のユーザ/参加者プロフィール情報と、を受信する。例えば、SIPベースのユーザ/参加者2は、スペイン語の選好翻訳言語を有するユーザ/参加者プロフィールとして設定される。聞き手サーバ2 406は、ユーザ/参加者1およびユーザ/参加者2の2つのユーザ/参加者プロフィールの間の言語の違いを識別し、ユーザ/参加者2 426のため、聞き手サーバ2 406の英語同報通信音声パケットを処理し合成スピーチ音声のスペイン語に翻訳する。同様に、ユーザ/参加者3 428は聞き手サーバ3 408からフランス語ベースの翻訳を受信し、同じように、ユーザ/参加者5 432は聞き手サーバ5 412からロシア語ベースの翻訳を受信し、ユーザ/参加者6は聞き手サーバ6 414からアラビア語ベースの翻訳を受信する。
【0029】
しかしながら、SIPベースのユーザ/参加者4 430のユーザ/参加者プロフィール情報には、英語が選好翻訳言語として設定されている。話し手サーバ1 402から送信される英語の同報通信音声パケットは翻訳する必要がないので、聞き手サーバ4 410は、コミュニケーション送信を翻訳する必要がなく、英語の同報通信音声パケットを直接ユーザ/参加者4 430に転送するだけである。
【0030】
同期ポイント416、418、420、422、および424は、VoIPネットワーク400中のコミュニケーション・チャネルCh1、…、Chn沿いにそれぞれ配置される。これらの同期ポイントは、まとまりを確実にするため、特定のユーザ/参加者に対する翻訳が完了した時点で、話し手ユーザ/参加者以外のユーザ/参加者がコミュニケーション・セッション中への対話を開始することを可能にする。例えば、ユーザ/参加者定義プロフィールに基づいて、通信リソースに対する音声サービス要求が生成される。これらの音声サービス要求は、一群のアクション、すなわち、n−Way通信セッション中の一人の参加者が同期境界のアクション実行を要求する場合に行われる一連のイベントを指定することができる。これは、該ユーザ/参加者が、進行中のコミュニケーション・セッションの中で対話の開始を所望していることの通知であり得る。音声サービス要求に関連する特定の制御パケット情報は、1)話し手サーバが聞き手サーバに情報を送信する、2)あるサーバが聞き手モードから話し手モードに移行する、というシナリオに関係する。これらのサービス要求は、ユーザ/参加者間の翻訳/転送が行われていないとき、同期境界ポイントにおいて受理される。該サービス要求は、これら同期ポイントにおいて新規のコミュニケーションを開始するため、同期ポイントと同期ポイントとの間で処理される。翻訳の一定割合部分が完了次第、ユーザ・プロフィールを構成し、同期境界425にサービス要求を発行することができる。一方の極端として、ネィティブ言語による最初の言葉の反応を検知するとすぐ、翻訳が行われる前に、聞き手が次の話し手になれるためのサービス要求が発行されることがあり得る。このやり方で、話をしたい最初のSIPベースのユーザは、翻訳を聴取するまでの遅延を要する、他の全参加者を聞き手にして、次の話し手サーバになることができよう。他方の極端として、ユーザ設定によって、翻訳が完了した後でしかサービス要求を出せないようにすることもできよう。あるいは、妥協的モードとして、ユーザ設定によって言葉のコミュニケーションの最初のn個の単語の翻訳がうまく行き次第サービス要求が出せるようすることも可能であろう。このような仕方で、ユーザ設定を会話に対し最適化することができる。
【0031】
図5は、最適の場所で処理をするためのサーバ割当手順を含む、本発明のある実施形態のSIPベースのVoIPを示してしており、該実施形態では、n−Way複数ユーザ/参加者音声翻訳セッションが開始され500ユーザ/参加者、プロフィールが読み出される502。音声処理/翻訳が必要ないと判定された場合504、サーバは、図4の聞き手サーバ4 410の場合と同様な転送サービスを割り当てる506。処理/翻訳が必要であると判定された場合504、サーバは、特定の言語に対し必要な同時処理/翻訳の最大数を計算する508。該サーバは、次いでそれぞれの翻訳サーバの場所に基づいて利用可能なリソースを調べることができる510。デフォルト/話し手サーバが処理要件とルーティング・リアルタイム要件とを満たすことができるかどうかの判定が行われ512、満たせれば、デフォルト/話し手サーバに処理/翻訳サービスが割り当てられる516。デフォルト発信/話し手サーバが処理要件とルーティング・リアルタイム要件とを満たせない場合は、該処理要件とルーティング・リアルタイム要件とを満たすことができる聞き手サーバ(群)に、プロフィール・ベースの処理およびルーティングがスケジュールされる。
【0032】
さらに、原語の音声データ・ファイル/パケットを地理的にサーバ近くの同一言語のユーザ/参加者の多数により近接した、異なる場所にある翻訳サーバに送信することができる。しかして、参加者定義プロフィールに基づいて、別のサーバには、実際のパケットを送信しないで音声ファイルのある場所を送信することができる。
【0033】
翻訳処理のため最適のサーバを識別するサーバは、参加者定義プロフィールに基づき、アクティブなn−Way通信セッション中のそれぞれの参加者の衛星利用測位システム(GPS:Global Positioning System)場所情報に基づいて、サーバを識別することができる。しかして、該サーバは、転送/翻訳参加者の場所を判定し、特定のユーザ/参加者群により近いサーバ群を用いて、通信トラフィック混雑および送信遅延が最小化されるように翻訳サーバを割り当てる。
【0034】
図6は、VoIP2方向セッションの例を含む、本発明の実施形態のSIPベースのVoIPを示す。ボイス・オーバーIPサーバ600は、英語を話すユーザ/参加者1 602およびフランス語を話すユーザ/参加者2 606からのコミュニケーションを受信する。英語を話すユーザ/参加者1の会話604は、ユーザ/参加者1の会話の開始、およびユーザ/参加者2からのフランス語から英語に翻訳された応答を示す。フランス語を話すユーザ/参加者2の会話608は、ユーザ/参加者1の対話への応答およびユーザ/参加者1からの英語からフランス語に翻訳された応答を示す。「N番目の言語」を話すユーザ/参加者「N]は、ユーザ/参加者1とユーザ/参加者2との全会話の翻訳をユーザ/参加者「N」の「N番目の言語」で受信することになろう。
【0035】
図7は、VoIPネットワーク上のn−Way複数参加者音声処理を含む、本発明の実施形態のSIPベースのVoIPを示す。n−Way多言語コミュニケーションのためのVoIPサーバ700は、音声またはテキストあるいはその両方による多言語コミュニケーションのため、サーバでのn−Way言語翻訳に対するユーザ/参加者の選好言語を検出する。翻訳または転送あるいはその両方の対象となる音声およびテキスト・データに加えて、補助的な、音声、テキストを含むドキュメント、音声を含む映像データをn−Way通信に組み入れ、ユーザ/参加者定義プロフィール・データに基づき、同様な翻訳または転送あるいはその両方の対象とすることができる。
【0036】
VoIPサーバには、異なる地理的場所群に亘って分散可能な複数のサーバを含めることができる。ユーザ/参加者No.1、ユーザ/参加者No.2、ユーザ/参加者No.3、およびユーザ/参加者No.4は、例えば、それぞれ、英語、スペイン語、フランス語、および英語の選好言語を有する。音声およびテキスト・データは、聞き手ユーザ/参加者の選好する言語に翻訳されるか、あるいは、例えば、双方の選考言語が同じ英語のユーザ/参加者No.1とユーザ/参加者No.4と間のコミュニケーションなど翻訳が不必要な場合には、ユーザ/参加者に直接転送することができる。
【0037】
図8は、VoIPサーバ800が、ユーザ/参加者の選好言語を検出し、ユーザ/参加者プロフィール・データを使ってユーザ/参加者プロフィール・データベース806を更新する遊休時モードを含む、本発明の実施形態のSIPベースのVoIPを示す。ユーザ/参加者プロフィール・データベース806は、SIPプロトコルを拡張し、ユーザ/参加者プロフィール・データの間の類似点あるいは相違点の対比と判定とに基づいてコミュニケーションを行うために用いられる。ユーザ/参加者1 802は話し手サーバ(TS:talking server)によって識別され、ユーザ/参加者2 804は聞き手サーバによって識別される。
【0038】
図9は、選択的プロトコルを用いるコミュニケーションを含む、本発明の実施形態のSIPベースのVoIPを示す。ユーザ/参加者1が、少なくとも2つの言語を使う複数のユーザ/参加者とn−Way通信を開始する900。ユーザ/参加者1および意図された受信者であるユーザ/参加者2の選好言語904のチェック902が行われ、言語の翻訳を行うかどうかが判定される。翻訳の必要がなく、コミュニケーションが同じ言語を話す受信者への転送だけの場合、原語の音声データはユーザ/参加者に直接送信され906、n−Way通信でユーザ/参加者2によって受信される908。
【0039】
ユーザ/参加者プロフィール・データベース904からのユーザ/参加者プロフィール・データの違いに基づき翻訳が必要と判定された場合902、サーバ負荷、通信ルーティング、および同一言語プロフィールを有する他のユーザ/参加者への地理的近接度に基づいて、最適の場所で音声およびテキスト・データの翻訳を行う設定がされる910。送信される914合成音声翻訳またはテキスト翻訳を受信することになるユーザ/参加者2に対し通知が行われる912。
【0040】
ユーザ/参加者2は、翻訳された音声/テキスト・データまたは翻訳されていない原語の音声/テキスト・データを受信し、ユーザ/参加者1、またはコミュニケーション・セッション中の別のユーザ/参加者(図示せず)に応答することができる。ユーザ/参加者2は、翻訳サーバが、例えば900におけるユーザ/参加者1など前回のコミュニケーション・ユーザ/参加者からのデータを翻訳した後で、遊休状態に入っているとき、同期ポイントにおいて応答する916。ユーザ/参加者2に対する聞き手/転送サーバは、今や話し手サーバとなり、ユーザ/参加者プロフィール・データベース904に基づいて言語翻訳が必要かどうかをチェックする918。翻訳が必要ない場合、原語の音声テキスト・データがユーザ/参加者1、またはユーザ/参加者2が宛てた別の違うユーザ/参加者に送信される。
【0041】
ユーザ/参加者プロフィール・データベース904からのユーザ/参加者プロフィール・データの違いに基づき翻訳が必要と判定された場合918、サーバ負荷、通信ルーティング、および同一言語プロフィールを有する他のユーザ/参加者への地理的近接度に基づいて、最適の場所で音声およびテキスト・データの翻訳を行う設定がされる920。送信される924合成音声翻訳またはテキスト翻訳を受信することになるユーザ/参加者1に対し通知が行われる922。
【0042】
図10は、複数参加者間のリアルタイム・コミュニケーションを可能にするコンピュータ実行の例示的実施形態を示し、この方法は、第一サーバが、第一参加者から第二参加者に宛てられた、第一会話言語で構成されるリアルタイム・コミュニケーションを受信するステップ1000を含む。第二参加者が、リアルタイム・コミュニケーション受信の選好会話言語を識別する1002。該受信の選好会話言語が、リアルタイム・コミュニケーションの第一会話言語と異なっているかどうかの判定が行われる1004。該選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは第一会話言語から第二参加者の受信選好会話言語に翻訳され、翻訳されたリアルタイム・コミュニケーションが生成される1006。翻訳されたリアルタイム・コミュニケーションが、第二参加者に配信される1008。
【0043】
通信リソースに対する音声サービス要求が生成され、参加者定義プロフィールに基づいて、第一参加者と第二参加者との間の音声コミュニケーションがオンデマンドで処理される。
【0044】
また、参加者定義プロフィールに基づいて、翻訳されたテキスト、補助的な翻訳された音声、翻訳されたドキュメント・テキスト、および翻訳された音声を含む映像データを参加者コミュニケーション中に組み入れることができる。参加者定義プロフィールに基づき、ドキュメントの実際の送信をしないで、音声ファイルの場所の連絡で済ますことができる。加えて、翻訳するステップには、参加者定義プロフィールに基づいて、実行中のコミュニケーション・チャネル中のそれぞれの参加者の衛星利用測位システム(GPS)場所情報を識別するステップをさらに含めることができる。リアルタイム・コミュニケーションを処理するステップには、参加者定義プロフィールに基づいて、リアルタイム・コミュニケーションを処理するための最適の場所を判定するステップをさらに含めることができる。
【0045】
図11は、少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル(VoIP)サーバ1102と、少なくとも一つの受信VoIPサーバ1104と、送信VoIPサーバ1102と受信VoIPサーバ1104との間の通信を提供する、少なくとも一つのVoIP通信ネットワーク1106とを包含する通信システム1100を含む別の例示的実施形態を示す。翻訳モジュールが、少なくとも一つのVoIP通信ネットワーク1106を通して、送信VoIPサーバ1102と受信VoIPサーバ1104との間にアクティブなn−Way双方向自動音声翻訳チャネルを確立する。特定の場所1110にある処理VoIPサーバ1108は、少なくとも一つのVoIP通信ネットワーク1106上の相異なる会話言語の参加者の間で少なくとも一つの会話言語を翻訳する。少なくとも一つの会話言語の処理は、相異なる会話言語の参加者それぞれの参加者プロフィールに基づいて、処理VoIPサーバ1108のある特定の場所1110で実施するよう設定される。送信VoIPサーバ1102または受信VoIPサーバ1104のいずれかが、翻訳処理を取り扱う特定の場所1110の中にあると判定される場合、該いずれかのサーバ(1102/1104)を処理VoIPサーバ1108に含めることができる。
【0046】
参加者プロフィール・データベースに格納されている各参加者プロフィールは、参加者の会話言語プロフィールを含む。音声サービス要求モジュールは、参加者プロフィールに基づき、利用可能な通信リソースに対する要求を生成する。メディア・インテグレータは、参加者プロフィールに基づき、少なくとも一つの翻訳されている会話言語を使って、テキスト、音声、ドキュメント、および映像データを包含する情報を集成する。
【0047】
複数の聞き手VoIPサーバが、相異なる参加者会話言語を有する参加者をホストすることができる。処理VoIPサーバは、複数のVoIP話し手サーバ、および複数のVoIP聞き手サーバを含む。
【0048】
図12は、コンピュータ実行の方法を含む別の例示的実施形態を示し、該方法は、複数場所、複数参加者の音声翻訳セッションを開始し1200、次いで、該音声翻訳セッションへのセッション参加者の参加者プロフィールに基づいて、音声翻訳処理が必要かどうかを判定するステップ1202を含む。複数場所の各々において利用可能な翻訳リソースが判定され1204、該複数場所の各々において利用可能な翻訳リソースに基づいて、可能な同時翻訳処理の最大数が計算される1206。デフォルト・サーバが、該音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の両方を満たせるかどうかの判定が行われ1208、話し手参加者と聞き手参加者との参加者プロフィールの対比に基づいて、翻訳処理サービスが利用可能な翻訳リソースに割り当てられる1210。
【0049】
転送サービスの割り当ては、参加者プロフィールよる音声翻訳処理が必要かどうかの判定に基づいて行われる。少なくとも一つの聞き手サーバにおける参加者プロフィール・ベースの翻訳処理サービスのスケジューリングは、話し手参加者および聞き手参加者の参加者プロフィールの対比による判定に基づいて行われる。
【0050】
本発明のある実施形態は、その固有の新規な特長により、話し手VoIPサーバが、発話元言語および標的言語コンテントを同時処理するため最適な場所にある利用可能なリソースを探し出して識別し、これにより、終端の参加者(達)が聞き手VoIPサーバから処理済みのデータをリアルタイムで受信し、オンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持される、ようにすることができる、プロトコル方法およびシステムを提供する。
【0051】
当業者がよく理解しているであろうように、本発明の態様は、システム、方法、またはコンピュータ・プログラムとして具現することができる。従って、本発明の態様は、全体がハードウエアの実施形態、全体がソフトウエアの実施形態(ファームウエア、常駐ソフトウエア、マイクロコードなどを含む)、または、本明細書では全て一般的に「回路」、「モジュール」、または「システム」ということもある、ソフトウエアおよびハードウエア態様を組み合わせた実施形態の形を取り得る。さらに、本発明の態様は、体内に具現されたコンピュータ可読プログラム・コードを有する一つ以上のコンピュータ可読媒体(群)中に具現されたコンピュータ・プログラムの形を取ることができる。
【0052】
一つ以上のコンピュータ可読媒体(群)の任意の組み合わせを用いることができる。該コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体とすることができる。コンピュータ可読記憶媒体は、例えば、以下に限らないが、電子的、磁気的、光学的、電磁気的、赤外的、または半導体の、システム、装置、またはデバイス、あるいは上記の任意の適切な組み合わせとすることができる。コンピュータ可読記憶媒体のさらに具体的な例(限定的リスト)には、一つ以上の配線を有する電気接続、携帯コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM:random access memory)、固体素子(SSD:solid−state device)、読み取り専用メモリ(ROM:read−only memory)、消去およびプログラム可能読み取り専用メモリ(EPROM:erasable programmable read−only memory、またはフラッシュ・メモリ)、光ファイバ、携帯コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disc read−only memory)、光記憶デバイス、磁気記憶デバイス、または上記の任意の適切な組み合わせが含まれよう。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、またはデバイスによって、またはこれらに関連させて使うためのプログラムを、包含または格納できる任意の有形媒体であり得る。
【0053】
コンピュータ可読信号媒体には、例えばベースバンド中にもしくは搬送波の一部として具現されたコンピュータ可読のプログラム・コードを有する、伝播データ信号を含めることができる。かかる伝播信号は、以下に限らないが、電磁気的、光学的、またはこれらの任意の組み合わせを含め、さまざまな形態の任意の形を取ることができる。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体でなく、命令実行システム、装置、またはデバイスによって、またはこれらに関連させて使うためのプログラムを通信、伝播、または移送可能な任意のコンピュータ可読媒体であり得る。
【0054】
コンピュータ可読媒体に具現されたプログラム・コードは、以下に限らないが、無線、有線、光ファイバ・ケーブル、RFなど、またはこれらの任意の適切な組合せ、を含む任意の適切な媒体を使って送信することができる。
【0055】
本発明の態様のためのオペレーションを実施するコンピュータ・プログラム・コードは、Java(R)、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および、“C”プログラミング言語または類似のプログラミング言語などの従来式手続き型プログラミング言語を含め、一つ以上のプログラミング言語の任意の組み合わせで書くことができる。該プログラム・コードは、全体をユーザのコンピュータで、一部をユーザのコンピュータで単独型ソフトウエア・パッケージとして実行することができ、一部をユーザのコンピュータで他の部分を遠隔コンピュータで、または全体を遠隔コンピュータまたはサーバで実行することができる。後者のシナリオでは、ローカル・エリア・ネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide area network)を含む任意の種類のネットワークを介して、遠隔コンピュータをユーザのコンピュータに接続することができ、あるいは(例えばインターネット・サービス・プロバイダを使いインターネットを介し)外部のコンピュータへの接続を行うことができる。
【0056】
以下に、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラムのフローチャート説明図またはブロック図あるいはその両方を参照しながら、本発明の態様を説明する。フローチャート説明図またはブロック図あるいはその両方の各ブロック、および、フローチャート説明図またはブロック図あるいはその両方のブロックの組み合わせは、コンピュータ・プログラム命令によって実行可能であることが理解されよう。これらのコンピュータ・プログラム命令を、汎用コンピュータ、特殊用途コンピュータ、または他のプログラム可能データ処理装置、のプロセッサに供給してマシンを形成し、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行されるこれらの命令が、該フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能/処理を実施するための手段を生成するようにすることができる。
【0057】
また、これらのコンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、または他の特定の仕方で機能するデバイス、に命令できるコンピュータ可読媒体に格納し、該コンピュータ可読媒体に格納された命令が、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能/処理を実施する命令を包含する製品を形成するようにすることができる。
【0058】
さらに、該コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、または、他のデバイスにロードして、該コンピュータ、他のプログラム可能装置、または他のデバイス上で一連のオペレーション・ステップを実施させてコンピュータ実行のプロセスを生成し、該コンピュータまたは他のプログラム可能装置で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能/処理を実行するためのプロセスを提供するようにすることもできる。
【0059】
図13は、本発明の実施形態の例示的態様によるコンピュータ・システムおよび方法を実行するために用いることのできる典型的なハードウエア構成のシステムを示す。
【0060】
ここで図13を参照すると、システム1300は、本発明のシステムおよび方法を実行するために用いることのできる[方法/システムの概要説明]のための典型的なハードウエア構成を図示している。該構成は、望ましくは、少なくとも一つのプロセッサまたは中央プロセッシング・ユニット(CPU:central processing unit)1310a、1310bを含む。CPU1310a、1310bは、システム・バス1312を介して、ランダム・アクセス・メモリ(RAM)または固体素子(SSD)あるいはその両方1314と、読み取り専用メモリ(ROM)1316と、(ディスク装置1321およびテープ・ドライブ1340などの周辺デバイスをシステム・バス1312に連結するための)入力/出力(I/O:input/output)アダプタ1318と、(キーボード1324、マウス1326、スピーカ1328、マイクロフォン1332、または他の参加者インタフェース・デバイス、あるいはこれらの複数を、システム・バス1312に連結するための)ユーザ(参加者)インタフェース・アダプタ1322と、情報処理システムをデータ処理ネットワーク、インターネット、イントラネット、パーソナル・エリア・ネットワーク(PAN:personal area network)などに接続するための通信アダプタ1334と、システム・バス1312をディスプレイ・デバイス1338またはプリンタ1339あるいはその両方に連結するためのディスプレイ・アダプタ1336と、に相互連結されている。さらに、自動リーダ/スキャナ1341を含めることができる。かかるリーダ/スキャナは、多くのメーカから販売されている。
【0061】
前述のシステムに加え、本発明のある異なる態様は、前述した方法を実施するためのコンピュータ実行の方法を含む。一例として、この方法は、上述の特定の環境で実行することができる。
【0062】
かかる方法は、例えば、デジタル・データ処理装置として具体化されたコンピュータを作動し、マシン可読の命令のシーケンスを実行することによって遂行することができる。これらの命令は、さまざまな種類の信号担持媒体中に在置することができる。
【0063】
しかして、本発明の実施形態のこの態様は、デジタル・データ・プロセッサが実行して上記の方法を遂行可能な、マシン可読命令のプログラムを有形に具現化する信号担持媒体を含むプログラム製品を対象とする。
【0064】
かかる方法は、例えば、CPU1310を作動し、マシン可読命令のシーケンスを実行させることによって遂行することができる。これらの命令は、さまざまな種類の信号担持媒体中に在置することができる。
【0065】
しかして、本発明の実施形態の態様は、CPU1310および上記のハードウエアを組み込んだデジタル・データ・プロセッサが実行して上記の方法を遂行することが可能な、マシン可読命令のプログラムを有形に具現化する信号担持媒体を含むプログラム製品を対象とする。
【0066】
この信号担持媒体には、例として、高速アクセス記憶装置に代表される、例えばCPU1310内に包含されたRAMまたはSSDあるいはその両方を含めることができる。あるいは、これら命令は、磁気データ記憶ディスケット1400、CD−ROM1402、または、USBフラッシュ・ドライブのような「プラグ・アンド・プレイ」メモリ・デバイス1404(図14参照)など、CPU1410が直接または間接的にアクセス可能な別の信号担持媒体に収納することができる。
【0067】
コンピュータ・サーバ/CPU1310に包含されているか他の場所かを問わず、これら命令は、例えば、DASD記憶装置(例、従来型の「ハード・ドライブ」またはRAIDアレイ)、磁気テープ、電子読み取り専用メモリ(例、ROM、SSD、EPROM、またはEEPROM)、光記憶デバイス(例、CD−ROM、WORM、DVD、デジタル光テープなど)、紙「パンチ」カード、または、デジタルおよびアナログ通信リンクおよび無線などの送信媒体を含む他の適切な信号担持媒体などの、多様なマシン可読のデータ記憶媒体に格納することができる。本発明のある例示的実施形態において、該マシン可読命令には、“C”などの言語からコンパイルされた、ソフトウエア・オブジェクト・コードを含めることができる。
【0068】
図中のフローチャートおよびブロック図は、本発明のさまざまな実施形態による、システム、方法、およびコンピュータ・プログラムの、可能な実装のアーキテクチャ、機能、およびオペレーションを示す。この点において、フローチャート中またはブロック図中の各ブロックは、規定された論理機能(群)を実施するための一つ以上の実行可能命令を含む、コードのモジュール、セグメント、または部分に相当し得る。また、いくつかの別の実装において、ブロック中に記載された機能を、図に記載されたのと違った順序で実施できることに留意すべきである。例えば、逐次的に示された2つのブロックが、実際は、実質的に同時に実行されることがあり得、または、関連する機能により時によっては、これらブロックが逆の順序で実行されることがあり得る。さらに、ブロック図またはフローチャート説明図あるいはその両方の各ブロック、および、ブロック図またはフローチャート説明図あるいはその両方のブロックの組み合わせは、特定の機能または処理を遂行する特別用途のハードウエア・ベースのシステム、または特別用途ハードウエアとコンピュータ命令との組み合わせによっても実施できることに留意すべきである。
【符号の説明】
【0069】
1300 システム
1310a CPU
1310b CPU
1312 システム・バス
1314 RAMまたはSSDあるいはその両方
1316 ROM
1318 I/Oアダプタ
1321 ディスク装置
1322 ユーザ・インタフェース・アダプタ
1324 キーボード
1326 マウス
1328 スピーカ
1332 マイクロフォン
1334 通信アダプタ
1336 ディスプレイ・アダプタ
1338 ディスプレイ
1339 プリンタ
1340 テープ・ドライブ
1341 リーダ/スキャナ
【技術分野】
【0001】
本発明の実施形態は、n−Way(ウエイ)選択的音声プロトコルを用い、フレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイス、システム、および方法に関する。
【背景技術】
【0002】
インターネット・プロトコル(IP:Internet Protocol)構内交換装置(PBX:Private Branch Exchange)は、内部参加者のためIPネットワークを介した電話を経路設定し、外線へのアクセスを提供する、構内交換装置または構内電話交換システムである。また、通常、IP PBXは、VoIP参加者と従来式電話システムの通話者との間の電話も交換する。こういった製品は、通常、サーバまたは専用の機器上で作動するソフトウエア・パッケージである。IP PBXは、別個の音声ネットワークの必要性を排除し、代わりに、同じネットワークに音声およびデータのトラフィックを一つにまとめる。既存の製品は、音声メニュー・システム、電話会議、クリックツーコール、通話記録および追跡、音声メール、および自動転送など、多様な電話マネジメント機能を提供している。IP PBXを用いて、企業は、参加者のデスクトップで作動、またはIPネットワーク上で機能するよう設計された従来式の机上電話セットで作動する、ソフトウエア実装だけのIP電話である「ソフトフォン」を選択することができる。
【0003】
Nemertes Research社のロビン・ガレイス(Robin Gareiss)によれば、諸組織は、VoIPに移行することによって、WANコストを15%〜40%節約し、節約の平均は23%である。主な節約分野は以下の3分野である。
【0004】
1. 典型的にはフレーム・リレー、非同期伝送モード、または専用回線ネットワークから、マルチプロトコル・ラベル・スイッチング(MPLS:Multiprotocol Label Switching)への移行。VoIPは、MPLSへの転換の推進要因であるが、同速度の回線に対する全体的コストはより低い。を参照。
【0005】
2. 統合アクセス、これによって、企業は、音声とデータとを同一のアクセス・ラインに組み合わせ、利用度の低い回線を排除する。
【0006】
3. 統合コア回線。組織は、音声およびデータネットワークを組み合わせ、60%の平均使用率、非常にうまく管理されているネットワークでは75%から85%に達するピーク使用率を得ている。これら組織は、コアに低使用率の高速回線を使う必要性を排除している。
【発明の概要】
【発明が解決しようとする課題】
【0007】
MPLSは、Ipsilon(商標)のIPスイッチング、Cisco(商標)のTagスイッチング、IBM(IBM社の登録商標)のARIS(IBM社の登録商標)技術、並びに、コネクション型の非同期伝送モードおよびフレーム・リレー・ネットワークに見られるトラフィック技術の類からコネクションレスIPネットワークへの移行についての、他のいくつかの提案に起源している。IPトラフィックを、単一ルートに換えて多様なルートで送るという着想は、ボーダ・ゲートウェイ・プロトコルなどの内部ゲートウェイ・プロトコルによって、混雑または障害を回避するため、あるいは特定クラスのサービスまたは保証されたサービス・レベルを可能にするため考え出されたものである。MPLSスイッチおよびルータは、宛先、サービス・パラメータの種類、仮想プライベート・ネットワーク会員資格、または他の基準に基づいて、パケットにラベルを添付する。パケットがネットワークを進むにつれ、他のスイッチおよびルータは、パケットおよび経路をラベルと関連付けるテーブルを作成する。ラベル・スイッチ・ルータとも呼ばれるMPLSスイッチおよびルータ群は、各パケットに、ネットワークを通る特定の経路に対応するラベルをあてがう。同じラベルの全パケットは、同じ経路、いわゆるラベル・スイッチ・パス(LSP:Label Switched Path)、を使う。ラベルはエンドポイントでなく経路を示しているので、同じエンドポイントに宛てられたパケット群は、そこに到達するためにさまざまなLSPと使うことができる。既存のインターネット・スイッチング・システム(IP PBX)は、パケットを一つのエンドポイントから別のエンドポイントにルーティングするように最適化されている。しかしながら、VoIPパケットを使うアプリケーションは、リアルタイム・ルーティング要件に加え、リアルタイム処理の要件も必要とする。今日、異なる言語を話す人々の間でのボイス・オーバーIP(VoIP:Voice over IP)を使ったコミュニケーションは、発呼および受呼当事者の両方が理解し話すことのできる言語を使ってだけ行うことができる。企業が世界的な人的資源を自社の労働力に組み込むにつれ、言語バリアが益々重大な障害になっている。本発明は、n−Way選択的音声プロトコルを用いてフレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイスおよび方法に関する。
【0008】
開発プロジェクトにおいて、地理的に分散されたチームの間の非効率的なコミュニケーションがプロジェクトのリスクおよびコストを増大させている。今日、異なる言語を話す人々の間での、ボイス・オーバーIPを介した(VoIP)コミュニケーションは、発呼および受呼当事者の両方が理解し話すことのできる言語使うか、または通訳を介してだけ行うことができる。
【0009】
本発明は、既存のVoIPネットワークを拡張し、複数参加者の同時翻訳機能およびサービスを可能にする。
【課題を解決するための手段】
【0010】
従来の方法および構造の前述および他の典型的な問題、欠点および不利点をかんがみ、本発明の実施形態の例示的態様は、選択的同報通信プロトコルを用い複数の参加者の間でのリアルタイム・コミュニケーションを可能にするコンピュータ実行の方法を提供し、該方法は、第一サーバが第一参加者からのリアルタイム・コミュニケーションを受信するステップを含み、該リアルタイム・コミュニケーションは、第一会話言語で構成され、第二参加者に宛てられている。第二参加者がリアルタイム・コミュニケーション受信に選好する会話言語を識別する。該選好受信会話言語が、該リアルタイム・コミュニケーションの第一会話言語と異なっているかどうかが判定される。選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは第一会話言語から第二参加者の受信選好会話言語に翻訳され、翻訳されたリアルタイム・コミュニケーションが生成される。翻訳されたリアルタイム・コミュニケーションは第二参加者に配信される。
【0011】
本発明の別の例示的実施形態は、少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル(VoIP:Voice Over Internet protocol)サーバと、少なくとも一つの受信VoIPサーバと、送信VoIPサーバと受信VoIPサーバとの間の通信を提供する少なくとも一つのVoIP通信ネットワークとを含む通信システムを提供する。翻訳モジュールは、該少なくとも一つのVoIP通信ネットワークを通して、送信および受信VoIPサーバ間にアクティブなn−Way双方向自動音声翻訳チャネルを確立する。特定の場所にある処理VoIPサーバは、少なくとも一つのVoIP通信ネットワーク上の相異なる会話言語の参加者間の少なくとも一つの会話言語を翻訳する。該少なくとも一つの会話言語の処理は、処理VoIPサーバのある特定の場所で、それぞれの参加者の場所およびプロフィールに基づいて行われるよう設定される。
【0012】
本発明の別の例示的実施形態は、複数場所、複数参加者の音声翻訳セッションを開始するステップと、次いで参加者に基づいて音声翻訳処理が必要かどうかを判定するステップとを含む、コンピュータ実行の方法を提供する。複数場所の各々における利用可能な翻訳リソースが判定され、該複数の場所の各々において利用可能な翻訳リソースと、コミュニケーション・セッションのリアルタイム要件とに基づいて、同時翻訳処理の可能最大数が計算される。デフォルト・サーバが、音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の両方を満たすことができるかどうかの判定が行われ、次いで、話し手参加者と聞き手参加者との参加者プロフィールの対比に基づいて、翻訳処理サービスが利用可能な翻訳リソースに割り当てられる。
【0013】
これらの新規な特長により、本発明のある実施形態は、話し手VoIPサーバが、発話元言語および標的言語コンテントを同時処理するために最適な場所にある利用可能なリソースを探し出して識別し、これにより、終端の参加者(達)が聞き手VoIPサーバから処理済みのデータをリアルタイムで受信し、オンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持されるようにすることができる、プロトコル方法およびシステムを提供することができる。
【0014】
前述のおよび他の典型的な目的、態様および利点は、以下の本発明の例示的実施形態の詳細な説明を、図面を参照しながら読むことによってより良く理解することができよう。
【図面の簡単な説明】
【0015】
【図1】ボイス・オーバー・インターネット・プロトコル(VoIP)に基づいた、セッション開始プロトコル(SIP:Session Initiation Protocol)を示す。
【図2】本発明のある実施形態のSIPベースのVoIPを示す。
【図3】図3Aは4つのプロフィール設定用ディスプレイ・ページの一組を示し、図3Bは、翻訳の質問のため表示された、ユーザ/参加者プロンプト・ウィンドウを示し、これらは、本発明のある実施形態にサポートされているSIP方法を示す。
【図4】本発明のある実施形態のSIPベースのVoIPを示す。
【図5】最適の場所で処理をするためのサーバ割当手順を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図6】VoIPセッションの例を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図7】VoIPネットワーク上の複数参加者の音声処理を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図8】遊休時モードを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図9】選択的プロトコルを用いるコミュニケーションを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図10】本発明の一つの実施形態の方法についての論理フローチャートを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図11】本発明の一つの実施形態のシステム略図を含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図12】本発明の一つの実施形態の方法に対する論理フローチャートを含む、本発明のある実施形態のSIPベースのVoIPを示す。
【図13】本発明のある実施形態の例示的態様によるコンピュータ・システムおよび方法を実装するため用いることのできる、典型的なハードウエア構成システムを示す。
【図14】発明のある実施形態の例示的態様によるコンピュータ・システムおよび方法を実装するため用いることのできる、プログラム可能な記憶媒体を示す。
【発明を実施するための形態】
【0016】
ここで、図面、さらに具体的には図1〜図14を参照すると、本発明の方法の典型的実施形態群およびある実施形態の構造が示されている。
【0017】
概観
参照により本明細書に組み込まれる米国特許第6,434,526号は、スピーチ認識能力を含有するネットワーク・アプリケーション・ソフトウエア・サービスについて記載している。スピーチ認識ソフトウエアは、通信ネットワーク上のアプリケーション特有のソフトウエアと組み合わせて提供される。アナログ音声データは、ユーザの場所でデジタル化され、音声データとして識別され、中央となる場所に所在するアプリケーション・ソフトウエアに送信される。ネットワーク・サーバが、音声データとして識別されたデータを受信し、それをスピーチ・サーバに送信する。スピーチ・サーバに常駐するスピーチ認識ソフトウエアは、辞書、および該スピーチ認識ソフトウエアのユーザの各々の声にあわせたモジュールを包含している。ユーザが話すにつれ、口述の翻訳がユーザの場所に返信され、点検および必要な場合音声または印字による内容訂正のため、ユーザのコンピュータ画面に印字で表示される。複数のユーザは、ユーザの各々に対する返信が同時ベースで行われるようにするため、スピーチ認識ソフトウエアに交互にアクセスする。
【0018】
参照により本明細書に組み込まれる米国特許第7,058,046号は、拡張性のある電話管理システムについて記載している。該システムには、一つ以上の音声ブラウザをホストする少なくとも一つの音声サーバを含めることができ、該音声サーバは、音声ブラウザが音声電話要求を通して処理することができる単一の通信ポートを有し、各音声ブラウザは、音声電話要求を通して処理することができるポート・エイリアスを有する。また、該システムには、公衆交換式電話ネットワーク(PSTN:public switched telephone network)中の回線エンドポイントを音声サーバにリンクする電話処理ゲートウェイを含めることができる。最後に、該システムには、それぞれの音声ブラウザへのポート・エイリアスをマップする転換テーブルを含めることができる。
【0019】
参照により本明細書に組み込まれる米国特許第7,406,414号は、音声ストリームの中で翻訳を提供する方法について記載しており、該方法は、第一言語のスピーチ信号を受信するステップと、該スピーチ信号からテキストを設定するステップと、該テキストを第二の異なる言語に翻訳するステップと、翻訳されたテキストをスピーチ信号内に符号化するステップとを包含することができる。
【0020】
企業が世界的な人的資源を自社の労働力に組み込むにつれ、言語バリアが益々重大な障害になっている。本発明は、n−Way選択的音声プロトコルを使うVoIPチャネルを用いて、フレーズを一つの言語から別の言語に翻訳するための電子翻訳デバイスおよび方法に関する。
【0021】
普通、複数の言語翻訳が要求される場合、VoIPリアルタイム要件が所与のサーバ・アプリケーションの設計能力を超えることがあり得る。課題は、どのサーバが、本発明が対象とする同時的プロフィール・ベースのVoIP処理の所与の数に対し、リアルタイム処理要件およびルーティング要件を満たすことができるかを判定することである。
【0022】
本発明のある実施形態は、話し手VoIPサーバが、発話元言語および標的言語コンテントを同時処理するため最適な場所にある利用可能なリソースを探し出して識別し、これにより、少なくとも一人のエンド参加者が聞き手VoIPサーバから処理済みのデータをリアルタイムで受信し、選択的同報通信プロトコルに基づくオンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持されるようすることができる、システムおよび方法を提供する。
【0023】
例示的態様
再度、図面を参照すると、図1には、ボイス・オーバー・インターネット・プロトコル(VoIP)に基づいた、セッション開始プロトコル(SIP)が示されている。SIPアプリケーション層は、コンテントが音声、映像、データ、またはウェブ・ベースのもののいずれかに関わらず、一人以上の参加者のエンド・デバイスがどのように接続を生成し、変更し、終了することができるかを定義する。しかしながら、SIPの限界は、電話会議セッションでは、全SIPパケットが参加者全員に同報通信され、従い同時参加者に対する計算およびピアツーピア(P2P)処理能力の拡張性が制限されることにある。図1には、コミュニケーションの開始100と、その後の同報通信パケットの生成または受信102が示されている。コミュニケーションを終了する決定がされなければ104、同報通信パケットが続けて生成、受信され、終了決定されれば終了される106。
【0024】
図2には、本発明のある実施形態の新規なSIPベースのVoIPが示されており、電話会議のセッションにおいては、拡張SIPパケットが、参加者の言語プロフィールおよび利用可能な計算および通信リソースに基づいた選択的同報通信コミュニケーション・チャネルを流れ、参加者間のまとまりを維持する。200においてコミュニケーションの開始が起動され、その後コミュニケーションがn−Way通信かどうかの判定がされる202。少なくとも2つの言語が関わる単一のコミュニケーション・セッションに2人を超える参加者がいる場合は、n−Way通信である。n−Wayユーザ/参加者コミュニケーションがなく、例えば2方向性コミュニケーションだけであると判定された場合は、同報通信パケットが生成されまたは受信され204、コミュニケーションを終了すると決められ206該コミュニケーションが完全に終了する208まで生成または受信が続けられる。なお、エレメント204、206、および208は、図1のエレメント102、104、および106と同じである。
【0025】
n−Way通信が、あるユーザ/参加者によって起動されたと判定された場合202、同報通信パケットが生成または受信される210。コミュニケーションの間に、ユーザ/参加者の発話要求が受信されたと判定された場合212、アービタ・サービス214は、同期ポイントで同報通信パケットに割り込むことができる。コミュニケーション・セッションを終了するとの決定がなされるまで216、コミュニケーション・セッションが続く。コミュニケーション・セッションを終了するとの決定がなされた後216、コミュニケーション・セッションは終了される218。
【0026】
図3Aは4つのプロフィール設定用ディスプレイ・ページの一組300を示し、ユーザ/参加者は、コミュニケーション・セッションを開始するに先立って、これらページにおいてユーザ/参加者プロフィール設定を初期選択することができる。「言語設定」ページ302は、ユーザ/参加者が、言語翻訳を有効にし、選好および代替翻訳言語を選択し、ユーザ/参加者コンタクト・プロフィールに基づいて特定のユーザ/参加者に固有の選好言語を選択し、各ユーザ/参加者コンタクトとの直近使用言語を用いるかどうか、およびコミュニケーションが翻訳されている間ユーザ/参加者に警告表示させるかどうかを選定できるページを示す。「音声識別」ページ304は、ユーザ/参加者が、ユーザ/参加者の写真、または氏名、または身分証明を表示させることによって、翻訳された合成音声を識別することを選定できるページを示す。「翻訳エンジン」ページ306は、ユーザ/参加者が、サーバ翻訳を行う場合の選択を行えるページを示す。例えば、ユーザ/参加者のサーバで翻訳してもよいし、ユーザ/参加者のデバイスで翻訳してもよいし、もしくは、サーバの負荷、ユーザ/参加者のデバイスの能力、またはユーザ/参加者の数および翻訳対象言語の数、あるいはこれらの複数に基づいて、自動的に翻訳デバイスを決定することもできる。「テキスト」ページ308は、ユーザ/参加者が、ユーザ/参加者の元々のまたは選好する言語のいずれかを使って、翻訳されたテキスト・インプットをスピーチに変換したり、入来する翻訳音声をテキストに変換したりすること、および、テキストに変換されている場合入来する翻訳音声を消音することができるページを示す。
【0027】
図3Bは、コミュニケーション・セッションが開始されたとき、翻訳問い合わせについて表示されるユーザ/参加者プロンプト・ウィンドウ310を示す。例えば、あるユーザ/参加者が、ある特定の言語で音声コミュニケーションを開始したことが識別される。ユーザ/参加者プロンプト・ウィンドウ310は、該コミュニケーションの、図3Aの「言語設定」ページ302で選定されたユーザ/参加者の選好言語への翻訳を起動するようにうながす。
【0028】
図4は、本発明のある実施形態のSIPベースのVoIPを示し、VoIPネットワーク400が、複数のサーバ402、406、408、410、412、および414を含む円で表されている。ネィティブ言語が例えば英語である、SIPベースのユーザ/参加者1 404によって、話し手サーバ402を使いn−Way通信セッションが開始される。話し手サーバ1 402は、複数のチャネルCh1、Ch2、Ch3、…、Chnを介して複数の聞き手サーバ2〜6 406〜414に転送する。各聞き手サーバは、英語の同報通信音声パケットと、それに加え、ユーザ/参加者1 404のユーザ/参加者プロフィール情報および聞き手サーバそれぞれのユーザ/参加者のユーザ/参加者プロフィール情報と、を受信する。例えば、SIPベースのユーザ/参加者2は、スペイン語の選好翻訳言語を有するユーザ/参加者プロフィールとして設定される。聞き手サーバ2 406は、ユーザ/参加者1およびユーザ/参加者2の2つのユーザ/参加者プロフィールの間の言語の違いを識別し、ユーザ/参加者2 426のため、聞き手サーバ2 406の英語同報通信音声パケットを処理し合成スピーチ音声のスペイン語に翻訳する。同様に、ユーザ/参加者3 428は聞き手サーバ3 408からフランス語ベースの翻訳を受信し、同じように、ユーザ/参加者5 432は聞き手サーバ5 412からロシア語ベースの翻訳を受信し、ユーザ/参加者6は聞き手サーバ6 414からアラビア語ベースの翻訳を受信する。
【0029】
しかしながら、SIPベースのユーザ/参加者4 430のユーザ/参加者プロフィール情報には、英語が選好翻訳言語として設定されている。話し手サーバ1 402から送信される英語の同報通信音声パケットは翻訳する必要がないので、聞き手サーバ4 410は、コミュニケーション送信を翻訳する必要がなく、英語の同報通信音声パケットを直接ユーザ/参加者4 430に転送するだけである。
【0030】
同期ポイント416、418、420、422、および424は、VoIPネットワーク400中のコミュニケーション・チャネルCh1、…、Chn沿いにそれぞれ配置される。これらの同期ポイントは、まとまりを確実にするため、特定のユーザ/参加者に対する翻訳が完了した時点で、話し手ユーザ/参加者以外のユーザ/参加者がコミュニケーション・セッション中への対話を開始することを可能にする。例えば、ユーザ/参加者定義プロフィールに基づいて、通信リソースに対する音声サービス要求が生成される。これらの音声サービス要求は、一群のアクション、すなわち、n−Way通信セッション中の一人の参加者が同期境界のアクション実行を要求する場合に行われる一連のイベントを指定することができる。これは、該ユーザ/参加者が、進行中のコミュニケーション・セッションの中で対話の開始を所望していることの通知であり得る。音声サービス要求に関連する特定の制御パケット情報は、1)話し手サーバが聞き手サーバに情報を送信する、2)あるサーバが聞き手モードから話し手モードに移行する、というシナリオに関係する。これらのサービス要求は、ユーザ/参加者間の翻訳/転送が行われていないとき、同期境界ポイントにおいて受理される。該サービス要求は、これら同期ポイントにおいて新規のコミュニケーションを開始するため、同期ポイントと同期ポイントとの間で処理される。翻訳の一定割合部分が完了次第、ユーザ・プロフィールを構成し、同期境界425にサービス要求を発行することができる。一方の極端として、ネィティブ言語による最初の言葉の反応を検知するとすぐ、翻訳が行われる前に、聞き手が次の話し手になれるためのサービス要求が発行されることがあり得る。このやり方で、話をしたい最初のSIPベースのユーザは、翻訳を聴取するまでの遅延を要する、他の全参加者を聞き手にして、次の話し手サーバになることができよう。他方の極端として、ユーザ設定によって、翻訳が完了した後でしかサービス要求を出せないようにすることもできよう。あるいは、妥協的モードとして、ユーザ設定によって言葉のコミュニケーションの最初のn個の単語の翻訳がうまく行き次第サービス要求が出せるようすることも可能であろう。このような仕方で、ユーザ設定を会話に対し最適化することができる。
【0031】
図5は、最適の場所で処理をするためのサーバ割当手順を含む、本発明のある実施形態のSIPベースのVoIPを示してしており、該実施形態では、n−Way複数ユーザ/参加者音声翻訳セッションが開始され500ユーザ/参加者、プロフィールが読み出される502。音声処理/翻訳が必要ないと判定された場合504、サーバは、図4の聞き手サーバ4 410の場合と同様な転送サービスを割り当てる506。処理/翻訳が必要であると判定された場合504、サーバは、特定の言語に対し必要な同時処理/翻訳の最大数を計算する508。該サーバは、次いでそれぞれの翻訳サーバの場所に基づいて利用可能なリソースを調べることができる510。デフォルト/話し手サーバが処理要件とルーティング・リアルタイム要件とを満たすことができるかどうかの判定が行われ512、満たせれば、デフォルト/話し手サーバに処理/翻訳サービスが割り当てられる516。デフォルト発信/話し手サーバが処理要件とルーティング・リアルタイム要件とを満たせない場合は、該処理要件とルーティング・リアルタイム要件とを満たすことができる聞き手サーバ(群)に、プロフィール・ベースの処理およびルーティングがスケジュールされる。
【0032】
さらに、原語の音声データ・ファイル/パケットを地理的にサーバ近くの同一言語のユーザ/参加者の多数により近接した、異なる場所にある翻訳サーバに送信することができる。しかして、参加者定義プロフィールに基づいて、別のサーバには、実際のパケットを送信しないで音声ファイルのある場所を送信することができる。
【0033】
翻訳処理のため最適のサーバを識別するサーバは、参加者定義プロフィールに基づき、アクティブなn−Way通信セッション中のそれぞれの参加者の衛星利用測位システム(GPS:Global Positioning System)場所情報に基づいて、サーバを識別することができる。しかして、該サーバは、転送/翻訳参加者の場所を判定し、特定のユーザ/参加者群により近いサーバ群を用いて、通信トラフィック混雑および送信遅延が最小化されるように翻訳サーバを割り当てる。
【0034】
図6は、VoIP2方向セッションの例を含む、本発明の実施形態のSIPベースのVoIPを示す。ボイス・オーバーIPサーバ600は、英語を話すユーザ/参加者1 602およびフランス語を話すユーザ/参加者2 606からのコミュニケーションを受信する。英語を話すユーザ/参加者1の会話604は、ユーザ/参加者1の会話の開始、およびユーザ/参加者2からのフランス語から英語に翻訳された応答を示す。フランス語を話すユーザ/参加者2の会話608は、ユーザ/参加者1の対話への応答およびユーザ/参加者1からの英語からフランス語に翻訳された応答を示す。「N番目の言語」を話すユーザ/参加者「N]は、ユーザ/参加者1とユーザ/参加者2との全会話の翻訳をユーザ/参加者「N」の「N番目の言語」で受信することになろう。
【0035】
図7は、VoIPネットワーク上のn−Way複数参加者音声処理を含む、本発明の実施形態のSIPベースのVoIPを示す。n−Way多言語コミュニケーションのためのVoIPサーバ700は、音声またはテキストあるいはその両方による多言語コミュニケーションのため、サーバでのn−Way言語翻訳に対するユーザ/参加者の選好言語を検出する。翻訳または転送あるいはその両方の対象となる音声およびテキスト・データに加えて、補助的な、音声、テキストを含むドキュメント、音声を含む映像データをn−Way通信に組み入れ、ユーザ/参加者定義プロフィール・データに基づき、同様な翻訳または転送あるいはその両方の対象とすることができる。
【0036】
VoIPサーバには、異なる地理的場所群に亘って分散可能な複数のサーバを含めることができる。ユーザ/参加者No.1、ユーザ/参加者No.2、ユーザ/参加者No.3、およびユーザ/参加者No.4は、例えば、それぞれ、英語、スペイン語、フランス語、および英語の選好言語を有する。音声およびテキスト・データは、聞き手ユーザ/参加者の選好する言語に翻訳されるか、あるいは、例えば、双方の選考言語が同じ英語のユーザ/参加者No.1とユーザ/参加者No.4と間のコミュニケーションなど翻訳が不必要な場合には、ユーザ/参加者に直接転送することができる。
【0037】
図8は、VoIPサーバ800が、ユーザ/参加者の選好言語を検出し、ユーザ/参加者プロフィール・データを使ってユーザ/参加者プロフィール・データベース806を更新する遊休時モードを含む、本発明の実施形態のSIPベースのVoIPを示す。ユーザ/参加者プロフィール・データベース806は、SIPプロトコルを拡張し、ユーザ/参加者プロフィール・データの間の類似点あるいは相違点の対比と判定とに基づいてコミュニケーションを行うために用いられる。ユーザ/参加者1 802は話し手サーバ(TS:talking server)によって識別され、ユーザ/参加者2 804は聞き手サーバによって識別される。
【0038】
図9は、選択的プロトコルを用いるコミュニケーションを含む、本発明の実施形態のSIPベースのVoIPを示す。ユーザ/参加者1が、少なくとも2つの言語を使う複数のユーザ/参加者とn−Way通信を開始する900。ユーザ/参加者1および意図された受信者であるユーザ/参加者2の選好言語904のチェック902が行われ、言語の翻訳を行うかどうかが判定される。翻訳の必要がなく、コミュニケーションが同じ言語を話す受信者への転送だけの場合、原語の音声データはユーザ/参加者に直接送信され906、n−Way通信でユーザ/参加者2によって受信される908。
【0039】
ユーザ/参加者プロフィール・データベース904からのユーザ/参加者プロフィール・データの違いに基づき翻訳が必要と判定された場合902、サーバ負荷、通信ルーティング、および同一言語プロフィールを有する他のユーザ/参加者への地理的近接度に基づいて、最適の場所で音声およびテキスト・データの翻訳を行う設定がされる910。送信される914合成音声翻訳またはテキスト翻訳を受信することになるユーザ/参加者2に対し通知が行われる912。
【0040】
ユーザ/参加者2は、翻訳された音声/テキスト・データまたは翻訳されていない原語の音声/テキスト・データを受信し、ユーザ/参加者1、またはコミュニケーション・セッション中の別のユーザ/参加者(図示せず)に応答することができる。ユーザ/参加者2は、翻訳サーバが、例えば900におけるユーザ/参加者1など前回のコミュニケーション・ユーザ/参加者からのデータを翻訳した後で、遊休状態に入っているとき、同期ポイントにおいて応答する916。ユーザ/参加者2に対する聞き手/転送サーバは、今や話し手サーバとなり、ユーザ/参加者プロフィール・データベース904に基づいて言語翻訳が必要かどうかをチェックする918。翻訳が必要ない場合、原語の音声テキスト・データがユーザ/参加者1、またはユーザ/参加者2が宛てた別の違うユーザ/参加者に送信される。
【0041】
ユーザ/参加者プロフィール・データベース904からのユーザ/参加者プロフィール・データの違いに基づき翻訳が必要と判定された場合918、サーバ負荷、通信ルーティング、および同一言語プロフィールを有する他のユーザ/参加者への地理的近接度に基づいて、最適の場所で音声およびテキスト・データの翻訳を行う設定がされる920。送信される924合成音声翻訳またはテキスト翻訳を受信することになるユーザ/参加者1に対し通知が行われる922。
【0042】
図10は、複数参加者間のリアルタイム・コミュニケーションを可能にするコンピュータ実行の例示的実施形態を示し、この方法は、第一サーバが、第一参加者から第二参加者に宛てられた、第一会話言語で構成されるリアルタイム・コミュニケーションを受信するステップ1000を含む。第二参加者が、リアルタイム・コミュニケーション受信の選好会話言語を識別する1002。該受信の選好会話言語が、リアルタイム・コミュニケーションの第一会話言語と異なっているかどうかの判定が行われる1004。該選好会話言語が第一会話言語と異なる場合は常に、リアルタイム・コミュニケーションは第一会話言語から第二参加者の受信選好会話言語に翻訳され、翻訳されたリアルタイム・コミュニケーションが生成される1006。翻訳されたリアルタイム・コミュニケーションが、第二参加者に配信される1008。
【0043】
通信リソースに対する音声サービス要求が生成され、参加者定義プロフィールに基づいて、第一参加者と第二参加者との間の音声コミュニケーションがオンデマンドで処理される。
【0044】
また、参加者定義プロフィールに基づいて、翻訳されたテキスト、補助的な翻訳された音声、翻訳されたドキュメント・テキスト、および翻訳された音声を含む映像データを参加者コミュニケーション中に組み入れることができる。参加者定義プロフィールに基づき、ドキュメントの実際の送信をしないで、音声ファイルの場所の連絡で済ますことができる。加えて、翻訳するステップには、参加者定義プロフィールに基づいて、実行中のコミュニケーション・チャネル中のそれぞれの参加者の衛星利用測位システム(GPS)場所情報を識別するステップをさらに含めることができる。リアルタイム・コミュニケーションを処理するステップには、参加者定義プロフィールに基づいて、リアルタイム・コミュニケーションを処理するための最適の場所を判定するステップをさらに含めることができる。
【0045】
図11は、少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル(VoIP)サーバ1102と、少なくとも一つの受信VoIPサーバ1104と、送信VoIPサーバ1102と受信VoIPサーバ1104との間の通信を提供する、少なくとも一つのVoIP通信ネットワーク1106とを包含する通信システム1100を含む別の例示的実施形態を示す。翻訳モジュールが、少なくとも一つのVoIP通信ネットワーク1106を通して、送信VoIPサーバ1102と受信VoIPサーバ1104との間にアクティブなn−Way双方向自動音声翻訳チャネルを確立する。特定の場所1110にある処理VoIPサーバ1108は、少なくとも一つのVoIP通信ネットワーク1106上の相異なる会話言語の参加者の間で少なくとも一つの会話言語を翻訳する。少なくとも一つの会話言語の処理は、相異なる会話言語の参加者それぞれの参加者プロフィールに基づいて、処理VoIPサーバ1108のある特定の場所1110で実施するよう設定される。送信VoIPサーバ1102または受信VoIPサーバ1104のいずれかが、翻訳処理を取り扱う特定の場所1110の中にあると判定される場合、該いずれかのサーバ(1102/1104)を処理VoIPサーバ1108に含めることができる。
【0046】
参加者プロフィール・データベースに格納されている各参加者プロフィールは、参加者の会話言語プロフィールを含む。音声サービス要求モジュールは、参加者プロフィールに基づき、利用可能な通信リソースに対する要求を生成する。メディア・インテグレータは、参加者プロフィールに基づき、少なくとも一つの翻訳されている会話言語を使って、テキスト、音声、ドキュメント、および映像データを包含する情報を集成する。
【0047】
複数の聞き手VoIPサーバが、相異なる参加者会話言語を有する参加者をホストすることができる。処理VoIPサーバは、複数のVoIP話し手サーバ、および複数のVoIP聞き手サーバを含む。
【0048】
図12は、コンピュータ実行の方法を含む別の例示的実施形態を示し、該方法は、複数場所、複数参加者の音声翻訳セッションを開始し1200、次いで、該音声翻訳セッションへのセッション参加者の参加者プロフィールに基づいて、音声翻訳処理が必要かどうかを判定するステップ1202を含む。複数場所の各々において利用可能な翻訳リソースが判定され1204、該複数場所の各々において利用可能な翻訳リソースに基づいて、可能な同時翻訳処理の最大数が計算される1206。デフォルト・サーバが、該音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の両方を満たせるかどうかの判定が行われ1208、話し手参加者と聞き手参加者との参加者プロフィールの対比に基づいて、翻訳処理サービスが利用可能な翻訳リソースに割り当てられる1210。
【0049】
転送サービスの割り当ては、参加者プロフィールよる音声翻訳処理が必要かどうかの判定に基づいて行われる。少なくとも一つの聞き手サーバにおける参加者プロフィール・ベースの翻訳処理サービスのスケジューリングは、話し手参加者および聞き手参加者の参加者プロフィールの対比による判定に基づいて行われる。
【0050】
本発明のある実施形態は、その固有の新規な特長により、話し手VoIPサーバが、発話元言語および標的言語コンテントを同時処理するため最適な場所にある利用可能なリソースを探し出して識別し、これにより、終端の参加者(達)が聞き手VoIPサーバから処理済みのデータをリアルタイムで受信し、オンライン・コミュニケーション・セッションの間コミュニケーションのテンポが維持される、ようにすることができる、プロトコル方法およびシステムを提供する。
【0051】
当業者がよく理解しているであろうように、本発明の態様は、システム、方法、またはコンピュータ・プログラムとして具現することができる。従って、本発明の態様は、全体がハードウエアの実施形態、全体がソフトウエアの実施形態(ファームウエア、常駐ソフトウエア、マイクロコードなどを含む)、または、本明細書では全て一般的に「回路」、「モジュール」、または「システム」ということもある、ソフトウエアおよびハードウエア態様を組み合わせた実施形態の形を取り得る。さらに、本発明の態様は、体内に具現されたコンピュータ可読プログラム・コードを有する一つ以上のコンピュータ可読媒体(群)中に具現されたコンピュータ・プログラムの形を取ることができる。
【0052】
一つ以上のコンピュータ可読媒体(群)の任意の組み合わせを用いることができる。該コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体とすることができる。コンピュータ可読記憶媒体は、例えば、以下に限らないが、電子的、磁気的、光学的、電磁気的、赤外的、または半導体の、システム、装置、またはデバイス、あるいは上記の任意の適切な組み合わせとすることができる。コンピュータ可読記憶媒体のさらに具体的な例(限定的リスト)には、一つ以上の配線を有する電気接続、携帯コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM:random access memory)、固体素子(SSD:solid−state device)、読み取り専用メモリ(ROM:read−only memory)、消去およびプログラム可能読み取り専用メモリ(EPROM:erasable programmable read−only memory、またはフラッシュ・メモリ)、光ファイバ、携帯コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disc read−only memory)、光記憶デバイス、磁気記憶デバイス、または上記の任意の適切な組み合わせが含まれよう。本文書の文脈において、コンピュータ可読記憶媒体は、命令実行システム、装置、またはデバイスによって、またはこれらに関連させて使うためのプログラムを、包含または格納できる任意の有形媒体であり得る。
【0053】
コンピュータ可読信号媒体には、例えばベースバンド中にもしくは搬送波の一部として具現されたコンピュータ可読のプログラム・コードを有する、伝播データ信号を含めることができる。かかる伝播信号は、以下に限らないが、電磁気的、光学的、またはこれらの任意の組み合わせを含め、さまざまな形態の任意の形を取ることができる。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体でなく、命令実行システム、装置、またはデバイスによって、またはこれらに関連させて使うためのプログラムを通信、伝播、または移送可能な任意のコンピュータ可読媒体であり得る。
【0054】
コンピュータ可読媒体に具現されたプログラム・コードは、以下に限らないが、無線、有線、光ファイバ・ケーブル、RFなど、またはこれらの任意の適切な組合せ、を含む任意の適切な媒体を使って送信することができる。
【0055】
本発明の態様のためのオペレーションを実施するコンピュータ・プログラム・コードは、Java(R)、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および、“C”プログラミング言語または類似のプログラミング言語などの従来式手続き型プログラミング言語を含め、一つ以上のプログラミング言語の任意の組み合わせで書くことができる。該プログラム・コードは、全体をユーザのコンピュータで、一部をユーザのコンピュータで単独型ソフトウエア・パッケージとして実行することができ、一部をユーザのコンピュータで他の部分を遠隔コンピュータで、または全体を遠隔コンピュータまたはサーバで実行することができる。後者のシナリオでは、ローカル・エリア・ネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide area network)を含む任意の種類のネットワークを介して、遠隔コンピュータをユーザのコンピュータに接続することができ、あるいは(例えばインターネット・サービス・プロバイダを使いインターネットを介し)外部のコンピュータへの接続を行うことができる。
【0056】
以下に、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラムのフローチャート説明図またはブロック図あるいはその両方を参照しながら、本発明の態様を説明する。フローチャート説明図またはブロック図あるいはその両方の各ブロック、および、フローチャート説明図またはブロック図あるいはその両方のブロックの組み合わせは、コンピュータ・プログラム命令によって実行可能であることが理解されよう。これらのコンピュータ・プログラム命令を、汎用コンピュータ、特殊用途コンピュータ、または他のプログラム可能データ処理装置、のプロセッサに供給してマシンを形成し、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行されるこれらの命令が、該フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能/処理を実施するための手段を生成するようにすることができる。
【0057】
また、これらのコンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、または他の特定の仕方で機能するデバイス、に命令できるコンピュータ可読媒体に格納し、該コンピュータ可読媒体に格納された命令が、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能/処理を実施する命令を包含する製品を形成するようにすることができる。
【0058】
さらに、該コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、または、他のデバイスにロードして、該コンピュータ、他のプログラム可能装置、または他のデバイス上で一連のオペレーション・ステップを実施させてコンピュータ実行のプロセスを生成し、該コンピュータまたは他のプログラム可能装置で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックまたはブロック群中に規定された機能/処理を実行するためのプロセスを提供するようにすることもできる。
【0059】
図13は、本発明の実施形態の例示的態様によるコンピュータ・システムおよび方法を実行するために用いることのできる典型的なハードウエア構成のシステムを示す。
【0060】
ここで図13を参照すると、システム1300は、本発明のシステムおよび方法を実行するために用いることのできる[方法/システムの概要説明]のための典型的なハードウエア構成を図示している。該構成は、望ましくは、少なくとも一つのプロセッサまたは中央プロセッシング・ユニット(CPU:central processing unit)1310a、1310bを含む。CPU1310a、1310bは、システム・バス1312を介して、ランダム・アクセス・メモリ(RAM)または固体素子(SSD)あるいはその両方1314と、読み取り専用メモリ(ROM)1316と、(ディスク装置1321およびテープ・ドライブ1340などの周辺デバイスをシステム・バス1312に連結するための)入力/出力(I/O:input/output)アダプタ1318と、(キーボード1324、マウス1326、スピーカ1328、マイクロフォン1332、または他の参加者インタフェース・デバイス、あるいはこれらの複数を、システム・バス1312に連結するための)ユーザ(参加者)インタフェース・アダプタ1322と、情報処理システムをデータ処理ネットワーク、インターネット、イントラネット、パーソナル・エリア・ネットワーク(PAN:personal area network)などに接続するための通信アダプタ1334と、システム・バス1312をディスプレイ・デバイス1338またはプリンタ1339あるいはその両方に連結するためのディスプレイ・アダプタ1336と、に相互連結されている。さらに、自動リーダ/スキャナ1341を含めることができる。かかるリーダ/スキャナは、多くのメーカから販売されている。
【0061】
前述のシステムに加え、本発明のある異なる態様は、前述した方法を実施するためのコンピュータ実行の方法を含む。一例として、この方法は、上述の特定の環境で実行することができる。
【0062】
かかる方法は、例えば、デジタル・データ処理装置として具体化されたコンピュータを作動し、マシン可読の命令のシーケンスを実行することによって遂行することができる。これらの命令は、さまざまな種類の信号担持媒体中に在置することができる。
【0063】
しかして、本発明の実施形態のこの態様は、デジタル・データ・プロセッサが実行して上記の方法を遂行可能な、マシン可読命令のプログラムを有形に具現化する信号担持媒体を含むプログラム製品を対象とする。
【0064】
かかる方法は、例えば、CPU1310を作動し、マシン可読命令のシーケンスを実行させることによって遂行することができる。これらの命令は、さまざまな種類の信号担持媒体中に在置することができる。
【0065】
しかして、本発明の実施形態の態様は、CPU1310および上記のハードウエアを組み込んだデジタル・データ・プロセッサが実行して上記の方法を遂行することが可能な、マシン可読命令のプログラムを有形に具現化する信号担持媒体を含むプログラム製品を対象とする。
【0066】
この信号担持媒体には、例として、高速アクセス記憶装置に代表される、例えばCPU1310内に包含されたRAMまたはSSDあるいはその両方を含めることができる。あるいは、これら命令は、磁気データ記憶ディスケット1400、CD−ROM1402、または、USBフラッシュ・ドライブのような「プラグ・アンド・プレイ」メモリ・デバイス1404(図14参照)など、CPU1410が直接または間接的にアクセス可能な別の信号担持媒体に収納することができる。
【0067】
コンピュータ・サーバ/CPU1310に包含されているか他の場所かを問わず、これら命令は、例えば、DASD記憶装置(例、従来型の「ハード・ドライブ」またはRAIDアレイ)、磁気テープ、電子読み取り専用メモリ(例、ROM、SSD、EPROM、またはEEPROM)、光記憶デバイス(例、CD−ROM、WORM、DVD、デジタル光テープなど)、紙「パンチ」カード、または、デジタルおよびアナログ通信リンクおよび無線などの送信媒体を含む他の適切な信号担持媒体などの、多様なマシン可読のデータ記憶媒体に格納することができる。本発明のある例示的実施形態において、該マシン可読命令には、“C”などの言語からコンパイルされた、ソフトウエア・オブジェクト・コードを含めることができる。
【0068】
図中のフローチャートおよびブロック図は、本発明のさまざまな実施形態による、システム、方法、およびコンピュータ・プログラムの、可能な実装のアーキテクチャ、機能、およびオペレーションを示す。この点において、フローチャート中またはブロック図中の各ブロックは、規定された論理機能(群)を実施するための一つ以上の実行可能命令を含む、コードのモジュール、セグメント、または部分に相当し得る。また、いくつかの別の実装において、ブロック中に記載された機能を、図に記載されたのと違った順序で実施できることに留意すべきである。例えば、逐次的に示された2つのブロックが、実際は、実質的に同時に実行されることがあり得、または、関連する機能により時によっては、これらブロックが逆の順序で実行されることがあり得る。さらに、ブロック図またはフローチャート説明図あるいはその両方の各ブロック、および、ブロック図またはフローチャート説明図あるいはその両方のブロックの組み合わせは、特定の機能または処理を遂行する特別用途のハードウエア・ベースのシステム、または特別用途ハードウエアとコンピュータ命令との組み合わせによっても実施できることに留意すべきである。
【符号の説明】
【0069】
1300 システム
1310a CPU
1310b CPU
1312 システム・バス
1314 RAMまたはSSDあるいはその両方
1316 ROM
1318 I/Oアダプタ
1321 ディスク装置
1322 ユーザ・インタフェース・アダプタ
1324 キーボード
1326 マウス
1328 スピーカ
1332 マイクロフォン
1334 通信アダプタ
1336 ディスプレイ・アダプタ
1338 ディスプレイ
1339 プリンタ
1340 テープ・ドライブ
1341 リーダ/スキャナ
【特許請求の範囲】
【請求項1】
複数の参加者の間でリアルタイム・コミュニケーションを可能にする、コンピュータ実行の方法であって、前記方法は、
第一参加者からのリアルタイム・コミュニケーションを第一サーバで受信するステップであって、前記リアルタイム・コミュニケーションは、第一会話言語で構成され第二参加者に宛てられている、前記受信ステップと、
コンピューティング・デバイスが、前記第二参加者がリアルタイム・コミュニケーションの受信に選好する会話言語を識別するステップと、
前記コンピューティング・デバイスが、前記受信に選好する会話言語が前記リアルタイム・コミュニケーションの前記第一会話言語と異なっているかどうかを判定するステップと、
前記選好する会話言語が前記第一会話言語と異なる場合は常に、前記コンピューティング・デバイスが、前記リアルタイム・コミュニケーションを、前記第一会話言語から、前記第二参加者が前記受信に選好する会話言語に翻訳し、翻訳されたリアルタイム・コミュニケーションを生成するステップと、
前記コンピューティング・デバイスが、前記翻訳されたリアルタイム・コミュニケーションを前記第二参加者に配信するステップと、
を含む、前記方法。
【請求項2】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、通信リソースに対する音声サービス要求を生成するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、第一および第二参加者間の音声コミュニケーションをオンデマンドで処理するステップをさらに含む、請求項1に記載の方法。
【請求項4】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、翻訳されたテキスト、補助的な翻訳された音声、翻訳されたドキュメント・テキスト、および翻訳された音声を含む映像データを前記コミュニケーションに組み入れるステップをさらに含む、請求項1に記載の方法。
【請求項5】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、音声データの実際の送信をせずに前記音声データの場所を通信するステップをさらに含む、請求項4に記載の方法。
【請求項6】
前記翻訳をするステップは、前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、アクティブなコミュニケーション・チャネル中のそれぞれの参加者の衛星利用測位システム(GPS)場所情報を識別するステップを含む、請求項1に記載の方法。
【請求項7】
前記コンピューティング・デバイスが、前記リアルタイム・コミュニケーションを処理するのに最適な場所を判定するステップをさらに含む、請求項1に記載の方法。
【請求項8】
少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル(VoIP)サーバと、
少なくとも一つの受信VoIPサーバと、
前記送信VoIPサーバと前記受信VoIPサーバとの間の通信を提供する少なくとも一つのVoIP通信ネットワークと、
前記少なくとも一つのVoIP通信ネットワークを通して、前記少なくとも一つの送信VoIPサーバと前記少なくとも一つの受信VoIPサーバとの間に、アクティブなn−Way双方向自動音声翻訳チャネルを確立する、少なくとも一つの翻訳モジュールと、
前記少なくとも一つのVoIP通信ネットワーク上の相異なる会話言語の参加者の間で少なくとも一つの会話言語を翻訳する、特定の場所にある処理VoIPサーバと、
を含む通信システムであって、
前記少なくとも一つの会話言語の処理は、相異なる会話言語の前記参加者のそれぞれの参加者プロフィールに基づいて、前記処理VoIPサーバのある前記特定の場所で実施されるよう設定される、
前記通信システム。
【請求項9】
前記参加者プロフィールは、各々、参加者の会話言語プロフィールを含む、請求項8に記載のシステム。
【請求項10】
前記参加者プロフィールに基づいて、利用可能な通信リソースに対する要求を生成する音声サービス要求モジュールをさらに含む、請求項8に記載のシステム。
【請求項11】
前記参加者プロフィールに基づき、前記少なくとも一つの翻訳されている会話言語を使って、テキスト、音声、ドキュメント、および映像データを包含する情報を集成するメディア・インテグレータをさらに含む、請求項8に記載のシステム。
【請求項12】
参加者プロフィール・データベースをさらに含む、請求項8に記載のシステム。
【請求項13】
相異なる参加者の会話言語プロフィールを有する参加者をホストする、複数の聞き手VoIPサーバをさらに含む、請求項8に記載のシステム。
【請求項14】
前記処理VoIPサーバは、複数のVoIP話し手サーバおよび複数のVoIP聞き手サーバのうちの少なくとも一つを含む、請求項8に記載のシステム。
【請求項15】
コンピューティング・デバイスが、複数場所、複数参加者の音声翻訳セッションを開始するステップと、
前記コンピューティング・デバイスが、前記音声翻訳セッション中のセッション参加者の参加者プロフィールに基づいて、音声翻訳処理が必要かどうかを判定するステップと、
前記複数場所の各々において利用可能な翻訳リソースを判定するステップと、
前記コンピューティング・デバイスが、前記複数場所の各々において利用可能な前記翻訳リソースに基づいて可能な同時翻訳処理の最大数を計算するステップと、
前記コンピューティング・デバイスが、デフォルト・サーバは前記音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の双方を満たすことができるかどうかを判定するステップと、
前記コンピューティング・デバイスが、話し手参加者および聞き手参加者の前記参加者プロフィールの対比に基づいて、翻訳処理サービスを前記利用可能な翻訳リソースに割り当てるステップと、
を含むコンピュータ実行の方法。
【請求項16】
前記コンピューティング・デバイスが、参加者プロフィールに基づいて行った音声翻訳処理が必要かどうかの前記判定に基づいて転送サービスを割り当てるステップをさらに含む、請求項15に記載の方法。
【請求項17】
前記話し手参加者および前記聞き手参加者の前記参加者プロフィールの対比に基づいて行った前記判定に基づいて、少なくとも一つの聞き手サーバにおいて参加者プロフィール・ベースの翻訳処理サービスをスケジュールするステップをさらに含む、請求項15に記載の方法。
【請求項18】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、前記音声翻訳セッションにテキスト、音声、ドキュメント、および映像データを組み入れるステップをさらに含む、請求項15に記載の方法。
【請求項19】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、前記音声翻訳セッションに参加者の衛星利用測位システム(GPS)場所情報を組み入れるステップをさらに含む、請求項15に記載の方法。
【請求項20】
前記参加者プロフィールの各々は、参加者の会話言語プロフィールを含む、請求項15に記載の方法。
【請求項1】
複数の参加者の間でリアルタイム・コミュニケーションを可能にする、コンピュータ実行の方法であって、前記方法は、
第一参加者からのリアルタイム・コミュニケーションを第一サーバで受信するステップであって、前記リアルタイム・コミュニケーションは、第一会話言語で構成され第二参加者に宛てられている、前記受信ステップと、
コンピューティング・デバイスが、前記第二参加者がリアルタイム・コミュニケーションの受信に選好する会話言語を識別するステップと、
前記コンピューティング・デバイスが、前記受信に選好する会話言語が前記リアルタイム・コミュニケーションの前記第一会話言語と異なっているかどうかを判定するステップと、
前記選好する会話言語が前記第一会話言語と異なる場合は常に、前記コンピューティング・デバイスが、前記リアルタイム・コミュニケーションを、前記第一会話言語から、前記第二参加者が前記受信に選好する会話言語に翻訳し、翻訳されたリアルタイム・コミュニケーションを生成するステップと、
前記コンピューティング・デバイスが、前記翻訳されたリアルタイム・コミュニケーションを前記第二参加者に配信するステップと、
を含む、前記方法。
【請求項2】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、通信リソースに対する音声サービス要求を生成するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、第一および第二参加者間の音声コミュニケーションをオンデマンドで処理するステップをさらに含む、請求項1に記載の方法。
【請求項4】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、翻訳されたテキスト、補助的な翻訳された音声、翻訳されたドキュメント・テキスト、および翻訳された音声を含む映像データを前記コミュニケーションに組み入れるステップをさらに含む、請求項1に記載の方法。
【請求項5】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、音声データの実際の送信をせずに前記音声データの場所を通信するステップをさらに含む、請求項4に記載の方法。
【請求項6】
前記翻訳をするステップは、前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、アクティブなコミュニケーション・チャネル中のそれぞれの参加者の衛星利用測位システム(GPS)場所情報を識別するステップを含む、請求項1に記載の方法。
【請求項7】
前記コンピューティング・デバイスが、前記リアルタイム・コミュニケーションを処理するのに最適な場所を判定するステップをさらに含む、請求項1に記載の方法。
【請求項8】
少なくとも一つの送信ボイス・オーバー・インターネット・プロトコル(VoIP)サーバと、
少なくとも一つの受信VoIPサーバと、
前記送信VoIPサーバと前記受信VoIPサーバとの間の通信を提供する少なくとも一つのVoIP通信ネットワークと、
前記少なくとも一つのVoIP通信ネットワークを通して、前記少なくとも一つの送信VoIPサーバと前記少なくとも一つの受信VoIPサーバとの間に、アクティブなn−Way双方向自動音声翻訳チャネルを確立する、少なくとも一つの翻訳モジュールと、
前記少なくとも一つのVoIP通信ネットワーク上の相異なる会話言語の参加者の間で少なくとも一つの会話言語を翻訳する、特定の場所にある処理VoIPサーバと、
を含む通信システムであって、
前記少なくとも一つの会話言語の処理は、相異なる会話言語の前記参加者のそれぞれの参加者プロフィールに基づいて、前記処理VoIPサーバのある前記特定の場所で実施されるよう設定される、
前記通信システム。
【請求項9】
前記参加者プロフィールは、各々、参加者の会話言語プロフィールを含む、請求項8に記載のシステム。
【請求項10】
前記参加者プロフィールに基づいて、利用可能な通信リソースに対する要求を生成する音声サービス要求モジュールをさらに含む、請求項8に記載のシステム。
【請求項11】
前記参加者プロフィールに基づき、前記少なくとも一つの翻訳されている会話言語を使って、テキスト、音声、ドキュメント、および映像データを包含する情報を集成するメディア・インテグレータをさらに含む、請求項8に記載のシステム。
【請求項12】
参加者プロフィール・データベースをさらに含む、請求項8に記載のシステム。
【請求項13】
相異なる参加者の会話言語プロフィールを有する参加者をホストする、複数の聞き手VoIPサーバをさらに含む、請求項8に記載のシステム。
【請求項14】
前記処理VoIPサーバは、複数のVoIP話し手サーバおよび複数のVoIP聞き手サーバのうちの少なくとも一つを含む、請求項8に記載のシステム。
【請求項15】
コンピューティング・デバイスが、複数場所、複数参加者の音声翻訳セッションを開始するステップと、
前記コンピューティング・デバイスが、前記音声翻訳セッション中のセッション参加者の参加者プロフィールに基づいて、音声翻訳処理が必要かどうかを判定するステップと、
前記複数場所の各々において利用可能な翻訳リソースを判定するステップと、
前記コンピューティング・デバイスが、前記複数場所の各々において利用可能な前記翻訳リソースに基づいて可能な同時翻訳処理の最大数を計算するステップと、
前記コンピューティング・デバイスが、デフォルト・サーバは前記音声翻訳セッションのリアルタイム処理要件およびリアルタイム・ルーティング要件の双方を満たすことができるかどうかを判定するステップと、
前記コンピューティング・デバイスが、話し手参加者および聞き手参加者の前記参加者プロフィールの対比に基づいて、翻訳処理サービスを前記利用可能な翻訳リソースに割り当てるステップと、
を含むコンピュータ実行の方法。
【請求項16】
前記コンピューティング・デバイスが、参加者プロフィールに基づいて行った音声翻訳処理が必要かどうかの前記判定に基づいて転送サービスを割り当てるステップをさらに含む、請求項15に記載の方法。
【請求項17】
前記話し手参加者および前記聞き手参加者の前記参加者プロフィールの対比に基づいて行った前記判定に基づいて、少なくとも一つの聞き手サーバにおいて参加者プロフィール・ベースの翻訳処理サービスをスケジュールするステップをさらに含む、請求項15に記載の方法。
【請求項18】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、前記音声翻訳セッションにテキスト、音声、ドキュメント、および映像データを組み入れるステップをさらに含む、請求項15に記載の方法。
【請求項19】
前記コンピューティング・デバイスが、参加者定義プロフィールに基づき、前記音声翻訳セッションに参加者の衛星利用測位システム(GPS)場所情報を組み入れるステップをさらに含む、請求項15に記載の方法。
【請求項20】
前記参加者プロフィールの各々は、参加者の会話言語プロフィールを含む、請求項15に記載の方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2011−125006(P2011−125006A)
【公開日】平成23年6月23日(2011.6.23)
【国際特許分類】
【出願番号】特願2010−268938(P2010−268938)
【出願日】平成22年12月2日(2010.12.2)
【出願人】(390009531)インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MASCHINES CORPORATION
【Fターム(参考)】
【公開日】平成23年6月23日(2011.6.23)
【国際特許分類】
【出願日】平成22年12月2日(2010.12.2)
【出願人】(390009531)インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MASCHINES CORPORATION
【Fターム(参考)】
[ Back to top ]