説明

電子文書のテキスト情報に関するポインタにより瞬時に起動される2ヶ国語注釈

【課題】 本発明の課題は、ユーザがコンピュータ画面上に表示される電子文書を読みながら、ユーザのマウスポインタに隣接または重なり合うテキストの一部に含まれるテキスト情報に関するユーザのマウスポインタに関連付けされたコールアウトに表示される人工知能に基づく2ヶ国語注釈をユーザに提供するシステム及び方法を提供することである。
【解決手段】 上記課題は、ユーザ画面に表示される電子文書に含まれる第1言語によるテキスト情報に関する2ヶ国語注釈をユーザに提供するシステムであって、ユーザのポインタに隣接または重なり合うテキストの一部を画面抽出し、画面抽出したテキストの一部を1以上の論理、言語及び/または文法規則に従ってクエリに変換し、データベースを検索し、論理、言語及び/または文法規則を適用することにより、クエリを第2言語に翻訳し、ユーザ画面上にクエリ、クエリの翻訳及び/または他の読解支援情報を含む視覚的合図を表示するよう構成されるプロセッサを有するシステムにより解決される。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、その内容が参照することによりここに含まれる、2002年9月30日に出願された米国特許仮出願第60/414,623号に対する優先権を主張する。
【0002】
本発明は、一般に機械翻訳技術に関する。より詳細には、本発明は、ユーザがコンピュータ画面上の電子文書を閲覧しながら、ユーザのマウスポインタに隣接または重なっているテキストの一部に含まれるフレーズ、キーワードやセンテンスなどのテキスト情報に関するコールアウト(callout)やバブル(bubble)に表示される人工知能に基づく2ヶ国語注釈(bilingual annotation)を、ローカルコンピュータやウェブサーバからユーザに自動的に返すシステム及び方法を有する2ヶ国語LACE(Linguistic Annotation Calibration Engine)に関する。
【背景技術】
【0003】
ワールドワイドウェブは、シンプルなポイント・アンド・クリックシステムを介しユーザにアクセス可能なHTTPプロトコルを用いたすべてのインターネットサーバ上にある文書全体を参照する。インターネットはボーダレスであるため、世界中のユーザは、インターネット接続に必要な装置が利用可能である限り、任意のウェブサーバにより管理されているウェブサイトへのアクセスが可能である。
【0004】
世界中でのインターネットの広範な利用により、WWWは、インターネットへのアクセスが可能な多数の人々にとって主要な情報源となりつつある。ウェブユーザは、ユーザ自身の言語でのウェブサイトだけからでなく、外国語でのウェブサイトからも情報を求めている。異なる言語のバックグラウンドを有するユーザを支援するため、多くのサイト提供者は複数言語により自身のウェブサイトを提供している。例えば、西洋諸国からの閲覧者に注目してもらうため、多くの中国、韓国及び日本のウェブサイトは、英語、フランス語あるいはドイツ語のバージョンを備えている。同様に、アジアの閲覧者に注目してもらうため、一部のアメリカのウェブサイトもまた、中国語、韓国語あるいは日本語のバージョンを備えている。
【0005】
実際問題として、多言語ウェブサイトは、サイト所有者の観点から2ヶ国語ニーズを有するユーザに最も良く資するが、コスト効率的ではない。第1に、ウェブページ及びそのアップデートを異なる言語に翻訳するための専門家を雇うことは大変コストがかかる。数百から数千もの文書ページを有する大規模なウェブサイトでは、翻訳作業は大変なものとなる。第2に、翻訳は時間を要するため、適時的に多言語バージョンをアップデートすることは不可能である。第3に、ウェブサイトがより多くのバージョンを有するほど、各バージョン間に不整合が生じてくる。中心性、完全性あるいは整合性が不可欠となる場合もある。第4に、多言語ウェブサイトは、大規模データベース及び高処理機能を要するためにホストに負荷をかけるだけでなく、より大きなトラフィックを発生させるためにインターネットにも負荷をかけることになる。
【0006】
従って、ユーザ言語以外の言語によるウェブサイトを読むための1以上のツールをユーザに提供する必要性がある。
【0007】
Ning−Ping Chanらは、2003年8月5日に「METHOD AND SYSTEM FOR TRASLINGUAL TRANSLATION OF QUERY AND SEARCH AND RETRIAL OF MULTILINGUAL INFORMATION ON A COMPUTER NETWORK」というタイトルの発明に対する米国特許を受けた。当該特許は、ソース言語(あるいはユーザ言語またはサブジェクト言語とも呼ばれる)によりユーザが入力したクエリをターゲット言語(またはオブジェクト言語とも呼ばれる)に変換し、ターゲット言語によりウェブ文書の検索及び抽出を行い、当該ウェブ言語をソース言語に翻訳する方法を開示及び教示している。本発明によると、ユーザはまず、キーボードなどのユニットを介しソース言語によりクエリを入力する。その後、このクエリは、コンテンツワードを抽出するため、バックエンドのサーバにより処理される。次のステップは、サーバ上に設けられ、抽出されたコンテンツワードを言語地理的に標準化する機能を実行するダイアレクタルコントローラ(dialectal controller)において実行される。当該プロセスにおいて、ユーザによる検索を詳細化するため、あるいは最初の入力クエリを利用しては言語地理的標準化が実行できない場合には、さらなる入力を促されるかもしれない。この後、言語地理的に標準化されたワードを翻訳機を介しターゲット言語に翻訳するプレサーチ翻訳プロセスが後続する。この翻訳プロセスの後、翻訳されたワードをターゲット言語によりサーチエンジンに投入する。このような入力は、翻訳されたワードに対応するターゲット言語による検索結果を生成する。その後、当該検索結果は、検索基準を満たすサイト名(URL)の形式により表示される。ターゲット言語により取得されたすべての結果が、ユーザ画面に表示される。ユーザの要求に従って、当該検索結果はすべてあるいは部分的にソース言語に翻訳されるようにしてもよい。Chanの特許は、ソース言語と呼ばれるユーザ言語によりクエリを入力し、対象となるウェブサイトの翻訳全体をユーザに返すことによって、ユーザによるウェブ検索を支援するためのものである。多くの状況では、ターゲット言語に関する基本的知識をある程度有するユーザにとっては、文書全体の翻訳は必要ではない。代わりに、一部のキーワード、フレーズあるいはセンテンスに関する即時の2ヶ国語注釈(bilingual annotation)で十分であるかもしれない。
【0008】
Langeらによる米国特許第6,236,958号は、2ヶ国語の用語の自動生成を可能にする用語抽出システムを開示している。当該システムは、少なくとも1つのターゲットタームシーケンスを有するターゲットテキストと並置された少なくとも1つのソースタームシーケンスを有するソーステキストを有する。ターム抽出器は、ネットワークの各ノードが少なくとも1つのタームを有し、ソースタームの各組み合わせが1つのソースノード内に含まれ、ターゲットタームの各組み合わせが1つのターゲットノード内に含まれるようなネットワークを各ソース及びターゲットシーケンスから構成する。ターム抽出器は、各ソースノードと各ターゲットノードをリンクさせ、フロー最適化方法により、結果として得られるネットワークの該当するリンクを選択する。ターム抽出器が並置されたシーケンス全体に対して実行されると、ターム統計回路がリンクしたソース/ターゲットタームの各ペアに対する関連性スコアを計算し、最終的に、該当する2ヶ国語タームとみなされるリンクしたソース/ターゲットタームの採点されたペアが2ヶ国語用語データベースに格納される。上記プロセス全体は、2ヶ国語リンクを強化させるため、繰り返すことができる。Langeの特許は、統計抽出及びファジー論理を用いた言語変換機構を教示するものでもなく、またユーザのマウスポインタと同的に関連するコールアウトにより2ヶ国語注釈を即座に表示する機構でもない。
【0009】
従って、ユーザがコンピュータ画面上の電子文書を読んでいる最中に、ユーザのマウスに隣接あるいは重なり合うテキストの一部に含まれるユーザのマウスポインタに関連するコールアウトに表示されるテキスト情報に関する人工知能に基づく2ヶ国語注釈をコンピュータユーザに自動提供するシステム及び方法を提供することが望ましい。
【0010】
さらに、ユーザがウェブサーバによりサポートされているウェブサイトを閲覧している最中に、ユーザのマウスに隣接あるいは重なり合うテキストの一部に含まれるユーザのマウスポインタに関連するコールアウトに表示されるテキスト情報に関する人工知能に基づく2ヶ国語注釈をウェブサーバからリモートオンラインユーザに自動的に返すシステム及び方法を提供することが望ましい。
【0011】
さらに、ユーザがウェブサーバによりサポートされているウェブサイトを閲覧している最中に、ユーザのマウスに隣接あるいは重なり合うテキストの一部に含まれるユーザのマウスポインタに関連するコールアウトに表示されるテキスト情報に関する人工知能に基づく2ヶ国語注釈を第三者の中央翻訳サーバからリモートオンラインユーザに自動的に返す加入ベースシステム及び方法を提供することが望ましい。
【特許文献1】米国特許第6,604,101号
【特許文献2】米国特許第6,236,958号
【発明の開示】
【発明が解決しようとする課題】
【0012】
本発明は、上述した従来技術の問題点に鑑み、ユーザがコンピュータ画面上の電子文書を閲覧しながら、ユーザのマウスポインタに隣接または重なっているテキストの一部に含まれるフレーズ、キーワードやセンテンスなどのテキスト情報に関するコールアウトやバブルに表示される人工知能に基づく2ヶ国語注釈を、ローカルコンピュータやウェブサーバからユーザに自動的に返す効果的なシステム及び方法を提供することである。
【課題を解決するための手段】
【0013】
本発明の好適な一実施例では、コンピュータ画面上に表示される電子文書を読んでいるユーザが、テキスト情報を含むテキストの一部の上でマウスポインタを移動させ、あるいは指定しながら、ユーザのマウスポインタに関連付けされたコールアウトに含まれるテキスト情報に関する2ヶ国語注釈メッセージをコンピュータユーザに瞬時に提供するシステム及び方法が開示される。本実施例は、ユーザのコンピュータ上で実行され、以下のステップ、すなわち、
ユーザのマウスポインタに隣接または重なり合う第1言語(オブジェクト言語)によるテキストの一部を画面抽出するステップと、
前記画面抽出したテキストの一部をクエリに変換するステップと、
前記クエリとその翻訳(及び他の読解支援情報)をユーザのマウスポインタに近接して関連付けされたコールアウトまたは仮想バブルに表示するステップと、
を実行するよう動作するソフトウェアアプリケーションに関する。
【0014】
本発明の他の好適な実施例では、コンピュータ画面上に表示される電子文書を読んでいるユーザが、テキスト情報を含むテキストの一部の上でマウスポインタを移動させ、あるいは指定しながら、ユーザのマウスポインタに関連付けされたコールアウトに含まれるテキスト情報に関する2ヶ国語注釈メッセージをバックエンドサーバからウェブユーザに瞬時に返すシステム及び方法が開示される。本実施例は、ウェブサイトのバックエンドサーバ上で実行され、以下のステップ、すなわち、
ユーザのマウスポインタに隣接または重なり合うオブジェクト言語によるウェブページに含まれるテキストの一部を画面抽出するステップと、
前記画面抽出したテキストの一部をウェブページを運営するバックエンドサーバに送信するステップと、
前記画面抽出したテキストの一部をクエリに変換するステップと、
前記クエリをサブジェクト言語に翻訳するステップと、
前記クエリとその翻訳(及び他の読解支援情報)をユーザのマウスポインタに近接して関連付けされたコールアウトに表示するのに必要とされるデータをユーザのコンピュータに返すステップと、
前記サーバから送信された信号に従って前記コールアウトを表示するステップと、
を実行するよう動作するソフトウェアアプリケーションに関する。
【0015】
本発明のさらなる他の好適な実施例では、コンピュータ画面上に表示される電子文書を読んでいるユーザが、テキスト情報を含むテキストの一部の上でマウスポインタを移動させ、あるいは指定しながら、ユーザのマウスポインタに関連付けされたコールアウトに含まれるテキスト情報に関する2ヶ国語注釈メッセージを第三者サーバからウェブユーザに瞬時に返すシステム及び方法が開示される。本実施例は、第三者サーバ上で実行され、以下のステップ、すなわち、
ユーザのマウスポインタに隣接または重なり合うオブジェクト言語によるウェブページまたは他の電子文書に含まれるテキストの一部を画面抽出するステップと、
前記画面抽出したテキストの一部を2ヶ国語注釈サービスを提供する第三者サーバに送信するステップと、
前記画面抽出したテキストの一部をクエリに変換するステップと、
前記クエリをサブジェクト言語に翻訳するステップと、
前記クエリとその翻訳(及び他の読解支援情報)をユーザのマウスポインタに近接して関連付けされたコールアウトに表示するのに必要とされるデータをユーザのコンピュータに返すステップと、
前記サーバから送信された信号に従って前記コールアウトを表示するステップと、
を実行するよう動作するソフトウェアアプリケーションに関する。
【発明の効果】
【0016】
本発明によると、ユーザがコンピュータ画面上の電子文書を閲覧しながら、ユーザのマウスポインタに隣接または重なっているテキストの一部に含まれるフレーズ、キーワードやセンテンスなどのテキスト情報に関するコールアウトやバブルに表示される人工知能に基づく2ヶ国語注釈を、ローカルコンピュータやウェブサーバからユーザに自動的に返す効果的なシステム及び方法を提供することが可能となる。
【発明を実施するための最良の形態】
【0017】
上記説明は、本発明の関連する重要な特徴を概要したものである。以下において、本発明の技術的効果が十分に理解されるように、本発明の詳細な説明が提供される。
【0018】
図面を参照しながら、本発明がベストモード及び好適実施例に関して詳細に説明される。それの最も一般的形態では、本発明は、ユーザのマウスポインタと関連するコールアウトに表示される2ヶ国語注釈メッセージをユーザに提供するのに必要な各ステップを実行するため、コンピュータが実行可能な命令プログラムを有形に実現するコンピュータにより可読なプログラム記憶媒体から構成される。
【0019】
図1Aは、一好適実施例による多言語LACE(Linguistic Annotation Calibration Engine)100を示す概略的なブロック図である。多言語LACE100は、1以上のCPU(Central Processing Unit)101と、RAM(Random Access Memory)102と、入出力(I/O)インタフェース103と、オペレーティングシステム(OS)104と、任意的なMC(Microinstruction Code)105とから構成されるコンピュータプラットフォーム110上で動作する。多言語LACE100は、OS104を介し実行されるアプリケーションプログラムまたはMC105の一部であってもよい。当業者は、多言語LACE100が実質的な変更を伴わない他のシステム内で実現されてもよいということを容易に理解するであろう。
【0020】
しばしばオブジェクト言語と呼ばれる第1言語により電子文書をコンピュータ画面109上で閲覧しているユーザは、任意の時点で多言語LACEを起動するかもしれない。電子文書は、Microsoft Word、Microsoft Excel、Microsoft PowerPoint、PDF、JPEGなどの任意のフォーマットが可能である。多言語LACEが起動すると、ユーザは、しばしばサブジェクト言語と呼ばれる第2言語を、各々が選択肢を表すいくつかのアイコンやドロップダウンリストを有するGUI(Graphical User Interface)要素とすることが可能な言語設定117からの注釈に利用されるよう設定することができる。本出願に関して、「サブジェクト言語」とは、ターゲットまたはオブジェクト文書に含まれる情報に注釈を付けるため、ユーザが使用することを所望するターゲットまたはオブジェクト文書で用いられる言語以外の言語を意味する。他方、「オブジェクト言語」とは、ユーザが読んだり、閲覧したりしている文書に用いられるサブジェクト言語以外の言語を意味する。図1Aに示されるような例では、ユーザは、サブジェクト言語として簡単な中国語を選択している。コールアウト設定118から、ユーザは、2ヶ国語注釈を表示するのに利用されるバブルとしばしば呼ばれるコールアウトの構成及びスタイル設定を行うパラメータを設定してもよい。上記パラメータには、以下に限定するものではないが、スタイル、形状、フォントスタイル及びサイズ、背景カラーなどが含まれる。言語設定117と類似したコールアウト設定118は、各々が選択肢を表すいくつかのアイコンまたはドロップダウンリストを有するGUI要素とすることができる。1つの配置では、言語設定117とコールアウト設定118は、1つのGUI108に含まれる。他の配置では、言語設定117とコールアウト設定118は、例えば、これらの設定が通常は隠されているが、ユーザがコールアウトを右クリックすることによりアクセスできるような便利な方法により表示されたコールアウトに結合される。ユーザがこれらの設定を変更する前には、それらはデフォルト状態か、あるいはユーザが最後にアプリケーションを利用した状態に設定されている。
【0021】
本発明で用いられるコールアウトまたはバブルは、コンピュータ画面上に重なり合う動的に生成された視覚的な合図である。スタイル、形状、フォントスタイル及びサイズと共に背景カラーは、ユーザにより予め設定可能であるが、それに表示されるコンテンツは、変換モジュール113と翻訳モジュール114の出力に基づき、表示モジュール116により決定される。2ヶ国語モードでは、表示モジュール116により与えられるコールアウトコンテンツは、2ヶ国語である。ユーザが言語設定117から同時に2つの言語を選択した場合、表示コンテンツは3ヶ国語になる。ユーザが言語設定117から同時に複数の言語を選び、オブジェクト言語によるクエリの多言語注釈を取得することが可能である。コールアウトまたはバブルは固定サイズとすることができるが、好ましくは、表示されるコンテンツに従って適応可能とされる。ここでの「適応可能」とは、表示されるコンテンツに適合するよう自動調整されるエラスティック、フレキシブル、スケーラブルであることを意味する。例えば、クエリとその翻訳(及び/または他の読解支援情報)が極めて短いとき、コールアウトやバブルも比較的小さいものとなり、そうでない場合には、比較的大きなものとなりうる。
【0022】
ユーザがコンピュータ画面上に表示される電子文書上でマウスポインタを動かすとき、マウスポインタは、画面抽出(screen−scraping)機能112を起動する。通常はポインタと呼ばれるマウスポインタは、典型的にはマウスなどのポインティング装置の動きに応答して、コンピュータ画面上を移動するオペレーティングシステム(OS)104により提供される小さな矢印などの小さなビットマップである。マウスポインタが移動すると、モーションイベントが生成され、ユーザフィードバックが与えられる。マウスポインタはまた、ときにはドラッグアクションと共にマウスボタンがクリックされるとき、画面上のどのオブジェクトが選択されるかユーザに示す。本発明の好適実施例では、マウスポインタは、それがテキストの1つの行またはその行のポイントを移動するとき、テキストの一部が自動的に選択されるように設定される。言い換えると、ユーザはクリックやドラッグアクションを行う必要がない。にもかかわらず、ユーザは常に手動による選択を行うことができる。
【0023】
図1Aを参照するに、ユーザが「...the book titled Living History written by Hillary Rodham Clinton...」を含むテキストの1つの行にマウスポインタ111を移動させると、多言語LACEアプリケーションは、この行からテキストの一部を画面抽出する。画面抽出されたテキストの一部の長さは、ユーザ要求に従って設定することができる。図1Aの例において、「Living History written by」が画面抽出され、変換モジュール113への入力として送られると仮定する。変換モジュール113は、入力をいくつかの所定の論理、言語及び文法規則に従って、フレーズ、キーワードあるいはセンテンスなどの変換されたクエリに標準化する。画面抽出されたテキストの一部の長さは、エラスティック、フレキシブル、スケーラブルあるいは自動調整可能であることを意味する適応的となるよう設定することが可能である。この場合、ユーザの選好と変換に用いられる論理、言語及び文法規則が、部分長さ設定に適用され、画面抽出されたテキストは、それがすでに変換済みであるという理由から、翻訳モジュール114のためのクエリとして直接使用することができる。何れの場合でも、変換処理は人工知能(AI)に基づき、変換されたクエリは、言語専門家による選択と極めて類似したものとなる。
【0024】
翻訳モジュール114は、変換されたクエリを入力とし、いくつかの所定の論理、言語及び文法規則に従う多言語データベース115を検索することによりAIベースの翻訳を実行する。データベース115と翻訳規則は機械翻訳の分野における最新の成果を反映し、経時的に更新することができるため、翻訳モジュールによる翻訳はプロの翻訳者による翻訳と大変近いものとなるはずである。
【0025】
表示モジュール116は、多機能ユニットである。表示モジュール116は、コールアウト設定118から行われたユーザのコールアウト設定選好を受付ける。表示モジュール116はまた、ユーザ選好に従ってコールアウトのサイズと、変換モジュール113からのオブジェクト言語による変換クエリ及び翻訳モジュール114からのクエリの翻訳を含む2ヶ国語注釈の文字列の長さを計算する。表示モジュール116は、コールアウトで当該クエリとそれの翻訳(及び/または他の読解支援情報)を「ラップ(wrap)」する。表示モジュール116は、マウスポインタの位置、コールアウトのサイズ及び他のパラメータに従ってコールアウトの位置を確定する。その後、表示モジュール116は、当該データとメタデータをユーザに2ヶ国語注釈コールアウト119を表示するコンピュータ画面に送信する。
【0026】
図1Bは、図1Aによる多言語LACEのためのプロセスをさらに示すブロック図である。本プロセスは以下のステップからなる。
【0027】
ステップ121:LACEの起動(LACEは、ユーザがサブジェクト言語を選択すると、自動的に起動することができる。)
ステップ122:ユーザの選択またはデフォルト選択に従うオブジェクト言語によるテキスト情報に注釈を付けるために使用されるサブジェクト言語の設定
ステップ123:マウスポインタがテキストの一部を含むテキストの1つの行またはその中のポイントを移動するとき自動的に選択されるテキストの一部の画面抽出
ステップ124:画面抽出されたテキストの翻訳用のクエリへの変換
ステップ125:当該クエリのサブジェクト言語への翻訳
ステップ126:クエリ及びそれの翻訳(及び/または他の読解支援情報)に適合するコールアウトの生成及びコールアウトへのラップ
ステップ127:マウスポインタ位置、コールアウトサイズ、2ヶ国語注釈の文字列の長さ(すなわち、クエリ、それの翻訳及び/または他の読解支援情報)などの各種パラメータと、ユーザにより予め設定された選好あるいはデフォルト選好とにより決定された位置におけるコールアウトの表示
ステップ128は、任意の時点にユーザにより実行される。
【0028】
図1A及び1Bを参照して上述された多言語LACEは、好ましくは、公衆に配布されるソフトウェアプログラムとして構成される。それはまた、好ましくは、ユーザ画面上に表示される任意の電子文書を画面抽出することができるよう構成される。例えば、ユーザは、WORD文書、PDF文書あるいはインターネット上のHTML文書に対して多言語LACEを実行することができる。
【0029】
多言語LACEはまた、WORDやEXCELなどの任意の文書作成ソフトウェアに内蔵することが可能である。この場合、ユーザは、メインプログラムの全体メニューから注釈機能を単に起動または終了させるだけでよい。
【0030】
PDA、携帯電話や双方向ページャなどの簡易装置には、簡易式の多言語LACEプログラムを埋め込むことが有用である。
【0031】
他の好適な実施例では、本発明は、ウェブサイトに含まれるテキスト情報に関するマウスポインタに関連するコールアウトに表示される2ヶ国語注釈をリモートオンラインユーザに動的に返すシステム及び方法を提供する。図2Aに概略的に示されるように、本システムは、インターネット212上のウェブサイト211をサポートするウェブサーバを有する。リモートエンドユーザ213は、ユーザのコンピュータのブラウザを用いることにより、インターネット212にログオンし、ウェブサイト211などのウェブサイトに訪問する。ウェブサイトは、英語などのオブジェクト言語により記述されている。多言語LACE214は、ウェブサイトから起動することが可能であるが、ウェブサイトサーバ210上で実行される。多言語LACE214を起動すると、ユーザは、所望のテキストにマウスポインタを移動させるか、あるいはポインタをこのテキストにポインタ指定することにより、ウェブサイトのテキスト情報に関する2ヶ国語注釈を取得することができる。例えば、ユーザが「Products」にポインタを移動させると、ポップアップコールアウト215が画面上に現れる。当該コールアウトは、このコールアウトとターゲットテキストとの間の視覚参照が確立されるようにポインタと関連付けされる。例えば、図2Aの注釈コールアウト215のテール(tail)はテキスト「Product」を指し示している。
【0032】
図2Bは、ユーザとサーバの両サイドにおける処理ステップを示すブロック図である。URLを入力することにより、あるいはハイパーリンクをクリックすることにより、ユーザは、ウェブサーバにより運営されるウェブサイトにアクセスする(ステップ221)。このウェブサイトは、英語などのオブジェクト言語で記述されている。ユーザがウェブサイトのいくつかのワード、フレーズあるいはセンテンスなどの2ヶ国語注釈を所望する場合、ユーザは多言語LACEを起動する必要があり(ステップ222)、リストから中国語などのサブジェクト言語を選択する(ステップ223)。サブジェクト言語が選択されるとすぐに、画面抽出手段がユーザのマウスポインタと関連付けされる。アルゴリズムにより表されるいくつかの所定の規則に従って、多言語LACEアプリケーションの一部である画面抽出装置が、ポインタに空間的に近接した領域に属するテキストの一部を取得し、抽出したテキストの一部をHTTPを介しウェブサーバに送信する(ステップ224)。抽出したテキストの一部をクエリに標準化することにより(ステップ225)、サーバ側の多言語LACEが強力な多言語データベースを検索することにより当該クエリを翻訳する(ステップ226)。その後、ウェブサーバは、クエリとそれの翻訳(及び/または他の読解支援情報)を含む要求された2ヶ国語注釈を、注釈のコールアウトを規定するのに必要なメタデータと共にユーザのコンピュータに返す(ステップ227)。ユーザのコンピュータは、サーバから送信された信号に従って画面上の返されたデータを表示する(ステップ228)。
【0033】
図2A及び2Bに示される実施例に従う多言語LACEは、バックエンドサーバ上で主として動作するクロスプラットフォームアプリケーションである。このアプリケーションは、ウェブサイトの各ページに埋め込まれたグラフィカルユーザインタフェース(GUI)として実現される起動手段を有する。ユーザがウェブサイトにアクセスすると、ユーザは任意のページから多言語LACEの起動または終了を行うことができる。1つの配置では、ユーザは、起動ボタンをクリックすることにより、アプリケーションを起動または終了する。他の配置では、ユーザは、ドロップダウンメニューから選択することにより、アプリケーションを起動または終了する。さらなる他の配置では、ユーザがウェブサイトから離れると、自動的にアプリケーションが終了される。上記起動及び終了方法は、それがユーザにとって有用である限り、いくつかの方法により合成することができる。
【0034】
当該アプリケーションはまた、選択肢のリストから1以上のサブジェクト言語を選択する選択手段を有する。起動手段と同様に、選択手段は、ドロップダウンメニュー、いくつかのアイコンボタン(各ボタンは言語を表す)あるいはGUIまたはウェブページに含まれる他の任意の要素として配置することができる。
【0035】
上述の起動手段と選択手段はまた、いくつかの方法により搭載可能である。例えば、ユーザが選択肢のリストからある言語を選択すると、多言語LACEが自動的に起動される。アプリケーションを終了させるため、ユーザは、アイコンをクリックするなどにより、リストから「LACEの終了」を選択するようにしてもよい。
【0036】
図2Cは、注釈で使用される1以上のサブジェクト言語を選択するための一例となるドロップダウンメニューを示す概略図である。図2Dは、各々がサブジェクト言語を表すいくつかの仮想ボタンを示す概略図である。一例として、オリジナルのサイト言語、すなわち、オブジェクト言語が英語であり、サブジェクト言語として英語が選択されたと仮定すると、ユーザがウェブサイトのフレーズまたはセンテンス上に、あるいはそれらのポイントにポインタを移動させると、ポインタに関連するコールアウトまたはバブルが瞬時に現れる。コールアウトやバブルは、英語のフレーズまたはセンテンスとそれの中国語の翻訳を含む。
【0037】
コールアウトやバブルは、任意の形状、カラー背景及びサイズにより構成することが可能である。さらに、ユーザは、ワープロアプリケーションやメッセージングアプリケーションの大多数に設けられているフォント設定と同様に、コールアウトまたはバブルに使用されるフォントスタイル及びサイズを設定することができる。図2Eは、「Time New Roman」フォントが使用されている丸め矩形状の注釈コールアウトを示している。図2Fは、「Courier New」フォントが使用されている雲状の注釈コールアウトを示している。
【0038】
コールアウトとバブルの相違は、前者がボディーとテールを有し、後者はボディーのみ有するという点である。テールは、注釈コールアウトと注釈が付けられたテキスト情報との参照コネクタとしてしばしば使用されるため有用である。コールアウトは、好ましくは本発明の様々な実施例において使用されるが、正方形、矩形、円、バブル、「カイト(kite)」や「ハロ(halo)」などの他のタイプの視覚的合図が、返された注釈メッセージを表示するのに使用される場合、コールアウトは本発明の本質及び範囲から逸脱するものでない。
【0039】
一例として、コールアウトは、固定サイズとして構成することも可能である。この場合、コールアウトには限定された個数の文字が表示可能である。ポインタが移動するとき、移動ウィンドウなどのコールアウトは、ポインタに空間的に近接するワードに関する2ヶ国語注釈のみを示す。ポインタからより離れたワードに関する注釈は、コールアウトから自動的に消える。
【0040】
他の例として、ユーザは、センテンス単位の翻訳スキームを設定することができる。この場合、ポインタがセンテンスを移動するとき、センテンスの翻訳がバブルに表示される。一部のセンテンスは長く、一部のセンテンスは極めて短いため、フレキシブルなバブルが最も適している。
【0041】
多言語LACEアプリケーションは、例えば、ポインタに最も近接したラインのテキストのみが抽出され、ポインタの左(または右)側1インチの部分が抽出され、ポインタの左右に1インチの部分のみが抽出され、あるいは全体が抽出されるなど、いくつかの所定の規則に従って画面からテキストを抽出する。
【0042】
図1Aによる本発明の好適な実施例をさらに示す概略ブロック図である図2Gが参照される。ユーザが画面のテキスト「Port of Oakland」にマウスポインタ241を指示すると、多言語LACEアプリケーションの一部である画面抽出装置242は、画面抽出処理を実行する。画面抽出されたテキストの一部は、構成モジュール243、多言語データベース245に接続された翻訳モジュール244及びコールアウト生成モジュール246を有するサーバ240にHTTPを介し送信される。変換モジュール243は、画面抽出されたテキストの一部を標準化されたクエリに変換するため、いくつかの論理、言語及び文法処理を実行する。翻訳モジュール244は、強力な多言語データベース245を検索し、関連する言語及び文法計算を実行することにより、クエリをウェブサイト250において利用可能な言語選択インタフェース247からユーザにより選択されたサブジェクト言語による表現に翻訳する。ユーザの選好及び関連計算に基づき、コールアウト生成モジュール246は、オブジェクト言語によるクエリと1以上のサブジェクト言語によるクエリの翻訳を含む注釈を表示するのに必要なコールアウトのサイズ、スタイル、形状、フォントタイプ及びフォントサイズを決定する。好ましくは、2ヶ国語表現が必要とされる。コールアウト249に対するスタイル、フォント及び背景カラーなどは、ウェブサイト250において利用可能なコールアウト設定インタフェース248を利用して、ユーザにより設定することが可能である。
【0043】
変換モジュール243は、言語地理的ワード検索、自発的確信の収集、語彙拡散、統計抽出、ファジー論理、構文解析、複雑センテンスの分解など各種機能を実行するようにしてもよい。構成モジュール243により用いられる論理、言語及び文法規則は、以下に限定されるものではないが、画面抽出されたテキストにおける2つの近隣するピリオド(「.」)の間のテキスト、1つのピリオド(「.」)と1つのイクスクラメーションマーク(「!」)との間のテキスト、1つのピリオド(「.」)とクエスチョンマーク(「?」)との間のテキストを抽出することにより完全なセンテンスを特定し、完全なセンテンスが特定されない場合、代名詞や接続詞などを無視することにより、キーフレーズを特定するなどである。
【0044】
コールアウト生成モジュール246は、コールアウト249のサイズを決定するだけでなく、マウスポインタ241に対するコールアウトの位置を決定する。図2Hに示されるように、マウスポインタがページの右端に近接しているとき、ページ内にコールアウトを維持するため、コールアウトはポインタの左側に置かれる。同様に、マウスポインタがページの左端に近接するとき、マウスポインタはそれの右に置かれる。マウスポインタがページの上端に近接するとき、コールアウトは、マウスポインタより高い位置には置かれない。ポインタがページの底部に近接するとき、コールアウトは、マウスポインタより下には置かれない。
【0045】
ここで、翻訳モジュール244は、選択された言語に特有な所定の論理、言語及び文法規則に基づき翻訳を実行する。これらの規則がより精緻化されるほど、翻訳はより正確なものとなる。さらに、翻訳モジュール244は人工知能(AI)に基づく。例えば、結合特性(valence feature)、連語確率、統計抽出及びファジー論理により強化される。
【0046】
図2A〜2Hを参照することにより上述された多言語LACEは、好ましくは、ウェブサイトサーバにより運営されるウェブサイトに特有のソフトウェアアプリケーションとして配置される。多言語LACEはまた、好ましくは、ウェブサイト上の情報を画面抽出することが可能となるよう構成される。言い換えると、ユーザは、1つのサイトから多言語LACEを起動し、それを当該ウェブサイトから提供されたもの以外の文書に利用することはできない。そうでない場合、システムはフリーキャリアとなってしまうであろう。
【0047】
図3Aに示されるような本発明のさらなる他の好適な実施例では、IM_LACEと呼ばれるInstant MultilingualLACEサービスが、独立したIMシステムあるいはNetMeeting、MSN Messenger、Yahoo! Messenger、AIMなどの既存のIMシステムに搭載されるIM(Instant Messaging)フレームワークを用いた中央翻訳サーバ310から提供される。ユーザと中央翻訳サーバ310との間のデータ交換は、SOAP/XML/HTTPなどのウェブサービスインタフェース及び関連するプロトコルによってサポートされている。
【0048】
好ましくは、IM_LACEサービスは、加入に基づくものである。ユーザ312や317などの各ユーザは、IM_LACEクライアントアプリケーションの登録及びダウンロードによりサービスを購入する。クライアントアプリケーションがダウンロードされると、ユーザは当該サービスにログインし、それを任意の電子文書に対してオンラインに利用することができる。クライアントアプリケーションがダウンロードされると、変換及びコールアウト生成タスクを実行するが、通常大規模データベースを要する翻訳を中央サーバ310に任せるよう構成することができる。図3Aでは、ユーザ316は、IMセッション317においてIM_LACEサービスを利用している。同様に、IMセッション315のユーザ312は、インターネット318上のqNサイトサーバ311によりサポートされるウェブサイトを閲覧するためIM_LACEサービスを利用している。
【0049】
図3Bは、図3Aの実施例によるプロセスを示すブロック図である。本プロセスは、以下の各ステップを有する。
【0050】
ステップ321:IM_LACEシステムへのログオン(起動)
ステップ322:ユーザのマウスポインタに隣接または重なり合うオブジェクト言語によるウェブページまたは他の電子文書に含まれるテキストの一部の画面抽出
ステップ323:画面抽出されたテキストの一部のクエリへの変換
ステップ324:クエリの中央翻訳サーバへの送信
ステップ325:ユーザのローカルコンピュータのIM_LACEクライアントアプリケーションへの翻訳の返送
ステップ326:ユーザのマウスポインタに最も近接したコールアウトでのクエリ及びそれの翻訳(及び/または他の読解支援情報)の表示
上記本発明は様々な効果を有する。第1に、図2Gの変換モジュール243などのAIベースモジュールを利用した画面抽出されたテキストを変換することにより、よりコンテンツに関連した注釈が利用可能となる。
【0051】
第2に、翻訳モジュールもAIに基づく。高機能AI翻訳技術を採用することにより、翻訳は専門家による翻訳に近いものとなる。
【0052】
第3に、コールアウトまたはバブルの表示はユーザのマウスポインタに関連し、表示された2ヶ国語注釈はマウスポインタに空間的に近接したテキスト情報部分に関するものであるため、注釈は動的なものとなる。
【0053】
第4に、ユーザはコールアウトあるいはバブルのスタイル、フォント、背景などを容易に設定することができるため、システムはユーザフレンドリなものとなる。
【0054】
第5に、シンプルな装置として、異なる言語によりサイトを作成するコストを負担することなく、主要な情報の瞬時の文脈に適した翻訳を外国人に提供することによって、LACEは、メインとなるサイトの完全性及び中心性の維持に資する。外国人は、起動を所望するサブジェクト言語を単に選択しさえすればよい。
【0055】
本発明は好適な実施例を参照して説明されたが、当業者は、他のアプリケーションが本発明の趣旨及び範囲を逸脱することなくここで開示されたものに置換されるということを容易に理解するであろう。
【0056】
従って、本発明は、以下に含まれる請求項によってのみ限定されるべきである。
【図面の簡単な説明】
【0057】
【図1A】図1Aは、本発明の好適な実施例による計算装置上で任意のウェブサーバから独立に実行される多言語LACE(Linguistic Annotation Calibration Engine)を示す概略的なブロック図である。
【図1B】図1Bは、図1AによるLACEのためのプロセスをさらに示すフロー図である。
【図2A】図2Aは、本発明の他の好適な実施例によるウェブサイトのバックエンドサーバ上で実行される多言語LACEを有するシステムを示す概略図である。
【図2B】図2Bは、図2Aによるユーザ側とバックエンドサーバ側の両方における動作ステップを示すブロック図である。
【図2C】図2Cは、注釈で使用されるサブジェクト言語を選択するための一例となるドロップダウンメニューを示す概略図である。
【図2D】図2Dは、各々がサブジェクト言語を表すいくつかの仮想ボタンを示す概略図である。
【図2E】図2Eは、丸め矩形注釈コールアウトを示す概略図である。
【図2F】図2Fは、雲状注釈コールアウトを示す概略図である。
【図2G】図2Gは、図2Aによる本発明の好適な実施例をさらに示す概略的なブロック図である。
【図2H】図2Hは、本発明の一実施例を適用した概略図である。
【図3A】図3Aは、本発明の他の好適な実施例による購入ベースのIM_LACEサービスを提供する中央翻訳サーバ上で実行されるIM_LACE(Instant Multilingual Linguistic Annotation Calibration Engine)を有するシステムを示す概略的なブロック図である。
【図3B】図3Bは、図3Aに示される好適な実施例による中央IM_LACEサービスを提供するためのプロセスを示すフロー図である。
【符号の説明】
【0058】
100 多言語LACEシステム
101 CPU
102 RAM
103 入出力インタフェース
104 オペレーティングシステム
113、243 変換モジュール
114、244 翻訳モジュール
115、245 多言語DB
116 表示モジュール

【特許請求の範囲】
【請求項1】
ユーザ画面に表示される電子文書に含まれる第1言語によるテキスト情報に関する2ヶ国語注釈をユーザに提供するシステムであって、
前記ユーザのポインタに隣接または重なり合うテキストの一部を画面抽出し、
前記画面抽出したテキストの一部を1以上の論理、言語及び/または文法規則に従ってクエリに変換し、
データベースを検索し、論理、言語及び/または文法規則を適用することにより、前記クエリを第2言語に翻訳し、
前記ユーザ画面上に前記クエリ、前記クエリの翻訳及び/または他の読解支援情報を含む視覚的合図を表示する、
よう構成されるプロセッサを有することを特徴とするシステム。
【請求項2】
ユーザ画面に表示される電子文書に含まれる第1言語によるテキスト情報に関する2ヶ国語注釈をユーザに提供する方法であって、
前記ユーザのポインタに隣接または重なり合うテキストの一部を画面抽出するステップと、
前記画面抽出したテキストの一部を1以上の規則に従ってクエリに変換するステップと、
データベースを検索し、論理、言語及び/または文法規則を適用することにより、前記クエリを第2言語に翻訳するステップと、
前記ユーザ画面上に前記クエリ、前記クエリの翻訳及び/または他の読解支援情報を含む注釈コールアウトを表示するステップと、
から構成されることを特徴とする方法。
【請求項3】
ウェブサーバによってサポートされるウェブサイトに含まれる第1言語によるテキスト情報に関する2ヶ国語注釈を前記ウェブサーバからリモートユーザに返すシステムであって、
該システムは、
前記ユーザのポインタに隣接または重なり合うテキストの一部を画面抽出し、
前記画面抽出したテキストの一部をクエリに変換し、
前記クエリを第2言語に翻訳し、
前記ユーザ画面上の視覚的合図に前記クエリ、前記クエリの翻訳及び/または他の読解支援情報を表示するよう信号を送信する、
よう動作するアプリケーションを有することを特徴とするシステム。
【請求項4】
ウェブサーバによってサポートされるウェブサイトに含まれる第1言語によるテキスト情報に関する2ヶ国語注釈を前記ウェブサーバからリモートユーザに返す方法であって、
前記ユーザのポインタに隣接または重なり合うテキストの一部を画面抽出するステップと、
前記画面抽出したテキストの一部を前記ウェブサーバに送信するステップと、
前記画面抽出したテキストの一部を1以上の規則に従ってクエリに変換するステップと、
データベースを検索し、論理、言語及び/または文法規則を適用することにより、前記クエリを第2言語に翻訳するステップと、
前記クエリを前記クエリの翻訳と共に前記ユーザのコンピュータに返すステップと、
前記ユーザ画面上に前記クエリ、前記クエリの翻訳及び/または他の読解支援情報を含むコールアウトを表示するよう信号を送信するステップと、
から構成されることを特徴とする方法。
【請求項5】
サーバからユーザにグローバルネットワークを介しリアルタイム多言語注釈サービスを提供するシステムであって、
(a)前記ユーザのコンピュータ上で実行され、前記ユーザのポインタに隣接または重なり合う第1言語によるテキストの一部を画面抽出し、前記画面抽出したテキストの一部をクエリに変換し、前記クエリを前記サーバに送信し、前記クエリと前記サーバから返されたクエリの翻訳を含む注釈コールアウトを表示するよう動作可能なクライアントアプリケーションと、
(b)前記サーバ上で実行され、データベースを検索し、論理、言語及び文法規則を適用することにより、前記クエリを第2言語に翻訳し、前記クエリの翻訳を前記クライアントアプリケーションに返すよう動作可能なサーバアプリケーションと、
から構成されることを特徴とするシステム。
【請求項6】
サーバからユーザにグローバルネットワークを介しリアルタイム多言語注釈サービスを提供する方法であって、
前記ユーザのポインタに隣接または重なり合う第1言語によるテキストの一部を画面抽出するステップと、
前記画面抽出したテキストの一部をクエリに変換するステップと、
データベースを検索し、論理、言語及び文法規則を適用することにより、前記サーバにおいて前記クエリを第2言語に翻訳するステップと、
前記クエリの翻訳を前記ユーザのコンピュータに返すステップと、
前記サーバから返された前記クエリ、前記クエリの翻訳及び/または他の読解支援情報を含む注釈コールアウトを表示するステップと、
から構成されることを特徴とする方法。
【請求項7】
ネットワークを介しクライアントに通信可能に接続されるサーバに格納される電子文書に含まれる第1言語によるテキスト情報に関する注釈を提供するシステムであって、
前記テキスト情報を特定するデータを前記クライアントから受信し、
前記特定されたテキスト情報を1以上の論理、言語及び/または文法規則に従ってクエリに変換し、
データベースを検索し、論理、言語及び文法規則を適用することにより、前記クエリを第2言語に翻訳し、
前記クエリの翻訳を前記クライアントに転送する、
よう構成されたプロセッサを有することを特徴とするシステム。
【請求項8】
ユーザ画面に表示される電子文書に含まれる第1言語によるテキスト情報に関する2ヶ国語注釈をユーザに提供する方法であって、
前記テキスト情報を特定するデータを受信するステップと、
前記テキスト情報をクエリに変換するステップと、
前記クエリを第2言語に翻訳するステップと、
前記翻訳されたクエリを前記ユーザに転送するステップと、
から構成されることを特徴とする方法。

【図1A】
image rotate

【図1B】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図2C】
image rotate

【図2D】
image rotate

【図2E】
image rotate

【図2F】
image rotate

【図2G】
image rotate

【図2H】
image rotate

【図3A】
image rotate

【図3B】
image rotate


【公開番号】特開2008−152798(P2008−152798A)
【公開日】平成20年7月3日(2008.7.3)
【国際特許分類】
【出願番号】特願2008−13992(P2008−13992)
【出願日】平成20年1月24日(2008.1.24)
【分割の表示】特願2004−551479(P2004−551479)の分割
【原出願日】平成15年9月27日(2003.9.27)
【出願人】(505114798)
【Fターム(参考)】