説明

テキスト入力装置、それを含む翻訳装置、テキスト入力方法及びコンピュータプログラム

【課題】扱いが容易で信頼姓の高い翻訳が可能な装置の
提供。
【解決手段】タッチパネルディスプレイを備えた翻訳装置は、アイコン118を表示するためのアイコン表示ユニットを含む。アイコンを選択することにより、アイコンのシーケンスが入力され、アイコンシーケンスフィールド120に表示される。ユーザがソース生成ボタン126を押すと、アイコンのシーケンスに対応する単語のシーケンスから完全型のソース文が推定される。もしソース文が満足のいくものであれば、翻訳ボタン124を選択することでソース文がターゲット文に翻訳され、これが翻訳文フィールド130に表示される。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は自然言語処理に関し、特に、ピクチャー又はアイコンベースのテキスト処理装置と、それを含む機械翻訳とに関する。
【背景技術】
【0002】
最近は機械翻訳(Machine Translation:MT)サービスに対する需要が大いに増しているが、これは、多くの言語の組合せにおいて実用的レベルまで翻訳の品質が改良されてきたからである。機械翻訳のアプリケーションに共通のプラットフォームの1つとして、必要な時にどこでも用いることのできる携帯機器がある。MTシステムが広まるにつれ、MTに関し、翻訳品質以外の周辺的な問題に光が当てられるようになってきた。実世界のMTアプリケーションが直面する重大な問題は、MTシステムに入力としてユーザが与える可能性のあるものが実に様々であるということである。例えば、入力には、間違えたり、標準からはずれたり、又は文法に従わなかったりする文、短縮された単語、絵文字、単語の置換え(例えば、「you」の代わりに「u」と書く等)等が含まれている。このような現象はMTシステムの性能を低下させるが、本質的には、MTシステムが取組もうとしている、それ自体既に十分な難問である中心的な問題に対して、周辺的な事項である。
【0003】
このような問題に対処する1つの方法は、不規則な用法とそれに対応する正確な用法とから成る大規模なコーパスを収集し、教師付き方法で言語を規則化するように学習させることであろう。しかし、この方策には明らかに限界がある。現実のユーザが標準からはずれるやり方はユーザのコミュニケーションのモード又はコード、内容、さらにはユーザのウィットにも依存するからである。
【0004】
MTドメインでは、これまで、2つのコミュニケーションチャネルが研究されてきた。図1に示すように、第1のコミュニケーションチャネル40は、ソース言語42とターゲット言語46との間の翻訳であって、これはソース言語42とターゲット言語46との間に置かれる中間の言語である中間言語(インターリンガ)44を介して行なうことができる。中間言語44が自然言語である場合は、コミュニケーションチャネルは2つのMTシステムの連結でよい。第1はソース言語42から中間言語44へのものであり、第2は中間言語44からターゲット言語46へのものである。また、翻訳はコミュニケーションチャネル50を介しても達成できる。これはソース言語52からターゲット言語54への直接翻訳処理である。これは、広範に研究されている、最新の統計的機械翻訳システムを用いて達成できる。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】picTrans。2010年。簡単なピクチャーベースの翻訳システム。7ジリオン。[オンライン]http://www.7zillion.com/iPhone/PicTrans/、アクセス日2011年1月18日。
【非特許文献2】指さし。2010年。指さし。情報センタ出版局。[オンライン]、http://www.yubisashi.com/free/t/iphone/、アクセス日2011年1月18日。
【非特許文献3】TexTra.2010年。(NICTによるテキスト翻訳機)。NICT。[オンライン]、http://mastar.jp/translation/textra-en.html、アクセス日2011年1月18日。
【非特許文献4】VoiceTra。2010年。(NICTによる音声翻訳機)。NICT。[オンライン]、http://mastar.jp/translation/voicetra-en.html、アクセス日2011年1月18日。
【発明の概要】
【発明が解決しようとする課題】
【0006】
人が母国語を異にする人と意思の疎通を図ろうとする場合、MTは便利な道具である。しかし、完全なMTシステムを持ち歩くわけにはいかない。携帯電話、又は無線通信能力を備えた携帯タブレット型コンピュータ等の携帯機器は、これらが完全なMTシステムと通信可能である限りにおいて、有用である。しかし、携帯機器でテキストを入力するのは、面倒で、多くのキーを押す必要があり、間違えやすい。ごく短い文でも、携帯機器で入力するのは困難である。このような場合、携帯機器以外の手段を用いた従来の方法が便利である。例えば、多くの場合、意思の疎通を図ろうとする人は、画像、記号、身振り等のコミュニケーション手段を持っており、ほかの手段がうまくいかない場合にはしばしば、これらの手段を用いる。実際、アイコンベースのコミュニケーションは、コミュニケーション手段が全くない地域の人々と意思の疎通を図ろうとする外交官の間では長い歴史がある。コミュニケーションはピクチャーを主として用いた本を用いて行なわれる。この本は、表現したいと願う内容の意味を示すアイコンを含み、外交官はそれらを指さすだけで外国の人々と意思の疎通を図る。
【0007】
例えば、図4に示すように、ピクチャーブックは2つのピクチャー80及び82を含む。ピクチャー80には「I want to go to」という英語のテキストと、対応の日本語のテキストが付されている。ピクチャー82には、「restaurant」という英語のテキストと、対応の日本語のテキストと、ナイフ及びフォークのピクチャーとがある。ユーザが、「I want to go to the restaurant」(私はレストランに行きたい)という表現を翻訳したいとする。このピクチャーブックがあれば、ユーザはおそらく図5に示すように上記した2つのピクチャーを指さすであろう。すなわちピクチャー80(「I want to go to」)を指さし、それからピクチャー82(「restaurant」)を指さす。
【0008】
ピクチャーベースのコミュニケーションに関しては、携帯型の装置用に様々なアプリケーションが提案されている。前者の領域では、PictTrans(pic−Trans,2010:非特許文献1)はピクチャーのアイコンのみを示し、指さし(指さし、2010:非特許文献2)(指でさすことを意味する)はアイコンをタップすると音声が出るが、これらのシステムは言語の生成は何ら行なわず、これは人間のユーザに任されている。
【0009】
逆に、ハンドヘルドの装置用に、かなりの数の機械翻訳システムも提案されている。例えば、texTra(texTra,2010:非特許文献3)テキスト翻訳システム及びvoiceTra(VoiceTra、2010:非特許文献4)発話翻訳システムがあるが、われわれの承知している限りでは、これらには、アイコンを備えたユーザインターフェイスを採用しているものはない。
【0010】
ピクチャーベースのアプリケーションは扱いが容易であるが、ソース文の表現可能性は限られている。音声ベースの機械翻訳アプリケーションは扱いが容易であるが、音声認識には誤りが多いと思われる。テキストベースの機械翻訳は最も翻訳の信頼性が高いが、テキスト入力はその携帯機器の入力システムに依存し、ほとんどの場合面倒である。
【0011】
したがって、この発明の目的は、扱いが容易で信頼性の高い翻訳を生成する装置及び方法を提供することである。
【0012】
この発明の別の目的は、ソーステキストを容易に入力し信頼性の高い翻訳を生成する装置及び方法を提供することである。
【課題を解決するための手段】
【0013】
この発明の第1の局面にしたがえば、タッチパネルディスプレイと関連して用いられるテキスト入力装置は、前記タッチパネルディスプレイに接続され、前記タッチパネルディスプレイにアイコンの組を表示するための手段と、前記タッチパネルディスプレイに接続され、ユーザによる前記タッチパネルディスプレイに表示された前記アイコンの1つ又は2つ以上のシーケンスの入力を受けるための入力受信手段と、前記タッチパネルディスプレイに接続され、前記入力受信手段を用いて前記ユーザによって入力されたアイコンのシーケンスを前記タッチパネルディスプレイに表示するための手段と、前記アイコンのシーケンスを所定の言語の完全な文に翻訳する翻訳手段と、を含む。
【0014】
好ましくは、テキスト入力装置は、前記タッチパネルディスプレイ及び前記翻訳手段に接続され、前記翻訳手段によって翻訳された前記完全な文を前記タッチパネルディスプレイに表示するための手段をさらに含む。
【0015】
さらに好ましくは、テキスト入力装置は、各々が前記アイコンとそれぞれ関連する、前記所定の言語のフレーズを記憶するための記憶手段と、前記記憶手段及び前記入力受信手段に接続され、前記アイコンの各々について前記記憶手段から引出されたフレーズを連結することにより外部言語のテキストを生成するための手段とをさらに含む。前記翻訳手段は文の対のコーパスで前記外部言語のテキストを前記所定の言語の文に翻訳するように統計的にトレーニングされたフレーズベースの統計的機械翻訳ユニットを含んでもよく、前記対の各々は、前記所定言語の第1の語彙内の語を含むフレーズのシーケンスと、前記第1の語彙より大きい第2の語彙内の語を含む前記所定言語の文と、を含む。
【0016】
さらに好ましくは、前記第1の語彙は前記所定言語の内容語を含む。
【0017】
統計的機械翻訳ユニットは、文仮説を構築するのに用いられるバイリンガルフレーズ対を、先行する部分的仮説の末尾にこれらのフレーズ対を付加することに関連するモデル確率とともに表す、探索グラフを出力してもよい。前記文は前記探索グラフにおいて最も尤度の高い経路に対応する仮説であり得る。
【0018】
テキスト入力装置はさらに、前記アイコンシーケンス中のアイコンの1つのユーザによる選択を受ける手段と、前記ユーザの選択に応答して、前記探索グラフの前記ユーザによって選択された前記アイコンに対応するノードまでの部分から引出された複数個の部分仮説を示すための手段とを含んでもよい。
【0019】
この発明の第2の局面にしたがえば、翻訳装置は、上述のテキスト入力装置のいずれかにしたがったテキスト入力装置と、前記テキスト入力装置によって出力される前記文をターゲット言語の翻訳文に翻訳するための統計的機械翻訳装置と、前記翻訳文を前記タッチパネルディスプレイに表示するための手段と、を含む。
【0020】
好ましくは、翻訳装置はさらに、前記タッチパネルディスプレイから予め規定されたコマンドを受けるための手段と、前記予め規定されたコマンドに応答して前記翻訳文を前記所定言語に逆翻訳し、前記逆翻訳された文を前記タッチパネルディスプレイに表示するための手段とを含む。
【0021】
この発明の第3の局面にしたがえば、タッチパネルディスプレイに関連してテキストを入力する方法は、前記タッチパネルディスプレイにアイコンの組を表示するステップと、ユーザによる、前記タッチパネルディスプレイに表示された前記アイコンの1つ又は2つ以上のシーケンスの入力を受けるステップと、前記受けるステップで入力されたアイコンのシーケンスを前記タッチパネルディスプレイに表示するステップと、前記アイコンのシーケンスを所定の言語の完全な文に翻訳するステップと、を含む。
【0022】
この発明の第4の局面にしたがえば、コンピュータプログラムは、タッチパネルディスプレイを備えたコンピュータを、前記タッチパネルディスプレイに接続され、前記タッチパネルディスプレイにアイコンの組を表示するための手段と、前記タッチパネルディスプレイに接続され、ユーザによる前記タッチパネルディスプレイに表示された前記アイコンの1つ又は2つ以上のシーケンスの入力を受けるための入力受信手段と、前記タッチパネルディスプレイに接続され、前記入力受信手段を用いて前記ユーザによって入力されたアイコンのシーケンスを前記タッチパネルディスプレイに表示するための手段と、前記アイコンのシーケンスを所定の言語の完全な文に翻訳する翻訳手段、として機能させる。
【図面の簡単な説明】
【0023】
【図1】先行技術の第1のコミュニケーションチャネル40を示す図である。
【図2】先行技術の第2のコミュニケーションチャネル50を示す図である。
【図3】この発明のコミュニケーションチャネル60を示す図である。
【図4】ピクチャーブックにあるピクチャーの例を示す図である。
【図5】ユーザが図4に示すピクチャーブックを操作する様子を示す図である。
【図6】この発明の1実施の形態のアイコンベースの翻訳アプリケーションのユーザインターフェイス(User Interface:UI)画面100を示す図である。
【図7】翻訳とその逆翻訳のトグルを示す図である。
【図8】この発明の第1の実施の形態のアイコンベースの翻訳システムのブロック図である。
【図9】図8に示す翻訳システムの翻訳サーバの機能的ブロック図である。
【図10】ソース言語−ソース言語(source−to−souce:S−TO−S)SMTエンジンをトレーニングするプログラムの制御の流れを示すフローチャートである。
【図11】アイコンベースのソース文と完全型のソース文とのアライメント例を示す図である。
【図12】この発明にしたがった携帯機器で実行されるアイコンベースの翻訳アプリケーションの制御の流れを示すフローチャートである。
【図13】アイコン追加ルーチンの詳細な制御の流れを示す図である。
【図14】アイコンテキストのシーケンスから完全型のソース文を生成するルーチンの詳細な制御の流れを示す図である。
【図15】完全型のソース文を改良するルーチンの詳細な制御の流れを示す図である。
【図16】翻訳操作の詳細な制御の流れを示す図である。
【図17】人間による操作がある場合の、アイコンの組のサイズに対する、未遭遇データの範囲を示すグラフである。
【図18】人間による操作なしの場合の、アイコンの組のサイズに対する、未遭遇データの範囲を示すグラフである。
【図19】欠落した不変化詞を回復するための隠れn−グラム法に対する、SMTアプローチを用いたソース文生成品質を表形式で示す図である。
【図20】アイコンベースの翻訳アプリケーションが実行される携帯機器の斜視図である。
【図21】図20に示す機器のブロック図である。
【図22】この発明の一実施の形態の翻訳サーバとして機能するコンピュータの正面図である。
【図23】図22に示すコンピュータのブロック図である。
【発明を実施するための形態】
【0024】
上述の図面を参照してこの発明を説明する。以下の説明及び図面では、同一の構成要素には同一の参照番号を付してある。したがって、それらについての詳細な説明は繰返さない。それらの機能もまた同様であるので、その詳細な説明は繰返さない。
【0025】
1.外部言語
この実施の形態は、対話者のいずれからも見える外部言語(Extralingua)を用いる。図3を参照して、ユーザは、両者とも、外部言語62を、以下の3つのMTシステムの支援を用いて対話的に操作できる。第1は外部言語62とソース言語64との間のもの、第2はソース言語64とターゲット言語66との間のもの、第3は外部言語62とターゲット言語66との間のものである。このような外部言語が存在するならそもそもなぜMTが必要なのか疑問に思うかもしれない。実はこの点が重要なのである。対話者同士には互いに意思の疎通ができる共通の言語が無い。これまでは図1及び図2に示すように単一のMTチャネルを用いてこのギャップを埋める方法のみを考えてきた。しかし、多くの状況において、対話者は、画像、記号、身振り等のコミュニケーション手段を持っており、ほかの手段がうまくいかない場合には、これらの手段を用いることが多い。このコミュニケーションの別のモードをMTチャネルと独立して並列に採用することもできるが、この発明の思想は、第2のコミュニケーションチャネルを直接機械翻訳システムに緊密に結合することを探求しようとするものである。
【0026】
このアプローチには多くの利点がある。第1に、何よりもまず、ユーザ間のコミュニケーションの品質が改善される。外部言語62を採用することにより、ユーザは2つの別種のチャネルを介して意思の疎通を図ることが可能になる。MT出力が完全であるとは期待できないので、これを補強する、又はこれと矛盾を生じるような第2の独立したコミュニケーションモードがあれば、より良い相互理解につながる。第2に、この提案はまたMTの品質も改善する。ユーザ入力処理を外部言語へのユーザインターフェイスで支援することができ、それによって入力を規則正しくし、予期しないエントリの数を減じることができるからである。
【0027】
外部言語62の概念は、2つの大きな問題を提示する。
【0028】
−外部言語はどのような形をとるべきか?
−どうすればこの外部言語を効果的にMTシステムに統合できるか?
原理的には、外部言語は対話者によって共有できる、言語型のコミュニケーション媒体であればどのようなものでもよい。画像、記号、公式又は国際的な自然言語であってもよい。この実施の形態では、このような外部言語のアプローチが単純な抽象的言語によっても効果的であることを示すために、まず初めの例としてアイコンを採用した。
【0029】
2.アイコンベースの翻訳システム
ピクチャーベースの翻訳支援具は紙の本の形で使われてきて、現在はハンドヘルドの装置に統合されているが、先行技術の非特許文献1又は2に示されるように、機械翻訳システムと組合わされてはいない。簡潔に言えば、この実施の形態において、ユーザはタッチスクリーンに現れるピクチャーのアイコンを、ちょうどピクチャーベースの翻訳支援具と同じように、タップする。システムはこれらの選択されたアイコンのシーケンスから可能な文を自動的に生成し、それらを機械翻訳に供給して、翻訳結果が表示できるようにする。ピクチャーブックとは異なり、アイコンのシーケンスはディスプレイ上に維持されてユーザが見ることができ、必要に応じて操作できる。入力が完了すると、システムは自動的に又は要求に応じてソース言語で完全型の文を生成し、これがその後機械翻訳ソフトウェアで翻訳されて、アイコンのシーケンスとともにスクリーン上に表示される。
【0030】
後述するように、この実施の形態では、アイコンのシーケンスは携帯機器のタッチスクリーンで入力される。遠隔の翻訳サーバで完全型のソース文の探索ツリーが生成される。探索ツリーを用いて、ユーザは携帯機器上で完全型のソース文を改良する。この改良されたソース文が翻訳サーバに送られる。翻訳文が携帯機器に送り返され、ユーザに提示される。
【0031】
この実施の形態では、このユーザインターフェイスを介してコミュニケーションすることにより、ユーザは本の同じ見開きからのみの組合せを想定してデザインされたピクチャーブックでできるよりもかなり多くのピクチャーを組合せることができ、このためアプリケーションは本よりずっと豊かな表現を実現できる。機械翻訳システムはピクチャーベースのモードに支援された、詳細で正確な翻訳を提供することができ、これは基本的な概念を伝えるのにより迅速な方法を提供するのみならず、機械翻訳の誤りをとらえ、ユーザにその文の再試行を許して誤解を避けるような、機械翻訳出力の「セカンドオピニオン」も与える。
【0032】
携帯機器上のMTに適用した場合、このようなシステムは非常に有利である。これら形態機器上でのユーザの入力は、テキスト入力の場合は面倒だろうし、音声入力では誤りが多いだろう。この結果、ユーザはより簡単で信頼のおける、ピクチャーブックの翻訳支援具等の言語間コミュニケーション方法を好むようになっており、最近、紙の形でも、電子的翻訳支援アプリケーションの形でも、広く用いられるようになってきている。
【0033】
2.1 ユーザインターフェイス
携帯機器で実行されるアプリケーションの完全なユーザインターフェイスの図を図6に示す。簡単に言えば、このアプリケーションはユーザが表現したいものをバイリンガルで注釈を付けたアイコンのシーケンスで入力できるようにする。これは本質的にはピクチャーブックと同じ思想である。
【0034】
図6を参照して、この実施の形態のUIは、ソース言語とターゲット言語との間で言語をトグルするUI言語トグルボタン110、所望のアイコンカテゴリをユーザに選択させるカテゴリボタン112、選択されたアイコンカテゴリのうち、所望のサブカテゴリをユーザに選択させるサブカテゴリボタン114、アイコンの順序を並べ替えるアイコンソートボタン116、及び各々がソース言語フレーズとターゲット言語フレーズとの対を保持し、フレーズの意味を図形で表すアイコンがついた、一組のアイコン118とを含む。この実施の形態では、アイコン上のテキストは必須ではない。図形がうまくデザインされていれば、テキストはアイコンから省略してもよい。各アイコン118はこのシステムを実現するプログラムにおいてオブジェクトとして実現される。各アイコンオブジェクトは表示のためのそれ自身の図形データと、そのアイコンに関連したソース言語及びターゲット言語の単語又はフレーズを有する。アイコンデータはプログラムの一部であってもよく、ハードディスクドライブ等の記憶装置に記憶される。
【0035】
UIはさらに、アイコンのシーケンス(例えば、アイコン140、142及び144)を入力順に表示するための、入力アイコンシーケンス用のアイコンシーケンスフィールド120と、アイコンのシーケンスから完全型のソース文の生成を起動するソース生成ボタン126と、アイコンのシーケンスから生成された完全型のソース文を表示するためのソース文フィールド122と、ソース文フィールド122のソース文の翻訳文を表示する翻訳文フィールド130と、ソース文フィールド122に示された完全型のソース文の翻訳を起動し、翻訳文が翻訳文フィールド130に現れるようにさせる翻訳ボタン124と、アイコンシーケンスフィールド120、ソース文フィールド122、及び翻訳文フィールド130をクリアするためのクリアボタン128と、翻訳文フィールド130に示された翻訳文の他の言語への翻訳を起動するチェックボタン132とを含む。ユーザがアイコン118の1つを選択すると、選択されたアイコンはアイコンシーケンスフィールド120内のアイコンのシーケンスに追加される。これは、アイコンの図形表現のシーケンスが生成されるだけでなく、アイコンシーケンスにしたがって単語又はフレーズを連結することにより、アイコンに関連する単語又はフレーズのシーケンスも生成されることを意味する。
【0036】
ソース生成ボタン126は必ずしも必要でない。例えば、2個又はそれ以上のアイコンが選択された場合、完全なソーステキストを自動的に推定してもよい。又は、ソース言語によっては、例えば特定のクラスの単語又はフレーズによって推定が自動的に起動してもよい。
【0037】
ユーザはUI言語トグルボタン110を押すことによってユーザインターフェイスを自身の言語に切換えることができる。翻訳処理は以下のように進む。
【0038】
(1)ユーザがカテゴリボタン112のいずれかを押すことにより、表現したいと思う概念のカテゴリを選択する。
【0039】
(2)ユーザがサブカテゴリボタン114の1つを押すことによりサブカテゴリを選択する。
【0040】
(3)ユーザがアイコン118の中からアイコンを選ぶと、そのアイコンがアイコンシーケンスフィールド120内のアイコンシーケンスに追加される。
【0041】
(3a)もしユーザが入力を続けたい場合には、(1)に戻り、シーケンスに別のアイコンを選択する。
【0042】
(3b)もしアイコンシーケンスが完了であれば、ソース生成ボタン126を押し、続いてステップ(4)に進む。アイコンシーケンスフィールド120内のアイコンシーケンスは完全型のソース文に翻訳され、ソース言語文がソース文フィールド122に現れる。この翻訳はソース言語からソース言語への翻訳である。完全なソース言語は、後述するフレーズベースのソース言語−ソース言語SMTによって、アイコンのシーケンスに基づいて、又はより具体的にはアイコンテキストのシーケンスに基づいて、遠隔のサーバにおいて推定される。
【0043】
(4)ユーザはシステムを対話的に操作することにより、ソース文を改良する(後述する。)。ユーザはアイコンシーケンスフィールド120内のアイコンのいずれか1つを選択することによりソース文を改良できる。
【0044】
(5)完全型のソース文に満足な場合は、ユーザは翻訳ボタン124をクリックする。これによって遠隔サーバ内のSMTシステムがソース文フィールド122内の文をターゲット言語に翻訳することになる。
【0045】
(6)翻訳文フィールド130に翻訳文が現れる。
【0046】
図7を参照して、一旦翻訳が完了すると、チェックボタン132を押すことにより翻訳文フィールド130内のターゲット文のソース言語への逆翻訳が示され、ユーザが翻訳を検証できる。チェックボタン132をもう一度押すと、逆翻訳が翻訳文に置き換わる。
【0047】
2.2システムアーキテクチャ
図8を参照して、翻訳システム150は、ネットワーク156により接続された携帯機器152とサーバコンピュータ154とを含む。携帯機器152はネットワーク156によりサーバコンピュータ154に接続され、このサーバコンピュータ154には3つの異なる機械翻訳サーバ処理が内蔵されている。第1のサーバ処理はアイコンシーケンスを完全型のソース文に翻訳し、デコード処理の探索グラフを、携帯機器152上で実行されているUIアプリケーションに返す。この処理は統計的機械翻訳(SMT)によって実現され、この実施の形態ではこれをソース言語−ソース言語SMTと呼ぶ。他の2つのサーバ処理はソース言語からターゲット言語への翻訳と、ターゲット言語からソース言語への逆翻訳とを行なう。これらの処理は最新のSMTによって実現され、それぞれソース言語−ターゲット言語SMT、ターゲット言語−ソース言語SMTと呼ぶ。
【0048】
UI言語をトグルすることによって、2人のユーザ160及び162はともに携帯機器152上のUIアプリケーションを利用できる。したがって、図9に示すように、2つのソース言語−ソース言語SMT174及び176がコンピュータ154内に内蔵されている。このシステムが日本語と英語との間のものであるとすれば、SMT174は日−日(日本語から日本語)のSMTであって、日本語のアイコンテキストシーケンスを日本語の完全型のソース文に翻訳し、SMT176は英−英(英語から英語)のSMT176であって英語のアイコンテキストシーケンスを英語の完全型のソース文に翻訳する。
【0049】
したがって、この実施の形態では、サーバコンピュータ154は日−日SMT174と、英−英SMT176と、日−英SMT178と、英−日SMT180と、サーバコンピュータ154にネットワーク156への接続を与えるネットワークインターフェイスカード(Network Interface Card:NIC)170と、図8の携帯機器152等の遠隔携帯機器(図示せず)からの要求を、日−日SMT174、英−英SMT176、日−英SMT178及び英−日SMT180の間に配信し、携帯機器に応答を返す要求配信処理172とを有する。
【0050】
3.外部言語からソース文への変換
3.1 機械翻訳
外部言語を完全型のソース文に変換する作業は、字訳生成作業と極めて類似しており、これは単語並べ替え処理での一方向制約を用いたフレーズベースの統計的機械翻訳システム(SMT)(Finch及びSumita、2008年;Rama及びGali、2009年)を用いて行なうことができる。ここでも同様のアプローチを採用したが、SMTシステムのためのフレーズテーブルを引出すのにはベイズ共セグメント化アプローチ(次のセクションで説明する。)を用いた。
【0051】
アイコンテキストシーケンスを完全型のソース文に翻訳するようにSMTシステムをトレーニングするために、単語の削除によってトレーニングコーパスを生成する。この実施の形態と実験では、ソース言語として日本語を用いた。すなわち、図10に示すように、日本語コーパス200を準備する。日本語コーパス200には、公に入手可能なMeCab(Kudo、2008年)等の形態素解析ツールを用いた形態素解析が行なわれる。本システムでアイコンで表されるであろう種類の内容語(例えば、名詞、動詞、形容詞等)を表す品詞(Part−Of−Speech:POS)タグの組が手で集められ、ステップ206で残りの単語のクラス(不変化詞、形式名詞、助動詞)がソース文から削除される。さらに全ての語彙素の活用形はこのステップでその見出し語に還元される。この処理の結果、バイリンガル(日本語から日本語)のトレーニングコーパス210が得られ、これは外部言語を示す、ソース側の内容語(語幹の形)のシーケンスと、ターゲット側である、完全型のソース文とからなる。トレーニングコーパス210のソース側内容語は語彙が限られており、一方で、ターゲット文側の完全なソース単語は、より大きな語彙からなる。
【0052】
後述する実験では、フレーズベースの機械翻訳デコーダ(日−日SMT174)を用い、このモデルを対数線形フレームワーク(Och及びNey、2002年)と統合した。トレーニングコーパス210内でのフレーズ対の発見と抽出は、ベイズバイリンガルアライメント部(Finch及びSumita、2010年)を用いて行なわれた。この処理では、Knesser−Ney平滑化によって構築された5−グラム言語モデルが用いられた。システムは、対数線形モデルの重みを最適化するために取りのけておいた開発データ上で、BLEUスコア(Papineniら、2001年)に関する最小誤差率トレーニング(minimum error rate training:MERT)手順(Och、2003年)を用いて、標準的なやり方でトレーニングされた。
【0053】
機械翻訳システムは、旅行会話集で典型的に見られるような表現からなる約700,000のバイリンガル文対でトレーニングされた。これは非常に限られたドメインであり、このドメイン内の文は非常に短い傾向がある(コーパスの英語側で平均7語)ため、翻訳は極めて容易であった。機械翻訳システムは最新のシステムであり、限定したドメインの短い文に限って適用した結果、高品質の翻訳が可能であった。
【0054】
3.2 ベイズ共セグメント化
全てのフレーズベースの統計的機械翻訳システムにおいて中心となるのは、フレーズテーブルである。このテーブルは、翻訳を構築するのに用いられる構成要素の基本的な組である。
【0055】
フレーズベースのSMTシステムの通常のトレーニング処理の間のフレーズテーブルの作成は、しばしばGIZA++(Och及びNey、2003年)を用いる単語アライメントステップと、これに続く、ヒューリスティクス(例えば、MOSES(Koehnら、2007年)ツールキットのgrow−diag−final−and)を用いたフレーズ対抽出ステップとから成る。このアプローチは実際には非常にうまく働くが、ソースとターゲットとで非対称であり、データを過学習するおそれの大きい最大尤度法に基づいている。
【0056】
ここで共セグメント化に用いたモデルは、Finch及びSumita、2010年、に類似のディリクレプロセスモデルである。ここでベイズのアプローチを用いた理由は、その結果が、一方向にアライメント可能なシーケンスに対しGIZA++/MOSESヒューリスティックス(Finch及びSumita、2010年)を用いるよりも効果的であることを示したばかりでなく、コーパスの、首尾一貫した単一のバイリンガルセグメント化をもたらすからである。この一貫性はこのモデルを構築するのに非常に望ましい特性であると考えられる。このシステムは、これらフレーズ対を組合せるだけで自然言語を生成するからである。
【0057】
図11に共セグメント化処理を例示する。図11を参照して、日本語アイコンテキスト220のシーケンスが完全な日本語文222とアライメントされる。日本語のアイコンテキスト220のシーケンスは外部言語の文と考えられ、一方、日本語文222は日本語の文である。したがって、これら2つの文又は単語シーケンスは英語の文と日本語の文との場合と同様に、アライメントできる。図11の例では、アイコンテキスト230(タクシー)、232(レストラン)及び234(行く)がフレーズ240(タクシーで)、242(レストランに)及び244(行きたいのですが)とアライメントされている。
【0058】
3.3 ユーザの操作
図12を参照して、図6に示すアイコンベースの翻訳アプリケーションのUI画面100を実現するメインプログラムは、以下の制御構造を有する。プログラムはステップ260で始まり、ここではシステムの初期化が行なわれる。このステップでは、プログラムにメモリロケーションが割当てられ、このプログラムを実行するためのベースアドレスが決定され、メモリロケーションが初期化され、スクリーンが初期化される。
【0059】
次のステップ262で、システムはユーザの入力を待つ。ユーザの入力が検出されると、システムはユーザによってどのボタン又はタブがタッチされたかを判断し、ステップ264から282に制御を分岐させる。
【0060】
ユーザがUI言語トグルボタン110(図6)をタッチすると、制御の流れはステップ264に進み、ここでUI言語がこの実施の形態では日本語と英語との間でトグルし、その後制御はステップ262に戻る。ユーザがカテゴリボタン112及びサブカテゴリボタン114の1つをタッチすると、対応のアイコンの組がアイコン記憶部(図示せず)から読出されて、タッチスクリーン上に配列され、制御はステップ262に戻る。ユーザがアイコンソートボタン116の1つをタッチすると、制御はステップ270に進み、ここでアイコン118が選択された順序で並べ替えられ、制御はステップ262に戻る。これらのステップは通常の処理であると考えられ、当業者によって容易に実現可能である。したがって、これらのステップの詳細はここでは説明しない。
【0061】
ユーザがアイコン118のうち1つをタッチすると、制御はステップ272に進む。図13を参照して、ステップ272はアイコンをアイコンシーケンスフィールド120内のアイコンのアイコンシーケンスの末尾に追加するステップ300と、アイコンテキストをテキストシーケンスの末尾に追加するステップ302(図示せず)と、アイコンシーケンスフィールド120を更新してこのルーチンから出るステップ304とを含む。
【0062】
ユーザがソース生成ボタン126をタッチすると、制御はステップ274に進む。図14を参照して、ステップ274はアイコンシーケンスフィールド120内のアイコンシーケンスに対応するアイコンテキストシーケンスを日−日SMT174に送るステップ320(図9を参照)と、日−日SMT174から探索グラフが送り返されるのを待つステップ322と、この探索グラフを記憶部に記憶するステップ324(図示せず)と、探索グラフのうち最も尤度の高い経路を探すステップ326と、ステップ326で見つかった最も尤度高い経路に対応するソーステキストをソース文フィールド122のための記憶部に記憶するステップ328と、ソース文フィールド122を更新するステップ330と、を含む。ステップ330の後、制御はステップ262に戻る(図12)。
【0063】
機械翻訳システムの出力は、探索グラフであって、完全型のソース文仮説を構築するのに用いられるバイリンガルフレーズ対を、先行する部分的仮説の末尾にこれらのフレーズ対を付加することに関連するモデル確率とともに表したものである。このグラフは機械翻訳システムからユーザインターフェイスクライアントに与えられ、これは図形中の情報を用いて、操作処理の間に入力を連続して再デコードする必要なしに、ユーザに満足のいく結果を与える。
【0064】
このシステムでは、外部言語からの生成処理に続いて、上述のステップ274の処理の結果として、与えられた入力文に対し完全型のソース文の最も尤度の高い仮説がユーザに提示される。この文がユーザの意図した意味に合わなければ、ユーザはアイコンシーケンスを対話的に操作することにより、生成された文を改良できる。これは図12のステップ276で行なわれる。
【0065】
ユーザはアイコンシーケンスフィールド120に表示されているアイコンシーケンスの中のどのアイコンをタップしてもよい。図12を参照して、制御はステップ276に進む。
【0066】
図15を参照して、ステップ276はステップ340を含み、ここではユーザインターフェイスが探索グラフを調べ、ユーザに対し、選択されたアイコンの翻訳にいたる範囲で、かつ選択されたアイコンの翻訳を含む、部分的な翻訳仮説のnベストリストを提示する。これに応じて、ユーザは部分的翻訳仮説の1つを選択できる。この実施の形態では、システムに直接テキスト入力することはできないが、そのようにすることも可能であり、おそらく実世界のシステムではこれが必要であろう。入力をこのように制限することによって支払うべき対価は、表現の豊かさであるので、以下のセクションでは、このことを念頭においてこのシステムを実験的に検討する。
【0067】
ステップ276はさらに、ステップ340でのユーザの入力に基づいて新たな完全型のソーステキストを生成するステップ342と、新たな完全型のソーステキストをソース文フィールド122のための記憶部に記憶するステップ344と、ソース文フィールド122を更新するステップ346と、を含む。ステップ346の後、制御はステップ262に戻る。
【0068】
再び図12を参照して、ユーザがクリアボタン128(図6を参照)をタッチすると、制御はステップ278に進み、ここでアイコンシーケンスフィールド120、ソース文フィールド122及び翻訳文フィールド130がクリアされ、制御はステップ262に戻る。
【0069】
ユーザが翻訳ボタン124(図6を参照)をタッチすると、制御はステップ280に進む。図16を参照して、ステップ280は、ソース文フィールド122の完全型のソース文を図9に示す日−英SMT178に送るステップ360と、日−英SMT178からの応答(翻訳)を待つステップ362と、翻訳文を受取り、翻訳文フィールド130用の記憶部に記憶するステップ366と、翻訳文フィールド130を更新するステップ368とを含み、制御はステップ262に戻る(図12を参照)。
【0070】
ユーザがチェックボタン132をタッチすると(図6を参照)、制御はステップ282に進む。この実施の形態では、ステップ282において、翻訳文フィールド130に示されたテキストが日本語のテキストか(逆翻訳)又は英語の翻訳であるかに依存して、翻訳文フィールド130に示されたテキストが日−英SMT178又は英−日SMT180に送られる。日−英SMT178又は英−日SMT180から翻訳文又は逆翻訳文が送り返され、翻訳文フィールド130に示され、制御はステップ262に戻る。
【0071】
上の実施の形態はソース言語(例えば日本語)からターゲット言語(例えば英語)への翻訳に関連して説明されたが、上述の装置が逆方向への翻訳、すなわち英語から日本語への翻訳にも使用できることは当業者には明らかであろう。さらに、サーバコンピュータ154(図9を参照)が英−英SMT176を有していない場合でも、これは依然として日本語から英語へのアイコンベースの翻訳装置として機能する。
【0072】
4.評価
4.1 表現力
アイコン駆動のユーザ入力について懸念される主な点の1つは、ドメイン内におけるその表現力である。文をその携帯機器で利用可能なアイコンのみを用いて表現しなければならないからである。このため、システムの評価を行なって、UI画面100が表すことのできるドメイン内の文の比率を判断した。この目的のために、トレーニングコーパス210(図10を参照)と同じサンプルから抽出し取りのけておいたデータの組から100個の文のサンプルを採り、各々の文からアイコン駆動のインターフェイスとそのソース文生成処理とを用いて意味的に均等な形を生成できるかどうかを判断した。現在のプロトタイプの開発ははまだ十分ではないので、数値表現(価格、電話番号、日付、時刻等)を扱うアイコンの組を含んでいない。このため、評価用の組からはこれらを含む文を除いた(数値表現を含む文を除いた後の評価用の組のサイズは100文であった。)。しかし、数値表現の扱いは比較的直截的なので、将来この機能を付加することに格別困難があるとは思われない。評価で用いたアイコンの組は、日−英SMT178及び英−日SMT180をトレーニングするのに用いたトレーニングコーパスの英語側で最もよく用いられる2010個の内容語であり、トレーニングコーパス中で28回以上出現した内容語である。この値は、ユーザインターフェイスのアイコンの数が、実世界で役立つ応用を構築するのに必要なアイコン数の概算である2000個程度になるように選ばれた。
【0073】
この評価データの文の74%で、意味的に均等な文を生成可能であることが分かった。これを、より少ない数のアイコンが用いられた例についての(100個の評価文からランダムに採った30個のサンプル文に基づく)統計とともに、図17のグラフ380に示す。ユーザインターフェイスを簡素化したことを考えれば、この守備範囲は高レベルであると思われる。出力に対し人による訂正がない場合の2つの方法の比較を図18に示す。ここでもまた、MT法(グラフ390で示す)がn−グラム法(グラフ392で示す)よりも高い性能を示した。これと、この方法が一般に全ての言語に応用可能であると期待できることと考え併せれば、この発明の目的に関しこの方法がそれだけ良い生成技術であるといっても過言ではないであろう。
【0074】
4.2 効率
これらの文を外部言語を用いて入力するのに必要とされたキーを押す動作の回数を、装置のテキスト入力インターフェイスを用いて入力した場合に必要とされたであろう回数と比較検討した。ここでは、アイコンの各々を選択するのにキーを3回押す必要があると仮定したが、多くの場合同じアイコンサブカテゴリからのアイコンを用いることができるので、そのようなアイコンはキーを1回押すだけで済む。したがって、ここでの推定は必要とされるキーを押す動作の回数の上限を表す。キーを1回押すのにかかる時間は、アイコンの入力とテキストの入力とでは同じではないが、実験ではこれは測定しなかった。さらに、入力処理でのユーザの入力誤りの影響も測定しなかった。ソース文が意図した意味になるように、ユーザがシステムを対話的に操作するために必要なキーを押す追加の動作は測定に含めた。
【0075】
この実験で、この実施の形態にしたがった外部言語の入力システムでは、テキスト入力方法のキーを押す動作の回数の57%しか必要としないことが分かった。キーを押す動作の回数はテキスト入力の1650回に対し、外部言語の入力方法では941回である。これは、外部言語の入力システムが、効率的なテキスト入力システムとして利用できることを意味する。
【0076】
4.3 ソース文生成の品質
この発明のシステムの最初の版では、欠落する機能語を回復するのに単純な言語モデルベースのアプローチを用いた。このアプローチは、形が非常に規則的で、機能を示すのに内容語に近接して不変化詞を用い、限定詞を含まない日本語には適している。内容語の対であって機能語がその左又は右についているものを含むバイグラムをトレーニングデータから抽出し、これらのバイグラムを生成処理において対応の内容語の場所に挿入した。この発明のモデルは、これら可能な置換の全てから結果として生じる仮説の組に、5グラム言語モデルでスコア付けし、最も高い言語モデルスコアとなった仮説を最良の候補として選択する。探索空間を管理可能なサイズに削減するため、ビーム探索法を用いた。
【0077】
この発明のシステムのソース生成構成要素の品質を、いずれもn−グラム精度に基づく機械翻訳性能を測定する一般的な方法である、BLEUスコア(Papineniら、2001年)及びNISTスコア(Doddington、2002年)について、NIST機械翻訳評価スコアスクリプトのバージョン13aを用いて評価した。評価データの中から、数値表現を含む文を除去した。この除去により、当初510個の日本語文の組が455個の文に減じられた。これらの文をMeCab形態素解析器に供給し、発明のシステムのアイコンとは関係のない単語を除いた。実験結果を表の形で図19に示す。
【0078】
隠れn−グラム(見出し語化済み)とSMT生成とのスコアは全く同じ入力から導出したものである。この例で隠れn−グラムのスコアが低いのは、活用形を生成できないからである。したがって、第2の実験では、活用した語の正しい表層形式から隠れn−グラムを生成できるようにした。これはこのモデルに、活用を予測する必要があるSMT生成モデルに対し不当な優位性を与えることになった。それにも関わらず、SMT処理で生成されたソース文は用いられたどちらの評価基準でもより高いスコアであった。
【0079】
5.コンピュータによる実現
この発明の実施の形態の上述の説明から明らかなように、携帯機器152とサーバコンピュータ154とはコンピュータハードウェアで実現可能である。携帯機器152はユーザが持ち運ぶので、そのリソースは限られるが、サーバコンピュータ154にはそのような制限はない。したがって、それらの構成は互いに異なる。
【0080】
図20及び図21を参照して、この実施の形態の携帯機器152はタブレット型のコンピュータであって、液晶表示装置(Liquid Crystal Display:LDC)420上に形成されたタッチパネル418を有し、ユーザがテキストの入力をしたり、LCD420に表示された何らかのボタンをタッチしたりできる。携帯機器152はさらに、CPU(Central Processing Unit:中央処理装置)410と、フラッシュROM(Read−Only Memory:読出専用メモリ)412と、RAM(Random Access Memory:ランダムアクセスメモリ)414と、入出力インターフェイス(I/F)416と、ネットワークインターフェイス422と、ハードウェアボタン424と、を含む。これらの構成要素は全て、バス426に接続される。CPU410はバス426を介してこれらのいずれにもアクセス可能である。
【0081】
図22を参照して、この実施の形態のサーバコンピュータ154にハードウェアリソースを提供するコンピュータシステム430は、コンピュータ440を含む。コンピュータシステム430はさらに、全てコンピュータ440に接続された、モニタ442、キーボード446及びマウス448を含む。コンピュータ440はDVD(Digital Versatile Disc:ディジタル多用途ディスク)462からデータを読出し、又はDVD462にデータを書込むためのDVDドライブ450と、リムーバブルメモリ464からデータを読出し又はデータを書込むためのメモリポート452と、を有する。
【0082】
図23を参照して、コンピュータ440はさらに、CPU456と、CPU456に接続されたバス466とを含む。DVDドライブ450とメモリポート452とはバス466に接続されており、バス466を介してCPU456にアクセス可能である。コンピュータ440はさらに、コンピュータ440のブートプログラムを記憶するROM458と、CPU456によって使用される作業領域及びCPU456によって実行されるプログラムの記憶領域を提供するRAM460と、SMTが使用するコーパスデータ、翻訳モデル及び言語モデル、並びにトレーニング処理と翻訳処理との間に使用される他のデータを記憶するハードディスクドライブ(HDD)454と、を含む。
【0083】
コンピュータ440はさらにNIC170を含み、これは図9にも示されるが、バス466に接続されてコンピュータ440に、典型的にはLAN(Local Area Network)(図示せず)及び無線通信である、ネットワークへの接続を与える。
【0084】
上述の実施の形態のサーバコンピュータ154を実現するソフトウェアは、DVD462等の記録媒体に記録されたオブジェクトコードの形で配信されてもよいし、リムーバブルメモリ464に記憶され、DVDドライブ450又はメモリポート452等の読出装置を介してコンピュータ440に提供され、HDD454に記憶されてもよい。CPU456がプログラムを実行する際に、プログラムはHDD454から読出されてRAM460に記憶される。CPU456の図示しないプログラムカウンタによって指定されるアドレスからCPU456によって命令がフェッチされ、CPU456によって処理される。CPU456は、CPU456内のレジスタ、RAM460又はHDD454の、命令のオペランドによって指定されるアドレスから処理すべきデータを読出し、処理の結果を、これもまた命令のオペランドによって指定される、CPU456内のレジスタ、RAM460又はHDD454に記憶する。
【0085】
コンピュータシステム430の一般的な動作は周知であるので、その詳細はここでは説明しない。
【0086】
ソフトウェアの配信の仕方について、これは必ずしも記録媒体に固定されていなくてもよい。例えば、ソフトウェアは別のシステムからコンピュータ440にネットワーク及びNIC170を介して送信されてもよい。ソフトウェアの一部をHDD454に記憶し、ソフトウェアの残りの部分をネットワークからHDD454に取り込んで、実行の際にそれらを統合してもよい。
【0087】
典型的には、現代のコンピュータはコンピュータのオペレーティングシステム(OS)によって提供される機能を利用し、所望の目的にしたがって制御されたやり方で機能を実行する。したがって、OS又はサードパーティによって提供される機能を含まず、一般的な機能を実行する命令の組合せのみを指定するプログラムもまた、全体として所望の目的を達成する制御構造を有する限り、この発明の範囲に含まれる。
【0088】
6.結論
この発明は、外部言語と呼ばれる抽象的言語を用いてコミュニケーションの際に両当事者が伝えようとしている意味的内容を明示する、機械翻訳の新たな入力の枠組みを提供する。この外部言語は機械翻訳システムに対しトランスペアレントで信頼性のあるセカンドオピニオンとして働くのみならず、携帯機器で実行されるアプリケーションにうまく適合する、主たるユーザ入力の方法として用いることができる。
【0089】
この発明の実施の形態、発明の思想を実施するシステムの具体例、及びその特性のいくつかの実験的説明を提示した。この実施の形態では、旅行者のための2つの異なる翻訳方法の思想を結びつけた。ピクチャーブックと、統計的機械翻訳とである。このアプローチはピクチャーブックの単純ながら力強い表現の利点を全て提供すると同時に、ソース文でのユーザの意味を明瞭に言い表すことのできる自然言語をターゲット言語で生成できる。発明者らの評価によれば、アイコンベースの入力システムはこの基本旅行表現コーパスのドメインにおいて文の約74%をカバーし、さらに、テキストのみの入力方法に対し、翻訳すべき表現を入力するのに必要なキーを押す回数は大幅に減じられた。
【0090】
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。
【0091】
参考文献
G.Doddington.2002年。Nグラム共起統計を用いた機械翻訳品質の自動評価。HLT会議予稿集、サンディエゴ、カリフォルニア。
【0092】
Andrew Finch及びEiichiro Sumita.2008年。フレーズベースの機械翻訳。第3回NLP国際合同会議予稿集、第1巻。ハイデラバード、インド。
【0093】
Andrew Finch及びEiichiro Sumita.2010年。字訳のためのバイリンガルセグメント化のベイズモデル。IWSLT予稿集、パリ、フランス。
【0094】
Philipp Koehnら、2007年.Moses:統計的機械翻訳のためのオープンソースツールキット。ACL2007:デモ及び紙セッションの予稿集、第177−180ページ、プラハ、チェコ共和国、6月。
【0095】
T.Kudo.2008年。MeCab.[オンライン]、http://mecab.sourceforge.net/で入手可能。
【0096】
Franz Josef Och及びHermann Ney.2002年。統計的機械翻訳のための識別的トレーニング及び最大エントロピモデル。第40回コンピュータ言語学会年次会合(ACL2002)予稿集、第295−302ページ。
【0097】
Franz Josef Och及びHermann Ney2003年。様々な統計的アライメントモデルの系統的比較。コンピュータ言語、29(1):19−51。
【0098】
Kishore Papineniら、2001年.Bleu:機械翻訳の自動評価方法。ACL’02:コンピュータ言語学会第40回年次会合予稿集、第311−318ページ、モリスタウン、NJ、USA、コンピュータ言語学会。
【0099】
Taraka Rama及びKarthik Gali.2009年。フレーズベースの統計的機械翻訳課題としての機械翻訳モデル。NEWS’09:固有表現ワークショップ:音訳の共有タスク、第124−127ページ、モリスタウン、NJ、USA、コンピュータ言語学会。
【符号の説明】
【0100】
40、50、60 コミュニケーションチャネル
42、52及び64 ソース言語
44 中間言語
46、56及び66 ターゲット言語
62 外部言語
80及び82 ピクチャー
100 UI画面
110 UI言語トグルボタン
112 カテゴリボタン
114 サブカテゴリボタン
116 アイコンソートボタン
118、140、142及び144 アイコン
120 アイコンシーケンスフィールド
122 ソース文フィールド
124 翻訳ボタン
126 ソース生成ボタン
128 クリアボタン
130 翻訳文フィールド
132 チェックボタン
150 翻訳システム
152 携帯機器
154 サーバコンピュータ
156 ネットワーク

【特許請求の範囲】
【請求項1】
タッチパネルディスプレイと関連して用いられるテキスト入力装置であって、
前記タッチパネルディスプレイに接続され、前記タッチパネルディスプレイにアイコンの組を表示する手段と、
前記タッチパネルディスプレイに接続され、ユーザによる前記タッチパネルディスプレイに表示された前記アイコンの1つ又は2つ以上のシーケンスの入力を受ける入力受信手段と、
前記タッチパネルディスプレイに接続され、前記入力受信手段を用いて前記ユーザによって入力されたアイコンのシーケンスを前記タッチパネルディスプレイに表示する手段と、
前記アイコンのシーケンスを所定の言語の完全型の文に翻訳する翻訳手段と、を含むテキスト入力装置。
【請求項2】
前記タッチパネルディスプレイ及び前記翻訳手段に接続され、前記翻訳手段によって翻訳された前記完全型の文を前記タッチパネルディスプレイに表示する手段をさらに含む、請求項1に記載のテキスト入力装置。
【請求項3】
各々が前記アイコンとそれぞれ関連する、前記所定の言語のフレーズを記憶する記憶手段と、
前記記憶手段及び前記入力受信手段に接続され、前記アイコンの各々について前記記憶手段から抽出されたフレーズを連結することにより外部言語のテキストを生成する手段とをさらに含み、
前記翻訳手段は、文の対のコーパスで前記外部言語のテキストを前記所定の言語の文に翻訳するように統計的にトレーニングされたフレーズベースの統計的機械翻訳ユニットを含み、前記対の各々は、前記所定言語の第1の語彙内の語を含むフレーズのシーケンスと、前記第1の語彙より大きい第2の語彙内の語を含む前記所定言語の文と、を含む、請求項1又は請求項2に記載のテキスト入力装置。
【請求項4】
前記第1の語彙は前記所定言語の内容語を含む、請求項3に記載のテキスト入力装置。
【請求項5】
前記統計的機械翻訳ユニットは、文仮説を構築するのに用いられるバイリンガルフレーズ対を、先行する部分的仮説の末尾にこれらのフレーズ対を追加することに関連するモデル確率とともに表す、探索グラフを出力するものであり、
前記文は、前記探索グラフにおいて最も尤度の高いな経路に対応する仮説である、請求項3又は請求項4に記載のテキスト入力装置。
【請求項6】
前記アイコンシーケンス中のアイコンの1つのユーザによる選択を受ける手段と、
前記ユーザの選択に応答して、前記探索グラフの前記ユーザによって選択された前記アイコンに対応するノードまでの部分から引出された複数個の部分仮説を示す手段と、をさらに含む、請求項5に記載のテキスト入力装置。
【請求項7】
請求項1から請求項6のいずれかに記載のテキスト入力装置と、
前記テキスト入力装置によって出力される前記文をターゲット言語の翻訳文に翻訳する統計的機械翻訳装置と、
前記翻訳文を前記タッチパネルディスプレイに表示する手段と、を含む、翻訳装置。
【請求項8】
前記タッチパネルディスプレイから予め規定されたコマンドを受ける手段と、
前記予め規定されたコマンドに応答して前記翻訳文を前記所定言語に逆翻訳し、前記逆翻訳された文を前記タッチパネルディスプレイに表示する手段と、をさらに含む、請求項7に記載の翻訳装置。
【請求項9】
タッチパネルディスプレイに関連してテキストを入力する方法であって、
前記タッチパネルディスプレイにアイコンの組を表示するステップと、
ユーザによる、前記タッチパネルディスプレイに表示された前記アイコンの1つまたは2つ以上のシーケンスの入力を受けるステップと、
前記受けるステップで入力されたアイコンのシーケンスを前記タッチパネルディスプレイに表示するステップと、
前記アイコンのシーケンスを所定の言語の完全型の文に翻訳するステップと、を含む、テキスト入力方法。
【請求項10】
コンピュータプログラムであって、タッチパネルディスプレイを備えたコンピュータを、
前記タッチパネルディスプレイに接続され、前記タッチパネルディスプレイにアイコンの組を表示する手段と、
前記タッチパネルディスプレイに接続され、ユーザによる前記タッチパネルディスプレイに表示された前記アイコンの1つ又は2つ以上のシーケンスの入力を受ける入力受信手段と、
前記タッチパネルディスプレイに接続され、前記入力受信手段を用いて前記ユーザによって入力されたアイコンのシーケンスを前記タッチパネルディスプレイに表示する手段と、
前記アイコンのシーケンスを所定の言語の完全型の文に翻訳する翻訳手段、として機能させる、コンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate


【公開番号】特開2012−164172(P2012−164172A)
【公開日】平成24年8月30日(2012.8.30)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−24518(P2011−24518)
【出願日】平成23年2月8日(2011.2.8)
【出願人】(301022471)独立行政法人情報通信研究機構 (1,071)
【Fターム(参考)】