説明

翻訳支援システム及びその方法及びそのプログラム

【課題】ユーザが訳文を入力する際に発生するユーザの入力負担を低減した翻訳支援システムを構成する。
【解決手段】翻訳支援システムのサブシステムは、第1翻訳単位を表示する第1翻訳単位表示手段と、第2翻訳単位に関連付けられた入力トークン及び訳文文字セット文字をユーザが選択的に入力可能な混合入力シーケンス入力手段とを具備する。前記第1翻訳単位は前記原文の一部又は全部を具備し、前記第2翻訳単位は前記第1翻訳単位の一部又は全部である。前記入力トークンは、前記第1翻訳単位内で前記第2翻訳単位の1つを特定可能である。前記第1翻訳単位表示手段は、前記第1翻訳単位を表示する際に、前記第2翻訳単位に関連付けられた前記入力トークンが具備する、前記第2翻訳単位が具備する原文文字セット文字をハイライト表示する。前記混合入力シーケンスをベースにして、コンピュータによって半自動的に訳文を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、翻訳支援システム及びその方法及びそのプログラムに関する。より具体的には、ユーザの入力負担を低減することによって、ユーザが自然な訳文を高速に作成することを可能とするための、翻訳支援システム及びその方法に関する。
【背景技術】
【0002】
翻訳の分野におけるコンピュータによる支援は、機械翻訳と翻訳支援ツールとに大別される。
【0003】
機械翻訳とは、文字通り機械による翻訳である。機械翻訳については、既にさまざまなアプリケーションが市販されている。しかしながら、本願の出願時点においては、機械翻訳によって出力された訳文の品質は一般に十分なものではないという問題がある。従って、機械翻訳によって出力された訳文の読み手には「この訳文は機械で翻訳したものである」という先験情報が与えられるとともに、読み手自身が訳文に修正を加えながら読むことが一般的である。特に、訳文を商品として扱う場合は、訳文に一定の品質が要求されることから、機械翻訳によって出力された訳文を、人手によって再度チェックする必要があり、従ってコストが発生するという問題がある。また、訳文をさらに自然な訳文に推敲する必要があるならば、その分さらに人手がかかり、従ってさらにコストが発生するという問題がある。また、機械翻訳では、例えば原文が不正確な文法で記載されていることによって、機械が原文を充分に分析することが不可能となり、結果として意味不明の訳文が出力されるなどの問題がある。
【0004】
翻訳支援ツールは、ユーザが訳文をコンピュータに入力する際に発生する入力負担を低減することを目的とする。例えば、図1で図示するように、訳語候補に関連付けた入力用符号を指示するインターフェースを具備するとともに、ユーザによる訳語の入力を、ユーザによる入力用符号の入力で代替可能にすることによって、入力負担を低減する従来技術がある。しかしながら、ユーザが入力用符号を参照する度に、ユーザが原文から訳語候補の一覧表示まで視線を移動させる必要があるという問題がある。さらに、通常入力用符号は、訳語候補内の訳語に対して訳語の表示順に割り当てたアルファベット、序数等の無意味な符号であることが多い。それによって、ユーザが符号を選択する際に、ユーザの思考が中断されることにより、ユーザに負担がかかるという問題がある。
【0005】
上述の機械翻訳も翻訳支援ツールも使用しない場合は、人手によって訳文を直接入力する必要がある。訳文の直接入力は、入力者にとって負担の多い作業となる問題がある。さらに、漢字文化圏の言語に翻訳する場合は、漢字変換操作も同時に必要である。漢字変換操作は、通常、誤変換が発生した場合に、提示された複数の同音異義語から入力者が1つを選択する及び/又は文節区切りを指定する操作を伴い、従って入力者にとって負担の多い操作であるという問題がある。
【0006】
また、ユーザが訳文をコンピュータに入力する際に発生する入力負担を低減するために、予め辞書内に、単語と入力用短縮コードとの組み合わせを登録し、入力用短縮コードの入力によって単語の入力が可能にする方法が既に提案されている(後述の先行技術文献参照)。しかしながら、この方法では、入力用短縮コードがすぐに不足してしまうという欠点と、前もってユーザが入力用短縮コードを暗記する必要があり、習熟を要する欠点とがある。また、入力用短縮コードの不足を補うために、入力用短縮コードの長さを長くすると、入力負担を軽減するという発明の目的が達成されない虞がある。
【0007】
もちろん、上述の機械翻訳と翻訳支援インターフェースとを組み合わせた製品も存在するが、それらの製品も本質的に上述と同様の問題を抱えている。一方で、自然な訳文を高速に作成することに対する需要は旺盛である。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2001−5807号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、上述の問題を解決することと翻訳作業を効率的に分業することとを目的とする。
【課題を解決するための手段】
【0010】
本発明による翻訳支援システムは、翻訳作業の効率的な分業を鑑み、複数のサブシステムによって構成する。もちろん、前記複数のサブシステムの少なくとも1つを組み合わせて実施しても良いことに留意する。
【0011】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
表示装置と、
入力装置と、
第1翻訳単位を原文文字セット文字で、前記表示装置によって表示する第1翻訳単位表示手段と、
入力トークン又は訳文文字セット文字の少なくとも1つを、ユーザが選択的に前記入力装置から入力することによって、入力トークン又は訳文文字セット文字との少なくとも1つを具備する混合入力シーケンスを前記ユーザに入力させる混合入力シーケンス入力手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記第1翻訳単位表示手段は、前記第1翻訳単位の一部又は全部を具備する第2翻訳単位に関連付けられた前記入力トークンが具備する原文文字セット文字の全てを、表示されている前記第1翻訳単位が具備する前記第2翻訳単位内でハイライト表示し、
前記入力トークンが具備する原文文字セット文字の全ての入力が、前記入力トークンの入力に必要であることを特徴とするサブシステムである。
【0012】
原文言語とは、翻訳元の言語である。訳文言語とは、翻訳先の言語である。原文とは、原文言語で書かれた翻訳対象の文章である。訳文とは、原文を訳文言語に翻訳した文章である。
【0013】
原文文字セットとは、表示装置によって原文を表示するのに使用可能な任意の文字セットのことである。訳文文字セットとは、表示装置によって訳文を表示するのに使用可能な任意の文字セットのことである。原文文字セットと訳文文字セットとは、共通の文字を具備しても良い。原文文字セット文字とは、原文文字セット内の任意の文字のことである。訳文文字セット文字とは、訳文文字セット内の任意の文字のことである。
【0014】
ハイライト表示とは、表示装置によって表示されている特定の部分を、前記表示装置のユーザが視認によって特定することが可能である任意の表示のことである。ハイライト表示は、例えば、文字色、背景色、装飾、フォントの少なくとも1つで特定の部分を他の部分と区別する表示であっても良い。
【0015】
同値関係とは、公知であるように、反射律、対称律、及び推移律を満たす任意の関係である。例えば、任意の2つの第2翻訳単位に対して、それぞれを原文文字セット文字で表示した場合に空白文字を除いて同一の表示となる場合に限り、前記2つの第2翻訳単位は同値であるとして定義しても良い。その他、例えば、第1翻訳単位内の第2翻訳単位の位置情報の有無、品詞の違いの有無、単数形複数形の違いの有無を考慮しても良い。第2翻訳単位の同値類とは、前記第2翻訳単位に同値である第2翻訳単位の集合である。
【0016】
第1翻訳単位は、次に説明するコンピュータの格納手段に格納されているものでも良いが、表示装置を有するクライアントコンピュータがインターネット接続するサーバコンピュータ内に格納されても良い。クライアントコンピュータは、第1翻訳単位を画像形式のデータとして受信しても良い。
【0017】
本発明のさらなる構成は、
格納手段を有するコンピュータと、
原文を受信するとともに前記格納手段に格納する原文受信手段と、
空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
前記格納手段に格納された原文に対して、少なくとも1つの第1翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第1翻訳単位決定手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
をさらに具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするサブシステムである。
【0018】
ここでいう原文の受信とは、公知の仕方による受信であっても良い。公知の仕方とは、例えば、揮発性/不揮発性記憶装置からの読み出し、ネットワークを介した受信であっても良い。
【0019】
ここでいうコンピュータとは、必ずしも特定の形態のコンピュータである必要はなく、スタンドアロン型コンピュータや、ネットワークで接続され複数のCPUで分散処理する少なくとも1つのコンピュータや、クライアントサーバー形式で処理を分担する少なくとも1つのコンピュータ等、さまざまな形態のコンピュータであっても良い。
【0020】
本発明のさらなる構成は、
格納手段を有するコンピュータと、
原文を受信するとともに前記格納手段に格納する原文受信手段と、
前記原文を前記表示装置によって表示する原文表示手段と、
ユーザが前記入力装置を使用することによって、表示された原文内からユーザに第1翻訳単位を選択させるとともに前記格納手段に格納する第1翻訳単位選択手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
前記第1翻訳単位決定手段に対して、空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
をさらに具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするサブシステムである。
【0021】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
表示装置と、
格納手段を有するコンピュータと、
前記格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位の同値類に表示トークンを前記コンピュータによって関連付けるとともに前記格納手段に格納する表示トークン関連付け手段と、
前記格納手段に格納された混合シーケンス内で、1つの訳語が関連付けられていない第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた表示トークンで置換されるとともに、1つの訳語が関連付けられた第2翻訳単位の同値類は、前記1つの訳語で置換されることによって生成される混合表示シーケンスを、前記コンピュータによって生成するとともに前記格納手段に格納する混合表示シーケンス生成手段と、
前記格納手段に格納された前記混合表示シーケンスを、前記表示装置によって表示する混合表示シーケンス表示手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするサブシステムである。
【0022】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
格納手段を有するコンピュータと、
前記格納手段に格納された混合シーケンスをベースとして、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記格納手段に格納された前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに、前記格納手段に格納された前記訳語候補内の1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするサブシステムである。
【0023】
本発明のさらなる構成は、
前記訳語候補内の1つの訳語は、前記訳語候補内で所定の優先度が最大の1つであることを特徴とするサブシステムである。
【0024】
本発明のさらなる構成は、
入力装置と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つを、前記ユーザに選択させる置換対象選択手段と、
前記混合シーケンスをベースとして、前記第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記訳語候補を、前記表示装置によって一覧表示する訳語候補表示手段と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記訳語候補内の1つの訳語を前記ユーザに選択させる訳語候補選択手段と、
前記混合シーケンス内の、前記第2翻訳単位の同値類の少なくとも1つに、前記ユーザに選択させた前記1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
をさらに具備することを特徴とするサブシステムである。
【0025】
本発明のさらなる構成は、
前記訳語候補決定手段は、前記訳語候補内の訳語の品詞及び/又は活用形を、前記混合シーケンスが具備する訳文文字セット文字に依存して決定することを特徴とするサブシステムである。
【0026】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
表示装置と、
格納手段を有するコンピュータと、
前記格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位に同値である第2翻訳単位の、前記第1翻訳単位内での出現回数である第1出現回数を、前記コンピュータによってカウントする第1出現回数カウント手段と、
前記格納手段に格納された混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類に同値である第2翻訳単位の同値類の、前記混合シーケンス内での出現回数である第2出現回数を、前記コンピュータによってカウントする第2出現回数カウント手段と、
前記第1翻訳単位が具備する第2翻訳単位に対してカウントされた前記第1出現回数と、前記第2翻訳単位の同値類に対してカウントされた前記第2出現回数とを、前記コンピュータによって比較する出現回数比較手段と、
前記第1翻訳単位を原文文字セット文字で、前記表示装置によって表示する第1翻訳単位表示手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備し、
前記第1翻訳単位表示手段は、前記第1翻訳単位が具備する第2翻訳単位を、前記比較の結果に依存して、表示される前記第1翻訳単位内でハイライト表示することを特徴とするサブシステムである。
【0027】
所与の2つの第2翻訳単位の同値類には、第2翻訳単位の同値関係から自然に定義される同値関係を定義する。即ち、所与の2つの第2翻訳単位の同値類は、それぞれの第2翻訳単位の同値類の代表元が同値である場合に限り、同値である。
【0028】
第1翻訳単位は、原文文字セット文字で表された原文内の少なくとも1つの文であっても良い。第2翻訳単位は、1つの文内の少なくとも1つの単語であっても良い。

【0029】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示段階と、
入力トークン又は訳文文字セット文字の少なくとも1つを、ユーザが選択的に入力装置から入力することによって、入力トークン又は訳文文字セット文字との少なくとも1つを具備する混合入力シーケンスを前記ユーザに入力させる混合入力シーケンス入力段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記第1翻訳単位表示段階は、前記第1翻訳単位の一部又は全部を具備する第2翻訳単位に関連付けられた前記入力トークンが具備する原文文字セット文字の全てを、表示されている前記第1翻訳単位が具備する前記第2翻訳単位内でハイライト表示し、
前記入力トークンが具備する原文文字セット文字の全ての入力が、前記入力トークンの入力に必要であることを特徴とする方法である。
【0030】
本発明のさらなる構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
原文を受信するとともに格納手段に格納する原文受信段階と、
空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化段階と、
前記格納手段に格納された原文に対して、少なくとも1つの第1翻訳単位を、コンピュータによって決定するとともに前記格納手段に格納する第1翻訳単位決定段階と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定段階と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け段階と、
前記混合入力シーケンス入力段階によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入段階と、
をさらに具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする請求項10に記載の方法である。
【0031】
本発明のさらなる構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
原文を受信するとともに格納手段に格納する原文受信段階と、
前記原文を前記表示装置によって表示する原文表示段階と、
ユーザが前記入力装置を使用することによって、表示された原文内からユーザに第1翻訳単位を選択させるとともに前記格納手段に格納する第1翻訳単位選択段階と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定段階と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け段階と、
前記第1翻訳単位決定段階に対して、空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化段階と、
混合入力シーケンス入力段階によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入段階と、
をさらに具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする方法である。
【0032】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位の同値類に表示トークンをコンピュータによって関連付けるとともに前記格納手段に格納する表示トークン関連付け段階と、
前記格納手段に格納された混合シーケンス内で、1つの訳語が関連付けられていない第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた表示トークンで置換されるとともに、1つの訳語が関連付けられた第2翻訳単位の同値類は、前記1つの訳語で置換されることによって生成される混合表示シーケンスを、前記コンピュータによって生成するとともに前記格納手段に格納する混合表示シーケンス生成段階と、
前記格納手段に格納された前記混合表示シーケンスを、表示装置によって表示する混合表示シーケンス表示段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする方法である。
【0033】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
格納手段に格納された混合シーケンスをベースとして、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定段階と、
前記格納手段に格納された前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに、前記格納手段に格納された前記訳語候補内の1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする方法である。
【0034】
本発明のさらなる構成は、
前記訳語候補内の1つの訳語は、前記訳語候補内で所定の優先度が最大の1つであることを特徴とする方法である。
【0035】
本発明のさらなる構成は、
ユーザが前記表示装置及び入力装置を使用することによって、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つを、前記ユーザに選択させる置換対象選択段階と、
前記混合シーケンスをベースとして、前記第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定段階と、
前記訳語候補を、前記表示装置によって一覧表示する訳語候補表示段階と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記訳語候補内の1つの訳語を前記ユーザに選択させる訳語候補選択段階と、
前記混合シーケンス内の、前記第2翻訳単位の同値類の少なくとも1つに、前記ユーザに選択させた前記1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け段階と、
をさらに具備することを特徴とする方法である。
【0036】
本発明のさらなる構成は、
前記訳語候補決定段階は、前記訳語候補内の訳語の品詞及び/又は活用形を、前記混合シーケンスが具備する訳文文字セット文字に依存して決定することを特徴とする方法である。
【0037】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位に同値である第2翻訳単位の、前記第1翻訳単位内での出現回数である第1出現回数を、コンピュータによってカウントする第1出現回数カウント段階と、
前記格納手段に格納された混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類に同値である第2翻訳単位の同値類の、前記混合シーケンス内での出現回数である第2出現回数を、前記コンピュータによってカウントする第2出現回数カウント段階と、
前記第1翻訳単位が具備する第2翻訳単位に対してカウントされた前記第1出現回数と、前記第2翻訳単位の同値類に対してカウントされた前記第2出現回数とを、前記コンピュータによって比較する出現回数比較段階と、
前記第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備し、
前記第1翻訳単位表示段階は、前記第1翻訳単位が具備する第2翻訳単位を、前記比較の結果に依存して、表示される前記第1翻訳単位内でハイライト表示することを特徴とする方法である。
【0038】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示手段と、
入力トークン又は訳文文字セット文字の少なくとも1つを、ユーザが選択的に入力装置から入力することによって、入力トークン又は訳文文字セット文字との少なくとも1つを具備する混合入力シーケンスを前記ユーザに入力させる混合入力シーケンス入力手段と、
して機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記第1翻訳単位表示手段は、前記第1翻訳単位の一部又は全部を具備する第2翻訳単位に関連付けられた前記入力トークンが具備する原文文字セット文字の全てを、表示されている前記第1翻訳単位が具備する前記第2翻訳単位内でハイライト表示し、
前記入力トークンが具備する原文文字セット文字の全ての入力が、前記入力トークンの入力に必要であることを特徴とするプログラムである。
【0039】
本発明のさらなる構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
原文を受信するとともに格納手段に格納する原文受信手段と、
空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
前記格納手段に格納された原文に対して、少なくとも1つの第1翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第1翻訳単位決定手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
前記混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
としてさらに機能させ、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするプログラムである。
【0040】
本発明のさらなる構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段を有するコンピュータと、
原文を受信するとともに格納手段に格納する原文受信手段と、
前記原文を前記表示装置によって表示する原文表示手段と、
ユーザが前記入力装置を使用することによって、表示された原文内からユーザに第1翻訳単位を選択させるとともに前記格納手段に格納する第1翻訳単位選択手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
前記第1翻訳単位決定手段に対して、空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
してさらに機能させ、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするプログラムである。
【0041】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段を有するコンピュータと、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位の同値類に表示トークンを前記コンピュータによって関連付けるとともに前記格納手段に格納する表示トークン関連付け手段と、
前記格納手段に格納された混合シーケンス内で、1つの訳語が関連付けられていない第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた表示トークンで置換されるとともに、1つの訳語が関連付けられた第2翻訳単位の同値類は、前記1つの訳語で置換されることによって生成される混合表示シーケンスを、前記コンピュータによって生成するとともに前記格納手段に格納する混合表示シーケンス生成手段と、
前記格納手段に格納された前記混合表示シーケンスを、表示装置によって表示する混合表示シーケンス表示手段と、
して機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするプログラムである。
【0042】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段に格納された混合シーケンスをベースとして、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記格納手段に格納された前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに、前記格納手段に格納された前記訳語候補内の1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
して機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするプログラムである。
【0043】
本発明のさらなる構成は、
前記訳語候補内の1つの訳語は、前記訳語候補内で所定の優先度が最大の1つであることを特徴とするプログラムである。
【0044】
本発明のさらなる構成は、
ユーザが前記表示装置及び入力装置を使用することによって、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つを、前記ユーザに選択させる置換対象選択手段と、
前記混合シーケンスをベースとして、前記第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記訳語候補を、前記表示装置によって一覧表示する訳語候補表示手段と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記訳語候補内の1つの訳語を前記ユーザに選択させる訳語候補選択手段と、
前記混合シーケンス内の、前記第2翻訳単位の同値類の少なくとも1つに、前記ユーザに選択させた前記1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
してさらに機能させることを特徴とするプログラムである。
【0045】
本発明のさらなる構成は、
前記訳語候補決定手段は、前記訳語候補内の訳語の品詞及び/又は活用形を、前記混合シーケンスが具備する訳文文字セット文字に依存して決定することを特徴とするプログラムである。
【0046】
本発明の一構成は、
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位に同値である第2翻訳単位の、前記第1翻訳単位内での出現回数である第1出現回数を、前記コンピュータによってカウントする第1出現回数カウント手段と、
前記格納手段に格納された混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類に同値である第2翻訳単位の同値類の、前記混合シーケンス内での出現回数である第2出現回数を、前記コンピュータによってカウントする第2出現回数カウント手段と、
前記第1翻訳単位が具備する第2翻訳単位に対してカウントされた前記第1出現回数と、前記第2翻訳単位の同値類に対してカウントされた前記第2出現回数とを、前記コンピュータによって比較する出現回数比較手段と、
前記第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示手段と、
として機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備し、
前記第1翻訳単位表示手段は、前記第1翻訳単位が具備する第2翻訳単位を、前記比較の結果に依存して、表示される前記第1翻訳単位内でハイライト表示することを特徴とするプログラムである。
【図面の簡単な説明】
【0047】
【図1】図1は、従来技術による翻訳支援システムの実施例を示している。
【図2】図2は、本発明による翻訳支援システムの実施例を示している。
【図3】図3は、本発明による翻訳支援システムの表示装置が表示する画面の実施例を示している。
【図4】図4は、本発明による翻訳支援システムの表示装置の第1翻訳単位表示部が表示するハイライト表示された第1翻訳単位の実施例を図示している。
【図5】図5は、本発明による翻訳支援システムでの、ユーザが入力した混合入力シーケンスと、混合表示シーケンス表示部との対応関係の実施例を、時間軸に沿って図示している。
【図6】図6は、本発明による翻訳支援システムで、決定された訳語候補から、ユーザが1つの訳語を選択するための選択肢決定ウィンドウを表示する実施例を図示している。
【図7】図7は、本発明による翻訳支援システムで、決定された訳語候補から、ユーザが1つの訳語を選択するための選択肢決定ウィンドウを表示する実施例を図示している。
【図8】図8は、本発明による翻訳支援システムの翻訳チェック支援画面の実施例を図示している。
【図9】図9は、本発明による翻訳支援システムの入力トークン関連付け手段の一実施形態を説明するためのプログラムである。
【図10】図10は、本発明による翻訳支援システムの入力トークン関連付け手段の一実施形態を説明するためのプログラムである。
【図11】図11は、本発明による翻訳支援システムの入力トークン関連付け手段の一実施形態を説明するためのプログラムである。
【図12】図12は、本発明の一実施形態を表すフローチャートである。
【図13】図13は、本発明の第1翻訳単位の訳文生成の一実施形態を表すフローチャートである。
【図14】図14は、本発明の混合表示シーケンス表示の一実施形態を表すフローチャートである。
【図15】図15は、本発明の訳語関連付けの一実施形態を表すフローチャートである。
【図16】図16は、本発明の訳語置換の一実施形態を表すフローチャートである。
【発明を実施するための形態】
【0048】
本発明の他の特徴及び利点は、添付図面を参照した本発明の実施形態の後述の説明から明らかになる。
【0049】
以下では、原文言語として英語を、訳文言語として日本語を例として説明するが、これは例示的かつ非限定的な実施形態であることに留意する。本発明の範囲は、原文言語と訳文言語とが任意の言語を対象とする場合を含むことに留意する。以下では、任意の2つの第2翻訳単位に対して、前記2つの第2翻訳単位のそれぞれが具備する原文の一部又は全部を原文文字セット文字で表したものが、原文文字セット文字列として等しい場合に限り、前記2つの第2翻訳単位は同値であると定義して説明するが、これは例示的かつ非限定的な実施形態であることに留意する。本発明の範囲は、第2翻訳単位に定義された任意の同値関係を含むことに留意する。
【0050】
以下の説明では、簡潔を旨とするために、コンピュータによる処理によって生成されたオブジェクトをコンピュータの格納手段に格納することについての記載は、当業者に自明な事項として省略されていることに留意する。
【0051】
図2は、本発明の翻訳支援システムの本発明の代表的実施形態を示している。この実施形態は、表示装置であるコンピュータディスプレイ装置200と、入力装置であるキーボード210と、コンピュータ220とを具備する。
【0052】
表示装置であるコンピュータディスプレイ装置は、CRTディスプレイ、液晶ディスプレイ等、コンピュータの指示によって表示内容を変更可能な任意の装置で良く、カラー表示可能であるのが好ましい。
【0053】
入力装置としては、キーボードを使用する代わりに、スクリーンタッチパネル、タブレット、音声認識等、ユーザが文字をコンピュータに入力可能な任意の装置の少なくとも1つの組み合わせを使用しても良い。
【0054】
図3は、第1翻訳単位の表示と混合表示シーケンスの表示との、本発明の代表的実施形態での例示的かつ非限定的な実施例を示している。図3は、コンピュータディスプレイ装置300上の画面300が、第1翻訳単位を表示する第1翻訳単位表示部310と、混合表示シーケンスを表示する混合表示シーケンス表示部320とを具備する様子を示している。
【0055】
図3では、1つの第1翻訳単位である、原文文字セット文字で表された文を画面上に表示しているが、例えば、文章全体、段落全体等、複数の第1翻訳単位を画面上に表示しても良い。
【0056】
本発明の代表的実施形態では、コンピュータが翻訳対象の原文を、翻訳に適した単位である少なくとも1つの文に分割し、前記文を第1翻訳単位として決定する。例えば、原文文字セット文字で表された原文を、コンピュータによって実行されるパーサが1文字ずつパースするとともに、前記1文字がピリオド、セミコロン等のパンクチュエーション文字と判定されるごとに、既にパースされた部分を、前記パーサが文として切り出すことによって、前記コンピュータが原文を少なくとも1つの文に分割しても良い。
【0057】
例えば、「Dr.」、「e.g.」等が具備する文中のピリオドは、パンクチュエーション文字として扱わないのが好ましいことに留意する。例えば、ピリオドを具備する原文言語の単語一覧を、予めコンピュータの揮発性/不揮発性記憶手段に格納するとともに、前記パーサがパースした1文字がピリオドであるごとに、前記ピリオドの前後の少なくとも1つの原文文字セット文字が、前記単語一覧内の単語を具備するか否かを、前記パーサによって判定するとともに、具備すると判定された場合には、前記パーサによって前記ピリオドをパンクチュエーション文字として扱わないようにしても良い。
【0058】
また、コンピュータが第1翻訳単位を決定する代わりに、表示装置が原文を画面上に表示するとともに、画面上に表示されたテキストに対して、公知の選択手段をユーザに使用させることによって、原文の一部をユーザに選択させるとともに、選択された前記原文の一部を第1翻訳単位としても良い。公知の選択手段は、テキスト範囲指定による選択であっても良い。
【0059】
本発明の代表的実施形態では、コンピュータが第1翻訳単位である1つの文を、少なくとも1つの単語に分割するとともに、前記少なくとも1つの単語のいくつかを第2翻訳単位として決定する。例えば、原文文字セット文字で表された文を1文字ずつパースするとともに、前記1文字が空白、カンマ、括弧等のセパレータ文字と判定されるごとに、既にパースされた部分を前記パーサが単語として切り出すとともに、切り出された単語の少なくとも1つを第2翻訳単位として前記コンピュータが決定しても良い。<表1>に例示的かつ非限定的な実施例を示す。
【0060】
【表1】

【0061】
第2翻訳単位で第1翻訳単位の全体を構成する必要はないことに留意する。例えば、<表1>の例1では、第1翻訳単位「This computer is used by him.」内の単語「is」、「by」は、第2翻訳単位ではない。このように、対応する訳語の入力負担が少ない単語を、第2翻訳単位として決定される対象から除いても良い。
【0062】
第2翻訳単位は、複数の単語を具備しても良いことに留意する。例えば、<表1>の例4では、フレーズ「Internet Infrastructure」が1つの第2翻訳単位である。
【0063】
例えば、数詞「1,234,567」が具備する単語中のカンマは、前後の空白文字とともに、前記セパレータ文字として扱わないのが好ましい。そのような規則を予め正規表現で定義しておき、前記パースの際に、前記正規表現にマッチする原文内の部分文字セット文字列内の文字を、前記パーサがセパレータ文字として扱わないようにしても良い。
【0064】
第2翻訳単位の選択基準として、原文言語の品詞を使用しても良い。例えば、公知技術によって、第1翻訳単位内の少なくとも1つの単語の品詞を判定するとともに、前記品詞が名詞又は名詞句である場合に限り、前記少なくとも1つの単語を第2翻訳単位として決定しても良い。その場合、第1翻訳単位内の名詞でも名詞句でもない単語に対する訳語は、ユーザが訳文文字セット文字で直接入力する必要があるが、それにもかかわらず、訳語の長さが長い名詞又は名詞句が原文内に繰り返し現れる場合に、本発明は有用である。
また、例えば、コンピュータが具備する揮発性/不揮発性記憶手段内に、予め第2翻訳単位として決定可能である、原文文字セット文字からなる文字列の一覧を格納しても良い。
【0065】
本発明の代表的実施形態では、第1翻訳単位が具備する第2翻訳単位に、それぞれ入力トークンを、前記第1翻訳単位内で、前記第2翻訳単位の同値類を特定することが可能であるように、コンピュータによって関連付ける。<表2>に例示的かつ非限定的な実施例を示す。
【0066】
【表2】

【0067】
例えば、<表2>の例1のように、第1翻訳単位「This computer is used by him.」が、第2翻訳単位「This」と、「computer」と、「used」と、「him」とを具備する場合、それぞれの第2翻訳単位に対して、それぞれ入力トークン<T>と、<c>と、<u>と、<h>とを関連付けても良い。ここで、例えば<T>は、原文文字セット文字「T」を具備する入力トークンを表す。また、例えば第1翻訳単位「Development of Internet Infrastructure」が、第2翻訳単位「Internet」と第2翻訳単位「Infrastructure」とを具備する場合、それぞれの第2翻訳単位に対して、<表2>の例3−1のように、それぞれ入力トークン<int>と、<inf>とを関連付けても良いし、<表2>の例3−2のように、それぞれ入力トークン<i>と、<f>とを関連付けても良い。
【0068】
このように、第2翻訳単位に入力トークンを関連付ける関連付け方は1通りとは限らないことに留意する。例えば、出現頻度の高い第2翻訳単位にはより長さの短い入力トークンを関連付けても良い。それにより、入力トークンの入力に必要なキータイプの総数がより低減される。
【0069】
入力トークンが具備する第2翻訳単位内の原文文字セット文字で、慣用的に混同される文字、例えば大文字と小文字とを、区別しても良いし、混同しても良いことに留意する。混同する場合は、第2翻訳単位の同値類の特定に関して混同も考慮すべきことに留意する。即ち、混同する場合は、混同に関らず、入力トークンによって第2翻訳単位を特定することが可能である必要がある。
【0070】
また、第2翻訳単位に対して入力トークンを関連付ける代わりに、第2翻訳単位の同値類に対して入力トークンを関連付けても良い。
【0071】
第1翻訳単位内の少なくとも1つの単語を、複数の第2翻訳単位が具備しても良く、前記複数の第2翻訳単位がそれぞれ特定可能であるように入力トークンを関連付けても良い。例えば、<表2>の例3−2及び例4の第1翻訳単位「Development of Internet Infrastructure」に対して、<表2>の例3−2の第2翻訳単位及び入力トークンの関連付けと、<表2>の例4の第2翻訳単位及び入力トークンの関連付けとを同時に使用しても良い。この場合、入力トークン<t>によって、第2翻訳単位の同値類[Internet Infrastructure]が特定されるとともに、入力トークン<i>によって、第2翻訳単位の同値類[Internet]が特定される。ここで、例えば[Internet Infrastructure]は、第2翻訳単位「Internet Infrastructure」の同値類を表す。
【0072】
サブスクリプト、スーパースクリプトを具備する第2翻訳単位に対して、入力トークンを関連付けても良い。例えば、<表2>の例5のように、第2翻訳単位「CH3COOH」に対して、「CH3COOH」の部分文字列「co」を入力トークンとしても良い。このようにすると、従来手段を使用して訳文内でサブスクリプト、スーパースクリプトを設定するという、ユーザの手間を省略可能である。
【0073】
図9,10,11に、第1翻訳単位が具備する少なくとも1つの第2翻訳単位に対して、入力トークンを関連付けるプログラム例を示す。まず、前記プログラム例の呼び出し側で、InputTokenGeneratorインスタンスを生成する。次いで、前記第1翻訳単位が具備する少なくとも1つの第2翻訳単位の全てに対して、それぞれ前記第2翻訳単位を引数として、前記インスタンス上でregisterSecondTranslationUnitを呼び出す。次いで、前記第1翻訳単位が具備する少なくとも1つの第2翻訳単位の全てに対して、前記第2翻訳単位を引数として、前記インスタンス上でbuildInputTokenForRegisteredSecondTranslationUnitを呼び出すと、前記第2翻訳単位のinputTokenメンバ変数に、前記第2翻訳単位に関連付けられる入力トークンが格納される。ここで、図9,10,11のプログラム例は、本発明の代表的実施形態による入力トークン関連付けの一実施形態を、簡潔を旨として説明するための、エラー処理が省略された例示的かつ非限定的なプログラムに過ぎず、本発明の範囲を限定するものではないことに留意する。図9,10,11のプログラム例は他のプログラム言語で記載されても良く、また種々の最適化及び機能拡張及び入力トークンを関連付ける他のアルゴリズムは、当業者には容易に想到可能である。
【0074】
入力トークンが具備する文字以外の文字の入力を、前記入力トークンの入力がさらに要求しても良いことに留意する。例えば、入力トークンの入力終了を指示するための終端文字として、ピリオドの入力をさらに要求しても良い。
【0075】
本発明の代表的実施形態では、第1翻訳単位を表示装置によって表示する際に、前記第1翻訳単位が具備する第2翻訳単位に関連付けられた前記入力トークンが具備する、原文文字セット文字の少なくとも1つの全てを、表示される前記第1翻訳単位が具備する前記第2翻訳単位内でハイライト表示する。図4に、例示的かつ非限定的な実施例を示す。<表2>の例1,2,3−1,3−2,4,5の第1翻訳単位は、それぞれ図4の401,402,403−1,403−2,404−1,405のように表示される。図3の第1翻訳単位表示部310は、図4の402の実施例を表示している。
【0076】
図4に示した実施例では、黒枠で囲う表示をハイライト表示としているが、例えば、背景の色彩を変更する表示や、フォントを変更する表示や、装飾をする表示等を適切に組み合わせたものをハイライト表示としても良い。
【0077】
図4の404−2に示したように、第2翻訳単位が原文内の複数の単語を具備することを、ユーザが視認可能な形式で表示しても良い。
【0078】
原文に対して第1翻訳単位及び第2翻訳単位を決定する際に、前記第1翻訳単位及び前記第2翻訳単位に空白文字を適切に挿入及び/又は付加するとともに、前記第2翻訳単位に関連付ける入力トークンに、対応する空白文字を挿入及び/又は付加しても良い。この場合、前記第1翻訳単位を表示する際に、前記第1翻訳単位内の第2翻訳単位に挿入及び/又は付加された、前記対応する空白文字も、同時にハイライト表示される。
【0079】
本発明の代表的実施形態では、第2翻訳単位の同値類に、それぞれ表示トークンを、コンピュータによって関連付ける。<表3>に例示的かつ非限定的な実施例を示す。
【0080】
【表3】

【0081】
<表3>の例1〜3は、第2翻訳単位の同値類[configured]に関連付ける表示トークンの実施例である。<表3>の例1は、前記第2翻訳単位の同値類が具備する原文文字セット文字「configured」をそのまま表示トークンとして前記第2翻訳単位の同値類に関連付ける実施例である。<表3>の例2は、前記第2翻訳単位の同値類が具備する原文文字セット文字を「${}」で囲ったものを表示トークンとして前記第2翻訳単位の同値類に関連付ける実施例である。<表3>の例3は、前記第2翻訳単位の同値類が具備する単語「configured」の活用形を変更したものを表示トークンとして前記第2翻訳単位の同値類に関連付ける実施例である。このように、適宜品詞及び/又は活用形の変更をしても良い。<表3>の例4は、例2の実施例と例3の実施例とを組み合わせた実施例である。
【0082】
<表3>の例5は、第2翻訳単位の同値類[Internet Infrastructure]に関連付ける表示トークンの実施例である。<表3>の例5は、前記第2翻訳単位の同値類が具備する原文文字セット文字を一括りに「${}」で囲ったものを表示トークンとして前記第2翻訳単位に関連付ける実施例である。
【0083】
<表3>の例6〜8は、第2翻訳単位の同値類[CH3COOH]に関連付ける表示トークンの実施例である。<表3>の例6は、前記第2翻訳単位の同値類の原文文字セット文字「CH3COOH」を「${}」で囲ったものを表示トークンとして前記第2翻訳単位に関連付ける実施例である。<表3>の例7、例8は、前記第2翻訳単位の同値類の原文文字セット文字を、それぞれ大文字又は小文字に変換するとともに、スーパースクリプト及び/又はサブスクリプトを解除したものを表示トークンとして前記第2翻訳単位に関連付ける実施例である。
【0084】
このように、表示トークンは、ユーザが視認によって第2翻訳単位の同値類を直感的に把握可能であるのが好ましい。
【0085】
混合入力シーケンスの入力と、訳文文字セット文字又は第2翻訳単位の同値類の混合シーケンスへの付加と、混合表示シーケンスの生成と、混合表示シーケンスの表示との本発明の代表的実施形態を、<表2>の例1に示した、第1翻訳単位、第2翻訳単位、及び入力トークンを例にとって説明する。
【0086】
図5は、混合入力シーケンスの入力に従う混合表示シーケンス表示部の表示変化の、本発明の代表的実施形態での例示的かつ非限定的な実施例を示している。図5は、入力装置がキーボードである場合の、混合入力シーケンスの入力502に対する混合表示シーケンス表示部の表示の変化503を、時間軸501に沿って示している。前記混合表示シーケンス表示部は、テキストカーソル504を具備している。ここで、訳文言語文字セットの入力の仕方は、例えば日本語であれば、かな入力、ローマ字入力等公知の仕方によっても良いことに留意する。
【0087】
最初は、混合シーケンスは空であるとともに、前記混合表示シーケンス表示部の内容は空である。次いで、ユーザがキーボードでAltキーを押下しながら「t」キーを押下すると、混合入力シーケンス<t>が入力される。次いで、前記混合入力シーケンスが具備する入力トークン<t>で特定される第2翻訳単位の同値類[This]が、前記混合シーケンスに付加されて、前記混合シーケンスは[This]になる。次いで、混合シーケンス[This]が具備する第2翻訳単位の同値類[This]を、前記第2翻訳単位の同値類に関連付けられた表示トークン「${This}」で置換することによって、混合表示シーケンス「${This}」が生成される。次いで、混合表示シーケンス「${This}」が、前記混合表示シーケンス表示部に表示される。混合シーケンスをコンピュータが有する格納手段に格納する仕方は、当業者には容易に想到可能であるので、説明は省略する。
【0088】
次いで、ユーザが日本語入力モードで訳文文字セット文字「は、」を直接入力すると、混合入力シーケンス「は、」が入力される。次いで、混合入力シーケンス「は、」が、前記混合シーケンスに付加されて、前記混合シーケンスは、[This]「は、」になる。次いで、混合表示シーケンス「${This}」「は、」が、前記混合表示シーケンス表示部に表示される。
【0089】
次いで、図5に示されるようにユーザが入力すると、前記混合シーケンスは、[This][computer]「は、」[him]「によって」[used]「されている。」になるとともに、前記混合表示シーケンス表示部に、生成された混合表示シーケンス「${This}」「${computer}」「は、」「${him}」「によって」「${used}」「されている。」が表示される。
【0090】
混合表示シーケンス表示部は、通常のテキスト編集画面として使用可能であっても良い。例えば、混合表示シーケンス表示部で、表示トークン「${This}」を削除するために、ユーザは公知のテキストカーソル移動操作によってテキストカーソルを移動させるとともに、公知のテキスト編集操作によって表示トークン「${This}」を削除すれば良い。ここで、表示トークンはカーソル移動に関して1文字とみなすのが好ましい。即ち、表示トークンの一部のみを編集することは禁止されるのが好ましい。また、入力トークンが入力された際に、前記テキストカーソルによって指示される前記混合表示シーケンス内の位置に対応する前記混合シーケンス内の位置に、前記入力トークンで特定される第2翻訳単位の同値類を挿入するとともに、対応する混合表示シーケンスを生成するとともに表示しても良い。
【0091】
混合表示シーケンス表示部が通常のテキスト編集画面としても使用可能である場合には、ユーザが前記混合表示シーケンス表示部に訳文文字セット文字を直接入力することも可能である。従って、例えば、ユーザが細かく助詞を使い分けることが可能となることによって、より高品質の訳文を作成することが前記ユーザにとってより容易となることが、本発明の重要な利点の1つである。
【0092】
図3を参照すると、本発明を実施する際には、ユーザの入力作業に伴うユーザの視線移動が、第1翻訳単位表示部と混合表示シーケンス表示部との間の往復に限定されることが理解される。このように、図1の従来技術を実施する際に発生するような画面上の3点間以上でのユーザの視線移動が発生しないので、ユーザの作業負担が軽減されることが、本発明の重要な利点の1つである。
【0093】
<表2>の例3−1の第1翻訳単位、第2翻訳単位、及びトークンの実施例を参照する。ユーザがキーボードでAltキーを押下しながら、「i」に続けて「n」を押下した段階では、ユーザが入力トークン<int>を入力しているのか、入力トークン<inf>を入力しているのか特定できない。そこで、本発明の一実施形態では、入力トークンが具備する原文文字セット文字をユーザが一部入力した時点で、その後に特定される可能性のある第2翻訳単位の全てを、入力トークンが具備する第2翻訳単位内の文字のハイライトとは独立に、ハイライト表示しても良い。この場合、入力トークン<int>に関連付けられた第2翻訳単位「Internet」と、入力トークン<inf>に関連付けられた第2翻訳単位「Infrastructure」のみがハイライト表示される。
【0094】
混合入力シーケンスの入力が終了した時点で、ユーザに入力終了を通知させるために、例えば、画面に表示されている他の第1翻訳単位の上にユーザがフォーカスを移動させることによって、前記ユーザに入力終了を通知させても良いし、画面に「入力終了」ボタンを表示するとともに、ユーザが前記「入力終了」ボタンを押下することによって、前記ユーザに入力終了を通知させても良いし、特定のキーをユーザが押下することによって、前記ユーザに入力終了を通知させても良い。
【0095】
第2翻訳単位に対する訳語を訳文文字セット文字で直接入力するのに必要なキータイプ数と比較して、前記第2翻訳単位又は前記第2翻訳単位の同値類に関連付けられた入力トークンを入力するのに必要なキータイプ数が非常に少ないことに注目する。図5を参照する。第2翻訳単位の同値類[computer]に対応する入力トークン<c>の入力に必要なキータイプ数は、Altキーの押下を含めて2回である。一方で、第2翻訳単位「computer」に対応する訳語「コンピュータ」を訳文文字セット文字で直接入力するのに必要なキータイプ数は、カタカナ入力モードで少なくとも7回、より一般的に使用されるローマ字入力モードで約10回である。即ち、第2翻訳単位の同値類[computer]の入力に関しては、関連付けられた入力トークンで入力することによって、必要なキータイプ数が4分の1から5分の1に低減されるとともに、後述の実施形態の説明にあるように、前記入力トークンで特定される第2翻訳単位の同値類に対して1つの訳語がコンピュータによって自動的に関連付けられることによって、ユーザが訳語を訳文文字セット文字で直接入力するのと同様の効果が得られる。加えて、訳文中に現れる長い単語又は漢字で記載される単語の数が増大するほど、前記訳文の訳文文字セット文字での直接入力に必要なキータイプ数と、対応する混合入力シーケンスの入力に必要なキータイプ数との差が顕著になる。このように、従来技術を実施する場合と比較して、本発明を実施した場合はユーザのキータイプ数が低減されることにより、ユーザの入力負担が軽減されることが、本発明の重要な利点の1つである。
【0096】
第1翻訳単位と、ユーザによってすでに入力された第2翻訳単位の同値類及び訳文文字セット文字のシーケンスとを解析して、前記第1翻訳単位が具備する第2翻訳単位を適切な時点で再度決定しても良い。例えば、第1翻訳単位「Development of Internet Infrastructure」が表示される際に、他の第1翻訳単位及び/又は前記第1翻訳単位に対応する混合シーケンスが第2翻訳単位の同値類のシーケンス[Internet][Infrastructure]を既に具備しているならば、前記第2翻訳単位の同値類のシーケンス[Internet][Infrastructure]を結合して、[Internet Infrastructure]を新規の1つの第2翻訳単位の同値類として再度決定しても良い。これによって、特に、原文内に同一のフレーズが多数現れる場合に、ユーザの入力負担が軽減される。
【0097】
入力トークンが入力される度に、第1翻訳単位が具備する第2翻訳単位に入力トークンを再度関連付けても良い。入力トークンを再度関連付ける際に、ユーザによって既に入力されていた入力トークンに関連付けられた第2翻訳単位のいくつかを、入力トークン関連付けの対象から外しても良く、従って、より短い入力トークンの関連付けが可能となる。
【0098】
入力トークンと訳文文字セット文字との入力をユーザが選択的に行うためにユーザが押下するAltキーは、他のキーで代替しても良い。また、キーの同時押下はキーの連続押下で代替しても良い。
【0099】
本発明の代表的実施形態では、所与の混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに対して、前記第2翻訳単位の同値類で表される単語をコンピュータの揮発性/不揮発性記憶手段に格納された電子辞書で前記コンピュータによって引くことによって取得された訳語を具備する訳語候補を前記コンピュータによって決定する。例えば、混合シーケンス[This][computer]「は、」[him]「によって」[properly][used]「されている。」が具備する第2翻訳単位の同値類[computer]に対して、訳語「コンピュータ」を具備する訳語候補{「コンピュータ」}を決定する。
【0100】
所与の混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類で表される単語を、コンピュータの揮発性/不揮発性記憶手段に格納された電子辞書で前記コンピュータによって引くことによって取得された訳語及びその全ての活用形の内で、前記第2翻訳単位の同値類の後続の訳文文字セット文字に接続可能である活用形の一部又は全部を具備する訳語を具備する訳語候補を前記コンピュータによって決定しても良い。例えば、混合シーケンス[used]「ない」内の第2翻訳単位の同値類[used]に対して、後続の訳文文字セット文字「ない」に接続可能である活用形を具備する訳語「使用し」を具備する訳語候補{「使用し」}を決定しても良い。一方で、第2翻訳単位の同値類[used]に対して、訳文文字セット文字「ない」に接続可能である活用形を具備する訳語「使用させ」を具備する訳語候補{「使用させ」}も決定しうる。この場合、例えば、接続可能である活用形の内で、訳語の長さが最短となる活用形を具備する訳語「使用し」を具備する訳語候補{「使用し」}を決定しても良い。同様に、例えば、混合シーケンス[used]「れない」が具備する第2翻訳単位の同値類[used]と、混合シーケンス[used]「されない」が具備する第2翻訳単位の同値類[used]とに対して、それぞれ訳語「使用さ」を具備する訳語候補{「使用さ」}と、訳語「使用」を具備する訳語候補{「使用」}とを決定しても良い。
【0101】
所与の混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類の品詞及び活用形よりも、前記第2翻訳単位の同値類の後続の訳文文字セット文字から決定される品詞及び活用形を優先させて、訳語候補を決定しても良い。例えば、混合シーケンス[used]「する」が具備する第2翻訳単位の同値類[used]に対して、訳語候補{「使用」}を決定しても良い。ここで、第2翻訳単位の同値類[used]が過去分詞形であることは無視されていることに留意する。これにより、例えば、原文内の動詞の受動態を訳文で能動態に訳し分ける、又は原文内の動詞の過去形を訳文で現在形に訳し分けることが可能である。従って、ユーザは、原語単語の品詞にとらわれずに訳文作成が可能となり、それによって訳文作成の自由度が高まることが、本発明の重要な利点の1つである。また、後続の訳文文字セットがない場合に、所定の品詞及び/又は活用形、例えば第2翻訳単位の同値類から特定される品詞及び基本形を具備する訳語候補を決定しても良い。
【0102】
これらを組み合わせると、例えば、混合シーケンス[This][computer]「は、」[him]「によって」[used]「されている。」が具備する第2翻訳単位の同値類[This]と、[computer]と、[him]と、[used]とに、それぞれの訳語候補内の1つの訳語「この」と、「コンピュータ」と、「彼」と、「使用」とを関連付けることによって、前記混合シーケンスは、混合シーケンス[この:This][コンピュータ:computer]「は、」[彼:him]「によって」[使用:used]「されている。」になる。ここで、例えば、[この:This]は、第2翻訳単位の同値類[This]に1つの訳語「この」が関連付けられていることを表す。また、混合シーケンス[him]「は、」[This][computer]「を」[used]「する。」は、第2翻訳単位の同値類[him]と、[This]と、[computer]と、[used]とに、それぞれの前記訳語候補内の1つの訳語「彼」と、「この」と、「コンピュータ」と、「使用」とを関連付けられて、混合シーケンス[彼:him]「は、」[この:This][コンピュータ:computer]「を」[使用:used]「する。」になる。
【0103】
複数の第2翻訳単位の同値類に対して1つの訳語候補を決定しても良い。例えば、第2翻訳単位の同値類のシーケンス[for][example]に対して、1つの訳語候補{「例えば」}を決定しても良い。
【0104】
所与の混合シーケンスが具備する第2翻訳単位の同値類のシーケンスに対して、後続の訳文文字セットをベースとして、前記後続の訳文文字セットの直前の第2翻訳単位の同値類から順に、前記第2翻訳単位の同値類の訳語候補を決定する及び/又は前記第2翻訳単位に1つの訳語を関連付けても良い。例えば、混合シーケンス[properly][configured]「する」に対して、訳文文字セット「する」の直前の第2翻訳単位の同値類[configured]に、1つの訳語「設定」を関連付けることによって、前記混合シーケンスは、混合シーケンス[properly][設定:configured]「する」になる。次いで、第2翻訳単位の同値類[configured]の直前の第2翻訳単位の同値類[properly]に、1つの訳語「正しく」を関連付けることによって、前記混合シーケンスは、混合シーケンス[正しく:properly][設定:configured]「する」になる。一方で、例えば、混合シーケンス[properly][configured]「である」は、混合シーケンス[properly][設定:configured]「である」を経由して、混合シーケンス[正しい:properly][設定:configured]「である」になる。
【0105】
前記電子辞書が具備する複数の異なる単語に対して、前記単語の訳語間のリンク情報を予め追加するとともに、所与の第1翻訳単位に対して、係り受け解析に関する公知技術を使用して取得された修飾関係で特定される前記リンク情報を使用して、前記第1翻訳単位が具備する第2翻訳単位に対する同値類の訳語候補を決定しても良いし、前記訳語候補内の1つの訳語を前記第2翻訳単位の同値類に関連付けても良い。例えば、係り受け解析に関する公知の手段を使用して、第1翻訳単位「filed application」が具備する第2翻訳単位「filed」が、第2翻訳単位「application」を修飾していることを発見したら、前記2翻訳単位の同値類を具備する混合シーケンス[filed][application]が具備する第2翻訳単位の同値類[filed]に対する訳語候補{「出願された」}を決定するとともに、第2翻訳単位の同値類[application]に対する訳語候補{「出願」}を決定しても良い。
【0106】
第2翻訳単位の同値類の少なくとも1つに対して決定される訳語候補が具備する訳語の数は、1つであるのが好ましいが、0個又は複数であっても良い。0個の場合は、前記第2翻訳単位の同値類の少なくとも1つに、1つの訳語を関連付けなくても良い。複数の場合は、前記第2翻訳単位の同値類の少なくとも1つに、前記訳語候補内の任意の1つの訳語を関連付けても良いし、関連付けなくても良い。前記1つの訳語は、前記訳語候補の中で所定の優先度が最大の1つであっても良い。
【0107】
前記所定の優先度は、訳語言語の所与のコーパスを予めコンピュータで形態素解析することによって取得された訳語言語の単語とその出現頻度とを、コンピュータの揮発性/不揮発性記憶手段に格納しておくとともに、前記訳語言語の単語とその出現頻度とを使用して決定しても良い。
【0108】
前記第2翻訳単位の同値類と対応するユーザの所望の訳語とを関連付けたものを、又は、必要であればさらに品詞及び/又は活用形の情報とともに関連付けたものを、ユーザがテキストボックスに入力することによって前記電子辞書にユーザに登録させるための、前記テキストボックスを具備するGUIを提供しても良い。前記所望の訳語が複数あるときに、前記所望の訳語に対して所望の優先度をユーザに付与させるためのGUIを提供しても良い。
【0109】
第2翻訳単位の同値類に対する訳語候補の決定及び1つの訳語の関連付けは、入力トークンによって前記第2翻訳単位が特定された後の任意の時点で実施可能である。従って、混合シーケンスの入力が終了した時点で実施しても良いし、訳語候補を決定可能な時点でリアルタイムに実施しても良い。
【0110】
図6は、訳語候補を決定可能な時点で、訳語候補の決定と1つの訳語の関連付けとをリアルタイムに実施する、本発明の代表的実施形態での例示的かつ非限定的な実施例を示している。図6は、混合入力シーケンスの入力602に従った混合表示シーケンス表示部の表示の変化603を、時間軸601に沿って示している。
【0111】
最初は、混合シーケンスは空である。次いで、入力トークン<T>、入力トークン<c>に続いて、後続の訳文文字セット文字「は、」が入力されると、前記混合シーケンスは、入力トークン<T>で特定される第2翻訳単位の同値類[This]と、入力トークン<c>で特定される第2翻訳単位の同値類[computer]と、訳文文字セット文字「は、」とを具備する混合シーケンス[This][computer]「は、」になる。次いで、第2翻訳単位の同値類[This]と、[computer]とに対して、それぞれ訳語候補{「この」}と、{「コンピュータ」}とが決定される。次いで、混合シーケンス[This][computer]「は、」は、第2翻訳単位の同値類[This]と、[computer]とに、それぞれ1つの訳語「この」と、「コンピュータ」とが関連付けられて、混合シーケンス[この:This][コンピュータ:computer]「は、」になる。次いで、混合表示シーケンス「この」「コンピュータ」「は、」が生成される。次いで、前記混合表示シーケンスが、混合表示シーケンス表示部に表示される。
【0112】
次いで、入力トークン<u>に続いて、後続部分の訳文文字セット文字「によって」が入力されると、混合シーケンス[This][computer]「は、」は、入力トークン<u>で特定される第2翻訳単位の同値類[user]と、訳文文字セット文字「によって」とが付加されて、混合シーケンス[この:This][コンピュータ:computer]「は、」[user]「によって」になる。次いで、第2翻訳単位の同値類[user]に対して、訳語候補{「ユーザ」}が決定される。次いで、混合シーケンス[この:This][コンピュータ:computer]「は、」[user]「によって」は、第2翻訳単位の同値類[user]に、1つの訳語「ユーザ」が関連付けられて、混合シーケンス[この:This][コンピュータ:computer]「は、」[ユーザ:user]「によって」になる。次いで、混合表示シーケンス「この」「コンピュータ」「は、」「ユーザ」「によって」が生成される。次いで、前記混合表示シーケンスが、混合表示シーケンス表示部に表示される。
【0113】
混合表示シーケンス表示部が表示を更新するタイミングは、混合表示シーケンスを生成した後の任意の時点でも良い。例えば、ユーザが入力を所定時間だけ中断した時点でも良いし、ユーザが第1翻訳単位に対する混合入力シーケンスの入力終了を通知した時点でも良い。
【0114】
次いで、入力トークン<c>が入力されると、入力トークン<c>で特定される第2翻訳単位の同値類[configured]に対して、複数の訳語「構成」と「設定」とを具備する訳語候補{「構成」,「設定」}が決定された場合に、第2翻訳単位の同値類[configured]に1つの訳語候補が関連付けられていない様子を示している。次いで、ユーザが第2翻訳単位の同値類[configured]に関連付けられた表示トークン「${configured}」上にカーソルを移動することによって、ユーザが第2翻訳単位の同値類[configured]を選択すると、前記第2翻訳単位の同値類に対して訳語候補{「構成」,「設定」}が決定され、前記訳語候補からユーザに1つの訳語を選択させるための選択肢決定ウィンドウ605を表示する。次いで、ユーザが選択肢決定ウィンドウ605で所望の1つの訳語「設定」を選択すると、混合シーケンス[この:This][コンピュータ:computer]「は、」[ユーザ:user]「によって」[正しく:properly][configured」「されている。」は、第2翻訳単位の同値類[configured]に1つの訳語「設定」が関連付けられて、[この:This][コンピュータ:computer]「は、」[ユーザ:user]「によって」[正しく:properly][設定:configured]「されている。」になる。次いで、混合表示シーケンス「この」「コンピュータ」「は、」「ユーザ」「によって」「正しく」「設定」「されている。」が生成されると
ともに、混合表示シーケンス表示部は、スナップショット606のように更新される。以下で、<表4>に、スナップショット604に対応する各シーケンスの状態を、<表5>に、スナップショット606に対応する各シーケンスの状態を、それぞれ示す。
【0115】
【表4】

【0116】
【表5】

【0117】
このようにして生成された混合表示シーケンスを、第1翻訳単位「This computer is properly configured by a user.」に対する訳文「このコンピュータは、ユーザによって正しく設定されている。」として採用しても良い。
【0118】
図7は、1つの訳語が既に関連付けられている第2翻訳単位の同値類に対して、ユーザに他の所望の1つの訳語を選択させるとともに、前記所望の1つの訳語を前記第2翻訳単位の同値類に関連付ける、本発明の代表的実施形態での例示的かつ非限定的な実施例を示している。図7では、第2翻訳単位の同値類[configured]に対して、複数の訳語「構成」と「設定」とを具備する訳語候補{「構成」,「設定」}が決定されるとともに、混合シーケンス[この:This][コンピュータ:computer]「は、」[ユーザ:user]「によって」[正しく:properly][configured]「されている。」が具備する第2翻訳単位の同値類[configured]に対して決定された前記訳語候補内の1つの訳語「構成」が既に関連付けられて、混合シーケンス[この:This][コンピュータ:computer]「は、」[ユーザ:user]「によって」[正しく:properly][構成:configured]「されている。」が既に生成されている。図7は、混合入力シーケンスの入力702に従った混合表示シーケンス表示部の表示の変化703を、時間軸701に沿って示している。
【0119】
次いで、第2翻訳単位の同値類[configured]に関連付けられた表示トークン「${configured}」上にユーザがカーソルを移動することによって、ユーザに第2翻訳単位の同値類[configured]を選択させると、前記第2翻訳単位の同値類に対して訳語候補{「構成」,「設定」}を決定するとともに、前記訳語候補からユーザに1つの訳語を選択させるための選択肢決定ウィンドウ704を表示する。次いで、ユーザが選択肢決定ウィンドウ704から所望の1つの訳語「設定」を選択すると、混合シーケンス[この:This][コンピュータ:computer]「は、」[ユーザ:user]「によって」[正しく:properly][configured]「されている。」は、第2翻訳単位の同値類[configured]に1つの訳語「設定」が関連付けられて、[この:This][コンピュータ:computer]「は、」[ユーザ:user]「によって」[正しく:properly][設定:configured]「されている。」になる。次いで、混合表示シーケンス「この」「コンピュータ」「は、」「ユーザ」「によって」「正しく」「設定」「されている。」が生成されるとともに、混合表示シーケンス表示部は、スナップショット705のように更新される。
【0120】
前記第2翻訳単位の同値類に1つの訳語が関連付けられた際に、前記第1翻訳単位及び/又は他の第1翻訳単位が具備する、前記第2翻訳単位の同値類と同値である第2翻訳単位の同値類に、前記1つの訳語をコンピュータによって同時に関連付けても良い。
【0121】
ユーザによって選択された第2翻訳単位の同値類と、関連付けられた前記所望の1つの訳語に最大の優先度を付与しても良い。
【0122】
このように、ユーザが選択した1つの訳語を、前記第2翻訳単位の同値類と同値である他の第2翻訳単位の同値類に、コンピュータによって同時に関連付けることによって、訳文内での表記の統一が実現された高品質な訳文の作成がより容易になることが、本発明の重要な利点の1つである。
【0123】
図6、図7の実施形態でも、図5の実施形態と同様、Altキーやカーソルキーは他のキーで代替しても良い。また、メタキーと文字キーとの同時押下は、連続押下で代替しても良い。
【0124】
図8を参照する。本発明の代表的実施形態では、訳文チェック支援画面800は、第1翻訳単位表示部810を具備する。図8に示した実施例では、<表1>の例2の第1翻訳単位と第2翻訳単位とに対して、第1翻訳単位表示部810が、第1翻訳単位「This computer is properly configured by a user.」を表示しているとともに、図8に示した実施例は、所与の混合シーケンス[この:This」[コンピュータ:computer]「は、」[ユーザ:user]「が」[設定:configured]「した」[コンピュータ:computer]「である。」に対応している。
【0125】
<表6>に、図8の実施例に対応する、第1翻訳単位内での第2翻訳単位の同値類の出現回数と、混合シーケンス内での前記第2翻訳単位の同値類の出現回数と、の比較結果を示す。
【0126】
【表6】

【0127】
第1翻訳単位内での出現回数と混合シーケンス内での出現回数とが等しい第2翻訳単位の同値類は、[This]と、[configured]と、[user]とである。従って、第2翻訳単位の同値類[This]と、[configured]と、[user]とは、第1翻訳単位表示部810内で、出現回数が等しいことを指示する点線によってハイライト表示されている。一方、第1翻訳単位内での出現回数の方が多い第2翻訳単位の同値類[properly]は、それを指示する2重線によってハイライト表示されている。また、第1翻訳単位内での出現回数のほうが少ない第2翻訳単位の同値類[computer]は、それを指示する1重線によってハイライト表示されている。
【0128】
前記ハイライト表示は、選択的に実施しても良いことに留意する。即ち、例えば、出現回数の等しい第2翻訳単位の同値類のみをハイライト表示しても良い。また、訳文チェック支援画面800は、前記ハイライト表示の選択的な実施をユーザに指示させるための選択ボタンをさらに具備しても良い。
【0129】
図8に示した実施例のように、訳文チェック支援画面800は、前記混合シーケンスから生成される混合表示シーケンス、例えば「この」「コンピュータ」「は、」「ユーザ」「が」「設定」「した」「コンピュータ」「である。」を表示する第2混合シーケンス表示部830、及び/又は、前記混合シーケンスに関連付けられた1つの訳語の関連付けがコンピュータによって解除された混合シーケンス[This][computer]「は、」[user]「が」[configured]「した」[computer]「である。」から生成される混合表示シーケンスを表示する第1混合シーケンス表示部820をさらに具備しても良い。
【0130】
第1翻訳単位表示部810と、第1混合表示シーケンス表示部820及び/又は第2混合表示シーケンス表示部830とをユーザが参照することによって、混合シーケンス内の訳抜けや重複翻訳をユーザが発見することが容易になる。なお、ユーザが発見した修正箇所を前記ユーザが修正可能にするために、第2混合表示シーケンス表示部830を編集可能にしても良い。
【0131】
また、ユーザがフォーカスを移動することによって、第1翻訳単位表示部810が表示する第1翻訳単位が具備する任意の第2翻訳単位を選択させると、前記選択に応答して、前記第2翻訳単位の同値類を置換した表示トークン及び/又は1つの訳語を、第1混合表示シーケンス表示部820及び/又は第2混合表示シーケンス表示部830内でハイライト表示しても良い。
【0132】
図12〜17には、本発明の一実施形態を表すフローチャートが記載されている。ここで、簡潔を旨とするために、各処理によって生成されたオブジェクトを格納手段内に格納することについての記載はフローチャートから省略されていることに留意する。これらのフローチャートは、例示的かつ非限定的な実施形態であることと、各処理が実行される順序を限定するものではないこととに留意する。
【0133】
以上の説明により、本発明の構成要素をサブシステムにグループ化するとともに、各サブシステムを別々のユーザに対して実施可能であることは明らかである。これにより翻訳作業の分業が可能になることによって、翻訳作業全体のさらなるコスト低減を図ることが可能である。
【0134】
本発明では、第2入力単位の入力に必要な入力トークンは、第1翻訳単位が決定又は選択されてから第1翻訳単位に依存して決定される。そのため、予め辞書に短縮コードを登録する方法と比較して、対象となる入力候補が好ましくは1文である第1翻訳単位内の第2翻訳単位に限定されているために、入力トークンの長さが著しく短くなるという顕著な利点がある。また、表示装置に表示されている原文を参照すれば入力トークンが分かるので、短縮コードをユーザが暗記する必要もない。
【0135】
本発明では、ユーザによる入力作業で発生する、ユーザの視線移動及びタイプ数が低減される。従って、ユーザによる入力作業負担が低減されることによって翻訳作業全体の高速化が可能となる。従って、翻訳作業全体のコスト低減を図ることが可能である。
【0136】
また、ユーザが、訳文文字セット文字を直接入力することも可能である。従って、例えば、訳文言語が日本語の場合には、ユーザが訳文内で細かく助詞を使い分けることが可能となる。従って、より高品質の訳文を作成することがより容易になる。
【0137】
また、訳文を作成する際に、同一の表記を具備する第2翻訳単位に対して、同一の訳語をコンピュータによって同時に関連付けることが可能である。従って、訳文内での表記の統一が図られたより高品質の訳文を作成することが容易である。
【0138】
また、翻訳メモリ等の既存技術を併用しても良い。例えば、まず原文に翻訳メモリを適用するとともに、翻訳メモリが適用不可能である部分に対して、本発明を実施しても良い。それによって、翻訳作業全体のさらなるコスト低減を図ることが可能である。
【0139】
発明の詳細な説明においては、具体的な実施形態について説明したが、本発明の範囲から逸脱しない範囲内で、種々な修正例及び変形例が実施可能である。従って、本発明の範囲は、上述した実施形態に限定されるものではなく、特許請求の範囲で定義されるものとその均等物である。
【産業上の利用可能性】
【0140】
発明の効果で述べた翻訳作業のコスト低減及び訳文の品質向上等の効果に加えて、例えば、キーボード等の入力手段を使う作業の苦手なユーザにとっても、翻訳作業が比較的容易となるので、新たなユーザが発掘される可能性がある。また、翻訳作業のコスト低減により、新たな翻訳需要が喚起される可能性もある。
【符号の説明】
【0141】
300 画面
310 第1翻訳単位表示部
320 混合表示シーケンス表示部


【特許請求の範囲】
【請求項1】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
表示装置と、
入力装置と、
第1翻訳単位を原文文字セット文字で、前記表示装置によって表示する第1翻訳単位表示手段と、
入力トークン又は訳文文字セット文字の少なくとも1つを、ユーザが選択的に前記入力装置から入力することによって、入力トークン又は訳文文字セット文字との少なくとも1つを具備する混合入力シーケンスを前記ユーザに入力させる混合入力シーケンス入力手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記第1翻訳単位表示手段は、前記第1翻訳単位の一部又は全部を具備する第2翻訳単位に関連付けられた前記入力トークンが具備する原文文字セット文字の全てを、表示されている前記第1翻訳単位が具備する前記第2翻訳単位内でハイライト表示し、
前記入力トークンが具備する原文文字セット文字の全ての入力が、前記入力トークンの入力に必要であることを特徴とするサブシステム。
【請求項2】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
格納手段を有するコンピュータと、
原文を受信するとともに前記格納手段に格納する原文受信手段と、
空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
前記格納手段に格納された原文に対して、少なくとも1つの第1翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第1翻訳単位決定手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
前記混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記混合入力シーケンスは、前記入力トークンと訳文文字セット文字との少なくとも1つを具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする請求項1に記載のサブシステム。
【請求項3】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
表示装置と、
入力装置と、
格納手段を有するコンピュータと、
原文を受信するとともに前記格納手段に格納する原文受信手段と、
前記原文を前記表示装置によって表示する原文表示手段と、
ユーザが前記入力装置を使用することによって、表示された原文内からユーザに第1翻訳単位を選択させるとともに前記格納手段に格納する第1翻訳単位選択手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
前記第1翻訳単位決定手段に対して、空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記混合入力シーケンスは、前記入力トークンと訳文文字セット文字との少なくとも1つを具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする請求項1に記載のサブシステム。
【請求項4】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
表示装置と、
格納手段を有するコンピュータと、
前記格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位の同値類に表示トークンを前記コンピュータによって関連付けるとともに前記格納手段に格納する表示トークン関連付け手段と、
前記格納手段に格納された混合シーケンス内で、1つの訳語が関連付けられていない第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた表示トークンで置換されるとともに、1つの訳語が関連付けられた第2翻訳単位の同値類は、前記1つの訳語で置換されることによって生成される混合表示シーケンスを、前記コンピュータによって生成するとともに前記格納手段に格納する混合表示シーケンス生成手段と、
前記格納手段に格納された前記混合表示シーケンスを、前記表示装置によって表示する混合表示シーケンス表示手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするサブシステム。
【請求項5】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
格納手段を有するコンピュータと、
前記格納手段に格納された混合シーケンスをベースとして、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記格納手段に格納された前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに、前記格納手段に格納された前記訳語候補内の1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするサブシステム。
【請求項6】
前記訳語候補内の1つの訳語は、前記訳語候補内で所定の優先度が最大の1つであることを特徴とする請求項5に記載のサブシステム。
【請求項7】
入力装置と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つを、前記ユーザに選択させる置換対象選択手段と、
前記混合シーケンスをベースとして、前記第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記訳語候補を、前記表示装置によって一覧表示する訳語候補表示手段と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記訳語候補内の1つの訳語を前記ユーザに選択させる訳語候補選択手段と、
前記混合シーケンス内の、前記第2翻訳単位の同値類の少なくとも1つに、前記ユーザに選択させた前記1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
をさらに具備することを特徴とする請求項4に記載のサブシステム。
【請求項8】
前記訳語候補決定手段は、前記訳語候補内の訳語の品詞及び/又は活用形を、前記混合シーケンスが具備する訳文文字セット文字に依存して決定することを特徴とする請求項5〜7の何れか1項に記載のサブシステム。
【請求項9】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムであり、
表示装置と、
格納手段を有するコンピュータと、
前記格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位に同値である第2翻訳単位の、前記第1翻訳単位内での出現回数である第1出現回数を、前記コンピュータによってカウントする第1出現回数カウント手段と、
前記格納手段に格納された混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類に同値である第2翻訳単位の同値類の、前記混合シーケンス内での出現回数である第2出現回数を、前記コンピュータによってカウントする第2出現回数カウント手段と、
前記第1翻訳単位が具備する第2翻訳単位に対してカウントされた前記第1出現回数と、前記第2翻訳単位の同値類に対してカウントされた前記第2出現回数とを、前記コンピュータによって比較する出現回数比較手段と、
前記第1翻訳単位を原文文字セット文字で、前記表示装置によって表示する第1翻訳単位表示手段と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備し、
前記第1翻訳単位表示手段は、前記第1翻訳単位が具備する第2翻訳単位を、前記比較の結果に依存して、表示される前記第1翻訳単位内でハイライト表示することを特徴とするサブシステム。
【請求項10】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示段階と、
入力トークン又は訳文文字セット文字の少なくとも1つを、ユーザが選択的に入力装置から入力することによって、入力トークン又は訳文文字セット文字との少なくとも1つを具備する混合入力シーケンスを前記ユーザに入力させる混合入力シーケンス入力段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記第1翻訳単位表示段階は、前記第1翻訳単位の一部又は全部を具備する第2翻訳単位に関連付けられた前記入力トークンが具備する原文文字セット文字の全てを、表示されている前記第1翻訳単位が具備する前記第2翻訳単位内でハイライト表示し、
前記入力トークンが具備する原文文字セット文字の全ての入力が、前記入力トークンの入力に必要であることを特徴とする方法。
【請求項11】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
原文を受信するとともに格納手段に格納する原文受信段階と、
空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化段階と、
前記格納手段に格納された原文に対して、少なくとも1つの第1翻訳単位を、コンピュータによって決定するとともに前記格納手段に格納する第1翻訳単位決定段階と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定段階と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け段階と、
前記混合入力シーケンス入力段階によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記混合入力シーケンスは、前記入力トークンと訳文文字セット文字との少なくとも1つを具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする請求項10に記載の方法。
【請求項12】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
原文を受信するとともに格納手段に格納する原文受信段階と、
前記原文を表示装置によって表示する原文表示段階と、
ユーザが入力装置を使用することによって、表示された原文内からユーザに第1翻訳単位を選択させるとともに前記格納手段に格納する第1翻訳単位選択段階と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定段階と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け段階と、
前記第1翻訳単位決定段階に対して、空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化段階と、
混合入力シーケンス入力段階によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記混合入力シーケンスは、前記入力トークンと訳文文字セット文字との少なくとも1つを具備し、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする請求項10に記載の方法。
【請求項13】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位の同値類に表示トークンをコンピュータによって関連付けるとともに前記格納手段に格納する表示トークン関連付け段階と、
前記格納手段に格納された混合シーケンス内で、1つの訳語が関連付けられていない第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた表示トークンで置換されるとともに、1つの訳語が関連付けられた第2翻訳単位の同値類は、前記1つの訳語で置換されることによって生成される混合表示シーケンスを、前記コンピュータによって生成するとともに前記格納手段に格納する混合表示シーケンス生成段階と、
前記格納手段に格納された前記混合表示シーケンスを、表示装置によって表示する混合表示シーケンス表示段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする方法。
【請求項14】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
格納手段に格納された混合シーケンスをベースとして、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定段階と、
前記格納手段に格納された前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに、前記格納手段に格納された前記訳語候補内の1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする方法。
【請求項15】
前記訳語候補内の1つの訳語は、前記訳語候補内で所定の優先度が最大の1つであることを特徴とする請求項14に記載の方法。
【請求項16】
ユーザが前記表示装置及び入力装置を使用することによって、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つを、前記ユーザに選択させる置換対象選択段階と、
前記混合シーケンスをベースとして、前記第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定段階と、
前記訳語候補を、前記表示装置によって一覧表示する訳語候補表示段階と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記訳語候補内の1つの訳語を前記ユーザに選択させる訳語候補選択段階と、
前記混合シーケンス内の、前記第2翻訳単位の同値類の少なくとも1つに、前記ユーザに選択させた前記1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け段階と、
をさらに具備することを特徴とする請求項13に記載の方法。
【請求項17】
前記訳語候補決定段階は、前記訳語候補内の訳語の品詞及び/又は活用形を、前記混合シーケンスが具備する訳文文字セット文字に依存して決定することを特徴とする請求項14〜16の何れか1項に記載の方法。
【請求項18】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用される方法であり、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位に同値である第2翻訳単位の、前記第1翻訳単位内での出現回数である第1出現回数を、コンピュータによってカウントする第1出現回数カウント段階と、
前記格納手段に格納された混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類に同値である第2翻訳単位の同値類の、前記混合シーケンス内での出現回数である第2出現回数を、前記コンピュータによってカウントする第2出現回数カウント段階と、
前記第1翻訳単位が具備する第2翻訳単位に対してカウントされた前記第1出現回数と、前記第2翻訳単位の同値類に対してカウントされた前記第2出現回数とを、前記コンピュータによって比較する出現回数比較段階と、
前記第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示段階と、
を具備し、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備し、
前記第1翻訳単位表示段階は、前記第1翻訳単位が具備する第2翻訳単位を、前記比較の結果に依存して、表示される前記第1翻訳単位内でハイライト表示することを特徴とする方法。
【請求項19】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示手段と、
入力トークン又は訳文文字セット文字の少なくとも1つを、ユーザが選択的に入力装置から入力することによって、入力トークン又は訳文文字セット文字との少なくとも1つを具備する混合入力シーケンスを前記ユーザに入力させる混合入力シーケンス入力手段と、
して機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記第2翻訳単位に対して、それぞれ前記入力トークンが関連付けられており、
前記入力トークンは、それぞれに関連付けられた前記第2翻訳単位が具備する原文文字セット文字の少なくとも1つを具備し、
前記第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた前記入力トークンによって前記第1翻訳単位内で特定可能であり、
前記第1翻訳単位表示手段は、前記第1翻訳単位の一部又は全部を具備する第2翻訳単位に関連付けられた前記入力トークンが具備する原文文字セット文字の全てを、表示されている前記第1翻訳単位が具備する前記第2翻訳単位内でハイライト表示し、
前記入力トークンが具備する原文文字セット文字の全ての入力が、前記入力トークンの入力に必要であることを特徴とするプログラム。
【請求項20】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
原文を受信するとともに格納手段に格納する原文受信手段と、
空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
前記格納手段に格納された原文に対して、少なくとも1つの第1翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第1翻訳単位決定手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
前記混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
としてさらに機能させ、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする請求項19に記載のプログラム。
【請求項21】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段を有するコンピュータと、
原文を受信するとともに格納手段に格納する原文受信手段と、
前記原文を前記表示装置によって表示する原文表示手段と、
ユーザが前記入力装置を使用することによって、表示された原文内からユーザに第1翻訳単位を選択させるとともに前記格納手段に格納する第1翻訳単位選択手段と、
前記格納手段に格納された前記第1翻訳単位に対して、少なくとも1つの第2翻訳単位を、前記コンピュータによって決定するとともに前記格納手段に格納する第2翻訳単位決定手段と、
前記格納手段に格納された前記第2翻訳単位に対して、入力トークンを、前記コンピュータによって関連付けるとともに前記格納手段に格納する入力トークン関連付け手段と、
前記第1翻訳単位決定手段に対して、空の混合シーケンスを前記格納手段に格納する混合シーケンス初期化手段と、
混合入力シーケンス入力手段によって入力された混合入力シーケンスと前記格納手段に格納された前記混合シーケンスとに対して、前記混合入力シーケンスが具備する前記入力トークンによって前記第1翻訳単位内で特定される第2翻訳単位の同値類、又は前記混合入力シーケンスが具備する訳文文字セット文字を、前記混合シーケンスに、前記コンピュータによって付加又は挿入するとともに前記格納手段に格納する付加・挿入手段と、
してさらに機能させ、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とする請求項19に記載のプログラム。
【請求項22】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段を有するコンピュータと、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位の同値類に表示トークンを前記コンピュータによって関連付けるとともに前記格納手段に格納する表示トークン関連付け手段と、
前記格納手段に格納された混合シーケンス内で、1つの訳語が関連付けられていない第2翻訳単位の同値類は、前記第2翻訳単位に関連付けられた表示トークンで置換されるとともに、1つの訳語が関連付けられた第2翻訳単位の同値類は、前記1つの訳語で置換されることによって生成される混合表示シーケンスを、前記コンピュータによって生成するとともに前記格納手段に格納する混合表示シーケンス生成手段と、
前記格納手段に格納された前記混合表示シーケンスを、表示装置によって表示する混合表示シーケンス表示手段と、
して機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするプログラム。
【請求項23】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段に格納された混合シーケンスをベースとして、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記格納手段に格納された前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つに、前記格納手段に格納された前記訳語候補内の1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
して機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備することを特徴とするプログラム。
【請求項24】
前記訳語候補内の1つの訳語は、前記訳語候補内で所定の優先度が最大の1つであることを特徴とする請求項23に記載のプログラム。
【請求項25】
ユーザが前記表示装置及び入力装置を使用することによって、前記混合シーケンスが具備する第2翻訳単位の同値類の少なくとも1つを、前記ユーザに選択させる置換対象選択手段と、
前記混合シーケンスをベースとして、前記第2翻訳単位の同値類の少なくとも1つに対する訳語候補を、前記コンピュータによって決定するとともに前記格納手段に格納する訳語候補決定手段と、
前記訳語候補を、前記表示装置によって一覧表示する訳語候補表示手段と、
ユーザが前記表示装置及び前記入力装置を使用することによって、前記訳語候補内の1つの訳語を前記ユーザに選択させる訳語候補選択手段と、
前記混合シーケンス内の、前記第2翻訳単位の同値類の少なくとも1つに、前記ユーザに選択させた前記1つの訳語を、前記コンピュータによって関連付けるとともに前記格納手段に格納する訳語関連付け手段と、
してさらに機能させることを特徴とする請求項22に記載のプログラム。
【請求項26】
前記訳語候補決定手段は、前記訳語候補内の訳語の品詞及び/又は活用形を、前記混合シーケンスが具備する訳文文字セット文字に依存して決定することを特徴とする請求項23〜25の何れか1項に記載のプログラム。
【請求項27】
原文に対する訳文の作成を支援するための翻訳支援システムのサブシステムで使用されるプログラムであり、
コンピュータを、
格納手段に格納された第1翻訳単位が具備する第2翻訳単位に対して、前記第2翻訳単位に同値である第2翻訳単位の、前記第1翻訳単位内での出現回数である第1出現回数を、前記コンピュータによってカウントする第1出現回数カウント手段と、
前記格納手段に格納された混合シーケンスが具備する第2翻訳単位の同値類に対して、前記第2翻訳単位の同値類に同値である第2翻訳単位の同値類の、前記混合シーケンス内での出現回数である第2出現回数を、前記コンピュータによってカウントする第2出現回数カウント手段と、
前記第1翻訳単位が具備する第2翻訳単位に対してカウントされた前記第1出現回数と、前記第2翻訳単位の同値類に対してカウントされた前記第2出現回数とを、前記コンピュータによって比較する出現回数比較手段と、
前記第1翻訳単位を原文文字セット文字で、表示装置によって表示する第1翻訳単位表示手段と、
として機能させ、
前記第1翻訳単位は、原文文字セット文字で表された前記原文の一部又は全部を具備し、
前記第2翻訳単位は、前記第1翻訳単位の一部又は全部を具備し、
前記第2翻訳単位の間には、同値関係が定義され、
前記混合シーケンスは、前記第1翻訳単位が具備する第2翻訳単位の1つと同値である第2翻訳単位の同値類と訳文文字セット文字との0又は1つ以上を具備するとともに、前記第2翻訳単位の同値類の0又は1つ以上が、それぞれに関連付けられた1つの訳語を具備し、
前記第1翻訳単位表示手段は、前記第1翻訳単位が具備する第2翻訳単位を、前記比較の結果に依存して、表示される前記第1翻訳単位内でハイライト表示することを特徴とするプログラム。



【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−211691(P2009−211691A)
【公開日】平成21年9月17日(2009.9.17)
【国際特許分類】
【出願番号】特願2009−27530(P2009−27530)
【出願日】平成21年2月9日(2009.2.9)
【出願人】(308003426)
【Fターム(参考)】