翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法
【課題】より容易かつ適切に、翻訳文の入力作業をユーザにおこなわせることで、結果的に、翻訳文の入力作業における作業効率の向上を図ること。
【解決手段】指定部202は、入力部201によって入力された原文データのうち、対象範囲の指定を受け付ける。取得部203は、指定部202によって指定された対象範囲を分解した結果得られる言語単位の原文語を取得する。検索部204は、記憶部200によって記憶されている訳文語の中から、取得部203によって取得された原文語に関連付けられている訳文語を検索する。抽出部206は、入力部201によって第2の言語の文字列が入力された場合、検索部204によって検索された訳文語の中から、入力された第2の言語の文字列と一致または関連する訳文語を入力候補として抽出する。表示部205は、表示制御部207の制御によって、抽出部206によって抽出された入力候補を表示する。
【解決手段】指定部202は、入力部201によって入力された原文データのうち、対象範囲の指定を受け付ける。取得部203は、指定部202によって指定された対象範囲を分解した結果得られる言語単位の原文語を取得する。検索部204は、記憶部200によって記憶されている訳文語の中から、取得部203によって取得された原文語に関連付けられている訳文語を検索する。抽出部206は、入力部201によって第2の言語の文字列が入力された場合、検索部204によって検索された訳文語の中から、入力された第2の言語の文字列と一致または関連する訳文語を入力候補として抽出する。表示部205は、表示制御部207の制御によって、抽出部206によって抽出された入力候補を表示する。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、コンピュータを用いた翻訳文の入力を支援する翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法に関する。
【背景技術】
【0002】
従来より、たとえば日本語によって表現された原文から、英語によって表現される翻訳文を作成する翻訳作業においては、一般的にワープロなどの文書作成ソフトが用いられている。また、このような文書作成ソフトを用いた翻訳作業においては、ユーザが翻訳文を入力する際に、原文語に対応する訳語やその正確なスペルがわからない場合、その都度、辞書など補助的な文書を参照することによって、適切な訳語を入力するといった方法が用いられているため、翻訳作業にかかる作業時間が長時間化するといった問題が生じていた。
【0003】
そこで、たとえばユーザが翻訳文を入力する際に、訳語やその正確なスペルがわからない単語をユーザに指定させることによって、指定された単語に対応する訳語を辞書データベースから検索し、検索された訳語を表示することができる技術が開示されている(たとえば、下記特許文献1参照。)。
【0004】
【特許文献1】特開2006−107261号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載の従来技術にあっては、単語単位で一連の処理(指定処理、検索処理、および検索結果表示処理)をおこなっているため、ユーザは、訳語やその正確なスペルがわからない単語が原文中に多数含まれている場合であっても、単語ごとに、その単語を翻訳対象として指定し、対応する訳語を辞書データベースから検索させる必要がある。この結果、翻訳文の入力作業において、作業効率が低下し、これに伴い作業時間が長時間化するといった問題が生じていた。
【0006】
また、辞書データベースから検索された訳語の全てが検索結果として表示されるため、ユーザは、訳語のスペルをある程度把握しているにも関わらず多数の訳語が辞書データベースから検索された場合、検索結果として表示された多数の訳語の中から、適切な訳語を目視により探し出す必要がある。この結果、翻訳文の入力作業において、作業効率が低下し、これに伴い作業時間が長時間化するといった問題が生じていた。
【0007】
この発明は、上述した従来技術による問題点を解消するため、より容易かつ適切に、翻訳文の入力作業をユーザにおこなわせることができ、結果的に、翻訳文の入力作業における作業効率の向上を図ることができる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するため、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法は、第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法であって、前記原文データを分解した結果得られる前記言語単位の原文語を取得し、取得された原文語に関連付けられている訳文語を、前記データベースから検索し、前記第2の言語の文字列の入力を受け付け、入力された前記第2の言語の文字列を表示する表示画面を有し、前記第2の言語の文字列が入力された場合、検索された訳文語の中から、前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出し、前記表示画面を制御して、抽出された入力候補を表示することを特徴とする。
【0009】
この発明によれば、入力された原文データに関連する訳文語のみを辞書データベースから検索することができる。そして、検索された訳文語の中から、入力された文字列と一致または関連する訳文語のみを抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。
【0010】
また、上記発明において、表示された前記入力候補の中から、任意の前記入力候補の選択を受け付け、選択された前記入力候補を、表示された前記第2の言語の文字列の代わりに、表示させることとしてもよい。
【0011】
この発明によれば、ユーザに提示した入力候補のうち、ユーザによって選択された任意の入力候補を、訳文データとしてユーザの代わりに入力することができる。
【0012】
また、上記発明において、前記原文データの範囲の指定を受け付け、前記原文データの指定された範囲を分解した結果得られる前記言語単位の原文語を取得することとしてもよい。
【0013】
この発明によれば、入力された原文データのうち、ユーザが所望する適切な範囲に関連する訳文語のみを辞書データベースから検索することができる。
【0014】
また、上記発明において、検索された訳文語の信頼度を算出し、抽出された入力候補とともに算出された信頼度に関する情報を表示することとしてもよい。
【0015】
この発明によれば、ユーザが入力候補を選択する際の判断基準とすることができる入力候補の信頼度をユーザに提示することができる。
【0016】
また、上記発明において、抽出された入力候補を、所定の条件に基づく表示順序で表示することとしてもよい。
【0017】
この発明によれば、ユーザが入力候補を選択する際の判断基準とすることができる順序で入力候補をユーザに提示することができる。
【0018】
また、上記発明において、抽出された入力候補が所定数より多い場合、抽出された入力候補を表示しないこととしてもよい。
【0019】
この発明によれば、ユーザが混乱を招くような多数の入力候補がユーザに提示されることを防ぐことができるだけでなく、さらなる文字列の入力により入力候補の絞込みをユーザに促すことができる。
【0020】
また、上記発明において、検索された訳文語を表示することとしてもよい。
【0021】
この発明によれば、ユーザが文字列を入力する際に、検索された訳文語をユーザに参照させることができる。
【0022】
また、上記発明において、前記第1の言語の文字列の入力を受け付け、前記第1の言語の文字列が入力された場合、検索された訳文語の中から、入力された前記第1の言語の文字列と一致または関連する前記第1の言語の文字列に関連付けられている訳文語を入力候補として抽出することとしてもよい。
【0023】
この発明によれば、検索された訳文語の中から、ユーザにとって使い慣れた第1の言語によって入力された文字列に基づく訳文語を抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。
【0024】
また、上記発明において、前記第1の言語の文字列の入力を受け付け、前記第1の言語の文字列が入力された場合、前記原文データにおける入力された前記第1の言語の文字列から始まる所定範囲内の文字列から、その翻訳文を生成し、生成された翻訳文を入力候補として抽出することとしてもよい。
【0025】
この発明によれば、原文データの翻訳文を、入力された第1の言語の文字列から始まる適切な範囲で、ユーザに提示することができる。
【0026】
また、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法は、第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法であって、前記第2の言語の文字列の入力を受け付け、入力された前記第2の言語の文字列を表示し、前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出し、入力された前記第2の言語の文字列を表示する表示画面を制御して、抽出された入力候補を表示することを特徴とする。
【0027】
この発明によれば、入力された原文データに関連する訳文語であって、なおかつ入力された文字列と一致または関連する訳文語のみをテーブルから抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。
【発明の効果】
【0028】
本発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法によれば、より容易かつ適切に、翻訳文の入力作業をユーザにおこなわせることができ、結果的に、翻訳文の入力作業における作業効率の向上を図ることができるという効果を奏する。
【発明を実施するための最良の形態】
【0029】
以下に添付図面を参照して、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法の好適な実施の形態を詳細に説明する。
【0030】
(実施の形態)
(翻訳文入力支援装置のハードウェア構成)
まず、この発明の実施の形態にかかる翻訳文入力支援装置のハードウェア構成について説明する。図1は、この発明の実施の形態にかかる翻訳文入力支援装置のハードウェア構成を示すブロック図である。
【0031】
図1において、翻訳文入力支援装置100は、CPU101と、ROM102と、RAM103と、HDD(ハードディスクドライブ)104と、HD(ハードディスク)105と、FDD(フレキシブルディスクドライブ)106と、着脱可能な記憶媒体の一例としてのFD(フレキシブルディスク)107と、ディスプレイ108と、I/F(インターフェース)109と、キーボード110と、マウス111と、スキャナ112と、プリンタ113と、を備えており、各構成部はバス120によってそれぞれ接続されている。
【0032】
ここで、CPU101は、翻訳文入力支援装置100の全体の制御を司る。ROM102は、ブートプログラムなどのプログラムを記憶している。RAM103は、CPU101のワークエリアとして使用される。HDD104は、CPU101の制御にしたがってHD105に対するデータのリード/ライトを制御する。HD105は、HDD104の制御で書き込まれたデータを記憶する。
【0033】
FDD106は、CPU101の制御にしたがってFD107に対するデータのリード/ライトを制御する。FD107は、FDD106の制御で書き込まれたデータを記憶したり、FD107に記憶されたデータを読み取らせたりする。
【0034】
また、着脱可能な記憶媒体として、FD107のほか、CD−ROM(CD−R、CD−RW)、MO、DVD(Digital Versatile Disk)、メモリーカードなどであってもよい。ディスプレイ108は、カーソル、アイコンあるいはツールボックスをはじめ、文章、画像、機能情報などのデータを表示する。このディスプレイ108は、たとえば、CRT、TFT液晶ディスプレイ、プラズマディスプレイなどを採用することができる。
【0035】
I/F109は、通信回線を通じてインターネットなどのネットワーク114に接続され、このネットワーク114を介して他の装置に接続される。また、I/F109は、USBケーブルなどの通信ケーブルなどが接続され、この通信ケーブルを介してUSB機器などの他の装置に接続される。そして、I/F109は、ネットワーク114と内部のインターフェースを司り、当該翻訳文入力支援装置100と接続された他の装置からのデータの入出力を制御する。I/F109には、たとえばモデム、LANアダプタ、USBポートなどを採用することができる。
【0036】
キーボード110は、文字、数字、各種指示などの入力のためのキーを備え、データの入力をおこなう。また、タッチパネル式の入力パッドやテンキーなどであってもよい。マウス111は、カーソルの移動や範囲選択、あるいはウィンドウの移動やサイズの変更などをおこなう。ポインティングデバイスとして同様に機能を備えるものであれば、トラックボールやジョイスティックなどであってもよい。
【0037】
スキャナ112は、画像を光学的に読み取り、翻訳文入力支援装置100内に画像データを取り込む。なお、スキャナ112は、OCR機能を持たせてもよい。また、プリンタ113は、画像データや文章データを印刷する。プリンタ113には、たとえば、レーザプリンタやインクジェットプリンタを採用することができる。
【0038】
(翻訳文入力支援装置100の機能的構成)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100の機能的構成について説明する。図2は、この発明の実施の形態にかかる翻訳文入力支援装置100の機能的構成を示すブロック図である。
【0039】
図2において、翻訳文入力支援装置100は、記憶部200と、入力部201と、指定部202と、取得部203と、検索部204と、表示部205と、抽出部206と、表示制御部207と、選択部208と、から構成されている。
【0040】
図2において、記憶部200は、第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と、第2の言語によって表現されたその訳文語とを関連付けて記憶するデータベースである。なお、原文語には、異なる言語単位の訳文語が関連付けられていてもよい。たとえば、原文語の言語単位が単語であって、その訳文語の言語単位が熟語であってもよい。また、原文語には、複数の訳文語が関連付けられていてもよい。
【0041】
また、記憶部200は、当該翻訳文入力支援装置100に備えられているものに限らず、当該翻訳文入力支援装置100と接続された他の装置に備えられているものであってもよい。記憶部200は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107によってその機能を実現する。なお、以降の記述においては、一例として、第1の言語として日本語を、第2の言語として英語を用いて説明する。
【0042】
入力部201は、第1の言語(日本語)によって表現された原文データの入力を受け付ける。ここで原文データとしては、ユーザによるキーボード操作またはマウス操作によって入力されたものに限らず、たとえば、所定の記憶媒体に記録されたテキストファイルなどから読み取ったものであってもよい。この場合、上記記憶媒体は、当該翻訳文入力支援装置100に備えられているものに限らず、当該翻訳文入力支援装置100と接続された他の装置に備えられているものであってもよい。また、入力部201は、後述する抽出部206によって抽出処理が行われる際の検索キーとなる第2の言語(英語)の文字列の入力を受け付ける。
【0043】
なお、入力部201によって入力された各種データは、メモリなどの記録媒体に一時的に記録される。入力部201は、具体的には、たとえば図1に示したI/F(インターフェース)109、キーボード110、マウス111などによってその機能を実現する。
【0044】
指定部202は、入力部201によって入力された原文データのうち、翻訳文の入力支援対象とする範囲(以下、「対象範囲」という)の指定を受け付ける。ここで、対象範囲を指定する方法としては、たとえば、ユーザがマウスやキーボードを用いて、画面に表示された原文データに対して、ドラッグ操作をおこなうことによって指定する方法などが挙げられる。
【0045】
ここで、ユーザは、原文データのうちの、一部だけでなく全部(全文)を対象範囲として指定することができる。また、複数の対象範囲を指定することもできる。このとき、明示的な対象範囲の指定がない場合は、暗黙的に全部(全文)が対象範囲となる。
【0046】
なお、指定部202によって対象範囲が指定された原文データは、メモリなどの記録媒体に一時的に記録される。指定部202は、具体的には、たとえば図1に示したI/F(インターフェース)109、キーボード110、マウス111などによってその機能を実現する。
【0047】
取得部203は、入力部201によって入力された原文データの指定部202によって指定された対象範囲を分解した結果得られる言語単位の原文語を取得する。原文データは、形態素解析プログラムや語句抽出プログラムなど、既知の技術を利用することで分解することができる。具体的には、形態素解析プログラムや語句抽出プログラムなどを用いて、原文データを分割し、分割された原文データの中から、所定の品詞(たとえば単語)に属する原文語を抽出する。
【0048】
なお、取得部203によって取得された言語単位の原文語は、メモリなどの記録媒体に一時的に記録される。取得部203は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0049】
検索部204は、記憶部200によって記憶されている訳文語の中から、取得部203によって取得された原文語に関連付けられている訳文語を検索する。ここで、検索部204は、記憶部200において一つの原文語に対して複数の訳文語が関連付けられている場合は、関連付けられている全ての訳文語を記憶部200から検索する。
【0050】
なお、検索部204は、原文語に関連付けられている訳文語のみならず、原文語が部分一致する原文語に関連付けられている訳文語を検索するようにしてもよい。たとえば、取得部203によって取得された原文語が「日本」であった場合、この原文語「日本」に関連付けられている訳文語「japan」のみならず、この原文語「日本」と部分一致する原文語「日本語」に関連付けられている訳文語「japanese」を検索するようにしてもよい。
【0051】
反対に、たとえば、取得部203によって取得された原文語が「日本語」であった場合、この原文語「日本語」に関連付けられている訳文語「japanese」のみならず、この原文語「日本語」と部分一致する原文語「日本」に関連付けられている訳文語「japan」を検索するようにしてもよい。
【0052】
この場合、部分一致する原文語のうち、あらかじめ設定されている最低一致文字数を満たす原文語に関連付けられている訳文語のみを検索するようにしてもよい。たとえば、最低一致文字数に「3」が設定されている場合において、取得部203によって取得された原文語が「日本語」であった場合、この原文語「日本語」と部分一致する原文語「日本」は2文字しか部分一致していないため、この原文語「日本」に関連付けられている訳文語「japan」は検索対象外となる。
【0053】
なお、検索部204によって検索された訳文語は、メモリなどの記録媒体に一時的に記録される。検索部204は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0054】
表示部205は、表示画面を有し、入力部201によって入力された第1の言語(日本語)によって表現された原文データを表示する。また、表示部205は、入力部201によって入力された第2の言語(英語)の文字列を表示する。そして、表示部205は、後述する表示制御部207の制御によって、抽出部206によって抽出された訳文語を表示する。表示部205は、具体的には、たとえば図1に示したディスプレイ108によってその機能を実現する。
【0055】
抽出部206は、入力部201によって第2の言語(英語)の文字列が入力された場合、検索部204によって検索された訳文語の中から、入力部201によって入力された第2の言語(英語)の文字列と一致または関連する訳文語を入力候補として抽出する。たとえば、検索部204によって「lake」、「life」および「like」が訳文語として検索されている場合において、入力部201によって「l」が第2の言語(英語)の文字列として入力された場合、抽出部206は、この中から、「lake」、「life」および「like」を入力候補として抽出する。
【0056】
続いて、入力部201によって「i」が入力され、結果的に入力部によって入力された文字列が「li」となった場合、抽出部206は、この中から、「life」および「like」を入力候補として抽出する。
【0057】
なお、抽出部206は、入力部201によって、第2の言語(英語)の文字列ではなく第1の言語(日本語)の文字列が入力された場合、検索部204によって検索された訳文語の中から、入力部201によって入力された第1の言語(日本語)の文字列と一致または関連する原文語とその訳文語を入力候補として抽出するようにしてもよい。ただし、この場合、検索部204は、辞書データベースから、訳文語だけでなく、訳文語に関連付けられている日本語も検索することが前提となる。
【0058】
たとえば、検索部204によって「japan 日本」、「japanese 日本語」、「jp にほん」、「sunday 日曜日」が検索されている場合において、入力部201によって「日」が第1の言語(日本語)の文字列として入力された場合、抽出部206は、この中から、「japan 日本」、「japanese 日本語」および「sunday 日曜日」を入力候補として抽出する。
【0059】
さらに、抽出部206は、入力部201によって、第1の言語(日本語)の文字列が入力された場合、入力部201によって入力された原文データのうち、指定部202によって指定された対象範囲内において、入力された文字列から始まる所定範囲(たとえば、「。」や「、」まで)の文字列を自動翻訳して、その翻訳文を抽出結果とするようにしてもよい。
【0060】
たとえば、入力部201によって入力された原文データのうち、指定部202によって指定された対象範囲が「日本語は日本の言語です。また、・・・」であった場合において、入力部201によって「日」が第1の言語(日本語)の文字列として入力された場合、
「日本語は日本の言語です」の翻訳文「japanese is language of japan」と、「日本の言語です」の翻訳文「language of japan」とを抽出結果とする。
【0061】
なお、抽出部206によって抽出された入力候補は、メモリなどの記録媒体に一時的に記録される。抽出部206は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0062】
表示制御部207は、抽出部206によって抽出された訳文語(入力候補)を、表示部205に表示する。このとき、訳文語だけでなく、この訳文語が登録されていた辞書データベースを識別する情報や、この訳文語に関連付けられている原文語や説明文、この訳文語の語句の種類などを同時に表示するようにしてもよい。たとえば、抽出部206によって抽出された訳文語(入力候補)が「japan」であった場合の表示の一例として、「japan 日本」、「japan 日本 ××辞典」、「japan 日本 にほん(日本) ××辞典」、「japan 日本 ××辞典 名詞」などが挙げられる。
【0063】
また、抽出部206によって抽出された訳文語(入力候補)が複数の場合、ランキング表示するようにしてもよい。たとえば、訳文語が登録されていた辞書データベースの優先度順や使用頻度順に表示する方法などが挙げられる。さらに、抽出部206によって抽出された訳文語(入力候補)が所定数以上の場合、表示しないようにしてもよい。
【0064】
また、表示制御部207は、すでに表示部205に表示されている第2の言語(英語)の文字列(入力部201によって入力された第2の言語(英語)の文字列)の代わりに、後述する選択部208によって選択された任意の入力候補(訳文語)を、表示部205に表示する。
【0065】
表示制御部207は、さらに、検索部204によって検索された訳文語を表示部205に表示するようにしてもよい。表示制御部207は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0066】
選択部208は、表示部205によって表示された入力候補(訳文語)の中から、任意の入力候補(訳文語)の選択を受け付ける。ここで、入力候補を選択する方法としては、たとえば、ユーザがマウスを用いる方法や、入力候補を矢印キー(↑、↓)で選択する方法などが挙げられる。マウスをクリックするか、ENTERキーを押すことにより、その入力候補を確定し、訳文領域に入力することができる。
【0067】
なお、選択部208によって選択された入力候補は、メモリなどの記録媒体に一時的に記録される。選択部208は、具体的には、たとえば図1に示したキーボード110、マウス111などによってその機能を実現する。
【0068】
(辞書データベースの一例)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる辞書データベースの一例について説明する。図3は、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる辞書データベースの一例を示す説明図である。
【0069】
図3に示すように、翻訳文入力支援装置100には、4つの異なる辞書データベース(辞書データベース310,320,330,340)が用いられる。各辞書データベース310〜340は、少なくとも、データ列「原文語」と、データ列「訳文語」とを含んで構成されている。翻訳文入力支援装置100に用いる辞書データベースは1つでもよいが、このように、複数の辞書データベースを用いることによって、各辞書データベースを互いに補完させることができる。
【0070】
たとえば、図3において、辞書データベース320,330,340には、原文語「その」に対して、訳文語が関連付けられていないが、辞書データベース310は、原文語「その」に対して、3つの訳文語「that」、「the」、および「whose」が関連付けられていることによって、辞書データベース320,330,340を補完することができる。
【0071】
また、たとえば、図3において、辞書データベース330には、原文語「アルカリ溶液」に対して、訳文語「alkaline solution」のみが関連付けられているが、辞書データベース320は、原文語「アルカリ溶液」に対して、訳文語「alkaline solution」に加えて、訳文語「alkali solution」が関連付けられていることによって、辞書データベース330を補完することができる。
【0072】
ここで、辞書データベースは、市販されているものや、一般公開されているものに限らず、たとえば、ユーザが定義したものなどを用いるようにしてもよい。これにより、他の辞書データベースに登録されていない訳文語やユーザが多用する訳文語を、任意の原文語と関連付けておくことができる。
【0073】
さらに、辞書データベースには、原文語と訳文語とが関連付けられているだけでなく、たとえば、原文語または訳文語と、説明文とが関連付けられているものを用いてもよい。これにより、ユーザが複数提示された訳文語の中から任意の訳文語を選択する際に、その判断材料とすることができる文字列を、原文語または訳文語と関連付けておくことができる。
【0074】
(翻訳文入力支援装置100による翻訳文入力支援処理の手順)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100による翻訳文入力支援処理の手順について説明する。図4は、この発明の実施の形態にかかる翻訳文入力支援装置100による翻訳文入力支援処理の手順の一例を示すフローチャートである。
【0075】
まず、入力部201によって、第1の言語(日本語)によって表現された原文データの入力を受け付ける(ステップS401)。入力部201によって入力された原文データの一例については、図5を用いて後述する。
【0076】
つぎに、指定部202によって、ステップS401で入力された原文データのうち、対象範囲の指定を受け付ける(ステップS402)。指定部202によって対象範囲が指定された原文データの一例については、図6を用いて後述する。
【0077】
つぎに、取得部203によって、ステップS402で指定された対象範囲を分解した結果得られる言語単位の原文語を取得する(ステップS403)。取得部203によって取得された言語単位の原文語の一例については、図7および図8を用いて後述する。
【0078】
そして、検索部204によって、記憶部200によって記憶されている訳文語の中から、ステップS403で取得された原文語に関連付けられている訳文語を検索する(ステップS404)。検索部204によって検索された訳文語の一例については、図9および図10を用いて後述する。なお、このとき、表示制御部207によって、ステップS404で検索された訳文語を表示部205に表示するようにしてもよい。
【0079】
続いて、入力部201によって、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたか否かを判断する(ステップS405)。ステップS405において、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けていないと判断した場合(ステップS405:No)は、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたと判断されるまで繰り返し上記判断処理(ステップS405)をおこなう。
【0080】
一方、ステップS405において、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたと判断した場合(ステップS405:Yes)は、抽出部206によって、ステップS404で検索された訳文語の中から、入力部201によって入力された第2の言語(英語)または第1の原語(日本語)の文字列と一致または関連する訳文語(入力候補)が抽出されたか否かを判断する(ステップS406)。
【0081】
ステップS406において、入力候補が抽出されていないと判断した場合(ステップS406:No)は、ステップS410へ進む。一方、ステップS406において、入力候補が抽出されたと判断した場合(ステップS406:Yes)は、表示制御部207によって、抽出部206によって抽出された入力候補を、表示部205に表示する(ステップS407)。表示部205に表示された入力候補の一例については、図11および図12を用いて後述する。
【0082】
そして、選択部208によって、ステップS407で表示された入力候補の中から、任意の入力候補の選択を受け付けたか否かを判断する(ステップS408)。
【0083】
ステップS408において、任意の入力候補の選択を受け付けていないと判断した場合(ステップS408:No)は、ステップS405に戻って、再び、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたか否かの判断処理をおこなう。
【0084】
一方、ステップS408において、任意の入力候補の選択を受け付けたと判断した場合(ステップS408:Yes)は、すでに表示部205に表示されている第2の言語(英語)または第1の原語(日本語)の文字列(入力部201によって入力された第2の言語(英語)または第1の原語(日本語)の文字列)の代わりに、選択部208によって選択された任意の入力候補を、表示部205に表示して(ステップS409)、訳文の編集を終了するか否かを判断する(ステップS410)。
【0085】
ここで、訳文の編集を終了するか否かの判断は、たとえば、ユーザがおこなった「終了」や「保存」などの操作を検知することで、訳文の編集を終了すると判断することができる。ステップS410において、訳文の編集を終了すると判断した場合は(ステップS410:Yes)、一連の処理を終了する。一方、ステップS410において、訳文の編集を終了しないと判断した場合は(ステップS410:No)、ステップS405に戻って、再び、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたか否かの判断処理をおこなう。
【0086】
(原文データの一例)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる原文データの一例について説明する。図5は、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる原文データの一例を示す説明図である。
【0087】
図5において、画面500は、ディスプレイ108(図1参照)の画面上に表示された、図4を用いて説明した手順による翻訳文入力支援処理をおこなう翻訳文入力支援ツールの画面であって、原文データ入力欄510と、訳文データ入力欄520と、全文検索ボタン530と、部分検索ボタン540と、保存ボタン550と、を備えて構成されている。
【0088】
このうち、原文データ入力欄510には、翻訳対象とする原文データが入力される。たとえば、図5に示す画面500においては、原文入力欄510に、原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」が入力されている。ここで原文データ入力欄510への原文データの入力方法としては、ユーザによるキーボード110やマウス111の操作によるものに限らず、たとえば、所定の記憶媒体に記録されたテキストファイルなどから読み取るなどの方法によるものであってもよい。
【0089】
(対象範囲が指定された原文データの一例)
つぎに、対象範囲が指定された原文データの一例について説明する。図6は、対象範囲が指定された原文データの一例を示す説明図である。
【0090】
図6に示す画面500は、図5に示した画面500の状態から、たとえばユーザがおこなったキーボード110やマウス111の操作によって、原文データ入力欄510に表示されている原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」のうち、文字列「アルカリ溶液を攪拌する」が対象範囲として指定されている状態を示す。
【0091】
このように、原文データのうち、任意の文字列を対象範囲として指定してもよいし、全文を対象範囲として指定してもよい。また、たとえば上記原文データのうち「その物質は」と「生成される」とを対象範囲とするなど、複数の対象範囲を指定してもよい。なお、本実施の形態においては、図5に示した画面500の状態のように、明示的な対象範囲の指定がない場合は、暗黙的に全文が対象範囲となる。
【0092】
(取得部203によって取得された言語単位の原文語の一例)
つぎに、取得部203によって取得された言語単位の原文語の一例について説明する。図7および図8は、取得部203によって取得された言語単位の原文語の一例を示す説明図である。
【0093】
このうち、図7は、たとえば、図5に示した画面500の状態(原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」に対する対象範囲が指定されていない状態)から、全文検索ボタン530が押下されたことによって、原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」の全文に対する分解処理が形態素解析プログラムや語句抽出プログラムなどによっておこなわれ、その結果の一例として、「その」、「物質」、「アルカリ溶液」、「攪拌」および「生成」が取得部203によって取得されたことを示す。
【0094】
一方、図8は、たとえば、図6に示した画面500の状態(原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」のうちの文字列「アルカリ溶液を攪拌する」が対象範囲として指定された」状態)から、部分検索ボタン540が押下されたことによって、原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」のうちの文字列「アルカリ溶液を攪拌する」に対する分解処理が形態素解析プログラムや語句抽出プログラムなどによっておこなわれ、その結果の一例として、「アルカリ溶液」および「攪拌」が取得部203によって取得されたことを示す。
【0095】
このように、取得部203によって取得された原文語は、検索部204による訳文語の検索処理に用いられるため、たとえば図1に示したROM102、RAM103、HD105、FD107などの記憶媒体に一時的に記録される。
【0096】
(検索部204によって検索された訳文語の一例)
つぎに、検索部204によって検索された訳文語の一例について説明する。図9および図10は、検索部204によって検索された訳文語の一例を示す説明図である。
【0097】
このうち、図9は、取得部203によって取得された原文語が、図7に示したものであった場合において、辞書データベース310〜340(図3参照)に対する検索処理が検索部204によっておこなわれ、その結果の一例として、辞書データベース310〜340から検索された、図7に示した原文語と関連付けられている訳文語を示す。
【0098】
一方、図10は、取得部203によって取得された原文語が、図8に示したものであった場合において、辞書データベース310〜340(図3参照)に対する検索処理が検索部204によっておこなわれ、その結果の一例として、辞書データベース310〜340から検索された、図7に示した原文語と関連付けられている訳文語を示す。
【0099】
たとえば、図9において、取得部203によって取得された原文語「その」に着目した場合、これに関連付けられている訳文語として、辞書1(辞書データベース310)から、「that」、「the」および「whose」が検索されたことを示す。また、たとえば、図9および図10において、取得部203によって取得された原文語「アルカリ溶液」に着目した場合、これに関連付けられている訳文語として、辞書2(辞書データベース320)から、「alkali solution」が、辞書2(辞書データベース320)および辞書3(辞書データベース330)から、「alkaline solution」が検索されたことを示す。
【0100】
このように、検索部204によって検索された訳文語は、抽出部206による入力候補の抽出処理に用いられるため、たとえば図1に示したROM102、RAM103、HD105、FD107などの記憶媒体に一時的に記録される。
【0101】
(表示部205に表示された入力候補の一例)
つぎに、表示部205に表示された入力候補の一例について説明する。図11および図12は、表示部205に表示された入力候補の一例を示す説明図である。
【0102】
図11は、訳文データ入力欄520において、文字列「The material is generated by stir the 」に続いて、文字列「a」が入力されたときの、画面500の状態を示したものである。
【0103】
このように、文字列「a」が入力されたことによって、画面500には、図9に示した訳文語(検索部204によって検索された訳文語)の中から抽出された、文字列「a」を含む訳文語「agent」、「alkali solution」および「alkaline solution」が入力候補として表示されている。
【0104】
一方、図12は、訳文データ入力欄520において、文字列「The material is generated by stir the 」に続いて、文字列「al」が入力されたときの、画面500の状態(すなわち、図11に示した画面500の状態からさらに訳文データ入力欄520において文字列「l」が入力された状態)を示したものである。
【0105】
このように、文字列「al」が入力されたことによって、画面500には、図9に示した訳文語(検索部204によって検索された訳文語)の中から抽出された、文字列「al」を含む訳文語「alkali solution」および「alkaline solution」が入力候補として表示されている。
【0106】
このように、訳文データ入力欄520において文字列「l」が追加入力されたことによって、結果的に、図11に示した3つの入力候補(「agent」、「alkali solution」および「alkaline solution」)は、図12に示した2つ(「alkali solution」および「alkaline solution」)の入力候補に絞り込まれた形となる。
【0107】
なお、画面500に表示された入力候補は、キーボード110やマウス111の操作によるユーザ選択が可能であり、たとえばユーザは、この中から任意の入力候補を選択することによって、選択した入力候補を、入力した文字列の代わりに訳文データ入力欄520に表示することができる。すなわち、訳文データ入力欄520に入力した文字列を、選択した入力候補に変換することができる。
【0108】
(表示部205に表示された任意の入力候補の一例)
つぎに、表示部205に表示された任意の入力候補の一例について説明する。図13は、表示部205に表示された任意の入力候補の一例を示す説明図である。
【0109】
図13は、図12に示した画面500の状態から、さらに、表示された2つの入力候補(「alkali solution」および「alkaline solution」)の中から任意の入力候補として「alkali solution」が選択されたときの、画面500の状態を示したものである。
【0110】
このように、入力候補「alkali solution」が選択されたことによって、訳文データ入力欄520は、既に入力されていた文字列「The material is generated by stir the 」に続いて、選択された入力候補「alkali solution」が表示された状態となっている。
【0111】
(表示部205に表示された入力候補の別の一例)
つぎに、表示部205に表示された入力候補の別の一例について説明する。図14は、表示部205に表示された入力候補の別の一例を示す説明図である。
【0112】
図14は、訳文データ入力欄520において、文字列「The material is generated by stir the 」に続いて、英語(第2の原語)の文字列ではなく、日本語(第1の原語)の文字列「アルカ」が入力されたときの、画面500の状態を示したものである。
【0113】
このように、日本語の文字列「アルカ」が入力されたことによって、画面500には、図示を省略する辞書データベースの中から検索された、文字列「アルカ」を含む原文語「アルカリ」、「アルカリ溶液」とその訳文語「alkali」、「alkaline」、「alkali solution」、および「alkaline solution」が入力候補として表示されている。
【0114】
そして、たとえば、この入力候補の中から、「alkali solution」が選択された場合、訳文データ入力欄520には、既に入力されていた文字列「The material is generated by stir the 」に続いて、選択された入力候補「alkali solution」が表示される。
【0115】
以上説明したように、本実施の形態にかかる翻訳文入力支援装置100は、入力された原文データに関連する訳文語のみを辞書データベース310〜340から検索することができる。そして、検索された訳文語の中から、入力された文字列を含む訳文語のみを抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。さらに、ユーザによって選択された任意の入力候補を、訳文データとしてユーザの代わりに入力することができる。
【0116】
これにより、ユーザにとって不要となる、原文データとの関連性が低い訳文語が、ユーザに提示されることを防ぐことができる。さらに、ユーザが入力した文字列を含まない訳文語が、ユーザに提示されることを防ぐことができる。このため、ユーザは、わずかな文字列(たとえば先頭文字)だけを入力して、その結果提示された、原文データとの関連性が高く、かつユーザが入力した文字列を含む入力候補の中から、対象の入力候補を選択するだけといった簡単な操作によって、容易かつ適切に意図した訳文語を入力することができる。その結果、翻訳文の入力作業における作業効率の向上を図ることができる。
【0117】
また、本実施の形態にかかる翻訳文入力支援装置100は、対象範囲を指定することができるため、原文データのうちの指定された対象範囲に関連する訳文語のみを辞書データベース310〜340から検索することができる。そして、検索された訳文語の中から、入力された文字列を含む訳文語のみを抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。さらに、ユーザによって選択された任意の入力候補を、訳文データとしてユーザの代わりに入力することができる。
【0118】
これにより、ユーザにとって不要となる、上記対象範囲との関連性が低い訳文語が、ユーザに提示されることを防ぐことができる。さらに、ユーザが入力した文字列を含まない訳文語が、ユーザに提示されることを防ぐことができる。このため、ユーザは、対象範囲を指定したうえ、わずかな文字列(たとえば先頭文字)だけを入力して、その結果提示された、上記対象範囲との関連性が高く、かつユーザが入力した文字列を含む入力候補の中から、対象の入力候補を選択するだけといった簡単な操作によって、容易かつ適切に意図した訳文語を入力することができる。その結果、翻訳文の入力作業における作業効率のさらなる向上を図ることができる。
【0119】
以上、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法の基本的な構成による好適な実施の形態を説明したが、検索部204によって検索された訳文語の信頼度を算出する算出部をさらに備え、表示制御部207は、抽出部206によって抽出された訳文語(入力候補)とともに算出部によって算出された信頼度に関する情報を、表示部205に表示する構成としてもよい。これにより、ユーザは表示された入力候補の中から、より信頼度の高い入力候補を選択することができる。
【0120】
この場合の、算出部は、たとえば、あらかじめ用意された対訳例文データベース(第1の言語で記述された例文(原語例文)と第2の言語で記述された例文(訳語例文)との対である対訳例文が格納されたデータベース)から、取得部203によって取得された原文語と抽出部206によって抽出された訳文語(入力候補)との対を検索キーとして検索したときの検索件数を信頼度とするようにしてもよい。そして、検索件数の多い訳文語(入力候補)ほど、信頼度の高い訳文語(入力候補)として扱うようにしてもよい。
【0121】
また、あらかじめ辞書データベースごとに重み値を設定しておき、上記検索処理によって求められた検索件数と重み値とを乗算した値を信頼度とするようにしてもよい。そして算出された値の大きい訳文語(入力候補)ほど、信頼度の高い訳文語(入力候補)として扱うようにしてもよい。
【0122】
そして、信頼度の高い入力候補に「◎」を付与して「◎:japan 日本」のように表示部205に表示したり、信頼度の低い入力候補に「×」を付与して「×:jp にほん」のように表示するようにしてもよい。なお、信頼度に関する情報の表示方法は、上記に限らず、たとえば、信頼度の高い入力候補を太字で表示したり、下線を付与したり、文字色を変更するなど、信頼度の高低を容易に識別できる表示方法であれば、どのような方法を用いてもよい。
【0123】
なお、本実施の形態で説明した翻訳文入力支援方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション、CAD等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記憶媒体に記録され、コンピュータによって記憶媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。
【0124】
(付記1)第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得させる取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索させる検索工程と、
前記第2の言語の文字列の入力を受け付けさせる入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出させる抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援プログラム。
【0125】
(付記2)前記表示工程によって表示された前記入力候補の中から、任意の前記入力候補の選択を受け付ける選択工程をさらに備え、
前記表示工程は、前記選択工程によって選択された前記入力候補を、前記表示工程によって表示された前記第2の言語の文字列の代わりに、表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0126】
(付記3)前記原文データの範囲の指定を受け付ける指定工程をさらに備え、
前記取得工程は、
前記原文データの前記指定工程によって指定された範囲を分解した結果得られる前記言語単位の原文語を取得することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0127】
(付記4)前記検索工程によって検索された訳文語の信頼度を算出する算出工程をさらに備え、
前記表示工程は、
前記抽出工程によって抽出された入力候補とともに前記算出工程によって算出された信頼度に関する情報を表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0128】
(付記5)前記入力工程は、
前記第1の言語の文字列の入力を受け付け、
前記抽出工程は、
前記入力工程によって前記第1の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第1の言語の文字列と一致または関連する前記第1の言語の文字列に関連付けられている訳文語を入力候補として抽出することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0129】
(付記6)前記表示工程は、前記抽出工程によって抽出された入力候補を、所定の条件に基づく表示順序で表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0130】
(付記7)前記表示工程は、前記抽出工程によって抽出された入力候補が所定数より多い場合、前記抽出工程によって抽出された入力候補を表示しないことを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0131】
(付記8)前記表示工程は、前記検索工程によって検索された訳文語を表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0132】
(付記9)前記入力工程は、
前記第1の言語の文字列の入力を受け付け、
前記抽出工程は、
前記入力工程によって前記第1の言語の文字列が入力された場合、前記原文データにおける前記入力工程によって入力された前記第1の言語の文字列から始まる所定範囲内の文字列から、その翻訳文を生成し、生成された翻訳文を入力候補として抽出することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0133】
(付記10)第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記第2の言語の文字列の入力を受け付けさせる入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出させる抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援プログラム。
【0134】
(付記11)付記1〜10のいずれか一つに記載の翻訳文入力支援プログラムを記録したコンピュータ読み取り可能な記憶媒体。
【0135】
(付記12)第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援装置であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得手段と、
前記取得手段によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索手段と、
前記第2の言語の文字列の入力を受け付ける入力手段と、
前記入力手段によって入力された前記第2の言語の文字列を表示する表示画面を有する表示手段と、
前記入力手段によって前記第2の言語の文字列が入力された場合、前記検索手段によって検索された訳文語の中から、前記入力手段によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出手段と、
前記表示画面を制御して、前記抽出手段によって抽出された入力候補を前記表示手段に表示する表示制御手段と、
を備えたことを特徴とする翻訳文入力支援装置。
【0136】
(付記13)第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援装置であって、
前記第2の言語の文字列の入力を受け付ける入力手段と、
前記入力手段によって入力された前記第2の言語の文字列を表示する表示画面を有する表示手段と、
前記入力手段によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力手段によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出手段と、
前記表示画面を制御して、前記抽出手段によって抽出された入力候補を前記表示手段に表示する表示制御手段と、
を備えたことを特徴とする翻訳文入力支援装置。
【0137】
(付記14)第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援方法であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索工程と、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援方法。
【0138】
(付記15)第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援方法であって、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援方法。
【産業上の利用可能性】
【0139】
以上のように、本発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法は、翻訳文の作成時に用いられる文書ソフトウェアなどへの利用に適している。
【図面の簡単な説明】
【0140】
【図1】この発明の実施の形態にかかる翻訳文入力支援装置のハードウェア構成を示すブロック図である。
【図2】この発明の実施の形態にかかる翻訳文入力支援装置の機能的構成を示すブロック図である。
【図3】この発明の実施の形態にかかる翻訳文入力支援装置に用いられる辞書データベースの一例を示す説明図である。
【図4】この発明の実施の形態にかかる翻訳文入力支援装置による翻訳文入力支援処理の手順の一例を示すフローチャートである。
【図5】この発明の実施の形態にかかる翻訳文入力支援装置に用いられる原文データの一例を示す説明図である。
【図6】対象範囲が指定された原文データの一例を示す説明図である。
【図7】取得部によって取得された言語単位の原文語の一例を示す説明図である。
【図8】取得部によって取得された言語単位の原文語の一例を示す説明図である。
【図9】検索部によって検索された訳文語の一例を示す説明図である。
【図10】検索部によって検索された訳文語の一例を示す説明図である。
【図11】表示部に表示された入力候補の一例を示す説明図である。
【図12】表示部に表示された入力候補の一例を示す説明図である。
【図13】表示部に表示された任意の入力候補の一例を示す説明図である。
【図14】表示部に表示された入力候補の別の一例を示す説明図である。
【符号の説明】
【0141】
100 翻訳文入力支援装置
200 記憶部
201 入力部
202 指定部
203 取得部
204 検索部
205 表示部
206 抽出部
207 表示制御部
208 選択部
【技術分野】
【0001】
この発明は、コンピュータを用いた翻訳文の入力を支援する翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法に関する。
【背景技術】
【0002】
従来より、たとえば日本語によって表現された原文から、英語によって表現される翻訳文を作成する翻訳作業においては、一般的にワープロなどの文書作成ソフトが用いられている。また、このような文書作成ソフトを用いた翻訳作業においては、ユーザが翻訳文を入力する際に、原文語に対応する訳語やその正確なスペルがわからない場合、その都度、辞書など補助的な文書を参照することによって、適切な訳語を入力するといった方法が用いられているため、翻訳作業にかかる作業時間が長時間化するといった問題が生じていた。
【0003】
そこで、たとえばユーザが翻訳文を入力する際に、訳語やその正確なスペルがわからない単語をユーザに指定させることによって、指定された単語に対応する訳語を辞書データベースから検索し、検索された訳語を表示することができる技術が開示されている(たとえば、下記特許文献1参照。)。
【0004】
【特許文献1】特開2006−107261号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載の従来技術にあっては、単語単位で一連の処理(指定処理、検索処理、および検索結果表示処理)をおこなっているため、ユーザは、訳語やその正確なスペルがわからない単語が原文中に多数含まれている場合であっても、単語ごとに、その単語を翻訳対象として指定し、対応する訳語を辞書データベースから検索させる必要がある。この結果、翻訳文の入力作業において、作業効率が低下し、これに伴い作業時間が長時間化するといった問題が生じていた。
【0006】
また、辞書データベースから検索された訳語の全てが検索結果として表示されるため、ユーザは、訳語のスペルをある程度把握しているにも関わらず多数の訳語が辞書データベースから検索された場合、検索結果として表示された多数の訳語の中から、適切な訳語を目視により探し出す必要がある。この結果、翻訳文の入力作業において、作業効率が低下し、これに伴い作業時間が長時間化するといった問題が生じていた。
【0007】
この発明は、上述した従来技術による問題点を解消するため、より容易かつ適切に、翻訳文の入力作業をユーザにおこなわせることができ、結果的に、翻訳文の入力作業における作業効率の向上を図ることができる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するため、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法は、第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法であって、前記原文データを分解した結果得られる前記言語単位の原文語を取得し、取得された原文語に関連付けられている訳文語を、前記データベースから検索し、前記第2の言語の文字列の入力を受け付け、入力された前記第2の言語の文字列を表示する表示画面を有し、前記第2の言語の文字列が入力された場合、検索された訳文語の中から、前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出し、前記表示画面を制御して、抽出された入力候補を表示することを特徴とする。
【0009】
この発明によれば、入力された原文データに関連する訳文語のみを辞書データベースから検索することができる。そして、検索された訳文語の中から、入力された文字列と一致または関連する訳文語のみを抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。
【0010】
また、上記発明において、表示された前記入力候補の中から、任意の前記入力候補の選択を受け付け、選択された前記入力候補を、表示された前記第2の言語の文字列の代わりに、表示させることとしてもよい。
【0011】
この発明によれば、ユーザに提示した入力候補のうち、ユーザによって選択された任意の入力候補を、訳文データとしてユーザの代わりに入力することができる。
【0012】
また、上記発明において、前記原文データの範囲の指定を受け付け、前記原文データの指定された範囲を分解した結果得られる前記言語単位の原文語を取得することとしてもよい。
【0013】
この発明によれば、入力された原文データのうち、ユーザが所望する適切な範囲に関連する訳文語のみを辞書データベースから検索することができる。
【0014】
また、上記発明において、検索された訳文語の信頼度を算出し、抽出された入力候補とともに算出された信頼度に関する情報を表示することとしてもよい。
【0015】
この発明によれば、ユーザが入力候補を選択する際の判断基準とすることができる入力候補の信頼度をユーザに提示することができる。
【0016】
また、上記発明において、抽出された入力候補を、所定の条件に基づく表示順序で表示することとしてもよい。
【0017】
この発明によれば、ユーザが入力候補を選択する際の判断基準とすることができる順序で入力候補をユーザに提示することができる。
【0018】
また、上記発明において、抽出された入力候補が所定数より多い場合、抽出された入力候補を表示しないこととしてもよい。
【0019】
この発明によれば、ユーザが混乱を招くような多数の入力候補がユーザに提示されることを防ぐことができるだけでなく、さらなる文字列の入力により入力候補の絞込みをユーザに促すことができる。
【0020】
また、上記発明において、検索された訳文語を表示することとしてもよい。
【0021】
この発明によれば、ユーザが文字列を入力する際に、検索された訳文語をユーザに参照させることができる。
【0022】
また、上記発明において、前記第1の言語の文字列の入力を受け付け、前記第1の言語の文字列が入力された場合、検索された訳文語の中から、入力された前記第1の言語の文字列と一致または関連する前記第1の言語の文字列に関連付けられている訳文語を入力候補として抽出することとしてもよい。
【0023】
この発明によれば、検索された訳文語の中から、ユーザにとって使い慣れた第1の言語によって入力された文字列に基づく訳文語を抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。
【0024】
また、上記発明において、前記第1の言語の文字列の入力を受け付け、前記第1の言語の文字列が入力された場合、前記原文データにおける入力された前記第1の言語の文字列から始まる所定範囲内の文字列から、その翻訳文を生成し、生成された翻訳文を入力候補として抽出することとしてもよい。
【0025】
この発明によれば、原文データの翻訳文を、入力された第1の言語の文字列から始まる適切な範囲で、ユーザに提示することができる。
【0026】
また、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法は、第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法であって、前記第2の言語の文字列の入力を受け付け、入力された前記第2の言語の文字列を表示し、前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出し、入力された前記第2の言語の文字列を表示する表示画面を制御して、抽出された入力候補を表示することを特徴とする。
【0027】
この発明によれば、入力された原文データに関連する訳文語であって、なおかつ入力された文字列と一致または関連する訳文語のみをテーブルから抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。
【発明の効果】
【0028】
本発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法によれば、より容易かつ適切に、翻訳文の入力作業をユーザにおこなわせることができ、結果的に、翻訳文の入力作業における作業効率の向上を図ることができるという効果を奏する。
【発明を実施するための最良の形態】
【0029】
以下に添付図面を参照して、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法の好適な実施の形態を詳細に説明する。
【0030】
(実施の形態)
(翻訳文入力支援装置のハードウェア構成)
まず、この発明の実施の形態にかかる翻訳文入力支援装置のハードウェア構成について説明する。図1は、この発明の実施の形態にかかる翻訳文入力支援装置のハードウェア構成を示すブロック図である。
【0031】
図1において、翻訳文入力支援装置100は、CPU101と、ROM102と、RAM103と、HDD(ハードディスクドライブ)104と、HD(ハードディスク)105と、FDD(フレキシブルディスクドライブ)106と、着脱可能な記憶媒体の一例としてのFD(フレキシブルディスク)107と、ディスプレイ108と、I/F(インターフェース)109と、キーボード110と、マウス111と、スキャナ112と、プリンタ113と、を備えており、各構成部はバス120によってそれぞれ接続されている。
【0032】
ここで、CPU101は、翻訳文入力支援装置100の全体の制御を司る。ROM102は、ブートプログラムなどのプログラムを記憶している。RAM103は、CPU101のワークエリアとして使用される。HDD104は、CPU101の制御にしたがってHD105に対するデータのリード/ライトを制御する。HD105は、HDD104の制御で書き込まれたデータを記憶する。
【0033】
FDD106は、CPU101の制御にしたがってFD107に対するデータのリード/ライトを制御する。FD107は、FDD106の制御で書き込まれたデータを記憶したり、FD107に記憶されたデータを読み取らせたりする。
【0034】
また、着脱可能な記憶媒体として、FD107のほか、CD−ROM(CD−R、CD−RW)、MO、DVD(Digital Versatile Disk)、メモリーカードなどであってもよい。ディスプレイ108は、カーソル、アイコンあるいはツールボックスをはじめ、文章、画像、機能情報などのデータを表示する。このディスプレイ108は、たとえば、CRT、TFT液晶ディスプレイ、プラズマディスプレイなどを採用することができる。
【0035】
I/F109は、通信回線を通じてインターネットなどのネットワーク114に接続され、このネットワーク114を介して他の装置に接続される。また、I/F109は、USBケーブルなどの通信ケーブルなどが接続され、この通信ケーブルを介してUSB機器などの他の装置に接続される。そして、I/F109は、ネットワーク114と内部のインターフェースを司り、当該翻訳文入力支援装置100と接続された他の装置からのデータの入出力を制御する。I/F109には、たとえばモデム、LANアダプタ、USBポートなどを採用することができる。
【0036】
キーボード110は、文字、数字、各種指示などの入力のためのキーを備え、データの入力をおこなう。また、タッチパネル式の入力パッドやテンキーなどであってもよい。マウス111は、カーソルの移動や範囲選択、あるいはウィンドウの移動やサイズの変更などをおこなう。ポインティングデバイスとして同様に機能を備えるものであれば、トラックボールやジョイスティックなどであってもよい。
【0037】
スキャナ112は、画像を光学的に読み取り、翻訳文入力支援装置100内に画像データを取り込む。なお、スキャナ112は、OCR機能を持たせてもよい。また、プリンタ113は、画像データや文章データを印刷する。プリンタ113には、たとえば、レーザプリンタやインクジェットプリンタを採用することができる。
【0038】
(翻訳文入力支援装置100の機能的構成)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100の機能的構成について説明する。図2は、この発明の実施の形態にかかる翻訳文入力支援装置100の機能的構成を示すブロック図である。
【0039】
図2において、翻訳文入力支援装置100は、記憶部200と、入力部201と、指定部202と、取得部203と、検索部204と、表示部205と、抽出部206と、表示制御部207と、選択部208と、から構成されている。
【0040】
図2において、記憶部200は、第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と、第2の言語によって表現されたその訳文語とを関連付けて記憶するデータベースである。なお、原文語には、異なる言語単位の訳文語が関連付けられていてもよい。たとえば、原文語の言語単位が単語であって、その訳文語の言語単位が熟語であってもよい。また、原文語には、複数の訳文語が関連付けられていてもよい。
【0041】
また、記憶部200は、当該翻訳文入力支援装置100に備えられているものに限らず、当該翻訳文入力支援装置100と接続された他の装置に備えられているものであってもよい。記憶部200は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107によってその機能を実現する。なお、以降の記述においては、一例として、第1の言語として日本語を、第2の言語として英語を用いて説明する。
【0042】
入力部201は、第1の言語(日本語)によって表現された原文データの入力を受け付ける。ここで原文データとしては、ユーザによるキーボード操作またはマウス操作によって入力されたものに限らず、たとえば、所定の記憶媒体に記録されたテキストファイルなどから読み取ったものであってもよい。この場合、上記記憶媒体は、当該翻訳文入力支援装置100に備えられているものに限らず、当該翻訳文入力支援装置100と接続された他の装置に備えられているものであってもよい。また、入力部201は、後述する抽出部206によって抽出処理が行われる際の検索キーとなる第2の言語(英語)の文字列の入力を受け付ける。
【0043】
なお、入力部201によって入力された各種データは、メモリなどの記録媒体に一時的に記録される。入力部201は、具体的には、たとえば図1に示したI/F(インターフェース)109、キーボード110、マウス111などによってその機能を実現する。
【0044】
指定部202は、入力部201によって入力された原文データのうち、翻訳文の入力支援対象とする範囲(以下、「対象範囲」という)の指定を受け付ける。ここで、対象範囲を指定する方法としては、たとえば、ユーザがマウスやキーボードを用いて、画面に表示された原文データに対して、ドラッグ操作をおこなうことによって指定する方法などが挙げられる。
【0045】
ここで、ユーザは、原文データのうちの、一部だけでなく全部(全文)を対象範囲として指定することができる。また、複数の対象範囲を指定することもできる。このとき、明示的な対象範囲の指定がない場合は、暗黙的に全部(全文)が対象範囲となる。
【0046】
なお、指定部202によって対象範囲が指定された原文データは、メモリなどの記録媒体に一時的に記録される。指定部202は、具体的には、たとえば図1に示したI/F(インターフェース)109、キーボード110、マウス111などによってその機能を実現する。
【0047】
取得部203は、入力部201によって入力された原文データの指定部202によって指定された対象範囲を分解した結果得られる言語単位の原文語を取得する。原文データは、形態素解析プログラムや語句抽出プログラムなど、既知の技術を利用することで分解することができる。具体的には、形態素解析プログラムや語句抽出プログラムなどを用いて、原文データを分割し、分割された原文データの中から、所定の品詞(たとえば単語)に属する原文語を抽出する。
【0048】
なお、取得部203によって取得された言語単位の原文語は、メモリなどの記録媒体に一時的に記録される。取得部203は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0049】
検索部204は、記憶部200によって記憶されている訳文語の中から、取得部203によって取得された原文語に関連付けられている訳文語を検索する。ここで、検索部204は、記憶部200において一つの原文語に対して複数の訳文語が関連付けられている場合は、関連付けられている全ての訳文語を記憶部200から検索する。
【0050】
なお、検索部204は、原文語に関連付けられている訳文語のみならず、原文語が部分一致する原文語に関連付けられている訳文語を検索するようにしてもよい。たとえば、取得部203によって取得された原文語が「日本」であった場合、この原文語「日本」に関連付けられている訳文語「japan」のみならず、この原文語「日本」と部分一致する原文語「日本語」に関連付けられている訳文語「japanese」を検索するようにしてもよい。
【0051】
反対に、たとえば、取得部203によって取得された原文語が「日本語」であった場合、この原文語「日本語」に関連付けられている訳文語「japanese」のみならず、この原文語「日本語」と部分一致する原文語「日本」に関連付けられている訳文語「japan」を検索するようにしてもよい。
【0052】
この場合、部分一致する原文語のうち、あらかじめ設定されている最低一致文字数を満たす原文語に関連付けられている訳文語のみを検索するようにしてもよい。たとえば、最低一致文字数に「3」が設定されている場合において、取得部203によって取得された原文語が「日本語」であった場合、この原文語「日本語」と部分一致する原文語「日本」は2文字しか部分一致していないため、この原文語「日本」に関連付けられている訳文語「japan」は検索対象外となる。
【0053】
なお、検索部204によって検索された訳文語は、メモリなどの記録媒体に一時的に記録される。検索部204は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0054】
表示部205は、表示画面を有し、入力部201によって入力された第1の言語(日本語)によって表現された原文データを表示する。また、表示部205は、入力部201によって入力された第2の言語(英語)の文字列を表示する。そして、表示部205は、後述する表示制御部207の制御によって、抽出部206によって抽出された訳文語を表示する。表示部205は、具体的には、たとえば図1に示したディスプレイ108によってその機能を実現する。
【0055】
抽出部206は、入力部201によって第2の言語(英語)の文字列が入力された場合、検索部204によって検索された訳文語の中から、入力部201によって入力された第2の言語(英語)の文字列と一致または関連する訳文語を入力候補として抽出する。たとえば、検索部204によって「lake」、「life」および「like」が訳文語として検索されている場合において、入力部201によって「l」が第2の言語(英語)の文字列として入力された場合、抽出部206は、この中から、「lake」、「life」および「like」を入力候補として抽出する。
【0056】
続いて、入力部201によって「i」が入力され、結果的に入力部によって入力された文字列が「li」となった場合、抽出部206は、この中から、「life」および「like」を入力候補として抽出する。
【0057】
なお、抽出部206は、入力部201によって、第2の言語(英語)の文字列ではなく第1の言語(日本語)の文字列が入力された場合、検索部204によって検索された訳文語の中から、入力部201によって入力された第1の言語(日本語)の文字列と一致または関連する原文語とその訳文語を入力候補として抽出するようにしてもよい。ただし、この場合、検索部204は、辞書データベースから、訳文語だけでなく、訳文語に関連付けられている日本語も検索することが前提となる。
【0058】
たとえば、検索部204によって「japan 日本」、「japanese 日本語」、「jp にほん」、「sunday 日曜日」が検索されている場合において、入力部201によって「日」が第1の言語(日本語)の文字列として入力された場合、抽出部206は、この中から、「japan 日本」、「japanese 日本語」および「sunday 日曜日」を入力候補として抽出する。
【0059】
さらに、抽出部206は、入力部201によって、第1の言語(日本語)の文字列が入力された場合、入力部201によって入力された原文データのうち、指定部202によって指定された対象範囲内において、入力された文字列から始まる所定範囲(たとえば、「。」や「、」まで)の文字列を自動翻訳して、その翻訳文を抽出結果とするようにしてもよい。
【0060】
たとえば、入力部201によって入力された原文データのうち、指定部202によって指定された対象範囲が「日本語は日本の言語です。また、・・・」であった場合において、入力部201によって「日」が第1の言語(日本語)の文字列として入力された場合、
「日本語は日本の言語です」の翻訳文「japanese is language of japan」と、「日本の言語です」の翻訳文「language of japan」とを抽出結果とする。
【0061】
なお、抽出部206によって抽出された入力候補は、メモリなどの記録媒体に一時的に記録される。抽出部206は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0062】
表示制御部207は、抽出部206によって抽出された訳文語(入力候補)を、表示部205に表示する。このとき、訳文語だけでなく、この訳文語が登録されていた辞書データベースを識別する情報や、この訳文語に関連付けられている原文語や説明文、この訳文語の語句の種類などを同時に表示するようにしてもよい。たとえば、抽出部206によって抽出された訳文語(入力候補)が「japan」であった場合の表示の一例として、「japan 日本」、「japan 日本 ××辞典」、「japan 日本 にほん(日本) ××辞典」、「japan 日本 ××辞典 名詞」などが挙げられる。
【0063】
また、抽出部206によって抽出された訳文語(入力候補)が複数の場合、ランキング表示するようにしてもよい。たとえば、訳文語が登録されていた辞書データベースの優先度順や使用頻度順に表示する方法などが挙げられる。さらに、抽出部206によって抽出された訳文語(入力候補)が所定数以上の場合、表示しないようにしてもよい。
【0064】
また、表示制御部207は、すでに表示部205に表示されている第2の言語(英語)の文字列(入力部201によって入力された第2の言語(英語)の文字列)の代わりに、後述する選択部208によって選択された任意の入力候補(訳文語)を、表示部205に表示する。
【0065】
表示制御部207は、さらに、検索部204によって検索された訳文語を表示部205に表示するようにしてもよい。表示制御部207は、具体的には、たとえば図1に示したROM102、RAM103、HD105、FD107に記憶されたプログラムをCPU101が実行することによってその機能を実現する。
【0066】
選択部208は、表示部205によって表示された入力候補(訳文語)の中から、任意の入力候補(訳文語)の選択を受け付ける。ここで、入力候補を選択する方法としては、たとえば、ユーザがマウスを用いる方法や、入力候補を矢印キー(↑、↓)で選択する方法などが挙げられる。マウスをクリックするか、ENTERキーを押すことにより、その入力候補を確定し、訳文領域に入力することができる。
【0067】
なお、選択部208によって選択された入力候補は、メモリなどの記録媒体に一時的に記録される。選択部208は、具体的には、たとえば図1に示したキーボード110、マウス111などによってその機能を実現する。
【0068】
(辞書データベースの一例)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる辞書データベースの一例について説明する。図3は、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる辞書データベースの一例を示す説明図である。
【0069】
図3に示すように、翻訳文入力支援装置100には、4つの異なる辞書データベース(辞書データベース310,320,330,340)が用いられる。各辞書データベース310〜340は、少なくとも、データ列「原文語」と、データ列「訳文語」とを含んで構成されている。翻訳文入力支援装置100に用いる辞書データベースは1つでもよいが、このように、複数の辞書データベースを用いることによって、各辞書データベースを互いに補完させることができる。
【0070】
たとえば、図3において、辞書データベース320,330,340には、原文語「その」に対して、訳文語が関連付けられていないが、辞書データベース310は、原文語「その」に対して、3つの訳文語「that」、「the」、および「whose」が関連付けられていることによって、辞書データベース320,330,340を補完することができる。
【0071】
また、たとえば、図3において、辞書データベース330には、原文語「アルカリ溶液」に対して、訳文語「alkaline solution」のみが関連付けられているが、辞書データベース320は、原文語「アルカリ溶液」に対して、訳文語「alkaline solution」に加えて、訳文語「alkali solution」が関連付けられていることによって、辞書データベース330を補完することができる。
【0072】
ここで、辞書データベースは、市販されているものや、一般公開されているものに限らず、たとえば、ユーザが定義したものなどを用いるようにしてもよい。これにより、他の辞書データベースに登録されていない訳文語やユーザが多用する訳文語を、任意の原文語と関連付けておくことができる。
【0073】
さらに、辞書データベースには、原文語と訳文語とが関連付けられているだけでなく、たとえば、原文語または訳文語と、説明文とが関連付けられているものを用いてもよい。これにより、ユーザが複数提示された訳文語の中から任意の訳文語を選択する際に、その判断材料とすることができる文字列を、原文語または訳文語と関連付けておくことができる。
【0074】
(翻訳文入力支援装置100による翻訳文入力支援処理の手順)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100による翻訳文入力支援処理の手順について説明する。図4は、この発明の実施の形態にかかる翻訳文入力支援装置100による翻訳文入力支援処理の手順の一例を示すフローチャートである。
【0075】
まず、入力部201によって、第1の言語(日本語)によって表現された原文データの入力を受け付ける(ステップS401)。入力部201によって入力された原文データの一例については、図5を用いて後述する。
【0076】
つぎに、指定部202によって、ステップS401で入力された原文データのうち、対象範囲の指定を受け付ける(ステップS402)。指定部202によって対象範囲が指定された原文データの一例については、図6を用いて後述する。
【0077】
つぎに、取得部203によって、ステップS402で指定された対象範囲を分解した結果得られる言語単位の原文語を取得する(ステップS403)。取得部203によって取得された言語単位の原文語の一例については、図7および図8を用いて後述する。
【0078】
そして、検索部204によって、記憶部200によって記憶されている訳文語の中から、ステップS403で取得された原文語に関連付けられている訳文語を検索する(ステップS404)。検索部204によって検索された訳文語の一例については、図9および図10を用いて後述する。なお、このとき、表示制御部207によって、ステップS404で検索された訳文語を表示部205に表示するようにしてもよい。
【0079】
続いて、入力部201によって、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたか否かを判断する(ステップS405)。ステップS405において、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けていないと判断した場合(ステップS405:No)は、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたと判断されるまで繰り返し上記判断処理(ステップS405)をおこなう。
【0080】
一方、ステップS405において、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたと判断した場合(ステップS405:Yes)は、抽出部206によって、ステップS404で検索された訳文語の中から、入力部201によって入力された第2の言語(英語)または第1の原語(日本語)の文字列と一致または関連する訳文語(入力候補)が抽出されたか否かを判断する(ステップS406)。
【0081】
ステップS406において、入力候補が抽出されていないと判断した場合(ステップS406:No)は、ステップS410へ進む。一方、ステップS406において、入力候補が抽出されたと判断した場合(ステップS406:Yes)は、表示制御部207によって、抽出部206によって抽出された入力候補を、表示部205に表示する(ステップS407)。表示部205に表示された入力候補の一例については、図11および図12を用いて後述する。
【0082】
そして、選択部208によって、ステップS407で表示された入力候補の中から、任意の入力候補の選択を受け付けたか否かを判断する(ステップS408)。
【0083】
ステップS408において、任意の入力候補の選択を受け付けていないと判断した場合(ステップS408:No)は、ステップS405に戻って、再び、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたか否かの判断処理をおこなう。
【0084】
一方、ステップS408において、任意の入力候補の選択を受け付けたと判断した場合(ステップS408:Yes)は、すでに表示部205に表示されている第2の言語(英語)または第1の原語(日本語)の文字列(入力部201によって入力された第2の言語(英語)または第1の原語(日本語)の文字列)の代わりに、選択部208によって選択された任意の入力候補を、表示部205に表示して(ステップS409)、訳文の編集を終了するか否かを判断する(ステップS410)。
【0085】
ここで、訳文の編集を終了するか否かの判断は、たとえば、ユーザがおこなった「終了」や「保存」などの操作を検知することで、訳文の編集を終了すると判断することができる。ステップS410において、訳文の編集を終了すると判断した場合は(ステップS410:Yes)、一連の処理を終了する。一方、ステップS410において、訳文の編集を終了しないと判断した場合は(ステップS410:No)、ステップS405に戻って、再び、第2の言語(英語)または第1の原語(日本語)の文字列の入力を受け付けたか否かの判断処理をおこなう。
【0086】
(原文データの一例)
つぎに、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる原文データの一例について説明する。図5は、この発明の実施の形態にかかる翻訳文入力支援装置100に用いられる原文データの一例を示す説明図である。
【0087】
図5において、画面500は、ディスプレイ108(図1参照)の画面上に表示された、図4を用いて説明した手順による翻訳文入力支援処理をおこなう翻訳文入力支援ツールの画面であって、原文データ入力欄510と、訳文データ入力欄520と、全文検索ボタン530と、部分検索ボタン540と、保存ボタン550と、を備えて構成されている。
【0088】
このうち、原文データ入力欄510には、翻訳対象とする原文データが入力される。たとえば、図5に示す画面500においては、原文入力欄510に、原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」が入力されている。ここで原文データ入力欄510への原文データの入力方法としては、ユーザによるキーボード110やマウス111の操作によるものに限らず、たとえば、所定の記憶媒体に記録されたテキストファイルなどから読み取るなどの方法によるものであってもよい。
【0089】
(対象範囲が指定された原文データの一例)
つぎに、対象範囲が指定された原文データの一例について説明する。図6は、対象範囲が指定された原文データの一例を示す説明図である。
【0090】
図6に示す画面500は、図5に示した画面500の状態から、たとえばユーザがおこなったキーボード110やマウス111の操作によって、原文データ入力欄510に表示されている原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」のうち、文字列「アルカリ溶液を攪拌する」が対象範囲として指定されている状態を示す。
【0091】
このように、原文データのうち、任意の文字列を対象範囲として指定してもよいし、全文を対象範囲として指定してもよい。また、たとえば上記原文データのうち「その物質は」と「生成される」とを対象範囲とするなど、複数の対象範囲を指定してもよい。なお、本実施の形態においては、図5に示した画面500の状態のように、明示的な対象範囲の指定がない場合は、暗黙的に全文が対象範囲となる。
【0092】
(取得部203によって取得された言語単位の原文語の一例)
つぎに、取得部203によって取得された言語単位の原文語の一例について説明する。図7および図8は、取得部203によって取得された言語単位の原文語の一例を示す説明図である。
【0093】
このうち、図7は、たとえば、図5に示した画面500の状態(原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」に対する対象範囲が指定されていない状態)から、全文検索ボタン530が押下されたことによって、原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」の全文に対する分解処理が形態素解析プログラムや語句抽出プログラムなどによっておこなわれ、その結果の一例として、「その」、「物質」、「アルカリ溶液」、「攪拌」および「生成」が取得部203によって取得されたことを示す。
【0094】
一方、図8は、たとえば、図6に示した画面500の状態(原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」のうちの文字列「アルカリ溶液を攪拌する」が対象範囲として指定された」状態)から、部分検索ボタン540が押下されたことによって、原文データ「その物質は、アルカリ溶液を攪拌することにより生成される。」のうちの文字列「アルカリ溶液を攪拌する」に対する分解処理が形態素解析プログラムや語句抽出プログラムなどによっておこなわれ、その結果の一例として、「アルカリ溶液」および「攪拌」が取得部203によって取得されたことを示す。
【0095】
このように、取得部203によって取得された原文語は、検索部204による訳文語の検索処理に用いられるため、たとえば図1に示したROM102、RAM103、HD105、FD107などの記憶媒体に一時的に記録される。
【0096】
(検索部204によって検索された訳文語の一例)
つぎに、検索部204によって検索された訳文語の一例について説明する。図9および図10は、検索部204によって検索された訳文語の一例を示す説明図である。
【0097】
このうち、図9は、取得部203によって取得された原文語が、図7に示したものであった場合において、辞書データベース310〜340(図3参照)に対する検索処理が検索部204によっておこなわれ、その結果の一例として、辞書データベース310〜340から検索された、図7に示した原文語と関連付けられている訳文語を示す。
【0098】
一方、図10は、取得部203によって取得された原文語が、図8に示したものであった場合において、辞書データベース310〜340(図3参照)に対する検索処理が検索部204によっておこなわれ、その結果の一例として、辞書データベース310〜340から検索された、図7に示した原文語と関連付けられている訳文語を示す。
【0099】
たとえば、図9において、取得部203によって取得された原文語「その」に着目した場合、これに関連付けられている訳文語として、辞書1(辞書データベース310)から、「that」、「the」および「whose」が検索されたことを示す。また、たとえば、図9および図10において、取得部203によって取得された原文語「アルカリ溶液」に着目した場合、これに関連付けられている訳文語として、辞書2(辞書データベース320)から、「alkali solution」が、辞書2(辞書データベース320)および辞書3(辞書データベース330)から、「alkaline solution」が検索されたことを示す。
【0100】
このように、検索部204によって検索された訳文語は、抽出部206による入力候補の抽出処理に用いられるため、たとえば図1に示したROM102、RAM103、HD105、FD107などの記憶媒体に一時的に記録される。
【0101】
(表示部205に表示された入力候補の一例)
つぎに、表示部205に表示された入力候補の一例について説明する。図11および図12は、表示部205に表示された入力候補の一例を示す説明図である。
【0102】
図11は、訳文データ入力欄520において、文字列「The material is generated by stir the 」に続いて、文字列「a」が入力されたときの、画面500の状態を示したものである。
【0103】
このように、文字列「a」が入力されたことによって、画面500には、図9に示した訳文語(検索部204によって検索された訳文語)の中から抽出された、文字列「a」を含む訳文語「agent」、「alkali solution」および「alkaline solution」が入力候補として表示されている。
【0104】
一方、図12は、訳文データ入力欄520において、文字列「The material is generated by stir the 」に続いて、文字列「al」が入力されたときの、画面500の状態(すなわち、図11に示した画面500の状態からさらに訳文データ入力欄520において文字列「l」が入力された状態)を示したものである。
【0105】
このように、文字列「al」が入力されたことによって、画面500には、図9に示した訳文語(検索部204によって検索された訳文語)の中から抽出された、文字列「al」を含む訳文語「alkali solution」および「alkaline solution」が入力候補として表示されている。
【0106】
このように、訳文データ入力欄520において文字列「l」が追加入力されたことによって、結果的に、図11に示した3つの入力候補(「agent」、「alkali solution」および「alkaline solution」)は、図12に示した2つ(「alkali solution」および「alkaline solution」)の入力候補に絞り込まれた形となる。
【0107】
なお、画面500に表示された入力候補は、キーボード110やマウス111の操作によるユーザ選択が可能であり、たとえばユーザは、この中から任意の入力候補を選択することによって、選択した入力候補を、入力した文字列の代わりに訳文データ入力欄520に表示することができる。すなわち、訳文データ入力欄520に入力した文字列を、選択した入力候補に変換することができる。
【0108】
(表示部205に表示された任意の入力候補の一例)
つぎに、表示部205に表示された任意の入力候補の一例について説明する。図13は、表示部205に表示された任意の入力候補の一例を示す説明図である。
【0109】
図13は、図12に示した画面500の状態から、さらに、表示された2つの入力候補(「alkali solution」および「alkaline solution」)の中から任意の入力候補として「alkali solution」が選択されたときの、画面500の状態を示したものである。
【0110】
このように、入力候補「alkali solution」が選択されたことによって、訳文データ入力欄520は、既に入力されていた文字列「The material is generated by stir the 」に続いて、選択された入力候補「alkali solution」が表示された状態となっている。
【0111】
(表示部205に表示された入力候補の別の一例)
つぎに、表示部205に表示された入力候補の別の一例について説明する。図14は、表示部205に表示された入力候補の別の一例を示す説明図である。
【0112】
図14は、訳文データ入力欄520において、文字列「The material is generated by stir the 」に続いて、英語(第2の原語)の文字列ではなく、日本語(第1の原語)の文字列「アルカ」が入力されたときの、画面500の状態を示したものである。
【0113】
このように、日本語の文字列「アルカ」が入力されたことによって、画面500には、図示を省略する辞書データベースの中から検索された、文字列「アルカ」を含む原文語「アルカリ」、「アルカリ溶液」とその訳文語「alkali」、「alkaline」、「alkali solution」、および「alkaline solution」が入力候補として表示されている。
【0114】
そして、たとえば、この入力候補の中から、「alkali solution」が選択された場合、訳文データ入力欄520には、既に入力されていた文字列「The material is generated by stir the 」に続いて、選択された入力候補「alkali solution」が表示される。
【0115】
以上説明したように、本実施の形態にかかる翻訳文入力支援装置100は、入力された原文データに関連する訳文語のみを辞書データベース310〜340から検索することができる。そして、検索された訳文語の中から、入力された文字列を含む訳文語のみを抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。さらに、ユーザによって選択された任意の入力候補を、訳文データとしてユーザの代わりに入力することができる。
【0116】
これにより、ユーザにとって不要となる、原文データとの関連性が低い訳文語が、ユーザに提示されることを防ぐことができる。さらに、ユーザが入力した文字列を含まない訳文語が、ユーザに提示されることを防ぐことができる。このため、ユーザは、わずかな文字列(たとえば先頭文字)だけを入力して、その結果提示された、原文データとの関連性が高く、かつユーザが入力した文字列を含む入力候補の中から、対象の入力候補を選択するだけといった簡単な操作によって、容易かつ適切に意図した訳文語を入力することができる。その結果、翻訳文の入力作業における作業効率の向上を図ることができる。
【0117】
また、本実施の形態にかかる翻訳文入力支援装置100は、対象範囲を指定することができるため、原文データのうちの指定された対象範囲に関連する訳文語のみを辞書データベース310〜340から検索することができる。そして、検索された訳文語の中から、入力された文字列を含む訳文語のみを抽出して、抽出された訳文語を入力候補としてユーザに提示することができる。さらに、ユーザによって選択された任意の入力候補を、訳文データとしてユーザの代わりに入力することができる。
【0118】
これにより、ユーザにとって不要となる、上記対象範囲との関連性が低い訳文語が、ユーザに提示されることを防ぐことができる。さらに、ユーザが入力した文字列を含まない訳文語が、ユーザに提示されることを防ぐことができる。このため、ユーザは、対象範囲を指定したうえ、わずかな文字列(たとえば先頭文字)だけを入力して、その結果提示された、上記対象範囲との関連性が高く、かつユーザが入力した文字列を含む入力候補の中から、対象の入力候補を選択するだけといった簡単な操作によって、容易かつ適切に意図した訳文語を入力することができる。その結果、翻訳文の入力作業における作業効率のさらなる向上を図ることができる。
【0119】
以上、この発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法の基本的な構成による好適な実施の形態を説明したが、検索部204によって検索された訳文語の信頼度を算出する算出部をさらに備え、表示制御部207は、抽出部206によって抽出された訳文語(入力候補)とともに算出部によって算出された信頼度に関する情報を、表示部205に表示する構成としてもよい。これにより、ユーザは表示された入力候補の中から、より信頼度の高い入力候補を選択することができる。
【0120】
この場合の、算出部は、たとえば、あらかじめ用意された対訳例文データベース(第1の言語で記述された例文(原語例文)と第2の言語で記述された例文(訳語例文)との対である対訳例文が格納されたデータベース)から、取得部203によって取得された原文語と抽出部206によって抽出された訳文語(入力候補)との対を検索キーとして検索したときの検索件数を信頼度とするようにしてもよい。そして、検索件数の多い訳文語(入力候補)ほど、信頼度の高い訳文語(入力候補)として扱うようにしてもよい。
【0121】
また、あらかじめ辞書データベースごとに重み値を設定しておき、上記検索処理によって求められた検索件数と重み値とを乗算した値を信頼度とするようにしてもよい。そして算出された値の大きい訳文語(入力候補)ほど、信頼度の高い訳文語(入力候補)として扱うようにしてもよい。
【0122】
そして、信頼度の高い入力候補に「◎」を付与して「◎:japan 日本」のように表示部205に表示したり、信頼度の低い入力候補に「×」を付与して「×:jp にほん」のように表示するようにしてもよい。なお、信頼度に関する情報の表示方法は、上記に限らず、たとえば、信頼度の高い入力候補を太字で表示したり、下線を付与したり、文字色を変更するなど、信頼度の高低を容易に識別できる表示方法であれば、どのような方法を用いてもよい。
【0123】
なお、本実施の形態で説明した翻訳文入力支援方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション、CAD等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記憶媒体に記録され、コンピュータによって記憶媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。
【0124】
(付記1)第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得させる取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索させる検索工程と、
前記第2の言語の文字列の入力を受け付けさせる入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出させる抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援プログラム。
【0125】
(付記2)前記表示工程によって表示された前記入力候補の中から、任意の前記入力候補の選択を受け付ける選択工程をさらに備え、
前記表示工程は、前記選択工程によって選択された前記入力候補を、前記表示工程によって表示された前記第2の言語の文字列の代わりに、表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0126】
(付記3)前記原文データの範囲の指定を受け付ける指定工程をさらに備え、
前記取得工程は、
前記原文データの前記指定工程によって指定された範囲を分解した結果得られる前記言語単位の原文語を取得することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0127】
(付記4)前記検索工程によって検索された訳文語の信頼度を算出する算出工程をさらに備え、
前記表示工程は、
前記抽出工程によって抽出された入力候補とともに前記算出工程によって算出された信頼度に関する情報を表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0128】
(付記5)前記入力工程は、
前記第1の言語の文字列の入力を受け付け、
前記抽出工程は、
前記入力工程によって前記第1の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第1の言語の文字列と一致または関連する前記第1の言語の文字列に関連付けられている訳文語を入力候補として抽出することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0129】
(付記6)前記表示工程は、前記抽出工程によって抽出された入力候補を、所定の条件に基づく表示順序で表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0130】
(付記7)前記表示工程は、前記抽出工程によって抽出された入力候補が所定数より多い場合、前記抽出工程によって抽出された入力候補を表示しないことを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0131】
(付記8)前記表示工程は、前記検索工程によって検索された訳文語を表示することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0132】
(付記9)前記入力工程は、
前記第1の言語の文字列の入力を受け付け、
前記抽出工程は、
前記入力工程によって前記第1の言語の文字列が入力された場合、前記原文データにおける前記入力工程によって入力された前記第1の言語の文字列から始まる所定範囲内の文字列から、その翻訳文を生成し、生成された翻訳文を入力候補として抽出することを特徴とする付記1に記載の翻訳文入力支援プログラム。
【0133】
(付記10)第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記第2の言語の文字列の入力を受け付けさせる入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出させる抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援プログラム。
【0134】
(付記11)付記1〜10のいずれか一つに記載の翻訳文入力支援プログラムを記録したコンピュータ読み取り可能な記憶媒体。
【0135】
(付記12)第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援装置であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得手段と、
前記取得手段によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索手段と、
前記第2の言語の文字列の入力を受け付ける入力手段と、
前記入力手段によって入力された前記第2の言語の文字列を表示する表示画面を有する表示手段と、
前記入力手段によって前記第2の言語の文字列が入力された場合、前記検索手段によって検索された訳文語の中から、前記入力手段によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出手段と、
前記表示画面を制御して、前記抽出手段によって抽出された入力候補を前記表示手段に表示する表示制御手段と、
を備えたことを特徴とする翻訳文入力支援装置。
【0136】
(付記13)第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援装置であって、
前記第2の言語の文字列の入力を受け付ける入力手段と、
前記入力手段によって入力された前記第2の言語の文字列を表示する表示画面を有する表示手段と、
前記入力手段によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力手段によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出手段と、
前記表示画面を制御して、前記抽出手段によって抽出された入力候補を前記表示手段に表示する表示制御手段と、
を備えたことを特徴とする翻訳文入力支援装置。
【0137】
(付記14)第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援方法であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索工程と、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援方法。
【0138】
(付記15)第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援方法であって、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援方法。
【産業上の利用可能性】
【0139】
以上のように、本発明にかかる翻訳文入力支援プログラム、該プログラムを記録した記憶媒体、翻訳文入力支援装置、および翻訳文入力支援方法は、翻訳文の作成時に用いられる文書ソフトウェアなどへの利用に適している。
【図面の簡単な説明】
【0140】
【図1】この発明の実施の形態にかかる翻訳文入力支援装置のハードウェア構成を示すブロック図である。
【図2】この発明の実施の形態にかかる翻訳文入力支援装置の機能的構成を示すブロック図である。
【図3】この発明の実施の形態にかかる翻訳文入力支援装置に用いられる辞書データベースの一例を示す説明図である。
【図4】この発明の実施の形態にかかる翻訳文入力支援装置による翻訳文入力支援処理の手順の一例を示すフローチャートである。
【図5】この発明の実施の形態にかかる翻訳文入力支援装置に用いられる原文データの一例を示す説明図である。
【図6】対象範囲が指定された原文データの一例を示す説明図である。
【図7】取得部によって取得された言語単位の原文語の一例を示す説明図である。
【図8】取得部によって取得された言語単位の原文語の一例を示す説明図である。
【図9】検索部によって検索された訳文語の一例を示す説明図である。
【図10】検索部によって検索された訳文語の一例を示す説明図である。
【図11】表示部に表示された入力候補の一例を示す説明図である。
【図12】表示部に表示された入力候補の一例を示す説明図である。
【図13】表示部に表示された任意の入力候補の一例を示す説明図である。
【図14】表示部に表示された入力候補の別の一例を示す説明図である。
【符号の説明】
【0141】
100 翻訳文入力支援装置
200 記憶部
201 入力部
202 指定部
203 取得部
204 検索部
205 表示部
206 抽出部
207 表示制御部
208 選択部
【特許請求の範囲】
【請求項1】
第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得させる取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索させる検索工程と、
前記第2の言語の文字列の入力を受け付けさせる入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出させる抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援プログラム。
【請求項2】
前記表示工程によって表示された前記入力候補の中から、任意の前記入力候補の選択を受け付ける選択工程をさらに備え、
前記表示工程は、前記選択工程によって選択された前記入力候補を、前記表示工程によって表示された前記第2の言語の文字列の代わりに、表示することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項3】
前記原文データの範囲の指定を受け付ける指定工程をさらに備え、
前記取得工程は、
前記原文データの前記指定工程によって指定された範囲を分解した結果得られる前記言語単位の原文語を取得することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項4】
前記検索工程によって検索された訳文語の信頼度を算出する算出工程をさらに備え、
前記表示工程は、
前記抽出工程によって抽出された入力候補とともに前記算出工程によって算出された信頼度に関する情報を表示することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項5】
前記入力工程は、
前記第1の言語の文字列の入力を受け付け、
前記抽出工程は、
前記入力工程によって前記第1の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第1の言語の文字列と一致または関連する前記第1の言語の文字列に関連付けられている訳文語を入力候補として抽出することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項6】
第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって入力された前記第2の言語の文字列を表示する表示画面を有する表示工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を備えたことを特徴とする翻訳文入力支援プログラム。
【請求項7】
請求項1〜6のいずれか一つに記載の翻訳文入力支援プログラムを記録したコンピュータ読み取り可能な記憶媒体。
【請求項8】
第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援装置であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得手段と、
前記取得手段によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索手段と、
前記第2の言語の文字列の入力を受け付ける入力手段と、
前記入力手段によって入力された前記第2の言語の文字列を表示する表示画面を有する表示手段と、
前記入力手段によって前記第2の言語の文字列が入力された場合、前記検索手段によって検索された訳文語の中から、前記入力手段によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出手段と、
前記表示画面を制御して、前記抽出手段によって抽出された入力候補を前記表示手段に表示する表示制御手段と、
を備えたことを特徴とする翻訳文入力支援装置。
【請求項9】
第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援方法であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索工程と、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援方法。
【請求項1】
第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得させる取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索させる検索工程と、
前記第2の言語の文字列の入力を受け付けさせる入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出させる抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援プログラム。
【請求項2】
前記表示工程によって表示された前記入力候補の中から、任意の前記入力候補の選択を受け付ける選択工程をさらに備え、
前記表示工程は、前記選択工程によって選択された前記入力候補を、前記表示工程によって表示された前記第2の言語の文字列の代わりに、表示することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項3】
前記原文データの範囲の指定を受け付ける指定工程をさらに備え、
前記取得工程は、
前記原文データの前記指定工程によって指定された範囲を分解した結果得られる前記言語単位の原文語を取得することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項4】
前記検索工程によって検索された訳文語の信頼度を算出する算出工程をさらに備え、
前記表示工程は、
前記抽出工程によって抽出された入力候補とともに前記算出工程によって算出された信頼度に関する情報を表示することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項5】
前記入力工程は、
前記第1の言語の文字列の入力を受け付け、
前記抽出工程は、
前記入力工程によって前記第1の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第1の言語の文字列と一致または関連する前記第1の言語の文字列に関連付けられている訳文語を入力候補として抽出することを特徴とする請求項1に記載の翻訳文入力支援プログラム。
【請求項6】
第1の言語によって表現された原文データの第2の言語による翻訳文データの入力を支援する翻訳文入力支援プログラムであって、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって入力された前記第2の言語の文字列を表示する表示画面を有する表示工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記原文データを分解した結果得られる前記言語単位の原文語とその訳文語とを関連付けたテーブルの中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を備えたことを特徴とする翻訳文入力支援プログラム。
【請求項7】
請求項1〜6のいずれか一つに記載の翻訳文入力支援プログラムを記録したコンピュータ読み取り可能な記憶媒体。
【請求項8】
第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援装置であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得手段と、
前記取得手段によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索手段と、
前記第2の言語の文字列の入力を受け付ける入力手段と、
前記入力手段によって入力された前記第2の言語の文字列を表示する表示画面を有する表示手段と、
前記入力手段によって前記第2の言語の文字列が入力された場合、前記検索手段によって検索された訳文語の中から、前記入力手段によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出手段と、
前記表示画面を制御して、前記抽出手段によって抽出された入力候補を前記表示手段に表示する表示制御手段と、
を備えたことを特徴とする翻訳文入力支援装置。
【請求項9】
第1の言語によって表現された単語、語句、節、文などの言語単位の原文語と第2の言語によって表現された前記原文語の訳文語とを関連付けて記憶するデータベースを用いて、前記第1の言語によって表現された原文データに対する翻訳文データの入力を支援する翻訳文入力支援方法であって、
前記原文データを分解した結果得られる前記言語単位の原文語を取得する取得工程と、
前記取得工程によって取得された原文語に関連付けられている訳文語を、前記データベースから検索する検索工程と、
前記第2の言語の文字列の入力を受け付ける入力工程と、
前記入力工程によって前記第2の言語の文字列が入力された場合、前記検索工程によって検索された訳文語の中から、前記入力工程によって入力された前記第2の言語の文字列と一致または関連する前記第2の言語の訳文語を入力候補として抽出する抽出工程と、
前記入力工程によって入力された前記第2の言語の文字列が表示されている表示画面に、前記抽出工程によって抽出された入力候補を表示する表示工程と、
を含んだことを特徴とする翻訳文入力支援方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2008−152670(P2008−152670A)
【公開日】平成20年7月3日(2008.7.3)
【国際特許分類】
【出願番号】特願2006−341829(P2006−341829)
【出願日】平成18年12月19日(2006.12.19)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成20年7月3日(2008.7.3)
【国際特許分類】
【出願日】平成18年12月19日(2006.12.19)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]