説明

情報処理装置、訳文接続方法、およびプログラム

【課題】対訳テンプレートを用いて生成した複数の文を用いて文章を作成可能な翻訳装置を提供する。
【解決手段】翻訳装置1は、第1言語による第1原文を翻訳することにより得られる第2言語による第1訳文と、第1言語による第2原文を翻訳することにより得られる第2言語による第2訳文とを出力部11に表示させる表示制御部25と、入力部10を介して、第1訳文と第2訳文とを接続するための第1指示、および当該接続の態様を指定する第2指示を受け付ける受付部31と、第1指示および第2指示に基づいて、第1訳文と第2訳文とを接続する接続部33とを備える。表示制御部25は、接続後の文章を出力部11に表示させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対訳文を表示可能な情報処理装置、訳文接続方法、およびプログラムに関する。
【背景技術】
【0002】
従来、対訳テンプレートを用いて所定の目的言語による文を作成する機械翻訳装置が知られている。
【0003】
特許文献1には、上記機械翻訳装置として、以下の文作成支援装置が開示されている。当該文作成支援装置においては、ユーザが作成しようとしている文の主動詞の役割を果たす述語が入力されると、文構造フレーム検索部が当該述語の取りうる文構造フレームを文構造フレームデータベース記憶部から検索して一覧表示する。その一覧から1つの文構造フレームのスロットが選択され名詞句が入力されると、名詞句解析部が当該名詞句から主要語を抽出して、当該主要語の意味情報を解析用文法・辞書記憶部から取り出して意味情報照合部に渡す。名詞句解析部からの意味情報と当該スロットの意味制約情報が一致すると、編集制御部が当該スロットの名詞句として確定する。全スロットの名詞句が確定されると、目的文の作成が完了する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平11−328180号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1の文作成支援装置では、目的文を作成することができるが、作成した複数の目的文を用いて文章を作成することはできない。
【0006】
本願発明は、上記問題点に鑑みなされたものであって、その目的は、対訳テンプレートを用いて生成した複数の文を用いて文章を作成可能な情報処理装置、訳文接続方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0007】
本発明のある局面に従うと、情報処理装置は、対訳テンプレートを用いて第1言語による原文を第2言語による訳文に翻訳する情報処理装置であって、第1言語による第1原文を翻訳することにより得られる第2言語による第1訳文と、第1言語による第2原文を翻訳することにより得られる第2言語による第2訳文とを表示装置に表示させる表示制御手段と、入力装置を介して、第1訳文と第2訳文とを接続するための第1指示、および当該接続の態様を指定する第2指示を受け付ける受付手段と、第1指示および第2指示に基づいて、第1訳文と第2訳文とを接続する接続手段とを備える。表示制御手段は、接続後の文章を表示装置に表示させる。
【0008】
好ましくは、受付手段は、入力装置を介して、第1訳文の内容を変更するための第3指示をさらに受け付ける。情報処理装置は、第3指示に基づき、第1訳文の内容を変更する変更手段をさらに備える。受付手段は、第1指示として、変更後の第1訳文と、第2訳文とを接続するための指示をさらに受け付ける。
【0009】
好ましくは、受付手段は、第3指示として、第2訳文の内容を変更するための指示をさらに受け付ける。変更手段は、第2訳文の内容を変更するための指示に基づき、第2訳文の内容を変更する。受付手段は、第1指示として、変更後の第1訳文と、変更後の第2訳文とを接続するための指示をさらに受け付ける。
【0010】
好ましくは、情報処理装置は、複数の接続詞を格納した記憶装置をさらに備える。接続手段は、複数の接続詞のうちの第2指示に基づく接続詞を用いて、変更後の第1訳文と、変更後の第2訳文とを接続する。
【0011】
好ましくは、受付手段は、入力装置を介して、変更後の第1訳文と、変更後の第2訳文との接続の順番を指定する第4指示をさらに受け付ける。接続手段は、第4指示に基づき、変更後の第1訳文と、変更後の第2訳文とを順番で接続する。
【0012】
好ましくは、第3指示は、第1訳文および第2訳文について、時制を変更する指示、並びに、肯定文、否定文、および疑問文のいずれかへの変更する指示のうちのいずれかの指示である。
【0013】
好ましくは、記憶装置は、さらに、1つ以上の等位接続詞および1つ以上の従属接続詞をさらに格納している。第2指示は、1つ以上の等位接続詞および1つ以上の従属接続詞のうちのいずれかの接続詞の指定を含む指示である。
【0014】
本発明の他の局面に従うと、訳文接続方法は、対訳テンプレートを用いて第1言語による原文を第2言語による訳文に翻訳する情報処理装置における訳文接続方法であって、第1言語による第1原文を翻訳することにより得られた第2言語による第1訳文と、第1言語による第2原文を翻訳することにより得られた第2言語による第2訳文とを表示装置に表示させるステップと、入力装置を介して、第1訳文と第2訳文とを接続するための第1指示、および当該接続の態様を指定する第2指示を受け付けるステップと、第1指示および第2指示に基づいて、第1訳文と第2訳文とを接続するステップと、接続後の文章を表示装置に表示させるステップとを備える。
【0015】
本発明のさらに他の局面に従うと、プログラムは、対訳テンプレートを用いて第1言語による原文を第2言語による訳文に翻訳する情報処理装置において実行されるプログラムであって、プログラムは、第1言語による第1原文を翻訳することにより得られた第2言語による第1訳文と、第1言語による第2原文を翻訳することにより得られた第2言語による第2訳文とを表示装置に表示させるステップと、入力装置を介して、第1訳文と第2訳文とを接続するための第1指示、および当該接続の態様を指定する第2指示を受け付けるステップと、第1指示および第2指示に基づいて、第1訳文と第2訳文とを接続するステップと、接続後の文章を表示装置に表示させるステップとを情報処理装置に実行させる。
【発明の効果】
【0016】
対訳テンプレートを用いて生成した複数の文を用いて文章を作成できるといった効果を奏する。
【図面の簡単な説明】
【0017】
【図1】本発明の実施の形態に係る翻訳装置の概略構成を示した図である。
【図2】上記翻訳装置の記憶装置に記憶されているデータを示した図である。
【図3】上記記憶装置に記憶されたテンプレートデータベースに含まれるテンプレートデータの構成を示した図である。
【図4】上記記憶装置に記憶された辞書データベースに含まれる辞書データの構成を示した図である。
【図5】上記記憶装置に記憶された日本語活用形テーブルを示した図である。
【図6】上記記憶装置に記憶されたカテゴリデータベースに含まれるカテゴリデータの構成を示した図である。
【図7】上記記憶装置に記憶されたシソーラスデータの階層構造の一部を示した図である。
【図8】上記カテゴリデータベースに含まれる他のカテゴリデータの構成を示した図である。
【図9A】上記記憶装置に記憶された共起関係データベースに含まれる共起関係データの構成を示した図である。
【図9B】上記記憶装置に記憶された共起関係データベースに含まれる他の共起関係データの構成を示した図である。
【図10】翻訳装置のメモリ内の各バッファを示した図である。
【図11】上記翻訳装置の具体的構成の一態様を示した図である。
【図12】上記翻訳装置における処理の概略を示したフローチャートである。
【図13】テンプレート検索における処理の流れを示したフローチャートである。
【図14】抽出語句バッファに記憶されるデータの構成を示した図である。
【図15】文例作成処理における処理の流れを示したフローチャートである。
【図16】テンポラリテンプレートバッファに記憶されたテンポラリテンプレートデータの構成を示した図である。
【図17】処理文格納バッファに記憶されたテンプレートデータを示した図である。
【図18】スロット部用バッファに記憶されたデータを示した図である。
【図19】共起部用バッファに記憶されたデータを示した図である。
【図20A】テンプレートデータのスロット部の処理フローにおける前半の処理フローを示したフローチャートである。
【図20B】テンプレートデータのスロット部の処理フローにおける後半の処理フローを示したフローチャートである。
【図21】テンポラリスロットバッファに記憶されたスロット情報の構成を示した図である。
【図22】テンポラリ辞書バッファに記憶された辞書データを示した図である。
【図23】テンポラリ語句バッファに記憶されたデータを示した図である。
【図24】上記テンポラリ語句バッファに記憶された、語形変化を行った後のデータを示した図である。
【図25】上記処理文格納バッファに記憶された、スロット部における置換処理の途中状態のテンプレートデータを示した図である。
【図26】上記スロット部用バッファに記憶された、スロット部における置換処理の途中状態のスロット情報を示した図である。
【図27】上記処理文格納バッファに記憶された、スロット部の置換処理が完了した状態におけるテンプレートデータを示した図である。
【図28】上記スロット部用バッファに記憶された、スロット部の置換処理が完了した状態におけるスロット情報を示した図である。
【図29A】テンプレートデータの共起部の処理フローにおける前半の処理フローを示したフローチャートである。
【図29B】テンプレートデータの共起部の処理フローにおける後半の処理フローを示したフローチャートである。
【図30】テンポラリ第1共起バッファ81に記憶された共起情報を示した図である。
【図31】テンポラリ第1共起バッファ81に記憶された他の共起情報の構成を示した図である。
【図32】上記テンポラリスロットバッファに記憶されたスロット情報の構成を示した図である。
【図33】上記テンポラリ語句バッファに記憶されたデータを示した図である。
【図34】上記処理文格納バッファに記憶された、共起部における置換処理の途中状態のテンプレートデータを示した図である。
【図35】優先共起バッファに記憶された共起情報を示した図である。
【図36】上記テンポラリスロットバッファに記憶されたスロット情報を示した図である。
【図37】テンポラリ第2共起バッファに記憶された共起情報を示した図である。
【図38】上記テンポラリ語句バッファに記憶された語句を示した図である。
【図39】上記処理文格納バッファに記憶された、共起部の置換処理が完了した状態におけるテンプレートデータを示した図である。
【図40】上記処理文格納バッファに記憶された文例データを示した図である。
【図41】テンプレートデータベースに記憶されているテンプレートデータの構成を示した図である。
【図42】図41のテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。
【図43】辞書データベースに記憶されておる辞書データを示した図である。
【図44】英語の文例を作成する際のフローを示したフローチャートである。
【図45】生成された英語テンプレートの構成を示した図である。
【図46】テンプレートデータベースに記憶されているテンプレートデータの構成を示した図である。
【図47】図46に示したテンプレートデータにおける日本語テンプレートのスロット部において置換された語句の例を示した図である。
【図48】辞書データベースに記憶されておる辞書データを示した図である。
【図49】英語の文例を作成する際のフローを示したフローチャートである。
【図50】生成された英語テンプレートの構成を示した図である。
【図51】テンプレートデータベース60に記憶されているテンプレートデータの構成を示した図である。
【図52】図51に示したテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。
【図53】辞書データベースに記憶されておる辞書データを示した図である。
【図54】英語の文例を作成する際のフローを示したフローチャートである。
【図55】生成された英語テンプレートの構成を示した図である。
【図56】他の翻訳装置の概略構成を示した図である。
【図57】他のテンプレートデータベースに含まれる一つのテンプレートデータの構成を示した図である。
【図58】テンプレート検索における前半の処理の流れを示したフローチャートである。
【図59】テンプレート検索における後半の処理の流れを示したフローチャートである。
【図60】図58におけるステップS2001の詳細の一部を示したフローチャートである。
【図61】図58におけるステップS2001の詳細の残りの部分を示したフローチャートである。
【図62】1度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。
【図63】処理待ちバッファに格納した後の1つのテンプレートデータを示した図である。
【図64】処理待ちバッファに格納した後の他のテンプレートデータを示した図である。
【図65】処理待ちバッファに格納した後のさらに他のテンプレートデータを示した図である。
【図66】2度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。
【図67】1度目のステップS2117の処理を行なった後の、要素バッファの状態を示した図である。
【図68】図63のテンプレートデータを、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。
【図69】図63のテンプレートデータを、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。
【図70】図63のテンプレートデータを、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。
【図71】図64のテンプレートデータを、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。
【図72】図64のテンプレートデータを、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。
【図73】図64のテンプレートデータを、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。
【図74】図65のテンプレートデータを、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。
【図75】図65のテンプレートデータを、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。
【図76】図65のテンプレートデータを、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。
【図77】日本語の文、日本語の語句、または中国語の語句を示した図である。
【図78】変更前の文と、制御部に含まれる変更部による変更後の文とを示した図である。
【図79】図78とは異なる変更前の文と変更後の文とを示した図である。
【図80】接続前の文と、制御部に含まれる接続部による接続後の文とを示した図である。
【図81】翻訳装置の具体的機能を実現するための用いるテンプレートを示した図である。
【図82】文を変更するためのテーブルを示した図である。
【図83】「助動詞」、「時制」、および「構文」の初期の状態を示したデータである。
【図84】翻訳装置がユーザの指示に基づき図83に示したデータの内容を更新した後のデータの状態を示した図である。
【図85】図84の変更指示データに基づき、図81のテンプレートを図82のテーブルを用いて変更した後のテンプレートの状態を示した図である。
【図86】翻訳装置が図85に示すテンプレートに基づいて生成した文を示した図である。
【図87】翻訳装置がユーザの指示に基づき図83に示したデータの内容を更新した後のデータの他の状態を示した図である。
【図88】図88の変更指示データに基づき、図81のテンプレートを図82のテーブルTB1を用いて変更した後のテンプレートの状態を示した図である。
【図89】翻訳装置が図88に示すテンプレートに基づいて生成した文を示した図である。
【図90】と文との接続に用いられるテーブルした図である。
【図91】文と文とを接続する際に、当該文と文とを一時的に格納するテーブルを示した図である。
【図92】ユーザが上記文変更処理と上記文接続処理とを行なうために、翻訳装置が表示する画像を示した図である。
【図93】翻訳装置が、文と文とを生成し、当該2つの文を第1領域に表示した状態を示した図である。
【図94】図93の状態から、ユーザが、プルダウンメニューにより時制を選択するとともに、他のプルダウンメニューにより構文を選択した場合における画像を示した図である。
【図95】図94の状態から、ユーザが、ボタンを選択した場合における画像を示した図である。
【図96】図95の状態から、ユーザが、他のボタンを選択した場合における画像を示した図である。
【図97】図96の状態から、翻訳装置1が、さらに文と文とを生成し、当該2つの文を第1領域に表示した状態を示した図である。
【図98】図97の状態から、ユーザが、プルダウンメニューにより時制を選択し、他のプルダウンメニューにより構文を選択し、オプションメニューから1つの項目を選択した場合における画像を示した図である。
【図99】図98の状態から、ユーザが、ボタンを選択した場合における画像を示した図である。
【図100】図99の状態から、ユーザが、さらに他のプルダウンメニューにより接続情報を選択した場合における画像を示した図である。
【図101】ユーザが、マウス等の入力部により「sentA」を選択した後、さらに他のボタンを選択した後の状態を示した図である。
【図102】「sentA」として処理済文が選択された場合における、テーブルを示した図である。
【図103】文を「sentB」に割り当てる文として特定した場合における、テーブルTB3を示した図である。
【図104】翻訳装置の処理の流れを示すフローチャートである。
【図105】図104のステップS306に示した文変更処理の詳細を示した図である。
【図106】図104のステップS308に示した文接続処理の詳細を示した図である。
【発明を実施するための形態】
【0018】
本実施の形態では、日本語で入力された文を、英語および中国語に翻訳する場合を例に挙げて説明する。なお、本発明は、これに限定されず、ある言語で入力された文を他の言語に翻訳する構成であれば、適用可能である。
【0019】
日本語には「活用」といった概念がある。「活用」とは、単語が文中でその語の文法的機能や他の語への続き方に応じて、語形を変化させることをいう。また、活用する語の変化形を、「活用形」という。また、用語が活用する際に変化する語末の部分(つまり語幹以外の部分)を、「活用語尾」(inflected suffix)という。
【0020】
以下では、<<1.翻訳装置の一般的機能>>と、<<2.翻訳装置の具体的機能>>とに分けて説明する。なお、「一般的機能」とは、「具体的機能」を説明するための前提となる機能をいう。具体的機能を実現するために、必ずしも、後述する一般的機能を全て具備する必要はない。
【0021】
本発明に係る翻訳装置の一実施の形態について、図1から図106に基づいて説明すると、以下のとおりである。
【0022】
<<1.翻訳装置の一般的機能>>
図1は、本発明の実施の形態に係る翻訳装置1の概略構成を示した図である。
【0023】
翻訳装置1は、同図に示すとおり、入力部10と、出力部11と、制御部12と、記憶装置13と、メモリ14とを備えている。
【0024】
入力部10は、ユーザからの入力を受け付けるための入力デバイスである。入力部10を介してユーザが文の入力を行なうことにより、メモリ14に当該入力された文が記憶される。
【0025】
出力部11は、制御部12からの指示に基づき、入力部10を介して入力されたデータ、および制御部12における各種の処理の結果を表示するためのデバイスである。
【0026】
制御部12は、同図に示すとおり、抽出部20と、データ読出部21と、判定部22と、選択部23と、置換部24と、表示制御部25と、出力文整形部26と、受付部31と、変更部32と、接続部33とを備えている。また、置換部24は、辞書検索部40と、スロット置換部41と、共起置換部42と、変化形探索部43と、未入力箇所置換部44とを備えている。なお、受付部31と、変更部32と、接続部33とについては、後述する「<<2.翻訳装置の具体的機能>>」において説明する。
【0027】
なお、制御部12および制御部12内の各部は機能ブロックであり、これらのブロックにおける処理は、後述するCPU(Central Processing Unit)により実行されるソフトウェアによって実現される。
【0028】
抽出部20は、入力部10を介して日本語(第1言語)で入力された文から、所定の規則にしたがって語句を抽出する。例えば、日本語による文W11(図77参照)が入力部10を介して入力された場合、抽出部20は、例えば形態素解析を行なうことにより、語句W12(名詞)、語句W13(名詞)、および語句W14(動詞)といった3つの語句(形態素)を抽出する。なお、図77は、日本語の文、日本語の語句、または中国語の語句を示した図である。
【0029】
ここで、語句とは語や句を意味し、語句の中には単語(一般に文を構成する最小単位で、特定の意味や文法上の職能を有するものと定義されているもの)や複合語(一般に2個以上の語が結び付いて1つの意味を表すものと定義されているもの)等も含まれる。
【0030】
データ読出部21は、所定の指示を受けた場合、記憶装置13に記憶された各種のデータを読み出す。例えば、データ読出部21は、後述するテンプレートデータを記憶装置13から読み出す。
【0031】
判定部22は、入力部10を介して日本語で入力された文に含まれる語句が、後述する語句と一致するかを判定する。なお、判定部22における判定方法の詳細については後述する。
【0032】
選択部23は、判定部22の判定結果に基づいて、記憶装置13に記憶された日本語による複数のテンプレートの中から、少なくとも一つのテンプレートを選択する。
【0033】
置換部24は、後述する置換処理を行なうことにより、上記選択されたテンプレートを用いて日本語による文例を作成する。さらに、置換部24は、記憶装置13に記憶された、上記選択されたテンプレートと対応関係にある英語(第2言語)および中国語(第2言語)によるテンプレートを用いて、英語および中国語による文例を作成する。なお、置換部24が行なう処理の詳細と、置換部24に含まれる各部(40〜43)が行なう処理とについては後述する。なお、文例とは、後述するテンプレートデータの可変部を語句に置換し終えることにより、得られる文をいう。
【0034】
表示制御部25は、出力部11に対して、入力部10を介して入力されたデータ、および翻訳装置1における各種の処理の結果を表示させる。なお、出力文整形部26については、後述する。
【0035】
図2は、記憶装置13に記憶されているデータを示した図である。
記憶装置13は、同図に示すとおり、テンプレートデータベース60と、辞書データベース61と、日本語活用形テーブル62と、カテゴリデータベース63と、シソーラスデータ64と、共起関係データベース65とを記憶している。
【0036】
テンプレートデータベース60は、後述するテンプレートデータを一つ以上含んでいる。また、辞書データベース61は、後述する辞書データを含んでいる。また、カテゴリデータベース63は、後述するカテゴリデータを一つ以上含んでいる。共起関係データベース65は、後述する共起関係データを一つ以上含んでいる。
【0037】
図3は、上記テンプレートデータベース60に含まれる一つのテンプレートデータの構成を示した図である。同図に示すとおり、テンプレートデータは、テンプレートIDと、日本語によるテンプレート(以下、日本語テンプレート)と、英語によるテンプレート(以下、英語テンプレート)と、中国語によるテンプレート(以下、中国語テンプレート)とを含んでいる。
【0038】
上記テンプレートIDは、テンプレートデータを他のテンプレートデータと識別する識別子である。なお、テンプレートIDは、テンプレートデータ毎に固有の番号が与えられている。
【0039】
上記日本語テンプレートは、所定の語句で構成された固定部と、予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とを含んでいる。同図においては、語句W15(postpositional word functioning as an auxiliary to a main word)と、文W16とが固定部に該当し、{1:&HUMAN-SUBJ}と{2:&VB_EAT+v.ren1}とが可変部に該当する。
【0040】
上記英語テンプレートは、日本語テンプレートと同様に、固定部と可変部とを含んでいる。同図においては、「What」と「?」とのが固定部に該当し、{-i:be_AUX+pres}と{-i:#DET_MY-NULL}と{1-i:&HUMAN-SUBJ}と{2:&VB_EAT+ing}とが可変部に該当する。
【0041】
また、可変部の種類として、第1可変部と第2可変部とがある。同図においては、英語テンプレート中の「1」や「2」といった数字で始まる{1-i:&HUMAN-SUBJ}と{2:&VB_EAT+ing}とが第1可変部に該当し、「-i」で始まる{-i:be_AUX+pres}と{-i:#DET_MY-NULL}とが第2可変部に該当する。なお、以下では、説明の便宜上、第1可変部をスロット部と、第2可変部を共起部と称する。
【0042】
なお、各言語のテンプレートにおいて、「-i」が含まれている可変部は、当該可変部同士の間において共起関係があることを示している。ここで、共起関係とは、一方が決定すると他方が決定するといった関係、あるいは、一方を仮に決定しても他方との関係で当該決定内容を変更せざるを得ないような、言わば両方を共に決定していくような関係をいう。
【0043】
上記中国語テンプレートについても、同図に示すとおり、日本語テンプレートと英語テンプレートと同様に、固定部と可変部とを含んでいる。
【0044】
以上のように、日本語テンプレートと英語テンプレート(あるいは中国語テンプレート)とは、対応する位置に、それぞれ、所定の語句で構成された固定部と、予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とを含んだ構成である。
【0045】
また、以下では、可変部の「1」や「2」といった先頭の数字をスロット番号と称する。また、各可変部において、「:」よりも前の文字と「+」よりも後ろの文字とを除いた部分(同図の場合には、「be_AUX」と「#DET_MY-NULL」と「&HUMAN-SUBJ」と「&VB_EAT」)をラベル(所定の識別標識)と称する。また、上記ラベルのうちスロット部に関する各ラベル(「&」で始まるラベル)を、それぞれ1つのカテゴリとする。
【0046】
なお、上記スロット部と共起部との詳細については、後述する。
図4は、辞書データベース61に含まれる一つの辞書データの構成を示した図である。同図に示すとおり、辞書データにおいては、辞書IDと、見出しと、品詞と、活用と、助数詞コードと、意味コードとが対応付けられている。
【0047】
上記辞書IDの欄には、辞書データを他の辞書データと区別するための識別子(ID)が記載されている。また、上記見出しの欄には、日本語の語句である語句W14(動詞)と、当該語句に対応する英語の語句「drink」と中国語の語句である語句W17(動詞)とが記されている。さらに、上記品詞の欄には、見出しの品詞が記載されている。また、上記活用の欄には、上記各言語について上記語句の活用形に関する情報が記載されている。語句W18の意味は、語句W14が、語句W19(図77参照)が示す活用(five-tire conjugation in the ”ma” column of the kana syllabary)であることを示している。意味コードについては、後述する。
【0048】
また、同図に示すとおり、日本語の語句に対して、英語の語句と中国語の語句とがそれぞれ一つだけ対応付けられている。
【0049】
図5は、上記日本語活用形テーブル62を示した図である。日本語活用形テーブル62には、活用の種類(例えば、語句W20(図77参照)が示す活用(five-tire conjugation of a Japanese consonant-stem verb)、語句W21が示す活用(conjugation of a vowel-stem verb ending in ”-eru”))と、当該活用における各活用形(例えば、語句W22として示した活用形(form of a verb preceding ”nai”)、語句W23として示した活用形(attributive form of a verb))で用いられる語句(例えば、語句W24(inflected suffix)、語句W25(inflected suffix))とが記載されている。なお、同図には、一例として、語句W19が示す活用(つまり語句W18(図4参照))における各活用の語句を記している。また、例えば語句W26として示した活用形(continuative form of a verb)の語句には、「ren1」といった省略形の記号を対応付けている。
【0050】
図6は、上記カテゴリデータベースに含まれる一つのカテゴリデータの構成を示した図である。同図に示すとおり、カテゴリデータにおいては、カテゴリIDとラベル名と意味コードと代表値とが対応付けてられている。
【0051】
上記カテゴリIDの欄には、カテゴリデータを他のカテゴリデータと区別するための識別子が記載されている。ラベル名の欄には、テンプレートデータ(例えば、図3のテンプレートデータ)の可変部に含まれるラベルが記されている。なお、代表値については後述する。
【0052】
図7は、シソーラスデータの階層構造の一部を示した図である。ここで、シソーラスとは、単語の上位/下位関係、部分/全体関係、同義関係、類義関係などによって単語を分類し、体系付けた辞書(語彙集)をいう。
【0053】
まず、上記意味コードは上記ラベルに対応付けられている。例えば、同図においては、「120201」といった意味コードは、「&HUMAN-PRON_SUBJ」といったラベルに対応付けられている。
【0054】
ここで、ラベル名として「&HUMAN-PRON_SUBJ」が与えられ、かつ意味コードとして「120201」が与えられたカテゴリデータに関しては、同図における「&HUMAN-PRON_SUBJ (120201)」といった区分(所定の区分)に含まれるの語句が、当該カテゴリデータに含まれる語句として特定される。例えば、日本語の語句については、語句W27(名詞)、語句W28(名詞)、および語句W12が特定される。
【0055】
ここで、図6に戻り、代表値について説明する。同図に示したように、ラベル「&VB_EAT」と意味コード「52500」とが与えられたカテゴリデータには、日本語と英語と中国語との組が複数組含まれている。そして、これらの複数組のうち所定の組の各語句が、代表値として設定されている。例えば、同図では、語句W29(動詞)、「eat」、語句W14、「drink」、語句W17等の語句が代表値として記されている。
【0056】
ところで、図3に示したテンプレートデータには、可変部として、例えば{2:&VB_EAT+v.ren1}や{2:&VB_EAT+ing}が含まれている。この場合、{2:&VB_EAT+v.ren1}および{2:&VB_EAT+ing}については、上記シソーラスデータにおいて「&VB_EAT (52500)」といった区分に含まれる語句が、置換可能な語句として特定される。また、他の可変部についても同様である。
【0057】
図8は、上記カテゴリデータベースに含まれる他のカテゴリデータの構成を示した図である。この場合、翻訳装置1は、図7に示したシソーラスデータにおいて、「&HUMAN-SUBJ」といった区分に含まれる語句を、置換可能な語句として特定する。同図に示す場合には、翻訳装置1は、例えば、日本語に関しては、語句W27、語句W28、語句W12、語句W30(名詞)等を置換可能な語句として特定する。
【0058】
以上のように、可変部は、予め定められた複数の語句のうちの何れかの語句に置換可能な構成となっている。なお、以下では、置換可能な語句の集合を、候補とも称する。
【0059】
図9Aは、上記共起関係データベースに含まれる共起関係データの構成を示した図である。図9Bは、上記共起関係データベースに含まれる他の共起関係データの構成を示した図である。図9Aおよび図9Bに示すとおり、共起関係データにおいては、言語とラベル名と共起条件とが対応付けられている。言語の欄には、日本語、英語、または中国語といった種別が記される。また、ラベル名の欄には、上述した共起部に記されるラベルが記される。
【0060】
さらに、図9Aの共起条件の欄には、上述したスロット部に用いられる語句(例えば、「I」)と、当該語句が用いられた場合における共起部に用いる文字(例えば、「am」)との対応関係が記されている。一方、図9Bの共起条件の欄には、上述したスロット部のラベル(例えば、「&HUMAN-MY」)と、当該ラベルが条件として指定された場合における共起部に用いる文字(例えば、「my」)との対応関係が記されている。
【0061】
図10は、上記メモリ14内の各バッファを示した図である。
メモリ14は、同図に示すとおり、抽出語句バッファ70と、検索結果テンプレートバッファ71と、スロット部用バッファ72と、共起部用バッファ73と、優先共起バッファ74と、処理文格納バッファ75と、翻訳結果バッファ76と、テンポラリテンプレートバッファ77と、テンポラリ辞書バッファ78と、テンポラリ語句バッファ79と、テンポラリスロットバッファ80と、テンポラリ第1共起バッファ81と、テンポラリ第2共起バッファ82と、入力文バッファ83と、を備えている。これらの各バッファが記憶するデータについては、後述する。
【0062】
なお、メモリ14内には、上記の各バッファ専用の領域が常に用意されている必要はなく、処理に必要となるバッファの領域がメモリ14内で順次確保される構成であればよい。
【0063】
ここで、図11を参照して、本実施の形態に係る翻訳装置1の具体的構成の一態様について説明する。同図は、翻訳装置1として機能するコンピュータシステム100のハードウェア構成を表わすブロック図である。
【0064】
コンピュータシステム100は、主たる構成要素として、プログラムを実行するCPU110と、コンピュータシステム100の使用者による指示の入力を受けるマウス120およびキーボード130と、CPU110によるプログラムの実行により生成されたデータ、又はマウス120若しくはキーボード130を介して入力されたデータを揮発的に格納するRAM140と、データを不揮発的に格納するハードディスク150と、CD−ROM(Compact Disk-Read Only Memory)駆動装置160と、モニタ170と、通信IF(Interface)180とを含む。各構成要素は、相互にデータバスによって接続されている。CD−ROM駆動装置160には、CD−ROM161が装着される。
【0065】
なお、翻訳装置1における入力部10がキーボード130およびマウス120に該当し、出力部11がモニタ170に該当し、記憶装置13がハードディスク150に該当し、メモリ14がRAM140に該当する。
【0066】
コンピュータシステム100における処理は、各ハードウェアおよびCPU110により実行されるソフトウェアによって実現される。このようなソフトウェアは、ハードディスク150に予め記憶されている場合がある。また、ソフトウェアは、CD−ROM161その他の記憶媒体に格納されて、プログラムプロダクトとして流通している場合もある。あるいは、ソフトウェアは、いわゆるインターネットに接続されている情報提供事業者によってダウンロード可能なプログラムプロダクトとして提供される場合もある。このようなソフトウェアは、CD−ROM駆動装置160その他の読取装置によりその記憶媒体から読み取られて、あるいは、通信IF180を介してダウンロードされた後、ハードディスク150に一旦格納される。そのソフトウェアは、CPU110によってハードディスク150から読み出され、RAM140に実行可能なプログラムの形式で格納される。CPU110は、そのプログラムを実行する。
【0067】
同図に示されるコンピュータシステム100を構成する各構成要素は、一般的なものである。したがって、翻訳装置1の本質的な部分は、RAM140、ハードディスク150、CD−ROM161その他の記憶媒体に格納されたソフトウェア、あるいはネットワークを介してダウンロード可能なソフトウェアであるともいえる。なお、コンピュータシステム100の各ハードウェアの動作は周知であるので、詳細な説明は繰り返さない。
【0068】
なお、記録媒体としては、CD−ROM、FD(Flexible Disk)、ハードディスクに限られず、磁気テープ、カセットテープ、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、IC(Integrated Circuit)カード(メモリカードを含む)、光カード、マスクROM、EPROM(Electronically Programmable Read-Only Memory)、EEPROM(Electronically Erasable Programmable Read-Only Memory)、フラッシュROMなどの半導体メモリ等の固定的にプログラムを担持する媒体でもよい。
【0069】
ここでいうプログラムとは、CPUにより直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
【0070】
ところで、上記構成は、あくまでも具体的構成の一態様にすぎず、上記マウスを備えず、かつ、キーボードとモニタとハードディスクとが翻訳装置1内に備えられている構成であってもよい。上記翻訳装置1は、電子辞書や携帯電話等のポータブル型の携帯情報端末としても構成できる。
【0071】
このような携帯情報端末として翻訳装置1を構成する場合には、ハードディスク150の代わりに例えばフラッシュメモリを用いることができる。また、入力部として、タッチペン式の入力装置を備える構成としてもよい。さらに、小型化の観点から、モニタ170としては、液晶モニタや有機ELモニタ等の薄型のモニタを使用することが好適である。また、小型化の観点から、CD−ROM駆動装置の代わりにメモリカードを読み取る装置を設けておき、記録媒体としてCD−ROMの代わりに当該メモリカードを用いることが好適である。
【0072】
ここで、翻訳装置1における処理の具体的な流れについて、図12から図40に基づいて説明する。また、以下では、処理フローの各ステップにおいて行われる処理の結果、どのようなデータが作成されるかを、適宜具体例を挙げて説明する。
【0073】
図12は、翻訳装置1における処理の概略を示したフローチャートである。
まず、入力部10を介して日本語による文が翻訳装置1に入力される(S1)。なお、当該入力された文はメモリ14の入力文バッファ83に一時的に記憶される。ステップS1の後は、制御部12が、テンプレートデータベース60において、所定の条件を満たすテンプレートデータデータを検索する(S2)。
【0074】
ステップS2の後は、上記所定の条件を満たすテンプレートデータが存在したか否かを制御部12が判断する(S3)。ステップS3において上記テンプレートデータが存在したと判断された場合には、制御部12は、処理をステップS4の文例作成処理に進める。一方、ステップS3において上記テンプレートデータが存在しないと判断された場合、制御部12は処理を終了する。
【0075】
ステップS4においては、置換部24は、上記テンプレートデータを用いて、日本語の文例と、当該文例に対応する英語の文例および中国語の文例とを作成する。ステップS4の後は、表示制御部25は、各言語による文例を出力部11に表示させる(S5)。
【0076】
なお、上記においては、テンプレートデータが日本語テンプレートと英語テンプレートと中国語テンプレートとを含んでおり、各言語によるテンプレートを用いて各言語による文例を作成する構成を示したが、これに限定されるものではない。
【0077】
例えば、ユーザが日本語の文を英語に翻訳した結果を知りたい場合には、ユーザが入力部10を介して翻訳装置1に所定の指示を送ることにより、中国語の文例を表示することなく、日本語の文例と英語の文例とを翻訳装置1が表示する構成としてもよい。つまり、翻訳装置1は、ユーザが翻訳が不要と考える言語については、出力部11で出力させる必要はない。また、この際、不要な言語については、文例を作成する処理を翻訳装置1が行わない構成としてもよい。
【0078】
次に、上記ステップS2におけるテンプレートの検索の詳細について、図13および図14に基づいて説明する。
【0079】
図13は、テンプレート検索における処理の流れを示したフローチャートである。また、図14は、抽出語句バッファ70に記憶されるデータの構成を示した図である。
【0080】
まず、抽出部20が、入力された日本語の文から上記所定の規則にしたがって語句を抽出し、当該抽出した語句を抽出語句バッファ70に記憶させる(S201)。例えば、文W11(図77参照)を入力した場合、抽出語句バッファ70には、図14に示すとおり、抽出された各語句(語句W14、語句W12、語句W13)が、語句(日本語)の欄に語句番号と対応付けられた形で記憶される。なお、語句番号は、抽出した語句を互いに識別するための番号である。なお、以下では、説明の便宜上、抽出した語句を、語句(WX)として表記する。
【0081】
ステップS201の後は、データ読出部21が、テンプレートデータベース60からテンプレートデータを一つ読み出す(S202)。そして、ステップS202の後は、制御部12が、抽出語句バッファ70から語句(WX)を一つ読み出す(S203)。
【0082】
ステップS203の後は、判定部22が、読み出したテンプレートデータにおける日本語テンプレートの固定部に、上記読み出した語句(WX)または当該語句(WX)の活用形を示した語句(WX′)が存在するか否かを判断する(S204)。なお、語句(WX′)が存在するか否かの判断に際しては、上述した、辞書データの活用の欄における情報と日本語活用形テーブルとを用いる。
【0083】
ステップS204において、存在すると判断された場合には、制御部12は、処理をステップS206に進める。一方、ステップS204において、存在しないと判断された場合には、判定部22が、上記日本語テンプレートの可変部に置換可能な語句(つまり、上記候補)に、上記読み出した語句(WX)または上記語句(WX′)が含まれているか否かを判断する(S205)。
【0084】
ステップS205において、存在すると判定された場合には、制御部12は、処理をステップS206に進める。一方、ステップS205において、存在しないと判定された場合には、制御部12は、処理をステップS208に進める。
【0085】
ステップS206においては、制御部12が、未だ読み出していない語句が抽出語句バッファ70に存在するか否かを判定する。ステップS206において存在すると判断された場合には、制御部12は、処理をステップS203に戻す。一方、S206において存在しないと判断された場合には、選択部23が、上記テンプレートデータを検索結果テンプレートバッファ71に記憶させる(S207)。このように、選択部23により、複数のテンプレートデータの中から一定の条件を満たしたテンプレートデータが選択されて、検索結果テンプレートバッファ71に記憶されることになる。なお、ステップS207の後は、制御部12は、処理をステップS208に進める。
【0086】
ステップS208においては、制御部12が、テンプレートデータベース60内に、未だ読み出していないテンプレートデータが存在するか否かを判断する。ステップS208において存在すると判断された場合には、制御部12は、処理をステップS202に戻す。一方、ステップS208において存在しないと判断された場合には、制御部12は、処理を図12のステップS13に進める。
【0087】
次に、上記ステップS4における文例作成処理の詳細について、図15から図19に基づいて説明する。
【0088】
図15は、文例作成処理における処理の流れを示したフローチャートである。
まず、制御部12が、検索結果テンプレートバッファ71からテンプレートデータを一つ読み出し、当該読み出したテンプレートデータをテンポラリテンプレートバッファ77に記憶させる(S401)。例えば、図3に示すようようなテンプレートデータが検索結果テンプレートバッファ71に記憶されている場合、制御部12は、図16に示すとおり、結果番号が付与された形でテンポラリテンプレートバッファ77に当該テンプレートデータを記憶させる。なお、結果番号とは、複数のテンプレートデータからテンプレートデータを識別するための番号であり、検索結果テンプレートバッファ71にテンプレートデータが記憶される際に付される番号である。
【0089】
ステップS401の後は、制御部12が、上記読み出したテンプレートデータを処理文格納バッファ75に格納する(S402)。当該ステップS402によって、例えば、制御部12は、図17に示すとおり、図16で示したテンプレートデータのうち上記結果番号とテンプレートIDとを除いたデータが処理文格納バッファ75に記憶させる。なお、図16は、テンポラリテンプレートバッファ77に記憶されたテンポラリテンプレートデータの構成を示した図である。また、図17は、処理文格納バッファ75に記憶されたテンプレートデータを示した図である。
【0090】
ステップS402の後は、制御部12が、処理文格納バッファ75からスロット部に関する情報を上述したカテゴリ(つまり、「&」で始まるラベル)毎に抽出し、当該抽出した各データを所定形式のテーブルの所定箇所に代入する(S403)。
【0091】
このステップS403の処理により、図17に示すデータの例では、スロット部用バッファ72に、図18に示すとおり、スロット番号と、当該スロット番号に対応するカテゴリと、各言語の情報(活用情報および共起フラグの情報)とが対応付けされて記憶される。なお、活用情報の欄と、共起フラグの欄と、置換語句の欄とにおいては、言語別に欄(以下、小欄という)が設けられている。なお、図18は、スロット部用バッファ72に記憶されたデータを示した図である。
【0092】
ここで、制御部12は、同図の活用情報の欄に、言語毎に、スロット部の「+」より後ろの文字列を書き込む。例えば、制御部12は、日本語テンプレートでは、活用情報の欄に{2:&VB_EAT+v.ren1}の「v.ren1」を書き込み、英語のテンプレートでは、活用情報の欄に{2:&VB_EAT+ing}の「ing」を書き込む。
【0093】
また、スロット部に「-i」という符号が付されている場合、制御部12は、同図の共起フラグの欄には、当該スロット部に関連する小欄(同図では、英語の小欄)の箇所に、「i」を書き込む。ここで、上記符号は、他の可変部との関連性を示す符号である。なお、同図における置換語句の欄と、処理済フラグの欄とについては、後述する。
【0094】
また、以下では、説明の便宜上、一つのカテゴリと、当該カテゴリに関する、上記活用情報と上記共起フラグの情報と置換語句との言語毎の情報とからなる情報を、スロット情報と称する。例えば、図18においては、「&HUMAN-SUBJ」に関するスロット情報と、「&VB_EAT」とに関するスロット情報とが存在していることになる。
【0095】
ステップS403の後は、制御部12が、処理文格納バッファ75から共起部に関する情報をラベル(つまり、「&」で始まるラベル)毎に抽出し、当該抽出した各データを所定形式のテーブルの所定箇所に書き込む(S404)。
【0096】
このステップS404の処理により、図17に示すデータの例では、共起部用バッファ73に、図19に示すとおり、共起番号と、ラベルと、言語と、優先処理フラグと、置換語句と、共起フラグとが対応付けて記憶される。なお、図19は、共起部用バッファ73に記憶されたデータを示した図である。
【0097】
ここで、上記共起番号とは、共起部をラベル毎に区別するために付された番号である。また、上記言語は、ラベル名で特定される共起部を含むテンプレートが、何れの言語のテンプレートであるかを示している。言い換えれば、上記言語は、ラベル名で特定される共起部に何れの言語が用いられるのかを示した情報といえる。
【0098】
また、上記優先処理フラグは、後述する共起部の作成の際に用いられるフラグである。図17の英語テンプレートに示すように、共起部の「:」の後ろに「#」が付されている場合、当該共起部のラベルに関する図19の優先処理フラグの欄に、フラグ「1」を立てる。
【0099】
なお、以下では、説明の便宜上、一つのラベルと、当該ラベルに関する、上記言語と上記優先処理フラグと上記置換語句と上記共起フラグとの情報とからなる情報を、共起情報と称する。例えば、図19においては、「be_AUX」に関する共起情報と、「DET_MY-NULL」とに関する共起情報とが存在していることになる。
【0100】
ステップS404の後は、制御部12が、スロット部用バッファ72にデータが書き込まれているか否かを判断する(S405)。ステップS405においてデータが書き込まれていると判断された場合には、置換部24が、スロット部の処理を実行する(S406)。そして、ステップS406の後は、制御部12は、処理をステップS407に進める。なお、当該ステップS406の詳細については、後述する。
【0101】
一方、ステップS405においてデータが書き込まれていないと判断された場合には、制御部12は、処理をステップS407に進める。なお、テンプレートデータによっては、スロット部が存在しないものもあるため、制御部12は、ステップS405においてデータが書き込まれているか否かを判断している。
【0102】
ステップS407においては、制御部12が、共起部用バッファ73にデータが書き込まれているか否かを判断する。ステップS407においてデータが書き込まれていると判断された場合には、置換部24が、共起部の処理を実行する(S408)。そして、ステップS408の後は、制御部12は、処理をステップS409に進める。なお、当該ステップS408の詳細については、後述する。
【0103】
一方、ステップS407においてデータが書き込まれていないと判断された場合には、制御部12は、処理をステップS409に進める。なお、テンプレートデータによっては、共起部が存在しないものもあるため、制御部12は、ステップS407においてデータが書き込まれているか否かを判断している。
【0104】
ステップS409においては、出力文整形部26が、スロット部と共起部とが処理されることにより作成された文例に対して、後処理を行なう。なお、当該処理の詳細については後述する。上記文例としては、日本語による文例と、英語による文例と、中国語による文例が含まれる。つまり、置換部24と出力文整形部26とにより、各言語のテンプレートに対応した文例が作成される。
【0105】
ステップS409の後は、制御部12が、上記後処理した文例を翻訳結果バッファ76に書き込む(S410)。ステップS410の後は、制御部12が、未だ読み出されていないテンプレートデータが検索結果テンプレートバッファ71に存在しているか否かを判断する(S411)。
【0106】
ステップS411において存在すると判断された場合には、制御部12は、処理をステップS401に戻す。一方、ステップS411において存在しないと判断された場合には、制御部12は、処理を図12のステップS5に進める。
【0107】
次に、上記ステップS406におけるスロット部の処理の詳細について、図20A、図20B、および図21から図28に基づいて説明する。
【0108】
図20Aは、スロット部の処理フローにおける前半の処理フローを示したフローチャートである。図20Bは、スロット部の処理フローにおける後半の処理フローを示したフローチャートである。
【0109】
まず、スロット置換部41が、抽出語句バッファ70から語句(WX)を一つ読み出し、当該読み出した語句(WX)をテンポラリ語句バッファ79に書き込む(S601)。例えば、図14に示すとおり、抽出語句バッファ70に語句W14と語句W12と語句W13とが記憶されている場合、スロット置換部41は、同図に示す語句番号の順に語句を読み出す。ここでは、スロット置換部41は、最初に語句W14を読み出す。なお、テンポラリ語句バッファの構成については後述する。
【0110】
S601の後は、スロット置換部41が、スロット部用バッファ72から上述したスロット情報を一つ抽出し、テンポラリスロットバッファ80に書き込む(S602)。例えば、スロット置換部41は、図18に示すスロット部用バッファ72から、最初に「&HUMAN-SUBJ」に関するスロット情報を抽出する。また、抽出されたスロット情報については、制御部12は、スロット置換部41が抽出済みであることを示すフラグ(図示せず)を立てる。なお、以下では、説明の便宜上、上記のようにテンポラリスロットバッファ80に記憶されたスロット情報をスロット情報(SX)として表記する。
【0111】
ステップS602の後は、スロット置換部41が、テンポラリ語句バッファ79に書き込んだ語句(WX)が抽出したスロット情報(SX)に関連する語句であるか否かを判断する(S603)。
【0112】
ステップS603について具体的には、以下のように判断する。なお、語句(WX)として語句W14(図14、図77参照)が読み出されており、かつスロット情報(SX)として「&HUMAN-SUBJ」に関するスロット情報が抽出されているものとする。この場合、スロット置換部41が、図7に示したシソーラスデータを参照し、「&HUMAN-SUBJ」といった区分に含まれる語句に、語句W14といった語句が存在するか否かを判断する。実際のところ、「&HUMAN-SUBJ」といった区分に含まれる語句に語句W14は存在しないので、この場合、スロット置換部41は、ステップS603において、テンポラリ語句バッファ79に書き込んだ語句(WX)は抽出したスロット情報(SX)に関連する語句ではないと判断する。
【0113】
ステップS603において関連する語句であると判断された場合には、制御部12は、処理をステップS604に進める。一方、ステップS603において関連する語句ではないと判断された場合には、制御部12は、処理をステップS610に進める。
【0114】
ここで、説明の便宜上、ステップS604からステップS609の説明の前に、ステップS610の説明を行なう。
【0115】
ステップS610においては、スロット置換部41が、スロット部用バッファ72に、未だ抽出されていないスロット情報が存在するか否かを判断する。ステップS610においてスロット情報が存在すると判断された場合には、制御部12は、処理をステップS602に進める。一方、ステップS610においてスロット情報が存在しないと判断された場合には、制御部12は、処理をステップS611に進める。
【0116】
ここで、上記の例では、「&HUMAN-SUBJ」に関するスロット情報は抽出されているが、「&VB_EAT」に関するスロット情報は未だ抽出されていないため、スロット置換部41は、ステップS610においてスロット情報が存在すると判断する。そして、ステップS602において、図21に示すとおり、スロット置換部41が「&VB_EAT」に関するスロット情報を抽出する。なお、図21は、テンポラリスロットバッファ80に記憶されたスロット情報の構成を示した図である。
【0117】
さらに、この場合、スロット置換部41は、テンポラリ語句バッファ79に書き込まれた語句W14(WX)が、「&VB_EAT」に関するスロット情報に関連する語句であるか否かを、ステップS603において判断することになる。ここでは、上記と同様に、スロット置換部41が、図7に示したシソーラスデータを参照し、「&VB_EAT」といった区分に含まれる語句に、語句W14が存在するか否かを判断する。実際のところ、「&VB_EAT」といった区分に含まれる語句に語句W14は存在するため、この場合、スロット置換部41は、ステップS603において、テンポラリ語句バッファ79に書き込んだ語句(WX)は抽出したスロット情報(SX)に関連する語句であると判断する。その結果、制御部12は、処理をステップS604に進める。
【0118】
ここで、ステップS604からステップS609について説明する。なお、ステップS604からステップS609の説明においては、語句(WX)として語句W14が読み出されており、かつスロット情報(SX)として「&VB_EAT」に関するスロット情報が抽出されている例を挙げて説明する。
【0119】
ステップS604においては、辞書検索部40が、語句(WX)を含んだ辞書データを辞書データベース61から読み出し、当該読み出した辞書データをテンポラリ辞書バッファ78に書き込む。さらに、ステップS604の後は、スロット置換部41が、テンポラリ辞書データにおける見出しの欄に書き込まれた英語と中国語とのデータを用いて、テンポラリ語句バッファ79の英語の語句の欄と中国語の語句の欄との書き込みを行なう(S605)。また、ステップS605の後は、制御部12は、処理をステップS606に進める。
【0120】
ステップS604およびステップS605について具体例を挙げて説明すると、以下の通りである。まず、ステップS604において、辞書検索部40は、図22に示すとおり、語句W14(WX)を含んだ辞書データを、テンポラリ辞書バッファ78に書き込む。なお、図22は、テンポラリ辞書バッファ78に記憶された辞書データを示した図である。ここで、見出しの欄に書き込まれた英語のデータが「drink」であり、中国語のデータが語句W17である。したがって、ステップS605において、スロット置換部41は、「drink」と語句W17とを、図23に示すとおり、それぞれ、テンポラリ語句バッファ79の英語の語句の欄と中国語の語句の欄とに書き込む。なお、図23は、テンポラリ語句バッファ79に記憶されたデータを示した図である。
【0121】
ステップS606においては、変化形探索部43が、テンポラリスロットバッファ80に書き込まれたスロット情報(SX)において、上記活用情報の欄にデータが書き込まれているかを判断する。そして、ステップS606においてデータが書き込まれていると判断された場合には、スロット置換部41が、当該活用情報とテンポラリ辞書バッファ78の活用の欄のデータと図5に示した日本語活用形テーブル62とを用いて、テンポラリ語句バッファ79における語句(WX)の語形を変化させる(S607)。さらに、ステップS607においては、スロット置換部41が、上記活用情報を用いて、テンポラリ語句バッファ79における、語句(WX)に対応する英語の語句と中国語の語句との語形を変化させる。そして、ステップS607の後は、ステップS608に進む。
【0122】
ステップS606およびステップS607について具体例を挙げて説明すると、以下の通りである。先ず、テンポラリスロットバッファ80に、図21に示すとおり、「&VB_EAT」に関するスロット情報(SX)があるため、当該スロット情報の活用情報の欄を、スロット置換部41が確認する。ここで、活用情報の欄には、日本語に関しては動詞の連用形1を示す「v.ren1」が書き込まれており、英語に関しては進行形を示す「ing」が書き込まれている。
【0123】
そして、語句W14(WX)については、図22に示すテンポラリ辞書データの活用の欄に、語句W19(図77参照)が示す活用であることを示す語句W18が書き込まれている。それゆえ、スロット置換部41が、当該語句W18が示す情報と「v.ren1」という情報とを用いて、図5に示した日本語活用形テーブル62から活用形で用いられる語句(この例では、語句W31(inflected suffix))を取得する。そして、スロット置換部41は、テンポラリ語句バッファ79における語句W14のうち語句W32(inflected suffix)を、当該取得した語句W31で置換する(図23,77参照)。
【0124】
また、「drink」といった語句については、スロット置換部41が、テンポラリスロットバッファ80の「ing」という情報に基づき、テンポラリ辞書バッファ78の活用の欄から「*ing」という情報を得る。この「*ing」という情報は、「*」の部分に、テンポラリ辞書バッファ78の見出しの欄の語句「drink」を挿入すればよいことを示した情報である。それゆえ、スロット置換部41は、テンポラリ語句バッファ79の「drink」を、「*」の部分に「drink」を挿入して得られた「drinking」に置換する。
【0125】
なお、中国語である語句W17(図22参照)に関しては、活用情報が書き込まれていないため、スロット置換部41は、語形の変化を行わない。
【0126】
以上の結果、テンポラリ語句バッファ79には、図24に示すとおり、語句W33(動詞)と「drinking」と語句W17とが各言語の欄に書き込まれることになる。なお、図24は、テンポラリ語句バッファ79に記憶された、語形変化を行った後のデータを示した図である。
【0127】
次に、ステップS608においては、スロット置換部41が、処理文格納バッファ75に記憶された各言語のテンプレートにおける上記スロット情報に関連するスロット部を、テンポラリ語句バッファ79に記憶されている語句で置換する。そして、ステップS608の後は、制御部12は、処理をステップS609に進める。
【0128】
ステップS608について具体例を挙げて説明すると、以下の通りである。
まず、処理文格納バッファ75には、図17に示したテンプレートデータが記憶されている。また、テンポラリ語句バッファ79(図24参照)には、日本語の欄に語句W33が、英語の欄に「drinking」が、中国語の欄に語句W17が書き込まれている。
【0129】
そこで、スロット置換部41は、図17に示した日本語テンプレートの{2:&VB_EAT+v.ren1}を語句W33に置換する。また、スロット置換部41は、同図に示した英語テンプレートの{2:&VB_EAT+ing}を上記「drinking」に置換する。さらに、スロット置換部41は、同図に示した中国語テンプレートの{2:&VB_EAT}を語句W17に置換する。
【0130】
以上により、図25に示すとおりのテンプレートデータが処理文格納バッファ75に記憶されることになる。なお、図25は、処理文格納バッファ75に記憶された、スロット部における置換処理の途中状態のテンプレートデータを示した図である。
【0131】
ところで、図25においては、可変部であることを判別しやすくするため、便宜上、置換した語句(語句W33と「drinking」と語句W17)を、{}といった括弧書きで記載している。実際には、翻訳装置1においては、{}を含めた可変部全体が語句で置換されることになる。つまり、置換された可変部には{}といった括弧は存在しなくなる。後述する、図27と図34と図39と図40と図45と図50と図55とにおいても、同様である。
【0132】
ステップS609においては、制御部12は、スロット部用バッファ72に記憶されている上記スロット情報(SX)の置換語句の欄に、各言語のテンプレートの置換に用いた語句を書き込むとともに、上記処理済フラグの欄に置換処理済であることを示すフラグを立てる。
【0133】
この処理により、例えば図18で示された、スロット部用バッファ72に記憶されているデータが更新される。ここでは、制御部12は、図26に示すとおり、「&VB_EAT」に関するスロット情報における置換語句の日本語の欄に語句W33を、英語の欄に「drinking」が、中国語の欄に語句W17を書き込む。さらに、制御部12は、同図に示すとおり、「&VB_EAT」に関するスロット情報における処理済フラグの欄に、「1」を書き込む。なお、図26は、スロット部用バッファ72に記憶された、スロット部における置換処理の途中状態のスロット情報を示した図である。
【0134】
ステップS609の後は、ステップS610に進む。なお、ステップS610については説明を行ったので、ここでの説明は省略する。
【0135】
ステップS610の後は、スロット置換部41が、未だ読み出されていない語句が抽出語句バッファ70に存在するか否かを判断する(S611)。ステップS611において存在すると判断された場合には、制御部12は、処理をステップS601に戻す。一方、ステップS611において存在しないと判断された場合には、制御部12は、処理をステップS612に進める。
【0136】
なお、ステップS612に進む際には、処理文格納バッファ75において、各言語のテンプレートのスロット部が、例えば図27に示すとおり語句で置換されている。なお、図27は、処理文格納バッファ75に記憶された、スロット部の置換処理が完了した状態におけるテンプレートデータを示した図である。
【0137】
また、スロット部用バッファ72は、図26に示した状態から図28に示した状態に遷移する。つまり、制御部12は、「&HUMAN_SUBJ」に関するスロット情報における置換語句の日本語の欄に語句W12を、英語の欄に「he」を、中国語の欄に語句W34(名詞)を書き込む。さらに、同図に示すとおり、「&HUMAN_SUBJ」に関するスロット情報における処理済フラグの欄に、制御部12は、「1」を書き込む。なお、図28は、スロット部用バッファ72に記憶された、スロット部の置換処理が完了した状態におけるスロット情報を示した図である。
【0138】
この場合、以上の処理により全てのスロット情報が読み出されているため、全てのスロット情報について、抽出済みフラグ(図示せず)が立っている。一方で、抽出部20で抽出した語句がn個(n:自然数)であり、日本語テンプレートにおけるスロット部の個数がn+1個以上の場合等には、スロット部に語句が置換されていない状況が起こりうる。つまり、この場合、置換処理済みであることを示すフラグが立っていないスロット情報が存在する。
【0139】
そこで、ステップS612においては、スロット置換部41が、全てのスロット情報について、抽出済みであることを示すフラグを消去する。そして、ステップS612の後は、スロット置換部41が、再度、スロット部用バッファ72からスロット情報を一つ抽出し、当該抽出したスロット情報をテンポラリスロットバッファ80に再度書き込む(S613)。
【0140】
ステップS613の後は、スロット置換部41が、抽出したスロット情報において、置換処理済であることを示すフラグが立っているか否かを判断する(S614)。ステップS614においてフラグが立っていると判断された場合には、制御部12は、処理をステップS616に進める。一方、ステップS614においてフラグが立っていないと判断された場合には、未入力箇所置換部44が、当該スロット情報に対応する各言語のテンプレートのスロット部を、所定の語句に置換する(S615)。さらに、制御部12は、当該スロット情報の置換語句の欄にも、上記置換された語句と同じ語句を書き込む。また、ステップS615の後は、制御部12は、処理をステップS616に進める。
【0141】
なお、上記語句の置換の仕方としては、例えば、ユーザが入力部10を介して入力する構成とすることができる。また、未入力箇所置換部44が、図7に示したシソーラスデータを参照し、上記スロット部のラベルが存在する階層の語句および当該階層よりも下層の語句の何れかを用いて、語句の置換を行なう構成としてもよい。この場合、置換する語句としては、例えば上述した代表値を用いることができる。また、ユーザが入力する場合であっても、未入力箇所置換部44が、上記スロット部のラベルで示される区分に含まれる語句を、埋め込み対象語句として出力部11に表示するとともに、表示した語句の中から一つの語句をユーザに選択させる構成としてもよい。未入力箇所置換部44における置換の方法は特に限定されるものではない。
【0142】
ステップS616においては、スロット置換部41が、未だ読み出されていない語句が抽出語句バッファ70に存在するか否かを判断する。ステップS616において存在すると判断された場合には、制御部12は、処理を、再度、ステップS613に進める。一方、ステップS616において存在しないと判断された場合には、制御部12は、処理を図15のステップS407に進める。
【0143】
次に、上記ステップS408における共起部の処理の詳細について、図29A、図29B、および図30から図40に基づいて説明する。
【0144】
図29Aは、共起部の処理フローにおける前半の処理フローを示したフローチャートである。図29Bは、共起部の処理フローにおける後半の処理フローを示したフローチャートである。
【0145】
まず、共起置換部42が、共起部用バッファ73から上述した共起情報を一つ抽出し、テンポラリ第1共起バッファ81に書き込む(S801)。共起置換部42は、例えば、図19に示す共起部用バッファ73内のデータから、最初に「be_AUX」に関する共起情報を抽出し、当該共起情報を、図30に示すとおり、テンポラリ第1共起バッファ81に書き込む。また、制御部12は、抽出された共起情報については、共起置換部42が抽出済みであることを示すフラグ(図示せず)を立てる。なお、図30は、テンポラリ第1共起バッファ81に記憶された共起情報を示した図である。また、以下では、説明の便宜上、上記のようにテンポラリ第1共起バッファ81に書き込まれた情報を共起情報(CX)として表記する。
【0146】
ステップS801の後は、制御部12は、テンポラリ第1共起バッファ81に書き込まれた共起情報において、優先処理フラグが立っているか否かを判断する(S802)。ステップS802において優先処理フラグが立っていると判断された場合には、制御部12は、処理をステップS803に進める。一方、ステップS802において優先処理フラグが立っていないと判断されたされた場合には、制御部12は、処理をステップS807に進める。例えば、「be_AUX」に関する共起情報については、図30に示すように優先処理フラグが立っていないので、この場合には、制御部12は、処理をステップS808に進める。
【0147】
ここで、説明の便宜上、ステップS803からステップS807の説明の前に、ステップS808の説明を行なう。
【0148】
ステップS808においては、共起置換部42が、未だ抽出されていない共起情報が存在するか否かを判断する。ステップS808において共起情報が存在すると判断された場合には、制御部12は、処理をステップS801に進める。一方、ステップS808において共起情報が存在しないと判断された場合には、制御部12は、処理をステップS809に進める。
【0149】
ここで、上記の例では、「be_AUX」に関する共起情報は抽出されているが、「DET_MY-NULL」に関する共起情報は未だ抽出されていないため、制御部12は、ステップS808においてスロット情報が存在すると判断する。そして、ステップS801において、図31に示すとおり、共起置換部42が「DET_MY-NULL」に関する共起情報を抽出する。なお、図31は、テンポラリ第1共起バッファ81に記憶された共起情報の構成を示した図である。
【0150】
また、同図に示すとおり「DET_MY-NULL」に関する共起情報は優先処理フラグが立っているため、制御部12は、ステップS802においては優先処理フラグがあると判断し、その結果、処理をステップS803に進める。
【0151】
ここで、ステップS803からステップS807について説明する。なお、ステップS803からステップS807の説明においては、共起情報(CX)として「DET_MY-NULL」に関する共起情報が抽出されている例を挙げて説明する。
【0152】
ステップS803においては、共起置換部42が、スロット部用バッファ72から、共起情報(CX)に含まれる共起フラグを有するスロット情報を読み出し、当該読み出したスロット情報をテンポラリスロットバッファ80に書き込む。
【0153】
ここで、具体例を挙げて説明する。図21に示す「DET_MY-NULL」に関する共起情報(CX)には、共起フラグ「i」が立っている。一方、スロット部用バッファ72には、図28に示すとおり、共起フラグ「i」を含んだ「&HUMAN-SUBJ」に関するスロット情報が存在する。したがって、共起置換部42は、テンポラリスロットバッファ80に、図32に示すような「&HUMAN-SUBJ」に関するスロット情報を書き込む。なお、図32は、テンポラリスロットバッファ80に記憶されたスロット情報の構成を示した図である。
【0154】
ステップS803の後は、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報に基づき、共起関係対応データベースから共起関係対応データを読み出す(S804)。そして、ステップS804の後は、共起置換部42が、テンポラリスロットバッファ80に書き込んだスロット情報と、上記読み出した共起関係対応データとに基づいて、テンポラリ語句バッファ79に語句を書き込む(S805)。また、ステップS805の後は、制御部12は、処理をステップS806に進める。
【0155】
ステップS804およびステップS805について具体例を挙げて説明すると、以下の通りである。
【0156】
まず、ステップS804において、共起置換部42は、図9Bに示す共起関係データを読み出す。そして、ステップS805において、共起置換部42は、図32に示すスロット情報と、当該読み出した共起関係データとに基づいて、テンポラリ語句バッファ79に語句を書き込む。この例の場合、スロット情報に置換される語句W12(図7参照)の属するのカテゴリ(ラベルの一種)が「&HUMAN-PRON_SUBJ(&HUMAN-SUBJ)」であるため、共起置換部42は、当該ラベルが条件として指定された場合に用いられる文字を書き込む。
【0157】
図9Bによると、ラベルが「&HUMAN-MY」に属する場合は「my」という文字が書き込まれるが、それ以外の場合には「(NULL)」という文字が書き込まれる。したがって、ステップS805において、共起置換部42は、図33に示すとおり、テンポラリ語句バッファ79における英語の欄に、「(NULL)」を書き込む。なお、(NULL)については、後述する。なお、図33は、テンポラリ語句バッファ79に記憶されたデータを示した図である。
【0158】
このように、共起部の置換候補を決定する場合には、シソーラスデータの木をたどり、ラベルの包含関係も考慮に入れる必要がある。
【0159】
ステップS806においては、共起置換部42が、処理文格納バッファ75に記憶された各言語のテンプレートにおける上記共起情報に関連する共起部を、テンポラリ語句バッファ79に記憶されている語句で置換する。そして、ステップS806の後は、ステップS807に進む。
【0160】
ステップS806について具体例を挙げて説明すると、以下の通りである。まず、共起置換部42は、図27に示した英語テンプレートの「{-i:#DET_MY-NULL}」といった共起部の「-i:#DET_MY-NULL」を「(NULL)」で置き換える。ただし、「(NULL)」とは、本実施の形態においては何も記さないことを意味する記号であるため、共起置換部42は「-i:#DET_MY-NULL」を消去する。この結果、上記英語テンプレートは、図34に示すように、「{-i:be_AUX+pres}」と「{he}」との間の共起部が、単に「{}」といった記号で示されることになる。なお、図34は、処理文格納バッファ75に記憶された、共起部における置換処理の途中状態のテンプレートデータを示した図である。
【0161】
ステップS807においては、制御部12は、図35に示すとおり、上記共起情報(CX)を優先共起バッファ74に書き込む。なお、図35は、優先共起バッファに記憶された共起情報を示した図である。
【0162】
そして、S807の後は、制御部12は、処理をステップS808に進める。なお、ステップS808については説明を行ったので、ここでの説明は省略する。
【0163】
ステップS809においては、共起置換部42が、全ての共起情報について、抽出済みであることを示すフラグを消去する。そして、ステップS809の後は、共起置換部42が、共起部用バッファ73から共起情報を一つ抽出し、当該抽出した共起情報をテンポラリ第1共起バッファ81に書き込む(S810)。
【0164】
共起置換部42は、例えば、図19に示す共起部用バッファ73から、最初に「be_AUX」に関する共起情報を抽出する。また、制御部12は、抽出された共起情報については、抽出済みであることを示すフラグ(図示せず)を立てる。
【0165】
ステップS810の後は、テンポラリ第1共起バッファ81に書き込まれた上記共起情報において、制御部12は、優先処理フラグが立っているか否かを判断する(S811)。そして、ステップS811において優先処理フラグが立っていると判断された場合には、制御部12は、処理をステップS817に進める。一方、ステップS811において優先処理フラグが立っていないと判断されたされた場合には、制御部12は、処理をステップS812に進める。
【0166】
上記の例では、共起置換部42は、図19に示す共起部用バッファ73内のデータから、最初に「be_AUX」に関する共起情報を再度抽出し、当該共起情報を、図30に示すとおり、テンポラリ第1共起バッファ81に再度書き込む。例えば、「be_AUX」に関する共起情報については、同図に示すように優先処理フラグが立っていないので、この場合には、制御部12は、処理をステップS812に進める。
【0167】
なお、ステップS811において優先処理フラグの有無を判断する理由は、「{-i:#DET_MY-NULL}」といった共起部のように、もはや処理の必要でない共起部を、以降のステップS812からステップS816における処理の対象外とするためである。
【0168】
ここで、説明の便宜上、ステップS812からステップS816の説明の前に、ステップS817の説明を行なう。
【0169】
ステップS817においては、共起置換部42が、未だ抽出されていない共起情報が存在するか否かを判断する。ステップS817において共起情報が存在すると判断された場合には、制御部12は、処理をステップS810に進める。一方、ステップS817において共起情報が存在しないと判断された場合には、制御部12は、処理をステップS409に進める。
【0170】
上記の例では、「be_AUX」に関する共起情報は抽出されているが、「DET_MY-NULL」に関する共起情報は未だ抽出されていないため、共起置換部42は、ステップS817において共起情報が存在すると判断する。そして、ステップS810において、図31に示すとおり、共起置換部42が「DET_MY-NULL」に関する共起情報を抽出する。
【0171】
ここで、ステップS812からステップS815について説明する。なお、ステップS812からステップS815の説明においては、共起情報(CX)として「be_AUX」に関する共起情報が抽出されている例を挙げて説明する。
【0172】
ステップS812においては、共起置換部42が、スロット部用バッファ72から、共起情報(CX)に含まれる共起フラグを有するスロット情報を読み出し、当該読み出したスロット情報をテンポラリスロットバッファ80に書き込む。
【0173】
例えば、優先処理フラグのない図30に示す共起情報(CX)に含まれる共起フラグ「i」を有するスロット情報は、「&HUMAN-SUBJ」に関するスロット情報である。したがって、共起置換部42は、「&HUMAN-SUBJ」に関するスロット情報をスロット部用バッファ72から読み出し、図36に示すとおり、当該読み出したスロット情報(SX)をテンポラリスロットバッファ80に書き込む。なお、図36は、テンポラリスロットバッファ80に記憶されたスロット情報を示した図である。
【0174】
ステップS812の後は、共起置換部42は、優先共起バッファ74から、上記共起情報(CX)と同じ共起フラグを有する共起情報を読み出す(S813)。例えば、図35に示すとおり、「be_AUX」に関する共起情報(CX)と同じ共起フラグ「i」を有する共起情報として、「DET_MY-NULL」に関する共起情報が優先共起バッファ74に存在する。このため、共起置換部42は、当該「DET_MY-NULL」に関する共起情報を読み出し、図37に示すとおり、当該読み出した共起情報をテンポラリ第2共起バッファ82に書き込む。なお、図37は、テンポラリ第2共起バッファに記憶された共起情報を示した図である。また、以下では、上記のようにテンポラリ第2共起バッファ82に書き込まれた共起情報を共起情報(CHX)と表記する。
【0175】
ステップS813の後は、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報(CX)と、テンポラリ第2共起バッファ82に書き込んだ共起情報(CHX)とに基づき、共起関係対応データベースから共起関係対応データを読み出す(S814)。そして、ステップS814の後は、共起置換部42が、上記読み出した共起関係対応データと、テンポラリスロットバッファ80に書き込んだスロット情報(SX)とに基づいて、テンポラリ語句バッファ79に語句を書き込む(S815)。また、ステップS815の後は、制御部12は、処理をステップS816に進める。
【0176】
ステップS814およびステップS815について具体例を挙げて説明すると、以下の通りである。なお、以下の例では、共起情報(CX)に基づき、共起関係対応データベースから共起関係対応データを読み出す構成を説明する。
【0177】
まず、ステップS814において、共起置換部42は、図30に示す共起情報(CX)に基づき、図9Aに示す共起関係対応データを読み出す。具体的には、共起置換部42は、図30に示された共起情報のラベルと同じラベルを有する共起関係対応データを読み出す。そして、ステップS815において、共起置換部42は、図9Aに示す共起関係対応データと、図36に示すスロット情報(SX)とに基づいて、テンポラリ語句バッファ79に語句を書き込む。
【0178】
この例の場合、スロット情報の置換語句が「he」であるため、共起置換部42は、当該「he」が用いられた場合における共起部に用いる語句をテンポラリ語句バッファ79に書き込む。図9Aによると、共起置換部42は、置換語句が「I」の場合には「am」という語句をテンポラリ語句バッファ79に書き込む。また、置換語句が「you」または複数形の語句である場合には、共起置換部42は、「are」という語句をテンポラリ語句バッファ79に書き込む。さらに、これら以外の置換語句の場合には、共起置換部42は、「is」という語句をテンポラリ語句バッファ79に書き込む。したがって、共起置換部42は、テンポラリ語句バッファ79の英語の欄に、図38に示すとおり、「is」といった語句を書き込む。なお、図38は、テンポラリ語句バッファ79に記憶された語句を示した図である。
【0179】
ステップS816においては、共起置換部42は、処理文格納バッファ75に記憶されたテンプレートにおける上記共起情報に関する共起部を、テンポラリ語句バッファ79に記憶された語句で置換する。具体的には、共起置換部42は、図34に示した英語テンプレートの{-i:be_AUX+pres}を上記「is」に置換する。これにより、図39に示すとおりのテンプレートデータが処理文格納バッファ75に記憶されることになる。なお、図39は、処理文格納バッファ75に記憶された、共起部の置換処理が完了した状態におけるテンプレートデータを示した図である。
【0180】
そして、ステップS816の後は、S817に進む。
ここで、図15のステップS409における処理を説明する。
【0181】
ステップS409においては、出力文整形部26が、処理文格納バッファ75に記憶された、例えば図39に示すテンプレートデータにおける日本語テンプレートの語句W35(音節)という語句を、図40に示すとおり語句W36(音節(語句W35の濁音))に変更する。なお、図40は、処理文格納バッファ75に記憶された文例データを示した図である。
【0182】
翻訳装置1には、このように文を整形する規則が記憶されており、例えば全ての可変部が置換された後に当該規則にしたがって文を整形する。この規則の一例としては、語句W19(図77参照)で示した活用の動詞の活用形が語句W26で示した活用形(つまり、ren1)であり、当該動詞の直後が語句W35である場合には語句W36に変更し、当該動詞の直後が図77に示す語句W38(音節)である場合には図77に示す語句W39(音節(語句W38の濁音))に変更するといった規則が挙げられる。
【0183】
以上の結果、翻訳装置1では、各言語のテンプレートに基づき、日本語の文例が得られるとともに、当該日本語の文例を翻訳した英語の文例と、当該日本語の文例を翻訳した中国語の文例とが得られる。そして、これらの各文例は表示制御部25によって出力部で表示されるため、ユーザは、少なくとも自身が入力した文と同じ文例あるいは最も近い文例の翻訳結果を確認することができる。
【0184】
このように、翻訳装置1は、所定の語句で構成された固定部と予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とをそれぞれ対応する位置に含んだ、第1言語(例えば、日本語)によるテンプレートと当該テンプレートと対応関係にある第2言語(例えば、英語)によるテンプレートとを記憶した記憶装置13から、第1言語によるテンプレートと第2言語によるテンプレートとを読み出すデータ読出部21と、データ読出部21によって読み出された第1言語による複数のテンプレートについて、入力部10を介して第1言語で入力された文に含まれる語句が、上記所定の語句および上記予め定めた複数の語句の何れかと一致するかを判定する判定部22と、当該判定の結果に基づいて、上記複数のテンプレートの中から、少なくとも一つのテンプレートを選択する選択部23と、選択部23によって上記一致した語句に置換可能な可変部を含むテンプレートが選択された場合、データ読出部21によって読み出された、上記選択されたテンプレートと対応関係にある第2言語によるテンプレートについて、上記一致した語句に置換可能な可変部に対応した可変部を、上記一致した語句に対応する第2言語による語句に置換する置換部24とを備える構成であるといえる。
【0185】
それゆえ、このような構成では、第1言語による各テンプレートの可変部における語句を上記複数の語句から選ぶことができるため、当該可変部において語句の選択の幅を持たせることができる。例えば、可変部においてn個の語句が置換可能な場合、翻訳装置1は、一つのテンプレートにより、n通りの文例を作成することができる。また、例えば2つの可変部を有する場合、一方の可変部においてn個の語句が置換可能であって、他方の可変部においてm個の語句が置換可能である場合、翻訳装置1は、一つのテンプレートから、n×m個の文例を作成することができる。
【0186】
このように、可変部を有さない従来の装置と、本実施の形態に係る翻訳装置1とにおいて、仮に同じ数のテンプレートを備えた構成とした場合、作成可能な文例の数は明らかに本実施の形態に係る翻訳装置1の方が多くなる。このため、本実施の形態に係る翻訳装置1の方が、従来の装置に比べ、正確な文例を選ぶことが可能となる。
【0187】
また、特に、シソーラスデータを用いることにより、翻訳装置1は、一つの可変部に含まれる語句を容易に決めることができる。また、シソーラスデータを用いれば、一つの可変部における上記複数の語句を、概念的に似通った語句とすることができる。このため、意味の通じない文例が作成されるおそれがなくなる。
【0188】
また、翻訳装置1は、少なくとも、置換部24による置換を行った後の第2言語によるテンプレートに基づく画像を出力部11に表示させる表示制御部25を備える構成でもある。それゆえ、当該構成により、翻訳装置1のユーザは、第2言語による文例を確認することができる。
【0189】
さらに、翻訳装置1は、選択部23によって第1言語によるテンプレートが選択された場合、一致した語句に置換可能な可変部を前記一致した語句に置換するとともに、置換部24による置換を行った後の第1言語によるテンプレートに基づく画像を出力部11に表示させる構成でもある。それゆえ、当該構成により、ユーザは、第1言語による文例と第2言語による文例とを同時に確認することができる。
【0190】
特に、翻訳装置1では、図4に示したとおり、記憶装置13には、第1言語によるテンプレートの可変部における上記予め定めた複数の語句それぞれについて、第2言語に翻訳した語句が一つ対応付けて記憶されている。そして、置換部24が、第2言語によるテンプレートの可変部を、記憶装置13において上記対応付けて記憶された第2言語に翻訳した語句に置換する。それゆえ、翻訳装置1においては、第1言語のテンプレートの可変部において置換された語句に対応する、第2言語による語句が一意に定まる。したがって、翻訳装置1は、第2言語によるテンプレートに基づいた、正確な第2言語の文例を得ることができる。
【0191】
また、翻訳装置1では、上述したように、第1言語によるテンプレートの可変部と、当該可変部に対応した第2言語によるテンプレートの可変部とには、語句の活用形に関する情報が対応付けられている。そして、置換部24が、この活用形に関する情報に基づいて、上記置換した語句について語形を変化させる。それゆえ、翻訳装置1は、第1言語による文例と第2言語による文例とのそれぞれについて、語形を変化させない場合に比べ、より正確な文例とすることができる。
【0192】
また、翻訳装置1では、上述したように、第2言語によるテンプレートには可変部として、スロット部と共起部とが含まれており、置換部24は、スロット部を第2言語による語句に置換するとともに、当該置換後の語句に応じて共起部の語句を決定する。それゆえ、スロット部において置換された語句に対応した語句を用いて、共起部を置換可能となる。したがって、翻訳装置1は、置換後の語句に応じて共起部の語句を決定しない構成に比べ、より正確な文例を作成することができる。
【0193】
ところで、図29BのステップS814およびステップS815についての具体例を挙げた説明においては、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報(CX)に基づき、共起関係対応データベースから共起関係対応データを読み出す構成を説明した。ここでは、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報(CX)と、テンポラリ第2共起バッファ82に書き込んだ共起情報(CHX)とに基づき、共起関係対応データベースから共起関係対応データを読み出す構成を図41から図45に基づいて説明する。
【0194】
図41は、テンプレートデータベース60に記憶されているテンプレートデータの構成を示したものである。説明の便宜上、日本語テンプレートと英語テンプレートとを示している。同図に示すとおり、日本語テンプレートには、「{1:NOUN}」といったスロット部が含まれている。また、英語テンプレートには、「{1-i:NOUN}」といったスロット部と、「{-i:DET_A}」および「{-i#CLASSIFIER}」といった共起部とが含まれている。
【0195】
ここで、「{-i#CLASSIFIER}」に関する共起情報が共起情報(CHX)に該当する。つまり、以下では、「{1:NOUN}」に関するスロット情報と「{-i#CLASSIFIER}」に関する共起情報とに基づき、「{-i:DET_A}」に置換される語句が決定される。
【0196】
図42は、図41に示したテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。なお、図41においては、入力例Aと入力例Bと入力例Cと入力例Dとは、それぞれ、「{1:NOUN}」といったスロット部において置換された語句の例を挙げたものである。例えば入力例Aは、「{1:NOUN}」といったスロット部が「コーヒー」で置換された場合を示している。
【0197】
図43は、辞書データベース61に記憶されておる辞書データを示した図である。同図に示すとおり、辞書データには、日本語の語句と当該語句に対応する英語の語句とが対応付けて記憶されている。また、辞書データにおいては、当該英語の各語句に対して、助数詞に関する情報が対応付けて記憶されている。
【0198】
図44は、このようなテンプレートデータと辞書データとを用いて、英語の文例を作成する際のフローを示したフローチャートである。
【0199】
まず、日本語テンプレートのスロット部「{1:NOUN}」において置換された語句に応じて、スロット置換部41が、辞書データを参照することにより、英語テンプレートのスロット部「{1-i:NOUN}」を、例えば「coffee」といった語句に置換する(S901)。ステップS901の後は、共起置換部42が、英語テンプレートの共起部「{-i#CLASSIFIER}」に関し、置換する語句を決定する(S902)。
【0200】
例えば入力例Aの場合には、ステップS902においては、共起置換部42は、辞書データを参照することにより、共起部「{-i#CLASSIFIER}」を「cup of」といった語句で置換することを決定する。また、入力例Bの場合には、同様に、共起置換部42は、共起部「{-i#CLASSIFIER}」を「order of」といった語句で置換することを決定する。一方、入力例Cの場合には、辞書データを参照すると、「ペン」といった語句に対応する助数詞の情報が「(NULL)」であるため、共起置換部42は、共起部「{-i#CLASSIFIER}」を「(NULL)」で置換することを決定する。入力例Dの場合についても、「入力例C」の場合と同様である。
【0201】
ステップS902の後は、共起置換部42が、辞書データに基づいて、共起部「{-i#CLASSIFIER}」に関し、決定された語句の訳があるか否かを判断する(S903)。
【0202】
ステップS903において訳があると判断された場合、共起置換部42が、当該決定された語句の読みに基づき、共起部「{-i:DET_A}」を「a」で置換するか、それとも「an」で置換するかを決定する(S904)。例えば、入力例Aの場合には、共起置換部42は、共起部「{-i:DET_A}」を「a」で置換することを決定する。また、入力例Bの場合には、共起置換部42は、共起部「{-i:DET_A}」を「an」で置換することを決定する。
【0203】
一方、ステップS903において訳がないと判断された場合、共起置換部42が、「{1-i:NOUN}」といったスロット部において置換されることが決定した語句の読みに基づき、共起部{-i:DET_A}」を「a」で置換するか、それとも「an」で置換するかを決定する(S905)。例えば、入力例Cの場合には、共起置換部42は、共起部「{-i:DET_A}」を「a」で置換することを決定する。また、入力例Dの場合には、共起置換部42は、共起部「{-i:DET_A}」を「an」で置換することを決定する。
【0204】
ステップS904とステップS905の後は、制御部12は、処理をステップS906に進める。ステップS906においては、共起置換部42は、共起部「{-i#CLASSIFIER}」において置換する語句として決定された語句と、共起部「{-i:DET_A}」において置換する語句として決定された語句を用いて、それぞれの共起部を置換する。ただし、「(NULL)」とは、上述したとおり、何も記さないことを意味する記号であるため、共起置換部42は「-i#CLASSIFIER」を消去する。
【0205】
その結果、翻訳装置1は、図45に示すとおり、入力例A〜入力例Dのそれぞれについて、スロット部と2つの共起部とが語句で置換された英語文例を生成する。
【0206】
ところで、上記の説明においては、スロット部において置換する語句は、スロット部同士の間で独立して決定可能な構成を例に挙げて説明した。つまり、例えば図3において、「{1:&HUMAN-SUBJ}」と「{2:&VB_EAT+v.ren1}」との何れを先に決定しても問題ない構成について説明した。以下では、スロット部間において共起関係を形成する2つの例について、図46から図55に基づいて説明する。
【0207】
まず、一つ目の例を、図46から図50に基づいて説明する。
図46は、テンプレートデータベース60に記憶されているテンプレートデータの構成を示したものである。説明の便宜上、日本語テンプレートと英語テンプレートとを示している。同図に示すとおり、日本語テンプレートには、「{1:THIS-THAT}」と「{2:GOODS}」といった2つのスロット部が含まれている。また、英語テンプレートには、「{1-i:THIS-THAT}」と「{2-i:GOODS}」といった2つのスロット部が含まれている。この英語テンプレートの両方のスロット部においては、「-i」といった符号が付されている。つまり、両スロット部は互いに共起関係を有している。
【0208】
図47は、図46に示したテンプレートデータにおける日本語テンプレートのスロット部において置換された語句の例を示した図である。なお、図47においては、入力例Aと入力例Bと入力例Cと入力例Dとは、それぞれ、「{1:THIS-THAT}」と「{2:GOODS}」といったスロット部において置換された語句の例を挙げたものである。例えば入力例Aは、「{1-i:THIS-THAT}」といったスロット部が語句W40(指示代名詞)で置換され、「{2-i:GOODS}」といったスロット部が語句W41(名詞)で置換された場合を示している。
【0209】
図48は、辞書データベース61に記憶されておる辞書データを示した図である。同図に示すとおり、辞書データには、日本語の語句と当該語句に対応する英語の語句とが対応付けて記憶されている。また、辞書データにおいては、当該英語の各語句に対して、当該各語句の複数形に関する情報が対応付けて記憶されている。
【0210】
図49は、このようなテンプレートデータと辞書データとを用いて、英語の文例を作成する際のフローを示したフローチャートである。なお、以下では、日本語テンプレートのスロット部における置換処理は終了しているものとし、英語テンプレートのスロット部における置換処理を説明する。
【0211】
まず、スロット置換部41が、英語テンプレートのスロット部「{1-i:THIS-THAT}」において置換される語句が、複数形であるか否かを判断する(S1001)。ここで、語句が複数形であるか否かの判断は、スロット置換部41が辞書データベース61を参照することにより行なう。なお、辞書データベース61には、語句が単数あるいは複数形であることを示す情報が記憶されている。
【0212】
例えば入力例Aと入力例Bと入力例Cとの場合には、ステップS1001において、スロット置換部41は、複数形でないと判断する。一方、入力例Dと入力例Eと入力例Fとの場合には、ステップS1001において、スロット置換部41は、複数形であると判断する。
【0213】
ステップ1001において複数形であると判断された場合には、スロット置換部41が、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形を有するか否かを判断する(S1002)。一方、ステップS1001において複数形ではないと判断された場合には、制御部12は、処理をステップS1004に進める。
【0214】
ステップS1002において複数形を有すると判断された場合には、スロット置換部41が、図48に示した辞書データを参照することにより、上記英語テンプレートのスロット部「{2-i:GOODS}」に用いられる英語の語句を複数形に変換する(S1003)。一方、ステップS1002において複数形を有しないと判断された場合には、制御部12は、処理をステップS1004に進める。
【0215】
例えば入力例Dの場合には、ステップS1003において、スロット置換部41は、「book」という語句を「books」といった複数形の語句に変換する。また、同様に、入力例Eの場合には、スロット置換部41は、「trousers」という語句を「trousers」といった複数形(この場合、単数形と複数形とで同一)の語句に変換する。一方、例えば、入力例Fの場合には、図48にも示すとおり「luggage」という語句に複数形は存在しないので、この場合には、制御部12は、処理をステップS1004に進める。
【0216】
ステップS1004においては、スロット置換部41が、再度、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形を有するか否かを判断する。ステップS1004において複数形を有すると判断された場合には、スロット置換部41が、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形であるか否かを判断する(S1005)。一方、ステップS1004において複数形を有しないと判断された場合には、スロット置換部41が、辞書データを参照することにおより、英語テンプレートのスロット部「{1-i:THIS-THAT}」に用いられる語句を単数形に変換する(S1006)。そして、ステップS1006の後は、ステップS1008に進む。
【0217】
例えば、入力例Aと入力例Bと入力例Dと入力例Eとの場合には、ステップS1004において、スロット置換部41は、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形を有すると判断する。一方、入力例Cと入力例Fとの場合には、ステップS1006において、スロット置換部41は、スロット部「{2-i:GOODS}」を単数形に変換する。具体的には、入力例Cの場合には、実質的な変更はないが、スロット置換部41は「this」を「this」に変換する。また、入力例Fの場合には、スロット置換部41は、「these」を「this」に変換する。
【0218】
そして、ステップS1005においては、スロット置換部41は、入力例Aと入力例Bと入力例Dと入力例Eとのうち、入力例Bと入力例Dと入力例Eとについては、スロット部「{2-i:GOODS}」において置換される語句が複数形であると判断する。一方、同ステップにおいては、スロット置換部41は、入力例Aについては、スロット部「{2-i:GOODS}」において置換される語句が複数形でないと判断する。
【0219】
ステップS1005において複数形であると判断された場合には、スロット置換部41が、英語テンプレートのスロット部「{1-i:THIS-THAT}」に用いられる語句を複数形に変換する(S1007)。そして、ステップS1007の後は、制御部12は、処理をステップS1008に進める。一方、ステップS1005において複数形でないと判断された場合には、語句を複数形に変換することなく、制御部12は、処理をステップS1008に進める。
【0220】
例えば、入力例Bと入力例Dと入力例Eとの場合には、ステップS1007において、スロット置換部41は、英語テンプレートのスロット部「{1-i:THIS-THAT}」において置換される語句を複数形に変換する。具体的には、入力例Bの場合には、スロット置換部41は、「this」を「these」に変換する。また、入力例Dと入力例Eとの場合には、実質的な変更はないが、スロット置換部41は、「these」を「these」に変換する。
【0221】
ステップS1008においては、スロット置換部41が、上述した変換処理後の語句を用いて、スロット部「{1-i:THIS-THAT}」とスロット部「{2-i:GOODS}」とを置換する。
【0222】
以上の結果、図50に示すとおり、入力例A〜入力例Fのそれぞれについて、2つのスロットが語句で置換された英語文例が生成される。
【0223】
次に、二つ目の例を、図51から図55に基づいて説明する。
図51は、テンプレートデータベース60に記憶されているテンプレートデータの構成を示したものである。説明の便宜上、日本語テンプレートと英語テンプレートとを示している。同図に示すとおり、日本語テンプレートには、「{1-i:NOUN}」と「{2:NUM}」と「{3-i:CLASSIFIER}」といった3つのスロット部が含まれている。また、英語テンプレートには、「{2-j:NUM}」と「{3-j:CLASSIFIER}」と「{1-j:NOUN}」といった3つのスロット部が含まれている。この英語テンプレートの3つスロット部においては、共起関係を示す「-j」といった符号が付されている。つまり、3つのスロット部は互いに共起関係を有している。
【0224】
図52は、図51に示したテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。なお、図52においては、入力例Aと入力例Bとは、それぞれ、「{1-i:NOUN}」と「{2:NUM}」と「{3-i:CLASSIFIER}」といったスロット部において置換される語句の例を挙げたものである。例えば入力例Aは、「{1-i:NOUN}」といったスロット部が語句W42(名詞)で置換され、「{2:NUM}」といったスロット部が「2」で置換され、「{3-i:CLASSIFIER}」といったスロット部が語句W43(名詞)で置換された場合を示している。
【0225】
図53は、辞書データベース61に記憶されておる辞書データを示した図である。同図に示すとおり、辞書データには、日本語の語句と当該語句に対応する英語の語句とが対応付けて記憶されている。
【0226】
図54は、このようなテンプレートデータと辞書データとを用いて、英語の文例を作成する際のフローを示したフローチャートである。
【0227】
まず、スロット置換部41が、辞書データを参照し、日本語テンプレートのスロット部「{1-i:NOUN}」において置換された語句に応じて、日本語テンプレートのスロット部「{3-i:CLASSIFIER}」において置換可能な語句の候補を選定する(S1101)。例えば、図52に示す入力例Aの場合には、スロット置換部41は、上記候補として、語句W43と語句W41(図53参照)とを選定する。また、同図に示す入力例Bの場合には、スロット置換部41は、上記候補として、語句W44(名詞)を選定する。
【0228】
ステップS1101の後は、スロット置換部41は、スロット部{3-i:CLASSIFIER}」において一旦置換された語句に基づき、上記候補のうちから一つの語句を決定する(S1102)。スロット置換部41は、例えば、入力例Aの場合には、日本語テンプレートのスロット部「{3-i:CLASSIFIER}」において置換可能な語句を語句W43に決定し、入力例Bの場合には、当該スロット部「{3-i:CLASSIFIER}」において置換可能な語句を語句W44に決定する。
【0229】
そして、ステップS1102の後は、制御部12は、処理を英語テンプレートの処理に移行する。
【0230】
ステップS1102の後は、スロット置換部41により、日本語テンプレートのスロット部「{2:NUM}」が「2」以上であるか否かが判断される(S1103)。ステップS1103において「2」以上であると判断された場合には、スロット置換部41が、日本語テンプレートのスロット部{3-i:CLASSIFIER}」における語句の訳が存在するか否かを判断する(S1104)。一方、ステップS1103において「2」以上でないと判断された場合には、ステップS1107に進む。
【0231】
ステップS1104において訳が存在すると判断された場合には、スロット置換部41は、英語テンプレートのスロット部「{3-j:CLASSIFIER}」の語句を複数形に変換する(S1105)。そして、ステップS1105の後は、制御部12は、処理をステップS1107に進める。一方、ステップS1104において訳が存在しないと判断された場合には、スロット置換部41は、英語テンプレートのスロット部「{2-j:NOUN}」の語句を複数形に変換する(S1106)。そして、ステップS1106の後は、制御部12は、処理をステップS1107に進める。
【0232】
例えば入力例Aの場合には、ステップS1105において、スロット置換部41は、「glass of」を「glasses of」に変換する。また、入力例Bの場合には、ステップS1106において、スロット置換部41は、「magazine」を「magazines」に変換する。
【0233】
そして、ステップS1107においては、翻訳装置1は、変換後の語句を用いて置換処理を行なう。
【0234】
以上の結果、図55に示すとおり、翻訳装置1は、入力例Aおよび入力例Bのそれぞれについて、各スロットが語句で置換された英語文例を生成する。
【0235】
なお、上記の実施の形態においては、図13のフローにも示すとおり、テンプレートデータベース内の全てのテンプレートデータを検索対象とし、抽出した語句が固定部または可変部に含まれるようなテンプレートを検索する構成を例に挙げて説明した。しかしながら、これに限定されるものではなく、テンプレートデータの一部のテンプレートを検索の対象としてもよい。
【0236】
また、上記においては、図3に示すとおり、複数の言語のテンプレートが1つのテンプレートデータに含まれる構成を例に挙げて説明したが、これに限定されるものではない。例えば、一つのテンプレートデータには一つの言語のテンプレートデータが含まれている構成としてもよい。この場合、上記一つの言語のテンプレートデータと対応関係にある他の言語のテンプレートデータが、当該一つの言語のテンプレートデータと関連付けられて記憶装置13に記憶されていればよい。
【0237】
また、上記においては、図7に示すとおり、シソーラスデータを用いた例を挙げて説明したが、これに限定されるものではない。
【0238】
あくまでも、可変部において置換可能な上記予め定められた複数の語句は、所定の識別標識により特定される語句であればよい。つまり、シソーラスデータにおける区分としてのラベルで特定される語句に限定されず、予め区分が設けられたデータにおける或る区分を表す識別標識で特定される語句であればよい。
【0239】
例えば、記憶装置13に記憶された第1言語の辞書データでは、当該辞書データに含まれる語句のうち全部または一部の語句が、それぞれ、少なくとも一つのグループに属するように分類しておき、上記所定の識別標識を、前記複数のグループのうちの所定のグループを示す標識としてもよい。つまり、ある語句「A」を、少なくとも一つのグループ(例えば、グループAおよびグループB)に含まれるようにしておき、例えば上記所定の識別標識としてグループBを示す標識を用いた場合には、グループBに含まれる語句全てが、一つの可変部において置換対象となるようにすればよい。
【0240】
また、翻訳装置1は、出力部11において画像を出力する構成であったが、これに限定されるものではない。例えば、翻訳装置1を、画像を出力すると共に、得られた各言語の文例を音声出力する構成としてもよい。また、翻訳装置1を、当該文例を画像出力することなく、単に、音声出力するだけの構成としてもよい。
【0241】
以上述べてきたように、本実施の形態に係る翻訳装置1を用いることにより、入力文とテンプレートとのマッチングの際に、同一意味概念の言葉(語句)は同定される。その結果、翻訳装置1は、適切な文例(ベースとなる文例)の選択が可能となる。また、テンプレートにおける一文中の可変部の数が増えても、不当に類似度(マッチ度合い)が低下することはない。さらに、テンプレートにおいて、予め可変部となる箇所がスロット化されて特定されているため、翻訳装置1は、非マッチ部分の特定を誤ることがない。また、可変部で置換可能な語句が予め対訳辞書に指定されているため、翻訳装置1は、確実な訳語置換を行なうことができる。さらに、共起関係を記したテンプレート、共起関係対応データ、活用形に関する情報等のデータを用いるため、翻訳装置1は、従来の用例主導型方式をはじめとする各種方式の翻訳装置では実現できなかった「100%正しい」といえる翻訳結果を得ることがきる。
【0242】
<翻訳装置1の変形例>
ところで、上記においては、翻訳装置1は、翻訳処理を実行しない場合であっても、図3に示した形式の日本語テンプレートや英語テンプレートを、記憶装置13のテンプレートデータベース60に記憶している。以下では、翻訳装置が、翻訳処理を実行する際に、記憶装置13のテンプレートデータベースに予め記憶されたテンプレートに基づいて、日本語テンプレートおよび英語テンプレートを生成する構成について説明する。なお、以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
【0243】
図56は、翻訳装置1Aの概略構成を示した図である。図56を参照して、翻訳装置1Aは、入力部10と、出力部11と、制御部12Aと、記憶装置13Aと、メモリ14Aとを備えている。つまり、翻訳装置1Aが制御部12Aおよび記憶装置13Aを有する点において、制御部12および記憶装置13を有する翻訳装置1とは異なる。
【0244】
記憶装置13Aは、テンプレートデータベース60Aと、辞書データベース61と、日本語活用形テーブル62と、カテゴリデータベース63と、シソーラスデータ64と、共起関係データベース65とを記憶している。
【0245】
テンプレートデータベース60Aは、日本語テンプレートデータの代わりに、当該日本語テンプレートを生成するためのテンプレート(以下、「第1テンプレート」と称する)を記憶している。また、記憶装置13Aは、英語テンプレートの代わりに、当該英語テンプレートを生成するためのテンプレート(以下、「第2テンプレート」と称する)を記憶している。また、記憶装置13Aは、中国語テンプレートの代わりに、当該中国語テンプレートを生成するためのテンプレート(以下、「第3テンプレート」と称する)を記憶している。第1テンプレート、第2テンプレート、および第3テンプレートの概要については、後述する(図57参照)。
【0246】
メモリ14Aは、抽出語句バッファ70と、検索結果テンプレートバッファ71と、スロット部用バッファ72と、共起部用バッファ73と、優先共起バッファ74と、処理文格納バッファ75と、翻訳結果バッファ76と、テンポラリテンプレートバッファ77と、テンポラリ辞書バッファ78と、テンポラリ語句バッファ79と、テンポラリスロットバッファ80と、テンポラリ第1共起バッファ81と、テンポラリ第2共起バッファ82と、入力文バッファ83と、展開データ格納バッファ(図示せず)と、処理待ちバッファ(図示せず)と、要素バッファ(図示せず)とを備えている。
【0247】
制御部12Aは、抽出部20と、データ読出部21Aと、判定部22と、選択部23と、置換部24と、表示制御部25と、出力文整形部26と、テンプレート生成部27とを備えている。
【0248】
データ読出部21Aは、記憶装置13Aから上記第1テンプレートと上記第2テンプレートとを読み出す。
【0249】
テンプレート生成部27は、読み出された第1テンプレートと第2テンプレートと第3テンプレートとに基づき、日本語テンプレートと当該日本語テンプレートと対応関係にある英語テンプレートおよび中国語テンプレートとをそれぞれ複数生成する。テンプレート生成部27は、当該生成した日本語テンプレートと英語テンプレートと中国語テンプレートとを記憶装置13Aに記憶させる。
【0250】
以上の処理により、翻訳装置1Aは、記憶装置13Aに、日本語テンプレートと英語テンプレートと中国語テンプレートとを記憶させることができる。以下、第1テンプレート、第2テンプレート、および第3テンプレートの構成を説明しつつ、テンプレート生成部27の詳細な処理を説明する。
【0251】
図57は、テンプレートデータベース60Aに含まれる一つのテンプレートデータの構成を示した図である。図57を参照して、テンプレートデータは、テンプレートIDと、第1テンプレートと、第2テンプレートと、第3テンプレートとを含んでいる。
【0252】
第1テンプレートは、所定の語句で構成された第1部と、予め定められた複数の語句のうちの何れかの語句に置換可能な可変部と、予め定められた複数の要素のうちの何れかの要素を選択可能な第2部とを含んでいる。
【0253】
図57においては、語句W36、語句W45(否定を示す文字)、および語句W46(句点)が第1部に該当する。また、{1:&LANGUAGE}が可変部に該当する。さらに、文字列W47と、{2:(&VB_EXPLAIN+v.kanou)|(&VB_PRONOUNCE+v.kanou)|(&VB_INTERPRET+v.kanou)}とが、第2部に該当する。
【0254】
第2テンプレートは、第1テンプレートと同様に、第1部と可変部と第2部とを含んでいる。図57においては、「I」と「can't」とが第1部に該当する。また、{1:&LANGUAGE}が可変部に該当する。さらに、{2:(&VB_EXPLAIN+inf) it in|(&VB_PRONOUNCE+inf) it in|(&VB_INTERPRET+inf) it in}が第2部に該当する。
【0255】
第3テンプレートについても、図57に示すとおり、第1テンプレートと第2テンプレートと同様に、第1部と可変部と第2部とを含んでいる。
【0256】
以上のように、第1テンプレートと第2テンプレート(あるいは第3テンプレート)とは、所定の語句で構成された第1部と予め定められた複数の要素のうちの何れかの要素を選択可能な第2部とを含んでいる。
【0257】
翻訳装置1Aにおける処理の概略は、図12に示したフローチャートと同じである。ただし、翻訳装置1Aにおけるテンプレート検索(ステップS2)の処理は、図13に示したフローチャートとは異なる。
【0258】
図58は、テンプレート検索における前半の処理の流れを示したフローチャートである。図59は、当該テンプレート検索における後半の処理の流れを示したフローチャートである。図58を参照して、ステップS202とステップS203との間に、新たに2つのステップS2001,S2002を含む点で、図58の処理は図13の処理(ステップS201〜ステップS204)とは異なる。図59を参照して、ステップS207とステップS208との間に、新たにステップS2003を含む点で、図59の処理は図13の処理(ステップS205〜ステップS208)とは異なる。
【0259】
再び図58を参照して、ステップS2001において、テンプレート生成部27は、記憶装置13Aから読み出されたテンプレートデータ(図57参照)を展開し、当該展開して得られたテンプレートデータを上記展開データ格納バッファに書き込む。テンプレート生成部27は、テンプレートデータの展開により、少なくとも1つ以上のテンプレートデータを展開データ格納バッファに書き込む。ステップS2002において、テンプレート生成部27は、展開データ格納バッファからテンプレートデータを1つ読み出す。
【0260】
再び図59を参照して、ステップS2003において、テンプレート生成部27は、未だ読み出していないテンプレートデータが展開データ格納バッファに存在するか否かを判断する。テンプレートデータが存在すると判断された場合(ステップS2003においてYES)、翻訳装置1Aは、処理をステップS2002に戻す。一方、テンプレートデータが存在しないと判断された場合(ステップS2003においてNO)、翻訳装置1Aは、処理をステップS208に進める。ステップS208においては、制御部12が、テンプレートデータベース60A内に、未だ読み出していないテンプレートデータがテンプレートデータベースに存在するか否かを判断する。
【0261】
図60は、図58におけるステップS2001の詳細の一部を示したフローチャートである。図61は、図58におけるステップS2001の詳細の残りの部分を示したフローチャートである。
【0262】
図60を参照して、ステップS2101において、翻訳装置1Aは、ステップS202にて読み出した一つのテンプレートデータを、処理待ちバッファに格納する。例えば、翻訳装置1は、図57に示したテンプレートデータを処理待ちバッファに格納する。以下では、図57に示したテンプレートデータ(以下、「テンプレートデータ(ID1971−1)」と称する)が処理待ちバッファに格納された場合を例に挙げて説明する。
【0263】
ステップS2103において、翻訳装置1Aは、処理待ちバッファから、テンプレートデータを1件読み出す。処理待ちバッファにテンプレートデータ(ID1971−1)のみが格納されているため、翻訳装置1Aは、このテンプレートデータ(ID1971−1)を読み出す。
【0264】
ステップS2105において、翻訳装置1Aは、読み出したテンプレートデータ内に「|」といった区分けを示す記号が存在するか否かを判断する。記号「|」が存在すると判断された場合(ステップS2105においてYES)、翻訳装置1Aは、処理をステップS2111(図61参照)に進める。
【0265】
記号「|」が存在しないと判断された場合(ステップS2105においてNO)、ステップS2107において、翻訳装置1Aは、テンプレートデータを展開データ格納バッファに書き込む。そして、ステップS2109において、翻訳装置1Aは、処理待ちバッファ内に読み出していないテンプレートデータが存在するか否かを判断する。テンプレートデータが存在すると判断された場合(ステップS2109においてYES)、翻訳装置1Aは、処理をステップS2103に戻す。一方、テンプレートデータが存在しないと判断された場合(ステップS2109においてNO)、翻訳装置1Aは、処理をステップS2002(図58参照)に進める。
【0266】
テンプレートデータ(ID1971−1)は記号「|」を含んでいるため、翻訳装置1Aは、ステップS2105の後、ステップS2111を実行する。図61を参照して、ステップS2111において、翻訳装置1Aは、記号「|」を含む第2部を1つ読み出す。たとえば、翻訳装置1Aは、テンプレートデータ(ID1971−1)の第1テンプレートから、文字列W47(図57参照)を読み出す。
【0267】
ステップS2113において、翻訳装置1Aは、読み出した第2部の「{}」内において「|」で仕切られて存在している各要素を、要素バッファに書き込む。具体的には、翻訳装置1Aは、図62に示すとおり、語句W48(副詞)と語句W49(副詞)と「 」(つまり空白)とを要素バッファの日本語の欄に書き込む。なお、図62は、1度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。なお、第2テンプレートおよび第3テンプレートには、文字列W47に対応する第2部が存在しないため、翻訳装置1Aは、要素バッファの英語および中国語の欄について、「Null」の状態を維持する。
【0268】
ステップS2115において、翻訳装置1Aは、要素内にラベルが存在するか否かを判断する。ラベルが存在すると判断された場合(ステップS2115においてYES)、ステップS2117において、翻訳装置1Aは、読み出した要素内に、「()」が存在するか否かを判断する。「()」が存在すると判断された場合(ステップS2117においてYES)、ステップS2119において、翻訳装置1Aは、まず、要素バッファにおいて、「(」を「{」に変更するとともに、「)」を「}」に変更する。さらに、ステップS2119において、翻訳装置1Aは、「{」の後にスロット番号を追記する。一方、「()」が存在しないと判断された場合(ステップS2117においてNO)、翻訳装置1Aは、要素バッファにおいて、要素全体を「()」で括るとともに、「{」の後にスロット番号を追記する。
【0269】
一方、ラベルが存在しないと判断された場合(ステップS2115においてNO)、翻訳装置1Aは、処理をステップS2123に進める。ステップS2123において、翻訳装置1Aは、テンプレートデータを要素バッファ内の各要素を用いて書き換え、当該書き換えたテンプレートデータを処理待ちバッファに格納する。
【0270】
上記のように、要素バッファに、語句W48と語句W49と「 」(つまり空白)とが書き込まれている場合(図62参照)、ステップS2115において、翻訳装置1Aは、ラベルが存在しないと判断する。このため、ステップS2123の処理の結果、翻訳装置1Aは、図63に示すテンプレートデータ、図64に示すテンプレートデータ、および図65に示すテンプレートデータを、処理待ちバッファに格納する。
【0271】
なお、図63は、処理待ちバッファに格納した後の1つのテンプレートデータ(以下、「テンプレートデータ(1971−1_1)」と称する)を示した図である。なお、テンプレートデータ(1971−1_1)は、翻訳装置1が、テンプレートデータ(ID1971−1)の文字列W47を、語句W48(要素)を用いて書き換えることにより得られらデータである。
【0272】
また、図64は、処理待ちバッファに格納した後の他のテンプレートデータ(以下、「テンプレートデータ(1971−1_2)」と称する)を示した図である。なお、テンプレートデータ(1971−1_2)は、翻訳装置1が、テンプレートデータ(ID1971−1)の文字列W47を、語句W49(要素)を用いて書き換えることにより得られるデータである。
【0273】
さらに、図65は、処理待ちバッファに格納した後のさらに他のテンプレートデータ(以下、「テンプレートデータ(1971−1_3)」と称する)を示した図である。なお、テンプレートデータ(1971−1_3)は、翻訳装置1が、テンプレートデータ(ID1971−1)の文字列W47を、「 」(つまり空白)といった要素を用いて書き換えることにより得られらデータである。
【0274】
翻訳装置1Aが、テンプレートデータ(1971−1_1)、テンプレートデータ(1971−1_2)、およびテンプレートデータ(1971−1_3)を処理待ちバッファに格納した場合、ステップS2103において、翻訳装置1は、当該格納した3つのテンプレートデータから、1つのテンプレートデータを読み出す。ここで、翻訳装置1Aが、テンプレートデータ(ID1971−1_1)を読み出したとする。この場合、翻訳装置1Aは、ステップS2105においては肯定的な判断をし、翻訳装置1Aは、処理をステップS2111に進める。
【0275】
図66は、2度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。図66を参照して、翻訳装置1Aは、「(&VB_EXPLAIN+v.kanou)」と「(&VB_PRONOUNCE+v.kanou)」と「(&VB_INTERPRET+v.kanou)」とを、要素バッファの日本語の欄に書き込む。また、翻訳装置1Aは、「(&VB_EXPLAIN+inf) it in」と「(&VB_PRONOUNCE+inf) it in」と「(&VB_INTERPRET+inf) it in」とを、要素バッファの英語の欄に書き込む。なお、翻訳装置1Aは、要素バッファの中国語の欄についても、日本語の欄および英語の欄と同様の処理を行なう。
【0276】
要素バッファの状態が、ステップS2113の処理により図66に示す状態となった場合、要素内にラベルが存在するため、翻訳装置1Aは、ステップS2115において肯定的な判断を行い、処理をステップS2117に進める。さらに、読み出した要素内に「()」が存在するため、翻訳装置1Aは、ステップS2117において肯定的な判断を行い、処理をステップS2119に進める。
【0277】
1度目のステップS2117の処理を行なった後、翻訳装置1Aは、要素バッファの各言語の欄において、まず、「(」を「{」に変更するとともに、「)」を「}」に変更する。さらに、翻訳装置1Aは、「{」の後にスロット番号「2」を追記する。なお、図67は、当該1度目のステップS2117の処理を行なった後の、要素バッファの状態を示した図である。
【0278】
当該ステップS2117の後、翻訳装置1AがステップS2123の処理を行なうことにより、処理待ちバッファには、テンプレートデータ(ID1971−1_2)と、テンプレートデータ(ID1971−1_3)と、図68に示すテンプレートデータと、図69に示すテンプレートデータと、図70に示すテンプレートデータとが格納される。
【0279】
なお、図68は、テンプレートデータ(ID1971−1_1)を、図67に示す要素1を用いて書き換えたテンプレートデータ(以下、「テンプレートデータ(ID1971−1_11)」と称する)を示した図である。また、図69は、テンプレートデータ(ID1971−1_1)を、図67に示す要素2を用いて書き換えたテンプレートデータ(以下、「テンプレートデータ(ID1971−1_12)」と称する)を示した図である。図70は、テンプレートデータ(ID1971−1_1)を、図67に示す要素3を用いて書き換えたテンプレートデータ(以下、「テンプレートデータ(ID1971−1_13)」と称する)を示した図である。
【0280】
ステップS2123の後は、ステップS2103において、翻訳装置1Aは、処置待ちバッファから、上記5つのテンプレートデータのうち、1つのテンプレートデータを読み出す。
【0281】
図60および図61に示す一連の処理が完了した時点において、展開データ格納バッファには、図68から図76に示す9つのテンプレートデータが書き込まれている。
【0282】
なお、図71は、テンプレートデータ(ID1971−1_2)を、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。図72は、テンプレートデータ(ID1971−1_2)を、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。図73は、テンプレートデータ(ID1971−1_2)を、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。
【0283】
また、図74は、テンプレートデータ(ID1971−1_3)を、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。図75は、テンプレートデータ(ID1971−1_3)を、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。図76は、テンプレートデータ(ID1971−1_3)を、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。
【0284】
このように、翻訳装置1Aは、図57に示した1つのテンプレートデータに基づいて、図63から図65、および図71から図76に示した9つのテンプレートを生成することができる。
【0285】
なお、上記においては、図57に示すとおり、複数の言語のテンプレートが1つのテンプレートデータに含まれる構成を例に挙げて説明したが、これに限定されるものではない。例えば、一つのテンプレートデータには一つの言語のテンプレートデータが含まれている構成としてもよい。この場合、上記一つの言語のテンプレートデータと対応関係にある他の言語のテンプレートデータが、当該一つの言語のテンプレートデータと関連付けられて記憶装置13Aに記憶されていればよい。
【0286】
以上説明したように、翻訳装置1Aの記憶装置13Aには、少なくとも、日本語テンプレートを生成するための第1テンプレートと、当該日本語テンプレートと対応関係にある英語テンプレートとを生成するための第2テンプレートとが記憶されている。データ読出部21Aは、記憶装置13Aから第1テンプレートと第2テンプレートとを読出す。テンプレート生成部27は、読出された第1テンプレートと第2テンプレートとに基づき、日本語テンプレートと当該テンプレートと対応関係にある英語テンプレートとをそれぞれ複数生成する。さらに、テンプレート生成部27は、当該生成した日本語テンプレートと英語テンプレートとを記憶装置13Aに記憶させる。
【0287】
したがって、翻訳装置1Aは、第1テンプレートから日本語テンプレートを複数生成できる。さらに、翻訳装置1Aは、第2テンプレートから当該日本語テンプレートと対応関係にある英語テンプレートを複数生成することができる。
【0288】
それゆえ、翻訳装置1のように予め日本語テンプレートおよび英語テンプレートを記憶装置13に記憶しておく構成に比べ、翻訳装置1Aは、予め記憶しておくテンプレートの数を少なくすることができる。このため、翻訳装置1Aは、翻訳装置1に比べて、テンプレートを記憶させておく領域の容量を小さくすることができる。
【0289】
また、第1テンプレートと第2テンプレートとは、所定の語句で構成された第1部と予め定められた複数の要素のうちの何れかの要素を選択可能な第2部とを含む。テンプレート生成部27は、第1テンプレートおよび第2テンプレートにおいて互いに対応する位置の要素を、第1テンプレートおよび第2テンプレートにおいて順に選択することにより、日本語テンプレートと当該テンプレートに対応する英語テンプレートとをそれぞれ複数生成する。
【0290】
したがって、翻訳装置1Aは、第2部に含まれる要素の数に応じた、日本語テンプレートおよび英語テンプレートを生成することができる。
【0291】
また、図57に示したように、要素は可変部であってもよい。要素が可変部である場合には、翻訳装置1Aは、要素が可変部でない場合よりも、数多くの文例を作成することができる。
【0292】
<<2.翻訳装置の具体的機能>>
<1.概要>
翻訳装置1の具体的機能の概要について、図78から図80に基づいて説明する。
【0293】
図78は、変更前の文と、制御部12に含まれる変更部32(図1参照)による変更後の文とを示した図である。図78を参照して、ユーザは、「<<1.翻訳装置の一般的機能>>」で示した翻訳装置1の機能を用いて、原文である文WJ10と、当該原文の訳文である文WE10とを得る。つまり、翻訳装置1は、ユーザからの入力に基づき、日本語テンプレートと英語テンプレートとを用いて、対訳文を出力部11に表示する。なお、当該具体的機能を実現するためには、上述したテンプレートは異なるテンプレートを利用する。テンプレートの構成については後述する(図81参照)。
【0294】
ユーザから文WJ10、WE10を過去形にする変更指示を翻訳装置1が受付けると、翻訳装置1は、文WJ10を過去形とした文WJ11と、文WE10を過去形とした文WE11とを出力部11に表示する。
【0295】
図79は、図78とは異なる変更前の文と変更後の文とを示した図である。図79を参照して、ユーザは、「<<1.翻訳装置の一般的機能>>」で示した翻訳装置1の機能を用いて、原文である文WJ20と、当該原文の訳文である文WE20とを得る。ユーザから文WJ20、WE20を過去形かつ否定形かつ可能を意味する文に変更する変更指示を翻訳装置1が受付けると、翻訳装置1は、文WJ20を当該変更指示に応じて変更した文WJ21と、文WE20を当該変更指示に応じて変更した文WE21とを出力部11に表示する。
【0296】
図80は、接続前の文と、制御部12に含まれる接続部33(図1参照)による接続後の文とを示した図である。図80を参照して、翻訳装置1は、上記変更後の文WJ11と上記変更後の文WJ21とを接続した文WJ30を出力部11に表示する。また、翻訳装置1は、上記変更後の文WE11と上記変更後の文WE21とを接続した文WE30を出力部11に表示する。
【0297】
翻訳装置1は、当該接続の際には、ユーザの指定に基づく語句(たとえば、「So」)を用いて、上記文の接続を行なう。さらに、翻訳装置1は、接続対象となる2つ文のそれぞれに同一の固有名詞が含まれる場合、一方の文(後に配される文)の固有名詞を代名詞に置換する。たとえば、文WE30に示すとおり、2文目の「Tom」を「he」に置換する。
【0298】
以下、図78から図80に示した処理を実行するための翻訳装置1が備える構成について、図81から図106に基づいて説明する。
【0299】
<2.データ>
図81は、翻訳装置1の具体的機能を実現するための用いるテンプレートを示した図である。なお、テンプレートは図81のようなテンプレートに限定されず、「he」、「eat」、「apple」、および当該各語句に対応する日本語の各語句の箇所が、可変部になっているテンプレートであってもよい。つまり、当該各可変部を置換することにより、図81に示す日本語の文および英語の文が生成されるようなテンプレートであってもよい。
【0300】
以下では、説明の便宜上、図81のようなテンプレートが記憶装置13に格納されているとして説明する。また、説明の便宜上、日本語と英語との対訳文を示す場合を例に挙げて説明する。
【0301】
図82は、文を変更するためのテーブルTB1を示した図である。なお、当該テーブルTB1は、記憶装置13に予め格納されている。図82を参照して、テーブルTB1には、「助動詞」、「時制」、および「構文」の組に、「vj」、「aj」、「se」、「ve」、「ae1」、「ae2」、および「m」が対応付けられている。
【0302】
たとえば、「助動詞」、「時制」、および「構文」のi番目の組は、「助動詞」に関する指定がなく、「時制」が現在形、かつ「構文」が疑問形を示した組である。この組の場合、一例として、「vj」として「+ren」、「se」として「-i」が対応付けられている。なお、「φ」は、指定がないことを示した記号である。また、「助動詞」、「時制」、および「構文」のk番目の組は、「助動詞」が進行形を示した助動詞であって、「時制」が未来形、かつ「構文」が否定形を示した組である。
【0303】
図83は、「助動詞」、「時制」、および「構文」の初期の状態を示したデータである。図83を参照して、「助動詞」、「時制」、および「構文」は、全て指定がない状態となっている。
【0304】
図84は、翻訳装置1がユーザの指示に基づき図83に示したデータの内容を更新した後のデータの状態を示した図である。具体的には、図84は、「助動詞」が、「φ」から進行形を示した助動詞に変更され、「時制」が「φ」から未来形へ変更され、かつ「構文」が「φ」から否定形へ変更された後の状態を示した図である。つまり、図84は、「助動詞」、「時制」、および「構文」のk番目の組が選択されたことを示した図である。
【0305】
なお、以下では、図83、84のように、「助動詞」、「時制」、および「構文」の状態を示したデータを、「変更指示データ」と称する。
【0306】
図85は、図84の変更指示データに基づき、図81のテンプレートを図82のテーブルTB1を用いて変更した後のテンプレートの状態を示した図である。以下では、テンプレートに含まれる語句や記号の並びを、「要素」とも称する。
【0307】
図85を参照して、要素W311は、テーブルTB1(図82参照)における上記k番目の組の「vj」の欄の記載に基づいて、図81の要素W301を変更した後の要素である。図85の要素W312は、テーブルTB1におけるk番目の組の「aj」の記載に基づいて、図81の要素W302を変更した後の要素である。図85の要素W411は、テーブルTB1におけるk番目の組の「ve」の記載に基づいて、図81の要素W401を変更した後の要素である。図85の要素W412は、テーブルTB1におけるk番目の組の「ae2」の記載に基づいて、図81の要素W402を変更した後の要素である。
【0308】
図86は、翻訳装置1が図85に示すテンプレートに基づいて生成した文を示した図である。つまり、図86は、翻訳装置1がテンプレートTP1、TP2(図81参照)に基づいて生成した文を示した図でもある。図86を参照して、翻訳装置1は、テンプレートTP1、TP2に基づき、進行形、未来形、かつ否定形である、日本語の文WJ40および英語の文WE40を生成する。なお、文WJ40が原文であり、文WE40が当該原文に対する訳文である。
【0309】
図87は、翻訳装置1がユーザの指示に基づき図83に示したデータの内容を更新した後のデータ(変更指示データ)の他の状態を示した図である。具体的には、図87は、「時制」が「φ」から現在形へ変更され、かつ「構文」が「φ」から疑問形へ変更された後の状態を示した図である。つまり、図87は、図82におけるi番目の組が選択されたことを示した図である。
【0310】
図88は、図88の変更指示データに基づき、図81のテンプレートを図82のテーブルTB1を用いて変更した後のテンプレートの状態を示した図である。
【0311】
図88を参照して、要素W321は、テーブルTB1(図82参照)における上記i番目の組の「vj」の欄の記載に基づいて、図81の要素W301を変更した後の要素である。図88の要素W322は、テーブルTB1におけるi番目の組の「aj」の記載に基づいて、図81の要素W302を変更した後の要素である。図88の要素W421は、テーブルTB1におけるi番目の組の「ve」の記載に基づいて、図81の要素W401を変更した後の要素である。図88の要素W422は、テーブルTB1におけるi番目の組の「ae2」の記載に基づいて、図81の要素W402を変更した後の要素である。
【0312】
また、図88の要素W423は、テーブルTB1におけるi番目の組の「se」の記載に基づいて、図81の要素W403を変更した後の要素である。図88の要素W424は、テーブルTB1におけるi番目の組の「ae1」の記載に基づいて、図81の要素W404を変更した後の要素である。
【0313】
図89は、翻訳装置1が図88に示すテンプレートに基づいて生成した文を示した図である。つまり、図89は、翻訳装置1がテンプレートTP1、TP2(図81参照)に基づいて生成した文を示した図でもある。図89を参照して、翻訳装置1は、テンプレートTP1、TP2に基づき、現在形かつ疑問形である、日本語の文WJ50および英語の文WE50を生成する。なお、文WJ50が原文であり、文WE50が当該原文に対する訳文である。
【0314】
図90は、文と文との接続に用いられるテーブルTB2した図である。なお、当該テーブルTB2は、記憶装置13に予め格納されている。図90を参照して、テーブルTB2においては、接続情報と、日本語文接続のテンプレートと、英語文接続のテンプレートと、生成条件とが対応付けられている。
【0315】
たとえば、1番目の組(つまり、No.1)には、接続情報として、「順接」が対応付けられている。また、当該接続情報には、順接で文と文とを接続する場合における、日本語文接続のテンプレートと、英語文接続のテンプレートとが対応付けられている。当該テーブルTB2の利用方法については後述する。なお、以下では、日本語文接続のテンプレート、および英語文接続のテンプレートとのそれぞれを、「接続テンプレート」とも称する。
【0316】
また、テーブルTB2は、日本語の複数の接続詞と、英語の複数の接続詞とを記憶した構成である。より詳しくは、テーブルTB2は、日本語と英語とに関し、1つ以上の等位接続詞と1つ以上の従属接続詞とを記憶した構成である。
【0317】
次に、生成条件について説明する。生成条件は、文と文とを接続する際に、語句の変更等を行なう条件を規定したものである。一例として、図90の生成条件に規定された内容を説明すると以下のとおりである。図90の生成条件では、以下の3つの条件が整うと、以下の生成処理を行なう。
【0318】
条件1:可変部「{sentA}」において置換された文と、可変部「{sentB}」において置換された文とに同一の語が存在する。
【0319】
条件2:上記同一の語が名詞である。
条件3:上記同一の語が代名詞ではない。
【0320】
生成処理:可変部「{sentB}」において置換された文における上記同一の語を代名詞に変更する。
【0321】
翻訳装置1は、当該生成処理を行なうことにより、たとえば、図80に示したように、「Tom」を「he」に変更する。なお、図90に示した生成条件は、一例であって、これに限定されるものではない。
【0322】
図91は、文と文とを接続する際に、当該文と文とを一時的に格納するテーブルTB3を示した図である。図91を参照して、「sentA」と「日本語文」とにより特定される欄には、1つ目の日本語の文が格納される。「sentB」と「日本語文」とにより特定される欄には、2つ目の日本語の文が格納される。「sentA」と「英語文」とにより特定される欄には、1つ目の英語の文が格納される。「sentB」と「英語文」とにより特定される欄には、2つ目の英語の文が格納される。なお、詳細については後述するが、翻訳装置1は、「sentB」の各欄に、「sentA」に続く文を格納する。
【0323】
<3.機能ブロック>
再び図1を参照して、後述する文変更処理と文接続処理とに分けて、翻訳装置1の制御部12における、受付部31、変更部32、および接続部33について説明する。
【0324】
(文変更処理)
図78、79に示したように文を変更する処理(以下、「文変更処理」とも称する)について説明する。前提として、表示制御部25は、日本語による文である第1原文と、対訳テンプレートを用いて当該第1原文を翻訳することにより得られた英語による文である第1訳文とを出力部11に表示させる。
【0325】
受付部31は、上記第1原文と上記第1訳文とが出力部11に表示された状態で、入力部10を介して、当該第1原文と当該第1訳文との内容を変更するための指示(以下、「第1指示」と称する)を受け付ける。変更部32は、上記第1指示に基づき、上記第1原文と上記第1訳文との内容を変更する。なお、第1指示は、第1原文および第1訳文について、時制を変更する指示、並びに、肯定文、否定文、および疑問文のいずれかへの変更する指示のうちのいずれかの指示である。表示制御部25は、当該変更後の第1原文と当該変更後の第1訳文とを出力部11に表示させる。
【0326】
(文接続処理)
図80に示したように、同一言語の2つの文を接続する処理(以下、「文接続処理」とも称する)について説明する。表示制御部25は、日本語による文である第2原文と当該第2原文に対応する英語による文である第2訳文とが新たに生成されたことに基づき、さらに、当該第2原文と当該第2訳文とを出力部11に表示させる。
【0327】
受付部31は、入力部10を介して、上記第2原文と上記第2訳文との内容を変更するための指示(以下、「第2指示」と称する)をさらに受け付ける。変更部32は、上記第2指示に基づき、上記第2原文と上記第2訳文との内容を変更する。さらに、受付部31は、入力部10を介して、当該変更後の第1原文と当該変更後の第2原文とを接続するとともに当該変更後の第1訳文と当該変更後の第2訳文とを接続するための指示(以下、「第3指示」と称する)、および当該接続の態様を指定する指示(以下、「第4指示」と称する)を受け付ける。なお、当該第4指示は、1つ以上の等位接続詞および1つ以上の従属接続詞のうちのいずれかを指定を含む指示である。
【0328】
接続部33は、上記第3指示および上記第4指示に基づいて、当該変更後の第1原文と、当該変更後の第2原文とを接続するとともに、当該変更後の第1訳文と当該変更後の第2訳文とを接続する。表示制御部25は、当該接続後の文章を出力部11に表示させる。
【0329】
また、接続部33は、複数の接続詞(テーブルTB2参照)のうちの上記第4指示に基づく接続詞を用いて、変更後の第1原文と変更後の第2原文とを接続するとともに、接続変更後の第1訳文と変更後の第2訳文とを接続する構成でもある。
【0330】
受付部31は、さらに、入力部10を介して、変更後の第1訳文と変更後の第2訳文との接続の順番を指定する指示(以下、「第5指示」と称する)を受け付ける。接続部33は、当該第5指示に基づき、変更後の第1訳文と変更後の第2訳文とを当該順番で接続するとともに、変更後の第1訳文と変更後の第2訳文とを当該順番で接続する。
【0331】
なお、上記においては、翻訳装置1の接続部33が変更後の文同士を接続する構成を例に挙げて説明したが、これに限定されるものではない。たとえば、接続部33は、ユーザの指示に基づき、同一言語の2つの文について、変更後の文(たとえば、図78の文WE11)と変更前の文(たとえば、図79の文WE20)とを接続してもよい。
【0332】
<4.具体例>
翻訳装置1の文変更処理および文接続処理について、図92から図101に基づいて、より具体的に説明する。
【0333】
図92は、ユーザが上記文変更処理と上記文接続処理とを行なうために、翻訳装置1が表示する画像900(グラフィカルユーザインターフェイス(GUI))を示した図である。すなわち、図92は、翻訳装置1の出力部11に表示される画像である。
【0334】
図92を参照して、画像900は、ボタン901、903、904、905と、第1表示領域902と、プルダウンメニュー910、920、930と、オプションメニュー940と、第2表示領域960とを含む。
【0335】
ボタン901は、新規例文を検索するための入力を受け付けるボタンである。すなわち、ボタン901は、図81のような型を有するテンプレートを用いて、たとえば図78の文WJ10、WE10、あるいは図79の文WJ20、WE20の生成をユーザが指示するためのボタンである。
【0336】
ボタン903は、ユーザが文変更処理を翻訳装置1に指示するためのボタンである。ボタン904は、ユーザが文を移動する処理(以下、「文移動処理」と称する)を翻訳装置1に指示するためのボタンである。ボタン905は、ユーザが文接続処理を翻訳装置1に指示するためのボタンである。
【0337】
プルダウンメニュー910は、時制を選択するためのメニューである。プルダウンメニュー920は、構文を選択するためのメニューである。プルダウンメニュー930は、接続情報を選択するためのメニューである。オプションメニュー940は、複数の項目から少なくとも1つの項目をユーザが選択するためのメニューである。オプションメニューは、たとえば、ラジオボタンである。また、オプションメニュー940を、複数のチェックボックスを備えるメニューとして構成してもよい。
【0338】
第1表示領域902は、翻訳装置1が処理対象文と処理済文とを表示する領域である。なお、「処理対象文」とは、図78に示した文WJ10、WE10や図79に示した文WJ20、WE20といった、文変更処理を行なう前の文である。「処理対象文」とは、図78に示した文WJ11、WE11や図79に示した文WJ21、WE21といった、文変更処理を行なうことにより得られる文である。
【0339】
第2表示領域960は、主として、生成された文章を表示するための領域である。ここで、文章とは、複数の文から構成されるものをいう。第2表示領域960は、英文の表示領域である英語訳文表示領域961と日本語の表示領域である日本語原文表示領域962とを含む。
【0340】
以下、図78から図80に示した文変更処理と文接続処理とが、どのように実現されるかについて説明する。
【0341】
図93は、翻訳装置1が、文WJ10と文WE10とを生成し、当該文WJ10と文WE10とを第1表示領域902に表示した状態を示した図である。図93を参照して、翻訳装置1は、当該文WJ10と文WE10とを、第1表示領域902の処理対象文の領域に表示する。
【0342】
図94は、図93の状態から、ユーザが、プルダウンメニュー910により時制を選択するとともに、プルダウンメニュー920により構文を選択した場合における画像900を示した図である。具体的には、図94は、ユーザによる選択指示に基づき、時制として「過去」を示す語句W911が選択され、構文として「肯定」を示す語句W921が選択された状態を示した図である。
【0343】
図95は、図94の状態から、ユーザが、ボタン903を選択した場合における画像900を示した図である。図95を参照して、ボタン903の選択に基づく文変更処理の指示が入力されると、翻訳装置1は、文WJ10と文WE10とを変更し、当該変更後の文WJ11と変更後の文WE11とを第1表示領域902の処理済文の領域に表示する。
【0344】
図96は、図95の状態から、ユーザが、ボタン904を選択した場合における画像900を示した図である。図96を参照して、ボタン904の選択に基づく文移動処理の指示が入力されると、翻訳装置1は、文WJ11および文WE11を、第1表示領域902から第2表示領域960に移動する。より具体的には、文移動処理の指示が入力されると、翻訳装置1は、第1表示領域902に表示した4つの文WJ10、WE10、WJ11、WE11を非表示とする。さらに、翻訳装置1は、英語訳文表示領域961に文WE11を表示するとともに、日本語原文表示領域962に文WJ11を表示する。
【0345】
図97は、図96の状態から、翻訳装置1が、文WJ20と文WE20とを生成し、当該文WJ20と文WE20とを第1表示領域902に表示した状態を示した図である。図97を参照して、翻訳装置1は、当該文WJ20と文WE20とを、第1表示領域902の処理対象文の領域に表示する。
【0346】
図98は、図97の状態から、ユーザが、プルダウンメニュー910により時制を選択し、プルダウンメニュー920により構文を選択し、オプションメニュー940から1つの項目を選択した場合における画像900を示した図である。具体的には、図98は、ユーザによる選択指示に基づき、時制として「過去」を示す語句W911が選択された状態の図である。また、図98は、ユーザによる選択指示に基づき、構文として「否定」を示す語句W922が選択された状態を示した図である。さらに、図98は、ユーザによる選択指示に基づき、「可能」を示す語句W941が選択された状態を示した図でもある。
【0347】
図99は、図98の状態から、ユーザが、ボタン903を選択した場合における画像900を示した図である。図99を参照して、ボタン903の選択に基づく文変更処理の指示が入力されると、翻訳装置1は、文WJ20と文WE20とを変更し、当該変更後の文WJ21と変更後の文WE21とを第1表示領域902の処理済文の領域に表示する。
【0348】
図100は、図99の状態から、ユーザが、プルダウンメニュー930により接続情報を選択した場合における画像900を示した図である。より詳しくは、図100は、ユーザが、プルダウンメニュー930により、接続情報の1つである「結果」を示す語句W931を選択した状態を示した図である。図100を参照して、翻訳装置1は、ガイダンス表示W932を、語句W931に対応付けて表示する。
【0349】
ガイダンス表示W932は、図90に示した日本語文接続に基づく情報を含む。より詳しくは、ガイダンス表示W932は、図90における5番目の組(つまりNo.5)の日本語接続文を含む。さらに、ガイダンス表示W932は、図90における「sentA」に割り当てる文を選択することをユーザに促す表示を含む。より詳しくは、ガイダンス表示W932は、表示されている処理済文WJ21と、表示されている日本語原文WJ11とから、「sentA」に割り当てる文を選択することをユーザに促す表示を含む。
【0350】
図101は、ユーザが、マウス等の入力部10により「sentA」を選択した後、ボタン905を選択した後の状態を示した図である。より具体的には、ユーザが、「sentA」として処理済文である文WJ11を選択した後、ボタン905を選択した後の状態を示した図である。
【0351】
図102は、「sentA」として処理済文WJ11が選択された場合における、テーブルTB3を示した図である。図102を参照して、「sentA」の日本語文の欄には、文WJ11が記憶される。また、「sentA」の英語文の欄には、文WE11が記憶される。また、「sentA」の選択に基づき、翻訳装置1は、「sentB」に割り当てる文を特定する。「sentA」として文WJ11が選択された場合、翻訳装置1は、文WJ21を「sentB」に割り当てる文として特定する。
【0352】
図103は、文WJ21を「sentB」に割り当てる文として特定した場合における、テーブルTB3を示した図である。図103を参照して、「sentA」の日本語文の欄には、文WJ21が記憶される。また、「sentA」の英語文の欄には、文WE21が記憶される。
【0353】
再び、図101を参照して、翻訳装置1は、英語訳文表示領域961に文WE30を表示するとともに、日本語原文表示領域962に文WJ30を表示する。
【0354】
以上により、図80において説明したように、翻訳装置1は、変更後の日本語の文WJ11、WJ21を接続した日本語の文WJ30と、変更後の英語の文WE11、WE21を接続した英語の文WE30とを表示することができる。したがって、ユーザは、接続後の文WJ30、WE30を確認することができる。
【0355】
また、翻訳装置1は、文変更処理の際、処理対象文をユーザが所望する時制の文に変更することができる。したがって、ユーザは、時制を変更した後の文を確認することができる。
【0356】
また、翻訳装置1は、文変更処理の際、処理対象文を、ユーザの指示に応じて、肯定文、否定文、および疑問文のいずれかへの変更することができる。したがって、ユーザは、肯定文、否定文、あるいは疑問文に変更した後の文を確認することができる。
【0357】
また、翻訳装置1は、上述した文変更処理を行なうため、ユーザが新たに一から文を作り直すといった作業が不要となる。また、図81に示した型のテンプレートを用いることにより記憶装置13が格納するテンプレートの数を減らすことができる。
【0358】
また、翻訳装置1は、文接続処理の際、ユーザが所望する態様の接続詞を用いて文と文とを接続することができる。また、2つの訳文を接続する場合、接続の順番をユーザがしていることができる。したがって、文を作成した順序に関わらず、文と文とを接続することが可能となる。
【0359】
なお、上述したように、接続する各日本語文および接続する各英語文は、必ずしも変更部32による変更処理が行なわれたものである必要はない。たとえば、文変更処理を行っていない日本語文(あるいは英語文)と、文変更処理を行っていない日本語文(あるいは英語文)とを接続してもよい。また、文変更処理を行っていない日本語文(あるいは英語文)と、変更後の日本語文(英語文)とを接続してもよい。
【0360】
また、上記おいては、2つの文を接続する例を挙げて説明したが、これに限定されるものではない。翻訳装置1は、2つの文を接続した後、さらに1つの文を接続することも可能である。たとえば、図101に示した状態において、さらに、日本語の文と当該文に対応する英語の文とを生成し、当該生成した文あるいは当該生成した文を文変更処理した文と、第2表示領域に表示されている文WJ30,WE30とを上記文接続処理により接続することにより実現できる。また、翻訳装置1は、同様の処理を繰り返すことにより、4つ以上の文を接続することもできる。
【0361】
<5.制御構造>
図104は、翻訳装置1の処理の流れを示すフローチャートである。図104を参照して、ステップS301において、翻訳装置1は、図92に示す画像900が表示されている状態において、テンプレート検索およびテンプレートを用いた文の生成を行なう。ステップS302において、翻訳装置1は、入力を受け付ける。ステップS303において、翻訳装置1は、文の変更指示を受け付けたか否かを判断する。具体的には、翻訳装置1は、画像900に含まれるボタン903が選択されたか否かを判断する。
【0362】
翻訳装置1は、文の変更指示を受け付けたと判断した場合(ステップS303においてYES)、ステップS306において文変更処理を行なう。ステップS307において、翻訳装置1は、第1表示領域902へ変更結果の出力を行なう。つまり、翻訳装置1は、変更した文を、処理済文の領域(図95等参照)に表示する。
【0363】
翻訳装置1は、文の変更指示を受け付けていないと判断した場合(ステップS303においてNO)、ステップS304において、文の移動指示を受け付けたか否かを判断する。具体的には、翻訳装置1は、画像900に含まれるボタン904が選択されたか否かを判断する。
【0364】
翻訳装置1は、文の移動指示を受け付けたと判断した場合(ステップS304においてYES)、第2表示領域960への出力を行なう。具体的には、翻訳装置1は、第1表示領域の処理済文の表示領域に表示された文を非表示とし、当該文を第2表示領域960に表示させる処理を行なう(図96参照)。
【0365】
翻訳装置1は、文の移動指示を受け付けていないと判断した場合(ステップS304においてNO)、ステップS305において、文と文との接続指示を受け付けたか否かを判断する。具体的には、翻訳装置1は、画像900に含まれるボタン905が選択されたか否かを判断する。さらに、翻訳装置1は、「sentA」が選択されたか否かについても判断する。
【0366】
翻訳装置1は、文と文との接続指示を受け付けたと判断した場合(ステップS305においてYES)、ステップS308において文接続処理を行なう。翻訳装置1は、文と文との接続指示を受け付けていないと判断した場合(ステップS305においてNO)、処理を終了する。
【0367】
図105は、図104のステップS306に示した文変更処理の詳細を示した図である。図105を参照して、翻訳装置1は、ステップS3061において、入力情報を抽出する。ここで、入力情報とは、入力部10を介して、ユーザによって入力された情報をいう。当該入力情報には、「時制」についての情報、「構文」についての情報、「オプション」についての情報、接続情報等が含まれる。翻訳装置1は、文変更処理においては、「時制」についての情報、「構文」についての情報、「オプション」についての情報を用いる。
【0368】
翻訳装置1は、ステップS3062において、変更する文のテンプレートを選択する。たとえば、翻訳装置1は、「He eats an apple」といった訳文と当該訳文の原文とを第1表示領域902の処理対象文として表示している場合、当該訳文と当該原文の基となった、図81に示すテンプレートTP1、TP2を選択する。
【0369】
翻訳装置1は、ステップS3063において、上記抽出した入力情報とテーブルTB1(図82参照)とに基づき、選択したテンプレートにおいて置換処理を行なう。翻訳装置1は、たとえば、図85および図88に基づいて説明した置換処理を行なう。翻訳装置1は、ステップS3064において、出力文を生成する。翻訳装置1は、たとえば、図86および図89に示した文を生成する。
【0370】
図106は、図104のステップS308に示した文接続処理の詳細を示した図である。図106を参照して、翻訳装置1は、ステップS3081において、入力情報を抽出する。文接続処理においては、抽出した入力情報のうちの接続情報を用いる。
【0371】
翻訳装置1は、ステップS3082において、抽出した入力情報である接続情報に基づいて、接続テンプレート(図90参照)を選択する。翻訳装置1は、たとえば、接続情報が「結果」を示すものである場合、図90の5番目の組に対応付けられた接続テンプレートを選択する。
【0372】
翻訳装置1は、ステップS3083において、選択した接続テンプレート内の可変部を抽出する。なお、図90の接続テンプレートにおいては、「{sentA}」および「{sentB}」が可変部となる。翻訳装置1は、ステップS3084において、未決定の可変部が存在するか否かを判断する。翻訳装置1は、たとえば、「{sentA}」および「{sentB}」に割り当てる文が未決定か否かを判断する。
【0373】
翻訳装置1は、未決定の可変部が存在すると判断した場合(ステップS3084において、ステップS3087において、可変部への選択入力を受け付ける。つまり、翻訳装置1は、ユーザから、未決定の可変部に割り当てる文の指定を受け付ける。
【0374】
翻訳装置1は、未決定の可変部が存在しないと判断した場合(ステップS3084においてNO)、ステップS3085において、可変部に関する入力情報を挿入する。つまり、翻訳装置1は、選択した接続テンプレートの可変部(たとえば、「{sentA}」、「{sentB}」)に、文を挿入する。翻訳装置1は、ステップS3086において、生成条件(図90参照)に基づく処理を行なう。
【0375】
<6.その他>
(1)「<<2.翻訳装置の具体的機能>>」においては、翻訳装置1の具体的機能を述べたが、当該具体的な機能を翻訳装置1Aが備える構成としてもよい。
【0376】
(2)今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0377】
<付記>
(1)対訳テンプレートを用いて第1言語による文を第2言語による文に翻訳する翻訳装置1であって、翻訳装置1は、第1言語による文である第1原文と、対訳テンプレートを用いて当該第1原文を翻訳することにより得られた第2言語による文である第1訳文とを出力部11に表示させる表示制御部25と、第1原文と第1訳文とが表示された状態で、入力部10を介して、第1訳文の内容を変更するための第1指示を受け付ける受付部31と、第1指示に基づき、第1訳文の内容を変更する変更部32とを備える。表示制御部25は、変更後の第1訳文を出力部11に表示させる。
【0378】
(2)表示制御部25は、第1言語による文である第2原文と当該第2原文に対応する第2言語による文である第2訳文とが新たに生成されたことに基づき、当該第2原文と当該第2訳文とを出力部11に表示させる。受付部31は、入力部10を介して、第2訳文の内容を変更するための第2指示をさらに受け付ける。変更部32は、第2指示に基づき、第2訳文の内容を変更する。受付部31は、入力部10を介して、変更後の第1訳文と変更後の第2訳文とを接続するための第3指示、および当該接続の態様を指定する第4指示をさらに受け付ける。翻訳装置1は、第3指示および第4指示に基づいて、変更後の第1訳文と、変更後の第2訳文とを接続する接続部33をさらに備える。表示制御部25は、接続後の文章を出力部11に表示させる。
【0379】
(3)翻訳装置1は、複数の接続詞を格納した記憶装置をさらに備える。接続部33は、複数の接続詞のうちの第4指示に基づく接続詞を用いて、変更後の第1訳文と、変更後の第2訳文とを接続する。
【0380】
(4)受付部31は、入力部10を介して、変更後の第1訳文と、変更後の第2訳文との接続の順番を指定する第5指示をさらに受け付ける。接続部33は、第5指示に基づき、変更後の第1訳文と、変更後の第2訳文とを順番で接続する。
【0381】
(5)第1指示は、第1訳文について、時制を変更する指示、並びに、肯定文、否定文、および疑問文のいずれかへの変更する指示のうちのいずれかの指示である。
【0382】
(6)記憶装置は、さらに、1つ以上の等位接続詞および1つ以上の従属接続詞をさらに格納している。第4指示は、1つ以上の等位接続詞および1つ以上の従属接続詞のうちのいずれかを指定する指示である。
【0383】
(7)表示制御部25は、第1言語による文である第2原文と当該第2原文に対応する第2言語による文である第2訳文とが生成されたことに基づき、当該第2原文と当該第2訳文とを出力部11に表示させる。受付部31は、入力部10を介して、変更後の第1訳文と第2訳文とを接続するための第2指示、および当該接続の態様を指定する第3指示を、さらに受け付ける。翻訳装置1は、第2指示および第3指示に基づいて、変更後の第1訳文と、第2訳文とを接続する接続部33をさらに備える。表示制御部25は、接続後の文章を出力部11に表示させる。
【符号の説明】
【0384】
1 翻訳装置、1A 翻訳装置、10 入力部、11 出力部、12 制御部、12A 制御部、13 記憶装置、13A 記憶装置、14 メモリ、14A メモリ、20 抽出部、21 データ読出部、21A データ読出部、22 判定部、23 選択部、24 置換部、25 表示制御部、26 出力文整形部、27 テンプレート生成部、31 受付部、32 変更部、33 接続部、40 辞書検索部、41 スロット置換部、42 共起置換部、43 変化形探索部、44 未入力箇所置換部。

【特許請求の範囲】
【請求項1】
対訳テンプレートを用いて第1言語による原文を第2言語による訳文に翻訳する情報処理装置であって、
前記第1言語による第1原文を翻訳することにより得られる前記第2言語による第1訳文と、前記第1言語による第2原文を翻訳することにより得られる前記第2言語による第2訳文とを表示装置に表示させる表示制御手段と、
入力装置を介して、前記第1訳文と前記第2訳文とを接続するための第1指示、および当該接続の態様を指定する第2指示を受け付ける受付手段と、
前記第1指示および前記第2指示に基づいて、前記第1訳文と前記第2訳文とを接続する接続手段とを備え、
前記表示制御手段は、前記接続後の文章を前記表示装置に表示させる、情報処理装置。
【請求項2】
前記受付手段は、前記入力装置を介して、前記第1訳文の内容を変更するための第3指示をさらに受け付け、
前記情報処理装置は、
前記第3指示に基づき、前記第1訳文の内容を変更する変更手段をさらに備え、
前記受付手段は、前記第1指示として、前記変更後の第1訳文と、前記第2訳文とを接続するための指示をさらに受け付ける、請求項1に記載の情報処理装置。
【請求項3】
前記受付手段は、前記第3指示として、前記第2訳文の内容を変更するための指示をさらに受け付け、
前記変更手段は、前記第2訳文の内容を変更するための指示に基づき、前記第2訳文の内容を変更し、
前記受付手段は、前記第1指示として、前記変更後の第1訳文と、前記変更後の第2訳文とを接続するための指示をさらに受け付ける、請求項2に記載の情報処理装置。
【請求項4】
前記情報処理装置は、
複数の接続詞を格納した記憶装置をさらに備え、
前記接続手段は、前記複数の接続詞のうちの前記第2指示に基づく接続詞を用いて、前記変更後の第1訳文と、前記変更後の第2訳文とを接続する、請求項3に記載の情報処理装置。
【請求項5】
前記受付手段は、前記入力装置を介して、前記変更後の第1訳文と、前記変更後の第2訳文との接続の順番を指定する第4指示をさらに受け付け、
前記接続手段は、前記第4指示に基づき、前記変更後の第1訳文と、前記変更後の第2訳文とを前記順番で接続する、請求項3または4に記載の情報処理装置。
【請求項6】
前記第3指示は、前記第1訳文および前記第2訳文について、時制を変更する指示、並びに、肯定文、否定文、および疑問文のいずれかへの変更する指示のうちのいずれかの指示である、請求項3から5のいずれかに記載の情報処理装置。
【請求項7】
前記記憶装置は、前記接続詞として、1つ以上の等位接続詞および1つ以上の従属接続詞を格納しており、
前記第2指示は、前記1つ以上の等位接続詞および前記1つ以上の従属接続詞のうちのいずれかの接続詞の指定を含む指示である、請求項4に記載の情報処理装置。
【請求項8】
対訳テンプレートを用いて第1言語による原文を第2言語による訳文に翻訳する情報処理装置における訳文接続方法であって、
前記第1言語による第1原文を翻訳することにより得られた前記第2言語による第1訳文と、前記第1言語による第2原文を翻訳することにより得られた前記第2言語による第2訳文とを表示装置に表示させるステップと、
入力装置を介して、前記第1訳文と前記第2訳文とを接続するための第1指示、および当該接続の態様を指定する第2指示を受け付けるステップと、
前記第1指示および前記第2指示に基づいて、前記第1訳文と前記第2訳文とを接続するステップと、
前記接続後の文章を前記表示装置に表示させるステップとを備える、訳文接続方法。
【請求項9】
対訳テンプレートを用いて第1言語による原文を第2言語による訳文に翻訳する情報処理装置において実行されるプログラムであって、
前記プログラムは、
前記第1言語による第1原文を翻訳することにより得られた前記第2言語による第1訳文と、前記第1言語による第2原文を翻訳することにより得られた前記第2言語による第2訳文とを表示装置に表示させるステップと、
入力装置を介して、前記第1訳文と前記第2訳文とを接続するための第1指示、および当該接続の態様を指定する第2指示を受け付けるステップと、
前記第1指示および前記第2指示に基づいて、前記第1訳文と前記第2訳文とを接続するステップと、
前記接続後の文章を前記表示装置に表示させるステップとを前記情報処理装置に実行させる、プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20A】
image rotate

【図20B】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29A】
image rotate

【図29B】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate

【図35】
image rotate

【図36】
image rotate

【図37】
image rotate

【図38】
image rotate

【図39】
image rotate

【図40】
image rotate

【図41】
image rotate

【図42】
image rotate

【図43】
image rotate

【図44】
image rotate

【図45】
image rotate

【図46】
image rotate

【図47】
image rotate

【図48】
image rotate

【図49】
image rotate

【図50】
image rotate

【図51】
image rotate

【図52】
image rotate

【図53】
image rotate

【図54】
image rotate

【図55】
image rotate

【図56】
image rotate

【図57】
image rotate

【図58】
image rotate

【図59】
image rotate

【図60】
image rotate

【図61】
image rotate

【図62】
image rotate

【図63】
image rotate

【図64】
image rotate

【図65】
image rotate

【図66】
image rotate

【図67】
image rotate

【図68】
image rotate

【図69】
image rotate

【図70】
image rotate

【図71】
image rotate

【図72】
image rotate

【図73】
image rotate

【図74】
image rotate

【図75】
image rotate

【図76】
image rotate

【図77】
image rotate

【図78】
image rotate

【図79】
image rotate

【図80】
image rotate

【図81】
image rotate

【図82】
image rotate

【図83】
image rotate

【図84】
image rotate

【図85】
image rotate

【図86】
image rotate

【図87】
image rotate

【図88】
image rotate

【図89】
image rotate

【図90】
image rotate

【図91】
image rotate

【図92】
image rotate

【図93】
image rotate

【図94】
image rotate

【図95】
image rotate

【図96】
image rotate

【図97】
image rotate

【図98】
image rotate

【図99】
image rotate

【図100】
image rotate

【図101】
image rotate

【図102】
image rotate

【図103】
image rotate

【図104】
image rotate

【図105】
image rotate

【図106】
image rotate


【公開番号】特開2011−48576(P2011−48576A)
【公開日】平成23年3月10日(2011.3.10)
【国際特許分類】
【出願番号】特願2009−195733(P2009−195733)
【出願日】平成21年8月26日(2009.8.26)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】