説明

外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム

【課題】外国語文書を作成する際に、文書作成者の語学力に依存せずに、文脈に沿った最適なフレーズを検索させる。
【解決手段】英文作成支援装置100は、英文テキストデータが蓄積されたデータベースを利用して英文フレーズを検索する装置であり、入力部201によって英文作成者から入力された英文フレーズの中の検索対象に指定された英単語の関連語として、検索クエリ作成処理部203によって英単語の日本語訳を検索するとともに、検索された関連語の英語訳を検索して検索用の英文フレーズである検索クエリを作成する。作成された検索クエリは、検索処理部204によってコーパスで検索される。コーパスの検索結果は、出力部205によってこの出力結果が英文作成者に提示される。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ユーザの要求する英文表現を提供して外国語文書作成の支援をおこなう外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラムに関する。
【背景技術】
【0002】
従来、日本語を母語とするユーザが英文を作成するなど、母語とは異なる外国語によって文書を作成する際に、文書作成者(ユーザ)は、ある意味を表現する英文フレーズを思いつくと、この表現が本当に正しいのか、また、他に同じような意味をあらわす表現はないか調べるために、類語辞書を引いていた。類語辞書を引くことによって、ある一つのフレーズに関する複数の類義語を検索することができるが、これら多数の類義語の中から前後の文脈や、単語と単語との結びつきに合った表現を選択するのは容易ではない。上述した単語と単語との結びつきや文脈のことを一般的にコロケーションというが、このコロケーションが適切であるかを判断するには、高い英語力が必要とされる。
【0003】
また、類語辞書を引く以外にも、英文フレーズの書換え表現を調べる方法としては、言語データベースであるコーパスから書換え表現を検索する方法があった。コーパスには、膨大なテキストデータが蓄積されており、これらのテキストデータを名詞+形容詞、動詞+名詞、動詞+前置詞など、品詞のコロケーションを指定して検索することができる。文書作成者がある英文フレーズを思いついた場合には、テキストデータの中からこの英文フレーズと同じコロケーションの英文フレーズが絞り込まれて出力される。文書作成者は、絞り込まれたフレーズのコロケーションを参照して適切な表現を探しだす。
【0004】
上述のようなコーパスを利用する方法は、英文フレーズによる表現の使用頻度を基準にして前後のコロケーションに合う単語を選ぶことができるという利点があるが、一方で、ユーザが調べたい表現のコロケーションに関係のない単語も数多く表示されてしまうという難点もある。すなわち、目的の表現を探すのに時間がかかったり、単語の意味を知っていないと適切な表現なのかどうかが判断できないという問題が発生する。たとえば、「decrease staff」の書換え表現を調べたければ、「動詞+staff」のコロケーションを検索すればよいが、検索結果として「decrease」の意味と関連のない多数の英文フレーズが表示されてしまうことがある。結果として、英語力が高くなければ適切な英文フレーズを選択できない。
【0005】
そこで近年では、英文法や単語の知識が十分でない人であっても、英文法に沿った英語的な表現の英文を作成することのできる英文作成支援装置が開示されている(たとえば、下記特許文献1参照。)。この、英文作成支援装置は、文字や各種命令を与える入力部からの入力情報に基づいて必要なデータを検索する辞書検索部と、辞書検索部が必要とするデータが格納された辞書データベースおよび英文法表データベースと、辞書検索部で検索した結果を出力するディスプレイなどの出力部とを備えた構成になっている。
【0006】
辞書検索部は、入力部から与えられた単語に基づいて辞書データベースを検索し、関連する接続可能な語句を抽出する。抽出された語句は、出力部に一覧として表示される。そして、さらにユーザの要求にしたがって英文法表データベースを検索し、表示されている語句の一覧の中で選択された単語と語句に関連する文法情報を抽出する。これら抽出された接続可能な語句や文法情報を提供することにより、ユーザに正しい英文を作成させることができる。
【0007】
また、動詞ごとに取り得る文型を表にした動詞文型活用早見表をデータベース化し、このデータベースを活用することによって、ネイティブにも通用する良質な英文作成の手助けをおこなう英文作成支援装置も開示されている(たとえば、下記特許文献2参照。)。
【0008】
この英文作成支援装置は、動詞と動詞に関する動詞文型活用情報を蓄積した動詞文型データベースと、動詞に関する連語情報を蓄積した連語データベースと、デスクトップコンピユータシステムにおける入力部を備えている。入力部によって動詞を指定すると、動詞文型データベースと連語データベースとから指定された動詞に関する動詞文型活用情報、連語情報を検索する。そして、検索された動詞文型活用情報、連語情報を表示手段によってユーザに提供する。
【0009】
【特許文献1】特開2000−242643号公報
【特許文献2】特開2005−25690号公報
【発明の開示】
【発明が解決しようとする課題】
【0010】
しかしながら、上記特許文献1、2のような従来の英文作成支援装置の場合、文書作成者によって指定された単語についての文法、フレーズ、文例などを出力するに過ぎなかった。したがって、表現したい意味に適した英文フレーズの情報が蓄積されていたとしても、文書作成者が想定しなかったり、全く知らない単語を使った英文フレーズは提供されないという問題があった。
【0011】
また、文書作成者が想定しなかった英文フレーズが検索されたとしても、複数の英文フレーズが検索された場合には、最終的に最適な英文フレーズの選択は文書作成者に委ねられてしまう。したがって、文書作成者に英語力がなければ最適な英文フレーズを選択することができないという問題があった。
【0012】
この発明は、上述した従来技術による問題点を解消するため、文書作成者の語学力に依存せずに表現したい意味に合致した外国語のフレーズを検索すると共に、作成中の文書の前後の文脈に合った外国語のフレーズを選択させることができる外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラムを提供することを目的とする。
【課題を解決するための手段】
【0013】
上述した課題を解決し、目的を達成するため、請求項1の発明にかかる外国語文書作成支援装置は、特定の外国語のテキストデータが蓄積されたデータベースを利用して前記外国語によって表現されたフレーズを検索する外国語文書作成支援装置であって、入力された前記外国語のフレーズの中の検索対象に指定された単語の関連語として前記単語の母語訳を検索する関連語検索手段と、前記関連語検索手段によって検索された関連語の前記外国語訳を検索する訳語検索手段と、前記フレーズの中の指定された前記外国語の単語を、前記訳語検索手段によって検索された外国語訳に置き換えてあらたな前記外国語のフレーズを作成する作成手段と、前記作成手段によって作成されたあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを前記データベースから検索するフレーズ検索手段と、前記フレーズ検索手段による検索結果を出力する出力手段と、を備えることを特徴とする。
【0014】
この請求項1の発明によれば、文書作成者が使ったことない外国語の単語や、表現したい母語の意味として想定していなかった外国語の単語であっても、語文書作成者が意図する意味であれば、類語表現の英文フレーズとして検索される。
【0015】
また、請求項2の発明にかかる外国語文書作成支援装置は、請求項1に記載の発明において、前記関連語検索手段は、前記外国語の単語と、当該単語から連想される母語とのデータを蓄積した母語データベースを備え、前記指定された単語の母語訳とともに、前記関連語として、前記母語データベースから前記指定された単語から連想される母語を検索することを特徴とする。
【0016】
この請求項2の発明によれば、文書作成者が入力した英単語がどのような意味の母語をあらわすかを考慮して、外国語のフレーズを検索することができる。
【0017】
また、請求項3の発明にかかる外国語文書作成支援装置は、請求項1または2に記載の発明において、前記関連語検索手段は、入力された前記外国語のフレーズの中に検索対象に指定された単語が含まれていない場合に、前記外国語のフレーズを構成する単語の品詞を解析する解析手段と、前記解析手段によって解析された前記外国語のフレーズの品詞の組み合わせに基づいて前記外国語のフレーズから検索対象となる単語を抽出する単語抽出手段と、を備えることを特徴とする。
【0018】
この請求項3の発明によれば、入力された外国語のフレーズを構成する単語の品詞に基づいて、自動的に検索対象となる単語を抽出することができる。
【0019】
また、請求項4の発明にかかる外国語文書作成支援装置は、請求項3に記載の発明において、前記解析手段は、前記外国語のフレーズを構成する単語の品詞として複数の候補が挙げられる場合に、外国語文書作成者から正しい品詞の選択を受け付ける受け付け手段を備え、前記単語抽出手段は、前記受け付け手段によって選択された品詞の組み合わせに基づいて前記外国語のフレーズから検索対象の単語を抽出することを特徴とする。
【0020】
この請求項4の発明によれば、品詞解析の結果、複数の品詞の候補が挙げられ、品詞が特定できない場合には、文書作成者の選択を受け付けることにより、正しい品詞付けをおこなうことができる。
【0021】
また、請求項5の発明にかかる外国語文書作成支援装置は、請求項1〜4のいずれか一つに記載の発明において、前記外国語による文書データの中から一部分の外国語センテンスを指定する指定手段と、前記指定手段によって指定された外国語センテンスの中から前記外国語のフレーズを抽出するフレーズ抽出手段と、を備え、前記関連語検索手段は、前記フレーズ抽出手段によって抽出された前記外国語フレーズの中の検索対象に指定された単語の関連語を検索することを特徴とする。
【0022】
この請求項5の発明によれば、文書作成者によって作成した外国語による文書データや、作成済みの外国語の文書データから任意のセンテンスに含まれたフレーズについて類似するあらたなフレーズを検索することができる。
【0023】
また、請求項6の発明にかかる外国語文書作成支援装置は、請求項1〜5のいずれか一つに記載の発明において、前記出力手段は、前記フレーズ検索手段によって検索された前記外国語のフレーズの件数を集計し、当該検索された件数が多い順に前記外国語のフレーズを表示させることを特徴とする。
【0024】
この請求項6の発明によれば、あらたな複数の外国語のフレーズが検索された場合であっても、どのフレーズの利用が最適であるかの判断基準となる情報を文書作成者に提示することができる。
【0025】
また、請求項7の発明にかかる外国語文書作成支援装置は、請求項1〜6に記載の発明において、前記データベースに蓄積された前記外国語によるテキストデータには、それぞれジャンル情報が紐付けされ、前記フレーズ検索手段は、前記入力された前記外国語のフレーズのジャンル情報を参照して、前記データベースに蓄積された前記前記外国語のフレーズと同じジャンル情報が紐付けされたテキストデータの中からあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを検索することを特徴とする。
【0026】
この請求項7の発明によれば、文書作成者が作成中の文書と同じジャンルの外国語による文書データの中からあらたなフレーズを検索することができる。
【0027】
また、請求項8の発明にかかる外国語文書作成支援方法は、特定の外国語のテキストデータが蓄積されたデータベースを利用して前記外国語によって表現されたフレーズを検索する外国語文書作成支援方法であって、入力された前記外国語のフレーズの中の検索対象に指定された単語の関連語として前記単語の母語訳を検索する関連語検索工程と、前記関連語検索工程によって検索された関連語の前記外国語訳を検索する訳語検索工程と、前記フレーズの中の指定された前記外国語の単語を、前記訳語検索工程によって検索された外国語訳に置き換えてあらたな前記外国語のフレーズを作成する作成工程と、前記作成工程によって作成されたあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを前記データベースから検索するフレーズ検索工程と、前記フレーズ検索工程による検索結果を出力する出力工程と、を含むことを特徴とする。
【0028】
この請求項8の発明によれば、文書作成者が使ったことない外国語の単語や、表現したい母語の意味として想定していなかった外国語の単語であっても、文書作成者が意図する意味であれば、類語表現のフレーズとして検索される。
【0029】
また、請求項9の発明にかかる外国語文書作成支援方法は、請求項8に記載の発明において、前記関連語検索工程は、前記外国語の単語と、当該単語から連想される母語とのデータを蓄積した母語データベースを備え、前記指定された単語の母語訳とともに、前記関連語として、前記母語データベースから前記指定された単語から連想される母語を検索することを特徴とする。
【0030】
この請求項9の発明によれば、文書作成者が入力した外国語の単語がどのような意味の母語をあらわすかを考慮して、外国語のフレーズを検索することができる。
【0031】
また、請求項10の発明にかかる外国語文書作成支援方法は、請求項8または9に記載の発明において、前記関連語検索工程にて、入力された前記外国語のフレーズの中に検索対象に指定された単語が含まれていない場合には、前記外国語のフレーズを構成する単語の品詞を解析する解析工程と、前記解析工程によって解析された前記外国語のフレーズの品詞の組み合わせに基づいて前記外国語のフレーズから検索対象となる単語を抽出する単語抽出工程と、をおこない、前記単語抽出工程によって抽出された単語に関連する母語を検索することを特徴とする。
【0032】
この請求項10の発明によれば、入力された外国語のフレーズを構成する単語の品詞に基づいて、自動的に検索対象となる単語を抽出することができる。
【0033】
また、請求項11の発明にかかる外国語文書作成支援方法は、請求項10に記載の発明において、前記解析工程にて、前記外国語のフレーズを構成する単語の品詞として複数の候補が挙げられる場合には、外国語文書作成者から正しい品詞の選択を受け付ける受け付け工程をおこない、前記単語抽出工程では、前記受け付け工程によって選択された品詞の組み合わせに基づいて前記外国語のフレーズから検索対象の単語を抽出することを特徴とする。
【0034】
この請求項11の発明によれば、品詞解析の結果、複数の品詞の候補が挙げられ、品詞が特定できない場合には、文書作成者の選択を受け付けることにより、正しい品詞付けをおこなうことができる。
【0035】
また、請求項12の発明にかかる外国語文書作成支援方法は、請求項8〜11に記載の発明において、前記外国語による文書データの中から一部分の外国語センテンスを指定する指定工程と、前記指定工程によって指定された外国語センテンスの中から前記外国語のフレーズを抽出するフレーズ抽出工程と、を含み、前記関連語検索工程は、前記フレーズ抽出工程によって抽出された前記外国語フレーズの中の検索対象に指定された単語の関連語を検索することを特徴とする。
【0036】
この請求項12の発明によれば、文書作成者によって作成した外国語による文書データや、作成済みの外国語の文書データから任意のセンテンスに含まれたフレーズについて類似するあらたなフレーズを検索することができる。
【0037】
また、請求項13にかかる外国語文書作成支援方法は、請求項8〜12に記載の発明において、前記出力工程は、前記フレーズ検索工程によって検索された前記外国語のフレーズの件数を集計し、当該検索された件数が多い順に前記外国語のフレーズを表示させることを特徴とする。
【0038】
この請求項13の発明によれば、あらたな複数の外国語のフレーズが検索された場合であっても、どのフレーズの利用が最適であるかの判断基準となる情報を文書作成者に提示することができる。
【0039】
また、請求項14にかかる外国語文書作成支援方法は、請求項8〜13に記載の発明において、前記データベースに蓄積された前記外国語によるテキストデータには、それぞれジャンル情報が紐付けされ、前記フレーズ検索工程では、前記入力された前記外国語のフレーズのジャンル情報を参照して、前記データベースに蓄積された前記前記外国語のフレーズと同じジャンル情報が紐付けされたテキストデータの中からあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを検索することを特徴とする。
【0040】
この請求項14の発明によれば、文書作成者が作成中の文書と同じジャンルの外国語による文書データの中からあらたなフレーズを検索することができる。
【0041】
また、請求項15の発明にかかる外国語文書作成支援プログラムによれば、請求項8〜14に記載の外国語文書作成支援方法をコンピュータに実行させることができる。
【発明の効果】
【0042】
本発明にかかる外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラムによれば、文書作成者の語学力に依存せずに、表現したい意味に合致した外国語のフレーズを検索すると共に、作成中の英文の前後の文脈に合った外国語のフレーズを選択させることができるという効果を奏する。
【発明を実施するための最良の形態】
【0043】
以下に添付図面を参照して、この発明にかかる外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラムの好適な実施の形態を詳細に説明する。ここでは、母語と異なる外国語による文書作成の例として、日本語を母語とする文書作成者が、英文を作成する場合について説明する。したがって、以下の実施の形態では、本発明にかかる外国語作成支援装置、外国語作成支援方法および外国語作成支援プログラムの機能を備えた、英文作成支援装置、英文作成支援方法および英文作成支援プログラムについて説明する。
【0044】
(英文作成支援装置のハードウェア構成)
まず、この発明の実施の形態にかかる英文作成支援装置のハードウェア構成について説明する。図1は、本実施の形態にかかる英文作成支援装置のハードウェア構成を示すブロック図である。図1のように、英文作成支援装置100は、CPU101と、ROM102と、RAM103と、HDD(ハードディスクドライブ)104と、HD(ハードディスク)105と、FDD(フレキシブルディスクドライブ)106と、FD(フレキシブルディスク)107と、CD−RWD(CD−RWドライブ)108と、CD−RW109と、ディスプレイ110と、キーボード111と、マウス112と、ネットワークI/F113とを含んで構成されている。なお、上記の各構成101〜113は、それぞれバス120に接続されている。また、ネットワークI/F(インターフェース)113には、NET(ネットワーク)に接続するための通信ケーブル114が備えられている。
【0045】
上述のような構成の英文作成支援装置100において、CPU101は、英文作成支援装置100全体を制御する。また、ROM102は、基本入出力プログラムや、英文作成プログラム、本実施の形態にかかる英文作成支援プログラムを記憶している。ROM102に記憶されたCPU101からの制御に応じて読み出しされ実行される。また、RAM103は、CPU101のワークエリアとして使用される。
【0046】
HDD104は、CPU101の制御にしたがってHD105に対するデータのリード/ライトを制御する。HD105は、HDD104の制御にしたがって書き込まれたデータを記憶する記憶媒体である。また、HD105に記憶されたデータは、HDD104の制御に応じて適宜読み出される。
【0047】
FDD106は、CPU101の制御にしたがってFD107に対するデータのリード/ライトを制御する。FD107は、FDD106の制御にしたがって書き込まれたデータを記憶する着脱自在の記憶媒体である。また、FD107に記録されたデータは、FDD106の制御に応じて適宜読み出される。
【0048】
CD−RWD108は、CPU101の制御にしたがってCD−RW109に対するデータのリード/ライトを制御する。CD−RW109は、CD−RWD108の制御にしたがって書き込まれたデータを記憶する着脱自在な記憶媒体である。また、CD−RW109に記録されたデータは、CD−RWD108の制御に応じて適宜読み出される。
【0049】
ディスプレイ110は、CPU101の制御によって、カーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示する。また、キーボード111は、文字、数値、各種指示などの入力のための複数のキーを備えた入力ディバイスであり、マウス112は、各種指示の選択や実行、処理対象の選択、マウスポインタの移動などをおこなうポインティングディバイスである。
【0050】
ネットワークI/F113は、通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能する。
【0051】
本実施の形態にかかる英文作成支援装置100は、上述したようなハードウェアを備えており、CPU101の制御によりROM102に記憶された英文作成支援プログラムを実行させた状態で利用される。上述したように、ROM102には、所定の英文作成プログラムが記憶されているため、英文作成時には、この英文作成プログラムが読み出され、実行される。そして、上述したような、キーボード111やマウス112を入力部として入力を受け付け、出力部として機能するディスプレイ110によって、作成した英文が表示される。
【0052】
なお、英文作成支援プログラムは上述のようにCPU101からの制御に応じて起動されてもよいが、英文作成プログラムの一部に組み込まれ、英文作成プログラムの起動がすなわち英文作成支援プログラムの起動となってもよい。また、英文作成プログラムと、英文作成支援プログラムとが異なるプログラムとして記憶されている場合であっても、英文作成プログラムが起動すると、英文作成支援プログラムが連動して起動するように設定してもよい。
【0053】
(英文作成支援装置の機能的構成)
つぎに、英文作成支援装置100によって英文作成支援処理をおこなう場合の機能的構成について説明する。図2は、本実施の形態にかかる英文作成支援装置の機能的構成を示すブロック図である。図2のように、英文作成支援装置100は、入力部201と、品詞付け処理部202と、検索クエリ作成処理部203と、検索処理部204と、出力部205とからなる機能部を備えている。
【0054】
入力部201は、英文作成者から類語表現を検索したい英文フレーズの入力を受け付ける。このとき、入力された英文フレーズは複数の英単語によって構成されているが、これらの英単語のうち、英文作成者がより適切な表現を知りたい、もしくは類語表現を知りたい英単語を検索対象の英単語として、あらかじめ設定しておいてもよい。
【0055】
また、入力部201における入力の手法としては、たとえば、図1に示したキーボード111から入力された英単語群の類語表現を検索したい英文フレーズとして受け付ける。また、マウス112によってディスプレイ110に表示されている英文データの中から一部分の英文フレーズを選択し、この英文フレーズの類語表現を検索したい英文フレーズとして受け付けてもよい。
【0056】
さらに、他の入力の手法として、作成中の英文や、指定した英文を構成するセンテンスから自動的に英文フレーズを抽出する機能を備えてもよい。そして、これら抽出された英文フレーズについて、それぞれ類語表現を検索する。なお、このとき、抽出された英文フレーズの中から、英文作成者が選択した英文フレーズに関してのみ類語表現を検索するような設定であってもよい。
【0057】
また、入力部201は、マウス112によって指定されたのが英文データの中の一部分の英文センテンスであった場合には、指定された英文センテンスの中から英文フレーズを抽出する英文抽出機能部を備えてもよい。
【0058】
品詞付け処理部202は、入力部201から入力された英文フレーズの中に検索対象に指定された英単語が含まれていない場合に、英文フレーズを構成する英単語の品詞を解析する解析処理と、解析された英文フレーズの品詞の組み合わせに基づいて、入力された英文フレーズから検索対象の英単語を抽出する抽出処理とをおこない、抽出された英単語を検索対象に指定された英単語に設定する。
【0059】
品詞付け処理部202において、検索対象となる英単語を設定するには、まず、入力部201によって受け付けた英文フレーズを構成する各英単語の品詞を解析し、この解析結果を各単語に紐付けする。このとき、英単語の種類によっては、複数の品詞を兼ねる場合があるが、英文フレーズ内の英単語の構成(係り受けなど)に基づいて、入力された英文フレーズの場合にどの品詞として用いられているかを解析する。なお、構成を参照しても英単語の品詞が解析できない場合には、英文作成者からの指示を受け付ける画面を表示させてもよい。
【0060】
さらに、品詞付け処理部202は、検索対象となる英単語を設定するため、品詞付け処理部202によって紐付けされた品詞の係り受けから、英文フレーズの中から焦点を当てる英単語(以下、「英単語A」とよぶ)を選択する。この、英単語Aが検索対象に指定された英単語となる。なお、上述したように、あらかじめ英文作成者によって検索対象に指定された英単語がある場合には、その英単語が「英単語A」となる。
【0061】
なお、以下英文フレーズを構成する英単語A以外の英単語を「英単語B」とよぶ。ここでは、英文フレーズが英単語A+英単語Bの順序で構成されていたものとして、以下説明する。
【0062】
検索クエリ作成処理部203は、英文のテキストデータが蓄積されたデータベースであるコーパスから英文フレーズのコロケーションにあった類語表現の検索をおこなうため、入力された英文フレーズに基づいて、最適な表現を検索しやすい英文フレーズ(以下、「検索クエリ」という)を作成する。検索クエリを作成するために、検索クエリ作成処理部203は、検索対象に指定された英単語Aの関連語として英単語の日本語訳を検索する関連語検索処理と、検索された関連語の英語訳を検索する訳語検索処理と、英文フレーズの中の英単語Aを、訳語検索処理によって検索された英語訳に置き換えてあらたな英文フレーズを作成する作成処理とをおこなう。
【0063】
処理の順番に説明すると、検索クエリ作成処理部203は、まず、関連語検索処理として、品詞付け処理部202によって設定された英単語Aの日本語訳を検索する。なお、関連語として検索する日本語は、日本語訳に限らず、たとえば、英単語Aを書くときに日本人がイメージする日本語であってもよい。関連語として日本語訳を検索する場合には、英和辞書データベースを検索すればよい。さらに、日本語訳以外の関連語を検索する場合には、あらかじめ、英単語Aに対して日本人がイメージしている日本語を集めた関連語データベースを用意しておき、この関連語データベースを検索すればよい。
【0064】
なお、関連語データベースを作成する際には、日本語を母語とする不特定多数の日本人の英文作成時の癖を集計してもよいし、英文作成支援装置100を利用する英文作成者が英文を書くときの個人的な癖を集計してもよい。この関連語検索処理によって検索される関連語は、関連語データベースの蓄積内容に依存するため、1種類である場合もあれば、複数種類である場合(通常複数検索される)もある。
【0065】
上述したように、関連語として日本語が検索されると、検索クエリ作成処理部203は、つぎに、訳語検索処理として、関連語の英語訳を検索する。英語訳を検索する際には、和英辞書データベースを利用する。また、関連語データベースによって複数種類の関連語が検索された場合には、各関連語の英語訳を検索する。なお、ここで検索された英語訳を以下、「英訳x」とする。
【0066】
そして、検索クエリ作成処理部203では、作成処理として、検索された英訳xと、英文フレーズを構成する英単語Bとを組み合わせてあらたな英文フレーズ「検索クエリ」を作成する。上述したように、最初に入力された英文フレーズは、「英単語A+英単語B」である。したがって、ここでは、英単語Aに代わる表現として検索された英訳xを利用する。したがって、検索クエリは「英訳x+英単語B」の構成の英文フレーズとして作成される。
【0067】
続いて、検索処理部204は、検索クエリ作成処理部203によって作成された検索クエリ「英訳x+英単語B」と同じ構成の英文フレーズをコーパスから検索する。上述したように、英訳xは、たとえば英訳x1〜英訳xnと、n(自然数)種類検索されている場合がある。このような場合には、検索クエリも「英訳x1+英単語B」、「英訳x2+英単語B」、…、「英訳xn+英単語B」と複数個作成されており、各検索クエリと同じ構成の英文フレーズが検索される。
【0068】
ここで、コーパスについて説明する。コーパスには、膨大な様々なジャンルの英文テキストデータが蓄積されている。これらのテキストデータは、英語を母語もしくはそれに準じた言語として利用している人々が作成した文章である。さらに、本発明にかかる英文作成支援装置100の場合、コーパスには、検索用のインデックスが付けられている。これらの情報が含まれていることによって、検索クエリと同じ構成の英文フレーズを効率的に検索することができる。
【0069】
上述したようなインデックスが付けられたコーパスから検索クエリと同じ構成の英文フレーズが検索される。また、コーパスに蓄積された英文テキストデータに紐付けられたンル情報を利用して、検索処理部204は、入力部201によって入力された英文フレーズと同じジャンルが紐付けされた英文テキストの中から検索クエリと同じ構成の英文フレーズを検索するようにしてもよい。
【0070】
出力部205は、検索処理部204による検索クエリの検索結果を出力する。検索クエリの検索結果は、たとえば、コーパスによる検索ヒット件数と、検索したテキストデータと、テキストデータのリンク情報とをセットにして表示させてもよい。また、検索処理部204によって検索された各検索クエリの件数を集計し、検索された件数が多い順に検索クエリを表示させてもよい。
【0071】
英文作成支援装置100を利用している英文作成者は、ディスプレイ110が出力部205として機能し、上述したような検索結果が表示される。ディスプレイ110に表示された検索クエリが入力した英文フレーズの類語表現であり、なおかつ、入力された英文フレーズよりも前後の文脈に適した表現となる。また、検索件数が多いほど、使用頻度が高い英文フレーズであることから、利用者がどの英文フレーズを選択すればよいかの判断基準となる。
【0072】
(英文表現検索処理の手順)
つぎに、図2によって説明した各機能部201〜205による英文表現検索処理の手順について説明する。図3は、英文表現検索処理の手順を示すフローチャートである。図3のフローチャートにおいて、まず、入力部201によって英文作成者から英文フレーズが入力されたか否かを判断する(ステップS301)。ここで、英文フレーズが入力されるまで待ち(ステップS301:Noのループ)、英文フレーズが入力されると(ステップS301:Yes)、品詞付け処理部202において、英文フレーズを構成する英単語の品詞を解析する(ステップS302)。
【0073】
つぎに、ステップS302によって解析された品詞に基づいて、英文フレーズから検索対象とする英単語Aを選択する(ステップS303)。英単語Aが選択されると、検索クエリ作成処理部203によって英和辞書から英単語Aの関連語を検索する(ステップS304)。さらに、検索された関連語の英訳xを検索する(ステップS305)。
【0074】
そして、検索クエリ作成処理部203では、入力部201から入力された英文フレーズの英単語A以外の英単語Bと、ステップS305によって検索された英訳xとを組み合わせて検索クエリ(英文フレーズ)を作成する(ステップS306)。
【0075】
その後、検索処理部204によって、コーパスからステップS306によって作成された検索クエリを検索する(ステップS307)。検索が終了すると、出力部205によってステップS307による検索結果が出力され(ステップS308)、一連の処理を終了する。
【0076】
以上説明したように、本実施の形態にかかる英文作成支援装置100は、英文作成者が入力した英文フレーズに対して、前後の文脈と日本人の英単語のイメージを考慮してあらたな英文フレーズ(検索クエリ)を検索する。また、検索結果にはコーパスから何件検索されたかの情報が含まれており、あらたな英文フレーズが複数検索された場合の判断基準として機能する。したがって、英文作成者は英文作成支援装置100を用いることによって、英語力に依存せずに、表現したい意味に合致した英文フレーズを検索するとともに、作成中の英文の前後の文脈に合った英文フレーズを選択することができる。
【実施例】
【0077】
つぎに、上述した英文作成支援装置100を利用して英文を作成する際の実施例について具体的に説明する。
【0078】
(英文フレーズの入力例)
英文作成者は、英文作成支援装置100に、正しいかどうか自信のない英文フレーズや、書換え表現が知りたい英文フレーズを入力するが、このとき入力の手法としては、1.キーボード111によって所定の入力エリア内に手動で入力、2.作成中の英文の中からマウス112によって英文フレーズを含んだセンテンスを指定、3.指定した英文データから抽出された英文フレーズを自動的に入力、との3つがある。
【0079】
図4は、英文フレーズの入力例を示す説明図である。1.の手法で英文フレーズを入力する場合、図4の画面例400のように、ディスプレイ110には、英文フレーズ入力領域401が設けてある。英文作成者は、キーボード111によって英文フレーズ、たとえば、「decrease staff」と入力する。
【0080】
なお、英文作成支援装置100に英文フレーズが入力されると、上述した品詞付け処理部202(図2参照)によって”decrease”は英単語A(動詞)、”staff”は英単語B(名詞)と、品詞付けがなされ、検索対象に指定された英単語か否かが判断される。
【0081】
また、英文フレーズを構成する英単語の一部がわからない、もしくは英文フレーズの一部の表現が正しいかわからない、もしくは、同じ意味をあらわす他の英単語はないかを検索したい場合には、あらかじめ検索対象となる英単語に「?」を付けて入力する。たとえば、「decrease? staff」と入力する。このような英文フレーズの入力を受け付けた場合には、自動的に”decrease”が英単語Aに設定される。
【0082】
上記2.の場合は、たとえば、英文作成支援装置100によって「The company said that flat screen TV pricing has fallen 30% in the past 3months. So it says it will decrease staff by 10% over the next 12months.」という英文を作成していたとする。
【0083】
このとき後半の「So it says it will decrease staff by 10% over the next 12months.」の中の「decrease staff」の表現が正しいか、また、類語表現はあるかを検索したい場合には、マウス112によって、英文センテンス「So it says it will decrease staff by 10% over the next 12months.」の表示範囲を選択する。このような選択の他にも、ピリオドが打たれたタイミングや、特定のキーやボタンが押されたタイミングで、本文中から英文センテンスの入力として受け付ける設定にしてもよい。
【0084】
マウス112によって英文センテンスが選択されると、品詞付け処理部202によって英文センテンスを構成するすべての英単語に自動で品詞付けがなされ、この品詞に基づいて係り受けを解析する。そしてこの解析結果を利用することにより、英文センテンスから特定の品詞パターンの英文フレーズが抽出される。
【0085】
具体的には、英文センテンス「So it says it will decrease staff by 10% over the next 12months.」が入力された場合には、「decrease staff”(動詞+名詞)」、「decrease by ○%(percent)(動詞+前置詞+単位)」、「next month(形容詞+名詞)」などが英文フレーズとして検出される可能性がある。このように、複数の英文フレーズが抽出された場合には、各英文フレーズに対してそれぞれ検索クエリ作成処理をおこなってもよいし、英文作成者からの選択を受け付けてもよい。
【0086】
また、抽出された英文フレーズを構成する英単語のうち、どの英単語を検索対象として設定するかは、特定のアルゴリズムにより決定する。たとえば、英文フレーズが「decrease(動詞) staff(名詞)」の場合、アルゴリズムにより、decreaseの方がstaffよりも間違いやすい単語と判断される。したがって、検索対象となる英単語は”decrease”となる。ただし、上述したように入力した英単語に「?」が付与されている場合であれば、「?」が付いた英単語を検索対象の英単語とする。
【0087】
上記3.の場合は、上記2.のように英文作成支援装置100によって「The company said that flat screen TV pricing has fallen 30% in the past 3months. So it says it will decrease staff by 10% over the next 12months.」という英文を作成していたとする。
【0088】
このとき、キーボード111やマウス112によって、3.の手法を選択すると、上述した英文すべてがキーボード111によって指定されたこととなり、以下、2.と同様の処理によって英文フレーズが抽出される。また、3.の場合、抽出された英文フレーズそれぞれをすべて入力してもよいが、抽出された英文フレーズの中から選択された英文フレーズのみを入力してもいい。
【0089】
(検索クエリ作成処理)
つぎに、検索クエリ作成処理部203による検索クエリの作成例について説明する。図5は、検索クエリ作成処理の概要を示す説明図である。検索クエリ作成処理部203によって、検索クエリを作成するには、英和辞書501、学習データ502および和英辞書503、それぞれのデータベースを利用する。
【0090】
まず、品詞付け処理部202によって抽出された英単語Aの関連語を検索する。関連語として、英和辞書501を利用して英単語Aの日本語訳が候補1として検索される。同時に、学習データ502を利用して英単語Aから英文作成者がイメージする日本語が候補2、3として検索される。さらに、和英辞書503を利用して、関連語の候補1〜3それぞれの英訳が検索される。図5のように、候補1から検索された英訳2〜4と、候補2から検索された英訳2〜4のように、各候補によって検索された英訳が重複することもある。
【0091】
たとえば、英単語Aが、”decrease”の場合、関連語として「候補1:減少する、候補2:減る、候補3:減らす、候補4:下げる」などが検索される。そしてこれらの関連語の英訳として、「英訳1:decline,英訳2:decay,英訳3:dent,英訳4:come down,英訳5:decrease,英訳6:bring down,英訳7:cast down」などが検索される。
【0092】
そして、上述した英訳xと英単語Bとを組み合わせることによって検索クエリが作成される。上述した英訳の場合であれば、「decline staff」,「decay staff」,「dent staff」,「come staff down」などの検索クエリが作成される。
【0093】
(コーパスを用いた検索処理例)
つぎに、コーパスを用いた検索処理について説明する。図6は、コーパスを用いた検索処理を示す説明図である。上述したように、コーパス601には、膨大な英文テキストデータが蓄積されているが、これら英文テキストデータには、さらに、下記のようなインデックス情報が付与されていてもよい。
【0094】
・各英文フレーズの出現数
・1センテンス内のコロケーション
・複数センテンスをまたいだコロケーション
・ソース(文章)のジャンル情報(ニュース、論文、製品説明など)
・ソースの中でよく使われる言葉(キーワード)
・ソースへのリンク先(ファイルの格納場所、URLなど)
【0095】
このようなコーパス601から、検索クエリと同じ構成の英文フレーズ「英単語Aの品詞+英単語B」を検索する。たとえば、検索クエリと同じ構成の英文フレーズとして「動詞 + staff」を検索した場合、検索結果として、「have staff」,「attract staff」,「gather staff」,「split staff」,「reduce staff」,「cut staff」などが検索される。
【0096】
上述したような検索処理は、検索クエリの組み合わせ(英訳xと英単語Bとの組み合わせ)ごとにおこなわれ、それぞれの検索クエリに対して、検索された英文フレーズのヒット数、前後のセンテンス、ヒットした文書の情報などが紐付けされる。
【0097】
(検索結果の出力例)
つぎに、検索結果の出力例について説明する。図7は、英文作成支援装置による英文表現検索結果の出力例を示す説明図である。図7の画面例700では、コーパス601から検索された英文表現の検索結果を表示している。
【0098】
画面例700のように、検索クエリ「英訳x+英単語B」と同じ構成の英文フレーズが、検索された場合には、それぞれの英文フレーズについて、ヒットした件数、フレーズ前後のセンテンス、ヒットしたソースの情報などが表示される。このとき、ヒット数が多い英文フレーズが優先的に表示されるように設定されている。
【0099】
また、検索結果として出力する際に、英文作成者が作成中の文書と関連性が高そうな英文テキストに含まれているフレーズを上位に表示させるように設定してもよい。たとえば、英文作成者が作成中の文書のジャンルが論文であった場合には、コーパスから検出された英文フレーズのソースとなる英文テキストのジャンル情報を参照する。そして、ジャンル情報:論文となっている英文テキストに含まれている英文フレーズが多い順に上位に表示させてもよい。
【0100】
以上説明したように、本実施の形態にかかる英文作成支援装置100では、検索対象となる英単語から関連する日本語(関連語)を検索し、この関連語の英訳を用いて検索クエリを作成する。これは、英文作成者の母語が日本語の場合、どうしても日本語的な語感で英語を書いてしまうことに着目したものである。
【0101】
したがって、日本語的な語感で書かれた英語を英和辞書や学習データのデータベースを利用して関連語を検索する。この関連語は、すなわち、英文作成者が入力した英語の元としてイメージされた日本語である。このようにして、英文作成者が意図している日本語に最も近い英単語を用いた表現を検索することができる。
【0102】
さらに、英文作成支援装置100では、膨大な英文テキストデータが蓄積されたコーパスと検索クエリとのマッチングをおこなう。このような検索処理によって、英文作成者が意図した意味を持ちつつ、実際にも使われている英語表現を検索することができる。また、検索によるヒット件数を合わせて表示させることによって、英語圏でよく使われる表現であるか否かがわかり、検索された英文フレーズの中からどの英文フレーズを利用するかの判断基準となる。
【0103】
以上説明したように、本実施の形態にかかる英文作成支援装置、英文作成支援方法および英文作成支援プログラムによれば、英文作成者の英語力に依存せずに、表現したい意味に合致した英文フレーズを検索するとともに、作成中の英文の前後の文脈に合った英文フレーズを選択させることができる。
【0104】
なお、本実施の形態で説明した英文作成支援方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。
【産業上の利用可能性】
【0105】
以上のように、本発明にかかる外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラムは、外国語文書作成者が作成する文書に用いる言語を母語としない場合に有用であり、特に、外国語文書作成者が該当言語の運用に自信のない場合の利用に適している。
【図面の簡単な説明】
【0106】
【図1】本実施の形態にかかる英文作成支援装置のハードウェア構成を示すブロック図である。
【図2】本実施の形態にかかる英文作成支援装置の機能的構成を示すブロック図である。
【図3】英文表現検索処理の手順を示すフローチャートである。
【図4】英文フレーズの入力例を示す説明図である。
【図5】検索クエリ作成処理の概要を示す説明図である。
【図6】コーパスを用いた検索処理を示す説明図である。
【図7】英文作成支援装置による英文表現検索結果の出力例を示す説明図である。
【符号の説明】
【0107】
100 英文作成支援装置
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 CD−RWD
109 CO−RW
110 ディスプレイ
111 キーボード
112 マウス
113 ネットワークI/F
114 通信ケーブル
120 バス

【特許請求の範囲】
【請求項1】
特定の外国語のテキストデータが蓄積されたデータベースを利用して前記外国語によって表現されたフレーズを検索する外国語文書作成支援装置であって、
入力された前記外国語のフレーズの中の検索対象に指定された単語の関連語として前記単語の母語訳を検索する関連語検索手段と、
前記関連語検索手段によって検索された関連語の前記外国語訳を検索する訳語検索手段と、
前記フレーズの中の指定された前記外国語の単語を、前記訳語検索手段によって検索された外国語訳に置き換えてあらたな前記外国語のフレーズを作成する作成手段と、
前記作成手段によって作成されたあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを前記データベースから検索するフレーズ検索手段と、
前記フレーズ検索手段による検索結果を出力する出力手段と、
を備えることを特徴とする外国語文書作成支援装置。
【請求項2】
前記関連語検索手段は、前記外国語の単語と、当該単語から連想される母語とのデータを蓄積した母語データベースを備え、前記指定された単語の母語訳とともに、前記関連語として、前記母語データベースから前記指定された単語から連想される母語を検索することを特徴とする請求項1に記載の外国語文書作成支援装置。
【請求項3】
前記関連語検索手段は、
入力された前記外国語のフレーズの中に検索対象に指定された単語が含まれていない場合に、前記外国語のフレーズを構成する単語の品詞を解析する解析手段と、
前記解析手段によって解析された前記外国語のフレーズの品詞の組み合わせに基づいて前記外国語のフレーズから検索対象となる単語を抽出する単語抽出手段と、
を備えることを特徴とする請求項1または2に記載の外国語文書作成支援装置。
【請求項4】
前記解析手段は、前記外国語のフレーズを構成する単語の品詞として複数の候補が挙げられる場合に、文書作成者から正しい品詞の選択を受け付ける受け付け手段を備え、
前記単語抽出手段は、前記受け付け手段によって選択された品詞の組み合わせに基づいて前記外国語のフレーズから検索対象の単語を抽出することを特徴とする請求項3に記載の外国語文書作成支援装置。
【請求項5】
前記外国語による文書データの中から一部分の外国語センテンスを指定する指定手段と、
前記指定手段によって指定された外国語センテンスの中から前記外国語のフレーズを抽出するフレーズ抽出手段と、を備え、
前記関連語検索手段は、前記フレーズ抽出手段によって抽出された前記外国語フレーズの中の検索対象に指定された単語の関連語を検索することを特徴とする請求項1〜4のいずれか一つに記載の外国語文書作成支援装置。
【請求項6】
前記出力手段は、前記フレーズ検索手段によって検索された前記外国語のフレーズの件数を集計し、当該検索された件数が多い順に前記外国語のフレーズを表示させることを特徴とする請求項1〜5のいずれか一つに記載の外国語文書作成支援装置。
【請求項7】
前記データベースに蓄積された前記外国語によるテキストデータには、それぞれジャンル情報が紐付けされ、
前記フレーズ検索手段は、前記入力された前記外国語のフレーズのジャンル情報を参照して、前記データベースに蓄積された前記前記外国語のフレーズと同じジャンル情報が紐付けされたテキストデータの中からあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを検索することを特徴とする請求項1〜6に記載の外国語文書作成支援装置。
【請求項8】
特定の外国語のテキストデータが蓄積されたデータベースを利用して前記外国語によって表現されたフレーズを検索する外国語文書作成支援方法であって、
入力された前記外国語のフレーズの中の検索対象に指定された単語の関連語として前記単語の母語訳を検索する関連語検索工程と、
前記関連語検索工程によって検索された関連語の前記外国語訳を検索する訳語検索工程と、
前記フレーズの中の指定された前記外国語の単語を、前記訳語検索工程によって検索された外国語訳に置き換えてあらたな前記外国語のフレーズを作成する作成工程と、
前記作成工程によって作成されたあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを前記データベースから検索するフレーズ検索工程と、
前記フレーズ検索工程による検索結果を出力する出力工程と、
を含むことを特徴とする外国語文書作成支援方法。
【請求項9】
前記関連語検索工程は、前記外国語の単語と、当該単語から連想される母語とのデータを蓄積した母語データベースを備え、前記指定された単語の母語訳とともに、前記関連語として、前記母語データベースから前記指定された単語から連想される母語を検索することを特徴とする請求項8に記載の外国語文書作成支援方法。
【請求項10】
前記関連語検索工程にて、入力された前記外国語のフレーズの中に検索対象に指定された単語が含まれていない場合には、
前記外国語のフレーズを構成する単語の品詞を解析する解析工程と、
前記解析工程によって解析された前記外国語のフレーズの品詞の組み合わせに基づいて前記外国語のフレーズから検索対象となる単語を抽出する単語抽出工程と、をおこない、前記単語抽出工程によって抽出された単語に関連する母語を検索することを特徴とする請求項7または8に記載の外国語文書作成支援方法。
【請求項11】
前記解析工程にて、前記外国語のフレーズを構成する単語の品詞として複数の候補が挙げられる場合には、
文書作成者から正しい品詞の選択を受け付ける受け付け工程をおこない、
前記単語抽出工程では、前記受け付け工程によって選択された品詞の組み合わせに基づいて前記外国語のフレーズから検索対象の単語を抽出することを特徴とする請求項10に記載の外国語文書作成支援方法。
【請求項12】
前記外国語による文書データの中から一部分の外国語センテンスを指定する指定工程と、
前記指定工程によって指定された外国語センテンスの中から前記外国語のフレーズを抽出するフレーズ抽出工程と、を含み、
前記関連語検索工程は、前記フレーズ抽出工程によって抽出された前記外国語フレーズの中の検索対象に指定された単語の関連語を検索することを特徴とする請求項8〜11のいずれか一つに記載の外国語文書作成支援方法。
【請求項13】
前記出力工程は、前記フレーズ検索工程によって検索された前記外国語のフレーズの件数を集計し、当該検索された件数が多い順に前記外国語のフレーズを表示させることを特徴とする請求項8〜12のいずれか一つに記載の外国語文書作成支援方法。
【請求項14】
前記データベースに蓄積された前記外国語によるテキストデータには、それぞれジャンル情報が紐付けされ、
前記フレーズ検索工程では、前記入力された前記外国語のフレーズのジャンル情報を参照して、前記データベースに蓄積された前記前記外国語のフレーズと同じジャンル情報が紐付けされたテキストデータの中からあらたな前記外国語のフレーズと同じ構成の前記外国語のフレーズを検索することを特徴とする請求項8〜13に記載の外国語文書作成支援方法。
【請求項15】
請求項8〜14のいずれか一つに記載の外国語文書作成支援方法をコンピュータに実行させることを特徴とする外国語文書作成支援プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2009−59290(P2009−59290A)
【公開日】平成21年3月19日(2009.3.19)
【国際特許分類】
【出願番号】特願2007−227839(P2007−227839)
【出願日】平成19年9月3日(2007.9.3)
【出願人】(390024350)株式会社ジャストシステム (123)
【Fターム(参考)】