説明

プログラム及び同義語生成装置

【課題】文又は節に含まれる主語と述語の組合せと同義の、接頭辞付きの単語を生成する。
【解決手段】接頭辞・述語表現対照表20は、接頭辞ごとに、接頭辞の意味を表す述語表現のリストを有する。構文意味解析部12は、対象文入力部10に入力された対象文に対して構文意味解析を実行し、主語と述語の組を抽出する。単語候補生成部14は、抽出された述語に対応する接頭辞を接頭辞・述語表現対照表20から求め、求めた各接頭辞をその主語に連結することで、主語と述語の組と同義である単語の候補を生成する。同義語判定部16は、生成された候補の中から、標準辞書22の語彙に含まれるものを選別し、これをその主語と述語の組に対応する接頭辞付き同義語として出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プログラム及び同義語生成装置に関する。
【背景技術】
【0002】
特許文献1には、テキスト中に名詞に続く丸括弧或いは名詞に続くコロン及びセミコロンがあるかどうか調べ、あった場合には、丸括弧に囲まれた部分或いはコロン及びセミコロンに続く部分を名詞の同義語として辞書に登録するシステムが開示されている。このシステムでは、この同義語表現辞書を用いて語彙対応表を作成し、この対応表を参照して入力された検索語から検索式を生成する。
【0003】
特許文献2には、単語の表記の揺れの検索への悪影響を除くために、データベースに登録する文書内の各単語の表記をあらかじめ定めた表記に統一(標準化)しておき、問合せ文についても同様の表記の標準化を行った上で、その問合せ文に合致する文書をデータベースから検索するシステムが開示されている。
【0004】
特許文献3には、主要語(検索文中の主語、動詞、目的語を一組と考えたもの)を検索キーワードとして、類似な主要語を格納した主要語関連辞書と、例文とその関連情報を格納した例文データベースを用いて、検索文に類似な例文を検索する手法が提案されている。すなわち、この文献の手法では、検索文に意味の似た文を検索している。
【0005】
特許文献4には、問合せ文に含まれる商品キーワード、動詞キーワード、職業キーワードから商品と動詞の組合せを生成し、その組合せに対応する職業名を知識ベースから検索して提示するシステムが開示されている。知識ベースには、商品と動詞の組合せに対応する職業名が登録されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開平09−073454号公報
【特許文献2】特開2002−288175号公報
【特許文献3】特開平06−012451号公報
【特許文献4】特開平10−078969号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、文又は節に含まれる主語と述語の組合せと同義の、接頭辞付きの単語を生成するためのプログラム及び装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
請求項1に係る発明は、コンピュータを、入力された文又は節から、述語とこの述語に対応する主語とを抽出する抽出手段、前記抽出手段が抽出した述語に対応する述語表現に対応する接頭辞を、あらかじめ定められた語彙における互いに対応する接頭辞と述語表現とを記憶した接頭辞・述語表現対応記憶手段から検索する検索手段、前記検索手段が検索した接頭辞を前記抽出手段が抽出した前記主語又は当該主語の同義語と連結することで、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する単語候補を作成する単語候補作成手段、前記単語候補作成手段が作成した各単語候補の中から前記語彙に含まれる単語候補を選別し、選別した単語候補を、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する同義語として出力する出力手段、として機能させるためのプログラムである。
【0009】
請求項2に係る発明は、前記コンピュータを、更に、接頭辞ごとに、前記語彙に含まれる各見出し語の語釈を表す辞書情報の中の当該接頭辞を含んだ見出し語の語釈から述語表現を抽出し、抽出した述語表現を当該接頭辞と対応づけて前記接頭辞・述語表現対応記憶手段に登録する登録手段、として機能させる請求項1に記載のプログラムである。
【0010】
請求項3に係る発明は、前記登録手段は、前記接頭辞を含んだ見出し語の語釈から抽出した述語表現の主語が、当該見出し語から当該接頭辞を除いた部分の関連語である場合にのみ、当該述語表現を当該接頭辞と対応づけて前記接頭辞・述語表現対応記憶手段に登録する、ことを特徴とする請求項2に記載のプログラムである。
【0011】
請求項4に係る発明は、入力された文又は節から、述語とこの述語に対応する主語とを抽出する抽出手段、前記抽出手段が抽出した述語に対応する述語表現に対応する接頭辞を、あらかじめ定められた語彙における互いに対応する接頭辞と述語表現とを記憶した接頭辞・述語表現対応記憶手段から検索する検索手段と、前記検索手段が検索した接頭辞を前記抽出手段が抽出した前記主語又は当該主語の同義語と連結することで、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する単語候補を作成する単語候補作成手段と、前記単語候補作成手段が作成した各単語候補の中から前記語彙に含まれる単語候補を選別し、選別した単語候補を、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する同義語として出力する出力手段と、を備える同義語生成装置である。
【発明の効果】
【0012】
請求項1又は4に係る発明によれば、文又は節に含まれる主語と述語の組合せと同義の、接頭辞付きの単語を生成することができる。
【0013】
請求項2に係る発明によれば、請求項1に係る発明の同義語生成のために用いる接頭辞・述語表現対応記憶手段の記憶情報を、辞書情報から自動生成することができる。
【0014】
請求項3に係る発明によれば、辞書情報の語釈に接頭辞と対応しない述語表現が存在しても、それが接頭辞に対応する述語表現として接頭辞・述語表現対応記憶手段に登録されることを抑制できる。
【図面の簡単な説明】
【0015】
【図1】実施形態の同義語生成装置の機能構成の一例を示す図である。
【図2】例文の構文意味解析結果を説明するための図である。
【図3】接頭辞・述語表現対照表のデータ内容の一例を示す図である。
【図4】単語候補生成部の処理手順の一例を示す図である。
【図5】接頭辞・述語表現対照表を辞書から自動生成する機構を備えた同義語生成装置の機能構成の一例を示す図である。
【図6】対照表作成部の処理手順の一例を示す図である。
【図7】辞書のデータ内容の一例を示す図である。
【図8】改良した対照表作成部を備える同義語生成装置の機能構成の一例を示す図である。
【図9】辞書のデータ内容の一例を示す図である。
【図10】改良した対照表作成部の処理の一例の主要部を示す図である。
【発明を実施するための形態】
【0016】
この実施形態は、入力された自然言語の文又は節を、同一又は類似の意味を表す接頭辞付きの単語に変換するためのシステムの一例である。ここで、「文」又は「節」といっているのは、自然言語の表現のうち、主語と述語の組合せを備えているものを総称するためである。この実施形態では、このような主語と述語の組合せから、この組合せとほぼ同等の意味を持つ接頭辞付きの単語を1以上生成する。以下の説明では、説明を簡潔にするために、文又は節のことを、文と総称する。
【0017】
述語は、日本語の場合、動詞、形容詞、形容動詞などである。接頭辞は、例えば、元の語(語幹)の意味を補強或いは変化させるために、語幹の前に付加される形態素である。
【0018】
図1に、このような処理を行う同義語生成装置の機能ブロック図を示す。図示のように、この同義語生成装置は、対象文入力部10、構文意味解析部12、単語候補生成部14、同義語判定部16、接頭辞・述語表現対照表20及び標準辞書22を備える。
【0019】
対象文入力部10は、処理対象の文(以下、対象文と呼ぶ)の入力を受け付ける。対象文は、例えばウェブページなどとして構成された入力フォーム(例えばアンケートフォームなど)内の自由記述欄などに入力された文字列データ、或いは定型用紙の記入欄の記入内容を光学文字認識技術などにより文字列データ変換したもの、などである。例えば、アンケート集計のシステムに、この同義語生成装置を組み込む場合、対象文入力部10は、アンケート集計システムから、対象文を含んだ同義語生成依頼を受け取る。
【0020】
構文意味解析部12は、入力された対象文に対して、公知の構文意味解析を実行する。この構文意味解析は、対象文の中から主語と述語の対応関係を見出すために行う。したがって、主語と述語の対応関係を見出すことができるものであれば、既存のどのような構文意味解析又は構文解析の手法を用いてもよい。具体的な構文意味解析の方法としては、特にこれに限定されるものではないが、例えば河原大輔 、黒橋禎夫「自動構築した大規模格フレームに基づく構文・格解析の統合的確率モデル」,自然言語処理,14(4),2007,p.67-p.81 にて提案された方法を用いることができる。
【0021】
図2に、例文「このデジカメは解像度がとても悪いんです。」が対象文として与えられた場合の、構文意味解析の結果を示す。この例では、文全体の主辞として「悪い」が検出され、これに対応する主語として「解像度」が検出されている。この例の文の主辞「悪い」は、述語に該当する。なお、図2の例では、主辞・主語・修飾成分からなる文全体の構造の中に、更に個々の成分の内部構造が分析されており、その内部構造の中にも主辞は存在するが、これらの内部構造の中の主辞は、この例文では述語表現に該当しない。したがって、この例文からは、述語「悪い」とそれに対応する主語「解像度」が抽出されることとなる。
【0022】
なお、対象文の中に主語とこれに対応する述語との組が複数存在する場合、構文意味解析部12は、それら組を全て見つけ出す。また構文意味解析部12が見つけ出す主語と述語の組合せは、その対象文全体についての主語と述語の組合せだけでなく、その対象文の中に含まれる節や句における主語と述語の組合せも含まれ得る。
【0023】
単語候補生成部14は、構文意味解析部12の解析結果を受けて、この解析結果の中に主語と述語との組合せが存在すれば、その組合せに対応する意味を持つ接頭辞付き単語の候補を生成する。この生成処理のために、単語候補生成部14は、接頭辞・述語表現対照表20を参照する。
【0024】
接頭辞・述語表現対照表20は、接頭辞と、この接頭辞に対応する述語表現と、の対応関係を表すデータである。接頭辞・述語表現対照表20のデータ内容の一例を図3に示す。図3には、例として「低」及び「短」という接頭辞について、その意味を表す述語表現のリストを示した。例えば、「低」という接頭辞は、「低い」、「悪い」、「小さい」、「劣る」などの述語表現の表す意味を持つ。このような接頭辞・述語表現対照表20は、あらかじめ作成しておく。なお、接頭辞・述語表現対照表20は、後で例示するように自動作成することもできる。
【0025】
単語候補生成部14が実行する単語候補の生成処理の手順の一例を図4に示す。この例では、まず単語候補生成部14は、構文意味解析部12の解析結果(例えば図2参照)の中から、述語Vを取得する(S102)。解析結果に述語が複数ある場合は、個々の述語ごとに図4の処理を実行してもよい。
【0026】
次に、単語候補生成部14は、取得した述語Vが接頭辞・述語表現対照表20内の各接頭辞の対応述語表現リストに含まれるかどうかを調べる(S104)。含まれるかどうかの判定は、その述語Vそのもの(又は活用している場合はその基準形、例えば原形)が接頭辞・述語表現対照表20にあるかどうかで判定してもよいし、シソーラス等を用いて述語Vの類義語まで範囲を広げて、その類義語の範囲に該当する述語表現が接頭辞・述語表現対照表20にあるかどうかで判定してもよい。
【0027】
S104で述語Vに対応する述語表現が接頭辞・述語表現対照表20内に登録されていないことが判明した場合、単語候補生成部14は、候補を生成せずに処理を終了する。
【0028】
述語Vに対応する述語表現が接頭辞・述語表現対照表20内に登録されている場合、単語候補生成部14は、接頭辞・述語表現対照表20から、その述語Vに対応する述語表現に対応する接頭辞をすべて抽出する(S106)。抽出された接頭辞のリストP0..nを接頭辞候補リストと呼ぶ。なお、ここでnはS106で抽出された接頭辞の総数である。すなわち、接頭辞候補リストP0..nは、抽出された接頭辞Pi(iは0から(n−1)までの整数)のリストである。
【0029】
また、単語候補生成部14は、構文意味解析部12の解析結果の中に、S102で取得した述語Vに対応する主語Sがあるかどうかを判定する(S108)。対応する主語Sがない場合、単語候補生成部14は、候補を生成せずに処理を終了する。
【0030】
また、述語Vに対応する主語Sが存在する場合は、S106で取得した接頭辞候補リストP0..n内の各接頭辞Piについて、S110の処理を繰り返す(ループ処理)。S110では、当該接頭辞Piをその主語Sと連結する(すなわち主語Sの前に接頭辞Piを付ける)ことで、単語候補Wiを生成する。このような処理により、接頭辞候補リストP0..n内の接頭辞の数と同じ数の単語候補Wiからなる単語候補リストWi..nが生成されることになる。生成された単語候補リストは、単語候補生成部14の処理結果として出力される(S112)。
【0031】
なお、S110では、接頭辞Piを主語Sと連結したものだけでなく、その主語Sの同義語と連結したものも単語候補として生成してもよい。主語Sの同義語は、あらかじめ用意した同義語辞書から求めればよい。
【0032】
また、S110では、接頭辞Piを主語Sと連結したものではなく、接頭辞Piをその主語Sのあらかじめ定められた同義語と連結したものを単語候補として生成してもよい。これは、例えば、対象文の中の主語(名詞)を、同義語の中の特定の名詞に揃える必要がある場合などに行うことが考えられる。例えば、デジタルカメラに関するアンケートに対する回答に「ピクセル数が少ない」という対象文があり、それをあらかじめ用意された選択肢「低画質」に当てはめる場合には、「ピクセル数」(或いは「解像度」)が、標準的な名詞「画質」の(デジタルカメラ分野、或いはこのアンケートの中での)同義語であるとの事前情報(同義語辞書)を用意しておく。そして、S110では、その対象文中の主語「ピクセル数」の同義語である標準名詞「解像度」に対し、述語「少ない」に対応する接頭辞「少」、「低」、「省」などを組み合わせた単語候補「少画質」、「低画質」、「省画質」などを生成する。
【0033】
以上のようにして単語候補生成部14が、対象文中の主語と述語の組と同義である可能性のある単語候補を生成すると、同義語判定部16(図1参照)が、それら単語候補の中から、語彙として妥当なものを判定する。
【0034】
すなわち、単語候補は、単に対象文中の述語に対応する接頭辞を単にその述語の主語(又はその同義語)に連結しただけのものなので、通常用いられないようなものも含まれ得る(例えば上述の例では「少画質」や「省画質」)。そこで、同義語判定部16が、標準的な語彙を収録した標準辞書22を参照することで、それら各単語候補の中から標準辞書22の語彙に含まれるもののみを選び出し、選ばれたものを、対象文中の主語と述語の組合せに対応する接頭辞付きの同義語と判定する。例えば、「少画質」、「低画質」、「省画質」のうち、標準辞書22から妥当な語彙と判定される「低画質」のみが、対象文中の主語と述語の組の同義語と判定されることになる。
【0035】
標準辞書22としては、一般的な国語辞書を用いてもよいし、当該同義語生成装置の利用目的に適合した専門用語辞書(例えば、デジタルカメラ分野のアンケートを処理する場合は、デジタルカメラ用語辞典)を用いてもよい。また、同義語判定部16の目的だけからすれば、標準辞書22は、語彙を構成する単語からなる単なるリストであってもよい(すなわち各単語の語釈はなくてもよい)。
【0036】
また、標準辞書22として既成の辞書データを用いる代わりに、インターネット等のネットワーク上の文書(例えばウェブページ)群を用いてもよい。すなわち、ネットワーク上から収集されたそれら文書群から抽出した検索情報を標準辞書22として用いるのである。この場合、標準辞書22は、Google(登録商標)などの検索エンジンの機能を備えており、ネットワーク上の文書(ウェブページ)群から生成したインデックス情報を有する。そして、同義語判定部16から問い合わせられた各単語候補をそのインデックス情報の中から検索し、各単語候補の検索ヒット数を返す。同義語判定部16は、検索ヒット数に対する閾値判定を行い、あらかじめ設定した閾値以上の検索ヒット数を持つ単語候補を、語彙に含まれる妥当な単語候補(すなわち求めるべき同義語)と判定する。
【0037】
以上のようにして同義語判定部16が求めた同義語は、処理結果としてユーザに提示してもよいし、処理結果データとして(例えば元になった主語と述語の組合せと対応づけて)記憶装置に記憶してもよい。またその処理結果の同義語を、例えば、当該同義語生成装置に同義語生成を依頼した上位システム(上述の例ではアンケート集計システム)に返し、上位システムがどの同義語データを利用して処理を進めるようにしてもよい。
【0038】
次に、図5を参照して変形例を説明する。この変形例の同義語生成装置は、図1に示した装置の構成要素の他に、対照表作成部24と接頭辞リスト26とを含む。
【0039】
対照表作成部24は、既存の辞書を利用して、接頭辞・述語表現対照表20のエントリを生成する。用いる辞書は、見出し語とそれに対応する語釈(見出し語の意味の説明文)の組が多数登録されたものである。図5の例では、対照表作成部24は、そのような辞書として、単語候補の語彙としての妥当性の判定基準とする標準辞書22を利用している。ただし、これは一例に過ぎず、対照表作成部24が利用する辞書は、標準辞書22以外でもよい。また、対照表作成部24が利用する辞書は、同義語生成装置の適用分野に応じた専門辞書であってもよい。
【0040】
接頭辞リスト26は、語彙に含まれる接頭辞を列挙したリストである。接頭辞リスト26としては、例えば、浅原正幸 、松本裕治による「IPADICユーザーズマニュアルver2.5.1」に含まれる辞書を用いてもよい。
【0041】
対照表作成部24が実行する処理の手順の例を図6に示す。この例では、対照表作成部24は、接頭辞リスト26に登録されたn個の接頭辞から順に1つずつ順に接頭辞Prefi(iは接頭辞の番号を表す0〜(n−1)の整数)を取得し(S202)、取得した各接頭辞についてステップS204及びS206の処理を実行する。S204では、その接頭辞Prefiを含む見出し語を辞書(図5の例では標準辞書22)から見つけ出し、見つけ出した見出し語に対応する語釈文を取得する(S204)。一般的にはある接頭辞を含んだ見出し語は多数存在するので、それら多数の見出し語のそれぞれについて、語釈文を取得する。次に、その語釈文の中から述語表現(例えば、動詞、形容詞、形容動詞に該当するもの)を抽出し、抽出した述語表現を、当該接頭辞Prefiに対応する述語表現として接頭辞・述語表現対照表20に登録する(S206)。以上の処理を、接頭辞リスト26内の各接頭辞について実行する。
【0042】
例えば、接頭辞「低」を含んだ見出し語と語釈文として、図7に例示したものが標準辞書22に登録されていたとする。図では、分かりやすくするために、述語表現に下線を付している。この場合、S206の処理では、例えば、見出し語「低気圧」から述語表現「低い」が、見出し語「低下」から述語表現「悪い」が、見出し語「低級」から述語表現「劣る」がそれぞれ抽出され、接頭辞・述語表現対照表20における接頭辞「低」に対応する述語表現リストに追加される。
【0043】
このように、対照表作成部24は、既存の辞書データから、接頭辞に対応する述語表現を自動的に抽出して接頭辞・述語表現対照表20を作成する。
【0044】
次に、図8〜図10を参照して、対照表作成部24の処理を改良した例を説明する。
【0045】
図5及び図6の例では、対照表作成部24は、接頭辞を含んだ見出し語の語釈から単に述語表現を抽出していたが、語釈の内容によっては、語釈に含まれている述語表現であっても接頭辞の意味と直接関連しない場合がある。例えば、辞書データの中に、接頭辞「低」を含んだ見出し語「低アルコール飲料」に対する語釈として、図9に例示されるように「アルコール飲料のうち,比較的アルコール分が低いもの。一般に10 %未満の飲料を指すことが多い。」という文が登録されていたとする。この語釈文には、述語として「低い」と「多い」が含まれている。しかし、述語「多い」は、主語「こと」についての述語であり、アルコール飲料について言及しているものではないので、「アルコール飲料」を修飾する接頭辞「低」を言い換える述語表現としては不適格である。そこで、図8に例示する対照表作成部24aは、語釈に含まれる述語表現のうち不適格なものを除外する処理を行う。この除外のための処理の一例を、図10に示す。図10に示す手順は、図6のS206の手順をより精密化したものである。
【0046】
図10の手順では、対照表作成部24aは、S204(図6参照)で取得した見出し語を、接頭辞部分Pと、接頭辞を除いた残余部分Wとに分割する(S2060)。その見出し語に対応する語釈文(S204で取得済)を構文意味解析部12に解析させ(S2062)、その解析結果から、その語釈文中の主語Sと述語Vの組合せ(ペア)を全て抽出する(S2064)。そして、組合せごとに、その組合せに含まれる主語Sと、S2060で求めた残余部分Wとが関連語であるかどうかを概念辞書28に問い合わせる(S2066)。
【0047】
概念辞書28は、単語の概念的な分類又は単語間の概念上の関連などを表す辞書データである。概念辞書28としては、既存のもの(例えばシソーラス)を用いればよい。概念辞書28への問合せにより、主語Sと残余部分Wとが関連語(関連のある語のこと)であるかどうかが判明する。なお、同一語も関連語の一種と考える。すなわち、主語Sと残余部分Wとがまったく同一の語である場合も、ここでは両者は関連語であるとする。
【0048】
対照表作成部24aは、S2066の問合せ結果に基づき、主語Sが残余部分Wの関連語であるかどうかを判定し(S2067)、関連語であれば、その主語Sに対応する述語Vを、現在注目している接頭辞(S202で取得したもの)に対応する述語表現として、接頭辞・述語表現対照表20に登録する(S2068)。一方、S2067で、関連語でないと判定した場合、その主語Sに対応する述語Vは、注目している接頭辞に対応する述語表現としては登録しない(すなわちS2068はスキップする)。
【0049】
以上の処理により、対照表作成部24aが参照する標準辞書22の語釈文に、接頭辞が修飾している語(残余部分W)とは異なる主語の状態や動作などを表す述語があっても、それが接頭辞に対応する述語表現として採用されることがなくなる。
【0050】
以上、本発明に係る同義語生成装置の実施形態や変形例を説明した。説明に用いた機能ブロック図やフローチャートは、実施形態や変形例の装置の機能構成や処理手順の一例を示すものに過ぎない。同様の機能を実現するのに他の機能構成や処理手順を採用してももちろんよい。
【0051】
以上に説明した同義語生成装置は、例えば、アンケート集計システムから自由記入の文章の入力を受け、その文章が示す概念を、あらかじめ選定したアンケートの選択肢に対応づける等の用途で利用できる。この用例では、文章から抽出された主語と述語に対応して単語候補生成部14が生成した接頭辞付きの同義単語の候補のうち、アンケートの選択肢に該当する候補を同義語と判定してもよい。また、別の例として、文書の内容を表すキーワード又はキーワード候補を自動生成するのにこの同義語生成装置を用いてもよい。この場合、文書中の文章を同義語生成装置に入力し、その文章に含まれる主語と述語のペアに対応する接頭辞付き同義語をキーワード又はキーワード候補として生成させればよい。
【0052】
以上に例示した同義語生成装置は、典型的には、汎用のコンピュータに上述の機能を記述したプログラムを実行させることにより実現される。コンピュータは、例えば、ハードウエアとして、CPU等のマイクロプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、例えばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のマイクロプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。なお、それら機能モジュール群のうちの一部又は全部を、専用LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit、特定用途向け集積回路)又はFPGA(Field Programmable Gate Array)等のハードウエア回路として構成してもよい。
【符号の説明】
【0053】
10 対象文入力部、12 構文意味解析部、14 単語候補生成部、16 同義語判定部、20 接頭辞・述語表現対照表、22 標準辞書。


【特許請求の範囲】
【請求項1】
コンピュータを、
入力された文又は節から、述語とこの述語に対応する主語とを抽出する抽出手段、
前記抽出手段が抽出した述語に対応する述語表現に対応する接頭辞を、あらかじめ定められた語彙における互いに対応する接頭辞と述語表現とを記憶した接頭辞・述語表現対応記憶手段から検索する検索手段、
前記検索手段が検索した接頭辞を前記抽出手段が抽出した前記主語又は当該主語の同義語と連結することで、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する単語候補を作成する単語候補作成手段、
前記単語候補作成手段が作成した各単語候補の中から前記語彙に含まれる単語候補を選別し、選別した単語候補を、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する同義語として出力する出力手段、
として機能させるためのプログラム。
【請求項2】
前記コンピュータを、更に、
接頭辞ごとに、前記語彙に含まれる各見出し語の語釈を表す辞書情報の中の当該接頭辞を含んだ見出し語の語釈から述語表現を抽出し、抽出した述語表現を当該接頭辞と対応づけて前記接頭辞・述語表現対応記憶手段に登録する登録手段、
として機能させる請求項1に記載のプログラム。
【請求項3】
前記登録手段は、前記接頭辞を含んだ見出し語の語釈から抽出した述語表現の主語が、当該見出し語から当該接頭辞を除いた部分の関連語である場合にのみ、当該述語表現を当該接頭辞と対応づけて前記接頭辞・述語表現対応記憶手段に登録する、ことを特徴とする請求項2に記載のプログラム。
【請求項4】
入力された文又は節から、述語とこの述語に対応する主語とを抽出する抽出手段、
前記抽出手段が抽出した述語に対応する述語表現に対応する接頭辞を、あらかじめ定められた語彙における互いに対応する接頭辞と述語表現とを記憶した接頭辞・述語表現対応記憶手段から検索する検索手段と、
前記検索手段が検索した接頭辞を前記抽出手段が抽出した前記主語又は当該主語の同義語と連結することで、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する単語候補を作成する単語候補作成手段と、
前記単語候補作成手段が作成した各単語候補の中から前記語彙に含まれる単語候補を選別し、選別した単語候補を、前記抽出手段が抽出した述語とこの述語に対応する主語との組合せに対応する同義語として出力する出力手段と、
を備える同義語生成装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate