回答検索装置、方法、及びプログラム

【課題】ユーザの入力単語の理解を支援することができる。
【解決手段】回答検索装置は、クラス抽出部、単語検索部、構文パターン格納部、テンプレート生成部、及び比喩表現検索部を含む。クラス抽出部は、入力された第１単語の分類を示すクラスを抽出する。単語検索部は、第１単語と異なり、かつ、クラスと同一のクラスに属する第２単語を検索する。構文パターン格納部は、第１単語、少なくとも１つの第２単語、および第２単語を形容する任意の文字列を当てはめて第１単語を比喩する比喩表現において、第１単語、第２単語、および任意の文字列が不定である構文パターンを格納する。テンプレート生成部は、構文パターンに第１単語と第２単語とを当てはめて任意の文字列が不定である比喩表現テンプレートを生成する。比喩表現検索部は、比喩表現テンプレートと一致する文字列をテキストデータから検索して、比喩表現として取得する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明の実施形態は、回答を検索する回答検索装置、方法、及びプログラムに関する。
【背景技術】
【０００２】
近年、Ｗｅｂ検索システムの普及に伴い、ユーザが知りたい単語の情報をＷｅｂ上から検索することが一般的となっている。しかし、こうした検索システムの多くは、ユーザが入力したキーワードが文章中に含まれるかどうかによって検索を行っている。そのため、ユーザが得たい情報を的確に、かつユーザに対して分かりやすく情報提示することが難しい。
提示手法としては、例えば、ユーザからの質問に対して、その質問の意味的または概念的な周辺概念を用いて質問に回答する手法がある。具体的には、ユーザが「大統領とは何か？」という質問をした場合に、概念的な周辺概念である語「王様」を用いて、「王様みたいなもの」という回答を行う。
【先行技術文献】
【特許文献】
【０００３】
【特許文献１】特開２００８−２０４１３３号公報
【発明の概要】
【発明が解決しようとする課題】
【０００４】
しかしながら、上述の提示手法は、質問された単語を主格とした場合、用言と目的格名詞とのパターンを用いて周辺概念の語を選定する。そのため、質問された単語が固有名詞の場合には、ユーザに誤ったイメージを持たせる回答となりえる。
例えば、日本人ユーザが知らない外国人ロック歌手Ａについて質問した場合、「外国人ロック歌手Ａは新曲を歌う」のような用言および目的格名詞のパターンが考えられる。このとき、上述の手法では「新曲を歌う」の主格となる外国人ロック歌手Ａ以外の名詞を探し出し、回答を生成する。もし、「日本人演歌歌手Ｂは新曲を歌う」という表現が存在した場合、質問中の名詞や回答に使用する名詞の詳細な特徴を考慮することが出来ないため、「外国人ロック歌手Ａは日本人演歌歌手Ｂみたいなもの」や「新曲を歌うという意味で外国人ロック歌手Ａは日本人演歌歌手Ｂみたいなもの」といった回答をすることになる。このような回答により、ユーザが知りたい単語について誤ったイメージを持ってしまう可能性がある。
【０００５】
本開示は、上述の課題を解決するためになされたものであり、ユーザの単語理解を支援することができる回答検索装置、方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【０００６】
本実施形態に係る回答検索装置は、クラス抽出部、単語検索部、構文パターン格納部、テンプレート生成部、及び比喩表現検索部を含む。クラス抽出部は、入力された第１単語の分類を示すクラスを抽出する。単語検索部は、前記第１単語と異なり、かつ、前記クラスと同一のクラスに属する第２単語を検索する。構文パターン格納部は、前記第１単語、少なくとも１つの前記第２単語、および該第２単語を形容する任意の文字列を当てはめて前記第１単語を比喩する比喩表現において、該第１単語、該第２単語、および該任意の文字列が不定である構文パターンを格納する。テンプレート生成部は、前記構文パターンに前記第１単語と前記第２単語とを当てはめて前記任意の文字列が不定である比喩表現テンプレートを生成する。比喩表現検索部は、前記比喩表現テンプレートと一致する文字列をテキストデータから検索して、比喩表現として取得する。
【図面の簡単な説明】
【０００７】
【図１】第１の実施形態に係る回答検索装置を示すブロック図。
【図２】第１の実施形態に係る単語意味クラス辞書の一例を示す図。
【図３】単語意味クラス抽出部の動作を示すフローチャート。
【図４】単語検索結果の一例を示す図。
【図５】構文パターン格納部に格納される構文パターンの一例を示す図。
【図６】比喩表現テンプレートの一例を示す図。
【図７】テキストデータ格納部に格納されるテキストデータの一例を示す図。
【図８】比喩表現検索部の動作を示すフローチャート。
【図９】比喩表現出力部の一例を示す図。
【図１０】構文パターンの別例を示す図。
【図１１】第２の実施形態に係る単語意味クラス辞書の一例を示す図。
【図１２】第２の実施形態に係る単語検索部の動作を示すフローチャート。
【図１３】第２の実施形態に係る構文パターンを示す図。
【図１４】第３の実施形態に係る回答検索装置を示すブロック図。
【図１５】自然性判定部の動作を示すフローチャート。
【図１６】評判表現の一例を示す図。
【図１７】評判情報ベクトルの一例を示す図。
【図１８】第４の実施形態に係る回答検索装置を示すブロック図。
【図１９】情報推薦部における情報推薦の一例を示す図。
【図２０】興味情報の一例を示す図。
【図２１】興味情報を用いた場合の情報推薦の一例を示す図。
【図２２】興味情報を用いた場合の情報推薦の別例を示す図。
【発明を実施するための形態】
【０００８】
以下、図面を参照しながら本実施形態に係る回答検索装置、方法、及びプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
（第１の実施形態）
本実施形態に係る回答検索装置について図１のブロック図を参照して説明する。
本実施形態に係る回答検索装置１００は、単語意味クラス抽出部１０１、単語意味クラス辞書格納部１０２、単語検索部１０３、構文パターン格納部１０４、比喩表現テンプレート生成部１０５、テキストデータ格納部１０６、比喩表現検索部１０７、および比喩表現出力部１０８を含む。
【０００９】
単語意味クラス抽出部１０１は、ユーザから入力された単語（以下、入力単語ともいう）を受け取り、後述の単語意味クラス辞書格納部１０２を参照して、入力単語と一致する単語のクラスを抽出する。クラスは、単語の分類であり、例えば、ロック歌手名、野球選手名、地名、駅名などが挙げられる。
また、ユーザによる入力単語の入力方法としては、例えば、キーボードにより入力したり、マウス操作により文字列を選択したりする方法が挙げられる。なお、入力単語は、ユーザによる直接入力に限られない。例えば、ユーザがＷｅｂを閲覧中にＷｅｂページタイトル中の名詞を自動で入力単語としたり、オンラインショップを閲覧中に商品情報（商品名、作者名など）を自動で入力単語とする手法でもよい。単語意味クラス抽出部１０１の動作については図３を参照して後述する。
【００１０】
単語意味クラス辞書格納部１０２は、単語とクラスとを含む単語意味クラス辞書を格納する。単語意味クラス辞書格納部１０２については、図２を参照して後述する。
単語検索部１０３は、単語意味クラス抽出部１０１から入力単語と入力単語のクラスとを受け取り、入力単語のクラスと同一のクラスを有する単語を単語意味クラス辞書格納部１０２から全て抽出し、単語検索結果を生成する。
【００１１】
構文パターン格納部１０４は、構文パターンと制約条件とを対応付けて１以上格納する。構文パターンは、入力単語、少なくとも１つの単語検索結果の単語、および単語検索結果の単語を形容する任意の文字列を当てはめて第２単語を比喩する比喩表現において、入力単語、単語検索結果の単語、および任意の文字列が不定である構文を示す。制約条件は、構文パターンに当てはめる文字数と単語数との制限を示す。構文パターン格納部１０４については、図５を参照して後述する。
比喩表現テンプレート生成部１０５は、外部から入力単語を、単語検索部１０３で抽出された単語検索結果を、構文パターン格納部１０４から構文パターンをそれぞれ受け取り、比喩表現テンプレートを生成する。比喩表現テンプレートは、構文パターンに入力単語と単語検索結果の単語とを当てはめたテンプレートである。つまり、構文パターンに当てはめる文字列の中で、単語検索結果の単語を形容する任意の文字列だけ不定である。比喩表現テンプレート生成部１０５については、図６を参照して後述する。
【００１２】
テキストデータ格納部１０６は、任意の文書群から抽出したテキストデータを格納する。テキストデータの収集には、さまざまな方法が考えられるが、第１の実施形態では、インターネットを利用してテキストデータを収集する。まず始めに、ニュースサイトやブログサイトなどの頻繁にサイト中のテキストが更新されるサイトのＵＲＬをリストとして保持しておく。これらのＵＲＬは予め手動でリストを作成しておいてもよい。次に、定期的に、例えば、毎日、予め定めた時刻にリストにあるＵＲＬのサイト上のテキストを取得し、取得したテキストをテキストデータベースに保存する。テキストデータ格納部１０６の詳細については図７を参照して後述する。
【００１３】
比喩表現検索部１０７は、比喩表現テンプレート生成部１０５から比喩表現テンプレートを受け取り、テキストデータ格納部１０６から比喩表現テンプレートと一致する文字列であって、かつ比喩表現テンプレートに用いた構文パターンの制約条件を満たす文字列を検索し、一致する文字列があれば比喩表現として取得する。比喩表現検索部１０７の動作については、図８を参照して後述する。
比喩表現出力部１０８は、比喩表現検索部１０７から比喩表現を受け取り、外部に出力する。比喩表現出力部１０８については、図９を参照して後述する。
【００１４】
次に、単語意味クラス辞書格納部１０２に格納される対応表の一例について図２を参照して説明する。
単語意味クラス辞書格納部１０２は、単語２０１およびクラス２０２を対応付けた単語意味クラス辞書を格納する。具体的には、例えば単語２０１「日本人歌手Ａ」、クラス「ロック歌手名」が対応付けられて格納される。なお、以下では、ある単語についてクラスが対応付けられたデータを単語レコード２０３と呼ぶ。
【００１５】
次に、単語意味クラス抽出部１０１の動作について図３のフローチャートを参照して説明する。
ステップＳ３０１では、入力単語を受け取る。
ステップＳ３０２では、Ｎ＝１と設定する。
ステップＳ３０３では、単語意味クラス辞書格納部１０２を参照して、Ｎ番目の単語レコードを取得する。すなわち、最初は１番目の単語レコードを取得することになる。
【００１６】
ステップＳ３０４では、単語レコードの単語が入力単語と同一であるかどうかを判定する。単語が同一であればステップＳ３０８に進み、単語が同一でなければステップＳ３０５へ進む。
ステップＳ３０５では、Ｎ＋１番目の単語レコードがあるかどうかを判定する。単語レコードがなければステップＳ３０７へ進み、単語レコードがあればステップＳ３０６へ進む。
ステップＳ３０６では、Ｎ＋１番目を新たなＮと設定して、ステップＳ３０３へ戻り、同様の処理を繰り返す。すなわち、入力単語と同一の単語が単語レコードに存在するか、新たな単語レコードが存在しなくなるまでステップＳ３０３からステップＳ３０５までの処理を繰り返す。
【００１７】
ステップＳ３０７では、新たな単語レコードが存在しないため、推定結果を「なし」として処理を終了する。
ステップＳ３０８では、単語レコードのクラスを入力単語のクラスとして出力する。
ここで具体例を挙げて説明する。例えば、入力単語として「外国人歌手Ｇ」が入力された場合は、単語意味クラス辞書格納部１０２を参照する。その後、入力単語の「外国人歌手Ｇ」と単語レコードの単語「外国人歌手Ｇ」とが同一であるので、この単語レコードのクラス「ロック歌手名」が入力単語のクラスとして出力される。以上で単語意味クラス抽出部１０１の動作を終了する。
【００１８】
次に、単語検索部１０３において検索された単語検索結果の一例について図４を参照して説明する。
単語検索部１０３では、単語意味クラス抽出部１０１で推定されたクラスと同一のクラスを有する単語レコードを、単語意味クラス辞書格納部１０２から検索し、一致した単語レコードの単語を全て抽出して単語検索結果を生成する。具体的には、図２を参照すると、単語検索部１０３はクラス「ロック歌手名」である単語レコード２０３の単語２０１を検索し、同一のクラス２０２「ロック歌手名」を有する単語２０１「日本人歌手Ａ」、「日本人歌手Ｕ」などを抽出する。結果として、図４に示すような単語検索結果４０１を生成する。
【００１９】
次に、構文パターン格納部１０４に格納される構文パターンの一例について図５を参照して説明する。
構文パターン格納部１０４には、構文パターン５０１、制約条件５０２が対応付けられて格納される。構文パターン５０１の「○○」には入力単語が、「××」には単語検索結果の単語を形容する任意の文字列が、「△△」には単語検索結果の単語がそれぞれ当てはめられる。制約条件５０２は、ここでは、構文パターン５０１の「××」に当てはめる文字列の、許容される最大文字数Ｍおよび／または最大単語数Ｔを示す。具体的には、図５に示すように、構文パターン５０１「○○は××の△△」、制約条件５０２「１０文字以内および５単語以内」がそれぞれ対応付けられる。なお、制約条件として、単語を形容する文字列の制約ではなく、比喩表現テンプレートの全体の文字数について、最大文字数および最大単語数の制約を設けてもよい。
【００２０】
次に、比喩表現テンプレート生成部１０５で生成される比喩表現テンプレートの一例について図６を参照して説明する。
比喩表現テンプレートは、比喩表現テンプレート生成部１０５が、図５に示す構文パターン５０１に入力単語と単語検索結果の単語とを当てはめることで生成される。例えば、入力単語が「外国人歌手Ｇ」、これと同一クラスの単語検索結果の単語が図４に示すような「日本人歌手Ａ」であった場合を想定する。この場合、構文パターン５０１「○○は××の△△」の「○○」と「△△」とにそれぞれ「外国人歌手Ｇ」と「日本人歌手Ａ」とが当てはめられて、比喩表現テンプレート６０１「外国人歌手Ｇは××の日本人歌手Ａ」が生成される。
なお、構文パターンまたは単語検索結果が複数存在する可能性があるため、それらを用いて生成される比喩表現テンプレートも複数生成されてもよい。例えば、構文パターンが２つ存在し、かつ単語検索結果として単語が３つ存在した場合は、２×３＝６通りの比喩表現テンプレートが生成されることになる。
【００２１】
次に、テキストデータ格納部１０６に格納されるテキストデータの一例について図７を参照して説明する。
テキストデータ格納部１０６には、テキスト取得元のサイトＵＲＬと取得日時をファイル名にもつファイル７０１とによって構成される。各ファイル７０１には、ファイル名に記された日時にファイル名に記されたＵＲＬのサイトから取得したテキストが記憶される。各ファイルに記憶されるテキストは、形態素解析を行い、単語に分かち書きされる。ただし、必ずしも形態素解析を行う必要はなく、テキストを分かち書きされた状態にし、テキストの単語数を数えることが可能な状態にすることができればよい。なお、単語数を数えることが可能な状態のテキストがあれば、テキストデータ格納部１０６に格納せず、直接外部のデータを参照してもよい。また、分かち書きが不可能な場合は、図５の制約条件５０２は単語数の制約を無視して文字数の制約だけで実施することも考えられる。
【００２２】
次に、比喩表現検索部１０７の動作について図８のフローチャートを参照して説明する。
ステップＳ８０１では、Ｎ＝１に設定する。
ステップＳ８０２では、構文パターン格納部１０４からＮ番目の比喩表現テンプレートに用いた構文パターンの制約条件５０２を取得し、最大文字数Ｍおよび／または最大単語数Ｔを得る。
ステップＳ８０３では、比喩表現テンプレートの「××」に最大文字数Ｍおよび／または最大単語数Ｔを満たす比喩表現が、テキストデータ格納部１０６に記憶されるテキストデータに存在するかどうかを検索する。当該比喩表現が存在すればステップＳ８０４へ進み、当該比喩表現が存在しなければステップＳ８０５へ進む。
【００２３】
ステップＳ８０４では、当該比喩表現を比喩表現として取得する。当該比喩表現が複数存在する場合は、全て取得する。
ステップＳ８０５では、Ｎ番目の比喩表現テンプレートの「××」に最大文字数Ｍおよび／または最大単語数Ｔを満たす比喩表現がテキストデータに存在しないため、次の比喩表現テンプレート、すなわちＮ＋１番目の比喩表現テンプレートがあるかどうかを判定する。Ｎ＋１番目の比喩表現テンプレートがあればステップＳ８０６に進み、Ｎ＋１番目の比喩表現テンプレートがなければ処理を終了する。
ステップＳ８０６では、Ｎ＋１番目を新たなＮと設定して、ステップＳ８０２へ戻り、ステップＳ８０２からステップＳ８０５までの処理を繰り返す。すなわち、比喩表現テンプレート生成部１０５で生成された全ての比喩表現テンプレートについて上述の処理を行う。
【００２４】
具体例として、図６および図７を参照すると、比喩表現テンプレートの「外国人歌手Ｇは××の日本人歌手Ａ」と一致する文字列であって、「××」に当てはまる文字列の制約条件が「１０文字以内、５単語以内」という文字列を図７に示すテキストデータ中から検索する。図７のテキストデータに、「外国人歌手Ｇはアメリカの日本人歌手Ａ」という文字列が存在したとすると、この文字列は、比喩表現テンプレートと一致し、かつ「アメリカ」の文字列は「４文字、１単語」であるので、比喩表現テンプレートの制約条件にも当てはまるため、これらの文字列を比喩表現として取得する。
【００２５】
次に、比喩表現出力部１０８の出力例について図９を参照して説明する。
図９に示すように、ユーザが「外国人歌手Ｇ」を調べるために入力単語として「外国人歌手Ｇ」を入力した場合に、出力結果として「外国人歌手Ｇはアメリカの日本人歌手Ａ」という比喩表現を出力する。こうすることで、外国人歌手Ｇに対して的確な比喩表現を提示することができ、ユーザの単語理解を支援することができる。
【００２６】
なお、上述の例では、構文パターン格納部１０４には日本語による構文パターンを格納していたが、これに限らず他言語の構文パターンを格納してもよい。
他言語の構文パターンを格納する構文パターン格納部１０４の一例を図１０に示す。図１０の例では、英語による構文パターン５０１を格納する。
他言語の構文パターンを用意することにより、ユーザが入力単語を入力する際に比喩表現として出力したい言語を選択することで、様々な言語の比喩表現テンプレートを作成することができる。なお、入力単語および単語検索結果の単語を言語判定部（図示せず）が構文パターン格納部１０４に存在する構文パターンの言語にそれぞれ翻訳し、他言語の構文パターンを当てはめてもよい。このとき、テキストデータ格納部１０６において、テキストデータ取得時において様々な言語のテキストを収集しておくことが望ましい。このように多言語の構文パターンを用意しておくことで、他言語の比喩表現をユーザに提示することができる。
【００２７】
以上に示した第１の実施形態によれば、比喩表現テンプレートに一致する文字列をテキストデータから抽出することで、入力単語をより的確に比喩表現することができ、ユーザの入力単語の理解を支援することができる。
【００２８】
（第２の実施形態）
第１の実施形態では、単語検索部において同一のクラスである単語を全て抽出していたが、第２の実施形態では、プロフィール情報と単語の知名度との少なくとも一方を用いて抽出する単語を選択する点が異なる。プロフィール情報は、ユーザの年齢、性別、使用言語、Ｗｅｂ検索クエリの履歴、オンラインショップでの商品の購入履歴、およびユーザが事前に入力した興味のある事柄などユーザに関する情報である。なお、プロフィール情報は、予めユーザからの入力によりプロフィール情報を受け取り、プロフィール情報を外部またはプロフィール情報格納部（図示せず）に保持しておき、必要に応じて単語検索部１０３が抽出すればよい。知名度は、単語２０１がどの程度認知されているかを示す値である。
【００２９】
第２の実施形態に係る単語意味クラス辞書の一例について図１１を参照して説明する。
第２の実施形態に係る単語意味クラス辞書格納部１０２は、第１の実施形態に係る単語意味クラス辞書の項目に加え、表記言語１１０１、知名度１１０２及び属性１１０３を含んだ単語レコード１１０４を複数格納する。表記言語１１０１は、単語２０１がどの言語で表記されているかを示し、例えば「日本人歌手Ａ」であれば表記言語１１０１は「日本語」であり、「New York」であれば表記言語１１０１は「英語」となる。属性１１０３は、本実施形態では、単語が出現するテキストが属する国別コードトップレベルドメインを単語の属性とするが、単語に関連する国名など、どのようなものでもよい。また、第２の実施形態における知名度１１０２の算出方法としては、知名度算出の対象となる単語２０１の表記言語で書かれたテキストデータ中での単語２０１の出現回数を知名度の値としているが、どのような方法を用いてもよい。
図１１の例では、「日本人歌手Ａ」の知名度１１０２は「５４７００」であり、テキストデータ中に５４７００回出現したことを示す。また、「外国人歌手Ｇ」の知名度１１０２は「６６００」であり、検索したテキストデータ中では、日本人歌手Ａよりも外国人歌手Ｇの知名度が低いことがわかる。
【００３０】
次に、第２の実施形態に係る単語検索部１０３の動作について図１２のフローチャートを参照して説明する。
ステップＳ１２０１では、ユーザの使用言語Ｌを取得する。使用言語Ｌはユーザプロフィール情報から取得すればよい。
ステップＳ１２０２では、Ｎ＝１と設定する。
ステップＳ１２０３では、単語意味クラス辞書格納部１０２のＮ番目の単語レコードＲを取得する。
【００３１】
ステップＳ１２０４では、単語レコードＲのクラスが入力単語のクラスと同一であるかどうかを判定する。同一である場合は、ステップＳ１２０５へ進み、同一でない場合はステップＳ１２０８へ進む。
ステップＳ１２０５では、単語レコードＲの表記言語がユーザの使用言語Ｌと同一であるかどうかを判定する。表記言語がユーザの使用言語Ｌと同一である場合はステップＳ１２０６へ進み、同一でない場合はステップＳ１２０８へ進む。
ステップＳ１２０６では、単語レコードＲの知名度が閾値以上であるかどうかを判定する。知名度が閾値以上であればステップＳ１２０７へ進み、知名度が閾値未満であればステップＳ１２０８へ進む。
【００３２】
ステップＳ１２０７では、単語検索結果に単語レコードＲの単語を追加する。
ステップＳ１２０８では、Ｎ＋１番目の単語レコードＲが存在するかどうかを判定する。Ｎ＋１番目の単語レコードＲが存在すればステップＳ１２０９へ進む。Ｎ＋１番目の単語レコードＲが存在しなければ処理を終了する。
ステップＳ１２０９では、Ｎ＋１番目を新たなＮと設定してステップＳ１２０３からステップＳ１２０８までの処理を繰り返す。以上で単語検索部１０３の処理を終了する。
【００３３】
具体的に、図１１の単語意味クラス辞書を参照して単語検索部１０３の動作を説明する。まず、ユーザの使用言語Ｌを取得し、例えば使用言語Ｌが日本語である場合を想定する。この場合、単語意味クラス辞書の単語レコードＲのうち、言語が日本語である単語レコードが検索対象となり、さらに知名度の閾値を「４００００」と設定していれば、該当する単語は「日本人歌手Ａ」となる。
【００３４】
なお、上述のステップでは、使用言語と知名度との両方を用いて単語検索結果を得ているが、使用言語および知名度のどちらか一方のみを用いて単語検索結果を得てもよい。また、プロフィール情報に含まれる検索履歴や購入履歴に単語レコードＲの単語が存在すれば、ユーザが単語を知っていると考えられるため、その単語が単語検索結果として追加されるように設定してもよい。例えば、プロフィール情報の購入履歴などに単語レコードＲの単語が存在した場合は、知名度の値を閾値以上となるような値に設定すればよい。
【００３５】
以上に示した第２の実施形態によれば、ユーザのプロフィール情報と単語の知名度との少なくとも一方を利用することにより、ユーザがよく知っている単語を用いて比喩表現を生成することができるため、ユーザが入力単語をよりイメージしやすく、入力単語の理解を支援することができる。
【００３６】
以上の説明では、ユーザの使用言語といった単一の言語内で比喩表現の生成を行う場合を述べてきたが、複数の言語で比喩表現を生成することも可能である。例えば、翻訳装置（図示せず）を利用して入力単語および単語検索結果を様々な言語に翻訳し、図１３に示すような翻訳先の言語の構文パターンに当てはめることで、様々な言語の比喩表現を生成することができる。このとき、テキストデータ格納部１０６において、テキストデータ取得時において様々な言語のテキストを収集しておくことが望ましい。必要に応じて生成した比喩表現を再度翻訳することで、多言語の比喩表現をユーザに提示することができる。
【００３７】
（第２の実施形態の変形例）
第２の実施形態の変形例では、単語レコードが持つ情報として、さらに、属性を利用する。そして、表記言語ではなく属性に基づいて単語の知名度を算出し、それを用いて単語検索部において単語検索結果を作成する。
【００３８】
まず始めに、第２の実施形態の表記言語に基づく知名度算出において生じうる問題について説明する。
日本語の場合、日本語を公用語とする国は日本のみであり、日本における「東京」（図１１を参照）の知名度を、「東京」の表記言語である日本語で書かれたテキストデータ内での「東京」の出現頻度と定義することができる（これは第２の実施形態における知名度の定義である）。しかし、例えば英語の場合、英語を公用語とする国はアメリカ、イギリス、オーストラリアなど数多く存在する。そのため、例えば、英語表記の単語「Cambridge」の知名度を英語で書かれたテキストデータ内の出現頻度とした場合、「Cambridge」の知名度の値は、アメリカでもイギリスでもオーストラリアでも一律の値となる。実際には「Cambridge」があるイギリスでの知名度は、オーストラリアでの知名度よりも高いと考えられるが、表記言語に基づく知名度算出では、それを考慮することができない。こうして算出された知名度を基に単語検索部１０３で単語検索結果を作成した場合、ユーザが入力単語をイメージしにくい比喩表現を出力しかねない。そこで、この問題を属性を利用することで解消することができる。
【００３９】
属性を含んだ単語意味クラス辞書の一例として、図１１を参照する。例えば、「東京」という単語は、収集したテキストデータ内において、「jp」という日本を表す国別コードトップレベルドメイン（以降、ドメインとも略す）を持つURLから収集されたテキスト中に出現する。よって、属性１１０３の値は「jp」となる。また、「Cambridge」という単語は、ドメイン「us」やドメイン「uk」、ドメイン「au」といった複数のドメインのテキストに出現する。このとき、単語意味クラス辞書に格納される単語レコードとしては、ドメインごとに単語レコードが作られる。図１１の例では、「Cambridge」に対して３つの単語レコードが作られている。ここで、各単語レコードの知名度１１０２を、表記言語１１０１ではなく、属性１１０３に基づいて算出する。具体的には、図１１の単語レコード１１０５を例に挙げれば、ドメイン「uk」のＵＲＬから収集されたテキスト内での「Cambridge」の出現頻度を知名度の値とする。
【００４０】
続いて、属性に基づいて算出された知名度と、ユーザのプロフィール情報を利用して、単語検索結果を取得する方法を述べる。ユーザのプロフィール情報として、ユーザがいる国のドメインが得られた場合、単語検索部１０３において単語検索する範囲を属性がユーザの属するドメインである単語レコードに限定する。具体的には、ユーザがオーストラリアにいることがプロフィール情報から判明した場合、単語検索の範囲を属性１１０３が「au」の単語レコードのみとする。それ以外の単語検索の動作は第２の実施形態と同様である。
【００４１】
以上に示した第２の実施形態の変形例によれば、オーストラリアのユーザにとっての「Cambridge」の知名度と、イギリスのユーザにとっての「Cambridge」の知名度を区別することができるため、ユーザが入力単語をよりイメージしやすい比喩表現を生成することができる。
【００４２】
なお、オンラインショップ上などで比喩表現を生成する場合には、オンラインショップのＵＲＬからドメインを取得し、それをユーザがいる国のドメインとすることで、ユーザのプロフィール情報にドメインの情報が無い場合にも実現可能である。
【００４３】
（第３の実施形態）
第３の実施形態では、比喩表現の自然性を判定する。自然性は、本実施形態では比喩表現として一般的に認知されている度合いを示す。このような自然性を判定することにより、より一般的な比喩表現を選択することができ、ユーザの入力単語の理解を支援することができる。
【００４４】
第３の実施形態に係る回答検索装置について図１４のブロック図を参照して説明する。
第３の実施形態に係る回答検索装置１４００は、単語意味クラス抽出部１０１、単語意味クラス辞書格納部１０２、単語検索部１０３、構文パターン格納部１０４、比喩表現テンプレート生成部１０５、テキストデータ格納部１０６、比喩表現検索部１０７、自然性判定部１４０１および比喩表現出力部１０８を含む。
単語意味クラス抽出部１０１、単語意味クラス辞書格納部１０２、単語検索部１０３、構文パターン格納部１０４、比喩表現テンプレート生成部１０５、テキストデータ格納部１０６、比喩表現検索部１０７、および比喩表現出力部１０８は、第１の実施形態と同様の動作を行うためここでの説明は省略する。
【００４５】
自然性判定部１４０１は、比喩表現検索部１０７から１以上の比喩表現を受け取り、比喩表現の自然性を判定し、自然性が最も高い比喩表現を比喩表現出力部１０８へ出力する。自然性の判定には、様々な方法が考えられるが、本実施形態では比喩表現の出現回数を用いる。比喩表現の出現回数を用いた自然性の判定は、比喩表現検索部１０７で生成された各比喩表現が、テキストデータ中でそれぞれ何回出現するかをカウントする。そして、最も多く出現した比喩表現が一般的に用いられている表現であり、最も自然であると判定することができるので、この比喩表現を出力する。
【００４６】
以上に示した第３の実施形態によれば、比喩表現の自然性を判定することで、より一般的な比喩表現を選択することができ、ユーザの入力単語の理解を支援することができる。
【００４７】
（第３の実施形態の変形例）
第３の実施形態の変形例では、比喩表現の出現回数に基づく自然性判定の代わりに、単語の評判情報を用いた自然性判定を行う。評判情報は、ある単語がどのような評判表現で形容されているかを示す情報である。評判表現は、単語を形容する表現である。評判表現の一例としては、例えば、「美しい」「かわいい」「かっこいい」といったものが挙げられる。
【００４８】
本変形例に係る自然性判定部１４０１の動作について図１５のフローチャートを参照して説明する。
ステップＳ１５０１では、初期設定として、後述する評判表現に関するコサイン類似度の最大値「Ｍａｘ」をゼロに設定し、比喩表現Ｈｍａｘを「なし」に設定する。
ステップＳ１５０２では、Ｎ＝１に設定する。
ステップＳ１５０３では、Ｎ番目の比喩表現をＨｎとし、比喩表現Ｈｎ中の２つの単語（入力単語および単語検索結果の単語）の評判情報ベクトルＶ１とＶ２とをそれぞれ取得する。評判情報ベクトルＶ１は、評判表現と入力単語とがテキストデータの１文中に出現した共起頻度の数を示し、評判情報ベクトルＶ２は、評判表現と単語検索結果の単語とがテキストデータの１文中に出現した共起頻度の数を示す。
【００４９】
ステップＳ１５０４では、評判情報ベクトルＶ１と評判情報ベクトルＶ２とのコサイン類似度Ｃを計算する。
ステップＳ１５０５では、コサイン類似度ＣがＭａｘより大きいかどうかを判定する。コサイン類似度ＣがＭａｘより大きければステップＳ１５０６に進み、コサイン類似度ＣがＭａｘ以下であればステップＳ１５０７へ進む。
ステップＳ１５０６では、Ｍａｘの値をコサイン類似度Ｃの値で更新し、ＨｍａｘをＨｎで更新する。
【００５０】
ステップＳ１５０７では、Ｎ＋１番目の比喩表現があるかどうかを判定する。Ｎ＋１番目の比喩表現があればステップＳ１５０８へ進み、Ｎ＋１番目の比喩表現がなければステップＳ１５０９へ進む。
ステップＳ１５０８では、Ｎ＋１番目を新たなＮと設定して、ステップＳ１５０３に戻り、未処理の比喩表現がなくなるまで、ステップＳ１５０３からステップＳ１５０７までの処理を繰り返す。
ステップＳ１５０９では、類似度が最大となる評判表現が当てはめられた比喩表現Ｈｍａｘが最も自然な比喩表現であるといえるため、この比喩表現Ｈｍａｘを出力する。以上で自然性判定部１４０１の処理を終了する。なお、コサイン類似度Ｃの値が等しいＨｍａｘが複数存在する場合は、複数の比喩表現を出力してもよい。
【００５１】
次に、評判表現の一例を図１６に示す。図１６の例では、「かわいい」「かっこいい」といった評判表現を抽出してリスト化する。評判表現の収集には、さまざまな方法が考えられるが、本実施形態では、予め評判表現を用意しておく。
【００５２】
次に、具体的な評判情報ベクトルの一例について図１７を参照して説明する。
図１７に示しように、単語と各評判表現とを対応付けてリスト化する。そして、評判表現のうち、テキストデータ中で、単語と同一の文中に出現する評判表現の数をカウントし、評判情報ベクトルとする。具体的には、図１７に示すように、評判情報ベクトルＶ１として「外国人歌手Ｇ」と「かわいい」との共起頻度が４００回、評判情報ベクトルＶ２として「日本人歌手Ａ」と「かわいい」との共起頻度が５００回である。よって、これらの値のコサイン類似度を求めればよい。
なお、テキストデータは複数のテキストファイルからなるテキストデータベースに保存されているため、テキストデータ中から単語や評判表現を探す場合には、テキストデータベース中の全ファイルのテキストを探索する。
【００５３】
また、本変形例では、評判情報ベクトルとして「かわいい」などの形容詞を評判表現として評判情報ベクトルを生成するが、「背の低い」「目の大きい」などの特徴を表す表現を用いて評判情報ベクトルを生成してもよい。
【００５４】
以上に示した第３の実施形態の変形例によれば、比喩表現の自然性を評判情報ベクトルを用いて判定することで、単に共起頻度から自然性を求めるよりも、一般的に表現される比喩表現を選択することができ、ユーザの入力単語の理解を支援することができる。
【００５５】
（第４の実施形態）
第４の実施形態は、ユーザに対して比喩表現を用いて情報推薦を行う点が他の実施形態と異なる。
情報推薦を実現する一般的な手法として、協調フィルタリングが考えられる。協調フィルタリングとは、大量のユーザの嗜好情報を蓄積し、あるユーザＡと嗜好が類似している他のユーザの嗜好情報を用いて、ユーザＡに情報推薦を行う手法である。例えば、ユーザＡがある商品Ｍを購入し、ユーザＢは商品ＭとＮとを購入している場合、ユーザＡに商品Ｎを推薦することができる。しかし、この協調フィルタリングに基づく推薦では、外国の商品などを推薦することが難しい場合が想定される。例えば、ある国Ｃでは有名な商品Ｐが、ある国Ｄではほとんど知られていない場合がある。このような場合は、国Ｄに住むユーザが商品Ｐを購入していることは稀であるため、国Ｄのユーザに商品Ｐを推薦することは難しい。
このように協調フィルタリングでは推薦が難しい場合でも、第４の実施形態による推薦方法によれば、国Ｃの商品Ｐと国Ｄの商品Ｑを用いた比喩表現を生成できるため商品Ｑを購入した国Ｄのユーザに商品Ｐを推薦することができる。
【００５６】
第４の実施形態に係る回答検索装置について図１８のブロック図を参照して説明する。
第４の実施形態に係る回答検索装置１８００は、単語意味クラス抽出部１０１、単語意味クラス辞書格納部１０２、単語検索部１０３、構文パターン格納部１０４、比喩表現テンプレート生成部１０５、テキストデータ格納部１０６、比喩表現検索部１０７、および情報推薦部１８０１を含む。単語意味クラス抽出部１０１、単語意味クラス辞書格納部１０２、単語検索部１０３、構文パターン格納部１０４、比喩表現テンプレート生成部１０５、テキストデータ格納部１０６、および比喩表現検索部１０７は、第１の実施形態と同様の処理を行うためここでの説明は省略する。
情報推薦部１８０１は、比喩表現検索部１０７から比喩表現を受け取り、比喩表現を任意の手法でユーザに提示する。
【００５７】
ここで、情報推薦部１８０１による情報推薦の一例について図１９を参照して説明する。
図１９では、ユーザが「外国人歌手Ｇ」に興味があり、「外国人歌手Ｇ」のＣＤをオンラインショップなどで閲覧している場合の表示画面を想定する。回答検索装置は、商品情報から歌手名である「外国人歌手Ｇ」を自動取得し、これを入力単語として第１の実施形態と同様に比喩表現を生成する。そして、生成結果の比喩表現として「外国人歌手Ｇはアメリカの日本人歌手Ａ」が生成された場合、比喩表現中の歌手名「日本人歌手Ａ」は「外国人歌手Ｇ」と関係があると考えられる。よって、「日本人歌手Ａ」に関するＣＤ情報などをユーザへ提示および推薦する。
具体的には、図１９に示すように、推薦情報１９０１として、商品情報（タイトル、歌手名、価格）、および推薦理由として比喩表現「外国人歌手Ｇはアメリカの日本人歌手Ａ」をあわせて提示すればよい。なお、推薦情報１９０１の提示手法は、図１９に示すように画面の下部領域を推薦情報の表示領域とするだけではなく、ポップアップで別ウィンドウを表示してもよいし、音声で提供するなど、ユーザが認知できる方法であれば何でもよい。
また、別例として、ユーザの興味情報を用いて情報推薦を行ってもよい。興味情報は、ユーザが関心のある単語情報であり、例えばユーザの商品購入履歴、検索ワード履歴に存在する単語を抽出すればよい。
【００５８】
ここで、購入履歴を用いた興味情報の一例について図２０を参照して説明する。
図２０では、カテゴリ名２００１と値２００２とを対応付けて格納する。カテゴリ名２００１としては、例えば、商品名、歌手名、製造会社名、およびブランド名がある。ユーザの興味情報の収集および記憶には、さまざまな手法が考えられるが、第４の実施形態では、ユーザがオンラインショップで商品を購入した履歴をオンラインショップ運営者から受け取り、図２０に示す形式で本実施形態に係る回答検索装置１８００内に保持する。
【００５９】
ユーザの興味情報を用いた場合の情報推薦の一例について図２１を参照して説明する。
図２１では、ユーザは外国人歌手Ｇを知らない場合を想定する。
ユーザが外国人歌手Ｇについて調べるために、「外国人歌手Ｇ」という単語を入力したとする。この場合、「外国人歌手Ｇ」を入力単語として、本実施形態に係る回答検索装置１８００において第１の実施形態と同様に比喩表現を生成する。その後、生成された比喩表現「外国人歌手Ｇはアメリカの日本人歌手Ａ」が表示される。このとき、興味情報からユーザが「日本人歌手Ａ」に関する商品を購入している、あるいは日本人歌手Ａについて何度も検索しているといった履歴があれば、ユーザは「日本人歌手Ａ」に興味があるといえる。そこで、推薦情報２１０１のように、「日本人歌手Ａ」と関連がある「外国人歌手Ｇ」の商品または「外国人歌手Ｇ」に関する情報をユーザに提示することで、ユーザの単語理解を支援することができる。なお、図２１に示すように、おすすめ理由として比喩表現を用いてもよい。
【００６０】
また、ユーザの興味情報を用いた場合の情報推薦の別例について図２２を参照して説明する。
図２２の例では、ユーザにより入力単語が入力されることで比喩表現を生成しているが、ユーザが能動的に単語を入力する場合でなくとも推薦情報を提示してもよい。例えば、ユーザがオンラインショップなどを閲覧している場合に、商品名、歌手名などの単語を入力単語として自動抽出し、第１の実施形態と同様に比喩表現を生成する。その後、図２１の推薦情報２２０１のように、生成した比喩表現をおすすめ理由として提示する。
【００６１】
なお、第４の実施形態では、ユーザが興味を持っている単語を含んだ比喩表現が生成された場合にのみ商品推薦とおすすめ理由の提示を行っているが、情報推薦時に必ずしもユーザが興味を持っている単語が比喩表現に含まれていなくともよい。
ユーザの興味情報を利用しない手法としてさまざまな手法があるが、その一例として知名度を利用する手法がある。例えば、「外国人歌手Ｇはアメリカの日本人歌手Ａ」が生成された場合、「日本人歌手Ａ」の知名度を図１２に示す単語意味クラス辞書を参照することで取得し、取得した知名度が一定値以上であれば情報推薦を行う。知名度の算出は、第１の実施形態で用いた手法を用いればよい。
【００６２】
以上に示した第４の実施形態よれば、ユーザの興味情報を用いることで、ユーザの理解を支援しつつ入力単語に関連する様々な情報を提供することができる。
【００６３】
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した回答検索装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク（フレキシブルディスク、ハードディスクなど）、光ディスク（ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ±Ｒ、ＤＶＤ±ＲＷなど）、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をＣＰＵで実行させれば、上述した実施形態の回答検索装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているＯＳ（オペレーティングシステム）や、データベース管理ソフト、ネットワーク等のＭＷ（ミドルウェア）等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、ＬＡＮやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は１つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
【００６４】
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の１つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
【００６５】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【００６６】
１００，１４００，１８００・・・回答検索装置、１０１・・・単語意味クラス抽出部、１０２・・・単語意味クラス辞書格納部、１０３・・・単語検索部、１０４・・・構文パターン格納部、１０５・・・比喩表現テンプレート生成部、１０６・・・テキストデータ格納部、１０７・・・比喩表現検索部、１０８・・・比喩表現出力部、２０１・・・単語、２０２・・・クラス、１１０３・・・属性、２０３，１１０４・・・単語レコード、４０１・・・単語検索結果、５０１・・・構文パターン、５０２・・・制約条件、６０１・・・比喩表現テンプレート、７０１・・・ファイル、１１０１・・・表記言語、１１０２・・・知名度、１４０１・・・自然性判定部、１８０１・・・情報推薦部、１９０１，２１０１，２２０１・・・推薦情報、２００１・・・カテゴリ名、２００２・・・値。

【特許請求の範囲】
【請求項１】
入力された第１単語の分類を示すクラスを抽出するクラス抽出部と、
前記第１単語と異なり、かつ、前記クラスと同一のクラスに属する第２単語を検索する単語検索部と、
前記第１単語、少なくとも１つの前記第２単語、および該第２単語を形容する任意の文字列を当てはめて前記第１単語を比喩する比喩表現において、該第１単語、該第２単語、および該任意の文字列が不定である構文パターンを格納する構文パターン格納部と、
前記構文パターンに前記第１単語と前記第２単語とを当てはめて前記任意の文字列が不定である比喩表現テンプレートを生成するテンプレート生成部と、
前記比喩表現テンプレートと一致する文字列をテキストデータから検索して、比喩表現として取得する比喩表現検索部と、を具備することを特徴とする回答検索装置。
【請求項２】
第３単語と、該第３単語の分類を示すクラスとを対応付けて複数格納する辞書格納部をさらに具備し、
前記クラス抽出部は、前記第１単語と一致する第３単語があるかどうかを前記辞書格納部から検索し、該第１単語と一致する第３単語のクラスを前記第１単語のクラスとして抽出し、
前記単語検索部は、前記辞書格納部から前記第２単語を検索することを特徴とする請求項１に記載の回答検索装置。
【請求項３】
前記構文パターン格納部は、前記任意の文字列の文字数および該任意の文字列の単語数の少なくともどちらか一方の制限を示す制約条件を、前記構文パターンと対応付けてさらに格納し、
前記比喩表現検索部は、前記比喩表現として、前記比喩表現テンプレートと一致する文字列かつ前記比喩表現テンプレートに用いられた構文パターンの制約条件を満たす文字列を検索することを特徴とする請求項１に記載の回答検索装置。
【請求項４】
前記辞書格納部は、さらに、前記第３単語の言語を示す表記言語を対応付けて格納し、
前記単語検索部は、ユーザの使用言語を含むプロフィール情報を参照して、該使用言語と一致する前記表記言語を有する第３単語から前記第２単語を検索することを特徴とする請求項２に記載の回答検索装置。
【請求項５】
前記辞書格納部は、さらに、前記第１単語の文書中の出現頻度を含む知名度を対応付けて格納し、
前記単語検索部は、前記知名度が閾値以上である第３単語から前記第２単語を検索することを特徴とする請求項２に記載の回答検索装置。
【請求項６】
前記辞書格納部は、さらに、前記第１単語の表記言語もしくは属性を対応付けて格納し、
前記知名度は、前記第１単語の表記言語もしくは属性に基づいて算出されることを特徴とする請求項５に記載の回答検索装置。
【請求項７】
ユーザの購入履歴または単語検索履歴を含むプロフィール情報を参照して、前記比喩表現に含まれる前記第２単語と前記プロフィール情報に含まれる単語とが一致する場合、前記比喩表現を出力する情報推薦部をさらに具備することを特徴とする請求項１に記載の回答検索装置。
【請求項８】
複数の前記比喩表現ごとに、前記テキストデータにおける出現回数をカウントし、該出現回数が最大である比喩表現を出力する自然性判定部をさらに具備する請求項１に記載の回答検索装置。
【請求項９】
前記第１単語および該第１単語を形容する表現の共起頻度と、前記第２単語および該第２単語を形容する表現の共起頻度との類似度を前記比喩表現ごとに計算し、該類似度が最大となる比喩表現を出力する自然性判定部をさらに具備する請求項１に記載の回答検索装置。
【請求項１０】
入力された第１単語の分類を示すクラスを抽出し、
前記第１単語と異なり、かつ、前記クラスと同一のクラスに属する第２単語を検索し、
前記第１単語、少なくとも１つの前記第２単語、および該第２単語を形容する任意の文字列を当てはめて前記第１単語を比喩する比喩表現において、該第１単語、該第２単語、および該任意の文字列が不定である構文パターンを格納し、
前記構文パターンに前記第１単語と前記第２単語とを当てはめて前記任意の文字列が不定である比喩表現テンプレートを生成し、
前記比喩表現テンプレートと一致する文字列をテキストデータから検索して、比喩表現として取得することを具備することを特徴とする回答検索方法。
【請求項１１】
コンピュータを、
入力された第１単語の分類を示すクラスを抽出するクラス抽出手段と、
前記第１単語と異なり、かつ、前記クラスと同一のクラスに属する第２単語を検索する単語検索手段と、
前記第１単語、少なくとも１つの前記第２単語、および該第２単語を形容する任意の文字列を当てはめて前記第１単語を比喩する比喩表現において、該第１単語、該第２単語、および該任意の文字列が不定である構文パターンを格納する構文パターン格納手段と、
前記構文パターンに前記第１単語と前記第２単語とを当てはめて前記任意の文字列が不定である比喩表現テンプレートを生成するテンプレート生成手段と、
前記比喩表現テンプレートと一致する文字列をテキストデータから検索して、比喩表現として取得する比喩表現検索手段として機能させるための回答検索プログラム。

【図１】