情報検索システム、方法及びプログラム

【課題】質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる情報検索システムを提供する。
【解決手段】音声として入力された質問に対して音声認識を行い、第１のテキスト情報を生成する音声認識手段（１０２）と、第１のテキスト情報を修正して質問に対する回答を検索するための手がかり語を含む第２のテキスト情報を生成する生成手段（１０３）と、第２のテキスト情報を用いて文書データベース（１０）から回答を検索する検索手段（１０４）とを具備する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声入力した質問に対する回答を検索する情報検索システム、方法及びプログラムに関する。
【背景技術】
【０００２】
従来、ユーザから音声として入力された質問に対する回答を検索し、その検索結果を表示、又は音声として出力する質問応答システムが多く提案されている。このようなシステムでは、一般的に、事前に用意された問題解決用知識（データベース）を用いて回答を生成する。このような質問応答システムでは、入力された質問が曖昧な場合、ユーザが求める回答を生成することが難しい。
【０００３】
曖昧性のある質問に対しては、ユーザへ追加質問を行い、ユーザから追加質問に対する回答を得ることにより、曖昧性を解消するなどの工夫が提案されている。例えば、特許文献１（特開２００２−６３２０９号公報）には、コンテンツを登録した候補リストを保持し、他の装置から入力される検索条件に基づいて、その候補リストに登録されているコンテンツの類似度を算出し、算出された類似度が所定の閾値より小さい場合、対応するコンテンツを候補リストから削除し、候補リストに残っているコンテンツの総数が所定の個数以上である場合、他の装置に対して質問事項を提示し、他の装置から入力される追加の検索条件に基づいて、コンテンツの類似度をさらに算出するようにした情報処理装置が記載されている。
【０００４】
また、従来のシステムにおいて、自然文の質問であるテキスト情報を解析し、解析結果に基づいて文書データベースから必要な回答を検索する質問応答型検索の研究開発が行われている。この質問応答型の検索が、通常の文書検索と異なる点は、質問に対する回答を文書単位ではなく、過不足なく提示することにある。例えば、「富士山の標高は何ｍですか」という質問には「３，７７６ｍ」と回答する。
【特許文献１】特開２００２−６３２０９号公報
【発明の開示】
【発明が解決しようとする課題】
【０００５】
従来、音声入力に対して質問応答型検索を実現するためには、先ず、入力された音声を音声認識処理によりテキスト情報に変換しなければならないが、文書データベースから検索を行う質問応答型検索システムでは、音声認識誤りがある場合の対応が非常に難しい。
【０００６】
自然文の質問で音声入力し、文書検索を行う場合、質問中に音声認識誤りが含まれていても、正しく認識された部分により文書検索を行うことができるが、文書データベースから検索を行う質問応答型検索では回答（長さ、重さなど回答の種類）を推定するための手がかり語（何ｍ、何ｋｇなど）の部分に認識誤りがあると、的確な回答を検索することができない。
【０００７】
従って、本発明の目的は、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる質問応答型の情報検索システム、方法及びプログラムを提供することにある。
【課題を解決するための手段】
【０００８】
上記課題を解決するために、本発明の一つの観点では、音声として入力された質問に対して音声認識を行い、第１のテキスト情報を生成する音声認識手段と、前記第１のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第２のテキスト情報を生成する生成手段と、前記第２のテキスト情報を用いて文書データベースから前記回答を検索する検索手段とを具備する。
【０００９】
本発明の他の観点では、音声として入力された質問に対して音声認識を行い、第１のテキスト情報を生成するステップと、前記第１のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第２のテキスト情報を生成するステップと、前記第２のテキスト情報を用いて文書データベースから前記回答を検索するステップとを具備する。
【発明の効果】
【００１０】
本発明によれば、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。更に、本発明は検索を開始して回答に到達するまでの時間や、検索処理にかかるコストを削減することができる。
【発明を実施するための最良の形態】
【００１１】
以下、図面を参照して本発明の実施の形態について説明する。
【００１２】
〔第１実施形態〕
図１は、本発明の第１実施形態に従う情報検索システムを示すブロック図である。図１に示す情報検索システムは、ユーザから音声入力された質問を音声認識してテキスト情報に変換し、変換したテキスト情報に基づいて質問に対する回答を検索し、検索結果をユーザに提供するシステムである。情報検索システムでは、予め、文書解析部１０１により、検索対象の文書が事前に登録された専用の文書データベース（以下ＤＢと呼ぶ）１０の文書データ中から、検索語になりうる語と回答になりうる候補の表現（回答候補）との共起関係が解析される。その後、文書解析部１０１は、前記回答候補を導くための手がかり語と検索語の間の共起情報を共起情報データベース（以下ＤＢと呼ぶ）１１に格納する。尚、「共起関係」とは、共起関係にある単語が近傍に同時に現れるという関係を示している。情報検索システムは、これらの手がかり語及び検索語の中から質問中に現れた語を用いて音声入力された質問に対する回答を検索する。
【００１３】
情報検索システムでの処理の流れを詳細に説明する。情報検索システムでは、ユーザから発声された音声による質問文が、音声認識部１０２により認識された後、テキスト情報に変換される。テキスト情報に変換された情報は、質問修正部１０３に提供される。質問修正部１０３は、テキスト情報を解析し、共起情報ＤＢ１１から対応する共起情報を選択し、その共起情報を用いてテキスト情報に手がかり語を付加する。質問修正部１０３は、付加した手がかり語を含むテキスト情報を検索部１０４に提供する。検索部１０４は、質問修正部１０３からのテキスト情報と付加された手がかり語に基づいて文書ＤＢ１０を参照し、その中から質問に対する回答を検索する。また、検索部１０４は、制御部１０５に回答を提供する。表示部１０６には、制御部１０５の制御により回答が表示される。制御部１０５は、音声認識部１０２から表示部１０６までを適切なタイミングで呼び出し、ユーザの操作に応じた制御を行う。
【００１４】
尚、情報検索システムでの全体の処理について図３で、文書解析部１０１の処理について図４〜図６で、質問修正部１０３の処理について図８〜図１０で詳細に説明する。また、共起情報ＤＢ１１については図７で詳細に説明する。
【００１５】
このように、情報検索システムで、音声認識結果であるテキスト情報に共起情報を付加し、その共起情報に基づいて回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【００１６】
さらに、図１に示す情報検索システムは、図２に示すように一般のパーソナルコンピュータ（ＰＣ）などのクライアント端末３０１上で実現可能である。以下に、図１の構成と図２の構成と対応させて情報検索システムで実行される処理を説明する。先ず、情報検索システムで実行されるプログラムをディスク２０６にインストールして起動させる。図１に示す各処理を制御部１０５であるＣＰＵ２０４で制御することにより、データベース検索処理が実行される。次に、図１に示す音声認識部１０２は、マイクなどの音声入力装置２０１を通して入力された音声をテキスト情報に変換する。制御部１０５は、マウスなどのポインティングデバイス２０２による画面上の操作に応じて、音声認識処理の開始や終了、質問応答処理の起動を制御する。また、制御部１０５は、音声認識部１０２、質問修正部１０３、検索部１０４での結果をディスプレイなどの表示部１０６に対応する表示装置２０３に表示させる。同時に、制御部１０５が各処理を制御する場合、メモリ２０５に一時的にデータを格納する。
【００１７】
さらに、情報検索システムでの処理をクライアント端末３０１上だけでなく、そのクライアント端末３０１とネットワーク１で接続されたサーバコンピュータであるサーバ３０２に処理やデータベースを分散配置してもよい。例えば、音声認識部１０２はクライアント端末３０１で、また、文書解析部１０１、質問修正部１０３、検索部１０４、文書ＤＢ１０、共起情報ＤＢ１１はサーバ３０２で、制御部１０５、表示部１０６はクライアント端末３０１とサーバ３０２の両方で実行するような配置にしてもよい。
【００１８】
例えば、クライアント端末３０１上でＷｅｂブラウザを用い、クライアント端末３０１上で動作する制御部１０５はJava Script（登録商標）で記述する。一方、サーバ３０２上でＪＳＰ(Java Server Pages)に対応したＷｅｂサーバを用い、サーバ３０２上で動作する制御部１０５はＪＳＰによって記述し、図１の各部をJava Script（登録商標）やＪａｖａ（登録商標）から呼び出せる形式で実装することで、それらの呼び出しや相互間のデータの受渡し、結果の表示などを分散した環境上で実現することができる。
【００１９】
また、音声認識部１０２は、図２の音声入力装置２０１により入力された音声のディクテーションを行い、その結果であるテキスト情報を表示装置２０３に表示する。音声のディクテーション処理や結果表示処理は、市販の専用のソストウェアにより外部から制御することができる。音声認識部１０２はそのようなソフトウェアを用いる。
【００２０】
次に、図１に示す情報検索システムで実行されるデータベース検索処理について説明する。図３において、先ず、音声認識部１０２へ質問の音声が入力される（ステップＳ１）。音声認識部１０２は、入力された音声を認識し、テキスト情報に変換する（ステップＳ２）。質問修正部１０３は、テキスト情報から共起情報を抽出し、その共起情報に従いテキスト情報を修正する（ステップＳ３）。検索部１０４は、修正されたテキスト情報に基づいて文書ＤＢ１０から回答を検索し、抽出する（ステップＳ４）。検索部１０４は、抽出した回答を制御部１０５に提供する。制御部１０５は、表示部１０６に回答を提示する（ステップＳ５）。
【００２１】
このように、共起情報に従い修正されたテキスト情報に基づいて回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【００２２】
次に、文書解析部１０１による文書解析処理について図４〜図６を用いて説明する。図４において、先ず、文書解析部１０１は、文書ＤＢ１０から質問応答型検索の回答になる可能性のある表現（回答候補）を探索する（ステップＳ１０）。次に、文書解析部１０１は、探索した回答侯補の前後の予め定められた区間の文字列を切り出す（ステップＳ１１）。例えば、図５に示すように、例１の場合、テキスト情報の「…スチーム皿１枚…」の「枚」という単位表現が探索され（ステップＳ１０に対応）、その単語を中心に、前後の所定の文字列を切り出す（ステップＳ１１に対応）。また、例２の場合、テキスト情報の「…皿にのせて５分間だけ加熱します…」の「分」という単位表現が探索され、その単語を中心に、前後の所定の文字列を切り出す。尚、ｍ(メートル)、ｃｍ(センチメートル)、ｇ(グラム)、ｋｇ(キログラム)など長さや重さなどの単位のついた数量表現を探索するようにしてもよい。このことにより、「枚」や「分」、あるいは、長さや重さなどの単位表現を予め指定しておくことで図４のステップＳ１０とステップＳ１１においては、それら単位表現の前後の予め定められた区間（例えば文字数）の文字列が文書から切り出されるようになる。
【００２３】
次に、図４に示すように、文書解析部１０１は、切り出した文字列を形態素に分解し、その品詞を解析する（ステップＳ１２）。形態素解析は機械翻訳などの自然言語処理で、従来から行われている処理のため、ここでは詳細な説明を省略する。次に、文書解析部１０１は、形態素解析の結果に基づいて、切り出した文字列中から予め定められた品詞（ここでは名詞）の語（検索語）を抽出し、その検索語と回答候補を介して間接的な共起関係にある手がかり語を作成する（ステップＳ１３）。文書解析部１０１は、検索語と手がかり語と対応付けて共起情報ＤＢ１１に格納する（ステップＳ１４）。
【００２４】
例えば、図６に示すように、切り出された文字列の「皿にのせて５分間だけ加熱」を形態素解析すると、「皿＜名詞＞に＜付属語＞のせ＜動詞＞て＜付属語＞５＜数字＞分間＜単位＞だけ＜付属語＞加熱＜名詞＞」となり、その形態素の中から名詞「皿」、「加熱」を抽出する（ステップＳ１２に対応）。この場合、切り出された文字列中に「５分」という回答と関連する表現から、回答の単位「分」に「何」を付けて手がかり語「何分」を生成し、検索語と手がかり語とを対応付けて共起情報ＤＢ１１に格納する（ステップＳ１３に対応）。
【００２５】
即ち、本実施形態の場合、回答の単位（すなわち、図４のステップＳ１０で着目した単位表現）の前に「何」をつけることで手がかり語を自動生成し、共起情報ＤＢ１１に格納する。尚、検索語と手がかり語の対応付けに関しては、対応付けのルールを用意してもよい。例えば、正規表現で回答候補のカテゴリを記述し、各正規表現と手がかり語を対応付けておく。回答候補とそれらの正規表現と照合し、照合できた正規表現に対応づけられた手がかり語をその回答候補に対応させる、という方法も考えられる。また、検索語と手がかり語とを対応付けて、双方向に対応付けられた両者を辿れるように、共起情報を図７に示すような二つの形式で共起情報ＤＢ１１に格納する。
【００２６】
次に、共起情報ＤＢ１１に格納されるテーブルについて説明する。図７に示すテーブル１１０に、検索語と手がかり語との対応が二つの形式で格納されている。第１の形式では、一つの手がかり語に複数の検索語が対応付けられ、第２の形式では、一つの検索語に複数の手がかり語が対応付けられている。例えば、第１の形式で、手がかり語「何枚」に対し検索語「皿、ベーコン、ピザ、スチーム…」が格納され、第２の形式で、検索語「皿」に対し手がかり語「何枚、何分、何時間…」が格納されている。図６に示す例によれば、抽出された検索語「皿、加熱」から手がかり語「何分」が生成されるため、第１の形式で手がかり語「何分」に対し検索語「皿、加熱」が格納され、第２の形式で検索語「皿」、「加熱」に対し手がかり語「何分」がそれぞれ格納される。
【００２７】
次に、質問修正部１０３による質問付加処理について図８〜図１０を用いて説明する。図８において、先ず、質問修正部１０３は、テキスト情報中に図７に示した検索語が含まれているかを調べ、その検索語に対応する手がかり語を図７に示された共起情報から列挙する（ステップＳ２０）。質問修正部１０３は、列挙された手がかり語とテキスト情報中の表現との文字列上の類似度を測定し、予め定められた閾値以上の類似度で照合できた手がかり語を選択する（ステップＳ２１）。
【００２８】
文字列上の類似度は、手がかり語とテキスト情報との双方の読みをローマ字に変換し、両者の編集距離ｄ（両者を一致させるための文字単位の置換、挿入、削除の最小回数）を基に、手がかり語の文字数をＬとすると、
類似度Ｓ＝１―（ｄ／Ｌ）
で求める。
【００２９】
尚、テキスト情報全体を手がかり語と照合し、テキスト情報の部分文字列内で手がかり語との最大の類似度をもつ文字列との間の類似度を、手がかり語とテキスト情報との類似度とする。これは、質問文を先頭から一文字ずらした部分文字列を手がかり語と照合し、かつ、手がかり語の終端まで照合処理が到達したときに、そこで類似度計算を停止することで実現できる。これにより、上記のｄはＬ以下になり、類似度Ｓは０から１の間の値をとる。
【００３０】
例えば、図９に示すように、テキスト情報「付属の乳も皿は名前だっけ」に含まれる検索語を抽出し、抽出された検索語「皿」から共起情報ＤＢ１１を参照して手がかり語「何枚、何分、何時間…」を列挙する（ステップＳ２０に対応）。次に、列挙された手がかり語の中から、先ず、手がかり語「何枚（ｎａｎｍａｉ）」のローマ字表記のうち、三文字目のｎを削除し、最後の文字ｉをｅに修正するとテキスト情報中の「ｎａｍａｅ」と一致させることができる。そのため、ローマ字表記したテキスト情報と、ローマ字表記した手がかり語「何枚」との類似度を測定すると、類似度Ｓ＝１−（２／６）≒０．６７（尚、２は、削除と修正した文字との間の距離ｄ（＝２）、６は手がかり語「ｎａｎｍａｉ」の文字長）となる。同様に、他の手がかり語「何分、何時間…」も類似度を求め、閾値以上の手がかり語を類似度順にソートする（ステップＳ２１に対応）。
【００３１】
図８に戻り、質問修正部１０３は、予め定められた類似度以上の手がかり語を発見したとき、その手がかり語に基づいて、図７に示された共起情報から対応する検索語を列挙する。質問修正部１０３は、手がかり語のときと同様に、検索語とテキスト情報とを照合し、予め定められた類似度以上のものを選択する（ステップＳ２２）。最後に、質問修正部１０３は、選択された手がかり語をテキスト情報の末尾に、検索語をテキスト情報の先頭に付加する（ステップＳ２３）。ただし、付加しようとする手がかり語、あるいは、検索語が音声認識結果のテキスト情報中に最初から含まれていれば付加しない。
【００３２】
例えば、図１０において、質問修正部１０３によるテキスト情報と手がかり語との照合の結果、手がかり語「何枚、何分、何時間」の三つが残ったとする。図７に示す共起情報から、それらの手がかり語と共起する「ベーコン、ピザ、スチーム、オーブン、予熱、加熱」がテキスト情報と照合される。説明の便宜上、その結果、手がかり語「何枚、何分」を介した検索語「スチーム」のみがテキスト情報との照合で予め定められた閾値以上の類似度をもち、残ったとする。質問修正部１０３は、得られた手がかり語をテキスト情報の末尾に、検索語をテキスト情報の先頭に付加する。この時、手がかり語ごとに、テキスト情報へ手がかり情報及び検索語が付加される。例えば、手がかり語「何枚」の場合、テキスト情報の先頭に検索語「スチーム」、末尾に手がかり語「何枚」が付加される。ただし、手がかり情報「何時間」の場合、手がかり情報「何時間」と検索語「スチーム」が共起していないため、テキスト情報の先頭に検索語「スチーム」は付加されない。
【００３３】
更に、質問修正部１０３による処理の後、検索部１０４は、予め検索対象のテキスト情報が格納された文書ＤＢ１０を参照し、質問修正部１０３の処理後のテキスト情報に基づいて回答を検索する。テキスト情報に手がかり語が含まれている場合、質問応答型検索を実行し、手がかり語が含まれていない場合、従来型の文書検索を実行する。
【００３４】
テキスト情報に手がかり語が含まれている場合、質問応答型検索では、最初に、手がかり語に基づいて回答の種類を特定する。回答の種類とは重さや長さなど、回答として出力すべき表現の種類のことである。次に、テキスト情報を元にベクトル空間法などの従来型の文書検索を文書ＤＢ１０に対して実行した後、その検索結果の上位の文書群を走査し、上記で特定された回答の種類と合致する回答候補の語を抽出する。最後に、抽出した回答候補の語を同一文書中のヒットワード(テキスト情報中の語で文書中に出現したもの)との距離（出現位置の近さ、例えば文字数を単位とする距離）でランキングし、１位のものを回答として出力する。図１２に示す検索結果画面の回答が出現する文書内容を表示した領域５３を用いて説明すると、文書中に出現するヒットワード「スチーム皿」の前後の文字群から、その「スチーム皿」と最も近い「枚」を含む文字列「１枚」（但し、改行を含む文字群は走査の対象から除く）を回答として出力する。
【００３５】
尚、その際、回答だけでなく、その回答が含まれていた文書の中で質問のテキスト表現に対する文書検索の検索スコアが最も高かったものの文書情報（文書ＩＤなど）も回答に付加する。テキスト情報中に回答を特定するための手がかり語が含まれていなかった場合、従来型の文書検索を実行し、検索スコアが最も高かった文書の文書情報を提供する。
【００３６】
次に、回答等が提供された場合、表示装置２０３に表示される第１実施形態の検索結果画面について説明する。図１１に示す検索結果画面６０には、音声認識結果のテキスト情報が表示される領域６１と、音声入力した質問に対する回答を検索する検索ボタン６２と、領域６１の音声認識結果をクリアするクリアボタン６３と、手がかり語を含むテキスト情報とその回答とを類似度の高い順に表示する領域６４と、音声認識結果から検索された回答が出現する文書内容を表示する領域６６が表示される。領域６４には、例えば、図１０に示すような手がかり語が付加されたテキスト情報が、類似度の高い順に表示される。この時、検索ボタン６２を選択すると、それぞれの回答がリンクの張られた状態で領域６４の右側に表示される。更に、領域６１に表示された音声認識結果のテキスト情報に基づいて、通常と同様に検索された回答が出現する文書内容が領域６６に表示される。なお、検索ボタン６２を選択せずとも、所定の時間、発話が行われなければ、領域６１の音声認識結果に手がかり語を付加したテキスト情報とその回答を領域６４に、また、領域６１のテキスト情報に基づいて検索した文書内容を領域６６に表示するようにしてもよい。
【００３７】
尚、図１１に示す検索結果画面６０は、Ｗｅｂブラウザ上で実現し、領域６４に表示されたリンクの張られた回答を選択することで、ハイパーリンクを辿り、その回答が含まれるページが表示される。例えば、領域６５のリンクの張られた回答結果「１枚」を選択すると、図１２に示す画面が表示される。
【００３８】
このように、検索結果画面６０を構成することで、テキスト情報に正しく手がかり語が付加された場合と、誤った手がかり語が付加された場合の両方を識別することができ、情報検索の機能性を向上させることができる。
【００３９】
次に、図１１に示す領域６５を選択した場合に表示される検索結果画面を図１２に示す。図１２に示す検索結果画面５０には、音声認識結果のテキスト情報又は共起情報を含むテキスト情報が表示される領域５１と、検索結果の回答を表示する領域５２と、回答が出現する文書の内容を表示する領域５３とが表示される。図１１の例では、「スチーム付属の乳も皿は名前だったっけ何枚」と修正された質問の回答を領域５２に「１枚」と表示し、さらに、その回答が記載されたページ（の中で最も検索スコアの高かったページ）を領域５３に表示する。
【００４０】
このように、音声認識したテキスト情報に、手がかり語、検索語を付加して回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。更に、回答が記載されたページも同時に表示するため、質問に対する回答が正確であるか、質問に関するその他の情報を確認することができる。
【００４１】
〔第２の実施の形態〕
次に、第２実施形態の情報検索システムについて説明する。第２実施形態の情報検索システムが、第１の実施例の情報検索システムと大きく異なる点は、文書解析部１０１音声認識の次候補情報を用いて、次候補中にある手がかり語候補を音声認識の第１の候補と差し替える点である。即ち、第２実施形態の情報検索システムは、手がかり語や検索語などの共起情報を追加するのではなく、テキスト情報の一部を共起情報に基づき修正する点で第１実施形態の情報検索システムと異なる。
【００４２】
次に、第２実施形態での情報検索システムでの処理について説明する。第２実施形態の情報検索システムは第１実施形態の情報システムと同じ構成で、先ず、ユーザから発声された音声による質問文が、音声認識部１０２により認識された後、テキスト情報に変換される。制御部１０５は、音声認識部１０２から認識結果のテキスト情報を取得し、それを質問修正部１０３に提供する。質問修正部１０３は、そのテキスト情報を構成する各語に関する次候補を音声認識部１０２から取得する。検索部１０４は、質問修正部１０３の結果に基づいて回答を検索する。テキスト情報を構成する各語に関して、次候補は一つである必要はなく、複数あってもかまわない。質問修正部１０３は、テキスト情報に最初から手がかり語や検索語が含まれていれば何もせず、テキスト情報をそのまま検索部１０４に提供する。また、質問修正部１０３は、テキスト情報に手がかり語や検索語が含まれず、次候補のいずれにも手がかり語が含まれていない場合も何もせず、テキスト情報をそのまま検索部１０４に提供する。一方、テキスト情報には手がかり語が含まれていないが、次候補に含まれている場合、テキスト情報の次候補を走査し、最初に発見した手がかり語をその次候補の該当部分に置き換えることでテキスト情報を修正し、その結果を提供する。第２実施形態の情報検索システムでは図８の質問修正処理の中で、検索語検出Ｓ２０、手がかり語照合Ｓ２１、検索語照合Ｓ２２までを行い、手がかり語、検索語付加Ｓ２３は行わない。第２実施形態の情報検索システムでは手がかり語、検索語付加Ｓ２３のかわりに図１の音声認識部１０２が出力する次候補テーブルを走査し、図８の手がかり語照合Ｓ２１、検索語照合Ｓ２２の結果である手がかり語や検索語が次候補として存在すれば、その次候補を認識結果の該当部分と差し替える。
【００４３】
このように、音声認識されたテキスト情報をユーザにとって自然な形式に修正することで、容易に的確な回答を検索することができるようになる。
【００４４】
次に、音声認識部１０２が出力する次候補テーブルについて説明する。図１３に示すテーブル１２０は、音声認識されたテキスト情報の各文字列に対する次候補のみを示している。例えば、文字列「乳も」に対し、次候補「土も、スチーム…」などが格納されている。図９、１０に例示した場合では、第２実施形態の情報検索システムにおいては、質問修正部１０３は、文字列「乳も」は、次候補の中に照合に成功した検索語「スチーム」があることから、テキスト情報の文字列「乳も」を「スチーム」に修正する。更に、質問修正部１０３は、文字列「名前」は、次候補の中に「何枚」と「何分」があることから、テキスト情報の文字列「名前」を「何枚」又は「何分」に修正する。質問修正部１０３により修正されたテキスト情報は、図１４に示す検索結果画面に表示される。
【００４５】
次に、第２実施形態の検索結果画面について説明する。図１４に示す検索結果画面７０には、音声認識結果のテキスト情報又は共起情報を含むテキスト情報が表示される領域７１と、共起情報を含むテキスト情報とその回答とを類似度の高い順に表示する領域７２と、音声認識結果から検索された回答が出現する文書内容を表示する領域７３が表示される。図１４に示す領域７２と、図１１に示す領域６４と比較すると、領域６４で表示された手がかり語「何時間」を含むテキスト情報は、第２実施例では次候補に出現していないため、領域７２に表示されない。
【００４６】
このように、音声認識したテキスト情報に共起情報を付加し、その共起情報から回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【００４７】
上記実施形態で説明した情報検索処理は、ハードウェアによって実現することもできるし、コンピュータを用いてソフトウェアにより実行することもできる。すなわち、本発明によると、音声として入力された質問に対して音声認識を行い、第１のテキスト情報を生成するステップと、第１のテキスト情報を修正して質問に対する回答を導き出すための手がかり語及び該手がかり語を含む第２のテキスト情報を生成するステップと、第２のテキスト情報を用いて文書データベースを検索し、回答を抽出するステップとを含むとを含むデータベース検索処理をコンピュータに行わせるためのプログラムを提供することもできる。
【図面の簡単な説明】
【００４８】
【図１】本発明の第１実施形態に従う情報検索システムを示すブロック図
【図２】情報検索システムの適用例を示す図
【図３】データベース検索処理を示すフローチャート
【図４】文書解析処理を示すフローチャート
【図５】回答候補検索処理及び文字列切出し処理を説明するための図
【図６】形態素解析処理及び共起関係抽出処理を説明するための図
【図７】共起情報ＤＢに格納されたテーブルを示す図
【図８】質問付加処理を示すフローチャート
【図９】検索語検出処理及び手がかり語照合処理を説明するための図
【図１０】検索語照合処理を説明するための図
【図１１】第１実施形態の検索結果画面を示す図
【図１２】第１実施形態の検索結果画面を示す図
【図１３】第２実施形態の共起情報ＤＢに格納されたテーブルを示す図
【図１４】第２実施形態の検索結果画面を示す図
【符号の説明】
【００４９】
１・・・ネットワーク；
１０・・・文書ＤＢ；
１１、１２・・・共起情報ＤＢ；
１０１・・・文書解析部；
１０２・・・音声認識部；
１０３・・・質問修正部；
１０４・・・検索部；
１０５・・・制御部；
１０６・・・表示部；
２０１・・・音声入力装置；
２０２・・・ポインティングデバイス；
２０３・・・表示装置；
２０４・・・ＣＰＵ；
２０５・・・メモリ；
２０６・・・ディスク；
３０１・・・クライアント端末；
３０２・・・サーバ；
１０４・・・回答提示部；

【特許請求の範囲】
【請求項１】
音声として入力された質問に対して音声認識を行い、第１のテキスト情報を生成する音声認識手段と、
前記第１のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第２のテキスト情報を生成する生成手段と、
前記第２のテキスト情報を用いて文書データベースから前記回答を検索する検索手段とを具備する情報検索システム。
【請求項２】
回答を検索するための手がかり語候補と文書検索に用いる検索語とを共起関係を用いて対応付けて記憶した記憶手段をさらに具備し、前記生成手段は前記第１のテキスト情報を参照して前記記憶手段から前記手がかりとなる第２のテキスト情報を選択する請求項１記載の情報検索システム。
【請求項３】
前記記憶手段は、一つの手がかり語候補に対応付けて複数の検索語を記憶し、一つの検索語に対応付けて複数の手がかり語候補を記憶する請求項２記載の情報検索システム。
【請求項４】
前記第１のテキスト情報から検索語を探索する探索手段と、
前記第１のテキスト情報から前記回答の一部が含まれる語を前記手がかり語候補として生成する生成手段とをさらに具備する請求項２または３記載の情報検索システム。
【請求項５】
前記生成手段は、前記第１のテキスト情報から前記検索語を検出する検出手段と、
前記検出手段により検出された検索語に対応する複数の手がかり語候補から前記第１のテキスト情報中の語との類似度が閾値以上の手がかり語候補を選択する手段と、
選択された手がかり語候補の各々を前記第１のテキスト情報に付加することにより複数の前記第２のテキスト情報を生成する手段とを有する請求項２記載の情報検索システム。
【請求項６】
前記第２のテキスト情報と前記回答とを併せて表示する表示手段をさらに具備する請求項１記載の情報検索システム。
【請求項７】
前記複数の第２のテキスト情報を前記類似度の順に前記回答と併せて表示する表示手段をさらに具備する請求項５記載の情報検索システム。
【請求項８】
前記表示手段は、前記回答を該回答が含まれる前記データベース内の文書データとリンクさせて表示する請求項６記載の情報検索システム。
【請求項９】
前記第１のテキスト情報を構成する語について音声認識の次候補を記憶した記憶手段をさらに具備し、
前記生成手段は、前記第１のテキスト情報中の語を前記次候補で置き換えることにより前記第２のテキスト情報を生成する請求項１記載の情報検索システム。
【請求項１０】
音声として入力された質問に対して音声認識を行い、第１のテキスト情報を生成するステップと、
前記第１のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第２のテキスト情報を生成するステップと、
前記第２のテキスト情報を用いて文書データベースから前記回答を検索するステップとを具備する情報検索方法。
【請求項１１】
音声として入力された質問に対して音声認識を行い、第１のテキスト情報を生成するステップと、
前記第１のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第２のテキスト情報を生成するステップと、
前記第２のテキスト情報を用いて文書データベースから前記回答を検索するステップとを含む情報検索処理をコンピュータに行わせるためのプログラム。

【図１】