情報検索システム、方法及びプログラム
【課題】質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる情報検索システムを提供する。
【解決手段】音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成する音声認識手段(102)と、第1のテキスト情報を修正して質問に対する回答を検索するための手がかり語を含む第2のテキスト情報を生成する生成手段(103)と、第2のテキスト情報を用いて文書データベース(10)から回答を検索する検索手段(104)とを具備する。
【解決手段】音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成する音声認識手段(102)と、第1のテキスト情報を修正して質問に対する回答を検索するための手がかり語を含む第2のテキスト情報を生成する生成手段(103)と、第2のテキスト情報を用いて文書データベース(10)から回答を検索する検索手段(104)とを具備する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声入力した質問に対する回答を検索する情報検索システム、方法及びプログラムに関する。
【背景技術】
【0002】
従来、ユーザから音声として入力された質問に対する回答を検索し、その検索結果を表示、又は音声として出力する質問応答システムが多く提案されている。このようなシステムでは、一般的に、事前に用意された問題解決用知識(データベース)を用いて回答を生成する。このような質問応答システムでは、入力された質問が曖昧な場合、ユーザが求める回答を生成することが難しい。
【0003】
曖昧性のある質問に対しては、ユーザへ追加質問を行い、ユーザから追加質問に対する回答を得ることにより、曖昧性を解消するなどの工夫が提案されている。例えば、特許文献1(特開2002−63209号公報)には、コンテンツを登録した候補リストを保持し、他の装置から入力される検索条件に基づいて、その候補リストに登録されているコンテンツの類似度を算出し、算出された類似度が所定の閾値より小さい場合、対応するコンテンツを候補リストから削除し、候補リストに残っているコンテンツの総数が所定の個数以上である場合、他の装置に対して質問事項を提示し、他の装置から入力される追加の検索条件に基づいて、コンテンツの類似度をさらに算出するようにした情報処理装置が記載されている。
【0004】
また、従来のシステムにおいて、自然文の質問であるテキスト情報を解析し、解析結果に基づいて文書データベースから必要な回答を検索する質問応答型検索の研究開発が行われている。この質問応答型の検索が、通常の文書検索と異なる点は、質問に対する回答を文書単位ではなく、過不足なく提示することにある。例えば、「富士山の標高は何mですか」という質問には「3,776m」と回答する。
【特許文献1】特開2002−63209号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
従来、音声入力に対して質問応答型検索を実現するためには、先ず、入力された音声を音声認識処理によりテキスト情報に変換しなければならないが、文書データベースから検索を行う質問応答型検索システムでは、音声認識誤りがある場合の対応が非常に難しい。
【0006】
自然文の質問で音声入力し、文書検索を行う場合、質問中に音声認識誤りが含まれていても、正しく認識された部分により文書検索を行うことができるが、文書データベースから検索を行う質問応答型検索では回答(長さ、重さなど回答の種類)を推定するための手がかり語(何m、何kgなど)の部分に認識誤りがあると、的確な回答を検索することができない。
【0007】
従って、本発明の目的は、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる質問応答型の情報検索システム、方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本発明の一つの観点では、音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成する音声認識手段と、前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成する生成手段と、前記第2のテキスト情報を用いて文書データベースから前記回答を検索する検索手段とを具備する。
【0009】
本発明の他の観点では、音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成するステップと、前記第2のテキスト情報を用いて文書データベースから前記回答を検索するステップとを具備する。
【発明の効果】
【0010】
本発明によれば、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。更に、本発明は検索を開始して回答に到達するまでの時間や、検索処理にかかるコストを削減することができる。
【発明を実施するための最良の形態】
【0011】
以下、図面を参照して本発明の実施の形態について説明する。
【0012】
〔第1実施形態〕
図1は、本発明の第1実施形態に従う情報検索システムを示すブロック図である。図1に示す情報検索システムは、ユーザから音声入力された質問を音声認識してテキスト情報に変換し、変換したテキスト情報に基づいて質問に対する回答を検索し、検索結果をユーザに提供するシステムである。情報検索システムでは、予め、文書解析部101により、検索対象の文書が事前に登録された専用の文書データベース(以下DBと呼ぶ)10の文書データ中から、検索語になりうる語と回答になりうる候補の表現(回答候補)との共起関係が解析される。その後、文書解析部101は、前記回答候補を導くための手がかり語と検索語の間の共起情報を共起情報データベース(以下DBと呼ぶ)11に格納する。尚、「共起関係」とは、共起関係にある単語が近傍に同時に現れるという関係を示している。情報検索システムは、これらの手がかり語及び検索語の中から質問中に現れた語を用いて音声入力された質問に対する回答を検索する。
【0013】
情報検索システムでの処理の流れを詳細に説明する。情報検索システムでは、ユーザから発声された音声による質問文が、音声認識部102により認識された後、テキスト情報に変換される。テキスト情報に変換された情報は、質問修正部103に提供される。質問修正部103は、テキスト情報を解析し、共起情報DB11から対応する共起情報を選択し、その共起情報を用いてテキスト情報に手がかり語を付加する。質問修正部103は、付加した手がかり語を含むテキスト情報を検索部104に提供する。検索部104は、質問修正部103からのテキスト情報と付加された手がかり語に基づいて文書DB10を参照し、その中から質問に対する回答を検索する。また、検索部104は、制御部105に回答を提供する。表示部106には、制御部105の制御により回答が表示される。制御部105は、音声認識部102から表示部106までを適切なタイミングで呼び出し、ユーザの操作に応じた制御を行う。
【0014】
尚、情報検索システムでの全体の処理について図3で、文書解析部101の処理について図4〜図6で、質問修正部103の処理について図8〜図10で詳細に説明する。また、共起情報DB11については図7で詳細に説明する。
【0015】
このように、情報検索システムで、音声認識結果であるテキスト情報に共起情報を付加し、その共起情報に基づいて回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【0016】
さらに、図1に示す情報検索システムは、図2に示すように一般のパーソナルコンピュータ(PC)などのクライアント端末301上で実現可能である。以下に、図1の構成と図2の構成と対応させて情報検索システムで実行される処理を説明する。先ず、情報検索システムで実行されるプログラムをディスク206にインストールして起動させる。図1に示す各処理を制御部105であるCPU204で制御することにより、データベース検索処理が実行される。次に、図1に示す音声認識部102は、マイクなどの音声入力装置201を通して入力された音声をテキスト情報に変換する。制御部105は、マウスなどのポインティングデバイス202による画面上の操作に応じて、音声認識処理の開始や終了、質問応答処理の起動を制御する。また、制御部105は、音声認識部102、質問修正部103、検索部104での結果をディスプレイなどの表示部106に対応する表示装置203に表示させる。同時に、制御部105が各処理を制御する場合、メモリ205に一時的にデータを格納する。
【0017】
さらに、情報検索システムでの処理をクライアント端末301上だけでなく、そのクライアント端末301とネットワーク1で接続されたサーバコンピュータであるサーバ302に処理やデータベースを分散配置してもよい。例えば、音声認識部102はクライアント端末301で、また、文書解析部101、質問修正部103、検索部104、文書DB10、共起情報DB11はサーバ302で、制御部105、表示部106はクライアント端末301とサーバ302の両方で実行するような配置にしてもよい。
【0018】
例えば、クライアント端末301上でWebブラウザを用い、クライアント端末301上で動作する制御部105はJava Script(登録商標)で記述する。一方、サーバ302上でJSP(Java Server Pages)に対応したWebサーバを用い、サーバ302上で動作する制御部105はJSPによって記述し、図1の各部をJava Script(登録商標)やJava(登録商標)から呼び出せる形式で実装することで、それらの呼び出しや相互間のデータの受渡し、結果の表示などを分散した環境上で実現することができる。
【0019】
また、音声認識部102は、図2の音声入力装置201により入力された音声のディクテーションを行い、その結果であるテキスト情報を表示装置203に表示する。音声のディクテーション処理や結果表示処理は、市販の専用のソストウェアにより外部から制御することができる。音声認識部102はそのようなソフトウェアを用いる。
【0020】
次に、図1に示す情報検索システムで実行されるデータベース検索処理について説明する。図3において、先ず、音声認識部102へ質問の音声が入力される(ステップS1)。音声認識部102は、入力された音声を認識し、テキスト情報に変換する(ステップS2)。質問修正部103は、テキスト情報から共起情報を抽出し、その共起情報に従いテキスト情報を修正する(ステップS3)。検索部104は、修正されたテキスト情報に基づいて文書DB10から回答を検索し、抽出する(ステップS4)。検索部104は、抽出した回答を制御部105に提供する。制御部105は、表示部106に回答を提示する(ステップS5)。
【0021】
このように、共起情報に従い修正されたテキスト情報に基づいて回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【0022】
次に、文書解析部101による文書解析処理について図4〜図6を用いて説明する。図4において、先ず、文書解析部101は、文書DB10から質問応答型検索の回答になる可能性のある表現(回答候補)を探索する(ステップS10)。次に、文書解析部101は、探索した回答侯補の前後の予め定められた区間の文字列を切り出す(ステップS11)。例えば、図5に示すように、例1の場合、テキスト情報の「…スチーム皿 1枚…」の「枚」という単位表現が探索され(ステップS10に対応)、その単語を中心に、前後の所定の文字列を切り出す(ステップS11に対応)。また、例2の場合、テキスト情報の「…皿にのせて5分間だけ加熱します…」の「分」という単位表現が探索され、その単語を中心に、前後の所定の文字列を切り出す。尚、m(メートル)、cm(センチメートル)、g(グラム)、kg(キログラム)など長さや重さなどの単位のついた数量表現を探索するようにしてもよい。このことにより、「枚」や「分」、あるいは、長さや重さなどの単位表現を予め指定しておくことで図4のステップS10とステップS11においては、それら単位表現の前後の予め定められた区間(例えば文字数)の文字列が文書から切り出されるようになる。
【0023】
次に、図4に示すように、文書解析部101は、切り出した文字列を形態素に分解し、その品詞を解析する(ステップS12)。形態素解析は機械翻訳などの自然言語処理で、従来から行われている処理のため、ここでは詳細な説明を省略する。次に、文書解析部101は、形態素解析の結果に基づいて、切り出した文字列中から予め定められた品詞(ここでは名詞)の語(検索語)を抽出し、その検索語と回答候補を介して間接的な共起関係にある手がかり語を作成する(ステップS13)。文書解析部101は、検索語と手がかり語と対応付けて共起情報DB11に格納する(ステップS14)。
【0024】
例えば、図6に示すように、切り出された文字列の「皿にのせて5分間だけ加熱」を形態素解析すると、「皿<名詞>に<付属語>のせ<動詞>て<付属語>5<数字>分間<単位>だけ<付属語>加熱<名詞>」となり、その形態素の中から名詞「皿」、「加熱」を抽出する(ステップS12に対応)。この場合、切り出された文字列中に「5分」という回答と関連する表現から、回答の単位「分」に「何」を付けて手がかり語「何分」を生成し、検索語と手がかり語とを対応付けて共起情報DB11に格納する(ステップS13に対応)。
【0025】
即ち、本実施形態の場合、回答の単位(すなわち、図4のステップS10で着目した単位表現)の前に「何」をつけることで手がかり語を自動生成し、共起情報DB11に格納する。尚、検索語と手がかり語の対応付けに関しては、対応付けのルールを用意してもよい。例えば、正規表現で回答候補のカテゴリを記述し、各正規表現と手がかり語を対応付けておく。回答候補とそれらの正規表現と照合し、照合できた正規表現に対応づけられた手がかり語をその回答候補に対応させる、という方法も考えられる。また、検索語と手がかり語とを対応付けて、双方向に対応付けられた両者を辿れるように、共起情報を図7に示すような二つの形式で共起情報DB11に格納する。
【0026】
次に、共起情報DB11に格納されるテーブルについて説明する。図7に示すテーブル110に、検索語と手がかり語との対応が二つの形式で格納されている。第1の形式では、一つの手がかり語に複数の検索語が対応付けられ、第2の形式では、一つの検索語に複数の手がかり語が対応付けられている。例えば、第1の形式で、手がかり語「何枚」に対し検索語「皿、ベーコン、ピザ、スチーム…」が格納され、第2の形式で、検索語「皿」に対し手がかり語「何枚、何分、何時間…」が格納されている。図6に示す例によれば、抽出された検索語「皿、加熱」から手がかり語「何分」が生成されるため、第1の形式で手がかり語「何分」に対し検索語「皿、加熱」が格納され、第2の形式で検索語「皿」、「加熱」に対し手がかり語「何分」がそれぞれ格納される。
【0027】
次に、質問修正部103による質問付加処理について図8〜図10を用いて説明する。図8において、先ず、質問修正部103は、テキスト情報中に図7に示した検索語が含まれているかを調べ、その検索語に対応する手がかり語を図7に示された共起情報から列挙する(ステップS20)。質問修正部103は、列挙された手がかり語とテキスト情報中の表現との文字列上の類似度を測定し、予め定められた閾値以上の類似度で照合できた手がかり語を選択する(ステップS21)。
【0028】
文字列上の類似度は、手がかり語とテキスト情報との双方の読みをローマ字に変換し、両者の編集距離d(両者を一致させるための文字単位の置換、挿入、削除の最小回数)を基に、手がかり語の文字数をLとすると、
類似度S=1―(d/L)
で求める。
【0029】
尚、テキスト情報全体を手がかり語と照合し、テキスト情報の部分文字列内で手がかり語との最大の類似度をもつ文字列との間の類似度を、手がかり語とテキスト情報との類似度とする。これは、質問文を先頭から一文字ずらした部分文字列を手がかり語と照合し、かつ、手がかり語の終端まで照合処理が到達したときに、そこで類似度計算を停止することで実現できる。これにより、上記のdはL以下になり、類似度Sは0から1の間の値をとる。
【0030】
例えば、図9に示すように、テキスト情報「付属の乳も皿は名前だっけ」に含まれる検索語を抽出し、抽出された検索語「皿」から共起情報DB11を参照して手がかり語「何枚、何分、何時間…」を列挙する(ステップS20に対応)。次に、列挙された手がかり語の中から、先ず、手がかり語「何枚(nanmai)」のローマ字表記のうち、三文字目のnを削除し、最後の文字iをeに修正するとテキスト情報中の「namae」と一致させることができる。そのため、ローマ字表記したテキスト情報と、ローマ字表記した手がかり語「何枚」との類似度を測定すると、類似度S=1−(2/6)≒0.67(尚、2は、削除と修正した文字との間の距離d(=2)、6は手がかり語「nanmai」の文字長)となる。同様に、他の手がかり語「何分、何時間…」も類似度を求め、閾値以上の手がかり語を類似度順にソートする(ステップS21に対応)。
【0031】
図8に戻り、質問修正部103は、予め定められた類似度以上の手がかり語を発見したとき、その手がかり語に基づいて、図7に示された共起情報から対応する検索語を列挙する。質問修正部103は、手がかり語のときと同様に、検索語とテキスト情報とを照合し、予め定められた類似度以上のものを選択する(ステップS22)。最後に、質問修正部103は、選択された手がかり語をテキスト情報の末尾に、検索語をテキスト情報の先頭に付加する(ステップS23)。ただし、付加しようとする手がかり語、あるいは、検索語が音声認識結果のテキスト情報中に最初から含まれていれば付加しない。
【0032】
例えば、図10において、質問修正部103によるテキスト情報と手がかり語との照合の結果、手がかり語「何枚、何分、何時間」の三つが残ったとする。図7に示す共起情報から、それらの手がかり語と共起する「ベーコン、ピザ、スチーム、オーブン、予熱、加熱」がテキスト情報と照合される。説明の便宜上、その結果、手がかり語「何枚、何分」を介した検索語「スチーム」のみがテキスト情報との照合で予め定められた閾値以上の類似度をもち、残ったとする。質問修正部103は、得られた手がかり語をテキスト情報の末尾に、検索語をテキスト情報の先頭に付加する。この時、手がかり語ごとに、テキスト情報へ手がかり情報及び検索語が付加される。例えば、手がかり語「何枚」の場合、テキスト情報の先頭に検索語「スチーム」、末尾に手がかり語「何枚」が付加される。ただし、手がかり情報「何時間」の場合、手がかり情報「何時間」と検索語「スチーム」が共起していないため、テキスト情報の先頭に検索語「スチーム」は付加されない。
【0033】
更に、質問修正部103による処理の後、検索部104は、予め検索対象のテキスト情報が格納された文書DB10を参照し、質問修正部103の処理後のテキスト情報に基づいて回答を検索する。テキスト情報に手がかり語が含まれている場合、質問応答型検索を実行し、手がかり語が含まれていない場合、従来型の文書検索を実行する。
【0034】
テキスト情報に手がかり語が含まれている場合、質問応答型検索では、最初に、手がかり語に基づいて回答の種類を特定する。回答の種類とは重さや長さなど、回答として出力すべき表現の種類のことである。次に、テキスト情報を元にベクトル空間法などの従来型の文書検索を文書DB10に対して実行した後、その検索結果の上位の文書群を走査し、上記で特定された回答の種類と合致する回答候補の語を抽出する。最後に、抽出した回答候補の語を同一文書中のヒットワード(テキスト情報中の語で文書中に出現したもの)との距離(出現位置の近さ、例えば文字数を単位とする距離)でランキングし、1位のものを回答として出力する。図12に示す検索結果画面の回答が出現する文書内容を表示した領域53を用いて説明すると、文書中に出現するヒットワード「スチーム皿」の前後の文字群から、その「スチーム皿」と最も近い「枚」を含む文字列「1枚」(但し、改行を含む文字群は走査の対象から除く)を回答として出力する。
【0035】
尚、その際、回答だけでなく、その回答が含まれていた文書の中で質問のテキスト表現に対する文書検索の検索スコアが最も高かったものの文書情報(文書IDなど)も回答に付加する。テキスト情報中に回答を特定するための手がかり語が含まれていなかった場合、従来型の文書検索を実行し、検索スコアが最も高かった文書の文書情報を提供する。
【0036】
次に、回答等が提供された場合、表示装置203に表示される第1実施形態の検索結果画面について説明する。図11に示す検索結果画面60には、音声認識結果のテキスト情報が表示される領域61と、音声入力した質問に対する回答を検索する検索ボタン62と、領域61の音声認識結果をクリアするクリアボタン63と、手がかり語を含むテキスト情報とその回答とを類似度の高い順に表示する領域64と、音声認識結果から検索された回答が出現する文書内容を表示する領域66が表示される。領域64には、例えば、図10に示すような手がかり語が付加されたテキスト情報が、類似度の高い順に表示される。この時、検索ボタン62を選択すると、それぞれの回答がリンクの張られた状態で領域64の右側に表示される。更に、領域61に表示された音声認識結果のテキスト情報に基づいて、通常と同様に検索された回答が出現する文書内容が領域66に表示される。なお、検索ボタン62を選択せずとも、所定の時間、発話が行われなければ、領域61の音声認識結果に手がかり語を付加したテキスト情報とその回答を領域64に、また、領域61のテキスト情報に基づいて検索した文書内容を領域66に表示するようにしてもよい。
【0037】
尚、図11に示す検索結果画面60は、Webブラウザ上で実現し、領域64に表示されたリンクの張られた回答を選択することで、ハイパーリンクを辿り、その回答が含まれるページが表示される。例えば、領域65のリンクの張られた回答結果「1枚」を選択すると、図12に示す画面が表示される。
【0038】
このように、検索結果画面60を構成することで、テキスト情報に正しく手がかり語が付加された場合と、誤った手がかり語が付加された場合の両方を識別することができ、情報検索の機能性を向上させることができる。
【0039】
次に、図11に示す領域65を選択した場合に表示される検索結果画面を図12に示す。図12に示す検索結果画面50には、音声認識結果のテキスト情報又は共起情報を含むテキスト情報が表示される領域51と、検索結果の回答を表示する領域52と、回答が出現する文書の内容を表示する領域53とが表示される。図11の例では、「スチーム 付属の乳も皿は名前だったっけ 何枚」と修正された質問の回答を領域52に「1枚」と表示し、さらに、その回答が記載されたページ(の中で最も検索スコアの高かったページ)を領域53に表示する。
【0040】
このように、音声認識したテキスト情報に、手がかり語、検索語を付加して回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。更に、回答が記載されたページも同時に表示するため、質問に対する回答が正確であるか、質問に関するその他の情報を確認することができる。
【0041】
〔第2の実施の形態〕
次に、第2実施形態の情報検索システムについて説明する。第2実施形態の情報検索システムが、第1の実施例の情報検索システムと大きく異なる点は、文書解析部101音声認識の次候補情報を用いて、次候補中にある手がかり語候補を音声認識の第1の候補と差し替える点である。即ち、第2実施形態の情報検索システムは、手がかり語や検索語などの共起情報を追加するのではなく、テキスト情報の一部を共起情報に基づき修正する点で第1実施形態の情報検索システムと異なる。
【0042】
次に、第2実施形態での情報検索システムでの処理について説明する。第2実施形態の情報検索システムは第1実施形態の情報システムと同じ構成で、先ず、ユーザから発声された音声による質問文が、音声認識部102により認識された後、テキスト情報に変換される。制御部105は、音声認識部102から認識結果のテキスト情報を取得し、それを質問修正部103に提供する。質問修正部103は、そのテキスト情報を構成する各語に関する次候補を音声認識部102から取得する。検索部104は、質問修正部103の結果に基づいて回答を検索する。テキスト情報を構成する各語に関して、次候補は一つである必要はなく、複数あってもかまわない。質問修正部103は、テキスト情報に最初から手がかり語や検索語が含まれていれば何もせず、テキスト情報をそのまま検索部104に提供する。また、質問修正部103は、テキスト情報に手がかり語や検索語が含まれず、次候補のいずれにも手がかり語が含まれていない場合も何もせず、テキスト情報をそのまま検索部104に提供する。一方、テキスト情報には手がかり語が含まれていないが、次候補に含まれている場合、テキスト情報の次候補を走査し、最初に発見した手がかり語をその次候補の該当部分に置き換えることでテキスト情報を修正し、その結果を提供する。第2実施形態の情報検索システムでは図8の質問修正処理の中で、検索語検出S20、手がかり語照合S21、検索語照合S22までを行い、手がかり語、検索語付加S23は行わない。第2実施形態の情報検索システムでは手がかり語、検索語付加S23のかわりに図1の音声認識部102が出力する次候補テーブルを走査し、図8の手がかり語照合S21、検索語照合S22の結果である手がかり語や検索語が次候補として存在すれば、その次候補を認識結果の該当部分と差し替える。
【0043】
このように、音声認識されたテキスト情報をユーザにとって自然な形式に修正することで、容易に的確な回答を検索することができるようになる。
【0044】
次に、音声認識部102が出力する次候補テーブルについて説明する。図13に示すテーブル120は、音声認識されたテキスト情報の各文字列に対する次候補のみを示している。例えば、文字列「乳も」に対し、次候補「土も、スチーム…」などが格納されている。図9、10に例示した場合では、第2実施形態の情報検索システムにおいては、質問修正部103は、文字列「乳も」は、次候補の中に照合に成功した検索語「スチーム」があることから、テキスト情報の文字列「乳も」を「スチーム」に修正する。更に、質問修正部103は、文字列「名前」は、次候補の中に「何枚」と「何分」があることから、テキスト情報の文字列「名前」を「何枚」又は「何分」に修正する。質問修正部103により修正されたテキスト情報は、図14に示す検索結果画面に表示される。
【0045】
次に、第2実施形態の検索結果画面について説明する。図14に示す検索結果画面70には、音声認識結果のテキスト情報又は共起情報を含むテキスト情報が表示される領域71と、共起情報を含むテキスト情報とその回答とを類似度の高い順に表示する領域72と、音声認識結果から検索された回答が出現する文書内容を表示する領域73が表示される。図14に示す領域72と、図11に示す領域64と比較すると、領域64で表示された手がかり語「何時間」を含むテキスト情報は、第2実施例では次候補に出現していないため、領域72に表示されない。
【0046】
このように、音声認識したテキスト情報に共起情報を付加し、その共起情報から回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【0047】
上記実施形態で説明した情報検索処理は、ハードウェアによって実現することもできるし、コンピュータを用いてソフトウェアにより実行することもできる。すなわち、本発明によると、音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、第1のテキスト情報を修正して質問に対する回答を導き出すための手がかり語及び該手がかり語を含む第2のテキスト情報を生成するステップと、第2のテキスト情報を用いて文書データベースを検索し、回答を抽出するステップとを含むとを含むデータベース検索処理をコンピュータに行わせるためのプログラムを提供することもできる。
【図面の簡単な説明】
【0048】
【図1】本発明の第1実施形態に従う情報検索システムを示すブロック図
【図2】情報検索システムの適用例を示す図
【図3】データベース検索処理を示すフローチャート
【図4】文書解析処理を示すフローチャート
【図5】回答候補検索処理及び文字列切出し処理を説明するための図
【図6】形態素解析処理及び共起関係抽出処理を説明するための図
【図7】共起情報DBに格納されたテーブルを示す図
【図8】質問付加処理を示すフローチャート
【図9】検索語検出処理及び手がかり語照合処理を説明するための図
【図10】検索語照合処理を説明するための図
【図11】第1実施形態の検索結果画面を示す図
【図12】第1実施形態の検索結果画面を示す図
【図13】第2実施形態の共起情報DBに格納されたテーブルを示す図
【図14】第2実施形態の検索結果画面を示す図
【符号の説明】
【0049】
1・・・ネットワーク;
10・・・文書DB;
11、12・・・共起情報DB;
101・・・文書解析部;
102・・・音声認識部;
103・・・質問修正部;
104・・・検索部;
105・・・制御部;
106・・・表示部;
201・・・音声入力装置;
202・・・ポインティングデバイス;
203・・・表示装置;
204・・・CPU;
205・・・メモリ;
206・・・ディスク;
301・・・クライアント端末;
302・・・サーバ;
104・・・回答提示部;
【技術分野】
【0001】
本発明は、音声入力した質問に対する回答を検索する情報検索システム、方法及びプログラムに関する。
【背景技術】
【0002】
従来、ユーザから音声として入力された質問に対する回答を検索し、その検索結果を表示、又は音声として出力する質問応答システムが多く提案されている。このようなシステムでは、一般的に、事前に用意された問題解決用知識(データベース)を用いて回答を生成する。このような質問応答システムでは、入力された質問が曖昧な場合、ユーザが求める回答を生成することが難しい。
【0003】
曖昧性のある質問に対しては、ユーザへ追加質問を行い、ユーザから追加質問に対する回答を得ることにより、曖昧性を解消するなどの工夫が提案されている。例えば、特許文献1(特開2002−63209号公報)には、コンテンツを登録した候補リストを保持し、他の装置から入力される検索条件に基づいて、その候補リストに登録されているコンテンツの類似度を算出し、算出された類似度が所定の閾値より小さい場合、対応するコンテンツを候補リストから削除し、候補リストに残っているコンテンツの総数が所定の個数以上である場合、他の装置に対して質問事項を提示し、他の装置から入力される追加の検索条件に基づいて、コンテンツの類似度をさらに算出するようにした情報処理装置が記載されている。
【0004】
また、従来のシステムにおいて、自然文の質問であるテキスト情報を解析し、解析結果に基づいて文書データベースから必要な回答を検索する質問応答型検索の研究開発が行われている。この質問応答型の検索が、通常の文書検索と異なる点は、質問に対する回答を文書単位ではなく、過不足なく提示することにある。例えば、「富士山の標高は何mですか」という質問には「3,776m」と回答する。
【特許文献1】特開2002−63209号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
従来、音声入力に対して質問応答型検索を実現するためには、先ず、入力された音声を音声認識処理によりテキスト情報に変換しなければならないが、文書データベースから検索を行う質問応答型検索システムでは、音声認識誤りがある場合の対応が非常に難しい。
【0006】
自然文の質問で音声入力し、文書検索を行う場合、質問中に音声認識誤りが含まれていても、正しく認識された部分により文書検索を行うことができるが、文書データベースから検索を行う質問応答型検索では回答(長さ、重さなど回答の種類)を推定するための手がかり語(何m、何kgなど)の部分に認識誤りがあると、的確な回答を検索することができない。
【0007】
従って、本発明の目的は、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる質問応答型の情報検索システム、方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本発明の一つの観点では、音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成する音声認識手段と、前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成する生成手段と、前記第2のテキスト情報を用いて文書データベースから前記回答を検索する検索手段とを具備する。
【0009】
本発明の他の観点では、音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成するステップと、前記第2のテキスト情報を用いて文書データベースから前記回答を検索するステップとを具備する。
【発明の効果】
【0010】
本発明によれば、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。更に、本発明は検索を開始して回答に到達するまでの時間や、検索処理にかかるコストを削減することができる。
【発明を実施するための最良の形態】
【0011】
以下、図面を参照して本発明の実施の形態について説明する。
【0012】
〔第1実施形態〕
図1は、本発明の第1実施形態に従う情報検索システムを示すブロック図である。図1に示す情報検索システムは、ユーザから音声入力された質問を音声認識してテキスト情報に変換し、変換したテキスト情報に基づいて質問に対する回答を検索し、検索結果をユーザに提供するシステムである。情報検索システムでは、予め、文書解析部101により、検索対象の文書が事前に登録された専用の文書データベース(以下DBと呼ぶ)10の文書データ中から、検索語になりうる語と回答になりうる候補の表現(回答候補)との共起関係が解析される。その後、文書解析部101は、前記回答候補を導くための手がかり語と検索語の間の共起情報を共起情報データベース(以下DBと呼ぶ)11に格納する。尚、「共起関係」とは、共起関係にある単語が近傍に同時に現れるという関係を示している。情報検索システムは、これらの手がかり語及び検索語の中から質問中に現れた語を用いて音声入力された質問に対する回答を検索する。
【0013】
情報検索システムでの処理の流れを詳細に説明する。情報検索システムでは、ユーザから発声された音声による質問文が、音声認識部102により認識された後、テキスト情報に変換される。テキスト情報に変換された情報は、質問修正部103に提供される。質問修正部103は、テキスト情報を解析し、共起情報DB11から対応する共起情報を選択し、その共起情報を用いてテキスト情報に手がかり語を付加する。質問修正部103は、付加した手がかり語を含むテキスト情報を検索部104に提供する。検索部104は、質問修正部103からのテキスト情報と付加された手がかり語に基づいて文書DB10を参照し、その中から質問に対する回答を検索する。また、検索部104は、制御部105に回答を提供する。表示部106には、制御部105の制御により回答が表示される。制御部105は、音声認識部102から表示部106までを適切なタイミングで呼び出し、ユーザの操作に応じた制御を行う。
【0014】
尚、情報検索システムでの全体の処理について図3で、文書解析部101の処理について図4〜図6で、質問修正部103の処理について図8〜図10で詳細に説明する。また、共起情報DB11については図7で詳細に説明する。
【0015】
このように、情報検索システムで、音声認識結果であるテキスト情報に共起情報を付加し、その共起情報に基づいて回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【0016】
さらに、図1に示す情報検索システムは、図2に示すように一般のパーソナルコンピュータ(PC)などのクライアント端末301上で実現可能である。以下に、図1の構成と図2の構成と対応させて情報検索システムで実行される処理を説明する。先ず、情報検索システムで実行されるプログラムをディスク206にインストールして起動させる。図1に示す各処理を制御部105であるCPU204で制御することにより、データベース検索処理が実行される。次に、図1に示す音声認識部102は、マイクなどの音声入力装置201を通して入力された音声をテキスト情報に変換する。制御部105は、マウスなどのポインティングデバイス202による画面上の操作に応じて、音声認識処理の開始や終了、質問応答処理の起動を制御する。また、制御部105は、音声認識部102、質問修正部103、検索部104での結果をディスプレイなどの表示部106に対応する表示装置203に表示させる。同時に、制御部105が各処理を制御する場合、メモリ205に一時的にデータを格納する。
【0017】
さらに、情報検索システムでの処理をクライアント端末301上だけでなく、そのクライアント端末301とネットワーク1で接続されたサーバコンピュータであるサーバ302に処理やデータベースを分散配置してもよい。例えば、音声認識部102はクライアント端末301で、また、文書解析部101、質問修正部103、検索部104、文書DB10、共起情報DB11はサーバ302で、制御部105、表示部106はクライアント端末301とサーバ302の両方で実行するような配置にしてもよい。
【0018】
例えば、クライアント端末301上でWebブラウザを用い、クライアント端末301上で動作する制御部105はJava Script(登録商標)で記述する。一方、サーバ302上でJSP(Java Server Pages)に対応したWebサーバを用い、サーバ302上で動作する制御部105はJSPによって記述し、図1の各部をJava Script(登録商標)やJava(登録商標)から呼び出せる形式で実装することで、それらの呼び出しや相互間のデータの受渡し、結果の表示などを分散した環境上で実現することができる。
【0019】
また、音声認識部102は、図2の音声入力装置201により入力された音声のディクテーションを行い、その結果であるテキスト情報を表示装置203に表示する。音声のディクテーション処理や結果表示処理は、市販の専用のソストウェアにより外部から制御することができる。音声認識部102はそのようなソフトウェアを用いる。
【0020】
次に、図1に示す情報検索システムで実行されるデータベース検索処理について説明する。図3において、先ず、音声認識部102へ質問の音声が入力される(ステップS1)。音声認識部102は、入力された音声を認識し、テキスト情報に変換する(ステップS2)。質問修正部103は、テキスト情報から共起情報を抽出し、その共起情報に従いテキスト情報を修正する(ステップS3)。検索部104は、修正されたテキスト情報に基づいて文書DB10から回答を検索し、抽出する(ステップS4)。検索部104は、抽出した回答を制御部105に提供する。制御部105は、表示部106に回答を提示する(ステップS5)。
【0021】
このように、共起情報に従い修正されたテキスト情報に基づいて回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【0022】
次に、文書解析部101による文書解析処理について図4〜図6を用いて説明する。図4において、先ず、文書解析部101は、文書DB10から質問応答型検索の回答になる可能性のある表現(回答候補)を探索する(ステップS10)。次に、文書解析部101は、探索した回答侯補の前後の予め定められた区間の文字列を切り出す(ステップS11)。例えば、図5に示すように、例1の場合、テキスト情報の「…スチーム皿 1枚…」の「枚」という単位表現が探索され(ステップS10に対応)、その単語を中心に、前後の所定の文字列を切り出す(ステップS11に対応)。また、例2の場合、テキスト情報の「…皿にのせて5分間だけ加熱します…」の「分」という単位表現が探索され、その単語を中心に、前後の所定の文字列を切り出す。尚、m(メートル)、cm(センチメートル)、g(グラム)、kg(キログラム)など長さや重さなどの単位のついた数量表現を探索するようにしてもよい。このことにより、「枚」や「分」、あるいは、長さや重さなどの単位表現を予め指定しておくことで図4のステップS10とステップS11においては、それら単位表現の前後の予め定められた区間(例えば文字数)の文字列が文書から切り出されるようになる。
【0023】
次に、図4に示すように、文書解析部101は、切り出した文字列を形態素に分解し、その品詞を解析する(ステップS12)。形態素解析は機械翻訳などの自然言語処理で、従来から行われている処理のため、ここでは詳細な説明を省略する。次に、文書解析部101は、形態素解析の結果に基づいて、切り出した文字列中から予め定められた品詞(ここでは名詞)の語(検索語)を抽出し、その検索語と回答候補を介して間接的な共起関係にある手がかり語を作成する(ステップS13)。文書解析部101は、検索語と手がかり語と対応付けて共起情報DB11に格納する(ステップS14)。
【0024】
例えば、図6に示すように、切り出された文字列の「皿にのせて5分間だけ加熱」を形態素解析すると、「皿<名詞>に<付属語>のせ<動詞>て<付属語>5<数字>分間<単位>だけ<付属語>加熱<名詞>」となり、その形態素の中から名詞「皿」、「加熱」を抽出する(ステップS12に対応)。この場合、切り出された文字列中に「5分」という回答と関連する表現から、回答の単位「分」に「何」を付けて手がかり語「何分」を生成し、検索語と手がかり語とを対応付けて共起情報DB11に格納する(ステップS13に対応)。
【0025】
即ち、本実施形態の場合、回答の単位(すなわち、図4のステップS10で着目した単位表現)の前に「何」をつけることで手がかり語を自動生成し、共起情報DB11に格納する。尚、検索語と手がかり語の対応付けに関しては、対応付けのルールを用意してもよい。例えば、正規表現で回答候補のカテゴリを記述し、各正規表現と手がかり語を対応付けておく。回答候補とそれらの正規表現と照合し、照合できた正規表現に対応づけられた手がかり語をその回答候補に対応させる、という方法も考えられる。また、検索語と手がかり語とを対応付けて、双方向に対応付けられた両者を辿れるように、共起情報を図7に示すような二つの形式で共起情報DB11に格納する。
【0026】
次に、共起情報DB11に格納されるテーブルについて説明する。図7に示すテーブル110に、検索語と手がかり語との対応が二つの形式で格納されている。第1の形式では、一つの手がかり語に複数の検索語が対応付けられ、第2の形式では、一つの検索語に複数の手がかり語が対応付けられている。例えば、第1の形式で、手がかり語「何枚」に対し検索語「皿、ベーコン、ピザ、スチーム…」が格納され、第2の形式で、検索語「皿」に対し手がかり語「何枚、何分、何時間…」が格納されている。図6に示す例によれば、抽出された検索語「皿、加熱」から手がかり語「何分」が生成されるため、第1の形式で手がかり語「何分」に対し検索語「皿、加熱」が格納され、第2の形式で検索語「皿」、「加熱」に対し手がかり語「何分」がそれぞれ格納される。
【0027】
次に、質問修正部103による質問付加処理について図8〜図10を用いて説明する。図8において、先ず、質問修正部103は、テキスト情報中に図7に示した検索語が含まれているかを調べ、その検索語に対応する手がかり語を図7に示された共起情報から列挙する(ステップS20)。質問修正部103は、列挙された手がかり語とテキスト情報中の表現との文字列上の類似度を測定し、予め定められた閾値以上の類似度で照合できた手がかり語を選択する(ステップS21)。
【0028】
文字列上の類似度は、手がかり語とテキスト情報との双方の読みをローマ字に変換し、両者の編集距離d(両者を一致させるための文字単位の置換、挿入、削除の最小回数)を基に、手がかり語の文字数をLとすると、
類似度S=1―(d/L)
で求める。
【0029】
尚、テキスト情報全体を手がかり語と照合し、テキスト情報の部分文字列内で手がかり語との最大の類似度をもつ文字列との間の類似度を、手がかり語とテキスト情報との類似度とする。これは、質問文を先頭から一文字ずらした部分文字列を手がかり語と照合し、かつ、手がかり語の終端まで照合処理が到達したときに、そこで類似度計算を停止することで実現できる。これにより、上記のdはL以下になり、類似度Sは0から1の間の値をとる。
【0030】
例えば、図9に示すように、テキスト情報「付属の乳も皿は名前だっけ」に含まれる検索語を抽出し、抽出された検索語「皿」から共起情報DB11を参照して手がかり語「何枚、何分、何時間…」を列挙する(ステップS20に対応)。次に、列挙された手がかり語の中から、先ず、手がかり語「何枚(nanmai)」のローマ字表記のうち、三文字目のnを削除し、最後の文字iをeに修正するとテキスト情報中の「namae」と一致させることができる。そのため、ローマ字表記したテキスト情報と、ローマ字表記した手がかり語「何枚」との類似度を測定すると、類似度S=1−(2/6)≒0.67(尚、2は、削除と修正した文字との間の距離d(=2)、6は手がかり語「nanmai」の文字長)となる。同様に、他の手がかり語「何分、何時間…」も類似度を求め、閾値以上の手がかり語を類似度順にソートする(ステップS21に対応)。
【0031】
図8に戻り、質問修正部103は、予め定められた類似度以上の手がかり語を発見したとき、その手がかり語に基づいて、図7に示された共起情報から対応する検索語を列挙する。質問修正部103は、手がかり語のときと同様に、検索語とテキスト情報とを照合し、予め定められた類似度以上のものを選択する(ステップS22)。最後に、質問修正部103は、選択された手がかり語をテキスト情報の末尾に、検索語をテキスト情報の先頭に付加する(ステップS23)。ただし、付加しようとする手がかり語、あるいは、検索語が音声認識結果のテキスト情報中に最初から含まれていれば付加しない。
【0032】
例えば、図10において、質問修正部103によるテキスト情報と手がかり語との照合の結果、手がかり語「何枚、何分、何時間」の三つが残ったとする。図7に示す共起情報から、それらの手がかり語と共起する「ベーコン、ピザ、スチーム、オーブン、予熱、加熱」がテキスト情報と照合される。説明の便宜上、その結果、手がかり語「何枚、何分」を介した検索語「スチーム」のみがテキスト情報との照合で予め定められた閾値以上の類似度をもち、残ったとする。質問修正部103は、得られた手がかり語をテキスト情報の末尾に、検索語をテキスト情報の先頭に付加する。この時、手がかり語ごとに、テキスト情報へ手がかり情報及び検索語が付加される。例えば、手がかり語「何枚」の場合、テキスト情報の先頭に検索語「スチーム」、末尾に手がかり語「何枚」が付加される。ただし、手がかり情報「何時間」の場合、手がかり情報「何時間」と検索語「スチーム」が共起していないため、テキスト情報の先頭に検索語「スチーム」は付加されない。
【0033】
更に、質問修正部103による処理の後、検索部104は、予め検索対象のテキスト情報が格納された文書DB10を参照し、質問修正部103の処理後のテキスト情報に基づいて回答を検索する。テキスト情報に手がかり語が含まれている場合、質問応答型検索を実行し、手がかり語が含まれていない場合、従来型の文書検索を実行する。
【0034】
テキスト情報に手がかり語が含まれている場合、質問応答型検索では、最初に、手がかり語に基づいて回答の種類を特定する。回答の種類とは重さや長さなど、回答として出力すべき表現の種類のことである。次に、テキスト情報を元にベクトル空間法などの従来型の文書検索を文書DB10に対して実行した後、その検索結果の上位の文書群を走査し、上記で特定された回答の種類と合致する回答候補の語を抽出する。最後に、抽出した回答候補の語を同一文書中のヒットワード(テキスト情報中の語で文書中に出現したもの)との距離(出現位置の近さ、例えば文字数を単位とする距離)でランキングし、1位のものを回答として出力する。図12に示す検索結果画面の回答が出現する文書内容を表示した領域53を用いて説明すると、文書中に出現するヒットワード「スチーム皿」の前後の文字群から、その「スチーム皿」と最も近い「枚」を含む文字列「1枚」(但し、改行を含む文字群は走査の対象から除く)を回答として出力する。
【0035】
尚、その際、回答だけでなく、その回答が含まれていた文書の中で質問のテキスト表現に対する文書検索の検索スコアが最も高かったものの文書情報(文書IDなど)も回答に付加する。テキスト情報中に回答を特定するための手がかり語が含まれていなかった場合、従来型の文書検索を実行し、検索スコアが最も高かった文書の文書情報を提供する。
【0036】
次に、回答等が提供された場合、表示装置203に表示される第1実施形態の検索結果画面について説明する。図11に示す検索結果画面60には、音声認識結果のテキスト情報が表示される領域61と、音声入力した質問に対する回答を検索する検索ボタン62と、領域61の音声認識結果をクリアするクリアボタン63と、手がかり語を含むテキスト情報とその回答とを類似度の高い順に表示する領域64と、音声認識結果から検索された回答が出現する文書内容を表示する領域66が表示される。領域64には、例えば、図10に示すような手がかり語が付加されたテキスト情報が、類似度の高い順に表示される。この時、検索ボタン62を選択すると、それぞれの回答がリンクの張られた状態で領域64の右側に表示される。更に、領域61に表示された音声認識結果のテキスト情報に基づいて、通常と同様に検索された回答が出現する文書内容が領域66に表示される。なお、検索ボタン62を選択せずとも、所定の時間、発話が行われなければ、領域61の音声認識結果に手がかり語を付加したテキスト情報とその回答を領域64に、また、領域61のテキスト情報に基づいて検索した文書内容を領域66に表示するようにしてもよい。
【0037】
尚、図11に示す検索結果画面60は、Webブラウザ上で実現し、領域64に表示されたリンクの張られた回答を選択することで、ハイパーリンクを辿り、その回答が含まれるページが表示される。例えば、領域65のリンクの張られた回答結果「1枚」を選択すると、図12に示す画面が表示される。
【0038】
このように、検索結果画面60を構成することで、テキスト情報に正しく手がかり語が付加された場合と、誤った手がかり語が付加された場合の両方を識別することができ、情報検索の機能性を向上させることができる。
【0039】
次に、図11に示す領域65を選択した場合に表示される検索結果画面を図12に示す。図12に示す検索結果画面50には、音声認識結果のテキスト情報又は共起情報を含むテキスト情報が表示される領域51と、検索結果の回答を表示する領域52と、回答が出現する文書の内容を表示する領域53とが表示される。図11の例では、「スチーム 付属の乳も皿は名前だったっけ 何枚」と修正された質問の回答を領域52に「1枚」と表示し、さらに、その回答が記載されたページ(の中で最も検索スコアの高かったページ)を領域53に表示する。
【0040】
このように、音声認識したテキスト情報に、手がかり語、検索語を付加して回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。更に、回答が記載されたページも同時に表示するため、質問に対する回答が正確であるか、質問に関するその他の情報を確認することができる。
【0041】
〔第2の実施の形態〕
次に、第2実施形態の情報検索システムについて説明する。第2実施形態の情報検索システムが、第1の実施例の情報検索システムと大きく異なる点は、文書解析部101音声認識の次候補情報を用いて、次候補中にある手がかり語候補を音声認識の第1の候補と差し替える点である。即ち、第2実施形態の情報検索システムは、手がかり語や検索語などの共起情報を追加するのではなく、テキスト情報の一部を共起情報に基づき修正する点で第1実施形態の情報検索システムと異なる。
【0042】
次に、第2実施形態での情報検索システムでの処理について説明する。第2実施形態の情報検索システムは第1実施形態の情報システムと同じ構成で、先ず、ユーザから発声された音声による質問文が、音声認識部102により認識された後、テキスト情報に変換される。制御部105は、音声認識部102から認識結果のテキスト情報を取得し、それを質問修正部103に提供する。質問修正部103は、そのテキスト情報を構成する各語に関する次候補を音声認識部102から取得する。検索部104は、質問修正部103の結果に基づいて回答を検索する。テキスト情報を構成する各語に関して、次候補は一つである必要はなく、複数あってもかまわない。質問修正部103は、テキスト情報に最初から手がかり語や検索語が含まれていれば何もせず、テキスト情報をそのまま検索部104に提供する。また、質問修正部103は、テキスト情報に手がかり語や検索語が含まれず、次候補のいずれにも手がかり語が含まれていない場合も何もせず、テキスト情報をそのまま検索部104に提供する。一方、テキスト情報には手がかり語が含まれていないが、次候補に含まれている場合、テキスト情報の次候補を走査し、最初に発見した手がかり語をその次候補の該当部分に置き換えることでテキスト情報を修正し、その結果を提供する。第2実施形態の情報検索システムでは図8の質問修正処理の中で、検索語検出S20、手がかり語照合S21、検索語照合S22までを行い、手がかり語、検索語付加S23は行わない。第2実施形態の情報検索システムでは手がかり語、検索語付加S23のかわりに図1の音声認識部102が出力する次候補テーブルを走査し、図8の手がかり語照合S21、検索語照合S22の結果である手がかり語や検索語が次候補として存在すれば、その次候補を認識結果の該当部分と差し替える。
【0043】
このように、音声認識されたテキスト情報をユーザにとって自然な形式に修正することで、容易に的確な回答を検索することができるようになる。
【0044】
次に、音声認識部102が出力する次候補テーブルについて説明する。図13に示すテーブル120は、音声認識されたテキスト情報の各文字列に対する次候補のみを示している。例えば、文字列「乳も」に対し、次候補「土も、スチーム…」などが格納されている。図9、10に例示した場合では、第2実施形態の情報検索システムにおいては、質問修正部103は、文字列「乳も」は、次候補の中に照合に成功した検索語「スチーム」があることから、テキスト情報の文字列「乳も」を「スチーム」に修正する。更に、質問修正部103は、文字列「名前」は、次候補の中に「何枚」と「何分」があることから、テキスト情報の文字列「名前」を「何枚」又は「何分」に修正する。質問修正部103により修正されたテキスト情報は、図14に示す検索結果画面に表示される。
【0045】
次に、第2実施形態の検索結果画面について説明する。図14に示す検索結果画面70には、音声認識結果のテキスト情報又は共起情報を含むテキスト情報が表示される領域71と、共起情報を含むテキスト情報とその回答とを類似度の高い順に表示する領域72と、音声認識結果から検索された回答が出現する文書内容を表示する領域73が表示される。図14に示す領域72と、図11に示す領域64と比較すると、領域64で表示された手がかり語「何時間」を含むテキスト情報は、第2実施例では次候補に出現していないため、領域72に表示されない。
【0046】
このように、音声認識したテキスト情報に共起情報を付加し、その共起情報から回答を検索することにより、質問の音声入力に認識誤りがある場合にも的確な回答を検索してユーザに提供することができる。
【0047】
上記実施形態で説明した情報検索処理は、ハードウェアによって実現することもできるし、コンピュータを用いてソフトウェアにより実行することもできる。すなわち、本発明によると、音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、第1のテキスト情報を修正して質問に対する回答を導き出すための手がかり語及び該手がかり語を含む第2のテキスト情報を生成するステップと、第2のテキスト情報を用いて文書データベースを検索し、回答を抽出するステップとを含むとを含むデータベース検索処理をコンピュータに行わせるためのプログラムを提供することもできる。
【図面の簡単な説明】
【0048】
【図1】本発明の第1実施形態に従う情報検索システムを示すブロック図
【図2】情報検索システムの適用例を示す図
【図3】データベース検索処理を示すフローチャート
【図4】文書解析処理を示すフローチャート
【図5】回答候補検索処理及び文字列切出し処理を説明するための図
【図6】形態素解析処理及び共起関係抽出処理を説明するための図
【図7】共起情報DBに格納されたテーブルを示す図
【図8】質問付加処理を示すフローチャート
【図9】検索語検出処理及び手がかり語照合処理を説明するための図
【図10】検索語照合処理を説明するための図
【図11】第1実施形態の検索結果画面を示す図
【図12】第1実施形態の検索結果画面を示す図
【図13】第2実施形態の共起情報DBに格納されたテーブルを示す図
【図14】第2実施形態の検索結果画面を示す図
【符号の説明】
【0049】
1・・・ネットワーク;
10・・・文書DB;
11、12・・・共起情報DB;
101・・・文書解析部;
102・・・音声認識部;
103・・・質問修正部;
104・・・検索部;
105・・・制御部;
106・・・表示部;
201・・・音声入力装置;
202・・・ポインティングデバイス;
203・・・表示装置;
204・・・CPU;
205・・・メモリ;
206・・・ディスク;
301・・・クライアント端末;
302・・・サーバ;
104・・・回答提示部;
【特許請求の範囲】
【請求項1】
音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成する音声認識手段と、
前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成する生成手段と、
前記第2のテキスト情報を用いて文書データベースから前記回答を検索する検索手段とを具備する情報検索システム。
【請求項2】
回答を検索するための手がかり語候補と文書検索に用いる検索語とを共起関係を用いて対応付けて記憶した記憶手段をさらに具備し、前記生成手段は前記第1のテキスト情報を参照して前記記憶手段から前記手がかりとなる第2のテキスト情報を選択する請求項1記載の情報検索システム。
【請求項3】
前記記憶手段は、一つの手がかり語候補に対応付けて複数の検索語を記憶し、一つの検索語に対応付けて複数の手がかり語候補を記憶する請求項2記載の情報検索システム。
【請求項4】
前記第1のテキスト情報から検索語を探索する探索手段と、
前記第1のテキスト情報から前記回答の一部が含まれる語を前記手がかり語候補として生成する生成手段とをさらに具備する請求項2または3記載の情報検索システム。
【請求項5】
前記生成手段は、前記第1のテキスト情報から前記検索語を検出する検出手段と、
前記検出手段により検出された検索語に対応する複数の手がかり語候補から前記第1のテキスト情報中の語との類似度が閾値以上の手がかり語候補を選択する手段と、
選択された手がかり語候補の各々を前記第1のテキスト情報に付加することにより複数の前記第2のテキスト情報を生成する手段とを有する請求項2記載の情報検索システム。
【請求項6】
前記第2のテキスト情報と前記回答とを併せて表示する表示手段をさらに具備する請求項1記載の情報検索システム。
【請求項7】
前記複数の第2のテキスト情報を前記類似度の順に前記回答と併せて表示する表示手段をさらに具備する請求項5記載の情報検索システム。
【請求項8】
前記表示手段は、前記回答を該回答が含まれる前記データベース内の文書データとリンクさせて表示する請求項6記載の情報検索システム。
【請求項9】
前記第1のテキスト情報を構成する語について音声認識の次候補を記憶した記憶手段をさらに具備し、
前記生成手段は、前記第1のテキスト情報中の語を前記次候補で置き換えることにより前記第2のテキスト情報を生成する請求項1記載の情報検索システム。
【請求項10】
音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、
前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成するステップと、
前記第2のテキスト情報を用いて文書データベースから前記回答を検索するステップとを具備する情報検索方法。
【請求項11】
音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、
前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成するステップと、
前記第2のテキスト情報を用いて文書データベースから前記回答を検索するステップとを含む情報検索処理をコンピュータに行わせるためのプログラム。
【請求項1】
音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成する音声認識手段と、
前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成する生成手段と、
前記第2のテキスト情報を用いて文書データベースから前記回答を検索する検索手段とを具備する情報検索システム。
【請求項2】
回答を検索するための手がかり語候補と文書検索に用いる検索語とを共起関係を用いて対応付けて記憶した記憶手段をさらに具備し、前記生成手段は前記第1のテキスト情報を参照して前記記憶手段から前記手がかりとなる第2のテキスト情報を選択する請求項1記載の情報検索システム。
【請求項3】
前記記憶手段は、一つの手がかり語候補に対応付けて複数の検索語を記憶し、一つの検索語に対応付けて複数の手がかり語候補を記憶する請求項2記載の情報検索システム。
【請求項4】
前記第1のテキスト情報から検索語を探索する探索手段と、
前記第1のテキスト情報から前記回答の一部が含まれる語を前記手がかり語候補として生成する生成手段とをさらに具備する請求項2または3記載の情報検索システム。
【請求項5】
前記生成手段は、前記第1のテキスト情報から前記検索語を検出する検出手段と、
前記検出手段により検出された検索語に対応する複数の手がかり語候補から前記第1のテキスト情報中の語との類似度が閾値以上の手がかり語候補を選択する手段と、
選択された手がかり語候補の各々を前記第1のテキスト情報に付加することにより複数の前記第2のテキスト情報を生成する手段とを有する請求項2記載の情報検索システム。
【請求項6】
前記第2のテキスト情報と前記回答とを併せて表示する表示手段をさらに具備する請求項1記載の情報検索システム。
【請求項7】
前記複数の第2のテキスト情報を前記類似度の順に前記回答と併せて表示する表示手段をさらに具備する請求項5記載の情報検索システム。
【請求項8】
前記表示手段は、前記回答を該回答が含まれる前記データベース内の文書データとリンクさせて表示する請求項6記載の情報検索システム。
【請求項9】
前記第1のテキスト情報を構成する語について音声認識の次候補を記憶した記憶手段をさらに具備し、
前記生成手段は、前記第1のテキスト情報中の語を前記次候補で置き換えることにより前記第2のテキスト情報を生成する請求項1記載の情報検索システム。
【請求項10】
音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、
前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成するステップと、
前記第2のテキスト情報を用いて文書データベースから前記回答を検索するステップとを具備する情報検索方法。
【請求項11】
音声として入力された質問に対して音声認識を行い、第1のテキスト情報を生成するステップと、
前記第1のテキスト情報を修正して前記質問に対する回答を検索するための手がかりとなる第2のテキスト情報を生成するステップと、
前記第2のテキスト情報を用いて文書データベースから前記回答を検索するステップとを含む情報検索処理をコンピュータに行わせるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2006−209022(P2006−209022A)
【公開日】平成18年8月10日(2006.8.10)
【国際特許分類】
【出願番号】特願2005−24360(P2005−24360)
【出願日】平成17年1月31日(2005.1.31)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
【公開日】平成18年8月10日(2006.8.10)
【国際特許分類】
【出願日】平成17年1月31日(2005.1.31)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
[ Back to top ]