説明

質問回答検索システム及びその方法とプログラム

【課題】入力された質問文からでは回答が絞り込めない場合に、適切な絞込みキーワードを提示し、回答の特定を支援する質問回答検索システム及びその方法とプログラムを提供すること。
【解決手段】質問文と回答文との対を含む事例が記憶された事例データベースと、事例の質問文に含まれるキーワードの重要度を質問文の対の回答文同士の類似度を用いて計算し、重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する絞込みキーワード選択手段とを有する質問回答検索システムである。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は質問回答検索システム及びその方法とプログラムに関する。
【背景技術】
【0002】
企業のコンタクトセンターのオペレータ等は、顧客からの電話や電子メールでの問い合わせに対して適切な回答が求められる。コンタクトセンターのオペレータの応対記録は、顧客からの質問とオペレータの回答との対を記録した事例データベースとして蓄積される。このような事例データベースから参考となる回答を検索できる質問回答システムがあれば、オペレータの回答内容の品質向上や応対時間の短縮が期待できる。
【0003】
事例データベースを用いた質問回答システムは、従来から提案されている。これらは、利用者が質問文を入力すると、その質問文と類似度が高い事例データベースに格納された質問文を検出し、その回答文を回答候補として利用者に提示する。例えば、特許文献1は、類似度を計算する際に、精密な言語解析を用いて入力された質問文と事例データベースの質問文とを比較することを特徴としている。
【特許文献1】特開2006−244262号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
従来の質問回答システムの課題は、入力された質問文だけでは必ずしも回答が十分に特定できないことである。例えば、図1のように「紙詰まり」を質問文として障害事例データベースを検索した結果、質問文が類似する(「紙詰まり」を含む)5つの事例の回答文が回答候補として検索されたとする。ここで、障害事例データベースには障害の現象と原因のペアが格納されており、質問文を検索するのは現象文、回答候補として提示するのは原因文である。この例から、「紙詰まり」という現象だけでは、その障害の原因が「LDユニット」にあるのか「ピックローラ」にあるのかが明らかではなく、質問文に対する回答が十分に特定できない。
【0005】
そこで、本発明は上記課題に鑑みて発明されたものであって、入力された質問文からでは回答が絞り込めない場合に、適切な絞込みキーワードを提示し、回答の特定を支援する質問回答検索システム及びその方法とプログラムを提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決する本発明は、質問文と回答文との対を含む事例が記憶された事例データベースと、前記事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算し、前記重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する絞込みキーワード選択手段とを有する質問回答検索システムである。
【0007】
上記課題を解決する本発明は、質問文と回答文との対を含む事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算し、前記重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する質問回答検索方法である。
【0008】
上記課題を解決する本発明は、質問文と回答文との対を含む事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算する処理と、前記重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する処理とを情報処理装置に実行させるプログラムである。
【発明の効果】
【0009】
本発明は、入力された質問文からでは回答が十分に特定できない(絞り込めない)場合に、回答を絞り込むキーワードを提示することにより、回答の特定を支援することができる。
【発明を実施するための最良の形態】
【0010】
本発明を実施するための最良の形態について図面を参照して詳細に説明する。
【0011】
まず、本発明の実施の形態の概要を説明する。
【0012】
例えば、質問文として「紙詰まり」が入力されたとする。事例検索手段は、図1のように質問文に「紙詰まり」を含む事例を検索する。その結果、ID1からID5の五つの事例が得られたとする。
【0013】
次に、絞込みキーワード選択手段は、事例検索手段により得られた事例の質問文に含まれるキーワードの重要度を、質問文と対の回答文同士の類似度を用いて計算する。ここでは、質問文に含まれる自立語をキーワードとすると、5つの事例では、「紙詰まり」、「頻発」、「印字」、「薄い」、「最近」、「思う」等が該当する。これらのすべてのキーワードの重要度を、そのキーワードを含む事例の回答文同士の類似度の平均値によって求める。例えば、図2のようにキーワード「薄い」の重要度を計算する際には、「薄い」を含むID1からID3の回答文間の類似度sim(1,2), sim(1,3), sim(2,3)の平均値を求める。同様に、図3のように「印字」の重要度を計算する際には、「印字」を含むID1からID5の回答文間の類似度の平均値を求める。類似度の計算の方法は後述するが、ここでは、回答文間の類似度の平均値(重要度)が、「薄い」は0.78、「印字」は0.43であったとする。
【0014】
絞込みキーワード選択手段は、重要度の順にあらかじめ指定された個数、又は重要度が閾値以上のキーワードを、絞込みキーワードとして選択して利用者に提示する。
【0015】
利用者は、提示された絞込みキーワードを見て、「紙詰まり」以外にも「(印字が)薄い」、「異常音」等の絞込みキーワードに該当する障害が発生しているかを確認し、もし発生している場合は、その絞込みキーワードを含めた質問文で再度検索することで、回答の特定(絞り込み)が可能となる。図4、5は絞込みキーワードとそれに対応する事例とを表示したものであり、図4は絞込みキーワード「(印字が)薄い」とこれに対応する事例とを表示したものであり、図5は絞込みキーワード「異常音」とこれに対応する事例とを表示したものである。
【0016】
キーワードの重要度を、それを含む文書間の類似度に基づいて計算する方法は、Term Strengthと呼ばれ文献1(Wilbur, J.W. and Sirotkin, K., The automatic identification of stop words, Journal of Information Science, 18, pp.45-55, 1992.)で提案されている。キーワードの主題になりやすさ(≒キーワードの役割の文書での重要性≒不要語になりにくさ)を図る指標で、キーワードが文書の主題に近いほど、キーワードを含む対象文書の内容は類似しやすいという性質に基づく。上記の文献1と本実施の形態との違いは、文献1をそのまま適用すると、質問文に含まれるキーワードの重要度をその質問文同士の類似度に基づいて計算することになるが、本実施の形態は質問文に含まれるキーワードの重要度をその回答文同士の類似度に基づいて計算している点である。この違いにより、入力された質問文からでは回答が十分に特定できない(絞り込めない)場合に、回答を特定しやすい(回答間の類似度が高い)絞込みキーワードを提示することができるという新たな効果を有する。
【0017】
直感的には、事例の質問文の内容と回答文の内容とには相関があるため、事例の質問文同士が類似すれば回答文同士も類似し、文献1の方法でも本実施の形態と同様の効果を得られるとも考えられる。しかしながら、図1の例のように、質問文には非常に細かく障害の現象が記載され、その中には回答の特定に無関係な部分(自立語)も多い。そのため、回答文が類似するが質問文が類似しない場合がある。また、質問文同士が類似していても、それら事例の質問文が非常に抽象的な内容である場合、回答文同士は類似するとは限らない。このような、質問文の内容と回答文の内容とに相関が無い場合に有効である。
【0018】
次に、具体的な第1の実施の形態を説明する。
【0019】
図6を参照すると、本実施の形態における質問回答検索システムは、プログラム制御により動作するデータ処理装置1と、情報を記憶する記憶装置2と、キーボード等の入力装置3、ディスプレイ等の出力装置4とを含む。
【0020】
質問回答検索システムは、上記の四つの装置が一つのハードウェア上で実装される場合と、データ処理装置1と記憶装置2とがサーバ上に存在し、入力装置3と出力装置4とがクライアント上の別の装置に存在する場合がある。後者では、クライアント上の入力装置3から入力した情報は、ネットワークを介してサーバ上のデータ処理装置1に送信され、サーバ上のデータ処理装置1で出力した情報は、ネットワークを介してクライアント上の出力装置4に送信される。
【0021】
データ処理装置1は、事例検索部10と、絞込みキーワード選択部11と、表示部12とを含む。
【0022】
事例検索部10は、入力装置3を通して入力された質問文と事例データベース20の質問文とが類似する事例を事例データベース20から検索し、その結果を事例ID記憶部21に格納する。
【0023】
絞込みキーワード選択部11は、事例ID記憶部21と事例データベース20とを参照して、事例検索部10により得られた事例の質問文に含まれるキーワードの重要度を、その回答文同士の類似度を用いて計算する。そして、重要度の順にあらかじめ指定された個数あるいは重要度が閾値以上のキーワードを、絞込みキーワードとして選択し、絞込みキーワード記憶部22に格納する。
【0024】
表示手段12は、絞込みキーワード記憶部22と事例データベース20とを参照して、絞込みキーワード選択部11により得られた絞込みキーワードと、これを含む事例検索部10により得られた事例を出力装置4に送信する。
【0025】
記憶装置2は、事例データベース20と、事例ID記憶部21と、絞込みキーワード記憶部22とを含む。記憶装置2は通常、HDD等の補助記憶装置で実現されるが、メモリであってもよい。また、事例データベース20と、事例ID記憶部21と、絞込みキーワード記憶部22とは、記憶装置2に全て含まれて居なくても良く。異なる場所にあっても良い。
【0026】
事例データベース20において、ひとつの事例は質問文と回答文との対を含み、各事例にはその事例を識別する事例IDが付与されている。
【0027】
事例ID記憶部21は、事例検索部10により得られた事例IDを格納する。
【0028】
絞込みキーワード記憶部22は、絞込みキーワード選択部11が選択した絞込みキーワードを格納する。
【0029】
次に、図7を参照して本実施の形態の動作について詳細に説明する。尚、事例データベース10には障害事例データが格納され、個々の事例は、質問文に該当する「障害の現象」と回答文に該当する「障害の原因」との対で構成されている場合を例にして説明する。また、事例データベース10の質問文と回答文とはあらかじめ形態素解析によって単語に分割し、自立語のみを抜き出して記憶装置2に格納されているものとする。
【0030】
まず、事例検索部10は、入力装置3を通して入力された質問文と事例データベース20の質問文とが類似する事例を事例データベース20から検索し、その結果を事例ID記憶部21に格納する(図7のステップS1)。
【0031】
質問文は「紙詰まり」のような語入力と、「紙詰まりが発生する」のような文入力とがある。語入力の場合は、その語を質問文に含む事例を検索する。「紙詰まり 発生」のように複数の語が入力された場合(スペースは語の区切り)は、すべての語を含む事例を検索する。文入力の場合は、形態素解析を用いて自立語のみを抜き出し、その語は語入力と同様である。ここでは、入力装置3から「紙詰まり」が語入力され、「紙詰まり」を質問文に含む事例として、図8のID1からID5を事例データベース20から検索し、事例ID記憶部21に格納したものとする。
【0032】
次に、絞込みキーワード部11は、事例ID記憶部21と事例データベース20とを参照して、事例検索部10により得られた事例の質問文に含まれるキーワードの重要度を、その回答文同士の類似度を用いて計算し、重要度の順にあらかじめ指定された個数あるいは重要度が閾値以上のキーワードを絞込みキーワードとして、絞込みキーワード記憶部22に格納する(図7のステップS2)。
【0033】
質問文に含まれるキーワードとは、ここでは質問文に含まれる自立語を表す。事例検索部10により得られたID1からID5の事例の質問文と回答文とに含まれる自立語を図9に示す。「異常音」、「薄い」、「印字」、「紙詰まり」、「発生」、「思う」、「途中」、「電源」、「頻発」、「大きい」、「UNIT」、「最近」、「おこる」、「投入」が重要度計算の対象となるキーワードである。
【0034】
キーワードの重要度は、回答文同士の類似度を用いて計算する。具体的には、図10の(式1)に示すように、キーワードNの重要度Score(N)を、事例検索手段で得られた事例でかつ、質問文にNを含む事例D_Nの中から選んだ2つの回答文の類似度sim(d_i,d_j)の全ての組み合わせを計算し、その平均値を求める。組み合わせの数は、|D_N|に対して|D_N|x(|D_N|-1)/2となる。尚、キーワードの重要度を計算する方法は(式2)以降に示すように様々な形態が存在するが、後述する。
【0035】
図11の(式5)にsim(d_i,d_j)の計算式を示す。sim(d_i,d_j)は一般にcosine類似度と呼ばれる計算方法である。(式5)において事例dに含まれる語(自立語)tの重みw(d,t)は(式6)または(式7)の方法で計算する。(式6)はどの語の重みも常に1で一定であり、(式7)はtのdにおける出現回数tf(d,t)と、tの出現事例数df(t)の逆数の積により求める。尚、sim(d_i,d_j)の計算方法は、cosine類似度以外でも、2文書間の類似度を計算するどのような方式も適用できる。例えば、Jaccard係数やdice係数であっても良い。
【0036】
キーワードNの重要度の計算例を図12に示す。図12の(a)は、文書検索部10により得られた図8のID1からID5の事例の質問文に含まれるキーワード「薄い」のスコアScore(薄い)を計算している。「薄い」はID1-ID3の3つの事例の質問文に含まれるため類似度はsim(1,2), sim(1,3), sim(2,3)の3通りあり、これらの平均値を求める。図12の(b)は、sim(d_i,d_j)の計算例として、sim(1,2)を計算している。それぞれのw(d,t)の値は図12の(c)のように計算する。例えば、ID1の事例で「LD」は1回出現し、「LD」は5事例中3事例で出現するので、1*log(5/3)=1.42となる。
【0037】
図13に、事例検索部10により得られた図8の事例の質問文に含まれるキーワードの重要度を計算した結果を示す。図10の(式1)は、キーワードを含む事例の数|D_N|が1のとき分母が0になるため計算できない。そのため|D_N|=1のキーワードは0としている。絞込みキーワード選択部11は、得られた重要度の順にあらかじめ指定された個数あるいは重要度が閾値以上のキーワードを絞込みキーワードとして、絞込みキーワード記憶部22に格納する。例えば、重要度が0.7以上のキーワードを絞込みキーワードとするとした場合は、「異常音」「薄い」の2つが絞込みキーワードとして絞込みキーワード記憶部22に格納される。この際、絞込みキーワード記憶部22には図14のように絞込みキーワードとそれを含む事例IDを対応付けて登録しておく。
【0038】
最後に表示手段12は、絞込みキーワード記憶部21と事例データベース20とを参照して、絞込みキーワード選択部11により得られた絞込みキーワードと事例検索部10により得られた事例を出力装置4に送信する(図7のステップS3)。
【0039】
図14のように絞込みキーワード記憶部22には、「異常音」、「薄い」とそれぞれを含む事例検索部10で得られた事例IDの対応が格納されているので、その内容を出力装置4に送信すればよい。
【0040】
以上、本実施の形態の動作を説明した。図7のステップS2において事例検索部10により得られた事例の質問文に含まれるキーワードの重要度を、その回答文同士の類似度を用いて計算した。上記では特に、その具体的な実現方式として図10の(式1)を用いたが、そのほかにも実現方式が存在する。
【0041】
図10の(式2)の実現方式では、キーワードNの重要度Score(N)は、事例検索部10で得られた事例でかつ、質問文にキーワードを含む事例D_Nの回答文の中心を求めた後、それぞれの回答文とその回答文の中心の類似度sim(d_i,d_DN)の平均値を求めることによって得る。回答文の中心は、D_Nの回答文を全て連結することにより求める。例えば、図8のID1からID5の回答文の中心は「LDユニットが故障していました/LDユニットを交換。/LDユニットの故障。交換/ピックローラ不良。/どうやらピックローラの故障のようでした」となる(“/”は回答文の区切り)。(式1)では、D_Nの2つ回答文の類似度の全ての組み合わせを求める必要があるが、(式2)はそれぞれの回答文と回答文の中心の類似度のみを計算すればよいので、(式1)よりも高速に実現できる。
【0042】
図10の(式3)の実現方式では、キーワードNの重要度Score(N)を、(式1)の値からその出現事例数を有するキーワードの重要度の期待値E[Score(N)]の値を引くことによって得る。例えば、文書検索手段により得られた図8の事例において「薄い」はID1-ID3の3つの質問文で現れる。「薄い」のスコアを(式1)の方法で求め、さらに3つの質問文で現れるキーワードの(式1)のスコアの期待値を求め、両者の差を求める。(式1)の性質上、出現事例数が小さなキーワードほどスコアが高くなり、逆に出現事例数が高いキーワードほどスコアは低くなる全体傾向がある。そのため、(式1)をそのまま適用すると、出現事例数が小さいキーワードが過大評価されてしまう。(式3)のように、期待値の値を引くことによってこの問題を解消可能である。
【0043】
図10の(式4)の実現方式は、(式1)の代わりに(式2)を用いる点以外は、(式3)と同様である。
【0044】
図15の(式9)から(式12)は、事例検索部10により得られた事例の質問文に含まれるキーワードの重要度を、その回答文同士の類似度を用いることに加え、その出現事例数を用いる点で(式1)から(式4)と異なる。この実装方法により、回答を特定しやすいキーワードであると同時に、利用者の質問を具体化できる可能性が高いキーワードを応対キーワードとして提示することが可能になる。(式9)から(式12)で出現事例数|D_N|の項に対数logが付与されているのは、出現事例数の影響を小さくするためである。無論logを付与しなくても良い。
【0045】
質問回答検索システムは利用者に絞込みキーワードを提示し、利用者は提示された絞込みキーワードが初期に入力した質問文を具体化できるのであれば、その絞込みキーワードを含めた質問文で新たに検索する。例えば、初期の質問文「紙詰まり」に対して「薄い」「異常音」を絞込みキーワードとして提示された場合、利用者は「紙詰まり」に加えて「(印字が)薄い」、「異常音」といった現象が発生していないかを調査する。その結果、もし「(印字が)薄い」が発生している場合は、「薄い」と「紙詰まり」とで新たに事例を検索する。ここで、もし「薄い」を含む事例が3件、「異常音」を含む事例が1件であれば、「薄い」ほうが「異常音」よりも実際に発生している可能性が高いといえる。このように、出現事例数を考慮することで、利用者が質問を具体化できる可能性が高いキーワードを応対キーワードとして提示することができるようになる。
【0046】
図16の(式13)と(式14)は、事例検索部10により得られた事例の質問文に含まれるキーワードの重要度を、その回答文同士の類似度に加えてその質問文同士の類似度を用いる点で(式1)から(式4),(式9)から(式12)と異なる。(式13)と(式14)とにおけるQScore(N)では、質問文を対象として(式1)から(式4),(式9)から(式12)のScore(N)を計算する。すなわち、|D_N|をNを質問文に含む事例集合, sim(d_1,d_2)を質問文d_1と質問文d_2の間の類似度と置き換え計算すればよい。AScore(N)は(式1)-(式4),(式9)-(式12)のScore(N)と同様である。
【0047】
ある質問に対する正解の回答が複数存在する場合、回答文同士の類似度を利用すると、それらの回答を特定するキーワードの重要度は必ずしも高くならない。一方、質問文の内容と回答文の内容には一定の相関があるので、質問文同士の類似度が高ければ、回答文同士の類似度が高くなくても回答を特定するキーワードである可能性が高くなる。そのため、質問文同士の類似度も合わせて用いる。
【0048】
他の実施の形態を説明する。
【0049】
ここまでは、一つの質問文と一つの回答文との対から構成されている事例を用いていたが、事例の中には、一つの質問文と複数の回答文の対から構成されているものもある。例えば、Web上のQAサイトでは、図17のように、利用者がWebを通して質問文を登録すると、それに対する回答文が他の利用者から登録される。登録された回答文のうち一つが最良の回答文に選ばれる。現在、QAサイトとして有名なものとして、「Yahoo知恵袋」(http://chiebukuro.yahoo.co.jp/)、「教えてgoo」(http://oshiete.goo.ne.jp/)、「OKWave」(http://okwave.jp/)が存在する。
【0050】
このような一つの質問文と複数の回答文との対を含む事例に対する本発明の適用方法を説明する。最も単純な方法は、複数の回答文のうちあらかじめ選択された最良の回答文を用いて絞込みキーワード選択部11を実行することである。この場合、実質的には、一つの質問文と一つの回答文との対から構成されているとみなすことができる。
【0051】
別の方法として、一つの質問文に対してn個の回答文の対を含む事例を、一つの質問文に対して一つの回答文を含むn個の事例に展開してから絞込みキーワード部11を適用することである。例えば、{Q1,{A1,A2}}からなる事例を{Q1,A1}{Q1,A2}に展開する。ここで、{Q1,{A1,A2}}とは、質問文Q1と2つの回答文A1,A2からなる一つの事例を、質問文Q1と回答文A1、および、質問文Q1と回答文A2の2つの事例に展開することを表す。
【0052】
さらに別の方法として、一つの質問文に対する複数の回答文の中心を求めてから絞込みキーワード部11を実行することである。この場合、実質的には、一つの質問文と一つの回答文の対から構成されているとみなすことができる。中心の求め方については、図10の(式2)の時と同様に複数の回答文を全て連結することにより求めればよい。
【0053】
さらに別の方法として、絞込みキーワード部11が、事例検索部10により得られた事例の質問文に含まれるキーワードの重要度を、事例の回答文同士の類似度を用いて計算する際に、事例の複数の回答文と事例の複数の回答文の全ての組み合わせの類似度を求め、その最小値または最大値または平均値を事例の回答文同士の類似度とする方法がある。例えば、事例A{Q1, {A1,A2} , 事例B{Q2, {A3,A4}}において、事例Aと事例Bの回答文同士の類似度をsim(A1,A3), sim(A1,A4), sim(A2,A3), sim(A2,A4)の最小値、最大値、又は平均値によって求める。
【0054】
本実施の形態の効果は、入力された質問文からでは回答が十分に特定できない(絞り込めない)場合に、回答を特定しやすい応対キーワードを提示することにより、回答の特定を支援することが可能になることである。その理由は、事例検索部10により得られた事例の質問文に含まれるキーワードの重要度を、その回答文同士の類似度を用いて計算し、重要度の順にあらかじめ指定された個数あるいは重要度が閾値以上のキーワードを絞込みキーワードとする絞込みキーワード部11を有するためである。
【産業上の利用可能性】
【0055】
本発明の質問回答検索システムは、コンタクトセンターのオペレータが受けた顧客からの問い合わせを正確に早く回答するために、蓄積された事例データベースから参考となる回答を検索する際に利用できる。また、WebのQAサイトにおいて、利用者が参考となるQAを検索する際に利用できる。
【図面の簡単な説明】
【0056】
【図1】図1は従来技術の問題点を説明するための図である。
【図2】図2は本発明の概要を説明するための図である。
【図3】図3は本発明の概要を説明するための図である。
【図4】図4は本発明の概要を説明するための図である。
【図5】図5は本発明の概要を説明するための図である。
【図6】図6は本発明の実施の形態の構成を示す図である。
【図7】図7は本発明の実施の形態の動作を示す流れ図である。
【図8】図8は本発明の実施の形態の動作を説明するための図である。
【図9】図9は本発明の形態の絞込みキーワード部11の動作を説明するための図である。
【図10】図10は本発明の実施の形態の絞込みキーワード部11の動作を説明するための図である。
【図11】図11は本発明の実施の形態の絞込みキーワード部11の動作を説明するための図である。
【図12】図12は本発明の実施の形態の絞込みキーワード部11の動作を説明するための図である。
【図13】図13は本発明の実施の形態の絞込みキーワード部11の動作を説明するための図である。
【図14】図14は本発明の実施の形態の絞込みキーワード記憶部22の格納例である。
【図15】図15は本発明の実施の形態の絞込みキーワード部11の動作を説明するための図である。
【図16】図16は本発明の実施の形態の絞込みキーワード部11の動作を説明するための図である。
【図17】図17は本発明の他の実施の形態の絞込みキーワード部11の動作を説明するための図である。
【符号の説明】
【0057】
1 データ処理装置
2 記憶装置
3 入力装置
4 出力装置
10 事例検索部
11 絞込みキーワード選択部
12 表示部
20 事例データベース
21 事例ID記憶部
22 絞込みキーワード記憶部

【特許請求の範囲】
【請求項1】
質問文と回答文との対を含む事例が記憶された事例データベースと、
前記事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算し、前記重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する絞込みキーワード選択手段と
を有する質問回答検索システム。
【請求項2】
入力された問い合わせ文と前記事例データベースの質問文とが類似する事例を、前記事例データベースから検索する事例検索手段を有する請求項1に記載の質問回答検索システム。
【請求項3】
前記絞込みキーワード選択手段は、前記事例検索手段で検索された事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算し、前記重要度に基づいて、前記問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する請求項2に記載の質問回答検索システム。
【請求項4】
前記絞込みキーワード選択手段は、前記重要度の順にあらかじめ指定された個数のキーワードを絞込みキーワードとして選択する請求項1に記載の質問回答検索システム。
【請求項5】
前記絞込みキーワード選択手段は、前記重要度が閾値以上のキーワードを絞込みキーワードとして選択する請求項1に記載の質問回答検索システム。
【請求項6】
前記絞込みキーワードと前記絞込みキーワードを含む事例とを出力装置に送信する表示手段を有する請求項1に記載の質問回答検索システム。
【請求項7】
前記絞込みキーワード選択手段は、前記事例の質問文に含まれるキーワードの重要度を、前記事例の回答文同士の類似度と出現事例数とを用いて計算する請求項1から請求項6のいずれかに記載の質問回答検索システム。
【請求項8】
前記絞込みキーワード選択手段は、前記事例の質問文に含まれるキーワードの重要度を、前記事例の回答文同士の類似度と、前記事例の質問文同士の類似度とを用いて計算する請求項1から請求項6のいずれかに記載の質問回答検索システム。
【請求項9】
前記絞込みキーワード選択手段は、質問文にキーワードを含む事例の回答文同士の類似度を前記質問文にキーワードを含む事例の回答文の全ての組み合わせで計算し、その平均値を前記キーワードの重要度とする請求項1から請求項6のいずれかに記載の質問回答検索システム。
【請求項10】
前記絞込みキーワード選択手段は、質問文にキーワードを含む事例の回答文の中心を求め、前記質問文にキーワードを含む事例のそれぞれの回答文と前記回答文の中心との類似度の平均値を、前記キーワードの重要度とする請求項1から請求項6のいずれかに記載の質問回答検索システム。
【請求項11】
前記絞込みキーワード選択手段は、求めたキーワードの重要度から、前記キーワードの出現事例数を有するキーワードの重要度の期待値を引いた値を前記キーワードの重要度とする請求項1から請求項6のいずれかに記載の質問回答検索システム。
【請求項12】
前記絞込みキーワード選択手段は、一つの事例が一つの質問文と複数の回答文の対で構成されている場合、一つの事例が一つの質問文と一つの回答文との対とみなされるようにする請求項1から請求項11のいずれかに記載の質問回答検索システム。
【請求項13】
前記絞込みキーワード選択手段は、一つの事例が一つの質問文と複数の回答文との対で構成されている場合、複数の回答文のうち最良の回答文を選択し、前記事例を前記質問文と前記選択された回答文との対とみなす請求項12に記載の質問回答検索システム。
【請求項14】
前記絞込みキーワード選択手段は、一つの事例が一つの質問文とn個の回答文との対で構成されている場合、一つの質問文に対して一つの回答文を含むn個の事例に展開する請求項12に記載の質問回答検索システム。
【請求項15】
前記絞込みキーワード選択手段は、一つの事例が一つの質問文と複数の回答文との対で構成されている場合、一つの質問文に対する複数の回答文の中心を求め、前記事例を前記質問文と前記回答文の中心との対とみなす請求項12に記載の質問回答検索システム。
【請求項16】
前記絞込みキーワード選択手段は、一つの事例が一つの質問文と複数の回答文との対で構成されている場合、対象となる事例の複数の回答文の全ての組み合わせの類似度を求め、その最小値または最大値または平均値を事例の回答文同士の類似度とする請求項12に記載の質問回答検索システム。
【請求項17】
質問文と回答文との対を含む事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算し、前記重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する質問回答検索方法。
【請求項18】
質問文と回答文との対を含む事例が記憶された事例データベースから、問い合わせ文と質問文とが類似する事例を検索する請求項17に記載の質問回答検索方法。
【請求項19】
前記検索された事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算し、前記重要度に基づいて、前記問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する請求項18に記載の質問回答検索方法。
【請求項20】
前記重要度の順にあらかじめ指定された個数のキーワードを絞込みキーワードとして選択する請求項17に記載の質問回答検索方法。
【請求項21】
前記重要度が閾値以上のキーワードを絞込みキーワードとして選択する請求項17に記載の質問回答検索方法。
【請求項22】
前記絞込みキーワードと前記絞込みキーワードを含む事例とを表示する請求項17に記載の質問回答検索方法。
【請求項23】
前記事例の質問文に含まれるキーワードの重要度を、前記事例の回答文同士の類似度と出現事例数とを用いて計算する請求項17から請求項22のいずれかに記載の質問回答検索方法。
【請求項24】
前記事例の質問文に含まれるキーワードの重要度を、前記事例の回答文同士の類似度と、前記事例の質問文同士の類似度とを用いて計算する請求項17から請求項22のいずれかに記載の質問回答検索方法。
【請求項25】
質問文にキーワードを含む事例の回答文同士の類似度を前記質問文にキーワードを含む事例の回答文の全ての組み合わせで計算し、その平均値を前記キーワードの重要度とする請求項17から請求項22のいずれかに記載の質問回答検索方法。
【請求項26】
質問文にキーワードを含む事例の回答文の中心を求め、前記質問文にキーワードを含む事例のそれぞれの回答文と前記回答文の中心との類似度の平均値を、前記キーワードの重要度とする請求項17から請求項22のいずれかに記載の質問回答検索方法。
【請求項27】
求めたキーワードの重要度から、前記キーワードの出現事例数を有するキーワードの重要度の期待値を引いた値を前記キーワードの重要度とする請求項17から請求項22のいずれかに記載の質問回答検索方法。
【請求項28】
一つの事例が一つの質問文と複数の回答文との対で構成されている場合、一つの事例が一つの質問文と一つの回答文との対とみなされるようにする請求項17から請求項27のいずれかに記載の質問回答検索方法。
【請求項29】
一つの事例が一つの質問文と複数の回答文との対で構成されている場合、複数の回答文のうち最良の回答文を選択し、前記事例を前記質問文と前記選択された回答文との対とみなす請求項28に記載の質問回答検索方法。
【請求項30】
一つの事例が一つの質問文とn個の回答文との対で構成されている場合、一つの質問文に対して一つの回答文を含むn個の事例に展開する請求項28に記載の質問回答検索方法。
【請求項31】
一つの事例が一つの質問文と複数の回答文との対で構成されている場合、一つの質問文に対する複数の回答文の中心を求め、前記事例を前記質問文と前記回答文の中心との対とみなす請求項28に記載の質問回答検索方法。
【請求項32】
一つの事例が一つの質問文と複数の回答文との対で構成されている場合、対象となる事例の複数の回答文の全ての組み合わせの類似度を求め、その最小値または最大値または平均値を事例の回答文同士の類似度とする請求項28に記載の質問回答検索方法。
【請求項33】
質問文と回答文との対を含む事例の質問文に含まれるキーワードの重要度を前記質問文の対の回答文同士の類似度を用いて計算する処理と、
前記重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する処理と
を情報処理装置に実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2010−9471(P2010−9471A)
【公開日】平成22年1月14日(2010.1.14)
【国際特許分類】
【出願番号】特願2008−170555(P2008−170555)
【出願日】平成20年6月30日(2008.6.30)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】