説明

キーワード生成装置、文書検索装置、その方法、およびそのプログラム

【課題】誤認識や応対の話題に直接関係のないキーワードを選択しないようにする。
【解決手段】応対中の文字列中よりキーワードを検出し(6)、上記キーワードを出現時系列として蓄積し(16)、別途現在の応対に直接的に関連するキーワードである関連キーワードを関連キーワード入力部96から入力し、関連キーワード取り出し部38がキーワード履歴から関連キーワードを取り出し、記憶し(32)、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、関連キーワードとキーワードとを組み合わせて、これらを検索語として含む文書を検索用データベース21から検索し、これら文書中の最も長く連続するキーワードを生成出力する(20)。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、例えばコールセンタ、窓口業務、電子メールのやり取りによる顧客応対業務の業務支援に関するキーワードを生成する装置、その生成されたキーワードを用いて文書を検索する装置、その方法、およびそのプログラムに関するものである。
【背景技術】
【0002】
現状のコールセンタ、窓口業務、電子メールのやり取りによる顧客応対業務においては、各応対業務の流れを示したマニュアル文書、商品情報などの文書が電子的に管理されている。オペレータは応対中にそれら文書を端末上で検索、表示しながら応対業務についている。
文書の検索のためのキーボードやマウス操作の時間を極力省いて、応対時間を効率化させる、または、業務経験の浅いオペレータの検索支援を行うことを目的として、応対中の対話音声を音声認識し、そこから得られるキーワードを用いて応対用件の質問の回答案や問題解決方法などを記した文書を自動的に検索・表示を行う技術の適用が考えられる。これには、例えば特許文献1で開示されている技術がある。
【特許文献1】特開2001−229180号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
応対を開始した直後の段階においては、顧客が問い合わせてくる問題については、顧客自身が的確に説明できず、曖昧さが残る説明になることが多い。よってオペレータは、顧客からの説明を受けると、用件の復唱や用件の状況を噛み砕いて確認する質問を返す問題把握応対を通して、徐々に解答すべき問題を突き止めていくことになる。
【0004】
問題把握応対の段階においては、その問題についておおよそのカテゴリが判明しても、最終的な回答までにはさらなる問題の詳細な切り分けが必要である。そのため、応対の進行に伴って選択すべき回答用文書の候補は徐々に変化する。例えば、「プリンタから印刷ができない。」という質問があった場合でも、プリンタからエラーが出ているのか、パソコンの画面メッセージでエラーが出ているかで、回答の内容が大きく異なる。従って、応答用文書の検索には、オペレータの質問のたびに、つまり、応答発生の度毎に直前までの応対話題のカテゴリの推測や、文書候補の絞り込みの見直しをする必要がある。
【0005】
オペレータの負担を最小限にするためには、自動検索結果となる文書のリストは的確に絞り込まれている必要がある。そのため、キーワードを元に検索する場合にはそのキーワードの組み合わせは適切に設定されている必要がある。
【0006】
応対の各発話が認識され、その結果が出力されるごとに、単にキーワードを取り出すだけでは、応対の内容にはそぐわないキーワードが取り出され、結果として検索結果となる文書が応対にそぐわない文書となることがある。例えば、音声認識の誤認識結果にたまたまキーワードとなる表現が出現したことにより、現在の話題とは異なるキーワードが含まれることがある。また、正しく、音声認識できた場合でも、その応対中、局所的に本題とは関係のない内容を説明していたり、例え話のように間接的な表現で質問していた場合、その内容から得られるキーワードではうまく文書は検索できない。
【0007】
誤認識を含んだ音声認識結果の中から、誤認識されたキーワードであるかそうでないかを判定する技術が前記特許文献1の段落[0058]付近に示されている。この技術は、音声認識した文書から大局的な話題の内容を表した話題語を取り出し、キーワードの候補となる単語が話題語と上位・下位概念の関係を持っているかを調査することで、判定している。しかし、応対で扱おうとしている話題毎にキーワードの上位・下位概念の関係をあらかじめ構築しておかなければならず、一般にこの構築コストは非常に高く、扱う話題を新たにするたびに概念ツリーを構築することは現実的ではないという問題があった。
【0008】
以上のような各種の問題は、コールセンタなどの電話音声による応対のみならず、窓口業務における応対や、電子メールによる応対などにおいても同様に生じる。
【課題を解決するための手段】
【0009】
この発明によれば、応対中の文字列中よりキーワードを検出し、その検出したキーワードを出現時系列としてキーワード履歴部に蓄積し、全てのキーワードを検出するとトリガーを生成し、そのトリガーをキーワード生成部へ送信し、上記キーワード生成部はトリガーを受信すると、別途現在の応対に直接的に関連するキーワードである関連キーワードを受け取り、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、上記関連キーワードと直接的な結びつきがあるキーワードの連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて出力する。
【発明の効果】
【0010】
以上の構成によれば、応対に直接的に関連がある関連キーワードを受け取り、これと直接的に関連し、かつ連続するキーワードをキーワード履歴中から最新のキーワード側より探し出しているため、オペレータや窓口業務員などの支援となる文書をより的確に検索し、提示するためのキーワードが探し出せる。つまり、誤認識を含む認識結果や応対の内容に間接的な表現が含まれている場合でも、的確に文書を選び出すためのキーワードを生成することができる。応対業務に沿った文書を検索するためのキーワードの選択において、扱おうとしている話題に対して、概念ツリーといった特別な情報の構築なしに、誤認識や応対の話題に直接関係のないキーワードが選択されることを防ぐことが出来るようになる。話題に直接関係のないキーワードが選択されることがなくなることにより、より的確に応対中の話題に沿った文書を検索することが出来るようになる。また、より的確に文書を検索できるようになったことにより、提示された文書を参照しながらオペレータがより早く的確に案件に回答することが出来るようになる。
【発明を実施するための最良の形態】
【0011】
実施例1
図1にこの発明の実施例1を示し、主な処理の流れを図2に示す。
キーワード検出処理部6はキーワード検出部7とキーワード計数部14とトリガー生成部18とで構成されおり、キーワード生成部20は第1の判定部24、第2の判定部26、キーワードレジスタ28、制御部30とで構成されている。
以下の会話に関して、この実施例の処理を説明する。
オペレータ:「ブラウザからインターネットにですか?」
顧客:「えー、えー、そうです。」
オペレータ:「社内のデータベースにはクエリーできるのに、接続出来ないのですね。」
【0012】
まず、電話などの通信手段により到着した前記会話の音声信号が、ディジタル変換され、このディジタル音声信号が入力端子2より、音声認識処理部4に入力される(ステップS100)。音声認識処理部4では例えば、公知の技術である隠れマルコフモデル(HMM:Hidden Markov Model)、単語辞書などを用いて、音声認識され、認識文字列が生成される(ステップS101)。そして、この認識文字列が発話毎にキーワード検出処理部6に入力される。
【0013】
また、この発明では、電話などに限らず、直接、顧客が応対窓口に来て、窓口業務員(相談員など)と話す場合にも適用できる。この場合は、例えば、マイクなどの収音手段(図示せず)により顧客と窓口業務員との会話を収音し、収音した音声信号をA/D変換器(図示せず)などで、ディジタル信号に変換され、入力端子2に入力させることも可能である。
また、この発明では、音声に限らず電子メールなどによる応対などにも適用することが出来る。この場合、電子メール中の本文の文字列が、破線で記している文字列入力部12に入力され、この文字列が上記の認識文字列として同様に、キーワード検出処理部6に入力される。
【0014】
キーワード検出処理部6では、キーワード検出部7がその文字列の中から検索の際のキーとなる単語であるキーワードを検出して時間順にキーワード列として取り出す(ステップS102)。この処理には抜き出すべきキーワードの文字列、例えば、「データベース」、「ネット」、「ブラウザ」などのような文字列を格納したキーワード辞書格納部8を予め準備し、この格納部8内の各文字列と認識文字列を例えば、マッチング処理をすることで得ることができる。
【0015】
また、キーワード辞書格納部8に変えて、例えば、特開平9−330331号公報に開示されている方法のように、破線で示す形態素解析部10によって、認識文字列を形態素解析し、例えば、名詞と固定された単語が連続する文字列の部分で同一の文字列パターンが同一文書内に2回以上現れたものをキーワードとして検出してもよい。この処理は単語を検出する処理だけであるので処理時間は短くて済む。
【0016】
この実施例では、上記の会話から
オペレータ:「ブラウザ」から「インターネット」にですか?
顧客:えー、えー、そうです。
オペレータ:社内の「データベース」には「クエリー」できるのに、「接続」「出来ない」のですね。
のように、キーワードは「ブラウザ」「インターネット」「データベース」「クエリー」「接続」「出来ない」の6個が検出されたとする。キーワード計数部14では、キーワードが検出されるごとに計数する。ちなみにこの例では検出されたキーワードの個数は「6」となる。
【0017】
キーワード検出処理部6により得られた各キーワードは、後で各キーワードを最新のものから時間的に遡って順に取り出せるように、出現順番の番号と組み合わせてキーワード履歴記憶部16に記憶される(ステップS104)。つまり、これらのキーワードにはその検出が時間的に古いものから若い番号を付けていく。例えば、この場合であると、1:「ブラウザ」2:「インターネット」3:「データベース」4:「クエリー」5:「接続」6:「出来ない」という形式で、記憶される。このようにキーワードは時系列として、キーワード履歴記憶部16に記憶される。
【0018】
また、キーワード検出処理部6では各発話の認識ごとに、全てのキーワードの検出が終了し、得られたキーワード列のキーワード履歴記憶部16への記憶が終了すると、トリガー生成部18がトリガーを生成し、キーワード生成部20へ実行開始のトリガーを送信する。キーワード生成部20は、トリガーを受け取ると、入力された関連キーワードを受け取り(ステップS106)、今の話題に沿った文書を検索するためのキーワードを1つまたは複数個の組み合わせを生成する。
【0019】
ここで、関連キーワードとは、別途、現在の応対に頻繁に使用され、その内容に直接的に関連するキーワードのことであり、オペレータなどによって、事前にきめられるものである。オペレータは、通常、様々な部門に配置され、その部門に直接的に関係するキーワードを関連キーワードとすればよい。例えば、パソコンの故障部門においての関連キーワードであれば、「出来ない」「作動しない」などが考えられ、パソコンの料金問い合わせ部門においての関連キーワードであれば、「請求書」「料金」などが考えられる。
この関連キーワードは予め、もしくは応対が開始した直後に、オペレータが破線で示す関連キーワード記憶部32にキーワード入力部33から記憶させてもよい。
【0020】
また、応対の開始の時点では、関連キーワードを考慮せず、この応対を開始し、その応対の途中で、キーワード検出処理部6より得られてくるキーワード列を、図1中に破線で示す表示部34に表示させ、つまり、キーワード履歴記憶部16に記憶されているキーワード列を表示させ、応対の途中で、表示されているキーワード列からオペレータが目視等で、その応対に直接関連するキーワードを関連キーワードとして選択し、その選択情報を、破線で示す関連キーワード入力部36から入力する。関連キーワード入力部36からの入力情報に基づき、破線で示す関連キーワード取り出し部38が表示部34に表示されたキーワード中の1ないし複数の関連キーワードをキーワード履歴記憶部16から取り出し、取り出したキーワードを関連キーワードとして、関連キーワード記憶部32に記憶させてもよい。なお、この実施例の説明での関連キーワードを「ブラウザ」「インターネット」とする。
【0021】
また、前記特許文献1中に記されているように、話題語を抽出する処理を実施し(図示せず)、その話題語を関連キーワードとして関連キーワード記憶部32に記憶させてもよい。また関連キーワード生成の方法はこれらに限られるものではない。
関連キーワード記憶部32に記憶されている関連キーワードはキーワード生成部20へ入力される。キーワード生成部20内において関連キーワードはキーワードレジスタ28内の一部に格納される。また、
応対が開始した直後に、オペレータが入力した関連キーワードを、必要に応じて、キーワードレジスタ28に直接格納しても良い。
【0022】
キーワード生成部20は関連キーワードを用いて、キーワード履歴記憶部16に記憶されたキーワードのうち、出現の新しいものから順に、時間をさかのぼり、関連キーワードと直接的な結びつきがあるキーワードがある連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて、出力するものである。この実施例では、この処理を例えば、検索用データベース21を用いて行う場合について説明する。
【0023】
検索用データベース21はキーワードおよび関連キーワードの個々のものと同一のものを検索語とし、これら検索語の1つでも含む文書を検索できるものである。キーワード生成部20は検索用データベース21を用いて、関連キーワードと検出したキーワードとを検索語として含む文書を検索する。検索用データベース21の具体的構成例は図1に記載のように、検索語と、文書のインデックスと、各文書のインデックスが表す文書中に各検索語が含まれているか否かを表すフラグと、で構成される。この例では、検索用データベース21中に行列として格納され、左端の列に各検索語が配列格納され、最上位行に各文書のインデックスが配列格納され、各文書のインデックスごとに、その文書に検索語が含まれていれば、その文書のインデックスの列におけるその検索語の行に「1」のフラグを立て、含まれていなければ「0」のフラグを立てる。例えば、文書のインデックスがd1の列では、検索語「データベース」「接続」「クエリー」「出来ない」の各行に「1」のフラグが立ち、それ以外の検索語には「0」のフラグが立つ。また、「データベース」という検索語が含まれる文書のインデックスは、d1、d2、d5、d8となり、これらには「1」のフラグが立ち、これら以外の文書のインデックスは「0」のフラグが立っている。また、キーワード生成部20によるキーワードの生成において、検索用データベース21はこのようなものに限られるものではなく、例えば、その応対と関連のある文書全体を文書のインデックスを付けて全て格納したものでも良い。
【0024】
キーワード生成部20の処理の具体的な流れを、図3を参照しながら説明する。キーワード生成部20は検索用データベース21を用いて、関連キーワードと検出したキーワードとを検索語として含む文書を検索し、検索結果があれば、関連キーワードと結びつきがあると判定して、上記キーワードの連続する範囲を探し出し、探し出された連続する範囲中の最も長く連続するキーワードを生成出力する。またキーワード生成部20での処理は、オペレータと顧客間の会話において、最新の発話に重要なキーワードがあるとの思想に基づいている。ここで、キーワード履歴記憶部16中のキーワード履歴中の位置を示すカウンタ変数としてi、jが定義され、このカウンタ変数は制御部30により制御される。また関連キーワード記憶部32よりのM個の関連キーワードをCK1、CK2、...、CKMとし、キーワード履歴記憶部16中に音声認識開始から現時点までに蓄積されたキーワードの数をNとし、キーワード履歴記憶部16に保存されているキーワードを音声中での出現順に、K1、K2、...、KNとする。ただしN、Mは1以上の整数とする。
【0025】
まずカウンタ変数iにNを設定する(ステップS200)。次に、iの値が「0」であるか否かを判定し、「0」でない場合は、第1の判定部24での処理に進む(ステップS202)。
ここで、第1の判定部24で使用される関数N(x)について説明する。関数N(x)はその引数xに与えられたキーワードを検索語として用いて、AND条件で検索した場合に、検索結果として得られる文書数を求める関数である。また関数N(x)の計算には、文書のインデックスを用いて、実際に検索処理を行うことで、実行可能である。例えば、図1中の検索用データベース21の例として示す転置行列を検索用インデックスとして構成し、各検索語に対応づく文書集合のAND検索を行い、その文書数を数えることで、計算可能である。なお、詳細は、「情報検索と言語処理 発効日:2004年9月15日 第3刷 発行所:(財)東京大学出版会 P39ーP41」に記載されている。
【0026】
説明を図3のフローチャートに戻すと、N(CK1、CK2、...、CKM、Ki)の値である第1の文書検索数を求め、この値が「0」であるか否かを判定する(ステップS204)。N(CK1、CK2、...、CKM、Ki)の値は図1中の検索用データベース21を用いて、関連キーワードCK1、CK2、...、CKMとキーワード履歴記憶部16中のキーワードKiをそれぞれ検索語としてこれら全ての検索語を含む文書の数つまり、第1の文書検索数を求める。なお、この実施例では、検索開始においては、i=N=6である場合のKiは「出来ない」であり、関連キーワードを「ブラウザ」「インターネット」とすると、「出来ない」「ブラウザ」「インターネット」を検索語とすると、全ての検索語を含む文書のインデックスはd6となり、文書のインデックスの数は「1」であるから、N(CK1、CK2、...、CKM、Ki)は「1」と出力される。よってN(CK1、CK2、...、CKM、Ki)の値は「0」でないので、ステップS212に移動する。
【0027】
また、ステップS204で、第1の文書検索数が「0」の場合は、iの値を「1」引いて(ステップS206)、ステップS202に戻る。このときにカウンタ変数i≠0であればステップS204に再び移るが、カウンタ変数i=0になったときは、キーワード生成部20の処理は、結果無しとして終了する(ステップS208)。つまり、第1の判定部24での処理は、上述のように最新の発話に重要なワードがあるとの思想に基づき、最新のキーワードKNから順番に過去にさかのぼったキーワードと関連キーワードCK1、CK2、...、CKMとの組み合わせを検索語として使用する。
【0028】
一方、ステップS212では、カウンタ変数j=i−1とし(ステップS212)、その後j=0であるか否かを判定する(ステップS214)。j≠0であれば、第2の判定部26で行う。上述の関数N(x)を用いて、関連キーワードCK1〜CKMとキーワード履歴記憶部16中のキーワードKj、Kj+1、...、Kiを組み合わせたものを検索語とし、AND条件で文書検索を行った場合の文書検索数つまりN(CK1、CK2、...、CKM、Ki、Ki−1、...、Kj)を求め、この値を第2の文書検索数とし、第2の文書検索数が「0」以上であるか否かを第2の判定部26で判定する(ステップS216)。第2の文書検索数が「0」以上の場合は、jの値を「1」減らして(ステップS218)、ステップS214に戻る。
【0029】
第2の文書検索数が「0」である場合はキーワード履歴記憶部16中の位置j+1〜位置iにあるキーワードKi、Ki−1、...、Kj+1をキーワード生成結果として出力部40から出力する(ステップS220)。またステップS214でj=0の場合で、ステップS220に移動した場合は、j+1=iとなり、1つのキーワードKiのみが出力部40から出力される(ステップS220)。つまり、第2の判定部26では、Kiから更に過去に遡った複数のキーワードと関連キーワードとを検索語とし、これら検索語とのAND条件で検索ヒットする最大のキーワード集合を求めている。
【0030】
実施例2
次に、実施例2を説明する。実施例2は実施例1で説明したキーワード生成装置を用いて、構成した文書検索装置である。文書検索装置の具体的構成例とその他これに関連する装置を図4、文書検索装置の主な処理の流れを図5に示す。文書検索装置100は実施例1で説明したキーワード生成装置102、文書検索部104、映像信号変換部106、表示部108、選択入力部110とで構成されている。以下の説明は、顧客がコールセンタ内のオペレータに電話で質疑応答をする場面を想定する。
【0031】
顧客電話端末112は顧客がコールセンタとの音声信号を送受信するためのものである。まず顧客が例えば、顧客電話端末112から話しかけると、その音声信号が、ネットワーク114に入力され、オペレータと顧客との音声信号を送受信する電話送受信部116に着信し、顧客とオペレータの会話が可能となる(ステップS500)。接続切断判定部118は電話送受信部116の状態を監視している。オペレータが電話送受信部116で顧客の電話を受信することにより、顧客電話端末112と電話送受信部116との間でネットワーク114を介した通信が開始されたことを検出すると、接続切断判定部118はキーワード生成装置102に対して、接続情報を送信する。また、その通信が終了すると、切断情報を送信する。通信の接続または切断の判定は電話送受信部116から別途、通信が接続、切断したことを知らせる信号を出力させ、その信号を受信することで判定するなどの方法を取ることで実現できる。
【0032】
接続情報を受信したキーワード生成装置102は電話送受信部116を介して、送受信されている音声信号を受け取り、実施例1で説明したキーワード出力処理を実行し、キーワードを出力する(ステップS502)。なお、音声認識をする対象音声は、送話装置から取り出したオペレータ側の音声のみ、または受話装置から取り出した着信音声のみ、またはそれら両方を認識する何れでも良い。
関連キーワードが入力されると(ステップS504)、キーワード生成装置102より出力されたキーワードと関連キーワードは文書検索部104に入力される。
【0033】
関連キーワードについては、図1記載のキーワード生成装置102の出力部40より生成されたキーワードと同時に、関連キーワードを出力させるようにキーワード生成装置102を構成してもよい。また実施例1でも言及したように、応対が開始した直後に選択入力部110から、オペレータが関連キーワードを直接入力するのでもよいし、音声認識中の単語からキーワードを生成して、映像信号変換部106で映像信号に変換させて表示部108に表示させ、応対の途中で、オペレータが目視等で、それらキーワードの中から、応対に直接関連するキーワードを選び、選択入力部110から関連キーワードとして選択することで、文書検索部104に入力してもよい。
【0034】
キーワード生成装置102が文書検索装置100と一体構成されている場合は、選択入力部110は図1中の関連キーワード入力部36と、表示部108は図1中の表示部34とそれぞれ兼用すればよい。
【0035】
文書検索部104は、キーワードと関連キーワードの組を用いて、文書検索を行う。具体的には、文書記憶装置120内の検索データベース1201を用いて、キーワードと関連キーワードの組について実施例1で説明したAND検索による検索処理を行う。検索データベース1201は図1中の検索用データベース21と同様なものでもよい。その検索結果が文書検索部104に返され、その検索結果が映像信号変換部106により映像信号に変換され、表示部108に表示される(ステップS506)。
【0036】
上記検索結果中には得られた文書の件数、検索結果の各文書が文書記憶装置内120内の記憶されているメモリやファイルの位置やファイル名、各検索結果の見出し(タイトル)や要約文などが含まれる。
【0037】
表示部108の画面に表示された検索結果例を図6に示す。リスト欄402には、検索結果となる文書の内容をオペレータが把握するための文書のタイトル、又は要約文が表示されている。例えば「プリントサーバ経由で印刷をする方法」などである。この検索に用いられた、つまり文書検索部104に入力されたキーワードの組み合わせと、得られた文書の件数が検索キーワード表示欄401に表示している。
【0038】
オペレータはマウスなどの選択入力部110を操作し、リスト欄402に表示されているリストの何れかのタイトルまたは要約を、例えば、カーソルを移動させてクリックすることにより、選択し、その後、表示指令ボタン403にカーゾルを移動させて、クリックすることで表示指令を出す。選択入力部110からのこれら選択表示指示情報に基づき、文書検索部104は選択されたタイトルまたは要約と該当する文書情報を文書記憶装置120中から検索し(ステップS508)、この文書情報を文書検索部104に読み出す。この文書情報は映像信号変換部106に入力され、文書情報は映像信号に変換され、表示部108に表示される(ステップS508)。オペレータは表示部309に表示されている文書を参考にして、用件について説明することが可能である。
【0039】
なお、上述したようにキーワード生成装置102で用いた関連キーワードを応対中に得られたキーワードからオペレータの操作によって、選択する場合の具体例を説明する。応対中に順次得られたキーワードは表示部108の表示面に、図6中において選択用キーワード欄404に表示される。この選択用キーワード欄404に表示されたこれまでに検出したキーワードのリスト中から、応対の話題に直接的に関連するキーワード、つまり関連キーワードを選択する。例えば四角枠405で囲まれたキーワードを「プリンター」「故障」「電源」を選択し、選択ボタン表示406を選択する。この選択操作は選択入力部110を、タイトル又は要約文と該当する文書情報を選択表示させる場合と、同様に操作すればよい。
【0040】
上述したように、この発明はコールセンタ内のオペレータと顧客との電話による応対のみではなく、例えば、電子メールでのやり取りや、窓口での直接の会話による応対にも適用することが出来る。
【0041】
なお、キーワード生成装置102からその検索用データベース21で検索された文書のインデックスをも出力するようにし、その文書のインデックスのそれぞれに該当する文書のタイトル又は要約文を、文書検索部104により、文書記憶装置120から検索して、表示部108の表示面中のリスト欄402に表示するようにしてもよい。
【0042】
電子メールでのやり取りの場合は、電子メール中の本文が図1中の文字列入力部12に入力されると上述のように、キーワードを生成して、予め関連キーワードを関連キーワード記憶部32に記憶させておくことにより、文書記憶装置120からいくつかの文書が選択されるが、そのいくつかの文書の中から、例えば、一番選択された回数の多い文書を顧客に返答するようにすればよい。これらの処理をCPU(図示せず)などに制御させれば、オペレータを配置させる必要もなく、24時間応対業務を低コストで実施することなども可能である。
【0043】
以上の各実施形態の他、本発明であるキーワード生成装置・方法、文書検索装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記言語モデル作成装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
【0044】
また、上記キーワード生成装置、文書検索装置における処理機能をコンピュータによって実現する場合、キーワード生成装置、文書検索装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記キーワード生成装置、文書検索装置における処理機能がコンピュータ上で実現される。
【0045】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto−Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable−Read Only Memory)等を用いることができる。
【0046】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0047】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0048】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、キーワード生成装置、文書検索装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【図面の簡単な説明】
【0049】
【図1】この発明のキーワード生成装置の具体的構成例を示すブロック図。
【図2】キーワード生成装置の主な処理の流れを示すフローチャート
【図3】キーワード生成部20の主な処理の流れを示すフローチャート。
【図4】この発明の文書検索装置の具体的構成例を示すブロック図。
【図5】文書検索装置の主な処理の流れを示すフローチャート。
【図6】表示部108に表示される画面の具体例。

【特許請求の範囲】
【請求項1】
応対中の文字列中よりキーワードを検出し、検出したキーワードを、キーワード生成部へ送信するキーワード検出処理部と、
上記キーワードを出現時系列として蓄積するキーワード履歴記憶部と、
別途現在の応対に直接的に関連するキーワードである関連キーワードを受け取り、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、上記関連キーワードと直接的な結びつきがあるキーワードの連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて出力するキーワード生成部と、を有するキーワード生成装置。
【請求項2】
請求項1記載のキーワード生成装置において、
更に、上記キーワードの個々のものと同一のものを検索語とし、複数の文書のそれぞれについて、少なくともその文書に含まれる検索語が保存されている検索用データベースを備え、
上記キーワード生成部は、上記検索用データベースを用いて、上記関連キーワードと上記検出したキーワードとを検索語として含む文書を検索し、検索結果があれば、関連キーワードと結びつきがあると判定して、上記キーワードの連続する範囲を探し出し、
探し出された連続する範囲中の最も長く連続するキーワードを生成出力するものである、ことを特徴とするキーワード生成装置。
【請求項3】
請求項1または2の何れかに記載のキーワード生成装置において、
更に、上記関連キーワードを入力する関連キーワード入力部と、を有することを特徴とするキーワード生成装置。
【請求項4】
請求項1〜3の何れかに記載のキーワード生成装置を備え、
上記キーワード生成装置から出力されたキーワードまたはこれと上記関連キーワードを受け取ると、上記キーワードと上記関連キーワードを含む文書のタイトル又は要約を文書記憶装置から検索出力する文書検索部と、
上記文書検索部からの出力を映像信号に変換して、表示部へ出力する映像信号変換部と、を有することを特徴とする文書検索装置。
【請求項5】
請求項1〜3の何れかに記載のキーワード生成装置を備え、
上記キーワード生成部は上記生成したキーワードと関連キーワードを検索語として含む文書のインデックスをも出力するものであり、
上記キーワード生成装置から出力されたインデックスで、文書記憶装置から検索して、上記文書のタイトルまたは要約を出力する文書検索部と、
上記文書検索部からの出力を映像信号に変換して、表示部へ出力する映像信号変換部と、を有することを特徴とする文書検索装置。
【請求項6】
キーワード検出処理手段が、応対中の文字列中よりキーワードを検出するキーワード検出処理過程と、
キーワード履歴記憶手段が、上記キーワードを出現時系列として蓄積するキーワード履歴記憶過程と、
キーワード生成手段が、別途現在の応対に直接的に関連するキーワードである関連キーワードから、蓄積された上記キーワードの内、出現の新しいものから順に、時間をさかのぼり、上記関連キーワードと直接的な結びつきがあるキーワードの連続する範囲を探し出し、当該範囲にあるキーワードを組み合わせて生成するキーワード生成過程と、を有するキーワード生成方法。
【請求項7】
請求項6記載のキーワード生成方法において、
上記キーワード生成過程は、検索用データベースを参照して、上記関連キーワードと上記検出したキーワードとを検索語として含む文書を検索し、検索結果があれば、関連キーワードと結びつきがあると判定して、上記キーワードの連続する範囲を探し出し、
探し出された連続する範囲中の最も長く連続するキーワードを生成出力する過程であることを特徴とするキーワード生成方法、ここで検索用データベースは上記キーワードの個々のものと同一のものを検索語とし、複数の文書中のそれぞれについて、少なくとも、その文書に含まれる検索語が保存されたものである。
【請求項8】
請求項6または7の何れかに記載のキーワード生成方法において、
更に表示手段が、上記検出されたキーワードを表示手段に表示する過程と、キーワード取り出し手段が、関連キーワード入力手段により入力された入力情報に基づき上記表示手段に表示されたキーワード中の1ないし複数を上記関連キーワードとする過程と、を有することを特徴とするキーワード生成方法。
【請求項9】
請求項6〜8の何れかに記載のキーワード生成方法に加え、
文書検索手段が、上記キーワード生成過程で生成された上記キーワードと上記関連キーワードを含む文書のタイトル又は要約を文書記憶手段から検索する文書検索過程と、
映像信号変換手段が、上記検索された文書のタイトル又は要約を映像信号に変換して表示手段へ入力する映像信号変換過程と、を有することを特徴とする文書検索方法。
【請求項10】
請求項6〜8の何れかに記載のキーワード生成方法に加え、
上記キーワード生成過程は、更に上記生成したキーワードと関連キーワードを検索語として含む文書のインデックスを検索する過程であり、
文書検索手段が、上記キーワード生成過程により検索されたインデックスで、上記文書のタイトルまたは要約を文書記憶手段から検索する文書検索過程と、
映像信号変換手段が、上記検索された文書のタイトル又は要約を映像信号に変換して表示手段へ入力する映像信号変換過程と、を有することを特徴とする文書検索方法。
【請求項11】
請求項9又は10に記載の文書検索方法において、
上記文書検索過程は、更に、上記選択入力手段により選択入力された情報に基づき、上記文書のタイトル又は要約に対応する文書を文書記憶手段から読み出して、上記映像信号変換手段へ入力する過程を含むことを特徴とする文書検索方法。
【請求項12】
請求項6〜8の何れかに記載のキーワード生成方法の各過程をコンピュータに実行させるためのキーワード生成プログラム。
【請求項13】
請求項9〜11の何れかに記載の文書検索方法の各過程をコンピュータに実行させるための文書検索プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2007−323558(P2007−323558A)
【公開日】平成19年12月13日(2007.12.13)
【国際特許分類】
【出願番号】特願2006−155693(P2006−155693)
【出願日】平成18年6月5日(2006.6.5)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】