説明

カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム

【課題】質問回答の事例をカテゴリに分類することが可能なカテゴリ分類処理装置を提供する。
【解決手段】検索部11は、クライアント4により実際に参照されたQ&Aの事例をキーワードと共に検索キーワードログ集合14として格納する。カテゴリ抽出部12は、検索キーワードログ集合14において、Q&Aの事例と共に記録された1個のキーワードについて、Q&Aの事例毎かつ1個のキーワード毎に格納された回数を求め、Q&Aの事例毎に回数が多い順に上位からm(mは正の整数)個までのキーワードをQ&Aの事例毎にカテゴリ候補として抽出し、抽出したカテゴリ候補をカテゴリとして用いてカテゴリとQ&Aの事例とを対応付ける。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システムに関する。
【背景技術】
【0002】
多くの企業は、自社の製品についての質問回答(以下、Q&Aという)の事例を蓄積したQ&Aデータベースを用意して、ユーザがインターネットを介してQ&Aデータベースにアクセスできるようにしている。Q&Aデータベースの構築においては、ユーザが満足できる回答を得られるようにすることが求められる。換言すれば、ユーザがあるカテゴリの質問文を入力すると、これに応じて、ユーザが満足できる回答文が抽出されるようにすることが求められる。このために、質問文と回答文との対で構成されるQ&Aの事例を、適切なカテゴリに分類することが求められる。
【0003】
なお、質問文と回答文との対を含む事例が記憶された事例データベースと、事例の質問文に含まれるキーワードの重要度を質問文の対の回答文同士の類似度を用いて計算し、重要度に基づいて、問い合わせ文に対する回答を絞り込む為の絞込みキーワードを前記キーワードから選択する絞込みキーワード選択手段とを有する質問回答検索システムが提案されている。
【0004】
また、第1ユーザから質問の入力の受信工程と、前記質問と関連したカテゴリの決定工程と、前記質問の所定のウェブページ上への提供工程と、第2ユーザから前記質問に対する回答の入力の受信工程と、前記回答の入力に応答して前記カテゴリに対応する前記第2ユーザと関連した回答数の増加工程と、前記第1ユーザから前記回答が選択された場合、前記カテゴリに対応する前記第2ユーザと関連した回答採択数の増加工程と、前記回答数および前記回答採択数を含む評価資料に基づいて前記カテゴリに対応する前記第2ユーザと関連したポイントの算出工程と、前記ポイントが所定の基準値以上である場合、前記第2ユーザを前記カテゴリに該当する分野の専門家として選出する工程と、を含むエキスパート選出方法が提案されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2010−009471号公報
【特許文献2】特表2006−524370号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
Q&Aの事例は、Q&Aデータベースのオペレータにより、人手で適切と考えられるカテゴリに分類される。実際の分類に際しては、実際に質問文及び回答文を読んで分類する方法、又は、質問文の本文及び回答文の本文の文字列からキーワードを抽出して、抽出したキーワードに基づいて分類する方法が採用される。
【0007】
しかし、Q&Aの事例をオペレータによりカテゴリに分類しているので、多大な手間と労力を要する。また、このため、一旦分類したカテゴリの更新は、事実上困難であるか、又は、相当の時間を経過してから実行されることが多い。この結果、カテゴリに属するQ&Aの事例が古いという問題が生じる。また、カテゴリ自体が陳腐化するという問題が生じる。カテゴリ自体の陳腐化とは、最新のQ&Aの事例が既存のどのカテゴリにも分類することができない状態である。また、カテゴリとQ&Aの事例の関係、換言すれば、カテゴリ分類の適切さが、ユーザの想定と合っていない場合があるという問題が生じる。
【0008】
本発明は、質問回答の事例をカテゴリに分類することが可能なカテゴリ分類処理装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
開示されるカテゴリ分類処理装置は、事例格納部と、ログ格納部と、検索部と、カテゴリ抽出部とを含む。事例格納部は、質問文と回答文との対を含む質問回答の事例を格納する。ログ格納部は、質問回答の事例の検索についてのログを格納する。検索部は、1又は複数のキーワードを入力するための入力画面を端末装置に送信し、入力画面に入力された1又は複数のキーワードにより事例格納部を検索して質問回答の事例を抽出し、抽出した質問回答の事例を表す識別情報を端末装置に送信し、端末装置により実際に識別情報を用いて参照された質問回答の事例の識別情報を入力画面に入力された1又は複数のキーワードと共に検索キーワードログとして、ログ格納部に格納する。カテゴリ抽出部は、検索キーワードログにおいて、質問回答の事例と共に記録された1個のキーワードについて、質問回答の事例毎かつ1個のキーワード毎に格納された回数を求め、質問回答の事例毎に回数が多い順に上位からm(mは正の整数)個までのキーワードを質問回答の事例毎にカテゴリ候補として抽出し、抽出したカテゴリ候補をカテゴリとして用いてカテゴリと質問回答の事例とを対応付けるカテゴリ抽出部とを含む。
【発明の効果】
【0010】
開示されるカテゴリ分類処理装置によれば、ユーザにより実際に参照された質問回答の事例と入力されたキーワードとに基づいて、質問回答の事例をカテゴリに分類することができる。
【図面の簡単な説明】
【0011】
【図1】カテゴリ分類処理装置を含む質問回答システムの一例を示す図である。
【図2】事例検索サーバのハードウェアの構成の一例を示す説明図である。
【図3】カテゴリ分類処理の説明図である。
【図4】カテゴリ分類処理の説明図である。
【図5】カテゴリ分類処理の説明図である。
【図6】カテゴリ分類処理の説明図である。
【図7】カテゴリ分類処理の説明図である。
【図8】カテゴリ分類処理の説明図である。
【図9】カテゴリ分類処理の説明図である。
【図10】カテゴリ分類処理の説明図である。
【図11】カテゴリ分類処理の説明図である。
【図12】カテゴリ分類処理の説明図である。
【図13】カテゴリ分類処理の説明図である。
【図14】カテゴリ分類処理の説明図である。
【図15】カテゴリ分類処理の説明図である。
【図16】カテゴリ分類処理の説明図である。
【図17】カテゴリ分類処理の説明図である。
【図18】カテゴリ分類処理フローである。
【発明を実施するための形態】
【0012】
図1は、カテゴリ分類処理装置を含む質問回答システムの一例を示す図である。
【0013】
質問回答システムは、事例検索サーバ1と、検索サーバ2と、ネットワーク3と、複数のクライアント4とを含む。事例検索サーバ1、検索サーバ2及び複数のクライアント4の間は、例えばインターネットのようなネットワーク3により相互に接続される。
【0014】
クライアント4は、端末装置であり、ネットワーク3を介して、事例検索サーバ1にアクセスして、事例検索サーバ1が格納する事例を検索して検索結果を取得する。事例検索サーバ1が格納する事例は、例えば、質問回答(以下、Q&A)の事例である。
【0015】
また、クライアント4は、ネットワーク3を介して、検索サーバ2にアクセスして、検索サーバ2を介して事例検索サーバ1にアクセスして、事例検索サーバ1が格納する事例を検索して検索結果を取得する。検索サーバ2が、事例検索サーバ1が格納する事例と同一の事例を格納して、クライアント4が、検索サーバ2が格納する事例を検索するようにしても良い。検索サーバ2が格納する事例は、例えば、質問回答の事例である。
【0016】
事例検索サーバ1は、検索部11と、カテゴリ抽出部12と、Q&Aデータベース13と、検索キーワードログ集合14と、単語数設定ファイル15と、抽出条件設定ファイル16と、カテゴリマスタ17とを含む。カテゴリ抽出部12は、集計部121と、抽出部122と、作成部123とを含む。
【0017】
検索部11は、クライアント4からの要求に応じて、1又は複数のキーワードを入力するための入力画面を、クライアント4に送信する。クライアント4は、受信した入力画面を表示装置に表示する。
【0018】
表示された入力画面を見たクライアント4のユーザは、入力画面にキーワードを入力する。クライアント4は、入力画面にキーワードが入力されると、入力されたキーワードを事例検索サーバ1に送信する。
【0019】
事例検索サーバ1は、入力されたキーワードを受信すると、受信したキーワードを検索部11に送る。これに応じて、検索部11は、受信したキーワード、換言すれば、入力画面に入力された1又は複数のキーワードにより、Q&Aデータベース13を検索して、キーワードに対応付けられたQ&Aの事例を抽出する。この時、Q&Aの事例は、複数抽出される。
【0020】
検索部11は、抽出したQ&Aの事例を表す識別情報をクライアント4に送信する。識別情報は、Q&Aの事例を一意に定める情報である。識別情報としては、例えば、Q&Aナンバーが用いられる。前述したように、複数のQ&Aの事例が抽出されるので、検索部11は、例えば、複数のQ&Aの事例に対応する複数の識別情報のリストを生成して、生成したリストをクライアント4に送信する。クライアント4は、受信した複数の識別情報のリストを表示装置に表示する。
【0021】
表示された複数の識別情報のリストを見たクライアント4のユーザは、複数の識別情報のリストから、1個の識別情報を選択する。クライアント4は、複数の識別情報のリストから1個の識別情報が選択されると、選択された1個の識別情報を事例検索サーバ1に送信する。
【0022】
事例検索サーバ1は、選択された1個の識別情報を受信すると、受信した選択された1個の識別情報を検索部11に送る。これに応じて、検索部11は、Q&Aデータベース13から選択された1個の識別情報により表される1個のQ&Aの事例を読み出して、クライアント4に送信する。クライアント4は、受信した1個のQ&Aの事例を表示装置に表示する。これにより、クライアント4のユーザは、表示されたQ&Aの事例を見て、自己が望んだ回答を知る。従って、選択された1個の識別情報により表される1個のQ&Aの事例が、クライアント4のユーザにより実際に識別情報を用いて参照されたQ&Aの事例である。
【0023】
そこで、検索部11は、クライアント4により実際に識別情報を用いて参照されたQ&Aの事例の識別情報を、検索キーワードログ格納部に格納する。この時、検索部11は、Q&Aの事例の識別情報を、入力画面に入力された1又は複数のキーワードと共に格納する。これにより、Q&Aデータベース13の検索についてのログである1個の検索キーワードログが得られる。従って、1個の検索キーワードログは、Q&Aの事例の識別情報と、1又は複数のキーワードとを含む。
【0024】
Q&Aデータベース13の検索の都度に1個の検索キーワードログが得られるので、検索キーワードログ格納部には多数の検索キーワードログの集合である検索キーワードログ集合14が得られる。検索キーワードログ集合14は、Q&Aの事例の検索についてのログであり、検索キーワードログ格納部に格納される。
【0025】
カテゴリ抽出部12は、検索キーワードログ集合14に基づいて、Q&Aの事例の分類先としてのカテゴリを抽出する。
【0026】
具体的には、カテゴリ抽出部12において、集計部121は、検索キーワードログ集合14において、Q&Aの事例と共に記録された1個のキーワードについて、Q&Aの事例毎かつ1個のキーワード毎に格納された回数を求める。換言すれば、Q&Aの事例毎に、どのキーワードが、何回参照されたかが、集計される。
【0027】
カテゴリ抽出部12において、抽出部122は、Q&Aの事例毎に回数が多い順に上位からm(mは正の整数)個までのキーワードを、Q&Aの事例毎にカテゴリ候補として抽出する。これにより、m個のカテゴリ候補が抽出される。mの値は、抽出条件設定ファイル16に予め記述される。これにより、mの値を容易に変更することができる。抽出条件設定ファイル16は、抽出条件設定ファイル格納部に格納される。mの値は、例えば2である。これにより、抽出されるカテゴリ候補の数を抑えることができる。
【0028】
カテゴリ抽出部12において、作成部123は、抽出したカテゴリ候補をカテゴリとして用いてカテゴリとQ&Aの事例とを対応付ける。換言すれば、Q&Aの事例がカテゴリに分類される。作成部123は、対応付けたカテゴリとQ&Aの事例との関係を、カテゴリマスタ17に格納する。カテゴリマスタ17は、対応付けたカテゴリとQ&Aの事例との関係を格納するファイルであって、カテゴリマスタ格納部に格納される。カテゴリマスタ17は、Q&Aデータベース13のデータ構造に反映される。
【0029】
また、カテゴリ抽出部12は、検索キーワードログ集合14に基づいて、Q&Aの事例の分類先としてのサブカテゴリを抽出する。
【0030】
具体的には、カテゴリ抽出部12において、集計部121は、Q&Aの事例と共に記録されたn(nは正の整数)個のキーワードを含むキーワードの組について、Q&Aの事例毎かつキーワードの組毎に格納された回数を求める。換言すれば、Q&Aの事例毎に、どのキーワードの組が、何回参照されたかが、集計される。nの値は、単語数設定ファイル15に予め記述される。これにより、nの値を容易に変更することができる。単語数設定ファイル15は、単語数設定ファイル格納部に格納される。nの値は、例えば2である。これにより、抽出されるサブカテゴリ候補の数を抑えることができる。
【0031】
カテゴリ抽出部12において、抽出部122は、Q&Aの事例毎に回数が多い順に上位からm個までのキーワードの組に属するキーワードをQ&Aの事例毎に仮サブカテゴリ候補として抽出する。これにより、m個の仮サブカテゴリ候補が抽出される。前述したように、mの値は容易に変更することができる。mの値は例えば2であるので、抽出される仮サブカテゴリ候補の数を抑えることができる。
【0032】
カテゴリ抽出部12において、作成部123は、抽出したカテゴリ候補をカテゴリとして用い、抽出した仮サブカテゴリ候補をサブカテゴリとして用いて、カテゴリとサブカテゴリとを対応付け、サブカテゴリとQ&Aの事例とを対応付ける。換言すれば、Q&Aの事例がサブカテゴリに分類され、サブカテゴリがカテゴリに分類される。作成部123は、対応付けたカテゴリとサブカテゴリとの関係、及び、対応付けたサブカテゴリとQ&Aの事例との関係を、カテゴリマスタ17に格納する。
【0033】
図2は、検索装置のハードウェア構成の一例を示す図である。
【0034】
CPU101は、ROM102に格納された制御プログラムに従って、事例検索サーバ1を制御する。CPU101は、例えば主メモリであるRAM103上の検索プログラム及びカテゴリ抽出プログラムを実行する。これにより、検索部11、カテゴリ抽出部12が実現される。検索プログラム及びカテゴリ抽出プログラムは、例えば、CD−ROMやDVD等の記録媒体109に格納され、記録媒体109からハードディスク106に入力され、ハードディスク106からRAM103にロードされる。
【0035】
Q&Aデータベース13、検索キーワードログ格納部、カテゴリマスタ格納部、単語数設定ファイル格納部、抽出条件設定ファイル格納部は、例えばハードディスク106に設けられる。換言すれば、データは、例えばハードディスク106に格納される。データは、例えば、CD−ROMやDVD等の記録媒体109に格納され、記録媒体109からハードディスク106に入力され、必要に応じてハードディスク106からRAM103にロードされ、検索部11又はカテゴリ抽出部12により処理される。
【0036】
入力装置104は、例えばキーボードであり、マウス等を含んでも良い。出力装置105は、例えばディスプレイであり、プリンタ等の出力装置を含んでも良い。CPU101、ROM102、RAM103、入力装置104、出力装置105、及び、ハードディスク106、ネットワーク接続部107は、バス108を介して、相互に接続される。
【0037】
ネットワーク接続部107は、例えば、送受信装置であり、ネットワーク3に接続され、ネットワーク3を介して他のコンピュータ、例えば検索サーバ2及び複数のクライアント4に接続される。これにより、事例検索サーバ1は、検索サーバ2と複数のクライアント4との間で通信を行う。
【0038】
以下、図3〜図17を参照して、Q&Aの事例のカテゴリ及びサブカテゴリ分類処理について具体的に説明する。
【0039】
事例検索サーバ1の検索部11は、前述したように、クライアント4からの要求に応じて、キーワードを入力するための入力画面を、クライアント4に送信する。クライアント4が受信した入力画面を表示装置に表示すると、ユーザは、例えば、図3に示すように、キーワード「コピー」を入力する。なお、入力画面は、例えば、図3の画面41の上部のキーワード「コピー」が入力されたフィールドと、検索ボタンとを含む画面である。
【0040】
クライアント4が入力されたキーワードを事例検索サーバ1に送信すると、事例検索サーバ1の検索部11は、受信したキーワード「コピー」により、Q&Aデータベース13を検索して、キーワード「コピー」に対応付けられた複数のQ&Aの事例を抽出し、抽出した複数のQ&Aの事例を表すQ&Aナンバーのリストをクライアント4に送信する。クライアント4は、図3に示すように、受信した複数のQ&Aナンバーのリストを含む画面41を表示装置に表示する。
【0041】
この時、画面41は、実際には、図3に示すように、Q&Aの事例毎に、Q&Aナンバーに加えて、Q&Aの事例のタイトル「[OS#2]ハードディスクの空き容量を増やす方法を教えて下さい。」と、Q&Aの事例の更新日とを含む。従って、検索部11は、Q&Aナンバーのリストに加えて、Q&Aナンバー毎のタイトルと、Q&Aナンバー毎の更新日と含む画面41を、クライアント4に送信する。表示された画面41を見たクライアント4のユーザは、例えば、4番目のQ&Aナンバー「5678−1111」を選択する。クライアント4は、選択されたQ&Aナンバー「5678−1111」を事例検索サーバ1に送信する。
【0042】
事例検索サーバ1の検索部11は、Q&Aデータベース13から、選択されたQ&Aナンバー「5678−1111」を持つQ&Aの事例を読み出して、受信したQ&Aナンバー「5678−1111」を持つQ&Aの事例の画面42を、クライアント4に送信する。クライアント4は、図4に示すように、受信したQ&Aナンバー「5678−1111」を持つQ&Aの事例の画面42を表示装置に表示する。これにより、クライアント4のユーザは、Q&Aナンバー「5678−1111」を持つQ&Aの事例を知ることができる。
【0043】
ここで、Q&Aナンバー「5678−1111」を持つQ&Aの事例が、クライアント4のユーザにより実際に参照されたQ&Aの事例である。
【0044】
そこで、検索部11は、図5に示すように、実際に参照されたQ&Aの事例のQ&Aナンバー「5678−1111」と、キーワード「コピー」とを、1個の検索キーワードログとして、検索キーワードログ集合14に加える。
【0045】
この時、検索キーワードログ集合14において、1個の検索キーワードログは、実際には、図5に示すように、参照日時(REFERENCE LOG DATE)と、キーワード(REFERENCE QUERY)と、Q&Aナンバー(REFERENCE PUBLIC ID)とを格納する。検索キーワードログ集合14において、検索キーワードログが、Q&Aの事例の参照についての種々のデータを含むようにしても良い。
【0046】
なお、検索キーワードログ集合14Aは、クライアント4から検索サーバ2を介してQ&Aデータベース13がアクセスされた場合における、検索キーワードログの集合である。換言すれば、事例検索サーバ1から見て外部の検索サイトである検索サーバ2からのアクセスについての検索キーワードログ集合14Aは、自サーバへのアクセスについての検索キーワードログ集合14とは別に生成される。検索キーワードログ集合14Aは、検索キーワードログ集合14と同様に、参照日時(REFERENCE LOG DATE)と、キーワード(REFERENCE QUERY)と、Q&Aナンバー(REFERENCE PUBLIC ID)とを格納する。検索キーワードログ集合14Aにおいて、検索キーワードログが、Q&Aの事例の参照についての種々のデータを含むようにしても良い。
【0047】
検索キーワードログ集合14と検索キーワードログ集合14Aとを、一体に生成するようにしても良い。また、検索キーワードログ集合14Aを、ネットワーク3を介して、検索サーバ2から転送するようにしても良い。
【0048】
カテゴリ抽出部12は、予め定められた周期で、検索キーワードログ集合14に基づいて、カテゴリ及びサブカテゴリを抽出し、Q&Aの事例を抽出したカテゴリ及びサブカテゴリに分類する。この周期は、例えば、24時間毎とされる。従って、例えば、ある1日において蓄積された検索キーワードログ集合14に基づいて、カテゴリ及びサブカテゴリが更新され、Q&Aの事例のカテゴリ及びサブカテゴリへの分類が更新される。換言すれば、カテゴリマスタ17が更新される。これにより、最新のカテゴリマスタ17に基づいて、Q&Aデータベース13を検索することができる。
【0049】
カテゴリ抽出部12の集計部121は、検索キーワードログ集合14に基づいて、Q&Aの事例毎に、どのキーワードが、何回参照されたかを、集計する。
【0050】
最初に、集計部121は、図6(A)に示すように、抽出結果141を生成する。抽出結果141は、検索キーワードログ集合14に格納された検索キーワードログについての抽出結果であり、検索キーワードログ集合14からQ&Aナンバーと対応するキーワードとを抜き出したものである。また、集計部121は、図6(B)に示すように、抽出結果142を生成する。抽出結果142は、検索キーワードログ集合14Aに格納された検索キーワードログについての抽出結果であり、検索キーワードログ集合14AからQ&Aナンバーと対応するキーワードとを抜き出したものである。
【0051】
次に、集計部121は、図7に示すように、抽出結果141及び抽出結果142に基づいて、キーワードについて正規化した正規化結果143を生成する。例えば、集計部121は、抽出結果141の2行目に存在する、Q&Aナンバー「1111−1111」についてのキーワード「”dvd” ”録画”」を、スペースが存在するので、「”dvd”」及び「”録画”」の2単語に分割する。抽出結果141の5行目及び6行目と、抽出結果142の2行目、3行目及び8行目についても、同様である。また、集計部121は、抽出結果141の2行目から得た2単語「”dvd”」及び「”録画”」から、「””」を削除する。抽出結果142の3行目についても、同様である。また、集計部121は、抽出結果141の2行目から得た単語「dvd」について、大文字「DVD」に変換する。抽出結果141の2行目及び5行目の小文字と、抽出結果142の3行目及び5行目の小文字についても、同様である。
【0052】
これにより、例えば、正規化結果143において、抽出結果141の2行目に存在するQ&Aナンバー「1111−1111」について2個のキーワード「DVD」及び「録画」が得られ、抽出結果141の5行目に存在するQ&Aナンバー「1111−1111」について、3個のキーワード「DVD」「録画」及び「BLU−RAY」が得られる。
【0053】
次に、集計部121は、図8に示すように、正規化結果143に基づいて、単語一覧データ144を生成する。例えば、集計部121は、正規化結果143の2行目に存在するQ&Aナンバー「1111−1111」について2個のキーワード「DVD」及び「録画」を、各々、別のキーワードとして抽出する。これにより、正規化結果143の2行目に存在するQ&Aナンバー「1111−1111」についてのキーワード「DVD」に基づいて、単語一覧データ144の2行目に、キーワード「DVD」が抽出される。また、正規化結果143の2行目に存在するQ&Aナンバー「1111−1111」についてのキーワード「録画」に基づいて、単語一覧データ144の3行目に、キーワード「録画」が抽出される。
【0054】
次に、前述したように、単語数設定ファイル15に格納されたnの値が「2」であるので、集計部121は、図9に示すように、正規化結果143に基づいて、2単語一覧データ145を生成する。
【0055】
例えば、集計部121は、正規化結果143の2行目に存在するQ&Aナンバー「1111−1111」について2個のキーワード「DVD」及び「録画」を2個のキーワードの組として抽出する。これにより、正規化結果143の2行目に存在するQ&Aナンバー「1111−1111」についての2個のキーワード「DVD」及び「録画」に基づいて、2単語一覧データ145の1行目に、キーワード「DVD」及び「録画」の組が抽出される。
【0056】
また、例えば、正規化結果143の5行目に存在するQ&Aナンバー「1111−1111」についてのキーワード「DVD」「録画」「BLU−RAY」に基づいて、2単語一覧データ145の2行目にキーワード「DVD」及び「録画」の組、3行目にキーワード「BLU−RAY」及び「DVD」の組、4行目にキーワード「BLU−RAY」及び「録画」の組が、各々、抽出される。換言すれば、カテゴリ抽出部12の集計部121は、Q&Aの事例と共にnの値を超える数のキーワードが記録されている場合に、nの値を超える数のキーワードからn個のキーワードを取り出して組み合せることにより、キーワードの組を複数生成する。これにより、後述するサブカテゴリ候補の数を抑えることができる。
【0057】
次に、集計部121は、図10(A)に示すように、単語一覧データ144に基づいて、集計結果146を生成する。例えば、単語一覧データ144において、Q&Aナンバー「1111−1111」について、キーワード「DVD」は、7回出現する。従って、集計結果146において、Q&Aナンバー「1111−1111」について、キーワード「DVD」が参照された回数は「7」とされる。
【0058】
次に、集計部121は、図10(B)に示すように、2単語一覧データ145に基づいて、集計結果147を生成する。例えば、2単語一覧データ145において、Q&Aナンバー「1111−1111」について、キーワード「DVD」及び「録画」の組は、2回出現する。従って、集計結果147において、Q&Aナンバー「1111−1111」について、キーワード「DVD」及び「録画」の組が参照された回数は「2」とされる。
【0059】
カテゴリ抽出部12において、抽出部122は、集計結果146に基づいて、図11(A)に示すように、カテゴリ候補一覧148を生成する。この時、前述したように、抽出条件設定ファイル16に格納されたmの値が「2」であるので、Q&Aの事例毎に、回数が多い順に、2個のキーワードが、カテゴリ候補として抽出される。
【0060】
例えば、集計結果146において、Q&Aナンバー「1111−1111」について、参照回数が上位から2個の範囲にあるのは、キーワード「DVD」及び「録画」である。従って、カテゴリ候補一覧148において、第1行に、Q&Aナンバー「1111−1111」についてのキーワード「DVD」が得られ、第2行に、Q&Aナンバー「1111−1111」についてのキーワード「録画」が得られる。換言すれば、Q&Aナンバー「1111−1111」のカテゴリ候補は、キーワード「DVD」及び「録画」である。
【0061】
なお、カテゴリ候補一覧148においては、Q&Aナンバー毎かつカテゴリ候補毎に、参照回数が付加される。参照回数は、省略するようにしても良い。
【0062】
次に、抽出部122は、集計結果147に基づいて、図11(B)に示すように、サブカテゴリ候補一覧149を生成する。この時、前述したように、抽出条件設定ファイル16に格納されたmの値が「2」であるので、Q&Aの事例毎に、回数が多い順に、2個のキーワードの組が、仮サブカテゴリ候補として抽出される。
【0063】
例えば、集計結果147において、Q&Aナンバー「1111−1111」について、参照回数が上位から2個の範囲にあるのは、キーワード「DVD」及び「録画」の組と、キーワード「DVD」及び「保存」の組である。従って、サブカテゴリ候補一覧149において、第1行に、Q&Aナンバー「1111−1111」についてのキーワード「DVD」及び「録画」の組が得られ、第2行に、Q&Aナンバー「1111−1111」についてのキーワード「DVD」及び「保存」の組が得られる。換言すれば、Q&Aナンバー「1111−1111」の仮サブカテゴリ候補は、キーワード「DVD」及び「録画」の組と、キーワード「DVD」及び「保存」の組である。
【0064】
ここで、カテゴリ候補の抽出及び仮サブカテゴリ候補の抽出において、抽出部122は、以下のようにして、カテゴリ候補を抽出する。
【0065】
例えば、単語一覧データ144に基づいて、図12(A)に示すような集計結果146Aが生成されたとする。抽出部122は、Q&Aナンバー毎に、回数が多い順にキーワードに順位を付ける。そして、抽出部122は、Q&Aナンバー毎に、カテゴリ候補を抽出する。例えば、抽出部122は、Q&Aナンバー「1111−1111」について、1位に属するキーワード「DVD」をカテゴリ候補として抽出する。また、抽出部122は、1位に属するキーワードの数が「2」以上であるかを判定する。1位に属するキーワードは「DVD」のみであるので、1位に属するキーワードの数「2」よりも少ない。そこで、抽出部122は、2位に属するキーワードについて、1位と同様の処理を実行する。従って、2位に属するキーワード「録画」及び「BLU−RAY」の全部が、Q&Aナンバー「1111−1111」について、カテゴリ候補として抽出される。これにより、図12(B)に示すように、カテゴリ候補一覧148Aに、3個のカテゴリ候補が得られる。
【0066】
なお、2位に属するキーワード「録画」及び「BLU−RAY」の一部を、Q&Aナンバー「1111−1111」について、カテゴリ候補として抽出するようにしても良い。
【0067】
また、例えば、単語一覧データ144に基づいて、図13(A)に示すような集計結果146Bが生成されたとする。この場合、抽出部122は、Q&Aナンバー「1111−1111」について、1位に属するキーワード「DVD」及び「録画」をカテゴリ候補として抽出する。また、抽出部122は、1位に属するキーワードの数が「2」以上であるので、2位以下についての処理を実行しない。これにより、図13(B)に示すように、カテゴリ候補一覧148Bに、2個のカテゴリ候補が得られる。
【0068】
以上のように、抽出部122は、上位からm個のキーワードが属する順位を求め、求めた順位に属するキーワードの全部又は一部をカテゴリ候補として抽出する。また、抽出部122は、Q&Aナンバー毎に、上位の順位に属するキーワードの数がmの値以上であるかを判定し、mの値以上である場合に、上位の順位に属するキーワードの全部又は一部をカテゴリ候補として抽出し、mの値よりも少ない場合に、上位の順位の次の順位に属するキーワードの数がmの値以上であるかを判定する。
【0069】
なお、抽出部122は、あるQ&Aナンバーと共に記録されたキーワードの総数がmの値よりも少ない場合に、Q&Aナンバーと共に記録されたキーワードの全てを、カテゴリ候補として抽出する。
【0070】
次に、抽出部122は、カテゴリ候補一覧148に基づいて、カテゴリ候補一覧148内のカテゴリ候補をキーとして、Q&Aナンバーをマージする。例えば、キーワード「DVD」をキーとして、「DVD」に対応するQ&Aナンバーをまとめる。これにより、抽出部122は、図11(C)に示すように、カテゴリ候補マージ表150を生成する。カテゴリ候補マージ表150において、例えば、キーワード「DVD」をカテゴリ候補とするQ&Aナンバーが3個存在する。
【0071】
なお、カテゴリ候補マージ表150においては、Q&Aナンバー毎かつカテゴリ候補毎に参照回数が付加され、カテゴリ候補毎に参照回数総数が付加される。参照回数総数は、カテゴリ候補についての参照回数の和である。参照回数及び参照回数総数は、省略するようにしても良い。
【0072】
次に、抽出部122は、サブカテゴリ候補一覧149に基づいて、図11(D)に示すように、サブカテゴリ候補マージ表151を生成する。例えば、抽出部122は、サブカテゴリ候補一覧149にいて、仮サブカテゴリ候補「DVD」及び「録画」の中でカテゴリ候補「DVD」と一致するキーワード「DVD」を第1単語として抽出する。また、抽出部122は、仮サブカテゴリ候補「DVD」及び「録画」の中で、第1単語「DVD」以外の残りのキーワード「録画」を第2単語として抽出する。更に、抽出部122は、第1単語と一致するカテゴリ候補「DVD」をカテゴリ候補とした場合において、第2単語「録画」をカテゴリ候補のサブカテゴリ候補とする。
【0073】
なお、第2単語の数は1個に限られず、複数であっても良い。複数の第2単語が存在する場合、複数の第2単語の各々が、サブカテゴリ候補とされる。
【0074】
また、抽出部122は、サブカテゴリ候補一覧149にいて、仮サブカテゴリ候補「DVD」及び「録画」の中でカテゴリ候補「録画」と一致するキーワード「録画」を第1単語として抽出し、残りのキーワード「DVD」を第2単語として抽出する。更に、抽出部122は、第1単語と一致するカテゴリ候補「録画」をカテゴリ候補とした場合において、第2単語「DVD」をカテゴリ候補のサブカテゴリ候補とする。
【0075】
以上の結果、サブカテゴリ候補マージ表151において、例えば、キーワード「DVD」をカテゴリ候補とする2個のサブカテゴリ候補「録画」及び「保存」が存在する。また、例えば、キーワード「録画」をサブカテゴリ候補とするQ&Aナンバー「1111−1111」が存在する。換言すれば、Q&Aナンバー「1111−1111」は、カテゴリ候補「DVD」のサブカテゴリ候補「録画」に属する。
【0076】
カテゴリ抽出部12において、作成部123は、カテゴリ候補マージ表150とサブカテゴリ候補マージ表151とに基づいて、図14に示すように、カテゴリマスタ17を生成する。例えば、作成部123は、カテゴリ候補マージ表150に基づいてカテゴリ候補をカテゴリとし、サブカテゴリ候補マージ表151に基づいてサブカテゴリ候補をサブカテゴリとし、サブカテゴリ候補マージ表151に基づいて、カテゴリにサブカテゴリを対応付け、サブカテゴリにQ&Aナンバーを対応付ける。これにより、図14に示すカテゴリマスタ17が生成される。図14に示すカテゴリマスタ17においては、カテゴリは、サブカテゴリを介して、Q&Aナンバーと対応付けられる。
【0077】
なお、カテゴリマスタ17は、図14に示す構成に限られず、種々の構成をとることができる。例えば、カテゴリマスタ17は、図15(A)〜図15(C)に示すように、複数のテーブル171〜173により構成することができる。
【0078】
この場合、例えば、作成部123は、抽出したカテゴリ候補に、カテゴリ候補マージ表150において参照回数総数の多い順に、カテゴリIDを付与してカテゴリとする。これにより、第1テーブル171が生成される。換言すれば、カテゴリとカテゴリIDとが対応付けられる。
【0079】
また、作成部123は、抽出したサブカテゴリ候補に、サブカテゴリ候補マージ表151における出現の順に、サブカテゴリIDを付与してサブカテゴリとする。また、作成部123は、サブカテゴリ候補マージ表151から、サブカテゴリに対応するカテゴリを抽出してカテゴリIDに置換する。これにより、第2テーブル172が生成される。換言すれば、カテゴリとサブカテゴリとが対応付けられる。
【0080】
更に、作成部123は、第1テーブル171と第2テーブル172とをマージし、カテゴリとQ&Aナンバーとを対応付け、カテゴリ及びサブカテゴリとQ&Aナンバーとを対応付ける。これにより、第3テーブル173が生成される。
【0081】
例えば、作成部123は、第1テーブル171のカテゴリID「1」について、カテゴリ候補マージ表150を参照して、対応する3個のQ&Aナンバーを求める。これにより、第3テーブル173の第1行〜第3行が得られる。次に、作成部123は、第1テーブル171のカテゴリID「1」について、第2テーブル172を参照して、対応する1個のサブカテゴリID「1」を求める。そして、作成部123は、カテゴリID「1」に対応するキーワード「DVD」とサブカテゴリID「1」に対応するキーワード「録画」とを用いてサブカテゴリ候補マージ表151を参照して、対応するQ&Aナンバー「1111−1111」を求める。カテゴリID「1」に対応するキーワード「DVD」は第1テーブル171から求められ、サブカテゴリID「1」に対応するキーワード「録画」は第2テーブル172から求められる。以上の処理が、カテゴリIDの順、及び、サブカテゴリIDの順に繰り返される。
【0082】
前述したように、カテゴリマスタ17は、Q&Aデータベース13の構造に反映される。換言すれば、Q&Aデータベース13のデータ構造は、図16に示すように、カテゴリマスタ17に従う階層構造とされる。例えば、カテゴリトップにおいて、カテゴリAにサブカテゴリA1が対応付けられ、サブカテゴリA1にカテゴリQ&A一覧が対応付けられ、カテゴリQ&A一覧において、サブカテゴリA1にサブカテゴリA1に属するQ&Aが対応付けられる。
【0083】
カテゴリマスタ17に従う階層構造のQ&Aデータベース13に基づいて、検索部11は、クライアント4からの要求に応じて、図16に示す画面を、クライアント4に送信する。図16の画面において、例えば、カテゴリトップが表示される。なお、カテゴリのみを表示し、カテゴリが選択されると、選択されたカテゴリに属するサブカテゴリを表示するようにしても良い。
【0084】
図16の画面を見たクライアント4のユーザが例えばカテゴリ又はサブカテゴリをクリックすると、検索部11は、クリックされたカテゴリ又はサブカテゴリを用いて、Q&Aデータベース13を検索する。そして、検索部11は、検索結果として、カテゴリ又はサブカテゴリに対応付けられたQ&Aを抽出して、抽出したQ&Aの一覧であるカテゴリQ&A一覧をクライアント4に送信する。これにより、クライアント4は、図3に示す画面41を表示することができる。
【0085】
これを見たクライアント4のユーザがQ&Aのタイトルをクリックすると、検索部11は、クリックされたQ&Aのタイトルを用いて、Q&Aデータベース13を検索する。そして、検索部11は、対応するQ&Aを抽出して、抽出したQ&Aをクライアント4に送信する。これにより、クライアント4は、図4に示す画面42を表示することができる。この時、検索部11により、実際に参照されたQ&Aの事例のQ&Aナンバーが、先にクリックされたカテゴリ及びサブカテゴリと共に、検索キーワードログとして採取され、検索キーワードログ集合14が更新される。
【0086】
なお、カテゴリマスタ17に従う階層構造のQ&Aデータベース13に基づいて、検索部11は、クライアント4からの要求に応じて、図17に示すように、1又は複数のキーワードを入力するための入力画面43を、クライアント4に送信するようにしても良い。この場合、入力画面43において、例えば、カテゴリトップが表示される。なお、カテゴリのみを表示し、カテゴリが選択されると、選択されたカテゴリに属するサブカテゴリを表示するようにしても良い。
【0087】
入力画面43を見たクライアント4のユーザが例えばカテゴリをクリックすると、クリックされたカテゴリが入力フィールドに入力される。ユーザが例えばサブカテゴリをクリックすると、クリックされたサブカテゴリが入力フィールドに入力される。ユーザが例えば入力フィールドに直接キーワードを入力するようにしても良い。例えば、サブカテゴリA1が「コピー」である場合には、「コピー」が入力フィールドに入力され、キーワードとして検索に用いられる。
【0088】
検索部11は、入力画面43に入力された1又は複数のキーワードを用いて、カテゴリ抽出部12により対応付けられたカテゴリ及びサブカテゴリとQ&Aナンバーとを含むQ&Aデータベース13を検索する。そして、検索部11は、検索結果として、カテゴリ又はサブカテゴリに対応付けられたQ&Aナンバーを抽出して、抽出したQ&Aナンバーをクライアント4に送信する。これにより、クライアント4は、図3に示す画面41を表示することができる。
【0089】
図18は、カテゴリ分類処理フローである。
【0090】
カテゴリ抽出部12の集計部121が、自サーバである事例検索サーバ1を介してクライアント4により参照されたQ&Aナンバーを抽出する(ステップS1)。これにより、図6(A)に示す抽出結果141が生成される。
【0091】
集計部121が、外部検索サイトである検索サーバ2を介してクライアント4により参照されたQ&Aナンバーを抽出する(ステップS2)。これにより、図6(B)に示す抽出結果142が生成される。なお、ステップS1とステップS2とは、いずれを先に実行しても良い。
【0092】
集計部121が、検索キーワードの正規化処理と、スペースによる分割処理とを実行する(ステップS3)。これにより、図7に示す正規化結果143が生成される。
【0093】
カテゴリ抽出部12の抽出部122が、正規化結果143に基づいて、Q&Aナンバーと単語の一覧を作成する(ステップS4)。これにより、図8に示す単語一覧データ144が生成される。
【0094】
抽出部122が、正規化結果143に基づいて、Q&Aナンバーと2単語ずつの一覧を作成する(ステップS5)。これにより、図9に示す2単語一覧データ145が生成される。なお、ステップS4とステップS5とは、いずれを先に実行しても良い。
【0095】
抽出部122が、単語一覧データ144に基づいて、Q&Aナンバーと単語をキーに集計する(ステップS6)。これにより、図10(A)に示す集計結果146が生成される。
【0096】
抽出部122が、2単語一覧データ145に基づいて、Q&Aナンバーと2単語をキーに集計する(ステップS7)。これにより、図10(B)に示す集計結果147が生成される。なお、ステップS6とステップS7とは、いずれを先に実行しても良い。
【0097】
抽出部122が、集計結果146に基づいて、Q&Aナンバー毎に、参照回数の上位から最大抽出分を、カテゴリ候補として抽出する(ステップS8)。これにより、図11(A)に示すカテゴリ候補一覧148が生成される。
【0098】
抽出部122が、集計結果147に基づいて、Q&Aナンバー毎に、参照回数の上位から最大抽出分を、仮サブカテゴリ候補として抽出する(ステップS9)。これにより、図11(B)に示すサブカテゴリ候補一覧149が生成される。なお、ステップS8とステップS9とは、いずれを先に実行しても良い。
【0099】
抽出部122が、カテゴリ候補一覧148に基づいて、カテゴリ候補をキーにQ&Aナンバーをマージする(ステップS10)。これにより、図11(C)に示すカテゴリ候補マージ表150が生成される。
【0100】
抽出部122が、サブカテゴリ候補一覧149に基づいて、カテゴリ候補のサブカテゴリ候補を抽出する(ステップS11)。これにより、図11(D)に示すサブカテゴリ候補マージ表151が生成される。
【0101】
カテゴリ抽出部12の作成部123が、カテゴリ候補マージ表150とサブカテゴリ候補マージ表151とに基づいて、カテゴリ、サブカテゴリ、これらに関連付けられるQ&AナンバーをQ&Aデータベース13に保存する(ステップS12)。換言すれば、図14に示すカテゴリマスタ17が生成され、Q&Aデータベース13のデータ構造に反映される。
【0102】
以上の説明から理解されるように、以下のような実施の態様が把握される。
【0103】
(付記1) 質問文と回答文との対を含む質問回答の事例を格納する事例格納部と、
前記質問回答の事例の検索についてのログを格納するログ格納部と、
1又は複数のキーワードを入力するための入力画面を端末装置に送信し、前記入力画面に入力された前記1又は複数のキーワードにより前記事例格納部を検索して質問回答の事例を抽出し、抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信し、前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記ログ格納部に格納する検索部と、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求め、前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出し、抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付けるカテゴリ抽出部とを含む
ことを特徴とするカテゴリ分類処理装置。
【0104】
(付記2) 前記カテゴリ抽出部が、前記質問回答の事例と共に記録されたn(nは正の整数)個のキーワードを含むキーワードの組について、前記質問回答の事例毎かつ前記キーワードの組毎に格納された回数を求め、前記質問回答の事例毎に前記回数が多い順に上位からm個までのキーワードの組に属するキーワードを前記質問回答の事例毎に仮サブカテゴリ候補として抽出し、抽出した前記カテゴリ候補をカテゴリとして用い抽出した前記仮サブカテゴリ候補をサブカテゴリとして用いて、前記カテゴリと前記サブカテゴリとを対応付け、前記サブカテゴリと前記質問回答の事例とを対応付ける
ことを特徴とする付記1に記載のカテゴリ分類処理装置。
【0105】
(付記3) 前記カテゴリ抽出部が、前記サブカテゴリ候補の中で前記カテゴリ候補と一致するキーワードを第1単語として抽出し、前記サブカテゴリ候補の中で前記第1単語以外の1又は複数のキーワードを第2単語として抽出し、前記第1単語と一致するカテゴリ候補を前記カテゴリとした場合において、前記1又は複数の第2単語の各々を前記カテゴリのサブカテゴリとする
ことを特徴とする付記2に記載のカテゴリ分類処理装置。
【0106】
(付記4) 前記カテゴリ分類処理装置が、更に、
前記nの値を記述した単語数設定ファイルを格納する単語数設定ファイル格納部を含む
ことを特徴とする付記2に記載のカテゴリ分類処理装置。
【0107】
(付記5) 前記カテゴリ抽出部が、前記質問回答の事例と共に前記nの値を超える数のキーワードが記録されている場合に、前記nの値を超える数のキーワードからn個のキーワードを取り出して組み合せることにより、前記キーワードの組を複数生成する
ことを特徴とする付記2に記載のカテゴリ分類処理装置。
【0108】
(付記6) 前記カテゴリ分類処理装置が、更に、
前記mの値を記述した抽出条件設定ファイルを格納する抽出条件設定ファイル格納部を含む
ことを特徴とする付記1に記載のカテゴリ分類処理装置。
【0109】
(付記7) 前記カテゴリ抽出部が、前記カテゴリ候補の抽出において、前記質問回答の事例毎に前記回数が多い順にキーワードに順位を付け、上位からm個のキーワードが属する順位を求め、前記求めた順位に属するキーワードの全部又は一部を前記カテゴリ候補として抽出する
ことを特徴とする付記1に記載のカテゴリ分類処理装置。
【0110】
(付記8) 前記カテゴリ抽出部が、前記カテゴリ候補の抽出において、前記質問回答の事例毎に、上位の順位に属するキーワードの数が前記mの値以上であるかを判定し、前記mの値以上である場合に、前記上位の順位に属するキーワードの全部又は一部を前記カテゴリ候補として抽出し、前記mの値よりも少ない場合に、前記上位の順位の次の順位に属するキーワードの数が前記mの値以上であるかを判定する
ことを特徴とする付記7に記載のカテゴリ分類処理装置。
【0111】
(付記9) 前記カテゴリ抽出部が、前記カテゴリ候補の抽出において、前記質問回答の事例と共に記録されたキーワードの数が前記mの値よりも少ない場合に、前記質問回答の事例と共に記録されたキーワードの全てを、前記カテゴリ候補として抽出する
ことを特徴とする付記7に記載のカテゴリ分類処理装置。
【0112】
(付記10) 前記検索部が、前記入力画面に入力された前記1又は複数のキーワードを用いて、前記カテゴリ抽出部により対応付けられた前記カテゴリと前記質問回答の事例とを検索して、前記カテゴリに対応付けられた前記質問回答の事例を抽出して、抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信する
ことを特徴とする付記1に記載のカテゴリ分類処理装置。
【0113】
(付記11) 1又は複数のキーワードを入力するための入力画面を端末装置に送信し、
前記入力画面に入力された前記1又は複数のキーワードにより、質問文と回答文との対を含む質問回答の事例を格納する事例格納部を検索して質問回答の事例を抽出し、
抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信し、
前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記質問回答の事例の検索についてのログを格納するログ格納部に格納し、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求め、
前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出し、
抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付ける
ことを特徴とするカテゴリ分類処理方法。
【0114】
(付記12) 前記質問回答の事例と共に記録されたn(nは正の整数)個のキーワードを含むキーワードの組について、前記質問回答の事例毎かつ前記キーワードの組毎に格納された回数を求め、
前記質問回答の事例毎に前記回数が多い順に上位からm個までのキーワードの組に属するキーワードを前記質問回答の事例毎に仮サブカテゴリ候補として抽出し、
抽出した前記カテゴリ候補をカテゴリとして用い抽出した前記仮サブカテゴリ候補をサブカテゴリとして用いて、前記カテゴリと前記サブカテゴリとを対応付け、前記サブカテゴリと前記質問回答の事例とを対応付ける
ことを特徴とする付記11に記載のカテゴリ分類処理方法。
【0115】
(付記13) カテゴリ分類処理装置を実現するカテゴリ分類処理プログラムを記録する記録媒体であって、
前記プログラムが、コンピュータに、
1又は複数のキーワードを入力するための入力画面を端末装置に送信するステップと、
前記入力画面に入力された前記1又は複数のキーワードにより、質問文と回答文との対を含む質問回答の事例を格納する事例格納部を検索して質問回答の事例を抽出するステップと、
抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信するステップと、
前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記質問回答の事例の検索についてのログを格納するログ格納部に格納するステップと、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求めるステップと、
前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出するステップと、
抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付けるステップとを実行させる
ことを特徴とする記録媒体。
【0116】
(付記14) 前記プログラムが、コンピュータに、更に、
前記質問回答の事例と共に記録されたn(nは正の整数)個のキーワードを含むキーワードの組について、前記質問回答の事例毎かつ前記キーワードの組毎に格納された回数を求めるステップと、
前記質問回答の事例毎に前記回数が多い順に上位からm個までのキーワードの組に属するキーワードを前記質問回答の事例毎に仮サブカテゴリ候補として抽出するステップと、
抽出した前記カテゴリ候補をカテゴリとして用い抽出した前記仮サブカテゴリ候補をサブカテゴリとして用いて、前記カテゴリと前記サブカテゴリとを対応付け、前記サブカテゴリと前記質問回答の事例とを対応付けるステップとを実行させる
ことを特徴とする付記13に記載の記録媒体。
【0117】
(付記15) カテゴリ分類処理装置と、
前記カテゴリ分類処理装置にネットワークを介して接続された複数の端末装置とを含むカテゴリ分類処理システムであって、
前記カテゴリ分類処理装置は、
質問文と回答文との対を含む質問回答の事例を格納する事例格納部と、
前記質問回答の事例の検索についてのログを格納するログ格納部と、
1又は複数のキーワードを入力するための入力画面を端末装置に送信し、前記入力画面に入力された前記1又は複数のキーワードにより前記事例格納部を検索して質問回答の事例を抽出し、抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信し、前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記ログ格納部に格納する検索部と、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求め、前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出し、抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付けるカテゴリ抽出部とを含み、
前記端末装置は、前記カテゴリ分類処理装置から前記入力画面を受信して表示し、前記入力画面に入力された前記1又は複数のキーワードを前記カテゴリ分類処理装置に送信し、前記カテゴリ分類処理装置から前記質問回答の事例を表す前記識別情報を受信して表示し、表示した前記識別情報から選択された識別情報を前記カテゴリ分類処理装置に送信し、前記カテゴリ分類処理装置から選択された前記識別情報により表される質問回答の事例を受信して表示する
ことを特徴とするカテゴリ分類処理システム。
【0118】
(付記16) 前記カテゴリ抽出部が、前記質問回答の事例と共に記録されたn(nは正の整数)個のキーワードを含むキーワードの組について、前記質問回答の事例毎かつ前記キーワードの組毎に格納された回数を求め、前記質問回答の事例毎に前記回数が多い順に上位からm個までのキーワードの組に属するキーワードを前記質問回答の事例毎に仮サブカテゴリ候補として抽出し、抽出した前記カテゴリ候補をカテゴリとして用い抽出した前記仮サブカテゴリ候補をサブカテゴリとして用いて、前記カテゴリと前記サブカテゴリとを対応付け、前記サブカテゴリと前記質問回答の事例とを対応付ける
ことを特徴とする付記15に記載のカテゴリ分類処理システム。
【符号の説明】
【0119】
1 事例検索サーバ
2 検索サーバ
3 ネットワーク
4 クライアント
11 検索部
12 カテゴリ抽出部
13 Q&Aデータベース
14 検索キーワードログ集合
15 単語数設定ファイル
16 抽出条件設定ファイル
17 カテゴリマスタ
121 集計部
122 抽出部
123 作成部

【特許請求の範囲】
【請求項1】
質問文と回答文との対を含む質問回答の事例を格納する事例格納部と、
前記質問回答の事例の検索についてのログを格納するログ格納部と、
1又は複数のキーワードを入力するための入力画面を端末装置に送信し、前記入力画面に入力された前記1又は複数のキーワードにより前記事例格納部を検索して質問回答の事例を抽出し、抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信し、前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記ログ格納部に格納する検索部と、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求め、前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出し、抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付けるカテゴリ抽出部とを含む
ことを特徴とするカテゴリ分類処理装置。
【請求項2】
前記カテゴリ抽出部が、前記質問回答の事例と共に記録されたn(nは正の整数)個のキーワードを含むキーワードの組について、前記質問回答の事例毎かつ前記キーワードの組毎に格納された回数を求め、前記質問回答の事例毎に前記回数が多い順に上位からm個までのキーワードの組に属するキーワードを前記質問回答の事例毎に仮サブカテゴリ候補として抽出し、抽出した前記カテゴリ候補をカテゴリとして用い抽出した前記仮サブカテゴリ候補をサブカテゴリとして用いて、前記カテゴリと前記サブカテゴリとを対応付け、前記サブカテゴリと前記質問回答の事例とを対応付ける
ことを特徴とする請求項1に記載のカテゴリ分類処理装置。
【請求項3】
前記カテゴリ分類処理装置が、更に、
前記mの値を記述した抽出条件設定ファイルを格納する抽出条件設定ファイル格納部を含む
ことを特徴とする請求項1に記載のカテゴリ分類処理装置。
【請求項4】
前記カテゴリ抽出部が、前記カテゴリ候補の抽出において、前記質問回答の事例毎に前記回数が多い順にキーワードに順位を付け、上位からm個のキーワードが属する順位を求め、前記求めた順位に属するキーワードの全部又は一部を前記カテゴリ候補として抽出する
ことを特徴とする請求項1に記載のカテゴリ分類処理装置。
【請求項5】
前記検索部が、前記入力画面に入力された前記1又は複数のキーワードを用いて、前記カテゴリ抽出部により対応付けられた前記カテゴリと前記質問回答の事例とを検索して、前記カテゴリに対応付けられた前記質問回答の事例を抽出して、抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信する
ことを特徴とする請求項1に記載のカテゴリ分類処理装置。
【請求項6】
1又は複数のキーワードを入力するための入力画面を端末装置に送信し、
前記入力画面に入力された前記1又は複数のキーワードにより、質問文と回答文との対を含む質問回答の事例を格納する事例格納部を検索して質問回答の事例を抽出し、
抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信し、
前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記質問回答の事例の検索についてのログを格納するログ格納部に格納し、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求め、
前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出し、
抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付ける
ことを特徴とするカテゴリ分類処理方法。
【請求項7】
カテゴリ分類処理装置を実現するカテゴリ分類処理プログラムを記録する記録媒体であって、
前記プログラムが、コンピュータに、
1又は複数のキーワードを入力するための入力画面を端末装置に送信するステップと、
前記入力画面に入力された前記1又は複数のキーワードにより、質問文と回答文との対を含む質問回答の事例を格納する事例格納部を検索して質問回答の事例を抽出するステップと、
抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信するステップと、
前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記質問回答の事例の検索についてのログを格納するログ格納部に格納するステップと、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求めるステップと、
前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出するステップと、
抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付けるステップとを実行させる
ことを特徴とする記録媒体。
【請求項8】
カテゴリ分類処理装置と、
前記カテゴリ分類処理装置にネットワークを介して接続された複数の端末装置とを含むカテゴリ分類処理システムであって、
前記カテゴリ分類処理装置は、
質問文と回答文との対を含む質問回答の事例を格納する事例格納部と、
前記質問回答の事例の検索についてのログを格納するログ格納部と、
1又は複数のキーワードを入力するための入力画面を端末装置に送信し、前記入力画面に入力された前記1又は複数のキーワードにより前記事例格納部を検索して質問回答の事例を抽出し、抽出した前記質問回答の事例を表す識別情報を前記端末装置に送信し、前記端末装置により実際に前記識別情報を用いて参照された質問回答の事例の前記識別情報を前記入力画面に入力された前記1又は複数のキーワードと共に検索キーワードログとして、前記ログ格納部に格納する検索部と、
前記検索キーワードログにおいて、前記質問回答の事例と共に記録された1個のキーワードについて、前記質問回答の事例毎かつ前記1個のキーワード毎に格納された回数を求め、前記質問回答の事例毎に前記回数が多い順に上位からm(mは正の整数)個までのキーワードを前記質問回答の事例毎にカテゴリ候補として抽出し、抽出した前記カテゴリ候補をカテゴリとして用いて前記カテゴリと前記質問回答の事例とを対応付けるカテゴリ抽出部とを含み、
前記端末装置は、前記カテゴリ分類処理装置から前記入力画面を受信して表示し、前記入力画面に入力された前記1又は複数のキーワードを前記カテゴリ分類処理装置に送信し、前記カテゴリ分類処理装置から前記質問回答の事例を表す前記識別情報を受信して表示し、表示した前記識別情報から選択された識別情報を前記カテゴリ分類処理装置に送信し、前記カテゴリ分類処理装置から選択された前記識別情報により表される質問回答の事例を受信して表示する
ことを特徴とするカテゴリ分類処理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate