説明

専門家検索装置、および専門家検索方法

【課題】Web文書を対象として、精度高く専門家を検索できなかった。
【解決手段】1以上のWebサーバ装置から、トピックに関連する1以上の文書を取得する文書検索部と、1以上の文書から1以上の専門家候補を抽出する専門家候補抽出部と、1以上の文書からトピックの意見に関する文である1以上の意見文を抽出する意見文抽出部と、1以上の意見文から意見情報を、1以上の各専門家候補ごとに取得する意見情報取得部と、1以上の各文書と専門家候補との関連度を、1以上の各専門家候補ごとに取得する関連度取得部と、1以上の各専門家候補ごとに、意見情報および関連度を用いて、トピックについての専門性スコアを算出するスコア算出部と、スコアを用いて、1以上の専門家を取得する専門家選択部と、専門家選択部が取得した1以上の専門家を出力する専門家出力部とを具備する専門家検索装置により、Web文書を対象として、精度高く専門家を検索できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、Web文書からトピックについての1以上の専門家を抽出する専門家検索システム等に関するものである。
【背景技術】
【0002】
従来、組織内の文書を対象に専門家を検索する技術があった(例えば、非特許文献1、非特許文献2参照)。また、研究論文を対象に専門家を検索する技術があった(例えば、非特許文献3参照)。これらの従来技術に共通するのは、専門家候補の専門性の証拠として、専門家候補が出現する文書、または専門家候補が著者となっている文書について、トピックとの関連度を用いる点である。組織内文書や研究論文は、文書の品質が一定以上であることが仮定でき、専門家候補が関わる文書のトピックとの関連度を専門性の証拠と扱っても問題はない。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Balog K, Azzopardi L, Rijke M de. Formal Models for Expert Finding in Enterprise Corpora. In: Proceedings of SIGIR’06.; 2006:43-50.
【非特許文献2】Macdonald C, Ounis I. Voting for Candidates : Adapting Data Fusion Techniques for an Expert Search Task. In: Proceedings of CIKM’06.; 2006:387-396.
【非特許文献3】Mimno D, Mccallum A. Expertise Modeling for Matching Papers with Reviewers. In: Proceedings of KDD’07.; 2007:500-509.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、専門家を検索する対象の文書を組織内の文書を対象にした場合には、一般のユーザは利用できない。また、トピックの中には、研究論文にならないトピックも存在する。また、研究論文は書かないが、専門家と呼ぶに相応しい人も居る。そこで、Web上に存在する文書であるWeb文書を対象として、専門家を抽出することは有効である。
【0005】
しかし、Web文書を対象とした場合に、スパムなどのノイズとなる文書だけでなく、掲示板の書き込みやブログといった必ずしも品質が高くない文書も多く含まれており、トピックとの関連度だけでは専門性について十分な証拠とはならず、専門性検索の精度低下を招く。つまり、従来の専門家検索システムにおいては、Web文書を対象として、精度高く専門家を検索できなかった。
【0006】
また、従来技術では、専門性候補が所与のものとして扱われている。特定の組織を対象としたり、特定の研究分野を対象とする場合には専門家候補を特定でき、そのような仮定は妥当である。しかし、Web文書を対象に不特定のトピックについて専門家検索を実施しようとしたとき、事前に専門家候補を得るのは現実的ではない。
【課題を解決するための手段】
【0007】
本第一の発明の専門家検索装置は、トピックを受け付ける受付部と、1以上のWebサーバ装置から、トピックに関連する1以上の文書を取得する文書検索部と、1以上の文書から、1以上の専門家候補を抽出する専門家候補抽出部と、1以上の文書から、トピックの意見に関する文である1以上の意見文を抽出する意見文抽出部と、1以上の意見文から、肯定的な意見文の数である肯定意見文数、および否定的な意見文の数である否定意見文数を含む意見情報を、1以上の各専門家候補ごとに取得する意見情報取得部と、1以上の各専門家候補ごとに、意見情報を用いて、トピックについての専門性のスコアを算出するスコア算出部と、スコアを用いて、1以上の専門家候補から、1以上の専門家を取得する専門家選択部と、専門家選択部が取得した1以上の専門家を出力する専門家出力部とを具備する専門家検索装置である。
【0008】
かかる構成により、Web文書を対象として、精度高く専門家を検索できる。
【0009】
また、本第二の発明の専門家検索装置は、第一の発明に対して、専門家候補抽出部が抽出した1以上の各専門家候補と、文書検索部が取得した1以上の文書のうち、各専門家候補が出現する文書に対して、専門家候補と文書との関連度を、1以上の各専門家候補ごとに取得する関連度取得部をさらに具備し、スコア算出部は、1以上の各専門家候補ごとに、意見情報および関連度を用いて、トピックについての専門性のスコアを算出する専門家検索装置である。
【0010】
かかる構成により、Web文書を対象として、精度高く専門家を検索できる。
【0011】
また、本第三の発明の専門家検索装置は、第一または第二の発明に対して、専門家出力部は、スコアの高い順に、1以上の専門家をソートして出力する専門家検索装置である。
【0012】
かかる構成により、Web文書を対象として、精度高く専門家を検索し、適切に専門家を提示できる。
【0013】
また、本第四の発明の専門家検索装置は、第一から第三いずれかの発明に対して、専門家出力部は、1以上の専門家の出力に代えて、専門家選択部が取得した1以上の各専門家のスコアを算出する元になった1以上の文書または1以上の意見文を出力する専門家検索装置である。
【0014】
かかる構成により、Web文書を対象として、精度高く専門家を検索し、当該専門家が記載した文書を提示できる。
【0015】
また、本第五の発明の専門家検索装置は、第一から第三いずれかの発明に対して、1以上の専門家のうちの一部または全部の専門家に対応する1以上の文書、または1以上の文書にアクセスするための情報である1以上のアクセス情報を出力する文書出力部をさらに具備する専門家検索装置である。
【0016】
かかる構成により、Web文書を対象として、精度高く専門家を検索し、当該専門家が記載した文書を提示できる。
【発明の効果】
【0017】
本発明による専門家検索装置によれば、Web文書を対象として、精度高く専門家を検索できる。
【図面の簡単な説明】
【0018】
【図1】実施の形態1における専門家検索システム1の概念図
【図2】同専門家検索システム1のブロック図
【図3】同専門家検索装置13の動作について説明するフローチャート
【図4】同専門家候補抽出処理について説明するフローチャート
【図5】同意見情報取得処理について説明するフローチャート
【図6】同第一関連度取得処理について説明するフローチャート
【図7】同第二関連度取得処理について説明するフローチャート
【図8】同スコア算出処理について説明するフローチャート
【図9】同Webページの例を示す図
【図10】同意見情報の例を示す図
【図11】同コンピュータシステムの概観図
【図12】同コンピュータシステムのブロック図
【発明を実施するための形態】
【0019】
以下、専門家検索システム等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0020】
(実施の形態1)
本実施の形態において、Web文書からトピックについての1以上の専門家を抽出し、出力する専門家検索システムについて説明する。また、本実施の形態において、スコアの順に専門家をソートして出力する専門家検索システム1について説明する。また、本実施の形態において、専門家の書いた信頼性の高い文書を提示する専門家検索システムについて説明する。
【0021】
図1は、本実施の形態における専門家検索システム1の概念図である。専門家検索システム1は、1以上の端末装置11、1以上のWebサーバ装置12、および専門家検索装置13を具備する。端末装置11は、ユーザが専門家の検索のために利用する端末である。Webサーバ装置12は、いわゆるWeb上のWebサーバ装置であり、1以上の文書を格納している。専門家検索装置13は、専門家を検索できる装置である。端末装置11、Webサーバ装置12、および専門家検索装置13は、インターネット4により、通信可能である。
【0022】
図2は、本実施の形態における専門家検索システム1のブロック図である。
【0023】
専門家検索システム1を構成する端末装置11は、端末受付部110、端末送信部111、端末受信部112、および端末出力部113を具備する。
【0024】
Webサーバ装置12は、文書格納部121、および文書送信部122を具備する。
【0025】
専門家検索装置13は、受付部130、文書検索部131、専門家候補抽出部132、意見文抽出部133、意見情報取得部134、関連度取得部135、スコア算出部136、専門家選択部137、専門家出力部138、および文書出力部139を具備する。
【0026】
端末装置11を構成する端末受付部110は、ユーザからトピックを受け付ける。トピックとは、用語と同意義であると考えても良い。トピックは、単語とは限らず、句や1以上の単語の集合などでも良い。また、トピックとは、検索したい専門家の専門領域を示す用語等である。トピックの入力手段は、キーボードやマウスやメニュー画面によるもの等、何でも良い。端末受付部110は、キーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0027】
端末送信部111は、端末受付部110が受け付けたトピックを、専門家検索装置13に送信する。
【0028】
端末受信部112は、1以上の専門家、または1以上の文書、または1以上の意見文などを専門家検索装置13から受信する。
【0029】
端末出力部113は、端末受信部112が受信した1以上の専門家、または1以上の文書、または1以上の意見文などを出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。端末出力部113は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。端末出力部113は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0030】
Webサーバ装置12を構成する文書格納部121は、1以上の文書を格納している。文書とは、Web上の文書である。Web上の文書をWeb文書ということとする。また、Web文書は、研究論文なども含むが、いわゆるブログや、ミニブログや、SNSに投函した文書などのCGMの文書も含む。文書は、一ファイルに分かれている必要はない。つまり、文書の区切りの識別情報は問わない。
【0031】
文書送信部122は、文書格納部121の文書を専門家検索装置13に送信する。通常、文書送信部122は、専門家検索装置13の要求に応じて、文書格納部121の文書を専門家検索装置13に送信する。
【0032】
専門家検索装置13を構成する受付部130は、トピックを受け付ける。通常、受付部130は、端末装置11からトピックを受信する。ただし、専門家検索装置13がスタンドアロンで動作する場合は、受付部130は、キーボードやマウスなどの入力デバイスからトピックを受け付ける。つまり、ここでの受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。
【0033】
文書検索部131は、1以上のWebサーバ装置12から、トピックに関連する1以上の文書を取得する。通常、文書検索部131は、Webサーバ装置12から文書を受信する。ここで、文書検索部131は、トピックを含む文書をすべて取得しても良いし、所定のタグ(例えば、タイトルタグ)に対応する箇所にトピックを含む文書を取得しても良いし、トピックの出現回数が閾値以上の文書を取得するなどしても良い。その他、文書検索部131がトピックに関連する1以上の文書を取得するアルゴリズムは種々あり得る。なお、文書検索部131は、トピックをキーとして、いわゆるWeb検索する機能を有するものでも良い。かかる場合、文書検索部131は、いわゆるWeb検索エンジンである。
【0034】
専門家候補抽出部132は、1以上の文書から、1以上の専門家候補を抽出する。専門家候補とは、人名でも組織名でも良い。また、専門家候補抽出部132は、例えば、固有表現抽出(NE)の技術を用いて固有名称(人名・組織名)する(例えば、「http://www.sophia-it.com/content/%E5%9B%BA%E6%9C%89%E8%A1%A8%E7%8F%BE%E6%8A%BD%E5%87%BA」「http://www.ntt.co.jp/journal/0806/files/jn200806020.pdf」参照)。さらに具体的には、専門家候補抽出部132は、1以上の各文書に対して形態素解析を行い、各文書を単語に分割した後に、機械学習(系列タギング)の手法を使って抽出する。また、専門家候補抽出部132は、例えば、特定のタグを手がかりに人名を取得しても良い。また、専門家候補抽出部132は、例えば、手がかり句「氏」「氏名」などを用いて、例えば、「山田○夫氏」から人名「山田○夫」を抽出したりしても良い。なお、文章から人名や組織名を取得する技術は公知技術である。
【0035】
意見文抽出部133は、1以上の文書から、トピックの意見に関する文である1以上の意見文を抽出する。意見文抽出部133は、例えば、トピックと、主張を特定する用や句「である。」「と考えられる。」などを含む文を意見文として抽出する。また、意見文抽出部133は、例えば、「Tetsuji Nakagawa, Kentaro Inui and Sadao Kurohashi:Dependency Tree-based Sentiment Classification using CRFs with Hidden Variables, In Proceedings of Human Language Technologies: The 11th Annual Conference of the North American Chapter of the Association for Computational Linguistics (HLT-NAACL 2010), June 2010.」に記載されている技術を用いて、意見文を取得する。本論文に記載されている技術を用いれば、意見文抽出部133は、処理対象の文に対して構文解析を行った後、その結果得られる文に含まれる語の品詞や語の係り受け関係などを手がかりに、系列タギングに基づき意見を述べている箇所(句など)を抽出する。さらに、意見文抽出部133は、意見として抽出された句などについて、係り受け関係に加えて、極性に関する辞書や極W性を反転させる語の辞書を利用して、条件付き確率場の手法により意見文の極性を出力する。さらに、意見文抽出部133は、メリット、出来事、当為などの意見タイプを、構文解析の結果から素性を手がかりとした分類器により出力する。その他、意見文の抽出方法は問わない。
【0036】
意見情報取得部134は、1以上の意見文から、1以上の各専門家候補ごとに意見情報を取得する。意見情報は、意見文抽出部133が取得した意見文に関する情報である。意見情報は、通常、1以上の意見文から取得できる数値情報である。また、意見情報は、通常、1以上の意見文に関する統計データである。意見情報は、通常、肯定的な意見文の数である肯定意見文数、および否定的な意見文の数である否定意見文数を含む。意見情報取得部134は、例えば、「良い」「すばらしい」「悪い」「評価できない」などの評価語を格納している評価語DBを保持しており、かかる評価語を用いて、意見文が肯定的な意見文か、否定的な意見文かを判断する。そして、かかる判断結果を用いて、意見情報を取得する。なお、意見情報には、肯定意見文数、否定意見文数の他、肯定・否定意見の数の合計、意見の偏り(総意見数に占める肯定意見の割合)などを含んでも良い。また、意見情報に、意見文または意見文が含まれる文書とトピックとの関連度や文書が格納されているサイトのドメイン種別(co.jp,go.jp,ac.jpなど)などを含んでも良い。
【0037】
関連度取得部135は、専門家候補と文書との関連度を、1以上の専門家候補ごとに取得する。関連度取得部135は、例えば、専門家候補抽出部132が抽出した1以上の各専門家候補と、文書検索部131が取得した1以上の文書のうち、各専門家候補が出現する文書に対して、専門家候補と文書との関連度を、1以上の各専門家候補ごとに取得する。
【0038】
さらに具体的には、関連度取得部135は、文書検索部131が取得した1以上の各文書に対して、専門家候補抽出部132が抽出した専門家候補の数(N)を取得する。そして、関連度取得部135は、文書に出現する専門家候補に対して、当該文書との関連度を「1/N」と算出する。
【0039】
なお、関連度取得部135は、文書とトピックとの関連度を取得しても良い。そして、関連度取得部135は、専門家候補ごとに、当該専門家候補が出現する文書とトピックとの関連度を取得しても良い。つまり、例えば、関連度取得部135は、1以上の各専門家候補に対応する1以上の文書を決定し、1以上の各文書とトピックとの関連度を、1以上の各専門家候補ごとに取得しても良い。かかる場合、例えば、関連度取得部135は、1以上の各専門家候補に対応する1以上の文書を決定する。そして、関連度取得部135は、専門家候補ごとに、当該専門家候補に対応する1以上の各文書とトピックとの関連度を取得する。ここで、関連度取得部135は、例えば、文書中のトピックの出現頻度を、当愛文書とトピックとの関連度として取得する。また、関連度取得部135は、ベクトル空間モデル用いたコサイン類似度や、Okapi BM25という方式を用いて、文書とトピックとの関連度を取得しても良い(例えば、「http://gihyo.jp/dev/serial/01/search-engine/0008」、「http://wpedia.goo.ne.jp/enwiki/Probabilistic_relevance_model_(BM25)」参照)。つまり、文書とトピックとの関連度を取得する技術は公知技術で実現され得る。
【0040】
また、関連度取得部135は、専門家候補と文書との関連度(第一の関連度)、および文書とトピックとの関連度(第二の関連度)の両方を取得しても良い。
【0041】
スコア算出部136は、1以上の各専門家候補ごとに、意見情報および関連度を用いて、トピックについての専門性のスコアを算出する。スコア算出部136は、例えば、肯定意見文数が大きいほど、また、関連度が大きいほど、大きなスコアを算出する。スコア算出部136は、意見情報に含まれる情報や、関連度をパラメータとする算出式を保持しており、かかる算出式を用いて、専門家候補ごとに、トピックについての専門性のスコアを算出する。なお、算出式の具体例は後述する。
【0042】
専門家選択部137は、スコア算出部136が算出したスコアを用いて、1以上の専門家候補から、1以上の専門家を取得する。ここで、専門家とは、人名または組織名などである。専門家選択部137は、例えば、スコアが閾値以上の専門家候補を専門家として取得する。また、専門家選択部137は、例えば、スコアの上位N位までの専門家候補を専門家として取得しても良い。さらに、専門家選択部137は、例えば、スコアの順に、専門家または専門家候補をソートしても良い。
【0043】
専門家出力部138は、専門家選択部137が取得した1以上の専門家を出力する。また、専門家出力部138は、スコアの高い順に、1以上の専門家をソートして出力することは好適である。また、専門家出力部138は、1以上の専門家の出力に代えて、専門家選択部137が取得した1以上の各専門家のスコアを算出する元になった1以上の文書または1以上の意見文を出力しても良い。ここで、出力とは、通常、端末装置11への送信であるが、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどでも良い。
【0044】
文書出力部139は、1以上の専門家のうちの一部または全部の専門家に対応する1以上の文書、または1以上の文書にアクセスするための情報である1以上のアクセス情報を出力する。なお、専門家出力部138が文書やアクセス情報などを出力する場合、文書出力部139は不要である。また、文書出力部139は、専門家のスコアの順に、専門家の書いた文書やアクセス情報や意見文などを順位付けして出力しても良い。ここで、出力とは、通常、端末装置11への送信であるが、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどでも良い。
【0045】
端末送信部111、文書送信部122、専門家出力部138、および文書出力部139は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
【0046】
端末受信部112、および受付部130は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
【0047】
文書検索部131、専門家候補抽出部132、意見文抽出部133、意見情報取得部134、関連度取得部135、スコア算出部136、および専門家選択部137は、通常、MPUやメモリ等から実現され得る。文書検索部131等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0048】
次に、専門家検索システム1の動作について説明する。まず、端末装置11の動作について説明する。端末装置11の端末受付部110は、ユーザからトピックを受け付ける。そして、端末送信部111は、端末受付部110が受け付けたトピックを、専門家検索装置13に送信する。次に、トピックの送信に対応して、端末受信部112は、トピックの専門家、または文書、または意見文などを専門家検索装置13から受信する。次に、端末出力部113は、端末受信部112が受信した専門家、または文書、または意見文などを出力する。
【0049】
次に、Webサーバ装置12の動作について説明する。Webサーバ装置12の文書送信部122は、通常、専門家検索装置13の要求に応じて、文書格納部121の文書を専門家検索装置13に送信する。
【0050】
次に、専門家検索装置13の動作について、図3のフローチャートを用いて説明する。
【0051】
(ステップS301)受付部130は、トピックを受け付けたか否かを判断する。トピックを受け付ければステップS302に行き、トピックを受け付けなければステップS301に戻る。
【0052】
(ステップS302)文書検索部131は、1以上のWebサーバ装置12から、ステップS301で受け付けられたトピックに関連する1以上の文書を取得する。
【0053】
(ステップS303)専門家候補抽出部132は、ステップS302で取得された1以上の文書から、ステップS301で受け付けられたトピックに関する1以上の専門家候補を抽出する。かかる処理は、専門家候補抽出処理である。専門家候補抽出処理については、図4のフローチャートを用いて説明する。
【0054】
(ステップS304)意見文抽出部133は、ステップS302で取得された1以上の文書から、ステップS301で受け付けられたトピックの意見文を、1以上、抽出する。そして、意見情報取得部134は、取得された1以上の意見文を用いて、意見情報を取得する。かかる処理は、意見情報取得処理である。意見情報取得処理については、図5のフローチャートを用いて説明する。
【0055】
(ステップS305)関連度取得部135は、ステップS303で抽出された1以上の各専門家候補に対応する1以上の文書を決定し、1以上の各文書とトピックとの関連度を、1以上の専門家候補ごとに取得する。かかる処理は、関連度取得処理(第一関連度取得処理と言っても良い)である。また、第一関連度取得処理で取得する関連度を第一関連度と言っても良い。かかる第一関連度取得処理については、図6のフローチャートを用いて説明する。また、関連度取得部135は、専門家候補と文書との関連度を、1以上の専門家候補ごとに取得する。かかる処理も、関連度取得処理(第二関連度取得処理と言っても良い)と言える。また、第二関連度取得処理で取得する関連度を第二関連度と言っても良い。かかる第二関連度取得処理については、図7のフローチャートを用いて説明する。
【0056】
(ステップS306)スコア算出部136は、ステップS304で取得された意見情報およびステップS305で取得された関連度(第一関連度または/および第二関連度)を用いて、1以上の専門家候補ごとに、トピックについての専門性のスコアを算出する。かかる処理は、スコア算出処理である。スコア算出処理については、図8のフローチャートを用いて説明する。
【0057】
(ステップS307)専門家選択部137は、ステップS306で算出されたスコアを用いて、1以上の専門家候補から、1以上の専門家を取得する。なお、通常、専門家選択部137は、スコアが十分に高い(スコアが閾値以上の)専門家候補を、専門家として選択する。
【0058】
(ステップS308)専門家出力部138は、ステップS307で取得された1以上の専門家を出力する。
【0059】
(ステップS309)文書出力部139は、1以上の専門家のうちの一部または全部の専門家に対応する1以上の文書、または1以上の文書にアクセスするための情報である1以上のアクセス情報を出力し、ステップS301に戻る。
【0060】
なお、図3のフローチャートにおいて、ステップS309の処理は行わなくても良い。
【0061】
また、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0062】
次に、ステップS302の専門家候補抽出処理について、図4のフローチャートを用いて説明する。
【0063】
(ステップS401)専門家候補抽出部132は、カウンタiに1を代入する。
【0064】
(ステップS402)専門家候補抽出部132は、i番目の文書が存在するか否かを判断する。i番目の文書が存すればステップS403に行き、存在しなければ上位処理(ステップS304)にリターンする。
【0065】
(ステップS403)専門家候補抽出部132は、i番目の文書に対して、形態素解析を行う。
【0066】
(ステップS404)専門家候補抽出部132は、例えば、ステップS403における形態素解析の結果を用いて、例えば、機械学習(系列タギング)の手法を使って、1以上の専門家候補を取得する。
【0067】
(ステップS405)専門家候補抽出部132は、カウンタjに1を代入する。
【0068】
(ステップS406)専門家候補抽出部132は、j番目の専門家候補が存在するか否かを判断する。j番目の専門家候補が存在すればステップS407に行き、存在しなければステップS411に行く。
【0069】
(ステップS407)専門家候補抽出部132は、j番目の専門家候補が、所定のバッファに存在するか否かを判断する。所定のバッファに存在すればステップS408に行き、存在しなければステップS410に行く。
【0070】
(ステップS408)専門家候補抽出部132は、j番目の専門家候補とi番目の文書の文書識別子とを対応付けて、所定のバッファに、少なくとも一時蓄積する。
【0071】
(ステップS409)専門家候補抽出部132は、カウンタjを1、インクリメントし、ステップS406に戻る。
【0072】
(ステップS410)専門家候補抽出部132は、i番目の文書の文書識別子を、所定のバッファに既に存在するj番目の専門家候補に対応付けて少なくとも一時蓄積する。
【0073】
(ステップS411)専門家候補抽出部132は、カウンタiを1、インクリメントし、ステップS402に戻る。
【0074】
なお、図4のフローチャートにおいて、専門家候補抽出部132が各文書から専門家候補を抽出するアルゴリズムは問わない。
【0075】
次に、ステップS303の意見情報取得処理については、図5のフローチャートを用いて説明する。
【0076】
(ステップS501)意見文抽出部133は、カウンタiに1を代入する。
【0077】
(ステップS502)意見文抽出部133は、ステップS302で取得された文書のうち、i番目の文書が存在するか否かを判断する。i番目の文書が存在すればステップS503に行き、i番目の文書が存在しなければステップS514に行く。
【0078】
(ステップS503)意見文抽出部133は、カウンタjに1を代入する。
【0079】
(ステップS504)意見文抽出部133は、i番目の文書のうち、j番目の文が存在するか否かを判断する。j番目の文が存在すればステップS505に行き、j番目の文が存在しなければステップS513に行く。なお、ここでの文は、文の一部でも良い。つまり、文は、意見文か否かを判断する対象の単位で良い。
【0080】
(ステップS505)意見文抽出部133は、i番目の文書のj番目の文を取得する。
【0081】
(ステップS506)意見文抽出部133は、ステップS505で取得した文が意見文か否かを判断し、判断結果をバッファに代入する。なお、意見文抽出部133は、文に対して構文解析を行い、その結果を用いて、文に含まれる語の品詞や語の係り受け関係などを手がかりに、系列タギングに基づき意見を述べている箇所を抽出し、意見文か否かを判断する。
【0082】
(ステップS507)意見文抽出部133は、バッファの値が意見文であることを示す情報であればステップS508に行き、意見文でないことを示す情報であればステップS512に行く。
【0083】
(ステップS508)意見情報取得部134は、i番目の文書のj番目の文が肯定的な文である「肯定的」、否定的な文であるか「否定的」、どちらでもないか「中立」等を判断する。意見情報取得部134は、j番目の文の極性を算出しても良い。意見情報取得部134は、例えば、語の係り受け関係や、極性に関する辞書や極性を反転させる語の辞書を利用して、条件付き確率場の手法により文の極性を算出する。なお、意見情報取得部134は、極性に関する辞書や極性を反転させる語の辞書を保持している、とする。また、極性とは、文の肯定の度合い、または/および否定の度合いを示す情報である。
【0084】
(ステップS509)意見情報取得部134は、ステップS508における判断結果をフラグ(姿勢フラグという。)に代入し、当該姿勢フラグを意見文に付与する。
【0085】
(ステップS510)意見情報取得部134は、i番目の文書のj番目の文と、トピックとの関連度を取得し、意見文に付与する。
【0086】
(ステップS511)意見情報取得部134は、i番目の文書のドメイン種別を取得し、意見文に付与する。なお、ドメイン種別は、文書検索部131が文書を取得した際に、文書検索部131が取得する。
【0087】
(ステップS512)意見文抽出部133は、カウンタjを1、インクリメントし、ステップS504に戻る。
【0088】
(ステップS513)意見文抽出部133は、カウンタiを1、インクリメントし、ステップS502に戻る。
【0089】
(ステップS514)意見情報取得部134は、カウンタiに1を代入する。
【0090】
(ステップS515)意見情報取得部134は、i番目の専門家候補が存在するか否かを判断する。i番目の専門家候補が存在すればステップS516に行き、i番目の専門家候補が存在しなければ上位処理(ステップS305)にリターンする。
【0091】
(ステップS516)意見情報取得部134は、i番目の専門家候補に対応するすべての文書識別子を取得する。
【0092】
(ステップS517)意見情報取得部134は、ステップS516で取得したすべての文書識別子に対応するすべての文書の中の姿勢フラグが「肯定的」である文の数を取得する。かかる文の数は、肯定文数である。
【0093】
(ステップS518)意見情報取得部134は、ステップS516で取得したすべての文書識別子に対応するすべての文書の中の姿勢フラグが「否定的」である文の数を取得する。かかる文の数は、否定文数である。
【0094】
(ステップS519)意見情報取得部134は、ステップS516で取得したすべての文書識別子に対応するすべての文書の中の意見の合計数を取得する。なお、ここで、意見の合計数とは、通常、すべての意見文の数である。
【0095】
(ステップS520)意見情報取得部134は、肯定文数の割合を取得する。
【0096】
(ステップS521)意見情報取得部134は、カウンタiを1、インクリメントし、ステップS515に戻る。
【0097】
なお、図5のフローチャートにおいて取得された、肯定意見文数、否定意見文数の他、肯定・否定意見の数の合計、肯定文数の割合、関連度、およびドメイン種別などは、意見情報の例である。
【0098】
次に、ステップS305の第一関連度取得処理については、図6のフローチャートを用いて説明する。
【0099】
(ステップS601)関連度取得部135は、カウンタiに1を代入する。
【0100】
(ステップS602)関連度取得部135は、i番目の文書が存在するか否かを判断する。i番目の文書が存すればステップS603に行き、存在しなければステップS606に行く。
【0101】
(ステップS603)関連度取得部135は、i番目の文書とトピックとの関連度を取得する。
【0102】
(ステップS604)関連度取得部135は、i番目の文書の文書識別子と関連度とを対応付けて蓄積する。
【0103】
(ステップS605)関連度取得部135は、カウンタiを1、インクリメントし、ステップS602に戻る。
【0104】
(ステップS606)関連度取得部135は、カウンタiに1を代入する。
【0105】
(ステップS607)関連度取得部135は、i番目の専門家候補が存在するか否かを判断する。i番目の専門家候補が存すればステップS608に行き、存在しなければ上位処理(ステップS306)にリターンする。
【0106】
(ステップS608)関連度取得部135は、i番目の専門家候補に対応するすべての文書識別子をバッファから取得する。
【0107】
(ステップS609)関連度取得部135は、ステップS608で取得したすべての文書識別子に対応する1以上の関連度を取得する。
【0108】
(ステップS610)関連度取得部135は、i番目の専門家候補に対応付けて、ステップS609で取得した関連度をバッファに蓄積する。
【0109】
(ステップS611)関連度取得部135は、カウンタiを1、インクリメントし、ステップS502に戻る。
【0110】
次に、ステップS305の第二関連度取得処理については、図7のフローチャートを用いて説明する。
【0111】
(ステップS701)関連度取得部135は、カウンタiに1を代入する。
【0112】
(ステップS702)i番目の専門家候補が存在するか否かを判断する。i番目の専門家候補が存すればステップS703に行き、存在しなければ上位処理(ステップS306)にリターンする。
【0113】
(ステップS703)関連度取得部135は、i番目の専門家候補に対応するすべての文書識別子をバッファから取得する。
【0114】
(ステップS704)関連度取得部135は、カウンタjに1を代入する。
【0115】
(ステップS705)関連度取得部135は、ステップS703で取得した文書識別子の中の、j番目の文書識別子が存在するか否かを判断する。j番目の文書識別子が存在すればステップS706に行き、存在しなければステップS710に行く。
【0116】
(ステップS706)関連度取得部135は、j番目の文書識別子に対応する専門家候補の数を取得する。
【0117】
(ステップS707)関連度取得部135は、ステップS706で取得した専門家候補の数を用いて、j番目の文書識別子で識別される文書と、i番目の専門家候補との関連度を算出する。なお、文書と専門家候補との関連度を算出する演算式は、専門家候補の数をパラメータとする減少関数である。
【0118】
(ステップS708)関連度取得部135は、j番目の文書識別子とi番目の専門家候補とに対応付けて、ステップS707で算出した関連度をバッファに一時蓄積する。
【0119】
(ステップS709)関連度取得部135は、カウンタjを1、インクリメントし、ステップS705に戻る。
【0120】
(ステップS710)関連度取得部135は、カウンタiを1、インクリメントし、ステップS702に戻る。
【0121】
ステップS306のスコア算出処理については、図8のフローチャートを用いて説明する。
【0122】
(ステップS801)スコア算出部136は、カウンタiに1を代入する。
【0123】
(ステップS802)スコア算出部136は、i番目の専門家候補が存在するか否かを判断する。i番目の専門家候補が存すればステップS803に行き、存在しなければ上位処理(ステップS307)にリターンする。
【0124】
(ステップS803)スコア算出部136は、i番目の専門家候補に対応する意見情報を取得する。
【0125】
(ステップS804)スコア算出部136は、i番目の専門家候補に対応する関連度を取得する。ここでの関連度は、第一関連度、または第二関連度、または第一関連度と第二関連度である。
【0126】
(ステップS805)スコア算出部136は、ステップS803で取得した意見情報、およびステップS804で取得した関連度を用いて、スコアを算出する。
【0127】
(ステップS806)スコア算出部136は、i番目の専門家候補に対応付けて、ステップS805で算出したスコアを、バッファに蓄積する。
【0128】
(ステップS807)スコア算出部136は、カウンタiを1、インクリメントし、ステップS802に戻る。
【0129】
以下、本実施の形態における専門家検索システム1の具体的な動作について説明する。
【0130】
今、ユーザは、端末装置11に対して、トピック「ゆとり教育」を入力した、とする。そして、端末装置11の端末受付部110は、トピック「ゆとり教育」を受け付ける。そして、端末送信部111は、端末受付部110が受け付けたトピック「ゆとり教育」を、専門家検索装置13に送信する。
【0131】
次に、専門家検索装置13の受付部130は、トピック「ゆとり教育」を受信する。そして、文書検索部131は、トピック「ゆとり教育」をキーとして、いわゆるWeb検索を行い、1以上の文書を取得する。そして、文書検索部131は、2以上のWebページを取得する。ここで、一のWebページは、例えば、図9に示すWebページであった、とする。
【0132】
次に、専門家候補抽出部132は、例えば、図9の文書から、トピック「ゆとり教育」に関する専門家候補「山田○夫」を抽出する。専門家候補抽出部132は、固有名認識の技術を用いて、専門家候補「山田○夫」を抽出する。
【0133】
次に、意見文抽出部133は、図9の文書から、1以上の文を抽出する。そして、意見文抽出部133は、取得した各文が意見文に対して、構文解析を行う。構文解析は、例えば、KNP(http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp.html参照)により行う。
【0134】
次に、意見文抽出部133は、各文が意見文か否かを判断し、判断結果をバッファに代入する。
【0135】
次に、意見文抽出部133は、各意見文のタイプ、および極性を取得する。具体的には、意見文抽出部133は、例えば、構文解析の結果から1以上の素性を取得し、当該1以上の素性を機械学習の分類器に与えて、タイプを取得する。また、意見文抽出部133は、例えば、文に対して構文解析を行い、極性の反転語、および係り受け関係も考慮した上で文の極性を取得する。なお、意見文の抽出、意見文のタイプ、および極性の取得に関する技術は、文献「Tetsuji Nakagawa, Kentaro Inui and Sadao Kurohashi:Dependency Tree-based Sentiment Classification using CRFs with Hidden Variables, In Proceedings of Human Language Technologies: The 11th Annual Conference of the North American Chapter of the Association for Computational Linguistics (HLT-NAACL 2010), June 2010.」に記載されている。なお、意見文の抽出、極性の取得について、上記文献以外の方法で行われても良い。
【0136】
そして、意見文抽出部133は、図9の文章に対して、バッファ内に、図10に示す意見文の情報を得る。意見文の情報は、「タイプ」「極性」「意見文」を有するレコードの集合である。なお、意見文抽出部133が取得する文は、文の一部でも良い。
【0137】
次に、意見情報取得部134は、図9の文書に対して、専門家候補「山田○夫」の意見情報を、以下のように意見情報を取得する。つまり、意見情報取得部134は、図10の表の極性がプラスの意見文の数「2」を、肯定的な意見数として取得する。また、意見情報取得部134は、図10の表の極性がマイナスの意見文の数「1」を、否定的な意見数として取得する。さらに、意見情報取得部134は、図10の表のレコード数「5」を、意見文の数として取得する。
【0138】
次に、関連度取得部135は、専門家候補と文書との関連度を、以下の数式1を用いて算出する。なお、関連度取得部135は、数式1の演算式の情報を予め保持している、とする。
【数1】

【0139】
なお、数式1において、aijは、文書iと専門家候補jの関連度である。niは、文書iから抽出された専門家候補の数である。
【0140】
つまり、例えば、図9の文書から、専門家候補{山田○夫,寺田○和}が検出された場合、関連度取得部135は、専門家候補「山田○夫」と図9の文書との関連度aijは、1/2となる。なお、例えば、図9の文書から、専門家候補{山田○夫}のみが検出された場合、関連度取得部135は、専門家候補「山田○夫」と図9の文書との関連度aijは、1となる。
【0141】
また、関連度取得部135は、各文書と、トピック「ゆとり教育」との関連度を算出する。例えば、関連度取得部135は、図9の文書において、トピック「ゆとり教育」の出現回数「14」を取得する。そして、関連度取得部135は、出現回数をパラメータとする増加関数により、図9の文書とトピック「ゆとり教育」との関連度riを取得する。
【0142】
次に、スコア算出部136は、以下の数式2を用いて、専門家候補jのスコアEjを算出する、とする。
【数2】

【0143】
なお、文書iの品質スコアqiは、以下の数式3により算出される、とする。
【数3】

【0144】
数式3において用いられる素性種別は、バイアス項、肯定意見数、否定意見数、意見総数である。また、数式3において、wはモデルパラメータである。モデルパラメータとは、素性種別に与えられるパラメータである。モデルパラメータが(バイアス項のパラメータ,肯定意見数のパラメータ,否定意見数のパラメータ,意見総数のパラメータ)である場合、モデルパラメータwは、例えば、w=(−1.44,0.06,0.390,0.239)である。また、数式3において、xiは文書iの素性の集合である。xiは、ここでは、(バイアス項,肯定意見数,否定意見数,意見総数)である。なお、バイアス項とは、文書とは独立のパラメータで、品質スコア関数の形状を決定するものである。
【0145】
また、スコア算出部136は、上述した意見情報を取得する。ここでの意見情報は、文書iの素性の集合xi(1,2,1,5)である。
【0146】
そして、スコア算出部136は、文書iの品質スコアqiを構成する「w・x」(数式3参照)を、「wx=−1.44+0.12+0.390+1.195=0.265」と算出する。
【0147】
次に、スコア算出部136は、数式3に従って、文書iの品質スコアqiを「qi=0.566」と算出する。
【0148】
次に、スコア算出部136は、数式2に従って、専門家候補「山田○夫」に対して、「山田○夫」が抽出された文書iのトピックとの関連度ri、文書iの品質スコアqi、文書iと専門家候補「山田○夫」との関連度aijとを乗算する。そして、スコア算出部136は、数式2に従って、関連度ri、品質スコアqi、および関連度aijとの積を、各文書に対して算出し、算出した値の和を、専門家候補「山田○夫」のスコアとして算出する。
【0149】
以上の処理を、他の専門家候補に対しても行い、各専門家候補のスコアが取得される。
【0150】
次に、専門家選択部137は、算出されたスコアを用いて、1以上の専門家候補から、例えば、スコアが閾値より高い1以上の専門家を取得する。そして、文書出力部139は、スコアの順に、専門家をソートして、端末装置11に送信する。
【0151】
また、文書出力部139は、各専門家に対応する1以上の文書のURL等を端末装置11に送信する。
【0152】
次に、端末装置11の端末受信部112は、スコア順にソートされた1以上の専門家および文書のURLを専門家検索装置13から受信する。そして、端末出力部113は、端末受信部112が受信した1以上の専門家および文書のURLを出力する。
【0153】
以上、本実施の形態によれば、Web文書を対象として、精度高く専門家を検索できる。
【0154】
また、本実施の形態によれば、その玉石混淆のWeb上の多数の情報の中から専門家の書いた情報を順位付けして提示することができるので、Web上の多数の情報の中からより信頼性の高い情報へのアクセスを可能とし、利用者の利便性を高めることができる。
【0155】
また、本実施の形態によれば、トピックについての専門家の一覧や,あるいは専門家が発信した情報を利用者に提示することが可能となる。
【0156】
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における専門家検索装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、例えば、コンピュータを、トピックを受け付ける受付部と、1以上のWebサーバ装置から、前記トピックに関連する1以上の文書を取得する文書検索部と、前記1以上の文書から、1以上の専門家候補を抽出する専門家候補抽出部と、前記1以上の文書から、前記トピックの意見に関する文である1以上の意見文を抽出する意見文抽出部と、前記1以上の意見文から、肯定的な意見文の数である肯定意見文数、および否定的な意見文の数である否定意見文数を含む意見情報を、前記1以上の各専門家候補ごとに取得する意見情報取得部と、前記1以上の各専門家候補ごとに、前記意見情報を用いて、前記トピックについての専門性のスコアを算出するスコア算出部と、前記スコアを用いて、前記1以上の専門家候補から、1以上の専門家を取得する専門家選択部と、前記専門家選択部が取得した1以上の専門家を出力する専門家出力部として機能させるプログラムである。
【0157】
また、図11は、本明細書で述べたプログラムを実行して、上述した実施の形態の専門家検索装置等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図11は、このコンピュータシステム340の概観図であり、図12は、コンピュータシステム340のブロック図である。
【0158】
図11において、コンピュータシステム340は、FDドライブ、CD−ROMドライブを含むコンピュータ341と、キーボード342と、マウス343と、モニタ344とを含む。
【0159】
図12において、コンピュータ341は、FDドライブ3411、CD−ROMドライブ3412に加えて、MPU3413と、CD−ROMドライブ3412及びFDドライブ3411に接続されたバス3414と、ブートアッププログラム等のプログラムを記憶するためのROM3415とに接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3416と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3417とを含む。ここでは、図示しないが、コンピュータ341は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
【0160】
コンピュータシステム340に、上述した実施の形態の専門家検索装置等の機能を実行させるプログラムは、CD−ROM3501、またはFD3502に記憶されて、CD−ROMドライブ3412またはFDドライブ3411に挿入され、さらにハードディスク3417に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ341に送信され、ハードディスク3417に記憶されても良い。プログラムは実行の際にRAM3416にロードされる。プログラムは、CD−ROM3501、FD3502またはネットワークから直接、ロードされても良い。
【0161】
プログラムは、コンピュータ341に、上述した実施の形態の専門家検索装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム340がどのように動作するかは周知であり、詳細な説明は省略する。
【0162】
なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信するステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
【0163】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0164】
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
【0165】
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【0166】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0167】
以上のように、本発明にかかる専門家検索装置は、Web文書を対象として、精度高く専門家を検索できる、という効果を有し、専門家用のWeb検索エンジン等として有用である。
【符号の説明】
【0168】
1 専門家検索システム
11 端末装置
12 Webサーバ装置
13 専門家検索装置
110 端末受付部
111 端末送信部
112 端末受信部
113 端末出力部
121 文書格納部
122 文書送信部
130 受付部
131 文書検索部
132 専門家候補抽出部
133 意見文抽出部
134 意見情報取得部
135 関連度取得部
136 スコア算出部
137 専門家選択部
138 専門家出力部
139 文書出力部

【特許請求の範囲】
【請求項1】
トピックを受け付ける受付部と、
1以上のWebサーバ装置から、前記トピックに関連する1以上の文書を取得する文書検索部と、
前記1以上の文書から、1以上の専門家候補を抽出する専門家候補抽出部と、
前記1以上の文書から、前記トピックの意見に関する文である1以上の意見文を抽出する意見文抽出部と、
前記1以上の意見文から、意見文に関する情報である意見情報を、前記1以上の各専門家候補ごとに取得する意見情報取得部と、
前記1以上の各専門家候補ごとに、前記意見情報を用いて、前記トピックについての専門性のスコアを算出するスコア算出部と、
前記スコアを用いて、前記1以上の専門家候補から、1以上の専門家を取得する専門家選択部と、
前記専門家選択部が取得した1以上の専門家を出力する専門家出力部とを具備する専門家検索装置。
【請求項2】
前記専門家候補抽出部が抽出した1以上の各専門家候補と、前記文書検索部が取得した1以上の文書のうち、各専門家候補が出現する文書に対して、専門家候補と文書との関連度を、前記1以上の各専門家候補ごとに取得する関連度取得部をさらに具備し、
前記スコア算出部は、
前記1以上の各専門家候補ごとに、前記意見情報および関連度を用いて、前記トピックについての専門性のスコアを算出する請求項1記載の専門家検索装置。
【請求項3】
前記専門家出力部は、
前記スコアの高い順に、1以上の専門家をソートして出力する請求項1または請求項2記載の専門家検索装置。
【請求項4】
前記専門家出力部は、
前記1以上の専門家の出力に代えて、前記専門家選択部が取得した1以上の各専門家のスコアを算出する元になった1以上の文書または1以上の意見文を出力する請求項1から請求項3いずれか記載の専門家検索装置。
【請求項5】
前記1以上の専門家のうちの一部または全部の専門家に対応する1以上の文書、または当該1以上の文書にアクセスするための情報である1以上のアクセス情報を出力する文書出力部をさらに具備する請求項1から請求項3いずれか記載の専門家検索装置。
【請求項6】
受付部、文書検索部、専門家候補抽出部、意見文抽出部、意見情報取得部、関連度取得部、スコア算出部、専門家選択部、および専門家出力部により実現される専門家検索方法であって、
前記受付部が、トピックを受け付ける受付ステップと、
前記文書検索部が、1以上のWebサーバ装置から、前記トピックに関連する1以上の文書を取得する文書検索ステップと、
前記専門家候補抽出部が、前記1以上の文書から、1以上の専門家候補を抽出する専門家候補抽出ステップと、
前記意見文抽出部が、前記1以上の文書から、前記トピックの意見に関する文である1以上の意見文を抽出する意見文抽出ステップと、
前記意見情報取得部が、前記1以上の意見文から、肯定的な意見文の数である肯定意見文数、および否定的な意見文の数である否定意見文数を含む意見情報を、前記1以上の各専門家候補ごとに取得する意見情報取得ステップと、
前記関連度取得部が、前記1以上の各専門家候補に対応する1以上の文書を決定し、前記1以上の各文書と前記トピックとの関連度を、前記1以上の各専門家候補ごとに取得する関連度取得ステップと、
前記スコア算出部が、前記1以上の各専門家候補ごとに、前記意見情報および関連度を用いて、前記トピックについての専門性のスコアを算出するスコア算出ステップと、
前記専門家選択部が、前記スコアを用いて、前記1以上の専門家候補から、1以上の専門家を取得する専門家選択ステップと、
前記専門家出力部が、前記専門家選択部が取得した1以上の専門家を出力する専門家出力部とを具備する専門家検索ステップとを具備する専門家検索方法。

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図1】
image rotate

【図9】
image rotate


【公開番号】特開2012−208728(P2012−208728A)
【公開日】平成24年10月25日(2012.10.25)
【国際特許分類】
【出願番号】特願2011−73811(P2011−73811)
【出願日】平成23年3月30日(2011.3.30)
【出願人】(301022471)独立行政法人情報通信研究機構 (1,071)
【Fターム(参考)】