情報評価装置、コンテンツ検索装置、情報評価方法、コンテンツ検索方法、それらのプログラム及び記録媒体
【課題】 様々なコミュニティの中から提供された情報を元に、数学的に意味のある安定した情報評判スコアと、各参加者の情報提供スコアと情報評価スコアとを算出する。
【解決手段】 情報取得手段101において、コンテンツを提供した利用者の利用者IDと利用者によって提供されたコンテンツの識別子であるコンテンツIDを含む情報提供リンク情報と、コンテンツを評価した利用者の利用者IDと利用者によって評価されたコンテンツの識別子であるコンテンツIDとコンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報を含む情報評価リンク情報とを取得し、スコア計算手段104において、情報提供リンク情報と情報評価リンク情報より生成したスコア推移行列の固有ベクトルを計算し、固有ベクトルの値を用いてコンテンツの情報評判スコアと利用者の情報提供スコアと利用者の情報評価スコアとを算出する。
【解決手段】 情報取得手段101において、コンテンツを提供した利用者の利用者IDと利用者によって提供されたコンテンツの識別子であるコンテンツIDを含む情報提供リンク情報と、コンテンツを評価した利用者の利用者IDと利用者によって評価されたコンテンツの識別子であるコンテンツIDとコンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報を含む情報評価リンク情報とを取得し、スコア計算手段104において、情報提供リンク情報と情報評価リンク情報より生成したスコア推移行列の固有ベクトルを計算し、固有ベクトルの値を用いてコンテンツの情報評判スコアと利用者の情報提供スコアと利用者の情報評価スコアとを算出する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワーク上のコミュニティにおいて提供される情報の評判を評価する技術に関する。
【背景技術】
【0002】
近年、お互いに同じ関心を持つユーザ同士で情報を共有する多くのコミュニティがインターネット上に形成されている。このようなコミュニティの一例としては、以下で述べる、1)問題解決型コミュニティ、2)商品・サービス評価型コミュニティ、3)ユーザ創造型コミュニティ、4)トピックベースコミュニティ、等がある。
問題解決型コミュニティは、あるトピックにおける問題(例えば商品利用におけるトラブル)について、ユーザ主導で相互的なサポートを行うコミュニティであり、一例としては、株式会社オーケイウェブの「OKWeb」 や、Sun Microsystems, Inc.の「Sun Support Forums」などのユーザフォーラム型カスタマサポートサイト等がある。
【0003】
商品・サービス評価コミュニティは、商品やサービスに対するユーザレビューを共有するためのコミュニティであり、一例としては、アイスタイル株式会社の「cosme.net」や株式会社カカクコムの提供する「kakaku.com」等がある。
ユーザ創造型コミュニティは、ユーザ主導による新サービス創造などを目的としたコミュニティであり、一例としては、株式会社エンジンの「たのみこむ」やエレファントデザイン株式会社の「空想生活」等がある。
トピックベースコミュニティは、あるトピックについて、ユーザ間でのディスカッションや情報共有が行われるコミュニティであり、取り扱われるトピックはコミュニティによって多種多様である。一例としては、「Slashdot.jp」や株式会社ベネッセウィコーポレーションの「ベネッセウイメンズパーク」等がある。
【0004】
本発明はこれらの特定のコミュニティのみに適用されるわけではなく、これらを含む多様な情報共有型のコミュニティに適用できる。これらの情報共有型コミュニティでは、コミュニティの参加者から広く記事やコンテンツを集めるという特徴を有しており、コミュニティには様々な参加者が含まれるため、これらの参加者によって提供される情報やコンテンツの品質は千差万別である。多くの人が関心を持つ有益かつ信頼度の高い情報を提供する人がいる一方で、誰も関心を持たない情報を大量に投入する参加者や、意図的ないし無意識のうちに正しくない情報を投入する参加者も存在する。また、コミュニティに対して投入された情報に対する評価の入力についても、意図的ないし無意識のうちに真実ではない評価を投入する参加者も存在する。そこで、コミュニティに提供する情報の中から、有益な情報を抽出するためには、コミュニティ参加者の情報提供能力、及び情報評価能力を考慮に入れた情報評価装置或いは情報評価方法が重要となる。
【0005】
このような参加者の能力を考慮に入れ、コミュニティに投稿される情報の重要性をスコアリングするシステムの一例が、特許文献1に記載されている。この文献では、コミュニティに投稿された情報の有益度を数値化した情報評判スコアと、参加者の情報提供能力を数値化した情報提供スコア(該文献では情報発言スコアと記載)と、参加者の情報評価能力を数値化した情報評価スコアの3つのスコアを導入し、これらのスコアの相互依存関係に基づき計算する算出アルゴリズムを提案している。
しかしながら、該文献に記載された方法では、情報提供能力及び情報評価能力に対応する情報提供スコア及び情報評価スコアが該文献段落〔0060〕に記載されている[式(2)]及び、段落〔0063〕に記載されている[式(3)]のように、情報評判スコアの変動に比例して単純に情報評価スコア及び情報提供スコアを変動させるのみである。このため、このアルゴリズムに基づき、実際に大量のデータを読み込ませてみると、初期の段階で高いスコアを得た人の情報提供スコアや情報評価スコアが時間の経過に伴い、ますます増大し発散する傾向があり、そのままでは有用な値が得られないという問題がある。これは、特許文献1に記載された方法ではスコアに対する意味論が厳密に定義されておらず、算出されたスコアも全体として整合がとれたものになっていないことに起因するものである。
【0006】
すなわち、情報評判スコア、情報提供スコア、情報評価スコアの3つのスコアを安定させ、しかもコミュニティの参加者の活動の実態に合うスコアとするためには、スコアの意味論を厳密に定義することが必要である。例えば、非特許文献1では、Webページの重要度を表すPageRankと呼ぶ指標を、ランダムサーファーモデルと呼ぶ意味論に基づき計算している。ランダムサーファーモデルは、Webページに存在するハイパーリンクをランダムにクリックした場合の各ページへの到着確率をPageRankとして定義している。このモデルに基づく具体的なスコアの計算方法は、おおよそ次のようなものである。
【0007】
各Webページをグラフ理論におけるノード、リンクをエッジとみなしたときに、Webページ数をNとすると、N×Nの隣接行列Lで表現できる。この隣接行列を転置し、さらにそれぞれの列ベクトルの総和が1となるようにそれぞれのリンク数で割った行列を作成する。これは推移確率行列となる。推移確率行列の場合、線形代数学の基礎理論により、推移確率行列の最大固有値に属する固有ベクトルを求めることが、最終的な到着確率ベクトルを計算することとなることが知られている。したがって、ランダムサーファーモデルによる各ページの到着確率は、前記の推移確率行列の固有ベクトルを算出することで、実現できる。固有ベクトルの算出アルゴリズムについては、多くの方法が提案されているため、詳しくは省略するが、最も単純な方法としては、前記確率推移行列の掛け算を反復して行うことで、最大固有値に属する固有ベクトルを計算する方法等がある。
【0008】
同様に、非特許文献2には、HITSと呼ぶ、Webページのスコアリングのアルゴリズムが提案されている。このアルゴリズムでは、各ページの情報提供能力を表すAuthorityベクトルaと、各ページの情報評価能力を表すhubベクトルhという指標を導入し、Webページの隣接行列Lとその転置行列LTとするとき、aが行列LTLの固有ベクトル、hが 行列LLTの固有ベクトルとして算出することを提案している。
【特許文献1】特開2003−316915号公報
【非特許文献1】S. Brin and L. Page, “The anatomy of a large-scale hyper-textual web search engine.” Proceedings of 7th WWW Conference, (1998).
【非特許文献2】J. M. Kleinberg, “Authoritative sources in hyperlinked environment”, Journal of ACM, Vol. 48, pp. 604-632 (1999).
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、上記のように行列によるモデル化と行列の固有ベクトルを用いて計算する方法は、Webページのスコアリングの方法としては広く利用されているが、本発明が対象とする上記のコミュニティ分析に適用する方法は十分に検討されていない。Webページの場合には、ハイパーテキストのリンクと呼ぶ1種類のリンクに基づいて、隣接行列や推移確率行列等を生成するのに対し、本発明が対象とするコミュニティ分析においては、参加者が情報に対して行った情報提供に対応する情報提供リンクと、同じく参加者が情報に対して行った情報評価アクションに対応する情報評価リンクの2種類のリンクが存在する。また、これらのリンクは、コミュニティの参加者がM人、提供或いは評価された情報がN個とするとき、情報提供リンク及び情報評価リンクはそれぞれM×Nの隣接行列を構成する等、多くの点でWebページのスコアリングと異なっており、上記で述べたPageRankやHITSといったアルゴリズムをそのまま適用することは困難である。
【0010】
本発明は上記のような問題点を鑑みてなされたものであり、1)問題解決型コミュニティ、2)商品・サービス評価型コミュニティ、3)ユーザ創造型コミュニティ、4)トピックベースコミュニティ、等の様々なコミュニティの中から、参加者から情報への情報提供リンクと情報評価リンクを抽出し、この2種類のリンクを分析することで、全体として整合がとれたスコアを算出できる技術を提供することを目的とする。すなわち、本発明の目的は、2種類のリンクを分析し、評価値として意味のある安定した値のスコアを算出する技術を提供することである。
【課題を解決するための手段】
【0011】
以上の課題を解決するために、本発明では、以下のように情報評判スコア、情報提供スコア及び情報評価スコアの少なくとも一つを算出する。尚、情報評判スコアは、利用者から提供された電子情報であるコンテンツの評判を数値化したものを意味する。また、情報提供スコアは、コンテンツを提供した利用者の情報提供能力を数値化したものを意味する。さらに、情報評価スコアは、コンテンツを評価した利用者の情報評価能力を数値化したものを意味する。
まず、情報提供リンク格納手段に、コンテンツを提供した利用者の利用者IDと、利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を格納する。また、情報評価リンク格納手段に、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を格納する。
【0012】
次に、スコア計算手段において、上述の情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と何れかのスコア(情報評価スコア、情報評判スコア又は情報提供スコアの何れか)との間の定義された関係を示す行列)の固有ベクトルを算出する。そして、スコア計算手段は、この固有ベクトルの要素を何れかのスコアとして、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させる。
ここで、スコア計算手段が生成するスコア推移行列は、情報提供リンク情報と情報評価リンク情報と何れかのスコアとの定義(スコアに対する意味論の定義)された関係を示す行列である。そして、本発明では、このスコア推移行列の固有値を求め、上述のスコアを求める。そのため、本発明によって求められたスコアは、導入された意味論の定義を厳格に保守したものとなる。その結果、求められたスコアは、導入された意味論のもと数学的に意味のある安定した値となる。
【0013】
また、本発明において好ましくは、スコア計算手段において、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと何れかのスコアとの定義された関係を示す関係式に従い、何れかのスコアを算出する。これにより、数学的に意味のある安定した2種類以上のスコアを算出することができる。
また、本発明において好ましくは、スコア計算手段は以下のようにしてスコアを算出する。まず、第1隣接行列生成手段において、情報提供リンク格納手段に格納された情報提供リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報提供リンク情報の個数を数え、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)を生成して出力する。また、第2隣接行列生成手段において、情報評価リンク格納手段に格納された情報評価リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報評価リンク情報の評価情報の値を加算し、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)を生成して出力する。そして、固有ベクトル算出手段において、情報提供リンク隣接行列と情報評価リンク隣接行列とから、スコア推移行列(情報提供リンク隣接行列と情報評価リンク隣接行列と何れかのスコアとの関係を示す行列)の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。その後、算出されたスコアを、書き込み手段において、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段の何れかに格納させる。
【0014】
さらに、本発明において好ましくは、スコア算出手段において、情報提供リンク隣接行列又は情報評価リンク隣接行列と固有ベクトルとを、これらと何れかのスコアとの定義された関係を示す関係式に代入し、当該スコアを算出して出力する。
またさらに、本発明において好ましくは、固有ベクトル算出手段は、以下のように固有ベクトルを算出する。まず、第1正規化手段において、情報提供リンク隣接行列の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報提供リンク格納手段において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報提供リンク隣接行列を出力する。また、第2正規化手段において、情報評価リンク隣接行列の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報評価リンク格納手段において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報評価リンク隣接行列を出力する。さらに演算手段において、正規化された情報提供リンク隣接行列と正規化された情報評価リンク隣接行列とを用いてスコア推移行列の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。これにより、同一の利用者が多数のコンテンツを提供したり、多数のコンテンツの評価を行ったりすることによって、その利用者の情報提供スコアや情報評価スコアが高められてしまうことを防止できる。
【0015】
また、本発明において好ましくは、スコア推移行列Sは、S=αCTC+(1−α)ETE、S=CETECT、或いはS=ECTCETの何れかである。尚、Cは情報提供リンク隣接行列であり、Eは情報評価リンク隣接行列であり、αは0以上1以下の実数であり、βTはβの転置行列を意味している。
また、本発明をネットワークに接続されたコンテンツサーバ装置が格納するコンテンツの情報の提供に適用することもできる。この場合、まずコンテンツ情報受信手段においてコンテンツが有する情報であるコンテンツ情報を受信し、コンテンツ情報格納手段に格納する。その後、情報提供リンク生成手段において、コンテンツ情報格納手段に格納されたコンテンツ情報を用い、コンテンツを提供した利用者の利用者IDと、利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を生成し、情報提供リンク格納手段に格納する。また、情報評価リンク生成手段において、コンテンツ情報格納手段に格納されたコンテンツ情報を用い、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を生成し、情報評価リンク格納手段に格納する。次に、固有ベクトル算出手段において、情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と情報評判スコア又は情報提供スコアとの間の定義された関係を示す行列)の固有ベクトルを算出して、この固有ベクトルの要素を各コンテンツ情報に対応する情報評判スコア又は情報提供スコアとして出力する。そして、書き込み手段において、情報評判スコア又は情報提供スコアを、対応するコンテンツ情報に関連付けて、コンテンツ情報格納手段に格納させる。その後、検索条件受信手段において、利用者端末装置から送信された検索条件を受信し、検索手段において、この検索条件を充足するコンテンツ情報を、それらに関連付けられた情報評判スコア及び情報提供スコアの少なくとも一方とともにコンテンツ情報格納手段から抽出して出力する。
【0016】
このような構成の装置は、算出されたスコアに従い、検索条件に合致した各コンテンツ情報を加工(例えば並び替えなど)することができる。そして、当該装置は、この加工された情報を用いることにより、コンテンツの重要度が適切に示唆された検索結果を利用者に提供することができる。
さらに、本発明において好ましくは、スコア算出手段において、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと情報評判スコア又は情報提供スコアとの定義された関係を示す関係式に従い、各コンテンツ情報に対応する情報評判スコア又は情報提供スコアを算出し、当該スコアを出力する。また、より好ましくは、情報提供リンク生成手段は、評価が存在するコンテンツに対応する情報提供リンク情報のみを生成する。そして、情報評判スコア推定手段において、利用者の情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコアとして出力する。この場合、スコアの妥当性をさほど落すことなく、スコアの算出速度を向上させることができる。
【0017】
また、本発明において好ましくは、コンテンツ情報が、コンテンツ提供者情報(コンテンツを提供した利用者に対応する情報)を含み、検索手段が、検索条件を充足するコンテンツ情報を、当該コンテンツ情報に関連付けられた情報評判スコアとともに、コンテンツ情報格納手段から抽出する手段である。そして、情報評判スコア集計手段において、検索手段において抽出された情報評判スコアを、コンテンツ情報が有するコンテンツ提供者情報毎に加算し、各加算値を当該コンテンツ提供者情報ともに出力する。このような加算値は、検索条件に合致するコンテンツのみに関し、コンテンツに対する評価値をコンテンツ提供者毎に合算したものである。すなわち、当該加算値とコンテンツ提供者情報とを用いることにより、検索条件に合致するコンテンツのオピニオンリーダを正確に特定することができる(詳細は後述)。
【0018】
さらに、本発明において好ましくは、コンテンツ情報は、コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報と、当該コンテンツのアドレスを示すコンテンツアドレス情報と、他のコンテンツのアドレスを示すポインタ情報とを含む情報である。そして、情報提供リンク生成手段は、コンテンツ提供者情報を利用者IDとし、コンテンツアドレス情報をコンテンツIDとして、情報提供リンク情報を生成する。また、情報評価リンク生成手段は、コンテンツ提供者情報を利用者IDとし、ポインタ情報をコンテンツIDとし、コンテンツ情報がポインタ情報を含むか否かによって定まる値を評価情報として、情報評価リンク情報を生成する。
【0019】
また、本発明において好ましくは、情報評価リンク生成手段は、トラックバック以外のポインタ情報を用いて情報評価リンク情報を生成する。これにより、誤った情報評価リンク情報が生成されることを防止できる(詳細は後述)。
【発明の効果】
【0020】
以上のように本発明によれば、情報提供リンク情報と情報評価リンク情報という2種類のリンク情報から、評価値として意味のある全体として整合がとれたスコアを算出することができる。
【発明を実施するための最良の形態】
【0021】
以下、本発明の実施の形態を図面を参照して説明する。
〔第1の実施の形態〕
まず、本発明における第1の実施の形態について説明する。
<構成>
図1は、本形態における情報評価システム1の構成を示す図である。
図1に例示するように、本形態の情報評価システム1は、情報評価装置100及びこれとネットワーク300を通じて接続され、利用者i (i=1…m)がそれぞれ使用する利用者端末装置200−1〜mを有している。
【0022】
情報評価装置100は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、バス、補助記憶装置、通信装置等からなる周知のコンピュータ装置において、そのCPUに所定のプログラムを実行させることにより構成されるものである。図1に例示するように、この例の情報評価装置100は、情報取得手段101と、情報提供リンク格納手段102と、情報評価リンク格納手段103と、スコア計算手段104と、情報評判スコア格納手段105と、情報提供スコア格納手段106と、情報評価スコア格納手段107と、スコア出力手段108と、一時メモリ111と、制御手段110とを有している。尚、図1において各手段をつなぐ線は情報の流れを示すが、制御手段110及び一時メモリ111に対して入出力される情報の流れの記載は省略してある。
【0023】
図2は、図1における情報取得手段101の詳細構成を例示した図である。
図2に例示するように、この例の情報取得手段101は、通信手段101aと、メッセージ認証手段101bと、情報検証手段101cと、コンテンツID生成手段101dと、情報提供リンク生成手段101eと、情報評価リンク生成手段101fと、書き込み手段101gとを有している。尚、図2における矢印は情報の流れを示すが、制御手段110及び一時メモリ111に対して入出力される情報の流れの記載は一部省略してある。
図3は、図1におけるスコア計算手段104の詳細構成を例示した図である。
【0024】
図3に例示するように、この例のスコア計算手段104は、第1隣接行列生成手段104aと、第2隣接行列生成手段104bと、固有ベクトル算出手段104cと、スコア算出手段104dと、書き込み手段104eとを有している。また、固有ベクトル算出手段104cは、第1正規化手段104caと、第2正規化手段104cbと、演算手段104ccとを有している。尚、図3における矢印は情報の流れを示すが、制御手段110に対して入出力される情報の流れの記載は省略してある。
図4は、図1におけるスコア出力手段108の詳細構成を例示した図である。
【0025】
図4に例示するように、この例のスコア出力手段108は、受信手段108aと、メッセージ判定手段108bと、スコア検索手段108cと、メッセージ生成手段108dと、送信手段108eとを有している。尚、図4における矢印は情報の流れを示すが、制御手段110に対して入出力される情報の流れの記載は一部省略してある。
尚、上述した各手段は、同一の筺体内に存在するものに限定されず、複数の筺体に分散配置されてもよい。また、上述した通信手段101a、受信手段108a及び送信手段108eは、例えば、LAN(Local Area Network)カード、モデム、ルータ、ハブ等の通信装置によって構成されるものである。また、情報提供リンク格納手段102、情報評価リンク格納手段103、情報評判スコア格納手段105、情報提供スコア格納手段106、情報評価スコア格納手段107及び一時メモリ111は、例えば、ハードディスク装置、フレキシブルディスク、MO(Magneto-Optical disc)等の補助記憶装置や、RAM、CPU内のレジスタやキャッシュメモリ等によって構成されるものである。また、制御手段110、メッセージ認証手段101b、情報検証手段101c、コンテンツID生成手段101d、情報提供リンク生成手段101e、情報評価リンク生成手段101f、書き込み手段101g、第1隣接行列生成手段104a、第2隣接行列生成手段104b、固有ベクトル算出手段104c、スコア算出手段104d、書き込み手段104e、メッセージ判定手段108b、スコア検索手段108c及びメッセージ生成手段108dは、例えば、CPUに所定のプログラムが読み込まれ、CPUがこれらのプログラムを実行することにより構成されるものである。
【0026】
また、利用者端末装置200−1〜m(図1)も所定のプログラムに基づいて動作する周知のコンピュータ装置からなる。
<動作>
次に、本形態の情報評価装置100の動作について説明する。
[概要]
本形態の情報評価装置100は、利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア、コンテンツを提供した利用者の情報提供能力を数値化した情報提供スコア、及びコンテンツを評価した利用者の情報評価能力を数値化した情報評価スコアを算出する装置である。まず、この情報評価装置100の処理の概要を説明する。尚、情報評価装置100の各処理は、制御手段110の制御のもと実行される。
【0027】
まず、複数の利用者端末装置200−1〜mは、ネットワーク300を通じ、<利用者ID、コンテンツ>の2つ組みを含むコンテンツ提供メッセージ、或いは、<利用者ID、コンテンツID、評価情報>の3つ組を含むコンテンツ評価メッセージを情報評価装置100に送信する。
情報評価装置100は、情報取得手段101においてこれらを受信する。ここで、受信されたメッセージがコンテンツ提供メッセージであった場合、情報取得手段101は、コンテンツを提供した利用者の利用者IDと、当該利用者によって提供されたコンテンツの識別子であるコンテンツIDとが関連付けられた情報提供リンク情報を情報提供リンク格納手段102に格納する。一方、受信されたメッセージがコンテンツ評価メッセージであった場合、情報取得手段101は、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を情報評価リンク格納手段103に格納する。
【0028】
その後、スコア計算手段104において、情報提供リンク格納手段102と情報評価リンク格納手段103とに格納された情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と何れかのスコアとの間の定義された関係を示す行列。詳細は後述。)の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。また、スコア計算手段104は、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと何れかのスコアとの定義された関係を示す関係式に従い、何れかのスコアを算出して出力する。そして、スコア計算手段104は、算出された各スコアを情報評判スコア格納手段105、情報提供スコア格納手段106又は情報評価スコア格納手段107に格納させる。
【0029】
その後、スコア出力手段108は、利用者端末装置200−1〜mからの要求に対し、情報評判スコア格納手段105、情報提供スコア格納手段106又は情報評価スコア格納手段107を検索し、要求されたスコアに関する情報を利用者端末装置200−1〜mに送信する。
[情報取得手段101の処理の詳細]
次に、情報取得手段101の処理の詳細について説明する。
図5は、情報取得手段101の処理の詳細を説明するためのフローを示す図である。以下、この図に沿って情報取得手段101の処理の詳細を説明する。
【0030】
まず、情報取得手段101の通信手段101a(図2)は、複数の利用者端末装置200−1〜mから送信された<利用者ID、コンテンツ>の2つ組みを含むコンテンツ提供メッセージ、或いは、<利用者ID、コンテンツID、評価情報>の3つ組を含むコンテンツ評価メッセージをネットワーク300経由で受信する(ステップS1)。
図6(a)は、このように受信されるコンテンツ提供メッセージ121のデータ構成の例示であり、図6(b)はコンテンツ評価メッセージ122の例である。この例のコンテンツ提供メッセージ121は、その属性やビット構成等を示すヘッダ情報121aと、コンテンツ121cを提供した利用者の利用者ID121bと、提供されたコンテンツ121cとを有する。ここで、コンテンツ121cは利用者により投入される電子情報である。コンテンツ121cの一例としては、「〇〇レストランの〇〇セットはおいしい」等の文字情報や、利用者が作成した音楽情報、画像情報、動画像などである。利用者ID121bは、そのコンテンツ121cを提供した利用者のIDであり、会員制のコミュニティの場合には、コンテンツ121cを書込む際にシステムにログインするときに利用するID等を用いる。また、コンテンツID121cは、コンテンツに対してユニークに付与される識別子である。
【0031】
また、この例のコンテンツ評価メッセージ122は、その属性やビット構成等を示すヘッダ情報122aと、コンテンツを評価した利用者の利用者ID122bと、利用者によって評価されたコンテンツの識別子であるコンテンツID122cと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報122dとを有する。ここで、利用者ID122cは、コンテンツを評価した利用者のIDであり、会員制のコミュニティの場合には、コンテンツの評価を書込む際にシステムにログインするときに利用するID等を用いる。また、評価情報122dはコンテンツ122dに対する評価を表す情報であり、本形態では、利用者が利用者端末装置200−1〜mを用いて明示的に入力した情報とする。評価情報の一例としては、「+1」、「+2」、「+3」などの予め決められた範囲の値をとる数値情報などがある。
【0032】
通信手段101aは、受信したコンテンツ提供メッセージやコンテンツ評価メッセージを一時メモリ111に格納し、次に、メッセージ認証手段101bが、利用者端末装置200−1〜mの認証処理を行う(ステップS2)。この認証処理は、一人の利用者が同一コンテンツの評価を複数回行うことを禁止したい場合や、別の利用者と偽ってコンテンツを提供することを禁止したい場合に行うものである。この認証処理は、通信手段101a及びネットワーク300を介し、メッセージ認証手段101bと利用者端末装置200−1〜mとの間で、既存のパスワード等を用いた認証プロトコルに従い実行される。尚、このステップS2の処理は応用分野によっては省略できる。
【0033】
ステップS2の認証処理の結果は制御手段110に伝えられる。そして、制御手段110は、認証処理がNGの場合はその利用者端末装置200−1〜mとのセッションを終了させる。一方、認証処理がOKであった場合、制御手段110は、情報検証手段101cに、受信されたメッセージが、コンテンツ提供メッセージかコンテンツ評価メッセージかを判定させる(ステップS3)。具体的には、この例の情報検証手段101cは、ステップS1で通信手段101aが受信したメッセージを一時メモリ111から読み込み、そのヘッダ情報121a又は122aを参照することにより、そのメッセージがコンテンツ提供メッセージ121かコンテンツ評価メッセージ122(図6)かを判断する。情報検証手段101cによる判断結果は制御手段110に送られる。
【0034】
ここで、制御手段110が受け取った判断結果が「メッセージがコンテンツ提供メッセージである」旨の判断結果であった場合、制御手段110はコンテンツID生成手段101dにコンテンツIDを生成する旨の指示を与える。この指示を受けたコンテンツID生成手段101dは、一時メモリ111からステップS1で通信手段101aが受信したコンテンツ提供メッセージを読み込む。そして、コンテンツID生成手段101dは、読み込みたコンテンツ提供メッセージが具備するコンテンツに対するユニークなコンテンツIDを生成し、一時メモリ111に格納する(ステップS4)。コンテンツIDの生成方法としては、例えばコンテンツ全体の一方向性ハッシュ値を利用する方法や、逐次連番を割り振るなどの方法がある。コンテンツIDが生成されると次に、情報提供リンク生成手段101eは、一時メモリ111からステップS1で受信されたコンテンツ提供メッセージと、ステップS4で生成されたコンテンツIDとを読み込む。そして情報提供リンク生成手段101eは、これらを用いて<利用者ID、コンテンツID、コンテンツ>の3つ組み(情報提供リンク情報)を生成し、一時メモリ111に格納する(ステップS5)。その後、書き込み手段101gにおいて一時メモリ111からこの情報提供リンク情報を読み込み、これを情報提供リンク格納手段102に格納させる(ステップS6)。
【0035】
一方、制御手段110が受け取ったステップS3の判断結果が「メッセージがコンテンツ評価メッセージである」旨の判断結果であった場合、制御手段110は情報評価リンク生成手段101fに対し、情報評価リンク情報を生成する旨の指示を与える。この指示を受けた情報評価リンク生成手段101fは、ステップS1で受信されたコンテンツ評価メッセージを一時メモリ111から読み込み、これに含まれる<利用者ID、コンテンツID、評価情報>の3つ組みを情報評価リンク情報として生成し、一時メモリ111に格納する(ステップS7)。その後、書き込み手段101gにおいて一時メモリ111からこの情報提供リンク情報を読み込み、これを情報評価リンク格納手段103に格納させる(ステップS8)。
【0036】
図7(a)は、上述のように情報提供リンク格納手段102に格納される情報提供リンク情報131a〜131eのデータ構成を例示する図である。図7(a)に示すように、情報提供リンク格納手段102は、利用者ID、コンテンツID、コンテンツをそれぞれ関連付けした情報提供リンク情報131a〜131eを格納・管理している。
図7(b)は、情報評価リンク格納手段103に格納・管理される情報評価リンク情報132a〜132fのデータ構成を示す図である。図7(b)に示すように、評価リンク格納手段103は、利用者ID、コンテンツID、評価情報をそれぞれ関連付けした情報評価リンク情報132a〜132fを格納・管理している。尚、コンテンツIDと情報コンテンツとの対応関係は、上記の図7(a)で示した情報提供リンク格納手段102に格納・管理されている。
【0037】
尚、本形態では、情報取得手段101が直接、利用者端末装置200−1〜mからコンテンツや評価情報を受取り、情報提供リンク情報131a〜131e及び情報評価リンク情報132a〜132fをそれぞれ情報提供リンク格納手段102及び情報評価リンク格納手段103に格納することとした。しかし、情報取得手段101が、既存の電子掲示板システムやWebサーバ装置から情報提供リンク情報131a〜131eと情報評価リンク情報132a〜132fとを抽出する構成としてもよい。例えば、問題解決型コミュニティにおいて、「質問」や「回答」というアクションを「コンテンツの提供」として本発明を適用してもよい。すなわち、電子掲示板上へ書込まれる「質問」や「回答」を「コンテンツ」とし、その書き込みを行った利用者を「コンテンツを提供した利用者」として本発明を適用してもよい。また、「質問」の参照や回答を行った利用者を「コンテンツを評価した利用者」とし、「質問」への参照回数や質問への回答の数等を、「質問」の良さの評価、すなわち「コンテンツに対する評価」として本発明を適用してもよい。また、質問者が「回答」の中から最も有用だった回答を選択する行為等を「質問」の良さの評価、すなわち「コンテンツに対する評価」として本発明を適用してもよい。同様に、商品・サービス評価型コミュニティにおいても、レビュー記事の投稿を「コンテンツ」の「提供」とし、これに対する他の参加者の支持を「コンテンツに対する評価」として本発明を適用してもよい。その他具体例は挙げないが、トピックベースコミュニティやユーザ創造型コミュニティにおいても同様である。尚、これを実現するには、このような既存のコミュニティを構成するWebサーバ装置から情報を収集するロボットを作成する必要があるが、Weサーバ装置から情報を収集する一般的なロボットの作成方法は、文献:Kevin Hemenway, Tara Calishain, “Spidering hacks”、O’Reilly (2003)、に記載されている方法等が利用できる。また、このような実施の形態を取った場合、図7(a)に示す情報提供リンク情報131a〜131eのコンテンツIDとして、そのコンテンツが存在するリソースのURL(Uniform Resource Identifier)を用いてもよい。そして、この場合、情報提供リンク情報131a〜131eにコンテンツの列は不要となる。
【0038】
[スコア計算手段104の処理の詳細]
次に、スコア計算手段104(図1,図3)の処理の詳細について説明する。
まず、スコア計算手段104が各スコアを算出するための原理について説明する。
上記のように情報提供リンク格納手段102及び情報評価リンク格納手段103に格納された情報提供リンク情報131a〜131e及び情報評価リンク情報132a〜132fは、論理的には、例えば、図8に示すような利用者からコンテンツに対する2種類のリンクを示すものと考えることができる。図8において、紙面に向かって左側の丸は利用者、右側の四角はコンテンツを示す。また、この図の破線は、情報提供リンク情報131a〜131eにおける利用者IDに対応する利用者とコンテンツとの関連付け(情報提供リンク)を表している。また、この図の実線は、情報評価リンク情報132a〜132fにおける利用者IDに対応する利用者と、コンテンツIDに対応するコンテンツとの関連付け(情報評価リンク)を表している。また、情報評価リンクに付与されている数値は、情報評価リンク情報132a〜132fにおける評価情報を表すものとする。
【0039】
これらのリンクは、
【数1】
のような利用者i (i=1…m)を行とし、コンテンツj (j=1…n)を列とする隣接行列で表現することができる。すなわち、情報提供リンクは行列C=[cij] (i=1…m, j=1…n)で表現できる。ただし、cijは行列Cのi行j列目の要素を示し、iからjにリンクがあればcij=1、なければcij =0となる。また情報評価リンクは行列E=[eij] (i=1…m, j=1…n)で表現できる。ただし、eijは行列Eのi行j列目の要素を示す。またeij は、報評価リンク情報132a〜132fにおいて、利用者iに対応する利用者IDと、コンテンツjに対応するコンテンツIDとに対応付けられている評価情報の値である。そして、eijの値が大きい程、コンテンツjが利用者iから強い支持を受けていることになる。尚、以下では特に断りがない限り、行列C及び行列Eは、一般化された行列C=[cij] (i=1…m, j=1…n)及びE=[eij] (i=1…m, j=1…n)を意味する。
【0040】
本形態では、2種類のリンクをそれぞれ示す行列C及び行列Eから、情報提供スコアai、情報評価スコアhi及び情報評判スコアrjの3つのスコアを算出する。以下にこれらのスコアの意味と表記方法を述べる。
情報提供スコアai は、利用者i (i=1…m)が、過去、どの程度コミュニティから支持を受けたコンテンツを提供してきたかを示す指標である。このスコアが高ければ高いほど、この利用者は情報の提供の面でコミュニティに貢献する能力があるとみなす。ここで全利用者の情報提供スコアaiを、a=[a1…am]Tと表記し、これを以後、情報提供ベクトルと呼ぶ。ここでMTは行列Mの転置行列である。
【0041】
情報評価スコアhiは、利用者i (i=1…m)が、過去、コミュニティに提供されるコンテンツに対してどの程度コミュニティの方向性に沿った評価情報を投入してきたを示す指標である。このスコアが高ければ高いほど、この利用者は情報評価の投入の面でコミュニティに貢献する能力があるとみなす。ここで全利用者の情報評価スコアhiを、h=[h1…hm]Tと表記し、これを以後、情報評価ベクトルと呼ぶ。
情報評判スコアrjは、コンテンツ j (j=1…n)が、どの程度利用者からの支持を受けているか(i.e. コミュニティの方向性に沿っているか)を示す指標である。このスコアが高ければ高いほど、その情報はコミュニティから支持を受けているものであるとみなす。ここで全コンテンツの情報評判スコアrjを、r=[r1…rn]Tと表記し、これを以後、情報評判ベクトルと呼ぶ。
【0042】
利用者の情報提供スコアと、情報評価スコアと、コンテンツの情報評判スコアとは、以下のルールにより相互に影響を及ぼしあう。
(1)情報提供スコアの高い利用者が提供するコンテンツは高い情報評判スコアを持つコンテンツである。
(2)情報評価スコアの高い利用者が評価したコンテンツは高い情報評判スコアを持つコンテンツである。
(3)情報評判スコアが高いコンテンツを提供した利用者は高い情報提供スコアを持つ利用者である。
【0043】
(4)情報評判スコアが高いコンテンツを評価した利用者は高い情報評価スコアを持つ利用者である。
本形態では、これら4つのルールに対応して、
r=CTa …(1)
r=ETh …(2)
a=Cr …(3)
h=Er …(4)
の4つの数学的な関係を定義する。ただし、式(1)と式(2)を両立させるため、式(1)と式(2)を凸結合(convex combination)により統合して、
r=αCTa+(1‐α)ETh …(5)
を利用する。ここで、αは[0,1]を定義域とする実数であり、コミュニティの特性に応じて調整されるものとする。つまり、αが1に近い程、情報提供リンクを重視し、0に近い程、情報評価リンクを重視して情報評判スコアが算出されることとなる。
【0044】
上記、式(5)に、式(3)と式(4)を代入すると、
r=αCTCr +(1‐α)ET Er
= (αCT C +(1‐α)ET E) r …(6)
を得る。(αCTC +(1‐α)ET E)は、n×nの正方行列であり、これをスコア推移行列S(「情報提供リンク情報と情報評価リンク情報と何れかのスコアとの定義された関係を示すスコア推移行列」に相当)と呼ぶことにすると、
r=Sr …(7)
となる。上記式(7)を満たすrは一般的には存在しないが、線形代数学の基礎理論によると、Sの要素が非負の実数の場合には、
λr=Sr …(8)
を満たす実数ベクトルrは存在する。ただし、λは定数であってSの固有値と呼ばれ、rはSの固有ベクトルと呼ばれる。これらの固有値と固有ベクトルを算出する具体的な方法の一例は後で述べるが、こうしてr(情報評判ベクトル)が算出できれば、式(3)及び式(4)により(「各スコア間の定義された関係」に相当)、a(情報提供ベクトル), h(情報評価ベクトル)がそれぞれ算出できる。
【0045】
尚、行列Eの要素eijは正規化していないため、ある特定の人が多くの情報に評価を入力すると、非常に高い情報評価スコアとなるという問題がある。このような行為を防止するためには、PageRankと同様に、利用者一人が提供する評価情報の値の総和が1になるように、行列Eを正規化することとしてもよい。つまり、行列Eの行ベクトルの要素の総和が1となるように行列Eを正規化し、正規化した行列を用いてスコアの算出を行うこととしてもよい。具体的には、次のような行列E'を生成、用いればよい。
E’=[e’ij](i=1…m, j=1...n)
e’ij= eij/Σj=1..n (eij)
同様に、行列Cの行ベクトルの要素の総和が1となるような正規化を行い、この正規化後の行列Cを用いて各スコアを算出することとしてもよい。尚、行列CやEの行ベクトルの要素の総和が1以外の値となるように正規化してもよい。また、これらの正規化は必須ではなく、用途によってはこのような正規化を行わずにスコアを算出することとしてもよい。
【0046】
スコア計算手段104は、上記のような考え方に基づき、行列CとEとからr(情報評判ベクトル)、a(情報提供ベクトル), h(情報評価ベクトル)を算出し、安定した値の情報提供スコアai、情報評価スコアhi及び情報評判スコアrjを算出する。
図9は、スコア計算手段104の処理を説明するためのフローを例示した図である。以下、この図に沿ってスコア計算手段104の処理を説明する。尚、以下では、行列CやEの行ベクトルの要素の総和が1になるように行列C,Eを正規化してスコアを求めることとする。
【0047】
まず、スコア計算手段104の第1隣接行列生成手段104aが行列Cを生成し、第2隣接行列生成手段104bが行列Eを生成する(ステップS11)。
この例の場合、まず、第1隣接行列生成手段104aが、情報提供リンク格納手段102に格納された情報提供リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報提供リンク情報の個数を数える。そして、第1隣接行列生成手段104aは、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)である行列Cを生成して一時メモリ111に出力し、そこに格納する。例えば、図7(a)の例の場合、(利用者ID,コンテンツID)が(A0001,C0001),(A0001,C0002),(A0002,C0003),(A0002,C0004),(A0003,C0005)である情報提供リンク情報はそれぞれ1個ずつ存在する。また、これらの利用者IDとコンテンツIDとの組合せに対応する行列成分(行,列)をそれぞれ(1,1),(1,2),(2,3),(2,4),(3,5)とすると、第1隣接行列生成手段104aは、
【数2】
を生成することになる。
【0048】
次に、第2隣接行列生成手段104bが、情報評価リンク格納手段103に格納された情報評価リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報評価リンク情報の評価情報の値を加算する。そして、情報評価リンク格納手段103は、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)である行列Eを生成して一時メモリ111に出力し、そこに格納する。例えば、図7(b)の例の場合、(利用者ID,コンテンツID,評価情報)が(A0001,C0003,+2),(A0001,C0004,+3),(A0002,C0001,+2),(A0002,C0002,+1),(A0002,C0005,+1),(A0003,C0004,+3)である情報評価リンク情報はそれぞれ1個ずつ存在する。また、これらの利用者IDとコンテンツIDとの組合せに対応する行列成分(行,列)をそれぞれ(1,3),(1,4),(2,1),(2,2),(2,5),(3,4)とすると、第2隣接行列生成手段104bは、
【数3】
を生成する。
尚、行列C,E生成の際、第1隣接行列生成手段104a或いは第2隣接行列生成手段104bは、各利用者ID及びコンテンツIDの情報も一時メモリ111に格納しておく。
【0049】
行列C,Eが生成されると、次に固有ベクトル算出手段は、これらからスコア推移行列S(情報提供リンク隣接行列と情報評価リンク隣接行列と何れかのスコアとの関係を示す行列)の固有ベクトルrを算出し、この固有ベクトルrの要素を情報評判スコアrjとして出力する。この例の場合、まず、固有ベクトル算出手段104cは、一時メモリ111から行列C,Eを読み込む。そして、第1正規化手段104ca及び第2正規化手段104cbにおいて、同一利用者による多数の提供(多数の記事の投稿等)や、同一利用者による多数の評価(多数の記事のコメント等)によって、その利用者の情報提供スコアや情報評価スコアを高められないようにするため、行列C,Eを正規化し、正規化後の行列C,Eを一時メモリ111に格納する(ステップS12)。この例の場合、第1正規化手段104caにおいて、行列C(情報提供リンク隣接行列)の各要素を、それぞれの利用者IDに対応する要素の集合毎に(すなわち行毎に)、「情報提供リンク格納手段102において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数(正規化関数1)」によって正規化し、当該正規化された行列Cを出力する。また、この例の第2正規化手段104cbにおいて、行列E(情報評価リンク隣接行列)の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報評価リンク格納手段103において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数(正規化関数2)」によって正規化し、当該正規化された行列Eを出力する。尚、例えば、上述の正規化関数1をcij/Σj=1..n (cij)とし、正規化関数1をeij/Σj=1..n (eij)とした場合、式(9)(10)の行列C,Eはそれぞれ、
【数4】
のように正規化される。尚、これは一例であり、行列CとEの正規化は必須でなく、あえてこのような正規化を省略してもよいし、別の正規化方法を利用してもよい(他の正規化方法の例については後述する)。
【0050】
次に固有ベクトル算出手段104cの演算手段104ccにおいて、一時メモリ111に格納された正規化後の行列C,Eを読み込み、読み込みた行列CとEから行列S=(αCT C +(1‐α)ET E)を計算し、これを一時メモリ111に格納する。尚、この行列Sをスコア推移行列と呼ぶ(ステップS13)。式(11)に示す行列CとEからα=0.3として生成したスコア推移行列Sの例を以下に示す。
【数5】
【0051】
次に演算手段104ccは、一時メモリ111からスコア推移行列Sを読み込み、その固有ベクトルrを算出し、この固有ベクトルrの要素を情報評判スコアrjとして一時メモリ111に格納する(ステップS14)。固有ベクトルの算出方法については、ベキ乗法による反復計算法、QR分解法、直接法など多くの手法が適用可能である。以下に、ベキ乗法による反復計算法を用いて算出した式(12)のスコア推移行列Sに対する固有ベクトルを示す。
【数6】
この例では、情報評判スコアr3=0.25926,r4=0.96581となる。尚、固有ベクトルは固有値の数だけ存在するが、本形態では、例えば、固有値最大の固有ベクトル(principal eigenvector)を用いる。
【0052】
次に、スコア算出手段104dにおいて、行列C又は行列Eと固有ベクトルrとを、これらと何れかのスコアa,hとの定義された関係を示す関係式に代入し、当該スコアa,hを算出して一時メモリ111に出力し、そこに格納する(ステップS15)。具体的には、例えば、スコア算出手段104dは、一時メモリ111から、行列Cと行列Eと固有ベクトルrとを読み込み、これらに式(3)及び式(4)を適用することで、スコアa、hを算出し、これらの要素を情報提供スコアai及び情報評価スコアhiとして一時メモリ111に格納する。以下に、式(11)の行列C及び行列Eと式(13)の固有ベクトルrとを用い、式(3)及び式(4)によって算出した情報提供スコアベクトルaと情報評価スコアベクトルhを示す。
【数7】
この例では、情報提供スコアa2=0.61253、情報評価スコアh1=0.68319,h3=0.96581となる。
次に、書き込み手段104eにおいて、上述の情報評判スコアrj、情報提供スコアai及び情報評価スコアhiと、各利用者ID及びコンテンツIDとを、一時メモリ111から読み込む。そして、書き込み手段104eは、情報評判スコアrj(141b)を対応するコンテンツID(141a)に関連付けて(図10(a))情報評判スコア格納手段105に格納する。また、書き込み手段104eは、情報提供スコアai(142b)及び情報評価スコアhi(142c)を対応する利用者ID(142a)に関連付けて(図10(b))、情報提供スコア格納手段106及び情報評価スコア格納手段107にそれぞれ格納する(ステップS16)。
【0053】
[スコア出力手段108の処理の詳細]
次に、スコア出力手段108(図1,図4)の処理の詳細について説明する。
図11は、スコア出力手段108の処理の詳細を説明するためのフローを示す図である。以下、この図に従ってスコア出力手段108の処理の詳細を説明する。
スコア出力手段108は、上記のステップにより算出格納された情報評判スコア、情報提供スコア、情報評価スコアを利用者端末からの要求に応じて検索して返す手段である。この処理を行う場合、まず、スコア出力手段108の受信手段108aは、利用者端末装置200−1〜mから送信された、コンテンツIDを含む情報評判スコア取得メッセージ或いは利用者IDを含む情報提供スコア・情報評価スコア取得メッセージを、ネットワーク300を通じて受信する(ステップS21)。受信されたメッセージは、一時メモリ111に格納される。
【0054】
次にメッセージ判定手段108bは、一時メモリ111からステップS21で受信されたメッセージを読み込み、そのヘッダ情報等により、このメッセージが、情報評判スコア取得メッセージか情報提供スコア・情報評価スコア取得メッセージかを判定する(ステップS22)。その判定結果は制御手段110に送られる。
ここでステップS21で情報評判スコア取得メッセージが受信されたと判断された場合には、制御手段110は、スコア検索手段108cに情報評判スコアの検索指示を与える。これを受けたスコア検索手段108cは、一時メモリ111に格納されている情報評判スコア取得メッセージのコンテンツIDをキーとして、情報評判スコア格納手段105を検索し、このコンテンツIDに対応する情報評判スコア(図10(a))を抽出する(ステップS23)。尚、抽出された情報評判スコアは一時メモリ111に格納される。
【0055】
一方、ステップS21で情報提供スコア・情報評価スコア取得メッセージが受信されたと判断された場合には、制御手段110は、情報提供スコア及び情報評価スコアの検索指示を与える。これを受けたスコア検索手段108cは、一時メモリ111に格納されている情報提供スコア・情報評価スコア取得メッセージの利用者IDをキーとして、情報提供スコア格納手段106及び情報評価スコア格納手段107を検索し、この利用者IDに対応する情報提供スコア及び情報評価スコア(図10(b))を抽出する(ステップS24)。尚、抽出された情報提供スコア及び情報評価スコアは一時メモリ111に格納される。
【0056】
次に、メッセージ生成手段108dにおいて、一時メモリ111から上記ステップS23やS24で取得されたスコアと、対応するコンテンツIDや利用者IDとを読み出し、それらの情報を例えば、コンテンツIDや利用者ID別に振り分けたり、スコアの大きい順序で並び替えたりしたメッセージを生成する(ステップS25)。生成されたメッセージは、一時メモリ111に格納され、さらに送信手段108eによって読み込まれ、ネットワーク300を通じて利用者端末装置200−1〜mに送信される(ステップS26)。
【0057】
このように各スコアを利用者に提供することにより、利用者は、コミュニティ中の大量の情報の中からコミュニティにとって有益な情報を取得することや、当該有益な情報のランキングを取得することが可能となる。
<変形例等>
尚、本発明は上述の実施の形態に限定されるものではない。例えば、また、上述の各種の処理は、上述した記載に従った時系列で実行されるのみならず、処理を実行する装置の処理能力或いは必要に応じて並列的に或いは個別に実行されてもよい。
【0058】
また、例えば、図9で示したステップS11からステップS16の計算手順は、図12(a)による反復計算を行うことでも全く同様に計算できる。この場合には、r、a、hが反復により同時に計算されるため、ステップS13からステップS15が統合された形態で実施される。この計算手順は、行列の要素表現で表すと、図12(b)のようにも表現することできる。ここで、prov(j)はコンテンツjを提供した利用者(prov(j)∈{1…m})、eval(j)はコンテンツjを評価している利用者の集合(eval(j)∈{1…m})、prov(i)は利用者iが提供したコンテンツの集合(prov(i)∈{1…n})、eval(i)は利用者iが評価したコンテンツの集合(eval(i)∈{1…n})である。これらの情報は、図1に示す情報提供リンク格納手段102及び情報評価リンク格納手段103から利用者ID或いはコンテンツIDを利用して検索することにより容易に抽出することが可能である。尚、図12(b)において||x||1及び||x||2はベクトルxのノルムを表し、||x||1はx の要素の絶対値の和、||x||2はx の要素の2乗の和の平方根(ユークリッドノルム)を表す。このように本発明では、スコアの算出に固有ベクトルを用いることとしたため、反復アルゴリズムを適用し、簡単にこれらのスコアが算出することが可能とである。
【0059】
図13は、図12のアルゴリズムによってr、a、hを算出する場合の処理を説明するためのフローを例示した図である。尚、図13ではベクトルを示す矢印を省略してある。図13の処理の場合、まず、ステップS11と同様に、第1隣接行列生成手段104a及び第2隣接行列生成手段104bにおいて、行列C,Eを生成し(ステップS31)、これらを第1正規化手段104ca及び第2正規化手段104cbにおいて正規化して一時メモリ111に格納する(ステップS32)。また、演算手段104ccにおいて、ベクトルa(0)=(1,...,1)T, ベクトルh(0)=(1,...,1)T,変数k=0とし、これらを一時メモリ111に格納する(ステップS33)。次に、演算手段104ccにおいて、一時メモリ111から正規化後の行列C,Eとベクトルa(k), h(k)とを読み込み、ベクトルr(k+1)=αCTa(k)+(1‐α)ETh(k)を算出し、一時メモリ111に格納する(ステッS34)。尚、αは前述のように予め定めておく。次に、演算手段104ccにおいて、一時メモリ111からベクトルr(k+1)を読み込み、図12(b)に示したようにこれを正規化して一時メモリ111に格納する(ステップS35)。次に、スコア算出手段104dにおいて、一時メモリ111から正規化後の行列C,Eとベクトルh(k+1)とを読み込み、ベクトルa(k+1)=C・r(k+1)及びh(k+1)=E・r(k+1)を算出し、ベクトルa(k+1),h(k+1)を一時メモリ111に格納する(ステップS36)。次に、制御手段110において、一時メモリ111からベクトルr(k),r(k+1)を読み込み、全てのj∈{1…n}についてrj(k)‐rj(k+1)<δが成り立つか否かを判断する(ステップS37)。尚、rj(k)はベクトルr(k)のj番目の要素を示し、rj(k+1)はベクトルr(k+1)のj番目の要素を示す。また、δは予め設定された十分小さい定数とする。ここで、rj(k)‐rj(k+1)<δでなかった場合には、制御手段110は演算手段104ccに指示を与える。これをトリガに演算手段104ccは、一時メモリ111から変数kを読み込み、k+1を演算し、その演算結果を新たなkとして一時メモリ111に格納する(ステップS38)。そして、制御手段110は処理をステップS34に戻す。一方、ステップS37の判断でrj(k)‐rj(k+1)<δと判断された場合には、制御手段110は書き込み手段104eに指示を与える。これをトリガに書き込み手段104eは、一時メモリ111からベクトルrj(k+1),a(k+1),h(k+1)を読み込み、これらの各要素をそれぞれ情報評判スコア、情報提供スコア及び情報評価スコアとして前述のように情報評判スコア格納手段105、情報提供スコア格納手段106及び情報評価スコア格納手段107に格納する(ステップS39)。
【0060】
また、上述の本形態を情報評価リンク情報が単調増加するコミュニティに適用した場合、このコミュニティで活動する期間が長い利用者ほど、その新しい活動(コンテンツの提供や評価)がスコアに与える影響が小さくなってしまう。これは、その利用者の過去の活動により作られた大量の情報評価リンク情報による影響と、前述の第2正規化手段104cb(図3)における正規化手法の影響によるものである。このような事態は、その参加者の活動を行うインセンティブを低下させる等の問題がある。よって、このような場合には、行列E(情報評価リンク隣接行列)に対し、これらの各要素が時間の経過に伴って小さくなるような正規化を行うことが有効である。具体的には、例えば、第2正規化手段104cb(図3)において、一時メモリ111から行列Eの各要素を読み込み、次式のような時間減衰のファクターを導入して行列Eを正規化し、一時メモリ111に格納する。そして、この時刻tにおける行列E(t)を本形態の行列E(正規化後の情報評価リンク隣接行列)として用いる。
【0061】
【数8】
ただし、tは現在時刻、time(eij)はeijが入力された時刻、ρは[0,1]を定義域とする減衰定数である。またeij(t)は現在時刻tにおける行列E(t)のi行j列目の要素である。尚、この場合、第2正規化手段104cb(図3)は、例えば、情報評価装置100内の図示していない内部時計等から出力される情報を現在時刻tとして用いる。さらに、この場合、情報取得手段101が情報評価リンク格納手段103に情報評価リンク情報を格納する際、その受信時間や格納時間等を各情報評価リンク情報に関連付けて格納しておく。そして、第2正規化手段104cb(図3)は、例えば、この情報評価リンク格納手段103に格納された受信時間や格納時間等を、それに関連付けられている情報評価リンク情報に対応するtime(eij)として利用する。
【0062】
また、本形態では、上述の式(1)〜式(4)を用いて式(6)のような変形を行い、(αCT C +(1‐α)ET E)をスコア推移行列Sとしてその固有ベクトルrを求め、さらに式(3)及び式(4)によりベクトルa,hを求めることとした。しかし、上述の式(1)〜式(4)を用い、
a=Cr=(CET)h=(CETE)r=(CETECT)a …(15)
或いは
h=Er=(ECT)a=(ECTC)r=(ECTCET)h …(16)
のような変形を行い、これらの式からスコア推移行列をS= CETECT或いはS= ECTCETとおいてもよい。この場合、演算手段104cc(図3)が算出するのは、固有ベクトルa或いはhであり、スコア算出手段104dが式(1)〜(4)を用いて算出するのは、ベクトルh,r或いはa,rとなる。尚、この場合の処理の詳細は、スコア推移行列が異なる点と、スコア算出手段104dが用いる式及びベクトルの種類が異なる点を除いて上述の実施の形態と同様である。もちろん、この場合に、図12による反復計算の変形を用いてもよいことはいうまでもない。
【0063】
また、上述の実施の形態では、情報評判スコア、情報提供スコア及び情報評価スコアの3つのスコアを算出することとした。しかし、これらのスコアの一部のみを算出する構成としてもよい。
さらに、本形態では、スコア出力手段108において、情報評判スコア取得メッセージ及び情報提供スコア・情報評価スコア取得メッセージの2種類のメッセージを受け付ける構成とした。しかし、用途によっては、スコア出力手段108が情報提供スコア・情報評価スコア取得メッセージを受け付けないこととし、上記のステップS24(図11)の処理を実行しない構成としてもよい。
【0064】
〔第2の実施の形態〕
次に、本発明における第2の実施の形態について説明する。
<原理>
既に述べたように、本発明の情報評価装置は、問題解決型コミュニティ、商品・サービス評価型コミュニティ等の特定のコミュニティに対して適用することが可能である。しかし、これに留まらず、インターネット上の動画、画像、音楽、ニュース等の様々なコンテンツ検索システムにおける検索結果のランキング表示に本発明を適用することもできる。本形態は、このようなコンテンツ検索システムに本発明を適用した例である。尚、本形態では、blog(ブログ)記事をコンテンツの具体例とし、blog記事検索システムとして本コンテンツ検索システムを利用する場合を説明する。
【0065】
本形態では、blog記事(コンテンツ)を以下のような構造上の特徴を有するものとする。尚、本形態の手法ではblog記事の内容には関与しない。
(a)個人を編集主体とし、個人単位にトップページ(blogサイトトップ)を有する。
(b)トップページから各記事(blogエントリ)へのリンクを有し、各記事はURI(Uniform Resource Identifier)を有する。
(c)双方向リンクを生成するためのメカニズム(トラックバック)が提供されている。
【0066】
このようなblog記事に対して、本発明を適用するためには、収集したblog記事の集合から情報提供リンク情報と、情報評価リンク情報とを抽出する必要がある。このためには、まず情報提供者と情報評価者の利用者IDを取得できなくてはならない。ここで、blog記事の場合には、上記のように編集主体が個人であり、またblogのホスティングサービス毎に各blog記事のトップページのURIの形式がほぼ決まっている。そこで本形態では、利用者IDとしてblogサイトトップのURIを用いる。また、blogのシステムでは、基本的に、各blog記事のエントリに永続的なURIが付与される。よって、本形態では、blog記事に付与されたURIをコンテンツIDとして用いることにする。このようにすることにより、情報提供リンク情報は、blogサイトトップのURI(利用者ID)と、その配下にあるblog記事エン卜リのURI(コンテンツID)との2つ組を含む集合として生成できる。
【0067】
同様に情報評価リンク情報についでも、blogサイトトップのURI(利用者ID)と、その配下にある各記事に含まれるリンク先である外部のblog記事URI(コンテンツID)との2つ組を含む集合として生成できる。これは、「あるblogger(利用者)iのblog記事から外部のblog記事jに対してリンクが存在する」ということが「このblogger(利用者)iが、blog記事j(コンテンツ)に対して関心がある」と考えられるからである。この場合、リンクの有無により、eij=1(リンク有り)或いはeij=0(リンク無し)とすることで、情報評価リンク情報に対応する行列E(情報評価リンク隣接行列)を生成することができる。ただし、blogでは、トラックバック機能により、リンクされたblog記事に、自動的にそのリンク元のblog記事への逆リンクが生成される。即ち、自動的に相互リンクが形成される。その結果、本来関心がもたれないblog記事に対しても、トラックバックされる側のblog記事からトラックバックする側のblog記事への逆向きのリンク(トラックバックリンク)が張られる。その結果、関心を持たれない記事に対して多くの被リンクが張られる、いわゆるトラックバックスパムという攻撃が存在する。そこで本形態では、トラックバックする側からトラックバックされる側へのリンク(すなわち通常のリンク)は情報評価リンク情報の生成に用いるが、トラックバックリンクは情報評価リンク情報の生成に用いない。尚、もちろん、トラックバックに依らない一般のblog記事間のリンクは情報評価リンク情報の生成に用いる。
【0068】
また、第1の実施の形態では、利用者一人が提供するコンテンツ数や評価情報の値の総和が1になるように行列C,Eを正規化する手法を例示した。しかし、blogスペースにおいては、数千のblog記事を書く人もいる一方、数件のblog記事を書いてやめてしまう人も多い。このような様々なblogger(利用者)全てに対し、利用者一人が提供するコンテンツ数や評価情報の値の総和が1になるように行列C,Eを正規化すると、blog記事の提供が少ない利用者のblog記事に対してリンクが張られた場合に、そのリンク情報を元に算出された情報提供スコアが非常に高い値となってしまう。利用者の情報提供能力が本当に高い場合にはこれでもよいが、情報提供スコアが運によって左右されすいという問題がある。−方、正規化を行わない場合、すなわち、例えば、blog記事の追加に伴い単純に行列C(情報提供リンク隣接行列)の要素cijに1を追加し、blog記事間のリンクの追加に伴い単純に行列E(情報評価リンク隣接行列)の要素eijに1を追加した場合には、利用者がたくさんの記事を書くことにより、故意にスコアを上げることができるという問題がある。
【0069】
そこで、本形態では、blog記事の投稿数やリンク数に応じて計算される値を用い、中間レベルの正規化を実施することで、この問題を解決する。具体的には、例えば以下のように、コンテンツや評価の投稿数の平方根(Sqrt)の重みで利用者一人当たりの投稿数を正規化する。
C'=[c'ij](i=1,...,m,j=1,...,n)
c'ij=sqrt(Σj=1...n(cij))×cij/Σj=1...n(cij)=cij/sqrt(Σj=1...n(cij)) …(17)
E'=[e'ij](i=1,...,m,j=1,...,n)
e'ij=sqrt(Σj=1...n(eij))×eij/Σj=1...n(eij)=eij/sqrt(Σj=1...n(eij)) …(18)
上記のSqrt関数による正規化は、blog記事へ本発明を適用する場合には、特に有効であることが経験的に知られている。しかし、本発明を、他のコミュニティ、例えば電子掲示板システム(BBS)に適用する場合、以下のように自然対数(ln)関数を用いて正規化を行うとよい結果が得られることがある。
【0070】
C'=[c'ij](i=1,...,m,j=1,...,n)
c'ij=ln(Σj=1...n(cij))×cij/Σj=1...n(cij) …(19)
E'=[e'ij](i=1,...,m,j=1,...,n)
e'ij=ln(Σj=1...n(eij))×eij/Σj=1...n(eij) …(20)
<構成>
次に、上記で述べた考え方に基づき、本発明の情報評価装置をblog記事の検索に適用したコンテンツ検索システムの構成を説明する。尚、以下では第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
【0071】
図14は、本形態におけるコンテンツ検索システム1の構成を示す図である。
図14に例示するように、この例のコンテンツ検索システム1は、blog記事の提供やコンテンツ情報の収集を行う利用者i=1,...,pが利用する利用者端末装置500−1〜p、blog記事が格納されるコンテンツサーバ装置600−1〜q、コンテンツサーバ装置600−1〜qから送信されるコンテンツの更新情報を配信するPINGサーバ(Weblog Updates Ping サーバ)装置700及びコンテンツ検索装置1000を有しており、これらはインターネット等のネットワークを通じて接続されている。また、コンテンツ検索装置1000は、インターネット上で公開されているコンテンツ(ここでは、blog記事、blog entryとも呼ぶ)情報をコンテンツサーバ装置600−1〜qから収集するコンテンツ情報収集手段1100と、収集されたコンテンツ情報を蓄積格納するコンテンツ情報格納手段1200と、−定時間間隔或いは、一定数のコンテンツ情報が収集されるたびに、コンテンツ情報格納手段から情報提供リンク情報と情報評価リンク情報を抽出し、各スコアを算出する情報評価装置1300と、利用者端末装置500−1〜pからネットワーク300を介して検索語を受け取り、コンテンツ情報格納手段1200に記録されているコンテンツのデータセットからキーワードに−致するコンテンツ情報を検索し、検索結果を利用者端末装置500−1〜pに返送するコンテンツ情報検索手段1400と、一時メモリ1010と、制御手段1020と、内部時計1030とから構成されている。尚、第1の実施の形態と同様、コンテンツサーバ装置600−1〜q、PINGサーバ装置700及びコンテンツ検索装置1000は、公知のコンピュータに所定のプログラムを実行させることにより構成されるものである。
【0072】
図15は、図14のコンテンツ情報収集手段1100の詳細構成を例示した図である。
この図に例示するように、この例のコンテンツ情報収集手段1100は、通信手段1110、更新情報読み込み手段1120、コンテンツ情報読み込み手段1130及びコンテンツ情報解析手段1140を有している。尚、図15における矢印はデータの流れを示しているが、制御手段1020及び内部時計1030に入出力されるデータの流れの記載は省略してある。
図16は、図14の情報評価装置1300の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0073】
この図に例示するように、この例の情報評価装置1300は、情報取得手段1301、情報提供リンク格納手段102、情報評価リンク格納手段103及びスコア計算手段104を有している。尚、図16における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図17は、図16の情報取得手段1301の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0074】
この図に例示するように、この例の情報取得手段1301は、読み込み手段1301a、情報提供リンク生成手段101e、情報評価リンク生成手段101f及び書き込み手段101gを有している。尚、図17における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図18は、図16におけるスコア計算手段104の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0075】
この図に例示するように、この例のスコア計算手段104は、第1隣接行列生成手段104a、第2隣接行列生成手段104b、固有ベクトル算出手段104c、スコア算出手段104d及び書き込み手段104eを有している。また、固有ベクトル算出手段104cは、第1正規化手段104ca、第2正規化手段104cb及び演算手段104ccを有している。尚、図18における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図19は、図14におけるコンテンツ情報検索手段1400の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0076】
この図に例示するように、この例のコンテンツ情報検索手段1400は、受信手段1410、コンテンツ情報検索手段1420、コンテンツ情報提供リスト生成手段1430及び送信手段1440を有している。
<動作>
次に、本形態のコンテンツ検索装置1000の動作を説明する。
[概要]
本形態のコンテンツ検索システム900は、コンテンツサーバ装置600−1〜pに格納されたコンテンツに関する情報を前述のスコアを利用して加工し、提供するシステムである。この情報提供を行う場合、まず、コンテンツ検索装置1000のコンテンツ情報収集手段1100において、コンテンツサーバ装置600−1〜pに格納されているblog記事(コンテンツ)の情報を収集し、コンテンツ情報格納手段1200に格納する。そして、情報評価装置1300において、第1の実施の形態と同様にコンテンツ情報格納手段1200に格納されたコンテンツ情報から各スコアを算出し、これをコンテンツ情報に関連付けてコンテンツ情報格納手段1200に格納する。そして、コンテンツ情報検索手段1400が、利用者端末装置500−1〜pから送られた検索条件に従ってコンテンツ情報格納手段1200に格納された情報を検索し、その検索結果を利用者端末装置500−1〜pに返す。尚、コンテンツ検索装置1000の各処理は、制御手段1020の制御のもと実行される。
【0077】
[スコア算出処理の詳細]
図20は、本形態のコンテンツ検索装置1000で行われるスコア算出処理を説明するためのフローを示した図である。以下、図20に沿ってこの処理を説明する。
まず、制御手段1020は、内部時計1030を参照し、前回更新情報の読み込みを行ってから所定の時間が経過したか否かを判断する(ステップS101)。ここで、所定の時間が経過したと判断された場合、制御手段1020は、更新情報読み込み手段1120に指示を与え、更新情報読み込み手段1120は、通信手段1110及びネットワーク300を通じてPINGサーバ装置700から更新情報を読み込んで一時メモリ1010に格納する(S102)。ここで更新情報としては、例えば、PINGサーバ装置700で公開されるChanges.Xmlフォーマットやblogホスティングサービス等で公開されるblog記事のサマリ情報(RSS(Rich Site Summary))等を例示できる。
【0078】
次に、制御手段110は、一時メモリ1010に格納された更新情報を読み込み、これを用いて何れかのコンテンツサーバ装置600−1〜qに格納されたコンテンツ(blog記事)が更新されたか否かを判定する(ステップS103)。ここでコンテンツの更新がないと判断された場合には、制御手段110は、処理をステップS101に戻す。一方、コンテンツの更新があると判断された場合には、制御手段110は、コンテンツ情報読み込み手段1130に指示を与え、コンテンツ情報読み込み手段1130は、通信手段1110(コンテンツ情報受信手段)及びネットワーク300を通じ、コンテンツサーバ装置600−1〜qから更新されたコンテンツに関する情報を取得し、一時メモリ1010に格納する。尚、コンテンツサーバ装置(blogサイト等)600−1〜qを巡回(crawling)して記事を収集する方法・プログラムコードについては、例えば、文献「宮川達彦、伊藤直也著「BIog Hacks」、オライリー・ジャパン」に詳しく記載されている。
【0079】
図22は、このように一時メモリ1010に格納されたコンテンツに関する情報であるブログ情報1500を例示した概念図である。尚、図22では、一人のblogger(利用者)に関するブログ情報のみを図示するが、実際はこれ以上のloggerに関するブログ情報が収集される。
この図に例示するように、この例のブログ情報1500は、blogサイトトップのURIであるサイトトップURI1510、blogサイトトップの記事1511、コンテンツ1520,1530を有する。また、コンテンツ1520,1530は、それぞれ、それが位置するリソースのURIであるブログURI1521、そのコンテンツ1520,1530を投稿した利用者の意思で設定したリンク先である通常リンクURI1522,1532、記事1523,1533、及びトラックバック機能に基づく逆リンク先であるトラックバックURI1524,1525,1534,1535,1536を有している。
【0080】
コンテンツ情報解析手段1140は、一時メモリ1010からこのようなコンテンツの情報を読み込み、これを解析して図23に例示するような情報をコンテンツ情報リスト1600として抽出し、これをDBMS等のテープルとしてコンテンツ情報格納手段1200に格納する。ここで、DocIDは、コンテンツ情報収集手段1100によって収集されたblog記事等のコンテンツに付与されるユニークなIDを格納するカラムである。また、URIは、コンテンツが公開されているリソースのURI(ブログURI1521,1531等)を格納するカラムである。ただし、コンテンツがblogサイトトップである場合には、そのURI(サイトトップURI1510等)がURIのカラムに格納される。keywordsは、収集されたblog記事(記事1511,1523,1533等)に対して形態素解析を施し、抽出された単語を格納するカラムである。また、blog−URIは、blog記事の属するblogサイトトップのURI(サイトトップURI1510等)を格納するカラムである。ただし、コンテンツがblogサイトトップ自身の場合には<nil>を格納する。また、Refer−URIは、blog記事の本文内で−般リンクとして参照している他のblog記事のURI(通常リンクURI1522,1532等)を格納するカラムである。ただし、−般リンクとして他のblog記事を参照していないコンテンツに対しては<nil>を格納し、複数のリンクを持つ場合には、複数のリンク先のURIを格納する。尚、図23の例では、トラックバックとして参照されているURI(トラックバックURI1524,1525,1534,1535,1536等)は格納しない。また、Dateは、巡回してblog記事を取得した日時を格納するカラムである。尚、blog記事を取得した日時は、例えば内部時計1030から出力される日時情報を用いる。Scoreは、後で述べるように情報評価装置1300によって計算されたスコアを格納するカラムである。ただし、コンテンツがblogサイトトップの場合には、そのblogger(利用者)に対する情報提供スコアを、コンテンツがblog記事の場合には、その記事の情報評判スコアを格納する。尚、情報評価スコアは、本形態では使用しない。また、既に述べたように、本システムでは、blogサイトトップのURI(blog−URIのカラムのURI)を利用者IDとして利用する。また、URI及びrefer−URIのカラムのURIをコンテンツIDとして利用する。また、blog−URIのカラムのデータは、請求項中の「コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報」に相当し、URIのカラムのデータは請求項中の「当該コンテンツのアドレスを示すコンテンツアドレス情報」に相当し、refer−URIのカラムのデータは、「他のコンテンツのアドレスを示すポインタ情報とを含む情報」に相当する。また、コンテンツ情報リスト1600のURIカラム、keywordsカラム、blog−URIカラム及びrefer−URIカラムのデータが請求項の「コンテンツ情報」に相当する。
【0081】
その後、制御手段1020において、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されたか否かを判断する(ステップS106)。ここで、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されていないと判断された場合、制御手段1020はその処理をステップS101に戻す。一方、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されたと判断された場合には、情報評価装置1300において、情報提供リンク情報と情報評価リンク情報とを生成する。そして、情報評価装置1300は、それらからスコアを算出し、コンテンツ情報に関連付けてコンテンツ情報格納手段1200に格納する(ステップS107)。尚、−定期間が経過したことを契機としてステップS107を実行することとしてよい。
【0082】
[ステップS107の詳細]
まず、情報取得手段1301において、コンテンツ情報格納手段1200に格納されているblog−URIとURIのカラムの要素(コンテンツ情報)を抽出し、これを用いて、図24(a)に記載されるような利用者IDとコンテンツIDの2つ組みが関連付けられた情報提供リンク情報1611〜1615を生成し、情報提供リンク格納手段102に格納する。また、情報取得手段1301において、コンテンツ情報格納手段1200に格納されているblog−URIとrefer−URIのカラムの要素(コンテンツ情報)を抽出し、これを用いて、図24(b)に記載されるような利用者IDとコンテンツIDと評価情報との3つ組みが関連付けられた情報評価リンク情報1621〜1626を生成し、情報評価リンク格納手段103に格納する。
【0083】
図21は、これらの情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明するためのフローを示した図である。以下この図に従って、情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明する。
まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS111)。具体的には、例えば、スコアを算出するコンテンツ情報リスト1600の先頭のDocIDをvに代入する。
次に、読み込み手段1301aにおいて、コンテンツ情報格納手段1200からv行目のコンテンツ情報(図23参照)を読み込み、一時メモリ1010に格納する。そして、情報提供リンク生成手段101eにおいて、一時メモリ1010から、v行目のblog−URIのカラムのデータ(コンテンツ提供者情報)を利用者IDとし、v行目のURIのカラムのデータ(コンテンツアドレス情報)をコンテンツIDとして読み込む。そして、情報提供リンク生成手段101eは、これらが関連付けられた情報提供リンク情報を生成し(ステップS112)、一時メモリ1010に格納する。尚、blog−URIのカラムのデータが<nil>である場合には、その行に対する情報提供リンク情報は生成しない。そして、書き込み手段101gは、一時メモリ1010からこの情報提供リンク情報を読み出し、情報提供リンク格納手段102に格納する(ステップS113)。
【0084】
また、情報評価リンク生成手段101fにおいて、一時メモリ1010から、v行目のblog−URIカラムのデータ(コンテンツ提供者情報)を利用者IDとし、v行目のrefer−URIカラムのデータ(ポインタ情報)をコンテンツIDとして読み込む。そして、さらに情報評価リンク生成手段101fは、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータ(ポインタ情報)を含むか否かによって定まる値を評価情報として設定する。この例では、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータを含む場合、評価情報を+1と設定する。そして、情報評価リンク生成手段101fは、このように抽出した利用者ID、コンテンツID及び評価情報を対応付けた情報評価リンク情報を生成し、一時メモリ1010に格納する(ステップS114)。そして、書き込み手段101gは、一時メモリ1010からこの情報評価リンク情報を読み出し、情報評価リンク格納手段103に格納する(ステップS115)。尚、この例のコンテンツ情報格納手段1200に格納されるコンテンツ情報リスト1600のrefer−URIのカラムには、トラックバックに基づくURIは格納されていない。よって、この例の情報評価リンク生成手段101fは、トラックバック以外のURI(ポインタ情報)を用いて情報評価リンク情報を生成することになる。尚、コンテンツ情報リスト1600の生成時に、トラックバックに基づくURIもコンテンツ情報リスト1600に含めることとし、情報評価リンク情報の生成時に、情報評価リンク生成手段101fがこのトラックバックに基づくURI以外の情報を用いて情報評価リンク情報を生成することとしてもよい。
【0085】
次に、制御手段1020において、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値(コンテンツ情報リスト1600におけるDocIDカラムのデータの最大値)であるか否かを判断する(ステップS116)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS112に戻す(ステップS117)。一方、変数vがDocIDの最大値であれば、情報提供リンク情報及び情報評価リンク情報の算出処理を終了する。
【0086】
その後、第1の実施の形態と同様に、第1隣接行列生成手段104a及び第2隣接行列生成手段104bにおいて、情報提供リンク格納手段102及び情報評価リンク格納手段103に格納された、情報提供リンク情報及び情報評価リンクを用い、行列E,Cを生成する。そして、第1の実施の形態と同様に、固有ベクトル算出手段104cにおいて、行列E,Cからスコア推移行列Sの固有ベクトルを情報評判スコア又は情報提供スコアとして算出し、スコア算出手段104dにおいて他のスコアを算出する。尚、この例の第1の正規化手段104ca及び第2正規化手段104cbは、例えば前述の式(17)(18)又は式(19)(20)に従って行列E,Cを正規化し、演算手段104ccは、この正規化後の行列E,Cを用いてスコア推移行列Sの固有ベクトルを算出する。最後に、書き込み手段104eが、算出された各スコアを前述のようにコンテンツ情報リスト1600内に関連付けてコンテンツ情報格納手段1200に格納させる。
【0087】
[コンテンツ情報検索処理の詳細]
次に、コンテンツ情報検索手段1400が行うコンテンツ情報検索処理の詳細について説明する。
図25は、このコンテンツ情報検索処理の詳細を説明するためのフローを示した図である。以下、この図を用い、コンテンツ情報検索処理の詳細を説明する。
この例の場合、まず、−般的なApache等のwebサーバ装置(図示せず)とHTTPプロトコルとを用い、利用者端末装置500−1〜pに検索語の入力を促進する画面を表示させる。利用者端末装置500−1〜pの利用者は、これに従い利用者端末装置500−1〜pに検索語(検索条件)を入力し、これを含むメッセージを、ネットワーク300を通じてコンテンツ検索装置1000に送信する。コンテンツ情報検索手段1400の受信手段1410(図19)は、この利用者端末装置500−1〜pから送信された検索語を含むメッセージを受信し(ステップS121)、一時メモリ1010に格納する。
【0088】
次に、コンテンツ情報検索手段1420において、一時メモリ1010から上述の検索語を読み出し、コンテンツ情報格納手段1200に格納されているコンテンツ情報の中から当該検索語で指定された条件を充足するすべてのコンテンツ情報を検索する。そして、コンテンツ情報検索手段1420は、この条件を充足するコンテンツ情報を、それらに関連付けられた情報評判スコア及び情報提供スコアの少なくとも一方とともにコンテンツ情報格納手段1200から抽出し一時メモリ1010に格納する(ステップS122)。具体的には、例えば、コンテンツ情報検索手段1420は、一時メモリ1010から上述の検索語を読み出し、その検索語をキーとしてコンテンツ情報格納手段1200のコンテンツ情報リスト1600(図23)のKeywordsカラムを検索する。そして、コンテンツ情報検索手段1420は、この検索語と一致する語が存在するすべてのコンテンツ情報リスト1600のレコード(Scoreのカラム情報含む)を読み出し、一時メモリ1010に格納する。
【0089】
次に、コンテンツ情報提供リスト生成手段1430において、一時メモリ1010からステップS122で抽出されたレコードを、例えば情報評判スコアの値をキーとしてソートすることでコンテンツ情報提供リストを生成し、これを含むメッセージを一時メモリ1010に格納する(ステップS123)。具体的には、この例のコンテンツ提供情報リスト生成手段1430は、このコンテンツ情報リストに、利用者端末装置500−1〜pがwebブラウザを用いてこのリストを表示するために必要なHTMLタグを付与したメッセージを生成する。
その後、送信手段1440において、一時メモリ1010からステップS123で生成されたメッセージを読み込み、これを検索語に対する検索結果として、当該検索語を送信した利用者端末装置500−1〜pに送信する(ステップS124)。利用者端末装置500−1〜pは、このメッセージを受信し、例えばwebブラウザを用い、メッセージが有するコンテンツ情報リストを検索結果画面として表示する。
【0090】
<変形例等>
尚、本発明は上述の実施の形態に限定されるものではない。
例えば、情報提供リンク生成手段101eが、コンテンツ情報格納手段1200に格納された全てのレコードに対して情報提供リンク情報を生成するのではなく、評価が存在するコンテンツに対応する情報提供リンク情報のみを生成することとしてもよい。
図26は、この変形例に対応するスコア計算手段2104の構成を例示した図である。また、図27は、この変形例の処理を説明するためのフローを示した図である。
この変形例の場合、スコア計算手段104の代わりにスコア計算手段2104が配置される。また、前述した図21の処理の代わりに図27の処理が実行される。すなわち、まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS131)。次に、読み込み手段1301aにおいて、コンテンツ情報格納手段1200からv行目のコンテンツ情報(図23参照)を読み込み、一時メモリ1010に格納する。そして、情報提供リンク生成手段101eにおいて、v行目のコンテンツ情報のURIカラムの値をrefer−URIカラムの値とする他の行(レコード)が存在するか否かを検索する(ステップS132)。
【0091】
ここで、v行目のコンテンツ情報のURIカラムの値をrefer−URIカラムの値とする他の行が存在すると判断された場合、情報提供リンク生成手段101eは、一時メモリ1010から、v行目のblog−URIカラムのデータを利用者IDとし、v行目のURIカラムのデータをコンテンツIDとして読み込む。そして、情報提供リンク生成手段101eは、これらが関連付けられた情報提供リンク情報を生成し(ステップS133)、一時メモリ1010に格納する。そして、書き込み手段101gは、一時メモリ1010からこの情報提供リンク情報を読み出し、情報提供リンク格納手段102に格納する(ステップS134)。一方、ステップS132でv行目のコンテンツ情報におけるURIカラムの値を、refer−URIカラムにおける値とする他の行が存在しない判断された場合、情報提供リンク生成手段101eは、v行目のコンテンツ情報を用いた情報提供リンク情報の生成は行わない。
【0092】
次に、情報評価リンク生成手段101fにおいて、一時メモリ1010から、v行目のblog−URIカラムのデータを利用者IDとし、v行目のrefer−URIカラムのデータをコンテンツIDとして読み込む。そして、さらに情報評価リンク生成手段101fは、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータを含むか否かによって定まる値を評価情報として設定する。そして、情報評価リンク生成手段101fは、このように抽出した利用者ID、コンテンツID及び評価情報を対応付けた情報評価リンク情報を生成し、一時メモリ1010に格納する(ステップS135)。そして、書き込み手段101gは、一時メモリ1010からこの情報評価リンク情報を読み出し、情報評価リンク格納手段103に格納する(ステップS136)。
【0093】
次に、制御手段1020において、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値であるか否かを判断する(ステップS137)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS112に戻す(ステップS138)。一方、変数vがDocIDの最大値であれば、制御手段1020は、情報提供リンク情報及び情報評価リンク情報の算出処理を終了する。
その後、情報評判スコア推定手段2104f(図26)において、利用者の情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコアとしてコンテンツ情報格納手段1200に出力し、格納することとしてもよい。
【0094】
図28は、この場合の情報評判スコア推定手段2104fの処理を説明するためのフローの例示である。
この場合、まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS141)。次に情報評判スコア推定手段2104fは、例えば、コンテンツ情報格納手段1200に格納されたv行目のコンテンツ情報リスト1600(図23参照)のscoreカラムにデータが格納されているか否かを判断する(ステップS142)。
【0095】
ここで、データが格納されていないと判断された場合、情報評判スコア推定手段2104fは、v行目のコンテンツ情報リスト1600のblog−URIカラムの値をキーとしてコンテンツ情報リスト1600のURIカラムを検索する。そして、情報評判スコア推定手段2104fは、このキーとURIカラムの値とが一致した行のScoreカラムの値をavに代入し、このav(利用者の情報提供スコア)を一時メモリ1010に格納する(ステップS143)。次に、v行目のコンテンツ情報リスト1600のblog−URIカラムの値をキーとしてコンテンツ情報リスト1600のblog−URIカラムのすべての行を検索し、blog−URIカラムの値がv行目のblog−URIカラムの値に等しい行の数を数え、それをnv(当該利用者が提供したコンテンツ数)として一時メモリ1010に格納する(ステップS144)。次に、情報評判スコア推定手段2104fは、一時メモリ1010からavとnvとを読み出し、avとnvとに依存した関数の演算を行う。そして、情報評判スコア推定手段2104fは、この演算結果(当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコア)を、v行目のコンテンツ情報リスト1600のScoreカラムに格納する(ステップS145)。尚、avとnvとに依存した関数としては、例えば、rj=av/sqrt(nv)を例示できる。ここでsqrt(X)はXの平方根を返す関数である。また、avはコンテンツjを提供したコンテンツ提供者vの情報提供スコアに相当し、nvはコンテンツ提供者vのコンテンツ提供数に相当する。
【0096】
ステップS145が終了した場合、或いは、ステップS142の判断においてコンテンツ情報格納手段1200に格納されたv行目のコンテンツ情報リスト1600のscoreカラムにデータが格納されていると判断された場合、制御手段1020は、以下のステップS146の処理を実行する。
まず、制御手段1020は、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値であるか否かを判断する(ステップS146)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS142に戻す(ステップS147)。一方、変数vがDocIDの最大値であれば処理を終了する。
このような情報評判スコアの計算手法を採ることにより、blog記事のようにほとんどのコンテンツに対してリンクが張られていない(=情報評価リンク情報がない)場合に、情報評価装置1300による計算対象のコンテンツ数を著しく減少させることができる。その結果、高速なスコアの算出が可能となる。
【0097】
また、コンテンツ情報検索手段が、検索語に関連する記事を検索するのではなく、検索語に関連するコンテンツ提供者(blogに適用した場合にはblogger)を検索して出力することとしてもよい。これにより、利用者は、検索語に関連するオピニオンリーダのblogサイトを見つけることができる。そして、この利用者は、オピニオンリーダのblogサイトの記事を読むことで、検索語に関連した網羅的な知識を習得することが可能となる。このような検索語に関連する情報提供者のコンテンツ提供者リストを生成する一つの方法は、検索語を含むコンテンツを1件でも書いたコンテンツ提供者のリストを作成し、それを情報提供スコアでソートするという方法である。しかし、情報提供スコアは、検索語が与えられる前に、一定時間間隔等を契機に事前に情報提供リンク情報と情報評価リンク情報を抽出して計算されているものである。そのため、この情報提供スコアの値と関連語との関連性は低い。従って、情報提供スコアによって検索結果のコンテンツ提供者リストをソートした場合、高い情報提供スコアを持つ情報提供者がたまたま1件の関連語を含む記事を記載すると直ちにコンテンツ提供者リストの上位になってしまう可能性がある。
【0098】
そこでこの例の情報評判スコア集計手段は、検索語の条件を充足する複数のコンテンツの情報評判スコアをコンテンツ提供者毎に集計し、この集計したスコアに基づいて、その検索語に関する記事を書いたコンテンツ提供者のリストをソートし、コンテンツ提供者リストを生成する。そして、この例の情報評判スコア集計手段は、このコンテンツ提供者リストを検索語に対する検索結果として利用者端末装置500−1〜pに送信する。
図29は、このようなコンテンツ情報検索手段2400の構成を例示した図である。また、図30は、コンテンツ情報検索手段2400の処理を説明するためのフローを例示した図である。
【0099】
コンテンツ情報検索手段2400は、受信手段1410において、検索語を含む検索条件を受信すると(ステップS151)、一時メモリ1010にその検索条件のデータを格納する。次に、コンテンツ情報検索手段1420において、一時メモリ1010から検索条件のデータを読み出し、コンテンツ情報格納手段1200のコンテンツ情報リスト1600(図23)から、keywordsカラムのデータがこの検索条件を充足し、blog−URIのカラムが<nil>でない全てのコンテンツ情報の行を、それらに関連付けられている情報評判スコア(Scoreカラムのデータ)とともに抽出し、それらを関連付けて一時メモリ1010に格納する(ステップS152)。次に、情報評判スコア集計手段2450が、一時メモリ1010に格納された情報評判スコアを、それに関連付けられたコンテンツ情報のblog−URIカラムの値(コンテンツ提供者情報)毎に加算する。そして、情報評判スコア集計手段2450は、この加算値と対応するblog−URIカラムの値とを一時メモリ1010に出力して格納する(ステップS153)。その後、コンテンツ情報提供リスト生成手段1430において、一時メモリ1010から、加算値と、それに対応するblog−URIカラムの値とを読み出し、加算値をキーとしてblog−URIカラムの値を並び替えて生成したリストを含むメッセージを生成し、一時メモリ1010に格納する。さらに、このメッセージは、一時メモリ1010から送信手段1440に送られ、送信手段144は、このメッセージを、検索条件を送信した利用者端末装置500−1〜pに送信する。
その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0100】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0101】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。尚、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0102】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【図面の簡単な説明】
【0103】
【図1】図1は、第1の実施の形態における情報評価システムの構成を示す図である。
【図2】図2は、図1における情報取得手段の詳細構成を例示した図である。
【図3】図3は、図1におけるスコア計算手段の詳細構成を例示した図である。
【図4】図1におけるスコア出力手段の詳細構成を例示した図である。
【図5】図5は、情報取得手段の処理の詳細を説明するためのフローを示す図である。
【図6】図6(a)は、このように受信されるコンテンツ提供メッセージのデータ構成の例示であり、図6(b)はコンテンツ評価メッセージの例である。
【図7】図7(a)は、情報提供リンク情報のデータ構成を例示する図である。図7(b)は、情報評価リンク情報のデータ構成を示す図である。
【図8】利用者からコンテンツに対する2種類のリンクを示した概念図である。
【図9】図9は、スコア計算手段の処理を説明するためのフローを例示した図である。
【図10】図10(a)は、情報評判スコア格納手段が管理するデータ構造図である。図10(b)は、情報提供スコア格納手段および情報評価スコア格納手段が管理するデータ構造図である。
【図11】図11は、スコア出力手段の処理の詳細を説明するためのフローを示す図である。
【図12】図12(a)は、スコア計算手段の反復計算手順を行列表現で示す図である。図12(b)は、スコア計算手段の反復計算手順を要素表現で示す図である。
【図13】図13は、図12のアルゴリズムによってr、a、hを算出する場合の処理を説明するためのフローを例示した図である。
【図14】図14は、第2の実施の形態におけるコンテンツ検索システムの構成を示す図である。
【図15】図15は、図14のコンテンツ情報収集手段の詳細構成を例示した図である。
【図16】図16は、図14の情報評価装置の詳細構成を例示した図である。
【図17】図17は、図16の情報取得手段の詳細構成を例示した図である。
【図18】図18は、図16におけるスコア計算手段の詳細構成を例示した図である。
【図19】図19は、図14におけるコンテンツ情報検索手段の詳細構成を例示した図である。
【図20】図20は、第2の実施の形態のスコア算出処理を説明するためのフローを示した図である。
【図21】図21は、第2の実施の形態における、情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明するためのフローを示した図である。
【図22】図22は、ブログ情報を例示した概念図である。
【図23】図23は、コンテンツ情報リストを例示した概念図である。
【図24】図24(a)は、情報提供リンク情報のデータ構成を例示する図である。図24(b)は、情報評価リンク情報のデータ構成を示す図である。
【図25】図25は、コンテンツ情報検索処理の詳細を説明するためのフローを示した図である。
【図26】図26は、スコア計算手段の変形例の構成を例示した図である。
【図27】図27は、スコア計算手段の処理の変形例を説明するためのフローを示した図である。
【図28】図28は、情報評判スコア推定手段の処理を説明するためのフローの例示である。
【図29】図29は、コンテンツ情報検索手段の変形例の構成を例示した図である。
【図30】図30は、コンテンツ情報検索手段の処理の変形例を説明するためのフローを例示した図である。
【符号の説明】
【0104】
1 情報評価システム
100 情報評価装置
200−1〜m,500−1〜p 利用者端末装置
300 ネットワーク
600−1〜q コンテンツサーバ装置
1000 コンテンツ検索装置
【技術分野】
【0001】
本発明は、ネットワーク上のコミュニティにおいて提供される情報の評判を評価する技術に関する。
【背景技術】
【0002】
近年、お互いに同じ関心を持つユーザ同士で情報を共有する多くのコミュニティがインターネット上に形成されている。このようなコミュニティの一例としては、以下で述べる、1)問題解決型コミュニティ、2)商品・サービス評価型コミュニティ、3)ユーザ創造型コミュニティ、4)トピックベースコミュニティ、等がある。
問題解決型コミュニティは、あるトピックにおける問題(例えば商品利用におけるトラブル)について、ユーザ主導で相互的なサポートを行うコミュニティであり、一例としては、株式会社オーケイウェブの「OKWeb」 や、Sun Microsystems, Inc.の「Sun Support Forums」などのユーザフォーラム型カスタマサポートサイト等がある。
【0003】
商品・サービス評価コミュニティは、商品やサービスに対するユーザレビューを共有するためのコミュニティであり、一例としては、アイスタイル株式会社の「cosme.net」や株式会社カカクコムの提供する「kakaku.com」等がある。
ユーザ創造型コミュニティは、ユーザ主導による新サービス創造などを目的としたコミュニティであり、一例としては、株式会社エンジンの「たのみこむ」やエレファントデザイン株式会社の「空想生活」等がある。
トピックベースコミュニティは、あるトピックについて、ユーザ間でのディスカッションや情報共有が行われるコミュニティであり、取り扱われるトピックはコミュニティによって多種多様である。一例としては、「Slashdot.jp」や株式会社ベネッセウィコーポレーションの「ベネッセウイメンズパーク」等がある。
【0004】
本発明はこれらの特定のコミュニティのみに適用されるわけではなく、これらを含む多様な情報共有型のコミュニティに適用できる。これらの情報共有型コミュニティでは、コミュニティの参加者から広く記事やコンテンツを集めるという特徴を有しており、コミュニティには様々な参加者が含まれるため、これらの参加者によって提供される情報やコンテンツの品質は千差万別である。多くの人が関心を持つ有益かつ信頼度の高い情報を提供する人がいる一方で、誰も関心を持たない情報を大量に投入する参加者や、意図的ないし無意識のうちに正しくない情報を投入する参加者も存在する。また、コミュニティに対して投入された情報に対する評価の入力についても、意図的ないし無意識のうちに真実ではない評価を投入する参加者も存在する。そこで、コミュニティに提供する情報の中から、有益な情報を抽出するためには、コミュニティ参加者の情報提供能力、及び情報評価能力を考慮に入れた情報評価装置或いは情報評価方法が重要となる。
【0005】
このような参加者の能力を考慮に入れ、コミュニティに投稿される情報の重要性をスコアリングするシステムの一例が、特許文献1に記載されている。この文献では、コミュニティに投稿された情報の有益度を数値化した情報評判スコアと、参加者の情報提供能力を数値化した情報提供スコア(該文献では情報発言スコアと記載)と、参加者の情報評価能力を数値化した情報評価スコアの3つのスコアを導入し、これらのスコアの相互依存関係に基づき計算する算出アルゴリズムを提案している。
しかしながら、該文献に記載された方法では、情報提供能力及び情報評価能力に対応する情報提供スコア及び情報評価スコアが該文献段落〔0060〕に記載されている[式(2)]及び、段落〔0063〕に記載されている[式(3)]のように、情報評判スコアの変動に比例して単純に情報評価スコア及び情報提供スコアを変動させるのみである。このため、このアルゴリズムに基づき、実際に大量のデータを読み込ませてみると、初期の段階で高いスコアを得た人の情報提供スコアや情報評価スコアが時間の経過に伴い、ますます増大し発散する傾向があり、そのままでは有用な値が得られないという問題がある。これは、特許文献1に記載された方法ではスコアに対する意味論が厳密に定義されておらず、算出されたスコアも全体として整合がとれたものになっていないことに起因するものである。
【0006】
すなわち、情報評判スコア、情報提供スコア、情報評価スコアの3つのスコアを安定させ、しかもコミュニティの参加者の活動の実態に合うスコアとするためには、スコアの意味論を厳密に定義することが必要である。例えば、非特許文献1では、Webページの重要度を表すPageRankと呼ぶ指標を、ランダムサーファーモデルと呼ぶ意味論に基づき計算している。ランダムサーファーモデルは、Webページに存在するハイパーリンクをランダムにクリックした場合の各ページへの到着確率をPageRankとして定義している。このモデルに基づく具体的なスコアの計算方法は、おおよそ次のようなものである。
【0007】
各Webページをグラフ理論におけるノード、リンクをエッジとみなしたときに、Webページ数をNとすると、N×Nの隣接行列Lで表現できる。この隣接行列を転置し、さらにそれぞれの列ベクトルの総和が1となるようにそれぞれのリンク数で割った行列を作成する。これは推移確率行列となる。推移確率行列の場合、線形代数学の基礎理論により、推移確率行列の最大固有値に属する固有ベクトルを求めることが、最終的な到着確率ベクトルを計算することとなることが知られている。したがって、ランダムサーファーモデルによる各ページの到着確率は、前記の推移確率行列の固有ベクトルを算出することで、実現できる。固有ベクトルの算出アルゴリズムについては、多くの方法が提案されているため、詳しくは省略するが、最も単純な方法としては、前記確率推移行列の掛け算を反復して行うことで、最大固有値に属する固有ベクトルを計算する方法等がある。
【0008】
同様に、非特許文献2には、HITSと呼ぶ、Webページのスコアリングのアルゴリズムが提案されている。このアルゴリズムでは、各ページの情報提供能力を表すAuthorityベクトルaと、各ページの情報評価能力を表すhubベクトルhという指標を導入し、Webページの隣接行列Lとその転置行列LTとするとき、aが行列LTLの固有ベクトル、hが 行列LLTの固有ベクトルとして算出することを提案している。
【特許文献1】特開2003−316915号公報
【非特許文献1】S. Brin and L. Page, “The anatomy of a large-scale hyper-textual web search engine.” Proceedings of 7th WWW Conference, (1998).
【非特許文献2】J. M. Kleinberg, “Authoritative sources in hyperlinked environment”, Journal of ACM, Vol. 48, pp. 604-632 (1999).
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、上記のように行列によるモデル化と行列の固有ベクトルを用いて計算する方法は、Webページのスコアリングの方法としては広く利用されているが、本発明が対象とする上記のコミュニティ分析に適用する方法は十分に検討されていない。Webページの場合には、ハイパーテキストのリンクと呼ぶ1種類のリンクに基づいて、隣接行列や推移確率行列等を生成するのに対し、本発明が対象とするコミュニティ分析においては、参加者が情報に対して行った情報提供に対応する情報提供リンクと、同じく参加者が情報に対して行った情報評価アクションに対応する情報評価リンクの2種類のリンクが存在する。また、これらのリンクは、コミュニティの参加者がM人、提供或いは評価された情報がN個とするとき、情報提供リンク及び情報評価リンクはそれぞれM×Nの隣接行列を構成する等、多くの点でWebページのスコアリングと異なっており、上記で述べたPageRankやHITSといったアルゴリズムをそのまま適用することは困難である。
【0010】
本発明は上記のような問題点を鑑みてなされたものであり、1)問題解決型コミュニティ、2)商品・サービス評価型コミュニティ、3)ユーザ創造型コミュニティ、4)トピックベースコミュニティ、等の様々なコミュニティの中から、参加者から情報への情報提供リンクと情報評価リンクを抽出し、この2種類のリンクを分析することで、全体として整合がとれたスコアを算出できる技術を提供することを目的とする。すなわち、本発明の目的は、2種類のリンクを分析し、評価値として意味のある安定した値のスコアを算出する技術を提供することである。
【課題を解決するための手段】
【0011】
以上の課題を解決するために、本発明では、以下のように情報評判スコア、情報提供スコア及び情報評価スコアの少なくとも一つを算出する。尚、情報評判スコアは、利用者から提供された電子情報であるコンテンツの評判を数値化したものを意味する。また、情報提供スコアは、コンテンツを提供した利用者の情報提供能力を数値化したものを意味する。さらに、情報評価スコアは、コンテンツを評価した利用者の情報評価能力を数値化したものを意味する。
まず、情報提供リンク格納手段に、コンテンツを提供した利用者の利用者IDと、利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を格納する。また、情報評価リンク格納手段に、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を格納する。
【0012】
次に、スコア計算手段において、上述の情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と何れかのスコア(情報評価スコア、情報評判スコア又は情報提供スコアの何れか)との間の定義された関係を示す行列)の固有ベクトルを算出する。そして、スコア計算手段は、この固有ベクトルの要素を何れかのスコアとして、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させる。
ここで、スコア計算手段が生成するスコア推移行列は、情報提供リンク情報と情報評価リンク情報と何れかのスコアとの定義(スコアに対する意味論の定義)された関係を示す行列である。そして、本発明では、このスコア推移行列の固有値を求め、上述のスコアを求める。そのため、本発明によって求められたスコアは、導入された意味論の定義を厳格に保守したものとなる。その結果、求められたスコアは、導入された意味論のもと数学的に意味のある安定した値となる。
【0013】
また、本発明において好ましくは、スコア計算手段において、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと何れかのスコアとの定義された関係を示す関係式に従い、何れかのスコアを算出する。これにより、数学的に意味のある安定した2種類以上のスコアを算出することができる。
また、本発明において好ましくは、スコア計算手段は以下のようにしてスコアを算出する。まず、第1隣接行列生成手段において、情報提供リンク格納手段に格納された情報提供リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報提供リンク情報の個数を数え、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)を生成して出力する。また、第2隣接行列生成手段において、情報評価リンク格納手段に格納された情報評価リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報評価リンク情報の評価情報の値を加算し、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)を生成して出力する。そして、固有ベクトル算出手段において、情報提供リンク隣接行列と情報評価リンク隣接行列とから、スコア推移行列(情報提供リンク隣接行列と情報評価リンク隣接行列と何れかのスコアとの関係を示す行列)の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。その後、算出されたスコアを、書き込み手段において、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段の何れかに格納させる。
【0014】
さらに、本発明において好ましくは、スコア算出手段において、情報提供リンク隣接行列又は情報評価リンク隣接行列と固有ベクトルとを、これらと何れかのスコアとの定義された関係を示す関係式に代入し、当該スコアを算出して出力する。
またさらに、本発明において好ましくは、固有ベクトル算出手段は、以下のように固有ベクトルを算出する。まず、第1正規化手段において、情報提供リンク隣接行列の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報提供リンク格納手段において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報提供リンク隣接行列を出力する。また、第2正規化手段において、情報評価リンク隣接行列の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報評価リンク格納手段において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報評価リンク隣接行列を出力する。さらに演算手段において、正規化された情報提供リンク隣接行列と正規化された情報評価リンク隣接行列とを用いてスコア推移行列の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。これにより、同一の利用者が多数のコンテンツを提供したり、多数のコンテンツの評価を行ったりすることによって、その利用者の情報提供スコアや情報評価スコアが高められてしまうことを防止できる。
【0015】
また、本発明において好ましくは、スコア推移行列Sは、S=αCTC+(1−α)ETE、S=CETECT、或いはS=ECTCETの何れかである。尚、Cは情報提供リンク隣接行列であり、Eは情報評価リンク隣接行列であり、αは0以上1以下の実数であり、βTはβの転置行列を意味している。
また、本発明をネットワークに接続されたコンテンツサーバ装置が格納するコンテンツの情報の提供に適用することもできる。この場合、まずコンテンツ情報受信手段においてコンテンツが有する情報であるコンテンツ情報を受信し、コンテンツ情報格納手段に格納する。その後、情報提供リンク生成手段において、コンテンツ情報格納手段に格納されたコンテンツ情報を用い、コンテンツを提供した利用者の利用者IDと、利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を生成し、情報提供リンク格納手段に格納する。また、情報評価リンク生成手段において、コンテンツ情報格納手段に格納されたコンテンツ情報を用い、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を生成し、情報評価リンク格納手段に格納する。次に、固有ベクトル算出手段において、情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と情報評判スコア又は情報提供スコアとの間の定義された関係を示す行列)の固有ベクトルを算出して、この固有ベクトルの要素を各コンテンツ情報に対応する情報評判スコア又は情報提供スコアとして出力する。そして、書き込み手段において、情報評判スコア又は情報提供スコアを、対応するコンテンツ情報に関連付けて、コンテンツ情報格納手段に格納させる。その後、検索条件受信手段において、利用者端末装置から送信された検索条件を受信し、検索手段において、この検索条件を充足するコンテンツ情報を、それらに関連付けられた情報評判スコア及び情報提供スコアの少なくとも一方とともにコンテンツ情報格納手段から抽出して出力する。
【0016】
このような構成の装置は、算出されたスコアに従い、検索条件に合致した各コンテンツ情報を加工(例えば並び替えなど)することができる。そして、当該装置は、この加工された情報を用いることにより、コンテンツの重要度が適切に示唆された検索結果を利用者に提供することができる。
さらに、本発明において好ましくは、スコア算出手段において、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと情報評判スコア又は情報提供スコアとの定義された関係を示す関係式に従い、各コンテンツ情報に対応する情報評判スコア又は情報提供スコアを算出し、当該スコアを出力する。また、より好ましくは、情報提供リンク生成手段は、評価が存在するコンテンツに対応する情報提供リンク情報のみを生成する。そして、情報評判スコア推定手段において、利用者の情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコアとして出力する。この場合、スコアの妥当性をさほど落すことなく、スコアの算出速度を向上させることができる。
【0017】
また、本発明において好ましくは、コンテンツ情報が、コンテンツ提供者情報(コンテンツを提供した利用者に対応する情報)を含み、検索手段が、検索条件を充足するコンテンツ情報を、当該コンテンツ情報に関連付けられた情報評判スコアとともに、コンテンツ情報格納手段から抽出する手段である。そして、情報評判スコア集計手段において、検索手段において抽出された情報評判スコアを、コンテンツ情報が有するコンテンツ提供者情報毎に加算し、各加算値を当該コンテンツ提供者情報ともに出力する。このような加算値は、検索条件に合致するコンテンツのみに関し、コンテンツに対する評価値をコンテンツ提供者毎に合算したものである。すなわち、当該加算値とコンテンツ提供者情報とを用いることにより、検索条件に合致するコンテンツのオピニオンリーダを正確に特定することができる(詳細は後述)。
【0018】
さらに、本発明において好ましくは、コンテンツ情報は、コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報と、当該コンテンツのアドレスを示すコンテンツアドレス情報と、他のコンテンツのアドレスを示すポインタ情報とを含む情報である。そして、情報提供リンク生成手段は、コンテンツ提供者情報を利用者IDとし、コンテンツアドレス情報をコンテンツIDとして、情報提供リンク情報を生成する。また、情報評価リンク生成手段は、コンテンツ提供者情報を利用者IDとし、ポインタ情報をコンテンツIDとし、コンテンツ情報がポインタ情報を含むか否かによって定まる値を評価情報として、情報評価リンク情報を生成する。
【0019】
また、本発明において好ましくは、情報評価リンク生成手段は、トラックバック以外のポインタ情報を用いて情報評価リンク情報を生成する。これにより、誤った情報評価リンク情報が生成されることを防止できる(詳細は後述)。
【発明の効果】
【0020】
以上のように本発明によれば、情報提供リンク情報と情報評価リンク情報という2種類のリンク情報から、評価値として意味のある全体として整合がとれたスコアを算出することができる。
【発明を実施するための最良の形態】
【0021】
以下、本発明の実施の形態を図面を参照して説明する。
〔第1の実施の形態〕
まず、本発明における第1の実施の形態について説明する。
<構成>
図1は、本形態における情報評価システム1の構成を示す図である。
図1に例示するように、本形態の情報評価システム1は、情報評価装置100及びこれとネットワーク300を通じて接続され、利用者i (i=1…m)がそれぞれ使用する利用者端末装置200−1〜mを有している。
【0022】
情報評価装置100は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、バス、補助記憶装置、通信装置等からなる周知のコンピュータ装置において、そのCPUに所定のプログラムを実行させることにより構成されるものである。図1に例示するように、この例の情報評価装置100は、情報取得手段101と、情報提供リンク格納手段102と、情報評価リンク格納手段103と、スコア計算手段104と、情報評判スコア格納手段105と、情報提供スコア格納手段106と、情報評価スコア格納手段107と、スコア出力手段108と、一時メモリ111と、制御手段110とを有している。尚、図1において各手段をつなぐ線は情報の流れを示すが、制御手段110及び一時メモリ111に対して入出力される情報の流れの記載は省略してある。
【0023】
図2は、図1における情報取得手段101の詳細構成を例示した図である。
図2に例示するように、この例の情報取得手段101は、通信手段101aと、メッセージ認証手段101bと、情報検証手段101cと、コンテンツID生成手段101dと、情報提供リンク生成手段101eと、情報評価リンク生成手段101fと、書き込み手段101gとを有している。尚、図2における矢印は情報の流れを示すが、制御手段110及び一時メモリ111に対して入出力される情報の流れの記載は一部省略してある。
図3は、図1におけるスコア計算手段104の詳細構成を例示した図である。
【0024】
図3に例示するように、この例のスコア計算手段104は、第1隣接行列生成手段104aと、第2隣接行列生成手段104bと、固有ベクトル算出手段104cと、スコア算出手段104dと、書き込み手段104eとを有している。また、固有ベクトル算出手段104cは、第1正規化手段104caと、第2正規化手段104cbと、演算手段104ccとを有している。尚、図3における矢印は情報の流れを示すが、制御手段110に対して入出力される情報の流れの記載は省略してある。
図4は、図1におけるスコア出力手段108の詳細構成を例示した図である。
【0025】
図4に例示するように、この例のスコア出力手段108は、受信手段108aと、メッセージ判定手段108bと、スコア検索手段108cと、メッセージ生成手段108dと、送信手段108eとを有している。尚、図4における矢印は情報の流れを示すが、制御手段110に対して入出力される情報の流れの記載は一部省略してある。
尚、上述した各手段は、同一の筺体内に存在するものに限定されず、複数の筺体に分散配置されてもよい。また、上述した通信手段101a、受信手段108a及び送信手段108eは、例えば、LAN(Local Area Network)カード、モデム、ルータ、ハブ等の通信装置によって構成されるものである。また、情報提供リンク格納手段102、情報評価リンク格納手段103、情報評判スコア格納手段105、情報提供スコア格納手段106、情報評価スコア格納手段107及び一時メモリ111は、例えば、ハードディスク装置、フレキシブルディスク、MO(Magneto-Optical disc)等の補助記憶装置や、RAM、CPU内のレジスタやキャッシュメモリ等によって構成されるものである。また、制御手段110、メッセージ認証手段101b、情報検証手段101c、コンテンツID生成手段101d、情報提供リンク生成手段101e、情報評価リンク生成手段101f、書き込み手段101g、第1隣接行列生成手段104a、第2隣接行列生成手段104b、固有ベクトル算出手段104c、スコア算出手段104d、書き込み手段104e、メッセージ判定手段108b、スコア検索手段108c及びメッセージ生成手段108dは、例えば、CPUに所定のプログラムが読み込まれ、CPUがこれらのプログラムを実行することにより構成されるものである。
【0026】
また、利用者端末装置200−1〜m(図1)も所定のプログラムに基づいて動作する周知のコンピュータ装置からなる。
<動作>
次に、本形態の情報評価装置100の動作について説明する。
[概要]
本形態の情報評価装置100は、利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア、コンテンツを提供した利用者の情報提供能力を数値化した情報提供スコア、及びコンテンツを評価した利用者の情報評価能力を数値化した情報評価スコアを算出する装置である。まず、この情報評価装置100の処理の概要を説明する。尚、情報評価装置100の各処理は、制御手段110の制御のもと実行される。
【0027】
まず、複数の利用者端末装置200−1〜mは、ネットワーク300を通じ、<利用者ID、コンテンツ>の2つ組みを含むコンテンツ提供メッセージ、或いは、<利用者ID、コンテンツID、評価情報>の3つ組を含むコンテンツ評価メッセージを情報評価装置100に送信する。
情報評価装置100は、情報取得手段101においてこれらを受信する。ここで、受信されたメッセージがコンテンツ提供メッセージであった場合、情報取得手段101は、コンテンツを提供した利用者の利用者IDと、当該利用者によって提供されたコンテンツの識別子であるコンテンツIDとが関連付けられた情報提供リンク情報を情報提供リンク格納手段102に格納する。一方、受信されたメッセージがコンテンツ評価メッセージであった場合、情報取得手段101は、コンテンツを評価した利用者の利用者IDと、利用者によって評価されたコンテンツの識別子であるコンテンツIDと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を情報評価リンク格納手段103に格納する。
【0028】
その後、スコア計算手段104において、情報提供リンク格納手段102と情報評価リンク格納手段103とに格納された情報提供リンク情報と情報評価リンク情報とを用い、スコア推移行列(情報提供リンク情報と情報評価リンク情報と何れかのスコアとの間の定義された関係を示す行列。詳細は後述。)の固有ベクトルを算出し、この固有ベクトルの要素を何れかのスコアとして出力する。また、スコア計算手段104は、情報提供リンク情報又は情報評価リンク情報と固有ベクトルとを用い、これらと何れかのスコアとの定義された関係を示す関係式に従い、何れかのスコアを算出して出力する。そして、スコア計算手段104は、算出された各スコアを情報評判スコア格納手段105、情報提供スコア格納手段106又は情報評価スコア格納手段107に格納させる。
【0029】
その後、スコア出力手段108は、利用者端末装置200−1〜mからの要求に対し、情報評判スコア格納手段105、情報提供スコア格納手段106又は情報評価スコア格納手段107を検索し、要求されたスコアに関する情報を利用者端末装置200−1〜mに送信する。
[情報取得手段101の処理の詳細]
次に、情報取得手段101の処理の詳細について説明する。
図5は、情報取得手段101の処理の詳細を説明するためのフローを示す図である。以下、この図に沿って情報取得手段101の処理の詳細を説明する。
【0030】
まず、情報取得手段101の通信手段101a(図2)は、複数の利用者端末装置200−1〜mから送信された<利用者ID、コンテンツ>の2つ組みを含むコンテンツ提供メッセージ、或いは、<利用者ID、コンテンツID、評価情報>の3つ組を含むコンテンツ評価メッセージをネットワーク300経由で受信する(ステップS1)。
図6(a)は、このように受信されるコンテンツ提供メッセージ121のデータ構成の例示であり、図6(b)はコンテンツ評価メッセージ122の例である。この例のコンテンツ提供メッセージ121は、その属性やビット構成等を示すヘッダ情報121aと、コンテンツ121cを提供した利用者の利用者ID121bと、提供されたコンテンツ121cとを有する。ここで、コンテンツ121cは利用者により投入される電子情報である。コンテンツ121cの一例としては、「〇〇レストランの〇〇セットはおいしい」等の文字情報や、利用者が作成した音楽情報、画像情報、動画像などである。利用者ID121bは、そのコンテンツ121cを提供した利用者のIDであり、会員制のコミュニティの場合には、コンテンツ121cを書込む際にシステムにログインするときに利用するID等を用いる。また、コンテンツID121cは、コンテンツに対してユニークに付与される識別子である。
【0031】
また、この例のコンテンツ評価メッセージ122は、その属性やビット構成等を示すヘッダ情報122aと、コンテンツを評価した利用者の利用者ID122bと、利用者によって評価されたコンテンツの識別子であるコンテンツID122cと、コンテンツの評価者がコンテンツに対して行った評価の数値情報である評価情報122dとを有する。ここで、利用者ID122cは、コンテンツを評価した利用者のIDであり、会員制のコミュニティの場合には、コンテンツの評価を書込む際にシステムにログインするときに利用するID等を用いる。また、評価情報122dはコンテンツ122dに対する評価を表す情報であり、本形態では、利用者が利用者端末装置200−1〜mを用いて明示的に入力した情報とする。評価情報の一例としては、「+1」、「+2」、「+3」などの予め決められた範囲の値をとる数値情報などがある。
【0032】
通信手段101aは、受信したコンテンツ提供メッセージやコンテンツ評価メッセージを一時メモリ111に格納し、次に、メッセージ認証手段101bが、利用者端末装置200−1〜mの認証処理を行う(ステップS2)。この認証処理は、一人の利用者が同一コンテンツの評価を複数回行うことを禁止したい場合や、別の利用者と偽ってコンテンツを提供することを禁止したい場合に行うものである。この認証処理は、通信手段101a及びネットワーク300を介し、メッセージ認証手段101bと利用者端末装置200−1〜mとの間で、既存のパスワード等を用いた認証プロトコルに従い実行される。尚、このステップS2の処理は応用分野によっては省略できる。
【0033】
ステップS2の認証処理の結果は制御手段110に伝えられる。そして、制御手段110は、認証処理がNGの場合はその利用者端末装置200−1〜mとのセッションを終了させる。一方、認証処理がOKであった場合、制御手段110は、情報検証手段101cに、受信されたメッセージが、コンテンツ提供メッセージかコンテンツ評価メッセージかを判定させる(ステップS3)。具体的には、この例の情報検証手段101cは、ステップS1で通信手段101aが受信したメッセージを一時メモリ111から読み込み、そのヘッダ情報121a又は122aを参照することにより、そのメッセージがコンテンツ提供メッセージ121かコンテンツ評価メッセージ122(図6)かを判断する。情報検証手段101cによる判断結果は制御手段110に送られる。
【0034】
ここで、制御手段110が受け取った判断結果が「メッセージがコンテンツ提供メッセージである」旨の判断結果であった場合、制御手段110はコンテンツID生成手段101dにコンテンツIDを生成する旨の指示を与える。この指示を受けたコンテンツID生成手段101dは、一時メモリ111からステップS1で通信手段101aが受信したコンテンツ提供メッセージを読み込む。そして、コンテンツID生成手段101dは、読み込みたコンテンツ提供メッセージが具備するコンテンツに対するユニークなコンテンツIDを生成し、一時メモリ111に格納する(ステップS4)。コンテンツIDの生成方法としては、例えばコンテンツ全体の一方向性ハッシュ値を利用する方法や、逐次連番を割り振るなどの方法がある。コンテンツIDが生成されると次に、情報提供リンク生成手段101eは、一時メモリ111からステップS1で受信されたコンテンツ提供メッセージと、ステップS4で生成されたコンテンツIDとを読み込む。そして情報提供リンク生成手段101eは、これらを用いて<利用者ID、コンテンツID、コンテンツ>の3つ組み(情報提供リンク情報)を生成し、一時メモリ111に格納する(ステップS5)。その後、書き込み手段101gにおいて一時メモリ111からこの情報提供リンク情報を読み込み、これを情報提供リンク格納手段102に格納させる(ステップS6)。
【0035】
一方、制御手段110が受け取ったステップS3の判断結果が「メッセージがコンテンツ評価メッセージである」旨の判断結果であった場合、制御手段110は情報評価リンク生成手段101fに対し、情報評価リンク情報を生成する旨の指示を与える。この指示を受けた情報評価リンク生成手段101fは、ステップS1で受信されたコンテンツ評価メッセージを一時メモリ111から読み込み、これに含まれる<利用者ID、コンテンツID、評価情報>の3つ組みを情報評価リンク情報として生成し、一時メモリ111に格納する(ステップS7)。その後、書き込み手段101gにおいて一時メモリ111からこの情報提供リンク情報を読み込み、これを情報評価リンク格納手段103に格納させる(ステップS8)。
【0036】
図7(a)は、上述のように情報提供リンク格納手段102に格納される情報提供リンク情報131a〜131eのデータ構成を例示する図である。図7(a)に示すように、情報提供リンク格納手段102は、利用者ID、コンテンツID、コンテンツをそれぞれ関連付けした情報提供リンク情報131a〜131eを格納・管理している。
図7(b)は、情報評価リンク格納手段103に格納・管理される情報評価リンク情報132a〜132fのデータ構成を示す図である。図7(b)に示すように、評価リンク格納手段103は、利用者ID、コンテンツID、評価情報をそれぞれ関連付けした情報評価リンク情報132a〜132fを格納・管理している。尚、コンテンツIDと情報コンテンツとの対応関係は、上記の図7(a)で示した情報提供リンク格納手段102に格納・管理されている。
【0037】
尚、本形態では、情報取得手段101が直接、利用者端末装置200−1〜mからコンテンツや評価情報を受取り、情報提供リンク情報131a〜131e及び情報評価リンク情報132a〜132fをそれぞれ情報提供リンク格納手段102及び情報評価リンク格納手段103に格納することとした。しかし、情報取得手段101が、既存の電子掲示板システムやWebサーバ装置から情報提供リンク情報131a〜131eと情報評価リンク情報132a〜132fとを抽出する構成としてもよい。例えば、問題解決型コミュニティにおいて、「質問」や「回答」というアクションを「コンテンツの提供」として本発明を適用してもよい。すなわち、電子掲示板上へ書込まれる「質問」や「回答」を「コンテンツ」とし、その書き込みを行った利用者を「コンテンツを提供した利用者」として本発明を適用してもよい。また、「質問」の参照や回答を行った利用者を「コンテンツを評価した利用者」とし、「質問」への参照回数や質問への回答の数等を、「質問」の良さの評価、すなわち「コンテンツに対する評価」として本発明を適用してもよい。また、質問者が「回答」の中から最も有用だった回答を選択する行為等を「質問」の良さの評価、すなわち「コンテンツに対する評価」として本発明を適用してもよい。同様に、商品・サービス評価型コミュニティにおいても、レビュー記事の投稿を「コンテンツ」の「提供」とし、これに対する他の参加者の支持を「コンテンツに対する評価」として本発明を適用してもよい。その他具体例は挙げないが、トピックベースコミュニティやユーザ創造型コミュニティにおいても同様である。尚、これを実現するには、このような既存のコミュニティを構成するWebサーバ装置から情報を収集するロボットを作成する必要があるが、Weサーバ装置から情報を収集する一般的なロボットの作成方法は、文献:Kevin Hemenway, Tara Calishain, “Spidering hacks”、O’Reilly (2003)、に記載されている方法等が利用できる。また、このような実施の形態を取った場合、図7(a)に示す情報提供リンク情報131a〜131eのコンテンツIDとして、そのコンテンツが存在するリソースのURL(Uniform Resource Identifier)を用いてもよい。そして、この場合、情報提供リンク情報131a〜131eにコンテンツの列は不要となる。
【0038】
[スコア計算手段104の処理の詳細]
次に、スコア計算手段104(図1,図3)の処理の詳細について説明する。
まず、スコア計算手段104が各スコアを算出するための原理について説明する。
上記のように情報提供リンク格納手段102及び情報評価リンク格納手段103に格納された情報提供リンク情報131a〜131e及び情報評価リンク情報132a〜132fは、論理的には、例えば、図8に示すような利用者からコンテンツに対する2種類のリンクを示すものと考えることができる。図8において、紙面に向かって左側の丸は利用者、右側の四角はコンテンツを示す。また、この図の破線は、情報提供リンク情報131a〜131eにおける利用者IDに対応する利用者とコンテンツとの関連付け(情報提供リンク)を表している。また、この図の実線は、情報評価リンク情報132a〜132fにおける利用者IDに対応する利用者と、コンテンツIDに対応するコンテンツとの関連付け(情報評価リンク)を表している。また、情報評価リンクに付与されている数値は、情報評価リンク情報132a〜132fにおける評価情報を表すものとする。
【0039】
これらのリンクは、
【数1】
のような利用者i (i=1…m)を行とし、コンテンツj (j=1…n)を列とする隣接行列で表現することができる。すなわち、情報提供リンクは行列C=[cij] (i=1…m, j=1…n)で表現できる。ただし、cijは行列Cのi行j列目の要素を示し、iからjにリンクがあればcij=1、なければcij =0となる。また情報評価リンクは行列E=[eij] (i=1…m, j=1…n)で表現できる。ただし、eijは行列Eのi行j列目の要素を示す。またeij は、報評価リンク情報132a〜132fにおいて、利用者iに対応する利用者IDと、コンテンツjに対応するコンテンツIDとに対応付けられている評価情報の値である。そして、eijの値が大きい程、コンテンツjが利用者iから強い支持を受けていることになる。尚、以下では特に断りがない限り、行列C及び行列Eは、一般化された行列C=[cij] (i=1…m, j=1…n)及びE=[eij] (i=1…m, j=1…n)を意味する。
【0040】
本形態では、2種類のリンクをそれぞれ示す行列C及び行列Eから、情報提供スコアai、情報評価スコアhi及び情報評判スコアrjの3つのスコアを算出する。以下にこれらのスコアの意味と表記方法を述べる。
情報提供スコアai は、利用者i (i=1…m)が、過去、どの程度コミュニティから支持を受けたコンテンツを提供してきたかを示す指標である。このスコアが高ければ高いほど、この利用者は情報の提供の面でコミュニティに貢献する能力があるとみなす。ここで全利用者の情報提供スコアaiを、a=[a1…am]Tと表記し、これを以後、情報提供ベクトルと呼ぶ。ここでMTは行列Mの転置行列である。
【0041】
情報評価スコアhiは、利用者i (i=1…m)が、過去、コミュニティに提供されるコンテンツに対してどの程度コミュニティの方向性に沿った評価情報を投入してきたを示す指標である。このスコアが高ければ高いほど、この利用者は情報評価の投入の面でコミュニティに貢献する能力があるとみなす。ここで全利用者の情報評価スコアhiを、h=[h1…hm]Tと表記し、これを以後、情報評価ベクトルと呼ぶ。
情報評判スコアrjは、コンテンツ j (j=1…n)が、どの程度利用者からの支持を受けているか(i.e. コミュニティの方向性に沿っているか)を示す指標である。このスコアが高ければ高いほど、その情報はコミュニティから支持を受けているものであるとみなす。ここで全コンテンツの情報評判スコアrjを、r=[r1…rn]Tと表記し、これを以後、情報評判ベクトルと呼ぶ。
【0042】
利用者の情報提供スコアと、情報評価スコアと、コンテンツの情報評判スコアとは、以下のルールにより相互に影響を及ぼしあう。
(1)情報提供スコアの高い利用者が提供するコンテンツは高い情報評判スコアを持つコンテンツである。
(2)情報評価スコアの高い利用者が評価したコンテンツは高い情報評判スコアを持つコンテンツである。
(3)情報評判スコアが高いコンテンツを提供した利用者は高い情報提供スコアを持つ利用者である。
【0043】
(4)情報評判スコアが高いコンテンツを評価した利用者は高い情報評価スコアを持つ利用者である。
本形態では、これら4つのルールに対応して、
r=CTa …(1)
r=ETh …(2)
a=Cr …(3)
h=Er …(4)
の4つの数学的な関係を定義する。ただし、式(1)と式(2)を両立させるため、式(1)と式(2)を凸結合(convex combination)により統合して、
r=αCTa+(1‐α)ETh …(5)
を利用する。ここで、αは[0,1]を定義域とする実数であり、コミュニティの特性に応じて調整されるものとする。つまり、αが1に近い程、情報提供リンクを重視し、0に近い程、情報評価リンクを重視して情報評判スコアが算出されることとなる。
【0044】
上記、式(5)に、式(3)と式(4)を代入すると、
r=αCTCr +(1‐α)ET Er
= (αCT C +(1‐α)ET E) r …(6)
を得る。(αCTC +(1‐α)ET E)は、n×nの正方行列であり、これをスコア推移行列S(「情報提供リンク情報と情報評価リンク情報と何れかのスコアとの定義された関係を示すスコア推移行列」に相当)と呼ぶことにすると、
r=Sr …(7)
となる。上記式(7)を満たすrは一般的には存在しないが、線形代数学の基礎理論によると、Sの要素が非負の実数の場合には、
λr=Sr …(8)
を満たす実数ベクトルrは存在する。ただし、λは定数であってSの固有値と呼ばれ、rはSの固有ベクトルと呼ばれる。これらの固有値と固有ベクトルを算出する具体的な方法の一例は後で述べるが、こうしてr(情報評判ベクトル)が算出できれば、式(3)及び式(4)により(「各スコア間の定義された関係」に相当)、a(情報提供ベクトル), h(情報評価ベクトル)がそれぞれ算出できる。
【0045】
尚、行列Eの要素eijは正規化していないため、ある特定の人が多くの情報に評価を入力すると、非常に高い情報評価スコアとなるという問題がある。このような行為を防止するためには、PageRankと同様に、利用者一人が提供する評価情報の値の総和が1になるように、行列Eを正規化することとしてもよい。つまり、行列Eの行ベクトルの要素の総和が1となるように行列Eを正規化し、正規化した行列を用いてスコアの算出を行うこととしてもよい。具体的には、次のような行列E'を生成、用いればよい。
E’=[e’ij](i=1…m, j=1...n)
e’ij= eij/Σj=1..n (eij)
同様に、行列Cの行ベクトルの要素の総和が1となるような正規化を行い、この正規化後の行列Cを用いて各スコアを算出することとしてもよい。尚、行列CやEの行ベクトルの要素の総和が1以外の値となるように正規化してもよい。また、これらの正規化は必須ではなく、用途によってはこのような正規化を行わずにスコアを算出することとしてもよい。
【0046】
スコア計算手段104は、上記のような考え方に基づき、行列CとEとからr(情報評判ベクトル)、a(情報提供ベクトル), h(情報評価ベクトル)を算出し、安定した値の情報提供スコアai、情報評価スコアhi及び情報評判スコアrjを算出する。
図9は、スコア計算手段104の処理を説明するためのフローを例示した図である。以下、この図に沿ってスコア計算手段104の処理を説明する。尚、以下では、行列CやEの行ベクトルの要素の総和が1になるように行列C,Eを正規化してスコアを求めることとする。
【0047】
まず、スコア計算手段104の第1隣接行列生成手段104aが行列Cを生成し、第2隣接行列生成手段104bが行列Eを生成する(ステップS11)。
この例の場合、まず、第1隣接行列生成手段104aが、情報提供リンク格納手段102に格納された情報提供リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報提供リンク情報の個数を数える。そして、第1隣接行列生成手段104aは、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)である行列Cを生成して一時メモリ111に出力し、そこに格納する。例えば、図7(a)の例の場合、(利用者ID,コンテンツID)が(A0001,C0001),(A0001,C0002),(A0002,C0003),(A0002,C0004),(A0003,C0005)である情報提供リンク情報はそれぞれ1個ずつ存在する。また、これらの利用者IDとコンテンツIDとの組合せに対応する行列成分(行,列)をそれぞれ(1,1),(1,2),(2,3),(2,4),(3,5)とすると、第1隣接行列生成手段104aは、
【数2】
を生成することになる。
【0048】
次に、第2隣接行列生成手段104bが、情報評価リンク格納手段103に格納された情報評価リンク情報を検索し、利用者IDとコンテンツIDとの組合せ毎に、当該組合せを有する情報評価リンク情報の評価情報の値を加算する。そして、情報評価リンク格納手段103は、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)である行列Eを生成して一時メモリ111に出力し、そこに格納する。例えば、図7(b)の例の場合、(利用者ID,コンテンツID,評価情報)が(A0001,C0003,+2),(A0001,C0004,+3),(A0002,C0001,+2),(A0002,C0002,+1),(A0002,C0005,+1),(A0003,C0004,+3)である情報評価リンク情報はそれぞれ1個ずつ存在する。また、これらの利用者IDとコンテンツIDとの組合せに対応する行列成分(行,列)をそれぞれ(1,3),(1,4),(2,1),(2,2),(2,5),(3,4)とすると、第2隣接行列生成手段104bは、
【数3】
を生成する。
尚、行列C,E生成の際、第1隣接行列生成手段104a或いは第2隣接行列生成手段104bは、各利用者ID及びコンテンツIDの情報も一時メモリ111に格納しておく。
【0049】
行列C,Eが生成されると、次に固有ベクトル算出手段は、これらからスコア推移行列S(情報提供リンク隣接行列と情報評価リンク隣接行列と何れかのスコアとの関係を示す行列)の固有ベクトルrを算出し、この固有ベクトルrの要素を情報評判スコアrjとして出力する。この例の場合、まず、固有ベクトル算出手段104cは、一時メモリ111から行列C,Eを読み込む。そして、第1正規化手段104ca及び第2正規化手段104cbにおいて、同一利用者による多数の提供(多数の記事の投稿等)や、同一利用者による多数の評価(多数の記事のコメント等)によって、その利用者の情報提供スコアや情報評価スコアを高められないようにするため、行列C,Eを正規化し、正規化後の行列C,Eを一時メモリ111に格納する(ステップS12)。この例の場合、第1正規化手段104caにおいて、行列C(情報提供リンク隣接行列)の各要素を、それぞれの利用者IDに対応する要素の集合毎に(すなわち行毎に)、「情報提供リンク格納手段102において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数(正規化関数1)」によって正規化し、当該正規化された行列Cを出力する。また、この例の第2正規化手段104cbにおいて、行列E(情報評価リンク隣接行列)の各要素を、それぞれの利用者IDに対応する要素の集合毎に、「情報評価リンク格納手段103において当該利用者IDに関連付けられているコンテンツIDの数に依存した関数(正規化関数2)」によって正規化し、当該正規化された行列Eを出力する。尚、例えば、上述の正規化関数1をcij/Σj=1..n (cij)とし、正規化関数1をeij/Σj=1..n (eij)とした場合、式(9)(10)の行列C,Eはそれぞれ、
【数4】
のように正規化される。尚、これは一例であり、行列CとEの正規化は必須でなく、あえてこのような正規化を省略してもよいし、別の正規化方法を利用してもよい(他の正規化方法の例については後述する)。
【0050】
次に固有ベクトル算出手段104cの演算手段104ccにおいて、一時メモリ111に格納された正規化後の行列C,Eを読み込み、読み込みた行列CとEから行列S=(αCT C +(1‐α)ET E)を計算し、これを一時メモリ111に格納する。尚、この行列Sをスコア推移行列と呼ぶ(ステップS13)。式(11)に示す行列CとEからα=0.3として生成したスコア推移行列Sの例を以下に示す。
【数5】
【0051】
次に演算手段104ccは、一時メモリ111からスコア推移行列Sを読み込み、その固有ベクトルrを算出し、この固有ベクトルrの要素を情報評判スコアrjとして一時メモリ111に格納する(ステップS14)。固有ベクトルの算出方法については、ベキ乗法による反復計算法、QR分解法、直接法など多くの手法が適用可能である。以下に、ベキ乗法による反復計算法を用いて算出した式(12)のスコア推移行列Sに対する固有ベクトルを示す。
【数6】
この例では、情報評判スコアr3=0.25926,r4=0.96581となる。尚、固有ベクトルは固有値の数だけ存在するが、本形態では、例えば、固有値最大の固有ベクトル(principal eigenvector)を用いる。
【0052】
次に、スコア算出手段104dにおいて、行列C又は行列Eと固有ベクトルrとを、これらと何れかのスコアa,hとの定義された関係を示す関係式に代入し、当該スコアa,hを算出して一時メモリ111に出力し、そこに格納する(ステップS15)。具体的には、例えば、スコア算出手段104dは、一時メモリ111から、行列Cと行列Eと固有ベクトルrとを読み込み、これらに式(3)及び式(4)を適用することで、スコアa、hを算出し、これらの要素を情報提供スコアai及び情報評価スコアhiとして一時メモリ111に格納する。以下に、式(11)の行列C及び行列Eと式(13)の固有ベクトルrとを用い、式(3)及び式(4)によって算出した情報提供スコアベクトルaと情報評価スコアベクトルhを示す。
【数7】
この例では、情報提供スコアa2=0.61253、情報評価スコアh1=0.68319,h3=0.96581となる。
次に、書き込み手段104eにおいて、上述の情報評判スコアrj、情報提供スコアai及び情報評価スコアhiと、各利用者ID及びコンテンツIDとを、一時メモリ111から読み込む。そして、書き込み手段104eは、情報評判スコアrj(141b)を対応するコンテンツID(141a)に関連付けて(図10(a))情報評判スコア格納手段105に格納する。また、書き込み手段104eは、情報提供スコアai(142b)及び情報評価スコアhi(142c)を対応する利用者ID(142a)に関連付けて(図10(b))、情報提供スコア格納手段106及び情報評価スコア格納手段107にそれぞれ格納する(ステップS16)。
【0053】
[スコア出力手段108の処理の詳細]
次に、スコア出力手段108(図1,図4)の処理の詳細について説明する。
図11は、スコア出力手段108の処理の詳細を説明するためのフローを示す図である。以下、この図に従ってスコア出力手段108の処理の詳細を説明する。
スコア出力手段108は、上記のステップにより算出格納された情報評判スコア、情報提供スコア、情報評価スコアを利用者端末からの要求に応じて検索して返す手段である。この処理を行う場合、まず、スコア出力手段108の受信手段108aは、利用者端末装置200−1〜mから送信された、コンテンツIDを含む情報評判スコア取得メッセージ或いは利用者IDを含む情報提供スコア・情報評価スコア取得メッセージを、ネットワーク300を通じて受信する(ステップS21)。受信されたメッセージは、一時メモリ111に格納される。
【0054】
次にメッセージ判定手段108bは、一時メモリ111からステップS21で受信されたメッセージを読み込み、そのヘッダ情報等により、このメッセージが、情報評判スコア取得メッセージか情報提供スコア・情報評価スコア取得メッセージかを判定する(ステップS22)。その判定結果は制御手段110に送られる。
ここでステップS21で情報評判スコア取得メッセージが受信されたと判断された場合には、制御手段110は、スコア検索手段108cに情報評判スコアの検索指示を与える。これを受けたスコア検索手段108cは、一時メモリ111に格納されている情報評判スコア取得メッセージのコンテンツIDをキーとして、情報評判スコア格納手段105を検索し、このコンテンツIDに対応する情報評判スコア(図10(a))を抽出する(ステップS23)。尚、抽出された情報評判スコアは一時メモリ111に格納される。
【0055】
一方、ステップS21で情報提供スコア・情報評価スコア取得メッセージが受信されたと判断された場合には、制御手段110は、情報提供スコア及び情報評価スコアの検索指示を与える。これを受けたスコア検索手段108cは、一時メモリ111に格納されている情報提供スコア・情報評価スコア取得メッセージの利用者IDをキーとして、情報提供スコア格納手段106及び情報評価スコア格納手段107を検索し、この利用者IDに対応する情報提供スコア及び情報評価スコア(図10(b))を抽出する(ステップS24)。尚、抽出された情報提供スコア及び情報評価スコアは一時メモリ111に格納される。
【0056】
次に、メッセージ生成手段108dにおいて、一時メモリ111から上記ステップS23やS24で取得されたスコアと、対応するコンテンツIDや利用者IDとを読み出し、それらの情報を例えば、コンテンツIDや利用者ID別に振り分けたり、スコアの大きい順序で並び替えたりしたメッセージを生成する(ステップS25)。生成されたメッセージは、一時メモリ111に格納され、さらに送信手段108eによって読み込まれ、ネットワーク300を通じて利用者端末装置200−1〜mに送信される(ステップS26)。
【0057】
このように各スコアを利用者に提供することにより、利用者は、コミュニティ中の大量の情報の中からコミュニティにとって有益な情報を取得することや、当該有益な情報のランキングを取得することが可能となる。
<変形例等>
尚、本発明は上述の実施の形態に限定されるものではない。例えば、また、上述の各種の処理は、上述した記載に従った時系列で実行されるのみならず、処理を実行する装置の処理能力或いは必要に応じて並列的に或いは個別に実行されてもよい。
【0058】
また、例えば、図9で示したステップS11からステップS16の計算手順は、図12(a)による反復計算を行うことでも全く同様に計算できる。この場合には、r、a、hが反復により同時に計算されるため、ステップS13からステップS15が統合された形態で実施される。この計算手順は、行列の要素表現で表すと、図12(b)のようにも表現することできる。ここで、prov(j)はコンテンツjを提供した利用者(prov(j)∈{1…m})、eval(j)はコンテンツjを評価している利用者の集合(eval(j)∈{1…m})、prov(i)は利用者iが提供したコンテンツの集合(prov(i)∈{1…n})、eval(i)は利用者iが評価したコンテンツの集合(eval(i)∈{1…n})である。これらの情報は、図1に示す情報提供リンク格納手段102及び情報評価リンク格納手段103から利用者ID或いはコンテンツIDを利用して検索することにより容易に抽出することが可能である。尚、図12(b)において||x||1及び||x||2はベクトルxのノルムを表し、||x||1はx の要素の絶対値の和、||x||2はx の要素の2乗の和の平方根(ユークリッドノルム)を表す。このように本発明では、スコアの算出に固有ベクトルを用いることとしたため、反復アルゴリズムを適用し、簡単にこれらのスコアが算出することが可能とである。
【0059】
図13は、図12のアルゴリズムによってr、a、hを算出する場合の処理を説明するためのフローを例示した図である。尚、図13ではベクトルを示す矢印を省略してある。図13の処理の場合、まず、ステップS11と同様に、第1隣接行列生成手段104a及び第2隣接行列生成手段104bにおいて、行列C,Eを生成し(ステップS31)、これらを第1正規化手段104ca及び第2正規化手段104cbにおいて正規化して一時メモリ111に格納する(ステップS32)。また、演算手段104ccにおいて、ベクトルa(0)=(1,...,1)T, ベクトルh(0)=(1,...,1)T,変数k=0とし、これらを一時メモリ111に格納する(ステップS33)。次に、演算手段104ccにおいて、一時メモリ111から正規化後の行列C,Eとベクトルa(k), h(k)とを読み込み、ベクトルr(k+1)=αCTa(k)+(1‐α)ETh(k)を算出し、一時メモリ111に格納する(ステッS34)。尚、αは前述のように予め定めておく。次に、演算手段104ccにおいて、一時メモリ111からベクトルr(k+1)を読み込み、図12(b)に示したようにこれを正規化して一時メモリ111に格納する(ステップS35)。次に、スコア算出手段104dにおいて、一時メモリ111から正規化後の行列C,Eとベクトルh(k+1)とを読み込み、ベクトルa(k+1)=C・r(k+1)及びh(k+1)=E・r(k+1)を算出し、ベクトルa(k+1),h(k+1)を一時メモリ111に格納する(ステップS36)。次に、制御手段110において、一時メモリ111からベクトルr(k),r(k+1)を読み込み、全てのj∈{1…n}についてrj(k)‐rj(k+1)<δが成り立つか否かを判断する(ステップS37)。尚、rj(k)はベクトルr(k)のj番目の要素を示し、rj(k+1)はベクトルr(k+1)のj番目の要素を示す。また、δは予め設定された十分小さい定数とする。ここで、rj(k)‐rj(k+1)<δでなかった場合には、制御手段110は演算手段104ccに指示を与える。これをトリガに演算手段104ccは、一時メモリ111から変数kを読み込み、k+1を演算し、その演算結果を新たなkとして一時メモリ111に格納する(ステップS38)。そして、制御手段110は処理をステップS34に戻す。一方、ステップS37の判断でrj(k)‐rj(k+1)<δと判断された場合には、制御手段110は書き込み手段104eに指示を与える。これをトリガに書き込み手段104eは、一時メモリ111からベクトルrj(k+1),a(k+1),h(k+1)を読み込み、これらの各要素をそれぞれ情報評判スコア、情報提供スコア及び情報評価スコアとして前述のように情報評判スコア格納手段105、情報提供スコア格納手段106及び情報評価スコア格納手段107に格納する(ステップS39)。
【0060】
また、上述の本形態を情報評価リンク情報が単調増加するコミュニティに適用した場合、このコミュニティで活動する期間が長い利用者ほど、その新しい活動(コンテンツの提供や評価)がスコアに与える影響が小さくなってしまう。これは、その利用者の過去の活動により作られた大量の情報評価リンク情報による影響と、前述の第2正規化手段104cb(図3)における正規化手法の影響によるものである。このような事態は、その参加者の活動を行うインセンティブを低下させる等の問題がある。よって、このような場合には、行列E(情報評価リンク隣接行列)に対し、これらの各要素が時間の経過に伴って小さくなるような正規化を行うことが有効である。具体的には、例えば、第2正規化手段104cb(図3)において、一時メモリ111から行列Eの各要素を読み込み、次式のような時間減衰のファクターを導入して行列Eを正規化し、一時メモリ111に格納する。そして、この時刻tにおける行列E(t)を本形態の行列E(正規化後の情報評価リンク隣接行列)として用いる。
【0061】
【数8】
ただし、tは現在時刻、time(eij)はeijが入力された時刻、ρは[0,1]を定義域とする減衰定数である。またeij(t)は現在時刻tにおける行列E(t)のi行j列目の要素である。尚、この場合、第2正規化手段104cb(図3)は、例えば、情報評価装置100内の図示していない内部時計等から出力される情報を現在時刻tとして用いる。さらに、この場合、情報取得手段101が情報評価リンク格納手段103に情報評価リンク情報を格納する際、その受信時間や格納時間等を各情報評価リンク情報に関連付けて格納しておく。そして、第2正規化手段104cb(図3)は、例えば、この情報評価リンク格納手段103に格納された受信時間や格納時間等を、それに関連付けられている情報評価リンク情報に対応するtime(eij)として利用する。
【0062】
また、本形態では、上述の式(1)〜式(4)を用いて式(6)のような変形を行い、(αCT C +(1‐α)ET E)をスコア推移行列Sとしてその固有ベクトルrを求め、さらに式(3)及び式(4)によりベクトルa,hを求めることとした。しかし、上述の式(1)〜式(4)を用い、
a=Cr=(CET)h=(CETE)r=(CETECT)a …(15)
或いは
h=Er=(ECT)a=(ECTC)r=(ECTCET)h …(16)
のような変形を行い、これらの式からスコア推移行列をS= CETECT或いはS= ECTCETとおいてもよい。この場合、演算手段104cc(図3)が算出するのは、固有ベクトルa或いはhであり、スコア算出手段104dが式(1)〜(4)を用いて算出するのは、ベクトルh,r或いはa,rとなる。尚、この場合の処理の詳細は、スコア推移行列が異なる点と、スコア算出手段104dが用いる式及びベクトルの種類が異なる点を除いて上述の実施の形態と同様である。もちろん、この場合に、図12による反復計算の変形を用いてもよいことはいうまでもない。
【0063】
また、上述の実施の形態では、情報評判スコア、情報提供スコア及び情報評価スコアの3つのスコアを算出することとした。しかし、これらのスコアの一部のみを算出する構成としてもよい。
さらに、本形態では、スコア出力手段108において、情報評判スコア取得メッセージ及び情報提供スコア・情報評価スコア取得メッセージの2種類のメッセージを受け付ける構成とした。しかし、用途によっては、スコア出力手段108が情報提供スコア・情報評価スコア取得メッセージを受け付けないこととし、上記のステップS24(図11)の処理を実行しない構成としてもよい。
【0064】
〔第2の実施の形態〕
次に、本発明における第2の実施の形態について説明する。
<原理>
既に述べたように、本発明の情報評価装置は、問題解決型コミュニティ、商品・サービス評価型コミュニティ等の特定のコミュニティに対して適用することが可能である。しかし、これに留まらず、インターネット上の動画、画像、音楽、ニュース等の様々なコンテンツ検索システムにおける検索結果のランキング表示に本発明を適用することもできる。本形態は、このようなコンテンツ検索システムに本発明を適用した例である。尚、本形態では、blog(ブログ)記事をコンテンツの具体例とし、blog記事検索システムとして本コンテンツ検索システムを利用する場合を説明する。
【0065】
本形態では、blog記事(コンテンツ)を以下のような構造上の特徴を有するものとする。尚、本形態の手法ではblog記事の内容には関与しない。
(a)個人を編集主体とし、個人単位にトップページ(blogサイトトップ)を有する。
(b)トップページから各記事(blogエントリ)へのリンクを有し、各記事はURI(Uniform Resource Identifier)を有する。
(c)双方向リンクを生成するためのメカニズム(トラックバック)が提供されている。
【0066】
このようなblog記事に対して、本発明を適用するためには、収集したblog記事の集合から情報提供リンク情報と、情報評価リンク情報とを抽出する必要がある。このためには、まず情報提供者と情報評価者の利用者IDを取得できなくてはならない。ここで、blog記事の場合には、上記のように編集主体が個人であり、またblogのホスティングサービス毎に各blog記事のトップページのURIの形式がほぼ決まっている。そこで本形態では、利用者IDとしてblogサイトトップのURIを用いる。また、blogのシステムでは、基本的に、各blog記事のエントリに永続的なURIが付与される。よって、本形態では、blog記事に付与されたURIをコンテンツIDとして用いることにする。このようにすることにより、情報提供リンク情報は、blogサイトトップのURI(利用者ID)と、その配下にあるblog記事エン卜リのURI(コンテンツID)との2つ組を含む集合として生成できる。
【0067】
同様に情報評価リンク情報についでも、blogサイトトップのURI(利用者ID)と、その配下にある各記事に含まれるリンク先である外部のblog記事URI(コンテンツID)との2つ組を含む集合として生成できる。これは、「あるblogger(利用者)iのblog記事から外部のblog記事jに対してリンクが存在する」ということが「このblogger(利用者)iが、blog記事j(コンテンツ)に対して関心がある」と考えられるからである。この場合、リンクの有無により、eij=1(リンク有り)或いはeij=0(リンク無し)とすることで、情報評価リンク情報に対応する行列E(情報評価リンク隣接行列)を生成することができる。ただし、blogでは、トラックバック機能により、リンクされたblog記事に、自動的にそのリンク元のblog記事への逆リンクが生成される。即ち、自動的に相互リンクが形成される。その結果、本来関心がもたれないblog記事に対しても、トラックバックされる側のblog記事からトラックバックする側のblog記事への逆向きのリンク(トラックバックリンク)が張られる。その結果、関心を持たれない記事に対して多くの被リンクが張られる、いわゆるトラックバックスパムという攻撃が存在する。そこで本形態では、トラックバックする側からトラックバックされる側へのリンク(すなわち通常のリンク)は情報評価リンク情報の生成に用いるが、トラックバックリンクは情報評価リンク情報の生成に用いない。尚、もちろん、トラックバックに依らない一般のblog記事間のリンクは情報評価リンク情報の生成に用いる。
【0068】
また、第1の実施の形態では、利用者一人が提供するコンテンツ数や評価情報の値の総和が1になるように行列C,Eを正規化する手法を例示した。しかし、blogスペースにおいては、数千のblog記事を書く人もいる一方、数件のblog記事を書いてやめてしまう人も多い。このような様々なblogger(利用者)全てに対し、利用者一人が提供するコンテンツ数や評価情報の値の総和が1になるように行列C,Eを正規化すると、blog記事の提供が少ない利用者のblog記事に対してリンクが張られた場合に、そのリンク情報を元に算出された情報提供スコアが非常に高い値となってしまう。利用者の情報提供能力が本当に高い場合にはこれでもよいが、情報提供スコアが運によって左右されすいという問題がある。−方、正規化を行わない場合、すなわち、例えば、blog記事の追加に伴い単純に行列C(情報提供リンク隣接行列)の要素cijに1を追加し、blog記事間のリンクの追加に伴い単純に行列E(情報評価リンク隣接行列)の要素eijに1を追加した場合には、利用者がたくさんの記事を書くことにより、故意にスコアを上げることができるという問題がある。
【0069】
そこで、本形態では、blog記事の投稿数やリンク数に応じて計算される値を用い、中間レベルの正規化を実施することで、この問題を解決する。具体的には、例えば以下のように、コンテンツや評価の投稿数の平方根(Sqrt)の重みで利用者一人当たりの投稿数を正規化する。
C'=[c'ij](i=1,...,m,j=1,...,n)
c'ij=sqrt(Σj=1...n(cij))×cij/Σj=1...n(cij)=cij/sqrt(Σj=1...n(cij)) …(17)
E'=[e'ij](i=1,...,m,j=1,...,n)
e'ij=sqrt(Σj=1...n(eij))×eij/Σj=1...n(eij)=eij/sqrt(Σj=1...n(eij)) …(18)
上記のSqrt関数による正規化は、blog記事へ本発明を適用する場合には、特に有効であることが経験的に知られている。しかし、本発明を、他のコミュニティ、例えば電子掲示板システム(BBS)に適用する場合、以下のように自然対数(ln)関数を用いて正規化を行うとよい結果が得られることがある。
【0070】
C'=[c'ij](i=1,...,m,j=1,...,n)
c'ij=ln(Σj=1...n(cij))×cij/Σj=1...n(cij) …(19)
E'=[e'ij](i=1,...,m,j=1,...,n)
e'ij=ln(Σj=1...n(eij))×eij/Σj=1...n(eij) …(20)
<構成>
次に、上記で述べた考え方に基づき、本発明の情報評価装置をblog記事の検索に適用したコンテンツ検索システムの構成を説明する。尚、以下では第1の実施の形態との相違点を中心に説明し、第1の実施の形態と共通する事項については説明を省略する。
【0071】
図14は、本形態におけるコンテンツ検索システム1の構成を示す図である。
図14に例示するように、この例のコンテンツ検索システム1は、blog記事の提供やコンテンツ情報の収集を行う利用者i=1,...,pが利用する利用者端末装置500−1〜p、blog記事が格納されるコンテンツサーバ装置600−1〜q、コンテンツサーバ装置600−1〜qから送信されるコンテンツの更新情報を配信するPINGサーバ(Weblog Updates Ping サーバ)装置700及びコンテンツ検索装置1000を有しており、これらはインターネット等のネットワークを通じて接続されている。また、コンテンツ検索装置1000は、インターネット上で公開されているコンテンツ(ここでは、blog記事、blog entryとも呼ぶ)情報をコンテンツサーバ装置600−1〜qから収集するコンテンツ情報収集手段1100と、収集されたコンテンツ情報を蓄積格納するコンテンツ情報格納手段1200と、−定時間間隔或いは、一定数のコンテンツ情報が収集されるたびに、コンテンツ情報格納手段から情報提供リンク情報と情報評価リンク情報を抽出し、各スコアを算出する情報評価装置1300と、利用者端末装置500−1〜pからネットワーク300を介して検索語を受け取り、コンテンツ情報格納手段1200に記録されているコンテンツのデータセットからキーワードに−致するコンテンツ情報を検索し、検索結果を利用者端末装置500−1〜pに返送するコンテンツ情報検索手段1400と、一時メモリ1010と、制御手段1020と、内部時計1030とから構成されている。尚、第1の実施の形態と同様、コンテンツサーバ装置600−1〜q、PINGサーバ装置700及びコンテンツ検索装置1000は、公知のコンピュータに所定のプログラムを実行させることにより構成されるものである。
【0072】
図15は、図14のコンテンツ情報収集手段1100の詳細構成を例示した図である。
この図に例示するように、この例のコンテンツ情報収集手段1100は、通信手段1110、更新情報読み込み手段1120、コンテンツ情報読み込み手段1130及びコンテンツ情報解析手段1140を有している。尚、図15における矢印はデータの流れを示しているが、制御手段1020及び内部時計1030に入出力されるデータの流れの記載は省略してある。
図16は、図14の情報評価装置1300の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0073】
この図に例示するように、この例の情報評価装置1300は、情報取得手段1301、情報提供リンク格納手段102、情報評価リンク格納手段103及びスコア計算手段104を有している。尚、図16における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図17は、図16の情報取得手段1301の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0074】
この図に例示するように、この例の情報取得手段1301は、読み込み手段1301a、情報提供リンク生成手段101e、情報評価リンク生成手段101f及び書き込み手段101gを有している。尚、図17における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図18は、図16におけるスコア計算手段104の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0075】
この図に例示するように、この例のスコア計算手段104は、第1隣接行列生成手段104a、第2隣接行列生成手段104b、固有ベクトル算出手段104c、スコア算出手段104d及び書き込み手段104eを有している。また、固有ベクトル算出手段104cは、第1正規化手段104ca、第2正規化手段104cb及び演算手段104ccを有している。尚、図18における矢印はデータの流れを示しているが、制御手段1020に入出力されるデータの流れの記載は省略してある。
図19は、図14におけるコンテンツ情報検索手段1400の詳細構成を例示した図である。尚、この図において第1の実施の形態と共通する部分については第1の実施の形態と同じ符号を用いた。
【0076】
この図に例示するように、この例のコンテンツ情報検索手段1400は、受信手段1410、コンテンツ情報検索手段1420、コンテンツ情報提供リスト生成手段1430及び送信手段1440を有している。
<動作>
次に、本形態のコンテンツ検索装置1000の動作を説明する。
[概要]
本形態のコンテンツ検索システム900は、コンテンツサーバ装置600−1〜pに格納されたコンテンツに関する情報を前述のスコアを利用して加工し、提供するシステムである。この情報提供を行う場合、まず、コンテンツ検索装置1000のコンテンツ情報収集手段1100において、コンテンツサーバ装置600−1〜pに格納されているblog記事(コンテンツ)の情報を収集し、コンテンツ情報格納手段1200に格納する。そして、情報評価装置1300において、第1の実施の形態と同様にコンテンツ情報格納手段1200に格納されたコンテンツ情報から各スコアを算出し、これをコンテンツ情報に関連付けてコンテンツ情報格納手段1200に格納する。そして、コンテンツ情報検索手段1400が、利用者端末装置500−1〜pから送られた検索条件に従ってコンテンツ情報格納手段1200に格納された情報を検索し、その検索結果を利用者端末装置500−1〜pに返す。尚、コンテンツ検索装置1000の各処理は、制御手段1020の制御のもと実行される。
【0077】
[スコア算出処理の詳細]
図20は、本形態のコンテンツ検索装置1000で行われるスコア算出処理を説明するためのフローを示した図である。以下、図20に沿ってこの処理を説明する。
まず、制御手段1020は、内部時計1030を参照し、前回更新情報の読み込みを行ってから所定の時間が経過したか否かを判断する(ステップS101)。ここで、所定の時間が経過したと判断された場合、制御手段1020は、更新情報読み込み手段1120に指示を与え、更新情報読み込み手段1120は、通信手段1110及びネットワーク300を通じてPINGサーバ装置700から更新情報を読み込んで一時メモリ1010に格納する(S102)。ここで更新情報としては、例えば、PINGサーバ装置700で公開されるChanges.Xmlフォーマットやblogホスティングサービス等で公開されるblog記事のサマリ情報(RSS(Rich Site Summary))等を例示できる。
【0078】
次に、制御手段110は、一時メモリ1010に格納された更新情報を読み込み、これを用いて何れかのコンテンツサーバ装置600−1〜qに格納されたコンテンツ(blog記事)が更新されたか否かを判定する(ステップS103)。ここでコンテンツの更新がないと判断された場合には、制御手段110は、処理をステップS101に戻す。一方、コンテンツの更新があると判断された場合には、制御手段110は、コンテンツ情報読み込み手段1130に指示を与え、コンテンツ情報読み込み手段1130は、通信手段1110(コンテンツ情報受信手段)及びネットワーク300を通じ、コンテンツサーバ装置600−1〜qから更新されたコンテンツに関する情報を取得し、一時メモリ1010に格納する。尚、コンテンツサーバ装置(blogサイト等)600−1〜qを巡回(crawling)して記事を収集する方法・プログラムコードについては、例えば、文献「宮川達彦、伊藤直也著「BIog Hacks」、オライリー・ジャパン」に詳しく記載されている。
【0079】
図22は、このように一時メモリ1010に格納されたコンテンツに関する情報であるブログ情報1500を例示した概念図である。尚、図22では、一人のblogger(利用者)に関するブログ情報のみを図示するが、実際はこれ以上のloggerに関するブログ情報が収集される。
この図に例示するように、この例のブログ情報1500は、blogサイトトップのURIであるサイトトップURI1510、blogサイトトップの記事1511、コンテンツ1520,1530を有する。また、コンテンツ1520,1530は、それぞれ、それが位置するリソースのURIであるブログURI1521、そのコンテンツ1520,1530を投稿した利用者の意思で設定したリンク先である通常リンクURI1522,1532、記事1523,1533、及びトラックバック機能に基づく逆リンク先であるトラックバックURI1524,1525,1534,1535,1536を有している。
【0080】
コンテンツ情報解析手段1140は、一時メモリ1010からこのようなコンテンツの情報を読み込み、これを解析して図23に例示するような情報をコンテンツ情報リスト1600として抽出し、これをDBMS等のテープルとしてコンテンツ情報格納手段1200に格納する。ここで、DocIDは、コンテンツ情報収集手段1100によって収集されたblog記事等のコンテンツに付与されるユニークなIDを格納するカラムである。また、URIは、コンテンツが公開されているリソースのURI(ブログURI1521,1531等)を格納するカラムである。ただし、コンテンツがblogサイトトップである場合には、そのURI(サイトトップURI1510等)がURIのカラムに格納される。keywordsは、収集されたblog記事(記事1511,1523,1533等)に対して形態素解析を施し、抽出された単語を格納するカラムである。また、blog−URIは、blog記事の属するblogサイトトップのURI(サイトトップURI1510等)を格納するカラムである。ただし、コンテンツがblogサイトトップ自身の場合には<nil>を格納する。また、Refer−URIは、blog記事の本文内で−般リンクとして参照している他のblog記事のURI(通常リンクURI1522,1532等)を格納するカラムである。ただし、−般リンクとして他のblog記事を参照していないコンテンツに対しては<nil>を格納し、複数のリンクを持つ場合には、複数のリンク先のURIを格納する。尚、図23の例では、トラックバックとして参照されているURI(トラックバックURI1524,1525,1534,1535,1536等)は格納しない。また、Dateは、巡回してblog記事を取得した日時を格納するカラムである。尚、blog記事を取得した日時は、例えば内部時計1030から出力される日時情報を用いる。Scoreは、後で述べるように情報評価装置1300によって計算されたスコアを格納するカラムである。ただし、コンテンツがblogサイトトップの場合には、そのblogger(利用者)に対する情報提供スコアを、コンテンツがblog記事の場合には、その記事の情報評判スコアを格納する。尚、情報評価スコアは、本形態では使用しない。また、既に述べたように、本システムでは、blogサイトトップのURI(blog−URIのカラムのURI)を利用者IDとして利用する。また、URI及びrefer−URIのカラムのURIをコンテンツIDとして利用する。また、blog−URIのカラムのデータは、請求項中の「コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報」に相当し、URIのカラムのデータは請求項中の「当該コンテンツのアドレスを示すコンテンツアドレス情報」に相当し、refer−URIのカラムのデータは、「他のコンテンツのアドレスを示すポインタ情報とを含む情報」に相当する。また、コンテンツ情報リスト1600のURIカラム、keywordsカラム、blog−URIカラム及びrefer−URIカラムのデータが請求項の「コンテンツ情報」に相当する。
【0081】
その後、制御手段1020において、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されたか否かを判断する(ステップS106)。ここで、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されていないと判断された場合、制御手段1020はその処理をステップS101に戻す。一方、コンテンツ情報格納手段1200にスコア算出前のコンテンツ情報が所定数以上蓄積されたと判断された場合には、情報評価装置1300において、情報提供リンク情報と情報評価リンク情報とを生成する。そして、情報評価装置1300は、それらからスコアを算出し、コンテンツ情報に関連付けてコンテンツ情報格納手段1200に格納する(ステップS107)。尚、−定期間が経過したことを契機としてステップS107を実行することとしてよい。
【0082】
[ステップS107の詳細]
まず、情報取得手段1301において、コンテンツ情報格納手段1200に格納されているblog−URIとURIのカラムの要素(コンテンツ情報)を抽出し、これを用いて、図24(a)に記載されるような利用者IDとコンテンツIDの2つ組みが関連付けられた情報提供リンク情報1611〜1615を生成し、情報提供リンク格納手段102に格納する。また、情報取得手段1301において、コンテンツ情報格納手段1200に格納されているblog−URIとrefer−URIのカラムの要素(コンテンツ情報)を抽出し、これを用いて、図24(b)に記載されるような利用者IDとコンテンツIDと評価情報との3つ組みが関連付けられた情報評価リンク情報1621〜1626を生成し、情報評価リンク格納手段103に格納する。
【0083】
図21は、これらの情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明するためのフローを示した図である。以下この図に従って、情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明する。
まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS111)。具体的には、例えば、スコアを算出するコンテンツ情報リスト1600の先頭のDocIDをvに代入する。
次に、読み込み手段1301aにおいて、コンテンツ情報格納手段1200からv行目のコンテンツ情報(図23参照)を読み込み、一時メモリ1010に格納する。そして、情報提供リンク生成手段101eにおいて、一時メモリ1010から、v行目のblog−URIのカラムのデータ(コンテンツ提供者情報)を利用者IDとし、v行目のURIのカラムのデータ(コンテンツアドレス情報)をコンテンツIDとして読み込む。そして、情報提供リンク生成手段101eは、これらが関連付けられた情報提供リンク情報を生成し(ステップS112)、一時メモリ1010に格納する。尚、blog−URIのカラムのデータが<nil>である場合には、その行に対する情報提供リンク情報は生成しない。そして、書き込み手段101gは、一時メモリ1010からこの情報提供リンク情報を読み出し、情報提供リンク格納手段102に格納する(ステップS113)。
【0084】
また、情報評価リンク生成手段101fにおいて、一時メモリ1010から、v行目のblog−URIカラムのデータ(コンテンツ提供者情報)を利用者IDとし、v行目のrefer−URIカラムのデータ(ポインタ情報)をコンテンツIDとして読み込む。そして、さらに情報評価リンク生成手段101fは、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータ(ポインタ情報)を含むか否かによって定まる値を評価情報として設定する。この例では、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータを含む場合、評価情報を+1と設定する。そして、情報評価リンク生成手段101fは、このように抽出した利用者ID、コンテンツID及び評価情報を対応付けた情報評価リンク情報を生成し、一時メモリ1010に格納する(ステップS114)。そして、書き込み手段101gは、一時メモリ1010からこの情報評価リンク情報を読み出し、情報評価リンク格納手段103に格納する(ステップS115)。尚、この例のコンテンツ情報格納手段1200に格納されるコンテンツ情報リスト1600のrefer−URIのカラムには、トラックバックに基づくURIは格納されていない。よって、この例の情報評価リンク生成手段101fは、トラックバック以外のURI(ポインタ情報)を用いて情報評価リンク情報を生成することになる。尚、コンテンツ情報リスト1600の生成時に、トラックバックに基づくURIもコンテンツ情報リスト1600に含めることとし、情報評価リンク情報の生成時に、情報評価リンク生成手段101fがこのトラックバックに基づくURI以外の情報を用いて情報評価リンク情報を生成することとしてもよい。
【0085】
次に、制御手段1020において、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値(コンテンツ情報リスト1600におけるDocIDカラムのデータの最大値)であるか否かを判断する(ステップS116)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS112に戻す(ステップS117)。一方、変数vがDocIDの最大値であれば、情報提供リンク情報及び情報評価リンク情報の算出処理を終了する。
【0086】
その後、第1の実施の形態と同様に、第1隣接行列生成手段104a及び第2隣接行列生成手段104bにおいて、情報提供リンク格納手段102及び情報評価リンク格納手段103に格納された、情報提供リンク情報及び情報評価リンクを用い、行列E,Cを生成する。そして、第1の実施の形態と同様に、固有ベクトル算出手段104cにおいて、行列E,Cからスコア推移行列Sの固有ベクトルを情報評判スコア又は情報提供スコアとして算出し、スコア算出手段104dにおいて他のスコアを算出する。尚、この例の第1の正規化手段104ca及び第2正規化手段104cbは、例えば前述の式(17)(18)又は式(19)(20)に従って行列E,Cを正規化し、演算手段104ccは、この正規化後の行列E,Cを用いてスコア推移行列Sの固有ベクトルを算出する。最後に、書き込み手段104eが、算出された各スコアを前述のようにコンテンツ情報リスト1600内に関連付けてコンテンツ情報格納手段1200に格納させる。
【0087】
[コンテンツ情報検索処理の詳細]
次に、コンテンツ情報検索手段1400が行うコンテンツ情報検索処理の詳細について説明する。
図25は、このコンテンツ情報検索処理の詳細を説明するためのフローを示した図である。以下、この図を用い、コンテンツ情報検索処理の詳細を説明する。
この例の場合、まず、−般的なApache等のwebサーバ装置(図示せず)とHTTPプロトコルとを用い、利用者端末装置500−1〜pに検索語の入力を促進する画面を表示させる。利用者端末装置500−1〜pの利用者は、これに従い利用者端末装置500−1〜pに検索語(検索条件)を入力し、これを含むメッセージを、ネットワーク300を通じてコンテンツ検索装置1000に送信する。コンテンツ情報検索手段1400の受信手段1410(図19)は、この利用者端末装置500−1〜pから送信された検索語を含むメッセージを受信し(ステップS121)、一時メモリ1010に格納する。
【0088】
次に、コンテンツ情報検索手段1420において、一時メモリ1010から上述の検索語を読み出し、コンテンツ情報格納手段1200に格納されているコンテンツ情報の中から当該検索語で指定された条件を充足するすべてのコンテンツ情報を検索する。そして、コンテンツ情報検索手段1420は、この条件を充足するコンテンツ情報を、それらに関連付けられた情報評判スコア及び情報提供スコアの少なくとも一方とともにコンテンツ情報格納手段1200から抽出し一時メモリ1010に格納する(ステップS122)。具体的には、例えば、コンテンツ情報検索手段1420は、一時メモリ1010から上述の検索語を読み出し、その検索語をキーとしてコンテンツ情報格納手段1200のコンテンツ情報リスト1600(図23)のKeywordsカラムを検索する。そして、コンテンツ情報検索手段1420は、この検索語と一致する語が存在するすべてのコンテンツ情報リスト1600のレコード(Scoreのカラム情報含む)を読み出し、一時メモリ1010に格納する。
【0089】
次に、コンテンツ情報提供リスト生成手段1430において、一時メモリ1010からステップS122で抽出されたレコードを、例えば情報評判スコアの値をキーとしてソートすることでコンテンツ情報提供リストを生成し、これを含むメッセージを一時メモリ1010に格納する(ステップS123)。具体的には、この例のコンテンツ提供情報リスト生成手段1430は、このコンテンツ情報リストに、利用者端末装置500−1〜pがwebブラウザを用いてこのリストを表示するために必要なHTMLタグを付与したメッセージを生成する。
その後、送信手段1440において、一時メモリ1010からステップS123で生成されたメッセージを読み込み、これを検索語に対する検索結果として、当該検索語を送信した利用者端末装置500−1〜pに送信する(ステップS124)。利用者端末装置500−1〜pは、このメッセージを受信し、例えばwebブラウザを用い、メッセージが有するコンテンツ情報リストを検索結果画面として表示する。
【0090】
<変形例等>
尚、本発明は上述の実施の形態に限定されるものではない。
例えば、情報提供リンク生成手段101eが、コンテンツ情報格納手段1200に格納された全てのレコードに対して情報提供リンク情報を生成するのではなく、評価が存在するコンテンツに対応する情報提供リンク情報のみを生成することとしてもよい。
図26は、この変形例に対応するスコア計算手段2104の構成を例示した図である。また、図27は、この変形例の処理を説明するためのフローを示した図である。
この変形例の場合、スコア計算手段104の代わりにスコア計算手段2104が配置される。また、前述した図21の処理の代わりに図27の処理が実行される。すなわち、まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS131)。次に、読み込み手段1301aにおいて、コンテンツ情報格納手段1200からv行目のコンテンツ情報(図23参照)を読み込み、一時メモリ1010に格納する。そして、情報提供リンク生成手段101eにおいて、v行目のコンテンツ情報のURIカラムの値をrefer−URIカラムの値とする他の行(レコード)が存在するか否かを検索する(ステップS132)。
【0091】
ここで、v行目のコンテンツ情報のURIカラムの値をrefer−URIカラムの値とする他の行が存在すると判断された場合、情報提供リンク生成手段101eは、一時メモリ1010から、v行目のblog−URIカラムのデータを利用者IDとし、v行目のURIカラムのデータをコンテンツIDとして読み込む。そして、情報提供リンク生成手段101eは、これらが関連付けられた情報提供リンク情報を生成し(ステップS133)、一時メモリ1010に格納する。そして、書き込み手段101gは、一時メモリ1010からこの情報提供リンク情報を読み出し、情報提供リンク格納手段102に格納する(ステップS134)。一方、ステップS132でv行目のコンテンツ情報におけるURIカラムの値を、refer−URIカラムにおける値とする他の行が存在しない判断された場合、情報提供リンク生成手段101eは、v行目のコンテンツ情報を用いた情報提供リンク情報の生成は行わない。
【0092】
次に、情報評価リンク生成手段101fにおいて、一時メモリ1010から、v行目のblog−URIカラムのデータを利用者IDとし、v行目のrefer−URIカラムのデータをコンテンツIDとして読み込む。そして、さらに情報評価リンク生成手段101fは、v行目のコンテンツ情報リスト1600がrefer−URIカラムのデータを含むか否かによって定まる値を評価情報として設定する。そして、情報評価リンク生成手段101fは、このように抽出した利用者ID、コンテンツID及び評価情報を対応付けた情報評価リンク情報を生成し、一時メモリ1010に格納する(ステップS135)。そして、書き込み手段101gは、一時メモリ1010からこの情報評価リンク情報を読み出し、情報評価リンク格納手段103に格納する(ステップS136)。
【0093】
次に、制御手段1020において、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値であるか否かを判断する(ステップS137)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS112に戻す(ステップS138)。一方、変数vがDocIDの最大値であれば、制御手段1020は、情報提供リンク情報及び情報評価リンク情報の算出処理を終了する。
その後、情報評判スコア推定手段2104f(図26)において、利用者の情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコアとしてコンテンツ情報格納手段1200に出力し、格納することとしてもよい。
【0094】
図28は、この場合の情報評判スコア推定手段2104fの処理を説明するためのフローの例示である。
この場合、まず、制御手段1020において、変数vに初期値を代入し、一時メモリ1010に格納する(ステップS141)。次に情報評判スコア推定手段2104fは、例えば、コンテンツ情報格納手段1200に格納されたv行目のコンテンツ情報リスト1600(図23参照)のscoreカラムにデータが格納されているか否かを判断する(ステップS142)。
【0095】
ここで、データが格納されていないと判断された場合、情報評判スコア推定手段2104fは、v行目のコンテンツ情報リスト1600のblog−URIカラムの値をキーとしてコンテンツ情報リスト1600のURIカラムを検索する。そして、情報評判スコア推定手段2104fは、このキーとURIカラムの値とが一致した行のScoreカラムの値をavに代入し、このav(利用者の情報提供スコア)を一時メモリ1010に格納する(ステップS143)。次に、v行目のコンテンツ情報リスト1600のblog−URIカラムの値をキーとしてコンテンツ情報リスト1600のblog−URIカラムのすべての行を検索し、blog−URIカラムの値がv行目のblog−URIカラムの値に等しい行の数を数え、それをnv(当該利用者が提供したコンテンツ数)として一時メモリ1010に格納する(ステップS144)。次に、情報評判スコア推定手段2104fは、一時メモリ1010からavとnvとを読み出し、avとnvとに依存した関数の演算を行う。そして、情報評判スコア推定手段2104fは、この演算結果(当該利用者が提供したコンテンツであって評価が存在しないものの情報評判スコア)を、v行目のコンテンツ情報リスト1600のScoreカラムに格納する(ステップS145)。尚、avとnvとに依存した関数としては、例えば、rj=av/sqrt(nv)を例示できる。ここでsqrt(X)はXの平方根を返す関数である。また、avはコンテンツjを提供したコンテンツ提供者vの情報提供スコアに相当し、nvはコンテンツ提供者vのコンテンツ提供数に相当する。
【0096】
ステップS145が終了した場合、或いは、ステップS142の判断においてコンテンツ情報格納手段1200に格納されたv行目のコンテンツ情報リスト1600のscoreカラムにデータが格納されていると判断された場合、制御手段1020は、以下のステップS146の処理を実行する。
まず、制御手段1020は、一時メモリ1010に格納されている変数vを読み込み、それがDocIDの最大値であるか否かを判断する(ステップS146)。ここで、変数vがDocIDの最大値でなければ、制御手段1020は、v+1の演算を行い、その演算結果を新たな変数vとして一時メモリ1010に格納し、処理をステップS142に戻す(ステップS147)。一方、変数vがDocIDの最大値であれば処理を終了する。
このような情報評判スコアの計算手法を採ることにより、blog記事のようにほとんどのコンテンツに対してリンクが張られていない(=情報評価リンク情報がない)場合に、情報評価装置1300による計算対象のコンテンツ数を著しく減少させることができる。その結果、高速なスコアの算出が可能となる。
【0097】
また、コンテンツ情報検索手段が、検索語に関連する記事を検索するのではなく、検索語に関連するコンテンツ提供者(blogに適用した場合にはblogger)を検索して出力することとしてもよい。これにより、利用者は、検索語に関連するオピニオンリーダのblogサイトを見つけることができる。そして、この利用者は、オピニオンリーダのblogサイトの記事を読むことで、検索語に関連した網羅的な知識を習得することが可能となる。このような検索語に関連する情報提供者のコンテンツ提供者リストを生成する一つの方法は、検索語を含むコンテンツを1件でも書いたコンテンツ提供者のリストを作成し、それを情報提供スコアでソートするという方法である。しかし、情報提供スコアは、検索語が与えられる前に、一定時間間隔等を契機に事前に情報提供リンク情報と情報評価リンク情報を抽出して計算されているものである。そのため、この情報提供スコアの値と関連語との関連性は低い。従って、情報提供スコアによって検索結果のコンテンツ提供者リストをソートした場合、高い情報提供スコアを持つ情報提供者がたまたま1件の関連語を含む記事を記載すると直ちにコンテンツ提供者リストの上位になってしまう可能性がある。
【0098】
そこでこの例の情報評判スコア集計手段は、検索語の条件を充足する複数のコンテンツの情報評判スコアをコンテンツ提供者毎に集計し、この集計したスコアに基づいて、その検索語に関する記事を書いたコンテンツ提供者のリストをソートし、コンテンツ提供者リストを生成する。そして、この例の情報評判スコア集計手段は、このコンテンツ提供者リストを検索語に対する検索結果として利用者端末装置500−1〜pに送信する。
図29は、このようなコンテンツ情報検索手段2400の構成を例示した図である。また、図30は、コンテンツ情報検索手段2400の処理を説明するためのフローを例示した図である。
【0099】
コンテンツ情報検索手段2400は、受信手段1410において、検索語を含む検索条件を受信すると(ステップS151)、一時メモリ1010にその検索条件のデータを格納する。次に、コンテンツ情報検索手段1420において、一時メモリ1010から検索条件のデータを読み出し、コンテンツ情報格納手段1200のコンテンツ情報リスト1600(図23)から、keywordsカラムのデータがこの検索条件を充足し、blog−URIのカラムが<nil>でない全てのコンテンツ情報の行を、それらに関連付けられている情報評判スコア(Scoreカラムのデータ)とともに抽出し、それらを関連付けて一時メモリ1010に格納する(ステップS152)。次に、情報評判スコア集計手段2450が、一時メモリ1010に格納された情報評判スコアを、それに関連付けられたコンテンツ情報のblog−URIカラムの値(コンテンツ提供者情報)毎に加算する。そして、情報評判スコア集計手段2450は、この加算値と対応するblog−URIカラムの値とを一時メモリ1010に出力して格納する(ステップS153)。その後、コンテンツ情報提供リスト生成手段1430において、一時メモリ1010から、加算値と、それに対応するblog−URIカラムの値とを読み出し、加算値をキーとしてblog−URIカラムの値を並び替えて生成したリストを含むメッセージを生成し、一時メモリ1010に格納する。さらに、このメッセージは、一時メモリ1010から送信手段1440に送られ、送信手段144は、このメッセージを、検索条件を送信した利用者端末装置500−1〜pに送信する。
その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
【0100】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0101】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。尚、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0102】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
【図面の簡単な説明】
【0103】
【図1】図1は、第1の実施の形態における情報評価システムの構成を示す図である。
【図2】図2は、図1における情報取得手段の詳細構成を例示した図である。
【図3】図3は、図1におけるスコア計算手段の詳細構成を例示した図である。
【図4】図1におけるスコア出力手段の詳細構成を例示した図である。
【図5】図5は、情報取得手段の処理の詳細を説明するためのフローを示す図である。
【図6】図6(a)は、このように受信されるコンテンツ提供メッセージのデータ構成の例示であり、図6(b)はコンテンツ評価メッセージの例である。
【図7】図7(a)は、情報提供リンク情報のデータ構成を例示する図である。図7(b)は、情報評価リンク情報のデータ構成を示す図である。
【図8】利用者からコンテンツに対する2種類のリンクを示した概念図である。
【図9】図9は、スコア計算手段の処理を説明するためのフローを例示した図である。
【図10】図10(a)は、情報評判スコア格納手段が管理するデータ構造図である。図10(b)は、情報提供スコア格納手段および情報評価スコア格納手段が管理するデータ構造図である。
【図11】図11は、スコア出力手段の処理の詳細を説明するためのフローを示す図である。
【図12】図12(a)は、スコア計算手段の反復計算手順を行列表現で示す図である。図12(b)は、スコア計算手段の反復計算手順を要素表現で示す図である。
【図13】図13は、図12のアルゴリズムによってr、a、hを算出する場合の処理を説明するためのフローを例示した図である。
【図14】図14は、第2の実施の形態におけるコンテンツ検索システムの構成を示す図である。
【図15】図15は、図14のコンテンツ情報収集手段の詳細構成を例示した図である。
【図16】図16は、図14の情報評価装置の詳細構成を例示した図である。
【図17】図17は、図16の情報取得手段の詳細構成を例示した図である。
【図18】図18は、図16におけるスコア計算手段の詳細構成を例示した図である。
【図19】図19は、図14におけるコンテンツ情報検索手段の詳細構成を例示した図である。
【図20】図20は、第2の実施の形態のスコア算出処理を説明するためのフローを示した図である。
【図21】図21は、第2の実施の形態における、情報提供リンク情報及び情報評価リンク情報の算出処理の詳細を説明するためのフローを示した図である。
【図22】図22は、ブログ情報を例示した概念図である。
【図23】図23は、コンテンツ情報リストを例示した概念図である。
【図24】図24(a)は、情報提供リンク情報のデータ構成を例示する図である。図24(b)は、情報評価リンク情報のデータ構成を示す図である。
【図25】図25は、コンテンツ情報検索処理の詳細を説明するためのフローを示した図である。
【図26】図26は、スコア計算手段の変形例の構成を例示した図である。
【図27】図27は、スコア計算手段の処理の変形例を説明するためのフローを示した図である。
【図28】図28は、情報評判スコア推定手段の処理を説明するためのフローの例示である。
【図29】図29は、コンテンツ情報検索手段の変形例の構成を例示した図である。
【図30】図30は、コンテンツ情報検索手段の処理の変形例を説明するためのフローを例示した図である。
【符号の説明】
【0104】
1 情報評価システム
100 情報評価装置
200−1〜m,500−1〜p 利用者端末装置
300 ネットワーク
600−1〜q コンテンツサーバ装置
1000 コンテンツ検索装置
【特許請求の範囲】
【請求項1】
利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア、コンテンツを提供した利用者の情報提供能力を数値化した情報提供スコア、及びコンテンツを評価した利用者の情報評価能力を数値化した情報評価スコアの少なくとも一つを算出する情報評価装置において、
コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を格納する情報提供リンク格納手段と、
コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を格納する情報評価リンク格納手段と、
前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と何れかの前記スコアとの間の定義された関係を示す行列)の固有ベクトルを算出し、この固有ベクトルの要素を何れかの前記スコアとして、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させるスコア計算手段と、を備える、
ことを特徴とする情報評価装置。
【請求項2】
請求項1に記載の情報評価装置であって、
前記スコア計算手段が、
さらに前記情報提供リンク情報又は前記情報評価リンク情報と前記固有ベクトルとを用い、これらと何れかの前記スコアとの定義された関係を示す関係式に従い、何れかの前記スコアを算出し、当該スコアを情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させる手段である、
ことを特徴とする情報評価装置。
【請求項3】
請求項1に記載の情報評価装置であって、
前記スコア計算手段が、
前記情報提供リンク格納手段に格納された前記情報提供リンク情報を検索し、前記利用者IDと前記コンテンツIDとの組合せ毎に、当該組合せを有する前記情報提供リンク情報の個数を数え、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)を生成して出力する第1隣接行列生成手段と、
前記情報評価リンク格納手段に格納された前記情報評価リンク情報を検索し、前記利用者IDと前記コンテンツIDとの組合せ毎に、当該組合せを有する前記情報評価リンク情報の前記評価情報の値を加算し、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)を生成して出力する第2隣接行列生成手段と、
前記情報提供リンク隣接行列と前記情報評価リンク隣接行列とから、前記スコア推移行列(前記情報提供リンク隣接行列と前記情報評価リンク隣接行列と何れかの前記スコアとの関係を示す行列)の固有ベクトルを算出し、この固有ベクトルの要素を何れかの前記スコアとして出力する固有ベクトル算出手段と、
前記スコアを、前記情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段の何れかに格納させる書き込み手段と、
を備える手段である、
ことを特徴とする情報評価装置。
【請求項4】
請求項3に記載の情報評価装置であって、
前記スコア計算手段が、
前記情報提供リンク隣接行列又は前記情報評価リンク隣接行列と前記固有ベクトルとを、これらと何れかの前記スコアとの定義された関係を示す関係式に代入し、当該スコアを算出して出力するスコア算出手段をさらに具備する手段である、
ことを特徴とする情報評価装置。
【請求項5】
請求項3に記載の情報評価装置であって、
前記固有ベクトル算出手段が、
前記情報提供リンク隣接行列の各要素を、それぞれの前記利用者IDに対応する要素の集合毎に、「前記情報提供リンク格納手段において当該利用者IDに関連付けられている前記コンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報提供リンク隣接行列を出力する第1正規化手段と、
前記情報評価リンク隣接行列の各要素を、それぞれの前記利用者IDに対応する要素の集合毎に、「前記情報評価リンク格納手段において当該利用者IDに関連付けられている前記コンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報評価リンク隣接行列を出力する第2正規化手段と、
前記正規化された情報提供リンク隣接行列と前記正規化された情報評価リンク隣接行列とを用いて前記固有ベクトルを算出し、この固有ベクトルの要素を何れかの前記スコアとして出力する演算手段と、
を備える手段である、
ことを特徴とする情報評価装置。
【請求項6】
請求項3に記載の情報評価装置であって、
前記スコア推移行列Sが、
前記情報提供リンク隣接行列をCとし、前記情報評価リンク隣接行列をEとし、αを0以上1以下の実数とし、βTをβの転置行列とした場合における、
S=αCTC+(1−α)ETE、S=CETECT、或いはS=ECTCET
の何れかである、
ことを特徴とする情報評価装置。
【請求項7】
コンテンツサーバ装置に格納されたコンテンツに関する情報を提供するコンテンツ検索装置であって、
前記コンテンツが有する情報であるコンテンツ情報を受信するコンテンツ情報受信手段と、
前記コンテンツ情報を格納するコンテンツ情報格納手段と、
前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を生成して出力する情報提供リンク生成手段と、
前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を生成して出力する情報評価リンク生成手段と、
前記情報提供リンク情報を格納する情報提供リンク格納手段と、
前記情報評価リンク情報を格納する情報評価リンク格納手段と、
前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と情報評判スコア又は情報提供スコアとの間の定義された関係を示す行列)の固有ベクトルを算出して、この固有ベクトルの要素を各コンテンツ情報に対応する前記情報評判スコア又は前記情報提供スコアとして出力する固有ベクトル算出手段と、
前記情報評判スコア又は前記情報提供スコアを、対応する前記コンテンツ情報に関連付けて、前記コンテンツ情報格納手段に格納させる書き込み手段と、
利用者端末装置から送信された検索条件を受信する検索条件受信手段と、
前記検索条件を充足する前記コンテンツ情報を、それらに関連付けられた前記情報評判スコア及び前記情報提供スコアの少なくとも一方とともに前記コンテンツ情報格納手段から抽出する検索手段と、を備える、
ことを特徴とするコンテンツ検索装置。
【請求項8】
請求項7に記載のコンテンツ検索装置であって、
前記情報提供リンク情報又は前記情報評価リンク情報と前記固有ベクトルとを用い、これらと前記情報評判スコア又は前記情報提供スコアとの定義された関係を示す関係式に従い、各コンテンツ情報に対応する前記情報評判スコア又は前記情報提供スコアを算出し、当該スコアを出力するスコア算出手段をさらに備える、
ことを特徴とするコンテンツ検索装置。
【請求項9】
請求項8に記載のコンテンツ検索装置であって、
前記情報提供リンク生成手段が、
評価が存在するコンテンツに対応する前記情報提供リンク情報のみを生成する手段であり、
当該コンテンツ検索装置が、
利用者の前記情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの前記情報評判スコアとして出力する情報評判スコア推定手段をさらに備える、
ことを特徴とするコンテンツ検索装置。
【請求項10】
請求項7或いは8の何れかに記載のコンテンツ検索装置であって、
前記コンテンツ情報が、
コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報を含み、
前記検索手段が、
前記検索条件を充足する前記コンテンツ情報を、当該コンテンツ情報に関連付けられた前記情報評判スコアとともに、前記コンテンツ情報格納手段から抽出する手段であり、
当該コンテンツ検索装置が、
前記検索手段において抽出された前記情報評判スコアを、前記コンテンツ情報が有する前記コンテンツ提供者情報毎に加算し、各加算値を当該コンテンツ提供者情報ともに出力する情報評判スコア集計手段をさらに備える、
ことを特徴とするコンテンツ検索装置。
【請求項11】
請求項7に記載のコンテンツ検索装置であって、
前記コンテンツ情報が、
コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報と、当該コンテンツのアドレスを示すコンテンツアドレス情報と、他のコンテンツのアドレスを示すポインタ情報とを含む情報であり、
前記情報提供リンク生成手段が、
前記コンテンツ提供者情報を前記利用者IDとし、前記コンテンツアドレス情報を前記コンテンツIDとして、前記情報提供リンク情報を生成する手段であり、
前記情報評価リンク生成手段が、
前記コンテンツ提供者情報を前記利用者IDとし、前記ポインタ情報を前記コンテンツIDとし、前記コンテンツ情報が前記ポインタ情報を含むか否かによって定まる値を前記評価情報として、前記情報評価リンク情報を生成する手段である、
ことを特徴とするコンテンツ検索装置。
【請求項12】
請求項11に記載のコンテンツ検索装置であって、
前記情報評価リンク生成手段が、
トラックバック以外の前記ポインタ情報を用いて前記情報評価リンク情報を生成する手段である、
ことを特徴とするコンテンツ検索装置。
【請求項13】
利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア、コンテンツを提供した利用者の情報提供能力を数値化した情報提供スコア、及びコンテンツを評価した利用者の情報評価能力を数値化した情報評価スコアの少なくとも一つを算出する情報評価方法において、
情報提供リンク格納手段に、コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を格納するステップと、
情報評価リンク格納手段に、コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を格納するステップと、
スコア計算手段において、前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と何れかの前記スコアとの間の定義された関係を示す行列)の固有ベクトルを算出するステップと、
前記スコア計算手段において、前記固有ベクトルの要素を何れかの前記スコアとして、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させるステップと、を備える、
ことを特徴とする情報評価方法。
【請求項14】
コンテンツサーバ装置に格納されたコンテンツ関する情報を提供するコンテンツ検索方法であって、
コンテンツ情報受信手段において、前記コンテンツが有する情報であるコンテンツ情報を受信するステップと、
前記コンテンツ情報をコンテンツ情報格納手段に格納するステップと、
情報提供リンク生成手段において、前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を生成するステップと、
前記情報提供リンク情報を情報提供リンク格納手段に格納するステップと、
情報評価リンク生成手段において、前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を生成するステップと、
前記情報評価リンク情報を情報評価リンク格納手段に格納するステップと、
固有ベクトル算出手段において、前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と情報評判スコア又は情報提供スコアとの間の定義された関係を示す行列)の固有ベクトルを算出して、この固有ベクトルの要素を各コンテンツ情報に対応する前記情報評判スコア又は前記情報提供スコアとして出力するステップと、
書き込み手段において、前記情報評判スコア又は前記情報提供スコアを、対応する前記コンテンツ情報に関連付けて、前記コンテンツ情報格納手段に格納させるステップと、
検索条件受信手段において、利用者端末装置から送信された検索条件を受信するステップと、
検索手段において、前記検索条件を充足する前記コンテンツ情報を、それらに関連付けられた前記情報評判スコア及び前記情報提供スコアの少なくとも一方とともに前記コンテンツ情報格納手段から抽出して出力するステップと、を備える、
ことを特徴とするコンテンツ検索方法。
【請求項15】
請求項1から6の何れかに記載の情報評価装置又は請求項7から14の何れかに記載のコンテンツ検索装置としてコンピュータを機能させるためのプログラム。
【請求項16】
請求項15に記載のプログラムを格納したコンピュータ読み取り可能な記録媒体。
【請求項1】
利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア、コンテンツを提供した利用者の情報提供能力を数値化した情報提供スコア、及びコンテンツを評価した利用者の情報評価能力を数値化した情報評価スコアの少なくとも一つを算出する情報評価装置において、
コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を格納する情報提供リンク格納手段と、
コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を格納する情報評価リンク格納手段と、
前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と何れかの前記スコアとの間の定義された関係を示す行列)の固有ベクトルを算出し、この固有ベクトルの要素を何れかの前記スコアとして、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させるスコア計算手段と、を備える、
ことを特徴とする情報評価装置。
【請求項2】
請求項1に記載の情報評価装置であって、
前記スコア計算手段が、
さらに前記情報提供リンク情報又は前記情報評価リンク情報と前記固有ベクトルとを用い、これらと何れかの前記スコアとの定義された関係を示す関係式に従い、何れかの前記スコアを算出し、当該スコアを情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させる手段である、
ことを特徴とする情報評価装置。
【請求項3】
請求項1に記載の情報評価装置であって、
前記スコア計算手段が、
前記情報提供リンク格納手段に格納された前記情報提供リンク情報を検索し、前記利用者IDと前記コンテンツIDとの組合せ毎に、当該組合せを有する前記情報提供リンク情報の個数を数え、当該個数を当該組合せに対応する行列成分の要素とした隣接行列(情報提供リンク隣接行列)を生成して出力する第1隣接行列生成手段と、
前記情報評価リンク格納手段に格納された前記情報評価リンク情報を検索し、前記利用者IDと前記コンテンツIDとの組合せ毎に、当該組合せを有する前記情報評価リンク情報の前記評価情報の値を加算し、当該加算値を当該組合せに対応する行列成分の要素とした隣接行列(情報評価リンク隣接行列)を生成して出力する第2隣接行列生成手段と、
前記情報提供リンク隣接行列と前記情報評価リンク隣接行列とから、前記スコア推移行列(前記情報提供リンク隣接行列と前記情報評価リンク隣接行列と何れかの前記スコアとの関係を示す行列)の固有ベクトルを算出し、この固有ベクトルの要素を何れかの前記スコアとして出力する固有ベクトル算出手段と、
前記スコアを、前記情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段の何れかに格納させる書き込み手段と、
を備える手段である、
ことを特徴とする情報評価装置。
【請求項4】
請求項3に記載の情報評価装置であって、
前記スコア計算手段が、
前記情報提供リンク隣接行列又は前記情報評価リンク隣接行列と前記固有ベクトルとを、これらと何れかの前記スコアとの定義された関係を示す関係式に代入し、当該スコアを算出して出力するスコア算出手段をさらに具備する手段である、
ことを特徴とする情報評価装置。
【請求項5】
請求項3に記載の情報評価装置であって、
前記固有ベクトル算出手段が、
前記情報提供リンク隣接行列の各要素を、それぞれの前記利用者IDに対応する要素の集合毎に、「前記情報提供リンク格納手段において当該利用者IDに関連付けられている前記コンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報提供リンク隣接行列を出力する第1正規化手段と、
前記情報評価リンク隣接行列の各要素を、それぞれの前記利用者IDに対応する要素の集合毎に、「前記情報評価リンク格納手段において当該利用者IDに関連付けられている前記コンテンツIDの数に依存した関数」によって正規化し、当該正規化された情報評価リンク隣接行列を出力する第2正規化手段と、
前記正規化された情報提供リンク隣接行列と前記正規化された情報評価リンク隣接行列とを用いて前記固有ベクトルを算出し、この固有ベクトルの要素を何れかの前記スコアとして出力する演算手段と、
を備える手段である、
ことを特徴とする情報評価装置。
【請求項6】
請求項3に記載の情報評価装置であって、
前記スコア推移行列Sが、
前記情報提供リンク隣接行列をCとし、前記情報評価リンク隣接行列をEとし、αを0以上1以下の実数とし、βTをβの転置行列とした場合における、
S=αCTC+(1−α)ETE、S=CETECT、或いはS=ECTCET
の何れかである、
ことを特徴とする情報評価装置。
【請求項7】
コンテンツサーバ装置に格納されたコンテンツに関する情報を提供するコンテンツ検索装置であって、
前記コンテンツが有する情報であるコンテンツ情報を受信するコンテンツ情報受信手段と、
前記コンテンツ情報を格納するコンテンツ情報格納手段と、
前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を生成して出力する情報提供リンク生成手段と、
前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を生成して出力する情報評価リンク生成手段と、
前記情報提供リンク情報を格納する情報提供リンク格納手段と、
前記情報評価リンク情報を格納する情報評価リンク格納手段と、
前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と情報評判スコア又は情報提供スコアとの間の定義された関係を示す行列)の固有ベクトルを算出して、この固有ベクトルの要素を各コンテンツ情報に対応する前記情報評判スコア又は前記情報提供スコアとして出力する固有ベクトル算出手段と、
前記情報評判スコア又は前記情報提供スコアを、対応する前記コンテンツ情報に関連付けて、前記コンテンツ情報格納手段に格納させる書き込み手段と、
利用者端末装置から送信された検索条件を受信する検索条件受信手段と、
前記検索条件を充足する前記コンテンツ情報を、それらに関連付けられた前記情報評判スコア及び前記情報提供スコアの少なくとも一方とともに前記コンテンツ情報格納手段から抽出する検索手段と、を備える、
ことを特徴とするコンテンツ検索装置。
【請求項8】
請求項7に記載のコンテンツ検索装置であって、
前記情報提供リンク情報又は前記情報評価リンク情報と前記固有ベクトルとを用い、これらと前記情報評判スコア又は前記情報提供スコアとの定義された関係を示す関係式に従い、各コンテンツ情報に対応する前記情報評判スコア又は前記情報提供スコアを算出し、当該スコアを出力するスコア算出手段をさらに備える、
ことを特徴とするコンテンツ検索装置。
【請求項9】
請求項8に記載のコンテンツ検索装置であって、
前記情報提供リンク生成手段が、
評価が存在するコンテンツに対応する前記情報提供リンク情報のみを生成する手段であり、
当該コンテンツ検索装置が、
利用者の前記情報提供スコアと当該利用者が提供したコンテンツ数とに依存した関数の演算結果を、当該利用者が提供したコンテンツであって評価が存在しないものの前記情報評判スコアとして出力する情報評判スコア推定手段をさらに備える、
ことを特徴とするコンテンツ検索装置。
【請求項10】
請求項7或いは8の何れかに記載のコンテンツ検索装置であって、
前記コンテンツ情報が、
コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報を含み、
前記検索手段が、
前記検索条件を充足する前記コンテンツ情報を、当該コンテンツ情報に関連付けられた前記情報評判スコアとともに、前記コンテンツ情報格納手段から抽出する手段であり、
当該コンテンツ検索装置が、
前記検索手段において抽出された前記情報評判スコアを、前記コンテンツ情報が有する前記コンテンツ提供者情報毎に加算し、各加算値を当該コンテンツ提供者情報ともに出力する情報評判スコア集計手段をさらに備える、
ことを特徴とするコンテンツ検索装置。
【請求項11】
請求項7に記載のコンテンツ検索装置であって、
前記コンテンツ情報が、
コンテンツを提供した利用者に対応する情報であるコンテンツ提供者情報と、当該コンテンツのアドレスを示すコンテンツアドレス情報と、他のコンテンツのアドレスを示すポインタ情報とを含む情報であり、
前記情報提供リンク生成手段が、
前記コンテンツ提供者情報を前記利用者IDとし、前記コンテンツアドレス情報を前記コンテンツIDとして、前記情報提供リンク情報を生成する手段であり、
前記情報評価リンク生成手段が、
前記コンテンツ提供者情報を前記利用者IDとし、前記ポインタ情報を前記コンテンツIDとし、前記コンテンツ情報が前記ポインタ情報を含むか否かによって定まる値を前記評価情報として、前記情報評価リンク情報を生成する手段である、
ことを特徴とするコンテンツ検索装置。
【請求項12】
請求項11に記載のコンテンツ検索装置であって、
前記情報評価リンク生成手段が、
トラックバック以外の前記ポインタ情報を用いて前記情報評価リンク情報を生成する手段である、
ことを特徴とするコンテンツ検索装置。
【請求項13】
利用者から提供された電子情報であるコンテンツの評判を数値化した情報評判スコア、コンテンツを提供した利用者の情報提供能力を数値化した情報提供スコア、及びコンテンツを評価した利用者の情報評価能力を数値化した情報評価スコアの少なくとも一つを算出する情報評価方法において、
情報提供リンク格納手段に、コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を格納するステップと、
情報評価リンク格納手段に、コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を格納するステップと、
スコア計算手段において、前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と何れかの前記スコアとの間の定義された関係を示す行列)の固有ベクトルを算出するステップと、
前記スコア計算手段において、前記固有ベクトルの要素を何れかの前記スコアとして、情報評判スコア格納手段、情報提供スコア格納手段又は情報評価スコア格納手段に格納させるステップと、を備える、
ことを特徴とする情報評価方法。
【請求項14】
コンテンツサーバ装置に格納されたコンテンツ関する情報を提供するコンテンツ検索方法であって、
コンテンツ情報受信手段において、前記コンテンツが有する情報であるコンテンツ情報を受信するステップと、
前記コンテンツ情報をコンテンツ情報格納手段に格納するステップと、
情報提供リンク生成手段において、前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを提供した利用者の利用者IDと、前記利用者によって提供されたコンテンツの識別子であるコンテンツIDと、が関連付けられた情報提供リンク情報を生成するステップと、
前記情報提供リンク情報を情報提供リンク格納手段に格納するステップと、
情報評価リンク生成手段において、前記コンテンツ情報格納手段に格納された前記コンテンツ情報を用い、コンテンツを評価した利用者の利用者IDと、前記利用者によって評価されたコンテンツの識別子であるコンテンツIDと、前記コンテンツの評価者が前記コンテンツに対して行った評価の数値情報である評価情報と、が関連付けられた情報評価リンク情報を生成するステップと、
前記情報評価リンク情報を情報評価リンク格納手段に格納するステップと、
固有ベクトル算出手段において、前記情報提供リンク情報と前記情報評価リンク情報とを用い、スコア推移行列(前記情報提供リンク情報と前記情報評価リンク情報と情報評判スコア又は情報提供スコアとの間の定義された関係を示す行列)の固有ベクトルを算出して、この固有ベクトルの要素を各コンテンツ情報に対応する前記情報評判スコア又は前記情報提供スコアとして出力するステップと、
書き込み手段において、前記情報評判スコア又は前記情報提供スコアを、対応する前記コンテンツ情報に関連付けて、前記コンテンツ情報格納手段に格納させるステップと、
検索条件受信手段において、利用者端末装置から送信された検索条件を受信するステップと、
検索手段において、前記検索条件を充足する前記コンテンツ情報を、それらに関連付けられた前記情報評判スコア及び前記情報提供スコアの少なくとも一方とともに前記コンテンツ情報格納手段から抽出して出力するステップと、を備える、
ことを特徴とするコンテンツ検索方法。
【請求項15】
請求項1から6の何れかに記載の情報評価装置又は請求項7から14の何れかに記載のコンテンツ検索装置としてコンピュータを機能させるためのプログラム。
【請求項16】
請求項15に記載のプログラムを格納したコンピュータ読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【公開番号】特開2006−202253(P2006−202253A)
【公開日】平成18年8月3日(2006.8.3)
【国際特許分類】
【出願番号】特願2005−128413(P2005−128413)
【出願日】平成17年4月26日(2005.4.26)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
【公開日】平成18年8月3日(2006.8.3)
【国際特許分類】
【出願日】平成17年4月26日(2005.4.26)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
[ Back to top ]