説明

集団知性を用いた推薦システム及びその方法

【課題】集団知性を用いた推薦システム及びその方法を開示する。
【解決手段】集団知性を用いた推薦システムは、商品と関連してインターネット上に掲示された評点情報を、評点情報を掲示したユーザ、及び商品と関連して収集する評点情報収集部と、評点情報を用いてユーザ間の類似度を測定した後に、ユーザ間の類似度によってユーザをクラスタリングしたクラスタを生成する類似性向ユーザクラスタ生成部と、サービス対象者が属するクラスタに含まれるユーザの評点情報を基にサービス対象者に商品に対する推薦サービスを提供するサービス提供部とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、集団知性(Collective intelligence)を用いて似た性向を有する人々が推薦する商品を提供できる推薦システム及びその方法に関する。
【背景技術】
【0002】
映画や小説のような娯楽作品を消費するときには、絶対的な評価よりは好みに沿った相対的な評価がさらに重要な役割を担うことがある。
【0003】
ポータルサイトやインターネット書店に書き込まれる映画評や書評などを利用すれば、当該作品に対する大衆の評価を容易に知ることが出来るが、自分と好みの似た人々がこの作品をどのように評価したかを知ることは難しい。
【0004】
集団知性を用いた推薦システムは、多くの分野で応用されているものの、多くのユーザの評価データベースを構築することは困難である。また、当該サービスを充分に利用するためには、自分の情報(例えば、自分が好む商品など)をまず入力しなければならないという進入障壁が存在し得る。
【発明の概要】
【発明が解決しようとする課題】
【0005】
マイクロブログ、ポータルサイトの評点サイトなどで個人が商品の評点を記録した評価文書を収集して集団の商品評価データベースを構築できる集団知性を用いた推薦システム及びその方法を提供する。
【0006】
集団の商品評価データベースを用いて似た性向を有するユーザが推薦する商品情報を提示できる集団知性を用いた推薦システム及びその方法を提供する。
【課題を解決するための手段】
【0007】
本発明の実施形態によれば、商品と関連し、インターネット上に掲示された評点情報を、評点情報を掲示したユーザ、及び商品と関連して収集する評点情報収集部と、評点情報を用いてユーザ間の類似度を測定した後に、ユーザ間の類似度によってユーザをクラスタリングしたクラスタを生成する類似性向ユーザクラスタ生成部と、サービス対象者が属するクラスタに含まれるユーザの評点情報を基にサービス対象者に商品に対する推薦サービスを提供するサービス提供部とを含む集団知性を用いた推薦システムが提供される。
【0008】
また、集団知性を用いた推薦システムは、インターネット上に掲示された掲示文書を収集する文書収集部と、掲示文書のうち商品と関連する掲示文書を抽出する文書フィルタリング部と、掲示文書に対する単語肯定度を算出する肯定度算出部とをさらに含んでもよい。ここで、評点情報収集部は、単語肯定度を商品の評点情報として収集してもよい。
【0009】
また、集団知性を用いた推薦システムは、商品と関連する少なくとも1つのキーワードを保持する商品キーワードデータベースをさらに含んでもよい。ここで、文書フィルタリング部は、商品キーワードデータベースを基にキーワードとマッチングされる単語が含まれる掲示文書を抽出してもよい。
【0010】
また、集団知性を用いた推薦システムは、肯定語に該当する肯定的キーワード及び肯定的キーワード別に付与された肯定語加重値と、否定語に該当する否定的キーワード及び否定的キーワード別に付与された否定語加重値を保持する肯定/否定キーワードデータベースをさらに含んでもよい。ここで、肯定度算出部は、肯定/否定キーワードデータベースを基に掲示文書から肯定的キーワードまたは否定的キーワードにマッチングされる単語を抽出した後、抽出された単語に対応する肯定語加重値または否定語加重値に基づいて単語肯定度を算出してもよい。
【0011】
また、評点情報収集部は、少なくとも1つのウェブサイトから収集されたユーザのサイトID、及びサイトIDごとに割り当てられたユニークキーを保持するユーザデータベースと、ユーザデータベースを基にユーザが掲示した評点情報を商品のID、及びユーザのユニークキー値によって管理する評点情報データベースとを含んでもよい。ここで、ユーザデータベースは、サイトIDのうちIDが同一のサイトIDに対して互いに異なる値のユニークキーが割り当てられるが、ユーザの認証によって同一ユーザと判断されれば、ユニークキーが同じ値に再び割当てられてもよい。
【0012】
また、ユーザ間の類似度はユーザ間に同一の商品の評点情報を比較した値であり、類似性向ユーザクラスタ生成部はユーザごとにそれぞれ異なるユーザとの類似度を保持する類似度データベースと、ユーザ間の類似度が設定値(threshold)以上であるユーザを同じクラスタで管理するクラスタデータベースとを含んでもよい。
【0013】
また、集団知性を用いた推薦システムは、サービス対象者がクラスタに含まれていない場合、インターネット上に評点情報を掲示したユーザを対象にサービス対象者との類似度が設定値以上であるユーザを検索する類似性向ユーザ検索部と、サービス対象者に対する前記検索されたユーザとの類似度を類似度データベースに更新した後に当該サービス対象者をクラスタデータベースに追加するデータベース更新部とをさらに含んでもよい。
【0014】
また、サービス提供部は、サービス対象者が属するクラスタに対し、商品別にユーザの評点情報に当該ユーザとの類似度をかけた加重値の合計をユーザ間類似度の合計で割って商品に対する最終評点を算出する最終評点算出部と、最終評点を基準として商品を推薦する商品推薦部とを含んでもよい。
【0015】
また、本発明の一実施形態によれば、集団知性を用いて商品を推薦する推薦方法において、商品と関連してインターネット上に掲示された評点情報を、評点情報を掲示したユーザ及び商品と関連して収集する評点情報収集ステップと、評点情報を用いてユーザ間の類似度を測定した後に、ユーザ間の類似度によってユーザをクラスタリングしたクラスタを生成する類似性向ユーザクラスタ生成ステップと、サービス対象者が属するクラスタに含まれるユーザの評点情報を基にサービス対象者に商品に対する推薦サービスを提供するサービス提供ステップとを含む集団知性を用いた推薦方法が提供される。
【発明の効果】
【0016】
ポータルサイトの評点サイト、または個人が利用するマイクロブログを収集して集団の商品評価データベースを構築し、サービス対象者が別途好みの情報を入力しなくても類似性向を有するユーザの評点に基づく推薦サービスを提供することができる。したがって、集団知性のデータベースを利用すれば、サービス対象者と似た好みを有するユーザが推薦する商品情報を得ることができる。
【図面の簡単な説明】
【0017】
【図1】本発明の一実施形態において、類似性向集団の商品評価データベースを構築し、これにより推薦サービスを提供する集団知性を用いた推薦システムの内部構成を示すブロック図である。
【図2】評点情報を収集する一例を説明するための図である。
【図3】本発明の一実施形態において、インターネット上に掲示された評点情報とこれを掲示したユーザを収集してデータベース化した評点情報収集部の構成を示すブロック図である。
【図4】本発明の一実施形態において、マイクロブログから収集された掲示文書のフィルタリングによって評点情報とユーザをデータベース化する集団知性を用いた推薦システムの追加構成を示すブロック図である。
【図5】本発明の一実施形態において、似た性向のユーザをクラスタリングした類似性向ユーザクラスタ生成部の構成を示すブロック図である。
【図6】似た性向のユーザをクラスタリングする一例を説明するための図である。
【図7】本発明の一実施形態において、データベースに含まれていないユーザに対する似た性向のユーザを検索してデータベースを更新する集団知性を用いた推薦システムの追加構成を示すブロック図である。
【図8】本発明の一実施形態において、類似性向を有するユーザの評点情報を用いて商品を推薦するサービス提供部の構成を示すブロック図である。
【図9】本発明の一実施形態において、類似性向集団の商品評価データベースを構築し、これにより推薦サービスを提供する集団知性を用いた推薦方法を示すフローチャートである。
【発明を実施するための形態】
【0018】
以下、本発明の実施形態を添付する図面を参照しながら詳細に説明する。
【0019】
図1は、本発明の一実施形態において、類似性向を示す集団の商品評価データベースを構築し、これにより推薦サービスを提供する集団知性を用いた推薦システムの内部構成を示すブロック図である。図1は、商品に対する大衆の評価を土台にサービス対象者に商品を推薦する集団知性を用いた推薦システム100を示すものである。
【0020】
本実施の形態によれば、「商品」は、映画、演劇、小説などの娯楽作品だけでなく、販売を目的とする物やサービスなどを包含した意味であってもよい。
【0021】
一実施形態に係る推薦システム100は、評点情報収集部110、類似性向ユーザクラスタ生成部120、サービス提供部130を含んでもよい。
【0022】
評点情報収集部110は、商品と関連してインターネット上に掲示された評点情報を、掲示者であるユーザ及び当該商品の情報と関連させて収集及び格納する手段を意味する。評点情報収集部110は、商品を紹介する商品紹介サイト(例えば、映画紹介サイト)の評点サイトで評点情報を収集する方式、または、マイクロブログ(micro blog)に掲示された掲示文書で評点情報を抽出して収集する方式によってユーザ別の評点情報をデータベースに構築してもよい。
【0023】
類似性向ユーザクラスタ生成部120は、ユーザ別の評点情報に基づいて測定されたユーザ間の類似度によってユーザをクラスタリング(clustering)するユーザクラスタを生成する役割を担う。同時に、類似性向ユーザクラスタ生成部120は、ユーザ間の類似度、及びユーザクラスタを格納する手段を意味する。すなわち、類似性向ユーザクラスタ生成部120によってユーザごとにそれぞれ異なるユーザとの類似度を保持及び管理し、似た性向のユーザを同じクラスタで保持及び管理してもよい。
【0024】
サービス提供部130は、推薦サービスの提供を受けようとするサービス対象者が属するクラスタを確認した後、サービス対象者が属するクラスタ内のユーザの評点情報を基にサービス対象者に商品に対する推薦サービスを提供してもよい。換言すれば、サービス提供部130は、クラスタを介してサービス対象者と類似性向を有するユーザの評点情報を用いて類似性向のユーザが推薦する商品を対象にサービスしてもよい。
【0025】
図2〜図8を参照しながら、一実施形態に係る集団知性を用いた推薦システムの構成及び作用を詳細に説明することにする。
[評点情報収集部]
【0026】
まず、評点サイトでユーザ別の評点情報を収集する方式を説明する。
【0027】
評点情報収集部110は、図2に示すように、ポータルサイトで提供される商品紹介ページなどの評点サイト210でユーザのサイトID201とユーザが評点サイト210に書き込む評点情報202を収集してもよい。図2に図示したように、評点サイト210に評点を残したウェブページが複数ページである場合、評点情報収集部110はページを変えていきユーザのサイトID201と評点情報202を収集してもよい。
【0028】
評点情報収集部110は、収集されたユーザ別の評点情報をデータベースに構築する。図3に示すように、評点情報収集部300は、ユーザデータベース310と、評点情報データベース320で構成してもよい。
【0029】
ユーザデータベース310は、表1のように少なくとも1つのウェブサイトから収集されたユーザのサイトID、及びサイトIDごとに割り当てられたユニークキー(unique key)を保持及び管理する。ユーザデータベース310は、基本的にサイト別にサイトIDが同じであっても他のユーザと判断して互いに異なる値のユニークキーを割り当て、今後ユーザが本人の認証をした場合、同一ユーザと見なして表1のように同一のユニークキーを再び割り当ててもよい。
【0030】
【表1】

【0031】
評点情報データベース320は、ユーザデータベース310を基に表2のようにユーザが掲示した評点情報を商品のIDとユーザのユニークキー値と関連して保持及び管理する。すなわち、評点情報データベース320は、ユーザデータベース310に構築された各ユーザが書き込む商品別評点を記録する。ここで、評点情報は−1から1以内に正規化して格納される値を意味する。特に、評点が−1に近いほど商品に対する否定的意見が、1に近いほど商品に対する肯定的意見が反映された値を意味する。
【0032】
【表2】

【0033】
すべての商品に対してユーザ別の評点情報を収集し、評点情報データベース320を構築することができ、または、ある一定期間(期間は変更可能)ユーザが付けた評点の高い順に一定個数(n個)の商品を選別して評点情報データベース320を構築してもよい。
【0034】
上記の構成によれば、評点情報収集部300は、評点サイトから評点情報を収集して、各商品と関連するユーザ別の評点情報をデータベース化して保持及び管理してもよい。
【0035】
次に、マイクロブログでユーザ別の評点情報を収集する方式を説明する。
【0036】
これのための構成として、図4に示すように一実施形態に係る集団知性を用いた推薦システム400は、文書収集部410、商品キーワードデータベース420、文書フィルタリング部430、肯定/否定キーワードデータベース440、肯定度算出部450を追加構成としてさらに含んでもよい。
【0037】
文書収集部410は、表3のようにマイクロブログサイトでユーザのサイトID及びユーザが掲示した掲示文書を収集する。ここで、マイクロブログとは、1〜2文章程度の短いメッセージを用いて様々な人と疎通できるソーシャルネットワークサービスの一種であり、例えば、ツイッター(twitter(登録商標))、ファンフォウ(fanfou)等の海外サイトと、ミートゥデイ(me2day)、ヨジュム(yozm)等の韓国国内サイトが代表的なマイクロブログに該当する。
【0038】
【表3】

【0039】
商品キーワードデータベース420は、商品と関連する少なくとも1つのキーワードを保持する役割を担う。ここで、商品キーワードデータベース420は、表4のように商品別に代表キーワード、及び関連キーワードを対応させて保持及び管理してもよい。また、商品キーワードデータベース420は、各商品をカテゴリー別に区分して商品別キーワードをデータベース化してもよい。
【0040】
【表4】

【0041】
文書フィルタリング部430は、商品キーワードデータベース420を基に商品と関連する掲示文書をフィルタリングする役割を担う。換言すれば、文書フィルタリング部430は、表3に収集された掲示文書のうち商品キーワードデータベース420内のキーワードとマッチングされる単語が含まれる掲示文書を抽出する。表5において、文字の背景が網かけで示された掲示文書が、キーワードマッチングによって抽出した商品と関連する掲示文書に該当する。
【0042】
【表5】

【0043】
肯定/否定キーワードデータベース440は、肯定語と否定語を分類して表6のようにデータベースを構築することによって、肯定語に該当する肯定的キーワード及び肯定的キーワード別に付与された肯定語加重値、否定語に該当する否定的キーワード及び否定的キーワード別に付与された否定語加重値を保持する役割を担う。肯定/否定キーワードデータベース440は、予め機械学習(machine learning)による学習を通して準備してもよい。
【0044】
【表6】

【0045】
肯定度算出部450は、肯定/否定キーワードデータベース440を基にフィルタリングを経て抽出された表5の掲示文書の単語肯定度を算出する。肯定度算出部450は、掲示文書から肯定的キーワードまたは否定的キーワードにマッチングされる単語を抽出した後、抽出された単語に対応する肯定語加重値または否定語加重値に基づいて単語肯定度を算出してもよい。一例として、肯定度算出部450は、数式(1)によって掲示文書の単語肯定度を算出してもよい。
【0046】
【数1】

【0047】
肯定度算出部450は、掲示文書を形態素単位の単語ごとに分類し、分類された単語のうち肯定的キーワードまたは否定的キーワードにマッチングされる単語に割り当てられた肯定語加重値または否定語加重値を、キーワード加重値(keyword weight)で判断する。次に、肯定度算出部450は、数式(2)によって文章距離加重値(sentence distance weight)を算出してもよい。
【0048】
【数2】

【0049】
換言すれば、肯定度算出部450は、掲示文書を文章単位の句節に分類して、分類された全体句節数で、肯定的キーワードまたは否定的キーワードにマッチングされる単語を含む句節と商品と関連するキーワードとマッチングされる単語を含む句節間の距離を引いた値を全体句節数で割って文章距離加重値を算出する。
【0050】
例えば、掲示文書が「AAAを見た。これ思ったより面白いな〜推薦します〜」である場合、次のような方式によって単語肯定度が算出される。
【0051】
(1)掲示文書を形態素単位に分ける。
<AAAを見た。これ思ったより面白いな〜推薦します〜>→<[AAA]、[見る]、[これ]、[思う]、[面白い]、[推薦する]>
【0052】
(2)キーワード加重値を算出する。
[面白さ]=0.7
[推薦]=1.0
【0053】
(3)掲示文書を文章単位に分ける。
<AAAを見た。これ思ったより面白いな〜推薦します〜>→<[AAAを見た]、[これ思ったより面白いな]、[推薦します]>
【0054】
(4)文章距離加重値を算出する。
[AAAを見た]=(3−0)/3=1
[これ思ったより面白いな]=(3−1)/3=0.66
[推薦します]=(3−2)/3=0.33
【0055】
(5)キーワード加重値と文章距離加重値に基づいて単語肯定度を最終判断する。
単語肯定度=[面白さ](0.7*0.66)+[推薦](1.0*0.33)=0.79
【0056】
上記の過程によって算出された単語肯定度が正の数であれば掲示文書に掲示された商品の評点が肯定であり、負の数であれば商品の評点が否定であると判断してもよい。
【0057】
同時に、肯定度算出部450は、各商品に対してユーザ別単語肯定度を合計した後に、合計した値を−1から1以内に正規化する。ここで、掲示文書の単語肯定度は掲示文書に関連する商品に対するユーザの評点情報として用いてもよい。
【0058】
上記の構成により、評点情報収集部300は、マイクロブログから収集されたユーザを対象にユーザのサイトIDごとにユニークキーを割り当てた表1のようなユーザデータベース310を構築してもよい。また、評点情報収集部300は、肯定度算出部450で算出された掲示文書の単語肯定度を当該商品の評点情報として格納することにより、マイクロブログから収集された評点情報を対象に各商品と関連するユーザ別の評点情報を、表2のような評点情報データベース320で構築してもよい。
[類似性向ユーザクラスタ生成部]
【0059】
図5は、似た性向のユーザをクラスタリングした類似性向ユーザクラスタ生成部500を示すものである。図示するように、類似性向ユーザクラスタ生成部500は、類似度データベース510と、クラスタデータベース520とで構成してもよい。
【0060】
類似度データベース510は、ユーザ別のそれぞれ異なるユーザとの類似度を保持及び管理する役割を担う。ユーザの性向に対する類似度は、ピアソン相関点数、ユークリッド距離、ジャカード係数、マンハッタン距離などを用いた様々な方式によって測定することができる。一例として、ピアス相関点数は、2つのデータ集合がある直線でどれくらいよく表現されるかを示す測定値を意味するものであり、ピアソン相関点数を用いてユーザ間の類似度を測定してもよい。例えば、特定ユーザが評価した商品と同一の商品を評価した異なるユーザを探した後、2つのユーザが商品に残した評点を比較して2つのユーザのピアソン相関点数を算出してもよい。ここで、ピアソン相関点数は−1から1以内の値として表れ、そのうちの1は、2人がすべての商品に同じ点数を付けたことを示す。すなわち、類似度データベース510は、ユーザと異なるユーザの商品別評点情報に基づいて算出されたユーザ間の類似度を表7のように構築してもよい。
【0061】
【表7】

【0062】
クラスタデータベース520は、ユーザ間の類似度が設定値以上であるユーザを同じクラスタで管理する役割を担う。各商品と関連するユーザ別の評点情報を保持する評点情報データベース320には、非常に多くのユーザが存在し、各ユーザ間の類似度を毎回算出しようとすると多くの時間が必要とされるため、周期的に評点情報データベース320を基に各ユーザ間の類似度を算出した後、類似度データベース510を更新し、同時に似た性向を有するユーザをクラスタリングしてクラスタデータベース520を更新してもよい。一例として、ユーザが付けた評点の高い順に従って選択された一定個数(n個)の商品を対象にする場合、n個の商品に評点を残したユーザを対象にユーザ間の類似度を算出してもよい。図6を参照すると、類似度に設定値を適用して類似度の値が設定値を越えたユーザどうしがグラフ601,602に接続されて、同一のグラフ601,602にまとめられるユーザを表8のように同じクラスタに格納してもよい。
【0063】
【表8】

【0064】
上記の構成によれば、類似性向ユーザクラスタ生成部500は、ユーザ間の類似度を基に生成されたクラスタを介して似た性向のユーザを管理できるようにユーザ別クラスタをクラスタデータベース520で構築してもよい。
[サービス提供部]
【0065】
一実施形態に係る集団知性を用いた推薦システムは、推薦サービスを提供するのに先立ち、サービス対象者が属するクラスタを確認してサービス対象者がクラスタに含まれていないユーザの場合、サービス対象者をクラスタに追加する機能を提供してもよい。
【0066】
このための構成として、図7に示すように一実施形態に係る集団知性を用いた推薦システム700は、類似性向ユーザ検索部710と、データベース更新部720とを追加構成としてさらに含んでもよい。
【0067】
類似性向ユーザ検索部710は、サービス対象者が個人情報(例えば、サイトID)を入力すれば、個人情報をによってサービス対象者がクラスタデータベース520内のクラスタに含まれるユーザであるか否かを確認する。そして、類似性向ユーザ検索部710は、サービス対象者がクラスタに含まれていない場合、クラスタに含まれるユーザを対象にサービス対象者との類似度が設定値以上であるユーザを探してもよい。また、類似性向ユーザ検索部710は、クラスタに含まれるユーザのうちサービス対象者と似た性向を有するユーザが存在しない場合、クラスタに含まれていなくても商品別評点情報が構築されているユーザを対象にするか、リアルタイムで商品別評点情報を掲示するユーザを対象にサービス対象者との類似度が設定値以上であるユーザを探してもよい。
【0068】
データベース更新部720は、新規ユーザのサービス対象者に対して類似度データベース510とクラスタデータベース520を更新する役割を担う。換言すれば、クラスタデータベース520内のクラスタにおいて、サービス対象者と似た性向を有するユーザを探せば、当該ユーザが属するクラスタにサービス対象者を追加し、クラスタ以外のユーザを対象にしてサービス対象者と似た性向を有するユーザを探せば、当該ユーザとサービス対象者からなるクラスタをさらに生成してクラスタデータベース520を更新してもよい。また、データベース更新部720は、サービス対象者と似た性向を有するユーザを探せば、サービス対象者に対するユーザとの類似度を類似度データベース510に追加更新してもよい。
【0069】
さらに、一実施形態に係る集団知性を用いた推薦システムは、サービス対象者とサービス対象者が属するクラスタに含まれるユーザ間の類似度、及び当該クラスタに含まれるユーザの評点情報を用いて、サービス対象者に商品の推薦をサービスしてもよい。
【0070】
このための構成として、一実施形態に係る集団知性を用いた推薦システムにおいて、サービス提供部800は、図8に示すように最終評点算出部810と、商品推薦部820とで構成してもよい。
【0071】
最終評点算出部810は、評点情報データベース320と、類似度データベース510と、クラスタデータベース520とを用いてサービス対象者が属するクラスタにおいて、当該クラスタに含まれるユーザ間の類似度点数と、商品別ユーザの評点情報とを抽出する。ここで、サービス対象者が属するクラスタに含まれるユーザリストと、各ユーザとの類似度点数と、商品別評点情報とは、図9のように整理することができる。
【0072】
【表9】

【0073】
より詳しくは、最終評点算出部810は、各商品の評点に類似度をかけた加重値の合計(weighted sum)を求めて、同一の商品に評点を残したユーザの類似度合計を算出した後、加重値の合計を類似度合計で割った正規化値を求める。ここで、正規化値が商品に対する最終評点となる。
【0074】
商品推薦部820は、商品別最終評点を基準としてサービス対象者に商品を推薦する。一例として、商品推薦部820は、サービス対象者が推薦サービスを提供するサイトにログインする場合、カテゴリ(例えば、映画、小説、演劇など)ごとに区分して最終評点の高い順に商品を推薦してもよい。他の一例として、商品推薦部820は、サービス対象者が推薦サービスを提供するサイトにログインして特定カテゴリーを選択する場合、サービス対象者が選択したカテゴリに対応する商品を最終評点の高い順に推薦してもよい。また他の一例として、商品推薦部820は、サービス対象者が商品を検索する場合、当該商品に対する一般的な評点情報(すなわち、すべてのユーザが付けた評点の平均)と共に、サービス対象者と似た性向を有するユーザの評点情報を基に算出された商品別最終評点を示してもよい。また他の一例として、商品推薦部820は、サービス対象者が商品を検索する場合、当該商品と関連してサービス対象者と似た性向のユーザが推薦する商品を推薦してもよい。
【0075】
上記の構成によれば、サービス提供部800は、サービス対象者と類似性向を有するユーザの評点情報、及びユーザ間の類似度を用いて商品別最終評点を算出し、商品別最終評点を基準として商品を推薦してもよい。
【0076】
図9は、本発明の一実施形態において、類似性向集団の商品評価データベースを構築し、これにより推薦サービスを提供する集団知性を用いた推薦方法を示すフローチャートである。本実施形態に係る集団知性を用いた推薦方法は、図1と図4によって説明した推薦システムによってそれぞれのステップを実行することができる。
【0077】
ステップS910において、推薦システムは、商品と関連してインターネット上に掲示された評点情報を、掲示者であるユーザ及び当該商品と関連させて評点情報データベースを構築する。
【0078】
評点情報データベースを構築するための一例として、ステップS911において、推薦システムは、商品紹介サイト(例えば、映画紹介サイト)の評点サイトで評点情報を収集する方式を用いてもよい。すなわち、ポータルサイトで提供される商品紹介ページなどの評点サイトでユーザのサイトIDとユーザが評点サイトに書き込む評点情報を収集してもよい。
【0079】
評点情報データベースを構築するための他の一例として、ステップS912において、推薦システムは、マイクロブログに掲示された掲示文書で評点情報を抽出して収集する方式を用いてもよい。すなわち、推薦システムは、マイクロブログサイトでユーザのサイトID及びユーザが掲示した掲示文書を収集する。ステップS913において、推薦システムは、商品と関連する少なくとも1つのキーワードを保持する商品キーワードデータベースを基にステップS912で収集された掲示文書のうち商品と関連するキーワードが含まれる掲示文書を抽出する。ステップS914において、推薦システムは、肯定語に該当する肯定的キーワード及び肯定的キーワード別に付与された肯定語加重値、否定語に該当する否定的キーワード及び否定的キーワード別に付与された否定語加重値を保持する肯定/否定キーワードデータベースを基盤として、ステップS913でフィルタリングを経て抽出された掲示文書の単語肯定度を算出する。推薦システムは、掲示文書から肯定的キーワードまたは否定的キーワードにマッチングされる単語を抽出した後、抽出された単語に対応する肯定語加重値または否定語加重値に基づいて単語肯定度を算出してもよい。ここで、掲示文書の単語肯定度は、評点情報データベースを構築するのに商品別ユーザの評点情報として格納することができる。
【0080】
ステップS920において、推薦システムは、ユーザごとにそれぞれ異なるユーザとの類似度を保持する類似度データベース、及びユーザ間の類似度によってユーザをクラスタリングしたユーザクラスタを保持するクラスタデータベースを構築する。一例として、推薦システムは、特定ユーザが評価した商品と同一の商品を評価した異なるユーザを探した後、2つのユーザが商品に残した評点を比較して2つのユーザ間の類似度を算出してもよい。そして、推薦システムは、ユーザごとに他のユーザとの類似度をデータベースに構築し、同時にユーザ間の類似度が設定値以上であるユーザをクラスタとしてまとめ、クラスタ別ユーザグループをデータベースに構築してもよい。すなわち、推薦システムは、ユーザごとに他のユーザとの類似度を保持及び管理し、商品評点にあって類似性向を有するユーザを同じクラスタで保持及び管理してもよい。
【0081】
ステップS930において、推薦システムは、ステップS910で構築された評点情報データベース、及びステップS920で構築された類似度データベースとクラスタデータベースを用いて推薦サービスの提供を受けようとするサービス対象者に、サービス対象者と類似性向を有するユーザが推薦する商品を推薦してもよい。推薦システムは、サービス対象者が属するクラスタを介してユーザ間の類似度、及び商品別ユーザの評点情報を抽出した後、評点情報に類似度をかけた加重値の合計をユーザ間の類似度合計で割って商品別最終評点を算出してもよい。ここで、推薦システムは、サービス対象者に最終評点の高い順に商品を推薦してもよい。
【0082】
このように、本発明の実施形態によれば、ポータルサイトの評点サイト、または個人が用いるマイクロブログで商品に対するユーザ別の評点情報を収集して集団の商品評価データベースを構築してもよい。このため、サービス対象者が別途好みの情報を入力しなくても、サービス対象者と類似性向を有するユーザの評点に基づく推薦サービスを提供することができる。
【0083】
上述したように本発明を限定された実施形態と図面によって説明したが、本発明は、上記の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な修正及び変形が可能である。
【0084】
したがって、本発明の範囲は、開示された実施形態に限定されて定められるものではなく、特許請求の範囲及び特許請求の範囲と均等なものなどによって定められるものである。
【符号の説明】
【0085】
110:評点情報収集部
120:類似性向ユーザクラスタ生成部
130:サービス提供部

【特許請求の範囲】
【請求項1】
商品と関連してインターネット上に掲示された評点情報を、前記評点情報を掲示したユーザ及び前記商品と関連して収集する評点情報収集部と、
前記評点情報を用いて前記ユーザ間の類似度を測定した後、前記ユーザ間の類似度によって前記ユーザをクラスタリングしたクラスタを生成する類似性向ユーザクラスタ生成部と、
サービス対象者が属する前記クラスタに含まれる前記ユーザの評点情報を基に前記サービス対象者に前記商品に対する推薦サービスを提供するサービス提供部と、
を含むことを特徴とする集団知性を用いた推薦システム。
【請求項2】
前記評点情報収集部は、
前記インターネット上に掲示された掲示文書の単語肯定度を前記商品の評点情報として収集することを特徴とする請求項1に記載の集団知性を用いた推薦システム。
【請求項3】
前記推薦システムは、
前記インターネット上に掲示された掲示文書を収集する文書収集部と、
前記掲示文書のうち前記商品と関連する掲示文書を抽出する文書フィルタリング部と、
前記掲示文書に対する単語肯定度を算出する肯定度算出部と、
をさらに含み、
前記評点情報収集部は、
前記単語肯定度を前記商品の評点情報として収集することを特徴とする請求項1または請求項2に記載の集団知性を用いた推薦システム。
【請求項4】
前記文書フィルタリング部は、
前記商品と関連する少なくとも1つのキーワードを保持する商品キーワードデータベースを基に前記掲示文書のうち前記キーワードとマッチングされる単語が含まれる掲示文書を抽出することを特徴とする請求項3に記載の集団知性を用いた推薦システム。
【請求項5】
前記推薦システムは、
前記単語肯定度を算出する肯定度算出部をさらに含み、
前記肯定度算出部は、
前記掲示文書から肯定的キーワードまたは否定的キーワードにマッチングされる単語を抽出した後、前記抽出された単語に対応する前記肯定的キーワードの肯定語加重値、または前記否定的キーワードの否定語加重値に基づいて前記単語肯定度を算出することを特徴とする請求項2から請求項4のいずれか1項に記載の集団知性を用いた推薦システム。
【請求項6】
前記肯定度算出部は、
前記掲示文書を形態素単位の単語に分類してキーワード加重値を算出し、前記掲示文書を文章単位の句節に分類して文章距離加重値を算出した後、前記キーワード加重値に前記文章距離加重値を反映した値を前記単語肯定度として判断し、
前記キーワード加重値は、
前記形態素単位の各単語に対応する前記肯定語加重値または前記否定語加重値で算出され、
前記文章距離加重値は、
前記掲示文書を構成する前記句節の数と、前記肯定的キーワードまたは前記否定的キーワードを含む句節から前記商品と関連するキーワードを含む句節までの句節間距離によって算出されることを特徴とする請求項5に記載の集団知性を用いた推薦システム。
【請求項7】
前記評点情報収集部は、
少なくとも1つのウェブサイトから収集された前記ユーザのサイトID及び前記サイトIDごとに割り当てられたユニークキーを保持するユーザデータベースと、
前記ユーザデータベースを基に前記ユーザが掲示した前記評点情報を前記商品のID及び前記ユーザのユニークキー値によって管理する評点情報データベースと、
を含み、
前記ユーザデータベースは、
前記サイトIDのうちIDが同一のサイトIDに対して互いに異なる値のユニークキーが割り当てられ、前記ユーザの認証によって同一ユーザと判断されれば、前記ユニークキーが同じ値に再び割り当てられることを特徴とする請求項1から請求項6のいずれか1項に記載の集団知性を用いた推薦システム。
【請求項8】
前記ユーザ間の類似度は、
前記ユーザ間に同一の商品の評点情報を比較した値であり、
前記類似性向ユーザクラスタ生成部は、
前記ユーザごとにそれぞれ異なるユーザとの類似度を保持する類似度データベースと、
前記ユーザ間の類似度が設定値以上であるユーザを同じクラスタで管理するクラスタデータベースと、
を含むことを特徴とする請求項1から請求項7のいずれか1項に記載の集団知性を用いた推薦システム。
【請求項9】
前記推薦システムは、
前記サービス対象者が前記クラスタに含まれていなかった場合、前記インターネット上に前記評点情報を掲示したユーザを対象に前記サービス対象者との類似度が前記設定値以上であるユーザを検索する類似性向ユーザ検索部と、
前記サービス対象者に対する前記検索されたユーザとの類似度を前記類似度データベースに更新した後に前記サービス対象者を前記クラスタデータベースに追加するデータベース更新部と、
をさらに含むことを特徴とする請求項8に記載の集団知性を用いた推薦システム。
【請求項10】
前記サービス提供部は、
前記サービス対象者と前記サービス対象者が属するクラスタに含まれるユーザ間の類似度、及び当該クラスタに含まれるユーザによって掲示された前記評点情報を用いて前記サービス対象者に前記商品を推薦することを特徴とする請求項1から請求項9のいずれか1項に記載の集団知性を用いた推薦システム。
【請求項11】
前記サービス提供部は、
前記サービス対象者が属するクラスタに対し、前記商品別に前記ユーザの評点情報に当該ユーザとの類似度をかけた加重値の合計を前記ユーザ間類似度の合計で割って前記商品に対する最終評点を算出する最終評点算出部と、
前記最終評点を基準として前記商品を推薦する商品推薦部と、
を含むことを特徴とする請求項10に記載の集団知性を用いた推薦システム。
【請求項12】
集団知性を用いて商品を推薦する推薦方法において、
前記推薦方法は、
前記商品と関連してインターネット上に掲示された評点情報を、前記評点情報を掲示したユーザ及び前記商品と関連して収集する評点情報収集ステップと、
前記評点情報を用いて前記ユーザ間の類似度を測定した後、前記ユーザ間の類似度によって前記ユーザをクラスタリングしたクラスタを生成する類似性向ユーザクラスタ生成ステップと、
サービス対象者が属する前記クラスタに含まれる前記ユーザの評点情報を基に前記サービス対象者に前記商品に対する推薦サービスを提供するサービス提供ステップと、
を含むことを特徴とする集団知性を用いた推薦方法。
【請求項13】
前記評点情報収集ステップは、
前記インターネット上に掲示された掲示文書の単語肯定度を前記商品の評点情報として収集することを特徴とする請求項12に記載の集団知性を用いた推薦方法。
【請求項14】
前記推薦方法は、
前記インターネット上に掲示された掲示文書を収集する文書収集ステップと、
前記掲示文書のうち前記商品と関連する掲示文書を抽出する文書フィルタリングステップと、
前記掲示文書に対する単語肯定度を算出する肯定度算出ステップと、
をさらに含み、
前記評点情報収集ステップは、
前記単語肯定度を前記商品の評点情報として収集することを特徴とする請求項12または請求項13に記載の集団知性を用いた推薦方法。
【請求項15】
前記文書フィルタリングステップは、
前記商品と関連する少なくとも1つのキーワードを保持する商品キーワードデータベースを基に前記掲示文書のうち前記キーワードとマッチングされる単語が含まれる掲示文書を抽出することを特徴とする請求項14に記載の集団知性を用いた推薦方法。
【請求項16】
前記推薦方法は、
前記単語肯定度を算出する肯定度算出ステップをさらに含み、
前記肯定度算出ステップは、
前記掲示文書から肯定的キーワードまたは否定的キーワードにマッチングされる単語を抽出した後、前記抽出された単語に対応する前記肯定的キーワードの肯定語加重値または前記否定的キーワードの否定語加重値に基づいて前記単語肯定度を算出することを特徴とする請求項13から請求項15のいずれか1項に記載の集団知性を用いた推薦方法。
【請求項17】
前記肯定度算出ステップは、
前記掲示文書を形態素単位の単語に分類してキーワード加重値を算出し、前記掲示文書を文章単位の句節に分類して文章距離加重値を算出した後、前記キーワード加重値に前記文章距離加重値を反映した値を前記単語肯定度として判断し、
前記キーワード加重値は、
前記形態素単位の各単語に対応する前記肯定語加重値または前記否定語加重値で算出され、
前記文章距離加重値は、
前記掲示文書を構成する前記句節の数と、前記肯定的キーワードまたは前記否定的キーワードを含む句節から前記商品と関連するキーワードを含む句節までの句節間距離によって算出されることを特徴とする請求項16に記載の集団知性を用いた推薦方法。
【請求項18】
前記評点情報収集ステップは、
少なくとも1つのウェブサイトから収集された前記ユーザのサイトID及び前記サイトIDごとに割り当てられたユニークキーを保持するユーザデータベースを構築するステップと、
前記ユーザデータベースを基に前記ユーザが掲示した前記評点情報を前記商品のID及び前記ユーザのユニークキー値によって管理する評点情報データベースを構築するステップと、
を含み、
前記ユーザデータベースは、
前記サイトIDのうちIDが同一のサイトIDに対して互いに異なる値のユニークキーが割り当てられ、前記ユーザの認証によって同一ユーザと判断されれば、前記ユニークキーが同じ値に再び割り当てられることを特徴とする請求項12から請求項17のいずれか1項に記載の集団知性を用いた推薦方法。
【請求項19】
前記ユーザ間の類似度は、
前記ユーザ間に同一の商品の評点情報を比較した値であり、
前記類似性向ユーザクラスタ生成ステップは、
前記ユーザごとにそれぞれ異なるユーザとの類似度を保持する類似度データベースを構築するステップと、
前記ユーザ間の類似度が設定値以上であるユーザを同じクラスタで管理するクラスタデータベースを構築するステップと、
を含むことを特徴とする請求項12から請求項18のいずれか1項に記載の集団知性を用いた推薦方法。
【請求項20】
前記推薦方法は、
前記サービス対象者が前記クラスタに含まれていなかった場合、前記インターネット上に前記評点情報を掲示したユーザを対象に前記サービス対象者との類似度が前記設定値以上であるユーザを検索する類似性向ユーザ検索ステップと、
前記サービス対象者に対する前記検索されたユーザとの類似度を前記類似度データベースに更新した後に前記サービス対象者を前記クラスタデータベースに追加するデータベース更新ステップと、
をさらに含むことを特徴とする請求項19に記載の集団知性を用いた推薦方法。
【請求項21】
前記サービス提供ステップは、
前記サービス対象者と前記サービス対象者が属するクラスタに含まれるユーザ間の類似度、及び当該クラスタに含まれるユーザによって掲示された前記評点情報を用いて前記サービス対象者に前記商品を推薦することを特徴とする請求項12から請求項20のいずれか1項に記載の集団知性を用いた推薦方法。
【請求項22】
前記サービス提供ステップは、
前記サービス対象者が属するクラスタに対し、前記商品別に前記ユーザの評点情報に当該ユーザとの類似度をかけた加重値の合計を前記ユーザ間類似度の合計で割って前記商品に対する最終評点を算出する最終評点算出ステップと、
前記最終評点を基準として前記商品を推薦する商品推薦ステップと、
を含むことを特徴とする請求項21に記載の集団知性を用いた推薦方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−99115(P2012−99115A)
【公開日】平成24年5月24日(2012.5.24)
【国際特許分類】
【出願番号】特願2011−240989(P2011−240989)
【出願日】平成23年11月2日(2011.11.2)
【出願人】(505205812)エヌエイチエヌ コーポレーション (408)