説明

コンテンツ推薦装置,コンテンツ推薦プログラムおよびその記録媒体

【課題】多数の閲覧履歴情報がないような場合でも,あるコンテンツを閲覧したユーザに対し,そのコンテンツに関連する別の適切なコンテンツの推薦を可能にする。
【解決手段】キーワード重み付け部12は,キーワードとコンテンツの関連性またはキーワードの具体性を示す値を算出し,これによりキーワードの重み付けを行う。コンテンツ関連スコア算出部13は,ユーザが閲覧したコンテンツと他のコンテンツの両方に含まれるキーワードの重みの総和を関連スコアとして算出する。推薦コンテンツ決定部14は,関連スコアの高いコンテンツをユーザに推薦するコンテンツとして決定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は,文書や,画像,音楽,映像などのコンテンツにアクセスしたユーザに対して,そのコンテンツに関連する別のコンテンツを推薦する技術に関する。
【背景技術】
【0002】
インターネットなどの普及により,ユーザが閲覧可能なコンテンツの総量は増加している。しかし,ユーザが一定時間に閲覧することのできるコンテンツは限られており,大量のコンテンツの中からユーザが興味のあるコンテンツを発見するのがかなり困難な状況になってきている。この問題を解決するためのアプローチの1つとして,推薦が挙げられる。推薦とは,ユーザがあるコンテンツに対して閲覧や評価をした際に,関連する別のコンテンツを提示することにより,ユーザのコンテンツ発見を容易にし,より多くのコンテンツを閲覧してもらうための手法である。
【0003】
コンテンツの推薦を行う方法を大別すると,協調フィルタリングと内容ベースフィルタリングの2つに分けられる。
【0004】
協調フィルタリングは,コンテンツに対するユーザの閲覧履歴や評価履歴を利用することにより,ユーザもしくはコンテンツ同士が似ているかどうかを分析し,推薦を行う手法である。協調フィルタリングは,多くのユーザの履歴が得られる場合には精度の高い推薦を行うことができるが,履歴の量が少ない場合には精度が低下してしまうという短所がある。
【0005】
一方,内容ベースフィルタリングは,コンテンツの内容を比較することにより,類似するコンテンツを推薦する手法である。内容ベースフィルタリングは,多くのユーザの履歴がなくても推薦できるため,視聴数の少ないコンテンツも推薦の対象にすることができるという利点がある。
【0006】
内容ベースフィルタリングに関する研究としては,ユーザが高く評価したコンテンツに付与されている属性の出現頻度を計測し,出現頻度の高い属性が付与されているコンテンツを推薦する手法(特許文献1参照)がある。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2009−205418号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら,特許文献1に挙げられている技術では,複数のユーザの履歴を利用する代わりに,推薦対象のユーザの操作履歴を利用するため,高い精度で推薦を行うためには推薦対象のユーザが多くのコンテンツを閲覧している必要がある。そのため,閲覧数の少ないユーザには適切な推薦ができないという問題点がある。
【0009】
本発明は,このような課題の解決を図り,多数の閲覧履歴情報がないような場合でも,あるコンテンツを閲覧したユーザに対し,そのコンテンツに関連する別の適切なコンテンツの推薦を行うことができるようにすることを目的とする。
【課題を解決するための手段】
【0010】
本発明は,上記課題を解決するためのものであり,コンテンツに付与された各キーワードに対する重み付けを,コンテンツ集合とそれらに付与されたキーワードの関係を分析することによって算出し,コンテンツ間でキーワードの重み付けを比較することにより,各コンテンツにおいて高い重みを持つキーワードが似ているコンテンツを推薦する。
【0011】
すなわち,本発明は,コンテンツに付与された各キーワードを分析することにより,あるコンテンツに対し,関連する別のコンテンツを発見し,推薦する。キーワードの分析では,コンテンツにおいてキーワードが付与される傾向を分析することにより重み付けを行う。そして,重み付けされたキーワードに基づき,推薦候補となるコンテンツ集合中の各コンテンツに対し,スコア付けを行う。より高く重み付けされたキーワードがより多く付与されているほど,コンテンツの関連スコアは高くなる。コンテンツ推薦装置は,スコア付けにおいて,高いスコアとなったコンテンツを推薦する。
【0012】
コンテンツに付与されているキーワードの重み付けは,次のように行う。キーワード間の共起関係から関係の強さを求めることができる。キーワード間の関係の強さからコンテンツに付与された各キーワードの重みを求める。あるいは,キーワード共起出現の偏りからキーワード自体の重みを決める。コンテンツaとコンテンツbの両者に共通のキーワードの重みの総和を,2つのコンテンツ間の関連スコアとする。こうして,関連スコアの高いコンテンツを選出し,ユーザに推薦する。
【0013】
関連スコアが閾値以上となるコンテンツ集合のクラスタリングを行い,クラスタリングした結果をユーザに提示するようにしてもよい。
【0014】
また,ユーザのコンテンツ閲覧情報を記憶するユーザ閲覧情報蓄積手段を設け,キーワードの重み付けでは,ユーザ閲覧情報蓄積手段を参照し,ユーザが閲覧した複数のコンテンツの入力を受け付けることにより,複数のコンテンツに付与されたキーワードの情報をもとにキーワードの重みを算出するようにしてもよい。
【0015】
さらに,ユーザからの入力によって,ユーザが興味のあるキーワードもしくは興味のないキーワードを選択し,選択したキーワードの重みを変更するキーワード重み変更手段を設け,キーワードの重みを変更可能とすることもできる。
【発明の効果】
【0016】
本発明により,コンテンツ集合とそれらに付与されたキーワード集合の関係についての情報のみを利用して,コンテンツ間の関連性を算出することができるため,あるコンテンツを閲覧したユーザに対し,コンテンツにおける重要なキーワードに関連する別のコンテンツの推薦を行うことができる。
【0017】
また,本発明は,コンテンツに付与された各キーワードについて,コンテンツとキーワードの関連性の強さを算出し,キーワードの重みとして利用することにより,コンテンツと強く関連しているキーワードが似ているコンテンツを推薦することができる。
【0018】
また,本発明は,キーワードごとに話題を絞り込むことができるキーワードであるかを表す具体性を算出し,キーワードの重みとして利用することにより,コンテンツを推薦するために必要な計算量を減らすことができる。
【0019】
また,本発明は,関連スコアが高いいくつかのコンテンツをクラスタリングし,集約してユーザに提示することにより,幅広い内容のコンテンツを推薦することができる。
【0020】
また,本発明は,複数のコンテンツの情報を利用して,コンテンツの推薦を行うことにより,多くのコンテンツを閲覧したユーザに対しては,より個人の嗜好を反映したコンテンツを推薦することができる。
【0021】
また,本発明は,キーワードの重みをユーザが自由に変更可能にすることにより,推薦されたコンテンツがユーザの満足するものでなかった場合に,他のコンテンツを推薦することが可能になる。
【図面の簡単な説明】
【0022】
【図1】本発明の実施形態に係るコンテンツ推薦装置の構成例を示す図である。
【図2】コンテンツ推薦処理の概要を示すフローチャートである。
【図3】キーワード蓄積装置に格納された情報の例を示す図である。
【図4】キーワード蓄積装置に格納された情報の例を示す図である。
【図5】キーワード間の関係の強さを算出する例を示す図である。
【図6】キーワード間の共起回数を算出する例を示す図である。
【図7】キーワードの具体性算出の例を示す図である。
【図8】ユーザの閲覧履歴を利用するコンテンツ推薦装置の例を示す図である。
【図9】ユーザ操作により推薦コンテンツの変更が可能なコンテンツ推薦装置の例を示す図である。
【発明を実施するための形態】
【0023】
以下,本発明の実施形態について,図面を用いて説明する。図1は,本発明の実施形態に係るコンテンツ推薦装置を模式的に示す構成図である。
【0024】
コンテンツ推薦装置10は,キーワード蓄積装置100,コンテンツ情報入力部11,キーワード重み付け部12,コンテンツ関連スコア算出部13,推薦コンテンツ決定部14,コンテンツ情報出力部15から構成される。キーワード蓄積装置100には,コンテンツ情報管理テーブル101,キーワード情報管理テーブル102,キーワード・コンテンツ関係管理テーブル103が格納されている。
【0025】
入出力装置20は,コンテンツを閲覧するユーザが利用するディスプレイやキーボードその他の周辺装置であるが,ネットワークを介して接続される端末のようなものであってもよい。また,コンテンツ推薦を利用するシステムでもよい。以下では,コンテンツ推薦装置10を利用する人間またはシステムを“ユーザ”という。
【0026】
コンテンツ推薦装置10は,例えば,CPU(Central Processing Unit ),および,ROM(Read Only Memory),RAM(Random Access Memory),HDD(Hard Disk Drive )などの記憶手段,および,記憶手段に展開されたプログラムを含む。図1に示した構成要素の動作を記述したプログラムは,コンテンツ推薦装置10として利用されるコンピュータ上で実行させる,または,ネットワークなどを介してサービスとして実行させることが可能である。キーワード蓄積装置100は,API(Application Program Interface )などを通じてコンテンツやキーワードを取得するプログラムであってもよい。
【0027】
図2は,コンテンツ推薦装置10によるコンテンツ推薦処理の概要を示すフローチャートである。
【0028】
コンテンツ推薦装置10は,コンテンツに付与されたキーワードの情報に基づいて推薦するコンテンツを次のように決定する。まず,ステップS1では,コンテンツ情報入力部11によって,ユーザがアクセスしたコンテンツの情報を取得し,キーワード重み付け部12によって,そのコンテンツに付与されたキーワード集合をキーワード蓄積装置100から取得する。次に,ステップS2では,キーワード重み付け部12によって,各コンテンツとキーワードの関係からコンテンツに付与されたキーワードの重みを算出する。続いて,ステップS3では,コンテンツ関連スコア算出部13によって,コンテンツのキーワードの重みに基づいてコンテンツ間の関連スコアを算出する。その後,ステップS4では,推薦コンテンツ決定部14によって,関連スコアに基づいて推薦するコンテンツを決定し,コンテンツ情報出力部15によって,推薦するコンテンツ集合30を出力する。
【0029】
以上のように,本実施形態では,コンテンツ推薦装置10は,ユーザがコンテンツを閲覧した際,コンテンツに付与されたキーワード集合を取得し(S1),キーワード蓄積装置内に格納されたコンテンツとキーワードの関係を分析することにより,キーワードに対する重み付けを行う(S2)。次に,キーワードの重み付けに基づき,キーワード蓄積装置100に格納された各コンテンツに対するスコア付けを行う(S3)。最後に,より高いスコアのコンテンツから1つもしくは複数を選択し,ユーザに提示する(S4)。
【0030】
一度算出したキーワードの重みの値は,キーワード蓄積装置100に格納しておくことにより,次回以降は同じキーワードの重みの算出を省略することができる。また,各キーワードの重みを,必要なときにその都度算出するのではなく,事前にすべてのコンテンツのキーワードについて重みを算出しておき,キーワード蓄積装置100に格納しておくようにしてもよい。
【0031】
キーワード蓄積装置100には,コンテンツ集合およびそれらに付与されたキーワードについてのデータが,例えば図3または図4に示すような,コンテンツ情報管理テーブル101,キーワード情報管理テーブル102,キーワード・コンテンツ関係管理テーブル103のテーブル形式で格納されている。キーワード蓄積装置100は,コンテンツを選択するための検索条件を指定することにより,コンテンツやコンテンツに付与されたキーワードについてのデータを出力する。すなわち,キーワード重み付け部12およびコンテンツ関連スコア算出部13は,キーワード蓄積装置100から,コンテンツを指定することによって,コンテンツの情報およびコンテンツに付与されたキーワード集合を取得することができ,キーワードを指定することによって,キーワードの情報およびキーワードが付与されたコンテンツ集合を取得することができる。
【0032】
図3の例は,後述する〔キーワードの重み算出の例1〕を利用した場合のキーワード蓄積装置100に格納された情報の例である。キーワード蓄積装置100は,コンテンツ情報管理テーブル101として,管理対象のコンテンツごとに,各コンテンツを一意に識別するコンテンツID,コンテンツの名前およびその説明の情報を記憶している。また,キーワード情報管理テーブル102として,各キーワードを一意に識別するキーワードIDと,キーワードの名前などの情報を記憶している。また,キーワード・コンテンツ関係管理テーブル103として,各コンテンツIDとキーワードIDの組み合わせの情報,およびコンテンツに対するキーワードの重みの値を記憶している。
【0033】
一方,図4の例は,後述する〔キーワードの重み算出の例2〕を利用した場合のキーワード蓄積装置100に格納された情報の例である。コンテンツ情報管理テーブル101として,図3と同様な情報を記憶するが,キーワード情報管理テーブル102では,各キーワードを一意に識別するキーワードIDと,キーワードの名前の他に,キーワードの重みの値を記憶している。キーワード・コンテンツ関係管理テーブル103では,各コンテンツIDとキーワードIDの対応情報を記憶している。
【0034】
図3および図4に示したコンテンツ情報管理テーブル101,キーワード情報管理テーブル102,キーワード・コンテンツ関係管理テーブル103は一例であり,名前や説明などの属性は格納されていなくてもよく,また,他の属性が格納されていてもよい。また,すでに算出し終えたキーワードの重みが格納される領域はなくてもよい。
【0035】
ユーザが,コンテンツaを閲覧した場合を想定し,コンテンツの推薦手法について説明する。
【0036】
〔キーワードの重み算出の例1〕
まず,キーワードの重み付けを算出する第1の手法の例について説明する。キーワードの重みの算出には,例えば,同じコンテンツに付けられたより多くの他のキーワードと強い関連を持つキーワードに対して,より高い重みを与えることが考えられる。
【0037】
キーワードの重み付けの計算では,最初に,コンテンツaに付与されたキーワード集合のうち,任意の2キーワード間の関係の強さを算出する。図5に本発明の一実施形態におけるコンテンツに付与されたキーワードについてのキーワード間の関係の強さを算出する例を示す。キーワード間の関係の強さは,例えば,キーワードの出現頻度に対するカイ二乗値により定義することができる。このとき,キーワード間の関係の強さR(A,B)は次の式で与えられる。
【0038】
【数1】

【0039】
ただし,Nはキーワード蓄積装置100において蓄積されているコンテンツ集合に存在するコンテンツの総数であり,[A,B],[ ̄A, ̄B],[ ̄A,B],[A, ̄B]は,それぞれキーワードA,Bが共に付与されたコンテンツ数,キーワードA,Bのどちらも付与されていないコンテンツ数,キーワードBは付与されキーワードAは付与されていないコンテンツ数,キーワードAは付与されキーワードBは付与されていないコンテンツ数である。なお,「 ̄A」の「 ̄」は,Aの上に付く記号である(Bも同様)。
【0040】
また,[A],[ ̄A],[B],[ ̄B]は,それぞれキーワードAが付与されているコンテンツ数,キーワードAが付与されていないコンテンツ数,キーワードBが付与されているコンテンツ数,キーワードBが付与されていないコンテンツ数である。
【0041】
続いて,キーワードの重み付けを決定する。コンテンツaに付与されたキーワードAの重みW(a,A)の値は,例えば,キーワードAとコンテンツaに付与された他のキーワードとの関係の強さの平均値により定義することができる。このとき,W(a,A)は,次の式で与えられる。
【0042】
【数2】

【0043】
ただし,Ka はコンテンツaに付与されたすべてのキーワードを含む集合であり,NKaはKa に含まれるキーワードの総数である。
【0044】
以上のキーワードの重み付け手法は,次の知見に基づいている。
[知見1]:より多くのキーワードにより重複して表現されている内容は,コンテンツの主要な内容である。
【0045】
コンテンツの全内容において,特に重要な内容については,多くのキーワードが表現しようとするであろう。さらに,本例では,次の知見に基づいて,キーワードとコンテンツとの関連性を求める。
[知見2]:主要な内容を表現するキーワードは,コンテンツとの関連性が高い。
【0046】
したがって,キーワード同士の内容がどの程度重なり合っているかを分析することにより,キーワードがどの程度コンテンツの主要な内容を表現しているかを分析することができるのである。
【0047】
〔キーワードの重み算出の例2〕
次に,キーワードの重み付けを算出する第2の手法の例について説明する。キーワードの重みの算出には,例えば,キーワードが付与されたときは同じ話題であることが多い場合,すなわち,話題を絞り込むことができるキーワードである場合に,より高い重みを与えることが考えられる。
【0048】
キーワードの重み付けの計算では,最初に,コンテンツに付与された各キーワードについて,全コンテンツにおいて各キーワードと共起するキーワードの集合を取得する。
【0049】
図6は,本発明の一実施形態におけるキーワード間の共起回数の算出例を説明する図である。図6において,キーワードAは,具体性を算出しようとしているキーワードを表している。キーワード蓄積装置100から,キーワードAが付与されたコンテンツをすべて取得し,それらのコンテンツ集合に一度でも付与されているキーワードをすべて取得する。ただし,キーワードA自身は除く。図6の例では,キーワードAと共起するキーワードがキーワードB,キーワードC,キーワードDであったことを表している。各キーワードがキーワードAと共起した回数は,それぞれ,C(A,B),C(A,C),C(A,D)である。すなわち,キーワード蓄積装置100において,キーワードAとキーワードBが共に付与されているコンテンツの数は,C(A,B) 個である。
【0050】
続いて,キーワードAと共起するキーワードの共起回数の偏りを調べるため,以下の式E(A)の値を計算する。ただし,K′A は,キーワードAと共起したキーワードの集合を表し,NK'A =Σk C(A,k)である(ここで,Σk はk∈K′A の総和を表す)。図6の例では,K′A は,キーワードB,キーワードC,キーワードDからなる集合となる。
【0051】
【数3】

【0052】
キーワードAと共起するキーワードの共起回数の偏りが小さければ,E(A)は大きくなり,偏りが大きければ,E(A)は小さくなる。すなわち,E(A)が小さいほど,具体的なキーワードであるといえる。
【0053】
最後に,以下の式W(A)の値を計算することにより,キーワードの重みが算出できる。W(A)の値は,キーワードAが具体的であるほど大きな値になる。
【0054】
【数4】

【0055】
ただし,σはパラメータであり,σ>1の任意の値を利用可能である。
【0056】
以上のキーワードの重み付け手法は,次の知見に基づいている。キーワードは,コンテンツの内容を反映して付与される。例えば,「スポーツ」というキーワードは,テニスや野球やサッカーなどに関係するコンテンツに対して付与される。一方で,「ワールドカップ」というキーワードが付与されるコンテンツは,ほとんどがサッカーに関係するものである。この違いは,「スポーツ」というキーワードと,「ワールドカップ」というキーワードが表している話題の広さが異なるために生じる。
【0057】
そこで,各キーワードと共起するキーワードの偏りに着目する。今,「ワールドカップ」というキーワードが付与されるコンテンツは,サッカーに関係するものが多いため,そのコンテンツに付与されるキーワードもサッカーに関係するものが多いと考えられる。そのため,「ワールドカップ」と共起するキーワードの偏りは大きくなる。逆に,「スポーツ」というキーワードは,さまざまな話題のコンテンツに対して付与されるため,共起するキーワードの偏りは小さくなる。そのため,共起するキーワードの偏りの大きさを分析することによって,キーワードの具体性を判別することができる。
【0058】
キーワードの具体性算出の例を図7に示す。図7の例は,「スポーツ」と「ワールドカップ」というキーワードについて具体性を計算した例である。今,「スポーツ」と共起するキーワードが「サッカー」,「テニス」,「野球」であり,共起回数がそれぞれ180回,120回,200回であったとする。このとき,[数1]式のE(A)を計算すると,E(スポーツ)=0.468となる。一方,「ワールドカップ」と共起するキーワードが「サッカー」,「大会」であり,共起回数がそれぞれ90回,10回であったとする。このとき,E(ワールドカップ)=0.141となる。したがって,E(スポーツ)よりE(ワールドカップ)の方が小さいため,「スポーツ」よりも「ワールドカップ」の方が具体的なキーワードであると分かる。
【0059】
キーワードの重み付けの後,キーワード蓄積装置100内の各コンテンツに対して関連スコアの算出を行う。関連スコアの算出には,例えば,コンテンツに付与されたキーワードの重みの総和を利用することができる。その場合,コンテンツbのスコアは,以下の式S(b)により算出される。
【0060】
【数5】

【0061】
ただし,コンテンツaはユーザが閲覧を行ったコンテンツであり,Ka はコンテンツaに付与されたすべてのキーワードの集合であり,Kb はコンテンツbに付与されたすべてのキーワードの集合であり,δ(k∈Kb )はコンテンツbにキーワードkが付与されている場合に“1”,それ以外の場合に“0”となる関数である。また,キーワードの重み付けの手法として,キーワードの重み付けを算出する第2の手法を利用した場合,W(a,k)=W(k)であるとする。
【0062】
すべてのコンテンツに対して関連スコアを計算し,比較することにより,推薦するコンテンツを決定する。ユーザに推薦するコンテンツが1つの場合には,関連スコアが最も高かったコンテンツを提示し,複数の場合には,関連スコアが高いものから順にいくつかを提示することにより,コンテンツの推薦を行うことができる。
【0063】
また,推薦コンテンツ決定部14において,関連スコアが閾値以上となるコンテンツ集合のクラスタリングを行う手法を用いることにより,推薦候補となるコンテンツをクラスタリングし,幅広い内容のコンテンツを推薦することができる。
【0064】
例えば,推薦候補となる各コンテンツについて,[数5]式を用いて関連スコアを算出する。続いて,関連スコアが高かった上位n件のコンテンツを取得する。nは任意の値でよい。さらに,それらのコンテンツをクラスタリングすることによって,幅広い内容を持つコンテンツを推薦することが可能になる。
【0065】
クラスタリングの手法として,例えば,コンテンツに付与されたキーワードに対する重みを要素とするベクトルをk−means法(下記の参考文献1参照)によってクラスタリングすることができる。
【0066】
〔参考文献1〕:J.McQueen ,"Some methods for classification and analysis of multivariate observations" ,In Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, pp.281-297 (1967)。
【0067】
また,さらにユーザの閲覧情報を蓄積し,キーワード重み付け部12は,ユーザが閲覧した複数のコンテンツの入力を受け付けることにより,複数のコンテンツに付与されたキーワードの情報をもとに重みを算出する手法を用いることもできる。この手法を利用することにより,ユーザが閲覧した複数のコンテンツの情報に基づいて,コンテンツの推薦を行うことができる。
【0068】
図8は,ユーザが閲覧した複数のコンテンツ情報に基づいて,コンテンツの推薦を行う場合のコンテンツ推薦装置10の構成例を示す図である。
【0069】
コンテンツ推薦装置10は,ユーザの閲覧履歴情報を記憶するユーザ閲覧情報蓄積装置110を備える。ユーザ情報入力部16は,推薦するユーザの情報を入力とし,そのユーザが閲覧したコンテンツの情報をユーザ閲覧情報蓄積装置110から取得し,キーワード重み付け部12に伝達する。キーワード重み付け部12は,ユーザが閲覧したすべてのコンテンツに対して付与されたキーワードについて,重み付けを行う。コンテンツ関連スコア算出部13は,キーワードの重みに基づいてコンテンツの関連スコアを算出し,推薦コンテンツ決定部14は,関連スコアが高かったコンテンツを推薦するコンテンツとして,コンテンツ情報出力部15により出力する。
【0070】
例えば,ユーザが閲覧した各コンテンツについて,コンテンツに付与された各キーワードの重みを計算し,それらを合計したものをコンテンツの関連スコアの算出に利用することができる。ユーザが閲覧したコンテンツの集合をCとおくと,コンテンツbのスコアは,以下の式S′(b)により算出される。
【0071】
【数6】

【0072】
また,さらにユーザによってキーワードの重みを変更する手段を設け,キーワード重み付け部12において,ユーザが興味のあるキーワードもしくは興味のないキーワードを選択することにより,キーワードの重みを変更可能とすることもできる。この手法を利用することにより,推薦結果が満足のいくものでなかった場合に,ユーザが任意にキーワードの重みを変更し,推薦されるコンテンツを変更することが可能になる。
【0073】
図9は,ユーザ操作により推薦コンテンツの変更が可能なコンテンツ推薦装置10の構成例を示す図である。
【0074】
この例では,ユーザは,キーワード重み変更部17に対して,興味のあるキーワード,もしくは,興味のないキーワードを入力することにより,キーワードの重みを増減させることができる。ユーザの操作の後,キーワード重み変更部17はユーザ操作の内容をキーワード重み付け部12に伝達し,キーワード重み付け部12はキーワードの重みを修正する。コンテンツ関連スコア算出部13は,キーワードの重みに基づいてコンテンツの関連スコアを算出し,推薦コンテンツ決定部14は,関連スコアが高かったコンテンツを推薦するコンテンツとして,コンテンツ情報出力部15により出力する。
【0075】
例えば,あるコンテンツを閲覧したユーザに対して,コンテンツ推薦装置10を利用して,推薦するコンテンツを提示するのと同時に,コンテンツに付与されているキーワードの集合をユーザに提示する。ユーザは,推薦されるコンテンツを変更したい場合に,キーワード集合の中から興味のあるキーワードを選択すると,コンテンツ推薦装置10は,そのキーワードの重みを増やす。もしくは,興味のないキーワードを選択すると,そのキーワードの重みを減らす。そして,変更したキーワードの重みに基づいて,コンテンツのスコアを再計算し,推薦するコンテンツを決定し,ユーザに提示する。
【0076】
以上,本発明の実施形態を説明したが,本発明は上記の実施形態に限定されず,特許請求の範囲に記載された技術的範囲内において変更や応用が可能である。
【符号の説明】
【0077】
10 コンテンツ推薦装置
11 コンテンツ情報入力部
12 キーワード重み付け部
13 コンテンツ関連スコア算出部
14 推薦コンテンツ決定部
15 コンテンツ情報出力部
16 ユーザ情報入力部
17 キーワード重み変更部
100 キーワード蓄積装置
101 コンテンツ情報管理テーブル
102 キーワード情報管理テーブル
103 キーワード・コンテンツ関係管理テーブル
110 ユーザ閲覧情報蓄積装置


【特許請求の範囲】
【請求項1】
ユーザにコンテンツを推薦するコンテンツ推薦装置であって,
ユーザが閲覧したコンテンツの情報を取得するコンテンツ情報入力手段と,
コンテンツに付与されたキーワードを格納したキーワード蓄積手段と,
キーワードとコンテンツの関連性およびキーワードの具体性の少なくとも一方の指標により,キーワードの重み付けを行うキーワード重み付け手段と,
前記ユーザが閲覧したコンテンツと推薦候補となるコンテンツ集合の中の各コンテンツの両方に共通に含まれるキーワードの重みの総和を,前記ユーザが閲覧したコンテンツと前記各コンテンツとの関連スコアとして算出するコンテンツ関連スコア算出手段と,
前記ユーザが閲覧したコンテンツとの関連スコアが大きい1または複数のコンテンツを,推薦コンテンツとして決定する推薦コンテンツ決定手段と,
ユーザに,前記推薦コンテンツの情報を提示するコンテンツ情報出力手段とを備える
ことを特徴とするコンテンツ推薦装置。
【請求項2】
前記キーワード蓄積手段は,推薦対象となる各コンテンツの情報と,コンテンツに付与されたキーワードの情報と,各キーワードの情報とを記憶しており,
前記キーワード重み付け手段および前記コンテンツ関連スコア算出手段は,前記キーワード蓄積手段から,コンテンツを指定することによって,コンテンツの情報およびコンテンツに付与されたキーワード集合を取得し,キーワードを指定することによって,キーワードの情報およびキーワードが付与されたコンテンツ集合を取得する
ことを特徴とする請求項1に記載のコンテンツ推薦装置。
【請求項3】
前記キーワード重み付け手段は,
コンテンツに付与された任意の2キーワードの出現頻度についてのカイ二乗値を計算し,各キーワードと他のキーワードとのカイ二乗値の平均値を計算することにより,コンテンツとキーワードとの関連性を計算し,算出された関連性の大きさを示す値をキーワードの重みとする
ことを特徴とする請求項1または請求項2に記載のコンテンツ推薦装置。
【請求項4】
前記キーワード重み付け手段は,
全コンテンツを対象に,重み付けを行うキーワードと共起するキーワードを取得し,共起するキーワードの共起回数の偏りを計算することにより,キーワードの具体性を示す値を計算し,算出された具体性を示す値をキーワードの重みとする
ことを特徴とする請求項1または請求項2に記載のコンテンツ推薦装置。
【請求項5】
前記推薦コンテンツ決定手段は,
関連スコアが閾値以上となるコンテンツ集合のクラスタリングを行う
ことを特徴とする請求項1から請求項4までのいずれか1項に記載のコンテンツ推薦装置。
【請求項6】
さらに,ユーザのコンテンツ閲覧情報を記憶するユーザ閲覧情報蓄積手段を有し,
前記キーワード重み付け手段は,
前記ユーザ閲覧情報蓄積手段を参照し,ユーザが閲覧した複数のコンテンツの入力を受け付けることにより,複数のコンテンツに付与されたキーワードの情報をもとにキーワードの重みを算出する
ことを特徴とする請求項1から請求項5までのいずれか1項に記載のコンテンツ推薦装置。
【請求項7】
さらに,ユーザからの入力によって,ユーザが興味のあるキーワードもしくは興味のないキーワードを選択し,選択したキーワードの重みを変更するキーワード重み変更手段を有し,
前記キーワード重み付け手段が算出したキーワードの重みを変更可能とした
ことを特徴とする請求項1から請求項6までのいずれか1項に記載のコンテンツ推薦装置。
【請求項8】
コンピュータを,請求項1から請求項7までのいずれか1項に記載のコンテンツ推薦装置が備える手段として機能させるためのコンテンツ推薦プログラム。
【請求項9】
請求項8に記載のコンテンツ推薦プログラムが記録されたコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−59183(P2012−59183A)
【公開日】平成24年3月22日(2012.3.22)
【国際特許分類】
【出願番号】特願2010−204092(P2010−204092)
【出願日】平成22年9月13日(2010.9.13)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】