説明

コンテンツ関連度算出装置、コンテンツ関連度算出方法、およびコンテンツ関連度算出プログラム

【課題】より適切なコンテンツを推薦する。
【解決手段】コンテンツ関連度算出装置10は、関連度の算出対象となるコンテンツを指定するコンテンツ指定部11と、階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積部17と、ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積部18と、ジャンル体系蓄積部17に蓄積されている階層構造においてコンテンツ指定部11により指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において関係性スコア蓄積部18に蓄積されている関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出部13と、ジャンル関連度算出部13により算出されたジャンル間の関連度に基づいてコンテンツ指定部11により指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出部14とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツ間の関連度を算出するコンテンツ関連度算出装置、コンテンツ関連度算出方法、およびコンテンツ関連度算出プログラムに関する。
【背景技術】
【0002】
あるコンテンツにアクセスしたユーザに対して別のコンテンツを提示することにより、コンテンツのアクセス数や売り上げを増加させる推薦技術が知られている。推薦技術の1つとして、コンテンツに付与されたメタデータのマッチングによりコンテンツの関連度を算出する手法がある。このような手法は内容ベースフィルタリングと呼ばれる。
【0003】
内容ベースフィルタリングでは、コンテンツから抽出されたキーワードや特徴量、コンテンツに付与されたタグやコンテンツの属性等の情報を利用し、より多くの情報が共通しているコンテンツの関連度が高いと考え、推薦を行う。内容ベースフィルタリングに関する研究としては、ユーザが高く評価したコンテンツに付与されている属性の出現頻度を計測し、出現頻度の高い属性が付与されているコンテンツを推薦する手法がある(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−205418号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ここで、内容ベースフィルタリングの推薦手法により、映像の推薦を行う場合を考える。例えば、あるユーザが「子供向けアニメ」というジャンルを持つ映像Aを視聴した場合、そのユーザは他の「子供向けアニメ」の映像も好む可能性が高い。そこで、内容ベースフィルタリングの推薦手法では、映像Aと別の「子供向けアニメ」の映像との関連度を高く算出する。特許文献1に開示される推薦手法でも、ユーザが「子供向けアニメ」を多く視聴している場合、「子供向けアニメ」に属する映像の推薦スコアを高く算出する。
【0006】
「子供向けアニメ」を視聴するユーザは子供である場合が多く、「人形劇」や「特撮」などのジャンルの映像も嗜好する可能性が高いため、「子供向けアニメ」に加えて「人形劇」や「特撮」などの映像を推薦することは有効であると考えられる。一方、「政治」や「ホラー」などのジャンルの映像は嗜好しない可能性が高いため、推薦しない方が良いと思われる。
【0007】
しかし、特許文献1などに開示される従来の内容ベースフィルタリングの推薦手法では、ユーザが視聴していないジャンルの映像については推薦スコアの増減を行わない。そのため、推薦されるべき「人形劇」や「特撮」ジャンルの映像が推薦されないという問題や、推薦されるべきでない「政治」や「ホラー」の映像が推薦されるという問題がある。
【0008】
本発明は、前記従来の技術に鑑み、より適切なコンテンツを推薦することのできるコンテンツ関連度算出装置、コンテンツ関連度算出方法、およびコンテンツ関連度算出プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
前記課題を解決するために、本発明の実施形態に係るコンテンツ関連度算出装置は、コンテンツ間の関連度を算出する装置であって、関連度の算出対象となるコンテンツを指定するコンテンツ指定部と、階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積部と、ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積部と、前記ジャンル体系蓄積部に蓄積されている階層構造において前記コンテンツ指定部により指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積部に蓄積されている関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出部と、前記ジャンル関連度算出部により算出されたジャンル間の関連度に基づいて前記コンテンツ指定部により指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出部とを備えることを特徴とする。
【0010】
前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されている場合、その関係性スコアの絶対値が大きいほど高い関連度を算出するとともに、ジャンルa’およびb’の階層が深いほど高い関連度を算出してもよい。
【0011】
前記ジャンル関連度算出部は、ジャンルa’とb’の間に定義されている関係性スコアをC(a’,b’)とし、ジャンルa’およびb’がどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(a’,b’)とし、ジャンルaとジャンルbにおいて最も近い共通の祖先以上に深い階層で定義されている関係性スコアがG’={(a’i,b’)|i=1,2,・・・}におけるi番目のジャンルの間であったとすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR’( G’)により算出してもよい。
【数1】

【0012】
前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されていない場合、前記祖先にあたるジャンルの階層が深いほど高い関連度を算出してもよい。
【0013】
前記ジャンル関連度算出部は、ジャンルcがどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(c,c)とすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR”(c)により算出してもよい。
【数2】

【0014】
前記課題を解決するために、本発明の実施形態に係るコンテンツ関連度算出方法は、コンテンツ間の関連度を算出する方法であって、関連度の算出対象となるコンテンツを指定するコンテンツ指定ステップと、階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積ステップと、ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積ステップと、前記ジャンル体系蓄積ステップで蓄積された階層構造において前記コンテンツ指定ステップで指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積ステップで蓄積された関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出ステップと、前記ジャンル関連度算出ステップで算出されたジャンル間の関連度に基づいて前記コンテンツ指定ステップで指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出ステップとを備えることを特徴とする。
【0015】
前記課題を解決するために、本発明の実施形態に係るコンテンツ関連度算出プログラムは、前記コンテンツ関連度算出装置が備える各処理部としてコンピュータを機能させることを特徴とする。
【発明の効果】
【0016】
本発明によれば、ジャンル間の関係性を考慮するようにしているので、より適切なコンテンツを推薦することのできるコンテンツ関連度算出装置、コンテンツ関連度算出方法、およびコンテンツ関連度算出プログラムを提供することができる。
【図面の簡単な説明】
【0017】
【図1】本発明の実施の形態におけるコンテンツ関連度算出装置の構成図である。
【図2】本発明の実施の形態におけるジャンル体系の説明図である。
【図3】本発明の実施の形態におけるコンテンツ情報の一例を示す図である。
【図4】本発明の実施の形態におけるコンテンツ関連度算出装置のフローチャートである。
【図5】本発明の実施の形態における関係性スコアの一例を示す図である。
【発明を実施するための形態】
【0018】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0019】
図1は、本発明の実施の形態におけるコンテンツ関連度算出装置10の構成図である。このコンテンツ関連度算出装置10は、コンテンツ間の関連度を算出する装置であって、図1に示すように、コンテンツ指定部11と、ジャンルペア抽出部12と、ジャンル関連度算出部13と、コンテンツ関連度算出部14と、コンテンツ関連度出力部15と、コンテンツ情報蓄積部16と、ジャンル体系蓄積部17と、関係性スコア蓄積部18とを備えている。コンテンツ情報蓄積部16は、コンテンツ情報を蓄積する蓄積装置等である。ジャンル体系蓄積部17は、木構造として表現されているジャンル体系を蓄積する蓄積装置等である。関係性スコア蓄積部18は、ジャンル間の関係性の強さを表す関係性スコアを蓄積する蓄積装置等である。コンテンツ指定部11は、関連度の算出対象となる2コンテンツを指定する入力装置等である。ジャンルペア抽出部12は、コンテンツ情報蓄積部16に蓄積されているコンテンツ情報に基づいて、コンテンツ指定部11により指定された2コンテンツについてジャンルペアを抽出する。ジャンル関連度算出部13は、ジャンルペア抽出部12により抽出されたジャンルペアについてジャンル間の関連度を算出する。例えば、木構造においてジャンルペアに共通する最も近い祖先を特定し、その祖先より深い階層において関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出する。コンテンツ関連度算出部14は、ジャンル関連度算出部13により算出されたジャンル間の関連度に基づいて、コンテンツ指定部11により指定された2コンテンツ間の関連度を算出する。コンテンツ関連度出力部15は、コンテンツ関連度算出部14により算出された2コンテンツ間の関連度を出力する。
【0020】
図2は、ジャンル体系蓄積部17に蓄積されているジャンル体系の説明図である。この図に示すように、ジャンル体系は木構造として定義されているものとする。このとき、異なるサービスにおけるジャンル体系が一つの木構造と表現されていてもよく、一番上の階層にルートジャンル、その下の階層に各サービスのジャンルが配置されているものとする。ここでは、関係性スコアが定義されているジャンル間を両矢印で表している。関係性スコアは、ユーザが独自に指定することができる。各コンテンツのジャンルの祖先・子孫・兄弟にあたるジャンル間もしくは自身との間に関係性が定義されている場合は、その関係性に基づいた関連度を算出するようになっている(後述する)。
【0021】
図3は、コンテンツ情報蓄積部16に蓄積されているコンテンツ情報の一例を示す図である。この図に示すように、1つのコンテンツには複数のジャンルが付与される場合がある。コンテンツAに付与されているジャンルをG={a|i=1,2,・・・}、コンテンツBに付与されているジャンルをG={b|j=1,2,・・・}とおくと、コンテンツAとコンテンツBの関連度R(A,B)は以下の式により算出される。
【数3】

【0022】
ただし、R(a,b)はジャンルaとジャンルbの関連度である。コンテンツAまたはコンテンツBに1つ以上のジャンルが付与されていない場合は、R(A,B)=0とする。
【0023】
図4は、コンテンツ関連度算出装置10の動作を示すフローチャートである。以下、あるコンテンツにアクセスしたユーザに対して別のコンテンツを提示する際の動作を説明する。
【0024】
まず、関連度の算出対象となる2コンテンツを指定する(ステップS1)。例えば、2コンテンツのうちの一方は、ユーザがアクセスしたコンテンツであり、もう一方は、コンテンツ情報蓄積部16に蓄積されている任意のコンテンツである。
【0025】
次いで、各コンテンツに付与された任意のジャンルペアについてステップS2〜S6を繰り返す。例えば、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとする。このとき、ジャンルaの祖先でジャンルcより深いジャンルa’と、ジャンルbの祖先でジャンルcより深いジャンルb’との間に、1つ以上の関係性スコアが定義されているか否かを判定する(ステップS2)。ただし、ジャンルa’はジャンルaであってもよく、ジャンルb’はジャンルbであってもよい。そして、関係性スコアが定義されている場合は、後述する数4により、関係性スコアに基づいてジャンルaとジャンルbの関連度を算出する(ステップS3)。一方、関係性スコアが定義されていない場合は、後述する数7により、共通の祖先の深さに基づいてジャンルaとジャンルbの関連度を算出する(ステップS4)。
【0026】
次いで、算出したジャンル間の関連度のうち、最も大きいものをXとする(ステップS5→S6)。すなわち、算出したジャンル間の関連度がXより大きい場合、またはXが未定義である場合は、算出したジャンル間の関連度をXとする。
【0027】
次いで、このXに基づいて2コンテンツ間の関連度を数3により算出し、算出した関連度を出力する(ステップS7→S8)。このような処理を繰り返せば、コンテンツ情報蓄積部16に蓄積されている全てのコンテンツについて、ユーザがアクセスしたコンテンツとの関連度を算出することができる。
【0028】
以下、ジャンルaとジャンルbに共通する最も近い祖先より深い階層で関係性スコアが定義されている場合について詳しく説明する。まず、関係性がG’={(a’i,b’)|i=1,2,・・・}におけるi番目のジャンルの間で定義されているとする。この場合、ジャンル関連度算出部13は、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR’( G’)により算出する。
【数4】

【0029】
C(a’,b’)は、ジャンルa’とb’の間に定義されている関係性スコアである。関係性スコアは任意の実数値をとる。ジャンルa’のコンテンツに対してジャンルb’のコンテンツの推薦を行いたい場合には正の値、推薦を行いたくない場合には負の値、どちらでもない場合には値は0として定義する。関係性スコアの絶対値が大きいほど高い関連度を算出する。例えば、「子供向け」と「ホラー」は関連度を低くするため、図5に示すように、C(子供向け,ホラー)=−1と定義されている。
【0030】
T(a’,b’)は、ジャンルa’およびb’がどれだけ詳細なジャンルであるかに基づくスコアを算出する関数であり、a’およびb’のジャンルが詳細であるほど大きい値となる。例えば、ジャンルaが「子供向けアニメ」、ジャンルbが「ホラー」であるとする。この場合、ジャンルaとジャンルbに共通する最も近い祖先は「VOD」であり、これより深い階層「子供向け」と「ホラー」の間に関係性スコアが定義されている。このとき、ジャンルa’は「子供向け」、ジャンルb’は「ホラー」となる。T(a’,b’)は、例えば、以下の式により算出することができる。
【数5】

【0031】
ただし、N(a’)は、全コンテンツのうちジャンルa’に属するコンテンツ数を返す関数であり、Nrootは全コンテンツ数である。αはパラメータであり、任意の値を設定することができる。Nroot=12000、α=100、N(子供向け)=1000、N(ホラー)=90であるとすると、T(子供向け,ホラー)=0.4となる。よって、「子供向けアニメ」と「ホラー」の関連度Rは、R’(子供向け,ホラー)=−1×0.4=−0.4となる。
【0032】
T(a’,b’)の別の算出方法を説明する。例えば、ジャンルa’およびb’がそれぞれ末端から何階層目に属しているかによりT(a’,b’)を算出してもよい。このとき、T(a’,b’)は以下の式により算出することができる。
【数6】

【0033】
ただし、D(a’)は、ジャンル体系の木構造においてジャンルa’が末端から何階層目に属しているかを返す関数であり、D(子供向け)=2となる。βはパラメータであり、任意の値を設定することができる。β=3、D(子供向け)=2、D(ホラー)=1であるとすると、T(子供向け,ホラー)=1となる。
【0034】
次に、ジャンルaとジャンルbに共通する最も近い祖先より深い階層で関係性スコアが定義されていない場合について詳しく説明する。ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとする。この場合、ジャンル関連度算出部13は、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR”(c)により算出する。
【数7】

【0035】
T(c,c)の値は、数5や数6により算出することができる。例えば、ジャンルaが「洋画−SF」、ジャンルbが「邦画−アクション」であるとする。この場合、ジャンルaとジャンルbに共通する最も近い祖先は「映画」であり、これより深い階層には関係性スコアが定義されていない。そこで、Nroot=12000、α=100、N(映画)=1000であるとすると、T(c,c)は、数5によりR”(映画)=0.12と算出することができる。
【0036】
以上のように、コンテンツ関連度算出装置10によれば、ジャンル間の関係性を考慮するようにしているので、より適切なコンテンツを推薦することができる。すなわち、ジャンルの異なる2つのコンテンツに対しても、各コンテンツのジャンル間の関係性に基づいてコンテンツ間の関連度を算出することができるため、内容ベースフィルタリングの推薦技術による推薦において、より強く関連するコンテンツをより多く推薦することが可能になる。
【0037】
また、コンテンツ関連度算出装置10によれば、関係性スコアが定義されている場合、数4によりジャンル間の関連度を算出するようにしている。すなわち、関係性スコアの絶対値が大きいほど高い関連度を算出するとともに、ジャンルa’およびb’の階層が深いほど高い関連度を算出するようにしているので、適切にジャンル間の関連度を算出することができる。
【0038】
また、コンテンツ関連度算出装置10によれば、関係性スコアが定義されていない場合、数7によりジャンル間の関連度を算出するようにしている。すなわち、祖先にあたるジャンルの階層が深いほど高い関連度を算出するようにしているので、適切にジャンル間の関連度を算出することができる。
【0039】
なお、本発明は、前記の実施形態に限定されず、特許請求の範囲内において変更や応用が可能である。例えば、ジャンル体系蓄積部17は、木構造として表現されているジャンル体系を蓄積することとしているが、ジャンル体系は階層構造として表現されていればよく、木構造に限定されるものではない。また、ユーザが関係性スコアを指定することとしているが、ユーザ以外の者(例えばコンテンツ提供者)が関係性スコアを指定することも可能である。
【0040】
また、本発明は、コンテンツ関連度算出装置10として実現することができるだけでなく、コンテンツ関連度算出装置10が備える特徴的な処理部をステップとする画像処理方法として実現したり、それらの各処理部としてコンピュータを機能させるコンテンツ関連度算出プログラムとして実現したりすることもできる。このようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのはいうまでもない。
【符号の説明】
【0041】
10…コンテンツ関連度算出装置
11…コンテンツ指定部
13…ジャンル関連度算出部
14…コンテンツ関連度算出部
17…ジャンル体系蓄積部
18…関係性スコア蓄積部

【特許請求の範囲】
【請求項1】
コンテンツ間の関連度を算出するコンテンツ関連度算出装置であって、
関連度の算出対象となるコンテンツを指定するコンテンツ指定部と、
階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積部と、
ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積部と、
前記ジャンル体系蓄積部に蓄積されている階層構造において前記コンテンツ指定部により指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積部に蓄積されている関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出部と、
前記ジャンル関連度算出部により算出されたジャンル間の関連度に基づいて前記コンテンツ指定部により指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出部と、
を備えることを特徴とするコンテンツ関連度算出装置。
【請求項2】
前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されている場合、その関係性スコアの絶対値が大きいほど高い関連度を算出するとともに、ジャンルa’およびb’の階層が深いほど高い関連度を算出することを特徴とする請求項1記載のコンテンツ関連度算出装置。
【請求項3】
前記ジャンル関連度算出部は、ジャンルa’とb’の間に定義されている関係性スコアをC(a’,b’)とし、ジャンルa’およびb’がどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(a’,b’)とし、ジャンルaとジャンルbにおいて最も近い共通の祖先以上に深い階層で定義されている関係性スコアがG’={(a’i,b’)|i=1,2,・・・}におけるi番目のジャンルの間であったとすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR’( G’)により算出することを特徴とする請求項2記載のコンテンツ関連度算出装置。
【数8】

【請求項4】
前記ジャンル関連度算出部は、ジャンルaとジャンルbに共通する最も近い祖先をジャンルcとすると、ジャンルaの祖先でジャンルcより深いジャンルa’とジャンルbの祖先でジャンルcより深いジャンルb’との間に前記関係性スコアが定義されていない場合、前記祖先にあたるジャンルの階層が深いほど高い関連度を算出することを特徴とする請求項1記載のコンテンツ関連度算出装置。
【請求項5】
前記ジャンル関連度算出部は、ジャンルcがどれだけ詳細なジャンルであるかに基づくスコアを算出する関数をT(c,c)とすると、ジャンルaとジャンルbの関連度R(a,b)を以下の式のR”(c)により算出することを特徴とする請求項4記載のコンテンツ関連度算出装置。
【数9】

【請求項6】
コンテンツ間の関連度を算出するコンテンツ関連度算出方法であって、
関連度の算出対象となるコンテンツを指定するコンテンツ指定ステップと、
階層構造として表現されているジャンル体系を蓄積するジャンル体系蓄積ステップと、
ジャンル間の関係性の強さを表す関係性スコアを蓄積する関係性スコア蓄積ステップと、
前記ジャンル体系蓄積ステップで蓄積された階層構造において前記コンテンツ指定ステップで指定されたコンテンツのジャンルに共通する最も近い祖先を特定し、その祖先より深い階層において前記関係性スコア蓄積ステップで蓄積された関係性スコアが定義されている場合、その関係性スコアに基づいてジャンル間の関連度を算出するジャンル関連度算出ステップと、
前記ジャンル関連度算出ステップで算出されたジャンル間の関連度に基づいて前記コンテンツ指定ステップで指定されたコンテンツ間の関連度を算出するコンテンツ関連度算出ステップと、
を備えることを特徴とするコンテンツ関連度算出方法。
【請求項7】
請求項1乃至5のいずれか1項に記載した各処理部としてコンピュータを機能させることを特徴とするコンテンツ関連度算出プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2013−3893(P2013−3893A)
【公開日】平成25年1月7日(2013.1.7)
【国際特許分類】
【出願番号】特願2011−135167(P2011−135167)
【出願日】平成23年6月17日(2011.6.17)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】