説明

オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システム

【課題】ユーザ自らが気づきにくく目新しいオブジェクトを提供可能とする。
【解決手段】対象利用者にオブジェクトを推薦するオブジェクト推薦装置であって、オブジェクトに対して所定の行動をした利用者数が多いほど小さい値を取るように人気度情報を算出する人気度算出部23と、他の利用者が前記対象利用者に先行してオブジェクトに行動をした度合いを示す先行度情報を算出する先行度算出部21と、対象利用者がオブジェクトに行動をしてから経過した時間に基づいて、対象利用者にとってのオブジェクトの重要度を示す重要度情報を算出する重要度算出部22と、人気度情報と先行度情報と重要度情報とに基づいて、他の利用者が対象利用者に先行してオブジェクトに行動をした確率に基づく革新者確率を算出する革新者確率算出部24と、革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する推薦オブジェクト抽出部40と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システムに関する。
【背景技術】
【0002】
近年、インターネット上のオンラインストアなどで、インターネットの利用者(以下、ユーザと称す)個々人を特定または識別し、その属性や行動に合わせて、ユーザに提供するサービスやコンテンツを変える仕組み、いわゆるサービスのパーソナライズが行われている。また、サービスのパーソナライズにおいて、対象ユーザと嗜好が類似したユーザを見つけ、それらのユーザが好むオブジェクトを推薦することが行われている。
【0003】
例えば、特許文献1では、ユーザのアクセス履歴を用いて、対象ユーザと他ユーザとの間の相対関係を抽出し、抽出した相対関係を数値化したスコアで、他ユーザの履歴データに含まれるオブジェクトを、順位付けする方法が開示されている。
また、非特許文献1では、各ユーザの最新の嗜好に合うオブジェクトの推薦をするために、過去の購入行動が対象ユーザと類似するだけでなく、購入が対象ユーザよりも先行している度合いの高い他ユーザの履歴を重視する方法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008−305055号公報
【非特許文献】
【0005】
【非特許文献1】川前徳章、坂野鋭、山田武士、上田修功「ユーザの嗜好の時系列性と先行性に着目した協調フィルタリング」電子情報通信学会論文誌 D Vol.J92−D、NO.6、pp.767−776、2009
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1および非特許文献1では、一般的に良く知られているオブジェクトが推薦されやすいので、ユーザ自らが気づきにくいオブジェクトが推薦されるわけではないという問題があった。また、当該良く知られているオブジェクトは概して定番オブジェクトとして長い期間購入され続けているので、ユーザに取って目新しいオブジェクトでないという問題もあった。
【0007】
本発明は上記の点に鑑みてなされたものであり、その目的は、ユーザ自らが気づきにくく目新しいオブジェクトを提供可能とすることにある。
【課題を解決するための手段】
【0008】
本発明は上記の課題を解決するためになされたものであり、対象利用者にオブジェクトを推薦するオブジェクト推薦装置であって、前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する人気度算出部と、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する先行度算出部と、前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する重要度算出部と、前記人気度情報と前記先行度情報と前記重要度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する革新者確率算出部と、前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する推薦オブジェクト抽出部と、を備えることを特徴とするオブジェクト推薦装置である。
【0009】
この発明によれば、対象利用者へ推薦するオブジェクトは、他の利用者が対象利用者に先行してオブジェクトに対して所定の行動をし、他の利用者が対象利用者に先行してオブジェクトに所定の行動をした確率に基づく革新者確率と、所定のオブジェクトに所定の行動をした後に別のオブジェクトに前記行動をする確率である利用者遷移確率とを用いて抽出される。これにより、対象利用者に先行してオブジェクトに対して所定の行動をしていた他の利用者が既に所定の行動をしていたオブジェクトであって、いまだ利用者数が少ないオブジェクトが推薦されるようになるので、利用者が自ら気づきにくく、各利用者にとって目新しいオブジェクトを提供することができる。
【0010】
また、本発明の一態様は、各利用者が所定のオブジェクトに前記行動をした後、別のオブジェクトに前記行動をするまで要した時間に基づいて、前記所定のオブジェクトに前記行動をした後に前記別のオブジェクトに前記行動をする確率を利用者遷移確率として算出する利用者遷移確率算出部を更に備え、前記推薦オブジェクト抽出部は、前記革新者確率と前記利用者遷移確率とに基づいて、対象利用者へ推薦するオブジェクトを抽出することを特徴とする。
【0011】
この発明によれば、先行度情報と、重要度情報と、人気度情報とに基づいて、革新者確率を算出している。これにより、利用者間で共通して所定の行動をしているオブジェクトであって、そのオブジェクトに対して他の利用者が先行して所定の行動をしている情報と、そのオブジェクトの対象利用者にとっての重要度と、そのオブジェクトの人気度に応じて、推薦するオブジェクトを抽出することができる。従って、推薦するオブジェクトを、対象利用者にとって、そのオブジェクトが重要であるか否かに応じて抽出することができる。
【0012】
また、本発明の一態様は、上記のオブジェクト推薦装置において、前記先行度算出部は、前記対象利用者が前記オブジェクトに所定の行動をした時刻と、他の利用者が前記オブジェクトに前記行動をした時刻と、前記オブジェクトが公開された時刻とに基づいて、前記先行度情報を算出することを特徴とする。
【0013】
この発明によれば、対象利用者がオブジェクトに所定の行動をした時刻と、他の利用者がオブジェクトに行動をした時刻と、オブジェクトが公開された時刻とに基づいて、先行度情報を算出している。これにより、当該オブジェクトに関して、他の利用者の先行度情報を正確に算出することができるので、対象利用者に適切なオブジェクトを推薦することができる。
【0014】
また、本発明の一態様は、上記のオブジェクト推薦装置において、前記革新者確率算出部は、各利用者が前記対象利用者にN人(Nは自然数)先行して前記行動をした各先行度合いの確率に基づく各確率に基づいて、前記革新者確率を算出することを特徴とする。
【0015】
この発明によれば、他の利用者が対象利用者にN人(Nは自然数)先行して所定の行動をした各先行度合いの確率に基づく各確率に基づいて、革新者確率を算出している。これにより、他の利用者が対象利用者に先行している人数と先行度合いに応じて、他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出できるので、各対象利用者に適切なオブジェクトを推薦することができる。
【0016】
また、本発明の一態様は、上記のオブジェクト推薦装置において、前記革新者確率算出部は、前記各利用者が前記対象利用者に1人先行して前記行動をした各先行度合いの確率に基づく各確率を要素とする行列をPと表したとき、Pに基づいて前記革新者確率を算出することを特徴とする。
【0017】
この発明によれば、Pに基づいて、他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出している。ここで、Pの(m,n)成分(ここで、mは自然数、nは自然数)は、利用者mが対象利用者nに対してN人先行してオブジェクトに所定の行動をした先行度合いの確率に基づく確率である。これにより、行列Pに基づいて革新者確率を算出できるので、各対象利用者に適切なオブジェクトを推薦することができる。
【0018】
また、本発明の一態様は、人気度算出部と、先行度算出部と、重要度算出部と、推薦オブジェクト抽出部とを備え、対象利用者にデジタル化されたオブジェクトを推薦するオブジェクト推薦装置が実行するオブジェクト推薦方法であって、前記人気度算出部が、前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する人気度算出手順と、前記先行度算出部が、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する先行度算出手順と、前記重要度算出部が、前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する重要度算出手順と、前記人気度情報と前記先行度情報と前記重要度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する革新者確率算出手順と、前記推薦オブジェクト抽出部が、前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する推薦オブジェクト抽出手順と、を有することを特徴とするオブジェクト推薦方法である。
【0019】
また、本発明の一態様は、対象利用者にオブジェクトを推薦するオブジェクト推薦装置としてのコンピュータに、前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する第1のステップと、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する第2のステップと、前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する第3のステップと、前記人気度情報と前記先行度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する第4のステップと、前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する第5のステップと、を実行させるためのオブジェクト推薦プログラムである。
【0020】
また、本発明の一態様は、対象利用者にオブジェクトを推薦するオブジェクト推薦システムであって、前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する人気度算出部と、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する先行度算出部と、前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する重要度算出部と、前記人気度情報と前記先行度情報と前記重要度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する革新者確率算出部と、を備える計算装置と、前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する推薦オブジェクト抽出装置と、を備えることを特徴とするオブジェクト推薦システムである。
【発明の効果】
【0021】
本発明によれば、ユーザ自らが気づきにくく目新しいオブジェクトを提供可能とすることができる。
【図面の簡単な説明】
【0022】
【図1】本発明の第1の実施形態におけるオブジェクト推薦装置の機能ブロック図である。
【図2】ログ記憶部に記憶されているテーブルの1例を示した図である。
【図3】本発明が提案するオブジェクト推薦方法を説明するための図である。
【図4】オブジェクトのリリース経過日数ごとの購入ユーザ数の分布を示した図である。
【図5】第3のユーザを介した、ユーザ2に対するユーザ1の先行度合いの確率を説明するための図である。
【図6】算出結果記憶部に記憶されているPIPとUFPのデータが格納されたテーブルの一例を示した図である。
【図7】オブジェクト推薦の処理の流れを示したフローチャートである。
【図8】PIPの算出処理の流れを示したフローチャートである。
【図9】楽曲、ビデオ、Netflix、およびQueryのデータセットを用いて、個人に特化された推薦のトップNの正確性を各手法で比較したテーブルである。
【図10】楽曲、ビデオおよびNetflix、およびQueryのデータセットを用いて、UC,IC、Gini係数、AE係数、AD係数を各手法で比較したテーブルである。
【図11】Gini係数の算出方法を説明するための図である。
【図12】本発明の第2の実施形態におけるオブジェクト推薦システムの機能ブロック図である。
【発明を実施するための形態】
【0023】
<第1の実施形態>
以下、本発明の第1の実施形態について、図面を参照して詳細に説明する。図1は、本発明の第1の実施形態におけるオブジェクト推薦装置の機能ブロック図である。
オブジェクト推薦装置1は、記憶部10と、計算部20と、入力部31と、表示部33と、推薦オブジェクト抽出部40とを備える。
【0024】
記憶部10は、ログ記憶部11と、算出結果記憶部12とを備える。
ログ記憶部11には、利用者を識別する符号であるユーザidと、オブジェクトを識別する符号であるオブジェクトidと、各オブジェクトを購入した時刻とが関連付けられて記憶されている。ここで、オブジェクトとは、商品、画像、記事などを総称したものである。
【0025】
図2は、ログ記憶部11に記憶されているテーブル50の1例を示した図である。テーブル40において、ユーザidとオブジェクトidとオブジェクトを購入した時刻とが1対1で対応付けられている。
【0026】
図1に戻って、算出結果記憶部12に、革新者確率算出部24により算出されたPIP(Personal Innovator Probability:個人的革新者確率)と、利用者遷移確率算出部25により算出されたUFP(User Flow Probability:利用者遷移確率)とが記憶されている。
【0027】
図3は、本実施形態によるオブジェクト推薦方法を説明するための図である。同図において、ターゲットユーザ(レコメンド対象となるユーザ)と、そのターゲットユーザと同じオブジェクトを購入した人であって、ターゲットユーザよりもそのオブジェクトの購入時刻が早い人(革新者:Innovator)のグループが示されている。
【0028】
同図の右側には、革新者のグループが購入したオブジェクト集合の購入遷移が示されている。革新者のグループは、オブジェクト51を購入後、オブジェクト52またはオブジェクト53を購入し、その後オブジェクト54を購入している。オブジェクト54は、革新者のグループにより最近購入されたオブジェクトである。
【0029】
本実施形態では、オブジェクト推薦装置1は、各ユーザのオブジェクトの購入履歴から、ユーザ毎に対応する1人以上の革新者を検索し、革新者が先に購入しているオブジェクトを、気づきを与えるオブジェクトとして抽出する。オブジェクト推薦装置1は、抽出したオブジェクトの中で、革新者が一番最近購入したオブジェクトを抽出する。このオブジェクトが、ターゲットユーザにとって、ユーザが気づきにくく目新しいオブジェクトである。オブジェクト推薦装置1は、ターゲットユーザへ当該オブジェクトを推薦する。
【0030】
図1に戻って、計算部20は、先行度算出部21と、重要度算出部22と、人気度算出部23と、革新者確率算出部24と、利用者遷移確率算出部25とを備える。
先行度算出部21は、ユーザa、b間で共通するオブジェクト集合Cabのオブジェクト毎に、オブジェクトi(iは0以上の整数)についてユーザb(u)がユーザa(u)に対し先行する度合いr(i;b,a)を算出する。
【0031】
図4は、オブジェクトのリリース経過日数ごとの購入ユーザ数の分布を示した図である。図4の横軸はオブジェクトがリリースされてからの購入されるまでの経過日数、縦軸は経過日数ごとにオブジェクトを購入したユーザ数の対数である。同図より、購入したユーザ数の分布の対数を片対数グラフで直線に近似できることから、オブジェクトのリリース直後に購入ユーザ数のピークがあり、その数は指数的に減少する。従って、本実施形態で後述する楽曲やビデオなどの購入ユーザ数の時間分布は、指数分布で近似しうる。
【0032】
従って、先行度算出部21は、指数分布を用いて、オブジェクトi(iは1以上の整数)についてユーザb(u)がユーザa(u)に対し先行する度合いr(i;b,a)を以下の式(1)により算出する。
【0033】
【数1】

【0034】
ここで、tb,iはユーザbがオブジェクトiを購入した時刻、ta,iはユーザaがオブジェクトiを購入した時刻、Tはオブジェクトiのリリース時刻、t(オーバーライン)はオブジェクトiが購入された時刻の全ユーザにおける平均である。なお、前記“(オーバーライン)”は、その直前の文字の平均を表す。ユーザbがユーザaに先行してオブジェクトiを購入していなければ、先行する度合いrは0である。また、先行する度合いr(i;b,a)は、ユーザbがユーザaよりも先行して購入するほど高くなる。
先行度算出部21は、算出された先行する度合いr(i;b,a)を革新者確率算出部24へ供給する。
【0035】
図1に戻って、重要度算出部22は、ユーザa、b間で共通するオブジェクト集合Cabのオブジェクト毎に、ユーザaに対するオブジェクトiの重要度w(i,a)を算出する。一般に、オブジェクト購入時点のユーザにとってのオブジェクトの重要度は指数関数的に減衰すると考えられているため、重要度算出部22は、以下の式(2)により重要度w(i,a)を算出する。
【0036】
【数2】

【0037】
ここで、ea,iはユーザaがオブジェクトiを購入した時刻からの経過時間、e(オーバーライン)は、経過時間ea,iをユーザaが購入した全てのオブジェクトiに対して平均したものである。ユーザaに対するオブジェクトiの重要度w(i,a)は、そのオブジェクトiを購入してからの経過時間が短いほど高くなる。換言すると、ユーザaに対するオブジェクトiの重要度w(i,a)は最近購入するほど高くなる。
重要度算出部22は、算出された重要度w(i,a)を革新者確率算出部24へ供給する。
【0038】
人気度算出部23は、ユーザa,b間で共通するオブジェクト集合Cabのオブジェクト毎に、オブジェクトiの人気度v(i)を以下の式(3)により算出する。
【0039】
【数3】

【0040】
ここで、Uはオブジェクトiを購入した全ユーザ数である。オブジェクトiの人気度v(i)は、他のユーザが購入していないほど高くなる。
人気度算出部23は、算出された人気度v(i)を革新者確率算出部24へ供給する。
【0041】
革新者確率算出部24は、先行する度合いr(i;b,a)と、ユーザaに対するオブジェクトiの重要度w(i,a)と、オブジェクトiの人気度v(i)とを用いて、ユーザaに対するユーザbの先行度合いPID(u,u)を以下の式(4)により算出する。
【0042】
【数4】

【0043】
ここで、式(4)は、ユーザa、b間で共通するオブジェクト集合Cabに属する全てのオブジェクトiで、r(i;b,a)×w(i,a)×v(i)の和を算出することを意味する。
続いて、革新者確率算出部24は、上記PIDを用いてユーザaに対するユーザbの先行度合いの確率p(b|a)を以下の式(5)により算出する。
【0044】
【数5】

【0045】
ここで、右辺の分母は、ユーザaからみた他のユーザの先行度合いPID(u,u)を全てのユーザにおいて加算したものである。
続いて、革新者確率算出部24は、エルゴード的マルコフ連鎖を実装するために、改訂したユーザaに対するユーザbの先行度合いの確率p(ドット)(b,a)を以下の式(6)により算出する。
【0046】
【数6】

【0047】
ここで、革新者確率算出部24は、他のどのユーザuも、ユーザaに先行してオブジェクトを購入していない場合(式(6)のotherwise)には、改訂したユーザaに対するユーザbの先行度合いの確率p(ドット)(b,a)は、全ユーザ数Uの逆数と仮定する。
【0048】
革新者確率算出部24は、全てのユーザの組み合わせで、ユーザmに対するユーザnの先行度合いの確率p(ドット)(n|m)を算出する。そして、革新者確率算出部24は、n行m列の成分をp(ドット)(n|m)とする行列P(ドット)を算出する。
【0049】
続いて、革新者確率算出部24は、エルゴード的マルコフ連鎖を実装するために、上記行列P(ドット)を用いて、各利用者が対象利用者に1人先行して購入した各先行度合いの確率p(ドット)に基づく各確率を要素とする革新者確率行列P(ダブルドット)を以下の式(7)により算出する。
【0050】
【数7】

【0051】
ここで、革新者確率行列P(ダブルドット)は、ユーザaに対してユーザbが1人先行して購入する先行度合いの確率p(b|a)に基づく確率p(ダブルドット)(b,a)を行列の(b,a)成分とする革新者確率行列であり、αは重みパラメータ(0から1の間の数)、Uは全ユーザ数、eは全要素が1の長さUの列ベクトルである。この定義によれば、革新者確率行列P(ダブルドット)は、個人的革新者遷移の確率を表した確率行列として構成される。そして、この革新者確率行列P(ダブルドット)は、定常分布に収束する。
【0052】
最後に、革新者確率算出部24は、複数のステップを介したユーザ間で先行度合いを考慮したPIPを算出する。複数のステップを介するというのは、例えば、3人のユーザ(ユーザ1、ユーザ2、ユーザ3)を仮定したときに、あるオブジェクトに着目した場合、ユーザ2に先行してユーザ3がそのオブジェクトを購入したとしても、ユーザ3に更に先行してユーザ1がそのオブジェクトを購入していた場合のことである。
【0053】
あるユーザが少ないステップ数を介して先行して購入しているときには、ユーザ間により直接的な関係があり、その場合に先行して購入したユーザは、より重要なInnovatorであるとみなされるので、そのユーザの革新者確率を相対的に上げる必要がある。
一方、あるユーザが多くのステップ数を介して先行して購入しているときには、ユーザ間により直接的な関係が少なく、その場合に先行して購入したユーザは、あまり重要なInnovatorでないので、そのユーザの革新者確率を相対的に下げる必要がある。
従って、革新者確率算出部24は、他の利用者が対象利用者に先行してオブジェクトを購入した確率に基づく革新者確率を要素とする行列P(オーバーライン)を一例として以下の式(8)で算出する。
【0054】
【数8】

【0055】
ここで、βは先行度合いの効果を調整するパラメータであり、例えば0から1までの値である。P(ダブルドット)(Nは自然数)は、各利用者が対象利用者にN人(Nは自然数)先行して購入する各確率に基づく各確率を成分とする行列である。また、Nの数が大きくなるほど、1/N!が小さくなるので、P(ダブルドット)の効果が小さくなる。また、exp(−β)は正規化係数である。
【0056】
右辺の括弧内の第2項目は、ユーザnに対するユーザmの先行度合いであって、ユーザを1人分、間に介した先行度合いの効果を表す項である。同様に、右辺の括弧内のN−1項目は、ユーザnに対するユーザmの先行度合いであって、ユーザを(N−2)人分、間に介した先行度合いの効果を表す項である。
【0057】
ここで、数式(8)の右辺の括弧内の第2項目の意味するところを説明する。図5は、第3のユーザを介した、ユーザ2に対するがユーザ1の先行度合いの確率を説明するための図である。同図において、3人のユーザ(ユーザ1、ユーザ2、ユーザ3)を仮定する。
【0058】
その場合、購入パターンは、ユーザ1、ユーザ1、ユーザ2の順にオブジェクトを購入する第1のパターンと、ユーザ1、ユーザ2、ユーザ2の順にオブジェクトを購入する第2のパターンと、ユーザ1、ユーザ3、ユーザ2の順にオブジェクトを購入する第3のパターンがある。
【0059】
同図における第1のパターンにおいて、ユーザ1のユーザ1に先行してオブジェクトを購入する確率(以下、先行購入確率と称する)がp(ダブルドット)(1,1)で、ユーザ1のユーザ2に対する先行購入確率がp(ダブルドット)(1,2)で、ユーザ2のユーザ2に対する先行購入確率がp(ダブルドット)(2,2)で、ユーザ1のユーザ3に対する先行購入確率がp(ダブルドット)(1,3)で、ユーザ3のユーザ2に対する先行購入確率がp(ダブルドット)(3,2)とする。そうすると、図5において、ユーザ1が2人先行してユーザ2に先行購入確率(P(ダブルドット))(1,2)は、以下の式(9)で表される。
【0060】
【数9】

【0061】
この先行購入確率(P(ダブルドット))(1,2)は、以下の式(10)で表される(P(ダブルドット))の1行2列目の成分と同一である。
【0062】
【数10】

【0063】
従って、数式(8)の右辺の括弧内の第2項目は、ユーザnに対するユーザmの先行度合いであって、ユーザを1人分、間に介した先行度合いの効果を表す項である。
また、数式(8)の右辺の括弧内の第N−1項目の意味するところを説明する。利用者mが対象利用者nに1人先行して購入した先行度合いの確率に基づく確率p(ダブルドット)(m,n)を要素とする行列をP(ダブルドット)と表したとき、P(ダブルドット)N−1は、各利用者が対象利用者にN−1人(Nは自然数)先行して購入した各先行度合いの確率に基づく各確率を要素とする行列である。
図1に戻って、革新者確率算出部24は、算出された他の利用者が対象利用者に先行してオブジェクトを購入した確率に基づく革新者確率を要素とする行列P(オーバーライン)をPIPとして算出結果記憶部12に記憶させる。
【0064】
続いて、利用者遷移確率算出部25は、以下の方法によりUFPを算出する。UFPの目的は、ある特定のオブジェクトの購入の後に、別のオブジェクトを購入した消費者の数を推定するために、各オブジェクトに対して適切な重みづけをすることである。遷移確率pabを算出するために、オブジェクトaの購入後に、時刻tでオブジェクトbを購入した消費者に関する関数が考慮される。この確率に応じて、そのオブジェクトが次に購入されるか予測されうる。
【0065】
本発明の第1の実施形態では、マルコフ特性を満たし、状態空間という1つのセットから得られる値を取る連続時間マルコフ過程を用いたオブジェクト間の遷移確率が構築される。連続時間マルコフ過程は最も簡単には、遷移確率qijを特定することによって定義される。このプロセスは、典型的には、マルコフ連鎖の遷移に関する全ての遷移確率行列Qのij成分として与えられる。
【0066】
この確率が保存されるためには、遷移確率行列Qの非対角要素が負でなく、ジャンプ率と呼ばれる対角要素が以下の式(11)を満たさなければならない。
【0067】
【数11】

【0068】
ここで、qは、オブジェクトiからの連鎖確率である。統計過程では、オブジェクトiからオブジェクトjに遷移する確率pijは、オブジェクトiに停留する時間とは独立であり、pii=0とΣpij=1(但し、j≠i)を満たさなければならない。
従って、オブジェクトiからオブジェクトjに遷移する確率pijは、以下の式(12)で表される。
【0069】
【数12】

【0070】
オブジェクトiに停留する期間は遷移確率qを係数とする指数関数に従う。指数分布のランダム変数の特性から、ユーザuがオブジェクトiからオブジェクトjの購入まで要した時間tu,ijの平均であるE(t)は、遷移確率qを用いて以下の式(13)で表される。
【0071】
【数13】

【0072】
利用者遷移確率算出部25は、式(13)により遷移確率qを算出した後に、以下の式(14)により、オブジェクトiからオブジェクトjへ遷移する確率pijを算出する。
【0073】
【数14】

【0074】
式(12)から遷移確率qijは、以下の式(15)で表される。
【0075】
【数15】

【0076】
続いて、時刻t=tにおけるトレンドを予測するために、行列Uのij成分である期間[0,t]におけるオブジェクトiから他のオブジェクトへのユーザの遷移確率u(j|i,t)を以下の式(16)で表される。
【0077】
【数16】

【0078】
ここで、P(t)はij成分pijである遷移行列を示している。形式的に、状態空間が有限だとすると、遷移確率は、式(12)より以下の微分方程式(17)で推定される。
【0079】
【数17】

【0080】
ここで、Iは恒等行列である。上記微分方程式(17)の解は、以下の式(18)で表される。
【0081】
【数18】

【0082】
続いて、QがQ=MDM−1により対角化されるとすると、コルモゴロフの前進および行進方程式(Kolmogorov forward and backward equation)を満たす遷移行列関数P(t)は、以下の式(19)で表される。
【0083】
【数19】

【0084】
Qが大きいため、テイラー近似を用いて、遷移行列関数P(t)は以下の式(20)で近似される。
【0085】
【数20】

【0086】
最終的に、UFPはu(i|i,∞)から構成され、以下の式(21)で表される。
【0087】
【数21】

【0088】
従って、利用者遷移確率算出部25は、上記式(21)を用いて、UFPを算出する。そして、利用者遷移確率算出部25は、算出されたUFPを算出結果記憶部12へ記憶させる。
【0089】
図6は、算出結果記憶部12に記憶されているPIPとUFPのデータが格納されたテーブルの一例を示した図である。図6(a)は、算出結果記憶部12に記憶されているPIPのデータが格納されたテーブル61の一例を示した図である。同図において、テーブル61において、対象ユーザのユーザidと、他のユーザのユーザidと、対象ユーザに対する他のユーザの個人的革命者確率PIPが対応付けられている。
【0090】
図6(b)は、算出結果記憶部12に記憶されているUFPのデータが格納されたテーブル62の一例を示した図である。同図において、テーブル62において、元のオブジェクトのオブジェクトidと、次のオブジェクトidと、元のオブジェクトから次のオブジェクトに遷移する確率UFPが対応付けられている。
【0091】
図1に戻って、入力部31から外部から入力された入力に基づいて、対象ユーザのユーザidを推薦オブジェクト抽出部32へ供給する。
推薦オブジェクト抽出部32は、入力部31から供給された対象ユーザのユーザidに対応するPIPとUFPを算出結果記憶部12から読み出す。そして、推薦オブジェクト抽出部32は、読み出したPIPとUFPに基づいて、以下に示す方法により、対象ユーザのユーザidに対応するCPI(Conditonal Probability of the Item given each user:各ユーザがオブジェクトを購入する確率)を算出する。
【0092】
式(10)で算出されるPIPと、式(21)で算出されるUFPを用いて、ユーザa(u)がオブジェクトb(i)を購入する確率p(i|u)は以下の式(22)で表される。
【0093】
【数22】

【0094】
ここで、δ(i|u)はユーザjがオブジェクトa(i)を式(22)の計算時点で購入していれば1であり、そうでなければ0である。
オブジェクトb(i)を購入した個人的革新者のPIPが高く、オブジェクトiへのUFPが高ければ、ユーザa(u)がオブジェクトb(i)を購入する確率p(i|u)は、高くなる。
【0095】
推薦オブジェクト抽出部40は、全てのオブジェクトiで確率p(i|u)を算出する。そして、推薦オブジェクト抽出部40は、確率p(i|u)が高い順にN(トップNと称す)個のオブジェクトを抽出する。
【0096】
トップN個のオブジェクトを含むオブジェクトリストの中に、対象ユーザが購入したオブジェクトが含まれている場合、推薦オブジェクト抽出部40は、そのオブジェクトをオブジェクトリストから削除し、削除されたオブジェクトを除くオブジェクトリストを表示部33に表示させる。
【0097】
なお、推薦オブジェクト抽出部40は、トップN個のオブジェクトを抽出し、抽出したオブジェクトを含むオブジェクトリストを表示部33に表示させたが、これに限らず、最も確率p(i|u)が高いオブジェクトを抽出し、抽出したオブジェクトに対応するオブジェクトを表示部33に表示させてもよい。
【0098】
図8は、PIPの算出処理の流れを示したフローチャートである。まず、計算部20は、ログを記憶部10から読み出す(ステップS101)。次に、革新者確率算出部24は、読み出したログに基づきPIPを算出し、算出されたPIPを算出結果記憶部12に記憶させる(ステップS102)。次に、利用者遷移確率算出部25は、読み出したログに基づきUFPを算出し、算出されたUFPを算出結果記憶部12に記憶させる(ステップS103)。
【0099】
次に、推薦オブジェクト抽出部40は、入力部から供給された対象ユーザのユーザidに対応するPIPとUFPとを算出結果記憶部12から読み出す。そして、推薦オブジェクト抽出部40は、読み出したPIPとUFPとに基づいて、CPIを算出する(ステップS104)。次に、推薦オブジェクト抽出部40は、CPIが高い順にオブジェクトが並べられたオブジェクトリストを表示部33に表示させる(ステップS105)。以上で、本フローチャートの処理を終了する。
【0100】
続いて、図8は、PIPの算出処理の流れを示したフローチャートである。まず、先行度算出部21は、ログ記憶部11から読み出されたログから先行度情報rを算出し、革新者確率算出部24へ供給する(ステップS201)。重要度算出部22は、ログ記憶部11から読み出されたログから重要度情報wを算出し、革新者確率算出部24へ供給する(ステップS202)。人気度算出部23は、ログ記憶部11から読み出されたログから人気度情報iを算出し、革新者確率算出部24へ供給する(ステップS203)。
【0101】
革新者確率算出部24は、供給された先行度情報rと、重要度情報wと、人気度情報iとに基づいて、先行確率PIDを算出する(ステップS204)。革新者確率算出部24は、算出された先行確率PIDに基づいて、PIPを算出し、算出結果記憶部12に記憶させる(ステップS205)。以上で、本フローチャートの処理を終了する。
【0102】
<本発明の効果>
続いて、本発明が提案する手法の効果について立証するために行った実験結果について、説明する。
<実験に用いたデータセットについて>
本発明の第1の実施形態では、4つのデータセットについての実験結果について説明する。4つのデータセットうち2つは、日本でオンラインストアでの楽曲またはビデオのダウンロードサービスから得られた購入履歴である。3つ目は、協調フィルタリングのコンテストの評価データとして用いられる映画のレビュー履歴Netflixである。最後の1つは検索クエリーのログである。以下、それぞれのデータセットについて説明する。
【0103】
まず、オンラインストアの購入履歴の詳細は以下の通りである。楽曲ダウンロードの購入履歴は2005年4月1日から2006年7月31日までであり、84,620ユーザによって購入された44,527オブジェクトを含む。
各購入履歴は、ユーザID、購入した曲のタイトル、アーティスト名、CDアルバムのタイトル、購入日時および価格から構成されている。
【0104】
ビデオダウンロードの購入履歴は2005年9月1日から2006年2月28日までであり、7,537ユーザによって購入された4,064オブジェクトを含む。
各購入履歴は、ユーザID、購入したビデオのタイトル、監督名、購入日時および価格から構成されている。
【0105】
これらのデータのたいていのオブジェクトは、新規に発売されたものであり、まずCDまたはビデオ(DVD)として店頭でのリリースの直後にオンラインサイトで購入できるようになったものである。
【0106】
Netflixは、1999年11月11日から2005年12月31日までに、480,189人のユーザによって評価された17,770の映画に対する100,480,507個の評価データである。少なくとも20個の映画に対して評価を降したユーザが選択される。また、少なくとも100人のユーザによって評価された映画が選択される。これによって、データセットのデータサイズが小さくなり、136,589人のユーザによって評価された9,264の映画に対する85,730,203個の評価データとなる。
【0107】
各評価データは、映画タイトルID、ユーザID,評価、評価日時から構成されている。上記2つのオンラインストアでの購入履歴とは異なり、Netflixは、ユーザの映画に対する評価のログであり、そのデータは1から5までの5段階評価で表される。
本発明で提案する協調フィルタリングでは、ユーザの評価でなく購入を予測する。そこでNetflixのデータは次のように利用された。
【0108】
そのユーザの評価は、5段階の評価から0から1かのバイナリ値に変換された。すなわち、ユーザがあるオブジェクトを評価していた場合、その評価は1(購入を意味する)となり、それ以外は0(購入しないことを意味する)となる。Netflix(o)およびNetflix(p)は文献(N. Kawamae, H. Sakano, T. Yamada, Personalized recommendation based on the personal innovator degree. In ACM Recsys, pages 329-332, 2009)と同じ方法で算出されたものが用いられた。
【0109】
次に、検索クエリーは、2006年4月1日から2006年5月31日までのサーチエンジンのログから作られたものである。このデータセットは、35,325,842の負エリー履歴から構成されている。また各検索クエリーは、クエリーキーワードID、ユーザID,および履歴日時から構成されている。
【0110】
<実験計画について>
実験では、ユーザの過去の購入履歴から、どの楽曲、ビデオ、映画(クエリー)を将来そのユーザが購入する(検索する)か予測することを目的とする。推薦の予測精度を評価するために、データセットをランダムにK個のサブデータセットに分割し、K回クロス確認するシミュレーションが行われた。
【0111】
我々は、K個のサブデータセットの中で、モデルをテストするために、1つのサブデータセットを評価データとし、他のK−1個のサブデータセットをトレーニングデータとする。
このプロセスはK回繰り返され、各サブデータセットは1回のみ評価データとされた。各サブデータセットは2つの期間(学習期間、テスト期間)に分けられ、テスト期間中のサブデータセットをテストデータと称し、学習期間中のサブデータセットを学習データと称する。ここでは、Kは一例として、10に設定された。
【0112】
オブジェクト推薦装置1は、K個に分割したうち1個のデータセットのテスト期間に含まれる全ユーザをそれぞれ対象ユーザとし、提案手法を用いて残りのK−1個のデータオブジェクトをランキングした。オブジェクト推薦装置1は、そのランキングに基づいて対象ユーザに対して上位N件のオブジェクトを提示した。
【0113】
そして、オブジェクト推薦装置1は、これら提示したオブジェクトが対象ユーザのテスト期間中の購入履歴に含まれる割合をトップNの正確性として算出した。ここで、このトップNの正確性は、協調フィルタリングの予測性能を評価するのに一般的に使われている指標である。
【0114】
ここでは、従来の9個の推薦方法に対してデータセットを適用し、トップN個(Nは1、5、または10)の推薦の正確性が比較された。
図9は、楽曲、ビデオ、Netflix、およびQueryのデータセットを用いて、個人に特化された推薦のトップNの正確性を各手法で比較したテーブルである。t検定で他の全ての手法と比べてp<0.05、p<0.01で顕著に異なる場合に、それぞれ“*”、“**”の印が付けられている。
【0115】
従来の推薦方法の1つであるPopularは、学習期間の最後の1ヶ月で最も人気のあるオブジェクトを推薦するので、推薦オブジェクトはユーザ毎に個別化されていない。
従来の推薦方法の1つであるPearsonとCosineは、それぞれピアソンの相関係数またはコサイン類似度によって計測されたユーザの類似度に基づいている。
【0116】
一方、Itemは、文献(J. K. B. Sarwa, G. Karypis and J. Riedl. Item-based collaborative filtering recommendation algorithms. In WWW, pages 285-295, 2001.)で提案されたピアソンの相関係数によって計測された内容類似度に基づいている。
bPLSAは、ベルヌーイ分布を用いたPLSA(Probabilistic Latent Semantic Analysis:確率潜在意味解析)(T. Hofmann. Collaborative filtering via Gaussian probabilistic latent semantic analysis. In ACM SIGIR, pages 259-266, 2003)に基づいている。
【0117】
MEAは、文献(D. Pavlov and D. Pennock. A maximum entropy approach to collaborative filtering in dynamic, sparse, high-dimensional domains. In NIPS, pages 1441-1448, 2002)で提案されたMaxlimum Entropy Approach(最大エントロピー法)である。
【0118】
IFDは、文献(Y. Hu, Y. Koren, and C. Volinsky. Collaborative filtering for implicit feedback datasets. In ICDM,pages 263-272, 2008.)で提案された潜在フィードバックデータセットのための協調フィルタリングである。
EABIFは、文献(X. Song, C. Lin, B. Tseng, and M. Sun. Personalized recommendation driven by information flow. In ACM SIGIR, pages 509-516, 2006.)で提案されたEarly Adoption Based Information Flow(EABIF)方法である。
【0119】
PIDは、式(4)で算出されるPIDである。PIPは、式(8)で算出されるPIPである。PIP+UFPは、本発明が提案する方法である。本実施形態では、式(7)におけるαは1に設定され、式(8)におけるβは1に、Nは5に設定されている。
【0120】
図9において、データセットが楽曲、ビデオ、Netflix(h)またはNetflix(p)のときに、本発明が提案するPIP+UFPは、他の全ての手法に比べて、トップ10の推薦オブジェクトの正確性が高い。
すなわち、PIP+UFPは、他の全ての手法に比べて、高い精度で将来ユーザが購入するオブジェクトを推定していることを示している。
【0121】
この結果は、データセットに含まれるオブジェクトが高価なオブジェクトから構成されているという特徴によって説明しうる。すなわち、各ユーザはこれらの高価なオブジェクトを購入する際には、必要性からというよりはむしろ嗜好によって動機付けられて購入しているからだと考えられる。
【0122】
PIP+UFPは、より最近に購入したオブジェクトに対して重みを大きくするようにする時間減衰因子を用いて、同じ好みを持ったユーザ毎に区別する。また、PIP+UFPは、オブジェクトの流行をオブジェクトランキングに導入する。その結果、本発明が提案する方法であるPIP+UFPは、ユーザの最新の嗜好にマッチするオブジェクトを上位にランキングするので、オブジェクト推薦の正確性の性能が向上している。
【0123】
図10は、楽曲、ビデオおよびNetflix、およびQueryのデータセットを用いて、UC,IC、Gini係数、AE係数、およびAD係数を各手法で比較したテーブルである。t検定で他の全ての手法と比べてp<0.05、p<0.01で顕著に異なる場合に、それぞれ“*”、“**”の印が付けられている。
【0124】
同図において、上記のトップN個の正確性に加えて、2つの被覆率(IC、UC)、すなわちGini係数、オブジェクトのリリースからの平均時間(AE)または予測購入時間の平均(AD)を用いて、上記の各手法の性能が評価されている。
【0125】
続いて、それぞれの指標について詳細に説明する。まず、UC(User Coverage:推薦ユーザの被覆率)は、テスト期間にオブジェクトを購入したユーザ数に対する各推薦方法が推薦可能なユーザ数の割合である。UCが高いほど、多くのユーザにオブジェクトを推薦できるので、ユーザ全体にとって価値が高いシステムである。
【0126】
一方、IC(Item Coverage:推薦オブジェクトの被覆率)は、テスト期間に購入されたオブジェクトのタイトル数に対する各推薦方法が推薦可能なタイトル数の割合である。ICは、システムが推薦できるシステム中のオブジェクトドメインの大きさを示す1つの指標である。従って、ICが低いシステムは、ごく限られた選択オブジェクトしか提示できないから、ユーザにとって価値が低いシステムである。
【0127】
Gini係数は、オブジェクトに対するユーザの購入者数の分布の統計的分散を示す指標である。図11は、Gini係数の算出方法を説明するための図である。Gini係数gは、45度線71と横軸73と縦軸74とで囲まれた面積(A+B)に対する45度線71とローレンツ曲線(Lorenz curve)72で囲まれた面積Aの割合であり、数式ではg=A/(A+B)と表される。Gini係数は、0から1の値をとり、値が0に近いほどオブジェクトごとの購入ユーザ数の格差が少なく、1に近いほど格差が大きいことを意味する。
【0128】
Gini係数が0の場合、分布が完全に平等、すなわち全てのオブジェクトが正確に同じ数のユーザによって購入されている。一方、Gini係数が1の場合、分布が完全に不平等、すなわち1つのオブジェクトがすべてのユーザによって購入され、他のオブジェクトは、どのユーザにも購入されてない。
【0129】
高いGini係数となる結果は、2、3個の特定のオブジェクトがたいていのユーザによって高くランク付けされている傾向にあることを意味し、特定のオブジェクトばかりが推薦される傾向が強く、ユーザ毎の推薦オブジェクトの違いは小さくなる。すなわち、オブジェクト推薦は、ユーザ毎に特化されていないことを意味する。一方、Gini係数が0に近いほど、オブジェクトの推薦がユーザ毎に特化し、オブジェクト推薦がうまく行われていることを意味する。
【0130】
AE(Average Elapsed time)は、オブジェクトがリリースから購入されるまでの経過時間の平均である。この値が小さければそれだけオブジェクトの新規性が高くなる。
AD(Average Differnece time)は、テスト期間の開始時刻とオブジェクト購入の時刻の差の平均である。この値が大きければ、それだけ気が付き難いオブジェクトになる。
【0131】
図10において、データセットが楽曲、ビデオ、Netflix(p)のときに、本発明が提案するPIP+UFPは、他の全ての手法に比べて、ICが高く、Gini係数が低く、AEが短く、ADが長い。
すなわち、PIP+UFPは、他の全ての手法に比べて、多くのオブジェクトを推薦でき、かつオブジェクトの推薦がユーザ毎に特化し、かつ新規性が高いオブジェクトを推薦し、かつ気が付き難いオブジェクトを推薦していることを示している。
【0132】
また、データセットがNetflix(h)のときに、本発明が提案するPIP+UFPは、本発明が提案するPIP+UFPは、他の全ての手法に比べて、ICが高く、Gini係数が低く、AEが短い。
すなわち、PIP+UFPは、他の全ての手法に比べて、多くのオブジェクトを推薦でき、かつオブジェクトの推薦がユーザ毎に特化し、かつ新規性が高いオブジェクトを推薦していることを示している。
【0133】
また、データセットがQueryのときに、本発明が提案するPIP+UFPは、本発明が提案するPIP+UFPは、他の全ての手法に比べて、Gini係数が低く、AEが短く、ADが長い。
すなわち、PIP+UFPは、他の全ての手法に比べて、オブジェクトの推薦がユーザ毎に特化し、かつ新規性が高いオブジェクトを推薦し、かつ気が付き難いオブジェクトを推薦していることを示している。
【0134】
図10の結果から、本発明で提案するPIP+UFPを用いた場合、最も高いUCおよびICとなり、Gini係数が最も低くなり(0に近くなり)、ADが最も長くなる。一方、図9の結果から、本発明で提案するPIP+UFPを用いた場合のあっても、トップN個の推薦の正確性は、顕著な改良がなされない。この結果から、本発明で提案するPIP+UFPは、他の手法と比べて、様々な異なるオブジェクトを、オブジェクト毎にあまりバイアスをかけずにランクづけし、推薦する。
【0135】
事実、ユーザの嗜好動態およびユーザ間の関係性を考慮しない従来の手法では、ICが低く、Gini係数が高い。それらの従来の手法では、オブジェクトをリリース直後に購入する人と同様に、後にそのオブジェクトを購入する人を嗜好の似たユーザとして扱い、それらのユーザのログを使用するので、概して人気があって、些細なオブジェクトを高くランク付けする。
【0136】
推薦ユーザの被覆率(UC)に関しては、ユーザ間の関係の動態を考慮した従来の手法は、他の手法に比べてかすかに低い値を取る。本発明で提案するPIP+UFPは、たいていのユーザによってこれまで購入されていないオブジェクトを、ユーザにとって目新しいオブジェクトとして推薦することができる。
【0137】
以上により、本発明の第1の実施形態におけるオブジェクト推薦装置1は、ユーザ毎に特化し、かつ新規性が高いオブジェクトを推薦し、かつ気が付き難いオブジェクトを推薦することができる。
【0138】
<第2の実施形態>
次に、本発明の第2の実施形態を説明する。図12は、本発明の第2の実施形態におけるオブジェクト推薦システムの機能ブロック図である。なお、図1と共通する要素には同一の符号を付し、その具体的な説明を省略する。
オブジェクト推薦システム101は、記憶装置110と、計算装置120と、端末装置130と、推薦オブジェクト抽出装置140とを備える。
【0139】
記憶装置110は、ログ記憶部11と、算出結果記憶部12とを備える。また、計算装置120は、先行度算出部21と、重要度算出部22と、人気度算出部23と、革新者確率算出部24と、利用者遷移確率算出部25とを備える。
【0140】
端末装置130は、入力部31と、表示部33とを備える。入力部31は、外部から供給された入力信号に基づいて、ユーザidを示す情報を推薦オブジェクト抽出装置140へ供給する。
【0141】
推薦オブジェクト抽出装置140は、入力部31から供給されたユーザidに対応するPIPとUFPとを、算出結果記憶部12から読み出す。そして、推薦オブジェクト抽出装置140は、読み出したPIPとUFPとに基づいて、上記の方法によりCPIを算出する。そして、推薦オブジェクト抽出装置140は、CPIが高い順にN個(Nは1以上の整数)のオブジェクトを表示部33に表示させる。処理の流れは、第1の実施形態と同じであるので、省略する。
【0142】
以上により、本発明の第2の実施形態におけるオブジェクト推薦システム101は、ユーザ毎に特化し、かつ新規性が高いオブジェクトを推薦し、かつ気が付き難いオブジェクトを推薦することができる。
【0143】
なお、本発明の第1の実施形態または第2の実施形態では、ユーザの行動としてオブジェクトを購入する場合について説明したが、これに限らず、ユーザが表示部33に表されたオブジェクト(例えば、記事)を閲覧する場合についても、本発明を適用することができる。すなわち、本発明は、ユーザがオブジェクトを閲覧した閲覧履歴に基づいて、そのユーザにとって気づきにくく目新しいオブジェクトを推薦する装置およびシステムにも適用することができる。
【0144】
上記の点に鑑みると、本発明は、利用者がオブジェクトを購入するときに限定されるものではなく、利用者がオブジェクトに対して所定の行動(例えば、記事の閲覧、画像の選択等)をするときにも適用可能である。
また、本発明において、上記オブジェクトはデジタル化された音楽、電子書籍、動画等に限られず、上記オブジェクトにはデジタル化されていない本、家具等も含まれる。
【0145】
なお、本発明の第1の実施形態であるオブジェクト推薦装置1の一部、例えば、計算部20または推薦オブジェクト抽出部40をコンピュータで実現するようにしてもよい。この場合、その機能を実現するためのオブジェクト検出プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたオブジェクト推薦プログラムをコンピュータステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定期間プログラムを保持するものを含んでもよい。また上記のプログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
【0146】
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0147】
1 オブジェクト推薦装置
10 記憶部
11 ログ記憶部
12 算出結果記憶部
20 計算部
21 先行度算出部
22 重要度算出部
23 人気度算出部
24 革新者確率算出部
25 利用者遷移確率算出部
31 入力部
33 表示部
40 推薦オブジェクト抽出部
101 オブジェクト推薦システム
110 記憶装置
120 計算装置
130 端末装置
140 推薦オブジェクト抽出装置

【特許請求の範囲】
【請求項1】
対象利用者にオブジェクトを推薦するオブジェクト推薦装置であって、
前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する人気度算出部と、
前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する先行度算出部と
前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する重要度算出部と、
前記人気度情報と前記先行度情報と前記重要度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する革新者確率算出部と、
前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する推薦オブジェクト抽出部と、
を備えることを特徴とするオブジェクト推薦装置。
【請求項2】
各利用者が所定のオブジェクトに前記行動をした後、別のオブジェクトに前記行動をするまで要した時間に基づいて、前記所定のオブジェクトに前記行動をした後に前記別のオブジェクトに前記行動をする確率を利用者遷移確率として算出する利用者遷移確率算出部を更に備え、
前記推薦オブジェクト抽出部は、前記革新者確率と前記利用者遷移確率とに基づいて、対象利用者へ推薦するオブジェクトを抽出することを特徴とする請求項1に記載のオブジェクト推薦装置。
【請求項3】
前記先行度算出部は、前記対象利用者が前記オブジェクトに所定の行動をした時刻と、他の利用者が前記オブジェクトに前記行動をした時刻と、前記オブジェクトが公開された時刻とに基づいて、前記先行度情報を算出することを特徴とする請求項1または請求項2に記載のオブジェクト推薦装置。
【請求項4】
前記革新者確率算出部は、各利用者が前記対象利用者にN人(Nは自然数)先行して前記行動をした各先行度合いの確率に基づく各確率に基づいて、前記革新者確率を算出することを特徴とする請求項1から請求項3のいずれかに記載のオブジェクト推薦装置。
【請求項5】
前記革新者確率算出部は、前記各利用者が前記対象利用者に1人先行して前記行動をした各先行度合いの確率に基づく各確率を要素とする行列をPと表したとき、Pに基づいて前記革新者確率を算出することを特徴とする請求項4に記載のオブジェクト推薦装置。
【請求項6】
人気度算出部と、先行度算出部と、重要度算出部と、推薦オブジェクト抽出部とを備え、対象利用者にオブジェクトを推薦するオブジェクト推薦装置が実行するオブジェクト推薦方法であって、
前記人気度算出部が、前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する人気度算出手順と、
前記先行度算出部が、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する先行度算出手順と、
前記重要度算出部が、前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する重要度算出手順と、
前記人気度情報と前記先行度情報と前記重要度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する革新者確率算出手順と、
前記推薦オブジェクト抽出部が、前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する推薦オブジェクト抽出手順と、
を有することを特徴とするオブジェクト推薦方法。
【請求項7】
対象利用者にオブジェクトを推薦するオブジェクト推薦装置としてのコンピュータに、
前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する第1のステップと、
前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する第2のステップと、
前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する第3のステップと、
前記人気度情報と前記先行度情報と前記重要度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する第4のステップと、
前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する第5のステップと、
を実行させるためのオブジェクト推薦プログラム。
【請求項8】
対象利用者にオブジェクトを推薦するオブジェクト推薦システムであって、
前記オブジェクトに対して所定の行動をした他の利用者数が多いほど小さい値を取るように、前記オブジェクトの人気度を示す人気度情報を算出する人気度算出部と、
前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした度合いを示す先行度情報を算出する先行度算出部と、
前記対象利用者が前記オブジェクトに前記行動をしてから経過した時間に基づいて、前記対象利用者にとっての前記オブジェクトの重要度を示す重要度情報を算出する重要度算出部と、
前記人気度情報と前記先行度情報と前記重要度情報とに基づいて、前記他の利用者が前記対象利用者に先行して前記オブジェクトに前記行動をした確率に基づく革新者確率を算出する革新者確率算出部と、
を備える計算装置と、
前記革新者確率に基づいて、対象利用者へ推薦するオブジェクトを抽出する推薦オブジェクト抽出装置と、
を備えることを特徴とするオブジェクト推薦システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2012−22570(P2012−22570A)
【公開日】平成24年2月2日(2012.2.2)
【国際特許分類】
【出願番号】特願2010−160854(P2010−160854)
【出願日】平成22年7月15日(2010.7.15)
【出願人】(397065480)エヌ・ティ・ティ・コムウェア株式会社 (187)
【Fターム(参考)】