説明

推薦コンテンツ抽出装置、推薦コンテンツ抽出方法および推薦コンテンツ抽出プログラム

【課題】ユーザの利用履歴のない特定のサービスにおいて効果的な推薦コンテンツの抽出を行なう。
【解決手段】ネットワークを介して接続された複数のサービス提供装置を識別するサービス識別情報毎に、ネットワークを介して接続された複数のユーザ端末を識別するユーザ識別情報と、ユーザ識別情報に対応するユーザ端末に送信されたコンテンツのコンテンツ識別情報とが対応付けられた利用履歴情報を記憶し、サービス識別情報毎に、ユーザ間における前記利用履歴情報の類似度を算出し、複数の前記類似度の平均値である統合類似度を算出し、算出した統合類似度に基づいてユーザ毎のクラスタリングを行ない、推薦対象ユーザと同一のクラスタに分類された他のユーザの利用履歴情報に含まれる推薦対象サービスのコンテンツを、推薦対象ユーザに推薦するコンテンツ識別情報であると判定する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザに推薦するコンテンツを抽出する技術に関する。
【背景技術】
【0002】
近年、インターネット等のネットワークを介してユーザのコンピュータ端末に様々な情報を送信するサービスが提供されている。例えば、ショッピングサービス、映像配信サービス、ニュース配信サービス、オークションサービス、ウェブメールサービスなどの様々なサービスがネットワークを介して利用可能である。ここで、例えばコンテンツ(商品)を販売するショッピングサービスでは、ユーザ毎のコンテンツの利用履歴に応じて推薦する他のコンテンツを判定し、推薦コンテンツの情報を送信することがある。例えば、特定のサービスにおけるユーザの利用履歴と他のユーザの利用履歴との相関を分析して、特定のユーザに対し、そのユーザと相関の高い他のユーザに利用されたコンテンツを推薦する。このようなコンテンツの推薦によれば、ユーザは有用な情報を得ることができるとともに、サービス提供者は自身のサービスによるコンテンツを有効に宣伝することが可能である。
特許文献1には、データ形式の異なる複数のドメインに利用履歴を持つユーザの相関に基づいてユーザの類似度を算出し、算出した類似度に基づいて推薦を行なう技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特表2008−502028号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術においてユーザに推薦するコンテンツを判定するためには、そのサービスにおけるユーザの利用履歴が蓄積されている必要があった。すなわち、特定のサービスにおける利用履歴が蓄積されているユーザについては、利用履歴が類似する他のユーザとの相関に基づいて推薦するコンテンツを判定することが可能であるが、利用履歴が蓄積されていないユーザについては利用履歴の相関が高い他のユーザを判定することができないため、推薦するコンテンツの判定を行うことができなかった。このような場合でも、ユーザに推薦する有効なコンテンツを判定することが望ましい。例えば、利用履歴が蓄積された特定のサービスを提供するサービス提供者が他の新規サービスの提供を開始したような場合、新規サービスの利用を促すために、新規サービスに利用履歴のないユーザに対して適切なコンテンツを推薦することが望ましい。
【0005】
本発明は、このような状況に鑑みてなされたもので、ユーザの利用履歴のない特定のサービスにおいて効果的な推薦コンテンツの抽出を行なうことを可能とする推薦コンテンツ抽出装置、推薦コンテンツ抽出方法および推薦コンテンツ抽出プログラムに関する。
【課題を解決するための手段】
【0006】
上述した課題を解決するために、本発明は、ネットワークを介して接続された複数のユーザ端末に、定められた複数のコンテンツのうちユーザ端末から要求されたコンテンツを送信する複数のサービス提供装置に接続された推薦コンテンツ抽出装置であって、サービス提供装置を識別するサービス識別情報毎に、ユーザ端末のユーザを識別するユーザ識別情報と、サービス提供装置によってユーザ端末に送信されたコンテンツを識別するコンテンツ識別情報とが対応付けられた利用履歴情報が記憶される利用履歴記憶部と、ユーザ識別情報毎に、ユーザ識別情報に対応する利用履歴情報に基づくクラスタリングにより定められるユーザのクラスタを識別するクラスタ識別情報が対応付けられて記憶されるクラスタリング情報記憶部と、サービス識別情報毎に、予め定められた距離尺度に基づいて、ユーザとクラスタ重心間における利用履歴情報の類似度を算出する類似度算出部と、類似度算出部によってサービス識別情報毎に算出された複数の類似度の平均値である統合類似度を算出する統合類似度算出部と、統合類似度算出部によって算出された統合類似度に基づいてユーザ毎のクラスタリングを行なってユーザに対応するクラスタを判定し、ユーザを識別するユーザ識別情報と、ユーザ識別情報に対応するクラスタを識別するクラスタ識別情報とを対応付けてクラスタリング記憶部に記憶させるクラスタリング部と、複数のユーザ端末のうち、コンテンツを推薦する対象である推薦対象ユーザのユーザ端末を識別する推薦対象ユーザ識別情報が入力される推薦対象ユーザ識別情報入力部と、複数のサービス提供装置のうち、推薦対象ユーザのユーザ端末に推薦するコンテンツを送信するサービス提供装置を識別する推薦対象サービス識別情報が入力される推薦対象サービス識別情報入力部と、推薦対象ユーザ識別情報入力部に入力された推薦対象ユーザ識別情報に対応付けられたクラスタ識別情報をクラスタリング情報記憶部から読み出し、読み出したクラスタ識別情報に対応付けられたユーザ識別情報のうち、推薦対象ユーザ識別情報とは異なるユーザ識別情報を読み出し、読み出したユーザ識別情報と推薦対象サービス識別情報とに対応付けられて利用履歴記憶部に記憶されたコンテンツ識別情報を、推薦対象ユーザに推薦するコンテンツ識別情報であると判定する推薦コンテンツ抽出部と、を備えることを特徴とする。
【0007】
また、本発明は、上述の統合類似度算出部が、サービス識別情報毎に予め定められた重み付け係数を、類似度算出部によってサービス識別情報毎に算出された複数の類似度に乗じて、重み付け係数を乗じた類似度の平均値である統合類似度を算出することを特徴とする。
【0008】
また、本発明は、上述の類似度算出部が、サービス識別情報毎に予め定められたユークリッド距離とコサイン類似度とが含まれる複数の距離尺度のうちいずれかの距離尺度に基づいて、ユーザ間における利用履歴情報の類似度を算出することを特徴とする。
【0009】
また、本発明は、定められた複数のコンテンツのうちネットワークを介して接続された複数のユーザ端末から要求されたコンテンツを送信する複数のサービス提供装置を識別するサービス識別情報毎に、ユーザ端末のユーザを識別するユーザ識別情報と、サービス提供装置によってユーザ端末に送信されたコンテンツを識別するコンテンツ識別情報とが対応付けられた利用履歴情報が記憶される利用履歴記憶部と、ユーザ識別情報毎に、ユーザ識別情報に対応する利用履歴情報に基づくクラスタリングにより定められるユーザのクラスタを識別するクラスタ識別情報が対応付けられて記憶されるクラスタリング情報記憶部と、を備えた推薦コンテンツ抽出装置の推薦コンテンツ抽出方法であって、類似度算出部が、サービス識別情報毎に、予め定められた距離尺度に基づいて、ユーザとクラスタ重心間における利用履歴情報の類似度を算出するステップと、統合類似度算出部が、類似度算出部によってサービス識別情報毎に算出された複数の類似度の平均値である統合類似度を算出するステップと、クラスタリング部が、統合類似度算出部によって算出された統合類似度に基づいてユーザ毎のクラスタリングを行なってユーザに対応するクラスタを判定し、ユーザを識別するユーザ識別情報と、ユーザ識別情報に対応するクラスタを識別するクラスタ識別情報とを対応付けてクラスタリング記憶部に記憶させるステップと、推薦対象ユーザ識別情報入力部に、複数のユーザ端末のうち、コンテンツを推薦する対象である推薦対象ユーザのユーザ端末を識別する推薦対象ユーザ識別情報が入力されるステップと、推薦対象サービス識別情報入力部に、複数のサービス提供装置のうち、推薦対象ユーザのユーザ端末に推薦するコンテンツを送信するサービス提供装置を識別する推薦対象サービス識別情報が入力されるステップと、推薦コンテンツ抽出部が、推薦対象ユーザ識別情報入力部に入力された推薦対象ユーザ識別情報に対応付けられたクラスタ識別情報をクラスタリング情報記憶部から読み出し、読み出したクラスタ識別情報に対応付けられたユーザ識別情報のうち、推薦対象ユーザ識別情報とは異なるユーザ識別情報を読み出し、読み出したユーザ識別情報と推薦対象サービス識別情報とに対応付けられて利用履歴記憶部に記憶されたコンテンツ識別情報を、推薦対象ユーザに推薦するコンテンツ識別情報であると判定するステップと、を備えることを特徴とする。
【0010】
また、本発明は、定められた複数のコンテンツのうちネットワークを介して接続された複数のユーザ端末から要求されたコンテンツを送信する複数のサービス提供装置を識別するサービス識別情報毎に、ユーザ端末のユーザを識別するユーザ識別情報と、サービス提供装置によってユーザ端末に送信されたコンテンツを識別するコンテンツ識別情報とが対応付けられた利用履歴情報が記憶される利用履歴記憶部と、ユーザ識別情報毎に、ユーザ識別情報に対応する利用履歴情報に基づくクラスタリングにより定められるユーザのクラスタを識別するクラスタ識別情報が対応付けられて記憶されるクラスタリング情報記憶部と、を備えた推薦コンテンツ抽出装置のコンピュータに、類似度算出部が、サービス識別情報毎に、予め定められた距離尺度に基づいて、ユーザとクラスタ重心間における利用履歴情報の類似度を算出するステップと、統合類似度算出部が、類似度算出部によってサービス識別情報毎に算出された複数の類似度の平均値である統合類似度を算出するステップと、クラスタリング部が、統合類似度算出部によって算出された統合類似度に基づいてユーザ毎のクラスタリングを行なってユーザに対応するクラスタを判定し、ユーザを識別するユーザ識別情報と、ユーザ識別情報に対応するクラスタを識別するクラスタ識別情報とを対応付けてクラスタリング記憶部に記憶させるステップと、推薦対象ユーザ識別情報入力部に、複数のユーザ端末のうち、コンテンツを推薦する対象である推薦対象ユーザのユーザ端末を識別する推薦対象ユーザ識別情報が入力されるステップと、推薦対象サービス識別情報入力部に、複数のサービス提供装置のうち、推薦対象ユーザのユーザ端末に推薦するコンテンツを送信するサービス提供装置を識別する推薦対象サービス識別情報が入力されるステップと、推薦コンテンツ抽出部が、推薦対象ユーザ識別情報入力部に入力された推薦対象ユーザ識別情報に対応付けられたクラスタ識別情報をクラスタリング情報記憶部から読み出し、読み出したクラスタ識別情報に対応付けられたユーザ識別情報のうち、推薦対象ユーザ識別情報とは異なるユーザ識別情報を読み出し、読み出したユーザ識別情報と推薦対象サービス識別情報とに対応付けられて利用履歴記憶部に記憶されたコンテンツ識別情報を、推薦対象ユーザに推薦するコンテンツ識別情報であると判定するステップと、を実行させる推薦コンテンツ抽出プログラムである。
【発明の効果】
【0011】
以上説明したように、本発明によれば、ネットワークを介して接続された複数のサービス提供装置を識別するサービス識別情報毎に、ネットワークを介して接続された複数のユーザ端末を識別するユーザ識別情報と、ユーザ識別情報に対応するユーザ端末に送信されたコンテンツのコンテンツ識別情報とが対応付けられた利用履歴情報を記憶し、サービス識別情報毎に、ユーザとクラスタ重心間における前記利用履歴情報の類似度を算出し、複数の前記類似度の平均値である統合類似度を算出し、算出した統合類似度に基づいてユーザ毎のクラスタリングを行ない、推薦対象ユーザと同一のクラスタに分類された他のユーザの利用履歴情報に含まれる推薦対象サービスのコンテンツを、推薦対象ユーザに推薦するコンテンツ識別情報であると判定するようにしたので、複数の異なるサービスの利用履歴に基づいて、複数のサービスのうち特定のサービスにおける推薦コンテンツを抽出することができ、特定のサービスにおいて利用履歴のないユーザに対する効果的な推薦コンテンツを抽出することが可能となる。
【図面の簡単な説明】
【0012】
【図1】本発明の一実施形態によるサービス提供システムの構成例を示すブロック図である。
【図2】本発明の一実施形態によるサービスを利用するユーザの集合の例を示す図である。
【図3】本発明の一実施形態による利用履歴記憶部に記憶される利用履歴情報のデータ例を示す図である。
【図4】本発明の一実施形態によるユーザ利用履歴行列記憶部に記憶されるユーザ利用履歴行列のデータ例を示す図である。
【図5】本発明の一実施形態によるユーザ・重心類似度行列記憶部に記憶されるユーザ・重心類似度行列のデータ例を示す図である。
【図6】本発明の一実施形態によるクラスタリング情報記憶部に記憶されるクラスタリング結果のデータ例を示す図である。
【図7】本発明の一実施形態により抽出する推薦コンテンツの例を示す図である。
【図8】本発明の一実施形態によるサービス提供システムが推薦コンテンツを決定する動作例を示すフローチャートである。
【図9】本発明の一実施形態による利用履歴格納処理の具体的な動作例を示すフローチャートである。
【図10】本発明の一実施形態によるユーザ履歴行列作成処理の具体的な動作例を示すフローチャートである。
【図11】本発明の一実施形態によるクラスタリング処理の具体的な動作例を示すフローチャートである。
【図12】本発明の一実施形態による推薦コンテンツ抽出処理の具体的な動作例を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態について、図面を参照して説明する。
図1は、本実施形態によるサービス提供システム1の構成を示すブロック図である。サービス提供システム1は、サービス提供装置200−i(iは任意の数字)によってユーザ端末100に提供されたコンテンツの利用履歴に基づいて、他のサービス提供装置200−j(jはiとは異なる任意の数字)によって提供されるサービスのコンテンツを、ユーザ端末100−k(kは任意の数字)に推薦するものである。例えば、図2は、異なるサービスを利用するユーザの集合の例を示す図である。サービス提供装置200−1によって提供されるサービスをサービス1(映画配信サービス)とし、サービス提供装置200−2によって提供されるサービスをサービス2(ニュース記事配信サービス)とする。ここで、サービス1は多数のユーザに利用されており、複数件のユーザの利用履歴が蓄積されている。一方、サービス2は新規に立ち上げられたサービスであり、サービス1に比べてユーザ数が少なく、また利用履歴の蓄積も少ないとする。
【0014】
本実施形態のサービス提供システム1は、このような場合に、サービス1のみを利用しているユーザに対して、サービス2によって提供されるコンテンツからそのユーザに合ったコンテンツを推薦する。これにより、サービス1のみを利用するユーザに有用な情報を提供できるとともに、サービス2のサービス提供者にとって有効な宣伝を行うことができる。また、サービス1のみを利用しているユーザが、サービス2を利用するきっかけを提供することができる。
【0015】
図1に戻り、サービス提供システム1は、複数のユーザ端末100(ユーザ端末100−1、ユーザ端末100−2、・・・)と、複数のサービス提供装置200(サービス提供装置200−1、サービス提供装置200−2、サービス提供装置200−3、・・・)と、推薦コンテンツ抽出装置300とを備えている。ここで、複数のユーザ端末100は同様の構成であるので、特に区別をして説明する必要がない場合にはユーザ端末100として説明する。同様に、複数のサービス提供装置200は同様の構成であるので、特に区別をして説明する必要がない場合にはサービス提供装置200として説明する。
【0016】
ユーザ端末100は、ネットワークを介して複数のサービス提供装置200に接続されたコンピュータ装置である。ユーザ端末100は、例えばインターネットブラウザの機能を備えており、サービス提供装置200に予め登録されたユーザIDやパスワードなどを入力して、サービス提供装置200が提供するサービスに対するログインを行なう。また、ユーザ端末100は、ユーザからの操作情報の入力に応じてサービス提供装置200にコンテンツ情報の取得要求を送信し、サービス提供装置200から応答され送信されるコンテンツ情報を受信する。
【0017】
サービス提供装置200は、定められた複数のコンテンツのうちユーザ端末100から要求されたコンテンツを送信するサービスを行なうコンピュータ装置である。サービス提供装置200は、例えば、ショッピングサービス、映像配信サービス、ニュース配信サービス、オークションサービス、ウェブメールサービス、地図情報サービス、オンライン辞書サービスなどのサービスや、これらのサービスへのリンク集や検索エンジンなどを備えたポータルサイトサービスなどを提供する。本実施形態では、サービス提供装置200−1は、ユーザ端末100から送信される映画の取得要求に応じて映画(動画コンテンツ)を送信する映画配信サービスを提供し、サービス提供装置200−2は、ユーザ端末100から送信されるニュース記事の取得要求に応じてニュース記事を送信するニュース記事配信サービスを提供する。サービス提供装置200は、コンテンツ記憶部210と、サービス提供部220とを備えている。
【0018】
コンテンツ記憶部210には、予め定められた複数のコンテンツが記憶される。例えば、映画配信サービスを提供するサービス提供装置200−1のコンテンツ記憶部210−1には、複数の映画の動画コンテンツが記憶される。ニュース記事配信サービスを提供するサービス提供装置200−2のコンテンツ記憶部210−2には、複数のニュース記事が記憶される。
サービス提供部220は、ユーザ端末100からネットワークを介して送信されるコンテンツの取得要求に応じて、コンテンツ記憶部210に記憶されたコンテンツを読み出し、コンテンツの取得要求の送信元であるユーザ端末100に送信する。
【0019】
推薦コンテンツ抽出装置300は、複数のサービス提供装置200によって提供される特定のサービスにおいてユーザに応じた推薦コンテンツを抽出するコンピュータ装置であり、記憶部310と、利用履歴取得部320と、ユーザ利用履歴行列生成部330と、類似度算出部340と、統合類似度算出部350と、クラスタリング部360と、推薦対象ユーザ識別情報入力部370と、推薦対象サービス識別情報入力部380と、推薦コンテンツ抽出部390とを備えている。
【0020】
記憶部310は、複数の利用履歴記憶部311(利用履歴記憶部311−1、利用履歴記憶部311−2、利用履歴記憶部311−3、・・・)と、ユーザ利用履歴行列記憶部312と、ユーザ・重心類似度行列記憶部313と、クラスタリング情報記憶部314とを備えており、ユーザに応じた推薦コンテンツを抽出するための情報が記憶される。ここで、複数の利用履歴記憶部311には、サービス毎に対応する利用履歴情報が記憶されるが、同様のデータ形式の利用履歴情報が記憶されるため、特に区別して説明する必要がない場合には利用履歴記憶部311として説明する。
【0021】
複数の利用履歴記憶部311には、対応するサービス提供装置200を識別するサービスID毎に、ユーザ端末100を識別するユーザIDと、そのサービス提供装置200によってそのユーザ端末100に送信されたコンテンツを識別するコンテンツIDとが対応付けられた利用履歴情報が記憶される。図3は、利用履歴記憶部311に記憶される利用履歴情報のデータ例を示す図である。例えば、符号aは、サービス1に対応する利用履歴記憶部311−1に記憶された利用履歴情報のデータ例を示し、符号bは、サービス2に対応する利用履歴記憶部311−2に記憶された利用履歴情報のデータ例を示し、符号nは、サービスN(Nはサービス提供装置200の台数に対応する数字)に対応する利用履歴記憶部311−Nに記憶された利用履歴情報のデータ例を示す。
【0022】
ここで、サービス毎の利用履歴記憶部311に記憶されたそれぞれのユーザIDは、同一のユーザ端末100を識別する共通のユーザIDである。このような異なるサービス間で共通するユーザIDは、例えば双方に共通するポータルサイトなどにおいて登録されたユーザIDを適用しても良いし、サービス提供者が同一である場合には、いずれかのサービスにおいて登録されたユーザIDを他のサービスに流用するようにしても良い。あるいは、サイトを超えて共通に使用できるOpenIDのようなユーザIDにより、異なるサービス間のユーザの同一性を識別するようにしても良い。コンテンツIDは、サービス毎に異なるコンテンツを識別する識別情報である。
【0023】
ユーザ利用履歴行列記憶部312には、サービスID毎に、ユーザIDと、対応するサービスIDによって提供されるコンテンツが提供されたか否かを示す情報とが含まれる情報が記憶される。図4は、ユーザ利用履歴行列記憶部312に記憶されるユーザ利用履歴行列のデータ例を示す図である。このように、本実施形態におけるユーザ利用履歴行列記憶部312には、サービスID毎のコンテンツIDとユーザIDとに対応付けて、ユーザがコンテンツを利用したか否かを示すブーリアン型の情報が含まれるユーザ利用履歴行列が記憶される。ここでは、行をユーザIDとし、列をサービス毎のコンテンツIDとしたブーリアン型のデータが記憶される例を示すが、ユーザ利用履歴行列記憶部312のデータには、例えばコンテンツを利用した量(例えば、ユーザがニュース記事を参照した回数や、時間)などが記憶されるようにしても良い。
【0024】
ユーザ・重心類似度行列記憶部313には、ユーザID毎に、クラスタ重心に対する類似度を示す情報が対応付けられたユーザ・重心類似度行列が記憶される。図5は、ユーザ・重心類似度行列記憶部313に記憶されるユーザ・重心類似度行列のデータ例を示す図である。ここで、ユーザ・重心類似度行列記憶部313には、符号a、bに示すサービス毎に算出されるユーザ・重心類似度行列と、符号zに示す全てのサービスの類似度が統合された統合類似度のユーザ・重心類似度行列とが記憶される。この例では、距離尺度としてコサイン類似度が適用された場合のデータ例を示している。この場合、ユーザの類似度は0〜1の値で表され、値が大きいほど類似度が高いことを示す。
【0025】
クラスタリング情報記憶部314には、ユーザID毎に、ユーザIDに対応する利用履歴情報に基づくクラスタリングにより定められるユーザのクラスタを識別するクラスタIDが対応付けられて記憶される。図6は、クラスタリング情報記憶部314に記憶されるクラスタリング結果のデータ例を示す図である。ここでは、ユーザID「00001」に対してクラスタID「1」が対応付けられており、ユーザID「00002」に対してクラスタID「2」が対応付けられており、ユーザID「00003」に対してクラスタID「1」が対応付けられた例が示されている。
【0026】
利用履歴取得部320は、ユーザ端末100がサービス提供装置200に対して情報の取得要求を送信し、サービス提供装置200が取得要求に応じてコンテンツを送信した場合、取得要求を送信したユーザ端末100に対応するユーザIDと、コンテンツを送信したサービス提供装置200に対応するサービスIDと、サービス提供装置200によって送信されたコンテンツに対応するコンテンツIDとを取得し、サービスIDに対応する利用履歴記憶部311に記憶させる。
【0027】
ユーザ利用履歴行列生成部330は、利用履歴記憶部311から、ユーザ毎に記憶された利用履歴情報を読み出し、サービス毎の利用履歴情報が格納された上述のユーザ利用履歴行列を生成し、ユーザ利用履歴行列記憶部312に記憶させる。
【0028】
類似度算出部340は、ユーザ利用履歴行列生成部330によってユーザ利用履歴行列記憶部312に記憶されたユーザ利用履歴行列に基づいて、サービスID毎に、予め定められた距離尺度に基づいてユーザとクラスタ重心との間における利用履歴情報の類似度を算出する。ここで、距離尺度は、例えば、利用履歴情報に含まれる情報が離散値であるか連続値であるかなど、その利用履歴情報の性質に応じて、サービスID毎に予め定められたユークリッド距離やコサイン類似度などの複数の距離尺度のうちいずれかの距離尺度が適用できる。例えば、本実施形態のように、ユーザ利用履歴行列記憶部312に、上述したようにサービスID毎のコンテンツIDとユーザIDとに対応付けて、ユーザがコンテンツを利用したか否かを示すブーリアン型の情報が記憶される場合には、二値を扱うコサイン類似度を適用することが望ましい。一方、ユーザ利用履歴行列記憶部312に、例えばコンテンツを利用した量(例えば、ユーザがニュース記事を参照した回数や、時間)などが記憶されている場合や、コンテンツの数が大きく空間の次元数が多い場合は、ユークリッド距離を適用するようにしても良い。
【0029】
例えば、距離尺度としてコサイン類似度を適用する場合、類似度算出部340は、処理対象のサービスのコンテンツ数をNとすると、そのサービスにおけるユーザの利用履歴情報を要素数がNのベクトルとする。そして、ユーザの利用履歴情報に基づくベクトルと、各クラスタ重心との角度(コサイン)を算出し、算出した角度を、処理対象のサービスにおけるそのユーザの各クラスタへの類似度とする。類似度算出部340は、サービス毎に算出した利用履歴情報の類似度を、サービス毎のユーザ・重心類似度行列として、ユーザ・重心類似度行列記憶部313に記憶させる。
【0030】
統合類似度算出部350は、類似度算出部340によってサービスID毎に算出されたユーザ・重心類似度行列に基づいて、サービスID毎の各ユーザと各クラスタとの類似度の平均値である統合類似度を算出する。ここで、平均値を算出する際、ユーザの利用履歴がないサービスのユーザ・重心類似度行列が存在する場合(例えば、図5の符号bに示すユーザID「00002」のユーザ)、そのサービスについては、平均の値に加味しないこととする。例えば、統合類似度算出部350は、ユーザの利用履歴が存在するサービスのユーザ・重心類似度行列における類似度の値を加算し、ユーザの利用履歴が存在しないサービスのユーザ・重心類似度行列の類似度の加算はスキップして、ユーザの利用履歴が存在するサービスのユーザ・重心類似度行列の数で割ることにより平均値を算出する。このように統合類似度を算出することで、利用履歴がなく、すなわちそもそも利用していないサービスについての利用履歴が、クラスタリングに影響を与えないようにすることができる。統合類似度算出部350は、算出した統合類似度のユーザ・重心類似度行列を、ユーザ・重心類似度行列記憶部313に記憶させる。
【0031】
ここで、統合類似度算出部350は、サービスID毎に予め定められた重み付け係数を、類似度算出部340によってサービスID毎に算出された複数の類似度に乗じて、重み付け係数を乗じた類似度の平均値である統合類似度を算出するようにしても良い。サービスID毎に予め定められた重み続け係数は、統合類似度算出部350の記憶領域に予め記憶される。例えば、立ち上がったばかりでサービス開始から日数が経っておらず、利用履歴情報の蓄積も少ないようなサービスの重み付け係数に1以下の値を設定しておくことで、ユーザの嗜好が充分に表れていないと考えられる利用履歴情報が統合類似度に与える影響を小さくして、信頼性の高い統合類似度を算出することが可能である。一方、充分な量の利用履歴情報が蓄積されたサービスの重み付け係数に1以上の値を設定しておくことで、ユーザの嗜好が充分に表れていると考えられる利用履歴情報が統合類似度に与える影響を大きくして、信頼性の高い統合類似度を算出することが可能である。また、統合類似度算出部350は、類似度算出部340によって、サービス毎に異なる距離尺度により類似度が算出されている場合には、予め定められて自身の記憶領域に記憶された類似度間の補正係数を乗じることにより統合類似度を算出するようにしても良い。
【0032】
クラスタリング部360は、ユーザ・重心類似度行列記憶部313に記憶された統合類似度のユーザ・重心類似度行列に基づいて、ユーザ毎のクラスタリング(クラスタ解析)を行なってユーザに対応するクラスタを判定し、ユーザを識別するユーザIDと、ユーザIDに対応するクラスタを識別するクラスタIDとを対応付けてクラスタリング情報記憶部314に記憶させる。クラスタリング部360は、ユーザの分類を階層的に行なうウォード法などの階層型クラスタリングや、定められた特定のクラスタ数にユーザを分類するK平均法などの非階層型クラスタリングなどの手法によりユーザを分類する。本実施形態では、K平均法によりクラスタリングを行う例について説明する。
【0033】
K平均法では、例えば、クラスタリング部360は、予め定められたクラスタ数のユーザIDをランダムに抽出し、抽出したユーザIDに対応する利用履歴情報をクラスタ重心とする。そして、類似度算出部340と統合類似度算出部350とが、それぞれのユーザについて、各クラスタ重心との統合類似度を算出する。クラスタリング部360は、統合類似度が最も大きいクラスタIDをユーザに割り当てる。そして、クラスタリング部360は、クラスタ重心を更新し、クラスタ重心に変化がなくなるまで、類似度の算出とクラスタIDの割当処理を行う。
【0034】
推薦対象ユーザ識別情報入力部370には、複数のユーザ端末100のうち、コンテンツを推薦する対象である推薦対象ユーザのユーザ端末100を識別する推薦対象ユーザIDが入力される。例えば、推薦対象ユーザ識別情報入力部370は、ユーザ端末100からサービス提供装置200に情報の取得要求が送信された際に、取得要求を送信したユーザ端末100に対応するユーザIDをサービス提供装置200から取得し、取得したユーザIDが推薦対象ユーザIDとして入力されるようにしても良い。あるいは、推薦対象ユーザ識別情報入力部370は、キーボードやマウスなどの入力デバイスを備えており、推薦コンテンツ抽出装置300の管理者等から、特定のユーザを識別する推薦対象ユーザIDが入力されるようにしても良い。
【0035】
推薦対象サービス識別情報入力部380は、複数のサービス提供装置200のうち、推薦対象ユーザのユーザ端末100に推薦するコンテンツを送信するサービス提供装置200を識別する推薦対象サービスIDが入力される。例えば、推薦対象サービス識別情報入力部380は、サービス提供装置200がユーザ端末100から情報の取得要求を受信した際に、取得要求を受信したサービス提供装置200に対応するサービスIDを取得し、取得したサービスIDが推薦対象サービスIDとして入力されるようにしても良い。あるいは、推薦対象サービス識別情報入力部380は、キーボードやマウスなどの入力デバイスを備えており、推薦コンテンツ抽出装置300の管理者等から、特定のサービスを識別する推薦対象サービスIDが入力されるようにしても良い。
【0036】
推薦コンテンツ抽出部390は、推薦対象サービス識別情報入力部380に入力された推薦対象ユーザIDに対応付けられたクラスタIDをクラスタリング情報記憶部314から読み出し、読み出したクラスタIDに対応付けられたユーザIDのうち、推薦対象ユーザIDとは異なるユーザIDを読み出し、読み出したユーザIDと推薦対象サービスIDとに対応付けられて利用履歴記憶部311に記憶されたコンテンツIDを、推薦対象ユーザに推薦するコンテンツIDであると判定する。ここで、推薦コンテンツ抽出部390は、例えば、推薦対象サービスIDにおいて、同一クラスタの他のユーザに最も多く購入されているコンテンツIDを、推薦コンテンツIDであると判定する。あるいは、例えば直近に売れたコンテンツIDを、推薦コンテンツIDであると判定するようにしても良い。
【0037】
図7は、推薦コンテンツ抽出部390によって抽出される推薦コンテンツの例を示す図である。例えば、符号aに示される利用履歴記憶部311−1に記憶されたサービス1の利用履歴情報と、符号bに示される利用履歴記憶部311−2に記憶されたサービス2の利用履歴情報とに基づいて、類似度算出部340と統合類似度算出部350とによって統合類似度が算出され、算出された統合類似度に基づいて、クラスタリング部360によって符号b1(b2)に示すようにクラスタリングされたとする。ここでは、クラスタ1にユーザ1とユーザ2とがクラスタリングされ、クラスタ2にユーザ3とユーザ4とユーザ5とがクラスタリングされ、クラスタ3にユーザ6とユーザ7とユーザ8とがクラスタリングされている。ユーザ5について、サービス1には利用履歴が存在しているが、サービス2には利用履歴が存在しない。そこで、推薦コンテンツ抽出部390は、ユーザ5に対して、同一クラスタであるユーザ3とユーザ4とのサービス2における利用履歴情報に基づいて、ユーザ3とユーザ4とに購入されているコンテンツ3とコンテンツ4とを、推薦コンテンツIDであると判定する。推薦コンテンツ抽出部390は、判定した推薦コンテンツIDを、ユーザ5に対応するユーザ端末100に送信する。
【0038】
次に、本実施形態によるサービス提供システム1の動作例を説明する。図8は、サービス提供システム1が推薦コンテンツを決定する動作例を示すフローチャートである。まず、利用履歴取得部320は、複数サービスにおけるユーザの利用履歴を、利用履歴記憶部311に格納する(ステップS100)。図9は、利用履歴格納処理の具体的な動作例を示すフローチャートである。例えば、ユーザ端末100−1が、サービス提供装置200−1にコンテンツの取得要求を送信すると、サービス提供装置200−1は、ユーザ端末100−1から送信された取得要求に応じたコンテンツをユーザ端末100−1に送信する(ステップS101)。
【0039】
推薦コンテンツ抽出装置300の利用履歴取得部320は、サービス提供装置200−1からユーザ端末100−1にコンテンツが送信されたことを検知すると、ユーザ端末100−1に対応するユーザIDと、サービス提供装置200−1に対応するサービスIDと、サービス提供装置200−1がユーザ端末100−1に送信したコンテンツに対応するコンテンツIDとを取得する(ステップS102)。利用履歴取得部320は、取得したサービスIDに対応する利用履歴記憶部311である利用履歴記憶部311−1に、サービスIDと、ユーザIDと、コンテンツIDとを対応付けて記憶させる(ステップS103)。利用履歴取得部320は、サービス提供装置200からユーザ端末100にコンテンツが送信される度に、このような利用履歴格納処理を行う。
【0040】
図8に戻り、ユーザ利用履歴行列生成部330は、利用履歴記憶部311に記憶された利用履歴情報に基づいて、ユーザ履歴行列を作成する(ステップS200)。図10は、ユーザ履歴行列作成処理の具体的な動作例を示すフローチャートである。ユーザ利用履歴行列生成部330は、複数の利用履歴記憶部311から、特定のユーザIDに対応する利用履歴情報を読み出す(ステップS201)。ユーザ利用履歴行列生成部330は、ユーザ利用履歴行列記憶部312に記憶されたユーザ履歴行列に、読み出した利用履歴情報に対応するユーザIDが存在するか否かを判定する(ステップS202)。ユーザ利用履歴行列生成部330は、読み出した利用履歴情報に対応するユーザIDがユーザ履歴行列に存在すると判定した場合(ステップS202:YES)、読み出した利用履歴情報をユーザ利用履歴行列記憶部312に上書き保存し、記憶させる(ステップS203)。読み出した利用履歴情報に対応するユーザIDがユーザ履歴行列に存在しないと判定した場合(ステップS202:NO)、ユーザIDに対応する行をユーザ利用履歴行列記憶部312に作成し、読み出した利用履歴情報をユーザ利用履歴行列記憶部312に記憶させる(ステップS204)。
【0041】
図8に戻り、類似度算出部340と、統合類似度算出部350と、クラスタリング部360とは、ユーザ利用履歴行列記憶部312に記憶されたユーザ履歴行列に基づいて各ユーザと各クラスタ重心との類似度を算出してクラスタリングの処理を行う(ステップS300)。図11は、クラスタリング処理の具体的な動作例を示すフローチャートである。クラスタリング部360は、クラスタ重心の初期化を行なう(ステップS301)。ここで、クラスタリング部360は、例えば、ユーザ利用履歴行列記憶部312に記憶された複数のユーザIDのうち、定められた数(例えば、10)のユーザIDをランダムに抽出し、抽出したユーザIDに対応する利用履歴情報をクラスタ重心としてユーザ利用履歴行列記憶部312に記憶させる。ここで、クラスタリング部360は、例えばユーザ利用履歴行列記憶部312に記憶されたユーザ利用履歴行列にクラスタ重心となるデータ行を追加し、クラスタ重心である利用履歴情報を記憶させる。
【0042】
そして、類似度算出部340と統合類似度算出部350とが、各ユーザと各クラスタ重心(クラスタ重心として特定ユーザの利用履歴情報を適用する場合は、そのユーザ)との間の類似度を算出する(ステップS302)。具体的には、類似度算出部340が、ユーザ利用履歴行列記憶部312に記憶されたユーザの利用履歴情報を読み出す(ステップS302)。類似度算出部340は、ユーザ利用履歴行列生成部330に記憶された各ユーザと、クラスタ重心であるデータ行に対応する利用履歴情報との類似度を算出してユーザ・重心類似度行列を生成し、ユーザ・重心類似度行列記憶部313に記憶させる(ステップS304)。統合類似度算出部350は、類似度算出部340によって算出されユーザ・重心類似度行列記憶部313に記憶されたサービス毎のユーザ・重心類似度行列を統合して統合類似度を算出し、ユーザ・重心類似度行列記憶部313に統合類似度のユーザ・重心間類似度行列を記憶させる(ステップS305)。
【0043】
クラスタリング部360は、ユーザ・重心類似度行列記憶部313に記憶された統合類似度のユーザ・重心間類似度行列に基づいて、ユーザ毎の最近傍クラスタ重心を判定し、ユーザID毎に対応するクラスタを判定するクラスタリングの処理を行う(ステップS306)。クラスタリング部360は、判定したユーザID毎のクラスタと、ユーザID毎の利用履歴情報に基づいて、サービス毎のクラスタ重心を算出し、ユーザ・重心類似度行列記憶部313に記憶させる(ステップS307)。ここで、クラスタリング部360は、算出した複数のクラスタ重心のいずれかが、前回に算出したクラスタ重心と比較して変化があったか否かを判定する(ステップS308)。
【0044】
クラスタリング部360が、クラスタ重心に変化があったと判定すれば(ステップS308:YES)、ステップS302に戻る。クラスタ重心に変化がないと判定すれば(ステップS308:NO)、クラスタリング情報記憶部314に、ユーザ毎のクラスタIDを対応付けて記憶させる(ステップS309)。
【0045】
図8に戻り、推薦コンテンツ抽出部390は、推薦対象ユーザIDと推薦対象サービスIDとに基づいて、推薦対象ユーザIDに対する推薦コンテンツIDを判定する(ステップS400)。図12は、推薦コンテンツ抽出処理の具体的な動作例を示すフローチャートである。推薦対象ユーザ識別情報入力部370は、推薦対象ユーザIDの入力を受け付け、推薦対象サービス識別情報入力部380は、推薦対象サービスIDの入力を受け付ける(ステップS401)。
【0046】
推薦コンテンツ抽出部390は、推薦対象ユーザに対応するクラスタに属する他のユーザIDを、クラスタリング情報記憶部314から抽出する(ステップS402)。推薦コンテンツ抽出部390は、推薦対象サービスに対応する利用履歴記憶部311から、抽出したユーザIDに対応付けられた利用履歴情報を読み出し、読み出した利用履歴情報のうちで、利用頻度(購入回数)が多いコンテンツIDを、定められた数(例えば、10個)抽出する(ステップS403)。推薦コンテンツ抽出部390は、抽出した推薦コンテンツIDを、推薦対象ユーザに対応するユーザ端末100に送信する(ステップS404)。ここでは、推薦コンテンツ抽出部390は、例えば推薦対象サービスIDに対応するサービス提供装置200から、推薦コンテンツIDに対応する名称等の情報を読み出して、ユーザ端末100に送信する。ユーザ端末100は、推薦コンテンツIDに対応する情報を表示させる。このようにすれば、例えば、映画配信サービス(サービス1)において野球のジャンルの映画を嗜好するユーザと同一クラスタに分類された他のユーザであって、ニュース記事配信サービス(サービス2)に利用履歴がないユーザに対して、サービス2において、野球に関するニュース記事のコンテンツを推薦することが可能である。
【0047】
なお、本実施形態では、コンテンツ記憶部210に記憶され、推薦コンテンツ抽出部390によって推薦されるコンテンツとして、映画の動画コンテンツとニュース記事のコンテンツとを例として説明したが、他のサービスにおける様々なコンテンツであって良い。例えば、商品の通信販売を行なうショッピングサービスにおいて販売する商品の情報をコンテンツとして、ユーザに購入された商品に応じた推薦商品に対応する情報をコンテンツとして推薦することができる。
【0048】
また、本実施形態では、クラスタリング部360は、クラスタ重心の初期化処理として、定められた数のユーザIDをランダムに抽出し、抽出したユーザIDに対応する利用暦情報をユーザ利用履歴行列に記憶させるようにしたが、例えば、予め定められた所定のクラスタ数にユーザをランダムに分類し、同じクラスタに属するユーザの利用履歴の平均値をクラスタ重心として、ユーザ利用履歴行列に記憶させるようにしても良い。
【0049】
以上説明したように、本実施形態の推薦コンテンツ抽出装置300によれば、ユーザの利用履歴が蓄積されたサービスにおける推薦コンテンツの抽出のみならず、ユーザの利用履歴がない特定のサービスにおいても、効果的な推薦コンテンツの抽出を行なうことが可能となる。これにより、例えば複数のサービスを提供するサービス提供者の企業が、既に多数のユーザに利用されているサービスの利用履歴に基づいてユーザの嗜好を把握し、利用履歴がない他のサービスにおけるコンテンツ群の中から、ユーザに合ったコンテンツを推薦することが可能となる。すなわち、ユーザの同一性が識別可能な複数のサービス間において、あるサービスにおいて獲得したユーザを、他のサービスに誘導することが可能となり、ユーザによるコンテンツ利用の増加が期待できる。さらに、利用履歴がないか少なかったサービスにおけるコンテンツの利用履歴が得られることで、より精度の高いクラスタリングを行なって、より効果的な推薦コンテンツの提示を行なうことができ、コンテンツ利用のさらなる増加やユーザの囲い込みが期待できる。
【0050】
なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより推薦コンテンツの抽出を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0051】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【符号の説明】
【0052】
1 サービス提供システム
100 ユーザ端末
200 サービス提供装置
210 コンテンツ記憶部
220 サービス提供部
300 推薦コンテンツ抽出装置
310 記憶部
311 利用履歴記憶部
312 ユーザ利用履歴行列記憶部
313 ユーザ・重心類似度行列記憶部
314 クラスタリング情報記憶部
320 利用履歴取得部
330 ユーザ利用履歴行列生成部
340 類似度算出部
350 統合類似度算出部
360 クラスタリング部
370 推薦対象ユーザ識別情報入力部
380 推薦対象サービス識別情報入力部
390 推薦コンテンツ抽出部

【特許請求の範囲】
【請求項1】
ネットワークを介して接続された複数のユーザ端末に、定められた複数のコンテンツのうち前記ユーザ端末から要求されたコンテンツを送信する複数のサービス提供装置に接続された推薦コンテンツ抽出装置であって、
前記サービス提供装置を識別するサービス識別情報毎に、前記ユーザ端末のユーザを識別するユーザ識別情報と、当該サービス提供装置によって当該ユーザ端末に送信された前記コンテンツを識別するコンテンツ識別情報とが対応付けられた利用履歴情報が記憶される利用履歴記憶部と、
前記ユーザ識別情報毎に、当該ユーザ識別情報に対応する前記利用履歴情報に基づくクラスタリングにより定められる前記ユーザのクラスタを識別するクラスタ識別情報が対応付けられて記憶されるクラスタリング情報記憶部と、
前記サービス識別情報毎に、予め定められた距離尺度に基づいて、前記ユーザとクラスタ重心間における前記利用履歴情報の類似度を算出する類似度算出部と、
前記類似度算出部によって前記サービス識別情報毎に算出された複数の前記類似度の平均値である統合類似度を算出する統合類似度算出部と、
前記統合類似度算出部によって算出された前記統合類似度に基づいて前記ユーザ毎のクラスタリングを行なってユーザに対応するクラスタを判定し、前記ユーザを識別するユーザ識別情報と、当該ユーザ識別情報に対応する前記クラスタを識別する前記クラスタ識別情報とを対応付けて前記クラスタリング記憶部に記憶させるクラスタリング部と、
前記複数のユーザ端末のうち、前記コンテンツを推薦する対象である推薦対象ユーザのユーザ端末を識別する推薦対象ユーザ識別情報が入力される推薦対象ユーザ識別情報入力部と、
前記複数のサービス提供装置のうち、前記推薦対象ユーザのユーザ端末に推薦するコンテンツを送信する前記サービス提供装置を識別する推薦対象サービス識別情報が入力される推薦対象サービス識別情報入力部と、
前記推薦対象ユーザ識別情報入力部に入力された前記推薦対象ユーザ識別情報に対応付けられた前記クラスタ識別情報を前記クラスタリング情報記憶部から読み出し、読み出したクラスタ識別情報に対応付けられた前記ユーザ識別情報のうち、前記推薦対象ユーザ識別情報とは異なる前記ユーザ識別情報を読み出し、読み出した当該ユーザ識別情報と前記推薦対象サービス識別情報とに対応付けられて前記利用履歴記憶部に記憶された前記コンテンツ識別情報を、前記推薦対象ユーザに推薦するコンテンツ識別情報であると判定する推薦コンテンツ抽出部と、
を備えることを特徴とする推薦コンテンツ抽出装置。
【請求項2】
前記統合類似度算出部は、前記サービス識別情報毎に予め定められた重み付け係数を、前記類似度算出部によって前記サービス識別情報毎に算出された複数の前記類似度に乗じて、当該重み付け係数を乗じた前記類似度の平均値である前記統合類似度を算出する
ことを特徴とする請求項1に記載の推薦コンテンツ抽出装置。
【請求項3】
前記類似度算出部は、前記サービス識別情報毎に予め定められたユークリッド距離とコサイン類似度とが含まれる複数の距離尺度のうちいずれかの距離尺度に基づいて、前記ユーザ間における前記利用履歴情報の類似度を算出する
ことを特徴とする請求項1または請求項2に記載の推薦コンテンツ抽出装置。
【請求項4】
定められた複数のコンテンツのうちネットワークを介して接続された複数のユーザ端末から要求されたコンテンツを送信する複数のサービス提供装置を識別するサービス識別情報毎に、前記ユーザ端末のユーザを識別するユーザ識別情報と、当該サービス提供装置によって当該ユーザ端末に送信された前記コンテンツを識別するコンテンツ識別情報とが対応付けられた利用履歴情報が記憶される利用履歴記憶部と、前記ユーザ識別情報毎に、当該ユーザ識別情報に対応する前記利用履歴情報に基づくクラスタリングにより定められる前記ユーザのクラスタを識別するクラスタ識別情報が対応付けられて記憶されるクラスタリング情報記憶部と、を備えた推薦コンテンツ抽出装置の推薦コンテンツ抽出方法であって、
類似度算出部が、前記サービス識別情報毎に、予め定められた距離尺度に基づいて、前記ユーザとクラスタ重心間における前記利用履歴情報の類似度を算出するステップと、
統合類似度算出部が、前記類似度算出部によって前記サービス識別情報毎に算出された複数の前記類似度の平均値である統合類似度を算出するステップと、
クラスタリング部が、前記統合類似度算出部によって算出された前記統合類似度に基づいて前記ユーザ毎のクラスタリングを行なってユーザに対応するクラスタを判定し、前記ユーザを識別するユーザ識別情報と、当該ユーザ識別情報に対応する前記クラスタを識別する前記クラスタ識別情報とを対応付けて前記クラスタリング記憶部に記憶させるステップと、
推薦対象ユーザ識別情報入力部に、前記複数のユーザ端末のうち、前記コンテンツを推薦する対象である推薦対象ユーザのユーザ端末を識別する推薦対象ユーザ識別情報が入力されるステップと、
推薦対象サービス識別情報入力部に、前記複数のサービス提供装置のうち、前記推薦対象ユーザのユーザ端末に推薦するコンテンツを送信する前記サービス提供装置を識別する推薦対象サービス識別情報が入力されるステップと、
推薦コンテンツ抽出部が、前記推薦対象ユーザ識別情報入力部に入力された前記推薦対象ユーザ識別情報に対応付けられた前記クラスタ識別情報を前記クラスタリング情報記憶部から読み出し、読み出したクラスタ識別情報に対応付けられた前記ユーザ識別情報のうち、前記推薦対象ユーザ識別情報とは異なる前記ユーザ識別情報を読み出し、読み出した当該ユーザ識別情報と前記推薦対象サービス識別情報とに対応付けられて前記利用履歴記憶部に記憶された前記コンテンツ識別情報を、前記推薦対象ユーザに推薦するコンテンツ識別情報であると判定するステップと、
を備えることを特徴とする推薦コンテンツ抽出方法。
【請求項5】
定められた複数のコンテンツのうちネットワークを介して接続された複数のユーザ端末から要求されたコンテンツを送信する複数のサービス提供装置を識別するサービス識別情報毎に、前記ユーザ端末のユーザを識別するユーザ識別情報と、当該サービス提供装置によって当該ユーザ端末に送信された前記コンテンツを識別するコンテンツ識別情報とが対応付けられた利用履歴情報が記憶される利用履歴記憶部と、前記ユーザ識別情報毎に、当該ユーザ識別情報に対応する前記利用履歴情報に基づくクラスタリングにより定められる前記ユーザのクラスタを識別するクラスタ識別情報が対応付けられて記憶されるクラスタリング情報記憶部と、を備えた推薦コンテンツ抽出装置のコンピュータに、
類似度算出部が、前記サービス識別情報毎に、予め定められた距離尺度に基づいて、前記ユーザとクラスタ重心間における前記利用履歴情報の類似度を算出するステップと、
統合類似度算出部が、前記類似度算出部によって前記サービス識別情報毎に算出された複数の前記類似度の平均値である統合類似度を算出するステップと、
クラスタリング部が、前記統合類似度算出部によって算出された前記統合類似度に基づいて前記ユーザ毎のクラスタリングを行なってユーザに対応するクラスタを判定し、前記ユーザを識別するユーザ識別情報と、当該ユーザ識別情報に対応する前記クラスタを識別する前記クラスタ識別情報とを対応付けて前記クラスタリング記憶部に記憶させるステップと、
推薦対象ユーザ識別情報入力部に、前記複数のユーザ端末のうち、前記コンテンツを推薦する対象である推薦対象ユーザのユーザ端末を識別する推薦対象ユーザ識別情報が入力されるステップと、
推薦対象サービス識別情報入力部に、前記複数のサービス提供装置のうち、前記推薦対象ユーザのユーザ端末に推薦するコンテンツを送信する前記サービス提供装置を識別する推薦対象サービス識別情報が入力されるステップと、
推薦コンテンツ抽出部が、前記推薦対象ユーザ識別情報入力部に入力された前記推薦対象ユーザ識別情報に対応付けられた前記クラスタ識別情報を前記クラスタリング情報記憶部から読み出し、読み出したクラスタ識別情報に対応付けられた前記ユーザ識別情報のうち、前記推薦対象ユーザ識別情報とは異なる前記ユーザ識別情報を読み出し、読み出した当該ユーザ識別情報と前記推薦対象サービス識別情報とに対応付けられて前記利用履歴記憶部に記憶された前記コンテンツ識別情報を、前記推薦対象ユーザに推薦するコンテンツ識別情報であると判定するステップと、
を実行させる推薦コンテンツ抽出プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2011−81728(P2011−81728A)
【公開日】平成23年4月21日(2011.4.21)
【国際特許分類】
【出願番号】特願2009−235453(P2009−235453)
【出願日】平成21年10月9日(2009.10.9)
【出願人】(000102728)株式会社エヌ・ティ・ティ・データ (438)
【Fターム(参考)】