レコメンド情報生成装置およびレコメンド情報生成方法
【課題】類似ユーザの閲覧履歴を用いることなく、類似ユーザの特性に合致したコンテンツを選択することができるレコメンド情報生成装置およびレコメンド情報生成方法を提供する。
【解決手段】情報配信サーバ200において、ユーザ特性ベクトル計算部204が各ユーザのユーザ特性ベクトルを算出し、類似ユーザ計算部209は、上述算出された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する。そして、類似ユーザ計算部209は、算出された類似度に基づいて一のユーザと類似する上位所定数S人の類似ユーザを選択し、新ユーザ特性ベクトル算出部209aは、S人の類似ユーザのユーザ特性ベクトルおよび一のユーザとの類似度に基づいて新ユーザ特性ベクトルを生成する。レコメンド情報生成部210は、生成された新ユーザ特性ベクトルに基づいて、一のユーザに対するレコメンド情報を生成することができる。
【解決手段】情報配信サーバ200において、ユーザ特性ベクトル計算部204が各ユーザのユーザ特性ベクトルを算出し、類似ユーザ計算部209は、上述算出された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する。そして、類似ユーザ計算部209は、算出された類似度に基づいて一のユーザと類似する上位所定数S人の類似ユーザを選択し、新ユーザ特性ベクトル算出部209aは、S人の類似ユーザのユーザ特性ベクトルおよび一のユーザとの類似度に基づいて新ユーザ特性ベクトルを生成する。レコメンド情報生成部210は、生成された新ユーザ特性ベクトルに基づいて、一のユーザに対するレコメンド情報を生成することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、レコメンド情報を生成するレコメンド情報生成装置およびレコメンド情報生成方法に関する。
【背景技術】
【0002】
ユーザの履歴と他ユーザの履歴との比較に基づいて類似ユーザを求め、類似ユーザがよく見るコンテンツを推薦する協調フィルタ方式が考えられている。例えば、下記特許文献1(特開2002−215665号公報)には、対象とするユーザに最もよく似た嗜好を持つ協調ユーザを選定し、この協調ユーザのプロファイルに基づいて推薦するコンテンツを選択することが記載されている。また、下記特許文献2(特開2009−252177号公報)では、各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出し、類似の高い類似ユーザの閲覧済みコンテンツのうち、類似ユーザのユーザ特性ベクトルに近いコンテンツをレコメンドすることが記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−215665号公報
【特許文献2】特開2009−252177号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述特許文献1に記載の技術では、協調ユーザのプロファイルに基づいたコンテンツ選択を行っていることから、協調ユーザと同じコンテンツしかレコメンドされず、適切なレコメンド情報の提供を受けることができないという問題があった。
【0005】
また、上述特許文献2に記載の技術でも類似ユーザの閲覧履歴を用いて、レコメンドを行うため、膨大なコンテンツが存在し、類似ユーザがその中の一部のコンテンツしか閲覧していないような場合では、その一部のコンテンツしかレコメンドすることができず、また閲覧されていないコンテンツについてはレコメンドの対象とならなった。
【0006】
そこで、本発明は、類似ユーザの閲覧履歴を用いずに、類似ユーザの特性に合致したコンテンツを選択することができるレコメンド情報生成装置およびレコメンド情報生成方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上述の問題を解決するために、本発明のレコメンド情報生成装置は、各ユーザのユーザ特性ベクトルを取得するするベクトル取得手段と、前記ベクトル取得手段により取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出手段と、前記類似度算出手段により算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択手段と、前記選択手段により選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出するする算出手段と、前記算出手段により算出された新ユーザ特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成手段と、を備えている。
【0008】
また、本発明のレコメンド情報生成方法は、各ユーザのユーザ特性ベクトルを取得するするベクトル取得ステップと、前記ベクトル取得ステップにより取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出ステップと、前記類似度算出ステップにより算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択ステップと、前記選択ステップにより選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出するする算出ステップと、前記算出ステップにより算出された新ユーザ特性ベクトルに基づいて、前記選択ステップにより選択された類似ユーザの特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成ステップと、を備えている。
【0009】
この発明によれば、各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出し、算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する。そして、選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出し、算出された新ユーザ特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する。これにより、一のユーザと近いユーザ特性ベクトルを持つ他の類似ユーザのユーザ特性ベクトルを参考にして適切なレコメンド情報を生成することができる。すなわち、ユーザの趣味嗜好にはないが好きになる可能性がある嗜好を求めることができる。さらに、類似ユーザの閲覧履歴を用いることなく、類似ユーザの特性に合致したレコメンド情報を提供することができる。しかも、類似ユーザのみのユーザ特性ベクトルを利用していないため、当該類似ユーザに対するレコメンド情報と同じ情報はなく、一のユーザに対する特有のレコメンド情報を提供することができる。
【0010】
また、本発明のレコメンド情報生成装置において、前記選択手段は、上位所定数の類似ユーザを複数選択し、前記算出手段は、当該複数の類似ユーザのそれぞれの類似度に、前記類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、前記一のユーザの新ユーザ特性ベクトルを算出するように構成してもよい。
【0011】
この発明によれば、当該複数の類似ユーザのそれぞれの類似度に、類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、一のユーザの新ユーザ特性ベクトルを算出することにより、類似ユーザとの類似度に応じたユーザ特性ベクトルを構成するパラメータを加工することができ、類似ユーザの類似度の影響を適度に与えつつ一のユーザに対する新ユーザ特性ベクトルを生成することができる。よって、一のユーザに対して適切なレコメンド情報を提供することができる。
【0012】
また、本発明のレコメンド情報生成装置において、前記算出手段は、前記算出した合計値を、類似ユーザとの類似度の絶対値の合計値で除算したパラメータに基づき一のユーザの新ユーザ特性ベクトルを算出するように構成してもよい。
【0013】
この発明によれば、さらに、類似ユーザとの類似度の絶対値の合計値で除算することで、一のユーザの新ユーザ特性ベクトルを算出することで、より適切な新ユーザ特性ベクトルを生成することができる。
【0014】
また、本発明のレコメンド情報生成装置において、前記算出手段は、前記乗算値に、類似ユーザの閲覧履歴の大きさに基づいた所定係数で重み付けを行うように構成してもよい。
【0015】
この発明によれば、上述乗算値に、類似ユーザの閲覧履歴の大きさに基づいた所定係数で重み付けを行うことで、閲覧履歴の大きさに応じた新ユーザ特性ベクトルのパラメータに対する影響力を変えることができる。よって、より適切な新ユーザ特性ベクトルを生成することができる。
【0016】
また、本発明のレコメンド情報生成装置において、前記ベクトル取得手段は、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、前記受付手段により受け付けられた選択対象項目の満足特性ベクトルおよび前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルを記憶する記憶手段と、前記記憶手段により記憶されている選択された選択対象項目の満足特性ベクトルと選択されなかった選択対象項目の不満足特性ベクトルとを分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、から構成されるようにしてもよい。
【0017】
また、本発明のレコメンド情報生成装置において、前記ベクトル取得手段は、ユーザ操作により、複数の選択対象項目から一の選択対象項目が選択されたこと、および選択されなかった選択対象項目を受け付ける受付手段と、前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成手段と、から構成されるようにしてもよい。
【発明の効果】
【0018】
本発明によれば、一のユーザと近いユーザ特性ベクトルを持つ他の類似ユーザのユーザ特性ベクトルを参考にして適切なレコメンド情報を生成することができる。すなわち、ユーザの趣味嗜好にはないが好きになる可能性がある嗜好を求めることができる。さらに、類似ユーザの閲覧履歴を用いることなく、類似ユーザの特性に合致したレコメンド情報を提供することができる。
【図面の簡単な説明】
【0019】
【図1】レコメンド情報配信システムのシステム構成を示すシステム構成図である。
【図2】情報配信サーバ200の機能構成を示すブロック図である。
【図3】情報配信サーバ200のハードウェア構成図である。
【図4】携帯電話機100に表示されるメニュー画面の一例を示す説明図である。
【図5】分離平面を生成するときの処理概念を示す概念図である。
【図6】分離平面に基づいてユーザ特性ベクトルを算出するときの概念を示す概念図である。
【図7】コンテンツ管理テーブル205aの記憶内容を示す説明図である。
【図8】コンテンツ特性ベクトル管理テーブル207bの記憶内容を示す説明図である。
【図9】携帯電話機100の機能構成を示すブロック図である。
【図10】携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。
【図11】ユーザ特性ベクトルの計算処理を示すフローチャートである。
【図12】レコメンド情報を配信するときのシーケンス図である。
【図13】レコメンド情報の生成処理を示すフローチャートである。
【図14】履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示す説明図である。
【図15】メニュー画面おいて選択されたコンテンツの特性ベクトルの特徴空間における位置関係を示す図である。
【図16】履歴事象aおよびbを相対空間内において、コンテンツの特性ベクトルを表した図である。
【図17】分離平面を生成することができない場合において相対空間を用いて処理を行うときの説明図である。
【図18】閲覧頻度を考慮して特性ベクトルの重心を求める処理を示す概念図である。
【図19】アクセスされた時系列順にNN法により分離平面を生成するときの処理を示す説明図である。
【図20】操作に関する特徴空間における特性ベクトルのパラメータを示す説明図である。
【発明を実施するための最良の形態】
【0020】
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
図1は、本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。携帯電話機100からの要求に応じて情報配信サーバ200は、レコメンド情報生成装置として機能するものであって、この携帯電話機100のユーザとその特性が類似するユーザのそれぞれのユーザ特性ベクトルに基づいて携帯電話機100のユーザの新ユーザ特性ベクトルを生成して、この新ユーザ特性ベクトルに基づいて抽出されたコンテンツを、携帯電話機100に配信する。なお、この情報配信サーバ200は、各ユーザが保持する携帯電話機100a〜携帯電話機100cからのアクセス要求に応じて、他のコンテンツプロバイダからコンテンツを取得し、取得したコンテンツを配信するものであり、アクセス履歴はこのときに収集される。また、携帯電話機100がアクセス履歴を送信し、それを取得するように構成されてもよい。
【0021】
このような情報配信サーバ200の構成について、図2を用いて説明する。図2は、情報配信サーバ200の機能構成を示すブロック図である。この情報配信サーバ200は、コンテンツ要求受信部201(受付手段)、レコメンド要求受信部202、履歴クラス分離部203、ユーザ特性ベクトル計算部204(ユーザ特性ベクトル生成手段、ベクトル取得手段)、配信情報格納部205、履歴格納部207(記憶手段)、コンテンツ送信部208、類似ユーザ計算部209(類似度算出手段)、新ユーザ特性ベクトル算出部209a(選択手段、算出手段)およびレコメンド情報生成部210(生成手段)を含んで構成されている。
【0022】
図3は、情報配信サーバ200のハードウェア構成図である。図2に示される情報配信サーバ200は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。
【0023】
コンテンツ要求受信部201は、携帯電話機100(〜100c)からのコンテンツの要求に応じて、ネットワーク上のコンテンツプロバイダからコンテンツを取得する部分であり、携帯電話機100(〜100c)からコンテンツの要求とそのURLを受信することでアクセス履歴を収集することができる。収集したアクセス履歴(URLなど)は、履歴格納部207に出力される。なお、このコンテンツ要求受信部201は、アクセス履歴として、あるメニュー画面(事象)内において実際にアクセスされたコンテンツ(URL)と、メニュー画面には表示されているものの、実際にアクセスされなかったコンテンツとを区別して収集する。
【0024】
また、コンテンツ要求受信部201は、アクセス要求だけでなく、携帯電話機100(〜100c)において収集されたアクセス履歴情報を受信し、これを履歴格納部207に出力するようにしてもよい。この場合も同様に、携帯電話機100(〜100c)は、あるメニュー画面において選択されたコンテンツ、選択されなかったコンテンツを区別してアクセス履歴情報として情報配信サーバ200に送信するように構成される。
【0025】
レコメンド要求受信部202は、携帯電話機100からレコメンド情報の配信要求を、携帯電話機100のユーザのユーザIDとともに受信する部分である。レコメンド要求受信部202は、その配信要求を受信すると、類似ユーザ計算部209にその旨を通知し、類似ユーザを抽出するよう指示をする。なお、変形例として、レコメンド要求のあった旨をユーザ特性ベクトル計算部204に出力し、現時点におけるユーザ特性ベクトルを計算させ、その結果を類似ユーザ計算部209に通知し、類似ユーザを抽出させるようにしてもよい。
【0026】
履歴クラス分離部203は、履歴格納部207(閲覧履歴テーブル207c)に記憶されている閲覧履歴情報に含まれているコンテンツの特性ベクトルに基づいて、コンテンツを満足クラス(満足特性ベクトル)と不満足クラス(不満足特性ベクトル)とに分離するための分離平面を生成する部分である。ここで、満足クラスとは、あるコンテンツにアクセスするためのメニュー画面において選択可能に表示された複数のコンテンツのうち、実際に選択されたコンテンツのみを含んだクラスをいい、不満足クラスとは、そのメニュー画面において選択されなかったコンテンツのみを含んだクラスをいう。この履歴クラス分離部203は、SVM法またはNN法を用いて、各コンテンツの特性ベクトルを満足クラスと不満足クラスとに分離することができる分離平面を生成することで、これらクラスを分離することができる。ここでSVM(Support Vector Machine)法とは、それぞれのクラスのノード間(特性ベクトル間)の最小距離を最大化する平面を分離平面とする方法であり、NN法とは、それぞれのクラスの重心間、すなわち各コンテンツの特性ベクトルに基づいて算出された、満足クラスの重心と不満足クラスの重心とを結んだ直線を推薦する平面を分離平面とする方法である。なお、NN法においては、必ずしも分離平面を求める必要はなく、不満足クラスの重心から満足クラスへの重心へ向けて結んだ直線をユーザ特性ベクトルとするようにしてもよい。
【0027】
ここで分離平面を生成する具体的な方法について説明する。図4は、携帯電話機100に表示されるメニュー画面の一例を示す説明図である。図4に示すようにNode1〜Node5が表示されている。このNodeは、選択対象項目を示すものであり、例えばウェブ上のメニュー画面におけるカテゴリごとに区別された項目であったり、ウエブページのタイトルである。例えば、Node1が、自動車に関するコンテンツ、Node2が、金融に関するコンテンツなどである。ユーザは、Node1〜Node5のいずれかを選択することにより、対応するコンテンツを閲覧することができる。
【0028】
図5は、分離平面を生成するときの処理概念を示す概念図である。図5は、上述図4におけるメニュー画面のうちユーザが選択したコンテンツおよび選択されなかったコンテンツにおける、特徴空間内における各コンテンツの特性ベクトルの位置関係を示す。図5に示されている通り、円形で示されている部分が満足なコンテンツ(Node3、Node4)であり、三角形で示されている部分が不満足なコンテンツ(Node1、Node2、Node5)であり、四角形で示されている部分が未知の未評価コンテンツ(Node8、Node7)である。これら満足コンテンツと不満足コンテンツとを分離するように生成されたものが分離平面である。ここでは、未評価コンテンツは分離処理する際には考慮されない。なお、図においては、特徴空間を便宜上二次元平面で表現しているが、ベクトルを構成するパラメータ分だけベクトル軸が存在することになり、通常は20次元以上のベクトルで特徴空間は構成されている。
【0029】
ユーザ特性ベクトル計算部204は、履歴クラス分離部203により生成された分離平面に対して直交する直交ベクトルを算出し、これをユーザ特性ベクトルとする部分である。図6にその具体例を示す。図6は、分離平面に基づいてユーザ特性ベクトルを算出するときの概念を示す概念図である。図6に示すように、分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが、ユーザ特性ベクトル計算部204により算出される。ユーザ特性ベクトル計算部204は、閲覧履歴が収集されるたびに計算し、ユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルを更新させる。
【0030】
配信情報格納部205は、オペレータにより予め登録されたコンテンツ、または各ユーザである携帯電話機100〜100cからコンテンツ要求受信部201により受信された配信要求のあったコンテンツを記憶する部分であり、コンテンツ管理テーブル205aを記憶している。図7は、コンテンツ管理テーブル205aの記憶内容を示す説明図である。図7に示すように、このコンテンツ管理テーブル205aは、ユーザID、コンテンツID、カテゴリ、タイトル、およびレコメンド本文を対応付けて記憶している。ユーザIDは、ユーザを特定するための識別情報であり、携帯電話機100〜100cの固有情報などである。コンテンツIDは、コンテンツを一意に特定するための識別情報であり、カテゴリは情報種別を示し、例えばCDに関連するもの、DVDに関連するもの、書籍に関連するもの、テレビ番組に関連するものなどを示すための情報である。タイトルは、レコメンド情報として表示するための見出し情報である。レコメンド情報を配信する際には、このタイトル部分が表示されることになる。レコメンド文は、レコメンド情報の本体部分であり、ユーザに有用な情報である。このコンテンツ管理テーブル205aに記憶される情報は、予めオペレータにより入力されたものでもよいし、自動的にコンテンツプロバイダから検索・抽出され所定のフィルタにより絞り込まれたものであってもよい。
【0031】
類似ユーザ計算部209は、レコメンド要求受信部202により受信されたレコメンド要求にしたがって、当該レコメンド要求を発したユーザuと類似する類似ユーザu’を抽出するために、一のユーザ特性ベクトルwuと他のユーザのユーザ特性ベクトルwu’をそれぞれ抽出して、その類似度を計算する部分である。具体的には、類似ユーザ計算部209は、ユーザ特性ベクトル管理テーブル207aに記憶されている一のユーザ特性ベクトルwuと、他のユーザのユーザ特性ベクトルwu’との内積を計算することにより類似度を算出する。具体的には、式(1)のとおりの式に従って類似度は算出される。
【数1】
【0032】
この他のユーザは、多数存在しており、類似ユーザ計算部209は、類似度が大きい複数の他のユーザのうち上位所定数(例えば、S人分)を類似ユーザとする。なお、一のユーザ、他のユーザのそれぞれのユーザ特性ベクトルは、正規化処理されている。また、ここでは、一のユーザを携帯電話機100のユーザとし、複数の類似ユーザを携帯電話機100a〜100cのユーザとする。
【0033】
新ユーザ特性ベクトル算出部209aは、一のユーザuと複数の類似ユーザu’とのそれぞれの類似度と、類似ユーザu’のユーザ特性ベクトルを構成する各特徴iの特性パラメータWu’,iに基づいて、一のユーザuの新ユーザ特性ベクトルw’uを算出する部分である。具体的には、上述の式(1)に示すとおりに求められた、一のユーザである携帯電話機100のユーザuと類似ユーザu’である携帯電話機100a等のユーザ特性ベクトルwu’との特性ベクトルの類似度を算出し、そのうち類似度の高い上位S人の類似ユーザを求める。
【0034】
そして、新ユーザ特性ベクトル算出部209aは、類似ユーザu’のS人と一のユーザuとのそれぞれの類似度sim(wu,wu’)に基づき、一のユーザuのユーザ特性ベクトルwuを構成する特徴iの特性パラメータWu,iを式(2)の通り算出する。すなわち、新ユーザ特性ベクトル算出部209aは、一のユーザuと類似ユーザu’との類似度sim(wu,wu’)とその類似ユーザu’の特徴iの特性パラメータWu’,iを乗算し、これを上位S人分の類似ユーザ分の累積値を算出する。そして、これを類似度sim(wu,wu’)の全体値における上位S人分の累積値を算出して、除算する。これにより、一のユーザuの特徴iにおける特性パラメータW’u,iを算出することができる。
これを特性パラメータ分だけ行い、各特性パラメータから構成されるベクトルを正規化することにより、新ユーザ特性ベクトルw’uを導出することができる。一般的に特性ベクトルは、数千〜数万の特性パラメータから構成されており、その個数分繰り返し、算出して、これら特性パラメータを用いて一のユーザuの新ユーザ特性ベクトルw’uを生成することができる。
【数2】
【0035】
レコメンド情報生成部210は、配信情報格納部205に記憶されているコンテンツのうち、新ユーザ特性ベクトル算出部209aにより算出された新ユーザ特性ベクトルに基づいて、コンテンツを抽出・評価し、そして評価の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する部分である。
【0036】
履歴格納部207は、各履歴情報を記憶する部分であり、ユーザ特性ベクトル管理テーブル207a、コンテンツ特性ベクトル管理テーブル207b、および閲覧履歴テーブル207cを記憶している。
【0037】
ユーザ特性ベクトル管理テーブル207aは、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルを、ユーザを特定するためのユーザIDと対応付けて記憶する部分である。
【0038】
コンテンツ特性ベクトル管理テーブル207bは、コンテンツ管理テーブル205aに記憶されている、予めオペレータにより登録されたコンテンツの特性ベクトルを、そのコンテンツを特定するための情報(例えばコンテンツID、URLなど)と対応付けて記憶する部分である。例えば、コンテンツ特性ベクトル管理テーブル207bは、図8に示される情報が記憶されている。図8に示すように、コンテンツIDと対応付けて、特性ベクトルを構成するパラメータが複数記憶されている。図8では、8個のパラメータを記載しているが、通常はさらに多くのパラメータから特性ベクトルは構成されている。なお、規定のパラメータ以外に、コンテンツごとに形態素解析にしたがって抽出されたキーワードをパラメータとして追加するようにしてもよい。特性ベクトルを構成するパラメータごとに、0から1の間で数値が記述されており、どの特性ベクトルに特徴を持たせているかを表している。
【0039】
閲覧履歴テーブル207cは、コンテンツ要求受信部201により受信されたあて先または収集されたアクセス履歴情報を記憶する部分であり、例えば、ユーザID、コンテンツID(またはコンテンツのURL)およびそのコンテンツ(閲覧されたもの、閲覧されていないものそれぞれ)の特性ベクトルを対応付けて記憶する部分である。
【0040】
コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信する部分である。例えば、コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信し、またレコメンド要求受信部202に応じて、配信情報格納部205に記憶されているコンテンツまたは閲覧履歴テーブル207cに記憶されている閲覧履歴に記述されたコンテンツに基づいてレコメンド情報生成部210による評価結果にしたがって生成されたレコメンド情報を送信する。
【0041】
このように構成された情報配信サーバ200は、携帯電話機100からの要求に応じて、類似ユーザである携帯電話機100a〜100cの各ユーザのユーザ特性ベクトルに基づいて抽出されたコンテンツを含んだレコメンド情報を配信することができる。よって、ユーザ特性ベクトルに基づいてユーザの類似度を判断し、類似ユーザのユーザ特性ベクトルに基づいて新ユーザ特性ベクトルを生成して、これに基づいてコンテンツをレコメンド情報として配信することで、閲覧履歴が少ない類似ユーザであっても、その類似ユーザの特性にあったコンテンツを抽出することができる。
【0042】
なお、本実施形態では、履歴クラス分離部203およびユーザ特性ベクトル計算部204を用いて、ユーザ特性ベクトルを計算し、これをユーザ特性ベクトル管理テーブル207aに記憶させているが、これに限定するものではなく、固定値としてユーザ特性ベクトル管理テーブル207aにユーザ特性ベクトルを記憶させるようにしてもよい。例えば、この固定値として、アンケート調査などを行った結果に基づいて、人手により生成されたものが考えられる。また、この場合、生成した新ユーザ特性ベクトルと置き換える処理をして、常にユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルは、更新されているように処理してもよい。
【0043】
また、不満足コンテンツの特性ベクトル(不満足特性ベクトル)のみに基づいてユーザ特性ベクトルを逐次計算し、ユーザ特性ベクトル管理テーブル207aに記憶させるようにしてもよい。例えば、履歴クラス分離部203を用いることなく、ユーザ特性ベクトル計算部204は、選択されなかった不満足コンテンツのみに基づいてユーザ特性ベクトルを生成し、ユーザ特性ベクトル管理テーブル207aに記憶させるようにしてもよい。この場合、ユーザ特性ベクトル計算部204は、不満足コンテンツのみに基づいて重心を計算し、これをユーザ特性ベクトルとし、ユーザ特性ベクトル管理テーブル207aに記憶させ、類似ユーザ計算部209は、これに基づいて、類似ユーザを判断することになる。
【0044】
つぎに、携帯電話機100について説明する。図9は、携帯電話機100の機能構成を示すブロック図である。図9に示すとおり、携帯電話機100は、ブラウザ101、履歴送信部102、レコメンド要求送信部103、および配信情報表示部104を含んで構成されている。この携帯電話機100は、CPU、RAM、ROMなどのハードウェアにより構成されており、記憶されているプログラムにしたがってCPUは動作するよう構成されている。具体的には、情報配信サーバ200と同様の構成をとるものであって、図3に示されるハードウェア構成により実現される。以下、各構成について説明する。
【0045】
ブラウザ101は、インターネットに接続するためのアプリケーション部分であり、インターネット上に配置されているサイトに対してアクセスし、サイトに保持されているコンテンツをユーザに閲覧可能にさせるものである。このブラウザ101は、アクセス履歴を保持するように構成される。
【0046】
履歴送信部102は、ブラウザ101を用いてアクセスしたコンテンツのアクセス履歴(同一メニュー画面上において選択されたコンテンツおよび選択されなかったコンテンツを示す情報)を送信する部分である。なお、この履歴送信部102は、情報配信サーバ200側でアクセスのたびに履歴情報を収集する機能を有している場合には、必須の構成ではない。
【0047】
レコメンド要求送信部103は、図示しない操作部をユーザが操作することによりユーザIDとともにレコメンド情報の要求を情報配信サーバ200に送信する部分である。
【0048】
配信情報表示部104は、ブラウザ101により取得されたメニュー画面およびコンテンツ(ウエブページ)を表示する部分である。
【0049】
このように構成された携帯電話機100は、ブラウザ101を用いてインターネットにアクセス可能にするとともに、そのアクセス履歴を保持し、履歴送信部102は、情報配信サーバ200からの要求または所定のタイミングでアクセス履歴を送信することができる。
【0050】
つぎに、これら携帯電話機100および情報配信サーバ200の動作について説明する。図10は、携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。
【0051】
図10に示すとおり、携帯電話機100におけるブラウザ101からの要求に応じて、コンテンツ送信部208により情報配信サーバ200からメニュー画面が配信される(S101)。携帯電話機100のユーザは、そのメニュー画面から任意の一のコンテンツ(上述Nodeに相当)を選択し、携帯電話機100におけるブラウザ101がこれを受け付けると(S102)、コンテンツの接続要求およびそのあて先でURLが情報配信サーバ200に送信される(S103)。
【0052】
情報配信サーバ200では、URLはコンテンツ要求受信部201により受信され、閲覧履歴テーブル207cにアクセス履歴として記憶される。そして、このアクセス履歴に基づいて、ユーザ特性ベクトルの計算がなされ、記憶される(S104)。そして、コンテンツ送信部208によりS103において要求のあったあて先に基づいたコンテンツがコンテンツプロバイダ(図示せず)から取得され、配信される(S105)。なお、ユーザ特性ベクトルの計算処理と、コンテンツの配信処理の順番は逆でもよい。
【0053】
ここでS104におけるユーザ特性ベクトル計算の詳細に処理について説明する。図11は、ユーザ特性ベクトルの計算処理を示すフローチャートである。図11に示すように、まずコンテンツ要求受信部201により受信されたアクセス要求またはアクセス履歴により示されたアクセス履歴情報が、新たに追加されたアクセス履歴として閲覧履歴テーブル207cに記憶される(S201)。
【0054】
そして、履歴クラス分離部203により、この閲覧履歴テーブル207cに記憶されているアクセス履歴情報に基づいて、各満足クラスまたは不満足クラスに属するコンテンツの特性ベクトルが抽出される(S202)。そして、履歴クラス分離部203により、これら特性ベクトルに基づいて満足クラスと不満足クラスとを分離するための分離平面が生成される(S202)。つぎに、ユーザ特性ベクトル計算部204により、生成された分離平面に直交する直交ベクトルが計算され、ユーザ特性ベクトルが求められる(S204)。ここで求められたユーザ特性ベクトルは、ユーザ特性ベクトル管理テーブル207aに保持され、レコメンド情報の配信時において配信情報格納部205に記憶されているコンテンツを評価する際に利用される。
【0055】
つぎに、本実施形態における類似ユーザのユーザ特性ベクトルに基づいて抽出されたコンテンツをレコメンド情報として配信するときの処理について説明する。図12は、レコメンド情報を配信するときのシーケンス図である。図12に示すように、携帯電話機100におけるレコメンド要求送信部103によりユーザIDを含んだレコメンド要求が送信され、このレコメンド要求は情報配信サーバ200におけるレコメンド要求受信部202により受信される(S301)。そして、情報配信サーバ200では、新ユーザ特性ベクトル算出部209aにより、類似ユーザのユーザ特性ベクトルに基づいて新ユーザ特性ベクトルが生成され、レコメンド情報生成部210により、新ユーザ特性ベクトルに基づいたコンテンツの抽出処理が行われる(S302)。ここでは、レコメンド情報生成部210により、コンテンツとの関連度が計算され、高い関連度の順にコンテンツのタイトルを並べたレコメンド情報が生成される。そして、コンテンツ送信部208により、このように生成されたレコメンド情報が配信される(S303)。
【0056】
ここで、S302のレコメンド情報の生成についてさらに詳細な処理について説明する。図13は、レコメンド情報の生成処理を示すフローチャートである。図13に示すように、類似ユーザ計算部209により、レコメンド要求とともに送信されたユーザIDに基づいて、ユーザ特性ベクトル管理テーブル207aから、対応するユーザ特性ベクトルが取得される(S401)。つぎに、類似ユーザ計算部209により、レコメンド要求を発したユーザと他のユーザとの類似度の計算が行われる。すなわち、ユーザのユーザ特性ベクトルと他のユーザのユーザ特性ベクトルとがそれぞれユーザ特性ベクトル管理テーブル207aから抽出され、その内積が計算される。全ての他のユーザとの内積が計算される(S402)。
【0057】
つぎに、新ユーザ特性ベクトル算出部209aにより、類似度の高い(上記の内積値が大きい)上位S人の類似ユーザが求められ、当該類似ユーザの特性ベクトルが取得される(S403)。そして、類似ユーザS人のユーザ特性ベクトルを構成する特性パラメータと類似度との乗算値に基づいてユーザの新たな特性ベクトルである新ユーザ特性ベクトルが生成される(S404)。そして、レコメンド情報生成部210により、生成した新ユーザ特性ベクトルに基づいて、コンテンツが抽出され、関連度の大きい順に並び替えて、レコメンド情報としてユーザ(携帯電話機100)に送信される(S406)。この送信処理は図12のS303に相当する。
【0058】
このように、ユーザ特性ベクトルにしたがって、上位S人の類似ユーザを抽出し、その類似ユーザに基づいて、新ユーザ特性ベクトルを生成し、この新ユーザ特性ベクトルに基づいたコンテンツを抽出して、レコメンド情報として提供することができる。
【0059】
つぎに、上述本実施形態の変形例について説明する。上述式(2)においては、ユーザu’の特性パラメータと、ユーザuとユーザu’との類似度とを乗算した乗算値を算出し、これをユーザu’のS人の乗算値を算出して、その合計値にもとづいたものを、新ユーザ特性ベクトルの一パラメータとしている。
【0060】
しかしながら、S人のユーザu’の中には、ユーザu’それぞれのユーザ特性ベクトルの元となる閲覧履歴の大きさ(閲覧回数)も異なるものであり、一律に扱うことが適当ではない場合もありえる。
【0061】
そこで、本変形例の情報配信サーバ200においては、式(2)にかえて以下の式(3)を適用して、新ユーザ特性ベクトルを生成するようにしてもよい。
【数3】
【0062】
ここでαu’は、例えば、ユーザu’の閲覧履歴の大きさ(閲覧回数)に基づいて定められた係数である。例えば、上位S人のユーザu’の閲覧履歴の大きさにおける比率である。閲覧履歴が大きければ大きいほど、そのユーザu’に対する影響力が大きくなる。
【0063】
このように、閲覧回数の大きさに応じて重み付けをすることにより、より適切な新ユーザ特性ベクトルを生成することができる。
【0064】
<相対空間における分離平面の生成>
以上の分離平面の生成方法は、絶対空間におけるコンテンツの特性ベクトルにしたがって行われたものであるが、より精度高める方法として、相対的な位置関係を求めた相対空間を利用したものも考えられる。以下、相対空間を用いて分離平面を生成する方法について説明する。なお、このときの処理構成は上述と同様であり、履歴クラス分離部203における処理内容が異なるだけである。
【0065】
図14は、履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示し、図14(a)が履歴事象aにおけるメニュー画面を示す図であり、このメニュー画面はNode1からNode3で構成されている。また、図14(b)が履歴事象bにおけるメニュー画面を示す図であり、このメニュー画面はNode6からNode9で構成されている。図14(a)では、Node3が選択されており、図14(b)では、Node9が選択されていることが示されている。
【0066】
図15は、図14で示されたそれぞれのメニュー画面おいて選択されたコンテンツの特性ベクトルの特徴空間における位置関係を示す図である。図15(a)は、履歴事象aにおいて選択されたコンテンツの特徴空間(絶対空間)、図15(b)は、履歴事象bにおいて選択されたコンテンツの特徴空間(絶対空間)を示す図である。上述と同様に、選択されたコンテンツは満足なコンテンツ、選択されなかったコンテンツは不満足なコンテンツと定義され、それぞれ満足クラス、不満足クラスに分類することができる。
【0067】
図16は、それぞれの履歴事象aおよびbを同一特徴空間上に、コンテンツの特性ベクトルを表した図であって、不満足なコンテンツの特性ベクトルを原点に取った場合における満足なコンテンツの特性ベクトルの位置を示す相対空間を表した図である。例えば、Node2とNode3との相対比較、Node1とNode3との相対比較のため、それぞれNode1、Node2を原点とした場合のNode3の位置を表した特徴空間を相対空間としている。より具体的には、Node3の特性ベクトルからNode1の特性ベクトルを減算することにより、相対空間を形成することができる。他のNodeについても同様に、対象となるコンテンツの特性ベクトルを減算する処理を行うことで相対空間を形成することができる。
【0068】
この相対空間において、図16に示すようにこのように満足なコンテンツの特性ベクトル、不満足なコンテンツの特性ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面が、履歴クラス分離部203により生成される。そして、ユーザ特性ベクトル計算部204により、この分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが計算される。
【0069】
このように、履歴事象が異なる場合においても、相対空間を利用してユーザ特性ベクトルを生成することができ、より識別性の高いユーザ特性ベクトルを生成することができる。
【0070】
このように相対空間を用いて分離平面を生成し、それによってユーザ特性ベクトルを生成することができる。ところで、図15から図17については、絶対空間として扱っても分離平面を生成することができるが、分離平面を生成することができない特性ベクトルから構成される特徴空間も考えられる。その場合に、上述した相対空間を利用することにより分離平面を生成することができる。以下、その方法について説明する。
【0071】
図17(a)は、絶対空間におけるコンテンツの特性ベクトルを示した図である。この図17(a)では、Node1とNode4とが同じ事象(メニュー画面)に存在するコンテンツであり、Node2とNode3とが同じ事象に存在するコンテンツであことを前提としている。なお、円形のものが選択されたコンテンツの特性ベクトル(満足クラス)、三角形のものが選択されなかったコンテンツの特性ベクトル(不満足クラス)である。
【0072】
図17(a)から明らかなように、絶対空間においては、このような位置関係をとる特性ベクトルのコンテンツに対しては、分離平面を生成することができない。分離平面は、満足クラスと不満足クラスとを分離するための平面であるためであり、図17(a)の例では、可不足なく両者を分離することができないためである。よって、分離平面を生成することができるように相対的な位置関係を表す相対空間に変換することが必要である。
【0073】
図17(b)では、相対空間内におけるコンテンツの特性ベクトルを表した図であり、Node1およびNode2が同じ位置になるように、図17(b)の例では、Node2を平行移動させるためそのNode2に対応するNode3を平行移動させている。このように相対空間に変換することで、不満足なコンテンツであるNode1(Node2)と、満足なコンテンツであるNode3およびNode4とを分離することができる分離平面vを生成することができる。
【0074】
以上の通り絶対空間では、分離平面を生成することができない場合であっても、相対空間に変換することで分離平面を生成することができ、これによりユーザ特性ベクトルを計算することができる。
【0075】
<閲覧頻度を考慮した分離平面の生成方法>
つぎに、コンテンツの閲覧頻度を用いた重み付け処理を行い、この重み付け処理された特性ベクトルを用いて分離平面を生成するときの履歴クラス分離部203の処理について説明する。なお、ここでは、NN法を用いた分離平面の生成について説明する。
【0076】
図18は、閲覧頻度を考慮して特性ベクトルの重心を求める処理を示す概念図であり、コンテンツc1〜c3の特性ベクトルの位置を表す特徴空間を示す概念図である。コンテンツc1の閲覧頻度は3回、コンテンツc2の閲覧頻度は1回、コンテンツc3の閲覧頻度は10回とする。なお、閲覧履歴テーブル207cは、閲覧されたコンテンツの閲覧履歴、閲覧されていないコンテンツの不閲覧履歴を記憶しておくことが好ましく、それぞれの頻度を保持または計算可能に記憶しておくことが必要である。
【0077】
この場合、これらコンテンツc1〜c3の重心は、以下の式(4)により計算される。
【数4】
なお、ciは閲覧されたコンテンツの特性ベクトル、niは閲覧頻度である。
【0078】
この計算を行うことにより重心が定まる。また、図示していないが閲覧されていないコンテンツについても同様に式(4)を用いて、閲覧さていないコンテンツの特性ベクトルを用いてその重心を求める。そして、閲覧されていないコンテンツの重心から閲覧されたコンテンツの重心に対して結んだ直線をユーザ特性ベクトルとして求めることができる。なお、この直線は、分離平面に直交する直線と同じ向きを取るものであり、分離平面を算出し、この分離平面に直交する直交ベクトルを求めるようにしてもよいが、NN法においては必ずしも分離平面は必要とはならない。
【0079】
これにより、コンテンツの閲覧頻度を利用してユーザ特性ベクトルを求めることができ、閲覧頻度を利用しない場合と比較して、ユーザの嗜好に近いユーザ特性ベクトルを求めることができる。よって、ユーザの嗜好にそったコンテンツの評価を行うことができる。
【0080】
<選択順位を考慮した分離平面の生成方法>
つぎに、閲覧したコンテンツの順番を考慮して分離平面を生成するときの履歴クラス分離部203の処理について説明する。一般的に、直近にアクセスしたコンテンツの方が、その前にアクセスしたコンテンツより重要である、またはユーザの嗜好に近いものであると考えることができる。この時間差が大きくなればなるほど、ユーザの嗜好に変化が生じ、より直近にアクセスしたコンテンツを重要と考えることが顕著となる。ここでは、その時間差(時系列成分)を考慮して分離平面を生成するときの処理について説明する。
【0081】
図19は、履歴クラス分離部203が分離平面を生成する際において、そのアクセスされた時系列順にNN法により分離平面を生成するときの処理を示す説明図であって、図19(a)は、そのときのメニュー画面を示す説明図であり、図19(b)は、ユーザが選択したコンテンツの選択履歴を示す説明図であり、図19(c)は、特徴空間における各コンテンツの特性ベクトルを表した概念図であり、図19(d)は、選択順を考慮した分離平面を生成することを説明するための概念図である。なお、選択履歴は、閲覧履歴テーブル207cに記憶される。
【0082】
図19(a)に示されるように、NodeAからNodeFからメニュー画面が構成されている。ここでは図19(b)に示すようにNodeA、NodeB、NodeCの順にコンテンツが選択されている。よって、NodeA、NodeB、NodeCが満足クラスに分類されるコンテンツとなり、NodeD、NodeE、NodeFが不満足クラスに分類されるコンテンツとなる。
【0083】
つぎに、図19(c)および図19(d)を用いて、分離平面を生成するときの処理を示す概念について説明する。図19(c)に示されるように、NodeAからNodeFは、その特性ベクトルにしたがって特徴空間上に位置づけられている。そして、直近に選択したコンテンツの特性ベクトルの影響が大きくなるように計算される。図19(d)に示されるように、満足クラスにおける重心を求めるため、まず、NodeAとNodeBとの中点w1が計算される。そして、この中点w1とNodeCとの中点w2が計算される。
【0084】
一方、不満足クラスにおいては、NodeD、NodeE、NodeFに基づいて重心w3が計算される。不満足クラスにおいては選択順という概念がないため、通常の処理と同じく、その3つのNodeに基づいた重心w3が計算される。そして、中点w2と重心w3とを結んだ線が垂線となる分離平面vが生成される。なお、本実施形態においてはこの分離平面vに直交する直交ベクトルをユーザ特性ベクトルとするものであり、これは、重心w3から中点w2に向けて結んだ直線と同じである。実施形態での説明の便宜上、分離平面を求めているが、NN法を用いる場合においては分離平面を求めることは必須のものではない。
【0085】
このように、特性ベクトルと特性ベクトルとの中点を算出し、またその中点と特性ベクトルとの中点を算出し、時系列的に順に中点を算出する(NN法を適用する)ことにより、前のアクセス履歴ほど重みが小さくなり、時系列順位を考慮した重心を算出することができる。
【0086】
<操作メニューへの適用>
ところで、上述の各方法では、メニュー画面として、ウエブサイトである情報配信サーバ200から送信されたメニュー画面を例に説明したが、これに限るものではなく、例えば、携帯電話機100の操作メニューに対して、レコメンド情報としてレコメンド操作情報を表示するようにしてもよい。
【0087】
例えば、操作メニューにおける各操作項目に対して、特性ベクトルが割り振られており、ユーザの操作履歴に従って、ユーザ操作に関するユーザ特性ベクトルが生成され、そのユーザ特性ベクトルに基づいて類似ユーザをS人抽出し、そのS人の類似ユーザに基づいて、ユーザの新ユーザ特性ベクトルを生成し、当該新ユーザ特性ベクトルに基づいたレコメンド操作情報を生成するようにしてもよい。この場合、操作履歴は情報配信サーバ200に所定のタイミングで送信され、記憶されるよう構成されている。また、ユーザは類似ユーザの操作履歴を見たい場合にはその旨のレコメンド操作情報要求を行うよう操作することができるよう構成されている。
【0088】
図20は、操作に関する特徴空間における特性ベクトルのパラメータを示す説明図である。図20に示すように、携帯電話機100の端末機能として、「着もじ」「テレビ電話」「ワンセグ」「画面メモ」「テキストメモ」が規定されている。また、特性ベクトルを構成するパラメータとして「電話」「インターネット」「テキスト」「メモ」「テレビ」が規定されている。このように、携帯電話機100の機能に特性ベクトルが規定されている。例えば、「着もじ」には、「電話」「テキスト」のパラメータに1がふられており、電話、テキストに関連のある機能であることが示されている。配信情報格納部205には、類似ユーザが操作した操作履歴情報が記憶され、ユーザが操作メニューを表示するための操作をするときには、その旨が通知される。そして、新ユーザ特性ベクトル算出部209aは、類似ユーザのユーザ特性ベクトルに基づいて、上位S人の類似ユーザを抽出し、当該S人の類似ユーザのユーザ特性ベクトルおよび類似ユーザとユーザとの類似度に基づいて、ユーザの新ユーザ特性ベクトルを生成する。そして、レコメンド情報生成部210は、新ユーザ特性ベクトルに基づいたレコメンド操作情報を生成し、コンテンツ送信部208はそのレコメンド操作情報を送信し、携帯電話機100においてそれを表示させることができる。
【0089】
このように操作メニューに対しても本実施形態の評価方法を適用し、レコメンド操作情報をユーザに提供することで、ユーザがよく使う操作に類似または関連した操作をユーザに通知することができる。
【0090】
つぎに、本実施形態の情報配信サーバ200の作用効果について説明する。この情報配信サーバ200において、ユーザ特性ベクトル計算部204が各ユーザのユーザ特性ベクトルを算出し、類似ユーザ計算部209は、上述算出された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する。そして、類似ユーザ計算部209は、算出された類似度に基づいて一のユーザと類似するS人の類似ユーザを選択し、新ユーザ特性ベクトル算出部209aは、このS人の類似ユーザのユーザ特性ベクトルおよびS人の類似ユーザと対象となるユーザとのそれぞれの類似度に基づいて、新ユーザ特性ベクトルを生成する。レコメンド情報生成部210は、生成された新ユーザ特性ベクトルに基づいて、一のユーザに対するレコメンド情報を生成することができる。
【0091】
これにより、新ユーザ特性ベクトルを用いてコンテンツの抽出を行うことで、従前の方法と比較して、類似ユーザの履歴情報を利用することがなく、類似ユーザの特性に合致したレコメンド情報を生成することができる。
【0092】
また、本実施形態の情報配信サーバ200においては、新ユーザ特性ベクトル算出部209aは、当該複数の類似ユーザのそれぞれの類似度に、類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、一のユーザの新ユーザ特性ベクトルを算出する。例えば、式(2)または(3)にしたがって、新ユーザ特性ベクトルのパラメータを算出し、これに基づいて新ユーザ特性ベクトルを算出することができる。これにより、類似ユーザとの類似度に応じたユーザ特性ベクトルを構成するパラメータを加工することができ、類似ユーザの類似度の影響を適度に与えつつ一のユーザに対する新ユーザ特性ベクトルを生成することができる。よって、一のユーザに対して適切なレコメンド情報を提供することができる。
【0093】
なお、上述の式(2)または(3)においては、類似ユーザとの類似度の絶対値の合計値で、除算する処理を行っているが、これに限るものではなく、予め定めた定数としてもよい。
【0094】
また、乗算値に、類似ユーザに対する類似度の程度若しくは類似ユーザの閲覧履歴における頻度に基づいた所定係数で重み付けを行うことで、その影響力を適切に貸せることができる。
【0095】
また、コンテンツ要求受信部201が、ユーザ操作により、複数の選択対象項目であるメニュー画面から一の選択対象項目であるコンテンツを選択することを受信し、コンテンツ特性ベクトル管理テーブル207bは、選択されたコンテンツの特性ベクトルおよび選択されなかったコンテンツの特性ベクトルを記憶する。そして、履歴クラス分離部203は、記憶されている、選択されたコンテンツの特性ベクトルと選択されなかったコンテンツの特性ベクトルとを分離するための平坦に形成されている分離平面を生成し、ユーザ特性ベクトル計算部204は、生成された分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成することができる。これにより、精度のよいユーザ特性ベクトルを生成することができる。
【符号の説明】
【0096】
100…携帯電話機、100a…携帯電話機、101…ブラウザ、102…履歴送信部、103…レコメンド要求送信部、104…配信情報表示部、200…情報配信サーバ、201…コンテンツ要求受信部、202…レコメンド要求受信部、203…履歴クラス分離部、204…ユーザ特性ベクトル計算部、205…配信情報格納部、205a…コンテンツ管理テーブル、207…履歴格納部、207a…ユーザ特性ベクトル管理テーブル、207b…コンテンツ特性ベクトル管理テーブル、207c…閲覧履歴テーブル、208…コンテンツ送信部、209…類似ユーザ計算部、209a…新ユーザ特性ベクトル算出部、210…レコメンド情報生成部。
【技術分野】
【0001】
本発明は、レコメンド情報を生成するレコメンド情報生成装置およびレコメンド情報生成方法に関する。
【背景技術】
【0002】
ユーザの履歴と他ユーザの履歴との比較に基づいて類似ユーザを求め、類似ユーザがよく見るコンテンツを推薦する協調フィルタ方式が考えられている。例えば、下記特許文献1(特開2002−215665号公報)には、対象とするユーザに最もよく似た嗜好を持つ協調ユーザを選定し、この協調ユーザのプロファイルに基づいて推薦するコンテンツを選択することが記載されている。また、下記特許文献2(特開2009−252177号公報)では、各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出し、類似の高い類似ユーザの閲覧済みコンテンツのうち、類似ユーザのユーザ特性ベクトルに近いコンテンツをレコメンドすることが記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−215665号公報
【特許文献2】特開2009−252177号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述特許文献1に記載の技術では、協調ユーザのプロファイルに基づいたコンテンツ選択を行っていることから、協調ユーザと同じコンテンツしかレコメンドされず、適切なレコメンド情報の提供を受けることができないという問題があった。
【0005】
また、上述特許文献2に記載の技術でも類似ユーザの閲覧履歴を用いて、レコメンドを行うため、膨大なコンテンツが存在し、類似ユーザがその中の一部のコンテンツしか閲覧していないような場合では、その一部のコンテンツしかレコメンドすることができず、また閲覧されていないコンテンツについてはレコメンドの対象とならなった。
【0006】
そこで、本発明は、類似ユーザの閲覧履歴を用いずに、類似ユーザの特性に合致したコンテンツを選択することができるレコメンド情報生成装置およびレコメンド情報生成方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上述の問題を解決するために、本発明のレコメンド情報生成装置は、各ユーザのユーザ特性ベクトルを取得するするベクトル取得手段と、前記ベクトル取得手段により取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出手段と、前記類似度算出手段により算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択手段と、前記選択手段により選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出するする算出手段と、前記算出手段により算出された新ユーザ特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成手段と、を備えている。
【0008】
また、本発明のレコメンド情報生成方法は、各ユーザのユーザ特性ベクトルを取得するするベクトル取得ステップと、前記ベクトル取得ステップにより取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出ステップと、前記類似度算出ステップにより算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択ステップと、前記選択ステップにより選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出するする算出ステップと、前記算出ステップにより算出された新ユーザ特性ベクトルに基づいて、前記選択ステップにより選択された類似ユーザの特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成ステップと、を備えている。
【0009】
この発明によれば、各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出し、算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する。そして、選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出し、算出された新ユーザ特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する。これにより、一のユーザと近いユーザ特性ベクトルを持つ他の類似ユーザのユーザ特性ベクトルを参考にして適切なレコメンド情報を生成することができる。すなわち、ユーザの趣味嗜好にはないが好きになる可能性がある嗜好を求めることができる。さらに、類似ユーザの閲覧履歴を用いることなく、類似ユーザの特性に合致したレコメンド情報を提供することができる。しかも、類似ユーザのみのユーザ特性ベクトルを利用していないため、当該類似ユーザに対するレコメンド情報と同じ情報はなく、一のユーザに対する特有のレコメンド情報を提供することができる。
【0010】
また、本発明のレコメンド情報生成装置において、前記選択手段は、上位所定数の類似ユーザを複数選択し、前記算出手段は、当該複数の類似ユーザのそれぞれの類似度に、前記類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、前記一のユーザの新ユーザ特性ベクトルを算出するように構成してもよい。
【0011】
この発明によれば、当該複数の類似ユーザのそれぞれの類似度に、類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、一のユーザの新ユーザ特性ベクトルを算出することにより、類似ユーザとの類似度に応じたユーザ特性ベクトルを構成するパラメータを加工することができ、類似ユーザの類似度の影響を適度に与えつつ一のユーザに対する新ユーザ特性ベクトルを生成することができる。よって、一のユーザに対して適切なレコメンド情報を提供することができる。
【0012】
また、本発明のレコメンド情報生成装置において、前記算出手段は、前記算出した合計値を、類似ユーザとの類似度の絶対値の合計値で除算したパラメータに基づき一のユーザの新ユーザ特性ベクトルを算出するように構成してもよい。
【0013】
この発明によれば、さらに、類似ユーザとの類似度の絶対値の合計値で除算することで、一のユーザの新ユーザ特性ベクトルを算出することで、より適切な新ユーザ特性ベクトルを生成することができる。
【0014】
また、本発明のレコメンド情報生成装置において、前記算出手段は、前記乗算値に、類似ユーザの閲覧履歴の大きさに基づいた所定係数で重み付けを行うように構成してもよい。
【0015】
この発明によれば、上述乗算値に、類似ユーザの閲覧履歴の大きさに基づいた所定係数で重み付けを行うことで、閲覧履歴の大きさに応じた新ユーザ特性ベクトルのパラメータに対する影響力を変えることができる。よって、より適切な新ユーザ特性ベクトルを生成することができる。
【0016】
また、本発明のレコメンド情報生成装置において、前記ベクトル取得手段は、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、前記受付手段により受け付けられた選択対象項目の満足特性ベクトルおよび前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルを記憶する記憶手段と、前記記憶手段により記憶されている選択された選択対象項目の満足特性ベクトルと選択されなかった選択対象項目の不満足特性ベクトルとを分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、から構成されるようにしてもよい。
【0017】
また、本発明のレコメンド情報生成装置において、前記ベクトル取得手段は、ユーザ操作により、複数の選択対象項目から一の選択対象項目が選択されたこと、および選択されなかった選択対象項目を受け付ける受付手段と、前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成手段と、から構成されるようにしてもよい。
【発明の効果】
【0018】
本発明によれば、一のユーザと近いユーザ特性ベクトルを持つ他の類似ユーザのユーザ特性ベクトルを参考にして適切なレコメンド情報を生成することができる。すなわち、ユーザの趣味嗜好にはないが好きになる可能性がある嗜好を求めることができる。さらに、類似ユーザの閲覧履歴を用いることなく、類似ユーザの特性に合致したレコメンド情報を提供することができる。
【図面の簡単な説明】
【0019】
【図1】レコメンド情報配信システムのシステム構成を示すシステム構成図である。
【図2】情報配信サーバ200の機能構成を示すブロック図である。
【図3】情報配信サーバ200のハードウェア構成図である。
【図4】携帯電話機100に表示されるメニュー画面の一例を示す説明図である。
【図5】分離平面を生成するときの処理概念を示す概念図である。
【図6】分離平面に基づいてユーザ特性ベクトルを算出するときの概念を示す概念図である。
【図7】コンテンツ管理テーブル205aの記憶内容を示す説明図である。
【図8】コンテンツ特性ベクトル管理テーブル207bの記憶内容を示す説明図である。
【図9】携帯電話機100の機能構成を示すブロック図である。
【図10】携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。
【図11】ユーザ特性ベクトルの計算処理を示すフローチャートである。
【図12】レコメンド情報を配信するときのシーケンス図である。
【図13】レコメンド情報の生成処理を示すフローチャートである。
【図14】履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示す説明図である。
【図15】メニュー画面おいて選択されたコンテンツの特性ベクトルの特徴空間における位置関係を示す図である。
【図16】履歴事象aおよびbを相対空間内において、コンテンツの特性ベクトルを表した図である。
【図17】分離平面を生成することができない場合において相対空間を用いて処理を行うときの説明図である。
【図18】閲覧頻度を考慮して特性ベクトルの重心を求める処理を示す概念図である。
【図19】アクセスされた時系列順にNN法により分離平面を生成するときの処理を示す説明図である。
【図20】操作に関する特徴空間における特性ベクトルのパラメータを示す説明図である。
【発明を実施するための最良の形態】
【0020】
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
図1は、本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。携帯電話機100からの要求に応じて情報配信サーバ200は、レコメンド情報生成装置として機能するものであって、この携帯電話機100のユーザとその特性が類似するユーザのそれぞれのユーザ特性ベクトルに基づいて携帯電話機100のユーザの新ユーザ特性ベクトルを生成して、この新ユーザ特性ベクトルに基づいて抽出されたコンテンツを、携帯電話機100に配信する。なお、この情報配信サーバ200は、各ユーザが保持する携帯電話機100a〜携帯電話機100cからのアクセス要求に応じて、他のコンテンツプロバイダからコンテンツを取得し、取得したコンテンツを配信するものであり、アクセス履歴はこのときに収集される。また、携帯電話機100がアクセス履歴を送信し、それを取得するように構成されてもよい。
【0021】
このような情報配信サーバ200の構成について、図2を用いて説明する。図2は、情報配信サーバ200の機能構成を示すブロック図である。この情報配信サーバ200は、コンテンツ要求受信部201(受付手段)、レコメンド要求受信部202、履歴クラス分離部203、ユーザ特性ベクトル計算部204(ユーザ特性ベクトル生成手段、ベクトル取得手段)、配信情報格納部205、履歴格納部207(記憶手段)、コンテンツ送信部208、類似ユーザ計算部209(類似度算出手段)、新ユーザ特性ベクトル算出部209a(選択手段、算出手段)およびレコメンド情報生成部210(生成手段)を含んで構成されている。
【0022】
図3は、情報配信サーバ200のハードウェア構成図である。図2に示される情報配信サーバ200は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。
【0023】
コンテンツ要求受信部201は、携帯電話機100(〜100c)からのコンテンツの要求に応じて、ネットワーク上のコンテンツプロバイダからコンテンツを取得する部分であり、携帯電話機100(〜100c)からコンテンツの要求とそのURLを受信することでアクセス履歴を収集することができる。収集したアクセス履歴(URLなど)は、履歴格納部207に出力される。なお、このコンテンツ要求受信部201は、アクセス履歴として、あるメニュー画面(事象)内において実際にアクセスされたコンテンツ(URL)と、メニュー画面には表示されているものの、実際にアクセスされなかったコンテンツとを区別して収集する。
【0024】
また、コンテンツ要求受信部201は、アクセス要求だけでなく、携帯電話機100(〜100c)において収集されたアクセス履歴情報を受信し、これを履歴格納部207に出力するようにしてもよい。この場合も同様に、携帯電話機100(〜100c)は、あるメニュー画面において選択されたコンテンツ、選択されなかったコンテンツを区別してアクセス履歴情報として情報配信サーバ200に送信するように構成される。
【0025】
レコメンド要求受信部202は、携帯電話機100からレコメンド情報の配信要求を、携帯電話機100のユーザのユーザIDとともに受信する部分である。レコメンド要求受信部202は、その配信要求を受信すると、類似ユーザ計算部209にその旨を通知し、類似ユーザを抽出するよう指示をする。なお、変形例として、レコメンド要求のあった旨をユーザ特性ベクトル計算部204に出力し、現時点におけるユーザ特性ベクトルを計算させ、その結果を類似ユーザ計算部209に通知し、類似ユーザを抽出させるようにしてもよい。
【0026】
履歴クラス分離部203は、履歴格納部207(閲覧履歴テーブル207c)に記憶されている閲覧履歴情報に含まれているコンテンツの特性ベクトルに基づいて、コンテンツを満足クラス(満足特性ベクトル)と不満足クラス(不満足特性ベクトル)とに分離するための分離平面を生成する部分である。ここで、満足クラスとは、あるコンテンツにアクセスするためのメニュー画面において選択可能に表示された複数のコンテンツのうち、実際に選択されたコンテンツのみを含んだクラスをいい、不満足クラスとは、そのメニュー画面において選択されなかったコンテンツのみを含んだクラスをいう。この履歴クラス分離部203は、SVM法またはNN法を用いて、各コンテンツの特性ベクトルを満足クラスと不満足クラスとに分離することができる分離平面を生成することで、これらクラスを分離することができる。ここでSVM(Support Vector Machine)法とは、それぞれのクラスのノード間(特性ベクトル間)の最小距離を最大化する平面を分離平面とする方法であり、NN法とは、それぞれのクラスの重心間、すなわち各コンテンツの特性ベクトルに基づいて算出された、満足クラスの重心と不満足クラスの重心とを結んだ直線を推薦する平面を分離平面とする方法である。なお、NN法においては、必ずしも分離平面を求める必要はなく、不満足クラスの重心から満足クラスへの重心へ向けて結んだ直線をユーザ特性ベクトルとするようにしてもよい。
【0027】
ここで分離平面を生成する具体的な方法について説明する。図4は、携帯電話機100に表示されるメニュー画面の一例を示す説明図である。図4に示すようにNode1〜Node5が表示されている。このNodeは、選択対象項目を示すものであり、例えばウェブ上のメニュー画面におけるカテゴリごとに区別された項目であったり、ウエブページのタイトルである。例えば、Node1が、自動車に関するコンテンツ、Node2が、金融に関するコンテンツなどである。ユーザは、Node1〜Node5のいずれかを選択することにより、対応するコンテンツを閲覧することができる。
【0028】
図5は、分離平面を生成するときの処理概念を示す概念図である。図5は、上述図4におけるメニュー画面のうちユーザが選択したコンテンツおよび選択されなかったコンテンツにおける、特徴空間内における各コンテンツの特性ベクトルの位置関係を示す。図5に示されている通り、円形で示されている部分が満足なコンテンツ(Node3、Node4)であり、三角形で示されている部分が不満足なコンテンツ(Node1、Node2、Node5)であり、四角形で示されている部分が未知の未評価コンテンツ(Node8、Node7)である。これら満足コンテンツと不満足コンテンツとを分離するように生成されたものが分離平面である。ここでは、未評価コンテンツは分離処理する際には考慮されない。なお、図においては、特徴空間を便宜上二次元平面で表現しているが、ベクトルを構成するパラメータ分だけベクトル軸が存在することになり、通常は20次元以上のベクトルで特徴空間は構成されている。
【0029】
ユーザ特性ベクトル計算部204は、履歴クラス分離部203により生成された分離平面に対して直交する直交ベクトルを算出し、これをユーザ特性ベクトルとする部分である。図6にその具体例を示す。図6は、分離平面に基づいてユーザ特性ベクトルを算出するときの概念を示す概念図である。図6に示すように、分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが、ユーザ特性ベクトル計算部204により算出される。ユーザ特性ベクトル計算部204は、閲覧履歴が収集されるたびに計算し、ユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルを更新させる。
【0030】
配信情報格納部205は、オペレータにより予め登録されたコンテンツ、または各ユーザである携帯電話機100〜100cからコンテンツ要求受信部201により受信された配信要求のあったコンテンツを記憶する部分であり、コンテンツ管理テーブル205aを記憶している。図7は、コンテンツ管理テーブル205aの記憶内容を示す説明図である。図7に示すように、このコンテンツ管理テーブル205aは、ユーザID、コンテンツID、カテゴリ、タイトル、およびレコメンド本文を対応付けて記憶している。ユーザIDは、ユーザを特定するための識別情報であり、携帯電話機100〜100cの固有情報などである。コンテンツIDは、コンテンツを一意に特定するための識別情報であり、カテゴリは情報種別を示し、例えばCDに関連するもの、DVDに関連するもの、書籍に関連するもの、テレビ番組に関連するものなどを示すための情報である。タイトルは、レコメンド情報として表示するための見出し情報である。レコメンド情報を配信する際には、このタイトル部分が表示されることになる。レコメンド文は、レコメンド情報の本体部分であり、ユーザに有用な情報である。このコンテンツ管理テーブル205aに記憶される情報は、予めオペレータにより入力されたものでもよいし、自動的にコンテンツプロバイダから検索・抽出され所定のフィルタにより絞り込まれたものであってもよい。
【0031】
類似ユーザ計算部209は、レコメンド要求受信部202により受信されたレコメンド要求にしたがって、当該レコメンド要求を発したユーザuと類似する類似ユーザu’を抽出するために、一のユーザ特性ベクトルwuと他のユーザのユーザ特性ベクトルwu’をそれぞれ抽出して、その類似度を計算する部分である。具体的には、類似ユーザ計算部209は、ユーザ特性ベクトル管理テーブル207aに記憶されている一のユーザ特性ベクトルwuと、他のユーザのユーザ特性ベクトルwu’との内積を計算することにより類似度を算出する。具体的には、式(1)のとおりの式に従って類似度は算出される。
【数1】
【0032】
この他のユーザは、多数存在しており、類似ユーザ計算部209は、類似度が大きい複数の他のユーザのうち上位所定数(例えば、S人分)を類似ユーザとする。なお、一のユーザ、他のユーザのそれぞれのユーザ特性ベクトルは、正規化処理されている。また、ここでは、一のユーザを携帯電話機100のユーザとし、複数の類似ユーザを携帯電話機100a〜100cのユーザとする。
【0033】
新ユーザ特性ベクトル算出部209aは、一のユーザuと複数の類似ユーザu’とのそれぞれの類似度と、類似ユーザu’のユーザ特性ベクトルを構成する各特徴iの特性パラメータWu’,iに基づいて、一のユーザuの新ユーザ特性ベクトルw’uを算出する部分である。具体的には、上述の式(1)に示すとおりに求められた、一のユーザである携帯電話機100のユーザuと類似ユーザu’である携帯電話機100a等のユーザ特性ベクトルwu’との特性ベクトルの類似度を算出し、そのうち類似度の高い上位S人の類似ユーザを求める。
【0034】
そして、新ユーザ特性ベクトル算出部209aは、類似ユーザu’のS人と一のユーザuとのそれぞれの類似度sim(wu,wu’)に基づき、一のユーザuのユーザ特性ベクトルwuを構成する特徴iの特性パラメータWu,iを式(2)の通り算出する。すなわち、新ユーザ特性ベクトル算出部209aは、一のユーザuと類似ユーザu’との類似度sim(wu,wu’)とその類似ユーザu’の特徴iの特性パラメータWu’,iを乗算し、これを上位S人分の類似ユーザ分の累積値を算出する。そして、これを類似度sim(wu,wu’)の全体値における上位S人分の累積値を算出して、除算する。これにより、一のユーザuの特徴iにおける特性パラメータW’u,iを算出することができる。
これを特性パラメータ分だけ行い、各特性パラメータから構成されるベクトルを正規化することにより、新ユーザ特性ベクトルw’uを導出することができる。一般的に特性ベクトルは、数千〜数万の特性パラメータから構成されており、その個数分繰り返し、算出して、これら特性パラメータを用いて一のユーザuの新ユーザ特性ベクトルw’uを生成することができる。
【数2】
【0035】
レコメンド情報生成部210は、配信情報格納部205に記憶されているコンテンツのうち、新ユーザ特性ベクトル算出部209aにより算出された新ユーザ特性ベクトルに基づいて、コンテンツを抽出・評価し、そして評価の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する部分である。
【0036】
履歴格納部207は、各履歴情報を記憶する部分であり、ユーザ特性ベクトル管理テーブル207a、コンテンツ特性ベクトル管理テーブル207b、および閲覧履歴テーブル207cを記憶している。
【0037】
ユーザ特性ベクトル管理テーブル207aは、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルを、ユーザを特定するためのユーザIDと対応付けて記憶する部分である。
【0038】
コンテンツ特性ベクトル管理テーブル207bは、コンテンツ管理テーブル205aに記憶されている、予めオペレータにより登録されたコンテンツの特性ベクトルを、そのコンテンツを特定するための情報(例えばコンテンツID、URLなど)と対応付けて記憶する部分である。例えば、コンテンツ特性ベクトル管理テーブル207bは、図8に示される情報が記憶されている。図8に示すように、コンテンツIDと対応付けて、特性ベクトルを構成するパラメータが複数記憶されている。図8では、8個のパラメータを記載しているが、通常はさらに多くのパラメータから特性ベクトルは構成されている。なお、規定のパラメータ以外に、コンテンツごとに形態素解析にしたがって抽出されたキーワードをパラメータとして追加するようにしてもよい。特性ベクトルを構成するパラメータごとに、0から1の間で数値が記述されており、どの特性ベクトルに特徴を持たせているかを表している。
【0039】
閲覧履歴テーブル207cは、コンテンツ要求受信部201により受信されたあて先または収集されたアクセス履歴情報を記憶する部分であり、例えば、ユーザID、コンテンツID(またはコンテンツのURL)およびそのコンテンツ(閲覧されたもの、閲覧されていないものそれぞれ)の特性ベクトルを対応付けて記憶する部分である。
【0040】
コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信する部分である。例えば、コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信し、またレコメンド要求受信部202に応じて、配信情報格納部205に記憶されているコンテンツまたは閲覧履歴テーブル207cに記憶されている閲覧履歴に記述されたコンテンツに基づいてレコメンド情報生成部210による評価結果にしたがって生成されたレコメンド情報を送信する。
【0041】
このように構成された情報配信サーバ200は、携帯電話機100からの要求に応じて、類似ユーザである携帯電話機100a〜100cの各ユーザのユーザ特性ベクトルに基づいて抽出されたコンテンツを含んだレコメンド情報を配信することができる。よって、ユーザ特性ベクトルに基づいてユーザの類似度を判断し、類似ユーザのユーザ特性ベクトルに基づいて新ユーザ特性ベクトルを生成して、これに基づいてコンテンツをレコメンド情報として配信することで、閲覧履歴が少ない類似ユーザであっても、その類似ユーザの特性にあったコンテンツを抽出することができる。
【0042】
なお、本実施形態では、履歴クラス分離部203およびユーザ特性ベクトル計算部204を用いて、ユーザ特性ベクトルを計算し、これをユーザ特性ベクトル管理テーブル207aに記憶させているが、これに限定するものではなく、固定値としてユーザ特性ベクトル管理テーブル207aにユーザ特性ベクトルを記憶させるようにしてもよい。例えば、この固定値として、アンケート調査などを行った結果に基づいて、人手により生成されたものが考えられる。また、この場合、生成した新ユーザ特性ベクトルと置き換える処理をして、常にユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルは、更新されているように処理してもよい。
【0043】
また、不満足コンテンツの特性ベクトル(不満足特性ベクトル)のみに基づいてユーザ特性ベクトルを逐次計算し、ユーザ特性ベクトル管理テーブル207aに記憶させるようにしてもよい。例えば、履歴クラス分離部203を用いることなく、ユーザ特性ベクトル計算部204は、選択されなかった不満足コンテンツのみに基づいてユーザ特性ベクトルを生成し、ユーザ特性ベクトル管理テーブル207aに記憶させるようにしてもよい。この場合、ユーザ特性ベクトル計算部204は、不満足コンテンツのみに基づいて重心を計算し、これをユーザ特性ベクトルとし、ユーザ特性ベクトル管理テーブル207aに記憶させ、類似ユーザ計算部209は、これに基づいて、類似ユーザを判断することになる。
【0044】
つぎに、携帯電話機100について説明する。図9は、携帯電話機100の機能構成を示すブロック図である。図9に示すとおり、携帯電話機100は、ブラウザ101、履歴送信部102、レコメンド要求送信部103、および配信情報表示部104を含んで構成されている。この携帯電話機100は、CPU、RAM、ROMなどのハードウェアにより構成されており、記憶されているプログラムにしたがってCPUは動作するよう構成されている。具体的には、情報配信サーバ200と同様の構成をとるものであって、図3に示されるハードウェア構成により実現される。以下、各構成について説明する。
【0045】
ブラウザ101は、インターネットに接続するためのアプリケーション部分であり、インターネット上に配置されているサイトに対してアクセスし、サイトに保持されているコンテンツをユーザに閲覧可能にさせるものである。このブラウザ101は、アクセス履歴を保持するように構成される。
【0046】
履歴送信部102は、ブラウザ101を用いてアクセスしたコンテンツのアクセス履歴(同一メニュー画面上において選択されたコンテンツおよび選択されなかったコンテンツを示す情報)を送信する部分である。なお、この履歴送信部102は、情報配信サーバ200側でアクセスのたびに履歴情報を収集する機能を有している場合には、必須の構成ではない。
【0047】
レコメンド要求送信部103は、図示しない操作部をユーザが操作することによりユーザIDとともにレコメンド情報の要求を情報配信サーバ200に送信する部分である。
【0048】
配信情報表示部104は、ブラウザ101により取得されたメニュー画面およびコンテンツ(ウエブページ)を表示する部分である。
【0049】
このように構成された携帯電話機100は、ブラウザ101を用いてインターネットにアクセス可能にするとともに、そのアクセス履歴を保持し、履歴送信部102は、情報配信サーバ200からの要求または所定のタイミングでアクセス履歴を送信することができる。
【0050】
つぎに、これら携帯電話機100および情報配信サーバ200の動作について説明する。図10は、携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。
【0051】
図10に示すとおり、携帯電話機100におけるブラウザ101からの要求に応じて、コンテンツ送信部208により情報配信サーバ200からメニュー画面が配信される(S101)。携帯電話機100のユーザは、そのメニュー画面から任意の一のコンテンツ(上述Nodeに相当)を選択し、携帯電話機100におけるブラウザ101がこれを受け付けると(S102)、コンテンツの接続要求およびそのあて先でURLが情報配信サーバ200に送信される(S103)。
【0052】
情報配信サーバ200では、URLはコンテンツ要求受信部201により受信され、閲覧履歴テーブル207cにアクセス履歴として記憶される。そして、このアクセス履歴に基づいて、ユーザ特性ベクトルの計算がなされ、記憶される(S104)。そして、コンテンツ送信部208によりS103において要求のあったあて先に基づいたコンテンツがコンテンツプロバイダ(図示せず)から取得され、配信される(S105)。なお、ユーザ特性ベクトルの計算処理と、コンテンツの配信処理の順番は逆でもよい。
【0053】
ここでS104におけるユーザ特性ベクトル計算の詳細に処理について説明する。図11は、ユーザ特性ベクトルの計算処理を示すフローチャートである。図11に示すように、まずコンテンツ要求受信部201により受信されたアクセス要求またはアクセス履歴により示されたアクセス履歴情報が、新たに追加されたアクセス履歴として閲覧履歴テーブル207cに記憶される(S201)。
【0054】
そして、履歴クラス分離部203により、この閲覧履歴テーブル207cに記憶されているアクセス履歴情報に基づいて、各満足クラスまたは不満足クラスに属するコンテンツの特性ベクトルが抽出される(S202)。そして、履歴クラス分離部203により、これら特性ベクトルに基づいて満足クラスと不満足クラスとを分離するための分離平面が生成される(S202)。つぎに、ユーザ特性ベクトル計算部204により、生成された分離平面に直交する直交ベクトルが計算され、ユーザ特性ベクトルが求められる(S204)。ここで求められたユーザ特性ベクトルは、ユーザ特性ベクトル管理テーブル207aに保持され、レコメンド情報の配信時において配信情報格納部205に記憶されているコンテンツを評価する際に利用される。
【0055】
つぎに、本実施形態における類似ユーザのユーザ特性ベクトルに基づいて抽出されたコンテンツをレコメンド情報として配信するときの処理について説明する。図12は、レコメンド情報を配信するときのシーケンス図である。図12に示すように、携帯電話機100におけるレコメンド要求送信部103によりユーザIDを含んだレコメンド要求が送信され、このレコメンド要求は情報配信サーバ200におけるレコメンド要求受信部202により受信される(S301)。そして、情報配信サーバ200では、新ユーザ特性ベクトル算出部209aにより、類似ユーザのユーザ特性ベクトルに基づいて新ユーザ特性ベクトルが生成され、レコメンド情報生成部210により、新ユーザ特性ベクトルに基づいたコンテンツの抽出処理が行われる(S302)。ここでは、レコメンド情報生成部210により、コンテンツとの関連度が計算され、高い関連度の順にコンテンツのタイトルを並べたレコメンド情報が生成される。そして、コンテンツ送信部208により、このように生成されたレコメンド情報が配信される(S303)。
【0056】
ここで、S302のレコメンド情報の生成についてさらに詳細な処理について説明する。図13は、レコメンド情報の生成処理を示すフローチャートである。図13に示すように、類似ユーザ計算部209により、レコメンド要求とともに送信されたユーザIDに基づいて、ユーザ特性ベクトル管理テーブル207aから、対応するユーザ特性ベクトルが取得される(S401)。つぎに、類似ユーザ計算部209により、レコメンド要求を発したユーザと他のユーザとの類似度の計算が行われる。すなわち、ユーザのユーザ特性ベクトルと他のユーザのユーザ特性ベクトルとがそれぞれユーザ特性ベクトル管理テーブル207aから抽出され、その内積が計算される。全ての他のユーザとの内積が計算される(S402)。
【0057】
つぎに、新ユーザ特性ベクトル算出部209aにより、類似度の高い(上記の内積値が大きい)上位S人の類似ユーザが求められ、当該類似ユーザの特性ベクトルが取得される(S403)。そして、類似ユーザS人のユーザ特性ベクトルを構成する特性パラメータと類似度との乗算値に基づいてユーザの新たな特性ベクトルである新ユーザ特性ベクトルが生成される(S404)。そして、レコメンド情報生成部210により、生成した新ユーザ特性ベクトルに基づいて、コンテンツが抽出され、関連度の大きい順に並び替えて、レコメンド情報としてユーザ(携帯電話機100)に送信される(S406)。この送信処理は図12のS303に相当する。
【0058】
このように、ユーザ特性ベクトルにしたがって、上位S人の類似ユーザを抽出し、その類似ユーザに基づいて、新ユーザ特性ベクトルを生成し、この新ユーザ特性ベクトルに基づいたコンテンツを抽出して、レコメンド情報として提供することができる。
【0059】
つぎに、上述本実施形態の変形例について説明する。上述式(2)においては、ユーザu’の特性パラメータと、ユーザuとユーザu’との類似度とを乗算した乗算値を算出し、これをユーザu’のS人の乗算値を算出して、その合計値にもとづいたものを、新ユーザ特性ベクトルの一パラメータとしている。
【0060】
しかしながら、S人のユーザu’の中には、ユーザu’それぞれのユーザ特性ベクトルの元となる閲覧履歴の大きさ(閲覧回数)も異なるものであり、一律に扱うことが適当ではない場合もありえる。
【0061】
そこで、本変形例の情報配信サーバ200においては、式(2)にかえて以下の式(3)を適用して、新ユーザ特性ベクトルを生成するようにしてもよい。
【数3】
【0062】
ここでαu’は、例えば、ユーザu’の閲覧履歴の大きさ(閲覧回数)に基づいて定められた係数である。例えば、上位S人のユーザu’の閲覧履歴の大きさにおける比率である。閲覧履歴が大きければ大きいほど、そのユーザu’に対する影響力が大きくなる。
【0063】
このように、閲覧回数の大きさに応じて重み付けをすることにより、より適切な新ユーザ特性ベクトルを生成することができる。
【0064】
<相対空間における分離平面の生成>
以上の分離平面の生成方法は、絶対空間におけるコンテンツの特性ベクトルにしたがって行われたものであるが、より精度高める方法として、相対的な位置関係を求めた相対空間を利用したものも考えられる。以下、相対空間を用いて分離平面を生成する方法について説明する。なお、このときの処理構成は上述と同様であり、履歴クラス分離部203における処理内容が異なるだけである。
【0065】
図14は、履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示し、図14(a)が履歴事象aにおけるメニュー画面を示す図であり、このメニュー画面はNode1からNode3で構成されている。また、図14(b)が履歴事象bにおけるメニュー画面を示す図であり、このメニュー画面はNode6からNode9で構成されている。図14(a)では、Node3が選択されており、図14(b)では、Node9が選択されていることが示されている。
【0066】
図15は、図14で示されたそれぞれのメニュー画面おいて選択されたコンテンツの特性ベクトルの特徴空間における位置関係を示す図である。図15(a)は、履歴事象aにおいて選択されたコンテンツの特徴空間(絶対空間)、図15(b)は、履歴事象bにおいて選択されたコンテンツの特徴空間(絶対空間)を示す図である。上述と同様に、選択されたコンテンツは満足なコンテンツ、選択されなかったコンテンツは不満足なコンテンツと定義され、それぞれ満足クラス、不満足クラスに分類することができる。
【0067】
図16は、それぞれの履歴事象aおよびbを同一特徴空間上に、コンテンツの特性ベクトルを表した図であって、不満足なコンテンツの特性ベクトルを原点に取った場合における満足なコンテンツの特性ベクトルの位置を示す相対空間を表した図である。例えば、Node2とNode3との相対比較、Node1とNode3との相対比較のため、それぞれNode1、Node2を原点とした場合のNode3の位置を表した特徴空間を相対空間としている。より具体的には、Node3の特性ベクトルからNode1の特性ベクトルを減算することにより、相対空間を形成することができる。他のNodeについても同様に、対象となるコンテンツの特性ベクトルを減算する処理を行うことで相対空間を形成することができる。
【0068】
この相対空間において、図16に示すようにこのように満足なコンテンツの特性ベクトル、不満足なコンテンツの特性ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面が、履歴クラス分離部203により生成される。そして、ユーザ特性ベクトル計算部204により、この分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが計算される。
【0069】
このように、履歴事象が異なる場合においても、相対空間を利用してユーザ特性ベクトルを生成することができ、より識別性の高いユーザ特性ベクトルを生成することができる。
【0070】
このように相対空間を用いて分離平面を生成し、それによってユーザ特性ベクトルを生成することができる。ところで、図15から図17については、絶対空間として扱っても分離平面を生成することができるが、分離平面を生成することができない特性ベクトルから構成される特徴空間も考えられる。その場合に、上述した相対空間を利用することにより分離平面を生成することができる。以下、その方法について説明する。
【0071】
図17(a)は、絶対空間におけるコンテンツの特性ベクトルを示した図である。この図17(a)では、Node1とNode4とが同じ事象(メニュー画面)に存在するコンテンツであり、Node2とNode3とが同じ事象に存在するコンテンツであことを前提としている。なお、円形のものが選択されたコンテンツの特性ベクトル(満足クラス)、三角形のものが選択されなかったコンテンツの特性ベクトル(不満足クラス)である。
【0072】
図17(a)から明らかなように、絶対空間においては、このような位置関係をとる特性ベクトルのコンテンツに対しては、分離平面を生成することができない。分離平面は、満足クラスと不満足クラスとを分離するための平面であるためであり、図17(a)の例では、可不足なく両者を分離することができないためである。よって、分離平面を生成することができるように相対的な位置関係を表す相対空間に変換することが必要である。
【0073】
図17(b)では、相対空間内におけるコンテンツの特性ベクトルを表した図であり、Node1およびNode2が同じ位置になるように、図17(b)の例では、Node2を平行移動させるためそのNode2に対応するNode3を平行移動させている。このように相対空間に変換することで、不満足なコンテンツであるNode1(Node2)と、満足なコンテンツであるNode3およびNode4とを分離することができる分離平面vを生成することができる。
【0074】
以上の通り絶対空間では、分離平面を生成することができない場合であっても、相対空間に変換することで分離平面を生成することができ、これによりユーザ特性ベクトルを計算することができる。
【0075】
<閲覧頻度を考慮した分離平面の生成方法>
つぎに、コンテンツの閲覧頻度を用いた重み付け処理を行い、この重み付け処理された特性ベクトルを用いて分離平面を生成するときの履歴クラス分離部203の処理について説明する。なお、ここでは、NN法を用いた分離平面の生成について説明する。
【0076】
図18は、閲覧頻度を考慮して特性ベクトルの重心を求める処理を示す概念図であり、コンテンツc1〜c3の特性ベクトルの位置を表す特徴空間を示す概念図である。コンテンツc1の閲覧頻度は3回、コンテンツc2の閲覧頻度は1回、コンテンツc3の閲覧頻度は10回とする。なお、閲覧履歴テーブル207cは、閲覧されたコンテンツの閲覧履歴、閲覧されていないコンテンツの不閲覧履歴を記憶しておくことが好ましく、それぞれの頻度を保持または計算可能に記憶しておくことが必要である。
【0077】
この場合、これらコンテンツc1〜c3の重心は、以下の式(4)により計算される。
【数4】
なお、ciは閲覧されたコンテンツの特性ベクトル、niは閲覧頻度である。
【0078】
この計算を行うことにより重心が定まる。また、図示していないが閲覧されていないコンテンツについても同様に式(4)を用いて、閲覧さていないコンテンツの特性ベクトルを用いてその重心を求める。そして、閲覧されていないコンテンツの重心から閲覧されたコンテンツの重心に対して結んだ直線をユーザ特性ベクトルとして求めることができる。なお、この直線は、分離平面に直交する直線と同じ向きを取るものであり、分離平面を算出し、この分離平面に直交する直交ベクトルを求めるようにしてもよいが、NN法においては必ずしも分離平面は必要とはならない。
【0079】
これにより、コンテンツの閲覧頻度を利用してユーザ特性ベクトルを求めることができ、閲覧頻度を利用しない場合と比較して、ユーザの嗜好に近いユーザ特性ベクトルを求めることができる。よって、ユーザの嗜好にそったコンテンツの評価を行うことができる。
【0080】
<選択順位を考慮した分離平面の生成方法>
つぎに、閲覧したコンテンツの順番を考慮して分離平面を生成するときの履歴クラス分離部203の処理について説明する。一般的に、直近にアクセスしたコンテンツの方が、その前にアクセスしたコンテンツより重要である、またはユーザの嗜好に近いものであると考えることができる。この時間差が大きくなればなるほど、ユーザの嗜好に変化が生じ、より直近にアクセスしたコンテンツを重要と考えることが顕著となる。ここでは、その時間差(時系列成分)を考慮して分離平面を生成するときの処理について説明する。
【0081】
図19は、履歴クラス分離部203が分離平面を生成する際において、そのアクセスされた時系列順にNN法により分離平面を生成するときの処理を示す説明図であって、図19(a)は、そのときのメニュー画面を示す説明図であり、図19(b)は、ユーザが選択したコンテンツの選択履歴を示す説明図であり、図19(c)は、特徴空間における各コンテンツの特性ベクトルを表した概念図であり、図19(d)は、選択順を考慮した分離平面を生成することを説明するための概念図である。なお、選択履歴は、閲覧履歴テーブル207cに記憶される。
【0082】
図19(a)に示されるように、NodeAからNodeFからメニュー画面が構成されている。ここでは図19(b)に示すようにNodeA、NodeB、NodeCの順にコンテンツが選択されている。よって、NodeA、NodeB、NodeCが満足クラスに分類されるコンテンツとなり、NodeD、NodeE、NodeFが不満足クラスに分類されるコンテンツとなる。
【0083】
つぎに、図19(c)および図19(d)を用いて、分離平面を生成するときの処理を示す概念について説明する。図19(c)に示されるように、NodeAからNodeFは、その特性ベクトルにしたがって特徴空間上に位置づけられている。そして、直近に選択したコンテンツの特性ベクトルの影響が大きくなるように計算される。図19(d)に示されるように、満足クラスにおける重心を求めるため、まず、NodeAとNodeBとの中点w1が計算される。そして、この中点w1とNodeCとの中点w2が計算される。
【0084】
一方、不満足クラスにおいては、NodeD、NodeE、NodeFに基づいて重心w3が計算される。不満足クラスにおいては選択順という概念がないため、通常の処理と同じく、その3つのNodeに基づいた重心w3が計算される。そして、中点w2と重心w3とを結んだ線が垂線となる分離平面vが生成される。なお、本実施形態においてはこの分離平面vに直交する直交ベクトルをユーザ特性ベクトルとするものであり、これは、重心w3から中点w2に向けて結んだ直線と同じである。実施形態での説明の便宜上、分離平面を求めているが、NN法を用いる場合においては分離平面を求めることは必須のものではない。
【0085】
このように、特性ベクトルと特性ベクトルとの中点を算出し、またその中点と特性ベクトルとの中点を算出し、時系列的に順に中点を算出する(NN法を適用する)ことにより、前のアクセス履歴ほど重みが小さくなり、時系列順位を考慮した重心を算出することができる。
【0086】
<操作メニューへの適用>
ところで、上述の各方法では、メニュー画面として、ウエブサイトである情報配信サーバ200から送信されたメニュー画面を例に説明したが、これに限るものではなく、例えば、携帯電話機100の操作メニューに対して、レコメンド情報としてレコメンド操作情報を表示するようにしてもよい。
【0087】
例えば、操作メニューにおける各操作項目に対して、特性ベクトルが割り振られており、ユーザの操作履歴に従って、ユーザ操作に関するユーザ特性ベクトルが生成され、そのユーザ特性ベクトルに基づいて類似ユーザをS人抽出し、そのS人の類似ユーザに基づいて、ユーザの新ユーザ特性ベクトルを生成し、当該新ユーザ特性ベクトルに基づいたレコメンド操作情報を生成するようにしてもよい。この場合、操作履歴は情報配信サーバ200に所定のタイミングで送信され、記憶されるよう構成されている。また、ユーザは類似ユーザの操作履歴を見たい場合にはその旨のレコメンド操作情報要求を行うよう操作することができるよう構成されている。
【0088】
図20は、操作に関する特徴空間における特性ベクトルのパラメータを示す説明図である。図20に示すように、携帯電話機100の端末機能として、「着もじ」「テレビ電話」「ワンセグ」「画面メモ」「テキストメモ」が規定されている。また、特性ベクトルを構成するパラメータとして「電話」「インターネット」「テキスト」「メモ」「テレビ」が規定されている。このように、携帯電話機100の機能に特性ベクトルが規定されている。例えば、「着もじ」には、「電話」「テキスト」のパラメータに1がふられており、電話、テキストに関連のある機能であることが示されている。配信情報格納部205には、類似ユーザが操作した操作履歴情報が記憶され、ユーザが操作メニューを表示するための操作をするときには、その旨が通知される。そして、新ユーザ特性ベクトル算出部209aは、類似ユーザのユーザ特性ベクトルに基づいて、上位S人の類似ユーザを抽出し、当該S人の類似ユーザのユーザ特性ベクトルおよび類似ユーザとユーザとの類似度に基づいて、ユーザの新ユーザ特性ベクトルを生成する。そして、レコメンド情報生成部210は、新ユーザ特性ベクトルに基づいたレコメンド操作情報を生成し、コンテンツ送信部208はそのレコメンド操作情報を送信し、携帯電話機100においてそれを表示させることができる。
【0089】
このように操作メニューに対しても本実施形態の評価方法を適用し、レコメンド操作情報をユーザに提供することで、ユーザがよく使う操作に類似または関連した操作をユーザに通知することができる。
【0090】
つぎに、本実施形態の情報配信サーバ200の作用効果について説明する。この情報配信サーバ200において、ユーザ特性ベクトル計算部204が各ユーザのユーザ特性ベクトルを算出し、類似ユーザ計算部209は、上述算出された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する。そして、類似ユーザ計算部209は、算出された類似度に基づいて一のユーザと類似するS人の類似ユーザを選択し、新ユーザ特性ベクトル算出部209aは、このS人の類似ユーザのユーザ特性ベクトルおよびS人の類似ユーザと対象となるユーザとのそれぞれの類似度に基づいて、新ユーザ特性ベクトルを生成する。レコメンド情報生成部210は、生成された新ユーザ特性ベクトルに基づいて、一のユーザに対するレコメンド情報を生成することができる。
【0091】
これにより、新ユーザ特性ベクトルを用いてコンテンツの抽出を行うことで、従前の方法と比較して、類似ユーザの履歴情報を利用することがなく、類似ユーザの特性に合致したレコメンド情報を生成することができる。
【0092】
また、本実施形態の情報配信サーバ200においては、新ユーザ特性ベクトル算出部209aは、当該複数の類似ユーザのそれぞれの類似度に、類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、一のユーザの新ユーザ特性ベクトルを算出する。例えば、式(2)または(3)にしたがって、新ユーザ特性ベクトルのパラメータを算出し、これに基づいて新ユーザ特性ベクトルを算出することができる。これにより、類似ユーザとの類似度に応じたユーザ特性ベクトルを構成するパラメータを加工することができ、類似ユーザの類似度の影響を適度に与えつつ一のユーザに対する新ユーザ特性ベクトルを生成することができる。よって、一のユーザに対して適切なレコメンド情報を提供することができる。
【0093】
なお、上述の式(2)または(3)においては、類似ユーザとの類似度の絶対値の合計値で、除算する処理を行っているが、これに限るものではなく、予め定めた定数としてもよい。
【0094】
また、乗算値に、類似ユーザに対する類似度の程度若しくは類似ユーザの閲覧履歴における頻度に基づいた所定係数で重み付けを行うことで、その影響力を適切に貸せることができる。
【0095】
また、コンテンツ要求受信部201が、ユーザ操作により、複数の選択対象項目であるメニュー画面から一の選択対象項目であるコンテンツを選択することを受信し、コンテンツ特性ベクトル管理テーブル207bは、選択されたコンテンツの特性ベクトルおよび選択されなかったコンテンツの特性ベクトルを記憶する。そして、履歴クラス分離部203は、記憶されている、選択されたコンテンツの特性ベクトルと選択されなかったコンテンツの特性ベクトルとを分離するための平坦に形成されている分離平面を生成し、ユーザ特性ベクトル計算部204は、生成された分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成することができる。これにより、精度のよいユーザ特性ベクトルを生成することができる。
【符号の説明】
【0096】
100…携帯電話機、100a…携帯電話機、101…ブラウザ、102…履歴送信部、103…レコメンド要求送信部、104…配信情報表示部、200…情報配信サーバ、201…コンテンツ要求受信部、202…レコメンド要求受信部、203…履歴クラス分離部、204…ユーザ特性ベクトル計算部、205…配信情報格納部、205a…コンテンツ管理テーブル、207…履歴格納部、207a…ユーザ特性ベクトル管理テーブル、207b…コンテンツ特性ベクトル管理テーブル、207c…閲覧履歴テーブル、208…コンテンツ送信部、209…類似ユーザ計算部、209a…新ユーザ特性ベクトル算出部、210…レコメンド情報生成部。
【特許請求の範囲】
【請求項1】
各ユーザのユーザ特性ベクトルを取得するベクトル取得手段と、
前記ベクトル取得手段により取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出手段と、
前記類似度算出手段により算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択手段と、
前記選択手段により選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出する算出手段と、
前記算出手段により算出された新ユーザ特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成手段と、
を備えるレコメンド情報生成装置。
【請求項2】
前記選択手段は、上位所定数の類似ユーザを複数選択し、
前記算出手段は、当該複数の類似ユーザのそれぞれの類似度に、前記類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、前記一のユーザの新ユーザ特性ベクトルを算出する
ことを特徴とする請求項1に記載のレコメンド情報生成装置。
【請求項3】
前記算出手段は、前記算出した合計値を、類似ユーザとの類似度の絶対値の合計値で除算したパラメータに基づき一のユーザの新ユーザ特性ベクトルを算出する
ことを特徴とする請求項2に記載のレコメンド情報生成装置。
【請求項4】
前記算出手段は、前記乗算値に、類似ユーザの閲覧履歴の大きさに基づいた所定係数で重み付けを行うことを特徴とする請求項2または3に記載のレコメンド情報生成装置。
【請求項5】
前記ベクトル取得手段は、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、
前記受付手段により受け付けられた選択対象項目の満足特性ベクトルおよび前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルを記憶する記憶手段と、
前記記憶手段により記憶されている選択された選択対象項目の満足特性ベクトルと選択されなかった選択対象項目の不満足特性ベクトルとを分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、
から構成されることを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報生成装置。
【請求項6】
前記ベクトル取得手段は、
ユーザ操作により、複数の選択対象項目から一の選択対象項目が選択されたこと、および選択されなかった選択対象項目を受け付ける受付手段と、
前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成手段と、
から構成されることを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報生成装置。
【請求項7】
各ユーザのユーザ特性ベクトルを取得するベクトル取得ステップと、
前記ベクトル取得ステップにより取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出ステップと、
前記類似度算出ステップにより算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択ステップと、
前記選択ステップにより選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出する算出ステップと、
前記算出ステップにより算出された新ユーザ特性ベクトルに基づいて、前記選択ステップにより選択された類似ユーザの特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成ステップと、
を備えるレコメンド情報生成方法。
【請求項1】
各ユーザのユーザ特性ベクトルを取得するベクトル取得手段と、
前記ベクトル取得手段により取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出手段と、
前記類似度算出手段により算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択手段と、
前記選択手段により選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出する算出手段と、
前記算出手段により算出された新ユーザ特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成手段と、
を備えるレコメンド情報生成装置。
【請求項2】
前記選択手段は、上位所定数の類似ユーザを複数選択し、
前記算出手段は、当該複数の類似ユーザのそれぞれの類似度に、前記類似ユーザのユーザ特性ベクトルを構成するパラメータのそれぞれを乗算した乗算値を算出し、類似ユーザごとに算出された当該乗算値の合計値に基づいて、前記一のユーザの新ユーザ特性ベクトルを算出する
ことを特徴とする請求項1に記載のレコメンド情報生成装置。
【請求項3】
前記算出手段は、前記算出した合計値を、類似ユーザとの類似度の絶対値の合計値で除算したパラメータに基づき一のユーザの新ユーザ特性ベクトルを算出する
ことを特徴とする請求項2に記載のレコメンド情報生成装置。
【請求項4】
前記算出手段は、前記乗算値に、類似ユーザの閲覧履歴の大きさに基づいた所定係数で重み付けを行うことを特徴とする請求項2または3に記載のレコメンド情報生成装置。
【請求項5】
前記ベクトル取得手段は、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、
前記受付手段により受け付けられた選択対象項目の満足特性ベクトルおよび前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルを記憶する記憶手段と、
前記記憶手段により記憶されている選択された選択対象項目の満足特性ベクトルと選択されなかった選択対象項目の不満足特性ベクトルとを分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、
から構成されることを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報生成装置。
【請求項6】
前記ベクトル取得手段は、
ユーザ操作により、複数の選択対象項目から一の選択対象項目が選択されたこと、および選択されなかった選択対象項目を受け付ける受付手段と、
前記受付手段により受け付けられなかった選択対象項目の不満足特性ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成手段と、
から構成されることを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報生成装置。
【請求項7】
各ユーザのユーザ特性ベクトルを取得するベクトル取得ステップと、
前記ベクトル取得ステップにより取得された各ユーザのユーザ特性ベクトルに基づいてユーザ間の類似度を算出する類似度算出ステップと、
前記類似度算出ステップにより算出された類似度に基づいて一のユーザと類似する複数の類似ユーザを選択する選択ステップと、
前記選択ステップにより選択された複数の類似ユーザとのそれぞれの類似度および複数の類似ユーザのユーザ特性ベクトルに基づいて、前記一のユーザの新ユーザ特性ベクトルを算出する算出ステップと、
前記算出ステップにより算出された新ユーザ特性ベクトルに基づいて、前記選択ステップにより選択された類似ユーザの特性ベクトルに基づいて、前記一のユーザに対するレコメンド情報を生成する生成ステップと、
を備えるレコメンド情報生成方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【公開番号】特開2012−242844(P2012−242844A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−108656(P2011−108656)
【出願日】平成23年5月13日(2011.5.13)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願日】平成23年5月13日(2011.5.13)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
[ Back to top ]