情報推薦装置
【課題】
新しく推薦システムの利用を開始した利用者にも適切な推薦をすることができる情報推薦装置を提供する。
【解決手段】
新規利用者の属性に応じてあらかじめ設定されるプロファイル情報と前記新規利用者の
選択対象の項目を管理する第1管理部と、複数の利用者のプロファイル情報と好みを表わす選好情報とを取得する取得部と、前記規利用者のプロファイル情報を用いて前記集合から類似する類似集合を推定する推定部と、分類された前記集合ごとに前記項目に含まれる属性に関するパラメータを算出する算出部と、前記新規利用者の選好情報と新規利用者のプロファイル情報とを用いて前記集合から類似する類似集合を推定する推定部と、前記類似集合の属性に関するパラメータを利用して前記項目の選好度を算出し、前記選好度を用いて推薦する項目を決定する決定部とを有する。
新しく推薦システムの利用を開始した利用者にも適切な推薦をすることができる情報推薦装置を提供する。
【解決手段】
新規利用者の属性に応じてあらかじめ設定されるプロファイル情報と前記新規利用者の
選択対象の項目を管理する第1管理部と、複数の利用者のプロファイル情報と好みを表わす選好情報とを取得する取得部と、前記規利用者のプロファイル情報を用いて前記集合から類似する類似集合を推定する推定部と、分類された前記集合ごとに前記項目に含まれる属性に関するパラメータを算出する算出部と、前記新規利用者の選好情報と新規利用者のプロファイル情報とを用いて前記集合から類似する類似集合を推定する推定部と、前記類似集合の属性に関するパラメータを利用して前記項目の選好度を算出し、前記選好度を用いて推薦する項目を決定する決定部とを有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報推薦装置に関する。
【背景技術】
【0002】
特許文献1では、ユーザの嗜好情報を蓄積するのに長時間を要することなく、初期設定時において簡便かつ短時間でユーザの嗜好情報を抽出し、視聴履歴や録画履歴のない状態においても、ユーザが装置を利用し始めた直後からユーザの嗜好を反映した番組を推薦できる技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007-318364号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
新しく情報推薦装置の利用を開始した利用者にも適切な推薦をすることができる情報推薦装置である。
【課題を解決するための手段】
【0005】
実施形態の情報推薦装置は、第1管理部と、取得部と、分類部と、算出部と、推定部と、決定部とを備える。第1管理部は、新規利用者の属性に応じてあらかじめ設定されるプロファイル情報と前記新規利用者の選択対象の項目を管理する。取得部は、複数の利用者のプロファイル情報と好みを表わす選好情報とを取得する。分類部は、前記複数の利用者の前記プロファイル情報と前記選好情報とを用いて前記複数の利用者を複数の集合に分類する。算出部は、分類された前記集合ごとに前記項目に含まれる属性に関するパラメータを算出する。推定部は、前記新規利用者のプロファイル情報と前記分類情報とを用いて前記集合から類似する類似集合を推定する。決定部は、前記類似集合の属性に関するパラメータを利用して前記項目の選好度を算出し、推薦する項目を決定する。
【図面の簡単な説明】
【0006】
【図1】本実施形態に係る情報推薦装置の構成を示す図。
【図2】本実施形態に係る情報推薦装置の一例を表す図。
【図3】本実施形態に係る映像推薦装置の構成を示す図。
【図4】本実施形態に係るユーザクラスタ作成のフローを示す図。
【図5】本実施形態に係るプロファイル情報入力時の例示す図。
【図6】本実施形態に係る複数の利用者のプロファイル情報の例を示す図。
【図7】本実施形態に係る利用者の選好情報の例を示す図。
【図8】本実施形態に係るユーザクラスタモデルの例を示す図。
【図9】本実施形態に係るユーザクラスタの例を示す図。
【図10】本実施形態に係る類似クラスタを推定するフローを例示する図。
【図11】本実施形態に係るクラスとの類似度を算出する例を示す図。
【図12】本実施形態に係るコンテンツ属性パラメータを算出するフローを例示する図。
【図13】本実施形態に係るコンテンツ属性を例示する図。
【図14】本実施形態に係るコンテンツの属性パラメータを例示する図。
【図15】コンテンツ選好度の算出と推薦するコンテンツ決定のフローを示す図。
【図16】本実施形態に係るコンテンツ選考度の算出を例示する図。
【発明を実施するための形態】
【0007】
利用者集団の選好情報を用いて対象利用者と類似する利用者の好むアイテムを推薦する技術には、協調フィルタリングや、対象利用者の選好情報とアイテム情報を用いて対象利用者の選好アイテムに類似するアイテムを推薦するコンテンツベースフィルタリング、ユーザのプロファイル情報に基づいてアイテム情報とマッチするアイテムを推薦するプロファイルベースフィルタリングが存在する。しかし推薦システムの利用を新しく始めた利用者には適切な推薦をすることが困難である。そこで本実施形態では推薦システムの利用を新たに開始した利用者にも適切な推薦をすることができる情報推薦装置について説明する。
【0008】
図1に本実施形態に係る情報推薦装置10の構成を示す。本実施形態に係る情報推薦装置はプロファイル情報及び選択対象項目を管理する第1管理部101と、取得部102と、分類部103と、算出部104と、推定部105と、決定部106と、選好情報を管理する第2管理部107と、分類された複数の集合に関する情報を管理する第3管理部108と、学習部109と、項目の属性パラメータを管理する第4管理部110とを備える。
【0009】
第1管理部101は新規利用者を分類するために設定されるプロファイル情報と新規利用者の選択対象の項目(項目を以下「アイテム」と称する)を管理する。また、ほぼ同様な情報推薦装置を用いている複数の利用者のプロファイル情報を管理するサーバ等を介して、複数の利用者のプロファイル情報を取得する。
【0010】
取得部102は、利用者のプロファイル情報を第1管理部から取得する。また、ほぼ同様な情報推薦装置を用いている複数の利用者の選好情報を管理するサーバ等を介して、複数の利用者の選好情報を取得する。
【0011】
分類部103は、取得部102から利用者のプロファイル情報と選好情報とを取得し、利用者を複数の集合(集合を以下「クラスタ」と称する)に分類する。分類したクラスタに関する情報(以下「クラスタ情報」と称する)は第3管理部108で管理する。
【0012】
算出部104は、取得部102から得たアイテムに含まれる属性に関するパラメータを、分類部103で分類されたクラスタごとに算出する。アイテムに含まれる属性とは、アイテムを識別するための指標になるもので、例えばアイテムのジャンルを示す情報等をさす。例えばアイテムが映像の場合には、映像の「出演者」や「作者(または製作者)」、アイテムが書籍などの情報をもとにしたものであれば、「著者」や書籍の「ジャンル(またはカテゴリ)」などが属性として含まれる。ここで、属性に関するパラメータを以下「属性パラメータ」と称する。属性パラメータは、学習部109によって事前に学習してもよく、学習されたアイテムの属性パラメータを第4管理部110で管理する。事前に学習されたパラメータは、後述する推定部105の要求に応じて第4管理部110から送ればよい。
【0013】
推定部105は、第1管理部101から得た新規利用者のプロファイル情報と分類部103から得たクラスタ情報とを用いて複数いる他の利用者と類似する類似集合(類似集合を以下「類似クラスタ」と称する)を推定する。クラスタ情報は必要に応じて第3管理部108から得てもよい。
【0014】
決定部106は、推定された類似クラスタが有する属性パラメータを用いて、新規利用者のアイテムに関する選好度を算出し、推薦するアイテムを決定する。決定された推薦するアイテムは提示部に送り、新規の利用者に提示する。提示部は、例えば推薦するアイテムが映像である場合、映像を表示するディスプレイなどの表示装置、推薦するアイテムを選択するために用いられるコントローラーなどに付属した表示部等である。
【0015】
次に、本実施形態に係る情報推薦装置の各手段における動作を図2を用いて説明する。
【0016】
まず第1管理部101は複数の利用者のプロファイル情報とアイテムとをサーバ等を介して取得する(ステップS1)。同様に、複数の利用者の選好情報を取得部102が取得する。(ステップS2)。取得された複数の利用者のプロファイル情報及びアイテムと、複数の利用者の選好情報とから、分類部103は利用者の分類を行う(ステップS3)。利用者が分類されたクラスタ毎に、算出部はアイテム属性パラメータを算出する(ステップS4)。推定部は、第1管理部101から新規利用者のプロファイル情報を得て、新規利用者のプロファイル情報からアイテム属性パラメータをもとに、類似クラスを推定する(ステップS5)。決定部106はアイテム属性パラメータと類似クラスタとから新規利用者のアイテム選好度(選好度)を算出する(ステップS6)。算出されたアイテム選好度に従い新規利用者に推薦するアイテムを決定する(ステップS7)
次に、本実施形態に関する情報推薦装置の詳細について図3を用いてより具体的に説明する。ここでは情報推薦装置の一例である映像コンテンツを推薦する装置を例にする。映像コンテンツを推薦する装置では、利用者の選好にかなう映像を推薦する方法に関して述べているが、対象とする情報は映像でなくてもよい。画像、音楽、生活用品、食品などの一般消費財全般を対象とすることが可能である。また、映像コンテンツの配信装置を対象として説明しているが、コンテンツの表示や操作などが可能なコンテンツを提供する機器であってもよい。
【0017】
図3は、本実施形態に係る映像推薦装置の構成を示している。映像推薦装置は、第1管理部である、映像推薦装置を利用する利用者のプロファイルを管理するプロファイル情報管理部(304)を有する。また、取得部である、映像推薦装置を利用する複数の利用者からのプロファイル情報をネットワークを介して受診する集団プロファイル情報受信部(301)と、受信したプロファイル情報を格納するプロファイル情報格納部(302)と、利用者のプロファイル情報が格納部などに登録されていない場合に、利用者のプロファイル情報を入力するためのプロファイル情報入力部(303)と、複数の利用者の選好情報をネットワーク等を介して受診する集団選好情報受信部(305)と、受信した選好情報を格納する選好情報格納部(306)とを有する。また第2管理部である、新規利用者を含めた利用者の選好情報を管理する選好情報管理部(307)を有する。また、分類部である、複数の利用者を複数のクラスタに分類するクラスタリング部(309)と、クラスタリングを行うために予め格納されているユーザクラスタモデル(308)とを有する。また、第3管理部である、クラスタリングで生成されたユーザクラスタをクラスタ情報を管理するクラスタ情報管理部(310)と、クラスタ情報を格納するクラスタ情報格納部(311)とを有する。また、推定部である、利用者の選好情報と利用者のプロファイル情報とを用いて他の利用者と類似する類似クラスタを推定するクラスタ推定部(312)と、コンテンツの属性に関するパラメータを格納するコンテンツ属性パラメータ格納部(313)とを有する。また、第4管理部である、コンテンツの属性パラメータを分類されたクラスタごとに算出し、管理するコンテンツ属性パラメータ管理部(314)と、クラスタ情報と、コンテンツのメタ情報を格納するコンテンツメタ情報格納部(315)、メタ情報を管理するコンテンツメタ情報管理部(316)とを有する。また、算出部である、コンテンツメタ情報と、コンテンツ属性パラメータ情報とを用いて利用者に対するコンテンツ選好度を計算するコンテンツ選好度計算部(317)を有する。また、決定部である、選好度を用いて推薦するコンテンツ(アイテム)を決定する推薦コンテンツ決定部(318)と、決定した推薦コンテンツを提示し、利用者がコンテンツを選択する、推薦コンテンツ表示・選択部(319)を有する。
【0018】
次に、図面に従い、映像推薦装置の各機能について説明する。図4は、ユーザクラスタを作成する動作フローを示す図である。映像推薦装置では、映像推薦装置で表示可能なコンテンツの情報を受信したり、装置を利用する複数の利用者からの利用者から入力情報を獲得したりするなどして、ユーザクラスタを作成する。ユーザクラスタの作成は推薦するコンテンツを決定する前にあらかじめ作成しておいてもよい。
【0019】
利用者が装置を初めて利用する場合など、プロファイル情報が登録されていない場合には(S401;no)、プロファイル情報入力部303が利用者にプロファイル情報の入力を求める(S402)。ここでプロファイル情報とは、例えば利用者の性別や年代などユーザに関する属性情報である。例えば図5に示すような、年齢や性別を問う入力画面においてプロファイル情報は収集される。プロファイル情報はこれに限らず、取得可能であれば、利用者がよく利用する映像コンテンツのジャンルやよく利用するコンテンツ配信元などをいれてもよく、様々なフォーマットや定義で取得してよい。また、入力はキーボードやリモートコントロールを利用した入力をすればよい。ユーザとインタラクティブなやりとりが可能であれば、ネットワークを利用したオンラインでの入力をしてもよい。また所定の書式で最小限の情報に関して、情報伝達の媒体である磁気テープやフラッシュメモリなどから読み取る等の形で入力してもよい。
【0020】
一方、すでに利用者のプロファイル情報が登録されている場合には(S401;yes)、利用者からの更新要求時に入力を受け付ければよい。プロファイル情報管理部304は、プロファイル情報入力装置303を介して得られた利用者プロファイル情報をプロファイル情報格納部302に格納する。
【0021】
また集団プロファイル情報受信部301は、インターネットなどの回線を通じてサーバ側に蓄積された複数の利用者の集団プロファイル情報を受信する(S403)。プロファイル情報管理部304 は、集団プロファイル情報受信部301によって取得した利用者集団プロファイル情報をプロファイル情報格納部302に格納する(S404)。例えば図6に示すような複数の利用者の年齢と性別が記載された複数のプロファイル情報が獲得される。
【0022】
集団選好情報受信部305は、インターネットなどの回線を通じてサーバ側に蓄積された利用者集団選好情報を受信する(S405)。選好情報管理部307は、集団選好情報受信部305によって取得した集団選好情報を選好情報格納部311に格納する(S406)。例えば図7に示すような選好情報が格納される。ここでは、複数の利用者(ユーザ:Aさん、Dさん、Bさん、Cさん、Fさん、Gさん、Nさん)と映像情報(コンテンツのID:Oc、St、Pr、Ko、Fi、Su、Ga)とを示している例である。ユーザが該当するコンテンツを選択し、視聴した場合に「1」、コンテンツを視聴していない場合に「0」、視聴に関する選好情報が不明な場合には「?」を示している。ここでは視聴の有無を「1」あるいは「0」で示しているが、視聴の有無あるいは視聴情報自体の有無がわかる方法であればよい。またこれらの選好情報は利用者が入力部を介して別途入力してもよいし、予め視聴の履歴を記録しておき、それらをサーバにアップロードするなどして取得してもよい。
【0023】
クラスタリング部309は、選好情報管理部307を介して得られる集団選好情報と、プロファイル情報管理部304を介して得られる集団プロファイル情報と、ユーザクラスタモデルを格納するユーザークラスタモデル格納部308から獲得するユーザクラスタモデルに基づいてユーザをいくつかのグループに分類(クラスタリング)する(S407)。
【0024】
ユーザクラスタモデルは、例えば、図8に示すようなベイジアンネットで表現される。図8におけるユーザクラスタモデルは、プロファイル情報から得られる性別と年齢とをもとに利用者の各クラスタに属する確率を計算する。そして最も確率が高いクラスタに利用者を分類する。本実施例では、図7に示した利用者の集合を図9に示すような3つのユーザグループに分割し、クラスタ情報を獲得する例を示している。ここではベイジアンネットを用いたユーザクラスタモデルを記述したが、モデル記述方法はこれに限定されるものではない。また、あらかじめ人手で作成したユーザクラスタモデルをもとにユーザをクラスタに分割したが、例えばk-means などのユーザクラスタリング手法を用いて計算機で自動的にクラスタを作成する手法でもよい。
【0025】
クラスタ情報管理部310は、クラスタリング部309で生成されたユーザクラスタをクラスタ情報格納部311に格納する(S408)。クラスタ情報格納部311に既にクラスタ情報が存在する場合には、クラスタ情報データベースを更新する。
【0026】
次に、利用者情報と類似するクラスタ(類似クラスタ)を推定するクラスタ推定部312について説明する。図10は類似クラスタを推定する動作フローを示す図である。クラスタ推定部312は、プロファイル情報管理部304を介して得られるプロファイル情報(S1001)と、選好情報管理部207を介して得られる選好情報(S1002)と、クラスタ情報管理部310を介して得られるクラスタ情報を読み込む(S1003)。クラスタ推定部312はプロファイル情報と選好情報とクラスタ情報とを用いて利用者と各クラスタとの類似度を計算する(S1004)。
【0027】
ここで、新規に利用を開始した利用者に対しては、選好情報が少ない。そのため複数の利用者プロファイル情報に加えて利用者選好情報も用いてクラスタとの類似度を求める。図11は他の利用者のクラスタとの類似度を求める場合の例を示している。利用者はAさん、Dさん、Bさん、Cさん、Fさん、Gさん、Nさんに加え、新規利用者(対象利用者)がいる。各利用者のプロファイル情報として、年齢及び性別が取得されており、Aさん、Dさんがクラスタ1、Bさん、Cさん、Fさんがクラスタ2、Gさん、Nさんがクラスタ3であるとする。コンテンツの種類はコンテンツIDがOc、St、Pr、Ko、Fi、Su、Gaの7種類に対して、各利用者が視聴した場合を「1」、視聴しなかった場合を「0」、情報がない場合を「?」としている。
【0028】
まず、利用者とクラスタとの類似度計算に各クラスタに属する利用者の選好情報、プロファイル情報をもとにクラスタ中心を求める。(Oc,St,Pr,Ko,Fi,Su,Ga)に関するクラスタ1のクラスタ中心は(1,1,0,0,0.5,0,0.5,20,F)、クラスタ2では(0,0.67,1,1,0,0.33,0,30,F)、クラスタ3では(1,0,0,0,1,0.5,1,40,M)である。クラスタ中心は、新規利用者と各クラスタに属する利用者の選好情報とを比較するために用いる。したがって、クラスタ中心としては、平均値、中央値、加重平均等を用いればよい。
【0029】
そしてクラスタ中心と利用者プロファイル情報及び利用者選好情報とのユークリッド距離を計算し、その逆数をとることによって類似度とする。利用対象者である新規ユーザは(?,1,?,?,?,?,?,30,F)であるので、クラスタ1、クラスタ2、クラスタ3の類似度はそれぞれ、1.0、3.0、0.577である。したがって、新規ユーザはクラスタ2が類似クラスタであると推定できる。ここではユークリッド距離の逆数を用いたが、類似度計算手法はクラスタと新規ユーザとの類似度が算出できるものであればよい。
【0030】
上記は新規に利用を開始した利用者の選好情報が少ない場合を例示したが、選好情報がない場合でも、新規利用者もプロファイル情報を得て類似するユーザクラスタを同様に求めることが可能である。この場合、新規利用者のプロファイル情報と複数の利用者プロファイル情報から類似するクラスタを求めればよい。
【0031】
クラスタ情報管理部310は、クラスタ推定部312で計算された利用者とクラスタとの類似度をクラスタ情報格納部311に格納する。クラスタ情報格納部311に既に類似度が存在する場合には、クラスタ情報データベースを更新する(S1005)。ユーザプロファイルを導入することによって少ない情報からクラスタ推定精度を上げることが可能である。
【0032】
次に、コンテンツを推定する動作について詳細に説明する。コンテンツ属性パラメータは予め用意されたものを使用してもよく、本実施形態では学習部109において予め算出したものを用いる。図12はコンテンツ属性パラメータを算出する動作フローを示した図である。コンテンツ属性パラメータの学習では、学習部が選好情報管理部307を介して得られる利用者選好情報(S1201)と、コンテンツメタ情報管理部316を介して得られるコンテンツメタ情報(S1202) と、クラスタ情報管理部310を介して得られるクラスタ情報(S1203)を読み込む。ここで、コンテンツメタ情報はインターネットなどの回線を通じてサーバ側に蓄積されたコンテンツに関する情報を受信するコンテンツ情報受信部を通じて得られる。あるいは、CD(Compact Disc)、DVD(Digital Versatile Disc)、フラッシュメモリなどの様々な情報伝達の媒体から装置に入力される等の形でもよい。
【0033】
また、コンテンツメタ情報から得られるコンテンツ属性とは、例えば図13に挙げるように、コンテンツのジャンル情報(アニメ、恋愛などをテーマにしたコメディ(ラブコメと表示)、アクション)などである。
【0034】
図12に戻る。学習部109は各クラスタに属する利用者のコンテンツ選好情報の平均値を求め(S1204)、コンテンツ属性の加重値を計算してそれらを平滑化することによって算出する(S1205)。例えば、平均値と選好する属性の出現頻度に応じた加重値を用いて属性パラメータを算出してもよい。コンテンツ属性パラメータの計算方法には、その他にも様々な方法の適用が考えられ、任意の計算方法でかまわない。コンテンツ属性パラメータ管理部314 は、コンテンツ属性パラメータの学習部109で計算されたコンテンツ属性パラメータをコンテンツ属性パラメータ格納部313に格納する(S1206)。コンテンツ属性パラメータデータベース に既に値が存在する場合には、コンテンツ属性パラメータ格納部313の属性パラメータを更新する。
【0035】
図14は、図11のクラスタと図13のコンテンツ属性とが得られた場合のコンテンツの属性パラメータの詳細である。例えば(Oc,St,Pr,Ko,Fi,Su,Ga)のコンテンツ選好情報平均をクラスタ毎に算出すると、クラスタ1は(1,1,0,0,0.5,0,0.5)、クラスタ2では(0,0.67,1,1,0,0.33,0)、クラスタ3では(1,0,0,0,1,0.5,1)となる。一方、コンテンツ属性に関するクラスタ毎のの加重平均は、クラスタ1では(1.5,0.0,1.5)、クラスタ2では(0.0,2.0,1.0)、クラスタ3では(2.0,0.0,1.5)となる。さらに、コンテンツ属性パラメータは、ベクトルの和が均一になるようにする。例えば1になるように処理するとベクトル和が均一になるが、数値は適宜せってすればよい。クラス毎にクラスタ1のパラメータW1(0.5,0,0.5)、クラスタ2のW2(0,0.67,0.33)、クラスタ3のパラメータW3(0.57,0,0.43)として算出される。
【0036】
次に、コンテンツ選好度の算出と推薦するコンテンツ決定について図15に従い説明する。推定部105(コンテンツ選好度計算部317)は、クラスタ情報管理部310 を介して得られるクラスタ情報(S1501) と、コンテンツメタ情報管理部316を介して得られるコンテンツメタ情報(S1502) と、コンテンツ属性パラメータ管理部314 を介して得られるコンテンツ属性パラメータ情報と(S1503) を読み込み、利用者に対するコンテンツ選好度を計算する(S1504)。コンテンツ選好度は、例えば図16 に示すように、利用者の選好情報のないアイテムについて、利用者と最も類似するクラスタのコンテンツ属性パラメータとコンテンツ属性値の積で求めることができる。コンテンツ属性値とは、コンテンツメタ情報から得られる値である。図16では、ジャンル情報から得られたコンテンツ属性を示している。例えば、コンテンツFiのコンテンツ属性値は(0,0,1)である。例えばクラスタ2についてのコンテンツFiのコンテンツ属性値は0×0+0.67×0+0.33×1=0.33である。コンテンツ選好度には、その他にも様々な方法の適用が考えられ、利用者がすでに視聴したコンテンツと類似する属性値を持つコンテンツのコンテンツ選好度を高くするなどの任意の計算方法を用いてもよい。
【0037】
決定部106(推薦コンテンツ決定部318) は、コンテンツ選好度計算部317で算出されたコンテンツ選好度の値の大きいコンテンツを利用者へ推薦するコンテンツに決定する(S1505)。推薦コンテンツを選択する場合は、任意の閾値以上のコンテンツ選好度を持つコンテンツ、あるいは任意の件数のコンテンツなどの条件を設ければ良い。図16ではコンテンツ選好度計算部317によって算出された、全てのコンテンツ選好度を比較し、最も大きい選好度を有するコンテンツPrやコンテンツ Koを推薦するコンテンツとして決定する例である。推薦コンテンツ表示・選択部319 は、推薦コンテンツ決定部318で決定された推薦コンテンツを、コンテンツメタ情報管理部316 を介して得られるコンテンツメタ情報を用いて装置の表示部に提示する(S1506)。利用者が装置上に表示された推薦コンテンツの中から任意のコンテンツを選択すると(S1507)、映像装置がインターネットなどの回線を通じてサーバ側に蓄積されたコンテンツに関する情報を受信するコンテンツ情報受信部を通じて得られるコンテンツの映像を放映する(S1508)。推薦コンテンツ表示・選択部319は、利用者が選択したコンテンツ情報を利用者の選好情報として選好情報管理部307に送る。選好情報管理部307は選好情報格納部306に格納する。映像情報は、インターネットなどの回線を通じてサーバ側から獲得する形態に限らず、CD、DVD、フラッシュメモリなどの様々な情報伝達の媒体から装置に入力される等の形でもかまわない。
【0038】
選好情報が更新された場合には、更新に応じて情報推薦装置の各部における、選好情報を更新して、推薦するコンテンツを決定することが可能である。例えば、第2管理部107である、選好情報管理部307は、利用者の新たな選好情報をもとに、選好情報格納部306の利用者毎の選好情報を更新してもよい。また、算出部104はコンテンツ属性パラメータはコンテンツメタ情報の更新や、選好度の更新に伴ってコンテンツ属性パラメータを算出して更新してもよい。
【0039】
また、選好情報が更新された場合に、推定部105は対象となる利用者のプロファイル情報に加え、利用者の選好情報を用いて推定してもよい。この場合、クラスタの選好情報に新規利用者の選択対象のアイテムが予め決められた数以上ある場合には、分類部103(クラスタリング部)は利用者の分類(クラスタリング)を再度行い、算出部104(コンテンツ属性パラメータ管理部)は属性パラメータを再度算出する。また、算出部104(コンテンツ属性パラメータ管理部)は新規利用者の選好情報のみを用いてアイテムの属性パラメータを算出してもよい。
【0040】
本実施の形態にかかる情報推薦装置は、CPU(Central Processing Unit)などの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、ネットワークなどに接続して通信を行う通信I/Fと、HDD(Hard Disk Drive)、CD(Compact Disc)ドライブ装置などの外部記憶装置と、ディスプレイ装置などの情報推薦のために提示を行う表示装置と、オペレータが識別処理や結果取得などを行うためのキーボードやマウスなどの入力装置と、各部を接続するバスを備えており、通常のコンピュータを利用したハードウェア構成となっている。
【0041】
本実施の形態にかかる情報推薦装置で実行され推薦処理プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供することが可能である。
【0042】
また、本実施の形態にかかる情報推薦装置で実行される推薦処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施の形態にかかる情報推薦装置で実行される処理プログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0043】
また、本実施の形態の処理プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
【0044】
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。例えば食料品や雑貨や本などの日常生活用品、映画や音楽などの電子コンテンツなどのあらゆるアイテムの推薦に適用することが可能である。
【符号の説明】
【0045】
101・・・第1管理部、102・・・取得部、103・・・分類部、104・・・算出部、105・・・推定部、106・・・決定部、107・・・第2管理部、108・・第3管理部、109・・・学習部、110・・・第4管理部
【技術分野】
【0001】
本発明の実施形態は、情報推薦装置に関する。
【背景技術】
【0002】
特許文献1では、ユーザの嗜好情報を蓄積するのに長時間を要することなく、初期設定時において簡便かつ短時間でユーザの嗜好情報を抽出し、視聴履歴や録画履歴のない状態においても、ユーザが装置を利用し始めた直後からユーザの嗜好を反映した番組を推薦できる技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007-318364号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
新しく情報推薦装置の利用を開始した利用者にも適切な推薦をすることができる情報推薦装置である。
【課題を解決するための手段】
【0005】
実施形態の情報推薦装置は、第1管理部と、取得部と、分類部と、算出部と、推定部と、決定部とを備える。第1管理部は、新規利用者の属性に応じてあらかじめ設定されるプロファイル情報と前記新規利用者の選択対象の項目を管理する。取得部は、複数の利用者のプロファイル情報と好みを表わす選好情報とを取得する。分類部は、前記複数の利用者の前記プロファイル情報と前記選好情報とを用いて前記複数の利用者を複数の集合に分類する。算出部は、分類された前記集合ごとに前記項目に含まれる属性に関するパラメータを算出する。推定部は、前記新規利用者のプロファイル情報と前記分類情報とを用いて前記集合から類似する類似集合を推定する。決定部は、前記類似集合の属性に関するパラメータを利用して前記項目の選好度を算出し、推薦する項目を決定する。
【図面の簡単な説明】
【0006】
【図1】本実施形態に係る情報推薦装置の構成を示す図。
【図2】本実施形態に係る情報推薦装置の一例を表す図。
【図3】本実施形態に係る映像推薦装置の構成を示す図。
【図4】本実施形態に係るユーザクラスタ作成のフローを示す図。
【図5】本実施形態に係るプロファイル情報入力時の例示す図。
【図6】本実施形態に係る複数の利用者のプロファイル情報の例を示す図。
【図7】本実施形態に係る利用者の選好情報の例を示す図。
【図8】本実施形態に係るユーザクラスタモデルの例を示す図。
【図9】本実施形態に係るユーザクラスタの例を示す図。
【図10】本実施形態に係る類似クラスタを推定するフローを例示する図。
【図11】本実施形態に係るクラスとの類似度を算出する例を示す図。
【図12】本実施形態に係るコンテンツ属性パラメータを算出するフローを例示する図。
【図13】本実施形態に係るコンテンツ属性を例示する図。
【図14】本実施形態に係るコンテンツの属性パラメータを例示する図。
【図15】コンテンツ選好度の算出と推薦するコンテンツ決定のフローを示す図。
【図16】本実施形態に係るコンテンツ選考度の算出を例示する図。
【発明を実施するための形態】
【0007】
利用者集団の選好情報を用いて対象利用者と類似する利用者の好むアイテムを推薦する技術には、協調フィルタリングや、対象利用者の選好情報とアイテム情報を用いて対象利用者の選好アイテムに類似するアイテムを推薦するコンテンツベースフィルタリング、ユーザのプロファイル情報に基づいてアイテム情報とマッチするアイテムを推薦するプロファイルベースフィルタリングが存在する。しかし推薦システムの利用を新しく始めた利用者には適切な推薦をすることが困難である。そこで本実施形態では推薦システムの利用を新たに開始した利用者にも適切な推薦をすることができる情報推薦装置について説明する。
【0008】
図1に本実施形態に係る情報推薦装置10の構成を示す。本実施形態に係る情報推薦装置はプロファイル情報及び選択対象項目を管理する第1管理部101と、取得部102と、分類部103と、算出部104と、推定部105と、決定部106と、選好情報を管理する第2管理部107と、分類された複数の集合に関する情報を管理する第3管理部108と、学習部109と、項目の属性パラメータを管理する第4管理部110とを備える。
【0009】
第1管理部101は新規利用者を分類するために設定されるプロファイル情報と新規利用者の選択対象の項目(項目を以下「アイテム」と称する)を管理する。また、ほぼ同様な情報推薦装置を用いている複数の利用者のプロファイル情報を管理するサーバ等を介して、複数の利用者のプロファイル情報を取得する。
【0010】
取得部102は、利用者のプロファイル情報を第1管理部から取得する。また、ほぼ同様な情報推薦装置を用いている複数の利用者の選好情報を管理するサーバ等を介して、複数の利用者の選好情報を取得する。
【0011】
分類部103は、取得部102から利用者のプロファイル情報と選好情報とを取得し、利用者を複数の集合(集合を以下「クラスタ」と称する)に分類する。分類したクラスタに関する情報(以下「クラスタ情報」と称する)は第3管理部108で管理する。
【0012】
算出部104は、取得部102から得たアイテムに含まれる属性に関するパラメータを、分類部103で分類されたクラスタごとに算出する。アイテムに含まれる属性とは、アイテムを識別するための指標になるもので、例えばアイテムのジャンルを示す情報等をさす。例えばアイテムが映像の場合には、映像の「出演者」や「作者(または製作者)」、アイテムが書籍などの情報をもとにしたものであれば、「著者」や書籍の「ジャンル(またはカテゴリ)」などが属性として含まれる。ここで、属性に関するパラメータを以下「属性パラメータ」と称する。属性パラメータは、学習部109によって事前に学習してもよく、学習されたアイテムの属性パラメータを第4管理部110で管理する。事前に学習されたパラメータは、後述する推定部105の要求に応じて第4管理部110から送ればよい。
【0013】
推定部105は、第1管理部101から得た新規利用者のプロファイル情報と分類部103から得たクラスタ情報とを用いて複数いる他の利用者と類似する類似集合(類似集合を以下「類似クラスタ」と称する)を推定する。クラスタ情報は必要に応じて第3管理部108から得てもよい。
【0014】
決定部106は、推定された類似クラスタが有する属性パラメータを用いて、新規利用者のアイテムに関する選好度を算出し、推薦するアイテムを決定する。決定された推薦するアイテムは提示部に送り、新規の利用者に提示する。提示部は、例えば推薦するアイテムが映像である場合、映像を表示するディスプレイなどの表示装置、推薦するアイテムを選択するために用いられるコントローラーなどに付属した表示部等である。
【0015】
次に、本実施形態に係る情報推薦装置の各手段における動作を図2を用いて説明する。
【0016】
まず第1管理部101は複数の利用者のプロファイル情報とアイテムとをサーバ等を介して取得する(ステップS1)。同様に、複数の利用者の選好情報を取得部102が取得する。(ステップS2)。取得された複数の利用者のプロファイル情報及びアイテムと、複数の利用者の選好情報とから、分類部103は利用者の分類を行う(ステップS3)。利用者が分類されたクラスタ毎に、算出部はアイテム属性パラメータを算出する(ステップS4)。推定部は、第1管理部101から新規利用者のプロファイル情報を得て、新規利用者のプロファイル情報からアイテム属性パラメータをもとに、類似クラスを推定する(ステップS5)。決定部106はアイテム属性パラメータと類似クラスタとから新規利用者のアイテム選好度(選好度)を算出する(ステップS6)。算出されたアイテム選好度に従い新規利用者に推薦するアイテムを決定する(ステップS7)
次に、本実施形態に関する情報推薦装置の詳細について図3を用いてより具体的に説明する。ここでは情報推薦装置の一例である映像コンテンツを推薦する装置を例にする。映像コンテンツを推薦する装置では、利用者の選好にかなう映像を推薦する方法に関して述べているが、対象とする情報は映像でなくてもよい。画像、音楽、生活用品、食品などの一般消費財全般を対象とすることが可能である。また、映像コンテンツの配信装置を対象として説明しているが、コンテンツの表示や操作などが可能なコンテンツを提供する機器であってもよい。
【0017】
図3は、本実施形態に係る映像推薦装置の構成を示している。映像推薦装置は、第1管理部である、映像推薦装置を利用する利用者のプロファイルを管理するプロファイル情報管理部(304)を有する。また、取得部である、映像推薦装置を利用する複数の利用者からのプロファイル情報をネットワークを介して受診する集団プロファイル情報受信部(301)と、受信したプロファイル情報を格納するプロファイル情報格納部(302)と、利用者のプロファイル情報が格納部などに登録されていない場合に、利用者のプロファイル情報を入力するためのプロファイル情報入力部(303)と、複数の利用者の選好情報をネットワーク等を介して受診する集団選好情報受信部(305)と、受信した選好情報を格納する選好情報格納部(306)とを有する。また第2管理部である、新規利用者を含めた利用者の選好情報を管理する選好情報管理部(307)を有する。また、分類部である、複数の利用者を複数のクラスタに分類するクラスタリング部(309)と、クラスタリングを行うために予め格納されているユーザクラスタモデル(308)とを有する。また、第3管理部である、クラスタリングで生成されたユーザクラスタをクラスタ情報を管理するクラスタ情報管理部(310)と、クラスタ情報を格納するクラスタ情報格納部(311)とを有する。また、推定部である、利用者の選好情報と利用者のプロファイル情報とを用いて他の利用者と類似する類似クラスタを推定するクラスタ推定部(312)と、コンテンツの属性に関するパラメータを格納するコンテンツ属性パラメータ格納部(313)とを有する。また、第4管理部である、コンテンツの属性パラメータを分類されたクラスタごとに算出し、管理するコンテンツ属性パラメータ管理部(314)と、クラスタ情報と、コンテンツのメタ情報を格納するコンテンツメタ情報格納部(315)、メタ情報を管理するコンテンツメタ情報管理部(316)とを有する。また、算出部である、コンテンツメタ情報と、コンテンツ属性パラメータ情報とを用いて利用者に対するコンテンツ選好度を計算するコンテンツ選好度計算部(317)を有する。また、決定部である、選好度を用いて推薦するコンテンツ(アイテム)を決定する推薦コンテンツ決定部(318)と、決定した推薦コンテンツを提示し、利用者がコンテンツを選択する、推薦コンテンツ表示・選択部(319)を有する。
【0018】
次に、図面に従い、映像推薦装置の各機能について説明する。図4は、ユーザクラスタを作成する動作フローを示す図である。映像推薦装置では、映像推薦装置で表示可能なコンテンツの情報を受信したり、装置を利用する複数の利用者からの利用者から入力情報を獲得したりするなどして、ユーザクラスタを作成する。ユーザクラスタの作成は推薦するコンテンツを決定する前にあらかじめ作成しておいてもよい。
【0019】
利用者が装置を初めて利用する場合など、プロファイル情報が登録されていない場合には(S401;no)、プロファイル情報入力部303が利用者にプロファイル情報の入力を求める(S402)。ここでプロファイル情報とは、例えば利用者の性別や年代などユーザに関する属性情報である。例えば図5に示すような、年齢や性別を問う入力画面においてプロファイル情報は収集される。プロファイル情報はこれに限らず、取得可能であれば、利用者がよく利用する映像コンテンツのジャンルやよく利用するコンテンツ配信元などをいれてもよく、様々なフォーマットや定義で取得してよい。また、入力はキーボードやリモートコントロールを利用した入力をすればよい。ユーザとインタラクティブなやりとりが可能であれば、ネットワークを利用したオンラインでの入力をしてもよい。また所定の書式で最小限の情報に関して、情報伝達の媒体である磁気テープやフラッシュメモリなどから読み取る等の形で入力してもよい。
【0020】
一方、すでに利用者のプロファイル情報が登録されている場合には(S401;yes)、利用者からの更新要求時に入力を受け付ければよい。プロファイル情報管理部304は、プロファイル情報入力装置303を介して得られた利用者プロファイル情報をプロファイル情報格納部302に格納する。
【0021】
また集団プロファイル情報受信部301は、インターネットなどの回線を通じてサーバ側に蓄積された複数の利用者の集団プロファイル情報を受信する(S403)。プロファイル情報管理部304 は、集団プロファイル情報受信部301によって取得した利用者集団プロファイル情報をプロファイル情報格納部302に格納する(S404)。例えば図6に示すような複数の利用者の年齢と性別が記載された複数のプロファイル情報が獲得される。
【0022】
集団選好情報受信部305は、インターネットなどの回線を通じてサーバ側に蓄積された利用者集団選好情報を受信する(S405)。選好情報管理部307は、集団選好情報受信部305によって取得した集団選好情報を選好情報格納部311に格納する(S406)。例えば図7に示すような選好情報が格納される。ここでは、複数の利用者(ユーザ:Aさん、Dさん、Bさん、Cさん、Fさん、Gさん、Nさん)と映像情報(コンテンツのID:Oc、St、Pr、Ko、Fi、Su、Ga)とを示している例である。ユーザが該当するコンテンツを選択し、視聴した場合に「1」、コンテンツを視聴していない場合に「0」、視聴に関する選好情報が不明な場合には「?」を示している。ここでは視聴の有無を「1」あるいは「0」で示しているが、視聴の有無あるいは視聴情報自体の有無がわかる方法であればよい。またこれらの選好情報は利用者が入力部を介して別途入力してもよいし、予め視聴の履歴を記録しておき、それらをサーバにアップロードするなどして取得してもよい。
【0023】
クラスタリング部309は、選好情報管理部307を介して得られる集団選好情報と、プロファイル情報管理部304を介して得られる集団プロファイル情報と、ユーザクラスタモデルを格納するユーザークラスタモデル格納部308から獲得するユーザクラスタモデルに基づいてユーザをいくつかのグループに分類(クラスタリング)する(S407)。
【0024】
ユーザクラスタモデルは、例えば、図8に示すようなベイジアンネットで表現される。図8におけるユーザクラスタモデルは、プロファイル情報から得られる性別と年齢とをもとに利用者の各クラスタに属する確率を計算する。そして最も確率が高いクラスタに利用者を分類する。本実施例では、図7に示した利用者の集合を図9に示すような3つのユーザグループに分割し、クラスタ情報を獲得する例を示している。ここではベイジアンネットを用いたユーザクラスタモデルを記述したが、モデル記述方法はこれに限定されるものではない。また、あらかじめ人手で作成したユーザクラスタモデルをもとにユーザをクラスタに分割したが、例えばk-means などのユーザクラスタリング手法を用いて計算機で自動的にクラスタを作成する手法でもよい。
【0025】
クラスタ情報管理部310は、クラスタリング部309で生成されたユーザクラスタをクラスタ情報格納部311に格納する(S408)。クラスタ情報格納部311に既にクラスタ情報が存在する場合には、クラスタ情報データベースを更新する。
【0026】
次に、利用者情報と類似するクラスタ(類似クラスタ)を推定するクラスタ推定部312について説明する。図10は類似クラスタを推定する動作フローを示す図である。クラスタ推定部312は、プロファイル情報管理部304を介して得られるプロファイル情報(S1001)と、選好情報管理部207を介して得られる選好情報(S1002)と、クラスタ情報管理部310を介して得られるクラスタ情報を読み込む(S1003)。クラスタ推定部312はプロファイル情報と選好情報とクラスタ情報とを用いて利用者と各クラスタとの類似度を計算する(S1004)。
【0027】
ここで、新規に利用を開始した利用者に対しては、選好情報が少ない。そのため複数の利用者プロファイル情報に加えて利用者選好情報も用いてクラスタとの類似度を求める。図11は他の利用者のクラスタとの類似度を求める場合の例を示している。利用者はAさん、Dさん、Bさん、Cさん、Fさん、Gさん、Nさんに加え、新規利用者(対象利用者)がいる。各利用者のプロファイル情報として、年齢及び性別が取得されており、Aさん、Dさんがクラスタ1、Bさん、Cさん、Fさんがクラスタ2、Gさん、Nさんがクラスタ3であるとする。コンテンツの種類はコンテンツIDがOc、St、Pr、Ko、Fi、Su、Gaの7種類に対して、各利用者が視聴した場合を「1」、視聴しなかった場合を「0」、情報がない場合を「?」としている。
【0028】
まず、利用者とクラスタとの類似度計算に各クラスタに属する利用者の選好情報、プロファイル情報をもとにクラスタ中心を求める。(Oc,St,Pr,Ko,Fi,Su,Ga)に関するクラスタ1のクラスタ中心は(1,1,0,0,0.5,0,0.5,20,F)、クラスタ2では(0,0.67,1,1,0,0.33,0,30,F)、クラスタ3では(1,0,0,0,1,0.5,1,40,M)である。クラスタ中心は、新規利用者と各クラスタに属する利用者の選好情報とを比較するために用いる。したがって、クラスタ中心としては、平均値、中央値、加重平均等を用いればよい。
【0029】
そしてクラスタ中心と利用者プロファイル情報及び利用者選好情報とのユークリッド距離を計算し、その逆数をとることによって類似度とする。利用対象者である新規ユーザは(?,1,?,?,?,?,?,30,F)であるので、クラスタ1、クラスタ2、クラスタ3の類似度はそれぞれ、1.0、3.0、0.577である。したがって、新規ユーザはクラスタ2が類似クラスタであると推定できる。ここではユークリッド距離の逆数を用いたが、類似度計算手法はクラスタと新規ユーザとの類似度が算出できるものであればよい。
【0030】
上記は新規に利用を開始した利用者の選好情報が少ない場合を例示したが、選好情報がない場合でも、新規利用者もプロファイル情報を得て類似するユーザクラスタを同様に求めることが可能である。この場合、新規利用者のプロファイル情報と複数の利用者プロファイル情報から類似するクラスタを求めればよい。
【0031】
クラスタ情報管理部310は、クラスタ推定部312で計算された利用者とクラスタとの類似度をクラスタ情報格納部311に格納する。クラスタ情報格納部311に既に類似度が存在する場合には、クラスタ情報データベースを更新する(S1005)。ユーザプロファイルを導入することによって少ない情報からクラスタ推定精度を上げることが可能である。
【0032】
次に、コンテンツを推定する動作について詳細に説明する。コンテンツ属性パラメータは予め用意されたものを使用してもよく、本実施形態では学習部109において予め算出したものを用いる。図12はコンテンツ属性パラメータを算出する動作フローを示した図である。コンテンツ属性パラメータの学習では、学習部が選好情報管理部307を介して得られる利用者選好情報(S1201)と、コンテンツメタ情報管理部316を介して得られるコンテンツメタ情報(S1202) と、クラスタ情報管理部310を介して得られるクラスタ情報(S1203)を読み込む。ここで、コンテンツメタ情報はインターネットなどの回線を通じてサーバ側に蓄積されたコンテンツに関する情報を受信するコンテンツ情報受信部を通じて得られる。あるいは、CD(Compact Disc)、DVD(Digital Versatile Disc)、フラッシュメモリなどの様々な情報伝達の媒体から装置に入力される等の形でもよい。
【0033】
また、コンテンツメタ情報から得られるコンテンツ属性とは、例えば図13に挙げるように、コンテンツのジャンル情報(アニメ、恋愛などをテーマにしたコメディ(ラブコメと表示)、アクション)などである。
【0034】
図12に戻る。学習部109は各クラスタに属する利用者のコンテンツ選好情報の平均値を求め(S1204)、コンテンツ属性の加重値を計算してそれらを平滑化することによって算出する(S1205)。例えば、平均値と選好する属性の出現頻度に応じた加重値を用いて属性パラメータを算出してもよい。コンテンツ属性パラメータの計算方法には、その他にも様々な方法の適用が考えられ、任意の計算方法でかまわない。コンテンツ属性パラメータ管理部314 は、コンテンツ属性パラメータの学習部109で計算されたコンテンツ属性パラメータをコンテンツ属性パラメータ格納部313に格納する(S1206)。コンテンツ属性パラメータデータベース に既に値が存在する場合には、コンテンツ属性パラメータ格納部313の属性パラメータを更新する。
【0035】
図14は、図11のクラスタと図13のコンテンツ属性とが得られた場合のコンテンツの属性パラメータの詳細である。例えば(Oc,St,Pr,Ko,Fi,Su,Ga)のコンテンツ選好情報平均をクラスタ毎に算出すると、クラスタ1は(1,1,0,0,0.5,0,0.5)、クラスタ2では(0,0.67,1,1,0,0.33,0)、クラスタ3では(1,0,0,0,1,0.5,1)となる。一方、コンテンツ属性に関するクラスタ毎のの加重平均は、クラスタ1では(1.5,0.0,1.5)、クラスタ2では(0.0,2.0,1.0)、クラスタ3では(2.0,0.0,1.5)となる。さらに、コンテンツ属性パラメータは、ベクトルの和が均一になるようにする。例えば1になるように処理するとベクトル和が均一になるが、数値は適宜せってすればよい。クラス毎にクラスタ1のパラメータW1(0.5,0,0.5)、クラスタ2のW2(0,0.67,0.33)、クラスタ3のパラメータW3(0.57,0,0.43)として算出される。
【0036】
次に、コンテンツ選好度の算出と推薦するコンテンツ決定について図15に従い説明する。推定部105(コンテンツ選好度計算部317)は、クラスタ情報管理部310 を介して得られるクラスタ情報(S1501) と、コンテンツメタ情報管理部316を介して得られるコンテンツメタ情報(S1502) と、コンテンツ属性パラメータ管理部314 を介して得られるコンテンツ属性パラメータ情報と(S1503) を読み込み、利用者に対するコンテンツ選好度を計算する(S1504)。コンテンツ選好度は、例えば図16 に示すように、利用者の選好情報のないアイテムについて、利用者と最も類似するクラスタのコンテンツ属性パラメータとコンテンツ属性値の積で求めることができる。コンテンツ属性値とは、コンテンツメタ情報から得られる値である。図16では、ジャンル情報から得られたコンテンツ属性を示している。例えば、コンテンツFiのコンテンツ属性値は(0,0,1)である。例えばクラスタ2についてのコンテンツFiのコンテンツ属性値は0×0+0.67×0+0.33×1=0.33である。コンテンツ選好度には、その他にも様々な方法の適用が考えられ、利用者がすでに視聴したコンテンツと類似する属性値を持つコンテンツのコンテンツ選好度を高くするなどの任意の計算方法を用いてもよい。
【0037】
決定部106(推薦コンテンツ決定部318) は、コンテンツ選好度計算部317で算出されたコンテンツ選好度の値の大きいコンテンツを利用者へ推薦するコンテンツに決定する(S1505)。推薦コンテンツを選択する場合は、任意の閾値以上のコンテンツ選好度を持つコンテンツ、あるいは任意の件数のコンテンツなどの条件を設ければ良い。図16ではコンテンツ選好度計算部317によって算出された、全てのコンテンツ選好度を比較し、最も大きい選好度を有するコンテンツPrやコンテンツ Koを推薦するコンテンツとして決定する例である。推薦コンテンツ表示・選択部319 は、推薦コンテンツ決定部318で決定された推薦コンテンツを、コンテンツメタ情報管理部316 を介して得られるコンテンツメタ情報を用いて装置の表示部に提示する(S1506)。利用者が装置上に表示された推薦コンテンツの中から任意のコンテンツを選択すると(S1507)、映像装置がインターネットなどの回線を通じてサーバ側に蓄積されたコンテンツに関する情報を受信するコンテンツ情報受信部を通じて得られるコンテンツの映像を放映する(S1508)。推薦コンテンツ表示・選択部319は、利用者が選択したコンテンツ情報を利用者の選好情報として選好情報管理部307に送る。選好情報管理部307は選好情報格納部306に格納する。映像情報は、インターネットなどの回線を通じてサーバ側から獲得する形態に限らず、CD、DVD、フラッシュメモリなどの様々な情報伝達の媒体から装置に入力される等の形でもかまわない。
【0038】
選好情報が更新された場合には、更新に応じて情報推薦装置の各部における、選好情報を更新して、推薦するコンテンツを決定することが可能である。例えば、第2管理部107である、選好情報管理部307は、利用者の新たな選好情報をもとに、選好情報格納部306の利用者毎の選好情報を更新してもよい。また、算出部104はコンテンツ属性パラメータはコンテンツメタ情報の更新や、選好度の更新に伴ってコンテンツ属性パラメータを算出して更新してもよい。
【0039】
また、選好情報が更新された場合に、推定部105は対象となる利用者のプロファイル情報に加え、利用者の選好情報を用いて推定してもよい。この場合、クラスタの選好情報に新規利用者の選択対象のアイテムが予め決められた数以上ある場合には、分類部103(クラスタリング部)は利用者の分類(クラスタリング)を再度行い、算出部104(コンテンツ属性パラメータ管理部)は属性パラメータを再度算出する。また、算出部104(コンテンツ属性パラメータ管理部)は新規利用者の選好情報のみを用いてアイテムの属性パラメータを算出してもよい。
【0040】
本実施の形態にかかる情報推薦装置は、CPU(Central Processing Unit)などの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、ネットワークなどに接続して通信を行う通信I/Fと、HDD(Hard Disk Drive)、CD(Compact Disc)ドライブ装置などの外部記憶装置と、ディスプレイ装置などの情報推薦のために提示を行う表示装置と、オペレータが識別処理や結果取得などを行うためのキーボードやマウスなどの入力装置と、各部を接続するバスを備えており、通常のコンピュータを利用したハードウェア構成となっている。
【0041】
本実施の形態にかかる情報推薦装置で実行され推薦処理プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供することが可能である。
【0042】
また、本実施の形態にかかる情報推薦装置で実行される推薦処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施の形態にかかる情報推薦装置で実行される処理プログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0043】
また、本実施の形態の処理プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
【0044】
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。例えば食料品や雑貨や本などの日常生活用品、映画や音楽などの電子コンテンツなどのあらゆるアイテムの推薦に適用することが可能である。
【符号の説明】
【0045】
101・・・第1管理部、102・・・取得部、103・・・分類部、104・・・算出部、105・・・推定部、106・・・決定部、107・・・第2管理部、108・・第3管理部、109・・・学習部、110・・・第4管理部
【特許請求の範囲】
【請求項1】
新規利用者を分類するためにあらかじめ設定されるプロファイル情報と前記新規利用者の選択対象の項目を管理する第1管理部と、
複数の利用者のプロファイル情報と好みを表わす選好情報とを取得する取得部と、
前記複数の利用者の前記プロファイル情報と前記選好情報とを用いて前記複数の利用者を複数の集合に分類する分類部と、
分類された前記集合ごとに前記選択対象の前記項目に含まれる属性に関するパラメータを算出する算出部と、
前記規利用者のプロファイル情報と前記分類情報とを用いて前記集合から類似する類似集合を推定する推定部と、
前記類似集合の属性に関するパラメータを利用して前記項目の選好度を算出し、推薦する項目を決定する決定部と
を有することを特徴とする情報推薦装置。
【請求項2】
新規利用者情報の選好情報を管理する第2管理部を更に有し、
前記第2管理部は新規利用者の新たな選好情報を得た場合には前記選好情報を更新し、
前記算出部は更新された前記項目の属性に関するパラメータを算出して更新することを特徴とする請求項1記載の情報推薦装置。
【請求項3】
前記推定部は前記新規利用者のプロファイル情報に加えて、前記新規利用者の選好情報を用いて推定することを特徴とする請求項2記載の情報推薦装置。
【請求項4】
前記集合の選好情報に前記新規利用者の選択対象である項目数が所定数以上ある場合に、
前記分類部は前記利用者の分類を再度行い、
前記算出部は前記項目の前記属性に関するパラメータを再度算出することを特徴とする請求項1乃至3いずれか1項に記載の情報推薦装置。
【請求項5】
前記新規利用者の前記選好情報が所定数以上ある場合には、
前記算出部は前記新規利用者の選好情報のみを用いて前記項目の前記属性に関するパラメータを算出することを特徴とする請求項1記載の情報推薦装置。
【請求項6】
前記算出部は前記類似集合に属する利用者の選好情報の平均値を算出し、
前記平均値と前記選好する前記属性の出現頻度に応じた加重値を用いて前記属性に関するパラメータを算出することを特徴とする請求項1乃至4いずれか1項に記載の情報推薦装置。
【請求項7】
前記複数の利用者を分類した前記類似集合の情報を管理する第3管理部を更に有することを特徴とする請求項1乃至6いずれか1項記載の情報推薦装置。
【請求項8】
前記項目の前記属性に関するパラメータを管理する第4管理部を更に有することを特徴とする請求項1乃至7いずれか1項記載の情報推薦装置。
【請求項9】
前記新規利用者に推薦する前記項目を提示する提示部を更に備えたことを特徴とする情請求項1乃至8いずれか1項記載の情報推薦装置。
【請求項1】
新規利用者を分類するためにあらかじめ設定されるプロファイル情報と前記新規利用者の選択対象の項目を管理する第1管理部と、
複数の利用者のプロファイル情報と好みを表わす選好情報とを取得する取得部と、
前記複数の利用者の前記プロファイル情報と前記選好情報とを用いて前記複数の利用者を複数の集合に分類する分類部と、
分類された前記集合ごとに前記選択対象の前記項目に含まれる属性に関するパラメータを算出する算出部と、
前記規利用者のプロファイル情報と前記分類情報とを用いて前記集合から類似する類似集合を推定する推定部と、
前記類似集合の属性に関するパラメータを利用して前記項目の選好度を算出し、推薦する項目を決定する決定部と
を有することを特徴とする情報推薦装置。
【請求項2】
新規利用者情報の選好情報を管理する第2管理部を更に有し、
前記第2管理部は新規利用者の新たな選好情報を得た場合には前記選好情報を更新し、
前記算出部は更新された前記項目の属性に関するパラメータを算出して更新することを特徴とする請求項1記載の情報推薦装置。
【請求項3】
前記推定部は前記新規利用者のプロファイル情報に加えて、前記新規利用者の選好情報を用いて推定することを特徴とする請求項2記載の情報推薦装置。
【請求項4】
前記集合の選好情報に前記新規利用者の選択対象である項目数が所定数以上ある場合に、
前記分類部は前記利用者の分類を再度行い、
前記算出部は前記項目の前記属性に関するパラメータを再度算出することを特徴とする請求項1乃至3いずれか1項に記載の情報推薦装置。
【請求項5】
前記新規利用者の前記選好情報が所定数以上ある場合には、
前記算出部は前記新規利用者の選好情報のみを用いて前記項目の前記属性に関するパラメータを算出することを特徴とする請求項1記載の情報推薦装置。
【請求項6】
前記算出部は前記類似集合に属する利用者の選好情報の平均値を算出し、
前記平均値と前記選好する前記属性の出現頻度に応じた加重値を用いて前記属性に関するパラメータを算出することを特徴とする請求項1乃至4いずれか1項に記載の情報推薦装置。
【請求項7】
前記複数の利用者を分類した前記類似集合の情報を管理する第3管理部を更に有することを特徴とする請求項1乃至6いずれか1項記載の情報推薦装置。
【請求項8】
前記項目の前記属性に関するパラメータを管理する第4管理部を更に有することを特徴とする請求項1乃至7いずれか1項記載の情報推薦装置。
【請求項9】
前記新規利用者に推薦する前記項目を提示する提示部を更に備えたことを特徴とする情請求項1乃至8いずれか1項記載の情報推薦装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2012−204894(P2012−204894A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−65265(P2011−65265)
【出願日】平成23年3月24日(2011.3.24)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願日】平成23年3月24日(2011.3.24)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
[ Back to top ]