プロファイル解析システム
【課題】ユーザにとって有用な情報をドメインやサービスに関わらず推薦する。
【解決手段】アイテムをユーザの行動目的である基本的欲求によって定義し、ユーザプロファイルを基本的欲求の強さで表すことによって、ユーザの行動履歴から算出されたユーザの欲求の定常的な強さと現在欲求の強さを比較し、現在の欲求度を算出して推薦アイテムを提示する。
【解決手段】アイテムをユーザの行動目的である基本的欲求によって定義し、ユーザプロファイルを基本的欲求の強さで表すことによって、ユーザの行動履歴から算出されたユーザの欲求の定常的な強さと現在欲求の強さを比較し、現在の欲求度を算出して推薦アイテムを提示する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの特性に関する情報を抽出・解析する装置に関するものである。
【背景技術】
【0002】
情報通信技術の発展とその商業利用の拡大により、インターネットなどの各種メディアが提供する情報量は計り知れない。ユーザは多種多様な情報を受け取ることが可能になり、ユーザにとっての情報の有用性の多様化が進んでいる。そのため、ユーザは、大量の多種多様な情報の中から自身にとって有用な情報を選択することが困難となっている。また、情報提供側においても、不特定多数へ向けた広告・宣伝の効果が減少している。こうした状況において、近年、ユーザの行動履歴からユーザの嗜好情報(ユーザがどのような情報に興味があるか)のようなプロファイルを抽出し解析することで、ユーザのプロファイルに適した有用な情報を推薦する技術やマーケティングデータとしてターゲティング広告に利用するデータマイニング技術が知られている。
【0003】
従来のプロファイル解析技術では、各サービスでユーザの行動履歴を蓄積し、独自の管理方法によってプロファイルを記述し、推薦処理に用いる。例えば、テレビ番組推薦システムでは、ユーザのテレビ番組の視聴履歴をテレビ番組のカテゴリ(バラエティ、スポーツなど)や番組出演者などの番組中に含まれる単語によって記述し、視聴履歴中の各単語の登場頻度を当該ユーザの嗜好情報として抽出し、番組の推薦に利用する。また、ECサイトで多く見られるような商品推薦システムでは、ユーザの商品購買履歴を用いて、当該ユーザと類似した購買履歴を持つユーザの購買した商品を推薦する。つまり、各サービスの利用履歴のみからユーザプロファイルを抽出している。
【0004】
しかしながら、ユーザプロファイルを精度良く抽出するためには、ユーザの多くの行動履歴を取得する必要がある。従来は、ユーザの単一ドメインの行動履歴しか用いていないため、ユーザプロファイルを高精度に抽出することはできない。ここで、ドメインとは、「テレビ番組」や「映画」、「旅行」などのコンテンツを提供する業態などによって限られるコンテンツの範囲を指す。これは、テレビ番組の視聴行動のみからユーザの特徴を高精度に特定することはできない、ということを意味している。また、複数ドメインにまたがる行動履歴を取得したとしても、従来技術では、各ドメインの履歴の記述方式が異なるため、複数ドメインにまたがる汎用性のあるユーザプロファイルを抽出することはできない。
【0005】
こうした課題を解決するために、特許文献1では、ベイジアンネットワークモデルを用いて、ユーザ属性とアイテム属性の依存関係(以下、共通属性)を確率変数で表わし、その値から特定ユーザと各アイテムとの組み合わせ毎に特定ユーザに対する各アイテムの適合性を検証し、この検証結果から特定ユーザに推薦するアイテムを決定することにより、アイテムの推薦精度の向上を図っている。例えば、被験者への聞き取り調査、定性調査等によりアイテム(例えば映画)に対する評価に用いられる用語を共通属性候補として抽出し、大規模アンケート調査等により共通属性候補の中から大多数の人に共通に支持される候補を選択することで共通属性の確率変数を導出する。この確率変数に基づき、特定ユーザに推薦するアイテムを決定することができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−58398号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
特許文献1では、事前に確率変数の依存関係を設定する必要があり、また、アイテム属性は各ドメインに特化しているという問題がある。
【0008】
本発明は、上述の点に鑑みてなされたものであり、その目的とするところは、ユーザにとって有用な情報をドメインに関わらず推薦することのできるシステムを提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明のプロファイル解析システムは、アイテムをユーザの行動目的である基本的欲求によって定義し、ユーザプロファイルを基本的欲求の強さで表すことによって、ユーザの行動履歴から算出されたユーザの欲求の定常的な強さと現在欲求の強さを比較し、現在の欲求度を算出して推薦アイテムを提示する。
【0010】
本発明によるプロファイル解析システムは、ユーザのアイテム選択履歴に関する情報を格納したユーザ行動履歴データベースと、複数の種別からなる基本的欲求に対するユーザの定常的な欲求の強さの情報をユーザの欲求プロファイルとして格納したユーザプロファイルデータベースと、アイテムと基本的欲求の種別との対応関係についての情報を格納したアイテムデータベースと、ユーザ行動履歴データベースに格納されたアイテム選択履歴からユーザの基本的欲求に対する欲求満足度を計算する欲求満足度計算部と、欲求満足度と欲求プロファイルとから、ユーザの現在の基本的欲求の強さを計算する欲求計算部と、ユーザの現在の基本的欲求の強さ及びアイテムと基本的欲求の種別との対応関係に基づいて、アイテムデータベースから、現在のユーザの基本的欲求の強さに適したアイテムを推薦する推薦部と、を備える。このようにユーザプロファイルとアイテムを共に基本的欲求で記述することにより、各種サービスによって提供される異種アイテムを統一的に扱い、ユーザが現在必要としているアイテムを適切に推薦することが可能になる。
【発明の効果】
【0011】
本発明によれば、ユーザは、幅広い分野から自身の行動目的に最適な情報を得ることができ、生活行動が豊かになる。また、情報提供者は、ユーザに飽きの来ないサービスを提供することができる。
【0012】
上記した以外の、課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0013】
【図1】本発明の一実施例のプロファイルの解析とその結果からアイテムを推薦する機能を有するシステムの構成図である。
【図2】ユーザ行動履歴データベースに格納されているデータの構成例を示す図である。
【図3】ユーザプロファイルデータベースに格納されているデータの構成例を示す図である。
【図4】アイテムデータベースに格納されているデータの構成例を示す図である。
【図5】処理の概要を示すフローチャートである。
【図6】定常的欲求度の改善機能を有するプロファイル解析システムの構成例を示す図である。
【図7】定常的欲求度の改善機能を有するプロファイル解析システムにおける処理の流れを示すフローチャートである。
【図8】各データベースと欲求解析の関連を表わすシステムの構成図である。
【図9】欲求プロファイルを学習する方式を説明する模式図である。
【図10】アイテムに対する欲求を学習する方式を説明する模式図である。
【図11】アイテムに対する欲求の学習を行う流れを表わすフローチャートである。
【図12】アイテムのクラスタグループに確率表を付与したデータ構成図である。
【図13】アイテムに対する未知の欲求と未知のユーザの欲求プロファイルを学習する方式の説明図である。
【図14】未知のアイテムに対する欲求と未知のユーザの欲求プロファイルを学習する流れを表わすフローチャートである。
【図15】ドメインの異なる複数のアイテムデータベースを有する一実施例のシステム構成例を示す図である。
【図16】ドメインの異なる複数のアイテムデータベースを有する一実施例のユーザ行動履歴データベースのデータ構成例を示す図である。
【図17】ドメインの異なる複数のアイテムデータベースを有する一実施例のアイテムデータベースのデータ構成例を示す図である。
【図18】ドメインの異なる複数のアイテムデータベースを有するシステムにおいてアイテムを提示するまでの流れを示すフローチャートである。
【図19】ドメインの異なる複数のアイテムデータベースに対して推薦に利用するアイテムデータベースを選択する機能を有するシステムの構成例を示す図である。
【図20】ドメインの異なる複数のアイテムデータベースに対して推薦に利用するアイテムデータベースを選択する機能を有するシステムにおける処理の流れを示すフローチャートである。
【図21】個別サービスに接続する機能を有するシステムの構成例を示す図である。
【図22】個別サービスに接続する機能を有するシステムのユーザ行動履歴データベースのデータ構成例を示す図である。
【図23】個別サービスに接続する機能を有するシステムのユーザプロファイルデータベースのデータ構成例を示す図である。
【図24】個別サービスに接続する機能を有するシステムにおける処理の流れを表わすフローチャートである。
【発明を実施するための形態】
【0014】
Nelson, P. : “Information and Consumer Behavior”, Journal of Political Economy, Vol.78, pp.311-329, (1970)に、人間の消費行動は、欲求を満足させることが目的であることが示唆されている。また、Steven Reiss : “Who am I? The 16 Basic Desires that Motivate Our Actions and Define Our Personalities”, Berkley Trade (2002)に示されているように、人間の基本的欲求の存在が知られている。ユーザの消費行動における欲求の強さは、長期的に普遍である欲求の定常的強さと、短期間における欲求の満足度合いから瞬間的な強さ(以下、現在欲求)によって表わすことができる。
【0015】
ここで、基本的欲求とは、例えば、「所有」や「知的好奇心」、「やすらぎ」、「社会的帰属」などである。「所有」とは、モノを集めたい、特別なものを所有したいなど、獲得・所有に関する欲求である。「知的好奇心」とは、未知のものに興味をもつ、知らないことを学びたいなど、知への好奇心に関する欲求である。「やすらぎ」とは、癒されたい、ストレスからの解放、恥を予防したいなど、心のやすらぎに関する欲求である。「社会的帰属」とは、地域や社会を守りたい、地球全体規模で正しいことをしたいなど、社会への帰属意識に関する欲求である。例えば、「所有」の欲求は、切手の収集やシリーズもののテレビ番組の録画、飲料水のおまけ商品、ご当地グルメなどの複数のドメインにおいて現れる。また、「知的好奇心」の欲求は、教育番組の視聴や雑学に関する書籍の購入、史跡めぐりツアーなどの複数のドメインにおいて現れる。「やすらぎ」の欲求は、クラシックコンサートの番組やCD,アロマテラピーに関する商品購入、温泉旅行などの複数のドメインの行動に現れる。「社会的帰属」の欲求は、オリンピックなどの国家を代表するスポーツ番組の視聴や、環境負荷の小さい商品の購入などの複数のドメインにおいて現れる。
【0016】
本発明のプロファイル解析システムは、アイテムをユーザの行動目的である基本的欲求によって定義し、ユーザプロファイルを基本的欲求の強さで表すことによって、ユーザの行動履歴から算出されたユーザの欲求の定常的な強さと現在欲求の強さを比較し、現在の欲求度を算出してその欲求に適合する推薦アイテムを提示する。
【0017】
以下、本発明を実施する場合の実施形態を、図面を用いて詳細に説明する。
【0018】
図1は、本発明の一実施例のシステム構成例を示す図である。本実施例のプロファイル解析システムは、プロファイルの解析とその結果からテレビ番組の推薦機能を有するシステムである。本システムは、テレビ番組の視聴履歴に関する情報を格納したユーザ行動履歴データベース101と、ユーザ行動履歴データベース101から欲求満足度を計算する欲求満足度計算部102と、ユーザがそれぞれの基本的欲求に対してどのような特性があるかを表す情報である欲求プロファイルを格納するユーザプロファイルデータベース103と、欲求満足度計算部102及びユーザプロファイルデータベース103から現在の欲求の強さを計算する欲求度計算部104と、推薦を行うテレビ番組がどのような基本的欲求を満たすか、又は、一般的にどのような基本的欲求から対象のテレビ番組を視聴するかの情報を格納するアイテムデータベース105と、欲求度計算部104及びアイテムデータベース105から現在のユーザの欲求に適したテレビ番組を推薦する推薦部106を有する。ここで、欲求とは、知的好奇心や所有欲、社会的帰属欲求などを代表とする人間の行動原理となる基本的欲求のことを指す。
【0019】
図2は、ユーザ行動履歴データベース101に格納されているデータの構成例を示す図であり、ユーザを一意に識別するユーザID201と、テレビ番組を一意に識別するアイテムID202と、当該テレビ番組の視聴にとって満たされる基本的欲求の種別を表わす欲求ID203と、番組を視聴した日時204で構成される。
【0020】
図3は、ユーザプロファイルデータベース103に格納されているユーザプロファイルデータの構成例を示す図であり、ユーザを一意に識別するユーザID301と、ある基本的欲求に対してユーザが日常的にどの程度の欲求を持っているかを示す定常的な欲求度(以下、定常的欲求度)を表す割合である欲求IDnの強さ302で構成される。本例では、基本的欲求はID1〜ID19の19種類とした。ユーザの定常的な欲求の強さは、例えば、ユーザがサービス加入段階で心理テストなどのアンケートに回答することで生成するものとしてもよい。また、ユーザ自身で設定するものとしてもよい。定常的な欲求度は、季節によって異なるため、季節毎に登録するものとしてもよい。後述のように、学習・推定するものとしてもよい。
【0021】
図4は、アイテムデータベース105に格納されているデータの構成例を示す図であり、テレビ番組を一意に識別するアイテムID401と、テレビ番組の視聴行動の元となる基本的欲求の種別を表わす欲求ID402と、テレビ番組の詳細を表わした詳細403で構成される。テレビ番組の視聴行動の元となる基本的欲求の種別は、例えば、サービス提供時に提供者が任意に設定するものとしてもよい。後述のように、学習・推定するものとしてもよい。詳細403には、アイテムに関する情報がテキストデータとして格納されている。
【0022】
図5は、本実施例における処理の概要を示すフローチャートである。プロファイル解析システムを起動すると(S501)、ユーザ行動履歴データベース101に格納されたテレビ番組視聴履歴に関する欲求情報をもとに欲求満足度計算部102により欲求満足度を計算する(S502)。ここで欲求満足度とは、現時点で対象のユーザのどのような基本的欲求が満たされており、どのような基本的欲求が満たされていないかを基本的欲求ごとに示す割合であり、例えば以下の計算式で算出する。
【0023】
【数1】
【0024】
ここで、任意の欲求IDをnとすると、Snは欲求IDnの欲求満足度であり、Ctotalは全ての行動の総数であり、Cnは行動の中で欲求IDnを満たした回数である。テレビ番組であれば、回数でなく、番組の長さや視聴時間などを基準に計算してもよい。テレビ番組以外の商品の場合には、値段などを利用してもよい。その場合、例えば、Ctotalはユーザが費やした全費用、Cnは欲求IDnのために費やした費用とすればよい。
【0025】
欲求満足度は、例えば、ユーザ行動履歴データベース101に格納された日時204をもとに、例えば過去1週間の行動履歴から算出するものとする。その場合、ユーザ行動履歴データベース101には、欲求満足度の計算に用いる期間内の行動履歴のみ格納しても良い。
【0026】
次に、全ての基本的欲求について、欲求満足度とユーザプロファイルデータベース103に格納された定常的欲求度をもとに欲求度計算部104により現在の基本的欲求の強さを計算し(S503)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S504)。
現在の基本的欲求の強さは、例えば以下の計算式で算出する。
【0027】
【数2】
【0028】
ここで、Qnは、欲求IDnの現在の強さを表す割合であり、0から1の間の値をとる。Snは欲求IDnの欲求満足度であり、ユーザプロファイルデータベース103で管理されているSSnは欲求IDnの定常的欲求度を表す割合であり、0から1の間の値をとる。欲求満足度Snが定常的欲求度SSnの割合に達している場合、現在欲求が十分に満たされているものものとしてQnは0の値をとる。なお、計算式は基本的欲求の強さを表現できれば、他の方式でもよい。
【0029】
最後に、S504で抽出した基本的欲求を満たすテレビ番組をアイテムデータベース105から抽出し(S505)、ユーザに推薦するテレビ番組を提示する(S506)。
【0030】
例えば、現在欲求抽出処理で算出された最も強い基本的欲求が「知的好奇心」である場合、一般的に「知的好奇心」の基本的欲求を満たす「教育番組」「クイズ番組」などのテレビ番組が推薦されることになる。ここで、ユーザに推薦するテレビ番組は、全ての欲求度の中で最も強い基本的欲求に該当するテレビ番組を選択してもよいし、ある一定値以上の欲求度に該当するテレビ番組をまとめて推薦してもよい。
【0031】
行動履歴は、番組視聴のみでなく、異なるドメインの行動履歴を利用することも可能である。その場合、現在欲求抽出処理で算出された最も強い基本的欲求が「知的好奇心」である場合、「教育番組」「クイズ番組」のほか、「雑学に関する書籍」「プラネタリウム」などの異なるドメインに属する商品なども推薦する。
【0032】
次に、上記実施例について、推薦したテレビ番組に対するユーザの反応をもとに定常的欲求度の改善を行うことにより、より精度の高い推薦を行うことを目的としたプロファイル解析システムについて説明する。
【0033】
図6は、本発明の、定常的欲求度の改善機能を有するプロファイル解析システムの一実施例の構成例を表わすシステム構成図である。このシステムは、ユーザの行動履歴に関する情報を格納したユーザ行動履歴データベース601と、ユーザ行動履歴データベース601から欲求満足度を計算する欲求満足度計算部602と、基本的欲求の定常的な欲求度の情報を格納したユーザプロファイルデータベース603と、欲求満足度計算部602及びユーザプロファイルデータベース603から現在の基本的欲求の強さを計算する欲求度計算部604と、基本的欲求に対応するアイテムの情報を格納したアイテムデータベース605と、欲求度計算部604及びアイテムデータベース605から現在のユーザの基本的欲求に適したアイテムを推薦する推薦部606と、推薦部606で推薦したテレビ番組がユーザに選択されなかった場合に推薦に用いた基本的欲求の定常的な欲求度の値を再計算し改善するフィードバック処理部607から構成される。
【0034】
図7は、定常的欲求度の改善機能を有するプロファイル解析システムにおける処理の概要を示すフローチャートである。
【0035】
まず、プロファイル解析システムを起動すると(S701)、ユーザ行動履歴データベース601に格納されたテレビ番組視聴履歴に関する欲求情報をもとに欲求満足度計算部602により欲求満足度を計算する(S702)。欲求満足度の計算式は上述の式(1)と同様である。次に、全ての欲求について、欲求IDnの欲求満足度とユーザプロファイルデータベース603に格納された定常的欲求度をもとに欲求度計算部604により現在の基本的欲求の強さを計算し(S703)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S704)。現在の基本的欲求の強さの計算式は上述の式(2)と同様である。次に、抽出した基本的欲求を満たすテレビ番組をアイテムデータベース605から抽出し推薦するテレビ番組を決定し(S705)、ユーザに推薦するテレビ番組を提示する(S706)。ここで、推薦されたテレビ番組をユーザが視聴しなかった場合(S707)、推薦する番組の抽出を行った処理(S705)に用いた基本的欲求の定常的欲求度を低く調整し、調整した値をユーザプロファイルデータベース603に再格納する(S708)。定常的欲求度の調整後の値は、例えば以下の計算式で算出する。
【0036】
【数3】
【0037】
ここで、SSnnewは、欲求IDnの定常的欲求度の調整後の値である。wは1回のテレビ番組推薦で行ったユーザの視聴行動をどの程度定常的欲求度の調整に反映するかを決定するパラメータであり、0から1の間の値をとる。SSnoldは欲求IDnの定常的欲求度の調整前の値である。計算式は、定常的欲求度に対してフィードバックできるものであれば、他の式を用いてもよい。
【0038】
以上説明した定常的欲求度の改善機能は、本発明の全ての実施例に対して適用可能である。
【0039】
図8は、欲求解析によって、アイテムデータベースに登録されるテレビ番組などのアイテムが対応する基本的欲求や、各ユーザの欲求プロファイルを既知の情報から学習するシステムの構成例を示す図である。このシステムは、ユーザの行動履歴に関する情報を格納したユーザ行動履歴データベース801と、基本的欲求の定常的な欲求度の情報を格納したユーザプロファイルデータベース802と、基本的欲求に対応するテレビ番組などのアイテムの情報を格納したアイテムデータベース803と、ユーザ行動履歴データベース801及びユーザプロファイルデータベース802及びアイテムデータベース803をもとに未知のユーザの欲求プロファイル又はアイテムに対する未知の基本的欲求を解析する欲求解析部804で構成される。
【0040】
図9は、アイテムに対する基本的欲求が全て既知であり、ユーザの欲求プロファイルが全て未知の場合に、各ユーザの欲求プロファイルを学習する方式を説明する模式図である。対応する基本的欲求が既知であるアイテム群901はアイテムデータベース803に格納された情報であり、欲求プロファイルが未知であるユーザ902のアイテム選択履歴からそのアイテムに対応する欲求度を抽出し、ユーザ902の欲求プロファイル903を作成する。すなわち、ユーザ902が選択した各アイテムにそれぞれ対応する基本的欲求を基本的欲求の種別ごとに集計し、各基本的欲求の欲求度を計算して、それをそのユーザの欲求プロファイル903とする。欲求度の計算は、上述の式(1)を利用して計算してもよい。また、欲求度を抽出するためのアイテム選択履歴の選定に関して、習慣性のある行動は周期性を伴うことを考慮してもよい。さらに、季節性のある行動なども考慮してよい。
【0041】
図10は、ユーザの欲求プロファイルが既知で、アイテムに対応する基本的欲求を学習する方式を説明する模式図である。基本的欲求が未知であるアイテム群1001を、アイテム間の類似度を計算することによりクラスタリング(グループ分け)し、クラスタリング結果1002からユーザ1003の欲求プロファイル1004に適応するようにクラスタリング結果1002に基本的欲求を割り振る。このとき、各アイテム集合に属するアイテムには同じ種別の基本的欲求が一つあるいは複数割り振られる。
【0042】
図11は、アイテムのクラスタリングを行い、クラスタに基本的欲求を割り振るまでの流れを表わすフローチャートである。まず、アイテム間の類似度を算出することにより対応する基本的欲求が未知のアイテム群1001をクラスタリングする(S1101)。例えば、アイテム間の類似度は、下式(4)のようなユーザの行動をもとに算出する方法でも、下式(5)のようなアイテム自体の特徴を利用したコンテンツベースのものでもよい。その他のアイテム間類似度を表すものを利用してもよい。
【0043】
【数4】
【0044】
ここで、InはアイテムIDがnであるアイテムを表し、d(In,Im)はアイテムInとImの類似度である。P(In,Im)は、アイテムInとImを両方利用したユーザの人数である。
【0045】
【数5】
【0046】
ここで、iはアイテムの詳細情報に含まれる単語であり、In(i)は単語iが含まれるか否かを表し、0か1の2種類の値でも良いし、単語の出現回数としてもよい。
【0047】
クラスタリング手法は、階層的クラスタリングやk-meansなどの従来手法を用いるものとし、クラスタ内に重複を許す形式とする。次に、上記の手法で生成されたクラスタに対して、各基本的欲求をランダムで設定する(S1102)。クラスタに割り振られた基本的欲求によって、各ユーザがそのクラスタを選択した場合に算出される欲求プロファイル1004を計算し、既知のユーザの欲求プロファイルと比較することにより、各基本的欲求の適合度合いを算出する(S1103)。ここで欲求プロファイルの計算は、式(1)、式(2)を全ての基本的欲求について計算した結果であってもよい。各基本的欲求の適合度合いは、例えば以下の計算式で算出する。
【0048】
【数6】
【0049】
Gkはクラスタを表し、R(Gk,Di)はクラスタGkと割り振られた基本的欲求Diとの適合度合いを表す。Uin(Gk,Di)は、ユーザnがクラスタGkを利用した履歴から生成される基本的欲求Diの強さであり、Untrue(Di)は、ユーザnの欲求プロファイルの欲求番号iの基本的欲求Diの強さである。使用する計算式は、適合度合いを表すものであれば、他の式でもよい。
【0050】
各クラスタに対応する基本的欲求の適合度合いを下式(7)のような誤差関数を最小化するように調整することで、S1102でランダムに割り振ったクラスタに対応する基本的欲求を学習する(S1104)。
【0051】
【数7】
【0052】
誤差関数は、基本的欲求の適合度合いを調整するものであれば、式(7)以外の方式でもよい。
【0053】
最小化方法は、遺伝的アルゴリズムや最急降下法などを用いればよい。もしくは、各クラスタに対して、各基本的欲求に対応する確率値を付与し、確率の調整を行うとしてもよい。図12は、確率表を付与したデータ構成図であり、アイテムとクラスタの関連を格納したアイテム表1201と、クラスタの各基本的欲求の確率を格納した確率表1202で構成され、その確率値をもとに確率の調整を行う。確率の調整は、前述の式(7)で示した各クラスタに対応する基本的欲求の適合度合いを最小化すればよい。
【0054】
図13は、一部のアイテムに対応する基本的欲求の種別と一部のユーザの欲求プロファイルが既知である場合に、その他多数の、基本的欲求の種別が関連づけられていないアイテムと、欲求プロファイルが未知のユーザの欲求プロファイルを学習する方式を説明する模式図である。対応する基本的欲求が既知であるアイテム群1301と、対応する基本的欲求が未知であるアイテム群1302の類似度を計算し、基本的欲求が未知であるアイテムの基本的欲求を、基本的欲求が既知である類似度の高いアイテムの欲基本的求に対応する基本的欲求と同じものとして設定する。設定されたアイテムの基本的欲求に基づき上記のようにして欲求プロファイルが既知のユーザ1303の欲求プロファイルを計算し、既知の欲求プロファイルとの比較を行うことでアイテムに対応する基本的欲求をより精度の高いものに調整する。また、欲求プロファイルが未知のユーザ1304の行動履歴から欲求プロファイルを作成し、欲求プロファイルが既知のユーザの行動履歴から類似度の高いユーザを特定することで、更なるアイテムの基本的欲求の学習を行う。
【0055】
図14は、未知の欲求プロファイルと未知のアイテムに対する基本的欲求の関連づけを行うまでの流れを表わすフローチャートである。
【0056】
まず、ある基本的欲求との関連が未知であるアイテムについて、基本的欲求との関連が既知である全てのアイテムとの類似度を計算する(S1401)。類似度の計算は、上述の式(4)や式(5)を用いて算出することができる。対応する基本的欲求が未知のアイテムの基本的欲求を、計算された類似度の高い既知のアイテムに対応する基本的欲求と同じ基本的欲求として設定する(S1402)。S1401、S1402は基本的欲求が未知である全てのアイテムについて行われる。
【0057】
次に、欲求プロファイルが既知のユーザの行動履歴から、計算されたアイテムの基本的欲求に基づき既知ユーザ1303のユーザプロファイル1305を算出し、上述の式(6)の誤差関数を最小にするようにアイテムに設定した基本的欲求に対する確率値を調整する(S1403)。さらに、算出された基本的欲求が未知のアイテムの基本的欲求ならびに、基本的欲求が既知のアイテムの基本的欲求を用いて、欲求プロファイルが未知のユーザの欲求プロファイルを算出する(S1404)。欲求プロファイルは上述の式(1)、式(2)を全ての基本的欲求について計算した結果であってもよい。算出された欲求プロファイルが未知のユーザの欲求プロファイルについて、欲求プロファイルが既知であるユーザの行動履歴と対象ユーザとの行動履歴から類似度の高い欲求プロファイルが既知のユーザを特定し、そのユーザの欲求プロファイルとの誤差が最小になるように、例えば下式(8)で示す誤差関数をもとに調整を行う(S1405)。
【0058】
【数8】
【0059】
Rlog(Ui,Uj)は行動履歴での類似度、Rprofile(Ui,Uj)は算出されたユーザプロファイルの類似度である。誤差関数は、欲求プロファイルとの差が表現できるものであれば、他の式を用いてもよい。
【0060】
S1403とS1405の双方の処理が最小化されるまで処理を繰り返し(S1403,S1404,S1405)、最小化された時点(S1406)の計算で利用した欲求プロファイルが未知のユーザの欲求プロファイルと、アイテムと基本的欲求との対応が未知の基本的欲求に対する各値を採用する(S1407)。最小化方法は、遺伝的アルゴリズムや最急降下法などを用いればよい。
【0061】
図15は、ドメインの異なる複数のアイテムデータベースを有する本発明の一実施例の構成例を表わすシステム構成図であり、テレビ番組情報と書籍情報と観光地情報を同時に推薦する機能を有したプロファイル解析システムである。テレビ番組の視聴履歴や書籍の閲覧履歴、観光地の訪問履歴などを格納するユーザ行動履歴データベース1501と、ユーザ行動履歴データベース1501から欲求満足度を計算する欲求満足度計算部1502と、基本的欲求の定常的な欲求度(強さ)の情報を格納したユーザプロファイルデータベース1503と、欲求満足度計算部1502及びユーザプロファイルデータベース1503から現在の基本的欲求の強さを計算する欲求度計算部1504と、推薦を行うテレビ番組情報、書籍情報、観光地情報などのアイテムをそれぞれ格納する複数のアイテムデータベース1505と、欲求度計算部1504及び複数のアイテムデータベース1505から現在のユーザの基本的欲求に適したアイテムを推薦する推薦部1506から構成される。
【0062】
図16は、本実施例におけるユーザ行動履歴データベース1501のデータ構成例を示す図であり、ユーザを一意に識別するユーザID1601と、個別ドメインを一意に識別するドメインID1602と、アイテムを一意に識別するアイテムID1603と、基本的欲求の種別を表わす欲求ID1604と、ユーザが行動を起こした日時1605で構成される。
【0063】
図17は、本実施例におけるよるアイテムデータベース1505に格納されているデータの構成例を示す図であり、個別サービスを一意に識別するドメインID1701と、アイテムを一意に識別するアイテムID1702と、基本的欲求の種別を表わす欲求ID1703と、アイテムの詳細をテキストで表わした詳細1704で構成される。
【0064】
図18は、本実施例のプロファイル解析システムの動作を示すフローチャートである。まず、プロファイル解析システムを起動すると(S1801)、ユーザ行動履歴データベース1501に格納されたテレビ番組の視聴履歴、書籍の閲覧履歴、観光地の訪問履歴などのドメインの異なる全ての行動履歴情報(アイテム選択履歴情報)から欲求満足度計算部1502により欲求満足度を計算する(S1802)。欲求満足度の計算は、上述の式(1)によって算出することができる。各履歴はドメインが異なるため、性質の異なるものであるが、各行動を基本的欲求によって評価するため、異なるドメインの履歴情報をもとに欲求満足度を抽出することができることは言うまでもない。次に、欲求IDnの満足度とユーザプロファイルデータベース1503に格納された定常的欲求度をもとに欲求度計算部1504により現在の基本的欲求の強さを計算し(S1803)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S1804)。現在の基本的欲求の強さは上述の式(2)によって算出できる。最後に、S1804で抽出した基本的欲求を満たすアイテムを各アイテムデータベース1505から抽出し推薦するアイテムを決定し(S1805)、ユーザに推薦するアイテムを提示する(S1806)。
【0065】
本実施例では、現在の基本的欲求に対応するアイテムを、ドメインの異なる複数のアイテムデータベース1505から検索し、現在欲求に対応する推薦アイテムをユーザに推薦することができる。例えば、S1804で決定された現時点で強く望んでいる基本的欲求が「知的好奇心」であった場合、教育番組、クイズ番組などのテレビ番組、及び参考書、学術誌などの書籍、及び工場見学、遺跡見学などの観光地などを同時に推薦することが可能である。
【0066】
図19は、複数のドメインのアイテムデータベースを有するプロファイル解析システムにおける推薦時のドメイン利用可否、並びにドメイン利用順序を決定する機能を有する実施例のシステム構成例を示す図である。このシステムは、テレビ番組の視聴履歴や書籍の閲覧履歴、観光地の訪問履歴などを格納するユーザ行動履歴データベース1901とユーザ行動履歴データベース1901から欲求満足度を計算する欲求満足度計算部1902と、基本的欲求の定常的な強さの情報を格納したユーザプロファイルデータベース1903と、欲求満足度計算部1902及びユーザプロファイルデータベース1903から現在の基本的欲求の強さを計算する欲求度計算部1904と、推薦を行うテレビ番組情報、書籍情報、観光地情報などのアイテム情報をそれぞれ格納する複数のアイテムデータベース1905と、欲求度計算部1904及びアイテムデータベース1905から現在のユーザの基本的欲求に適したアイテムを推薦する推薦部1906と、複数のドメインのアイテムデータベースからどのアイテムデータベースを利用するかを決定するドメイン選択部1907から構成される。一般的にアイテムのドメインによって、そのドメインを利用する人間の行動原理となる基本的欲求は類似していることが考えられる。図15の構成図で示した複数のドメインのアイテムについて全て推薦を行った場合、ユーザにとって最も有用なドメインの推薦が他のドメインの推薦によって埋もれたり、推薦の順番が最後になる可能性がある。本実施例の方式を利用することで、より有用なドメインの推薦結果を先に提供することが可能となる。
【0067】
図20は、本実施例の処理手順を示すフローチャートである。まず、プロファイル解析システムが起動すると(S2001)、ユーザ行動履歴データベース1901に格納されたテレビ番組の視聴履歴、書籍の閲覧履歴、観光地の訪問履歴等のドメインの異なる全ての行動履歴情報を利用して欲求満足度計算部1902により欲求満足度を計算する(S2002)。欲求満足度は、上述の式(1)によって算出することができる。次に、欲求IDnの満足度とユーザプロファイルデータベース1903に格納された定常的欲求度をもとに欲求度計算部1904により現在の基本的欲求の強さを計算し(S2003)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S2004)。現在の基本的欲求の強さは上述の式(2)によって算出できる。次に、ユーザ行動履歴データベース1901から対象の基本的欲求を満たした行動の回数をドメインごとに集計し、より多くの行動が行われたドメインを決定する(S2005)。本ステップで利用する行動履歴は、対象のユーザの行動履歴のみを利用したユーザに特化した情報であっても、全ユーザの行動履歴を利用したより一般的な情報であっても、その組み合わせであってもよい。最後に、S2004で抽出した基本的欲求を満たすアイテムを、S2005で選択したドメインのアイテムデータベース1905から決定し(S2006)、ユーザに推薦するアイテムを提示する(S2007)。
【0068】
本実施例では、ドメインとアイテムを選択する際に最も大きな現在欲求を利用したが、複数の基本的欲求を利用してもよい。また、ドメインの決定についても1つのドメインを特定するだけではなく、各ドメインに行動回数から優先度を設定し、優先度の高いドメインを一部又は全て利用することができることは言うまでもない。
【0069】
図21は、既存のさまざまなコンテンツを提供する推薦サービスに本発明のプロファイル解析システムを適用した一実施例を示す構成図である。このシステムは、それぞれのサービスにおける行動履歴を格納したユーザ行動履歴データベース2101と、ユーザ行動履歴データベース2101から欲求満足度を計算する欲求満足度計算部2102と、定常的欲求の強さと、各個別サービス利用時の、特定の基本的欲求を満たすアイテム内でのキーワードの出現頻度情報を格納したユーザプロファイルデータベース2103と、欲求満足度計算部2102及びユーザプロファイルデータベース2103から現在の基本的欲求の強さを計算する欲求度計算部2104と、基本的欲求の強さから推薦に利用する基本的欲求を選択する欲求推薦部2105と、推薦された基本的欲求から利用するサービスを特定するサービス選択部2106と、個別サービスに対して欲求推薦部で決定された基本的欲求に基づく検索キーワードを算出する推薦候補キーワード変換部2107を持ち、サービスに対して固有の条件からアイテムを推薦する個別推薦部2108とそのサービスに含まれるアイテムと個別推薦条件との関連情報を持つアイテムデータベース2109を持ち、テレビ番組推薦サービス、書籍販売サービス、観光案内サービスなどの既存サービスと接続し、推薦結果を取得する機能を持つプロファイル解析システムである。
【0070】
テレビ番組推薦サービス、食品販売サービス、書籍販売サービスなどの既存サービスには、前述のようなアイテムと基本的欲求を関連づける情報をアイテムデータベースとして格納していないのが一般的であり、各個別サービスは、それぞれ固有の個別推薦部2108と、個別のアイテムデータベース2109を持つ。本実施例は、プロファイル解析システムにより算出された基本的欲求を基に個別サービスの個別推薦システムに適合できる形のキーワード情報を算出し、そのキーワードを用いて各個別サービスを利用する。
【0071】
図22は、ユーザ行動履歴データベース2101に格納されるユーザ行動履歴データの構成図であり、ユーザを一意に特定するユーザID2201と、接続されているサービスを特定するサービスID2202と、各種サービスが提供するテレビ番組情報、書籍情報、観光地情報などを特定するアイテムID2203と、当該行動を行った際に満たされたもしくは、当該行動の行動原理となった基本的欲求を示す欲求ID2204と、その行動を行った日時2205で構成される。欲求ID2204はアイテムデータベースに格納されている。アイテムデータベースは、当該行動の行動原理となった基本的欲求を前実施例によって学習する。
【0072】
図23は、ユーザプロファイルデータベース2103に格納される欲求プロファイルと対象のサービスを特定の基本的欲求に基づいて利用したときに選択した検索キーワードの出現頻度情報を示す構成図である。欲求プロファイルは、ユーザを特定するユーザID2301と、各基本的欲求の定常的欲求度を示す情報である欲求IDnの強さ2302から構成される。検索キーワードの出現頻度情報は、ユーザを特定するユーザID2303と、サービスを特定するサービスID2304と、サービスを利用する行動原理となる欲求2305と、そのサービスをその基本的欲求から利用した場合に個別推薦部の入力となるキーワードの出現頻度2306から構成される。本情報は、個別サービスごとにサービス提供元が一意に決めてもよいし、ユーザ加入時のアンケートなどによって作成してもよい。または、そのサービスの利用履歴から、tfidfなどの特徴語抽出に用いる頻度算出方式を利用して値を算出するものとしてもよい。
【0073】
図24は、本実施例のフローチャートである。プロファイル解析システムが起動すると(S2401)、ユーザ行動履歴データベース2101に格納された欲求をもとに欲求満足度計算部2102により欲求満足度を計算する(S2402)。次に、欲求IDnの満足度とユーザプロファイルデータベース2103に格納された定常的欲求度をもとに欲求度計算部2104により現在の基本的欲求の強さを計算し(S2403)、ユーザが持っている強い基本的欲求を抽出し(S2404)、抽出した基本的欲求を有するサービスをユーザ行動履歴データベース2101から検索し、利用するサービスを特定する(S2405)。次に、S2404で抽出した基本的欲求及びS2405で選択したサービスをもとに、ユーザプロファイルデータベース2103から単語IDnの頻度2306の値が大きい単語を推薦候補キーワードとする(S2406)。その後、個別推薦部2108に処理を渡す。
【0074】
一方、個別推薦部2108では、個別のサービスで保持しているアイテムデータベース2109に格納された検索キーワードと推薦候補キーワードを比較することで推薦するアイテムを決定し(S2408)、ユーザに推薦するアイテムを提示する(S2409)。または、単語の出現頻度を利用して、例えば下式に従って推薦スコアを計算し、推薦スコア上位を推薦するアイテムとする。
【0075】
【数9】
【0076】
ここで、Score(Item_ID)は、アイテムIDがItem_IDであるアイテムの推薦スコアであり、P(Item_ID)は、アイテムIDがItem_IDであるアイテムの単語集団であり、|P(Item_ID)|はP(Item_ID)の単語数を表す。Fi(User_ID)はユーザIDがUser_IDであるユーザの単語IDがiの単語の頻度である。スコアの計算方式は、アイテムの推薦順位を決定できるものであれば、その他の方式でもよい。
【0077】
本実施例では、テレビ番組情報、書籍情報、観光地情報などのアイテム情報ならびに、各種推薦サービスとの組み合わせを例としたが、さまざまなドメインのアイテムを推薦する機能について適用できることは言うまでもない。
【0078】
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0079】
また、上記の各構成、機能、処理部、処理手段等は、それらの一部や全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
【符号の説明】
【0080】
101…ユーザ行動履歴データベース、102…欲求満足度計算部、103…ユーザプロファイルデータベース、104…欲求度計算部、105…アイテムデータベース、106…推薦部、601…ユーザ行動履歴データベース、602…欲求満足度計算部、603…ユーザプロファイルデータベース、604…欲求度計算部、605…アイテムデータベース、606…推薦部、607…フィードバック処理部、801…ユーザ行動履歴データベース、802…ユーザプロファイルデータベース、803…アイテムデータベース、804…欲求解析部、1201…アイテム表、1202…確率表、1501…ユーザ行動履歴データベース、1502…欲求満足度計算部、1503…ユーザプロファイルデータベース、1504…欲求度計算部、1505…アイテムデータベース、1506…推薦部、1901…ユーザ行動履歴データベース、1902…欲求満足度計算部、1903…ユーザプロファイルデータベース、1904…欲求度計算部、1905…アイテムデータベース、1906…推薦部、1907…ドメイン選択部、2101…ユーザ行動履歴データベース、2102…欲求満足度計算部、2103…ユーザプロファイルデータベース、2104…欲求度計算部、2105…欲求推薦部、2106…サービス選択部、2107…推薦候補キーワード変換部、2108…個別推薦部、2109…アイテムデータベース
【技術分野】
【0001】
本発明は、ユーザの特性に関する情報を抽出・解析する装置に関するものである。
【背景技術】
【0002】
情報通信技術の発展とその商業利用の拡大により、インターネットなどの各種メディアが提供する情報量は計り知れない。ユーザは多種多様な情報を受け取ることが可能になり、ユーザにとっての情報の有用性の多様化が進んでいる。そのため、ユーザは、大量の多種多様な情報の中から自身にとって有用な情報を選択することが困難となっている。また、情報提供側においても、不特定多数へ向けた広告・宣伝の効果が減少している。こうした状況において、近年、ユーザの行動履歴からユーザの嗜好情報(ユーザがどのような情報に興味があるか)のようなプロファイルを抽出し解析することで、ユーザのプロファイルに適した有用な情報を推薦する技術やマーケティングデータとしてターゲティング広告に利用するデータマイニング技術が知られている。
【0003】
従来のプロファイル解析技術では、各サービスでユーザの行動履歴を蓄積し、独自の管理方法によってプロファイルを記述し、推薦処理に用いる。例えば、テレビ番組推薦システムでは、ユーザのテレビ番組の視聴履歴をテレビ番組のカテゴリ(バラエティ、スポーツなど)や番組出演者などの番組中に含まれる単語によって記述し、視聴履歴中の各単語の登場頻度を当該ユーザの嗜好情報として抽出し、番組の推薦に利用する。また、ECサイトで多く見られるような商品推薦システムでは、ユーザの商品購買履歴を用いて、当該ユーザと類似した購買履歴を持つユーザの購買した商品を推薦する。つまり、各サービスの利用履歴のみからユーザプロファイルを抽出している。
【0004】
しかしながら、ユーザプロファイルを精度良く抽出するためには、ユーザの多くの行動履歴を取得する必要がある。従来は、ユーザの単一ドメインの行動履歴しか用いていないため、ユーザプロファイルを高精度に抽出することはできない。ここで、ドメインとは、「テレビ番組」や「映画」、「旅行」などのコンテンツを提供する業態などによって限られるコンテンツの範囲を指す。これは、テレビ番組の視聴行動のみからユーザの特徴を高精度に特定することはできない、ということを意味している。また、複数ドメインにまたがる行動履歴を取得したとしても、従来技術では、各ドメインの履歴の記述方式が異なるため、複数ドメインにまたがる汎用性のあるユーザプロファイルを抽出することはできない。
【0005】
こうした課題を解決するために、特許文献1では、ベイジアンネットワークモデルを用いて、ユーザ属性とアイテム属性の依存関係(以下、共通属性)を確率変数で表わし、その値から特定ユーザと各アイテムとの組み合わせ毎に特定ユーザに対する各アイテムの適合性を検証し、この検証結果から特定ユーザに推薦するアイテムを決定することにより、アイテムの推薦精度の向上を図っている。例えば、被験者への聞き取り調査、定性調査等によりアイテム(例えば映画)に対する評価に用いられる用語を共通属性候補として抽出し、大規模アンケート調査等により共通属性候補の中から大多数の人に共通に支持される候補を選択することで共通属性の確率変数を導出する。この確率変数に基づき、特定ユーザに推薦するアイテムを決定することができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2007−58398号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
特許文献1では、事前に確率変数の依存関係を設定する必要があり、また、アイテム属性は各ドメインに特化しているという問題がある。
【0008】
本発明は、上述の点に鑑みてなされたものであり、その目的とするところは、ユーザにとって有用な情報をドメインに関わらず推薦することのできるシステムを提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明のプロファイル解析システムは、アイテムをユーザの行動目的である基本的欲求によって定義し、ユーザプロファイルを基本的欲求の強さで表すことによって、ユーザの行動履歴から算出されたユーザの欲求の定常的な強さと現在欲求の強さを比較し、現在の欲求度を算出して推薦アイテムを提示する。
【0010】
本発明によるプロファイル解析システムは、ユーザのアイテム選択履歴に関する情報を格納したユーザ行動履歴データベースと、複数の種別からなる基本的欲求に対するユーザの定常的な欲求の強さの情報をユーザの欲求プロファイルとして格納したユーザプロファイルデータベースと、アイテムと基本的欲求の種別との対応関係についての情報を格納したアイテムデータベースと、ユーザ行動履歴データベースに格納されたアイテム選択履歴からユーザの基本的欲求に対する欲求満足度を計算する欲求満足度計算部と、欲求満足度と欲求プロファイルとから、ユーザの現在の基本的欲求の強さを計算する欲求計算部と、ユーザの現在の基本的欲求の強さ及びアイテムと基本的欲求の種別との対応関係に基づいて、アイテムデータベースから、現在のユーザの基本的欲求の強さに適したアイテムを推薦する推薦部と、を備える。このようにユーザプロファイルとアイテムを共に基本的欲求で記述することにより、各種サービスによって提供される異種アイテムを統一的に扱い、ユーザが現在必要としているアイテムを適切に推薦することが可能になる。
【発明の効果】
【0011】
本発明によれば、ユーザは、幅広い分野から自身の行動目的に最適な情報を得ることができ、生活行動が豊かになる。また、情報提供者は、ユーザに飽きの来ないサービスを提供することができる。
【0012】
上記した以外の、課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0013】
【図1】本発明の一実施例のプロファイルの解析とその結果からアイテムを推薦する機能を有するシステムの構成図である。
【図2】ユーザ行動履歴データベースに格納されているデータの構成例を示す図である。
【図3】ユーザプロファイルデータベースに格納されているデータの構成例を示す図である。
【図4】アイテムデータベースに格納されているデータの構成例を示す図である。
【図5】処理の概要を示すフローチャートである。
【図6】定常的欲求度の改善機能を有するプロファイル解析システムの構成例を示す図である。
【図7】定常的欲求度の改善機能を有するプロファイル解析システムにおける処理の流れを示すフローチャートである。
【図8】各データベースと欲求解析の関連を表わすシステムの構成図である。
【図9】欲求プロファイルを学習する方式を説明する模式図である。
【図10】アイテムに対する欲求を学習する方式を説明する模式図である。
【図11】アイテムに対する欲求の学習を行う流れを表わすフローチャートである。
【図12】アイテムのクラスタグループに確率表を付与したデータ構成図である。
【図13】アイテムに対する未知の欲求と未知のユーザの欲求プロファイルを学習する方式の説明図である。
【図14】未知のアイテムに対する欲求と未知のユーザの欲求プロファイルを学習する流れを表わすフローチャートである。
【図15】ドメインの異なる複数のアイテムデータベースを有する一実施例のシステム構成例を示す図である。
【図16】ドメインの異なる複数のアイテムデータベースを有する一実施例のユーザ行動履歴データベースのデータ構成例を示す図である。
【図17】ドメインの異なる複数のアイテムデータベースを有する一実施例のアイテムデータベースのデータ構成例を示す図である。
【図18】ドメインの異なる複数のアイテムデータベースを有するシステムにおいてアイテムを提示するまでの流れを示すフローチャートである。
【図19】ドメインの異なる複数のアイテムデータベースに対して推薦に利用するアイテムデータベースを選択する機能を有するシステムの構成例を示す図である。
【図20】ドメインの異なる複数のアイテムデータベースに対して推薦に利用するアイテムデータベースを選択する機能を有するシステムにおける処理の流れを示すフローチャートである。
【図21】個別サービスに接続する機能を有するシステムの構成例を示す図である。
【図22】個別サービスに接続する機能を有するシステムのユーザ行動履歴データベースのデータ構成例を示す図である。
【図23】個別サービスに接続する機能を有するシステムのユーザプロファイルデータベースのデータ構成例を示す図である。
【図24】個別サービスに接続する機能を有するシステムにおける処理の流れを表わすフローチャートである。
【発明を実施するための形態】
【0014】
Nelson, P. : “Information and Consumer Behavior”, Journal of Political Economy, Vol.78, pp.311-329, (1970)に、人間の消費行動は、欲求を満足させることが目的であることが示唆されている。また、Steven Reiss : “Who am I? The 16 Basic Desires that Motivate Our Actions and Define Our Personalities”, Berkley Trade (2002)に示されているように、人間の基本的欲求の存在が知られている。ユーザの消費行動における欲求の強さは、長期的に普遍である欲求の定常的強さと、短期間における欲求の満足度合いから瞬間的な強さ(以下、現在欲求)によって表わすことができる。
【0015】
ここで、基本的欲求とは、例えば、「所有」や「知的好奇心」、「やすらぎ」、「社会的帰属」などである。「所有」とは、モノを集めたい、特別なものを所有したいなど、獲得・所有に関する欲求である。「知的好奇心」とは、未知のものに興味をもつ、知らないことを学びたいなど、知への好奇心に関する欲求である。「やすらぎ」とは、癒されたい、ストレスからの解放、恥を予防したいなど、心のやすらぎに関する欲求である。「社会的帰属」とは、地域や社会を守りたい、地球全体規模で正しいことをしたいなど、社会への帰属意識に関する欲求である。例えば、「所有」の欲求は、切手の収集やシリーズもののテレビ番組の録画、飲料水のおまけ商品、ご当地グルメなどの複数のドメインにおいて現れる。また、「知的好奇心」の欲求は、教育番組の視聴や雑学に関する書籍の購入、史跡めぐりツアーなどの複数のドメインにおいて現れる。「やすらぎ」の欲求は、クラシックコンサートの番組やCD,アロマテラピーに関する商品購入、温泉旅行などの複数のドメインの行動に現れる。「社会的帰属」の欲求は、オリンピックなどの国家を代表するスポーツ番組の視聴や、環境負荷の小さい商品の購入などの複数のドメインにおいて現れる。
【0016】
本発明のプロファイル解析システムは、アイテムをユーザの行動目的である基本的欲求によって定義し、ユーザプロファイルを基本的欲求の強さで表すことによって、ユーザの行動履歴から算出されたユーザの欲求の定常的な強さと現在欲求の強さを比較し、現在の欲求度を算出してその欲求に適合する推薦アイテムを提示する。
【0017】
以下、本発明を実施する場合の実施形態を、図面を用いて詳細に説明する。
【0018】
図1は、本発明の一実施例のシステム構成例を示す図である。本実施例のプロファイル解析システムは、プロファイルの解析とその結果からテレビ番組の推薦機能を有するシステムである。本システムは、テレビ番組の視聴履歴に関する情報を格納したユーザ行動履歴データベース101と、ユーザ行動履歴データベース101から欲求満足度を計算する欲求満足度計算部102と、ユーザがそれぞれの基本的欲求に対してどのような特性があるかを表す情報である欲求プロファイルを格納するユーザプロファイルデータベース103と、欲求満足度計算部102及びユーザプロファイルデータベース103から現在の欲求の強さを計算する欲求度計算部104と、推薦を行うテレビ番組がどのような基本的欲求を満たすか、又は、一般的にどのような基本的欲求から対象のテレビ番組を視聴するかの情報を格納するアイテムデータベース105と、欲求度計算部104及びアイテムデータベース105から現在のユーザの欲求に適したテレビ番組を推薦する推薦部106を有する。ここで、欲求とは、知的好奇心や所有欲、社会的帰属欲求などを代表とする人間の行動原理となる基本的欲求のことを指す。
【0019】
図2は、ユーザ行動履歴データベース101に格納されているデータの構成例を示す図であり、ユーザを一意に識別するユーザID201と、テレビ番組を一意に識別するアイテムID202と、当該テレビ番組の視聴にとって満たされる基本的欲求の種別を表わす欲求ID203と、番組を視聴した日時204で構成される。
【0020】
図3は、ユーザプロファイルデータベース103に格納されているユーザプロファイルデータの構成例を示す図であり、ユーザを一意に識別するユーザID301と、ある基本的欲求に対してユーザが日常的にどの程度の欲求を持っているかを示す定常的な欲求度(以下、定常的欲求度)を表す割合である欲求IDnの強さ302で構成される。本例では、基本的欲求はID1〜ID19の19種類とした。ユーザの定常的な欲求の強さは、例えば、ユーザがサービス加入段階で心理テストなどのアンケートに回答することで生成するものとしてもよい。また、ユーザ自身で設定するものとしてもよい。定常的な欲求度は、季節によって異なるため、季節毎に登録するものとしてもよい。後述のように、学習・推定するものとしてもよい。
【0021】
図4は、アイテムデータベース105に格納されているデータの構成例を示す図であり、テレビ番組を一意に識別するアイテムID401と、テレビ番組の視聴行動の元となる基本的欲求の種別を表わす欲求ID402と、テレビ番組の詳細を表わした詳細403で構成される。テレビ番組の視聴行動の元となる基本的欲求の種別は、例えば、サービス提供時に提供者が任意に設定するものとしてもよい。後述のように、学習・推定するものとしてもよい。詳細403には、アイテムに関する情報がテキストデータとして格納されている。
【0022】
図5は、本実施例における処理の概要を示すフローチャートである。プロファイル解析システムを起動すると(S501)、ユーザ行動履歴データベース101に格納されたテレビ番組視聴履歴に関する欲求情報をもとに欲求満足度計算部102により欲求満足度を計算する(S502)。ここで欲求満足度とは、現時点で対象のユーザのどのような基本的欲求が満たされており、どのような基本的欲求が満たされていないかを基本的欲求ごとに示す割合であり、例えば以下の計算式で算出する。
【0023】
【数1】
【0024】
ここで、任意の欲求IDをnとすると、Snは欲求IDnの欲求満足度であり、Ctotalは全ての行動の総数であり、Cnは行動の中で欲求IDnを満たした回数である。テレビ番組であれば、回数でなく、番組の長さや視聴時間などを基準に計算してもよい。テレビ番組以外の商品の場合には、値段などを利用してもよい。その場合、例えば、Ctotalはユーザが費やした全費用、Cnは欲求IDnのために費やした費用とすればよい。
【0025】
欲求満足度は、例えば、ユーザ行動履歴データベース101に格納された日時204をもとに、例えば過去1週間の行動履歴から算出するものとする。その場合、ユーザ行動履歴データベース101には、欲求満足度の計算に用いる期間内の行動履歴のみ格納しても良い。
【0026】
次に、全ての基本的欲求について、欲求満足度とユーザプロファイルデータベース103に格納された定常的欲求度をもとに欲求度計算部104により現在の基本的欲求の強さを計算し(S503)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S504)。
現在の基本的欲求の強さは、例えば以下の計算式で算出する。
【0027】
【数2】
【0028】
ここで、Qnは、欲求IDnの現在の強さを表す割合であり、0から1の間の値をとる。Snは欲求IDnの欲求満足度であり、ユーザプロファイルデータベース103で管理されているSSnは欲求IDnの定常的欲求度を表す割合であり、0から1の間の値をとる。欲求満足度Snが定常的欲求度SSnの割合に達している場合、現在欲求が十分に満たされているものものとしてQnは0の値をとる。なお、計算式は基本的欲求の強さを表現できれば、他の方式でもよい。
【0029】
最後に、S504で抽出した基本的欲求を満たすテレビ番組をアイテムデータベース105から抽出し(S505)、ユーザに推薦するテレビ番組を提示する(S506)。
【0030】
例えば、現在欲求抽出処理で算出された最も強い基本的欲求が「知的好奇心」である場合、一般的に「知的好奇心」の基本的欲求を満たす「教育番組」「クイズ番組」などのテレビ番組が推薦されることになる。ここで、ユーザに推薦するテレビ番組は、全ての欲求度の中で最も強い基本的欲求に該当するテレビ番組を選択してもよいし、ある一定値以上の欲求度に該当するテレビ番組をまとめて推薦してもよい。
【0031】
行動履歴は、番組視聴のみでなく、異なるドメインの行動履歴を利用することも可能である。その場合、現在欲求抽出処理で算出された最も強い基本的欲求が「知的好奇心」である場合、「教育番組」「クイズ番組」のほか、「雑学に関する書籍」「プラネタリウム」などの異なるドメインに属する商品なども推薦する。
【0032】
次に、上記実施例について、推薦したテレビ番組に対するユーザの反応をもとに定常的欲求度の改善を行うことにより、より精度の高い推薦を行うことを目的としたプロファイル解析システムについて説明する。
【0033】
図6は、本発明の、定常的欲求度の改善機能を有するプロファイル解析システムの一実施例の構成例を表わすシステム構成図である。このシステムは、ユーザの行動履歴に関する情報を格納したユーザ行動履歴データベース601と、ユーザ行動履歴データベース601から欲求満足度を計算する欲求満足度計算部602と、基本的欲求の定常的な欲求度の情報を格納したユーザプロファイルデータベース603と、欲求満足度計算部602及びユーザプロファイルデータベース603から現在の基本的欲求の強さを計算する欲求度計算部604と、基本的欲求に対応するアイテムの情報を格納したアイテムデータベース605と、欲求度計算部604及びアイテムデータベース605から現在のユーザの基本的欲求に適したアイテムを推薦する推薦部606と、推薦部606で推薦したテレビ番組がユーザに選択されなかった場合に推薦に用いた基本的欲求の定常的な欲求度の値を再計算し改善するフィードバック処理部607から構成される。
【0034】
図7は、定常的欲求度の改善機能を有するプロファイル解析システムにおける処理の概要を示すフローチャートである。
【0035】
まず、プロファイル解析システムを起動すると(S701)、ユーザ行動履歴データベース601に格納されたテレビ番組視聴履歴に関する欲求情報をもとに欲求満足度計算部602により欲求満足度を計算する(S702)。欲求満足度の計算式は上述の式(1)と同様である。次に、全ての欲求について、欲求IDnの欲求満足度とユーザプロファイルデータベース603に格納された定常的欲求度をもとに欲求度計算部604により現在の基本的欲求の強さを計算し(S703)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S704)。現在の基本的欲求の強さの計算式は上述の式(2)と同様である。次に、抽出した基本的欲求を満たすテレビ番組をアイテムデータベース605から抽出し推薦するテレビ番組を決定し(S705)、ユーザに推薦するテレビ番組を提示する(S706)。ここで、推薦されたテレビ番組をユーザが視聴しなかった場合(S707)、推薦する番組の抽出を行った処理(S705)に用いた基本的欲求の定常的欲求度を低く調整し、調整した値をユーザプロファイルデータベース603に再格納する(S708)。定常的欲求度の調整後の値は、例えば以下の計算式で算出する。
【0036】
【数3】
【0037】
ここで、SSnnewは、欲求IDnの定常的欲求度の調整後の値である。wは1回のテレビ番組推薦で行ったユーザの視聴行動をどの程度定常的欲求度の調整に反映するかを決定するパラメータであり、0から1の間の値をとる。SSnoldは欲求IDnの定常的欲求度の調整前の値である。計算式は、定常的欲求度に対してフィードバックできるものであれば、他の式を用いてもよい。
【0038】
以上説明した定常的欲求度の改善機能は、本発明の全ての実施例に対して適用可能である。
【0039】
図8は、欲求解析によって、アイテムデータベースに登録されるテレビ番組などのアイテムが対応する基本的欲求や、各ユーザの欲求プロファイルを既知の情報から学習するシステムの構成例を示す図である。このシステムは、ユーザの行動履歴に関する情報を格納したユーザ行動履歴データベース801と、基本的欲求の定常的な欲求度の情報を格納したユーザプロファイルデータベース802と、基本的欲求に対応するテレビ番組などのアイテムの情報を格納したアイテムデータベース803と、ユーザ行動履歴データベース801及びユーザプロファイルデータベース802及びアイテムデータベース803をもとに未知のユーザの欲求プロファイル又はアイテムに対する未知の基本的欲求を解析する欲求解析部804で構成される。
【0040】
図9は、アイテムに対する基本的欲求が全て既知であり、ユーザの欲求プロファイルが全て未知の場合に、各ユーザの欲求プロファイルを学習する方式を説明する模式図である。対応する基本的欲求が既知であるアイテム群901はアイテムデータベース803に格納された情報であり、欲求プロファイルが未知であるユーザ902のアイテム選択履歴からそのアイテムに対応する欲求度を抽出し、ユーザ902の欲求プロファイル903を作成する。すなわち、ユーザ902が選択した各アイテムにそれぞれ対応する基本的欲求を基本的欲求の種別ごとに集計し、各基本的欲求の欲求度を計算して、それをそのユーザの欲求プロファイル903とする。欲求度の計算は、上述の式(1)を利用して計算してもよい。また、欲求度を抽出するためのアイテム選択履歴の選定に関して、習慣性のある行動は周期性を伴うことを考慮してもよい。さらに、季節性のある行動なども考慮してよい。
【0041】
図10は、ユーザの欲求プロファイルが既知で、アイテムに対応する基本的欲求を学習する方式を説明する模式図である。基本的欲求が未知であるアイテム群1001を、アイテム間の類似度を計算することによりクラスタリング(グループ分け)し、クラスタリング結果1002からユーザ1003の欲求プロファイル1004に適応するようにクラスタリング結果1002に基本的欲求を割り振る。このとき、各アイテム集合に属するアイテムには同じ種別の基本的欲求が一つあるいは複数割り振られる。
【0042】
図11は、アイテムのクラスタリングを行い、クラスタに基本的欲求を割り振るまでの流れを表わすフローチャートである。まず、アイテム間の類似度を算出することにより対応する基本的欲求が未知のアイテム群1001をクラスタリングする(S1101)。例えば、アイテム間の類似度は、下式(4)のようなユーザの行動をもとに算出する方法でも、下式(5)のようなアイテム自体の特徴を利用したコンテンツベースのものでもよい。その他のアイテム間類似度を表すものを利用してもよい。
【0043】
【数4】
【0044】
ここで、InはアイテムIDがnであるアイテムを表し、d(In,Im)はアイテムInとImの類似度である。P(In,Im)は、アイテムInとImを両方利用したユーザの人数である。
【0045】
【数5】
【0046】
ここで、iはアイテムの詳細情報に含まれる単語であり、In(i)は単語iが含まれるか否かを表し、0か1の2種類の値でも良いし、単語の出現回数としてもよい。
【0047】
クラスタリング手法は、階層的クラスタリングやk-meansなどの従来手法を用いるものとし、クラスタ内に重複を許す形式とする。次に、上記の手法で生成されたクラスタに対して、各基本的欲求をランダムで設定する(S1102)。クラスタに割り振られた基本的欲求によって、各ユーザがそのクラスタを選択した場合に算出される欲求プロファイル1004を計算し、既知のユーザの欲求プロファイルと比較することにより、各基本的欲求の適合度合いを算出する(S1103)。ここで欲求プロファイルの計算は、式(1)、式(2)を全ての基本的欲求について計算した結果であってもよい。各基本的欲求の適合度合いは、例えば以下の計算式で算出する。
【0048】
【数6】
【0049】
Gkはクラスタを表し、R(Gk,Di)はクラスタGkと割り振られた基本的欲求Diとの適合度合いを表す。Uin(Gk,Di)は、ユーザnがクラスタGkを利用した履歴から生成される基本的欲求Diの強さであり、Untrue(Di)は、ユーザnの欲求プロファイルの欲求番号iの基本的欲求Diの強さである。使用する計算式は、適合度合いを表すものであれば、他の式でもよい。
【0050】
各クラスタに対応する基本的欲求の適合度合いを下式(7)のような誤差関数を最小化するように調整することで、S1102でランダムに割り振ったクラスタに対応する基本的欲求を学習する(S1104)。
【0051】
【数7】
【0052】
誤差関数は、基本的欲求の適合度合いを調整するものであれば、式(7)以外の方式でもよい。
【0053】
最小化方法は、遺伝的アルゴリズムや最急降下法などを用いればよい。もしくは、各クラスタに対して、各基本的欲求に対応する確率値を付与し、確率の調整を行うとしてもよい。図12は、確率表を付与したデータ構成図であり、アイテムとクラスタの関連を格納したアイテム表1201と、クラスタの各基本的欲求の確率を格納した確率表1202で構成され、その確率値をもとに確率の調整を行う。確率の調整は、前述の式(7)で示した各クラスタに対応する基本的欲求の適合度合いを最小化すればよい。
【0054】
図13は、一部のアイテムに対応する基本的欲求の種別と一部のユーザの欲求プロファイルが既知である場合に、その他多数の、基本的欲求の種別が関連づけられていないアイテムと、欲求プロファイルが未知のユーザの欲求プロファイルを学習する方式を説明する模式図である。対応する基本的欲求が既知であるアイテム群1301と、対応する基本的欲求が未知であるアイテム群1302の類似度を計算し、基本的欲求が未知であるアイテムの基本的欲求を、基本的欲求が既知である類似度の高いアイテムの欲基本的求に対応する基本的欲求と同じものとして設定する。設定されたアイテムの基本的欲求に基づき上記のようにして欲求プロファイルが既知のユーザ1303の欲求プロファイルを計算し、既知の欲求プロファイルとの比較を行うことでアイテムに対応する基本的欲求をより精度の高いものに調整する。また、欲求プロファイルが未知のユーザ1304の行動履歴から欲求プロファイルを作成し、欲求プロファイルが既知のユーザの行動履歴から類似度の高いユーザを特定することで、更なるアイテムの基本的欲求の学習を行う。
【0055】
図14は、未知の欲求プロファイルと未知のアイテムに対する基本的欲求の関連づけを行うまでの流れを表わすフローチャートである。
【0056】
まず、ある基本的欲求との関連が未知であるアイテムについて、基本的欲求との関連が既知である全てのアイテムとの類似度を計算する(S1401)。類似度の計算は、上述の式(4)や式(5)を用いて算出することができる。対応する基本的欲求が未知のアイテムの基本的欲求を、計算された類似度の高い既知のアイテムに対応する基本的欲求と同じ基本的欲求として設定する(S1402)。S1401、S1402は基本的欲求が未知である全てのアイテムについて行われる。
【0057】
次に、欲求プロファイルが既知のユーザの行動履歴から、計算されたアイテムの基本的欲求に基づき既知ユーザ1303のユーザプロファイル1305を算出し、上述の式(6)の誤差関数を最小にするようにアイテムに設定した基本的欲求に対する確率値を調整する(S1403)。さらに、算出された基本的欲求が未知のアイテムの基本的欲求ならびに、基本的欲求が既知のアイテムの基本的欲求を用いて、欲求プロファイルが未知のユーザの欲求プロファイルを算出する(S1404)。欲求プロファイルは上述の式(1)、式(2)を全ての基本的欲求について計算した結果であってもよい。算出された欲求プロファイルが未知のユーザの欲求プロファイルについて、欲求プロファイルが既知であるユーザの行動履歴と対象ユーザとの行動履歴から類似度の高い欲求プロファイルが既知のユーザを特定し、そのユーザの欲求プロファイルとの誤差が最小になるように、例えば下式(8)で示す誤差関数をもとに調整を行う(S1405)。
【0058】
【数8】
【0059】
Rlog(Ui,Uj)は行動履歴での類似度、Rprofile(Ui,Uj)は算出されたユーザプロファイルの類似度である。誤差関数は、欲求プロファイルとの差が表現できるものであれば、他の式を用いてもよい。
【0060】
S1403とS1405の双方の処理が最小化されるまで処理を繰り返し(S1403,S1404,S1405)、最小化された時点(S1406)の計算で利用した欲求プロファイルが未知のユーザの欲求プロファイルと、アイテムと基本的欲求との対応が未知の基本的欲求に対する各値を採用する(S1407)。最小化方法は、遺伝的アルゴリズムや最急降下法などを用いればよい。
【0061】
図15は、ドメインの異なる複数のアイテムデータベースを有する本発明の一実施例の構成例を表わすシステム構成図であり、テレビ番組情報と書籍情報と観光地情報を同時に推薦する機能を有したプロファイル解析システムである。テレビ番組の視聴履歴や書籍の閲覧履歴、観光地の訪問履歴などを格納するユーザ行動履歴データベース1501と、ユーザ行動履歴データベース1501から欲求満足度を計算する欲求満足度計算部1502と、基本的欲求の定常的な欲求度(強さ)の情報を格納したユーザプロファイルデータベース1503と、欲求満足度計算部1502及びユーザプロファイルデータベース1503から現在の基本的欲求の強さを計算する欲求度計算部1504と、推薦を行うテレビ番組情報、書籍情報、観光地情報などのアイテムをそれぞれ格納する複数のアイテムデータベース1505と、欲求度計算部1504及び複数のアイテムデータベース1505から現在のユーザの基本的欲求に適したアイテムを推薦する推薦部1506から構成される。
【0062】
図16は、本実施例におけるユーザ行動履歴データベース1501のデータ構成例を示す図であり、ユーザを一意に識別するユーザID1601と、個別ドメインを一意に識別するドメインID1602と、アイテムを一意に識別するアイテムID1603と、基本的欲求の種別を表わす欲求ID1604と、ユーザが行動を起こした日時1605で構成される。
【0063】
図17は、本実施例におけるよるアイテムデータベース1505に格納されているデータの構成例を示す図であり、個別サービスを一意に識別するドメインID1701と、アイテムを一意に識別するアイテムID1702と、基本的欲求の種別を表わす欲求ID1703と、アイテムの詳細をテキストで表わした詳細1704で構成される。
【0064】
図18は、本実施例のプロファイル解析システムの動作を示すフローチャートである。まず、プロファイル解析システムを起動すると(S1801)、ユーザ行動履歴データベース1501に格納されたテレビ番組の視聴履歴、書籍の閲覧履歴、観光地の訪問履歴などのドメインの異なる全ての行動履歴情報(アイテム選択履歴情報)から欲求満足度計算部1502により欲求満足度を計算する(S1802)。欲求満足度の計算は、上述の式(1)によって算出することができる。各履歴はドメインが異なるため、性質の異なるものであるが、各行動を基本的欲求によって評価するため、異なるドメインの履歴情報をもとに欲求満足度を抽出することができることは言うまでもない。次に、欲求IDnの満足度とユーザプロファイルデータベース1503に格納された定常的欲求度をもとに欲求度計算部1504により現在の基本的欲求の強さを計算し(S1803)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S1804)。現在の基本的欲求の強さは上述の式(2)によって算出できる。最後に、S1804で抽出した基本的欲求を満たすアイテムを各アイテムデータベース1505から抽出し推薦するアイテムを決定し(S1805)、ユーザに推薦するアイテムを提示する(S1806)。
【0065】
本実施例では、現在の基本的欲求に対応するアイテムを、ドメインの異なる複数のアイテムデータベース1505から検索し、現在欲求に対応する推薦アイテムをユーザに推薦することができる。例えば、S1804で決定された現時点で強く望んでいる基本的欲求が「知的好奇心」であった場合、教育番組、クイズ番組などのテレビ番組、及び参考書、学術誌などの書籍、及び工場見学、遺跡見学などの観光地などを同時に推薦することが可能である。
【0066】
図19は、複数のドメインのアイテムデータベースを有するプロファイル解析システムにおける推薦時のドメイン利用可否、並びにドメイン利用順序を決定する機能を有する実施例のシステム構成例を示す図である。このシステムは、テレビ番組の視聴履歴や書籍の閲覧履歴、観光地の訪問履歴などを格納するユーザ行動履歴データベース1901とユーザ行動履歴データベース1901から欲求満足度を計算する欲求満足度計算部1902と、基本的欲求の定常的な強さの情報を格納したユーザプロファイルデータベース1903と、欲求満足度計算部1902及びユーザプロファイルデータベース1903から現在の基本的欲求の強さを計算する欲求度計算部1904と、推薦を行うテレビ番組情報、書籍情報、観光地情報などのアイテム情報をそれぞれ格納する複数のアイテムデータベース1905と、欲求度計算部1904及びアイテムデータベース1905から現在のユーザの基本的欲求に適したアイテムを推薦する推薦部1906と、複数のドメインのアイテムデータベースからどのアイテムデータベースを利用するかを決定するドメイン選択部1907から構成される。一般的にアイテムのドメインによって、そのドメインを利用する人間の行動原理となる基本的欲求は類似していることが考えられる。図15の構成図で示した複数のドメインのアイテムについて全て推薦を行った場合、ユーザにとって最も有用なドメインの推薦が他のドメインの推薦によって埋もれたり、推薦の順番が最後になる可能性がある。本実施例の方式を利用することで、より有用なドメインの推薦結果を先に提供することが可能となる。
【0067】
図20は、本実施例の処理手順を示すフローチャートである。まず、プロファイル解析システムが起動すると(S2001)、ユーザ行動履歴データベース1901に格納されたテレビ番組の視聴履歴、書籍の閲覧履歴、観光地の訪問履歴等のドメインの異なる全ての行動履歴情報を利用して欲求満足度計算部1902により欲求満足度を計算する(S2002)。欲求満足度は、上述の式(1)によって算出することができる。次に、欲求IDnの満足度とユーザプロファイルデータベース1903に格納された定常的欲求度をもとに欲求度計算部1904により現在の基本的欲求の強さを計算し(S2003)、ユーザが現時点で強く望んでいる基本的欲求を抽出する(S2004)。現在の基本的欲求の強さは上述の式(2)によって算出できる。次に、ユーザ行動履歴データベース1901から対象の基本的欲求を満たした行動の回数をドメインごとに集計し、より多くの行動が行われたドメインを決定する(S2005)。本ステップで利用する行動履歴は、対象のユーザの行動履歴のみを利用したユーザに特化した情報であっても、全ユーザの行動履歴を利用したより一般的な情報であっても、その組み合わせであってもよい。最後に、S2004で抽出した基本的欲求を満たすアイテムを、S2005で選択したドメインのアイテムデータベース1905から決定し(S2006)、ユーザに推薦するアイテムを提示する(S2007)。
【0068】
本実施例では、ドメインとアイテムを選択する際に最も大きな現在欲求を利用したが、複数の基本的欲求を利用してもよい。また、ドメインの決定についても1つのドメインを特定するだけではなく、各ドメインに行動回数から優先度を設定し、優先度の高いドメインを一部又は全て利用することができることは言うまでもない。
【0069】
図21は、既存のさまざまなコンテンツを提供する推薦サービスに本発明のプロファイル解析システムを適用した一実施例を示す構成図である。このシステムは、それぞれのサービスにおける行動履歴を格納したユーザ行動履歴データベース2101と、ユーザ行動履歴データベース2101から欲求満足度を計算する欲求満足度計算部2102と、定常的欲求の強さと、各個別サービス利用時の、特定の基本的欲求を満たすアイテム内でのキーワードの出現頻度情報を格納したユーザプロファイルデータベース2103と、欲求満足度計算部2102及びユーザプロファイルデータベース2103から現在の基本的欲求の強さを計算する欲求度計算部2104と、基本的欲求の強さから推薦に利用する基本的欲求を選択する欲求推薦部2105と、推薦された基本的欲求から利用するサービスを特定するサービス選択部2106と、個別サービスに対して欲求推薦部で決定された基本的欲求に基づく検索キーワードを算出する推薦候補キーワード変換部2107を持ち、サービスに対して固有の条件からアイテムを推薦する個別推薦部2108とそのサービスに含まれるアイテムと個別推薦条件との関連情報を持つアイテムデータベース2109を持ち、テレビ番組推薦サービス、書籍販売サービス、観光案内サービスなどの既存サービスと接続し、推薦結果を取得する機能を持つプロファイル解析システムである。
【0070】
テレビ番組推薦サービス、食品販売サービス、書籍販売サービスなどの既存サービスには、前述のようなアイテムと基本的欲求を関連づける情報をアイテムデータベースとして格納していないのが一般的であり、各個別サービスは、それぞれ固有の個別推薦部2108と、個別のアイテムデータベース2109を持つ。本実施例は、プロファイル解析システムにより算出された基本的欲求を基に個別サービスの個別推薦システムに適合できる形のキーワード情報を算出し、そのキーワードを用いて各個別サービスを利用する。
【0071】
図22は、ユーザ行動履歴データベース2101に格納されるユーザ行動履歴データの構成図であり、ユーザを一意に特定するユーザID2201と、接続されているサービスを特定するサービスID2202と、各種サービスが提供するテレビ番組情報、書籍情報、観光地情報などを特定するアイテムID2203と、当該行動を行った際に満たされたもしくは、当該行動の行動原理となった基本的欲求を示す欲求ID2204と、その行動を行った日時2205で構成される。欲求ID2204はアイテムデータベースに格納されている。アイテムデータベースは、当該行動の行動原理となった基本的欲求を前実施例によって学習する。
【0072】
図23は、ユーザプロファイルデータベース2103に格納される欲求プロファイルと対象のサービスを特定の基本的欲求に基づいて利用したときに選択した検索キーワードの出現頻度情報を示す構成図である。欲求プロファイルは、ユーザを特定するユーザID2301と、各基本的欲求の定常的欲求度を示す情報である欲求IDnの強さ2302から構成される。検索キーワードの出現頻度情報は、ユーザを特定するユーザID2303と、サービスを特定するサービスID2304と、サービスを利用する行動原理となる欲求2305と、そのサービスをその基本的欲求から利用した場合に個別推薦部の入力となるキーワードの出現頻度2306から構成される。本情報は、個別サービスごとにサービス提供元が一意に決めてもよいし、ユーザ加入時のアンケートなどによって作成してもよい。または、そのサービスの利用履歴から、tfidfなどの特徴語抽出に用いる頻度算出方式を利用して値を算出するものとしてもよい。
【0073】
図24は、本実施例のフローチャートである。プロファイル解析システムが起動すると(S2401)、ユーザ行動履歴データベース2101に格納された欲求をもとに欲求満足度計算部2102により欲求満足度を計算する(S2402)。次に、欲求IDnの満足度とユーザプロファイルデータベース2103に格納された定常的欲求度をもとに欲求度計算部2104により現在の基本的欲求の強さを計算し(S2403)、ユーザが持っている強い基本的欲求を抽出し(S2404)、抽出した基本的欲求を有するサービスをユーザ行動履歴データベース2101から検索し、利用するサービスを特定する(S2405)。次に、S2404で抽出した基本的欲求及びS2405で選択したサービスをもとに、ユーザプロファイルデータベース2103から単語IDnの頻度2306の値が大きい単語を推薦候補キーワードとする(S2406)。その後、個別推薦部2108に処理を渡す。
【0074】
一方、個別推薦部2108では、個別のサービスで保持しているアイテムデータベース2109に格納された検索キーワードと推薦候補キーワードを比較することで推薦するアイテムを決定し(S2408)、ユーザに推薦するアイテムを提示する(S2409)。または、単語の出現頻度を利用して、例えば下式に従って推薦スコアを計算し、推薦スコア上位を推薦するアイテムとする。
【0075】
【数9】
【0076】
ここで、Score(Item_ID)は、アイテムIDがItem_IDであるアイテムの推薦スコアであり、P(Item_ID)は、アイテムIDがItem_IDであるアイテムの単語集団であり、|P(Item_ID)|はP(Item_ID)の単語数を表す。Fi(User_ID)はユーザIDがUser_IDであるユーザの単語IDがiの単語の頻度である。スコアの計算方式は、アイテムの推薦順位を決定できるものであれば、その他の方式でもよい。
【0077】
本実施例では、テレビ番組情報、書籍情報、観光地情報などのアイテム情報ならびに、各種推薦サービスとの組み合わせを例としたが、さまざまなドメインのアイテムを推薦する機能について適用できることは言うまでもない。
【0078】
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
【0079】
また、上記の各構成、機能、処理部、処理手段等は、それらの一部や全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
【符号の説明】
【0080】
101…ユーザ行動履歴データベース、102…欲求満足度計算部、103…ユーザプロファイルデータベース、104…欲求度計算部、105…アイテムデータベース、106…推薦部、601…ユーザ行動履歴データベース、602…欲求満足度計算部、603…ユーザプロファイルデータベース、604…欲求度計算部、605…アイテムデータベース、606…推薦部、607…フィードバック処理部、801…ユーザ行動履歴データベース、802…ユーザプロファイルデータベース、803…アイテムデータベース、804…欲求解析部、1201…アイテム表、1202…確率表、1501…ユーザ行動履歴データベース、1502…欲求満足度計算部、1503…ユーザプロファイルデータベース、1504…欲求度計算部、1505…アイテムデータベース、1506…推薦部、1901…ユーザ行動履歴データベース、1902…欲求満足度計算部、1903…ユーザプロファイルデータベース、1904…欲求度計算部、1905…アイテムデータベース、1906…推薦部、1907…ドメイン選択部、2101…ユーザ行動履歴データベース、2102…欲求満足度計算部、2103…ユーザプロファイルデータベース、2104…欲求度計算部、2105…欲求推薦部、2106…サービス選択部、2107…推薦候補キーワード変換部、2108…個別推薦部、2109…アイテムデータベース
【特許請求の範囲】
【請求項1】
ユーザのアイテム選択履歴に関する情報を格納したユーザ行動履歴データベースと、
複数の種別からなる基本的欲求に対するユーザの定常的な欲求の強さの情報をユーザの欲求プロファイルとして格納したユーザプロファイルデータベースと、
アイテムと前記基本的欲求の種別との対応関係についての情報を格納したアイテムデータベースと、
前記ユーザ行動履歴データベースに格納されたアイテム選択履歴からユーザの前記基本的欲求に対する欲求満足度を計算する欲求満足度計算部と、
前記欲求満足度と前記欲求プロファイルとから、ユーザの現在の基本的欲求の強さを計算する欲求計算部と、
前記ユーザの現在の基本的欲求の強さ及び前記アイテムと前記基本的欲求の種別との対応関係に基づいて、前記アイテムデータベースから、前記現在のユーザの基本的欲求の強さに適したアイテムを推薦する推薦部と、
を備えることを特徴とするプロファイル解析システム。
【請求項2】
請求項1に記載のプロファイル解析システムにおいて、
前記推薦部が推薦したアイテムがユーザに選択されなかったとき、当該アイテムに対応する前記基本的欲求の強さを低減するように前記ユーザの欲求プロファイルを修正することを特徴とするプロファイル解析システム。
【請求項3】
請求項1に記載のプロファイル解析システムにおいて、
前記ユーザ行動履歴データベースに格納されたユーザのアイテム選択履歴から、選択されたアイテムに対応する基本的欲求をその種別ごとに集計して各基本的欲求の相対的強さを算出し、それを当該ユーザの欲求プロファイルとするユーザプロファイル学習部を備え、
アイテムと基本的欲求の種別との対応関係が既知であり、ユーザの欲求プロファイルが未知である場合に、前記ユーザプロファイル学習部によってユーザの欲求プロファイルを学習することを特徴とするプロファイル解析システム。
【請求項4】
請求項1に記載のプロファイル解析システムにおいて、
アイテムを類似度に応じて複数のアイテム集合にクラスタリングする手段と、
前記クラスタリングされたアイテム集合に基本的欲求の種別を割り振る手段と、
前記アイテム集合に割り振られた基本的欲求の種別と前記ユーザ行動履歴データベースに格納されたユーザのアイテム選択履歴とからユーザの欲求プロファイルを算出する手段と、
前記算出された欲求プロファイルと既知のユーザの欲求プロファイルの適合度を算出する手段と、
前記適合度を最大化するように前記アイテム集合に割り当てられる基本的欲求の種別を調整する手段とを備え、
アイテムと基本的欲求の種別との対応関係が未知であり、ユーザの欲求プロファイルが既知である場合に、各アイテムに対応する基本的欲求の種別を学習することを特徴とするプロファイル解析システム。
【請求項5】
請求項1に記載のプロファイル解析システムにおいて、
基本的欲求の種別との対応関係が既知のアイテムと未知のアイテム間の類似度を計算する手段と、
前記類似度の高いアイテム間において、前記対応関係が既知のアイテムの基本的欲求の種別を前記対応関係が未知のアイテムの基本的欲求の種別として設定する手段と、
前記対応関係が未知のアイテムに設定された基本的欲求の種別を用い、欲求プロファイルが既知であるユーザのアイテム選択履歴から、選択されたアイテムに対応する基本的欲求をその種別ごとに集計して各基本的欲求の相対的強さを当該ユーザの欲求プロファイルとして算出し、算出した欲求プロファイルと前記既知の欲求プロファイルとの適合度が最大化されるように、前記対応関係が未知のアイテムに対して設定された基本的欲求の種別を調整する手段と、
欲求プロファイルが未知のユーザのアイテム選択履歴から、選択されたアイテムに対応する基本的欲求をその種別ごとに集計して各基本的欲求の相対的強さを当該ユーザの欲求プロファイルとして算出し、当該ユーザとアイテム選択履歴の類似度が高く欲求プロファイルが既知であるユーザの欲求プロファイルと前記算出された欲求プロファイルとの適合度を算出し、それが最大化されるように前記対応関係が未知のアイテムに対して設定された基本的欲求の種別を調整する手段とを備え、
一部のアイテムに対応する基本的欲求の種別と、一部のユーザの欲求プロファイルとが既知である場合に、基本的欲求の種別との対応関係が未知のアイテムに対する基本的欲求の種別と、欲求プロファイルが未知のユーザの欲求プロファイルとを学習することを特徴とするプロファイル解析システム。
【請求項6】
請求項1に記載のプロファイル解析システムにおいて、複数のアイテムデータベースを備え、前記推薦部は前記複数のアイテムデータベースから前記現在のユーザの基本的欲求の強さに適したアイテムを推薦することを特徴とするプロファイル解析システム。
【請求項7】
請求項6に記載のプロファイル解析システムにおいて、
前記現在の欲求の強さと前記行動履歴データベースに格納された欲求プロファイルとから欲求に対応するアイテムデータベースを選択する選択手段とを有し、
前記推薦部は、前記選択手段によって選択されたアイテムデータベールから、前記現在の基本的欲求の強さに適したアイテムを推薦することを特徴とするプロファイル解析システム。
【請求項8】
ユーザが選択したアイテム及び当該アイテムを提供したサービス、及び当該アイテムの選択に関連する基本的欲求についての情報を格納したユーザ行動履歴データベースと、
複数の種別からなる基本的欲求に対するユーザの定常的な欲求の強さを示す欲求プロファイルと、各サービスについて基本的欲求の種別とキーワードとの対応を示す情報を格納したユーザプロファイルデータベースと、
前記ユーザ行動履歴データベースに格納されたアイテム選択履歴からユーザの基本的欲求に対する欲求満足度を計算する欲求満足度計算部と、
前記欲求満足度と前記欲求プロファイルとから、ユーザの現在の基本的欲求の強さを計算する欲求計算部と、
前記欲求計算部の計算結果からユーザの有する強い基本的欲求を選択する欲求推薦部と、
前記欲求推薦部によって選択された基本的欲求から利用するサービスを選択するデータベース選択部と、
前記選択されたサービスと前記欲求推薦部で選択された基本的欲求に基づき、前記ユーザプロファイルデータベースからキーワードを抽出する手段と、
前記抽出したキーワードを前記選択したサービスを提供するデータベースに検索キーとして送信する送信手段と、
前記データベースから検索結果として送信されてきたアイテムを受信する受信手段と、
有することを特徴とするプロファイル解析システム。
【請求項1】
ユーザのアイテム選択履歴に関する情報を格納したユーザ行動履歴データベースと、
複数の種別からなる基本的欲求に対するユーザの定常的な欲求の強さの情報をユーザの欲求プロファイルとして格納したユーザプロファイルデータベースと、
アイテムと前記基本的欲求の種別との対応関係についての情報を格納したアイテムデータベースと、
前記ユーザ行動履歴データベースに格納されたアイテム選択履歴からユーザの前記基本的欲求に対する欲求満足度を計算する欲求満足度計算部と、
前記欲求満足度と前記欲求プロファイルとから、ユーザの現在の基本的欲求の強さを計算する欲求計算部と、
前記ユーザの現在の基本的欲求の強さ及び前記アイテムと前記基本的欲求の種別との対応関係に基づいて、前記アイテムデータベースから、前記現在のユーザの基本的欲求の強さに適したアイテムを推薦する推薦部と、
を備えることを特徴とするプロファイル解析システム。
【請求項2】
請求項1に記載のプロファイル解析システムにおいて、
前記推薦部が推薦したアイテムがユーザに選択されなかったとき、当該アイテムに対応する前記基本的欲求の強さを低減するように前記ユーザの欲求プロファイルを修正することを特徴とするプロファイル解析システム。
【請求項3】
請求項1に記載のプロファイル解析システムにおいて、
前記ユーザ行動履歴データベースに格納されたユーザのアイテム選択履歴から、選択されたアイテムに対応する基本的欲求をその種別ごとに集計して各基本的欲求の相対的強さを算出し、それを当該ユーザの欲求プロファイルとするユーザプロファイル学習部を備え、
アイテムと基本的欲求の種別との対応関係が既知であり、ユーザの欲求プロファイルが未知である場合に、前記ユーザプロファイル学習部によってユーザの欲求プロファイルを学習することを特徴とするプロファイル解析システム。
【請求項4】
請求項1に記載のプロファイル解析システムにおいて、
アイテムを類似度に応じて複数のアイテム集合にクラスタリングする手段と、
前記クラスタリングされたアイテム集合に基本的欲求の種別を割り振る手段と、
前記アイテム集合に割り振られた基本的欲求の種別と前記ユーザ行動履歴データベースに格納されたユーザのアイテム選択履歴とからユーザの欲求プロファイルを算出する手段と、
前記算出された欲求プロファイルと既知のユーザの欲求プロファイルの適合度を算出する手段と、
前記適合度を最大化するように前記アイテム集合に割り当てられる基本的欲求の種別を調整する手段とを備え、
アイテムと基本的欲求の種別との対応関係が未知であり、ユーザの欲求プロファイルが既知である場合に、各アイテムに対応する基本的欲求の種別を学習することを特徴とするプロファイル解析システム。
【請求項5】
請求項1に記載のプロファイル解析システムにおいて、
基本的欲求の種別との対応関係が既知のアイテムと未知のアイテム間の類似度を計算する手段と、
前記類似度の高いアイテム間において、前記対応関係が既知のアイテムの基本的欲求の種別を前記対応関係が未知のアイテムの基本的欲求の種別として設定する手段と、
前記対応関係が未知のアイテムに設定された基本的欲求の種別を用い、欲求プロファイルが既知であるユーザのアイテム選択履歴から、選択されたアイテムに対応する基本的欲求をその種別ごとに集計して各基本的欲求の相対的強さを当該ユーザの欲求プロファイルとして算出し、算出した欲求プロファイルと前記既知の欲求プロファイルとの適合度が最大化されるように、前記対応関係が未知のアイテムに対して設定された基本的欲求の種別を調整する手段と、
欲求プロファイルが未知のユーザのアイテム選択履歴から、選択されたアイテムに対応する基本的欲求をその種別ごとに集計して各基本的欲求の相対的強さを当該ユーザの欲求プロファイルとして算出し、当該ユーザとアイテム選択履歴の類似度が高く欲求プロファイルが既知であるユーザの欲求プロファイルと前記算出された欲求プロファイルとの適合度を算出し、それが最大化されるように前記対応関係が未知のアイテムに対して設定された基本的欲求の種別を調整する手段とを備え、
一部のアイテムに対応する基本的欲求の種別と、一部のユーザの欲求プロファイルとが既知である場合に、基本的欲求の種別との対応関係が未知のアイテムに対する基本的欲求の種別と、欲求プロファイルが未知のユーザの欲求プロファイルとを学習することを特徴とするプロファイル解析システム。
【請求項6】
請求項1に記載のプロファイル解析システムにおいて、複数のアイテムデータベースを備え、前記推薦部は前記複数のアイテムデータベースから前記現在のユーザの基本的欲求の強さに適したアイテムを推薦することを特徴とするプロファイル解析システム。
【請求項7】
請求項6に記載のプロファイル解析システムにおいて、
前記現在の欲求の強さと前記行動履歴データベースに格納された欲求プロファイルとから欲求に対応するアイテムデータベースを選択する選択手段とを有し、
前記推薦部は、前記選択手段によって選択されたアイテムデータベールから、前記現在の基本的欲求の強さに適したアイテムを推薦することを特徴とするプロファイル解析システム。
【請求項8】
ユーザが選択したアイテム及び当該アイテムを提供したサービス、及び当該アイテムの選択に関連する基本的欲求についての情報を格納したユーザ行動履歴データベースと、
複数の種別からなる基本的欲求に対するユーザの定常的な欲求の強さを示す欲求プロファイルと、各サービスについて基本的欲求の種別とキーワードとの対応を示す情報を格納したユーザプロファイルデータベースと、
前記ユーザ行動履歴データベースに格納されたアイテム選択履歴からユーザの基本的欲求に対する欲求満足度を計算する欲求満足度計算部と、
前記欲求満足度と前記欲求プロファイルとから、ユーザの現在の基本的欲求の強さを計算する欲求計算部と、
前記欲求計算部の計算結果からユーザの有する強い基本的欲求を選択する欲求推薦部と、
前記欲求推薦部によって選択された基本的欲求から利用するサービスを選択するデータベース選択部と、
前記選択されたサービスと前記欲求推薦部で選択された基本的欲求に基づき、前記ユーザプロファイルデータベースからキーワードを抽出する手段と、
前記抽出したキーワードを前記選択したサービスを提供するデータベースに検索キーとして送信する送信手段と、
前記データベースから検索結果として送信されてきたアイテムを受信する受信手段と、
有することを特徴とするプロファイル解析システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【公開番号】特開2012−103955(P2012−103955A)
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願番号】特願2010−252784(P2010−252784)
【出願日】平成22年11月11日(2010.11.11)
【出願人】(000233055)株式会社日立ソリューションズ (1,610)
【Fターム(参考)】
【公開日】平成24年5月31日(2012.5.31)
【国際特許分類】
【出願日】平成22年11月11日(2010.11.11)
【出願人】(000233055)株式会社日立ソリューションズ (1,610)
【Fターム(参考)】
[ Back to top ]