説明

情報提供装置、情報提供方法、及び情報提供プログラム

【課題】ユーザに対するおすすめアイテムを適切に選択する。
【解決手段】情報選択装置は、複数のアイテムそれぞれに対するレビューに用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成するとともに、複数のアイテムごとに、アイテムと、アイテムに対するレビューを記載したユーザと、抽出した形容表現との対応を示す対応情報を生成する形容表現分析部と、生感性情報セット及び対応情報に基づいて生成した感性タクソノミと、プロバイダ提供タクソノミとから、各ユーザのアイテムに対する興味を階層的に示すユーザ興味プロファイルを生成するユーザ興味構築部と、生成したユーザ興味プロファイルに基づいて、各ユーザのアイテムに対する興味の類似度を算出し、算出した類似度に基づいて複数のアイテムからユーザに推薦するアイテムを選択するユーザ興味類似度計測部とを備えている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、協調フィルタリングに基づいてユーザにアイテムを推薦するための情報提供装置、情報提供方法、及び情報提供プログラムに関する。
【背景技術】
【0002】
アイテム推薦システムは、ユーザにおすすめのアイテムを提示することができるので、アイテム推薦システムを利用することでアイテムの売上を増やせる可能性がある。そのため、アイテム推薦システムは、アイテム(商品又はコンテンツ)を販売する様々なコンテンツプロバイダで採用されている。
多くのコンテンツプロバイダは、推薦するアイテムを選択する推薦技術として、協調フィルタリングを採用している。協調フィルタリングは、「同じアイテムを評価するユーザは類似した興味をもつ」という仮定に基づき、ユーザへのおすすめアイテムを計算により求める技術である。
【0003】
たとえば、特許文献1には、複数のユーザのブログ情報からユーザの興味オントロジを抽出し、各ユーザの興味オントロジを比較することで、ユーザが興味をもつ可能性が高く、ユーザが既知の概念以外の異なる概念に属する情報を推薦できるようにしたものが記載されている。
【0004】
また、ユーザの興味の分析は、ウェブ上のブログ情報のみならず、ユーザによるアイテムに対するレビューの記述を用いて行うことができる。たとえば、非特許文献1や非特許文献2などのサイトでは、こうしたユーザによるレビューが非常に多く投稿されている。
【0005】
また、非特許文献3や非特許文献4のサイトでは、音楽、映画、ゲームなどのアイテムのタクソノミによるユーザ興味のモデルが構築されている。また、非特許文献5や非特許文献6のサイトにおいては、ユーザの興味に基づいたタクソノミに基づくアイテム検索手段をユーザに提供している。
【0006】
更に、協調フィルタリングに関する技術としては、非特許文献7から非特許文献11に記載されている技術がある。
【0007】
一般的な協調フィルタリングでは、そのユーザが過去に高く評価したアイテムのみを用いてユーザの興味を決定し、同じアイテムを高く評価したかどうかを基にユーザ間の類似度を計測し、計測した類似度に基づいてアイテムの推薦を行っている。そのため、現状の推薦エンジンは、結果としてユーザが過去に評価したアイテムと同種のアイテムを推薦しがちである。
たとえば、あるユーザがホラー映画のある作品を過去に購買していたとすると、そのユーザに同じ監督、同じ出演者、又は、同じホラージャンルのアイテムが多く推薦される。結果として、ユーザにとっては、既知のアイテムであったり、未知のアイテムであったりしたとしても自分自身で簡単に発見し得るアイテムが推薦されることが多い。
【0008】
こうした問題に対し、ZieglerとMcNeeとは、ユーザに提示する推薦リスト内のアイテムの多様性を増やすアルゴリズムを提案している(非特許文献7)。多様性はアイテムのタクソノミを用いて計算され、リスト内のアイテムが所属するタクソノミ上のクラスがばらつくように設定されている。こうしたアイテムのタクソノミは、アイテムを提供するサービスプロバイダにより、彼らの顧客が興味あるアイテムにアクセスしやすいように工夫して構築されているものである。彼らの非特許文献7に記載されている技術を適用したオンライン検証によると、この方法では、推薦の予測精度は落ちるものの、ユーザの満足度は向上することがアンケート結果から確認されている。
【0009】
しかしながら、非特許文献7に記載されている技術は、「ユーザが過去にアクセスしたことのないコンセプト(クラス)に所属しているアイテムであり、且つ、興味をもつ可能性の高いアイテム」として定義される新規性(Novelty)の高いアイテムを推薦する試みではない。
【0010】
ユーザにとって新規性の高いアイテムを推薦する技術として、Nakatsujiらは、タクソノミに基づきユーザ興味を構築し、ユーザ間の類似度を計算することで、新規性の高いアイテムを推薦する手法を提案している(非特許文献8)。非特許文献8では、提案した手法によるオンライン検証において、ユーザのクリックが新規性の高いアイテムに集中したことが報告されている。
【0011】
しかしながら、非特許文献8に記載されている技術は、新規性の高いアイテムの推薦とそれを通じたユーザ間でのコミュニケーションの活性化の検証に焦点をしぼっており、他の協調フィルタリングの手法と予測精度や推薦されるアイテムの新規性の分布は比較されていない。
【0012】
文章のポジティブ・ネガティブの判定に関する技術として、非特許文献9に記載されている技術がある。非特許文献9に記載されている技術は、記事集合に対し、人手により分類した複数のポジティブ語やネガティブ語との共起性を基に、文章中に現れるフレーズのポジティブ・ネガティブの傾向を計算する。そして、記事内に登場する複数のフレーズをチェックし平均的にポジティブであればポジティブな記事と分類し、それ以外はネガティブと判定し、比較的高精度な分類結果を得ている。
【0013】
非特許文献9に記載されている技術を、映画記事に対して適用し検証を行ったところ、映画記事内における”more evil”などのフレーズは、ホラーなどのジャンルによってはポジティブなフレーズであることも多いにも関わらず、映画全体ではネガティブなフレーズとなる結果が得られた。このように、記事内での話題対象の背景クラスまで考慮したポジティブ・ネガティブの判定を実施できているとはいえない。ましてや、ポジティブ又はネガティブなフレーズと、ユーザと、商品との関係を把握して、ユーザへのおすすめの商品を推薦することはできていない。
【先行技術文献】
【特許文献】
【0014】
【特許文献1】特開2008−117112号公報
【非特許文献】
【0015】
【非特許文献1】食べログ、[online]、株式会社カカクコム、[平成22年5月21日検索]、インターネット<URL http://tabelog.com/>
【非特許文献2】amazon.com(登録商標)、[online]、Amazon.com Inc.、[平成22年5月21日検索]、インターネット<URL http://www.amazon.com/>
【非特許文献3】Digital Entertainment Technology Leader、[online]、Rovi Corporation、[平成22年5月21日検索]、インターネット<http//www.rovicorp.com>
【非特許文献4】ListenJapan、[online]、株式会社リッスンジャパン、[平成22年5月21日検索]、インターネット<http://listen.jp>
【非特許文献5】all music、[online]、Rovi Corporation、[平成22年5月21日検索]、インターネット<URL http://www.allmusic.com/>
【非特許文献6】ぐにゅナビ、[online]、エヌ・ティ・ティレゾナント株式会社、[平成22年5月21日検索]、インターネット<URL http://gnv.bb.goo.ne.jp/>
【非特許文献7】Ziegler, C. N. and McNee, S. M.: Improving recommendation lists through topic diversification, In proc. WWW ’05 , pp. 22-32 (2005).
【非特許文献8】Nakatsuji, M., Yoshida, M. and Ishida, T.: Detecting innovative topics based on user interest ontology, J. Web Sem., Vol. 7, No. 2, pp. 107-120 (2009).
【非特許文献9】Turney, P. D.: Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews, Proceedings of the 40th Annual Meeting of the Association of Computational Linguistics, Philadelphia, Pennsylvania, pp. 417 - 424 (2002).
【非特許文献10】Breese, J. S., Heckerman, D. and Kadie, C.: Empirical Analysis of Predictive Algorithms for Collaborative Filtering, In Proc. UAI ’98 , pp. 43-52 (1998).
【非特許文献11】Shardanand, U. and Maes, P.: Social Information Filtering: Algorithms for Automating”Word of Mouth”, In proc. CHI’95, pp. 210-217 (1995).
【発明の概要】
【発明が解決しようとする課題】
【0016】
ところで、従来の協調フィルタリングにおいてユーザ間の類似度を計測する際には、Cosineベースアプローチ(非特許文献10)とPearson correlationアプローチ(非特許文献11)を用いることが多い。
【0017】
Cosineベースアプローチにおいては、アクティブユーザaとあるユーザuとの間の類似度S(a,u)は、ユーザaとユーザuの評価ベクトルのCosine角度を計算することで求められる。形式的には、両方のユーザが評価を与えているアイテム数をMとし、ユーザuのアイテムIiに対する評価値をru,Iiとすると、類似度S(a,u)は、次式(1)により表される。
【0018】
【数1】

【0019】
一方、Pearson correlationアプローチでは、ユーザ間の類似度の計測において、ユーザの評価スキームはユーザごとに異なるという考え方を採用しており、次式(2)により表される。
【0020】
【数2】

【0021】
CosineベースアプローチもPearson correlationアプローチも、両方のユーザaとユーザuとが評価を与えたアイテムのみに焦点をしぼり計算を行っている点に注意が必要である。最終的にNをアクティブユーザaと類似度の高いユーザの数とすると、ユーザaのアイテムIiに対する予測値pa,Iiは、次式(3)により与えられる。
【0022】
【数3】

【0023】
ここで述べた従来の協調フィルタリングでは、ユーザへのおすすめアイテムが、過去のユーザの評価アイテムと同種のコンセプトに属するものとなりやすいという問題がある。すなわち、ユーザにとっては、既知のアイテムであったり、未知のアイテムであったりしたとしても自分自身で簡単に発見し得るアイテムが推薦されてしまい、適切なおすすめアイテムが選択されないことが多いという問題がある。
【0024】
上述の課題を鑑み、本発明は、ユーザに対するおすすめアイテムを適切に選択する情報提供装置、情報提供方法、及び情報提供プログラムを提供することを目的とする。
【課題を解決するための手段】
【0025】
上述の課題を解決するために、本発明に係る情報提供装置は、複数のアイテムそれぞれに対するレビューに用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成するとともに、前記複数のアイテムごとに、アイテムと、アイテムに対するレビューを記載したユーザと、抽出した形容表現との対応を示す対応情報を生成する形容表現分析部と、前記形容表現分析部が生成した感性情報セット及び対応情報に基づいて、形容表現を分類した感性クラスによりアイテムを分類したタクソノミである感性タクソノミを生成し、前記複数のアイテムを提供しているプロバイダにより生成された前記複数のアイテムのタクソノミであるプロバイダ提供タクソノミと、生成した感性タクソノミとから、各ユーザのアイテムに対する興味を前記感性タクソノミ及び前記プロバイダ提供タクソノミに沿って階層的に示すユーザ興味プロファイルを生成するユーザ興味構築部と、前記ユーザ興味構築部が生成したユーザ興味プロファイルに基づいて、各ユーザのアイテムに対する興味の類似度を算出し、算出した類似度に基づいて前記複数のアイテムからユーザに推薦するアイテムを選択するアイテム選択部とを備えたことを特徴とする。
【0026】
また、本発明は、上記に記載の情報提供装置において、前記ユーザ興味構築部は、前記ユーザ興味プロファイルを生成する際に、更に、前記複数のアイテムそれぞれに対するユーザの評価値を用いて、前記ユーザ興味プロファイルを生成することを特徴とする。
また、本発明は、上記に記載の情報提供装置において、前記ユーザ興味構築部は、前記ユーザ興味プロファイルを生成する際に、前記感性タクソノミに含まれる感性クラスに対するユーザの評価値を、感性クラスに属するアイテムに対するユーザの評価値に基づいて算出し、前記アイテム選択部は、前記ユーザ興味構築部が算出した各感性クラスに対するユーザの評価値を用いて、各ユーザのアイテムに対する興味の類似度を算出することを特徴とする。
【0027】
また、本発明は、上記に記載の情報提供装置において、前記ユーザ興味構築部は、前記感性タクソノミと、前記プロバイダ提供タクソノミとを結合して前記ユーザ興味プロファイルを生成することを特徴とする。
また、本発明は、上記に記載の情報提供装置において、前記ユーザ興味構築部は、前記感性タクソノミと、前記プロバイダ提供タクソノミとを結合する際に、前記感性タクソノミにおける感性クラスのルートクラスと、前記プロバイダ提供タクソノミにおけるクラスのルートクラスとを1つのルートクラスとして結合し、前記感性タクソノミ及び前記プロバイダ提供タクソノミそれぞれにおける同一のユーザを示すノードを結合して得られる一つのタクソノミから前記ユーザ興味プロファイルを生成することを特徴とする。
【0028】
また、本発明に係る情報提供方法は、複数のアイテムそれぞれに対するレビューに用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成するとともに、前記複数のアイテムごとに、アイテムと、アイテムに対するレビューを記載したユーザと、抽出した形容表現との対応を示す対応情報を生成する形容表現分析ステップと、前記形容表現分析ステップにおいて生成した感性情報セット及び対応情報に基づいて、形容表現を分類した感性クラスによりアイテムを分類したタクソノミである感性タクソノミを生成し、前記複数のアイテムを提供しているプロバイダにより生成された前記複数のアイテムのタクソノミであるプロバイダ提供タクソノミと、生成した感性タクソノミとから、各ユーザのアイテムに対する興味を前記感性タクソノミ及び前記プロバイダ提供タクソノミに沿って階層的に示すユーザ興味プロファイルを生成するユーザ興味構築ステップと、前記ユーザ興味構築ステップにおいて生成したユーザ興味プロファイルに基づいて、各ユーザのアイテムに対する興味の類似度を算出し、算出した類似度に基づいて前記複数のアイテムからユーザに推薦するアイテムを選択するアイテム選択ステップとを有することを特徴とする。
【0029】
また、本発明に係る情報提供プログラムは、情報提供装置が有しているコンピュータに複数のアイテムそれぞれに対するレビューに用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成するとともに、前記複数のアイテムごとに、アイテムと、アイテムに対するレビューを記載したユーザと、抽出した形容表現との対応を示す対応情報を生成する形容表現分析手段、前記形容表現分析手段により生成した感性情報セット及び対応情報に基づいて、形容表現を分類した感性クラスによりアイテムを分類したタクソノミである感性タクソノミを生成し、前記複数のアイテムを提供しているプロバイダにより生成された前記複数のアイテムのタクソノミであるプロバイダ提供タクソノミと、生成した感性タクソノミとから、各ユーザのアイテムに対する興味を前記感性タクソノミ及び前記プロバイダ提供タクソノミに沿って階層的に示すユーザ興味プロファイルを生成するユーザ興味構築手段、前記ユーザ興味構築手段により生成したユーザ興味プロファイルに基づいて、各ユーザのアイテムに対する興味の類似度を算出し、算出した類似度に基づいて前記複数のアイテムからユーザに推薦するアイテムを選択するアイテム選択手段として機能させることを特徴とする。
【発明の効果】
【0030】
本発明によれば、ユーザのアイテムに対するレビューに含まれる形容表現に基づいて、ユーザのアイテムに対する興味の類似度を算出するようにしたので、一般的に行われているアイテムの分類と異なる観点によりアイテムを選択でき、ユーザに対するおすすめアイテムを適切に選択することができる。
【図面の簡単な説明】
【0031】
【図1】本発明の実施形態の情報提供装置の機能に基づくブロック図である。
【図2】ユーザ興味モデルの説明図である。
【図3】同実施形態の情報提供装置の具体構成を示す概略ブロック図である。
【図4】同実施形態の情報提供装置における形容表現分析部での処理を示すフローチャートである。
【図5】同実施形態の情報提供装置におけるユーザ興味構築部での処理を示すフローチャートである。
【図6】同実施形態の情報提供装置におけるユーザ興味類似度計測部での処理を示すフローチャートである。
【図7】同実施形態の情報提供装置における類似度計算の説明図である。
【発明を実施するための形態】
【0032】
まず、本発明の概要について説明する。
本発明によれば、ユーザに新規性の高いアイテムを推薦可能とするために、ウェブ上のユーザのレビューを分析した結果により得られた2つの知見を基にして、ユーザ興味を、ユーザが評価したアイテムのみならず、ユーザがそのアイテムに対し与えた形容表現を用いてモデリングする。ここで、2つの知見のうち一つは、同じアイテムを高く評価するユーザであってもアイテムを評価する際に用いる形容表現は多様であり、多様な感性をもってアイテムに接していることである。もう一つは、アイテムの所属するクラスが異なっていても同じ形容表現が与えられることが多いということである。
【0033】
上述のように、ユーザがそのアイテムに対し与えた形容表現を用いてモデリングすることにより、ユーザが評価したアイテムのみからユーザ間の類似度を計算するのではなく、ユーザが評価したアイテムに対し与えた形容表現を用いユーザ間の類似度を計算できるようになり、結果として、同じ感性をもつユーザが高く評価するアイテムが、推薦を享受するユーザに推薦されるようになる。その結果、推薦の精度を上げることができとともに、アクティブユーザに対して推薦されることのなかったアイテムであり、ユーザにとって新規性の高いアイテムを推薦することができる。
更に、推薦の際に、他のユーザがそのアイテムをどのような形容表現を用いて評価していたか、という情報も併せて提示でき、ユーザへの納得感の向上にも役立たせることができる。
【0034】
以下、本発明の実施の形態について図面を参照しながら説明する。図1は、本発明の第1の実施形態の情報提供装置の機能構成に基づくブロック図である。図1に示すように、本発明の第1の実施形態の情報提供装置は、形容表現分析部1と、ユーザ興味構築部2と、ユーザ興味類似度計測部(アイテム選択部)3とから構成される。
【0035】
形容表現分析部1には、複数のアイテムそれぞれに対するレビュー(Review)11が入力される。このレビュー11は、ネットワーク上で公開されているものでもよいし、予め収集したものであってもよい。そして、形容表現分析部1は、入力されたレビューを用いて、ユーザがアイテムに対してどのような形容表現を用い評価をしているかを分析する。ここで、アイテムは、流通機構により提供される商品や、ネットワーク上で電子データとして提供されている画像、音楽などのコンテンツである。
【0036】
また、本実施形態では、形容表現分析部1は、アイテムの内容をアイテムに与えられているメタデータを基に表現し、ユーザの記述したレビュー11を用い、アイテムのメタデータの属性値に対する感性分析(sentimental analysis)を行う。これにより、ユーザがアイテムに対しどのような感覚・感性をもって評価を下しているかを分析している。
たとえば、映画をドメインとした場合、メタデータには、タイトル、役者、監督、脚本、制作国、制作年などが設定される。また、グルメをドメインとした場合、メタデータには、店舗名、メニュー、住所などが設定される。また、各サービスプロバイダは、自身の提供するサービスに対するレビューをユーザに記述してもらっている。
【0037】
形容表現分析部1は、ドメインを利用している全ユーザを対象にしてレビューの分析を行う。形容表現分析部1が行う分析における形容表現の抽出は、あるサービスを提供するドメインに属する全ユーザ/全アイテムのレビュー記事を用い実施することとし、結果として、そのドメインで使用される形容表現を網羅的に抽出した形容表現の集合である形容表現セットをドメインごとに一つ生成する。
【0038】
換言すると、形容表現分析部1は、ドメインに属する各アイテムに対するユーザによるレビューにおいて用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成する。
また、形容表現分析部1は、抽出した形容表現と、当該形容表現を用いたレビューが記載されたアイテムと、当該アイテムに対する当該レビューを記載したユーザとの対応を示す対応情報を生成して、ユーザ興味構築部2に出力する。
本実施形態では、形容表現(「かわいい」や「怖い」等)をクラス(以下、感性クラスという)とし、アイテム集合を各クラスに分類する。そして、感性の表れである形容表現を軸としたアイテムのタクソノミ(以下、感性タクソノミという)を設定する。
【0039】
ユーザ興味構築部2は、形容表現分析部1が生成した形容表現セット及び対応情報に基づいて感性タクソノミを生成する。そして、ユーザ興味構築部2は、生成した感性タクソノミを用いてユーザ興味のモデリングを行い、感性によるユーザ興味プロファイルを構築(生成)する。ここで、感性タクソノミは、形容表現セットに含まれる各形容表現を分類した感性クラスによりアイテムを分類したタクソノミである。
【0040】
また、ユーザ興味構築部2は、ユーザ興味プロファイルを生成する際に、ドメインにおけるサービスを提供するプロバイダが構築した、予め定めたクラスによりアイテムを分類したタクソノミであるタクソノミ12(以下、プロバイダ提供タクソノミという)も用いて、ユーザ興味プロファイルを生成する。具体的には、ユーザ興味構築部2は、感性タクソノミと、プロバイダ提供タクソノミとを結合して得られた一つのタクソノミと、対応情報とから、各ユーザのアイテムに対する興味を感性タクソノミ及びプロバイダ提供タクソノミに沿って階層的に示すユーザ興味プロファイルを生成する。
【0041】
本実施形態では、ユーザ興味構築部2は、ユーザのもつ感性・感覚のスコアを計算するために、ユーザがアイテムに与えた評価値をアイテムの所属する感性クラスの評価値として反映させている。こうすることで、ユーザ間で共通して評価したアイテムのみでなく、共通して評価された感性クラスまで考慮して、ユーザ間の類似度を計測することができる。なお、感性タクソノミ上において、アイテムは複数の感性クラスに所属する場合があるが、本実施形態では、ユーザが用いた形容表現に対応するクラス配下のアイテムのみに、ユーザの評価値を反映させることにする。
【0042】
ユーザ興味類似度計測部3は、ユーザ興味構築部2により構築されたユーザ興味プロファイルを入力として、ユーザの類似度を計測し、ユーザに推薦するアイテムを選択する。
また、ユーザ興味類似度計測部3は、アイテムに対する評価のみでなく、アイテムに対し与えた形容表現も共通するユーザを類似ユーザとして取り扱うので、結果として、多様なクラスに所属するアイテムを精度よくユーザに推薦でき、新規性のあるアイテム(Novelアイテム)を推薦することができる。
【0043】
図2は、プロバイダ提供タクソノミと、感性タクソノミとを結合したタクソノミを示している。図2において、左側のクラスC、C、Cは、プロバイダ提供タクソノミから構築されたクラスであり、右側のクラスC、Cは、感性タクソノミから構築された感性クラスである。
【0044】
たとえば、図2において、左側のプロバイダ提供タクソノミにおいては、ユーザuの興味はアイテムIとアイテムIにあり、ユーザvの興味はアイテムIとアイテムIにある。アイテムIとアイテムIとはクラスCに所属し、アイテムIとアイテムIとはクラスCに所属している。
このように、ユーザuが興味を有するアイテムと、ユーザvが興味を有するアイテムとが異なるクラスに所属するので、ユーザuとユーザvとでは、興味が類似していないと判定されることになる。
【0045】
これに対して、右側の感性タクソノミにおいては、アイテムIとアイテムIとは同じ感性クラスCに所属し、アイテムIとアイテムIとは同じ感性クラスCに所属している。このため、プロバイダ提供タクソノミを用いた類似度計算手法では類似すると考えることができなかったユーザuとユーザvとを、アイテムを評価する際に用いた形容表現が同じであることに基づいて、興味が類似すると判定することができる。結果として、新規性の高いアイテムをユーザへ推薦することができる。また、アイテムの評価値のみでなく、評価する際に利用する形容表現まで考慮しており、感性と興味の両面から類似度を計算できるため、推薦の精度も向上させることができる。
【0046】
次に、上述の形容表現分析部1、ユーザ興味構築部2、ユーザ興味類似度計測部3それぞれについて詳述する。図3は、本実施形態における情報提供装置の具体構成を示す概略ブロック図である。
図3に示すように、本実施形態の情報提供装置は、制御部101と、記憶部102と、入力部103と、表示部104と、通信部105とからなるコンピュータ上に、形容表現分析部1、ユーザ興味構築部2、及びユーザ興味類似度計測部3の機能を有するソフトウェアを動作させることで実現できる。レビュー等のウェブ上の情報は、通信部105を介して収集される。また、形容表現分析部1が生成する形容表現セット及び対応情報、ユーザ興味構築部2が生成する感性タクソノミ及びユーザ興味プロファイルは、記憶部102上に展開される。
【0047】
まず、形容表現分析部1について説明する。形容表現分析部1は、レビューの記述から感性分析を行う。つまり、本実施形態においては、形容表現分析部1は、形容表現を含む出力を抽出して、形容表現セットS=(S,…,S)を生成する。形容表現の抽出は、たとえば、単語の品詞により行い、たとえば、形容詞、形容動詞などを含む表現を選択する。
【0048】
あるドメインDにおける形容表現sのセットである形容表現セットSは、S=(S,…,S)として表すことができる。ここでnは、ドメインDにおける形容表現の数である。ユーザがドメインD内に存在するアイテムに対し持ち得る感覚・感性を過不足なくもつことが、そのドメインDにおけるユーザ興味を詳細に表現することにつながるため、ドメインDにおいて利用されうる形容表現は網羅的に準備されている必要がある。各サービスプロバイダは、自身の提供するサービスに対するレビューをユーザに記述してもらうことで、記述されたレビューを見たユーザのアイテムに対する関心を引きつけることを狙い、積極的にユーザにレビューを記述してもらうように取り組んでいる。非特許文献1や非特許文献2などのサイトでは、こうしたレビューが非常に多く記述されるようになっている。レビューが大量に存在する場合、レビューからアイテムに対する形容表現を抜き出せば、網羅性を担保することができる。
【0049】
形容表現分析部1は、感性分析を行う際、サービスプロバイダがアイテムに与えているメタデータを用いて、アイテムのみでなくても、そのメタデータに対し形容表現が関連付けられたかどうかを分析する。すなわち、形容表現分析部1は、ユーザが記載したレビューにおいて、アイテムに予め与えられているメタデータに対する形容表現を抽出する。
たとえば、映画に対しては、メタデータとして、タイトル、役者、監督、脚本、制作国、制作年などがプロバイダから与えられている情報としてある。また、グルメに関しては、メタデータとして、店舗名、メニュー、住所などがある。このうち、たとえばタイトルや役者、監督及び、店舗名やメニューは、レビューにおいて話題となりうる対象であるため、それらに対する形容表現の分析を実施する。これに対して、制作国,制作年及び住所は、それ自身が話題になることは少ないことから、形容表現の分析の対象から除外する。
【0050】
図4は、形容表現分析部1における分析処理を示すものである。図4において、形容表現分析部1は、まず、処理の繰り返し回数の計数値を0にしておき(ステップS101)、次いで、処理の繰り返し回数の計数値をインクリメントし(ステップS102)、レビューの記述Eiについて、インスタンスIiに関係する関係フレーズf(Ii)を、関係の近さを表すスコアS(Ii)を伴なって抽出し、該抽出された関係フレーズf(Ii)による関係フレーズ集合F(Ii)を得る(ステップS103)。
ここで、インスタンスIiは、アイテムを示している。
【0051】
インスタンス集合(アイテムセット)Iに含まれている全インスタンス(ここでは全数をmとする)に対し、ステップS101の処理を繰り返し実行する(ステップS102〜ステップS104)。ステップS102〜ステップS104によって、インスタンスに関係する各フレーズf(Ii)がその関係の近さを表す各スコアS(Ii)を伴なって抽出される。
【0052】
次いで、形容表現分析部1は、ステップS102〜ステップS104によって抽出された各関係フレーズf(Ii)によるフレーズ集合Fの各フレーズf付随するスコアS(Ii)の値を相互に比較して、スコア値が最大であるフレーズfiを探索する(ステップS105)。ステップS105の処理において、(ユーザによって特定された)或るインスタンスIi、フレーズfi、インスタンス集合I、上記インスタンスIiに関係する関係フレーズf(Ii)の関係の近さを表すスコアをスコアS(Ii)と表記する。
【0053】
そして、形容表現分析部1は、インスタンス集合I内のインスタンスIi内でIiに関係する関係フレーズf(Ii)と関係をもつインスタンス集合I(f(Ii))、及び、インスタンス集合I(f(Ii))内の各インスタンスとf(Ii)との関係の近さを表すスコアS(I(f(Ii)))が供給されると、上記スコアS(Ii)と比較し、スコアS(Ii)とスコアS(I(f(Ii)))との比較判定の結果、スコアS(Ii)が最も大きいときのインスタンスIiとフレーズfiとを対応付ける(ステップS106)、対応付けられたインスタンスIiとフレーズfiとの組を出力する。ここで、形容表現分析部1は、たとえば、形態素分析等により形容詞、形容動詞などを含むフレーズを形容表現として選択し、インスタンスとの対応付けを行う。
【0054】
次に、ユーザ興味構築部2について詳述する。図5は、ユーザ興味構築部2での処理を示すフローチャートである。図5に示すように、ユーザ興味構築部2は、形容表現分析部1が生成する形容表現セットSから感性タクソノミの構築を行う(ステップS201)。アイテムの感性タクソノミとしては、形容表現セットS=(S,…,S)内の形容表現を感性クラスと捉え、その配下に対応する形容表現に関係付けられたアイテムを分類していくことで、感性タクソノミを構築する。また、形容表現セットS=(S,…,S)を更に階層化することで、ユーザの持ち得る感性の傾向をより詳細に分析することもできる。
【0055】
次に、ユーザ興味構築部2は、ユーザの興味を感性タクソノミに沿ってモデリングを行い、感性に基づくユーザ興味プロファイルの構築を行う(ステップS202)。具体的には、ユーザ興味構築部2は、アイテムに対するユーザの評価値をそのアイテムを含む感性クラスに対する評価値に反映させる。その際、ユーザがそのアイテムに対して用いた形容表現に対応する感性クラス配下のそのアイテムにのみに評価値を反映させる。
【0056】
すなわち、Iを感性クラスCに対応する形容表現を用いて、ユーザuが評価を行ったアイテムセットとすると、クラスに対する評価値ru,Ciは、次式(4)を用いて算出される。
【0057】
【数4】

【0058】
たとえば、図2において、ユーザuがアイテムIを感性クラスCに対応する形容表現を用いてレビューを記述しつつ評点4.0をつけ、同様にしてアイテムIに評点4.5をつけているとすると、クラスCに対するユーザuの評点は4.0、クラスCに対するユーザuの評点は4.5となる。
感性タクソノミの階層が(Rootを1階層目として)3階層以上の場合、感性クラスの親クラスに対する評価値は、各アイテムに対する評価値の代わりに各クラスに対する評価値を用いることで同様にして計算される。図2に示した例では、階層が2階層しかないため、各クラスに対する評価値を親クラスのRootクラスに反映させなくともよい。
【0059】
次に、ユーザ興味構築部2は、プロバイダが構築しているタクソノミをユーザ興味のモデリングに用いて、更に、ユーザ興味プロファイルの構築を行う(ステップS203)。
様々なコンテンツプロバイダが、自身の提供するアイテムのタクソノミを構築し始めている。たとえば、音楽、映画、ゲームなどのアイテムのタクソノミは、非特許文献3や非特許文献4において構築済みである。こうしたタクソノミは、ユーザがアイテムを自身の興味に沿って検索しやすいように、クラスの粒度や分岐数を適切に研究して設定されている。そのため、このタクソノミを用いてユーザ興味をモデリングすることは、合理的なアプローチであると考えられる。そこで、ユーザ興味構築部2は、感性タクソノミによるモデリングに加えて、プロバイダが提供するタクソノミを用いてユーザ興味のモデリングを行う。
【0060】
プロバイダが提供するタクソノミによるユーザ興味のモデリングのアプローチとしては、「あるアイテムに興味をもつユーザは、そのアイテムを含むクラスにも興味をもちうる」という考えに基づき、アイテムに対するユーザの評価値をそのアイテムを含むクラスに対する評価値に反映させる。アイテムに対する評価値は、アイテムへのユーザのアクセス頻度に沿って潜在的な評価値として割り当てられる場合と、ユーザ自身によって明示的に与えられる場合がある。
ここで、アイテムへのユーザのアクセス頻度は、たとえば、当該アイテムについての情報を表示するウェブページなどを閲覧した回数や、当該アイテムを検索した回数などである。
【0061】
プロバイダが提供するタクソノミにおいて、IをクラスCにおけるアイテムセットとすると、クラスに対する評価値ru,Ciは、次式(5)により算出される。
【0062】
【数5】

【0063】
たとえば、図2において、ユーザuがアイテムIに評点4.0をつけ、アイテムIに評点4.5をつけているとすると、クラスCに対するユーザuの評点は8.5となる。親クラスに対する評価値は、各アイテムに対する評価値の変わりに各クラスに対する評価値を用いることで同様にして計算される。
【0064】
本実施形態において、ユーザ興味構築部2は、感性タクソノミと、プロバイダ提供タクソノミとの双方の親クラス(図2の例では、Rootクラス)をマージ(結合)することにより、感性タクソノミに基づくユーザ興味と、プロバイダ提供タクソノミに基づくユーザ興味とを組み合わせて、ユーザごとの感性を考慮したユーザ興味のモデリングをすることができる。なお、双方の親クラスをマージする際に、同一のユーザを示すノード同士もマージ(結合)される。
【0065】
これにより、ユーザごとの感性を考慮したユーザ興味モデルを表すことができる。また、感性タクソノミと、プロバイダ提供タクソノミとに基づくユーザ興味を組み合わせることで、「ある感性の傾向をもつユーザは、あるジャンルを好む傾向がある」、という情報を取ることができる。また、感性クラスを用いることで、プロバイダ提供タクソノミにおけるクラスを跨った興味の関連を見付けることができ、ユーザにとって新規性のあるアイテム(Novelアイテム)の推薦をすることができる。
【0066】
次に、ユーザ興味類似度計測部3について詳述する。図6は、ユーザ興味類似度計測部3での処理を示すフローチャートである。図6において、ユーザ興味類似度計測部3は、まず、ユーザaとユーザuとのクラスCに対する興味の一致度を示すスコアS(a,u,C)を算出する(ステップS301)。このスコアS(a,u,C)は、ユーザaの評価値ra,Ciと、ユーザuの評価値ru,Ciとの内、小さい方の値を基に計算する。これにより、興味の一致度の計算の際に、クラスCに対する興味がユーザaより低いユーザのスコアS(a,u,C)を下げることができる。
【0067】
次に、ユーザ興味類似度計測部3は、ユーザaとユーザuとの間での、クラスに対する評価行為の類似度S(a,u)を興味の一致度のスコアS(a,u,C)を用い計算する(ステップS302)。その際Jaccard coefficientの考え方を用いる。このJaccard coefficientアプローチは、ユーザaとユーザuのどちらかのみが評価を与えているクラス集合の内、両方が評価を与えているクラス集合が、クラス集合の全体においてどれだけの割合を占めているかを計算できる。これは、言い換えると、タクソノミのクラス階層の中(例では,Cの子クラスの中)での、ユーザの興味の幅の類似度を考慮しているといえる。
これにより、アクティブなユーザaがそれほど多くのクラスに評価を割り当てていない場合、多くのクラスに評価を割り当てているユーザuを、ユーザaから分離することができる。Pearson correlationアプローチとCosineベースアプローチとは式(2)に示したように、ユーザaとユーザuとの両方が評価を与えたクラスのみしか考慮しないため、ユーザの興味の幅の差を考慮していない。
【0068】
次に、ユーザaとユーザuとの間でのアイテムに対する評価行為の類似度S(a,u)を計算する(ステップS303)。この場合は、式(2)で説明したアイテムに対する各ユーザの評価スキームの違いを考慮し計算を行うPearson correlation アプローチを用いてもよいし、Jaccard coefficient アプローチを用いてもよい。
【0069】
次に、ユーザ興味類似度計測部3は、上述した類似度S(a,u)(クラスに対するユーザ間の類似度)と、類似度S(a,u)(アイテムに対するユーザ間の類似度)との2つの類似度を組み合わせ、ユーザ間のクラス、アイテムに対する評価行為の類似度を計算する(ステップS304)。
【0070】
ユーザ興味類似度計測部3は、上述したユーザ間のクラス、アイテムに対する評価行為の類似度に基づいて、新規性のあるアイテム(Novelアイテム)の推薦を行う(ステップS305)。
【0071】
以下に、類似度の計算アルゴリズムについて説明する。本アルゴリズムにおいては、C(a)をユーザaが評価したクラスCの子クラス集合として定義する。
【0072】
まず、ステップS301で計測されたユーザaとユーザuとのクラスCに対する興味の一致度S(a,u,C)を、min(ra,Ci,ru,Ci)とする。
【0073】
次に,ステップS302では、クラスに対するユーザ間の評価行為の類似度S(a,u)を次式(6)により算出する。
【0074】
【数6】

【0075】
次に、ステップS303では、アイテムに対するユーザ間の評価行為の類似度S(a,i)を,Pearson correlation アプローチに基づき式(2)に沿って計算する。
【0076】
次に、ステップS304では、クラスの一致度S(a,u)とアイテムの一致度S(a,u)とを全ユーザ集合を母集合としガウス分布に正規化をした上で、ユーザ間の類似度S(a,u)を次式により算出する。
【0077】
S(a,u)=S(a,u)+S(a,u)
【0078】
例として、図7に示すようにモデル化されたユーザaの興味と、ユーザuの興味との類似度を計算する。
【0079】
まず、ステップS301で、ユーザaとユーザuとのクラスCに対する興味の一致度S(a,u,C)を、min(ra,Ci,ru,Ci)とすると、クラスCに対する一致度S(a,u,C)は、次式により算出される。
【0080】
S(a,u,C)=min(6.0,2.0)=2.0
【0081】
また、クラスC3に対する一致度S(a,u,C)は、次式により算出される。
【0082】
S(a,u,C)=min(0.0,8.5)=0.0
【0083】
ステップS302で、クラスに対するユーザ間の評価行為の類似度S(a,u)を、式(4)に基づいて計算すると、次式により算出される。
【0084】
(a,u)=(2.0/2)+0.0=1.0
【0085】
また、ステップS303で、アイテムに対するユーザ間の評価行為の類似度S(a,u)を式(2)に基づいて計算すると、次式(7)により算出される。
【0086】
【数7】

【0087】
そして、ユーザ間の類似度S(a,u)は、算出されたS(a,u)と、算出されたS(a,u)との和として計算される。こうして得られたユーザの類似度を式(3)に適用すれば、ユーザaのアイテムIiに対する評価値の予測値pa,Iiを算出する。そして、ユーザ興味類似度計測部3は、予測値pa,Iiが最も大きいアイテムIiを、ユーザaに対するおすすめ商品に選択する。また、ユーザ興味類似度計測部3は、予め定められた閾値を越える予測値pa,Iiを有するアイテムIiをユーザaに対するおすすめ商品に選択するようにしてもよい。
【0088】
上述のように、感性タクソノミとプロバイダ提供のタクソノミとに基づくユーザ興味を組み合わせることで、「ある感性の傾向をもつユーザは、あるジャンルを好む傾向がある」という情報を検出することができる。また、感性クラスを用いることで,プロバイダ提供タクソノミにおけるクラスを跨った興味の関連を見付けることができ、ユーザにとって新規性のあるアイテム(Novelアイテム)の推薦に繋げることができる。
たとえば、図2に示したタクソノミにおいて、アイテムI、Iに興味をもつユーザuは、プロバイダ提供のタクソノミで、同一のクラスCにしか興味をもっていないことになる。このため、ユーザ間の類似度の計算の際に、クラスCに興味をもつユーザが多く結果として出力され、推薦結果としてもクラスC配下のアイテムが多く推薦されがちになってしまう。これに対し、本実施形態のように、感性タクソノミを加えることにより、ユーザuは、たとえば、感性クラスCやCを介して(アイテムI、Iがそれぞれ感性クラスC、Cに所属しているため)、ユーザvと興味が類似することになる。その結果、ユーザvが興味をもつクラスCに属するアイテムI、Iが、ユーザuへの推薦対象に加えることができ、ユーザuにとって新規性のあるアイテムを推薦することができる。
【0089】
すなわち、これまでのユーザの興味を再生産するというものから、ユーザの興味を喚起するという新たな役割を担うようことができるようになる。本発明の実施形態による技術は、ユーザがこれまでアクセスしていなかったコンセプトに属し、ユーザにとって新規性のあるアイテム(Novelアイテム)を、高い精度で提示することができる。アイテムの推薦に際して、これまでの「この商品を購入したユーザは、こんな商品も購入しています」という説明だけでなく、「あなたと似たような感性でこの商品に接したユーザは,こんな商品にはこんな感性で接しています」といった説明を伴ないユーザにおすすめを提示でき、ユーザにとって新規性のあるアイテムに興味をもつきっかけを与えることができる。これに基づき、サービスプロバイダは、ユーザにすすめる商品の範囲を広げることができる。更に、ユーザは、自分の興味をもちうる新たな分野を発掘することができる。
【0090】
本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【符号の説明】
【0091】
1…形容表現分析部
2…ユーザ興味構築部
3…ユーザ興味類似度計測部
11…レビュー
12…アイテムのタクソノミ

【特許請求の範囲】
【請求項1】
複数のアイテムそれぞれに対するレビューに用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成するとともに、前記複数のアイテムごとに、アイテムと、アイテムに対するレビューを記載したユーザと、抽出した形容表現との対応を示す対応情報を生成する形容表現分析部と、
前記形容表現分析部が生成した感性情報セット及び対応情報に基づいて、形容表現を分類した感性クラスによりアイテムを分類したタクソノミである感性タクソノミを生成し、前記複数のアイテムを提供しているプロバイダにより生成された前記複数のアイテムのタクソノミであるプロバイダ提供タクソノミと、生成した感性タクソノミとから、各ユーザのアイテムに対する興味を前記感性タクソノミ及び前記プロバイダ提供タクソノミに沿って階層的に示すユーザ興味プロファイルを生成するユーザ興味構築部と、
前記ユーザ興味構築部が生成したユーザ興味プロファイルに基づいて、各ユーザのアイテムに対する興味の類似度を算出し、算出した類似度に基づいて前記複数のアイテムからユーザに推薦するアイテムを選択するアイテム選択部と
を備えたことを特徴とする情報提供装置。
【請求項2】
前記ユーザ興味構築部は、前記ユーザ興味プロファイルを生成する際に、
更に、前記複数のアイテムそれぞれに対するユーザの評価値を用いて、前記ユーザ興味プロファイルを生成する
ことを特徴とする請求項1に記載の情報提供装置。
【請求項3】
前記ユーザ興味構築部は、前記ユーザ興味プロファイルを生成する際に、
前記感性タクソノミに含まれる感性クラスに対するユーザの評価値を、感性クラスに属するアイテムに対するユーザの評価値に基づいて算出し、
前記アイテム選択部は、
前記ユーザ興味構築部が算出した各感性クラスに対するユーザの評価値を用いて、各ユーザのアイテムに対する興味の類似度を算出する
ことを特徴とする請求項2に記載の情報提供装置。
【請求項4】
前記ユーザ興味構築部は、
前記感性タクソノミと、前記プロバイダ提供タクソノミとを結合して前記ユーザ興味プロファイルを生成する
ことを特徴とする請求項1から請求項3のいずれか一項に記載の情報提供装置。
【請求項5】
前記ユーザ興味構築部は、前記感性タクソノミと、前記プロバイダ提供タクソノミとを結合する際に、前記感性タクソノミにおける感性クラスのルートクラスと、前記プロバイダ提供タクソノミにおけるクラスのルートクラスとを1つのルートクラスとして結合し、前記感性タクソノミ及び前記プロバイダ提供タクソノミそれぞれにおける同一のユーザを示すノードを結合して得られる一つのタクソノミから前記ユーザ興味プロファイルを生成する
ことを特徴とする請求項1から請求項4のいずれか一項に記載の情報提供装置。
【請求項6】
複数のアイテムそれぞれに対するレビューに用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成するとともに、前記複数のアイテムごとに、アイテムと、アイテムに対するレビューを記載したユーザと、抽出した形容表現との対応を示す対応情報を生成する形容表現分析ステップと、
前記形容表現分析ステップにおいて生成した感性情報セット及び対応情報に基づいて、形容表現を分類した感性クラスによりアイテムを分類したタクソノミである感性タクソノミを生成し、前記複数のアイテムを提供しているプロバイダにより生成された前記複数のアイテムのタクソノミであるプロバイダ提供タクソノミと、生成した感性タクソノミとから、各ユーザのアイテムに対する興味を前記感性タクソノミ及び前記プロバイダ提供タクソノミに沿って階層的に示すユーザ興味プロファイルを生成するユーザ興味構築ステップと、
前記ユーザ興味構築ステップにおいて生成したユーザ興味プロファイルに基づいて、各ユーザのアイテムに対する興味の類似度を算出し、算出した類似度に基づいて前記複数のアイテムからユーザに推薦するアイテムを選択するアイテム選択ステップと
を有することを特徴とする情報提供方法。
【請求項7】
情報提供装置が有しているコンピュータに
複数のアイテムそれぞれに対するレビューに用いられている形容表現をレビューから抽出し、抽出した形容表現の集合である形容表現セットを生成するとともに、前記複数のアイテムごとに、アイテムと、アイテムに対するレビューを記載したユーザと、抽出した形容表現との対応を示す対応情報を生成する形容表現分析手段、
前記形容表現分析手段により生成した感性情報セット及び対応情報に基づいて、形容表現を分類した感性クラスによりアイテムを分類したタクソノミである感性タクソノミを生成し、前記複数のアイテムを提供しているプロバイダにより生成された前記複数のアイテムのタクソノミであるプロバイダ提供タクソノミと、生成した感性タクソノミとから、各ユーザのアイテムに対する興味を前記感性タクソノミ及び前記プロバイダ提供タクソノミに沿って階層的に示すユーザ興味プロファイルを生成するユーザ興味構築手段、
前記ユーザ興味構築手段により生成したユーザ興味プロファイルに基づいて、各ユーザのアイテムに対する興味の類似度を算出し、算出した類似度に基づいて前記複数のアイテムからユーザに推薦するアイテムを選択するアイテム選択手段
として機能させるための情報提供プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−253243(P2011−253243A)
【公開日】平成23年12月15日(2011.12.15)
【国際特許分類】
【出願番号】特願2010−125053(P2010−125053)
【出願日】平成22年5月31日(2010.5.31)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】