説明

レコメンド情報配信装置およびレコメンド情報配信方法

【課題】 ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるように、その評価を行う分離平面をより正確に行うこと。
【解決手段】 閲覧履歴テーブル104bには、コンテンツが送信されるたびに各コンテンツの閲覧度および不閲覧度の閲覧履歴情報が更新される。そして、レコメンド要求受信部105がレコメンド要求を受信すると、閲覧度算出部106は、閲覧履歴テーブル104bに記憶されている閲覧度および不閲覧度をコンテンツごとにその累積値を算出し、判定部107は、その累積値に基づいて各コンテンツの関心度を判定する。信頼度算出部108は、関心度の絶対値から、当該判定結果の信頼度を算出し、分離平面生成部109は、算出された信頼度に基づいて、複数あるコンテンツを満足クラスと不満足クラスとに分離する分離平面を生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、レコメンド情報配信装置およびレコメンド情報配信方法に関する。
【背景技術】
【0002】
ユーザの特性に合致したレコメンド情報を配信するために、そのレコメンド情報を抽出するための情報フィルタリング方式として、Content−basedFiltering方式が考えられている。この方式は、ユーザがWebページの閲覧などの行動を取ることにより、閲覧された対象文書を解析し、文書に含まれている単語(キーワード)を抽出する。そして、これらの単語を、ユーザごとに区別して、ユーザプロファイルといわれる興味・嗜好情報として記録する。ユーザプロファイルには、1つの興味の概念が表現され、この概念を利用してユーザに情報を提供することが考えられている。例えば、広告商品等に割り当てられたキーワードとユーザプロファイル(キーワードで表現された)とをマッチングすることにより適切な広告の推薦を可能とするシステムが一般的に知られている。
【0003】
また、これに関連する技術として、特許文献1に記載されている技術が挙げられる。この特許文献1には、予め定められたレコメンド抽出ルールに従ってレコメンド情報を配信する配信先および配信すべきレコメンド情報を決定し、配信する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−148878号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の背景技術においては、マッチング処理をすることによりレコメンド情報を抽出するものであったり、また、特許文献1に記載の技術では、予め定められたレコメンド抽出ルールに基づいてレコメンド情報が決定されていることから、レコメンド情報に漏れが生じるおそれがある。
【0006】
すなわち、特許文献1の技術においては、レコメンド抽出ルールに、趣味・嗜好が登録されていれば、その趣味・嗜好にあったレコメンド情報が決定され配信されることになり、また、購買履歴等に基づいて、ある商品を購入するとその購入した商品に関連する情報が配信されることになるが、これら配信される情報は、趣味・嗜好、購買履歴、またはアクセス履歴などの直接的な情報に基づいて決定されているため、ユーザが潜在的に望んでいるコンテンツに漏れが生じる場合がある。
【0007】
特にアクセス履歴に基づいてレコメンド情報を配信しようとする場合には、特に漏れが大きくなるものと考えられる。すなわち、ユーザがサイトなどを閲覧する場合、閲覧しているサイト自体は、一つのキーワードによって表されるものではなく、複数のキーワードをもって表されているものが通常である。例えば、ユーザが映画aに関する情報を検索し、閲覧している場合において、その閲覧しているサイトは、映画aの紹介であったり、原作本を紹介していたり、興行映画館を紹介していたり、出演者を紹介していたり、いろいろな情報(ベクトル情報)を含んでいる。この場合、ユーザは原作本を探している場合には、その原作本に特化したフィルタリング処理を行い、そのためのだけのレコメンド情報を配信することがユーザにとって望まれるものである。
【0008】
しかしながら、上述特許文献1に記載の技術では、閲覧しているサイトの全体を見てその全体に近い情報をレコメンド情報として配信することになり、上述のとおりユーザにとって潜在的に望んでいる情報を配信することができなかった。
【0009】
そこで、このように潜在的に望んでいる情報を配信する技術としてユーザの閲覧の有無に基づいて各コンテンツに対する満足・不満足を判定し、これに基づいて生成された分離平面に基づいて潜在的に望んでいる未知のコンテンツに対して満足・不満足を判定することが考えられている。
【0010】
しかしながら、単純にユーザの閲覧の有無に基づいて各コンテンツに対する満足・不満足を判定すると、ユーザにとって本当に不満足であったものか、正確に判定することができない。すなわち、ユーザが閲覧しなかったものを一律に不満足とするとユーザはコンテンツの内容を十分に理解しないまま、また誤解したまま不満足と判断される可能性がある。例えば、ユーザはコンテンツリストに表示されているコンテンツ概要に基づいてどれを閲覧するか判断するものであるが、その概要に基づいて閲覧の要否を判断しているため、十分に理解していない可能性がある。
【0011】
そこで、本発明は、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるように、その評価を行う分離平面をより正確に行うことができるレコメンド情報配信装置およびレコメンド情報配信方法を提供することを目的とする。
【課題を解決するための手段】
【0012】
上述の課題を解決するために、本発明のレコメンド情報配信装置は、コンテンツを複数示したコンテンツリストをクライアント端末に送信し、当該クライアント端末において前記コンテンツリストから一のコンテンツが選択されると、当該一のコンテンツを送信するコンテンツ送信手段と、前記コンテンツ送信手段により送信された一のコンテンツに対する閲覧度および前記コンテンツリストに表示される前記一のコンテンツ以外の他のコンテンツに対する不閲覧度を記憶するとともに、前記コンテンツ送信手段によりコンテンツが送信されるたびにその閲覧度および不閲覧度を記憶する閲覧履歴記憶手段と、前記閲覧履歴記憶手段に記憶されている各コンテンツの閲覧度および不閲覧度に基づいて、各コンテンツの関心度を判定する判定手段と、前記閲覧履歴記憶手段に記憶された各コンテンツの閲覧度および不閲覧度に基づいて、前記判定手段により判定された各コンテンツの判定結果の信頼度を算出する信頼度算出手段と、前記信頼度算出手段により算出された各コンテンツの信頼度に基づいて、各コンテンツを満足クラスと不満足クラスとに分離する分離平面を生成する分離平面生成手段と、前記分離平面生成手段により生成された分離平面を用いて評価されたコンテンツをレコメンド情報として送信するレコメンド送信手段と、を備えている。
【0013】
この発明によれば、コンテンツを複数示したコンテンツリストをクライアント端末に送信し、当該クライアント端末においてコンテンツリストから一のコンテンツが選択されると、当該一のコンテンツを送信し、送信された一のコンテンツの閲覧度およびコンテンツリストに表示される一のコンテンツ以外の他のコンテンツの不閲覧度を記憶するとともに、コンテンツが送信されるたびにその閲覧度および不閲覧度を記憶する。ここで記憶された各コンテンツの閲覧度および不閲覧度に基づいて、各コンテンツの関心度を判定し、判定された各コンテンツの判定結果の信頼度を算出し、算出された各コンテンツの信頼度に基づいて、各コンテンツを満足クラスと不満足クラスとに分離する分離平面を生成する。そして、この分離平面を用いて生成されたレコメンド情報を送信する。
【0014】
これにより、未知のコンテンツに対しても分離平面を用いて満足クラス、不満足クラスに分離することができ、ユーザが満足するコンテンツをレコメンド情報として提供することができる。特に、満足判定結果の信頼度を用いることで、精度のよい分離平面を生成することができ、ユーザにとって関心度の高いレコメンド情報を提供することができる。
【0015】
また、本発明のレコメンド情報配信装置は、コンテンツリストに選択可能な状態にありつつ選択されなかったコンテンツと類似する未知のコンテンツに対する不閲覧度を増加させる閲覧度算出手段をさらに備え、前記判定手段は、前記閲覧度算出手段により増加させられた不閲覧度を用いて各コンテンツの関心度を判定することが好ましい。
【0016】
この発明によれば、コンテンツリストに選択可能な状態にありつつ選択されなかったコンテンツと類似する未知のコンテンツに対する不閲覧度を増加させ、この増加させられた不閲覧度を用いて各コンテンツの関心度を判定することにより、類似するコンテンツに対しては、不閲覧度を伝播させることができ、少ないサンプル数で、より精度のよい信頼度を算出することができる。
【0017】
また、本発明のレコメンド情報配信装置において、前記分離平面生成手段は、前記信頼度算出手段により算出された各コンテンツの信頼度の度合いに応じて、当該各コンテンツに対する誤差を許容しないように分離平面を生成することが好ましい。
【0018】
この発明によれば、算出された各コンテンツの信頼度の度合いに応じて、当該各コンテンツに対する誤差を許容しないように分離平面を生成することで、信頼度の高いコンテンツに比べて信頼度の低いコンテンツに対する誤差を許容し、信頼度に応じたより精度のよい分離平面を生成することができる。すなわち、信頼度の低いコンテンツは、例えば満足であると判断されたとしても、本当に満足したものか否か不明瞭な部分もあるため、そのようなコンテンツは分離平面を生成する際には、あまり重要視しないようにしたほうが結果的に精度のよい分離平面を生成することができる。
【0019】
また、本発明のレコメンド情報配信装置において、前記分離平面生成手段は、前記信頼度算出手段により算出された信頼度が所定順位までのコンテンツを用いて分離平面を生成することが好ましい。
【0020】
この発明によれば、算出された信頼度が所定順位までのコンテンツを用いて分離平面を生成することで、相対的に信頼度の低いコンテンツは無視して分離平面を生成することになる。すなわち、信頼度の低いコンテンツは、例えば満足であると判断されたとしても、本当に満足したものか否か不明瞭な部分もあるため、そのようなコンテンツは分離平面を生成する際には、あまり重要視しないようにしたほうが結果的に精度のよい分離平面を生成することができる。
【発明の効果】
【0021】
本発明によれば、未知のコンテンツに対しても分離平面を用いて満足クラス、不満足クラスに分離することができ、ユーザが満足するコンテンツをレコメンド情報として提供することができる。特に、満足判定結果の信頼度を用いることで、精度のよい分離平面を生成することができ、ユーザにとって関心度の高いレコメンド情報を提供することができる。
【図面の簡単な説明】
【0022】
【図1】本実施形態のレコメンド情報配信装置100の機能を示すブロック図である。
【図2】コンテンツ特性ベクトル管理テーブル104aが記憶する情報の説明図である。
【図3】閲覧履歴テーブル104bの具体例を示す説明図である。
【図4】コンテンツの階層構造を示す模式図である。
【図5】ページID別点数テーブルを示す説明図である。
【図6】満足判定テーブルの具体例を示す説明図である。
【図7】従来のSVM法を用いて分離平面を生成するときの模式図である。
【図8】判定信頼度を用いてSVM法を用いて分離平面を生成するときの模式図である。
【図9】分離平面を生成するときのレコメンド情報配信装置100の処理を示すフローチャートである。
【図10】分離平面を用いて満足クラスに分離されたコンテンツをレコメンド情報として送信するときの処理を示すフローチャートである。
【図11】他の類似するコンテンツに対して不閲覧度が伝播する概念を示す概念図である。
【発明を実施するための形態】
【0023】
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
【0024】
図1は、本実施形態のレコメンド情報配信装置100の機能を示すブロック図である。図1に示すようにレコメンド情報配信装置100は、コンテンツ要求受信部101、コンテンツ送信部102(コンテンツ送信手段、レコメンド送信手段)、コンテンツリスト記憶部103a、コンテンツ記憶部103b、ページID別点数テーブル103c、コンテンツ特性ベクトル管理テーブル104a、閲覧履歴テーブル104b、満足判定テーブル104c、不閲覧履歴テーブル104d、レコメンド要求受信部105、閲覧度算出部106(閲覧度算出手段)、判定部107(判定手段)、信頼度算出部108(信頼度算出手段)、および分離平面生成部109(分離平面生成手段)を含んで構成されている。
【0025】
このレコメンド情報配信装置100は、CPU、ROM、RAM、および通信モジュール等から構成されており、ROMに記憶されているプログラムにしたがってCPU等が動作することにより、以下の機能を実現することができる。
【0026】
コンテンツ要求受信部101は、クライアント端末である移動機等からコンテンツの配信要求を受信する部分である。
【0027】
コンテンツ送信部102は、コンテンツ要求受信部101により受信されたコンテンツの配信要求に基づいて、クライアント端末から要求のあったコンテンツまたはコンテンツリストを送信する部分である。なお、コンテンツは、Webページ等の情報であり、またコンテンツリストはコンテンツの概要・タイトル等をリスト形式でまとめた情報である。このコンテンツリストは、リストとして予め記憶されているのではなく、リストに掲載するための概要情報がコンテンツごとに記憶されており、必要に応じて動的に生成(リスト化)される情報である。
【0028】
また、コンテンツ送信部102は、レコメンド要求受信部105においてレコメンド要求が受信された際に、後述する分離平面生成部109により生成された分離平面に基づいて満足と評価されたコンテンツおよびコンテンツリストの少なくとも一方をレコメンド情報として送信する部分である。
【0029】
コンテンツリスト記憶部103aは、コンテンツの概要、タイトル等を記述したコンテンツリストを、その生成時に一時的に記憶する部分である。
【0030】
コンテンツ記憶部103bは、配信対象となるコンテンツを記憶する部分である。
【0031】
ページID別点数テーブル103cは、ページIDごとに閲覧度のための点数を対応付けて記憶する部分である。後述するとおり、ページID別点数テーブル103cを用いて、閲覧度算出部106においては満足判定テーブル104cに閲覧度を記述することができる。
【0032】
コンテンツ特性ベクトル管理テーブル104aは、コンテンツの特性ベクトルを記憶する部分である。
【0033】
コンテンツ特性ベクトル管理テーブル104aは、コンテンツの特性ベクトルを記憶する部分である。例えば、図2に示される情報が記憶される。図2は、コンテンツ特性ベクトル管理テーブル104aが記憶する情報の説明図であり、コンテンツを特定するコンテンツIDごとに、コンテンツ特性ベクトルのパラメータが記憶されている。例えば、コンテンツIDがC1については、金融、旅行、・・・、音楽、サッカーというパラメータに対して、その特性ベクトルは、(0,0、・・・1,0,0)が定義付けられている。
【0034】
閲覧履歴テーブル104bおよび不閲覧履歴テーブル104dは、コンテンツ送信部102により送信されたコンテンツリストの中から選択され閲覧された閲覧コンテンツおよび閲覧されなかった不閲覧コンテンツの閲覧履歴情報を記憶する部分である。図3は、その閲覧履歴テーブル104bおよび不閲覧履歴テーブル104dの具体例を示す説明図である。図3(a)に示すように、閲覧履歴テーブル104bは、閲覧日時、閲覧したコンテンツを示すコンテンツID、およびそのコンテンツに付与されているページIDを記憶し、図3(b)に示すように、不閲覧履歴テーブル104dは、閲覧可能状態であったにもかかわらず閲覧されなかったときの日時およびそのコンテンツを示すコンテンツIDを記憶する。コンテンツ送信部102によりコンテンツが送信されるたびに、この閲覧履歴テーブル104bに上述各種情報が記憶され、また、コンテンツリストにコンテンツが閲覧可能な状態に表示されているにもかかわらず、送信されなかったコンテンツについては、そのコンテンツIDおよび不閲覧の日時(閲覧可能な状態であっても、閲覧されなかった日時)が、不閲覧履歴テーブル104dに記憶される。
【0035】
なお、これら閲覧履歴情報におけるコンテンツIDおよびページIDの値は、レコメンド情報配信装置100においてアクセスログとして記録されたURL情報等をもとに判定してもよい。すなわち、レコメンド情報配信装置100、または他のサーバ装置において、URL情報に、コンテンツIDおよびページIDを対応付けて記憶しておき、アクセスログに記述されているURL情報にもとづいてコンテンツID及びページIDを抽出するようにしてもよい。また、コンテンツIDおよびページIDをそのままアクセスログとして記憶しておき、その記憶している情報を用いてもよい。
【0036】
また、アクセスログは、レコメンド情報配信装置100に記憶するほか、コンテンツを配信するWebサーバにおいて記憶しておき、そのWebサーバから必要に応じてアクセスログを抽出するようにしてもよいし、移動機にアクセスログを記憶しておき、そのアクセスログを抽出するようにしてもよい。
【0037】
ここで各コンテンツに含まれているページIDについて説明する。本実施形態におけるページIDとは、閲覧度を計算するために各コンテンツに付与されている点数を示す情報である。このページIDは、階層構造で構成されているコンテンツのうち下層に位置するコンテンツに対して、より多くの点数が与えられるように数値設定がなされるほうが、そのコンテンツに対する興味の度合いを図る上では好ましいが、当然にこれに限定するものではない。
【0038】
図4にコンテンツの階層構造を示す模式図を示す。図4に示されるように、コンテンツリスト401のうち、ユーザによりコンテンツ(コンテンツID:1)が選択されると、コンテンツ要求受信部101によりコンテンツ401aがコンテンツ記憶部103bから読み出され、クライアント端末に送信される。このコンテンツ401aは、ページID:1が設定されている。そして、ページID別点数テーブル103cには、図5に示されるようにページID:1は、点数:1が対応付けられている。なお、このページID別点数テーブル103cは、記憶部103に記憶されているが、ページIDで閲覧度の算出を行っていない場合には不要となる。
【0039】
そして、コンテンツ401aに記述されている“地図を見る”がユーザにより選択されると、それにリンク付けされてコンテンツ地図画面であるコンテンツ402aが抽出され、送信される。また、コンテンツ401aに記述されている“お気に入りに登録”がユーザにより選択されると、それにリンク付けされてお気に入り登録画面であるコンテンツ403aが抽出され、送信される。
【0040】
そして、コンテンツ送信部102により、選択されたコンテンツが送信されるとともに、それぞれ選択されたコンテンツに対応するページIDが閲覧履歴テーブル104bに、そのコンテンツIDに対応付けて記述される。また、コンテンツリストには選択可能に表示されつつ、選択されなかった他のコンテンツについては、不閲覧度の計算のため、不閲覧履歴テーブル104dに、当該他のコンテンツのコンテンツIDが記述される。
【0041】
満足判定テーブル104cは、閲覧度算出部106、判定部107、および信頼度算出部108により生成される満足判定のための情報をユーザ(クライアント端末)単位で区別して記憶する部分であって、その中でさらにコンテンツを示すコンテンツIDに対応付けて閲覧度、不閲覧度、関心度、満足判定結果、および判定信頼度が記憶されている。図6にその具体例を示す。図6は、満足判定テーブル104cの具体例を示す説明図である。図6に示されるように、コンテンツID、閲覧度、不閲覧度、関心度、満足判定結果、および判定信頼度が対応付けて記憶されている。なお、この満足判定テーブル104cは、ユーザ(クライアント端末)ごとに用意されているものである。
【0042】
この閲覧度および不閲覧度は、後述するとおり、閲覧度算出部106により算出され、この満足判定テーブル104cの該当箇所に記述される。また、関心度は、判定部107により閲覧度から不閲覧度を減算することにより算出され、その算出結果が記述される。同様に満足判定結果は、判定部107により算出された関心度にしたがって判定された結果が記述される。判定信頼度は、信頼度算出部108により、関心度の絶対値を求めることにより算出される。
【0043】
レコメンド要求受信部105は、クライアント端末からレコメンド情報の配信要求であるレコメンド要求を受信する部分である。レコメンド要求受信部105はクライアント端末からレコメンド要求を受信すると、コンテンツ評価部110に対して、コンテンツの閲覧度および不閲覧度に基づいて算出された関心度および信頼度にしたがって、複数あるコンテンツを満足クラスまたは不満足クラスに分離するための分離平面にしたがってコンテンツを分離し、満足クラスに位置するコンテンツをレコメンド情報とするよう、指示を出力する。
【0044】
コンテンツ評価部110は、レコメンド情報としてコンテンツを評価する部分であり、具体的には、閲覧度算出部106、判定部107、信頼度算出部108、および分離平面生成部109を含んで構成されている。
【0045】
閲覧度算出部106は、レコメンド要求受信部105においてクライアント端末からレコメンド要求が受信されると、閲覧履歴テーブル104bおよび不閲覧履歴テーブル104dに記憶される情報に基づいて当該クライアント端末のユーザにおける閲覧度および不閲覧度を計算する部分である。
【0046】
例えば、閲覧度算出部106は、コンテンツごとに閲覧度を算出するにあたって、閲覧履歴テーブル104bに記憶されているページIDを、ページID別点数テーブルを用いて点数に変換して、その点数をコンテンツIDごとに集計して、その累積値を算出する。一方、閲覧度算出部106は、不閲覧履歴テーブル104dに記憶されているコンテンツIDが同じものの数(不閲覧回数)を集計する。閲覧度算出部106は、不閲覧回数1回につき所定の点数を累積するために、所定係数に不閲覧回数を乗算した数値を不閲覧度として算出する。
【0047】
このように計算した閲覧度および不閲覧度は、上述したとおり満足判定テーブル104cの閲覧度欄および不閲覧度欄に記述される。
【0048】
なお、閲覧度算出部106は、不閲覧度を算出する際に、閲覧されなかったコンテンツに類似するコンテンツに対しても、不閲覧回数を付加して、不閲覧度を増加させるようにしてもよい。例えば、あるコンテンツの不閲覧度を計算する際に、そのコンテンツに類似するコンテンツが閲覧できる状態であるにもかかわらず閲覧されていなかった場合、その回数を不閲覧履歴テーブル104dに基づいて算出する。そして、その回数に所定の重み係数を乗算して得た数値を、その類似したコンテンツから伝播された不閲覧度とする。類似したコンテンツが複数あった場合には、その分だけ不閲覧度を合算し、合算した伝播された不閲覧度を考慮した不閲覧度が満足判定テーブル104cに記憶される。
【0049】
よって、コンテンツ特性ベクトル管理テーブル104aに記憶されているコンテンツ特性ベクトルに基づいて、その内積を計算することにより類似度を求め、所定の類似度をもつ他のコンテンツ(すなわち類似するコンテンツ)については、当該閲覧されなかったコンテンツと同様に閲覧されない可能性が高いものであることから、閲覧できる状態であったのにもかかわらず、閲覧されなかったという評価を伝播させる。これにより、少ないサンプル数で満足クラス、または不満足クラスの判断を正確に行わせることができる。
【0050】
その概念について図11を用いて説明する。図11は、N次元特徴空間における不閲覧度が伝播される概念を示す概念図である。図11に示されるようにコンテンツCが閲覧されていなかった場合、そのコンテンツCに類似するコンテンツC4およびC5については不閲覧度が2加算される。一方で、類似していないコンテンツC1からC3については、不閲覧度は加算されない。これにより上述したとおり、少ないサンプル数を持って満足クラス、不満足クラスの判断を行わせることができる。
【0051】
判定部107は、閲覧度算出部106により算出された閲覧度および不閲覧度に基づいて関心度を算出し、その関心度に基づいて、対応するコンテンツが満足クラスまたは不満足クラスであるかを判定する部分である。例えば、判定部107は、閲覧度から不閲覧度を減算することにより関心度を算出し、その関心度が正の数値をとるのであれば、そのコンテンツは満足クラスであるとの判定結果を得ることができ、その結果を満足判定テーブル104cに記述する。
【0052】
信頼度算出部108は、関心度に基づいて判定信頼度を算出する部分である。具体的には信頼度算出部108は、関心度の絶対値を求め、その値を判定信頼度として算出する。
【0053】
分離平面生成部109は、信頼度算出部108により算出された判定信頼度に基づいて、コンテンツ記憶部103bに記憶されている複数のコンテンツを満足クラスと不満足クラスとに分離するための分離平面を生成する部分である。本実施形態では、分離平面生成部109は、SVM(Suport Vector Machine)法を用いて分離平面を生成する。
【0054】
ここで具体的な分離平面の生成手法について説明する。従来のSVM法のアルゴリズムは、下記式(1)を用いてL(w,ξ)を最小化する分離平面を表すベクトルwを計算する。
【数1】



【0055】
ここで1/‖w‖は、識別平面と分離平面との距離、ξは、サンプルデータiが識別平面を超えてどれくらい反対側に入り込んだかを示す距離を表すパラメータ、γは定数である、Nはコンテンツの総数である。これにより、識別平面と分離平面との距離(=マージン)1/‖w‖を最大としながら、誤差の総和Σξを最小化するような分離平面を表すベクトルwが算出される。識別平面とは、満足クラス(不満足クラス)の内側と外側の境界を表す平面であり、分離平面に対して平行な面である。
【0056】
図7に、上述の通り説明した従来のSVM法を用いて満足クラス、不満足クラスを分けた分離平面wの模式図を示す。ここで得られた分離平面は、一部のコンテンツについて誤差を許容することで、識別平面と分離平面との距離を最大化しつつ、誤差を最小化している。例えば、コンテンツAは、本来不満足クラスに位置すべきであるが、不満足クラスの外側にはみ出しており、誤差が許容されている。また、コンテンツBは、本来満足クラスに位置すべきであるが、満足クラスの外側にはみ出しており、誤差が許容されている。
【0057】
これに対して、本実施形態における拡張したSVM法においては、各コンテンツにおいて判定された関心度判定にする判定信頼度に基づいてこの誤差の許容の範囲を変えようとするものである。
【0058】
具体的には、拡張したSVM法においては、以下の式(2)を用いてL(w,ξ)を最小化する分離平面を表すベクトルwを計算する。
【数2】



【0059】
ここでも、上述したとおり、1/‖w‖は、識別平面と分離平面との距離、ξは、サンプルデータであるコンテンツiが識別平面を超えてどれくらい反対側に入り込んだかを示す距離、γは定数である、Nはコンテンツの総数である。また、tは、コンテンツiの判定信頼度、Tは判定信頼度の基準値(定数)となる。これにより判定信頼度で誤差に対する重み付けを行うことができる。よって、判定信頼度の高いコンテンツは、誤差が許容されにくくなり、判定信頼度の低いコンテンツは逆に誤差が許容されやすくなる。
【0060】
この拡張したSVM法を用いて生成した分離平面の模式図を図8に示す。図8では、コンテンツAは、満足判定に対する信頼度が低いコンテンツとし、コンテンツBは満足判定に対する信頼度が高いコンテンツとしている。これにより、コンテンツAは、不満足コンテンツであると判定されていたのにもかかわらず、信頼度が低いため、不満足クラスの外側にあっても許容されている。すなわち、コンテンツAについては、誤差は許容される。
【0061】
また、コンテンツBは、満足判定の信頼度が高い、満足コンテンツであると判定されている。よって、これらを満たすように分離平面wが生成されることになる。
【0062】
つぎに、判定信頼度が相対的に低いコンテンツを排除する別のSVM法について説明する。例えば、図7、図8に示したコンテンツAおよびコンテンツBに関して、それぞれコンテンツAは判定信頼度が低く(所定値以下)、コンテンツBは判定信頼度が高い(所定値以上)ものとすると、判定信頼度が低いものは分離平面を生成する上で、考慮しない処理が考えられる。例えば、以下の式(3)を用いることにより分離平面を生成することができる。
【数3】



【0063】
ここで1/‖w‖は、識別平面と分離平面との距離、ξは、サンプルデータであるコンテンツiが識別平面を超えてどれくらい反対側に入り込んだかを示す距離、γは定数である、N1は判定信頼度が所定値以上のコンテンツの総数である。
【0064】
これにより、判定信頼度が高い、すなわち所定値以上のコンテンツのみを対象に分離平面を生成することになり、より精度の高い分離平面を生成することが期待できる。なお、この方法においては、判定信頼度が所定値(予め定めた定数)以上のN1個のコンテンツを対象としているが、これに限るものではなく、例えば、判定信頼度の平均値に所定係数α(>0)を乗じたものを所定値としてN1個のコンテンツに対する分離平面を生成するときの対象となるコンテンツとしてもよい。
【0065】
さらに、式(2)および式(3)により表された方法を組み合わせた方法を考えることができる。すなわち、以下の式(4)により表された式により分離平面を生成することもできる。
【数4】



【0066】
ここでも、上述したとおり、1/‖w‖は、識別平面と分離平面との距離、ξは、サンプルデータであるコンテンツiが識別平面を超えてどれくらい反対側に入り込んだかを示す距離、γは定数である、N1はコンテンツの判定信頼度が所定値以上となるコンテンツの総数である。また、tは、コンテンツiの判定信頼度、Tは判定信頼度の基準値(定数)となる。
【0067】
これにより、判定信頼度の条件を満たすデータの誤差と判定信頼度との積の総和を、最小化の対象とし、信頼度が所定値未満のコンテンツを対象としないことで、より精度の高い分離平面を生成することが期待できる。
【0068】
このように分離平面生成部109により分離平面を用いて満足コンテンツ、不満足コンテンツを分離し、満足コンテンツ側に位置するコンテンツをレコメンド情報として、コンテンツ送信部102は送信することができる。
【0069】
つぎに、このレコメンド情報配信装置100の処理について説明する。図9は、分離平面を生成するときのレコメンド情報配信装置100の処理を示すフローチャートである。クライアント端末からのコンテンツ要求がコンテンツ要求受信部101により受信され、そのコンテンツがコンテンツ送信部102により送信されるたびに閲覧履歴テーブル104bに、ユーザが閲覧したコンテンツを示すコンテンツID、そのコンテンツに記述されるページID、および閲覧日時が、また不閲覧履歴テーブル104dに、閲覧しなかったコンテンツのコンテンツIDおよびその日時が記憶される(S101)。
【0070】
そして、レコメンド要求受信部105により、レコメンド要求が受信されると、閲覧履歴テーブル104bから、コンテンツごとにユーザが閲覧したコンテンツのページIDが、閲覧度算出部106により取得される(S102)。そして、閲覧度算出部106により、閲覧履歴テーブル104bから取得した閲覧度および不閲覧度のコンテンツごとのそれぞれ累積値が算出され、算出した閲覧度および不閲覧度のそれぞれ累積値が満足判定テーブル104cの閲覧度欄および不閲覧度欄に記述される(S103)。
【0071】
この満足判定テーブル104cに記憶されている閲覧度および不閲覧度に基づいて、判定部107により関心度が算出される。そして、この関心度に基づいてコンテンツごとに当該コンテンツを満足クラスとするか、不満足クラスとするかが、判定部107により判定され、その判定結果が満足判定テーブル104cに記述される(S104)。
【0072】
つぎに、信頼度算出部108により、満足判定結果の判定信頼度が算出される(S105)。そして、分離平面生成部109により、コンテンツ記憶部103bに記憶されている複数のコンテンツを特徴ベクトルが抽出され、その特徴ベクトルを用いて満足クラスと、不満足クラスとに分離するための分離平面が生成される(S107)。分離平面の生成方法に関して、上述したとおり、拡張したSVM法を用いて判定信頼度を考慮した分離平面を生成する。
【0073】
つぎに、この分離平面の活用について説明する。図10は、分離平面を用いて満足クラスに分離されたコンテンツの送信処理を示すフローチャートである。コンテンツ送信部102により、配信候補となるコンテンツのうち、分離平面生成部109により生成された分離平面に基づいて区分された満足クラスに属するコンテンツのコンテンツ概要がレコメンド情報としてコンテンツリストから抽出される(S201)。そして、コンテンツ送信部102により抽出されたレコメンド情報はクライアント端末に送信される(S202)。このようにして、分離平面を用いてレコメンド情報を配信することができる。
【0074】
つぎに、このように構成されたレコメンド情報配信装置100の作用効果について説明する。本実施形態のレコメンド情報配信装置100において、コンテンツ送信部102は、関心度を示す点数であるページIDを含んだコンテンツを複数示したコンテンツリストをコンテンツリスト記憶部103aから抽出してクライアント端末に送信し、当該クライアント端末においてコンテンツリストから一のコンテンツが選択されると、当該一のコンテンツをクライアント端末に送信する。そして、コンテンツ送信部102は、送信した一のコンテンツに含まれているページIDに基づいて閲覧度の点数を導出するとともに、当該導出した点数を閲覧履歴テーブル104bに記述する。この処理とともに、コンテンツリストに表示される一のコンテンツ以外の他のコンテンツについては、閲覧されなかったとして不閲覧度を算出し、閲覧履歴テーブル104bに記述する。このように閲覧履歴テーブル104bには、コンテンツが送信されるたびに閲覧履歴情報が更新される。
【0075】
そして、レコメンド要求受信部105がレコメンド要求を受信すると、閲覧度算出部106は、閲覧履歴テーブル104bに記憶されている閲覧度および不閲覧度をコンテンツごとにその累積値を算出し、判定部107は、その累積値に基づいて各コンテンツの関心度を判定する。例えば閲覧度から不閲覧度を減算して得た関心度が正の数値であれば満足であると判定する。
【0076】
そして、信頼度算出部108は、関心度の絶対値から、当該判定結果の信頼度を算出し、分離平面生成部109は、算出された信頼度に基づいて、複数あるコンテンツを満足クラスと不満足クラスとに分離する分離平面を生成する。例えば、SVM法を用いて分離平面を生成する。このように生成された分離平面を用いて評価されたコンテンツをレコメンド情報として、コンテンツ送信部102は送信する。
【0077】
これにより、未知のコンテンツに対しても分離平面を用いて満足クラス、不満足クラスに分離することができ、ユーザが満足するコンテンツをレコメンド情報として提供することができる。特に、満足判定結果の信頼度を用いることで、精度のよい分離平面を生成することができ、ユーザにとって関心度の高いレコメンド情報を提供することができる。
【0078】
また、レコメンド情報配信装置100において、閲覧度算出部106は、満足判定テーブル104cを生成するSAIにおいて、コンテンツリストに選択可能な状態にありつつ選択されなかったコンテンツと類似する未知のコンテンツに対する不閲覧度を増加させる。判定部107は、この増加させられた不閲覧度を用いて各コンテンツの関心度を判定する。これにより、類似するコンテンツに対しては、不閲覧度を伝播させることができ、少ないサンプル数で、より精度のよい信頼度を算出することができる。
【0079】
また、レコメンド情報配信装置100において、算出された各コンテンツの信頼度の度合いに応じて、当該各コンテンツに対する誤差を許容しないように分離平面を生成することで、信頼度の高いコンテンツに比べて信頼度の低いコンテンツに対する誤差を許容し、信頼度に応じたより精度のよい分離平面を生成することができる。すなわち、信頼度の低いコンテンツは、例えば満足であると判断されたとしても、本当に満足したものか否か不明瞭な部分もあるため、そのようなコンテンツは分離平面を生成する際には、あまり重要視しないようにしたほうが結果的に精度のよい分離平面を生成することができる。
【符号の説明】
【0080】
100…レコメンド情報配信装置、101…コンテンツ要求受信部、102…コンテンツ送信部、103…記憶部、103a…コンテンツリスト記憶部、103b…コンテンツ記憶部、103c…ページID別点数テーブル、104a…コンテンツ特性ベクトル管理テーブル、104b…閲覧履歴テーブル、104c…満足判定テーブル、104d…不閲覧履歴テーブル、105…レコメンド要求受信部、106…閲覧度算出部、107…判定部、108…信頼度算出部、109…分離平面生成部、110…コンテンツ評価部。

【特許請求の範囲】
【請求項1】
コンテンツを複数示したコンテンツリストをクライアント端末に送信し、当該クライアント端末において前記コンテンツリストから一のコンテンツが選択されると、当該一のコンテンツを送信するコンテンツ送信手段と、
前記コンテンツ送信手段により送信された一のコンテンツに対する閲覧度および前記コンテンツリストに表示される前記一のコンテンツ以外の他のコンテンツに対する不閲覧度を記憶するとともに、前記コンテンツ送信手段によりコンテンツが送信されるたびにその閲覧度および不閲覧度を記憶する閲覧履歴記憶手段と、
前記閲覧履歴記憶手段に記憶されている各コンテンツの閲覧度および不閲覧度に基づいて、各コンテンツの関心度を判定する判定手段と、
前記閲覧履歴記憶手段に記憶された各コンテンツの閲覧度および不閲覧度に基づいて、前記判定手段により判定された各コンテンツの判定結果の信頼度を算出する信頼度算出手段と、
前記信頼度算出手段により算出された各コンテンツの信頼度に基づいて、各コンテンツを満足クラスと不満足クラスとに分離する分離平面を生成する分離平面生成手段と、
前記分離平面生成手段により生成された分離平面を用いて評価されたコンテンツをレコメンド情報として送信するレコメンド送信手段と、
を備えるレコメンド情報配信装置。
【請求項2】
コンテンツリストに選択可能な状態にありつつ選択されなかったコンテンツと類似する未知のコンテンツに対する不閲覧度を増加させる閲覧度算出手段をさらに備え、
前記判定手段は、前記閲覧度算出手段により増加させられた不閲覧度を用いて各コンテンツの関心度を判定することを特徴とする請求項1に記載のレコメンド情報配信装置。
【請求項3】
前記分離平面生成手段は、前記信頼度算出手段により算出された各コンテンツの信頼度の度合いに応じて、当該各コンテンツに対する誤差を許容しないように分離平面を生成することを特徴とする請求項1または2に記載のレコメンド情報配信装置。
【請求項4】
前記分離平面生成手段は、前記信頼度算出手段により算出された信頼度が所定順位までのコンテンツを用いて分離平面を生成することを特徴とする請求項1から3のいずれか一項に記載のレコメンド情報配信装置。
【請求項5】
コンテンツを複数示したコンテンツリストをクライアント端末に送信し、当該クライアント端末において前記コンテンツリストから一のコンテンツが選択されると、当該一のコンテンツを送信するコンテンツ送信ステップと、
前記コンテンツ送信ステップにより送信された一のコンテンツに対する閲覧度および前記コンテンツリストに表示される前記一のコンテンツ以外の他のコンテンツに対する不閲覧度を記憶するとともに、前記コンテンツ送信ステップによりコンテンツが送信されるたびにその閲覧度および不閲覧度を閲覧履歴記憶手段に記憶する閲覧履歴記憶ステップと、
前記閲覧履歴記憶手段に記憶されている各コンテンツの閲覧度および不閲覧度に基づいて、各コンテンツの関心度を判定する判定ステップと、
前記閲覧履歴記憶手段に記憶された各コンテンツの閲覧度および不閲覧度に基づいて、前記判定ステップにより判定された各コンテンツの判定結果の信頼度を算出する信頼度算出ステップと、
前記信頼度算出ステップにより算出された各コンテンツの信頼度に基づいて、各コンテンツを満足クラスと不満足クラスとに分離する分離平面を生成する分離平面生成ステップと、
前記分離平面生成ステップにより生成された分離平面を用いて評価されたコンテンツをレコメンド情報として送信するレコメンド送信ステップと、
を備えるレコメンド情報配信方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate