レコメンド情報評価装置およびレコメンド情報評価方法
【課題】ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるように、その評価を行うことができる装置を提供する。
【解決手段】所定のタイミングで、特徴ベクトル生成部209は、Webページなどのコンテンツを収集し、そのコンテンツの特徴を示すキーワードを抽出して、特徴ベクトルを生成する。生成した特徴ベクトルは、コンテンツ特徴ベクトル管理テーブル207bに記憶され、更新される。この収集のタイミングは、任意のタイミングや、Webページが更新されたタイミング(これは更新通知信号を受信するなどして)である。このように更新されたコンテンツ特徴ベクトルを用いてコンテンツの評価を行う。
【解決手段】所定のタイミングで、特徴ベクトル生成部209は、Webページなどのコンテンツを収集し、そのコンテンツの特徴を示すキーワードを抽出して、特徴ベクトルを生成する。生成した特徴ベクトルは、コンテンツ特徴ベクトル管理テーブル207bに記憶され、更新される。この収集のタイミングは、任意のタイミングや、Webページが更新されたタイミング(これは更新通知信号を受信するなどして)である。このように更新されたコンテンツ特徴ベクトルを用いてコンテンツの評価を行う。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツの評価を行うレコメンド情報評価装置およびレコメンド情報評価方法に関する。
【背景技術】
【0002】
ユーザの特徴に合致したレコメンド情報を配信するために、そのレコメンド情報を抽出するための情報フィルタリング方式として、Content−basedFiltering方式が考えられている。この方式は、ユーザがWebページの閲覧などの行動を取ることにより、閲覧された対象文書を解析し、文書に含まれている単語(キーワード)を抽出する。そして、これらの単語を、ユーザごとに区別して、ユーザプロファイルといわれる興味・嗜好情報として記録する。ユーザプロファイルには、1つの興味の概念が表現され、この概念を利用してユーザに情報を提供することが考えられている。例えば、広告商品等に割り当てられたキーワードとユーザプロファイル(キーワードで表現された)とをマッチングすることにより適切な広告の推薦を可能とするシステムが一般的に知られている。
【0003】
また、これに関連する技術として、特許文献1に記載されている技術が挙げられる。この特許文献1には、予め定められたレコメンド抽出ルールに従ってレコメンド情報を配信する配信先および配信すべきレコメンド情報を決定し、配信する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−148878号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の背景技術においては、マッチング処理をすることによりレコメンド情報を抽出するものであったり、また、特許文献1に記載の技術では、予め定められたレコメンド抽出ルールに基づいてレコメンド情報が決定され、レコメンド対象によって特徴空間ベクトルは更新されないことから、レコメンド情報に漏れが生じるおそれがある。
【0006】
すなわち、特許文献1の技術においては、レコメンド抽出ルールに、趣味・嗜好が登録されていれば、その趣味・嗜好にあったレコメンド情報が決定され配信されることになり、また、購買履歴等に基づいて、ある商品を購入するとその購入した商品に関連する情報が配信されることになるが、これら配信される情報は、趣味・嗜好、購買履歴、またはアクセス履歴などの直接的な情報に基づいて決定され、またレコメンド対象によって特徴空間ベクトルは更新されないため、ユーザが潜在的に望んでいるコンテンツに漏れが生じる場合がある。
【0007】
特にアクセス履歴に基づいてレコメンド情報を配信使用とする場合には、特に漏れが大きくなるものと考えられる。すなわち、ユーザがサイトなどを閲覧する場合、閲覧しているサイト自体は、一つのキーワードによって表されるものではなく、複数のキーワードをもって表されているものが通常である。例えば、ユーザが映画aに関する情報を検索し、閲覧している場合において、その閲覧しているサイトは、映画aの紹介であったり、原作本を紹介していたり、興行映画館を紹介していたり、出演者を紹介していたり、いろいろな情報(ベクトル情報)を含んでいる。この場合、ユーザは原作本を探している場合には、その原作本に特化したフィルタリング処理を行い、そのためのだけのレコメンド情報を配信することがユーザにとって望まれるものである。
【0008】
しかしながら、上述特許文献1に記載の技術では、閲覧しているサイトの全体を見てその全体に近い情報をレコメンド情報として配信することになり、上述のとおりユーザにとって潜在的に望んでいる情報を配信することができなかった。
【0009】
そこで、本発明は、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるように、その評価を行うことができるレコメンド情報評価装置およびレコメンド情報評価方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
上述の課題を解決するために、本発明のレコメンド情報評価装置は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新するように構成されている。
【0011】
また、本発明のレコメンド情報評価方法は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成ステップと、前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新するように構成されている。
【0012】
この発明によれば、選択対象項目の特徴空間を構成する特徴ベクトルを生成し、生成された特徴ベクトルを記憶することで、生成した特徴ベクトルに基づいて、すでに記憶されている特徴ベクトルを更新する。一方、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付けると、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する。そして、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとし、このユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行うことができる。
【0013】
これにより、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。
【0014】
また、本発明のレコメンド情報評価装置は、前記履歴記憶手段により記憶されている選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成する分離平面生成手段をさらに備え、前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することが好ましい。
【0015】
この発明によれば、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成し、これに基づいてユーザ特性ベクトルを生成することにより、ユーザ特性ベクトルを精度良く生成することができる。
【0016】
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、更新するために必要な情報を選択項目対象である文書情報から取得することが好ましい。
【0017】
この発明によれば、更新するために必要な情報を選択項目対象である文書情報から取得することにより、特徴ベクトルを生成することができる。この文書情報は、Webページ、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)などの解析可能な文書が記述された情報である。
【0018】
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴抽出手段をさらに備え、前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することが好ましい。
【0019】
この発明によれば、選択対象項目の属性毎に特徴的な単語を品詞に毎に抽出し、抽出された単語に基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。
【0020】
また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。
【0021】
この発明によれば、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。
【0022】
また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。
【0023】
この発明によれば、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。
【0024】
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、特徴ベクトルを任意のタイミングで生成することが好ましい。
【0025】
この発明によれば、特徴ベクトルを任意のタイミングで生成することで、適切な特徴ベクトルを生成することができる。よって、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。
【発明の効果】
【0026】
この発明によれば、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。
【図面の簡単な説明】
【0027】
【図1】本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。
【図2】情報配信サーバ200の機能構成を示すブロック図である。
【図3】情報配信サーバ200のハードウェア構成図である。
【図4】携帯電話機100に表示されるメニュー画面の一例を示す説明図である。
【図5】分離平面を生成するときの処理概念を示す概念図である。
【図6】分離平面に基づいてユーザ特性ベクトルを算出し、さらにユーザ特性ベクトルに基づいて評価を行うときの概念を示す概念図である。
【図7】コンテンツ管理テーブル205aの記憶内容を示す説明図である。
【図8】コンテンツ特徴ベクトル管理テーブル207bの記憶内容を示す説明図である。
【図9】携帯電話機100の機能構成を示すブロック図である。
【図10】携帯電話機100の要求に応じてコンテンツを配信するときの処理を示すシーケンス図である。
【図11】ユーザ特性ベクトルの計算処理を示すフローチャートである。
【図12】レコメンド情報を配信するときのシーケンス図である。
【図13】コンテンツの評価処理を示すフローチャートである。
【図14】履歴事象aと履歴事象bとにおけるメニュー画面を示す説明図である。
【図15】メニュー画面おいて選択されたコンテンツの特徴ベクトルの特徴空間における位置関係を示す図である。
【図16】履歴事象aおよびbを相対空間内において、コンテンツの特徴ベクトルを表した図である。
【図17】絶対空間における各コンテンツの特徴ベクトルに基づいて評価を行うときの概念を示した図である。
【図18】分離平面を生成することができない場合において相対空間を用いて処理を行うときの説明図である。
【図19】閲覧頻度を考慮して特徴ベクトルの重心を求める処理を示す概念図である。
【図20】アクセスされた時系列順にNN法によりユーザ特性ベクトルを求める過程を示す概念図である。
【図21】操作に関する特徴空間における特徴ベクトルのパラメータを示す説明図である。
【図22】レコメンド操作情報を表示することができる携帯電話機100aの機能を示すブロック図である。
【図23】特徴ベクトルを生成する処理を示すフローチャートである。
【発明を実施するための形態】
【0028】
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
【0029】
図1は、本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。携帯電話機100からの要求に応じて情報配信サーバ200は、予め記憶されているレコメンド情報となるコンテンツを、携帯電話機100に配信する。配信されるレコメンド情報は、携帯電話機100のユーザのアクセス履歴に基づいて編集されたものであり、ユーザにとって必要と思われる情報である。なお、この情報配信サーバ200は、携帯電話機100からのアクセス要求に応じて、他のコンテンツプロバイダからコンテンツを取得し、取得したコンテンツを配信するものであり、アクセス履歴はこのときに収集される。また、携帯電話機100がアクセス履歴を送信し、それを取得するように構成されてもよい。
【0030】
このような情報配信サーバ200の構成について、図2を用いて説明する。図2は、情報配信サーバ200の機能構成を示すブロック図である。この情報配信サーバ200は、コンテンツ要求受信部201(受付手段)、レコメンド要求受信部202、履歴クラス分離部203(分離平面生成手段)、ユーザ特性ベクトル計算部204(ユーザ特性ベクトル生成手段)、配信情報格納部205、コンテンツ評価部206(評価手段)、履歴格納部207(特徴ベクトル記憶手段、履歴記憶手段)、コンテンツ送信部208、および特徴ベクトル生成部209(特徴ベクトル生成手段)を含んで構成されている。
【0031】
図3は、情報配信サーバ200のハードウェア構成図である。図2に示される情報配信サーバ200は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。
【0032】
コンテンツ要求受信部201は、携帯電話機100からのコンテンツの要求に応じて、ネットワーク上のコンテンツプロバイダからコンテンツを取得する部分であり、携帯電話機100からコンテンツの要求とそのURLを受信することでアクセス履歴を収集することができる。収集したアクセス履歴(URLなど)は、履歴格納部207に出力される。なお、このコンテンツ要求受信部201は、アクセス履歴として、あるメニュー画面(事象)内において実際にアクセスされたコンテンツ(URL)と、メニュー画面には表示されているものの、実際にアクセスされなかったコンテンツとを区別して収集する。
【0033】
また、コンテンツ要求受信部201は、アクセス要求だけでなく、携帯電話機100において収集されたアクセス履歴情報を受信し、これを履歴格納部207に出力するようにしてもよい。この場合も同様に、携帯電話機100は、あるメニュー画面において選択されたコンテンツ、選択されなかったコンテンツを区別してアクセス履歴情報として情報配信サーバ200に送信するように構成される。
【0034】
レコメンド要求受信部202は、携帯電話機100からレコメンド情報の配信要求を、携帯電話機100のユーザのユーザIDとともに受信する部分である。レコメンド要求受信部202は、その配信要求を受信すると、コンテンツ評価部206にその旨を通知し、予め計算されていたユーザ特性ベクトルに基づいて、配信情報格納部205に記憶されているコンテンツの評価を行うよう指示する。なお、変形例として、レコメンド要求のあった旨をユーザ特性ベクトル計算部204に出力し、現時点におけるユーザ特性ベクトルを計算させ、その結果をコンテンツ評価部206に通知し、コンテンツ送信部208にレコメンド情報の配信を行わせるようにしてもよい。
【0035】
履歴クラス分離部203は、履歴格納部207(閲覧履歴テーブル207c:履歴記憶手段)に記憶されている閲覧履歴情報に含まれているコンテンツの特徴ベクトルに基づいて、あるユーザが閲覧したコンテンツをコンテンツ特徴ベクトル管理テーブル207bに記憶されている特徴ベクトルより構成される特徴空間で満足クラスと不満足クラスとに分離するための分離平面を生成する部分である。ここで、満足クラスとは、あるコンテンツにアクセスするためのメニュー画面において選択可能に表示された複数のコンテンツのうち、実際に選択されたコンテンツのみを含んだクラスをいい、不満足クラスとは、そのメニュー画面において選択されなかったコンテンツのみを含んだクラスをいう。この履歴クラス分離部203は、SVM法またはNN法を用いて、各コンテンツの特徴ベクトルを満足クラスと不満足クラスとに分離することができる分離平面を生成することで、これらクラスを分離することができる。ここでSVM(Support Vector Machine)法とは、それぞれのクラスのノード間(特徴ベクトル間)の最小距離を最大化する平面を分離平面とする方法であり、NN法とは、それぞれのクラスの重心間、すなわち各コンテンツの特徴ベクトルに基づいて算出された、満足クラスの重心と不満足クラスの重心とを結んだ直線を垂線とする平面を分離平面とする方法である。なお、NN法においては、必ずしも分離平面を求める必要はなく、不満足クラスの重心から満足クラスへの重心へ結んだ直線をユーザ特性ベクトルとするようにしてもよい。
【0036】
ここで分離平面を生成する具体的な方法について説明する。図4は、携帯電話機100に表示されるメニュー画面の一例を示す説明図である。図4に示すようにNode1〜Node5が表示されている。このNodeは、選択対象項目を示すものであり、例えばウェブ上のメニュー画面におけるカテゴリごとに区別された項目であったり、Webページなどの文書情報のタイトルである。例えば、Node1が、自動車に関するコンテンツ、Node2が、金融に関するコンテンツなどである。ユーザは、Node1〜Node5のいずれかを選択することにより、対応するコンテンツを閲覧することができる。
【0037】
図5は、分離平面を生成するときの処理概念を示す概念図である。図5は、上述図4におけるメニュー画面のうちユーザが選択したコンテンツおよび選択されなかったコンテンツにおける、特徴空間内における各コンテンツの特徴ベクトルの位置関係を示す。図5に示されている通り、円形で示されている部分が満足なコンテンツ(Node3、Node4)であり、三角形で示されている部分が不満足なコンテンツ(Node1、Node2、Node5)であり、四角形で示されている部分が未知の未評価コンテンツ(Node8、Node7)である。これら満足コンテンツと不満足コンテンツとを分離するように生成されたものが分離平面である。ここでは、未評価コンテンツは分離処理する際には考慮されない。なお、図においては、特徴空間を便宜上二次元平面で表現しているが、ベクトルを構成するパラメータ分だけベクトル軸が存在することになり、通常は20次元以上のベクトルで特徴空間は構成されている。
【0038】
ユーザ特性ベクトル計算部204は、特徴ベクトル生成部209により生成された特徴ベクトルで構成された特徴ベクトル空間における、履歴クラス分離部203により生成された分離平面に対して直交する直交ベクトルを算出し、これをユーザ特性ベクトルとする部分である。図6にその具体例を示す。図6は、分離平面に基づいてユーザ特性ベクトルを算出し、さらにユーザ特性ベクトルに基づいて評価を行うときの概念を示す概念図である。図6に示すように、分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが、ユーザ特性ベクトル計算部204により算出される。ユーザ特性ベクトル計算部204は、閲覧履歴が収集されるたびに計算され、ユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルを更新させる。
【0039】
配信情報格納部205は、配信対象であるコンテンツ(レコメンド情報)およびその管理情報を記憶する部分であり、コンテンツ管理テーブル205aを記憶している。図7は、コンテンツ管理テーブル205aの記憶内容を示す説明図である。図7に示すように、このコンテンツ管理テーブル205aは、コンテンツID、カテゴリ、タイトル、およびレコメンド本文を対応付けて記憶している。コンテンツIDは、コンテンツを一意に特定するための識別情報であり、カテゴリは情報種別を示し、例えばCDに関連するもの、DVDに関連するもの、書籍に関連するもの、テレビ番組に関連するものなどを示すための情報である。タイトルは、レコメンド情報として表示するための見出し情報である。レコメンド情報を配信する際には、このタイトル部分が表示されることになる。レコメンド文は、レコメンド情報の本体部分であり、ユーザに有用な情報である。このコンテンツ管理テーブル205aに記憶される情報は、予めオペレータにより入力されたものでもよいし、自動的にコンテンツプロバイダから検索・抽出され所定のフィルターにより絞り込まれたものであってもよい。
【0040】
コンテンツ評価部206は、レコメンド要求受信部202によりレコメンドの要求が受信されると、配信情報格納部205に記憶されているコンテンツに対して、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルに基づいて評価し、そして評価の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する部分である。具体的には、このコンテンツ評価部206は、ユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより評価値を算出し、その評価値の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する。
【0041】
概念的には、つぎの通りとなる。例えば、図6では、Node7およびNode8がコンテンツ管理テーブル205aに記憶された情報であるとして、未知のコンテンツとして扱われている。ここで、Node7およびNode8からユーザ特性ベクトルwに対して垂線をおろした点がユーザ特性ベクトルwに対する評価点となる。この垂線とユーザ特性ベクトルとの交点の位置が上位にある順にコンテンツ(タイトル部分)を表示するようにレコメンド情報を生成する。なお、分離平面を基準に、表示または非表示とするようにしてもよい。例えば、Node8からの垂線との交点は、分離平面を基準にした場合、それよりも上位に位置しているため、ユーザにとって評価は高いと判断されレコメンド情報として選択される。一方、Node7は基準より下にあるため、評価は低く、レコメンド情報として選択されない、というようなレコメンド情報としてもよい。
【0042】
履歴格納部207は、各履歴情報を記憶する部分であり、ユーザ特性ベクトル管理テーブル207a、コンテンツ特徴ベクトル管理テーブル207b、および閲覧履歴テーブル207cを記憶している。
【0043】
ユーザ特性ベクトル管理テーブル207aは、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルを、ユーザを特定するためのユーザIDと対応付けて記憶する部分である。
【0044】
コンテンツ特徴ベクトル管理テーブル207bは、コンテンツ管理テーブル205aに記憶されているコンテンツの特徴ベクトルを、そのコンテンツを特定するための情報(例えばコンテンツID、URLなど)と対応付けて記憶する部分である。このコンテンツ特徴ベクトルは、ユーザがアクセスしたときにそのコンテンツとともに、コンテンツ要求受信部201により取得されるもの、レコメンド情報を登録するときにそのオペレータにより設定されたものである。例えば、コンテンツ特徴ベクトル管理テーブル207bは、図8に示される情報が記憶されている。図8に示すように、コンテンツIDと対応付けて、特徴ベクトルを構成するパラメータが複数記憶されている。図8では、8個のパラメータを記載しているが、通常はさらに多くのパラメータから特徴ベクトルは構成されている。なお、規定のパラメータ以外に、コンテンツごとに形態素解析にしたがって抽出されたキーワードをパラメータとして追加するようにしてもよい。特徴ベクトルを構成するパラメータごとに、0から1の間で数値が記述されており、どの特徴ベクトルに特徴を持たせているかを表している。
【0045】
閲覧履歴テーブル207cは、コンテンツ要求受信部201により受信されたあて先または収集されたアクセス履歴情報を記憶する部分であり、例えば、コンテンツID(またはコンテンツのURL)およびそのコンテンツ(閲覧されたもの、閲覧されていないものそれぞれ)の特徴ベクトルを対応付けて記憶する部分である。このコンテンツの特徴ベクトルは、コンテンツ要求受信部201により取得されるコンテンツとともに取得されるものである。
【0046】
コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求またはレコメンド要求受信部202により受信されたレコメンド要求に応じて取得されたコンテンツを送信する部分である。例えば、コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信し、またレコメンド要求受信部202に応じて配信情報格納部205に記憶されているコンテンツに基づいてコンテンツ評価部206による評価結果にしたがって生成されたレコメンド情報を送信する。
【0047】
特徴ベクトル生成部209は、Webページ等の文書情報からコンテンツ情報を収集し、収集したコンテンツ情報に対してキーワード解析を行って、その特徴ベクトルを計算することで、コンテンツの特徴ベクトルを生成する部分である。なお、文書情報には、Webページのほか、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)、PDFデータなどの解析可能な文書が記述された情報が含まれる。詳細な処理は以下の通りとおりである。そして、特徴ベクトル生成部209は、生成した特徴ベクトルを用いて、コンテンツ特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新する。
【0048】
ここで特徴ベクトルを生成する具体的な方法について説明する。図23は、特徴ベクトルの計算処理を示すフローチャートである。図23に示すように、まずコンテンツ情報収集部209aによりWebページからコンテンツ情報(例えばWebページ)が収集される(S501)。
【0049】
そして、収集されたコンテンツ情報は、特徴キーワード抽出部209bにより形態素解析のアルゴリズムにより品詞毎(名詞、固有名詞、動詞、助詞など)に分類される(S502)。そして、このコンテンツ情報から、当該コンテンツ情報の属性に従った特徴的なキーワードが特徴抽出アルゴリズムにより抽出される(S503)。この特徴キーワード抽出部209bの特徴抽出アルゴリズムは、TF/IDF法またはPMM法を用いて、コンテンツ情報の属性毎に特徴的なキーワードを品詞毎に抽出することができる。
【0050】
ここで、TF/IDF法とは、ある文書での出現頻度が高い単語のうち他の文書にはあまり出現し無いものをその文書に特徴的な単語とする方法であり、PMM(Parametric Mixture Model)法とは、多重トピックを有する文書の確率モデルを構成することにより、ある文書から多重トピックを同時に抽出する方法である。なお、特徴抽出アルゴリズムにおいては、必ずしもTF/IDF法またはPMM法を用いて抽出する必要はない。
【0051】
抽出されたキーワードに基づいて、特徴ベクトル計算部209cにより特徴ベクトルが生成される(S504)。この生成された特徴ベクトルはコンテンツ特徴ベクトル管理テーブル207bに記憶される。
【0052】
特徴ベクトル生成部209は、Webページの情報が更新されるたび、または任意のタイミングで特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新させる。
【0053】
このように構成された情報配信サーバ200は、携帯電話機100からの要求に応じて、ユーザ特性ベクトルに基づいて評価されたレコメンド情報を配信することができる。よって、嗜好・趣味などの情報を登録する必要はなく、またアクセスしたコンテンツに直接的に関連するコンテンツのみを抽出することがなく、漏れのないレコメンド情報を配信することを可能とする。
【0054】
つぎに、携帯電話機100について説明する。図9は、携帯電話機100の機能構成を示すブロック図である。図9に示すとおり、携帯電話機100は、ブラウザ101、履歴送信部102、レコメンド要求送信部103、および配信情報表示部104を含んで構成されている。この携帯電話機100は、CPU、RAM、ROMなどのハードウェアにより構成されており、記憶されているプログラムにしたがってCPUは動作するよう構成されている。具体的には、情報配信サーバ200と同様の構成をとるものであって、図3に示されるハードウェア構成により実現される。以下、各構成について説明する。
【0055】
ブラウザ101は、インターネットに接続するためのアプリケーション部分であり、インターネット上に配置されているサイトに対してアクセスし、サイトに保持されているコンテンツをユーザに閲覧可能にさせるものである。このブラウザ101は、アクセス履歴を保持するように構成される。
【0056】
履歴送信部102は、ブラウザ101を用いてアクセスしたコンテンツのアクセス履歴(同一メニュー画面上において選択されたコンテンツおよび選択されなかったコンテンツを示す情報)を送信する部分である。なお、この履歴送信部102は、情報配信サーバ200側でアクセスのたびに履歴情報を収集する機能を有している場合には、必須の構成ではない。
【0057】
レコメンド要求送信部103は、図示しない操作部をユーザが操作することによりユーザIDとともにレコメンド情報の要求を情報配信サーバ200に送信する部分である。
【0058】
配信情報表示部104は、ブラウザ101により取得されたメニュー画面およびコンテンツ(Webページ)を表示する部分である。
【0059】
このように構成された携帯電話機100は、ブラウザ101を用いてインターネットにアクセス可能にするとともに、そのアクセス履歴を保持し、履歴送信部102は、情報配信サーバ200からの要求または所定のタイミングでアクセス履歴を送信することができる。
【0060】
つぎに、これら携帯電話機100および情報配信サーバ200の動作について説明する。図10は、携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。
【0061】
図10に示すとおり、携帯電話機100におけるブラウザ101からの要求に応じて、コンテンツ送信部208により情報配信サーバ200からメニュー画面が配信される(S101)。携帯電話機100のユーザは、そのメニュー画面から任意の一のコンテンツ(上述Nodeに相当)を選択し、携帯電話機100におけるブラウザ101がこれを受け付けると(S102)、コンテンツの接続要求およびそのあて先でURLが情報配信サーバ200に送信される(S103)。
【0062】
情報配信サーバ200では、URLはコンテンツ要求受信部201により受信され、閲覧履歴テーブル207cにアクセス履歴として記憶される。そして、このアクセス履歴に基づいて、ユーザ特性ベクトルの計算がなされ、記憶される(S104)。そして、コンテンツ送信部208によりS103において要求のあったあて先に基づいたコンテンツがコンテンツプロバイダ(図示せず)から取得され、配信される(S105)。なお、ユーザ特性ベクトルの計算処理と、コンテンツの配信処理の順番は逆でもよい。
【0063】
ここでS104におけるユーザ特性ベクトル計算の詳細に処理について説明する。図11は、ユーザ特性ベクトルの計算処理を示すフローチャートである。図11に示すように、まずコンテンツ要求受信部201により受信されたアクセス要求またはアクセス履歴により示されたアクセス履歴情報が、新たに追加されたアクセス履歴として閲覧履歴テーブル207cに記憶される(S201)。
【0064】
そして、履歴クラス分離部203により、この閲覧履歴テーブル207cに記憶されているアクセス履歴情報に基づいて、各満足クラスまたは不満足クラスに属するコンテンツの特徴ベクトルが抽出される(S202)。そして、履歴クラス分離部203により、これら特徴ベクトルに基づいて満足クラスと不満足クラスとを分離するための分離平面が生成される(S202)。つぎに、ユーザ特性ベクトル計算部204により、生成された分離平面に直交する直交ベクトルが計算され、ユーザ特性ベクトルが求められる(S204)。ここで求められたユーザ特性ベクトルは、ユーザ特性ベクトル管理テーブル207aに保持され、レコメンド情報の配信時において配信情報格納部205に記憶されているコンテンツを評価する際に利用される。
【0065】
つぎに、本実施形態におけるレコメンド情報を配信するときのそのコンテンツの評価処理について説明する。図12は、レコメンド情報を配信するときのシーケンス図である。図12に示すように、携帯電話機100におけるレコメンド要求送信部103によりユーザIDを含んだレコメンド要求が送信され、このレコメンド要求は情報配信サーバ200におけるレコメンド要求受信部202により受信される(S301)。そして、情報配信サーバ200では、配信情報格納部205に記憶されているコンテンツに対して、コンテンツの評価が行われる(S302)。ここでは、コンテンツ評価部206により、ユーザ特性ベクトルにしたがって評価され、高評価順にコンテンツのタイトルを並べたレコメンド情報が生成される。そして、コンテンツ送信部208により、このように生成されたレコメンド情報が配信される(S303)。
【0066】
ここで、S302のコンテンツ評価についてさらに詳細な処理について説明する。図13は、コンテンツの評価処理を示すフローチャートである。図13に示すように、コンテンツ評価部206により、レコメンド要求とともに送信されたユーザIDに基づいて、ユーザ特性ベクトル管理テーブル207aから、対応するユーザ特性ベクトルが取得される(S401)。つぎに、コンテンツ評価部206により、コンテンツ特徴ベクトル管理テーブル207bから、各コンテンツの特徴ベクトルが取得される(S402)。
【0067】
そして、コンテンツ評価部206により、ユーザ特性ベクトルとコンテンツの特徴ベクトルとの内積が計算される(S403)。コンテンツ評価部206により計算された内積の大きい順に、コンテンツ管理テーブル205aに記憶されているコンテンツIDに対応するタイトルが抽出され、そのタイトルが評価の高い順に並べられることでレコメンド情報が生成される。そして、コンテンツ送信部208により、生成されたレコメンド情報が携帯電話機100に送信される(S404)。
【0068】
このように、ユーザ特性ベクトルにしたがって、レコメンド情報を提供することができ、漏れなくレコメンド情報をユーザに提供することができる。
【0069】
<相対空間における分離平面の生成>
以上の分離平面の生成方法は、絶対空間におけるコンテンツの特徴ベクトルにしたがって行われたものであるが、より精度高める方法として、相対的な位置関係を求めた相対空間を利用したものも考えられる。以下、相対空間を用いて分離平面を生成する方法について説明する。なお、このときの処理構成は上述と同様であり、履歴クラス分離部203における処理内容が異なるだけである。
【0070】
図14は、履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示し、図14(a)が履歴事象aにおけるメニュー画面を示す図であり、このメニュー画面はNode1からNode3で構成されている。また、図14(b)が履歴事象bにおけるメニュー画面を示す図であり、このメニュー画面はNode6からNode9で構成されている。図14(a)では、Node3が選択されており、図14(b)では、Node9が選択されていることが示されている。
【0071】
図15は、図14で示されたそれぞれのメニュー画面おいて選択されたコンテンツの特徴ベクトルの特徴空間における位置関係を示す図である。図15(a)は、履歴事象aにおいて選択されたコンテンツの特徴空間(絶対空間)、図15(b)は、履歴事象bにおいて選択されたコンテンツの特徴空間(絶対空間)を示す図である。上述と同様に、選択されたコンテンツは満足なコンテンツ、選択されなかったコンテンツは不満足なコンテンツと定義され、それぞれ満足クラス、不満足クラスに分類することができる。
【0072】
図16は、それぞれの履歴事象aおよびbを同一特徴空間上に、コンテンツの特徴ベクトルを表した図であって、不満足なコンテンツの特徴ベクトルを原点に取った場合における満足なコンテンツの特徴ベクトルの位置を示す相対空間を表した図である。例えば、Node2とNode3との相対比較、Node1とNode3との相対比較のため、それぞれNode1、Node2を原点とした場合のNode3の位置を表した特徴空間を相対空間としている。より具体的には、Node3の特徴ベクトルからNode1の特徴ベクトルを減算することにより、相対空間を形成することができる。他のNodeについても同様に、対象となるコンテンツの特徴ベクトルを減算する処理を行うことで相対空間を形成することができる。
【0073】
この相対空間において、図16に示すようにこのように満足なコンテンツの特徴ベクトル、不満足なコンテンツの特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面が、履歴クラス分離部203により生成される。そして、ユーザ特性ベクトル計算部204により、この分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが計算される。
【0074】
このように、履歴事象が異なる場合においても、相対空間を利用してユーザ特性ベクトルを生成することができ、より識別性の高いユーザ特性ベクトルを生成することができる。
【0075】
図17は、絶対空間における各コンテンツの特徴ベクトルに基づいて評価を行うときの概念を示した図であり、例えば、配信情報格納部205に記憶されている未知のコンテンツであるNode6〜Node8は、生成されたユーザ特性ベクトルに基づいて評価される。ここでは上述と同様に、コンテンツ評価部206はユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより、その評価値を算出することができる。概念的には、上述と同様に、ユーザ特性ベクトルに射影した点、すなわち垂線を下ろした点が、そのベクトル方向における上位の順にコンテンツの優先順が決定される。
【0076】
このように相対空間を用いて分離平面を生成し、それによってユーザ特性ベクトルを生成することができる。ところで、図15から図17については、絶対空間として扱っても分離平面を生成することができるが、分離平面を生成することができない特徴ベクトルから構成される特徴空間も考えられる。その場合に、上述した相対空間を利用することにより分離平面を生成することができる。以下、その方法について説明する。
【0077】
図18(a)は、絶対空間におけるコンテンツの特徴ベクトルを示した図である。この図18(a)では、Node1とNode4とが同じ事象(メニュー画面)に存在するコンテンツであり、Node2とNode3とが同じ事象に存在するコンテンツであことを前提としている。なお、円形のものが選択されたコンテンツの特徴ベクトル(満足クラス)、三角形のものが選択されなかったコンテンツの特徴ベクトル(不満足クラス)である。
【0078】
図18(a)から明らかなように、絶対空間においては、このような位置関係をとる特徴ベクトルのコンテンツに対しては、分離平面を生成することができない。分離平面は、満足クラスと不満足クラスとを分離するための平面であるためであり、図18(a)の例では、可不足なく両者を分離することができないためである。よって、分離平面を生成することができるように相対的な位置関係を表す相対空間に変換することが必要である。
【0079】
図18(b)では、相対空間内におけるコンテンツの特徴ベクトルを表した図であり、Node1およびNode2が同じ位置になるように、図18(b)の例では、Node2を平行移動させるためそのNode2に対応するNode3を平行移動させている。このように相対空間に変換することで、不満足なコンテンツであるNode1(Node2)と、満足なコンテンツであるNode3およびNode4とを分離することができる分離平面vを生成することができる。
【0080】
以上の通り絶対空間では、分離平面を生成することができない場合であっても、相対空間に変換することで分離平面を生成することができ、これによりユーザ特性ベクトルを計算することができる。
【0081】
<閲覧頻度を考慮した分離平面の生成方法>
つぎに、コンテンツの閲覧頻度を用いた重み付け処理を行い、この重み付け処理された特徴ベクトルを用いて分離平面を生成するときの履歴クラス分離部203の処理について説明する。なお、ここでは、NN法を用いた分離平面の生成について説明する。
【0082】
図19は、閲覧頻度を考慮して特徴ベクトルの重心を求める処理を示す概念図でありNodeA〜Cに対応したコンテンツc1〜c3の特徴ベクトルの位置を表す特徴空間を示す概念図である。コンテンツc1の閲覧頻度は3回、コンテンツc2の閲覧頻度は1回、コンテンツc3の閲覧頻度は10回とする。なお、閲覧履歴テーブル207cは、閲覧されたコンテンツの閲覧履歴、閲覧されていないコンテンツの不閲覧履歴を記憶しておくことが好ましく、それぞれの頻度を保持または計算可能に記憶しておくことが必要である。
【0083】
この場合、これらコンテンツc1〜c3の重心は、以下の式(1)により計算される。
【数1】
なお、ciは閲覧されたコンテンツの特徴ベクトル、niは閲覧頻度である。
【0084】
この計算を行うことにより重心が定まる。また、図示していないが閲覧されていないコンテンツについても同様に式(1)を用いて、閲覧さていないコンテンツの特徴ベクトルを用いてその重心を求める。そして、閲覧されていないコンテンツの重心から閲覧されたコンテンツの重心に対して結んだ直線をユーザ特性ベクトルとして求めることができる。なお、この直線は、分離平面に直交する直線と同じ向きを取るものであり、分離平面を算出し、この分離平面に直交する直交ベクトルを求めるようにしてもよいが、NN法においては必ずしも分離平面は必要とはならない。
【0085】
これにより、コンテンツの閲覧頻度を利用してユーザ特性ベクトルを求めることができ、閲覧頻度を利用しない場合と比較して、ユーザの嗜好に近いユーザ特性ベクトルを求めることができる。よって、ユーザの嗜好にそったコンテンツの評価を行うことができる。
【0086】
<選択順位を考慮した分離平面の生成方法>
つぎに、閲覧したコンテンツの順番を考慮して分離平面を生成するときの履歴クラス分離部203の処理について説明する。一般的に、直近にアクセスしたコンテンツの方が、その前にアクセスしたコンテンツより重要である、またはユーザの嗜好に近いものであると考えることができる。この時間差が大きくなればなるほど、ユーザの嗜好に変化が生じ、より直近にアクセスしたコンテンツを重要と考えることが顕著となる。ここでは、その時間差(時系列成分)を考慮して分離平面を生成するときの処理について説明する。
【0087】
図20は、履歴クラス分離部203が分離平面を生成する際において、そのアクセスされた時系列順にNN法によりユーザ特性ベクトルを生成するときの処理を示す説明図であって、図20(a)は、そのときのメニュー画面を示す説明図であり、図20(b)は、ユーザが選択したコンテンツの選択履歴を示す説明図であり、図20(c)は、特徴空間における各コンテンツの特徴ベクトルを表した概念図であり、図20(d)は、選択順を考慮した分離平面を生成することを説明するための概念図である。なお、選択履歴は、閲覧履歴テーブル207cに記憶される。
【0088】
図20(a)に示されるように、NodeAからNodeFからメニュー画面が構成されている。ここでは図20(b)に示すようにNodeA、NodeB、NodeCの順にコンテンツが選択されている。よって、NodeA、NodeB、NodeCが満足クラスに分類されるコンテンツとなり、NodeD、NodeE、NodeFが不満足クラスに分類されるコンテンツとなる。
【0089】
つぎに、図20(c)および図20(d)を用いて、分離平面を生成するときの処理を示す概念について説明する。図20(c)に示されるように、NodeAからNodeFは、その特徴ベクトルにしたがって特徴空間上に位置づけられている。そして、直近に選択したコンテンツの特徴ベクトルの影響が大きくなるように計算される。図20(d)に示されるように、満足クラスにおける重心を求めるため、まず、NodeAとNodeBとの中点w1が計算される。そして、この中点w1とNodeCとの中点w2が計算される。
【0090】
一方、不満足クラスにおいては、NodeD、NodeE、NodeFに基づいて重心w3が計算される。不満足クラスにおいては選択順という概念がないため、通常の処理と同じく、その3つのNodeに基づいた重心w3が計算される。そして、中点w2と重心w3とを結んだ線が垂線となる分離平面vが生成される。なお、本実施形態においてはこの分離平面vに直交する直交ベクトルをユーザ特性ベクトルとするものであり、これは、重心w3から中点w2に向けて結んだ直線と同じである。実施形態での説明の便宜上、分離平面を求めているが、NN法を用いる場合においては分離平面を求めることは必須のものではない。
【0091】
このように、特徴ベクトルと特徴ベクトルとの中点を算出し、またその中点と特徴ベクトルとの中点を算出し、時系列的に順に中点を算出する(NN法を適用する)ことにより、前のアクセス履歴ほど重みが小さくなり、時系列順位を考慮した重心を算出することができる。
【0092】
<操作メニューへの適用>
ところで、上述の各方法では、メニュー画面として、ウエブサイトである情報配信サーバ200から送信されたメニュー画面を例に説明したが、これに限るものではなく、例えば、携帯電話機100の操作メニューに対して、レコメンド情報としてレコメンド操作情報を表示するようにしてもよい。
【0093】
例えば、操作メニューにおける各操作項目に対して、特徴ベクトルが割り振られており、ユーザの操作履歴に従って、ユーザ操作に関するユーザ特性ベクトルが生成され、ユーザがレコメンド操作情報の要求を発すると、そのユーザ特性ベクトルに基づいてレコメンド操作情報を生成するようにしてもよい。なお、操作履歴情報は、所定のタイミングで携帯電話機100から情報配信サーバ200に送信され、記憶されるように構成されている。
【0094】
図21は、操作に関する特徴空間における特徴ベクトルのパラメータを示す説明図である。図21に示すように、携帯電話機100の端末機能として、「着もじ」「テレビ電話」「ワンセグ」「画面メモ」「テキストメモ」が規定されている。また、特徴ベクトルを構成するパラメータとして「電話」「インターネット」「テキスト」「メモ」「テレビ」が規定されている。このように、携帯電話機100の機能に特徴ベクトルが規定されている。例えば、「着もじ」には、「電話」「テキスト」のパラメータに1がふられており、電話、テキストに関連のある機能であることが示されている。配信情報格納部205には、全ての端末機能情報が記憶され、ユーザが操作メニューを表示する操作をするときには、その旨が通知され、コンテンツ評価部206は、操作情報の評価を行って適切なレコメンド操作情報を生成し、コンテンツ送信部208は、レコメンド操作情報を送信し、携帯電話機100においてそれを表示させることができる。
【0095】
このように操作メニューに対しても本実施形態の評価方法を適用し、レコメンド操作情報をユーザに提供することで、ユーザがよく使う操作に類似または関連した操作をユーザに通知することができる。
【0096】
また、情報配信サーバ200に接続することなく、携帯電話機内で処理を行うことも考えられる。図22は、レコメンド操作情報を表示することができる携帯電話機100aの機能を示すブロック図である。このハードウェア構成は図3と同じである。
【0097】
この携帯電話機100aは、操作部101a、レコメンド操作表示部104a、履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109を含んで構成されている。
【0098】
以下、各構成について説明する。操作部101aは、携帯電話機100aに搭載されている各機能を実行するための部分であり、テンキー、タッチパネルなどで構成されている。
【0099】
レコメンド操作表示部104aは、レコメンド操作情報を表示する部分であり、後述するようにユーザの操作履歴に従って定められたユーザにとって未知の操作を示すレコメンド操作情報を表示する部分である。
【0100】
履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109は、それぞれ図2にて示されている情報配信サーバ200の履歴クラス分離部203、ユーザ特性ベクトル計算部204、配信情報格納部205、コンテンツ評価部206および履歴格納部207に相当するものであり、履歴クラス分離部105において、同一操作メニュー内において操作された機能、操作されていない機能をそれぞれ満足機能、不満足機能に分離する分離平面を生成し、ユーザ特性ベクトル計算部106は、生成された分離平面に直交する直交ベクトルをユーザ特性ベクトルとする。操作情報評価部107は、計算されたユーザ特性ベクトルにしたがって、各機能特徴ベクトルに基づいて評価をし、高評価の機能については、操作メニュー上に表示するようにそのメニュー画面を編集する。ユーザは、操作メニューを表示させるときには、その操作メニュー上でその高評価された機能を確認することができる。
【0101】
つぎに、本実施形態の携帯電話機100および情報配信サーバ200の作用効果について説明する。情報配信サーバ200において、所定のタイミングで、特徴ベクトル生成部209は、Webページなどのコンテンツを収集し、そのコンテンツの特徴を示すキーワードを抽出して、特徴ベクトルを生成する。生成した特徴ベクトルは、コンテンツ特徴ベクトル管理テーブル207bに記憶され、更新される。
【0102】
この収集のタイミングは、任意のタイミングや、Webページが更新されたタイミング(これは更新通知信号を受信するなどして)である。このように任意のタイミングで収集処理、特徴ベクトル生成処理が行われることで、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。
【0103】
一方、携帯電話機100において、ユーザがブラウザを操作することにより、メニュー画面が表示され、Node1〜Node5などのコンテンツを表す複数の選択対象項目が表示される。そして、ユーザ操作により、これらコンテンツから任意の一のコンテンツを選択すると、携帯電話機100は情報配信サーバ200に選択されたコンテンツおよび選択されなかったコンテンツを送信し、情報配信サーバ200(コンテンツ要求受信部201)はこれを受け付ける。コンテンツ要求受信部201は、選択されたコンテンツを、コンテンツプロバイダから取得し、コンテンツ送信部208はこれを携帯電話機100に送信する。
【0104】
また、閲覧履歴テーブル207cは、選択されたコンテンツの特徴ベクトルおよび選択されなかったコンテンツの特徴ベクトルを記憶する。履歴クラス分離部203は、閲覧履歴テーブル207cに記憶されている選択されたコンテンツの特徴ベクトルと選択されなかったコンテンツの特徴ベクトルとを、特徴空間内で分離するための分離平面を生成する。そして、ユーザ特性ベクトル計算部204は、生成された分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成し、これをユーザ特性ベクトル管理テーブル207aに記憶させる。その後、レコメンド要求をレコメンド要求受信部202が受信すると、コンテンツ評価部206は、記憶されているユーザ特性ベクトルに基づいて、コンテンツの評価を行う。
【0105】
これにより、ユーザの特徴を示すベクトルにしたがってコンテンツの評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきコンテンツを評価することがなく、漏れのないコンテンツをユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。
【0106】
また、本実施形態の情報配信サーバ200は、履歴クラス分離部203は、選択されなかった全てのコンテンツの特徴ベクトルと選択されたコンテンツの特徴ベクトルとの相対的な位置関係を算出し、当該位置関係に基づいて分離平面を生成することが好ましい。すなわち、選択されなかったまたは選択されたコンテンツの特徴ベクトルに、他の特徴ベクトルを重ねるようその位置関係を計算し、相対空間を形成し、その相対空間において分離平面を生成することが好ましい。これにより、相対的な位置関係を表す相対空間内で分離平面を生成し、これ基づいてユーザ特性ベクトルを生成することができるため、より精度の高いコンテンツの評価を行うことができる。
【0107】
また、本実施形態の情報配信サーバ200において、閲覧履歴テーブル207cは、コンテンツの閲覧頻度および閲覧されていない不閲覧頻度を記憶しておく。なお、このような閲覧頻度、不閲覧頻度を記憶することなく、閲覧履歴に基づいて閲覧頻度、不閲覧頻度を必要に応じて計算するようにしてもよい。そして、閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行うとともに、不閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行い、その重み付けされた特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面を生成することができる。これにより、頻度に応じてユーザ特性ベクトルを算出することができ、より精度のよいユーザ特性ベクトルを算出し、よってコンテンツの評価をより正確に行うことができる。
【0108】
また、本実施形態の情報配信サーバ200において、コンテンツ管理テーブル205aは、メニュー画面における各コンテンツを選択した時期を、そのコンテンツの特徴ベクトルとともに記憶し、選択時期の新しさの度合いに応じて重み付けされたコンテンツの特徴ベクトルに基づいて分離平面を生成することができる。例えば、NN法においては、時間的に古いコンテンツの特徴ベクトルから順にその重心を求めていくことにより、結果的に選択時期の新しさの度合いに応じた重み付け処理がなされることになる。これにより時系列成分を考慮した重み付けを行うことができ、より精度のよいコンテンツの評価を行うことができる。
【0109】
また、本実施形態の情報配信サーバ200において、コンテンツ送信部208は、コンテンツ評価部206による評価結果に従って生成されたレコメンド情報を送信することにより、ユーザは役立つ情報を取得することができる。
【0110】
また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、更新するために必要な情報を選択項目対象であるWebページから取得する。よって、適切な特徴ベクトルを生成することができる。
【0111】
また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴キーワード抽出部209bを備え、特徴キーワード抽出部209bにより抽出されたキーワードに基づいて、特徴ベクトル計算部209cは、特徴ベクトルを計算することができる。
【0112】
この発明によれば、選択対象項目の属性毎に特徴的なキーワードを品詞に毎に抽出し、抽出されたキーワードに基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。
【0113】
この特徴キーワード抽出部209bは、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出してもよいし、また、PMM法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出するようにしてもよい。
【符号の説明】
【0114】
100…携帯電話機、100a…携帯電話機、101…ブラウザ、101a…操作部、102…履歴送信部、103…レコメンド要求送信部、104…配信情報表示部、104a…レコメンド操作表示部、105…履歴クラス分離部、106…ユーザ特性ベクトル計算部、107…操作情報評価部、108…操作情報格納部、109…履歴格納部、200…情報配信サーバ、201…コンテンツ要求受信部、202…レコメンド要求受信部、203…履歴クラス分離部、204…ユーザ特性ベクトル計算部、205…配信情報格納部、205a…コンテンツ管理テーブル、206…コンテンツ評価部、207…履歴格納部、207a…ユーザ特性ベクトル管理テーブル、207b…コンテンツ特徴ベクトル管理テーブル、207c…閲覧履歴テーブル、208…コンテンツ送信部、209…特徴ベクトル生成部。
【技術分野】
【0001】
本発明は、コンテンツの評価を行うレコメンド情報評価装置およびレコメンド情報評価方法に関する。
【背景技術】
【0002】
ユーザの特徴に合致したレコメンド情報を配信するために、そのレコメンド情報を抽出するための情報フィルタリング方式として、Content−basedFiltering方式が考えられている。この方式は、ユーザがWebページの閲覧などの行動を取ることにより、閲覧された対象文書を解析し、文書に含まれている単語(キーワード)を抽出する。そして、これらの単語を、ユーザごとに区別して、ユーザプロファイルといわれる興味・嗜好情報として記録する。ユーザプロファイルには、1つの興味の概念が表現され、この概念を利用してユーザに情報を提供することが考えられている。例えば、広告商品等に割り当てられたキーワードとユーザプロファイル(キーワードで表現された)とをマッチングすることにより適切な広告の推薦を可能とするシステムが一般的に知られている。
【0003】
また、これに関連する技術として、特許文献1に記載されている技術が挙げられる。この特許文献1には、予め定められたレコメンド抽出ルールに従ってレコメンド情報を配信する配信先および配信すべきレコメンド情報を決定し、配信する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−148878号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の背景技術においては、マッチング処理をすることによりレコメンド情報を抽出するものであったり、また、特許文献1に記載の技術では、予め定められたレコメンド抽出ルールに基づいてレコメンド情報が決定され、レコメンド対象によって特徴空間ベクトルは更新されないことから、レコメンド情報に漏れが生じるおそれがある。
【0006】
すなわち、特許文献1の技術においては、レコメンド抽出ルールに、趣味・嗜好が登録されていれば、その趣味・嗜好にあったレコメンド情報が決定され配信されることになり、また、購買履歴等に基づいて、ある商品を購入するとその購入した商品に関連する情報が配信されることになるが、これら配信される情報は、趣味・嗜好、購買履歴、またはアクセス履歴などの直接的な情報に基づいて決定され、またレコメンド対象によって特徴空間ベクトルは更新されないため、ユーザが潜在的に望んでいるコンテンツに漏れが生じる場合がある。
【0007】
特にアクセス履歴に基づいてレコメンド情報を配信使用とする場合には、特に漏れが大きくなるものと考えられる。すなわち、ユーザがサイトなどを閲覧する場合、閲覧しているサイト自体は、一つのキーワードによって表されるものではなく、複数のキーワードをもって表されているものが通常である。例えば、ユーザが映画aに関する情報を検索し、閲覧している場合において、その閲覧しているサイトは、映画aの紹介であったり、原作本を紹介していたり、興行映画館を紹介していたり、出演者を紹介していたり、いろいろな情報(ベクトル情報)を含んでいる。この場合、ユーザは原作本を探している場合には、その原作本に特化したフィルタリング処理を行い、そのためのだけのレコメンド情報を配信することがユーザにとって望まれるものである。
【0008】
しかしながら、上述特許文献1に記載の技術では、閲覧しているサイトの全体を見てその全体に近い情報をレコメンド情報として配信することになり、上述のとおりユーザにとって潜在的に望んでいる情報を配信することができなかった。
【0009】
そこで、本発明は、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるように、その評価を行うことができるレコメンド情報評価装置およびレコメンド情報評価方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
上述の課題を解決するために、本発明のレコメンド情報評価装置は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成手段と、前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新するように構成されている。
【0011】
また、本発明のレコメンド情報評価方法は、選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成ステップと、前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新するように構成されている。
【0012】
この発明によれば、選択対象項目の特徴空間を構成する特徴ベクトルを生成し、生成された特徴ベクトルを記憶することで、生成した特徴ベクトルに基づいて、すでに記憶されている特徴ベクトルを更新する。一方、ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付けると、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する。そして、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとし、このユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行うことができる。
【0013】
これにより、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。
【0014】
また、本発明のレコメンド情報評価装置は、前記履歴記憶手段により記憶されている選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成する分離平面生成手段をさらに備え、前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することが好ましい。
【0015】
この発明によれば、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成し、これに基づいてユーザ特性ベクトルを生成することにより、ユーザ特性ベクトルを精度良く生成することができる。
【0016】
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、更新するために必要な情報を選択項目対象である文書情報から取得することが好ましい。
【0017】
この発明によれば、更新するために必要な情報を選択項目対象である文書情報から取得することにより、特徴ベクトルを生成することができる。この文書情報は、Webページ、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)などの解析可能な文書が記述された情報である。
【0018】
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴抽出手段をさらに備え、前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することが好ましい。
【0019】
この発明によれば、選択対象項目の属性毎に特徴的な単語を品詞に毎に抽出し、抽出された単語に基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。
【0020】
また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。
【0021】
この発明によれば、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。
【0022】
また、本発明のレコメンド情報評価装置において、前記特徴抽出手段は、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することが好ましい。
【0023】
この発明によれば、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することで、適切な特徴ベクトルを生成することができる。
【0024】
また、本発明のレコメンド情報評価装置において、前記特徴ベクトル生成手段は、特徴ベクトルを任意のタイミングで生成することが好ましい。
【0025】
この発明によれば、特徴ベクトルを任意のタイミングで生成することで、適切な特徴ベクトルを生成することができる。よって、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。
【発明の効果】
【0026】
この発明によれば、ユーザの特徴を示すベクトルにしたがって未知の選択対象項目、例えばコンテンツまたは操作メニュー項目などのレコメンド情報の評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきレコメンド情報を評価することがなく、漏れなくレコメンド情報をユーザに提供することができる。
【図面の簡単な説明】
【0027】
【図1】本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。
【図2】情報配信サーバ200の機能構成を示すブロック図である。
【図3】情報配信サーバ200のハードウェア構成図である。
【図4】携帯電話機100に表示されるメニュー画面の一例を示す説明図である。
【図5】分離平面を生成するときの処理概念を示す概念図である。
【図6】分離平面に基づいてユーザ特性ベクトルを算出し、さらにユーザ特性ベクトルに基づいて評価を行うときの概念を示す概念図である。
【図7】コンテンツ管理テーブル205aの記憶内容を示す説明図である。
【図8】コンテンツ特徴ベクトル管理テーブル207bの記憶内容を示す説明図である。
【図9】携帯電話機100の機能構成を示すブロック図である。
【図10】携帯電話機100の要求に応じてコンテンツを配信するときの処理を示すシーケンス図である。
【図11】ユーザ特性ベクトルの計算処理を示すフローチャートである。
【図12】レコメンド情報を配信するときのシーケンス図である。
【図13】コンテンツの評価処理を示すフローチャートである。
【図14】履歴事象aと履歴事象bとにおけるメニュー画面を示す説明図である。
【図15】メニュー画面おいて選択されたコンテンツの特徴ベクトルの特徴空間における位置関係を示す図である。
【図16】履歴事象aおよびbを相対空間内において、コンテンツの特徴ベクトルを表した図である。
【図17】絶対空間における各コンテンツの特徴ベクトルに基づいて評価を行うときの概念を示した図である。
【図18】分離平面を生成することができない場合において相対空間を用いて処理を行うときの説明図である。
【図19】閲覧頻度を考慮して特徴ベクトルの重心を求める処理を示す概念図である。
【図20】アクセスされた時系列順にNN法によりユーザ特性ベクトルを求める過程を示す概念図である。
【図21】操作に関する特徴空間における特徴ベクトルのパラメータを示す説明図である。
【図22】レコメンド操作情報を表示することができる携帯電話機100aの機能を示すブロック図である。
【図23】特徴ベクトルを生成する処理を示すフローチャートである。
【発明を実施するための形態】
【0028】
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
【0029】
図1は、本実施形態の携帯電話機100および情報配信サーバ200を備えたレコメンド情報配信システムのシステム構成を示すシステム構成図である。携帯電話機100からの要求に応じて情報配信サーバ200は、予め記憶されているレコメンド情報となるコンテンツを、携帯電話機100に配信する。配信されるレコメンド情報は、携帯電話機100のユーザのアクセス履歴に基づいて編集されたものであり、ユーザにとって必要と思われる情報である。なお、この情報配信サーバ200は、携帯電話機100からのアクセス要求に応じて、他のコンテンツプロバイダからコンテンツを取得し、取得したコンテンツを配信するものであり、アクセス履歴はこのときに収集される。また、携帯電話機100がアクセス履歴を送信し、それを取得するように構成されてもよい。
【0030】
このような情報配信サーバ200の構成について、図2を用いて説明する。図2は、情報配信サーバ200の機能構成を示すブロック図である。この情報配信サーバ200は、コンテンツ要求受信部201(受付手段)、レコメンド要求受信部202、履歴クラス分離部203(分離平面生成手段)、ユーザ特性ベクトル計算部204(ユーザ特性ベクトル生成手段)、配信情報格納部205、コンテンツ評価部206(評価手段)、履歴格納部207(特徴ベクトル記憶手段、履歴記憶手段)、コンテンツ送信部208、および特徴ベクトル生成部209(特徴ベクトル生成手段)を含んで構成されている。
【0031】
図3は、情報配信サーバ200のハードウェア構成図である。図2に示される情報配信サーバ200は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。
【0032】
コンテンツ要求受信部201は、携帯電話機100からのコンテンツの要求に応じて、ネットワーク上のコンテンツプロバイダからコンテンツを取得する部分であり、携帯電話機100からコンテンツの要求とそのURLを受信することでアクセス履歴を収集することができる。収集したアクセス履歴(URLなど)は、履歴格納部207に出力される。なお、このコンテンツ要求受信部201は、アクセス履歴として、あるメニュー画面(事象)内において実際にアクセスされたコンテンツ(URL)と、メニュー画面には表示されているものの、実際にアクセスされなかったコンテンツとを区別して収集する。
【0033】
また、コンテンツ要求受信部201は、アクセス要求だけでなく、携帯電話機100において収集されたアクセス履歴情報を受信し、これを履歴格納部207に出力するようにしてもよい。この場合も同様に、携帯電話機100は、あるメニュー画面において選択されたコンテンツ、選択されなかったコンテンツを区別してアクセス履歴情報として情報配信サーバ200に送信するように構成される。
【0034】
レコメンド要求受信部202は、携帯電話機100からレコメンド情報の配信要求を、携帯電話機100のユーザのユーザIDとともに受信する部分である。レコメンド要求受信部202は、その配信要求を受信すると、コンテンツ評価部206にその旨を通知し、予め計算されていたユーザ特性ベクトルに基づいて、配信情報格納部205に記憶されているコンテンツの評価を行うよう指示する。なお、変形例として、レコメンド要求のあった旨をユーザ特性ベクトル計算部204に出力し、現時点におけるユーザ特性ベクトルを計算させ、その結果をコンテンツ評価部206に通知し、コンテンツ送信部208にレコメンド情報の配信を行わせるようにしてもよい。
【0035】
履歴クラス分離部203は、履歴格納部207(閲覧履歴テーブル207c:履歴記憶手段)に記憶されている閲覧履歴情報に含まれているコンテンツの特徴ベクトルに基づいて、あるユーザが閲覧したコンテンツをコンテンツ特徴ベクトル管理テーブル207bに記憶されている特徴ベクトルより構成される特徴空間で満足クラスと不満足クラスとに分離するための分離平面を生成する部分である。ここで、満足クラスとは、あるコンテンツにアクセスするためのメニュー画面において選択可能に表示された複数のコンテンツのうち、実際に選択されたコンテンツのみを含んだクラスをいい、不満足クラスとは、そのメニュー画面において選択されなかったコンテンツのみを含んだクラスをいう。この履歴クラス分離部203は、SVM法またはNN法を用いて、各コンテンツの特徴ベクトルを満足クラスと不満足クラスとに分離することができる分離平面を生成することで、これらクラスを分離することができる。ここでSVM(Support Vector Machine)法とは、それぞれのクラスのノード間(特徴ベクトル間)の最小距離を最大化する平面を分離平面とする方法であり、NN法とは、それぞれのクラスの重心間、すなわち各コンテンツの特徴ベクトルに基づいて算出された、満足クラスの重心と不満足クラスの重心とを結んだ直線を垂線とする平面を分離平面とする方法である。なお、NN法においては、必ずしも分離平面を求める必要はなく、不満足クラスの重心から満足クラスへの重心へ結んだ直線をユーザ特性ベクトルとするようにしてもよい。
【0036】
ここで分離平面を生成する具体的な方法について説明する。図4は、携帯電話機100に表示されるメニュー画面の一例を示す説明図である。図4に示すようにNode1〜Node5が表示されている。このNodeは、選択対象項目を示すものであり、例えばウェブ上のメニュー画面におけるカテゴリごとに区別された項目であったり、Webページなどの文書情報のタイトルである。例えば、Node1が、自動車に関するコンテンツ、Node2が、金融に関するコンテンツなどである。ユーザは、Node1〜Node5のいずれかを選択することにより、対応するコンテンツを閲覧することができる。
【0037】
図5は、分離平面を生成するときの処理概念を示す概念図である。図5は、上述図4におけるメニュー画面のうちユーザが選択したコンテンツおよび選択されなかったコンテンツにおける、特徴空間内における各コンテンツの特徴ベクトルの位置関係を示す。図5に示されている通り、円形で示されている部分が満足なコンテンツ(Node3、Node4)であり、三角形で示されている部分が不満足なコンテンツ(Node1、Node2、Node5)であり、四角形で示されている部分が未知の未評価コンテンツ(Node8、Node7)である。これら満足コンテンツと不満足コンテンツとを分離するように生成されたものが分離平面である。ここでは、未評価コンテンツは分離処理する際には考慮されない。なお、図においては、特徴空間を便宜上二次元平面で表現しているが、ベクトルを構成するパラメータ分だけベクトル軸が存在することになり、通常は20次元以上のベクトルで特徴空間は構成されている。
【0038】
ユーザ特性ベクトル計算部204は、特徴ベクトル生成部209により生成された特徴ベクトルで構成された特徴ベクトル空間における、履歴クラス分離部203により生成された分離平面に対して直交する直交ベクトルを算出し、これをユーザ特性ベクトルとする部分である。図6にその具体例を示す。図6は、分離平面に基づいてユーザ特性ベクトルを算出し、さらにユーザ特性ベクトルに基づいて評価を行うときの概念を示す概念図である。図6に示すように、分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが、ユーザ特性ベクトル計算部204により算出される。ユーザ特性ベクトル計算部204は、閲覧履歴が収集されるたびに計算され、ユーザ特性ベクトル管理テーブル207aに記憶されているユーザ特性ベクトルを更新させる。
【0039】
配信情報格納部205は、配信対象であるコンテンツ(レコメンド情報)およびその管理情報を記憶する部分であり、コンテンツ管理テーブル205aを記憶している。図7は、コンテンツ管理テーブル205aの記憶内容を示す説明図である。図7に示すように、このコンテンツ管理テーブル205aは、コンテンツID、カテゴリ、タイトル、およびレコメンド本文を対応付けて記憶している。コンテンツIDは、コンテンツを一意に特定するための識別情報であり、カテゴリは情報種別を示し、例えばCDに関連するもの、DVDに関連するもの、書籍に関連するもの、テレビ番組に関連するものなどを示すための情報である。タイトルは、レコメンド情報として表示するための見出し情報である。レコメンド情報を配信する際には、このタイトル部分が表示されることになる。レコメンド文は、レコメンド情報の本体部分であり、ユーザに有用な情報である。このコンテンツ管理テーブル205aに記憶される情報は、予めオペレータにより入力されたものでもよいし、自動的にコンテンツプロバイダから検索・抽出され所定のフィルターにより絞り込まれたものであってもよい。
【0040】
コンテンツ評価部206は、レコメンド要求受信部202によりレコメンドの要求が受信されると、配信情報格納部205に記憶されているコンテンツに対して、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルに基づいて評価し、そして評価の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する部分である。具体的には、このコンテンツ評価部206は、ユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより評価値を算出し、その評価値の高い順にコンテンツのタイトルを並べたレコメンド情報を生成する。
【0041】
概念的には、つぎの通りとなる。例えば、図6では、Node7およびNode8がコンテンツ管理テーブル205aに記憶された情報であるとして、未知のコンテンツとして扱われている。ここで、Node7およびNode8からユーザ特性ベクトルwに対して垂線をおろした点がユーザ特性ベクトルwに対する評価点となる。この垂線とユーザ特性ベクトルとの交点の位置が上位にある順にコンテンツ(タイトル部分)を表示するようにレコメンド情報を生成する。なお、分離平面を基準に、表示または非表示とするようにしてもよい。例えば、Node8からの垂線との交点は、分離平面を基準にした場合、それよりも上位に位置しているため、ユーザにとって評価は高いと判断されレコメンド情報として選択される。一方、Node7は基準より下にあるため、評価は低く、レコメンド情報として選択されない、というようなレコメンド情報としてもよい。
【0042】
履歴格納部207は、各履歴情報を記憶する部分であり、ユーザ特性ベクトル管理テーブル207a、コンテンツ特徴ベクトル管理テーブル207b、および閲覧履歴テーブル207cを記憶している。
【0043】
ユーザ特性ベクトル管理テーブル207aは、ユーザ特性ベクトル計算部204により計算されたユーザ特性ベクトルを、ユーザを特定するためのユーザIDと対応付けて記憶する部分である。
【0044】
コンテンツ特徴ベクトル管理テーブル207bは、コンテンツ管理テーブル205aに記憶されているコンテンツの特徴ベクトルを、そのコンテンツを特定するための情報(例えばコンテンツID、URLなど)と対応付けて記憶する部分である。このコンテンツ特徴ベクトルは、ユーザがアクセスしたときにそのコンテンツとともに、コンテンツ要求受信部201により取得されるもの、レコメンド情報を登録するときにそのオペレータにより設定されたものである。例えば、コンテンツ特徴ベクトル管理テーブル207bは、図8に示される情報が記憶されている。図8に示すように、コンテンツIDと対応付けて、特徴ベクトルを構成するパラメータが複数記憶されている。図8では、8個のパラメータを記載しているが、通常はさらに多くのパラメータから特徴ベクトルは構成されている。なお、規定のパラメータ以外に、コンテンツごとに形態素解析にしたがって抽出されたキーワードをパラメータとして追加するようにしてもよい。特徴ベクトルを構成するパラメータごとに、0から1の間で数値が記述されており、どの特徴ベクトルに特徴を持たせているかを表している。
【0045】
閲覧履歴テーブル207cは、コンテンツ要求受信部201により受信されたあて先または収集されたアクセス履歴情報を記憶する部分であり、例えば、コンテンツID(またはコンテンツのURL)およびそのコンテンツ(閲覧されたもの、閲覧されていないものそれぞれ)の特徴ベクトルを対応付けて記憶する部分である。このコンテンツの特徴ベクトルは、コンテンツ要求受信部201により取得されるコンテンツとともに取得されるものである。
【0046】
コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求またはレコメンド要求受信部202により受信されたレコメンド要求に応じて取得されたコンテンツを送信する部分である。例えば、コンテンツ送信部208は、コンテンツ要求受信部201により受信されたコンテンツ要求に応じて取得されたコンテンツを送信し、またレコメンド要求受信部202に応じて配信情報格納部205に記憶されているコンテンツに基づいてコンテンツ評価部206による評価結果にしたがって生成されたレコメンド情報を送信する。
【0047】
特徴ベクトル生成部209は、Webページ等の文書情報からコンテンツ情報を収集し、収集したコンテンツ情報に対してキーワード解析を行って、その特徴ベクトルを計算することで、コンテンツの特徴ベクトルを生成する部分である。なお、文書情報には、Webページのほか、ワープロデータ(ワードプロセッサにより作成されたデータ)、表計算データ(表計算アプリケーションにより作成されたデータ)、PDFデータなどの解析可能な文書が記述された情報が含まれる。詳細な処理は以下の通りとおりである。そして、特徴ベクトル生成部209は、生成した特徴ベクトルを用いて、コンテンツ特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新する。
【0048】
ここで特徴ベクトルを生成する具体的な方法について説明する。図23は、特徴ベクトルの計算処理を示すフローチャートである。図23に示すように、まずコンテンツ情報収集部209aによりWebページからコンテンツ情報(例えばWebページ)が収集される(S501)。
【0049】
そして、収集されたコンテンツ情報は、特徴キーワード抽出部209bにより形態素解析のアルゴリズムにより品詞毎(名詞、固有名詞、動詞、助詞など)に分類される(S502)。そして、このコンテンツ情報から、当該コンテンツ情報の属性に従った特徴的なキーワードが特徴抽出アルゴリズムにより抽出される(S503)。この特徴キーワード抽出部209bの特徴抽出アルゴリズムは、TF/IDF法またはPMM法を用いて、コンテンツ情報の属性毎に特徴的なキーワードを品詞毎に抽出することができる。
【0050】
ここで、TF/IDF法とは、ある文書での出現頻度が高い単語のうち他の文書にはあまり出現し無いものをその文書に特徴的な単語とする方法であり、PMM(Parametric Mixture Model)法とは、多重トピックを有する文書の確率モデルを構成することにより、ある文書から多重トピックを同時に抽出する方法である。なお、特徴抽出アルゴリズムにおいては、必ずしもTF/IDF法またはPMM法を用いて抽出する必要はない。
【0051】
抽出されたキーワードに基づいて、特徴ベクトル計算部209cにより特徴ベクトルが生成される(S504)。この生成された特徴ベクトルはコンテンツ特徴ベクトル管理テーブル207bに記憶される。
【0052】
特徴ベクトル生成部209は、Webページの情報が更新されるたび、または任意のタイミングで特徴ベクトル管理テーブル207bまたは必要に応じて閲覧履歴テーブル207cに記憶されている特徴ベクトルを更新させる。
【0053】
このように構成された情報配信サーバ200は、携帯電話機100からの要求に応じて、ユーザ特性ベクトルに基づいて評価されたレコメンド情報を配信することができる。よって、嗜好・趣味などの情報を登録する必要はなく、またアクセスしたコンテンツに直接的に関連するコンテンツのみを抽出することがなく、漏れのないレコメンド情報を配信することを可能とする。
【0054】
つぎに、携帯電話機100について説明する。図9は、携帯電話機100の機能構成を示すブロック図である。図9に示すとおり、携帯電話機100は、ブラウザ101、履歴送信部102、レコメンド要求送信部103、および配信情報表示部104を含んで構成されている。この携帯電話機100は、CPU、RAM、ROMなどのハードウェアにより構成されており、記憶されているプログラムにしたがってCPUは動作するよう構成されている。具体的には、情報配信サーバ200と同様の構成をとるものであって、図3に示されるハードウェア構成により実現される。以下、各構成について説明する。
【0055】
ブラウザ101は、インターネットに接続するためのアプリケーション部分であり、インターネット上に配置されているサイトに対してアクセスし、サイトに保持されているコンテンツをユーザに閲覧可能にさせるものである。このブラウザ101は、アクセス履歴を保持するように構成される。
【0056】
履歴送信部102は、ブラウザ101を用いてアクセスしたコンテンツのアクセス履歴(同一メニュー画面上において選択されたコンテンツおよび選択されなかったコンテンツを示す情報)を送信する部分である。なお、この履歴送信部102は、情報配信サーバ200側でアクセスのたびに履歴情報を収集する機能を有している場合には、必須の構成ではない。
【0057】
レコメンド要求送信部103は、図示しない操作部をユーザが操作することによりユーザIDとともにレコメンド情報の要求を情報配信サーバ200に送信する部分である。
【0058】
配信情報表示部104は、ブラウザ101により取得されたメニュー画面およびコンテンツ(Webページ)を表示する部分である。
【0059】
このように構成された携帯電話機100は、ブラウザ101を用いてインターネットにアクセス可能にするとともに、そのアクセス履歴を保持し、履歴送信部102は、情報配信サーバ200からの要求または所定のタイミングでアクセス履歴を送信することができる。
【0060】
つぎに、これら携帯電話機100および情報配信サーバ200の動作について説明する。図10は、携帯電話機100の要求に応じてコンテンツを配信するときの携帯電話機100と情報配信サーバ200との処理を示すシーケンス図である。
【0061】
図10に示すとおり、携帯電話機100におけるブラウザ101からの要求に応じて、コンテンツ送信部208により情報配信サーバ200からメニュー画面が配信される(S101)。携帯電話機100のユーザは、そのメニュー画面から任意の一のコンテンツ(上述Nodeに相当)を選択し、携帯電話機100におけるブラウザ101がこれを受け付けると(S102)、コンテンツの接続要求およびそのあて先でURLが情報配信サーバ200に送信される(S103)。
【0062】
情報配信サーバ200では、URLはコンテンツ要求受信部201により受信され、閲覧履歴テーブル207cにアクセス履歴として記憶される。そして、このアクセス履歴に基づいて、ユーザ特性ベクトルの計算がなされ、記憶される(S104)。そして、コンテンツ送信部208によりS103において要求のあったあて先に基づいたコンテンツがコンテンツプロバイダ(図示せず)から取得され、配信される(S105)。なお、ユーザ特性ベクトルの計算処理と、コンテンツの配信処理の順番は逆でもよい。
【0063】
ここでS104におけるユーザ特性ベクトル計算の詳細に処理について説明する。図11は、ユーザ特性ベクトルの計算処理を示すフローチャートである。図11に示すように、まずコンテンツ要求受信部201により受信されたアクセス要求またはアクセス履歴により示されたアクセス履歴情報が、新たに追加されたアクセス履歴として閲覧履歴テーブル207cに記憶される(S201)。
【0064】
そして、履歴クラス分離部203により、この閲覧履歴テーブル207cに記憶されているアクセス履歴情報に基づいて、各満足クラスまたは不満足クラスに属するコンテンツの特徴ベクトルが抽出される(S202)。そして、履歴クラス分離部203により、これら特徴ベクトルに基づいて満足クラスと不満足クラスとを分離するための分離平面が生成される(S202)。つぎに、ユーザ特性ベクトル計算部204により、生成された分離平面に直交する直交ベクトルが計算され、ユーザ特性ベクトルが求められる(S204)。ここで求められたユーザ特性ベクトルは、ユーザ特性ベクトル管理テーブル207aに保持され、レコメンド情報の配信時において配信情報格納部205に記憶されているコンテンツを評価する際に利用される。
【0065】
つぎに、本実施形態におけるレコメンド情報を配信するときのそのコンテンツの評価処理について説明する。図12は、レコメンド情報を配信するときのシーケンス図である。図12に示すように、携帯電話機100におけるレコメンド要求送信部103によりユーザIDを含んだレコメンド要求が送信され、このレコメンド要求は情報配信サーバ200におけるレコメンド要求受信部202により受信される(S301)。そして、情報配信サーバ200では、配信情報格納部205に記憶されているコンテンツに対して、コンテンツの評価が行われる(S302)。ここでは、コンテンツ評価部206により、ユーザ特性ベクトルにしたがって評価され、高評価順にコンテンツのタイトルを並べたレコメンド情報が生成される。そして、コンテンツ送信部208により、このように生成されたレコメンド情報が配信される(S303)。
【0066】
ここで、S302のコンテンツ評価についてさらに詳細な処理について説明する。図13は、コンテンツの評価処理を示すフローチャートである。図13に示すように、コンテンツ評価部206により、レコメンド要求とともに送信されたユーザIDに基づいて、ユーザ特性ベクトル管理テーブル207aから、対応するユーザ特性ベクトルが取得される(S401)。つぎに、コンテンツ評価部206により、コンテンツ特徴ベクトル管理テーブル207bから、各コンテンツの特徴ベクトルが取得される(S402)。
【0067】
そして、コンテンツ評価部206により、ユーザ特性ベクトルとコンテンツの特徴ベクトルとの内積が計算される(S403)。コンテンツ評価部206により計算された内積の大きい順に、コンテンツ管理テーブル205aに記憶されているコンテンツIDに対応するタイトルが抽出され、そのタイトルが評価の高い順に並べられることでレコメンド情報が生成される。そして、コンテンツ送信部208により、生成されたレコメンド情報が携帯電話機100に送信される(S404)。
【0068】
このように、ユーザ特性ベクトルにしたがって、レコメンド情報を提供することができ、漏れなくレコメンド情報をユーザに提供することができる。
【0069】
<相対空間における分離平面の生成>
以上の分離平面の生成方法は、絶対空間におけるコンテンツの特徴ベクトルにしたがって行われたものであるが、より精度高める方法として、相対的な位置関係を求めた相対空間を利用したものも考えられる。以下、相対空間を用いて分離平面を生成する方法について説明する。なお、このときの処理構成は上述と同様であり、履歴クラス分離部203における処理内容が異なるだけである。
【0070】
図14は、履歴事象aと履歴事象bとにおけるメニュー画面の構成例を示し、図14(a)が履歴事象aにおけるメニュー画面を示す図であり、このメニュー画面はNode1からNode3で構成されている。また、図14(b)が履歴事象bにおけるメニュー画面を示す図であり、このメニュー画面はNode6からNode9で構成されている。図14(a)では、Node3が選択されており、図14(b)では、Node9が選択されていることが示されている。
【0071】
図15は、図14で示されたそれぞれのメニュー画面おいて選択されたコンテンツの特徴ベクトルの特徴空間における位置関係を示す図である。図15(a)は、履歴事象aにおいて選択されたコンテンツの特徴空間(絶対空間)、図15(b)は、履歴事象bにおいて選択されたコンテンツの特徴空間(絶対空間)を示す図である。上述と同様に、選択されたコンテンツは満足なコンテンツ、選択されなかったコンテンツは不満足なコンテンツと定義され、それぞれ満足クラス、不満足クラスに分類することができる。
【0072】
図16は、それぞれの履歴事象aおよびbを同一特徴空間上に、コンテンツの特徴ベクトルを表した図であって、不満足なコンテンツの特徴ベクトルを原点に取った場合における満足なコンテンツの特徴ベクトルの位置を示す相対空間を表した図である。例えば、Node2とNode3との相対比較、Node1とNode3との相対比較のため、それぞれNode1、Node2を原点とした場合のNode3の位置を表した特徴空間を相対空間としている。より具体的には、Node3の特徴ベクトルからNode1の特徴ベクトルを減算することにより、相対空間を形成することができる。他のNodeについても同様に、対象となるコンテンツの特徴ベクトルを減算する処理を行うことで相対空間を形成することができる。
【0073】
この相対空間において、図16に示すようにこのように満足なコンテンツの特徴ベクトル、不満足なコンテンツの特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面が、履歴クラス分離部203により生成される。そして、ユーザ特性ベクトル計算部204により、この分離平面に直交する直交ベクトルであるユーザ特性ベクトルwが計算される。
【0074】
このように、履歴事象が異なる場合においても、相対空間を利用してユーザ特性ベクトルを生成することができ、より識別性の高いユーザ特性ベクトルを生成することができる。
【0075】
図17は、絶対空間における各コンテンツの特徴ベクトルに基づいて評価を行うときの概念を示した図であり、例えば、配信情報格納部205に記憶されている未知のコンテンツであるNode6〜Node8は、生成されたユーザ特性ベクトルに基づいて評価される。ここでは上述と同様に、コンテンツ評価部206はユーザ特性ベクトルと各コンテンツの特徴ベクトルとの内積を計算することにより、その評価値を算出することができる。概念的には、上述と同様に、ユーザ特性ベクトルに射影した点、すなわち垂線を下ろした点が、そのベクトル方向における上位の順にコンテンツの優先順が決定される。
【0076】
このように相対空間を用いて分離平面を生成し、それによってユーザ特性ベクトルを生成することができる。ところで、図15から図17については、絶対空間として扱っても分離平面を生成することができるが、分離平面を生成することができない特徴ベクトルから構成される特徴空間も考えられる。その場合に、上述した相対空間を利用することにより分離平面を生成することができる。以下、その方法について説明する。
【0077】
図18(a)は、絶対空間におけるコンテンツの特徴ベクトルを示した図である。この図18(a)では、Node1とNode4とが同じ事象(メニュー画面)に存在するコンテンツであり、Node2とNode3とが同じ事象に存在するコンテンツであことを前提としている。なお、円形のものが選択されたコンテンツの特徴ベクトル(満足クラス)、三角形のものが選択されなかったコンテンツの特徴ベクトル(不満足クラス)である。
【0078】
図18(a)から明らかなように、絶対空間においては、このような位置関係をとる特徴ベクトルのコンテンツに対しては、分離平面を生成することができない。分離平面は、満足クラスと不満足クラスとを分離するための平面であるためであり、図18(a)の例では、可不足なく両者を分離することができないためである。よって、分離平面を生成することができるように相対的な位置関係を表す相対空間に変換することが必要である。
【0079】
図18(b)では、相対空間内におけるコンテンツの特徴ベクトルを表した図であり、Node1およびNode2が同じ位置になるように、図18(b)の例では、Node2を平行移動させるためそのNode2に対応するNode3を平行移動させている。このように相対空間に変換することで、不満足なコンテンツであるNode1(Node2)と、満足なコンテンツであるNode3およびNode4とを分離することができる分離平面vを生成することができる。
【0080】
以上の通り絶対空間では、分離平面を生成することができない場合であっても、相対空間に変換することで分離平面を生成することができ、これによりユーザ特性ベクトルを計算することができる。
【0081】
<閲覧頻度を考慮した分離平面の生成方法>
つぎに、コンテンツの閲覧頻度を用いた重み付け処理を行い、この重み付け処理された特徴ベクトルを用いて分離平面を生成するときの履歴クラス分離部203の処理について説明する。なお、ここでは、NN法を用いた分離平面の生成について説明する。
【0082】
図19は、閲覧頻度を考慮して特徴ベクトルの重心を求める処理を示す概念図でありNodeA〜Cに対応したコンテンツc1〜c3の特徴ベクトルの位置を表す特徴空間を示す概念図である。コンテンツc1の閲覧頻度は3回、コンテンツc2の閲覧頻度は1回、コンテンツc3の閲覧頻度は10回とする。なお、閲覧履歴テーブル207cは、閲覧されたコンテンツの閲覧履歴、閲覧されていないコンテンツの不閲覧履歴を記憶しておくことが好ましく、それぞれの頻度を保持または計算可能に記憶しておくことが必要である。
【0083】
この場合、これらコンテンツc1〜c3の重心は、以下の式(1)により計算される。
【数1】
なお、ciは閲覧されたコンテンツの特徴ベクトル、niは閲覧頻度である。
【0084】
この計算を行うことにより重心が定まる。また、図示していないが閲覧されていないコンテンツについても同様に式(1)を用いて、閲覧さていないコンテンツの特徴ベクトルを用いてその重心を求める。そして、閲覧されていないコンテンツの重心から閲覧されたコンテンツの重心に対して結んだ直線をユーザ特性ベクトルとして求めることができる。なお、この直線は、分離平面に直交する直線と同じ向きを取るものであり、分離平面を算出し、この分離平面に直交する直交ベクトルを求めるようにしてもよいが、NN法においては必ずしも分離平面は必要とはならない。
【0085】
これにより、コンテンツの閲覧頻度を利用してユーザ特性ベクトルを求めることができ、閲覧頻度を利用しない場合と比較して、ユーザの嗜好に近いユーザ特性ベクトルを求めることができる。よって、ユーザの嗜好にそったコンテンツの評価を行うことができる。
【0086】
<選択順位を考慮した分離平面の生成方法>
つぎに、閲覧したコンテンツの順番を考慮して分離平面を生成するときの履歴クラス分離部203の処理について説明する。一般的に、直近にアクセスしたコンテンツの方が、その前にアクセスしたコンテンツより重要である、またはユーザの嗜好に近いものであると考えることができる。この時間差が大きくなればなるほど、ユーザの嗜好に変化が生じ、より直近にアクセスしたコンテンツを重要と考えることが顕著となる。ここでは、その時間差(時系列成分)を考慮して分離平面を生成するときの処理について説明する。
【0087】
図20は、履歴クラス分離部203が分離平面を生成する際において、そのアクセスされた時系列順にNN法によりユーザ特性ベクトルを生成するときの処理を示す説明図であって、図20(a)は、そのときのメニュー画面を示す説明図であり、図20(b)は、ユーザが選択したコンテンツの選択履歴を示す説明図であり、図20(c)は、特徴空間における各コンテンツの特徴ベクトルを表した概念図であり、図20(d)は、選択順を考慮した分離平面を生成することを説明するための概念図である。なお、選択履歴は、閲覧履歴テーブル207cに記憶される。
【0088】
図20(a)に示されるように、NodeAからNodeFからメニュー画面が構成されている。ここでは図20(b)に示すようにNodeA、NodeB、NodeCの順にコンテンツが選択されている。よって、NodeA、NodeB、NodeCが満足クラスに分類されるコンテンツとなり、NodeD、NodeE、NodeFが不満足クラスに分類されるコンテンツとなる。
【0089】
つぎに、図20(c)および図20(d)を用いて、分離平面を生成するときの処理を示す概念について説明する。図20(c)に示されるように、NodeAからNodeFは、その特徴ベクトルにしたがって特徴空間上に位置づけられている。そして、直近に選択したコンテンツの特徴ベクトルの影響が大きくなるように計算される。図20(d)に示されるように、満足クラスにおける重心を求めるため、まず、NodeAとNodeBとの中点w1が計算される。そして、この中点w1とNodeCとの中点w2が計算される。
【0090】
一方、不満足クラスにおいては、NodeD、NodeE、NodeFに基づいて重心w3が計算される。不満足クラスにおいては選択順という概念がないため、通常の処理と同じく、その3つのNodeに基づいた重心w3が計算される。そして、中点w2と重心w3とを結んだ線が垂線となる分離平面vが生成される。なお、本実施形態においてはこの分離平面vに直交する直交ベクトルをユーザ特性ベクトルとするものであり、これは、重心w3から中点w2に向けて結んだ直線と同じである。実施形態での説明の便宜上、分離平面を求めているが、NN法を用いる場合においては分離平面を求めることは必須のものではない。
【0091】
このように、特徴ベクトルと特徴ベクトルとの中点を算出し、またその中点と特徴ベクトルとの中点を算出し、時系列的に順に中点を算出する(NN法を適用する)ことにより、前のアクセス履歴ほど重みが小さくなり、時系列順位を考慮した重心を算出することができる。
【0092】
<操作メニューへの適用>
ところで、上述の各方法では、メニュー画面として、ウエブサイトである情報配信サーバ200から送信されたメニュー画面を例に説明したが、これに限るものではなく、例えば、携帯電話機100の操作メニューに対して、レコメンド情報としてレコメンド操作情報を表示するようにしてもよい。
【0093】
例えば、操作メニューにおける各操作項目に対して、特徴ベクトルが割り振られており、ユーザの操作履歴に従って、ユーザ操作に関するユーザ特性ベクトルが生成され、ユーザがレコメンド操作情報の要求を発すると、そのユーザ特性ベクトルに基づいてレコメンド操作情報を生成するようにしてもよい。なお、操作履歴情報は、所定のタイミングで携帯電話機100から情報配信サーバ200に送信され、記憶されるように構成されている。
【0094】
図21は、操作に関する特徴空間における特徴ベクトルのパラメータを示す説明図である。図21に示すように、携帯電話機100の端末機能として、「着もじ」「テレビ電話」「ワンセグ」「画面メモ」「テキストメモ」が規定されている。また、特徴ベクトルを構成するパラメータとして「電話」「インターネット」「テキスト」「メモ」「テレビ」が規定されている。このように、携帯電話機100の機能に特徴ベクトルが規定されている。例えば、「着もじ」には、「電話」「テキスト」のパラメータに1がふられており、電話、テキストに関連のある機能であることが示されている。配信情報格納部205には、全ての端末機能情報が記憶され、ユーザが操作メニューを表示する操作をするときには、その旨が通知され、コンテンツ評価部206は、操作情報の評価を行って適切なレコメンド操作情報を生成し、コンテンツ送信部208は、レコメンド操作情報を送信し、携帯電話機100においてそれを表示させることができる。
【0095】
このように操作メニューに対しても本実施形態の評価方法を適用し、レコメンド操作情報をユーザに提供することで、ユーザがよく使う操作に類似または関連した操作をユーザに通知することができる。
【0096】
また、情報配信サーバ200に接続することなく、携帯電話機内で処理を行うことも考えられる。図22は、レコメンド操作情報を表示することができる携帯電話機100aの機能を示すブロック図である。このハードウェア構成は図3と同じである。
【0097】
この携帯電話機100aは、操作部101a、レコメンド操作表示部104a、履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109を含んで構成されている。
【0098】
以下、各構成について説明する。操作部101aは、携帯電話機100aに搭載されている各機能を実行するための部分であり、テンキー、タッチパネルなどで構成されている。
【0099】
レコメンド操作表示部104aは、レコメンド操作情報を表示する部分であり、後述するようにユーザの操作履歴に従って定められたユーザにとって未知の操作を示すレコメンド操作情報を表示する部分である。
【0100】
履歴クラス分離部105、ユーザ特性ベクトル計算部106、操作情報評価部107、操作情報格納部108、および履歴格納部109は、それぞれ図2にて示されている情報配信サーバ200の履歴クラス分離部203、ユーザ特性ベクトル計算部204、配信情報格納部205、コンテンツ評価部206および履歴格納部207に相当するものであり、履歴クラス分離部105において、同一操作メニュー内において操作された機能、操作されていない機能をそれぞれ満足機能、不満足機能に分離する分離平面を生成し、ユーザ特性ベクトル計算部106は、生成された分離平面に直交する直交ベクトルをユーザ特性ベクトルとする。操作情報評価部107は、計算されたユーザ特性ベクトルにしたがって、各機能特徴ベクトルに基づいて評価をし、高評価の機能については、操作メニュー上に表示するようにそのメニュー画面を編集する。ユーザは、操作メニューを表示させるときには、その操作メニュー上でその高評価された機能を確認することができる。
【0101】
つぎに、本実施形態の携帯電話機100および情報配信サーバ200の作用効果について説明する。情報配信サーバ200において、所定のタイミングで、特徴ベクトル生成部209は、Webページなどのコンテンツを収集し、そのコンテンツの特徴を示すキーワードを抽出して、特徴ベクトルを生成する。生成した特徴ベクトルは、コンテンツ特徴ベクトル管理テーブル207bに記憶され、更新される。
【0102】
この収集のタイミングは、任意のタイミングや、Webページが更新されたタイミング(これは更新通知信号を受信するなどして)である。このように任意のタイミングで収集処理、特徴ベクトル生成処理が行われることで、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの最新情報に追従して選択項目に基づくコンテンツ、例えばWebページを取得して、その特徴ベクトルを生成することができる。
【0103】
一方、携帯電話機100において、ユーザがブラウザを操作することにより、メニュー画面が表示され、Node1〜Node5などのコンテンツを表す複数の選択対象項目が表示される。そして、ユーザ操作により、これらコンテンツから任意の一のコンテンツを選択すると、携帯電話機100は情報配信サーバ200に選択されたコンテンツおよび選択されなかったコンテンツを送信し、情報配信サーバ200(コンテンツ要求受信部201)はこれを受け付ける。コンテンツ要求受信部201は、選択されたコンテンツを、コンテンツプロバイダから取得し、コンテンツ送信部208はこれを携帯電話機100に送信する。
【0104】
また、閲覧履歴テーブル207cは、選択されたコンテンツの特徴ベクトルおよび選択されなかったコンテンツの特徴ベクトルを記憶する。履歴クラス分離部203は、閲覧履歴テーブル207cに記憶されている選択されたコンテンツの特徴ベクトルと選択されなかったコンテンツの特徴ベクトルとを、特徴空間内で分離するための分離平面を生成する。そして、ユーザ特性ベクトル計算部204は、生成された分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成し、これをユーザ特性ベクトル管理テーブル207aに記憶させる。その後、レコメンド要求をレコメンド要求受信部202が受信すると、コンテンツ評価部206は、記憶されているユーザ特性ベクトルに基づいて、コンテンツの評価を行う。
【0105】
これにより、ユーザの特徴を示すベクトルにしたがってコンテンツの評価を行うことができ、ユーザの趣味・嗜好など、またアクセス履歴などの直接的な情報に基づいて推薦すべきコンテンツを評価することがなく、漏れのないコンテンツをユーザに提供することができる。また、ユーザが潜在的に望んでいるコンテンツなどのレコメンド情報を漏れなく配信することができるようになる。すなわち、選択対象項目、例えばテレビ番組やCDの紹介情報などのコンテンツの種類に応じて特徴ベクトルが更新されることにより、コンテンツの種類に特化されたレコメンド情報をユーザに提供することができる。
【0106】
また、本実施形態の情報配信サーバ200は、履歴クラス分離部203は、選択されなかった全てのコンテンツの特徴ベクトルと選択されたコンテンツの特徴ベクトルとの相対的な位置関係を算出し、当該位置関係に基づいて分離平面を生成することが好ましい。すなわち、選択されなかったまたは選択されたコンテンツの特徴ベクトルに、他の特徴ベクトルを重ねるようその位置関係を計算し、相対空間を形成し、その相対空間において分離平面を生成することが好ましい。これにより、相対的な位置関係を表す相対空間内で分離平面を生成し、これ基づいてユーザ特性ベクトルを生成することができるため、より精度の高いコンテンツの評価を行うことができる。
【0107】
また、本実施形態の情報配信サーバ200において、閲覧履歴テーブル207cは、コンテンツの閲覧頻度および閲覧されていない不閲覧頻度を記憶しておく。なお、このような閲覧頻度、不閲覧頻度を記憶することなく、閲覧履歴に基づいて閲覧頻度、不閲覧頻度を必要に応じて計算するようにしてもよい。そして、閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行うとともに、不閲覧頻度の高いコンテンツの特徴ベクトルにその頻度に応じた重み付けを行い、その重み付けされた特徴ベクトルに基づいて、満足クラスと不満足クラスとに分離するための分離平面を生成することができる。これにより、頻度に応じてユーザ特性ベクトルを算出することができ、より精度のよいユーザ特性ベクトルを算出し、よってコンテンツの評価をより正確に行うことができる。
【0108】
また、本実施形態の情報配信サーバ200において、コンテンツ管理テーブル205aは、メニュー画面における各コンテンツを選択した時期を、そのコンテンツの特徴ベクトルとともに記憶し、選択時期の新しさの度合いに応じて重み付けされたコンテンツの特徴ベクトルに基づいて分離平面を生成することができる。例えば、NN法においては、時間的に古いコンテンツの特徴ベクトルから順にその重心を求めていくことにより、結果的に選択時期の新しさの度合いに応じた重み付け処理がなされることになる。これにより時系列成分を考慮した重み付けを行うことができ、より精度のよいコンテンツの評価を行うことができる。
【0109】
また、本実施形態の情報配信サーバ200において、コンテンツ送信部208は、コンテンツ評価部206による評価結果に従って生成されたレコメンド情報を送信することにより、ユーザは役立つ情報を取得することができる。
【0110】
また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、更新するために必要な情報を選択項目対象であるWebページから取得する。よって、適切な特徴ベクトルを生成することができる。
【0111】
また、本実施形態の情報配信サーバ200において、特徴ベクトル生成部209は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴キーワード抽出部209bを備え、特徴キーワード抽出部209bにより抽出されたキーワードに基づいて、特徴ベクトル計算部209cは、特徴ベクトルを計算することができる。
【0112】
この発明によれば、選択対象項目の属性毎に特徴的なキーワードを品詞に毎に抽出し、抽出されたキーワードに基づいて、特徴ベクトルを生成することで、適切な特徴ベクトルを生成することができる。
【0113】
この特徴キーワード抽出部209bは、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出してもよいし、また、PMM法に基づいて、選択対象項目の属性毎に特徴的なキーワードを抽出するようにしてもよい。
【符号の説明】
【0114】
100…携帯電話機、100a…携帯電話機、101…ブラウザ、101a…操作部、102…履歴送信部、103…レコメンド要求送信部、104…配信情報表示部、104a…レコメンド操作表示部、105…履歴クラス分離部、106…ユーザ特性ベクトル計算部、107…操作情報評価部、108…操作情報格納部、109…履歴格納部、200…情報配信サーバ、201…コンテンツ要求受信部、202…レコメンド要求受信部、203…履歴クラス分離部、204…ユーザ特性ベクトル計算部、205…配信情報格納部、205a…コンテンツ管理テーブル、206…コンテンツ評価部、207…履歴格納部、207a…ユーザ特性ベクトル管理テーブル、207b…コンテンツ特徴ベクトル管理テーブル、207c…閲覧履歴テーブル、208…コンテンツ送信部、209…特徴ベクトル生成部。
【特許請求の範囲】
【請求項1】
選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成手段と、
前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、
前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、
前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、
前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、
前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新することを特徴とするレコメンド情報評価装置。
【請求項2】
前記履歴記憶手段により記憶されている選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成する分離平面生成手段をさらに備え、
前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することを特徴とする
請求項1に記載のレコメンド情報評価装置。
【請求項3】
前記特徴ベクトル生成手段は、更新するために必要な情報を選択項目対象である文書情報から取得することを特徴とする請求項1または2に記載のレコメンド情報評価装置。
【請求項4】
前記文書情報は、Webページであることを特徴とする請求項3に記載のレコメンド情報評価装置。
【請求項5】
前記特徴ベクトル生成手段は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴抽出手段をさらに備え、
前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報評価装置。
【請求項6】
前記特徴抽出手段は、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することを特徴とする請求項5に記載のレコメンド情報評価装置。
【請求項7】
前記特徴抽出手段は、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することを特徴とする請求項5に記載のレコメンド情報評価装置。
【請求項8】
前記特徴ベクトル生成手段は、特徴ベクトルを任意のタイミングで生成することを特徴とする請求項1から7のいずれか一項に記載のレコメンド情報評価装置。
【請求項9】
選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成ステップと、
前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、
前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、
前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、
前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、
前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新することを特徴とするレコメンド情報評価方法。
【請求項1】
選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成手段と、
前記特徴ベクトル生成手段により生成された特徴ベクトルを記憶する特徴ベクトル記憶手段と、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付手段と、
前記受付手段により受け付けられ、選択された選択対象項目、および選択されなかった選択対象項目を区別して記憶する履歴記憶手段と、
前記履歴記憶手段により記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面に直交する直交ベクトルをユーザ特性ベクトルとするユーザ特性ベクトル生成手段と、
前記ユーザ特性ベクトル生成手段により生成されたユーザ特性ベクトルに基づいて、未知の選択対象項目の評価を行う評価手段と、を備え、
前記特徴ベクトル生成手段は、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶されている特徴ベクトルを更新することを特徴とするレコメンド情報評価装置。
【請求項2】
前記履歴記憶手段により記憶されている選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを特徴空間内で分離するための分離平面を生成する分離平面生成手段をさらに備え、
前記ユーザ特性ベクトル生成手段は、前記分離平面生成手段により生成された分離平面に従ってユーザ特性ベクトルを生成することを特徴とする
請求項1に記載のレコメンド情報評価装置。
【請求項3】
前記特徴ベクトル生成手段は、更新するために必要な情報を選択項目対象である文書情報から取得することを特徴とする請求項1または2に記載のレコメンド情報評価装置。
【請求項4】
前記文書情報は、Webページであることを特徴とする請求項3に記載のレコメンド情報評価装置。
【請求項5】
前記特徴ベクトル生成手段は、選択対象項目の属性毎に特徴的な単語を品詞毎に抽出する特徴抽出手段をさらに備え、
前記特徴抽出手段により抽出された単語に基づいて、特徴ベクトルを生成することを特徴とする請求項1から4のいずれか一項に記載のレコメンド情報評価装置。
【請求項6】
前記特徴抽出手段は、TF/IDF法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することを特徴とする請求項5に記載のレコメンド情報評価装置。
【請求項7】
前記特徴抽出手段は、PMM法に基づいて、選択対象項目の属性毎に特徴的な単語を抽出することを特徴とする請求項5に記載のレコメンド情報評価装置。
【請求項8】
前記特徴ベクトル生成手段は、特徴ベクトルを任意のタイミングで生成することを特徴とする請求項1から7のいずれか一項に記載のレコメンド情報評価装置。
【請求項9】
選択対象項目の特徴空間を構成する特徴ベクトルを生成する特徴ベクトル生成ステップと、
前記特徴ベクトル生成ステップにおいて生成された特徴ベクトルを特徴ベクトル記憶手段に記憶する特徴ベクトル記憶ステップと、
ユーザ操作により、複数の選択対象項目から一の選択対象項目を選択することを受け付ける受付ステップと、
前記受付ステップにおいて受け付けられ、選択された選択対象項目および選択されなかった選択対象項目を履歴記憶手段に記憶する履歴記憶ステップと、
前記履歴記憶手段に記憶された、選択された選択対象項目の満足特徴ベクトルと選択されなかった選択対象項目の不満足特徴ベクトルとを、特徴空間内で分離するための分離平面に直交する直交ベクトルに基づいてユーザ特性ベクトルを生成するユーザ特性ベクトル生成ステップと、
前記ユーザ特性ベクトル生成ステップにより生成されたユーザ特性ベクトルに基づいて、レコメンド情報の評価を行う評価ステップと、を備え、
前記特徴ベクトル生成ステップは、生成した特徴ベクトルに基づいて、前記特徴ベクトル記憶手段に記憶された特徴ベクトルを更新することを特徴とするレコメンド情報評価方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【公開番号】特開2010−181966(P2010−181966A)
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願番号】特願2009−22880(P2009−22880)
【出願日】平成21年2月3日(2009.2.3)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願日】平成21年2月3日(2009.2.3)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
[ Back to top ]