説明

コンテンツ間類似度算出装置及びコンテンツ間類似度算出方法

【課題】利用状況の類似性を考慮に入れてコンテンツ間の類似度を算出することを目的とする。
【解決手段】コンテンツ間の類似度を算出するコンテンツ間類似度算出装置は、コンテンツが携帯端末で起動したときの利用履歴を携帯端末から受信する利用履歴受信部と、前記利用履歴受信部で受信した利用履歴を、予め設定された利用状況に集計する利用履歴集計部と、前記利用履歴集計部で集計された利用履歴から、コンテンツ毎に利用状況の特徴ベクトルを生成する利用状況特徴ベクトル化部と、利用状況の特徴ベクトルに基づいて、コンテンツ間の類似度を算出する類似度算出部とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツ間類似度算出装置及びコンテンツ間類似度算出方法に関する。
【背景技術】
【0002】
従来から、あるコンテンツに関連性のあるコンテンツを算出する装置として、Amazonに代表されるEC(Electronic Commerce)サイト等での協調フィルタリングを用いたコンテンツ間関連性算出装置が知られている。その他、メタデータ等のコンテンツの内容を表すものを比較することで関連性を算出するコンテンツフィルタリングを用いたコンテンツ間関連性算出装置も知られている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−134941号公報
【非特許文献】
【0004】
【非特許文献1】T.Joachims, "Optimizing Search Engines Using Clickthrough Data", Proc.ACM SIGKDD International Conf. Knowledge Discovery and Data Mining(KDD02), ACM Press, pp.132-142, 2002.
【発明の概要】
【発明が解決しようとする課題】
【0005】
一般に、協調フィルタリングは、ユーザによる各コンテンツへの評価や、閲覧履歴又は購買履歴を大量に必要とするという問題点がある。また、コンテンツフィルタリングは似たような内容のコンテンツのみが関連性の高いものとして算出される為、ユーザが興味のある領域に関して既知のものが検索される可能性が高く、新たな発見が少ないという問題点がある。
【0006】
AndroidやWindows Mobile等のオープンプラットフォーム基盤におけるコンテンツ配信システムにおいて、日々新規コンテンツが追加される中で膨大な数のコンテンツの中からユーザが潜在的に求めるコンテンツを効率良く配信する方法が求められる。
【0007】
特に携帯端末のコンテンツにおいては、コンテンツ間の関連性として機能の類似性だけでなく、コンテンツが利用される状況の類似性も考えられる。例えば、「天気予報」というコンテンツと「世界の天気」というコンテンツとは、機能の類似性があると考えられる。一方、「路線案内」というコンテンツと「グルメガイド」というコンテンツとは、コンテンツが利用される状況の類似性があると考えられる。この理由は、「グルメガイド」で見つけた飲食店に行くために、同じ時間帯及び同じエリアで「路線案内」を利用する可能性があるからである。
【0008】
そこで、本発明は、コンテンツ配信システムにおいてユーザが潜在的に求めるコンテンツを効率良く配信するための手段として、利用状況の類似性を考慮に入れてコンテンツ間の類似度を算出することを目的とする。
【課題を解決するための手段】
【0009】
本発明のコンテンツ間類似度算出装置は、
コンテンツ間の類似度を算出するコンテンツ間類似度算出装置であって、
コンテンツが携帯端末で起動したときの利用履歴を携帯端末から受信する利用履歴受信部と、
前記利用履歴受信部で受信した利用履歴を、予め設定された利用状況に集計する利用履歴集計部と、
前記利用履歴集計部で集計された利用履歴から、コンテンツ毎に利用状況の特徴ベクトルを生成する利用状況特徴ベクトル化部と、
利用状況の特徴ベクトルに基づいて、コンテンツ間の類似度を算出する類似度算出部と、
を有することを特徴とする。
【0010】
本発明のコンテンツ間類似度算出方法は、
コンテンツ間の類似度を算出するコンテンツ間類似度算出装置におけるコンテンツ間類似度算出方法であって、
コンテンツが携帯端末で起動したときの利用履歴を携帯端末から受信するステップと、
前記利用履歴受信部で受信した利用履歴を、予め設定された利用状況に集計するステップと、
前記利用履歴集計部で集計された利用履歴から、コンテンツ毎に利用状況の特徴ベクトルを生成するステップと、
利用状況の特徴ベクトルに基づいて、コンテンツ間の類似度を算出するステップと、
を有することを特徴とする。
【発明の効果】
【0011】
本発明の実施例によれば、利用状況の類似性を考慮に入れてコンテンツ間の類似度を算出することが可能になる。
【図面の簡単な説明】
【0012】
【図1】本発明の実施例に係る通信システムの構成図
【図2】本発明の実施例に係る携帯端末及び検索サーバの機能ブロック図
【図3】本発明の実施例に係る携帯端末内の利用履歴管理テーブルを示す図
【図4】本発明の実施例に係る検索サーバ内の利用履歴管理テーブルを示す図
【図5】本発明の実施例に係る検索サーバ内のメタデータ管理テーブルを示す図
【図6】本発明の実施例に係る検索サーバ内の特徴量管理テーブルを示す図
【図7】本発明の実施例に係る検索サーバ内の類似度管理テーブルを示す図
【図8】本発明の実施例に係る検索サーバにおけるコンテンツ間類似度算出方法のフローチャート
【図9】利用状況を特徴ベクトル化する手順を示すフローチャート
【発明を実施するための形態】
【0013】
本発明の実施例では、コンテンツ間の類似度を算出するコンテンツ間類似度算出装置が用いられる。コンテンツ間類似度算出装置は、携帯端末と通信可能な検索サーバでもよい。
【0014】
コンテンツ間類似度算出装置は、コンテンツが携帯端末で起動したときの時間情報又は位置情報等の利用履歴を携帯端末から受信する。受信した利用履歴は、予め設定された利用状況に集計される。例えば、利用履歴は、エリア毎、利用時間帯毎又は利用時間の長さ毎に集計される。集計された利用履歴から、コンテンツ毎に利用状況の特徴ベクトルが生成される。コンテンツ間の類似度は、利用状況の特徴ベクトルに基づいて算出される。なお、利用状況の特徴ベクトルとは、予め設定されたn個の利用状況とコンテンツとの結びつきの強さを表すn次元ベクトルである。
【0015】
また、メタデータの特徴ベクトルが生成され、コンテンツ間の類似度は、利用状況の特徴ベクトルとメタデータの特徴ベクトルとに基づいて算出されてもよい。メタデータの特徴ベクトルとは、コンテンツのメタデータから抽出されたm個の特徴語とコンテンツとの結びつきの強さを表すm次元ベクトルである。
【0016】
以下、本発明の実施例について詳細に説明する。
【0017】
<通信システムの構成>
まず、本実施例に係る通信システムの全体構成について説明する。図1に示すように、本発明の実施例に係る通信システムは、携帯端末10と、検索サーバ20と、コンテンツ管理サーバ30と、移動通信網40とから構成される。
【0018】
検索サーバ20は、コンテンツ間の類似度を算出するコンテンツ間類似度算出装置である。検索サーバ20は、携帯端末10からコンテンツの検索リクエストを受け付け、検索リクエストのコンテンツに関連性の高いコンテンツを検索し、移動通信網40経由で携帯端末10に検索結果を送信する。
【0019】
コンテンツ管理サーバ30は、携帯端末10に配信されるコンテンツを記憶及び管理する装置である。コンテンツとは、コンテンツ管理サーバ30から携帯端末10に提供されるサービス又は情報のことであり、例えば、アプリケーション、データ、映像、音楽、これらの組み合わせ等を含む。
【0020】
図2を参照して、携帯端末10及び検索サーバ20について更に詳細に説明する。携帯端末10は、利用履歴送信部101と、利用履歴格納部102と、利用履歴取得部103と、現在地取得部104と、検索部105とから構成される。
【0021】
利用履歴取得部103は、コンテンツを携帯端末10で実行したときに、時間情報等の利用履歴を取得する。例えば、実行したコンテンツ名、起動日時、利用時間の長さを取得する。
【0022】
現在地取得部104は、コンテンツを実行したときの位置情報を取得する。例えば、携帯端末10の緯度及び経度を取得する。
【0023】
利用履歴格納部102は、利用履歴取得部103及び現在地取得部104から取得した内容を記憶する。
【0024】
利用履歴送信部101は、利用履歴格納部102に記憶された時間情報及び位置情報等の利用履歴を検索サーバ20に送信する。
【0025】
検索部105は、検索サーバ20に検索リクエストを送信し、また、検索サーバ20から検索結果を受信する。検索リクエストは、コンテンツIDであり、検索結果は、検索リクエストのコンテンツと関連性の高いコンテンツのリストである。
【0026】
検索サーバ20は、利用履歴受信部201と、エリア情報取得部202と、利用履歴集計部203と、メタデータ格納部204と、特徴語抽出部205と、メタデータ特徴ベクトル化部206と、利用履歴格納部207と、利用状況特徴ベクトル化部208と、特徴量格納部209と、類似度算出部210と、類似度格納部211と、検索部212とから構成される。
【0027】
利用履歴受信部201は、携帯端末10から時間情報及び位置情報等の利用履歴を受信する。
【0028】
エリア情報取得部202は、利用履歴のうち、携帯端末10の緯度及び経度から駅、ショッピングセンター等の周辺施設情報を取得する。周辺施設情報は、検索サーバ20内に周辺施設情報と緯度及び経度情報とを対応付けたデータベース(図示せず)を設けておき、そのデータベースから取得されてもよい。また、周辺施設情報は、外部のサーバから取得されてもよい。
【0029】
利用履歴集計部203は、コンテンツ毎に、利用履歴受信部201及びエリア情報取得部202から取得した内容を予め設定された利用状況別に集計する。
【0030】
利用履歴格納部207は、利用履歴集計部203で集計された内容を記憶する。
【0031】
利用状況特徴ベクトル化部208は、各コンテンツの利用状況を表現する利用状況特徴ベクトルを生成する。これにより、各コンテンツの代表的な利用状況が特徴ベクトル化される。
【0032】
メタデータ格納部204は、各コンテンツの名称、カテゴリ、説明文等を含むメタデータを記憶する。
【0033】
特徴語抽出部205は、メタデータ内の説明文からコンテンツを表す特徴的な単語を抽出する。
【0034】
メタデータ特徴ベクトル化部206は、抽出された特徴語に基づいて各コンテンツの機能を表現するメタデータ特徴ベクトルを生成する。
【0035】
特徴量格納部209は、利用状況特徴ベクトル化部208及びメタデータ特徴ベクトル化部206により算出された各コンテンツの利用状況特徴ベクトル及びメタデータ特徴ベクトルを記憶する。
【0036】
類似度算出部210は、特徴量格納部209に記憶された内容に基づいて利用状況の類似度及びメタデータの類似度を算出し、更に、コンテンツ間の類似度を算出する。
【0037】
類似度格納部211は、類似度算出部210により算出された類似度を記憶する。
【0038】
検索部212は、携帯端末10からの検索リクエストを受け付け、また、類似度の高いコンテンツのリストを携帯端末10に送信する。
【0039】
なお、図2では、携帯端末10が利用履歴を検索サーバ20に送信しているが、検索サーバ20の利用履歴受信部201が携帯端末10を監視して利用履歴を収集してもよい。
【0040】
図3に、利用履歴格納部102の利用履歴管理テーブルを示す。利用履歴格納部102には、携帯端末10上で実行されたコンテンツの利用履歴毎に、コンテンツを一意に識別するコンテンツID、起動日時、緯度、経度及び利用時間の長さが記憶される。
【0041】
図4に、利用履歴格納部207の利用履歴管理テーブルを示す。利用履歴格納部207には、コンテンツID毎に、そのコンテンツが起動された利用状況が記憶され、また、その利用状況に該当するコンテンツの起動回数が記憶される。ここで、利用状況は利用状況IDという形で表現される。例えば、利用状況IDの各成分(S01〜S06)は、コンテンツが利用された時間帯(朝、昼、晩)、利用時間の長さ(5分以内、30分以上等)、エリア情報(駅、飲食店、学校、映画館等)等を表す。各成分に、0(該当しない)、1(該当する)が記憶されている。例えば、昼(S02)に駅(S06)でコンテンツID=C0001が利用された場合、(S01,S02,S03,S04,S05,S06)=(0,1,0,0,0,1)に該当する利用状況の起動回数を1だけ増やす。コンテンツの利用履歴は、コンテンツの起動回数(又はダウンロード回数)の多い順にソートされ、各コンテンツのソートされた利用履歴の最下位には、全成分が0となるレコードが挿入される。なお、利用履歴は、時間情報(利用時間帯又は利用時間の長さ)及び位置情報(エリア情報)のいずれかに基づいて集計されてもよく、時間情報及び位置情報の双方に基づいて集計されてもよい。
【0042】
図5に、メタデータ格納部204のメタデータ管理テーブルを示す。メタデータ格納部204には、コンテンツのメタデータがコンテンツID別に記憶されている。コンテンツは、カテゴリによって分類されてもよい。
【0043】
図6に、特徴量格納部209の特徴量管理テーブルを示す。特徴量格納部209には、抽出された特徴語、利用状況IDの要素数がそれぞれm個、n個とした場合、メタデータ特徴ベクトル化部206により算出されたm次元ベクトル(メタデータ特徴ベクトル)と、利用状況特徴ベクトル化部208により算出されたn次元ベクトル(利用状況特徴ベクトル)と、コンテンツ間の類似度を測定する際に2つの特徴ベクトルの重みを決定する重み係数αが記憶されている。例えば、メタデータ特徴ベクトルは、「路線」、「駅」、「居酒屋」、「天気」、「時刻」というm個の特徴語のそれぞれが出現したか否か、特徴語が出現する確率、特徴語間の共起度等を表す。利用状況特徴ベクトルは、SVM(Support Vector Machine)等により変換されたコンテンツの利用状況を表す。
【0044】
図7に、類似度格納部211の類似度管理テーブルを示す。類似度格納部211には、コンテンツIDの組み合わせ(コンテンツID1,コンテンツID2)に対して、メタデータ特徴ベクトルのコサイン類似度(メタデータ類似度)と、利用状況特徴ベクトルのコサイン類似度(利用状況類似度)と、メタデータ類似度と利用状況類似度とをαに応じて重み付けすることで算出されるコンテンツ間類似度と、コンテンツID1のコンテンツを検索キーとした検索リクエストがあった際にコンテンツID2のコンテンツが実際にダウンロードされた回数を示すダウンロードリクエスト数とが記憶されている。
【0045】
<コンテンツ間類似度算出方法>
次に、検索サーバでのコンテンツ間類似度算出方法について説明する。図8は、本発明の実施例に係る検索サーバ20におけるコンテンツ間類似度算出方法のフローチャートである。
【0046】
まず、検索サーバ20において、メタデータ格納部204に新しいコンテンツが追加されている場合は(ステップS11)、事前準備としてメタデータの特徴ベクトルを生成する(ステップS18)。具体的には、特徴語抽出部205は各コンテンツのメタデータから形態素解析により名詞等の単語を抽出する。抽出された名詞のうち、TFIDF(term frequency inverse document frequency)の閾値処理により、ノイズとなり得るコンテンツの特徴と関係の低い一般的な名詞を判定し、排除する。例えば、格納されたメタデータが図5の内容である場合、「路線」、「駅」「居酒屋」、「天気」、「時刻」といった単語が特徴語として抽出され、「検索」、「表示」といった一般的な単語は排除されることが期待される。ここで抽出されたm個の特徴語を用いて、各コンテンツのメタデータがm次元ベクトル化される。ここで、ベクトルの各成分の決定方法として、当該特徴語が出現するか否かに応じて1(出現する)又は0(出現しない)を代入する方法、特徴語の出現確率や特徴語間の共起度を考慮して重み付けした値を代入する方法がある。算出されたm次元ベクトルは、図6に示す特徴量格納部209の特徴量管理テーブルにおけるメタデータ特徴ベクトルの列に記憶される。
【0047】
そして、類似度算出部210が、コンテンツの全組み合わせに対してメタデータから生成されたm次元ベクトル間のコサイン距離simAを算出する(ステップS19)。例えば、ベクトルviとベクトルvjとのコサイン距離は、以下の式(1)により算出される。
【0048】
【数1】

算出されたメタデータ特徴ベクトルのコサイン距離simA(メタデータ類似度)は、図7に示す類似度格納部211の類似度管理テーブルにおけるメタデータ類似度の列に記憶される。
【0049】
一方、携帯端末10において、利用履歴取得部103はコンテンツの起動状況を監視し、コンテンツの起動又は終了イベントを検知し、起動したコンテンツのID、起動日時、利用時間、起動した位置の緯度及び経度を記録する。ここで、測位方法として携帯端末に内蔵されているGPSモジュールを用いる方法と基地局から位置情報を取得する方法がある。利用履歴格納部102に図3のように記憶されたコンテンツの利用履歴は、決められたタイミングで検索サーバ20の利用履歴受信部201に送信される(ステップS12)。
【0050】
次に、利用履歴集計部203は利用履歴受信部201が受信した利用履歴に対し、緯度及び経度情報をもとにエリア情報取得部202に対して検索を行わせ、コンテンツが起動された位置周辺にある施設情報を求める。更に、時間帯、利用時間の長さ、エリア情報など予め設定したn個の要素からなる利用状況ID別にコンテンツ利用履歴を集計する(ステップS13)。ここで、利用状況IDの各要素は該当する/しないに応じて1/0が代入される。例えば、要素として時間帯が(朝、昼、夜)、利用時間が(5分以内、5〜29分、30〜59分、60分以上)、エリア情報が(駅、飲食店、映画館、コンビニエンスストア)の11個とした場合、朝に駅構内のコンビニエンスストア内で3分コンテンツを利用した履歴は利用状況ID(1,0,0,1,0,0,0,1,0,0,1)として集計される。このように、携帯端末10から受信した全ての履歴は利用状況IDが付与され、利用履歴が利用状況IDに該当する場合には、利用状況IDに対応する起動回数が1だけ増やされる。
【0051】
集計された利用履歴は、特徴ベクトル化される(ステップS14)。具体的な手順を図9に示す。集計された利用履歴は、図4に示すようにコンテンツID毎に起動回数の多い順にソートされ、利用履歴格納部207に記憶される(ステップS20)。次に、各コンテンツの最下位部分に全ての成分が0のレコードが挿入される(ステップS21)。ソートされた利用履歴は、SVM(Support Vector Machine)により各コンテンツを代表する一つの利用状況特徴ベクトルに変換され(非特許文献1参照)、特徴量格納部209に記憶される(S22)。起動回数の順番にソートすることで起動回数の多い状況がより強く反映される。利用状況特徴ベクトルは起動回数に依存するため、利用状況特徴ベクトルは、収集した利用履歴に基づいて動的に算出されてもよい。
【0052】
そして、メタデータ類似度算出部210が、コンテンツの全組み合わせに対して利用状況から生成されたn次元ベクトル間のコサイン距離simBを算出する(ステップS15)。このコサイン距離simBも式(1)と同様に算出される。算出された利用状況特徴ベクトルのコサイン距離simB(メタデータ類似度)は、図7に示す類似度格納部211の類似度管理テーブルにおける利用状況類似度の列に記憶される。
【0053】
ところで、図7に示すように、類似度格納部211にはコンテンツID1のコンテンツを検索キーとして関連検索をした際にコンテンツID2のコンテンツがダウンロードされた回数(ダウンロードリクエスト数)が記憶されている。コンテンツ間類似度算出の際の重み係数αはこのダウンロードリクエスト数に応じて、以下の式(2)により算出される(ステップS16)。
【0054】
【数2】

ただし、request(i)は、コンテンツiを検索キーとした検索リクエストがあった際に他のコンテンツのダウンロードがリクエストされたダウンロードリクエスト総数であり、request(i|simA>simB)は、ダウンロードリクエスト総数のうち、simA>simBを満たす組み合わせの数である。なお、αiの初期値を0.5としているが、これはダウンロードリクエストが閾値未満である場合には、simAとsimBとを同等に扱うことを意味している。このように、1つのリクエストによってαiが大きく変化しないようにリクエスト総数が閾値以上になるまではαi=0.5とする。αiの初期値は0.5以外の値でもよい。
【0055】
図7に示すコンテンツC0001の例では、C0002、C0003、C0004のコンテンツがそれぞれ50回、20回、30回ダウンロードされている。コンテンツC0001の関連コンテンツ検索からのダウンロードリクエスト総数100のうち、simA>simBとなるリクエスト数が20となるため、α=0.2となり、特徴量格納部209の重み係数αとして記憶される。αは各コンテンツに対し算出される値で、0に近づくほど利用状況の近いコンテンツが検索結果として返される。このように、αはダウンロードリクエスト数に応じて動的に変化させてもよい。
【0056】
次に、コンテンツの全組み合わせに対し、類似度算出部210がsimA、simB、αからコンテンツiとコンテンツjとの間のコンテンツ間類似度simi,jを、以下の式(3)により算出する。
【0057】
【数3】

算出されたコンテンツ間類似度は、類似度格納部211に記憶される。図7ではC0001のコンテンツ間類似度は、α=0.5として算出された値である。上記のようにダウンロードリクエスト数に応じてα=0.2に更新された場合、C0001からC0002、C0003、C0004への各類似度は0.82、0.46、0.68となりC0002、C0004との結びつきが強くなる。つまり、C0001からの関連度検索は状況類似依存傾向となる。
【0058】
検索サーバ20の検索部212は、携帯端末10からのリクエストを受信すると、受信したコンテンツIDに対して類似度格納部212に記憶された類似度の高い順にコンテンツが並び替えられたコンテンツリストを配信する。
【0059】
<実施例の効果>
本発明の実施例によれば、利用状況の類似性を考慮に入れてコンテンツ間の類似度を算出できる。例えば、ユーザが明示的に指定したお気に入りのコンテンツに対し、機能だけでなく似たような利用状況で用いられているコンテンツを提示でき、新たな発見を提供できる。また、ユーザの潜在的な目的に合ったコンテンツに少ない手順で到達できるようになり、クライアント端末、ネットワーク設備等のリソースの利用を低減できる。さらに、コンテンツ毎にメタデータと利用状況のどちらに依存した関連コンテンツが好まれるかが検索結果に反映されるため、不適切なコンテンツの出現を抑える効果がある。
【0060】
例えば、ニュースリーダと天気予報や、メディアプレーヤとブックリーダといった機能は異なるが、似たような利用状況で使われがちなコンテンツが関連付けられるようになり、明確なイメージはないが有用なコンテンツを探すといった目的に合致した検索ができる。
【0061】
更に、利用状況及びメタデータの双方を特徴ベクトル化することにより、ユーザが検索キーとして既知のコンテンツをサーバに知らせることで、サーバはそのコンテンツに対して代表的な利用状況及びメタデータの類似するコンテンツのリストを配信できる。
【0062】
更に、αを動的に変化させることで、検索キーに対して利用状況の類似度が高いコンテンツがダウンロードされれば利用状況の類似度の重みを上げ、メタデータの類似度が高いコンテンツがダウンロードされればメタデータの類似度の重みを上げることができる。このため、利用状況に特徴のあるコンテンツと機能に特徴のあるコンテンツのどちらにも対応できる。
【0063】
更に、起動回数の多い順に利用履歴をソートして、SVMにより利用状況特徴ベクトルを生成することで、起動回数の多い利用状況を強く反映したコンテンツに代表的な利用状況を算出できる。
【0064】
説明の便宜上、本発明の実施例に係るコンテンツ間類似度算出装置は機能的なブロック図を用いて説明しているが、本発明のコンテンツ間類似度算出装置は、ハードウェア、ソフトウェア又はそれらの組み合わせで実現されてもよい。例えば、コンテンツ間類似度算出装置の各機能部がソフトウェアで実現され、コンピュータ内に実現されてもよい。また、2以上の実施例及び実施例の各構成要素が必要に応じて組み合わせて使用されてもよい。
【0065】
以上、本発明の実施例について説明したが、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において、種々の変更・応用が可能である。
【符号の説明】
【0066】
10 携帯端末
101 利用履歴送信部
102 利用履歴格納部
103 利用履歴取得部
104 現在地取得部
105 検索部
20 検索サーバ
201 利用履歴受信部
202 エリア情報取得部
203 利用履歴集計部
204 メタデータ格納部
205 特徴語抽出部
206 メタデータ特徴ベクトル化部
207 利用履歴格納部
208 利用状況特徴ベクトル化部
209 特徴量格納部
210 類似度算出部
211 類似度格納部
212 検索部

【特許請求の範囲】
【請求項1】
コンテンツ間の類似度を算出するコンテンツ間類似度算出装置であって、
コンテンツが携帯端末で起動したときの利用履歴を携帯端末から受信する利用履歴受信部と、
前記利用履歴受信部で受信した利用履歴を、予め設定された利用状況に集計する利用履歴集計部と、
前記利用履歴集計部で集計された利用履歴から、コンテンツ毎に利用状況の特徴ベクトルを生成する利用状況特徴ベクトル化部と、
利用状況の特徴ベクトルに基づいて、コンテンツ間の類似度を算出する類似度算出部と、
を有するコンテンツ間類似度算出装置。
【請求項2】
コンテンツのメタデータに含まれる単語に基づいて、コンテンツ毎にメタデータの特徴ベクトルを生成するメタデータ特徴ベクトル化部を更に有し、
前記類似度算出部は、利用状況の特徴ベクトルから利用状況の類似度を算出し、メタデータの特徴ベクトルからメタデータの類似度を算出し、利用状況の類似度とメタデータの類似度とを重み付けることにより、コンテンツ間の類似度を算出する、請求項1に記載のコンテンツ間類似度算出装置。
【請求項3】
前記類似度算出部は、コンテンツ間の類似度に基づいてコンテンツがダウンロードされた回数に基づいて、利用状況の類似度とメタデータの類似度との重み付けに用いられる重み付け係数を算出する、請求項2に記載のコンテンツ間類似度算出装置。
【請求項4】
前記利用状況特徴ベクトル化部は、コンテンツ毎に起動回数の多い順に利用状況を並び替えて特徴ベクトルを生成する、請求項1乃至3のうちいずれか1項に記載のコンテンツ間類似度算出装置。
【請求項5】
前記利用履歴集計部は、前記利用履歴受信部で受信した利用履歴を、コンテンツが携帯端末で起動したときの利用時間帯又は利用時間の長さ毎に集計する、請求項1乃至4のうちいずれか1項に記載のコンテンツ間類似度算出装置。
【請求項6】
前記利用履歴受信部で受信した利用履歴から、コンテンツが携帯端末で起動したときのエリアを取得するエリア情報取得部を更に有し、
前記利用履歴集計部は、前記利用履歴受信部で受信した利用履歴を、エリア毎に集計する、請求項1乃至5のうちいずれか1項に記載のコンテンツ間類似度算出装置。
【請求項7】
携帯端末からコンテンツの検索リクエストを受信した場合、類似度の高い順にコンテンツが並び替えられたリストを生成するコンテンツ検索部を更に有する、請求項1乃至6のうちいずれか1項に記載のコンテンツ間類似度算出装置。
【請求項8】
コンテンツ間の類似度を算出するコンテンツ間類似度算出装置におけるコンテンツ間類似度算出方法であって、
コンテンツが携帯端末で起動したときの利用履歴を携帯端末から受信するステップと、
前記利用履歴受信部で受信した利用履歴を、予め設定された利用状況に集計するステップと、
前記利用履歴集計部で集計された利用履歴から、コンテンツ毎に利用状況の特徴ベクトルを生成するステップと、
利用状況の特徴ベクトルに基づいて、コンテンツ間の類似度を算出するステップと、
を有するコンテンツ間類似度算出方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−14518(P2012−14518A)
【公開日】平成24年1月19日(2012.1.19)
【国際特許分類】
【出願番号】特願2010−151168(P2010−151168)
【出願日】平成22年7月1日(2010.7.1)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WINDOWS
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】