説明

ランドマーク推薦装置及び方法及びプログラム

【課題】 動作主が好む、位置座標以外のランドマークの特徴に基づいて、ランドマークを推薦する。
【解決手段】 本発明は、位置座標の近さ以外で複数のランドマークを潜在的に結びつける特徴(潜在トピック)の存在を仮定して、動作主が各潜在トピックに対して興味を持つ確率値θ(ユーザ固有トピック出現確率)と潜在トピックから各ランドマークが選択される確率値φ(トピック固有ランドマーク存在確率)を学習し、これらの確率値、動作主の移動履歴情報、ランドマーク情報とから算出される、動作主がランドマークを訪問する確率値に基づいて、動作主に対してランドマークを推薦する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ランドマーク推薦装置及び方法及びプログラムに係り、個人の移動履歴情報に基づいて、その人が将来的に訪れるランドマークを予測し、推薦するためのランドマーク推薦装置及び方法及びプログラムに関する。
【背景技術】
【0002】
従来技術1として、動作主がランドマークを訪れた移動履歴情報の集合を学習データとして、トピックモデルを用いて動作主の行動をモデリングし、動作主が次に訪れるランドマークを予測する方法がある。トピックモデルにおいては、学習データが"ある動作主が訪れる各場所は、ユーザ固有のトピック比率に従ってある潜在トピックを選択した後、その潜在トピックに固有のランドマーク出現確率分布に従って生成された"と仮定して、動作主の行動を確率モデルで表現することで、次に訪れる地点を予測する(例えば、非特許文献1、非特許文献2参照)。
【0003】
また、従来技術2として、例えば、複数人に関する移動履歴情報集合の全体傾向からランドマーク間の遷移のしやすさをマルコフモデルでモデル化することで、動作主が次に訪れるランドマークを予測する方法がある(例えば、非特許文献3参照)。
【0004】
なお、ランドマークとは、位置座標(緯度・経度など)に関連づけられた建物、寺社・仏閣、レストラン、商業施設などを意味する総称とする。
【0005】
また、従来技術3として、上記の従来技術2のトピックモデルと、前記従来技術1のマルコフモデルの二項演算による行動モデルで、次に行く場所を予測・推薦する技術も存在する(例えば、非特許文献4参照)。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】T. Hofmann. Probabilistic Latent Semantic Analysis , in Proc. Conf. on Uncertainty in Artificial Intelligence (UAI), pp. 289-296 (1999).
【非特許文献2】D.M. Baei, A.Y. Ng, and M.I. Jordan. Latent Dirichlet Allocation, in Journal of Machine Learning Research (JMLR), vol. 3, pp. 993-1022 (2003).
【非特許文献3】D. Ashbrook and T. starner, Uing GPS to Learn Significant Locations and Predict Movement Across Multiple Users, in Personal and ubiquitous computing, Vol.7, No. 5, pp.275-286 (2003).
【非特許文献4】「写真サイトにおけるジオタグ情報を利用したとラベルルート推薦」、信学技報, Vol. 109, No.450, LOIS2009-88, pp. 55-60, 2010年3月.
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記従来技術2は、ランドマーク間の推移をマルコフモデルでモデル化しており、過去に多くの人が辿った順に推薦する手法であるため、アートに関するランドマークによく行く人には美術館を、スポーツに関するランドマークによく行く人には野球場を推薦するといった、個人の興味に応じた推薦をすることができなかった。
【0008】
また、従来技術1であるトピックモデルを用いた手法においては、東京駅周辺のランドマークがひとつの潜在トピックになってしまうなど、位置座標が近いランドマーク集合をまとめるものとして潜在トピックが推定されてしまう。つまり、「アート」、「スポーツ」、「人気」、「おしゃれ」といった位置座標の近さ以外のランドマークの"特徴"でつながるランドマーク集合を含む潜在トピックを推定できなかった。その結果、過去に訪問したランドマークから位置的に近いランドマークしか推薦されないという問題があった。さらに、一度も訪問したことのない(移動履歴のない)エリア内のランドマークを推薦する際には、過去の移動履歴の傾向に基づく推薦が不可能であった。
【0009】
さらに、従来技術3において、マルコフモデルはトピックモデル以上に、過去に訪問したランドマークから位置的に近いランドマークを推薦する傾向が強いため、トピックモデルが抱えていた「過去に訪問したランドマークから位置的に近いランドマークしか推薦されない」問題を解消するには至らなかった。
【0010】
本発明は、上記の点に鑑みなされたものであり、動作主が好む、「アート」、「スポーツ」、「人気」、「おしゃれ」といった位置座標の近さ以外のランドマークの"特徴"をもとにランドマークの推薦を可能とするためのランドマーク推薦装置及び方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
上記の課題を解決するために、本発明(請求項1)は、複数人の移動履歴に基づいて動作主が次に各ランドマークを訪問する確率を算出するためのランドマーク推薦装置であって、
前記複数人の移動履歴が「動作主が訪れるランドマークは、動作主固有のトピック比率に従って位置の近さ以外のランドマークの特徴を表すある潜在トピックを選択した後、その潜在トピック、及び、動作主の行動領域に固有のランドマーク出現確率分布に従って生成した」という仮定のもと、前記位置の近さ以外のランドマークの特徴を表す潜在トピックを、動作主が選択する確率であるユーザ固有トピック出現確率と、位置の近さ以外のランドマークの特徴を表す潜在トピックからのランドマークの選択されやすさを示すトピック固有ランドマーク存在確率を、最尤法を用いて学習し、学習後のユーザ固有トピック出現確率をユーザ固有トピック出現確率記憶手段に、トピック固有ランドマーク存在確率をトピック固有ランドマーク存在確率記憶手段に格納する潜在変数推定手段を有する。
【0012】
また、本発明(請求項2)は、外部から入力された、または、前記複数人の移動履歴から取得したある特定移動履歴に関して、
前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率に基づいて、前記位置の近さ以外のランドマークの特徴を表す潜在トピックからの選択されやすさを示す該トピック固有ランドマーク存在確率が高いランドマークほど、また、前記特定移動履歴に含まれる各ランドマークから位置が近いランドマークほど、存在確率が高くなるトピック・空間領域固有ランドマーク存在確率を算出するトピック・空間領域固有ランドマーク存在確率算出手段と、
外部から入力された、または、前記複数人の移動履歴から特定したある特定動作主に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック・空間領域固有ランドマーク存在確率算出手段で算出した前記トピック・空間領域固有ランドマーク存在確率との二項演算で、前記特定動作主があるランドマークを訪問する確率を求めるユーザ履歴固有ランドマーク存在確率算出手段と、
を更に有する。
【0013】
また、本発明(請求項3)は、外部から入力された、または、前記複数人の移動履歴から特定したある特定動作主に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率との二項演算で、前記特定動作主があるランドマークを訪問する確率を求めるユーザ固有ランドマーク存在確率算出手段を更に有する。
【0014】
本発明(請求項4)は、複数人の移動履歴に基づいて動作主が次に各ランドマークを訪問する確率を算出するためのランドマーク推薦方法であって、
移動履歴情報を格納した移動履歴情報格納装置及びランドマークの識別子及び位置情報を含むランドマーク情報を格納したランドマーク情報格納装置と接続されるランドマーク推薦装置において、
潜在変数推定手段が、前記移動履歴格納装置から取得する前記複数人の移動履歴が「動作主が訪れるランドマークは、動作主固有のトピック比率に従って位置の近さ以外のランドマークの特徴を表すある潜在トピックを選択した後、その潜在トピック、及び、動作主の行動領域に固有のランドマーク出現確率分布に従って生成した」という仮定のもと、該位置の近さ以外のランドマークの特徴を表す潜在トピックを動作主が選択する確率であるユーザ固有トピック出現確率と、位置の近さ以外のランドマークの特徴を表す潜在トピックからのランドマークの選択されやすさを示すトピック固有ランドマーク存在確率を、前記移動履歴格納装置から取得した複数人の移動履歴を学習データとし、最尤法を用いて学習し、該ユーザ固有トピック出現確率をユーザ固有トピック出現確率記憶手段に、該トピック固有ランドマーク存在確率をトピック固有ランドマーク存在確率記憶手段に格納する潜在変数推定ステップを行う。
【0015】
また、本発明(請求項5)は、トピック・空間領域固有ランドマーク存在確率算出手段が、
外部から入力された、または、前記複数人の移動履歴から取得したある特定移動履歴に関して、
前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率に基づいて、前記位置の近さ以外のランドマークの特徴を表す潜在トピックからの選択されやすさを示す該トピック固有ランドマーク存在確率が高いランドマークほど、また、前記特定移動履歴に含まれる各ランドマークから位置が近いランドマークほど、存在確率が高くなるトピック・空間領域固有ランドマーク存在確率を算出するトピック・空間領域固有ランドマーク存在確率算出ステップと、
ユーザ履歴固有ランドマーク存在確率算出手段が、
外部から入力された、または、前記複数人の移動履歴から特定したある特定動作主に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック・空間領域固有ランドマーク存在確率算出ステップで算出した前記トピック・空間領域固有ランドマーク存在確率との二項演算で前記特定動作主があるランドマークを訪問する確率を求めるユーザ履歴固有ランドマーク存在確率算出ステップと、を更に行う法。
【0016】
また、本発明(請求項6)は、ユーザ固有ランドマーク存在算出手段が、
外部から入力された、または、前記複数人の移動履歴から特定したある特定動作に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率との二項演算で、前記特定動作主があるランドマークを訪問する確率を求めるユーザ固有ランドマーク存在確率算出ステップを更に行う。
【0017】
本発明(請求項7)は、請求項1乃至3のいずれか1項に記載のランドマーク推薦装置を構成する各手段としてコンピュータを機能させるためのランドマーク推薦プログラムである。
【発明の効果】
【0018】
上記のように本発明によれば、"動作主が訪れるランドマークは、ユーザ固有のトピック比率に従ってある潜在トピックを選択した後、その潜在トピックと動作主が過去に訪れたランドマークの位置座標集合とに固有のランドマーク出現確率分布に従って決定した"という仮定に基づく行動モデルを生成し、その行動モデルを用いて、動作主の興味に応じたランドマーク推薦が可能である。この行動モデルは、従来手法(トピックモデル)と異なり、動作主が過去に訪れたランドマークの位置座標集合との近さを考慮して学習する特徴がある。これにより、"位置的な近さ"に依存しないランドマークの特徴("カテゴリ"や"雰囲気"や"位置的な近さ"といった特徴要素の中から"位置的な近さ"の影響を抜いたその他の要素("カテゴリ"や"雰囲気"など))を扱うものとして潜在トピックが推定可能となる。また、潜在トピックが"位置的な近さ"以外のランドマークの特徴を扱うため、過去に訪れたことのない場所に行ったときも、動作主が好む位置以外のランドマークの特徴を用いて動作主の嗜好に合致したランドマークを推薦することが可能となる。
【図面の簡単な説明】
【0019】
【図1】本発明の第1の実施の形態におけるランドマーク推薦装置のブロック図である。
【図2】本発明の第1の実施の形態におけるトピック・空間領域固有ランドマーク存在確率算出部のフローチャートである。
【図3】本発明の第1の実施の形態におけるユーザ履歴固有ランドマーク存在確率算出部のフローチャートである。
【図4】本発明の第1の実施の形態における移動履歴情報格納装置に格納されている情報の一例である。
【図5】本発明の第1の実施の形態におけるランドマーク情報格納装置に格納されているランドマーク情報の一例である。
【図6】本発明の第1の実施の形態におけるユーザ履歴固有ランドマーク存在確率算出部及びユーザ固有ランドマーク存在確率算出部の動作を説明するための図である。
【図7】本発明の第1の実施の形態における検索部への検索例と出力部からの出力例である。
【図8】本発明の第2の実施の形態におけるランドマーク推薦装置のブロック図である。
【発明を実施するための形態】
【0020】
[第1の実施の形態]
以下、本装置の第1の形態について図面を参照して説明する。
【0021】
図1は、本発明の第1の実施の形態におけるランドマーク推薦装置のブロック図を示す。
【0022】
同図に示すランドマーク推薦装置10は、操作部11、検索部12、潜在変数推定部14、ユーザ固有トピック出現確率格納部15、トピック固有ランドマーク存在確率格納部16、トピック・空間領域固有ランドマーク存在確率算出部17、ユーザ履歴固有ランドマーク存在確率算出部18、出力部19から構成されている。このうち、操作部11、潜在変数推定部14、トピック・空間領域固有ランドマーク存在確率算出部17は、外部の移動履歴情報格納装置1、及び、ランドマーク情報格納装置2と接続されている。
【0023】
移動履歴情報格納装置1は、ランドマーク推薦装置10から解析され得る移動履歴情報を格納しており、ランドマーク推薦装置10からの要求に従って、移動履歴情報を読み出し、当該情報をランドマーク推薦装置10に送信する。いま、動作主をuで、ランドマークをiで表すと、動作主uの移動履歴情報は、
【0024】
【数1】

で表すことができる。τは、動作主uが過去に訪問したことのある全ランドマーク数である。移動履歴情報格納装置1は、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
【0025】
ランドマーク情報格納装置2は、ランドマーク推薦装置10から解析され得るランドマーク情報を格納しており、ランドマーク推薦装置10からの要求に従って、ランドマーク情報を読み出し、当該情報をランドマーク推薦装置に送信する。各ランドマーク情報は、例えば、ランドマークを一意に識別するためのID、ランドマークの名称、位置座標(緯度・経度)から成る情報である。ランドマーク情報格納装置2は、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
【0026】
なお、移動履歴情報格納装置1に格納された移動履歴情報とランドマーク情報格納装置2に格納されたランドマーク情報とから、ランドマークIDを介して、動作主uが過去に訪問したランドマークの位置座標集合
【0027】
【数2】

を求めることもできる。riは、ランドマークiの位置情報(緯度・経度)である。
【0028】
操作部11は、移動履歴情報格納装置1、及びランドマーク情報格納装置2のデータに対するユーザからの各種操作を受け付ける。各種操作とは、格納された情報を登録、修正、削除する操作等である。また、操作部11は、ランドマーク情報格納装置2に格納されたランドマーク情報10を装置のユーザに提示することも可能である。ユーザは、提示された情報の中から単一、もしくは、複数の代表地点を選択することで、推薦を行う対象となる動作主に関する移動履歴情報として登録することが可能である。操作部11の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。操作部11は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
【0029】
検索部12は、推薦を行う対象となる動作主uに関する情報と、潜在変数推定部14で用いる各種パラメータを受け付ける。動作主uに関する情報は、移動履歴情報格納装置1に格納されている動作主u∈Uを一意に識別するID等の推薦対象動作主に関する情報と、移動履歴情報格納装置1に格納された移動履歴と同形式の移動履歴である。検索部12で指定された動作主に対して、検索部12で指定された移動履歴に基づいてランドマークの推薦を行う。検索部12で指定された移動履歴と、検索部12で指定された動作主uに関して既に移動履歴情報格納装置1に格納された移動履歴が同一の場合は、例えば、既にランドマーク"1","2","3"に訪れたことがある動作主に対して、ランドマーク"1","2","3"から近いランドマークを推薦するといった推薦が可能となる。また、検索部12で指定された動作主uに関して移動履歴情報格納装置1に格納された移動履歴が同一ではない場合は、例えば、すでにランドマーク"1","2","3"に訪れたことがある動作主に対して、現在地であるランドマーク"4"から近いランドマークを推薦するといった推薦が可能となる。なお、移動履歴は省略可能であり、省略された場合は、指定された動作主IDに関して、すでに移動履歴情報格納装置1に格納されている過去の移動履歴が指定されたものとして扱う。一方、動作主を特定する情報も省略可能であり、動作主を特定する情報が省略され、移動履歴情報そのものが入力された場合、移動履歴情報格納装置1に格納されたデータの中で、受け付けた移動履歴と最も類似性が高い動作主u∈Uが指定されたものとする。類似性を測る指標としては、例えば、コサイン尺度や内積があるが、何を用いても良い。なお、検索部12の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。検索部11は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
【0030】
ランドマーク存在確率算出部13は、潜在変数推定部14、ユーザ固有トピック出現確率格納部15、トピック固有ランドマーク存在確率格納部16、トピック・空間領域固有ランドマーク存在確率算出部17、ユーザ履歴固有ランドマーク存在確率算出部18から成る。
【0031】
ランドマーク存在確率算出部13は、移動履歴情報格納装置1(とランドマーク情報格納装置2)のデータから学習し、ある動作主uがランドマークiに存在する確率を算出する。本装置は、"動作主uが訪れるランドマークiは、ユーザ固有のトピック比率に従ってある潜在トピックzを選択した後、その潜在トピックzと動作主uに関する位置座標集合Ruに固有のランドマーク出現確率分布に従って決定した"という仮定に基づく行動モデルである。つまり、潜在トピック数Zが与えられたもとで、動作主uがランドマークiに存在する確率P(i|u)を以下の式で計算する。
【0032】
【数3】

ここで、変数zは、例えば「スポーツ」、「アート」、「人気」、「おしゃれ」などの潜在トピックを表すために用意された変数である。P(z|u)=θuzは、動作主の興味を表し、動作主uが潜在トピックzに興味を持つ確率値である。また、P(i│z, Ru)は、潜在トピックzにおいてランドマークiが選択されるトレンドP(i|z) =φziと、ユーザuの位置座標集合Ruとの近さから導かれたランドマーク存在確率値である。P(i│z, Ru)は、潜在トピックzから支持されているランドマークほど、また、動作主uが過去に訪れた位置座標集合r∈Ruと位置座標の近いランドマークほど、そのランドマーク出現確率が高くなるように計算する。例えば、P(i│z, Ru)は以下の式で計算することができる。
【0033】
【数4】

なお、変数βはガウス分布の形状を決定するパラメータであり、正規分布の分散をσ2とすると
【0034】
【数5】

である。P(i|z) =φziは、潜在トピックにおけるトレンドを示しており、例えば、潜在トピックが「アート」の場合は、「東京▽▼美術館」や「京都●○美術館」などのアートに関連するランドマークの出現確率が高くなる。
【0035】
従って、P(i│z, Ru)は、例えば、潜在トピックが「アート」で、かつ、動作主の位置座標集合が「京都市周辺」に集中していた場合に、「京都●○美術館」や「京都▲△ギャラリー」などの京都近辺のランドマークの出現確率が高くなる。なお、潜在トピックzは典型的には「スポーツ」や「アート」などのトピックを表すために用意された変数であるが、その変数が実際にどのようなトピックを表すかは不明でよい。
【0036】
潜在変数推定部14は、検索部12で受け付けたパラメータである潜在トピック数Zと、ガウス分布に関するパラメータβを受け付け、移動履歴情報格納装置1に格納された動作主uがランドマークiを訪れた情報を学習データとし、これらの学習データが、"動作主uが訪れるランドマークiは、ユーザ固有のトピック比率に従ってある潜在トピックzを選択した後、その潜在トピックzと動作主uに関する位置座標集合Ruに固有のランドマーク出現確率分布に従って生成された"と仮定した上で、動作主uが潜在トピックzに興味を持つ確率値であるθuz、及び、潜在トピックzからランドマークiが選択される確率値であるφziを学習する。これらの未知パラメータは、EMアルゴリズムを用いて求めることができる。EMアルゴリズムは、以下の対数尤度を最大化することにより未知パラメータを推定する手法である。
【0037】
【数6】

動作主uの集合をU、動作主uが過去に訪れたランドマークの個数をMu、動作主uがm番目に訪れたランドマークをiumとする。なお、位置座標集合Ruは、式(2)により、移動履歴情報格納装置1とランドマーク情報格納装置2に格納されたランドマーク情報とに基づいて求めることができる。
【0038】
EMアルゴリズムは、最初にθuzとφziに適当な初期値を与える。次に、θuzとφziが収束するまで以下のE-stepとM-stepを繰り返す。
【0039】
E-stepにおいては、現在のθuzとφziに関する推定値が与えられたもとでの、トピック事後確率をベイス則に従い計算する。
【0040】
【数7】

そして、式(6)で求めたP(z|u,m)を含むQ関数を以下のように定義する。
【0041】
【数8】

M-stepでは、式(7)のQ関数を最大化する、新たなθuzとφziを求める。θuzに関しては、
【0042】
【数9】

を解き、Q関数をθuzに関して最大化することで求めることができる。
【0043】
【数10】

φziに関しては、閉形式で直接求めることができないため、準ニュートン法等の最適化手法を用いてQ関数を最大化して求める。φziに関する勾配ベクトルは、以下の通りである。
【0044】
【数11】

ユーザ固有トピック出現確率格納部15は、潜在変数推定部14で求めた動作主uが潜在トピックzに興味を持つ確率値であるθuzを格納する。ユーザ固有トピック出現確率格納部15は、これらの情報が保存され、復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
【0045】
トピック固有ランドマーク存在確率格納部16は、潜在変数推定部14で求めた潜在トピックzからランドマークiが選択される確率値であるφziを格納する。トピック固有ランドマーク存在確率格納部16は、これらの情報が保存され、復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
【0046】
トピック・空間領域固有ランドマーク存在確率算出部17は、検索部12で指定された動作主uに関する情報、トピック固有ランドマーク存在確率格納部16に格納されたφzi、移動履歴情報格納装置1に格納された移動履歴情報、ランドマーク情報格納装置2に格納されたランドマーク情報に基づいて、潜在トピックとユーザuの位置座標集合Ruに関するランドマークのトレンドを表現する確率値P(i│z, Ru)を求める。ここで、ユーザuは検索部12で指定された動作主であり、位置座標集合Ruは検索部12で指定された移動履歴情報に関する位置座標集合である。検索部12で指定された動作主uに関するトピック・空間領域固有ランドマーク存在確率
【0047】
【数12】

を求めるフローチャートを図2に示す。
【0048】
ユーザ履歴固有ランドマーク存在確率算出部18は、ユーザ固有トピック出現確率格納部15に格納された動作主uが潜在トピックzに興味を持つ確率値であるθuzと、トピック・空間領域固有ランドマーク存在確率算出部17の結果P(i│z, Ru)に基づき、動作主uがランドマークiに存在する確率値を計算する。前記の通り、本装置においては、ある位置座標集合Ruで表わされる行動領域を持つ動作主が訪れる各ランドマークは、ユーザ固有のトピック比率に従ってあるトピックを選択した後、そのトピックと位置座標集合Ruに固有のランドマーク出現確率分布に従って生成されると仮定して、式(3)でP(i|u)を算出する。検索部12で指定された動作主uに関するユーザ履歴固有ランドマーク存在確率
【0049】
【数13】

を求めるフローチャートを図3に示す。
【0050】
出力部19は、ユーザ履歴固有ランドマーク存在確率算出部18の結果に基づき、検索部12で指定されたユーザが存在する確率値の高い順にランドマークを出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部19は、ディスプレイやスピーカ等の出力デバイスを含むと考えても含まないと考えてもよい。出力部19は、出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。
【0051】
以下、具体的な例を用いて実施の形態の処理について説明する。図4に本発明の実施の形態における移動履歴情報格納装置1に格納されている情報の一例を示す。例えば、図4に示すように、移動履歴情報格納装置1に格納された情報から、動作主IDがU1とU2の動作主の移動履歴情報は以下のようになる。
【0052】
hU1={L1,L2,L3,L4}
hU2={L1,L2,L5}
図5に本発明の実施の形態におけるランドマーク情報格納装置2に格納されているランドマーク情報の一例を示す。動作主IDがU1とU2の動作主の位置座標集合は以下のようになる。
【0053】
RU1={<35.6, 139.7>, <34.9, 135.7>, <35.7, 139.7>, <35.4, 139.6>}
RU2={<35.6, 139.7>, <34.9, 135.7>, <34.6, 135.4>,}
図6に本発明の実施の形態における基本的な動作の一例を示す。図中の位置座標空間において、ある動作主が過去に訪問したランドマークの図形は塗りつぶし図形で、未訪問のランドマークは塗りつぶしなし図形で示してある。また、全潜在トピック数は3であるとし、それぞれのトピックに含まれやすいランドマークをそれぞれ丸、四角、三角で示してある。厳密には、本装置により、潜在トピック固有のランドマーク出現確率を算出できるため、各ランドマークは複数の潜在トピックから同程度に支持される可能性もあるが、説明の簡略化のため、各ランドマークはいずれかの潜在トピックに含まれるとして説明を進める。また、図形内の数値はランドマークIDである。つまり、動作主はランドマーク"1"から"3"に過去に訪問したことがある。また検索部12で指定された移動履歴情報としてランドマーク1からランドマーク3が指定されたとする。本装置は、式(4)により、過去に訪問したランドマークから近いランドマークほど高いスコアを与える。図6の点線丸は、ガウス分布のパラメータβで指定される範囲である。つまり、図6においては、ランドマーク"4","5","7","8","9","10","11"のスコアが高くなる。また、本装置においては、動作主が支持する潜在トピックに含まれるランドマークほどスコアが高くなる。つまり、図6においては、丸で示してあるランドマーク"7"、"8"、"9"、"14"のスコアが高くなる。最終的に、その2つの要素を加味して推薦するランドマークが決定する。図6の例においては、過去に訪問したランドマークに近く、かつ、潜在トピックも近いランドマーク"7","8","9"の値が高くなる。本例における検索部12、及び出力部19の例を図7に示す。なお、検索部12で指定された移動履歴情報として、ランドマーク"1"からランドマーク"3"以外の現在地ランドマーク"0"を指定すると、本装置は、現在地ランドマーク"0"に近く、かつ、ランドマーク"1"から"3"に訪れたことがあるという事実から推定した動作主の潜在トピック(丸図)に含まれるランドマークを推薦することができる。
[第2の実施の形態]
以下、本装置の第2の形態について図面を参照して説明する。
【0054】
図8は、本発明の第2の実施の形態におけるランドマーク推薦装置のブロック図を示す。
同図において、図1と同一構成部分には同一符号を付し、その説明を省略する。
【0055】
同図に示すランドマーク推薦装置10は、操作部11、検索部12、潜在変数推定部14、ユーザ固有トピック出現確率格納部15、トピック固有ランドマーク存在確率格納部16、出力部19、ユーザ固有ランドマーク存在確率算出部20から構成されている。このうち、操作部11、潜在変数推定部14は、外部の移動履歴情報格納装置1、及び、ランドマーク情報格納装置2と接続されている。
【0056】
検索部12は、移動履歴情報格納装置1に格納されている動作主u∈Uを一意に識別するID等の推薦対象動作主に関する情報と、潜在変数推定部14で用いる各種パラメータを受け付ける。なお、一方、動作主を特定する情報の代わりに、移動履歴情報そのものを受け付けることもできる。その場合、移動履歴情報格納装置1に格納されたデータの中で、受け付けた移動履歴と最も類似性が高い動作主u∈Uが指定されたものとする。類似性を測る指標としては、例えば、コサイン尺度や内積があるが、何を用いても良い。なお、検索部12の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。検索部12は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
【0057】
ユーザ固有ランドマーク存在確率算出部20は、ユーザ固有トピック出現確率格納部15に格納された動作主uが潜在トピックzに興味を持つ確率値であるθuzと、トピック固有ランドマーク存在確率格納部16に格納された潜在トピックzからランドマークiが選択される確率φziに基づき、検索部12で指定された動作主uがランドマークiに存在する確率値を計算する。第二の実施の形態においては、動作主uが訪れる各ランドマークは、ユーザ固有のトピック比率に従ってあるトピックを選択した後、そのトピックに固有のランドマーク出現確率分布に従って生成されると仮定して、式(10)でP(i|u)を算出する。
【0058】
【数14】

式(10)により、動作主の行動領域Ruとの近さではなく、純粋な興味トピックのみに基づくランドマーク推薦が可能となる。
【0059】
以下、具体的な例を用いて実施の形態の処理について説明する。
ここでは図6とまったく同様の状況で本実施の形態に基づく推薦を行う場合を考える。
式(10)は、ユーザが訪れたランドマークの位置座標集合Ruとの近さを考慮しない。つまり、ユーザが過去に訪れたランドマーク1から3が丸で示される潜在トピックに含まれるという情報のみから、図6の丸で示される潜在トピックに含まれる他のランドマーク"7","8","9","14"を推薦する。これらのランドマークが推薦される順位は、潜在トピック固有のランドマーク出現確率に依存し、例えば、丸で示されるトピック固有のランドマーク出現確率がランドマーク"8">"9">"7">"14"であれば、"8"、"9"、"7"、"14"の順で推薦が行われる。
【0060】
本実施の形態における検索部12、及び出力部19の例は図7と同様であるが、ユーザIDと移動履歴情報のいずれか一方を指定する点が第1の実施形態とは異なる。
【0061】
つまり、第2の実施の形態により、位置には依存しないランドマークの特徴などを扱う潜在トピックに基づいて、位置には依存しない動作主の興味に基づくランドマークの推薦が可能となる。
【0062】
第2の実施の形態においては、位置には依存しない動作主の興味に基づくランドマークの推薦が可能なため、旅行など一度も訪れたことのないエリアを訪れた場合でも、潜在的な興味に基づいた推薦が可能となる。
【0063】
なお、上記の図1、図8のランドマーク推薦装置の構成要素の動作をプログラムとして構築し、ランドマーク推薦装置として利用されるコンピュータにインストールする、または、ネットワークを介して流通させることが可能である。
【0064】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0065】
1 移動履歴情報格納装置
2 ランドマーク情報格納装置
10 ランドマーク推薦装置
11 操作部
12 検索部
13 ランドマーク存在確率算出部
14 潜在変数推定部
15 ユーザ固有トピック出現確率格納部
16 トピック固有ランドマーク存在確率格納部
17 トピック・空間領域固有ランドマーク存在確率算出部
18 ユーザ履歴固有ランドマーク存在確率算出部
19 出力部
20ユーザ固有ランドマーク存在確率算出部

【特許請求の範囲】
【請求項1】
複数人の移動履歴に基づいて動作主が次に各ランドマークを訪問する確率を算出するためのランドマーク推薦装置であって、
前記複数人の移動履歴が「動作主が訪れるランドマークは、動作主固有のトピック比率に従って位置の近さ以外のランドマークの特徴を表すある潜在トピックを選択した後、その潜在トピック、及び、動作主の行動領域に固有のランドマーク出現確率分布に従って生成した」という仮定のもと、前記位置の近さ以外のランドマークの特徴を表す潜在トピックを動作主が選択する確率であるユーザ固有トピック出現確率と、位置の近さ以外のランドマークの特徴を表す潜在トピックからのランドマークの選択されやすさを示すトピック固有ランドマーク存在確率を、最尤法を用いて学習し、学習後のユーザ固有トピック出現確率をユーザ固有トピック出現確率記憶手段に、トピック固有ランドマーク存在確率をトピック固有ランドマーク存在確率記憶手段に格納する潜在変数推定手段
を有することを特徴とするランドマーク推薦装置。
【請求項2】
外部から入力された、または、前記複数人の移動履歴から取得したある特定移動履歴に関して、
前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率に基づいて、前記位置の近さ以外のランドマークの特徴を表す潜在トピックからの選択されやすさを示す該トピック固有ランドマーク存在確率が高いランドマークほど、また、前記特定移動履歴に含まれる各ランドマークから位置が近いランドマークほど、存在確率が高くなるトピック・空間領域固有ランドマーク存在確率を算出するトピック・空間領域固有ランドマーク存在確率算出手段と、
外部から入力された、または、前記複数人の移動履歴から特定したある特定動作主に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック・空間領域固有ランドマーク存在確率算出手段で算出した前記トピック・空間領域固有ランドマーク存在確率との二項演算で、前記特定動作主があるランドマークを訪問する確率を求めるユーザ履歴固有ランドマーク存在確率算出手段と、
を更に有する請求項1記載のランドマーク推薦装置。
【請求項3】
外部から入力された、または、前記複数人の移動履歴から特定したある特定動作主に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率との二項演算で、前記特定動作主があるランドマークを訪問する確率を求めるユーザ固有ランドマーク存在確率算出手段
を更に有する請求項1記載のランドマーク推薦装置。
【請求項4】
複数人の移動履歴に基づいて動作主が次に各ランドマークを訪問する確率を算出するためのランドマーク推薦方法であって、
移動履歴情報を格納した移動履歴情報格納装置及びランドマークの識別子及び位置情報を含むランドマーク情報を格納したランドマーク情報格納装置と接続されるランドマーク推薦装置において、
潜在変数推定手段が、前記移動履歴格納装置から取得する前記複数人の移動履歴が「動作主が訪れるランドマークは、動作主固有のトピック比率に従って位置の近さ以外のランドマークの特徴を表すある潜在トピックを選択した後、その潜在トピック、及び、動作主の行動領域に固有のランドマーク出現確率分布に従って生成した」という仮定のもと、該位置の近さ以外のランドマークの特徴を表す潜在トピックを動作主が選択する確率であるユーザ固有トピック出現確率と、位置の近さ以外のランドマークの特徴を表す潜在トピックからのランドマークの選択されやすさを示すトピック固有ランドマーク存在確率を、前記移動履歴格納装置から取得した複数人の移動履歴を学習データとし、最尤法を用いて学習し、該ユーザ固有トピック出現確率をユーザ固有トピック出現確率記憶手段に、該トピック固有ランドマーク存在確率をトピック固有ランドマーク存在確率記憶手段に格納する潜在変数推定ステップ
を行うことを特徴とするランドマーク推薦方法。
【請求項5】
トピック・空間領域固有ランドマーク存在確率算出手段が、
外部から入力された、または、前記複数人の移動履歴から取得したある特定移動履歴に関して、
前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率に基づいて、前記位置の近さ以外のランドマークの特徴を表す潜在トピックからの選択されやすさを示す該トピック固有ランドマーク存在確率が高いランドマークほど、また、前記特定移動履歴に含まれる各ランドマークから位置が近いランドマークほど、存在確率が高くなるトピック・空間領域固有ランドマーク存在確率を算出するトピック・空間領域固有ランドマーク存在確率算出ステップと、
ユーザ履歴固有ランドマーク存在確率算出手段が、
外部から入力された、または、前記複数人の移動履歴から特定したある特定動作主に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック・空間領域固有ランドマーク存在確率算出ステップで算出した前記トピック・空間領域固有ランドマーク存在確率との二項演算で前記特定動作主があるランドマークを訪問する確率を求めるユーザ履歴固有ランドマーク存在確率算出ステップと、
を更に行う請求項4記載のランドマーク推薦方法。
【請求項6】
ユーザ固有ランドマーク存在算出手段が、
外部から入力された、または、前記複数人の移動履歴から特定したある特定動作に関して、
前記ユーザ固有トピック出現確率記憶手段から取得した、前記特定動作主が位置の近さ以外のランドマークの特徴を表す潜在トピックを支持する確率である前記ユーザ固有トピック出現確率と、前記トピック固有ランドマーク存在確率記憶手段から取得した前記トピック固有ランドマーク存在確率との二項演算で、前記特定動作主があるランドマークを訪問する確率を求めるユーザ固有ランドマーク存在確率算出ステップ
を更に行う請求項4記載のランドマーク推薦方法。
【請求項7】
請求項1乃至3のいずれか1項に記載のランドマーク推薦装置を構成する各手段としてコンピュータを機能させるためのランドマーク推薦プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate