説明

場所存在確率算出装置及び方法及びプログラム及びトラベルルート推薦装置及び方法及びプログラム

【課題】 個人の現在地と興味に加え、個人の空き時間に応じたパーソナライズドルートの推薦を可能とする。
【解決手段】 本発明は、複数人の行動履歴から導出される場所間の遷移しやすさを捉えるマルコフモデルに基づいて求められた確率と、個人の行動履歴に反映された個人の嗜好を捉えるトピックモデルに基づいて求められた確率の2つの確率値の2項演算を行うことで、動作主が現在地をスタート地点とした各ルートを通る確率を求め、算出した確率値をもとに、各個人毎の推薦ルートを決定する。さらに、複数の場所を含むルートの旅行時間を算出し、旅行時間に関する制約条件を満たすルートを推薦する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、場所存在確率算出装置及び方法及びプログラム及びトラベルルート推薦装置及び方法及びプログラムに係り、特に複数人のGPS(Global Positioning System)データに元に基づいてトラベルルートを推薦するための場所存在確率算出装置及び方法及びプログラム及びトラベルルート推薦装置及び方法及びプログラムに関する。
【背景技術】
【0002】
従来技術として、GPSなどの実世界における行動ログに基づく行動予測・推薦技術が存在する。例えば、位置データのログから動作主が滞在した地点を抽出し、代表地点間の遷移をマルコフモデルでモデル化することで次に訪れる地点を予測する方法がある(例えば、非特許文献1参照)。
【0003】
また、位置データのログに基づき、動作主がある地域にどの程度詳しいか、どれくらい多くの人がその場所を訪れているかという観点で、ある地点や、地点間を結ぶルートの重要度を算出する方法がある(例えば、非特許文献2参照)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】D. Ashbrook and T. starner, Uing GPS to Learn Significant Locations and Predict Movement Across Multiple Users, in Personal and ubiquitous computing, Vol.7, No. 5, pp.275-286 (2003).
【非特許文献2】Y. Zheng, L. Zhang, X. Xie and W. Ma, Mining Interesting Locations and Travel Sequences from GPS Trajectories, in Proc, Int. Conf. on World Wide Web, pp. 791-800 (2009).
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来技術は、場所間の推移をマルコフモデルでモデル化しており、過去に多くの人が辿ったルートから順に推薦する特徴がある。その結果、アートに興味のある人には美術館を、スポーツに興味のある人には野球場を優先的に推薦するといった、個人の多様な興味に応じたルートを推薦することができなかった。
【0006】
また、従来技術は、個人の空き時間を考慮したルート推薦を行っていない。その結果、空き時間を大幅に上回る、もしくは、下回る非現実的なルートが推薦されてしまう問題が存在した。
【0007】
本発明は、上記の点に鑑みなされたもので、個人の現在地と興味に加え、個人の空き時間に応じたパーソナライズドルートの推薦を可能とするための場所存在確率算出装置及び方法及びプログラム及びトラベルルート推薦装置及び方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
図1は、本発明の原理構成図である。
【0009】
本発明(請求項1)は、複数人のGPSデータに基づいて動作主が次に各場所に存在する確率を算出するための場所存在確率算出装置であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段4と、
移動履歴記憶手段4から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成手段71と、
移動履歴記憶手段4から動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成手段72と、
ある移動履歴を持つ動作主がある場所を訪れる確率を、マルコフモデル生成手段71とトピックモデル生成手段72が算出した確率の二項演算で求める行動モデル生成手段73と、を有する。
【0010】
本発明(請求項2)は、複数人のGPSデータに基づいてトラベルルートを推薦する装置であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段と、
移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成手段と、
移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成手段と、
ある移動履歴を持つ動作主がある場所を訪れる確率を、マルコフモデル生成手段とトピックモデル生成手段が算出した確率の二項演算で求める行動モデル生成手段と、
行動モデル生成手段を繰り返し適用し、ある移動履歴を持つ動作主があるルートを通る確率を求めるルート生成手段と、を有する。
【0011】
また、本発明(請求項3)は、請求項2のトラベルルート推薦装置に、
複数人の移動履歴情報の集計結果に基づいて、複数の場所を含むルートの旅行時間を算出し、旅行時間記憶手段に格納する旅行時間算出手段と、
旅行時間記憶手段を参照し、旅行時間の制約条件を満たすルートに関して、行動モデル生成手段を繰り返し適用し、ある移動履歴を持つ動作主があるルートを通る確率を求める時間制約付きルート生成手段と、を更に加えた構成である。
【0012】
また、本発明(請求項4)は、請求項3のトラベルルート推薦装置に、
複数人の位置情報、時間情報、テキストタグ情報、動作主を一意に識別する動作主情報とからなるGPSデータを格納した行動ログ記憶手段と、
行動ログ記憶手段からGPSデータを取得して、多くの人々が訪れる代表地点を特定し、各GPSデータを該代表地点のいずれかに変換する代表地点抽出手段と、
行動ログ記憶手段から代表地点を特徴的に表すテキストタグ情報を抽出する代表タグ抽出手段と、を更に加えた構成である。
【0013】
図2は、本発明の原理を説明するための図である。
【0014】
本発明(請求項5)は、複数人のGPSデータに基づいて動作主が次に各場所に存在する確率を算出するための場所存在確率算出方法であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段を有するコンピュータが、
移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成ステップ(ステップ1)と、
移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成ステップ(ステップ2)と、
ある移動履歴を持つ動作主がある場所を訪れる確率を、マルコフモデル生成ステップとトピックモデル生成ステップで算出された確率の二項演算で求める行動モデル生成ステップ(ステップ3)と、を行う。
【0015】
本発明(請求項6)は、複数人のGPSデータに基づいてトラベルルートを推薦する方法であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段を有するコンピュータが、
移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成ステップと、
移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成ステップと、
ある移動履歴を持つ動作主がある場所を訪れる確率を、マルコフモデル生成ステップとトピックモデル生成ステップで算出された確率の二項演算で求める行動モデル生成ステップと、
行動モデル生成ステップを繰り返し実行し、ある移動履歴を持つ動作主があるルートを通る確率を求めるルート生成ステップと、を行う。
【0016】
また、本発明(請求項7)は、上記の請求項6のトラベルルート推薦方法において、
複数人の移動履歴情報の集計結果に基づいて、複数の場所を含むルートの旅行時間を算出し、旅行時間記憶手段に格納する旅行時間算出ステップと、
旅行時間記憶手段を参照し、旅行時間の制約条件を満たすルートに関して、行動モデル生成手段を繰り返し適用し、ある移動履歴を持つ動作主があるルートを通る確率を求める時間制約付きルート生成ステップと、を更に行う。
【0017】
また、本発明(請求項8)は、上記の請求項7のトラベルルート推薦方法において、
複数人の位置情報、時間情報、テキストタグ情報、動作主を一意に識別する動作主情報とからなるGPSデータを格納した行動ログ記憶手段から該GPSデータを取得して、多くの人々が訪れる代表地点を特定し、各GPSデータを該代表地点のいずれかに変換する代表地点抽出ステップと、
行動ログ記憶手段から代表地点を特徴的に表すテキストタグ情報を抽出する代表タグ抽出ステップと、を更に行う。
【0018】
本発明(請求項9)は、請求項1に記載の場所存在確率算出装置を構成する各手段としてコンピュータを機能させるための場所存在確率算出プログラムである。
【0019】
本発明(請求項10)は、請求項2乃至4のいずれか1項に記載のトラベルルート推薦装置を構成する各手段としてコンピュータを機能させるためのトラベルルート推薦プログラムである。
【発明の効果】
【0020】
上記のように本発明によれば、複数人の行動履歴から導き出される場所間の遷移のしやすさを捉えるマルコフモデル、個人の行動履歴に反映された個人の嗜好を捉えるトピックモデルの二項演算による行動モデルに基づき、個人の現在地と、興味に応じたパーソナライズド推薦を実現可能である。また、時間制約を用いて個人が旅行に費やすことができる時間を考慮することで、個人の現在地と興味に加え、個人の空き時間に応じたパーソナライズドルート推薦を実現できる。
【図面の簡単な説明】
【0021】
【図1】本発明の原理構成図である。
【図2】本発明の原理を説明するための図である。
【図3】本発明の第1の実施の形態におけるトラベルルート推薦装置のブロック図である。
【図4】本発明の第1の実施の形態におけるルート生成部のフローチャートである。
【図5】本発明の第1の実施の形態における行動ログ格納装置に格納されている行動ログの一例である。
【図6】本発明の第1の実施の形態における代表地点抽出部と位置情報変換部の動作例を説明するための図である。
【図7】本発明の第1の実施の形態における代表地点格納部に格納されている代表地点情報の一例である。
【図8】本発明の第1の実施の形態における移動履歴格納部に格納されている移動履歴の一例である。
【図9】本発明の第1の実施の形態における出力部からの出力例である。
【図10】本発明の第2の実施の形態におけるトラベルルート推薦装置のブロック図である。
【図11】本発明の第2の実施の形態における時間制約付きルート生成部のフローチャートである。
【図12】本発明の第2の実施の形態における出力部からの出力例である。
【発明を実施するための形態】
【0022】
以下、図面と共に本発明の実施の形態を説明する。
【0023】
[第1の実施の形態]
以下、トラベルルート推薦装置の実施の形態について図面を参照して説明する。
【0024】
図3は、本発明の第1の実施の形態におけるトラベルルート推薦装置のブロック図を示す。
【0025】
同図に示すトラベルルート推薦装置は、移動履歴変換部2、代表地点格納部3、移動履歴格納部4、操作部5、検索部6、モデル生成部7、ルート生成部8、出力部9から構成される。このうち、操作部5、移動履歴変換部2は、外部の行動ログ格納装置1と接続されている。
【0026】
行動ログ格納装置1は、トラベルルート推薦装置から解析され得る行動ログを格納しており、トラベルルート推薦装置からの要求に従って、行動ログを読み出し、当該情報をトラベルルート推薦装置に送信する。行動ログは、例えば、GPSデータであり、位置情報、時間情報、テキストタグ情報、動作主を一意に識別する動作主情報とからなる情報である。但し、行動ログは、テキストタグ情報を含まなくてもよい。いま、動作主をuで表すと、各行動ログは、
【0027】
【数1】

で表される。このうち、位置情報
【0028】
【数2】

は、例えば、緯度、経度の組み合わせで表される情報であり、時間情報
【0029】
【数3】

は、例えば、位置情報の測定時間であるが、動作主が各行動ログを取得した順序が保存できる形式であればよい。テキストタグ情報
【0030】
【数4】

は、例えば、位置情報に関連して付与されたタグの集合であり、地名や店舗名などである。行動ログ格納装置1は、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
【0031】
移動履歴変換部2は、代表地点抽出部21と、位置情報変換部22と、代表タグ抽出部23とを具備する。行動ログ格納装置1に格納されている動作主uに関する行動ログは、位置情報のシーケンスである移動履歴が
【0032】
【数5】

で表すことができる。τ―1は、動作主uの全行動ログ数であり、移動履歴中の各位置情報は時間情報に基づいてソートされているものとする。移動履歴変換部2は、行動ログ格納装置1に格納されている各行動ログの位置情報に基づき、多くの人が訪れる代表地点を特定し(代表地点抽出部21)、各代表地点を特徴的に表すテキストタグを抽出し(代表タグ抽出部23)、更に、移動履歴huに含まれるそれぞれの位置情報
【0033】
【数6】

を、代表地点集合に含まれるいずれかの代表地点に変換する(位置情報変換部22)。
代表地点抽出部21は、行動ログ格納装置1に格納されている各行動ログの位置情報に基づき、多くの人々が訪れる代表地点を特定する。代表地点の特定は、最頻値探索問題を解くことに等しい。一般に、点(位置情報)の集まりがどのように分布しているかを示す関数は密度関数と呼ばれる。この密度関数は空間上の任意の位置における点の密度を表し、関数値が高いところの周辺には点がたくさん集まり、低いところにはあまり無いことを示す。代表地点抽出部21において、最頻値探索問題の最頻値とは、この密度関数の極大値(局所的な最大値)として定義され、対応する極大値点は空間上の点の密度が局所的に最も高いところを示す。例えば、最頻値探索問題を解く手法として、ミーンシフト法(文献:Y. Cheng. Mean shift, mode seeking, and clustering. IEEE trans. Pattern Anal. And Machine Intell., 17(8), pp. 790-799 (1995))を用いることが考えられる。代表地点抽出部21の結果は、代表地点格納部3に格納する。
【0034】
位置情報変換部22は、クラスタリング手法を用いて、移動履歴huに含まれるそれぞれの位置情報
【0035】
【数7】

を代表地点抽出部21で得られた代表地点集合に含まれるいずれかの代表地点に変換する。例えば、クラスタリング法として、ミーンシフトクラスタリング法が考えられる。ミーンシフトクラスタリング法は、ミーンシフト法の計算過程を利用し、各位置情報をその収束先の最頻値点(代表地点)でラベル付けする。この他にも、k-means法等、既存のクラスタリングアルゴリズムを適用し、各クラスタ重心を代表地点とし、各位置情報がどのクラスタに含まれたかの結果を用いて、各行動ログの位置情報をいずれかの代表地点に対応させてもよい。今後、説明の簡略化のため、変換後の位置情報も同じ記号
【0036】
【数8】

で表現している。変換した結果、移動履歴hu中に連続する位置情報(代表地点)が存在する場合は、それらをまとめてひとつの位置情報として扱ってもよい。連続する位置情報をまとめた場合、動作主がその位置を訪れた時間と、出発した時間の中央値を、纏めた位置情報の新たな時間情報とする。なお、連続する位置情報は、動作主が同一の代表地点付近で複数の行動ログを残したことを意味する。位置情報変換部22の結果は、移動履歴格納部4に格納する。
【0037】
代表タグ抽出部23は、行動ログ格納装置1を参照して、代表地点抽出部21で得られた各代表地点を特徴的に表すテキストタグを抽出する。各代表地点を代表するテキストタグは、代表地点抽出部2の結果、各代表地点に対応させた行動ログ(のテキストタグ情報)集合から導き出す。例えば、テキストタグVが、どの程度、各代表地点Rの内容を表すのにふさわしいかを示す代表性スコアは、以下の式で計算することができる。
【0038】
【数9】

n(v,r)は、各代表地点Rについて、テキストタグVを含む行動ログ数、もしくは動作主数である。n(v)は、行動ログ格納装置1に格納されている全データ中における、テキストタグVを含む行動ログ数、もしくは動作主数である。この他にも、条件付き確率P(v│r)、リフト値P(v│r)/P(v)、tf−idf値等、他の重み付け手法を用いた計算結果を代表スコアとしてもよい。各代表地点において、代表性スコアの高い上位数件のテキスト情報を、各代表地点を代表する代表タグとする。代表タグ抽出部23は、代表地点格納部3に格納する。
【0039】
代表地点格納部3は、代表地点抽出部21と代表タグ抽出部23で得られた、代表地点に関連する情報を格納する。代表地点に関する情報とは、代表地点抽出部21で得られた代表地点を一意に識別するID、代表地点の緯度、経度、代表タグ抽出部23で得られた代表タグからなる情報であり、移動履歴格納部3には、これらの情報が保存され、復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
【0040】
移動履歴格納部4は、位置情報のシーケンスである動作主の移動履歴を、代表地点のシーケンスへと変換する位置情報変換部22の結果を格納する。具体的には、移動履歴と、動作主を一意に識別するIDを格納する。移動履歴格納部4は、移動履歴、及び、動作主を一意に識別するIDが保存され、復元可能なものであればなんでもよい。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
【0041】
操作部5は、行動ログ格納装置1、及び移動履歴格納部4のデータに対するユーザからの各種操作を受け付ける。各種操作とは、格納された情報を登録、修正、削除する操作等である。また、操作部5は、代表地点格納部3に格納された代表地点情報を装置のユーザに提示することも可能である。ユーザは、提示された情報の中から単一、もしくは、複数の代表地点を選択することで、推薦を行う対象となる動作主に関する行動ログ、及び、移動履歴情報として登録することが可能である。なお、複数の代表地点を選択する場合は、それらを訪れた順序情報も判別可能な形式で入力する。操作部5の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。操作部5は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
【0042】
検索部6は、推薦を行う対象となる動作主情報と、ルート制約条件を受け付ける。動作主情報は、動作主uを特定する情報である。例えば、移動履歴格納部4に格納されている動作主を一意に識別するIDがこれに該当するが、移動履歴格納部4に格納された移動履歴と同形式の移動履歴そのものを入力として受け付けてもよい。本装置は、同一の移動履歴を持つ複数の動作主に同様の結果を提示する。そのため、移動履歴そのものが入力の場合は、移動履歴格納部4に格納されたデータの中で、受け付けた移動履歴と同じ移動履歴を持ついずれかの動作主が指定されたものとして扱う。もし、同じ移動履歴が存在しない場合は、移動履歴格納部4の移動履歴の系列の中から、受け付けた移動履歴と類似性の高いものを選択する。類似性を測る指標としては、例えば、編集距離がある。編集距離は2つのシーケンスが与えられた場合に、一方のシーケンスをもう一方のシーケンスに変換する操作(追加、削除、置換)の最小ステップで定義されるシーケンス間の類似性を測るための指標である。「ルートの制約条件」とは、推薦して欲しいルートの個数や、単一のルートに含まる位置情報の個数である。3個以上10個以下というように、単一のルートに含まれる位置情報の個数の範囲を指定してもよい。
【0043】
なお、検索部6の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。検索部6は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
【0044】
モデル生成部7は、マルコフモデル生成部71と、トピックモデル生成部72と、行動モデル生成部73とを具備する。モデル生成部7は、移動履歴格納部4の移動履歴に基づき、時間t−1に位置rt-1にいる動作主uが、時間tに位置rを訪れる確率
【0045】
【数10】

を算出する。モデル生成部7は、検索部6によって指定されたhuの(ユーザu)の
【0046】
【数11】

を算出する。
【0047】
マルコフモデル生成部71は、移動履歴格納部4の移動履歴に基づいて、マルコフモデルを生成する。マルコフモデルは、時系列データを扱う確率モデルとして広く用いられている。以後、説明の簡略化のため、1次マルコフモデルを用いて説明をするが、他の次数のマルコフモデルを用いてもよい。1次マルコフモデルの場合、動作主が次に訪れる位置は一つ前に訪れた位置に依存し、以下の式で計算することができる。
【0048】
【数12】

【0049】
【数13】

は、最尤推定によって以下の式で計算することができる。
【0050】
【数14】

【0051】
【数15】

は、全移動履歴中で、位置rt-1の後に位置r訪れたことを示す移動履歴数である。また、n(rt-1)は、全移動履歴中で、rt-1を訪れたことを示す移動履歴数である。
【0052】
トピックモデル生成部72は、移動履歴格納部4の移動履歴に基づいて、トピックモデルを生成する。トピックモデルにおいては、ある動作主が訪れる各場所は、ユーザ固有のトピック比率に従ってあるトピックを選択した後、そのトピックに固有の場所出現確率分布に従って生成されると仮定して、動作主の行動を確率モデルで表現する。トピックモデルにおいては、潜在トピックz∈Z={z1,…,zK}が与えられ、hとrが独立であると(仮定)したときに、移動履歴hの動作主が場所rを訪れる確率を以下の式で計算することができる。
【0053】
【数16】

ここで、P(z|h)は、動作主の興味を示しており、動作主uがトピックzに興味を持つ確率である。例えば、変数zは、「スポーツ」や「アート」などの興味トピックを表すために用意された変数である。また、P(rt│z)はトピックzにおけるトレンドを表現しており、トピックzにおいて場所rが選択される確率である。例えば、「スポーツ」というトピックからは、「野球場」や「サッカー場」などの場所が高い確率で選択される。
【0054】
つまり、トピックモデルは、移動履歴hの動作主uが場所rを訪れた情報を学習データとし、これらの学習データが、"ある動作主が訪れる各場所は、ユーザ固有のトピック比率に従ってあるトピックzを選択した後、そのトピックzに固有の場所出現確率分布に従って生成された"と仮定した上で、潜在トピックzに関するp(z│h)、P(r│z)を学習する手法である。なお、トピックzは典型的には「スポーツ」や「アート」などのトピックを表すために用意された変数であるが、その変数が実際にどのようなトピックかを表すかは不明でよい。つまり、トピックモデルは、変数zに関する確率p(z│h)、P(r│z)を学習するものである。
【0055】
トピックモデルの代表例として、Probabilistic Latent Semantic Analysis(T. Hofmann. Probabilistic Latent Semantic Analysis , in Proc. Conf. on Uncertainty in Artificial Intelligence (UAI), pp. 289-296 (1999))やLatent Dirichlet Allocation(D.M. Baei, A.Y. Ng, and M.I. Jordan. Latent Dirichlet Allocation, in Journal of Machine Learning Research (JMLR), vol. 3, pp. 993-1022 (2003).)などがあるが、どのモデルを用いて求めてもよい。
【0056】
行動モデル生成部73は、時間t−1に場所rt-1にいる動作主uが、時間tに訪れる場所rtを訪れる確率P(r|rt-1,h)を、マルコフモデル生成部71によって得られた結果と、トピックモデル生成部72によって得られた結果の二項演算によって導出する。例えば、マルコフモデルとトピックモデルを組み合わせる方法としてユニグラムリスケーリング(D. Gildea and T. Hofmann. Topic-based Language Models Using EM, in Proc. EUROSPEECH, pp. 2167-2170 (1999))がある。ユニグラムリスケーリング法は、以下の式で計算できる。
【0057】
【数17】

P(r)は、位置(rt)を訪れる確率で、以下の式で計算することができる。
【0058】
【数18】

Nは、全移動履歴数である。C(rt-1,h)は正規化項である。P(r|rt-1)とP(r|h)は、それぞれ、マルコフモデル生成部71とトピックモデル生成部72によって導出した確率モデルである。
【0059】
ルート生成部8は、検索部6のルート制約条件と、モデル生成部7の結果に基づいて、動作主uが訪れる確率の高い、動作主uの現在地からのルートを求める。本実施の形態におけるルート制約条件とは、推薦して欲しいルートの個数Kや、一つのルートに含まれる位置情報の個数M(ルート長)または個数Mの範囲である。である。つまり、ルート生成部8は、長さがMで動作主uが訪れる確率の高いK個のトラベルルートを求める。例えば、ルート生成部8は、図4に示すフローチャートによって求めることができる。入力は、動作主uに関する移動履歴h、一つのルートに含まれる位置情報の個数M(ルート長)、推薦して欲しいルートの個数Kである。
【0060】
出力は、K個のルートを格納とした配列Aである。また、sは訪れた位置のシーケンスであるルート、msはmに含まれる位置の個数、psはsが選択される確率、slastはs中で最後に訪れた位置、s+rは位置rを訪れた場合に更新されたルートである。以下、図4に従って説明する。
【0061】
まず、以下の各値
配列A←Φ;
一時変数k←1;
優先度付きキューQ←Φ;
を初期化し(ステップ101)、現在地
【0062】
【数19】

を優先度付きキューQに追加する(ステップ102)。優先度付きキューQは、取り出し操作(ポップ)によって最も優先度の高い一つの要素を返すデータ構造である。本装置においては、優先度が確率値psで与えられる優先度付きキューを用いる。つまり、最も確率値の高い要素を優先度付きキューQに返す。キューQから最も高い確率値のルートsを取り出し(ステップ104)、そのルートsが制約条件(ルート長mがM)を満たすかどうかを調べる(ステップ105,107)。満たす場合は(ステップ105、Yes)、ルートsを配列Aに追加する(ステップ106)。もしルートsが条件を満たさない場合は、現在地(ルートsにおける最後の位置)から他の位置へのサブルートsを追加した新たなルートを生成する(ステップ109)。同時に、生成したルートの確率値
【0063】
【数20】

を計算する(ステップ108)。上記のプロセスをK個のルートが配列Aに追加させるまで繰り返す(ステップ103、Yes)。
【0064】
出力部9は、ルート生成部8で得られたモデルに基づき、訪れる確率の高いルートから順に出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部9は、ディスプレイやスピーカ等の出力デバイスを含むと考えても含まないと考えてもよい。出力部9は、出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。
【0065】
以下、具体的な例を用いて第1の実施の形態の処理について説明する。
【0066】
図5は、本発明の第1の実施の形態における行動ログ格納装置に格納されている行動ログの一例を示す。また、図6は、本発明の一実施の形態における代表地点抽出部と位置情報変換部の動作を説明するための図であり、行動ログ格納装置1に格納される各データを位置情報(緯度、経度)に基づいて地図上にマッピングした例である。図6中の白丸で表される点は各行動ログであり、図5中の「動作主1」と「動作主2」の移動履歴はそれぞれ、黒線矢印と点線矢印で表される。
【0067】
代表地点抽出部21は、行動ログ格納装置1に格納される(各行動ログの)位置情報の分布に基づいて、位置情報が集中している位置(図6の『代表地点a』から『代表地点d』)を特定する。さらに、位置情報変換部22により、代表地点を中心とした円に含まれる各行動ログ(図6中の白丸)を各代表地点(図6中の黒丸)に対応させる。
【0068】
図7は、本発明の第1の実施の形態における代表地点格納部に格納されている代表地点情報の一例である。同図において、代表タグ属性は、代表タグ抽出部3によって各代表地点に対して付与されたテキストタグ情報である。
【0069】
図8は、本発明の第1の実施の形態における移動履歴格納部に格納される移動履歴の一例である。同図では、図6の黒線矢印で示される「動作主1」の移動履歴は、「代表地点a→代表地点b→代表地点c→代表地点d」となる。
【0070】
以上のように、位置情報変換部22により、各移動履歴を代表地点からなる移動履歴に変換し、類似した移動履歴を同一の移動履歴として集約させることが可能である。
【0071】
図9は、本発明の第1の実施の形態における出力部の出力の一例である。
【0072】
出力部9は、訪れる確率の高いルートから順に出力する。ルートに含まれる各代表地点は、移動履歴格納部3に格納されている情報をもとに代表タグによって表されているが、緯度・経度で表される位置情報そのものを出力してもよい。指定されたルート制約条件は、ルートの個数と、ルート内に含まれる代表地点数である。図9の例においては、過去の移動履歴に、テーマパークである「東京××××ランド」が含まれている。本装置では、「テーマパークが好き」という動作主の嗜好情報をトピックモデルによって汲み取り、同じテーマパークの「ユニオンスタジオ」を優先して提示することが可能である。また、図9の出力例においては、検索部6によって指定された、推薦を行う対象となる動作主情報(移動履歴h)と、受け付けたルート制約条件も出力している。
【0073】
[第2の実施の形態]
以下に、本発明の第2の実施の形態について図面を参照して説明する。
【0074】
図10は、本発明の第2の実施の形態におけるトラベルルート推薦装置のブロック図である。同図において、第1の実施の形態における図3と同一構成部分には同一符号を付す。
【0075】
同図に示すトラベルルート推薦装置は、移動履歴変換部2(代表地点抽出部21、位置情報変換部22、代表タグ抽出部23)、代表地点格納部3、移動履歴格納部4、操作部5、モデル生成部7、出力部9については、第1の実施の形態と共通である。また、操作部5と移動履歴変換部2は、行動ログ格納装置1に接続されている点についても同様であるので、その説明を省略する。
【0076】
本実施の形態では、新たに、時間制約付き検索部10、旅行時間算出部11、旅行時間格納部12、時間制約付きルート生成部14が加えられ、また、時間制約付きルート生成部14には、外部の旅行時間格納装置13が接続されている。以下、これらの要素について説明する。
【0077】
時間制約付き検索部10は、第1の実施の形態における検索部6と同様のルート制約条件に加え、時間制約をルートの制約条件として受け付ける。「時間制約」とは、例えば、推薦して欲しいルートの総旅行時間である。時間制約付き検索部10の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等で何でもよい。時間制約付き検索部10は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
【0078】
旅行時間算出部11は、移動履歴格納部4に格納された移動履歴情報に基づいて、任意の複数の位置を含むルートの旅行時間を算出する手段である。「旅行時間」は、場所間の移動時間であるが、一つの場所の滞在時間を旅行時間の中に含めてもよい。旅行時間の算出方法としては、例えば、平均移動時間、平均滞在時間や、移動時間分布、滞在時間分布における最頻値を旅行時間とする方法等があるが、何を用いても良い。
【0079】
旅行時間格納部12は、旅行時間算出部11によって得られた任意の複数の位置を含むルートの旅行時間の結果を格納する。旅行時間格納部12は、データの構造が保存され、復元可能なものであればなんでも良い。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
【0080】
旅行時間格納装置13は、任意の複数位置を含むルートの旅行時間を格納しており、時間制約付きルート生成部14からの要求に従って、旅行時間情報を読み出し、当該情報を時間制約付きルート生成部14に送信する。旅行時間格納装置13は、カーナビゲーションサービスを提供するWebサーバや、予め登録された辞書、データベースを具備するデータベースサーバ等である。
【0081】
時間制約付きルート生成部14は、時間制約付き検索部10で指定されたルート制約条件を満たす中で、動作主uが訪れる確率の高い現在地からのルートを求める。本実施の形態における「ルート制約条件」とは、推薦して欲しいルートの個数Kや、総旅行時間である。例えば、時間制約付きルート生成部14は、最良優先探索アルゴリズムによって、図11に示すフローチャートによって求めることができる。
【0082】
入力は、動作主uに関する移動履歴hu、時間制約条件(時間下限tlowerと上限tupperで表される動作主の空き時間)、推薦して欲しいルートの個数Kである。出力は、K個のルートを格納した配列Aである。また、sは訪れた位置のシーケンスであるルート、tはsの旅行時間、psはsが選択される確率、slastはs中で最後に訪れた単一の位置、s+1は位置rを訪れた場合に更新されたルートである。
【0083】
まず、以下の値
配列の初期化:A←Φ;
一時変数の初期化:k←1;
優先度付きキューの初期化:Q←Φ;
を初期化し(ステップ201)、現在地
【0084】
【数21】

を優先度付きキューQに追加する(ステップ202)。優先度付きキューQは、取り出し操作(ポップ)によって最も優先度の高い一つの要素を返すメモリ(図示せず)内のデータ構造である。本装置においては、優先度画確率値psで与えられる優先度付きキューを用いる。つまり、最も確率値の高い要素を優先度付きキューQは返す。キューQから最も高い確率値のルートsを取り出し(ステップ204)、そのルートが時間制約条件を満たすか動かを調べる(ステップ205)。もし、ルートsが条件を満たさない場合は、現在地(ルートsにおける最後の位置)から他の位置へのサブルートをsに追加した新たなルートを生成する(ステップ206)。同時に、生成したルートの確率値と旅行時間を計算する(ステップ208,209)。「TravelTime」関数は、2つの位置間の旅行時間を返す関数であり、この関数は、旅行時間格納部12、もしくは、旅行時間格納装置13のデータを利用することで実現し得る。上記のプロセスをK個のルートが配列Aに追加されるまで繰り返す(ステップ210,203)。
【0085】
図12は、本発明の第2の実施の形態における出力部の出力の一例である。第1の実施の形態と同様、出力部9は、訪れる確率の高いルートから順に出力する。指定されたルート制約条件は、ルートの個数と総旅行時間である。時間制約付き検索部10で指定された時間制約条件を考慮してルートの到達確率を計算し、ルート自身に加えてルートを辿るのにかかる時間情報(総旅行時間、場所間の旅行時間)も同時に出力する特徴がある。
【0086】
本実施の形態のように、時間制約条件を受け付けて、当該制約条件を満たすルートを推薦することにより、空き時間を大幅に上回る、もしくは下回る非現実的なルートが推薦されることがなくなる。
【0087】
また、上記の第1の実施の形態における図3、第2の実施の形態における図10に示す装置の構成要素の動作をプログラムとして構築し、トラベルルート推薦装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
【0088】
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
【0089】
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0090】
1 行動ログ格納装置
2 移動履歴変換部
3 代表地点格納部
4 移動履歴記憶手段、移動履歴格納部
5 操作部
6 検索部
7 モデル生成部
8 ルート生成部
9 出力部
10 時間制約付き検索部
11 旅行時間算出部
12 旅行時間格納部
13 旅行時間格納装置
14 時間制約付きルート生成部
21 代表地点抽出部
22 位置情報変換部
23 代表タグ抽出部
71 マルコフモデル生成手段
72 トピックモデル生成手段
73 行動モデル生成手段

【特許請求の範囲】
【請求項1】
複数人のGPS(Global Positioning System)データに基づいて動作主が次に各場所に存在する確率を算出するための場所存在確率算出装置であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段と、
前記移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成手段と、
前記移動履歴記憶手段から前記動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成手段と、
ある移動履歴を持つ動作主がある場所を訪れる確率を、前記マルコフモデル生成手段と前記トピックモデル生成手段が算出した確率の二項演算で求める行動モデル生成手段と、
を有することを特徴とする場所存在確率算出装置。
【請求項2】
複数人のGPSデータに基づいてトラベルルートを推薦する装置であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段と、
前記移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成手段と、
前記移動履歴記憶手段から前記動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成手段と、
ある移動履歴を持つ動作主がある場所を訪れる確率を、前記マルコフモデル生成手段と前記トピックモデル生成手段が算出した確率の二項演算で求める行動モデル生成手段と、
前記行動モデル生成手段を繰り返し適用し、ある移動履歴を持つ動作主があるルートを通る確率を求めるルート生成手段と、
を有することを特徴とするトラベルルート推薦装置。
【請求項3】
複数人の移動履歴情報の集計結果に基づいて、複数の場所を含むルートの旅行時間を算出し、旅行時間記憶手段に格納する旅行時間算出手段と、
前記旅行時間記憶手段を参照し、前記旅行時間の制約条件を満たすルートに関して、前記行動モデル生成手段を繰り返し適用し、ある移動履歴を持つ動作主があるルートを通る確率を求める時間制約付きルート生成手段と、
を更に有する請求項2記載のトラベルルート推薦装置。
【請求項4】
複数人の位置情報、時間情報、テキストタグ情報、動作主を一意に識別する動作主情報とからなるGPSデータを格納した行動ログ記憶手段と、
前記行動ログ記憶手段から前記GPSデータを取得して、多くの人々が訪れる代表地点を特定し、各GPSデータを該代表地点のいずれかに変換する代表地点抽出手段と、
前記行動ログ記憶手段から前記代表地点を特徴的に表すテキストタグ情報を抽出する代表タグ抽出手段と、
を更に有する請求項3記載のトラベルルート推薦装置。
【請求項5】
複数人のGPS(Global Positioning System)データに基づいて動作主が次に各場所に存在する確率を算出するための場所存在確率算出方法であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段を有するコンピュータが、
前記移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成ステップと、
前記移動履歴記憶手段から前記動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成ステップと、
ある移動履歴を持つ動作主がある場所を訪れる確率を、前記マルコフモデル生成ステップと前記トピックモデル生成ステップで算出された確率の二項演算で求める行動モデル生成ステップと、
を行うことを特徴とする場所存在確率算出方法。
【請求項6】
複数人のGPSデータに基づいてトラベルルートを推薦する方法であって、
動作主の位置情報のシーケンスである移動履歴を格納した移動履歴記憶手段を有するコンピュータが、
前記移動履歴記憶手段から動作主の移動履歴を取得して、ある場所を訪れる確率をマルコフモデルに基づいて算出するマルコフモデル生成ステップと、
前記移動履歴記憶手段から前記動作主の移動履歴を取得して、ある場所を訪れる確率をトピックモデルに基づいて算出するトピックモデル生成ステップと、
ある移動履歴を持つ動作主がある場所を訪れる確率を、前記マルコフモデル生成ステップと前記トピックモデル生成ステップで算出された確率の二項演算で求める行動モデル生成ステップと、
前記行動モデル生成ステップを繰り返し実行し、ある移動履歴を持つ動作主があるルートを通る確率を求めるルート生成ステップと、
を行うことを特徴とするトラベルルート推薦方法。
【請求項7】
複数人の移動履歴情報の集計結果に基づいて、複数の場所を含むルートの旅行時間を算出し、旅行時間記憶手段に格納する旅行時間算出ステップと、
前記旅行時間記憶手段を参照し、前記旅行時間の制約条件を満たすルートに関して、前記行動モデル生成手段を繰り返し適用し、ある移動履歴を持つ動作主があるルートを通る確率を求める時間制約付きルート生成ステップと、
を更に行う請求項6記載のトラベルルート推薦方法。
【請求項8】
複数人の位置情報、時間情報、テキストタグ情報、動作主を一意に識別する動作主情報とからなるGPSデータを格納した行動ログ記憶手段から該GPSデータを取得して、多くの人々が訪れる代表地点を特定し、各GPSデータを該代表地点のいずれかに変換する代表地点抽出ステップと、
前記行動ログ記憶手段から前記代表地点を特徴的に表すテキストタグ情報を抽出する代表タグ抽出ステップと、
を更に行う請求項7記載のトラベルルート推薦方法。
【請求項9】
請求項1に記載の場所存在確率算出装置を構成する各手段としてコンピュータを機能させるための場所存在確率算出プログラム。
【請求項10】
請求項2乃至4のいずれか1項に記載のトラベルルート推薦装置を構成する各手段としてコンピュータを機能させるためのトラベルルート推薦プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2011−170453(P2011−170453A)
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【出願番号】特願2010−31620(P2010−31620)
【出願日】平成22年2月16日(2010.2.16)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】