説明

データ処理装置、データ処理方法、およびプログラム

【課題】より正確に、目的地までの経路および所要時間を予測することができるようにする。
【解決手段】学習メインプロセス部23は、学習用データとしての移動履歴データをユーザの活動を表す確率モデルで表し、そのパラメータを学習する。目的地経由地検出部25は、確率モデルの状態ノードのうち、目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する。現在地ノード推定部41は、ユーザの現在地に相当する現在地ノードを推定する。目的地経由地予測部42は、ユーザの現在地から目的地までの経路を探索する。予測ポストプロセス部34は、探索された目的地への到達確率と所要時間を算出する。本発明は、例えば、移動履歴データから目的地を予測するデータ処理装置に適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置、データ処理方法、およびプログラムに関し、特に、より正確に、目的地までの経路および所要時間を予測することができるようにするデータ処理装置、データ処理方法、およびプログラムに関する。
【背景技術】
【0002】
近年、ユーザが身に着けられるセンサであるウェアラブルセンサから得られる時系列データを用いてユーザの状態をモデル化して学習し、学習により得られたモデルを用いてユーザの現在の状態を認識する研究が盛んである(例えば、特許文献1,2、非特許文献1)。
【0003】
本出願人は、未来の所望の時刻におけるユーザの活動状態の複数の可能性を確率的に予測する方法を、特願2009−180780号(以下、先願1という)として先に提案している。先願1の方法では、時系列データからユーザの活動状態を確率的状態遷移モデルとして学習し、学習した確率的状態遷移モデルを用いて現在の活動状態を認識し、「所定時間後」のユーザの活動状態を確率的に予測することができる。先願1では、「所定時間後」のユーザの活動状態の予測の一例として、ユーザの移動履歴の時系列データを学習した確率的状態遷移モデルを用いて、ユーザの現在の位置を認識し、所定時間後のユーザの行き先(場所)を予測する例が示されている。
【0004】
さらに、本出願人は、先願1をさらに発展させ、「所定時間後」という現在時刻からの経過時間の指定がない場合であっても、複数の目的地への到達確率、経路、時間を予測する方法を、特願2009−208064号(以下、先願2という)として提案した。先願2の方法では、確率的状態遷移モデルを構成するノードに、”移動状態”かまたは”滞在状態”の属性が付与された。そして、確率的状態遷移モデルを構成するノードの中から、目的地のノードとして”滞在状態”のノードを見つけることで、目的地の候補を自動的に検出することができた。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2006−134080号公報
【特許文献2】特開2008−204040号公報
【非特許文献】
【0006】
【非特許文献1】“Life Patterns: structure from wearable sensors”,Brian Patrick Clarkson, Doctor Thesis, MIT, 2002
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、先願2の予測方法では、次のような事象が発生していた。第1に、予測される目的地が実際の目的地ではなく、途中の経由地とすることがあった。これにより、途中の経由地から実際の目的地までが予測されないことがあった(第1の課題)。例えば、帰宅途中の駅での電車乗り換えや本屋への立ち寄りなどのため、所定時間滞在した場所が目的地と認識され、本来の目的地である自宅までの経路を予測できない場合があった。
【0008】
第2に、予測結果として、ほぼ同一の経路を通る、似たような経路が複数提示され、ユーザにとって有益なその他の経路がユーザに提示なされないことがあった(第2の課題)。これは、頻繁に通り、バリエーションの多い経路と、頻繁に通らず、バリエーションの少ない経路とをうまく区別できないことに起因する。
【0009】
本発明は、このような状況に鑑みてなされたものであり、より正確に、目的地までの経路および所要時間を予測することができるようにするものである。
【課題を解決するための手段】
【0010】
本発明の一側面のデータ処理装置は、学習用データとして取得される、ユーザの移動履歴データを、ユーザの活動を表す確率モデルで表し、そのパラメータを学習する学習手段と、学習により得られた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを、学習により得られた前記パラメータを用いた前記確率モデルに入力し、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、探索された前記目的地への到達確率と所要時間を算出する算出手段とを備える。
【0011】
本発明の一側面のデータ処理方法は、ユーザの移動履歴データを処理するデータ処理装置が、学習用データとして取得される前記移動履歴データを、ユーザの活動を表す確率モデルで表し、そのパラメータを学習し、学習により得られた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定し、前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを、学習により得られた前記パラメータを用いた前記確率モデルに入力し、前記ユーザの現在地に相当する現在地ノードを推定し、推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索し、探索された前記目的地への到達確率と所要時間を算出するステップを含む。
【0012】
本発明の一側面のプログラムは、コンピュータを、学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルで表し、そのパラメータを学習する学習手段と、学習により得られた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを、学習により得られた前記パラメータを用いた前記確率モデルに入力し、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、探索された前記目的地への到達確率と所要時間を算出する算出手段として機能させるためのものである。
【0013】
本発明の一側面においては、学習用データとして取得される移動履歴データが、ユーザの活動を表す確率モデルで表され、そのパラメータが学習され、学習により得られたパラメータを用いた確率モデルの状態ノードのうち、目的地および経由地に相当する目的地ノードおよび経由地ノードが推定され、学習用データとは別の、現在から所定時間以内のユーザの移動履歴データが、学習により得られたパラメータを用いた確率モデルに入力され、ユーザの現在地に相当する現在地ノードが推定され、推定された目的地ノードおよび経由地ノード並びに現在地ノードについての情報と、学習により得られた確率モデルとを用いて、ユーザの現在地から目的地までの経路が探索され、探索された目的地への到達確率と所要時間が算出される。
【発明の効果】
【0014】
本発明の一側面によれば、より正確に、目的地までの経路および所要時間を予測することができる。
【図面の簡単な説明】
【0015】
【図1】本発明を適用した予測システムの一実施の形態の構成例を示すブロック図である。
【図2】予測システムのハードウエア構成例を示すブロック図である。
【図3】移動履歴データの例を示す図である。
【図4】HMMの例を示す図である。
【図5】left-to-right型のHMMの例を示す図である。
【図6】スパース制約を与えたHMMの例を示す図である。
【図7】学習プリプロセス部の詳細構成例を示すブロック図である。
【図8】学習プリプロセス部の処理について説明する図である。
【図9】移動属性識別付与部の詳細構成例を示すブロック図である。
【図10】移動属性識別部の学習器の構成例を示すブロック図である。
【図11】行動状態をカテゴリごとに分類する場合の分類例を示す図である。
【図12】行動状態ラベリング部の処理例を説明する図である。
【図13】行動状態ラベリング部の処理例を説明する図である。
【図14】図10の行動状態学習部の構成例を示すブロック図である。
【図15】移動属性識別部の詳細構成例を示すブロック図である。
【図16】移動属性識別部の学習器のその他の構成例を示すブロック図である。
【図17】移動属性識別部のその他の構成例を示すブロック図である。
【図18】学習プリプロセス部の処理を説明するフローチャートである。
【図19】学習メインプロセス処理を説明するフローチャートである。
【図20】学習ポストプロセス部の詳細構成例を示すブロック図である。
【図21】状態系列修正部の状態系列データの修正処理について説明する図である。
【図22】状態系列修正部の状態系列データの修正処理について説明する図である。
【図23】状態系列修正部の状態系列データの修正処理について説明する図である。
【図24】状態系列修正部の状態系列データの修正処理について説明する図である。
【図25】状態系列修正部の状態系列データの修正処理について説明する図である。
【図26】目的地経由地検出部の処理について説明する図である。
【図27】学習ブロック全体の処理を説明するフローチャートである。
【図28】ツリー探索処理を説明するフローチャートである。
【図29】ツリー探索処理をさらに説明する図である。
【図30】ツリー探索処理をさらに説明する図である。
【図31】ツリー探索処理における探索結果リストの例を示す図である。
【図32】代表経路選択処理を説明するフローチャートである。
【図33】予測ブロック全体の処理を説明するフローチャートである。
【図34】本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
【発明を実施するための形態】
【0016】
[予測システムの構成例]
図1は、本発明を適用した予測システムの一実施の形態の構成例を示している。
【0017】
図1の予測システム1は、学習ブロック11、ユーザ別モデルパラメータ記憶部12、および予測ブロック13により構成される。
【0018】
学習ブロック11には、GPS (Global Positioning System)センサなどのセンサデバイス(不図示)において、所定の期間に取得された、所定の時刻におけるユーザの位置(緯度と経度)を示す時系列データが供給される。即ち、学習ブロック11には、一定時間間隔(たとえば、15秒間隔)で順次取得された位置(緯度および経度)のデータと、そのときの時刻の3次元からなる、ユーザの移動経路を示す時系列データ(以下、移動履歴データという。)が供給される。なお、時系列データを構成する、緯度、経度、および時刻の1組のデータを、適宜、3次元データともいう。
【0019】
学習ブロック11は、ユーザの移動履歴データを用いて、ユーザの活動モデル(ユーザの行動・活動パターンを表した状態モデル)を、確率的状態遷移モデルとして学習する学習処理を行う。
【0020】
学習に使用される確率的状態遷移モデルとしては、例えば、エルゴディックHMM(Hidden Markov Model)などの、隠れ状態を含む確率モデルを採用することができる。予測システム1では、確率的状態遷移モデルとして、エルゴディックHMMにスパース制約を与えたものを採用する。なお、スパース制約を与えたエルゴディックHMM、エルゴディックHMMのパラメータの算出方法等については、図4乃至図6を参照して後述する。
【0021】
ユーザ別モデルパラメータ記憶部12は、学習ブロック11の学習により得られた、ユーザの活動モデルを表すパラメータを記憶する。
【0022】
予測ブロック13は、学習ブロック11の学習により得られたユーザ活動モデルのパラメータをユーザ別モデルパラメータ記憶部12から取得する。そして、予測ブロック13は、新たに取得されたユーザの移動履歴データに対し、学習により得られたパラメータを用いたユーザ活動モデルを用いて、ユーザの現在地を推定し、さらに現在地からの移動先となる目的地を予測する。さらに、予測ブロック13は、予測した目的地までの到達確率、経路、および到達時間(所要時間)も算出する。なお、目的地は1つだけとは限らず、複数の目的地が予測されることもある。
【0023】
学習ブロック11および予測ブロック13の詳細について説明する。
【0024】
学習ブロック11は、履歴データ蓄積部21、学習プリプロセス部22、学習メインプロセス部23、学習ポストプロセス部24、および目的地経由地検出部25により構成される。
【0025】
履歴データ蓄積部21は、センサデバイスから供給される、ユーザの移動履歴データを、学習用データとして蓄積(記憶)する。履歴データ蓄積部21は、移動履歴データを、必要に応じて学習プリプロセス部22に供給する。
【0026】
学習プリプロセス部22は、センサデバイスから生じる課題を解決する。具体的には、学習プリプロセス部22は、移動履歴データを整形するとともに、一時的なデータの欠落を補間処理等を行うことで補完する。また、学習プリプロセス部22は、移動履歴データを構成する3次元データそれぞれに対し、同一場所に滞在(停止)している”滞在状態”か、または、移動している”移動状態”のいずれかの移動属性を付与する。移動属性付与後の移動履歴データが、学習メインプロセス部23と目的地経由地検出部25に供給される。
【0027】
学習メインプロセス部23は、ユーザ活動モデルを確率的状態遷移モデルにモデル化する。即ち、学習メインプロセス部23は、ユーザの移動履歴を確率的状態遷移モデルにモデル化したときのパラメータを求める。学習により得られたユーザ活動モデルのパラメータは、学習ポストプロセス部24とユーザ別モデルパラメータ記憶部12に供給される。
【0028】
学習ポストプロセス部24は、学習メインプロセス部23の学習により得られたユーザ活動モデルを用いて、移動履歴データを構成する各3次元データを、ユーザ活動モデルの状態ノードに変換する。即ち、学習ポストプロセス部24は、移動履歴データに対応する、ユーザ活動モデルの状態ノードの時系列データ(状態ノード系列データ)を生成する。その際、学習ポストプロセス部24は、一般常識に基づくバイアスを加えることで、状態ノード系列データの一部修正を行う。学習ポストプロセス部24は、変換および修正後の状態ノード系列データを目的地経由地検出部25に供給する。
【0029】
目的地経由地検出部25は、学習プリプロセス部22から供給された移動属性付与後の移動履歴データと、学習ポストプロセス部24から供給された状態ノード系列データとを対応付ける。即ち、目的地経由地検出部25は、移動履歴データを構成する各3次元データに、ユーザ活動モデルの状態ノードを割り当てる。
【0030】
そして、目的地経由地検出部25は、状態ノード系列データの各状態ノードのうち、移動属性が”滞在状態”の3次元データに対応する状態ノードに、目的地または経由地の属性を付与する。これにより、ユーザの移動履歴内の所定の場所(に対応する状態ノード)が、目的地かまたは経由地に割り当てられる。目的地経由地検出部25により、状態ノードに付与された目的地、経由地の属性についての情報は、ユーザ別モデルパラメータ記憶部12に供給され、記憶される。
【0031】
予測ブロック13は、バッファリング部31、予測プリプロセス部32、予測メインプロセス部33、および、予測ポストプロセス部34により構成される。
【0032】
バッファリング部31は、予測処理のためのリアルタイムに取得される移動履歴データをバッファリングする(記憶する)。なお、予測処理のための移動履歴データとしては、学習処理時の移動履歴データよりも短い期間のデータ、例えば、100ステップ程度の移動履歴データがあれば十分である。バッファリング部31は、常に、所定期間分の最新の移動履歴データを記憶するようにし、新たなデータが取得されたとき、記憶されているデータのうち最も古いデータを消去する。
【0033】
予測プリプロセス部32は、学習プリプロセス部22と同様、センサデバイスから生じる課題を解決する。即ち、予測プリプロセス部32は、移動履歴データを整形するとともに、一時的なデータの欠落を補間処理等を行うことで補完する。
【0034】
予測メインプロセス部33は、現在地ノード推定部41と目的地経由地予測部42により構成される。予測メインプロセス部33には、ユーザ別モデルパラメータ記憶部12から、学習ブロック11の学習により得られた、ユーザ活動モデルを表すパラメータが供給される。
【0035】
現在地ノード推定部41は、予測プリプロセス部32から供給される移動履歴データと、学習ブロック11の学習により得られたユーザ活動モデルを用いて、ユーザの現在地に対応する状態ノード(現在地ノード)を推定する。状態ノードの推定には、ビタビ最尤推定や軟判定ビタビ推定を採用することができる。
【0036】
目的地経由地予測部42は、現在地ノード推定部41で推定された現在地ノードから遷移可能な複数の状態ノードでなるツリー構造において、目的地の状態ノード(目的地ノード)までのノード系列とその生起確率を算出する。なお、目的地の状態ノードへのノード系列(経路)には経由地のノードが含まれる場合もあるので、目的地経由地予測部42は、目的地と同時に経由地も予測する。
【0037】
予測ポストプロセス部34は、同一目的地までの複数の経路の選択確率(生起確率)の和を到達確率として求める。また、予測ポストプロセス部34は、目的地への経路のうち代表となる1以上の経路(以下、代表経路という。)を選択し、代表経路の所要時間を算出する。そして、予測ポストプロセス部34は、予測した目的地までの代表経路、到達確率、および所要時間を予測結果として出力する。なお、経路の生起確率の代わりに頻度、目的地への到達確率の代わりに到達頻度を、予測結果として出力してもよい。
【0038】
[予測システムのハードウエア構成例]
以上のように構成される予測システム1は、例えば、図2に示されるハードウエア構成を採用することができる。即ち、図2は、予測システム1のハードウエア構成例を示すブロック図である。
【0039】
図2において、予測システム1は、3台のモバイル端末51−1乃至51−3とサーバ52とにより構成されている。モバイル端末51−1乃至51−3は、同一機能を有する同型のモバイル端末51であるが、モバイル端末51−1乃至51−3では、それを所有するユーザが異なる。従って、図2では、3台のモバイル端末51−1乃至51−3のみが示されているが、実際には、ユーザ数に応じた数のモバイル端末51が存在する。
【0040】
モバイル端末51は、無線通信及びインターネット等のネットワークを介した通信により、サーバ52とデータの授受を行うことができる。サーバ52は、モバイル端末51から送信されてくるデータを受信し、受信したデータに対し所定の処理を行う。そして、サーバ52は、データ処理の処理結果を無線通信等によりモバイル端末51に送信する。
【0041】
従って、モバイル端末51とサーバ52は、無線または有線による通信を行う通信部を少なくとも有する。
【0042】
さらに、モバイル端末51が、図1の予測ブロック13を備え、サーバ52が、図1の学習ブロック11とユーザ別モデルパラメータ記憶部12を備える構成を採用することができる。
【0043】
この構成が採用される場合、例えば、学習処理において、モバイル端末51のセンサデバイスにより取得された移動履歴データがサーバ52に送信される。サーバ52は、受信した学習用の移動履歴データに基づき、ユーザ活動モデルを学習し、記憶する。そして、予測処理において、モバイル端末51が、学習により得られたユーザ活動モデルのパラメータを取得し、リアルタイムに取得される移動履歴データから、ユーザの現在地ノードを推定し、さらに、目的地ノードと、そこまでの到達確率、代表経路、および所要時間を算出する。そして、モバイル端末51は、予測結果を図示せぬ液晶ディスプレイ等の表示部に表示する。
【0044】
以上のようなモバイル端末51とサーバ52との間の役割分担は、それぞれのデータ処理装置としての処理能力や通信環境に応じて、適宜、決定することができる。
【0045】
学習処理は、処理に要する1回あたりの時間は非常に長いが、それほど頻繁に処理する必要はない。従って、一般的には、携行可能なモバイル端末51よりもサーバ52の方が処理能力が高いので、サーバ52に、一日に一回程度蓄積された移動履歴データに基づいて学習処理(パラメータの更新)を行わせるようにすることができる。
【0046】
一方、予測処理は、時々刻々とリアルタイムに更新される移動履歴データに対応させて迅速に処理し、表示することが望ましいので、モバイル端末51で処理を行う方が望ましい。通信環境がリッチであれば、サーバ52に予測処理も行わせ、予測結果のみをサーバ52から受信する方が、携行可能な小型化が要求されるモバイル端末51の負荷が軽減され、望ましい。
【0047】
また、モバイル端末51単独で、データ処理装置として学習処理および予測処理を高速に行うことが可能である場合には、図1の予測システム1の構成すべてをモバイル端末51が備えるようにすることも勿論可能である。
【0048】
[入力される移動履歴データの例]
図3は、予測システム1で取得された移動履歴データの例を示している。図3において、横軸は経度を表し、縦軸は緯度を表している。
【0049】
図3に示される移動履歴データは、実験者の1ヶ月半程度の期間に蓄積された移動履歴データを示している。図3に示されるように、移動履歴データは、主に、自宅周辺と、勤務先などの4か所の外出先を移動したデータとなっている。なお、この移動履歴データには、人工衛星を捕捉できず、位置が飛んでいるデータも含まれている。
【0050】
[エルゴディックHMMについて]
次に、予測システム1が、学習モデルとして採用するエルゴディックHMMについて説明する。
【0051】
図4は、HMMの例を示している。
【0052】
HMMは、状態ノードと状態ノード間遷移とを有する状態遷移モデルである。
【0053】
図4は、3状態のHMMの例を示している。
【0054】
図4において(以降の図においても同様)、丸印は、状態ノードを表し、矢印は、状態ノードの遷移を表す。なお、以下において、状態ノードは、単に、ノードまたは状態ともいう。
【0055】
また、図4において、si(図4では、i=1,2,3)は、状態を表し、aijは、状態siから状態sjへの状態遷移確率を表す。さらに、bj(x)は、状態sjへの状態遷移時に、観測値xが観測される出力確率密度関数を表し、πiは、状態siが初期状態である初期確率を表す。
【0056】
なお、出力確率密度関数bj(x)としては、例えば、正規確率分布等が用いられる。
【0057】
ここで、HMM(連続HMM)は、状態遷移確率aij、出力確率密度関数bj(x)、及び初期確率πiによって定義される。これらの状態遷移確率aij、出力確率密度関数bj(x)、及び初期確率πiを、HMMのパラメータλ={aij,bj(x), πi,i=1,2,・・・,M,j=1,2,・・・,M}という。Mは、HMMの状態数を表す。
【0058】
HMMのパラメータλを推定する方法としては、Baum-Welchの最尤推定法が広く利用されている。Baum-Welchの最尤推定法は、EMアルゴリズム(EM(Expectation-Maximization) algorithm)に基づくパラメータの推定方法である。
【0059】
Baum-Welchの最尤推定法によれば、観測される時系列データx=x1,x2,・・・,xTに基づき、その時系列データが観測(生起)される確率である生起確率から求まる尤度を最大化するように、HMMのパラメータλの推定が行われる。ここで、xtは、時刻tに観測される信号(サンプル値)を表し、Tは、時系列データの長さ(サンプル数)を表す。
【0060】
Baum-Welchの最尤推定法については、例えば、“パターン認識と機械学習(下)”,C.M.ビショップ著,P. 333(英語原書:“Pattern Recognition and Machine Learning (Information Science and Statistics) ”,Christopher M. BishopSpringer, New York, 2006.)(以下、文献Aと称する)に記載されている。
【0061】
なお、Baum-Welchの最尤推定法は、尤度最大化に基づくパラメータ推定方法ではあるが、最適性を保証するものではなく、HMMの構造やパラメータλの初期値によっては、局所解(ローカルミニマム)に収束することがある。
【0062】
HMMは、音声認識で広く利用されているが、音声認識で利用されるHMMでは、一般に、状態の数や状態遷移の仕方等はあらかじめ決定される。
【0063】
図5は、音声認識で利用されるHMMの例を示している。
【0064】
図5のHMMは、left-to-right型と呼ばれる。
【0065】
図5では、状態数は3になっており、状態遷移は、自己遷移(状態siから状態siへの状態遷移)と、左から右隣の状態への状態遷移とのみを許す構造に制約されている。
【0066】
図5のHMMのように、状態遷移に制約があるHMMに対して、図4に示した、状態遷移に制約がないHMM、すなわち、任意の状態siから任意の状態sjへの状態遷移が可能なHMMは、エルゴディック(Ergodic)HMMと呼ばれる。
【0067】
エルゴディックHMMは、構造としては最も自由度の高いHMMであるが、状態数が多くなると、パラメータλの推定が困難となる。
【0068】
例えば、エルゴディックHMMの状態数が、1000である場合、状態遷移の数は、100万(=1000×1000)となる。
【0069】
したがって、この場合、パラメータλのうちの、例えば、状態遷移確率aijについては、100万個の状態遷移確率aijを推定することが必要となる。
【0070】
そこで、状態に対して設定する状態遷移には、例えば、スパース(Sparse)な構造であるという制約(スパース制約)をかけることができる。
【0071】
ここで、スパースな構造とは、任意の状態から任意の状態への状態遷移が可能なエルゴディックHMMのような密な状態遷移ではなく、ある状態から状態遷移することができる状態が非常に限定されている構造である。なお、ここでは、スパースな構造であっても、他の状態への状態遷移は、少なくとも1つ存在し、また、自己遷移は存在することとする。
【0072】
図6は、スパース制約を与えたHMMを示している。
【0073】
ここで、図6では、2つの状態を結ぶ双方向の矢印は、その2つの状態の一方から他方への状態遷移と、他方から一方への状態遷移とを表す。また、図6において、各状態は、自己遷移が可能であり、その自己遷移を表す矢印の図示は、省略されている。
【0074】
図6では、16個の状態が、2次元空間上に格子状に配置されている。すなわち、図6では、横方向に、4個の状態が配置され、縦方向にも、4個の状態が配置されている。
【0075】
いま、横方向に隣接する状態どうしの距離、及び、縦方向に隣接する状態どうしの距離を、いずれも1とすると、図6Aは、距離が1以下の状態への状態遷移は可能とし、他の状態への状態遷移はできないというスパース制約を与えたHMMを示している。
【0076】
また、図6Bは、距離が√2以下の状態への状態遷移は可能とし、他の状態への状態遷移はできないというスパース制約を与えたHMMを示している。
【0077】
図1の例では、予測システム1に、移動履歴データx=x1,x2,・・・,xTが供給され、学習ブロック11は、移動履歴データx=x1,x2,・・・,xTを用い、ユーザ活動モデルを表すHMMのパラメータλを推定する。
【0078】
即ち、ユーザの移動軌跡を表す各時刻の位置(緯度経度)のデータが、HMMの状態sjのいずれかに対応する地図上の一点から、所定の分散値の広がりを持って正規分布した確率変数の観測データであると考える。学習ブロック11は、各状態sjに対応する地図上の一点(平均μj)とその分散値σj、および状態遷移確率aijを最適化する。
【0079】
なお、状態siの初期確率πiは、一様な値に設定することができる。例えば、M個の状態siそれぞれの初期確率πiが、1/Mに設定される。
【0080】
現在地ノード推定部41は、学習により得られたユーザ活動モデル(HMM)に対して、ビタビアルゴリズムを適用し、移動履歴データx=x1,x2,・・・,xTが観測される尤度を最も大にする状態遷移の過程(状態の系列)(パス)(以下、最尤パスともいう)を求める。これにより、ユーザの現在地に対応する状態siが認識される。
【0081】
ここで、ビタビアルゴリズムとは、各状態siを始点とする状態遷移のパスの中で、時刻tに、状態siから状態sjに状態遷移する状態遷移確率aijと、その状態遷移において、移動履歴データx=x1,x2,・・・,xTのうちの時刻tのサンプル値xtが観測される確率(出力確率密度関数bj(x)から求められる出力確率)とを、処理後時系列データxの長さTに亘って累積した値(生起確率)を最大にするパス(最尤パス)を決定するアルゴリズムである。ビタビアルゴリズムの詳細については上述の文献AのP.347に記載されている。
【0082】
[学習プリプロセス部22の構成例]
図7は、学習ブロック11の学習プリプロセス部22の詳細構成例を示すブロック図である。
【0083】
学習プリプロセス部22は、データ接続分割部71、データ異常除去部72、再サンプリング処理部73、移動属性識別付与部74、および滞在状態加工部75により構成される。
【0084】
データ接続分割部71は、移動履歴データの接続および分割の処理を行う。データ接続分割部71には、移動履歴データが、センサデバイスから、1日単位などの所定の単位でログファイルとして供給される。従って、本来、ある目的地への移動途中で連続すべき移動履歴データが、日付を跨いだために分割されて取得されることがある。データ接続分割部71は、そのような分割された移動履歴データを接続する。具体的には、データ接続分割部71は、1つのログファイル内の最後の3次元(緯度、経度、時刻)データと、そのログファイルの次に作成されたログファイル内の最初の3次元データの時間差が所定の時間内であれば、それらのファイル内の移動履歴データを接続する。
【0085】
また、例えば、GPSセンサは、トンネルや地下では人工衛星を捕捉することができないため、移動履歴データの取得間隔が長くなることがある。移動履歴データが長い時間欠落している場合には、ユーザがどこにいたかを推定することが難しくなる。そこで、データ接続分割部71は、取得された移動履歴データにおいて、前後の取得時刻の間隔が所定の時間間隔(以下、欠落閾値時間という。)以上ある場合に、その間隔の前後で移動履歴データを分割する。ここで、欠落閾値時間は、例えば、5分、10分、1時間などである。
【0086】
データ異常除去部72は、移動履歴データの明らかな異常を除去する処理を行う。例えば、ある時刻の位置のデータが、その前後の位置と100m以上も離れていて、跳躍している場合、その位置のデータは異常である。そこで、データ異常除去部72は、ある時刻の位置のデータが、その前後の両方の位置と所定の距離以上離れている場合、その3次元データを移動履歴データから除去する。
【0087】
再サンプリング処理部73は、取得時刻の時間間隔が欠落閾値時間未満の欠落データを、線形補間等により補完する処理を行う。即ち、取得時刻の時間間隔が欠落閾値時間以上である場合には、データ接続分割部71により、移動履歴データが分割されるが、欠落閾値時間未満のデータの欠落は残っている。そこで、再サンプリング処理部73は、取得時刻の時間間隔が欠落閾値時間未満の欠落データを補完する。
【0088】
移動属性識別付与部74は、移動履歴の3次元データそれぞれが、同一場所に滞在(停止)している”滞在状態”か、または、移動している”移動状態”のいずれであるかの移動属性を識別し、付与する。これにより、移動履歴データの各3次元データに移動属性が付与された、移動属性付き移動履歴データが生成される。
【0089】
滞在状態加工部75は、移動属性識別付与部74から供給される移動属性付き移動履歴データに基づいて、移動属性が”滞在状態”の3次元データを加工する。より具体的には、滞在状態加工部75は、”滞在状態”の移動属性が所定時間(以下、滞在閾値時間という。)以上継続している場合、その前後で移動履歴データを分割する。また、滞在状態加工部75は、”滞在状態”の移動属性が滞在閾値時間未満で継続している場合には、その滞在閾値時間以内の所定時間続く、”滞在状態”の複数の3次元データの位置のデータをホールドする(同一位置のデータに修正する)。これにより、同一の目的地や経由地の移動履歴データに対して複数の”滞在状態”ノードが割り当てられることを防止することができる。換言すれば、同一の目的地や経由地を複数のノードで表現することを防止することができる。
【0090】
[学習プリプロセス部22の処理]
図8は、学習プリプロセス部22の学習プリプロセス処理を概念的に示したイメージ図である。
【0091】
図8上段に示される、再サンプリング処理部73によるデータ補完後の移動履歴データ81に対して、移動属性識別付与部74が、”滞在状態”または”移動状態”の移動属性を識別し、付与する。その結果、図8中段に示される、移動属性付き移動履歴データ82が生成される。
【0092】
図8中段の移動属性付き移動履歴データ82において、”m”および”m”は、”移動状態”の移動属性を表し、”u”は、”滞在状態”の移動属性を表す。なお、”m”と”m”は、同じ”移動状態”でも、移動手段(車、バス、電車、徒歩など)が異なる。
【0093】
そして、図8中段の、移動属性付き移動履歴データ82に対して、滞在状態加工部75により、移動履歴データを分割およびホールドする処理が実行され、図8下段の、移動属性付き移動履歴データ83(83Aおよび83B)が生成される。
【0094】
移動属性付き移動履歴データ83では、移動属性付き移動履歴データ82において2回目に発生した”移動状態”の箇所(3次元データ)で分割処理が行われ、移動属性付き移動履歴データ83Aと83Bに分割されている。
【0095】
分割処理では、最初に、移動属性付き移動履歴データ82の2回目に発生した”移動状態”までと、それ以降の複数の3次元データとで分割され、2つの移動属性付き移動履歴データ83Aおよび83Bとされる。次に、分割後の移動属性付き移動履歴データ83Aおよび83Bのうち、時間的に早い移動属性付き移動履歴データ83Aの最後の滞在閾値時間以上の複数の”移動状態”の3次元データが、1つの”滞在状態”の3次元データにまとめられる。これにより、不要な移動履歴データが削除されるので、学習時間を短縮することができる。
【0096】
なお、図8の例では、移動属性付き移動履歴データ82の3回目に発生した” 複数の移動状態”の3次元データも滞在閾値時間以上の”移動状態”が続くデータであり、同様の分割処理が行われている。しかし、分割後の後ろの3次元データが存在しないため、滞在閾値時間以上の複数の”移動状態”の3次元データが、1つの”滞在状態”の3次元データにまとめられるのみとなっている。
【0097】
一方、移動属性付き移動履歴データ83Aのうち、1回目の”移動状態”の移動履歴データでは、ホールド処理が実行されている。ホールド処理後は、3つの”移動状態”の3次元データ{(tk−1,xk−1,yk−1),(t,x,y),(tk+1,xk+1,yk+1)}が、{(tk−1,xk−1,yk−1),(t,xk−1,yk−1),(tk+1,xk−1,yk−1)}となっている。即ち、位置のデータが”移動状態”の最初の位置のデータに修正されている。なお、ホールド処理では、位置のデータは、”移動状態”の最初の位置のデータに変更するのではなく、位置の平均値、”移動状態”の期間の真ん中の時刻の位置のデータ等に変更してもよい。
【0098】
[移動属性識別付与部74の構成例]
図9は、移動属性識別付与部74の詳細構成例を示すブロック図である。
【0099】
移動属性識別付与部74は、移動速度演算部91、移動属性識別部92、および移動属性付与部93により構成される。
【0100】
移動速度演算部91は、供給される移動履歴データから移動速度を演算する。
【0101】
具体的には、一定の時間間隔でkステップ目(k個目)に得られるときの3次元データを、時刻t、経度y、緯度xと表すと、kステップ目のx方向の移動速度vxおよびy方向の移動速度vyは、次式(1)により計算することができる。
【0102】
【数1】

【0103】
式(1)では、緯度経度のデータをそのまま利用しているが、緯度経度を距離に変換したり、速度を時速や分速で表すように変換するなどの処理は、必要に応じて適宜行うことができる。
【0104】
また、移動速度演算部91は、式(1)で得られる移動速度vxおよびvyからさらに、式(2)で表されるkステップ目の移動速度vと進行方向の変化θを求め、これを利用することができる。
【0105】
【数2】

【0106】
式(2)で表される移動速度vと進行方向の変化θを利用する方が、式(1)の移動速度vxおよびvyよりも以下の点で、特徴をうまく取り出すことができる。
【0107】
1.移動速度vxおよびvyのデータの分布は、緯度経度軸に対して偏りが生じるため、同じ移動手段(電車や徒歩など)であっても角度が異なった場合に識別できない可能性があるが、移動速度vであればそのような可能性が少ない。
2.移動速度の絶対的な大きさ(|v|)だけで学習すると、機器のノイズによって生じる|v|のため、徒歩と滞在を区別できない。進行方向の変化も考慮することで、ノイズの影響を軽減することができる。
3.移動している場合は進行方向の変化が少ないが、滞在している場合は進行方向が定まらないので、進行方向の変化を使うと移動と滞在の識別がしやすい。
【0108】
以上の理由から、本実施の形態では、移動速度演算部91は、移動速度のデータとして、式(2)で表される移動速度vと進行方向の変化θを求め、移動属性識別部92に供給する。
【0109】
移動速度演算部91は、移動速度vと進行方向の変化θの演算を行う前に、ノイズ成分を除去するため、移動平均によるフィルタリング処理(前処理)を行うことができる。
【0110】
なお、センサデバイスのなかには、移動速度を出力できるものも存在する。そのようなセンサデバイスが採用されている場合、移動速度演算部91を省略し、センサデバイスが出力する移動速度をそのまま利用することができる。以下では、進行方向の変化θを、進行方向θと略記する。
【0111】
移動属性識別部92は、供給される移動速度に基づいて移動属性を識別し、認識結果を移動属性付与部93に供給する。より具体的には、移動属性識別部92は、ユーザの行動状態(移動状態)を確率的状態遷移モデル(HMM)として学習し、学習により得られた確率的状態遷移モデルを用いて移動属性を識別する。移動属性としては、少なくとも”滞在状態”と”移動状態”が存在する必要がある。本実施の形態では、図11等を参照して後述するように、移動属性識別部92は、”移動状態”を、さらに徒歩、自転車、車など、複数の移動手段によって分類した移動属性を出力する。
【0112】
移動属性付与部93は、再サンプリング処理部73からの、移動履歴データを構成する3次元データそれぞれに対し、移動属性識別部92で認識された移動属性を付与し、移動属性付き移動履歴データを生成して、滞在状態加工部75に出力する。
【0113】
次に、図10乃至図17を参照して、移動属性識別部92で使用される、ユーザの行動状態を表した確率的状態遷移モデルのパラメータの求め方について説明する。
【0114】
[移動属性識別部92の学習器の第1の構成例]
図10は、カテゴリHMMにより、移動属性識別部92で使用される確率的状態遷移モデルのパラメータを学習する学習器100Aの構成例を示している。
【0115】
カテゴリHMMでは、学習する教師データが予めどのカテゴリ(クラス)に属するデータであるのかが既知であり、カテゴリごとにHMMのパラメータが学習される。
【0116】
学習器100Aは、移動速度データ記憶部101、行動状態ラベリング部102、および行動状態学習部103により構成される。
【0117】
移動速度データ記憶部101は、学習用データとしての移動速度の時系列データを記憶する。
【0118】
行動状態ラベリング部102は、移動速度データ記憶部101から時系列に順次供給される移動速度のデータに対し、ユーザの行動状態をラベル(カテゴリ)として付与する。行動状態ラベリング部102は、移動速度のデータに行動状態が対応付けられたラベル済み移動速度データを行動状態学習部103に供給する。例えば、kステップ目の移動速度vと進行方向θに対して、行動状態を表すラベルMを付与したデータが行動状態学習部103に供給される。
【0119】
行動状態学習部103は、行動状態ラベリング部102から供給されるラベル済み移動速度データを、カテゴリごとに分類し、カテゴリ単位で、ユーザ活動モデル(HMM)のパラメータを学習する。学習の結果得られたカテゴリ毎のパラメータは移動属性識別部92に供給される。
【0120】
[行動状態の分類例]
図11は、行動状態をカテゴリごとに分類する場合の分類例を示している。
【0121】
図11に示されるように、まず、ユーザの行動状態は、滞在状態と移動状態に分類することができる。本実施の形態では、移動属性識別部92が認識するユーザの行動状態としては、上述したように、少なくとも滞在状態と移動状態が存在する必要があるので、この2つに分類することは必須である。
【0122】
さらに、移動状態は、移動手段によって、電車、車(バスなども含む)、自転車、徒歩に分類することができる。電車は、さらに、特急、快速、ローカルなどに分類することができ、車は、さらに、高速、一般道などに分類することができる。また、徒歩は、走る、普通、散歩などに分類することができる。
【0123】
本実施の形態では、ユーザの行動状態を、図11において斜線で示される“滞在”、“電車(快速)”、“電車(ローカル)”、“車(高速)”、“車(一般道)”、“自転車”、および“徒歩”に分類することとする。なお、“電車(特急)”は、学習用データが得られなかったため省略した。
【0124】
なお、カテゴリの分類の仕方が図11に示した例に限定されるものではないことは言うまでもない。また、移動手段による移動速度の変化はユーザによって大きく異なるものではないので、学習用データとしての移動速度の時系列データは、認識対象のユーザのものである必要はない。
【0125】
[行動状態ラベリング部102の処理例]
次に、図12および図13を参照して、行動状態ラベリング部102の処理例について説明する。
【0126】
図12は、行動状態ラベリング部102に供給される移動速度の時系列データの例を示している。
【0127】
図12では、行動状態ラベリング部102から供給される移動速度のデータ(v,θ)を、(t,v)および(t,θ)の形で示している。図12において、四角(■)のプロットは移動速度vを表し、丸(●)のプロットは進行方向θを表している。また、横軸は時間tを表し、右側の縦軸は進行方向θを、左側の縦軸は移動速度vを表す。
【0128】
図12の時間軸の下方に示されている“電車(ローカル)”、“徒歩”、“滞在”の文字は、説明のため付加したものである。図12の時系列データの最初は、ユーザが電車(ローカル)で移動中である場合の移動速度のデータであり、次が“徒歩”で移動中である場合、その次が“滞在”である場合の移動速度のデータとなっている。
【0129】
ユーザが“電車(ローカル)”で移動している場合、電車が駅で停車し、出発するとき加速し、再度減速して駅に停車することを繰り返すので、移動速度vのプロットが繰り返し上下に振れるという特徴が表れている。なお、電車が停止している場合でも移動速度が0になっていないのは、移動平均によるフィルタリング処理を行っているためである。
【0130】
また、ユーザが“徒歩”で移動している場合と“滞在”している場合は、最も区別しにくい状態であるが、移動平均によるフィルタリング処理により、移動速度vに明らかな違いが見られる。また、“滞在”では、進行方向θが瞬時に大きく変化する特徴がみられ、“徒歩”との差別化が容易であることがわかる。このように、移動平均によるフィルタリング処理、および、ユーザの移動を移動速度vと進行方向θで表すことにより、“徒歩”と“滞在”の区別が容易になっていることがわかる。
【0131】
なお、“電車(ローカル)”と“徒歩”の間の部分は、フィルタリング処理のため、行動の切り替わり点がはっきりしない部分である。
【0132】
図13は、図12に示した時系列データに対して、ラベル付けを行う例を示している。
【0133】
例えば、行動状態ラベリング部102は、図12に示した移動速度のデータをディスプレイに表示する。そして、ユーザは、ディスプレイに表示された移動速度のデータのうち、ラベル付けをしたい部分を矩形の領域で囲む操作を、マウスなどにより行う。また、ユーザは、指定したデータに対して付与するラベルをキーボードなどから入力する。行動状態ラベリング部102は、ユーザによって指定された矩形領域に含まれる移動速度のデータに、入力されたラベルを付与することにより、ラベル付けを行う。
【0134】
図13では、“徒歩”に相当する部分の移動速度のデータを矩形の領域で指示した例が示されている。なお、このとき、フィルタリング処理のため、行動の切り替わり点がはっきりしない部分については、指示する領域に含めないようにすることができる。時系列データの長さは、行動の違いが時系列データに明確に出る長さから決める。例えば、20ステップ(15秒×20ステップ=300秒)程度とすることができる。
【0135】
[行動状態学習部103の構成例]
図14は、図10の行動状態学習部103の構成例を示すブロック図である。
【0136】
行動状態学習部103は、分類部121とHMM学習部122乃至122により構成される。
【0137】
分類部121は、行動状態ラベリング部102から供給されるラベル済み移動速度データのラベルを参照し、ラベルに対応するHMM学習部122乃至122のいずれかに供給する。即ち、行動状態学習部103では、ラベル(カテゴリ)ごとにHMM学習部122が用意されており、行動状態ラベリング部102から供給されるラベル済み移動速度データが、ラベルごとに分類されて、供給される。
【0138】
HMM学習部122乃至122それぞれは、供給されるラベル済み移動速度データを用いて、学習モデル(HMM)を学習する。そして、HMM学習部122乃至122それぞれは、学習により得られるHMMのパラメータλを、図9の移動属性識別部92に供給する。
【0139】
HMM学習部122は、ラベルが“滞在”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“徒歩”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“自転車”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“電車(ローカル)”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“車(一般道)”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“電車(快速)”である場合の、学習モデル(HMM)を学習する。HMM学習部122は、ラベルが“車(高速)”である場合の、学習モデル(HMM)を学習する。
【0140】
[移動属性識別部92の第1の構成例]
図15は、学習器100Aで学習されたパラメータを利用する場合の移動属性識別部92である、移動属性識別部92Aの構成例を示すブロック図である。
【0141】
移動属性識別部92Aは、尤度計算部141乃至141と尤度比較部142とにより構成されている。
【0142】
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91(図9)から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“滞在”である尤度を計算する。
【0143】
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“徒歩”である尤度を計算する。
【0144】
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“自転車”である尤度を計算する。
【0145】
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“電車(ローカル)”である尤度を計算する。
【0146】
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“車(一般道)”である尤度を計算する。
【0147】
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“電車(快速)”である尤度を計算する。
【0148】
尤度計算部141は、HMM学習部122の学習により得られたパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データに対する尤度を計算する。即ち、尤度計算部141は、行動状態が“車(高速)”である尤度を計算する。
【0149】
尤度比較部142は、尤度計算部141乃至141それぞれから供給される尤度を比較し、尤度の最も高い行動状態を選択し、移動属性として出力する。
【0150】
[移動属性識別部92の学習器の第2の構成例]
図16は、マルチストリームHMMにより、移動属性識別部92で使用されるユーザ活動モデルのパラメータを学習する学習器100Bの構成例を示している。
【0151】
学習器100Bは、移動速度データ記憶部101、行動状態ラベリング部161、および行動状態学習部162により構成される。
【0152】
行動状態ラベリング部161は、移動速度データ記憶部101から時系列に順次供給される移動速度のデータに対し、ユーザの行動状態をラベル(行動モード)として付与する。行動状態ラベリング部161は、移動速度の時系列データ(v,θ)と、それと関連付けられた行動モードMの時系列データを行動状態学習部162に供給する。
【0153】
行動状態学習部162は、マルチストリームHMMにより、ユーザの行動状態を学習する。
【0154】
ここで、マルチストリームHMMは、通常のHMMと同様な遷移確率を有する状態ノードから、複数の異なる確率法則に従うデータが出力されるようなHMMである。マルチストリームHMMでは、パラメータλのうち、出力確率密度関数bj(x)が時系列データごとに別々に用意される。マルチストリームHMMでは、異なる種類の時系列データ(ストリーム)を関連付けながら学習することができる。
【0155】
行動状態学習部162には、連続量である移動速度vと進行方向θの時系列データと、離散量である行動モードMの時系列データが供給される。行動状態学習部162は、各状態ノードから出力される移動速度の分布パラメータと、行動モードの確率を学習する。学習により得られたマルチストリームHMMによれば、例えば、移動速度の時系列データから、現在の状態ノードが求められる。そして、求められた状態ノードから、行動モードを認識することができる。
【0156】
カテゴリHMMを用いた第1の構成例では、HMMをカテゴリごとに7個用意する必要があるが、マルチストリームHMMでは1個のHMMで十分である。ただし、状態ノードの数は、第1の構成例において7個のカテゴリで使用された状態ノードの総数と同程度用意する必要がある。
【0157】
[移動属性識別部92の第2の構成例]
図17は、学習器100Bで学習されたパラメータを利用する場合の移動属性識別部92である、移動属性識別部92Bの構成例を示すブロック図である。
【0158】
移動属性識別部92Bは、状態ノード認識部181と行動モード認識部182により構成される。
【0159】
状態ノード認識部181は、学習器100Bで学習されたマルチストリームHMMのパラメータを用いて、移動速度演算部91から供給される移動速度の時系列データから、マルチストリームHMMの状態ノードを認識する。状態ノード認識部181は、認識された現在の状態ノードのノード番号を行動モード認識部182に供給する。
【0160】
行動モード認識部182は、状態ノード認識部181で認識された状態ノードで、最も確率の高い行動モードを、移動属性として出力する。
【0161】
[学習プリプロセス部22の処理]
図18は、学習プリプロセス部22による学習プリプロセス処理のフローチャートである。
【0162】
学習プリプロセス処理では、最初に、ステップS1において、データ接続分割部71は、移動履歴データの接続および分割の処理を行う。
【0163】
ステップS2において、データ異常除去部72は、移動履歴データの明らかな異常を除去する処理を行う。
【0164】
ステップS3において、再サンプリング処理部73は、取得時刻の時間間隔が滞在閾値時間未満の欠落データを、線形補間等により補完する処理を行う。
【0165】
ステップS4において、移動属性識別付与部74は、移動履歴の3次元データそれぞれに対し、”滞在状態”かまたは”移動状態”の移動属性を識別し、付与する。
【0166】
ステップS5において、滞在状態加工部75は、移動属性識別付与部74から供給される属性付き移動履歴データに基づいて、移動属性が”滞在状態”の3次元データを加工する。そして、滞在状態加工部75は、加工処理後の、移動属性付き移動履歴データを学習メインプロセス部23に出力して、処理を終了する。
【0167】
以上のように、学習プリプロセス部22では、移動履歴データが、必要に応じて分割等され、移動属性が付与された、移動属性付き移動履歴データとされて、学習メインプロセス部23に供給される。
【0168】
[学習メインプロセス部23の処理]
次に、図19のフローチャートを参照して、学習メインプロセス部23の処理(学習メインプロセス処理)について説明する。
【0169】
学習メインプロセス処理では、初めに、ステップS11において、学習メインプロセス部23は、移動履歴データに対する各状態の尤度を計算する。具体的には、学習メインプロセス部23は、ユーザ活動モデルを表すHMMの状態siへの遷移時に、移動履歴データの時刻tの位置のデータxtが出力されると仮定した場合の状態尤度P(si|xt)を、次式(3)により計算する。
【0170】
【数3】

なお、時刻tは、時系列データの測定時刻ではなく、時系列データの順番(ステップ数)を表し、1からT(時系列データのサンプル数)までの値をとる。
【0171】
また、式(3)のDは、移動履歴データの次元数を示している。いまの場合、移動履歴データは、時刻、緯度、および経度の3次元なので、D=3となる。そして、xt(1)、xt(2)、xt(3)が、それぞれ移動履歴データxtの時刻、緯度、経度を表すものとする。また、状態siへの遷移時に出力される移動履歴データの時刻、緯度、および経度の出力確率密度関数がそれぞれ単一正規分布に従い、μsi(1)、σsi(1)は、時刻の出力確率密度関数の中心値および標準偏差を表す。また、μsi(2)、σsi(2)は、緯度の出力確率密度関数の中心値および標準偏差を表し、μsi(3)、σsi(3)は、経度の出力確率密度関数の中心値および標準偏差を表すものとする。
【0172】
なお、式(3)は、Baum-Welchの最尤推定法で一般的に用いられる式である。
【0173】
学習メインプロセス部23は、ステップS11において、全ての状態siと3次元データxtの組み合わせについて、式(3)により状態尤度P(si|xt)を計算する。
【0174】
次に、ステップS12において、学習メインプロセス部23は、各時刻tにおける全ての状態siのフォワード尤度αt(si)を計算する。即ち、学習メインプロセス部23は、次式(4)および(5)を用いて、時刻tにおける状態siのフォワード尤度αt(si)を時刻1から最終の時刻Tまで順番に計算する。
【0175】
【数4】

なお、式(4)のπsiは、状態siの初期確率を表す。また、式(5)のajiは、状態sjから状態siへの状態遷移確率を表す。なお、初期確率πsiおよび状態遷移確率ajiの初期値は、例えば、外部から与えられる。式(4)および式(5)は、Baum-Welchの最尤推定法のフォワードアルゴリズムにおいて一般的に用いられる式である。
【0176】
ステップS13において、学習メインプロセス部23は、各時刻tにおける全ての状態siのバックワード尤度βt(si)を計算する。即ち、学習メインプロセス部23は、次式(6)および(7)を用いて、時刻tにおける状態siのバックワード尤度βt(si)を、最終の時刻Tから時刻1まで逆順に計算する。
【0177】
【数5】

【0178】
式(6)および式(7)は、Baum-Welchの最尤推定法のバックワードアルゴリズムにおいて一般的に用いられる式である。式(6)は、時刻Tに各状態siである確率が全て等しいものとしている。
【0179】
このように、ステップS11乃至S13の処理により、移動履歴データに対する隠れマルコフモデルの各種の尤度が計算される。
【0180】
ステップS14において、学習メインプロセス部23は、初期確率、状態遷移確率を更新する。即ち、学習メインプロセス部23は、各状態siの初期確率πsi、各状態間の状態遷移確率aijを、次の式(8)および式(9)で求まる初期確率πsi’、状態遷移確率aij’にそれぞれ更新する。
【0181】
【数6】

式(8)および式(9)は、Baum-Welchの最尤推定法で一般的に用いられる式である。
【0182】
ステップS15において、学習メインプロセス部23は、観測確率を更新する。即ち、学習メインプロセス部23は、各状態siの出力確率密度関数の中心値μsi(d)、分散σsi(d)2を、次の式(10)および式(11)で求まる中心値μsi(d)’、分散σsi(d)’2にそれぞれ更新する。
【0183】
【数7】

なお、式(10)および式(11)のdは、データの次元を表し、いまの場合、1,2、または3のいずれかとなる。式(10)および式(11)は、Baum-Welchの最尤推定法で一般的に用いられる式である。
【0184】
ステップS16において、学習メインプロセス部23は、パラメータの更新を終了するか否かを判定する。例えば、各尤度の増分が所定の値以下となり、パラメータの更新の収束条件を満たした場合、学習メインプロセス部23は、パラメータの更新を終了すると判定する。あるいは、ステップS11乃至S15の処理を規定の回数繰り返し実行した場合、パラメータの更新を終了すると判定するとしてもよい。
【0185】
ステップS16で、パラメータの更新を終了しないと判定された場合、処理はステップS11に戻る。
【0186】
ステップS11では、学習メインプロセス部23は、更新されたパラメータに基づいて、各状態の尤度が計算される。即ち、ステップS14およびS15の処理で更新された、各状態siの初期確率πsi、中心値μsi(d)および分散σsi(d)2、並びに、各状態間の状態遷移確率aijを示すデータに基づいて、各状態の尤度が計算される。
【0187】
その後、同様にステップS12乃至S15の処理が実行される。これにより、状態siの系列の各種の尤度、すなわち、状態尤度P(si|xt)、フォワード尤度αt(si)、バックワード尤度βt(si)が次第に増加し、最終的に最大になるように、HMMのパラメータの更新が行われる。そして、ステップS16において、再度、パラメータの更新を終了するか否かが判定される。
【0188】
ステップS16で、パラメータの更新を終了すると判定された場合、処理はステップS17に進む。
【0189】
ステップS17において、学習メインプロセス部23は、最終的なパラメータをユーザ別モデルパラメータ記憶部12と目的地経由地検出部25(図1)に出力する。即ち、学習メインプロセス部23は、最終的に求められた、各状態siの初期確率πsi、中心値μsi(d)および分散σsi(d)2、並びに、各状態間の状態遷移確率aijを示すデータを、ユーザ別モデルパラメータ記憶部12と目的地経由地検出部25(図1)に出力する。その後、学習メインプロセス処理は終了する。
【0190】
[学習ポストプロセス部24の構成例]
次に、学習ポストプロセス部24の詳細について説明する。
【0191】
図20は、学習ポストプロセス部24の詳細構成例を示すブロック図である。
【0192】
学習ポストプロセス部24は、状態系列生成部201と状態系列修正部202により構成される。状態系列生成部201と状態系列修正部202には、学習メインプロセス部23が学習により求めたパラメータが供給される。
【0193】
状態系列生成部201は、学習プリプロセス部22で生成された移動属性付き移動履歴データを、ユーザ活動モデルの状態ノードの時系列データ(状態系列データ)に変換し、状態系列修正部202に供給する。具体的には、具体的には、状態系列生成部201は、学習メインプロセス部23から供給されたパラメータに基づくユーザ活動モデルから、移動履歴データの各3次元データに対応するユーザ活動モデルを認識する。そして、状態系列生成部201は、認識結果としてのユーザの状態ノードsiを、順次、状態系列修正部202に供給する。
【0194】
状態系列修正部202は、状態系列生成部201から供給される状態系列データを必要に応じて修正し、修正後の状態系列データを、目的地経由地検出部25(図1)に供給する。状態系列修正部202で状態系列データの修正がされない場合には、状態系列生成部201から供給される状態系列データが、そのまま、目的地経由地検出部25に供給される。
【0195】
[状態系列修正部202の処理]
図21乃至図25を参照して、状態系列修正部202が行う状態系列データの修正処理について説明する。
【0196】
図21は、状態系列修正部202による修正処理を示している。
【0197】
本実施の形態において、状態系列生成部201から供給される状態系列データは、ユーザの移動履歴に対応するデータである。ユーザの移動は、ある目的地から他の目的地へのleft-to-right型の状態遷移モデルに近似できると考えられる。
【0198】
そこで、状態系列修正部202は、状態系列生成部201から供給される状態系列データを、left-to-right型の状態系列データとなるように簡素化する修正を行う。
【0199】
状態系列修正部202は、状態系列データを、left-to-rightの制約を満たすように修正するために、最初に、状態系列データで、ループ、即ち、同一の状態ノードに戻る部分があるかどうかを探索する。そして、状態系列修正部202は、ループが検出された場合、そのループをマージ(その状態ノードを削除して親ノードに吸収)するか、または、スプリット(新たな状態ノードを生成して分割)する。
【0200】
より詳しくは、状態系列修正部202は、ループ内のノード数が1つである場合には、マージすることによって、状態系列データを修正し、ループ内のノード数が2以上である場合には、スプリットすることによって、状態系列データを修正する。
【0201】
[状態系列修正部202のループ修正処理]
図22は、状態系列修正部202によるループ修正処理のフローチャートを示している。状態系列修正部202は、所定のステップ数の状態系列データを記憶する内部メモリを有し、状態系列生成部201から、ある程度のステップ数の状態系列データが内部メモリに蓄積されたとき、この処理が開始される。
【0202】
初めに、ステップS31において、状態系列修正部202は、状態系列生成部201から供給された状態系列データに対し、注目ノードを決定する。即ち、状態系列修正部202は、状態系列生成部201から供給された状態系列データのなかの先頭の状態ノードを選択し、それを注目ノードとする。
【0203】
ステップS32において、状態系列修正部202は、注目ノードのノード番号が1つ前のノードと同じかを判定する。状態遷移が自己遷移である場合には、注目ノードのノード番号が同じとなる。従って、換言すれば、状態系列修正部202は、自己遷移であるか否かを判定する。なお、先頭の状態ノードが注目ノードである場合には、注目ノードのノード番号が1つ前のノードと同じであると判定する。
【0204】
ステップS32で、注目ノードのノード番号が1つ前のノードと同じであると判定された場合、処理は後述するステップS37に進む。
【0205】
一方、ステップS32で、注目ノードのノード番号が1つ前のノードと同じではないと判定された場合、処理はステップS33に進み、状態系列修正部202は、注目ノードが過去の状態系列に存在するかを判定する。状態系列データにループが存在し、ループして過去の状態系列に戻ってきたとき、ステップS33において、注目ノードが過去の状態系列に存在すると判定される。
【0206】
ステップS33で、注目ノードが過去の状態系列に存在しないと判定された場合、処理は後述するステップS37に進む。
【0207】
一方、ステップS33で、注目ノードが過去の状態系列に存在すると判定された場合、処理はステップS34に進み、状態系列修正部202は、ループ内のノード数が1つであるかを判定する。
【0208】
ステップS34で、ループ内のノード数が1つであると判定された場合、ステップS35において、状態系列修正部202は、ループのノードを親ノード(戻り先のノード)にマージする。
【0209】
ステップS34で、ループ内のノード数が2以上であると判定された場合、ステップS36において、状態系列修正部202は、新しいノードを生成し、分割する。
【0210】
ステップS35またはS36の処理後、ステップS37において、状態系列データに、注目ノードの次のノードがあるかを判定する。
【0211】
ステップS37で、注目ノードの次のノードがあると判定された場合、ステップS38において、状態系列修正部202は、次のノードを注目ノードに決定し、処理をステップS32に戻す。
【0212】
一方、ステップS37で、注目ノードの次のノードがないと判定された場合、即ち、状態系列生成部201から供給された状態系列データの全ての状態ノードについてループを探索した場合、処理は終了する。
【0213】
状態系列修正部202は、以上の処理を行うことにより、状態系列生成部201から供給される状態系列データを修正して、修正後の状態系列データを出力する。
【0214】
なお、本実施の形態では、状態系列修正部202が、検出されたループを、マージまたはスプリットのいずれで修正するかを、ループ内のノード数が1つであるか否かによって判断した。しかし、マージまたはスプリットのいずれで修正した場合に尤度が高くなるか、または、学習モデルの複雑さなど、その他の判断基準で、マージまたはスプリットのいずれで修正するかを判断するようにしてもよい。
【0215】
また、他の情報が使える場合にはそれを用いて、マージまたはスプリットのいずれで修正するかを判断することも可能である。たとえば、ループ内のノードが1つであっても、例えば、目的地候補のノードなど、重要なノードであるかもしれない。このような場合は、マージでなくて、スプリットの処理をすべきである。また、ループ内のノード数が2以上あっても、いずれも重要でないノードかもしれない。また、あるいは、全ノード数に制約があってこれ以上増やせない場合なども考えられる。このような場合には、状況に応じて変更をすればよい。
【0216】
[状態系列修正部202によるその他の修正処理の説明]
次に、状態系列修正部202による状態系列データのその他の修正処理の例を説明する。
【0217】
図23は、1つのノードが複数の系列で共有されている共有ノードを修正する処理の例を示している。
【0218】
図23の上段の状態遷移図において、斜線を付して示される真ん中のノードは、共有ノードとなっている。即ち、共有ノードの前後のノードは、それぞれ別々のノードとなっている。状態系列修正部202は、図23の下段の状態遷移図のように、共有ノードをスプリット(新たな状態ノードを生成して分割)し、2つの系列に、元の状態系列データを修正する。
【0219】
ノードの尤度が低い場合には、本来別々のノードになるべきところが、初期条件、モデルのノード数の不足などで、学習時にローカルミニマムに陥って、このような共有ノードとなることがある。3次元データを表すノードでノードの尤度が低い場合とは、ノードが示す位置(中心位置)と、実際のデータの位置との距離が大きい場合を意味する。
【0220】
状態系列修正部202には、共有ノードをスプリットする処理を、状態系列データの修正処理として行わせることで、初期条件、モデルのノード数の不足などで発生した共有ノードを解消することができる。換言すれば、学習メインプロセス部23による拘束条件(スパース制約によるエルゴディックHMM)では実現できない処理を、状態系列修正部202で事後的(付加的に)実現することができる。
【0221】
[状態系列修正部202の共有ノード修正処理]
図24は、状態系列修正部202による共有ノード修正処理のフローチャートを示している。状態系列生成部201から、全ての状態系列データが内部メモリに蓄積されたとき、この処理が開始される。
【0222】
初めに、ステップS51において、状態系列修正部202は、内部メモリに記憶されている状態系列データのなかで、尤度が所定値以下のノードである低尤度ノードを検索して、ステップS52に進む。本実施の形態では、学習により得られたノードの中心位置と、実際のデータの位置との距離が大きいノードが、低尤度ノードとなる。
【0223】
ステップS52において、状態系列修正部202は、低尤度ノードが検出されたかを判定する。
【0224】
ステップS52で、低尤度ノードが検出されたと判定された場合、処理はステップS53に進み、状態系列修正部202は、検出された低尤度ノードを注目ノードに決定する。
【0225】
ステップS54において、状態系列修正部202は、注目ノードが共有ノードであるかを判定する。ステップS54で、注目ノードが共有ノードではないと判定された場合、処理はステップS51に戻る。
【0226】
一方、ステップS54で、注目ノードが共有ノードであると判定された場合、処理はステップS55に進み、状態系列修正部202は、前後のノードが複数あるかを判定する。
【0227】
ステップS55で、前後のノードのいずれかが複数ないと判定された場合、処理はステップS51に戻る。一方、ステップS55で、前後のノードのいずれもが複数あると判定された場合、処理はステップS56に進み、状態系列修正部202は、新しいノードを生成することにより、元の状態系列データを、2つの系列に修正する。ステップS56の処理後も、処理はステップS51に戻る。
【0228】
そして、上述したステップS51乃至S56の処理を繰り返し実行することで、全ての低尤度ノードが順次検出され、共有ノードがスプリットされる。
【0229】
全ての低尤度ノードが検出された場合、ステップS52で、低尤度ノードが検出されなかったと判定され、処理がステップS57に進む。そして、ステップS57において、状態系列修正部202は、元の状態系列データに対し修正がなされた修正後の状態系列データを出力して、処理を終了する。低尤度ノードが1つも検出されない場合には、元の状態系列データがそのまま出力される。
【0230】
状態系列修正部202は、以上のような共有ノード修正処理を行って、状態系列生成部201から供給される状態系列データを修正することができる。
【0231】
なお、図23および図24に示した処理では、前と後ろの両方について複数の系列がある場合のみ、ノードをスプリットするようにした。しかし、図25右側に示すように、前または後ろのいずれか一方のみ、複数の系列がある場合であっても、ノードをスプリットするようにしてもよい。
【0232】
また、図25左側に示すように、前と後ろの両方で複数の系列が存在しない場合であっても、スプリットした方がノードの尤度が高くなる場合には、スプリットするようにしてもよい。いずれの場合においても、スプリットすることにより、尤度が修正前より高くなることが条件である。また、図25左側に示すように、前と後ろの両方で複数の系列が存在しない場合のスプリットでは、修正前後でステップ数が変わらないように、修正対象のノードにおいて、自己遷移が発生していることも条件となる。
【0233】
以上のような状態系列修正部202による状態系列データの修正処理によれば、状態系列データに拘束を新しく加えるのみならず、学習でローカルミニマムに陥って十分、尤度を高くすることができなかった場合などの修正が可能である。
【0234】
図23および図24に示した処理では、学習用データに対する尤度のチェックを行っているが、学習用データと同時に得られた他のデータによる尤度のチェックを行うようにしてもよい。他のデータ系列のうち、学習モデルの中の状態遷移に影響を及ぼすものがあれば、通常、マルチモーダルモデルとして学習することになる。しかし、そのデータ系列の寄与が大きくない、あるいは、不定であるならば、寄与の大きなデータのみで学習するようにして、学習されたモデルから得られる状態系列データを状態系列修正部202における修正時にのみ、その影響を反映させることで、寄与の少ない時系列データが学習モデルに必要以上の影響を与えるのを回避することができる。
【0235】
[目的地経由地検出部25の処理]
次に、図26を参照して、目的地経由地検出部25の処理について説明する。
【0236】
上述したように、学習メインプロセス部23は、移動履歴データを分割およびホールドする処理が行われた後の(移動属性付き)移動履歴データを学習用データとして、ユーザ活動モデルのパラメータを学習する。そして、学習ポストプロセス部24が、学習により求めたパラメータを用いて、移動履歴データに対応する状態系列データを生成する。
【0237】
図26Aは、図8下段に示した、学習プリプロセス部22によって移動履歴データの分割およびホールドが行われた後の、移動属性付き移動履歴データ83Aおよび83Bを示している。
【0238】
図26Bは、図8下段に示した移動属性付き移動履歴データ83Aおよび83Bに、対応する状態系列データを併せて示した図である。
【0239】
移動属性付き移動履歴データ83Aには、s,s,・・・,s,・・・sの状態系列ノードが対応する。移動属性付き移動履歴データ83Bには、st+1,st+2,・・・,sの状態系列ノードが対応する。
【0240】
目的地経由地検出部25は、1まとまりの移動属性付き移動履歴データの最後の”滞在状態(u)”の3次元データに対応する状態ノードを検出し、目的地の属性を付与する。図26Bの例では、移動属性付き移動履歴データ83Aの状態ノードsと、移動属性付き移動履歴データ83Bの状態ノードsに対して、目的地の属性が付与される。状態ノードsと状態ノードsは、いずれも滞在状態が滞在閾値時間以上継続していた状態ノードである。このように、目的地経由地検出部25によって、滞在状態が滞在閾値時間以上継続する移動履歴データに対応する状態ノードが、目的地に推定される。
【0241】
なお、図8を参照して説明した分割処理では、分割した移動履歴データの最後の滞在閾値時間以上の複数の”移動状態”が、1つの”滞在状態”に縮減された。しかしながら、分割処理では、移動履歴データの最後の滞在閾値時間以上の複数の”移動状態”のすべてを、消去するようにしてもよい。図26Aの例で説明すると、移動属性付き移動履歴データ83Aおよび83Bそれぞれの最後の”滞在状態(u)”の3次元データを省略するようにしてもよい。この場合には、目的地経由地検出部25は、1まとまりの移動属性付き移動履歴データの最後の3次元データに対応する状態ノードに、目的地の属性を付与する。図26Bの例で説明すると、移動属性付き移動履歴データ83Aの状態ノードsの1つ前の状態ノードst−1、および、移動属性付き移動履歴データ83Bの状態ノードsの1つ前の状態ノードsT−1を目的地とすればよい。
【0242】
目的地経由地検出部25は、また、1まとまりの移動属性付き移動履歴データの途中にある”滞在状態(u)”の3次元データに対応する状態ノードを検出し、経由地の属性を付与する。即ち、滞在状態の継続時間が1の分割閾値時間未満である移動履歴データに対応する状態ノードが、経由地に推定される。図26Bの例で説明すると、移動属性付き移動履歴データ83Aの状態ノードsが、経由地に決定される。
【0243】
なお、目的地経由地検出部25は、図26Cに示すように、移動手段が変更されたとき、変更前の最後の状態ノードsにも、経由地の属性を付与するようにしてもよい。
【0244】
[学習ブロック11の処理]
図27のフローチャートを参照して、学習ブロック11全体の処理について説明する。
【0245】
初めに、ステップS71において、履歴データ蓄積部21は、センサデバイスから供給される、移動履歴データを、学習用データとして蓄積する。
【0246】
ステップS72において、学習プリプロセス部22は、図18を参照して説明した、学習プリプロセス処理を実行する。即ち、履歴データ蓄積部21に蓄積されている移動履歴データの接続および分割の処理、移動履歴データを構成する3次元データそれぞれに、”滞在状態”または”移動状態”の移動属性の付与、などを行う。
【0247】
ステップS73において、学習メインプロセス部23は、ユーザの移動履歴を学習する。即ち、学習メインプロセス部23は、ユーザの移動履歴をユーザ活動モデルとして確率的状態遷移モデル(HMM)にモデル化したときのパラメータを求める。学習により得られたパラメータは、学習ポストプロセス部24とユーザ別モデルパラメータ記憶部12に供給され、ユーザ別モデルパラメータ記憶部12で記憶される。
【0248】
ステップS74において、学習ポストプロセス部24は、学習により得られたユーザ活動モデルを用いて、移動履歴データに対応する状態ノード系列データを生成する。
【0249】
ステップS75において、目的地経由地検出部25は、移動属性付き移動履歴データに対応する状態系列ノードの所定の状態ノードに、目的地の属性を付与する。より具体的には、目的地経由地検出部25は、滞在状態が滞在閾値時間以上継続する移動履歴データに対応する状態ノードに、目的地の属性を付与する。
【0250】
ステップS76において、目的地経由地検出部25は、移動属性付き移動履歴データに対応する状態系列ノードの所定の状態ノードに、経由地の属性を付与する。より具体的には、目的地経由地検出部25は、滞在状態の継続時間が滞在閾値時間未満である移動履歴データに対応する状態ノードに、経由地の属性を付与する。
【0251】
ステップS77において、目的地経由地検出部25は、状態ノードに付与された目的地、経由地の属性についての情報を、ユーザ別モデルパラメータ記憶部12に記憶させ、処理を終了する。
【0252】
[予測メインプロセス部33の処理]
次に、予測ブロック13が行う処理について説明する。
【0253】
初めに、予測メインプロセス部33による、現在地ノード以降のツリー探索処理について説明する。
【0254】
現在地ノード以降のツリー探索処理は、予測メインプロセス部33の現在地ノード推定部41が推定した現在地ノードから、到達可能な目的地ノードと、そこまでの経路を求める処理である。到達可能な目的地ノードは、現在地ノードから遷移可能なノードで構成されるツリー構造の中に存在する。従って、ツリーを構成する状態ノードのなかから、目的地ノードを探索することで、目的地を予測することができる。また、現在地ノード以降のツリー探索処理において、経由地の属性が付与された状態ノード(以下、経由地ノードという。)が検出された場合には、経由地までの経路も記憶される。
【0255】
学習により得られたHMMの各状態siは、地図上の所定の点(位置)を表し、状態siと状態sjが結ばれているとき、状態siから状態sjを移動する経路を表していると考えることができる。
【0256】
この場合、状態siに対応する各点は、端点、通過点、分岐点、ループのいずれかに分類することができる。端点とは、自己遷移以外の確率が極めて小さく(自己遷移以外の確率が所定の値以下であり)、次に移動可能な点がない点である。通過点とは、自己遷移以外に有意な遷移が一つある、換言すれば、次に移動可能な点が一つある点である。分岐点とは、自己遷移以外に有意な遷移が二つ以上ある、換言すれば、次に移動可能な点が二つ以上ある点である。ループとは、これまで通過した経路上のどれかと一致する点である。
【0257】
目的地への経路を探索する場合、異なる経路がある場合には、それぞれの経路について必要時間等の情報を提示することが望まれる。そこで、可能な経路を過不足なく探索するために、次の条件を設定する。
(1)一度分岐した経路は再度合流した場合でも、別の経路とみなす。
(2)探索中の経路が分岐点に達した場合に、未探索リストを作成し、未探索リストの分岐先の探索を行う。
(3)経路内に端点またはループが現れた場合、その経路の探索を終了する。なお、現在の点から、1つ前の点に経路を逆戻りする場合はループに含む。
【0258】
図28は、予測メインプロセス部33の目的地経由地予測部42による、現在地ノード以降のツリー探索処理のフローチャートである。
【0259】
図28の処理では、最初に、ステップS91において、目的地経由地予測部42は、予測メインプロセス部33の現在地ノード推定部41により推定された現在地ノードを取得し、注目するノードである注目ノードに設定する。
【0260】
ステップS92において、目的地経由地予測部42は、注目ノードに遷移先があるかを判定する。ステップS92で、注目ノードに遷移先がないと判定された場合、処理は後述するステップS101に進む。
【0261】
一方、ステップS92で、注目ノードに遷移先があると判定された場合、処理はステップS93に進み、目的地経由地予測部42は、遷移先が目的地ノードであるかを判定する。
【0262】
ステップS93で、遷移先が目的地ノードであると判定された場合、処理はステップS94に進み、目的地経由地予測部42は、これまでの経路(状態ノード系列)を内部メモリの探索結果リストに記憶する。ステップS94の後、処理はステップS101に進む。
【0263】
一方、ステップS93で、遷移先が目的地ノードではないと判定された場合、処理はステップS95に進み、目的地経由地予測部42は、遷移先が経由地ノードであるかを判定する。
【0264】
ステップS95で、遷移先が経由地ノードであると判定された場合、処理はステップS95に進み、目的地経由地予測部42は、これまでの経路(状態ノード系列)を内部メモリの探索結果リストに記憶する。
【0265】
目的地までの代表経路、到達確率、および所要時間を予測結果として出力するためには、探索結果リストには、遷移先が目的地であるときの経路のみを記憶すればよい。しかしながら、遷移先が経由地であるときの経路も記憶することにより、経由地までの経路、確率、および時間が必要になったときに即座に求めることができる。
【0266】
ステップS95で遷移先が経由地ノードではないと判定された場合、または、ステップS96の後、処理はステップS97に進み、目的地経由地予測部42は、遷移先が分岐点かを判定する。
【0267】
ステップS97で、遷移先が分岐点であると判定された場合、処理はステップS98に進み、目的地経由地予測部42は、分岐先の2つの状態ノードを内部メモリの未探索リストに記憶する(追加する)。ステップS98の後、処理はステップS101に進む。なお、分岐先が探索中の経路のいずれかの状態ノードである場合はループとなるので、目的地経由地予測部42は、その分岐先の状態ノードについては未探索リストに記憶させない。
【0268】
ステップS97で、遷移先が分岐点ではないと判定された場合、処理はステップS99に進み、目的地経由地予測部42は、遷移先が端点であるかを判定する。ステップS99で、遷移先が端点であると判定された場合、処理はステップS101に進む。
【0269】
一方、ステップS99で、遷移先が端点ではないと判定された場合、処理はステップS100に進み、目的地経由地予測部42は、遷移先の状態ノードを注目ノードに設定し、処理をステップS92に戻す。即ち、遷移先が、目的地ノード、経由地ノード、分岐点、および端点のいずれでもない場合には、探索対象の状態ノードが、遷移先の次の状態ノードに進められる。
【0270】
ステップS94,S98、またはS99の処理の後、処理がステップS101に進められた場合、目的地経由地予測部42は、未探索リストに登録されている状態ノードがあるか、即ち、未探索の分岐先があるかを判定する。
【0271】
ステップS101で、未探索の分岐先があると判定された場合、処理はステップS102に進み、目的地経由地予測部42は、未探索リストの最上位の分岐先の状態ノードを、注目ノードに設定し、注目ノードまでの経路を読み出す。そして、処理がステップS92に戻される。
【0272】
一方、ステップS101で、未探索の分岐先がないと判定された場合、ツリー探索処理は終了する。
【0273】
以上のように、ツリー探索処理では、ユーザの現在地ノードから遷移可能な状態ノードでなるツリー構造において、現在地ノードを出発点として、目的地ノード若しくは遷移先のない終端ノード(端点)になるまで全ての状態ノードを探索する処理が行われる。そして、ユーザの現在地から目的地までの経路が、現在地ノードからの状態ノード系列として、探索結果リストに記憶される。なお、ツリー探索処理は、探索回数が終了条件としての所定の回数を満たすまで探索するようにしてもよい。
【0274】
[ツリー探索処理の例]
図29を参照して、目的地経由地予測部42のツリー探索処理についてさらに説明する。
【0275】
図29の例において、状態sが現在地である場合、次のような3通りの経路が少なくとも探索されることになる。1つめの経路は、状態sから状態s,状態s等を経由して状態s10までの経路(以下、経路Aともいう。)である。2つめの経路は、状態sから状態s,状態s11,状態s14,状態s23等を経由して状態s29までの経路(以下、経路Bともいう。)である。3つめの経路は、状態sから状態s,状態s11,状態s19,状態s23等を経由して状態s29までの経路(以下、経路Cともいう。)である。
【0276】
目的地経由地予測部42は、探索された各経路が選択される確率(経路の選択確率)を計算する。経路の選択確率は、経路を構成する状態間の遷移確率を順次乗算することで求められる。ただし、次の状態に遷移する場合のみを考慮し、その場所に滞留する場合は考慮する必要がないので、学習により求められた各状態の状態遷移確率aijから、自己遷移確率を除いて規格化された遷移確率[aij]を用いて、経路の選択確率が求められる。
【0277】
自己遷移確率を除いて規格化された遷移確率[aij]は、次式(12)で表すことができる。
【数8】

ここで、δは、クロネッカー関数を表し、添え字のiとjが一致するときのみ1となり、それ以外は0となる関数である。
【0278】
したがって、例えば、図29の状態sの状態遷移確率aijが、自己遷移確率a5,5=0.5,遷移確率a5,6=0.2,遷移確率a5,11=0.3である場合、状態sから状態sまたは状態s11に分岐する場合の遷移確率[a5,6]および遷移確率[a5,11]は、それぞれ、0.4,0.6となる。
【0279】
探索された経路の状態siのノード番号iが、(y,y,・・・,y)であるとき、この経路の選択確率は、規格化された遷移確率[aij]を用いて、次式(13)で表すことができる。
【数9】

【0280】
なお、実際には、通過点での規格化された遷移確率[aij]は1であるので、経路の選択確率は、分岐する際の規格化された遷移確率[aij]を順次乗算すれば足りる。従って、目的地経由地予測部42は、図28のツリー探索処理を実行しながら、同時に、選択された経路の選択確率を式(13)により計算することができる。
【0281】
図29の例では、経路Aの選択確率は、0.4である。また、経路Bの選択確率は、0.24=0.6×0.4である。経路Cの選択確率は、0.36=0.6×0.6である。そして、計算された経路の選択確率の総和は1=0.4+0.24+0.36であり、過不足ない探索を実現することができることがわかる。
【0282】
図29の例では、現在地の状態sから注目ノードが順次進められ、状態sが注目ノードであるとき、遷移先の状態sが分岐点であるため、図28のステップS98が実行され、図30Aに示されるように、分岐先の状態s11と状態sが未探索リストに記憶される。ここで、状態s11と状態sでは、状態s11の選択確率が高いため、状態s11が未探索リストの上位に記憶される。
【0283】
そして、図28のステップS101およびS102が実行され、未探索リストの上位に記憶されている、状態s11が注目ノードに設定され、状態s11以降の経路が探索される。状態s11が注目ノードに設定されたとき、図30Bに示されるように、未探索リストから、状態s11が削除される。
【0284】
そして、状態s11を注目ノードとして探索が進められると、状態s14と状態s19の分岐先が検出されるので、図28のステップS98が実行され、状態s14と状態s19が未探索リストに記憶される。このとき、状態s14と状態s19は、現在の未探索リストの最上位に記憶され、また、状態s14と状態s19では、状態s19の選択確率が高いため、状態s19が状態s14より上位に記憶される。従って、未探索リストは、図30Cに示されるようになる。
【0285】
以下同様に、図28のステップS101およびS102が実行され、未探索リストの上位に記憶されている、状態s19が注目ノードに設定され、状態s19以降の経路が探索される。状態s19が注目ノードに設定されたとき、図30Dに示されるように、未探索リストから、状態s19が削除される。
【0286】
以上のように、目的地経由地予測部42によるツリー探索処理は、検出された分岐先を未探索リストの最上位に記録させることで、分岐先の経路のうち、より選択確率の高い方を先に探索する深さ優先アルゴリズムにより処理が実行される。
【0287】
なお、探索の深さが深くなる、換言すれば、現在地ノードを最上位として下位の階層が深くなることで、全てを探索することが難しいことも考えられる。そのような場合には、例えば、1)遷移確率の低い分岐先は探索しない、2)生起確率の低い経路は探索しない、3)探索する深さに制限を加える、4)探索する枝の数に制限を加える、などの条件を加えて、途中で探索を終了するようにしてもよい。
【0288】
図31は、ツリー探索処理における探索結果リストの例を示している。
【0289】
深さ優先アルゴリズムによりツリー探索処理を行うことにより、探索結果リストには、選択確率の高い経路から順に登録される。
【0290】
図31の例では、探索結果リストの1番目には、目的地gまでの経路R(r,r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。探索結果リストの2番目には、目的地gまでの経路R(r,r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。探索結果リストの3番目には、目的地gまでの経路R(r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。
【0291】
探索結果リストの4番目には、経由地wまでの経路R(r,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って経由地wまでにかかる時間がTである。探索結果リストの5番目には、経由地wまでの経路R(r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って経由地wまでにかかる時間がTである。
【0292】
探索結果リストの6番目には、目的地gまでの経路R(r,r,w,r,r)が登録され、この経路Rが選択される確率はPで、経路Rを使って目的地gまでにかかる時間がTである。探索結果リストの7番目には、この経路Rが選択される確率はPで、目的地gまでの経路R(r,r10,r11)が登録され、経路Rを使って目的地gまでにかかる時間がTである。
【0293】
目的地または経由地まで、各経路が選択される確率は、上述した式(13)により計算される。さらに、目的地までの経路が複数存在する場合、その目的地までの複数の経路の選択確率の和が、目的地の到達確率となる。
【0294】
従って、図31の例では、目的地gへ行くには、経路Rを利用する場合と、経路Rを利用する場合があり得るので、目的地gの到達確率は、は(P+P)となる。同様に、目的地gへ行くには、経路Rを利用する場合と、経路Rを利用する場合があり得るので、目的地gの到達確率は、は(P+P)となる。なお、目的地gの到達確率は、経路Rが選択される確率Pと同一である。
【0295】
[予測ポストプロセス部34の処理]
次に、予測ポストプロセス部34が行う処理について説明する。
【0296】
目的地または経由地まで、選択された経路で移動したときにかかる時間の求め方について説明する。
【0297】
例えば、現在時刻tの現在地が状態sy1であり、時刻(t,t,・・・,t)における決定された経路が(sy1,sy2,・・・,syg)であるとする。換言すれば、決定された経路の状態siのノード番号iが(y,y,・・・,y)であるとする。以下、簡単のため、位置に相当する状態siを、単に、そのノード番号iで表わす場合もある。
【0298】
現在時刻tでの現在地yは、現在地ノード推定部41により確定しているので、現在時刻tの現在地がyである確率Py1(t)は、
y1(t)=1である。
また、現在時刻tにy以外の他の状態にいる確率は0である。
【0299】
一方、所定の時刻tにノード番号yにいる確率Pyn(t)は、
【数10】

で表すことができる。式(14)の右辺第一項は、もともとその位置yにいて、自己遷移した場合の確率を表し、右辺第二項は、1つ前の位置yn−1から位置yに遷移してきた場合の確率を表している。式(14)では、経路の選択確率の計算とは異なり、学習により得られた状態遷移確率aijがそのまま利用される。
【0300】
目的地yへ到達するときの時刻tの予測値<t>は、「その直前の時刻tg−1に目的地yの1つ前の位置yg−1にいて、時刻tに目的地yに移動する確率」を用いて、
【数11】

と表すことができる。
【0301】
即ち、予測値<t>は、現在時刻から、「その直前の時刻tg−1に状態sygの1つ前の状態syg−1にいて、時刻tに状態sygに移動するとき」までの時間の期待値で表される。
【0302】
以上より、所定の目的地または経由地まで、選択された経路で移動したときにかかる時間は、上述した式(15)の予測値<t>により求められる。
【0303】
図31の例を使用して、目的地までの経路が探索された場合に、代表経路として選択する代表経路選択処理について説明する。
【0304】
図31のような探索結果リストが得られた場合、探索結果リストには、選択確率が高いものから順に(上位に)登録されるので、選択確率が上位であり、目的地も異なる、探索結果リストの1番目乃至3番目が予測結果として出力される。即ち、経目的地gとその経路R、目的地gとその経路R、目的地gとその経路Rが、目的地とその代表経路として選択される。
【0305】
次に、探索結果リストの4番目および5番目は経由地までの経路であるためスキップされ、探索結果リストの6番目の、目的地gへ到達するための経路Rを代表経路とするかが検討される。この経路Rは、既に代表経路として選択されている、同一の目的地gの経路Rには含まれていない経由地wを利用するものとなっている。したがって、目的地gへ到達するための経路Rも、代表経路として選択される。
【0306】
次に、探索結果リストの7番目の、目的地gへ到達するための経路Rを代表経路とするかが検討される。この経路Rは、既に代表経路として選択されている、同一の目的地gと同じく、所定の経由地を経由しないものとなっている。したがって、目的地gへ到達するための経路Rは、代表経路として選択されない。
【0307】
このように、代表経路選択処理では、ほぼ同一の経路を通る、似たような経路は提示せず、ユーザにとって有益と考えられる、異なる経由地を通る経路は、同一目的地であっても、予測結果として提示することができる。
【0308】
なお、探索結果リストの6番目の、目的地gへ到達するための経路Rは、[背景技術]に示した先願2の方法では、経由地wで探索が終了されていた。しかしながら、予測システム1によれば、経由地wで終了することなく、経由地wを利用して目的地gへ到達する経路まで探索することが可能となっている。
【0309】
予測システム1によれば、学習により得られた状態ノードに、目的地と経由地を区別して属性を付与することで、第1と第2の課題を解決することができる。
【0310】
図32は、予測ポストプロセス部34が行う代表経路選択処理のフローチャートである。
【0311】
初めに、ステップS121において、予測ポストプロセス部34は、目的地経由地予測部42で作成された探索結果リストから、経由地までの経路を除外し、目的地のみの探索結果リストである目的地リストを生成する。
【0312】
ステップS122において、予測ポストプロセス部34は、目的地リストを目的地別に並び替えた目的地別目的地リストに変更する。このとき、予測ポストプロセス部34は、同一の目的地内における順位を変えないように目的地別目的地リストを生成する。
【0313】
ステップS123において、予測ポストプロセス部34は、目的地ごとの到達確率を算出する。目的地までの経路が1つしかない場合には、その経路の選択確率が到達確率となり、目的地まで複数の経路が存在する場合には、複数の選択確率(生起確率)の和が、その目的地の到達確率となる。
【0314】
ステップS124において、予測ポストプロセス部34は、代表経路の選択に経由地を考慮するかを判定する。ステップS124で、経由地を考慮しないと判定された場合、処理はステップS125に進み、予測ポストプロセス部34は、目的地別に、最上位の経路を、各目的地の代表経路として選択し、処理を終了する。その結果、目的地まで複数の経路が存在する場合には、選択確率の高い目的地までの経路が、各目的地の代表経路とされ、その所要時間が、目的地までの所要時間として提示される。なお、目的地が多数ある場合には、上位から、予め設定した個数の目的地のみを提示するようにさせることができる。
【0315】
一方、ステップS124で、経由地を考慮すると判定された場合、処理はステップS126に進み、予測ポストプロセス部34は、目的地別目的地リストを、経由地なしの目的地別目的地リストと、経由地ありの目的地別目的地リストに分類する。
【0316】
そして、ステップS127において、予測ポストプロセス部34は、経由地なしの目的地別目的地リストから、目的地別に、最上位の経路を代表経路として選択する。これにより、代表経路としての、目的地ごとの経由地なしの経路が決定される。
【0317】
次に、ステップS128において、予測ポストプロセス部34は、経由地ありの目的地別目的地リストを、さらに、経由地別に分類する。
【0318】
ステップS129において、予測ポストプロセス部34は、経由地別の、経由地ありの目的地別目的地リストから、目的地別に、各経由地の最上位の経路を、代表経路として選択する。これにより、代表経路としての、目的地ごとの経由地ありの経路が決定される。その結果、目的地までの経路として、経由地なしの経路と経由地ありの経路が存在する場合には、その両方が、各目的地の代表経路とされ、それぞれの所要時間が、目的地までの所要時間として提示される。
【0319】
以上により、代表経路選択処理は終了する。このように、目的地への経路が複数存在する場合、生起確率の上位を複数提示するよりも、経由地によって分類して提示する方が、ユーザが実際に感じる予測に近いものとすることができる。
【0320】
[予測ブロック13全体の処理]
図33のフローチャートを参照して、予測ブロック13全体の処理について説明する。
【0321】
初めに、ステップS141において、バッファリング部31は、予測処理のため、リアルタイムに取得される移動履歴データをバッファリングする。
【0322】
ステップS142において、予測プリプロセス部32は、予測プリプロセス処理を実行する。具体的には、学習プリプロセス部22が行う学習プリプロセス処理と同様の、移動履歴データの接続および分割の処理、移動履歴データの明らかな異常を除去する処理、および、欠落データを補完する処理を実行する。但し、移動履歴データを分割する際の基準となる滞在閾値時間は、学習プリプロセス処理と異なる時間であってもよい。
【0323】
ステップS143において、予測メインプロセス部33は、学習ブロック11の学習により得られたユーザ活動モデルのパラメータを、ユーザ別モデルパラメータ記憶部12から取得する。このパラメータを取得する処理は、図33の目的地を予測する処理とは別に、予め実行するようにしてもよい。
【0324】
ステップS144において、予測メインプロセス部33の現在地ノード推定部41は、学習ブロック11の学習により得られたユーザ活動モデルを用いて、ユーザの現在地に対応する状態ノード(現在地ノード)を推定する。より具体的には、現在地ノード推定部41は、学習ブロック11の学習により得られたユーザ活動モデルを用いて、移動履歴データに対応する状態ノード系列データを算出する。そして、現在地ノード推定部41は、状態ノード系列データの最後の状態ノードを現在地ノードとする。状態ノード系列データの算出には、ビタビアルゴリズムが採用される。
【0325】
ステップS145において、予測メインプロセス部33の目的地経由地予測部42は、図28を参照して説明した、現在地ノード以降のツリー探索処理を実行する。ツリー探索処理と同時に、目的地および経由地までの経路(ノード系列)の生起確率も、式(13)により求められる。
【0326】
ステップS146において、予測ポストプロセス部34は、図32を参照して説明した、代表経路の選択処理を実行する。
【0327】
ステップS147において、予測ポストプロセス部34は、上述した式(15)により、選択された各代表経路の所要時間を算出する。
【0328】
ステップS148において、予測ポストプロセス部34は、予測した目的地までの代表経路、到達確率、および所要時間を予測結果として出力して、処理を終了する。
【0329】
以上のように、予測ブロック13の処理では、推定された目的地ノードおよび経由地ノード並びに現在地ノードについての情報と、学習により得られたユーザ活動モデルとを用いて、ユーザの現在地から目的地までの経路が探索される。学習により得られた状態ノードに目的地と経由地の属性が付与されているので、経由地を目的地として予測することを防止することができる。
【0330】
また、学習により得られた状態ノードに目的地と経由地の属性が付与されているので、同一目的地への経路であっても、経由地なしの経路と、経由地ありの経路を代表経路として出力することができる。
【0331】
[コンピュータの構成例]
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
【0332】
図34は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
【0333】
コンピュータにおいて、CPU(Central Processing Unit)221,ROM(Read Only Memory)222,RAM(Random Access Memory)223は、バス224により相互に接続されている。
【0334】
バス224には、さらに、入出力インタフェース225が接続されている。入出力インタフェース225には、入力部226、出力部227、記憶部228、通信部229、ドライブ230、およびGPSセンサ231が接続されている。
【0335】
入力部226は、キーボード、マウス、マイクロホンなどよりなる。出力部227は、ディスプレイ、スピーカなどよりなる。記憶部228は、ハードディスクや不揮発性のメモリなどよりなる。通信部229は、ネットワークインタフェースなどよりなる。ドライブ230は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体232を駆動する。上述のセンサデバイスとしてのGPSセンサ231は、現在地の位置(緯度および経度)のデータと、そのときの時刻からなる3次元データを出力する。
【0336】
以上のように構成されるコンピュータでは、CPU221が、例えば、記憶部228に記憶されているプログラムを、入出力インタフェース225及びバス224を介して、RAM223にロードして実行することにより、上述した一連の処理が行われる。
【0337】
コンピュータ(CPU221)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体232に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
【0338】
コンピュータでは、プログラムは、リムーバブル記録媒体232をドライブ230に装着することにより、入出力インタフェース225を介して、記憶部228にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部229で受信し、記憶部228にインストールすることができる。その他、プログラムは、ROM222や記憶部228に、あらかじめインストールしておくことができる。
【0339】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0340】
なお、本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。
【0341】
なお、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0342】
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【符号の説明】
【0343】
1 予測システム, 11 学習ブロック, 13 予測ブロック, 22 学習プリプロセス部, 23 学習メインプロセス部, 24 学習ポストプロセス部, 25 目的地経由地検出部, 32 予測プリプロセス部, 33 予測メインプロセス部, 34 予測ポストプロセス部, 41 現在地ノード推定部, 42 目的地経由地予測部, 74 移動属性識別付与部, 75 滞在状態加工部, 92 移動属性識別部, 93 移動属性付与部

【特許請求の範囲】
【請求項1】
学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルで表し、そのパラメータを学習する学習手段と、
学習により得られた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを、学習により得られた前記パラメータを用いた前記確率モデルに入力し、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段と
を備えるデータ処理装置。
【請求項2】
前記移動履歴データを構成する各3次元データに対し、少なくとも滞在状態または移動状態を識別する移動属性識別手段をさらに備え、
前記目的地経由地推定手段は、前記滞在状態が所定の閾値時間以上継続する前記移動履歴データに対応する前記状態ノードを前記目的地ノードに推定し、前記滞在状態の継続時間が前記所定の閾値時間未満である前記移動履歴データに対応する前記状態ノードを前記経由地ノードに推定する
請求項1に記載のデータ処理装置。
【請求項3】
滞在状態が前記所定の閾値時間以上継続している前記移動履歴データを、同一位置のデータに修正するデータ加工手段をさらに備え、
前記学習手段は、前記データ加工手段により加工された前記学習用データを用いて、前記確率モデルのパラメータを学習する
請求項2に記載のデータ処理装置。
【請求項4】
前記学習手段は、前記ユーザの活動を表す確率モデルとして、隠れマルコフモデルを採用し、前記隠れマルコフモデルで前記移動履歴データをモデル化したときの尤度が最大となるように前記パラメータを学習する
請求項1に記載のデータ処理装置。
【請求項5】
前記現在地推定手段は、現在から所定時間以内の前記ユーザの移動履歴データに対応する、学習により得られた前記パラメータを用いた前記確率モデルの状態ノード系列データを算出し、算出された前記状態ノード系列データの最終ノードを、前記ユーザの現在地に相当するノードとする
請求項1に記載のデータ処理装置。
【請求項6】
前記探索手段は、前記ユーザの前記現在地ノードから遷移可能な状態ノードでなるツリー構造において、前記現在地ノードを出発点として、前記目的地ノード若しくは遷移先のない終端ノードになるまで全ての状態ノードを探索したか、または、探索回数が終了条件としての所定の回数を満たすまで探索し、前記ユーザの現在地から目的地までの経路を、前記現在地ノードからの状態ノード系列として求める
請求項1に記載のデータ処理装置。
【請求項7】
前記探索手段は、分岐先の経路のうち、より選択確率の高い方を先に探索する深さ優先アルゴリズムにより処理が実行される
請求項6に記載のデータ処理装置。
【請求項8】
前記算出手段は、探索された前記目的地ノードへの状態ノード系列の、規格化された遷移確率の同時確率を演算することで、前記目的地までの経路の選択確率を算出する
請求項1に記載のデータ処理装置。
【請求項9】
前記算出手段は、前記目的地への経路が複数存在する場合、複数の前記選択確率の和により、前記目的地への到達確率を算出する
請求項8に記載のデータ処理装置。
【請求項10】
前記算出手段は、探索結果の前記ユーザの現在地から目的地までの経路のうち、目的地別に選択確率の最も高い経路を、各目的地の代表経路とし、その所要時間を、前記目的地までの所要時間として算出する
請求項8に記載のデータ処理装置。
【請求項11】
前記算出手段は、前記目的地までの経路として、経由地なしの経路と経由地ありの経路が存在する場合には、その両方を、各目的地の代表経路とし、それぞれの所要時間を、前記目的地までの所要時間として算出する
請求項8に記載のデータ処理装置。
【請求項12】
前記算出手段は、前記目的地までの所要時間を、現在時刻から、前記目的地ノードの直前の状態ノードにいて、前記目的地ノードに移動するときまでの時間の期待値として算出する
請求項1に記載のデータ処理装置。
【請求項13】
ユーザの移動履歴データを処理するデータ処理装置が、
学習用データとして取得される前記移動履歴データを、ユーザの活動を表す確率モデルで表し、そのパラメータを学習し、
学習により得られた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定し、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを、学習により得られた前記パラメータを用いた前記確率モデルに入力し、前記ユーザの現在地に相当する現在地ノードを推定し、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索し、
探索された前記目的地への到達確率と所要時間を算出する
ステップを含むデータ処理方法。
【請求項14】
コンピュータを、
学習用データとして取得されるユーザの移動履歴データを、ユーザの活動を表す確率モデルで表し、そのパラメータを学習する学習手段と、
学習により得られた前記パラメータを用いた前記確率モデルの状態ノードのうち、移動の目的地および経由地に相当する目的地ノードおよび経由地ノードを推定する目的地経由地推定手段と、
前記学習用データとは別の、現在から所定時間以内の前記ユーザの移動履歴データを、学習により得られた前記パラメータを用いた前記確率モデルに入力し、前記ユーザの現在地に相当する現在地ノードを推定する現在地推定手段と、
推定された前記目的地ノードおよび経由地ノード並びに前記現在地ノードについての情報と、学習により得られた前記確率モデルとを用いて、ユーザの現在地から目的地までの経路を探索する探索手段と、
探索された前記目的地への到達確率と所要時間を算出する算出手段
として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate

【図34】
image rotate


【公開番号】特開2011−252844(P2011−252844A)
【公開日】平成23年12月15日(2011.12.15)
【国際特許分類】
【出願番号】特願2010−128068(P2010−128068)
【出願日】平成22年6月3日(2010.6.3)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】