説明

目的地予測装置及びプログラム

【課題】定期的な移動でない場合であっても、目的地を精度良く予測することができるようにする。
【解決手段】データ収集部50によって、各ユーザについて、閲覧データの時系列及び移動データの時系列を収集する。内容抽出部60によって、収集された各閲覧データについて、Webサイトのテキストから地名を抽出し、地名に対する場所を抽出する。滞在地抽出部56によって、収集された移動データの時系列に基づいて、ユーザ毎に、滞在地データを抽出する。相関算出部62によって、ユーザ毎に、ユーザの各閲覧データと、移動履歴から抽出された各滞在地データとを関連付けて相関を算出し、事前確率学習部66によって、各滞在地データの場所へ行く事前確率を学習する。目的地予測部70によって、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出し、算出された確率に基づいて目的地を予測する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、目的地予測装置及びプログラムに係り、特に、ユーザの文書データの閲覧履歴及び位置情報の履歴から、ユーザの目的地を予測する目的地予測装置及びプログラムに関する。
【背景技術】
【0002】
従来より、インターネット閲覧履歴からユーザの興味を推定するシステムが知られている(例えば、特許文献1)。また、閲覧履歴・移動履歴から行動パターンを生成・予測し、情報提供を行うシステムが知られている(特許文献2)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2009−232415号公報
【特許文献2】特開2008−311212号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の特許文献1に記載のシステムは、あくまでユーザの興味の有りそうな箇所を列挙し推薦するシステムであり、目的地の予測を行うことができない、という問題がある。また、移動履歴データを使っておらずインターネット履歴のみを使っているため、推定精度が低い、という問題がある。
【0005】
また、上記の特許文献2に記載の技術は、移動距離に基づく地点間移動予測であり、定期的な移動における目的地しか予測できない、という問題がある。
【0006】
本発明は、上記の問題点を解決するためになされたもので、定期的な移動でない場合であっても、目的地を精度良く予測することができる目的地予測装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の目的を達成するために本発明に係る目的地予測装置は、複数のユーザについて、文書データの閲覧履歴及び位置情報の履歴を収集する履歴収集手段と、収集された閲覧履歴の各文書データについて、前記文書データ内のテキストに応じて、閲覧された前記文書データを分類する分類手段と、前記収集された位置情報の履歴に基づいて、ユーザ毎に、滞在地データを抽出する抽出手段と、ユーザ毎に、前記ユーザの前記閲覧履歴の各文書データと、前記位置情報の履歴から抽出された各滞在地データとを関連付けて、前記文書データと前記滞在地データとの組み合わせの各々に関する相関を算出する相関算出手段と、算出した前記相関に基づいて、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出し、前記算出された確率に基づいて目的地を予測する目的地予測手段と、を含んで構成されている。
【0008】
本発明に係るプログラムは、コンピュータを、複数のユーザについて、文書データの閲覧履歴及び位置情報の履歴を収集する履歴収集手段、収集された閲覧履歴の各文書データについて、前記文書データ内のテキストに応じて、閲覧された前記文書データを分類する分類手段、前記収集された位置情報の履歴に基づいて、ユーザ毎に、滞在地データを抽出する抽出手段、ユーザ毎に、前記ユーザの前記閲覧履歴の各文書データと、前記位置情報の履歴から抽出された各滞在地データとを関連付けて、前記文書データと前記滞在地データとの組み合わせの各々に関する相関を算出する相関算出手段、及び算出した前記相関に基づいて、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出し、前記算出された確率に基づいて目的地を予測する目的地予測手段として機能させるためのプログラムである。
【0009】
本発明によれば、履歴収集手段によって、複数のユーザについて、文書データの閲覧履歴及び位置情報の履歴を収集する。分類手段によって、収集された閲覧履歴の各文書データについて、前記文書データ内のテキストに応じて、閲覧された前記文書データを分類する。抽出手段によって、前記収集された位置情報の履歴に基づいて、ユーザ毎に、滞在地データを抽出する。
【0010】
そして、相関算出手段によって、ユーザ毎に、前記ユーザの前記閲覧履歴の各文書データと、前記位置情報の履歴から抽出された各滞在地データとを関連付けて、前記文書データと前記滞在地データとの組み合わせの各々に関する相関を算出する。目的地予測手段によって、算出した前記相関に基づいて、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出し、前記算出された確率に基づいて目的地を予測する。
【0011】
このように、ユーザ毎に、閲覧履歴の各文書データと、位置情報の履歴から抽出された各滞在地データとを関連付けて相関を算出し、算出された相関に基づいて、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出することにより、定期的な移動でない場合であっても、目的地を精度良く予測することができる。
【0012】
本発明に係る目的地予測装置は、前記相関算出手段によって算出された相関に基づいて、文書データの各分類と、各滞在地データとの組み合わせの各々について、前記分類に属する文書データを閲覧したときに前記滞在地データが示す場所へ行く事前確率を算出する確率算出手段を更に含み、前記目的地予測手段は、前記予測対象ユーザに対して算出された前記相関と、前記確率算出手段によって算出された前記事前確率とに基づいて、前記予測対象ユーザについて、各滞在地を目的地とする確率を算出し、目的地を予測するようにすることができる。
【0013】
本発明に係る相関算出手段は、前記ユーザの前記閲覧履歴の各文書データと、前記位置情報の履歴から抽出された各滞在地データとを関連付けて、前記文書データと前記滞在地データとの組み合わせの各々に関して、前記文書データの閲覧時刻と前記滞在地データの滞在時刻との時間差に応じた相関を算出するようにすることができる。
【0014】
上記の相関算出手段は、前記文書データと前記滞在地データとの組み合わせの各々に関して、前記文書データの閲覧時刻と前記滞在地データの滞在時刻との時間差、前記文書データの閲覧時間の長さに応じた閲覧確率、及び前記滞在地データの滞在時間の長さに応じた滞在確率に基づいて、前記相関を算出するようにすることができる。
【0015】
上記の分類手段は、収集された閲覧履歴の各文書データについて、前記文書データ内のテキストから地名又は商品名を抽出し、前記抽出された地名を示す場所データ、又は前記抽出された商品名を販売する店舗の場所データを、前記文書データの分類として割り当てるようにすることができる。
【0016】
上記の分類手段は、収集された閲覧履歴の各文書データについて、前記文書データ内のテキストから単語を抽出し、前記抽出された単語の集合についてクラスタリングを行い、前記文書データについて抽出された単語の集合が属するクラスタを、前記文書データの分類として割り当てるようにすることができる。
【0017】
また、本発明のプログラムは、記憶媒体に格納して提供することも可能である。
【発明の効果】
【0018】
以上説明したように、本発明の目的地予測装置及びプログラムによれば、ユーザ毎に、閲覧履歴の各文書データと、位置情報の履歴から抽出された各滞在地データとを関連付けて相関を算出し、算出された相関に基づいて、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出することにより、定期的な移動でない場合であっても、目的地を精度良く予測することができる、という効果が得られる。
【図面の簡単な説明】
【0019】
【図1】本発明の第1の実施の形態に係る目的地予測システムを示すブロック図である。
【図2】本発明の第1の実施の形態に係る携帯端末を示すブロック図である。
【図3】本発明の第1の実施の形態に係る処理サーバを示すブロック図である。
【図4】相関を算出する処理を説明するための図である。
【図5】本発明の第1の実施の形態に係る処理サーバにおける相関学習処理ルーチンの内容を示すフローチャートである。
【図6】本発明の第1の実施の形態に係る処理サーバにおける目的地予測処理ルーチンの内容を示すフローチャートである。
【発明を実施するための形態】
【0020】
以下、図面を参照して、本発明の好適な実施の形態について説明する。
【0021】
図1に示すように、第1の実施の形態に係る目的地予測システム10は、ユーザがWebサイトを閲覧するためのクライアントPC12と、ユーザがWebサイトを閲覧すると共に、位置情報を計測する携帯端末14と、移動体(例えば、車両)に搭載され、かつ、位置情報を計測する移動体端末16と、ユーザの目的地を予測する処理を行う処理サーバ18とを備えている。クライアントPC12、携帯端末14、及び移動体端末16の各々と、処理サーバ18とは、インターネット20を介して接続されている。
【0022】
図2に示すように、携帯端末14は、自端末の位置を計測する位置計測部22と、ユーザが自端末を操作するための操作部24と、Webサイトへのアクセスを制御すると共に、閲覧データ及び移動データを生成するコンピュータ26と、アクセスされたWebサイトをユーザに対して表示する表示部28と、Webサイトへアクセスすると共に、閲覧データ及び移動データを送信する通信部30とを備えている。
【0023】
位置計測部22は、例えば、GPSセンサ又は慣性センサを用いて構成され、自端末の現在位置を計測する。
【0024】
通信部30は、無線通信により、インターネット20を介してWebサイトへアクセスする共に、コンピュータ26により生成された閲覧データ及び移動データを、処理サーバ18へ送信する。また、通信部30は、無線通信により後述する目的地予測要求を、処理サーバ18へ送信する。
【0025】
コンピュータ26は、CPUと、RAMと、ROMとを備え、機能的には次に示すように構成されている。コンピュータ26は、ユーザによる操作部24の操作に応じてWebサイトへアクセスし、Webサイトの画面を表示部28に表示させる閲覧制御部32と、閲覧制御部32により表示されたWebサイトに関する閲覧データを生成して通信部30へ出力する閲覧データ生成部34と、位置計測部22により計測された自端末の位置を示す移動データを生成し、通信部30へ出力する移動データ生成部36とを備えている。
【0026】
ユーザが操作部24を操作して、ユーザID及びパスワードをコンピュータ26に入力すると、入力されたユーザID及びパスワードが、処理サーバ18へ送信される。これによって、携帯端末14は、処理サーバ18に対してログイン状態となる。
【0027】
閲覧データ生成部34は、閲覧制御部32により表示されたWebサイトのURL、当該WebサイトのHTMLテキスト、Webサイトへのアクセスしたときの時刻(閲覧時刻)、サイト表示時間、ユーザID、携帯端末14に予め設定された端末ID、及び端末タイプを含む各項目からなる閲覧データを生成する。
【0028】
移動データ生成部36は、位置計測部22によって計測された位置(緯度、経度、及び高度)、位置が計測されたときの位置時刻、ユーザID、携帯端末14に予め設定された端末ID、及び端末タイプを含む各項目からなる移動データを生成する。
【0029】
クライアントPC12は、操作部24、表示部28、通信部30、閲覧制御部32、及び閲覧データ生成部34と同様の構成を備えており、ユーザの操作に応じてWebサイトへアクセスしてユーザに対してWebサイトの画面を表示すると共に、表示されたWebサイトに関する閲覧データを生成して処理サーバ18へ送信する。
【0030】
移動体端末16は、例えば、カーナビシステムであり、位置計測部22、操作部24、通信部30、及び移動データ生成部36と同様の構成を備えている。移動体端末16は、自端末の位置を計測すると共に、計測された自端末の位置を示す移動データを生成して処理サーバ18へ送信する。
【0031】
図3に示すように、処理サーバ18は、閲覧データ、移動データ、及び目的地予測要求を受信する通信部40と、閲覧データ及び移動データを収集して記憶すると共に、予測対象ユーザの目的地を予測するコンピュータ42と、を備えている。
【0032】
通信部40は、インターネット20を介して、クライアントPC12、携帯端末14、及び移動体端末16から、閲覧データ、移動データ、及び目的地予測要求を受信する。
【0033】
コンピュータ42は、CPUと、RAMと、後述する相関学習処理ルーチン及び目的地予測処理ルーチンROMとを備え、機能的には次に示すように構成されている。コンピュータ42は、受信した閲覧データ及び移動データを収集するデータ収集部50と、収集した閲覧データ及び移動データを閲覧履歴及び移動履歴としてユーザ毎に記憶するログデータベース52と、ログデータベース52からユーザ毎に移動履歴を取得する移動データ取得部54と、取得した移動履歴に基づいて、滞在地を抽出する滞在地抽出部56と、ログデータベース52からユーザ毎に閲覧履歴を取得する閲覧データ取得部58と、取得した閲覧履歴の各閲覧データのHTMLテキストに基づいて、場所を抽出する内容抽出部60と、ユーザ毎に、閲覧データ及び移動データの各組み合わせについて、相関を算出する相関算出部62と、算出された相関に基づいて、ある場所が抽出されるWebサイトを閲覧したときに滞在地へ行く確率を示す事前確率を学習する事前確率学習部64と、算出された相関及び学習された事前確率を記憶する学習結果データベース66とを備えている。なお、内容抽出部60は、分類手段の一例であり、事前確率学習部64が、確率算出手段の一例である。
【0034】
データ収集部50は、通信部40によって受信した閲覧データ及び移動データを収集し、ユーザID毎に、閲覧データの時系列を閲覧履歴としてログデータベース52に記憶すると共に、移動データの時系列を移動履歴としてログデータベース52に記憶する。
【0035】
滞在地抽出部56は、ユーザID毎に、移動データ取得部54によって取得された移動データの時系列に基づいて、以下に説明するように、滞在地を抽出する。
【0036】
まず、移動データの時系列から、移動データが示す位置が密集している部分を探す。例えば、移動データが示す位置から求められる速度データが一定値以下となる部分を密集部分として抽出する。そして、密集部分ごとに、密集部分を含む時間窓T(開始時刻t1〜終了時刻t2)を初期値として設定する。
【0037】
次に、時間窓T毎に、開始時刻t1を動かして、以下の(1)式で表わされる滞在確率P(j)を最大化する。
【0038】
【数1】


ただし、α1は予め定められたパラメータである。
【0039】
また、時間窓T毎に、終了時刻t2を動かして、上記(1)で示す滞在確率P(j)を最大化する。
【0040】
ここで、もし時間窓Tが重複している場合には、重複している複数の時間窓Tを統合する。以上の処理により、滞在地を抽出する候補となる時間窓T(t1〜t2)が決定される。
【0041】
そして、時間窓T毎に、時間窓T内の移動データについて、上記(1)式に従って滞在確率P(j)を算出する。上記(1)式では、位置の分散Vが小さいほど、滞在確率P(j)は大きくなり、時間窓Tの幅(t2−t1)が長いほど、滞在確率P(j)は大きい。
【0042】
次に、滞在確率P(j)が閾値β1より大きくなる時間窓Tを、滞在地の抽出対象として特定し、特定された時間窓Tの移動データから、平均座標を計算して、場所を特定し、予め用意された場所データgのうち、最も近い場所データgに分類する。なお、当該場所データgは全ユーザに共通である。
【0043】
以上のように、ユーザID毎に、移動データの時系列から、滞在地として、場所データgが抽出される。
【0044】
内容抽出部60は、ユーザID毎に、閲覧データ取得部58によって取得された閲覧データの時系列に基づいて、以下に説明するように、閲覧したWebサイト中に含まれる地名を抽出し、Webサイトの内容fとして、地名に対応する場所IDを割り当てる。なお、Webサイトが、文書データの一例であり、場所IDが、文書データの分類の一例である。
【0045】
まず、閲覧データの時系列から、予め用意された辞書データに含まれる地名・商品名に合致する単語を抽出する。商品名が抽出された場合には、商品名でさらに周辺店舗を検索し、検索結果の地名を抽出する。ここで、複数の地名が抽出され、曖昧性がある場合は、すべての地名を列挙する。
【0046】
そして、予め用意された、地名・緯度経度の組になったデータである地名辞書に基づいて、閲覧データについて抽出された地名から、場所データ(緯度経度、場所ID)を取得し、閲覧データと場所データとを結びつける。また、以下の(2)式に従って、閲覧確率P(i)を算出する。
【0047】
【数2】


ただし、α0は、予め定められたパラメータであり、Tは、Webサイトの表示時間である。上記(2)式によれば、サイト表示時間Tが短いほど、閲覧確率が小さくなる。
【0048】
なお、地名辞書を用いれば、場所データ(緯度経度)から最も近い地名を取得することも可能である。
【0049】
相関算出部62は、図4に示すように、ユーザID毎に、閲覧履歴の閲覧データiの各々と、移動履歴から抽出された滞在地データjの各々とを組み合わせて関連付け、ユーザkにおける閲覧データiと滞在地データjとの相関wki,jを、以下の(3)式に従って算出する。
【0050】
【数3】


ただし、α2は予め定められたパラメータであり、dは、閲覧データiに対して結び付けられた場所データと、滞在地データ(場所データ)との距離であり、Tは、滞在地データの時刻tjと閲覧データの閲覧時刻tiとの時間間隔(T=tj−ti)である。
【0051】
上記(3)式によれば、場所の距離dが近いほど、相関wki,jが大きくなり、時間間隔Tが短いほど、相関wki,jが大きくなる。また、閲覧データの閲覧時刻より滞在地データの時刻の方が早い場合には、相関が0となる。
【0052】
なお、上記(3)式の代わりに、以下の(4)式を用いて、閲覧確率P(i)及び滞在確率P(j)を考慮した相関を算出するようにしてもよい。
【0053】
【数4】


また、上記(3)式は一例であり、最も簡単な例としては、T≧0の場合に、wki,j=1としてもよい。
【0054】
事前確率学習部64は、各ユーザについて算出された閲覧データiと滞在地データjとの相関に基づいて、以下に説明するように、場所fが抽出される閲覧データのWebサイトを閲覧したときに、場所gの滞在地へ行く事前確率を求める。なお、この事前確率は全ユーザで共通と仮定する。
【0055】
まず、以下の(4)式、(5)式に従って、各ユーザについて算出された相関に基づいて、ユーザkに対する閲覧データの場所fに関する相関を集計した集計結果Wkfを算出すると共に、閲覧データの場所fに関する相関を集計した集計結果Wfを算出する。
【0056】
【数5】


ただし、wki=f,jは、ユーザkについて算出された、場所fが抽出された閲覧データiと滞在地データjとの相関である。
【0057】
また、以下の(6)式、(7)式に従って、各ユーザについて算出された相関に基づいて、ユーザkに対する滞在地データの場所gに関する相関を集計した集計結果Wkgを算出すると共に、滞在地データの場所gに関する相関を集計した集計結果Wgを算出する。
【0058】
【数6】


ただし、wki,j=gは、ユーザkについて算出された、閲覧データiと、場所gが抽出された滞在地データjとの相関である。
【0059】
また、以下の(8)式、(9)式に従って、各ユーザについて算出された相関に基づいて、ユーザkに対する、閲覧データの場所fと滞在地データの場所gとの組み合わせに関する相関を集計した集計結果Wkf,gを算出すると共に、閲覧データの場所fと滞在地データの場所gとの組み合わせに関する相関を集計した集計結果Wf,gを算出する。
【0060】
【数7】


ただし、wki=f,j=gは、ユーザkについて算出された、場所fが抽出された閲覧データiと場所gが抽出された滞在地データjとの相関である。
【0061】
また、以下の(10)式に従って、全ての相関を集計した集計結果Wを算出する。
【0062】
【数8】


そして、上記のように算出された集計結果に基づいて、以下の式に従って、滞在地データの場所gの事前確率P(g)、閲覧データの場所fの事前確率P(f)、滞在地データの場所gであり、かつ、閲覧データの場所fである事前確率P(f,g)を算出する。
【0063】
【数9】


そして、閲覧データの場所fと、滞在地データの場所gとの全ての組み合わせの各々について、場所fが抽出される閲覧データのWebサイトを閲覧したときに、場所gの滞在地へ行く事前確率P(f,g)を以下の(11)式に従って算出する。
【0064】
【数10】


上記の相関の集計結果と、事前確率P(f、g)の算出結果とが、学習結果データベース66に格納される。
【0065】
また、コンピュータ42は、通信部40により受信したユーザからの目的地予測要求を受け付ける予測要求受付部68と、学習結果データベース66に記憶された相関の集計結果及び事前確率P(f、g)の算出結果に基づいて、予測対象ユーザの目的地を予測する目的地予測部70とを更に備えている。
【0066】
通信部40は、クライアントPC12、携帯端末14、又は移動体端末16から、ユーザIDを含む目的地予測要求を受信する。
【0067】
予測要求受付部68は、通信部40により受信した目的地予測要求を受け付ける。
【0068】
目的地予測部70は、予測対象のユーザkについて、ユーザkに対する閲覧データの場所fに関する相関を集計した集計結果Wkfを用いて、予め用意された滞在地の場所gの各々について、以下の(12)式に従って、場所gへ行く確率を算出する。
【0069】
【数11】


目的地予測部70は、上記(12)式で算出される確率が閾値以上となる場所gを特定し、特定された場所gを、予測される目的地として出力する。目的地の予測結果は、通信部40により、目的地予測要求を送信したクライアントPC12、携帯端末14、又は移動体端末16へ送信される。
【0070】
次に、第1の実施の形態に係る目的地予測システム10の動作について説明する。まず、クライアントPC12において、ユーザの操作により、ユーザID及びパスワードが入力されると、処理サーバ18へ送信され、ログイン状態となる。クライアントPC12において、ユーザの操作により、Webサイトが閲覧されると、閲覧データが処理サーバ18へ送信され、処理サーバ18において、閲覧データが収集される。
【0071】
また、携帯端末14において、ユーザの操作により、ユーザID及びパスワードが入力されると、処理サーバ18へ送信され、ログイン状態となる。携帯端末14において、ユーザの操作により、Webサイトが閲覧されると、閲覧データが処理サーバ18へ送信され、処理サーバ18において、閲覧データが収集される。また、携帯端末14において、自端末の位置が随時計測され、位置が計測される毎に、計測された位置を示す移動データが処理サーバ18へ送信される。処理サーバ18において、移動データが収集される。
【0072】
また、移動体端末16において、ユーザの操作により、ユーザID及びパスワードが入力されると、処理サーバ18へ送信され、ログイン状態となる。移動体端末16において、自端末の位置が随時計測され、位置が計測される毎に、計測された位置を示す移動データが処理サーバ18へ送信され、処理サーバ18において、移動データが収集される。
【0073】
そして、処理サーバ18において、所定期間毎に、コンピュータ42によって、図5に示す相関学習処理ルーチンが実行される。
【0074】
ステップ100において、予め登録されている複数のユーザのうち、処理対象のユーザkを設定する。次のステップ102では、ユーザkのユーザIDに基づいて、ユーザkの移動履歴(移動データの時系列)を、ログデータベース52から読み込む。
【0075】
そして、ステップ104において、上記ステップ102で読み込んだ移動データの時系列に基づいて、ユーザkの滞在地データ(場所データg)を抽出する。次のステップ106では、ユーザkのユーザIDに基づいて、ユーザkの閲覧履歴(閲覧データの時系列)を、ログデータベース52から読み込む。
【0076】
そして、ステップ108において、上記ステップ106で読み込んだ閲覧データの時系列の各々について、閲覧データのWebサイトのHTMLテキストから、内容として、地名又は商品名を抽出し、地名辞書を用いて場所データfを抽出する。
【0077】
次のステップ110では、ユーザkの各閲覧データと、上記ステップ104で抽出された各滞在地データとの全ての組み合わせについて、上記(3)式に従って相関を算出する。そして、ステップ112において、予め登録されている全てのユーザについて、上記ステップ100〜ステップ110の処理を実行したか否かを判定し、上記ステップ100〜ステップ110の処理を実行していないユーザが存在する場合には、上記ステップ100へ戻り、当該ユーザを、処理対象のユーザとして設定する。
【0078】
一方、全てのユーザについて、上記ステップ100〜ステップ110の処理を実行した場合には、ステップ114において、上記ステップ110で全てのユーザについて算出した相関に基づいて、上記(4)式〜(10)式に従って、相関の集計結果を算出し、学習結果データベース66に記憶する。
【0079】
次のステップ116では、上記ステップ114で算出された相関の集計結果に基づいて、場所データg及び場所データfの全ての組み合わせについて、上記(11)式に従って、場所データgが抽出された閲覧データを閲覧したときに、場所データfが抽出された滞在地へ行く事前確率P(f,g)を算出し、学習結果データベース66に記憶して、相関学習処理ルーチンを終了する。
【0080】
ログデータベース52の記憶内容は、随時更新されるため、上記の相関学習処理ルーチンが定期的に繰り返し実行され、学習結果データベース66に記憶される相関の集計結果及び上記の事前確率が更新される。
【0081】
次に、ログイン状態となっているクライアントPC12、携帯端末14、又は移動体端末16から、ユーザIDを含む目的地予測要求が、処理サーバ18へ送信されると、処理サーバ18において、コンピュータ42によって、図6に示す目的地予測処理ルーチンが実行される。
【0082】
まず、ステップ130において、受信した目的地予測要求を受け付けて、予測対象となるユーザを特定する。ステップ132において、学習結果データベース66から、相関の集計結果及び事前確率を読み込む。
【0083】
そして、ステップ134において、滞在地データとして予め用意された各場所gについて、上記(12)式に従って、予測対象のユーザが場所gへ行く確率を算出する。次のステップ136において、上記ステップ134で算出された確率が閾値以上となる場所gを特定し、特定された場所gを、予測対象ユーザの目的地の予測結果として、目的予測要求を送信したクライアントPC12、携帯端末14、又は移動体端末16へ送信して、目的地予測処理ルーチンを終了する。
【0084】
以上説明したように、第1の実施の形態に係る目的地予測システムによれば、ユーザ毎に、閲覧履歴の各閲覧データと、移動履歴から抽出された各滞在地データとを関連付けてそれぞれの組み合わせについて相関を算出し、算出された相関に基づいて事前確率を算出しておき、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出することにより、定期的な移動でない場合であっても、目的地を精度良く予測することができる。
【0085】
また、インターネットの閲覧履歴から行きたい場所を予測することで、道路上の車両や歩行者の将来の目的地と位置とを予測することができる。
【0086】
次に、第2の実施の形態について説明する。なお、第2の実施の形態に係る目的地予測システムは、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
【0087】
第2の実施の形態では、閲覧したWebサイトから抽出された単語集合の類似度によって、閲覧データのクラスタリングを行い、閲覧データの内容として、クラスタを与えている点が、第1の実施の形態と異なっている。
【0088】
第2の実施の形態に係る処理サーバ18の内容抽出部60は、まず、ログデータベース52に記憶された全てのユーザの各閲覧データから、Webサイトの単語集合を抽出し、単語集合の類似度に基づいて、閲覧データをクラスタリングする。なお、単語集合の類似度に基づくクラスタリングの手法については、従来既知の手法を用いればよいため、説明を省略する。また、クラスタリングの結果が、メモリに格納され、全ユーザに対して共通に用いられる。
【0089】
内容抽出部60は、ユーザID毎に、閲覧データ取得部58によって取得された閲覧データの時系列の各々について、閲覧データから抽出される単語集合がどのクラスタに分類されるかを求め、閲覧データの内容fとして、クラスタIDを割り当てる。
【0090】
相関算出部62は、ユーザID毎に、閲覧データiの各々と、移動履歴から抽出された滞在地データjの各々とを組み合わせて関連付け、ユーザkにおける閲覧データiと滞在地データjとの相関wki,jを、以下の(13)式に従って算出する。
【0091】
【数12】


ただし、α2は予め定められたパラメータであり、Tは、滞在地データの時刻tjと閲覧データの閲覧時刻tiとの時間間隔(T=tj−ti)である。
【0092】
上記(13)式によれば、時間間隔Tが短いほど、相関相関wki,jが大きくなる。
【0093】
事前確率学習部64は、各ユーザについて算出された閲覧データiと滞在地データjとの相関に基づいて、上記(4)式〜(10)式と同様の式に従って、相関の集計結果を算出すると共に、内容f(クラスタID)が割り当てられる閲覧データのWebサイトを閲覧したときに、場所gの滞在地へ行く事前確率P(f,g)を求める。
【0094】
目的地予測部70は、予測対象のユーザkについて、ユーザkに対する閲覧データのクラスタfに関する相関を集計した集計結果Wkfを用いて、予め用意された滞在地の場所gの各々について、上記(12)式と同様の式に従って、場所gへ行く確率を算出する。目的地予測部70は、算出された確率が閾値以上となる場所gを特定し、特定された場所gを、予測される目的地として出力する。
【0095】
なお、第2の実施の形態に係る目的地予測システムの他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
【0096】
このように、閲覧履歴の各閲覧データの単語集合に基づいてクラスタリングを行って、閲覧データを分類し、予測対象ユーザについて、閲覧履歴の各閲覧データが属するクラスタに関する相関を用いて、各滞在地データが示す場所へ行く確率を算出することができる。
【0097】
なお、上記の第2の実施の形態では、Webサイトから単語集合を抽出して、単語集合の類似度に基づいて閲覧データを分類する場合を例に説明したが、これに限定されるものではない。閲覧したWebサイトの内容・意味を表わす特徴量を抽出して、特徴量の類似度又は距離に基づいて、閲覧データを分類するようにしてもよい。例えば、WebサイトからURLを抽出して、URLの類似度、またはURL間の距離に基づいて閲覧データを分類するようにしてもよい。
【0098】
また、履歴の古さを考慮して、相関を算出するようにしてもよい。例えば、目的地予測部によりP(g|k)を計算する前に、以下の式に従って、予測対象ユーザの相関wki,jを更新するようにしてもよい。
【0099】
【数13】


ただし、α3は予め定められたパラメータであり、Tは、閲覧の古さ(T=現在時刻−閲覧時刻)である。上記の式によれば、閲覧時刻が古いほど、相関が小さくなるように更新される。
【符号の説明】
【0100】
10 目的地予測システム
12 クライアントPC
14 携帯端末
16 移動体端末
18 処理サーバ
22 位置計測部
26、42 コンピュータ
28 表示部
30、40 通信部
32 閲覧制御部
34 閲覧データ生成部
36 移動データ生成部
50 データ収集部
52 ログデータベース
56 滞在地抽出部
60 内容抽出部
62 相関算出部
64 事前確率学習部
66 学習結果データベース
70 目的地予測部

【特許請求の範囲】
【請求項1】
複数のユーザについて、文書データの閲覧履歴及び位置情報の履歴を収集する履歴収集手段と、
収集された閲覧履歴の各文書データについて、前記文書データ内のテキストに応じて、閲覧された前記文書データを分類する分類手段と、
前記収集された位置情報の履歴に基づいて、ユーザ毎に、滞在地データを抽出する抽出手段と、
ユーザ毎に、前記ユーザの前記閲覧履歴の各文書データと、前記位置情報の履歴から抽出された各滞在地データとを関連付けて、前記文書データと前記滞在地データとの組み合わせの各々に関する相関を算出する相関算出手段と、
算出した前記相関に基づいて、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出し、前記算出された確率に基づいて目的地を予測する目的地予測手段と、
を含む目的地予測装置。
【請求項2】
前記相関算出手段によって算出された相関に基づいて、文書データの各分類と、各滞在地データとの組み合わせの各々について、前記分類に属する文書データを閲覧したときに前記滞在地データが示す場所へ行く事前確率を算出する確率算出手段を更に含み、
前記目的地予測手段は、前記予測対象ユーザに対して算出された前記相関と、前記確率算出手段によって算出された前記事前確率とに基づいて、前記予測対象ユーザについて、各滞在地を目的地とする確率を算出し、目的地を予測する請求項1記載の目的地予測装置。
【請求項3】
前記相関算出手段は、前記ユーザの前記閲覧履歴の各文書データと、前記位置情報の履歴から抽出された各滞在地データとを関連付けて、前記文書データと前記滞在地データとの組み合わせの各々に関して、前記文書データの閲覧時刻と前記滞在地データの滞在時刻との時間差に応じた相関を算出する請求項1又は2記載の目的地予測装置。
【請求項4】
前記相関算出手段は、前記文書データと前記滞在地データとの組み合わせの各々に関して、前記文書データの閲覧時刻と前記滞在地データの滞在時刻との時間差、前記文書データの閲覧時間の長さに応じた閲覧確率、及び前記滞在地データの滞在時間の長さに応じた滞在確率に基づいて、前記相関を算出する請求項3記載の目的地予測装置。
【請求項5】
前記分類手段は、収集された閲覧履歴の各文書データについて、前記文書データ内のテキストから地名又は商品名を抽出し、前記抽出された地名を示す場所データ、又は前記抽出された商品名を販売する店舗の場所データを、前記文書データの分類として割り当てる請求項1〜請求項4の何れか1項記載の目的地予測装置。
【請求項6】
前記分類手段は、収集された閲覧履歴の各文書データについて、前記文書データ内のテキストから単語を抽出し、前記抽出された単語の集合についてクラスタリングを行い、前記文書データについて抽出された単語の集合が属するクラスタを、前記文書データの分類として割り当てる請求項1〜請求項4の何れか1項記載の目的地予測装置。
【請求項7】
コンピュータを、
複数のユーザについて、文書データの閲覧履歴及び位置情報の履歴を収集する履歴収集手段、
収集された閲覧履歴の各文書データについて、前記文書データ内のテキストに応じて、閲覧された前記文書データを分類する分類手段、
前記収集された位置情報の履歴に基づいて、ユーザ毎に、滞在地データを抽出する抽出手段、
ユーザ毎に、前記ユーザの前記閲覧履歴の各文書データと、前記位置情報の履歴から抽出された各滞在地データとを関連付けて、前記文書データと前記滞在地データとの組み合わせの各々に関する相関を算出する相関算出手段、及び
算出した前記相関に基づいて、予測対象ユーザについて、各滞在地データが示す場所へ行く確率を算出し、前記算出された確率に基づいて目的地を予測する目的地予測手段
として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−256239(P2012−256239A)
【公開日】平成24年12月27日(2012.12.27)
【国際特許分類】
【出願番号】特願2011−129468(P2011−129468)
【出願日】平成23年6月9日(2011.6.9)
【出願人】(000003609)株式会社豊田中央研究所 (4,200)
【Fターム(参考)】