説明

携帯端末を所持したユーザの有意圏を推定する装置、プログラム及び方法

【課題】携帯端末の測位機能を起動させることなく、通信事業者設備によって取得可能な、空間的粒度が粗く且つ時間間隔が一定でない基地局位置情報を用いて、ユーザの有意位置を推定することができる装置、プログラム及び方法を提供する。
【解決手段】ユーザ有意圏推定装置は、携帯端末が配下に位置する基地局から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する接続履歴収集手段と、接続履歴を所定の時間窓(時間区間)に分割し、時間窓毎に各基地局識別子の出現数を計数する時間窓分割手段と、時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集するクラスタリング手段と、クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定するユーザ有意圏推定手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、携帯端末を所持したユーザの移動に伴う位置を推定する技術に関する。
【背景技術】
【0002】
近年、携帯電話機に代表される携帯端末には、GPS(Global Positioning System)のような測位機能が、一般的に搭載されてきている。そのため、ユーザは、携帯端末を用いて、現在位置を測位できると共に、その位置をネットワークを介してサーバへ送信することによって、位置に応じた様々なサービス情報を受信することができる。
【0003】
従来、携帯端末のGPS機能によって取得された位置情報をサーバへ送信し、当該サーバが、そのユーザの行動履歴から行動範囲を算出し、その行動範囲を反映した情報を提供する技術がある(例えば特許文献1参照)。この技術によれば、携帯端末によって計測された位置情報同士の距離に基づいてクラスタリングされる。
【0004】
このような技術によれば、携帯端末を所持したユーザの行動範囲を算出することができる一方で、その位置がどのような意味を持つのか(有意な位置であるか否か)についてまで認識することはできない。サーバが、携帯端末へその位置に応じたサービス情報を提供する場合であっても、その位置における「意味付け」(有意性)によっては、提供すべきサービス情報も異なる。例えば、滞在時間が長い場所であっても、自宅(住所)と職場(居所)とでは、提供すべきサービス情報の内容も全く異なる。通常、測位位置に対する「意味付け」は、ユーザによって指定されるか、又は、他の登録情報を用いる必要がある。
【0005】
これに対し、携帯端末のGPS機能によって取得された位置情報に基づく行動履歴から、ユーザの有意位置を学習する技術がある(例えば非特許文献1参照)。この技術によれば、位置情報は、GPS機能によって定期的に取得される必要がある。
【0006】
また、携帯端末のGPS機能によって取得された位置情報に基づく行動履歴から、混合ガウス分布を用いて、ユーザの有意位置を学習する技術がある(例えば非特許文献2参照)。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2010−49295号公報
【非特許文献】
【0008】
【非特許文献1】遠山緑生、服部隆志、荻野達也、「携帯電話の測位機能を用いた有意位置の学習」、情報処理学会論文誌、vol.46 No.12、pp.2915-2924、2005
【非特許文献2】Petteri Nurmi、SouravBhattacharya、「Identifying Meaningful Places: The Non-parametric Way」、Pervasive2008、pp.111-127、2008
【発明の概要】
【発明が解決しようとする課題】
【0009】
前述した従来技術によれば、ユーザの位置情報は、携帯端末のGPS機能によって取得されることを前提としている。しかしながら、ユーザによって所持された携帯端末について、GPS機能及びそのアプリケーションを常に又は定期的に起動させることは、携帯端末の電池の消耗を早めだけでなく、携帯端末からのパケットの送出量を増やすという問題があった。そのために、ユーザの行動圏に基づくサービスを広く普及させることも難しい。
【0010】
また、非特許文献1に記載の技術によれば、一定時間内での移動距離(速度)に基づいて滞在状態を判定するために、携帯端末における位置情報の計測時間間隔が一定である必要がある。しかしながら、位置情報の計測時間間隔が一定でない場合、直線的な移動であると仮定できる十分に短い時間間隔でない限り、実際の速度との誤差が大きくなる。即ち、滞在位置の判定の精度が低下する。
【0011】
更に、非特許文献2に記載の技術によれば、空間的に疎な位置情報履歴(位置情報同士の地理的距離が比較的長い)を用いた場合、混合ガウス分布のパラメータ推定の性質によって、離れた位置情報同士を、同一のクラスタに含めてしまうという傾向がある。これによっても、滞在位置の判定精度が低下する。
【0012】
このような従来技術に対して、通信事業者側としては、携帯端末によって取得された位置情報ではなく、その携帯端末が配下となる基地局の位置情報によって、携帯端末の有意位置を推定できることが好ましい。この場合、携帯端末が常に又は定期的にGPS機能を起動させる必要もない。
【0013】
尚、特許文献1に記載の技術によれば、携帯端末が配下となる基地局の遷移履歴から、ユーザの行動履歴を算出することも想定できる。しかしながら、定期的な測位位置が得られない状況では、アルゴリズムを適用することが難しい。
【0014】
そこで、本発明では、携帯端末の測位機能を起動させることなく、通信事業者設備によって取得可能な、空間的粒度が粗く且つ時間間隔が一定でない基地局位置情報を用いて、ユーザにとって有意な位置の集合であるところのユーザの有意圏を推定することができる装置、プログラム及び方法を提供することを目的とする。
【課題を解決するための手段】
【0015】
本発明によれば、携帯端末を所持したユーザの有意圏を推定することができる、広域無線通信網に接続されたユーザ有意圏推定装置であって、
携帯端末が配下に位置する基地局から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する接続履歴収集手段と、
接続履歴を所定の時間窓(時間区間)に分割し、時間窓毎に各基地局識別子の出現数を計数する時間窓分割手段と、
時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集するクラスタリング手段と、
クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定するユーザ有意圏推定手段と
を有することを特徴とする。
【0016】
本発明のユーザ有意圏推定装置における他の実施形態によれば、
クラスタ毎に、当該クラスタのエントロピー(クラスタ内の基地局分布のランダムさ)が低いクラスタほど「滞留状態」と判定する滞留判定手段を更に有し、
ユーザ有意圏推定手段は、滞留状態と判定されたクラスタに基づく地域圏を、当該ユーザの生活圏として推定することも好ましい。
【0017】
本発明のユーザ有意圏推定装置における他の実施形態によれば、
クラスタ毎に、当該クラスタに含まれるベクトルの分散が低いクラスタほど「滞留状態」と判定する滞留判定手段を更に有し、
ユーザ有意圏推定手段は、滞留状態と判定されたクラスタに基づく地域圏を、当該ユーザの生活圏として推定することも好ましい。
【0018】
本発明のユーザ有意圏推定装置における他の実施形態によれば、
クラスタリング手段は、時間窓を「文書」とし且つ基地局識別子を「単語」として、文書及び単語に対する潜在状態(トピック)を推定するHDP(Hierarchical Dirichlet Process)−LDA(Latent Dirichlet Allocation) を用いており、
各時間窓について推定された潜在状態を、各時間窓が所属するクラスタとすることも好ましい。
【0019】
本発明のユーザ有意圏推定装置における他の実施形態によれば、
接続履歴収集手段は、接続履歴を、カレンダ又はユーザ設定による平日及び休日の日属性に基づいて区分し、
ユーザ有意圏推定手段は、
滞留状態について、自宅のような「住所」、及び、職場・学校のような「居所」に区分し、
全日滞在率が高い第1のクラスタを住所と規定し、第1のクラスタ以外に平日滞在率が高い第2のクラスタを居所と規定するか、
全日滞在率が高い2つのクラスタを選択し、平日滞在率が高い一方のクラスタを居所と規定し、他方のクラスタを住所と規定するか、又は、
全日滞在率が高い2つのクラスタを選択し、休日滞在率が高い一方のクラスタを住所と規定し、他方のクラスタを居所と規定する
ことによって、滞留状態と判定されたクラスタの地域圏が、住所/居所を推定することも好ましい。
【0020】
本発明のユーザ有意圏推定装置における他の実施形態によれば、
広域無線通信網は、携帯電話網であり、
携帯端末は、携帯電話機であり、
ユーザ有意圏推定装置は、携帯電話網の通信事業者設備として設置されたものであることも好ましい。
【0021】
本発明によれば、携帯端末を所持したユーザの有意圏を推定することができる、広域無線通信網に接続された通信事業者設備装置におけるユーザ有意圏推定方法であって、
携帯端末が配下に位置する基地局から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する第1のステップと、
接続履歴を所定の時間窓(時間区間)に分割し、時間窓毎に各基地局識別子の出現数を計数する第2のステップと、
時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集する第3のステップと、
クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定する第4のステップと
を有することを特徴とする。
【0022】
本発明によれば、携帯端末を所持したユーザの有意圏を推定することができる、広域無線通信網に接続された通信事業者設備装置に搭載されたコンピュータにおけるユーザ有意圏推定プログラムであって、
携帯端末が配下に位置する基地局から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する接続履歴収集手段と、
接続履歴を所定の時間窓(時間区間)に分割し、時間窓毎に各基地局識別子の出現数を計数する時間窓分割手段と、
時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集するクラスタリング手段と、
クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定するユーザ有意圏推定手段と
してコンピュータを機能させることを特徴とするユーザ有意圏推定プログラム。
【発明の効果】
【0023】
本発明の装置、プログラム及び方法によれば、携帯端末の測位機能を起動させることなく、通信事業者設備によって取得可能な、空間的粒度が粗く且つ時間間隔が一定でない基地局位置情報を用いて、ユーザの有意位置を推定することができる。
【図面の簡単な説明】
【0024】
【図1】携帯端末の移動を表す空間的な外観図である。
【図2】本発明におけるユーザ有意圏推定装置の機能構成図である。
【図3】本発明のフローチャートに基づく説明図である。
【図4】LDAの確率ネットワーク図である。
【図5】HDP−LDAの確率ネットワーク図である。
【発明を実施するための形態】
【0025】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0026】
図1は、携帯端末の移動を表す空間的な外観図である。
【0027】
ユーザに所持された携帯端末(例えば携帯電話機)は、いずれの位置にあっても、常に、基地局の配下にあってその基地局からの電波を受信し続けている。図1によれば、ユーザは、自宅の住所が「埼玉県ふじみ野市」にあり、職場の居所が「東京都港区飯田橋」にある。そのユーザは、自宅と職場との間を、池袋を経由して通勤している。また、そのユーザは、訪問先として「東京都千代田区大手町」へも頻繁に移動している。
【0028】
多数の基地局を統合する通信事業者設備では、携帯端末毎に、空間的粒度が粗く、且つ、時間間隔が一定でない基地局位置情報を常に収集することができる。「空間的粒度が粗く」とは、位置情報同士の地理的な距離が比較的長いことを意味する。また、「時間間隔が一定でない」とは、位置情報の取得時間間隔が比較的ばらついていることを意味する。
【0029】
本発明について、「住所」とは、ユーザ各人の生活の本拠をいい、例えば生活の中心となっている自宅の所在地を意味する。また、「居所」とは、継続して居るものの、生活の本拠というほどその場所との結びつきが強くない場所をいい、例えば職場又は学校の所在地をいう。
【0030】
図2は、本発明におけるユーザ有意圏推定装置の機能構成図である。
図3は、本発明のフローチャートに基づく説明図である。
【0031】
広域無線通信網(携帯電話網)に接続された基地局3は、無線フレーム信号を交換することによって、その配下に位置する携帯端末(携帯電話機)2を認識し、その日時刻を取得する。そして、基地局3は、携帯電話機2の「端末識別子」(アドレス、電話番号、識別番号等)と、「基地局識別子」と、「日時刻」とを含むデータを、ユーザ有意圏推定装置1へ送信する。
データ(端末識別子、基地局識別子、日時刻)
【0032】
ユーザ有意圏推定装置1は、広域無線通信網(携帯電話網)に接続されており、携帯端末(携帯電話機)を所持したユーザの有意圏を推定することができる。図2によれば、ユーザ有意圏推定装置1は、通信事業者網に接続する通信インタフェース部10と、接続履歴収集部11と、時間窓分割部12と、クラスタリング部13と、滞留判定部14と、ユーザ有意圏推定部15と、ユーザ有意圏登録部16と、アプリケーション処理部17とを有する。アプリケーション処理部17は、本発明によって推定されたユーザ毎の有意圏に基づいて、様々なサービスを実行する。通信インタフェース部を除くこれら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
【0033】
[接続履歴収集部]
接続履歴収集部11(図3のS11)は、携帯端末2が配下に位置する基地局3から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する。
【0034】
表1は、1つの携帯端末について収集された接続履歴を表す。
【表1】

【0035】
[時間窓分割部]
時間窓分割部12(図3のS12)は、接続履歴を所定の時間窓(時間区間)に分割する。時間窓は、時間幅T及びシフト幅Sによって決定される。シフト幅Sとは、開始時刻をSだけ遅らせたものである。即ち、T>Sの場合、時間窓は、T−Sだけ重畳することとなる。
【0036】
表2は、T=60分及びS=15分とした場合における、各時間窓の開始時刻及び終了時刻を表す。
【表2】

【0037】
次に、時間窓毎に、各基地局識別子の出現数を計数する。
18:00:00〜18:59:59の時間窓について、基地局IDの個数を計数すると、「基地1」は4個、「基地2」は3個となる。
18:15:00〜19:14:59の時間窓について、基地局IDの個数を計数すると、「基地1」は2個、「基地2」は3個となる。
以下同様に計数される。
【0038】
表3は、時間窓毎に、各基地局IDの出現数を表す。
【表3】

【0039】
[クラスタリング部]
クラスタリング部13(図3のS13)は、時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集する。
【0040】
クラスタリング部13は、時間窓を「文書」とし且つ基地局識別子を「単語」として、文書及び単語に対する潜在状態(トピック)を推定するHDP(Hierarchical Dirichlet Process)−LDA(Latent Dirichlet Allocation)を用いる。これによって、各時間窓について推定された潜在状態を、各時間窓が所属するクラスタとする。
【0041】
ここで、各時間窓における基地局IDの出現数は、ユーザの潜在状態に依存する確率分布に従って生成されたと想定できる。ユーザの潜在状態は、時間窓毎に、異なる多項分布に従って生成される。
【0042】
例えば、携帯端末を所持するユーザが、滞留点Aから滞留点Bへ移動した場合、潜在状態として以下の3つが想定できる。
・「滞留点A」
・「滞留点B」
・「移動中」(適宜さらに分割される場合もあるが、仮にひとつのまとまりとする)
【0043】
潜在状態が「滞留点」である場合には、携帯端末は、その付近の少数個の基地局との間で通信イベントが発生することが想定される。一方で、潜在状態が「移動中」の場合には、移動経路上の多くの基地局との間で通信イベントが発生することが想定される。
【0044】
表4は、時間窓毎における各基地局の出現数に基づいて、潜在状態を表す。
【表4】

【0045】
<LDA>
図4は、LDAの確率ネットワーク図である。
wij:時間窓iで、j番目に観測された基地局ID
zij:潜在状態
θi:時間窓毎の潜在状態分布パラメータ
α、β:超パラメータ
zij、θiの事後確率分布と、α、βの最適値(第二種最尤推定値)を求めることによって、携帯端末毎に基地局との接続履歴から、ユーザの潜在状態を推定し、時間窓毎に潜在状態を分類する(各潜在状態への所属確率を求める)ことができる。βについては、更に事前分布を設定することもある。
【0046】
<HDP−LDA>
図5は、HDP−LDAの確率ネットワーク図である。
LDAによれば、潜在状態の数を予め与える必要がある。これに対し、HDP−LDAによれば、データの複雑さに合わせて必要な数の潜在状態数を自動的に決めることができる。そのために、HDP−LDAによれば、G0、θi、zijの分布と、α及びβの最適値を推定する。これによって、θiの次元、即ち、潜在クラス数は、Dirichlet過程のパラメータαに従ってデータから決まるため、予め決定しておく必要もない。LDA又はHDP−LDAのいずれについても、実際の推定計算には、変分ベイズ法又はマルコフ連鎖モンテカルロ法が用いられる。
【0047】
表5は、HDP−LDAのクラスタリングの計算結果を表す。これは、時間窓毎の各クラスタへの所属確率を表す。
【表5】

【0048】
表6は、HDP−LDAを用いたクラスタリングの過程で計算される超パラメータβの結果を表す。βは、各潜在状態について、各基地局と通信する確率を表すパラメータの集合である。
【表6】

【0049】
[滞留判定部]
滞留判定部14(図3のS14)は、クラスタ毎に、「滞留状態」か否かを判定する。ここで、「滞留状態」を判定するために、以下の2つの方法がある。
<1>エントロピー(クラスタ内の基地局分布のランダムさ)が低いクラスタほど「滞留状態」と判定する。逆に、エントロピーが高いクラスタほど「移動状態」と判定する。
<2>当該クラスタに含まれるベクトルの分散が低いクラスタほど「滞留状態」と判定する。逆に、当該クラスタに含まれるベクトルの分散が高いクラスタほど「移動状態」と判定する。
【0050】
<エントロピーを用いる方法>
HDP-LDAを用いたクラスタリングの過程で計算される超パラメータβ(各潜在状態において各基地局と通信をする確率を表すパラメータの集合)の結果を用いて、各クラスタ内の基地局分布のランダムさの程度を表すエントロピーを計算し、その大きさをもとに滞留判定を行う。
【0051】
「エントロピー」とは、情報理論の概念であって、事象の生起のランダムさを表す尺度である。どのイベントが起こるかはっきりしている(ランダムさが小さい)状態(例えば滞留状態)には何らかの意味がある可能性が高く、どのイベントが起こるかはっきりしない(ランダムさが大きい)状態にはあまり意味がない。
【0052】
(1)クラスタiについて、各基地局jと通信する確率pijを用いてクラスタiのエントロピーentropyiを計算する。エントロピーは、クラスタの分散の程度を表す。
entropyi=−Σjijlogpij
例えば、クラスタ1の場合、各基地局と通信する確率は、表6によれば以下のようになる。
{0.49, 0.49, 0.01, 0.01, 0.0, 0.0, 0.0}
従って、エントロピーは、以下のように表される。
entropyi=-0.49log(0.49)-0.49log(0.49)-0.01log(0.01)-0.01log(0.01)
≒0.34
(2)次に、クラスタを、エントロピーの昇順でソートする。
(3)そして、エントロピーが閾値th以上のクラスタを「移動状態クラスタ」、th以下のクラスタを「滞留状態クラスタ」と判定する。
【0053】
表7は、エントロピーを用いた場合における、クラスタ毎の滞留状態の判定結果を表す。ここでは、例えばth=0.5とした場合であって、クラスタ1及び2は「滞留状態」と判定され、「クラスタ3」は「移動状態」と判定される。
【表7】

【0054】
<分散を用いる方法>
表8は、各基地局の位置情報を表す。このように、予め固定されている基地局の位置情報を用いて、クラスタの位置情報の分散共分散行列を計算し、その最大固有値の大きさに基づいて滞留状態を判定する。
【表8】

【0055】
(1)エリアに合わせて、緯度経度から分散共分散行列計算のための基地局位置情報を求める。表9は、補正後の基地局位置を表す。ここでは、前述の緯度経度の平均位置である緯度経度(35.4, 135.8)付近の緯度1度≒111.3km、経度1度≒90.8kmに基づいて、以下の式により、基地局jの緯度latj,経度lonjから基地局jの補正位置xj,yjを得る。楕円体を用いて、更に正確に補正することも好ましい。
【数1】

【表9】

【0056】
(2)次に、時間窓毎の各クラスタへの所属確率(表5参照)と、時間窓毎の基地局の個数(表6参照)とに基づいて、クラスタiで基地局jとの通信回数の期待値nijを計算する。
例えば、n11=0.99×4.0+0.98×2.0=5.92となる。
【0057】
表10は、クラスタ毎の各基地局との通信回数の期待値を表す。
【表10】

【0058】
(3)以下の式によって、クラスタiの分散共分散行列Siを計算する。
【数2】

例えば、以下のようになる。
【数3】

【0059】
(4)次に、クラスタiの分散共分散行列の最大固有値(第1主成分得点の分散)λiを計算する。例えば、λ1=178.83となる。
【0060】
(5)次に、クラスタを、分散共分散行列の最大固有値の昇順でソートする。
【0061】
(6)そして、分散共分散行列の最大固有値が閾値th以上のクラスタを「移動状態クラスタ」、th以下のクラスタを「滞留状態クラスタ」と判定する。
例えばth=2000とした場合、クラスタ1及び2「滞留状態クラスタ」と判定され、クラスタ3は「移動状態クラスタ」と判定される。
【0062】
表11は、分散を用いた場合における滞留状態の判定結果を表す。
【表11】

【0063】
[ユーザ有意圏推定部]
ユーザ有意圏推定部15(図3のS15)は、クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定する。有意圏は、滞留状態と判定されたクラスタに基づく地域圏であるとする。ここで、ユーザにとっての有意圏とは、「住所」又は「居所」とする。また、携帯端末から基地局に対する接続履歴は、カレンダ又はユーザ設定による平日及び休日の日属性に基づいて変換する。
【0064】
表12は、ユーザの有意圏の推定を表す。
【表12】

【0065】
ここで、平日/休日の定義は、カレンダ情報に基づいて土曜日及び日曜日に設定されたものであってもよいし、ユーザに利用態様に応じて設定されたものであってもよい。携帯端末が、携帯電話機である場合、アプリケーションとして搭載されたカレンダ/スケジューラの機能を用いることもできる。
【0066】
次に、クラスタ毎に、日属性に基づいて滞在率を算出する。滞在率は、例えば以下のように算出される。
D:総出現回数
Dw:平日出現回数
Dh:休日出現回数
nd(c):クラスタcにおける総出現回数
ndw(c):クラスタcにおける平日出現回数
ndh(c):クラスタcにおける休日出現回数
R(c):クラスタcにおける全日滞在率
R(c)=nd(c)/D
Rw(c):クラスタcにおける平日滞在率
Rw(c)=ndw(c)/Dw
Rh(c):クラスタcにおける休日滞在率
Rh(c)=ndh(c)/Dh
【0067】
ユーザ有意圏推定部15は、滞在状態にあると判定されたクラスタについて、自宅のような「住所」、及び、職場・学校のような「居所」に区分する。そして、以下のような3つのいずれかの方法で、滞留状態と判定されたクラスタの地域圏に対して、住所/居所を推定することができる。
【0068】
(1)平日休日を問わず、全日滞在率が高いクラスタAを住所と規定し、クラスタA以外に平日滞在率が高いクラスタBを居所と規定する。
【0069】
(2)全日滞在率が高い2つのクラスタA及びクラスタBを選択し、平日滞在率が高い一方のクラスタを「居所」と規定し、他方のクラスタを「住所」と規定する。
Rw(A)>Rw(B)の場合:クラスタA「住所」、クラスタB「居所」
Rw(A)<Rw(B)の場合:クラスタA「居所」、クラスタB「住所」
Rw(A)=Rw(B)の場合:休日滞在率が高い方のクラスタを「住所」
【0070】
(3)全日滞在率が高い2つのクラスタA及びクラスタBを選択し、休日滞在率が高い一方のクラスタを「住所」と規定し、他方のクラスタを「居所」と規定する。
Rh(A)>Rh(B)の場合:クラスタA「住所」、クラスタB「居所」
Rh(A)<Rh(B)の場合:クラスタA「居所」、クラスタB「住所」
Rh(A)=Rh(B)の場合:平日滞在率が高い方のクラスタを「居所」
【0071】
例えば、表12によれば、クラスタ2が「住所」として規定され、クラスタ1が「居所」として規定されている。
【0072】
[ユーザ有意圏登録部]
ユーザ有意圏登録部16は、クラスタID、基地局ID、所属率、緯度(任意)、経度(任意)、及び、有意圏ラベル(任意)から構成されたデータを登録する。ここで、所属率は、クラスタ毎に各基地局と通信をする確率であり、クラスタリング部13によって算出されたβの値を格納する。また、クラスタについては現回数の降順にソートし、基地局については所属率の降順にソートする。
【0073】
表13は、有意圏登録データを表す。ここでは、所属率=0.05の閾値が設定されており、その閾値以上の基地局IDが登録されている。また、所属率の代わりに、クラスタ毎に各基地局と通信する回数の期待値(表10参照)に対して閾値を設けてもよい。
【表13】

【0074】
尚、ユーザ有意圏登録部が、滞在状態(住所/居所)と判定されたクラスタについて、地域名称に対応付けて記憶することも好ましい。例えば、そのクラスタに属する基地局周辺の駅名を地域名称として記憶するものであってもよい。これら地域名称は、アプリケーション処理部113によって様々に利用することができる。
【0075】
例えば、図1を参照すると、住所位置に最も近い「ふじみ野」駅を、住所位置の地域名称と規定される。また、居所位置に最も近い「飯田橋」駅を、居所位置の地域名称と規定される。従って、居所位置から離れた「水道橋」駅及び「神保町」駅は、居所位置の地域名称として選択されない。クラスタの重心位置が正しい住所位置からずれている場合であっても、地域名称は正しい名称をつけることができる。
【0076】
以上、詳細に説明したように、本発明の装置、プログラム及び方法によれば、携帯端末の測位機能を起動させることなく、通信事業者設備によって取得可能であって、空間的粒度が粗く、且つ、時間間隔が一定でない基地局位置情報を用いて、ユーザの有意位置を推定することができる。
【0077】
本発明によれば、携帯端末がGPSのような測位機能を起動する必要がないので、携帯端末の電池の消耗を考慮する必要がない。即ち、ユーザの有意圏を推定するための全ての情報は、通信事業者側のみで取得できるものである。ユーザの有意圏を推定することによって提供できるサービスとしては、例えば、ユーザ毎に生活場所に応じたクーポン情報等を配信するパーソナライズド情報提供サービスなどがある。
【0078】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0079】
1 ユーザ有意圏推定装置
10 通信インタフェース部
11 接続履歴収集部
12 時間窓分割部
13 クラスタリング部
14 滞留判定部
15 ユーザ有意圏推定部
16 ユーザ有意圏登録部
17 アプリケーション処理部
2 携帯端末、携帯電話機
3 基地局

【特許請求の範囲】
【請求項1】
携帯端末を所持したユーザの有意圏を推定することができる、広域無線通信網に接続されたユーザ有意圏推定装置であって、
携帯端末が配下に位置する基地局から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する接続履歴収集手段と、
前記接続履歴を所定の時間窓(時間区間)に分割し、時間窓毎に各基地局識別子の出現数を計数する時間窓分割手段と、
前記時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集するクラスタリング手段と、
前記クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定するユーザ有意圏推定手段と
を有することを特徴とするユーザ有意圏推定装置。
【請求項2】
前記クラスタ毎に、当該クラスタのエントロピー(クラスタ内の基地局分布のランダムさ)が低いクラスタほど「滞留状態」と判定する滞留判定手段を更に有し、
前記ユーザ有意圏推定手段は、滞留状態と判定されたクラスタに基づく地域圏を、当該ユーザの生活圏として推定する
ことを特徴とする請求項1に記載のユーザ有意圏推定装置。
【請求項3】
前記クラスタ毎に、当該クラスタに含まれるベクトルの分散が低いクラスタほど「滞留状態」と判定する滞留判定手段を更に有し、
前記ユーザ有意圏推定手段は、滞留状態と判定されたクラスタに基づく地域圏を、当該ユーザの生活圏として推定する
ことを特徴とする請求項1に記載のユーザ有意圏推定装置。
【請求項4】
前記クラスタリング手段は、時間窓を「文書」とし且つ基地局識別子を「単語」として、文書及び単語に対する潜在状態(トピック)を推定するHDP(Hierarchical Dirichlet Process)−LDA(Latent Dirichlet Allocation) を用いており、
各時間窓について推定された前記潜在状態を、各時間窓が所属するクラスタとすることを特徴とする請求項1から3のいずれか1項に記載のユーザ有意圏推定装置。
【請求項5】
前記接続履歴収集手段は、前記接続履歴を、カレンダ又はユーザ設定による平日及び休日の日属性に基づいて区分し、
前記ユーザ有意圏推定手段は、
前記滞留状態について、自宅のような「住所」、及び、職場・学校のような「居所」に区分し、
全日滞在率が高い第1のクラスタを前記住所と規定し、第1のクラスタ以外に平日滞在率が高い第2のクラスタを前記居所と規定するか、
全日滞在率が高い2つのクラスタを選択し、平日滞在率が高い一方のクラスタを前記居所と規定し、他方のクラスタを前記住所と規定するか、又は、
全日滞在率が高い2つのクラスタを選択し、休日滞在率が高い一方のクラスタを前記住所と規定し、他方のクラスタを前記居所と規定する
ことによって、滞留状態と判定されたクラスタの地域圏が、住所/居所を推定することを特徴とする請求項1から4のいずれか1項に記載のユーザ有意圏推定装置。
【請求項6】
前記広域無線通信網は、携帯電話網であり、
前記携帯端末は、携帯電話機であり、
前記ユーザ有意圏推定装置は、携帯電話網の通信事業者設備として設置されたものである
ことを特徴とする請求項1から5のいずれか1項に記載のユーザ有意圏推定装置。
【請求項7】
携帯端末を所持したユーザの有意圏を推定することができる、広域無線通信網に接続された通信事業者設備装置におけるユーザ有意圏推定方法であって、
携帯端末が配下に位置する基地局から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する第1のステップと、
前記接続履歴を所定の時間窓(時間区間)に分割し、時間窓毎に各基地局識別子の出現数を計数する第2のステップと、
前記時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集する第3のステップと、
前記クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定する第4のステップと
を有することを特徴とするユーザ有意圏推定方法。
【請求項8】
携帯端末を所持したユーザの有意圏を推定することができる、広域無線通信網に接続された通信事業者設備装置に搭載されたコンピュータにおけるユーザ有意圏推定プログラムであって、
携帯端末が配下に位置する基地局から、日時刻及び基地局識別子の多数のデータを含む接続履歴を収集し、携帯端末毎に区分する接続履歴収集手段と、
前記接続履歴を所定の時間窓(時間区間)に分割し、時間窓毎に各基地局識別子の出現数を計数する時間窓分割手段と、
前記時間窓毎に、複数の基地局識別子を要素とし、出現数を値とするベクトルを生成し、当該ベクトルをクラスタに凝集するクラスタリング手段と、
前記クラスタ毎に、当該クラスタに含まれるベクトルの各基地局識別子の出現数に基づいてユーザの有意圏を推定するユーザ有意圏推定手段と
してコンピュータを機能させることを特徴とするユーザ有意圏推定プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate