説明

行動履歴分析方法、装置及びプログラム

【課題】ユーザの行動が変化したか否かを判断することにより、ユーザIDが譲渡されたか否かを容易に判断することができる方法を提供する。
【解決手段】予めユーザIDと、ユーザの行動を特徴付ける素性項目毎の特性を示す素性値を成分とする素性ベクトルと、を関連付けて記憶した行動履歴を読込む行動履歴読込ステップと、前記読込まれた行動履歴に記憶された前記素性ベクトルの一部また全部を教師データとして、一のユーザIDに関連付けられた素性ベクトルと、他のユーザIDに関連付けられた素性ベクトルと、を分離する分離超平面を算出し、教師データでない前記一のユーザIDに関連付けられた素性ベクトルが、前記分離超平面で分離される領域のうち、自分のユーザIDに関連付けられた教師データが包含される領域に属さない場合に、前記一のユーザIDに対応するユーザの行動が変化したと判断する行動履歴分析ステップと、を少なくとも実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの行動履歴を分析する行動履歴分析方法、装置及びプログラムに関する。
【背景技術】
【0002】
近年、様々なインターネットサービスにおいてユーザIDが利用されている。例えば、ウェブメールを利用する際には、ユーザID及びパスワードを入力してログインする必要がある。
【非特許文献1】[online]、YAHOO!JAPAN メール、[2008年7月29日検索]、インターネット<URL:https://login.yahoo.co.jp/config/login?.src=www&.done=http://www.yahoo.co.jp>
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記従来例のインターネットサービスでは、ユーザIDが他人に譲渡(盗難を含む。以下、同じ。)されたか否かを容易に判断することはできなかった。正しいユーザID及びパスワードを入力してログインした者は本人であると推定されるからである。
【0004】
本発明は、このような事情を考慮して提案されるものであり、所定のルールに基づいてユーザの行動が変化したか否かを判断することにより、ユーザIDが譲渡されたか否かを容易に判断することができる行動履歴分析方法、装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
上記目的を達成するために、本発明者は、所定のルールに基づいてユーザの行動が変化したか否かを判断する方法を見出し、本発明を想到するに至った。
【0006】
本発明に係る行動履歴分析方法は、予め定められた一定のルールに従ってユーザの行動を特徴付ける素性項目毎の特性を示す素性値を成分とする素性ベクトルを分類して、ユーザの行動が変化したか否かを判断することにより、ユーザIDが譲渡されたか否かを容易に判断するものである。
【0007】
(1)コンピュータが、予めユーザIDと、ユーザの行動を特徴付ける素性項目毎の特性を示す素性値を成分とする素性ベクトルと、を関連付けて記憶した行動履歴を読込む行動履歴読込ステップと、前記読込まれた行動履歴に記憶された前記素性ベクトルの一部または全部を教師データとして、一のユーザIDに関連付けられた素性ベクトルと他のユーザIDに関連付けられた素性ベクトルを機械学習により分離し、
教師データでない前記一のユーザIDに関連付けられた素性ベクトルが自分のユーザIDに関連付けられた領域に属さない場合に、前記一のユーザIDに対応するユーザの行動が変化したと判断する行動履歴分析ステップと、を少なくとも実行することを特徴とする行動履歴分析方法。
【0008】
ここで、素性項目としては、例えば、検索エンジンに対する検索クエリー、ニュース等のコンテンツの閲覧、カレンダー等のウェブスケジューラーの内容、ブログの語調、メッセンジャーの語調、メールの語調等が該当する。これらの素性項目はユーザ毎に傾向があり、ユーザの行動を特徴付けている。また、素性値としては、例えば、素性項目としてのメールの語調に対して、「関西弁」ならば「1」、「東北弁」ならば「2」のように、地方毎の方言に応じて所定の数値を割り当てるようにしてもよい。教師データとは、与えられたデータとその属性との対応付けのことをいう。教師データとしては、例えば、所定の素性ベクトルAは、ユーザAに属するものであるという対応付けが該当する。また、機械学習については数々の方法があるが、例えば、サポートベクターマシン(SVM;詳しくは、公知の文献、V.Vapnik, “The Nature of Statistical Learning Theory”, Springer, (1995)等参照)を利用してよい。
【0009】
(1)の発明によれば、ユーザIDに関連付けられた素性ベクトルが機械学習(たとえばSVM)で分離される領域のいずれに属するかにより、ユーザIDに対応するユーザの行動が変化したか否かを判断するので、ユーザIDが譲渡されたか否かを容易に判断することができる。
【0010】
(2)前記一のユーザIDに対応するユーザの行動が変化したと判断した場合に、前記一のユーザIDが譲渡された可能性がある旨を出力することを特徴とする(1)に記載の行動履歴分析方法。
【0011】
(2)の発明によれば、前記一のユーザIDに対応するユーザの行動が変化したと判断した場合に、前記一のユーザIDが譲渡された可能性がある旨を出力するので、ユーザIDが譲渡された可能性を容易に認知することができる。
【0012】
ここで、前記一のユーザIDが譲渡された可能性がある旨を出力するとともに、このユーザIDを利用したログインを禁止するようにしてもよい。これによると、ユーザIDが盗難等された場合に、不正なログインを防止することができる。
【0013】
(3)前記一のユーザIDに関連付けられた素性ベクトルが、サポートベクターマシンにおける分離超平面で分離される領域のうち、前記他のユーザIDに関連付けられた教師データが包含される領域に属する場合に、該素性ベクトルの成分に予め関連付けられた広告を、前記一のユーザIDに予め関連付けられたメールアドレス宛てに送信することを特徴とした(1)に記載の行動履歴分析方法。
【0014】
(3)の発明によれば、ユーザの行動が変化したと判断した場合に、その判断のもととなった素性ベクトルの成分に予め関連付けられた広告を配信するので、広告の効果的な配信をすることができる。ここで、素性ベクトルの成分である素性値が変化したものについてのみ、変化後の素性値に関連付けられた広告を所定の記憶手段から抽出して、分析結果出力手段13に渡すようにしてもよい。例えば、素性項目としてのインターネットショッピングの履歴に対して、その素性値が「車」に対応する値から「子供用品」に対応する値に変化した場合に、「子供用品」に関連付けられた広告を配信することが考えられる。これによると、変化のない素性値に関連付けられた広告を配信しないようにすることができる。
【0015】
(4)予めユーザIDと、ユーザの行動を特徴付ける素性項目毎の特性を示す素性値を成分とする素性ベクトルと、を関連付けて記憶した行動履歴を読込む行動履歴読込手段と、前記読込まれた行動履歴に記憶された前記素性ベクトルの一部または全部を教師データとして、一のユーザIDに関連付けられた素性ベクトルと、他のユーザIDに関連付けられた素性ベクトルと、を分離する分離超平面を算出し、教師データでない前記一のユーザIDに関連付けられた素性ベクトルが、前記分離超平面で分離される領域のうち、自分のユーザIDに関連付けられた教師データが包含される領域に属さない場合に、前記一のユーザIDに対応するユーザの行動が変化したと判断する行動履歴分析手段と、前記判断した結果を出力する分析結果出力手段と、を備えることを特徴とする行動履歴分析装置。
【0016】
(5)(1)に記載の方法をコンピュータに実行させることを特徴とするプログラム。
【発明の効果】
【0017】
この発明によれば、ユーザIDに関連付けられた素性ベクトルが分離超平面で分離される領域のいずれに属するかにより、ユーザIDに対応するユーザの行動が変化したか否かを判断するので、ユーザIDが譲渡されたか否かを容易に判断することができる。
【発明を実施するための最良の形態】
【0018】
以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
[行動履歴分析装置の機能構成]
【0019】
図1は、本実施形態に係る行動履歴分析装置1の機能構成の概要を示す図である。本実施形態に係る行動履歴分析装置1は、ユーザの行動履歴を分析するものであり、行動履歴読込手段11と、行動履歴分析手段12と、分析結果出力手段13と、を備える。
【0020】
行動履歴読込手段11は、ユーザの行動履歴を記憶した行動履歴データベース14のデータを読込み、行動履歴分析手段12に渡す。ここで、行動履歴データベース14は、行動履歴読込手段11の一部を構成している。行動履歴データベース14の詳細については後述する。
【0021】
行動履歴分析手段12は、行動履歴読込み手段から受け取った行動履歴データベース14のデータを分析して、ユーザの行動が変化したか否かを判断する。そして、行動履歴分析手段12は、判断結果を分析結果出力手段13に渡す。
【0022】
分析結果出力手段13は、行動履歴分析手段12から受け取った判断結果をディスプレイ等の表示装置に出力する。
[行動履歴データベースの構成]
【0023】
図2は、行動履歴データベース14の構成の概要を示す図である。
【0024】
行動履歴データベース14は、ユーザの行動を特徴付ける素性項目毎のテーブルとして、検索クエリーテーブル、コンテンツ閲覧テーブル、スケジュール内容テーブル、ブログ語調テーブル、メール語調テーブル、を備える。
【0025】
検索クエリーテーブルは、予めユーザIDと、素性項目としての検索エンジンに対する検索クエリーの特性を示す素性値、期間とをそれぞれ対応付けて記憶している。この素性値としては、例えば、検索クエリーに含まれる単語が、「車」に関する単語ならば「1」、「子供用品」に関する単語ならば「2」のように、予め定められたカテゴリに応じて所定の数値を割り当てる。
【0026】
コンテンツ閲覧テーブルは、予めユーザIDと、素性項目としてのニュース等のコンテンツの閲覧の特性を示す素性値、期間とをそれぞれ対応付けて記憶している。この素性値としては、例えば、ユーザIDに対応するユーザが閲覧したコンテンツが、「車」に関するコンテンツならば「1」、「子供用品」に関するコンテンツならば「2」のように、予め定められたカテゴリに応じて所定の数値を割り当てる。
【0027】
スケジュール内容テーブルは、予めユーザIDと、素性項目としてのカレンダー等のウェブスケジューラーの内容の特性を示す素性値、期間とをそれぞれ対応付けて記憶している。この素性値としては、例えば、ユーザIDに対応するユーザのスケジュールが、「仕事」に関する予定であれば「1」、「私事」に関する予定であれば「2」のように、予め定められたカテゴリに応じて所定の数値を割り当てる。
【0028】
ブログ語調テーブルは、予めユーザIDと、素性項目としてのブログの語調の特性を示す素性値、期間とをそれぞれ関連付けて記憶している。この素性値としては、例えば、ブログの語調が、「関西弁」ならば「1」、「東北弁」ならば「2」のように、地方毎の方言に応じて所定の数値を割り当てる。語調を特定する方法としては、例えば、素性項目に関連する文章としてのブログの文章を形態素解析により分割して得られた語尾と予め所定の記憶手段に記憶した地方毎の方言の語尾とを比較することにより、その方言を特定する。なお、形態素解析とは、与えられた文を文法上意味のある最小の単位(形態素)に区切ることをいう。形態素解析としては、例えば、隠れマルコフモデルによる形態素解析等が該当する。
【0029】
メール語調テーブルは、予めユーザIDと、素性項目としての電子メールの語調の特性を示す素性値、期間とをそれぞれ関連付けて記憶している。この素性値としては、例えば、電子メールの語調が、「関西弁」ならば「1」、「東北弁」ならば「2」のように、地方毎の方言に応じて所定の数値を割り当てる。語調を特定する方法は、ブログの語調を特定する方法と同様である。
【0030】
上記の行動履歴データベース14の構成は、すなわち、予めユーザIDと、素性項目毎の特性を示す素性値を成分とする素性ベクトル、期間とがそれぞれ関連付けて行動履歴データベース14に記憶されていることを意味する。ここで、素性ベクトルの第1の成分から第5の成分は、それぞれ、検索クエリーテーブル、コンテンツ閲覧テーブル、スケジュール内容テーブル、ブログ語調テーブル、メール語調テーブルの素性値とする。
[行動履歴分析装置のハードウェア構成図]
【0031】
図3は、本実施形態に係る行動履歴分析装置1のハードウェア構成を示す図である。
【0032】
行動履歴分析装置1は、制御部300を構成するCPU(Central Processing Unit)310(マルチプロセッサ構成ではCPU320等複数のCPUが追加されてもよい)、バスライン200、通信I/F(I/F:インタフェース)330、メインメモリ340、BIOS(Basic Input Output System)350、表示装置355、I/Oコントローラ360、ハードディスク370、光ディスクドライブ380、並びに半導体メモリ390を備える。尚、ハードディスク370、光ディスクドライブ380、並びに、半導体メモリ390はまとめて記憶装置410と呼ばれる。
【0033】
制御部300は、行動履歴分析装置1を統括的に制御する部分であり、ハードディスク370(後述)に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
【0034】
通信I/F330は、行動履歴分析装置1が、通信ネットワークを介して外部装置と情報を送受信する場合のネットワーク・アダプタである。通信I/F330は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
【0035】
BIOS350は、行動履歴分析装置1の起動時にCPU310が実行するブートプログラムや、行動履歴分析装置1がハードウェアに依存するプログラム等を記録する。
【0036】
表示装置355は、データの入力を受け付ける画面を表示したり、結果を出力する画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
【0037】
I/Oコントローラ360には、ハードディスク370、光ディスクドライブ380、及び半導体メモリ390等の記憶装置410を接続することができる。
【0038】
ハードディスク370は、本ハードウェアを行動履歴分析装置1として機能させるための各種プログラム、本発明の機能を実行するプログラム等を記憶する。なお、行動履歴分析装置1は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。
【0039】
光ディスクドライブ380としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク400を使用する。光ディスク400から光ディスクドライブ380によりプログラムまたはデータを読み取り、I/Oコントローラ360を介してメインメモリ340またはハードディスク370に提供することもできる。
【0040】
なお、行動履歴分析装置1は、記憶装置410、制御部300等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。
【0041】
この行動履歴分析装置1では、制御部300が主として行動履歴分析手段12に対応し、メインメモリ340が主として行動履歴読込手段11に対応し、表示装置355又は通信I/F330が分析結果出力手段13に対応する。
[本発明の実施形態に係るフローチャート]
【0042】
図4は、本発明の実施形態に係る行動履歴分析処理のフローチャートを示している。
【0043】
S1:行動履歴読込手段11は、行動履歴データベース14から、過去の所定の期間(例えば、2008年1月1週から2008年1月4週まで)におけるユーザID毎に関連付けられた素性ベクトルを読込んで、行動履歴分析手段12に渡す。すなわち、行動履歴読込手段11は、行動履歴データベース14の各テーブルから、過去の所定の期間におけるユーザID毎に関連付けられた素性値を読込んで、行動履歴分析手段12に渡す。
【0044】
S2:行動履歴分析手段12は、行動履歴読込手段11から受け取った素性ベクトルを教師データとして、ユーザID毎に素性ベクトルを分離する分離超平面を算出する。ここで、分離超平面はサポートベクターマシンにより算出される。サポートベクターマシンでは、線形計画法により、教師データである一のユーザIDに関連付けられた素性ベクトル及び教師データである他のユーザIDに関連付けられた素性ベクトルとのそれぞれの距離が最大となる分離超平面が算出される。
【0045】
S3:行動履歴読込手段11は、行動履歴データベース14から、予め指定された期間(例えば、2008年6月から2008年7月まで)におけるユーザID毎に関連付けられた素性ベクトルを読込んで、行動履歴分析手段12に渡す。すなわち、行動履歴読込手段11は、行動履歴データベース14の各テーブルから、予め指定された期間におけるユーザID毎に関連付けられた素性値を読込んで、行動履歴分析手段12に渡す。なお、期間の指定は、キーボード等の所定の入力手段により受付けるようにしてもよい。
【0046】
S4:行動履歴分析手段12は、行動履歴読込手段11から受け取った予め指定された期間におけるユーザID毎に関連付けられた素性ベクトルを、ユーザID毎に算出された分離超平面を利用して分析する。すなわち、行動履歴分析手段12は、教師データでない一のユーザID(例えば、00001)に関連付けられ素性ベクトルが、このユーザIDの分離超平面で分離される領域のうち、自分のユーザID(00001)に関連付けられた領域に属さない場合に、一のユーザID(00001)に対応するユーザの行動が変化したと判断する。あるいは、他のユーザID(例えば、00002)に関連付けられた教師データが包含される領域に属する場合に、一のユーザID(00001)に対応するユーザの行動が変化したと判断してもよい。一方、行動履歴分析手段12は、上記の条件を満たさない場合に、一のユーザID(00001)に対応するユーザの行動は変化していないと判断する。そして、行動履歴分析手段12は、予め指定された期間における、ユーザID毎に関連付けられた素性ベクトルと、ユーザID毎の判断結果とを分析結果出力手段13に渡す。
【0047】
S5:分析結果出力手段13は、行動履歴分析手段12から受け取ったユーザID毎に関連付けられた素性ベクトルと、ユーザID毎の判断結果とをディスプレイ装置に出力する。図5は、ユーザID毎に関連付けられた素性ベクトルと、ユーザID毎の判断結果をディスプレイ装置に出力した画面の一例である。この画面では、ユーザID毎に素性項目毎の素性値と、判断(判定)結果とを表示している。ここで、分析結果出力手段13は、ユーザの行動が変化したと判断したユーザIDによるログインを禁止するようにしてもよい。これによると、ユーザIDが盗難等された場合に、不正なログインを防止することができる。また、判断結果は、単にユーザの行動が変化したか否かを示すものだけでなく、ユーザの行動が変化した場合には、ユーザIDが譲渡された可能性がある旨を表示するようにしてもよい。これによると、一見してユーザIDが譲渡された可能性を把握することができる。
【0048】
以上説明したように、ユーザIDに関連付けられた素性ベクトルが分離超平面で分離される領域のいずれに属するかにより、ユーザIDに対応するユーザの行動が変化したか否かを判断するので、ユーザIDが譲渡されたか否かを容易に判断することができる。また、インターネットサービスの提供者は、ユーザの行動が変化した場合に、ユーザIDが盗難された可能性があることをユーザIDに対応するユーザに通知することにより、セキュリティーの向上を図ることができる。
【0049】
図6は、本発明の実施形態に係る広告配信処理のフローチャートを示している。
【0050】
S11:行動履歴分析手段12は、一のユーザID(例えば、00001)に関連付けられた素性ベクトルが、このユーザIDの分離超平面で分離される領域のうち、自分のユーザID(00001)に関連付けられた領域に属さない場合に、あるいは、他のユーザID(例えば、00002)に関連付けられた教師データが包含される領域に属する場合に、この素性ベクトルの成分である素性値に予め関連付けられた広告を所定の記憶手段から抽出して、分析結果出力手段13に渡す。ここで、素性ベクトルの成分である素性値が変化したものについてのみ、変化後の素性値に関連付けられた広告を所定の記憶手段から抽出して、分析結果出力手段13に渡すようにしてもよい。例えば、素性ベクトルの成分である検索クエリーの素性値に対して、その素性値が「車」に対応する値から「子供用品」に対応する値に変化した場合に、「子供用品」に関連付けられた広告を、所定の記憶手段から抽出して、分析結果出力手段13に渡す。これによると、変化のない素性値に関連付けられた広告を配信しないようにすることができる。
【0051】
S12:行動履歴分析手段12は、一のユーザID(00001)に予め関連付けられたメールアドレス(00001@yahoo.co.jp)を所定の記憶手段から抽出して、分析結果出力手段13に渡す。
【0052】
S13:分析結果出力手段13は、行動履歴分析手段12から受け取った広告(子供用品の広告等)を、行動履歴分析手段12から受け取ったメールアドレス(00001@yahoo.co.jp)宛てに送信する。
【0053】
以上説明したように、ユーザの行動が変化したと判断した場合に、その判断のもととなった素性ベクトルの成分に予め関連付けられた広告を配信するので、広告の効果的な配信をすることができる。すなわち、広告を配信する業者は、例えば、ユーザの行動が変化した場合に、結婚等によりユーザの生活環境が変わるとともに趣味・嗜好が変わったことを推測することができる。そして、この業者は、ユーザの新しい趣味・嗜好に適した広告を配信することができる。これにより、広告された商品の売上を向上することが可能となる。
【0054】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
【図面の簡単な説明】
【0055】
【図1】本実施形態に係る行動履歴分析装置の機能構成の概要を示す図である。
【図2】行動履歴データベースの構成の概要を示す図である。
【図3】本実施形態に係る行動履歴分析装置のハードウェア構成を示す図である。
【図4】本発明の実施形態に係る行動履歴分析処理のフローチャートを示している。
【図5】本発明の実施形態に係るユーザID毎に関連付けられた素性ベクトルと、ユーザID毎の判断結果をディスプレイ装置に出力した画面の一例である。
【図6】本発明の実施形態に係る広告配信処理のフローチャートを示している。
【符号の説明】
【0056】
1 行動履歴分析装置
11 行動履歴読込手段
12 行動履歴分析手段
13 分析結果出力手段
14 行動履歴データベース

【特許請求の範囲】
【請求項1】
コンピュータが、
予めユーザIDと、ユーザの行動を特徴付ける素性項目毎の特性を示す素性値を成分とする素性ベクトルと、を関連付けて記憶した行動履歴を読込む行動履歴読込ステップと、
前記読込まれた行動履歴に記憶された前記素性ベクトルの一部または全部を教師データとして、一のユーザIDに関連付けられた素性ベクトルと他のユーザIDに関連付けられた素性ベクトルを機械学習により分離し、
教師データでない前記一のユーザIDに関連付けられた素性ベクトルが自分のユーザIDに関連付けられた領域に属さない場合に、前記一のユーザIDに対応するユーザの行動が変化したと判断する行動履歴分析ステップと、
を少なくとも実行することを特徴とする行動履歴分析方法。
【請求項2】
前記一のユーザIDに対応するユーザの行動が変化したと判断した場合に、前記一のユーザIDが譲渡された可能性がある旨を出力することを特徴とする請求項1に記載の行動履歴分析方法。
【請求項3】
前記一のユーザIDに関連付けられた素性ベクトルが、サポートベクターマシンにおける分離超平面で分離される領域のうち、前記他のユーザIDに関連付けられた教師データが包含される領域に属する場合に、該素性ベクトルの成分に予め関連付けられた広告を、前記一のユーザIDに予め関連付けられたメールアドレス宛てに送信することを特徴とした請求項1に記載の行動履歴分析方法。
【請求項4】
予めユーザIDと、ユーザの行動を特徴付ける素性項目毎の特性を示す素性値を成分とする素性ベクトルと、を関連付けて記憶した行動履歴を読込む行動履歴読込手段と、
前記読込まれた行動履歴に記憶された前記素性ベクトルの一部または全部を教師データとして、一のユーザIDに関連付けられた素性ベクトルと、他のユーザIDに関連付けられた素性ベクトルと、を分離する分離超平面を算出し、教師データでない前記一のユーザIDに関連付けられた素性ベクトルが、前記分離超平面で分離される領域のうち、自分のユーザIDに関連付けられた教師データが包含される領域に属さない場合に、前記一のユーザIDに対応するユーザの行動が変化したと判断する行動履歴分析手段と、
前記判断した結果を出力する分析結果出力手段と、
を備えることを特徴とする行動履歴分析装置。
【請求項5】
請求項1に記載の方法をコンピュータに実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate