説明

購買行動分析装置、購買行動分析方法及び購買行動分析プログラム

【課題】マーケティング分析を適切に実行すること。
【解決手段】購買行動分析装置は、ユーザ端末にてユーザが閲覧したWebページを含むWeb閲覧データを取得する。そして、購買行動分析装置は、取得したWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出する。そして、購買行動分析装置は、抽出したページ情報から、ページ情報に含まれる商品についての情報である商品情報を抽出する。そして、購買行動分析装置は、抽出したページ情報から、ページ情報に含まれる情報の要約である要約情報を生成する。そして、購買行動分析装置は、商品情報と要約情報とに対して、所定の統計解析処理を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、購買行動分析装置、購買行動分析方法及び購買行動分析プログラムに関する。
【背景技術】
【0002】
消費者の購買行動に関するデータを収集し、収集したデータに基づいてマーケティング分析を行う手法がある。例えば、RFID(Radio Frequency IDentification)のタグを商品に付けておき、消費者が操作する携帯端末が、物品と接触した際にタグの識別子を取得してデータベースに送信するRFID手法がある。RFID手法では、その後、データベースに記憶された情報に基づいて、分析装置がマーケティング分析を行う。
【0003】
また、例えば、POS(Point Of Sale)systemデータを用いてマーケティング分析を行う手法があり、アンケートを用いてユーザについてのデータを収集してマーケティング手法を行う手法がある。また、店舗内にある監視カメラから消費者の導線や視線を分析し、分析結果に基づいてマーケティング分析を行う手法があり、特定のEC(e-commerce)サイトにおいて得られるWebログを解析することでマーケティング分析を行う手法がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−122896号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の手法では、マーケティング分析を適切に実行できないという問題がある。例えば、POSを用いた手法において用いられるデータには、消費者の購買前後の行動データが含まれず、アンケートを用いる手法や監視カメラを用いる手法では、消費者の購買前後の行動データを収集するのにコストがかかる。また、例えば、アンケートを用いる手法では、パネルユーザが購買行動を起こす時点とデータが収集される時点との間にタイムラグがあり、アンケートに回答した消費者の記憶忘れに起因する回答間違いや回答漏れが発生する。また、例えば、監視カメラを用いる手法では、特定の店舗内における消費者の行動データが得られるに留まり、他の店舗をまたいで行った消費者による商品を比較する行動や価格を比較する行動などについて行動データが得られない。
【0006】
開示の技術は、上述に鑑みてなされたものであって、マーケティング分析を適切に実行可能である購買行動分析装置、購買行動分析方法及び購買行動分析プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
開示する購買行動分析装置は、一つの態様において、ユーザ端末にてユーザが閲覧したWebページを含むWeb閲覧データを取得する取得部を備える。また、購買行動分析装置は、前記取得部により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出部を備える。また、購買行動分析装置は、前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出部を備える。また、購買行動分析装置は、前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成部を備える。また、購買行動分析装置は、前記商品情報抽出部により抽出された前記商品情報と前記要約生成部により生成された要約情報とに対して、所定の統計解析処理を実行する統計解析部を備える。
【発明の効果】
【0008】
開示する購買行動分析装置の一つの態様によれば、マーケティング分析を適切に実行可能であるという効果を奏する。
【図面の簡単な説明】
【0009】
【図1】図1は、実施例1に係る購買行動分析装置の構成の一例を示すブロック図である。
【図2】図2は、実施例1に係る購買行動分析装置による処理の流れの一例を示すフローチャートである。
【図3】図3は、実施例2に係る購買行動分析システムの構成の一例を示すブロック図である。
【図4】図4は、実施例2におけるWeb閲覧データDBに記憶された情報の一例を示す図である。
【図5】図5は、実施例2における購買行動分析サーバによる処理の全体像について示す図である。
【図6】図6は、実施例2における本文抽出ルールDBに記憶された情報の一例を示す図である。
【図7】図7は、実施例2における閲覧本文データDBに記憶された情報の一例を示す図である。
【図8】図8は、実施例2における閲覧商品データDBに記憶された情報の一例を示す図である。
【図9】図9は、実施例2における購入商品データDBに記憶された情報の一例を示す図である。
【図10】図10は、実施例2における行動サマリデータDBに記憶された情報の一例を示す図である。
【図11】図11は、実施例2におけるマーケティングデータDBにより記憶されるマーケティングデータの一例を示す図である。
【図12】図12は、実施例2におけるマーケティングデータDBにより記憶されるマーケティングデータの一例を示す図である。
【図13】図13は、実施例2におけるパネルユーザ端末による処理の流れの一例を示すフローチャートである。
【図14】図14は、実施例2におけるWeb閲覧データ受信部による処理の流れの一例を示すフローチャートである。
【図15】図15は、実施例2における本文抽出部による登録処理の流れの一例を示すフローチャートである。
【図16】図16は、実施例2における本文抽出部による抽出処理の流れの一例を示すフローチャートである。
【図17】図17は、実施例2における商品情報抽出部による処理の流れの一例を示すフローチャートである。
【図18】図18は、実施例2におけるサマリ生成部による処理の流れの一例を示すフローチャートである。
【図19】図19は、実施例2における統計解析部による処理の流れの一例を示すフローチャートである。
【図20】図20は、実施例2の効果を示すための図である。
【図21】図21は、実施例3に係る購買行動分析システムの構成の一例を示すブロック図である。
【図22】図22は、実施例3における個人情報データDBに記憶された情報の一例を示す図である。
【図23】図23は、実施例3におけるパネルユーザ端末による処理について示すフローチャートである。
【図24】図24は、購買行動分析システムの構成のバリエーションの一例を示す図である。
【図25】図25は、購買行動分析プログラムによる情報処理がコンピュータを用いて具体的に実現されることを示す図である。
【発明を実施するための形態】
【0010】
以下に、開示する購買行動分析装置、購買行動分析方法及び購買行動分析プログラムの実施例について、図面に基づいて詳細に説明する。なお、本実施例により開示する発明が限定されるものではない。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【実施例1】
【0011】
[実施例1に係る購買行動分析装置の構成]
図1を用いて、実施例1に係る購買行動分析装置100の構成の一例を示す。図1は、実施例1に係る購買行動分析装置の構成の一例を示すブロック図である。図1に示す例では、購買行動分析装置100は、取得部101と、ページ情報抽出部102と、商品情報抽出部103と、要約生成部104と、統計解析部105とを有する。
【0012】
取得部101は、パネルユーザ端末にてパネルユーザが閲覧したWebページについての情報であるWeb閲覧データを取得する。ここで、Web閲覧データには、パネルユーザ端末にて閲覧されたWebページの内容が含まれ、例えば、WebページのHTML(Hyper Text Markup Language)データが含まれる。
【0013】
ここで、パネルユーザ端末についても簡単に説明する。パネルユーザ端末は、パネルユーザがWebページを閲覧するのに用いられる端末である。パネルユーザ端末は、例えば、既知のパーソナルコンピュータ、インターネットにアクセスする機能を有するテレビ、携帯電話、スマートフォン、PHS(Personal Handy-phone System)、PDA(Personal Digital Assistant)などが該当する。
【0014】
取得部101の説明に戻る。例えば、取得部101は、購買行動分析装置100の管理者によってパネルユーザ端末から収集されたWeb閲覧データが入力されることで、Web閲覧データを取得する。また、例えば、購買行動分析装置100とパネルユーザ端末とが接続された場合には、取得部101は、パネルユーザ端末からWeb閲覧データを収集する。購買行動分析装置100とパネルユーザ端末とは、例えば、インターネットを介して接続されたり、専用回線を用いて接続されたりする。
【0015】
ページ情報抽出部102は、取得部101により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出する。例えば、ページ情報抽出部102は、所定の抽出条件として、商品に関する情報を含むWebサイトを特定する条件と、Webサイトから抽出する情報を特定する条件とを用いて、抽出処理を実行する。商品に関する情報を含むWebサイトを特定する条件は、例えば、商品に関する情報を含むWebサイトのURL(Uniform Resource Locator)、商品に関する情報を含むWebサイトに含まれることが予測される語句、商品に関する情報を含むWebサイトである場合に付与されることが予測されるWebページのタイトルなどが該当する。Webサイトから抽出する情報を特定する条件は、例えば、Webサイト内における位置を特定する情報が該当する。ただし、本発明はこれに限定されるものではなく、任意の抽出条件を用いて良い。
【0016】
例えば、ページ情報抽出部102は、商品に関する情報を含むWebサイトを特定する条件に合致するWebページについてのWeb閲覧データから、Webサイトから抽出する情報を特定する条件に合致する情報を抽出する。より詳細な一例をあげて説明すると、ページ情報抽出部102は、商品に関する情報を含むWebサイトを特定する条件として指定されたURLと合致するURLを有するWebページについてのWeb閲覧データから、Webサイトから抽出する情報を特定する条件により特定される位置にある情報を抽出することで、商品名やWebサイト名、Webサイトに含まれる本文、価格表記などを抽出する。
【0017】
なお、ページ情報抽出部102により抽出されたページ情報には、ページ情報に含まれる商品についての情報である商品情報だけでなく、商品に関する情報を含むWebサイトに含まれた他の情報も含まれる。商品に関する情報とは、例えば、パネルユーザがどこからどんな商品についての情報を閲覧したのかを示す情報である。一例をあげて説明すると、「Webサイト名」や「商品名」、「価格表記」などは商品情報に該当し、Webサイトに含まれる「本文」などはその他の情報に該当する。
【0018】
商品情報抽出部103は、ページ情報抽出部102により抽出されたページ情報から、商品情報を抽出する。すなわち、ページ情報抽出部102により抽出されたページ情報には、商品に関する情報だけでなく、商品に関する情報を含むWebサイトに含まれた他の情報も含まれる。商品に関する情報とは、例えば、商品情報抽出部103は、パネルユーザがどこで閲覧したかを示す情報として「Webサイト名」を抽出し、どんな商品についての情報を閲覧したかを示す情報として「商品名」や「価格表記」を抽出する。
【0019】
要約生成部104は、ページ情報抽出部102により抽出されたページ情報から、ページ情報に含まれる情報の要約である要約情報を生成する。例えば、要約生成部104は、商品情報とその他の情報とを併せて用いた上で、要約情報を生成する。要約生成部104による要約情報生成処理については、任意の手法を用いて良い。なお、要約情報は、「行動サマリ」とも記載する。
【0020】
統計解析部105は、商品情報抽出部103により抽出された商品情報と要約生成部104により生成された要約情報とに対して、所定の統計解析処理を実行する。すなわち、統計解析部105は、Web閲覧データに対して統計解析処理を実行するのではなく、商品情報抽出部103による処理結果となるデータと、要約生成部104による処理結果となるデータとを併せたデータに対して統計解析処理を実行する。
【0021】
[実施例1に係る購買行動分析装置の処理]
図2を用いて、実施例1に係る購買行動分析装置100による処理の流れの一例を示す。図2は、実施例1に係る購買行動分析装置による処理の流れの一例を示すフローチャートである。
【0022】
図2に示すように、取得部101がWeb閲覧データを取得すると(ステップS101肯定)、ページ情報抽出部102は、Web閲覧データからページ情報を抽出する(ステップS102)。つまり、ページ情報抽出部102は、Web閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、パネルユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出する。例えば、ページ情報抽出部102は、商品名やWebサイト名、Webサイトに含まれる本文、価格表記などを抽出する。
【0023】
そして、商品情報抽出部103は、商品情報を抽出する(ステップS103)。例えば、商品情報抽出部103は、ページ情報から、パネルユーザがどこで閲覧したかを示す情報として「Webサイト名」を抽出し、どんな商品についての情報を閲覧したかを示す情報として「商品名」や「価格表記」を抽出する。
【0024】
そして、要約生成部104は、要約情報を生成する(ステップS104)。例えば、要約生成部104は、ページ情報に含まれる商品情報とその他の情報とを併せて用いた上で、要約情報を生成する。そして、統計解析部105は、商品情報と要約情報と所定の統計解析処理を実行する(ステップS105)。
【0025】
なお、上記の処理手順は、上記の順番に限定されるものではなく、処理内容を矛盾させない範囲で適宜変更しても良い。例えば、上記のステップS103をS104の後に実行しても良い。
【0026】
[実施例1の効果]
このように、実施例1に係る購買行動分析装置100によれば、パネルユーザ端末にてパネルユーザが閲覧したWebページを含むWeb閲覧データを取得し、Web閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出する。そして、購買行動分析装置100は、ページ情報に含まれる商品についての情報である商品情報をページ情報から抽出し、ページ情報に含まれる情報の要約である要約情報をページ情報から生成し、商品情報と要約情報とに対して所定の統計解析処理を実行する。この結果、実施例1に係る購買行動分析装置100によれば、マーケティング分析を適切に実行可能である。
【0027】
すなわち、実施例1に係る購買行動分析装置100によれば、Web閲覧データを用いることで、低コストで大規模にデータを収集して用いることが可能である。また、購買行動分析装置100によれば、パネルユーザ端末にて収集されるWeb閲覧データに基づいて統計解析処理を実行することで、購買行動を起こす時点とデータが収集される時点との間のタイムラグに起因した回答間違いや回答漏れを防止可能である。また、パネルユーザ端末にて収集されるWeb閲覧データに基づいて統計解析処理を実行することで、特定の店舗のデータに限定されることのないデータを収集して用いることが可能であり、購買行動前後の行動データを用いることも可能である。
【0028】
また、段階的に情報を集めて統合することで,各ページでは情報の不足が生じる部分を補完したデータが作成することが可能である。具体的には、商品情報とともに、要約情報を作成することで、パネルユーザの行動意図の読み取りに適した要約情報を併せて用いることで、情報の不足が生じる部分を補完したマーケティング分析が可能である。
【実施例2】
【0029】
[実施例2に係る購買行動分析システムの構成]
実施例2に係る購買行動分析システムについて説明する。図3は、実施例2に係る購買行動分析システムの構成の一例を示すブロック図である。図3において、200は、パネルユーザ端末を示し、300は、図1における購買行動分析装置100に対応する購買行動分析サーバを示し、401は、ECサイトを示し、402は、インターネットを示す。以下では、実施例1と同様の点については、説明を省略し、又は、簡単に説明する。
【0030】
図3に示す例では、パネルユーザ端末200と購買行動分析サーバ300とがインターネット402を介して接続される場合を示したが、本発明はこれに限定されるものではない。例えば、パネルユーザ端末200と購買行動分析サーバ300とは、専用回線を用いて接続されても良く、任意の手法にて接続されて良い。
【0031】
[パネルユーザ端末]
パネルユーザ端末200は、インターネット402を介してECサイト401と購買行動分析サーバ300と接続される。図3に示す例では、複数のパネルユーザ端末200がある場合を例に示したが、本発明はこれに限定されるものではなく、パネルユーザ端末200は1つであっても良い。パネルユーザ端末200は、Web閲覧データDB201と、Web閲覧データ送信部211とを有する。Web閲覧データDB201は、Web閲覧データ送信部211による各種処理に用いるデータを記憶する。Web閲覧データDB201は、例えば、RAM(Random Access Memory)やフラッシュメモリ(Flash memory)などの半導体メモリ素子、又は、ハードディスクや光ディスクなどが該当する。Web閲覧データDB201は、パネルユーザ端末200を利用するパネルユーザにより閲覧されたWebページを含むWeb閲覧データを記憶する。
【0032】
図4は、実施例2におけるWeb閲覧データDBに記憶された情報の一例を示す図である。図4に示す例では、Web閲覧データDB201は、「パネルユーザID」と「閲覧番号」と「閲覧日時」と「URL」「HTMLソース」とを対応付けて記憶する。図4の「パネルユーザID」は、パネルユーザを識別するIDを示し、図4の「閲覧番号」は、Web閲覧データDB201に記憶されたレコードを一意に識別する情報を示す。また、図4の「閲覧日時」は、パネルユーザにより閲覧された日時を示し、図4の「URL」は、パネルユーザにより閲覧されたWebページのURLと、図4の「HTMLソース」は、パネルユーザにより閲覧されたWebページのHTMLソースを示す。
【0033】
図4に示す例では、Web閲覧データDB201は、パネルユーザID「00000001」と閲覧番号「00000001」と閲覧日時「2009-12-25 17:01:23」とURL「http://www1.example.com/foo.html」とHTMLソース「<html><head>〜</head><body>〜</body></html>」とを対応付けて記憶する。すなわち、Web閲覧データDB201は、閲覧番号「00000001」により識別されるレコードとして、パネルユーザID「00000001」により識別されるパネルユーザが、パネルユーザ端末200にて、「2009-12-25 17:01:23」に、「http://www1.example.com/foo.html」にあるWebページを閲覧したことを記憶する。また、Web閲覧データDB201は、パネルユーザID「00000001」により閲覧されたWebページのHTMLソースが「<html><head>〜</head><body>〜</body></html>」であることを記憶する。
【0034】
なお、図4に示す例では、記載の便宜上、HTMLソースについて、HTMLソース内におけるヘッダの位置を示す<head>や内容の位置を示す<body>を記載するに留めた。ただし、実際には、Web閲覧データDB201は、HTMLソースとして、ヘッダの具体的な記載内容や、ボディの具体的な記載内容も記憶する。
【0035】
Web閲覧データDB201に記憶されるデータは、例えば、パネルユーザがパネルユーザ端末200を用いてWebページを閲覧するごとに、パネルユーザ端末200により格納される。
【0036】
Web閲覧データ送信部211は、各種の処理手順などを規定したプログラムを記憶する内部メモリを有し、種々の処理を制御する。Web閲覧データ送信部211は、例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、CPU(Central Processing Unit)、MPU(Micro Processing Unit)などの電子回路が該当する。
【0037】
Web閲覧データ送信部211は、Web閲覧データDB201に記憶されたWeb閲覧データを所定の契機にて購買行動分析サーバ300に送信する。所定の契機とは、例えば、一定量のWeb閲覧データが新たにWeb閲覧データDB201に蓄積されたタイミングや、5分おき、1時間おき等の定期間隔、新たなWeb閲覧データが格納されたタイミング、Web閲覧ソフトが開始したタイミングや終了したタイミングなどが該当する。ただし、本発明はこれに限定されるものではく、任意のタイミングであって良い。
【0038】
Web閲覧データ送信部211は、例えば、Web閲覧データのアーカイブを作成し、作成したアーカイブを購買行動分析サーバ300に送信する。ただし、本発明はこれに限定されるものではなくWeb閲覧データ送信部211は、アーカイブとすることなく、Web閲覧データをそのまま送信しても良い。
【0039】
[購買行動分析サーバ]
購買行動分析サーバ300について説明する。図3に示すように、購買行動分析サーバ300は、本文抽出ルールDB301と、辞書データDB302と、Web閲覧データDB303と、閲覧本文データDB304と、閲覧商品データDB305と、購入商品データDB306と、行動サマリデータDB307と、マーケティングデータDB308とを有する。また、購買行動分析サーバ300は、Web閲覧データ受信部311と、本文抽出部312と、商品情報抽出部313と、サマリ生成部314と、統計解析部315とを有する。
【0040】
ここで、本文抽出ルールDB301と、辞書データDB302と、Web閲覧データDB303と、閲覧本文データDB304と、閲覧商品データDB305と、購入商品データDB306と、行動サマリデータDB307と、マーケティングデータDB308とは、例えば、RAMやフラッシュメモリなどの半導体メモリ素子、又は、ハードディスクや光ディスクなどが該当する。また、Web閲覧データ受信部311と、本文抽出部312と、商品情報抽出部313と、サマリ生成部314と、統計解析部315とは、例えば、ASIC、FPGA、CPU、MPUなどの電子回路が該当する。なお、図3に示す例では、本文抽出ルールDB301〜マーケティングデータDB308について、それぞれ別のデータベースとして記載し、Web閲覧データ受信部311〜統計解析部315について、それぞれ別の処理部として記載した。ただし、本発明はこれに限定されるものではなく、本文抽出ルールDB301〜マーケティングデータDB308のうち一部又はすべてを統合したデータベースとしても良く、Web閲覧データ受信部311〜統計解析部315のうち一部又はすべてを統合した処理部としても良い。
【0041】
図5を用いて、実施例2における購買行動分析サーバ300による処理の全体像について示す。図5は、実施例2における購買行動分析サーバによる処理の全体像について示す図である。図5においては、図3と対応するデータベースや処理部については、同じ符号を付した。図5を用いて説明する際には、詳細な処理の説明については省略する。
【0042】
図5の(1)に示すように、購買行動分析サーバ300では、Web閲覧データ受信部311が、パネルユーザ端末200により収集されたWeb閲覧データを受信し、Web閲覧データDB303に格納する。つまり、Web閲覧データ受信部311は、パネルユーザが閲覧したWebページの内容を収集してWeb閲覧データDB303に格納する。
【0043】
そして、図5の(2)に示すように、本文抽出部312は、本文抽出ルールDB301に記憶された本文抽出ルールを用いて、Web閲覧データDB303に格納されたWeb閲覧データからページ情報を抽出し、閲覧本文データDB304に格納する。
【0044】
そして、図5の(3)に示すように、商品情報抽出部313は、辞書データDB302に記憶された辞書データを用いて、閲覧本文データDB304に記憶されたページ情報から、商品情報として、パネルユーザが閲覧した商品についての商品情報を抽出し、パネルユーザが購入した商品についての商品情報を抽出する。そして、商品情報抽出部313は、閲覧した商品についての商品情報を閲覧商品データDB305に格納し、購入した商品についての商品情報を購入商品データDB306に格納する。
【0045】
また、図5の(4)に示すように、サマリ生成部314は、辞書データDB302に記憶された辞書データを用いて、閲覧本文データDB304に記憶されたページ情報の要約情報を生成し、行動サマリデータDB307に格納する。例えば、サマリ生成部314は、ページ情報を任意の手法にてクラスタごとに分け、ページ情報に含まれる代表的なキーワードを付与することで要約情報を生成する。
【0046】
そして、図5の(5)に示すように、統計解析部315は、閲覧商品データDB305や購入商品データDB306、行動サマリデータDB307に記憶された情報に対して所定の統計解析処理を実行し、マーケティングデータを生成してマーケティングデータDB308に格納する。例えば、統計解析部315は、所定の統計解析処理として、統計処理及び可視化処理を行うことで、マーケティングデータを生成する。その後、マーケティングデータDB308に記憶されたマーケティングデータは、例えば、マーケティングレポートとして出力される。
【0047】
図3の説明に戻る。本文抽出ルールDB301は、本文抽出部312と接続される。本文抽出ルールDB301は、Web閲覧データからページ情報を抽出するためのルールを記憶する。
【0048】
図6は、実施例2における本文抽出ルールDBに記憶された情報の一例を示す図である。図6に示す例では、本文抽出ルールDB301は、「URL条件」と「タイトル条件」と「購入サイト」と「ページタイプ」と「Xpath条件」と「データ種別」とを含む本文抽出ルールのレコードを記憶する。
【0049】
ここで、「URL条件」と「タイトル条件」とは、Web閲覧データに含まれるユーザが閲覧したWebページから商品に関するWebページを抽出するルールを示す。具体的には、URL条件は、Web閲覧データに含まれるユーザにより閲覧されたWebページのうち、ページ情報として抽出するWebページのURLを示す。タイトル条件は、Web閲覧データに含まれるユーザにより閲覧されたWebページのうち、ページ情報として抽出するWebページのタイトルを示す。
【0050】
「購入サイト」は、「URL条件」と「タイトル条件」とにより抽出されるWebページが、ECサイトのWebページである場合に、ECサイトの名称を示す。また、「ページタイプ」は、「URL条件」と「タイトル条件」と「購入サイト」とにより抽出されるWebページが、商品についての情報を閲覧するためのWebページかを示す。図6に示す例では、ページタイプ「商品詳細」が商品についての情報を閲覧するためのWebページを示し、ページタイプ「購入手続き」が商品を購入するためのWebページを示す場合を例に示した。
【0051】
また、「Xpath条件」は、抽出されたWebページからページ情報として抽出する箇所を示す情報であり、「データ種別」は、「Xpath条件」により抽出される情報の種別を示す。なお、図6に示した項目の組み合わせは一例であり、これに限定されるものではなく、任意の組み合わせを用いて良い。
【0052】
図6に示す例では、本文抽出ルールDB301は、URL条件「http://foo.examlple.com/bbb.html」とタイトル条件「NULL」と購入サイト「foo」とページタイプ「商品詳細」とXpath条件「//b/td[2]/span[3]」とデータ種別「販売名表記」とを含むレコードを記憶する。すなわち、本文抽出ルールDB301は、「http://foo.examlple.com/bbb.html」に合致する「foo」というECサイトのWebページをWeb閲覧データから抽出し、抽出したWebページのうち、「//b/td[2]/span[3]」により特定される箇所から「販売名表記」を示すデータを抽出することを記憶する。なお、「NULL」は、何もデータが含まれない場合を示す。
【0053】
図3の説明に戻る。辞書データDB302は、商品情報抽出部313及びサマリ生成部314と接続される。辞書データDB302は、Webページに含まれる本文からキーワードを抽出する際や、本文を形態素に分解する際に用いられる。辞書データDB302は、既存の任意の手法にて作成される。辞書データDB302は、例えば、専門誌の記事テキストやECサイトの検索クエリー、カテゴリ情報等から収集したデータに基づき、随時更新される。辞書データDB302の更新処理は、任意の手法を用いて良く、購買行動分析サーバ300の管理者が手動にて更新しても良く、専門誌の記事テキストやECサイトの検索クエリー、カテゴリ情報等から収集したデータを受信すると、自動で更新するようにしても良い。
【0054】
Web閲覧データDB303は、Web閲覧データを記憶する。例えば、パネルユーザ端末200各々により送信されてWeb閲覧データ受信部311が受信したWeb閲覧データ各々を記憶する。Web閲覧データDB303が記憶する情報については、Web閲覧データDB201が記憶する情報と同様であり、説明を省略する。
【0055】
閲覧本文データDB304は、Web閲覧データから本文抽出部312により抽出されたページ情報を記憶する。すなわち、閲覧本文データDB304は、Web閲覧データに含まれるユーザが閲覧したWebページのうち、商品に関するWebページに含まれる情報であるページ情報を記憶する。
【0056】
図7は、実施例2における閲覧本文データDBに記憶された情報の一例を示す図である。図7に示す例では、閲覧本文データDB304は、「閲覧番号」と「ユーザID」と「閲覧日時」と「サイト名」と「ページタイプ」と「本文」と「タイトル」と「販売名表記」と「価格表記」と「商品説明文」と「検索キーワード」と「商品画像」と「ショップ名」と「個数表記」と「カテゴリ」と「ブランド」とを含むレコードを記憶する。ただし、図7に示した項目の組み合わせは一例であり、本発明はこれに限定されるものではなく、任意の項目を用いて良い。
【0057】
ここで、「ユーザID」は、ユーザを識別する情報であり、例えば、Web閲覧データに含まれる。「本文」は、Webページに含まれる本文を示す。「販売名表記」は、Webページに含まれる商品の名称を示す。「商品説明文」は、Webページに含まれる本文のうち、商品についての説明文を示す。「検索キーワード」は、Webページに対して設定されているキーワードを示す。例えば、検索キーワードは、Webページのタグに設定され、メタ情報として設定される。「商品画像」は、Webページに含まれる画像のうち、商品についての画像を示す。「ショップ名」は、Webページにおいて商品について説明している店名や、Webページにおいて商品を販売している店名を示す。「個数表記」は、ユーザが商品を購入したことを示すWebページである場合に、ユーザが購入した商品の個数を示す。「カテゴリ」は、Webページに含まれる商品のカテゴリを示す。「ブランド」は、商品に付与されたブランドを示す。
【0058】
ここで、「閲覧番号」は、図4に示した「閲覧番号」と同一の番号である。また、「サイト名」と「ページタイプ」と「本文」と「タイトル」と「販売名表記」と「価格表記」と「商品説明文」と「検索キーワード」と「商品画像」と「ショップ名」と「個数表記」と「カテゴリ」と「ブランド」とは、それぞれ、辞書データDB302に基づいて、商品情報抽出部313によりWeb閲覧データから抽出される。例えば、本文抽出ルールにおける「データ種別」として「サイト名」〜「ブランド」が設定されることで、「サイト名」〜「ブランド」は、本文抽出ルールに基づいてWeb閲覧データから抽出される。また、「販売名表記」や「価格表記」、「ショップ名」「個数表記」「カテゴリ」「ブランド」は、辞書データDB302に基づいて本文からキーワードが抽出されることで、Web閲覧データから抽出される。
【0059】
図7に示す例では、閲覧本文データDB304は、閲覧番号「00000001」とユーザID「00000001」と閲覧日時「2009-12-25 17:01:23」とサイト名「サイトA」とページタイプ「商品詳細」と本文「本商品は云々…」とタイトル「商品××」と販売名表記「商品××」と価格表記「1200円」と商品説明文「本商品は云々…」と検索キーワード「NULL」と商品画像「(画像データ)」とショップ名「ショップa」と個数表記「NULL」とカテゴリ「Tシャツ」とブランド「ブランドX」とを含むレコードを記憶する。なお、図7に示す例では、記載の便宜上、商品画像として「(画像データ)」を記憶する場合を示したが、「(画像データ)」は画像データを示す。
【0060】
すなわち、図7に示す例では、閲覧本文データDB304は、「2009-12-25 17:01:23」にユーザ「00000001」により閲覧されたWeb閲覧データのうち閲覧番号「00000001」により識別されるレコードについてのページ情報を記憶する。また、閲覧本文データDB304は、Webページのサイト名が「サイトA」であり、商品の詳細について閲覧するためのWebページであり、Webぺージには「本商品は云々…」という本文が含まれ、Webページのタイトルが「商品××」であることを記憶する。また、閲覧本文データDB304は、Webページに「商品××」という商品についての情報が含まれ、価格が「1200円」であり、「本商品は云々…」という説明文があることを記憶する。また、Webページに「(画像データ)」という画像が含まれ、Webページに関する店名が「ショップa」であり、商品のカテゴリが「Tシャツ」であり、商品のブランドが「ブランドX」であることを記憶する。
【0061】
図3の説明に戻る。閲覧商品データDB305は、商品についての情報を閲覧するためのWebページから抽出される商品情報を記憶する。具体的には、閲覧商品データDB305は、ページタイプが「商品詳細」となっている閲覧本文データDB304のレコードに含まれる商品情報を記憶する。
【0062】
図8は、実施例2における閲覧商品データDBに記憶された情報の一例を示す図である。図8に示す例では、閲覧商品データDB305は、「閲覧番号」と「サイト名」と「ショップ名」と「販売名表記」と「価格表記」と「カテゴリ」と「ブランド」と「商品画像」とを含む閲覧商品のレコードを記憶する。なお、図8に示す項目の組み合わせは一例であり、これに限定されるものではなく、任意であって良い。
【0063】
例えば、閲覧商品データDB305は、閲覧番号「00000001」とサイト名「サイトA」とショップ名「ショップa」と販売名表記「商品××」と価格表記「1200円」とカテゴリ「Tシャツ」とブランド「ブランドX」と商品画像「(画像データ)」とを含む閲覧商品のレコードを記憶する。
【0064】
図3の説明に戻る、購入商品データDB306は、商品を購入するためのWebページから抽出される商品情報を記憶する。具体的には、購入商品データDB306は、ページタイプが「購入手続き」となっている閲覧本文データDB304のレコードに含まれる商品情報を記憶する。
【0065】
図9は、実施例2における購入商品データDBに記憶された情報の一例を示す図である。図9に示す例では、購入商品データDB306は、「閲覧番号」と「サイト名」と「ショップ名」と「販売名表記」と「価格表記」と「個数表記」と「カテゴリ」と「ブランド」と「商品画像」とを含む購入商品のレコードを記憶する。なお、図9に示す項目の組み合わせは一例であり、本発明はこれに限定されるものではなく任意の項目の組み合わせを用いて良い。なお、図8と図9とを比較すると、購入商品データDB306は、購入手続きを示すWebページについての商品情報であり、閲覧本文データDB304の項目に「個数表記」が加えられている。
【0066】
例えば、購入商品データDB306は、閲覧番号「00000002」とサイト名「サイトA」とショップ名「ショップa」と販売名表記「商品××」と価格表記「1200円」と個数表記「1」とカテゴリ「Tシャツ」とブランド「ブランドX」と商品画像「(画像データ)」とを含む購入商品のレコードを記憶する。
【0067】
図3の説明に戻る。行動サマリデータDB307は、ページ情報の要約である要約情報を記憶する。図10は、実施例2における行動サマリデータDBに記憶された情報の一例を示す図である。図10に示す例では、行動サマリデータDB307は、「ユーザID」と「閲覧番号」と「クラスタ番号」と「代表キーワード」とを含むレコードを記憶する。なお、図10に示した項目の組み合わせは一例であり、本発明はこれに限定されるものではなく任意の項目の組み合わせを用いて良い。
【0068】
ここで、「クラスタ番号」について簡単に説明する。後述のサマリ生成部314は、閲覧本文データDB304に含まれるレコードを複数のグループに分類する。クラスタ番号は、個々のグループを識別する情報である。代表キーワードは、個々のグループに含まれる代表的なキーワードを示す。
【0069】
図10に示す例では、行動サマリデータDB307は、ユーザID「00000001」と閲覧番号「00000001」とクラスタ番号「00000001」と代表キーワード「Tシャツ、ブランドX」とを含む行動サマリのレコードを記憶する。すなわち、行動サマリデータDB307は、「00000001」のユーザの閲覧番号「00000001」により識別される行動サマリのレコードが、クラスタ番号「00000001」により識別されるグループに分類されていることを記憶し、クラスタ番号「00000001」により識別されるグループの代表的なキーワードが「Tシャツ、ブランドX」であることを記憶する。
【0070】
マーケティングデータDB308は、統計解析部315による処理結果となるマーケティングデータを記憶する。図11と図12とは、実施例2におけるマーケティングデータDBにより記憶されるマーケティングデータの一例を示す図である。図11は、任意の期間内において、商品のカテゴリごとに、ブランドをランキングした場合におけるマーケティングデータを示す。また、図12は、カテゴリごとに、横軸をアイテムとし、縦軸をアイテムの平均金額とした場合のマーケティングデータを示す。マーケティングデータDB308に記憶されたデータは、マーケティングレポートとして出力される。
【0071】
図3の説明に戻る。Web閲覧データ受信部311は、Web閲覧データをパネルユーザ端末200から受信することで取得する。例えば、Web閲覧データ受信部311は、Web閲覧データのアーカイブを受信すると、受信したWeb閲覧データのアーカイブを解凍し、解凍の結果得られるWeb閲覧データをWeb閲覧データDB303に格納する。
【0072】
本文抽出部312は、例えば、購買行動分析サーバ300の管理者から本文抽出ルールを受信すると、本文抽出ルールDB301に格納する。本文抽出ルールの登録や変更は、例えば、管理者が任意に実行する。例えば、本文抽出部312は、登録タイミングとなると、管理者により本文抽出ルールが登録され、登録された本文抽出ルールを本文抽出ルールDB301に格納する。
【0073】
なお、本文抽出部312は、閲覧本文データDB304に記憶されたページ情報を監視することで、ECサイトのサイト構造の変化を検出し、検出結果に基づいて本文抽出ルールを変更しても良い。
【0074】
また、本文抽出部312は、Web閲覧データ受信部311により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出する。具体的には、本文抽出部312は、新規なWeb閲覧データが閲覧本文データDB304にある場合に、閲覧本文データDB304から新規なWeb閲覧データを読み出し、本文抽出ルールに基づいて、読み出した新規なWeb閲覧データに含まれるWebページから、商品を購入するためのWebページを特定し、商品についての情報を閲覧するためのWebページを特定する。そして、本文抽出部312は、本抽出ルールに基づいて、特定したWebページに含まれる情報であるページ情報を抽出する。例えば、本文抽出部312は、Web閲覧データに含まれるHTMLソースから本文抽出ルールにより指定される箇所を抽出することで、ページ情報を抽出する。
【0075】
例えば、本文抽出部312は、任意のタイミングで抽出処理を実行する。任意のタイミングとは、例えば、5分おきや1時間おきなどの定期間隔で実行する場合、一定量の新規Web閲覧データが蓄積されたタイミングなどが該当する。なお、本文抽出部312による処理の流れの一例については、フローチャートを用いて後述する。
【0076】
商品情報抽出部313は、本文抽出部312により抽出されたページ情報から、ページ情報に含まれる商品についての情報である商品情報を抽出する。具体的には、商品情報抽出部313は、商品を購入するためのWebページから商品情報として第1の商品情報を抽出し、商品についての情報を閲覧するためのWebページに含まれる商品情報である第2の商品情報を抽出する。
【0077】
例えば、商品情報抽出部313は、新規なページ情報が閲覧本文データDB304にある場合に、閲覧本文データDB304からレコードを1つ取得し、取得したレコードのページタイプが「商品詳細」であれば、閲覧商品データDB305に商品情報を格納する。また、商品情報抽出部313は、取得したレコードのページタイプが「購入手続き」であれば、購入商品データDB306に商品情報を格納する。より詳細な一例をあげて説明すると、商品情報抽出部313は、閲覧本文データDB304から取得したレコードに含まれる項目のうち、商品情報に該当する項目のデータを、閲覧商品データDB305に又は購入商品データDB306に格納する。商品情報抽出部313による処理の流れの一例については、フローチャートを用いて後述する。
【0078】
なお、商品情報抽出部313は、辞書データDB302に基づいてレコードに含まれるページ情報の本文からキーワードを抽出し、抽出したキーワードから商品情報に該当するキーワードを抽出して閲覧商品データDB305又は購入商品データDB306に格納しても良い。
【0079】
サマリ生成部314は、本文抽出部312により抽出されたページ情報から、ページ情報に含まれる情報の要約である要約情報を生成する。具体的には、サマリ生成部314は、閲覧本文データDB304からページ情報のレコードを取得し、取得したページ情報のレコードに対してクラスタ処理を行う。つまり、ページ情報のレコード間の類似度に基づいて、処理対象となるユーザについての複数のページ情報のレコードをグループに分類する。そして、サマリ生成部314は、キーワード抽出処理を行う。つまり、サマリ生成部314は、クラスタに含まれるレコードを代表するキーワードをクラスタごとに抽出する。そして、サマリ生成部314は、サマリ生成処理を行う。つまり、サマリ生成部314は、クラスタごとのキーワードと、クラスタ番号とを対応付けてサマリとして生成する。そして、サマリ生成部314は、生成したサマリを行動サマリデータDB307に格納する。サマリ生成部314による処理の一例については、フローチャートを用いて後述する。
【0080】
統計解析部315は、商品情報抽出部313により抽出された商品情報とサマリ生成部314により生成された要約情報とに対して、所定の統計解析処理を実行する。具体的には、統計解析部315は、閲覧商品データDB305に記憶された商品情報を取得し、購入商品データDB306に記憶された商品情報を取得し、行動サマリデータDB307に記憶された要約情報を取得する。そして、統計解析部315は、取得したデータに対して統計解析処理を実行し、処理結果となるマーケティングデータをマーケティングデータDB308に格納する。統計解析部315が用いる所定の統計解析処理は、任意の統計解析処理で良い。統計解析部315による処理の一例については、フローチャートを用いて後述する。
【0081】
[パネルユーザ端末による処理]
図13を用いて、実施例2におけるパネルユーザ端末200による処理の流れの一例を示す。図13は、実施例2におけるパネルユーザ端末による処理の流れの一例を示すフローチャートである。
【0082】
図13に示すように、パネルユーザ端末200では、Web閲覧データ送信部211は、新規なWeb閲覧データがあると(ステップS201肯定)、新規なWeb閲覧データのアーカイブを作成する(ステップS202)。そして、Web閲覧データ送信部211は、作成したWeb閲覧データのアーカイブを購買行動分析サーバ300に送信する(ステップS203)。
【0083】
なお、図13に示す例では、Web閲覧データ送信部211が、アーカイブを作成して送信する場合を示したが、本発明はこれに限定されるものではない。例えば、Web閲覧データ送信部211は、アーカイブを作成することなく、Web閲覧データそのものを送信しても良い。
【0084】
[購買行動分析サーバによる処理]
購買行動分析サーバ300による処理の流れの一例を示す。以下では、Web閲覧データ受信部311による処理の流れの一例と、本文抽出部312による処理の流れの一例と、商品情報抽出部313による処理の流れの一例と、サマリ生成部314による処理の流れの一例と、統計解析部315による処理の流れの一例とについて、順に説明する。
【0085】
[Web閲覧データ受信部による処理]
図14を用いて、実施例2におけるWeb閲覧データ受信部311による処理の流れの一例を示す。図14は、実施例2におけるWeb閲覧データ受信部による処理の流れの一例を示すフローチャートである。
【0086】
図14に示すように、Web閲覧データ受信部311は、Web閲覧データのアーカイブを受信すると(ステップS301肯定)、受信したWeb閲覧データのアーカイブを解凍する(ステップS302)。そして、Web閲覧データ受信部311は、解凍の結果得られるWeb閲覧データをWeb閲覧データDB303に格納する(ステップS303)。
【0087】
なお、図14に示す例では、Web閲覧データ受信部311は、アーカイブを解凍した上でWeb閲覧データDB303に格納する場合を示したが、本発明はこれに限定されるものではない。例えば、Web閲覧データ受信部311は、アーカイブを解凍することなく、そのまま格納しても良い。
【0088】
また、図14に示す例では、パネルユーザ端末200がWeb閲覧データのアーカイブを送信する場合を示した。ただし、本発明はこれに限定されるものではなく、パネルユーザ端末200がWeb閲覧データそのものを送信する場合には、Web閲覧データ受信部311は、解凍処理を実行することなく、受信したWeb閲覧データを格納する。
【0089】
[本文抽出部による登録処理]
図15を用いて、実施理2における本文抽出部312による登録処理の流れの一例を示す。図15は、実施例2における本文抽出部による登録処理の流れの一例を示すフローチャートである。
【0090】
図15に示すように、本文抽出部312は、登録タイミングとなると(ステップS401肯定)、管理者により本文抽出ルールが登録され(ステップS402)、登録された本文抽出ルールを本文抽出ルールDB301に格納する(ステップS403)。例えば、本文抽出部312は、本文抽出ルールを管理者から受信することで本文抽出ルールが登録され、受信した本文抽出ルールを本文抽出ルールDB301に格納する。
【0091】
[本部抽出部による抽出処理]
図16を用いて、実施例2における本文抽出部312による抽出処理の流れの一例を示す。図16は、実施例2における本文抽出部による抽出処理の流れの一例を示すフローチャートである。
【0092】
図16に示すように、本文抽出部312は、新規なWeb閲覧データがWeb閲覧データDB303にあるかを判定する(ステップS501)。ここで、本文抽出部312は、あると判定すると(ステップS501肯定)、Web閲覧データDB303からページ情報のレコードを1つ取得する(ステップS502)。そして、本文抽出部312は、本文抽出ルールDB301に本文抽出ルールが登録済みであるかを判定し(ステップS503)、あると判定すると(ステップS503肯定)、Web閲覧データに含まれるHTMLソースから本文抽出ルールにより指定される箇所を抽出する(ステップS504)。つまり、本文抽出部312は、Web閲覧データ受信部311により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、ページ情報を抽出する。そして、本文抽出部312は、閲覧本文データDBにページ情報を格納する(ステップS505)。
【0093】
そして、本文抽出部312は、ステップS501に戻り、新規なWeb閲覧データがWeb閲覧データDB303にないと判定するまで、ステップS501〜S505までの処理を繰り返す。また、本文抽出部312は、上述したステップS503において、本文抽出ルールがないと判定すると(ステップS503否定)、処理を終了する。また、本文抽出部312は、ステップS501において、新規なWeb閲覧データがWeb閲覧データDB303にないと判定すると(ステップS501否定)、処理を終了する。
【0094】
なお、上記の処理手順は、上記の順番に限定されるものではなく、処理内容を矛盾させない範囲で適宜変更しても良い。例えば、まず、図16におけるステップS501とステップS503とを実行し、その際、新規なWeb閲覧データがあると判定し、かつ、本文抽出ルールがあると判定した場合に、図16におけるステップS502、ステップS504及びステップS505を実行するようにしても良い。
【0095】
[商品情報抽出部による処理]
図17を用いて、実施例2における商品情報抽出部313による処理の流れの一例を示す。図17は、実施例2における商品情報抽出部による処理の流れの一例を示すフローチャートである。
【0096】
図17に示すように、商品情報抽出部313は、新規なページ情報が閲覧本文データDB304にあると(ステップS601肯定)、閲覧本文データDB304からレコードを1つ取得する(ステップS602)。例えば、商品情報抽出部313は、閲覧本文データDB304に処理済みでない新規レコードがあるか否かを判定したり、ストアドプロシジャー的に、新規のレコードが格納されるごとに、レコードを取得する。
【0097】
そして、商品情報抽出部313は、辞書データDB302に基づいてレコードに含まれるページ情報の本文からキーワードを抽出する(ステップS603)。つまり、商品情報抽出部313は、専門誌の記事テキストやECサイトの検索クエリー、カテゴリ情報等から収集されたデータに基づいて時更新される辞書データDB302に記憶された語句とマッチするキーワードを抽出する。
【0098】
そして、商品情報抽出部313は、ページタイプが「商品詳細」か「購入手続き」かを判別し(ステップS604)、ページタイプ「購入手続き」である場合には(ステップS604購入手続き)、商品情報を購入商品データDB306に格納する(ステップS605)。一方、商品情報抽出部313は、ページタイプ「商品詳細」である場合には(ステップS604商品詳細)、商品情報を閲覧商品データDB305に格納する(ステップS606)。
【0099】
例えば、商品情報抽出部313は、閲覧本文データDB304から取得したレコードに含まれる項目のうち、商品情報に該当する項目のデータを、閲覧商品データDB305に又は購入商品データDB306に格納する。より詳細な一例をあげて説明すると、商品情報抽出部313は、レコードの各項目のうち、「閲覧番号」と「サイト名」と「ショップ名」と「販売名表記」と「価格表記」と「個数表記」と「カテゴリ」と「ブランド」と「商品画像」とを購入商品データDB306に格納する。また、同様に、商品情報抽出部313は、レコードの各項目のうち、「閲覧番号」と「サイト名」と「ショップ名」と「販売名表記」と「価格表記」と「カテゴリ」と「ブランド」と「商品画像」とを閲覧商品データDB305に格納する。なお、ここで、レコードに含まれる各項目には、必ずしもデータが含まれるとは限らない。この場合、商品情報抽出部313は、データが含まれていない項目については何らデータを入力することなく、「NULL」とする。
【0100】
そして、商品情報抽出部313は、ステップS601に戻り、新規なページ情報がないと判定するまで、上述したステップS601〜S606までの処理を繰り返す。一方、商品情報抽出部313は、ステップS601において、新規なページ情報がないと判定すると(ステップS601否定)、処理を終了する。なお、上記の処理手順は、上記の順番に限定されるものではなく、処理内容を矛盾させない範囲で適宜変更しても良い。例えば、上記のステップS603を省略しても良い。
【0101】
[サマリ生成部による処理]
図18を用いて、実施例2におけるサマリ生成部314による処理の流れの一例を示す。図18は、実施例2におけるサマリ生成部による処理の流れの一例を示すフローチャートである。
【0102】
図18に示すように、サマリ生成部314は、処理対象期間、処理対象パネルユーザIDの指定が管理者よりあると(ステップS701肯定)、指定された期間、パネルユーザIDと一致又は相当するレコードを閲覧本文データDB304から取得する(ステップS702)。例えば、処理対象期間「2009-12-25 00:00:00〜2009-12-26 00:00:00」と処理対象パネルユーザID「00000001」とが指定されると、サマリ生成部314は、閲覧本文データDB304から、閲覧日時が「2009-12-25 00:00:00〜2009-12-26 00:00:00」に含まれ、パネルユーザID「00000001」を含むレコードを取得する。
【0103】
そして、サマリ生成部314は、辞書データDBに基づいて、各閲覧ページの本文を形態素に分解する(ステップS703)。つまり、サマリ生成部314は、辞書データDB302に基づいて、取得したレコードに含まれるページの本文を形態素に分解する。
【0104】
そして、サマリ生成部314は、形態素に分解したキーワードを利用して閲覧ページをクラスタリングする(ステップS704)。つまり、サマリ生成部314は、レコードごとに得られるキーワードを用いてレコード間の類似度を算出し、算出したレコード間の類似度に基づいて処理対象となるユーザについての複数のレコードをグループに分類する。
【0105】
そして、サマリ生成部314は、行動サマリデータDB307に閲覧番号とクラスタ番号とを格納する(ステップS705)。つまり、サマリ生成部314は、任意のクラスタ番号を発行し、ステップS704にて分類したレコードのグループ各々に付与する。そして、サマリ生成部314は、クラスタ番号と、クラスタ番号が付与されたグループに含まれるレコードの閲覧番号とを対応付けて、行動サマリデータDB307に格納する。例えば、閲覧番号「00000001」を含むレコードと「00000002」を含むレコードとが同一のグループに分類され、クラスタ番号「00000001」が付与された場合を用いて説明する。この場合、サマリ生成部314は、閲覧番号「00000001」とクラスタ番号「00000001」との対応付けを行動サマリデータDB307に格納し、閲覧番号「00000002」とクラスタ番号「00000001」との対応付けを行動サマリデータDB307に格納する。また、処理対象となったパネルユーザIDも格納する。この段階においては、図10に示す行動サマリデータDB307の項目のうち、代表キーワードは空白である。
【0106】
そして、サマリ生成部314は、対象クラスタ番号を「00000001」とし(ステップS706)、対象クラスタ番号が付与された閲覧番号のページ情報を取得する(ステップS707)。そして、サマリ生成部314は、辞書データDB302に基づいて、各ページ情報の本文を形態素に分解し(ステップS708)、形態素に分解したキーワードの中から代表キーワードを抽出する(ステップS709)。例えば、サマリ生成部314は、クラスタ番号「00000001」のページ情報から、代表キーワード「Tシャツ、ブランドX」を抽出する。
【0107】
例えば、サマリ生成部314は、キーワードを抽出する手法として、任意の手法を用いて良い。例えば、TFIDF(term frequency inverse document frequency)やc-valueなどを用いて良い。
【0108】
そして、サマリ生成部314は、行動サマリデータDB307に代表キーワードを格納する(ステップS710)。つまり、クラスタ番号「00000001」を含むレコードに、代表キーワード「Tシャツ、ブランドX」を格納する。
【0109】
そして、サマリ生成部314は、対象クラスタ番号をインクリメントする(ステップS711)。例えば、サマリ生成部314は、対象クラスタ番号を「00000002」とする。そして、サマリ生成部314は、対象クラスタ番号のクラスタがあるかを判別する(ステップS712)。例えば、上述したステップS704において、レコードを4つのグループに分類し、クラスタ番号「00000001」〜「00000004」までが付与された場合には、サマリ生成部314は、あると判定し(ステップS712肯定)、上述したステップS707に戻り、処理を繰り返す。一方、サマリ生成部314は、クラスタ番号「00000001」〜「00000004」までが付与されており、インクリメント後の対象クラスタ番号が「00000005」である場合には、ないと判定し(ステップS712否定)、処理を終了する。
【0110】
なお、上記の処理手順は、上記の順番に限定されるものではなく、処理内容を矛盾させない範囲で適宜変更しても良い。例えば、図18に示す例では、レコード各々からキーワードを抽出しキーワードの類似度に基づいてクラスタリングを行う場合について示したが、本発明はこれに限定されるものではなく、任意の手法を用いてクラスタリングして良い。また、図18に示す例では、ステップS703にて形態素に分解し、ステップS708においても、形態素に分解する場合を示したが、本発明はこれに限定されるものではない。例えば、ステップS708において、ステップS703における処理結果を用いることで、形態素に分解する処理を実行しなくて良い。
【0111】
[統計解析部による処理]
図19を用いて、実施例2における統計解析部315による処理の流れの一例を示す。図19は、実施例2における統計解析部による処理の流れの一例を示すフローチャートである。
【0112】
図19に示すように、統計解析部315は、解析対象期間や解析対象ユーザ条件、解析手法の指定が管理者よりあると(ステップS801肯定)、閲覧商品データDB305と、購入商品データDB306と、行動サマリデータDB307とから、期間及び条件の一致するレコードを取得する(ステップS802)。
【0113】
そして、統計解析部315は、統計解析を実行し(ステップS803)、統計解析結果を出力する(ステップS804)。つまり、統計解析部315は、商品情報抽出部313により抽出された商品情報とサマリ生成部314により生成された要約情報とに対して、所定の統計解析処理を実行し、処理結果をマーケティングデータDB308に格納する。
【0114】
[実施例2の効果]
上述したように、実施例2によれば、購買行動分析サーバ300は、パネルユーザ端末200にてユーザが閲覧したWebページを含むWeb閲覧データを取得する。そして、購買行動分析サーバ300は、取得したWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出する。そして、購買行動分析サーバ300は、抽出したページ情報から、ページ情報に含まれる商品についての情報である商品情報を抽出し、ページ情報から、ページ情報に含まれる情報の要約である要約情報を生成する。そして、購買行動分析サーバ300は、商品情報と要約情報とに対して、所定の統計解析処理を実行する。この結果、実施例1に係る購買行動分析装置100によれば、マーケティング分析を適切に実行可能である。
【0115】
また、実施例2によれば、購買行動分析サーバ300は、商品に関するWebページとして、商品を購入するためのWebページを特定し、商品についての情報を閲覧するためのWebページを特定し、特定したWebページに含まれる情報であるページ情報を抽出する。そして、購買行動分析サーバ300は、商品を購入するためのWebページに含まれる商品情報である第1の商品情報を抽出し、商品についての情報を閲覧するためのWebページに含まれる商品情報である第2の商品情報を抽出する。そして、購買行動分析サーバ300は、要約情報と第1の商品情報と第2の商品情報とに対して所定の解析処理を実行する。この結果、ユーザが閲覧した商品についての情報と、ユーザが購入した商品についての情報とを併せて用いて、マーケティング分析が可能である。
【0116】
すなわち、購買行動分析サーバ300は、パネルユーザ端末200からWeb閲覧データを取得して用いることで、購買手続きページのような、事後クロールでは入手することが不可能なページからも情報を取得してマーケティング分析ができ、高精度にマーケティング分析が可能である。
【0117】
図20は、実施例2の効果を示すための図である。図20に示すように、マーケティング分析を行う手法は複数あるが、そのいずれも、購買の前後の行動を分析できなかったり、横断的なデータ収集ができなかったり、幅広い対象商品を対象とできなかったり、購買行動を起こした時点とデータが収集される時点とのタイムラグが発生したり、精度に問題があったりする。なお、図20の「提案方式」は、実施例2の購買行動分析サーバ300による処理方式を示す。
【0118】
例えば、図20の「アンケート」に示すように、アンケートを用いてデータを収集する手法では、購買行動を起こした時点とデータが収集される時点とのタイムラグが大きく、人手での記入のため、記入漏れや記憶違いが多く結果信頼が低い。また、図20の「RFIDによる接触調査」に示すように、RFIDのタグを商品に付けておき、消費者が接触した商品のタグについての情報を用いる手法では、対象商品に対する商品接触のみ用いられる結果、購買の前後の行動を分析できない。また、消費者が接触した商品のタグについての情報を用いる手法では、対象商品にRFIDを貼り付けなければならない結果、幅広い対象商品を対象とできない。また、図20の「店舗内導線分析」に示すように、店舗内にある監視カメラから消費者の導線や視線を分析する手法では、店舗内に閉じてしまい、店舗間の共有は困難である結果、横断的なデータ収集ができない。また、店舗内にある監視カメラから消費者の導線や視線を分析する手法では、対象商品が店舗内にて取り扱われる商品に限られ、導線の行動解釈に時間のかかる場合がある。また、図20の「ECサイトのWebログ解析」に示すように、特定のECサイトにおいて得られるWebログを解析する手法では、ECサイト内に閉じてしまい、サイト間の共有が困難である結果、横断的なデータ収集ができない。また、特定のECサイトにおいて得られるWebログを解析する手法では、対象商品もECサイトにて取り扱われる商品に限られる。また、図20の「POSデータ等」に示すように、POSデータを用いてマーケティング分析する手法では、購買についてのデータを利用できるに留まり、購買の前後の行動を分析できず、同一の系列となる小売店内でしかデータを共有できず、店舗間の共有も困難である結果、横断的なデータ収集が困難である。また、POSデータを用いてマーケティング分析する手法では、JANコードが付与された登録商品に対象商品が限られる。
【0119】
これに対して、図20に示すように、実施例2における購買行動分析サーバ300による処理方式では、パネルユーザ端末200によるWeb閲覧データを用いる結果、閲覧時におけるデータも購入時におけるデータも用いることが可能であり、購買の前後の行動を分析可能である。また、購買行動分析サーバ300による処理方式では、パネルユーザ端末200がWeb閲覧データを用いて分析することで、特定の店舗に限定されることなく横断的にデータ収集が可能である。この結果、店舗をまたいだ商品や価格比較行動などの分析が可能である。また、購買行動分析サーバ300による処理方式では、パネルユーザ端末200によるWeb閲覧データを用いることで、パネルユーザがアクセスしたすべての商品についてのデータを用いることが可能である。また、購買行動分析サーバ300による処理方式では、パネルユーザ端末200からほぼリアルタイムにWeb閲覧データを取得して用いることができ、パネルユーザが購買行動を起こす時点とデータが収集される時点との間のタイムラグを抑えることが可能である。また、購買行動分析サーバ300による処理方式では、精度についても、テキストマイニングの精度を向上することで向上することが可能である。
【実施例3】
【0120】
実施例3では、パネルユーザ端末200から送信されるWeb閲覧データから個人情報を削除する場合について示す。以下では、パネルユーザ端末200が、Web閲覧データから個人情報を削除した上で購買行動分析サーバ300に送信する場合を示すが、本発明はこれに限定されるものではなく、購買行動分析サーバ300が、受信したWeb閲覧データから個人情報を削除しても良い。また、パネルユーザ端末200と購買行動分析サーバ300との両方が、Web閲覧データから個人情報を削除しても良い。
【0121】
図21は、実施例3に係る購買行動分析システムの構成の一例を示すブロック図である。図21に示すように、実施例3では、パネルユーザ端末200は、個人情報データDB501と、個人情報除去処理部502とを更に有する。なお、図21においては、図3と同様の処理部やデータベースについては、図3と同一の符号を付与した。
【0122】
個人情報データDB501は、パネルユーザの個人情報を記憶する。図22は、実施例3における個人情報データDBに記憶された情報の一例を示す図である。図22に示す例では、個人情報データDB501は、「氏名」と「電話番号」と「住所」と「カード番号」などを記憶する。ただし、本発明はこれに限定されるものではなく、個人情報データDB501は、任意の項目についてデータを記憶して良い。
【0123】
例えば、個人情報データDB501は、氏名「電信 太郎」と電話番号「012-345-6789」と住所「東京都武蔵野市×××」とカード番号「0123 4567 8901 2345」とを記憶する。
【0124】
個人情報除去処理部502は、Web閲覧データDB201からWeb閲覧データを取得すると、取得したWeb閲覧データから個人情報データDB501に記憶された個人情報と一致又は相当するデータを削除する。また、個人情報除去処理部502は、Web閲覧データから個人情報を削除する際、任意の文字列にて置き換えても良い。
【0125】
ここで、図23を用いて、実施例3におけるパネルユーザ端末200による処理について示す。図23は、実施例3におけるパネルユーザ端末による処理について示すフローチャートである。
【0126】
図23に示すように、パネルユーザ端末200では、個人情報除去処理部502は、新規なWeb閲覧データがあると(ステップS901肯定)、新規なWeb閲覧データ中に個人情報データと一致するテキストがあるかを判定する(ステップS902)。ここで、個人情報除去処理部502は、あると判定すると(ステップS902肯定)、個人情報データと一致するテキストを任意の文字で置き換える(ステップS903)。つまり、個人情報除去処理部502は、Web閲覧データから個人情報データを削除する。
【0127】
そして、Web閲覧データ送信部211は、個人情報が削除された後のWeb閲覧データのアーカイブを作成し(ステップS904)、作成したWeb閲覧データのアーカイブを購買行動分析サーバ300に送信する(ステップS905)。
【0128】
なお、図23に示す例では、Web閲覧データ送信部211が、アーカイブを作成して送信する場合を示したが、本発明はこれに限定されるものではない。例えば、Web閲覧データ送信部211は、アーカイブを作成することなく、Web閲覧データそのものを送信しても良い。
【0129】
また、上述した説明では、個人情報データDB501と一致または相当する場合に、Web閲覧データから削除する場合を用いて説明したが、これに限定されるものではなく、任意の手法にて個人情報を検出して削除して良い。
【0130】
[実施例3の効果]
上述したように、実施例3によれば、個人情報が削除されたWeb閲覧データを用いるので、個人情報を除去した上で、購買行動分析サーバ300においてデータが保持される。この結果、個人情報に配慮したセキュアなサービス提供が可能である。
【実施例4】
【0131】
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、その他の実施例にて実施されても良い。そこで、以下では、その他の実施例を示す。
【0132】
[システム構成]
また、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上述文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については(図1〜図23)、特記する場合を除いて任意に変更することができる。
【0133】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
【0134】
例えば、図24を用いて、購買行動分析システムの構成のバリエーションの一例を示す。図24は、購買行動分析システムの構成のバリエーションの一例を示す図である。図24に示すように、統計解析部601とマーケティングデータDB602とを購買行動分析サーバ300から分離して別の外部装置600とし、ネットワーク経由で接続するようにしても良い。統計解析部601とマーケティングデータDB602とは、それぞれ、図3における統計解析部315とマーケティングデータDB308とに対応する。この場合、外部装置600は、購買行動分析サーバ300の閲覧商品データDB603や購入商品データDB604、行動サマリデータDB605にアクセスしてデータを取得し、取得したデータに対して統計解析処理を実行することでマーケティングデータを作成する。また、図24に示す例において、外部装置が複数ある場合に、外部装置ごとに、アクセス可能なデータの種類を制限しても良い。この結果、購買行動分析システムを運用する会社から外部のマーケターに対して、分析装置や分析元データへのアクセスフィーを販売するビジネスを実現可能である。
【0135】
[プログラム]
図25は、購買行動分析プログラムによる情報処理がコンピュータを用いて具体的に実現されることを示す図である。図25に例示するように、コンピュータ3000は、例えば、メモリ3010と、CPU(Central Processing Unit)3020と、ハードディスクドライブインタフェース3030と、ディスクドライブインタフェース3040と、シリアルポートインタフェース3050と、ビデオアダプタ3060と、ネットワークインタフェース3070とを有する。コンピュータ3000の各部はバス3100によって接続される。
【0136】
なお、図25に示すコンピュータの構成は一例であり、コンピュータの構成はこれに限定されるものではない。例えば、図25に示す例では、コンピュータ3000は、ハードディスクドライブ3080を有し、ハードディスクドライブ3080がプログラムデータ3084などを記憶する場合を示したが、本発明はこれに限定されるものではない。例えば、コンピュータ3000は、ハードディスクドライブ3080を有さなくても良い。この場合、コンピュータ3000は、例えば、メモリ310にプログラムデータ3084などを記憶しても良く、任意の記憶領域にプログラムデータ3084などを記憶して良い。また、コンピュータ3000は、任意の情報処理装置であって良く、例えば、携帯電話、PHS(Personal Handyphone System)端末、移動体通信端末またはPDA(Personal Digital Assistant)などの情報処理装置であっても良い。
【0137】
メモリ3010は、図25に例示するように、ROM3011及びRAM3012を含む。ROM3011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース3030は、図25に例示するように、ハードディスクドライブ3080に接続される。ディスクドライブインタフェース3040は、図25に例示するように、ディスクドライブ3090に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ3090に挿入される。シリアルポートインタフェース3050は、図25に例示するように、例えばマウス3051、キーボード3052に接続される。ビデオアダプタ3060は、図25に例示するように、例えばディスプレイ3061に接続される。
【0138】
ここで、図25に例示するように、ハードディスクドライブ3080は、例えば、OS3081、アプリケーションプログラム3082、プログラムモジュール3083、プログラムデータ3084を記憶する。すなわち、開示の技術に係る更新プログラムは、コンピュータによって実行される指令が記述されたプログラムモジュール3083として、例えばハードディスクドライブ3080に記憶される。具体的には、上記実施例で説明したWeb閲覧データ送信部211やWeb閲覧データ受信部311〜統計解析部315と同様の情報処理を実行する手順各々が記述されたプログラムモジュールが、ハードディスクドライブ3080に記憶される。
【0139】
また、上記実施例で説明したWeb閲覧データDB201や本文抽出ルールDB301〜マーケティングデータDB308に記憶されるデータのように、購買行動分析プログラムによる情報処理に用いられるデータは、プログラムデータ3084として、例えばハードディスクドライブ3080に記憶される。そして、CPU3020が、ハードディスクドライブ3080に記憶されたプログラムモジュール3083やプログラムデータ3084を必要に応じてRAM3012に読み出し、各種の手順を実行する。
【0140】
なお、購買行動分析プログラムに係るプログラムモジュール3083やプログラムデータ3084は、ハードディスクドライブ3080に記憶される場合に限られない。例えば、プログラムモジュール3083やプログラムデータ3084は、着脱可能な記憶媒体に記憶されても良い。この場合、CPU3020は、ディスクドライブなどの着脱可能な記憶媒体を介してデータを読み出す。また、同様に、更新プログラムに係るプログラムモジュール3083やプログラムデータ3084は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されても良い。この場合、CPU3020は、ネットワークインタフェースを介して他のコンピュータにアクセスすることで各種データを読み出す。
【0141】
[その他]
なお、本実施例で説明した購買行動分析プログラムは、インターネットなどのネットワークを介して配布することができる。また、購買行動分析プログラムは、ハードディスク、フレキシブルディスク(FD)、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することもできる。
【符号の説明】
【0142】
100 購買行動分析装置
101 取得部
102 ページ情報抽出部
103 商品情報抽出部
104 要約生成部
105 統計解析部
200 パネルユーザ端末
201 Web閲覧データDB
211 Web閲覧データ送信部
300 購買行動分析サーバ
301 本文抽出ルールDB
302 辞書データDB
303 Web閲覧データDB
304 閲覧本文データDB
305 閲覧商品データDB
306 購入商品データDB
307 行動サマリデータDB
308 マーケティングデータDB
311 Web閲覧データ受信部
312 本文抽出部
313 商品情報抽出部
314 サマリ生成部
315 統計解析部
401 ECサイト
402 インターネット
501 個人情報データDB
502 個人情報除去処理部
600 外部装置

【特許請求の範囲】
【請求項1】
ユーザ端末にてユーザが閲覧したWebページを含むWeb閲覧データを取得する取得部と、
前記取得部により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出部と、
前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出部と、
前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成部と、
前記商品情報抽出部により抽出された前記商品情報と前記要約生成部により生成された要約情報とに対して、所定の統計解析処理を実行する統計解析部と
を備えたことを特徴とする購買行動分析装置。
【請求項2】
前記ページ情報抽出部は、前記商品に関するWebページとして、商品を購入するためのWebページを特定し、商品についての情報を閲覧するためのWebページを特定し、特定したWebページに含まれる情報であるページ情報を抽出し、
前記商品情報抽出部は、前記商品を購入するためのWebページに含まれる前記商品情報である第1の前記商品情報を抽出し、前記商品についての情報を閲覧するためのWebページに含まれる前記商品情報である第2の前記商品情報を抽出し、
前記統計解析部は、前記要約情報と前記第1の商品情報と前記第2の商品情報とに対して所定の解析処理を実行することを特徴とする請求項1に記載の購買行動分析装置。
【請求項3】
前記取得部は、前記ユーザ端末にて個人情報が削除された後のWeb閲覧データを取得することを特徴とする請求項1又は2に記載の購買行動分析装置。
【請求項4】
コンピュータが、
ユーザ端末にてユーザが閲覧したWebページを含むWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出工程と、
前記ページ情報抽出工程により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出工程と、
前記ページ情報抽出工程により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成工程と、
前記商品情報抽出工程により抽出された前記商品情報と前記要約生成工程により生成された要約情報とに対して、所定の統計解析処理を実行する統計解析工程と
を含んだことを特徴とする購買行動分析方法。
【請求項5】
コンピュータに、
ユーザ端末にてユーザが閲覧したWebページを含むWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出手順と、
前記ページ情報抽出手順により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出手順と、
前記ページ情報抽出手順により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成手順と、
前記商品情報抽出手順により抽出された前記商品情報と前記要約生成手順により生成された要約情報とに対して、所定の統計解析処理を実行する統計解析手順と
を実行させることを特徴とする購買行動分析プログラム。
【請求項6】
Webページを閲覧するための閲覧部と、
前記閲覧部にてユーザにより閲覧されたWebページを含むWeb閲覧データを送信する送信部と
を有するユーザ端末と、
前記ユーザ端末の前記送信部により送信された前記Web閲覧データを取得する取得部と、
前記取得部により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出部と、
前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出部と、
前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成部と、
前記商品情報抽出部により抽出された前記商品情報と前記要約生成部により生成された要約情報とに対して、所定の統計解析処理を実行する統計解析部と
を有するサーバと
を備えたことを特徴とする購買行動分析システム。
【請求項7】
ユーザ端末としてのコンピュータが、
Webページを閲覧するための閲覧工程と、
前記閲覧工程にてユーザにより閲覧されたWebページを含むWeb閲覧データを送信する送信工程とを含み、
前記送信工程により送信された前記Web閲覧データを取得するコンピュータが、
前記ユーザ端末の前記送信工程により送信された前記Web閲覧データを取得する取得工程と、
前記取得工程により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出工程と、
前記ページ情報抽出工程により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出工程と、
前記ページ情報抽出工程により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成工程と、
前記商品情報抽出工程により抽出された前記商品情報と前記要約生成工程により生成された要約情報とに対して、所定の統計解析処理を実行する統計解析工程と
を含むことを特徴とする制御方法。
【請求項8】
Webページを閲覧するための閲覧部と、
前記閲覧部にてユーザにより閲覧されたWebページを含むWeb閲覧データを送信する送信部と
を有するユーザ端末と、
前記ユーザ端末の前記送信部により送信された前記Web閲覧データを取得する取得部と、
前記取得部により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出部と、
前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出部と、
前記ページ情報抽出部により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成部と、
を有するサーバと、
前記商品情報抽出部により抽出された前記商品情報と前記要約生成部により生成された要約情報とを前記サーバから取得し、所定の統計解析処理を実行する統計解析部を有する端末と、
を備えたことを特徴とする購買行動分析システム。
【請求項9】
ユーザ端末としてのコンピュータが、
Webページを閲覧するための閲覧工程と、
前記閲覧工程にてユーザにより閲覧されたWebページを含むWeb閲覧データを送信する送信工程とを含み、
前記送信工程により送信された前記Web閲覧データを取得するサーバが、
前記ユーザ端末の前記送信工程により送信された前記Web閲覧データを取得する取得工程と、
前記取得工程により取得されたWeb閲覧データに対して所定の抽出条件に従って抽出処理を実行することで、前記ユーザが閲覧したWebページのうち商品に関するWebページに含まれる情報であるページ情報を抽出するページ情報抽出工程と、
前記ページ情報抽出工程により抽出されたページ情報から、当該ページ情報に含まれる前記商品についての情報である商品情報を抽出する商品情報抽出工程と、
前記ページ情報抽出工程により抽出されたページ情報から、当該ページ情報に含まれる情報の要約である要約情報を生成する要約生成工程とを含み、
前記商品情報抽出工程により抽出された前記商品情報と前記要約生成工程により生成された要約情報とを前記サーバから取得するコンピュータが、
前記商品情報抽出工程により抽出された前記商品情報と前記要約生成工程により生成された要約情報とに対して、所定の統計解析処理を実行する統計解析工程を含む
ことを特徴とする制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate


【公開番号】特開2012−89014(P2012−89014A)
【公開日】平成24年5月10日(2012.5.10)
【国際特許分類】
【出願番号】特願2010−236626(P2010−236626)
【出願日】平成22年10月21日(2010.10.21)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【出願人】(504126835)エヌ・ティ・ティ レゾナント株式会社 (60)