説明

アクセス解析システム及びアクセス解析方法

【課題】コンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたコンバージョンに至ったアクセス記録を含む記録データとに基づいて、ユーザ端末のアクセス動向を解析するアクセス解析システム及びアクセス解析方法を提供する。
【解決手段】アクセス解析システム10は、ウェブサイトのページ構造を記録するウェブ構造DB14と、ページ構造をページカテゴリに分類して記録するページカテゴリDB18と、アクセスログDB11の記録に基づいて各ユーザ端末が各ページを渡り歩いた経路を定義する経路定義DB17と、コンバージョンに至る順に顧客のクラスを定義する顧客クラスDB16と、顧客クラス判別処理によって顧客クラスの特性を分析した結果を記録する特性パターンDB15と、表示端末19に接続された制御部20と、を用いてアクセス解析を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システム及びアクセス解析方法に関する。
【背景技術】
【0002】
近年のインターネットの急速な普及に伴い、インターネットを通じて様々な商品や各種サービスの販売を行うe−コマース(エレクトロニック・コマース:電子商取引)のウェブサイトが増えるに従い、ウェブサイトへの訪問者である消費者(以下、顧客という)がこれらの商品やサービスを購入する機会も増えている。
【0003】
このような状況下において、e−コマースを運営する企業側もインターネット上での顧客行動に着目することで、伝統的なマーケティングとは異なるe−マーケティングがその重要性を増し、例えば、バーチャル・モール・サイトでは商品購入、コミュニティサイトでは会員登録などのビジネスにとって重要性が増加する顧客のアクション(以下、コンバージョンと呼ぶ)が重要となる。特に、e−マーケティングでは、コンバージョン率を向上させることを目的の一つとし、顧客の好みに合わせた商品・情報の提供をするために顧客のアクションの収集及び分析を行っている。
【0004】
一般的に、繰り返し購買を主流とするe−コマースにおいては、POSデータの蓄積により豊富な顧客の購買履歴と商品特性から頻繁に商品を購入する優良顧客の判定が容易となる。これに対して、耐久消費財等の販売を主流とするe−コマースおいては、想定耐用年数が1年以上で比較的購入価格が高いものという性格上、顧客は数年に1回購買するかしないかといういわゆる1回購買となり、顧客の購買履歴情報は存在せず、有力な情報としては、リファラ(当該サイトを訪問する直前のサイトの情報)、ランディング・ページ及びページ閲覧経路等、顧客がもたらすアクセス記録に依拠せざるを得ない。
【0005】
このような問題を解決する技術として、多くのユーザがアクセスすることでユーザ情報であるユーザプロファイルが頻繁に更新され、商品の入れ替えが頻繁に行われるe−コマースにおいて、これらの情報を組み合わせることによって解決するものがある。特許文献1には、電子的な店舗等において商品等の呈示をユーザの好みに合わせてリコメンデーションするため、顧客の情報を格納しているユーザプロファイルからユーザの好みを取り出すコラボレーティブフィルタリングを用いた静的なリコメンデーションと、アクセスログからユーザのアクセス履歴に基づくデータマイニングを用いた動的なリコメンデーションと、を組み合わせたリコメンデーションシステムが開示されている。
【0006】
【特許文献1】特開2002−366838号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
上述した特許文献1は、顧客情報を格納したユーザプロファイルとアクセスログを用いて処理しているものの、このような技術を顧客情報が乏しい1回購買を主流とするe−コマースにおいて顧客の好みを分析することは各商品、各分野に特化した解析ソフトを作る必要があり、容易ではない。
【0008】
そこで、本発明は、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたコンバージョンに至ったアクセス記録を含む記録データとに基づいて、各商品、各分野に特化する割合を減らし、汎用化した解析ソフトによりユーザ端末のアクセス動向を解析するアクセス解析システムを提供することを目的とする。
【課題を解決するための手段】
【0009】
以上のような目的を達成するために、本発明に係るアクセス解析システムは、ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システムにおいて、ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類手段と、ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義手段と、アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類手段と、定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出手段と、当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出手段と、算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み手段と、を有し、絞り込み手段からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とする。
【0010】
また、本発明に係るアクセス解析システムにおいて、絞り込み手段は、アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割手段と、短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ手段と、第1のフィルタ手段で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ手段と、第1と第2のフィルタ手段により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ手段と、抽出された端末クラスに関する情報を出力する出力手段と、を有することを特徴とする。
【0011】
また、本発明に係るアクセス解析システムにおいて更に、学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集手段と、学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証手段と、を有することを特徴とする。
【0012】
また、本発明に係るアクセス解析方法は、ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析方法において、ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類工程と、ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義工程と、アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類工程と、定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出工程と、当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出工程と、算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み工程と、を含み、絞り込み工程からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とする。
【0013】
また、本発明に係るアクセス解析方法において、絞り込み工程は、アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割工程と、短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ工程と、第1のフィルタ工程で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ工程と、第1と第2のフィルタ工程により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ工程と、抽出された端末クラスに関する情報を出力する出力工程と、を有することを特徴とする。
【0014】
また、本発明に係るアクセス解析方法において更に、学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集工程と、学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証工程と、を有することを特徴とする。
【発明の効果】
【0015】
本発明を用いると、顧客情報が乏しい1回購買を主流とするe−コマースにおいて、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたコンバージョンに至ったアクセス記録を含む記録データとに基づいてユーザ端末のアクセス動向を解析することが可能となる。
【発明を実施するための最良の形態】
【0016】
以下、本発明を実施するための最良の形態(以下実施形態という)を、図面に従って説明する。
(実施形態)
【0017】
図1はアクセス解析システム10の全体構成を示ている。ウェブサイトホームページは複数のページを有し、ウェブサイトをユーザ端末(31〜33)に公開しているウェブサーバ1はインターネット2を介してコンテンツをユーザ端末(31〜33)に提供する。アクセス解析システム10は、ユーザ端末31を操作する顧客のクリック動作によりアクセスされる各ページの情報を検出し、アクセスログDB(データベース、以下DBと略す)11に記憶する。
【0018】
アクセス解析システム10は、コンピュータシステムであり、ウェブサイトのページ構造を記録するウェブ構造DB14と、ページ構造をページカテゴリに分類して記録するページカテゴリDB18と、アクセスログDB11の記録に基づいて各ユーザ端末が各ページを渡り歩いた経路を定義する経路定義DB17と、コンバージョンに至る順に顧客のクラスを定義する顧客クラスDB16と、後述する顧客クラス判別処理によって顧客クラスの特性を分析した結果を記録する特性パターンDB15と、表示端末19に接続された制御部20と、を用いてアクセス解析を実行する。また、アクセスログDB11は、後述する顧客クラス判別処理で用いる学習用ログDB12と試験用ログDB13とを有している。
【0019】
図2は、本実施形態においてアクセス解析を行った「シビラ(登録商標)」のウェブサイトを示している。「シビラ(登録商標)」はアクセス解析用のソフトウエアであり、1回購買に該当することから、顧客の購買履歴は通常は存在せず、有力な情報要素としては、リファラ(サイトのページのリンクをクリックして別のページに移動したときの、リンク元のページ情報等)、ランディング・ページ(インターネット広告や、検索エンジンの検索結果からのリンク先となるウェブページ)、ページ閲覧経路、ページ閲覧時間、検索キーワード等、顧客がもたらすアクセスログデータだけである。
【0020】
図3は本実施形態におけるアクセス解析処理の流れを示している。本アクセス解析処理では、コンバージョンにアップグレードすると予想される優良顧客を判別するために、学習用ログと試験用ログを用いて顧客クラス判定処理に必要な様々なパラメータを特定し、その後に顧客クラス判定を行うものである。
【0021】
アクセス解析処理が実行されると、ループ回数を判定(ステップS10)し、1回目であれば、学習用ログの読み出し(ステップS12)を実行する。次に、ウェブサイトで提供されている複数のページを分類して定義するためにページカテゴリ定義(ステップS14)と、ページカテゴリに関連する顧客クラスを定義するために顧客クラスの定義(ステップS16)を実行する。学習用ログ、ページカテゴリ及び顧客クラスに基づいて固有アクセスパターンの抽出(ステップS18)と、固有アクセスパターンによって特徴付けられた顧客クラスを特定(ステップS20)する。顧客クラス特定時に使用したパラメータによりパラメータを特定(ステップS22)し、顧客クラス判定(ステップS24)を実行し、ステップS26において、判定した顧客クラスの評価を実行して、継続する場合には、ループ先頭であるステップS10へ戻る。
【0022】
ループ回数判定(ステップS10)において、2回目と判定された場合には、試験用ログの読み出し(ステップS30)を実行する。次に、試験用ログ、ページカテゴリ及び顧客クラスに基づいて、固有アクセスパターンの抽出(ステップS18)と、固有アクセスパターンにより特徴付けられて顧客クラスを特定(ステップS20)する。顧客クラス特定時に使用したパラメータによりパラメータを特定(ステップS22)し、顧客クラス判定(ステップS24)を実行し、ステップS26において、判定した顧客クラスの評価を実行し、パラメータの最適化を行う。継続する場合には、ループ先頭であるステップS10へ戻る。
【0023】
ループ回数判定(ステップS10)において、3回以上と判定された場合には、アクセスログの読み出し(ステップS32)を実行し、次に、顧客クラス判定(ステップS34)を実行してコンバージョンに至るであろう顧客を予想する。ステップS36において、継続しないと判定されることにより、処理が終了する。
【0024】
図4はウェブサイトページカテゴリの一例を示している。1回購買のサイトのコンバージョンに結びつくページカテゴリの内容は、(1)料金表、(2)プレゼント応募、(3)会員登録、(4)お問い合わせ・資料請求(5)お試し、(6)商談予約等の六つに分類することができる。ここで、ビジネスにとっての重要度は、番号が増えるに従いその重要度は高いものとなる。
【0025】
一般に、ウェブサイトは図4に示したように複数の階層(P01−P0101等)に分かれた大量のページによって構成されるため、個々のページに対するアクセス(以下PV:ページビューと略す)単位として顧客のアクセス経路の分析を試みると、各ページの訪問回数に関するヒストグラムが極端に平坦になってしまい、顧客の行動特性を捉えることが困難となる。そこで、内容的に纏まりを持ち、かつ顧客の行動特性を把握できる程度の詳細さを保持しつつ、ページのカテゴリ化を行う必要がある。なお、本実施形態では、ページのカテゴリを六つとした。
【0026】
図5はウェブサイトの顧客クラスの一例を示している。六つのページのカテゴリ化を行った後、顧客が閲覧したページカテゴリの経路を基に、N個の顧客クラス(C1〜Cn)に分類する。実施形態では、C1〜C4の4個の顧客クラスをページカテゴリの経路から定義した。具体的には、「シビラ(登録商標)」の場合、(1)料金表、(4)お問い合わせ・資料請求、(5)お試し、等を用いて、顧客クラスC1はP01,P04,P05に到達せずにサイトを離脱した顧客。顧客クラスC2はP01を閲覧したが、P04,P05にに到達しない顧客。顧客クラスC3はP04,P05を閲覧したが、送信完了をおこなわなかった顧客。顧客クラスC4はP04,P05を閲覧し、送信完了を行った顧客に分類した。このように顧客クラスを分類することにより、ページカテゴリの経路とスタート地点から、ゴール地点までのアップグレード及びアクセスの流れが表現できるようになる。
【0027】
アクセスパターンは連続するkPV(ページビュー)を基本単位とし、「シビラ(登録商標)」では学習用ログの解析からk=3,K=6とした。PV判別は1〜kPV,2〜(k+1〜)PV,・・・,(K−k+1)〜KPV)つまり、1〜3PV(1,2,3)、2〜4PV(2,3,4)、3〜5PV(3,4,5)、4〜6PV(4,5,6)のPV数を基準として最大6PV以内でクラス判定を行った。
【0028】
アクセスパターンを抽出するため、相関規則の統計的な意味付けとしてサポート値(Support)とコンフィデンス値(Confidence)という値を用いる。C1〜C4のアクセスパターンpに対するサポート値とは、Ciの顧客が起こした全アクセスパターン数の内、アクセスパターンpの起こった回数の占める割合である。また、コンフィデンス値とは、アクセスパターンpの総数の内、Ciがそのアクセスパターンpを起こした回数の占める割合である。
【0029】
ある顧客クラスのあるアクセスパターンに対するサポート値が高いということは、そのクラスに属する顧客がそのアクセスパターンを生起する蓋然性が高いことを意味するが、そのことのみによって、そのアクセスパターンがその顧客クラスの特性を表すことには無理がある。
【0030】
例えば、サポート値は高くてもコンフィデンス値が低い場合、そのアクセスパターンを起こした顧客が別の顧客クラスに属する蓋然性はより高いことになる。従って、ある顧客クラスの特性としてあるパターンを特性する為には、サポート値とコンフィデンス値の双方とも高い値を持つことが必要である。この理由により、Ciのアクセスパターンpに対して、それぞれのしきい値α,βを上回ったとき、そのアクセスパターンをCiの特性パターンとする。
【0031】
図6は顧客クラス判別処理の一例を示している。顧客クラス判別処理とは、顧客クラスの特性を把握するために、アクセスログから各顧客クラスに固有のアクセスパターンを抽出し、そのクラスに属する顧客がそのパターンを生起する蓋然性が高い特性を求めることである。また、具体例として、顧客クラスを二つ(C1,C2)、ページビューが(A)P01,(B)P04,(C)P05におけるアクセスパターンが四つしか存在しない場合を示している。
【0032】
図7(A)はアクセスパターンの抽出例を示し、図7(B)は図7(A)から算出されたサポート値、図7(C)は図7(A)から算出されたコンフィデンス値、図7(D)は最終的な特性パターンを示している。
【0033】
ここで、C2顧客クラスのうちP01,P04,P05(A−B−C)を閲覧し、送信完了をしたページビューパターン1を識別するためのしきい値α,βの選ぶ手順を示す。C2顧客クラスのうち特性パターンA−B−Cを満たすサポート値は0.375であり、コンフィデンス値は0.75であることが図7(D)に示されており、しきい値(α、β)=(0.375,0.75)以上とすると、サポート値0.375を上回る0.445のC1顧客クラスの特性パターンA−C−Bが該当するが、コンフィデンス値が0.44であり、C2顧客クラスの0.75を上回らないため、特性パターンA−C−BはC2顧客クラスでは選択されない。さらに、図7(B),(C)から学習用ログで求められたしきい値は、例えば、(α、β)=(0.35,0.5)としてもC2顧客クラスの特性パターンA−B−Cが選択されることになる。
【0034】
上述したように、1回購買サイトの分析においては、特性パターンを構成する情報要素としては、リファイラ、ランディング・ページ、ページ閲覧経路、ページ閲覧時間、検索キーワード等、顧客がもたらすアクセスログに依存する。これらの組み合わせでアクセスパターンを構成すれば良いかはウェブサイトのページ構造や、顧客のアクセス行動により一概に決定することができない。そこで、本実施形態では、複数の組み合わせを学習用ログと試験用ログとを用いて評価し、後述する顧客クラス判定処理の評価にて最良の結果をもたらす組み合わせを決定した。
【0035】
図8は顧客クラス判別処理の流れを示している。本実施形態は、図5のC1−P(C1最終顧客;ステージ1)からアップグレードする顧客クラスの判別において、顧客が六つのページを渡り歩く際、T=1では1〜3PV(ページビュー)に注目して非優良顧客を選別し、T=2では2〜4PVに、T=3では3〜5PVに、T=4では4〜6PVに着目して顧客がアップグレードするか否かの選別を行う。ここで、k=3,K=3,iはCiの添え字とする。
【0036】
顧客クラス判別処理が開始すると、最初にT=1を代入する(ステップS40)。次に、1〜3PVのループ外かを判定(ステップS42)し、ループ条件内であれば、ステップS46に移る。また、アップグレードをした場合にはステップS44にて判定を行う。ステップS46ではT時点でステージ1(ステージは1,2,3まで)にいる顧客がアップグレードするのか、最終的に現在の顧客クラスに留まるのかを判定する。この時点でアップグレードすると判定した場合にはそこで判別を終了すべくステップS58に移る。また、T時点でコンバージョンを達成してしまった場合には、以後その顧客を考察の対象から排除(ステップS58)する。もし、アップグレードしないと判定した場合には(T+1)時点以降でも引き続き判別をおこなうべく、ステップS48に移る。
【0037】
ステップS48において、C1のUCP(ユニーク・キャラクタリスティック・パターン)であるかを判定し、上述のしきい値α、βによりC1顧客クラスの特性パターンと一致することをステップS52で判断する。また、C1のUCP以外へのアップグレードによりC2のUCPを含む場合は、ステップS50に移り、複数クラスのUCPを待つことになる。もし、アップグレードにより複数クラスのUCPを受け取ると、ステップS54にて二つの顧客クラスに共通の特性パターンと一致した時は二つの顧客クラスのサポート値の比率により各顧客クラスに振り分ける。また、サポート比率によっても振り分けができない時には、顧客数比で振り分ける(ステップS56)。これらの処理が終わると、ステップS60に移り、Tに1を加えてステップS62にてループに戻るか否かを判定し、戻る場合には残りのT=2,3,4を順次実行する。
【0038】
なお、ステップS50では、複数クラスのUCPを待ち、リファラ,ランディング・ページ,ページ閲覧時間であるDwell Time等をアクセスパターンに取り入れ、特性パターンの判別精度の参考データを蓄積している。この参考データにより、最良の結果をもたらす組み合わせを評価する。
【0039】
上述した顧客クラス判定処理では、学習用ログを用い、特性パターンを表現する情報要素を組み合わせて各顧客クラスの特性パターンを判別するためのしきい値(α,β)を求め、最良の結果をもたらす組み合わせの評価を行った。
【0040】
一般的に、これらのパラメータには許容幅があることから、さらに、試験用ログを用いて顧客クラス判定処理の評価を行うことになる。この評価を行うに当たり、二項分布特性に当てはめたRecall,Precisionの値を算出する。
【0041】
図9、図10はコンバージョンにアップグレードするであろう優良顧客の選別例を示し、C1のステージ1におけるT=1(1〜3PV)からT=4(4〜6PV)までの4つの段階において、それぞれRecallとPrecisionの値を示している。図9(A)ではT=1(1〜3PV)においてアクセス後すぐに離脱してしまう顧客を弁別した非優良顧客選別結果を示している。ここで、C1−PのPrecisionは高く(72.64%)、非優良顧客を高い精度で選別できていることが分かる。図9(B)T=2における絞り込み1回目は、C2へアップグレードする顧客のPrecisionを(34.37%)しながら、T=3,4でもPresisonを(34.25%,34.67%)というように維持することができ、さらに、Recallも上昇させることに成功し、篩いとして機能していることが分かる。
【0042】
さらに、T=4におけるアップグレードのPrecisionを見ると355/1024=34.67%である。これは、一見すると低い精度と思われがちであるが、試験用ログから1024名を無差別に抽出し、それぞれがアップグレードが否かをランダムに判定したときに355名もしくはそれ以上を正しく言い当てる確率と比較は、約0.02%となる。この事実から、顧客クラス判定処理における優良顧客判定の精度が高いものであるかが理解されるであろう。
【0043】
なお、ランダムに判定した時の確率の算出方法は、正解率をXとし、正解率XはN=1024,θ=アップグレードのオリジナルの値である0.2922の二項分布に従い、Nは十分大きいので正規近似を用いXが355もしくはそれ以上である確率を求めると、その値は約0.00002(0.002%)となる。
【0044】
以上、上述したように、本実施形態に係るアクセス解析システムを用いると、顧客情報が乏しい1回購買を主流とするe−コマースにおいて、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたコンバージョンに至ったアクセス記録を含む記録データとに基づいてユーザ端末のアクセス動向を解析することが可能となる。
【0045】
(補遺)
本発明では、主にアクセス解析システム及びアクセス解析方法を説明したが、これにかぎらず、アクセス解析プログラムも重要であることから、以下その内容を記載する。
【0046】
本発明に係るアクセス解析プログラムは、ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析プログラムにおいて、ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類ステップと、ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義ステップと、アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類ステップと、定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出ステップと、当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出ステップと、算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込みステップと、をコンピュータによって実行し、絞り込みステップからの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とする。
【0047】
また、本発明に係るアクセス解析プログラムにおいて、絞り込みステップは、アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割ステップと、短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタステップと、第1のフィルタステップで得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタステップと、第1と第2のフィルタステップにより弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタステップと、抽出された端末クラスに関する情報を出力する出力ステップと、を有することを特徴とする。
【0048】
また、本発明に係るアクセス解析プログラムにおいて更に、学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集ステップと、学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証ステップと、を有することを特徴とする。
【産業上の利用可能性】
【0049】
本発明は、複数ページによってコンテンツを公開するウェブサーバへのユーザ端末のアクセスを検出して記録し、コンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システムに利用することが可能である。
【図面の簡単な説明】
【0050】
【図1】本発明の実施形態に係るアクセス解析システムの全体構成を示す構成図である。
【図2】本実施形態でアクセス解析をおこなったウェブサイトの一例である。
【図3】本実施形態に係るアクセス解析処理の流れを示すフローチャート図である。
【図4】本実施形態に係るページカテゴリの一例を説明する説明図である。
【図5】本実施形態に係るウェブサイトの顧客クラスを説明する説明図である。
【図6】本実施形態に係る顧客クラス判別処理の一例を説明する説明図である。
【図7】本実施形態に係るアクセスパターンの抽出例を示す模式図である。
【図8】本実施形態に係る顧客クラス判別処理の流れを示すフローチャート図である。
【図9】本実施形態に係るコンバージョンに至るであろう優良顧客の選別例を示す模式図である。
【図10】本実施形態に係るコンバージョンに至るであろう優良顧客の選別例を示す模式図である。
【符号の説明】
【0051】
1 ウェブサーバ、2 インターネット、10 アクセス解析システム、11 アクセスログDB、12 学習用ログDB、13 試験用ログDB、14 ウェブ構造DB、15 特性パターンDB、16 顧客クラスDB、17 経路定義DB、18 ページカテゴリDB、19 表示端末、20 制御部、31,32,33 ユーザ端末。

【特許請求の範囲】
【請求項1】
ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析システムにおいて、
ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類手段と、
ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義手段と、
アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類手段と、
定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出手段と、
当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出手段と、
算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み手段と、
を有し、
絞り込み手段からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とするアクセス解析システム。
【請求項2】
請求項1に記載のアクセス解析システムにおいて、
絞り込み手段は、
アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割手段と、
短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ手段と、
第1のフィルタ手段で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ手段と、
第1と第2のフィルタ手段により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ手段と、
抽出された端末クラスに関する情報を出力する出力手段と、
を有することを特徴とするアクセス解析システム。
【請求項3】
請求項1又は2に記載のアクセス解析システムにおいて更に、
学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集手段と、
学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証手段と、
を有することを特徴とするアクセス解析システム。
【請求項4】
ウェブサーバが複数ページによってコンテンツをユーザ端末に公開し、ウェブサーバへのユーザ端末のアクセスを記録してコンテンツの内容と記録されたアクセス記録とに基づいてユーザ端末のアクセス動向を解析するアクセス解析方法において、
ビジネスに関係するウェブサーバの各ページを予め決められた数のカテゴリに分類するカテゴリ分類工程と、
ビジネスにとって重要性が増加するユーザ端末のアクセス結果であるコンバージョンに結びつくようなユーザ端末のアクセスを、分類されたカテゴリに基づいてコンバージョンに至る連続経路として定義する経路定義工程と、
アクセス記録に記録されている付帯情報をさらに組み合わせて、ユーザ端末が複数のページを渡り歩くパターンであるアクセスパターンの傾向を、カテゴリ毎に端末クラスに分類する端末クラス分類工程と、
定義された連続経路と分類されたカテゴリとに基づく端末クラスの特性を、相関規則を用いて求めるため、端末クラスに該当するユーザ端末が起こした全アクセスパターン数のうち、ある端末クラスが起こしたアクセスパターンの回数の占める割合であるユーザ端末のサポート値を算出する端末特性算出工程と、
当該アクセスパターンの寄与度を求めるため、全アクセスパターン数のうち、当該アクセスパターンを起こした回数の占める割合であるユーザ端末の全体のアクセスに対するコンフィデンス値を算出する端末寄与度算出工程と、
算出されたユーザ端末のサポート値及びコンフィデンス値を予め決められたしきい値に基づいてアクセスパターンを絞り込む絞り込み工程と、
を含み、
絞り込み工程からの情報に基づいて、コンバージョンに至る端末クラスを予想することを特徴とするアクセス解析方法。
【請求項5】
請求項4に記載のアクセス解析方法において、
絞り込み工程は、
アクセス記録から取り出したユーザ端末の連続するアクセスパターンを複数の短いアクセスパターンに分割する分割工程と、
短いアクセスパターンに基づいて、サポート度及びコンフィデンス度の低い端末クラスのアクセスを予め決められたしきい値により、アクセス記録から弁別する第1のフィルタ工程と、
第1のフィルタ工程で得られたアクセス記録から、コンバージョンに至る手前の端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第2のフィルタ工程と、
第1と第2のフィルタ工程により弁別され抽出された残りのアクセス記録からコンバージョンに至った端末クラスに着目したサポート値及びコンフィデンス値のしきい値により抽出する第3のフィルタ工程と、
抽出された端末クラスに関する情報を出力する出力工程と、
を有することを特徴とするアクセス解析方法。
【請求項6】
請求項4又は5に記載のアクセス解析方法において更に、
学習用記録と試験用記録との二つのアクセス記録を収集するアクセス記録収集工程と、
学習用記録から求められたサポート値及びコンフィデンス値のしきい値に基づいて試験用記録を処理することで、しきい値を検証するしきい値検証工程と、
を有することを特徴とするアクセス解析方法。

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図2】
image rotate


【公開番号】特開2010−157151(P2010−157151A)
【公開日】平成22年7月15日(2010.7.15)
【国際特許分類】
【出願番号】特願2008−335738(P2008−335738)
【出願日】平成20年12月29日(2008.12.29)
【出願人】(300064102)株式会社環 (7)