説明

ユーザ層分離検出装置および方法ならびにそのためのプログラム

【課題】ユーザの利用行動を分析し特性を抽出する際に質的に異なるグループが出現しているか否かを判定し、出現する場合は、各ユーザを上位と下位の2グループに分け、各グループを特徴付ける非線型関数の作成を支援する技術の提供。
【解決手段】市場に提供された製品、システム、サービスに関するユーザの利用記録を記憶し(212)、ユーザがコンテンツや情報ページを利用する利用度の分布を集計し、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出し(213〜222)、得られた指標値、図表、または数値データを出力する(223)。これにより、利用頻度の傾向の意味で、上位層に属するユーザ集団と下位層に属するユーザ集団に分離する場合に、その分離を質的な特性によって検出し、上位層グループと下位層グループの境界を特定、また分離の発生と境界の評価についての判断を支援する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、消費者やユーザに繰り返して利用されることが想定されるサービス、またはシステム、または製品などが市場に提供されている状況下において、または、市場本格投入の前の実験的な評価段階において、ユーザの利用特性、需要、ないしはトラヒックを客観的に予測評価する、ないしは評価についての判断を支援する市場分析評価,投資判断評価,マーケティング,あるいはサービスまたはネットワークシステムのデザイン・改善・運用評価のための技術に関する。
【背景技術】
【0002】
消費者やユーザの利用行動を分析して、その特性を抽出することは、様々な領域で行われ、社会的な利用価値が高い。具体的な領域として、サービス、商品、広告、プラットフォーム等の戦略企画、市場性評価、投資マーケティング、ブランドや顧客の開発と管理、システムの運用・設備構築、経済政策、法制度など、多岐にわたる。そこでは、消費者またはユーザの行動特性をどのように捉えるかが問題である。消費者の行動は多岐に渡るため、その行動を捉えるのに、単一の枠組みではなく、複数に分類して分析することがしばしば行われる。
【0003】
一方、分析結果の付加価値を上げるには、消費者の行動を深く詳細に捉える必要があるが、従来の分類の方法は深い分析を可能とするような十分な基盤を備えていない。実際、消費者やユーザの行動には、しばしば、少なくとも2つの部類が出現し、高い活動性を示すが人数割合の少ない上位グループ(上位グループ:2割)と、比較的低い活動性を示す人数割合の大きい下位グループ(下位グループ:8割)があることが古くから言及され、パレートの法則、または、2:8の法則等と呼ばれている。しかしながら、従来の分類手法は、この2つのグループを的確に掌握し特定することができていない。
【0004】
実際、従来2つのグループの出現の把握と分類は、消費者やユーザの活動分布の分布形(非特許文献1)や成長曲線の変曲点(非特許文献2)を利用するものであり、極めて大規模なマクロデータが存在し、かつこれを注意深く分析した場合に浮かび上がるというものである。成長曲線のデータは適用領域が少なく、一般の行動データに対して適用しにくい。
【0005】
また、消費者やユーザの活動分布を使う場合、この分布自体は、サービス毎に多様な形状を示すため、非特許文献1で取っている特定の2種類の関数へのフィッティングという方法が使える範囲が少ない。図6は、ある動画サイトにおいて、縦軸にユーザ毎の総利用回数を対数でプロットした図であり、図6(A)は横軸に対数スケールを、図6(B)に通常スケールで示している。図6に示すように、上位の活動分布と下位の活動分布の間には異質性を示す特異点がデータに出現することは稀である。
【0006】
このため、解析的性質の異なる関数が一見すると連続的に接続しているように見え、データの揺らぎや分布形の多様性もあり、異質な層の出現を結論づけることが難しかった。そのため、非特許文献1や非特許文献2の研究を承知していない論者では、2:8の法則が、異質な2つのグループに基づくということを一般的に否定する意見さえ聞かれようになっている。行動の分析の基礎が脆弱であるため、混乱を来たしており、様々な判断が誤った推測に基づいて展開され、少なからぬ経済的な損失や無駄が生じていると考えられる。
【0007】
【非特許文献1】Zipf, G. K. 1949. Human Behaviour and the Principle of Least-Effort, Addison-Wesley, Cambridge MA. pp.484-495
【非特許文献2】S.Shimogawa and M.Shinno, 2007, Mechanism of Diffusion of Fixed-Line Broadband Access Services in Japan and its Application to Long-Term Growth Prediction, paper presented in TPRC 2007 (the 35th Research Conference on Communication, Information and Internet Policy, Arlington, VA, US). pp.1-27
【発明の開示】
【発明が解決しようとする課題】
【0008】
従って、本発明の目的は、消費者やユーザの利用行動を分析して、その特性を抽出する際に、上位グループと下位グループという2つの質的に特性が異なるユーザグループが出現しているか否かを高精度に判定し、もし存在する場合には、各ユーザを、上位グループと下位グループに分ける技術、および各グループを特徴付ける非線型関数の作成を支援する技術を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明は、上記目的を達成するために、次のような構成を採用する。
a)本発明に係るユーザ層分離検出装置は、ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出装置であって、繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を記憶する記憶手段と、ユーザが前記製品、システム、またはサービス(コンテンツや情報ページ)を利用する利用度の分布を集計する集計手段と、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出手段と、該算出手段によって得られた指標値、図表、または数値データを出力する出力手段を有することを特徴としている。
【0010】
この構成により、消費者向けで繰り返し利用することを想定した製品、システム、またはサービスなどが、市場に提供されている状況下において、当該の製品の購入、システムの利用、またはサービなどを利用するユーザが、利用頻度の傾向の意味で、上位層に属するユーザ集団と下位層に属するユーザ集団に分離する場合に、その分離を質的な特性によって検出し、上位層グループと下位層グループの境界を特定する、ないしは分離の発生と境界の評価についての判断を支援することができる。
【0011】
b)また、上記ユーザ層分離検出装置において、一定期間の間の利用記録を備え、N人のユーザとA個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号n(1≦n≦N)を付与する手段と、各コンテンツ番号a(1≦a≦A)に対して、分析用ユーザ番号nのユーザの番号aのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F=(F(n,a): 1≦n≦N、1≦a≦A)を集計する手段と、分析用ユーザ番号n, m(1≦n,m≦N)に対して、S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)を要素とする対称行列S=(S(n,m): 1≦n≦N、1≦m≦N))の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出する手段と、利用回数降順の分析用ユーザ番号nの軸に対して、各ユーザの利用回数の番号nに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画する手段を有することを特徴としている。
【0012】
c)また、上記ユーザ層分離検出装置において、前記利用回数降順の分析用ユーザ番号n(1≦n≦N)に対して、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)としてのスカラー値またはベクトル値を算出し、利用回数降順のユーザ番号nの軸に対して形状情報関数h(n)を描画する手段を有することを特徴としている。これにより、形状情報関数の描画の質的な違いから、ユーザ層の違いの識別を支援することができる。
【0013】
d)上記ユーザ層分離検出装置において、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、ある正の実数tに対して、固有値λ(n)に重複がないnにおいて、固有ベクトルの各要素の非負の成分と負の成分のそれぞれのtベキの総和の絶対値の小さくない方をとり、各要素の絶対値のtベキの総和に対する比を算出したものを含むことを特徴としている。
【0014】
e)また、上記ユーザ層分離検出装置において、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、固有値λ(n)に重複がないnにおいて、固有ベクトルの各要素の絶対値の最大値をとり、そのtベキの値の、各要素の絶対値のtベキの総和に対する比を算出したものを含むことを特徴としている。
【0015】
f)上記ユーザ層分離検出装置において、利用回数降順の分析用ユーザ番号nの形状情報関数h(n)の質的な変化を算出する関数p(n)を備えることを特徴としている。
【0016】
g)また、上記ユーザ層分離検出装置において、前記算出手段は、前記利用回数降順の分析用ユーザ番号nの形状情報関数h(n)の質的な変化を検出する関数p(n)として、形状情報関数の予め決められたステップ数前後との重み付けを含む1次または高次の移動和を算出し、その変化が予め決められた閾値を超える点を、質的なユーザ層の境界の候補として算出することを特徴としている。
【0017】
h)また、上記ユーザ層分離検出装置において、前記算出手段は、質的なユーザ層ごとに、利用回数関数f(n)と固有値平方根関数g(n)を、ベキ関数、指数関数、その他の幾つかの典型的な関数族によってフィッティングし、フィッティングングパラメータとフィッティング評価値を算出することを特徴としている。
【0018】
i)本発明に係るユーザ分離検出方法は、記憶手段と集計手段と算出手段と出力手段を備えたコンピュータにより、ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出方法であって、繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を前記記憶手段に記憶する記憶ステップと、前記集計手段により、ユーザが前記製品、システム、またはサービス(コンテンツや情報ページ)を利用する利用度の分布を集計する集計ステップと、前記算出手段により、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出ステップと、前記出力手段により、前記算出ステップによって得られた指標値、図表、または数値データを出力する出力ステップを有することを特徴としている。
【0019】
j)また、上記ユーザ層分離検出方法において、前記算出ステップは、一定期間の間の利用記録を備え、N人のユーザとA個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号n(1≦n≦N)を付与する手段と、各コンテンツ番号a(1≦a≦A)に対して、分析用ユーザ番号nのユーザの番号aのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F=(F(n,a): 1≦n≦N、1≦a≦A)を集計するステップと、分析用ユーザ番号n, m(1≦n,m≦N)に対して、S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)を要素とする対称行列S=(S(n,m): 1≦n≦N、1≦m≦N))の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出するステップを有し、前記出力ステップは、利用回数降順の分析用ユーザ番号nの軸に対して、各ユーザの利用回数の番号nに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画するステップを有することを特徴としている。
【0020】
k)本発明に係るプログラムは、コンピュータを、請求項1から8記載のユーザ層分離検出装置における各手段として機能させるユーザ層分離検出用プログラムである。
【発明の効果】
【0021】
本発明によれば、サービスのユーザや消費者の行動において、利用活動の上位層と下位層という基本的かつ質的な層分離が発生した場合、これを的確に検出し、かつ、その層を掌握することができる。
【0022】
具体的に説明すると、例えば、図1に見るように、活動分布だけを利用する従来の古典的な方法の場合、層分離を明確に主張することは難しい問題である。これに対して、本発明を適用すれば、上位層と下位層の2グループの発生が明瞭になり、性質の異なる2種類の関数が連結しているとみなすことが明確になることがわかる(後述する図4、5参照)。なお、下位の部分の関数は、本願出願人が先に出願した特願2008−191885で提案したように、サービスの定着性を測る尺度として、重要なものであり、その構造が分かることは、重要なサービスの定着性の評価をより的確なものとする。こうして、本発明によって、消費者の行動特性をより深くかつ詳しく捉えことができる。その結果、産業の革新と改善の効率化および投資の経済化が促進されるという意味において、産業上の高い効果が期待できる。
【発明を実施するための最良の形態】
【0023】
<発明の概要>
以下、本発明の概要について説明する。
本発明では、次のような実験的結果を利用する。インターネットのウェブサイトのあるサービスの利用行動を詳しく分析すると、次のような結果が得られる。
【0024】
一定期間で、サンプル抽出されたユーザN人が全体でA個のコンテンツにアクセスした結果から、非負行列をF=(F(n,a): 1≦n≦N、1≦a≦A)を作成できる。ここで、F(n,a)は、番号nのユーザの番号aのコンテンツの利用回数である。
【0025】
また、ユーザの番号nは、各ユーザnの総利用回数f(n)の降順となっているとする。
f(n)= F(n,1)+・・・+F(n,A)
である。
【0026】
S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)、
を要素とする正方行列S=(S(n,m): 1≦n≦N、1≦m≦N)は、非負要素からなる半正定対称行列であり、全ての固有値は非負実数で、固有ベクトルからなる直交行列を用いて対角化できる。
【0027】
固有値を大きいものから降順に番号1≦n≦Nを付与してλ(n)とする。1≦n≦Nに対して、関数g(n)を固有値λ(n)が正数の場合に、平方根λ(n)1/2、固有値λ(n)が零の場合には零として定義し、固有値平方根関数と呼ぶ。
【0028】
一般に多数のコンテンツにアクセスするサービスでは、ユーザ行動の多様性によって、正方行列はスパース(多くの非対角要素が零)となる。従って、固有値平方根関数g(n)は、行列Sの対角成分の平方根に近くなり、各ユーザのコンテンツ利用ベクトルの内積によるベクトルサイズ
f2(n)= {F(n,1)F(n,1)+・・・+F(n,A)F(n,A)}1/2
に近くなる。
【0029】
これは、定性的には総利用回数f(n)より大きいが、これに近い特性のある尺度である。そのため、固有値平方根関数g(n)は、f(n)に近い特性を示す。図3は、2つの動画サイトにおいて、固有値平方根関数g(n)とf(n)をプロットした図であるが、実際、g(n)とf(n)は、大きさは異なるが、形状は良く似ていることがわかる。
【0030】
なお、f(n)の形状は、上位グループと下位グループを特徴付ける上で重要であるが、 f(n)は、非負の整数にのみ値を取るため、利用回数の少ない領域で、値が散布しやすく、数学的関数によるフィッティングが難しい傾向にある。
【0031】
一方、固有値は一般に実数値を取り得るため、固有値平方根関数g(n)は、より滑らかで、値が曲線を描きやすく、数学的関数によるフィッティングを実施しやすいという利点を持っている。この固有値分布と総利用回数分布の結びつきから、ユーザ層の性質に関する有用な情報が、固有値分布・固有関数分布の性質からも得られると考えられる。
【0032】
次に、各固有値に対して固有ベクトルの形状を計算する。まず、非負行列であるため、有名なペロン-フロベニウスの理論によって、対称行列Sによって推移的な関係にある成分の部分行列ごとに最大固有値があり、部分行列に対応するユーザ番号nの要素において、その固有ベクトルは、全て真に正の値をとり、それ以外の固有ベクトルは、このベクトルと直交するため、非負の成分を併せ持つことになる。
【0033】
推移的な関係にあるユーザ番号n自体は大きいか、行列がスパースであることから、部分行列に分解する構造に近い状況にあるため、各固有ベクトルがどれだけ、全て正の要素からなるベクトルに近いか、または、遠いかが、固有ベクトルの形状を測る尺度となると考えられる。
【0034】
そこで、固有ベクトル形状の尺度h(n)として、定符号成分比h1(n)と固有ベクトル最大絶対値成分比h2(n)の2つを計算した。定符号成分比h1(n)は、ある正の実数tに対して、固有ベクトルの非負の要素と負の要素それぞれのtベキの総和を取り、絶対値の大きいほうの全体和に対する割合を量るものであり、固有ベクトルが全て正の要素からなるケースからの隔たりを測るものである。
【0035】
一方、固有ベクトル最大絶対値成分比h2(n)は、各要素の絶対値の中で最大の値を取る固有ベクトルの集中度を測る形状尺度である。
【0036】
固有ベクトルは各ユーザの利用回数を線型に全方位に少変化(線型摂動)させたときの、コンテンツ上の全ユーザ総和での利用ベクトルに対する内積によるベクトルサイズの小変化全体の直交成分を表し、同一コンテンツを利用することに起因する相関関係を記述する。
【0037】
従って利用活動の背後にある構造に踏み込んだ要素である。もし、固有ベクトルを利用した尺度から質的に異なる成分が出現すれば、これには、行動の相関関係のロバスト性と同程度のロバスト性をもった、利用活動の全体における質的に異なるグループの存在を意味する。
【0038】
図4は、解析実験の結果をプロットした図である。図4において、一つの動画サイトに対して、形状情報関数h(n)(定符号成分比h1(n)と固有ベクトル最大絶対値成分比h2(n))をt=1に対して、プロットした図である。図4からわかるように、予想された通りかかる質的に異なる境界が、最上位から2割程度の位置に出現した。図4には3つの層が観測されるが、最も低強度固有値側の層は、固有値の重複によって、固有関数の任意性が生じているためであり、分析の手法の性質によって生じ本質的でないため除外される。上位から2割程度の箇所に、明らかな質的違いを示す断層的な境界が観測される。
【0039】
この境界の観測により、上位層と下位層というグループの存在が明確になる。そこで、前半と後半に分けて、前半は原点近くに特異点を持つベキに近い関数、後半は指数関数に従うという主張が妥当であることがわかる。図5は、図6の総利用回数関数f(n) を、境界の前後で関数フィッティングを施した図であり、縦軸は対数スケールであり、横軸は図5(A)が対数スケール、図5(B)が通常スケールである。直線による部分適合であり、それぞれ、ベキ関数(同図(A))、指数関数(同図(B))になっている。図には点の上に直線が上書きしてあり、この直線部分が下位のユーザで、これより上位が上位ユーザに対応している。ただし、固有値とユーザの対応は、大まかな傾向であるため、当該の境界の正確な位置を決めるわけではない。
【0040】
一方、形状情報関数h(n)による断層がなければ、このような異質な解析的関数が接続するという主張は難しい。なお、下位グループの部分の関数としての特性は、本願出願人が先に出願した特願2008−191885で提案したように、消費者向けで繰り返し利用することを想定した製品、システム、またはサービスなどの定着性を測る尺度に関するもので、その構造が分かることは、重要なサービスの定着性を評価する尺度の計算を容易にする有益性の高いものである。特願2008−191885では、製品の購入、システムの利用、またはサービなどを多くの人が継続していくという意味での定着性の傾向を掌握する的確な尺度を構成する定着性評価支援装置を提供するために、ユーザの全員または一部のユーザの利用記録を記憶し、定着傾向を解析し、活動量ユーザ分布を分析し、低活動ユーザ活動特性を算出し、活動量コンテンツ分布を解析し、描画図面を生成して表示するようにしている。
【0041】
そこで本発明は、上記〔発明が解決しようとする課題〕の項に示した課題を下記の各手段(1)〜(6)によって解決するものである。
(1)消費者向けで繰り返し利用することを想定した製品、またはシステム、またはサービスなどが、市場に提供されている状況下において、当該サービス等に関する全員もしくは一部のユーザの一定期間の間の利用記録を記憶する記憶手段(後述のユーザ毎総利用回数集計部212参照)。
【0042】
例えば、着目するウェブサイトの各コンテンツと、各ユーザにそれぞれ認識番号が付与され、ある一月に各ユーザが各コンテンツをアクセスした回数として、利用記録をアクセスした数を活動量として、これを半年にわたって記録したデータを記憶装置に格納する。
【0043】
(2)N人のユーザとA個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号n、1≦n≦N、を付与する手段(後述の分析用ユーザ番号付与部213参照)と、各コンテンツ番号a、1≦a≦Aに対して、分析用ユーザ番号nのユーザのコンテンツ番号aのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F=(F(n,a): 1≦n≦N、1≦a≦A)を集計する手段(後述の基本行列作成部214参照)。
【0044】
例えば、各ユーザの認識番号kごとに各コンテンツaの利用回数をaについて総和しv(k)とし、その結果の降順から、ユーザの認識番号に降順の分析用番号nを付与する。コンテンツに対しては認識番号を、そのまま分析用番号aとして利用する。これから、分析番号の組(n,a)に対して、記録したデータから、分析用番号n番のユーザの番号aのコンテンツの利用回数を集計し F(n,a)として格納する。
【0045】
(3)分析用ユーザ番号n,m(1≦n, m≦N)に対して、 S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)、を要素とする対称行列S=(S(n,m): 1≦n≦N、1≦m≦N))の各固有値を、非負実数である各固有値の大きさの降順に番号を付与し固有値λ(n)として算出し、利用回数降順のユーザ番号nの軸に対して、固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数値g(n)を算出する手段、および、各分析用ユーザ番号nに対して、ユーザのコンテンツ総利用回数の関数値f(n)を算出する手段(後述の対称行列作成部215、対角化算出部216、基本関数作成部217参照)。
【0046】
例えば、ユーザ番号、n,m毎に、各コンテンツ番号aを1番から最終の番号A番まで、呼び出して、
S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)
として総和して、対称行列 S(n,m)を計算し、対称行列S=(S(n,m))の各固有値と固有関数を算出するプログラムを呼び出し、その出力を格納する。
【0047】
次に、各固有値に降順の順位を付与する。これから、平方根関数の各ユーザ番号nに対する値g(n)として、分析用ユーザ番号nに対して、降順の番号付けによる固有値の値λ(n)が、正の場合はλ(n)の平方根の値を、零の場合は零を返す。また、降順の分析用ユーザ番号nとデータ上の認識番号kの関係を利用して、分析用ユーザ番号nに対して、各ユーザのデータ上の認識番号kごとに各コンテンツaの利用回数をaについて総和したv(k)を対応させ、分析用ユーザ番号nについてのコンテンツ総利用回数f(n)を返す。
【0048】
(4)利用回数降順の分析用ユーザ番号n、1≦n≦N、に対して、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、固有値λ(n)に重複がない場合において、正の実数tに対して、固有ベクトルの各要素の正の成分のtベキの総和と負の成分の絶対値のtベキの総和の小さくない方をとり、各要素の絶対値のtベキの総和に対する比を算出する手段、および、固有ベクトルの形状情報関数h(n)の要素として、固有ベクトルの各要素の絶対値の最大値をとり、そのtベキ値と、各要素の絶対値のtベキの総和に対する比を算出する手段、および、固有ベクトルの形状情報関数h(n) をユーザ番号nの関数として描画する手段(後述の固有ベクトル形状情報作成部218参照)。
【0049】
例えば、まず、対称行列の対角化プログラムによって、返される各固有値と固有ベクトルを対のテーブルによって、管理する。次に、各固有値を降順で順序づけたλ(n)について、その値を隣接する番号で比較して、各固有値に重複度を付与する。重複度が2以上の場合は、形状情報関数h(n)として、空欄を示す特定のコードとする。重複度が1の場合は、正の実数tに対して、固有ベクトルの各要素について、要素の値が非負の要素のtベキの総和e1(n)と、負の要素の絶対値のtベキの総和値e2(n)と、絶対値が最大となる要素のtベキの値e3(n)を取り出す。これから、e1(n)とe2(n)の小さくない方をe4(n)とし、形状情報関数h(n)をベクトル値
h(n)=(e4(n)/(e1(n)+e2(n)), e3(n)/(e1(n)+e2(n))
として返す。形状情報関数h(n)として、常に上記の如きベクトル値を採用するのではなく、例えば、スカラー値 h(n)=(e4(n)/(e1(n)+e2(n))として返してもよい。
【0050】
(5)利用回数降順のユーザ番号nの形状情報関数h(n)の質的な変化を検出する関数p(n)として、形状情報関数の予め決められたステップ数前後との重み付けを含む一次または高次の移動和を算出し、その変化が予め決められた閾値を超える点を、質的なユーザ層の境界の候補として算出する手段(後述の層分離判定関数生成部219、層分離判定関数適用部220、層分離分析支援処理部221参照)。
【0051】
例えば、wをあまり大きくない自然数とし、原点に平均を持つ予め指定された分散σを持つガウス分布を整数区間上で積分して得られる、有界整数区間
W= {-w, -w+1,・・・, -1, 0, 1, ・・・, w-1, w}
の上の確率分布u(i), jはWの要素、を用いて、例えばh(n)がスカラーである場合、p(n)をh(n)の ある正数dのベキ乗 h(n)dとu(j)の畳み込み、即ち、
p(n)=Σ-w≦j≦w h(n-j)du(j)
とし、 ある閾値 c<1 を設定して、区間 [p(n-1),p(n)]または[p(n), p(n-1)]がcを含むnを境界候補の検出として算出する。
【0052】
この時、閾値cを区間(1/2, 1)の間の予め決められた刻みzに従って、1に近いcから次第に1/2へ移動させて、境界値の検出数を閾値cに対して描画することで、検出数が安定するcの領域が図示できる。
【0053】
(6)質的異なるユーザ層ごとに、利用回数関数f(n)と固有値平方根関数g(n)を、ベキ関数、指数関数、その他の幾つかの典型的な関数族によってフィッティングし、その結果を図示し、また、フィッティングングパラメータとフィッティング評価値を算出する手段(後述の層別フィッティング部222参照)。
【0054】
例えば、形状情報関数h(n)や形状情報関数の質的な変化を検出する関数p(n)の描画や境界候補値の算出値の提示に引きつづき、操作者の操作を受け付けて、上位グループと下位グループの境界となる番号n0を入力情報として受け付け、U={1≦n≦n0-1}, D={n0≦n≦N}として、上位層と下位層に分ける。
【0055】
次に、UとDそれぞれで、ベキ関数1/nq、q>0、指数関数 exp(-rn)の定数倍および定数和等を含む減少関数からなる典型的な関数(モデル関数)によって、利用回数関数f(n)と固有値平方根関数g(n)にパラメータフィッティングを施し、それぞれの結果を描画し、パラメータ値を出力する。
【0056】
<作用>
本発明では、消費者向けで繰り返し利用することを想定した製品、またはシステム、またはサービスなどが、市場に提供されている状況下において、消費者の利用行動を分析して、その特性を抽出する際に、上記<発明の概要>に記載の手段を用いて、利用活動における上位グループと下位グループという2つの質的に異なるユーザグループが存在しているか否かを高精度に判定(検出)し、存在している場合には、各ユーザを、上位グループと下位グループに分けることができ、また、各グループを特徴付ける非線型関数の作成を支援することができる。
【0057】
<実施例>
以下、本発明の実施例を具体的に説明する。
上述したように、インターネットのウェブサイト等で提供されるコンテンツベースのサービスや電子商取引のサービス等において、ユーザの利用行動を分析して、その特性を抽出することは、サービスの今後の展開戦略や、プラットフォーム・コンテンツの改善、必要資源の調達などを実施する上での基盤となる重要な業務である。
【0058】
そこで、このようなサービスのユーザの利用活動の記録がデータとして収集され、当該データを用いてユーザの利用行動を分析する場合に、上位グループと下位グループという2つの質的に異なるユーザグループが出現しているか否かを高精度に判定し、存在する場合には、各ユーザを、上位グループ、下位グループに分ける方法を提供し、かつ、各グループを特徴付ける非線型関数とそのパラメータを算出することができる装置を構成する実施例を以下に記す。
【0059】
なお、本実施例では、ウェブサイトのコンテンツサービスの場合に記載するが、他のサービスへの適用を除外するものではない。本実施例では、着目する幾つかのウェブサイトについて、一部または全部のユーザの利用記録が継続的に収集されているものとする。サービス利用活動データは、各々のユーザがウェブサイトの各コンテンツをどのような頻度でアクセスしているかが分かるものであり、例えば、ユーザを識別する番号、ウェブサイトのコンテンツを識別する記号からなるものとする。
【0060】
図1は、本発明に係るユーザ層分離検出システム構成例を示す図、図2は、本発明に係る各構成部により行われる処理フローを示す図である。以下、これらの図面を用いて本発明に係るユーザ層分離検出システムを説明する。
【0061】
本発明に係るユーザ層分離検出システムは、図1に示すように、ユーザインタフェース100,本体処理部200,サービス利用活動データ記憶部300,および出力保存部400から構成される。
【0062】
以下、図1を用いて各構成部の機能について説明する((ステップS・・)という記載は、図2における対応する処理ステップを示している)。
ユーザインタフェース100は、本ユーザ層分離検出システムの利用者がシステムを制御して目標の解析を実行するための命令を受理し、中央制御部202に転送する機能を有する。
【0063】
本体処理部200は、本発明に係るユーザ層分離検出処理を行うための主要部であり、コンピュータにより実現される。
サービス利用活動データ記憶部300は、外部からサービス利用活動データを入力し、格納する機能を有する。
出力保存部400は、ユーザインタフェース100からの指示により、主記憶ユーザインタフェース、図面などをファイルとして保存する機能を有する。
【0064】
本体処理部200は、ユーザインタフェース処理部201、中央制御部202、主記憶203、デフォルト設定部211、ユーザ毎総利用回数集計部212、分析用ユーザ番号付与部213、基本行列作成部214、対称行列作成部215、対角化算出部216、基本関数作成部217、固有ベクトル形状情報作成部218、層分離判定関数生成部219、層分離判定関数適用部220、層分離分析支援処理部221、層別フィッティング部222、描画図面生成部223、表示制御部224を有する。本体処理部200を構成する上記各部(各手段)は、コンピュータのCPUによりこれら各部(手段)に対応するプログラムを実行することによって実現される。
【0065】
デフォルト設定部211は、各部の様々なパラメータや指定要求に対するデフォルトを設定する機能を提供し、デフォルトの設定要求表を表示、入力、ファイル保存の機能を実行する(ステップS211)。
【0066】
ユーザ毎総利用回数集計部212は、各ユーザ識別番号kに対して、全てのコンテンツ識別番号aに対して利用回数の総和v(k)を集計し、ユーザ識別番号に対する配列(v(k))として、主記憶203に格納する(ステップS212)。
【0067】
分析用ユーザ番号付与部213は、v(k)の値を降順にする番号付けnを算出し、nに対してkを呼び出す分析用ユーザ番号付け関数(k(n))の配列を作成して、主記憶203に格納する(ステップS213)。
【0068】
基本行列作成部214は、分析用ユーザ番号nとコンテンツ識別番号に対する利用回数F(n,a)をk(n)とコンテンツ識別番号aを元に記録データを呼び出して集計し、(n,a)に対するに2次元配列(F(n,a))を作成して、主記録204に格納する(ステップS214)。
【0069】
対称行列作成部215は、分析用ユーザ番号n,mに対する行列要素 S(n,m)を、
S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)
によって算出し、(n,m)に対する2次元配列 (S(n,m)) を作成する(ステップS215)。
【0070】
対角化算出部216は、対称行列 S=(S(n,m))の固有値、重複度、固有ベクトル求めて、固有値の降順に並べ替え、順位nに対して、固有値λ(n)を対応させる配列 (λ(n))と重複度ml(n)を対応させる配列(ml(n))と、固有ベクトルev(n)を対応させる配列(ev(n))作成し、主記憶203に格納する(ステップS216)。
【0071】
基本関数作成部217は、分析用ユーザ番号nに対するユーザnの総利用回数f(n)、 降順第n位の固有値の平方根g(n) を、上記<発明の概要>(3)に示した手順によって算出し、それぞれ配列(f(n)), (g(n))を作成して主記憶203に格納する(ステップS217)。
【0072】
固有ベクトル形状情報作成部218は、正実数t に対して、各順位nに対して、固有ベクトルev(n)の形状情報関数
h(n)=(e4(n)/(e1(n)+e2(n)), e3(n)/(e1(n)+e2(n))
を作成し、(n,2)配列(h(n))を作成して主記憶に転送する(ステップS218)。形状情報関数として上記の如きベクトル値を採用するのではなく、例えばスカラー値
h(n)=(e4(n)/(e1(n)+e2(n))を採用してもよい。
【0073】
層分離判定関数生成部219は、上記<発明の概要>(5)に示した方法によって作成されるnに対する関数
p(n)=Σ-w≦j≦w h(n-j)du(j)
を作成し、配列(p(n)) を主記憶に格納する(ステップS219)。
【0074】
層分離判定関数適用部220は、閾値cを移動させつつ、上記(5)の手順によって、各閾値cに対する検出数を算出し、得られた検出数の閾値cに対する関数のグラフと、検出数5以下の閾値cに対する、境界候補値nを算出して、(c,n)の点によるグラフを作成し、主記憶203に格納する(ステップS220)。
【0075】
層分離分析支援処理部221は、ユーザインタフェース100からの要求に従って、ユーザ利用回数関数f(n)、固有値平均値関数g(n), 固有関数形状情報関数h(n)の各要素成分、検出数関数グラフ、境界候補値グラフを呼び出して、描画図面生成部223を用いて描画図面を作成し、表示制御部224により表示する。また、ユーザインタフェース100からの要求に従って、描画結果を基に操作者が、層分離の存在最終判定のYES-NOフラグと、層分離境界値n0を決定する(ステップS221)。
【0076】
層別フィッティング部222は、層分離境界値n0から、上記(6)の手順によって、利用回数関数f(n)と固有値平方根関数g(n)にパラメータフィッティングを施しで、その結果のグラフを描画し、パラメータ値と共に主記憶203に格納し、画面に表示する(ステップS222)。
【0077】
描画図面生成部223は、要求を受けて主記憶203への格納状態を走査し、作成可能な図画・図表のリストを表示し、指定を受けて、図面作成用の各データを呼び出し、グラフ、点集合等の図面タイプに応じてグラフィックデータを作成し、図面記憶領域に格納する(ステップS223)。
【0078】
表示制御部224は、要求を受けて図面記憶領域を操作し、表示可能な図画・図表のリストを表示し、指定を受けて、各図面を表示する(ステップS224)。
【0079】
上述したように、本体処理部200を構成する上記各部(各手段)の機能を達成するために、コンピュータのCPUにより上記各部(手段)に対応するプログラムが実行される。上記各部(手段)に対応するプログラムはFD,CD−ROM,DVDなどのコンピュータ読取り可能な記録媒体やインターネットなどのネットワークを介してユーザに提供することができることはいうまでもない。
【図面の簡単な説明】
【0080】
【図1】本発明実施例における、システム構成例を表す図である。
【図2】本発明実施例における、処理フローを表す図である。
【図3】2つの動画サイト(図中(イ)および(ロ))において、固有値平方根関数g(n)とf(n)をプロットした図である。
【図4】動画サイト(ロ)に対して、固有関数形状情報関数h(n)(定符号成分比h1(n)と固有ベクトル最大絶対値成分比h2(n))をt=1に対して、プロットした図である。
【図5】図6の総利用回数関数f(n) を、境界の前後で関数フィッティングを施した図である。
【図6】ある動画サイト(図3、図4の(ロ)に対応する)において、ユーザ毎の総利用回数f(n)をプロットした図である。
【符号の説明】
【0081】
100:ユーザインタフェース
200:本体処理部
201:ユーザインタフェース処理部
202:中央制御部
203:主記憶
211:デフォルト設定部
212:ユーザ毎総利用回数集計部
213:分析用ユーザ番号付与部
214:基本行列作成部
215:対称行列作成部
216:対角化算出部
217:基本関数作成部
218:固有ベクトル形状情報作成部
219:層分離判定関数生成部
220:層分離判定関数適用部
221:層分離分析支援処理部
222:層別フィッティング部
223:描画図面生成部
224:表示制御部
300:サービス利用活動データ記憶部
400:出力保存部

【特許請求の範囲】
【請求項1】
ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出装置であって、
繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を記憶する記憶手段と、ユーザが前記製品、システム、またはサービスを利用する利用度の分布を集計する集計手段と、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出手段と、該算出手段によって得られた指標値、図表、または数値データを出力する出力手段とを有することを特徴とするユーザ層分離検出装置。
【請求項2】
請求項1に記載のユーザ層分離検出装置において、
一定期間の間の利用記録を備え、N人のユーザとA個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号n(1≦n≦N)を付与する手段と、各コンテンツ番号a(1≦a≦A)に対して、分析用ユーザ番号nのユーザの番号aのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F=(F(n,a): 1≦n≦N、1≦a≦A)を集計する手段と、分析用ユーザ番号n, m(1≦n,m≦N)に対して、S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)を要素とする対称行列S=(S(n,m): 1≦n≦N、1≦m≦N))の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出する手段と、利用回数降順の分析用ユーザ番号nの軸に対して、各ユーザの利用回数の番号nに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画する手段を有することを特徴とするユーザ層分離検出装置。
【請求項3】
請求項2に記載のユーザ層分離検出装置において、
前記利用回数降順の分析用ユーザ番号n(1≦n≦N)に対して、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)としてのスカラー値またはベクトル値を算出し、利用回数降順のユーザ番号nの軸に対して形状情報関数h(n)を描画する手段を有することを特徴とするユーザ層分離検出装置。
【請求項4】
請求項3に記載のユーザ層分離検出装置において、
対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、ある正の実数tに対して、固有値λ(n)に重複がないnにおいて、固有ベクトルの各要素の非負の成分と負の成分のそれぞれのtベキの総和の絶対値の小さくない方をとり、各要素の絶対値のtベキの総和に対する比を算出したものを含むことを特徴とするユーザ層分離検出装置。
【請求項5】
請求項3に記載のユーザ層分離検出装置において、
対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、固有値λ(n)に重複がないnにおいて、固有ベクトルの各要素の絶対値の最大値をとり、そのtベキの値の、各要素の絶対値のtベキの総和に対する比を算出したものを含むことを特徴とするユーザ層分離検出装置。
【請求項6】
請求項3に記載のユーザ層分離検出装置において、
利用回数降順の分析用ユーザ番号nの形状情報関数h(n)の質的な変化を算出する関数p(n)を備えることを特徴とするユーザ層分離検出装置。
【請求項7】
請求項6に記載のユーザ層分離検出装置において、
前記算出手段は、前記利用回数降順の分析用ユーザ番号nの形状情報関数h(n)の質的な変化を検出する関数p(n)として、形状情報関数の予め決められたステップ数前後との重み付けを含む1次または高次の移動和を算出し、その変化が予め決められた閾値を超える点を、質的なユーザ層の境界の候補として算出することを特徴とするユーザ層分離検出装置。
【請求項8】
請求項3に記載のユーザ層分離検出装置において、
前記算出手段は、質的なユーザ層ごとに、利用回数関数f(n)と固有値平方根関数g(n)を、ベキ関数、指数関数、その他の幾つかの典型的な関数族によってフィッティングし、フィッティングングパラメータとフィッティング評価値を算出することを特徴とするユーザ分離検出装置。
【請求項9】
記憶手段と集計手段と算出手段と出力手段を備えたコンピュータにより、ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出方法であって、
繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を前記記憶手段に記憶する記憶ステップと、前記集計手段により、ユーザが前記製品、システム、またはサービスを利用する利用度の分布を集計する集計ステップと、前記算出手段により、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出ステップと、前記出力手段により、前記算出ステップによって得られた指標値、図表、または数値データを出力する出力ステップを有することを特徴とするユーザ層分離検出方法。
【請求項10】
請求項9に記載のユーザ層分離検出方法において、
前記算出ステップは、一定期間の間の利用記録を備え、N人のユーザとA個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号n(1≦n≦N)を付与する手段と、各コンテンツ番号a(1≦a≦A)に対して、分析用ユーザ番号nのユーザの番号aのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F=(F(n,a): 1≦n≦N、1≦a≦A)を集計するステップと、分析用ユーザ番号n, m(1≦n,m≦N)に対して、S(n,m)=F(n,1)F(m,1)+・・・+F(n,A)F(m,A)を要素とする対称行列S=(S(n,m): 1≦n≦N、1≦m≦N))の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出するステップを有し、
前記出力ステップは、利用回数降順の分析用ユーザ番号nの軸に対して、各ユーザの利用回数の番号nに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画するステップを有することを特徴とするユーザ層分離検出方法。
【請求項11】
コンピュータを、請求項1から8記載のユーザ層分離検出装置における各手段として機能させるためのユーザ層分離検出用プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−123027(P2010−123027A)
【公開日】平成22年6月3日(2010.6.3)
【国際特許分類】
【出願番号】特願2008−297730(P2008−297730)
【出願日】平成20年11月21日(2008.11.21)
【出願人】(000004226)日本電信電話株式会社 (13,992)