ユーザ層分離検出装置および方法ならびにそのためのプログラム

【課題】ユーザの利用行動を分析し特性を抽出する際に質的に異なるグループが出現しているか否かを判定し、出現する場合は、各ユーザを上位と下位の２グループに分け、各グループを特徴付ける非線型関数の作成を支援する技術の提供。
【解決手段】市場に提供された製品、システム、サービスに関するユーザの利用記録を記憶し（２１２）、ユーザがコンテンツや情報ページを利用する利用度の分布を集計し、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出し（２１３〜２２２）、得られた指標値、図表、または数値データを出力する（２２３）。これにより、利用頻度の傾向の意味で、上位層に属するユーザ集団と下位層に属するユーザ集団に分離する場合に、その分離を質的な特性によって検出し、上位層グループと下位層グループの境界を特定、また分離の発生と境界の評価についての判断を支援する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、消費者やユーザに繰り返して利用されることが想定されるサービス、またはシステム、または製品などが市場に提供されている状況下において、または、市場本格投入の前の実験的な評価段階において、ユーザの利用特性、需要、ないしはトラヒックを客観的に予測評価する、ないしは評価についての判断を支援する市場分析評価，投資判断評価，マーケティング，あるいはサービスまたはネットワークシステムのデザイン・改善・運用評価のための技術に関する。
【背景技術】
【０００２】
消費者やユーザの利用行動を分析して、その特性を抽出することは、様々な領域で行われ、社会的な利用価値が高い。具体的な領域として、サービス、商品、広告、プラットフォーム等の戦略企画、市場性評価、投資マーケティング、ブランドや顧客の開発と管理、システムの運用・設備構築、経済政策、法制度など、多岐にわたる。そこでは、消費者またはユーザの行動特性をどのように捉えるかが問題である。消費者の行動は多岐に渡るため、その行動を捉えるのに、単一の枠組みではなく、複数に分類して分析することがしばしば行われる。
【０００３】
一方、分析結果の付加価値を上げるには、消費者の行動を深く詳細に捉える必要があるが、従来の分類の方法は深い分析を可能とするような十分な基盤を備えていない。実際、消費者やユーザの行動には、しばしば、少なくとも２つの部類が出現し、高い活動性を示すが人数割合の少ない上位グループ（上位グループ：２割）と、比較的低い活動性を示す人数割合の大きい下位グループ（下位グループ：８割）があることが古くから言及され、パレートの法則、または、２：８の法則等と呼ばれている。しかしながら、従来の分類手法は、この２つのグループを的確に掌握し特定することができていない。
【０００４】
実際、従来２つのグループの出現の把握と分類は、消費者やユーザの活動分布の分布形（非特許文献１）や成長曲線の変曲点（非特許文献２）を利用するものであり、極めて大規模なマクロデータが存在し、かつこれを注意深く分析した場合に浮かび上がるというものである。成長曲線のデータは適用領域が少なく、一般の行動データに対して適用しにくい。
【０００５】
また、消費者やユーザの活動分布を使う場合、この分布自体は、サービス毎に多様な形状を示すため、非特許文献１で取っている特定の２種類の関数へのフィッティングという方法が使える範囲が少ない。図６は、ある動画サイトにおいて、縦軸にユーザ毎の総利用回数を対数でプロットした図であり、図６（Ａ）は横軸に対数スケールを、図６（Ｂ）に通常スケールで示している。図６に示すように、上位の活動分布と下位の活動分布の間には異質性を示す特異点がデータに出現することは稀である。
【０００６】
このため、解析的性質の異なる関数が一見すると連続的に接続しているように見え、データの揺らぎや分布形の多様性もあり、異質な層の出現を結論づけることが難しかった。そのため、非特許文献１や非特許文献２の研究を承知していない論者では、２：８の法則が、異質な２つのグループに基づくということを一般的に否定する意見さえ聞かれようになっている。行動の分析の基礎が脆弱であるため、混乱を来たしており、様々な判断が誤った推測に基づいて展開され、少なからぬ経済的な損失や無駄が生じていると考えられる。
【０００７】
【非特許文献１】Zipf, G. K. 1949. Human Behaviour and the Principle of Least-Effort, Addison-Wesley, Cambridge MA. pp.484-495
【非特許文献２】S.Shimogawa and M.Shinno, 2007, Mechanism of Diffusion of Fixed-Line Broadband Access Services in Japan and its Application to Long-Term Growth Prediction, paper presented in TPRC 2007 (the 35th Research Conference on Communication, Information and Internet Policy, Arlington, VA, US). pp.1-27
【発明の開示】
【発明が解決しようとする課題】
【０００８】
従って、本発明の目的は、消費者やユーザの利用行動を分析して、その特性を抽出する際に、上位グループと下位グループという２つの質的に特性が異なるユーザグループが出現しているか否かを高精度に判定し、もし存在する場合には、各ユーザを、上位グループと下位グループに分ける技術、および各グループを特徴付ける非線型関数の作成を支援する技術を提供することを目的とする。
【課題を解決するための手段】
【０００９】
本発明は、上記目的を達成するために、次のような構成を採用する。
ａ）本発明に係るユーザ層分離検出装置は、ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出装置であって、繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を記憶する記憶手段と、ユーザが前記製品、システム、またはサービス（コンテンツや情報ページ）を利用する利用度の分布を集計する集計手段と、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出手段と、該算出手段によって得られた指標値、図表、または数値データを出力する出力手段を有することを特徴としている。
【００１０】
この構成により、消費者向けで繰り返し利用することを想定した製品、システム、またはサービスなどが、市場に提供されている状況下において、当該の製品の購入、システムの利用、またはサービなどを利用するユーザが、利用頻度の傾向の意味で、上位層に属するユーザ集団と下位層に属するユーザ集団に分離する場合に、その分離を質的な特性によって検出し、上位層グループと下位層グループの境界を特定する、ないしは分離の発生と境界の評価についての判断を支援することができる。
【００１１】
ｂ）また、上記ユーザ層分離検出装置において、一定期間の間の利用記録を備え、Ｎ人のユーザとＡ個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号ｎ（１≦ｎ≦Ｎ）を付与する手段と、各コンテンツ番号ａ（1≦ａ≦Ａ）に対して、分析用ユーザ番号ｎのユーザの番号ａのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F＝（F(n,a): １≦ｎ≦N、1≦a≦A）を集計する手段と、分析用ユーザ番号ｎ，ｍ（１≦ｎ，ｍ≦Ｎ）に対して、S(n,m)=F(n,1)F(ｍ,1)+・・・＋F(n,A)F(m,A)を要素とする対称行列S=（S(n,ｍ): １≦ｎ≦N、1≦ｍ≦N））の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出する手段と、利用回数降順の分析用ユーザ番号ｎの軸に対して、各ユーザの利用回数の番号ｎに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画する手段を有することを特徴としている。
【００１２】
ｃ）また、上記ユーザ層分離検出装置において、前記利用回数降順の分析用ユーザ番号ｎ（１≦ｎ≦Ｎ）に対して、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)としてのスカラー値またはベクトル値を算出し、利用回数降順のユーザ番号ｎの軸に対して形状情報関数h(n)を描画する手段を有することを特徴としている。これにより、形状情報関数の描画の質的な違いから、ユーザ層の違いの識別を支援することができる。
【００１３】
ｄ）上記ユーザ層分離検出装置において、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、ある正の実数ｔに対して、固有値λ(n)に重複がないｎにおいて、固有ベクトルの各要素の非負の成分と負の成分のそれぞれのｔベキの総和の絶対値の小さくない方をとり、各要素の絶対値のｔベキの総和に対する比を算出したものを含むことを特徴としている。
【００１４】
ｅ）また、上記ユーザ層分離検出装置において、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、固有値λ(n)に重複がないｎにおいて、固有ベクトルの各要素の絶対値の最大値をとり、そのｔベキの値の、各要素の絶対値のｔベキの総和に対する比を算出したものを含むことを特徴としている。
【００１５】
ｆ）上記ユーザ層分離検出装置において、利用回数降順の分析用ユーザ番号ｎの形状情報関数h(n)の質的な変化を算出する関数p(n)を備えることを特徴としている。
【００１６】
ｇ）また、上記ユーザ層分離検出装置において、前記算出手段は、前記利用回数降順の分析用ユーザ番号ｎの形状情報関数h(n)の質的な変化を検出する関数p(n)として、形状情報関数の予め決められたステップ数前後との重み付けを含む１次または高次の移動和を算出し、その変化が予め決められた閾値を超える点を、質的なユーザ層の境界の候補として算出することを特徴としている。
【００１７】
ｈ）また、上記ユーザ層分離検出装置において、前記算出手段は、質的なユーザ層ごとに、利用回数関数f(n)と固有値平方根関数g(n)を、ベキ関数、指数関数、その他の幾つかの典型的な関数族によってフィッティングし、フィッティングングパラメータとフィッティング評価値を算出することを特徴としている。
【００１８】
ｉ）本発明に係るユーザ分離検出方法は、記憶手段と集計手段と算出手段と出力手段を備えたコンピュータにより、ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出方法であって、繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を前記記憶手段に記憶する記憶ステップと、前記集計手段により、ユーザが前記製品、システム、またはサービス（コンテンツや情報ページ）を利用する利用度の分布を集計する集計ステップと、前記算出手段により、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出ステップと、前記出力手段により、前記算出ステップによって得られた指標値、図表、または数値データを出力する出力ステップを有することを特徴としている。
【００１９】
ｊ）また、上記ユーザ層分離検出方法において、前記算出ステップは、一定期間の間の利用記録を備え、Ｎ人のユーザとＡ個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号ｎ（１≦ｎ≦Ｎ）を付与する手段と、各コンテンツ番号ａ（1≦ａ≦Ａ）に対して、分析用ユーザ番号ｎのユーザの番号ａのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F＝（F(n,a): １≦ｎ≦N、1≦a≦A）を集計するステップと、分析用ユーザ番号ｎ，ｍ（１≦ｎ，ｍ≦Ｎ）に対して、S(n,m)=F(n,1)F(ｍ,1)+・・・＋F(n,A)F(m,A)を要素とする対称行列S=（S(n,ｍ): １≦ｎ≦N、1≦ｍ≦N））の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出するステップを有し、前記出力ステップは、利用回数降順の分析用ユーザ番号ｎの軸に対して、各ユーザの利用回数の番号ｎに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画するステップを有することを特徴としている。
【００２０】
ｋ）本発明に係るプログラムは、コンピュータを、請求項１から８記載のユーザ層分離検出装置における各手段として機能させるユーザ層分離検出用プログラムである。
【発明の効果】
【００２１】
本発明によれば、サービスのユーザや消費者の行動において、利用活動の上位層と下位層という基本的かつ質的な層分離が発生した場合、これを的確に検出し、かつ、その層を掌握することができる。
【００２２】
具体的に説明すると、例えば、図１に見るように、活動分布だけを利用する従来の古典的な方法の場合、層分離を明確に主張することは難しい問題である。これに対して、本発明を適用すれば、上位層と下位層の２グループの発生が明瞭になり、性質の異なる２種類の関数が連結しているとみなすことが明確になることがわかる（後述する図４、５参照）。なお、下位の部分の関数は、本願出願人が先に出願した特願２００８−１９１８８５で提案したように、サービスの定着性を測る尺度として、重要なものであり、その構造が分かることは、重要なサービスの定着性の評価をより的確なものとする。こうして、本発明によって、消費者の行動特性をより深くかつ詳しく捉えことができる。その結果、産業の革新と改善の効率化および投資の経済化が促進されるという意味において、産業上の高い効果が期待できる。
【発明を実施するための最良の形態】
【００２３】
＜発明の概要＞
以下、本発明の概要について説明する。
本発明では、次のような実験的結果を利用する。インターネットのウェブサイトのあるサービスの利用行動を詳しく分析すると、次のような結果が得られる。
【００２４】
一定期間で、サンプル抽出されたユーザN人が全体でA個のコンテンツにアクセスした結果から、非負行列をF＝（F(n,a): １≦ｎ≦N、1≦a≦A）を作成できる。ここで、F(n,a)は、番号ｎのユーザの番号aのコンテンツの利用回数である。
【００２５】
また、ユーザの番号ｎは、各ユーザｎの総利用回数f(n)の降順となっているとする。
f(n)= F(n,1)+・・・＋F(n,A)
である。
【００２６】
S(n,m)=F(n,1)F(m,1)+・・・＋F(n,A)F(m,A)、
を要素とする正方行列S=（S(n,ｍ): １≦ｎ≦N、1≦ｍ≦N）は、非負要素からなる半正定対称行列であり、全ての固有値は非負実数で、固有ベクトルからなる直交行列を用いて対角化できる。
【００２７】
固有値を大きいものから降順に番号１≦ｎ≦Nを付与してλ(n)とする。１≦ｎ≦Nに対して、関数g(n)を固有値λ(n)が正数の場合に、平方根λ(n)^1/2、固有値λ(n)が零の場合には零として定義し、固有値平方根関数と呼ぶ。
【００２８】
一般に多数のコンテンツにアクセスするサービスでは、ユーザ行動の多様性によって、正方行列はスパース（多くの非対角要素が零）となる。従って、固有値平方根関数g(n)は、行列Sの対角成分の平方根に近くなり、各ユーザのコンテンツ利用ベクトルの内積によるベクトルサイズ
f2(n)= {F(n,1)F(n,1)+・・・＋F(n,A)F(n,A)}^1/2
に近くなる。
【００２９】
これは、定性的には総利用回数f(n)より大きいが、これに近い特性のある尺度である。そのため、固有値平方根関数g(n)は、f(n)に近い特性を示す。図３は、２つの動画サイトにおいて、固有値平方根関数g(n)とf(n)をプロットした図であるが、実際、g(n)とf(n)は、大きさは異なるが、形状は良く似ていることがわかる。
【００３０】
なお、f(n)の形状は、上位グループと下位グループを特徴付ける上で重要であるが、 f(n)は、非負の整数にのみ値を取るため、利用回数の少ない領域で、値が散布しやすく、数学的関数によるフィッティングが難しい傾向にある。
【００３１】
一方、固有値は一般に実数値を取り得るため、固有値平方根関数g(n)は、より滑らかで、値が曲線を描きやすく、数学的関数によるフィッティングを実施しやすいという利点を持っている。この固有値分布と総利用回数分布の結びつきから、ユーザ層の性質に関する有用な情報が、固有値分布・固有関数分布の性質からも得られると考えられる。
【００３２】
次に、各固有値に対して固有ベクトルの形状を計算する。まず、非負行列であるため、有名なペロン-フロベニウスの理論によって、対称行列Ｓによって推移的な関係にある成分の部分行列ごとに最大固有値があり、部分行列に対応するユーザ番号ｎの要素において、その固有ベクトルは、全て真に正の値をとり、それ以外の固有ベクトルは、このベクトルと直交するため、非負の成分を併せ持つことになる。
【００３３】
推移的な関係にあるユーザ番号ｎ自体は大きいか、行列がスパースであることから、部分行列に分解する構造に近い状況にあるため、各固有ベクトルがどれだけ、全て正の要素からなるベクトルに近いか、または、遠いかが、固有ベクトルの形状を測る尺度となると考えられる。
【００３４】
そこで、固有ベクトル形状の尺度h(n)として、定符号成分比h1(n)と固有ベクトル最大絶対値成分比h2(n)の２つを計算した。定符号成分比h1(n)は、ある正の実数ｔに対して、固有ベクトルの非負の要素と負の要素それぞれのｔベキの総和を取り、絶対値の大きいほうの全体和に対する割合を量るものであり、固有ベクトルが全て正の要素からなるケースからの隔たりを測るものである。
【００３５】
一方、固有ベクトル最大絶対値成分比h2(n)は、各要素の絶対値の中で最大の値を取る固有ベクトルの集中度を測る形状尺度である。
【００３６】
固有ベクトルは各ユーザの利用回数を線型に全方位に少変化（線型摂動）させたときの、コンテンツ上の全ユーザ総和での利用ベクトルに対する内積によるベクトルサイズの小変化全体の直交成分を表し、同一コンテンツを利用することに起因する相関関係を記述する。
【００３７】
従って利用活動の背後にある構造に踏み込んだ要素である。もし、固有ベクトルを利用した尺度から質的に異なる成分が出現すれば、これには、行動の相関関係のロバスト性と同程度のロバスト性をもった、利用活動の全体における質的に異なるグループの存在を意味する。
【００３８】
図４は、解析実験の結果をプロットした図である。図４において、一つの動画サイトに対して、形状情報関数h(n)（定符号成分比h1(n)と固有ベクトル最大絶対値成分比h2(n)）をｔ=1に対して、プロットした図である。図４からわかるように、予想された通りかかる質的に異なる境界が、最上位から２割程度の位置に出現した。図４には３つの層が観測されるが、最も低強度固有値側の層は、固有値の重複によって、固有関数の任意性が生じているためであり、分析の手法の性質によって生じ本質的でないため除外される。上位から２割程度の箇所に、明らかな質的違いを示す断層的な境界が観測される。
【００３９】
この境界の観測により、上位層と下位層というグループの存在が明確になる。そこで、前半と後半に分けて、前半は原点近くに特異点を持つベキに近い関数、後半は指数関数に従うという主張が妥当であることがわかる。図５は、図６の総利用回数関数f(n) を、境界の前後で関数フィッティングを施した図であり、縦軸は対数スケールであり、横軸は図５（Ａ）が対数スケール、図５（Ｂ）が通常スケールである。直線による部分適合であり、それぞれ、ベキ関数（同図（Ａ））、指数関数（同図（Ｂ））になっている。図には点の上に直線が上書きしてあり、この直線部分が下位のユーザで、これより上位が上位ユーザに対応している。ただし、固有値とユーザの対応は、大まかな傾向であるため、当該の境界の正確な位置を決めるわけではない。
【００４０】
一方、形状情報関数h(n)による断層がなければ、このような異質な解析的関数が接続するという主張は難しい。なお、下位グループの部分の関数としての特性は、本願出願人が先に出願した特願２００８−１９１８８５で提案したように、消費者向けで繰り返し利用することを想定した製品、システム、またはサービスなどの定着性を測る尺度に関するもので、その構造が分かることは、重要なサービスの定着性を評価する尺度の計算を容易にする有益性の高いものである。特願２００８−１９１８８５では、製品の購入、システムの利用、またはサービなどを多くの人が継続していくという意味での定着性の傾向を掌握する的確な尺度を構成する定着性評価支援装置を提供するために、ユーザの全員または一部のユーザの利用記録を記憶し、定着傾向を解析し、活動量ユーザ分布を分析し、低活動ユーザ活動特性を算出し、活動量コンテンツ分布を解析し、描画図面を生成して表示するようにしている。
【００４１】
そこで本発明は、上記〔発明が解決しようとする課題〕の項に示した課題を下記の各手段（１）〜（６）によって解決するものである。
（１）消費者向けで繰り返し利用することを想定した製品、またはシステム、またはサービスなどが、市場に提供されている状況下において、当該サービス等に関する全員もしくは一部のユーザの一定期間の間の利用記録を記憶する記憶手段（後述のユーザ毎総利用回数集計部２１２参照）。
【００４２】
例えば、着目するウェブサイトの各コンテンツと、各ユーザにそれぞれ認識番号が付与され、ある一月に各ユーザが各コンテンツをアクセスした回数として、利用記録をアクセスした数を活動量として、これを半年にわたって記録したデータを記憶装置に格納する。
【００４３】
（２）N人のユーザとA個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号ｎ、１≦ｎ≦N、を付与する手段（後述の分析用ユーザ番号付与部２１３参照）と、各コンテンツ番号a、１≦ａ≦Ａに対して、分析用ユーザ番号ｎのユーザのコンテンツ番号ａのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F＝（F(n,a): １≦ｎ≦N、1≦a≦A）を集計する手段（後述の基本行列作成部２１４参照）。
【００４４】
例えば、各ユーザの認識番号ｋごとに各コンテンツaの利用回数をaについて総和しv(k)とし、その結果の降順から、ユーザの認識番号に降順の分析用番号ｎを付与する。コンテンツに対しては認識番号を、そのまま分析用番号aとして利用する。これから、分析番号の組(n,a)に対して、記録したデータから、分析用番号ｎ番のユーザの番号aのコンテンツの利用回数を集計し F(n,a)として格納する。
【００４５】
（３）分析用ユーザ番号ｎ，ｍ（１≦ｎ, ｍ≦N）に対して、 S(n,m)=F(n,1)F(m,1)+・・・＋F(n,A)F(m,A)、を要素とする対称行列S=（S(n,ｍ): １≦ｎ≦N、1≦ｍ≦N））の各固有値を、非負実数である各固有値の大きさの降順に番号を付与し固有値λ(n)として算出し、利用回数降順のユーザ番号ｎの軸に対して、固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数値g(n)を算出する手段、および、各分析用ユーザ番号ｎに対して、ユーザのコンテンツ総利用回数の関数値f(n)を算出する手段（後述の対称行列作成部２１５、対角化算出部２１６、基本関数作成部２１７参照）。
【００４６】
例えば、ユーザ番号、ｎ,ｍ毎に、各コンテンツ番号aを１番から最終の番号A番まで、呼び出して、
S(n,m)=F(n,1)F(m,1)+・・・＋F(n,A)F(m,A)
として総和して、対称行列 S(n,m)を計算し、対称行列S=(S(n,m))の各固有値と固有関数を算出するプログラムを呼び出し、その出力を格納する。
【００４７】
次に、各固有値に降順の順位を付与する。これから、平方根関数の各ユーザ番号ｎに対する値g(n)として、分析用ユーザ番号ｎに対して、降順の番号付けによる固有値の値λ(n)が、正の場合はλ(n)の平方根の値を、零の場合は零を返す。また、降順の分析用ユーザ番号ｎとデータ上の認識番号ｋの関係を利用して、分析用ユーザ番号ｎに対して、各ユーザのデータ上の認識番号ｋごとに各コンテンツaの利用回数をaについて総和したv(k)を対応させ、分析用ユーザ番号ｎについてのコンテンツ総利用回数f(n)を返す。
【００４８】
（４）利用回数降順の分析用ユーザ番号ｎ、1≦ｎ≦N、に対して、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、固有値λ(n)に重複がない場合において、正の実数ｔに対して、固有ベクトルの各要素の正の成分のｔベキの総和と負の成分の絶対値のｔベキの総和の小さくない方をとり、各要素の絶対値のｔベキの総和に対する比を算出する手段、および、固有ベクトルの形状情報関数h(n)の要素として、固有ベクトルの各要素の絶対値の最大値をとり、そのｔベキ値と、各要素の絶対値のｔベキの総和に対する比を算出する手段、および、固有ベクトルの形状情報関数h(n) をユーザ番号ｎの関数として描画する手段（後述の固有ベクトル形状情報作成部２１８参照）。
【００４９】
例えば、まず、対称行列の対角化プログラムによって、返される各固有値と固有ベクトルを対のテーブルによって、管理する。次に、各固有値を降順で順序づけたλ(n)について、その値を隣接する番号で比較して、各固有値に重複度を付与する。重複度が２以上の場合は、形状情報関数h(n)として、空欄を示す特定のコードとする。重複度が１の場合は、正の実数ｔに対して、固有ベクトルの各要素について、要素の値が非負の要素のｔベキの総和e1(n)と、負の要素の絶対値のｔベキの総和値e2(n)と、絶対値が最大となる要素のｔベキの値e3(n)を取り出す。これから、e1(n)とe2(n)の小さくない方をe4(n)とし、形状情報関数h(n)をベクトル値
h(n)=(e4(n)/(e1(n)+e2(n)), e3(n)/(e1(n)+e2(n))
として返す。形状情報関数h(n)として、常に上記の如きベクトル値を採用するのではなく、例えば、スカラー値 h(n)=(e4(n)/(e1(n)+e2(n))として返してもよい。
【００５０】
（５）利用回数降順のユーザ番号ｎの形状情報関数h(n)の質的な変化を検出する関数p(n)として、形状情報関数の予め決められたステップ数前後との重み付けを含む一次または高次の移動和を算出し、その変化が予め決められた閾値を超える点を、質的なユーザ層の境界の候補として算出する手段（後述の層分離判定関数生成部２１９、層分離判定関数適用部２２０、層分離分析支援処理部２２１参照）。
【００５１】
例えば、ｗをあまり大きくない自然数とし、原点に平均を持つ予め指定された分散σを持つガウス分布を整数区間上で積分して得られる、有界整数区間
W= {-w, -w+1,・・・, -1, 0, 1, ・・・, w-1, w}
の上の確率分布u(i), jはWの要素、を用いて、例えばh(n)がスカラーである場合、p(n)をh(n)のある正数ｄのベキ乗 h(n)^dとu(j)の畳み込み、即ち、
p(n)=Σ_-w≦j≦w h(n-j)^du(j)
とし、ある閾値ｃ<1 を設定して、区間 [p(n-1),p(n)]または[p(n), p(n-1)]がｃを含むｎを境界候補の検出として算出する。
【００５２】
この時、閾値ｃを区間(1/2, 1)の間の予め決められた刻みｚに従って、１に近いｃから次第に1/2へ移動させて、境界値の検出数を閾値ｃに対して描画することで、検出数が安定するｃの領域が図示できる。
【００５３】
（６）質的異なるユーザ層ごとに、利用回数関数f(n)と固有値平方根関数g(n)を、ベキ関数、指数関数、その他の幾つかの典型的な関数族によってフィッティングし、その結果を図示し、また、フィッティングングパラメータとフィッティング評価値を算出する手段（後述の層別フィッティング部２２２参照）。
【００５４】
例えば、形状情報関数h(n)や形状情報関数の質的な変化を検出する関数p(n)の描画や境界候補値の算出値の提示に引きつづき、操作者の操作を受け付けて、上位グループと下位グループの境界となる番号ｎ0を入力情報として受け付け、U={1≦ｎ≦ｎ0-1}, D={ｎ0≦ｎ≦N}として、上位層と下位層に分ける。
【００５５】
次に、UとDそれぞれで、ベキ関数1/ｎ^q、q>0、指数関数 exp(-rn)の定数倍および定数和等を含む減少関数からなる典型的な関数（モデル関数）によって、利用回数関数f(n)と固有値平方根関数g(n)にパラメータフィッティングを施し、それぞれの結果を描画し、パラメータ値を出力する。
【００５６】
＜作用＞
本発明では、消費者向けで繰り返し利用することを想定した製品、またはシステム、またはサービスなどが、市場に提供されている状況下において、消費者の利用行動を分析して、その特性を抽出する際に、上記＜発明の概要＞に記載の手段を用いて、利用活動における上位グループと下位グループという２つの質的に異なるユーザグループが存在しているか否かを高精度に判定（検出）し、存在している場合には、各ユーザを、上位グループと下位グループに分けることができ、また、各グループを特徴付ける非線型関数の作成を支援することができる。
【００５７】
＜実施例＞
以下、本発明の実施例を具体的に説明する。
上述したように、インターネットのウェブサイト等で提供されるコンテンツベースのサービスや電子商取引のサービス等において、ユーザの利用行動を分析して、その特性を抽出することは、サービスの今後の展開戦略や、プラットフォーム・コンテンツの改善、必要資源の調達などを実施する上での基盤となる重要な業務である。
【００５８】
そこで、このようなサービスのユーザの利用活動の記録がデータとして収集され、当該データを用いてユーザの利用行動を分析する場合に、上位グループと下位グループという２つの質的に異なるユーザグループが出現しているか否かを高精度に判定し、存在する場合には、各ユーザを、上位グループ、下位グループに分ける方法を提供し、かつ、各グループを特徴付ける非線型関数とそのパラメータを算出することができる装置を構成する実施例を以下に記す。
【００５９】
なお、本実施例では、ウェブサイトのコンテンツサービスの場合に記載するが、他のサービスへの適用を除外するものではない。本実施例では、着目する幾つかのウェブサイトについて、一部または全部のユーザの利用記録が継続的に収集されているものとする。サービス利用活動データは、各々のユーザがウェブサイトの各コンテンツをどのような頻度でアクセスしているかが分かるものであり、例えば、ユーザを識別する番号、ウェブサイトのコンテンツを識別する記号からなるものとする。
【００６０】
図１は、本発明に係るユーザ層分離検出システム構成例を示す図、図２は、本発明に係る各構成部により行われる処理フローを示す図である。以下、これらの図面を用いて本発明に係るユーザ層分離検出システムを説明する。
【００６１】
本発明に係るユーザ層分離検出システムは、図１に示すように、ユーザインタフェース１００，本体処理部２００，サービス利用活動データ記憶部３００，および出力保存部４００から構成される。
【００６２】
以下、図１を用いて各構成部の機能について説明する（（ステップＳ・・）という記載は、図２における対応する処理ステップを示している）。
ユーザインタフェース１００は、本ユーザ層分離検出システムの利用者がシステムを制御して目標の解析を実行するための命令を受理し、中央制御部２０２に転送する機能を有する。
【００６３】
本体処理部２００は、本発明に係るユーザ層分離検出処理を行うための主要部であり、コンピュータにより実現される。
サービス利用活動データ記憶部３００は、外部からサービス利用活動データを入力し、格納する機能を有する。
出力保存部４００は、ユーザインタフェース１００からの指示により、主記憶ユーザインタフェース、図面などをファイルとして保存する機能を有する。
【００６４】
本体処理部２００は、ユーザインタフェース処理部２０１、中央制御部２０２、主記憶２０３、デフォルト設定部２１１、ユーザ毎総利用回数集計部２１２、分析用ユーザ番号付与部２１３、基本行列作成部２１４、対称行列作成部２１５、対角化算出部２１６、基本関数作成部２１７、固有ベクトル形状情報作成部２１８、層分離判定関数生成部２１９、層分離判定関数適用部２２０、層分離分析支援処理部２２１、層別フィッティング部２２２、描画図面生成部２２３、表示制御部２２４を有する。本体処理部２００を構成する上記各部（各手段）は、コンピュータのＣＰＵによりこれら各部（手段）に対応するプログラムを実行することによって実現される。
【００６５】
デフォルト設定部２１１は、各部の様々なパラメータや指定要求に対するデフォルトを設定する機能を提供し、デフォルトの設定要求表を表示、入力、ファイル保存の機能を実行する（ステップＳ２１１）。
【００６６】
ユーザ毎総利用回数集計部２１２は、各ユーザ識別番号ｋに対して、全てのコンテンツ識別番号ａに対して利用回数の総和v(k)を集計し、ユーザ識別番号に対する配列(v(k))として、主記憶２０３に格納する（ステップＳ２１２）。
【００６７】
分析用ユーザ番号付与部２１３は、v(k)の値を降順にする番号付けｎを算出し、ｎに対してｋを呼び出す分析用ユーザ番号付け関数(k(n))の配列を作成して、主記憶２０３に格納する（ステップＳ２１３）。
【００６８】
基本行列作成部２１４は、分析用ユーザ番号ｎとコンテンツ識別番号に対する利用回数F(n,a)をk(n)とコンテンツ識別番号ａを元に記録データを呼び出して集計し、(n,a)に対するに2次元配列(F(n,a))を作成して、主記録２０４に格納する（ステップＳ２１４）。
【００６９】
対称行列作成部２１５は、分析用ユーザ番号ｎ,ｍに対する行列要素Ｓ(n,m)を、
S(n,m)=F(n,1)F(m,1)+・・・＋F(n,A)F(m,A)
によって算出し、(n,m)に対する２次元配列 (S(n,m)) を作成する（ステップＳ２１５）。
【００７０】
対角化算出部２１６は、対称行列 S=(S(n,m))の固有値、重複度、固有ベクトル求めて、固有値の降順に並べ替え、順位ｎに対して、固有値λ(n)を対応させる配列 (λ(n))と重複度ｍl(n)を対応させる配列(ｍl(n))と、固有ベクトルev(n)を対応させる配列(ev(n))作成し、主記憶２０３に格納する（ステップＳ２１６）。
【００７１】
基本関数作成部２１７は、分析用ユーザ番号ｎに対するユーザｎの総利用回数f(n)、降順第ｎ位の固有値の平方根g(n) を、上記＜発明の概要＞（３）に示した手順によって算出し、それぞれ配列(f(n)), (g(n))を作成して主記憶２０３に格納する（ステップＳ２１７）。
【００７２】
固有ベクトル形状情報作成部２１８は、正実数ｔに対して、各順位ｎに対して、固有ベクトルev(n)の形状情報関数
h(n)=(e4(n)/(e1(n)+e2(n)), e3(n)/(e1(n)+e2(n))
を作成し、(n,2)配列(h(n))を作成して主記憶に転送する（ステップＳ２１８）。形状情報関数として上記の如きベクトル値を採用するのではなく、例えばスカラー値
h(n)=(e4(n)/(e1(n)+e2(n))を採用してもよい。
【００７３】
層分離判定関数生成部２１９は、上記＜発明の概要＞（５）に示した方法によって作成されるｎに対する関数
p(n)=Σ_-w≦j≦w h(n-j)^du(j)
を作成し、配列(p(n)) を主記憶に格納する（ステップＳ２１９）。
【００７４】
層分離判定関数適用部２２０は、閾値ｃを移動させつつ、上記（５）の手順によって、各閾値ｃに対する検出数を算出し、得られた検出数の閾値ｃに対する関数のグラフと、検出数５以下の閾値ｃに対する、境界候補値ｎを算出して、(c,n)の点によるグラフを作成し、主記憶２０３に格納する（ステップＳ２２０）。
【００７５】
層分離分析支援処理部２２１は、ユーザインタフェース１００からの要求に従って、ユーザ利用回数関数f(n)、固有値平均値関数g(n), 固有関数形状情報関数h(n)の各要素成分、検出数関数グラフ、境界候補値グラフを呼び出して、描画図面生成部２２３を用いて描画図面を作成し、表示制御部２２４により表示する。また、ユーザインタフェース１００からの要求に従って、描画結果を基に操作者が、層分離の存在最終判定のYES-NOフラグと、層分離境界値ｎ0を決定する（ステップＳ２２１）。
【００７６】
層別フィッティング部２２２は、層分離境界値ｎ0から、上記（６）の手順によって、利用回数関数f(n)と固有値平方根関数g(n)にパラメータフィッティングを施しで、その結果のグラフを描画し、パラメータ値と共に主記憶２０３に格納し、画面に表示する（ステップＳ２２２）。
【００７７】
描画図面生成部２２３は、要求を受けて主記憶２０３への格納状態を走査し、作成可能な図画・図表のリストを表示し、指定を受けて、図面作成用の各データを呼び出し、グラフ、点集合等の図面タイプに応じてグラフィックデータを作成し、図面記憶領域に格納する（ステップＳ２２３）。
【００７８】
表示制御部２２４は、要求を受けて図面記憶領域を操作し、表示可能な図画・図表のリストを表示し、指定を受けて、各図面を表示する（ステップＳ２２４）。
【００７９】
上述したように、本体処理部２００を構成する上記各部（各手段）の機能を達成するために、コンピュータのＣＰＵにより上記各部（手段）に対応するプログラムが実行される。上記各部（手段）に対応するプログラムはＦＤ，ＣＤ−ＲＯＭ，ＤＶＤなどのコンピュータ読取り可能な記録媒体やインターネットなどのネットワークを介してユーザに提供することができることはいうまでもない。
【図面の簡単な説明】
【００８０】
【図１】本発明実施例における、システム構成例を表す図である。
【図２】本発明実施例における、処理フローを表す図である。
【図３】２つの動画サイト（図中（イ）および（ロ））において、固有値平方根関数g(n)とf(n)をプロットした図である。
【図４】動画サイト（ロ）に対して、固有関数形状情報関数h(n)（定符号成分比h1(n)と固有ベクトル最大絶対値成分比h2(n)）をｔ=1に対して、プロットした図である。
【図５】図６の総利用回数関数f(n) を、境界の前後で関数フィッティングを施した図である。
【図６】ある動画サイト（図３、図４の（ロ）に対応する）において、ユーザ毎の総利用回数f(n)をプロットした図である。
【符号の説明】
【００８１】
１００：ユーザインタフェース
２００：本体処理部
２０１：ユーザインタフェース処理部
２０２：中央制御部
２０３：主記憶
２１１：デフォルト設定部
２１２：ユーザ毎総利用回数集計部
２１３：分析用ユーザ番号付与部
２１４：基本行列作成部
２１５：対称行列作成部
２１６：対角化算出部
２１７：基本関数作成部
２１８：固有ベクトル形状情報作成部
２１９：層分離判定関数生成部
２２０：層分離判定関数適用部
２２１：層分離分析支援処理部
２２２：層別フィッティング部
２２３：描画図面生成部
２２４：表示制御部
３００：サービス利用活動データ記憶部
４００：出力保存部

【特許請求の範囲】
【請求項１】
ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出装置であって、
繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を記憶する記憶手段と、ユーザが前記製品、システム、またはサービスを利用する利用度の分布を集計する集計手段と、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出手段と、該算出手段によって得られた指標値、図表、または数値データを出力する出力手段とを有することを特徴とするユーザ層分離検出装置。
【請求項２】
請求項１に記載のユーザ層分離検出装置において、
一定期間の間の利用記録を備え、Ｎ人のユーザとＡ個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号ｎ（１≦ｎ≦Ｎ）を付与する手段と、各コンテンツ番号ａ（1≦ａ≦Ａ）に対して、分析用ユーザ番号ｎのユーザの番号ａのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F＝（F(n,a): １≦ｎ≦N、1≦a≦A）を集計する手段と、分析用ユーザ番号ｎ，ｍ（１≦ｎ，ｍ≦Ｎ）に対して、S(n,m)=F(n,1)F(ｍ,1)+・・・＋F(n,A)F(m,A)を要素とする対称行列S=（S(n,ｍ): １≦ｎ≦N、1≦ｍ≦N））の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出する手段と、利用回数降順の分析用ユーザ番号ｎの軸に対して、各ユーザの利用回数の番号ｎに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画する手段を有することを特徴とするユーザ層分離検出装置。
【請求項３】
請求項２に記載のユーザ層分離検出装置において、
前記利用回数降順の分析用ユーザ番号ｎ（１≦ｎ≦Ｎ）に対して、対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)としてのスカラー値またはベクトル値を算出し、利用回数降順のユーザ番号ｎの軸に対して形状情報関数h(n)を描画する手段を有することを特徴とするユーザ層分離検出装置。
【請求項４】
請求項３に記載のユーザ層分離検出装置において、
対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、ある正の実数ｔに対して、固有値λ(n)に重複がないｎにおいて、固有ベクトルの各要素の非負の成分と負の成分のそれぞれのｔベキの総和の絶対値の小さくない方をとり、各要素の絶対値のｔベキの総和に対する比を算出したものを含むことを特徴とするユーザ層分離検出装置。
【請求項５】
請求項３に記載のユーザ層分離検出装置において、
対称行列Sの固有値λ(n)に付随する固有ベクトルの形状情報関数h(n)の要素として、固有値λ(n)に重複がないｎにおいて、固有ベクトルの各要素の絶対値の最大値をとり、そのｔベキの値の、各要素の絶対値のｔベキの総和に対する比を算出したものを含むことを特徴とするユーザ層分離検出装置。
【請求項６】
請求項３に記載のユーザ層分離検出装置において、
利用回数降順の分析用ユーザ番号ｎの形状情報関数h(n)の質的な変化を算出する関数p(n)を備えることを特徴とするユーザ層分離検出装置。
【請求項７】
請求項６に記載のユーザ層分離検出装置において、
前記算出手段は、前記利用回数降順の分析用ユーザ番号ｎの形状情報関数h(n)の質的な変化を検出する関数p(n)として、形状情報関数の予め決められたステップ数前後との重み付けを含む１次または高次の移動和を算出し、その変化が予め決められた閾値を超える点を、質的なユーザ層の境界の候補として算出することを特徴とするユーザ層分離検出装置。
【請求項８】
請求項３に記載のユーザ層分離検出装置において、
前記算出手段は、質的なユーザ層ごとに、利用回数関数f(n)と固有値平方根関数g(n)を、ベキ関数、指数関数、その他の幾つかの典型的な関数族によってフィッティングし、フィッティングングパラメータとフィッティング評価値を算出することを特徴とするユーザ分離検出装置。
【請求項９】
記憶手段と集計手段と算出手段と出力手段を備えたコンピュータにより、ユーザ層を質的もしくは構造的な特徴により分離するユーザ層分離検出方法であって、
繰り返し利用することが想定され市場に提供された製品、システム、またはサービスに関する全員もしくは一部のユーザの利用記録を前記記憶手段に記憶する記憶ステップと、前記集計手段により、ユーザが前記製品、システム、またはサービスを利用する利用度の分布を集計する集計ステップと、前記算出手段により、各ユーザの利用行動の相互関係の質的もしくは構造的特徴に関する指標値、図表、または数値データを算出する算出ステップと、前記出力手段により、前記算出ステップによって得られた指標値、図表、または数値データを出力する出力ステップを有することを特徴とするユーザ層分離検出方法。
【請求項１０】
請求項９に記載のユーザ層分離検出方法において、
前記算出ステップは、一定期間の間の利用記録を備え、Ｎ人のユーザとＡ個のコンテンツに対して、各ユーザの当該期間の総利用回数の降順に各ユーザに分析用ユーザ番号ｎ（１≦ｎ≦Ｎ）を付与する手段と、各コンテンツ番号ａ（1≦ａ≦Ａ）に対して、分析用ユーザ番号ｎのユーザの番号ａのコンテンツの利用回数F(n,a)からなる整数係数の非負行列F＝（F(n,a): １≦ｎ≦N、1≦a≦A）を集計するステップと、分析用ユーザ番号ｎ，ｍ（１≦ｎ，ｍ≦Ｎ）に対して、S(n,m)=F(n,1)F(ｍ,1)+・・・＋F(n,A)F(m,A)を要素とする対称行列S=（S(n,ｍ): １≦ｎ≦N、1≦ｍ≦N））の各固有値を、非負実数である各固有値の大きさの降順に番号を付与しλ(n)として算出するステップを有し、
前記出力ステップは、利用回数降順の分析用ユーザ番号ｎの軸に対して、各ユーザの利用回数の番号ｎに対する関数f(n)と固有値λ(n)の平方根またはλ(n)が零である場合には零を対応させる固有値平方根関数g(n)を、各軸にて、対数軸、および通常軸にて描画するステップを有することを特徴とするユーザ層分離検出方法。
【請求項１１】
コンピュータを、請求項１から８記載のユーザ層分離検出装置における各手段として機能させるためのユーザ層分離検出用プログラム。

【図１】