匿名データ生成装置、匿名データの生成方法およびプログラム
【課題】データの匿名化に関し、ユーザの行動履歴のような複数の属性とその依存関係(あるいは順序性)を有するようなデータに対しても適用可能な匿名データ生成装置、匿名データの生成方法およびプログラムを提供する。
【解決手段】グラフ作成部が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ部が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理部が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。
【解決手段】グラフ作成部が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ部が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理部が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの行動履歴を匿名化するための匿名データ生成装置、匿名データの生成方法およびプログラムに関し、特に、ユーザの行動履歴のような複数の属性とその依存関係(あるいは順序性)を有するようなデータに対しても適用可能な匿名データ生成装置、匿名データの生成方法およびプログラムに関する。
【背景技術】
【0002】
従来、データを公開する場合や解析に使う場合において、データの所有者のプライバシを保護するため、データの変形を行う必要がある。そこで、従来方式では、K−匿名性などの定義に基づいてデータを変形してデータ所有者を特定できない匿名データを出力する手法が提案されていた(例えば、非特許文献1参照。)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】B.Fung and K.Wang and P.Yu, “Top−down specialization for information and privacy preservation“ Proc of ICDE 2005 pp.205−216
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来の技術では、ある種の一般的なデータの匿名化は可能であったが、ユーザの行動履歴のような複数の属性とその依存関係(あるいは順序性)を有するようなデータに対しては、その技術をそのまま適用できないという問題があった。
【0005】
そこで、本発明は、上述の課題に鑑みてなされたものであり、データの匿名化に関し、ユーザの行動履歴のような複数の属性とその依存関係(あるいは順序性)を有するようなデータに対しても適用可能な匿名データ生成装置、匿名データの生成方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0007】
(1)本発明は、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成するグラフ作成手段(例えば、図1のグラフ作成部110に相当)と、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形するグラフマージ手段(例えば、図1のグラフマージ部120に相当)と、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する削除処理手段(例えば、図1の削除処理部130に相当)と、を備えたことを特徴とする匿名データ生成装置を提案している。
【0008】
この発明によれば、グラフ作成手段は、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する。グラフマージ手段は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。削除処理手段は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。つまり、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形し、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除するため、特定の人物の行動履歴を抽出することができない。
【0009】
(2)本発明は、(1)の匿名データ生成装置について、前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする匿名データ生成装置を提案している。
【0010】
この発明によれば、グラフが、各ノード間を行動履歴に対応した矢印で結合する有向グラフである。すなわち、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。
【0011】
(3)本発明は、(2)の匿名データ生成装置について、前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除することを特徴とする匿名データ生成装置を提案している。
【0012】
この発明によれば、削除処理手段は、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。したがって、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができない。
【0013】
(4)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップ(例えば、図5のステップS101に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図5のステップS102に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図5のステップS103に相当)と、を備えたことを特徴とする匿名データの生成方法を提案している。
【0014】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。したがって、特定の人物の行動履歴を抽出することができない。
【0015】
(5)本発明は、(4)の匿名データの生成方法について、前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする匿名データの生成方法を提案している。
【0016】
この発明によれば、グラフが、各ノード間を行動履歴に対応した矢印で結合する有向グラフである。すなわち、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。
【0017】
(6)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップ(例えば、図11のステップS201に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図11のステップS202に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図11のステップS203に相当)と、前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップ(例えば、図11のステップS204に相当)と、を備えることを特徴とする匿名データの生成方法を提案している。
【0018】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除し、さらに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。したがって、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができない。
【0019】
(7)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップ(例えば、図5のステップS101に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図5のステップS102に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図5のステップS103に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0020】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。したがって、特定の人物の行動履歴を抽出することができない。
【0021】
(8)本発明は、(7)のプログラムについて、前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とするプログラムを提案している。
【0022】
この発明によれば、グラフが、各ノード間を行動履歴に対応した矢印で結合する有向グラフである。すなわち、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。
【0023】
(9)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップ(例えば、図11のステップS201に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図11のステップS202に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図11のステップS203に相当)と、前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップ(例えば、図11のステップS204に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0024】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除し、さらに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。したがって、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができない。
【発明の効果】
【0025】
本発明によれば、ユーザの行動履歴を匿名化することができ、様々な解析や動向調査に使用することができるという効果がある。したがって、例えば、各ユーザのプライバシを保ったまま、購買履歴を解析しマーケットリサーチを行うといったようなサービスを構築することができるという効果がある。
【図面の簡単な説明】
【0026】
【図1】本発明の第1の実施形態に係る匿名データ生成装置の構成を示す図である。
【図2】本発明の第1の実施形態に係るグラフの作成を例示した図である。
【図3】本発明の第1の実施形態に係るグラフのマージを例示した図である。
【図4】本発明の第1の実施形態に係るマージしたグラフから所定の要件を満たすノードを削除した場合を例示した図である。
【図5】本発明の第1の実施形態に係る匿名データ生成装置の処理を示す図である。
【図6】本発明の第2の実施形態に係る匿名データ生成装置の構成を示す図である。
【図7】本発明の第2の実施形態に係るグラフの作成を例示した図である。
【図8】本発明の第2の実施形態に係るグラフのマージを例示した図である。
【図9】本発明の第2の実施形態に係るマージしたグラフから所定の要件を満たすノードを削除した場合を例示した図である。
【図10】本発明の第2の実施形態に係るマージしたグラフから所定の要件を満たすノードを削除した場合を例示した図である。
【図11】本発明の第2の実施形態に係る匿名データ生成装置の処理を示す図である。
【発明を実施するための形態】
【0027】
以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0028】
<第1の実施形態>
図1から図5を用いて、本実施形態に係る匿名データ生成装置について説明する。
【0029】
<匿名データ生成装置の構成>
本実施形態に係る匿名データ生成装置は、図1に示すように、グラフ作成部110と、グラフマージ部120と、削除処理部130とから構成されている。
【0030】
ここで、グラフ作成部110は、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する。具体的に、図2を用いて説明すると、ユーザA(図中、(A)参照)は、自宅からコンビニ、駅A、駅Bをたどって学校に行った履歴が、自宅、コンビニ、駅A、駅B、学校という各ノードを矢印で結んだ有向グラフで示されている。一方、ユーザB(図中、(B)参照)は、自宅から駅A、駅B、デパートをたどって駅Cに行った履歴が、自宅、駅A、駅B、デパート、駅Cという各ノードを矢印で結んだ有向グラフで示されている。ここで、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。なお、本実施形態では、有向グラフとして矢印を用いる例を示したが、これに限らず、例えば、点線を右向きの矢印、一点鎖線を左向きの矢印というように、予めルール化して、このような結線を用いてもよい。また、各ノードの名称についても、予めルール化した記号等で表してもよい。
【0031】
グラフマージ部120は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。具体的に、図2および図3を用いて説明すると、図2のユーザAの行動履歴を示すグラフとユーザBの行動履歴を示すグラフとでは、ノードとして、「自宅」、「駅A」、「駅B」が共通する。グラフマージ部120は、この共通ノードを抽出し、重ね合わせ処理を行うことにより、図2に示す2つのグラフを図3に示すような1つのグラフに変形する。
【0032】
削除処理部130は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除する。具体的に、K=2とした場合の図3および図4を用いて説明すると、ノード「デパート」は、2個以上の分岐がなく、下流ノード「駅C」が2個以上の分岐を持たないため、図3からノード「駅C」とノード「デパート」からノード「駅C」への矢印が削除される。なお、ノード「学校」のように、分岐をもたないノードは、この処理から除外される。これにより、特定の人物の行動履歴を抽出することができなくなる。
【0033】
<匿名データ生成装置の処理>
図5を用いて、本実施形態に係る匿名データ生成装置の処理について説明する。
まず、グラフ作成部110が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する(ステップS101)。グラフマージ部120は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する(ステップS102)。そして、削除処理部130は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除する(ステップS103)。
【0034】
以上、説明したように、本実施形態によれば、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形し、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除するため、特定の人物の行動履歴を抽出することができない。
【0035】
<第2の実施形態>
図6から図11を用いて、本実施形態に係る匿名データ生成装置について説明する。
第1の実施形態においては、特定の人物の行動履歴を抽出することは不可能となるが、複数ユーザの行動履歴を集計した全体の傾向をつかむことはできるという問題がある。この問題を解決するためには、より高度な匿名化が必要である。ここで、高度な匿名化とは、利用者がある行動を取っていたと判明したとき、それ以降の行動履歴の一部分でもK以下に絞り込まれるケースをいう。本実施形態では、これを実現する匿名データ生成装置を構築する。
【0036】
<匿名データ生成装置の構成>
本実施形態に係る匿名データ生成装置は、図6に示すように、グラフ作成部110と、グラフマージ部120と、削除処理部230とから構成されている。なお、第1の実施形態と同様の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は、省略する。
【0037】
削除処理部230は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除するとともに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。
【0038】
<匿名データ生成装置の処理>
図11を用いて、本実施形態に係る匿名データ生成装置の処理について説明する。
まず、グラフ作成部110が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する(ステップS201)。具体的に、図7を用いて説明すると、ユーザA(図中、(A)参照)は、自宅からコンビニ、駅A、駅Bをたどって学校に行った履歴が、自宅、コンビニ、駅A、駅B、学校という各ノードを矢印で結んだ有向グラフで示されている。一方、ユーザB(図中、(B)参照)は、自宅から駅A、駅B、デパートをたどって駅Cに行った履歴が、自宅、駅A、駅B、デパート、駅Cという各ノードを矢印で結んだ有向グラフで示されている。ここで、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。なお、本実施形態では、有向グラフとして矢印を用いる例を示したが、これに限らず、例えば、点線を右向きの矢印、一点鎖線を左向きの矢印というように、予めルール化して、このような結線を用いてもよい。また、各ノードの名称についても、予めルール化した記号等で表してもよい。
【0039】
グラフマージ部120は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する(ステップS202)。具体的に、図7および図8を用いて説明すると、図7のユーザAの行動履歴を示すグラフとユーザBの行動履歴を示すグラフとでは、ノードとして、「自宅」、「駅A」、「駅B」が共通する。グラフマージ部120は、この共通ノードを抽出し、重ね合わせ処理を行うことにより、図7に示す2つのグラフを図3に示すような1つのグラフに変形する。
【0040】
そして、削除処理部230は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除し(ステップS203)、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する(ステップS204)。具体的に、K=2とした場合の図8および図9を用いて説明すると、ノード「デパート」は、2個以上の分岐がなく、下流ノード「駅C」が2個以上の分岐を持たないため、図8からノード「駅C」とノード「デパート」からノード「駅C」への矢印が削除される。なお、ノード「学校」のように、分岐をもたないノードは、この処理から除外される。これにより、特定の人物の行動履歴を抽出することができなくなる。
【0041】
しかしながら、上記までの処理では、複数ユーザの行動履歴を集計した全体の傾向をつかむことはできるという問題がある。この問題を解決するためには、より高度な匿名化が必要である。そこで、図10に示すように、分岐を持たないノード(図9のノード「学校」、「デパート」)を除き、2個以上への分岐を持たないすべてのノード(図9のノード「駅A」、ノード「駅B」)について矢印すべてを削除する。
【0042】
以上、説明したように、本実施形態によれば、さらに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除することにより、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができないことを担保することができる。
【0043】
なお、匿名データ生成装置の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを匿名データ生成装置に読み込ませ、実行することによって本発明の匿名データ生成装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
【0044】
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されても良い。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0045】
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0046】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0047】
110;グラフ作成部
120;グラフマージ部
130;削除処理部
230;削除処理部
【技術分野】
【0001】
本発明は、ユーザの行動履歴を匿名化するための匿名データ生成装置、匿名データの生成方法およびプログラムに関し、特に、ユーザの行動履歴のような複数の属性とその依存関係(あるいは順序性)を有するようなデータに対しても適用可能な匿名データ生成装置、匿名データの生成方法およびプログラムに関する。
【背景技術】
【0002】
従来、データを公開する場合や解析に使う場合において、データの所有者のプライバシを保護するため、データの変形を行う必要がある。そこで、従来方式では、K−匿名性などの定義に基づいてデータを変形してデータ所有者を特定できない匿名データを出力する手法が提案されていた(例えば、非特許文献1参照。)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】B.Fung and K.Wang and P.Yu, “Top−down specialization for information and privacy preservation“ Proc of ICDE 2005 pp.205−216
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来の技術では、ある種の一般的なデータの匿名化は可能であったが、ユーザの行動履歴のような複数の属性とその依存関係(あるいは順序性)を有するようなデータに対しては、その技術をそのまま適用できないという問題があった。
【0005】
そこで、本発明は、上述の課題に鑑みてなされたものであり、データの匿名化に関し、ユーザの行動履歴のような複数の属性とその依存関係(あるいは順序性)を有するようなデータに対しても適用可能な匿名データ生成装置、匿名データの生成方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0007】
(1)本発明は、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成するグラフ作成手段(例えば、図1のグラフ作成部110に相当)と、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形するグラフマージ手段(例えば、図1のグラフマージ部120に相当)と、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する削除処理手段(例えば、図1の削除処理部130に相当)と、を備えたことを特徴とする匿名データ生成装置を提案している。
【0008】
この発明によれば、グラフ作成手段は、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する。グラフマージ手段は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。削除処理手段は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。つまり、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形し、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除するため、特定の人物の行動履歴を抽出することができない。
【0009】
(2)本発明は、(1)の匿名データ生成装置について、前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする匿名データ生成装置を提案している。
【0010】
この発明によれば、グラフが、各ノード間を行動履歴に対応した矢印で結合する有向グラフである。すなわち、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。
【0011】
(3)本発明は、(2)の匿名データ生成装置について、前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除することを特徴とする匿名データ生成装置を提案している。
【0012】
この発明によれば、削除処理手段は、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。したがって、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができない。
【0013】
(4)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップ(例えば、図5のステップS101に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図5のステップS102に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図5のステップS103に相当)と、を備えたことを特徴とする匿名データの生成方法を提案している。
【0014】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。したがって、特定の人物の行動履歴を抽出することができない。
【0015】
(5)本発明は、(4)の匿名データの生成方法について、前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする匿名データの生成方法を提案している。
【0016】
この発明によれば、グラフが、各ノード間を行動履歴に対応した矢印で結合する有向グラフである。すなわち、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。
【0017】
(6)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップ(例えば、図11のステップS201に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図11のステップS202に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図11のステップS203に相当)と、前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップ(例えば、図11のステップS204に相当)と、を備えることを特徴とする匿名データの生成方法を提案している。
【0018】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除し、さらに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。したがって、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができない。
【0019】
(7)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップ(例えば、図5のステップS101に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図5のステップS102に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図5のステップS103に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0020】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除する。したがって、特定の人物の行動履歴を抽出することができない。
【0021】
(8)本発明は、(7)のプログラムについて、前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とするプログラムを提案している。
【0022】
この発明によれば、グラフが、各ノード間を行動履歴に対応した矢印で結合する有向グラフである。すなわち、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。
【0023】
(9)本発明は、グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップ(例えば、図11のステップS201に相当)と、前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップ(例えば、図11のステップS202に相当)と、前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップ(例えば、図11のステップS203に相当)と、前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップ(例えば、図11のステップS204に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0024】
この発明によれば、グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成し、グラフマージ手段が、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。そして、削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除し、さらに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。したがって、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができない。
【発明の効果】
【0025】
本発明によれば、ユーザの行動履歴を匿名化することができ、様々な解析や動向調査に使用することができるという効果がある。したがって、例えば、各ユーザのプライバシを保ったまま、購買履歴を解析しマーケットリサーチを行うといったようなサービスを構築することができるという効果がある。
【図面の簡単な説明】
【0026】
【図1】本発明の第1の実施形態に係る匿名データ生成装置の構成を示す図である。
【図2】本発明の第1の実施形態に係るグラフの作成を例示した図である。
【図3】本発明の第1の実施形態に係るグラフのマージを例示した図である。
【図4】本発明の第1の実施形態に係るマージしたグラフから所定の要件を満たすノードを削除した場合を例示した図である。
【図5】本発明の第1の実施形態に係る匿名データ生成装置の処理を示す図である。
【図6】本発明の第2の実施形態に係る匿名データ生成装置の構成を示す図である。
【図7】本発明の第2の実施形態に係るグラフの作成を例示した図である。
【図8】本発明の第2の実施形態に係るグラフのマージを例示した図である。
【図9】本発明の第2の実施形態に係るマージしたグラフから所定の要件を満たすノードを削除した場合を例示した図である。
【図10】本発明の第2の実施形態に係るマージしたグラフから所定の要件を満たすノードを削除した場合を例示した図である。
【図11】本発明の第2の実施形態に係る匿名データ生成装置の処理を示す図である。
【発明を実施するための形態】
【0027】
以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0028】
<第1の実施形態>
図1から図5を用いて、本実施形態に係る匿名データ生成装置について説明する。
【0029】
<匿名データ生成装置の構成>
本実施形態に係る匿名データ生成装置は、図1に示すように、グラフ作成部110と、グラフマージ部120と、削除処理部130とから構成されている。
【0030】
ここで、グラフ作成部110は、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する。具体的に、図2を用いて説明すると、ユーザA(図中、(A)参照)は、自宅からコンビニ、駅A、駅Bをたどって学校に行った履歴が、自宅、コンビニ、駅A、駅B、学校という各ノードを矢印で結んだ有向グラフで示されている。一方、ユーザB(図中、(B)参照)は、自宅から駅A、駅B、デパートをたどって駅Cに行った履歴が、自宅、駅A、駅B、デパート、駅Cという各ノードを矢印で結んだ有向グラフで示されている。ここで、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。なお、本実施形態では、有向グラフとして矢印を用いる例を示したが、これに限らず、例えば、点線を右向きの矢印、一点鎖線を左向きの矢印というように、予めルール化して、このような結線を用いてもよい。また、各ノードの名称についても、予めルール化した記号等で表してもよい。
【0031】
グラフマージ部120は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する。具体的に、図2および図3を用いて説明すると、図2のユーザAの行動履歴を示すグラフとユーザBの行動履歴を示すグラフとでは、ノードとして、「自宅」、「駅A」、「駅B」が共通する。グラフマージ部120は、この共通ノードを抽出し、重ね合わせ処理を行うことにより、図2に示す2つのグラフを図3に示すような1つのグラフに変形する。
【0032】
削除処理部130は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除する。具体的に、K=2とした場合の図3および図4を用いて説明すると、ノード「デパート」は、2個以上の分岐がなく、下流ノード「駅C」が2個以上の分岐を持たないため、図3からノード「駅C」とノード「デパート」からノード「駅C」への矢印が削除される。なお、ノード「学校」のように、分岐をもたないノードは、この処理から除外される。これにより、特定の人物の行動履歴を抽出することができなくなる。
【0033】
<匿名データ生成装置の処理>
図5を用いて、本実施形態に係る匿名データ生成装置の処理について説明する。
まず、グラフ作成部110が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する(ステップS101)。グラフマージ部120は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する(ステップS102)。そして、削除処理部130は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除する(ステップS103)。
【0034】
以上、説明したように、本実施形態によれば、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形し、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、ノードの下流ノードを削除するため、特定の人物の行動履歴を抽出することができない。
【0035】
<第2の実施形態>
図6から図11を用いて、本実施形態に係る匿名データ生成装置について説明する。
第1の実施形態においては、特定の人物の行動履歴を抽出することは不可能となるが、複数ユーザの行動履歴を集計した全体の傾向をつかむことはできるという問題がある。この問題を解決するためには、より高度な匿名化が必要である。ここで、高度な匿名化とは、利用者がある行動を取っていたと判明したとき、それ以降の行動履歴の一部分でもK以下に絞り込まれるケースをいう。本実施形態では、これを実現する匿名データ生成装置を構築する。
【0036】
<匿名データ生成装置の構成>
本実施形態に係る匿名データ生成装置は、図6に示すように、グラフ作成部110と、グラフマージ部120と、削除処理部230とから構成されている。なお、第1の実施形態と同様の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は、省略する。
【0037】
削除処理部230は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除するとともに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する。
【0038】
<匿名データ生成装置の処理>
図11を用いて、本実施形態に係る匿名データ生成装置の処理について説明する。
まず、グラフ作成部110が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、各ノードを結びつけた複数のグラフを作成する(ステップS201)。具体的に、図7を用いて説明すると、ユーザA(図中、(A)参照)は、自宅からコンビニ、駅A、駅Bをたどって学校に行った履歴が、自宅、コンビニ、駅A、駅B、学校という各ノードを矢印で結んだ有向グラフで示されている。一方、ユーザB(図中、(B)参照)は、自宅から駅A、駅B、デパートをたどって駅Cに行った履歴が、自宅、駅A、駅B、デパート、駅Cという各ノードを矢印で結んだ有向グラフで示されている。ここで、有向グラフを用いることにより、複数の属性間の依存関係や順序性を明確に表現することができる。なお、本実施形態では、有向グラフとして矢印を用いる例を示したが、これに限らず、例えば、点線を右向きの矢印、一点鎖線を左向きの矢印というように、予めルール化して、このような結線を用いてもよい。また、各ノードの名称についても、予めルール化した記号等で表してもよい。
【0039】
グラフマージ部120は、複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する(ステップS202)。具体的に、図7および図8を用いて説明すると、図7のユーザAの行動履歴を示すグラフとユーザBの行動履歴を示すグラフとでは、ノードとして、「自宅」、「駅A」、「駅B」が共通する。グラフマージ部120は、この共通ノードを抽出し、重ね合わせ処理を行うことにより、図7に示す2つのグラフを図3に示すような1つのグラフに変形する。
【0040】
そして、削除処理部230は、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、そのノードの下流ノードを削除し(ステップS203)、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除する(ステップS204)。具体的に、K=2とした場合の図8および図9を用いて説明すると、ノード「デパート」は、2個以上の分岐がなく、下流ノード「駅C」が2個以上の分岐を持たないため、図8からノード「駅C」とノード「デパート」からノード「駅C」への矢印が削除される。なお、ノード「学校」のように、分岐をもたないノードは、この処理から除外される。これにより、特定の人物の行動履歴を抽出することができなくなる。
【0041】
しかしながら、上記までの処理では、複数ユーザの行動履歴を集計した全体の傾向をつかむことはできるという問題がある。この問題を解決するためには、より高度な匿名化が必要である。そこで、図10に示すように、分岐を持たないノード(図9のノード「学校」、「デパート」)を除き、2個以上への分岐を持たないすべてのノード(図9のノード「駅A」、ノード「駅B」)について矢印すべてを削除する。
【0042】
以上、説明したように、本実施形態によれば、さらに、分岐を持たないノードを除き、K個以上への分岐を持たないすべてのノードについて矢印すべてを削除することにより、複数のユーザの行動履歴を集計したとしても、全体の傾向さえも把握することができないことを担保することができる。
【0043】
なお、匿名データ生成装置の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを匿名データ生成装置に読み込ませ、実行することによって本発明の匿名データ生成装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
【0044】
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されても良い。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0045】
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0046】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0047】
110;グラフ作成部
120;グラフマージ部
130;削除処理部
230;削除処理部
【特許請求の範囲】
【請求項1】
複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成するグラフ作成手段と、
前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形するグラフマージ手段と、
K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する削除処理手段と、
を備えたことを特徴とする匿名データ生成装置。
【請求項2】
前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする請求項1に記載の匿名データ生成装置。
【請求項3】
前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除することを特徴とする請求項2に記載の匿名データ生成装置。
【請求項4】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
を備えたことを特徴とする匿名データの生成方法。
【請求項5】
前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする請求項4に記載の匿名データの生成方法。
【請求項6】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップと、
を備えることを特徴とする匿名データの生成方法。
【請求項7】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
をコンピュータに実行させるためのプログラム。
【請求項8】
前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする請求項7に記載のプログラム。
【請求項9】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップと、
をコンピュータに実行させるためのプログラム。
【請求項1】
複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成するグラフ作成手段と、
前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形するグラフマージ手段と、
K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する削除処理手段と、
を備えたことを特徴とする匿名データ生成装置。
【請求項2】
前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする請求項1に記載の匿名データ生成装置。
【請求項3】
前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除することを特徴とする請求項2に記載の匿名データ生成装置。
【請求項4】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
を備えたことを特徴とする匿名データの生成方法。
【請求項5】
前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする請求項4に記載の匿名データの生成方法。
【請求項6】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法であって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップと、
を備えることを特徴とする匿名データの生成方法。
【請求項7】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
をコンピュータに実行させるためのプログラム。
【請求項8】
前記グラフが、前記各ノード間を行動履歴に対応した矢印で結合する有向グラフであることを特徴とする請求項7に記載のプログラム。
【請求項9】
グラフ作成手段と、グラフマージ手段と、削除処理手段と、を備えた匿名データ生成装置における匿名データの生成方法をコンピュータに実行させるためのプログラムであって、
前記グラフ作成手段が、複数のユーザの各行動を示すノードと行動との依存関係あるいは順序性とを反映し、前記各ノードを矢印で結びつけた複数のグラフを作成する第1のステップと、
前記グラフマージ手段が、前記複数のグラフに対して、同一の部分を抽出して、重ね合わせ1つのグラフに変形する第2のステップと、
前記削除処理手段が、K(K:正の整数)個以上分岐がないノードでかつ下流ノードがK個以上の分岐を持たない場合に、該ノードの下流ノードを削除する第3のステップと、
前記削除処理手段が、分岐を持たない前記ノードを除き、K個以上への分岐を持たないすべての前記ノードについて矢印すべてを削除する第4のステップと、
をコンピュータに実行させるためのプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2013−114445(P2013−114445A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−259881(P2011−259881)
【出願日】平成23年11月29日(2011.11.29)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願日】平成23年11月29日(2011.11.29)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】
[ Back to top ]