説明

重要度判定装置、重要度判定方法およびプログラム

【課題】ネットワーク上を流れるデータの重要度を自動的かつ高速に判別し、適切な保護をユーザに要求する。
【解決手段】通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。次に、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。そして、変換されたデータをリングバッファに保存し、データを更新する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワーク上を流れるデータの重要度を自動的に判別し、適切な保護をユーザに要求する重要度判定装置、重要度判定方法およびプログラムに関し、高速処理を実現する重要度判定装置、重要度判定方法およびプログラムに関する。
【背景技術】
【0002】
今日、インターネットなどのネットワークを介して重要なデータをやり取りする場面が増えてきている。特に、利用者の趣味嗜好などを考慮してサービスを提供するようなサイトにおいては、ユーザの個人情報・プライバシ情報を提供することもあり、情報漏洩によるプライバシ侵害が懸念される。また、位置情報サービスなどにおいても同様の脅威がある(例えば、非特許文献1参照。)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】RFC2616 Hypertext Transfer Protocol ―― HTTP/1.1
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来は、データの重要度を判定することはなく、データの送受信を行っており、利用者が客観的に自身が送信するデータの重要度を高速に判定することができなかったという問題がある。
【0005】
そこで、本発明は、上述の課題に鑑みてなされたものであり、ネットワーク上を流れるデータの重要度を自動的かつ高速に判別し、適切な保護をユーザに要求する重要度判定装置、重要度判定方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
【0007】
(1)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、データを送受信する自己のクライアントモジュール(例えば、図1のクライアントモジュール101に相当)とデータを送受信する他のクライアントモジュール(例えば、図1のクライアントモジュール102〜105に相当)からデータ重要度を判定するためのデータを受信する受信手段(例えば、図2のデータ読込処理部202、通信モジュールドライバ204に相当)と、該受信したデータをサービスごとに分類する分類手段(例えば、図2のデータ事前処理部212に相当)と、該分類したデータについて、その重要度を判定できるように加工する加工手段(例えば、図2のデータ事前処理部212に相当)と、該加工したデータをリングバッファに保存する保存手段(例えば、図2の記憶部201Aに相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段(例えば、図2のデータ特徴量抽出処理部210に相当)と、前記加工したデータを前記保存手段に保存して、データの更新を行う保存データ更新手段(例えば、図2の制御部201に相当)と、を備えたことを特徴とする重要度判定装置を提案している。
【0008】
この発明によれば、受信手段は、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータの重要度を判定するためのデータを受信する。分類手段は、受信したデータをサービスごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータをリングバッファに保存する。判定手段は、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。保存データ更新手段は、加工したデータを前記保存手段に保存して、データの更新を行う。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的かつ高速に判別することができる。
【0009】
(2)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定装置であって、データを送受信する自己のクライアントモジュール(例えば、図1のクライアントモジュール101に相当)とデータを送受信する他のクライアントモジュール(例えば、図1のクライアントモジュール102〜105に相当)からデータ重要度を判定するためのデータを受信する受信手段と、該受信したデータをサービスごとに分類する分類手段(例えば、図5のデータ事前処理部212に相当)と、該分類したデータについて、その重要度を判定できるように加工する加工手段(例えば、図5のデータ事前処理部212に相当)と、該加工したデータを属性ごとに階層化したデータ構造で保存する保存手段(例えば、図5の記憶部301Aに相当)と、前記保存手段に保存するデータについて、予め必要な属性値を演算する演算手段(例えば、図5の演算部301Bに相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段(例えば、図5のデータ特徴量抽出処理部210に相当)と、前記加工したデータを前記保存手段に保存して、データの更新を行う保存データ更新手段(例えば、図5の制御部301に相当)と、を備えたことを特徴とする重要度判定装置を提案している。
【0010】
この発明によれば、受信手段は、データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータの重要度を判定するためのデータを受信する。分類手段は、受信したデータをサービスごとに分類する。加工手段は、分類したデータについて、その重要度を判定できるように加工する。保存手段は、加工したデータを属性ごとに階層化したデータ構造で保存する。演算手段は、保存手段に保存するデータについて、予め必要な属性値を演算する。判定手段は、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。保存データ更新手段は、加工したデータを前記保存手段に保存して、データの更新を行う。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、加工したデータを属性ごとに階層化したデータ構造で保存するとともに、保存するデータについて、予め必要な属性値を演算してあるため、判定処理を高速に行うことができる。
【0011】
(3)本発明は、(1)の重要度判定装置について、前記保存手段(例えば、図7の記憶部401Aに相当)が、前記加工したデータを属性ごとに階層化したデータ構造で前記リングバッファに保存し、前記保存手段に保存するデータについて、予め必要な属性値を演算する演算手段(例えば、図7の演算部401Bに相当)を備えたことを特徴とする重要度判定装置を提案している。
【0012】
この発明によれば、保存手段が、加工したデータを属性ごとに階層化したデータ構造でリングバッファに保存し、演算手段が、保存手段に保存するデータについて、予め必要な属性値を演算する。したがって、加工したデータを属性ごとに階層化したデータ構造でリングバッファに保存するとともに、保存するデータについて、予め必要な属性値を演算してあるため、判定処理を高速に行うことができる。
【0013】
(4)本発明は、(1)から(3)の重要度判定装置について、前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする重要度判定装置を提案している。
【0014】
この発明によれば、加工手段が一方向性関数を用いて、データの加工を行う。したがって、一方向性関数を用いることにより、情報の漏えいを防止することができる。
【0015】
(5)本発明は、(1)から(3)の重要度判定装置について、前記判定手段が、匿名性を評価することによりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
【0016】
この発明によれば、判定手段が、匿名性を評価することによりデータの重要度を判定する。したがって、たとえば、k−匿名性やl−多様性を評価することにより、情報の重要度を自動的に判別することができる。
【0017】
(6)本発明は、(1)から(3)の重要度判定装置について、前記判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
【0018】
この発明によれば、判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値={(重み付け値)×(自己のデータを含む属性値の数−自己のデータを含まない属性値の数)}の数式で算出することにより、属性値の変化を定量化して、データの重要度を自動的に判別することができる。
【0019】
(7)本発明は、(1)から(3)の重要度判定装置について、前記判定手段が、データ量の差分に関する評価値によりデータの重要度を判定することを特徴とする重要度判定装置を提案している。
【0020】
この発明によれば、判定手段が、データ量の差分に関する評価値によりデータの重要度を判定する。したがって、評価値を、評価値={(重み付け値)×(データの総数)/(自己のデータを含む同じ属性を持つデータの数)}の数式で算出することにより、データの重要度を自動的に判別することができる。
【0021】
(8)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第1のステップ(例えば、図4のステップS101に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図4のステップS102に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップ(例えば、図4のステップS103に相当)と、該判定結果をユーザに送信する第4のステップ(例えば、図4のステップS104に相当)と、前記変換されたデータをリングバッファに保存し、データを更新する第5のステップ(例えば、図4のステップS105に相当)と、を備えたことを特徴とする重要度判定方法を提案している。
【0022】
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。次に、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。そして、変換されたデータをリングバッファに保存し、データを更新する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的かつ高速に判別することができる。
【0023】
(9)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第1のステップ(例えば、図6のステップS201に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図6のステップS202に相当)と、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップ(例えば、図6のステップS203に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップ(例えば、図6のステップS204に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、図6のステップS205に相当)と、前記変換されたデータを保存し、データを更新する第6のステップ(例えば、図6のステップS206に相当)と、を備えたことを特徴とする重要度判定方法を提案している。
【0024】
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。次に、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索し、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。そして、判定結果をユーザに送信し、変換されたデータを保存し、データを更新する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、加工したデータを属性ごとに階層化したデータ構造で保存するとともに、保存するデータについて、予め必要な属性値を演算してあるため、判定処理を高速に行うことができる。
【0025】
(10)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法であって、通信路を流れるデータを取得する第1のステップ(例えば、図8のステップS301に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図8のステップS302に相当)と、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップ(例えば、図8のステップS303に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップ(例えば、図8のステップS304に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、図8のステップS305に相当)と、前記変換されたデータをリングバッファに保存し、データを更新する第6のステップ(例えば、図8のステップS306に相当)と、を備えたことを特徴とする重要度判定方法を提案している。
【0026】
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。次に、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索し、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。そして、判定結果をユーザに送信して、変換されたデータをリングバッファに保存し、データを更新する。したがって、加工したデータを属性ごとに階層化したデータ構造でリングバッファに保存するとともに、保存するデータについて、予め必要な属性値を演算してあるため、判定処理を高速に行うことができる。
【0027】
(11)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第1のステップ(例えば、図4のステップS101に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図4のステップS102に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップ(例えば、図4のステップS103に相当)と、該判定結果をユーザに送信する第4のステップ(例えば、図4のステップS104に相当)と、前記変換されたデータをリングバッファに保存し、データを更新する第5のステップ(例えば、図4のステップS105に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0028】
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。次に、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し、判定結果をユーザに送信する。そして、変換されたデータをリングバッファに保存し、データを更新する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的かつ高速に判別することができる。
【0029】
(12)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第1のステップ(例えば、図6のステップS201に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図6のステップS202に相当)と、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップ(例えば、図6のステップS203に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップ(例えば、図6のステップS204に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、図6のステップS205に相当)と、前記変換されたデータを保存し、データを更新する第6のステップ(例えば、図6のステップS206に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0030】
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。次に、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索し、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。そして、判定結果をユーザに送信し、変換されたデータを保存し、データを更新する。したがって、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、加工したデータを属性ごとに階層化したデータ構造で保存するとともに、保存するデータについて、予め必要な属性値を演算してあるため、判定処理を高速に行うことができる。
【0031】
(13)本発明は、ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、通信路を流れるデータを取得する第1のステップ(例えば、図8のステップS301に相当)と、データを前処理により重要度の判定ができるように変換する第2のステップ(例えば、図8のステップS302に相当)と、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップ(例えば、図8のステップS303に相当)と、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップ(例えば、図8のステップS304に相当)と、該判定結果をユーザに送信する第5のステップ(例えば、図8のステップS305に相当)と、前記変換されたデータをリングバッファに保存し、データを更新する第6のステップ(例えば、図8のステップS306に相当)と、をコンピュータに実行させるためのプログラムを提案している。
【0032】
この発明によれば、通信路を流れるデータを取得し、データを前処理により重要度の判定ができるように変換する。次に、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索し、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する。そして、判定結果をユーザに送信して、変換されたデータをリングバッファに保存し、データを更新する。したがって、加工したデータを属性ごとに階層化したデータ構造でリングバッファに保存するとともに、保存するデータについて、予め必要な属性値を演算してあるため、判定処理を高速に行うことができる。
【発明の効果】
【0033】
本発明によれば、ネットワーク上を流れるデータの重要度を自動的かつ高速に判別し、適切な保護をユーザに要求することにより、プライバシ情報を可視化して、ユーザに注意を喚起することができるという効果がある。
【図面の簡単な説明】
【0034】
【図1】本発明の第1の実施形態に係る重要度判定装置の概念図である。
【図2】本発明の第1の実施形態に係る重要度判定装置の構成を示す図である。
【図3】本発明の第1の実施形態に係る重要度判定装置におけるデータの抽象化に関する図である。
【図4】本発明の第1の実施形態に係る重要度判定装置の処理を示す図である。
【図5】本発明の第2の実施形態に係る重要度判定装置の構成を示す図である。
【図6】本発明の第2の実施形態に係る重要度判定装置の処理を示す図である。
【図7】本発明の第3の実施形態に係る重要度判定装置の構成を示す図である。
【図8】本発明の第3の実施形態に係る重要度判定装置の処理を示す図である。
【発明を実施するための形態】
【0035】
以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
【0036】
<第1の実施形態>
図1から図4を用いて、本発明の第1の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図1に示すように、クライアントモジュール101〜105とサービス提供サーバ300との間に配置され、データを送受信するクライアントモジュール101とデータを送受信する他のクライアントモジュール102〜105からデータの重要度を判定するためのデータを受信して、k−匿名性やl−多様性等の匿名性判定を行って、データを解析することにより、クライアントモジュール101からのデータの重要度を判別して、クライアントモジュール101に通知するものである。つまり、クライアントモジュール101は、データを収集し、解析する機能を有する。具体的には、データ収集機能を各ユーザの端末にインストールし、収集したデータをデータ解析機能に送付する。データ解析機能では、送られてきたデータをまとめて解析し、結果を各データ収集機能に返す。
【0037】
<重要度判定装置の構成>
図2を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図2に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部210と、l−多様性判定モジュール213と、k−匿名性判定モジュール214と、木構造データ管理部216と、ユーザ設定パラメータ管理部217とから構成されている。また、データ特徴量抽出処理部210は、k−匿名性、l−多様性判定処理部211と、データ事前処理部212と、記憶部201Aから構成されている。
【0038】
制御部201は、予め格納された制御プログラムによって、重要度判定装置200の全体を制御する。特に、通信モジュールドライバ204によりデータを送受信するクライアントモジュール101とデータを送受信する他のクライアントモジュール102〜105からデータの重要度を判定するためのデータを受信し、l−多様性判定モジュール213やk−匿名性判定モジュール214に通信モジュールドライバ204が受信したデータを供給し、k−匿名性やl−多様性等の匿名性判定を実行させ、データを解析することにより、クライアンモジュールト101からのデータの重要度を判別して、通信モジュールドライバ204によりクライアントモジュール101に通知させる。
【0039】
データ読込処理部202は、通信モジュールドライバ204からネットワークを流れるデータを取得する。データ出力処理部203は、通信モジュールドライバ204を利用して判定結果を通知する。
【0040】
データ事前処理部212は、受信したデータをサービスごとに分類し、分類したデータについて、その重要度を判定できるように加工する。
【0041】
l−多様性判定モジュール213は、入力されたデータセットがl−多様性を満たすかどうか判定し、満たす場合はデータを匿名データセット出力に受け渡す。なお、l−多様性の判定処理は独立したモジュールとし、他の評価基準も追加可能とする。また、l=1に設定された場合には、l−多様性の判定処理をスキップすることで無駄な処理を行わないようにする。l−多様性は、sensitive attributeに対して実行する。
【0042】
k−匿名性判定モジュール214は、入力されたデータセットがk−匿名性を満たすかどうか判定し、満たす場合はデータを匿名データセット出力に受け渡す。なお、k−匿名性の判定処理は独立したモジュールとし、他の評価基準も追加可能とする。また、k−匿名性の判定は、個別の属性及び準識別子全体に対して実行する。
【0043】
具体的には、ユーザ設定パラメータ管理部217に格納されたパラメータにしたがって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する。具体的には、各属性の重み付けは、利用者の入力により行われる。重み付けは、属性の優先順位を表わし、利用者が最も重視する属性を最上位とする。また、加工処理においては、優先順位が最下位の属性から順に加工処理を行い、k−匿名性を満たした段階で終了する。したがって、最上位の属性ほど元の情報が保持される確率が高くなる。また、これにより、直接的には、ユーザとの関連性の低い複数の情報を組合せることによりユーザを特定することも防止することにより、データ利用者が求める情報を可能な限り保持することができる。利用者は、GUI(Graphical User Interface)等を利用して各属性に対して優先順位を入力する。利用者は、各優先順位に対して、重み付けポイント(数値)を設定する。この値は、加工処理を行う属性を選択する際に使用する。
【0044】
つまり、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。具体的には、評価ポイントは、以下の数式を用いて、算出される。
評価ポイント=(属性値の数)*(重み付けポイント)
ここで、(属性値の数)とは、その属性が持つ属性値の種類の数を表す。ボトムアップ処理においては、一般化によって、この評価ポイントの減少が最小になる属性を一般化を行う属性として選択する。また、トップダウン処理においては、この値の増加が最大になる属性を一般化を行う属性として選択する。
【0045】
k−匿名性、l−多様性判定処理部211は、それぞれの属性単体を単体でk−匿名性を満たすように一般化する。また、属性によってユーザが一般化の限界レベルを設定しているものについては、それを超えて一般化はしない。さらに、生成したデータがk−匿名性を満たさなければ、各属性を1レベルだけ一般化して再度チェックを行う。この場合も、ユーザが設定した限界レベルを超えて一般化はせず、他の属性を一般化することで、k−匿名性を達成する。
【0046】
一般化に用いられるトップダウン処理は、算出した評価ポイントの増加分が最大となるようなデータ加工方法により、データの加工を行う。また、ボトムアップ処理は、算出した評価ポイントの減少分が最小となるようなデータ加工方法により、データの加工を行う。
【0047】
木構造データ管理部216は、事前入力された木構造データを変換し、ソフトウェアが利用可能な形式で格納する。また、属性が数値データではない場合、属性値の持つ意味の包含関係によって構築された木構造が上位ノード探索のために必要である。例えば、図3にように、Country、State、City、・・・といった属性値の上下関係によって構成された階層構造を事前に作成しておく必要がある。したがって、各属性に対してこのような木構造データをユーザが設定可能とする。数値データに関しては、一定の値ごとに階層化するため、木構造データは必ずしも必要ではない。なお、木構造データの構成に関して既存のソフトウェアが使用できる場合は、使用しても良い。また、木構造データは各レベルのノード数を情報として含む。木構造データ管理部216は、図3に示すような木構造データを管理する。
【0048】
ユーザ設定パラメータ管理部217は、管理者が設定情報として入力した各パラメータやファイルを一括管理する。データ圧縮処理部205は、一定期間の通信路を流れたデータを格納し保管するとともに、データの圧縮を定期的に行う。具体的には、一定期間経過したデータについては、複数のデータをマージしてもっとも特徴的な特徴量のみを残して圧縮する。これにより、圧縮して格納することにデータサイズを削減し、保存するデータのサイズが有限長になるようにする。
【0049】
また、記憶部201Aは、制御部201の制御に基づいて、データをある時間間隔ごとに分割して格納する。格納には、リングバッファを用いる。データの追加および削除は、FIFO(First In First Out)であり、これにより、データの追加および削除が高速に行えるリングバッファを用いることで処理時間を短縮できる。データは、リングバッファが一杯になるまで格納され、その後は、新しいデータが追加されるごとに、一番古いデータが削除される。
【0050】
<重要度判定装置の処理>
図4を用いて、本実施形態に係る重要度判定装置の処理について説明する。
まず、事前処理として、不要データの削除、データの抽象化、データの圧縮を行う。
【0051】
受信したデータは、サービスごとにグループ化して処理される。したがって、以下の処理は、グループごとの処理となる。まず、判定に使用しない不要データ部分を削除する。例えば、プログラムが参照しないフィールドなどを削減する。また、設定により秘匿度の高いデータと定義されたデータについては、置き換えを行う。この場合に置き換えにはハッシュ関数の出力値を使用する。
【0052】
次に、設定に従ってデータを抽象化する。数値データについては、末尾の桁から順に削除するなどしてデータを変換する。属性が数値データではない場合、属性値の持つ意味の包含関係によって構築された木構造が上位ノード探索のために必要である、例えば、図3のように、Country、State、City、・・・といった属性値の上下関係によって構成された階層構造を事前に作成しておく必要がある。従って、各属性に対してこのような木構造データをユーザが設定可能とする。そして、この木構造に従ってデータを抽象化する。数値データに関しては一定の値ごとに階層化するため、木構造データは必ずしも必要ではない。なお、木構造データの構成に関して既存のソフトウェアが使用できる場合は、使用しても良い。また、木構造データは各レベルのノード数を情報として含む。
【0053】
さらに、データを辞書データを用いて圧縮する。まず、格納されているデータの中から頻出度の高いデータを抽出する。そして、そのデータをある記号列で置き換えることにより圧縮する。圧縮したデータ、記号列は、辞書データに登録し、新たなデータがそのデータを含む場合、記号列で置き換えるようにする。本機能は、独立したモジュールとしバッチ処理により定期的に辞書データをメンテナンスし、可能な限り圧縮度の高いデータとする。
【0054】
また、データはある時間間隔ごとに分割して格納される。そして、格納には、リングバッファを用いられ、データの追加および削除は、FIFO(First In First Out)である。データは、リングバッファが一杯になるまで格納され、その後は、新しいデータが追加されるごとに、一番古いデータが削除される。
【0055】
本実施形態に係る重要度判定装置は、通信路を流れるデータを取得し(ステップS101)、データを前処理により重要度の判定ができるように変換する(ステップS102)。
【0056】
そして、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定し(ステップS103)、判定結果をユーザに送信する(ステップS104)。さらに、変換されたデータをリングバッファに保存し、データを更新する(ステップS105)。
【0057】
以上、説明したように、本実施形態によれば、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的かつ高速に判別することができる。
【0058】
<第2の実施形態>
図5および図6を用いて、本発明の第2の実施形態に係る重要度判定装置について説明する。
【0059】
<重要度判定装置の構成>
図5を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図5に示すように、制御部301と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部210と、l−多様性判定モジュール213と、k−匿名性判定モジュール214と、木構造データ管理部216と、ユーザ設定パラメータ管理部217とから構成されている。また、データ特徴量抽出処理部210は、k−匿名性、l−多様性判定処理部311と、データ事前処理部312と、記憶部301Aと、演算部301Bとから構成されている。なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
【0060】
記憶部301Aは、「データ」と「参照カウンタ」を要素とするツリー状のデータ(例えば、Red Black Tree)であり、同じデータ(キー)に対しては参照カウンタの増減により追加および削除を行い、データ(キー)の重複がないようにする。また、ツリーは「要素数カウンタ」を持ち、要素の増減に同期して要素数カウンタの増減も行う。さらに、最後に追加された要素への参照を保持する。
【0061】
また、ツリー状データは、
a)入力データの1レコード中のnon−sensitiveデータ(キー)
b)入力データの1レコード中のsensitiveデータを属性毎にそれぞれ格納するツリーのリスト
c)入力データの1レコードを属性毎にそれぞれ格納するツリーのリスト
で構成され、a)およびb)のリストは、追加されたq*(レコードの集まりのうち、non−sensitiveデータの数が同一のグループ)のk(k−匿名性の値)および最小のk、l(l−多様性の値)、(c、l)−Diversity(c;r1〜rmのうち、一番大きな値と他の値の合計値との比率)のr1〜rm(各グループについて、sensitiveデータが同一である個数)の情報を保持している。c)のリストは、評価ポイントのN(全レコード数)、nj(ある属性のレコード数)の情報を保持している。
【0062】
制御部301は、演算部301Bにおいて予め属性値が演算され、属性ごとに階層的に構成された記憶部201Bに記憶されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する。
【0063】
k−匿名性、l−多様性判定処理部311は、判定の際に、当該属性値と同一の属性を高速に発見するために、Red−Black Treeを用いる。このことにより探索コストは属性値の総数Nに対して(Log(N))に短縮できる。さらに、Red−Black Treeには、現在の「同じ属性値を持つデータの総数」など、評価ポイント算出に必要なデータが格納されている。この値を用いることで処理を高速化する。データ事前処理部312は、記憶部201Bに保存するデータについて、予め必要な属性値を演算する。
【0064】
<重要度判定装置の処理>
まず、通信路を流れるデータを取得し(ステップS201)、データを前処理により重要度の判定ができるように変換する(ステップS202)。
【0065】
そして、予め属性値が演算され、属性ごとに階層的に構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索して(ステップS203)、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する(ステップS204)。さらに、判定結果をユーザに送信し(ステップS205)、変換されたデータを保存し、データを更新する(ステップS206)。
【0066】
以上、説明したように、本実施形態によれば、ネットワーク上を流れる他のユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。また、加工したデータを属性ごとに階層化したデータ構造で保存するとともに、保存するデータについて、予め必要な属性値を演算してあるため、判定処理を高速に行うことができる。
【0067】
<第3の実施形態>
図7から図8を用いて、本発明の第3の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図7に示すように、制御部401と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部210と、l−多様性判定モジュール213と、k−匿名性判定モジュール214と、木構造データ管理部216と、ユーザ設定パラメータ管理部217とから構成されている。また、データ特徴量抽出処理部210は、k−匿名性、l−多様性判定処理部311と、データ事前処理部312と、記憶部401Aと、演算部401Bとから構成されている。なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
【0068】
記憶部401Aは、制御部401の制御に基づいて、データをある時間間隔ごとに分割して格納する。格納には、リングバッファを用いる。データの追加および削除は、FIFO(First In First Out)であり、これにより、データの追加および削除が高速に行えるリングバッファを用いることで処理時間を短縮できる。データは、リングバッファが一杯になるまで格納され、その後は、新しいデータが追加されるごとに、一番古いデータが削除される。
【0069】
また、記憶部401Aは、「データ」と「参照カウンタ」を要素とするツリー状のデータ(例えば、Red Black Tree)であり、同じデータ(キー)に対しては参照カウンタの増減により追加および削除を行い、データ(キー)の重複がないようにする。また、ツリーは「要素数カウンタ」を持ち、要素の増減に同期して要素数カウンタの増減も行う。さらに、最後に追加された要素への参照を保持する。
【0070】
また、ツリー状データは、
a)入力データの1レコード中のnon−sensitiveデータ(キー)
b)入力データの1レコード中のsensitiveデータを属性毎にそれぞれ格納するツリーのリスト
c)入力データの1レコードを属性毎にそれぞれ格納するツリーのリスト
で構成され、a)およびb)のリストは、追加されたq*(レコードの集まりのうち、non−sensitiveデータの数が同一のグループ)のk(k−匿名性の値)および最小のk、l(l−多様性の値)、(c、l)−Diversity(c;r1〜rmのうち、一番大きな値と他の値の合計値との比率)のr1〜rm(各グループについて、sensitiveデータが同一である個数)の情報を保持している。c)のリストは、評価ポイントのN(全レコード数)、nj(ある属性のレコード数)の情報を保持している。
【0071】
制御部401は、演算部401Bにおいて予め属性値が演算され、属性ごとに階層的に構成された記憶部201Bに記憶されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する。
【0072】
<重要度判定装置の処理>
まず、通信路を流れるデータを取得し(ステップS301)、データを前記前処理により重要度の判定ができるように変換する(ステップS302)。
【0073】
そして、予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索し(ステップS303)、各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する(ステップS304)。さらに、判定結果をユーザに送信し(ステップS305)、変換されたデータをリングバッファに保存し、データを更新する(ステップS306)。
【0074】
以上、説明したように、本実施形態によれば、ネットワーク上を流れるユーザのデータを利用して、簡易な構成でデータの重要度を自動的に判別することができる。
【0075】
なお、重要度判定装置の処理をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを重要度判定装置に読み込ませ、実行することによって本発明の重要度判定装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
【0076】
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されても良い。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0077】
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0078】
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、本発明の実施形態においては、重要度判定装置をクライアントモジュールとサービス提供サーバの間に配置する例について説明したが、これに限らず、重要度判定装置をクライアントモジュールに内蔵させた構成でもよい。
【符号の説明】
【0079】
101;クアントモジュール
102;クアントモジュール
103;クアントモジュール
104;クアントモジュール
105;クアントモジュール
200;重要度判定装置
201、301、401;制御部
201A、301A、401A;記憶部
202;データ読込処理部
203;データ出力処理部
204;通信モジュールドライバ
205;データ圧縮処理部
210;データ特徴量抽出処理部
211;k−匿名性、l−多様性判定処理部
212;データ事前処理部
213;l−多様性判定モジュール
214;k−匿名性判定モジュール
215;木構造データ管理部
216;ユーザ設定パラメータ管理部
300;サービス提供サーバ
301;制御部
301A;記憶部
301B;演算部
401;制御部
401A;記憶部
401B;演算部

【特許請求の範囲】
【請求項1】
ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータ重要度を判定するためのデータを受信する受信手段と、
該受信したデータをサービスごとに分類する分類手段と、
該分類したデータについて、その重要度を判定できるように加工する加工手段と、
該加工したデータをリングバッファに保存する保存手段と、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段と、
前記加工したデータを前記保存手段に保存して、データの更新を行う保存データ更新手段と、
を備えたことを特徴とする重要度判定装置。
【請求項2】
ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
データを送受信する自己のクライアントモジュールとデータを送受信する他のクライアントモジュールからデータ重要度を判定するためのデータを受信する受信手段と、
該受信したデータをサービスごとに分類する分類手段と、
該分類したデータについて、その重要度を判定できるように加工する加工手段と、
該加工したデータを属性ごとに階層化したデータ構造で保存する保存手段と、
前記保存手段に保存するデータについて、予め必要な属性値を演算する演算手段と、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する判定手段と、
前記加工したデータを前記保存手段に保存して、データの更新を行う保存データ更新手段と、
を備えたことを特徴とする重要度判定装置。
【請求項3】
前記保存手段が、前記加工したデータを属性ごとに階層化したデータ構造で前記リングバッファに保存し、前記保存手段に保存するデータについて、予め必要な属性値を演算する演算手段を備えたことを特徴とする請求項1に記載の重要度判定装置。
【請求項4】
前記加工手段が一方向性関数を用いて、データの加工を行うことを特徴とする請求項1から請求項3のいずれかに記載の重要度判定装置。
【請求項5】
前記判定手段が、匿名性を評価することによりデータの重要度を判定することを特徴とする請求項1から請求項3のいずれかに記載の重要度判定装置。
【請求項6】
前記判定手段が、データ内の属性の種類に関する評価値によりデータの重要度を判定することを特徴とする請求項1から請求項3のいずれかに記載の重要度判定装置。
【請求項7】
前記判定手段が、データ量の差分に関する評価値によりデータの重要度を判定することを特徴とする請求項1から請求項3のいずれかに記載の重要度判定装置。
【請求項8】
ユーザが送受信するデータの重要度を判定する重要度判定方法であって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップと、
該判定結果をユーザに送信する第4のステップと、
前記変換されたデータをリングバッファに保存し、データを更新する第5のステップと、
を備えたことを特徴とする重要度判定方法。
【請求項9】
ユーザが送受信するデータの重要度を判定する重要度判定方法であって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップと、
該判定結果をユーザに送信する第5のステップと、
前記変換されたデータを保存し、データを更新する第6のステップと、
を備えたことを特徴とする重要度判定方法。
【請求項10】
ユーザが送受信するデータの重要度を判定する重要度判定方法であって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップと、
該判定結果をユーザに送信する第5のステップと、
前記変換されたデータをリングバッファに保存し、データを更新する第6のステップと、
を備えたことを特徴とする重要度判定方法。
【請求項11】
ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第3のステップと、
該判定結果をユーザに送信する第4のステップと、
前記変換されたデータをリングバッファに保存し、データを更新する第5のステップと、
をコンピュータに実行させるためのプログラム。
【請求項12】
ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップと、
該判定結果をユーザに送信する第5のステップと、
前記変換されたデータを保存し、データを更新する第6のステップと、
をコンピュータに実行させるためのプログラム。
【請求項13】
ユーザが送受信するデータの重要度を判定する重要度判定方法をコンピュータに実行させるためのプログラムであって、
通信路を流れるデータを取得する第1のステップと、
データを前処理により重要度の判定ができるように変換する第2のステップと、
予め属性値が演算され、属性ごとに階層的の構成されたデータ群と該受信したデータの属性を比較し、判定に必要なパラメータを検索する第3のステップと、
各サービスごとに、一定期間保存されたデータに基づいてデータの重要度を判定する第4のステップと、
該判定結果をユーザに送信する第5のステップと、
前記変換されたデータをリングバッファに保存し、データを更新する第6のステップと、
をコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2012−150651(P2012−150651A)
【公開日】平成24年8月9日(2012.8.9)
【国際特許分類】
【出願番号】特願2011−8764(P2011−8764)
【出願日】平成23年1月19日(2011.1.19)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成22年度、総務省、「大規模仮想化サーバ環境における情報セキュリティ対策技術の研究開発」委託研究、産業技術力強化法第19条の適用を受ける特許出願
【出願人】(599108264)株式会社KDDI研究所 (233)
【Fターム(参考)】