説明

機密度学習装置、機密度学習システム、機密度学習方法および機密度学習プログラム

【課題】記憶装置資源の削減化を図り、また導入にかかるコスト及び労力が軽減できる機密度学習装置を提供する。
【解決手段】文書ファイルを特徴づける属性値からなる文書保管情報が少なくとも格納される管理対象ストレージ4と、文書ファイルの管理度合いの判断基準をなす管理ルールを格納する管理ルールデータベース5と、管理ルールに従い文書保管情報により特定される文書ファイルの管理厳重度を判定する管理厳重度判定部3とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、管理対象の文書の機密度を評価するための機密度学習装置、機密度学習システム、機密度学習方法および機密度学習プログラムに関する。
【背景技術】
【0002】
近年、個人情報を初めとする機密情報の漏洩が企業価値に大きな影響力を与えるようになり、情報セキュリティ管理が企業経営の重要な課題として認識されつつある。このような情報セキュリティ管理においては、機密度の学習が必要となる。そこで、特許文献1及び特許文献2は、以下のような機密度学習システムを提案している。
【0003】
特許文献1に開示されている機密度学習システムを図18に示すブロック図を参照して説明する。この機密度学習システムは、機密文書データベース(DB)118、機密文書管理サーバ119、ディスプレイ120(120a,120b,…,120n)、端末等を示すクライアント121(121a,121b…121n)、プリンタ122、機密情報管理装置123、プロキシサーバ130、ゲートウェイサーバ131、ファクシミリサーバ132、スキャンステーション133、携帯情報機器134、ネットワーク135、外部装置136(136a,136b,…,136m)を備えている。
【0004】
また、機密情報管理装置123は、頻出表現抽出部124、機密情報特徴抽出部125、機密情報判定部126、ハッシュテーブルデータベース(DB)127、判定ログファイル128、頻出表現テーブルデータベース(DB)129を備えている。
【0005】
そして、機密度学習システムにおいては、ハッシュテーブルDB127に格納する機密情報判定用の情報を生成する機密度学習処理と、評価対象文書が機密情報を含むか否かを判定する機密度評価処理とが互いに独立した処理として実行される。
【0006】
即ち、機密度学習処理において、機密情報管理装置123は、機密文書DB118に格納されている機密文書を機密文書管理サーバ119やネットワーク135を介して取得する。そして、機密情報管理装置123の頻出表現抽出部124は、取得した機密文書から頻出表現を抽出し、抽出結果を頻出表現テーブルDB129に格納する。
【0007】
その後、機密情報特徴抽出部125は、取得した機密文書と頻出表現テーブルDB129に格納されている情報とに基づき、機密情報判定用の情報を生成してハッシュテーブルDB127に格納する。
【0008】
一方、機密度評価処理において、機密情報判定部126は、ネットワーク135を介して得られる評価対象文書を取得して、ハッシュテーブルDB127に格納された機密情報判定用の情報に基づき評価対象文書が機密情報を含むか否かを判定する。これにより、評価対象文書の機密度が判定できる。
【0009】
また、特許文献2の機密度評価システムは、図19に示すように、文書参照手段137、領域分割手段138、特徴要素検出手段139、領域別辞書参照手段140、特徴定義辞書格納手段141、相関性評価手段142、機密情報分類手段143、結果出力手段144、文書格納手段145を備える。
【0010】
機密度評価システムは、機密度評価処理は実行するが、機密度の学習処理は行わない。機密度評価処理においては、文書参照手段137が文書格納手段145に格納された文書を読出す。そして、領域分割手段138が、読み出された文書を、ヘッダ、本文、フッタ等の部分領域に分割する。
【0011】
特徴要素検出手段139は、部分領域に応じた特徴定義辞書を参照して、この部分領域から特徴要素を抽出し、その部分領域が分類され得る機密情報カテゴリの候補を指定する。
【0012】
相関性評価手段142は、候補となった機密情報カテゴリ毎に、このカテゴリに応じた特徴要素の配置状況を定量的に評価し、その部分領域がどの機密情報カテゴリに分類されるのかを判定する。
【0013】
機密情報分類手段143は、各部分領域が分類された機密情報カテゴリと、各機密情報カテゴリの重要度とに基づいて、文書がどの機密情報カテゴリに分類されるのかを判定すると共に、その文書の重要度を決定する。これにより文書の重要度が決定される。
【先行技術文献】
【特許文献】
【0014】
【特許文献1】再公表特許2007−105273号公報
【特許文献2】特開2006−209649号公報
【発明の概要】
【発明が解決しようとする課題】
【0015】
しかしながら、上述した機密度学習システムや機密度評価システムにおいては、システム導入費用が高く、またシステム導入に多大な労力が必要になる問題がある。
【0016】
これは、特許文献1における機密文書DB118や特許文献2における特徴定義辞書格納手段141が、システム導入事案毎に、また管理対象文書の種別毎に準備しなければならないためである。
【0017】
また、特許文献1における機密文書DB118や特許文献2における特徴定義辞書格納手段141に格納されている情報は、管理対象文書の機密度の変化に応じて追加や更新等のメンテナンスを行う必要がある。このようなメンテナンスに多額の費用が必要になると共に、多大な労力が必要になる。加えて、これらの情報を格納するための記憶装置資源の消費も多くなる問題がある。
【0018】
特に、特許文献1の機密度学習システムでは、学習用の機密文書が機密文書DB118に別途格納されているため、記憶装置資源の消費は著しい。
【0019】
そこで、本発明の主目的は、システム導入及び導入後に必要となる費用や労力を削減できると共に、記憶装置資源の消費の少ない機密度学習装置、機密度学習システム、機密度学習方法および機密度学習プログラムを提供することである。
【課題を解決するための手段】
【0020】
上記課題を解決するため、機密度学習装置にかかる発明は、文書ファイルを特徴づける属性値からなる文書保管情報が少なくとも格納される管理対象ストレージと、前記文書ファイルの管理度合いの判断基準をなす管理ルールを格納する管理ルールデータベースと、前記管理ルールに従い前記文書保管情報により特定される前記文書ファイルの管理厳重度を判定する管理厳重度判定部とを備えることを特徴とする。
【0021】
また、機密度学習システムにかかる発明は、上記機密度学習装置と、該機密度学習装置に対して前記評価文書ファイルを指定して機密度を評価行わせる利用者端末とを備えることを特徴とする。
【0022】
また、機密度学習方法にかかる発明は、文書ファイルを特徴づける属性値からなる文書保管情報と、前記文書ファイルの管理度合いの判断基準をなす管理ルールとに基付き前記文書保管情報により特定される前記文書ファイルの管理厳重度を判定する管理厳重度判定手順を含むことを特徴とする。
【0023】
さらに、機密度学習プログラムにかかる発明は、文書ファイルを特徴づける属性値からなる文書保管情報と、前記文書ファイルの管理度合いの判断基準をなす管理ルールとに基付き前記文書保管情報により特定される前記文書ファイルの管理厳重度を判定する管理厳重度判定ステップを含むことを特徴とする。
【発明の効果】
【0024】
本発明によれば、機密度の学習は管理ルールDBに格納されている管理ルールに基づき判定されるので、機密度学習システムを導入する際には、管理ルールDBに格納する管理ルールだけを準備すればよいことになる。従って、記憶装置資源の削減化を図り、また導入にかかるコスト及び労力が軽減できる。
【図面の簡単な説明】
【0025】
【図1】本発明の第1の実施形態にかかる機密度学習装置のブロック図である。
【図2】本発明の第2の実施形態にかかる機密度学習システムのブロック図である。
【図3】第2の実施形態にかかる文書保管情報テーブルのテーブル構成を示す図である。
【図4】第2の実施形態にかかる管理ルールテーブルのテーブル構成を示す図である。
【図5】第2の実施形態にかかる管理厳重度テーブルのテーブル構成を示す図である。
【図6】第2の実施形態にかかる学習処理のフローチャートである。
【図7】第2の実施形態にかかる厳重度判定処理のフローチャートである。
【図8】第2の実施形態にかかる評価処理のフローチャートである。
【図9】本発明の第3の実施形態にかかる機密度学習システムのブロック図である。
【図10】第3の実施形態にかかる全文書機密度評価処理のフローチャートである。
【図11】本発明の第4の実施形態にかかる機密度学習システムのブロック図である。
【図12】第4の実施形態にかかる文書情報テーブルのテーブル構成を示す図である。
【図13】第4の実施形態にかかる転置索引テーブルのテーブル構成を示す図である。
【図14】第4の実施形態にかかる学習処理のフローチャートである。
【図15】第4の実施形態にかかる学習処理における管理度学習処理のフローチャートである。
【図16】第4の実施形態にかかる評価処理のフローチャートである。
【図17】第4の実施形態にかかる管理度評価処理のフローチャートである。
【図18】関連技術にかかる機密度学習システムのブロック図である。
【図19】関連技術にかかる機密度評価システムのブロック図である。
【発明を実施するための形態】
【0026】
<第1の実施形態>
本発明の第1の実施形態を説明する。図1は、本実施形態にかかる機密度学習装置のブロック図である。この機密度学習装置2は、管理対象ストレージ4、管理ルールデータベース(DB)5、管理厳重度判定部3を備える。管理対象ストレージ4は、文書ファイルを特徴づける属性値からなる文書保管情報が少なくとも格納する。管理ルールデータベース5は、文書ファイルの管理度合いの判断基準をなす管理ルールを格納する。管理厳重度判定部3は、管理ルールに従い文書保管情報により特定される文書ファイルの管理厳重度を判定する。
【0027】
これにより、文書ファイルの管理厳重度の判定が可能にするには、ユーザは管理ルールデータベース5の管理ルールのみを準備すれば良くなるので、機密度学習装置の導入コスト及び導入労力の軽減が可能になる。
<第2の実施形態>
次に、本発明を第2の実施形態を説明する。図2は、本実施形態にかかる機密度学習システム9Bのブロック図である。この機密度学習システム9Bは、機密度学習装置10B及び利用者端末11を備える。また、機密度学習装置10Bは、入出力部12a、管理対象ファイル等を格納するレポジトリである管理対象ストレージ13、管理厳重度判定部14、管理ルールDB15、管理厳重度DB16、機密度評価ユニット17を備えている。
【0028】
管理対象ストレージ13は、文書ファイル及び文書保管情報テーブルを格納する。なお、この文書ファイルは、文書自体を意味している。そこで、以下の説明において他の用語との混乱を避けるために、文書ファイルと記載する。
【0029】
図3は、管理対象ストレージ13に格納されている文書保管情報テーブル50のテーブル構成を示す図である。この文書保管情報テーブル50は、文書ファイルに関する複数の属性情報からなる文書保管情報55を複数含んでいる。1つの文書保管情報55は、1つの文書ファイルの格納位置を一意的に示すファイルパス情報51、その文書ファイルへのアクセス権限を示す権限設定情報52、文書ファイルの暗号化の有無等を示す暗号化情報53、文書ファイルの所有者等の情報を示す保管者情報54等の属性情報を含んでいる。なお、図3において空欄56が表記されているが、これは属性情報が、追加できるようになっていることを示している。例えば、文書ファイルの閲覧が可能な人を制限したい場合がある。このような場合には、空欄56に「閲覧者制限」とする新たな属性情報を設ける。
【0030】
例えば、図3における最上段の文書保管情報55は、「ファイルパス情報51が[C:¥file.text]の位置に格納された文書ファイルは、[777]の権限設定情報52により特定される権限者により管理され、また暗号化情報53が[無]なので暗号化されていない。そして、この文書ファイルの保管者は保管者情報54が示す[Yamada]である。」ことを示している。
【0031】
なお、ファイルパス情報51としては、文書ファイルの格納位置が一意的に特定できればよい。従って、ファイルパス情報51は、OS(Operating System)に依存するファイルパス、URI(Uniform Resource Identifier)、数値、文字列等が利用できる。
【0032】
権限設定情報52としては、利用者とアクセス権限の組み合わせ、利用者の集合であるグループを用いた表記等が例示できる。暗号化情報53としては、暗号化の有無を示す2値情報、暗号強度、暗号の種類等の情報が例示できる。保管者情報54としては、文書ファイルの保管者や管理者が例示できる。
【0033】
管理厳重度判定部14は、管理ルールDB15に格納されている管理ルールに基づき、管理対象ストレージ13に格納されている文書ファイルの管理厳重度を判定する。この管理厳重度は、文書ファイルに対するセキュリティ度を示す情報である。また、管理ルールは、文書ファイルに対する管理厳重度を判定する際の判定基準である。
【0034】
図4は、管理ルールテーブル60のテーブル構成を示す図である。この管理ルールテーブル60は、複数の管理ルール64を含んでいる。1つの管理ルール64は、その管理ルール64を識別(特定)するためのルールID情報61、管理ルール64のルール実体をなすルール情報62、このルール情報62に合致した文書ファイルに対して付与する厳重度を示す厳重度情報63を含んでいる。なお、厳重度情報63は、管理ルール64が適用される文書ファイルの機密度を数値により表現した情報である。
【0035】
例えば、図4の最上段の管理ルール64は、「ルールID情報61が[1]のルールは、文書ファイルが[暗号化]されている場合、その文書ファイルの厳重度情報63を[0.9]とする。」ことを示している。なお、ルールID情報61は、管理ルール64を一意的に特定する情報であり、数値、文字列、URI等を用いることができる。
また、
そして、管理厳重度判定部14は、図示しないローカルファイルシステム又はネットワーク等を介して、管理対象ストレージ13から文書ファイルを取得する。また、管理厳重度判定部14は、管理対象ストレージ13に格納されている文書保管情報テーブル50の中から取得した文書ファイルに対する文書保管情報55を取得する。そして、取得した文書ファイルの文書保管情報55と、管理ルールDB15に格納された管理ルール64とを比較することにより、この文書ファイルの管理厳重度を評価する。
【0036】
管理厳重度DB16は、管理厳重度判定部14が判定した厳重度を厳重度情報63として格納する。図5は、管理厳重度テーブル70のテーブル構成を示す図である。この管理厳重度テーブル70は、複数の管理厳重度情報73を含んでいる。管理厳重度情報73は、ファイルパス情報71及び厳重度情報72により構成されている。なお、ファイルパス情報71は、図3に示したファイルパス情報51に対応し、厳重度情報72は、図4に示した厳重度情報63に対応している。但し、後述するように、厳重度情報72は複数の厳重度情報63の平均値等の場合もあるため、厳重度情報72と厳重度情報63とは一意的に同じではない。
【0037】
入出力部12aは、利用者端末11を介して利用者が指定する文書ファイルの機密度の評価依頼を受け付ける。以下、評価依頼された文書ファイルを評価文書ファイルと記載する。そして、入出力部12aは、受け付けた評価文書ファイルの機密度の評価を機密度評価ユニット17に行わせる。機密度評価ユニット17は機密度の評価を行い、その評価結果を入出力部12aに出力する。入出力部12aは、利用者端末11に機密度の評価結果を出力する。
【0038】
この機密度評価ユニット17は、機密度学習部18、機密度学習結果DB19、機密度評価部20を備える。そして、機密度学習部18は、管理厳重度DB16に格納されている管理厳重度情報73と管理対象ストレージ13に格納されている文書保管情報55を用いて文書ファイルの機密度を学習する。この機密度は、機密度学習結果DB19に格納される。
【0039】
機密度評価部20は、入出力部12aから評価文書ファイルに対する機密度の評価要求を受け付けると、機密度学習結果DB19に格納されている機密度に基づき、この評価文書ファイルに対する機密度を評価して、評価結果を入出力部12aに出力する。
【0040】
次に、管理厳重度判定部14、機密度学習部18における処理(以下、学習処理という)及び、機密度評価部20における評価(以下、評価処理という)を詳細に説明する。
【0041】
先ず、学習処理について説明する。図6は、学習処理のフローチャートである。上述したように、学習処理は、厳重度判定処理(ステップSa1)及び機密度学習処理(ステップSa2)を主要手順とする。
【0042】
厳重度判定処理は、管理厳重度判定部14によって管理対象ストレージ13に格納されている文書ファイルに対して厳重度を判定し、この判定結果を管理厳重度情報73として管理厳重度DB16に登録する処理である。
【0043】
機密度学習処理は、機密度学習部18によって管理対象ストレージ13に格納されている文書ファイルと管理厳重度DB16に格納されている管理厳重度情報73とを用いて、文書ファイルの機密度を学習する処理である。
【0044】
図7は、厳重度判定処理のフローチャートである。管理厳重度判定部14は、管理対象ストレージ13に格納されている文書ファイルを取得すると共に、この文書ファイルの文書保管情報55を文書保管情報テーブル50から取得する(ステップSb1)。
【0045】
次に、管理厳重度判定部14は、管理ルールDB15から管理ルール64を取得して、この管理ルール64と文書保管情報55との比較を行う(ステップSb2)。そして、文書保管情報55と管理ルール64とが合致した場合は、ステップSb3に進み、一致しない場合にはステップSb4に進む。
【0046】
例えば、判定対象となっている文書ファイルが、図3に示す文書保管情報テーブル50における上から2行目の文書保管情報55により特徴付けられているとする。この文書保管情報55は、ファイルパス情報51が[file:///c:¥doc1.doc]、権限設定情報52が[700]、暗号化情報53が[有]、保管者情報54が[mail://Yamada@…jp]である。この文書保管情報55に対する、図4に示す複数の管理ルール64の一致性を判断すると、[暗号化]のルール情報62が、一致する。なお、この管理ルール64に一致する文書ファイルの厳重度は、厳重度情報63から[0.9]に設定される。
【0047】
文書保管情報55と管理ルール64とが合致した場合は、管理厳重度判定部14は、一致した管理ルール64の厳重度情報63を一時的に記憶する(ステップSb3)。
【0048】
管理ルールテーブル60には複数の管理ルール64が含まれている。そこで、管理厳重度判定部14は、厳重度情報63と全ての管理ルール64との比較を行ったか判断する(ステップSb4)。
【0049】
厳重度情報63と全ての管理ルール64との比較が行われた場合は、管理厳重度判定部14は、合致した管理ルール64の厳重度情報63に基づき判定対象となっている文書ファイルの厳重度情報72を算出する(ステップSb5)。なお、管理ルール64が複数存在するので、文書保管情報55と一致する管理ルール64も複数検出されることがある。そこで、文書ファイルの厳重度情報72は、各管理ルール64における厳重度情報63の平均値、中央値、最大値とすることが可能である。
【0050】
算出された文書ファイルの厳重度と、この文書保管情報55に含まれるファイルパス情報71とは、管理厳重度情報73として管理厳重度DB16に登録される(ステップSb6)。
【0051】
以上の厳重度判定処理が、全ての文書ファイルに対して行われたか否かの判断が行われる(ステップSb7)。全ての文書ファイルに対して厳重度判定処理が行われていない場合には、ステップSb1に戻り、全ての文書ファイルに対して行われた場合には、処理が終了する。
【0052】
機密度学習部18は、このようにして判定された管理厳重度情報73と文書保管情報55とを用いて機密度を学習する。そして、機密度の学習結果は、機密度学習結果として機密度学習結果DB19に格納される。なお、機密度学習部18における機密度の具体的な学習手順は、公知の機密度学習方法等が利用できる。
【0053】
次に、評価処理を説明する。図8は、評価処理のフローチャートである。先ず、機密度評価ユニット17における機密度評価部20は、入出力部12aを介して機密度の評価依頼を待っている(ステップSc1,Sc2)。機密度の評価依頼は、文書ファイル名やファイルパス情報の指定や文書ファイルの直接入力等により評価依頼対象である評価文書ファイルが指定される。
【0054】
そして、評価文書ファイルを受け付けると、機密度評価部20は、機密度の評価を行う(ステップSc3)。機密度の評価結果は、入出力部12aに送られる。
【0055】
入出力部12aは、機密度評価部20から受け取った評価文書ファイルの機密度評価結果を利用者端末11に出力する(ステップSc4)。
【0056】
以上説明したように、機密度の学習は図5に示した管理厳重度情報に基づいて行なわれる。この管理厳重度情報は、管理ルールDBに格納されている管理ルールに基づき判定されるので、機密度学習システムを導入する際には、管理ルールDBに格納する管理ルールだけを準備すればよいことになる。
【0057】
また、この管理厳重度情報は、ファイルパス情報と厳重度情報との2つの情報により構成される。従って、関連技術において説明した機密文書DBや特徴定義辞書に比べて、本発明にかかる機密度学習システムが予め準備しなければならない情報量は非常に少ない。
【0058】
よって、本発明にかかる機密度学習システムの導入費用が安価となると共に、導入時に必要となる労力も非常に少なくなる。
【0059】
また、管理ルールDBに格納されている多くの管理ルールは、普遍性、汎用性の高いルールであるので、関連技術において説明したようなシステムの導入目的や管理対象である文書ファイルの特徴に応じた機密文書DBや特徴定義辞書等を準備し、調整する作業が不要となる。従って、この観点からも、本発明にかかる機密度学習システムの導入コストが安価となると共に、導入時に必要とする労力の軽減が図れる。
【0060】
さらに、機密度学習が文書保管情報ストレージや管理ルールDBに格納された情報のみで行えるので、維持コストの抑制及び維持労力の軽減が達成でき、かつ、記憶装置資源の削減が可能になる。
【0061】
特に、管理ルールDBは、管理対象ストレージにおける文書の暗号化ルール等のように情報変更を行う頻度が低い情報であるため、更新に伴う労力や維持コストの大幅な軽減が可能になる。また、管理ルールDBは関連技術における機密文書DBや特徴定義辞書に比べて小規模であるため、記憶装置資源の大幅な削減が可能になる。
<第3の実施形態>
次に、本発明の第3の実施形態を説明する。なお、第2の実施形態と同一構成に関しては同一符号を用いて説明を適宜省略する。図9は、本実施形態にかかる機密度学習システム9Cのブロック図である。
【0062】
機密度学習システム9Cにおける機密度学習装置10Cは、図2に示した機密度学習装置10Bに対して全文書評価実行部21が追設されている点が相違する。
【0063】
入出力部12bは、利用者端末11からの評価文書ファイルの指定を受け付けて、機密度評価部20に評価文書ファイルに対する機密度評価の指示を行う。そして、入出力部12bは、機密度評価の結果を機密度評価部20から受信して利用者端末11に出力する。
【0064】
また、入出力部12bは、利用者端末11から管理対象ストレージ13に含まれる全ての文書ファイルに対する機密度評価の実行指示を受け付ける。全ての文書ファイルに対する機密度評価の実行指示を受け付けると、入出力部12bは、全文書評価実行部21に全ての文書ファイルに対する機密度の評価を指示する。そして、入出力部12bは、機密度評価の結果を利用者端末11に出力する。
【0065】
全文書評価実行部21は、入出力部12bから全ての文書ファイルに対する機密度評価の実行指示を受け付けると、管理厳重度判定部14に厳重度判定処理を実行させる。また、全文書評価実行部21は、この厳重度判定処理の結果を用いて全文書機密度評価処理を機密度評価部20に指示する。これにより全ての文書ファイルの機密度が評価される。そこで、全文書評価実行部21は、機密度評価部20による評価結果を機密度の順に並べ替えて入出力部12bに出力する。
【0066】
このような全文書機密度評価処理を図10のフローチャートに従い説明する。先ず、管理厳重度判定部14は、全文書評価実行部21から厳重度判定処理の実行指示を受け付けると、厳重度判定処理を実行する(ステップSd1)。
【0067】
次に、全文書評価実行部21は、管理対象ストレージ13から文書ファイルを読み込み(ステップSd2)、読み込んだ文書ファイルを機密度評価部20に送る。
【0068】
機密度評価部20は、全文書評価実行部21から受信した文書ファイルに対して図8に示したような評価処理を実行する(ステップSd3)。評価結果は、全文書評価実行部21に出力される。
【0069】
そして、このような評価処理が全ての文書ファイルに対して実行されたか否かが判断される(ステップSd4)。評価処理が全ての文書ファイルに対して実行された場合は、ステップSd4に進み、まだ実行されていない文書ファイルが存在する場合はステップSd2に戻る。
【0070】
全文書評価実行部21は、取得した文書ファイルとこの文書ファイルの機密度との組のリストを、機密度の降順で並べ替えて入出力部12bに出力する(ステップSd5)。
【0071】
入出力部12bは、得られた文書ファイルと機密度との組のリストを利用者端末11に出力する(ステップSd6)。
【0072】
このように、全文書評価実行部21が、全ての文書ファイルの機密度の評価が一連の処理として自動的に行われるので、運用費用及び運用労力の削減が可能になる。
【0073】
また、全文書評価実行部21により、管理対象ストレージに格納されている全ての文書ファイルの評価が簡単に行えるので、運用コストや運用の労力軽減が可能になる。
<第4の実施形態>
次に、本発明の第4の実施形態を説明する。なお、第2の実施形態と同一構成に関しては同一符号を用いて説明を適宜省略する。図11は、本実施形態にかかる機密度学習システム9Dのブロック図である。
【0074】
機密度学習システム9Dの機密度学習装置10Dは、図2に示した機密度学習装置10Bに対して管理度評価ユニット22と要対処度算出部27とが追設されている。
【0075】
管理度評価ユニット22は、管理厳重度DB16に格納されている管理厳重度情報73と、管理対象ストレージ13に格納されている文書保管情報55とに基づき、文書ファイルの管理度を学習し、また指定された評価文書ファイルの管理度を評価する。このような管理度評価ユニット22は、索引生成部23、索引DB24、検索部25、管理度評価部26を備える。
【0076】
索引DB24は、索引生成部23が生成する索引情報と文書情報とを格納するデータベースであり、転置索引テーブル80及び、文書情報テーブル90を備えている。
【0077】
文書情報テーブル90は、図12に示すように、複数の文書情報97により構成されている。1つの文書情報97は、文書ファイルを識別するための文書ID情報91、この文書ファイルの保管場所を一意的に示すファイルパス情報92、この文書ファイルに対するアクセス権限を示す権限設定情報93、この文書ファイルの暗号化の有無等を示す暗号化情報94及び、この文書ファイルに対する管理厳重度を示す厳重度情報95を含んでいる。なお、図12に示す文書情報テーブル90には、空欄96が設けられているが、この空欄96には、上述した情報と異なる他の情報を追加するような場合に用いられることを示している。即ち、文書情報97の属性項目の数は適宜増減可能に設けられている。
【0078】
転置索引テーブル80は、図13に示すように、複数の転置索引情報83を格納している。1つの転置索引情報83は、文書ファイルに含まれる単語等の項目情報81と、その項目情報81を含む複数の文書ファイルの文書ID情報91からなる文書ID群情報82とにより構成されている。例えば、項目情報81が[東京]である転置索引情報83は、文書ID情報91が[1],[2],[5],[…]の文書ファイルが該当することを示す文書ID群情報82を持っている。
【0079】
索引生成部23は、図示しないローカルファイルシステム又はネットワーク等を介して、管理対象ストレージ13から文書ファイルを取得する。そして、索引生成部23は、取得した文書ファイルから文字列情報を抽出し、この文字列情報から項目を抽出する。抽出された項目を含む文書ファイルには、文書ID91が付与されているので、この文書ID91を取得する。この集められた文書ID91は文書ID群情報82をなし、項目は項目情報81をなす。そこで、索引生成部23は、項目情報81と文書ID群情報82とを転置索引情報83として、索引DB24の転置索引テーブル80に追加する。
【0080】
また、索引生成部23は、管理対象ストレージ13から図3に示したような文書保管情報55を取得すると共に、管理厳重度DB16から図5に示したような管理厳重度情報73を取得する。そして、索引生成部23は、文書保管情報55からファイルパス情報51、権限設定情報52、暗号化情報53を抽出し、これらを文書ID情報91に対応したファイルパス情報92、権限設定情報93、暗号化情報94とする。さらに、索引生成部23は、管理厳重度情報73から厳重度情報72を抽出し、これを文書ID情報91に対応した厳重度情報95とする。これにより、文書ID情報91、ファイルパス情報92、権限設定情報93、暗号化情報94、厳重度情報95が取得される。そして、索引生成部23は、これらを文書情報97として索引DB24の文書情報テーブル90に追加する。
【0081】
検索部25は、評価要求のあった評価文書ファイルの文字列情報に基づきクエリを作成して索引DB24の転置索引テーブル80を検索する。そして、評価文書ファイルの内容と類似する内容の文書ファイルを取得する。
【0082】
管理度評価部26は、評価文書ファイルの管理度を評価する。即ち、管理度評価部26は、検索部25により検索された評価文書ファイルに類似する文書ファイル群と、この文書ファイル群の文書情報を取得する。そして、管理度評価部26は、類似した文書ファイル群の管理厳重度について、類似した文書ファイル群の管理状況を数値化する統計処理を行い、この結果を評価した管理度とする。
【0083】
要対処度算出部27は、入出力部12aが入力した評価文書ファイルに対して保管状態の変更等の必要性を数値化し、これを要対処度として算出する。
【0084】
この要対処度の算出は、機密度評価部20が評価した評価文書ファイルの機密度と、管理度評価部26が評価した評価文書ファイルの管理度とに基づき算出する。要対処度算出部27により算出された要対処度は、入出力部12aに出力される。
【0085】
次に、このような機密度学習システム9Dの処理手順を説明する。機密度学習システム9Dは、厳重度判定処理、学習処理、評価処理を主要な処理手順とする。厳重度判定処理は、第2の実施形態と同じ処理であるが、学習処理及び評価処理が異なるので、学習処理及び評価処理について詳細に説明する。
【0086】
図14は、学習処理のフローチャートである。学習処理では、厳重度判定処理(ステップSa1)を行った後、機密度学習処理(ステップSa2)と管理度学習処理(ステップSe1)とが行われる。なお、図14〜図16は、UML(Unified Modeling Language)で定められたダイアグラムに従う図で、図中の黒塗ステップは、[分岐点PS]又は[合流点PE]を示している。そして、分岐点PSと合流点PEとの間の一連のシーケンスの実行順序は、規定されていない。例えば、図14で、分岐点PSと合流点PEとの間に機密度学習処理と管理度学習処理とが含まれるが、機密度学習処理と管理度学習処理とは同時に処理されても良く、また一方の処理が他方の処理より先行して実行されてもよい。
【0087】
機密度学習処理(ステップSa2)については、図6において説明しているので、以下においては管理度学習処理(ステップSe1)を詳細に説明する。
【0088】
この管理度学習処理は、索引生成部23により管理対象ストレージ13に格納されている全ての文書ファイルと、管理厳重度DB16に格納されている管理厳重度情報73とを用いて転置索引情報83及び文書情報97を作成して、索引DB24に登録する手順である。
【0089】
図15は、学習処理における管理度学習処理のフローチャートである。管理度学習処理が開始されると、分岐点PSから、3つのシーケンス(ステップSf1〜ステップSf4によるファイルパス情報92等の作成・登録処理、ステップSf5〜ステップSf6による文書情報97の作成・登録処理、ステップSf7〜ステップSf8による厳重度情報95の作成・登録処理)が実行される。
【0090】
索引生成部23は、ローカルファイルシステム又はネットワーク等を介して、管理対象ストレージ13から文書ファイルを取得する(ステップSf1)。そして、索引生成部23は、取得した文書ファイルに含まれる文書ID情報91及び文字列を抽出し(ステップSf2)、この文字列から項目情報81を抽出する(ステップSf3)。なお、項目情報81として単語や、N文字インデックス法(n−gram)による文字列が適用できる。その後、索引生成部23は、抽出した項目情報81を用いて転置索引情報83を作成し、索引DB24の転置索引テーブル80に登録する(ステップSf4)。
【0091】
また、索引生成部23は、ローカルファイルシステム又はネットワーク等を介して管理対象ストレージ13から文書ID情報91に該当する文書ファイルの文書保管情報55を取得する(ステップSf5)。
【0092】
そして、索引生成部23は、取得した文書保管情報55からファイルパス情報92、権限設定情報93、暗号化情報94を文書情報テーブル90に登録する(ステップSf6)。
【0093】
さらに索引生成部23は、管理厳重度DB16から管理厳重度情報73を取得し、その中から該当する文書ファイルの厳重度情報72を抽出する(ステップSf7)。そして、索引生成部23は、厳重度情報72を厳重度情報95として索引DB24の文書情報テーブル90に登録する(ステップSf8)。
【0094】
このような、転置索引情報83の作成・登録処理、文書保管情報55の作成・登録処理、厳重度情報95の作成・登録処理が実行されると、合流点PEを経て管理対象ストレージ13に格納されている全ての文書ファイルに対して、上述した処理が行われたか否かの判断が行われる(ステップSf9)。全ての文書ファイルに対して処理が完了していない場合には分岐点PSに戻り、完了した場合には管理度学習処理が終了する。
【0095】
次に、評価処理を説明する。図16は、この評価処理のフローチャートである。評価処理では、評価文書ファイルの受け付けを判断し(ステップSc2,Sc1)、評価文書ファイルを受け付けると機密度評価処理(ステップSc3)及び管理度評価処理(ステップSg1)を行う。その後、要対処度算出部27による評価文書ファイルの機密度と管理度とが演算されて、この評価文書ファイルの要対処度が算出される(Sg2)。
【0096】
次に、管理度評価処理を詳細に説明する。なお、機密度評価処理(ステップSc3)は先の実施形態において説明したので重複説明を避ける。図17は、管理度評価処理のフローチャートである。
【0097】
先ず、検索部25が評価文書ファイルに類似した文書ファイルを索引DB24の転置索引テーブル80から検索して、類似文書ファイル群を得る(ステップSh1)。
【0098】
次に、検索部25は、索引DB24に格納されている文書情報97から類似文書ファイル群の各文書ファイルに対する厳重度情報95を取得する(ステップSh2)。
【0099】
そして、管理度評価部26は、評価文書ファイルの管理度を評価して、この管理度と類似文書ファイル群の厳重度情報95との一貫性を示す分散値や中央値等を統計処理により算出する(ステップSh3)。
【0100】
以上説明したように、管理度評価部が評価する文書ファイルの管理状態という指標を数値化した管理度を取得すると共に、機密度評価部が評価した機密度を取得して、これら管理度と機密度とから要対処度を算出する。従って、利用者が管理対象ストレージ13の管理状態を改善すべきか否かの判断は、評価文書ファイルの要対処度のみから判断できる。即ち、機密度が高いにもかかわらず管理度の悪い文書ファイルは、高い対処度が算出される。よって、管理対象ストレージ13の管理状態の改善の是非の判断及び状態管理が容易に行えるようになる。
【0101】
なお、機密度学習システムにおける各種の処理手順をコンピュータで実行可能にコーディングしてプログラム化することが可能であり、またそのプログラムを情報記録媒体に記録することも可能である。
【0102】
以上説明した特徴を付記として纏める。付記1は、文書ファイルを特徴づける属性値からなる文書保管情報が少なくとも格納される管理対象ストレージと、文書ファイルの管理度合いの判断基準をなす管理ルールを格納する管理ルールデータベースと、管理ルールに従い文書保管情報により特定される文書ファイルの管理厳重度を判定する管理厳重度判定部とを備えることを特徴とする機密度学習装置。
【0103】
付記2は、付記1に記載の機密度学習装置において、管理厳重度判定部による管理度厳重度と文書ファイルとに基づき、当該文書ファイルの機密度を学習する機密度評価ユニットを備えることを特徴とする機密度学習装置。
【0104】
付記3は、付記2に記載の機密度学習装置において、機密度評価ユニットは、管理厳重度を文書ファイルの機密度として、機密度評価のための学習を行う機密度学習部を備えることを特徴とする機密度学習装置。
【0105】
付記4は、付記2又は3に記載の機密度学習装置において、機密度評価ユニットは、機密度学習部の学習結果に基づき、指定された評価文書ファイルの機密度を評価する機密度評価部と、を備えることを特徴とする機密度学習装置。
【0106】
付記5は、付記1に記載の機密度学習装置において、管理対象ストレージに格納されている全ての文書ファイルの機密度の評価を機密度評価部に指示する全文書評価実行部を備えることを特徴とする機密度学習装置。
【0107】
付記6は、付記3又は4に記載の機密度学習装置において、管理厳重度と文書保管情報とに基づき評価文書ファイルの管理度を評価する管理度評価ユニットを備えることを特徴とする機密度学習装置。
【0108】
付記7は、付記4乃至6のいずれか1つの付記に記載の機密度学習装置において、機密度と管理度とに基づき、利用者による評価文書ファイルに対する管理の必要性を示す要対処度を算出する要対初度算出部を備えることを特徴とする機密度学習装置。
【0109】
付記8は、付記1乃至7のいずれか1つの付記に記載の機密度学習装置と、該機密度学習装置に対して評価文書ファイルを指定して機密度を評価行わせる利用者端末とを備えることを特徴とする機密度学習システム。
【0110】
付記9は、文書ファイルを特徴づける属性値からなる文書保管情報と、文書ファイルの管理度合いの判断基準をなす管理ルールとに基付き文書保管情報により特定される文書ファイルの管理厳重度を判定する管理厳重度判定手順を含むことを特徴とする機密度学習方法。
【0111】
付記10は、付記9に記載の機密度学習方法において、管理厳重度を文書ファイルの機密度として、機密度評価のための学習を行う学習手順を含むことを特徴とする機密度学習方法。
【0112】
付記11は、付記10に記載の機密度学習方法において、機密度の学習結果に基づき、指定された評価文書ファイルの機密度を評価する手順を含むことを特徴とする機密度学習方法。
【0113】
付記12は、付記9又は10に記載の機密度学習方法において、管理厳重度と文書保管情報とに基づき評価文書ファイルの管理度を評価する手順を含むことを特徴とする機密度学習方法。
【0114】
付記13は、付記12に記載の機密度学習方法において、機密度と管理度とに基づき、利用者による評価文書ファイルに対する管理の必要性を示す要対処度を算出する手順を含むことを特徴とする機密度学習方法。
【0115】
付記14は、文書ファイルを特徴づける属性値からなる文書保管情報と、文書ファイルの管理度合いの判断基準をなす管理ルールとに基付き文書保管情報により特定される文書ファイルの管理厳重度を判定する管理厳重度判定ステップを含むことを特徴とする機密度学習プログラム。
【0116】
付記15は、付記14に記載の機密度学習プログラムにおいて、管理厳重度を文書ファイルの機密度として、機密度評価のための学習を行う学習ステップを含むことを特徴とする機密度学習プログラム。
【0117】
付記16は、付記15に記載の機密度学習プログラムにおいて、機密度の学習結果に基づき、指定された評価文書ファイルの機密度を評価するステップを含むことを特徴とする機密度学習プログラム。
【0118】
付記17は、付記14乃至16の1つに記載の機密度学習プログラムにおいて、管理厳重度と文書保管情報とに基づき評価文書ファイルの管理度を評価するステップを含むことを特徴とする機密度学習プログラム。
【0119】
付記18は、付記17に記載の機密度学習プログラムにおいて、機密度と管理度とに基づき、利用者による評価文書ファイルに対する管理の必要性を示す要対処度を算出するステップを含むことを特徴とする機密度学習プログラム。
【符号の説明】
【0120】
9B〜9D 機密度学習システム
2,10B〜10D 機密度学習装置
12a,12b 入出力部
4,13 管理対象ストレージ
3,14 管理厳重度判定部
5,15 管理ルールDB
16 管理厳重度DB
17 機密度評価ユニット
18 機密度学習部
19 機密度学習結果DB
20 機密度評価部
21 全文書評価実行部
22 管理度評価ユニット
23 索引生成部
24 索引DB
25 検索部
26 管理度評価部
27 要対処度算出部

【特許請求の範囲】
【請求項1】
文書ファイルを特徴づける属性値からなる文書保管情報が少なくとも格納される管理対象ストレージと、
前記文書ファイルの管理度合いの判断基準をなす管理ルールを格納する管理ルールデータベースと、
前記管理ルールに従い前記文書保管情報により特定される前記文書ファイルの管理厳重度を判定する管理厳重度判定部と、を備えることを特徴とする機密度学習装置。
【請求項2】
請求項1に記載の機密度学習装置において、
前記管理厳重度判定部による前記管理度厳重度と前記文書ファイルとに基づき、当該文書ファイルの機密度を学習する機密度評価ユニットを備えることを特徴とする機密度学習装置。
【請求項3】
請求項2に記載の機密度学習装置において、
前記機密度評価ユニットは、前記機密度学習部の学習結果に基づき、指定された評価文書ファイルの機密度を評価する機密度評価部と、を備えることを特徴とする機密度学習装置。
【請求項4】
請求項3に記載の機密度学習装置において、
前記管理厳重度と前記文書保管情報とに基づき前記評価文書ファイルの管理度を評価する管理度評価ユニットを備えることを特徴とする機密度学習装置。
【請求項5】
請求項4に記載の機密度学習装置において、
前記機密度と前記管理度とに基づき、利用者による前記評価文書ファイルに対する管理の必要性を示す要対処度を算出する要対初度算出部を備えることを特徴とする機密度学習装置。
【請求項6】
請求項3乃至5に記載の機密度学習装置と、
該機密度学習装置に対して前記評価文書ファイルを指定して機密度を評価行わせる利用者端末と、を備えることを特徴とする機密度学習システム。
【請求項7】
文書ファイルを特徴づける属性値からなる文書保管情報と、前記文書ファイルの管理度合いの判断基準をなす管理ルールとに基付き前記文書保管情報により特定される前記文書ファイルの管理厳重度を判定する管理厳重度判定手順を含むことを特徴とする機密度学習方法。
【請求項8】
請求項7に記載の機密度学習方法において、
前記管理厳重度を前記文書ファイルの機密度として、機密度評価のための学習を行う学習手順を含むことを特徴とする機密度学習方法。
【請求項9】
請求項8に記載の機密度学習方法において、
前記機密度の学習結果に基づき、指定された評価文書ファイルの機密度を評価する手順を含むことを特徴とする機密度学習方法。
【請求項10】
文書ファイルを特徴づける属性値からなる文書保管情報と、前記文書ファイルの管理度合いの判断基準をなす管理ルールとに基付き前記文書保管情報により特定される前記文書ファイルの管理厳重度を判定する管理厳重度判定ステップを含むことを特徴とする機密度学習プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate