説明

情報処理装置及びプログラム

【課題】文書に対して適用するポリシーとして適切なポリシーの決定を支援する。
【解決手段】ポリシーサーバ10のポリシー情報DB100は、文書に対する利用制限の方針を表すポリシーと当該ポリシーの特徴情報とを関連づけて記憶する。各ポリシーの特徴情報は、当該ポリシーが適用された複数の文書のそれぞれから取得される各文書の特徴情報に基づいて求められたものである。クライアント20からポリシーを適用する対象文書を特定したポリシー適用要求をポリシーサーバ10が受けると、文書特徴情報抽出部110により対象文書の特徴情報が抽出される。ポリシー候補検索部108は、抽出された対象文書の特徴情報と、ポリシー情報DB100に登録された各ポリシーの特徴情報と、を比較した結果に基づいて、対象文書に適用するポリシーの候補を検索する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
文書の利用制限の方針を表すセキュリティポリシー(以下、単に「ポリシー」と言う)に従って文書の利用を制限し、文書の不正利用を防止する技術がある。このような技術では、利用制限の対象となる文書のそれぞれに対してポリシーを設定しておき、このポリシーに従って各文書の利用が制限される。文書に対して設定されるポリシーは、例えば、各ユーザ又はユーザグループに対して許可又は禁止される操作の種別や、文書の利用が許される有効期間などを表す。また、文書に対してその利用制限に用いるポリシーを設定することを、文書に対するポリシーの「適用」と呼ぶことがある。
【0003】
ポリシーは、文書の運用時に守られるべきセキュリティ要求に応じて複数定義されることがある。例えば、文書が不正利用された際の脅威の度合いに応じて異なる種類のポリシーが定義されたり、その文書の関係者の範囲に応じて異なる種類のポリシーが定義されたりする。複数のポリシーが定義される場合、例えば、サーバに複数のポリシーを登録しておき、利用制限の対象となる文書について、サーバに登録された複数のポリシーから1つを選択し、選択されたポリシーをその文書に対して適用する処理が行われる。
【0004】
例えば、特許文献1には、文書に対してポリシーを適用する際に、ポリシーを管理するポリシーサーバから利用可能なポリシーのリストを取得し、取得したリストをユーザに提示し、提示されたリストの中からユーザが選択したポリシーを対象の文書に適用する技術が開示されている。
【0005】
また、特許文献2に記載の技術では、文書データの出力を管理するシステムにおいて、複数の機密レベルと各機密レベルに対応するキーワードとを予め設定しておき、出力要求がなされた文書データの中にキーワードが含まれているか否かを判定し、出力要求をしたユーザが文書データ中に存在するキーワードに対応する機密レベルの出力権限を有するか否かの判定の結果に従って、出力要求された文書データの出力を制御する。
【0006】
また例えば、特許文献3及び特許文献4には、セキュリティ情報が設定されている文書を蓄積しておき、セキュリティ情報が設定されていない対象文書について、この対象文書と、蓄積されている各文書と、の間の類似度を計算し、蓄積されている文書のうち、対象文書との間の類似度が最も高い文書に設定されているセキュリティ情報を、対象文書に設定すべきセキュリティ情報として選択する技術が開示されている。
【0007】
【特許文献1】特開2007−26109号公報
【特許文献2】特開2006−252231号公報
【特許文献3】特開2006−185153号公報
【特許文献4】特開2007−34618号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
複数のポリシーが定義されている場合に、ある文書に対して適用するポリシーとしてどのポリシーが適切であるかを判断することがユーザにとって困難である場合がある。
【0009】
本発明は、文書に対して適用するポリシーとして適切なポリシーの決定を支援する技術を提供することを目的とする。
【課題を解決するための手段】
【0010】
請求項1に係る発明は、文書に対する利用制限の方針を表す利用制限情報と、前記利用制限情報の特徴を表す特徴情報であって前記利用制限情報に従って利用制限される複数の文書それぞれから取得される当該文書の特徴情報に基づいて求められる特徴情報と、を関連づけて記憶する記憶手段を参照し、利用制限の方針を決定すべき文書を特定した指示に応じて、この指示で特定された文書から取得される当該文書の特徴情報と、前記記憶手段に記憶された複数の利用制限情報のそれぞれに関連づけられた前記特徴情報と、を比較した結果に基づいて、前記複数の利用制限情報の中から、前記特定された文書に対する利用制限に用いられる利用制限情報の候補を選択する選択手段、を備えることを特徴とする情報処理装置である。
【0011】
請求項2に係る発明は、請求項1に係る発明において、前記利用制限情報に従って利用制限される複数の文書それぞれから取得される当該文書の特徴情報及び前記利用制限の方針を決定すべき文書を特定した指示に応じて、この指示で特定された文書から取得される当該文書の特徴情報は、いずれも当該文書の内容に関する特徴を表す値である。
【0012】
請求項3に係る発明は、請求項1又は2に係る発明において、前記利用制限情報に関連づけて前記記憶手段に記憶される特徴情報は、前記利用制限情報に従って利用制限される複数の文書それぞれの前記特徴情報の平均である。
【0013】
請求項4に係る発明は、請求項1から3のいずれか1項に係る発明において、前記選択手段が選択する前記利用制限情報の候補は、少なくとも、前記複数の利用制限情報のうち前記特定された文書の前記特徴情報に最も近い特徴情報に関連づけられた利用制限情報を含む。
【0014】
請求項5に係る発明は、請求項1又は2に係る発明において、前記利用制限情報に関連づけて前記記憶手段に記憶される特徴情報は、前記利用制限情報に従って利用制限される複数の文書からなる集合を当該複数の文書それぞれの前記特徴情報に応じて分割した部分集合ごとの特徴情報を含み、前記部分集合ごとの特徴情報は、当該部分集合に含まれる文書それぞれの前記特徴情報に基づいて求められる。
【0015】
請求項6に係る発明は、請求項5に係る発明において、前記部分集合ごとの特徴情報は、当該部分集合に含まれる文書それぞれの前記特徴情報の平均である。
【0016】
請求項7に係る発明は、請求項5又は6に係る発明において、前記選択手段は、前記特定された文書の前記特徴情報と、前記複数の利用制限情報それぞれに関連づけられた特徴情報に含まれる部分集合ごとの特徴情報と、を比較した結果に基づいて前記利用制限情報の候補を選択する。
【0017】
請求項8に係る発明は、請求項1から7のいずれか1項に係る発明において、前記選択手段が選択した候補に含まれる利用制限情報であって前記特定された文書の利用制限に用いるものとして決定された利用制限情報について、前記特定された文書の前記特徴情報をさらに考慮して当該利用制限情報の特徴情報を求め、求めた特徴情報を前記決定された利用制限情報に関連づけて前記記憶手段に登録する登録手段、をさらに備える。
【0018】
請求項9に係る発明は、文書に対する利用制限の方針を表す利用制限情報と、前記利用制限情報の特徴を表す特徴情報であって前記利用制限情報に従って利用制限される複数の文書それぞれから取得される当該文書の特徴情報に基づいて求められる特徴情報と、を関連づけて記憶する記憶手段を参照可能なコンピュータに、利用制限の方針を決定すべき文書を特定した指示に応じて、この指示で特定された文書から取得される当該文書の特徴情報と、前記記憶手段に記憶された複数の利用制限情報のそれぞれに関連づけられた前記特徴情報と、を比較した結果に基づいて、前記複数の利用制限情報の中から、前記特定された文書に対する利用制限に用いられる利用制限情報の候補を選択するステップ、を実行させることを特徴とするプログラムである。
【発明の効果】
【0019】
請求項1又は9に係る発明によると、文書の利用制限に用いる利用制限情報として適切な利用制限情報の決定を支援できる。
【0020】
請求項2に係る発明によると、ある利用制限情報に従って利用制限される文書の内容の特徴を表す情報に基づく利用制限情報の特徴情報を用いて、その利用制限情報を他の文書の利用制限に用いるか否かを選択できる。
【0021】
請求項3に係る発明によると、ある利用制限情報に従って利用制限される複数の文書の特徴情報を代表する値を当該利用制限情報の特徴情報として用いることができる。
【0022】
請求項4に係る発明によると、利用制限の方針を決定すべき文書の特徴と近い特徴を有する複数の文書に対する利用制限に用いられている利用制限情報を、当該利用制限の方針を決定すべき文書の利用制限に用いる候補として選択できる。
【0023】
請求項5に係る発明によると、ある利用制限情報に従って利用制限される複数の文書がその特徴情報に応じて部分集合に分割可能な場合に、その部分集合ごとの、当該部分集合に含まれる文書の特徴情報に基づく特徴情報を利用できる。
【0024】
請求項6に係る発明によると、ある利用制限情報に従って利用制限される複数の文書の部分集合それぞれに含まれる文書の特徴情報の代表的な値を、当該利用制限情報の特徴情報として用いることができる。
【0025】
請求項7に係る発明によると、ある利用制限情報に従って利用制限される複数の文書がその特徴情報に応じて部分集合に分割可能な場合に、その部分集合ごとの特徴を反映して、文書の利用制限に用いる利用制限情報の候補を選択できる。
【0026】
請求項8に係る発明によると、ある利用制限情報に従って利用制限される文書が新たに追加された場合に、当該文書の特徴情報を考慮して当該利用制限情報の特徴情報を更新できる。
【発明を実施するための最良の形態】
【0027】
図1に、文書の利用を管理するシステムの概略構成の例を示す。図1に例示するシステムは、ポリシーサーバ10、クライアント20−1,20−2,…(以下、クライアント20と総称する)、及びユーザ認証サーバ30がネットワーク40を介して互いに接続された構成を有する。
【0028】
図2に、ポリシーサーバ10の内部構成の概略の例を示す。ポリシーサーバ10は、本システムにおける文書の利用の制限に用いられるポリシーを管理する。ポリシーサーバ10は、ポリシー情報DB(データベース)100、文書情報DB102、新規ポリシー生成部104、ポリシー適用部106、ポリシー候補検索部108、文書特徴情報抽出部110、文書暗号化部112、ポリシー特徴情報生成部114、利用可否情報生成部116、及びポリシー検索部118を備える。
【0029】
ポリシー情報DB100は、ポリシーサーバ10の管理対象のポリシーに関する情報を記憶するデータベースである。図3に、ポリシー情報DB100に登録されるポリシーの内容の例を示す。
【0030】
図3を参照し、各ポリシーは、ポリシーID、利用範囲、有効期間、及び許諾機能リストの各項目により定義される。ポリシーIDは、各ポリシーに付与されるシステム内で一意な識別情報である。利用範囲は、文書に対する操作の実行主体を表し、ユーザ又はグループの識別情報(ユーザID、所属組織名など)により表される。有効期間は、対応する利用範囲で表されるユーザ又はグループが文書を利用できる期間を表す。許諾機能リストは、対応する利用範囲で表されるユーザ又はグループに対して許可される操作の種類を表す。例えば、図3の例の表のポリシーID「134A67B」のポリシーが適用された文書を、所属組織名「システム開発部」に属するユーザが利用する場合、有効期間「2007年2月1日から2007年2月3日まで」の間であれば、「電子文書の閲覧」及び「電子文書の印刷」の操作を実行することが許可される。
【0031】
なお、ポリシーの内容は、図3に例示する態様に限られない。例えば、図3の例の表に示されない項目に加えて、システムの管理者などがポリシーに付与したポリシーの名称などを登録しておいてもよい。また例えば、各利用範囲の実行主体に対応づけて許諾機能リストを登録する代わりに、禁止される操作の種類を登録してもよいし、あるいは、許可される操作の種類と禁止される操作の種類との双方を明示的に示す設定情報を登録してもよい。
【0032】
本実施形態の例では、ポリシー情報DB100は、図3に例示するような各ポリシーの内容に加えて、各ポリシーの特徴を表す特徴情報を記憶する。各ポリシーの特徴情報は、そのポリシーが適用されている文書(すなわち、そのポリシーに従って利用制限される文書)から取得される文書の特徴情報を用いて求められる。図4は、ポリシー情報DB100に記憶される各ポリシーの特徴情報の例を示す。図4を参照し、ポリシー情報DB100は、各ポリシーのポリシーIDに対応づけて、そのポリシーの特徴情報を記憶する。図4の例の表では、特徴情報の項目は、下位項目として「指標ワード1」,「指標ワード2」,…,「指標ワードi」,…を含む。ここで、指標ワードとは、文書の内容の傾向を判断するのに適している単語として予め設定された単語である。i番目の指標ワード(指標ワードi)は、例えば、図5の例の表のように予め設定されて、ポリシー情報DB100又はポリシーサーバ10によりアクセス可能な他の記憶装置に記憶される。再び図4を参照し、「指標ワードi」の項目には、対応するポリシーが適用された文書のそれぞれについて当該文書の内容における当該指標ワードの出現頻度(例.1000文字当りの指標ワードの出現回数)を求め、求めた出現頻度の平均値が登録される。
【0033】
なお、各ポリシーが適用されている文書を特定するための情報及び各文書の特徴情報は、文書情報DB102に記憶される。文書情報DB102は、ポリシーが適用された文書に関する情報を記憶するデータベースである。図6に、文書情報DB102のデータ内容の一例を示す。図6の例の表の1行は、1つの文書に関する情報に対応するレコードである。図6を参照し、各文書に対応するレコードは、文書ID、ポリシーID、及び特徴情報の各項目を含む。文書IDは、各文書に付与されるシステム内で一意な識別情報である。ポリシーIDは、対応するレコードの文書に適用されたポリシーのポリシーIDである。特徴情報は、対応するレコードの文書から取得される特徴情報であり、図6の例の特徴情報の項目は、下位項目として「指標ワードi」を含み、各指標ワードは、ポリシーの特徴情報を示す図4の例の表の各指標ワードに対応する。
【0034】
図4及び図6を参照し、例えば、ポリシーID「134A67B」のポリシー(図4の表の第2行)の特徴情報は、文書情報DB102においてポリシーIDの項目に「134A67B」を含むレコードを抽出し、抽出したレコードの各指標ワードの項目の値の平均を求めることで得られる。
【0035】
以上で説明したポリシーの特徴情報と各文書の特徴情報との間の関係は、例えば、次のように記述できる。n個の指標ワードが予め設定されており、あるポリシーPが適用されている文書がm個存在し、i番目の指標ワードについてのj番目の文書における出現頻度がfi,jである場合、ポリシーPの特徴情報η(P)は、次の式(1)のように表される。
【数1】

ただし、式(1)において、
【数2】

である。
【0036】
式(1)及び式(2)より、ポリシーPの特徴情報η(P)は、ポリシーPが適用されている文書j(j=1,2,…,m)の特徴情報λ(j)=(f1,j,f2,j,…,fn,j)のベクトルの平均であると言える。
【0037】
図7は、式(1)及び式(2)によって求められるポリシーPの特徴情報η(P)と文書jの特徴情報λ(j)の集合との関係を表す概念図の例である。ポリシーPの特徴情報η(P)は、ポリシーPが適用されている文書jの特徴情報λ(j)の集合において代表的な要素を表すものであると言える。
【0038】
図2の説明に戻り、新規ポリシー生成部104は、システムの管理者などからの指示に従って、新規なポリシーを生成する。例えば、新規ポリシー生成部104は、新規なポリシーの内容(例えば、利用範囲、有効期間、許諾機能リストなど)の設定の指示を受け付けて、このポリシーに対して新たなポリシーIDを生成する。そして、生成したポリシーIDに関連づけて、受け付けた設定の指示で表されるポリシーの内容をポリシー情報DB100に登録する。
【0039】
ポリシー適用部106は、ポリシーの適用されていない文書に対してポリシーを適用する処理を行う。ポリシー適用部106は、例えば、ポリシーを適用する対象の文書(以下、「適用対象文書」とも呼ぶ)を含むポリシー適用要求をクライアント20から受けると、ポリシー候補検索部108に依頼してポリシー情報DB100から適用可能なポリシーの候補を検索させ、検索された候補のうちの1つのポリシーを適用対象文書に適用する処理を行う。ポリシーを適用する処理では、ポリシー適用部106は、例えば、適用対象文書を文書暗号化部112により暗号化させ、暗号化された文書に適用したポリシーのポリシーIDを書き込む。このように暗号化されてポリシーIDが書き込まれた文書は、ポリシー適用済み文書としてポリシー適用部106からクライアント20へ送信される。
【0040】
ポリシー候補検索部108は、ポリシー適用部106からの依頼を受けて、適用対象文書に適用するポリシーの候補をポリシー情報DB100から検索する。ポリシー候補検索部108は、例えば、ポリシー情報DB100に登録された各ポリシーの特徴情報と、文書特徴情報抽出部110に依頼して適用対象文書から抽出させた当該文書の特徴情報と、を比較した結果に基づいて、ポリシー情報DB100中のポリシーの中から適用するポリシーの候補を選択する。そして、選択したポリシーの候補を検索結果としてポリシー適用部106に返す。
【0041】
文書特徴情報抽出部110は、ポリシー候補検索部108からの依頼に応じて、適用対象文書から当該文書の特徴情報を抽出する。特徴情報として指標ワードの出現頻度を用いる上述の例の場合、例えば、文書特徴情報抽出部110は、指標ワードを設定するテーブル(図5参照)を参照し、各番号の指標ワードについて、適用対象文書のテキストデータを検索することで各指標ワードの出現頻度を求める。求めた各ワードの出現頻度は、適用対象文書の特徴情報としてポリシー候補検索部108に渡される。
【0042】
文書暗号化部112は、ポリシー適用部106の指示に従って、適用対象文書を暗号化し、暗号化後の文書をポリシー適用部106に返す。
【0043】
ポリシー特徴情報生成部114は、ポリシー情報DB100に登録された各ポリシーの特徴情報を生成する。ポリシー特徴情報生成部114は、例えば、文書情報DB102を参照し、同じポリシーが適用されている複数の文書の特徴情報から、式(1)及び式(2)に従ってそのポリシーの特徴情報を求め、求めた特徴情報をそのポリシーのポリシーIDに関連づけてポリシー情報DB100に登録する。また例えば、ポリシー特徴情報生成部114は、ポリシー適用部106が新たにポリシーを適用した文書の特徴情報を用いて、適用されたポリシーについてポリシー情報DB100に登録された特徴情報を更新する処理を行うこともある。
【0044】
利用可否情報生成部116は、ポリシー適用済み文書についてのクライアント20からの利用要求に応じて、その文書の利用の可否を表す情報を生成する。利用要求は、例えば、ポリシー適用済み文書に含まれるポリシーID、利用要求を行ったユーザの識別情報、及び要求されている操作の種類を表す情報を含む。利用可否情報生成部116は、クライアント20からの利用要求を受けると、例えば、利用要求に含まれるポリシーIDのポリシーをポリシー検索部118に検索させ、検索結果のポリシーの内容と、利用要求を行ったユーザ及び要求されている操作の種類と、を照合することで、要求対象の文書の利用の可否を決定する。この決定を表す情報は、要求元のクライアント20に返送される。
【0045】
ポリシー検索部118は、利用可否情報生成部116から指示されたポリシーIDのポリシーをポリシー情報DB100から検索し、検索結果のポリシーの内容を利用可否情報生成部116に渡す。
【0046】
なお、以上では、ポリシー情報DB100及び文書情報DB102は、ポリシーサーバ10が備えるものとして説明したが、ポリシー情報DB100及び文書情報DB102のデータ内容の一部又は全部を、ポリシーサーバ10の他の各部の機能を実現するサーバ装置からアクセス可能な他のコンピュータなどが備える記憶装置上に実現してもよい。
【0047】
次に、図8を参照し、クライアント20の内部構成の概略の例を説明する。クライアント20は、入力受付部22、表示部24、及び文書操作アプリケーション200を備える。
【0048】
入力受付部22は、キーボードやマウスなどの入力装置(図示しない)を介してユーザにより入力された情報を受け付け、受け付けた入力情報を文書操作アプリケーション200に渡す。
【0049】
表示部24は、ユーザに対して提示される情報を表示する。
【0050】
文書操作アプリケーション200は、ポリシーが適用されていない文書に対してポリシーを適用するための処理を行ったり、ポリシー適用済み文書に対する操作を実行したりする。文書操作アプリケーション200は、ポリシー適用要求部202、ユーザ認証要求部204、文書操作部206、利用可否情報要求部208、及び文書暗号化/復号部210を含む。
【0051】
ポリシー適用要求部202は、入力受付部22を介して取得したユーザからの指示に従って、ポリシーサーバ10に対し、ポリシーが適用されていない文書に対するポリシーの適用を要求する。例えば、ポリシー適用要求部202は、ユーザがポリシーの適用を指示した文書を適用対象文書として含むポリシー適用要求をポリシーサーバ10に対して送信する。
【0052】
ユーザ認証要求部204は、入力受付部22を介して取得した認証情報(例えば、ユーザID及びパスワード)を用いてユーザ認証サーバ30に対してユーザ認証の要求を行い、この要求に応じてユーザ認証サーバ30から返される認証結果を後述の利用可否情報要求部208に渡す。
【0053】
文書操作部206は、ポリシー適用済み文書に対する各種の操作を実行する。文書に対する操作には、例えば、文書の内容の表示部24への表示(ユーザにとっては文書の「閲覧」)、文書の内容の編集、文書の複製、文書の印刷(図示しないプリンタへの文書の印刷指示)、及び文書のスキャン(図示しないスキャナ装置による文書の読み取り)などがある。文書操作部206は、次に述べる利用可否情報要求部208がポリシー適用済み文書に対する操作の実行の可否をポリシーサーバ10に問い合わせた結果、その実行が許可された場合にのみ文書に対する操作を実行する。
【0054】
利用可否情報要求部208は、入力受付部22を介してポリシー適用済み文書に対する操作の実行の要求をユーザから受けた場合に、その操作の実行の可否をポリシーサーバ10に対して問い合わせる。例えば、利用可否情報要求部208は、操作対象のポリシー適用済み文書から当該文書に含まれるポリシーIDを抽出し、このポリシーIDと、ユーザ認証要求部204から取得したユーザ認証の結果が表すユーザIDと、要求されている操作の種類と、を含む利用可否情報要求をポリシーサーバ10に対して送信する。そして、この要求に応じてポリシーサーバ10から返送される利用可否情報を文書操作部206に渡す。
【0055】
文書暗号化/復号部210は、ポリシー適用済み文書に関する暗号化処理又は復号処理を行う。例えば、文書暗号化/復号部210は、文書操作部206が編集などの操作を行った結果の文書を暗号化したり、ポリシー適用済み文書を復号したりする。
【0056】
ユーザ認証サーバ30は、本システムのユーザとして予め登録されたユーザの認証情報を管理し、ユーザ認証を行うサーバである。クライアント20のユーザ認証要求部204は、上述のように、ユーザID及びパスワードなどの認証情報の入力をユーザから受け付けると、受け付けた情報をユーザ認証サーバ30に送信してユーザ認証要求を行う。この要求に応じて、ユーザ認証サーバ30は、ユーザ認証を行い、その結果を要求元の装置に対して返信する。また、ユーザ認証サーバ30は、ユーザのグループとそのグループに所属するユーザとを対応づける情報も管理する。
【0057】
以下、以上で説明した例の構成のシステムで行われる処理の例を説明する。
【0058】
まず、ポリシーが適用されていない文書に対してポリシーを適用する場合の処理の例を説明する。クライアント20において、適用対象文書を指定してポリシーの適用を指示するユーザの入力を入力受付部22が受け付けると、文書操作アプリケーション200のポリシー適用要求部202は、適用対象文書を含むポリシー適用要求をポリシーサーバ10に対して送信する。ポリシー適用要求を受け取ったポリシーサーバ10は、図9に例示する手順の処理を開始する。
【0059】
図9を参照し、まず、ポリシー適用部106は、クライアント20から受け取ったポリシー適用要求に含まれる適用対象文書を取得する(ステップS10)。ポリシー適用部106は、取得した適用対象文書をポリシー候補検索部108に渡すとともに、適用するポリシーの候補の検索を依頼する。ポリシー候補検索部108は、文書特徴情報抽出部110に対し、適用対象文書からの特徴情報の抽出を依頼する。
【0060】
文書特徴情報抽出部110は、適用対象文書から特徴情報を抽出する(ステップS12)。本例では、文書特徴情報抽出部110は、指標ワードの設定(図5参照)を参照して適用対象文書における各指標ワードの出現頻度を求めることで適用対象文書の特徴情報を抽出する。例えば、n個の指標ワードが設定されている場合、i番目の指標ワードの適用対象文書Dにおける出現頻度がfi,Dであるとき、抽出される適用対象文書Dの特徴情報λ(D)は、
λ(D)=(f1,D,f2,D,…,fn,D
と表される。文書特徴情報抽出部110は、抽出した適用対象文書の特徴情報をポリシー候補検索部108に返す。
【0061】
次に、ポリシー候補検索部108は、文書特徴情報抽出部110が抽出した適用対象文書の特徴情報を用いて、ポリシー情報DB100中のポリシーの中から、適用対象文書に適用するポリシーの候補を検索する(ステップS14)。ステップS14では、例えば、ポリシー候補検索部108は、適用対象文書の特徴情報と、ポリシー情報DB100中の各ポリシーの特徴情報(図4参照)と、を比較した結果に応じてポリシーの候補を選択する。例えば、適用対象文書の特徴情報に最も近いと判断される特徴情報を有するポリシーから順に予め設定された個数のポリシーを候補として選択する。特徴情報の「近さ」の判断は、本例では、ユークリッド距離を用いて行う。例えば、上記の式(1),式(2)で表されるポリシーPの特徴情報η(P)と適用対象文書Dの特徴情報λ(D)とを用いて、次の式(3)に従って、適用対象文書Dの特徴情報とポリシーPの特徴情報との間のユークリッド距離dD,Pを求める。
【数3】

ポリシー候補検索部108は、ポリシー情報DB100中のポリシーのそれぞれについて、式(3)に従って適用対象文書の特徴情報λ(D)との間のユークリッド距離を求める。そして、例えば、求めたユークリッド距離の値が最小であるものから順に予め設定された個数のポリシーを、適用するポリシーの候補とする。あるいは、例えば、求めたユークリッド距離が予め設定された閾値以下であるポリシーを、適用するポリシーの候補としてもよい。ポリシー候補検索部108は、検索したポリシーの候補をポリシー適用部106に渡す。
【0062】
ポリシー候補検索部108からポリシーの候補を受け取ったポリシー適用部106は、受け取ったポリシーの候補の中から、適用対象文書に対して適用するポリシーを1つ決定する(ステップS16)。この決定は、例えば、ユーザの選択に従って行う。ユーザの選択に従って決定する場合、例えば、ポリシー適用部106は、クライアント20に対して、ポリシーの候補のリストを送信し、このリストを受け取ったクライアント20において、表示部24にリストを表示させ、入力受付部22を介してユーザの選択を受け付ける。リストの中から1つのポリシーをユーザが選択すると、その選択の結果を表す情報がクライアント20からポリシーサーバ10に対して返送され、ポリシー適用部106は、この選択結果が表すポリシーを適用対象文書に適用するポリシーとして決定する。
【0063】
適用するポリシーが決定されると、ポリシー適用部106は、文書暗号化部112に指示して適用対象文書を暗号化させる(ステップS18)。なお、ステップS18の暗号化は、クライアント20の文書操作アプリケーション200が備える文書暗号化/復号部210によってのみ復号が可能な方法で行われる。その後、適用対象文書の文書IDを生成し、当該文書IDとステップS16で決定したポリシーのポリシーIDを暗号化された文書に書き込む(ステップS20)。暗号化されて文書IDとポリシーIDが書き込まれた適用対象文書は、ポリシー適用済み文書としてポリシー適用部106からクライアント20に対して送信される(ステップS22)。また、ポリシー適用部106は、適用対象文書の文書IDと関連づけて、ステップS16で決定したポリシーのポリシーIDと適用対象文書の特徴情報とを文書情報DB102に登録する。なお、適用対象文書の文書IDを生成するタイミングは、適用対象文書の暗号化の前であってもよい。
【0064】
ポリシー適用部106が適用対象文書にポリシーを適用すると、ポリシー特徴情報生成部114は、適用対象文書の特徴情報を用いて、適用されたポリシー(ステップS16で決定されたポリシー)の特徴情報を更新する処理を行う(ステップS24)。
【0065】
以下、ステップS24の処理の具体例を説明する。適用対象文書Dの特徴情報λ(D)=(f1,D,f2,D,…,fn,D)、適用対象文書Dに適用されたポリシーPの現在の特徴情報η(P)=(F,F,…,F)とし、適用対象文書DにポリシーPを適用する前に、ポリシーPが適用されていた文書の個数がmであるとすると、ポリシー特徴情報生成部114は、次の式(4)に従ってポリシーPの更新後の特徴情報η´(P)=(F´,F´,…,F´)のベクトルの各要素F´の値を求める。
【数4】

ポリシーの特徴情報の更新処理(ステップS24)が終了すると図9の例の手順の処理は終了する。
【0066】
図9に例示する手順では、ステップS14でポリシー候補検索部108が検索した複数のポリシーの候補の中から、1つのポリシーを適用するポリシーとして決定する処理(ステップS16)を行うが、ポリシー候補検索部108は、ポリシーの候補を1つだけ検索結果としてポリシー適用部106に返すものであってもよい。例えば、ポリシー候補検索部108は、適用対象文書の特徴情報と最も近い特徴情報を有する1つのポリシーをポリシー適用部106に検索結果として返してもよい。この例の場合、当該1つのポリシーを適用するポリシーとし、ステップS16を省略してステップS18以下の処理が行えばよい。あるいは、当該1つのポリシーを実際に適用対象文書に適用するか否かをユーザに問い合わせる情報をステップS16でクライアント20に対して送信してもよい。そして、クライアント20において入力されたユーザの指示をクライアント20から受け取り、受け取ったユーザの指示が、当該1つのポリシーを適用対象文書に適用することを指示するものである場合にのみステップS18以降の処理を実行するようにしてもよい。
【0067】
次に、図10及び図11を参照し、ポリシー適用済み文書をユーザが利用するときの処理の例を説明する。
【0068】
図10は、ポリシー適用済み文書の利用時のクライアント20における処理の手順の例を示すフローチャートである。図10に例示する手順の処理は、例えば、クライアント20において、ユーザが利用を望む対象のポリシー適用済み文書と、当該文書に対してユーザが実行を望む操作の種類と、の入力を入力受付部22が受け付けて文書操作アプリケーション200に渡したときに開始される。
【0069】
図10を参照し、まず、クライアント20の文書操作アプリケーション200のユーザ認証要求部204は、ユーザ認証サーバ30に対してユーザ認証要求を行う(ステップS30)。ユーザ認証要求は、例えば、ユーザが入力した認証情報(例えば、ユーザID及びパスワード)を含む。ユーザ認証サーバ30は、クライアント20からのユーザ認証要求に含まれる認証情報を用いてユーザ認証を行い、その成功又は失敗を表す情報をクライアント20に対して返送する。
【0070】
ユーザ認証の成功を表す情報をユーザ認証サーバ30からユーザ認証要求部204が受け取った場合(ステップS32でYES)、処理はステップS34に進み、ユーザ認証の失敗を表す情報を受け取った場合(ステップS32でNO)、エラー処理(ステップS46)が行われる。エラー処理では、例えば、文書操作アプリケーション200は、エラーの内容(ここでは、ユーザ認証の失敗)を表す情報を表示部24に表示させる。
【0071】
ステップS34で、利用可否情報要求部208は、ユーザが指定したポリシー適用済み文書に含まれるポリシーIDを取得する。そして、利用可否情報要求部208は、ステップS34で取得したポリシーIDと、ユーザ認証処理(ステップS30)において入力されたユーザIDと、実行が望まれる操作の種類を表す情報と、を含む利用可否情報要求をポリシーサーバ10に対して行う(ステップS36)。
【0072】
ここで、図11を参照し、図10のステップS36の利用可否情報要求を受け取ったポリシーサーバ10で実行される処理の手順の例を説明する。ポリシーサーバ10の利用可否情報生成部116は、クライアント20から受け取った利用可否情報要求に含まれるポリシーIDをポリシー検索部118に渡すと共に、当該ポリシーIDのポリシーの検索を依頼する。この依頼を受けて、ポリシー検索部118は、当該ポリシーIDに関連づけてポリシー情報DB100に登録されたポリシーの内容(図3参照)を検索する(ステップS50)。ポリシー検索部118は、検索結果のポリシーの内容を利用可否情報生成部116に渡す。
【0073】
利用可否情報生成部116は、ポリシー検索部118から受け取ったポリシーの内容と、利用可否情報要求中のユーザID及び操作の種類と、を照合し、対象のユーザに対して指定された種類の操作の実行が許可されているか否かを判定する(ステップS52)。例えば、要求中のユーザIDが当該ポリシーで設定された「利用範囲」に該当し、現在の日時が該当する「利用範囲」に対応づけられた「有効期間」内であって、かつ、該当する「利用範囲」に対応づけられた「許諾機能リスト」に要求中の操作の種類が含まれる場合に、その操作の実行が許可されていると判定し、その他の場合には当該操作の実行が許可されていないと判定する。1つの具体例として、ポリシー検索部118から受け取ったポリシーが図3の例の表のポリシーID「AA34D3」のポリシーである場合、利用可否情報要求中のユーザIDが「利用範囲」の項目で設定された「所属組織名:人事部」又は「ユーザID:17839」に該当するか否かを調べ、該当しない場合は、その操作の実行(つまり、文書の利用)は許可されていないと判定する。ここで、要求中のユーザIDのユーザが、あるグループに所属するか否かは、例えば、ユーザ認証サーバ30に問い合わせて判定すればよい。また例えば、ポリシーID「AA34D3」のポリシーの例で、利用可否情報要求中のIDが「所属組織名:人事部」に該当し、現在の日時が「有効期間」で設定された「2007年3月1日から2007年8月31日まで」の期間内であり、かつ、利用可否情報要求中の操作の種類が「許諾機能リスト」に含まれる「電子文書の閲覧」であれば、その操作の実行は許可されていると判定する。
【0074】
利用可否情報生成要求中のユーザIDのユーザに当該要求中の種類の操作の実行が許可されていると判定された場合(ステップS52でYES)、利用可否情報生成部116は、利用許可を表す情報を生成してクライアント20に送信する(ステップS54)。対象のユーザに当該要求中の種類の操作の実行が許可されていないと判定された場合(ステップS52でNO)、利用可否情報生成部116は、利用不可を表す情報を生成してクライアント20に送信する(ステップS56)。ステップS54又はステップS56の後、図11の例の手順の処理は終了する。
【0075】
再び図10を参照し、利用許可を表す情報又は利用不可を表す情報をポリシーサーバ10から受け取ったクライアント20において、ステップS38以下の処理が行われる。
【0076】
ポリシーサーバ10から利用許可を表す情報を受け取った場合(ステップS38でYES)、文書操作アプリケーション200の文書操作部206は、文書暗号化/復号部210に依頼して操作対象のポリシー適用済み文書を復号させる(ステップS40)。そして、文書操作部206は、復号されたポリシー適用済み文書に対し、ユーザが指定した種類の操作を実行する(ステップS42)。操作の実行後、文書操作部206は、文書暗号化/復号部210に依頼してポリシー適用済み文書を暗号化させる(ステップS44)。
【0077】
一方、ポリシーサーバ10から利用不可を表す情報を受け取った場合(ステップS38でNO)、文書操作アプリケーション200は、エラー処理を行う(ステップS46)。ステップS44又はステップS46の後、図10に例示する手順の処理は終了する。
【0078】
以上で説明した実施形態の例では、各ポリシーについて、ポリシーPが適用されている文書の特徴情報の集合の平均をとることで1つの特徴情報η(P)を求める。他の実施形態の例では、図12に例示するように、ポリシーPが適用されている文書の特徴情報の集合を複数の部分集合に分割し、その部分集合ごとに特徴情報を求めてもよい。本例の場合、ポリシー情報DB100に登録される各ポリシーの特徴情報は、例えば、図13の表に示すような内容となる。
【0079】
図13を参照すると、各ポリシーの特徴情報は、「部分集合番号」の項目で表される部分集合ごとに登録されている。例えば、図13の例の表のポリシーID「134A67B」のポリシーは、部分集合番号「1」の部分集合に含まれる文書の特徴情報から求められた部分集合「1」の特徴情報と、部分集合番号「2」の部分集合に含まれる文書の特徴情報から求められた部分集合「2」の特徴情報と、を有する。
【0080】
各ポリシーが適用された文書の特徴情報の部分集合(以下、単に「各ポリシーの部分集合」と言うこともある)ごとの特徴情報を求めるため、本実施形態の例では、文書情報DB102は、各文書に適用されたポリシーIDに加えて、その文書(の特徴情報)が所属する部分集合の番号も記憶する。図14に、本実施形態の例の文書情報DB102のデータ内容の一例を示す。各ポリシーの部分集合ごとの特徴情報は、文書情報DB102において同じポリシーID及び部分集合番号の組を有するレコードを抽出し、抽出したレコードの各指標ワードの平均を求めることで得られる。
【0081】
以上で説明した本実施形態の例の各ポリシーの特徴情報をより一般的に記述すると次のとおりである。n個の指標ワードがあり、あるポリシーPの部分集合番号kの部分集合Pに属する文書がmPk個あり、部分集合P中のj番目の文書におけるi番目の指標ワードの出現頻度がfi,jである場合、あるポリシーPの部分集合番号kの部分集合Pの特徴情報η(P)は、以下の式(5)のように表される。
【数5】

ただし、式(5)において、
【数6】

である。
【0082】
なお、本実施形態の例において、必ずしもすべてのポリシーが複数の部分集合を有していなくてもよい。例えば、図13の例の表のポリシーID「AA34D3」のポリシーは、部分集合番号「1」の部分集合を1つだけ有する。ポリシーID「AA34D3」のポリシーの特徴情報は、図4を参照して説明した上述の実施形態と同様に、当該ポリシーが適用された文書の特徴情報の集合の全要素の値を平均することにより求められる。
【0083】
ポリシーPが適用されている文書jの特徴情報λ(j)の集合を複数の部分集合に分割する方法としては、例えば、データ間の非類似度(距離)を用いてデータの集合を部分集合に分類する技術として公知である各種のクラスタリングの手法のいずれかを採用すればよい。代表的なクラスタリング手法には、例えば、以下に概要を述べるk−means法及び凝集型階層クラスタリングなどがある。
【0084】
<k−means法>
k−means法では、クラスタに分割する対象の集合U(以下、「入力データ集合U」と呼ぶ)をk個のクラスタ(部分集合)に分割したときの、その分割の良さを表す目的関数(式(7))を最小とするような分割を求める。
【数7】

ここで、cは、クラスタCのセントロイドと呼ばれ、次の式(8)で表される。
【数8】

入力データ集合U及び分割するクラスタの個数kが与えられると、以下のステップに従った処理が行われる。
1.入力データ集合Uをランダムにk個の初期クラスタに分割する。
2.各クラスタCのセントロイドcを求める。
3.入力データ集合Uのすべての要素xを、各クラスタCのセントロイドcとの距離D(x,c)が最小となるクラスタCに割り当てる。
4.各クラスタへの割り当てに変化がないか、予め設定された繰り返し回数を超えていたら処理を終了し、そうでなければ、ステップ2に戻る。
以上のステップ1〜ステップ4に従った処理を異なる初期クラスタについて複数回実行し、式(7)の目的関数を最小とする分割を得る。
【0085】
<凝集型階層クラスタリング>
凝集型階層クラスタリングでは、入力データ集合Uが与えられると、まず、入力データ集合Uの1つの要素だけを含むクラスタがN個存在する状態を初期状態として生成する(すなわち、Nは、入力データ集合Uの要素数である)。この初期状態から開始して、入力データ集合Uの要素xと要素xとの間の距離D(x,x)から、要素x,xのそれぞれを含むクラスタC,C間の距離D(C,C)を計算し、計算したクラスタ間の距離が最も小さいクラスタ同士を逐次的に併合していく処理を、入力データ集合Uの全要素が1つのクラスタに併合されるまで繰り返すことで階層構造を取得する。要素間の距離D(x1,x2)としては、例えば、ユークリッド距離を用いる。クラスタ間の距離D(C1,C2)を求める距離関数としては、以下の例のような関数が提案されている。
・最短距離法(又は単連結法)
【数9】

・最長距離法(又は完全連結法)
【数10】

・群平均法
【数11】

・Ward法
【数12】

ただし、
【数13】

なお、クラスタリングの手法を記載した文献の例として、宮本定明,「クラスター分析入門 ファジィクラスタリングの理論と応用」,森北出版株式会社,1999年が挙げられる。
【0086】
ポリシーPが適用されている文書の特徴情報λ(j)の集合{λ(1),λ(2),…,λ(j),…,λ(m)}を入力データ集合Uとして上述の各種の例の手法を適用することで、文書の特徴情報λ(j)の集合を、互いに類似する特徴情報を含む部分集合に分割できる。
【0087】
以下、図12〜図14を参照して上記で説明した本実施形態の例において、新たに文書にポリシーを適用する場合のポリシーサーバ10における処理の例を説明する。本例においても、ポリシーサーバ10における全体的な処理の手順は、上記で説明した図9に例示するフローチャートと同様である。ただし、本例では、ポリシーサーバ10のポリシー候補検索部108は、文書に適用するポリシーの候補を検索する処理(ステップS14)において、適用対象文書Dの特徴情報λ(D)と、各ポリシーPが適用された文書の特徴情報の部分集合Pごとに登録された特徴情報η(P)と、の間の比較を行う。つまり、図13の例の表の1行で表される特徴情報ごとに、適用対象文書Dの特徴情報λ(D)との間のユークリッド距離を求める。そして、求めたユークリッド距離が最小であるものから順に予め設定された個数の特徴情報η(P)を選択するか、あるいは、予め設定された閾値以下である特徴情報η(P)を選択し、選択された特徴情報η(P)に対応するポリシーPを、適用するポリシーの候補とする。このとき、選択された特徴情報η(P)のうちの複数が同じ1つのポリシーPの異なる部分集合の特徴情報であれば、適用するポリシーの候補は、当該1つのポリシーPを含む。なお、ステップS14で、適用するポリシーの候補を1つだけ検索結果として返す場合は、求めたユークリッド距離が最小であるη(P)に対応する1つのポリシーを検索結果とすればよい。
【0088】
ステップS14の後、ステップS16(適用するポリシーの決定)〜ステップS22(ポリシー適用済み文書の送信)までは、本実施形態の例においても、上記ですでに説明したとおりの処理と同様に行われる。
【0089】
ステップS24のポリシーの特徴情報の更新処理では、適用対象文書Dに適用されたポリシーPに関し、ステップS14で適用対象文書Dの特徴情報λ(D)との間のユークリッド距離が上述の各例の条件(最小、最小から所定数、又は所定の閾値以下)を満たすとして選択された特徴情報η(P)を有する部分集合Pの特徴情報を更新する。すなわち、適用対象文書Dを部分集合Pに含まれる文書として部分集合Pの特徴情報η(P)を更新する。更新後の特徴情報η´(P)=(F´,F´,…,F´)は、適用対象文書Dの特徴情報λ(D)=(f1,D,f2,D,…,fn,D)、適用されたポリシーPの部分集合Pの現在の特徴情報η(P)=(F,F,…,F)とし、適用対象文書DにポリシーPを適用する前に部分集合Pに含まれていた文書の個数をmとして、前述の式(4)に従って求めればよい。また、ポリシー適用部106は、適用対象文書Dについて文書情報DB102への登録を行う際、適用対象文書Dの文書IDに関連づけて、このポリシーPのポリシーIDと、当該ポリシーPの部分集合Pの部分集合番号kと、適用対象文書Dの特徴情報λ(D)とを登録する。
【0090】
なお、適用されたポリシーPに関して、ステップS14で、ポリシーPの複数の部分集合P,Pの各特徴情報η(P),η(P)が条件を満たす特徴情報として選択されていた場合、例えば、各特徴情報η(P),η(P)のうち、適用対象文書Dの特徴情報λ(D)との間のユークリッド距離がより小さい方の部分集合の特徴情報を上記と同様に更新すればよい。
【0091】
以上、図1〜14を参照して説明した各種の実施形態の例では、ポリシーを文書に適用するときに、ポリシーサーバ10において適用対象文書の特徴情報を抽出し、抽出された特徴情報を用いてポリシーの候補の検索が行われる。さらに他の実施形態の例では、クライアント20において適用対象文書の特徴情報の抽出を行ってポリシーサーバ10へ送信し、ポリシーサーバ10は、クライアント20から受け取った適用文書の特徴情報を用いてポリシーの候補の検索を行う。この実施形態の例のクライアント20及びポリシーサーバ10の内部構成の概略の例を、それぞれ、図15及び図16に示す。
【0092】
まず、図15を参照し、本実施形態の例のクライアント20の構成例を説明する。図15において、図8に例示するクライアント20の構成要素と同様の構成要素には図8と同様の符号を付しており、その詳細な説明を省略する。図15の例のクライアント20は、文書操作アプリケーション200において、ポリシー適用要求部202(図8)に替えてポリシー適用処理部220を備える点で図8の例のクライアント20と異なる。
【0093】
ポリシー適用処理部220は、文書にポリシーを適用するための処理を行う。ポリシー適用処理部220は、文書特徴情報抽出部222、ポリシー候補要求部224、ポリシー適用部226、及びポリシー適用情報登録要求部228を備える。
【0094】
文書特徴情報抽出部222は、入力受付部22を介してユーザから指定された適用対象文書から当該文書の特徴情報を抽出する。例えば、クライアント20がアクセス可能な記憶装置(図示しない)に図5の例のような指標ワードの設定テーブルを予め記憶させておき、文書特徴情報抽出部222において、その設定テーブルを参照し、各番号の指標ワードについて、適用対象文書Dのテキストデータを検索することで各指標ワードiの出現頻度fi,Dを求める。そして、文書特徴情報抽出部222は、求めた各ワードの出現頻度を適用対象文書Dの特徴情報λ(D)とする。
【0095】
ポリシー候補要求部224は、ポリシーサーバ10に対して、適用対象文書に適用するポリシーの候補を要求する。このポリシー候補要求は、文書特徴情報抽出部222が抽出した適用対象文書Dの特徴情報λ(D)を含む。
【0096】
ポリシー適用部226は、ポリシー候補要求部224が行ったポリシー候補要求に応じてポリシーサーバ10から提供されるポリシーの候補の中から選択した1つのポリシーを適用対象文書に適用する処理を行う。例えば、ポリシー適用部226は、文書暗号化/復号部に依頼して適用対象文書を暗号化させた上で、適用対象文書の文書IDを生成し、当該文書IDと、選択したポリシーのポリシーIDを暗号化された適用対象文書に書き込む処理を行って、ポリシー適用済み文書を生成する。なお、適用対象文書の文書IDを生成するタイミングは、適用対象文書の暗号化の前であってもよい。
【0097】
ポリシー適用情報登録要求部228は、ポリシー適用部226が適用対象文書にポリシーを適用する処理を行ったときに、その旨に関する情報をポリシーサーバ10に登録する要求をポリシーサーバ10に対して行う。例えば、ポリシー適用情報登録要求部228は、適用対象文書の文書ID、文書特徴情報抽出部222が抽出した適用対象文書の特徴情報、及び適用対象文書に適用されたポリシーのポリシーIDを含む登録要求をポリシーサーバ10に対して送信する。この登録要求に応じて、ポリシーサーバ10において、適用対象文書に対するポリシーの適用に関する情報が登録される。
【0098】
次に、図16を参照し、本実施形態の例のポリシーサーバ10の構成例を説明する。図16において、図2に例示するポリシーサーバ10の構成要素と同様の構成要素には図2と同様の符号を付しており、その詳細な説明を省略する。
【0099】
ポリシー候補検索部108´は、クライアント20のポリシー候補要求部224からのポリシー候補要求に応じて、ポリシー情報DB100からポリシーの候補を検索する。例えば、ポリシー候補要求に含まれる適用対象文書の特徴情報と、ポリシー情報DB100に登録された各ポリシーの特徴情報と、を比較した結果に基づいて、適用対象文書に適用するポリシーの候補を選択する。ポリシー候補検索部108´は、選択したポリシーの候補を検索結果としてクライアント20に返送する。
【0100】
ポリシー適用情報登録部120は、クライアント20のポリシー適用情報登録要求部228からの登録要求に応じて、適用対象文書に対するポリシーの適用に関する情報を文書情報DB102に登録する処理を行う。例えば、ポリシー適用情報登録部120は、クライアント20からの登録要求から、適用対象文書の文書ID、適用対象文書の特徴情報、及び適用されたポリシーのポリシーIDを取得し、文書情報DB102(図6参照)において、取得した文書IDに関連づけて、取得したポリシーID及び特徴情報を登録する。
【0101】
図17は、図15及び図16にそれぞれ例示するクライアント20及びポリシーサーバ10において、文書にポリシーを適用するときに行われる処理の手順の例を示すフローチャートである。
【0102】
図17を参照し、クライアント20の文書操作アプリケーション200において、入力受付部22を介してユーザから適用対象文書の指定を受け付けると、まず、文書特徴情報抽出部222は、指定された適用対象文書から特徴情報を抽出する(ステップS60)。本例のステップS60では、図9のステップS14を参照して説明したのと同様に、適用対象文書Dの特徴情報λ(D)=(f1,D,f2,D,…,fn,D)を抽出する(fi,Dは指標ワードiの出現頻度)。次に、ポリシー候補要求部224は、ステップS60で抽出された適用対象文書Dの特徴情報λ(D)を含むポリシー候補要求をポリシーサーバ10に対して送信する(ステップS62)。
【0103】
ポリシー候補要求を受け取ったポリシーサーバ10において、ポリシー候補検索部108´は、ポリシー候補要求に含まれる適用対象文書Dの特徴情報λ(D)を用いて、適用するポリシーの候補をポリシー情報DB100から検索する(ステップS90)。ステップS90のポリシーの候補の検索処理は、図9のステップS14を参照して説明したポリシー候補検索部108による処理と同様であってよい。ポリシー候補検索部108´は、検索結果のポリシーの候補をクライアント20に対して送信する(ステップS92)。このとき、ポリシー候補検索部108´は、検索結果のポリシーの候補について、例えば、図3の例の表に示すような内容をクライアント20に対して送信する。
【0104】
ポリシーの候補をポリシーサーバ10から受け取ったクライアント20において、文書操作アプリケーション200のポリシー適用部226は、受け取った候補の中から1つのポリシーを適用対象文書に適用するポリシーとして決定する(ステップS64)。例えば、受け取ったポリシーの候補を表示部24に表示させてユーザの選択を受け付け、ユーザが選択したポリシーを適用するポリシーとして決定する。なお、ポリシーサーバ10から受け取ったポリシーの候補が1つだけである場合、当該1つのポリシーの候補を適用するポリシーとして決定すればよい。
【0105】
適用するポリシーを決定すると、ポリシー適用部226は、文書暗号化/復号部210に依頼して適用対象文書を暗号化させる(ステップS66)。次に、適用対象文書の文書IDを生成し、当該文書IDと、ステップS64で決定したポリシーのポリシーIDを暗号化された適用対象文書に書き込む(ステップS68)。その後、ポリシー適用情報登録要求部228は、適用対象文書の文書ID、適用対象文書の特徴情報、及び適用されたポリシーのポリシーIDを含む登録要求をポリシーサーバ10に対して行う(ステップS70)。なお、適用対象文書の文書IDを生成するタイミングは、適用対象文書の暗号化の前であってもよい。
【0106】
クライアント20からの登録要求を受けたポリシーサーバ10において、ポリシー適用情報登録部120は、登録要求に含まれる情報を文書情報DB102に登録する(ステップS94)。例えば、文書情報DB102において、登録要求中の文書IDに対応づけて、登録要求中のポリシーID及び特徴情報を登録する。
【0107】
以上で説明した各種の実施形態の例において、ポリシー情報DB100に登録される各ポリシーの特徴情報は、各ポリシーと当該ポリシーが適用された文書とを関連づける情報を用いて、新たに文書にポリシーを適用する処理(図9又は図17)の実行開始の前に、ポリシーサーバ10のポリシー特徴情報生成部114により生成される。
【0108】
また、ポリシーの特徴情報の更新処理(図9のステップS24参照)は、図9の例の手順のように新たに文書にポリシーが適用される度に行うのではなく、予め設定された期間ごとに、あるいは、システムの管理者などが指定したタイミングで、前回の更新処理の後から現在までに新たに文書に適用されたポリシーに関して行ってもよい。あるいは、新たにポリシーが適用されて文書情報DB102に登録された文書の数が予め設定された閾値を越えた時点で、これらの新たに登録された文書に適用されたポリシーの特徴情報を更新してもよい。
【0109】
また、各ポリシーが適用された文書の特徴情報の部分集合ごとの特徴情報を求める例(図12〜図14参照)では、適用されたポリシーの部分集合Pの特徴情報を更新する上述の処理の代わりに、あるいは、その処理に加えて、文書の特徴情報の集合を部分集合に分割するクラスタリング処理を再度実行し、新たに生成した部分集合ごとに文書の特徴情報の平均を再計算する更新処理を行ってもよい。クラスタリング処理の再実行及びそれに伴う部分集合ごとの特徴情報の再計算についても、予め設定された期間ごとに、あるいは、システムの管理者などが指定したタイミングで実行すればよい。例えば、ポリシーサーバ10の処理負荷が比較的小さいと予想される時間帯(システムの利用者が少ない夜間など)にクラスタリング処理の再実行を行うように設定しておく。
【0110】
また、以上では、予め設定された指標ワードの出現頻度を文書又はポリシーの特徴情報として用いる場合を例にとり、各種の実施形態の例を説明した。文書の特徴情報は、文書の特徴を表す情報であれば、文書における指標ワードの出現頻度の他のものを用いてもよい。例えば、文書内容全体における指標ワードの出現頻度の代わりに、文書の前半部分又は後半部分における指標ワードの出現頻度を特徴情報のベクトルの一要素としてもよい。また例えば、ある特定のフォームに従った文書を処理する場合、そのフォーム中の所定の要素に特定のキーワードが含まれているか否かを特徴情報の一要素(例えば、0又は1の値をとる)とすることが考えられる。また例えば、文書の属性情報として文書の内容の要約やタイトルを含む文書を処理する場合、その要約やタイトルに特定のキーワードが含まれているか否かを特徴情報の一要素とすることも考えられる。
【0111】
以上で説明した各種の実施形態の例のポリシーサーバ10は、典型的には、汎用のコンピュータにてポリシーサーバ10の各部の機能又は処理内容を記述したプログラムを実行することにより実現される。コンピュータは、例えば、ハードウエアとして、図18に示すように、CPU(中央演算装置)90、メモリ(一次記憶)91、各種I/O(入出力)インタフェース92等がバス93を介して接続された回路構成を有する。また、そのバス93に対し、例えばI/Oインタフェース92経由で、HDD(ハードディスクドライブ)94やCDやDVD、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体を読み取るためのディスクドライブ95が接続される。このようなドライブ94又は95は、メモリに対する外部記憶装置として機能する。実施形態の処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク経由で、HDD94等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがメモリに読み出されCPUにより実行されることにより、実施形態の処理が実現される。クライアント20についても同様である。
【図面の簡単な説明】
【0112】
【図1】文書の利用を管理するシステムの概略構成の例を示すブロック図である。
【図2】ポリシーサーバの内部構成の概略の例を示すブロック図である。
【図3】ポリシー情報DBに登録されるポリシーの内容の例を示す図である。
【図4】ポリシー情報DBに登録される各ポリシーの特徴情報の例を示す図である。
【図5】指標ワードの設定の例を表す図である。
【図6】文書情報DBのデータ内容の例を示す図である。
【図7】あるポリシーが適用された文書の特徴情報の集合と当該ポリシーの特徴情報との関係の例を表す概念図である。
【図8】クライアントの内部構成の概略の例を示すブロック図である。
【図9】文書にポリシーを適用するときにポリシーサーバで行われる処理の手順の例を示すフローチャートである。
【図10】ポリシー適用済み文書をユーザが利用するときにクライアントで行われる処理の手順の例を示すフローチャートである。
【図11】ポリシー適用済み文書をユーザが利用するときにポリシーサーバで行われる処理の手順の例を示すフローチャートである。
【図12】あるポリシーが適用された文書の特徴情報の集合と当該ポリシーの特徴情報との関係の他の例を表す概念図である。
【図13】ポリシー情報DBに登録される各ポリシーの特徴情報の他の例を示す図である。
【図14】文書情報DBのデータ内容の他の例を示す図である。
【図15】クライアントの内部構成の概略の他の例を示すブロック図である。
【図16】ポリシーサーバの内部構成の概略の他の例を示すブロック図である。
【図17】文書にポリシーを適用するときにクライアント及びポリシーサーバで行われる処理の他の手順の例を示すフローチャートである。
【図18】コンピュータのハードウエア構成の例を示す図である。
【符号の説明】
【0113】
10 ポリシーサーバ、20 クライアント、22 入力受付部、24 表示部、30 ユーザ認証サーバ、40 ネットワーク、90 CPU、91 メモリ、92 I/Oインタフェース、93 バス、94 HDD、95 ディスクドライブ、100 ポリシー情報DB、102 文書情報DB、104 新規ポリシー生成部、106,226 ポリシー適用部、108,108´ ポリシー候補検索部、110,222 文書特徴情報抽出部、112 文書暗号化部、114 ポリシー特徴情報生成部、116 利用可否情報生成部、118 ポリシー検索部、120 ポリシー適用情報登録部、200 文書操作アプリケーション、202 ポリシー適用要求部、204 ユーザ認証要求部、206 文書操作部、208 利用可否情報要求部、210 文書暗号化/復号部、220 ポリシー適用処理部、224 ポリシー候補要求部、228 ポリシー適用情報登録要求部。

【特許請求の範囲】
【請求項1】
文書に対する利用制限の方針を表す利用制限情報と、前記利用制限情報の特徴を表す特徴情報であって前記利用制限情報に従って利用制限される複数の文書それぞれから取得される当該文書の特徴情報に基づいて求められる特徴情報と、を関連づけて記憶する記憶手段を参照し、
利用制限の方針を決定すべき文書を特定した指示に応じて、この指示で特定された文書から取得される当該文書の特徴情報と、前記記憶手段に記憶された複数の利用制限情報のそれぞれに関連づけられた前記特徴情報と、を比較した結果に基づいて、前記複数の利用制限情報の中から、前記特定された文書に対する利用制限に用いられる利用制限情報の候補を選択する選択手段、
を備えることを特徴とする情報処理装置。
【請求項2】
前記利用制限情報に従って利用制限される複数の文書それぞれから取得される当該文書の特徴情報及び前記利用制限の方針を決定すべき文書を特定した指示に応じて、この指示で特定された文書から取得される当該文書の特徴情報は、いずれも当該文書の内容に関する特徴を表す値である、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記利用制限情報に関連づけて前記記憶手段に記憶される特徴情報は、前記利用制限情報に従って利用制限される複数の文書それぞれの前記特徴情報の平均である、
ことを特徴とする請求項1又は2に記載の情報処理装置。
【請求項4】
前記選択手段が選択する前記利用制限情報の候補は、少なくとも、前記複数の利用制限情報のうち前記特定された文書の前記特徴情報に最も近い特徴情報に関連づけられた利用制限情報を含む、
ことを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
前記利用制限情報に関連づけて前記記憶手段に記憶される特徴情報は、前記利用制限情報に従って利用制限される複数の文書からなる集合を当該複数の文書それぞれの前記特徴情報に応じて分割した部分集合ごとの特徴情報を含み、
前記部分集合ごとの特徴情報は、当該部分集合に含まれる文書それぞれの前記特徴情報に基づいて求められる、
ことを特徴とする請求項1又は2に記載の情報処理装置。
【請求項6】
前記部分集合ごとの特徴情報は、当該部分集合に含まれる文書それぞれの前記特徴情報の平均である、
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記選択手段は、前記特定された文書の前記特徴情報と、前記複数の利用制限情報それぞれに関連づけられた特徴情報に含まれる部分集合ごとの特徴情報と、を比較した結果に基づいて前記利用制限情報の候補を選択する、
ことを特徴とする請求項5又は6に記載の情報処理装置。
【請求項8】
前記選択手段が選択した候補に含まれる利用制限情報であって前記特定された文書の利用制限に用いるものとして決定された利用制限情報について、前記特定された文書の前記特徴情報をさらに考慮して当該利用制限情報の特徴情報を求め、求めた特徴情報を前記決定された利用制限情報に関連づけて前記記憶手段に登録する登録手段、
をさらに備えることを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
【請求項9】
文書に対する利用制限の方針を表す利用制限情報と、前記利用制限情報の特徴を表す特徴情報であって前記利用制限情報に従って利用制限される複数の文書それぞれから取得される当該文書の特徴情報に基づいて求められる特徴情報と、を関連づけて記憶する記憶手段を参照可能なコンピュータに、
利用制限の方針を決定すべき文書を特定した指示に応じて、この指示で特定された文書から取得される当該文書の特徴情報と、前記記憶手段に記憶された複数の利用制限情報のそれぞれに関連づけられた前記特徴情報と、を比較した結果に基づいて、前記複数の利用制限情報の中から、前記特定された文書に対する利用制限に用いられる利用制限情報の候補を選択するステップ、
を実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公開番号】特開2010−134586(P2010−134586A)
【公開日】平成22年6月17日(2010.6.17)
【国際特許分類】
【出願番号】特願2008−308363(P2008−308363)
【出願日】平成20年12月3日(2008.12.3)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】