説明

文書秘匿システム、文書秘匿装置、文書秘匿プログラムおよび文書秘匿方法

【課題】文書ファイルを効率的に秘匿化できるようにすることを目的とする。
【解決手段】秘匿単語テーブル291には秘匿される秘匿単語が設定される。ファイルサーバ130は複数の単語を含んだ文書ファイル139を記憶する。秘匿単語登録部220は、ファイルサーバ130に記憶される文書ファイル139から単語を抽出し、抽出した単語のうち秘匿単語テーブル291に設定されている秘匿単語と異なる単語を新たな秘匿単語として秘匿単語テーブル291に設定する。閲覧ファイル取得部240は、利用者端末110から要求された文書ファイル139をファイルサーバ130から取得する。秘匿ファイル生成部250は、文書ファイル139に含まれる単語のうち秘匿単語テーブル291に設定されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成する。秘匿ファイル出力部260は、秘匿ファイルを利用者端末110へ送信する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、文書ファイルを権限のない利用者に開示しないようにするための文書秘匿システム、文書秘匿装置、文書秘匿プログラムおよび文書秘匿方法に関するものである。
【背景技術】
【0002】
組織は、企業秘密等の漏洩を防止するために文書ファイルを秘匿したい場合がある。また、文書ファイル内の特定の固有名詞(人名、組織名、場所、装置名、システム名、プロジェクト名、ミッション名等)を秘匿化したい場合がある。
【0003】
従来、管理者は、OS(オペレーティングシステム)やアプリケーションが持つ機能を用いて、自身の裁量で文書ファイルに秘匿レベルを付与していた。
そして、利用者に付与された権限のレベルと文書ファイルに付与された秘匿レベルとを照合してアクセス制御を行うことにより、権限のない利用者に対して文書ファイルの開示を制限していた。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2011−133991号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
個々の管理者が知りうる知識に基づいて自身の主観で不確かな秘匿レベルを文書ファイルに付与してしまうと、十分なアクセス制御を行うことができない。
また、文書ファイル内の特定の固有名詞(人名、組織名、場所、装置名、システム名、プロジェクト名、ミッション名等)を秘匿化したい場合、管理者は、文書ファイル内の固有名詞を手作業で伏せ字等にする必要がある。
【0006】
本発明は、例えば、文書ファイルを効率的に秘匿化できるようにすることを目的とする。
【課題を解決するための手段】
【0007】
本発明の文書秘匿システムは、
秘匿される秘匿単語を記憶する秘匿単語記憶部と、
複数の単語を含んだ文書ファイルを記憶する文書ファイル記憶部と、
前記文書ファイル記憶部に記憶される文書ファイルから当該文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部と、
特定の文書ファイルを閲覧ファイルとして前記文書ファイル記憶部から取得する閲覧ファイル取得部と、
前記閲覧ファイル取得部によって取得された閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成する秘匿ファイル生成部と、
前記秘匿ファイル生成部によって生成された秘匿ファイルを出力する秘匿ファイル出力部とを備える。
【0008】
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を所定の秘匿表記に置換して当該単語を秘匿する。
【0009】
前記秘匿単語登録部は、前記文書ファイルから所定の品詞に属する単語を抽出する。
【0010】
前記秘匿単語登録部は、前記文書ファイルから固有名詞と数名詞との少なくともいずれかの単語を抽出する。
【0011】
前記秘匿単語登録部は、前記文書ファイルから数値と単位とを含んだ単語を抽出する。
【0012】
前記文書秘匿システムは、さらに、
開示される開示単語を記憶する開示単語記憶部を備え、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語であって且つ前記開示単語記憶部に記憶されている開示単語と異なる単語を前記新たな秘匿単語として前記秘匿単語記憶部に記憶する。
【0013】
前記秘匿単語記憶部は、各秘匿単語に対応付けて当該秘匿単語と当該秘匿単語を含んだ閲覧ファイルとのいずれを秘匿するかを示す秘匿種別を記憶し、
前記秘匿単語登録部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記文書ファイルから抽出した単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別のうちいずれかの秘匿種別を前記新たな秘匿単語の秘匿種別として前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記閲覧ファイルに含まれる単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別に基づいて各秘匿単語と前記閲覧ファイルとのいずれを秘匿するか判定し、各秘匿単語を秘匿すると判定した場合に前記秘匿ファイルを生成する。
【0014】
前記秘匿単語記憶部は、特定の秘匿単語を組み合わせた秘匿組み合わせを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語に基づいて前記秘匿単語記憶部に記憶されている秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれているか否かを判定し、前記秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれていると判定した場合に前記新たな秘匿単語を前記秘匿単語記憶部に記憶する。
【0015】
前記文書ファイル秘匿システムは、さらに、
各利用者に与えられた閲覧レベルを記憶する利用者情報記憶部と、
特定の利用者に与えられた閲覧レベルを閲覧者レベルとして前記利用者情報記憶部から取得する閲覧者レベル取得部とを備え、
前記秘匿単語記憶部は、各秘匿単語に対応付けて特定の秘匿レベルを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を登録済み単語として選別し、選別した登録済み単語の秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルのうちいずれかの秘匿レベルを前記新たな秘匿単語の秘匿レベルとして前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を選別し、選別した単語と同じ秘匿単語に対応付けられた秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルと前記閲覧者レベル取得部によって取得された閲覧者レベルとを比較し、当該秘匿レベルが前記閲覧者レベルより高い単語を秘匿して前記秘匿ファイルを生成する。
【0016】
本発明の文書秘匿装置は、
秘匿される秘匿単語を記憶する秘匿単語記憶部と、
文書ファイルから前記文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部とを備える。
【0017】
本発明の文書秘匿プログラムは、
秘匿される秘匿単語を記憶する秘匿単語記憶部と、複数の単語を含んだ文書ファイルを記憶する文書ファイル記憶部とを備える文書秘匿システムを機能させる。
前記文書秘匿プログラムは、
前記文書ファイル記憶部に記憶される文書ファイルから当該文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部と、
特定の文書ファイルを閲覧ファイルとして前記文書ファイル記憶部から取得する閲覧ファイル取得部と、
前記閲覧ファイル取得部によって取得された閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成する秘匿ファイル生成部と、
前記秘匿ファイル生成部によって生成された秘匿ファイルを出力する秘匿ファイル出力部として前記文書秘匿システムを機能させる。
【0018】
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を所定の秘匿表記に置換して当該単語を秘匿する。
【0019】
前記秘匿単語登録部は、前記文書ファイルから所定の品詞に属する単語を抽出する。
【0020】
前記秘匿単語登録部は、前記文書ファイルから固有名詞と数名詞との少なくともいずれかの単語を抽出する。
【0021】
前記秘匿単語登録部は、前記文書ファイルから数値と単位とを含んだ単語を抽出する。
【0022】
前記文書秘匿システムは、さらに、
開示される開示単語を記憶する開示単語記憶部を備え、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語であって且つ前記開示単語記憶部に記憶されている開示単語と異なる単語を前記新たな秘匿単語として前記秘匿単語記憶部に記憶する。
【0023】
前記秘匿単語記憶部は、各秘匿単語に対応付けて当該秘匿単語と当該秘匿単語を含んだ閲覧ファイルとのいずれを秘匿するかを示す秘匿種別を記憶し、
前記秘匿単語登録部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記文書ファイルから抽出した単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別のうちいずれかの秘匿種別を前記新たな秘匿単語の秘匿種別として前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記閲覧ファイルに含まれる単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別に基づいて各秘匿単語と前記閲覧ファイルとのいずれを秘匿するか判定し、各秘匿単語を秘匿すると判定した場合に前記秘匿ファイルを生成する。
【0024】
前記秘匿単語記憶部は、特定の秘匿単語を組み合わせた秘匿組み合わせを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語に基づいて前記秘匿単語記憶部に記憶されている秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれているか否かを判定し、前記秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれていると判定した場合に前記新たな秘匿単語を前記秘匿単語記憶部に記憶する。
【0025】
前記文書ファイル秘匿システムは、さらに、
各利用者に与えられた閲覧レベルを記憶する利用者情報記憶部を備え、
前記文書秘匿プログラムは、
特定の利用者に与えられた閲覧レベルを閲覧者レベルとして前記利用者情報記憶部から取得する閲覧者レベル取得部として前記文書ファイル秘匿システムを機能させ、
前記秘匿単語記憶部は、各秘匿単語に対応付けて特定の秘匿レベルを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を登録済み単語として選別し、選別した登録済み単語の秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルのうちいずれかの秘匿レベルを前記新たな秘匿単語の秘匿レベルとして前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を選別し、選別した単語と同じ秘匿単語に対応付けられた秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルと前記閲覧者レベル取得部によって取得された閲覧者レベルとを比較し、当該秘匿レベルが前記閲覧者レベルより高い単語を秘匿して前記秘匿ファイルを生成する。
【0026】
本発明の文書秘匿プログラムは、
秘匿される秘匿単語を記憶する秘匿単語記憶部を備える文書秘匿装置を機能させる。
前記文書秘匿プログラムは、
文書ファイルから前記文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部として前記文書秘匿装置を機能させる。
【0027】
本発明の文書秘匿方法は、
秘匿される秘匿単語を記憶する秘匿単語記憶部と、複数の単語を含んだ文書ファイルを記憶する文書ファイル記憶部と、前記文書ファイル記憶部に記憶される文書ファイルから当該文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部とを備える文書秘匿システムによって実行する。
前記文書秘匿方法において、
閲覧ファイル取得部が、特定の文書ファイルを閲覧ファイルとして前記文書ファイル記憶部から取得し、
秘匿ファイル生成部が、前記閲覧ファイル取得部によって取得された閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成し、
秘匿ファイル出力部が、前記秘匿ファイル生成部によって生成された秘匿ファイルを出力する。
【0028】
本発明の文書秘匿方法は、
秘匿される秘匿単語を記憶する秘匿単語記憶部を備える文書秘匿装置によって実行する。
前記文書秘匿方法において、
秘匿単語登録部が、文書ファイルから前記文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する。
【発明の効果】
【0029】
本発明によれば、例えば、文書ファイルを効率的に秘匿化することができる。
【図面の簡単な説明】
【0030】
【図1】実施の形態1における文書秘匿システム100の構成図。
【図2】実施の形態1における秘匿単語テーブル291と利用者情報テーブル292とを示す図。
【図3】実施の形態1における文書秘匿方法(文書ファイル登録方法)を示すフローチャート。
【図4】実施の形態1における秘匿単語登録処理(S200)を示すフローチャート。
【図5】実施の形態1における秘匿単語登録処理(S200)の具体例を示す図。
【図6】実施の形態1における秘匿単語登録処理(S200)の具体例を示す図。
【図7】実施の形態1における秘匿単語登録処理(S200)の具体例を示す図。
【図8】実施の形態1における文書秘匿方法(文書ファイル提供方法)を示すフローチャート。
【図9】実施の形態1における秘匿ファイル生成処理(S300)を示すフローチャート。
【図10】実施の形態1における秘匿ファイル生成処理(S300)の具体例を示す図。
【図11】実施の形態1における秘匿ファイル生成処理(S300)の具体例を示す図。
【図12】実施の形態1における文書秘匿装置200のハードウェア資源の一例を示す図。
【図13】実施の形態1における文書秘匿システム100の別例を示す構成図。
【図14】実施の形態2における文書秘匿システム100の構成図。
【図15】実施の形態2における秘匿単語登録処理(S200)を示すフローチャート。
【図16】実施の形態2における秘匿単語登録処理(S200)の具体例を示す図。
【図17】実施の形態2における秘匿ファイル生成処理(S300)を示すフローチャート。
【図18】実施の形態2における秘匿ファイル生成処理(S300)の具体例を示す図。
【図19】実施の形態2における秘匿ファイル生成処理(S300)の具体例を示す図。
【図20】実施の形態3における秘匿単語テーブル291と利用者情報テーブル292とを示す図。
【図21】実施の形態3における秘匿単語登録処理(S200)を示すフローチャート。
【図22】実施の形態3における秘匿単語登録処理(S200)の具体例を示す図。
【図23】実施の形態3における秘匿ファイル生成処理(S300)を示すフローチャート。
【図24】実施の形態3における秘匿ファイル生成処理(S300)の具体例を示す図。
【図25】実施の形態3における秘匿ファイル生成処理(S300)の具体例を示す図。
【図26】実施の形態4における秘匿単語テーブル291と利用者情報テーブル292とを示す図。
【図27】実施の形態4における秘匿単語登録処理(S200)を示すフローチャート。
【図28】実施の形態4における秘匿単語登録処理(S200)の具体例を示す図。
【図29】実施の形態4における秘匿ファイル生成処理(S300)の具体例を示す図。
【図30】実施の形態4における秘匿ファイル生成処理(S300)の具体例を示す図。
【発明を実施するための形態】
【0031】
実施の形態1.
秘匿したい単語を自動で登録し、登録した単語を秘匿化して文書ファイルを提供する文書秘匿システムについて説明する。
【0032】
図1は、実施の形態1における文書秘匿システム100の構成図である。
実施の形態1における文書秘匿システム100の構成について、図1に基づいて説明する。
【0033】
文書秘匿システム100は、文書秘匿装置200、ファイルサーバ130、利用者端末110および管理者端末120を有する。
文書秘匿装置200、ファイルサーバ130、利用者端末110および管理者端末120は、ネットワーク101を介して通信を行う。
【0034】
ファイルサーバ130は、秘匿化される文書ファイル139を記憶管理する装置(コンピュータ)である。
ファイルサーバ130は、ファイルサーバ制御部131とファイルサーバ記憶部132とを備える。
【0035】
ファイルサーバ制御部131は、文書ファイル139の通信や登録など、ファイルサーバ130の情報処理を実行する。
ファイルサーバ記憶部132(文書ファイル記憶部の一例)は、登録された文書ファイル139を記憶する。
【0036】
文書ファイル139は、複数の単語を含んだ文書を表したデータである。
【0037】
文書秘匿装置200は、秘匿化した文書ファイル139を生成するコンピュータである。
文書秘匿装置200は、文書ファイル登録部210、秘匿単語登録部220、閲覧者レベル取得部230、閲覧ファイル取得部240、秘匿ファイル生成部250、秘匿ファイル出力部260および文書秘匿装置記憶部290を備える。
【0038】
文書秘匿装置記憶部290(秘匿単語記憶部、利用者情報記憶部の一例)は、文書秘匿装置200で使用するデータを記憶する。
例えば、秘匿単語テーブル291や利用者情報テーブル292は、文書秘匿装置記憶部290に記憶されるデータの一例である。
【0039】
秘匿単語テーブル291は、秘匿単語と秘匿レベルとを対応付けて設定したデータである。
秘匿単語とは、特定レベル未満の閲覧レベルが与えられた利用者に対して秘匿する単語のことである。
秘匿レベルとは、秘匿単語の開示に必要な利用者の閲覧レベル(特定レベル)のことである。
【0040】
利用者情報テーブル292は、各利用者に与えられた閲覧レベルを設定したデータである。
【0041】
文書ファイル登録部210は、新たな文書ファイル139をファイルサーバ130に登録する。
【0042】
秘匿単語登録部220は、ファイルサーバ130に登録される文書ファイル139から当該文書ファイル139に含まれる単語を抽出する。例えば、秘匿単語登録部220は、文書ファイル139に含まれる単語のうち所定の品詞(固有名詞など)に属する単語を抽出する。
秘匿単語登録部220は、抽出した単語のうち秘匿単語テーブル291に設定されている秘匿単語と異なる単語(未登録単語)(例えば、後述する未登録の固有名詞)を新たな秘匿単語として秘匿単語テーブル291に設定する。
【0043】
秘匿単語登録部220は、文書ファイル139から抽出した単語のうち秘匿単語テーブル291に設定されている秘匿単語と同じ単語(例えば、後述する登録済みの固有名詞)を登録済み単語として選別する。
秘匿単語登録部220は、選別した登録済み単語の秘匿レベルを秘匿単語テーブル291から取得する。
秘匿単語登録部220は、取得した秘匿レベルのうちいずれかの秘匿レベルを新たな秘匿単語の秘匿レベルとして秘匿単語テーブル291に設定する。
【0044】
閲覧者レベル取得部230は、特定の利用者に与えられた閲覧レベルを閲覧者レベルとして利用者情報テーブル292から取得する。
【0045】
閲覧ファイル取得部240は、特定の文書ファイルを閲覧ファイルとしてファイルサーバ130から取得する。
【0046】
秘匿ファイル生成部250は、閲覧ファイル取得部240によって取得された閲覧ファイルに含まれる単語のうち秘匿単語テーブル291に設定されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成する。
【0047】
例えば、秘匿ファイル生成部250は、閲覧ファイルに含まれる単語のうち秘匿単語テーブル291に設定されている秘匿単語と同じ単語を所定の秘匿表記に置換して当該単語を秘匿する。
【0048】
例えば、秘匿ファイル生成部250は、以下のように秘匿ファイルを生成する。
秘匿ファイル生成部250は、閲覧ファイルに含まれる単語のうち秘匿単語テーブル291に設定されている秘匿単語と同じ単語を選別する。
秘匿ファイル生成部250は、選別した単語と同じ秘匿単語に対応付けられた秘匿レベルを秘匿単語テーブル291から取得する。
秘匿ファイル生成部250は、取得した秘匿レベルと閲覧者レベル取得部230によって取得された閲覧者レベルとを比較する。
秘匿ファイル生成部250は、当該秘匿レベルが閲覧者レベルより高い単語を秘匿して秘匿ファイルを生成する。
【0049】
秘匿ファイル出力部260は、秘匿ファイル生成部250によって生成された秘匿ファイルを出力する。例えば、秘匿ファイル出力部260は、秘匿ファイルを利用者端末110へ送信する。
【0050】
管理者端末120は、文書ファイル139を秘匿化したい管理者が使用する装置である。例えば、管理者は、管理者端末120を操作して文書ファイル139の登録を文書秘匿装置200に要求する。
管理者端末120は、管理者端末制御部121を備える。
管理者端末制御部121は、データの編集・表示・通信など、管理者端末120の情報処理を実行する。
【0051】
利用者端末110は、文書ファイル139を閲覧したい利用者が使用する装置である。例えば、利用者は、利用者端末110を操作して文書ファイル139の開示を文書秘匿装置200に要求し、文書秘匿装置200から送信される秘匿ファイルを利用者端末110の画面で閲覧する。
利用者端末110は、利用者端末制御部111を備える。
利用者端末制御部111は、データの編集・表示・通信など、利用者端末110の情報処理を実行する。
【0052】
図2は、実施の形態1における秘匿単語テーブル291と利用者情報テーブル292とを示す図である。
実施の形態1における秘匿単語テーブル291と利用者情報テーブル292とについて、図2に基づいて説明する。
【0053】
秘匿単語テーブル291は、「秘匿単語」と「秘匿レベル」とを対応付けたデータである。
【0054】
「秘匿単語」は、閲覧レベルが低い利用者に対して秘匿にしたい単語(秘匿単語)を示す。秘匿単語は、管理者によって手動で、又は秘匿単語登録部220によって自動で秘匿単語テーブル291に登録される。また、管理者は秘匿単語を削除することができ、また、秘匿単語を実施の形態2で説明する開示単語リスト293に開示可能な一般固有名詞として登録することもできる。
【0055】
「秘匿レベル」は、秘匿単語の開示に必要な利用者の閲覧レベルを示す。管理者は秘匿レベルを変更することができる。
実施の形態1において、秘匿レベル(または閲覧レベル)は、値が大きいほど高いものとする。つまり、実施の形態1において、秘匿レベル(または閲覧レベル)は「1」より「2」の方が高く、「2」より「3」の方が高い。
【0056】
実施の形態1において、管理者によって生成された秘匿単語テーブル291が文書秘匿装置記憶部290に予め記憶されているものとする。
この秘匿単語テーブル291には、秘匿単語として固有名詞「情報太郎」「情報二郎」「ミッションA」が設定され、各固有名詞の秘匿レベルとして「1」「2」「3」が設定されている。
【0057】
利用者情報テーブル292は、「利用者ID」「閲覧レベル」を対応付けたデータである。
【0058】
「利用者ID」は、利用者を識別する識別子である。
【0059】
「閲覧レベル」は、利用者に与えられた閲覧レベルを示す。
【0060】
実施の形態1において、管理者によって生成された利用者情報テーブル292が文書秘匿装置記憶部290に予め記憶されているものとする。
“USER001”で識別される利用者の閲覧レベルは「1」であり、“USER002”で識別される利用者の閲覧レベルは「2」である。
【0061】
図3は、実施の形態1における文書秘匿方法(文書ファイル登録方法)を示すフローチャートである。
秘匿化したい文書ファイルを登録する文書ファイル登録方法について、図3に基づいて説明する。
【0062】
S101において、管理者は、秘匿化したい文書ファイル(新規ファイル)を管理者端末120に入力する。
管理者端末120の管理者端末制御部121は、入力された文書ファイルを含んだ文書ファイル登録要求(データ)を生成し、生成した文書ファイル登録要求を文書秘匿装置200へ送信する。
S101の後、S102に進む。
【0063】
S102において、文書秘匿装置200の文書ファイル登録部210は、管理者端末120から送信された文書ファイル登録要求を受信する。
文書ファイル登録部210は、受信した文書ファイル登録要求をファイルサーバ130へ送信する。
S102の後、S103に進む。
【0064】
S103において、ファイルサーバ130のファイルサーバ制御部131は、文書秘匿装置200から送信された文書ファイル登録要求を受信する。
ファイルサーバ制御部131は、受信した文書ファイル登録要求から文書ファイル139を取得し、取得した文書ファイルを新たな文書ファイル139としてファイルサーバ記憶部132に記憶(登録)する。
S103の後、S200に進む。
【0065】
S200において、文書秘匿装置200の秘匿単語登録部220は、文書ファイル登録要求に含まれる文書ファイルから秘匿単語を抽出し、抽出した秘匿単語を秘匿単語テーブル291に登録する。
秘匿単語登録処理(S200)の詳細については後述する。
【0066】
S200により、文書秘匿方法(文書ファイル登録方法)の処理は終了する。
但し、文書ファイル139をファイルサーバ130に登録する処理(S102、S103)の前に、秘匿単語登録処理(S200)を実行しても構わない。
【0067】
文書秘匿方法(文書ファイル登録方法)の処理が実行されることにより、ファイルサーバ130に文書ファイル139が追加され、秘匿単語テーブル291に秘匿単語が追加される。
【0068】
図4は、実施の形態1における秘匿単語登録処理(S200)を示すフローチャートである。
実施の形態1における秘匿単語登録処理(S200)について、図4に基づいて説明する。
【0069】
S210において、秘匿単語登録部220は、管理者端末120から送信された文書ファイル登録要求から文書ファイル139(新規ファイル)を取得する。
秘匿単語登録部220は、取得した文書ファイル139から固有名詞を抽出する。例えば、秘匿単語登録部220は、文書ファイル139に対して形態素解析を実行することにより、文書ファイル139から固有名詞を抽出する。
S210の後、S220に進む。
【0070】
S220において、秘匿単語登録部220は、文書ファイル139から抽出した固有名詞のうち秘匿単語テーブル291に秘匿単語として登録されている固有名詞を選別する。
例えば、秘匿単語登録部220は、文書ファイル139から抽出した各固有名詞を検索キーにして秘匿単語テーブル291を検索し、秘匿単語テーブル291に設定されている秘匿単語と一致した固有名詞を選別する。
以下、S220で選別した固有名詞を「登録済みの固有名詞」といい、文書ファイル139から抽出した固有名詞のうち登録済みの固有名詞以外の固有名詞を「未登録の固有名詞」という。
S220の後、S230に進む。
【0071】
S230において、秘匿単語登録部220は、各登録済みの固有名詞の秘匿レベルを秘匿単語テーブル291から取得する。
S230の後、S240に進む。
【0072】
S240において、秘匿単語登録部220は、文書ファイル139から抽出した固有名詞のうち未登録の固有名詞を新たな秘匿単語として秘匿単語テーブル291に登録(設定)する。
秘匿単語登録部220は、新たな秘匿単語の秘匿レベルとしていずれかの登録済みの固有名詞と同じ秘匿レベルを秘匿単語テーブル291に設定する。
S240により、秘匿単語登録処理(S200)は終了する。
【0073】
図5から図7は、実施の形態1における秘匿単語登録処理(S200)の具体例を示す図である。
実施の形態1における秘匿単語登録処理(S200)の具体例について、図5から図7に基づいて説明する。
【0074】
<具体例1>
図5に示すように、“a文書”というファイル名の文書ファイル139aには3つの固有名詞“Bシステム”“情報太郎”“情報三郎”が含まれる。
秘匿単語登録部220は、この文書ファイル139aから3つの固有名詞“Bシステム”“情報太郎”“情報三郎”を抽出し、抽出した3つの固有名詞を設定した単語リスト221を生成する。
【0075】
図2に示した秘匿単語テーブル291には、抽出した3つの固有名詞“Bシステム”“情報太郎”“情報三郎”のうち“情報太郎”だけが設定されている。
したがって、“情報太郎”は登録済みの固有名詞であり、残りの“Bシステム”“情報三郎”は未登録の固有名詞である。
また、“情報太郎”の秘匿レベルは“1”である。
【0076】
図5に示すように、秘匿単語登録部220は、未登録の固有名詞である“Bシステム”“情報三郎”を新たな秘匿単語として秘匿単語テーブル291に設定する。
秘匿単語登録部220は、新たな秘匿単語“Bシステム”“情報三郎”の秘匿レベルとして登録済みの固有名詞“情報太郎”と同じ秘匿レベル“1”を秘匿単語テーブル291に設定する。
【0077】
<具体例2>
図6に示すように、“b文書”というファイル名の文書ファイル139bには5つの固有名詞“ミッションA”“Bシステム”“情報太郎”“情報二郎”“情報三郎”が含まれる。
秘匿単語登録部220は、この文書ファイル139bから5つの固有名詞“ミッションA”“Bシステム”“情報太郎”“情報二郎”“情報三郎”を抽出し、抽出した5つの固有名詞を設定した単語リスト221を生成する。
【0078】
図2に示した秘匿単語テーブル291には、抽出した5つの固有名詞“ミッションA”“Bシステム”“情報太郎”“情報二郎”“情報三郎”のうち“ミッションA”“情報太郎”“情報二郎”が設定されている。
したがって、“ミッションA”“情報太郎”“情報二郎”は登録済みの固有名詞であり、残りの“Bシステム”“情報三郎”は未登録の固有名詞である。
また、“ミッションA”の秘匿レベルは“3”であり、“情報太郎”の秘匿レベルは“1”であり、“情報二郎”の秘匿レベルは“2”である。
【0079】
図6に示すように、秘匿単語登録部220は、未登録の固有名詞である“Bシステム”“情報三郎”を新たな秘匿単語として秘匿単語テーブル291に設定する。
秘匿単語登録部220は、登録済みの固有名詞“ミッションA”“情報太郎”“情報二郎”の秘匿レベルのうち最も高い秘匿レベル“3(ミッションA)”を選択し、選択した秘匿レベルを新たな秘匿単語“Bシステム”“情報三郎”の秘匿レベルとして秘匿単語テーブル291に設定する。但し、秘匿単語登録部220は、登録済みの固有名詞の秘匿レベルのうち最も低い秘匿レベル“1(情報太郎)”または中間(平均)の秘匿レベル“2(情報二郎)”を新たな秘匿単語の秘匿レベルとして設定してもよい。また、秘匿単語登録部220は、各登録済みの固有名詞の秘匿レベルからランダムに秘匿レベルを選択し、選択した秘匿レベルを新たな秘匿単語の秘匿レベルとして設定しても構わない。
【0080】
<具体例3>
図7に示すように、“c文書”というファイル名の文書ファイル139cには4つの固有名詞“C装置”“Bシステム”“情報太郎”“情報二郎”が含まれる。
秘匿単語登録部220は、この文書ファイル139cから4つの固有名詞“C装置”“Bシステム”“情報太郎”“情報二郎”を抽出し、抽出した4つの固有名詞を設定した単語リスト221を生成する。
【0081】
図6に示した秘匿単語テーブル291には、抽出した4つの固有名詞“C装置”“Bシステム”“情報太郎”“情報二郎”のうち“Bシステム”“情報太郎”“情報二郎”が設定されている。“Bシステム”は文書ファイル139bから抽出されて登録された秘匿単語である。
したがって、“Bシステム”“情報太郎”“情報二郎”は登録済みの固有名詞であり、残りの“C装置”は未登録の固有名詞である。
また、“Bシステム”の秘匿レベルは“3”であり、“情報太郎”の秘匿レベルは“1”であり、“情報二郎”の秘匿レベルは“2”である。
【0082】
図7に示すように、秘匿単語登録部220は、未登録の固有名詞である“C装置”を新たな秘匿単語として秘匿単語テーブル291に設定する。
秘匿単語登録部220は、登録済みの固有名詞“Bシステム”“情報太郎”“情報二郎”の秘匿レベルのうち最も高い秘匿レベル“3(Bシステム)”を選択し、選択した秘匿レベルを新たな秘匿単語“C装置”の秘匿レベルとして秘匿単語テーブル291に設定する。但し、秘匿単語登録部220は、図6で説明したように、登録済みの固有名詞の秘匿レベルのうち最も低い秘匿レベル、中間(平均)の秘匿レベルまたはランダムに選択した秘匿レベルを新たな秘匿単語の秘匿レベルとして設定しても構わない。
【0083】
図8は、実施の形態1における文書秘匿方法(文書ファイル提供方法)を示すフローチャートである。
秘匿化した文書ファイル139(秘匿ファイル)を提供する文書ファイル提供方法について、図8に基づいて説明する。
【0084】
S111において、利用者(閲覧者)は、自分の利用者IDと閲覧したい文書ファイル139のファイル名とを利用者端末110に入力する。以下、利用者端末110に入力された利用者IDを「閲覧者ID」といい、利用者端末110に入力されたファイル名を「閲覧ファイル名」という。
利用者端末110の利用者端末制御部111は、入力された閲覧者IDと閲覧ファイル名とを含んだ文書ファイル提供要求(データ)を生成し、生成した文書ファイル提供要求を文書秘匿装置200へ送信する。
S111の後、S112に進む。
【0085】
S112において、文書秘匿装置200の閲覧者レベル取得部230は、利用者端末110から送信された文書ファイル提供要求を受信する。
閲覧者レベル取得部230は、受信した文書ファイル提供要求から閲覧者IDを取得し、取得した閲覧者IDと同じ利用者IDに対応付けられた閲覧レベルを利用者情報テーブル292(図2参照)から取得する。
以下、S112で取得した閲覧レベルを「閲覧者レベル」という。
S112の後、S113に進む。
【0086】
S113において、文書秘匿装置200の閲覧ファイル取得部240は、文書ファイル提供要求から閲覧ファイル名を取得し、取得した閲覧ファイル名を含んだ文書ファイル要求(データ)を生成し、生成した文書ファイル要求をファイルサーバ130へ送信する。
ファイルサーバ130のファイルサーバ制御部131は、文書ファイル要求を受信し、受信した文書ファイル要求から閲覧ファイル名を取得し、取得した閲覧ファイル名で識別される文書ファイル139をファイルサーバ記憶部132から取得する。
ファイルサーバ130のファイルサーバ制御部131は、取得した文書ファイル139を含んだ文書ファイル応答(データ)を生成し、生成した文書ファイル応答を文書秘匿装置200へ送信する。
文書秘匿装置200の閲覧ファイル取得部240は、文書ファイル応答を受信し、受信した文書ファイル応答から文書ファイル139を取得する。
以下、S113で取得された文書ファイル139を「閲覧ファイル」という。
S113の後、S300に進む。但し、閲覧ファイルを取得する処理(S113)を閲覧者レベルを取得する処理(S112)の前に実行しても構わない。
【0087】
S300において、文書秘匿装置200の秘匿ファイル生成部250は、秘匿単語テーブル291に基づいて閲覧ファイル内の固有名詞のうち秘匿レベルが閲覧者レベルより高い固有名詞(秘匿単語)を秘匿して秘匿ファイルを生成する。
秘匿ファイル生成処理(S300)の詳細については後述する。
S300の後、S114に進む。
【0088】
S114において、文書秘匿装置200の秘匿ファイル出力部260は、秘匿ファイルを含んだ文書ファイル提供応答(データ)を生成し、生成した文書ファイル提供応答を利用者端末110へ送信する。
S114の後、S115に進む。
【0089】
S115において、利用者端末110の利用者端末制御部111は、文書ファイル提供応答を受信し、受信した文書ファイル提供応答から秘匿ファイルを取得し、取得した秘匿ファイルをディスプレイに表示する。
S115により、文書秘匿方法(文書ファイル提供方法)の処理は終了する。
【0090】
図9は、実施の形態1における秘匿ファイル生成処理(S300)を示すフローチャートである。
実施の形態1における秘匿ファイル生成処理(S300)について、図9に基づいて説明する。
【0091】
S310において、秘匿ファイル生成部250は、閲覧ファイル取得部240によって取得された文書ファイル139(閲覧ファイル)から固有名詞を抽出する。
例えば、秘匿ファイル生成部250は、文書ファイル139に対して形態素解析を実行することにより、文書ファイル139から固有名詞を抽出する。
S310の後、S320に進む。
【0092】
S320において、秘匿ファイル生成部250は、文書ファイル139から抽出した各固有名詞の秘匿レベルを秘匿単語テーブル291から取得する。
例えば、秘匿ファイル生成部250は、文書ファイル139から抽出した各固有名詞を検索キーにして秘匿単語テーブル291を検索し、検索キーと一致した秘匿単語に対応付けられた秘匿レベルを当該固有名詞の秘匿レベルとして秘匿単語テーブル291から取得する。
S320の後、S330に進む。
【0093】
S330において、秘匿ファイル生成部250は、各固有名詞の秘匿レベルと閲覧者レベル取得部230によって取得された閲覧者レベルとを比較する。
秘匿ファイル生成部250は、比較結果に基づいて秘匿レベルが閲覧者レベルより高い固有名詞(秘匿対象単語)を選別する。
S330の後、S340に進む。
【0094】
S340において、秘匿ファイル生成部250は、S330で選別した固有名詞(秘匿対象単語)を伏せ字にして文書ファイル139から秘匿ファイルを生成する。
例えば、秘匿ファイル生成部250は、秘匿対象単語を検索キーにして文書ファイル139を検索して秘匿対象単語が記された部分を秘匿対象部分として特定し、特定した各秘匿対象部分を所定の秘匿表記で置換する。
S340により、秘匿ファイル生成処理(S300)は終了する。
【0095】
図10、図11は、実施の形態1における秘匿ファイル生成処理(S300)の具体例を示す図である。
実施の形態1における秘匿ファイル生成処理(S300)の具体例について、図10および図11に基づいて説明する。
【0096】
図10に示すように、“c文書”というファイル名の文書ファイル139cには4つの固有名詞“C装置”“Bシステム”“情報太郎”“情報二郎”が含まれる。
秘匿ファイル生成部250は、この文書ファイル139cから4つの固有名詞“C装置”“Bシステム”“情報太郎”“情報二郎”を抽出し、抽出した4つの固有名詞を設定した単語リスト251を生成する。
【0097】
秘匿ファイル生成部250は、抽出した各固有名詞を検索キーにして秘匿単語テーブル291を検索し、検索キーと一致した秘匿単語に対応付けられた秘匿レベルを取得する。
“C装置”の秘匿レベルは“3”であり、“Bシステム”の秘匿レベルは“3”であり、“情報太郎”の秘匿レベルは“1”であり、“情報二郎”の秘匿レベルは“2”である。
秘匿ファイル生成部250は、各固有名詞の秘匿レベルを単語リスト251に設定する。
【0098】
図11において、秘匿ファイル生成部250は、各固有名詞の秘匿レベルと閲覧者レベルとを比較する。ここで、閲覧者レベルは“2”である。
秘匿ファイル生成部250は、比較結果を単語リスト251に設定する。図中の“○”は閲覧者レベルが秘匿レベル以上であることを表し、“×”は閲覧者レベルが秘匿レベル未満であることを表している。つまり、“×”を記した固有名詞“C装置”“Bシステム”の秘匿レベル“3”は閲覧者レベル“2”より高い。
以下、秘匿レベルが閲覧者レベルより高い固有名詞“C装置”“Bシステム”を「秘匿対象単語」という。
【0099】
秘匿ファイル生成部250は、文書ファイル139c内の秘匿対象単語“C装置”“Bシステム”を伏せ字にして秘匿ファイル252cを生成する。
図中の秘匿ファイル252cは、秘匿対象単語“C装置”“Bシステム”を黒い四角(秘匿表記の一例)で表している。但し、黒い四角の代わりに空白やバツ印などのその他の表記で秘匿対象単語を表しても構わない。
【0100】
図12は、実施の形態1における文書秘匿装置200のハードウェア資源の一例を示す図である。
図12において、文書秘匿装置200(コンピュータの一例)は、CPU901(Central Processing Unit)を備えている。CPU901は、バス902を介してROM903、RAM904、通信装置905、ディスプレイ911(表示装置)、キーボード912、マウス913、ドライブ装置914、磁気ディスク装置920などのハードウェアデバイスと接続され、これらのハードウェアデバイスを制御する。ドライブ装置914は、FD(Flexible Disk Drive)、CD(Compact Disc)、DVD(Digital Versatile Disc)などの記憶媒体を読み書きする装置である。
ROM903、RAM904、磁気ディスク装置920およびドライブ装置914は記憶装置の一例である。キーボード912、マウス913および通信装置905は入力装置の一例である。ディスプレイ911および通信装置905は出力装置の一例である。
【0101】
通信装置905は、有線または無線で、LAN(Local Area Network)、インターネット、電話回線などの通信網に接続している。
【0102】
磁気ディスク装置920には、OS921(オペレーティングシステム)、プログラム群922、ファイル群923が記憶されている。
【0103】
プログラム群922には、実施の形態において「〜部」として説明する機能を実行するプログラムが含まれる。プログラム(例えば、文書秘匿プログラム、文書ファイル登録プログラム、文書ファイル提供プログラム)は、CPU901により読み出され実行される。すなわち、プログラムは、「〜部」としてコンピュータを機能させるものであり、また「〜部」の手順や方法をコンピュータに実行させるものである。
【0104】
ファイル群923には、実施の形態において説明する「〜部」で使用される各種データ(入力、出力、判定結果、計算結果、処理結果など)が含まれる。
【0105】
実施の形態において構成図およびフローチャートに含まれている矢印は主としてデータや信号の入出力を示す。
フローチャートなどに基づいて説明する実施の形態の処理はCPU901、記憶装置、入力装置、出力装置などのハードウェアを用いて実行される。
【0106】
実施の形態において「〜部」として説明するものは「〜回路」、「〜装置」、「〜機器」であってもよく、また「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ファームウェア、ソフトウェア、ハードウェアまたはこれらの組み合わせのいずれで実装されても構わない。
【0107】
利用者端末110、管理者端末120、ファイルサーバ130も文書秘匿装置200と同様にハードウェア資源を備える。
【0108】
図13は、実施の形態1における文書秘匿システム100の別例を示す構成図である。
図13に示すように、文書秘匿装置200がファイルサーバ130(図1参照)を兼ねても構わない。つまり、文書秘匿装置記憶部290に文書ファイル139を登録してもよい。
【0109】
また、秘匿単語テーブル291や利用者情報テーブル292をファイルサーバ130または別個に設けたデータベース装置に記憶しても構わない(図示省略)。
【0110】
実施の形態1では、文書ファイル139から固有名詞を抽出し、固有名詞を秘匿単語として秘匿単語テーブル291に登録する例を示した。但し、固有名詞以外の単語を抽出して秘匿単語として登録しても構わない。つまり、名詞(一般名詞、代名詞、数名詞などを含む)、動詞、形容詞など、その他の品詞に属する単語を秘匿単語として登録しても構わない。また、所定の複数の品詞(例えば、名詞と動詞と形容詞)のいずれかに属する単語または品詞の種類に関わらず全ての単語を文書ファイル139から抽出して秘匿単語として登録しても構わない。
【0111】
文書ファイル139から抽出する単語および秘匿単語には、複数の単語を組み合わせて一語として扱うもの(固有名詞、熟語、複合語、合成語)を含む。例えば、図2に示したように名字「情報」と名前「太郎」とを組み合わせた氏名「情報太郎」を一つの単語(秘匿単語)として扱ってもよい。
【0112】
文書ファイル139から抽出する単語および秘匿単語は、数量を表す単語(数詞、数名詞、数量詞)であっても構わない。つまり、単語(秘匿単語)は数値を含んでいても構わない。例えば、数値「170」と単位「cm(センチメートル)」とを組み合わせた「170cm」や数値「60」と単位「kg(キログラム)」とを組み合わせた「60kg」などを秘匿単語として扱っても構わない。さらに、数値と単位とによって修飾される名詞「身長」「体重」を組み合わせて「身長170cm」「体重60kg」などを秘匿単語として扱っても構わない。
【0113】
実施の形態1において、例えば、以下のような文書秘匿システム100について説明した。
【0114】
秘匿単語テーブル291には、最初に個々の管理者が知り得た特定の固有名詞を秘匿単語として秘匿レベルと共に登録しておく。
文書秘匿装置200は、文書ファイル139の登録時に文書ファイル139内に秘匿単語と共に記されている固有名詞を秘匿すべき単語として秘匿単語の秘匿レベルと共に自動で秘匿単語テーブル291に登録する。つまり、文書ファイル139を登録すればするほど、秘匿単語のデータベース(秘匿単語テーブル291)は拡充されていく。
これにより、管理者が秘匿レベルの付与作業を行う必要はなくなり、個々の管理者の主観に基づいて不確かな秘匿レベルが付与されることを防ぐことができる。
【0115】
文書秘匿装置200は、利用者に相応しくない秘匿レベルの固有名詞を秘匿単語テーブル291に基づいて伏字に置き換えて文書ファイル139を提供する。これにより、Need To Knowの原則に基づいた文書ファイル139の提供を強制化できる。
【0116】
つまり、文書秘匿システム100は、文書ファイルを効率的かつ効果的に秘匿化することができる。
【0117】
実施の形態2.
利用者の閲覧レベルに関わらず、特定の単語を伏せ字にしないで開示する形態について説明する。
以下、実施の形態1と異なる事項について主に説明する。説明しない事項については実施の形態1と同様である。
【0118】
図14は、実施の形態2における文書秘匿システム100の構成図である。
実施の形態2における文書秘匿システム100の構成について、図14に基づいて説明する。
【0119】
文書秘匿装置200の文書秘匿装置記憶部290(秘匿単語記憶部の一例)は、開示単語リスト293を記憶する。
開示単語リスト293は、各利用者に対して開示する開示単語(例えば、後述する一般固有名詞)を設定したデータである。
例えば、開示単語リスト293には、辞書などに記載されている一般的な固有名詞などを予め登録する。これは、一般的な固有名詞などを特定の固有名詞(秘匿単語)として抽出しないようにするためである。管理者によって開示単語リスト293に固有名詞を追加することが可能であるが、同じ固有名詞を複数登録することはできないものとする。
【0120】
秘匿単語登録部220は、文書ファイル139から抽出した単語のうち秘匿単語テーブル291に設定されている秘匿単語と異なる単語であって且つ開示単語リスト293に設定されている開示単語と異なる単語を新たな秘匿単語として秘匿単語テーブル291に記憶する。
【0121】
文書秘匿方法(文書ファイル登録方法)は、実施の形態1(図3参照)と同様である。
但し、秘匿単語登録処理(S200)の一部が実施の形態1と異なる。
【0122】
図15は、実施の形態2における秘匿単語登録処理(S200)を示すフローチャートである。
実施の形態2における秘匿単語登録処理(S200)について、図15に基づいて説明する。
【0123】
S210からS230の処理は、実施の形態1(図4参照)と同じである。
【0124】
秘匿単語登録部220は、実施の形態1で説明したS240の代わりにS241−1,2を実行する。
【0125】
S241−1において、秘匿単語登録部220は、文書ファイル139から抽出した固有名詞のうち開示単語リスト293に設定されていない未登録の固有名詞を選別する。未登録の固有名詞とは、文書ファイル139から抽出した固有名詞のうち秘匿単語として登録済みの固有名詞以外の固有名詞のことである。
例えば、秘匿単語登録部220は、各未登録の固有名詞を検索キーにして開示単語リスト293を検索し、開示単語リスト293に設定されているいずれの一般固有名詞とも異なる未登録の固有名詞を選別する。
S241−1の後、S241−2に進む。
【0126】
S241−2において、秘匿単語登録部220は、S241で選別した未登録の固有名詞を新たな秘匿単語として秘匿単語テーブル291に登録(設定)する。
秘匿単語登録部220は、新たな秘匿単語の秘匿レベルとしていずれかの登録済みの固有名詞と同じ秘匿レベルを秘匿単語テーブル291に設定する。
S241−2により秘匿単語登録処理(S200)は終了する。
【0127】
但し、登録済みの固有名詞の秘匿レベルを取得する処理(S220、S230)の前に、未登録の固有名詞を選別する処理(S241−1)を実行しても構わない。
【0128】
図16は、実施の形態2における秘匿単語登録処理(S200)の具体例を示す図である。
実施の形態2における秘匿単語登録処理(S200)の具体例について、図16に基づいて説明する。
【0129】
“d文書”というファイル名の文書ファイル139dには5つの固有名詞“経済産業省”“Dシステム”“情報太郎”“情報二郎”“特許太郎”が含まれる。
秘匿単語登録部220は、この文書ファイル139dから5つの固有名詞“経済産業省”“Dシステム”“情報太郎”“情報二郎”“特許太郎”を抽出し、抽出した5つの固有名詞を設定した単語リスト221を生成する。
【0130】
開示単語リスト293には、3つの一般固有名詞“特許太郎”“経済産業省”“特許庁”が設定されている。
秘匿単語登録部220は、単語リスト221から開示単語リスト293に設定されている一般固有名詞“経済産業省”“特許太郎”を削除する。
以下、単語リスト221に残った3つの固有名詞“Dシステム”“情報太郎”“情報二郎”を「特定固有名詞」という。
【0131】
秘匿単語テーブル291(図2参照)には、単語リスト221に設定されている3つの固有名詞“Dシステム”“情報太郎”“情報二郎”のうち“情報太郎”“情報二郎”が設定されている。
したがって、“情報太郎”“情報二郎”は登録済みの特定固有名詞であり、残りの“Dシステム”は未登録の特定固有名詞である。
また、“情報太郎”の秘匿レベルは“1”であり、“情報二郎”の秘匿レベルは“2”である。
【0132】
図16に示すように、秘匿単語登録部220は、未登録の特定固有名詞である“Dシステム”を新たな秘匿単語として秘匿単語テーブル291に設定する。
秘匿単語登録部220は、登録済みの特定固有名詞“情報太郎”“情報二郎”の秘匿レベルのうち最も高い秘匿レベル“2(情報二郎)”を選択し、選択した秘匿レベルを新たな秘匿単語“Dシステム”の秘匿レベルとして秘匿単語テーブル291に設定する。但し、秘匿単語登録部220は、図6で説明したように、登録済みの固有名詞の秘匿レベルのうち最も低い秘匿レベル、中間(平均)の秘匿レベルまたはランダムに選択した秘匿レベルを新たな秘匿単語の秘匿レベルとして設定しても構わない。
【0133】
文書秘匿方法(文書ファイル提供方法)は、実施の形態1(図8参照)と同様である。
但し、秘匿ファイル生成処理(S300)の一部が実施の形態1と異なる。
【0134】
図17は、実施の形態2における秘匿ファイル生成処理(S300)を示すフローチャートである。
実施の形態2における秘匿ファイル生成処理(S300)について、図17に基づいて説明する。
【0135】
S310の処理は、実施の形態1(図9参照)と同じである。
【0136】
秘匿ファイル生成部250は、実施の形態1で説明したS320からS340の代わりにS311からS341を実行する。
S321からS341は、S320からS340に相当する処理である。
【0137】
S311において、秘匿ファイル生成部250は、S310で文書ファイル139から抽出した固有名詞のうち開示単語リスト293に設定されていない固有名詞を選別する。
例えば、秘匿ファイル生成部250は、各固有名詞を検索キーにして開示単語リスト293を検索し、開示単語リスト293に設定されているいずれの一般固有名詞とも異なる固有名詞を選別する。
以下、S311で選別した固有名詞を「特定固有名詞」という。
S311の後、S321に進む。
【0138】
S321からS341の処理は、S320からS340と同様の処理であり、S320からS340の処理においてS310で抽出した「固有名詞」をS311で選別した「特定固有名詞」に置き換えた処理である。
つまり、秘匿ファイル生成部250は、各特定固有名詞の秘匿レベルを利用者情報テーブル292から取得し(S321)、秘匿レベルが閲覧者レベルより高い特定固有名詞を選別し(S331)、選別した特定固有名詞を伏せ字にして文書ファイル139から秘匿ファイルを生成する(S341)。
【0139】
但し、秘匿ファイル生成部250は、秘匿レベルが閲覧者レベルより高い固有名詞を選別(S310−S330)した後に、秘匿レベルが閲覧者レベルより高い固有名詞のうち開示単語リスト293に設定されていない特定固有名詞を選別(S311)しても構わない。秘匿ファイル生成部250は、選別した特定固有名詞を伏せ字にして秘匿ファイルを生成する(S341)。
また、秘匿ファイル生成部250は、文書ファイル139から抽出した固有名詞のうち秘匿レベルが閲覧者レベルより高い固有名詞を選別(S320、S330)すると共に、文書ファイル139から抽出した固有名詞のうち開示単語リスト293に設定されていない特定固有名詞を選別(S311)しても構わない。秘匿ファイル生成部250は、選別した特定固有名詞のうち秘匿レベルが閲覧者レベルより高い特定固有名詞を伏せ字にして秘匿ファイルを生成する(S341)。
【0140】
図18、図19は、実施の形態2における秘匿ファイル生成処理(S300)の具体例を示す図である。
実施の形態2における秘匿ファイル生成処理(S300)の具体例について、図18および図19に基づいて説明する。
【0141】
図18に示すように、“d文書”というファイル名の文書ファイル139dには5つの固有名詞“経済産業省”“Dシステム”“情報太郎”“情報二郎”“特許太郎”が含まれる。
秘匿ファイル生成部250は、この文書ファイル139dから5つの固有名詞“経済産業省”“Dシステム”“情報太郎”“情報二郎”“特許太郎”を抽出し、抽出した5つの固有名詞を設定した単語リスト251を生成する。
【0142】
開示単語リスト293には、3つの一般固有名詞“特許太郎”“経済産業省”“特許庁”が設定されている。
秘匿ファイル生成部250は、単語リスト251から開示単語リスト293に設定されている一般固有名詞“経済産業省”“特許太郎”を削除する。単語リスト251に残った3つの固有名詞“Dシステム”“情報太郎”“情報二郎”が特定固有名詞である。
【0143】
秘匿ファイル生成部250は、各特定固有名詞を検索キーにして秘匿単語テーブル291を検索し、検索キーと一致した秘匿単語に対応付けられた秘匿レベルを取得する。
秘匿ファイル生成部250は、各特定固有名詞の秘匿レベルを単語リスト251に設定する。
【0144】
図19において、秘匿ファイル生成部250は、各特定固有名詞の秘匿レベルと閲覧者レベルとを比較する。
比較した結果、特定固有名詞“Dシステム”“情報二郎”の秘匿レベル“2”は閲覧者レベル“1”より高い。
以下、秘匿レベルが閲覧者レベルより高い特定固有名詞“Dシステム”“情報二郎”を「秘匿対象単語」という。
【0145】
秘匿ファイル生成部250は、文書ファイル139d内の秘匿対象単語“Dシステム”“情報二郎”を伏せ字にして秘匿ファイル252dを生成する。
【0146】
実施の形態2において、利用者の閲覧レベルに関わらず、特定の単語(例えば、一般固有名詞)を伏せ字にしないで開示する形態について説明した。
実施の形態2により、秘匿する必要が無い単語を秘匿単語として自動登録してしまうことを防ぐことができる。また、秘匿する必要が無い単語を伏せ字にしてしまうことを防ぐことができる。
【0147】
実施の形態2は、例えば以下のように、実施の形態1と組み合わせても構わない。
【0148】
実施の形態1と同様に、文書秘匿装置200がファイルサーバ130を兼ねても構わないし、秘匿単語テーブル291や利用者情報テーブル292をファイルサーバ130またはデータベース装置に記憶しても構わない。
また、固有名詞以外の単語を秘匿単語または開示単語として登録しても構わない。
【0149】
実施の形態3.
文書ファイル139に含まれる秘匿単語に応じて文書ファイル139(秘匿ファイル)の提供を拒否する形態について説明する。
以下、実施の形態1、2と異なる事項について主に説明する。説明しない事項については実施の形態1、2と同様である。
【0150】
文書秘匿システム100の構成は、実施の形態1(図1参照)と同様である。但し、各構成は以下のような機能を有する。
【0151】
秘匿単語テーブル291には、各秘匿単語に対応付けて当該秘匿単語と当該秘匿単語を含んだ閲覧ファイルとのいずれを秘匿するかを示す秘匿種別が設定される。
【0152】
秘匿単語登録部220は、秘匿単語テーブル291に設定されている秘匿種別のうち文書ファイル139から抽出した単語と同じ秘匿単語の秘匿種別を取得する。
秘匿単語登録部220は、取得した秘匿種別のうちいずれかの秘匿種別を新たな秘匿単語の秘匿種別として秘匿単語テーブル291に設定する。
【0153】
秘匿ファイル生成部250は、秘匿単語テーブル291に設定されている秘匿単語のうち閲覧ファイルに含まれる単語と同じ秘匿単語の秘匿種別を取得する。
秘匿ファイル生成部250は、取得した秘匿種別に基づいて各秘匿単語と閲覧ファイルとのいずれを秘匿するか判定する。
秘匿ファイル生成部250は、各秘匿単語を秘匿すると判定した場合に秘匿ファイルを生成する。
【0154】
図20は、実施の形態3における秘匿単語テーブル291と利用者情報テーブル292とを示す図である。
実施の形態3における秘匿単語テーブル291について、図20に基づいて説明する。利用者情報テーブル292は実施の形態1と同じである(図2参照)。
【0155】
秘匿単語テーブル291は、「秘匿単語」「秘匿レベル」に対応付けて「秘匿種別」を有する。
【0156】
「秘匿種別」は、“単語”または“ファイル”を示す。
“単語”は、文書ファイル139に含まれる秘匿単語の秘匿レベルが利用者の閲覧レベルより高い場合に秘匿単語を秘匿して秘匿ファイルを生成することを意味する。
“ファイル”は、文書ファイル139に含まれる秘匿単語の秘匿レベルが利用者の閲覧レベルより高い場合に秘匿ファイルを生成せずに文書ファイル139の提供を拒否することを意味する。
【0157】
文書秘匿方法(文書ファイル登録方法)は、実施の形態1(図3参照)と同様である。
但し、秘匿単語登録処理(S200)の一部が実施の形態1と異なる。
【0158】
図21は、実施の形態3における秘匿単語登録処理(S200)を示すフローチャートである。
実施の形態3における秘匿単語登録処理(S200)について、図21に基づいて説明する。
【0159】
S210およびS220は、実施の形態1(図4参照)と同じである。
【0160】
秘匿単語登録部220は、実施の形態1で説明したS230、S240の代わりにS232、S242を実行する。
【0161】
S232において、秘匿単語登録部220は、実施の形態1のS230と同じく登録済みの固有名詞の秘匿レベルを秘匿単語テーブル291から取得する。
同様に、秘匿単語登録部220は、登録済みの固有名詞の秘匿種別を秘匿単語テーブル291から取得する。
S232の後、S242に進む。
【0162】
S242において、秘匿単語登録部220は、実施の形態1のS240と同じく未登録の固有名詞を新たな秘匿単語として秘匿単語テーブル291に登録する。また、秘匿単語登録部220は、S232で取得したいずれかの秘匿レベルを新たな秘匿単語の秘匿レベルとして秘匿単語テーブル291に設定する。
同様に、秘匿単語登録部220は、S232で取得したいずれかの秘匿種別を新たな秘匿単語の秘匿種別として秘匿単語テーブル291に設定する。
S242により、秘匿単語登録処理(S200)は終了する。
【0163】
図22は、実施の形態3における秘匿単語登録処理(S200)の具体例を示す図である。
実施の形態3における秘匿単語登録処理(S200)の具体例について、図22に基づいて説明する。
【0164】
“b文書”というファイル名の文書ファイル139bには5つの固有名詞“ミッションA”“Bシステム”“情報太郎”“情報二郎”“情報三郎”が含まれる。
秘匿単語登録部220は、この文書ファイル139bから5つの固有名詞“ミッションA”“Bシステム”“情報太郎”“情報二郎”“情報三郎”を抽出し、抽出した5つの固有名詞を設定した単語リスト221を生成する。
【0165】
ここで、文書ファイル139bから抽出した5つの固有名詞のうち“ミッションA”“情報太郎”“情報二郎”は、秘匿単語テーブル291に登録された登録済みの固有名詞である。
つまり、“Bシステム”“情報三郎”が未登録の固有名詞である。
【0166】
秘匿単語登録部220は、未登録の固有名詞“Bシステム”“情報三郎”を新たな秘匿単語として秘匿単語テーブル291に設定する。
秘匿単語登録部220は、登録済みの固有名詞の秘匿レベルのうち最も高い秘匿レベル“3(ミッションA)”を新たな秘匿単語“Bシステム”“情報三郎”の秘匿レベルとして秘匿単語テーブル291に設定する。但し、秘匿単語登録部220は、実施の形態1で説明したように、他の秘匿レベルを新たな秘匿単語の秘匿レベルとして設定しても構わない。
秘匿単語登録部220は、登録済みの固有名詞の秘匿種別のうち秘匿レベルが最も高い登録済みの固有名詞の秘匿種別“ファイル(ミッションA)”を選択し、選択した秘匿種別を新たな秘匿単語“Bシステム”“情報三郎”の秘匿種別として秘匿単語テーブル291に設定する。
【0167】
但し、秘匿単語登録部220は、最も秘匿レベルが低い登録済みの固有名詞(情報太郎)と同じ秘匿種別“単語”を新たな秘匿単語の秘匿種別として秘匿単語テーブル291に設定しても構わない。
また、秘匿単語登録部220は、各登録済みの固有名詞の秘匿レベルに関わらず、各登録済みの固有名詞の秘匿種別に基づいて新たな秘匿単語の秘匿種別を選択しても構わない。例えば、少なくともいずれかの登録済みの固有名詞の秘匿種別が“ファイル(または単語)”である場合、秘匿単語登録部220は“ファイル(または単語)”を新たな秘匿単語の秘匿種別として選択する。
【0168】
文書秘匿方法(文書ファイル提供方法)は、実施の形態1(図8参照)と同様である。
但し、秘匿ファイル生成処理(S300)の一部が実施の形態1と異なる。
【0169】
図23は、実施の形態3における秘匿ファイル生成処理(S300)を示すフローチャートである。
実施の形態3における秘匿ファイル生成処理(S300)について、図23に基づいて説明する。
【0170】
S310からS330の処理およびS340の処理は、実施の形態1(図9参照)と同じである。
秘匿ファイル生成部250は、S330の後、S332−1およびS332−2を実行する。
【0171】
S332−1において、秘匿ファイル生成部250は、S330で選別した各固有名詞の秘匿種別を利用者情報テーブル292から取得する。
S332−1の後、S332−2に進む。
【0172】
S332−2において、秘匿ファイル生成部250は、S332−1で取得した各秘匿種別に基づいて“単語”と“ファイル”とのいずれかの秘匿種別を選択する。
例えば、S332−2で取得した少なくてもいずれかの秘匿種別が“ファイル(または単語)”である場合、秘匿ファイル生成部250は“ファイル(または単語)”を選択する。
また、秘匿ファイル生成部250は、S330で選別した固有名詞のうち秘匿レベルが最も高い(または最も低い)固有名詞の秘匿種別を選択しても構わない。
選択した秘匿種別が“単語”である場合、S340に進む。
選択した秘匿種別が“ファイル”である場合、秘匿ファイル生成処理(S300)は終了する。この場合、秘匿ファイル出力部260は、文書ファイル139(秘匿ファイル)の提供を拒否することを示す文書ファイル提供応答を利用者端末110へ送信する。利用者端末110はこの文書ファイル提供応答を受信し、文書ファイル139の提供が拒否されたことを示すメッセージをディスプレイに表示する。
【0173】
図24、図25は、実施の形態3における秘匿ファイル生成処理(S300)の具体例を示す図である。
実施の形態3における秘匿ファイル生成処理(S300)の具体例について、図24および図25に基づいて説明する。
【0174】
図24に示すように、“b文書”というファイル名の文書ファイル139bには5つの固有名詞“ミッションA”“Bシステム”“情報太郎”“情報二郎”“情報三郎”が含まれる。
秘匿単語登録部220は、この文書ファイル139bから5つの固有名詞“ミッションA”“Bシステム”“情報太郎”“情報二郎”“情報三郎”を抽出し、抽出した5つの固有名詞を設定した単語リスト221を生成する。
【0175】
秘匿ファイル生成部250は、抽出した各固有名詞を検索キーにして秘匿単語テーブル291を検索し、検索キーと一致した秘匿単語に対応付けられた秘匿レベルを取得する。
秘匿ファイル生成部250は、各固有名詞の秘匿レベルを単語リスト251に設定する。
【0176】
図25において、秘匿ファイル生成部250は、各固有名詞の秘匿レベルと閲覧者レベルとを比較する。
比較した結果、固有名詞“ミッションA”“Bシステム”“情報二郎”“情報三郎”の秘匿レベルは閲覧者レベルより高い。
以下、秘匿レベルが閲覧者レベルより高い固有名詞“ミッションA”“Bシステム”“情報二郎”“情報三郎”を「秘匿対象単語」という。
【0177】
秘匿ファイル生成部250は、秘匿対象単語“ミッションA”“Bシステム”“情報二郎”“情報三郎”の秘匿種別を秘匿単語テーブル291から取得する。
秘匿対象単語“情報二郎”の秘匿種別は“単語”であり、秘匿対象単語“ミッションA”“Bシステム”“情報三郎”の秘匿種別は“ファイル”である。
【0178】
秘匿ファイル生成部250は、取得した秘匿種別の中に“ファイル”が含まれるため文書ファイル139b内の秘匿対象単語を伏せ字にした秘匿ファイルを生成しない。つまり、秘匿ファイル生成部250は、文書ファイル139bの提供を拒否する。
【0179】
実施の形態3において、文書ファイル139に含まれる秘匿単語に応じて文書ファイル139(秘匿ファイル)の提供を拒否する形態について説明した。
実施の形態3により、特定の秘匿単語を含んだ文書ファイル139およびその秘匿ファイルの提供を拒否することができる。つまり、文書ファイル139の秘匿性を向上させることができる。
【0180】
実施の形態3は、例えば以下のように、実施の形態1、2と組み合わせても構わない。
【0181】
実施の形態1と同様に、文書秘匿装置200がファイルサーバ130を兼ねても構わないし、秘匿単語テーブル291や利用者情報テーブル292をファイルサーバ130またはデータベース装置に記憶しても構わない。
また、固有名詞以外の単語を秘匿単語として秘匿単語テーブル291に登録しても構わない。
【0182】
実施の形態2と同様に開示単語リスト293を設け、秘匿ファイルを生成する際に利用者の閲覧レベルに関わらず開示単語を伏せ字にせずに開示しても構わない。
【0183】
実施の形態4.
文書ファイル139に特定の秘匿単語の組み合わせが含まれる場合に文書ファイル139に含まれる未登録単語を新たな秘匿単語として登録する形態について説明する。
以下、実施の形態1から3と異なる事項について主に説明する。説明しない事項については実施の形態1から3と同様である。
【0184】
文書秘匿システム100の構成は、実施の形態1(図1参照)と同様である。但し、各構成は以下のような機能を有する。
【0185】
秘匿単語テーブル291には、特定の秘匿単語を組み合わせた秘匿組み合わせが設定される。
【0186】
秘匿単語登録部220は、文書ファイル139から抽出した単語に基づいて、秘匿単語テーブル291に記憶されている秘匿組み合わせと同じ単語の組み合わせが文書ファイル139に含まれているか否かを判定する。
秘匿単語登録部220は、秘匿組み合わせと同じ単語の組み合わせが文書ファイル139に含まれていると判定した場合に新たな秘匿単語を秘匿単語テーブル291に設定する。
【0187】
図26は、実施の形態4における秘匿単語テーブル291と利用者情報テーブル292とを示す図である。
実施の形態4における秘匿単語テーブル291について、図26に基づいて説明する。利用者情報テーブル292は実施の形態1と同じである(図2参照)。
【0188】
秘匿単語テーブル291の「秘匿単語」は、単一の秘匿単語または秘匿単語の組み合わせを示す。図中の“ミッションD”は単一の秘匿単語の一例であり、図中の“情報太郎,ミッションA”“情報太郎,Bシステム”“情報二郎,C装置”はそれぞれ秘匿単語の組み合わせの一例である。秘匿単語の組み合わせは、3つ以上の秘匿単語を組み合わせたものであっても構わない。
秘匿単語の組み合わせは管理者によって予め設定され、単一の秘匿単語は管理者または秘匿単語登録部220によって設定される。
【0189】
以下、秘匿単語テーブル291に設定されている秘匿単語の組み合わせを「秘匿組み合わせ」という。
【0190】
文書秘匿方法(文書ファイル登録方法)は、実施の形態1(図3参照)と同様である。
但し、秘匿単語登録処理(S200)の一部が実施の形態1と異なる。
【0191】
図27は、実施の形態4における秘匿単語登録処理(S200)を示すフローチャートである。
実施の形態4における秘匿単語登録処理(S200)について、図27に基づいて説明する。
【0192】
S210は、実施の形態1(図4参照)と同じである。
【0193】
秘匿単語登録部220は、実施の形態1で説明したS220からS240の代わりにS223からS243を実行する。
【0194】
S223において、秘匿単語登録部220は、S210で文書ファイル139から抽出した各固有名詞に基づいて、秘匿単語テーブル291に設定されている少なくともいずれかの秘匿組み合わせと同じ単語の組み合わせが文書ファイル139に含まれるか否かを判定する。
秘匿組み合わせと同じ単語の組み合わせが文書ファイル139に含まれる場合(YES)、S233に進む。
秘匿組み合わせと同じ単語の組み合わせが文書ファイル139に含まれない場合(NO)、新たな秘匿単語の登録を行わず、秘匿単語登録処理(S200)は終了する。
【0195】
S233において、秘匿単語登録部220は、S223の処理結果に基づいて、文書ファイル139に含まれる単語の組み合わせと同じ各秘匿組み合わせの秘匿レベルを秘匿単語テーブル291から取得する。
S233の後、S243に進む。
【0196】
S243において、秘匿単語登録部220は、S210で文書ファイル139から抽出した複数の固有名詞から秘匿単語テーブル291に秘匿単語として登録されていない未登録の固有名詞を選別する。
例えば、秘匿単語登録部220は、各固有名詞を検索キーにして秘匿単語テーブル291を検索し、検索キーと一致する秘匿単語が秘匿単語テーブル291に存在しない場合に当該固有名詞を未登録の固有名詞と判定する。検索対象は秘匿単語テーブル291に設定されている単一の秘匿単語であっても構わないし、秘匿組み合わせを構成する秘匿単語を検索対象に含めても構わない。
【0197】
秘匿単語登録部220は、選別した未登録の固有名詞を新たな秘匿単語として秘匿単語テーブル291に登録(設定)する。
秘匿単語登録部220は、新たな秘匿単語の秘匿レベルとしてS233で取得したいずれかの秘匿レベルを秘匿単語テーブル291に設定する。
S243により、秘匿単語登録処理(S200)は終了する。
【0198】
図28は、実施の形態4における秘匿単語登録処理(S200)の具体例を示す図である。
実施の形態4における秘匿単語登録処理(S200)の具体例について、図28に基づいて説明する。
【0199】
“e文書”というファイル名の文書ファイル139eには5つの固有名詞“Bシステム”“ミッションD”“情報太郎”“情報二郎”“情報三郎”が含まれる。
秘匿単語登録部220は、この文書ファイル139eから5つの固有名詞“Bシステム”“ミッションD”“情報太郎”“情報二郎”“情報三郎”を抽出し、抽出した5つの固有名詞を設定した単語リスト221を生成する。
【0200】
図26に示した秘匿単語テーブル291には、3つの秘匿組み合わせ“情報太郎,ミッションA”“情報太郎,Bシステム”“情報二郎,C装置”が設定されている。
これら3つの秘匿組み合わせのうち“情報太郎,Bシステム”が単語リスト221に含まれる。
この秘匿組み合わせ“情報太郎,Bシステム”の秘匿レベルは“2”である。
【0201】
また、秘匿単語テーブル291には、6つの秘匿単語“情報太郎”“ミッションA”“Bシステム”“情報二郎”“C装置”“ミッションD”が設定されている。
このため、単語リスト221に設定されている5つの固有名詞のうち“情報三郎”が、秘匿単語テーブル291に設定されていない未登録の固有名詞である。
【0202】
秘匿単語登録部220は、未登録の固有名詞“情報三郎”を新たな秘匿単語として秘匿単語テーブル291に設定する。但し、秘匿単語登録部220は、単一の秘匿単語として登録されていない“Bシステム”“情報太郎”“情報二郎”“情報三郎”を新たな秘匿単語として秘匿単語テーブル291に設定しても構わない。
秘匿単語登録部220は、新たな秘匿単語“情報三郎”の秘匿レベルとして単語リスト221に含まれる秘匿組み合わせ“情報太郎,Bシステム”と同じ秘匿レベル“2”を秘匿単語テーブル291に設定する。複数の秘匿組み合わせが単語リスト221に含まれる場合、秘匿単語登録部220は、最も秘匿レベルが高い(または最も秘匿レベルが低い)秘匿組み合わせと同じ秘匿レベルを新たな秘匿単語の秘匿レベルとして設定する。但し、秘匿単語登録部220は、中間の秘匿レベルまたはランダムに選択した秘匿組み合わせの秘匿レベルを新たな秘匿単語の秘匿レベルとして設定しても構わない。
【0203】
文書秘匿方法(文書ファイル提供方法)および秘匿ファイル生成処理(S300)は、実施の形態1と同様である(図8、図9参照)。
【0204】
図29、図30は、実施の形態4における秘匿ファイル生成処理(S300)の具体例を示す図である。
実施の形態4における秘匿ファイル生成処理(S300)の具体例について、図29および図30に基づいて説明する。
【0205】
図29に示すように、“e文書”というファイル名の文書ファイル139eには5つの固有名詞“Bシステム”“ミッションD”“情報太郎”“情報二郎”“情報三郎”が含まれる。
秘匿ファイル生成部250は、この文書ファイル139eから5つの固有名詞“Bシステム”“ミッションD”“情報太郎”“情報二郎”“情報三郎”を抽出し、抽出した5つの固有名詞を設定した単語リスト251を生成する。
【0206】
秘匿ファイル生成部250は、抽出した各固有名詞を検索キーにして秘匿単語テーブル291を検索し、検索キーと一致した秘匿単語に対応付けられた秘匿レベルを取得する。複数の秘匿レベルが存在する場合、秘匿ファイル生成部250は、最も高い(または最も低い)秘匿レベルを選択する。
秘匿ファイル生成部250は、各固有名詞の秘匿レベルを単語リスト251に設定する。
【0207】
図30において、秘匿ファイル生成部250は、各固有名詞の秘匿レベルと閲覧者レベルとを比較する。
以下、秘匿レベルが閲覧者レベルより高い固有名詞“情報二郎”を「秘匿対象単語」という。
【0208】
秘匿ファイル生成部250は、文書ファイル139e内の秘匿対象単語“情報二郎”を伏せ字にして秘匿ファイル252eを生成する。
【0209】
実施の形態4において、文書ファイル139に特定の秘匿単語の組み合わせが含まれる場合に文書ファイル139に含まれる未登録単語を新たな秘匿単語として登録する形態について説明した。
実施の形態4により、一つの秘匿単語が文書ファイル139に記され、文書ファイル139に記されたその他の単語は秘匿する必要がない場合に文書ファイル139に含まれる秘匿する必要がない単語を秘匿単語として登録し、秘匿してしまうことを防ぐことができる。
【0210】
実施の形態4は、例えば以下のように、実施の形態1から3と組み合わせても構わない。
【0211】
実施の形態1と同様に、文書秘匿装置200がファイルサーバ130を兼ねても構わないし、秘匿単語テーブル291や利用者情報テーブル292をファイルサーバ130またはデータベース装置に記憶しても構わない。
また、固有名詞以外の単語を秘匿単語として秘匿単語テーブル291に登録しても構わない。
【0212】
実施の形態2と同様に開示単語リスト293を設け、秘匿ファイルを生成する際に利用者の閲覧レベルに関わらず開示単語を伏せ字にせずに開示しても構わない。
【0213】
実施の形態3と同様に秘匿種別を設け、特定の秘匿組み合わせを含んだ文書ファイル139およびその秘匿ファイルの提供を拒否しても構わない。
【符号の説明】
【0214】
100 文書秘匿システム、101 ネットワーク、110 利用者端末、111 利用者端末制御部、120 管理者端末、121 管理者端末制御部、130 ファイルサーバ、131 ファイルサーバ制御部、132 ファイルサーバ記憶部、139 文書ファイル、200 文書秘匿装置、210 文書ファイル登録部、220 秘匿単語登録部、221 単語リスト、230 閲覧者レベル取得部、240 閲覧ファイル取得部、250 秘匿ファイル生成部、251 単語リスト、252 秘匿ファイル、260 秘匿ファイル出力部、290 文書秘匿装置記憶部、291 秘匿単語テーブル、292 利用者情報テーブル、293 開示単語リスト、901 CPU、902 バス、903 ROM、904 RAM、905 通信装置、911 ディスプレイ、912 キーボード、913 マウス、914 ドライブ装置、920 磁気ディスク装置、921 OS、922 プログラム群、923 ファイル群。

【特許請求の範囲】
【請求項1】
秘匿される秘匿単語を記憶する秘匿単語記憶部と、
複数の単語を含んだ文書ファイルを記憶する文書ファイル記憶部と、
前記文書ファイル記憶部に記憶される文書ファイルから当該文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部と、
特定の文書ファイルを閲覧ファイルとして前記文書ファイル記憶部から取得する閲覧ファイル取得部と、
前記閲覧ファイル取得部によって取得された閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成する秘匿ファイル生成部と、
前記秘匿ファイル生成部によって生成された秘匿ファイルを出力する秘匿ファイル出力部と
を備えることを特徴とする文書秘匿システム。
【請求項2】
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を所定の秘匿表記に置換して当該単語を秘匿することを特徴とする請求項1記載の文書秘匿システム。
【請求項3】
前記秘匿単語登録部は、前記文書ファイルから所定の品詞に属する単語を抽出する
ことを特徴とする請求項1または請求項2記載の文書秘匿システム。
【請求項4】
前記秘匿単語登録部は、前記文書ファイルから固有名詞と数名詞との少なくともいずれかの単語を抽出する
ことを特徴とする請求項3記載の文書秘匿システム。
【請求項5】
前記秘匿単語登録部は、前記文書ファイルから数値と単位とを含んだ単語を抽出する
ことを特徴とする請求項1または請求項2記載の文書秘匿システム。
【請求項6】
前記文書秘匿システムは、さらに、
開示される開示単語を記憶する開示単語記憶部を備え、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語であって且つ前記開示単語記憶部に記憶されている開示単語と異なる単語を前記新たな秘匿単語として前記秘匿単語記憶部に記憶する
ことを特徴とする請求項1から請求項5いずれかに記載の文書秘匿システム。
【請求項7】
前記秘匿単語記憶部は、各秘匿単語に対応付けて当該秘匿単語と当該秘匿単語を含んだ閲覧ファイルとのいずれを秘匿するかを示す秘匿種別を記憶し、
前記秘匿単語登録部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記文書ファイルから抽出した単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別のうちいずれかの秘匿種別を前記新たな秘匿単語の秘匿種別として前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記閲覧ファイルに含まれる単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別に基づいて各秘匿単語と前記閲覧ファイルとのいずれを秘匿するか判定し、各秘匿単語を秘匿すると判定した場合に前記秘匿ファイルを生成する
ことを特徴とする請求項1から請求項6いずれかに記載の文書秘匿システム。
【請求項8】
前記秘匿単語記憶部は、特定の秘匿単語を組み合わせた秘匿組み合わせを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語に基づいて前記秘匿単語記憶部に記憶されている秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれているか否かを判定し、前記秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれていると判定した場合に前記新たな秘匿単語を前記秘匿単語記憶部に記憶することを特徴とする請求項1から請求項7いずれかに記載の文書秘匿システム。
【請求項9】
前記文書ファイル秘匿システムは、さらに、
各利用者に与えられた閲覧レベルを記憶する利用者情報記憶部と、
特定の利用者に与えられた閲覧レベルを閲覧者レベルとして前記利用者情報記憶部から取得する閲覧者レベル取得部とを備え、
前記秘匿単語記憶部は、各秘匿単語に対応付けて特定の秘匿レベルを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を登録済み単語として選別し、選別した登録済み単語の秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルのうちいずれかの秘匿レベルを前記新たな秘匿単語の秘匿レベルとして前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を選別し、選別した単語と同じ秘匿単語に対応付けられた秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルと前記閲覧者レベル取得部によって取得された閲覧者レベルとを比較し、当該秘匿レベルが前記閲覧者レベルより高い単語を秘匿して前記秘匿ファイルを生成する
ことを特徴とする請求項1から請求項8いずれかに記載の文書秘匿システム。
【請求項10】
秘匿される秘匿単語を記憶する秘匿単語記憶部と、
文書ファイルから前記文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部と
を備えることを特徴とする文書秘匿装置。
【請求項11】
秘匿される秘匿単語を記憶する秘匿単語記憶部と、複数の単語を含んだ文書ファイルを記憶する文書ファイル記憶部とを備える文書秘匿システムを機能させる文書秘匿プログラムであって、
前記文書ファイル記憶部に記憶される文書ファイルから当該文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部と、
特定の文書ファイルを閲覧ファイルとして前記文書ファイル記憶部から取得する閲覧ファイル取得部と、
前記閲覧ファイル取得部によって取得された閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成する秘匿ファイル生成部と、
前記秘匿ファイル生成部によって生成された秘匿ファイルを出力する秘匿ファイル出力部として前記文書秘匿システムを機能させる
ことを特徴とする文書秘匿プログラム。
【請求項12】
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を所定の秘匿表記に置換して当該単語を秘匿することを特徴とする請求項11記載の文書秘匿プログラム。
【請求項13】
前記秘匿単語登録部は、前記文書ファイルから所定の品詞に属する単語を抽出する
ことを特徴とする請求項11または請求項12記載の文書秘匿プログラム。
【請求項14】
前記秘匿単語登録部は、前記文書ファイルから固有名詞と数名詞との少なくともいずれかの単語を抽出する
ことを特徴とする請求項13記載の文書秘匿プログラム。
【請求項15】
前記秘匿単語登録部は、前記文書ファイルから数値と単位とを含んだ単語を抽出する
ことを特徴とする請求項11または請求項12記載の文書秘匿プログラム。
【請求項16】
前記文書秘匿システムは、さらに、
開示される開示単語を記憶する開示単語記憶部を備え、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語であって且つ前記開示単語記憶部に記憶されている開示単語と異なる単語を前記新たな秘匿単語として前記秘匿単語記憶部に記憶することを特徴とする請求項11から請求項15いずれかに記載の文書秘匿プログラム。
【請求項17】
前記秘匿単語記憶部は、各秘匿単語に対応付けて当該秘匿単語と当該秘匿単語を含んだ閲覧ファイルとのいずれを秘匿するかを示す秘匿種別を記憶し、
前記秘匿単語登録部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記文書ファイルから抽出した単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別のうちいずれかの秘匿種別を前記新たな秘匿単語の秘匿種別として前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記秘匿単語記憶部に記憶されている秘匿種別のうち前記閲覧ファイルに含まれる単語と同じ秘匿単語の秘匿種別を取得し、取得した秘匿種別に基づいて各秘匿単語と前記閲覧ファイルとのいずれを秘匿するか判定し、各秘匿単語を秘匿すると判定した場合に前記秘匿ファイルを生成する
ことを特徴とする請求項11から請求項16いずれかに記載の文書秘匿プログラム。
【請求項18】
前記秘匿単語記憶部は、特定の秘匿単語を組み合わせた秘匿組み合わせを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語に基づいて前記秘匿単語記憶部に記憶されている秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれているか否かを判定し、前記秘匿組み合わせと同じ単語の組み合わせが前記文書ファイルに含まれていると判定した場合に前記新たな秘匿単語を前記秘匿単語記憶部に記憶することを特徴とする請求項11から請求項17いずれかに記載の文書秘匿プログラム。
【請求項19】
前記文書ファイル秘匿システムは、さらに、
各利用者に与えられた閲覧レベルを記憶する利用者情報記憶部を備え、
前記文書秘匿プログラムは、
特定の利用者に与えられた閲覧レベルを閲覧者レベルとして前記利用者情報記憶部から取得する閲覧者レベル取得部として前記文書ファイル秘匿システムを機能させ、
前記秘匿単語記憶部は、各秘匿単語に対応付けて特定の秘匿レベルを記憶し、
前記秘匿単語登録部は、前記文書ファイルから抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を登録済み単語として選別し、選別した登録済み単語の秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルのうちいずれかの秘匿レベルを前記新たな秘匿単語の秘匿レベルとして前記秘匿単語記憶部に記憶し、
前記秘匿ファイル生成部は、前記閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を選別し、選別した単語と同じ秘匿単語に対応付けられた秘匿レベルを前記秘匿単語記憶部から取得し、取得した秘匿レベルと前記閲覧者レベル取得部によって取得された閲覧者レベルとを比較し、当該秘匿レベルが前記閲覧者レベルより高い単語を秘匿して前記秘匿ファイルを生成する
ことを特徴とする請求項11から請求項18いずれかに記載の文書秘匿プログラム。
【請求項20】
秘匿される秘匿単語を記憶する秘匿単語記憶部を備える文書秘匿装置を機能させる文書秘匿プログラムであって、
文書ファイルから前記文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部として前記文書秘匿装置を機能させる
ことを特徴とする文書秘匿プログラム。
【請求項21】
秘匿される秘匿単語を記憶する秘匿単語記憶部と、複数の単語を含んだ文書ファイルを記憶する文書ファイル記憶部と、前記文書ファイル記憶部に記憶される文書ファイルから当該文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する秘匿単語登録部とを備える文書秘匿システムによって実行する文書秘匿方法であって、 閲覧ファイル取得部が、特定の文書ファイルを閲覧ファイルとして前記文書ファイル記憶部から取得し、
秘匿ファイル生成部が、前記閲覧ファイル取得部によって取得された閲覧ファイルに含まれる単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と同じ単語を秘匿して秘匿ファイルを生成し、
秘匿ファイル出力部が、前記秘匿ファイル生成部によって生成された秘匿ファイルを出力する
ことを特徴とする文書秘匿方法。
【請求項22】
秘匿される秘匿単語を記憶する秘匿単語記憶部を備える文書秘匿装置によって実行する文書秘匿方法であって、
秘匿単語登録部が、文書ファイルから前記文書ファイルに含まれる単語を抽出し、抽出した単語のうち前記秘匿単語記憶部に記憶されている秘匿単語と異なる単語を新たな秘匿単語として前記秘匿単語記憶部に記憶する
ことを特徴とする文書秘匿方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate


【公開番号】特開2013−97479(P2013−97479A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−238170(P2011−238170)
【出願日】平成23年10月31日(2011.10.31)
【出願人】(591102095)三菱スペース・ソフトウエア株式会社 (148)
【Fターム(参考)】