説明

個人情報検索プログラム、処理方法および処理装置、個人情報管理プログラム、ならびに個人情報管理システム

【課題】 個人情報を管理するために、コンピュータが使用する情報記憶手段から個人情報を含む個人情報ファイルを漏れなく検索するプログラムを提供する。
【解決手段】 個人情報検索装置10は、データファイルを個人情報ファイルと判定するための検索条件を検索条件記憶手段11に記憶しておく。個人情報検索装置10は、入力処理手段12により、入出力手段3から例えば管理者の操作入力による個人情報の検索指示を入力し、検索手段13により、情報記憶手段2のデータファイルが検索条件に合致するか否かを判定して個人情報ファイルを検索する。そして、出力処理手段14により、検索手段13の検索結果4として個人情報ファイルのリストを入出力手段3に出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、個人情報の漏洩・散逸などを防止するために、サーバ、ストレージなどを含むコンピュータで使用される情報記憶手段に記憶されている個人情報を管理する個人情報管理支援技術に関する。
【背景技術】
【0002】
個人情報とは、苗字、名前、メールアドレス、電話番号など、個人を特定できる情報である。個人情報データベースに限らず、まとまった個人情報を含むデータファイル(個人情報ファイル)などをコンピュータの情報記憶装置に蓄積・管理し、必要に応じて呼び出した個人情報ファイルを利用してさまざまな業務のためにデータ処理を行うことは一般的に行われている(例えば、特許文献1)。
【特許文献1】特開2000−285136号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
個人情報を蓄積するコンピュータやその情報記憶装置を利用する企業・個人は、漏洩が生じないように留意して個人情報を管理する必要がある。近年では、「個人情報保護法」および関連法律が整備され、個人情報を安全に管理することが企業の活動にとって非常に重要な課題となっている。
【0004】
個人情報を管理するためには、管理対象となる個人情報を特定する必要があるが、個人情報を多く扱う企業や官公庁、自治体など(以下、企業等と記す)においては、管理対象を漏れなく特定することは非常に困難である。企業等での個人情報の存在に関して、以下のとおりに分類することができる。
1)誰でも、存在することがわかっている個人情報:例えば、社員の個人情報、協力会社社員の個人情報、顧客の個人情報などである。
2)担当する業務グループが存在することを知っている個人情報:例えば、特定業務用の共有の個人情報、プロジェクトのテストデータとして使用する個人情報などである。
3)担当者(個人)だけが存在することを知っている個人情報:例えば、特定業務用の共有の個人情報をコピーして個人的に保存している個人情報、個人管理のアドレス帳、名刺などである。
4)誰も存在することを知らない個人情報:例えば、プロジェクトのテストデータとして使用していた個人情報であって、プロジェクト完了や担当者退職などによって管理担当者が不明となっている状況にあるものなどである。
【0005】
上記1)、2)、3)のような個人情報の存在は、アンケート調査や自己申告によって特定が可能であるが、故意に隠された場合には特定することはできない。また、安全管理上最も危険であるのは、上記4)のような管理されていない個人情報である。そのため、個人情報管理について、定期的な内部監査や第三者監査が必要となる。個人情報を漏れなく特定するために、実際に個人情報の現物を調査する必要がある。しかし、企業等で取り扱う情報が電子データ化されている場合には、電子化された多量のデータをすべて手作業で調査して個人情報を特定することは事実上困難である。
【0006】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、個人情報管理業務を支援するために、外部記憶装置、ストレージなどのコンピュータが使用する情報記憶手段内に蓄積されたデータファイルから、個人情報を含む個人情報ファイルを自動的に漏れなく検索できる個人情報検索処理装置としてコンピュータを機能させるためのプログラムを提供することである。
【0007】
さらに、本発明は、コンピュータが使用する情報記憶手段内に蓄積されたデータファイルから、個人情報を含む個人情報ファイルを自動的に漏れなく検索した検索結果をもとに、電子データ化された個人情報を漏れなくかつ容易に管理できる個人情報管理装置としてコンピュータを機能させるためのプログラムを提供することである。
【課題を解決するための手段】
【0008】
本発明にかかる個人情報検索プログラムは、サーバやストレージなどを含む任意のコンピュータ内に個人情報があるか否かを自動的に検索するものである。
【0009】
本発明の個人情報検索プログラムは、情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索するために、コンピュータを、1)前記データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、2)個人情報ファイルを検索する検索指示を入力する入力処理手段と、3)前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、4)前記検索手段の検索結果を出力する出力処理手段として機能させるためのものである。
【0010】
本発明として機能するコンピュータは、データファイルを個人情報ファイルと判定するための検索条件を記憶しておく。
【0011】
そして、入力処理手段によって、例えば個人情報の管理者によって入力操作された前記情報記憶手段から個人情報ファイルの検索指示が入力されると、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索し、出力処理手段によって、前記検索手段の検索結果を例えば個人情報ファイルのリスト形式で出力する。
【0012】
管理者は、個人情報検索結果の個人情報ファイルの一覧を管理対象とするべき個人情報の候補として利用することができるため、漏れのない個人情報管理を実施することができる。
【0013】
また、本発明の個人情報検索プログラムは、前記データファイルが非テキスト形式である場合に、前記データファイルのデータをテキストデータに変換するデータ形式変換手段を備えるとともに、前記検索手段は、前記データファイルの変換されたテキストデータについて前記検索条件と合致するか否かを判定することができる。
【0014】
これにより、テキスト形式のデータファイルだけでなく、MS Word(米国マイクロソフト社の登録商標)、MS Excel(米国マイクロソフト社の登録商標)、MS Access(米国マイクロソフト社の登録商標)、OASYS(富士通株式会社の登録商標)、一太郎(株式会社ジャストシステムの登録商標)などの特定アプリケーション用のデータファイル、PDFファイル、圧縮されたファイルなども対象として、個人情報を漏れなく検索することができる。
【0015】
また、本発明の個人情報検索プログラムは、所定の暗号化ファイルを示す暗号化ファイル情報に合致するか否かを判定し、前記暗号化ファイル情報に合致するデータファイルを暗号化ファイルとして検出する暗号化情報検出手段を備えるとともに、前記検索手段は、前記データファイルが暗号化ファイルでない場合に、当該データファイルについて前記検索条件と合致するか否かを判定し、前記出力処理手段は、前記暗号化情報検出手段の検出結果を出力することができる。
【0016】
これにより、管理者は、検索条件による検索が行えない暗号化されたデータファイルの存在を知ることができる。
【0017】
また、本発明の個人情報検索プログラムにおいて、前記検索手段は、他のコンピュータが使用する情報記憶手段から前記個人情報ファイルを検索することができる。
【0018】
すなわち、本発明の個人情報検索プログラムを、情報記憶手段を備えるサーバまたはクライアント側にエージェントプログラムとして実施し、このエージェントプログラムによってサーバやクライアント側で個人情報の検索処理を行わせ、エージェントプログラムの検索結果をネットワークにより所定の管理サーバで収集し、収集した検索結果を利用することによって、遠隔のコンピュータの個人情報を検索することができる。さらに、検索対象先として複数のコンピュータを指定して個人情報を検索することができる。よって、遠隔地や複数のコンピュータに対する個人情報管理を支援することができる。
【0019】
また、本発明の個人情報検索処理方法は、1)個人情報ファイルを検索する検索指示を入力する入力処理過程と、2)前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが、前記データファイルを個人情報ファイルと判定するための検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索処理過程と、3)前記検索手段の検索結果を出力する出力処理過程とを備える。
【0020】
また、本発明の個人情報検索処理装置は、情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索する処理装置であって、1)前記データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、2)個人情報ファイルを検索する検索指示を入力する入力処理手段と、3)前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、4)前記検索手段の検索結果を出力する出力処理手段とを備える。
【0021】
また、本発明の個人情報管理プログラムは、情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するために、コンピュータを、1)データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、2)所定の指示を入力する入力処理手段と、3)個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、4)前記検索手段の検索結果を管理情報生成手段へ出力する出力処理手段と、5)前記出力した検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶する管理情報生成手段と、6)前記管理情報を出力する管理情報出力処理手段として機能させるためのものである。
【0022】
これにより、管理者は、コンピュータの情報記憶手段に対する検索処理の結果を利用して、検索された個人情報ファイルについて、所有者(オーナ)、パーミッション、ファイルの作成日、更新日、アクセス日などの管理情報を付加して個人情報ファイルを管理することができる。
【0023】
また、本発明は、サーバ・コンピュータとクライアント・コンピュータで構成される個人情報管理システムとすることもできる。
【発明の効果】
【0024】
本発明の個人情報検索プログラムによれば、コンピュータで使用される情報記憶手段に記憶されている個人情報を含む個人情報ファイルを検出することができるため、従来のアンケートや自己申告などによっては特定できないような故意に隠された個人情報や存在が知られていない個人情報を含む個人情報ファイルをも検出して管理対象とし、漏れなくかつ容易に個人情報を管理することができる。
【0025】
また、本発明によれば、個人情報検索処理を所定の時機または期間ごとに実行することができるため、個人情報の定期的監査に利用することができる。
【0026】
また、本発明によれば、ネットワークで接続されたコンピュータの情報記憶手段を検索対象先とすることができ、その検索結果を収集しまとめて記憶することができるため、遠隔地の複数のコンピュータで記憶されている個人情報を一元的に管理することができる。
【0027】
また、本発明を、検索対象先となる情報記憶手段を備えるコンピュータにインストール可能なツールプログラムとして実施することができるため、例えば情報管理コンサルタント業務などの業務支援ツールとして、顧客の調査対象となるコンピュータの情報記憶手段の中にどのような個人情報がどれだけあるかを簡単に調査することができる。
【発明を実施するための最良の形態】
【0028】
図1は、本発明の実施の一形態におけるブロック構成を示す図である。
【0029】
本発明の個人情報検索装置(検索プログラム)10は、データファイルを記憶する情報記憶手段2から、個人を特定できる個人情報を含むデータファイル(個人情報ファイル)を検索する処理をコンピュータ1に実行させるためのプログラムである。情報記憶手段2には、個人情報を含むデータファイル(個人情報ファイルA、B、C、D)、個人情報を含まないデータファイル(その他の情報ファイル)が記憶されている。
【0030】
検索プログラム10は、検索条件記憶手段11、入力処理手段12、検索手段13、出力処理手段14、およびデータ形式変換手段15を備える。
【0031】
検索条件記憶手段11は、情報記憶手段2のデータファイルを個人情報ファイルと判定するための条件を設定した検索条件を記憶する記憶手段である。検索条件記憶手段11には、検索条件として、データファイルから切り出される所定の判定対象単位のデータ(以下検索データとする)について、そのデータの種別を示すデータタイプが記憶される。さらに、個人情報となりうる検索データのデータタイプの組み合わせを示すタイプパターンが記憶される。
【0032】
データタイプとして、個人情報となるデータを、苗字または名前を表す文字列で示す姓名タイプ、電話番号を表す数字列で示す電話番号タイプ、電子メールアドレスを表すアドレス文字の文字列で示すメールアドレスタイプなどが記憶される。
【0033】
図2に、姓名タイプとなるデータの検索条件の例を示す。図2に示すキーワード表は、検索条件記憶手段11に姓名タイプの定義情報として記憶されるものであり個人情報となりうる苗字や名前を人名辞典などから抽出してキーワードとし、各キーワードに対応するデータタイプ(苗字タイプ、名前タイプ)を示したものである。なお、キーワード表に、株式会社、有限会社などの組織や団体を示す語であって、他の語との組み合わせによって個人情報となりうるものをキーワードとし、そのデータタイプ(組織タイプ)を含めてもよい。
【0034】
電話番号タイプとなるデータの検索条件として「0で始まる10桁または11桁の数字列」という定義情報と、また、メールアドレスタイプとなるデータの検索条件として「英数文字列@英数文字列.(ドット)英数文字列」という定義情報が記憶される。
【0035】
さらに、タイプパターンとして、「苗字タイプ+名前タイプ」、「組織タイプ+名前タイプ」、「苗字タイプ+電話番号タイプ」、「メールアドレスタイプのみ」などのデータタイプの組み合わせを示す定義情報が記憶される。
【0036】
さらに、データファイルを個人情報ファイルと判定するためのタイプパターンに合致する検索データ数を閾値として設定する。
【0037】
入力処理手段12は、入出力手段3を介してユーザが入力操作した所定の指示を入力する処理手段である。
【0038】
検索手段13は、入力処理手段12が入力した検索指示(情報記憶手段2から個人情報ファイルを検索する指示)に従って、情報記憶手段2に記憶されているデータファイルが検索条件に合致するか否かを判定して個人情報ファイルを検索する処理手段である。
【0039】
検索手段13は、例えば、検索条件記憶手段11に検索条件としてメールアドレスタイプの定義情報が記憶されている場合に、情報記憶手段2のデータファイルから切り出した検索データがメールアドレスタイプに合致するか否かを判定し、さらに、そのデータファイルにメールアドレスタイプと合致する検索データが所定の数以上含まれていた場合に個人情報ファイルと判定する。
【0040】
また、検索手段13は、例えば、検索条件記憶手段11に検索条件として姓名タイプおよび電話番号タイプの定義情報およびタイプパターンとして「苗字タイプ+名前タイプ」、「苗字タイプ+電話番号タイプ」が記憶されている場合に、情報記憶手段2のデータファイルから切り出した検索データがデータタイプに合致するか否かを判定し、さらに検索データのデータタイプがタイプパターンに合致するか否かを判定し、さらに、そのデータファイルにタイプパターンと合致する検索データの組み合わせが所定数以上含まれていた場合に個人情報ファイルと判定する。
【0041】
また、検索手段13は、検索条件記憶手段11に検索条件として、苗字の先頭2文字の漢字を表す文字列を示す苗字2文字タイプの定義情報が記憶されている場合に、情報記憶手段2のデータファイルから検索データとして2文字の文字列を切り出し、切り出した検索データ(2文字文字列)が苗字2文字タイプに一致するか否かを判定し、さらに、そのデータファイルに苗字2文字タイプに合致する2文字文字列が所定の数以上含まれていた場合に個人情報ファイルと判定する。
【0042】
さらに、検索手段13は、情報記憶手段2のデータファイルが所定の暗号化ファイルを示す暗号化ファイル情報に合致するか否かを判定し、前記暗号化ファイル情報に合致するデータファイルを暗号化ファイルとして検出する。
【0043】
出力処理手段14は、検索手段13によって検索された個人情報ファイル(個人情報ファイルA、B、C、D)の一覧である検索結果(個人情報リスト)4を入出力手段3への表示または印刷による出力処理を行う処理手段である。
【0044】
出力処理手段14は、さらに、検索結果4の個人情報ファイルについて、各個人情報ファイルに含まれる検索条件と合致した検索データの類似度を比較し、所定の類似度を持つ個人情報ファイルをファイル作成日をもとに並び替えて個人情報ファイル間の親子関係を特定し、その親子関係を図または表の形式で入出力手段3に出力する処理を行う。
【0045】
親子関係とは、先に生成されたデータファイルを親ファイルとし、親ファイルをもとに後に生成された類似の内容のデータファイルを子ファイルとする2つのファイルの関係である。
【0046】
データ形式変換手段15は、情報記憶手段2のデータファイルが非テキスト形式である場合に、データファイルのデータの一部または全部をテキストデータに変換する処理手段である。検索手段13は、データファイルの中のデータ形式変換手段15によって変換されたデータを検索データして検索条件による検索を行う。
【0047】
以下、図3を用いて本発明の処理概要を説明する。
【0048】
検索プログラム10の検索条件記憶手段11には、検索条件として、苗字タイプ、名前タイプ、電話番号タイプ、メールアドレスタイプなどの各データタイプの定義情報、「苗字+名前」、「組織+名前」、「苗字+電話番号」、「メールアドレス」などのタイプパターン、個人情報ファイルと判定する個人情報のカウント数の閾値=nが記憶されているとする。
【0049】
検索プログラム10の入力処理手段12は、ユーザが入出力手段3を操作して入力した検索指示を入力する。
【0050】
検索手段13は、検索指示に従って、検索対象先の情報記憶手段2に記憶されているデータファイルを1つ取り出し、取り出したデータファイルから所定の判定対象単位によって検索データを切り出す。
【0051】
ここでは、テキストデータを語単位で切り出す。例えば、データファイルのテキストデータの一部が「○○株式会社 青木 太郎」である場合に、検索手段13は、このテキストデータを1語ずつ切り出して検索データとする。切り出した検索データは、「○○」、「株式会社」、「青木」、「太郎」となる。
【0052】
検索手段13は、図2のキーワード表を参照して、検索データが検索条件のデータタイプ(苗字タイプ、名前タイプ、組織タイプなど)に合致するか否かを判定する。検索データ「○○」はいずれのデータタイプにも該当せず、「株式会社」は組織パターン、「青木」は苗字パターン、「太郎」は名前パターンに該当するものとする。検索手段13は、特定したデータタイプ「組織タイプ(組織)」、「苗字タイプ(苗字)」、「名前タイプ(名前)」を結果リストに順に追加してゆく。
【0053】
続いて、データファイルの検索データが、電話番号タイプに合致するか否かを判定する。電話番号タイプであると判定した場合に、電話番号タイプ(電話)を結果リストに追加する。さらに、データファイルの検索データが、メールアドレスタイプに合致するか否かを判定する。メールアドレスタイプであると判定した場合に、メールアドレスタイプ(アドレス)を結果リストに追加する。
【0054】
そして、検索手段13は、取り出した1つのデータファイルのすべての検索データについて、データタイプの判定を行った後、タイプパターンを参照して、結果リストのデータタイプの並びが所定のタイプパターンのデータタイプの組み合わせ(並び)に合致しているか否かを判定する。結果リストにいずれかのタイプパターンに合致したデータタイプの並びがあれば、個人情報のカウント数に1を加算する。個人情報のカウント数が所定の閾値n以上であれば、そのデータファイルを個人情報ファイルと判定する。
【0055】
なお、検索手段13は、個人情報のカウント数をタイプパターンごとに設けて各カウント数の閾値を設定できるようにしてもよい。
【0056】
以上の検索処理を、情報記憶手段2のすべてのデータファイルについて行う。
【0057】
また、検索手段13は、情報記憶手段2のデータファイルを検索処理する前に、暗号化ファイル情報をもとに取り出したデータファイルが暗号化ファイルであるか否かを判定し、暗号化ファイル情報に合致するデータファイルを暗号化ファイルとして検出し、暗号化ファイルリストに追加する。検索手段13は、暗号化ファイルとして検出したデータファイルについては検索条件による検索処理を行わない。
【0058】
また、検索手段13による検索処理の前に、データ形式変換手段15は、情報記憶手段2から取り出したデータファイルが非テキスト形式のデータファイルであれば、取り出したデータファイルの一部または全部のデータをテキスト形式のデータに変換する。検索手段13は、取り出したデータファイルの変換された検索データについて検索条件による検索処理を行う。
【0059】
情報記憶手段2のすべてのデータファイルについて上記の処理を行った後、出力処理手段14は、検索手段13で個人情報ファイルとして検索されたデータファイルのファイル名の一覧である検索結果4を入出力手段3に表示または印刷出力する。出力処理手段14は、暗号化ファイルリストを検索結果4とともに出力してもよい。
【0060】
ユーザである管理者は、出力された検索結果4によって、個人情報を一定量以上含むデータファイルの存在を漏れなく知ることができる。また、検索条件によっては検索処理ができない暗号化ファイルの存在をも知ることができる。
【0061】
以下に、本発明の実施形態における処理をより詳細に説明する。
【0062】
図4に、本発明の処理概要の流れを示す。
【0063】
検索プログラム10の入力処理手段12は、ユーザが入出力手段3を介して設定した個人情報のカウント数の閾値(数)nを入力する(ステップS1)。
【0064】
検索手段13は、情報記憶手段2からデータファイルを1つ取り出す(ステップS2)。取り出されたデータファイルがあれば(ステップS3)、暗号化ファイル情報をもとに取り出したデータファイルが暗号化ファイルか否かを判定する(ステップS4)。取り出したデータファイルが暗号化ファイルでなければ、取り出したデータファイルの形式を調べ、テキストデータを含むデータファイル(以下、テキストファイルという)に変換する処理を行う(ステップS5)。
【0065】
さらに、検索手段13は、検索条件記憶手段11の検索条件をもとに、変換したテキストファイルの検索データが検索条件に合致するデータであるか否かを判定し、検索条件に合致するデータを個人情報とし、個人情報の個数をカウントする処理を行う(ステップS6)。
【0066】
ステップS6の処理で、取り出したデータファイルの個人情報のカウント数がn個以上であれば(ステップS7)、取り出したデータファイルのファイル名を検索結果(個人情報リスト)4に追加し(ステップS8)、ステップS2の処理へ戻る。一方、個人情報のカウント数がn個に満たなければ(ステップS7)、ステップS2の処理へ戻る。
【0067】
また、ステップS4の処理において、取り出したデータファイルが暗号化ファイルであれば、取り出したデータファイルのファイル名を暗号化ファイルリストに追加して(ステップS9)、ステップS2の処理へ戻る。
【0068】
ステップS2〜ステップS9の処理を情報記憶手段2の各データファイルについて繰り返し、情報記憶手段2から取り出すデータファイルがなくなれば(ステップS3)、出力処理手段14は、検索結果(個人情報リスト)4と暗号化ファイルリストとを入出力手段3に表示または印刷により出力する処理を行い(ステップS10)、処理を終了する。
【0069】
図5に、図4に示すステップS5の処理の詳細フローを示す。
【0070】
ステップS5の処理において、さまざまなデータ形式を調べる処理は、全文検索システムのBizSearch(富士通株式会社)などで実現されている処理方法を使用する。また、検索手段13は、あるデータ形式をテキスト形式へ変換する各種データ変換の処理機能を備えているか、または、外部のデータ変換処理モジュールを呼び出してデータ形式変換処理を要求する。
【0071】
検索手段13は、取り出したデータファイルのデータ形式を判定する(ステップS50)。取り出したデータファイルのデータ形式がテキスト形式であれば(ステップS51)、データ変換処理を行わずに復帰する。
【0072】
また、取り出したデータファイルのデータが表計算ソフトウェアやデータベースソフトウェアなどで使用される表形式であれば(ステップS52)、表形式データをテキストデータに変換する所定の処理機能を用いて、データファイルのデータをテキストのcsv形式データに変換する(ステップS53)。また、取り出したデータファイルのデータがワードプロセッサ用データ形式であれば(ステップS54)、ワードプロセッサ用データをテキストデータに変換する所定の処理機能を用いて、テキスト部分のデータだけをテキスト形式データに変換する(ステップS55)。
【0073】
また、データファイルのデータが上記以外のデータ形式であれば、そのデータ形式のデータをテキストデータに変換する所定の処理機能を用いて、データファイルのデータをできるだけテキストデータに変換する(ステップS56)。
【0074】
図6に、図4に示すステップS6の処理の詳細フローを示す。
【0075】
検索手段13は、データファイルから所定の切り出し単位による検索データとして1語を切り出す(ステップS60)。データファイルから1語を切り出す処理として、例えば、文字種の区切り、例えば、全角文字、半角文字、漢字、かな、カタカナ、英字、記号などをもとに、文字種の変化部分を区切りとして切り出す処理を行う。苗字を表す文字列と名前を表す文字列とが連続する文字列については、文字列の先頭から1文字、2文字、3文字など所定の文字数の文字列を順次苗字の候補として切り出し、残りの文字列を名前の候補として切り出す。なお、苗字と名前が連続する文字列については、そのまま1語として切り出し、データタイプの判定処理において最長一致を行うことにより苗字タイプまたは名前タイプを決定するようにしてもよい。
【0076】
データファイルから検索データとして切り出す1語があれば(ステップS61)、検索条件のキーワード表から、検索データのデータタイプを求める処理を行う(ステップS62)。
【0077】
図7に、ステップS62の処理の詳細フローを示す。
【0078】
検索手段13は、キーワード取り出しのバッファを初期化し(ステップS620)、キーワード表から順にキーワードを1語取り出す(ステップS621)。キーワード表から取り出すキーワードがあれば(ステップS622)、検索データと取り出したキーワードとを比較する(ステップS623)。検索データとキーワードとの比較処理として、キーワード表をソートしておき2分法で比較する方法や、キーワード表にハッシュインデックスを作成しておき、検索データのハッシュ値を計算して比較対象のキーワードを検索するハッシュテーブル法などを使用してもよい。
【0079】
検索データと取り出したキーワードとが一致していれば(ステップS624)、キーワード表から取り出したキーワードに対応するデータタイプを求めて、戻り値をキーワードに対応する「データタイプ」とし、処理を復帰する(ステップS625)。検索データと取り出したキーワードとが一致していなければ(ステップS624)、ステップS621へ戻り、キーワード表から次のキーワードを1語取り出し、ステップS622以降の処理を繰り返す。
【0080】
ステップS622の処理で、キーワード表から切り出すキーワードがなければ、戻り値を「データタイプなし」とし、処理を復帰する(ステップS626)。
【0081】
次に、ステップS62のキーワード表による検索処理の結果、戻り値にデータタイプがあれば(ステップS63)、処理の戻り値、すなわち検索データと合致したキーワードのデータタイプ(苗字、名前、組織など)を結果リストに追加する(ステップS64)。一方、戻り値にデータタイプがなければ(ステップS63)、検索データが電話番号タイプか否かを判定する処理を行う(ステップS65)。
【0082】
図8に、ステップS65の処理の詳細フローを示す。
【0083】
検索手段13は、検索データに含まれる「(、)、−、空白」を削除し(ステップS650)、検索データが、0で始まる10桁または11桁の数字列であれば、電話番号タイプと判定する(ステップS651)。そして、検索データを電話番号タイプと判定した場合に、戻り値を「電話番号タイプ」にし、処理を復帰する(ステップS653)。また、電話番号タイプと判定しなかった場合に、戻り値を「データタイプなし」とし、処理を復帰する(ステップS654)。
【0084】
なお、電話番号タイプの判定処理として、検索データが以下のような正規表現に合致する場合に電話番号タイプと判定するようにしてもよい。
【0085】
”/0[1-9][\(\-]?[0-9][\(\-]?[0-9][\(\-]?[0-9][\(\-]?[0-9][0-9]?[\)\-]?[0-9][0-9][0-9][0-9]/”
また、電話番号や市外局番のデータベースを用意しておき、検索データが所定の電話番号や市外局番と一致する場合に電話番号タイプと判定するようにしてもよい。
【0086】
次に、ステップS65の検索データの電話番号タイプ判定処理の結果、戻り値にデータタイプがあれば(ステップS66)、戻り値の電話番号タイプを結果リストに追加する(ステップS64)。また、戻り値にデータタイプがなければ(ステップS66)、検索データがメールアドレスタイプであるか否かを判定する処理を行う(ステップS67)。
【0087】
図9に、ステップS67の処理の詳細フローを示す。
【0088】
検索手段13は、検索データの先頭から1文字ずつ取得し、所定のアドレス文字か否かを調べ、アドレス文字である間は、次の文字を取得して処理を繰り返す(ステップS670)。ここで、アドレス文字は、英小文字、英大文字、数字、_(下線)、−(ハイフン)、.(ピリオド)などである。アドレス文字列は、アドレス文字またはアドレス文字列で構成される文字列とする。
【0089】
続いて、検索データの取得した文字が@(アットマーク)であるか否かを判定し(ステップS671)、文字が@であれば(ステップS672)、検索データの@の後ろから1文字ずつ取得し、所定のアドレス文字か否かを調べ、取得した文字がアドレス文字である間はこの処理を繰り返す(ステップS673)。
【0090】
そして、検索データの文字が終了した場合、すなわち検索データが「アドレス文字/アドレス文字列+@+アドレス文字/アドレス文字列」である場合に(ステップS674)、戻り値を「メールアドレスタイプ」にし、処理を復帰する(ステップS675)。または検索データの取得した文字が終了していない場合に(ステップS674)、ステップS676の処理へ進む。
【0091】
ステップS672の処理において検索データの取得した文字に@がない場合に、戻り値を「データタイプなし」にし、処理を復帰する(ステップS676)。
【0092】
なお、メールアドレスタイプの判定処理として、検索データが以下のような正規表現に合致する場合にメールアドレスタイプと判定するようにしてもよい。
【0093】
”/[0-9a-zA-Z\.\-\_]+\@[0-9a-zA-Z\.\-]+\.[a-zA-Z][a-zA-Z]+/ ”
次に、ステップS67の検索データのメールアドレスタイプ判定処理の結果、戻り値に「データタイプ」があれば(ステップS68)、戻り値のメールアドレスタイプを結果リストに追加する(ステップS64)。また、戻り値にデータタイプがなければ(ステップS68)、ステップS60の処理へ戻り、検索データとして次の1語を切り出す。
【0094】
ステップS61の処理において、データファイルから切り出す語がなくなれば、結果リストを用いて個人情報の個数をカウントする(ステップS69)。
【0095】
図10にステップS69の処理の詳細フローを示す。
【0096】
検索手段13は、データタイプの取り出しバッファと個人情報のカウント数とを初期化し(ステップS690)、結果リストからデータタイプを1つ取り出す(ステップS691)。結果リストから取り出すデータタイプがあれば(ステップS692)、取り出したデータタイプを第1バッファに格納し、第1バッファにすでに格納されているデータタイプを第2バッファに格納する(ステップS693)。そして、第2バッファと第1バッファのデータタイプの並びが所定のタイプパターンのいずれかに合致するか否かを判定し、バッファのデータタイプの並びがタイプパターンに合致すれば個人情報と判定する(ステップS694)。そして、個人情報と判定すれば(ステップS695)、個人情報のカウント数を1つカウントアップし(ステップS696)、ステップS691の処理へ戻る。
【0097】
ステップS692の処理において、結果リストから取り出すデータタイプがなければ、処理を復帰する。
【0098】
なお、ステップS696の処理において、個人情報のカウント数をタイプパターンごとに設けてカウント数を集計するようにしてもよい。
【0099】
図11に、図4に示すステップS10の処理の詳細フローを示す。
【0100】
出力処理手段14は、検索結果(個人情報リスト)4から個人情報ファイルを1つ取り出す(ステップS100)。取り出した個人情報ファイルのファイルプロパティを取得し(ステップS101)、ファイル番号、ファイル名、ファイルパス名を表示し(ステップS102)、ファイルのオーナ(所有者)、パーミッション、ファイル作成日、最終更新日、最終アクセス日を表示し(ステップS103)、本処理の処理日をもとに、不更新日数、不アクセス日数を計算して所定の日数以上に更新が行われていないファイルやアクセスされていないファイルにマークを付与して表示し(ステップS104)、ファイル内の個人情報数を得て表示する(ステップS105)。出力処理手段14は、ステップS101〜ステップS105の処理を、各個人情報ファイルについて行い、検索結果(個人情報リスト)4を入出力手段3の表示装置に表示する。さらに、暗号化ファイルリストのファイル番号、ファイル名を入出力手段3に表示する(ステップS106)。
【0101】
ここで、表示する内容、すなわち当初の検索結果4に個人情報ファイルのファイルプロパティの情報などを追加したものを検索結果4としてもよい。
【0102】
なお、出力処理手段14は、検索結果4を入出力手段3へ表示する場合に、個人情報ファイル間の親子関係を表示してもよい。また、出力処理手段14は、検索結果4を表示するのではなく他の手段やデータベースなどへ出力してもよい。また、検索結果4の表示を行った上で、さらにそれらへの出力を行ってもよい。検索結果4の出力は、1行ずつ行ってもよいし、また、検索結果4の全体をファイルなどに書き込み、出力先に一度に渡すようにしてもよい。
【0103】
図12に、個人情報ファイル間の親子関係図表示処理の処理フローを示す。
【0104】
出力処理手段14は、検索結果(個人情報リスト)4から、個人情報ファイルを2つ抽出し(ステップS110)、抽出した2つの個人情報ファイルを情報記憶手段2から取得する(ステップS111)。そして、2つの個人情報ファイルから検索条件に合致すると判定された検索データ(個人情報データとする)を抽出し、個人情報データをマッチングして2つの個人情報ファイルの類似度を求める(ステップS112)。所定の程度以上に類似する個人情報ファイル同士を、データファイルの作成日を用いてトポロジカルソートする(ステップS113)。そして、ソートした個人情報ファイルのファイル名を、親子関係を示すツリー状またはネットワーク状に表示する(ステップS114)。
【0105】
図13に、個人情報ファイルの親子関係をツリー状に表示した場合の表示例を示す。図13のツリー状表示例は、ファイルaaa.txtをもとにファイルaaa1.txt、aaa2.txt、aaa3.txtが生成されたことを示し、ファイルaaa1.txtをもとにファイルaaab1.txtが生成されたことを示す。
【0106】
検索プログラム10の検索手段13は、図6に示すステップS62の処理として、検索条件として苗字の先頭2文字を漢字で表す文字列を示す漢字2文字タイプを用いた検索処理を行うこともできる。
【0107】
図14に、苗字2文字タイプとなるデータの検索条件の例を示す。図14のキーワード表では、出現頻度の高い漢字2文字の苗字を表す文字列がキーワードとして設定される。日本人の苗字のほとんどが漢字2文字で構成されるものであることを利用し、頻出度数の高い順に所定の範囲の苗字を表す文字列をキーワードとして定義することにより簡易かつ高速に苗字を示すデータを判定するものである。
【0108】
具体的には、約10万種類の苗字のうち出現頻度の高い200種の苗字をキーワードとして定義することにより、例えば電話帳2700万世帯のサンプリングデータのうち約51%をカバーできることが知られている。さらに、出現頻度の高い900種の苗字をキーワードとして定義することにより、同じサンプリングデータの約80%をカバーできることも知られている。このことから、苗字の先頭2文字の漢字による文字列が、個人情報の検出手段として実用上十分に使用できることがわかる。なお、3文字の苗字であって頻出度数の高いものは、その苗字の先頭2文字のみを漢字で表す文字列をキーワードとして設定してもよい。
【0109】
さらに、苗字を表す2文字の文字列をキーワードとするキーワード表についてハッシュテーブルを作成しておき、検出データのハッシュ値を計算し、ハッシュ値によるマッチングを行うようにしてもよい。
【0110】
図15に示すように、検索手段13は、データファイルから2文字ずつ切り出して、「○○、○株、株式、式会、会社、社青、青木、木太、太郎、…」のような検索データとする。各検索データを、図14に示すキーワード表のキーワードと比較し、キーワードに合致した場合に、苗字カウント数を1つ加算する。データファイルのすべての検索データについてキーワードとの比較を行った後、苗字カウント数が所定の閾値n個以上であれば、そのデータファイルを個人情報ファイルと判定する。
【0111】
図16は、本発明の別の実施の形態におけるブロック構成を示す図である。
【0112】
本形態において、管理サーバ100は、データファイルを記憶する情報記憶手段2から、個人情報ファイルを検索する個人情報検索装置(検索プログラム)10と、検索プログラム10の検索結果である検索結果(個人情報リスト)4をもとに、個人情報の管理情報を生成して個人情報を管理する個人情報管理装置(管理プログラム)50とを備えるコンピュータである。
【0113】
管理プログラム50は、検索プログラム10と連携して動作するように構成されていてもよく、また、検索プログラム10を組み込むように構成されていてもよい。
【0114】
情報記憶手段2には、図1に示す場合と同様に、個人情報を含むデータファイル(個人情報ファイルA、B、C、D)、個人情報を含まないデータファイル(その他の情報ファイル)が記憶されている。
【0115】
個人情報検索装置(検索プログラム10)は、入力処理手段12、検索手段13、出力処理手段14、および検索条件記憶手段11を備える。検索プログラム10の各処理手段の機能は図1に示す同一番号の処理手段と同様である。
【0116】
個人情報管理装置(管理プログラム)50は、管理情報生成手段51、管理情報出力処理手段52、ファイル内容出力処理手段53、および個人情報削除手段54を備える。
【0117】
管理情報生成手段51は、検索プログラム10が出力した検索結果(個人情報リスト)4の各個人情報ファイル(個人情報ファイルA、B、C、D)のデータに、管理番号、管理責任者などのデータ項目を追加して管理情報を生成し、個人情報管理データベース6に記憶する処理手段である。
【0118】
個人情報管理データベース6では、個人情報ファイルごとに、データベースへの登録日、管理番号、個人情報ファイルを使用する業務の種類、情報名、個人情報の内容、収集目的、更新日、アクセス日、個人情報ファイルへのパス、取り扱い規定、重要度、脆弱度、リスク、管理者、情報形態、保管場所、保管期限、受託/提供元、預託/提供先、廃棄方法などのデータ項目が設定される。管理情報のデータ項目の情報は、個人情報ファイルのプロパティ情報に含まれる情報については、プロパティ情報から自動的に設定される。それ以外の情報は、管理者によって入力される。
【0119】
出力処理手段14が出力した検索結果4にプロパティ情報が含まれていた場合に、管理情報生成手段51は、プロパティ情報を含む検索結果4の全てまたは一部を管理情報として個人情報管理データベース6に記憶する。また、記憶された管理情報に、さらに管理者によって入力されたそれ以外の情報を追加し、個人情報管理データベース6に記憶するようにしてもよい。
【0120】
管理プログラム50は、所定の期間または契機ごとに管理情報生成手段51を起動するようにして、定期的に検索結果(個人情報リスト)4を取り込み、管理情報を生成して個人情報管理データベース6に設定するようにしてもよい。
【0121】
管理情報出力処理手段52は、個人情報管理データベース6の管理情報を入出力手段3に出力する処理手段である。管理情報出力処理手段52は、個人情報生成手段51によって個人情報管理データベース6に新規に追加された個人情報ファイルについてのみ出力するようにしてもよい。
【0122】
ファイル内容出力処理手段53は、個人情報管理データベース6に記憶されている個人情報ファイルを情報記憶手段2から取得してそのファイル内容を入出力手段3に出力する処理手段である。
【0123】
個人情報削除手段54は、入出力手段3から入力された要求にもとづいて、情報記憶手段2の個人情報ファイルを削除する処理手段である。
【0124】
図17に、検索プログラム10と連携して動作する場合の管理プログラム50の処理フローを示す。
【0125】
検索プログラム10において、情報記憶手段2のデータファイルを検索し、検索結果(個人情報リスト)4を入出力手段3に出力する(ステップS700)。
【0126】
管理プログラム50は、入出力手段3から入力されるイベントを待機し(ステップS701)、イベントの種類を判定する(ステップS702)。
【0127】
イベントが「ファイル名選択」であれば、管理情報出力処理手段52は、表示された検索結果(個人情報リスト)4からユーザによって選択されたファイル名を、例えば反転表示などの選択状態を示す表示態様で表示する(ステップS703)。
【0128】
また、イベントが「ファイル内容ブラウズ」であれば、ファイル内容出力処理手段53は、検索結果4から指定された個人情報ファイルに対応したアプリケーションを起動・実行して個人情報ファイルのファイル内容を表示する(ステップS704)。
【0129】
また、イベントが「マーク」であれば、管理情報出力処理手段52は、検索結果(個人情報リスト)4のファイル名一覧のマーク欄にマークする(ステップS705)。マークは、検索結果4にリストアップされた個人情報ファイルから、印刷などの出力処理対象、削除処理対象、最終確定など、所定の処理の対象となるデータファイルを選択するためのものである。
【0130】
また、イベントが「リスト」であれば、管理情報生成手段51は、ステップS705の処理でマークされた個人情報ファイルのリストを出力し、管理情報を作成する(ステップS706)。また、イベントが「削除」であれば、個人情報削除手段54は、ステップS705の処理でマークされた個人情報ファイルを情報記憶手段2から削除する(ステップS707)。
【0131】
このように、管理プログラム50は、検索プログラム10が出力した検索結果(個人情報リスト)4の個人情報ファイルを管理するべき個人情報の候補として扱い、ユーザとのインタラクティブな操作によって、ユーザが最終的に個人情報と判定した個人情報ファイルについて管理情報を生成し、個人情報管理データベース6に蓄積して管理することによって、より正確な個人情報管理を支援することができる。
【0132】
図18に、検索プログラム10を組み込んで動作する場合の管理プログラム50の処理フローを示す。
【0133】
管理プログラム50は、入出力手段3から入力されるイベントを待機し(ステップS710)、イベントの種類を判定する(ステップS711)。
【0134】
イベントが「データ取り込み」であれば、検索プログラム10を起動して、情報記憶手段2のデータファイルから個人情報ファイルを検索する個人情報検索処理を行う(ステップS712)。
【0135】
また、イベントが「スケジュール設定」であれば、管理情報生成手段51は、ユーザが入出力手段3を通じて設定した情報をもとに、ステップS712のデータ取り込み処理のイベントの発生間隔を設定する(ステップS713)。
【0136】
また、イベントが「データ更新」であれば、管理情報生成手段51は、ユーザによって指定された個人情報管理データベース6の管理情報のデータを指定された値に更新する(ステップS714)。
【0137】
また、イベントが「データ検索」であれば、管理情報出力処理手段52は、ユーザによって指定された個人情報管理データベース6の管理情報を検索し、検索結果を入出力手段3に表示する(ステップS715)。
【0138】
また、イベントが「新規追加分表示」であれば、管理情報出力処理手段52は、前回以前の処理により管理情報が生成された個人情報ファイルと、今回管理情報が生成された個人情報ファイルとの差分をとり、今回の処理により追加された個人情報ファイルの管理情報を新規分として表示する(ステップS716)。
【0139】
さらに、検索プログラム10および管理プログラム50を備えるコンピュータ1は、図19に示すように、LANやWANなどのネットワークを介して接続するコンピュータ(PC)、サーバなどの情報記憶手段2を検索対象先として個人情報の検索処理を行い、検索結果4をもとに個人情報を管理することができる。
【0140】
具体的には、検索プログラム10を検索対象先のサーバやPC用の検索エンジンとして実施できるように構成し、検索対象先のサーバまたはPC8側で情報記憶手段2の個人情報の検索処理を行わせる。管理サーバ100は、その検索結果(個人情報リスト)4を、ネットワークを介して収集し、検索結果4の各個人情報ファイルの情報に入出力手段3である集計端末から入力した情報を追加して管理情報を生成し、個人情報管理データベース6に記憶して管理する。
【0141】
図20に、検索対象先のコンピュータ(PC)またはサーバ8と、管理サーバ100との関係を示す図である。
【0142】
検索対象先のコンピュータ(PC)8では、Webブラウザによって管理サーバ100にアクセスし、情報記憶手段2から個人情報ファイルを検索する検索指示を管理サーバ100へ送信し、管理サーバ100から検索プログラム(検索エージェント)10aをダウンロードする(ステップa)。なお、検索エージェント10aは、予めコンピュータ8にインストールされているようにしてもよい。
【0143】
管理プログラム50は、コンピュータ8内の検索エージェント10aに対して、情報記憶手段2の個人情報ファイルの検索処理を指示する(ステップb)。検索エージェント10aは、情報記憶手段2から個人情報ファイルを検索し、その検索結果(個人情報リスト)4とする(ステップc)。
【0144】
管理サーバ100では、管理プログラム50により、コンピュータ8から送信された検索結果(個人情報リスト)4を収集し、個人情報リスト4の各個人情報ファイルについて管理情報を生成し、個人情報管理データベース6に記憶する(ステップd)。その後、管理プログラム50は、個人情報管理データベース6にアクセスして、必要な管理情報を使用する(ステップe)。
【0145】
図21に、検索エージェント10aおよび管理プログラム50の処理フローを示す。
【0146】
管理プログラム50では、入出力手段3からユーザによって入力されるイベントを待機し(ステップS800)、イベントの種類を判定する(ステップS801)。
【0147】
イベントが「タイマ/検索指示」であれば、検索エージェント10aに情報記憶手段2での個人情報の検索を指示する(ステップS802)。「タイマ」イベントは、管理サーバ100に備えられたタイマ(図示しない)の間隔を予め設定しておくことにより、所定の間隔でイベントが発生し、定期的に個人情報検索を行わせるものである。
【0148】
また、イベントが「転送指示」であれば、検索エージェント10aに個人情報リスト4の転送を指示し(ステップS803)、検索エージェント10aから個人情報リスト4を受信する(ステップS804)。検索エージェント10aは、個人情報リスト4をもとに生成した管理情報を個人情報管理データベース6に書き込む(ステップS805)。
【0149】
また、イベントが「その他指示」であれば、管理プログラム50は、検索エージェント10aに対し、受け取ったイベントに対応する所定の処理を指示する(ステップS806)。
【0150】
検索エージェント10aは、管理サーバ100から送信されるイベントを待機し(ステップS810)、イベントの種類を判定する(ステップS811)。
【0151】
イベントが「検索指示」であれば、情報記憶手段2について個人情報検索処理を行う(ステップS812)。イベントが「転送指示」であれば、管理サーバ100に個人情報リスト4を転送する(ステップS813)。
【0152】
以上、本発明をその実施の形態により説明したが、本発明はその主旨の範囲において種々の変形が可能であることは当然である。
【0153】
図1において、検索プログラム10は、同一のコンピュータ1が使用する複数の情報記憶手段2を検索対象先とすることができる。また、検索プログラム10は、コンピュータ1とネットワークを介して接続する他のコンピュータの情報記憶手段2を検索対象先とすることができる。
【0154】
本発明は、コンピュータにより読み取られ実行されるプログラムとして実施するものとして説明したが、本発明を実現するプログラムは、コンピュータが読み取り可能な、可搬媒体メモリ、半導体メモリ、ハードディスクなどの適当な記録媒体に格納することができ、これらの記録媒体に記録して提供され、または、通信インタフェースを介して種々の通信網を利用した送受信により提供されるものである。
【0155】
本発明の形態および実施例の特徴を列記すると以下のとおりである。
【0156】
(付記1) 情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索するために、コンピュータを、
前記データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
個人情報ファイルを検索する検索指示を入力する入力処理手段と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段として
機能させるための個人情報検索プログラム。
【0157】
(付記2) 前記付記1記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記検索条件として、個人情報の種別を示すデータタイプを記憶し、
前記検索手段は、前記データファイルに前記データタイプに該当するデータが存在するか否かを判定し、前記データタイプと合致するデータを所定数以上含むデータファイルを個人情報ファイルと判定する
ことを特徴とする個人情報検索プログラム。
【0158】
(付記3) 前記付記1記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記検索条件として、個人情報の種別を示すデータタイプおよび個人情報となるデータタイプの組み合わせを示すタイプパターンを記憶し、
前記検索手段は、前記データファイルに前記データタイプに合致するデータの組み合わせが存在するか否かを判定し、前記タイプパターンと合致するデータの組み合わせを所定の数以上含むデータファイルを個人情報ファイルと判定する
ことを特徴とする個人情報検索プログラム。
【0159】
(付記4) 前記付記2または付記3のいずれか一項に記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記データタイプとして、苗字または名前を表す文字列を示す姓名タイプを記憶する
ことを特徴とする個人情報検索プログラム。
【0160】
(付記5) 前記付記2または付記3のいずれか一項に記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記データタイプとして、苗字の先頭2文字を漢字で表す文字列を示す苗字タイプを記憶し、
前記検索手段は、前記データファイルのデータを2文字の文字列ごとに切り出し、前記2文字の文字列が前記苗字タイプに合致するか否かを判定し、前記苗字タイプに合致する2文字の文字列を所定の数以上含むデータファイルを個人情報ファイルと判定する
ことを特徴とする個人情報検索プログラム。
【0161】
(付記6) 前記付記2または付記3のいずれか一項に記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記データタイプとして、電話番号を表す電話番号タイプを記憶する
ことを特徴とする個人情報検索プログラム。
【0162】
(付記7) 前記付記2または付記3のいずれか一項に記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記データタイプとして、電子メールアドレスを表すメールアドレスタイプを記憶する
ことを特徴とする個人情報検索プログラム。
【0163】
(付記8) 前記付記1記載の個人情報検索プログラムにおいて、
前記データファイルが非テキスト形式である場合に、前記データファイルのデータをテキストデータに変換するデータ形式変換手段を備えるとともに、
前記検索手段は、前記データファイルの変換されたテキストデータについて前記検索条件と合致するか否かを判定する
ことを特徴とする個人情報検索プログラム。
【0164】
(付記9) 前記付記1記載の個人情報検索プログラムにおいて、
前記データファイルが、所定の暗号化ファイルを示す暗号化ファイル情報に合致するか否かを判定し、前記暗号化ファイル情報に合致するデータファイルを暗号化ファイルとして検出する暗号化情報検出手段を備えるとともに、
前記検索手段は、前記データファイルが暗号化ファイルでない場合に、当該データファイルについて前記検索条件と合致するか否かを判定し、
前記出力処理手段は、前記暗号化情報検出手段の検出結果を出力する
ことを特徴とする個人情報検索プログラム。
【0165】
(付記10) 前記付記1記載の個人情報検索プログラムにおいて、
前記出力処理手段は、さらに、前記検索手段の検索結果の各個人情報ファイルに含まれる検索条件と合致したデータの類似度を比較し、所定の類似度を持つ個人情報ファイルをファイル作成日をもとに並び替えて個人情報ファイル間の親子関係を特定し、前記親子関係を図または表の形式で出力する個人情報親子関係出力手段を備える
ことを特徴とする個人情報検索プログラム。
【0166】
(付記11) 前記付記1記載の個人情報検索プログラムにおいて、
前記検索手段は、他のコンピュータが使用する情報記憶手段から前記個人情報ファイルを検索する
ことを特徴とする個人情報検索プログラム。
【0167】
(付記12) 前記付記1記載の個人情報検索プログラムにおいて、
前記検索手段は、所定の契機または期間ごとに発せられる前記検索指示を入力し、前記検索指示に従って、前記情報記憶手段から前記個人情報ファイルを検索する
ことを特徴とする個人情報検索プログラム。
【0168】
(付記13) 情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索する処理方法であって、
個人情報ファイルを検索する検索指示を入力する入力処理過程と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが、前記データファイルを個人情報ファイルと判定するための検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索処理過程と、
前記検索手段の検索結果を出力する出力処理過程とを備える
ことを特徴とする個人情報検索処理方法。
【0169】
(付記14) 情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索する処理装置であって、
前記データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
個人情報ファイルを検索する検索指示を入力する入力処理手段と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段とを備える
ことを特徴とする個人情報検索処理装置。
【0170】
(付記15) 情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するために、コンピュータを、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
所定の指示を入力する入力処理手段と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を管理情報生成手段へ出力する出力処理手段と、
前記出力した検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶する管理情報生成手段と、
前記管理情報を出力する管理情報出力処理手段として
機能させるための個人情報管理プログラム。
【0171】
(付記16) 前記付記15記載の個人情報管理プログラムにおいて、
前記出力処理手段は、前記検索結果を表示し、前記入力処理手段により選択された個人情報ファイルについての検索結果を管理情報生成手段へ出力する
ことを特徴とする個人情報管理プログラム。
【0172】
(付記17) 前記付記15または付記16のいずれか一項に記載の個人情報管理プログラムにおいて、
前記管理情報生成手段は、前記検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶するとともに、前記入力処理手段によって入力される情報を追加して管理情報として管理情報記憶手段に記憶する
ことを特徴とする個人情報管理プログラム。
【0173】
(付記18) 前記付記15記載の個人情報管理プログラムにおいて、
前記指示であるファイル内容表示指示に従って、前記管理情報により管理される個人情報ファイルのデータを表示するファイル内容出力処理手段を備える
ことを特徴とする個人情報管理プログラム。
【0174】
(付記19) 前記付記15記載の個人情報管理プログラムにおいて、
前記指示である個人情報ファイルの削除指示に従って、前記削除指示により特定された前記情報記憶手段の個人情報ファイルを削除する個人情報削除手段を備える
ことを特徴とする個人情報管理プログラム。
【0175】
(付記20) 前記付記15記載の個人情報管理プログラムにおいて、
前記管理情報生成手段は、前記検索結果から選択された個人情報ファイルについて管理情報を生成し、管理情報記憶手段に記憶する
ことを特徴とする個人情報管理プログラム。
【0176】
(付記21) 情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するために、コンピュータを、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
所定の指示を入力する入力処理手段と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段と、
前記検索結果から選択された前記個人情報ファイルのデータ内容を表示するファイル内容出力処理手段として
機能させるための個人情報管理プログラム。
【0177】
(付記22) 情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するために、コンピュータを、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
所定の指示を入力する入力処理手段と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段と、
前記検索結果から選択された前記個人情報ファイルを削除する個人情報削除手段として
機能させるための個人情報管理プログラム。
【0178】
(付記23) サーバおよび前記サーバにネットワークで接続されたクライアントで構成され、前記クライアントによって使用される情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するシステムであって、
前記クライアントは、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
個人情報ファイルを検索する検索指示を前記サーバから受信する入力処理手段と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を前記サーバへ送信する出力処理手段と、
前記サーバは、
前記クライアントから受信した前記検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶する管理情報生成手段と、
前記管理情報を出力する管理情報出力処理手段として
機能させるための個人情報管理システム。
【0179】
(付記24) 情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理する処理方法であって、
所定の指示を入力する入力処理過程と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが、前記データファイルを個人情報ファイルと判定するための検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索処理過程と、
前記検索手段の検索結果を出力する出力処理過程と、
前記出力した検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶する管理情報生成処理過程と、
前記管理情報を出力する管理情報出力処理過程とを備える
ことを特徴とする個人情報管理処理方法。
【0180】
(付記25) 情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理する処理装置であって、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
所定の指示を入力する入力処理手段と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段と、
前記出力した検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶する管理情報生成手段と、
前記管理情報を出力する管理情報出力処理手段とを備える
ことを特徴とする個人情報管理処理装置。
【図面の簡単な説明】
【0181】
【図1】本発明の実施の一形態におけるブロック構成を示す図である。
【図2】姓名タイプとなるデータの検索条件の例を示す図である。
【図3】本発明の処理概要を説明するための図である。
【図4】本発明の処理概要の流れを示す図である。
【図5】図4に示すステップS5の処理の詳細フローを示す図である。
【図6】図4に示すステップS6の処理の詳細フローを示す図である。
【図7】図6に示すステップS62の処理の詳細フローを示す図である。
【図8】図6に示すステップS65の処理の詳細フローを示す図である。
【図9】図6に示すステップS67の処理の詳細フローを示す図である。
【図10】図6に示すステップS69の処理の詳細フローを示す図である。
【図11】図4に示すステップS10の処理の詳細フローを示す図である。
【図12】個人情報ファイル間の親子関係図表示処理の処理フローを示す図である。
【図13】個人情報ファイルの親子関係をツリー状に表示した場合の表示例を示す図である。
【図14】苗字2文字タイプとなるデータの検索条件の例を示す図である。
【図15】苗字2文字タイプの検索処理の概要を説明するための図である。
【図16】本発明の別の実施の形態におけるブロック構成を示す図である。
【図17】別の実施の形態において、検索プログラムと連携して動作する場合の管理プログラムの処理フローを示す図である。
【図18】別の実施の形態において、検索プログラムを組み込んで動作する場合の管理プログラムの処理フローを示す図である。
【図19】ネットワークを介して接続するコンピュータ、サーバなどの情報記憶手段を検索対象先とする検索処理を説明するための図である。
【図20】検索対象先のコンピュータまたはサーバと、管理サーバとの関係を示す図である。
【図21】検索エージェントおよび管理プログラムの処理フローを示す図である。
【符号の説明】
【0182】
1 コンピュータ
2 情報記憶手段
3 入出力手段
4 検索結果(個人情報リスト)
10 個人情報検索装置(検索プログラム)
11 検索条件記憶手段
12 入力処理手段
13 検索手段
14 出力処理手段
50 個人情報管理装置(管理プログラム)
51 管理情報生成手段
52 管理情報出力処理手段
53 ファイル内容出力処理手段
54 個人情報削除手段
6 個人情報管理データベース(DB)
8 検索対象先のコンピュータまたはサーバ

【特許請求の範囲】
【請求項1】
情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索するために、コンピュータを、
前記データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
個人情報ファイルを検索する検索指示を入力する入力処理手段と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段として
機能させるための個人情報検索プログラム。
【請求項2】
請求項1記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記検索条件として、個人情報の種別を示すデータタイプを記憶し、
前記検索手段は、前記データファイルに前記データタイプに該当するデータが存在するか否かを判定し、前記データタイプと合致するデータを所定数以上含むデータファイルを個人情報ファイルと判定する
ことを特徴とする個人情報検索プログラム。
【請求項3】
請求項1記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記検索条件として、個人情報の種別を示すデータタイプおよび個人情報となるデータタイプの組み合わせを示すタイプパターンを記憶し、
前記検索手段は、前記データファイルに前記データタイプに合致するデータの組み合わせが存在するか否かを判定し、前記タイプパターンと合致するデータの組み合わせを所定の数以上含むデータファイルを個人情報ファイルと判定する
ことを特徴とする個人情報検索プログラム。
【請求項4】
請求項2または請求項3のいずれか一項に記載の個人情報検索プログラムにおいて、
前記検索条件記憶手段は、前記データタイプとして、苗字の先頭2文字を漢字で表す文字列を示す苗字タイプを記憶し、
前記検索手段は、前記データファイルのデータを2文字の文字列ごとに切り出し、前記2文字の文字列が前記苗字タイプに合致するか否かを判定し、前記苗字タイプに合致する2文字の文字列を所定の数以上含むデータファイルを個人情報ファイルと判定する
ことを特徴とする個人情報検索プログラム。
【請求項5】
請求項1記載の個人情報検索プログラムにおいて、
前記データファイルが非テキスト形式である場合に、前記データファイルのデータをテキストデータに変換するデータ形式変換手段を備えるとともに、
前記検索手段は、前記データファイルの変換されたテキストデータについて前記検索条件と合致するか否かを判定する
ことを特徴とする個人情報検索プログラム。
【請求項6】
請求項1記載の個人情報検索プログラムにおいて、
前記データファイルが、所定の暗号化ファイルを示す暗号化ファイル情報に合致するか否かを判定し、前記暗号化ファイル情報に合致するデータファイルを暗号化ファイルとして検出する暗号化情報検出手段を備えるとともに、
前記検索手段は、前記データファイルが暗号化ファイルでない場合に、当該データファイルについて前記検索条件と合致するか否かを判定し、
前記出力処理手段は、前記暗号化情報検出手段の検出結果を出力する
ことを特徴とする個人情報検索プログラム。
【請求項7】
請求項1記載の個人情報検索プログラムにおいて、
前記出力処理手段は、さらに、前記検索手段の検索結果の各個人情報ファイルに含まれる検索条件と合致したデータの類似度を比較し、所定の類似度を持つ個人情報ファイルをファイル作成日をもとに並び替えて個人情報ファイル間の親子関係を特定し、前記親子関係を図または表の形式で出力する個人情報親子関係出力手段を備える
ことを特徴とする個人情報検索プログラム。
【請求項8】
請求項1記載の個人情報検索プログラムにおいて、
前記検索手段は、他のコンピュータが使用する情報記憶手段から前記個人情報ファイルを検索する
ことを特徴とする個人情報検索プログラム。
【請求項9】
請求項1記載の個人情報検索プログラムにおいて、
前記検索手段は、所定の契機または期間ごとに発せられる前記検索指示を入力し、前記検索指示に従って、前記情報記憶手段から前記個人情報ファイルを検索する
ことを特徴とする個人情報検索プログラム。
【請求項10】
情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索する処理方法であって、
個人情報ファイルを検索する検索指示を入力する入力処理過程と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが、前記データファイルを個人情報ファイルと判定するための検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索処理過程と、
前記検索手段の検索結果を出力する出力処理過程とを備える
ことを特徴とする個人情報検索処理方法。
【請求項11】
情報記憶手段に記憶されたデータファイルから個人情報を含む個人情報ファイルを検索する処理装置であって、
前記データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
個人情報ファイルを検索する検索指示を入力する入力処理手段と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段とを備える
ことを特徴とする個人情報検索処理装置。
【請求項12】
情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するために、コンピュータを、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
所定の指示を入力する入力処理手段と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を管理情報生成手段へ出力する出力処理手段と、
前記出力した検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶する管理情報生成手段と、
前記管理情報を出力する管理情報出力処理手段として
機能させるための個人情報管理プログラム。
【請求項13】
請求項12記載の個人情報管理プログラムにおいて、
前記出力処理手段は、前記検索結果を表示し、前記入力処理手段により選択された個人情報ファイルについての検索結果を管理情報生成手段へ出力する
ことを特徴とする個人情報管理プログラム。
【請求項14】
請求項12または請求項13のいずれか一項に記載の個人情報管理プログラムにおいて、
前記管理情報生成手段は、前記検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶するとともに、前記入力処理手段によって入力される情報を追加して管理情報として管理情報記憶手段に記憶する
ことを特徴とする個人情報管理プログラム。
【請求項15】
請求項12記載の個人情報管理プログラムにおいて、
前記管理情報生成手段は、前記検索結果から選択された個人情報ファイルについて管理情報を生成し、管理情報記憶手段に記憶する
ことを特徴とする個人情報管理プログラム。
【請求項16】
情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するために、コンピュータを、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
所定の指示を入力する入力処理手段と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段と、
前記検索結果から選択された前記個人情報ファイルのデータ内容を表示するファイル内容出力処理手段として
機能させるための個人情報管理プログラム。
【請求項17】
情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するために、コンピュータを、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
所定の指示を入力する入力処理手段と、
個人情報ファイルを検索する検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を出力する出力処理手段と、
前記検索結果から選択された前記個人情報ファイルを削除する個人情報削除手段として
機能させるための個人情報管理プログラム。
【請求項18】
サーバおよび前記サーバにネットワークで接続されたクライアントで構成され、前記クライアントによって使用される情報記憶手段に記憶された個人情報を含む個人情報ファイルを管理するシステムであって、
前記クライアントは、
データファイルを個人情報ファイルと判定するための検索条件を記憶する検索条件記憶手段と、
個人情報ファイルを検索する検索指示を前記サーバから受信する入力処理手段と、
前記検索指示に従って、前記情報記憶手段に記憶されているデータファイルが前記検索条件に合致するか否かを判定して前記個人情報ファイルを検索する検索手段と、
前記検索手段の検索結果を前記サーバへ送信する出力処理手段と、
前記サーバは、
前記クライアントから受信した前記検索結果の全てまたは一部を管理情報として管理情報記憶手段に記憶する管理情報生成手段と、
前記管理情報を出力する管理情報出力処理手段として
機能させるための個人情報管理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate