画像処理装置、画像処理方法およびプログラム

【課題】必要箇所を確実にマスキングし、情報機密性を向上させることができる画像処理装置を提供する。
【解決手段】この画像処理装置は、表示装置へ送信され表示される前の表示データを取得するデータ取得部２０２と、取得した表示データが画像データであるかを判定するデータ判定部２０３と、画像データである場合に該画像データに含まれる文字画像の文字認識を行う文字認識処理部２０４と、キーワードとマスキングすべき箇所とを対応付けて格納するマスキング辞書を用い、取得したテキストデータまたは文字認識された結果データの中にキーワードに一致するものを検索し、マスキングすべき箇所を特定するキーワード検索部２０５と、特定された箇所に対しマスキング処理するマスキング処理部２０７と、マスキング処理により生成されたテキストデータまたは画像データを表示データとして表示装置へ出力するデータ出力部２０８とを含む。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、表示装置に表示させる前に表示データを取得し、マスキングが必要な箇所を見つけ、その箇所を塗りつぶす等のマスキング処理を行い、表示装置へ出力することにより、情報機密性を向上させることができる画像処理装置、その方法およびその方法を実現するためのコンピュータ可読なプログラムに関する。
【背景技術】
【０００２】
画面ＵＩ(User Interface)の文字列、エディタやワープロ等のテキストデータ、スキャナやＣＣＤ(Charge Coupled Device)カメラといった画像読取装置により読み取った文書画像データ等の各種情報をディスプレイ等の表示装置に表示し、利用者がその表示された情報に基づいて閲覧や編集を行うために、画像処理装置が利用されている。
【０００３】
画像読取装置から入力された画像データを外部に配布する場合において、その画像データに、他人には見られたくない情報が含まれているとき、その情報をマスキングして秘匿することが行われている。例えば、画像データ上に電子的にマスキング機能をもったオブジェクトを配置し、編集途中のデータではマスキングオブジェクト下にある画像データを確認する形で記録しておき、それをプリンタ等の出力装置で出力する際、マスキングオブジェクト下にある画像データを確認することができないようにする画像処理プログラムを実装した構成が知られている（特許文献１参照）。
【０００４】
この特許文献１では、画像処理プログラムの実行により、データ記録媒体から画像データを読み込み、メモリ上に描画し、その一方で入力デバイスから図形オブジェクトを読み込み、ディスプレイ上に出力するときは、図形オブジェクトが有するマスクパターンの機能に従ってメモリ上の画像データに描画し、プリンタに出力するときは、図形オブジェクトが有する特徴通りにメモリ上の画像データに描画する。これにより、編集途中ではディスプレイ上にマスキング処理されて隠れている情報を確認することができ、外部配布用にプリンタに出力されたものは、情報を確認できないようにすることができる。
【０００５】
また、個人情報の各項目と画像データに含まれる個人情報の座標位置とを対応付けて保持し、選択された項目に応じてその画像データにマスキング処理などの画像処理を施す画像処理部と、画像処理された画像データを印字出力する画像形成部とを備える画像処理装置が提案されている（特許文献２参照）。このように各個人情報の座標位置を保持し、コピーする際、見せたくない個人情報にマスキング処理等を施すことにより、所望の情報のみを選択的に出力できるようにすることができる。
【０００６】
また、ＰＤＬ(Page Description Language)データの画像を表示装置にプレビュー表示し、そのプレビュー表示された画像のうちユーザ選択された領域をマスキング領域に設定し、ユーザ入力された日時を設定されたマスキング領域をマスキングする有効期限として設定し、設定されたマスキング領域中の画像をマスキング対象画像として切り出し、この切り出したマスキング対象画像を暗号化して暗号画像を作成し、これを、有効期限を表現する有効期限画像と合成したマスキング画像を生成し、このマスキング画像がＰＤＬデータの画像中のマスキング領域にはめ込まれた画像を印刷し、マスキング原稿を提供する装置や方法が提案されている（特許文献３参照）。これにより、一部領域が、有効期限が設定された状態でマスキング処理された電子文書とその印刷物の融合を容易にすることができる。
【０００７】
画面上の情報を画像として扱い、光学的な文字認識技術を用いて空白にしたり、モザイクをかけたりする必要のある部分を判定する構成が提案されている（非特許文献１参照）。従来の隠ぺい方法とは異なり、ソフトウェアを修正したり、データを改変することなく、情報が画面に表示する前に情報にフィルタをかけることができ、また、隠ぺいすべき部分はユーザが変更することができるようにされている。これにより、提供先別に表示項目を修正したデータを用意するといった手間を省くことができる。
【発明の概要】
【発明が解決しようとする課題】
【０００８】
上記の特許文献１に記載された発明では、見られたくない情報をマスキングすることができるが、ディスプレイ等の表示装置に表示する前の段階で、マスキングすべき箇所の設定漏れ等により、マスキングされずに表示されてしまい、機密情報が漏洩してしまうという問題がある。
【０００９】
また、上記の特許文献２も、見られたくない情報をマスキングすることができるが、マスキング指定を手動で行っているため、かなり手間がかかるという問題がある。
【００１０】
上記の特許文献３も同様に、見られたくない情報をマスキングすることができるが、マスキング指定について座標データが予め決められているため、定形外のデータが来た場合、対応することができないという問題がある。
【００１１】
上記の非特許文献１では、ディスプレイに表示された情報を画像として扱うため、テキストデータであっても文字認識を行う必要があり、認識精度には限界があるため、誤認識により正しくマスキングされない可能性がある。
【課題を解決するための手段】
【００１２】
本発明は、上記課題に鑑みなされたものであり、画面ＵＩの文字列、エディタやワープロ等のテキストデータ、スキャナやＣＣＤカメラ等で読み込んだ文書画像データ等の各種情報をディスプレイ等の表示装置に表示させる前に、例えば一定間隔で画面を取り込み、文字列やテキストデータはそのまま文字として扱い、画像データのみ文字認識を行い、その認識結果の文字データ、文字列、テキストデータからマスキングが必要なキーワードを見つけ、マスキング辞書を参照して必要な箇所を画面上で塗りつぶすという構成を採用する。
【００１３】
このように、表示装置の画面に表示される表示データを、表示される前に取得し、画面ＵＩの文字列やテキストデータはそのまま用い、画像データのみ文字認識を行い、マスキング辞書を参照して必要な箇所にマスキング処理を施し出力するため、マスキングし忘れによる情報漏洩を防止することができ、自動でマスキング指定を行うことができ、テキストデータ等は文字認識が不要であるため誤認識を減少させ、より確実にマスキングすることができる。
【００１４】
本発明では、これらを実現するための画像処理装置、画像処理方法およびその方法を実現するためのコンピュータ可読なプログラムを提供することができる。
【００１５】
本発明の画像処理装置は、表示データを処理して表示させる装置であり、表示装置へ送信され表示される前の表示データを取得するデータ取得部と、取得した表示データが画像データであるかテキストデータであるかを判定するデータ判定部と、表示データが画像データである場合に、該画像データに含まれる文字画像の文字認識を行う文字認識処理部と、キーワードとマスキングすべき箇所とを対応付けて格納するマスキング辞書を用い、取得したテキストデータまたは文字認識処理部により文字認識された結果データの中に、キーワードに一致するものを検索し、該テキストデータまたは該文字認識された結果データの中のマスキングすべき箇所を特定するキーワード検索部と、取得したテキストデータまたは画像データの特定された箇所に対しマスキング処理するマスキング処理部と、マスキング処理により生成されたテキストデータまたは画像データを表示データとして表示装置へ出力するデータ出力部とを含む。
【００１６】
データ取得部は、取得する表示データに応じてフラグを設定し、データ判定部は、表示データに設定されたフラグに応じて画像データであるかテキストデータであるかを判定することができる。データ取得部は、画面をキャプチャするか、描画命令を出力するテキストデータやＵＩの文字列等を横取りし、表示データを取得する。このとき、画面をキャプチャして取得した表示データは画像データとして蓄積され、テキストデータやＵＩの文字列等はテキストデータとして蓄積され、それぞれに異なる値のフラグが設定される。
【００１７】
また、データ取得部は、一定間隔で表示データを取得し、もしくはユーザ操作があったことに応答して表示データを取得し、または画面切り替えが発生したことに応答して表示データを取得する。このような条件に応じて表示データを取得することにより、途中で機密情報を含む表示データが表示装置へ送信された場合においても、また、ユーザ操作により機密情報を含む表示データが表示装置へ送信された場合においても、さらには、画面切り替えにより機密情報を含む表示データが表示装置へ送信された場合においても、確実にその機密情報をマスキングし、他人に見られないようにして表示装置に表示させることができる。
【００１８】
文字認識処理部は、文字の領域を抽出し、予め作成された文字パターン辞書の各文字画像と照合して、文字を識別することにより結果データとしてのテキストデータへ変換する。
【００１９】
マスキング辞書は、さらに、表示データを表示させるのに使用されるアプリケーションのアプリケーション名と、マスキングすべき箇所に含まれる文字の文字種とを含む。このため、使用されるアプリケーションや文字種を判断してマスキング処理することが可能である。
【００２０】
マスキング辞書は、さらに、キーワードおよび文字種に対応する文字画像データを含み、
キーワード検索部は、画像データに含まれる文字画像と、マスキング辞書に含まれる文字画像とのマッチング処理を行い、マスキングすべき箇所を探し出すことができる。
【００２１】
マスキング処理部は、ユーザが設定したセキュリティレベルを参照し、そのセキュリティレベルに応じて、マスキングすべき箇所を、低コントラスト、ぼかし、格子線の追加、塗りつぶし、モザイクのいずれかで表示されるようにマスキング処理を行うことができる。データ出力部は、表示装置に代えて、または表示装置とともに印刷装置へマスキング処理により生成されたテキストデータまたは画像データを出力することができ、ユーザ設定により、印刷不可とすることもできる。
【００２２】
本発明の画像処理方法は、上記の画像処理装置が備える各部により実行される処理を処理ステップとして含み、プログラムは、この処理ステップをコンピュータに実行させるものとして構成することができる。
【図面の簡単な説明】
【００２３】
【図１】本実施形態の画像処理装置のハードウェア構成を示した図。
【図２】画像処理装置の機能ブロック図。
【図３】画像処理装置が行う画像処理の第１実施形態を示したフローチャート。
【図４】マスキング辞書の第１実施形態を示した図。
【図５】画像処理装置が行う画像処理の第２実施形態を示したフローチャート。
【図６】マスキング辞書の第２実施形態を示した図。
【図７】表示データの１つの例を示した図。
【図８】マッチング処理を行っているところを例示した図。
【図９】表示データの別の例を示した図。
【図１０】図９に示す表示データにマスキング処理を施した図。
【図１１】セキュリティレベルに応じてマスキング処理を施した文字列を例示した図。
【発明を実施するための形態】
【００２４】
図１は、本実施形態の画像処理装置のハードウェア構成を示した図である。画像処理装置１００は、原稿等を読み取るスキャナ部１０１と、撮像して画像データを取得する撮像手段１０２と、装置全体の制御を行うＣＰＵ１０３と、読み取った画像データや撮像して取得した画像データ等を表示させるために記憶する表示データメモリ部１０４と、それら画像データを蓄積したり、他の装置から取得した画像データ等を記録したり、ＣＰＵ１０３が実行するプログラムを格納するＣＤ−ＲＯＭ、ＤＶＤ、メモリカード１０６やＨＤＤ１０７といった外部記憶部１０５と、マスキング処理を施したり、その他の画像処理を行う画像処理部１０８と、インターネット等のネットワーク１１０と接続し、ネットワーク１１０との間の通信を制御する通信制御部１０９と、マスキング処理やその他の画像処理が施された画像データを表示する表示部１１１とを含んで構成されている。なお、これら各部は、データを伝送するためのバス１１２により互いに接続され、互いにデータのやりとりを行うことができるようにされている。
【００２５】
スキャナ部１０１は、読み取る対象の原稿に光を照射する光源と、その原稿に反射した光あるいは透過した光を読み取り、電気信号へ変換するＣＣＤと、アナログデータである電気信号をデジタルデータへ変換するＡ／Ｄコンバータとを含んで構成される。
【００２６】
撮像手段１０２は、例えば、デジタルカメラを挙げることができ、その構成は、集光するレンズ、光量を決定する絞り、光を検出する光学センサといった撮像素子、決定された時間に限って撮像素子に光を当てるシャッター、撮像対象を確認するためのファインダーを備えるものとされる。撮像素子としては、ＣＣＤやＣＭＯＳが用いられる。撮像手段１０２は、さらに、撮像素子から出力されたアナログデータをＡ／Ｄ変換するＡ／Ｄコンバータを備え、また、補間演算、色空間変換、ガンマ補正、収差の補正、ノイズリダクション、画像圧縮等の画像処理を行い、ＰＣ等による利用が可能な画像形式、例えばＥｘｉｆ(Exchangeable image file format)形式やＲＡＷ画像として記録媒体に記録する画像エンジンを備える。ここで、Ｅｘｉｆ形式とは、コンピュータ等で扱われる静止画像のデジタルデータを圧縮する方式の１つであるＪＰＥＧ(Joint Photographic Experts Group)の拡張規格であり、画像メタデータのフォーマットである。
【００２７】
表示データメモリ部１０４は、テキストやＵＩデータ等の表示データや、上記のスキャナ部１０１や撮像手段１０２により取得した表示データを記憶する。
【００２８】
画像処理部１０８は、表示部１１１に表示させる表示データにマスキングをかける処理を施し、また、色補正を施したり、所定の形式に変換する等の画像処理を行う。
【００２９】
図２は、画像処理装置の機能ブロック図である。画像処理装置は、図１に示すハードウェア構成とされるが、外部記憶部１０５が記憶するプログラムをＣＰＵ１０３が実行し、また、画像処理部１０８が画像処理を行うことにより、図２に示す各部として機能させることができる。
【００３０】
この画像処理装置は、機密情報の漏洩を防止すべく、機密情報の部分をマスキングし、出力する装置であり、ＵＩ提供部２０１と、データ取得部２０２と、データ判定部２０３と、文字認識処理部２０４と、キーワード検索部２０５と、マスキング辞書保管部２０６と、マスキング処理部２０７と、データ出力部２０８とを含んで構成されている。また、画像処理装置は、表示データを保管するための図示しないデータ保管部を備えることができる。
【００３１】
ＵＩ提供部２０１は、Windows（登録商標）系統のウィンドウをはじめとするオブジェクトやテキストデータ等のＵＩデータを提供する。
【００３２】
データ取得部２０２は、表示装置である表示部１１１へ送信される表示データであって、表示部１１１に表示される前のデータを取得する。表示された後にマスキングしても機密情報の漏洩を防止できないからである。表示データは、表示部１１１に表示するためのデータであって、スキャナ部１０１により読み取られた画像データや撮像手段１０２から取得した画像データ、描画命令を出力するテキストデータ、ＵＩ提供部２０１が提供するＵＩデータ等が挙げられる。
【００３３】
このデータ取得部２０２は、画面をキャプチャするか、テキストデータやＵＩデータを横取りして、表示データを取得することから、画面をキャプチャして取得したデータは画像データと識別し、テキストデータやＵＩデータはテキストデータと識別する。このようにして識別されたデータは、例えばフラグを設定し、それらを判別することを可能にすることができる。フラグは１ビットで表現され、画像データを１、テキストデータを０といった数値で設定することができる。
【００３４】
また、このデータ取得部２０２は、表示データを、一定間隔で取得したり、ユーザ操作（例えばボタンの押下）があったことに応答して取得したり、画面切り替えが発生したことに応答して取得することができ、次の画面が表示される前にマスキングを行い、確実に機密情報の漏洩を防止することができる。
【００３５】
データ判定部２０３は、データ取得部２０２が取得した表示データが、画像データであるか、テキストデータであるかを判定する。この判定は、表示データに設定されたフラグを読み出し、そのフラグの値により判定することができる。
【００３６】
文字認識処理部２０４は、データ判定部２０３で画像データと判定された表示データを受け取り、その表示データである画像データに含まれる文字を表す文字画像の文字認識を行う。文字認識の方法は、これまでに知られたいかなる方法でも採用することができるが、例えば、各字の文字パターンを文字パターン辞書として用意しておき、その文字パターンとマッチング処理を行うことにより文字認識を行うことができる。
【００３７】
マスキング辞書保管部２０６は、キーワードとマスキングすべき箇所とを対応付けて格納するマスキング辞書を保管する。キーワードは、文字列からなる単語であり、機密情報となる氏名、住所、電話番号、携帯番号、生年月日、性別、会社名、所属等が挙げられる。マスキングとは、文字や画像上をカバーで覆うことをいい、具体的には、文字例を塗りつぶし見えなくすること等をいう。マスキングすべき箇所は、キーワードと同じ行の右側、キーワードと同じ列の下側、キーワードと同じ行の右側のセル等である。したがって、キーワードとして住所が設定され、マスキングすべき箇所として同じ行の右側が設定されている場合、マスキングすべき箇所は、「住所Ａ市Ｂ町Ｃ」と記載されていれば、キーワードである「住所」の同じ行の右側にある「Ａ市Ｂ町Ｃ」の部分を意味する。このようにして機密情報を見えなくし、その情報の漏洩を防止する。
【００３８】
キーワード検索部２０５は、このマスキング辞書を用い、取得したテキストデータまたは文字認識処理部２０４により文字認識された結果データの中に、キーワードに一致するものを検索する。そして、そのテキストデータまたは文字認識された結果データの中のマスキングすべき箇所を特定する。
【００３９】
また、キーワード検索部２０５は、表示データが画像データである場合、画像データにより生成される文字画像と、マスキング辞書に含まれる文字画像データにより生成される文字画像とのマッチング処理を行い、マスキングすべき箇所を探し出す。このため、マスキング辞書は、文字画像データもキーワードと対応付けて格納することができる。
【００４０】
マスキング処理部２０７は、キーワード検索部２０５により特定されたマスキングすべき箇所を、設定したマスキング方法によりマスキングを行う。ユーザは、セキュリティレベルを設定することができ、そのセキュリティレベルに応じて、マスキングすべき箇所を、低コントラストにしたり、ぼかしを入れたり、格子線を追加したり、塗りつぶしたり、モザイクをかけたりすることができる。なお、マスキング処理は、マスキングすべき箇所として特定された文字列や数字列等のすべてに対して行われるようになされる。
【００４１】
マスキング辞書は、さらに、表示データを表示するために使用されるアプリケーションのアプリケーション名や、マスキングすべき箇所にある文字列の文字種等もキーワードに対応付けて格納することができる。これにより、マスキング処理部２０７が、使用されるアプリケーションを判断し、また、文字種を判断して適合した場合にマスキングを行うことができる。
【００４２】
データ出力部２０８は、マスキング処理部２０７によりマスキング処理により生成されたテキストデータまたは画像データである表示データを表示部１１１へ出力し、表示させる。このデータ出力部２０８は、表示部１１１のほか、印刷装置へ出力することもでき、マスキング処理したデータを印刷出力することも可能である。また、セキュリティレベル等の設定により、その設定に応じて、印刷出力したり、印刷不可とすることも可能である。
【００４３】
図３は、画像処理装置が行う画像処理の第１実施形態を示したフローチャートである。このフローチャートを参照して、画像処理の流れについて説明する。画像処理は、ステップ３００から開始し、まず、ステップ３１０で、表示データを取得する。
【００４４】
ここで、表示データを取得する方法の例を詳細に説明する。取得する条件は、例えば、一定期間ごと、特定の操作をしたとき、画面の切り替えがあったとき、に取得することができる。一定期間としては、例えば１０〜１００ミリ秒という間隔で画面をキャプチャすることが挙げられる。特定の操作をしたときとしては、ボタンが押下されたときや、閲覧しようとする操作をしたときが挙げられる。画面の切り替えがあったときとしては、表示用画面が変遷したときが挙げられる。
【００４５】
このような条件が発生した場合に、画面をキャプチャしたり、描画命令を出すテキストデータやＵＩの文字列等を横取りして、表示データを取得することができる。画面をキャプチャした場合、そのデータは画像データとして蓄積される。また、テキストデータ等を横取りして取得した場合は、テキストデータ、ＵＩの文字列等がテキストデータとして蓄積される。
【００４６】
これらの具体的な方法としては、公知のスクリーンリーダ（例えば、JAWS（登録商標） for Windows（登録商標）を用いて行うことができる。このスクリーンリーダは、画面やウィンドウに表示された情報や入力した文字を読み上げるものである。
【００４７】
次に、ステップ３２０で、取得した画面データが画像データであるか、テキストデータであるかの判定を行う。この判定は、ステップ３１０においてテキストデータを取得するというフラグの設定、あるいは画像データとして取得するというフラグの設定がなされるため、その設定されたフラグから判定することができる。
【００４８】
そして、ステップ３３０において、ステップ３２０により判定した結果から、画像データである場合は、文字認識処理を行い、文字認識した結果の結果データであるテキストデータを取得する。文字認識処理としては、これまで知られたいかなる技術でも使用することができる。
【００４９】
例えば、文書画像であれば、画像データが白と黒という情報から構成されるため、まず、黒のドットの分布のしかたを解析し、この黒の固まりを罫線や数字等と分類する。これは、面積や形状等の傾向を分析し、その特徴に基づいて分類する。分類後、予め作成した文字パターン辞書と照合し、文字や数字を識別することによりテキストデータへ変換する。その流れを説明すると、入力された文書画像から、写真等の画像として扱う領域と、文字の領域とに分け、文字画像をパターンに照らし合わせ、重なる面積の大きいものを変換すべき文字や数字として決定し、それをテキストデータとして変換する。
【００５０】
カラー画像データである場合は、白と黒という２値の画像データではなく、多値の画像データとなる。まず、写真の領域を抽出し、背景色を特定して削除する。その後、白黒２値データに変換し、文字の部分をテキストデータへ変換する。この変換は、上記と同様、パターンと照合する方法により文字や数字を識別し、その識別された文字や数字に変換することにより行うことができる。
【００５１】
このようにしてテキストデータへ変換するが、このデータにはレイアウト情報や文字の色情報等が含められ、ワープロ文書として再生できるようにされる。
【００５２】
テキストデータへの変換の際、画像データに汚れや網掛けがある場合、それらを除去し、原稿が傾いてスキャンされた場合、文字や罫線の傾きを分析し、水平になるようにスキュー補正し、天地左右の向きを誤ってスキャンしても、その方向を判別し、正しい方向へ修正することができ、これらの処理後、画像領域と文字領域とに分け、パターン照合し、テキストデータへ変換することができる。
【００５３】
ステップ３２０により判定した結果から、画面データにあるテキストデータの場合、あるいはステップ３３０でテキストデータへ変換された後、ステップ３４０へ進み、テキストデータから機密情報に該当するキーワードに一致するものを検索する。なお、機密情報に該当するキーワードは、マスキング辞書保管部２０６に保管されている。
【００５４】
図４に、マスキング辞書保管部２０６に保管されているマスキング辞書の一例を示す。マスキング辞書は、テーブルとして構成され、キーワード、アプリケーション、マスキングすべき箇所であるマスキング位置、文字種をデータとして含む。キーワードは、マスキングして秘匿すべき情報と対応付けて用いられる単語であり、具体的には、上述したもののほか、電話、Tel、FAX、名前、name、address等の文字が挙げられる。アプリケーションは、マスキングを適用する画像データまたはテキストデータに使用されるアプリケーションである。
【００５５】
マスキング位置は、キーワードに対してどの位置をマスキングするかを示し、「同じ行の右」であれば、キーワードと同じ行のキーワードの右側にあるテキストをマスキングすることを意味する。文字種は、マスキングして秘匿すべき情報がどのような文字種からなるものかを示す情報である。数字、ハイフンであれば、数字とハイフンから構成されるテキストデータであることを示す。
【００５６】
再び図３を参照して、ステップ３５０で、キーワードが見つかった場合、上述したマスキング辞書を用いてキーワードがある箇所の付近を参照し、マスキングすべき箇所を探し出す。この探し出す処理の詳細については後述する。
【００５７】
その後、ステップ３６０において、特定したマスキングすべき箇所に対し、マスキング処理を施す。そして、ステップ３７０で、マスキング処理により生成されたデータを出力し、画面に表示し、ステップ３８０でこの処理を終了する。ちなみに、ステップ３４０で、キーワードに一致するものがない場合、マスキング処理を施すことなく、ステップ３７０で、画像データあるいはテキストデータを含む画面データを表示し、ステップ３８０でこの処理を終了する。
【００５８】
図５は、画像処理装置が行う画像処理の第２実施形態を示したフローチャートである。ステップ５００から開始し、まず、ステップ５１０で、表示データを取得する。この表示データの取得は、上記と同様の方法で行うことができる。
【００５９】
次に、ステップ５２０で、取得した画面データが画像データであるか、テキストデータであるかの判定を行う。これも、上記と同様に、設定されたフラグにより判定することができる。
【００６０】
ステップ５２０でテキストデータであると判定された場合、ステップ５３０へ進み、テキストデータからマスキング辞書から機密情報に該当するキーワードに一致するものを検索する。キーワードに一致するものがある場合は、ステップ５４０へ進み、ない場合はステップ５８０へ進む。ステップ５４０では、マスキング辞書保管部２０６に保管されているマスキング辞書を参照し、マスキングすべき箇所を探し出す。そして、ステップ５７０で、そのマスキングすべき箇所に対しマスキング処理を施し、ステップ５８０で、マスキングされたデータを出力し、画面に表示し、ステップ５９０でこの処理を終了する。
【００６１】
ステップ５２０で画像データであると判定された場合、ステップ５５０へ進み、画像データに含まれる文字画像と、マスキング辞書にある文字画像とのマッチングを行い、マスキングすべき箇所を探し出す。そして、ステップ５６０で、マスキングすべき箇所があったかどうかを判定し、あった場合、ステップ５７０へ進み、そのマスキングすべき箇所にマスキングを施す。これに対し、なかった場合は、ステップ５８０へ進み、そのまま出力して画面表示を行う。
【００６２】
マッチング処理は、画像データにある文字画像とマスキング辞書にある文字との照合を行い、マスキングすべき箇所を探し出す処理である。このため、マスキング辞書には、図６のテーブルに示すように、機密情報に対応するキーワード（単語）、表示データの取得元で、表示するために使用されるアプリケーション、マスキングすべき箇所であるマスキング位置、文字種のほか、文字画像の画像データが含まれている。
【００６３】
キーワードを探し、見つかった場合、その箇所をマークし、キーワードが見つかった箇所の前後にある文字列をマスキング辞書のマスキング位置を参照して、最終的にマスキングする位置を特定する。図７に示すように、「氏名」、「住所」というキーワードを見つけ、それらの後にある「画像太郎」、「東京都Ｂ市Ｃ町１−５−３」をマスキングすべき箇所の文字列等として特定し、この文字列等に対してマスキングを施す。
【００６４】
帳票等の原稿画像データにおいて、レイアウト構成等のフォーマット形式が決まっているものについて、重要な情報であることを示す箇所をマスキング辞書に登録しておき、その箇所をマスキングすることも可能である。
【００６５】
マッチング処理は、図８に示す「あ」や「お」といった要素を、マッチング用データと重ね合わせ、差分を見て、一致度が高いかどうかを判定することにより行うことができる。図８に示す実施形態では、要素２の「お」はマッチング用データ「あ」と照合しても、重なり合う面積が少ないため、一致度が低いが、要素１の「あ」は、重なり合う面積が大部分で、その一致度は高いことから、要素１は「あ」と識別する。例えば、閾値を設け、その閾値を超える面積が重なり合う文字あるいは数字を、一致度が高い文字あるいは数字と判断し、その文字あるいは数字が複数存在する場合には、最も一致度が高いものを変換すべき文字あるいは数字として識別することができる。
【００６６】
図９は、画面に表示されるデータの表示例であるが、氏名、会社名、所属、郵便番号、住所、電話番号等が含まれている。これらは、個人を特定するための重要な情報であり、他人には見られたくない情報である。これらの情報がキーワードとして登録されている場合、本発明のマスキング処理の実行により、これらのキーワードの右側にある文字や数字等はマスキングされ、図１０に示すような画面として表示される。図１０では、マスキングされた箇所が黒く塗りつぶされ、見えなくなっている。
【００６７】
マスキング処理は、ユーザ設定したセキュリティレベルに応じて、図１１に示すように変更することができる。例えば、セキュリティレベルに応じて、通常表示、難視認表示、不可視表示を設定できるようにすることができる。通常表示の場合、そのままの表示にするか、強調表示することができる。難視認表示の場合、低コントラスト表示、ぼかし、格子線を入れる等の視認が難しい表示にすることができる。不可視表示の場合、べた塗り（塗りつぶし）、モザイク処理等の視認が不可能な表示にすることができる。
【００６８】
また、画面表示に限らず、プリンタ等に出力する場合においても、ユーザが設定したセキュリティレベルに応じて、印刷可能、印刷不可のフラグをたて、そのフラグが印刷不可であれば、印刷しないようにすることができる。
【００６９】
これまで本発明を上述した実施の形態をもって説明してきたが、本発明は上述した実施の形態に限定されるものではなく、他の実施の形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。したがって、本発明は、上記の画像処理装置および画像処理方法のほか、その方法を実行するためのコンピュータ可読なプログラム、そのプログラムが記録された記録媒体も提供することができるものである。
【符号の説明】
【００７０】
１００…画像処理装置、１０１…スキャナ部、１０２…撮像手段、１０３…ＣＰＵ、１０４…表示データメモリ部、１０５…外部記憶部、１０６…ＣＲ−ＲＯＭ、ＤＶＤ、メモリカード、１０７…ＨＤＤ、１０８…画像処理部、１０９…通信制御部、１１０…ネットワーク、１１１…表示部、１１２…バス、２０１…ＵＩ提供部、２０２…データ取得部、２０３…データ判定部、２０４…文字認識処理部、２０５…キーワード検索部、２０６…マスキング辞書保管部、２０７…マスキング処理部、２０８…データ出力部
【先行技術文献】
【特許文献】
【００７１】
【特許文献１】特開２００４−２２８７０９号公報
【特許文献２】特開２００７−０７４２９５号公報
【特許文献３】特開２００７−０７４０８８号公報
【非特許文献】
【００７２】
【非特許文献１】“データの加工は不要:ＩＢＭ、ディスプレイ上で機密情報をマスキングする技術を発表”、[online］、２００９年７月１０日、インターネット<URL:http://www.itmedia.co.jp/enterprise/articles/0907/10/news059.html>

【特許請求の範囲】
【請求項１】
表示データを処理して表示させる画像処理装置であって、
表示装置へ送信され表示される前の前記表示データを取得するデータ取得部と、
取得した前記表示データが画像データであるかテキストデータであるかを判定するデータ判定部と、
前記表示データが画像データである場合に、該画像データに含まれる文字画像の文字認識を行う文字認識処理部と、
キーワードとマスキングすべき箇所とを対応付けて格納するマスキング辞書を用い、取得した前記テキストデータまたは前記文字認識処理部により文字認識された結果データの中に前記キーワードに一致するものを検索し、該テキストデータまたは該文字認識された結果データの中のマスキングすべき箇所を特定するキーワード検索部と、
取得した前記テキストデータまたは前記画像データの特定された箇所に対しマスキング処理するマスキング処理部と、
マスキング処理により生成されたテキストデータまたは画像データを前記表示データとして前記表示装置へ出力するデータ出力部とを含む、画像処理装置。
【請求項２】
前記データ取得部は、取得する前記表示データに応じてフラグを設定し、前記データ判定部は、前記表示データに設定された前記フラグに応じて、前記画像データであるか前記テキストデータであるかを判定する、請求項１に記載の画像処理装置。
【請求項３】
前記データ取得部は、一定間隔で前記表示データを取得し、もしくはユーザ操作があったことに応答して前記表示データを取得し、または画面切り替えが発生したことに応答して前記表示データを取得する、請求項１または２に記載の画像処理装置。
【請求項４】
前記文字認識処理部は、文字の領域を抽出し、予め作成された文字パターン辞書の各文字画像と照合して、文字を識別することにより前記結果データとしてのテキストデータへ変換する、請求項１〜３のいずれか１項に記載の画像処理装置。
【請求項５】
前記マスキング辞書は、さらに、前記表示データを表示させるのに使用されるアプリケーションのアプリケーション名と、前記マスキングすべき箇所に含まれる文字の文字種とを含み、使用される前記アプリケーションおよび前記マスキングすべき箇所の前記文字種を判断してマスキング処理する、請求項１〜４のいずれか１項に記載の画像処理装置。
【請求項６】
前記マスキング辞書は、さらに、前記キーワードおよび前記文字種に対応する文字画像データを含み、
前記キーワード検索部は、前記画像データに含まれる文字画像と、前記マスキング辞書に含まれる文字画像とのマッチング処理を行い、前記マスキングすべき箇所を探し出す、請求項５に記載の画像処理装置。
【請求項７】
前記マスキング処理部は、ユーザが設定したセキュリティレベルを参照し、前記セキュリティレベルに応じて、前記マスキングすべき箇所を、低コントラスト、ぼかし、格子線の追加、塗りつぶし、モザイクのいずれかで表示されるようにマスキング処理を行う、請求項１〜６のいずれか１項に記載の画像処理装置。
【請求項８】
前記データ出力部は、前記表示装置に代えて、または前記表示装置とともに印刷装置へマスキング処理により生成されたテキストデータまたは画像データを出力する、請求項１〜７のいずれか１項に記載の画像処理装置。
【請求項９】
表示データを処理して表示させる画像処理方法であって、該方法は画像処理装置により実行され、
表示装置へ送信され表示される前の前記表示データを取得するステップと、
取得した前記表示データが画像データであるかテキストデータであるかを判定するステップと、
前記表示データが画像データである場合に、該画像データに含まれる文字画像の文字認識を行うステップと、
キーワードとマスキングすべき箇所とを対応付けて格納するマスキング辞書を用い、取得した前記テキストデータまたは前記文字認識を行うステップにおいて文字認識された結果データの中に前記キーワードに一致するものを検索し、該テキストデータまたは該文字認識された結果データの中のマスキングすべき箇所を特定するステップと、
取得した前記テキストデータまたは前記画像データの特定された箇所に対しマスキング処理するステップと、
マスキング処理により生成されたテキストデータまたは画像データを前記表示データとして前記表示装置へ出力するステップとを含む、画像処理方法。
【請求項１０】
前記取得するステップでは、取得する前記表示データに応じてフラグを設定し、前記判定するステップでは、前記表示データに設定された前記フラグに応じて、前記画像データであるか前記テキストデータであるかを判定する、請求項９に記載の画像処理方法。
【請求項１１】
前記取得するステップでは、一定間隔で前記表示データを取得し、もしくはユーザ操作があったことに応答して前記表示データを取得し、または画面切り替えが発生したことに応答して前記表示データを取得する、請求項９または１０に記載の画像処理方法。
【請求項１２】
前記文字認識を行うステップは、文字の領域を抽出し、予め作成された文字パターン辞書の各文字画像と照合して、文字を識別することにより前記結果データとしてのテキストデータへ変換するステップを含む、請求項９〜１１のいずれか１項に記載の画像処理方法。
【請求項１３】
前記マスキング辞書は、さらに、前記表示データを表示させるのに使用されるアプリケーションのアプリケーション名と、前記マスキングすべき箇所に含まれる文字の文字種とを含み、前記マスキング処理するステップでは、使用される前記アプリケーションおよび前記マスキングすべき箇所の前記文字種を判断してマスキング処理する、請求項９〜１２のいずれか１項に記載の画像処理方法。
【請求項１４】
前記マスキング辞書は、さらに、前記キーワードおよび前記文字種に対応する文字画像データを含み、
前記特定するステップは、前記画像データに含まれる文字画像と、前記マスキング辞書に含まれる文字画像とのマッチング処理を行い、前記マスキングすべき箇所を探し出すステップを含む、請求項１３に記載の画像処理方法。
【請求項１５】
前記マスキング処理するステップでは、ユーザが設定したセキュリティレベルを参照し、前記セキュリティレベルに応じて、前記マスキングすべき箇所を、低コントラスト、ぼかし、格子線の追加、塗りつぶし、モザイクのいずれかで表示されるようにマスキング処理を行う、請求項９〜１４のいずれか１項に記載の画像処理方法。
【請求項１６】
前記出力するステップでは、前記表示装置に代えて、または前記表示装置とともに印刷装置へマスキング処理により生成されたテキストデータまたは画像データを出力する、請求項９〜１５のいずれか１項に記載の画像処理方法。
【請求項１７】
請求項９〜１６のいずれか１項に記載の画像処理方法を実行するためのコンピュータ可読なプログラム。

【図１】