説明

情報処理装置および情報処理方法

【課題】紙文書の秘匿性を向上させるために、単純にマスキング領域を黒く塗りつぶさないで、マスキング幅を制御することが可能な情報処理装置を提供する。
【解決手段】マスキング対象を特定するマスキング情報を取得するマスキング情報取得手段と、前記取得したマスキング情報に基づいてマスキング対象の長さと独立してマスキング幅を決定するマスキング幅決定手段と、前記決定結果に基づいてマスキング対象をマスキングするマスキング手段とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子透かし技術を利用したマスキング処理技術に関する。
【背景技術】
【0002】
近年、役所の文書や企業内文書に関する情報公開が進んでいる。その一方で、個人情報や機密情報保護の重要性が増している。例えば、病院のカルテを開示する場合は、患者の氏名、住所等を秘匿する必要がある。このような場合、秘匿したい部分をマスキング(黒く塗りつぶす)した上で公開することが一般的である。従来、特許文献1に示すように、プロファイル情報と規則を用いて、マスキング領域を自動的に決定する方式がある。
【特許文献1】特開平11−143871号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、特許文献1では、単純にマスキング領域を黒く塗りつぶすため、マスキング後も長さの情報が残るという課題がある。例えば、人名部分が10文字分塗りつぶされている場合、そのように長い氏名の人物は特定されやすくなる。
【0004】
本発明は上記の課題に鑑みてなされたものであり、マスキング幅を制御することが可能な情報処理装置を提供する。
【課題を解決するための手段】
【0005】
上記の目的を達成するための本発明による情報処理装置は、マスキング対象を特定するマスキング情報を取得するマスキング情報取得手段と、前記取得したマスキング情報に基づいてマスキング対象の長さと独立してマスキング幅を決定するマスキング幅決定手段と、前記決定結果に基づいてマスキング対象をマスキングするマスキング手段とを備える。
【発明の効果】
【0006】
本発明によれば、マスキング幅を制御することによりマスキング処理を施した紙文書の秘匿性が向上する。
【発明を実施するための最良の形態】
【0007】
以下、添付の図面を参照して本発明の好適な実施形態のいくつかについて詳細に説明する。ただし、この実施の形態に記載されている構成要素はあくまでも例示であり、本発明の範囲をそれらのみに限定する趣旨のものではない。
【0008】
<第1実施形態>
本実施形態では、マスキング個所を電子透かしで予め埋め込んだ紙文書を入力とする。当該紙文書をスキャナなどの入力装置で取込み、マスキング領域を特定後、マスキング領域にマスキングを施して、再び紙文書として出力する場合について説明する。
【0009】
なお、マスキング情報を電子透かしとして埋め込む方法としては、例えば、文字間透かしやドットパターン透かし等を用いることができる。
【0010】
図1は、第1実施形態における情報処理装置のハードウエア構成を示すブロック図である。図1において、101は制御メモリであり、本実施形態の処理手順および固定的データが格納される。102は中央処理装置であり、数値演算/制御等の処理を行う。103はメモリであり、一時的なデータが格納される。104はスキャナなどの入力装置であり、紙文書を画像データとして取り込む。105はプリンタなどの出力装置であり、画像データを紙に出力する。106はバスであり、各装置間のデータのやり取りはこのバスを通じて行われる。
【0011】
図2は、第1実施形態における音声合成装置のモジュール構成を示すブロック図である。図2において、スキャン処理部201は、入力装置104を介して、紙文書を電子データに変換し文書画像として取り込む。文書画像保持部202は、文書画像を保持する。マスキング情報抽出部203は、文書画像に電子透かしとして埋め込まれているマスキング情報を抽出する。マスキング情報保持部204はマスキング情報を保持する。マスキング処理部205は、マスキング情報保持部204が保持するマスキング情報を基にマスキング領域を黒く塗りつぶす。マスキング文書画像保持部206は、マスキングが施されたマスキング文書画像を保持する。印刷処理部207は、出力装置105を介してマスキング文書画像を紙に出力する。
【0012】
図3は第1実施形態における情報処理装置の処理の流れを示すフローチャートである。ステップS301では、スキャン処理部201が、入力装置104を介して紙文書を文書画像として取り込み、文書画像を文書画像保持部202に保持してステップS302に移る。
【0013】
ステップS302では、マスキング情報抽出部203が、文書画像保持部202に保持されている文書画像からマスキング情報を抽出し、マスキング情報保持部204に保持してステップS303に移る。前記マスキング情報には、少なくともマスキング対象の開始位置および終了位置を特定可能な情報が含まれているものとする。
【0014】
ステップS303では、マスキング処理部205が、マスキング情報204が保持するマスキング情報を基にマスキングの開始位置を決定し、所定のマスキング幅のマスキング処理を行う。ここでのマスキング処理とは、マスキング幅にわたって黒く塗りつぶす処理と、さらに、マスキング対象の長さがマスキング幅よりも長い場合は、はみ出す部分の画像を消去する処理を含む。なお、マスキング幅は、予め与えられた固定値でもよいし、ランダムに決定してもよいし、さらには、電子透かしとして埋め込んでおいてもよいものとする。マスキング処理部205は、マスキング処理が施されたマスキング文書画像をマスキング文書画像保持部206に保持して、ステップS304に移る。
【0015】
ステップS304では、印刷処理部207が、出力装置105を介して、マスキング文書画像保持部206に保持されているマスキング文書画像を紙に出力して、終了する。
【0016】
図4は、定型文書(帳票、表形式など)に対して、本実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。
【0017】
図4(a)はマスキング処理前の紙文書である。マスキング対象が下線で示されているが、本来は電子透かしとして埋め込まれているため下線は表示されない。この例では、患者名および住所の一部がマスキングの対象である。
【0018】
図4(b)は、従来技術によるマスキング処理を施した後の紙文書である。マスキング幅がマスキング対象の長さと一致しており、特に、患者の氏名が長い場合、患者名が特定されやすくなり、マスキング対象の秘匿性が低下する。
【0019】
図4(c)は、本実施形態で説明したマスキング処理を施した後の紙文書である。マスキング幅が固定値になっており、マスキング対象の長さとは独立に制御されているため、マスキング対象の秘匿性が高い。
【0020】
以上説明したように、マスキング対象の長さと独立にマスキング幅を制御することにより、マスキング対象の秘匿性を向上することができる。
【0021】
<第2実施形態>
第1実施形態では、定型文書のようにマスキング対象の終端が自明である場合について説明したが、これに限定されるものではなく、不定型文書(一般的な文章)にマスキング処理を施す場合もよいものである。
【0022】
図5は、第2実施形態における情報処理装置のモジュール構成を示すブロック図である。図5において、第1実施形態と同じ処理を行うモジュールには図2と同じ番号を付与し、説明を省略する。レイアウト調整部501は、マスキング対象の長さとマスキング幅の差分を文書中の文字間隔に配分することによって文書のレイアウトを調整する。調整済み文書画像保持部502は、レイアウト調整済み文書画像を保持する。印刷処理部207は、出力装置105を介してレイアウト調整済み文書画像を紙に出力する。
【0023】
図6は、第2実施形態における情報処理装置の処理の流れを示すフローチャートである。図6において、第1実施形態と同じ処理を行うステップには図3と同じ番号を付与し、説明を省略する。
【0024】
ステップS601では、レイアウト調整部601が、マスキング文書画像保持部206が保持するマスキング文書画像を基に、マスキング対象の長さとマスキング幅の差分を、当該行の文字間隔を変更することによって吸収する。なお、文字間隔の変更を行うための前段として、レイアウト調整部601は、マスキング文書画像から少なくとも文字画像の抽出、および各文字画像の始端、終端を認識する必要がある。これには既存技術(例えばOCRの前処理技術)を適用することが可能である。一方、マスキング対象の長さは、マスキング情報保持部204が保持するマスキング情報から取得するものとする。レイアウト調整部501は、レイアウト調整済み文書画像を調整済み文書画像保持部502に保持して、ステップS304に移る。
【0025】
ステップS304では、印刷処理部207が、出力装置105を介して、調整済み文書画像保持部502に保持されているレイアウト調整済み文書画像を紙に出力して、終了する。
【0026】
図7は、不定型文書に対して、本実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。この例では、行単位でレイアウト調整を行っている。
【0027】
図7(a)はマスキング処理前の紙文書である。マスキング対象が下線で示されているが、本来は電子透かしとして埋め込まれているため下線は表示されない。この例では、固有名詞がマスキングの対象である。
【0028】
図7(b)は、従来技術によるマスキング処理を施した後の紙文書である。マスキング幅がマスキング対象の長さと一致しており、この例のように氏名が長いまたは短い場合はマスキング対象の秘匿性が低下する。
【0029】
図7(c)は、本実施形態で説明したマスキング処理を施した後の紙文書である。マスキング幅は固定値となっており、また、マスキング処理は行単位で行っている。例えば2行目では、マスキング対象の長さに比べてマスキング幅が短くなった分、同一行に存在する非マスキング対象部分の文字間隔が広くなるように調整されている。
【0030】
次に、マスキング対象が2行に渡る場合(図7(a)の3行目終わりから4行目にかけて)について説明する。この場合、図7(c)の3行目から4行目に示すように、マスキング処理により黒く塗りつぶされた矩形画像も2行に渡るように分割して配置される。両方の矩形画像の長さの和は固定値のマスキング幅に等しくなる。また、それぞれの長さの比は、図7(a)において2行に分割されたマスキング対象の比に等しいものとする。
【0031】
以上説明したように、マスキング対象の長さと独立にマスキング幅を制御することにより、マスキング対象の秘匿性を向上することができる。
【0032】
<第3実施形態>
第1実施形態のステップS303に示したマスキング処理では、マスキング幅にわたって黒く塗りつぶし、さらにマスキング対象の長さがマスキング幅よりも長い場合は、はみ出す部分の画像を消去する場合について説明したが、これに限定されるものではない。例えば、まずマスキング対象を消去し、さらに所定のマスキング幅の、黒く塗りつぶされた矩形画像を挿入する(つまり、マスキング対象を黒矩形画像で置換する)ことによってマスキング処理を実現してもよい。
【0033】
<第4実施形態>
第2実施形態では、日本語等のように単語間にスペースが挿入されない言語の文書を対象にした場合について説明したが、これに限定されるものではなく、英語等のように単語がスペースで区切られている言語に対して適用する場合もよいものとする。この場合、レイアウト調整部601は、単語間隔の調整を行う。すなわち、マスキング対象の長さとマスキング幅の差分を単語間のスペースの長さを調整することによって吸収するように実現する。なお、いうまでもないことであるが、スペース長と文字間隔の両方を調整することによって吸収するように実現してもよい。
【0034】
図8は、英語の文書に対して、本実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。
【0035】
図8(a)はマスキング処理前の紙文書である。マスキング対象が下線で示されているが、本来は電子透かしとして埋め込まれているため下線は表示されない。この例では、固有名詞がマスキング対象である。
【0036】
図8(b)は、従来技術によるマスキング処理を施した後の紙文書である。マスキング幅がマスキング対象の長さと一致しており、この例のように固有名詞が長い場合はマスキング対象の秘匿性が低下する。
【0037】
図8(c)は、本実施形態で説明したマスキング処理を施した後の紙文書である。マスキング幅は固定値となっており、マスキング処理は行単位で行っている。また、マスキング対象の長さとマスキング幅の差分は単語の間隔で調整している。例えば1行目では、マスキング対象の長さに比べてマスキング幅が短くなった分、同一行に存在する単語の間隔が広くなるように調整されている。
【0038】
次に、マスキング対象が2行に渡る場合(図8(a)の3行目終わりから4行目にかけて)について説明する。この場合、図8(c)の3行目から4行目に示すように、マスキング処理により黒く塗りつぶされた矩形画像も2行に渡るように分割して配置される。両方の矩形画像の長さの和は固定値のマスキング幅に等しくなる。また、それぞれの長さの比は、図8(a)において2行に分割されたマスキング対象の長さの比に等しいものとする。
【0039】
以上説明したように、マスキング幅をマスキング対象の長さとは独立に制御し、マスキング対象の長さとマスキング幅の差分をスペースで吸収しているため、マスキング対象の秘匿性が高い。つまり、英語等のように単語間にスペースが挿入される言語において、マスキング対象の長さとマスキング幅の差分をスペースで吸収することによって、マスキング対象の秘匿性を向上させることが可能である。
【0040】
<第5実施形態>
第2実施形態乃至第4実施形態では、レイアウト調整を行単位で行う場合について説明したが、これに限定されるものではなく、段落単位、ページ単位、文書単位、または、文単位など、任意の処理単位を対象に行う場合もよいものとする。段落単位の場合は、段落の行数が増減しない限りにおいて、段落末を最終行の任意の位置に移動してもよいものとする。
【0041】
図9は、図8(a)に示した紙文書に対して、文単位でマスキング処理を施した後の紙文書である。
【0042】
第4実施形態では、図8(a)の3行目から4行目に存在するマスキング対象の長さとマスキング幅の差分が大きいため、図8(c)の3行目では、マスキング処理後の単語間隔が極端に長くなってしまっている。極端な単語間隔は、レイアウトの劣化に加えて、秘匿性の低下につながる。すなわち、極端に長い単語間隔が存在する行では、そのマスキング対象がマスキング幅に比べて極端に長いことを意味する。一方、本実施形態では、図9に示す通り、大きな差分を文単位で分散して吸収しているため、図8(c)の場合に比べて単語間隔が均等になっており、レイアウトの劣化を低減し、さらに秘匿性の低下を軽減している。
【0043】
以上説明したように、マスキングの処理単位を長くすることによって、レイアウトの劣化を低減し、さらに秘匿性の低下を軽減することが可能である。
【0044】
<第6実施形態>
第1実施形態乃至第5実施形態では、紙文書を入力とする場合について説明したが、これに限定されるものではなく、電子データを入力とする場合もよいものとする。また、同様に、マスキング処理を施した結果を紙文書として出力する場合について説明したが、これに限定されるものではなく、電子データを保持または出力する場合もよいものとする。
【0045】
入力が電子データの場合は、スキャン処理部201が不要となる。また、電子データを保持または出力する場合は、印刷処理部207が不要となる。
【0046】
<第7実施形態>
第1実施形態乃至第5実施形態では、マスキング情報がマスキング対象の位置、または、長さの少なくともいずれかを含む場合について説明したが、これに限定されるものではなく、マスキング情報がマスキング対象のキーワードである場合もよいものとする。
【0047】
この場合、マスキング処理部205は、マスキング対象が含まれる電子データをキーワードで検索することによりマスキング対象を特定し、該マスキング対象の長さと独立して前記マスキング幅を決定し、該マスキング幅で前記マスキング対象をマスキングする。
【0048】
<第8実施形態>
第1実施形態では、マスキング情報を電子透かしとして埋め込む場合について説明したが、これに限定されるものではなく、マスキング情報がQRコードやXMLタグなど任意の形態で埋め込まれている場合もよいものとする。この場合、マスキング情報抽出部203が、QRコードやXMLタグなどを解析して、マスキング情報を抽出する。
【0049】
<その他の実施形態>
なお、本発明の目的は次のようにしても達成される。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。このようにしても目的が達成されることは言うまでもない。
【0050】
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶したコンピュータ読取可能な記憶媒体は本発明を構成することになる。
【0051】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0052】
また、本発明に係る実施の形態は、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される場合に限られない。例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0053】
さらに、本発明に係る実施形態の機能は次のようにしても実現される。即ち、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれる。そして、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。この処理により前述した実施形態の機能が実現されることは言うまでもない。
【図面の簡単な説明】
【0054】
【図1】第1実施形態における情報処理装置のハードウエア構成を示すブロック図である。
【図2】第1実施形態における情報処理装置のモジュール構成を示すブロック図である。
【図3】第1実施形態における情報処理装置の処理の流れを示すフローチャートである。
【図4】定型文書(帳票、表形式など)に対して、第1実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。
【図5】第2実施形態における情報処理装置のモジュール構成を示すブロック図である。
【図6】第2実施形態における音声合成装置の処理の流れを示すフローチャートである。
【図7】不定型文書に対して、第2実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。
【図8】英語に対して、第4実施形態で説明したマスキング処理を行う前後の紙文書を示した模式図である。
【図9】第5実施形態で説明したマスキング処理を行った後の紙文書を示した模式図である。
【符号の説明】
【0055】
101 制御メモリ
102 中央処理装置
103 メモリ
104 入力装置
105 出力装置
106 バス
201 スキャン処理部
202 文書画像保持部
203 マスキング情報抽出部
204 マスキング情報保持部
205 マスキング処理部
206 マスキング文書画像保持部
207 印刷処理部
501 レイアウト調整部
502 調整済み文書画像保持部

【特許請求の範囲】
【請求項1】
マスキング対象を特定するマスキング情報を取得する取得手段と、
前記取得したマスキング情報に基づいて、マスキング対象の長さと独立してマスキング幅を決定する決定手段と、
前記決定結果に基づいてマスキング対象をマスキングするマスキング手段と、
を備えることを特徴とする情報処理装置。
【請求項2】
マスキング情報が埋め込まれた文書をスキャンして電子データに変換するスキャン手段をさらに備え、
前記取得手段は、前記スキャン手段が変換した電子データから前記マスキング情報を取得することを特徴とする請求項1記載の情報処理装置。
【請求項3】
前記マスキング対象は電子データに含まれ、
前記マスキング手段によりマスキング対象がマスキングされた前記電子データを出力する出力手段をさらに備えることを特徴とする請求項1記載の情報処理装置。
【請求項4】
前記出力手段は、非マスキング対象部分の文字の間隔を変更して出力することを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記出力手段は、非マスキング対象部分の文字の間隔を変更する際に、行単位、段落単位、ページ単位、文書単位、または、文単位のいずれかを処理単位として文字間の変更処理を行うことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記マスキング情報は、マスキング対象の位置および長さの少なくともいずれかを含むことを特徴とする請求項1記載の情報処理装置。
【請求項7】
前記マスキング情報は、マスキング対象のキーワードであって、
前記決定手段は、前記マスキング対象が含まれる電子データをキーワードで検索することによりマスキング対象を特定し、該マスキング対象の長さと独立して前記マスキング幅を決定することを特徴とする請求項1記載の情報処理装置。
【請求項8】
前記決定手段は、マスキング幅を固定長とする、または、マスキング幅をランダムな長さとすることを特徴とする請求項1記載の情報処理装置。
【請求項9】
前記マスキング情報は、マスキング対象とは独立に決定されたマスキング幅を含み、
前記決定手段は、前記マスキング情報に含まれるマスキング幅に基づいてマスキング幅を決定することを特徴とする請求項1記載の情報処理装置。
【請求項10】
前記マスキング情報は電子透かし、QRコード、またはXMLタグとして前記文書に埋め込まれており、
前記取得手段は、前記電子透かし、QRコード、またはXMLタグを解析してマスキング情報を取得することを特徴とする請求項2記載の情報処理装置。
【請求項11】
マスキング対象を特定するマスキング情報を取得する取得工程と、
前記取得したマスキング情報に基づいてマスキング対象の長さと独立してマスキング幅を決定する決定工程と、
前記決定結果に基づいてマスキング対象をマスキングするマスキング工程と、
を備えることを特徴とする情報処理方法。
【請求項12】
コンピュータを請求項1乃至10のいずれか1項に記載の情報処理装置として機能させるためのプログラム。
【請求項13】
請求項12に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2009−145973(P2009−145973A)
【公開日】平成21年7月2日(2009.7.2)
【国際特許分類】
【出願番号】特願2007−319855(P2007−319855)
【出願日】平成19年12月11日(2007.12.11)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.QRコード
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】