画像形成装置、画像形成方法、及びコンピュータプログラム

【課題】印刷物の改ざんを従来よりも正確に検出することができるようにする。
【解決手段】原稿画像データ３１０から文字領域３１１ａ〜３１１ｆを抽出する。そして、抽出した文字領域３１１ａ〜３１１ｆが相互に重ならない範囲で可及的に小さなサイズになるように、それら文字領域３１１ａ〜３１１ｆをパッキングして画像データ５０１を生成する。この画像データ５０１を符号化して二次元コード８０１を生成し、原稿画像データ３１０と二次元コード８０１とを合成した交付文書画像データ８００を印刷する。その後、交付文書画像データ８００の改ざんを検出する場合、交付文書画像データ８００から抽出した文字領域３１１と、二次元コード８０１を復号化することにより得られた画像データ５０１の文字領域とを比較する。そして、比較した結果に基づいて、交付文書画像データ８００の改ざんを検出する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、画像形成装置、画像形成方法、及びコンピュータプログラムに関し、特に、印刷物の改ざんを検出するために用いて好適なものである。
【背景技術】
【０００２】
従来から、印刷物の原本に対する改ざんを検知するために、原本に関する付加情報を交付文書に付加して印刷出力する技術が開示されている。特許文献１では、原本となる文書画像の画像特徴量を交付文書に付加して（埋め込んで）印刷出力する。この特許文献１において交付文書の改ざんを検出する際には、交付文書から画像特徴量を計算する。そして、計算した画像特徴量と、交付文書に付加された画像特徴量とを比較し、比較した結果に基づいて原本の改ざんを検出する。
【０００３】
また、特許文献２では、原本から文字コード情報をＯＲＣ機能により取得し、当該文字コード情報から所定の演算で算出される認証値とレイアウト情報とを合わせた情報を、交付文書に付加して印刷出力する。この特許文献２において原本の改ざんを検出する際には、光学的に読み取った交付文書から、当該交付文書に付加された前記情報を取得する。その後、当該取得した情報からレイアウト情報を求め、求めたレイアウト情報に従って交付文書から文字列情報をＯＣＲ機能により取得する。その後、所定の演算で算出される認証値を、交付文書に付加された情報に含まれている元の認証値と比較し、比較した結果に基づいて、原本の改ざんを検出する。また、前述した情報を交付文書の印刷出力時に認証局に保管し、原本の改ざんの検出時に、当該情報を認証局に問い合わせ、問い合わせた情報に含まれる元の認証値と、前記所定の演算で算出される認証値とを比較することによっても原本の改ざんを検出できる。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】特開２００３−２６４６８５号公報
【特許文献２】特開２００４−１３２８７号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
しかしながら、前述した従来の技術には、以下のような課題がある。
すなわち、特許文献１では、画像をブロック単位に分割し、当該ブロック毎の「（１）周波数スペクトル」、「（２）任意のフィルタ処理を行った結果の値」、「（３）ブロック画像中の白画素と黒画素との割合」の何れかを画像特徴量としている。しかしながら、前記画像特徴量は、いずれも文書の認証を行うための情報としては情報が少なすぎるか、情報のサイズが大きすぎるかの何れかとなる。このため、正しく文書の改ざんを検出することや、画像特徴量を交付文書に付加して印刷することが困難になる虞がある。また、交付文書にごみや汚れがついてしまうと画像特徴量が変わってしまうため、正しく文書の改ざんを検知することが困難になる虞がある。
【０００６】
また、特許文献２では、ＯＣＲの読み取り精度等の問題により、改ざんが行われていなくても、交付文書を印刷するときのＯＣＲの読み取り結果と、認証を行う際のＯＣＲの読み取り結果とが異なる場合がある。したがって、正しく文書の改ざんを検出するのが困難になる虞がある。
【０００７】
本発明は以上のような問題点に鑑みてなされたものであり、印刷物の改ざんを従来よりも正確に検出することができるようにすることを目的とする。
【課題を解決するための手段】
【０００８】
本発明の画像形成装置は、文書データに含まれる文字情報を特定する特定手段と、前記特定手段によって特定された文字情報の画像データを生成する生成手段と、前記生成手段によって生成された画像データを二次元コードに変換する変換手段と、前記変換手段によって変換された二次元コードと前記文書データとを合成した印刷物を印刷する印刷手段と、を備え、前記生成手段によって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とする。
【発明の効果】
【０００９】
本発明によれば、文書データに含まれる文字情報を、当該文書データよりも小さなサイズの画像データにし、当該画像データを二次元コードに変換して文書データに合成するようにした。したがって、印刷物の文字情報と、二次元コードに含まれる文字情報とを比較することによって、改ざんされる可能性が高い文字に係る情報の改ざんを従来よりも正確に検出することが可能になる。
【図面の簡単な説明】
【００１０】
【図１】文書管理システムの一例を概念的に示す図である。
【図２】交付文書生成装置、交付文書確認装置の構成の一例を示すブロック図である。
【図３】文字領域を検索する様子の一例を概念的に示す図である。
【図４】交付文書生成装置の埋め込み情報生成部の動作の一例を説明するフローチャートである。
【図５】ステップＳ４０１の処理で生成される画像データの一例を示す図である。
【図６】ステップＳ４０１の処理の一例を詳細に説明するフローチャートである。
【図７】図６のフローチャートの処理によって画像データを形成する様子の一例を概念的に示す図である。
【図８】原稿画像データと二次元コードとが合成された交付文書画像データの一例を示す図である。
【図９】交付文書確認装置の動作の一例を説明するフローチャートである。
【図１０】ステップＳ９０３における改ざん検出部の詳細な動作の一例を説明するフローチャートである。
【図１１】交付文書の改ざんの有無を検出する際の画像データの様子の一例を概念的に示す図である。
【図１２】交付文書生成装置の埋め込み情報生成部の動作の一例を説明するフローチャートである。
【図１３】水平パリティと垂直パリティの一例を概念的に示す図である。
【図１４】原本画像データと、原本画像データの文字領域をパッキングすることにより得られる画像データの一例を示す図である。
【図１５】図１４（Ｂ）に示した画像データから得られる垂直パリティ及び水平パリティの一例を概念的に示す図である。
【図１６】交付文書確認装置の構成の一例を示すブロック図である。
【図１７】交付文書確認装置の動作の一例を説明するフローチャートである。
【図１８】文字領域に関する情報の一例を示す図である。
【図１９】ステップＳ１７０５の詳細な動作の一例を説明するフローチャートである。
【図２０】交付文書生成装置の埋め込み情報生成部の動作の一例を説明するフローチャートである。
【発明を実施するための形態】
【００１１】
（第１の実施形態）
以下、図面を参照しながら、本発明の第１の実施形態を説明する。
図１は、文書管理システムの一例を概念的に示す図である。
図１において、文書管理システムは、交付文書生成装置１００と交付文書確認装置１１０とを有する。
文書交付者１０１は交付文書生成装置１００を操作することで、原本１０２から、改ざんを検出することができる交付文書１０３を得る。文書交付者１０１は、交付文書１０３を文書受領者１０４に渡す。しかし、文書受領者１０４が受け取る交付文書１０３は、文書改ざん者１０５によって改ざんされることもあり得る。そのため、文書受領者１０４は、受け取った交付文書１０３を交付文書確認装置１１０に読み込ませることにより、受領した交付文書１０３に対して改ざんがなされていないことを確認する。
【００１２】
続いて、交付文書生成装置１００と交付文書確認装置１１０の構成の一例を説明する。
図２（Ａ）は、交付文書生成装置１００の構成の一例を示すブロック図である。図２（Ｂ）は、交付文書確認装置１１０の構成の一例を示すブロック図である。尚、図２（Ａ）及び図２（Ｂ）において、本質的に同じ機能を持つブロックについては同じ符号を付与している。
【００１３】
まず、図２（Ａ）に示す交付文書生成装置１００の構成の一例について説明する。交付文書生成装置１００は、例えば、ＭＦＰにより実現できる。ただし、交付文書生成装置１００はＭＦＰに限定されない。例えば、パーソナルコンピュータと、スキャナと、プリンタとを用いることにより、交付文書生成装置１００を実現できる。
【００１４】
文書読み取り部２０１は、スキャナを備え、入力された原稿画像（原本１０２）を光学的に走査することで電子的な原稿画像データを形成する。文字領域判定部２０２は、文書読み取り部２０１で形成された原稿画像データから、文字情報を含む文字領域を検索する。本実施形態では、矩形状の領域を文字領域とする。
埋め込み情報生成部２０３は、文字領域判定部２０２で検索された文字領域の情報から、交付文書１０３に付加する二次元コードを生成する。画像合成部２０４は、文書読み取り部２０１で形成された原稿画像データと、埋め込み情報生成部２０３で生成された二次元コードとを合成して交付文書１０３の画像データを生成する。画像出力部２０５は、プリンタエンジンを備え、画像合成部２０４で生成された交付文書１０３の画像データを紙に印刷する。
【００１５】
次に、図２（Ｂ）に示す交付文書確認装置１１０の構成の一例について説明する。交付文書確認装置１１０は、例えば、ＭＦＰにより実現できる。ただし、交付文書確認装置１１０はＭＦＰに限定されない。例えば、パーソナルコンピュータと、スキャナと、プリンタとを用いることにより、交付文書確認装置１１０を実現できる。
【００１６】
交付文書確認装置１１０の文書読み取り部２０１は、スキャナを備え、交付文書１０３を光学的に走査することでその情報を読み取り、電子的な交付文書画像データを形成する。文字領域判定部２０２は、文書読み取り部２０１で形成された交付文書画像データから文字領域を検索する。改ざん検出部２０６は、文書読み取り部２０１で形成された交付文書画像データと、文字領域判定部２０２で検索された文字領域の情報とから、改ざんされた領域を検出する。出力部２０７は、コンピュータディスプレイを備え、改ざん検出部２０６で検出された結果を表示する。
【００１７】
続いて、文字領域判定部２０２の動作の一例を詳細に説明する。
文字領域判定部２０２は、文書読み取り部２０１により形成された原稿画像データから、文字が含まれている文字領域を矩形状の領域として全て検索する。本実施形態では、文字領域判定部２０２は、ヒストグラムを用いた方法で文字領域を検索するものとする。
図３は、文字領域を検索する様子の一例を概念的に示す図である。
図３において、３００は、文字領域判定部２０２で文字領域を判定する原稿画像データである。３１０は、文字領域が判定された原稿画像データである。３１１ａ〜３１１ｆは、検索された文字領域である。これら検索された文字領域３１１ａ〜３１１ｆは、例えば、検索された各文字領域３１１ａ〜３１１ｆの左上の座標値と、幅と、高さとによって表現される。ここで、検索された各文字領域３１１ａ〜３１１ｆの左上の座標値は、原稿画像データ３１０の左上を原点とする座標値であるものとする。尚、以下の説明では、文字領域３１１ａ〜３１１ｆを区別しない場合には、これらを文字領域３１１と称する。
【００１８】
続いて、図４のフローチャートを参照しながら、交付文書生成装置１００の埋め込み情報生成部２０３の動作の一例を説明する。
まず、埋め込み情報生成部２０３は、文字領域判定部２０２で検索された文字領域３１１のみを含む画像データを全ての文字領域３１１のそれぞれについて生成する（ステップＳ４０１）。尚、ステップＳ４０１で生成される画像データのサイズ（縦横の大きさ）は、文書読み取り部２０１で形成された原稿画像データ３００のサイズよりも小さい。このステップＳ４０１の処理についての詳細は後述する。
【００１９】
続いて埋め込み情報生成部２０３は、ステップＳ４０１で生成された画像データを符号化する（ステップＳ４０２）。ステップＳ４０２で行われる符号化は、ステップＳ４０１で生成された画像データを圧縮する可逆変換が可能な符号化が好ましい。例えば、ステップＳ４０２では、ＰＮＧやＴＩＦＦ形式の符号化を利用できる。
続いて埋め込み情報生成部２０３は、符号化した結果を二次元コードに変換する（ステップＳ４０３）。ここで二次元コードとは、符号化した結果を紙面上に印刷できる形式であればよい。例えば、ステップＳ４０３では、ベリコード（登録商標）やＱＲコード（登録商標）、ＣＰコード等のコードを使用することが可能である。
【００２０】
次に、図５及び図７と、図６のフローチャートを参照しながら、図４のステップＳ４０１の処理の一例を詳細に説明する。図５は、図４のステップＳ４０１の処理で生成される画像データの一例を示す図である。図７は、図６のフローチャートの処理によって画像データを形成する様子の一例を概念的に示す図である。
埋め込み情報生成部２０３は、図３に示した原稿画像データ３００から、図５に示す画像データ５０１をステップＳ４０１で形成する。
【００２１】
図６において、まず、埋め込み情報生成部２０３は、文字領域判定部２０２で検索された全ての文字領域３１１のそれぞれを、各々他の文字領域３１１と重ならないように左詰めしたときの各文字領域３１１の座標値（Ｘ，Ｙ）を計算する（ステップＳ６０１）。各文字領域３１１を左詰めしたときの原稿画像データ３１０の様子は、図７の真ん中の図のようになる。
続いて埋め込み情報生成部２０３は、ステップＳ６０１で計算した座標値から、左詰した各文字領域３１１のそれぞれを、各々他の文字領域と重ならないように上詰めしたときの各文字領域３１１の座標値（Ｘ，Ｙ）を計算する（ステップＳ６０２）。左詰した各文字領域３１１を上詰めしたときの様子は、図７の右側の図のようになる。
【００２２】
最後に、埋め込み情報生成部２０３は、ステップＳ６０２で計算した座標値に配置した全ての文字領域３１１の画像をコピーして、図５に示す画像データ５０１を生成する（ステップＳ６０３）。尚、ステップＳ６０３で生成される画像データ５０１のサイズ（縦横の大きさ）は、ステップＳ６０２で計算した座標値と、それぞれの文字領域３１１自体のサイズとから計算される。本実施形態では、画像データ５０１は、全ての文字領域３１１を包含するサイズを有する矩形状の画像のデータであり、そのそれぞれのピクセルは全て白で初期化されているものとする。
【００２３】
以上のようなステップＳ４０１の処理が行われた後、前述したようにしてステップＳ４０２、Ｓ４０３の処理が行われることにより、埋め込み情報生成部２０３で二次元コードが生成される。画像合成部２０４は、この二次元コードと、文書読み取り部２０１で形成された原稿画像データ３００とを合成する。図８は、原稿画像データ３００と二次元コードとが合成された交付文書画像データの一例を示す図である。画像合成部２０４は、原稿画像データ３００から二次元コードを置くことが可能な空白領域を検索し、検索した空白領域に二次元コードを合成することができる。また、画像合成部２０４は、原稿画像データ３００の予め定められた領域に二次元コードを合成してもよい。予め二次元コードを合成する領域を定める場合には、文字が記載されていない領域を設定する必要がある。図８に示すように、交付文書画像データ８００には、埋め込み情報生成部２０３によって生成された二次元コード８０１が含まれる。
【００２４】
続いて、図９のフローチャートを参照しながら、交付文書確認装置１１０の動作の一例を説明する。
まず、交付文書確認装置１１０の文書読み取り部２０１は、改ざんを検出する対象の交付文書（紙文書）を光学的に走査することでその情報を読み取り、電子的な交付文書画像データ８００を形成する（ステップＳ９０１）。
続いて交付文書確認装置１１０の文字領域判定部２０２は、ステップＳ９０１で形成した交付文書画像データ８００の文字領域を検索する（ステップＳ９０２）。
【００２５】
続いて改ざん検出部２０６は、文書読み取り部２０１で形成された交付文書画像データ８００から二次元コード８０１を抽出し、抽出した二次元コードを復号する。そして、改ざん検出部２０６は、二次元コード８０１を復号することにより得られた画像データ５０１と、ステップＳ９０２で検索された各々の文字領域とを比較することで交付文書の改ざんを検出する（ステップＳ９０３）。このステップＳ９０３における交付文書確認装置１１０の動作についての詳細は後述する。
最後に交付文書確認装置の出力部２０７は、改ざん検出部２０６における改ざん検出の結果を出力（表示）する（ステップＳ９０４）。このステップＳ９０４における出力部２０７の動作についての詳細も後述する。
【００２６】
続いて、図１０のフローチャートを参照しながら、図９のステップＳ９０３における改ざん検出部２０６の詳細な動作の一例を説明する。
まず、改ざん検出部２０６は、文書読み取り部２０１で形成された交付文書画像データ８００から二次元コード８０１を検出する。その後、改ざん検出部２０６は、交付文書生成装置１００の埋め込み情報生成部２０３で生成された「文字領域３１１を含む二次元コード８０１」を復号する（ステップＳ１００１）。
【００２７】
続いて改ざん検出部２０６は、文字領域判定部２０２で検索された複数の文字領域３１１から、未処理の文字領域を１つ選択する（ステップＳ１００２）。
続いて改ざん検出部２０６は、ステップＳ１００１で二次元コード８０１を復号することにより得られた画像データ５０１から、ステップＳ１００２で選択した文字領域を、パターンマッチングにより検索する（ステップＳ１００３）。例えば、二次元コード８０１を復号することにより得られた画像データ５０１の文字領域と、ステップＳ１００２で選択した文字領域との各文字の特徴量を辞書と比較することによりステップＳ１００３の検索を行うことができる。また、二次元コード８０１を復号することにより得られた画像データ５０１の文字領域の特徴量と、ステップＳ１００２で選択した文字領域の特徴量との類似度によりステップＳ１００３の検索を行うこともできる。
続いて改ざん検出部２０６は、ステップＳ１００１で二次元コード８０１を復号することにより得られた画像データ５０１から、ステップＳ１００２で選択した文字領域が検出されたか否かを判定する。
【００２８】
この判定の結果、ステップＳ１００１で二次元コード８０１を復号することにより得られた画像データ５０１から、ステップＳ１００２で選択した文字領域が検出された場合には、ステップＳ１００６に進む。そして、改ざん検出部２０６は、画像データ５０１上の「ステップＳ１００２で選択された文字領域と合致（マッチ）した領域」を白で塗りつぶす（ステップＳ１００６）。そして、後述するステップＳ１００７に進む。
一方、ステップＳ１００１で二次元コード８０１を復号することにより得られた画像データ５０１から、ステップＳ１００２で選択した文字領域が検出されなかった場合には、ステップＳ１００５に進む。そして、改ざん検出部２０６は、ステップＳ１００２で選択した文字領域に対して、ステップＳ１００１で二次元コード８０１を復号することにより得られた画像データ５０１から当該文字領域を検出できなかったことを示すフラグを設定する。上記処理を、交付文書確認装置１１０の文字領域判定部２０２で検出された文字領域すべてに対して行う。そして、ステップＳ１００７に進む。
【００２９】
ステップＳ１００７に進むと、改ざん検出部２０６は、文字領域判定部２０２で検索された複数の文字領域３１１の全てについて、ステップＳ１００２以降の処理を行ったか否かを判定する。この判定の結果、文字領域判定部２０２で検索された複数の文字領域３１１の全てについて処理を行っていない場合には、ステップＳ１００２に戻り、複数の文字領域３１１の全てについて処理を行うまで、ステップＳ１００２〜Ｓ１００７の処理を繰り返し行う。そして、複数の文字領域３１１の全てについて処理が終了すると、図１０のフローチャートによる処理を終了する。
【００３０】
ここで、改ざん検出部２０６の具体的な動作について例示する。図１１は、交付文書の改ざんの有無を検出する際の画像データの様子の一例を概念的に示す図である。図１１では、文書受領者１０４が交付文書画像データ１１００（交付文書）を受け取ったと仮定する。ここで交付文書画像データ１１００は、交付文書生成装置１００が出力した交付文書画像データ８００（図８を参照）を改ざんしたものであり、原本では“\20000”だった文字列が“\30000”に改ざんされている。また、図１１では、交付文書画像データ１１００に付与された二次元コードを復号した画像データ５０１を交付文書画像データ１１００の下に示す。
【００３１】
まず、改ざん検出部２０６は、“商品コード”という文字領域８１１ａを選択する。“商品コード”という文字領域８１１ａの画像は、二次元コード８０１の復号により得られた画像データ５０１の文字領域５０１ａの画像とマッチする。したがって、画像データ５０１の文字領域５０１ａは白で塗りつぶされる（図１１の上段の左から３番目の画像データ５０１を参照）。以下、“０１２３”、“\30000”、“になります“、”株式会社○○○○“、”TEL XXX−XXXX−XXXX“という文字領域８１１ｂ〜８１１ｆに対して同様の処理を行う。ここで、画像データ５０１に”\30000“という文字領域が存在しない。したがって、交付文書画像データ１１００の”￥３００００“という文字領域８１１ｃを選択したときには、”\30000“という文字領域８１１ｃに対して前述したフラグが設定される。図１１において、”\30000“に付されている網がけは、このフラグが設定されていることを概念的に示している。以上のようにして改ざん検出部２０６が、交付文書画像データ１１００の全ての文字領域について、画像データ５０１の文字領域とのパターンマッチングを終えると、図１１の下段の右端のような状態になる。
【００３２】
改ざん検出部２０６の検出結果は以下の３つの種類に分類できる。
（１）全ての文字領域３１１、８１１に対してフラグが設定されず、パターンマッチングを行った後の画像データ５０１が全て白である。
この場合、改ざん検出部２０６は、交付文書画像データ８００の改ざんが行われていると判断する。したがって、出力部２０７は、改ざんが行われていない旨のメッセージを、交付文書確認装置１１０が備えるディスプレイに例えばＧＵＩとして表示する。
【００３３】
（２）文字領域８１１の少なくとも何れか１つに対してフラグが設定されている。
この場合、改ざん検出部２０６は、フラグが設定されている文字領域８１１が別の文字に改ざんされていると判断する。したがって、出力部２０７は、交付文書が改ざんされている旨のメッセージを、交付文書確認装置１１０が備えるディスプレイに例えばＧＵＩとして表示する。このとき、出力部２０７は、図１１の下段の右端のような画像を表示して、どの文字列が改ざんされているかを、文書受領者１０４に視覚的に分かり易く表示してもよい。或いは、出力部２０７は、交付文書が改ざんされている旨のメッセージを用紙上に印刷してもよい。
【００３４】
（３）文字領域８１１に対してフラグは設定されていないが、パターンマッチングを行った後の画像データ５０１が全て白ではない。
この場合、改ざん検出部２０６は、交付文書画像データ８００の一部の文字列が消去されていると判断する。したがって、出力部２０７は、交付文書が改ざんされている旨のメッセージを、交付文書確認装置１１０が備えるディスプレイに例えばＧＵＩとして表示する。このとき、出力部２０７は、パターンマッチングを行った後の画像データ５０１を表示することで、どのような文字列が消去されたかを文書受領者１０４に通知してもよい。
【００３５】
以上のように本実施形態では、原稿画像データ３１０から文字領域３１１ａ〜３１１ｆを特定する。そして、特定した文字領域３１１ａ〜３１１ｆが相互に重ならない範囲で可及的に小さなサイズになるように、それら文字領域３１１ａ〜３１１ｆをパッキングして画像データ５０１を生成する。この画像データ５０１を符号化して二次元コード８０１を生成し、原稿画像データ３１０と二次元コード８０１とを合成した交付文書画像データ８００を印刷する。その後、交付文書画像データ８００の改ざんを検出する場合、交付文書画像データ８００から特定した文字領域３１１と、二次元コード８０１を復号化することにより得られた画像データ５０１の文字領域とを比較する。そして、比較した結果に基づいて、交付文書画像データ８００の改ざんを検出する。
【００３６】
したがって、改ざんされてしまう可能性が高い文字に係る情報の改ざんを従来よりも正確に検出することができる。交付文書の文字情報を可及的にコンパクトなサイズにパッキングして改ざんの検出に利用することができ、従来よりも改ざんを検出するのに適した情報量のデータで交付文書画像データ８００の改ざんを検出することができる。また、本実施形態では、文字認識を行う。したがって、交付文書にごみや汚れがついていたとしても、改ざんを検出するために交付文書が読み取る情報の誤認識を従来よりも抑制することができる。また、ＯＣＲ処理のような高い読み取り精度が要求される処理を行う必要がないので、改ざんを検出するために交付文書が読み取る情報の誤認識を従来よりも抑制することができる。以上のことから、本実施形態では、印刷物の改ざんを従来よりも正確に検出することができる。
【００３７】
また、交付文書画像データ８００の改ざんを検出した場合には、どの文字列が改ざんされているのかを報知するようにしたので、交付文書画像データ８００のどの文字領域３１１が改ざんされたかを文書受領者１０４に知らせることが可能となる。
また、前述したように、原稿画像データ３１０から抽出した文字領域３１１ａ〜３１１ｆが相互に重ならない範囲で可及的に小さなサイズになるように、それら文字領域３１１ａ〜３１１ｆをパッキングして画像データ５０１を生成する。したがって、画像データ５０１を復号化するときの展開メモリのサイズを小さくすることができる。また、交付文書画像データ８００から抽出した文字領域３１１と、二次元コード８０１を復号化することにより得られた画像データ５０１の文字領域とを比較すること（パターンマッチング）を高速に行うことができる。
【００３８】
（第２の実施形態）
次に、本発明の第２の実施形態について説明する。前述した第１の実施形態では、原稿画像データ３００の文字領域３１１をパッキングした画像データ５０１を符号化した二次元コード８０１を原稿画像データ３００と合成して交付文書画像データ８００を生成した。しかしながら、このようにすると、紙面に大量の文字列がある原稿である場合、原稿画像データ３００に埋め込む情報が、当該原稿画像データ３００に埋められるように十分に小さくならない可能性が残る。そこで、本実施形態では、この課題をより確実に解決するため、原稿画像データ３００の文字領域３１１をパッキングした画像データのパリティ情報を符号化して交付文書データに付与する。
【００３９】
このように、本実施形態と第１の実施形態とは、交付文書データに付与する情報が主として異なる。したがって、本実施形態の説明において、第１の実施形態と同一の部分については、図１〜図１１に付した符号と同一の符号を付す等して詳細な説明を省略する。例えば、本実施形態における交付文書生成装置の構成は、第１の実施形態における交付文書生成装置１００と同じであるが、埋め込み情報生成部２０３の動作が異なる。
【００４０】
まず、図１２のフローチャートを参照しながら、交付文書生成装置の埋め込み情報生成部２０３の動作の一例を説明する。
まず、埋め込み情報生成部２０３は、文字領域判定部２０２で検索された全ての文字領域３１１のみを含む画像データを生成する（ステップＳ１２０１）。第１の実施形態と同様に、ステップＳ１２０１で生成される画像データのサイズ（縦横の大きさ）は、文書読み取り部２０１で形成された原稿画像データ３００のサイズよりも小さい。この画像データを生成する方法は、第１の実施形態で説明したのと同じである（図６及び図７を参照）。
【００４１】
続いて埋め込み情報生成部２０３は、ステップＳ１２０１で生成された画像データの垂直パリティと水平パリティとを計算する（ステップＳ１２０２）。ここで水平パリティとは、画像の水平方向の各ラインに対して、白以外のピクセルの個数が偶数なのか奇数なのかを示す情報である。垂直パリティとは、画像の垂直方向の各ラインに対して、白以外のピクセルの個数が偶数なのか奇数なのかを示す情報である。図１３は、水平パリティと垂直パリティの一例を概念的に示す図である。図１３において、例えば、水平方向の１行目には白以外のピクセルの個数が３個であるため奇数を示す０の水平パリティが与えられる。一方、水平方向の３行目には白以外のピクセルの個数が６個であるため偶数を示す１の水平パリティが与えられる。このようなステップＳ１２０２の処理が実行されることで、図１３に示すような水平パリティ１３０１及び垂直パリティ１３０２を得ることができる。
【００４２】
続いて埋め込み情報生成部２０３は、ステップＳ１２０２で計算された水平パリティ１３０１と垂直パリティ１３０２とを二次元コードに変換する（ステップＳ１２０３）。
ここで、埋め込み情報生成部２０３の具体的な動作について例示する。図１４（Ａ）は、原本画像データの一例を示す図である。図１４（Ｂ）は、原本画像データの文字領域をパッキングすることにより得られる画像データの一例を示す図である。また、図１５は、図１４（Ｂ）に示した画像データから得られる垂直パリティ及び水平パリティの一例を概念的に示す図である。
図１４（Ａ）に示す原稿画像データ１４０１に対してステップＳ１２０１の処理を行うことにより図１４（Ｂ）に示す画像データ１４０２が生成される。
埋め込み情報生成部２０３は、画像データ１４０２から、水平パリティ１５０１と垂直パリティ１５０２とを計算する。その後埋め込み情報生成部２０３は、計算した水平パリティ１５０１及び垂直パリティ１５０２を二次元符号コードに変換する。
【００４３】
続いて本実施形態における交付文書確認装置の一例について説明する。
図１６は、交付文書確認装置の構成の一例を示すブロック図である。尚、図１６において、これまでに説明した機能と本質的に同じ機能を持つブロックについては、これまでに示した符号と同じ符号を付している。
図１６において、交付文書確認装置１６０１は、文書読み取り部２０１と、文字領域判定部２０２と、埋め込み情報生成部２０３と、改ざん検出部２０６と、出力部２０７とを有している。
【００４４】
次に、図１７のフローチャートを参照しながら、交付文書確認装置１６０１の動作の一例を説明する。
交付文書確認装置１６０１の文書読み取り部２０１は、改ざんを検出する対象の交付文書（紙文書）を光学的に走査することでその情報を読み取り、電子的な交付文書画像データを形成する（ステップＳ１７０１）。
続いて交付文書確認装置１６０１の文字領域判定部２０２は、ステップＳ１７０１で形成した交付文書画像データに含まれている文字領域を検索する（ステップＳ１７０２）。
【００４５】
続いて交付文書確認装置１６０１の埋め込み情報生成部２０３は、ステップＳ１７０２で検索された文字領域のみを含む画像データを生成する（ステップＳ１７０３）。ここで交付文書確認装置１６０１は、交付文書生成装置の埋め込み情報生成部２０３が、図１２のステップＳ１２０１で行った方法と同じ方法で、ステップＳ１７０２で検索された文字領域のみを含む画像データを生成する。
また、埋め込み情報生成部２０３は、交付文書画像データ上の文字領域の位置（文字領域の元の位置）と、文字領域のみを含む画像データ上の文字領域の位置（文字領域の移動後の位置）と、当該文字領域の高さ及び幅の情報を文字領域毎に出力する。
図１８は、文字領域に関する情報の一例を示す図である。
図１８に示すように、埋め込み情報生成部２０３は、文字領域に含まれる文字列１８０１と、文字領域の元の位置１９０２と、文字領域の移動後の位置１９０３と、文字領域の高さ１９０４及び幅１９０５とが相互に対応付けられた情報を文字領域毎に出力する。
【００４６】
続いて交付文書確認装置１６０１の埋め込み情報生成部２０３は、ステップＳ１７０３で生成された画像データの垂直パリティと水平パリティとを計算する（ステップＳ１７０４）。
続いて交付文書確認装置１６０１の改ざん検出部２０６は、交付文書画像データの改ざんを検出する（ステップＳ１７０５）。このステップＳ１７０５の処理についての詳細は後述する。
最後に交付文書確認装置１６０１の出力部２０７は、ステップＳ１７０５で行われた改ざん検出の結果を出力（表示）する（ステップＳ１７０６）。
【００４７】
続いて、図１９のフローチャートを参照しながら、図１６のステップＳ１７０５における改ざん検出部２０６の詳細な動作の一例を説明する。
まず、改ざん検出部２０６は、ステップＳ１７０１で形成された交付文書画像データに含まれる二次元コードを復号して、交付文書生成装置で計算されたパリティの情報を得る（ステップＳ１９０１）。
続いて改ざん検出部２０６は、交付文書確認装置１６０１の埋め込み情報生成部２０３で計算されたパリティの情報（ステップＳ１７０４で計算されたパリティの情報）と、ステップＳ１９０１で復号したパリティの情報とを比較する。この結果、改ざん検出部２０６は、垂直パリティと水平パリティとが共に異なるピクセルは１、それ以外は０の値を持つ二値のビットマップを形成する（ステップＳ１７０２）。尚、ビットマップの内容は必ずしもこのようにする必要はない。例えば、垂直パリティと水平パリティとが共に異なるピクセルを０、それ以外を１としてもよい。
【００４８】
続いて改ざん検出部２０６は、交付文書確認装置１６０１の埋め込み情報生成部２０３から出力された、文字領域に関する情報（図１８を参照）を用いて、文字領域毎に値が１のピクセルの個数を計上する。そして、改ざん検出部２０６は、計上したピクセル数を用いて、文字領域毎に改ざん有無を判定する。ここでは、文字領域内のピクセル数が予め設定された閾値以上であるならば、当該文字領域は改ざんされていると判定することができる。ただし、ここでの判定は、このようなものに限定されない。例えば、文字領域の大きさと計上されたピクセル数との比が予め設定された閾値以上であるならば、当該文字領域は改ざんされたと判定してもよい。
【００４９】
以上のように検出された結果は、出力部２０７によって文書受領者１０４に通知される。出力部２０７は、例えば、交付文書画像上で、改ざんされたと判断された文字領域を視覚的に分かり易いように修飾し、修飾された交付文書画像をユーザインタフェースに表示することができる。ただし、改ざんを検出した結果を報知する方法は、このようなものに限定されない。例えは、出力部２０７は、改ざんされた文字領域が修飾された交付文書画像を紙面上に印刷してもよい。
【００５０】
以上のように本実施形態では、原稿画像データ１４０１の文字領域をパッキングした画像データ１４０２の水平パリティ１５０１及び垂直パリティ１５０２（パリティ値）を符号化した二次元コードを生成するようにした。したがって、第１の実施形態で説明した効果に加えて、例えば、原稿画像データ１４０１に埋め込む情報を第１の実施形態よりも小さくすることができるという効果が得られる。これにより、例えば、紙面に大量の文字列がある原稿である場合であっても、第１の実施形態よりも確実に、二次元コードを原稿画像データ１４０１に埋め込むことができる。
尚、本実施形態においても、第１の実施形態で説明した変形例を採用することができる。
【００５１】
（第３の実施形態）
次に、本発明の第３の実施形態について説明する。本実施形態では、原稿画像データの文字領域をパッキングした画像データを符号化したときのサイズ（情報量）と所定値との比較結果に応じて、画像データを符号化した二次元コードと、パリティ値を符号化した二次元コードとの何れかを生成する。すなわち、本実施形態では、原稿画像データの文字領域をパッキングした画像データを符号化したときのサイズ（情報量）に応じて、第１の実施形態のようにして二次元コードを生成するか、第２の実施形態のようにして二次元コードを生成するかの何れかを行う。このように本実施形態は、第１及び第２の実施形態と、二次元コードに関する処理の一部が主として異なる。したがって、本実施形態において、第１及び第２の実施形態と同一の部分については、図１〜図１９に付した符号と同一の符号を付す等して詳細な説明を省略する。
【００５２】
交付文書生成装置の埋め込み情報生成部２０３は、図４のフローチャートのＳ４０２で、文字領域をパッキングした画像データを符号化した結果、コード（情報量）が、所定値以上であるか否かを判定する。所定値は、例えば、２次元コードで符号化できるコードの上限値である。所定値は、予め設定されていてもよいし、原稿画像データのサイズと文字領域のデータとのサイズとの差分に応じて動的に設定されてもよい。
この判定の結果、文字領域をパッキングした画像データのコードが所定値以上である場合には、図１２のＳ１２０２で説明したように、その画像データのパリティ値を計算して２次元コードに変換する。一方、文字領域をパッキングした画像データのコードが所定値以上でない場合には、図４のステップＳ４０２のように、当該符号化した画像データを二次元コードに変換する。このとき、埋め込み情報生成部２０３は、二次元コードが、画像データによるものか、それともパリティによるものかを示すフラグの情報を二次元コードに付加する。
【００５３】
交付文書確認装置は、改ざんを検出する対象の交付文書画像データに含まれている２次元コードを復号したときに、前記フラグの内容を参照し、当該二次元コードが、画像データによるものか、それともパリティによるものかを判定する。この判定の結果、二次元コードが画像データによるものである場合には、図１０のステップＳ１００２以降の処理を行う。一方、二次元コードがパリティによるものである場合には、図１９のステップＳ１９０２以降の処理を行う。
【００５４】
ここで、図２０のフローチャートを参照しながら、交付文書生成装置の埋め込み情報生成部２０３の動作の一例を説明する。
まず、埋め込み情報生成部２０３は、文字領域判定部２０２で検索された全ての文字領域のみを含む画像データを生成する（ステップＳ２００１）。この処理は、図４のステップＳ４０１、図１２のステップＳ１２０１と同じである。
続いてステップＳ２００２において、埋め込み情報生成部２０３は、ステップＳ２００１で生成された画像データを符号化する（ステップＳ２００２）。この処理は、図４のステップＳ４０２と同じである。
【００５５】
続いて埋め込み情報生成部２０３は、ステップＳ２００２で画像データを符号化することにより得られたデータのサイズ（コードサイズ）が、所定値以上か否かを判定する（ステップＳ２００３）。
この判定の結果、コードサイズが所定値以上である場合、埋め込み情報生成部２０３は、ステップＳ２００１で生成された画像データの垂直パリティと水平パリティとを計算する（ステップＳ２００４）。この処理は、図１２のステップＳ１２０２と同じである。
【００５６】
続いて埋め込み情報生成部２０３は、埋め込み情報生成部２０３は、ステップＳ１２０２で計算された水平パリティ１３０１と垂直パリティ１３０２とを二次元コードに変換する（ステップＳ２００５）。この処理は、図１２のステップＳ１２００３と同じである。ただし、ステップＳ２００５では、埋め込み情報生成部２０３は、変換した二次元コードが、パリティによるものであることを示すフラグを当該二次元コードに付加する。
一方、ステップＳ２００３において、コードサイズが所定値以上である場合、埋め込み情報生成部２０３は、符号化した結果を二次元コードに変換する（ステップＳ２００６）。この処理は、図４のステップＳ４０３と同じである。ただし、ステップＳ２００６では、埋め込み情報生成部２０３は、変換した二次元コードが、画像によるものであることを示すフラグを当該二次元コードに付加する。
【００５７】
以上のように本実施形態では、原稿画像データの文字領域をパッキングした画像データを符号化したときのサイズ（情報量）に応じて、第１の実施形態のようにして二次元コードを生成するか、第２の実施形態のようにして二次元コードを生成するかを選択する。したがって、第１、第２の実施形態で説明した効果に加えて、原稿画像データに応じて二次元コードを適応的に選択することができるという効果が得られる。
尚、本実施形態においても、第１の実施形態で説明した変形例を採用することができる。
【００５８】
（本発明の他の実施形態）
前述した本発明の実施形態における画像形成装置、改ざん検出装置を構成する各手段、並びに画像形成方法の各ステップは、コンピュータのＲＡＭやＲＯＭなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
【００５９】
また、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
【００６０】
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム（実施形態では図４、９、１０、１２、１７、１９、２０に示すフローチャートに対応したプログラム）を、システムあるいは装置に直接、あるいは遠隔から供給するものを含む。そして、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
【００６１】
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【００６２】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、ＯＳに供給するスクリプトデータ等の形態であってもよい。
【００６３】
プログラムを供給するための記録媒体としては、例えば、フロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＭＯ、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷなどがある。また、磁気テープ、不揮発性のメモリカード、ＲＯＭ、ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−Ｒ）などもある。
【００６４】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
【００６５】
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるＷＷＷサーバも、本発明に含まれるものである。
【００６６】
また、本発明のプログラムを暗号化してＣＤ−ＲＯＭ等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【００６７】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているＯＳなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【００６８】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
【００６９】
尚、前述した各実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

【特許請求の範囲】
【請求項１】
文書データに含まれる文字情報を特定する特定手段と、
前記特定手段によって特定された文字情報の画像データを生成する生成手段と、
前記生成手段によって生成された画像データ、又は前記生成手段によって生成された画像データのパリティ値を二次元コードに変換する変換手段と、
前記変換手段によって変換された二次元コードと前記文書データとを合成した印刷物を印刷する印刷手段と、を備え、
前記生成手段によって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とする画像形成装置。
【請求項２】
前記生成手段によって生成された画像データのサイズが所定値以上であるか否かを判定する判定手段と、
前記判定手段により前記画像データのサイズが所定値以上であると判定された場合、前記画像データのパリティ値を計算する計算手段と、を更に備え、
前記変換手段は、前記計算手段により得られたパリティ値を前記二次元コードに変換することを特徴とする請求項１に記載の画像形成装置。
【請求項３】
前記変換手段は、前記判定手段により前記画像データのサイズが所定値以上であると判定された場合には、前記二次元コードが前記計算手段により計算されたパリティ値に基づくものであることを示す情報を当該二次元コードに含め、
前記判定手段により前記画像データのサイズが所定値以上でないと判定された場合には、前記二次元コードが前記生成手段により生成された画像データに基づくものであることを示す情報を当該二次元コードに含めることを特徴とする請求項２に記載の画像形成装置。
【請求項４】
前記生成手段は、複数の前記文字情報が相互に重ならないように、当該複数の文字情報を寄せ集めて前記文字情報の画像データを生成することを特徴とする請求項１又は２に記載の画像形成装置。
【請求項５】
請求項１〜４の何れか１項に記載の画像形成装置で印刷された印刷物の文字情報を特定する特定手段と、
前記印刷物に含まれる二次元コードを復号する復号手段と、
前記特定手段により特定された文字情報、又は前記特定手段により特定された文字情報のパリティ値と、前記復号手段により復号された前記二次元コードの情報とを比較した結果を用いて、前記印刷物の改ざんを検出する検出する検出手段と、
前記検出手段により検出された結果を報知する報知手段と、を備えることを特徴とする改ざん検出装置。
【請求項６】
前記検出手段は、前記特定手段により特定された文字情報、又は前記特定手段により特定された文字情報のパリティ値と、前記復号手段により復号された前記二次元コードの情報とを比較して、当該文字情報の改ざんを検出し、
前記報知手段は、前記検出手段により改ざんが検出された文字情報を報知することを特徴とする請求項５に記載の改ざん検出装置。
【請求項７】
文書データに含まれる文字情報を特定する特定ステップと、
前記特定ステップによって特定された文字情報の画像データを生成する生成ステップと、
前記生成ステップによって生成された画像データ、又は前記生成ステップによって生成された画像データのパリティ値を二次元コードに変換する変換ステップと、
前記変換ステップによって変換された二次元コードと前記文書データとを合成した印刷物を印刷する印刷ステップと、を備え、
前記生成ステップによって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とする画像形成方法。
【請求項８】
文書データに含まれる文字情報を特定する特定ステップと、
前記特定ステップによって特定された文字情報の画像データを生成する生成ステップと、
前記生成ステップによって生成された画像データ、又は前記生成ステップによって生成された画像データのパリティ値を二次元コードに変換する変換ステップと、
前記変換ステップによって変換された二次元コードと前記文書データとを合成した印刷物を印刷させるための処理を行う印刷ステップと、コンピュータに実行させ、
前記生成ステップによって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とするコンピュータプログラム。

【図１】