説明

画像形成装置、画像形成方法、及びコンピュータプログラム

【課題】 印刷物の改ざんを従来よりも正確に検出することができるようにする。
【解決手段】 原稿画像データ310から文字領域311a〜311fを抽出する。そして、抽出した文字領域311a〜311fが相互に重ならない範囲で可及的に小さなサイズになるように、それら文字領域311a〜311fをパッキングして画像データ501を生成する。この画像データ501を符号化して二次元コード801を生成し、原稿画像データ310と二次元コード801とを合成した交付文書画像データ800を印刷する。その後、交付文書画像データ800の改ざんを検出する場合、交付文書画像データ800から抽出した文字領域311と、二次元コード801を復号化することにより得られた画像データ501の文字領域とを比較する。そして、比較した結果に基づいて、交付文書画像データ800の改ざんを検出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像形成装置、画像形成方法、及びコンピュータプログラムに関し、特に、印刷物の改ざんを検出するために用いて好適なものである。
【背景技術】
【0002】
従来から、印刷物の原本に対する改ざんを検知するために、原本に関する付加情報を交付文書に付加して印刷出力する技術が開示されている。特許文献1では、原本となる文書画像の画像特徴量を交付文書に付加して(埋め込んで)印刷出力する。この特許文献1において交付文書の改ざんを検出する際には、交付文書から画像特徴量を計算する。そして、計算した画像特徴量と、交付文書に付加された画像特徴量とを比較し、比較した結果に基づいて原本の改ざんを検出する。
【0003】
また、特許文献2では、原本から文字コード情報をORC機能により取得し、当該文字コード情報から所定の演算で算出される認証値とレイアウト情報とを合わせた情報を、交付文書に付加して印刷出力する。この特許文献2において原本の改ざんを検出する際には、光学的に読み取った交付文書から、当該交付文書に付加された前記情報を取得する。その後、当該取得した情報からレイアウト情報を求め、求めたレイアウト情報に従って交付文書から文字列情報をOCR機能により取得する。その後、所定の演算で算出される認証値を、交付文書に付加された情報に含まれている元の認証値と比較し、比較した結果に基づいて、原本の改ざんを検出する。また、前述した情報を交付文書の印刷出力時に認証局に保管し、原本の改ざんの検出時に、当該情報を認証局に問い合わせ、問い合わせた情報に含まれる元の認証値と、前記所定の演算で算出される認証値とを比較することによっても原本の改ざんを検出できる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−264685号公報
【特許文献2】特開2004−13287号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、前述した従来の技術には、以下のような課題がある。
すなわち、特許文献1では、画像をブロック単位に分割し、当該ブロック毎の「(1)周波数スペクトル」、「(2)任意のフィルタ処理を行った結果の値」、「(3)ブロック画像中の白画素と黒画素との割合」の何れかを画像特徴量としている。しかしながら、前記画像特徴量は、いずれも文書の認証を行うための情報としては情報が少なすぎるか、情報のサイズが大きすぎるかの何れかとなる。このため、正しく文書の改ざんを検出することや、画像特徴量を交付文書に付加して印刷することが困難になる虞がある。また、交付文書にごみや汚れがついてしまうと画像特徴量が変わってしまうため、正しく文書の改ざんを検知することが困難になる虞がある。
【0006】
また、特許文献2では、OCRの読み取り精度等の問題により、改ざんが行われていなくても、交付文書を印刷するときのOCRの読み取り結果と、認証を行う際のOCRの読み取り結果とが異なる場合がある。したがって、正しく文書の改ざんを検出するのが困難になる虞がある。
【0007】
本発明は以上のような問題点に鑑みてなされたものであり、印刷物の改ざんを従来よりも正確に検出することができるようにすることを目的とする。
【課題を解決するための手段】
【0008】
本発明の画像形成装置は、文書データに含まれる文字情報を特定する特定手段と、前記特定手段によって特定された文字情報の画像データを生成する生成手段と、前記生成手段によって生成された画像データを二次元コードに変換する変換手段と、前記変換手段によって変換された二次元コードと前記文書データとを合成した印刷物を印刷する印刷手段と、を備え、前記生成手段によって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とする。
【発明の効果】
【0009】
本発明によれば、文書データに含まれる文字情報を、当該文書データよりも小さなサイズの画像データにし、当該画像データを二次元コードに変換して文書データに合成するようにした。したがって、印刷物の文字情報と、二次元コードに含まれる文字情報とを比較することによって、改ざんされる可能性が高い文字に係る情報の改ざんを従来よりも正確に検出することが可能になる。
【図面の簡単な説明】
【0010】
【図1】文書管理システムの一例を概念的に示す図である。
【図2】交付文書生成装置、交付文書確認装置の構成の一例を示すブロック図である。
【図3】文字領域を検索する様子の一例を概念的に示す図である。
【図4】交付文書生成装置の埋め込み情報生成部の動作の一例を説明するフローチャートである。
【図5】ステップS401の処理で生成される画像データの一例を示す図である。
【図6】ステップS401の処理の一例を詳細に説明するフローチャートである。
【図7】図6のフローチャートの処理によって画像データを形成する様子の一例を概念的に示す図である。
【図8】原稿画像データと二次元コードとが合成された交付文書画像データの一例を示す図である。
【図9】交付文書確認装置の動作の一例を説明するフローチャートである。
【図10】ステップS903における改ざん検出部の詳細な動作の一例を説明するフローチャートである。
【図11】交付文書の改ざんの有無を検出する際の画像データの様子の一例を概念的に示す図である。
【図12】交付文書生成装置の埋め込み情報生成部の動作の一例を説明するフローチャートである。
【図13】水平パリティと垂直パリティの一例を概念的に示す図である。
【図14】原本画像データと、原本画像データの文字領域をパッキングすることにより得られる画像データの一例を示す図である。
【図15】図14(B)に示した画像データから得られる垂直パリティ及び水平パリティの一例を概念的に示す図である。
【図16】交付文書確認装置の構成の一例を示すブロック図である。
【図17】交付文書確認装置の動作の一例を説明するフローチャートである。
【図18】文字領域に関する情報の一例を示す図である。
【図19】ステップS1705の詳細な動作の一例を説明するフローチャートである。
【図20】交付文書生成装置の埋め込み情報生成部の動作の一例を説明するフローチャートである。
【発明を実施するための形態】
【0011】
(第1の実施形態)
以下、図面を参照しながら、本発明の第1の実施形態を説明する。
図1は、文書管理システムの一例を概念的に示す図である。
図1において、文書管理システムは、交付文書生成装置100と交付文書確認装置110とを有する。
文書交付者101は交付文書生成装置100を操作することで、原本102から、改ざんを検出することができる交付文書103を得る。文書交付者101は、交付文書103を文書受領者104に渡す。しかし、文書受領者104が受け取る交付文書103は、文書改ざん者105によって改ざんされることもあり得る。そのため、文書受領者104は、受け取った交付文書103を交付文書確認装置110に読み込ませることにより、受領した交付文書103に対して改ざんがなされていないことを確認する。
【0012】
続いて、交付文書生成装置100と交付文書確認装置110の構成の一例を説明する。
図2(A)は、交付文書生成装置100の構成の一例を示すブロック図である。図2(B)は、交付文書確認装置110の構成の一例を示すブロック図である。尚、図2(A)及び図2(B)において、本質的に同じ機能を持つブロックについては同じ符号を付与している。
【0013】
まず、図2(A)に示す交付文書生成装置100の構成の一例について説明する。交付文書生成装置100は、例えば、MFPにより実現できる。ただし、交付文書生成装置100はMFPに限定されない。例えば、パーソナルコンピュータと、スキャナと、プリンタとを用いることにより、交付文書生成装置100を実現できる。
【0014】
文書読み取り部201は、スキャナを備え、入力された原稿画像(原本102)を光学的に走査することで電子的な原稿画像データを形成する。文字領域判定部202は、文書読み取り部201で形成された原稿画像データから、文字情報を含む文字領域を検索する。本実施形態では、矩形状の領域を文字領域とする。
埋め込み情報生成部203は、文字領域判定部202で検索された文字領域の情報から、交付文書103に付加する二次元コードを生成する。画像合成部204は、文書読み取り部201で形成された原稿画像データと、埋め込み情報生成部203で生成された二次元コードとを合成して交付文書103の画像データを生成する。画像出力部205は、プリンタエンジンを備え、画像合成部204で生成された交付文書103の画像データを紙に印刷する。
【0015】
次に、図2(B)に示す交付文書確認装置110の構成の一例について説明する。交付文書確認装置110は、例えば、MFPにより実現できる。ただし、交付文書確認装置110はMFPに限定されない。例えば、パーソナルコンピュータと、スキャナと、プリンタとを用いることにより、交付文書確認装置110を実現できる。
【0016】
交付文書確認装置110の文書読み取り部201は、スキャナを備え、交付文書103を光学的に走査することでその情報を読み取り、電子的な交付文書画像データを形成する。文字領域判定部202は、文書読み取り部201で形成された交付文書画像データから文字領域を検索する。改ざん検出部206は、文書読み取り部201で形成された交付文書画像データと、文字領域判定部202で検索された文字領域の情報とから、改ざんされた領域を検出する。出力部207は、コンピュータディスプレイを備え、改ざん検出部206で検出された結果を表示する。
【0017】
続いて、文字領域判定部202の動作の一例を詳細に説明する。
文字領域判定部202は、文書読み取り部201により形成された原稿画像データから、文字が含まれている文字領域を矩形状の領域として全て検索する。本実施形態では、文字領域判定部202は、ヒストグラムを用いた方法で文字領域を検索するものとする。
図3は、文字領域を検索する様子の一例を概念的に示す図である。
図3において、300は、文字領域判定部202で文字領域を判定する原稿画像データである。310は、文字領域が判定された原稿画像データである。311a〜311fは、検索された文字領域である。これら検索された文字領域311a〜311fは、例えば、検索された各文字領域311a〜311fの左上の座標値と、幅と、高さとによって表現される。ここで、検索された各文字領域311a〜311fの左上の座標値は、原稿画像データ310の左上を原点とする座標値であるものとする。尚、以下の説明では、文字領域311a〜311fを区別しない場合には、これらを文字領域311と称する。
【0018】
続いて、図4のフローチャートを参照しながら、交付文書生成装置100の埋め込み情報生成部203の動作の一例を説明する。
まず、埋め込み情報生成部203は、文字領域判定部202で検索された文字領域311のみを含む画像データを全ての文字領域311のそれぞれについて生成する(ステップS401)。尚、ステップS401で生成される画像データのサイズ(縦横の大きさ)は、文書読み取り部201で形成された原稿画像データ300のサイズよりも小さい。このステップS401の処理についての詳細は後述する。
【0019】
続いて埋め込み情報生成部203は、ステップS401で生成された画像データを符号化する(ステップS402)。ステップS402で行われる符号化は、ステップS401で生成された画像データを圧縮する可逆変換が可能な符号化が好ましい。例えば、ステップS402では、PNGやTIFF形式の符号化を利用できる。
続いて埋め込み情報生成部203は、符号化した結果を二次元コードに変換する(ステップS403)。ここで二次元コードとは、符号化した結果を紙面上に印刷できる形式であればよい。例えば、ステップS403では、ベリコード(登録商標)やQRコード(登録商標)、CPコード等のコードを使用することが可能である。
【0020】
次に、図5及び図7と、図6のフローチャートを参照しながら、図4のステップS401の処理の一例を詳細に説明する。図5は、図4のステップS401の処理で生成される画像データの一例を示す図である。図7は、図6のフローチャートの処理によって画像データを形成する様子の一例を概念的に示す図である。
埋め込み情報生成部203は、図3に示した原稿画像データ300から、図5に示す画像データ501をステップS401で形成する。
【0021】
図6において、まず、埋め込み情報生成部203は、文字領域判定部202で検索された全ての文字領域311のそれぞれを、各々他の文字領域311と重ならないように左詰めしたときの各文字領域311の座標値(X,Y)を計算する(ステップS601)。各文字領域311を左詰めしたときの原稿画像データ310の様子は、図7の真ん中の図のようになる。
続いて埋め込み情報生成部203は、ステップS601で計算した座標値から、左詰した各文字領域311のそれぞれを、各々他の文字領域と重ならないように上詰めしたときの各文字領域311の座標値(X,Y)を計算する(ステップS602)。左詰した各文字領域311を上詰めしたときの様子は、図7の右側の図のようになる。
【0022】
最後に、埋め込み情報生成部203は、ステップS602で計算した座標値に配置した全ての文字領域311の画像をコピーして、図5に示す画像データ501を生成する(ステップS603)。尚、ステップS603で生成される画像データ501のサイズ(縦横の大きさ)は、ステップS602で計算した座標値と、それぞれの文字領域311自体のサイズとから計算される。本実施形態では、画像データ501は、全ての文字領域311を包含するサイズを有する矩形状の画像のデータであり、そのそれぞれのピクセルは全て白で初期化されているものとする。
【0023】
以上のようなステップS401の処理が行われた後、前述したようにしてステップS402、S403の処理が行われることにより、埋め込み情報生成部203で二次元コードが生成される。画像合成部204は、この二次元コードと、文書読み取り部201で形成された原稿画像データ300とを合成する。図8は、原稿画像データ300と二次元コードとが合成された交付文書画像データの一例を示す図である。画像合成部204は、原稿画像データ300から二次元コードを置くことが可能な空白領域を検索し、検索した空白領域に二次元コードを合成することができる。また、画像合成部204は、原稿画像データ300の予め定められた領域に二次元コードを合成してもよい。予め二次元コードを合成する領域を定める場合には、文字が記載されていない領域を設定する必要がある。図8に示すように、交付文書画像データ800には、埋め込み情報生成部203によって生成された二次元コード801が含まれる。
【0024】
続いて、図9のフローチャートを参照しながら、交付文書確認装置110の動作の一例を説明する。
まず、交付文書確認装置110の文書読み取り部201は、改ざんを検出する対象の交付文書(紙文書)を光学的に走査することでその情報を読み取り、電子的な交付文書画像データ800を形成する(ステップS901)。
続いて交付文書確認装置110の文字領域判定部202は、ステップS901で形成した交付文書画像データ800の文字領域を検索する(ステップS902)。
【0025】
続いて改ざん検出部206は、文書読み取り部201で形成された交付文書画像データ800から二次元コード801を抽出し、抽出した二次元コードを復号する。そして、改ざん検出部206は、二次元コード801を復号することにより得られた画像データ501と、ステップS902で検索された各々の文字領域とを比較することで交付文書の改ざんを検出する(ステップS903)。このステップS903における交付文書確認装置110の動作についての詳細は後述する。
最後に交付文書確認装置の出力部207は、改ざん検出部206における改ざん検出の結果を出力(表示)する(ステップS904)。このステップS904における出力部207の動作についての詳細も後述する。
【0026】
続いて、図10のフローチャートを参照しながら、図9のステップS903における改ざん検出部206の詳細な動作の一例を説明する。
まず、改ざん検出部206は、文書読み取り部201で形成された交付文書画像データ800から二次元コード801を検出する。その後、改ざん検出部206は、交付文書生成装置100の埋め込み情報生成部203で生成された「文字領域311を含む二次元コード801」を復号する(ステップS1001)。
【0027】
続いて改ざん検出部206は、文字領域判定部202で検索された複数の文字領域311から、未処理の文字領域を1つ選択する(ステップS1002)。
続いて改ざん検出部206は、ステップS1001で二次元コード801を復号することにより得られた画像データ501から、ステップS1002で選択した文字領域を、パターンマッチングにより検索する(ステップS1003)。例えば、二次元コード801を復号することにより得られた画像データ501の文字領域と、ステップS1002で選択した文字領域との各文字の特徴量を辞書と比較することによりステップS1003の検索を行うことができる。また、二次元コード801を復号することにより得られた画像データ501の文字領域の特徴量と、ステップS1002で選択した文字領域の特徴量との類似度によりステップS1003の検索を行うこともできる。
続いて改ざん検出部206は、ステップS1001で二次元コード801を復号することにより得られた画像データ501から、ステップS1002で選択した文字領域が検出されたか否かを判定する。
【0028】
この判定の結果、ステップS1001で二次元コード801を復号することにより得られた画像データ501から、ステップS1002で選択した文字領域が検出された場合には、ステップS1006に進む。そして、改ざん検出部206は、画像データ501上の「ステップS1002で選択された文字領域と合致(マッチ)した領域」を白で塗りつぶす(ステップS1006)。そして、後述するステップS1007に進む。
一方、ステップS1001で二次元コード801を復号することにより得られた画像データ501から、ステップS1002で選択した文字領域が検出されなかった場合には、ステップS1005に進む。そして、改ざん検出部206は、ステップS1002で選択した文字領域に対して、ステップS1001で二次元コード801を復号することにより得られた画像データ501から当該文字領域を検出できなかったことを示すフラグを設定する。上記処理を、交付文書確認装置110の文字領域判定部202で検出された文字領域すべてに対して行う。そして、ステップS1007に進む。
【0029】
ステップS1007に進むと、改ざん検出部206は、文字領域判定部202で検索された複数の文字領域311の全てについて、ステップS1002以降の処理を行ったか否かを判定する。この判定の結果、文字領域判定部202で検索された複数の文字領域311の全てについて処理を行っていない場合には、ステップS1002に戻り、複数の文字領域311の全てについて処理を行うまで、ステップS1002〜S1007の処理を繰り返し行う。そして、複数の文字領域311の全てについて処理が終了すると、図10のフローチャートによる処理を終了する。
【0030】
ここで、改ざん検出部206の具体的な動作について例示する。図11は、交付文書の改ざんの有無を検出する際の画像データの様子の一例を概念的に示す図である。図11では、文書受領者104が交付文書画像データ1100(交付文書)を受け取ったと仮定する。ここで交付文書画像データ1100は、交付文書生成装置100が出力した交付文書画像データ800(図8を参照)を改ざんしたものであり、原本では“\20000”だった文字列が“\30000”に改ざんされている。また、図11では、交付文書画像データ1100に付与された二次元コードを復号した画像データ501を交付文書画像データ1100の下に示す。
【0031】
まず、改ざん検出部206は、“商品コード”という文字領域811aを選択する。“商品コード”という文字領域811aの画像は、二次元コード801の復号により得られた画像データ501の文字領域501aの画像とマッチする。したがって、画像データ501の文字領域501aは白で塗りつぶされる(図11の上段の左から3番目の画像データ501を参照)。以下、“0123”、“\30000”、“になります“、”株式会社○○○○“、”TEL XXX−XXXX−XXXX“という文字領域811b〜811fに対して同様の処理を行う。ここで、画像データ501に”\30000“という文字領域が存在しない。したがって、交付文書画像データ1100の”¥30000“という文字領域811cを選択したときには、”\30000“という文字領域811cに対して前述したフラグが設定される。図11において、”\30000“に付されている網がけは、このフラグが設定されていることを概念的に示している。以上のようにして改ざん検出部206が、交付文書画像データ1100の全ての文字領域について、画像データ501の文字領域とのパターンマッチングを終えると、図11の下段の右端のような状態になる。
【0032】
改ざん検出部206の検出結果は以下の3つの種類に分類できる。
(1)全ての文字領域311、811に対してフラグが設定されず、パターンマッチングを行った後の画像データ501が全て白である。
この場合、改ざん検出部206は、交付文書画像データ800の改ざんが行われていると判断する。したがって、出力部207は、改ざんが行われていない旨のメッセージを、交付文書確認装置110が備えるディスプレイに例えばGUIとして表示する。
【0033】
(2)文字領域811の少なくとも何れか1つに対してフラグが設定されている。
この場合、改ざん検出部206は、フラグが設定されている文字領域811が別の文字に改ざんされていると判断する。したがって、出力部207は、交付文書が改ざんされている旨のメッセージを、交付文書確認装置110が備えるディスプレイに例えばGUIとして表示する。このとき、出力部207は、図11の下段の右端のような画像を表示して、どの文字列が改ざんされているかを、文書受領者104に視覚的に分かり易く表示してもよい。或いは、出力部207は、交付文書が改ざんされている旨のメッセージを用紙上に印刷してもよい。
【0034】
(3)文字領域811に対してフラグは設定されていないが、パターンマッチングを行った後の画像データ501が全て白ではない。
この場合、改ざん検出部206は、交付文書画像データ800の一部の文字列が消去されていると判断する。したがって、出力部207は、交付文書が改ざんされている旨のメッセージを、交付文書確認装置110が備えるディスプレイに例えばGUIとして表示する。このとき、出力部207は、パターンマッチングを行った後の画像データ501を表示することで、どのような文字列が消去されたかを文書受領者104に通知してもよい。
【0035】
以上のように本実施形態では、原稿画像データ310から文字領域311a〜311fを特定する。そして、特定した文字領域311a〜311fが相互に重ならない範囲で可及的に小さなサイズになるように、それら文字領域311a〜311fをパッキングして画像データ501を生成する。この画像データ501を符号化して二次元コード801を生成し、原稿画像データ310と二次元コード801とを合成した交付文書画像データ800を印刷する。その後、交付文書画像データ800の改ざんを検出する場合、交付文書画像データ800から特定した文字領域311と、二次元コード801を復号化することにより得られた画像データ501の文字領域とを比較する。そして、比較した結果に基づいて、交付文書画像データ800の改ざんを検出する。
【0036】
したがって、改ざんされてしまう可能性が高い文字に係る情報の改ざんを従来よりも正確に検出することができる。交付文書の文字情報を可及的にコンパクトなサイズにパッキングして改ざんの検出に利用することができ、従来よりも改ざんを検出するのに適した情報量のデータで交付文書画像データ800の改ざんを検出することができる。また、本実施形態では、文字認識を行う。したがって、交付文書にごみや汚れがついていたとしても、改ざんを検出するために交付文書が読み取る情報の誤認識を従来よりも抑制することができる。また、OCR処理のような高い読み取り精度が要求される処理を行う必要がないので、改ざんを検出するために交付文書が読み取る情報の誤認識を従来よりも抑制することができる。以上のことから、本実施形態では、印刷物の改ざんを従来よりも正確に検出することができる。
【0037】
また、交付文書画像データ800の改ざんを検出した場合には、どの文字列が改ざんされているのかを報知するようにしたので、交付文書画像データ800のどの文字領域311が改ざんされたかを文書受領者104に知らせることが可能となる。
また、前述したように、原稿画像データ310から抽出した文字領域311a〜311fが相互に重ならない範囲で可及的に小さなサイズになるように、それら文字領域311a〜311fをパッキングして画像データ501を生成する。したがって、画像データ501を復号化するときの展開メモリのサイズを小さくすることができる。また、交付文書画像データ800から抽出した文字領域311と、二次元コード801を復号化することにより得られた画像データ501の文字領域とを比較すること(パターンマッチング)を高速に行うことができる。
【0038】
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。前述した第1の実施形態では、原稿画像データ300の文字領域311をパッキングした画像データ501を符号化した二次元コード801を原稿画像データ300と合成して交付文書画像データ800を生成した。しかしながら、このようにすると、紙面に大量の文字列がある原稿である場合、原稿画像データ300に埋め込む情報が、当該原稿画像データ300に埋められるように十分に小さくならない可能性が残る。そこで、本実施形態では、この課題をより確実に解決するため、原稿画像データ300の文字領域311をパッキングした画像データのパリティ情報を符号化して交付文書データに付与する。
【0039】
このように、本実施形態と第1の実施形態とは、交付文書データに付与する情報が主として異なる。したがって、本実施形態の説明において、第1の実施形態と同一の部分については、図1〜図11に付した符号と同一の符号を付す等して詳細な説明を省略する。例えば、本実施形態における交付文書生成装置の構成は、第1の実施形態における交付文書生成装置100と同じであるが、埋め込み情報生成部203の動作が異なる。
【0040】
まず、図12のフローチャートを参照しながら、交付文書生成装置の埋め込み情報生成部203の動作の一例を説明する。
まず、埋め込み情報生成部203は、文字領域判定部202で検索された全ての文字領域311のみを含む画像データを生成する(ステップS1201)。第1の実施形態と同様に、ステップS1201で生成される画像データのサイズ(縦横の大きさ)は、文書読み取り部201で形成された原稿画像データ300のサイズよりも小さい。この画像データを生成する方法は、第1の実施形態で説明したのと同じである(図6及び図7を参照)。
【0041】
続いて埋め込み情報生成部203は、ステップS1201で生成された画像データの垂直パリティと水平パリティとを計算する(ステップS1202)。ここで水平パリティとは、画像の水平方向の各ラインに対して、白以外のピクセルの個数が偶数なのか奇数なのかを示す情報である。垂直パリティとは、画像の垂直方向の各ラインに対して、白以外のピクセルの個数が偶数なのか奇数なのかを示す情報である。図13は、水平パリティと垂直パリティの一例を概念的に示す図である。図13において、例えば、水平方向の1行目には白以外のピクセルの個数が3個であるため奇数を示す0の水平パリティが与えられる。一方、水平方向の3行目には白以外のピクセルの個数が6個であるため偶数を示す1の水平パリティが与えられる。このようなステップS1202の処理が実行されることで、図13に示すような水平パリティ1301及び垂直パリティ1302を得ることができる。
【0042】
続いて埋め込み情報生成部203は、ステップS1202で計算された水平パリティ1301と垂直パリティ1302とを二次元コードに変換する(ステップS1203)。
ここで、埋め込み情報生成部203の具体的な動作について例示する。図14(A)は、原本画像データの一例を示す図である。図14(B)は、原本画像データの文字領域をパッキングすることにより得られる画像データの一例を示す図である。また、図15は、図14(B)に示した画像データから得られる垂直パリティ及び水平パリティの一例を概念的に示す図である。
図14(A)に示す原稿画像データ1401に対してステップS1201の処理を行うことにより図14(B)に示す画像データ1402が生成される。
埋め込み情報生成部203は、画像データ1402から、水平パリティ1501と垂直パリティ1502とを計算する。その後埋め込み情報生成部203は、計算した水平パリティ1501及び垂直パリティ1502を二次元符号コードに変換する。
【0043】
続いて本実施形態における交付文書確認装置の一例について説明する。
図16は、交付文書確認装置の構成の一例を示すブロック図である。尚、図16において、これまでに説明した機能と本質的に同じ機能を持つブロックについては、これまでに示した符号と同じ符号を付している。
図16において、交付文書確認装置1601は、文書読み取り部201と、文字領域判定部202と、埋め込み情報生成部203と、改ざん検出部206と、出力部207とを有している。
【0044】
次に、図17のフローチャートを参照しながら、交付文書確認装置1601の動作の一例を説明する。
交付文書確認装置1601の文書読み取り部201は、改ざんを検出する対象の交付文書(紙文書)を光学的に走査することでその情報を読み取り、電子的な交付文書画像データを形成する(ステップS1701)。
続いて交付文書確認装置1601の文字領域判定部202は、ステップS1701で形成した交付文書画像データに含まれている文字領域を検索する(ステップS1702)。
【0045】
続いて交付文書確認装置1601の埋め込み情報生成部203は、ステップS1702で検索された文字領域のみを含む画像データを生成する(ステップS1703)。ここで交付文書確認装置1601は、交付文書生成装置の埋め込み情報生成部203が、図12のステップS1201で行った方法と同じ方法で、ステップS1702で検索された文字領域のみを含む画像データを生成する。
また、埋め込み情報生成部203は、交付文書画像データ上の文字領域の位置(文字領域の元の位置)と、文字領域のみを含む画像データ上の文字領域の位置(文字領域の移動後の位置)と、当該文字領域の高さ及び幅の情報を文字領域毎に出力する。
図18は、文字領域に関する情報の一例を示す図である。
図18に示すように、埋め込み情報生成部203は、文字領域に含まれる文字列1801と、文字領域の元の位置1902と、文字領域の移動後の位置1903と、文字領域の高さ1904及び幅1905とが相互に対応付けられた情報を文字領域毎に出力する。
【0046】
続いて交付文書確認装置1601の埋め込み情報生成部203は、ステップS1703で生成された画像データの垂直パリティと水平パリティとを計算する(ステップS1704)。
続いて交付文書確認装置1601の改ざん検出部206は、交付文書画像データの改ざんを検出する(ステップS1705)。このステップS1705の処理についての詳細は後述する。
最後に交付文書確認装置1601の出力部207は、ステップS1705で行われた改ざん検出の結果を出力(表示)する(ステップS1706)。
【0047】
続いて、図19のフローチャートを参照しながら、図16のステップS1705における改ざん検出部206の詳細な動作の一例を説明する。
まず、改ざん検出部206は、ステップS1701で形成された交付文書画像データに含まれる二次元コードを復号して、交付文書生成装置で計算されたパリティの情報を得る(ステップS1901)。
続いて改ざん検出部206は、交付文書確認装置1601の埋め込み情報生成部203で計算されたパリティの情報(ステップS1704で計算されたパリティの情報)と、ステップS1901で復号したパリティの情報とを比較する。この結果、改ざん検出部206は、垂直パリティと水平パリティとが共に異なるピクセルは1、それ以外は0の値を持つ二値のビットマップを形成する(ステップS1702)。尚、ビットマップの内容は必ずしもこのようにする必要はない。例えば、垂直パリティと水平パリティとが共に異なるピクセルを0、それ以外を1としてもよい。
【0048】
続いて改ざん検出部206は、交付文書確認装置1601の埋め込み情報生成部203から出力された、文字領域に関する情報(図18を参照)を用いて、文字領域毎に値が1のピクセルの個数を計上する。そして、改ざん検出部206は、計上したピクセル数を用いて、文字領域毎に改ざん有無を判定する。ここでは、文字領域内のピクセル数が予め設定された閾値以上であるならば、当該文字領域は改ざんされていると判定することができる。ただし、ここでの判定は、このようなものに限定されない。例えば、文字領域の大きさと計上されたピクセル数との比が予め設定された閾値以上であるならば、当該文字領域は改ざんされたと判定してもよい。
【0049】
以上のように検出された結果は、出力部207によって文書受領者104に通知される。出力部207は、例えば、交付文書画像上で、改ざんされたと判断された文字領域を視覚的に分かり易いように修飾し、修飾された交付文書画像をユーザインタフェースに表示することができる。ただし、改ざんを検出した結果を報知する方法は、このようなものに限定されない。例えは、出力部207は、改ざんされた文字領域が修飾された交付文書画像を紙面上に印刷してもよい。
【0050】
以上のように本実施形態では、原稿画像データ1401の文字領域をパッキングした画像データ1402の水平パリティ1501及び垂直パリティ1502(パリティ値)を符号化した二次元コードを生成するようにした。したがって、第1の実施形態で説明した効果に加えて、例えば、原稿画像データ1401に埋め込む情報を第1の実施形態よりも小さくすることができるという効果が得られる。これにより、例えば、紙面に大量の文字列がある原稿である場合であっても、第1の実施形態よりも確実に、二次元コードを原稿画像データ1401に埋め込むことができる。
尚、本実施形態においても、第1の実施形態で説明した変形例を採用することができる。
【0051】
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。本実施形態では、原稿画像データの文字領域をパッキングした画像データを符号化したときのサイズ(情報量)と所定値との比較結果に応じて、画像データを符号化した二次元コードと、パリティ値を符号化した二次元コードとの何れかを生成する。すなわち、本実施形態では、原稿画像データの文字領域をパッキングした画像データを符号化したときのサイズ(情報量)に応じて、第1の実施形態のようにして二次元コードを生成するか、第2の実施形態のようにして二次元コードを生成するかの何れかを行う。このように本実施形態は、第1及び第2の実施形態と、二次元コードに関する処理の一部が主として異なる。したがって、本実施形態において、第1及び第2の実施形態と同一の部分については、図1〜図19に付した符号と同一の符号を付す等して詳細な説明を省略する。
【0052】
交付文書生成装置の埋め込み情報生成部203は、図4のフローチャートのS402で、文字領域をパッキングした画像データを符号化した結果、コード(情報量)が、所定値以上であるか否かを判定する。所定値は、例えば、2次元コードで符号化できるコードの上限値である。所定値は、予め設定されていてもよいし、原稿画像データのサイズと文字領域のデータとのサイズとの差分に応じて動的に設定されてもよい。
この判定の結果、文字領域をパッキングした画像データのコードが所定値以上である場合には、図12のS1202で説明したように、その画像データのパリティ値を計算して2次元コードに変換する。一方、文字領域をパッキングした画像データのコードが所定値以上でない場合には、図4のステップS402のように、当該符号化した画像データを二次元コードに変換する。このとき、埋め込み情報生成部203は、二次元コードが、画像データによるものか、それともパリティによるものかを示すフラグの情報を二次元コードに付加する。
【0053】
交付文書確認装置は、改ざんを検出する対象の交付文書画像データに含まれている2次元コードを復号したときに、前記フラグの内容を参照し、当該二次元コードが、画像データによるものか、それともパリティによるものかを判定する。この判定の結果、二次元コードが画像データによるものである場合には、図10のステップS1002以降の処理を行う。一方、二次元コードがパリティによるものである場合には、図19のステップS1902以降の処理を行う。
【0054】
ここで、図20のフローチャートを参照しながら、交付文書生成装置の埋め込み情報生成部203の動作の一例を説明する。
まず、埋め込み情報生成部203は、文字領域判定部202で検索された全ての文字領域のみを含む画像データを生成する(ステップS2001)。この処理は、図4のステップS401、図12のステップS1201と同じである。
続いてステップS2002において、埋め込み情報生成部203は、ステップS2001で生成された画像データを符号化する(ステップS2002)。この処理は、図4のステップS402と同じである。
【0055】
続いて埋め込み情報生成部203は、ステップS2002で画像データを符号化することにより得られたデータのサイズ(コードサイズ)が、所定値以上か否かを判定する(ステップS2003)。
この判定の結果、コードサイズが所定値以上である場合、埋め込み情報生成部203は、ステップS2001で生成された画像データの垂直パリティと水平パリティとを計算する(ステップS2004)。この処理は、図12のステップS1202と同じである。
【0056】
続いて埋め込み情報生成部203は、埋め込み情報生成部203は、ステップS1202で計算された水平パリティ1301と垂直パリティ1302とを二次元コードに変換する(ステップS2005)。この処理は、図12のステップS12003と同じである。ただし、ステップS2005では、埋め込み情報生成部203は、変換した二次元コードが、パリティによるものであることを示すフラグを当該二次元コードに付加する。
一方、ステップS2003において、コードサイズが所定値以上である場合、埋め込み情報生成部203は、符号化した結果を二次元コードに変換する(ステップS2006)。この処理は、図4のステップS403と同じである。ただし、ステップS2006では、埋め込み情報生成部203は、変換した二次元コードが、画像によるものであることを示すフラグを当該二次元コードに付加する。
【0057】
以上のように本実施形態では、原稿画像データの文字領域をパッキングした画像データを符号化したときのサイズ(情報量)に応じて、第1の実施形態のようにして二次元コードを生成するか、第2の実施形態のようにして二次元コードを生成するかを選択する。したがって、第1、第2の実施形態で説明した効果に加えて、原稿画像データに応じて二次元コードを適応的に選択することができるという効果が得られる。
尚、本実施形態においても、第1の実施形態で説明した変形例を採用することができる。
【0058】
(本発明の他の実施形態)
前述した本発明の実施形態における画像形成装置、改ざん検出装置を構成する各手段、並びに画像形成方法の各ステップは、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
【0059】
また、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
【0060】
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図4、9、10、12、17、19、20に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接、あるいは遠隔から供給するものを含む。そして、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
【0061】
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0062】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
【0063】
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。
【0064】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
【0065】
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0066】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0067】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0068】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
【0069】
尚、前述した各実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

【特許請求の範囲】
【請求項1】
文書データに含まれる文字情報を特定する特定手段と、
前記特定手段によって特定された文字情報の画像データを生成する生成手段と、
前記生成手段によって生成された画像データ、又は前記生成手段によって生成された画像データのパリティ値を二次元コードに変換する変換手段と、
前記変換手段によって変換された二次元コードと前記文書データとを合成した印刷物を印刷する印刷手段と、を備え、
前記生成手段によって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とする画像形成装置。
【請求項2】
前記生成手段によって生成された画像データのサイズが所定値以上であるか否かを判定する判定手段と、
前記判定手段により前記画像データのサイズが所定値以上であると判定された場合、前記画像データのパリティ値を計算する計算手段と、を更に備え、
前記変換手段は、前記計算手段により得られたパリティ値を前記二次元コードに変換することを特徴とする請求項1に記載の画像形成装置。
【請求項3】
前記変換手段は、前記判定手段により前記画像データのサイズが所定値以上であると判定された場合には、前記二次元コードが前記計算手段により計算されたパリティ値に基づくものであることを示す情報を当該二次元コードに含め、
前記判定手段により前記画像データのサイズが所定値以上でないと判定された場合には、前記二次元コードが前記生成手段により生成された画像データに基づくものであることを示す情報を当該二次元コードに含めることを特徴とする請求項2に記載の画像形成装置。
【請求項4】
前記生成手段は、複数の前記文字情報が相互に重ならないように、当該複数の文字情報を寄せ集めて前記文字情報の画像データを生成することを特徴とする請求項1又は2に記載の画像形成装置。
【請求項5】
請求項1〜4の何れか1項に記載の画像形成装置で印刷された印刷物の文字情報を特定する特定手段と、
前記印刷物に含まれる二次元コードを復号する復号手段と、
前記特定手段により特定された文字情報、又は前記特定手段により特定された文字情報のパリティ値と、前記復号手段により復号された前記二次元コードの情報とを比較した結果を用いて、前記印刷物の改ざんを検出する検出する検出手段と、
前記検出手段により検出された結果を報知する報知手段と、を備えることを特徴とする改ざん検出装置。
【請求項6】
前記検出手段は、前記特定手段により特定された文字情報、又は前記特定手段により特定された文字情報のパリティ値と、前記復号手段により復号された前記二次元コードの情報とを比較して、当該文字情報の改ざんを検出し、
前記報知手段は、前記検出手段により改ざんが検出された文字情報を報知することを特徴とする請求項5に記載の改ざん検出装置。
【請求項7】
文書データに含まれる文字情報を特定する特定ステップと、
前記特定ステップによって特定された文字情報の画像データを生成する生成ステップと、
前記生成ステップによって生成された画像データ、又は前記生成ステップによって生成された画像データのパリティ値を二次元コードに変換する変換ステップと、
前記変換ステップによって変換された二次元コードと前記文書データとを合成した印刷物を印刷する印刷ステップと、を備え、
前記生成ステップによって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とする画像形成方法。
【請求項8】
文書データに含まれる文字情報を特定する特定ステップと、
前記特定ステップによって特定された文字情報の画像データを生成する生成ステップと、
前記生成ステップによって生成された画像データ、又は前記生成ステップによって生成された画像データのパリティ値を二次元コードに変換する変換ステップと、
前記変換ステップによって変換された二次元コードと前記文書データとを合成した印刷物を印刷させるための処理を行う印刷ステップと、コンピュータに実行させ、
前記生成ステップによって生成される画像データのサイズは、前記文書データの画像データのサイズよりも小さいことを特徴とするコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公開番号】特開2010−246027(P2010−246027A)
【公開日】平成22年10月28日(2010.10.28)
【国際特許分類】
【出願番号】特願2009−95124(P2009−95124)
【出願日】平成21年4月9日(2009.4.9)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】