文書検証システム、文書検証方法、文書検証プログラム及び記録媒体

【課題】インクのにじみ、トナーの飛び散り、印刷・スキャンの際の歪みや雑音等が発生しても、高い精度で文書の改ざんを検出する。
【解決手段】文書検証システム１１１は、透かしデータから、原文書データの複数の領域の特徴量を取得し、ｎ値化閾値の複数の候補を受け付け、検証対象文書の画像データの、前記原文書データの複数の領域と対応している複数の領域に含まれる画素の画素値を、ｎ値化閾値の複数の候補を使用してｎ値化し、ｎ値化された画素値に基づいて算出した比較用特徴量を取得し、対応する領域毎に、原文書データの特徴量との差が最も小さい比較用特徴量を確定特徴量とし、確定特徴量を取得する際に使用されたｎ値化閾値を、隣接する領域同士で比較し、比較した差が所定の値よりも大きい場合、当該領域において検証対象文書が改ざんされていると判断する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、文書検証システム、文書検証方法、文書検証プログラム及び記録媒体に関する。
【背景技術】
【０００２】
文書の特徴量を抽出し、その文書を、プリンタを用いて印刷する際に、抽出した特徴量を電子透かし等を用いて紙面に対して埋め込む技術が知られている。また、印刷された紙面をスキャンして、埋め込まれている電子透かし等から特徴量を読み取り、一方、スキャンされた画像から特徴量を読み取り、双方の特徴量を比較することによって、紙面の改ざん、偽造及び変造等を検知する技術が知られている。
【０００３】
特許文献１に記載された技術では、まず、透かし画像形成部は、文書画像を参照して、機密情報に基づいて透かし画像を作成する。次に、所定のフィルタを用いて、所定のシンボルを識別可能なドットパターンを埋め込む埋め込み領域を文書画像から算出し、埋め込み領域に対する文字領域の割合が所定の閾値以下であるか否かを判定する。埋め込み領域に対する文字領域の割合が所定の閾値以下である場合、文字領域と重ならない埋め込み領域に、少なくとも一部の機密情報を含むシンボルを識別可能なドットパターン（シンボルユニット）を、所定の数埋め込む。
特許文献１に記載された技術は、文書画像を参照し、文字領域に重ならない領域に機密情報を埋め込むため、元の文書に関わらず、確実に機密情報を埋め込むことができるとしている。
【０００４】
特許文献２に記載された技術では、印刷物の印刷内容の改ざん有無を判定する改ざん検出システムに、元画像が印刷された印刷物を読み取って作成された読み取り画像に変更を加えて、読み取り画像に各々異なる変更が加えられた複数の変更画像を作成する変更画像作成部と、複数の変更画像の各々の特徴量を計測する特徴量計測部と、元画像の特徴量と、各変更画像の特徴量との差分値を求める特徴量差分算出部と、特徴量差分算出部によって求められた値に基づいて読み取り画像が改ざんされているか否かを判定する判定部とを設けている。
特許文献２に記載された技術は、印刷前の画像の特徴量と印刷後の画像の特徴量とを用いて改ざん有無判定を適切に行うことが可能な改ざん検出システムおよび改ざん検出方法を提供できるものとしている。
【先行技術文献】
【特許文献】
【０００５】
【特許文献１】米国特許出願公開第２００５／００１８８４５号明細書（請求項１）
【特許文献２】特開２００６−２６１８２４号公報（請求項１）
【発明の概要】
【発明が解決しようとする課題】
【０００６】
しかしながら、前記したように、特許文献１に記載された技術では、埋め込み領域に対する文字領域の割合が所定の閾値以下であるか否かを判定し、埋め込み領域に対する文字領域の割合が所定の閾値以下である場合に処理を行うため、埋め込み領域に対する文字領域の割合が印刷後に変化しないことが要求される。ところが、家庭用インクジェットプリンタ等では、文書を印刷した場合にインクのにじみが発生し、埋め込み領域に対する文字領域の割合が大きくなる可能性がある。また、オフィス用のページプリンタでも、文書を印刷した場合にトナーの飛び散りが発生し、埋め込み領域に対する文字領域の割合が大きくなる可能性がある。
【０００７】
また、文書をスキャンする場合に、レンズ等の光学系によって発生するぼけの影響によって、埋め込み領域に対する文字領域の割合が変化する可能性がある。このため、印刷後の文書を再びスキャンし、紙面の改ざんを検知する場合、埋め込み領域に対する文字領域の割合が増大するため、改ざんされていない部分も改ざんであると検知されてしまう可能性があった。
さらに、ローラの回転に起因する歪みや雑音の混入により、文字領域が変化し、元の文書の特徴量とスキャン画像の特徴量との差が大きくなり、改ざんされていない部分も改ざんであると検知されてしまう可能性があった。また、スキャン画像を２値化する際、その２値化閾値の取り方によって文字領域が変化するため、元の文書の特徴量とスキャン画像の特徴量との差が大きくなり、改ざんされていない部分も改ざんであると検知されてしまう可能性があった。これらの誤検知を防ぐために改ざんであると判定する閾値を弱めると、改ざんされている文書を改ざんされていないと誤検知してしまう可能性があった。
【０００８】
特許文献２に記載された技術では、元画像が印刷された印刷物を読み取って作成された読み取り画像に変更を加えて、前記読み取り画像に各々異なる変更が加えられた複数の変更画像を作成する。そして、前記複数の変更画像の各々の特徴量を計測し、前記元画像の特徴量との差分値を求める。そして、最小の差分値と、改ざん検出のための閾値とを比較して、差分値が改ざん検出のための閾値よりも小さければその領域の画像は改ざんされていないと判定し、差分値が改ざん検出のための閾値以上であれば、改ざんされていると判定する。
しかし、複数の差分値と一つの改ざん検出のための閾値とをそれぞれ比較しているため、改ざんされた後の画像に対して変更を加えた結果、差分値が改ざん検出のための閾値よりも小さくなり、改ざんされているのに改ざんされていないと判定してしまう可能性があった。
以上述べたように、特許文献１、特許文献２によって開示された技術には、印刷媒体が改ざんされた場合に、改ざんされた事実が確認できない可能性があるという課題があった。
【０００９】
そこで、本発明は、インクのにじみ、トナーの飛び散り、スキャンの際の歪みや雑音等が発生しても、高い精度で文書の改ざんを検出することができるシステム等を提供することを目的とする。
【課題を解決するための手段】
【００１０】
本発明の文書検証システムは、原文書データが前記原文書データの複数の領域の特徴量を表す透かしデータとともに印刷用媒体に対して印刷された検証対象文書を読み取り、当該印刷された検証対象文書が改ざんされているか否かを検証する文書検証システムであって、前記透かしデータから、前記原文書データの複数の領域の特徴量を取得し、前記検証対象文書の画像データの画素値をｎ値化（ｎ≧２）するｎ値化閾値の複数の候補を受け付け、前記検証対象文書の画像データの、前記原文書データの複数の領域と対応している複数の領域に含まれる画素の画素値を、前記ｎ値化閾値の複数の候補を使用してｎ値化し、前記ｎ値化された画素値に基づいて算出した比較用特徴量を取得し、対応する領域毎に、前記取得した原文書データの特徴量と、前記比較用特徴量とを比較し、前記取得した原文書データの特徴量との差が最も小さい前記比較用特徴量を確定特徴量とし、前記確定特徴量を取得する際に使用された前記ｎ値化閾値の候補を、改ざん判別用ｎ値化閾値として、対応する領域毎に取得し、前記領域の前記改ざん判別用ｎ値化閾値を、隣接する領域の前記改ざん判別用ｎ値化閾値と比較し、比較した差が所定の値よりも大きい場合、当該領域において検証対象文書が改ざんされていると判断する。
【発明の効果】
【００１１】
本発明によれば、インクのにじみ、トナーの飛び散り、スキャンの際の歪みや雑音等が発生しても、高い精度で文書の改ざんを検出することができるシステム等を提供することが可能になる。
【図面の簡単な説明】
【００１２】
【図１】本実施形態に係る文書作成システムの構成例を示す図である。
【図２】本実施形態に係る文書検証システムの構成例を示す図である。
【図３】本実施形態に係る文書作成システム及び文書検証システムの各装置のハードウエア構成図である。
【図４】本実施形態に係る特徴量タイプテーブルの一例を示す図である。
【図５】（ａ）は、本実施形態に係る改ざん検出対象領域レコードの一例を示す図である。（ｂ）は、本実施形態に係る改ざん検出対象領域を説明する図である。
【図６】（ａ）は、本実施形態に係る重心利用タイプにおける重心の求め方を説明する図である。（ｂ）は、本実施形態に係る重心利用タイプにおける特徴量を説明する図である。
【図７】（ａ）は、本実施形態に係るラン数利用タイプを説明する図である。（ｂ）は、本実施形態に係る面積利用タイプを説明する図である。
【図８】（ａ）は、本実施形態に係る重心リストの一例を示す図である。（ｂ）は、本実施形態に係る文書特徴量のコンピュータ内部表現の一例を示す図である。
【図９】（ａ）は、本実施形態に係る領域規定情報の一例を示す図である。（ｂ）は、本実施形態に係る領域座標の模式図である。（ｃ）は、本実施形態に係る検証対象文書画像座標の模式図である。
【図１０】（ａ）及び（ｂ）は、本実施形態に係る内部補間処理の一例を示す図である。
【図１１】（ａ）〜（ｈ）は、本実施形態に係る改ざん文書に対する改ざん検出処理の一例を示す図である。
【図１２】（ａ）〜（ｈ）は、本実施形態に係る非改ざん文書に対する改ざん検出処理の一例を示す図である。
【図１３】本実施形態に係る特徴量データの一例を示す図である。
【図１４】本実施形態に係るルール改ざん検出結果データの一例を示す図である。
【図１５】本実施形態に係る文書作成処理手順のフローチャートである。
【図１６】本実施形態に係る文書作成処理手順のステップＳ４０５の詳細フローチャートである。
【図１７】本実施形態に係る文書検証処理手順のフローチャートである。
【図１８】本実施形態に係る文書検証処理手順のステップＳ６０６の詳細フローチャートである。
【図１９】本実施形態に係る文書検証処理手順のステップＳ６０７の詳細フローチャートである。
【図２０】本実施形態に係る文書検証処理手順のステップＳ６０９の詳細フローチャートである。
【図２１】本実施形態に係る文書検証処理手順のステップＳ６１０の詳細フローチャートである。
【図２２】本実施形態に係る改ざん検出結果画面の一例を示す図である。
【発明を実施するための形態】
【００１３】
以降、本発明を実施するための形態（「本実施形態」という）を、図等を参照しながら詳細に説明する。
【００１４】
（文書作成システム）
図１に沿って、文書作成システムを説明する。
文書作成システム１０１は、文書検証システム１１１（後記）が読み取る、透かしデータが埋め込まれた印刷文書を作成するシステムである。
文書作成システム１０１は、文書作成端末装置１０２、文書特徴量抽出装置１０３、透かしデータ作成装置１０４、地紋透かし埋込装置１０５及び改ざん検出対象データベース（ＤＢ）装置１０６を有する。これらの各装置１０２〜１０６は、ネットワーク１１０を介して相互に接続されている。
【００１５】
文書作成端末装置１０２は、文書データを受け付け、その文書データとともに、その文書データの特徴を現す文書特徴量を透かしデータとして印刷媒体に印刷する。
文書特徴量抽出装置１０３は、文書データの文書特徴量を抽出する。文書特徴量とは、文書データ全体の特徴を表す量であって、特徴量タイプ、特徴量が取得されている領域、その領域の数、領域毎の特徴量を含む情報である（詳細後記）。なお、特徴量とは、その文書データのある領域毎の特徴を示す量であって、いくつかのタイプがある（詳細後記）。
文書特徴量抽出装置１０３のメモリ２０２は、特徴量タイプテーブル１０７を有する。さらに文書特徴量抽出装置１０３のメモリ２０２は、特徴量抽出プログラム１０８を有する。特徴量抽出プログラム１０８には特徴量タイプに応じていくつかの種類があり、ここでは、重心利用タイプ特徴量抽出プログラムを記載した（詳細後記）。
【００１６】
透かしデータ作成装置１０４は、透かしデータを作成する。透かしデータとは、一般的には、印刷した際に人間に視認されにくい「透かし」そのものである。本実施形態においては、透かしデータは、縦横の格子状に配列された微小な格子点及びその格子点の間に配置された微小な情報点からなるドットパターンである。この透かしデータは、格子点に対する情報点の位置関係に対して「０」、「１」等のシンボルを対応付けており、それらのシンボルの集合が、文書データの文書特徴量を表している。
【００１７】
地紋透かし埋込装置１０５は、透かしデータを文書データに埋め込む。
改ざん検出対象データベース装置１０６は、改ざん検出対象データベース１０９を格納する。改ざん検出対象データベース１０９には、改ざん検出対象領域レコード２５１（図５の説明にて後記）が記憶されている。
【００１８】
前記した各装置１０２〜１０６は、それぞれ別個の装置として説明した。しかし、前記各装置１０２〜１０６のすべて又は一部が、纏まって１つの装置として構成されていてもよい。
【００１９】
図３に沿って、前記各装置１０２〜１０６のハードウエア構成を説明する。
文書作成端末装置１０２、文書特徴量抽出装置１０３、透かしデータ作成装置１０４、地紋透かし埋込装置１０５及び改ざん検出対象データベース装置１０６は、それぞれ一般的なコンピュータであり、それぞれが図３のハードウエア構成を有するものとする。
【００２０】
例えば、文書作成端末装置１０２は、ＣＰＵ（Central Processing Unit）２０１、メモリ２０２、ハードディスク２０３、ネットワークインターフェース２０４、キーボード２０５、ディスプレイ２０６、スキャナ２０７及びプリンタ２０８を有する。これらは、インターフェース２０９によって相互に接続されている。
【００２１】
ＣＰＵ２０１は、中央処理装置であり、メモリ２０２に格納されているプログラム、又はハードディスク２０３からメモリ２０２に読み出されたプログラムを実行する。なお、プログラムは、必要に応じて、文書作成端末装置１０２が利用可能であり、着脱可能な記録媒体によって導入されてもよい。また、ネットワークインターフェース２０４によって、通信媒体（通信回線又は通信回線上の搬送波）を介して、文書作成端末装置１０２に導入されてもよい。
メモリ２０２は、ＣＰＵ２０１に実行されるプログラム及びデータを一時的に格納する。
インターフェース２０９は、文書作成端末装置１０２内の各構成を接続する。
ネットワークインターフェース２０４は、ネットワークを１１０介して外部と通信するインターフェースである。
【００２２】
キーボード２０５は、文書作成端末装置１０２への指示及びデータを入力するために、ユーザが操作する入力装置である。
ディスプレイ２０６は、処理結果等を表示する装置である。
スキャナ２０７は、印刷物等を光学的に読み取り、読み取った結果を画像として文書作成端末装置１０２内に入力する装置である。
プリンタ２０８は、処理結果等を印刷媒体（例えば、紙面）に印刷する装置である。
ハードディスク２０３は、プログラム及びデータを格納する装置であり、例えば、不揮発性メモリ等によって構成することができる。この場合、ハードディスク２０３に格納されたプログラム及びデータは、電源をＯＦＦとしても保存される。
【００２３】
文書特徴量抽出装置１０３、透かしデータ作成装置１０４、地紋透かし埋込装置１０５及び改ざん検出対象データベース装置１０６のハードウエア構成も基本的に同様である。しかしながら、ハードディスク２０３、ネットワークインターフェース２０４、キーボード２０５、ディスプレイ２０６、スキャナ２０７及びプリンタ２０８は、それぞれ必要に応じて省略されてもよい。
【００２４】
（特徴量タイプテーブル）
図４に沿って、特徴量タイプテーブル１０７を説明する。
特徴量タイプテーブル１０７においては、特徴量タイプＩＤ欄３０１に記憶された特徴量タイプＩＤに関連付けて、特徴量タイプ欄３０２には特徴量タイプが、特徴量抽出プログラム欄３０３には特徴量抽出プログラム情報が、特徴量比較プログラム欄３０４には特徴量比較プログラム情報が、記憶されている。
【００２５】
特徴量タイプＩＤ欄３０１の特徴量タイプＩＤは、特徴量タイプを一意に特定する識別子である。
特徴量タイプ欄３０２の特徴量タイプは、文書データの特徴量の種類であり、ここでは、例えば重心利用タイプ、ラン数利用タイプ及び面積利用タイプを含む複数の特徴量タイプが記憶されているものとする。重心利用タイプ、ラン数利用タイプ及び面積利用タイプの特徴量が、どのようにして文書データから抽出されるかは後記する。
特徴量抽出プログラム欄３０３の特徴量抽出プログラム情報は、特徴量を文書データ等から抽出するプログラムの所在を示す情報である。
特徴量比較プログラム欄３０４の特徴量比較プログラム情報は、文書データの特徴量を検証対象文書画像（又は修正画像）の特徴量と比較するプログラムの所在を示す情報である（詳細後記）。特徴量抽出プログラムそのもの及び特徴量比較プログラムそのものは、文書作成システム１０１の内部に格納されていてもよいし、外部に格納されていてもかまわない。
【００２６】
図５（ａ）及び（ｂ）に沿って、改ざん検出対象領域レコード２５１を説明する。改ざん検出対象データベース１０９には、１又は複数の改ざん検出対象領域レコード２５１が記憶されている（図５（ａ））。個々の改ざん検出対象領域レコード２５１には、改ざん検出対象レコードを一意に特定する識別子である改ざん検出対象レコード番号が記憶されている。
個々の改ざん検出対象領域レコード２５１においては、改ざん検出対象領域ＩＤ欄３１１に記憶された改ざん検出対象領域ＩＤに関連付けて、始点欄３１２には始点が、終点欄３１３には終点が記憶されている。
【００２７】
改ざん検出対象領域ＩＤ欄３１１の改ざん検出対象領域ＩＤは、改ざんがされているか否かの判断を行う領域（以降「改ざん検出対象領域」という。また以下の説明において、単に「領域」ということもある）を、その改ざん検出対象領域レコード２５１内において一意に特定する識別子である。改ざん検出対象領域の形状は任意である。本実施形態においては、正方形とする。
始点欄３１２の始点は、改ざん検出対象領域の左上の点の座標である。
終点欄３１３の終点は、改ざん検出対象領域の右下の点の座標である。
【００２８】
図５（ｂ）は、文書データに直交座標（Ｘ軸、Ｙ軸）を当てはめた図である。例えば、改ざん検出対象領域レコード番号が「３」である改ざん検出対象レコード２５１が有する改ざん検出対象領域のうち、改ざん検出対象領域ＩＤ「１」、「２」及び「３」により特定される改ざん検出対象領域は、図５（ｂ）においては、それぞれ符号「３２３」、「３２４」及び「３２５」の領域である。
【００２９】
（特徴量タイプ）
以降に、特徴量タイプとしての、「重心利用タイプ」、「ラン数利用タイプ」及び「面積利用タイプ」を順次説明する。この３つのタイプの特徴量は、いずれも、文書データを画像データに変換した場合の画素（ピクセル）の画素値に基づいて算出される。
白黒画像の場合、画素は、２５６段階の輝度（＝画素値）を有する。画素値「０」が最も暗く「黒」色であることを示し、画素値「２５５」が最も明るく「白」色であることを示し、その間の画素値は、輝度の異なる「灰色」である。
カラー画像の場合、画素は、３原色（赤、緑及び青）毎に２５６段階の階調を有している。そして、各画素の輝度は「輝度＝０.２９９Ｒ＋０．５８７Ｇ＋０．１１４Ｂ」の式で計算される。ここで、Ｒ、Ｇ、及びＢは、それぞれ、赤、緑及び青の階調である。
画素値は、２値化して表される。すなわち、ある閾値以上の画素値を有する画素は、完全な「白」（画素値＝２５５）、ある閾値未満の画素値を有する画素は、完全な「黒」（画素値＝０）とする。この処理を「２値化」といい、このときの閾値を「２値化閾値」という。
ここで、「２値化」を「ｎ値化」（ｎ＝２，３，４，・・・）と一般化することも可能である。ｎ−１個の閾値（ｎ値化閾値）を用いて、画素値をｎ個に区分し、区分されたそれぞれに代表的な画素値を割り当てることが可能である。
以降の「重心利用タイプ」、「ラン数利用タイプ」及び「面積利用タイプ」においては、ｎ値化の例として、２値化された画素を用いる。
【００３０】
（重心利用タイプ）
図６（ａ）及び（ｂ）に沿って、重心利用タイプを説明する。
図６（ａ）には、ある１つの改ざん検出対象領域が示されている。この改ざん検出対象領域には、画素が１００（１０×１０）個存在する。そのうち、４つの画素３３１〜３３４が黒画素（２値化され、完全な黒とされた画素）であり、それらの座標がそれぞれ（１，９）、（２，１）、（６，８）及び（７，２）であったとする。
この４つの画素のＸ座標の平均値は４である（（１＋２＋６＋７）／４＝４）。同様にＹ座標の平均値は５である（（９＋１＋８＋２）／４＝５）。このとき４つの黒画素の重心の座標は（４，５）となる。そしてこの重心の座標が、当該改ざん検出対象領域における特徴量である。
【００３１】
実際には、画素の数はより多い場合が多い。図６（ｂ）を参照すると、「４」という数字がある幅を持った線で記載されている。その線は多数の黒画素で構成されている。そして、それらの黒画素の重心は、符号３３５の点である。
なお、重心の座標は、整数ではなく小数であってもかまわない。この場合浮動小数点表現等を使用して計算結果の数を近似してもよい。
【００３２】
（ラン数利用タイプ）
図７（ａ）に沿って、ラン数利用タイプを説明する。
ある１つの改ざん検出対象領域において、任意の位置に縦（Ｙ軸に平行な）の直線を所定の数だけ（図の例では２本）引く。そして各直線が黒画素と交差した回数をカウントする。例えば、直線３４１は、「ラ」という文字を構成する黒画素と、３回交差するので、この直線に対して「３」を関連付ける。同様に、縦線３４２に対して「１」を関連付ける。
全く同様に、任意の位置に横（Ｘ軸に平行な）の直線を所定の数だけ（図の例では２本）引く。そして各直線が黒画素と交差した回数をカウントする。その結果、直線３４３に対して「６」が、直線３４４に対して「５」が関連付けられる。
そして、縦の直線との交差回数の平均値（（３＋１）／２＝２.０）及び横の直線との交差回数の平均値（（６＋５）／２＝５.５）を算出し、「２．０」と「５．５」の組合せを特徴量とする。
【００３３】
（面積利用タイプ）
図７（ｂ）に沿って、面積利用タイプを説明する。
ある１つの改ざん検出対象領域をいくつかの同じ面積のブロックに分け、そのブロックが含む黒画素の数が所定の閾値以上であるブロックの数を全ブロックの数で除する。図の例であれば、所定の閾値を「１」とすれば、１個以上の黒画素が存在するブロックの数は９２であるので、９２／２５６＝０．３５９が特徴量となる。
以上では、特徴量タイプとして、「重心利用タイプ」、「ラン数利用タイプ」及び「面積利用タイプ」を説明したが、これら以外の特徴量タイプを用いてもかまわない。以降の説明では、文書作成システム１０１（及び文書検証システム１１１）が、「重心利用タイプ」を用いる例を説明する。
【００３４】
（文書作成処理手順）
図１５に沿って、文書作成処理手順を説明する。
図１５の文書作成処理手順は、文書作成システム１０１の各装置１０２〜１０５のＣＰＵ２０１が、各装置１０２〜１０５のメモリ２０２に各装置１０２〜１０５のハードディスクからプログラム（図示せず）を読み出した上で実行する。
【００３５】
ステップＳ４０１において、文書作成端末装置１０２は、文書データ、特徴量タイプＩＤ、改ざん検出対象領域レコード番号、改ざん検出対象領域ＩＤ及び２値化閾値を受け付ける。
文書データは、例えば、一般のワープロソフト、テキストエディタ等コンピュータ上で動作可能なソフトウエアによって作成されたデータである。
改ざん検出対象領域ＩＤとして例えば「*」のような記号を受け付けた場合は、ある改ざん検出対象領域レコード２５１に含まれる全ての改ざん検出対象領域を特定する改ざん検出対象領域ＩＤを受け付けたものと看做してもよい。
なお、文書作成端末装置１０２は、文書データを受け付ける代わりに、文書データを一意に特定する識別子を受け付けてもよい。この場合、文書データは、この識別子に関連付けられたうえで、文書作成端末装置１０２のハードディスク２０３、又は文書作成端末装置１０２に接続されている装置のハードディスク２０３に記憶されているものとする。さらに、文書作成端末装置１０２は、受け付けた識別子を検索キーとして、それらのハードディスク２０３を検索し、文書データを取得するものとする。
【００３６】
ステップＳ４０２において、文書作成端末装置１０２は、文書データ、特徴量タイプＩＤ、改ざん検出対象領域レコード番号、改ざん検出対象領域ＩＤ及び２値化閾値を文書特徴量抽出装置１０３に送信する。
【００３７】
ステップＳ４０３において、文書特徴量抽出装置１０３は、特徴量抽出プログラムを取得する。
具体的には、ステップＳ４０２において送信された特徴量タイプＩＤを検索キーとして特徴量タイプテーブル１０７を検索し、該当した行の特徴量抽出プログラム情報を取得し、その所在場所にある特徴量抽出プログラムを取得する。ここでは、重心利用タイプ特徴量抽出プログラム１０８が取得されたものとする。
【００３８】
ステップＳ４０４において、文書特徴量抽出装置１０３は、特徴量抽出プログラムを稼動する。
具体的には、ステップＳ４０３において取得した特徴量抽出プログラムを稼動する。
【００３９】
ステップＳ４０５において、文書特徴量抽出装置１０３は、文書データから文書特徴量を抽出し、文書作成端末装置１０２に送信する。
ステップＳ４０５の詳細は、後記する。
【００４０】
ステップＳ４０６において、文書作成端末装置１０２は、文書特徴量を透かしデータ作成装置１０４に送信する。
【００４１】
ステップＳ４０７において、透かしデータ作成装置１０４は、文書特徴量から透かしデータを作成し、文書作成端末装置１０２に送信する。
透かしデータには、文書特徴量がそのまま用いられてもよい。また、一般的なアルゴリズムにしたがって暗号化された文書特徴量が用いられてもよい。一般的な暗号アルゴリズムにしたがって電子署名が付された文書特徴量が用いられてもよい。タイムスタンプが付与された文書特徴量が用いられてよい。
【００４２】
本実施形態の透かしデータは、前記したように、印刷媒体上に印刷された場合、人間には視認することが困難なドットパターンとなる。例えば、四隅に格子点を有するある正方形の領域を４つの部分（左上、右上、左下、右下）に分割し、各部分に情報点が１つあるか否かに応じて、その正方形の領域に１６（２×２×２×２）種類のシンボル「０，１，２，３，４，５，６，７，８，９，Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｆ」を割り当てることが可能である。したがって、後記する１６進数に変換された文書特徴量のコンピュータ内部表現（図８（ｂ）の符号３５４）を透かしデータによって表すことができる。
【００４３】
ステップＳ４０８において、文書作成端末装置１０２は、文書データ及び透かしデータを地紋透かし埋込装置１０５に送信する。
【００４４】
ステップＳ４０９において、地紋透かし埋込装置１０５は、文書データに透かしデータを埋め込み、透かしデータ入り文書データを作成し、文書作成端末装置１０２に送信する。
具体的には、地紋透かし埋込装置１０５は、第一に、文書データを画像化する。文書データの画像化には、市販のワープロソフトから所定の仮想プリンタに印刷し、印刷された文書データがＰＤＦデータに変換される公知技術、及び、ＰＤＦデータから画像データに変換する公知技術を用いることができる。
第二に、画像化された文書データに透かしデータを埋め込む。画像化された文書データに透かしデータを埋め込む方法としては、公知技術を用いることができるが、例えば、出願人による特開２００６-２７９６４０号公報に開示されている技術を用いることができる。
【００４５】
ステップＳ４１０において、文書作成端末装置１０２は、透かしデータ入り文書データを表示し、ユーザの求めに応じて印刷する。
本実施形形態では、透かしデータ入り文書データは画像であるため、従来技術を用いて、文書作成端末装置１０２のディスプレイ２０６に表示すること、及びプリンタ２０８によって印刷することが可能である。文書作成端末装置１０２は、透かしデータ入り文書データを、他の装置に送信したうえで、受信した装置が、透かしデータ入り文書データを印刷してもよい。
ここで、文書作成処理手順を終了する。
【００４６】
なお、ステップＳ４０５では、文書特徴量抽出装置１０３は、抽出された文書特徴量を文書作成端末装置１０２に送信しているが、抽出された文書特徴量を透かしデータ作成装置１０４に送信してもよい。この場合、文書作成処理手順はステップＳ４０６を省略し、ステップＳ４０７に進む。
また、ステップＳ４０７では、透かしデータ作成装置１０４は、作成された透かしデータを文書作成端末装置１０２に送信しているが、作成された透かしデータを地紋透かし埋込装置１０５に送信してもよい。この場合、文書作成処理手順はステップＳ４０８を省略し、ステップＳ４０９に進む。
【００４７】
（文書作成処理手順のＳ４０５の詳細）
図１６に沿って、ステップＳ４０５の詳細を説明する。
ステップＳ５０１において、文書特徴量抽出装置１０３は、改ざん検出対象領域レコード２５１を取得する。
具体的には、文書特徴量抽出装置１０３は、第一に、ステップＳ４０１において受け付けた改ざん検出対象領域レコード番号を検索キーにして、改ざん検出対象データベース１０９を検索し、該当した改ざん検出対象領域レコード２５１（図５（ａ）参照）を取得する。
第二に、文書特徴量抽出装置１０３は、ステップＳ４０１において受け付けた改ざん検出対象領域ＩＤを検索キーにして、取得した改ざん検出領域レコードを検索し、該当した行を取得する。この１行分のデータを１つのエントリとする（詳細後記）。
第三に、ステップＳ４０１において取得した文書データ全体の画像を作成する。
第四に、重心リスト２５２（図８（ａ）参照）を作成し、文書特徴量抽出装置１０３のメモリ２０２に一時的に保存する。重心リスト２５２は、改ざん検出対象領域ＩＤ欄３５１と重心欄３５２を関連付けて記憶した表である。この段階で、重心リスト２５２の行は未だ作成されていない。
【００４８】
ステップＳ５０２において、文書特徴量抽出装置１０３は、未処理のエントリがあるか否かを判断する。
具体的には、文書特徴量抽出装置１０３は、ステップＳ５０１において取得した行のうち、未処理のエントリがある場合（ステップＳ５０２“Ｙｅｓ”）は、未処理のエントリを１つ取得したうえでステップＳ５０３に進み、それ以外の場合（ステップＳ５０２“Ｎｏ”）は、ステップＳ５０５に進む。
【００４９】
ステップＳ５０３において、文書特徴量抽出装置１０３は、２値化閾値を用いて、文書データから改ざん検出対象領域の領域画像を作成する。
具体的には、文書特徴量抽出装置１０３は、第一に、ステップＳ５０２において取得したエントリに含まれている始点及び終点に基づいて、ステップＳ５０１において作成した文書データ全体の画像から、改ざん検出対象領域を切り出す。切り出された画像を「領域画像」と言う。
第二に、ステップＳ４０１において受け付けた２値化閾値を用いて切り出した領域画像の画素値を２値化する。
【００５０】
ステップＳ５０４において、文書特徴量抽出装置１０３は、領域画像の重心を計算する。
具体的には、文書特徴量抽出装置１０３は、第一に、領域画像に含まれる全ての黒画素の重心の座標値を計算する。
第二に、重心リスト２５２の新たな１つの行を作成し、その行の改ざん検出対象領域ＩＤ欄３５１に、ステップＳ５０２において取得したエントリに含まれる改ざん検出対象領域ＩＤを記憶し、その行の重心欄３５２に、計算した重心の座標値を記憶する。
【００５１】
ステップＳ５０５において、文書特徴量抽出装置１０３は、重心リスト２５２から文書特徴量を作成する。
具体的には、文書特徴量抽出装置１０３は、第一に、ステップＳ４０１にて受け付けた特徴量タイプＩＤ及び改ざん検出対象領域レコード番号を４桁の１６進数に変換する。例えば、重心利用タイプを特定する特徴量タイプＩＤ「１」は１６進数「０００１」に変換される。改ざん検出対象領域レコード番号として「３」が受け付けられている場合、「３」は１６進数「０００３」に変換される。
第二に、改ざん検出対象領域の数（重心リスト２５２の行の数である）を４桁の１６進数に変換する。例えば行の数が「１０」である場合、「１０」は１６進数「０００Ａ」に変換される。
第三に、重心リスト２５２の行毎に、改ざん検出対象領域ＩＤを４桁の１６進数に変換し、重心のＸ座標及びＹ座標をそれぞれ８桁の１６進数に変換する。例えば、１行目の改ざん検出対象領域ＩＤ「１」は１６進数「０００１」に、１行目の重心のＸ座標「２．４」は１６進数「４０１９９９９Ａ」に、１行目の重心のＹ座標「３．３」は１６進数「４０５３３３３３」に変換される。「第三」の処理は、重心リスト２５２のすべての行について繰り返される。すると、図８（ｂ）の符号３５３に示すような、１６進数に変換された改ざん検出対象領域ＩＤ、重心のＸ座標及び重心のＹ座標をその順に結合した組が複数作成される。
第四に、１６進数に変換された、特徴量タイプＩＤ、改ざん検出対象領域レコード番号及び改ざん検出対象領域の数をその順に並べ、さらにその末尾に、１６進数に変換された改ざん検出対象領域、重心のＸ座標及び重心のＹ座標をその順に結合した組を、重心の数だけ繰り返し並べる。このようにして文書特徴量のコンピュータ内部表現「０００１・・・４０９０００００」が作成される（図８（ｂ）の符号３５４）。
【００５２】
なお、前記の例では、特徴量タイプＩＤ、改ざん検出対象領域レコード番号、改ざん検出対象領域の数及び改ざん検出対象領域ＩＤを４桁の１６進数に変換し、重心のＸ座標及びＹ座標を８桁の１６進数に変換することとした。しかしながら、他の桁数が用いられてもよいし、１６進数以外の進数が用いられてもよい。
【００５３】
ステップＳ５０６において、文書特徴量抽出装置１０３は、文書特徴量を文書作成端末装置１０２に送信する。
その後、ステップＳ４０６に戻る。
【００５４】
（文書検証システム）
図２に沿って、文書検証システム１１１を説明する。
文書検証システム１１１は、文書作成システム１０１が印刷する、透かしデータが埋め込まれた印刷文書が改ざんされているか否かを検証するシステムである。
文書検証システム１１１は、文書検証端末装置１１２、地紋透かし読取装置１１３、文書画像修正装置１１４、改ざん検出装置１１５及び改ざん検出対象データベース装置１０６を有する。これらの各装置１１２〜１１５及び１０６は、ネットワーク１１８を介して相互に接続されている。
【００５５】
文書検証端末装置１１２は、文書作成システム１０１の文書作成端末装置１０２が印刷媒体に対して印刷した、透かしデータ入り文書データであって、改ざんされている可能性のある文書（検証対象文書）を読み取る。
地紋透かし読取装置１１３は、読み取られた検証対象文書から、透かしデータを抽出する。
文書画像修正装置１１４は、読み取られた検証対象文書画像（歪みを有していることが多い）を、歪みの少ない画像に修正し、改ざん検出の精度を上げる。
改ざん検出装置１１５は、検証対象文書が改ざんされているか否かを検証する。
改ざん検出装置１１５のメモリ２０２は、特徴量タイプテーブル１０７（図４）を有する。さらに改ざん検出装置１１５のメモリ２０２は、特徴量抽出プログラム１０８及び特徴量比較プログラム１１６を有する。特徴量抽出プログラム１０８には特徴量タイプに応じていくつかの種類があり、ここでは、重心利用タイプ抽出プログラムを記載した。特徴量比較プログラム１１６には特徴量タイプに応じていくつかの種類があり、ここでは、重心利用タイプ比較プログラムを記載した。
【００５６】
改ざん検出対象データベース装置１０６は、改ざん検出対象データベース１０９を格納する。改ざん検出対象データベース１０９には、改ざん検出対象領域レコード２５１（図５（ａ）参照）が記憶されている。
【００５７】
前記した各装置１１２〜１１５及び１０６は、それぞれ別個の装置として説明した。しかし、前記各装置１１２〜１１５及び１０６のすべて又は一部が、纏まって１つの装置として構成されていてもよい。また、特徴量タイプテーブル１０７、改ざん検出対象データベース装置１０６、特徴量比較プログラム１１６、改ざん検出対象領域レコード２５１及び特徴量抽出プログラム１０８は、文書作成システム１０１において説明したものと同じである。特徴量抽出プログラム１０８及び特徴量比較プログラム１１６は、文書検証システム１１１の内部に格納されていてもよいし、外部に格納されていてもかまわない。
【００５８】
文書検証端末装置１１２、地紋透かし読取装置１１３、文書画像修正装置１１４、改ざん検出装置１１５及び改ざん検出対象データベース装置１０６は、それぞれ一般的なコンピュータであり、それぞれが図３のハードウエア構成を有するものとし、ネットワークインターフェース２０４、キーボード２０５、ディスプレイ２０６、スキャナ２０７、プリンタ２０８及びハードディスク２０３は、それぞれ必要に応じて省略されてもよい。
【００５９】
（文書検証処理手順）
図１７に沿って、文書検証処理手順を説明する。
図１７の文書検証処理手順は、文書検証システム１１１の各装置のＣＰＵ２０１が、各装置のメモリ２０２に各装置のハードディスク２０３からプログラム（図示せず）を読み出した上で実行する。当該プログラムは、コンピュータ読み取り可能な記録媒体に格納され得るものとする。
【００６０】
ステップＳ６０１において、文書検証端末装置１１２は、検証対象文書をスキャンして検証対象文書画像を作成する。
検証対象文書のスキャンには、スキャナ２０７が使用される。
「検証対象文書の画像データ」には、ここでの検証対象文書画像が相当する。
【００６１】
ステップＳ６０２において、文書検証端末装置１１２は、判定閾値及び改ざん検出の指示を受け付ける。
判定閾値は、改ざんの有無を判定するために２値化閾値同士の差分に対して適用される閾値である（詳細後記）。判定閾値及び改ざん検出の指示は、キーボード２０５から入力される。
【００６２】
ステップＳ６０３において、文書検証端末装置１１２は、検証対象文書画像を地紋透かし読取装置１１３に送信する。
【００６３】
ステップＳ６０４において、地紋透かし読取装置１１３は、検証対象文書画像に埋め込まれた透かしデータから領域規定情報２５３（図９（ａ）参照）を作成し、透かしデータ及び領域規定情報２５３を、文書検証端末装置１１２に送信する。
前記したように、透かしデータは、文書特徴量のコンピュータ内部表現を表している。一方、透かしデータには、格子点が含まれている。地紋透かし読取装置１１３は、読み取った透かしデータの格子点の座標を読み取り、元の文書データに比して検証対象文書画像がどの程度歪んでいるかを示す領域規定情報２５３を作成する。ここでいう歪みは、人為的な改ざんとは無関係であり、人為的な改ざんがなされていなくともスキャナ２０７等で検証対象文書をスキャンする際、光学的に、又はローラの回転などに起因して生ずる歪みを意味する。
【００６４】
例えば、スキャナにより読み込まれる前の検証対象文書には、ドットパターンの格子点が、図９（ｂ）のように規則正しく並んでいる。一方スキャナ２０７に読み取られた後の検証対象文書画像のドットパターンの格子点は、図９（ｃ）のように正しく上下左右に配列されておらず、多少歪んでいる。
図９（ａ）の領域規定情報２５３は、領域座標欄３６１に記憶された領域座標に関連付けて、検証対象文書画像座標欄３６２には検証対象文書画像座標が記憶されている。
領域座標欄３６１の領域座標は、予め配置された複数の点の相対的な座標であり、図９（ｂ）の各格子点の位置関係を表す。ここで例えば（Ｘ座標，Ｙ座標）＝（ｍ，ｎ）と表現した場合、それは、ｍ番目の縦線とｎ番目の横線が交差する位置を表す。但し、ｍ、ｎは０，１，２，３，・・・であり、便宜上「０番目」から数えるものとする。
検証対象文書画像座標欄３６２の検証対象文書画像座標は、実際にスキャナ２０７が検証対象文書画像から読み取った図９（ｃ）の格子点の座標である。
【００６５】
具体的には、地紋透かし読取装置１１３は、第一に、検証対象文書画像から透かしデータの格子点を読み取る。なお、格子点と情報点との区別は、公知技術（特開２００６-２７９６４０号公報）を使用して、ある点につき、その点の上下の誤差を含む領域に点が存在する評価値と、その点の左右の誤差を含む領域に点が存在する評価値とが概ね等しい点を格子点であると判定する。
第二に、領域規定情報２５３（図９（ａ））を作成する。この段階では各行は未だ作成されていない。
第三に、領域規定情報２５３の新たな行を作成し、領域座標欄３６１に領域座標（相対的な位置関係）を記憶する。ここでは、左上から右に進み、直ぐ下を左から右に進み（繰り返し）、左下から右下に進んで終了するように各行に領域座標を記憶する。続いて、「第一」において読み取った格子点の座標を、左上から右に進み、直ぐ下を左から右に進み（繰り返し）、左下から右下に進んで終了する順番で、作成済の行の検証対象文書画像座標欄３６２に記憶し、領域規定情報２５３を完成する。なお、領域規定情報２５３の１行を１つのエントリとする（詳細後記）。
第五に、透かしデータ及び完成した領域規定情報２５３を文書検証端末装置１１２に送信する。以降の処理において、領域規定情報２５３は、検証対象文書画像の歪みを修正するために使用される。
【００６６】
ステップＳ６０５において、文書検証端末装置１１２は、検証対象文書画像及び領域規定情報２５３を文書画像修正装置１１４に送信する。
【００６７】
ステップＳ６０６において、文書画像修正装置１１４は、修正画像を作成し、文書検証端末装置１１２に送信する。
ステップＳ６０６の詳細は、後記する。
【００６８】
ステップＳ６０７において、文書検証端末装置１１２は、特徴量タイプＩＤ、改ざん検出対象領域レコード番号及び特徴量を抽出する。
ステップＳ６０７の詳細は、後記する。
【００６９】
ステップＳ６０８において、文書検証端末装置１１２は、特徴量タイプＩＤ、改ざん検出対象領域レコード番号、重心リスト２５２及び修正画像を改ざん検出装置１１５に送信する。
【００７０】
ステップＳ６０９において、改ざん検出装置１１５は、改ざん検出処理を行い、検証結果を文書検証端末装置１１２に送信する。
ステップＳ６０９の詳細は、後記する。
【００７１】
ステップＳ６１０において、文書検証端末装置１１２は、検証結果を表示する。
ステップＳ６１０の詳細は、後記する。
ここで、文書検証処理手順を終了する。
【００７２】
前記した文書検証処理手順においては、検証対象文書画像に歪み等がある場合を想定し、ステップＳ６０６において、この歪み等を修正し修正画像とし、ステップＳ６０９において、修正画像の特徴量と文書データ（元の文書）の特徴量を比較している。しかしながら、ステップＳ６０６を省略し、修正していない検証対象文書画像の特徴量と文書データ（元の文書）の特徴量を比較することも可能である。
【００７３】
（文書検証処理手順のＳ６０６の詳細）
図１８に沿って、ステップＳ６０６の詳細を説明する。
ステップＳ７０１において、文書画像修正装置１１４は、領域座標の最大値を取得する。
具体的には、文書画像修正装置１１４は、第一に、ステップＳ６０５において送信された領域規定情報２５３を受け取る。
第二に、受け取った領域規定情報２５３の領域座標欄３６１の領域座標のうち、Ｘ座標の最大値及びＹ座標の最大値を取得し、それぞれ、ｘｍ及びｙｍとする。図９（ａ）の例では、ｘｍ＝２、ｙｍ＝２である。
【００７４】
ステップＳ７０２において、文書画像修正装置１１４は、修正中画像を作成する。
具体的には、文書画像修正装置１１４は、第一に、横の画素数が（ｘｍ×ｇｘ＋１）であり縦の画素数が（ｙｍ×ｇｙ＋１）である領域（修正中画像）を作成する。
ｇｘ及びｇｙは、所与の値であり、例えば、検証対象文書画像の格子点（図９（ｃ）参照）と隣接する格子点との間に存在する画素の数に一致させてもよい。ここでは、ｇｘ＝６０及びｇｙ＝６０とする。
【００７５】
ステップＳ７０３において、文書画像修正装置１１４は、未処理のエントリがあるか否かを判断する。
具体的には、文書画像修正装置１１４は、ステップＳ６０４において作成した領域規定情報２５３の行のうち、未処理のエントリがある場合（ステップＳ７０３“Ｙｅｓ”）は、ステップＳ７０４に進み、それ以外の場合（ステップＳ７０３“Ｎｏ”）は、ステップＳ７０５に進む。
【００７６】
ステップＳ７０４において、文書画像修正装置１１４は、内部補間処理を行い検証対象文書画像の画素値を対応する修正中画像の画素にコピーする。そして、ステップＳ７０３へ戻る。
【００７７】
（内部補間処理）
図１０（ａ）及び（ｂ）に沿って、内部補間処理を説明する。
図１０（ａ）の４つの格子点で囲まれる正方形は、修正中画像のある１つの領域である。これらの４つの格子点のうち、左上の格子点の相対的な座標値が図９（ａ）の領域座標である。
図１０（ｂ）の４つの格子点で囲まれる四角形は、検証対象文書画像の対応する１つの領域である。これら４つの格子点のうち左上の格子点の座標値が図９（ｂ）の検証対象文書画像座標である。
内部補間処理は、図１０（ａ）の領域中の全ての画素について、図１０（ｂ）の領域の対応する位置にある画素の画素値をコピーすることによって、修正中画像を完成させる処理である。
【００７８】
具体的には、文書画像修正装置１１４は、第一に、領域規定情報２５３の未処理の１行を１つのエントリとして取得する。
第二に、取得した行の領域座標によって特定される（取得した領域画像が示す格子点、その右の格子点、下の格子点及び右下の格子点によって囲まれる）、修正中画像上の領域に存在する任意の１つの画素を取り出す。
第三に、取り出した画素が、領域をどのように内分しているかを求める。図１０（ａ）の例では、画素３６３は、領域をＸ軸方向にｓ：１−ｓに内分し、Ｙ軸方向にｔ：１−ｔに内分している。
第四に、「第一」において取得した行の検証対象文書画像座標によって特定される（「第二」における４つの格子点に対応する４つの格子点に囲まれる）、検証対象文書画像上の領域を求める。その結果、図１０（ｂ）の四角形が求められたとする。
第五に、検証対象文書画像上の領域の４辺を、「第三」にて求めた内分比で内分する。そして４つの内分点のうち隣り合わない辺に属する２つの内分点を直線で結び、２つの直線の交点に位置する、検証対象文書画像上の画素３６４の画素値を取得する。
第五に、取得した画素３６４の画素値を、画素３６３の画素値とする。
「第二」〜「第五」の処理は、修正中画像の当該領域（１つのエントリに対応している）に属する全ての画素について繰り返す。
【００７９】
ステップＳ７０５において、文書画像修正装置１１４は、修正中画像を修正画像として文書検証端末装置１１２に送信する。
ステップＳ７０３、Ｓ７０４のループが終了した段階で、歪みを含む可能性がある検証対象文書画像は、歪みのない修正画像として再生されたことになる。改ざんがある場合は、改ざんがあるまま再生されることになる。
その後、ステップＳ６０７に戻る。
【００８０】
（文書検証処理手順のＳ６０７の詳細）
図１９に沿って、ステップＳ６０７の詳細を説明する。
ステップＳ８０１において、文書検証端末装置１１２は、透かしデータから特徴量タイプＩＤ及び改ざん検出対象領域レコード番号を抽出する。
具体的には、文書検証端末装置１１２は、透かしデータが暗号化されている場合は復号化することによって、透かしデータに電子署名が付与されている場合には、電子署名を検証することによって、透かしデータにタイムスタンプが付与されている場合にはタイムスタンプを検証することによって文書特徴量のコンピュータ内部表現３５４（図８（ｂ）参照）を取得する。
第二に、特徴量のコンピュータ内部表現３５４（１６進数で表現されている）の初めの４桁を文書特徴量タイプＩＤとして、それに続く４桁を改ざん検出対象領域レコード番号として抽出する。
【００８１】
ステップＳ８０２において、文書検証端末装置１１２は、特徴量タイプＩＤが「１」であるか否かを判断する。
具体的には、文書検証端末装置１１２は、第一に、ステップＳ８０１において抽出された特徴量タイプＩＤが「１」であるか否かを判断し、特徴量タイプＩＤが「１」である場合（ステップＳ８０２“Ｙｅｓ”）は、ステップＳ８０３に進み、それ以外の場合（ステップＳ８０２“Ｎｏ”）はステップＳ８０７に進む。
【００８２】
ステップＳ８０３において、文書検証端末装置１１２は、改ざん検出対象領域の数を抽出する。
具体的には、文書検証端末装置１１２は、第一に、ステップＳ８０１において取得した文書特徴量のコンピュータ内部表現の、改ざん検出対象領域レコード番号に続く４桁を改ざん検出対象領域の数として抽出する。
第二に、重心リスト２５２（図８（ａ））を作成し、文書検証端末装置１１２のメモリ２０２に一時的に保存する。この段階で、重心リスト２５２の行は改ざん検出対象領域の数だけ作成するが、空欄のままとする。
【００８３】
ステップＳ８０４において、文書検証端末装置１１２は、未処理の改ざん検出対象領域があるか否かを判断する。
具体的には、文書検証端末装置１１２は、ステップＳ８０１において取得した文書特徴量のコンピュータ内部表現のなかに、１６進数に変換された改ざん検出対象領域ＩＤ、重心のＸ座標及び重心のＹ座標をその順に結合した組のうち未だ抽出されていない組がある場合（ステップＳ８０４“Ｙｅｓ”）は、ステップＳ８０１において取得した文書特徴量のコンピュータ内部表現の、改ざん検出対象領域の数に続く４桁を改ざん検出対象領域ＩＤとして、それに続く８桁を重心のＸ座標として、さらにそれに続く８桁を重心のＹ座標として抽出したうえで、ステップＳ８０５に進む。それ以外の場合（ステップＳ８０４“Ｎｏ”）は、ステップＳ８０６に進む。
【００８４】
ステップＳ８０５において、文書検証端末装置１１２は、重心リスト２５２に重心を追加する。
具体的には、文書検証端末装置１１２は、ステップＳ８０３において作成した重心リスト２５２の１つの行の改ざん検出対象領域ＩＤ欄３５１に改ざん検出対象領域ＩＤを、重心欄３５２に重心のＸ座標及びＹ座標を記憶する。そして、ステップＳ８０４に戻る。
【００８５】
ステップＳ８０６において、文書検証端末装置１１２は、特徴量タイプＩＤ、改ざん検出対象領域レコード番号及び重心リスト２５２を透かしデータの解釈結果として保持する。
その後、ステップＳ６０８に戻る。
【００８６】
ステップＳ８０７において、文書検証端末装置１１２は、エラーメッセージを出力して終了する。
具体的には、文書検証端末装置１１２は、例えば「不明な特徴量タイプです」というエラーメッセージをディスプレイ２０６に表示する。そして、文書検証処理手順を終了する。
【００８７】
ステップＳ８０２においては、特徴量タイプＩＤが「１」（重心利用タイプ）であるか否かの判断をしている。しかしながら、特徴量タイプＩＤが「１」以外であった場合には、その特徴量タイプＩＤに対応する文書特徴量抽出プログラム１０８を稼動させてもよい。
【００８８】
（文書検証処理手順のＳ６０９の詳細）
ステップＳ６０９は、改ざん検出処理を行うステップであるが、その詳細説明に入る前に、２値化閾値と特徴量の関係を、図１３の特徴量データ２５４に沿って説明する。
図１３には、ある改ざん検出対象領域についての、２値化閾値（行３７６）、特徴量（行３７７）、特徴量の差（行３７８）及び、画像見本が相互に関連付けて記載されている。
列３７１は、文書データ（元の文書）の画像見本が「Ａ」であり、その特徴量（重心）が「５．１，８．４」であることを示している。
列３７２は、２値化閾値「４０」によって２値化した修正画像の画像見本が「Ａ（線が最も細い）」であり、特徴量が「４．４，７．６」であり、特徴量の差が「０.８」であることを示している。
特徴量の差とは、元の文書の特徴量（列３７１の行３７７にある「５．１，８.４」）との差であり、Ｘ座標の差とＹ座標の差のうち小さくない方である（詳細後記）。列３７２から３７５についても同様である。
２値化閾値の値を変化させると、画像見本も特徴量も変化する。２値化閾値の値を大きくする程、黒画素となる灰色画素の数が増えるので、「Ａ」の線は太くなる。元の文書の特徴量（列３７１の行３７７）と同じ特徴量を与える２値化閾値は「７０」（列３７３行３７６）であるが、他の２値化閾値を用いれば特徴量は乖離し、元の文書が改ざんされていなくても改ざんされていると判断されてしまう可能性がある。
なお、特徴量データ２５４は、以降に説明する改ざん検出処理のなかで作成され、改ざん検出装置１１５のメモリ２０２に保持される（但し画像見本を除く）。
【００８９】
さらに、ステップＳ６０９の詳細を説明する前に、ステップＳ６０９において行われる処理内容を、図１１、図１２に沿って模式的に説明する。
図１１は、改ざんがなされている場合、図１２は改ざんがなされていない場合を示す。
【００９０】
まず、図１１について説明する。
図１１（ａ）の太枠内の３×３の領域は、９個の改ざん検証対象領域である。そして、図１１（ａ）〜（ｈ）は、この９個の改ざん検出対象領域である。
図１１（ｂ）、（ｃ）及び（ｅ）には、改ざん検出対象領域毎に、特徴量（重心のＸ座標と重心のＹ座標）が記載されている。
【００９１】
図１１（ｂ）には、透かしデータから抽出された特徴量（重心）、すなわち、文書データ（元の文書）の改ざん検出対象領域毎の特徴量が記載されている。
図１１（ｃ）には、修正画像の特徴量、すなわち検証対象文書画像の歪みを修正した画像の特徴量が記載されている。図１１（ｃ）においては、２値化閾値の候補の数だけ特徴量のセットが存在する（このセットを紙が重なるように表現した。同一の「紙」上に記載された特徴量は、共通の２値化閾値候補に基づいて算出されている）。
そして、改ざん検出対象領域毎に、図１１（ｂ）の特徴量と、図１１（ｃ）の特徴量のすべてを比較し、図１１（ｂ）の特徴量に最も近い図１１（ｃ）の特徴量を転記したものが、図１１（ｅ）である。
【００９２】
図１１（ｄ）の「２値化閾値マップ」は、図１１（ｅ）の特徴量を算出するときに用いた２値化閾値である。例えば、図１１（ｄ）の左下の改ざん検出対象領域の２値化閾値は「１０３」である。この「１０３」を使用して修正画像を２値化し特徴量を算出した結果が「１１．７，７．９」である（図１１（ｅ）の左下）。「１０３」以外の２値化閾値候補を使用すれば、「１１．７，７．９」以外の特徴量が複数算出されることになる（図１１（ｃ）の左下に重なっている）。しかし、「１１.８，８．０」（図１１（ｂ）の左下）との差が最小である特徴量は「１１．７，７．９」である。
【００９３】
図１１（ｆ）は、図１１（ｂ）と図１１（ｅ）との差である。但しＸ座標の差の絶対値とＹ座標の差の絶対値のうち小さくない方を表している。
図１１（ｄ）において、上辺で隣接する２値化閾値との差（上段）及び左辺で隣接する２値化閾値との差（下段）を記載したのが、図１１（ｇ）である。
例えば図１１（ｄ）の中央下の「１２５」に注目する。「１２５」を基準にして上辺で隣接する２値化閾値は「１０４」である。左辺で隣接する２値化閾値は「１０３」である。このとき、図１１（ｇ）の中央下の上段「＋２１」は、１２５−１０４＝２１であることを示している。同様に、図１１（ｇ）の中央下の下段「＋２２」は、１２５−１０３＝２２であることを示している。上（左）辺で隣接する２値化閾値が存在しない場合は、上（下）段には「０」を記憶する。
【００９４】
図１１（ｇ）において、上辺で隣接する２値化閾値との差及び左辺で隣接する２値化閾値のうちのいずれかが所定の値よりも大きい場合、その改ざん検出対象領域で改ざんがあったと判断し（「Ｙ」）、それ以外の場合は改ざんがなかった（「Ｎ」）と判断したのが、図１１（ｈ）である。
図１２についても全く同様である。
【００９５】
図１１（ｆ）と図１２（ｆ）とを比較すると、いずれも特徴量の差は最大でも「０．１」であり、一見していずれも改ざんがなかったかのように見える。しかしながら、図１１（ｈ）と図１２（ｈ）とを比較すると、図１１（ｈ）においては、右下と中下の改ざん検出対象領域において、改ざんが検出されている（「Ｙ」）。
【００９６】
図２０に沿って、適宜図１１及び１２を参照しつつ、ステップＳ６０９の詳細を説明する。
ステップＳ９０１において、改ざん検出装置１１５は、特徴量抽出プログラム１０８及び特徴量比較プログラム１１６を起動する。
具体的には、改ざん検出装置１１５は、ステップＳ６０８において、文書検証端末装置１１２が送信した特徴量タイプＩＤを検索キーとして特徴量タイプテーブル１０７を検索し、該当した行の特徴量抽出プログラム情報及び特徴量比較プログラム情報に基づいて、特徴量抽出プログラム及び特徴量比較プログラムを起動する。
ここでは、特徴量タイプは「１」であり、重心利用タイプ特徴量抽出プログラム及び重心利用タイプ特徴量比較プログラムが起動されるものとする。
【００９７】
ステップＳ９０２において、改ざん検出装置１１５は、改ざん検出対象領域レコード２５１（図５（ａ）参照）を取得する。
具体的には、改ざん検出装置１１５は、ステップＳ６０８において、文書検証端末装置１１２が送信した改ざん検出対象領域レコード番号を検索キーとして、改ざん検出対象データベース１０９を検索し、該当した改ざん検出対象領域レコード２５１を取得する。
【００９８】
ステップＳ９０３において、改ざん検出装置１１５は、未処理のエントリがあるか否かを判断する。
具体的には、改ざん検出装置１１５は、ステップＳ６０８において送信された重心リスト２５２（図８（ａ）参照）に未処理の行がある場合（ステップＳ９０３“Ｙｅｓ”）は、重心リスト２５２の未処理の１行の改ざん検出対象領域ＩＤ及び重心を取得して、ステップＳ９０４に進む。それ以外の場合（ステップＳ９０３“Ｎｏ”）は、ステップＳ９１０に進む。
【００９９】
ステップＳ９０４において、改ざん検出装置１１５は、特徴量データをクリアする。
具体的には、改ざん検出装置１１５は、直前に処理をした改ざん検出対象領域についての特徴量データ２５４（図１３参照）をクリアする。
なお、ステップＳ９０４を最初に経由したときは、列が空欄の特徴量データ２５４（詳細後記）を作成し、メモリ２０２に保持することとする。
【０１００】
ステップＳ９０５において、改ざん検出装置１１５は、２値化閾値の候補が残っているか否かを判断する。
具体的には、改ざん検出装置１１５は、第一に、２値化閾値の候補を所定の方法で複数個受け付ける。例えば、ユーザが文書検証端末装置１１２のキーボード２０５を介して複数の２値化閾値の候補を入力するのを受け付ける。
第二に、未処理の２値化閾値の候補が残っている場合（ステップＳ９０５“Ｙｅｓ”）、未処理の２値化閾値の候補のうちから１つを取得してステップＳ９０６に進む。それ以外の場合（ステップＳ９０５“Ｎｏ”）は、ステップＳ９０９に進む。
【０１０１】
ステップＳ９０６において、改ざん検出装置１１５は、修正画像を２値化する。
具体的には、改ざん検出装置１１５は、第一に、改ざん検出対象領域ＩＤを検索キーとして改ざん検出対象領域レコード２５１（図５（ａ）参照）を検索し、該当した行の始点及び終点を取得する。
第二に、始点及び終点に基づいて、ステップＳ６０８において送信された修正画像の該当する領域を切り出す。
第三に、切り出された修正画像の領域のすべての画素を２値化閾値の候補により２値化する。
【０１０２】
ステップＳ９０７において、改ざん検出装置１１５は、２値化された修正画像から特徴量を算出する。
具体的には、改ざん検出装置１１５は、特徴量抽出プログラム１０８を用いて、文書特徴量抽出装置１０３が文書作成処理手順のステップＳ４０５において行った処理と同様の処理を行う。すなわち、２値化されかつ切り出された修正画像の領域から、特徴量（黒画素の重心）を算出する。
「比較用特徴量」には、ここで算出される特徴量が相当する。
【０１０３】
ステップＳ９０８において、改ざん検出装置１１５は、特徴量の差を取得する。
具体的には、改ざん検出装置１１５は、第一に、ステップＳ９０７において取得した重心と、ステップＳ９０３において取得した重心リスト２５２（図８（ａ）参照）の重心とを、Ｘ座標同士及びＹ座標同士比較する。そして、Ｘ座標の差の絶対値とＹ座標の差の絶対値のうち小さくない方を特徴量の差として取得する。
第二に、特徴量データ２５４（図１３参照）に新たな列を作成し、２値化閾値の行３７６にステップＳ９０５において取得した２値化閾値の候補を、特徴量の行３７７にステップＳ９０７にて算出した特徴量を、特徴量の差の行３７８に「第一」において取得した特徴量の差を記憶する。そして、ステップＳ９０５に戻る。
【０１０４】
ステップＳ９０９において、改ざん検出装置１１５は、最小の特徴量の差を与えた２値化閾値を取得する。
具体的には、改ざん検出装置１１５は、特徴量データ２５４の特徴量の差のうち最小の特徴量の差に対応している２値化閾値を改ざん検出対象領域に関連付けて記憶する（図１１（ｄ）、図１２（ｄ）の２値化閾値マップ）。そして、ステップＳ９０３に戻る。
２値化閾値マップは、最小の特徴量の差を与えた２値化閾値を、改ざん検出対象領域に対応付けて記憶した表である。
「確定特徴量」には、特徴量データ２５４の特徴量のうち、特徴量の差が最小である特徴量が相当する。
「改ざん判別用ｎ値化閾値」には、２値化マップの各領域の２値化閾値が相当する。なお、２値化をｎ値化と一般化することができることは前記の通りである。
【０１０５】
ステップＳ９１０において、改ざん検出装置１１５は、未処理の２値化閾値があるか否かを判断する。
具体的には、改ざん検出装置１１５は、２値化閾値マップの２値化閾値のうち、未処理の２値化閾値がある場合（ステップＳ９１０“Ｙｅｓ”）は、未処理の２値化閾値を１つ保持してステップＳ９１１に進む。それ以外の場合（ステップＳ９１０“Ｎｏ”）は、ステップＳ９１４に進む。
【０１０６】
ステップＳ９１１において、改ざん検出装置１１５は、近傍の２値化閾値同士の差を算出する。
具体的には、改ざん検出装置１１５は、ステップＳ９１１において保持した２値化閾値とその上辺で隣接する改ざん検出対象領域の２値化閾値との差（上辺差）を算出し、さらに、ステップＳ９１１において保持した２値化閾値とその左辺で隣接する改ざん検出対象領域の２値化閾値との差（左辺差）を算出する。上（左）辺で隣接する改ざん検出対象領域の２値化閾値が存在しない場合は、上辺差は「０」とする。
【０１０７】
ステップＳ９１２において、改ざん検出装置１１５は、近傍の２値化閾値同士の差が判定閾値より大きいか否かを判断する。
具体的には、改ざん検出装置１１５は、上辺差の絶対値又は左辺差の絶対値の少なくともいずれかが、ステップＳ６０２において受け付けた判定閾値より大きい場合（ステップＳ９１２“Ｙｅｓ”）、改ざんが行われたと判断し、その差の絶対値（上辺差の絶対値及び左辺差の絶対値の両者が判定閾値より大きい場合は、小さくない方の差の絶対値）を保持してステップＳ９１３に進む。それ以外の場合（ステップＳ９１２“Ｎｏ”）は、改ざんが行われなかったと判断し、ステップＳ９１０に戻る。
【０１０８】
ステップＳ９１３において、改ざん検出装置１１５は、改ざん検出結果データを作成する。
具体的には、改ざん検出装置１１５は、最初にステップＳ９１３を経由したとき、行が空欄である改ざん検出結果データ２５５（図１４）を作成する。改ざん検出結果データ２５５は、改ざん検出対象領域ＩＤに関連付けて２値化閾値の差を記憶した表である。
そして、最初にステップＳ９１３を経由したとき及びそれ以降ステップ９１３を経由したとき、改ざん検出結果データ２５５の新たな行を作成し、差欄３８０にステップＳ９１２において保持した差の絶対値を、改ざん検出対象領域ＩＤ欄３７９にその差の絶対値を取得した改ざん検出対象領域を特定する改ざん検出対象領域ＩＤを記憶する。そして、ステップＳ９１０に戻る。
【０１０９】
ステップＳ９１４において、改ざん検出装置１１５は、改ざん検出結果データ２５５を文書検証端末装置１１２に送信する。
その後、ステップＳ６１０に戻る。
【０１１０】
（変形例１）
ステップＳ９１２において、改ざん検出装置１１５は、上辺差の絶対値又は左辺差の絶対値のいずれかが、ステップＳ６０２において受け付けた判定閾値より大きい場合、改ざんが行われたと判断した。しかしながら、左辺差とその直ぐ左にある左辺差との合計の絶対値又は上辺差とその直ぐ上にある上辺差との合計の絶対値のいずれかが判定閾値より大きい場合、改ざんが行われたと判断するようにしてもよい。
例えば、図１１（ｇ）の中央下及び右下の改ざん検出対象領域の左辺差は、それぞれ「＋２２」及び「−２１」である。すると、左辺差とその直ぐ左にある左辺差との合計の絶対値は、｜２２−２１｜＝１である。この「１」と判定閾値（たとえば１０）によって、右下の改ざん検出対象領域が改ざんされたか否かが判断されることになる。
図１１（ｈ）によれば、右下の改ざん検出対象領域は、改ざんされている（「Ｙ」）と判断されている。しかしながら、実は右下の改ざん検出対象領域は改ざんされておらず、「Ｙ」と判断されたのは、左辺で隣接する改ざん検出対象領域が改ざんされていることの影響を受けた結果である。当該変形例を用いると、このような影響を軽減でき、判断の精度が向上する。
【０１１１】
（変形例２）
ステップＳ９０５において、改ざん検出装置１１５は、２値化閾値の候補を所定の方法で複数個受け付けることとした。しかしながら、２値化閾値の候補は、外部から与えられるのではなく、改ざん検出装置１１５自体が複数作成するようにしてもよい。この場合、例えば１〜２５５の輝度を２値化閾値の候補としてもよい。この場合、全ての輝度について２値化処理ができるので、最良の２値化閾値を選択することができ、最良の改ざん検出ができる。また、より高速に処理を行いたい場合は、二分探索法を応用しても良い。この場合、まず輝度を０〜１２７と、１２８〜２５５に分け、それぞれの中間値である６４と１９２を最初の２値化閾値の候補とする。次に、得られた文書データ（元の文書）の特徴量と修正画像の特徴量との差の大きさを、閾値６４と閾値１９２で比べ、より小さい差を算出した方の輝度グループを選択する。例えば閾値６４の方がより小さい差を算出したとすれば、輝度０〜１２７が選択される。次に最初に戻り、輝度０〜１２７を輝度０〜６３と６４〜１２７に分け、それぞれの中間値である３２と９６を２値化の候補とし、以下繰り返すことで、小さい差の２値化閾値を選択してもよい。
【０１１２】
（文書検証処理手順のＳ６１０の詳細）
図２１に沿って、ステップＳ６１０の詳細を説明する。
ステップＳ１００１において、文書検証端末装置１１２は、改ざんが行われていると判断された改ざん検出対象領域のエントリを取得する。
具体的には、文書検証端末装置１１２は、第一に、ステップＳ６０７（Ｓ８０１）において抽出した改ざん検出対象領域レコード番号を検索キーとして改ざん検出対象データベース１０９を検索し、該当した改ざん検出対象領域レコード２５１（図５（ａ）参照）を取得する。
第二に、改ざん検出結果データ２５５（図１４参照）のすべての行の改ざん検出対象領域ＩＤを検索キーとして、「第一」において取得した改ざん検出対象領域レコード２５１を検索し、該当したすべての行の始点及び終点を取得する。そして、始点及び終点の組をエントリとする。
【０１１３】
ステップＳ１００２において、文書検証端末装置１１２は、未処理のエントリがあるか否かを判断する。
具体的には、文書検証端末装置１１２は、未処理のエントリがある場合（ステップＳ１００２“Ｙｅｓ”）は、始点及び終点を保持して、ステップＳ１００３へ進む。それ以外の場合（ステップＳ１００２“Ｎｏ”）は、文書検証処理手順を終了する。
【０１１４】
ステップＳ１００３において、文書検証端末装置１１２は、改ざん検出結果を表示する。
具体的には、文書検証端末装置１１２は、図２２に示すように、修正画像３８１をディスプレイ２０６に表示し、始点及び終点に基づいて、改ざんが行われた改ざん検出対象領域３８２、３８３を強調表示する。このとき、「改ざんが検出されました」のようなメッセージ３８４を表示してもよい。そして、ステップＳ１００２に戻る。
【符号の説明】
【０１１５】
１０１文書作成システム
１０２文書作成端末装置
１０３文書特徴量抽出装置
１０４透かしデータ作成装置
１０５地紋透かし埋込装置
１０６改ざん検出対象データベース装置
１０７特徴量タイプテーブル
１０８特徴量抽出プログラム
１１０ネットワーク
１１１文書検証システム
１１２文書検証端末装置
１１３地紋透かし読取装置
１１４文書画像修正装置
１１５改ざん検出装置
１１６特徴量比較プログラム
２０１ＣＰＵ
２０２メモリ
２０３ハードディスク
２０４ネットワークインターフェース
２０５キーボード
２０６ディスプレイ
２０７スキャナ
２０８プリンタ
２０９インターフェース
２５１改ざん検出対象領域レコード
２５２重心リスト
２５３領域規定情報
２５４特徴量データ
２５５改ざん検出結果データ

【特許請求の範囲】
【請求項１】
原文書データが前記原文書データの複数の領域の特徴量を表す透かしデータとともに印刷用媒体に対して印刷された検証対象文書を読み取り、当該印刷された検証対象文書が改ざんされているか否かを検証する文書検証システムであって、
前記文書検証システムは、
前記透かしデータから、前記原文書データの複数の領域の特徴量を取得し、
前記検証対象文書の画像データの画素値をｎ値化（ｎ≧２）するｎ値化閾値の複数の候補を受け付け、
前記検証対象文書の画像データの、前記原文書データの複数の領域と対応している複数の領域に含まれる画素の画素値を、前記ｎ値化閾値の複数の候補を使用してｎ値化し、
前記ｎ値化された画素値に基づいて算出した比較用特徴量を取得し、
対応する領域毎に、前記取得した原文書データの特徴量と、前記比較用特徴量とを比較し、前記取得した原文書データの特徴量との差が最も小さい前記比較用特徴量を確定特徴量とし、
前記確定特徴量を取得する際に使用された前記ｎ値化閾値の候補を、改ざん判別用ｎ値化閾値として、対応する領域毎に取得し、
前記領域の前記改ざん判別用ｎ値化閾値を、隣接する領域の前記改ざん判別用ｎ値化閾値と比較し、比較した差が所定の値よりも大きい場合、当該領域において検証対象文書が改ざんされていると判断すること、
を特徴とする文書検証システム。
【請求項２】
前記ｎは２であり、
前記原文書データの複数の領域の特徴量は、
当該領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であり、
前記比較用特徴量は、
前記検証対象文書の画像データの複数の領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であること、
を特徴とする請求項１に記載の文書検証システム。
【請求項３】
前記検証対象文書の画像データは、
前記検証対象部文書に含まれる前記透かしデータが表す格子点の位置情報に基づいて、前記検証対象文書の歪みを修正した後のものであること、
を特徴とする請求項１に記載の文書検証システム。
【請求項４】
原文書データが前記原文書データの複数の領域の特徴量を表す透かしデータとともに印刷用媒体に対して印刷された検証対象文書を読み取り、当該印刷された検証対象文書が改ざんされているか否かを検証する文書検証システムを用いた文書検証方法であって、
前記文書検証システムは、
前記透かしデータから、前記原文書データの複数の領域の特徴量を取得し、
前記検証対象文書の画像データの画素値をｎ値化（ｎ≧２）するｎ値化閾値の複数の候補を受け付け、
前記検証対象文書の画像データの、前記原文書データの複数の領域と対応している複数の領域に含まれる画素の画素値を、前記ｎ値化閾値の複数の候補を使用してｎ値化し、
前記ｎ値化された画素値に基づいて算出した比較用特徴量を取得し、
対応する領域毎に、前記取得した原文書データの特徴量と、前記比較用特徴量とを比較し、前記取得した原文書データの特徴量との差が最も小さい前記比較用特徴量を確定特徴量とし、
前記確定特徴量を取得する際に使用された前記ｎ値化閾値の候補を、改ざん判別用ｎ値化閾値として、対応する領域毎に取得し、
前記領域の前記改ざん判別用ｎ値化閾値を、隣接する領域の前記改ざん判別用ｎ値化閾値と比較し、比較した差が所定の値よりも大きい場合、当該領域において検証対象文書が改ざんされていると判断すること、
を特徴とする文書検証方法。
【請求項５】
前記ｎは２であり、
前記原文書データの複数の領域の特徴量は、
当該領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であり、
前記比較用特徴量は、
前記検証対象文書の画像データの複数の領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であること、
を特徴とする請求項４に記載の文書検証方法。
【請求項６】
前記検証対象文書の画像データは、
前記検証対象部文書に含まれる前記透かしデータが表す格子点の位置情報に基づいて、前記検証対象文書の歪みを修正した後のものであること、
を特徴とする請求項４に記載の文書検証方法。
【請求項７】
原文書データが前記原文書データの複数の領域の特徴量を表す透かしデータとともに印刷用媒体に対して印刷された検証対象文書を読み取り、当該印刷された検証対象文書が改ざんされているか否かを検証する文書検証システムを機能させる文書検証プログラムであって、
前記文書検証プログラムは、
前記文書検証システムに対して、
前記透かしデータから、前記原文書データの複数の領域の特徴量を取得し、
前記検証対象文書の画像データの画素値をｎ値化（ｎ≧２）するｎ値化閾値の複数の候補を受け付け、
前記検証対象文書の画像データの、前記原文書データの複数の領域と対応している複数の領域に含まれる画素の画素値を、前記ｎ値化閾値の複数の候補を使用してｎ値化し、
前記ｎ値化された画素値に基づいて算出した比較用特徴量を取得し、
対応する領域毎に、前記取得した原文書データの特徴量と、前記比較用特徴量とを比較し、前記取得した原文書データの特徴量との差が最も小さい前記比較用特徴量を確定特徴量とし、
前記確定特徴量を取得する際に使用された前記ｎ値化閾値の候補を、改ざん判別用ｎ値化閾値として、対応する領域毎に取得し、
前記領域の前記改ざん判別用ｎ値化閾値を、隣接する領域の前記改ざん判別用ｎ値化閾値と比較し、比較した差が所定の値よりも大きい場合、当該領域において検証対象文書が改ざんされていると判断する処理を実行させること、
を特徴とする文書検証プログラム。
【請求項８】
前記ｎは２であり、
前記原文書データの複数の領域の特徴量は、
当該領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であり、
前記比較用特徴量は、
前記検証対象文書の画像データの複数の領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であること、
を特徴とする請求項７に記載の文書検証プログラム。
【請求項９】
前記検証対象文書の画像データは、
前記検証対象部文書に含まれる前記透かしデータが表す格子点の位置情報に基づいて、前記検証対象文書の歪みを修正した後のものであること、
を特徴とする請求項７に記載の文書検証プログラム。
【請求項１０】
原文書データが前記原文書データの複数の領域の特徴量を表す透かしデータとともに印刷用媒体に対して印刷された検証対象文書を読み取り、当該印刷された検証対象文書が改ざんされているか否かを検証する文書検証システムを機能させる文書検証プログラムを記録したコンピュータ読み取り可能な記録媒体あって、
前記文書検証システムに対して、
前記透かしデータから、前記原文書データの複数の領域の特徴量を取得し、
前記検証対象文書の画像データの画素値をｎ値化（ｎ≧２）するｎ値化閾値の複数の候補を受け付け、
前記検証対象文書の画像データの、前記原文書データの複数の領域と対応している複数の領域に含まれる画素の画素値を、前記ｎ値化閾値の複数の候補を使用してｎ値化し、
前記ｎ値化された画素値に基づいて算出した比較用特徴量を取得し、
対応する領域毎に、前記取得した原文書データの特徴量と、前記比較用特徴量とを比較し、前記取得した原文書データの特徴量との差が最も小さい前記比較用特徴量を確定特徴量とし、
前記確定特徴量を取得する際に使用された前記ｎ値化閾値の候補を、改ざん判別用ｎ値化閾値として、対応する領域毎に取得し、
前記領域の前記改ざん判別用ｎ値化閾値を、隣接する領域の前記改ざん判別用ｎ値化閾値と比較し、比較した差が所定の値よりも大きい場合、当該領域において検証対象文書が改ざんされていると判断する処理を実行させる、
文書検証プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項１１】
前記ｎは２であり、
前記原文書データの複数の領域の特徴量は、
当該領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であり、
前記比較用特徴量は、
前記検証対象文書の画像データの複数の領域に含まれる２値化された画素のうちの黒画素の重心を示す座標値であること、
を特徴とする請求項１０に記載の文書検証プログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項１２】
前記検証対象文書の画像データは、
前記検証対象部文書に含まれる前記透かしデータが表す格子点の位置情報に基づいて、前記検証対象文書の歪みを修正した後のものであること、
を特徴とする請求項１０に記載の文書検証プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図１】