説明

文書の特徴に基づく複数レベルの画像比較を用いて印刷文書を認証するための方法及び装置

【課題】画像比較による文書の変更検出をより高性能に行う。
【解決手段】注目文書画像(スキャンされた画像)と原文書画像とを、ブロック(例えば段落、グラフィックス、画像)レベル、行レベル、単語レベル及び文字レベル等の複数のレベルで比較する。段落レベルの比較においては、注目画像と原画像とが同じ数の段落を有するかと、段落が同じ大きさを有し、同じ場所にあるかを判断し、行レベル比較においては、注目画像と原画像とが同じ数の行を有するかと、行が同じ大きさを有し、同じ場所にあるかを判断し、以下同様である。文書の分割は、注目画像と原画像に対して実行され、比較のためにこれらを段落段位、行単位等に分割する。原文書は予め分割し、分割情報を後の使用のために格納しうる。認証処理は、変更がより高いレベルで検出された場合に終了し、より低いレベルでの比較が実行されないように設計しうる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は文書のスキャンされた画像と元のデジタル形式の文書を比較して印刷文書上の変更を検出する方法に関する。具体的には文書の特徴に基づく複数レベルの比較を用いた画像比較方法に関する。
【背景技術】
【0002】
閉ループ処理とは元となるデジタル文書(テキスト、グラフィックス、画像等を含みうる)を印刷し、文書の印刷されたハードコピーを例えば配布、コピー等によって活用し、その後文書のハードコピーをスキャンして再びデジタル形式に戻す処理を指す。スキャンされたデジタル文書の認証とはスキャンされた文書が元のデジタル文書の真正なコピーであるか、つまり文書がハードコピー形式において変更されたか判断することを指す。様々な形式の文書を認証する方法及び変更を検出する方法が提案されてきた。多くの文書認証方法においては変更(追加、削除)の内容が何であるかを検出することを目的としてきた。また、文書認証方法として変更の内容を判断せずに文書が変更されたか否かを判断するものもある。
【0003】
ある形式の文書認証方法においてはスキャンされた文書と元のデジタル文書との間の画像比較を実行する。このような方法は、画素に基づく変更検出方法と称されることがある。文書認証方法の他の形式としては文書の内容を表す又は文書の内容に関係するデータがバーコードに符号化され、バーコードが文書自体に印刷されて後に文書認証に役立てられる。
【0004】
従来の画素に基づく変更検出方法においては元のデジタル画像とスキャンされた画像はピクセル毎に比較されて、スキャンされた画像に変更があるかが判断される。プリンタとスキャナと両者の高空間分解能によれば、高解像度のスキャンされた画像が得られる。このような画像全体に対して従来の変更検出方法による精緻な画像比較処理を行うと、計算上大きな負担となる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、スキャンされた文書と元のデジタル文書との間で、複数レベルでの比較(複数レベルの比較)を行うことで文書を認証する、より優れた方法に向けられる。
【0006】
本発明の目的は、より高性能な、画像比較に基づく変更検出方法を提供することである。
【0007】
本発明の付加的な特徴及び効果は、以下の記述において説明され、その一部は該記述より明らかであり、又は本発明の実施により理解されうる。本発明の目的及びその他の効果は、特に、添付図面と共に、明細書の記載及びそのクレームにおいて摘示される構造によって実現され、達成される。
【課題を解決するための手段】
【0008】
これら及び/又はその他の目的を達成するために、具現化され広義に記載されているように、本発明は、注目文書画像と原文書画像とを比較して前記注目文書画像を認証する、データ処理装置において実行される方法であって、第一レベルで前記注目文書画像と前記原文書画像とを比較するステップであって、(a)前記注目文書画像を複数の第一レベル単位に分割するステップと、(b)前記原文書画像を複数の第一レベル単位に分割するステップと、(c)前記注目文書画像における前記複数の第一レベル単位と前記原文書画像における前記複数の第一レベル単位とを比較して前記注目文書画像における変更を検出ステップと、を備え、ステップ(c)で変更が検出されない場合、第二レベルで前記注目文書画像と前記原文書画像とを比較するステップであって、(d)前記注目文書画像を、前記第一レベル単位よりも小さい、複数の第二レベル単位に分割するステップと、(e)前記原文書画像を、前記第一レベル単位よりも小さい、複数の第二レベル単位に分割するステップと、(f)前記注目文書画像における前記複数の第二レベル単位と前記原文書画像における前記複数の第二レベル単位とを比較して前記注目文書画像における変更を検出するステップと、を備える。
【0009】
また、ステップ(c)は(c1)前記注目文書画像における前記第一レベル単位の数と前記原文書画像における前記第一レベル単位の数とを比較して前記注目文書画像における変更を検出するステップと、(c2)ステップ(c1)で変更が検出されない場合、前記注目文書画像における各第一レベル単位の大きさ及び位置と前記原文書画像における対応する第一レベル単位の大きさ及び位置とを比較して前記注目文書画像における変更を検出するステップと、を備え、ステップ(f)は(f1)前記注目文書画像における前記第二レベル単位の数と前記原文書画像における前記第二レベル単位の数とを比較して前記注目文書画像における変更を検出するステップと、(f2)ステップ(f1)で変更が検出されない場合、前記注目文書画像における各第二レベル単位の大きさ及び位置と前記原文書画像における対応する第二レベル単位の大きさ及び位置とを比較して前記注目文書画像における変更を検出するステップと、を備える。
【0010】
前記注目文書画像と前記原文書画像とにおける前記第一レベル単位は、それぞれがテキストの段落、グラフィックオブジェクト又は画像オブジェクトを含むブロック単位であり、前記注目文書画像と前記原文書画像とにおける前記第二レベル単位はそれぞれがテキストの行を含む行単位であるか、それぞれがテキストの単語を含む単語単位であるか、又はそれぞれがテキストの文字を含む文字単位である。
【0011】
他の側面において、本発明は、データ処理装置を制御して上述の方法を実行するコンピュータに読取可能なプログラムコードが埋め込まれたコンピュータに使用可能な媒体(例えば、メモリ又は記憶装置)を含むコンピュータプログラム製品を提供する。
【0012】
当然のことながら、先の一般的記載及び後の詳細な説明は、例示的かつ説明的なものであり、請求の範囲に記載された発明について更なる説明を提供することを意図するものである。
【図面の簡単な説明】
【0013】
【図1a】ブロック単位、行単位、単語単位で分割された文書画像の概略図を図示する。
【図1b】ブロック単位、行単位、単語単位で分割された文書画像の概略図を図示する。
【図1c】ブロック単位、行単位、単語単位で分割された文書画像の概略図を図示する。
【図2a】本発明の実施形態による、複数レベルの比較を用いた文書認証方法を図示する。
【図2b】文書認証方法のさらなる処理ステップを図示する。
【発明を実施するための形態】
【0014】
ここで説明された変更検出方法はメモリに記録されたソフトウェア又はファームウェアによって実現し、例えばコンピュータやデータ処理装置を有するプリンタ又はスキャナ等のあらゆる適切なデータ処理装置によって実行しうる。この点については、下記の方法を実行するために符号化される、コンピュータにより実行可能なソフトウェアは、適切なデータ処理装置の中央処理装置(CPU)又はマイクロプロセッサ(MPU)によってアクセスされるコンピュータのメモリに格納されうる。コンピュータは文書やその他のデータを格納する大容量記憶装置に接続される。印刷及びスキャンするステップはあらゆるプリンタ、スキャナ又は印刷部及びスキャナ部を単一の装置に組み合わせたオールインワン装置によって実行しうる。これらの機器及び装置の構成は公知のものであり、ここでは詳細な説明は省略される。
【0015】
本発明の実施形態は画像を比較するという手段に基づいて文書の変更を検出する方法(文書認証方法とも称される)を提供するものであり、この方法では複数のレベルにおいて画像の比較を実行する。具体的には、当該文書認証方法においてはスキャンされたデジタル文書画像(以下、注目文書画像と称する)、と元のデジタル文書画像(以下、原文書画像と称する)とを複数のレベルにおいて比較して、高いレベルの比較(例えば粗い比較)から段階的に低いレベルの比較(例えば細かい比較)を行って、注目文書画像の変更を検出する。例えば、高いレベルの比較はブロックレベルの比較であり、注目文書画像が原文書画像と同じ数のブロックを有するかを判断し、各ブロックが注目文書画像と原文書画像との間でほぼ同じ大きさであるかとほぼ同じ位置にあるかを判断しうる。各ブロック単位はテキストの段落、画像又はグラフィックオブジェクト等を含みうる。より低いレベルでの比較は行レベルの比較であり、注目文書画像と原文書画像が同じ数の行を有するかを判断し、各行が注目文書画像と原文書画像との間でほぼ同じ大きさであるかと、ほぼ同じ位置にあるかを判断する。さらに低いレベルの比較は例えば単語レベル、文字レベル等があげられる。
【0016】
認証処理は、一旦あるレベルで変更が検出されると、処理を終了させてユーザに変更が検出されたメッセージをユーザに通知し、より低いレベルでのさらなる比較が実行されないように設計しうる。また、当該処理はインタラクティブな処理として設計し、変更が検出されると、データ処理装置はその結果についてユーザに通知し、ユーザはさらに比較を続けるか処理を終了するかを選択しうる。
【0017】
複数レベルの画像比較の方法は文書構造が通常階層的であり、文書のレイアウト構造もまた通常階層的であるという前提に基づいている。当該方法は文書の階層的特徴を活用し、異なるレベルの認証による解決策を提供する。
【0018】
複数レベル画像比較を実行するには、注目文書画像と原文書画像との両方が異なるレベルにおいて、異なるレベルの単位で分割され、単位にはブロック単位、行単位、単語単位及び文字単位が含まれる。各分割された単位は境界ボックスによって設定され、境界ボックスとは四方から各単位の境界を示すボックス(好ましくは矩形のもの)である。この処理は画像分割と称される。一般に、低いレベルの単位の境界ボックスは高いレベルの単位の境界ボックスよりも小さいものであり、高いレベルの単位の境界ボックスは複数の低いレベルの単位の境界ボックスを完全に包囲する。
【0019】
図1a、1b及び1cは画像分割の概略図を図示する。図1aは文書画像(実線の境界で示される)のあるページが示されており、当該ページは点線の矩形で示された複数のブロック単位で分割される。図1bは文書画像のあるページが示されており、当該ページは点線の矩形で示された複数の行単位で分割される。図1cは文書画像のあるページが示されており(テキストのいくつかの行しか示されていない)、当該ページは点線の矩形で示された複数の単語単位で分割される。
【0020】
画像分割を実現する方法としていくつかの方法が用いられる。ある方法においては、水平ヒストグラム(又は水平投影)が垂直軸に沿って画素の各行にある白ではない画素の数を描くことによって生成される。このような水平ヒストグラムはテキストの各行の間の空白に対応する、低い数値の部分とテキストの各行に対応するより高い数値の部分(ほぼ同じ幅)を有することが多い。このようなヒストグラムを用いて文書分割のための行単位を特定することができる。また、文書の段落間隔が行間隔と異なる場合は、ブロック(例えば段落)単位はこのようなヒストグラム(ヒストグラムにおけるより大きな隙間は段落の切れ目を示し、ヒストグラムにおけるより小さな隙間は行の切れ目を示す)から特定しうる。さらに、行の開始及び終了に関する情報はブロックの抽出に役立てられうる。さらに、複数オブジェクトや複雑なレイアウトデザインの場合は、ある領域における異なる種類のオブジェクトの存在はヒストグラムの分布を分析することによって特定することができ、次に当該領域の水平投影を分析してデータブロックを抽出することができる。
【0021】
さらに、特定された各行単位については、垂直ヒストグラム(又は垂直投影)が水平軸に沿って画素の各列にある白ではない画素の数を描くことによって生成される。このような垂直ヒストグラムはテキストの各文字の間の空白に対応する、低い数値の部分と各文字に対応するより高い数値の部分を有することが多い。また、垂直ヒストグラムにおけるより大きな空白は各単語の間の空白に対応し、単語を特定するのに用いることができる。よって、垂直及び水平ヒストグラムを用いて、文書のテキストはブロック(例えば段落)単位、行単位、単語単位及び文字単位で分割することができる。
【0022】
他の文書分割方法においては、形態学的膨張処理が画像に実行され、単語単位に対応する近接する文字を濃いブロックに融合する。膨張は形態学的画像処理における公知の技術であり、通常、結果として画像の濃い部分が広がる。各文字が単語単位に融合されると、さらにグルーピングされて、行単位及びブロック(例えば段落)単位を形成する。
【0023】
他の文書分割方法においては、連結した画像要素(例えばバイナリ画像の場合は画素の連結したグループ)が文字に対応するとして特定され、これらの連結した画像要素から文字単位が形成される。文字単位が形成されると、これらをグルーピングして単語単位、行単位及びブロック(例えば段落)単位を形成することができる。
【0024】
その他の文書分割方法も存在する。このような方法には知識に基づくものがあり、文書構造の知識を用いて、画像を分割する。
【0025】
本発明の実施形態によれば、複数レベルの認証方法によって注目文書画像と原文書画像とを異なるレベルの単位で分割し、二つの画像の各レベルにおける各単位の数(個数)を比較するとともに、二つの画像の各単位の境界ボックスの大きさ及び位置を比較する。処理は高いレベルの単位(ブロック単位、行単位等)から開始され、一旦変更が発見されると、あらゆるレベルで終了させることができる。
【0026】
具体的には図2aで図示されるように、当該処理はまず注目文書画像と原文書画像とをブロック単位で分割し、各ブロック単位は境界ボックスによって設定される(ステップS201)。注目文書画像と原文書画像におけるブロック単位の個数は比較される(ステップS202)。個数が異なる場合は(ステップS202、「N」)、注目文書画像が変更されたと判断され、適切なメッセージが表示されるか、さらなる処理が実行される(ステップA、詳細は後述)。注目文書画像と原文書画像のブロック単位の個数が同じである場合(ステップS202、「Y」)、注目文書画像と原文書画像との間で対応する境界ボックスの大きさ及び位置が比較される(ステップS203)。注目文書画像と原文書画像との間で対応する境界ボックスの大きさ又は位置が異なる場合(ステップS204、「N」)、注目文書画像は変更されたと判断され、適切なメッセージが表示されるか、さらなる処理が実行される(ステップA)。
【0027】
注目文書画像と原文書画像との間で対応する境界ボックスの大きさ及び位置を比較する場合は例えば数画素分の許容範囲を設定し、二つの境界ボックスの大きさの差や位置の差が許容範囲内の場合、比較の便宜上同じ大きさまたは位置としうる。
【0028】
ステップS201からS204は「注目文書画像と原文書画像とをブロック単位で分割し、ブロック単位を比較して、変更を検出する」ステップとまとめて称しうる。
【0029】
注目文書画像と原文書画像との間の対応する境界ボックスがすべて同じ大きさ及び位置である場合は(ステップS204、「Y」)、処理は続き、注目文書画像と原文書画像は行単位で分割され、各行単位は境界ボックスによって設定される(ステップS205)。ブロックレベルの比較と同様に、行レベルでは、処理はまず注目文書画像と原文書画像との間で行単位の数(個数)が同じか判断し(ステップS206)、続いて注目文書画像と原文書画像との間で対応する境界ボックスの大きさ及び位置を比較する(ステップS207、ステップS208)。行単位の個数が異なる場合(ステップS206、「N」)又は対応する境界ボックスの大きさもしくは位置が異なる場合(ステップS208、「N」)、注目文書は変更されたと判断され、適切なメッセージが表示されるか、さらなる処理が実行されうる(ステップA)。
【0030】
ステップS205からS208は「注目文書画像と原文書画像とを行単位で分割し、行単位を比較して、変更を検出する」ステップとまとめて称しうる。
【0031】
行単位の比較の後で、変更が検出されない場合は(ステップS208、「Y」)、ステップS209からS212において単語レベルの比較が実行される。単語レベルの比較の後で、変更が検出されない場合は(ステップS212、「Y」)、ステップS213からS216において文字単位の比較が実行される。これらの二つのレベルの比較は、ブロックレベル及び行レベルの比較と同様のステップを含み、その詳細な説明は省略される。ステップS209からS212は「注目文書画像と原文書画像とを単語単位で分割し、単語単位を比較して、変更を検出する」ステップとまとめて称しうる。ステップS213からS216は「注目文書画像と原文書画像とを文字単位で分割し、文字単位を比較して、変更を検出する」ステップとまとめて称しうる。
【0032】
ブロック、行、単語及び文字レベルでの検出ステップにおいて変更が検出されない場合は(ステップS216,「Y」)処理は更なる変更検出ステップを実行する処理に移行する(詳細チェック)(ステップS217)。詳細チェックにおいては、注目文書画像と原文書画像との間で、またはそれらの選択された部分について全体的な比較を階層的ではない方法で行う。詳細チェックのステップでは公知の画像比較方法を採用することができ、例えば二つのビットマップ画像の直接的な画素と画素との間の比較、各テキスト文字の中心線(スケルトン)を用いたスケルトンの比較、エッジ抽出及びエッジマップの比較、類似性の比較、垂直及び水平の両方向でのヒストグラムの比較、分解方法(フーリエ変換またはコサイン変換を実行し、変換を比較する)等が挙げられる。詳細チェックのステップとして用いることができる画像比較の方法としては重心の位置を比較する方法が挙げられ、共有の同時係属出願で、2009年6月30日に出願されたUS特許出願出願番号12/495749、名称「画像比較分析を用いて印刷文書の変更を検出する方法」に記載される。その他の適切な画像比較方法を詳細チェックのステップにおいて用いることができ、将来開発されるものも含まれる。詳細チェックのステップS217には例えば変更が検出されたか、変更された箇所の位置等の比較の結果を示す適切なメッセージを表示することが含まれる。
【0033】
どのレベルにおいても、変更が検出された場合、つまりステップS202、S204、S206,S208、S210、S212、S214及びS216における「N」の場合、続いて図2bに示される処理が実行される。図2bにおけるステップには実施例によっては任意のものが含まれる。簡易な実施例においては、当該処理はメッセージを表示して(ステップS218)、終了する。メッセージは変更が検出されたことを示す一般的なメッセージか、「ブロックの個数が違う」等さらに変更の種類を示す具体的なメッセージでありうる。メッセージはまた検出された変更が文書画像のどこに位置するかを示す画像を含みうる。例えば、注目文書画像の第三ブロックが原文書画像の第三ブロックと異なる大きさを有する場合は、反転表示されたボックスを示す画像を表示し、注目文書又は原文書の第三ブロックを示しうる。当然ながら、このような具体的なメッセージを生成するには図2aに示される変更検出のステップにおいて異なるフラッグ又はその他の手段を用いて検出された、異なる種類の変更を示すことが必要となる。
【0034】
他の実施例としては、処理は変更の性質をさらに判断しうる。ある例においては、注目文書画像と原文書画像との間でブロックの個数が異なる場合、処理はブロック単位の大きさ及び位置を比較することによってブロック全体が削除又は追加されているかを判断しうる。例えば、注目文書画像と原文書画像のブロック単位1から3が同じ大きさ及び位置であり、注目文書画像のブロック単位4から6が原文書画像のブロック単位5から7と同じ大きさを有すると判断された場合、処理では、原文書画像におけるブロック単位4が注目文書画像から削除された可能性があることをユーザに示唆するメッセージを表示する。
【0035】
よりインタラクティブな実施例においては、ステップS218に表示されるメッセージは、例えば処理を終了するか又はさらなる検出(詳細チェック)を実行するかなど、ユーザに対して指示の入力を促すプロンプトを含みうる。図2bに示されるように、詳細チェックを実行する指示がユーザから受け付けられた場合(ステップS219、「Y」)、詳細チェックの処理が実行され(ステップS220)、当該処理は詳細チェックのステップS217と同様または全く同じものとなりうる。
【0036】
また、詳細チェックのステップS217及びS220は任意であり、ユーザはセキュリティレベルパラメータを設定し、詳細チェックを実行する条件を決定しうる。例えば、セキュリティパラメータはブロックレベル、行レベル、単語レベル及び文字レベルでの検出において変更が検出されなかった場合には詳細チェックが実行されないというレベルに設定されうる。また、セキュリティパラメータはブロックレベル、行レベル及び単語レベルでの変更が検出されたが文字レベルでの変更のみが検出されなかった場合に詳細チェックを実行する等というレベルに設定しうる。このような柔軟な対応に対応するため、図2a及び2bにおけるフローチャートは適宜修正される。
【0037】
その他の検出の基準を採用することができる。例えば、「警告」や「エラー」等、検出された変更の性質によって、二つの種類のメッセージを生成するように認証処理を設計しうる。ある例においては、ブロックをグルーピングする際、より厳格又はより寛容な閾値を用いることによって異なるグルーピングの結果を得られうる。よって、より寛容な閾値で発見されたグルーピングの違いの場合ではエラーメッセージが生成されるのに対し、厳格な閾値でのみ発見されたグルーピングの違いの場合では警告メッセージが生成される。他の例では、注目文書で余分なブロックが検出されたが、その大きさが小さく、位置がページの境界にある場合は、ノイズである可能性の方が高いので、警告メッセージのみが生成される。二つのレベルのメッセージ(「警告」及び「エラー」)が採用される場合、エラーが検出された場合に処理を終了するが、警告のみが検出された場合は(適切なメッセージを表示しながら)処理を続行するように処理を設計しうる。
【0038】
図2aで示される処理において、原文書画像の分割を予め実行し、その結果を原文書画像と対応付けてデータベースに格納しうる。よって、同じ原文書画像に対して複数の注目文書画像の認証が要求されている場合、格納された分割情報がデータベースから読み出されて、原文書画像の分割処理を繰り返す必要はない。また、図2aに示されるように、認証処理の際に、注目文書画像と原文書画像とで文書分割が独立して実行される。
【0039】
さらに、原文書の元の形式、例えばワード又はPDF形式のものが利用できる場合は、元の形式のものを活用して原文書画像の分割を行いうる。
【0040】
また、原文書画像の文書分割がすでに利用可能である場合は、注目文書画像の分割において、すでになされている原文書画像の分割を活用することができる。よって、当該処理では、最初から注目文書画像を分割することを試みる代わりに、原文書画像の、すでになされている分割単位の位置における、同じブロック単位、行単位等を注目文書画像で探すことを試みる。つまり、当該処理では原文書画像と同じ分割が注目文書画像においても存在するかを照合することを試みる。
【0041】
原文書の分割情報はXML、SGML等の構文解析が可能なファイル形式に格納しうる。よって、文書の特定の部分のみについて認証が要求されている場合、分割情報が格納されるファイルを構文解析して対応するタグを発見して、指定された領域の認証を実行する。
【0042】
上述のように、本発明の実施形態に基づく複数レベルの比較方法によれば、文書レイアウトの階層的性質を活用して、全体的な画像比較を実行しなくても、特定の変更を迅速に検出することができることが認められる。これにより文書認証の性能が向上する。
【0043】
上述の文書認証処理は比較的強固であり、印刷及びスキャン処理による文書画像の品質劣化に対しても耐性を有する。これは、文字が印刷及びスキャンによって太くなったり細くなったりしても、ブロック単位、行単位、単語単位及び文字単位の数は印刷及びスキャン処理でも変更されないからである。また、印刷及びスキャンによって文字が太くなったり細くなったりしても、このような変化は画像全体にわたって一貫していることが多い。よって、文字が太くなったり細くなったりすることによる境界ボックスの大きさの変更は画像全体にわたって比較的一貫している。また、プリンタ又はスキャナが統一されていない特性を有し、その結果画像内で一貫しない大きさの変更が生じたとしても、近接する単位の間では急激な大きさの変更はないと思われる。
【0044】
本発明の趣旨及び範囲を逸脱することなく、本発明の複数レベルの画像比較を用いた文書認証方法に種々の改良及び変更を加えうることは、当業者において明らかである。このように、本発明は、添付のクレーム及びその均等物の範囲内において生じる改良及び変更を網羅することが意図されている。

【特許請求の範囲】
【請求項1】
注目文書画像と原文書画像とを比較して前記注目文書画像を認証する、データ処理装置において実行される方法であって、
第一レベルで前記注目文書画像と前記原文書画像とを比較するステップであって、
(a)前記注目文書画像を複数の第一レベル単位に分割するステップと、
(b)前記原文書画像を複数の第一レベル単位に分割するステップと、
(c)前記注目文書画像における前記複数の第一レベル単位と前記原文書画像における前記複数の第一レベル単位とを比較して前記注目文書画像における変更を検出ステップと、を備え、
ステップ(c)で変更が検出されない場合、第二レベルで前記注目文書画像と前記原文書画像とを比較するステップであって、
(d)前記注目文書画像を、前記第一レベル単位よりも小さい、複数の第二レベル単位に分割するステップと、
(e)前記原文書画像を、前記第一レベル単位よりも小さい、複数の第二レベル単位に分割するステップと、
(f)前記注目文書画像における前記複数の第二レベル単位と前記原文書画像における前記複数の第二レベル単位とを比較して前記注目文書画像における変更を検出するステップと、を備える。
【請求項2】
ステップ(c)は
(c1)前記注目文書画像における前記第一レベル単位の数と前記原文書画像における前記第一レベル単位の数とを比較して前記注目文書画像における変更を検出するステップと、
(c2)ステップ(c1)で変更が検出されない場合、前記注目文書画像における各第一レベル単位の大きさ及び位置と前記原文書画像における対応する第一レベル単位の大きさ及び位置とを比較して前記注目文書画像における変更を検出するステップと、を備え、
ステップ(f)は
(f1)前記注目文書画像における前記第二レベル単位の数と前記原文書画像における前記第二レベル単位の数とを比較して前記注目文書画像における変更を検出するステップと、
(f2)ステップ(f1)で変更が検出されない場合、前記注目文書画像における各第二レベル単位の大きさ及び位置と前記原文書画像における対応する第二レベル単位の大きさ及び位置とを比較して前記注目文書画像における変更を検出するステップと、を備える請求項1に記載の方法。
【請求項3】
前記注目文書画像と前記原文書画像とにおける前記第一レベル単位は、それぞれがテキストの段落、グラフィックオブジェクト又は画像オブジェクトを含むブロック単位であり、前記注目文書画像と前記原文書画像とにおける前記第二レベル単位はそれぞれがテキストの行を含む行単位であるか、それぞれがテキストの単語を含む単語単位であるか、又はそれぞれがテキストの文字を含む文字単位である請求項1に記載の方法。
【請求項4】
前記注目文書画像と前記原文書画像とにおける前記第一レベル単位はそれぞれがテキストの行を含む行単位であり、前記注目文書画像と前記原文書画像とにおける前記第二レベル単位はそれぞれがテキストの単語を含む単語単位であるか、又はそれぞれがテキストの文字を含む文字単位である請求項1に記載の方法。
【請求項5】
前記注目文書画像と前記原文書画像とにおける前記第一レベル単位はそれぞれがテキストの単語を含む単語単位であり、前記注目文書画像と前記原文書画像とにおける前記第二レベル単位はそれぞれがテキストの文字を含む文字単位である請求項1に記載の方法。
【請求項6】
ステップ(f)で変更が検出されない場合、前記注目文書画像と前記原文書画像との間で又は選択された部分で、全体的な比較を実行して前記注目文書画像の変更を検出するステップをさらに備える請求項1に記載の方法。
【請求項7】
ステップ(c)又はステップ(f)で変更が検出される場合、変更が検出されたことを示すメッセージを表示する請求項1に記載の方法。
【請求項8】
前記メッセージはさらに変更の種類を示す請求項7に記載の方法。
【請求項9】
データ処理装置に以下のステップを含む、注目文書画像と原文書画像とを比較することによって前記注目文書画像を認証する処理を実行させるように構成されたコンピュータ読取可能なコードを含み、データ処理装置を制御するコンピュータ読取可能なコードが埋め込まれたコンピュータ読取可能な媒体を含むコンピュータプログラム製品であって、前記処理は、
第一レベルで前記注目文書画像と前記原文書画像とを比較するステップであって、
(a)前記注目文書画像を複数の第一レベル単位に分割するステップと、
(b)前記原文書画像を複数の第一レベル単位に分割するステップと、
(c)前記注目文書画像における前記複数の第一レベル単位と前記原文書画像における前記複数の第一レベル単位とを比較して前記注目文書画像における変更を検出ステップと、を備え、
ステップ(c)で変更が検出されない場合、第二レベルで前記注目文書画像と前記原文書画像とを比較するステップであって、
(d)前記注目文書画像を、前記第一レベル単位よりも小さい、複数の第二レベル単位に分割するステップと、
(e)前記原文書画像を、前記第一レベル単位よりも小さい、複数の第二レベル単位に分割するステップと、
(f)前記注目文書画像における前記複数の第二レベル単位と前記原文書画像における前記複数の第二レベル単位とを比較して前記注目文書画像における変更を検出するステップと、を備える。
【請求項10】
ステップ(c)は
(c1)前記注目文書画像における前記第一レベル単位の数と前記原文書画像における前記第一レベル単位の数とを比較して前記注目文書画像における変更を検出するステップと、
(c2)ステップ(c1)で変更が検出されない場合、前記注目文書画像における各第一レベル単位の大きさ及び位置と前記原文書画像における対応する第一レベル単位の大きさ及び位置とを比較して前記注目文書画像における変更を検出するステップと、を備え、
ステップ(f)は
(f1)前記注目文書画像における前記第二レベル単位の数と前記原文書画像における前記第二レベル単位の数とを比較して前記注目文書画像における変更を検出するステップと、
(f2)ステップ(f1)で変更が検出されない場合、前記注目文書画像における各第二レベル単位の大きさ及び位置と前記原文書画像における対応する第二レベル単位の大きさ及び位置とを比較して前記注目文書画像における変更を検出するステップと、を備える請求項9に記載のコンピュータプログラム製品。
【請求項11】
前記注目文書画像と前記原文書画像とにおける前記第一レベル単位は、それぞれがテキストの段落、グラフィックオブジェクト又は画像オブジェクトを含むブロック単位であり、前記注目文書画像と前記原文書画像とにおける前記第二レベル単位はそれぞれがテキストの行を含む行単位であるか、それぞれがテキストの単語を含む単語単位であるか、又はそれぞれがテキストの文字を含む文字単位である請求項9に記載のコンピュータプログラム製品。
【請求項12】
前記注目文書画像と前記原文書画像とにおける前記第一レベル単位はそれぞれがテキストの行を含む行単位であり、前記注目文書画像と前記原文書画像とにおける前記第二レベル単位はそれぞれがテキストの単語を含む単語単位であるか、又はそれぞれがテキストの文字を含む文字単位である請求項9に記載のコンピュータプログラム製品。
【請求項13】
前記注目文書画像と前記原文書画像とにおける前記第一レベル単位はそれぞれがテキストの単語を含む単語単位であり、前記注目文書画像と前記原文書画像とにおける前記第二レベル単位はそれぞれがテキストの文字を含む文字単位である請求項9に記載のコンピュータプログラム製品。
【請求項14】
ステップ(f)で変更が検出されない場合、前記注目文書画像と前記原文書画像との間で又は選択された部分で、全体的な比較を実行して前記注目文書画像の変更を検出するステップをさらに備える請求項9に記載のコンピュータプログラム製品。
【請求項15】
ステップ(c)又はステップ(f)で変更が検出される場合、変更が検出されたことを示すメッセージを表示する請求項9に記載のコンピュータプログラム製品。
【請求項16】
前記メッセージはさらに変更の種類を示す請求項15に記載のコンピュータプログラム製品。




【図1a】
image rotate

【図1b】
image rotate

【図1c】
image rotate

【図2a】
image rotate

【図2b】
image rotate


【公開番号】特開2011−159283(P2011−159283A)
【公開日】平成23年8月18日(2011.8.18)
【国際特許分類】
【外国語出願】
【出願番号】特願2010−289551(P2010−289551)
【出願日】平成22年12月27日(2010.12.27)
【出願人】(507031918)コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド (157)
【Fターム(参考)】