説明

文字の形状特徴を使用した文字比較による文書改変検知方法

【課題】文書改変検知方法は、文字を実際に認識することなく、文字の形状特徴を比較することにより、オリジナル画像とターゲット画像を比較する。
【解決手段】文字の境界ボックスが両方の画像について生成され、それぞれの境界ボックスは一つの文字に関する一つ以上の連結されたピクセル群を有する。オリジナル画像およびターゲット画像の境界ボックスは、対応するペアを形成する。一方の画像中にある境界ボックスが、もう一方の画像中に対となる境界ボックスを持たない場合、文書の追加および削除が検知される。境界ボックスの各ペアはその形状特徴を比較するために処理される。形状特徴は、文字のオイラー数と、境界ボックスのアスペクト比と、境界ボックスのピクセル密度と、二つの文字間のハウスドルフ距離とを含む。二つの文字は、形状特徴の比較に基づき、同一の文字または異なる文字と判定される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ターゲットとする文書におけるオリジナルの文書に関する改変を検知する方法に関し、特に改変を検知するために文字の形状特徴を用いる改変検知方法に関する。
【背景技術】
【0002】
閉ループプロセスとは、オリジナルのデジタル文書(文字、図形、画像等を含む)を印刷し、印刷された文書のハードコピーを配布および複製等の方法で利用し、また文書のハードコピーをスキャンして再びデジタル形式に戻すことを指す。スキャンされたデジタル文書の認証とは、スキャンされた文書がオリジナルのデジタル文書の真正な複製であるかどうか、すなわちその文書がハードコピーの状態で改変されたかどうかを判定することを指す。様々な種類の文書認証および文書改変検知方法が提唱されている。多くの文書認証方法の目的は、追加や削除といった改変の内容を検知することである。文書認証方法の一種類においては、オリジナルのデジタル文書とスキャンされた文書の画像比較を行う。これは、ピクセルベースの改変検知方法と呼ばれることがある。他の種類の文書認証方法においては、文書の内容を表すデータまたは文書の内容に関連するデータがバーコードとして符号化され、後で行う文書認証を補助するために、そのバーコードが文書そのものの上に印刷される。
【発明の概要】
【発明が解決しようとする課題】
【0003】
従来のピクセルベースの改変検知方法において、対象となるスキャンされた画像に改変点があるかどうかを判定するために、オリジナルのデジタル画像とスキャンされた画像についてピクセル毎の比較を行う。プリンターとスキャナーの両方の解像度が高ければ、スキャンされた画像の解像度も高くなる。従来の改変検知方法における画像全体について網羅的に画像比較を行う処理は、非常に計算量が多い。
【0004】
さらに、ピクセル毎の比較は、誤った改変検知を行うことがある。例えば、オリジナル画像とターゲット画像の同じ位置にある二つの文字が、たとえ二つの文字が同一(すなわち文字が改変されていない)の場合でも、ターゲット画像とオリジナル画像においてピクセルレベルでの相違点は存在しうる。ターゲット文書を生成する印刷およびスキャンの過程によって生じる、このようなピクセルレベルの違いが、誤った改変検知につながる可能性がある。
【課題を解決するための手段】
【0005】
本発明は、オリジナルのデジタル文書の画像とスキャンされた文書の画像との画像比較を行うことにより、文書の認証方法の改良を目指したものである。
【0006】
本発明の目的は、誤った改変検知を抑止する画像比較に基づく改変検知方法を提供することである。
【0007】
本発明の追加の特徴および利点は以下の説明に記載され、ある程度は説明から明らかであり、または本発明の実施により知ることができる。本発明の目的および他の利点は、それについて記載された明細書、特許請求の範囲および添付の図面において特に指摘された構造によって実現および達成される。
【0008】
本書において具現化され、広範に記載された目的及び他の目的を達成するために、本発明は二値のビットマップ画像であるオリジナル画像およびターゲット画像の間における改変を検知するために、情報処理装置内に実装される方法であって、(a)それぞれが一文字に関する一つ以上の連結したピクセル群を有する複数の境界ボックスを、オリジナル画像およびターゲット画像の中に定義するステップと、(b)オリジナル画像およびターゲット画像それぞれにおいて実質的に同じ位置にある複数の対となる境界ボックスのペアを、オリジナル画像およびターゲット画像の中に特定するステップと、(c)それぞれの対となる境界ボックスのペアについて、(c1)(1)境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数と、(2)境界ボックスのペアそれぞれのアスペクト比と、(3)境界ボックスの文字に属するピクセル数を境界ボックス全体のピクセル数で割って得られる境界ボックスのペアそれぞれのピクセル密度と、(4)文字のペア間のハウスドルフ距離とを含む複数の形状特徴を算出し、(c2)(1)文字のペアのオイラー数が等しいかどうか、(2)境界ボックスのペアのアスペクト比の差分が所定の第一閾値よりも小さいかどうか、(3)境界ボックスのペアのピクセル密度の差分が所定の第二閾値よりも小さいかどうか、(4)文字のペア間のハウスドルフ距離が所定の第三閾値よりも小さいかどうか、を評価することにより境界ボックスのペアにより囲まれる文字が、同一の文字か異なる文字かを判定するステップと、を含む文書改変検知方法を提供する。
【0009】
一つの例において、ステップ(c2)は、(1)文字のペアのオイラー数が等しく、(2)文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、その文字のペアが同一の文字だと判定するステップと、そうでない場合には、その文字のペアが異なる文字だと判定するステップとを含む。
【0010】
その他の態様において、本発明は、各境界ボックスに囲まれた一つ以上の連結されたピクセル群である文字であって二値のビットマップ画像であるオリジナル画像およびターゲット画像のそれぞれの中にある二つの文字を比較するために、情報処理装置において実行される方法であって、(a)(1)境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数と、(2)境界ボックスのペアそれぞれのアスペクト比と、(3)境界ボックスの文字に属するピクセル数を境界ボックス全体のピクセル数で割って得られる境界ボックスのペアそれぞれのピクセル密度と、(4)文字のペア間のハウスドルフ距離とを含む複数の形状特徴を算出するステップと、(b)(1)文字のペアのオイラー数が等しいかどうか、(2)境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、(3)境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、(4)文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうかを評価することにより境界ボックスのペアにより囲まれる文字が、同一の文字か異なる文字かを判定するステップと、を含む文字比較方法を提供する。
【0011】
その他の態様において、本発明は、情報処理装置を制御するために組み込まれたコンピュータプログラムと、情報処理装置が上記の方法を実行するように設定されたコンピュータプログラムとをその中に含むコンピュータで使用可能な非一時的記憶媒体(例えばメモリまたは記憶装置)を有するコンピュータプログラムおよびコンピュータプログラム製品を提供する。
【0012】
前述の概要及び以下の詳述は、いずれも典型例及び説明を示すものであり、特許請求の範囲に記載された発明の仔細な説明を提供することを目的としている。
【図面の簡単な説明】
【0013】
【図1】本発明の実施形態に係る改変検知方法のフローチャートを示す図である。
【図2】図1のプロセスにおける形状特徴比較のステップを仔細に示すフローチャートである。
【図3a】それぞれが一つの文字を囲む二つの境界ボックスを示す図である。
【図3b】図3aに示す二つの文字から生成される二つのスケルトンを示す図である。
【発明を実施するための形態】
【0014】
本発明の実施形態に係る文書改変検知方法は、文字の形状特徴の比較を用いて、オリジナルのデジタル文書画像とスキャンされたデジタル文書画像(ターゲット画像)の比較を行う。ターゲット画像とオリジナル画像にある二つの文字は、実際に文字を認識することなく様々な文字の形状特徴を分析することにより、同じ文字または異なる文字と判定される。言い換えれば、文字認識(すなわちある文字を特定の言語における特定の文字と認識すること)は必要ではない。
【0015】
図1および図2を参照して、改変検知方法をより詳細に説明する。図1は本発明の実施形態に係る改変検知方法のフローチャートである。図2は図1におけるステップS15を更に詳細を示すものである。
【0016】
第一に、未加工オリジナル画像および未加工ターゲット画像を取得する(ステップ11)。両方の画像はビットマップ画像とする。一般に、未加工ターゲット画像は、元々オリジナルのデジタル文書から印刷された文書のハードコピーをスキャンすることにより取得する。例えば、オリジナルのデジタル文書は、コンピュータの文書加工アプリケーションにより生成した文書、ハードコピーをスキャンすることにより得られる画像、カメラで撮影した写真等である。オリジナルのデジタル文書が印刷された後、そのハードコピーは、未加工ターゲット画像を生成するためにスキャンし直されるまでの間に、回覧や複写等が行われる。ある実施形態における認証または改変検知プロセスの目的は、最初に印刷された時からスキャンし直されるまでの間、ハードコピー文書が改変されたかどうかを検知することである。
【0017】
ステップS11で取得する未加工オリジナル画像は、オリジナルのデジタル文書から生成した画像でもよいし、オリジナルのデジタル文書そのものでもよい。例えば、オリジナルのデジタル文書が文書加工アプリケーションにより生成された文書である場合、未加工オリジナル画像は、オリジナルのデジタル文書を表示する画像を生成するコンピュータプログラムを使用して取得してもよい。また、未加工オリジナル画像は、オリジナルのデジタル文書を印刷後すぐに改変することなくスキャンして取得してもよい。また、未加工オリジナル画像は、オリジナルとみなされるハードコピー文書をスキャンして取得してもよい。未加工オリジナル画像を得るための他の方法も使用してもよい。未加工オリジナル画像はオリジナル文書を改変していない画像を表す。
【0018】
未加工オリジナル画像およびターゲット画像が例えばマイクロソフト社のワード形式やPDF形式等のようなアプリケーション特有の形式を持つ場合、それらは以降のプロセスのためにビットマップ画像に変換される。加えて、未加工オリジナル画像およびターゲット画像のビットマップ画像は、好ましくは解像度が同一となるように調整されている。
【0019】
改変検知の典型的なシナリオにおいて、未加工ターゲット画像はオリジナル文書のコピーであり、従って通常、未加工ターゲット画像は一般的にオリジナル文書に類似した外観を持ち、もし改変されていたとしても限定的な改変だと想定されていることに留意されたい。
【0020】
未加工オリジナル画像および未加工ターゲット画像は事前処理される(ステップS12)。事前処理は、すでに二値画像である場合を除き、グレースケールまたはカラーの画像を閾値により二値画像に変換する処理を含む。事前処理はまた、傾き補正、サイズ補正、位置補正のような一つ以上の歪み補正工程も含む。傾き補正は、一般に印刷工程やスキャン工程において生じる回転誤差の修正を指す。ハフ変換およびフーリエ‐メリン変換等の多くの傾き補正方法が知られている。傾き補正を行うために、未加工ターゲット画像のみを使用する方法もあれば、未加工ターゲット画像と未加工オリジナル画像の両方を使用する方法もある。本ステップにおいて、いかなる好適な傾き補正方法を使用してもよい。同様に、多くのサイズ補正方法が知られている。未加工ターゲット画像のサイズ補正を行うためには、一般に未加工オリジナル画像と未加工ターゲット画像を比較する必要がある。二つの画像の実効的なコンテンツの面積を比較するサイズ補正方法もある。本ステップにおいて、いかなる好適なサイズ補正方法を使用してもよい。未加工ターゲット画像のサイズ補正は、例えば印刷された解像度とは異なる解像度でハードコピー文書がスキャンされる場合のように、未加工オリジナル画像と未加工ターゲット画像が異なる解像度を持つようなケースにおいて、特に必要となる。サイズ補正された未加工ターゲット画像は、少なくとも対象となる画像領域においては、未加工オリジナル画像と同じ解像度と同じピクセル数を持つ。未加工ターゲット画像を移動させる位置補正は、未加工ターゲット画像を未加工オリジナル画像に正確に揃えるように行われる。位置補正は、一般に二つの画像を比較することにより行われる。テンプレートマッチング等、多くの画像位置補正方法が知られている。本ステップにおいて、いかなる好適な画像位置補正方法を使用してもよい。未加工オリジナル画像については、印刷およびスキャンの工程を経ない場合、歪み補正工程を省略してもよい。
【0021】
加工されたオリジナル画像およびターゲット画像は、改変を検知するために比較される。これを行うために、オリジナル画像およびターゲット画像のそれぞれの文字について境界ボックスを生成する(ステップS13)。各境界ボックスは、通常一つの文字について一つ以上の連結したピクセル群を囲う。境界ボックスは長方形であることが望ましい。文字の境界ボックスを生成するステップはOCR(光学文字認識)技術において一般に使用されており、ステップS13においては、いかなる好適な境界ボックス生成方法を使用してもよい。
【0022】
オリジナル画像およびターゲット画像の境界ボックスは対応するペアを形成する。対となる境界ボックスのペアは、各画像上において実質的に同じ位置にある、オリジナル画像の境界ボックスと、ターゲット画像の境界ボックスとから構成される。ここで、実質的に同じ位置とは、二つの境界ボックスにおける位置の違いが水平および垂直方向において所定の閾値より小さいことを意味する。閾値はインチ単位またはピクセル単位(この場合、値は画像の解像度に依存する)で計測してもよい。閾値は様々な要素に依存してもよい。さらに、動的な閾値を使用してもよい。例えば、閾値は水平および垂直それぞれの閾値について、文章の該当する行における文字の平均的な幅および高さの半分としてもよい。閾値を該当する行における隣接した境界ボックスの平均距離とする例もある。一方の画像中にある境界ボックスが、他方の画像中に対となる境界ボックスを持たない場合、例えば文字の削除または追加といった改変が検知される(ステップS14)。
【0023】
図3aは、それぞれ文字「y」を含む境界ボックスの典型的なペアを示す
そして、オリジナル画像およびターゲット画像中の対となる境界ボックスのペアは、文字のペアが同一の文字かどうかを判定するために、境界ボックスの文字における形状特徴を比較する処理が施される(ステップS15)。図2を参照して、ステップS15をより詳細に説明する。
【0024】
図2の工程は、ここでは図2の改変検知工程全体の中の一つのステップとして記載されているが、図2に示すアルゴリズムは、他の実用的なアプリケーションにおいてもより一般的に適用可能であり、二つの文字が同一の文字かどうかを判断するための比較に使用できる点に留意されたい。
【0025】
図2に示すように、対となる境界ボックスの各ペアについて、以下の形状特徴がそれぞれの境界ボックスについて算出される。
【0026】
文字のオイラー数(ステップS21)。オイラー数(対数)は画像のトポロジーを測る尺度である。これは、E=C−Hという数式により定義され、ここで、Eはオイラー数、Cは画像中の接続された画像構成要素の数、Hは穴の数である。英文字およびアラビア数字のオイラー数は、一般に1、0または−1である。本ステップにおいて、文字のオイラー数を算出するためのいかなる好適なアルゴリズムも使用可能である。
【0027】
境界ボックスのアスペクト比(ステップS22)。長方形の境界ボックスについて、アスペクト比は幅と高さの比として定義してもよい。境界ボックスが平行四辺形などの他の形状である場合、他の尺度を使用してもよい。
【0028】
境界ボックスのピクセル密度(ステップS23)。これは文字に属するピクセル数(前景ピクセルと呼ばれることがある)を、バウンディングボ境界ボックスの全ピクセル数、例えば境界ボックスが長方形であればその高さ掛ける幅(ピクセル単位)、で割ったものと定義される。
【0029】
加えて、二つの文字間のハウスドルフ距離が算出される(ステップS24)。本ステップは、まずは二つの文字それぞれのスケルトンを取得することにより実現される。文字のスケルトンは、文字の中線または中心線である。図3bは、図3aに示す二つの文字から取得した二つのスケルトンを示す。スケルトンは形態的細線化アルゴリズムを使用して取得してもよい。ここで、二つ文字に関する二つのスケルトン間のハウスドルフ距離が算出される。数学的には、ハウスドルフ距離は一方の集合から他方の集合における最も近い点までの距離の最大値である。より正式には、集合Aから集合Bまでのハウスドルフ距離は以下に定義される最大値関数である。
【0030】
【数1】

【0031】
【数2】

【0032】
【数3】

【0033】
ここで、aおよびbはそれぞれ集合Aおよび集合B上の点であり、またd(a、b)はこれらの点間の任意の距離であり、例えばd(a、b)はaとbのユークリッド距離としてもよい。ハウスドルフ距離はコンピュータビジョン、コンピュータグラフィックスおよび他の分野で広く使用される。二つのスケルトン間のハウスドルフ距離を算出するためのいかなる好適なアルゴリズムを使用してもよい。
【0034】
そして、二つの文字が同一かどうかを判断する決定が行われる。好ましい実施形態において、二つの文字が下記の四つの条件を満たした場合、二つの文字は同一だと判定される。
【0035】
二つの文字のオイラー数が同一である(ステップS25)。
【0036】
二つのアスペクト比の差分値が所定の第一閾値より小さい(ステップS26)。
【0037】
二つのピクセル密度の差分値が所定の第二閾値より小さい(ステップ27)。
【0038】
二つの文字間のハウスドルフ距離が所定の第三閾値より小さい(ステップ28)。
【0039】
これらの条件において使用される閾値は、事前の統計的分析を行うことにより予め設定可能である。好適な実施形態において、上記の条件(ステップS26、S27、S28)における三つの所定の閾値は、それぞれ約0.1、0.2、5.5(解像度600dpiの画像について、ピクセルを単位として計測)である。しかし、いかなる他の好適な値を使用してもよい。特に、ハウスドルフ距離の閾値は画像の解像度に依存する。他の実施形態においては、ハウスドルフ距離の閾値は文字の大きさ(文字の幅、文字の高さ、またはその二つの組み合わせ)により正規化された距離である。好適な実施形態において、正規化された閾値は0.2である。
【0040】
上記四つの条件がすべて満たされた場合(ステップS25からS28までの全てにおいて「Y」となった場合)、二つの文字は同一と判定される(ステップS29)。いずれかの条件が満たされない場合(ステップS25からS28までのいずれかにおいて「N」となった場合)、二つの文字は異なると判断される(ステップS30)。上記の工程(ステップS21からS30まで)は、オリジナル画像およびターゲット画像にある全ての対となる境界ボックスのペアについて、繰り返し実行される。
【0041】
図2は四つの算出ステップ(S21からS24まで)および四つの判定ステップ(S25からS28まで)を記載しているが、ステップの順番は図2に記載したものから変更可能な点である点に留意されたい。例えば、各判定ステップは対応する算出ステップの後にすぐ実施可能であり、判定ステップの一つにおいて判定条件を満たさない場合、二つの文字は異なると判定され(ステップS30)、残りの算出および判定ステップは(もしあれば)スキップされる。
【0042】
さらに、図2の実施形態において、二つの文字が同一とみなされるためには四つの条件全てを満たす必要があるが、条件を緩和することも可能である。例えば、ある実施形態において、四つの条件(ステップS25からS28までに示す)のうち少なくとも三つを満たせば、二つの文字は同一と判定される。他の実施形態において、ハウスドルフ距離の条件(ステップS28)を満たし、かつ、他の三つの条件(ステップS25からS27まで)のうち少なくとも二つを満たせば、二つの文字は同一と判定される。この点において、四つの条件のそれぞれは、多くの実際の環境においては、これらの条件が単独で使用された場合、対となる二つの文字が同一かどうかを判定するには不十分だと言える。実際の経験から、発明者はオイラー数条件およびハウスドルフ距離条件の組み合わせが誤判定の割合を減少させることを発見した。ハウスドルフ距離条件の判定精度は、オイラー数条件の判定精度と組み合わせることにより補完することが可能だと言われている。その理由は、ハウスドルフ距離条件は、どのように対応する文字のスケルトンを抽出するかというアルゴリズムに大きく依存しており、比較される画像の質が低い場合には、精度が相対的に低くなるためである。しかし、他の組み合わせを使用してもよい。
【0043】
全ての対となる境界ボックスのペアが処理された後(図2の「リターン」)、ステップS14において検知された全ての改変およびステップS15(すなわち図2)において検知された全ての改変は、改変検知結果表示(便宜上、ここでは改変マップという)を生成するために統合され、改変マップはユーザにディスプレイ表示、印刷、保管等される(図1のステップS16)。
【0044】
改変マップはオリジナル画像およびターゲット画像における改変点(差異点)を表示できるものであれば、いかなる好適な形式とすることも可能である。例えば、改変マップは、二つの画像の間でどのピクセルが異なるかを示す二値の差異マップとしてもよい。そのようなマップにおいて、改変されていない領域は空白であり、改変された領域はマップ上に表れる。他の例として、改変マップは、画像中の改変(追加、削除、変更等)された部分を示すマーカーまたはハイライト(四角、円、線、矢印、色等)を用いた、オリジナル画像またはターゲット画像のマークアップ版としてもよい。追加または削除された文字は、その文字を表示または非表示とするマーカーによって表現してもよい。異なる種類の改変(追加、削除、変更等)を表現するために、改変マップにおいて異なる色を使用してもよい。他の例において、改変マップは、いかなる文字も含まず、改変された場所を示すマーカーだけを含むことも可能である。
【0045】
図2に示す形状特徴の比較工程はいかなる言語におけるいかなる文字の比較にも使用することが可能である。先述したように、この比較のために、OCR処理のように実際に文字を認識する必要はない。
【0046】
上記の改変検知方法は、メモリーに格納されたソフトウェアまたはファームウェアに実装され、例えばコンピュータや情報処理部を有するプリンターまたはスキャナーなどの好適な情報処理装置により実行してもよい。この点において、図1のフローチャートを実現するために作成されるコンピュータが実行可能なソフトウェアは、好適な情報処理装置の中央処理装置(CPU)またはマイクロ処理装置(MPU)からアクセスされるコンピュータメモリに格納してもよい。印刷およびスキャンのステップは、プリンターおよびスキャナー、もしくは印刷部分とスキャン部分を一つの装置の中に併せ持つオールインワン装置により実行してもよい。これらの装置および器具の構造はよく知られており、ここでは詳述しない。
【0047】
上記の方法、特に図2のアルゴリズムは、文書改善検知の文脈において記載されているが、このアルゴリズムは二つの文字が同一の文字かどうかを判定するための比較方法として一般的に使用してもよい。
【0048】
本発明の思想または範囲から逸脱することなく、本発明に係る改変検知方法の様々な修正および変更が可能であることは、当業者にとって明らかである。このように、本発明は、添付された特許請求の範囲およびそれらの同等物に記載の範囲で行われる修正や変更も含む。

【特許請求の範囲】
【請求項1】
二値のビットマップ画像であるオリジナル画像およびターゲット画像の間における改変を検知するために、情報処理装置内に実装される方法であって、
(a)それぞれが一つの文字に関する一つ以上の連結したピクセル群を囲む複数の境界ボックスを、前記オリジナル画像および前記ターゲット画像の中に定義するステップと、
(b)前記オリジナル画像および前記ターゲット画像のそれぞれにおいて実質的に同じ位置にある複数の対となる前記境界ボックスのペアを、前記オリジナル画像および前記ターゲット画像の中に特定するステップと、
(c)対となる前記境界ボックスのペアそれぞれについて、
(c1)(1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出し、
(c2)(1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが、同一の文字か異なる文字かを判定するステップと、
を有する文書改変検知方法。
【請求項2】
前記ステップ(c2)は、
(1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、前記文字のペアが同一の文字と判定するステップと、
上記以外の場合には、前記文字のペアが異なる文字と判定するステップと、
を有する請求項1に記載の文書改変検知方法。
【請求項3】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項1または請求項2に記載の文書改変検知方法。
【請求項4】
前記ステップ(c1)において算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる、前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
前記ステップ(c2)は、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、をさらに評価することにより実行される請求項1〜3のいずれかに記載の文書改変検知方法。
【請求項5】
前記ステップ(c2)は、
(1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、前記文字のペアが同一の文字だと判定するステップと、
上記以外の場合には、前記文字のペアが異なる文字だと判定するステップと、
を有する請求項4に記載の文書改変検知方法。
【請求項6】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項4または請求項5に記載の文書改変検知方法。
【請求項7】
前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が算出されることにより、前記文字のペア間のハウスドルフ距離が算出される請求項1〜6のいずれかに記載の文書改変検知方法。
【請求項8】
前記境界ボックスは長方形である請求項1〜7のいずれかに記載の文書改変検知方法。
【請求項9】
前記ステップ(c2)での判定に基づき、改変検知結果表示を生成するステップをさらに有する請求項1〜8のいずれかに記載の文書改変検知方法。
【請求項10】
前記ステップ(a)の後に、ステップ(d)として、前記オリジナル画像および前記ターゲット画像の一方には存在する境界ボックスであって、もう一方には対となるものが存在しない境界ボックスを特定するステップをさらに有する請求項1〜9のいずれかに記載の文書改変検知方法。
【請求項11】
前記ステップ(c2)での判定に基づく改変検知結果と、前記ステップ(d)で特定された境界ボックスとを表示する図を生成するステップをさらに有する請求項10に記載の文書改変検知方法。
【請求項12】
情報処理装置に二値のビットマップ画像であるオリジナル画像とターゲット画像との間における改変を検知する処理を実行させるために、前記情報処理装置を制御するためのコンピュータプログラムであって、
(a)それぞれが一つの文字に関する一つ以上の連結したピクセル群を囲む複数の境界ボックスを、前記オリジナル画像および前記ターゲット画像の中に定義するステップと、
(b)前記オリジナル画像および前記ターゲット画像のそれぞれにおいて実質的に同じ位置にある複数の対となる前記境界ボックスのペアを、前記オリジナル画像および前記ターゲット画像の中に特定するステップと、
(c)対となる前記境界ボックスのペアそれぞれについて、
(c1)(1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出し、
(c2)(1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが、同一の文字か異なる文字かを判定するステップと、
をコンピュータに実行させるコンピュータプログラム。
【請求項13】
前記ステップ(c2)は、(1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、前記文字のペアが同一の文字と判定するステップと、
上記以外の場合には、前記文字のペアが異なる文字と判定するステップと、
を有する請求項12に記載のコンピュータプログラム。
【請求項14】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項12または請求項13に記載のコンピュータプログラム。
【請求項15】
前記ステップ(c1)において算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
前記ステップ(c2)は、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、をさらに評価することにより実行される請求項12〜14のいずれかに記載のコンピュータプログラム。
【請求項16】
前記ステップ(c2)は、(1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、前記文字のペアが同一の文字だと判定するステップと、
そうでない場合には、前記文字のペアが異なる文字だと判定するステップと、
を有する請求項15に記載のコンピュータプログラム。
【請求項17】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項15または請求項16に記載のコンピュータプログラム。
【請求項18】
前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が計算されることにより、前記文字のペア間のハウスドルフ距離が算出される請求項12〜17のいずれかに記載のコンピュータプログラム。
【請求項19】
前記境界ボックスは長方形である請求項12〜18のいずれかに記載のコンピュータプログラム。
【請求項20】
前記ステップ(c2)での判定に基づき、改変検知結果表示を生成するステップをさらに有する請求項12〜19のいずれかに記載のコンピュータプログラム。
【請求項21】
前記ステップ(a)の後に、ステップ(d)として、前記オリジナル画像および前記ターゲット画像の一方には存在する境界ボックスであって、もう一方には対となるものが存在しない境界ボックスを特定するステップをさらに有する請求項12〜20のいずれかに記載のコンピュータプログラム。
【請求項22】
前記ステップ(c2)での判定に基づく改変検知結果と、前記ステップ(d)で特定された境界ボックスとを表示する図を生成するステップをさらに有する請求項21に記載のコンピュータプログラム。
【請求項23】
各境界ボックスに囲まれた一つ以上の連結されたピクセル群である文字であって、二値のビットマップ画像であるオリジナル画像およびターゲット画像のそれぞれの中にある二つの文字を比較するために、情報処理装置において実行される方法であって、
(1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出する算出ステップと、
(1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが同一の文字か異なる文字かを判定する判定ステップと、
を有する文字比較方法。
【請求項24】
前記判定ステップは、
(1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、前記文字のペアが同一の文字と判定するステップと、
上記以外の場合には、前記文字のペアが異なる文字と判定するステップと、
を有する請求項23に記載の文字比較方法。
【請求項25】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項23または請求項24に記載の文字比較方法。
【請求項26】
前記算出ステップにおいて算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
前記判定ステップは、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうかをさらに評価することにより実行される請求項23〜25のいずれかに記載の文字比較方法。
【請求項27】
前記判定ステップは、
(1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、その文字のペアが同一の文字だと判定するステップと、
そうでない場合には、その文字のペアが異なる文字だと判定するステップと、
を有する請求項26に記載の文字比較方法。
【請求項28】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項26または請求項27に記載の文字比較方法。
【請求項29】
前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が算出されることにより前記文字のペア間のハウスドルフ距離が算出される請求項23〜28のいずれかに記載の文字比較方法。
【請求項30】
前記境界ボックスは長方形である請求項23〜29のいずれかに記載の文字比較方法。
【請求項31】
各境界ボックスに囲まれた一つ以上の連結されたピクセル群である文字であって、二値のビットマップ画像であるオリジナル画像とターゲット画像それぞれの中にある二つの文字を比較する処理を情報処理装置に実行させるために、前記情報処理装置を制御するためのコンピュータプログラムであって、
(1)前記境界ボックスのペアにより囲まれる文字のペアそれぞれに関するオイラー数、および、(2)前記文字のペア間のハウスドルフ距離、を含む複数の形状特徴を算出する算出ステップと、
(1)前記文字のペアのオイラー数が等しいかどうか、および、(2)前記文字のペア間のハウスドルフ距離が所定の第一閾値よりも小さいかどうか、を評価することにより前記境界ボックスのペアにより囲まれる前記文字のペアが同一の文字か異なる文字かを判定する判定ステップと、
をコンピュータに実行させるコンピュータプログラム。
【請求項32】
前記判定ステップは、(1)前記文字のペアのオイラー数が等しく、かつ、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さい場合には、その文字のペアが同一の文字と判定するステップと、
上記以外の場合には、その文字のペアが異なる文字と判定するステップと、
を有する請求項31に記載のコンピュータプログラム。
【請求項33】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2である請求項31または請求項32に記載のコンピュータプログラム。
【請求項34】
前記算出ステップにおいて算出される複数の形状特徴は、(3)前記境界ボックスのペアそれぞれのアスペクト比、および、(4)前記境界ボックスの文字に属するピクセル数を前記境界ボックス全体のピクセル数で割って得られる前記境界ボックスのペアそれぞれのピクセル密度をさらに含み、
前記判定ステップは、(3)前記境界ボックスのペアのアスペクト比の差分が所定の第二閾値よりも小さいかどうか、および、(4)前記境界ボックスのペアのピクセル密度の差分が所定の第三閾値よりも小さいかどうか、をさらに評価することにより実行される請求項31〜33のいずれかに記載のコンピュータプログラム。
【請求項35】
前記判定ステップは、(1)前記文字のペアのオイラー数が等しく、(2)前記文字のペア間のハウスドルフ距離が前記所定の第一閾値よりも小さく、(3)前記境界ボックスのペアのアスペクト比の差分が前記所定の第二閾値よりも小さく、かつ、(4)前記境界ボックスのペアのピクセル密度の差分が前記所定の第三閾値よりも小さい場合には、その文字のペアが同一の文字だと判定するステップと、
上記以外の場合には、その文字のペアが異なる文字だと判定するステップと、
を有する請求項34に記載のコンピュータプログラム。
【請求項36】
文字の大きさによって正規化された距離として定義された前記所定の第一閾値は0.2であり、前記所定の第二閾値は0.1であり、前記所定の第三閾値は0.2である請求項34または請求項35に記載のコンピュータプログラム。
【請求項37】
前記文字のペアのそれぞれに一つずつとして、二つのスケルトンが取得され、前記二つのスケルトンの間のハウスドルフ距離が算出されることにより前記文字のペアのハウスドルフ距離が算出される請求項31〜36のいずれかに記載のコンピュータプログラム。
【請求項38】
前記境界ボックスは長方形である請求項31〜37のいずれかに記載のコンピュータプログラム。
【請求項39】
請求項12〜22および請求項31〜38のいずれかに記載のコンピュータプログラムが保存されたコンピュータで読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3a】
image rotate

【図3b】
image rotate


【公開番号】特開2012−199901(P2012−199901A)
【公開日】平成24年10月18日(2012.10.18)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−206637(P2011−206637)
【出願日】平成23年9月21日(2011.9.21)
【出願人】(507031918)コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド (157)
【Fターム(参考)】