説明

画像処理装置及び画像処理プログラム

【課題】複数の画像間で比較を行う場合に、画像全体の位置合わせを不要とし、部分画像の位置が異なっているにもかかわらず、両者の画像間の差異を抽出するようにした画像処理装置を提供する。
【解決手段】画像処理装置の部分画像抽出手段は、第1の画像と第2の画像からそれぞれ部分画像を抽出し、順序付手段は、前記部分画像抽出手段によって抽出された部分画像を、それぞれの前記画像内における該部分画像の位置に基づいて、順序付けを行い、差異抽出手段は、前記順序付手段によって順序付けされた部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理プログラムに関する。
【背景技術】
【0002】
媒体が紙である文書にユーザが記入した追記等を検出したり、セキュリティ文書が改竄されていないかどうかを検証したりする等の、文書に対する追加や削除などの変更箇所を明らかにしたいというニーズがある。このニーズに対応するために、原本と紙文書(原本と比較したい文書、つまり、追記等が行われている可能性のある文書)をスキャナで読み込んで、両者の画像を比較して差分を抽出する処理が行われる。
【0003】
これに関連する技術として、例えば、特許文献1には、差分処理後における引き残しの発生を防止することができ、加筆画像の抽出精度を向上させることができる加筆画像抽出装置を提供することを課題とし、第一領域識別手段により識別された電子文書の原稿画像の各々の領域と第二領域識別手段により識別された加筆重畳画像の各々の領域とについてのそれぞれの位置ズレ量を画像位置検出手段によって検出し、この検出した位置ズレ量に基づいて画像差分処理手段で位置を補正して差分処理を行い、これにより、電子文書の原稿画像と加筆重畳画像との間でズレが発生した場合であっても、位置ズレを補正してから差分処理を行うことで、差分処理後における引き残しの発生を防止することができるので、加筆画像の抽出精度が向上することが開示されている。
【0004】
また、例えば、特許文献2には、電子文書と加筆重畳画像とからの加筆抽出の際に、加筆情報が存在しない領域での引き残しの発生を抑制でき、かつ、より精度の高い加筆抽出を行うことができる加筆抽出装置及び加筆抽出方法を提供することを課題とし、加筆抽出装置は、電子文書の原稿画像と電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから、文字認識を用いて所望の領域を小領域に分割して小領域毎に加筆抽出操作の必要性の有無を判定する領域分割部と、これによって分割され差分計算が必要と判定された小領域に対して差分計算を行う画像差分部と、これによって差分処理された画像に対して補間処理を行う画像補間部と、を有し、これにより、加筆抽出の精度が向上することが開示されている。
【0005】
また、例えば、特許文献3には、電子文書ファイル及び画像ファイルの更新に伴う作業を効率的にし、ファイルの保存領域の容量を有効に利用できることを課題とし、元の電子文書ファイルを画像化した画像データ(元文書画像データ)の黒画素に対して画像膨張部により膨張処理を行い、位置合わせの際の誤差を補正し、次に、加筆された印刷物をイメージスキャナで読み取った画像データ(加筆画像データ)と、元文書画像データとに対し、部分領域分割部によって各々画像データ領域の分割を行い、その後、矩形抽出部により矩形情報を取得し、矩形比較・位置合わせ部で画像データ同士の位置合わせを行い、論理計算部により画素単位での排他的論理和を算出し、差分情報を抽出し、抽出した差分情報と、元文書画像データとを保存することでデータ領域の節約をすることが開示されている。
【特許文献1】特開2004−287682号公報
【特許文献2】特開2004−213230号公報
【特許文献3】特開2004−341914号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
従来技術では、画像全体の位置合わせを必要とし、また、その位置合わせができたとしても、行間隔や文字間隔が変化した場合はその内容が変化していない(例えば、文字の変更等が行われていない)にもかかわらず、画像としての差分を抽出してしまう。
本発明は、複数の画像間で比較を行う場合に、画像全体の位置合わせを不要とし、部分画像の位置が異なっているにもかかわらず、両者の画像間の差異を抽出するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、第1の画像と第2の画像からそれぞれ部分画像を抽出する部分画像抽出手段と、前記部分画像抽出手段によって抽出された部分画像を、それぞれの前記画像内における該部分画像の位置に基づいて、順序付けを行う順序付手段と、前記順序付手段によって順序付けされた部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段を具備することを特徴とする画像処理装置である。
【0008】
請求項2の発明は、前記第1の画像及び第2の画像は、それぞれ複数のページを有しており、前記順序付手段は、それぞれの前記画像のページに基づいて、前記部分画像の複数ページに渡る順序付けを行うことを特徴とする請求項1に記載の画像処理装置である。
【0009】
請求項3の発明は、前記差異抽出手段は、前記第1の画像内における部分画像の特徴量と前記第2の画像内における部分画像の特徴量を用いて個々の部分画像の比較を行い、該比較の順序は、前記順序付手段によって順序付けされた部分画像の順序に基づいて行うことを特徴とする請求項1又は2に記載の画像処理装置である。
【0010】
請求項4の発明は、第1の画像から抽出された部分画像の位置に基づいて順序付けされた該第1の画像内における部分画像に関する情報を記憶する記憶手段と、第2の画像から部分画像を抽出する部分画像抽出手段と、前記部分画像抽出手段によって抽出された前記第2の画像内における部分画像を、該第2の画像内における部分画像の位置に基づいて、順序付けを行う順序付手段と、前記記憶手段に記憶されている第1の画像内の部分画像に関する情報及び前記順序付手段によって順序付けされた前記第2の画像内における部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段を具備することを特徴とする画像処理装置である。
【0011】
請求項5の発明は、前記第1の画像及び第2の画像は、それぞれ複数のページを有しており、前記記憶手段は、前記第1の画像の複数ページに渡る順序付けされた部分画像に関する情報を記憶しており、前記順序付手段は、前記第2の画像のページに基づいて、前記第2の画像内における部分画像の複数ページに渡る順序付けを行うことを特徴とする請求項4に記載の画像処理装置である。
【0012】
請求項6の発明は、前記記憶手段は、前記第1の画像内における部分画像に関する情報として、該部分画像の順序及び該部分画像の特徴量を記憶しており、前記差異抽出手段は、前記記憶手段に記憶された第1の画像内における部分画像の特徴量と前記第2の画像内における部分画像の特徴量を用いて個々の部分画像の比較を行い、該比較の順序は、前記記憶手段に記憶されている第1の画像内の部分画像の順序及び前記順序付手段による順序付けに基づいて行うことを特徴とする請求項4又は5に記載の画像処理装置である。
【0013】
請求項7の発明は、前記差異抽出手段によって抽出された差異のある部分画像の位置に基づいて、前記第1の画像又は前記第2の画像を加工する画像加工手段をさらに具備することを特徴とする請求項1から6のいずれか一項に記載の画像処理装置である。
【0014】
請求項8の発明は、コンピュータを、第1の画像と第2の画像からそれぞれ部分画像を抽出する部分画像抽出手段と、前記部分画像抽出手段によって抽出された部分画像を、それぞれの前記画像内における該部分画像の位置に基づいて、順序付けを行う順序付手段と、前記順序付手段によって順序付けされた部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段として機能させることを特徴とする画像処理プログラムである。
【0015】
請求項9の発明は、コンピュータを、第1の画像から抽出された部分画像の位置に基づいて順序付けされた該第1の画像内における部分画像に関する情報を記憶する記憶手段と、第2の画像から部分画像を抽出する部分画像抽出手段と、前記部分画像抽出手段によって抽出された前記第2の画像内における部分画像を、該第2の画像内における部分画像の位置に基づいて、順序付けを行う順序付手段と、前記記憶手段に記憶されている第1の画像内の部分画像に関する情報及び前記順序付手段によって順序付けされた前記第2の画像内における部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段として機能させることを特徴とする画像処理プログラムである。
【発明の効果】
【0016】
請求項1の画像処理装置によれば、複数の画像間で比較を行う場合に、画像全体の位置合わせを不要とし、部分画像の位置が異なっているにもかかわらず、両者の画像間の差異を抽出できる。
【0017】
請求項2の画像処理装置によれば、複数のページを有する複数の画像間においても、両者の画像間の差異を抽出できる。
【0018】
請求項3の画像処理装置によれば、本構成を有していないものに比較して、部分画像間の比較のための処理量を削減することができる。
【0019】
請求項4の画像処理装置によれば、複数の画像間で比較を行う場合に、画像全体の位置合わせを不要とし、部分画像の位置が異なっているにもかかわらず、両者の画像間の差異を抽出できる。
【0020】
請求項5の画像処理装置によれば、複数のページを有する複数の画像間においても、両者の画像間の差異を抽出できる。
【0021】
請求項6の画像処理装置によれば、本構成を有していないものに比較して、部分画像間の比較のための処理量を削減することができる。
【0022】
請求項7の画像処理装置によれば、両者の画像間の差異を他と異ならせて提示することができる。
【0023】
請求項8の画像処理プログラムによれば、複数の画像間で比較を行う場合に、画像全体の位置合わせを不要とし、部分画像の位置が異なっているにもかかわらず、両者の画像間の差異を抽出できる。
【0024】
請求項9の画像処理プログラムによれば、複数の画像間で比較を行う場合に、画像全体の位置合わせを不要とし、部分画像の位置が異なっているにもかかわらず、両者の画像間の差異を抽出できる。
【発明を実施するための最良の形態】
【0025】
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。また、所定という用語は、予め定められたの意の他に、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じての意を含めて用いる。
【0026】
比較する画像として、複数の画像間であればよいが、以下、2つの画像(1ページ又は2ページ以上も含む)を対象とし、1つの比較される画像(いわゆる原本の画像、以下「画像A」ともいう)と1つの比較する画像(変更が施された可能性のある画像、以下「画像B」ともいう)を例示して説明する。また、ここでは、画像として、文書を例示するが、部分画像(以下、サブ画像ともいう)を有している画像であればよい。部分画像として、文字の画像を例示するが、文字に限る必要はなく、文字の一部分、逆に複数の文字、図形等であってもよい。また、画像の内容として、ビジネス用に用いられる文書、広告宣伝用のパンフレット等であってもよい。
【0027】
本実施の形態は、図1に示すように、画像受付モジュール100、前処理モジュール110、領域抽出モジュール120、領域順序付モジュール130、サブ画像抽出モジュール140、サブ画像順序付モジュール150、全体順序付モジュール160、照合モジュール170、加工モジュール180、出力モジュール190を有している。
【0028】
画像受付モジュール100は、前処理モジュール110と接続されており、画像を受け付けて、その画像を前処理モジュール110へ渡す。画像を受け付けるとは、スキャナで画像を読み込むこと、ファックスで画像を受信すること、画像データベース等から画像を読み出すこと等が含まれる。その画像は、1枚であってもよいし、複数枚であってもよい。また、受け付ける画像は必ずしも紙媒体のものの画像である必要はなく、電子ドキュメント(つまり、印刷する前の電子ドキュメントであり、例えば、文書作成ソフトウェアによって生成されたテキスト主体の電子ドキュメント等)を受け付け、それから印刷用の画像を生成するようにしてもよい。
【0029】
前処理モジュール110は、画像受付モジュール100、領域抽出モジュール120と接続されており、前処理モジュール110から画像を受け取り、その画像に対して前処理を行い、その前処理を行った画像を領域抽出モジュール120へ渡す。前処理として、例えば、受け取った画像が多値画像(カラー画像を含む)であれば、2値画像に変換すること、画像に対して正立処理を行うこと、スキュー(skew)補正を行うこと、ノイズ除去を行うこと等がある。なお、正立処理とは、画像の向きを一般的な読める向きにすることである。例えば、4方向に画像を回転させながら文字認識処理を行い、最も認識率の高い方向に回転させる等があり、既存の技術を用いてもよい。また、スキュー補正とは、傾き補正を行うことである。例えば、スキャナ等で読み込んだ場合に傾きが発生し、その画像に対して、ハフ変換で直線の傾きを求め、それが垂直又は水平になるように回転させる等があり、既存の技術を用いてもよい。
【0030】
領域抽出モジュール120は、前処理モジュール110、領域順序付モジュール130と接続されており、前処理モジュール110から画像を受け取り、その画像を構成する領域(例えば、文字領域、図形領域、写真等の領域)を抽出し、その領域に関する情報を領域順序付モジュール130へ渡す。例えば、画像内で文字が記載されている部分をブロック(矩形の領域)として抽出するものであり、文字とイメージとの分離技術や文字認識処理における前処理である文字領域抽出技術等の既存の技術を用いてもよい。
【0031】
領域順序付モジュール130は、領域抽出モジュール120、サブ画像抽出モジュール140と接続されており、領域抽出モジュール120から領域に関する情報を受け取り、その中で対象とする領域に対して、順序付けを行い、その順序付けした領域に関する情報をサブ画像抽出モジュール140へ渡す。例えば、横書き(左から右へ文字が書かれている場合)文書の場合、文字領域に対して、その画像の上にあるものから順に順序を付ける。そして、上下の位置として所定範囲内にあって、横に並んで文字領域がある場合は、左から右へ順序を付ける。また、縦書き文書の場合は、その画像の右にあるものから順に順序を付ける。そして、左右の位置として所定範囲内にあって、縦に並んで文字領域がある場合は、上から下へ順序を付ける。なお、領域順序付モジュール130が、横書き、縦書きの判断を行い、順序付けを行うようにしてもよい。つまり、一般的な読み順になるように順序付けを行うが、必ずしも正確な読み順になる必要はない。ただし、比較する画像間では同じ順序付けの規則に基づいて、領域の順序付けを行う。
【0032】
サブ画像抽出モジュール140は、領域順序付モジュール130、サブ画像順序付モジュール150と接続されており、領域順序付モジュール130から順序付けされた領域に関する情報を受け取り、その領域内の画像からサブ画像を抽出し、サブ画像に関する情報をサブ画像順序付モジュール150へ渡す。例えば、概ね1文字単位のサブ画像を抽出する。その際、抽出したページ、位置を記憶しておく。文字認識技術の前処理である文字抽出技術等の既存の技術を用いてもよい。
【0033】
サブ画像順序付モジュール150は、サブ画像抽出モジュール140、全体順序付モジュール160と接続されており、サブ画像抽出モジュール140によって抽出されたサブ画像を、画像内におけるそのサブ画像の位置に基づいて、順序付けを行い、その順序付けしたサブ画像に関する情報を全体順序付モジュール160へ渡す。例えば、横書き文書の場合、サブ画像に対して、その画像の上にあるものから順に順序を付ける。そして、上下の位置として所定範囲内にあって、横に並んでサブ画像がある場合は、左から右へ順序を付ける。また、縦書き文書の場合は、その画像の右にあるものから順に順序を付ける。そして、左右の位置として所定範囲内にあって、縦に並んで文字領域がある場合は、上から下へ順序を付ける。なお、領域順序付モジュール130が、横書き、縦書きの判断を行い、順序付けを行うようにしてもよい。つまり、一般的な読み順になるように順序付けを行うが、必ずしも正確な読み順になる必要はない。ただし、比較する画像間では同じ順序付けの規則に基づいて、サブ画像の順序付けを行う。
【0034】
全体順序付モジュール160は、サブ画像順序付モジュール150、照合モジュール170と接続されており、サブ画像順序付モジュール150から領域内で順序付けされたサブ画像に関する情報を受け取り、そのサブ画像に画像全体を通した順序付けを行い、その順序付けしたサブ画像に関する情報を照合モジュール170へ渡す。つまり、画像内に文字領域が複数あった場合は、領域順序付モジュール130によって順序付けされた領域に沿って、サブ画像に順序を付ける。画像が複数ページを有している場合は、そのページを通した順序である。2ページ以降にあるサブ画像は、前のページにあるサブ画像の後になるように順序付けを行う。つまり、3段階でソート(順序付け)を行い、そのソート順位は、第一優先としてページの順序、第二優先としてそのページ内の文字領域の順序、第三優先としてその文字領域内のサブ画像の順序となる。
【0035】
なお、前処理モジュール110から全体順序付モジュール160までの処理は、画像Aと画像Bに対してそれぞれ処理を行う。ただし、それぞれのモジュールが画像Aに対する処理を行った後に画像Bに対する処理を行うという順序である必要はなく、画像Aに対する処理を前処理モジュール110から全体順序付モジュール160によって順次行い、その結果を全体順序付モジュール160が記憶装置に記憶させておき、その後に、画像Bに対する処理を行うようにしてもよい。つまり、この記憶装置は、画像Aから抽出されたサブ画像の位置に基づいて順序付けされた画像A内におけるサブ画像に関する情報を記憶する。また、画像Aが複数ページを有している場合は、その複数ページに渡る順序付けされたサブ画像に関する情報を記憶する。また、画像Aに対しては、照合モジュール170によるサブ画像に対する特徴抽出までを行うようにしてもよい。そして、サブ画像に関する情報として、そのサブ画像の順序及びサブ画像の特徴量を記憶していてもよい。
サブ画像に関する情報を記憶装置に記憶させる場合、比較する画像が複数ある場合は、画像Aに対する処理は1回で済むことになる。
【0036】
照合モジュール170は、全体順序付モジュール160、加工モジュール180と接続されており、全体順序付モジュール160によって順序付けされたサブ画像の順序に基づいて、画像Aと画像Bとの間で対応するそのサブ画像間の比較を行い、画像Aと画像Bの差異を抽出し、その抽出した差異に関する情報を加工モジュール180へ渡す。また、照合モジュール170は、画像A内におけるサブ画像の特徴量と画像B内におけるサブ画像の特徴量を用いて個々のサブ画像の比較を行い、その比較の順序は、全体順序付モジュール160によって順序付けされたサブ画像の順序に基づいて行うようにしてもよい。
また、全体順序付モジュール160によって記憶装置に画像A内のサブ画像に関する情報が記憶されている場合は、照合モジュール170は、その記憶装置内のサブ画像に関する情報及び全体順序付モジュール160によって順序付けされた画像B内におけるサブ画像の順序に基づいて、画像Aと画像Bとの間で対応するそのサブ画像間の比較を行い、画像Aと画像Bの差異を抽出する。また、記憶装置に記憶された画像A内におけるサブ画像の特徴量と画像B内におけるサブ画像の特徴量を用いて個々のサブ画像の比較を行い、その比較の順序は、記憶装置に記憶されている画像A内のサブ画像の順序及び全体順序付モジュール160による画像B内のサブ画像の順序付けに基づいて行うようにしてもよい。
また、抽出する差異として、例えば、サブ画像の削除、挿入、変更がある。この場合、画像Aと画像Bのサブ画像を順次比較し、一致しなかった後に、画像Aのサブ画像を固定して画像Bのサブ画像を探索して一致するものがあった場合は「挿入」と判定し、画像Bのサブ画像を固定して画像Aのサブ画像を探索して一致するものがあった場合は「削除」と判定し、いずれでもない場合は「変更」と判定するようにしてもよい。また、一致しなかった後に行う探索は、連続する複数のサブ画像に対して行うようにしてもよい。
【0037】
加工モジュール180は、照合モジュール170、出力モジュール190と接続されており、照合モジュール170によって抽出された差異のあるサブ画像の位置に基づいて、画像A又は画像Bを加工し、その加工した画像を出力モジュール190へ渡す。例えば、照合モジュール170で異なると判断されたサブ画像の位置に当たる画像A又は画像Bに、異なることが判別できるように加工を施す。加工には、「記号(例えば、◆等)」などの印を付ける、文字を太くする/色を変える/背景色を変えるなどがある。また、画像自体を加工してもよいし、画像に付箋(アノテーション)を貼り付けてもよい。また、画像をディスプレイ等に表示する場合は、該当するサブ画像をブリンクする等を行うようにしてもよい。
出力モジュール190は、加工モジュール180と接続されており、加工モジュール180から加工された画像を受け取り、その画像を出力する。なお、画像を出力するとは、プリンタによって印刷すること、ディスプレイに画像を表示すること、ファックスで画像を送信すること、画像データベース等へ画像を格納すること等が含まれる。
【0038】
図2は、本実施の形態による処理例を示すフローチャートである。
ステップS210からステップS224までの処理は画像Aに対する処理であり、ステップS230からステップS244に対する処理は画像Bに対する処理である。両者は、同じ処理であるので、画像Aに対する処理(ステップS210からステップS224までの処理)について説明し、画像Bに対する処理については説明を省略する。
【0039】
ステップS212では、前処理モジュール110が、画像Aに対して正立処理を行う。
ステップS214では、前処理モジュール110が、画像Aに対してスキュー補正を行う。
ステップS216では、領域抽出モジュール120が、ステップS212、ステップS214で前処理された画像Aの各ページから文字領域を抽出する。なお、文字領域だけでなく、図形領域等を抽出するようにしてもよい。
【0040】
ここで、図4を用いて、文字領域等の抽出結果を格納する領域データテーブル400について説明する。領域データテーブル400は、No.欄401、左上x座標欄402、左上y座標欄403、幅欄404、高さ欄405、ページ欄406、領域欄407、領域順序欄408、サブ画像欄409を有している。サブ画像欄409は、最初欄410、最後欄411を有している。
No.欄401は、抽出した領域を一意に識別する符号を記憶する。
左上x座標欄402、左上y座標欄403、幅欄404、高さ欄405は、その領域を特定するためのものであり、それぞれは、そのページ内における矩形の領域の左上角のx座標、y座標、領域の幅、高さを記憶する。これに限る必要はなく、左上座標と右下座標等であってもよい。
ページ欄406は、その画像におけるページ順序を記憶する。
領域欄407は、領域の種類(文字領域、図形領域等)を記憶する。ステップS218以降では、文字領域のみを対象として処理を行う。
領域順序欄408は、ステップS218による文字領域に対する順序付けの結果を記憶する。
サブ画像欄409は、その領域内にあるサブ画像を記憶する。最初欄410は、その領域内の先頭にあるサブ画像の図5の例に示すサブ画像データテーブル500のNo.欄501の符号を記憶する。最後欄411は、同様に、その領域内の最後尾にあるサブ画像の図5の例に示すサブ画像データテーブル500のNo.欄501の符号を記憶する。
【0041】
ステップS218では、領域順序付モジュール130が、画像Aの各ページ内における文字領域の順序付けを行う。この結果を領域データテーブル400の領域順序欄408に記憶する。
ステップS220では、サブ画像抽出モジュール140が、画像Aの各ページ(の文字領域)内からサブ画像を抽出する。
【0042】
ここで、図5を用いて、サブ画像の抽出結果を格納するサブ画像データテーブル500について説明する。サブ画像データテーブル500は、No.欄501、左上x座標欄502、左上y座標欄503、幅欄504、高さ欄505、領域内順序欄506、ページ内順序欄507、全体順序欄508、フラグ欄509、サブ画像欄510を有している。
No.欄501は、抽出したサブ画像を一意に識別する符号を記憶する。
左上x座標欄502、左上y座標欄503、幅欄504、高さ欄505は、そのサブ画像を特定するためのものであり、それぞれは、そのページ内における矩形の領域の左上角のx座標、y座標、領域の幅、高さを記憶する。これに限る必要はなく、左上座標と右下座標等であってもよい。
領域内順序欄506は、ステップS222による結果(その文字領域内のサブ画像の順序)を記憶する。
ページ内順序欄507、全体順序欄508は、ステップS224による結果(その画像内のサブ画像の順序)を記憶する。
フラグ欄509は、ステップS260、ステップS268、ステップS270による結果を記憶する。
サブ画像欄510は、そのサブ画像を記憶する。記憶する内容は、サブ画像そのものであってもよいし、サブ画像を記憶している場所へのリンクであってもよい。
【0043】
ステップS222では、サブ画像順序付モジュール150が、サブ画像のその文字領域内における順序付けを行う。この結果をサブ画像データテーブル500の領域内順序欄506に記憶する。
ステップS224では、全体順序付モジュール160が、サブ画像の画像A内における順序付けを行う。つまり、複数の文字領域がある場合は、ステップS218での順序付けにしたがってサブ画像の順序付けを行い、複数ページである場合は、そのページ順にしたがってサブ画像の順序付けを行う。この結果をサブ画像データテーブル500のページ内順序欄507、全体順序欄508に記憶する。
【0044】
ステップS250からステップS270までの処理は、照合モジュール170が行う。
ステップS250では、画像A及び画像B内のサブ画像に対して、ステップS224、ステップS244でそれぞれソートされた結果にしたがって、未照合のサブ画像を順次照合する。つまり、サブ画像のそれぞれの画像内における順序にしたがって、そのサブ画像間の照合を行う。常に同じ順序同士を照合するわけではないが、それぞれの順序で照合する。そして、すべてのサブ画像に対して照合が終了したときは、ステップS272へ進む。照合処理の詳細については図3を用いて後述する。
【0045】
ステップS252では、ステップS250の照合処理の結果、2つのサブ画像が同一であるか否かを判断する。かかる判断において、同一であると判断した場合(Y)はステップS250へ戻り、それ以外の場合(N)はステップS254へ進む。ただし、ここで同一とは、サブ画像間で差がないこと以外に、その差が所定範囲内にあることも含む(以下、同様)。
【0046】
ステップS254では、画像Aの一致しなかったサブ画像とそれに続く計N個(Nは0以上の整数)のサブ画像列に着目する。つまり、このサブ画像列をステップS256での固定した照合対象とする。
ステップS256では、画像Bのサブ画像で、一致しなかったサブ画像以降から、ステップS254の着目サブ画像列に一致するサブ画像列を照合する。
【0047】
ステップS258では、ステップS256の照合処理の結果、2つのサブ画像列(画像Aの着目サブ画像列と画像Bのサブ画像列)が一致するものがあるか否かを判断する。かかる判断において、一致するものがあると判断した場合(Y)はステップS260へ進む、それ以外の場合(N)はステップS262へ進む。ただし、ここで一致とは、サブ画像列間で差がないこと以外に、その差が所定範囲内にあることも含む(以下、同様)。
ステップS260では、画像Bのサブ画像で、一致位置までのサブ画像列に「挿入」フラグを付ける。つまり、画像Aの着目サブ画像列と同じものが、画像B内にあることが判明したので、それまでの間の画像Bのサブ画像は画像Aと比べると挿入されたものである。この結果をサブ画像データテーブル500のフラグ欄509に記憶する。
【0048】
ステップS262、ステップS264は、ステップS254、ステップS256の逆の処理である。つまり、ステップS254、ステップS256は、画像Aのサブ画像を固定して照合したが、ステップS262、ステップS264では画像Bのサブ画像を固定して照合する。
ステップS262では、画像Bの一致しなかったサブ画像とそれに続く計N個のサブ画像列に着目する。つまり、このサブ画像列をステップS264での固定した照合対象とする。
ステップS264では、画像Aのサブ画像で、一致しなかったサブ画像以降から、ステップS262の着目サブ画像列に一致するサブ画像列を照合する。
【0049】
ステップS266では、ステップS264の照合処理の結果、2つのサブ画像列(画像Aのサブ画像列と画像Bの着目サブ画像列)が一致するものがあるか否かを判断する。かかる判断において、一致するものがあると判断した場合(Y)はステップS268へ進む、それ以外の場合(N)はステップS270へ進む。
ステップS268では、画像Aのサブ画像で、一致位置までのサブ画像列に「削除」フラグを付ける。つまり、画像Bの着目サブ画像列と同じものが、画像A内にあることが判明したので、それまでの間の画像Aのサブ画像は画像Bと比べると削除されたものである。この結果をサブ画像データテーブル500のフラグ欄509に記憶する。
【0050】
ステップS270では、画像A、画像Bの着目サブ画像列の最初の1つに、それぞれ「変更」フラグを付ける。つまり、いずれの着目サブ画像も他方の画像内には存在しなかったことが判明したので、着目サブ画像列の最初のものは変更されたものである。この結果をサブ画像データテーブル500のフラグ欄509に記憶する。
ステップS272では、加工モジュール180が、ステップS250からステップS270までの処理で、「削除」、「挿入」、「変更」と判断されたサブ画像の位置を加工する。つまり、サブ画像データテーブル500のフラグ欄509に基づいて、該当するサブ画像の位置(サブ画像データテーブル500の左上x座標欄502から高さ欄505)を加工する。
【0051】
図3は、本実施の形態によるサブ画像の照合処理例を示すフローチャートである。つまり、図2に示すフローチャート内のステップS250の照合処理についてであり、照合モジュール170が行う処理である。
ステップS310では画像Aのサブ画像を受け取り、ステップS320では画像Bのサブ画像を受け取る。つまり、比較すべき両者のサブ画像を受け取る。
【0052】
ステップS330では、両者のサブ画像の特徴量1(例えば、サブ画像の外接矩形の大きさ、より具体的にはサブ画像データテーブル500の幅欄504と高さ欄505)を比較する。
ステップS332では、ステップS330での比較の結果、つまり差が所定範囲内であるか否かを判断する。かかる判断において所定範囲内である場合(Y)はステップS334へ進み、それ以外の場合(N)はステップS348へ進む。
【0053】
ステップS334では、両者のサブ画像の特徴量2(例えば、サブ画像の黒画素数)を比較する。
ステップS336では、ステップS334での比較の結果、つまり差が所定範囲内であるか否かを判断する。かかる判断において所定範囲内である場合(Y)はステップS338へ進み、それ以外の場合(N)はステップS348へ進む。
【0054】
ステップS338では、両者のサブ画像の特徴量3(例えば、サブ画像を細線化した後の黒画素数)を比較する。なお、ここで、細線化したものを対象とするのは、書体に左右されないようにするため、又はスキャナで読み込んだ場合の濃度の影響を少なくするためである。
ステップS340では、ステップS338での比較の結果、つまり差が所定範囲内であるか否かを判断する。かかる判断において所定範囲内である場合(Y)はステップS342へ進み、それ以外の場合(N)はステップS348へ進む。
【0055】
ステップS342では、両者のサブ画像の特徴量4(例えば、サブ画像間でのパターンマッチング後の相関係数値、より具体的には2つのサブ画像間のEOR演算後の1の画素数)を比較する。
ステップS344では、ステップS342での比較の結果、つまり差が所定範囲内であるか否かを判断する。かかる判断において所定範囲内である場合(Y)はステップS346へ進み、それ以外の場合(N)はステップS348へ進む。
【0056】
ステップS346では、対象としている画像Aのサブ画像と画像Bのサブ画像は一致していると判定する。つまり、図2に示すフローチャートでは、ステップS252でYの場合である。
ステップS348では、対象としている画像Aのサブ画像と画像Bのサブ画像は不一致と判定する。つまり、図2に示すフローチャートでは、ステップS252でNの場合である。
なお、図3に示す処理例は、比較処理負荷が少ないものから順に4段階の比較を行っている。これは、不一致のものは負荷の大きな処理をしないで済むようにするためである。比較の段階数については、より多くの比較を行ってもよいし(例えば、文字認識処理に用いられる特徴抽出と同等の処理を行い、その結果を比較する等を追加)、少ない比較であってもよい。また、比較する特徴量はこれらに示した例に限られず、他の特徴量を用いてもよい。
【0057】
図6、図7、図8は、本実施の形態によるケース1の処理例を示す説明図である。
図6(a1)、(b1)は、画像Aとして画像610を例示し、画像Bとして画像620を例示したものである。つまり、画像620は、画像610の行間を変更し、文字の一部分が変更されたものである。この場合、画像610と画像620とで全体の位置合わせを行い、画像として差異を抽出するようにした場合、行間が異なっているので、「提案内容」以降のものはすべて異なっていると判定してしまう。
図6(a2)、(b2)に示す画像610、画像620は、領域抽出モジュール120による抽出結果を示したものである。つまり、画像610は、文字領域611、文字領域612を有しており、画像620は、文字領域621、文字領域622、文字領域623を有していると判定される。これは、画像610と画像620は、行間が異なるためである。
そして、領域順序付モジュール130によって、領域順序は画像610が文字領域611、612であり、画像620が文字領域621、622、623となる。
【0058】
図7は、画像610、画像620に対して、サブ画像抽出モジュール140、サブ画像順序付モジュール150、全体順序付モジュール160及び照合モジュール170による処理結果を示したものである。つまり、サブ画像抽出モジュール140によって抽出されたサブ画像(文字)を矩形で囲んで示しており、サブ画像順序付モジュール150、全体順序付モジュール160によって順序付けされた順序にサブ画像を並べたもの(サブ画像701aからサブ画像733a、サブ画像701bからサブ画像733b)である。つまり、文字領域が2つに分かれたとしても、サブ画像の順序は領域を通した順序になる。この順序付けされたサブ画像を照合モジュール170によって照合する。つまり、それぞれのサブ画像の順序にしたがって、対応するサブ画像間(例えば、サブ画像701aとサブ画像701b、・・・)の比較を行い、その結果、サブ画像701aからサブ画像715aとサブ画像701bからサブ画像715bはそれぞれ一致すると判定される。つまり、図2に示すフローチャートでは、ステップS250、ステップS252が繰り返される。そして、サブ画像716a「ろ」とサブ画像716b「x」では不一致と判定され、ステップS254、S256、S258、S262、S264、S266、S270の処理が行われ、サブ画像716aは変更されてサブ画像716bになったと判定される。同様に、サブ画像717a「わ」とサブ画像717b「x」、サブ画像729a「か」とサブ画像729b「x」、サブ画像730a「き」とサブ画像730b「x」が「変更」と判定される。
【0059】
図8は、加工モジュール180が画像620(画像B)に対して、「変更」と判定されたサブ画像(サブ画像716b、717b、729b、730b)の位置に加工を施した例を示したものである。例えば、図8(a)に示す画像810は、その位置にあるサブ画像(文字811、812、813、814)を太字にしている。また、図8(b)に示す画像820は、その位置にあるサブ画像(加工文字821、822、823、824)の背景を着色している。
【0060】
図9から図15は、本実施の形態によるケース2の処理例を示す説明図である。このケース2は、それぞれの画像が複数ページであり、挿入、削除が行われている場合を示している。
図9(a1)、(a2)は、画像Aとして画像911、921を例示し、図9(b1)、(b2)は、画像Bとして画像951、971を例示したものである。つまり、画像Bは、文字が挿入等され、画像971に前ページの文字列の一部がはみ出したものである。
図9(a3)、(a4)、(b3)、(b4)に示す画像911、921、画像951、971は、領域抽出モジュール120による抽出結果を示したものである。つまり、画像911は、文字領域931、932を有しており、画像921は、文字領域933から文字領域937を有しており、画像951は、文字領域981、982を有しており、画像971は、文字領域983から文字領域988を有していると判定される。
そして、領域順序付モジュール130によって、領域順序は画像911が文字領域931、932であり、画像921が文字領域933、934、935、936、937であり、画像951が文字領域981、982であり、画像971が文字領域983、984、985、986、987、988となる。
【0061】
図10(a)、(b)は、画像911、921の画像A、画像951、971の画像Bに対して、サブ画像抽出モジュール140、サブ画像順序付モジュール150及び全体順序付モジュール160による処理結果を示したものである。つまり、サブ画像抽出モジュール140によって抽出されたサブ画像(文字)を矩形で囲んで示しており、サブ画像順序付モジュール150、全体順序付モジュール160によって順序付けされた順序にサブ画像を並べたもの(画像Aは60個、画像Bは66個のサブ画像)である。つまり、複数ページ、複数領域であったとしても、サブ画像の順序はページ、領域を通した順序になる。
【0062】
図11(a)、(b)は、照合モジュール170による処理の途中(図2に示したフローチャートにおいてステップS250からステップS258)を表したものである。つまり、ステップS250、S252で、互いに12個のサブ画像までは一致すると判定する。そして、図2に示したフローチャートにおいてステップS254でNを1とした場合、つまり画像Aの2個のサブ画像列(「い」と「う」)を着目サブ画像列とし、それを画像B内のその後のサブ画像列(13個目のサブ画像以降)から探索する(ステップS256)。この場合、一致するものはないのでステップS262へ進む。なお、図11から図14では、比較の結果、一致するものは点線の矢印、不一致のものは実線の矢印で示している。
【0063】
図12(a)、(b)は、照合モジュール170による処理の途中(図2に示したフローチャートにおいてステップS250からステップS268、つまり「挿入」と「削除」を判定する処理)を表したものである。ステップS262で画像Bの2個のサブ画像列(「わ」と「を」)を着目サブ画像列とし、それを画像A内のその後のサブ画像列(13個目のサブ画像以降)から探索する(ステップS264)。この場合、一致するものが17個目のサブ画像の列(「わ」と「を」)であるのでステップS268へ進む。ステップS268では、互いに一致しないと判定された画像A内のサブ画像(13個目)から画像Bの着目サブ画像列と一致すると判定されたサブ画像の直前までのサブ画像(16個目)までを削除サブ画像1201とする。
そして、この後、画像Aの17個目(「わ」)から28個目(「ろ」)までと画像Bの13個目(「わ」)から24個目(「ろ」)までは、互いに一致するのでステップS250、S252による処理を繰り返す。
そして、画像Aの29個目のサブ画像(「か」)と画像Bの25個目のサブ画像(「の」)は不一致であるので、画像Aの29個目と30個目のサブ画像列(「か」と「き」)を着目サブ画像列とし、それを画像B内のその後のサブ画像列(26個目のサブ画像以降)から探索する。この場合、一致するものが30個目のサブ画像の列(「か」と「き」)であるのでステップS260へ進む。ステップS260では、互いに一致しないと判定された画像B内のサブ画像(25個目)から画像Aの着目サブ画像列と一致すると判定されたサブ画像の直前までのサブ画像(29個目)までを挿入サブ画像1202とする。
そして、その後、画像Aの31個目のサブ画像と画像Bの32個目のサブ画像は一致すると判定され、処理が続く。
【0064】
図13(a)、(b)は、同様に処理を繰り返して、画像Bから挿入サブ画像1301を判定し、その後、画像Aの着目サブ画像列(「の」と「は」)と一致するものを画像Bのその後のサブ画像列から発見できていない状態を示したものである。
図14(a)、(b)は、同様の処理を繰り返して、画像Aから削除サブ画像1401を判定し、画像Bから挿入サブ画像1402を判定した結果を示したものである。
まとめると、画像Aと画像Bの差異として、削除サブ画像1201、1401、挿入サブ画像1202、1301、1402を判定している。
【0065】
図15は、加工モジュール180が画像951、971(画像B)に対して、「削除」、「挿入」と判定されたサブ画像(削除サブ画像1201、1401、挿入サブ画像1202、1301、1402)の位置に加工を施した例を示したものである。
例えば、図15(a1)、(a2)に示すものは、「削除」部分は、そのサブ画像の前後各1つずつのサブ画像を太線化して色を変更したものである(文字1511と1522、文字1523と1524)。そして、「挿入」部分は、太線化して色を変更したもの(「削除」とは異なる色)である(文字1513から1517、文字1518から1522、文字1525から1527)。
また、図15(b1)、(b2)に示すものは、「削除」部分は、そのサブ画像の前後各1つずつのサブ画像を太線化して背景色を変更したものである(加工文字1531、加工文字1534)。そして、「挿入」部分は、太線化して背景色を変更したもの(「削除」とは異なる色)である(加工文字1532、加工文字1533、加工文字1535)。
また、図15(c1)、(c2)に示すものは、「削除」部分に当たる位置に記号(◆)を付したものである(加工画像1541、1552)。そして、「挿入」部分は、太線化して色を変更したもの(「削除」の記号とは異なる色)である(文字1542から1546、文字1547から1551、文字1553から1555)。
【0066】
図16を参照して、本実施の形態のハードウェア構成例について説明する。図16に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1617と、プリンタなどのデータ出力部1618を備えたハードウェア構成例を示している。
【0067】
CPU(Central Processing Unit)1601は、前述の実施の形態において説明した各種のモジュール、すなわち、領域抽出モジュール120、領域順序付モジュール130、サブ画像抽出モジュール140、サブ画像順序付モジュール150、全体順序付モジュール160、照合モジュール170等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
【0068】
ROM(Read Only Memory)1602は、CPU1601が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1603は、CPU1601の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1604により相互に接続されている。
【0069】
ホストバス1604は、ブリッジ1605を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1606に接続されている。
【0070】
キーボード1608、マウス等のポインティングデバイス1609は、操作者により操作される入力デバイスである。ディスプレイ1610は、液晶表示装置又はCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
【0071】
HDD(Hard Disk Drive)1611は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1601によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けられた画像や加工モジュール180によって加工された画像などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
【0072】
ドライブ1612は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1613に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1607、外部バス1606、ブリッジ1605、及びホストバス1604を介して接続されているRAM1603に供給する。リムーバブル記録媒体1613も、ハードディスクと同様のデータ記録領域として利用可能である。
【0073】
接続ポート1614は、外部接続機器1615を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1614は、インタフェース1607、及び外部バス1606、ブリッジ1605、ホストバス1604等を介してCPU1601等に接続されている。通信部1616は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1617は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1618は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
【0074】
なお、図16に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図16に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図16に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
【0075】
前述の実施の形態においては、図2に示すフローチャートにおいて、ステップS250以下の処理で、「挿入」、「削除」、「変更」を判定する処理例を示したが、予め「変更」のみであると判明している場合又は挿入、削除も変更として判定する場合(つまり、挿入、削除あった以降はすべて変更)は、ステップS250以降の処理を、ステップS224、ステップS244でソートされた順に両者のサブ画像を照合し、異なるサブ画像にフラグを付け、その異なると判定されたサブ画像の位置を加工するようにしてもよい。
また、前述の実施の形態では、加工モジュール180は、画像Bを基にして加工を行っている例を示したが、画像Aを基にして加工するようにしてもよい。また、両方の画像に加工を施すようにしてもよい。すなわち、画像Aには削除部分についての加工を行い、画像Bには挿入部分の加工を行うようにしてもよい。なお、変更部分についてはいずれか一方又は両方の画像に加工を行うようにしてもよい。
また、照合モジュール170が行う照合処理については、前述のもの以外に文字列(テキスト列)に用いられている照合処理を適用してもよい。
【0076】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
【図面の簡単な説明】
【0077】
【図1】本実施の形態の構成例についての概念的なモジュール構成図である。
【図2】本実施の形態による処理例を示すフローチャートである。
【図3】本実施の形態によるサブ画像の照合処理例を示すフローチャートである。
【図4】領域データテーブルのデータ構造例を示す説明図である。
【図5】サブ画像データテーブルのデータ構造例を示す説明図である。
【図6】本実施の形態によるケース1の処理例を示す説明図である。
【図7】本実施の形態によるケース1の処理例を示す説明図である。
【図8】本実施の形態によるケース1の処理例を示す説明図である。
【図9】本実施の形態によるケース2の処理例を示す説明図である。
【図10】本実施の形態によるケース2の処理例を示す説明図である。
【図11】本実施の形態によるケース2の処理例を示す説明図である。
【図12】本実施の形態によるケース2の処理例を示す説明図である。
【図13】本実施の形態によるケース2の処理例を示す説明図である。
【図14】本実施の形態によるケース2の処理例を示す説明図である。
【図15】本実施の形態によるケース2の処理例を示す説明図である。
【図16】本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
【符号の説明】
【0078】
100…画像受付モジュール
110…前処理モジュール
120…領域抽出モジュール
130…領域順序付モジュール
140…サブ画像抽出モジュール
150…サブ画像順序付モジュール
160…全体順序付モジュール
170…照合モジュール
180…加工モジュール
190…出力モジュール

【特許請求の範囲】
【請求項1】
第1の画像と第2の画像からそれぞれ部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像を、それぞれの前記画像内における該部分画像の位置に基づいて、順序付けを行う順序付手段と、
前記順序付手段によって順序付けされた部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段
を具備することを特徴とする画像処理装置。
【請求項2】
前記第1の画像及び第2の画像は、それぞれ複数のページを有しており、
前記順序付手段は、それぞれの前記画像のページに基づいて、前記部分画像の複数ページに渡る順序付けを行う
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記差異抽出手段は、前記第1の画像内における部分画像の特徴量と前記第2の画像内における部分画像の特徴量を用いて個々の部分画像の比較を行い、該比較の順序は、前記順序付手段によって順序付けされた部分画像の順序に基づいて行う
ことを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
第1の画像から抽出された部分画像の位置に基づいて順序付けされた該第1の画像内における部分画像に関する情報を記憶する記憶手段と、
第2の画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された前記第2の画像内における部分画像を、該第2の画像内における部分画像の位置に基づいて、順序付けを行う順序付手段と、
前記記憶手段に記憶されている第1の画像内の部分画像に関する情報及び前記順序付手段によって順序付けされた前記第2の画像内における部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段
を具備することを特徴とする画像処理装置。
【請求項5】
前記第1の画像及び第2の画像は、それぞれ複数のページを有しており、
前記記憶手段は、前記第1の画像の複数ページに渡る順序付けされた部分画像に関する情報を記憶しており、
前記順序付手段は、前記第2の画像のページに基づいて、前記第2の画像内における部分画像の複数ページに渡る順序付けを行う
ことを特徴とする請求項4に記載の画像処理装置。
【請求項6】
前記記憶手段は、前記第1の画像内における部分画像に関する情報として、該部分画像の順序及び該部分画像の特徴量を記憶しており、
前記差異抽出手段は、前記記憶手段に記憶された第1の画像内における部分画像の特徴量と前記第2の画像内における部分画像の特徴量を用いて個々の部分画像の比較を行い、該比較の順序は、前記記憶手段に記憶されている第1の画像内の部分画像の順序及び前記順序付手段による順序付けに基づいて行う
ことを特徴とする請求項4又は5に記載の画像処理装置。
【請求項7】
前記差異抽出手段によって抽出された差異のある部分画像の位置に基づいて、前記第1の画像又は前記第2の画像を加工する画像加工手段
をさらに具備することを特徴とする請求項1から6のいずれか一項に記載の画像処理装置。
【請求項8】
コンピュータを、
第1の画像と第2の画像からそれぞれ部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された部分画像を、それぞれの前記画像内における該部分画像の位置に基づいて、順序付けを行う順序付手段と、
前記順序付手段によって順序付けされた部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段
として機能させることを特徴とする画像処理プログラム。
【請求項9】
コンピュータを、
第1の画像から抽出された部分画像の位置に基づいて順序付けされた該第1の画像内における部分画像に関する情報を記憶する記憶手段と、
第2の画像から部分画像を抽出する部分画像抽出手段と、
前記部分画像抽出手段によって抽出された前記第2の画像内における部分画像を、該第2の画像内における部分画像の位置に基づいて、順序付けを行う順序付手段と、
前記記憶手段に記憶されている第1の画像内の部分画像に関する情報及び前記順序付手段によって順序付けされた前記第2の画像内における部分画像の順序に基づいて、対応する該部分画像間の比較を行い、前記第1の画像と前記第2の画像の差異を抽出する差異抽出手段
として機能させることを特徴とする画像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2009−258815(P2009−258815A)
【公開日】平成21年11月5日(2009.11.5)
【国際特許分類】
【出願番号】特願2008−104340(P2008−104340)
【出願日】平成20年4月14日(2008.4.14)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】