説明

画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体

【課題】共通部分を含む複数の原稿画像同士の位置合わせを精密に行い、複数の原稿画像から共通部分の画像を精度良く抽出できるようにする。
【解決手段】第1の原稿画像データの特徴点(第1の特徴点)と第2の原稿画像データの特徴点(第2の特徴点)を抽出する特徴点抽出部11、第1の特徴点の特徴量(第2の特徴量)と第2の特徴点の特徴量(第2の特徴量)を算出する特徴量算出部12、第1,第2の特徴量を比較し、特徴量が一致する第1,第2の特徴点を抽出する照合処理部13、抽出された第1,第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換する座標変換部14、並びに第1の原稿画像データと座標変換された第2の原稿画像データとの論理積を求め、第1,第2の原稿画像データに含まれる共通フォーマットの画像データを抽出する論理積算出部15を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、共通フォーマットの画像に基づく画像データと例えば手書きの画像に基づく画像データとを含む複数の画像データを処理する画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体に関するものである。
【背景技術】
【0002】
近年、情報の電子化処理として、紙の原稿をスキャナ等で読み取って画像データとし、記録媒体に保存することが行われている。一方で、上記画像データ同士の一致および不一致を判定するための文書照合技術が知られており、この文書照合技術は画像データの処理において種々利用されている。
【0003】
例えば、上記電子化処理により、得られた画像データを単純に記録していくとデータ量が膨大となり、大きな記憶容量が必要となる。そこで、例えば、特許文献1においては、罫線枠などの共通フォーマットを有する複数の画像データについて、記録するデータ量を削減するために、文書照合技術を利用した提案がなされている。
【0004】
すなわち、特許文献1では、複数の原稿を読み取って入力された画像データ(書画情報)から、全頁に渡って共通した部分(共通フォーマット)と頁毎に独立した部分とを抽出し、共通部分と独立部分とを分割して蓄積している。この場合、各画像データの共通部分については一つのデータのみを保存し、独立した部分については個々のデータを保存することになる。これにより、一定の定型書式に限定されることなく、蓄積する情報量を減らして画像データを蓄積するようになっている。
【0005】
具体的には、2値化された画像データについて、全頁の画像データを取り出し、各頁間の論理積を計算することにより全頁に渡って共通した部分を抽出する。また、1頁ずつ画像データを取り出し、共通部分との排他的論理和を計算することにより、頁毎に独立した部分を抽出する。このようにして得られた画像データの共通部分と独立部分を符号化し蓄積する。
【特許文献1】特開平3−135163(平成3年6月10日公開)
【特許文献2】国際公開第2006/092957号パンフレット(2006年9月8日公開)
【非特許文献1】中居 友弘、黄瀬 浩一、岩村 雅一:「複比の投票に基づく文書画像検索と射影歪み補正」、画像の認識・理解シンポジウム(MIRU2005)(情報処理学会 コンピュータビジョンとイメージメディア研究会主催)予稿集、538−545頁
【発明の開示】
【発明が解決しようとする課題】
【0006】
特許文献1に記載のように、複数枚の原稿を読み込んで得られた複数の画像データ(書画情報)から、論理積により共通部分を求めるには、あるいは共通部分との排他的論路和を用いて独立部分を求めるには、複数の画像データ同士を精密に位置合わせする必要がある。しかしながら、特許文献1には、そのように位置合わせできる構成については記載されていない。したがって、特許文献1に記載の技術では、実際上、共通部分あるいは独立部分を抽出するのは困難である。この問題は、特に、互いに共通部分を有しかつ互いに異なる書込みがされている複数の原稿画像から共通部分のみの原稿画像を抽出したいという要求を満たす上での障害となっている。
【0007】
したがって、本発明は、共通部分(共通フォーマット)を含む複数の原稿画像同士の位置合わせを精密に行うことができ、これによって共通部分(共通フォーマット)の画像を精度良く抽出することができる画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体の提供を目的としている。
【課題を解決するための手段】
【0008】
上記の課題を解決するために、本発明の画像処理装置は、入力された複数の原稿画像データのうちの第1および第2の原稿画像データから、第1の原稿画像データの特徴点である第1の特徴点、および第2の原稿画像データの特徴点である第2の特徴点を抽出する特徴点抽出部と、前記第1の特徴点の特徴量である第1の特徴量、および前記第2の特徴点の特徴量である第2の特徴量を算出する特徴量算出部と、前記第1の特徴量と前記第2の特徴量とを比較し、特徴量が一致する第1の特徴点と第2の特徴点とを抽出する照合処理部と、前記照合処理部にて抽出された第1の特徴点の座標および第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換する座標変換部と、第1の原稿画像データと前記座標変換部にて処理された第2の原稿画像データとの論理積を求めることにより、第1の原稿画像データと第2の原稿画像データとに含まれる共通フォーマットの画像データを抽出する論理積算出部とを備えていることを特徴としている。
【0009】
また、本発明の画像処理方法は、入力された複数の原稿画像データのうちの第1および第2の原稿画像データから、第1の原稿画像データの特徴点である第1の特徴点、および第2の原稿画像データの特徴点である第2の特徴点を抽出する特徴点抽出工程と、前記第1の特徴点の特徴量である第1の特徴量、および前記第2の特徴点の特徴量である第2の特徴量を算出する特徴量算出工程と、前記第1の特徴量と前記第2の特徴量とを比較し、特徴量が一致する第1の特徴点と第2の特徴点とを抽出する照合処理工程と、前記照合処理工程にて抽出された第1の特徴点の座標および第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換する座標変換工程と、第1の原稿画像データと前記座標変換工程にて処理された第2の原稿画像データとの論理積を求めることにより、第1の原稿画像データと第2の原稿画像データとに含まれる共通フォーマットの画像データを抽出する論理積算出工程とを備えていることを特徴としている。
【0010】
上記の構成によれば、入力された複数の原稿画像データのうちの第1および第2の原稿画像データから、第1の原稿画像データの特徴点である第1の特徴点、および第2の原稿画像データの特徴点である第2の特徴点を抽出し、次に、第1の特徴点の特徴量である第1の特徴量、および第2の特徴点の特徴量である第2の特徴量を算出する。次に、第1の特徴量と第2の特徴量とを比較し、特徴量が一致する第1の特徴点と第2の特徴点とを抽出する。次に、抽出された第1の特徴点の座標および第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換する。その後、第1の原稿画像データと座標変換された第2の原稿画像データとの論理積を求めることにより、第1の原稿画像データと第2の原稿画像データとに含まれる共通フォーマットの画像データを抽出する。
【0011】
上記のように、本発明の構成では、入力された複数の原稿画像データのうちの任意の画像データである第1の原稿画像データと第2の原稿画像データとについて、互いに特徴量が一致する特徴点を抽出し、それら特徴点を用いて第1の原稿画像データに対する第2の原稿画像データの位置合わせを行っている。したがって、第1の原稿画像データと第2の原稿画像データとの位置合わせを精度良く行うことができる。この結果、書き込みがない共通フォーマットのみからなる原稿画像データを予め用意することなく、第1の原稿画像データと第2の原稿画像データとの共通フォーマットの画像データを精度良く抽出することができる。
【0012】
なお、画像処理装置に入力される原稿画像データは、例えば、スキャナにて原稿を読み取ることにより得られた画像データ、あるいは電子データのフォーマットに、コンピュータ(ソフトウェア)を用いて必要事項を入力して作成される電子データである。すなわち、例えば、紙に印刷されあるいは記載された画像を電子化したもの、および電子データとして直接作成されたもの(電子申請書など)である。
【0013】
上記の画像処理装置は、前記論理積算出部にて抽出された共通フォーマットの画像データを前記第1の原稿画像データとし、前記各部での処理に使用した原稿画像データとは異なる原稿画像データを前記第2の原稿画像データとして、前記特徴点抽出部、前記特徴量算出部、前記照合処理部、前記座標変換部および前記論理積算出部の処理を行い、前記論理積算出部にて第2の共通フォーマットの画像データを抽出する構成としてもよい。
【0014】
また、上記の画像処理方法は、前記論理積算出工程にて抽出された共通フォーマットの画像データを前記第1の原稿画像データとし、前記各工程での処理に使用した原稿画像データとは異なる原稿画像データを前記第2の原稿画像データとして、前記特徴点抽出工程、前記特徴量算出工程、前記照合処理工程、前記座標変換工程および前記論理積算出工程の処理を行い、前記論理積算出工程にて第2の共通フォーマットの画像データを抽出する構成としてもよい。
【0015】
上記の構成によれば、一度抽出した共通フォーマットの画像データを第1の原稿画像データとし、この第1の原稿画像データを抽出する処理に使用していない他の原稿画像データを第2の原稿画像データとして再度共通フォーマットの画像データを抽出する。したがって、さらに高精度に共通フォーマットの画像データを抽出することができる。
【0016】
上記の画像処理装置において、前記照合処理部は、特徴量が一致する第1の特徴点と第2の特徴点とをそれぞれ複数抽出し、前記座標変換部は、前記照合処理部にて抽出されたそれぞれ複数の第1の特徴点の座標および第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換する構成としてもよい。
【0017】
上記の構成によれば、座標変換部は、特徴量が一致するそれぞれ複数の第1の特徴点および第2の特徴点を使用して座標変換を行う。したがって、複数の特徴点の中に、照合処理部において誤って特徴量が一致すると判定されてしまった特徴点が含まれている場合であっても、座標変換部では、その特徴点の影響を抑制した状態で座標変換を行うことができる。これにより、共通フォーマットの画像データの抽出をさらに高精度に行うことができる。
【0018】
上記の画像処理装置は、前記第1の原稿画像データおよび前記論理積算出部にて抽出された共通フォーマットの画像データを記憶する記憶手段と、前記第1の原稿画像データから前記共通フォーマットの画像データに対応する画像データを読み出して出力する画像合成部とを備えている構成としてもよい。
【0019】
上記の構成によれば、合成処理部は、例えば共通フォーマットの画像データを出力する要求に応じて、記憶手段に記憶されている共通フォーマットの画像データに代えて、第1の原稿画像データから上記共通フォーマットの画像データに対応する部分の画像データを読み出して出力する。
【0020】
これにより、第1の原稿画像データの共通フォーマット部分に例えば有彩色が含まれている場合など、元の原稿画像を忠実に再現することができる。
【0021】
上記の画像処理装置は、前記第1の原稿画像データから下地の画像データを抽出し、前記記憶手段に格納する下地検知処理部を備え、前記合成処理部は、前記第1の原稿画像データから前記共通フォーマットの画像データに対応する画像データを読み出し、この画像データの前記共通フォーマット部分以外の領域に前記下地の画像データを合成して出力する構成としてもよい。
【0022】
上記の構成によれば、合成処理部は、例えば共通フォーマットの画像データを出力する要求に応じて、記憶手段に記憶されている共通フォーマットの画像データに代えて、第1の原稿画像データから上記共通フォーマットの画像データに対応する部分の画像データを読み出し、この画像データの共通フォーマット部分以外の領域に下地の画像データを合成して出力する。
【0023】
これにより、第1の原稿画像データの共通フォーマット部分、および下地部分に例えば有彩色が含まれている場合など、元の原稿画像を下地を含めてさらに忠実に再現することができる。
【0024】
本発明の画像形成装置は、上記のいずれかの画像処理装置と画像データを印刷して出力する画像出力手段とをなえていることを特徴としている。
【0025】
上記の構成によれば、共通フォーマットを有しかつ書き込みのない原稿が必要な場合に、書き込みのない原稿がなくても、書き込みのある複数の原稿から共通のフォーマット部分のみの原稿を精度良く複製することができる。
【発明の効果】
【0026】
本発明によれば、第1の原稿画像データと第2の原稿画像データとについて、互いに特徴量が一致する特徴点を抽出し、それら特徴点を用いて第1の原稿画像データに対する第2の原稿画像データの位置合わせを行っている。したがって、第1の原稿画像データと第2の原稿画像データとの位置合わせを精度良く行うことができる。この結果、書き込みがない共通フォーマットのみからなる原稿画像データを予め用意することなく、第1の原稿画像データと第2の原稿画像データとの共通フォーマットの画像データを精度良く抽出することができる。
【発明を実施するための最良の形態】
【0027】
〔実施の形態1〕
本発明の実施の形態を図面に基づいて以下に説明する。
図1は本実施の形態における画像処理装置101の構成を示すブロック図である。この画像処理装置101は、例えば図2に示すデジタルカラー複写機(画像処理装置、画像形成装置)102に備えられる。
【0028】
画像処理装置101は、例えば図3(a)〜図3(c)に示す原稿をスキャナにて読み込んで得られた画像データを処理する。図3(a)は基準原稿であり、図3(b)および図3(c)は参照原稿である。これら基準原稿と参照原稿とは、例えば罫線や所定の文字列等からなる共通部分(共通フォーマット)、および例えば手書き文字など、それぞれの原稿に特有の独立部分を有する。
【0029】
画像処理装置101は、上記基準原稿の画像データ(基準画像データ)と上記第1および第2参照原稿の画像データ(参照画像データ)とを比較し、それら原稿の共通部分(共通フォーマット)の画像データを抽出するようになっている。図3(d)は、共通部分(共通フォーマット)の画像データを印刷して得られる共通フォーマットの画像である。
【0030】
上記基準画像データおよび参照画像データに関し、画像処理装置101は、順次入力されてくる複数枚の原稿についての各画像データのうち、例えば最初に入力されてくるものを基準画像データ(以下、単に基準画像と称する)として認識し、この基準画像よりも後に入力されてくるものを参照画像データ(以下、単位参照画像と称する)として認識する。
【0031】
画像処理装置101は、図1に示すように、制御部1、文書照合処理部2およびメモリ(記憶手段)3を備えている。文書照合処理部2は、特徴点算出部11、特徴量算出部12、照合処理部13、座標変換部14、論理積算出部15および登録処理部16を備えている。
【0032】
特徴点算出部11は、文字列や罫線の連結部分を抽出し、連結部分の重心を特徴点として算出する。
【0033】
特徴量算出部12は、特徴点算出部11にて算出された特徴点を用いて、回転、拡大、縮小に対して不変な量、すなわち原稿画像の回転、平行移動、拡大縮小を含む幾何学的変化に対して不変なパラメータである特徴量を算出する。特徴量を計算するために注目特徴点の近傍の特徴点を選択して用いる。
【0034】
照合処理部13は、基準画像と各参照画像との照合処理を行う。この照合処理においては、基準画像および各参照画像の2値の画像データを使用する。そして、基準画像(2値画像データ)と各参照画像(2値画像データ)とについて、特徴点算出部11により算出された各特徴点について特徴量算出部12により算出された特徴量(ハッシュ値)同士を比較する。次に、基準画像と参照画像との特徴量(ハッシュ値)が一致する各特徴点について、特徴量(ハッシュ値)、特徴点を表すインデックス、および各特徴点の座標を登録する。なお、基準原稿の画像データおよび各参照原稿の画像データの2値化処理は、特徴点算出部11の2値化処理部24(図6参照)が行う。
【0035】
具体的には、照合処理部13は、上記照合処理において、図4に示すように、基準画像についての各特徴点の特徴量(ハッシュ値)、各特徴点を表すインデックス、および各特徴点の座標を表すテーブルを使用する。このテーブルはメモリ3に登録されており、その登録処理は登録処理部16において行われる。そして、照合処理部13は、基準画像の特徴点の特徴量(ハッシュ値)と参照画像の特徴点の特徴量(ハッシュ値)との一致の有無を判定し、特徴量が一致した特徴点について座標を求める。この処理の結果、図4に示すテーブルに対して、さらに参照画像の、特徴量(ハッシュ値)が一致した特徴点を表すインデックスおよび特徴点の座標が登録され、図5に示すように、基準画像と参照画像との特徴量(ハッシュ値)が一致する特徴点の対応関係を示すテーブルが得られる。なお、このテーブルの登録処理は登録処理部16により行われる。
【0036】
図5の例では、例えば、参照画像の特徴点p1の特徴量(ハッシュ値)が基準画像の特徴点f1の特徴量と一致し、参照画像の特徴点p2の特徴量(ハッシュ値)が基準画像の特徴点f2の特徴量と一致し、参照画像の特徴点p3の特徴量(ハッシュ値)が基準画像の特徴点f4の特徴量と一致している。
【0037】
座標変換部14は、照合処理部13において特徴量(ハッシュ値)が一致すると判定された基準画像(2値画像データ)の特徴点の座標と参照画像(2値画像データ)の特徴点の座標とを用いて、基準画像と参照画像との位置合わせを行う。なお、上記の内容については非特許文献1に関連記載がある。
【0038】
また、実際には一致していない特徴点同士が一致していると判定されてしまう場合に対応するために、ロバスト推定などの方法を用いて一致しない特徴点の組(外れ点)に影響されないように座標変換を行う。
【0039】
論理積算出部15は、座標変換部14において位置合わせを行った基準画像(2値画像データ)と参照画像(2値画像データ)とを用いて両者の論理積を求める。
【0040】
登録処理部16は、基準画像から算出された各特徴点の特徴量(ハッシュ値)、各特徴点を表すインデックス、および各特徴点の座標を互いに対応付けてメモリ3に登録する。この登録状態は前記図4に示したものである。また、論理積算出部15において基準画像と参照画像との論理積が求められた画像データ(高濃度側の画像データ)をメモリ3に格納する。なお、基準画像の登録処理を行う場合、照合処理部13、座標変換部14および論理積算出部15の処理はスルーとなり、何も行われない。
【0041】
制御部(CPU)1は、文書照合処理部2における上記各処理部およびメモリ3へのアクセスを制御する。
【0042】
図6は特徴点算出部11の構成を示すブロック図である。図6に示すように、特徴点算出部11は、無彩化処理部21、解像度変換部22、MTF処理部23、2値化処理部24および重心算出部25を備えている。
【0043】
無彩化処理部21は、基準画像データおよび参照画像データ等の入力画像データがカラー画像であった場合に、入力画像データを無彩化して明度もしくは輝度信号に変換する。例えば、下記式より輝度Yを求める。
【0044】
【数1】

【0045】
なお、無彩化処理は、上式による方法に限定されず、RGB信号をCIE1976L***信号(CIE : Commission International de l'Eclairage、 L*: 明度、a*, b*::色度)に変換するものであっても良い。
【0046】
解像度変換部22は、入力画像データが画像入力装置で光学的に変倍されていた場合に、所定の解像度になるように入力画像データを再度変倍する。上記画像入力装置は、例えば、原稿の画像を読み取って画像データに変換するスキャナであり、図2に示すデジタルカラー複写機ではカラー画像入力装置111がそれに相当する。
【0047】
また、解像度変換部22は、後段でのデータ処理量を軽減するために、画像入力装置により等倍の設定にて読み込まれる解像度よりも解像度を落とすための解像度変換部としても用いられる。例えば、600dpi(dot per inch)で読み込まれた画像データを300dpiに変換する。
【0048】
MTF処理部23は、画像入力装置の空間周波数特性が画像入力装置の種類ごとに異なることによる影響を吸収するために用いられる。すなわち、画像入力装置が備えるCCDの出力する画像信号には、レンズやミラー等の光学部品、CCDの受光面のアパーチャ開口度、転送効率や残像、物理的な走査による積分効果および操作むら等に起因しMTFの劣化が生じている。このMTFの劣化により、読み込まれた画像がぼやけたものとなっている。そこで、MTF補正処理部23は、適切なフィルタ処理(強調処理)を施すことにより、MTFの劣化により生じるぼやけを修復する処理を行う。また、後段の特徴量算出部12の特徴点抽出部31での処理に不要な高周波成分を抑制するためにも用いる。すなわち、混合フィルタを用いて強調および平滑化処理を行う。なお、この混合フィルタのフィルタ係数は、例えば図7に示すものである。
【0049】
2値化処理部24は、無彩化処理部21にて無彩化された画像データの輝度値(輝度信号)または明度値(明度信号)を閾値と比較することにより画像データを2値化し、この2値化した画像データ(基準画像、参照画像の2値画像データ)をメモリ3に格納する。
【0050】
重心算出部25は、2値化処理部24において2値化された画像データ(例えば、「1」、「0」で表される画像データ)の各画素に対してラベリング(ラベル付け処理)を行う。このラベリングにおいては2値のうちの同一の値を示す画素に同一のラベルを付与する。次に、同一ラベルを付した画素を連結して形成された複数画素からなる領域である連結領域を特定する。次に、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点を特徴量算出部12へ出力する。なお、上記特徴点は、2値画像における座標値(x座標、y座標)で表すことができる。
【0051】
図8は、2値化された画像データから抽出された連結領域およびこの連結領域の重心の一例を示す説明図であり、「A」という文字に対応する連結領域およびその連結領域の重心(特徴点)を示している。また、図9は、2値化された画像データに含まれる文字列から抽出された複数の連結領域の各重心(特徴点)の一例を示す説明図である。
【0052】
図10は特徴量算出部12の構成を示すブロック図である。特徴量算出部12は、図10に示すように、特徴点抽出部31、不変量算出部32およびハッシュ値算出部33を備えている。
【0053】
特徴点抽出部31は、特徴点算出部11にて算出された特徴点が画像データにおいて複数存在する場合に、1つの特徴点を注目特徴点とし、この注目特徴点の周辺の特徴点を、注目特徴点からの距離が近いものから順に所定数だけ周辺特徴点として抽出する。図11の例では、上記所定数を4点とし、特徴点aを注目特徴点とした場合に特徴点b,c,d,eの4点が周辺特徴点として抽出され、特徴点bを注目特徴点とした場合には特徴点a,c,e,fの4点が周辺特徴点として抽出される。
【0054】
また、特徴点抽出部31は、上記のように抽出した周辺特徴点4点の中から選択し得る3点の組み合わせを抽出する。例えば、図12(a)〜図12(d)に示すように、図11に示した特徴点aを注目特徴点とした場合、周辺特徴点b,c,d,eのうちの3点の組み合わせ、すなわち、周辺特徴点b,c,d、周辺特徴点b,c,e、周辺特徴点b,d,e、周辺特徴点c,d,eの各組み合わせが抽出される。
【0055】
不変量算出部32は、特徴点抽出部31において抽出された各組み合わせについて、幾何学的変形に対する不変量(特徴量の1つ)Hijを算出する。
【0056】
ここで、iは注目特徴点を示す数(iは1以上の整数)であり、jは周辺特徴点3点の組み合わせを示す数(jは1以上の整数)である。本実施形態では、周辺特徴点同士を結ぶ線分の長さのうちの2つの比を不変量Hijとする。
【0057】
上記線分の長さは、各周辺特徴点の座標値に基づいて算出できる。例えば、図12(a)の例において、特徴点bと特徴点cとを結ぶ線分の長さをA11、特徴点bと特徴点dとを結ぶ線分の長さをB11とすると、不変量H11は、H11=A11/B11である。また、図12(b)の例において、特徴点bと特徴点cとを結ぶ線分の長さをA12、特徴点bと特徴点eとを結ぶ線分の長さをB12とすると、不変量H12は、H12=A12/B12である。また、図12(c)の例において、特徴点bと特徴点dとを結ぶ線分の長さをA13、特徴点bと特徴点eとを結ぶ線分の長さをB13とすると、不変量H13は、H13=A13/B13である。また、図12(d)の例において、特徴点cと特徴点dとを結ぶ線分の長さをA14、特徴点cと特徴点eとを結ぶ線分の長さをB14とすると、不変量H14は、H14=A14/B14である。このようにして、図12(a)〜図12(d)の例では、不変量H11,H12,H13,H14が算出される。
【0058】
なお、上記の例では、注目特徴点に最も近い周辺特徴点と2番目に近い周辺特徴点とを結ぶ線分をAij、注目特徴点に最も近い周辺特徴点と3番目に近い周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
【0059】
ハッシュ値算出部33は、例えば、
Hi=(Hi1×10+Hi2×10+Hi3×10+Hi4×10)/D
という式における余りの値をハッシュ値(特徴量の1つ)Hiとして算出し、得られたハッシュ値メモリ8に格納する。なお、上記Dは余りが取り得る値の範囲をどの程度に設定するかに応じて予め設定される定数である。
【0060】
上記不変量Hijの算出方法は特に限定されるものではない。例えば、注目特徴点の近傍5点の複比、近傍n点(nはn≧5の整数)から抽出した5点の複比、近傍n点から抽出したm点(mは、m<nかつm≧5の整数)の配置、およびm点から抽出した5点の複比に基づいて算出される値などを注目特徴点についての上記不変量Hijとしてもよい。なお、複比とは、直線上の4点または平面上の5点から求められる値であり、幾何学的変換の一種である射影変形に対する不変量として知られている。
【0061】
また、ハッシュ値Hiを算出するための式についても上記の式に限るものではなく、他のハッシュ関数(例えば特許文献2に記載されているハッシュ関数のうちのいずれか)を用いてもよい。
【0062】
特徴量算出部12の各部は、1つの注目特徴点に対する周辺特徴点の抽出およびハッシュ値Hiの算出が終わると、注目特徴点を他の特徴点に変更して周辺特徴点の抽出およびハッシュ値の算出を行い、全ての特徴点についてのハッシュ値を算出する。
【0063】
図11の例では、特徴点aを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出が終わると、次に特徴点bを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出を行う。なお、図11の例では、特徴点bを注目特徴点とした場合、特徴点a,c,e,fの4点が周辺特徴点として抽出される。
【0064】
そして、図13(a)〜図13(d)に示すように、これら周辺特徴点a,c,e,fの中から選択される3点の組み合わせ(周辺特徴点a,e,f、周辺特徴点a,e,c、周辺特徴点a,f,c、周辺特徴点e,f,c)を抽出し、各組み合わせについてハッシュ値Hiを算出し、メモリ3に格納する。そして、この処理を各特徴点について繰り返し、各特徴点を注目特徴点とした場合のハッシュ値をそれぞれ求めてメモリ3に記憶させる。
【0065】
次に、座標変換部14における座標変換動作 について説明する。
共通のフォーマットを有する基準画像と参照画像とから、互いに共通する部分を抽出するには、照合処理部13において特徴量(ハッシュ値)が一致すると判定された基準画像の特徴点と参照画像の特徴点とを用いて両者の位置関係を把握しておく必要がある。そこで、座標変換部14では、参照画像の座標系を基準画像の座標系に変換して両画像の位置合わせを行う。なお、上記共通フォーマットには、罫線や表のみでなく、共通の文字列が含まれていてもよい。
【0066】
図14は、特徴量(ハッシュ値)が一致する基準画像の特徴点と参照画像の特徴点とに基づいて、基準画像と参照画像との位置合せを行う動作の説明図である。図15は、基準画像と参照画像との位置合せの結果得られる基準画像の特徴点の座標と参照画像の特徴点の座標との対応関係を示す説明図である。図14および図15の例では、基準画像と参照画像との間において、特徴量(ハッシュ値)が一致する特徴点が4点存在する場合を示している。
【0067】
次に、座標変換部14では、基準画像の特徴点の座標についての行列をPout、参照画素増の特徴点の座標についての行列をPin、変換係数をAとする。
【0068】
【数2】

【0069】
そして、下記式により変換係数を算出する。
【0070】
【数3】

【0071】
ここで、Pinは正方行列ではないので、下式のように、両辺にPinの転置行列Pinを乗算し、さらにPinPinの逆行列を乗算する。
【0072】
【数4】

【0073】
次に、上記のようにして得られた変換係数Aを用いて、基準画像上における参照画像の座標位置を算出する。この場合、下式に示すように、参照画像上の任意の座標(x’,y’)は、変換係数Aを用いて基準画像上の座標(X,Y)に変換される。
【0074】
【数5】

【0075】
次に、座標変換部14が行う座標変換動作のうち、外れ点の影響を排除した座標変換動作について説明する。上記外れ点とは、特徴量算出部12において、基準画像と参照画像との特徴量(ハッシュ値)が一致する特徴点として抽出されたもののうち、誤って特徴量(ハッシュ値)が一致するものとして抽出された特徴点である。
【0076】
前述の座標変換動作においては、外れ点が存在した場合、求めた座標変換係数が本来の座標変換係数から大きくずれてしまうことになる。そこで、ロバスト推定など外れ点が含まれる場合に用いられる推定方法を用いて座標変換係数を求めることができる。以下には、ロバスト推定の中でLMedS基準を用いて座標変換係数を求める例について説明する。
【0077】
まず、照合処理部13において基準画像と参照画像との特徴量(ハッシュ値)が一致するものとして抽出された特徴点の組から、3組をランダムに抽出する。この場合、基準画像の特徴点の座標についての行列をPout2、参照画素増の特徴点の座標についての行列をPin2、変換係数をA2とする。
【0078】
【数6】

【0079】
そして、変換係数A2と特徴点(Pout2,Pin2)との関係を
【0080】
【数7】

【0081】
とする。これにより、変換係数A2は、次の式により求められる。
【0082】
【数8】

【0083】
次に、上記のようにして求めた変換係数A2を使用し、照合処理部13において基準画像と参照画像との特徴量(ハッシュ値)が一致するものとして抽出された全ての特徴点の組について座標変換を行い、その結果から求めた座標値と実際の座標値との誤差を計算する。次に、求めた誤差をその値が大きい順番にソートしたときの中央値を、求めた変換係数A2の評価値とする。なお、上記「求めた座標値」とは、例えば参照画像の座標系を基準画像の座標系に合わせ込む場合に、参照画像の特徴点の座標を変換した値(座標値)であり、「実際の座標値」とはこの座標値に対応する基準画像の座標値である。
【0084】
上記のように、特徴量(ハッシュ値)が一致する特徴点の組をランダムに抽出し、変換係数を求め、その評価値を決定する処理を複数回繰り返す。そして、求めた評価値が最も小さくなるときの変換係数を求める変換係数とする。
【0085】
次に、上記の画像処理装置101を備えるデジタルカラー複写機102の構成について説明する。図2はデジタルカラー複写機102の構成を示すブロック図である。
【0086】
図2に示すように、デジタルカラー複写機102は、カラー画像入力装置111、カラー画像処理装置112およびカラー画像出力装置113を備えている。
【0087】
カラー画像入力装置111は、例えばCCDなどの光学情報を電気信号に変換するデバイスを備えたスキャナ部より構成され、原稿からの反射光像をRGBのアナログ信号として出力する。
【0088】
カラー画像入力装置111にて読み取られたアナログ信号は、カラー画像処理装置112内を、A/D変換部121、シェーディング補正部122、文書照合処理部123、入力階調補正部124、領域分離処理部125、色補正部126、黒生成下色除去部127、空間フィルタ処理部128、出力階調補正部129、および階調再現処理部130の順で送られ、CMYKのデジタルカラー信号として、カラー画像出力装置113へ出力される。
【0089】
A/D変換部121は、RGBのアナログ信号をデジタル信号に変換するもので、シェーディング補正部122では、A/D変換部121より送られてきたデジタルのRGB信号に対して、カラー画像入力装置111の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施す。また、カラーバランスを整えると同時に、濃度信号などカラー画像処理装置に採用されている画像処理システムの扱い易い信号に変換する処理を施す。
【0090】
文書照合処理部123は、画像処理装置101の文書照合処理部2に相当するものである。すなわち、文書照合処理部123は、共通のフォーマットを備える複数の原稿画像から選択された基準画像、基準画像以外の参照画像について、特徴点算出処理、特徴量算出処理を行い、基準画像の特徴点と参照画像の特徴点を用いて両者の位置関係を求め、基準画像、参照画像の2値画像データの論理積を求めることにより共通フォーマットの抽出を行う。この文書照合処理部123は、入力されたRGB信号をそのまま、あるいは画像データの合成がなされた場合は、合成画像データを後段の入力階調補正部へ出力する。
【0091】
入力階調補正部124は、シェーディング補正部122にて各種の歪みが取り除かれたRGB信号に対して、下地濃度の除去やコントラストなどの画質調整処理が施される。
【0092】
領域分離処理部125は、RGB信号より、入力画像中の各画素を文字領域、網点領域、写真領域の何れかに分離するものである。領域分離処理部125は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、黒生成下色除去部127、空間フィルタ処理部128および階調再現処理部130へと出力するとともに、入力階調補正部124より出力された入力信号をそのまま後段の色補正部126に出力する。
【0093】
色補正部126では、色再現の忠実化を図るために、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りを取り除く処理を行う。
【0094】
黒生成下色除去部127は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行う。これによりCMYの3色信号はCMYKの4色信号に変換される。
【0095】
空間フィルタ処理部128は、黒生成下色除去部127より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正する。これにより出力画像のぼやけや粒状性劣化を軽減することができる。階調再現処理部130では、空間フィルタ処理部128と同様に、CMYK信号の画像データに対して、領域識別信号に基づいて後述する所定の処理が施される。
【0096】
例えば、領域分離処理部125にて文字に分離された領域は、文字の再現性を高めるために、空間フィルタ処理部128における空間フィルタに高周波成分の強調量が大きいフィルタが用いられる。同時に、階調再現処理部130においては、高域周波成分の再現に適した高解像度のスクリーンによる2値化もしくは多値化処理が実施される。
【0097】
また、領域分離処理部125にて網点に分離された領域に関しては、空間フィルタ処理部128において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部129では、濃度信号などの信号をカラー画像出力装置113の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部130で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理が施される。領域分離処理部125にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの2値化または多値化処理が行われる。
【0098】
上述した各処理が施された画像データは、一旦、記憶装置(図示せず)に記憶され、所定のタイミングで読み出されてカラー画像出力装置113に入力される。
【0099】
このカラー画像出力装置113は、画像データを紙などの記録媒体上に出力するものである。例えば、電子写真方式やインクジェット方式を用いたカラー画像出力装置等を挙げることができるが、特に限定されるものではない。なお、以上の処理は図示しないCPU(Central Processing Unit)により制御される。
【0100】
上記の構成において、本実施の形態の画像処理装置101の動作を図16のフローチャートに基づいて以下に説明する。
【0101】
画像処理装置101では、まず、入力されてくる複数の原稿画像のうちの一つを基準画像(基準原稿)に設定する処理を行う(S1)。
【0102】
この場合、複数の原稿画像は、例えば図2に示したデジタルカラー複写機102のカラー画像入力装置111により生成される。すなわち、ユーザにより例えば図3(a)〜図3(c)に示すような共通フォーマットを有する複数枚(例えば5〜6枚)の原稿がカラー画像入力装置111にセットされ、カラー画像入力装置111がこれら原稿を読み込んで画像データに変換し、それら画像データが画像処理装置101に入力される。
【0103】
画像処理装置101での基準原稿の設定については、例えば制御部1が行う。具体的には、制御部1は、順次入力されてくる一連の原稿画像(画像データ)のうちの最初に入力されてくるものを基準画像(基準原稿)として設定する。この場合、ユーザは、複数の原稿のうち、共通フォーマット部分が鮮明な原稿が最初にカラー画像入力装置111に読み込まれるように、複数の原稿をカラー画像入力装置111にセットする。
【0104】
なお、最初に入力されてくるものを基準画像(基準原稿)として設定する構成は合理的であるものの、基準画像(基準原稿)を選択するルールについては特に限定されない。例えば、何番目に入力されてくる原稿画像を基準画像とするかをユーザが設定可能であったり、ユーザが操作パネル114(図2参照)から基準画像(基準原稿)を選択できるようにしてもよい。
【0105】
次に、制御部1は、処理モードとして登録モードもしくは照合モードを選択する(S2)。この選択において、基準画像を処理する場合には登録モードを選択し、参照画像を処理する場合には照合モードを選択する。なお、この選択については、デジタルカラー複写機102では操作パネル114の操作により、また画像処理装置101とこれに接続された端末装置(コンピュータ)とを備えた画像処理システムでは端末装置からの入力操作により行われるものであってもよい。
【0106】
S2において登録モードが選択された場合、特徴点算出部11は入力画像データすなわち基準画像の各特徴点を算出し(S3)、それら特徴点の座標を算出する(S4)。
【0107】
次に、特徴量算出部12は、特徴点算出部11にて算出された各特徴点の特徴量を算出する(S5)。
【0108】
次に、登録処理部16は、基準画像の上記の各特徴点について、特徴点の特徴量(ハッシュ値)、特徴点のインデックス、特徴点の座標をメモリ3に格納する(S6)。これにより、図4に示す基準画像についてのテーブルが得られる。その後、画像処理装置101での処理はS6を経た後、S2に戻る。
【0109】
次に、制御部1は、S2において処理モードとして照合モードを選択する。S2において照合モードが選択された場合、特徴点算出部11は入力画像データすなわち参照画像の各特徴点を算出し(S8)、それら特徴点の座標を算出する(S9)。
【0110】
次に、特徴量算出部12は、特徴点算出部11にて算出された各特徴点の特徴量を算出する(S10)。
【0111】
次に、照合処理部13は、基準画像と各参照画像との照合処理を行い、基準画像と参照画像との特徴量(ハッシュ値)が一致する各特徴点を求める。この処理を受けて、登録処理部16は、図4に示す基準画像についてのテーブルに対して、特徴量(ハッシュ値)、特徴点を表すインデックス、および各特徴点の座標を登録する(S11)。これにより、図5に示すように、基準画像と参照画像との特徴量(ハッシュ値)が一致する特徴点の対応関係を示すテーブルが得られる。
【0112】
次に、座標変換部14は、照合処理部13において特徴量(ハッシュ値)が一致すると判定された基準画像の特徴点の座標と参照画像の特徴点の座標とを用いて、参照画像の座標系を基準画像の座標系に変換する(S12)。
【0113】
次に、論理積算出部15は、基準画像の2値画像データと座標変換後の参照画像の2値画像データとの論理積を求める(S13)。
【0114】
次に、登録処理部16は、論理積算出部15から得られた2値画像(高濃度側の2値画像)を共通フォーマットの2値画像データ(図3(d)に対応)としてメモリ3に格納する(S14)。本実施の形態においては画像データとしてRGBデータを用いているので、高濃度側の画像データは、輝度Y=0のデータ、例えば罫線や文字列を示すデータである。
【0115】
その後、画像処理装置101は、上記S8〜S14の処理を他の参照画像についても繰り返し、全ての原稿画像に対する処理が終了すると(S7)、動作を終了する。但し、他の参照画像についての上記S8〜S14の処理においては、先に第1の参照画像を使用して取得した第1の共通フォーマットの画像データを第2の基準画像とし、この第2の基準画像と第2の参照画像とから第2の共通フォーマットの画像データを取得し、次に、第2の共通フォーマットの画像データを第3の基準画像とし、この第3の基準画像と第3の参照画像とから第3の共通フォーマットの画像データを取得するといったように、順次共通フォーマットを更新していく。これにより、共通フォーマットの画像データを精度よく取得することができる。
【0116】
また、図17には、画像処理装置101には、複数の原稿画像が入力される場合に、最初に入力される原稿画像を基準画像と設定する場合の動作を示す。図17のフローチャートにおいては、S24〜S27の動作が図16におけるS3〜S6の動作に相当し、S30〜S36の動作が図16におけるS8〜S14の動作に相当する。したがって、これらの説明については省略する。
【0117】
図17において、画像処理装置101では、まず、入力されてきた複数の原稿画像のうち最初に入力された原稿画像を基準画像(基準原稿)に設定する処理を行う(S21)。
【0118】
S21の処理の後、入力される原稿画像の枚数が例えば5枚(N=5)に設定される(S22)。この設定は画像処理装置101の例えば制御部1が備えるカウンタに対して行われる。また、上記設定入力は、例えば図2に示したデジタルカラー複写機102においては、ADFにセットされた原稿枚数がユーザにより操作パネル114から入力されることにより行われる。
【0119】
制御部1は、最初の原稿画像が入力されると、上記カウンタの当初設定値が5であるので(S23)、その原稿画像を基準画像とし、S24〜S27の処理、すなわち図16に示した登録モードの処理を行う。その後、カウンタの設定値を−1すなわちN=4として(S29)、S23に戻る。
【0120】
次に、制御部1は、次の原稿画像が入力されると、上記カウンタの設定値が4であるので(S23)、その原稿画像を参照画像とし、S30〜S36の処理、すなわち図16に示した照合モードの処理を行う。その後、画像処理装置101は、S30〜S36の処理を最後の原稿まで繰り返し、動作を終了する。
【0121】
なお、前述のように、前回取得した共通フォーマットの画像データを基準画像として使用し、次の共通フォーマットの画像データを取得する第2の参照画像以降の参照画像に対する処理においては、S71〜S80の処理が行われる。すなわち、第2の参照画像以降の処理においては、共通フォーマットの画像データ(高濃度側の2値画像データ)が取得されていれば、S72〜S80の処理が行われる。この場合、S72〜S75、S76の処理はS30〜S33、S35に対応し、S77〜S79の処理はS24〜S27の処理に対応する。また、共通フォーマットの画像データ(2値画像データ)に対して行う2値の特徴点算出処理(S77)は、図6に示した特徴点算出部11の処理において、無彩化処理部21から2値化処理部24までの処理がスルーになり、重心算出部25での処理のみがなされる。
【0122】
上記のように、本実施の形態の画像処理装置101では、入力された複数の原稿画像のうちの一つを基準画像とするとともに他を参照画像とし、文書照合技術を用いて基準画像と参照画像との特徴量が一致する特徴点を抽出し、抽出した特徴点の座標値を用いて基準画像と参照画像との間の座標変換式を求め、この座標変換式を用いて基準画像と参照画像との位置合わせを行い、基準画像と参照画像とに含まれる共通のフォーマットを抽出している。
【0123】
したがって、共通フォーマットのみの画像(原稿)が存在しない場合であっても、共通フォーマットを含む複数の原稿画像(少なくとも二つの原稿画像)から、共通フォーマットのみの画像を作成することができる。
【0124】
なお、本実施の形態の画像処理装置101に適用可能な原稿としては、各種申請書、各種契約書、各種アンケート用紙など、定型のフォーム(共通フォーマット)を有し、個々の原稿に異なる書き込みがなされるものである。また、図3の例では、罫線を含むフォーム(共通フォーマット)を有するものとなっているが、例えば契約書など、罫線を含まない文字だけで構成された原稿も対象とし得る。
【0125】
〔実施の形態2〕
本発明の他の実施の形態を図面に基づいて以下に説明する。
図18は本実施の形態の画像処理装置103の構成を示すブロック図である。この画像処理装置103は、図1に示した画像処理装置101の文書照合処理部2に代えて文書照合処理部4を備えている。
【0126】
文書照合処理部4は、上記特徴点算出部11、特徴量算出部12、照合処理部13、座標変換部14、論理積算出部15および登録処理部16に加えて、合成処理部17を備えている。また、画像処理装置103は、文書照合処理部4の前段に下地検知処理部18を備えている。
【0127】
下地検知処理部18は、入力画像データから下地画像データを抽出し、メモリ3に格納する。
【0128】
合成処理部17は、メモリ3に格納されている、共通フォーマットに相当する画像データ(図3(d)に対応)に、それ以外の画像データとして下地検知処理部18にて抽出された下地画像データを合成し、合成画像データを出力する。この場合、上記共通フォーマットに相当する画像データとしては、論理積算出部15から得られた高濃度側の2値画像データをそのまま使用せずに、この画像データに相当する基準画像の画像データを使用する。
【0129】
上記合成画像データは、共通フォーマット部分には基準画像の画像データが使用され、下地部分には例えば基準画像から抽出された画像データが使用されるので、それら部分に有彩色が含まれている場合、元の原稿の色を忠実に再現することができる。
【0130】
本実施の形態の画像処理装置103を図2に示したデジタルカラー複写機102に適用した場合には、文書照合処理部123と入力階調補正部124との前後関係を入れ替えて、シェーディング補正部122の後段に入力階調補正部124を設け、入力階調補正部124の後段に文書照合処理部123を設け、入力階調補正部124で下地除去処理、すなわち上記下地検知処理部18の処理に相当する処理を行うようにしても良い。
【0131】
また、下地検知処理部18にて行う下地抽出処理は、従来周知の手法により行うことができる。例えば、その一例として次の手法がある。
(1)入力画像データにおけるRGBの各プレーン毎(色成分毎)で注目画素を含む複数の画素よりなるブロック(例えば7×7画素)の平均値を算出し、注目画素の画素値とする。
(2)次に、注目画素毎に、色成分毎の平均値に対するヒストグラム(Rave,Gave,Baveに対する3次元ヒストグラムであって濃度区分を例えば32区分としたもの)を作成し、最大度数を示すRave,Gave,Baveの値を下地濃度とする。
【0132】
他の例としては、次のように、色成分毎にヒストグラムを作成し、下記の条件を満たすとき、有彩色の下地があると判定するものである。
(1)Rプレーン、Gプレーン、Bプレーンにおける度数値が、下地があると判断される閾値以上であり、ほぼ同じ値である場合。なお、下地があると判断される閾値は、例えば、全画素数に対する度数値の比率が50%である。また、度数値がほぼ同じと判断される範囲の例は、最大の度数値に対して95%の範囲内にある場合である。
(2)ヒストグラムの濃度区分数を32とした場合、下地があると判断される閾値以上の度数を示す濃度区分数が2以下である。この条件を満たすとき、最大度数値を示す濃度区分値Rmax,Gmax,Bmaxの値を下地濃度とする。これは、有彩色の下地のヒストグラムは、度数の分布が狭くシャープであり、最大度数値がほぼ同じ値になるという特性を利用している。
【0133】
上記の構成において、本実施の形態の画像処理装置103の動作を図19のフローチャートに基づいて以下に説明する。図19においては、S41およびS44〜S49の動作が図16におけるS1およびS2〜S7の動作に相当し、S51〜S57の動作が図16におけるS8〜S14の動作に相当する。したがって、これらの説明については省略する。
【0134】
図19において、画像処理装置103では、まず、入力されてくる複数の原稿画像のうちの一つを基準画像(基準原稿)に設定する処理を行う(S41)。次に、基準画像をメモリ3に格納する(S42)。
【0135】
次に、画像処理装置103の下地検知処理部18は、例えば基準画像から下地画像データを抽出し、メモリ3に格納する(S43)。
【0136】
次に、画像処理装置103では、登録モードの選択(S44)、基準画像の各特徴点の算出(S45)、基準画像の各特徴点の座標の算出(S46)、基準画像の各特徴点についての特徴量(ハッシュ値)の算出(S47)、並びにメモリ3への基準画像の各特徴点の特徴量、各特徴点のインデックスおよび特徴点の座標の格納(S48)を行う。
【0137】
次に、画像処理装置103では、照合モードの選択(S44)、参照画像の各特徴点の算出(S51)、参照画像の各特徴点の座標の算出(S52)、参照画像の各特徴点についての特徴量(ハッシュ値)の算出(S53)、基準画像と各参照画像との照合処理(S54)、参照画像の座標系の基準画像の座標系への変換(S55)、基準画像の2値画像データと座標変換後の参照画像の2値画像データとの論理積算出(S56)、この論理積算出により得られた2値画像(高濃度側の2値画像)のメモリ3への格納(S57)を行う。
【0138】
その後、画像処理装置103の合成処理部17は、上述したように、共通フォーマットの合成画像データを出力する(S50)。
【0139】
また、図2に示したデジタルカラー複写機102は、本実施の形態の画像処理装置103を備えた場合、次のような使用形態が可能となる。
(1)ユーザが、共通フォーマットを含み書込みのある複数の原稿をADF(図示せず)に配置する。
(2)ユーザが、操作パネル114において「書き込みを消去した複製を作成するモード」を選択して実行を指示する。
(3)デジタルカラー複写機102では、文書照合処理部123(図18の文書照合処理部2に相当)が例えば基準画像(図3(a)に相当)から書き込み部分を消去した共通フォーマットのみの画像データを合成する。
(4)合成された画像データに対して文書照合処理部123以降の処理を実行し、得られた画像データをカラー画像出力装置113により紙などのメディアに出力する。これにより、書き込みを消去した共通フォーマットのみの原稿の複製を作成することができる。
【0140】
また、以上の実施の形態に示した画像処理装置101,103は、電子化データ、例えば原稿をスキャナで読み込んで取得した画像データをJPEGやPDFなど所定のファイルフォーマットに変換した画像データについても処理することができる。
【0141】
例えば、上記電子化データの形態に作成された画像データをサーバに格納しておき、それら画像データに対して、本発明をアプリケーションソフトウェアとして適用する対応である。具体的には、上記画像データがJPEGやGIFなどの符号化された画像フォーマットである場合、それら画像データに対して、一旦、復号処理を行い、次に、必要に応じてYCC信号をRGB信号に変換するなどの色変換処理を行った後、本実施の形態の画像処理装置101,103の処理を行えばよい。
【0142】
また、本実施の形態の画像処理装置101,103を適用する対象は、先に示したデジタルカラー複写機102に限定されず、コピー機能、プリンタ機能、ファクシミリ送信機能およびscan to e-mail機能等を備えたデジタルカラー複合機であってもよい。
【0143】
図20は上記デジタルカラー複合機(画像処理装置、画像形成装置)104の構成を示すブロック図である。
上記デジタルカラー複合機104は、図2に示したデジタルカラー複写機102に対して、例えばモデムやネットワークカードよりなる通信装置116を追加した構成である。
【0144】
このデジタルカラー複合機104では、ファクシミリの送信を行う場合、通信装置116にて相手先との送信手続きを行い、送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリ3から読み出し、圧縮形式の変更など必要な処理を施した後、その画像データを通信回線を介して相手先に順次送信する。
【0145】
また、ファクシミリの受信を行う場合、通信手続きを行いながら相手先から送信されてくる画像データを受信してカラー画像処理装置115に入力する。カラー画像処理装置115では、受信した画像データに対して圧縮/伸張処理部(図示せず)にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理や解像度変換処理が行なわれ、出力階調補正(出力階調補正部129)、階調再現処理(階調再現処理部10)が施され、カラー画像出力装置113から出力される。
【0146】
また、デジタルカラー複合機104は、ネットワークカード、LANケーブルを介して、ネットワークに接続されたコンピュータや他のデジタル複合機とデータ通信を行なう。
【0147】
また、上記の例では、デジタルカラー複合機104について説明したが、この複合機はモノクロの複合機であっても構わない。また、単体のファクシミリ通信装置であっても構わない。
【0148】
また、本実施の形態の画像処理装置101,103は、画像読取装置にも適用可能である。図21は、本実施の形態の画像処理装置101,103を適用したカラー画像読取装置(画像処理装置)105の構成を示すブロック図である。このカラー画像読取装置105は例えばフラットベッドスキャナであり、デジタルカメラであってもよい。
【0149】
カラー画像読取装置105は、カラー画像入力装置111とカラー画像処理装置117とを備え、カラー画像処理装置117は、A/D変換部121、シェーディング補正部122、文書照合処理部123とを備えている。文書照合処理部123は、図1に示した文書照合処理部2もしくは図18に示した文書照合処理部4に相当する。カラー画像処理装置117は、文書照合処理部4を備えている場合、さらに下地検知処理部18も備えている。
【0150】
カラー画像入力装置111(画像読取手段)は、例えばCCD(Charge Coupled Device )を備えたスキャナ部より構成され、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号としてCCDにて読み取って、カラー画像処理装置117に入力するものである。
【0151】
カラー画像入力装置111にて読み取られたアナログ信号は、カラー画像処理装置117内を、A/D(アナログ/デジタル)変換部121、シェーディング補正部122、文書照合処理部123の順で送られる。
【0152】
A/D変換部121は、RGBのアナログ信号をデジタル信号に変換するもので、シェーディング補正部122は、A/D変換部121より送られてきたデジタルのRGB信号に対して、カラー画像入力装置111の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。シェーディング補正部122ではカラーバランスの調整を行い、またRGBの反射率信号を濃度信号に変換する。
【0153】
文書照合処理部123の機能は、文書照合処理部2および文書照合処理部4において前述したとおりである。文書照合処理部123にて作成された共通フォーマットの画像データ、あるいは、合成画像データ(画像データの合成がなされた場合)は、ネットワークを介してプリンタや複合機に送信され出力される。あるいは、コンピュータを介してプリンタに、もしくは直接プリンタに入力さる。
【0154】
また、カラー画像読取装置105をサーバー、コンピュータもしくはプリンタのうちの少なくとも一つを備えたシステムの一構成要素として使用する場合には次のような動作も可能である。例えば、カラー画像読取装置105から上記のように共通フォーマットの画像データあるいは合成画像データを出力するのではなく、カラー画像読取装置105が、読み込んだ画像データの特徴点および特徴量を抽出し、それら情報をサーバー、コンピュータ、プリンタに出力する。サーバー、コンピュータ、プリンタではそれら情報に基づいて、共通フォーマットを抽出する。
【0155】
本発明はコンピュータに実行させるためのプログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータ読み取り可能な記録媒体に、上記した文書照合並びに出力制御を行う画像処理方法を記録するものとすることもできる。この結果、文書照合並びに出力制御、原稿画像の登録処理を行う画像処理方法を行うプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。
【0156】
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるためにメモリ(図示せず)、例えばROMそのものがプログラムメディアであっても良いし、また、外部記憶装置(図示せず)としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであっても良い。
【0157】
何れの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であっても良いし、あるいは、何れの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータのプログラム記憶エリア(図示せず)にダウンロードされて、そのプログラムコードが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
【0158】
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であっても良い。
【0159】
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムを担持する媒体であっても良い。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0160】
上記記録媒体は、デジタルカラー画像形成装置やコンピュータシステムに備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
【0161】
また、コンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより上記画像処理方法など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置およびコンピュータの処理結果を紙などに出力するプリンタより構成される。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられる。
【0162】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【図面の簡単な説明】
【0163】
【図1】本発明の実施の形態の画像処理装置の構成を示すブロック図である。
【図2】図1に示した画像処理装置を備えるデジタルカラー複写機の構成を示すブロック図である。
【図3】図3(a)は図1に示した画像処理装置にて処理される基準原稿を示す説明図、図3(b)は同第1の参照原稿を示す説明図、図3(c)は同第2の参照原稿を示す説明図、図3(d)は、上記基準原稿と参照原稿とから抽出される共通フォーマットの画像を示す説明図である。
【図4】図1に示したメモリに格納されている、基準画像についての各特徴点の特徴量(ハッシュ値)、各特徴点を表すインデックス、および各特徴点の座標を表すテーブルを示す説明図である。
【図5】図1に示したメモリに格納されている、基準画像と参照画画像との特徴量(ハッシュ値)が一致する特徴点の対応関係を示すテーブルである。
【図6】図1に示した特徴点算出部の構成を示すブロック図である。
【図7】図6に示したMTF補正処理部が備える混合フィルタのフィルタ係数を示す説明図である。
【図8】図1に示した特徴点算出部の処理により、2値化された画像データから抽出された連結領域およびこの連結領域の重心の一例を示す説明図である。
【図9】図1に示した特徴点算出部の処理により、2値化された画像データに含まれる文字列から抽出された複数の連結領域の各重心(特徴点)の一例を示す説明図である。
【図10】図1に示した特徴量算出部の構成を示すブロック図である。
【図11】図10に示した特徴点抽出部での注目特徴点に対する周辺特徴点の抽出動作の説明図である。
【図12】図12(a)は、特徴点抽出部にて抽出された周辺特徴点4点の中から選択し得る3点の組み合わせの一例を示すものであって、注目特徴点aに対する周辺特徴点b,c,dの組合せの例を示す説明図、図12(b)は、同注目特徴点aに対する周辺特徴点b,c,eの組合せの例を示す説明図、図12(c)は、同注目特徴点aに対する周辺特徴点b,d,eの組合せの例を示す説明図、図12(d)は、同注目特徴点aに対する周辺特徴点c,d,eの組合せの例を示す説明図である。
【図13】図13(a)は、特徴点抽出部にて抽出された周辺特徴点4点のうちの一つに注目特徴点を移した場合に選択し得る3点の周辺特徴点の組み合わせの一例を示すものであって、注目特徴点bに対する周辺特徴点a,e,fの組合せの例を示す説明図、図13(b)は、同注目特徴点bに対する周辺特徴点a,e,cの組合せの例を示す説明図、図13(c)は、同注目特徴点bに対する周辺特徴点a,f,cの組合せの例を示す説明図、図13(d)は、同注目特徴点bに対する周辺特徴点e,f,cの組合せの例を示す説明図である。
【図14】図1に示した座標変換部における、特徴量が一致する基準画像の特徴点と参照画像の特徴点とに基づいて、基準画像と参照画像との位置合せを行う動作の説明図である。
【図15】図14に示した基準画像と参照画像との位置合せの結果得られる基準画像の特徴点の座標と参照画像の特徴点の座標との対応関係を示す説明図である。
【図16】図1に示した画像処理装置の動作を示すフローチャートである。
【図17】図16に示した画像処理装置の動作の他の例を示すフローチャートである。
【図18】本発明の他の実施の形態の画像処理装置の構成を示すブロック図である。
【図19】図18に示した画像処理装置の動作を示すフローチャートである。
【図20】本発明の実施の形態の画像処理装置を備えたデジタルカラー複合機の構成を示すブロック図である。
【図21】本発明の実施の形態の画像処理装置を備えたカラー画像読取装置の構成を示すブロック図である。
【符号の説明】
【0164】
2 文書照合処理部
3 メモリ(記憶手段)
4 文書照合処理部
11 特徴点算出部
12 特徴量算出部
13 照合処理部
14 座標変換部
15 論理積算出部
16 登録処理部
17 合成処理部
18 下地検知処理部
101 画像処理装置
102 デジタルカラー複写機(画像処理装置、画像形成装置)
103 画像処理装置
104 デジタルカラー複合機(画像処理装置、画像形成装置)
105 カラー画像読取装置(画像処理装置)
113 カラー画像出力装置

【特許請求の範囲】
【請求項1】
入力された複数の原稿画像データのうちの第1および第2の原稿画像データから、第1の原稿画像データの特徴点である第1の特徴点、および第2の原稿画像データの特徴点である第2の特徴点を抽出する特徴点抽出部と、
前記第1の特徴点の特徴量である第1の特徴量、および前記第2の特徴点の特徴量である第2の特徴量を算出する特徴量算出部と、
前記第1の特徴量と前記第2の特徴量とを比較し、特徴量が一致する第1の特徴点と第2の特徴点とを抽出する照合処理部と、
前記照合処理部にて抽出された第1の特徴点の座標および第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換する座標変換部と、
第1の原稿画像データと前記座標変換部にて処理された第2の原稿画像データとの論理積を求めることにより、第1の原稿画像データと第2の原稿画像データとに含まれる共通フォーマットの画像データを抽出する論理積算出部とを備えていることを特徴とする画像処理装置。
【請求項2】
前記論理積算出部にて抽出された共通フォーマットの画像データを前記第1の原稿画像データとし、前記各部での処理に使用した原稿画像データとは異なる原稿画像データを前記第2の原稿画像データとして、前記特徴点抽出部、前記特徴量算出部、前記照合処理部、前記座標変換部および前記論理積算出部の処理を行い、前記論理積算出部にて第2の共通フォーマットの画像データを抽出することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記照合処理部は、特徴量が一致する第1の特徴点と第2の特徴点とをそれぞれ複数抽出し、
前記座標変換部は、前記照合処理部にて抽出されたそれぞれ複数の第1の特徴点の座標および第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換することを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
前記第1の原稿画像データおよび前記論理積算出部にて抽出された共通フォーマットの画像データを記憶する記憶手段と、
前記第1の原稿画像データから前記共通フォーマットの画像データに対応する画像データを読み出して出力する合成処理部とを備えていることを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。
【請求項5】
前記第1の原稿画像データから下地の画像データを抽出し、前記記憶手段に格納する下地検知処理部を備え、
前記合成処理部は、前記第1の原稿画像データから前記共通フォーマットの画像データに対応する画像データを読み出し、この画像データの前記共通フォーマット部分以外の領域に前記下地の画像データを合成して出力することを特徴とする請求項4に記載の画像処理装置。
【請求項6】
入力された複数の原稿画像データのうちの第1および第2の原稿画像データから、第1の原稿画像データの特徴点である第1の特徴点、および第2の原稿画像データの特徴点である第2の特徴点を抽出する特徴点抽出工程と、
前記第1の特徴点の特徴量である第1の特徴量、および前記第2の特徴点の特徴量である第2の特徴量を算出する特徴量算出工程と、
前記第1の特徴量と前記第2の特徴量とを比較し、特徴量が一致する第1の特徴点と第2の特徴点とを抽出する照合処理工程と、
前記照合処理工程にて抽出された第1の特徴点の座標および第2の特徴点の座標に基づいて、第2の原稿画像データの座標系を第1の原稿画像データの座標系に変換する座標変換工程と、
第1の原稿画像データと前記座標変換工程にて処理された第2の原稿画像データとの論理積を求めることにより、第1の原稿画像データと第2の原稿画像データとに含まれる共通フォーマットの画像データを抽出する論理積算出工程とを備えていることを特徴とする画像処理方法。
【請求項7】
前記論理積算出工程にて抽出された共通フォーマットの画像データを前記第1の原稿画像データとし、前記各工程での処理に使用した原稿画像データとは異なる原稿画像データを前記第2の原稿画像データとして、前記特徴点抽出工程、前記特徴量算出工程、前記照合処理工程、前記座標変換工程および前記論理積算出工程の処理を行い、前記論理積算出工程にて第2の共通フォーマットの画像データを抽出することを特徴とする請求項6に記載の画像処理方法。
【請求項8】
請求項1から5項の何れかに記載の画像処理装置と画像データを印刷して出力可能な画像出力手段とを備えることを特徴とする画像形成装置。
【請求項9】
請求項1から5のいずれか1項に記載の画像処理装置の前記の各部としてコンピュータを機能させるためのプログラム。
【請求項10】
請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2009−232085(P2009−232085A)
【公開日】平成21年10月8日(2009.10.8)
【国際特許分類】
【出願番号】特願2008−74063(P2008−74063)
【出願日】平成20年3月21日(2008.3.21)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】