説明

画像処理装置、画像データ出力処理装置、画像処理方法、プログラムおよびその記録媒体

【課題】原稿を読み取るときの読取倍率にかかわらず入力原稿画像のサイズを適切に算出する。
【解決手段】入力画像データに含まれる入力原稿画像の特徴点を算出する特徴点算出部31と、算出された特徴点同士の相対位置に基づいて入力原稿画像の特徴量を算出する特徴量算出部32と、入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して入力原稿画像が登録原稿画像に類似しているか否かの判定を行う類似度判定処理部34と、入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて入力原稿画像のサイズを算出する原稿傾き・サイズ・方向検知処理部35とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力画像データに含まれる入力原稿画像のサイズを算出する画像処理装置および画像処理方法に関するものである。
【背景技術】
【0002】
従来より、原稿から読み取った画像データにおける上記原稿に対応する画像部分を特定し、特定した画像部分のみを切り出す(クロップする)技術が知られている。
【0003】
例えば、特許文献1には、原稿から所定のサイズで読み取られた画像データにおける原稿部分のサイズを算出し、算出された原稿部分のサイズと予め記憶している複数の用紙サイズとを比較してこれらの差が予め設定された各用紙サイズの許容範囲内であるか否か判断し、許容範囲内である場合には最も近い用紙サイズで画像データをクロップし、許容範囲内でない場合には算出された原稿部分のサイズで画像データをクロップする技術が開示されている。
【特許文献1】特開2007−201752号公報(平成19年8月9日公開)
【特許文献2】国際公開第2006/092957号パンフレット(平成18年9月8日公開)
【非特許文献1】中居 友弘、黄瀬 浩一、岩村 雅一:「複比の投票に基づく文書画像検索と射影歪み補正」、画像の認識・理解シンポジウム(MIRU2005)(情報処理学会 コンピュータビジョンとイメージメディア研究会主催)予稿集、538−545頁
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1の技術では、原稿を読み取るときの読取倍率が一定であり、この読取倍率に対応する用紙サイズの情報が記憶されている場合にしか原稿部分のサイズを適切に判定できないという問題がある。
【0005】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、原稿を読み取るときの読取倍率にかかわらず原稿画像のサイズを適切に算出することにある。
【課題を解決するための手段】
【0006】
本発明の画像処理装置は、上記の課題を解決するために、入力画像データに含まれる入力原稿画像の特徴点を算出する特徴点算出部と、上記特徴点算出部の算出した特徴点同士の相対位置に基づいて上記入力原稿画像の特徴量を算出する特徴量算出部と、上記特徴量算出部の算出した上記入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して上記入力原稿画像が登録原稿画像に類似しているか否かの判定を行う類似性判定部とを備えた画像処理装置であって、上記登録原稿画像の各特徴点および上記登録原稿画像の各角部の座標を記憶した記憶手段と、上記入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を上記入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで上記入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて上記入力原稿画像のサイズを算出する原稿サイズ算出部を備えていることを特徴としている。なお、上記入力画像データは、原稿画像を読み取ることで取得してもよく、画像処理装置に通信可能に接続された他の装置から通信によって取得してもよく、各種記録媒体に記録された画像データを読み出すことで取得してもよい。
【0007】
また、本発明の画像処理方法は、上記の課題を解決するために、入力画像データに含まれる入力原稿画像の特徴点を算出する特徴点算出工程と、上記特徴点算出工程で算出した特徴点同士の相対位置に基づいて上記入力原稿画像の特徴量を算出する特徴量算出工程と、上記特徴量算出工程で算出した上記入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して上記入力原稿画像が登録原稿画像に類似しているか否かの判定を行う類似性判定工程とを含む画像処理方法であって、上記登録原稿画像の各特徴点および上記登録原稿画像の各角部の座標を予め記憶する記憶工程と、上記入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を上記入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで上記入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて上記入力原稿画像のサイズを算出する原稿サイズ算出工程とを含むことを特徴としている。
【0008】
上記の画像処理装置および画像処理方法によれば、入力画像データに含まれる入力原稿画像の特徴点を算出し、特徴点同士の相対位置に基づいて入力原稿画像の特徴量を算出し、入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して入力原稿画像が登録原稿画像に類似しているか否かを判定する。このように、特徴点同士の相対位置に基づいて算出される特徴量を用いて登録原稿画像との類似性判定を行うことにより、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、両画像の類似性を適切に判定できる。
【0009】
また、上記の画像処理装置および画像処理方法によれば、入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて入力原稿画像のサイズを算出する。これにより、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、登録原稿画像の角部に対応する入力原稿画像の座標を入力原稿画像の角部の座標として算出し、それに基づいて入力原稿画像のサイズを適切に算出することができる。したがって、原稿を読み取るときの読取倍率にかかわらず入力原稿画像のサイズを適切に算出することができる。
【0010】
また、上記原稿サイズ算出部による上記入力原稿画像の角部の座標および上記入力原稿画像のサイズの算出結果に基づいて上記入力画像データから上記入力原稿画像を切り出す原稿サイズ補正処理部を備えている構成としてもよい。
【0011】
上記の構成によれば、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、入力原稿画像の角部の座標および入力原稿画像のサイズを適切に算出し、それに基づいて入力画像データから入力原稿画像を適切に切り出すことができる。
【0012】
また、算出された上記入力原稿画像の角部の座標に基づいて、上記入力画像データの基準方向に対する上記入力原稿画像の傾き角度を算出する原稿傾き算出部を備えている構成としてもよい。
【0013】
上記の構成によれば、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、入力原稿画像の傾き角度を適切に算出することができる。
【0014】
また、上記原稿傾き算出部の算出した傾き角度に基づいて上記入力原稿画像の傾きを補正する傾き補正処理部を備えている構成としてもよい。
【0015】
上記の構成によれば、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、入力原稿画像の傾き角度を適切に算出することができ、それに基づいて原稿の傾きを適切に補正することができる。
【0016】
ところで、上記特許文献1の技術では、画像データにおける原稿部分のサイズの算出結果と予め記憶している複数の用紙サイズとを比較して類似する用紙サイズに基づいてクロップした後、算出された上記原稿部分のサイズをクロップ後の画像データの中心を基準として上記用紙サイズに一致させるように変換する場合、例えば、原稿の左側部分のみが実際の用紙サイズよりも大きく算出されたページと、原稿の下側部分のみが実際の用紙サイズよりも大きく算出されたページとで、文字位置がずれてしまう場合があった。
【0017】
これに対して、上記原稿サイズ補正処理部と上記傾き補正処理部とを備えた上記の構成によれば、同じフォーマットの複数の原稿を連続スキャンして得られた複数ページの入力画像データに対して、入力原稿画像の切り出し、および原稿の傾きを適切に行うことができるので、ページ間の位置ずれが少ない高品位な画像データを生成することができる。
【0018】
また、上記登録原稿画像の角部の座標と、算出された上記入力原稿画像の角部の座標とに基づいて、上記入力画像データの基準方向に対する上記入力原稿画像の向きを90度単位で算出する原稿方向算出部を備えている構成としてもよい。
【0019】
上記の構成によれば、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、入力原稿画像の90度単位の向きを適切に算出することができる。
【0020】
また、上記原稿方向算出部の算出した上記入力原稿画像の向きに基づいて上記入力原稿画像の向きを上記基準方向に一致させるように上記入力画像データに回転処理を施す原稿方向補正処理部を備えている構成としてもよい。
【0021】
上記の構成によれば、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、入力原稿画像の90度単位の向きを適切に算出することができ、それに基づいて入力原稿画像の向きを適切に補正することができる。
【0022】
本発明の画像データ出力処理装置は、画像データの出力処理を行う画像データ出力処理装置であって、上記したいずれかの補正処理部を有する画像処理装置を備え、上記画像処理装置から出力される画像データの出力処理を行うことを特徴としている。ここで、上記出力処理は、例えば、画像データに応じた画像を記録材上に印刷する処理であってもよく、画像データに応じた画像を表示装置に表示させる処理であってもよく、画像データの他の装置に送信する処理であってもよく、画像データを所定の記憶先に記憶させる処理であってもよい。
【0023】
上記の構成によれば、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、適切な補正処理を施された画像データに基づいて出力処理を行うことができる。
【0024】
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより、上記画像処理装置をコンピュータにて実現させる画像処理プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
【0025】
また、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより、上記画像処理装置をコンピュータにて実現させるプログラム、及びそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
【発明の効果】
【0026】
以上のように、本発明の画像処理装置は、入力画像データに含まれる入力原稿画像の特徴点を算出する特徴点算出部と、上記特徴点算出部の算出した特徴点同士の相対位置に基づいて上記入力原稿画像の特徴量を算出する特徴量算出部と、上記特徴量算出部の算出した上記入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して上記入力原稿画像が登録原稿画像に類似しているか否かの判定を行う類似性判定部とを備えた画像処理装置であって、上記登録原稿画像の各特徴点および上記登録原稿画像の各角部の座標を記憶した記憶部と、上記入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を上記入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで上記入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて上記入力原稿画像のサイズを算出する原稿サイズ算出部を備えている。
【0027】
また、本発明の画像処理装置は、入力画像データに含まれる入力原稿画像の特徴点を算出する特徴点算出工程と、上記特徴点算出工程で算出した特徴点同士の相対位置に基づいて上記入力原稿画像の特徴量を算出する特徴量算出工程と、上記特徴量算出工程で算出した上記入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して上記入力原稿画像が登録原稿画像に類似しているか否かの判定を行う類似性判定工程とを含む画像処理方法であって、上記登録原稿画像の各特徴点および上記登録原稿画像の各角部の座標を予め記憶する記憶工程と、上記入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を上記入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで上記入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて上記入力原稿画像のサイズを算出する原稿サイズ算出工程とを含む。
【0028】
それゆえ、原稿を読み取るときの読取倍率にかかわらず入力原稿画像のサイズを適切に算出することができる。
【発明を実施するための最良の形態】
【0029】
本発明の一実施形態について説明する。なお、本実施形態では、本発明をデジタルカラー複写機に適用する場合の例について説明する。
【0030】
(1−1. デジタルカラー複写機1の構成)
図2は、本実施形態にかかるデジタルカラー複写機(画像処理装置、画像形成装置、画像読取装置)1の概略構成を示すブロック図である。この図に示すように、デジタルカラー複写機1は、カラー画像入力装置2、カラー画像処理装置3、カラー画像出力装置4、および操作パネル6を備えている。
【0031】
カラー画像入力装置(画像読取装置)2は、例えばCCD(Charge Coupled Device )などの光学情報を電気信号に変換するデバイスを備えたスキャナ部(図示せず)より構成され、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号としてカラー画像処理装置3に出力する。
【0032】
カラー画像処理装置3は、A/D変換部11、シェーディング補正部12、文書照合処理部13、入力階調補正部14、領域分離処理部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、および階調再現処理部20を備えている。カラー画像入力装置2からカラー画像処理装置3に出力されたアナログ信号は、カラー画像処理装置3内を、A/D変換部11、シェーディング補正部12、文書照合処理部13、入力階調補正部14、領域分離処理部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、階調再現処理部20の順で送られ、CMYKのデジタルカラー信号としてカラー画像出力装置4に出力される。
【0033】
A/D(アナログ/デジタル)変換部11は、RGBのアナログ信号をデジタル信号に変換するものである。
【0034】
シェーディング補正部12は、A/D変換部11より送られてきたデジタルのRGB信号に対して、カラー画像入力装置2の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。
【0035】
文書照合処理部13は、入力された原稿画像(入力原稿画像)の画像データ(入力画像データ)から特徴点を抽出し、抽出した特徴点に基づいて特徴量を算出する。また、文書照合処理部13は、上記のように算出した特徴量を画像データと対応付けて後述するハッシュテーブルに記憶(登録)させる登録処理と、上記のように算出した特徴量をハッシュテーブルに記憶されている登録原稿画像の特徴量と比較することで入力原稿画像と登録原稿画像との類似性を判定する類似判定処理とを行う機能を有している。また、文書照合処理部13は、類似判定処理の結果に基づいて入力原稿画像における原稿傾き角度、原稿サイズ、および原稿方向を検知するとともに、これらの検知結果に基づいて入力原稿画像の画像データに対して原稿の傾き補正、原稿領域の切り出し、および原稿方向の補正(90°単位での回転処理)を行う機能を有している。また、文書照合処理部13は入力されたRGB信号をそのまま後段の入力階調補正部14へ出力する。文書照合処理部13の詳細については後述する。
【0036】
なお、本実施形態では、文書照合処理部13をシェーディング補正部12と入力階調補正部14との間に設けているが、これに限らず、領域分離処理部15の後段に設けてもよい。あるいは、文書照合処理部13をシェーディング補正部12と領域分離処理部15との間に入力階調補正部14と並列に設けてもよい。この場合、カラーバランスを整えると処理、濃度信号に変換する処理は入力階調補正部14ではなくシェーディング補正部12で行うようにすればよい。
【0037】
入力階調補正部14は、シェーディング補正部にて各種の歪みが取り除かれたRGB信号に対して、カラーバランスを整えると同時に、濃度信号などカラー画像処理装置3で採用されている画像処理システムの扱い易い信号に変換する処理を施すものである。また、入力階調補正部14は、下地色(下地色の濃度成分:下地濃度)の除去やコントラストなどの画質調整処理を施す。
【0038】
領域分離処理部15は、RGB信号より、入力画像データ中の各画素を文字領域、網点領域、写真領域のいずれかに分離するものである。領域分離処理部15は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、黒生成下色除去部17、空間フィルタ処理部18、および階調再現処理部20へと出力するとともに、入力階調補正部14より出力された入力信号をそのまま後段の色補正部16に出力する。
【0039】
色補正部16は、色再現の忠実化実現のために、不要吸収成分を含むCMY(C:シアン・M:マゼンタ・Y:イエロー)色材の分光特性に基づいた色濁りを取り除く処理を行うものである。
【0040】
黒生成下色除去部17は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成処理、および、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する下色除去処理を行うものである。これにより、CMYの3色信号はCMYKの4色信号に変換される。
【0041】
空間フィルタ処理部18は、黒生成下色除去部17より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。階調再現処理部20も、空間フィルタ処理部18と同様、CMYK信号の画像データに対して領域識別信号を基に所定の処理を施すものである。
【0042】
例えば、領域分離処理部15にて文字に分離された領域は、文字の再現性を高めるために、空間フィルタ処理部18による空間フィルタ処理における鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、階調再現処理部20においては、高域周波数の再現に適した高解像度のスクリーンでの二値化または多値化処理が選択される。
【0043】
また、領域分離処理部15にて網点領域に分離された領域に関しては、空間フィルタ処理部18において、入力網点成分を除去するためのローパス・フィルタ処理が施される。そして、出力階調補正部19では、濃度信号などの信号をカラー画像出力装置4の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部20で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理(中間調生成)が施される。領域分離処理部15にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
【0044】
上述した各処理が施された画像データは、いったん記憶装置(図示せず)に記憶され、所定のタイミングで読み出されてカラー画像出力装置4に入力される。
【0045】
カラー画像出力装置4は、カラー画像処理装置3から入力された画像データを記録材(例えば紙等)上に出力するものである。カラー画像出力装置4の構成は特に限定されるものではなく、例えば、電子写真方式やインクジェット方式を用いたカラー画像出力装置を用いることができる。
【0046】
操作パネル6は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され(いずれも図示せず)、デジタルカラー複写機1の主制御部(図示せず)の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を上記主制御部に伝達する。ユーザは、操作パネル6を介して入力画像データに対する処理要求(例えば処理モード(複写、印刷、編集など)、処理枚数(複写枚数、印刷枚数)など)を入力することができる。上記主制御部は、例えばCPU(Central Processing Unit)等からなり、図示しないROM等に格納されたプログラムや各種データ、操作パネル6から入力される情報等に基づいて、デジタルカラー複写機1の各部の動作を制御する。
【0047】
(1−2. 文書照合処理部13の構成)
次に、文書照合処理部13の詳細について説明する。本実施形態にかかる文書照合処理部13は、入力原稿画像の画像データから複数の特徴点を抽出し、抽出した各特徴点に対して局所的な特徴点の集合を決定し、決定した各集合から特徴点の部分集合を選択し、選択した各部分集合を特徴付ける量として、部分集合中の特徴点に関する複数の組み合わせに基づいて、幾何学的変換に対する不変量をそれぞれ求め、求めた各不変量を組み合わせてハッシュ値(特徴量)を算出する。また、計算したハッシュ値に対応する登録原稿画像に投票することにより、入力原稿画像に類似する登録原稿画像の検索、当該登録原稿画像に対する類似性の判定処理(類似あり/類似なしの判定)を行う。また、計算したハッシュ値と、このハッシュ値を抽出した画像とを対応付けてハッシュテーブルに記憶(登録)させる処理を行うこともできる。
【0048】
図1は、文書照合処理部13の概略構成を示すブロック図である。この図に示すように、文書照合処理部13は、特徴点算出部(特徴点検出部)31、特徴量算出部32、投票処理部33、類似度判定処理部(類似性判定部)34、原稿傾き・サイズ・方向検知処理部35、原稿傾き・サイズ補正処理部36、回転処理部37、登録処理部38、制御部7、およびメモリ8を備えている。
【0049】
制御部7は、文書照合処理部13の各部の動作を制御する。なお、制御部7は、デジタルカラー複写機1の各部の動作を制御するための主制御部に備えられていてもよく、主制御部とは別に備えられ、主制御部と協働して文書照合処理部13の動作を制御するものであってもよい。
【0050】
メモリ8には、登録原稿画像を特定するためのインデックスと、登録原稿画像から抽出した特徴量とを互いに対応付けて記憶するハッシュテーブル(図示せず)が備えられている。また、メモリ8には、ハッシュテーブルの他、文書照合処理部13の各部の処理に用いられる各種データ、処理結果等を記憶する記憶部(図示せず)を備えている。なお、ハッシュテーブルの詳細については後述する。
【0051】
特徴点算出部31は、画像データに基づいて文字列や罫線の連結部分を抽出し、連結部分の重心を特徴点として算出する。なお、特徴点の算出方法はこれに限るものではなく、従来から公知の種々の方法を用いることができる。
【0052】
図3は、特徴点算出部31の概略構成を示すブロック図である。この図に示すように、特徴点算出部31は、無彩化処理部(信号変換処理部)41、解像度変換部42、MTF処理部43、2値化処理部44、および重心算出部45を備えている。
【0053】
無彩化処理部41は、シェーディング補正部12から入力された画像データ(RGB信号)がカラー画像である場合にこの画像データを無彩化して、明度信号もしくは輝度信号に変換するものである。例えば、信号変換処理部41は、下記式によりRGB信号を輝度信号Yに変換する。
【0054】
Yi=0.30Ri+0.59Gi+0.11Bi
ここで、Yは各画素の輝度信号であり、R,G,Bは各画素のRGB信号における各色成分であり、添え字のiは画素毎に付与された値(iは1以上の整数)である。
【0055】
あるいは、RGB信号をCIE1976L***信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換してもよい。
【0056】
解像度変換部42は、入力画像データを変倍処理する。例えば、解像度変換部42は、入力画像データがカラー画像入力装置2で光学的に変倍されている場合に、所定の解像度になるように入力画像データを再度変倍する。また、解像度変換部42が、後段の各処理部における処理量を軽減するために、カラー画像入力装置2で等倍時に読み込まれる解像度よりも解像度を落とすための解像度変換を行うようにしてもよい(例えば、600dpi(dot per inch)で読み込まれた画像データを300dpiに変換するなど)。
【0057】
MTF(modulation transfer function)処理部43は、カラー画像入力装置2の空間周波数特性が機種ごとに異なることを吸収(調整)するために用いられる。CCDの出力する画像信号には、レンズやミラー等の光学部品、CCDの受光面のアパーチャ開口度、転送効率や残像、物理的な走査による積分効果及び操作むら等に起因しMTFの劣化が生じている。このMTFの劣化により、読み込まれた画像がぼやけたものとなっている。MTF処理部43は、適切なフィルタ処理(強調処理)を施すことにより、MTFの劣化により生じるぼやけを修復する処理を行う。また、後述する特徴点抽出処理に不要な高周波成分を抑制するためにも用いる。すなわち、混合フィルタ(図示せず)を用いて強調および平滑化処理を行う。なお、図4は、この混合フィルタにおけるフィルタ係数の一例を示している。
【0058】
2値化処理部44は、無彩化された画像データ(輝度値(輝度信号)又は明度値(明度信号))を閾値と比較することにより画像データを2値化する。
【0059】
重心算出部45は、2値化された画像データ(例えば、「1」、「0」で表される)に基づいて、各画素に対してラベリング(ラベル付け処理)を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出する。また、抽出した特徴点を示す情報を特徴量算出部へ出力する。なお、特徴点は、2値画像における座標値(x座標、y座標)で表すことができる。図5は「A」という文字から抽出される特徴点の例を示しており、図6は複数の文字からなる文字列から抽出された特徴点の例を示している。
【0060】
特徴量算出部32は、原稿画像の回転、平行移動、拡大、縮小、平行移動等の幾何学的変形に対して不変な量である特徴量(ハッシュ値および/または不変量)を算出する。図7は、特徴量算出部32の構成を示すブロック図である。この図に示すように、特徴量算出部32は、特徴点抽出部32a、不変量算出部32b、およびハッシュ値算出部32cを備えている。
【0061】
特徴点抽出部32aは、図8に示すように、1つの特徴点を注目特徴点とし、この注目特徴点の周辺の特徴点を、注目特徴点からの距離が近いものから順に所定数(ここでは4点)だけ周辺特徴点として抽出する。図8の例では、特徴点aを注目特徴点とした場合には特徴点b,c,d,eの4点が周辺特徴点として抽出され、特徴点bを注目特徴点とした場合には特徴点a,c,e,fの4点が周辺特徴点として抽出される。
【0062】
また、特徴点抽出部32aは、上記のように抽出した周辺特徴点4点の中から選択しうる3点の組み合わせを抽出する。例えば、図9(a)〜図9(c)に示すように、図13に示した特徴点aを注目特徴点とした場合、周辺特徴点b,c,d,eのうちの3点の組み合わせ、すなわち、周辺特徴点b,c,d、周辺特徴点b,c,e、周辺特徴点c,d,eの各組み合わせが抽出される。
【0063】
次に、不変量算出部32bは、抽出した各組み合わせについて、幾何学的変形に対する不変量(特徴量の1つ)Hijを算出する。ここで、iは注目特徴点を示す数(iは1以上の整数)であり、jは周辺特徴点3点の組み合わせを示す数(jは1以上の整数)である。本実施形態では、周辺特徴点同士を結ぶ線分の長さのうちの2つの比を不変量Hijとする。なお、上記線分の長さは、各周辺特徴点の座標値に基づいて算出すればよい。例えば、図9(a)の例では、特徴点cと特徴点dとを結ぶ線分の長さをA11、特徴点cと特徴点bとを結ぶ線分の長さをB11とすると、不変量H11はH11=A11/B11である。また、図9(b)の例では、特徴点cと特徴点bとを結ぶ線分の長さをA12、特徴点bと特徴点eとを結ぶ線分の長さをB12とすると、不変量H12はH12=A12/B12である。また、図9(c)の例では、特徴点dと特徴点bとを結ぶ線分の長さをA13、特徴点bと特徴点eとを結ぶ線分の長さをB13とすると、不変量H13はH13=A13/B13である。このようにして、図9(a)〜図9(c)の例では、不変量H11,H12,H13が算出される。なお、上記の例では、水平方向左側に位置する周辺特徴点と水平方向中央に位置する周辺特徴点とを結ぶ線分をAij、水平方向中央に位置する周辺特徴点と水平方向右側に位置する周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
【0064】
次に、ハッシュ値算出部32cは、(Hi1×10+Hi2×10+Hi3×10)/Dの余りの値をハッシュ値(特徴量の1つ)Hiとして算出し、メモリ8に記憶させる。なお、上記Dは余りが取り得る値の範囲をどの程度に設定するかに応じて予め設定される定数である。
【0065】
なお、不変量Hijの算出方法は特に限定されるものではなく、例えば、注目特徴点の近傍5点の複比、近傍n点(nはn≧5の整数)から抽出した5点の複比、近傍n点から抽出したm点(mはm<nかるm≧5の整数)の配置およびm点から抽出した5点の複比に基づいて算出される値などを注目特徴点についての上記不変量Hijとしてもよい。なお、複比とは、直線上の4点または平面上の5点から求められる値であり、幾何学的変換の一種である射影変形に対する不変量として知られている。
【0066】
また、ハッシュ値Hiの算出するための式についても上記式、すなわち(Hi1×10+Hi2×10+Hi3×10)/Dの余りの値をハッシュ値とする構成に限るものではなく、他のハッシュ関数(例えば特許文献2に記載されているハッシュ関数のうちのいずれか)を用いてもよい。
【0067】
また、特徴量算出部32の各部は、1つの注目特徴点に対する周辺特徴点の抽出およびハッシュ値Hiの算出が終わると、注目特徴点を他の特徴点に変更して周辺特徴点の抽出およびハッシュ値の算出を行い、全ての特徴点についてのハッシュ値を算出する。
【0068】
図8の例では、特徴点aを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出が終わると、次に特徴点bを注目特徴点とした場合の周辺特徴点およびハッシュ値の抽出を行う。図8の例では、特徴点bを注目特徴点とした場合、特徴点a,c,e,fの4点が周辺特徴点として抽出される。そして、図10(a)〜図10(c)に示すように、これら周辺特徴点a,c,e,fの中から選択される3点の組み合わせ(周辺特徴点a,e,f、周辺特徴点c,e,f、周辺特徴点a,c,f)を抽出し、各組み合わせについてハッシュ値Hiを算出し、メモリ8に記憶させる。そして、この処理を各特徴点について繰り返し、各特徴点を注目特徴点とした場合のハッシュ値をそれぞれ求めてメモリ8に記憶させる。
【0069】
なお、上記の例では、注目特徴点に最も近い周辺特徴点と2番目に近い周辺特徴点とを結ぶ線分をAij、注目特徴点に最も近い周辺特徴点と3番目に近い周辺特徴点とを結ぶ線分をBijとしたが、これに限らず、周辺特徴点間を結ぶ線分の長さを基準にして選定する等、不変量Hijの算出に用いる線分は任意の方法で選定すればよい。
【0070】
また、上記の例では、1つの特徴点(注目特徴点)に対して1つのハッシュ値を算出するものとしているが、これに限らず、1つの特徴点(注目特徴点)に対して複数のハッシュ値を算出するようにしてもよい。例えば、注目特徴点の周辺特徴点として6点を抽出し、この6点から5点を抽出した6通りの組み合わせそれぞれについて、5点から3点を抽出して不変量を求めてハッシュ値を算出する方法を用いてもよい。この場合には、1つの特徴点に対して6個のハッシュ値が算出されることになる。
【0071】
また、特徴量算出部32は、入力原稿画像を登録原稿画像として登録する登録処理を行う場合には、上記のように算出した入力原稿画像の各特徴点についてのハッシュ値(特徴量)を登録処理部38に送る。また、特徴量算出部32は、入力原稿画像が既に登録されている登録原稿画像の画像データであるかどうかの判定処理(類似判定処理)を行う場合には、上記のように算出した入力原稿画像の各特徴点についてのハッシュ値を投票処理部33に送る。
【0072】
登録処理部38は、特徴量算出部32が算出した各特徴点についてのハッシュ値と、原稿画像を表す原稿ページインデックス(原稿ID)とを互いに対応付けてメモリ8に設けられたハッシュテーブルに順次登録していく(図11(a)参照)。なお、入力画像データが複数ページ(複数の入力原稿画像)の画像データから成る場合には、各ページに対して原稿ページインデックスが付される。ハッシュ値がすでに登録されている場合は、当該ハッシュ値に対応付けて原稿IDを登録する。原稿IDは重複することなく順次番号が割り当てられる。なお、ハッシュテーブルに登録されている原稿の数が所定値(例えば、登録可能な原稿の数の80%)より多くなった場合、古い原稿IDを検索して順次消去するようにしてもよい。また、消去された原稿IDは、新たな入力原稿画像の原稿IDとして再度使用できるようにしてもよい。また、算出されたハッシュ値が同値である場合(図11(b)の例ではH1=H5)、これらを1つにまとめてハッシュテーブルに登録してもよい。
【0073】
また、登録処理部38は、図12に示すように、原稿ページインデックス毎に、原稿ページインデックスと原稿サイズ情報とを対応付けて登録する。本実施形態では、原稿サイズ情報として、原稿の4頂点(矩形形状からなる原稿の4つの角部)の座標情報を登録する。
【0074】
また、登録処理部38は、図13に示すように、登録原稿画像の各特徴点を表すインデックス情報f(f1、f2、f3、…)と、各登録原稿画像上の座標とを対応付けて登録する。
【0075】
なお、登録処理を行う場合、投票処理部33、類似度判定処理部34の処理はスルー(何も処理を行わない)となる。逆に、類似判定処理(文章照合処理)を行う場合は、登録処理部38の処理はスルーになる。
【0076】
投票処理部33は、入力原稿画像から算出した各特徴点のハッシュ値(特徴量)をハッシュテーブルに登録されているハッシュ値と比較し、同じハッシュ値を有する登録原稿画像に投票する。言い換えれば、登録原稿画像毎に、登録原稿画像が有するハッシュ値と同じハッシュ値が入力原稿画像から算出された回数をカウントし、カウント値をメモリ8に記憶させる。図14は、登録原稿画像ID1,ID2,ID3に対する投票数の一例を示すグラフである。
【0077】
なお、投票処理部33は、投票処理を行う際、ハッシュ値が一致する入力原稿画像の特徴点と登録原稿画像の特徴点とを用いて、両者の特徴点の位置関係を求めておく。つまり、入力原稿画像の特徴点と登録原稿画像の特徴点との位置合わせを行う。そして、図15に示すように、入力原稿画像のどの特徴点が、どの登録原稿画像のどの特徴点に投票したのかを記憶しておく。図15において、p(p1、p2、p3、…)は入力原稿画像の各特徴点を表すインデックス情報であり、f(f1、f2、f3、…)は登録原稿画像の各特徴点を表すインデックス情報である。図15の例では、入力原稿画像の特徴点p1に対して求めた特徴量(ハッシュ値)が、登録原稿画像ID1の特徴点f1の特徴量と一致し、また、入力原稿画像の特徴点p2に対して求めた特徴量(ハッシュ値)が、登録原稿画像ID3の特徴点f2の特徴量と一致していると判定されている(上記内容については、非特許文献1に記載がある)。
【0078】
類似度判定処理部(類似性判定部)34は、メモリ8から投票処理部33の投票処理結果(各登録原稿画像のインデックスおよび各登録原稿画像に対する投票数;類似度)を読み出し、最大得票数および最大得票数を得た登録原稿画像のインデックスを抽出する。そして、抽出された最大得票数を予め定められている閾値THaと比較して類似性(入力原稿画像が登録原稿画像の画像データであるかどうか)を判定し、判定結果を示す判定信号を制御部7に送る。つまり、最大得票数が予め定められた閾値THa以上である場合には「類似性あり(入力原稿画像は登録原稿画像の画像データである)」と判定し、閾値THa未満である場合には「類似性なし(入力原稿画像は登録原稿画像の画像データではない)」と判定する。
【0079】
あるいは、類似度判定処理部34が、各登録原稿画像に対する得票数を最大得票数(得票数が最大である登録原稿画像の得票数)で除算して正規化することで類似度を算出し、この類似度と予め定められている閾値THa(例えば0.8)との比較を行うことによって類似性を判定してもよい。なお、この場合、手書き部分があると投票数は最大得票数より大きくなることがあるため、類似度は1より大きくなる場合もあり得る。最大得票数は、特徴点の数×1つの特徴点(注目特徴点)から算出されるハッシュ値の数で表される。
【0080】
原稿傾き・サイズ・方向検知処理部35は、入力原稿画像が登録原稿画像に類似していると判定されたときに、(i)入力画像データにおける原稿の傾き(例えば原稿の上端の辺と画像データの主走査方向とのなす角度)、(ii)入力画像データに含まれる原稿のサイズ、および(iii)入力画像データに含まれる原稿の向き(例えば画像データの基準方向(上から下に向かう方向)に対する原稿に含まれる文字列の90度単位の向き)を検出する。原稿傾き・サイズ・方向検知処理部35における処理の詳細については後述する。
【0081】
原稿傾き・サイズ補正処理部36は、原稿傾き・サイズ・方向検知処理部35による原稿サイズの検出結果に基づいて入力画像データから原稿画像に対応する領域の切り出し処理(原稿サイズの補正処理)を行うとともに、原稿傾き・サイズ・方向検知処理部35による原稿の傾き検出結果に基づいて入力画像データに原稿の傾き補正処理を施す。原稿傾き・サイズ補正処理部36における処理の詳細については後述する。
【0082】
回転処理部37は、原稿傾き・サイズ・方向検知処理部35による原稿の向きの検出結果に基づいて原稿の向きを画像データの基準方向と一致させるように90°単位での回転処理(方向補正処理)を行う。回転処理部37における処理の詳細については後述する。
【0083】
(1−3. 原稿傾き・サイズ・方向の検知および補正)
次に、原稿傾き・サイズ・方向の検知方法、および補正方法について説明する。
【0084】
原稿傾き・サイズ・方向検知処理部35は、投票処理部33による投票処理の結果に基づいて、入力原稿画像の特徴点の座標と、この入力原稿画像に類似していると判定された登録原稿画像の特徴点の座標とを対応付ける。例えば、図15に示した例において、入力原稿画像が登録原稿画像ID1に類似していると判定された場合、図16および表1に示すように、入力原稿画像の各特徴点と登録原稿画像ID1の各特徴点とを対応付ける。
【0085】
【表1】

【0086】
次に、原稿傾き・サイズ・方向検知処理部35は、登録原稿画像の各特徴点についての行列Pinを入力原稿画像の各特徴点についての行列Poutに略一致させるための変換係数Aを算出する。なお、行列Pin、行列Pout、および変換係数Aは下記式で表現される。
【0087】
【数1】

【0088】
Pout=Pin×A
Pinは正方行列ではないので、下記式に示すように、両辺にPinの転置行列Pinを乗算し、さらにPinPinの逆行列を乗算する。
PinPout=PinPin×A
(PinPin)−1PinPout=A
そして、このように算出した変換係数Aを用いて、下記式により、登録原稿画像の4つの頂点座標(x,y)を入力原稿画像上の座標(x’,y’)に変換する。なお、登録原稿画像における左上の頂点座標(x1,y1)、右上の頂点座標を(x2,y2)、左下の頂点座標を(x3,y3)、右下の頂点座標を(x4,y4)とする。
(x1’,y1’,1)=(x1,y1,1)×A
(x2’,y2’,1)=(x2,y2,1)×A
(x3’,y3’,1)=(x3,y3,1)×A
(x4’,y4’,1)=(x4,y4,1)×A
次に、原稿傾き・サイズ・方向検知処理部35は、上記のように算出した4つの頂点のうち、x座標の値が最小である頂点を補正開始点(StartX,StartY)とする。
【0089】
そして、入力原稿画像の原稿右上座標(PointX,PointY)、すなわち入力画像データにおける入力原稿の右上座標を以下の条件に基づいて決定する。すなわち、
補正開始点が(x1’,y1’)の場合、原稿右上座標は(x2’,y2’)とし、
補正開始点が(x2’,y2’)の場合、原稿右上座標は(x4’,y4’)とし、
補正開始点が(x3’,y3’)の場合、原稿右上座標は(x1’,y1’)とし、
補正開始点が(x4’,y4’)の場合、原稿右上座標は(x3’,y3’)とする。
【0090】
また、上記のように決定した原稿右上座標に基づいて、原稿向き情報、すなわち画像データの基準方向(上から下に向かう方向)に対する原稿の反時計回りを正とした90°単位の向きを以下の条件に基づいて算出する。すなわち、
補正開始点が(x1’,y1’)の場合、原稿向き情報は0°とし、
補正開始点が(x2’,y2’)の場合、原稿向き情報は90°とし、
補正開始点が(x3’,y3’)の場合、原稿向き情報は270°とし、
補正開始点が(x4’,y4’)の場合、原稿向き情報は180°とする。
【0091】
次に、補正開始点および原稿右上座標より、以下の式に基づいてtanαを算出する。
tanα=(PointY−StartY)/(PointX−StartX)
そして、算出したtanαの値に基づいて原稿の傾き角度αを算出する。なお、tanαの値とαの値とを対応付けたテーブル(図21)を予め記憶しておき、tanαの算出結果に基づいてαの値を特定するようにしてもよい。
【0092】
ここで、上記のように算出される角度αは−90°〜0°をとるが、αの値が−90°以上−45°以下である場合、角度α、補正開始点、および原稿向き情報を以下ように変更する。すなわち、
角度αについては変更前の角度αに90°を加えた値とする。
補正開始点が(x1’,y1’)の場合、補正開始点を(x2’,y2’)に変更し、原稿向き情報を90°に変更する。
補正開始点が(x2’,y2’)の場合、補正開始点を(x4’,y4’)に変更し、原稿向き情報を180°に変更する。
補正開始点が(x3’,y3’)の場合、補正開始点を(x1’,y1’)に変更し、原稿向き情報を0°に変更する。
補正開始点が(x4’,y4’)の場合、補正開始点を(x3’,y3’)に変更し、原稿向き情報を270°に変更する。
【0093】
次に、原稿傾き・サイズ・方向検知処理部35は、補正後原稿サイズ[OutWIdth(補正後原稿幅),OutHeigt(補正後原稿高さ)]を以下の条件に基づいて決定する。すなわち、
補正開始点が(x1’,y1’)の場合には[x2−x1,y3−y1]とし、
補正開始点が(x2’,y2’)の場合には[y4−y2,x1−x2]とし、
補正開始点が(x3’,y3’)の場合には[y3−y1,x4−x3]とし、
補正開始点が(x4’,y4’)の場合には[x4−x3,y4−y2]とする。
【0094】
原稿傾き・サイズ補正処理部36は、原稿傾き・サイズ・方向検知処理部35によって算出された原稿の傾き角度、補正開始点、および補正後原稿サイズに基づいて、傾き補正処理およびサイズ補正処理を行う。傾き補正処理およびサイズ補正処理の方法は特に限定されるものではないが、例えば、回転行列を用いたアフィン変換処理を用いることができる。この場合、補正開始点および補正後原稿サイズによって特定される領域の各画素をアフィン変換処理によって時計回りに角度α回転させる。
【0095】
一般に、座標(x,y)をθ回転させた座標(x’,y’)は、下記の回転行列式で表すことができる。
【0096】
【数2】

【0097】
なお、画像の画素値として出力する場合には、整数値(x’,y’)に対応する小数値(xs,ys)を算出し、これをバイリニア等で補間演算すればよい。小数値(xs,ys)は、上記の回転行列式の逆変換式である下記の行列式によって算出される。
【0098】
【数3】

【0099】
回転補正前のx−y座標系において、(xs+StartX,ys+StartY)を取り囲む4点の画素を(x,yj)、(xi+1,yj)、(x,yj+1)、(xi+1,yj+1)とし(i,jは1以上の整数)、xi≦xs+StartX<xi+1、yi≦ys+StartY<yi+1とし、上記4つの画素の値をそれぞれ(x,yj)についてはZ、(xi+1,yj)についてはZ、(x,yj+1)についてはZ、(xi+1,yj+1)についてはZとし、xとxsとのx方向についての距離とxsとxi+1とのx方向についての距離との比をu:1−u、yjとysとのy方向についての距離とysとyj+1とのy方向についての距離との比をv:1−vとすると、バイリニアによる補間後の座標値Zは、Z(x’,y’)=Z(xs,ys)=(1−v){(1−u)Z1+uZ2}+v{(1−u)Z3+uZ4}により求められる。なお、ここで用いられる三角比の値についても、前述のtanαと同様、予め記憶させておいたテーブルを用いて算出するようにすれば演算を高速で行うことができる。
【0100】
これにより、傾き補正処理およびサイズ補正処理後の画像データが得られる。回転補正後の各画素(x’,y’)の取り得る範囲は、0≦x’<補正後原稿幅、0≦y’<補正後原稿高さとなる。
【0101】
回転処理部37は、傾き補正処理およびサイズ補正処理を施された入力画像データに対し、原稿傾き・サイズ・方向検知処理部35によって算出された原稿向き情報に基づいて、原稿の向きを画像データの基準方向と一致させるように90°単位での回転処理(方向補正処理)を行う。具滝的には、原稿向き情報が0°の場合には回転処理を行わず、原稿向き情報が90°の場合には時計回りに90°の回転処理を行い、原稿向き情報が180°の場合には時計回りに90°回転処理を行い、原稿向き情報が270°の場合には時計回りに90°回転処理を行う。
【0102】
(1−4. 文書照合処理部13における処理の流れ)
次に、文書照合処理部13における処理の流れについて、図17を参照しながら説明する。図17は、文書照合処理部13における処理の流れを示すフロー図である。
【0103】
まず、制御部7は、入力画像データを取得する(S1)。なお、入力画像データは、カラー画像入力装置2で原稿を読み取ることにより取得してもよく、デジタルカラー複写機1に脱着可能に装着される各種記録媒体から読み出すことにより取得してもよく、通信手段(図示せず)を備えておき、この通信手段を介して通信可能に接続される他の装置から受信することにより取得してもよい。
【0104】
次に、制御部7は、特徴点算出部31に特徴点算出処理を実行させ(S2)、特徴量算出部32に特徴量を算出させ(S3)、投票処理部33に投票処理を実行させ(S4)、類似度判定処理部34に類似判定処理を実行させる(S5)。そして、制御部7は、類似判定処理の結果に基づいて、類似する登録原稿画像が存在するか否かを判断する(S6)。
【0105】
類似する登録原稿画像が存在しないと判断した場合、制御部7は、入力原稿画像を登録原稿画像として新たに登録するか否かを判断する(S7)。この判断は、例えば操作パネル6に登録するか否かを問い合わせる画面を表示させ、それに対するユーザの指示に応じて判断すればよい。あるいは、類似する登録原稿画像が存在しない場合に登録処理を行うか否かを予め設定しておいてもよい。
【0106】
登録処理を行うと判断した場合、制御部7は、入力原稿画像の登録処理を行い(S8)、処理を終了する。また、登録処理を行わないと判断した場合にはそのまま処理を終了する。
【0107】
一方、S6において類似する登録原稿画像があると判断した場合、制御部7は、原稿傾き・サイズ・方向検知処理部35に、入力画像データにおける原稿の傾き、原稿のサイズ、および原稿の向きを検知させ(S9)、この検知結果に基づいて原稿傾き・サイズ補正処理部36に原稿の傾きおよび原稿サイズの補正処理を行わせ(S10)、原稿の向きの検知結果に基づいて回転処理部37に回転処理(方向補正処理)(S11)を行わせて処理を終了する。
【0108】
以上のように、本実施形態にかかるデジタルカラー複写機1では、原稿傾き・サイズ・方向検知処理部35が、入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて入力原稿画像のサイズを算出する。
【0109】
これにより、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、登録原稿画像の角部に対応する入力原稿画像の座標を入力原稿画像の角部の座標として算出し、それに基づいて入力原稿画像のサイズを適切に算出することができる。
【0110】
また、原稿傾き・サイズ・方向検知処理部35は、算出された入力原稿画像の角部の座標に基づいて、入力画像データの基準方向に対する入力原稿画像の傾き角度を算出する。
【0111】
これにより、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、入力原稿画像の傾き角度を適切に算出することができる。
【0112】
また、原稿傾き・サイズ・方向検知処理部35は、登録原稿画像の角部の座標と、算出された入力原稿画像の角部の座標とに基づいて、入力画像データの基準方向に対する入力原稿画像の向きを90度単位で算出する。
【0113】
これにより、入力原稿画像および登録原稿画像に対して回転、平行移動、拡大、縮小、平行移動等の幾何学的変形が施されている場合であっても、入力原稿画像の90度単位の向きを適切に算出することができる。
【0114】
また、本実施形態では、本発明をデジタルカラー複写機1に適用する場合について説明したが、本発明の適用対象はこれに限るものではない。例えば、モノクロの複写機に適用してもよい。また、複写機に限らず、例えば、単体のファクシミリ通信装置や画像読取装置に適用してもよく、コピア機能、プリンタ機能、ファクシミリ送信機能、scan to e-mail機能等を備える複合機に適用してもよい。
【0115】
図18は、本発明をデジタルカラー複合機に適用した場合の構成例を示すブロック図である。この図に示すデジタルカラー複合機1bは、上述したデジタルカラー複写機1に加えて、ネットワークカードやLANケーブル等を介してネットワークに接続されたコンピュータや他のデジタル複合機とのデータ通信を行う通信装置5を備えている。
【0116】
通信装置5としては、例えば、モデムやネットワークカードなどからなる通信装置を用いることができる。ファクシミリの送信を行うときは、モデムにて、相手先との送信手続きを行い送信可能な状態が確保されると、所定の形式で圧縮された画像データをメモリから読み出し、圧縮形式の変更など必要な処理を施して、相手先に通信回線を介して順次送信する。また、ファクシミリを受信する場合、主制御部は、通信手続きを行いながら相手先から送信されてくる画像データを受信してカラー画像処理装置3に入力し、カラー画像処理装置3では、受信した画像データに対して圧縮/伸張処理部(図示せず)にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理や解像度変換処理が行なわれ、出力階調補正や階調再現処理が施されてカラー画像出力装置4より出力される。
【0117】
図19は、本発明をフラットベッドスキャナに適用した場合の構成例を示すブロック図である。この図に示すフラットベッドスキャナ1cは、カラー画像入力装置2とカラー画像処理装置3cとを備えている。カラー画像処理装置3cは、A/D変換部11、シェーディング補正部12、および文書照合処理部13から構成されており、これに、カラー画像入力装置2が接続されている。なお、カラー画像入力装置2、A/D変換部11、シェーディング補正部12、および文書照合処理部13の機能は、上述したデジタルカラー複写機1と略同様であるのでここでは説明を省略する。
【0118】
図20は、デジタルカラー複写機1、デジタルカラー複合機1b、およびフラットベッドスキャナ1cに備えられるカラー画像入力装置2の構成例を示す断面図である。この図に示すカラー画像入力装置2は、上部筐体60と下部筐体61とを備えている。上部筐体(原稿カバー)60は、原稿押さえマット57、整合ローラ対55、原稿搬送路56、イメージセンサ部53、上側原稿搬送ガイド58等を備えており、下部筐体61は、第1コンタクトガラス(原稿台)51、第2コンタクトガラス52、読取部70、遮光部材59等を備えている。また、上部筐体60は下部筐体61に対して開閉可能に構成されている。
【0119】
なお、カラー画像入力装置2は、(1)第1コンタクトガラス51上に載置された原稿の下面側を読取部70によって読み取る静止読取モード、(2)第2コンタクトガラス52上を走行(移動)する原稿の下面側を読取部70によって読み取る走行読取モード、および(3)第2コンタクトガラス52上を走行(移動)する原稿の下面側を読取部70によって読み取るとともに、上面側をイメージセンサ部53で読み取る両面読取モードを備えている。
【0120】
整合ローラ対55は、走行読取モードおよび両面読取モードにおいて、搬送されてきた原稿の先端が搬送方向に垂直になるように原稿の角度を整合させるためのものである。搬送された原稿の先端が回転停止状態の整合ローラ対55のニップ部に付き当たることによってこの原稿に所定の撓みを形成され、その後、整合ローラ対55を回転させることによって上記原稿の向きが整合されて整合ローラ対55の下流側に搬送される。
【0121】
イメージセンサ部53は、両面モードが選択されたときに、第2コンタクトガラス52上を搬送される原稿の上面側の画像を読み取るためのものである。
【0122】
原稿押さえマット57は、静止読取モードが選択されたときに、第1コンタクトガラス51上に載置された原稿を第1コンタクトガラス51側に押さえつけて原稿の位置を安定させるためのものである。
【0123】
読取部70は、第1走査ユニット63、第2走査ユニット64、結像レンズ65、およびCCD(Charge Coupled Device)66を備えている。
【0124】
第1走査ユニット63は、原稿の読み取り面を露光する光源(露光ランプ)62と、原稿からの反射光を第2走査ユニット64に向けて反射する第1反射ミラー67とを備えている。
【0125】
なお、第1走査ユニット63は、静止読取モード時には、第1コンタクトガラス51に対して平行に図のPの位置から右に向かって原稿サイズに応じた距離だけ一定速度Vで移動しながら、第1コンタクトガラス51上に載置された原稿を光源62から出射した光で露光し、原稿からの反射光を第1反射ミラー67で反射させて第2走査ユニット64に導く。上記の原稿サイズは、図示しない原稿サイズ検出手段(例えば、フォトトランジスタなどの光電変換素子からなる原稿サイズ検出手段)によって第1コンタクトガラス51上に載置された原稿サイズを検知した結果であってもよく、ユーザが操作パネルを介して入力したものであってもよい。なお、本実施形態では、第1コンタクトガラス51は、A3サイズまでの原稿を読み取り可能な大きさに形成されている。
【0126】
また、第1走査ユニット63は、走行読取モード時および両面読取モード時には、第2コンタクトガラス52に対向する所定の位置において、第2コンタクトガラス52上を搬送される原稿を光源62から出射した光で露光し、原稿からの反射光を第1反射ミラー67で反射させて第2走査ユニット64に導く。
【0127】
第2走査ユニット64は、第2反射ミラー68と第3反射ミラー69とを備えており、これら両ミラーによって第1反射ミラー67から入射した光を結像レンズ65およびCCD66に導くように構成されている。なお、第2走査ユニット64は、静止読取モードでは第1走査ユニット63に追随してV/2の速度で移動するようになっている。
【0128】
遮光部材59は、読取部54の光源62の光が、イメージセンサ部53に入射することによってイメージセンサ部53が画像を適切な濃度で読み取れなくなることを防止するためのものである。
【0129】
結像レンズ65は、第3反射ミラー69から入射した原稿からの反射光を、CCD66上に結像させるためのものである。
【0130】
CCD66は、結像レンズ65を介して入射した光をアナログの電気信号に変換するためのものである。なお、この電気信号は、後述するカラー画像処理装置3によってデジタルの画像データに変換される。なお、両面読取モードの場合、読取部70によって読み取られた原稿の下面側の画像データがカラー画像処理装置3に入力されて処理され、その後、イメージセンサ部53によって読み取られた原稿の上面側の画像データがカラー画像処理装置3に入力されて処理される。カラー画像処理装置3において原稿の下面側の画像データが処理されている間、イメージセンサ部53によって読み取られた原稿の上面側の画像データは図示しないメモリに一旦格納されており、原稿の上面側の画像データに対する処理が終了した時にこのメモリから読み出されてカラー画像処理装置3に送られ、処理が施される。
【0131】
また、上記実施形態において、デジタルカラー複写機1に備えられる文書照合処理部13を構成する各部(各ブロック)は、CPU等のプロセッサを用いてソフトウェアによって実現される。すなわち、デジタルカラー複写機1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデジタルカラー複写機1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、デジタルカラー複写機1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
【0132】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0133】
また、デジタルカラー複写機1を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0134】
また、デジタルカラー複写機1の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよく、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
【0135】
本発明のコンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより上述した画像処理方法など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置、およびコンピュータの処理結果を紙などに出力するプリンタ等の画像形成装置により構成されてもよい。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられていてもよい。
【0136】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【産業上の利用可能性】
【0137】
本発明は、入力画像データに含まれる入力原稿画像のサイズを算出する画像処理装置および画像処理方法に適用できる。
【図面の簡単な説明】
【0138】
【図1】本発明の一実施形態にかかる画像処理装置の構成を示すブロック図である。
【図2】図1の画像処理装置を備えた画像データ出力処理装置であるデジタルカラー複写機の構成を示すブロック図である。
【図3】図1に示した画像処理装置における特徴点算出部の構成を示すブロック図である。
【図4】図3に示した特徴点算出部におけるMTF処理部が備える混合フィルタのフィルタ係数を示す説明図である。
【図5】図3に示した特徴点算出部の処理により、2値化された画像データから抽出された連結領域およびこの連結領域の重心の一例を示す説明図である。
【図6】図3に示した特徴点算出部の処理により、2値化された画像データに含まれる文字列から抽出された複数の連結領域の各重心(特徴点)の一例を示す説明図である。
【図7】図1に示した画像処理装置における特徴量算出部の構成を示すブロック図である。
【図8】図7に示した特徴量算出部における特徴点抽出部での注目特徴点に対する周辺特徴点の抽出動作の説明図である。
【図9】図9(a)は、図8に示した特徴点抽出部にて抽出された周辺特徴点4点の中から選択し得る3点の組み合わせの一例を示すものであって、注目特徴点aに対する周辺特徴点b,c,dの組み合わせの例を示す説明図、図9(b)は、同注目特徴点aに対する周辺特徴点b,c,eの組み合わせの例を示す説明図、図9(c)は、同注目特徴点aに対する周辺特徴点b,d,eの組み合わせの例を示す説明図、図9(d)は、同注目特徴点aに対する周辺特徴点c,d,eの組み合わせの例を示す説明図である。
【図10】図10(a)は、図8に示した特徴点抽出部にて抽出された周辺特徴点4点のうちの一つに注目特徴点を移した場合に選択し得る3点の周辺特徴点の組み合わせの一例を示すものであって、注目特徴点bに対する周辺特徴点a,e,fの組み合わせの例を示す説明図、図10(b)は、同注目特徴点bに対する周辺特徴点a,e,cの組み合わせの例を示す説明図、図10(c)は、同注目特徴点bに対する周辺特徴点a,f,cの組み合わせの例を示す説明図、図10(d)は、同注目特徴点bに対する周辺特徴点e,f,cの組み合わせの例を示す説明図である。
【図11】図11(a)および図11(b)は、図1に示した画像処理装置におけるメモリに格納されている各特徴点についてのハッシュ値および登録原稿画像のインデックスの一例を示す説明図である。
【図12】図1に示した画像処理装置におけるメモリに格納されている登録原稿画像のインデックスおよび各登録原稿画像の頂点座標の一例を示す説明図である。
【図13】図1に示した画像処理装置におけるメモリに格納されている、登録原稿画像毎の、登録原稿画像の特徴点のインデックスと座標値との対応関係を示すテーブルの説明図である。
【図14】図1に示した画像処理装置における投票処理部による投票結果の一例を示すグラフである。
【図15】図1に示した画像処理装置におけるメモリに格納される、入力原稿画像の特徴点と、投票先の登録原稿画像の特徴点との対応を記憶したテーブルの説明図である。
【図16】入力原稿画像の特徴点と、図1に示した画像処理装置における投票処理部によって上記入力原稿画像に類似していると判定された登録原稿画像の特徴点との対応関係を示す説明図である。
【図17】図1に示した画像処理装置における処理の流れを示すフロー図である。
【図18】図1の画像処理装置を備えた画像データ出力処理装置であるデジタルカラー複合機の構成を示すブロック図である。
【図19】図1の画像処理装置を備えた画像データ出力処理装置であるカラー画像読取装置の構成を示すブロック図である。
【図20】図2に示したデジタルカラー複写機、図18に示したデジタルカラー複合機、および図19に示したカラー画像読取装置に備えられるカラー画像入力装置の構成例を示す断面図である。
【図21】図1に示した画像処理装置において用いられる、tanαの値とαの値とを対応付けたテーブルを示す説明図である。
【符号の説明】
【0139】
1 デジタルカラー複写機
1b デジタルカラー複合機
1c フラットベッドスキャナ
2 カラー画像入力装置
3,3c カラー画像処理装置
4 カラー画像出力装置(画像データ出力処理装置)
5 通信装置(画像データ出力処理装置)
6 操作パネル
7 制御部
8 メモリ(記憶手段)
13 文書照合処理部(画像処理装置)
31 特徴点算出部
32 特徴量算出部
32a 特徴点抽出部
32b 不変量算出部
32c ハッシュ値算出部
33 投票処理部
34 類似度判定処理部(類似性判定部)
35 原稿傾き・サイズ・方向検知処理部(原稿サイズ算出部、原稿傾き算出部、原稿方向算出部)
36 原稿傾き・サイズ補正処理部(原稿サイズ補正処理部、傾き補正処理部)
37 回転処理部(原稿方向補正処理部)
38 登録処理部
41 無彩化処理部
42 解像度変換部
43 MTF処理部
44 2値化処理部
45 重心算出部

【特許請求の範囲】
【請求項1】
入力画像データに含まれる入力原稿画像の特徴点を算出する特徴点算出部と、上記特徴点算出部の算出した特徴点同士の相対位置に基づいて上記入力原稿画像の特徴量を算出する特徴量算出部と、上記特徴量算出部の算出した上記入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して上記入力原稿画像が登録原稿画像に類似しているか否かの判定を行う類似性判定部とを備えた画像処理装置であって、
上記登録原稿画像の各特徴点および上記登録原稿画像の各角部の座標を記憶した記憶手段と、
上記入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を上記入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで上記入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて上記入力原稿画像のサイズを算出する原稿サイズ算出部を備えていることを特徴とする画像処理装置。
【請求項2】
上記原稿サイズ算出部による上記入力原稿画像の角部の座標および上記入力原稿画像のサイズの算出結果に基づいて上記入力画像データから上記入力原稿画像を切り出す原稿サイズ補正処理部を備えていることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
算出された上記入力原稿画像の角部の座標に基づいて、上記入力画像データの基準方向に対する上記入力原稿画像の傾き角度を算出する原稿傾き算出部を備えていることを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
上記原稿傾き算出部の算出した傾き角度に基づいて上記入力原稿画像の傾きを補正する傾き補正処理部を備えていることを特徴とする請求項3に記載の画像処理装置。
【請求項5】
上記登録原稿画像の角部の座標と、算出された上記入力原稿画像の角部の座標とに基づいて、上記入力画像データの基準方向に対する上記入力原稿画像の向きを90度単位で算出する原稿方向算出部を備えていることを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。
【請求項6】
上記原稿方向算出部の算出した上記入力原稿画像の向きに基づいて上記入力原稿画像の向きを上記基準方向に一致させるように上記入力画像データに回転処理を施す原稿方向補正処理部を備えていることを特徴とする請求項5に記載の画像処理装置。
【請求項7】
画像データの出力処理を行う画像データ出力処理装置であって、
請求項2,4,6のいずれか1項に記載の画像処理装置を備え、上記画像処理装置から出力される画像データの出力処理を行うことを特徴とする画像データ出力処理装置。
【請求項8】
入力画像データに含まれる入力原稿画像の特徴点を算出する特徴点算出工程と、上記特徴点算出工程で算出した特徴点同士の相対位置に基づいて上記入力原稿画像の特徴量を算出する特徴量算出工程と、上記特徴量算出工程で算出した上記入力原稿画像の特徴量と登録原稿画像の特徴量とを比較して上記入力原稿画像が登録原稿画像に類似しているか否かの判定を行う類似性判定工程とを含む画像処理方法であって、
上記登録原稿画像の各特徴点および上記登録原稿画像の各角部の座標を予め記憶する記憶工程と、
上記入力原稿画像に類似していると判定された登録原稿画像の各特徴点の座標からなる行列を上記入力原稿画像の各特徴点の座標からなる行列に略一致させるための変換係数を算出し、上記登録原稿画像の各角部の座標を上記変換係数に基づいて変換することで上記入力原稿画像の各角部の座標を算出し、算出した各角部の座標に基づいて上記入力原稿画像のサイズを算出する原稿サイズ算出工程とを含むことを特徴とする画像処理方法。
【請求項9】
請求項1から6のいずれか1項に記載の画像処理装置を動作させるプログラムであって、コンピュータを上記各部として機能させるためのプログラム。
【請求項10】
請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2010−157878(P2010−157878A)
【公開日】平成22年7月15日(2010.7.15)
【国際特許分類】
【出願番号】特願2008−334744(P2008−334744)
【出願日】平成20年12月26日(2008.12.26)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】