画像処理方法、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム及び記録媒体
【課題】入力された画像と予め登録された画像との類似を精度よく判定することができる画像処理方法、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム及び記録媒体を提供する。
【解決手段】登録処理部226は、登録画像毎に特徴量算出部222が算出したハッシュ値に対応して登録画像の原稿ページインデックスを登録させるに際し、各ハッシュ値に対応して既に登録してある原稿ページインデックスの数が、予め設定された登録上限数以上であるか否かを判断する。登録処理部226は、既に登録してある原稿ページインデックスの数が登録上限数未満である場合、特徴量算出部222が算出したハッシュ値に対応して登録画像の原稿ページインデックスをハッシュテーブルに登録し、既に登録してある原稿ページインデックスの数が登録上限数以上である場合、このハッシュ値を無効にする。
【解決手段】登録処理部226は、登録画像毎に特徴量算出部222が算出したハッシュ値に対応して登録画像の原稿ページインデックスを登録させるに際し、各ハッシュ値に対応して既に登録してある原稿ページインデックスの数が、予め設定された登録上限数以上であるか否かを判断する。登録処理部226は、既に登録してある原稿ページインデックスの数が登録上限数未満である場合、特徴量算出部222が算出したハッシュ値に対応して登録画像の原稿ページインデックスをハッシュテーブルに登録し、既に登録してある原稿ページインデックスの数が登録上限数以上である場合、このハッシュ値を無効にする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力された画像から得られる特徴量に基づいて、予め登録された画像と類似するか否かを判定する画像処理方法、画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置、並びに前記画像処理装置を実現するためのコンピュータプログラム及び該コンピュータプログラムを記録した記録媒体に関する。
【背景技術】
【0002】
スキャナで原稿を読み取り、原稿を読み取って得られた画像データを予め登録されている画像データと照合して、画像の類似度を判定する画像処理としては、例えば、OCR(Optical Character Reader)で画像からキーワードを抽出し、抽出したキーワードにより画像の類似度を判定する方法、類似度の判定を行う画像を罫線のある帳票画像に限定して、罫線の特徴を抽出して画像の類似度を判定する方法などが提案されている。
【0003】
また、入力文書の特徴を抽出してデスクリプタを生成し、生成したデスクリプタと予めデスクリプタデータベースに登録されているデスクリプタとを照合することにより、入力文書とデスクリプタデータベース中のデスクリプタとのマッチングを行う装置が提案されている(特許文献1参照)。
【0004】
特許文献1で開示された装置では、デスクリプタデータベースに、デスクリプタと、それぞれのデスクリプタが抽出される特徴を含む文書のリストとが登録される。デスクリプタは、文書のデジタル化により生じる歪み、入力文書と文書データベース中の整合する文書との間の差異等に対して不変となるように生成される。特許文献1で開示された装置は、デスクリプタデータベースがスキャンされるときに、文書データベース中の各文書に対する投票を累積し、最高得票数の1文書又は得票数がある閾値を越えた文書を整合文書とする。
【0005】
また、デジタルカメラで撮像された画像、スキャナで読み取られた画像等に対して、画像の連結部分を単語領域と見なしてその重心を特徴点として求め、この特徴点を用いて幾何学的不変量を算出し、さらに幾何学的不変量より特徴量を求め、特徴量、特徴点を表すインデックス及び画像を表すインデックスをハッシュテーブルに登録しておき、画像の検索を行う際に、入力画像(検索質問)から、同様の処理で特徴点、特徴量、特徴点を表すインデックスを求め、ハッシュテーブルに予め登録されている画像に対して投票を行って検索を行う装置が提案されている(特許文献2参照)。
【0006】
特許文献2には、特徴量の精度を上げることに関して、1つの特徴量を計算する際に用いる特徴点として広い範囲から特徴点を抽出すること、特徴点の数を増やすこと等が記載されている。また、特許文献2では、予め登録されている画像に対して投票を行う際に、入力画像の特徴点と登録文書の点との間の対応を記録しておき、既に対応付けられている点については投票を行わないことにより、誤った投票を防止して画像検索の判定精度の低下を抑制できる。更に、特許文献2には、ハッシュテーブルに登録されている画像の登録ページ数が増えると画像検索の判定精度が低下し、また、この原因が、同じ特徴量をもつ異なる文書が登録される可能性が高くなることであると推定されることが記載されている。
【特許文献1】特開平7−282088号公報
【特許文献2】国際公開第2006/92957号パンフレット
【発明の開示】
【発明が解決しようとする課題】
【0007】
特許文献1では、デスクリプタデータベースを、無限に要素が登録できるリスト構造ではなく、1つのデスクリプタに対して有限個のデータが登録されるテーブル形式で構成している。このように、固定サイズのテーブル形式でデスクリプタデータベースを実装した場合、1枚の原稿から抽出されるデスクリプタの数を、デスクリプタデータベースに登録する全ての原稿について足し合わせた数が、1つのデスクリプタに対して登録されるデータの数となる。この場合、1枚の原稿からあまりに多くのデスクリプタを抽出すると、デスクリプタデータベースのサイズが膨大になってしまうため、抽出するデスクリプタの数を削減することが好ましい。なお、削減されるデスクリプタが、画像を検索する際の検出不可能エラー又は確定的間違いをもたらすものであれば、画像を検索する際の性能は向上する。
【0008】
また、特許文献1では、デスクリプタは冗長性を有しており、デスクリプタデータベースに登録してある全てのデスクリプタを使用して画像を検索する必要はなく、例えば、品質の高い、即ち、精度のよいデスクリプタのみを使用して画像を検索してもよいことが記載されている。従って、ノイズによって1枚の原稿中の文字が壊されていた場合であっても、登録された複数のデスクリプタに基づいて照合するので、原稿中のノイズの影響を受けていないデスクリプタが残っていれば、このデスクリプタに基づいて照合が可能である。
【0009】
しかし、特許文献1には、複数の異なる原稿から同じデスクリプタが抽出される場合の問題については記載されていない。複数の異なる原稿から同じデスクリプタが抽出された場合、このデスクリプタは、このデスクリプタが抽出された全ての原稿に当てはまるため、原稿を特定する際には有意ではなく、むしろ誤って類似画像を判定する原因となる。
【0010】
また、特許文献2では、ハッシュテーブルに予め登録されている登録画像の枚数の多少により無効な特徴量による判定精度に及ぼす影響が異なることに関する記載はなく、登録原稿が少ない場合に判定精度が低下するという問題を有している。
【0011】
本発明は、斯かる事情に鑑みてなされたものであり、画像の類似度を精度よく判定することができる画像処理方法、画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置、前記画像処理装置を実現するためのコンピュータプログラム及び記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0012】
本発明に係る画像処理方法では、画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段を備え、入力された原稿画像から特徴量を抽出し、抽出した特徴量及び記憶手段に記憶してある登録画像の特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定する。また、画像処理装置は、記憶手段に登録画像を登録するに際し、入力された画像から特徴量を抽出し、抽出した特徴量に対応して記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断し、登録画像の数が所定数以上でない場合、入力された画像を登録画像とし、抽出した特徴量に対応付けて記憶手段に登録し、登録画像の数が所定数以上である場合、前記特徴量を無効にする。従って、画像処理装置は、記憶手段に記憶してある登録画像の特徴量のうちで無効にされていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定する。
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより、上記画像処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
【発明の効果】
【0013】
本発明にあっては、1つの特徴量に対して所定数以上の登録画像が登録された場合、この特徴量を無効にし、入力された原稿画像が予め登録されている登録画像のいずれかに類似するか否かの判定処理には有効ではない特徴量として以降の判定処理には用いないので、精度よく画像の類似度を判定することができる。一方、登録画像の数が多い場合には、無効にすべき特徴量は無効にされるが、例えば、登録画像の数が少ない場合には、本来無効にすべき特徴量が無効にされない場合が生じ、登録画像の数に応じて、類似する登録画像の判定精度が変更する可能性がある。従って、所定の画像から抽出した特徴量を予め無効にしておくことにより、登録画像の数が少ない場合であっても、画像の類似度を判定する際の照合精度を安定して維持することができる。
【発明を実施するための最良の形態】
【0014】
以下、本発明を実施の形態を示す図面に基づいて説明する。図1は本発明に係る画像処理装置を備える画像形成装置100の構成を示すブロック図である。画像形成装置100(例えば、デジタルカラー複写機や複合機能、プリンタ機能、ファックスや電子メール配信機能を備えた複合機)は、カラー画像入力装置1、カラー画像処理装置2(画像処理装置)、画像形成手段としてのカラー画像出力装置3、各種操作を行うための操作パネル4などを備える。カラー画像入力装置1で原稿を読み込むことにより得られたRGB(R:赤、G:緑、B:青)のアナログ信号の画像データは、カラー画像処理装置2へ出力され、カラー画像処理装置2で所定の処理が行われ、CMYK(C:シアン、M:マゼンダ、Y:イエロー、K:黒)のデジタルカラー信号としてカラー画像出力装置3へ出力される。
【0015】
カラー画像入力装置1は、例えば、CCD(Charged Coupled Device)を備えたスキャナであり、原稿画像からの反射光像をRGBのアナログ信号として読み取り、読み取ったRGB信号をカラー画像処理装置2へ出力する。また、カラー画像出力装置3は、原稿画像の画像データを記録紙上に出力する電子写真方式又はインクジェット方式などのプリンタである。また、カラー画像出力装置3は、ディスプレイ等の表示装置であってもよい。
【0016】
カラー画像処理装置2は、A/D変換部20、シェーディング補正部21、文書照合処理部22、入力階調補正部23、領域分離処理部24、色補正部25、黒生成下色除去部26、空間フィルタ処理部27、出力階調補正部28、階調再現処理部29、これらのハードウエア各部の動作を制御するCPU(Central Processing Unit )等を備え、ASIC(Application Specific Integrated Circuit)などにより構成される。
【0017】
A/D変換部20は、カラー画像入力装置1から入力されたRGB信号を、例えば、10ビットのデジタル信号に変換し、変換後のRGB信号をシェーディング補正部21へ出力する。
【0018】
シェーディング補正部21は、入力されたRGB信号に対して、カラー画像入力装置1の照明系、結像系、撮像系などで生じた各種の歪みを取り除く補正処理を行い、補正後のRGB信号を文書照合処理部22へ出力する。また、シェーディング補正部21は、カラーバランスを整える処理を行うとともに、濃度信号などカラー画像処理装置2で採用されている画像処理システムが扱い易い信号に変換する処理を行う。
【0019】
文書照合処理部22は、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点を算出し、その結果を用いて入力された画像と予め登録されている画像(文書画像を含む)との類似度を判定する。文書照合処理部22は、画像が類似していると判定した場合、類似原稿に対して処理の実行が許可されているか否かを示す判定信号を出力する。例えば、類似原稿であると判定された原稿の出力、複写、所定のフォルダにファイルすること等が禁止されている場合、文書照合処理部22は、判定信号「0」を出力し、禁止されていない場合、判定信号「1」を出力する。なお、各類似原稿が、処理の実行が許可されている原稿であるか否かは予め登録されている。
【0020】
これにより、画像形成装置100は、入力された画像が登録画像に類似するか否かに応じて、この画像に対して実行が指示された各種の処理をキャンセル又は実行することができ、画像(文書画像を含む)の照合とともに、照合結果に応じた処理を行うことができる。また、文書照合処理部22は、入力されたRGB信号をそのまま後段の入力階調補正部23へ出力する。
【0021】
入力階調補正部23は、シェーディング補正部21にて各種の歪みが取り除かれたRGB信号(RGBの反射率信号)に対して、下地濃度の除去又はコントラストなど画質調整処理を施し、処理後のRGB信号を領域分離処理部24へ出力する。
【0022】
領域分離処理部24は、入力されたRGB信号に基づき、入力された画像中の各画素が、文字領域、網点領域、写真領域の何れであるかを分離する。領域分離処理部24は、分離結果に基づいて、各画素がどの領域に属しているかを示す領域識別信号を黒生成下色除去部26、空間フィルタ処理部27、階調再現処理部29へ出力する。また、領域分離処理部24は、入力されたRGB信号をそのまま後段の色補正部25へ出力する。
【0023】
色補正部25は、入力されたRGB信号をCMYの色空間に変換し、カラー画像出力装置3の特性に合わせて色補正を行い、補正後のCMY信号を黒生成下色除去部26へ出力する。具体的には、色補正部25は、色再現の忠実化のため、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りを取り除く処理を行う。
【0024】
黒生成下色除去部26は、色補正部25から入力されたCMY信号に基づいて、K(黒)信号を生成するとともに、入力されたCMY信号からK信号を差し引いて新たなCMY信号を生成し、生成したCMYK信号を空間フィルタ処理部27へ出力する。
【0025】
黒生成下色除去部26における処理の一例を示す。例えば、スケルトンブラックによる黒生成を行う処理の場合、スケルトンカーブの入出力特性をy=f(x)とし、入力されるデータをC、M、Yとし、出力されるデータをC´、M´、Y´、K´とし、UCR(Under Color Removal)率をα(0<α<1)とすると、黒生成下色除去処理により出力されるデータ夫々は、K´=f{min(C、M、Y)}、C´=C−αK´、M´=M−αK´、Y´=Y−αK´で表される。
【0026】
空間フィルタ処理部27は、黒生成下色除去部26から入力されたCMYK信号に対して、領域識別信号に基づいたデジタルフィルタによる空間フィルタ処理を行う。これにより、画像データの空間周波数特性が補正され、カラー画像出力装置3における出力画像のぼやけ、又は粒状性劣化を防止する。例えば、空間フィルタ処理部27は、領域分離処理部23において文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、鮮鋭強調処理を施し高周波成分を強調する。また、空間フィルタ処理部27は、領域分離処理部23において網点領域に分離された領域を、入力網点成分を除去するためのローパス・フィルタ処理を施す。空間フィルタ処理部27は、処理後のCMYK信号を出力階調補正部28へ出力する。
【0027】
出力階調補正部28は、空間フィルタ処理部27から入力されたCMYK信号に対して、カラー画像出力装置3の特性値である網点面積率に変換する出力階調補正処理を行い、出力階調補正処理後のCMYK信号を階調再現処理部29へ出力する。
【0028】
階調再現処理部29は、領域分離処理部23から入力された領域識別信号に基づいて、出力階調補正部28から入力されたCMYK信号に対して所定の処理を行う。例えば、階調再現処理部29は、文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、カラー画像出力装置3における高周波成分の再現に適するように二値化処理又は多値化処理を行う。
【0029】
また、階調再現処理部29は、領域分離処理部23において網点領域に分離された領域を、最終的に画像を画素に分離して、それぞれの階調を再現できるように階調再現処理(中間調生成)を行う。さらに、階調再現処理部29は、領域分離処理部23において写真領域に分離された領域を、カラー画像出力装置3における階調再現性に適するように二値化処理又は多値化処理を行う。
【0030】
カラー画像処理装置2は、階調再現処理部29で処理された画像データ(CMYK信号)を記憶部(不図示)に一旦記憶し、画像形成をする所定のタイミングで記憶部に記憶した画像データを読み出し、読み出した画像データをカラー画像出力装置3へ出力する。これらの制御は、例えば、CPU(不図示)により行われる。
【0031】
操作パネル4は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され、操作パネル4より入力された情報(例えば、原稿を登録するための原稿登録モードの指定、原稿画像に対するファイリング、複写、電子配信などの出力処理の指定など)に基づいてカラー画像入力装置1、カラー画像処理装置2、カラー画像出力装置3の動作が制御される。
【0032】
図2は文書照合処理部22の構成を示すブロック図である。文書照合処理部22は、特徴点算出部221、特徴量算出部222、無効特徴量判定部223、投票処理部224、類似度判定処理部225、登録処理部226、メモリ227、前記各部を制御する制御部228などを備えている。
【0033】
特徴点算出部221は、入力された画像に対して後述する所定の処理を行うとともに、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点(例えば、連結領域を構成する各画素の二値画像における座標値を累積加算し、累積加算した座標値を連結領域に含まれる画素数で除算した値)を抽出(算出)し、抽出した特徴点をメモリ227に記憶させると共に特徴量算出部222へ出力する。
【0034】
図3は特徴点算出部221の構成を示すブロック図である。特徴点算出部221は、無彩化処理部2210、解像度変換部2211、フィルタ処理部2212、二値化処理部2213、重心算出部2214などを備えている。
【0035】
無彩化処理部2210は、入力された画像がカラー画像である場合、カラー画像を無彩化して、輝度信号又は明度信号に変換し、変換後の画像を解像度変換部2211へ出力する。例えば、輝度信号Yは、各画素RGBの色成分を夫々Rj、Gj、Bjとし、各画素の輝度信号をYjとして、Yj=0.30×Rj+0.59×Gj+0.11×Bjで表すことができる。なお、上式に限らず、RGB信号をCIE1976L* a* b* 信号に変換することもできる。
【0036】
解像度変換部2211は、入力された画像がカラー画像入力装置1で光学的に変倍された場合であっても、所定の解像度になるように入力された画像を再度変倍し、変倍された画像をフィルタ処理部2212へ出力する。これにより、カラー画像入力装置1で変倍処理が行われ解像度が変化した場合であっても、その影響を受けることなく特徴点の抽出を行うことができ、精度良く画像の類似度を判定することができる。特に、縮小された文字などの場合、二値化処理を行って連結領域を特定するとき、文字が潰れているために本来離れている領域が繋がった状態で特定され、算出される重心がずれる虞を防止できる。また、解像度変換部2211は、カラー画像入力装置1で等倍時に読み込まれる解像度よりも小さい解像度に変換する。例えば、カラー画像入力装置1において600dpi(dot per inch)で読み込まれた画像を300dpiに変換する。これにより、後段における処理量を低減することができる。
【0037】
フィルタ処理部2212は、入力された画像が有する空間周波数特性を補正し(例えば、画像の強調化処理及び平滑化処理など)、補正後の画像を二値化処理部2213へ出力する。フィルタ処理部2212は、カラー画像入力装置1の空間周波数特性が機種ごとに異なるため、異なる空間周波数特性を所要の特性に補正する。カラー画像入力装置1が出力する画像(例えば、画像信号)には、レンズ又はミラーなどの光学系部品、CCDの受光面のアパーチャ開口度、転送効率、残像、物理的な走査による積分効果及び走査むら等に起因して画像のぼけなどの劣化が生ずる。フィルタ処理部2212は、境界又はエッジなどの強調処理を行うことにより、画像に生じたぼけなどの劣化を修復する。また、フィルタ処理部2212は、後段で処理される特徴点の抽出処理に不要な高周波成分を抑制するための平滑化処理を行う。これにより、特徴点を精度良く抽出することができ、結果として画像の類似度の判定を精度良く行うことが可能となる。なお、フィルタ処理部2212で使用するフィルタ係数は、使用されるカラー画像入力装置1の機種又は特性などに応じて適宜設定することができる。
【0038】
図4はフィルタ処理部2212のフィルタ係数の例を示す説明図である。図に示すように、空間フィルタは、例えば、7×7(7行、7列)の大きさを有し、強調処理及び平滑化処理を行う混合フィルタである。入力された画像の画素を走査し、空間フィルタによる演算処理を全ての画素に対して行う。なお、空間フィルタの大きさは、7×7の大きさに限定されるものではなく、3×3、5×5などの大きさであってもよい。また、フィルタ係数の数値は一例であって、これに限定されるものではなく、使用されるカラー画像入力装置1の機種又は特性などに応じて適宜設定することができる。
【0039】
二値化処理部2213は、入力された画像の輝度値(輝度信号)又は明度値(明度信号)を閾値と比較することにより画像を二値化し、二値化した二値画像を重心算出部2214へ出力する。
【0040】
重心算出部2214は、二値化処理部2213から入力された二値画像の各画素の二値化情報(例えば、「1」、「0」で表される)に基づいて、各画素に対してラベリング(ラベル付け処理)を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点をメモリ227に記憶させると共に特徴量算出部222へ出力する。なお、特徴点は、二値画像における座標値(x座標、y座標)で表すことができる。
【0041】
図5は連結領域の特徴点の例を示す説明図である。図において、特定された連結領域は、文字「A」であり、同一ラベルが付された画素の集合として特定される。この文字「A」の特徴点(重心)は、図中黒丸で示される位置(x座標、y座標)となる。
【0042】
図6は文字列に対する特徴点の抽出結果の例を示す説明図である。複数の文字から構成される文字列の場合、文字の種類により夫々異なる座標を有する特徴点が複数抽出される。
【0043】
特徴量算出部222は、特徴点算出部221から入力された特徴点(すなわち、連結領域の重心の座標値)夫々を注目特徴点とし、例えば、注目特徴点からの距離が小さい周辺の他の特徴点を4つ抽出する。
【0044】
図7は注目特徴点と周辺の特徴点を示す説明図である。図に示すように、注目特徴点P1に対して、例えば、注目特徴点P1からの距離が近い順に、閉曲線S1で囲まれる4つの特徴点を抽出する(注目特徴点P1に対しては、注目特徴点P2も1つの特徴点として抽出されている)。また、注目特徴点P2に対して、例えば、上記と同様に注目特徴点P2からの距離が近い順に、閉曲線S2で囲まれる4つの特徴点を抽出する(注目特徴点P2に対しては、注目特徴点P1も1つの特徴点として抽出されている)。
【0045】
特徴量算出部222は、抽出した4つの特徴点の中から3つの特徴点を選択して、不変量を算出する。なお、選択する特徴点は3つに限られるものではなく、4つ、5つなどの特徴点を選択することもできる。求めたい不変量の種類によって選択すべき特徴点の数が異なる。例えば、3点から求められる不変量は相似不変量(原稿画像の回転、平行移動、拡大縮小を含む幾何学的変化に対して不変なパラメータ)となる。
【0046】
図8は注目特徴点P1に関する不変量の算出例を示す説明図であり、図9は注目特徴点P2に関する不変量の算出例を示す説明図である。図8に示すように、注目特徴点P1の周辺の4つの特徴点から3つの特徴点を選択し、4通りの不変量夫々をH1j(j=1、2、3、4)とする。4つの特徴点から3つの特徴点を選択する組み合わせと順番は、注目特徴点P1からの距離に応じて一意に定めておく。不変量H1jは、H1j=A1j/B1jで表される式で算出する。ここで、A1j、B1j夫々は特徴点間の距離を示す。これにより、例えば、原稿が回転、移動、傾いた場合であっても、不変量H1jは変化せず、画像の類似度の判定を精度良く行うことができる。
【0047】
同様に、図9に示すように、注目特徴点P2の周辺の4つの特徴点から3つの特徴点を選択し、4通りの不変量夫々をH2j(j=1、2、3、4)とする。4つの特徴点から3つの特徴点を選択する組み合わせと順番は、注目特徴点P1からの距離に応じて一意に定めておく。不変量H2jは、H2j=A2j/B2jで表される式で算出する。ここで、A2j、B2j夫々は特徴点間の距離を示す。以下同様に、他の注目特徴点に対して不変量を算出することができる。
【0048】
特徴量算出部222は、夫々の注目特徴点により算出された不変量に基づいて、ハッシュ値(特徴量)Hiを算出する。注目特徴点Piのハッシュ値Hiは、Hi=(Hi1×103 +Hi2×102 +Hi3×101 +Hi4×100 )/Dで表される。ここで、Dは余りをどの程度設定するかにより決定される定数であり、例えば、「10」とした場合には、余りは「0」〜「9」となり、これが算出するハッシュ値の取り得る範囲となる。また、iは自然数である。なお、特徴量としての上記ハッシュ値は一例であって、これに限定されるものではなく、他のハッシュ関数を用いることができる。上記では、周辺の他の特徴点として4点を抽出する例を示しているが、4点に限定されるものではない。例えば、6点抽出するようにしても良い。この場合、6点の特徴点から5点を抽出し、5点を抽出する6通りそれぞれの方法について、5点から3点を抽出して不変量を求め、ハッシュ値を算出するようにしても良い。
【0049】
無効特徴量判定部223は、後述するハッシュテーブルの登録内容に基づいて、特徴量算出部222が夫々の注目特徴点に対して算出したハッシュ値が、既に無効にされたハッシュ値であるか否かを判定し、判定結果を投票処理部224へ出力する。投票処理部224及び類似度判定処理部225は、文書照合処理部22が画像の類似度を判定するための原稿の画像を登録する場合、即ち、操作パネル4より原稿を登録するための原稿登録モードが指定されている場合、何も処理を行わず、特徴量算出部222が夫々の注目特徴点に対して算出したハッシュ値又は無効特徴量判定部223による判定結果を登録処理部226へ出力する。
【0050】
登録処理部226は、原稿登録モードの場合、登録画像の原稿ページインデックス(例えば、ID1、ID2、…)を設定し、登録画像毎に上述の処理で算出したハッシュ値(例えば、H1、H2、…)及び設定した原稿ページインデックスをハッシュテーブルに登録する。なお、原稿ページインデックスは、個々の登録画像を識別するものであり、文書を構成する原稿の各ページを識別する。なお、登録処理部226は、文書照合処理を行う場合、即ち、操作パネル4より原稿画像に対して処理の実行が指定されている場合、何も処理を行わず、類似度判定処理部225から出力された判定信号をそのまま出力する。
【0051】
図10はハッシュテーブルの構造を示す説明図である。図に示すように、ハッシュテーブルの構造は、ハッシュ値及び原稿を表すインデックスの各欄により構成されている。より具体的には、原稿を示すインデックスに対応して、原稿中の位置を示すポイントインデックス、及び不変量が登録されている。画像の類似度を判定するため、予め照合する画像・文書画像などの照合用情報をハッシュテーブルに登録しておく。ハッシュテーブルはメモリ227に記憶してある。なお、図10(b)に示すように、ハッシュ値が等しい場合(H1=H5)、ハッシュテーブルの2つのエントリを1つにまとめることもできる。
【0052】
ここで、複数の異なる原稿に同じ特徴量を持つ特徴点が存在する場合、即ち、ハッシュテーブルにおいて、1つの特徴量(ハッシュ値)に対して複数の異なる原稿のインデックス(原稿ページインデックス)が登録されている場合、以下の現象が観測される。まず、1つの特徴量に対して複数の異なる原稿ページインデックスがハッシュテーブルに登録されるため、この特徴量に対して登録される原稿ページインデックスの登録数が、他の特徴量に対して登録される原稿ページインデックスの登録数に比して突出して多くなる。
【0053】
また、このように原稿ページインデックスの登録数が多い特徴量を持った特徴点を多数含む特定の原稿が照合される場合には、後述する投票処理部224による投票処理において、この特徴点が抽出された複数の原稿、具体的には、この特徴点に対応してハッシュテーブルに原稿ページインデックスが登録してある原稿への投票数が著しく増加する。照合すべき全ての原稿が登録されている状況では、このような現象が生じた場合であっても、本来類似であると判定すべき原稿に対して投票がより集中するため、画像の類似度を判定することは可能である。しかし、照合すべき原稿が必ずしも全て登録されていない状況では、登録されていない原稿に関しては登録されていないと判定する必要がある場合に、このような現象が生じると、登録されていない原稿を、誤っていずれかの登録画像に類似していると判定してしまう虞がある。
【0054】
そこで、上述したような現象を回避するため、本実施の形態では、1つのハッシュ値に対してハッシュテーブルに登録できる原稿ページインデックス数を予め設定された登録上限数に制限し、登録上限数以上となったハッシュ値を無効にし、画像を照合する際の投票の対象としないようにする。具体的には、登録処理部(判断手段)226は、登録画像毎に特徴量算出部222が算出したハッシュ値に対応して、登録画像の原稿ページインデックスを登録させるに際し、各ハッシュ値に対応して既に登録してある原稿ページインデックスの数が、予め設定された登録上限数(所定数)以上であるか否かを判断する。そして、登録処理部(無効手段)226は、登録上限数未満である場合、登録画像毎に特徴量算出部222が算出したハッシュ値に対応して登録画像の原稿ページインデックスを登録させ、登録上限数以上である場合、このハッシュ値を無効にする。
【0055】
なお、登録処理部226は、無効特徴量判定部223から、特徴量算出部222が算出したハッシュ値が無効ハッシュ値でないとの判定結果を取得した場合、このハッシュ値に対応して既に登録してある原稿ページインデックスの数が登録上限数以上であるか否かの判断処理は行わない。
【0056】
図11はハッシュテーブルの構造を示す説明図である。図11(a)に示すハッシュテーブルは、図10(a)に示すハッシュテーブルにおいて、登録処理部226が無効にしたハッシュ値(図11(a)ではH3)に対応して原稿ページインデックスが登録できないように構成されている。なお、図11(b)に示すように、登録処理部226が無効にしたハッシュ値(無効ハッシュ値)のみをメモリ227に保持する形式であってもよい。また、図11(c)に示すように、図10(a)に示すハッシュテーブルにおいて、全てのハッシュ値に対して、無効ハッシュ値であるか否かを示す1ビットのフラグを設け、無効ハッシュ値に対するフラグを「1」にセットし、各ハッシュ値が無効にされたか否かを保持する形式であってもよい。
【0057】
このように、複数の異なる原稿の原稿ページインデックスが登録されたハッシュ値を無効にして投票に用いないことにより、照合すべき原稿が必ずしも全て登録されていない状況であっても、登録されていない原稿を、誤っていずれかの登録画像に類似していると判定してしまう現象を回避することができる。なお、この場合、ハッシュテーブルに登録された登録原稿の数が多い場合と少ない場合とにおいて、無効にされるハッシュ値が異なってしまうので、登録原稿の数に応じて照合の判定精度が変動する虞がある。
【0058】
従って、本実施の形態では、事前に一般的な原稿について登録処理と同様の処理を行って、上述したように原稿ページインデックスの登録数が多い特徴量を抽出しておき、無効なハッシュ値として予め登録しておくことにより、登録枚数に依存した判定制度の変動を回避する。また、過去に誤一致を起こすことが判明している原稿がある場合には、誤一致した原稿に共通する特徴量を登録処理と同等の処理を実施して抽出しておき、無効なハッシュ値として登録しておいてもよい。なお、事前に抽出された無効なハッシュ値、登録画像の登録時に無効にされたハッシュ値は、操作パネル4からの入力により登録されてメモリ227に格納される。また、この作業は、工場出荷時、あるいは、サービスマンによるメンテナンス時に行われる。
【0059】
無効特徴量判定部223は、図11(a)又は(c)に示すハッシュテーブルの登録内容、又は図11(b)に示すようにメモリ227に登録された無効ハッシュ値に基づいて、特徴量算出部222が夫々の注目特徴点に対して算出したハッシュ値が既に無効にされたハッシュ値であるか否かを判定し、判定結果を投票処理部224へ出力する。
【0060】
投票処理部224は、原稿画像が予め登録されている登録画像に類似するか否かを判定する文書照合処理を行う場合、無効特徴量判定部223から、特徴量算出部222が算出したハッシュ値が無効ハッシュ値でないとの判定結果を取得したときには、このハッシュ値に基づいて、メモリ227に記憶されたハッシュテーブルを検索する。投票処理部224は、ハッシュ値が一致する場合、該ハッシュ値に登録されているインデックスの原稿(すなわち、ハッシュ値が一致する画像)に投票する。なお、無効特徴量判定部223から、特徴量算出部222が算出したハッシュ値が無効ハッシュ値であるとの判定結果を取得したときには、投票処理部224は、このハッシュ値に基づくハッシュテーブルの検索及び投票を行わない。投票処理部224は、累積加算した得票数を投票結果として類似度判定処理部225へ出力する。
【0061】
類似度判定処理部225は、投票処理部224から入力された投票結果に基づいて、原稿画像(画像、文書画像)がいずれの登録画像に類似するかを判定し、その判定結果、具体的には、類似すると判定された登録画像に対応して、処理(例えば、複写禁止、所定のフォルダに記憶など)の実行が許可されているか否かを示す判定信号を登録処理部226へ出力する。より具体的には、類似度判定処理部225は、投票処理部224から入力された投票数(得票数)を予め定めた閾値と比較し、投票数が閾値以上であれば、入力画像が予め登録された原稿の画像に類似すると判定し、さらに類似と判定された中で最も得票数の高い原稿が一致する原稿であると判定する。
【0062】
予め登録された原稿の画像中に入力画像と一致する画像があると判定した場合、類似度判定処理部225は、類似すると判定された登録画像に対応して処理の実行が許可されている場合、判定信号「1」を登録処理部226へ出力する。一方、類似すると判定された登録画像に対応して処理の実行が許可されていない場合、類似度判定処理部225は、判定信号「0」を登録処理部226へ出力する。なお、類似度判定処理部225は、投票処理部224から入力された投票数が閾値より小さい場合、類似する原稿がないと判定して、その結果(判定信号「0」)を出力する。登録処理部226は、文書照合処理を行う場合、何も処理を行わず、類似度判定処理部225から出力された判定信号をそのまま出力する。
【0063】
図12は投票結果に基づく類似判定の一例を示す説明図である。原稿画像から算出されたハッシュ値毎にハッシュテーブルを検索して投票した結果、原稿ページインデックスがID1、ID2、ID3で示される登録画像に対して投票されたとする。投票の結果、得られたそれぞれの得票数N1、N2、N3が閾値Th以上であるのは、原稿ページインデックスがID1で示される登録画像であるため、原稿画像は、原稿ページインデックスID1の登録画像に類似すると判定される。
【0064】
上記の判定方法は一例であり、別の方法として、例えば、投票処理部224から入力された得票数を原稿画像の最大得票数(特徴点の数×1つの特徴点から算出されるハッシュ値の数で表される)で除算して正規化した類似度を算出し、算出した類似度と予め定めた閾値Th(例えば、0.8)とを比較し、類似度が閾値Th以上である場合には、その類似度が算出された登録画像に類似すると判定し、類似度が閾値Thより小さい場合には、原稿画像に類似する登録画像はないと判定する。
【0065】
なお、図8及び図9には、最も簡単な例として、1つの特徴点から1つのハッシュ値が算出される例を示したが、注目特徴点の周辺の特徴点を選択する方法を変えると、1つの特徴点から複数のハッシュ値を算出することができる。例えば、注目特徴点の周辺の特徴点として6つの特徴点を抽出し、この6つの特徴点から5つの特徴点を抽出する組み合わせは6通り考えられる。そして、この6通りそれぞれについて、5つの特徴点から3つの特徴点を抽出して不変量を求め、ハッシュ値を算出する方法もある。
【0066】
次にカラー画像処理装置2の動作について説明する。図13及び図14は原稿登録処理の手順を示すフローチャートである。なお、原稿登録処理は、文書照合処理部22などの専用のハードウエア回路で構成するだけでなく、CPU、RAM、ROMなどを備えたパーソナルコンピュータに、原稿登録処理の手順を定めたコンピュータプログラムをロードすることによりCPUでコンピュータプログラムを実行させることにより行うこともできる。以下、カラー画像処理装置2を「処理部」という。
【0067】
処理部は、原稿登録モードであるか否かを判定し(S11)、原稿登録モードでない場合(S11でNO)、ステップS21へ処理を移行する。原稿登録モードである場合(S11でYES)、処理部は、登録画像を取得する(S12)。この場合、登録画像は原稿を原稿読取装置で読み取ることにより取得してもよく、あるいは、パーソナルコンピュータ等の処理装置で作成された電子データを受信することにより取得してもよい。
【0068】
処理部は、登録画像の特徴点を算出し(S13)、算出した特徴点に基づいてハッシュ値(特徴量)を算出する(S14)。処理部は、登録画像の原稿ページインデックスを設定し(S15)、ステップS14で算出したハッシュ値が既に無効にされているか否かを判定する(S16)。ハッシュ値が無効にされていないと判定した場合(S16でNO)、処理部は、このハッシュ値に対応して既にハッシュテーブルに登録してある原稿ページインデックスの数が、登録上限数以上であるか否かを判断する(S17)。
【0069】
このハッシュ値に対応して既にハッシュテーブルに登録してある原稿ページインデックスの数が、登録上限数未満であると判断した場合(S17でNO)、処理部は、設定した原稿ページインデックスを、算出したハッシュ値に対応してハッシュテーブルに格納することによりハッシュテーブルを更新する(S18)。このハッシュ値に対応して既にハッシュテーブルに登録してある原稿ページインデックスの数が、登録上限数以上であると判断した場合(S17でYES)、処理部は、このハッシュ値を無効にする(S19)。ハッシュ値が既に無効にされていると判定した場合(S16でYES)、処理部は、ステップS17〜S19の処理をスキップする。
【0070】
処理部は、ステップS14で算出した全てのハッシュ値に対して上述した処理が終了したか否かを判定する(S20)。全てのハッシュ値に対する処理が終了していない場合(S20でNO)、処理部は、ステップS16以降の処理を続け、残りのハッシュ値に対応して原稿ページインデックスをハッシュテーブルに登録する処理、又はハッシュ値を無効にする処理を行う。全てのハッシュ値に対する処理が終了した場合(S20でYES)、処理部は、上述した処理を終了する。
【0071】
一方、ステップS11で原稿登録モードでない場合(S11でNO)、処理部は、原稿画像を取得する(S21)。この場合、原稿画像は原稿を原稿読取装置で読み取ることにより取得してもよく、あるいは、パーソナルコンピュータ等の処理装置で作成された電子データを受信することにより取得してもよい。
【0072】
処理部は、原稿画像の特徴点を算出し(S22)、算出した特徴点に基づいてハッシュ値(特徴量)を算出する(S23)。処理部は、算出したハッシュ値に基づいて、ハッシュテーブルを検索し、同じハッシュ値を有する原稿ページインデックスに対して投票処理を行う(S24)。投票処理の結果に基づいて、処理部は、得票数が閾値Thより大きいか否かを判定する(S25)。得票数が閾値Thより大きい場合(S25でYES)、処理部は、原稿画像が類似する登録画像が、処理の実行が許可された画像であるか否かを判断する(S26)。
【0073】
処理の実行が許可されていると判断した場合(S26でYES)、処理部は、判定信号「1」を出力し(S27)、処理の実行が許可されていないと判断した場合(S26でNO)、判定信号「0」を出力する(S28)。なお、得票数が閾値Thより大きくない場合(S25でNO)、処理部は、判定信号「0」を出力する(S28)。
【0074】
上述の実施の形態において、画像形成装置100としては、ネットワークを介してサーバ装置などに接続するための通信手段としてのモデムなどを備えることもできる。図15は本発明に係る画像処理装置を備えるデジタルカラー複合機500の構成を示すブロック図である。図に示すように、デジタルカラー複合機500は、カラー画像入力装置1、カラー画像処理装置2、カラー画像出力装置3及び操作パネル4のほかに、送信装置5を備えている。カラー画像入力装置1、カラー画像処理装置2、カラー画像出力装置3及び操作パネル4は、上述の画像形成装置100の場合と同様であるので説明は省略する。
【0075】
送信装置5は、例えばモデムにより構成されている。送信装置5は、例えばファクシミリの送信を行う場合、モデムにて、相手先との送信手続きを行い送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリから読み出し、圧縮形式の変更など必要な処理を施して、相手先に通信回線を介して順次送信する。また、送信装置5は、ファクシミリを受信する場合、通信手続きを行いながら相手先から送信されてくる画像データを受信してカラー画像処理装置2へ出力し、カラー画像処理装置2は受信した画像データを、不図示の圧縮/伸張処理部にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理や解像度変換処理が行なわれ、出力階調補正処理、階調再現処理等が施され、カラー画像出力装置3より出力される。
【0076】
なお、送信装置5を、例えば、ネットワークカード、LANケーブル等を介して、ネットワークに接続されたコンピュータ及び他のデジタル複合機等との間でデータ通信を行うように構成してもよい。また、カラー複合機だけでなく、モノクロの画像を扱う複合機、ファクシミリ通信機能のみを有するファクシミリ通信装置単体においても本発明を適用することができる。
【0077】
図16は本発明に係る画像読取装置600の構成を示すブロック図である。図に示すように、画像読取装置600は、カラー画像入力装置1、A/D変換部20、シェーディング補正部21、文書照合処理部22などを備えている。カラー画像入力装置1、A/D変換部20、シェーディング補正部21、文書照合処理部22は、上述の画像形成装置100の場合と同様であるので説明は省略する。
【0078】
以上説明したように、本発明にあっては、例えば、定型フォーム等の原稿をスキャンして電子化文書を生成する場合、予め定型フォームの照合用情報とともに、原稿のページ構成情報を登録しておく。そして、登録画像と原稿画像との類似を判定し、登録画像に類似する原稿画像に対する処理の実行を許可又は禁止することができる。すなわち、利用者が特別な操作を行うことなく、予め処理の実行を禁止するように登録された原稿が読み取られて原稿画像が入力された場合に、この原稿画像に対する処理の実行を禁止することができ、例えば機密文書の複写を防止することができる。
【0079】
なお、原稿画像に対して実行される処理としては、例えば、複写、電子配信、ファクシミリ送信、ファイリングなどの処理があるが、これらに限定されるものではなく、複写、電子配信、ファクシミリ送信、ファイリングする際に、原稿画像全体ではなく原稿画像の一部に対して出力処理の制御を行うこともできる。例えば、定型フォームのうち、重要事項、機密事項などが記載される部分については、複写、電子配信を禁止するように制御することもできる。
【0080】
画像読取装置600が出力する判定信号は、読み込まれた原稿画像とともにネットワークを介してプリンタや複合機に送信され出力される。あるいは、コンピュータを介してプリンタに、もしくは、直接プリンタに入力さる。この場合、プリンタや複合機、コンピュータ側で処理内容を表す信号を判断できるようにしておく必要があるので、判定信号を出力するのではなく、特徴量を出力するようにしても良い。
【0081】
上述の実施の形態において、カラー画像入力装置1としては、例えば、フラットベッドスキャナ、フィルムスキャナ、デジタルカメラ、携帯電話機などが用いられる。なお、カラー画像入力装置1からカラー画像データを取得する代わりに、ネットワークを介して外部記憶装置、サーバ装置などからカラー画像データを取得する構成であってもよい。また、カラー画像出力装置3としては、例えば、CRTディスプレイ、液晶ディスプレイなどの画像表示装置、処理結果を記録紙などに出力する電子写真方式又はインクジェット方式のプリンタなどが用いられる。
【0082】
上述の実施の形態では、文書照合処理部22の中にメモリ227、制御部228を備える構成であるが、これに限定されるものではなく、メモリ227、制御部228を文書照合処理部22の外部に設ける構成であってもよい。
【0083】
本発明はコンピュータに実行させるためのコンピュータプログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータでの読み取り可能な記録媒体に、原稿登録処理及び原稿分類処理等を含む文書照合処理、出力処理の制御を行うコンピュータプログラムコードを記録することもできる。この結果、上記原稿登録処理、原稿分類処理、出力処理の制御を行うコンピュータプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。記録媒体としては、マイクロコンピュータで処理が行われるために図示しないメモリ、例えばROMのようなプログラムメディアであってもよく、図示しない外部記憶装置としてのプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。
【0084】
いずれの場合においても、格納されているコンピュータプログラムコードはマイクロプロセッサがアクセスして実行させる構成であってもよいし、コンピュータプログラムコードを読み出し、読み出されたコンピュータプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのコンピュータプログラムコードが実行される方式であってもよい。この場合、ダウンロード用のコンピュータプログラムは予め本体装置に格納されているものとする。
【0085】
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスク並びにCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にコンピュータプログラムを担持する媒体であってもよい。
【0086】
また、この場合、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからコンピュータプログラムコードをダウンロードするように流動的にコンピュータプログラムコードを担持する媒体であってもよい。なお、このように通信ネットワークからコンピュータプログラムコードをダウンロードする場合には、そのダウンロード用のコンピュータプログラムは予め本体装置に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【図面の簡単な説明】
【0087】
【図1】本発明に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。
【図2】文書照合処理部の構成を示すブロック図である。
【図3】特徴点算出部の構成を示すブロック図である。
【図4】フィルタ処理部のフィルタ係数の例を示す説明図である。
【図5】連結領域の特徴点の例を示す説明図である。
【図6】文字列に対する特徴点の抽出結果の例を示す説明図である。
【図7】注目特徴点と周辺の特徴点を示す説明図である。
【図8】注目特徴点に関する不変量の算出例を示す説明図である。
【図9】注目特徴点に関する不変量の算出例を示す説明図である。
【図10】ハッシュテーブルの構造を示す説明図である。
【図11】ハッシュテーブルの構造を示す説明図である。
【図12】投票結果に基づく類似判定の一例を示す説明図である。
【図13】原稿登録処理の手順を示すフローチャートである。
【図14】原稿登録処理の手順を示すフローチャートである。
【図15】本発明に係る画像処理装置を備えるデジタルカラー複合機の構成を示すブロック図である。
【図16】本発明に係る画像読取装置の構成を示すブロック図である。
【符号の説明】
【0088】
1 カラー画像入力装置
2 カラー画像処理装置
3 カラー画像出力装置
22 文書照合処理部
221 特徴点算出部
222 特徴量算出部
223 無効特徴量判定部
224 投票処理部
225 類似度判定処理部
226 登録処理部
227 メモリ
228 制御部
【技術分野】
【0001】
本発明は、入力された画像から得られる特徴量に基づいて、予め登録された画像と類似するか否かを判定する画像処理方法、画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置、並びに前記画像処理装置を実現するためのコンピュータプログラム及び該コンピュータプログラムを記録した記録媒体に関する。
【背景技術】
【0002】
スキャナで原稿を読み取り、原稿を読み取って得られた画像データを予め登録されている画像データと照合して、画像の類似度を判定する画像処理としては、例えば、OCR(Optical Character Reader)で画像からキーワードを抽出し、抽出したキーワードにより画像の類似度を判定する方法、類似度の判定を行う画像を罫線のある帳票画像に限定して、罫線の特徴を抽出して画像の類似度を判定する方法などが提案されている。
【0003】
また、入力文書の特徴を抽出してデスクリプタを生成し、生成したデスクリプタと予めデスクリプタデータベースに登録されているデスクリプタとを照合することにより、入力文書とデスクリプタデータベース中のデスクリプタとのマッチングを行う装置が提案されている(特許文献1参照)。
【0004】
特許文献1で開示された装置では、デスクリプタデータベースに、デスクリプタと、それぞれのデスクリプタが抽出される特徴を含む文書のリストとが登録される。デスクリプタは、文書のデジタル化により生じる歪み、入力文書と文書データベース中の整合する文書との間の差異等に対して不変となるように生成される。特許文献1で開示された装置は、デスクリプタデータベースがスキャンされるときに、文書データベース中の各文書に対する投票を累積し、最高得票数の1文書又は得票数がある閾値を越えた文書を整合文書とする。
【0005】
また、デジタルカメラで撮像された画像、スキャナで読み取られた画像等に対して、画像の連結部分を単語領域と見なしてその重心を特徴点として求め、この特徴点を用いて幾何学的不変量を算出し、さらに幾何学的不変量より特徴量を求め、特徴量、特徴点を表すインデックス及び画像を表すインデックスをハッシュテーブルに登録しておき、画像の検索を行う際に、入力画像(検索質問)から、同様の処理で特徴点、特徴量、特徴点を表すインデックスを求め、ハッシュテーブルに予め登録されている画像に対して投票を行って検索を行う装置が提案されている(特許文献2参照)。
【0006】
特許文献2には、特徴量の精度を上げることに関して、1つの特徴量を計算する際に用いる特徴点として広い範囲から特徴点を抽出すること、特徴点の数を増やすこと等が記載されている。また、特許文献2では、予め登録されている画像に対して投票を行う際に、入力画像の特徴点と登録文書の点との間の対応を記録しておき、既に対応付けられている点については投票を行わないことにより、誤った投票を防止して画像検索の判定精度の低下を抑制できる。更に、特許文献2には、ハッシュテーブルに登録されている画像の登録ページ数が増えると画像検索の判定精度が低下し、また、この原因が、同じ特徴量をもつ異なる文書が登録される可能性が高くなることであると推定されることが記載されている。
【特許文献1】特開平7−282088号公報
【特許文献2】国際公開第2006/92957号パンフレット
【発明の開示】
【発明が解決しようとする課題】
【0007】
特許文献1では、デスクリプタデータベースを、無限に要素が登録できるリスト構造ではなく、1つのデスクリプタに対して有限個のデータが登録されるテーブル形式で構成している。このように、固定サイズのテーブル形式でデスクリプタデータベースを実装した場合、1枚の原稿から抽出されるデスクリプタの数を、デスクリプタデータベースに登録する全ての原稿について足し合わせた数が、1つのデスクリプタに対して登録されるデータの数となる。この場合、1枚の原稿からあまりに多くのデスクリプタを抽出すると、デスクリプタデータベースのサイズが膨大になってしまうため、抽出するデスクリプタの数を削減することが好ましい。なお、削減されるデスクリプタが、画像を検索する際の検出不可能エラー又は確定的間違いをもたらすものであれば、画像を検索する際の性能は向上する。
【0008】
また、特許文献1では、デスクリプタは冗長性を有しており、デスクリプタデータベースに登録してある全てのデスクリプタを使用して画像を検索する必要はなく、例えば、品質の高い、即ち、精度のよいデスクリプタのみを使用して画像を検索してもよいことが記載されている。従って、ノイズによって1枚の原稿中の文字が壊されていた場合であっても、登録された複数のデスクリプタに基づいて照合するので、原稿中のノイズの影響を受けていないデスクリプタが残っていれば、このデスクリプタに基づいて照合が可能である。
【0009】
しかし、特許文献1には、複数の異なる原稿から同じデスクリプタが抽出される場合の問題については記載されていない。複数の異なる原稿から同じデスクリプタが抽出された場合、このデスクリプタは、このデスクリプタが抽出された全ての原稿に当てはまるため、原稿を特定する際には有意ではなく、むしろ誤って類似画像を判定する原因となる。
【0010】
また、特許文献2では、ハッシュテーブルに予め登録されている登録画像の枚数の多少により無効な特徴量による判定精度に及ぼす影響が異なることに関する記載はなく、登録原稿が少ない場合に判定精度が低下するという問題を有している。
【0011】
本発明は、斯かる事情に鑑みてなされたものであり、画像の類似度を精度よく判定することができる画像処理方法、画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置、前記画像処理装置を実現するためのコンピュータプログラム及び記録媒体を提供することを目的とする。
【課題を解決するための手段】
【0012】
本発明に係る画像処理方法では、画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段を備え、入力された原稿画像から特徴量を抽出し、抽出した特徴量及び記憶手段に記憶してある登録画像の特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定する。また、画像処理装置は、記憶手段に登録画像を登録するに際し、入力された画像から特徴量を抽出し、抽出した特徴量に対応して記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断し、登録画像の数が所定数以上でない場合、入力された画像を登録画像とし、抽出した特徴量に対応付けて記憶手段に登録し、登録画像の数が所定数以上である場合、前記特徴量を無効にする。従って、画像処理装置は、記憶手段に記憶してある登録画像の特徴量のうちで無効にされていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定する。
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより、上記画像処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
【発明の効果】
【0013】
本発明にあっては、1つの特徴量に対して所定数以上の登録画像が登録された場合、この特徴量を無効にし、入力された原稿画像が予め登録されている登録画像のいずれかに類似するか否かの判定処理には有効ではない特徴量として以降の判定処理には用いないので、精度よく画像の類似度を判定することができる。一方、登録画像の数が多い場合には、無効にすべき特徴量は無効にされるが、例えば、登録画像の数が少ない場合には、本来無効にすべき特徴量が無効にされない場合が生じ、登録画像の数に応じて、類似する登録画像の判定精度が変更する可能性がある。従って、所定の画像から抽出した特徴量を予め無効にしておくことにより、登録画像の数が少ない場合であっても、画像の類似度を判定する際の照合精度を安定して維持することができる。
【発明を実施するための最良の形態】
【0014】
以下、本発明を実施の形態を示す図面に基づいて説明する。図1は本発明に係る画像処理装置を備える画像形成装置100の構成を示すブロック図である。画像形成装置100(例えば、デジタルカラー複写機や複合機能、プリンタ機能、ファックスや電子メール配信機能を備えた複合機)は、カラー画像入力装置1、カラー画像処理装置2(画像処理装置)、画像形成手段としてのカラー画像出力装置3、各種操作を行うための操作パネル4などを備える。カラー画像入力装置1で原稿を読み込むことにより得られたRGB(R:赤、G:緑、B:青)のアナログ信号の画像データは、カラー画像処理装置2へ出力され、カラー画像処理装置2で所定の処理が行われ、CMYK(C:シアン、M:マゼンダ、Y:イエロー、K:黒)のデジタルカラー信号としてカラー画像出力装置3へ出力される。
【0015】
カラー画像入力装置1は、例えば、CCD(Charged Coupled Device)を備えたスキャナであり、原稿画像からの反射光像をRGBのアナログ信号として読み取り、読み取ったRGB信号をカラー画像処理装置2へ出力する。また、カラー画像出力装置3は、原稿画像の画像データを記録紙上に出力する電子写真方式又はインクジェット方式などのプリンタである。また、カラー画像出力装置3は、ディスプレイ等の表示装置であってもよい。
【0016】
カラー画像処理装置2は、A/D変換部20、シェーディング補正部21、文書照合処理部22、入力階調補正部23、領域分離処理部24、色補正部25、黒生成下色除去部26、空間フィルタ処理部27、出力階調補正部28、階調再現処理部29、これらのハードウエア各部の動作を制御するCPU(Central Processing Unit )等を備え、ASIC(Application Specific Integrated Circuit)などにより構成される。
【0017】
A/D変換部20は、カラー画像入力装置1から入力されたRGB信号を、例えば、10ビットのデジタル信号に変換し、変換後のRGB信号をシェーディング補正部21へ出力する。
【0018】
シェーディング補正部21は、入力されたRGB信号に対して、カラー画像入力装置1の照明系、結像系、撮像系などで生じた各種の歪みを取り除く補正処理を行い、補正後のRGB信号を文書照合処理部22へ出力する。また、シェーディング補正部21は、カラーバランスを整える処理を行うとともに、濃度信号などカラー画像処理装置2で採用されている画像処理システムが扱い易い信号に変換する処理を行う。
【0019】
文書照合処理部22は、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点を算出し、その結果を用いて入力された画像と予め登録されている画像(文書画像を含む)との類似度を判定する。文書照合処理部22は、画像が類似していると判定した場合、類似原稿に対して処理の実行が許可されているか否かを示す判定信号を出力する。例えば、類似原稿であると判定された原稿の出力、複写、所定のフォルダにファイルすること等が禁止されている場合、文書照合処理部22は、判定信号「0」を出力し、禁止されていない場合、判定信号「1」を出力する。なお、各類似原稿が、処理の実行が許可されている原稿であるか否かは予め登録されている。
【0020】
これにより、画像形成装置100は、入力された画像が登録画像に類似するか否かに応じて、この画像に対して実行が指示された各種の処理をキャンセル又は実行することができ、画像(文書画像を含む)の照合とともに、照合結果に応じた処理を行うことができる。また、文書照合処理部22は、入力されたRGB信号をそのまま後段の入力階調補正部23へ出力する。
【0021】
入力階調補正部23は、シェーディング補正部21にて各種の歪みが取り除かれたRGB信号(RGBの反射率信号)に対して、下地濃度の除去又はコントラストなど画質調整処理を施し、処理後のRGB信号を領域分離処理部24へ出力する。
【0022】
領域分離処理部24は、入力されたRGB信号に基づき、入力された画像中の各画素が、文字領域、網点領域、写真領域の何れであるかを分離する。領域分離処理部24は、分離結果に基づいて、各画素がどの領域に属しているかを示す領域識別信号を黒生成下色除去部26、空間フィルタ処理部27、階調再現処理部29へ出力する。また、領域分離処理部24は、入力されたRGB信号をそのまま後段の色補正部25へ出力する。
【0023】
色補正部25は、入力されたRGB信号をCMYの色空間に変換し、カラー画像出力装置3の特性に合わせて色補正を行い、補正後のCMY信号を黒生成下色除去部26へ出力する。具体的には、色補正部25は、色再現の忠実化のため、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りを取り除く処理を行う。
【0024】
黒生成下色除去部26は、色補正部25から入力されたCMY信号に基づいて、K(黒)信号を生成するとともに、入力されたCMY信号からK信号を差し引いて新たなCMY信号を生成し、生成したCMYK信号を空間フィルタ処理部27へ出力する。
【0025】
黒生成下色除去部26における処理の一例を示す。例えば、スケルトンブラックによる黒生成を行う処理の場合、スケルトンカーブの入出力特性をy=f(x)とし、入力されるデータをC、M、Yとし、出力されるデータをC´、M´、Y´、K´とし、UCR(Under Color Removal)率をα(0<α<1)とすると、黒生成下色除去処理により出力されるデータ夫々は、K´=f{min(C、M、Y)}、C´=C−αK´、M´=M−αK´、Y´=Y−αK´で表される。
【0026】
空間フィルタ処理部27は、黒生成下色除去部26から入力されたCMYK信号に対して、領域識別信号に基づいたデジタルフィルタによる空間フィルタ処理を行う。これにより、画像データの空間周波数特性が補正され、カラー画像出力装置3における出力画像のぼやけ、又は粒状性劣化を防止する。例えば、空間フィルタ処理部27は、領域分離処理部23において文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、鮮鋭強調処理を施し高周波成分を強調する。また、空間フィルタ処理部27は、領域分離処理部23において網点領域に分離された領域を、入力網点成分を除去するためのローパス・フィルタ処理を施す。空間フィルタ処理部27は、処理後のCMYK信号を出力階調補正部28へ出力する。
【0027】
出力階調補正部28は、空間フィルタ処理部27から入力されたCMYK信号に対して、カラー画像出力装置3の特性値である網点面積率に変換する出力階調補正処理を行い、出力階調補正処理後のCMYK信号を階調再現処理部29へ出力する。
【0028】
階調再現処理部29は、領域分離処理部23から入力された領域識別信号に基づいて、出力階調補正部28から入力されたCMYK信号に対して所定の処理を行う。例えば、階調再現処理部29は、文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、カラー画像出力装置3における高周波成分の再現に適するように二値化処理又は多値化処理を行う。
【0029】
また、階調再現処理部29は、領域分離処理部23において網点領域に分離された領域を、最終的に画像を画素に分離して、それぞれの階調を再現できるように階調再現処理(中間調生成)を行う。さらに、階調再現処理部29は、領域分離処理部23において写真領域に分離された領域を、カラー画像出力装置3における階調再現性に適するように二値化処理又は多値化処理を行う。
【0030】
カラー画像処理装置2は、階調再現処理部29で処理された画像データ(CMYK信号)を記憶部(不図示)に一旦記憶し、画像形成をする所定のタイミングで記憶部に記憶した画像データを読み出し、読み出した画像データをカラー画像出力装置3へ出力する。これらの制御は、例えば、CPU(不図示)により行われる。
【0031】
操作パネル4は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され、操作パネル4より入力された情報(例えば、原稿を登録するための原稿登録モードの指定、原稿画像に対するファイリング、複写、電子配信などの出力処理の指定など)に基づいてカラー画像入力装置1、カラー画像処理装置2、カラー画像出力装置3の動作が制御される。
【0032】
図2は文書照合処理部22の構成を示すブロック図である。文書照合処理部22は、特徴点算出部221、特徴量算出部222、無効特徴量判定部223、投票処理部224、類似度判定処理部225、登録処理部226、メモリ227、前記各部を制御する制御部228などを備えている。
【0033】
特徴点算出部221は、入力された画像に対して後述する所定の処理を行うとともに、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点(例えば、連結領域を構成する各画素の二値画像における座標値を累積加算し、累積加算した座標値を連結領域に含まれる画素数で除算した値)を抽出(算出)し、抽出した特徴点をメモリ227に記憶させると共に特徴量算出部222へ出力する。
【0034】
図3は特徴点算出部221の構成を示すブロック図である。特徴点算出部221は、無彩化処理部2210、解像度変換部2211、フィルタ処理部2212、二値化処理部2213、重心算出部2214などを備えている。
【0035】
無彩化処理部2210は、入力された画像がカラー画像である場合、カラー画像を無彩化して、輝度信号又は明度信号に変換し、変換後の画像を解像度変換部2211へ出力する。例えば、輝度信号Yは、各画素RGBの色成分を夫々Rj、Gj、Bjとし、各画素の輝度信号をYjとして、Yj=0.30×Rj+0.59×Gj+0.11×Bjで表すことができる。なお、上式に限らず、RGB信号をCIE1976L* a* b* 信号に変換することもできる。
【0036】
解像度変換部2211は、入力された画像がカラー画像入力装置1で光学的に変倍された場合であっても、所定の解像度になるように入力された画像を再度変倍し、変倍された画像をフィルタ処理部2212へ出力する。これにより、カラー画像入力装置1で変倍処理が行われ解像度が変化した場合であっても、その影響を受けることなく特徴点の抽出を行うことができ、精度良く画像の類似度を判定することができる。特に、縮小された文字などの場合、二値化処理を行って連結領域を特定するとき、文字が潰れているために本来離れている領域が繋がった状態で特定され、算出される重心がずれる虞を防止できる。また、解像度変換部2211は、カラー画像入力装置1で等倍時に読み込まれる解像度よりも小さい解像度に変換する。例えば、カラー画像入力装置1において600dpi(dot per inch)で読み込まれた画像を300dpiに変換する。これにより、後段における処理量を低減することができる。
【0037】
フィルタ処理部2212は、入力された画像が有する空間周波数特性を補正し(例えば、画像の強調化処理及び平滑化処理など)、補正後の画像を二値化処理部2213へ出力する。フィルタ処理部2212は、カラー画像入力装置1の空間周波数特性が機種ごとに異なるため、異なる空間周波数特性を所要の特性に補正する。カラー画像入力装置1が出力する画像(例えば、画像信号)には、レンズ又はミラーなどの光学系部品、CCDの受光面のアパーチャ開口度、転送効率、残像、物理的な走査による積分効果及び走査むら等に起因して画像のぼけなどの劣化が生ずる。フィルタ処理部2212は、境界又はエッジなどの強調処理を行うことにより、画像に生じたぼけなどの劣化を修復する。また、フィルタ処理部2212は、後段で処理される特徴点の抽出処理に不要な高周波成分を抑制するための平滑化処理を行う。これにより、特徴点を精度良く抽出することができ、結果として画像の類似度の判定を精度良く行うことが可能となる。なお、フィルタ処理部2212で使用するフィルタ係数は、使用されるカラー画像入力装置1の機種又は特性などに応じて適宜設定することができる。
【0038】
図4はフィルタ処理部2212のフィルタ係数の例を示す説明図である。図に示すように、空間フィルタは、例えば、7×7(7行、7列)の大きさを有し、強調処理及び平滑化処理を行う混合フィルタである。入力された画像の画素を走査し、空間フィルタによる演算処理を全ての画素に対して行う。なお、空間フィルタの大きさは、7×7の大きさに限定されるものではなく、3×3、5×5などの大きさであってもよい。また、フィルタ係数の数値は一例であって、これに限定されるものではなく、使用されるカラー画像入力装置1の機種又は特性などに応じて適宜設定することができる。
【0039】
二値化処理部2213は、入力された画像の輝度値(輝度信号)又は明度値(明度信号)を閾値と比較することにより画像を二値化し、二値化した二値画像を重心算出部2214へ出力する。
【0040】
重心算出部2214は、二値化処理部2213から入力された二値画像の各画素の二値化情報(例えば、「1」、「0」で表される)に基づいて、各画素に対してラベリング(ラベル付け処理)を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点をメモリ227に記憶させると共に特徴量算出部222へ出力する。なお、特徴点は、二値画像における座標値(x座標、y座標)で表すことができる。
【0041】
図5は連結領域の特徴点の例を示す説明図である。図において、特定された連結領域は、文字「A」であり、同一ラベルが付された画素の集合として特定される。この文字「A」の特徴点(重心)は、図中黒丸で示される位置(x座標、y座標)となる。
【0042】
図6は文字列に対する特徴点の抽出結果の例を示す説明図である。複数の文字から構成される文字列の場合、文字の種類により夫々異なる座標を有する特徴点が複数抽出される。
【0043】
特徴量算出部222は、特徴点算出部221から入力された特徴点(すなわち、連結領域の重心の座標値)夫々を注目特徴点とし、例えば、注目特徴点からの距離が小さい周辺の他の特徴点を4つ抽出する。
【0044】
図7は注目特徴点と周辺の特徴点を示す説明図である。図に示すように、注目特徴点P1に対して、例えば、注目特徴点P1からの距離が近い順に、閉曲線S1で囲まれる4つの特徴点を抽出する(注目特徴点P1に対しては、注目特徴点P2も1つの特徴点として抽出されている)。また、注目特徴点P2に対して、例えば、上記と同様に注目特徴点P2からの距離が近い順に、閉曲線S2で囲まれる4つの特徴点を抽出する(注目特徴点P2に対しては、注目特徴点P1も1つの特徴点として抽出されている)。
【0045】
特徴量算出部222は、抽出した4つの特徴点の中から3つの特徴点を選択して、不変量を算出する。なお、選択する特徴点は3つに限られるものではなく、4つ、5つなどの特徴点を選択することもできる。求めたい不変量の種類によって選択すべき特徴点の数が異なる。例えば、3点から求められる不変量は相似不変量(原稿画像の回転、平行移動、拡大縮小を含む幾何学的変化に対して不変なパラメータ)となる。
【0046】
図8は注目特徴点P1に関する不変量の算出例を示す説明図であり、図9は注目特徴点P2に関する不変量の算出例を示す説明図である。図8に示すように、注目特徴点P1の周辺の4つの特徴点から3つの特徴点を選択し、4通りの不変量夫々をH1j(j=1、2、3、4)とする。4つの特徴点から3つの特徴点を選択する組み合わせと順番は、注目特徴点P1からの距離に応じて一意に定めておく。不変量H1jは、H1j=A1j/B1jで表される式で算出する。ここで、A1j、B1j夫々は特徴点間の距離を示す。これにより、例えば、原稿が回転、移動、傾いた場合であっても、不変量H1jは変化せず、画像の類似度の判定を精度良く行うことができる。
【0047】
同様に、図9に示すように、注目特徴点P2の周辺の4つの特徴点から3つの特徴点を選択し、4通りの不変量夫々をH2j(j=1、2、3、4)とする。4つの特徴点から3つの特徴点を選択する組み合わせと順番は、注目特徴点P1からの距離に応じて一意に定めておく。不変量H2jは、H2j=A2j/B2jで表される式で算出する。ここで、A2j、B2j夫々は特徴点間の距離を示す。以下同様に、他の注目特徴点に対して不変量を算出することができる。
【0048】
特徴量算出部222は、夫々の注目特徴点により算出された不変量に基づいて、ハッシュ値(特徴量)Hiを算出する。注目特徴点Piのハッシュ値Hiは、Hi=(Hi1×103 +Hi2×102 +Hi3×101 +Hi4×100 )/Dで表される。ここで、Dは余りをどの程度設定するかにより決定される定数であり、例えば、「10」とした場合には、余りは「0」〜「9」となり、これが算出するハッシュ値の取り得る範囲となる。また、iは自然数である。なお、特徴量としての上記ハッシュ値は一例であって、これに限定されるものではなく、他のハッシュ関数を用いることができる。上記では、周辺の他の特徴点として4点を抽出する例を示しているが、4点に限定されるものではない。例えば、6点抽出するようにしても良い。この場合、6点の特徴点から5点を抽出し、5点を抽出する6通りそれぞれの方法について、5点から3点を抽出して不変量を求め、ハッシュ値を算出するようにしても良い。
【0049】
無効特徴量判定部223は、後述するハッシュテーブルの登録内容に基づいて、特徴量算出部222が夫々の注目特徴点に対して算出したハッシュ値が、既に無効にされたハッシュ値であるか否かを判定し、判定結果を投票処理部224へ出力する。投票処理部224及び類似度判定処理部225は、文書照合処理部22が画像の類似度を判定するための原稿の画像を登録する場合、即ち、操作パネル4より原稿を登録するための原稿登録モードが指定されている場合、何も処理を行わず、特徴量算出部222が夫々の注目特徴点に対して算出したハッシュ値又は無効特徴量判定部223による判定結果を登録処理部226へ出力する。
【0050】
登録処理部226は、原稿登録モードの場合、登録画像の原稿ページインデックス(例えば、ID1、ID2、…)を設定し、登録画像毎に上述の処理で算出したハッシュ値(例えば、H1、H2、…)及び設定した原稿ページインデックスをハッシュテーブルに登録する。なお、原稿ページインデックスは、個々の登録画像を識別するものであり、文書を構成する原稿の各ページを識別する。なお、登録処理部226は、文書照合処理を行う場合、即ち、操作パネル4より原稿画像に対して処理の実行が指定されている場合、何も処理を行わず、類似度判定処理部225から出力された判定信号をそのまま出力する。
【0051】
図10はハッシュテーブルの構造を示す説明図である。図に示すように、ハッシュテーブルの構造は、ハッシュ値及び原稿を表すインデックスの各欄により構成されている。より具体的には、原稿を示すインデックスに対応して、原稿中の位置を示すポイントインデックス、及び不変量が登録されている。画像の類似度を判定するため、予め照合する画像・文書画像などの照合用情報をハッシュテーブルに登録しておく。ハッシュテーブルはメモリ227に記憶してある。なお、図10(b)に示すように、ハッシュ値が等しい場合(H1=H5)、ハッシュテーブルの2つのエントリを1つにまとめることもできる。
【0052】
ここで、複数の異なる原稿に同じ特徴量を持つ特徴点が存在する場合、即ち、ハッシュテーブルにおいて、1つの特徴量(ハッシュ値)に対して複数の異なる原稿のインデックス(原稿ページインデックス)が登録されている場合、以下の現象が観測される。まず、1つの特徴量に対して複数の異なる原稿ページインデックスがハッシュテーブルに登録されるため、この特徴量に対して登録される原稿ページインデックスの登録数が、他の特徴量に対して登録される原稿ページインデックスの登録数に比して突出して多くなる。
【0053】
また、このように原稿ページインデックスの登録数が多い特徴量を持った特徴点を多数含む特定の原稿が照合される場合には、後述する投票処理部224による投票処理において、この特徴点が抽出された複数の原稿、具体的には、この特徴点に対応してハッシュテーブルに原稿ページインデックスが登録してある原稿への投票数が著しく増加する。照合すべき全ての原稿が登録されている状況では、このような現象が生じた場合であっても、本来類似であると判定すべき原稿に対して投票がより集中するため、画像の類似度を判定することは可能である。しかし、照合すべき原稿が必ずしも全て登録されていない状況では、登録されていない原稿に関しては登録されていないと判定する必要がある場合に、このような現象が生じると、登録されていない原稿を、誤っていずれかの登録画像に類似していると判定してしまう虞がある。
【0054】
そこで、上述したような現象を回避するため、本実施の形態では、1つのハッシュ値に対してハッシュテーブルに登録できる原稿ページインデックス数を予め設定された登録上限数に制限し、登録上限数以上となったハッシュ値を無効にし、画像を照合する際の投票の対象としないようにする。具体的には、登録処理部(判断手段)226は、登録画像毎に特徴量算出部222が算出したハッシュ値に対応して、登録画像の原稿ページインデックスを登録させるに際し、各ハッシュ値に対応して既に登録してある原稿ページインデックスの数が、予め設定された登録上限数(所定数)以上であるか否かを判断する。そして、登録処理部(無効手段)226は、登録上限数未満である場合、登録画像毎に特徴量算出部222が算出したハッシュ値に対応して登録画像の原稿ページインデックスを登録させ、登録上限数以上である場合、このハッシュ値を無効にする。
【0055】
なお、登録処理部226は、無効特徴量判定部223から、特徴量算出部222が算出したハッシュ値が無効ハッシュ値でないとの判定結果を取得した場合、このハッシュ値に対応して既に登録してある原稿ページインデックスの数が登録上限数以上であるか否かの判断処理は行わない。
【0056】
図11はハッシュテーブルの構造を示す説明図である。図11(a)に示すハッシュテーブルは、図10(a)に示すハッシュテーブルにおいて、登録処理部226が無効にしたハッシュ値(図11(a)ではH3)に対応して原稿ページインデックスが登録できないように構成されている。なお、図11(b)に示すように、登録処理部226が無効にしたハッシュ値(無効ハッシュ値)のみをメモリ227に保持する形式であってもよい。また、図11(c)に示すように、図10(a)に示すハッシュテーブルにおいて、全てのハッシュ値に対して、無効ハッシュ値であるか否かを示す1ビットのフラグを設け、無効ハッシュ値に対するフラグを「1」にセットし、各ハッシュ値が無効にされたか否かを保持する形式であってもよい。
【0057】
このように、複数の異なる原稿の原稿ページインデックスが登録されたハッシュ値を無効にして投票に用いないことにより、照合すべき原稿が必ずしも全て登録されていない状況であっても、登録されていない原稿を、誤っていずれかの登録画像に類似していると判定してしまう現象を回避することができる。なお、この場合、ハッシュテーブルに登録された登録原稿の数が多い場合と少ない場合とにおいて、無効にされるハッシュ値が異なってしまうので、登録原稿の数に応じて照合の判定精度が変動する虞がある。
【0058】
従って、本実施の形態では、事前に一般的な原稿について登録処理と同様の処理を行って、上述したように原稿ページインデックスの登録数が多い特徴量を抽出しておき、無効なハッシュ値として予め登録しておくことにより、登録枚数に依存した判定制度の変動を回避する。また、過去に誤一致を起こすことが判明している原稿がある場合には、誤一致した原稿に共通する特徴量を登録処理と同等の処理を実施して抽出しておき、無効なハッシュ値として登録しておいてもよい。なお、事前に抽出された無効なハッシュ値、登録画像の登録時に無効にされたハッシュ値は、操作パネル4からの入力により登録されてメモリ227に格納される。また、この作業は、工場出荷時、あるいは、サービスマンによるメンテナンス時に行われる。
【0059】
無効特徴量判定部223は、図11(a)又は(c)に示すハッシュテーブルの登録内容、又は図11(b)に示すようにメモリ227に登録された無効ハッシュ値に基づいて、特徴量算出部222が夫々の注目特徴点に対して算出したハッシュ値が既に無効にされたハッシュ値であるか否かを判定し、判定結果を投票処理部224へ出力する。
【0060】
投票処理部224は、原稿画像が予め登録されている登録画像に類似するか否かを判定する文書照合処理を行う場合、無効特徴量判定部223から、特徴量算出部222が算出したハッシュ値が無効ハッシュ値でないとの判定結果を取得したときには、このハッシュ値に基づいて、メモリ227に記憶されたハッシュテーブルを検索する。投票処理部224は、ハッシュ値が一致する場合、該ハッシュ値に登録されているインデックスの原稿(すなわち、ハッシュ値が一致する画像)に投票する。なお、無効特徴量判定部223から、特徴量算出部222が算出したハッシュ値が無効ハッシュ値であるとの判定結果を取得したときには、投票処理部224は、このハッシュ値に基づくハッシュテーブルの検索及び投票を行わない。投票処理部224は、累積加算した得票数を投票結果として類似度判定処理部225へ出力する。
【0061】
類似度判定処理部225は、投票処理部224から入力された投票結果に基づいて、原稿画像(画像、文書画像)がいずれの登録画像に類似するかを判定し、その判定結果、具体的には、類似すると判定された登録画像に対応して、処理(例えば、複写禁止、所定のフォルダに記憶など)の実行が許可されているか否かを示す判定信号を登録処理部226へ出力する。より具体的には、類似度判定処理部225は、投票処理部224から入力された投票数(得票数)を予め定めた閾値と比較し、投票数が閾値以上であれば、入力画像が予め登録された原稿の画像に類似すると判定し、さらに類似と判定された中で最も得票数の高い原稿が一致する原稿であると判定する。
【0062】
予め登録された原稿の画像中に入力画像と一致する画像があると判定した場合、類似度判定処理部225は、類似すると判定された登録画像に対応して処理の実行が許可されている場合、判定信号「1」を登録処理部226へ出力する。一方、類似すると判定された登録画像に対応して処理の実行が許可されていない場合、類似度判定処理部225は、判定信号「0」を登録処理部226へ出力する。なお、類似度判定処理部225は、投票処理部224から入力された投票数が閾値より小さい場合、類似する原稿がないと判定して、その結果(判定信号「0」)を出力する。登録処理部226は、文書照合処理を行う場合、何も処理を行わず、類似度判定処理部225から出力された判定信号をそのまま出力する。
【0063】
図12は投票結果に基づく類似判定の一例を示す説明図である。原稿画像から算出されたハッシュ値毎にハッシュテーブルを検索して投票した結果、原稿ページインデックスがID1、ID2、ID3で示される登録画像に対して投票されたとする。投票の結果、得られたそれぞれの得票数N1、N2、N3が閾値Th以上であるのは、原稿ページインデックスがID1で示される登録画像であるため、原稿画像は、原稿ページインデックスID1の登録画像に類似すると判定される。
【0064】
上記の判定方法は一例であり、別の方法として、例えば、投票処理部224から入力された得票数を原稿画像の最大得票数(特徴点の数×1つの特徴点から算出されるハッシュ値の数で表される)で除算して正規化した類似度を算出し、算出した類似度と予め定めた閾値Th(例えば、0.8)とを比較し、類似度が閾値Th以上である場合には、その類似度が算出された登録画像に類似すると判定し、類似度が閾値Thより小さい場合には、原稿画像に類似する登録画像はないと判定する。
【0065】
なお、図8及び図9には、最も簡単な例として、1つの特徴点から1つのハッシュ値が算出される例を示したが、注目特徴点の周辺の特徴点を選択する方法を変えると、1つの特徴点から複数のハッシュ値を算出することができる。例えば、注目特徴点の周辺の特徴点として6つの特徴点を抽出し、この6つの特徴点から5つの特徴点を抽出する組み合わせは6通り考えられる。そして、この6通りそれぞれについて、5つの特徴点から3つの特徴点を抽出して不変量を求め、ハッシュ値を算出する方法もある。
【0066】
次にカラー画像処理装置2の動作について説明する。図13及び図14は原稿登録処理の手順を示すフローチャートである。なお、原稿登録処理は、文書照合処理部22などの専用のハードウエア回路で構成するだけでなく、CPU、RAM、ROMなどを備えたパーソナルコンピュータに、原稿登録処理の手順を定めたコンピュータプログラムをロードすることによりCPUでコンピュータプログラムを実行させることにより行うこともできる。以下、カラー画像処理装置2を「処理部」という。
【0067】
処理部は、原稿登録モードであるか否かを判定し(S11)、原稿登録モードでない場合(S11でNO)、ステップS21へ処理を移行する。原稿登録モードである場合(S11でYES)、処理部は、登録画像を取得する(S12)。この場合、登録画像は原稿を原稿読取装置で読み取ることにより取得してもよく、あるいは、パーソナルコンピュータ等の処理装置で作成された電子データを受信することにより取得してもよい。
【0068】
処理部は、登録画像の特徴点を算出し(S13)、算出した特徴点に基づいてハッシュ値(特徴量)を算出する(S14)。処理部は、登録画像の原稿ページインデックスを設定し(S15)、ステップS14で算出したハッシュ値が既に無効にされているか否かを判定する(S16)。ハッシュ値が無効にされていないと判定した場合(S16でNO)、処理部は、このハッシュ値に対応して既にハッシュテーブルに登録してある原稿ページインデックスの数が、登録上限数以上であるか否かを判断する(S17)。
【0069】
このハッシュ値に対応して既にハッシュテーブルに登録してある原稿ページインデックスの数が、登録上限数未満であると判断した場合(S17でNO)、処理部は、設定した原稿ページインデックスを、算出したハッシュ値に対応してハッシュテーブルに格納することによりハッシュテーブルを更新する(S18)。このハッシュ値に対応して既にハッシュテーブルに登録してある原稿ページインデックスの数が、登録上限数以上であると判断した場合(S17でYES)、処理部は、このハッシュ値を無効にする(S19)。ハッシュ値が既に無効にされていると判定した場合(S16でYES)、処理部は、ステップS17〜S19の処理をスキップする。
【0070】
処理部は、ステップS14で算出した全てのハッシュ値に対して上述した処理が終了したか否かを判定する(S20)。全てのハッシュ値に対する処理が終了していない場合(S20でNO)、処理部は、ステップS16以降の処理を続け、残りのハッシュ値に対応して原稿ページインデックスをハッシュテーブルに登録する処理、又はハッシュ値を無効にする処理を行う。全てのハッシュ値に対する処理が終了した場合(S20でYES)、処理部は、上述した処理を終了する。
【0071】
一方、ステップS11で原稿登録モードでない場合(S11でNO)、処理部は、原稿画像を取得する(S21)。この場合、原稿画像は原稿を原稿読取装置で読み取ることにより取得してもよく、あるいは、パーソナルコンピュータ等の処理装置で作成された電子データを受信することにより取得してもよい。
【0072】
処理部は、原稿画像の特徴点を算出し(S22)、算出した特徴点に基づいてハッシュ値(特徴量)を算出する(S23)。処理部は、算出したハッシュ値に基づいて、ハッシュテーブルを検索し、同じハッシュ値を有する原稿ページインデックスに対して投票処理を行う(S24)。投票処理の結果に基づいて、処理部は、得票数が閾値Thより大きいか否かを判定する(S25)。得票数が閾値Thより大きい場合(S25でYES)、処理部は、原稿画像が類似する登録画像が、処理の実行が許可された画像であるか否かを判断する(S26)。
【0073】
処理の実行が許可されていると判断した場合(S26でYES)、処理部は、判定信号「1」を出力し(S27)、処理の実行が許可されていないと判断した場合(S26でNO)、判定信号「0」を出力する(S28)。なお、得票数が閾値Thより大きくない場合(S25でNO)、処理部は、判定信号「0」を出力する(S28)。
【0074】
上述の実施の形態において、画像形成装置100としては、ネットワークを介してサーバ装置などに接続するための通信手段としてのモデムなどを備えることもできる。図15は本発明に係る画像処理装置を備えるデジタルカラー複合機500の構成を示すブロック図である。図に示すように、デジタルカラー複合機500は、カラー画像入力装置1、カラー画像処理装置2、カラー画像出力装置3及び操作パネル4のほかに、送信装置5を備えている。カラー画像入力装置1、カラー画像処理装置2、カラー画像出力装置3及び操作パネル4は、上述の画像形成装置100の場合と同様であるので説明は省略する。
【0075】
送信装置5は、例えばモデムにより構成されている。送信装置5は、例えばファクシミリの送信を行う場合、モデムにて、相手先との送信手続きを行い送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリから読み出し、圧縮形式の変更など必要な処理を施して、相手先に通信回線を介して順次送信する。また、送信装置5は、ファクシミリを受信する場合、通信手続きを行いながら相手先から送信されてくる画像データを受信してカラー画像処理装置2へ出力し、カラー画像処理装置2は受信した画像データを、不図示の圧縮/伸張処理部にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理や解像度変換処理が行なわれ、出力階調補正処理、階調再現処理等が施され、カラー画像出力装置3より出力される。
【0076】
なお、送信装置5を、例えば、ネットワークカード、LANケーブル等を介して、ネットワークに接続されたコンピュータ及び他のデジタル複合機等との間でデータ通信を行うように構成してもよい。また、カラー複合機だけでなく、モノクロの画像を扱う複合機、ファクシミリ通信機能のみを有するファクシミリ通信装置単体においても本発明を適用することができる。
【0077】
図16は本発明に係る画像読取装置600の構成を示すブロック図である。図に示すように、画像読取装置600は、カラー画像入力装置1、A/D変換部20、シェーディング補正部21、文書照合処理部22などを備えている。カラー画像入力装置1、A/D変換部20、シェーディング補正部21、文書照合処理部22は、上述の画像形成装置100の場合と同様であるので説明は省略する。
【0078】
以上説明したように、本発明にあっては、例えば、定型フォーム等の原稿をスキャンして電子化文書を生成する場合、予め定型フォームの照合用情報とともに、原稿のページ構成情報を登録しておく。そして、登録画像と原稿画像との類似を判定し、登録画像に類似する原稿画像に対する処理の実行を許可又は禁止することができる。すなわち、利用者が特別な操作を行うことなく、予め処理の実行を禁止するように登録された原稿が読み取られて原稿画像が入力された場合に、この原稿画像に対する処理の実行を禁止することができ、例えば機密文書の複写を防止することができる。
【0079】
なお、原稿画像に対して実行される処理としては、例えば、複写、電子配信、ファクシミリ送信、ファイリングなどの処理があるが、これらに限定されるものではなく、複写、電子配信、ファクシミリ送信、ファイリングする際に、原稿画像全体ではなく原稿画像の一部に対して出力処理の制御を行うこともできる。例えば、定型フォームのうち、重要事項、機密事項などが記載される部分については、複写、電子配信を禁止するように制御することもできる。
【0080】
画像読取装置600が出力する判定信号は、読み込まれた原稿画像とともにネットワークを介してプリンタや複合機に送信され出力される。あるいは、コンピュータを介してプリンタに、もしくは、直接プリンタに入力さる。この場合、プリンタや複合機、コンピュータ側で処理内容を表す信号を判断できるようにしておく必要があるので、判定信号を出力するのではなく、特徴量を出力するようにしても良い。
【0081】
上述の実施の形態において、カラー画像入力装置1としては、例えば、フラットベッドスキャナ、フィルムスキャナ、デジタルカメラ、携帯電話機などが用いられる。なお、カラー画像入力装置1からカラー画像データを取得する代わりに、ネットワークを介して外部記憶装置、サーバ装置などからカラー画像データを取得する構成であってもよい。また、カラー画像出力装置3としては、例えば、CRTディスプレイ、液晶ディスプレイなどの画像表示装置、処理結果を記録紙などに出力する電子写真方式又はインクジェット方式のプリンタなどが用いられる。
【0082】
上述の実施の形態では、文書照合処理部22の中にメモリ227、制御部228を備える構成であるが、これに限定されるものではなく、メモリ227、制御部228を文書照合処理部22の外部に設ける構成であってもよい。
【0083】
本発明はコンピュータに実行させるためのコンピュータプログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータでの読み取り可能な記録媒体に、原稿登録処理及び原稿分類処理等を含む文書照合処理、出力処理の制御を行うコンピュータプログラムコードを記録することもできる。この結果、上記原稿登録処理、原稿分類処理、出力処理の制御を行うコンピュータプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。記録媒体としては、マイクロコンピュータで処理が行われるために図示しないメモリ、例えばROMのようなプログラムメディアであってもよく、図示しない外部記憶装置としてのプログラム読取装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。
【0084】
いずれの場合においても、格納されているコンピュータプログラムコードはマイクロプロセッサがアクセスして実行させる構成であってもよいし、コンピュータプログラムコードを読み出し、読み出されたコンピュータプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのコンピュータプログラムコードが実行される方式であってもよい。この場合、ダウンロード用のコンピュータプログラムは予め本体装置に格納されているものとする。
【0085】
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスク並びにCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にコンピュータプログラムを担持する媒体であってもよい。
【0086】
また、この場合、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからコンピュータプログラムコードをダウンロードするように流動的にコンピュータプログラムコードを担持する媒体であってもよい。なお、このように通信ネットワークからコンピュータプログラムコードをダウンロードする場合には、そのダウンロード用のコンピュータプログラムは予め本体装置に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【図面の簡単な説明】
【0087】
【図1】本発明に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。
【図2】文書照合処理部の構成を示すブロック図である。
【図3】特徴点算出部の構成を示すブロック図である。
【図4】フィルタ処理部のフィルタ係数の例を示す説明図である。
【図5】連結領域の特徴点の例を示す説明図である。
【図6】文字列に対する特徴点の抽出結果の例を示す説明図である。
【図7】注目特徴点と周辺の特徴点を示す説明図である。
【図8】注目特徴点に関する不変量の算出例を示す説明図である。
【図9】注目特徴点に関する不変量の算出例を示す説明図である。
【図10】ハッシュテーブルの構造を示す説明図である。
【図11】ハッシュテーブルの構造を示す説明図である。
【図12】投票結果に基づく類似判定の一例を示す説明図である。
【図13】原稿登録処理の手順を示すフローチャートである。
【図14】原稿登録処理の手順を示すフローチャートである。
【図15】本発明に係る画像処理装置を備えるデジタルカラー複合機の構成を示すブロック図である。
【図16】本発明に係る画像読取装置の構成を示すブロック図である。
【符号の説明】
【0088】
1 カラー画像入力装置
2 カラー画像処理装置
3 カラー画像出力装置
22 文書照合処理部
221 特徴点算出部
222 特徴量算出部
223 無効特徴量判定部
224 投票処理部
225 類似度判定処理部
226 登録処理部
227 メモリ
228 制御部
【特許請求の範囲】
【請求項1】
画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段を備え、入力された原稿画像から特徴量を抽出し、抽出した特徴量及び前記記憶手段に記憶してある登録画像の特徴量に基づいて、前記原稿画像が登録画像に類似するか否かを判定する画像処理方法において、
前記記憶手段に登録画像を登録するに際し、入力された画像から特徴量を抽出するステップと、
抽出した特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断するステップと、
登録画像の数が所定数以上でないと判断した場合、入力された画像を登録画像とし、抽出した特徴量に対応付けて前記記憶手段に登録するステップと、
登録画像の数が所定数以上であると判断した場合、前記特徴量を無効にするステップと、
前記記憶手段に記憶してある登録画像の特徴量のうちで無効にされていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定するステップと
を含むことを特徴とする画像処理方法。
【請求項2】
画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段と、入力された原稿画像から特徴量を抽出する抽出手段と、該抽出手段が抽出した特徴量及び前記記憶手段に記憶してある登録画像の特徴量に基づいて、前記原稿画像が登録画像に類似するか否かを判定する判定手段とを備える画像処理装置において、
前記記憶手段に登録画像を登録するに際し、前記抽出手段は、入力された画像から特徴量を抽出するように構成してあり、
前記抽出手段が抽出した特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断する判断手段と、
該判断手段によって登録画像の数が所定数以上でないと判断された場合、入力された画像を登録画像として前記抽出手段が抽出した特徴量に対応付けて前記記憶手段に登録する手段と、
前記判断手段によって登録画像の数が所定数以上であると判断された場合、前記特徴量を無効にする無効手段とを備え、
前記判定手段は、前記記憶手段に記憶してある登録画像の特徴量のうちで、前記無効手段が無効にしていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定するように構成してあることを特徴とする画像処理装置。
【請求項3】
前記抽出手段は、所定の画像から特徴量を抽出するように構成してあり、
前記無効手段は、所定の画像から前記抽出手段が抽出した特徴量を無効にするように構成してあることを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記無効手段が無効にした特徴量を記憶する無効特徴量記憶手段と、
入力された画像から前記抽出手段が抽出した特徴量が前記無効特徴量記憶手段に記憶されているか否かを判断する手段とを備え、
前記判断手段は、前記特徴量が前記無効特徴量記憶手段に記憶されていない場合、前記特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断するように構成してあることを特徴とする請求項2又は3に記載の画像処理装置。
【請求項5】
前記判定手段は、
入力された原稿画像から前記抽出手段が抽出した特徴量が前記無効特徴量記憶手段に記憶されているか否かを判定する手段と、
前記特徴量が前記無効特徴量記憶手段に記憶されていない場合、前記特徴量に対応する登録画像に投票する手段とを備え、
投票数の多い登録画像が前記原稿画像に類似すると判定するように構成してあることを特徴とする請求項4に記載の画像処理装置。
【請求項6】
請求項2から5までのいずれか一項に記載の画像処理装置と、該画像処理装置で処理された画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする画像形成装置。
【請求項7】
画像を読み取る画像読取手段と、請求項2から5までのいずれか一項に記載の画像処理装置とを備え、前記画像読取手段で読み取った画像を前記画像処理装置で処理するように構成してあることを特徴とする画像読取装置。
【請求項8】
画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段を備えたコンピュータに、入力された原稿画像から特徴量を抽出させ、抽出された特徴量及び前記記憶手段に記憶してある登録画像の特徴量に基づいて、前記原稿画像が登録画像に類似するか否かを判定させるためのコンピュータプログラムにおいて、
コンピュータに、
前記記憶手段に登録画像を登録するに際し、入力された画像から特徴量を抽出するステップと、
抽出した特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断するステップと、
登録画像の数が所定数以上でないと判断した場合、入力された画像を登録画像とし、抽出した特徴量に対応付けて前記記憶手段に登録するステップと、
登録画像の数が所定数以上であると判断した場合、前記特徴量を無効にするステップと、
前記記憶手段に記憶してある登録画像の特徴量のうちで無効にされていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定するステップと
を実行させるためのコンピュータプログラム。
【請求項9】
請求項8に記載のコンピュータプログラムを記録してあることを特徴とするコンピュータでの読み取りが可能な記録媒体。
【請求項1】
画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段を備え、入力された原稿画像から特徴量を抽出し、抽出した特徴量及び前記記憶手段に記憶してある登録画像の特徴量に基づいて、前記原稿画像が登録画像に類似するか否かを判定する画像処理方法において、
前記記憶手段に登録画像を登録するに際し、入力された画像から特徴量を抽出するステップと、
抽出した特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断するステップと、
登録画像の数が所定数以上でないと判断した場合、入力された画像を登録画像とし、抽出した特徴量に対応付けて前記記憶手段に登録するステップと、
登録画像の数が所定数以上であると判断した場合、前記特徴量を無効にするステップと、
前記記憶手段に記憶してある登録画像の特徴量のうちで無効にされていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定するステップと
を含むことを特徴とする画像処理方法。
【請求項2】
画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段と、入力された原稿画像から特徴量を抽出する抽出手段と、該抽出手段が抽出した特徴量及び前記記憶手段に記憶してある登録画像の特徴量に基づいて、前記原稿画像が登録画像に類似するか否かを判定する判定手段とを備える画像処理装置において、
前記記憶手段に登録画像を登録するに際し、前記抽出手段は、入力された画像から特徴量を抽出するように構成してあり、
前記抽出手段が抽出した特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断する判断手段と、
該判断手段によって登録画像の数が所定数以上でないと判断された場合、入力された画像を登録画像として前記抽出手段が抽出した特徴量に対応付けて前記記憶手段に登録する手段と、
前記判断手段によって登録画像の数が所定数以上であると判断された場合、前記特徴量を無効にする無効手段とを備え、
前記判定手段は、前記記憶手段に記憶してある登録画像の特徴量のうちで、前記無効手段が無効にしていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定するように構成してあることを特徴とする画像処理装置。
【請求項3】
前記抽出手段は、所定の画像から特徴量を抽出するように構成してあり、
前記無効手段は、所定の画像から前記抽出手段が抽出した特徴量を無効にするように構成してあることを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記無効手段が無効にした特徴量を記憶する無効特徴量記憶手段と、
入力された画像から前記抽出手段が抽出した特徴量が前記無効特徴量記憶手段に記憶されているか否かを判断する手段とを備え、
前記判断手段は、前記特徴量が前記無効特徴量記憶手段に記憶されていない場合、前記特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断するように構成してあることを特徴とする請求項2又は3に記載の画像処理装置。
【請求項5】
前記判定手段は、
入力された原稿画像から前記抽出手段が抽出した特徴量が前記無効特徴量記憶手段に記憶されているか否かを判定する手段と、
前記特徴量が前記無効特徴量記憶手段に記憶されていない場合、前記特徴量に対応する登録画像に投票する手段とを備え、
投票数の多い登録画像が前記原稿画像に類似すると判定するように構成してあることを特徴とする請求項4に記載の画像処理装置。
【請求項6】
請求項2から5までのいずれか一項に記載の画像処理装置と、該画像処理装置で処理された画像に基づいて出力画像を形成する画像形成手段とを備えることを特徴とする画像形成装置。
【請求項7】
画像を読み取る画像読取手段と、請求項2から5までのいずれか一項に記載の画像処理装置とを備え、前記画像読取手段で読み取った画像を前記画像処理装置で処理するように構成してあることを特徴とする画像読取装置。
【請求項8】
画像の特徴量及び各特徴量を有する登録画像を対応付けて記憶する記憶手段を備えたコンピュータに、入力された原稿画像から特徴量を抽出させ、抽出された特徴量及び前記記憶手段に記憶してある登録画像の特徴量に基づいて、前記原稿画像が登録画像に類似するか否かを判定させるためのコンピュータプログラムにおいて、
コンピュータに、
前記記憶手段に登録画像を登録するに際し、入力された画像から特徴量を抽出するステップと、
抽出した特徴量に対応して前記記憶手段に記憶してある登録画像の数が所定数以上であるか否かを判断するステップと、
登録画像の数が所定数以上でないと判断した場合、入力された画像を登録画像とし、抽出した特徴量に対応付けて前記記憶手段に登録するステップと、
登録画像の数が所定数以上であると判断した場合、前記特徴量を無効にするステップと、
前記記憶手段に記憶してある登録画像の特徴量のうちで無効にされていない特徴量に基づいて、原稿画像が登録画像に類似するか否かを判定するステップと
を実行させるためのコンピュータプログラム。
【請求項9】
請求項8に記載のコンピュータプログラムを記録してあることを特徴とするコンピュータでの読み取りが可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【公開番号】特開2009−87262(P2009−87262A)
【公開日】平成21年4月23日(2009.4.23)
【国際特許分類】
【出願番号】特願2007−259164(P2007−259164)
【出願日】平成19年10月2日(2007.10.2)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】
【公開日】平成21年4月23日(2009.4.23)
【国際特許分類】
【出願日】平成19年10月2日(2007.10.2)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】
[ Back to top ]