説明

画像処理装置および画像処理プログラム

【課題】 文字判別精度を向上させる。
【解決手段】 画像処理装置は、画像データを入力するイメージリーダ部と、入力された画像データからエッジ画素を抽出するエッジ判別部210と、エッジ画素を連結してエッジ領域を抽出するエッジ連結部230と、画素の明度が周辺の画素の明度よりも低い画素で構成される内側領域を抽出する内外判定部220と、エッジ領域でなく内側領域の参照領域を抽出し、エッジ領域かつ内側領域の領域を参照領域に隣接しないことを条件に文字領域と判定する文字検出部240とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、画像処理装置および画像処理プログラムに関し、特に、画像データから文字領域を抽出するのに適した画像処理装置および画像処理プログラムに関する。
【背景技術】
【0002】
従来、複写機などでは、原稿をスキャナなどで読取って、得られた画像データを画像処理して、紙に画像を形成する。この画像処理は、画質を向上させる処理が含まれる。通常、画像処理は、文字が表された領域、写真が表された領域など、その画像の属性により異なる処理を施すことが、画質を向上させるためになされている。このため、画像処理をする前の段階で、画像データのうちから属性別に領域を抽出する領域抽出処理がなされる。
【0003】
文字の表された文字領域を抽出する方法としては、画像データからエッジを抽出し、抽出されたエッジに基づいて、文字領域を抽出することがなされている。しかしながら、文字には、文字の明度が背景の明度よりも低い通常文字と、文字の明度と背景の明度を反転させた反転文字(いわゆる白抜き文字)とがある。通常文字を抽出する方法を、反転文字に適用すれば背景部分が文字領域として抽出されてしまう。このため、画像データから反転文字を抽出しておき、通常文字と反転文字とを別々に処理することがなされている(たとえば、特開平9−269970号公報、特開平11−161739号公報)。
【0004】
しかしながら、画像データから反転文字を抽出しなければ、通常文字を抽出することができないといった問題があった。
【特許文献1】特開平9−269970号公報
【特許文献2】特開平11−161739号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
この発明は上述した問題点を解決するためになされたもので、この発明の目的の1つは、文字判別精度を向上させた画像処理装置および画像処理プログラムを提供することである。
【課題を解決するための手段】
【0006】
上述した目的を達成するためにこの発明のある局面によれば、画像処理装置は、画像データを入力する画像データ入力手段と、入力された画像データからエッジ画素を抽出するエッジ判別手段と、エッジ画素を連結してエッジ領域を抽出するエッジ連結手段と、画素の明度が周辺の画素の明度よりも低い画素で構成される内側領域を抽出する内外判定手段と、エッジ領域でなく内側領域の参照領域を抽出する参照領域抽出手段と、エッジ領域かつ内側領域の領域を参照領域に隣接しないことを条件に文字領域と判定する判定手段とを含む。
【0007】
この発明に従えば、エッジ領域の内側領域を文字領域として抽出するので、通常文字を抽出することができる。エッジ領域かつ内側領域の領域を参照領域に隣接しないことを条件に文字領域と判定するので、白抜き文字の周辺に発生する下地部分が文字領域として誤って抽出されるのを防止し、文字判別精度を向上させた画像処理装置を提供することができる。
【0008】
好ましくは、判定手段は、エッジ領域かつ内側領域の領域が参照領域に隣接する場合、エッジ領域かつ内側領域の領域のうちエッジ画素を文字領域と判定する。
【0009】
この発明に従えば、白抜き文字の輪郭を文字領域として抽出することができる。
【0010】
好ましくは、判定手段は、エッジ領域かつ内側領域の文字領域を抽出する文字領域抽出手段と、文字領域として抽出された領域のうち参照領域に隣接する領域を文字領域としない取消手段と含む。
【0011】
この発明の他の局面によれば、画像処理プログラムは、画像データを入力するステップと、入力された画像データからエッジ画素を抽出するステップと、エッジ画素を連結してエッジ領域を抽出するステップと、画素の明度が周辺の画素の明度よりも低い画素で構成される内側領域を抽出するステップと、エッジ領域でなく、内側領域の参照領域を抽出するステップと、エッジ領域かつ内側領域の領域を参照領域に隣接しないことを条件に文字領域と判定するステップとをコンピュータに実行させる。
【0012】
この発明に従えば、エッジ領域の内側領域を文字領域として抽出するので、通常文字を抽出することができる。また、白抜き文字の周辺に発生する下地部分が文字領域として誤って抽出されるので防止し、文字判別精度を向上させた画像処理プログラムを提供することができる。
【発明を実施するための最良の形態】
【0013】
以下、図面を参照しつつ本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
【0014】
<第1の実施の形態>
図1は、本発明の第1の実施の形態における画像処理装置が適用されるカラー複写機の概略構成を示す模式的断面図である。図1を参照して、カラー複写機100は、原稿から画像データを読取るイメージリーダ部101と、画像処理装置10と、用紙上に画像を印刷するプリンタ部102とから構成されている。
【0015】
イメージリーダ部101の原稿台103上に載置された原稿は、スキャナ104の備える露光ランプ105により照射される。スキャナ104は、スキャナモータ112により矢印方向に移動して原稿全体を走査する。原稿面からの反射光は、ミラー106〜108および集光レンズを介してCCD110上に像を結ぶ。CCD110は、原稿面からの反射光をRGBの色データ(アナログ信号)に変換して画像処理装置10に出力する。CCD110が画像処理装置10に出力する色データを、画像データという。
【0016】
画像処理装置10は、CCD110から入力される画像データに所定の画像処理を施してレーザ装置113にデジタル信号を出力する。
【0017】
ここで画像処理装置10からレーザ装置113に出力されるデジタル信号は、シアン用の画像色データCと、マゼンタ用の画像色データMと、イエロー用の画像色データYと、ブラック用の画像色データKである。レーザ装置113は、入力された画像色データC,M,Y,Kに基づいて、シアン、マゼンタ、イエロー、ブラックそれぞれの感光体ドラム115C,115M,115Y,115Kにレーザビームを出力する。
【0018】
プリンタ部102において、レーザ装置113から出力されるレーザビームは、帯電チャージャ114C,114M,114Y,114Kによって帯電された感光体ドラム115C,115M,115Y,115Kを露光し、静電潜像を形成する。シアン、マゼンタ、イエロー、およびブラックの4色の現像器116C,116M,116Y,116Kにより、感光体ドラム115C,115M,115Y,115K上の静電潜像が現像される。
【0019】
一方、無端ベルト130は、駆動ローラ133Aと固定ローラ133B,133C,133Dとにより弛まないように懸架されている。駆動ローラ133Aが図中で反時計回りに回転すると、無端ベルト130が所定速度で図中で反時計回りに回転する。
【0020】
給紙カセット120〜122より適当な用紙が搬送され、タイミングローラ131から無端ベルト130に用紙が供給される。無端ベルト130に供給された用紙は、無端ベルト130上に担持され、図中で左方向に搬送される。これにより、用紙がシアン、マゼンタ、イエロー、ブラックの順に感光体ドラム115C,115M,115Y,115Kと接触する。用紙がそれぞれの感光体ドラム115C,115M,115Y,115Kと接触したときに、感光体ドラムと対をなす転写チャージャ117C,117M,117Y,117Kにより感光体ドラム上に現像されたトナー像が用紙に転写される。
【0021】
トナー像が転写された用紙は、定着ローラ対132により加熱される。これにより、トナーは溶かされて用紙に定着する。その後、用紙はプリンタ部102から排出される。
【0022】
図2は、第1の実施の形態における画像処理装置の機能を示す機能ブロック図である。図を参照して、画像処理装置10には、イメージリーダ部101から出力される画像データが入力される。画像処理装置10は、画像データを、画像の属性に応じた領域に分割する領域判別部200と、画像の属性に応じで画像データに所定の処理を実行する画像処理部300とを含む。
【0023】
画像の属性に応じた領域には、文字が表された文字領域、網点が表された網点領域を含む。領域判別部200は、画像データ中から網点領域、文字領域および写真領域を抽出する。そして、抽出した領域情報を画像処理部300に出力する。また、領域判別は、文字領域および網点領域に限られず、たとえば、グラフや図形が表されたベタ画像を含む図形領域等を判別するようにしてもよい。
【0024】
画像処理部300は、画像データに対して、領域判別部200により判別された領域に応じた画像処理を実行する。画像処理には、スムージング処理、エッジ強調処理が含まれる。より具体的には、文字領域の画像データにはエッジ強調処理を実行し、網点領域の画像データは、スムージング処理を実行する。また、網点領域中に文字が表されている場合には、文字のエッジ部分に対してエッジ強調処理を実行する。
【0025】
本実施の形態における画像処理部300は、文字領域を判別する精度を向上させたものである。特に、文字の明度が背景の明度よりも高い、いわゆる白抜き文字を含む画像から文字領域を抽出する精度を向上させたものである。したがって、ここでは、領域判別部200が画像データから領域を判別する処理のうち、文字領域を判別する処理について具体的に説明する。
【0026】
図3は、領域判別部のハード構成の一部を示すブロック図である。図4は、反転文字を含む画像データとそれを処理した処理画像との一例を示す図である。図5は、通常文字を含む画像データとそれを処理した処理画像との一例を示す図である。以下、領域判別部200を、図3〜図5を用いて説明する。
【0027】
領域判別部200は、画像データの各画素がエッジか否かを判別するためのエッジ判別部210と、エッジと判別された画素を周辺の画素と連結するエッジ連結部230と、画像データの各画素が文字の内側に存在する画素か外側に存在する画素かを検出するための内外判定部220と、文字検出部240とを含む。文字検出部240は、文字取消部250を含んでいる。
【0028】
領域判別部200に入力される画像データは、R、G,B信号に基づき生成される明度信号である。図4(A)は、反転文字を含む画像データを示す図である。反転文字「IL」の明度は、反転文字を除く背景部(図中斜線部分)の明度よりも高い。図5(A)は、通常文字を含む画像データを示す図である。ここでは、比較のために図5(A)に示した反転文字「IL」と同じ通常文字(図中斜線部分)を示している。通常文字「IL」の明度は、通常文字を除く背景部の明度よりも低い。
【0029】
エッジ判別部210は、1次微分フィルタ処理回路211と、それに接続された比較器212と、2次微分フィルタ処理回路213と、それに接続された比較器214と、比較器212,214に接続された論理和回路(OR)215とを備えている。
【0030】
1次微分フィルタ処理回路211は、予め準備された1次微分フィルタを用いて、画像データの画素ごとにそれの画素値と周辺の画素の画素値とから1次微分値を算出する。そして、算出した1次微分値の絶対値を比較器212に出力する。比較器212は、入力された1次微分値の絶対値を予め定められたしきい値EDGEREF1と比較する。比較器212は、1次微分値の絶対値がしきい値EDGEREF1よりも大きければ「1」、大きくなければ「0」となる論理信号をOR215に出力する。1次微分フィルタは、注目画素と周辺画素との画素値から明度の変化量を算出するためのフィルタである。1次部分フィルタは、方向性を有する複数の1次微分フィルタを用いても良い。この場合は、方向性を有する1次微分フィルタごとに、1次微分フィルタ処理回路211および比較器212を用いればよい。
【0031】
2次微分フィルタ処理回路213は、予め準備された2次微分フィルタを用いて、画像データの画素ごとにそれの画素値と周辺の画素の画素値とから2次微分値を算出する。そして、算出した2次微分値の絶対値を比較器214に出力する。比較器214は、入力された2次微分値の絶対値を予め定められたしきい値EDGEREF2と比較する。比較器214は、2次微分値の絶対値がしきい値EDGEREF2よりも大きければ「1」、大きくなければ「0」となる論理信号をOR215に出力する。2次微分フィルタは、注目画素と周辺画素との明度の変化の度合いを算出するためのフィルタである。2次部分フィルタは、方向性を有する複数の2次微分フィルタを用いても良い。この場合は、方向性を有する2次微分フィルタごとに、2次微分フィルタ処理回路211および比較器212を用いればよい。
【0032】
OR215は、比較器212,214それぞれから入力される論理信号の論理和を出力する。すなわち、エッジ判別部210は、画像データの各画素について、その画素がエッジの場合に「1」となり、エッジでない場合に「0」となる2値のエッジ信号を出力する。ここでのエッジには、内エッジと外エッジとが含まれる。背景が白で文字が黒色の場合、外エッジは文字に接する白色の部分であり、内エッジは白色の背景に接する黒色の部分である。以下、エッジ判別部210でエッジと判別された画素をエッジ画素という。
【0033】
図4(B)は、図4(A)に示す画像データから抽出されるエッジ画像を示す図である。図5(B)は、図5(A)に示す画像データから抽出されるエッジ画像を示す図である。図4(B)および図5(B)において、135度斜線のハッチングを付したエッジ画素は外エッジのエッジ画素を示し、45度斜線のハッチングが付されたエッジ画素は内エッジを示している。図4(B)と図5(B)とで、エッジ画素の位置は同じであるが、内エッジと外エッジが逆になる。
【0034】
図3に戻って、エッジ連結部230は、エッジ判別部210からエッジ画素を「1」とし他の画素を「0」とする2値の信号が入力される。エッジ連結部230は、この2値の信号から隣接するエッジ画素を連結して、エッジ画素とエッジ画素の間にある画素をエッジ画素とする。このため、エッジ連結部230は、拡張処理部231と、収縮処理部232とを含む。拡張処理部231は、エッジ画素の周辺の画素をエッジ画素とする。周辺の画素の範囲は、予め定めておけばよい。エッジ画素を周辺の画素にまで拡張することにより、隣接する2つ以上のエッジ画素の間では、それぞれのエッジ画素から拡張されてエッジ画素とされる画素が存在する場合がある。その結果、エッジ判別部210で文字を構成する線の輪郭がエッジと判別され、拡張処理部231でその線を構成するエッジ画素以外の画素がエッジ画素とされる。
【0035】
一方、拡張処理部231により文字を構成する線の外側にもエッジ画素が拡張されてしまうので、線幅を元に戻すために収縮処理部232でエッジ画素を収縮する。収縮処理部232では、拡張処理部231で周辺の画素にまで拡張されたエッジ画素の集合のうち周辺のエッジ画素を所定の個数だけ収縮する。所定の個数は、拡張処理部231でエッジ画素を拡張した画素数に等しい。エッジ連結部230は、エッジ画素を「1」とし、他の画素を「0」とする2値のエッジ領域信号を文字検出部240に出力する。
【0036】
なお、拡張処理部231および収縮処理部232を設けることなく、2つのエッジ画素の間の距離が所定の範囲内であれば、2つのエッジ画素の間の画素をエッジ画素とすることによってエッジ画素を連結するようにしてもよい。
【0037】
図4(C)は、図4(B)に示したエッジ画像をエッジ連結した後のエッジ領域を示す図である。図5(C)は、図5(B)に示したエッジ画像をエッジ連結した後のエッジ領域を示す図である。図中斜線部分がエッジ領域を示す。エッジ領域は、エッジ画素の集合である。図4(C)に示すエッジ領域と、図5(C)に示すエッジ領域とは同じ位置にエッジ画素を含む。
【0038】
内外判定部220は、画像データが入力され、ダイナミックレンジ算出部221と、しきい値算出部222と、比較器223とを含む。入力される画像データは、R、G,B信号に基づき生成される明度信号である。ダイナミックレンジ算出部221は、画像データの画素ごとに、その画素とその周辺の画素との画素値からダイナミックレンジを算出する。具体的には、エッジ連結部230で用いたマトリクスサイズよりも大きなサイズのマトリクスを用いて、処理対象画素とその周辺のマトリクス内の画素の画素値の最大値と最小値とを算出する。そして、算出したダイナミックレンジをしきい値算出部222に出力する。
【0039】
しきい値算出部222は、入力されたダイナミックレンジの中間値をしきい値に設定する。そして、設定したしきい値を比較器223に出力する。なお、ダイナミックレンジの中間値に代えて、上記マトリクスに含まれる画素の値の平均値を用いるようにしても良い。
【0040】
比較器223は、処理対象となる画素の値と、その画素に対応して算出されたしきい値とが入力される。比較器223は、画素値がしきい値より小さい場合にその画素を文字の内側の画素と判定し、その画素に対応する値が「1」の内信号を出力する。比較器223は、画素値がしきい値より小さくない場合にその画素を文字の外側の画素と判定し、その画素に対応する値が「0」の内信号を出力する。すなわち、内外判定部220は、処理対象画素が、通常文字の内側に存在する画素か外側に存在する画素かを判定し、内側に存在する画素と判定した場合には「1」、外側に存在する画素と判定した場合には「0」となる2値の信号を文字検出部240に出力する。このため、エッジ画素のうち内エッジは、文字の内側に存在する画素と判定され、外エッジは文字の外側に存在する画素と判定される。
【0041】
図4(D)は、図4(A)に示す画像データから生成される内信号を示す図である。図中斜線部分は値が「1」の画素を示し、他の部分は値が「0」の画素を示す。ここでは、値が「1」の斜線部分を内側領域という。内側領域は、図4(B)に示すエッジのうち内エッジを含むが、外エッジは含まない。このため、図4(A)に示す斜線部分から内エッジを削除した部分が、内側領域である。図5(D)は、図5(A)に示す画像データから生成される内側領域を示す図である。図中斜線部分は内信号が「1」の画素を示し、他の部分は内信号が「0」の画素を示す。内信号が「1」の内側領域は、図5(B)に示すエッジのうち内エッジを含むが、外エッジは含まない。図5(A)に示す斜線部分と同じ画素が内側領域とされる。
【0042】
文字検出部240は、エッジ連結部230からエッジ領域信号が入力され、内外判定部220から内信号が入力される。文字検出部240は、論理積回路(AND)241,243と、文字取消信号を出力する文字取消部250と、反転回路(NOT)242とを含む。
【0043】
AND241は、エッジ領域信号と内信号との論理積を出力する。エッジ領域信号と内信号との論理積は、エッジ領域に含まれる画素であって、文字の内側に存在する画素は「1」となり、他の画素は「0」となる。このため、通常文字であれば文字を構成する画素を「1」とし、他の画素を「0」とする信号となる。図5(E)は、図5(C)に示すエッジ領域に含まれ、かつ、図5(D)に示す内側領域に含まれる文字領域を示す図である。図5(A)に示した画像データに含まれる通常文字「IL」を構成する画素が文字領域に含まれる。
【0044】
一方、反転文字の場合は、通常文字の場合と異なる。図4(E)は、図4(C)に示すエッジ領域に含まれ、かつ、図4(D)に示す内側領域に含まれる文字領域を示す図である。図4(E)では、文字領域は斜線のハッチングが付された領域で示される。文字領域は、エッジ画素のうち内エッジに含まれる画素と、文字「I]と文字「L」との間の画素とが含まれる。この斜線が付された画素は、通常文字ではなく、誤って文字として検出された領域である。この誤って検出された文字領域をここでは、誤判別領域という。文字検出部240は、この誤判別領域を取消すために、文字取消部250を備えている。
【0045】
文字取消部250は、反転回路(NOT)251と、論理積回路(AND)252,254と、FIFOバッファ(FIFO)255と、参照部256と、論理和回路(OR)253とを含む。
【0046】
文字取消部250は、エッジ連結部230からエッジ領域信号が入力され、内外判定部220から内信号が入力される。NOT251は、エッジ領域信号が入力され、エッジ領域信号を反転した信号をAND252に出力する。AND252は、NOT251からエッジ領域信号を反転した信号と、内信号とが入力され、両者の論理積をOR253に出力する。論理積回路252が出力する信号は、エッジ領域に含まれない画素であって、内側領域に含まれる画素を「1」とし、他の画素を「0」とする2値の信号である。ここでは、エッジ領域でなく内側領域となる領域を参照領域といい、AND252が出力する信号を参照信号という。図4(F)は、参照領域を示す図である。図中の斜線で示す領域が参照領域を示す。通常文字を含む画像データを処理する場合は、参照領域は抽出されない。内側領域と、エッジ領域とが一致するか、内側領域がエッジ領域に含まれるからである。本実施の形態における文字取消部250は、通常文字を含む画像データからは抽出されることのない参照領域を抽出することによって、誤判別領域を文字領域としないようにする。
【0047】
ここで、図4(E)および図4(F)を参照して、図4(E)に示す誤判別領域は、図4(F)に示す参照領域に接している。これを利用して誤判別領域を文字領域としないように取消信号を生成する。
【0048】
AND252が出力する参照信号は、OR253に出力される。OR253については後述するが、AND252が出力する参照信号が「1」の場合、すなわち、処理対象画素が図4(F)に示す参照領域にある場合には、AND254に信号「1」が出力される。AND254は、内信号とOR253が出力する信号が出力される。図4(D)および図4(F)を参照して、反転文字の場合、処理対象画素が図4(F)に示す参照領域(参照信号が「1」)にあれば、図4(D)に示す内側領域(内信号が「1」)にあるので、この場合AND254の出力は「1」となる。AND254が出力する信号は、取消信号である。この取消信号は、FIFO255に格納されるとともに、参照部256に出力される。
【0049】
FIFO255は、1ライン分の取消信号を記憶するための先入先出メモリである。FIFO255は、1ライン分の画素の取消信号を記憶する容量を有すれば十分であるが、これより多くの取消信号を格納するようにしても良い。
【0050】
一方、参照部256は、AND254の出力(取消信号)が入力される。AND254は、バッファを有しており、AND254の出力を1画素分記憶する。このバッファに記憶されるのは、直前に処理対象とされた画素に対応する取消信号である。また、参照部156は、FIFO2255から順に取消信号を読み出す。この取消信号もまた、参照部156が有するバッファに記憶される。このようにバッファには、処理対象画素に対応する参照画素の取消信号が記憶される。
【0051】
図6は、参照マトリクスの一例を示す図である。図6を参照して、参照マトリクスは、処理対象画素をハッチングしたマスで示し、他のマスが参照画素を示す。
【0052】
参照画素は、処理対象画素との相対的な位置で定まる。参照画素は、処理対象画素の近傍に位置する画素である。好ましくは、処理対象画素に隣接する画素である。ここでは、画像データの画素を順に走査して処理対象画素を定めているので、参照画素は文字取消部250で処理済の画素に限られる。
【0053】
図6(A)は、参照マトリクスを示す第1の図である。図6(A)に示す参照マトリクスは、参照画素を、処理対象画素と同一ラインで直前に処理対象画素であった画素と、処理対象画素より1つ前のラインで、処理対象画素に隣接する3つの画素としている。処理対象画素と同一ラインの参照画素は、直前に処理対象とされていた画素であり、この画素の取消信号は、AND254から入力され、参照部256が有するバッファに記憶される。処理対象画素より1つ前のラインで処理対象画素に隣接する3つの参照画素の取消信号は、FIFO255から順に読み出され、参照部256が有するバッファに記憶される。
【0054】
図6(B)は、参照マトリクスを示す第2の図である。図6(B)に示す参照マトリクスは、図6(A)に示した参照マトリクスで定義される参照画素に加えて、処理対象画素より1つ前のラインにおいて、処理対象画素よりも走査方向に2画素分遅延した画素が追加されている。ここでは、処理対象画素よりも走査方向に2画素分遅延した画素を追加しているが、n画素(nは2以上の自然数)分遅延した画素を追加してもよい。好ましくは、nは3以下である。このように参照画素を定義するのは、画像データを走査して処理することによる。本実施の形態においては、画像データを、左から右に走査し、1ラインの走査が終了すると下のラインを走査するようにしている。このため、図6(B)の参照マトリクスは、例えば反転文字が右上がりの斜線部分(「/」)を含む場合に適している。
【0055】
参照部256は、参照画素のいずれか1つでも取消信号が「1」の場合には「1」の信号をOR253に出力し、参照画素のすべてで取消信号が「0」の場合には「0」の信号をOR253に出力する。上述したように、AND252では、処理対象画素が参照領域にある場合には、値が「1」の取消信号をFIFO255に格納した。したがって、参照部256は、処理対象画素が参照領域にない場合(AND252の出力が「0」の場合)であっても、処理対象画素が参照領域に隣接する場合に、値が「1」の信号を出力する。値が「1」の信号がOR253に出力されると、AND254で処理対象画素が内側領域にあれば、値が「1」の取消信号がFIFO255に格納されるとともに、参照部256に出力される。
【0056】
したがって、参照部256は、処理対象画素が参照領域に隣接しない場合であっても、参照画素のいずれか1つで取消信号の値が「1」の場合には、その処理対象画素について値が「1」の取消信号を出力する。このため、参照部256は、処理対象画素が参照領域になく、かつ、処理対象画素が参照領域に隣接しない場合であっても、参照画素のいずれか1つでも取消信号が「1」の場合には「1」の信号をOR253に出力し、参照画素のすべてで取消信号が「0」の場合には「0」の信号をOR253に出力する。
【0057】
すなわち、文字取消部250では、処理対象画素が内側領域であって、参照領域に隣接する場合、または、処理対象画素に隣接する参照画素が文字領域であったものを取消された画素である場合に、値が「1」の取消信号を出力する。また、文字取消部250では、AND254で処理対象画素が内側領域にあることを条件に、値が「1」の取消信号を出力する。このため、AND254は、値が「1」の取消信号がいつまでも出力され続けるのを停止させる。具体的には、画像データを走査するので、処理対象画素が内側領域から外側領域となる。処理対象画素が、内側領域にある場合に値が「1」の取消信号が出力されていた場合に、処理対象画素が外側領域となった時点で、値が「0」の取消信号が出力される。このため、次に、処理対象画素が、内側領域でかつ参照領域に隣接する条件、または、処理対象画素が、内側領域でかつ文字領域であったものを取消された画素に隣接する条件のいずれかが成立するまで、文字領域の判定が取消されることなく、有効とされる。
【0058】
文字取消部250は、AND241が出力する文字領域に含まれる画素の値を「1」とし、他の画素の値を「0」とする文字領域信号を、取消すための取消信号をNOT242に出力する。取消信号は、文字領域信号を取消す場合に「1」となり、取消さない場合に「0」となる信号であった。このため、取消信号をNOT242で反転して、AND242に入力する。AND243では、文字信号と、取消信号を反転した信号が入力され、それらの論理積を出力する。AND243は、AND241から値が「1」の文字信号が出力され、文字取消部250から値が「0」の取消信号が出力された場合に、値が「1」となり、他の場合に「0」となる2値の文字領域信号を出力する。したがって、AND243では、AND241から値が「1」の文字信号が出力され、文字取消部250から値が「1」の取消信号が出力された場合に、値が「0」の文字領域信号を出力するので、誤って文字領域と誤判別された結果を取消すことができる。具体的には、図4(E)に示した、反転文字を含む画素データから抽出された文字領域のすべてを取消すことができる。
【0059】
<領域判別部の変形例>
上述した文字取消部250では、処理対象画素が内側領域であって、参照領域に隣接する場合、または、隣接する画素が文字領域であったものを取消された画素である場合に、値が「1」の取消信号を出力するようにした。このため、図4(E)に示した文字領域のすべてを取消すものであった。変形された文字取消部250Aでは、処理対象画素が内エッジである場合には、取消さないようにするものである。
【0060】
図7は、領域判別部のハード構成の一部を示す別のブロック図である。図7を参照して、領域判別部200Aが、図3に示した領域判別部200と異なるところは、文字取消部250AにNOT257とAND258とが追加された点である。その他の構成は領域判別部200と同様なのでここでは説明を繰返さない。
【0061】
NOT257には、エッジ判別部210からエッジ信号が入力される。NOT257は、エッジ信号を反転した信号をAND258に出力する。すなわち、NOT257は、処理対象画素がエッジ画素の場合に「0」となり、エッジ画素でない場合に「1」となる2値の信号を出力する。AND258は、エッジ信号を反転した信号と、AND254から取消信号が入力され、両信号の論理積を出力する。すなわち、AND258は、取消信号が「1」の場合で、かつ、処理対象画素がエッジ画素の場合に「1」となり、他の場合に「0」となる信号を出力する。
【0062】
このため、図4(E)に示す文字領域のうち、内エッジ以外の領域のみが取消されて、内エッジの画素は取消されない。したがって、反転文字の輪郭部分を文字領域として抽出することができる。なお、抽出された文字領域の線幅が細い場合には、線幅を拡張する処理をすればよい。
【0063】
以上説明したように、第1の実施の形態における画像処理装置10では、反転文字の場合にのみ存在する参照領域を抽出し、その参照領域に隣接する文字領域を文字領域から削除するので、誤って文字領域と誤判別された反転文字を取消すことができる。
【0064】
さらに、変形された文字取消部では、文字領域のうちエッジ画素を文字領域から取消さないので、反転文字の輪郭部分を文字領域として抽出することができる。
【0065】
<第2の実施の形態>
次に第2の実施の形態における画像処理装置について説明する。図8は、第2の実施の形態におけるプリントシステムの全体概要を示す図である。図8を参照して、画像処理装置2は、複合機1(以下、「MFP1」という)とネットワーク3を介して接続される。
【0066】
画像処理装置2は、一般的なパーソナルコンピュータである。そのハード構成は周知であるので、ここでは説明を繰返さない。画像処理装置2は、CD−ROM等の記録媒体5に記録された画像処理プログラムを読出し、CPU(Central Processing Unit)で実行
する。
【0067】
一般的にこうした画像処理プログラムは、CD−ROMなどの記録媒体5に格納されて流通し、画像処理装置2が備えるCD−ROMドライブなどにより記録媒体5から読取られてハードディスクに一旦格納される。さらにハードディスクからランダムアクセスメモリ(RAM)に読出されてCPUにより実行される。
【0068】
記録媒体5としては、CD−ROM、ハードディスクに限られず、フレキシブルディスク、カセットテープ、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、ICカード(メモリカードを含む)、光カード、マスクROM、EPROM、EEPROM、フラッシュROMなどの半導体メモリ等の固定的にプログラムを担持する記録媒体でもよい。
【0069】
ここでいう画像処理プログラムは、CPUにより直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む概念である。
【0070】
MFP(Multi Function Peripheral)1は、原稿を読取るためのスキャナ、画像デー
タに基づいて紙などの記録媒体に画像を形成するための画像形成装置、ファクシミリを含み、画像読取機能、複写機能、ファクシミリ送受信機能を備えている。
【0071】
ネットワーク3は、ローカルエリアネットワーク(LAN)、インターネットまたは一般公衆回線であり、有線または無線を問わない。また、ここではネットワーク3でMFP1と画像処理装置2とが接続される例を示すが、MFP1と画像処理装置2とはシリアル回線またはパラレル回線を用いて接続するようにしてもよい。
【0072】
画像処理装置2では、MFP1で原稿を読取って得られた画像データを受信し、後述する画像処理を実行する。画像処理装置2が画像処理を実行する対象は、MFP1から受信する画像データに係わらず、記録媒体5に記録された画像データ、ネットワーク3を介して他のコンピュータから受信された画像データであってもよい。さらに、デジタルスチルカメラやデジタルビデオカメラ等で撮影して得られた画像データを、それらから受信するようにしてもよい。
【0073】
画像処理装置2は、画像データに対して領域判別処理を実行し、判別された領域に応じた画像処理を実行する。画像処理には、スムージング処理、エッジ強調処理が含まれる。以下、画像処理装置2で実行される文字領域判別処理について説明する。ここでは、説明のため、図4(A)に示す反転文字を含む画像データと、図5(A)に示す通常文字を含む画像データとが入力されるそれぞれの場合を比較して説明する。
【0074】
図9は、第2の実施の形態における画像処理装置で実行される文字領域判別処理の流れを示すフローチャートである。図9を参照して、画像処理装置2は、画像データが入力される(ステップS01)。入力された画像データは、R、G,B信号で構成されるが、画像処理装置2は、これら3つの信号から1つの明度信号を生成する。入力される画像データは、図4(A)に反転文字を含む画像データの一例が示され、図5(A)に通常文字を含む画像データの一例が示される。
【0075】
ステップS02では、入力された画像データからエッジ画素を抽出する。エッジ画素の抽出は、予め準備された1次微分フィルタを用いて、画像データの画素ごとにそれの画素値と周辺の画素の画素値とから1次微分値を算出し、算出した1次微分値の絶対値が所定の値より大きければ、エッジ画素として抽出する。また、予め準備された2次微分フィルタを用いて、画像データの画素ごとにそれの画素値と周辺の画素の画素値とから2次微分値を算出し、算出した2次微分値の絶対値が所定の値より大きければ、エッジ画素として抽出する。これにより、内エッジに含まれるエッジ画素と外エッジに含まれるエッジ画素とが抽出される。このステップS02により、図4(A)に示す反転文字を含む画像データから図4(B)に示すエッジ画素が抽出され、図5(A)に示す通常文字を含む画像データから図5(B)に示すエッジ画素が抽出される。
【0076】
次のステップS03では、抽出されたエッジ画素を連結してエッジ領域が抽出される。エッジ画素の連結は、2つのエッジ画素の間の距離が所定の範囲内であれば、2つのエッジ画素の間の画素をエッジ画素とすることにより行われる。そして、隣接するエッジ画素の集合がエッジ領域として抽出される。
【0077】
次のステップS04では、画像データから内側領域が抽出される。内側領域の抽出は、画像データの各画素を処理対象画素に設定し、その処理対象画素とその周辺の画素との画素値からダイナミックレンジを算出し、算出したダイナミックレンジの中間値を、処理対象画素の値と比較する。処理対象画素の値が、しきい値より小さい場合にその処理対象画素を内側領域の画素と判定し、しきい値以上の場合に処理対象画素を外側領域と判定する。このため、エッジ画素のうち内エッジは、文字の内側に存在する画素と判定され、外エッジは文字の外側に存在する画素と判定される。
【0078】
図4(A)に示す画像データから抽出された内側領域が図4(D)に示され、図5(A)に示す画像データから抽出された内側領域が図5(D)に示される。図中斜線部分が内側領域を示す。
【0079】
そして、ステップS05で文字領域が抽出される。文字領域は、エッジ領域と内側領域の2つの領域に含まれる領域をいう。したがって、ステップS03で抽出されたエッジ領域に含まれ、かつ、ステップS04で抽出された内側領域に含まれる画素が抽出される。そして、抽出された画素で構成される文字領域が抽出される。
【0080】
図4(C)に示すエッジ領域に含まれ、かつ、図4(D)に示す内側領域に含まれる文字領域が図4(E)に示される。図5(C)に示すエッジ領域に含まれ、かつ、図5(D)に示す内側領域に含まれる文字領域が図5(E)に示される。図4(E)を参照して、文字領域は、エッジ画素のうち内エッジの画素を含み、文字の間の領域を含む。斜線が付された画素は、文字ではなく、誤って検出されることになる。この誤って検出された文字領域をここでは、誤判別領域という。
【0081】
次に、誤判別領域を取消すために、参照領域が抽出される(ステップS06)。参照領域は、内側領域であるがエッジ領域でない領域をいう。このため、ステップS03で抽出したエッジ領域と、ステップS04で抽出した内側領域とから参照領域を抽出する。図4(F)は、図4(C)に示すエッジ領域と、図4(D)に示す内側領域とから抽出した参照領域を示す図である。ここで、図4(E)および図4(F)を参照して、図4(E)に示す誤判別領域は、図4(B)に示す参照領域に接している。これを利用して誤判別領域を文字領域としないように取消信号を生成する。
【0082】
次のステップS07では、ステップS06で参照領域が抽出されたか否かが判断される。参照領域が抽出された場合にはステップS08に進み、抽出されていない場合には処理を終了する。通常文字の場合には、内側領域がエッジ領域に含まれるので、参照領域が抽出されることはない。参照領域は、反転文字の場合に限って抽出される。
【0083】
ステップS08では、参照領域に接する文字領域を取消領域として抽出する。ステップS05で抽出された文字領域のうち、ステップS06で抽出された参照領域に接する文字領域が取消領域とされる。図4(E)に示す文字領域は、そのすべてが取消領域とされる。
【0084】
そして、文字領域から取消領域が削除される(ステップS09)。ここでは、図4(E)に示す文字領域と、取消領域とが等しいので、図4(E)に示す文字領域がすべて削除される。
【0085】
<領域判別処理の変形例>
上述した文字領域抽出処理では、参照領域に隣接する文字領域を文字領域から削除するようにした。このため、図4(E)に示した文字領域のすべてが削除された。変形された文字領域抽出処理では、文字領域のうちエッジ画素は、文字領域から削除しないようにしたものである。
【0086】
図10は、第2の実施の形態における画像処理装置で実行される文字領域判別処理の別の流れを示すフローチャートである。図10を参照して、ステップS11〜ステップS17までの処理は、図9に示した領域判別処理のステップS01〜ステップS07までの処理と同様であるので、ここでは説明を繰返さない。
【0087】
ステップS17で参照領域が抽出されたと判断した場合、ステップS18において、参照領域に接する文字領域を候補領域として抽出する。候補領域は、文字領域の削除する領域の候補となる領域である。ステップS15で抽出された文字領域のうち、ステップS16で抽出された参照領域に接する文字領域が候補領域とされる。図4(E)に示す文字領域は、そのすべてが取消領域とされる。
【0088】
そして、次のステップS19では、エッジでない候補領域を取消領域として抽出する。ステップS18で抽出された候補領域のうちエッジ画素でない領域が取消領域とされる。図4(E)に示す文字領域が候補領域とされ、その候補領域から図4(B)に示す内エッジのエッジ画素を除いた領域が取消領域とされる。
【0089】
そして、次のステップS20では、文字領域から取消領域が削除される。その結果、図4(B)に示す内エッジのエッジ画素が文字領域とされる。
【0090】
以上説明したように、第2の実施の形態における画像処理装置2では、反転文字の場合にのみ存在する参照領域を抽出し、その参照領域に隣接する文字領域を文字領域から削除するので、誤って文字領域と誤判別された反転文字を取消すことができる。
【0091】
変形された領域抽出処理では、文字領域のうちエッジ画素は削除されないので、反転文字の輪郭部分を文字領域として抽出することができる。
【0092】
(1) 上述した画像処理装置10は、
画像データが入力されるデータ入力手段と、
画像データに含まれる処理対象画素がエッジ画素か否かを判別するエッジ判別手段と、
エッジ画素を連結してエッジ領域を抽出し、エッジ領域に含まれる画素をエッジ画素とするエッジ連結手段と、
処理対象画素が、周辺の画素の明度よりも低い明度の画素で構成される内側領域に含まれるか否かを判定する内外判定手段と、
処理対象画素が、前記エッジ画素と判別され、かつ前記内側領域に含まれると判別されることを条件に文字領域に含まれる画素と判別する文字判別手段と、
処理対象画素が、前記エッジ画素でなく前記内側領域に含まれる場合に該処理対象画素に対応する取消信号を記憶する記憶手段と、
前記文字判別手段により文字領域に含まれる画素と判別された処理対象画素の近傍に位置する参照画素に対応する取消信号を前記記憶手段より読出し、前記参照画素の少なくとも1つが取消信号を有する場合、前記文字判別手段により文字領域に含まれる画素と判別された結果を取消す取消手段とを備え、
前記記憶手段は、前記取消手段により判別結果を取消された処理対象画素に対応する取消信号をさらに記憶する。
【0093】
(2) (1)において、前記取消手段は、前記処理対象画素が前記内側領域に含まれることをさらに条件として、前記文字判別手段により文字領域に含まれる画素と判別された結果を取消す。
【0094】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【図面の簡単な説明】
【0095】
【図1】本発明の第1の実施の形態における画像処理装置が適用されるカラー複写機の概略構成を示す模式的断面図である。
【図2】第1の実施の形態における画像処理装置の機能を示す機能ブロック図である。
【図3】領域判別部のハード構成の一部を示すブロック図である。
【図4】反転文字を含む画像データとそれを処理した処理画像との一例を示す図である。
【図5】通常文字を含む画像データとそれを処理した処理画像との一例を示す図である。
【図6】参照マトリクスの一例を示す図である。
【図7】領域判別部のハード構成の一部を示す別のブロック図である。
【図8】第2の実施の形態におけるプリントシステムの全体概要を示す図である。
【図9】第2の実施の形態における画像処理装置で実行される文字領域判別処理の流れを示すフローチャートである。
【図10】第2の実施の形態における画像処理装置で実行される文字領域判別処理の別の流れを示すフローチャートである。
【符号の説明】
【0096】
10 画像処理装置、200,200A 領域判別部、210 エッジ判別部、211 1次微分フィルタ処理回路、213 2次微分フィルタ処理回路、220 内外判定部、221 ダイナミックレンジ算出部、222 値算出部、223 比較器、230 エッジ連結部、231 拡張処理部、232 収縮処理部、240 文字検出部、250,250A 文字取消部、256 参照部、300 画像処理部。

【特許請求の範囲】
【請求項1】
画像データを入力する画像データ入力手段と、
入力された前記画像データからエッジ画素を抽出するエッジ判別手段と、
エッジ画素を連結してエッジ領域を抽出するエッジ連結手段と、
画素の明度が周辺の画素の明度よりも低い画素で構成される内側領域を抽出する内外判定手段と、
前記エッジ領域でなく前記内側領域の参照領域を抽出する参照領域抽出手段と、
前記エッジ領域かつ前記内側領域の領域を前記参照領域に隣接しないことを条件に文字領域と判定する判定手段とを含む、画像処理装置。
【請求項2】
前記判定手段は、前記エッジ領域かつ前記内側領域の領域が前記参照領域に隣接する場合、前記エッジ領域かつ前記内側領域の領域のうちエッジ画素を文字領域と判定する、請求項1に記載の画像処理装置。
【請求項3】
前記判定手段は、前記エッジ領域かつ前記内側領域の文字領域を抽出する文字領域抽出手段と、
前記文字領域として抽出された領域のうち前記参照領域に隣接する領域を文字領域としない取消手段と含む、請求項1に記載の画像処理装置。
【請求項4】
画像データを入力するステップと、
入力された前記画像データからエッジ画素を抽出するステップと、
エッジ画素を連結してエッジ領域を抽出するステップと、
画素の明度が周辺の画素の明度よりも低い画素で構成される内側領域を抽出するステップと、
前記エッジ領域でなく、前記内側領域の参照領域を抽出するステップと、
前記エッジ領域かつ前記内側領域の領域を前記参照領域に隣接しないことを条件に文字領域と判定するステップとをコンピュータに実行させる、画像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2006−202221(P2006−202221A)
【公開日】平成18年8月3日(2006.8.3)
【国際特許分類】
【出願番号】特願2005−15897(P2005−15897)
【出願日】平成17年1月24日(2005.1.24)
【出願人】(303000372)コニカミノルタビジネステクノロジーズ株式会社 (12,802)
【Fターム(参考)】