画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体
【課題】 本発明は罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【解決手段】 本発明の画像特性判別処理方法によれば、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとする。そして、抽出したランの長さが所定値以上であるランを罫線ランとし、判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする。抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とし、判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別する。次に、判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する。
【解決手段】 本発明の画像特性判別処理方法によれば、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとする。そして、抽出したランの長さが所定値以上であるランを罫線ランとし、判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする。抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とし、判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別する。次に、判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体に関し、詳細には文字認識装置の前処理として罫線や文字を含む認識対象画像の特性を判別する処理方法に関する。
【背景技術】
【0002】
画像の罫線や文字の識別処理は、濃い又はかすれている等の処理対象画像の特性によって識別処理に使用されているアルゴリズムやしきい値が対応できずに識別精度が低下することがある。画像の特性は、スキャナ等の入力装置で入力する時の2値化スレッシュを変更したりすることで、入力画像の濃さなどを補正し識別アルゴリズムに対応した画像特性を得ることは可能である。
【0003】
しかし、一度入力されてしまった2値データに対して、アルゴリズムに合わない特性だからと言って再度入力し直すなどは現実的ではない上に、能率が悪い。罫線や文字識別処理の前処理として、処理画像の特性を把握しその特性の情報を提供することができれば、その情報に対応したアルゴリズムやしきい値などに変更することが可能となり、識別精度を向上させることが可能となる。そこで、特許文献1では、品質を分析する品質分析手段として、かすれ状態、つぶれ状態を分析する手段を有する認識処理装置が提案されている。
【特許文献1】特開平10−154204号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1のような分析では、画像が濃く、つぶれているような場合をつぶれ画像と定義しまうと、つぶれ画像の特徴は文字がつぶれて画像部が太り罫線に接触している場合が多く、更につぶれ画像における実線識別処理においては画像が密で結合しているためにつぶれた文字部に短い実線が誤認識されることが多くなる。
【0005】
本発明はこれらの問題点を解決するためのものであり、罫線や文字の識別精度を向上させるための有益な情報を提供可能な、画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記問題点を解決するために、本発明の画像特性判別処理装置は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、該ラン抽出手段により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、該単独罫線判別手段により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手段と、該つぶれ画像判別手段により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段とを有することに特徴がある。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0007】
また、本発明の画像特性判別処理装置は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、該ラン抽出手段により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、該単独罫線判別手段により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手段と、該かすれ画像判別手段により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段とを有することに特徴がある。よって、接触しない実線を利用してかすれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0008】
更に、別の発明としての画像特性判別処理方法は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、該ラン抽出工程により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、該単独罫線判別工程により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別工程と、該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程とを有することに特徴がある。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0009】
また、別の発明としての画像特性判別処理方法は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、該ラン抽出工程により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、該単独罫線判別工程により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別工程と、該かすれ画像判別工程により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程とを有することに特徴がある。よって、接触しない実線を利用してかすれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0010】
更に、別の発明として、コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、該ラン抽出手順により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、該単独罫線判別手順により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手順と、該つぶれ画像判別手順により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順とを実行させるプログラムに特徴がある。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0011】
また、別の発明として、コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、該ラン抽出手順により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、該単独罫線判別手順により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手順と、該かすれ画像判別手順により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順とを実行させるプログラムに特徴がある。よって、接触しない実線を利用してかすれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0012】
更に、別の発明として、上記記載の画像特性判別処理方法を実行させるためのプログラムを格納したコンピュータ読み取り可能な記憶媒体に特徴がある。よって、既存のシステムを変えることなく、かつ画像特性判別処理システムを構築する装置を汎用的に使用することができる。
【発明の効果】
【0013】
本発明の画像特性判別処理方法によれば、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとする。そして、抽出したランの長さが所定値以上であるランを罫線ランとし、判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする。そして、抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とし、判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別する。次に、判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【発明を実施するための最良の形態】
【0014】
はじめに、本発明における構成及び動作の説明の中で使用する語句を以下に定義しておく。「矩形」とは2値画像データの画像部(例えば黒画素部)を一塊として、それらが接触包含される外接四角形で囲んだ範囲を矩形と定義する。よって、連結する黒画素を全て包含する外接範囲を矩形とする。「矩形抽出」とは矩形の位置座標を抽出することを矩形抽出と定義する。「処理方向」とは画像をX,Yの2次元とすれば、X方向(スキャン時の主走査方向)の処理とY方向(スキャン時の副走査方向)の処理を2方向の処理がある。点線抽出の場合には、点線がX方向に延びている場合とY方向に延びている場合があり、X方向とY方向の2方向でそれぞれ処理を行うものとする。「実線識別処理」の例として、矩形抽出後、着目する矩形を処理開始とし、同ベクトル上でかつ所定の距離内に存在する矩形どうしを結合してゆく処理とする。
【0015】
以下、図を用いて本発明の実施の形態の動作を説明する。
図1は本発明の第1の実施の形態に係る画像特性判別処理方法の全体動作を示すフローチャートである。同図において、先ず、処理のスキャナなどで画像を2値画像入力部で2値化データに変換し、高速化のために圧縮画像を作成する(ステップS101,S102)。ここで、圧縮画像とは1/4圧縮の場合4画素のうち全て白画素であった場合にのみ白画素ひとつに置き換え、4画素中1つでも黒画素が含まれていれば、黒画素ひとつに置き換えるといった圧縮処理をさす。次に、罫線認識処理で罫線を認識する(ステップS103)。抽出された罫線を使ってつぶれ領域候補抽出処理を実行する(ステップS104)。抽出されたつぶれ領域候補の特徴より画像の特性を判別する(ステップS105)。
【0016】
次に、図1のステップ103の処理で共通に用いられる処理、ラン抽出の一例を図2に従って説明する。ラン抽出処理はいずれの方法でもよしとする。ただし、ランの位置情報を提供する処理であることが必要である。また、入力された2値データをそのまま使用するか、処理時間短縮のために圧縮画像データを用いるかのどちらでも自由とする。ただし、本発明では、罫線認識処理の場合には圧縮画像(画素)データを矩形抽出処理の場合にはそのままの2値(画素)データを用いる。図2において、全ライン数を計数し、更に1ライン毎の画素数を計数する(ステップS201,S202)。そして、主走査方向の1ライン毎に黒画素連結を調べてゆき、黒画素の連結が途切れた時に黒画素一塊をランとして登録する(ステップS203;YES、ステップS204)。同様の処理を全ラインに対して繰返す(ステップS205)。
【0017】
また、図1のステップS103での罫線認識処理の一例を図3に従って説明する。罫線認識方法はいずれの方法でもよいが、罫線認識情報として、認識した罫線の位置を示すアドレス情報を提供する処理であることが必要である。ここでは一方向のみの罫線認識の場合であるが、X、Y方向と両方向の罫線認識するには、図3の処理を繰り返せばよい。図3において、図2で抽出されたランの全ての数を計数し、そのランの長さが所定値のA値以上であるかを判定する(ステップS301,S302)。所定値のA値以上であるものを罫線ランとして登録する(ステップS302;YES、ステップS303)。以上の処理を全てのランに対して行う(ステップS304)。次に、その罫線ラン数を計数し、罫線ラン同士が所定値以内に存在しているかを調べて、所定値内であれば罫線として登録する(ステップS305、ステップS306;YES、ステップS307)。同様の処理を全罫線ランの数だけ繰り返す(ステップS308)。
【0018】
更に、図1のステップS104でのつぶれ領域候補抽出処理の一例を図4に従って説明する。図1のステップS103で抽出された全罫線において、全罫線数を計数し、その罫線の長さが所定値のB値以下であるかを判定する(ステップS401,S402)。所定値のB値以下であるのものを短罫線として登録する(ステップS402;YES、ステップS403)。以上の処理を全ての罫線に対して行う(ステップS404)。次に、全短罫線数を計数し、短罫線同士で完全に交差しているものがないかを探索する(ステップS405,S406)。図5の(a)を例にすると、短罫線AとBは接触しているだけでなく完全に交差している。例えば、図5の(c)に示すように交差接触しているだけでは、枠の場合であることがあるために完全に突き抜けて交差していることが条件である。図5の(a)で示すような位置関係にあれば、それを包含する領域を登録する(ステップS406;YES、ステップS407)。次に、図5の(b)で示すように短罫線Cも完全交差していれば、図4のステップS407で登録した領域を成長させる。以上同様の処理を全短罫線に対して実施して領域を抽出する(ステップS408)。
【0019】
次に、図1のステップ105での画像特性判別処理を図6に従って説明する。図1のステップS104で抽出されたつぶれ領域候補は大体文字上で抽出される(図5の(d)参照)。そこで、通常の文字サイズを予測し、あるいは予め、サイズをいずれかの手段を用いて情報として与えておき、それよりも大きい領域の場合には「文字がつぶれて隣どうし接触しあいつながっている状態」であると判別する。従って、図6の抽出された全領域のうち領域面積が所定値のC値以上のものをつぶれ領域として登録する(ステップS501、ステップS502;YES、ステップS503)。以上の処理を全ての領域に対して行う(ステップS504)。ステップS503でつぶれ領域として登録されたものが所定値のD個以上あればつぶれ画像と判別する(ステップS505;YES、ステップS506)。
【0020】
また、図1のステップ105での画像特性判別処理の別の例を図7に従って説明する。図1のステップS104で抽出されたつぶれ領域候補に対して、各領域に包含されている罫線の信頼性を評価し、つぶれ領域であるか否かの判別をする(ステップS601〜S605)ことで、さらに画像特性判別の精度を向上させるものである。例えば図5の(a)を例にとると、罫線AとBが誤認識された罫線であるかの判定を行う。その判定方法はいずれの方式でも可とする。判定方法の一例をあげると、罫線Aの近傍に黒画素を利用し、例えば黒画素密度が高い場合には文字上で誤認識された罫線と判別する。このようにして、つぶれ領域候補を構成する罫線のうち誤認識された罫線の占める割合が所定値Z値以上であればつぶれ領域と判定する(ステップS603;YES)。ステップS604でつぶれ領域として登録されたものが所定値のD個以上あればつぶれ画像と判別する(ステップS606;YES、ステップS607)。
【0021】
また、上記実施の形態ではつぶれ領域候補の面積が文字サイズ以上という条件を判定理由に用いているが、文字サイズが不明であったり、想定した文字サイズが実際の認識対象の文字サイズと異なっていた場合には画像特性の判定精度が悪くなる可能性がある。そこで、全つぶれ領域候補の面積のバラツキを算出(分散値)を用いることでこれを解決する。つまり、抽出されたつぶれ領域候補がバラツキなく一定であれば、つぶれていない一文字一文字上で抽出された領域であると判別できるのである。図8のステップS701でつぶれ領域候補数が所定値のY個以上の場合(ステップS701;YES)、分散値を算出し、所定値のE値以上であれば、つぶれ画像と判別する(ステップS702、ステップS703;YES、ステップS704)。
【0022】
図9は本発明の第2の実施の形態に係る画像特性判別処理方法の全体動作を示すフローチャートである。同図において、先ず、処理のスキャナなどで画像を2値画像入力部で2値化データに変換し、高速化のために圧縮画像を作成する(ステップS801,S802)。次に、罫線認識処理で罫線を認識する(ステップS803)。抽出された罫線を使って罫線特徴判別処理を実行する(ステップS804)。判別された罫線特徴情報を用いて画像の特性を判別する(ステップS805)。
【0023】
図9のステップS803での罫線認識処理の一例を図10に従って説明する。
図9のステップS803で抽出された全罫線を計数し、他の罫線と接触せずに単独に存在しているか否かを判別する(ステップS901,S902)。単独存在していれば単独罫線として登録する(ステップS902;YES、ステップS903)。以上の処理を全ての罫線に対して行う(ステップS904)。次に、単独罫線を計数し、単独罫線を判別された単独罫線周囲近傍の黒画素密度を求めてその値が所定値のG値以上であれば(ステップS905、ステップS906;YES)、つぶれ文字上に誤認識された罫線と判別して罫線として登録していたものを無効化する(ステップS907)。全単独罫線に対して判別処理が終了すれば(ステップS908;YES)、無効化罫線数が所定値のH値以上であれば、つぶれ画像であると判定する(ステップS909;YES、ステップS910)。
【0024】
また、図9のステップS803での罫線認識処理の別の例を図11に従って説明する。図9のステップS803で抽出された全罫線を計数し、他の罫線と接触せずに単独に存在しているか否かを判別する(ステップS1001,S1002)。単独存在していれば単独罫線として登録する(ステップS1002;YES、ステップS1003)。以上の処理を全ての罫線に対して行う(ステップS1004)。次に、単独罫線と判別された罫線に対して、その罫線範囲内を処理対象としてラン抽出処理を行う(ステップS1005,S1006)。その結果、抽出されたランの数が所定値のF値以上であれば、かすれ罫線であると判定して登録する(ステップS107;YES、ステップS1008)。以上の処理を全ての単独罫線に対して行う(ステップS1009)。次に、かすれ罫線と判別された罫線の数が所定値のY値以上であれば、かすれ画像であると判定する(ステップS1010;YES、ステップS1011)。
【0025】
次に、図12は本発明のシステム構成を示すブロック図である。つまり、同図は上記各実施の形態における画像特性判別処理方法によるソフトウェアを実行させるマイクロプロセッサ等から構築されるハードウェアを示すものである。同図において、画像特性判別処理システムはインターフェース(以下I/Fと略す)121、CPU122、ROM123、RAM124、表示装置125、ハードディスク126、キーボード127及びCD−ROMドライブ128を含んで構成されている。また、汎用の処理装置を用意し、CD−ROMなどの読取可能な記憶媒体129には、本発明の画像特性判別処理方法を実行させるプログラムが記録されている。更に、I/F121を介して外部装置から制御信号が入力され、キーボード127によって操作者による指令又は自動的に本発明のプログラムが起動される。そして、CPU122は当該プログラムに従って上述の画像特性判別処理方法を施し、その処理結果をRAM124やハードディスク126等の記録装置に格納し、必要により表示装置125などに出力する。以上のように、本発明の画像特性判別処理方法を実行するプログラムが記憶した媒体を用いることにより、既存のシステムを変えることなく、かつ画像特性判別処理システムを構築する装置を汎用的に使用することができる。
【0026】
なお、本発明は上記実施の形態に限定されるものではなく、特許請求の範囲内の記載であれば多種の変形や置換可能であることは言うまでもない。
【図面の簡単な説明】
【0027】
【図1】本発明の第1の実施の形態に係る画像特性判別処理方法の全体動作を示すフローチャートである。
【図2】第1の実施の形態におけるラン抽出動作の一例を示すフローチャートである。
【図3】第1の実施の形態における罫線認識処理動作の一例を示すフローチャートである。
【図4】第1の実施の形態におけるつぶれ領域候補抽出処理動作の一例を示すフローチャートである。
【図5】第1の実施の形態における画像認識対象の一例を示す図である。
【図6】第1の実施の形態における画像特性判別処理動作の一例を示すフローチャートである。
【図7】第1の実施の形態における画像特性判別処理動作の別の例を示すフローチャートである。
【図8】第1の実施の形態におけるつぶれ領域候補抽出処理動作の別の例を示すフローチャートである。
【図9】本発明の第2の実施の形態に係る画像特性処理方法の全体動作を示すフローチャートである。
【図10】第2の実施の形態における罫線認識処理動作の一例を示すフローチャートである。
【図11】第2の実施の形態における罫線認識処理動作の別の例を示すフローチャートである。
【図12】本発明のシステム構成を示すブロック図である。
【符号の説明】
【0028】
121;I/F、122;CPU、123;ROM、124;RAM、
125;表示装置、126;ハードディスク、127;キーボード、
128;CD−ROMドライブ、129;記憶媒体。
【技術分野】
【0001】
本発明は画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体に関し、詳細には文字認識装置の前処理として罫線や文字を含む認識対象画像の特性を判別する処理方法に関する。
【背景技術】
【0002】
画像の罫線や文字の識別処理は、濃い又はかすれている等の処理対象画像の特性によって識別処理に使用されているアルゴリズムやしきい値が対応できずに識別精度が低下することがある。画像の特性は、スキャナ等の入力装置で入力する時の2値化スレッシュを変更したりすることで、入力画像の濃さなどを補正し識別アルゴリズムに対応した画像特性を得ることは可能である。
【0003】
しかし、一度入力されてしまった2値データに対して、アルゴリズムに合わない特性だからと言って再度入力し直すなどは現実的ではない上に、能率が悪い。罫線や文字識別処理の前処理として、処理画像の特性を把握しその特性の情報を提供することができれば、その情報に対応したアルゴリズムやしきい値などに変更することが可能となり、識別精度を向上させることが可能となる。そこで、特許文献1では、品質を分析する品質分析手段として、かすれ状態、つぶれ状態を分析する手段を有する認識処理装置が提案されている。
【特許文献1】特開平10−154204号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1のような分析では、画像が濃く、つぶれているような場合をつぶれ画像と定義しまうと、つぶれ画像の特徴は文字がつぶれて画像部が太り罫線に接触している場合が多く、更につぶれ画像における実線識別処理においては画像が密で結合しているためにつぶれた文字部に短い実線が誤認識されることが多くなる。
【0005】
本発明はこれらの問題点を解決するためのものであり、罫線や文字の識別精度を向上させるための有益な情報を提供可能な、画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記問題点を解決するために、本発明の画像特性判別処理装置は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、該ラン抽出手段により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、該単独罫線判別手段により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手段と、該つぶれ画像判別手段により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段とを有することに特徴がある。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0007】
また、本発明の画像特性判別処理装置は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、該ラン抽出手段により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、該単独罫線判別手段により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手段と、該かすれ画像判別手段により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段とを有することに特徴がある。よって、接触しない実線を利用してかすれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0008】
更に、別の発明としての画像特性判別処理方法は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、該ラン抽出工程により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、該単独罫線判別工程により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別工程と、該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程とを有することに特徴がある。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0009】
また、別の発明としての画像特性判別処理方法は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、該ラン抽出工程により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、該単独罫線判別工程により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別工程と、該かすれ画像判別工程により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程とを有することに特徴がある。よって、接触しない実線を利用してかすれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0010】
更に、別の発明として、コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、該ラン抽出手順により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、該単独罫線判別手順により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手順と、該つぶれ画像判別手順により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順とを実行させるプログラムに特徴がある。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0011】
また、別の発明として、コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、該ラン抽出手順により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、該単独罫線判別手順により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手順と、該かすれ画像判別手順により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順とを実行させるプログラムに特徴がある。よって、接触しない実線を利用してかすれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0012】
更に、別の発明として、上記記載の画像特性判別処理方法を実行させるためのプログラムを格納したコンピュータ読み取り可能な記憶媒体に特徴がある。よって、既存のシステムを変えることなく、かつ画像特性判別処理システムを構築する装置を汎用的に使用することができる。
【発明の効果】
【0013】
本発明の画像特性判別処理方法によれば、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとする。そして、抽出したランの長さが所定値以上であるランを罫線ランとし、判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする。そして、抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とし、判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別する。次に、判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する。よって、接触しない実線情報よりつぶれ画像特性を判別して、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【発明を実施するための最良の形態】
【0014】
はじめに、本発明における構成及び動作の説明の中で使用する語句を以下に定義しておく。「矩形」とは2値画像データの画像部(例えば黒画素部)を一塊として、それらが接触包含される外接四角形で囲んだ範囲を矩形と定義する。よって、連結する黒画素を全て包含する外接範囲を矩形とする。「矩形抽出」とは矩形の位置座標を抽出することを矩形抽出と定義する。「処理方向」とは画像をX,Yの2次元とすれば、X方向(スキャン時の主走査方向)の処理とY方向(スキャン時の副走査方向)の処理を2方向の処理がある。点線抽出の場合には、点線がX方向に延びている場合とY方向に延びている場合があり、X方向とY方向の2方向でそれぞれ処理を行うものとする。「実線識別処理」の例として、矩形抽出後、着目する矩形を処理開始とし、同ベクトル上でかつ所定の距離内に存在する矩形どうしを結合してゆく処理とする。
【0015】
以下、図を用いて本発明の実施の形態の動作を説明する。
図1は本発明の第1の実施の形態に係る画像特性判別処理方法の全体動作を示すフローチャートである。同図において、先ず、処理のスキャナなどで画像を2値画像入力部で2値化データに変換し、高速化のために圧縮画像を作成する(ステップS101,S102)。ここで、圧縮画像とは1/4圧縮の場合4画素のうち全て白画素であった場合にのみ白画素ひとつに置き換え、4画素中1つでも黒画素が含まれていれば、黒画素ひとつに置き換えるといった圧縮処理をさす。次に、罫線認識処理で罫線を認識する(ステップS103)。抽出された罫線を使ってつぶれ領域候補抽出処理を実行する(ステップS104)。抽出されたつぶれ領域候補の特徴より画像の特性を判別する(ステップS105)。
【0016】
次に、図1のステップ103の処理で共通に用いられる処理、ラン抽出の一例を図2に従って説明する。ラン抽出処理はいずれの方法でもよしとする。ただし、ランの位置情報を提供する処理であることが必要である。また、入力された2値データをそのまま使用するか、処理時間短縮のために圧縮画像データを用いるかのどちらでも自由とする。ただし、本発明では、罫線認識処理の場合には圧縮画像(画素)データを矩形抽出処理の場合にはそのままの2値(画素)データを用いる。図2において、全ライン数を計数し、更に1ライン毎の画素数を計数する(ステップS201,S202)。そして、主走査方向の1ライン毎に黒画素連結を調べてゆき、黒画素の連結が途切れた時に黒画素一塊をランとして登録する(ステップS203;YES、ステップS204)。同様の処理を全ラインに対して繰返す(ステップS205)。
【0017】
また、図1のステップS103での罫線認識処理の一例を図3に従って説明する。罫線認識方法はいずれの方法でもよいが、罫線認識情報として、認識した罫線の位置を示すアドレス情報を提供する処理であることが必要である。ここでは一方向のみの罫線認識の場合であるが、X、Y方向と両方向の罫線認識するには、図3の処理を繰り返せばよい。図3において、図2で抽出されたランの全ての数を計数し、そのランの長さが所定値のA値以上であるかを判定する(ステップS301,S302)。所定値のA値以上であるものを罫線ランとして登録する(ステップS302;YES、ステップS303)。以上の処理を全てのランに対して行う(ステップS304)。次に、その罫線ラン数を計数し、罫線ラン同士が所定値以内に存在しているかを調べて、所定値内であれば罫線として登録する(ステップS305、ステップS306;YES、ステップS307)。同様の処理を全罫線ランの数だけ繰り返す(ステップS308)。
【0018】
更に、図1のステップS104でのつぶれ領域候補抽出処理の一例を図4に従って説明する。図1のステップS103で抽出された全罫線において、全罫線数を計数し、その罫線の長さが所定値のB値以下であるかを判定する(ステップS401,S402)。所定値のB値以下であるのものを短罫線として登録する(ステップS402;YES、ステップS403)。以上の処理を全ての罫線に対して行う(ステップS404)。次に、全短罫線数を計数し、短罫線同士で完全に交差しているものがないかを探索する(ステップS405,S406)。図5の(a)を例にすると、短罫線AとBは接触しているだけでなく完全に交差している。例えば、図5の(c)に示すように交差接触しているだけでは、枠の場合であることがあるために完全に突き抜けて交差していることが条件である。図5の(a)で示すような位置関係にあれば、それを包含する領域を登録する(ステップS406;YES、ステップS407)。次に、図5の(b)で示すように短罫線Cも完全交差していれば、図4のステップS407で登録した領域を成長させる。以上同様の処理を全短罫線に対して実施して領域を抽出する(ステップS408)。
【0019】
次に、図1のステップ105での画像特性判別処理を図6に従って説明する。図1のステップS104で抽出されたつぶれ領域候補は大体文字上で抽出される(図5の(d)参照)。そこで、通常の文字サイズを予測し、あるいは予め、サイズをいずれかの手段を用いて情報として与えておき、それよりも大きい領域の場合には「文字がつぶれて隣どうし接触しあいつながっている状態」であると判別する。従って、図6の抽出された全領域のうち領域面積が所定値のC値以上のものをつぶれ領域として登録する(ステップS501、ステップS502;YES、ステップS503)。以上の処理を全ての領域に対して行う(ステップS504)。ステップS503でつぶれ領域として登録されたものが所定値のD個以上あればつぶれ画像と判別する(ステップS505;YES、ステップS506)。
【0020】
また、図1のステップ105での画像特性判別処理の別の例を図7に従って説明する。図1のステップS104で抽出されたつぶれ領域候補に対して、各領域に包含されている罫線の信頼性を評価し、つぶれ領域であるか否かの判別をする(ステップS601〜S605)ことで、さらに画像特性判別の精度を向上させるものである。例えば図5の(a)を例にとると、罫線AとBが誤認識された罫線であるかの判定を行う。その判定方法はいずれの方式でも可とする。判定方法の一例をあげると、罫線Aの近傍に黒画素を利用し、例えば黒画素密度が高い場合には文字上で誤認識された罫線と判別する。このようにして、つぶれ領域候補を構成する罫線のうち誤認識された罫線の占める割合が所定値Z値以上であればつぶれ領域と判定する(ステップS603;YES)。ステップS604でつぶれ領域として登録されたものが所定値のD個以上あればつぶれ画像と判別する(ステップS606;YES、ステップS607)。
【0021】
また、上記実施の形態ではつぶれ領域候補の面積が文字サイズ以上という条件を判定理由に用いているが、文字サイズが不明であったり、想定した文字サイズが実際の認識対象の文字サイズと異なっていた場合には画像特性の判定精度が悪くなる可能性がある。そこで、全つぶれ領域候補の面積のバラツキを算出(分散値)を用いることでこれを解決する。つまり、抽出されたつぶれ領域候補がバラツキなく一定であれば、つぶれていない一文字一文字上で抽出された領域であると判別できるのである。図8のステップS701でつぶれ領域候補数が所定値のY個以上の場合(ステップS701;YES)、分散値を算出し、所定値のE値以上であれば、つぶれ画像と判別する(ステップS702、ステップS703;YES、ステップS704)。
【0022】
図9は本発明の第2の実施の形態に係る画像特性判別処理方法の全体動作を示すフローチャートである。同図において、先ず、処理のスキャナなどで画像を2値画像入力部で2値化データに変換し、高速化のために圧縮画像を作成する(ステップS801,S802)。次に、罫線認識処理で罫線を認識する(ステップS803)。抽出された罫線を使って罫線特徴判別処理を実行する(ステップS804)。判別された罫線特徴情報を用いて画像の特性を判別する(ステップS805)。
【0023】
図9のステップS803での罫線認識処理の一例を図10に従って説明する。
図9のステップS803で抽出された全罫線を計数し、他の罫線と接触せずに単独に存在しているか否かを判別する(ステップS901,S902)。単独存在していれば単独罫線として登録する(ステップS902;YES、ステップS903)。以上の処理を全ての罫線に対して行う(ステップS904)。次に、単独罫線を計数し、単独罫線を判別された単独罫線周囲近傍の黒画素密度を求めてその値が所定値のG値以上であれば(ステップS905、ステップS906;YES)、つぶれ文字上に誤認識された罫線と判別して罫線として登録していたものを無効化する(ステップS907)。全単独罫線に対して判別処理が終了すれば(ステップS908;YES)、無効化罫線数が所定値のH値以上であれば、つぶれ画像であると判定する(ステップS909;YES、ステップS910)。
【0024】
また、図9のステップS803での罫線認識処理の別の例を図11に従って説明する。図9のステップS803で抽出された全罫線を計数し、他の罫線と接触せずに単独に存在しているか否かを判別する(ステップS1001,S1002)。単独存在していれば単独罫線として登録する(ステップS1002;YES、ステップS1003)。以上の処理を全ての罫線に対して行う(ステップS1004)。次に、単独罫線と判別された罫線に対して、その罫線範囲内を処理対象としてラン抽出処理を行う(ステップS1005,S1006)。その結果、抽出されたランの数が所定値のF値以上であれば、かすれ罫線であると判定して登録する(ステップS107;YES、ステップS1008)。以上の処理を全ての単独罫線に対して行う(ステップS1009)。次に、かすれ罫線と判別された罫線の数が所定値のY値以上であれば、かすれ画像であると判定する(ステップS1010;YES、ステップS1011)。
【0025】
次に、図12は本発明のシステム構成を示すブロック図である。つまり、同図は上記各実施の形態における画像特性判別処理方法によるソフトウェアを実行させるマイクロプロセッサ等から構築されるハードウェアを示すものである。同図において、画像特性判別処理システムはインターフェース(以下I/Fと略す)121、CPU122、ROM123、RAM124、表示装置125、ハードディスク126、キーボード127及びCD−ROMドライブ128を含んで構成されている。また、汎用の処理装置を用意し、CD−ROMなどの読取可能な記憶媒体129には、本発明の画像特性判別処理方法を実行させるプログラムが記録されている。更に、I/F121を介して外部装置から制御信号が入力され、キーボード127によって操作者による指令又は自動的に本発明のプログラムが起動される。そして、CPU122は当該プログラムに従って上述の画像特性判別処理方法を施し、その処理結果をRAM124やハードディスク126等の記録装置に格納し、必要により表示装置125などに出力する。以上のように、本発明の画像特性判別処理方法を実行するプログラムが記憶した媒体を用いることにより、既存のシステムを変えることなく、かつ画像特性判別処理システムを構築する装置を汎用的に使用することができる。
【0026】
なお、本発明は上記実施の形態に限定されるものではなく、特許請求の範囲内の記載であれば多種の変形や置換可能であることは言うまでもない。
【図面の簡単な説明】
【0027】
【図1】本発明の第1の実施の形態に係る画像特性判別処理方法の全体動作を示すフローチャートである。
【図2】第1の実施の形態におけるラン抽出動作の一例を示すフローチャートである。
【図3】第1の実施の形態における罫線認識処理動作の一例を示すフローチャートである。
【図4】第1の実施の形態におけるつぶれ領域候補抽出処理動作の一例を示すフローチャートである。
【図5】第1の実施の形態における画像認識対象の一例を示す図である。
【図6】第1の実施の形態における画像特性判別処理動作の一例を示すフローチャートである。
【図7】第1の実施の形態における画像特性判別処理動作の別の例を示すフローチャートである。
【図8】第1の実施の形態におけるつぶれ領域候補抽出処理動作の別の例を示すフローチャートである。
【図9】本発明の第2の実施の形態に係る画像特性処理方法の全体動作を示すフローチャートである。
【図10】第2の実施の形態における罫線認識処理動作の一例を示すフローチャートである。
【図11】第2の実施の形態における罫線認識処理動作の別の例を示すフローチャートである。
【図12】本発明のシステム構成を示すブロック図である。
【符号の説明】
【0028】
121;I/F、122;CPU、123;ROM、124;RAM、
125;表示装置、126;ハードディスク、127;キーボード、
128;CD−ROMドライブ、129;記憶媒体。
【特許請求の範囲】
【請求項1】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、
該ラン抽出手段により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、
該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、
該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、
該単独罫線判別手段により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手段と、
該つぶれ画像判別手段により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段と
を有することを特徴とする画像特性判別処理装置。
【請求項2】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、
該ラン抽出手段により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、
該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、
該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、
該単独罫線判別手段により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手段と、
該かすれ画像判別手段により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段と
を有することを特徴とする画像特性判別処理装置。
【請求項3】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、
該ラン抽出工程により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、
該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、
該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、
該単独罫線判別工程により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別工程と、
該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程と
を有することを特徴とする画像特性判別処理方法。
【請求項4】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、
該ラン抽出工程により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、
該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、
該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、
該単独罫線判別工程により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別工程と、
該かすれ画像判別工程により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程と
を有することを特徴とする画像特性判別処理方法。
【請求項5】
コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、
該ラン抽出手順により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、
該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、
該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、
該単独罫線判別手順により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手順と、
該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順と
を実行させるプログラム。
【請求項6】
コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、
該ラン抽出手順により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、
該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、
該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、
該単独罫線判別手順により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手順と、
該かすれ画像判別手順により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順と
を実行させるプログラム。
【請求項7】
請求項5又は6に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
【請求項1】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、
該ラン抽出手段により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、
該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、
該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、
該単独罫線判別手段により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手段と、
該つぶれ画像判別手段により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段と
を有することを特徴とする画像特性判別処理装置。
【請求項2】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、
該ラン抽出手段により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、
該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、
該罫線抽出手段により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手段と、
該単独罫線判別手段により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手段と、
該かすれ画像判別手段により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段と
を有することを特徴とする画像特性判別処理装置。
【請求項3】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、
該ラン抽出工程により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、
該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、
該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、
該単独罫線判別工程により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別工程と、
該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程と
を有することを特徴とする画像特性判別処理方法。
【請求項4】
光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、
該ラン抽出工程により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、
該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、
該罫線抽出工程により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別工程と、
該単独罫線判別工程により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別工程と、
該かすれ画像判別工程により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程と
を有することを特徴とする画像特性判別処理方法。
【請求項5】
コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、
該ラン抽出手順により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、
該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、
該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、
該単独罫線判別手順により判別された単独罫線を計数し、単独罫線周辺近傍の黒画素密度を求め、求めた黒画素密度が所定値以上であればつぶれ文字上に誤認識された無効化罫線と判別し、当該無効化罫線の数が所定値以上であればつぶれ画像であると判別するつぶれ画像判別手順と、
該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順と
を実行させるプログラム。
【請求項6】
コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、
該ラン抽出手順により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、
該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、
該罫線抽出手順により抽出された全罫線を計数し、他の罫線と接触せずに単独で存在する罫線を単独罫線とする単独罫線判別手順と、
該単独罫線判別手順により判別された単独罫線を含む領域内を処理対象とするラン抽出処理を施し、抽出したランの数が所定値以上であればかすれ罫線であると判別し、当該かすれ罫線の数が所定値以上であればかすれ画像であると判別するかすれ画像判別手順と、
該かすれ画像判別手順により判別されたかすれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順と
を実行させるプログラム。
【請求項7】
請求項5又は6に記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2008−117418(P2008−117418A)
【公開日】平成20年5月22日(2008.5.22)
【国際特許分類】
【出願番号】特願2007−329762(P2007−329762)
【出願日】平成19年12月21日(2007.12.21)
【分割の表示】特願2001−43145(P2001−43145)の分割
【原出願日】平成13年2月20日(2001.2.20)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
【公開日】平成20年5月22日(2008.5.22)
【国際特許分類】
【出願日】平成19年12月21日(2007.12.21)
【分割の表示】特願2001−43145(P2001−43145)の分割
【原出願日】平成13年2月20日(2001.2.20)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
[ Back to top ]