説明

帳票認識方法および帳票認識装置

【課題】 文字や罫線の色が不定で、かつ文字色に濃淡や色の変動がある状況において、文字の画素のみを残し、その他の色の画素をドロップアウトする。
【解決手段】 入力された画像の画素を色クラスタリングして、クラスタ内の画素数から背景と文字の色を求める。画像中の色の分布から文字色の代表値を検出し、文字色の変動幅を考慮して文字色の画素を選択することにより、2値画像を生成する。また、文字の色以外の罫線などのノイズがある場合には、文字とノイズとを弁別して、ノイズをドロップアウトした文字の2値画像を生成する。2つのドロップアウト画像を用いて文字認識を行い、認識スコアが高い方を出力する。2つのドロップアウト方法による2値画像に対して文字認識することで、色むらがある場合と、罫線などのノイズがある場合の両方に対して、認識精度を向上することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、OCR(Optical Character Reader:光学式文字読取装置)等の画像の処理技術に関し、特に文字の色に濃淡差があり、除去対象の色が文字色と同系色の場合などに、文字の色のみを残すドロップアウト技術に関する。
【背景技術】
【0002】
カラー画像から白黒2値画像を生成する2値化処理は、帳票OCRの前処理として基本的な処理である。帳票にはプレ印刷と呼ばれる予め印刷された罫線や文字があり、読取対象の文字を認識する際の障害となる。したがって、帳票画像の2値化処理でプレ印刷部分を消去、すなわち白化する処理は、読取の精度向上のために必須の機能である。色情報を用いたプレ印刷の白化はカラードロップアウトと呼ばれる。
【0003】
カラードロップアウト処理の代表的な従来技術として、特許文献1には、カラー画像を撮像し、RBGの3つの色のうち、ノイズ成分の輝度が最も高くなる色を選択した後、その色における画素の濃淡値を用いて2値化する方式が記載されている。また、特許文献2には、帳票ごとに異なる押印色とプレ印刷色に対応するため、押印の文字色を推定した後、文字色のみを抽出する方式が記載されている。また、その他の方法として、ノイズ成分として赤系もしくは青系のいずれかを指定し、ノイズ成分と同系色の光源で撮像した画像を文字認識に用いる方法がある。例えば、文字が黒で罫線が赤い帳票を赤系の光源で撮像すると、罫線部分が画像に現れなくなる。青系でも同様である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−196592号公報
【特許文献2】特開2010−244372号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
カラードロップアウト処理が必要な帳票の例として、領収伝票がある。領収伝票には罫線や文字等のプレ印刷があり、活字文字や手書き文字が記載され、入出金の証明として日付印が押印されている。このうち、日付印の文字を読取るには、カラードロップアウト処理において通常の記載文字とは異なる課題がある。日付印のインク色は帳票ごとに赤や青、黒など異なるうえ、多様な色や形状のプレ印刷との交差が多く発生する。
【0006】
さらに、日付印のインクの付け方や押し方の影響により、日付印内の文字は、帳票に記載される通常の文字に比べて濃淡差が大きい。そのうえ、日付印はプレ印刷と同系色のインクで押印されることも多い。文字の濃淡差と同系色のプレ印刷は二律背反の関係にある。通常、文字色の濃淡差を許容するには、文字の薄い箇所を抽出するために、ドロップアウトの閾値を下げる。これはノイズ成分なども同時に抽出する可能性があるため、プレ印刷との分離を困難にする。一方、同系色のプレ印刷をドロップアウトするには、閾値を厳しくすることになり、濃淡差が大きな文字を抽出できない。
【0007】
特許文献1に記載の方法では、文字とプレ印刷が異なる色であることを前提としているため、文字とプレ印刷が同系色の場合には適用できない。また、特許文献2に記載の方法では、ドロップアウトの閾値を動的に求めているものの、濃淡差が大きな文字と同系色の罫線が混在する場合には対応できない。また、ノイズ成分として赤系もしくは青系のいずれかを指定し、ノイズ成分と同系色の光源で撮像した画像を文字認識に用いる方法では、押印色やプレ印刷色が異なる帳票が混在する場合には適用できない。
【0008】
上述したような従来技術における問題点に鑑み、本発明の目的は、色むらが大きい場合に対するドロップアウトにおいて、インクの量が薄い画素の文字を正しく抽出すること、さらに、文字の周辺にプレ印刷が存在する帳票と、文字の濃淡差が大きな帳票が混在しても、適切にドロップアウトして文字認識することにある。
【0009】
ここで「色むら」とは、例えば日付印を帳票等に押印する際に、文字等の色がインクの量や力の加減等により、滲んだりかすれたりして、濃淡差が大きい状態をいう。
【課題を解決するための手段】
【0010】
本発明に係る画像処理方法では、処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、処理対象画像を入力するステップと、処理対象画像の画素を色クラスタリングするステップと、色クラスタリングに基づいて背景色を選択するステップと、処理対象画像の画素から押印色を選択するステップと、処理対象画像の画素を色空間変換するステップと、処理対象画像の画素から色むら対応用の濃淡画像生成するステップと、濃淡画像の傾きを補正するステップと、傾き補正した濃淡画像を2値化するステップを有する。
【発明の効果】
【0011】
本発明における、文字成分色とノイズ成分色が不定である帳票に対するドロップアウトでは、色むらが大きい場合でも、正しく文字色を残すことができる。このため、日付文字列も正しく抽出することができる。
【図面の簡単な説明】
【0012】
【図1】本発明の実施形態の画像処理装置の構成図である。
【図2】従来の実施形態のドロップアウト処理の概略を示す図である。
【図3】本発明の実施形態のドロップアウト処理の概略を示す図である。
【図4】本発明の実施形態の押印日付読取りの処理の一例を示す図である。
【図5】本発明の実施形態の色むら対応用2値画像を出力するドロップアウト処理を示すフローチャートである。
【図6】本発明の実施形態の押印色選択処理を示すフローチャートである。
【図7】従来の押印色選択におけるドロップアウト処理により日付印がドロップアウトしてしまう例を示す図である。
【図8】本発明の実施形態の円周色選択処理を示すフローチャートである。
【図9】本発明の実施形態の押印色決定処理を示すフローチャート。
【図10】本発明の実施形態の色むら対応用の濃淡画像生成処理を示すフローチャートである。
【図11】日付印の色相頻度分布と日付印色相許容範囲の概略を示す図である。
【図12】本発明の実施形態の押印色が無彩色の場合の注目する画素における色むら対応用画素分類の判定処理を示すフローチャートである。
【図13】本発明の実施形態の押印色が有彩色の場合の注目する画素における色むら対応用画素分類の判定処理を示すフローチャートである。
【図14】本発明の実施形態の2値化処理の概略を示す図である。
【図15】本発明の実施形態の押印日付読取りの第2の処理を示すフローチャートである。
【図16】本発明の実施形態のプレ印刷・地紋除去用2値画像を出力するドロップアウト処理を示すフローチャートである。
【図17】本発明の実施形態のプレ印刷・地紋除去用の濃淡画像生成処理を示すフローチャートである。
【図18】本発明の実施形態の押印色が無彩色の場合の注目する画素におけるプレ印刷・地紋除去用画素分類の判定処理を示すフローチャートである。
【図19】本発明の実施形態の押印色が有彩色の場合の注目する画素におけるプレ印刷・地紋除去用画素分類の判定処理を示すフローチャートである。
【図20】本発明の実施形態の日付印が同系色の罫線の上に押印した場合の罫線除去有無による2値画像出力結果の概略を示す図である。
【図21】本発明の実施形態の押印日付読取りの第3の処理を示すフローチャートである。
【図22】本発明の実施形態の色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するドロップアウト処理を示すフローチャートである。
【図23】本発明の実施形態の押印日付読取りの第4の処理を示すフローチャートである。
【図24】本発明の実施形態の押印日付読取りの第5の処理を示すフローチャートである。
【図25】本発明の実施形態の押印日付読取りの第6の処理を示すフローチャートである。
【図26】本発明の実施形態の押印日付読取りの第7の処理を示すフローチャートである。
【図27】本発明の実施形態の押印日付読取りの第8の処理を示すフローチャートである。
【図28】本発明の実施形態の押印日付読取り結果の確認および修正するユーザーインタフェースの第1の例を示す図である。
【図29】本発明の実施形態の押印日付読取り結果の確認および修正するユーザーインタフェースの第2の例を示す図である。
【図30】本発明の実施形態の押印日付読取り結果の確認および修正するユーザーインタフェースの第3の例を示す図である。
【発明を実施するための形態】
【0013】
<第一の実施形態>
本発明の実施形態を、図面を用いて説明する。なお、本発明は、以下の説明によって限定されるものではない。
【0014】
図1は、本発明の実施形態の帳票認識システムの構成を示す図である。帳票認識システムは、入力装置10、画像入力装置20、画像処理装置30、辞書40、表示装置50、及び画像データベース(DB)60を備える。入力装置10は、画像処理装置30にコマンド及びコードデータ等を入力するためのキーボード及びマウス等の装置である。画像入力装置20は、帳票を画像データとして、画像処理装置30に入力するためのスキャナ等の装置である。画像処理装置30は、画像入力装置20によって入力された帳票の読み取り領域を検出してドロップアウト処理をする計算機であって、図示しないCPU、メモリ、及び記憶装置を備える。画像処理装置では、ドロップアウト画像の文字認識などの処理も実行することができる。辞書40は、画像処理装置30が帳票を認識する際に参照する辞書データベースである。辞書40は、具体的には、画像処理装置30が文字認識する際に参照する文字認識辞書や、文字列照合を行う際に参照する知識辞書や、帳票の読み取り領域を検出する際に参照する帳票情報等を格納する。表示装置50は、画像処理装置30によって帳票が認識された結果を表示するディスプレイ等の装置である。画像DB60は、画像入力装置20によって画像処理装置30に入力された画像データを格納する。また、画像DB60には、画像入力装置20によって画像処理装置30が認識する対象となる画像データが予め格納されていてもよい。
【0015】
なお、本発明は、画像処理装置30と同じ機能を備えるソフトウェアによって通常の計算機に実装されてもよい。
【0016】
本発明で実現するドロップアウト方式の具体例を示す前に、従来のドロップアウトの処理結果の概要を図2に、本発明の色むら対応の処理結果の概要を図3にそれぞれ示す。
【0017】
図2は,例えば特許文献2に示すような従来のドロップアウトの処理結果の概要を示す図である。図2(a)はプレ印刷の上に色むらがほぼなく一様に押印された入力画像である。201は処理対象の領域、202は色むらがなく一様に押された日付印、203は帳票上の罫線等のプレ印刷や地紋を表す。図2(a)の入力画像から押印色以外のプレ印刷や地紋の色をドロップアウトすることにより、押印の色成分204のみが残ったカラードロップアウト画像(図2(b))が生成される。図2(b)のカラードロップアウト画像から傾き等の画像補正、2値化、日付行抽出を行うと、日付行成分205のみの日付行2値画像(図2(c))が生成される。
【0018】
図2(d)は色むらがある入力画像である。処理対象領域206内の日付印207は薄い画素208や濃い画素209があり,日付印全体としては色むらが大きい。この図2(d)の入力画像に対してドロップアウトを行うと,薄い画素が押印色でないと判定されるため,薄い画素がドロップアウトされて濃い画素210のみが残ったカラードロップアウト画像(図2(e))が生成される。図2(e)のカラードロップアウト画像から傾き等の画像補正、2値化、日付行抽出を行うと、日付の一部が欠落した日付行成分211のみの日付行2値画像(図2(f))が生成される。
【0019】
このように、従来のドロップアウトでは、色むらが大きい場合に文字成分が欠落してしまうという問題があった。ここで、本発明の第1の課題は、このような色むらが大きい場合に対してもドロップアウトによって成分が欠落することなく正しく日付文字行を抽出することである。これを実現するために、本発明における課題の解決策についての概要を説明する。詳細については図4以降で説明する。
【0020】
(1)押印色選択:従来方式では、背景色の次に多い画素数のクラスタを押印色とするため,処理対象領域に対してプレ印刷や地紋色の画素数が日付印色の画素数より多い場合に,プレ印刷や地紋色を押印色としてしまうことがある。本発明では、まず、日付印の円周付近の画素の色のみで色クラスタリングを行い、背景色とは近くなく、最も頻度が多いクラスタを円周色として選択する。次に、押印の中の領域で色クラスタリングを行い、この結果のクラスタの中で、ある程度の頻度があり、かつ円周色に最も近いクラスタの色を押印色とする。この方法により、プレ印刷や地紋の色を押印色に誤選択しないようにできる。
【0021】
(2)カラードロップアウト:従来方式では、画素のRGB情報だけなくHSV色空間も用いてプレ印刷や地紋をドロップアウトするための閾値が厳しいため、色むらが大きい場合には押印のインク色が薄い個所の画素がドロップアウトして欠落してしまう。本発明では、処理対象領域内の色相の頻度分布からRGB情報とこれを変換したHSY色空間において、色相や彩度や輝度の許容範囲を動的に求めることで、色むらが大きい場合であっても、文字色を残すことができる。
【0022】
(3)2値化:従来方式では、色むらが大きい場合には,押印のインク色が薄い個所の画素が白画素となり欠落してしまい,文字がかすれたりする。本発明では、日付行領域内の部分領域ごとに2値化閾値を求めて2値化すると,押印のインク色が薄い画素が多い部分領域においては,薄い画素も黒画素化することができ、部分領域ごとに2値化した全ての2値画像の論理和の2値画像を生成することで日付行領域の2値画像は,色むらが大きい場合であっても,文字の欠落を抑制できる。
【0023】
図3は、本発明の色むら対応のドロップアウトの処理結果の概要を示す図である。図3(a)は,図2(d)と同じ色むらがある入力画像である。色むら対応のカラードロップアウトでは,薄い画素302もドロップアウトせず残ったカラードロップアウト画像(図3(b))が生成される。図3(b)のカラードロップアウト画像から傾き等の画像補正、色むら対応の2値化、日付行抽出を行うと、文字成分が欠落しない日付行成分302日付行2値画像(図3(c))が生成される。
【0024】
図3(d)は図2(a)と同じプレ印刷の上に色むらがほぼなく一様に押印された入力画像である。この図3(d)の入力画像に色むら対応のカラードロップアウトを行うと,プレ印刷の罫線や文字303も残ったカラードロップアウト画像(図3(e))が生成される。図3(e)のカラードロップアウト画像から傾き等の画像補正、色むら対応の2値化、日付行抽出を行うと、プレ印刷の罫線や文字成分305が残った日付行成分304の日付行2値画像(図3(f))が生成される。
【0025】
このように、色むらに対応することで、従来ドロップアウトにて除去していた罫線や地紋成分が残ってしまうという問題がある。ここで、本発明における第2の課題は、色むらが大きい場合や同系色のプレ印刷・地紋がある場合が混在して入力されても、どちらの場合でも正しく日付文字行を抽出することである。これを実現するために、本発明では以下のような方式をとる。第1の方式は、ドロップアウトを、色むら対応用ドロップアウトとプレ印刷・地紋除去用のドロップアウトを状況により選択して日付文字行2値画像を出力することである。第2の方式は、ドロップアウトは、色むら対応用とプレ印刷・地紋除去用の2種類の日付文字行2値画像を出力することである。詳細については、図15以降で説明する。
【0026】
以下、本発明を適用した押印日付読取り方法および押印日付読取り装置の一実施形態について説明する。これは、日付印の押印に色むらが大きい場合においても、押印のインク色が薄い個所の画素が残すことができる。
【0027】
図4は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの処理フローを示す図である。これは、画像処理装置(CPU)30にて実行される。通常はCPUで実行されるプログラムとして実現され、このようなプログラムは各種記録媒体に格納することができ、メモリに格納されてCPUで実行される。
【0028】
画像入力401において対象のカラー画像を入力し、日付印検知402において日付印の領域を検出する。
【0029】
日付印検知402にて検出した日付印の数だけ403は、404〜406を繰り返す。色むら対応用2値画像を出力するカラードロップアウト404において、注目する日付印の領域を含めた処理対象領域から、日付行2値画像を抽出し、日付文字列認識405において辞書40に含まれる文字識別辞書および日付表記辞書等により日付文字列認識を行う。405において日付文字列認識結果を406にてセットして注目する日付印の読取り処理を終える。403において検出した全ての日付印の読取を終えたら、407にて結果を出力し、押印日付読取り処理を終了する。色むら対応用2値画像を出力するカラードロップアウト404について、図5で説明する。
【0030】
図5は、本発明である色むら対応用2値画像を出力するカラードロップアウト処理のフローを示す図である。このカラードロップアウトの処理は、処理対象領域から押印色のみを残した濃淡画像を生成して、これを2値化して2値画像を生成する。
【0031】
処理領域選択処理501は、画像中から読取り対象の日付印を含む領域を選択する処理である。この処理領域は、日付印検知402で求めた日付印の中心座標と半径を用いて決定する。
【0032】
色クラスタリング処理502は、処理領域中の各画素を色クラスタリングする処理である。色クラスタリングは、画像中の各画素を色空間上にマッピングした後、あらかじめ決められた基準に基づいて近い色同士を同じクラスタとする。色クラスタリングの具体的な例としては、特許文献2の方式などを使うことができる。以降の処理を容易にするために、色クラスタリングの結果は、クラスタの画素数が多い順番にソートしてもよい。
【0033】
背景色選択処理503は色クラスタリングした結果から、背景色を選択する処理である。背景色は色クラスタリングした結果の中で、最も画素数(頻度)が多い色を背景色とする。背景色を含むクラスタの選択基準の一例としては、最も画素数が多いクラスタを採用する。この理由は、処理対象領域内では、日付印、罫線、ノイズ、背景の中で、一般的には背景の面積が最も多いからである。背景色を含むクラスタの選択基準の他の例としては、最も輝度が高いクラスタを選択することである。この理由は、紙の色は日付印の色に比べて輝度が高いためである。クラスタの輝度としては、クラスタに含まれる画素の平均の輝度や、分布のピークまたは中心の輝度を用いることができる。輝度YはRGBの各色に異なる重みを付けており、Y=0.29891R+0.58661G+0.11448Bとして計算する。一方、日付印内の背景色を含むクラスタより、日付印の色を含むクラスタの頻度の方が多い場合、上記の方式では日付印の色を背景色と誤判定することがある。これを防ぐため、日付印の領域の外側の画素のみを色クラスタリングした結果から上記の基準例に従って背景色を選択してもよい。
【0034】
日付印の押印色選択処理504は色クラスタリングした結果から、日付印の押印色を選択する処理である。押印色選択処理については図6〜図9で説明する。
【0035】
色空間変換処理505は、色むら対応濃淡画像生成処理506に利用するために、処理対象の画素を入力装置から得られるRGB色空間からHSY空間に変換する処理である。HSY空間とは、色の種類の指標である色相(H)と鮮やかさの指標である彩度(S)、および明るさの指標である輝度(Y)で色を表現するものである。HとSについては、広く利用されているHSV色空間と同じ計算式で算出する。本発明でHSY色空間を用いた理由は、一般に、色相、彩度、明るさ用いた色の表現は、RGBを用いる表現に比べて人間の色の知覚方法と類似しているためである。明るさの指標として、明度(V)ではなく輝度(Y)を用いた理由は、輝度の方が人間の明るさの知覚方法に近いためである。なお、色空間の変換はHSVやHSYだけでなく、HSV色空間やHSL色空間などを用いてもよい。その他にも、印刷の過程で利用する減法混色の表現であるCMY色空間やCMYK色空間などを利用してもよい。
【0036】
このように、RGB以外の次元を用いることにより、後述する画素分類処理や等の処理が高精度となる。上記の例では、一括して色空間の変換を行ってから、次の処理を行ったが、色空間の変換は、画素を利用する際にその都度、RGBからHやS等を計算して処理を行ってもよい。
【0037】
色むら対応用濃淡画像生成処理506は、押印色選択504によって選択した押印色に対して処理対象領域から色むらに適した色のみを残し、濃淡画像を生成する。色むら対応用濃淡画像生成処理については、図10〜図13で説明する。
【0038】
傾き補正507は、濃淡画像生成処理506によって生成された濃淡画像に対して、日付領域の上限にある線を検知して傾きを求め、この傾きを正立するように補正する。傾き補正をここで行うメリットは、2値化後の画像に比べて濃淡画像では傾き補正後に量子化誤差が発生しにくいことである。具体的には、斜めの線や曲線を含む画像を補正した際に、線上にギザギザが発生しにくくなる。傾き補正手法の例としては、バイナリア法やバイキュービック法を利用することができる。なお、傾き補正のためには、傾きを検出する必要がある。これは、例えば日付行の上下にある線を検知して求めることができるが、他の方法で求めてもよい。また傾きの検出は、傾き補正507内で検出も、他の処理で検出してもよい。
【0039】
2値化処理508は、傾き補正507で傾き補正した濃淡画像から日付行の領域のみ2値化し、2値画像を生成する。2値化処理507は図14で説明する。
【0040】
押印色選択処理504について図6〜図9を用いて説明する。図6は押印色選択の処理フローである。押印色選択は、プレ印刷や地紋の色に誤って押印色としないために、まず円周色選択処理601によって円周色を選択し、次に押印色決定処理602によって押印色を決定する。従来の方式では、背景色の次に多い画素数のクラスタを押印色とするため,処理対象領域に対してプレ印刷や地紋色の画素数が日付印色の画素数より多い場合に,プレ印刷や地紋色を押印色としてしまうことがある。この理由を図7で後述する。本発明では、まず、日付印の円周付近の画素の色のみで色クラスタリングを行い、背景色とは近くなく、最も頻度が多いクラスタを円周色として選択する。円周付近の画素を用いる理由は、円周付近が最も押印色に近い色が密にあるためである。次に、押印の中の領域で色クラスタリングを行い、この結果のクラスタの中で、ある程度の頻度があり、かつ円周色に最も近いクラスタの色を押印色とする。この方法により、プレ印刷や地紋の色を押印色に誤選択しないようにできる。円周色選択処理601を図8に、押印色決定処理602を図9で説明する。
【0041】
図7は、押印色がプレ印刷や地紋の色に間違う例を示す。図7の入力画像(a)はカラー画像から対象領域選択処理501によって選択された領域である。例えば、日付印701は輝度の高い緑色、プレ印刷702は輝度が低い茶色、地紋703は輝度が高い茶色であるとする。また、色クラスタリングした結果の中で、日付印の緑色のクラスタより、プレ印刷や地紋の茶色のクラスタの頻度が多い場合がある。この場合、押印色は色クラスタリングの結果の中で、背景色以外で最も頻度が高いクラスタの色とするため、プレ印刷702や地紋703の色を押印色として間違ってしまう。以降の処理である画素判定では、この間違った押印色を中心とした色のみを残し、これを元に濃淡画像を生成すると図7(b)のようになり、濃淡画像はプレ印刷704および地紋705の濃淡画素のみが残る。この濃淡画像を2値化および日付行抽出を行った結果、プレ印刷や地紋706の画素が黒画素としてのこった日付文字行2値画像図7(c)が生成される。以上のように、押印色を間違って選択すると、日付印がドロップアウトされてしまう。
【0042】
図8は、円周色選択の処理フローを示す図である。ステップ801は半径rにマージンαを持たせた大きさを指定する。rinは半径rよりα小さく、routは半径rよりα大きく設定する。これは、日付印検知によって要られた半径rの値および中心座標が押印の歪みや量子化誤差等によりずれ、また、日付印の外側の縁の幅の分を考慮している。ステップ802は対象領域のy座標分、ステップ803は対象領域のx座標分の繰り返しを行い、対象領域の画素を走査する。ステップ804は対象領域の座標の中で、画素が日付印の半径にマージンを持たせた範囲であれば、この画素の色をステップ805にて円周色リストへ追加する。対象領域の中で日付印の半径にマージンを持たせた範囲の画素の色を全て登録し終わったら、ステップ806にて円周色リストに対して色クラスタリングを行う。ステップ807において、色クラスタリングの結果から最も頻度が多いクラスタの代表色を円周色の初期値としてセットする。ステップ808において、この色クラスタリングの結果のクラスタ数分かつ円周色と背景色の色距離が閾値未満の場合、ステップ809において、注目するクラスタの代表色を選択し、ステップ810において、円周色は注目するクラスタの代表色に置き換える。
【0043】
このようにして選択した円周色を押印色としない理由は、日付印は押印の仕方によって色むらが生じる場合がある。日付印全体で最も円周色に近い色を押印色とするためである。
【0044】
図9は、押印色決定の処理フローを示す図である。ステップ901は対象領域のy座標分、ステップ902は対象領域のx座標分の繰り返しを行い、対象領域の画素を走査する。ステップ903において、座標x、yが日付印の半径内
であれば、この座標の画素の色を押印色リストへ追加する。この時、背景色に近い色であれば押印色リストへ追加せずに次の座標に移動するという処理を加えてもよい。これは、押印色は背景色とは異なるため、押印色リストへ登録する必要がないためである。
【0045】
対象領域を全て走査して得られた押印色リストに対して、ステップ905において色クラスタリングを行う。ステップ906において、この色クラスタリングの結果から最も頻度が多いクラスタの色を押印色の初期値としてセットする。ステップ907において、押印色の色リストのクラスタリングのクラスタ数分、ステップ908〜912を繰り返す。ステップ908は注目するクラスタの代表色を選択する。ステップ909において、注目するクラスタの画素数が閾値より少ない場合は、ステップ910においてループ脱出する。クラスタの画素数が閾値より少ないというのは、日付印の色とは異なるためである。ステップ910は、色クラスタリングの結果がクラスタの画素数によってソートされている場合にはループ脱出するが、ソートされていなければ次のクラスタに移動する。ステップ911において、注目するクラスタの代表色と円周色選択601で得られた円周色との距離が、現在セットしている押印色と円周色との距離未満であれば、押印色は注目するクラスタの代表色に置き換える。以上の処理で押印色を決定する。
【0046】
次に色むら対応用の濃淡画像生成処理506について、図10〜図13で説明する。
【0047】
図10は、色むら対応用濃淡画像生成の処理フローを示す図である。従来の方式では、画素のRGB情報だけなくHSV色空間も用いてプレ印刷や地紋をドロップアウトするための閾値が厳しいため、色むらが大きい場合には押印のインク色が薄い個所の画素がドロップアウトして欠落してしまう。本発明では、処理対象領域内の色相の頻度分布からRGB情報とこれを変換したHSY色空間において、色相や彩度や輝度の許容範囲を動的に求めることで、色むらが大きい場合であっても、文字色を残すことができる。この処理では、押印色が無彩色か有彩色かで処理を切り替える。無彩色とは、彩度値が低い色であり、白や灰色、黒などの色を指す。有彩色とは彩度が一定値以上の色を指す。無彩色と有彩色とに分ける理由は、無彩色と有彩色とでは色の判別の基準が異なるためである。無彩色の識別では輝度と彩度を基準とする。これに対し、有彩色では色相が最も優先度が高く、輝度や彩度がそれに続く基準となる。
【0048】
まず1001において、押印色をHSY色空間変換する。以降の処理では、押印色のRGB値とHSY色空間によって処理を行う。判定1002において、押印色が有彩色か無彩色かの判定を行う。
【0049】
有彩色か無彩色かの判定は、押印色の彩度がスライド彩度閾値未満であれば無彩色とする(1003)。押印色の彩度がスライド彩度閾値以上であれば有彩色とする(1005)。ここでスライド彩度閾値とは、輝度によって彩度の閾値を変更する閾値設定である。一般的に輝度が低い場合より輝度が高い場合の方が同じ彩度であっても色の変化が大きく見える。このため、輝度が高くなるにつれて彩度の閾値は低くするように設定する。
【0050】
押印の半径内の各画素について色むら対応用の画素分類(無彩色用)1004において、押印の半径内の各画素について、ドロップアウトする画素等を分類する。画素分類処理とは、ドロップアウトを目的として領域内の各画素を押印色や背景色との距離に応じて4種類に分類する処理である。従来の画素分類処理は特許文献2に記載されているとおりである。本発明における、無彩色用の画素分類1004については図12で説明する。
【0051】
色むら対応用の色相許容範囲計算処理1006は、画素分類の判別基準である色相の許容範囲を計算する。有彩色の押印色の判別であるため、判別基準に色相を用いる。押印領域内にプレ印刷がある場合と、色むらがある場合とで色相の許容範囲を変えなければならない。この理由を、図11を用いて説明する。
【0052】
図11(a)はプレ印刷・地紋がある場合の色相の頻度分布である。カラー画像中で画素の色相の頻度分布をとると、日付印は、押印色の色相1101を中心に頻度分布1102のように色相が広がり、プレ印刷・地紋は色相1103を中心に頻度分布1104のようになるとする。プレ印刷・地紋等を日付印と分離するには、押印色の色相1101を中心に許容範囲1105で区切る必要がある。1105の許容範囲の計算の一例として、頻度分布1102は色相1101を中心とした正規分布と扱い、偏差βσ以内(例えばβ=1)となる色相までを許容範囲としてもよい。また計算量を削減するために、色相1101の頻度から頻度が1/m(例えばm=2)以下になるまでを許容範囲としてもよい。
【0053】
一方、図11(b)は色むらがある場合の色相の頻度分布である。色むらがある場合の頻度分布1106において日付印の一部は色相1103付近にも固まってある場合がある。範囲1105では、色相1103付近に固まってある成分はドロップアウトされることになる。そのために、色むらがある場合には許容範囲を1107まで広げる。許容範囲の広げ方の一例として、頻度分布1106は色相1101を中心とした正規分布と扱い、偏差ασ以内(例えばα=3)となる色相までを許容範囲としてもよい。また計算量を削減するために、色相1101の頻度から頻度が1/n(例えばn=10)以下になるまでを許容範囲としてもよい。これらの許容範囲の計算において、色相1101と色相1103の間に頻度が0または色相1101の頻度から頻度が1/n(例えばn=10)以下になる色相がある場合もあるため、頻度分布1106は移動平均等で馴らしてもよい。
【0054】
図10の押印の半径内の各画素について色むら対応用の画素分類(有彩色用)1007において、押印の半径内の各画素について、ドロップアウトする画素等を分類する。有彩色用の画素分類1007については図13で説明する。濃淡値変換処理1008は、画素分類1004または1007によって分類された各画素について特許文献2の図8〜図11の説明で示す方法により、画素の輝度値に基づく濃淡値画像を生成する。この濃淡値画像では、押印色以外の色をドロップアウトしやすくするため、背景およびプレ印刷と判断される画素の輝度値が、入力画像の輝度地よりも高い値になる。押印色以外であるとの判定には、押印色と背景色との距離、および隣接画素との関係を用いている。
【0055】
図12と図13は、画素分類の判定フローを示す図であり、図12が無彩色の場合、図13が有彩色の場合を示している。画素分類は、対象領域内の画素を、背景色や押印色との距離などを基準に、「背景」、「文字」、「除去候補」、「文字候補」の4種類に分類する。このうち、除去候補は、プレ印刷や地紋などを想定しており、明らかに押印とは異なる色を指す。文字候補は、押印と同系色のプレ印刷などを想定しており、押印色と近いために、この段階では文字か除去候補かを決定できない色を指す。この分類結果は、後段の濃淡画像生成に利用される。
【0056】
図12は、押印色が無彩色の場合の色むら対応用の画素分類の判定フローである。押印半径内の各画素について、この判定フローに従い画素分類を行う。画素の色と押印色との距離が閾値以上または画素の輝度が背景色の輝度より高いと判定(1201)した場合は、この画素について背景フラグをセット(1202)して戻る(1203)。画素の色と押印色との距離が閾値より近いと判定(1204)した場合は、この画素について文字フラグをセット(1205)して戻る(1206)。画素の彩度が画素のスライド彩度閾値以下でかつ押印色との輝度差が色むら対応用の輝度差の閾値以下と判定(1207)した場合も、この画素について文字フラグをセット(1208)して戻る(1209)。これらの判定以外の場合は、この画素について除去候補フラグをセット(1210)して終了する。
【0057】
図13は、押印色が有彩色の場合の色むら対応用の画素分類の判定フローである。押印半径内の各画素について、この判定フローに従い画素分類を行う。画素の色と押印色との距離が閾値以上または画素の輝度が背景色の輝度より高いと判定(1301)した場合は、この画素について背景フラグをセット(1302)して戻る(1303)。画素の色と押印色との距離が閾値より近いと判定(1304)した場合は、この画素について文字フラグをセット(1305)して戻る(1306)。画素の色相が色むら対応用の色相許容範囲計算処理1005によって得られた許容範囲と判定(1306)した場合、画素と押印色の彩度差によって分類する(1307)して戻る(1311)。押印色との彩度差が色むら対応用の閾値より低い場合は文字フラグをセット(1308)する。押印色との彩度差が色むら対応用の閾値の一定範囲内の場合は文字候補フラグをセット(1309)する。彩度差が一定範囲より大きい場合は除外候補フラグをセット(1310)する。画素と押印色の距離が閾値以内または色相が閾値以内と判定(1312)した場合は、文字候補フラグをセット(1313)して戻る(1314)。これら判定以外の場合は、この画素について除去候補フラグをセット(1315)して終了する。
【0058】
図14は、2値化処理の概要図である。図14(a)は、日付行の全領域に対する2値化の例である。2値化の手法としては、固定閾値を用いる方法や、動的に閾値を変える手法など多くの手法が提案されている。代表的な手法としては、大津の2値化手法がある。この手法では、濃淡画像に対して、各画素が2つのクラス(白化画素と黒化画素)のどちらに属するかを判別するための閾値を、判別分析法を用いて算出する。閾値は、クラス内分散最小、かつクラス間分散最大となる値とする。傾き補正処理507によって補正された濃淡画像1401の日付領域1402を大津の2値化手法で2値化すると日付領域2値画像1403が生成される。しかし、色むらがある日付領域全体に対する大津の2値化では、輝度が高い画素は閾値によって白化画素となる場合があるという問題がある。この問題を解決するための方法として、本発明では、日付領域内の複数の部分領域で2値化し、複数の部分領域の2値画像の論理和によって日付領域全体の2値画像とする。部分領域にする理由は、その部分領域の文字成分の輝度が高い画素は、大津の2値化を用いた場合でも2値化閾値が高くなるため、黒画素化とすることができる。
【0059】
図14(b)は、本発明である複数の部分領域論理和を用いた2値化の例である。部分領域1404は日付領域の左端から指定の大きさをとった領域で、この部分領域のみを例えば大津の2値化を用いて2値化すると2値画像2値画像1405になる。部分領域の取り方はこの方法に限らない。また、2値化の方法も大津の2値化に限る必要はない。2値画像1406は日付領域全体の2値画像になるが、ここではまだ部分領域1404に対してのみ2値化しただけのため、2値画像1405と同じである。部分領域1407は部分領域1404の幅の1/2だけX座標にずらした領域である。部分領域1407を同様に2値化した結果、2値画像1408となる。日付領域全体の2値画像は、日付領域全体2値画像1406と2値画像1408の論理和(1409)である2値画像1410となる。同様に部分領域をまた1/2だけX座標にずらした部分領域1411に対して2値化する。日付領域の右端に到達するまで部分領域1412をずらすことを繰り返し、日付領域全体の2値画像1413を得る。
【0060】
以上のようにして得られた2値画像に対して、文字列認識処理405を行う。
<第二の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第2の実施形態について説明する。本実施形態では、ドロップアウトの方法を、色むら対応用とプレ印刷・地紋除去用のいずれかに指定することができる。入力される画像の押印が、色むらが大きい場合は色むら対応用を、プレ印刷や地紋が多い場合はプレ印刷・地紋除去用のドロップアウトを用いることで、どちらの場合にでも対応できる。
【0061】
図15は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第2の実施形態の処理フローを示す別の図である。図4と同じ番号がついている処理は図4と同じである。この例では、カラードロップアウトの方式指定処理1501において、カラードロップアウトの方式を指定する。カラードロップアウトの方式の判定1502において、方式指定処理1501で指定した方式が、色むら対応用であれば、色むら対応用2値画像を出力するカラードロップアウト処理404を行う。その他の場合は、プレ印刷・地紋除去2値画像を出力するカラードロップアウト1503を行う。なお1501の処理はこの位置に限らない。プレ印刷・地紋除去2値画像を出力するカラードロップアウト1503について、図16で説明する。
【0062】
図16は、本発明であるプレ印刷・地紋除去用2値画像を出力するカラードロップアウト処理のフローを示す図である。図5と同じ番号がついている処理は図5と同じである。このカラードロップアウトの処理は、処理対象領域からプレ印刷や地紋を正しく除去し、押印色のみを残した濃淡画像を生成して、これを2値化して2値画像を生成する。図5との違いは、色むら対応用濃淡画像生成処理506が、プレ印刷・地紋除去用濃淡画像生成処理1601に置き換わっている。プレ印刷・地紋除去用濃淡画像生成処理1601を図17で説明する。
【0063】
図17は、プレ印刷・地紋除去用濃淡画像生成処理のフローを示す図である。図10と同じ番号が付いている処理は、図10と同じである。押印の半径内の各画素についてプレ印刷・地紋除去用の画素分類(無彩色用)1701は、図18で説明する。プレ印刷・地紋除去用の色相許容閾値計算1702では、例えば、図11の許容範囲1105を用いる。プレ印刷・地紋除去用の許容範囲の計算の一例として、頻度分布1102は色相1101を中心とした正規分布と扱い、偏差βσ以内(例えばβ=1)となる色相までを許容範囲としてもよい。また計算量を削減するために、色相1101の頻度から頻度が1/m(例えばm=2)以下になるまでを許容範囲としてもよい。
プレ印刷・地紋除去用の画素分類(有彩色用) 1703は、図19で説明する。
【0064】
プレ印刷の罫線等が押印色と同系色である場合や罫線付近に偽色が発生して押印色と同系色になる場合に、画素分類1701または1703において文字フラグとして残る場合がある。これに対して罫線除去1704を行う。罫線除去1704を図20で説明する。なお、罫線除去1704は図10の1005と1006の間に入れてもよい。
【0065】
図18は、押印色が無彩色の場合のプレ印刷・地紋除去用の画素分類の判定フローである。図12と同じ番号については、図12と同じである。図12との違いは、判定(1207)が判定(1801)に代わっている。判定(1801)は画素の彩度が画素のスライド彩度閾値以下でかつ押印色との輝度差がプレ印刷・地紋除去用の輝度差の閾値以下でかつ輝度が押印色の輝度より低い場合に文字フラグセット(1205)して戻る(1206)。
【0066】
図19は、押印色が有彩色の場合のプレ印刷・地紋除去用の画素分類の判定フローである。図13と同じ番号については、図13と同じである。押印色との距離が閾値より近いと判定(1901)した場合は、文字フラグをセット(1902)して戻る(1903)。押印色との色相差が閾値より近いかつ輝度が押印色の輝度より低いと判定(1904)した場合は、文字フラグをセット(1905)して戻る(1906)。色相がプレ印刷・地紋除去用の色相許容範囲内であると判定(1907)した場合、彩度差による判定(1908)を行う。判定(1908)において、彩度差がプレ印刷・地紋除去用の閾値より低い場合は文字フラグをセット(1909)する。彩度差がプレ印刷・地紋除去用の一定の閾値範囲内の場合は文字候補フラグをセット(1910)する。それ以外は除去候補フラグをセット(1911)して戻る(1912)。
【0067】
図20は、罫線除去の概要を示す。上記の画素判定によって、プレ印刷の罫線等が押印色と同系色である場合や罫線付近に偽色が発生して押印色と同系色になる場合に、これらが文字フラグとしてセットされ、ドロップアウトされない場合がある。この場合、2値化によっても罫線成分が残ってしまう可能性があり、罫線が混入した日付行となる。これを解決するために、例えば3×3画素のフィルタリング処理を行い、細い縦線および横線を罫線成分を除去する。
【0068】
図20(a)は入力画像であり、日付印2001は罫線2002の上に押印されているとする。罫線2002が日付印の押印色と同系色である場合に、濃淡画像を生成した結果が図20(b)のようになり、図20(c)の2値化および日付行抽出結果は罫線ノイズ2003が残る。罫線除去を行う方法の一例として、横・縦罫線検出フィルタリング処理2004を行う。画素分類1701または1703において分類された画素のフラグが文字フラグの場合に、この画素を中心とした8近傍の3×3画素を生成する。各画素のフラグにおいて、文字フラグ2005と、それ以外のフラグ2006とした3×3画素が、横罫線2007か縦罫線2008のフィルタと一致する画素の座標のフラグを、文字フラグから除去候補フラグもしくは文字候補フラグに変換する。
【0069】
全ての画素において上記の横・縦罫線検出フィルタリング処理を行って濃淡画像を生成した結果が図20(d)のようになり、図20(e)の2値化および日付行抽出結果は罫線が除去された日付文字行となる。
<第三の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第3の実施形態について説明する。本実施形態では、ドロップアウトにおいて、色むら対応用とプレ印刷・地紋除去用の両方のドロップアウト画像を生成することで、色むらが大きい場合は色むら対応用の2値画像で、プレ印刷や地紋が多い場合はプレ印刷・地紋除去用の2値画像で、どちらかが正しい日付文字行を抽出できるため、入力画像に依存しないで、日付文字列読取りができる。
【0070】
図21は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第3の実施形態の処理フローを示す別の図である。図4と同じ番号がついている処理は図4と同じである。色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウト処理2101において、色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力する。色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウト処理2101については図22で説明する。1つ目の2値画像に対する日付文字列認識処理2102で、1つ目の2値画像に対して日付文字列認識を行う。2つ目の2値画像に対する日付文字列認識処理2102で、2つ目の2値画像に対して日付文字列認識を行う。2つの日付文字列認識結果においてスコアが高い認識結果を2104にてセットする。色むら対応用の2値画像と、プレ印刷・地紋除去用の2値画像の、どちらを1つ目とするかは特に決まりはない。
【0071】
図22は、むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウトの処理フローを示す図である。図4および図16と同じ番号がついている処理は図4および図16と同じである。ここでは、色むら対応用とプレ印刷・地紋除去用で共通の処理501〜505を行った後に、まず色むら対応用の2値画像を生成する(506〜508)。次にプレ印刷・地紋除去用の2値画像を生成する(1601、507〜508)この2つの2値画像を出力する。
<第四の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第4の実施形態について説明する。本実施形態では、ドロップアウトにおいて、色むら対応用とプレ印刷・地紋除去用の両方のドロップアウト画像を生成することで、色むらが大きい場合は色むら対応用の2値画像で、プレ印刷や地紋が多い場合はプレ印刷・地紋除去用の2値画像で、どちらかが正しい日付文字行を抽出できるため、入力画像に依存しないで、日付文字列読取りができる。1つ目の2値画像に対する日付文字列読取が成功すれば、その時点で注目する日付印の読取を終わらせることで、第3の実施形態に比べて処理時間の削減ができる。
【0072】
図23は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第4の実施形態の処理フローを示す別の図である。図4および図21と同じ番号がついている処理は図4および図21と同じである。図21との違いは、1つ目の2値画像に対する日付文字列認識処理2102の後に、1つ目の2値画像に対する日付文字列認識処理2102の結果において、認識結果のスコアが閾値以上であると判定(2301)した場合に、認識結果をセット(2302)して、次の日付印へ処理を戻す(2303)。
<第五の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第5の実施形態について説明する。本実施形態では、ドロップアウトを、色むら対応用とプレ印刷・地紋除去用で個別に行い、それぞれのドロップアウト後に日付文字列認識を行う方法である。
【0073】
図24は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第5の実施形態の処理フローを示す別の図である。図4、図15、図21と同じ番号がついている処理は図4、図15、図21と同じである。ここでは、色むら対応用の2値画像を生成するカラードロップアウト処理404を行い、これを1つ目の2値画像として日付文字列認識処理2102を行い、次に、プレ印刷・地紋除去用2値画像を出力するカラードロップアウト処理1503を行い、これを2つ目の2値画像として日付文字列認識処理2103を行い、スコアが高い認識結果をセット(2104)する。なお、図24の中の404と1503は入れ替えてもよい。
<第六の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第6の実施形態について説明する。本実施形態では、ドロップアウトを、色むら対応用とプレ印刷・地紋除去用で個別に行い、それぞれのドロップアウト後に日付文字列読取りを行う。一つ目のドロップアウトによる日付文字列認識の結果が得られれば、その時点で注目する日付印の読取を終わらせることで、第5の実施形態に比べて、カラードロップの処理時間と日付文字列認識の処理時間が削減できる。
【0074】
図25は、本発明である色むら対応のカラードロップアウトを適用した押印日付読取りの第6の実施形態の処理フローを示す別の図である。図4、図15、図21、図23と同じ番号がついている処理は図4、図15、図21、図23と同じである。図24との違いは、1つ目の2値画像に対する日付文字列認識処理2102の後に、1つ目の2値画像に対する日付文字列認識処理2102の結果において、認識結果のスコアが閾値以上であると判定(2301)した場合に、認識結果をセット(2302)して、次の日付印へ処理を戻す(2303)。
<第七の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第7の実施形態について説明する。本実施形態では、カラードロップアウトを様々な閾値で行い、それに基づいた複数の2値画像を生成し、日付文字列認識することにより、正しく認識できる2値画像があることを期待できる。
【0075】
図26は、複数の2値画像を出力するカラードロップアウトを適用した押印日付読取りの第7の実施形態の処理フローを示す別の図である。図4、図23と同じ番号がついている処理は図4、図23と同じである。複数の2値画像を出力するカラードロップアウト処理2601は図5〜図19にある様々な閾値を段階的に変動させた2値画像を生成し、2値画像の数だけ(2602)、日付文字列認識処理405を行い、認識結果のスコアが以上と判定(2301)すれば、認識結果をセット(2302)して次の日付印へ処理を戻す(2303)。
<第八の実施形態>
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置の第8の実施形態について説明する。本実施形態では、カラードロップアウトを様々な閾値で行い、それに基づいた複数の2値画像を生成し、全ての2値画像に対して日付文字列認識し、最も精度が高い結果を得ることができる。
【0076】
図27は、複数の2値画像を出力するカラードロップアウトを適用した押印日付読取りの第8の実施形態の処理フローを示す別の図である。図4、図26と同じ番号がついている処理は図4、図26と同じである。図26との違いは、2602にて全ての2値画像に対して日付文字列認識405を行った後で、全ての認識結果の中でスコアが最も高い認識結果をセット(2701)する。また、2701の代わりに、全ての認識結果の中で認識した日付文字列の多数決を取って、最も多い認識結果をセットしてもよい。
【0077】
次に、本発明を適用した押印日付読取り方法および押印日付読取り装置による認識結果の確認・修正を行う表示画面について説明する。なお、表示する内容は以下の説明によって限定されるものではない。
【0078】
図28は、図21、図23、図24、図25の日付印読取処理の結果を確認および修正する画面の表示例である。表示装置50は画面2801を表示する。日付印読取処理の結果・確認を2802で表示するウィンドウである。入力画像表示ウィンドウ2803はカラー画像2804を表示する。日付印検知により検知した日付印2805を含む日付印読取処理の処理対象領域2806を表示する。帳票IDを2807にて表示する。現在確認・修正を行っているカラー画像が全処理カラー画像中の何番目かを示す番号を2808にて表示する。2809は本発明である色むら対応用とプレ印刷・地紋除去用それぞれのカラードロップアウト処理内の濃淡画像生成結果を表示する。2810に2値化および日付行抽出を行った結果の2値画像を色むら対応用とプレ印刷・地紋除去用のそれぞれを表示する。2812に日付読取りの結果の日付文字列を表示する。2813は日付読取り結果の修正を行うエディタである。2814および2815は同じカラー画像中に別の日付印があれば、別の日付印の認識結果等の表示に切り替えるボタンである。2816は別のカラー画像に対する日付印の認識結果等の表示に切り替えるスクロールバーである。
【0079】
図29は、図4または図15の日付印読取処理の結果を確認および修正する画面の別の表示例である。この表示は、日付印読取結果が不読等の結果の場合に、カラードロップアウト等の様々な閾値を変動した際に読取結果が得られるかを確認する。または、カラードロップアウト等の様々な閾値を自動で変動して、読取結果が得られるまで調整することで、日付印読取結果が不読等の結果の場合の修正も自動で行える。表示装置50は画面2901を表示する。日付印読取処理の結果・確認を2902で表示するウィンドウである。入力画像表示ウィンドウ2903はカラー画像2904を表示する。日付印検知により検知した日付印2905を含む日付印読取処理の処理対象領域2906を表示する。帳票IDを2907にて表示する。現在確認・修正を行っているカラー画像が全処理カラー画像中の何番目かを示す番号を2908にて表示する。2909は処理対象領域2906をカラー画像から抽出した日付印領域画像である。2910は図4または図15の処理においてカラードロップアウト処理内の濃淡画像生成結果と、2値化および日付行抽出を行った結果の2値画像と、日付読取りの結果の日付文字列を表示する。2911は2912および2913のタイトルである。2912は2910の認識結果が不読等の場合に、カラードロップアウトの処理における様々な閾値を手動または自動で変更し、その閾値を用いた図4または図5の処理を行い、日付読取り結果が得られるかを調整する。2913は2912の閾値調整の調整変更による図4または図5の処理結果を表示する。2914および2915は同じカラー画像中に別の日付印があれば、別の日付印の認識結果等の表示に切り替えるボタンである。2916は別のカラー画像に対する日付印の認識結果等の表示に切り替えるスクロールバーである。
【0080】
図30は、図26または図27の日付印読取処理の結果を確認および修正する画面の別の表示例である。表示装置50は画面3001を表示する。日付印読取処理の結果・確認を3002で表示するウィンドウである。入力画像表示ウィンドウ3003はカラー画像2904を表示する。日付印検知により検知した日付印3005を含む日付印読取処理の処理対象領域3006を表示する。帳票IDを3007にて表示する。現在確認・修正を行っているカラー画像が全処理カラー画像中の何番目かを示す番号を3008にて表示する。3009は、図26または図27のカラードロップアウトの処理結果で得られる複数の、カラードロップアウト処理内の濃淡画像生成結果または2値化および日付行抽出を行った結果の2値画像またはその両方を、全てないし一部を表示する。3010は、日付読取り結果でアクセプトした画像に対して強調枠を表示する。3011は入力装置等で選択した画像に対するカラードロップアウト等のパラメータの値を表示するウィンドウである。3012は日付読取り結果の修正を行うエディタである。3013および3014は同じカラー画像中に別の日付印があれば、別の日付印の認識結果等の表示に切り替えるボタンである。3015は別のカラー画像に対する日付印の認識結果等の表示に切り替えるスクロールバーである。
【0081】
続いて、前述した各実施の形態によって得られるネットワーク制御システムの特徴的な構成について、以下に列記する。
【0082】
(1)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
ドロップアウト方法を指定するステップと、
上記指定したドロップアウト方法が色むら対応用であるかプレ印刷・地紋除去用であるか判定するステップと、
上記指定したドロップアウト方法が色むら対応用であれば、上記検知した日付印に対して日付文字行2値画像を出力する請求項1の画像処理方法と、
上記指定したドロップアウト方法が色むら対応用以外であれば、上記検知した日付印に対して日付文字行2値画像を出力する請求項2の画像処理方法と
2値画像に対して日付文字列を認識するステップと、
上記認識結果をセットするステップと、
結果を出力するステップを有する第2の押印日付読取り方法。
【0083】
(2)処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、
上記処理対象画像を入力するステップと、
上記処理対象画像の画素を色クラスタリングするステップと、上記色クラスタリングに基づいて背景色を選択するステップと、
上記処理対象画像の画素から押印色を選択するステップと、
上記処理対象画像の画素を色空間変換するステップと、
上記処理対象画像の画素から色むら対応用の濃淡画像生成するステップと、
上記色むら対応用の濃淡画像の傾きを補正するステップと、
上記色むら対応用の濃淡画像を傾き補正した濃淡画像を2値化するステップと、
上記処理対象画像の画素からプレ印刷・地紋除去用の濃淡画像生成するステップと、
上記プレ印刷・地紋除去用の濃淡画像を傾き補正するステップと、
上記プレ印刷・地紋除去用の濃淡画像を傾き補正した濃淡画像を2値化するステップを有する第3の画像処理方法。
【0084】
(3)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像およびプレ印刷除去用2値画像の2つの2値画像を出力する請求項16の画像処理方法と、
1つ目の2値画像に対して日付文字列を認識するステップと、
2つ目の2値画像に対して日付文字列を認識するステップと、
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第3の押印日付読取り方法。
【0085】
(4)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力する請求項16の画像処理方法と、
上記1つ目の2値画像に対して日付文字列を認識するステップと、
上記1つ目の2値画像に対する日付文字列結果のスコアを判定するステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットするステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットした後に次の日付印へ処理を移動するステップと、
2つ目の2値画像に対して日付文字列を認識するステップと、
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第4の押印日付読取り方法。
【0086】
(5)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像を出力する請求項1の画像処理方法と、
上記出力した2値画像に対して、1つ目の2値画像に対して日付文字列を認識するステップと
上記検知した日付印に対して、プレ印刷・地紋除去用2値画像を出力する請求項10の画像処理方法と、
上記出力した2値画像に対して、2つ目の2値画像に対して日付文字列を認識するステップと
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第5の押印日付読取り方法。
【0087】
(6)前記(5)記載のドロップアウトの順番は、色むら対応用とプレ印刷・地紋除去用は順不同であることを特徴とする請求項19の押印日付読取り方法。
【0088】
(7)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、色むら対応用2値画像を出力する請求項1の画像処理方法と、
上記出力した2値画像に対して、1つ目の2値画像に対して日付文字列を認識するステップと
上記1つ目の2値画像に対する日付文字列結果のスコアを判定するステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットするステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットした後に次の日付印へ処理を移動するステップと、
上記検知した日付印に対して、プレ印刷・地紋除去用2値画像を出力する請求項10の画像処理方法と、
上記出力した2値画像に対して、2つ目の2値画像に対して日付文字列を認識するステップと
上記2つの認識結果のスコアが高い方の認識結果をセットするステップと、
結果を出力するステップを有する第6の押印日付読取り方法。
【0089】
(7)前記(6)記載のドロップアウトの順番は、色むら対応用とプレ印刷・地紋除去用は順不同であることを特徴とする請求項21の押印日付読取り方法。
【0090】
(8)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、複数の2値画像を出力するカラードロップアウトを行うステップと、
上記出力した2値画像に対して、日付文字列を認識するステップと
上記2値画像に対する日付文字列の認識結果のスコアを判定するステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットするステップと、
上記判定でスコアが閾値以上の場合に認識結果をセットした後に次の日付印へ処理を移動するステップと、
結果を出力するステップを有する第7の押印日付読取り方法。
【0091】
(9)日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して、複数の2値画像を出力するカラードロップアウトを行うステップと、
上記出力した全ての2値画像に対して、日付文字列を認識するステップと
上記全ての2値画像に対する日付文字列認識の結果の中で、最もスコアが高い認識結果をセットするステップと、
結果を出力するステップを有する第8の押印日付読取り方法。
【0092】
(10)前記(9)記載の認識結果をセットするステップにおいて、認識結果の文字列の頻度を数えて、最も頻度が多い認識文字列を認識結果としてセットすることも可能な請求項24の押印日付読取り方法。
【符号の説明】
【0093】
10…入力装置、20…画像入力装置、30…CPU、40…辞書、50…表示装置、60…画像DB、210…色むら対応用カラードロップアウト2値画像、404…色むら対応用2値画像を出力するカラードロップアウト処理、405、日付文字列認識処理、502…カラークラスタリング処理、503…背景色選択処理、504、押印色選択処理、506…色むら対応用濃淡画像生成処理、507…傾き補正処理、508…2値化処理、1503…プレ印刷・地紋除去用2値画像を出力するカラードロップアウト処理、1601…プレ印刷・地紋除去用濃淡画像生成処理、2101…色むら対応用2値画像およびプレ印刷・地紋除去用2値画像の2つの2値画像を出力するカラードロップアウト処理

【特許請求の範囲】
【請求項1】
処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、
上記処理対象画像を入力するステップと、
上記処理対象画像の画素を色クラスタリングするステップと、上記色クラスタリングに基づいて背景色を選択するステップと、
上記処理対象画像の画素から押印色を選択するステップと、
上記処理対象画像の画素を色空間変換するステップと、
上記処理対象画像の画素から色むら対応用の濃淡画像生成するステップと、
上記濃淡画像の傾きを補正するステップと、
上記傾き補正した濃淡画像を2値化するステップを有する第1の画像処理方法。
【請求項2】
上記押印色を選択するステップにおいて、
上記処理対象画像の押印の円周付近の画素の円周色を選択する手段と、
上記処理対象画像の押印の領域内の画素から上記選択された円周色に最も近い色を押印色として決定する手段により押印色を選択することを特徴とする請求項1記載の画像処理方法。
【請求項3】
上記色むら対応用の濃淡画像生成ステップにおいて、
上記押印色を色空間変換する手段と、
上記色空間変換によって得た押印色の彩度と輝度から無彩色か有彩色に判定する手段と、
上記判定結果で無彩色である場合は、無彩色用の色むら対応用の画素分類を行う手段と、
上記判定結果で有彩色である場合は、色むら対応用の色相許容範囲計算する手段と、
有彩色用の色むら対応用の画素分類を行う手段と、
画素分類の結果から濃淡値に変換する手段を有する請求項1記載の画像処理方法。
【請求項4】
上記無彩色用の色むら対応用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の彩度および輝度を用いて、背景、文字、および除去候補に弁別する請求項3記載の画像処理方法。
【請求項5】
上記色むら対応用の色相許容範囲計算手段において、
請求項3記載の色空間変換した押印色の色相と、請求項1記載の色空間変換による上記処理対象画像の画素の色相の頻度分布を用いて、頻度分布は押印色の色相を中心とした正規分布として扱い、偏差ασになるまでの色相範囲を色むら用の色相許容範囲とする請求項3の画像処理方法。
【請求項6】
上記色むら対応用の色相許容範囲計算手段において、
請求項3記載の色空間変換した押印色の色相と、請求項1記載の色空間変換による上記処理対象画像の画素の色相の頻度分布を用いて、頻度分布において押印色の色相の頻度の所定閾値以下になるまでの色相範囲を色むら用の色相許容範囲とする請求項3の画像処理方法。
【請求項7】
上記有彩色用の色むら対応用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の色相および彩度を用いて、背景、文字、文字候補、および除去候補に弁別する請求項3記載の画像処理方法。
【請求項8】
上記2値化するステップにおいて、
2値化は上記傾き補正した濃淡画像における日付領域の部分領域を、それぞれの部分領域の2値化閾値に従って2値化して2値画像を生成し、それぞれの部分領域2値画像の論理和をとることで、日付領域の2値画像とすることを特徴とする請求項1の画像処理方法。
【請求項9】
日付印が押印されたカラー画像からの押印日付読取り方法であって、
上記カラー画像を入力するステップと、
上記カラー画像から日付印を検知するステップと、
上記検知した日付印に対して日付文字行2値画像を出力する請求項1の画像処理方法と、
2値画像に対して日付文字列を認識するステップと、
上記認識結果をセットするステップと、
結果を出力するステップを有する第1の押印日付読取り方法。
【請求項10】
処理対象画像から文字成分のみ残すドロップアウトの画像処理方法であって、
上記処理対象画像を入力するステップと、
上記処理対象画像の画素を色クラスタリングするステップと、上記色クラスタリングに基づいて背景色を選択するステップと、
上記処理対象画像の画素から押印色を選択するステップと、
上記処理対象画像の画素を色空間変換するステップと、
上記処理対象画像の画素からプレ印刷・地紋除去用の濃淡画像生成するステップと、
上記濃淡画像の傾きを補正するステップと、
上記傾き補正した濃淡画像を2値化するステップを有する第2の画像処理方法。
【請求項11】
上記プレ印刷・地紋除去用の濃淡画像生成ステップにおいて、
上記押印色を色空間変換する手段と、
上記色空間変換によって得た押印色の彩度と輝度から無彩色か有彩色に判定する手段と、
上記判定結果で無彩色である場合は、無彩色用のプレ印刷・地紋除去用の画素分類を行う手段と、
上記判定結果で有彩色である場合は、プレ印刷・地紋除去用の色相許容範囲計算する手段と、
有彩色用のプレ印刷・地紋除去用の画素分類を行う手段と、
画素分離の結果から罫線を除去する手段と、
画素分類の結果から濃淡値に変換する手段を有する請求項10記載の画像処理方法。
【請求項12】
上記無彩色用のプレ印刷・地紋除去用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の彩度および輝度を用いて、背景、文字、および除去候補に弁別する請求項11記載の画像処理方法。
【請求項13】
上記プレ印刷・地紋除去用の色相許容範囲計算手段において、
請求項11記載の色空間変換した押印色の色相と、請求項10記載の色空間変換による上記処理対象画像の画素の色相の頻度分布を用いて、頻度分布は押印色の色相を中心とした正規分布として扱い、偏差βσになるまでの色相範囲を色むら用の色相許容範囲とする請求項11の画像処理方法。
【請求項14】
上記有彩色用のプレ印刷・地紋除去用の画素分類手段において、
上記処理対象画像内の各画素を、上記選択された押印色、背景色、当該画素の色相および彩度を用いて、背景、文字、文字候補、および除去候補に弁別する請求項11記載の画像処理方法。
【請求項15】
上記罫線を除去する手段において、
画素分類で文字に弁別された画素において、8近傍の弁別された画素で3×3画素のフィルタリングを行うことを特徴とした請求項11記載の画像処理方法。

【図1】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図12】
image rotate

【図13】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図2】
image rotate

【図3】
image rotate

【図7】
image rotate

【図11】
image rotate

【図14】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate


【公開番号】特開2013−84071(P2013−84071A)
【公開日】平成25年5月9日(2013.5.9)
【国際特許分類】
【出願番号】特願2011−222452(P2011−222452)
【出願日】平成23年10月7日(2011.10.7)
【出願人】(000233033)日立コンピュータ機器株式会社 (253)
【Fターム(参考)】