説明

画像処理装置、画像処理方法及びプログラム

【課題】枠罫線と記入文字が重なった状態の帳票を読み取った帳票画像データから枠罫線と記入文字の重なりが高精度に除去された帳票画像データを生成する。
【解決手段】オフセット方向・量検出部105で、多値帳票画像データにおいて記入文字と罫線との重なりを無くすために必要となる記入文字の罫線に対する相対的なオフセットの方向及び量を検出し、重なり除去補正部106で、帳票画像データにおいて記入文字の画素の値と当該画素をオフセット方向・量検出部105により検出されたオフセットの方向及び量に対応してオフセットした位置の画素の値とを交換することにより、記入文字と罫線との重なりが高精度に除去された多値の帳票画像データを生成する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スキャナなどにより帳票を読み取った帳票画像データを処理する画像処理装置及び方法に関する。
【背景技術】
【0002】
表の枠内に文字を記入するような帳票が多く利用されている。このような帳票を読み取った帳票画像データの処理においては、表の枠内に記入された文字と枠を構成する罫線との重なりの影響を排除したい場合がある。例えば、表の枠内の文字の文字認識において、文字と枠の接触の影響を排除するための先行技術が特許文献1に記載されている。
【0003】
この先行技術においては、文書画像(帳票画像)より一定値以上の長さを持つ黒ランを抽出し、予め定められた距離内にある黒ランの統合矩形を罫線矩形として抽出し、罫線矩形を組合せて枠を認識し、枠を構成する罫線矩形だけを罫線として認識し、それ以外の罫線矩形を削除する。削除されずに残した罫線、すなわち枠を構成する罫線について、その黒ランの黒画素を白画素に置換して罫線を消去し、しかる後に、枠内の黒画素連結矩形を抽出し、それを統合して文字領域を抽出し、その文字領域の画像に対し文字認識を行うため、枠に接触した文字も精度の良い文字認識が可能となる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
帳票を読み取った帳票画像データは、文字認識などの目的で直接処理される場合であっても再利用する目的で蓄積しておくような場合であっても、枠を構成する罫線と記入文字が重なった状態の帳票を読み取った帳票画像データについては、枠罫線と記入文字の重なりを除去した帳票画像データを生成できると好都合であるが、上記先行技術は、そのような目的に適用できるものではない。
【0005】
よって、本発明の目的は、枠の罫線と記入文字が重なった状態の帳票を読み取った帳票画像データから、枠の罫線と記入文字の重なりが高い精度で除去された帳票画像データを生成する画像処理装置及び方法を提供することにある。
【課題を解決するための手段】
【0006】
本発明による画像処理装置は、多値の帳票画像データにおいて記入文字と罫線との重なりを無くすために必要となる前記記入文字の前記罫線に対する相対的なオフセットの方向及び量を検出する第1の手段と、前記帳票画像データにおいて前記記入文字の画素の値と当該画素を前記第1の手段で検出されたオフセットの方向及び量に対応してオフセットした位置の画素の値とを交換する第2の手段とを有する構成とされる。
【発明の効果】
【0007】
かかる構成によれば、枠の罫線と記入文字が重なった状態の帳票を読み取った帳票画像データから、枠の罫線と記入文字の重なりが高精度に除去された帳票画像データを生成することができる。
【図面の簡単な説明】
【0008】
【図1】本発明の一実施形態に係る画像処理装置のブロック図である。
【図2】図1の画像処理装置の処理説明用フローチャートである。
【図3】オフセット方向・量検出処理のフローチャートである。
【図4】記入文字領域抽出の説明図である。
【図5】帳票画像の一例を示す図である。
【図6】図5の帳票画像に含まれているプレ印刷画像を示す図である。
【図7】図5の帳票画像に含まれている記入文字画像を示す図である。
【図8】図5の帳票画像に対し重なり除去補正処理を施した後の帳票画像を示す図である。
【発明を実施するための形態】
【0009】
図1は、本発明の一実施形態に係る画像処理装置の機能的構成を示すブロック図である。図1に示すように、本実施形態に係る画像処理装置は、帳票をスキャナ等で読み取った多値の帳票画像データ(例えばRGB画像データ)を入力する手段である画像データ入力部101、入力された帳票画像データ(入力帳票画像データと記す)や処理により生成される画像データなどを一時的に記憶する記憶部102、入力帳票画像データ中の記入文字を抽出する処理(詳細は後述)を行う手段である記入文字抽出処理部103、入力帳票画像データ中の罫線を抽出する処理(詳細は後述)を行う手段である罫線抽出処理部104、入力帳票画像データ中の記入文字と罫線との重なりをなくすために、記入文字を罫線に対し相対的に上下左右のどの方向にどれだけオフセット(移動)させる必要があるか調べ、必要なオフセットの方向及び量を検出するオフセット方向・量検出部105、検出されたオフセット方向及びオフセット量に基づいて、入力帳票画像データに対し記入文字と罫線との重なりを除去するための補正処理を施す重なり除去補正処理部106、処理結果データの出力を行うデータ出力部17を備える構成である。
【0010】
このような構成の画像処理装置は、専用のハードウェアにより実現することも当然に可能であるが、CPUやメモリ、ディスプレイ、ハードディスク装置、スキャナ、外部記憶媒体(半導体記憶素子、光ディスク、光磁気ディスクなど)を読み書きするための装置、ネットワーク・インターフェースなどを備える一般的なコンピュータのハードウェア資源を利用し、ソフトウェアによって実現することも容易であり、かかる実現態様も本発明に包含される。また、そのためのプログラム、すなわち、図1に示した画像処理装置を構成する手段(101〜107)としてコンピュータを機能させるプログラムも本発明に包含される。
【0011】
なお、処理される帳票画像データの入力については様々な態様をとり得る。すなわち、コンピュータの備えるスキャナにより帳票を読み取って帳票画像データを直接的に入力するような態様、そのスキャナ又は他のスキャナあるいは他の撮像手段(デジタルカメラなど)で読み取った帳票画像データをハードディスク装置や外部記憶媒体に保存しておき、必要な時にその帳票画像データを読み込むような態様、ネットワーク・インターフェースを通じてインターネットなどのネットワーク上のコンピュータなどから帳票画像データを取り込むような態様などである。
【0012】
図2は、本画像処理装置の処理フローの一例を示すフローチャートである。以下、このフローチャートに沿って本画像処理装置における処理内容について具体的に説明する。
【0013】
[ステップS1] 画像データ入力部101により、帳票をスキャナなどで読み取った多値の帳票画像データ(例えばRGB画像データやグレースケール画像データ)が入力されて記憶部102に記憶される。一般的に、帳票画像データは、帳票のプレ印刷画像と、帳票の記入枠に記入された文字(記入文字)の画像とを表している。
【0014】
図5に帳票画像の一例を示す。この帳票画像の例では、帳票の図6に示すようなプレ印刷画像(表を構成する縦横の罫線、表の記入枠の項目名(住所、発注者、発注日、伝票番号、発注No.、商品コード、商品名、数量、単価、金額、摘要、合計)、取引先の表示など)と、帳票の図7に示すような記入文字の画像とを含んでいる。そして、図5に見られるように、記入文字が本来の記入位置からずれているため、プレ印刷の表罫線と記入文字とが重なった状態となっている。なお、ここでは、記入文字色は黒又は濃青などの濃色とし、一方、プレ印刷色は、カラーのときでもグレースケールのときでも記入文字色と容易に識別可能な淡緑のようなものとして説明する。
【0015】
[ステップS2] 記入文字抽出処理部103により記入文字抽出処理が行われる。本実施形態では、この記入文字抽出処理のステップS2は、二値化処理ステップS2aと文字領域抽出処理ステップS2bとからなる。
【0016】
まず、二値化処理ステップS2aでは、前述したような記入文字色とプレ印刷色との違いに基づいて、多値の入力帳票画像データから、記入文字色の画素を黒画素、記入文字色以外の画素を白画素とした二値画像データを生成する。この二値画像データは、図7に示すような記入文字画像を表すものであるので、二値記入文字画像データと呼ぶものとする。この二値記入文字画像データは記憶部102に記憶される。
【0017】
文字領域抽出処理ステップS2bでは、二値記文字画像データ中の連結した黒画素の塊を、それに外接した矩形として抽出する。抽出した矩形の幅、高さ、面積、矩形同士の間隔などの要件を統計的に算出し、その要件に基づいて、統合すべき複数の矩形の統合を行う。このようにして最終的に得られた矩形の領域を一つ一つの記入文字の領域として抽出する。図4は、「い」の領域抽出の説明図である。(A)は二値記入文字画像データ上の「い」の画像を示す。この「い」の場合、(B)に示すように左側の連結黒画素塊と右側の連結黒画素塊がそれぞれ矩形として抽出される。この2つの矩形は(C)に示すように一つの矩形に統合され、この矩形が「い」の領域として抽出されることになる。このようにして抽出された記入文字領域のデータ(例えば矩形の頂点座標など)が記憶部102に記憶される。
【0018】
なお、本実施形態にあっては、重なり除去補正処理106(ステップS5)で二値記入文字画像データを参照するが、それは必須ではないので、ステップS2において、二値記入文字画像データを生成するための二値化処理(ステップS2a)を省き、多値の入力帳票画像データを直接参照しながら、記入文字色の画素を記入文字の画素として、その連結性に着目した矩形抽出と矩形統合により記入文字の領域を抽出するようにしてもよい。
【0019】
[ステップS3] 罫線抽出処理部104により罫線抽出処理が行われる。本実施形態では、この罫線抽出処理のステップS3は、二値化処理ステップS3aと罫線矩形抽出処理ステップS3bとからなる。
【0020】
まず、二値化処理ステップS3aでは、前述したような記入文字色とプレ印刷色との違いに基づいて、多値の入力帳票画像データから、プレ印刷色の画素を黒画素、プレ印刷色以外の画素を白画素とした二値画像データを生成する。この二値画像データは、図6に示すようなプレ印刷画像を表すものであるので、二値プレ印刷画像データと呼ぶものとする。この二値プレ印刷画像データは記憶部102に記憶される。なお、多値の入力帳票画像データから、背景色の画素を白画素、背景色以外の色の画素を黒画素とした二値画像データ、すなわち、プレ印刷画像と記入文字画像の両方を含む図5に示すような帳票画像を表す二値の帳票画像データを生成するようにしてもよく、このような二値帳票画像データからも次に述べるような罫線矩形抽出は可能である。
【0021】
罫線領域抽出処理ステップS3bでは、二値プレ印刷画像データ(又は二値帳票画像データ)に対し、黒画素の連結性をもとに連続した黒画素に同じラベルを付与するラベリングを行い、付与されたラベル値が同一で、主走査方向又は副走査方向に連結していて、かつ、表の罫線として妥当な長さ及び幅を持った黒画素群に外接する矩形(罫線矩形)を主走査方向又は副走査方向の罫線として抽出する。なお、抽出された罫線の中で交差又は接続した複数の罫線を連結することにより、表単位での罫線抽出も可能である。抽出された罫線のデータ(例えば罫線矩形の頂点座標など)は記憶部102に記憶される。
【0022】
なお、多値の入力帳票画像データを直接参照しながら、プレ印刷色の画素について、その連結性に着目した同様の罫線矩形抽出を行うことも可能である。この場合、プレ印刷画像又は帳票画像の二値画像データを生成するための二値化処理(ステップ3a)を省いてよい。
【0023】
[ステップS4] オフセット方向・量検出部105で、入力帳票画像データ中の記入文字と罫線との重なりをなくすために、記入文字を罫線に対し相対的に上下左右にどれだけオフセット(移動)させればよいか調べ、その必要なオフセットの方向と量を検出する。具体的には、ステップS2で得られた記入文字領域データとステップS3で得られた罫線データとを用い、例えば図3に示す処理手順を実行する。
【0024】
すなわち、記入文字を上下左右の4方向にオフセットするもとして、そのオフセット量を初期値(0)からインクリメントしながら(ステップS43)、現在のオフセット値に相当する量だけ記入文字を現在のオフセット方向(D方向)にオフセットしたときに記入文字(記入文字領域)と罫線(罫線矩形)との重なりがあるか判定する(ステップS41)。重なりがあると判定したときは(ステップS41,YES)、オフセット値が予め決められた一定値を越えているか判定し(ステップS42)、オフセット値が一定値以下ならばオフセット値をさらにインクリメントし(ステップS43)、インクリメント後のオフセット値に相当する量だけ記入文字をD方向へオフセットしたときにD方向での記入文字と罫線との重なりがあるか判定する(ステップS41)。D方向での記入文字と罫線との重なりがないと判定すると(ステップS41,YES)、現在のオフセット値をD方向のオフセット値として確定し(ステップS44)、ステップS45に進む。
【0025】
また、ステップS42でオフセット値が一定値を越えたと判定したときは、D方向にオフセットしても記入文字と罫線との重なりを解消できないと判断されるので、ステップS45へ進む。
【0026】
ステップS45では、上下左右の4方向の全てについて処理済みか判定する。未処理の方向があるときは(ステップS45,NO)、未処理の一つの方向をD方向に設定し(ステップS26)、D方向についてステップS41からの手順に戻る(図3には明示されていないが、オフセット値は初期値に戻される)。4方向全てについて処理済みとなると(ステップS45,YES)、オフセット方向・量検出処理を終了する。検出された各方向のオフセット値は記憶部102に記憶される。なお、次のステップS5の処理において利用されるオフセット値はステップS44で確定された方向のオフセット値のみであるから、ステップS42からステップS45へ進んだD方向についてのオフセット値は意味を持たないが、ここでは便宜0として記憶されるものとする。
【0027】
図5に示すような帳票画像の場合、記入文字と罫線との重なりを解消するには、記入文字を下方向及び右方向へオフセットさせる必要がある。1画素単位でオフセットし、オフセット値はオフセット画素数を示すものとすると、例えば、下方向のオフセット値は12、右方向のオフセット値は24となる。なお、上方向と左方向のオフセット値は便宜0とされる。
【0028】
[ステップS5] 重なり除去補正処理部106は、ステップS2aで生成された二値記入文字画像データを参照し、その黒画素を記入文字の画素として、入力帳票画像データにおいて記入文字の画素の値と、該画素をステップS4で検出されたオフセット方向及びオフセット量に応じてオフセット(移動)した位置の画素の値とを交換する処理を行う。図5の帳票画像の例の場合、前述したように右方向のオフセット値が24、下方向のオフセット値が12とすると、入力帳票画像データ中の記入文字の各画素の値と、該画素を右方向へ24画素だけ、下方向へ12画素だけ、それぞれオフセットした位置の画素の値とを交換することになる。なお、この例の場合、上方向と左方向のオフセット値は0であり、それら方向へのオフセットは行わない。このような重なり除去補正処理によって、図5の帳票画像の場合、図8に示すような記入文字と罫線との重なりが除去された帳票画像の多値画像データが得られる。この補正後の多値帳票画像データは記憶部102に記憶される。
【0029】
なお、二値記入文字画像データを参照せず、多値の入力帳票画像データにおいて記入文字色の画素をサーチし、サーチした画素を記入文字の画素として同様の重なり除去補正処理を実行するようにしてもよい。この場合においても、記入文字領域データに基づいてサーチ範囲を記入文字領域に限定し、効率的な記入文字画素のサーチが可能である。
【0030】
[ステップS6] データ出力部107により、記憶部102に得られた重なり除去補正処理後の多値帳票画像データのみ、あるいは、同多値帳票画像データに加えて二値記入文字画像データ、記入文字領域データ、罫線データのぜんぶもしくは一部が処理結果データが出力される。具体的には、このような処理結果データがコンピュータのディスプレイ画面に出力されたり、コンピュータのハードディスク装置や外部記憶媒体あるいはネットワーク上のコンピュータなどへデータファイルとして出力されたりする。
【0031】
なお、以上の画像処理装置の処理についての説明は、本発明の画像処理方法の処理手順についての説明でもある。
【符号の説明】
【0032】
101 画像データ入力部
102 記憶部
103 記入文字抽出処理部
104 罫線抽出処理部
105 オフセット方向・量検出部
106 重なり除去補正処理部
107 処理結果出力部
【先行技術文献】
【特許文献】
【0033】
【特許文献1】特開平10−177621号公報

【特許請求の範囲】
【請求項1】
多値の帳票画像データにおいて記入文字と罫線との重なりを無くすために必要となる前記記入文字の前記罫線に対する相対的なオフセットの方向及び量を検出する第1の手段と、前記帳票画像データにおいて前記記入文字の画素の値と当該画素を前記第1の手段で検出されたオフセットの方向及び量に対応してオフセットした位置の画素の値とを交換する第2の手段とを有することを特徴とする画像処理装置。
【請求項2】
多値の帳票画像データにおいて記入文字と罫線との重なりを無くすために必要となる前記記入文字の前記罫線に対する相対的なオフセットの方向及び量を検出する第1の工程と、前記帳票画像データにおいて前記記入文字の画素の値と当該画素を前記第1の工程で検出されたオフセットの方向及び量に対応してオフセットした位置の画素の値とを交換する第2の工程とを有することを特徴とする画像処理方法。
【請求項3】
多値の帳票画像データにおいて記入文字と罫線との重なりを無くすために必要となる前記記入文字の前記罫線に対する相対的なオフセットの方向及び量を検出する第1の手段、及び、前記帳票画像データにおいて前記記入文字の画素の値と当該画素を前記第1の手段で検出されたオフセットの方向及び量に対応してオフセットした位置の画素の値とを交換する第2の手段としてコンピュータを機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate