説明

画像処理装置、画像処理方法及びプログラム

【課題】記入文字色などが分からないような帳票の画像データから、記入文字画像を精度よく分離し、その画像データを生成する画像処理装置を提供する。
【解決手段】画像処理装置は、帳票画像データに対し減色処理を行う手段(103)、前記減色処理により減色後の帳票画像データにおける色の頻度分布を求める手段(104)、前記色の頻度分布に基づき前記減色後の帳票画像データにおける色の中から記入文字色及びプレ印刷色を推定する手段(105)、前記減色後の帳票画像データにおける前記記入文字色の画素からなる記入文字画像を表す画像データと前記プレ印刷色の画素からなるプレ印刷画像を表す画像データを生成する手段(106)とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スキャナなどにより帳票を読み取った帳票画像データを処理する画像処理装置及び方法に関する。
【背景技術】
【0002】
特許文献1に記載された技術よれば、文字が黒で印刷され、文字枠が黒以外の色によって印刷された帳票をスキャナで読み取った多値のRGB画像データにおいて、RGB値の閾値処理により、黒の文字と非黒の文字枠とを分離する。しかし、この従来技術は、文字色が黒で文字枠が非黒の帳票に限定的に適用し得るものであって、汎用性に欠けるという問題がある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明の主たる目的は、上記従来技術のような文字色などが限定されない一般的な帳票を処理の対象とし、スキャナなどで読み取った帳票の画像データを入力として、帳票上の文字記入枠に記入された文字(記入文字)の画像と、帳票上の表罫線などのプレ印刷画像とを高精度に分離することができる画像処理装置及び方法を提供することにある。
【課題を解決するための手段】
【0004】
上記目的を達成するため、本発明の画像処理装置は、帳票を読み取った帳票画像データに対し減色処理を行う手段と、前記減色処理により減色後の帳票画像データにおける色の頻度分布を求める手段と、前記色の頻度分布に基づき、前記減色後の帳票画像データにおける色の中から記入文字色を推定する手段と、前記減色後の帳票画像データにおける前記記入文字色の画素からなる記入文字画像を表す記入文字画像データを生成する手段とを有する構成である。
【発明の効果】
【0005】
帳票画像には、表罫線などのプレ印刷画像と、表の記入枠に記入(入力)された文字(記入文字)の画像とが含まれる。そして、プレ印刷画像の色(プレ印刷色)と記入文字画像の色(記入文字色)はそれぞれ単色であることが一般的である。また、帳票用紙の地色がそのまま背景色であることが多いが、用紙に着色されている場合でも背景色は単色であるのが通常である。
【0006】
したがって、上記減色処理により例えば3色に減色後の帳票画像データにおける色の頻度分布に基づいて、減色後の色の中から記入文字色を適切に推定し、その記入文字色の画素からなる記入文字画像をプレ印刷画像から精度よく分離して、記入画像を表すデータを生成することができる。また、記入文字色は推定されるため、上記従来技術のように記入文字色が予め分かっている必要はない。
【図面の簡単な説明】
【0007】
【図1】本発明の一実施形態に係る画像処理装置のブロック図である。
【図2】図1の画像処理装置の処理説明用フローチャートである。
【図3】帳票画像の一例を示す図である。
【図4】図3の帳票画像に含まれているプレ印刷画像を示す図である。
【図5】図3の帳票画像に含まれている記入文字画像を示す図である。
【発明を実施するための形態】
【0008】
図1は、本発明の一実施形態に係る画像処理装置の機能的構成を示すブロック図である。図1に示すように、本実施形態に係る画像処理装置は、帳票をスキャナ等で読み取った多値の帳票画像データ(例えばRGB画像データ)を入力する手段である画像データ入力部101、入力された帳票画像データや処理により生成される画像データなどを一時的に記憶する記憶部102、帳票画像データに対する減色処理を行う手段である減色処理部103、減色後の帳票画像データにおける色の頻度分布を求める手段である色頻度分布算出部104、色の頻度分布に基づいて記入文字色などの推定を行う手段である色推定部105、記入文字画像データなどを生成する手段である画像データ生成部106、記入文字画像データなどの二値化処理手段である二値化処理部107、文字認識処理手段である文字認識処理部108、罫線抽出処理手段である罫線抽出処理部109、処理結果データの出力を行うデータ出力部110を備える構成である。
【0009】
このような構成の画像処理装置は、専用のハードウェアにより実現することも当然に可能であるが、CPUやメモリ、ディスプレイ、ハードディスク装置、スキャナ、外部記憶媒体(半導体記憶素子、光ディスク、光磁気ディスクなど)を読み書きするための装置、ネットワーク・インターフェースなどを備える一般的なコンピュータのハードウェア資源を利用し、ソフトウェアによって実現することも容易であり、かかる実現態様も本発明に包含される。また、そのためのプログラム、すなわち、図1に示した画像処理装置を構成する手段(101〜110)としてコンピュータを機能させるプログラムも本発明に包含される。
【0010】
なお、処理される帳票画像データの入力については様々な態様をとり得る。すなわち、コンピュータの備えるスキャナにより帳票を読み取って帳票画像データを直接的に入力するような態様、そのスキャナ又は他のスキャナあるいは他の撮像手段(デジタルカメラなど)で読み取った帳票画像データをハードディスク装置や外部記憶媒体に保存しておき、必要な時にその帳票画像データを読み込むような態様、ネットワーク・インターフェースを通じてインターネットなどのネットワーク上のコンピュータなどから帳票画像データを取り込むような態様などである。
【0011】
図2は、本画像処理装置の処理フローの一例を示すフローチャートである。以下、このフローチャートに沿って本画像処理装置における処理内容について具体的に説明する。
【0012】
[ステップS1] 入力部101により、帳票をスキャナなどで読み取った帳票画像データ(多値のカラー画像データ、例えばRGB画像データ)が入力されて記憶部102に記憶される。一般的に、帳票画像データは、帳票のプレ印刷画像と、帳票の記入枠に記入された文字(記入文字)の画像とを表している。図3に帳票画像の一例を示す。この帳票画像の例では、帳票の図4に示すようなプレ印刷画像(表を構成する縦横の罫線、表の記入項目名(住所、発注者、発注日、伝票番号、発注No.、商品コード、商品名、数量、単価、金額、摘要、合計)、取引先の表示など)と、帳票の図5に示すような記入文字の画像とを含んでいる。
【0013】
[ステップS2] 減色処理部103により、帳票画像データにおける記入文字画像の色(記入文字色)、プレ印刷画像の色(プレイ印刷色)、背景色を推定するために、帳票画像データに対し減色処理を行う。帳票においては、プレ印刷色と記入文字色がそれぞれ単色であることが多い。また、帳票の背景色は、帳票用紙の地色であることが多く、これも単色である。かかる考察に基づき、本実施形態においては、帳票画像データに対し、3色へと減色する減色処理を施す。減色後の帳票画像データは記憶部102に記憶される。
【0014】
[ステップS3] 色頻度分布算出部104により、減色後の帳票画像データにおける3色の頻度分布が算出される。ここで、減色後の3色のうち、頻度値が最大の色をA色、頻度値が次に大きい色をB色、頻度値が最小の色をC色とする。すなわち、
A色の頻度値>B色の頻度値>C色の頻度値
という頻度値の大小関係があるものとする。このような色頻度分布のデータは記憶部102に記憶される。
【0015】
[ステップS4] 色推定部105は、減色後の3色のうちで、色の頻度分布に基づいて、記入文字色、プレ印刷色、背景色を推定する。通常、帳票画像データにおいて背景の画素が最も多く、プレ印刷画像の画素が次に多く、記入文字画像の画素が最も少ない。かかる点に鑑み、本実施形態では、色推定部105で減色後のA色,B色,C色のうち、C色を記入文字色と推定し、B色をプレ印刷色と推定し、A色を背景色と推定する。
【0016】
[ステップS5] 画像データ生成部106において、減色後の帳票画像データにおけるC色の画素からなる記入文字画像を表す記入文字画像データ、B色の画素からなるプレ印刷画像を表すプレ印刷画像データ、A色の画素からなる背景画像を表す背景画像データを生成する。生成された各画像データは記憶部102に記憶される。
【0017】
より具体的には、例えば以下の処理が実行される。帳票画像データと同サイズの多値の空白画像データを3つ(それぞれを空白画像データa,同b,同cと記す)記憶部102上に用意する。減色後の帳票画像データのC色が割り当てられた画素の値(C色)を空白画像データcの対応画素にコピーする。減色後の帳票画像データのB色が割り当てられた画素の値(B色)を空白画像データbの対応画素にコピーする。減色後の帳票画像データのA色が割り当てられた画素の値(A色)を空白画像データaの対応画素にコピーする。空白画像データcのコピー処理後の画像データが記入文字画像データであり、空白画像データbのコピー処理後の画像データがプレ印刷画像データである。また、空白画像データaのコピー処理後の画像データが背景画像データである。
【0018】
以上の処理によって、帳票の記入文字色、プレ印刷色、背景色が予め分かっていない場合であっても、帳票を読み取った帳票画像データより、記入文字色、プレ印刷色、背景色を適切に推定し、記入文字画像、プレ印刷画像、背景画像を精度よく分離して、精度のよい記入文字画像データ、プレ印刷画像データ、背景画像データを生成することができる。例えば図3に示すような帳票画像のデータの場合、図5に示すような記入文字画像のデータが生成され、図4に示すようなプレ印刷画像のデータが生成される。
【0019】
[ステップS6] 二値化処理部107は、記入文字画像データとプレ印刷画像データの二値化処理を行い、それぞれの二値化データを記憶部102上に生成する。この二値化データは、記入文字画像データ又はプレ印刷画像データにおける空白画素を白(0)、非空白画素を黒(1)とした1ビット/画素のデータである。
【0020】
[ステップS7] 文字認識部108において、記入文字画像データの二値化データに対し、黒画素を矩形統合し、文字として相応しい幅及び高さの統合矩形内の画像を文字候補として抽出する一般的な文字切り出し処理と、切り出した文字候補の特徴量を抽出し、文字候補の特徴量と辞書とを比較照合して文字を同定する処理とからなる文字認識処理を行い、認識した文字コードと記入文字画像データ上の文字位置の情報を認識結果データとして得る。この認識結果データは記憶部102に記憶される。なお、文字単位の認識のみならず、単語辞書を用いて単語単位の認識を行うようにしてもよい。精度よく分離された記入文字画像のデータの二値化データを利用するため、記入文字の高精度な文字認識が可能となる。
【0021】
[ステップS8] 罫線抽出処理部109において、プレ印刷画像データの二値化データに対し、水平方向の黒ラン抽出を行い、抽出した水平方向の黒ランのうちで所定以上の長さの黒ランを水平方向に矩形統合して水平方向の罫線矩形を抽出する。垂直方向についても黒ラン抽出を行い、抽出した黒ランのうちで所定以上の長さの黒ランを垂直方向に矩形統合して垂直方向の罫線矩形を抽出する。そして、抽出した罫線矩形の始点・終点位置情報などを罫線データとして取得し、記憶部102に記憶する。なお、水平方向と垂直方向の罫線の交差・接続を調べ、表の記入枠の座標情報などを求めてもよく、このようにすると記入文字と記入枠との対応付けが容易となる。精度よく分離されたプレ印刷画像のデータの二値化データを利用するため、表罫線の高精度な抽出が可能となる。
【0022】
[ステップS9] データ出力部110により、記憶部102に得られた処理結果データ、例えば記入文字画像データ、プレ印刷画像データ、背景画像データ、文字認識結果、罫線抽出結果が出力される。具体的には、それら処理結果データがコンピュータのディスプレイ画面に出力されたり、コンピュータのハードディスク装置や外部記憶媒体、ネットワーク上のコンピュータなどへデータファイルとして出力されたりする。
【0023】
本実施形態においては、記入文字画像データのほかにプレ印刷画像データと背景画像データを生成したが、記入文字画像データのみを生成する態様や、記入文字画像データとプレ印刷画像データを生成する態様もとり得る。また、本実施形態では、記入文字色、プレ印刷色、背景色がそれぞれ単色の帳票を処理の対象として想定したため、3色への減色処理を行った。記入文字色、プレ印刷色、背景色のいずれかが2色以上の帳票を処理対象とする場合には、より多い色数への減色処理を行って、本実施形態と同様な色頻度分布に基づいた記入文字色などの推定を行うことにより、記入文字画像などの精度のよい分離が可能である。
【0024】
なお、以上の画像処理装置の処理についての説明は、本発明の画像処理方法の処理手順についての説明でもある。
【符号の説明】
【0025】
101 画像データ入力部
102 記憶部
103 減色処理部
104 色頻度分布算出部
105 色推定部
106 画像データ生成部
107 二値化処理部
108 文字認識処理部
109 罫線抽出処理部
110 データ出力部
【先行技術文献】
【特許文献】
【0026】
【特許文献1】特開平10−187882号公報

【特許請求の範囲】
【請求項1】
帳票を読み取った帳票画像データに対し減色処理を行う手段と、
前記減色処理により減色後の帳票画像データにおける色の頻度分布を求める手段と、
前記色の頻度分布に基づき、前記減色後の帳票画像データにおける色の中から記入文字色を推定する手段と、
前記減色後の帳票画像データにおける前記記入文字色の画素からなる記入文字画像を表す記入文字画像データを生成する手段とを有することを特徴とする画像処理装置。
【請求項2】
帳票を読み取った帳票画像データに対し減色処理を行う手段と、
前記減色処理により減色後の帳票画像データにおける色の頻度分布を求める手段と、
前記色の頻度分布に基づき、前記減色後の帳票画像データにおける色の中から記入文字色及びプレ印刷色を推定する手段と、
前記減色後の帳票画像データにおける前記記入文字色の画素からなる記入文字画像を表す記入文字画像データを生成する手段と、
前記減色後の帳票画像データにおける前記プレ印刷色の画素からなるプレ印刷画像を表すプレ印刷画像データを生成する手段とを有することを特徴とする画像処理装置。
【請求項3】
帳票を読み取った帳票画像データに対し減色処理を行う手段と、
前記減色処理により減色後の帳票画像データにおける色の頻度分布を求める手段と、
前記色の頻度分布に基づき、前記減色後の帳票画像データにおける色の中から記入文字色、プレ印刷色及び背景色を推定する手段と、
前記減色後の帳票画像データにおける前記記入文字色の画素からなる記入文字画像を表す記入文字画像データを生成する手段と、
前記減色後の帳票画像データにおける前記プレ印刷色の画素からなるプレ印刷画像を表すプレ印刷画像データを生成する手段と、
前記減色後の帳票画像データにおける前記背景色の画素からなる背景画像を表す背景画像データを生成する手段とを有することを特徴とする画像処理装置。
【請求項4】
前記減色処理で3色への減色を行い、
前記減色後の帳票画像データにおいて頻度値が最大の色をA色、次に頻度値が大きい色をB色、頻度値が最小の色をC色としたとき、前記C色を前記記入文字色と推定することを特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記減色処理で3色への減色を行い、
前記減色後の帳票画像データにおいて頻度値が最大の色をA色、次に頻度値が大きい色をB色、頻度値が最小の色をC色としたとき、前記C色を前記記入文字色と推定し、前記B色を前記プレ印刷色と推定することを特徴とする請求項2に記載の画像処理装置。
【請求項6】
前記減色処理で3色への減色を行い、
前記減色後の帳票画像データにおいて頻度値が最大の色をA色、次に頻度値が大きい色をB色、頻度値が最小の色をC色としたとき、前記C色を前記記入文字色と推定し、前記B色を前記プレ印刷色と推定し、前記A色を前記背景色と推定することを特徴とする請求項3に記載の画像処理装置。
【請求項7】
前記記入文字画像データの二値化処理を行う手段と、
前記記入文字画像データの前記二値化処理により得られた二値化データに対し文字認識処理を行う手段とを有することを特徴とする請求項1又は4に記載の画像処理装置。
【請求項8】
前記記入文字画像データ及び前記プレ印刷画像データの二値化処理を行う手段と、
前記記入文字画像データの前記二値化処理により得られた二値化データに対し文字認識処理を行う手段と、
前記プレ印刷画像データの前記二値化処理により得られた二値化データに対し罫線抽出処理を行う手段とを有することを特徴とする請求項2,3,5又は6に記載の画像処理装置。
【請求項9】
帳票を読み取った帳票画像データに対し減色処理を行う工程と、
前記減色処理により減色後の帳票画像データにおける色の頻度分布を求める工程と、
前記色の頻度分布に基づき、前記減色後の帳票画像データにおける色の中から記入文字色を推定する工程と、
前記減色後の帳票画像データにおける前記記入文字色の画素からなる記入文字画像を表す記入文字画像データを生成する工程とを有することを特徴とする画像処理方法。
【請求項10】
請求項1乃至6のいずれか1項記載の画像処理装置の各手段としてコンピュータを機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−194899(P2012−194899A)
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2011−59610(P2011−59610)
【出願日】平成23年3月17日(2011.3.17)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】