説明

帳票処理装置およびプログラム

【課題】ドロップアウトカラーを用いずに,マークの効果的な認識を可能とする帳票処理装置およびプログラムを提供する。
【解決手段】帳票処理装置が,複数の項目が印字され,かつ選択される項目を表すマークが記入される領域を有する帳票を複数の画素を有する画像として読み取る読取部と,前記領域内の画像から,画素に対応する画素の個数がそれぞれ1番目,2番目,および3番目に大きい第1,第2,および第3の色の群を抽出する抽出部と,前記第2,第3の色の群間の色差が所定の基準色差より小さい場合に,前記第3の色の群に対応する画素の色を変更する色変更部と,前記第3の色の群に対応する画素の色が変更された画像に基づいて,前記項目と区分してマークを認識する認識部と,を具備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は,帳票処理装置およびプログラムに関する。
【背景技術】
【0002】
帳票を読み取る光学式文字読取装置に関する技術が公開されている(例えば,特許文献1参照)。ここで,帳票に丸(「○」)等のマークが記入される場合がある。帳票に印字された複数の項目のいずれか(一または複数)にマークを記入することで,記入者が選択した項目を表すことができる。この場合,項目内容を表す印字と,筆記具等により記入されたマークとが,帳票上に存在することになる。
【0003】
このとき,帳票の印字色をドロップアウトカラーとすることで,項目内容の印字から記入されたマークを区分することが可能となる。印字色をドロップアウトカラーとすると,項目の印字が読み取りの対象から除外され,マークのみが読み取られる。
【特許文献1】特開平11−42309号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし,ドロップアウトカラーを用いると,その色は読み取りに用いることができず,帳票に用いる色が制約される。
上記に鑑み,本発明はドロップアウトカラーを用いずに,マークの効果的な認識を可能とする帳票処理装置およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の一態様に係る帳票処理装置は,複数の項目が印字され,かつ選択される項目を表すマークが記入される領域を有する帳票を複数の画素を有する画像として読み取る読取部と,前記領域内の画像から,画素に対応する画素の個数がそれぞれ1番目,2番目,および3番目に大きい第1,第2,および第3の色の群を抽出する抽出部と,前記第2,第3の色の群間の色差が所定の基準色差より小さい場合に,前記第3の色の群に対応する画素の色を変更する色変更部と,前記第3の色の群に対応する画素の色が変更された画像に基づいて,前記項目と区分してマークを認識する認識部と,を具備することを特徴とする。
【発明の効果】
【0006】
本発明によれば,ドロップアウトカラーを用いずに,マークの効果的な認識を可能とする帳票処理装置およびプログラムを提供できる。
【発明を実施するための最良の形態】
【0007】
以下,図面を参照して,本発明の実施の形態を詳細に説明する。
図1は本発明の一実施形態に係る帳票処理装置100を表すブロック図である。
帳票処理装置100は,帳票,特に,帳票に記入されたマークを読み取る装置であり,読取装置110,装置本体120,記憶部130,表示部140,入力部150を有する。
【0008】
図2は,帳票の一部を表す図である。
帳票上に,マークエリアA1,A2が配置されている。マークエリアA1,A2は,筆記用具(例えば,鉛筆,ボールペン)により,マーク(例えば,「○」(丸マーク))が記入される領域(即ち,複数の項目が印字され,かつ選択される項目を表すマークが記入される領域)である。
【0009】
マークエリアA1,A2には,選択すべき項目および選択時に表すべきマークが表される。マークエリアA1には項目として,「2年(24回)」,「3年(36回)」,「4年(48回)」,「5年(60回)」の4つが印字されている。マークエリアA2には項目として,「全年齢」,「21歳以上」,「26歳以上」,「30歳以上」の4つが印字されている。また,記入すべきマーク(基準マーク)を表すために,破線の丸が印字されている。
【0010】
マークエリアA1,A2にはそれぞれ,「2年(24回)」,「21歳以上」の項目にマークM1,M2が記入されている。印字された破線の丸は記入されたマークM1,M2の下に隠されている。
本実施形態では,これらのマークM1,M2をこれらと重なるようにして印字された項目内容および基準マークと区別して読み取る。
【0011】
読取装置110は,帳票を光学的に読み取る装置,例えば,スキャナであり,帳票保持部111,帳票取出部112,帳票読取部113を備える。
装置本体120は,読取制御部121,マークエリア決定部122,色抽出部123,色差判定部124,色変更部125,マーク認識部126,認識結果訂正部127を有する。
記憶部130は,ハードディスク,半導体メモリ等の補助記憶装置であり,画像保持部131,認識結果保持部132,訂正結果保持部133を有する。
【0012】
帳票保持部111は,複数枚の帳票を保持する。帳票は帳票保持部111から取り出されて,読み取られ,また戻される。
帳票取出部112は,帳票保持部111から帳票を取り出して帳票読取部113に送り,読み取られた帳票を帳票保持部111に戻す。
帳票読取部113は,帳票を光学的に読み取るものであり,帳票を複数の画素を有する画像として読み取る読取部として機能する。
【0013】
帳票読取部113は,光源,リニアセンサ,走査駆動部を有する。光源は,帳票に光を照射する。リニアセンサでは,CCD等の光電変換素子が一次元的に配置され,帳票からの反射光中の三原色(例えば,R(赤),G(緑),B(青))をそれぞれ光電変換して,多階調(例えば,256階調(8ビット))の輝度データの電気信号として出力する。走査駆動部は,リニアセンサを帳票上で走査(スキャン)する。リニアセンサを帳票上で連続的に走査することで,帳票の2次元の画像(イメージ)データが得られる。この画像データは,多数の画素データから構成される。個々の画素データは,RGBの輝度Lr,Lg,Lbを有する。即ち,帳票読取部113は,色を有する多数の画素からなる画像(イメージ)として帳票を読み取る。
【0014】
ここでいう色は,RGBの輝度Lr,Lg,Lbの組み合わせを言うものとし,有彩色,無彩色のいずれをも含む。また,輝度Lr,Lg,Lbの比率が同一でも,輝度Lr,Lg,Lbの絶対値が異なれば,色として異なるものとする。即ち,ここでいう色は,色彩学上での色より広義である。
【0015】
装置本体120は,コンピュータとプログラム(例えば,OS(operating system),アプリケーションプログラム)で構成できる。コンピュータ中のCPU(Central Processing Unit)がプログラムで動作することで,コンピュータが読取制御部121等として機能する。
【0016】
読取制御部121は,読取装置110を制御し,帳票を画像として読み取り,読み取った画像のデータを画像保持部131に保持させる。画像は,色(RGBの輝度Lr,Lg,Lb)をそれぞれ有する複数の画素を含む。
【0017】
マークエリア決定部122は,帳票の画像データからマークエリアA1,A2を決定する。マークエリア決定部122はこの決定のためのテーブルT1を有する。このテーブルT1には,例えば,帳票の基準位置とマークエリアA1,A2それぞれの四隅との距離(相対距離)が表される。基準位置は,帳票上に適宜に規定される(一例として,帳票の左上隅,右下隅)。なお,基準位置は1カ所でも良いが,帳票が傾いた状態で読み取られる可能性を考慮し,2カ所以上とするのが好ましい。
【0018】
色抽出部123は,マークエリアA1,A2内の画像から複数の色の群を抽出するものであり,画像から,画素に対応する複数の色の群を抽出する抽出部として機能する。具体的には,対応する画素数(帳票上での面積比)の大きい順に色群C1〜C3を抽出する。これらの色群C1〜C3はそれぞれ,帳票の地色(紙の色),印字された項目の色,記入されたマークの色と考えられる。なお,色群C3が実質的に存在しない場合(誤差範囲),マークが未記入と考えられる。
【0019】
色差判定部124は,色群C2,C3間の色差ΔCの大小を判定する。具体的には,色差判定部124は,色差ΔCが基準色差ΔC0より大きいか否かを判定する。
【0020】
色変更部125は,色差判定部124の判定結果に基づき,色群C3に対応する画素の色を変更する。色群C2,C3間の色差ΔCが基準色差ΔC0より小さければ,色群C3に対応する画素の色が変更される。色差ΔCが基準色差ΔC0以上であれば,画素の色は変更されない。
【0021】
マーク認識部126は,マークエリアA1,A2中のどの項目がマークされたかを認識し,その認識結果を認識結果保持部132に保持するものであり,項目と区分してマークを認識する認識部として機能する。マーク認識部126はこの認識のためのテーブルT2を有する。このテーブルT2には,例えば,マークエリアA1,A2内での項目の相対位置が表される。
【0022】
認識結果訂正部127は,操作者(オペレータ)の操作に基づき,マーク認識部126での認識結果を訂正し,その訂正結果を訂正結果保持部133に保持する。この訂正に,表示部140,入力部150が用いられる。
【0023】
画像保持部131は,帳票読取部113で読み取られた帳票の画像データを保持する。
認識結果保持部132は,マーク認識部126での認識結果を保持する。
訂正結果保持部133は,認識結果訂正部127での訂正結果を保持する。
【0024】
表示部140は,画像を表示する表示装置,例えば,CRT,液晶表示装置である。
入力部150は,情報を入力する入力装置,例えば,キーボード,マウスである。
【0025】
(帳票処理装置100の動作手順)
図3は,帳票処理装置100の動作手順の一例を表すフロー図である。
(1)帳票の読み取り(ステップS11)
読取制御部121が読取装置110を制御することで,帳票が光学的に読み取られ,画像(イメージ)データとして,画像保持部131に保持される。この画像は,色をそれぞれ有する複数の画素で表される。この色はRGBの輝度Lr,Lg,Lbの組み合わせによって表される。
【0026】
(2)マークエリアの決定(ステップS12)
マークエリア決定部122が,帳票の画像データおよびテーブルT1を用いて,帳票のマークエリアA1,A2を決定する。具体的には,帳票の画像から帳票の基準位置を読み取り,この基準位置からの相対距離に基づいて,画像中のマークエリアA1,A2を決定する。
【0027】
(3)マークエリアからの色群C1〜C3の抽出(ステップS13)
色抽出部123が,マークエリアA1,A2から色群C1〜C3を抽出する。
図4は,マークエリアでのR,G,Bそれぞれの輝度の分布を表すグラフである。グラフの横軸,縦軸がそれぞれ輝度,出現頻度である。ここでは,出現頻度(画素数)および輝度の大中小に対応して,紙(帳票)の地色,印字色(印字された項目の色),記入されたマークの色が分布している。
【0028】
図5は,RGB色空間上にマークエリア中の画素の色を表した模式図である。直交する3つの軸をRGBの輝度Lr,Lg,Lbとして,RGB色空間が表現される。画素それぞれの色は,このRGB色空間上の点Pとして表される。この点Pは1つの色(1つの画素)を表す。点Pの集積としての色群C1〜C3をそれぞれ含む色領域S1〜S3が配置される。対応する画素の個数が多い順に色群C1〜C3が抽出される。なお,色群C1〜C3は,帳票上での面積比の大きい順,色空間上での画素の密度Dの大きい順とも対応する。
【0029】
ここでは,色領域S1〜S3は中心P1(Lr1,Lg1,Lb1),P2(Lr2,Lg2,Lb2),P3(Lr3,Lg3,Lb3)を有する立方体上の空間として表されている。
色領域S1: (Lr1±ΔL1,Lg1±ΔL1,Lb1±ΔL1)
色領域S2: (Lr2±ΔL2,Lg2±ΔL2,Lb2±ΔL2)
色領域S3: (Lr3±ΔL3,Lg1±ΔL3,Lb3±ΔL3)
ここで,色領域の大きさ(距離)ΔL1〜ΔL3: 色領域S1〜S3の中心P1〜P3からそれぞれの外周までの距離
【0030】
具体的には,次のようにして色群C1〜C3(色領域S1〜S3)を選択できる。
1)色空間を複数のブロック(例えば,輝度Lr,Lg,Lbをそれぞれ複数(例えば,8つに区分したブロック)に区分し,その内部での点(画素)の個数が最大のブロックを選択する。
【0031】
2)選択されたブロックの中心を調整し,ブロック内での画素の個数が最大となる中心P1(Lr1,Lg1,Lb1)を選択する。
【0032】
3)ブロックの大きさΔLを調整し,ブロック中での画素の密度Dに基づいて,ブロックの大きさΔL1を選択する。
【0033】
図6は,RGB色空間上でのブロックの大きさΔLとブロック中での画素の密度Dの関係の一例を表すグラフである。密度Dは,ブロック中での画素の個数/ブロックの体積(2・ΔL)で表される。
【0034】
ブロックの中心P1近傍での密度Dが大きく(ΔL〜0近傍で,密度Dが最大密度Dmax),中心P1から離れるに従い密度Dが小さくなる(色空間全体での平均密度Davに近づく)。大きさΔL1として,密度Dの変化量が最大となる大きさΔLを選択する。これに替えて,密度Dが基準密度D1となる大きさΔLを採用しても良い。密度D1は最大密度Dmaxを所定値aで割った値(Dmax/a)を用いることができる。
【0035】
4)以上のようにして決定されたブロックが色領域S1である。色領域S2は,色空間から色領域S1およびその近傍を除いて,同様の処理をすることで求められる。
【0036】
5)色領域S3は,色空間から色領域S2,S3およびその近傍を除いて,同様の処理をすることで求められる。
【0037】
(4)色群C3の実質的存在の有無の判定(ステップS14)
色群C3の実質的存在の有無を判定する。具体的には,抽出された色領域S3中の画素の密度が所定の基準密度D0以上であれば,抽出された色領域S3は実質的に存在すると判定する。一方,抽出された色領域S3中の画素の密度が所定の基準密度D0より小さければ,抽出された色領域S3は一種のノイズ(誤差範囲)であり,色群C3は実質的に存在しない(マークが記入されていない)と判定する。
【0038】
(5)色群C2,C3の色差ΔCの判定(ステップS15)
色群C2,C3間の色差ΔCを算出する。色差ΔCは,例えば,次のようにして算出できる。
ΔC=((Lr2−Lr3)+(Lg2−Lg3)+(Lb2−Lb3)1/2
この色差ΔCを基準色差ΔC0と比較し,色群C3に対応する画素の色の変更の要否を判定する。色差ΔCが基準色差ΔC0より小さければ,色群C3に対応する画素の色の変更が必要と判断される。
【0039】
(6)色群C3に対応する画素の色の変更(ステップS16)
ステップS15で,色群C3に対応する画素の色の変更が必要と判断された場合,これらの画素の色が変更される。具体的には,色領域S3中の画素の色を色C31に変更する。色群C2との色差が確保されるよう,色C31が適宜に選択される。
【0040】
(7)色群C3に対応するマークの認識(ステップS17)
色群C3(または変更された色C31)に対応する画素から構成されるマークがどの項目に付されているかが認識される。具体的には,色群C3(または色C31)に対応し,かつ連続する画素を抽出し,これらの画素の中心(重心)の位置,即ち,マークが付された位置が認識される。さらに,テーブルT2を参照することで,この位置からマークが付された項目が判定される。この認識結果は,認識結果保持部132に保持される。
【0041】
(8)全マークエリアでの処理の有無の判定(ステップS18)
全てのマークアリアで,処理が実行されたか否かが判定され,未処理のマークエリアがあれば,ステップS13〜S17が繰り返し実行される。
【0042】
(9)マークの認識結果の訂正(ステップS19)
マークの認識結果が訂正される。具体的には,表示部140上に帳票の画像とマークの認識結果が表示され,画像と認識結果の相違の有無が操作者によって判断される。イメージと認識結果に相違がある場合,認識結果を訂正するための情報が入力部150によって入力される。なお,色群C3に対応する画素の色が変更された場合には,変更された色に基づく画像を表示部140上に表示することが好ましい。
【0043】
以上のように,画素の色の相違に基づき,印字された項目と区分して,記入されたマークを認識できる。特に,(1)項目とマークの重なりが大きい場合,(2)印字とマークの色の相違が小さい場合でも,マークを効果的に認識できる。(1),(2)のような場合,一般には,マークの認識率,ひいては,帳票の読み取り処理(エントリ)効率が低下する可能性がある。本実施形態では,画素の色の相違を用いて,マークの認識率の低下が防止される。その結果,帳票での項目とマークの配置と配色の自由度を確保できる。また,(2)の場合には,画像上のマークの色を変更することで(色の相違の拡大),マークのより確実な認識が可能となる。
【0044】
(その他の実施形態)
本発明の実施形態は上記の実施形態に限られず拡張,変更可能であり,拡張,変更した実施形態も本発明の技術的範囲に含まれる。
上記実施形態では,画素毎の色を用いて,色の群を抽出している。これに替えて,近接する複数の画素での色の平均値を用いることも可能である。
上記実施形態では,色空間としてRGB色空間を用いている。これに替えて,他の色空間,例えば,xyY色空間を用いても良い。
【図面の簡単な説明】
【0045】
【図1】本発明の一実施形態に係る帳票処理装置を表すブロック図である。
【図2】帳票の一部を表す図である。
【図3】帳票処理装置の動作手順の一例を表すフロー図である。
【図4】マークエリアでのR,G,Bそれぞれの輝度の分布を表すグラフである。
【図5】RGB色空間上にマークエリア中の画素の色を表した模式図である。
【図6】RGB色空間上でのブロックの大きさとブロック中での画素の密度の関係の一例を表すグラフである。
【符号の説明】
【0046】
100…帳票処理装置,110…読取装置,111…帳票保持部,112…帳票取出部,113…帳票読取部,120…装置本体,121…読取制御部,122…マークエリア決定部,123…色抽出部,124…色差判定部,125…色変更部,126…マーク認識部,127…認識結果訂正部,130…記憶部,131…画像保持部,132…認識結果保持部,133…訂正結果保持部,140…表示部,150…入力部

【特許請求の範囲】
【請求項1】
複数の項目が印字され,かつ選択される項目を表すマークが記入される領域を有する帳票を複数の画素を有する画像として読み取る読取部と,
前記領域内の画像から,画素に対応する画素の個数がそれぞれ1番目,2番目,および3番目に大きい第1,第2,および第3の色の群を抽出する抽出部と,
前記第2,第3の色の群間の色差が所定の基準色差より小さい場合に,前記第3の色の群に対応する画素の色を変更する色変更部と,
前記第3の色の群に対応する画素の色が変更された画像に基づいて,前記項目と区分してマークを認識する認識部と,
を具備することを特徴とする帳票処理装置。
【請求項2】
前記第1〜第3の色の群がそれぞれ,前記帳票の地色,前記印字された項目の色,および記入されたマークの色に対応する
ことを特徴とする請求項1記載の帳票処理装置。
【請求項3】
前記認識部での認識結果を表示する表示部と,
前記認識結果を訂正するための情報を入力する入力部と,
前記入力に基づいて,前記認識結果を訂正する認識結果訂正部と,
をさらに具備することを特徴とする請求項1または2に記載の帳票処理装置。
【請求項4】
複数の項目が印字され,かつ選択される項目を表すマークが記入される領域を有する帳票を複数の画素を有する画像として読み取る読取装置を制御する制御部と,
前記領域内の画像から,画素に対応する画素の個数がそれぞれ1番目,2番目,および3番目に大きい第1,第2,および第3の色の群を抽出する抽出部と,
前記第2,第3の色の群間の色差が所定の基準色差より小さい場合に,前記第3の色の群に対応する画素の色を変更する色変更部と,
前記第3の色の群に対応する画素の色が変更された画像に基づいて,前記項目と区分してマークを認識する認識部として,
コンピュータを機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2009−152757(P2009−152757A)
【公開日】平成21年7月9日(2009.7.9)
【国際特許分類】
【出願番号】特願2007−327515(P2007−327515)
【出願日】平成19年12月19日(2007.12.19)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】