説明

マーク認識装置およびマーク認識方法

【課題】プレ印刷文字を含む帳票上に記入されたマークを、プレ印刷文字の情報を予め登録することなしに認識可能なマーク認識装置を提供する。
【解決手段】マーク認識対象領域の画像の範囲内で、走査ライン毎に画素集合の分布幅を検出する投影情報作成部131と、走査ライン毎の画素集合の分布幅を比較し、分布幅が所定の閾値以上となる走査ラインで構成される文字範囲を検出する文字範囲検出部133と、分布幅が所定の閾値未満となる走査ラインで構成されるマーク範囲であって、文字範囲の両側の範囲で、画素集合の分布範囲を近似する矩形領域を各々に検出するマーク範囲検出部134と、文字範囲の両側の範囲で各々に検出された矩形領域を、文字範囲を介して結合し、認識対象領域の画像上において結合された矩形領域の座標を特定するマーク範囲結合部135と、を含むマーク認識装置が提供される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マーク認識の装置および方法に関し、特に、予め印刷された文字を含む帳票上に記入されたマークの位置を、文字およびマークを画素集合として表現する帳票画像上で認識する、マーク認識の装置および方法に関する。
【背景技術】
【0002】
一般に、定型文書である帳票上に記入されたマークを認識するには、帳票上に予め印刷された文字(以下、プレ印刷文字とも称する。)と、記入されたマークとを判別する必要がある。このために、例えば、予め登録されたプレ印刷文字の情報(位置や大きさ等)を用いてプレ印刷文字を除去することでマークのみを認識する装置や、文字列表記知識などを用いてプレ印刷文字およびマークを共に認識する装置が知られている。
【0003】
特に、前者の装置では、プレ印刷文字を含む帳票の画像をマークが記入されていない状態で読取り、ディスプレイ上に表示された帳票画像上で、マウスなどのポインティングデバイスを用いて、プレ印刷文字の情報を記憶装置内などに予め登録しておく必要がある。また、このような登録作業には多大な労力や作業時間を要するため、登録作業の一部を自動処理する装置も知られている。
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、依然として登録作業には労力や作業時間を要するとともに、プレ印刷文字の情報を予め登録しておく記憶装置などには多大な負荷が課せられているのが実状である。
【0005】
本発明は上記問題点に鑑みてなされたものであり、その目的は、予め印刷された文字を含む帳票上に記入されたマークを、予め印刷された文字の情報を予め登録することなしに認識可能な、新規かつ改良された、マーク認識の装置および方法を提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の第1の観点によれば、予め印刷された文字を含む帳票上に記入されたマークの位置を、文字およびマークを画素集合として表現する帳票画像上で認識するマーク認識装置が提供される。ここで、本装置は、マーク認識の対象とされる認識対象領域の画像の範囲内で、走査ライン毎に画素集合の分布幅を検出する投影情報作成部と、走査ライン毎の画素集合の分布幅を比較し、分布幅が所定の閾値以上となる走査ラインで構成される文字範囲を検出する文字範囲検出部と、を含む。さらに、本装置は、分布幅が所定の閾値未満となる走査ラインで構成されるマーク範囲であって、文字範囲の両側の範囲で、画素集合の分布範囲を近似する矩形領域を各々に検出するマーク範囲検出部と、文字範囲の両側の範囲で各々に検出された矩形領域を、文字範囲を介して結合し、認識対象領域の画像上において結合された矩形領域の座標を特定するマーク範囲結合部と、を含む。
【0007】
一般に、帳票上に記入されたマークは、プレ印刷文字より大きく、プレ印刷文字の文字列方向と直交する方向の両側にはみ出している。よって、走査ラインの方向がプレ印刷文字の文字列方向と略一致すれば、プレ印刷文字を含む範囲を構成する走査ラインでは、画素集合の開始位置と終了位置との差分として定義される、画素集合の分布幅が、プレ印刷文字を含まない範囲を構成する走査ラインに比して大きくなる。かかる構成によれば、文字範囲検出部において、走査ライン毎の画素集合の分布幅を比較し、分布幅が所定の閾値以上となる走査ラインで構成される文字範囲を検出することで、帳票上でプレ印刷文字を含む範囲が検出される。さらに、マーク範囲検出部において、分布幅が所定の閾値未満となる走査ラインで構成されるマーク範囲であって、文字範囲の両側で、画素集合の分布範囲を近似する矩形領域を各々に検出することで、マークを含むマーク範囲が検出される。ここで、マーク範囲結合部において、文字範囲の両側で矩形領域として各々に検出された、マーク範囲が、文字範囲を介して互いに結合されて1つの矩形領域として表され、認識対象領域の画像上における当該矩形領域の座標がマークの座標として特定される。これにより、プレ印刷文字を含む帳票上に記入されたマークの位置が、プレ印刷文字の情報を予め登録することなしに認識可能となる。
【0008】
また、マーク認識の対象とされる認識対象領域の画像の範囲内で、走査ライン毎に画素集合の分布幅を検出する前に、認識対象領域の画像の範囲内で走査ライン毎に画素の累積値を検出するようにしてもよい。かかる構成によれば、投影情報作成部において、走査ライン毎に算出された画素の累積値に応じて、認識対象領域の画像の範囲内で画素集合の分布幅を検出すべき走査ラインが効率的に特定されうる。
【0009】
また、矩形領域の検出に際しては、所定の閾値未満の大きさを伴う矩形領域を検出誤差として処理するようにしてもよい。かかる構成によれば、マーク範囲結合部において、所定の閾値未満の大きさを伴う矩形領域を検出誤差として処理することで、マークを含む範囲が適切に検出されうる。
【0010】
また、本発明の第2の観点によれば、予め印刷された文字を含む帳票上に記入されたマークの位置を、文字およびマークを画素集合として表現する帳票画像上で認識するマーク認識装置が提供される。ここで、本装置は、マーク認識の対象とされる認識対象領域の画像を、収縮処理して収縮画像を作成する膨張収縮画像作成部と、収縮画像上で画素集合の分布範囲を近似する矩形領域を検出し、認識対象領域の画像上において矩形領域の座標を特定するマーク範囲検出部と、を含む。
【0011】
一般に、帳票上に記入されたマークは、プレ印刷文字より大きな線幅を伴う。よって、認識対象領域の画像を適切な収縮度で収縮処理して作成された収縮画像上では、相対的に小さな線幅を伴うプレ印刷文字を表す画素集合の大部分が除去され、相対的に大きな線幅を伴うマークを表す画素集合が残される。かかる構成によれば、膨張収縮画像作成部において、認識対象領域の画像を収縮処理して収縮画像を作成することで、マークを表す画素集合が抽出される。さらに、マーク範囲検出部において、収縮画像上でマークを表す画素集合の分布範囲を近似する矩形領域を検出することで、マークを含む範囲が検出され、認識対象領域の画像上における当該矩形領域の座標がマークの座標として特定される。これにより、プレ印刷文字を含む帳票上に記入されたマークの位置が、プレ印刷文字の情報を予め登録することなしに検出可能となる。本装置は、特に、マークがプレ印刷文字と略同一の大きさを伴い、プレ印刷文字の文字列方向と直交する方向の両側にはみ出しておらず、本発明の第1の観点により提供される装置を適用不能な場合に効果的に適用されうる。
【0012】
また、収縮処理時の収縮度が、認識対象領域の画像の範囲内で算出された、画素集合の平均線幅に基づいて設定されるようにしてもよい。かかる構成によれば、膨張収縮画像作成部において、マークとプレ印刷文字との線幅に応じて、認識対象領域の画像の範囲内において適切な収縮度が設定されうる。
【0013】
また、矩形領域の検出に際しては、所定の閾値未満の大きさを伴う矩形領域を検出誤差として処理するようにしてもよい。かかる装置によれば、マーク範囲検出部において、所定の閾値未満の大きさを伴う矩形領域を検出誤差として処理することで、マークを含む範囲が適切に検出されうる。
【0014】
また、本装置は、画素集合の分布範囲を近似する矩形領域として検出された収縮画像を、収縮処理時の収縮度を補償する膨張度で膨張処理して膨張画像を作成するマーク座標検出部と、膨張画像で認識対象領域の画像をマスク処理する文字認識画像作成部と、マスク処理された認識対象領域の画像上で、予め印刷された文字を認識する文字認識部と、をさらに含むようにしてもよい。かかる構成によれば、マーク座標検出部において、画素集合の分布範囲を近似する矩形領域として検出された収縮画像を収縮処理時の収縮度を補償する膨張度で膨張処理して膨張画像を作成することで、マークを表す画素集合が復元される。そして、文字認識画像作成部において、膨張画像で認識対象画像をマスク処理することで、マスク処理された認識対象画像上では、マークを表す画素集合の大部分が除去され、プレ印刷文字を表す画素集合が抽出される。さらに、文字認識部において、抽出されたプレ印刷文字を認識することで、マークで選択されたプレ印刷文字が認識される。これにより、プレ印刷文字を含む帳票上に記入されたマークで選択されたプレ印刷文字が、プレ印刷文字の情報を予め登録することなしに認識可能となる。本装置は、特に、プレ印刷文字が異なる帳票を同一の帳票として取扱う場合など、プレ印刷文字の内容が予め既知でない場合に効果的に適用されうる。
【0015】
また、認識された文字をコード化された文字列に変換して出力するようにしてもよい。かかる構成によれば、プレ印刷文字を含む帳票上に記入されたマークで選択されたプレ印刷文字が、プレ印刷文字の情報を予め登録することなしに、コード化された文字列として識別されうる。
【0016】
また、本発明の第3の観点によれば、予め印刷された文字を含む帳票上に記入されたマークの位置を、文字およびマークを画素集合として表現する帳票画像上で認識するマーク認識装置が提供される。ここで、本装置は、マーク認識の対象とされる認識対象領域の画像の範囲内で、マーク位置の座標を検出するマーク座標検出部と、マーク抽出画像を作成するマーク抽出画像作成部と、マーク抽出画像によって帳票画像からマークを除去した画像を得るマーク除去画像作成部と、マーク除去画像のうちマーク位置の座標情報により特定される領域に含まれる文字を認識する文字認識部と、を含む。
【0017】
かかる構成によれば、マーク座標検出部において、マーク認識の対象とされる認識対象領域の画像の範囲内で、マーク位置の座標が検出され、マーク抽出画像作成部において、マーク抽出画像が作成される。そして、マーク除去画像作成部において、マーク抽出画像によって帳票画像からマークを除去した画像が得られ、文字認識部において、マーク除去画像のうちマーク位置の座標情報により特定される領域に含まれる文字が認識される。これにより、プレ印刷文字を含む帳票上に記入されたマークで選択されたプレ印刷文字が、プレ印刷文字の情報を予め登録することなしに認識可能となる。本装置は、特に、プレ印刷文字が異なる帳票を同一の帳票として取扱う場合など、プレ印刷文字の内容が予め既知でない場合に効果的に適用されうる。
【0018】
また、本発明の第4の観点によれば、予め印刷された文字を含む帳票上に記入されたマークの位置を、文字およびマークを画素集合として表現する帳票画像上で認識するマーク認識方法が提供される。ここで、本方法は、マーク認識の対象とされる認識対象領域の画像の範囲内で、走査ライン毎に画素集合の分布幅を検出する第1のステップと、走査ライン毎の画素集合の分布幅を比較し、分布幅が所定の閾値以上となる走査ラインで構成される文字範囲を検出する第2のステップと、を含む。さらに、本方法は、分布幅が所定の閾値未満となる走査ラインで構成されるマーク範囲であって、文字範囲の両側の範囲で、画素集合の分布範囲を近似する矩形領域を各々に検出する第3のステップと、文字範囲の両側の範囲で各々に検出された矩形領域を、文字範囲を介して結合し、認識対象領域の画像上において結合された矩形領域の座標を特定する第4のステップと、を含む。
【0019】
かかる方法によれば、帳票上に記入されたマークとプレ印刷文字との大きさの相違に基づいてマークを認識可能なマーク認識方法が提供される。
【0020】
また、本発明の第5の観点によれば、予め印刷された文字を含む帳票上に記入されたマークの位置を、文字およびマークを画素集合として表現する帳票画像上で認識するマーク認識方法が提供される。ここで、本方法は、マーク認識の対象とされる認識対象領域の画像を、収縮処理して収縮画像を作成する第1のステップと、収縮画像上で画素集合の分布範囲を近似する矩形領域を検出し、認識対象領域の画像上において矩形領域の座標を特定する第2のステップと、を含む。
【0021】
かかる方法によれば、帳票上に記入されたマークとプレ印刷文字との線幅の相違に基づいてマークを認識可能なマーク認識方法が提供される。
【0022】
また、本方法は、画素集合の分布範囲を近似する矩形領域として検出された収縮画像を、収縮処理時の収縮度を補償する膨張度で膨張処理して膨張画像を作成する第3のステップと、膨張画像で認識対象領域の画像をマスク処理する第4のステップと、マスク処理された認識対象領域の画像上で、予め印刷された文字を認識する第5のステップと、をさらに含むようにしてもよい。かかる方法によれば、収縮画像の膨張処理と膨張画像によるマスク処理とに基づいてマークを認識可能なマーク認識方法が提供される。
【発明の効果】
【0023】
以上説明したように、本発明によれば、予め印刷された文字を含む帳票上に記入されたマークを、予め印刷された文字の情報を予め登録することなしに認識可能な、マーク認識の装置および方法が提供される。
【発明を実施するための最良の形態】
【0024】
以下に、添付した図面を参照しながら、本発明の好適な実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0025】
(第1の実施形態)
図1は、本発明の第1の実施形態に係るマーク認識装置100(以下、単に「認識装置」とも称する。)の構成を処理の流れに沿って概念的に示すブロック図である。本実施形態に係る認識装置100は、例えば、制御部110、画像バッファ部120およびマーク座標検出部130で構成される。なお、認識装置100は、例えば、操作入力部や画像入力部(いずれも不図示)などを含む上位装置10に制御部110を介して接続される。
【0026】
以下、本実施形態に係る認識装置100を構成する各部の機能について説明する。制御部110は、認識装置100全体の制御手段と、上位装置10−認識装置100間の通信手段とを有する。画像バッファ部120は、上位装置10から入力された認識対象画像を一次的に保存する手段を有する。ここで、認識対象画像には、帳票上のプレ印刷文字およびマークが図形成分を表す画素集合として表現されている。マーク座標検出部130は、認識対象画像上におけるマークの座標を検出する手段を有する。
【0027】
さらに、マーク座標検出部130は、例えば、投影情報作成部131、投影情報保存部132、文字範囲検出部133、マーク範囲検出部134、マーク範囲結合部135およびマーク座標保存部136で構成される。
【0028】
投影情報作成部131は、認識対象画像の範囲内で走査ライン毎の画素の累積値を検出する手段と、走査ライン毎の画素集合の開始位置および終了位置を検出する手段と、検出された走査ライン毎の画素の累積値と画素集合の開始位置および終了位置とを投影情報保存部132に一時的に保存させる手段とを有する。投影情報保存部132は、投影情報作成部131で検出された走査ライン毎の画素の累積値と画素集合の開始位置および終了位置とを一時的に保存する手段を有する。
【0029】
文字範囲検出部133は、投影情報保存部132に保存された情報を参照し、走査ライン毎の画素集合の分布幅を比較して文字範囲を検出する手段を有する。マーク範囲検出部134は、文字範囲検出部133で検出された文字範囲の画像の両側でマークの画像の範囲を近似する矩形領域を各々に検出する手段を有する。
【0030】
マーク範囲結合部135は、マーク範囲検出部134で検出された矩形領域から所定の閾値未満の大きさを伴う矩形領域を検出誤差として除去する手段と、文字範囲の画像の両側で各々に検出された矩形領域を結合する手段と、結合された矩形領域の座標をマーク座標保存部136に一時的に保存させる手段とを有する。マーク座標保存部136は、マーク範囲結合部135で検出されたマーク座標を一時的に保存する手段を有する。
【0031】
以下、図1〜図5を参照することで、処理の流れに沿って認識装置100を構成する各部の処理内容について説明する。図2〜図5は、マーク座標検出部130で行われる処理の一部を概略的に示す説明図であって、説明の便宜上、認識対象画像上での処理に関連する、プリ印刷文字およびマークの周囲の画素のみが示されている。
【0032】
帳票上の認識対象画像は、画像入力部(不図示)などを介して上位装置10に入力された上で、制御部110を介して認識装置100に入力される。画像バッファ部120では、認識装置100に入力された認識対象画像が一時的に保存される。マーク座標検出部130では、画像バッファ部120に保存された認識対象画像がマーク座標の検出に用いられる。マーク座標検出部130で検出されたマーク座標は、制御部110を介して上位装置10に出力される。
【0033】
マーク座標検出部130では、図2〜図5に示すように、以下の処理が実行される。投影情報作成部131では、認識対象画像の範囲内で走査ライン毎の画素が読取られる。すなわち、図2に例示するように、認識対象画像150に対して、走査ライン毎の画素が読取られる。ここで、認識対象画像上の座標範囲が(i0、j0)〜(i1、j1)、(i0<i1、j0<j1)で規定されるものとする。
【0034】
投影情報作成部131では、まず、走査ライン毎にプレ印刷文字およびマークを表す画素集合の累積値が検出される。そして、画素集合の累積値が所定値以上である走査ラインの範囲が、マーク座標の検出処理に用いられる認識対象画像として再定義される。すなわち、図2に例示するように、画素集合の累積値nが1以上となる走査ラインj0’〜j1’の範囲が、認識対象画像153として再定義される。ここでは、画素集合の累積値nが1以上という条件をもって、認識対象画像153として再定義する場合を示すが、累積値nが1以上という条件に限定されるものではない。例えば、画像にノイズが混入することを予め考慮して、累積値nを例えば10以上に設定してもよく、また、画像の解像度に応じて設定するようにしてもよい。
【0035】
そして、再定義された認識対象画像の範囲内で、走査ライン毎に画素集合の開始位置と終了位置とが検出されることで、画素集合の分布幅が検出される。ここで、画素集合の分布幅とは、走査ライン毎の画素集合の開始位置と終了位置との差分として定義される。図2に例示するように、走査ラインjでは、画素集合の開始位置および終了位置がsjおよびejとして各々に検出されることで、走査ラインjの画素集合の分布幅wj(=ej−sj+1、ej≧sj)が算出される。さらに、投影情報作成部131では、これらの投影情報(走査ライン毎の画素集合の累積値n、開始/終了位置s,eおよび分布幅w)を投影情報保存部132に一時的に保存させる。
【0036】
投影情報保存部132では、走査ライン毎の投影情報が一時的に保存される。図5は、投影情報保存部132に保存された投影情報を、説明の便宜上、イメージ的に示すものである。図5では、認識対象画像150上の走査ラインが縦軸に示され、走査ライン毎の画素集合の累積値n(白点)、および分布幅w(黒点)が横軸に各々に示されている。
【0037】
文字範囲検出部133では、走査ライン毎に画素集合の分布幅が比較され、文字範囲が検出される。すなわち、図5に例示するように、画素集合の分布幅が所定の閾値wt1以上となる走査ラインjc0〜jc1で構成される範囲が、プレ印刷文字を含む文字範囲hc(=jc1−jc0+1)として検出される。ここで、所定の閾値wt1としては、例えば、認識対象画像153の範囲内で画素集合の分布幅wが最大となる走査ラインの分布幅wmaxの1/4未満という条件が適用されうる。なお、閾値wt1としては、この条件以外にも、例えば、認識対象画像150、153の構成に応じて、分布幅wとの比率を調整したり、基準となる走査ラインの分布幅wを調整したり、分布幅wに依存しない固有値としたりしてもよい。また、閾値wt1は、投影情報作成部131でマーク座標の検出に用いた累積値nより十分に大きな値とする。
【0038】
マーク範囲検出部134では、文字範囲の画像の両側でマークの画像の範囲が検出される。図3に例示するように、走査ラインj0’〜jc0−1および走査ラインjc1+1〜j1’の範囲でマーク画像の範囲が各々に検出される。そして、走査ラインj0’〜jc0−1の範囲からは、マーク画像の範囲を近似する矩形領域R1が検出され、走査ラインjc1+1〜jc1’の範囲からは、マーク範囲を近似する矩形領域R2が検出される。ここで、矩形領域R1およびR2は、(ir10、jr10)〜(ir11、jr11)および(ir20、jr20)〜(ir21、jr21)の座標範囲を各々に有する。
【0039】
マーク範囲結合部135では、検出された矩形領域の大きさが確認され、その大きさが所定の閾値未満であると判断されれば、当該矩形領域で近似されるマーク範囲が検出誤差とみなされて除去される。所定の閾値wt2としては、例えば、矩形領域を構成する画素集合の分布幅wが文字範囲hcの1/4未満という条件が適用されうる。ここで、所定の閾値wt2としては、文字範囲hcに対して、矩形領域を構成する画素集合の分布幅w、すなわちi方向の幅で規定するのみならず、j方向の幅またはi,j両方向の幅で規定するような条件が適用されてもよい。
【0040】
図3に示す例によれば、文字範囲hcが15画素であり、矩形領域R1およびR2を構成する画素集合の分布幅wが各々に46および44画素である。よって、矩形領域R1およびR2は、それらの大きさが所定の閾値(wt2=hc/4=3.75)以上であると判断され、マーク範囲とみなされる。そして、マーク範囲結合部135では、マーク範囲を近似する矩形領域R1およびR2が、文字範囲を介して1つの矩形領域R0として結合される。すなわち、矩形領域R1およびR2を包含する座標範囲(ir20,jr10)〜(ir11、jr21)を有する矩形領域R0が、帳票上に記入されたマークを含む範囲に相当するマーク範囲として検出される。そして、マーク範囲結合部135では、矩形領域R0の座標範囲をマーク座標としてマーク座標保存部136に一時的に保存させる。これにより、図3の例では、「昭和」の位置にマークが記入されている旨が検出される。
【0041】
一方、図4に示す例によれば、矩形領域R2’を構成する画素集合の分布幅wが3画素である。よって、矩形領域R2’は、その大きさが所定の閾値wt2未満であると判断され、検出誤差とみなされて除去される。この場合には、マーク範囲結合部135では、座標範囲(ir10,jr10)〜(ir11、jc1)を有する矩形領域R0’が、帳票上に記入されたマークを含む範囲に相当するマーク範囲として検出される。そして、マーク範囲結合部135では、矩形領域R0’の座標範囲をマーク座標としてマーク座標保存部136に一時的に保存させる。これにより、図4の例では、「昭和」の位置にマークが記入されている旨が検出される。
【0042】
マーク座標保存部136では、矩形領域R0またはR0’の座標範囲がマーク座標として一時的に保存される。そして、マーク座標検出部130で検出されたマーク座標は、制御部110を介して上位装置10に出力される。
【0043】
以上、本発明の第1の実施形態に係るマーク認識装置100について説明した。一般に、帳票上に記入されたマークは、プレ印刷文字より大きく、プレ印刷文字の文字列方向と直交する方向の両側にはみ出している。よって、走査ラインの方向がプレ印刷文字の文字列方向と略一致すれば、プレ印刷文字を含む範囲を構成する走査ラインでは、画素集合の開始位置と終了位置との差分として定義される、画素集合の分布幅が、プレ印刷文字を含まない範囲を構成する走査ラインに比して大きくなる。
【0044】
本実施形態によれば、文字範囲検出部133において、走査ライン毎の画素集合の分布幅wを比較し、分布幅wが所定の閾値wt1以上となる走査ラインで構成される文字範囲hcを検出することで、帳票上でプレ印刷文字を含む範囲が検出される。さらに、マーク範囲検出部134において、分布幅wが所定の閾値wt1未満となる走査ラインで構成されるマーク範囲であって、文字範囲の両側で、画素集合の分布範囲を近似する矩形領域R1およびR2を各々に検出することで、マークを含むマーク範囲が検出される。ここで、マーク範囲結合部135において、文字範囲の両側で矩形領域として各々に検出された、マーク範囲R1およびR2が、文字範囲を介して互いに結合されて1つの矩形領域R0として表され、認識対象領域の画像150,153上における当該矩形領域R0の座標がマーク座標として特定される。これにより、プレ印刷文字を含む帳票上に記入されたマークの位置が、プレ印刷文字の情報を予め登録することなしに検出可能となる。
【0045】
また、本実施形態では、投影情報作成部131において、走査ライン毎に算出された画素の累積値に応じて、認識対象領域の画像150の範囲内で画素集合の分布幅wを検出すべき走査ラインが効率的に特定されるようにしてもよい。
【0046】
なお、前述の説明においては、i方向の走査ライン(横書きのプレ印刷文字)に適用される場合の実施形態が例示されているが、本発明の適用対象は、かかる実施形態のみに限定されるものではない。すなわち、本発明は、例えば、走査ラインがj方向(縦書きのプレ印刷文字)である場合においても、同様に適用可能なものである。
【0047】
また、前述の説明においては、走査ライン毎に画素集合の開始位置sと終了位置eとが検出されることで、走査ライン毎に画素集合の分布幅wが検出される場合の実施形態が例示されているが、本発明は、かかる実施形態のみに限定されるものではない。すなわち、本発明は、例えば、走査ライン毎の画素集合の分布幅wが予め記録部などにより記録されており、予め記録された情報を用いることで、走査ライン毎の画素集合の開始位置sと終了位置eとが検出されない場合においても、同様に適用可能なものである。
【0048】
(第2の実施形態)
図4は、本発明の第2の実施形態に係るマーク認識装置200(以下、単に「認識装置」とも称する。)の構成を処理の流れに沿って概念的に示すブロック図である。本実施形態に係る認識装置200は、例えば、制御部210、画像バッファ部220およびマーク座標検出部230で構成される。
【0049】
以下、本実施形態に係る認識装置200を構成する各部の機能について説明する。なお、第1の実施形態と同一の機能構成を有する部分についての重複説明は省略する。ここで、認識装置200を構成するマーク座標検出部230は、例えば、平均線幅算出部231、膨張収縮画像作成部232、膨張収縮画像バッファ部233、マーク範囲検出部234、マーク座標保存部235で構成される。
【0050】
平均線幅算出部231は、画像バッファ部220に保存された認識対象画像を構成する画素集合の平均線幅を算出する手段を有する。膨張収縮画像作成部232は、画像バッファ部220などに保存された認識対象画像から膨張画像および収縮画像を作成する手段と、膨張収縮画像バッファ部233に一時的に保存させる手段とを有する。膨張収縮画像バッファ部233は、膨張収縮画像作成部232で作成された膨張収縮画像を一時的に保存する手段を有する。
【0051】
マーク範囲検出部234は、膨張収縮画像バッファ部233に保存された収縮画像からマーク画像の範囲を近似する矩形領域を検出する手段を有する。マーク座標保存部235は、マーク範囲検出部234で検出されたマーク座標を一時的に保存する手段を有する。
【0052】
以下、図6〜図8を参照することで、処理の流れに沿って認識装置200を構成する各部の処理内容について説明する。なお、図7および図8は、マーク座標検出部230で行われる処理の一部を概略的に示す説明図であって、説明の便宜上、認識対象画像上での処理に関連する、プリ印刷文字およびマークの周囲の画素のみが示されている。
【0053】
マーク座標検出部230では、図7および図8に示すように、以下の処理が実行される。ここで、認識対象画像上の画像座標が、(i0,j0)〜(i1,j1)、(i0<i1、j0<j1)で規定されるものとする。
【0054】
平均線幅算出部231では、画像バッファ部230に保存された認識対象画像を構成する画素集合の平均線幅が算出される。すなわち、図7に例示するように、認識対象画像250を構成する画素集合から、連結領域を構成する画素集合が抽出され、当該画素集合毎の平均線幅が算出された上で、認識対象画像250を構成する連結領域全体としての平均線幅が算出される。
【0055】
膨張収縮画像作成部232では、画像バッファ部220に保存された認識対象画像から収縮処理により収縮画像が作成される。なお、画像の収縮処理とは、与えられた図形成分(プレ印刷文字およびマーク)の境界にある画素の値を背景成分の画素の値に変換して任意画素分縮める処理を意味する。
【0056】
図7に示す例によれば、認識対象画像250を構成する画素集合の平均線幅の3/4に相当する収縮度および1/2に相当する収縮度で、認識対象画像250を段階的に収縮処理した収縮画像252,254が各々に作成される。収縮処理された認識対象画像254では、プレ印刷文字を表す画素集合の大部分が除去され、マークを表す画素集合が残される。そして、膨張収縮画像作成部232では、収縮画像254を膨張収縮画像バッファ部233に一時的に保存させる。
【0057】
マーク範囲検出部234では、収縮処理された認識対象画像上でマークの画像の範囲が検出される。図8に示す例によれば、収縮画像254上で、各々に連結領域を構成する画素集合が、マーク画像の範囲を近似する矩形領域R1,R2およびR3として検出される。ここで、矩形領域R1、R2およびR3は、(ir10、jr10)〜(ir11、jr11)、(ir20、jr20)〜(ir21、jr21)および(ir30、jr30)〜(ir30、jr31)の座標範囲を各々に有する。
【0058】
さらに、マーク範囲検出部234では、検出された矩形領域の大きさが確認され、その大きさが所定の閾値未満であると判断されれば、当該矩形領域で近似されるマーク範囲が検出誤差とみなされて除去される。所定の閾値wt3としては、例えば、矩形領域を構成する画素集合の分布幅wが認識対象画像250の幅wi(=i1−i0+1,i1>i0)の1/10未満という条件が適用されうる。ここで、所定の閾値wt3としては、認識対象画像250の幅wiに対して、矩形領域を構成する画素集合の分布幅w、すなわちi方向の幅で規定するのみならず、j方向の幅またはi,j両方向の幅で規定するような条件が適用されてもよい。また、所定の閾値wt3は、認識対象画像250の幅wiに対してのみならず、認識対象画像250の幅wjに対して規定するような条件が適用されてもよく、または、認識対象画像250の幅wi,wjに依存しない固有値が適用されてもよい。
【0059】
ここで、図8に示す例によれば、認識対象画像250の幅wiが144画素であり、矩形領域R1、R2およびR3を構成する画素集合の分布幅が各々に47画素、47画素および1画素である。よって、矩形領域R1およびR2は、それらのi方向の幅が所定の閾値(wt3=wi/10=14.4)以上であると判断され、検出誤差とはみなされない。一方、矩形領域R3は、そのi方向の幅が所定の閾値wt3未満であると判断され、検出誤差とみなされて除去される。
【0060】
そして、マーク範囲検出部234では、マーク範囲を近似する複数の矩形領域が結合される。すなわち、図8に例示するように、矩形領域R1およびR2を包含する座標範囲(ir20,jr10)〜(ir11、jr21)を有する矩形領域R0が、帳票上に記入されたマークを含む範囲に相当するマーク範囲として検出される。そして、マーク範囲検出部234では、矩形領域R0の座標範囲をマーク座標としてマーク座標保存部235に一時的に保存させる。
【0061】
マーク座標保存部235では、矩形領域R0の座標範囲がマーク座標として一時的に保存される。そして、マーク座標検出部230で検出されたマーク座標は、制御部210を介して上位装置10に出力される。
【0062】
以上、本発明の第2の実施形態に係るマーク認識装置200について説明した。一般に、帳票上に記入されたマークは、プレ印刷文字より大きな線幅を伴う。よって、認識対象領域の画像を適切な収縮度で収縮処理して作成された収縮画像上では、相対的に小さな線幅を伴うプレ印刷文字を表す画素集合の大部分が除去され、相対的に大きな線幅を伴うマークを表す画素集合が残される。
【0063】
本実施形態によれば、膨張収縮画像作成部232において、認識対象領域250の画像を収縮処理して収縮画像254を作成することで、マークを表す画素集合が抽出される。さらに、マーク範囲検出部234において、収縮画像254上でマークを表す画素集合の分布範囲を近似する矩形領域R0を検出することで、マークを含む範囲が検出され、認識対象領域250の画像上における当該矩形領域R0の座標がマーク座標として特定される。これにより、プレ印刷文字を含む帳票上に記入されたマークの位置が、プレ印刷文字の情報を予め登録することなしに検出可能となる。なお、本実施形態は、特に、マークがプレ印刷文字と略同一の大きさを伴い、プレ印刷文字の文字列方向と直交する方向の両側にはみ出しておらず、第1の実施形態に係る認識装置を適用不能な場合に効果的に適用されうる。
【0064】
また、本実施形態では、収集膨張画像作成部232において、収縮処理時の収縮度が、認識対象領域250の画像の範囲内で算出された、画素集合の平均線幅に基づいて設定されるようにしてもよい。かかる構成によれば、マークとプレ印刷文字との線幅に応じて、認識対象領域の画像の範囲内において適切な収縮度が設定されうる。
【0065】
なお、前述の説明においては、収縮処理時の収縮度が画素集合の平均線幅に基づいて設定される場合の実施形態が例示されているが、本発明は、かかる実施形態のみに限定されるものではない。すなわち、本発明は、例えば、収縮処理時の収縮度が画素集合の平均線幅に依存せずに、所定の固有値に基づいて設定される場合や、他の条件に基づいて設定される場合においても、同様に適用可能なものである。
【0066】
(第3の実施形態)
図9は、本発明の第3の実施形態に係るマーク認識装置300(以下、単に「認識装置」とも称する。)の構成を処理の流れに沿って概念的に示すブロック図である。本実施形態に係る認識装置300は、例えば、制御部310、画像バッファ部320およびマーク座標検出部330、マーク画像バッファ部340、文字認識画像作成部350、文字認識画像バッファ部360および文字認識部370で構成される。
【0067】
以下、本実施形態に係る認識装置300を構成する各部の機能について説明する。なお、第1および第2の実施形態と同一の機能構成を有する部分についての重複説明は省略する。
【0068】
マーク座標検出部330内の膨張収縮画像作成部332では、マーク座標検出に用いられた収縮画像を、収縮処理時の収縮度を補償するような膨張度で膨張処理することで、膨張画像が予め作成される。
【0069】
マーク画像バッファ部340は、膨張収縮画像作成部332で作成された膨張画像、すなわち、マークのみを抽出したマーク抽出画像、を一次的に保存する手段を有する。文字認識画像作成部350は、画像バッファ部320に保存された認識対象画像とマーク画像バッファ部340に保存された膨張画像とを用いて文字認識画像を作成する手段と、文字認識画像バッファ部360に一時的に保存させる手段とを有する。
【0070】
文字認識画像バッファ部360は、文字認識画像作成部350で作成した文字認識画像を一時的に保存する手段を有する。文字認識部370は、文字認識画像バッファ部360に保存された文字認識画像から、プレ印刷文字を切り出して文字認識を行う手段を有する。
【0071】
以下、図9および図10を参照することで、処理の流れに沿って認識装置300を構成する各部の処理内容について説明する。なお、図10は、膨張収縮画像作成部332および文字認識画像作成部350で行われる処理の一部を概略的に示す説明図であって、説明の便宜上、認識対象画像上での処理に関連する、プリ印刷文字およびマークの周囲の画素のみが示されている。
【0072】
膨張収縮画像作成部332、およびマーク画像バッファ部340〜文字認識部370では、図9および図10に示すように、以下の処理が実行される。なお、マーク座標検出部330でマーク座標を検出するまでの処理は、第2の実施形態と同様である。
【0073】
膨張収縮画像作成部332では、マーク座標検出に用いられた収縮画像から膨張処理により膨張画像が作成される。なお、画像の膨脹処理とは、収縮処理とは逆に図形成分(プレ印刷文字およびマーク)の境界画素に接する背景成分中の画素の値を図形成分の画素の値に変換して任意画素分膨らませる処理を意味する。
【0074】
すなわち、図10に例示するように、収縮画像380の収縮度を補償するような膨張度で、収縮画像380を膨張処理した膨張画像382が作成される。膨張画像382では、マークを表す画像が明確に復元されている。そして、膨張収縮画像作成部332では、膨張収縮画像作成部332で作成された膨張画像382をマーク画像バッファ部340に一時的に保存させる。
【0075】
マーク画像バッファ部340では、膨張収縮画像作成部332で作成された膨張画像382を一次的に保存する。
【0076】
文字認識画像作成部350では、マーク画像バッファ部340に保存された膨張画像382を用いて、画像バッファ部320に保存された認識対象画像(例えば、図7の250)をマスク処理する。すなわち、認識対象画像250に膨張画像382が重畳された上で、膨張画像382上の画素値(ここでは、説明の便宜上、図形成分の画素値を“1”とする。)と、認識対象画像250上の対応する画素値との排他的論理和に応じて、認識対象画像250をマスク処理する。これにより、マスク処理された認識対象画像384上では、マーク画像を表す画素集合の大部分が除去され、マーク座標(ir20、jr10)〜(ir11、jr21)の範囲で、プレ印刷文字を表す画素集合が文字認識画像R0として抽出される。そして、文字認識画像作成部350では、文字認識画像R0を文字認識画像バッファ部360に一時的に保存させる。すなわち、文字認識画像作成部350は、マーク除去画像作成部としても捉えることができる。
【0077】
文字認識画像バッファ部360では、文字認識画像作成部350で作成された文字認識画像R0を一時的に保存する。
【0078】
文字認識部370では、文字認識画像バッファ部360に保存された文字認識画像R0からプレ印刷文字を表す画像を切り出して認識処理する。これにより、マークを記入されたプレ印刷文字が認識される。そして、文字認識部370で認識されたプレ印刷文字は画像として、制御部310を介して上位装置10に出力される。また、認識されたプレ印刷文字の画像がパターン認識処理等により変換され、コード化された文字列として出力されるようにしてもよい。これにより、図10の例では、マークで囲まれた文字である「昭和」が文字認識されて出力される。なお、マーク除去の過程において、文字パターンに多少の欠損が認められる場合でも、数画素単位の欠損であれば問題なく認識される。
【0079】
以上、本発明の第3の実施形態に係るマーク認識装置300について説明した。本実施形態によれば、膨張収縮画像作成部332において、画素集合の分布範囲を近似する矩形領域として検出された収縮画像380を収縮処理時の収縮度を補償する膨張度で膨張処理して膨張画像382を作成することで、マークを表す画素集合が復元される。そして、文字認識画像作成部350において、膨張画像382で認識対象画像250をマスク処理することで、マスク処理された認識対象画像384上では、マークを表す画素集合の大部分が除去され、マーク座標の範囲R0で、プレ印刷文字を表す画素集合が抽出される。さらに、文字認識部370において、抽出されたプレ印刷文字を認識することで、マークで選択されたプレ印刷文字が認識される。これにより、プレ印刷文字を含む帳票上に記入されたマークで選択されたプレ印刷文字が、プレ印刷文字の情報を予め登録することなしに認識可能となる。本実施形態は、特に、プレ印刷文字が異なる帳票を同一の帳票として取扱う場合など、プレ印刷文字の内容が予め既知でない場合などに効果的に適用されうる。
【0080】
また、本実施形態では、文字認識部370において、認識された文字をコード化された文字列に変換して出力するようにしてもよい。かかる構成によれば、プレ印刷文字を含む帳票上に記入されたマークで選択されたプレ印刷文字が、プレ印刷文字の情報を予め登録することなしに、コード化された文字列として識別されうる。
【0081】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されない。当業者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0082】
また、前述の説明の一部においては、2値画像として表現される帳票画像に適用される場合の実施形態が例示されているが、本発明の適用対象は、かかる実施形態のみに限定されるものではない。すなわち、本発明は、例えば、帳票画像がグレイ画像またはカラー画像として表現される場合においても、実質的に同様に適用可能なものである。
【図面の簡単な説明】
【0083】
【図1】第1の実施形態に係るマーク認識装置の構成を処理の流れに沿って概念的に示すブロック図である。
【図2】第1の実施形態に係るマーク座標検出部で行われる処理の一部を概略的に示す説明図である。
【図3】第1の実施形態に係るマーク座標検出部で行われる処理の一部を概略的に示す説明図である。
【図4】第1の実施形態に係るマーク座標検出部で行われる処理の一部を概略的に示す説明図である。
【図5】第1の実施形態に係るマーク座標検出部で行われる処理の一部を概略的に示す説明図である。
【図6】第2の実施形態に係るマーク認識装置の構成を処理の流れに沿って概念的に示すブロック図である。
【図7】第2の実施形態に係るマーク座標検出部で行われる処理の一部を概略的に示す説明図である。
【図8】第2の実施形態に係るマーク座標検出部で行われる処理の一部を概略的に示す説明図である。
【図9】第3の実施形態に係るマーク認識装置の構成を処理の流れに沿って概念的に示すブロック図である。
【図10】第3の実施形態に係る膨張収縮画像作成部および文字認識画像作成部で行われる処理の一部を概略的に示す説明図である。
【符号の説明】
【0084】
100 マーク画像認識装置
110 制御部
120 画像バッファ部
130 マーク座標検出部
131 投影情報作成部
132 投影情報保存部
133 文字範囲検出部
134 マーク範囲検出部
135 マーク範囲結合部
136 マーク座標保存部

【特許請求の範囲】
【請求項1】
予め印刷された文字を含む帳票上に記入されたマークの位置を、前記文字および前記マークを画素集合として表現する帳票画像上で認識するマーク認識装置であって、
マーク認識の対象とされる認識対象領域の画像の範囲内で、走査ライン毎に前記画素集合の分布幅を検出する投影情報作成部と、
走査ライン毎の前記画素集合の前記分布幅を比較し、前記分布幅が所定の閾値以上となる走査ラインで構成される文字範囲を検出する文字範囲検出部と、
前記分布幅が前記所定の閾値未満となる走査ラインで構成されるマーク範囲であって、前記文字範囲の両側の範囲で、前記画素集合の分布範囲を近似する矩形領域を各々に検出するマーク範囲検出部と、
前記文字範囲の両側の範囲で各々に検出された前記矩形領域を、前記文字範囲を介して結合し、前記認識対象領域の画像上において結合された矩形領域の座標を特定するマーク範囲結合部と、
を含むことを特徴とするマーク認識装置。
【請求項2】
マーク認識の対象とされる前記認識対象領域の画像の範囲内で、走査ライン毎に前記画素集合の分布幅を検出する前に、前記認識対象領域の画像の範囲内で走査ライン毎に画素の累積値を検出することを特徴とする、請求項1に記載のマーク認識装置。
【請求項3】
前記矩形領域の検出に際しては、所定の閾値未満の大きさを伴う矩形領域を検出誤差として処理することを特徴とする、請求項1または2に記載のマーク認識装置。
【請求項4】
予め印刷された文字を含む帳票上に記入されたマークの位置を、前記文字および前記マークを画素集合として表現する帳票画像上で認識するマーク認識装置であって、
マーク認識の対象とされる認識対象領域の画像を、収縮処理して収縮画像を作成する膨張収縮画像作成部と、
前記収縮画像上で前記画素集合の分布範囲を近似する矩形領域を検出し、前記認識対象領域の画像上において前記矩形領域の座標を特定するマーク範囲検出部と、
を含むことを特徴とするマーク認識装置。
【請求項5】
前記収縮処理時の収縮度が、前記認識対象領域の画像の範囲内で算出された、前記画素集合の平均線幅に基づいて設定されることを特徴とする、請求項4に記載のマーク認識装置。
【請求項6】
前記矩形領域の検出に際しては、所定の閾値未満の大きさを伴う矩形領域を検出誤差として処理することを特徴とする、請求項4または5に記載のマーク認識装置。
【請求項7】
前記画素集合の分布範囲を近似する前記矩形領域として検出された前記収縮画像を、収縮処理時の収縮度を補償する膨張度で膨張処理して膨張画像を作成するマーク座標検出部と、
前記膨張画像で前記認識対象領域の画像をマスク処理する文字認識画像作成部と、
前記マスク処理された認識対象領域の画像上で、予め印刷された文字を認識する文字認識部と、
をさらに含むことを特徴とする、請求項4〜6のいずれかに記載のマーク認識装置。
【請求項8】
前記認識された文字をコード化された文字列に変換して出力することを特徴とする、請求項7に記載のマーク認識装置。
【請求項9】
予め印刷された文字を含む帳票上に記入されたマークの位置を、前記文字および前記マークを画素集合として表現する帳票画像上で認識するマーク認識装置であって、
マーク認識の対象とされる認識対象領域の画像の範囲内で、マーク位置の座標を検出するマーク座標検出部と、マーク抽出画像を作成するマーク抽出画像作成部と、
前記マーク抽出画像によって前記帳票画像からマークを除去した画像を得るマーク除去画像作成部と、
マーク除去画像のうち前記マーク位置の座標情報により特定される領域に含まれる文字を認識する文字認識部と、
を含むことを特徴とするマーク認識装置。
【請求項10】
予め印刷された文字を含む帳票上に記入されたマークの位置を、前記文字および前記マークを画素集合として表現する帳票画像上で認識するマーク認識方法であって、
マーク認識の対象とされる認識対象領域の画像の範囲内で、走査ライン毎に前記画素集合の分布幅を算出する第1のステップと、
走査ライン毎の前記画素集合の前記分布幅を比較し、前記分布幅が所定の閾値以上となる走査ラインで構成される文字範囲を検出する第2のステップと、
前記分布幅が前記所定の閾値未満となる走査ラインで構成されるマーク範囲であって、前記文字範囲の両側の範囲で、前記画素集合の分布範囲を近似する矩形領域を各々に検出する第3のステップと、
前記文字範囲の両側の範囲で各々に検出された前記矩形領域を、前記文字範囲を介して結合し、前記認識対象領域の画像上において結合された矩形領域の座標を特定する第4のステップと、
を含むことを特徴とするマーク認識方法。
【請求項11】
予め印刷された文字を含む帳票上に記入されたマークの位置を、前記文字および前記マークを画素集合として表現する帳票画像上で認識するマーク認識方法であって、
マーク認識の対象とされる認識対象領域の画像を、収縮処理して収縮画像を作成する第1のステップと、
前記収縮画像上で前記画素集合の分布範囲を近似する矩形領域を検出し、前記認識対象領域の画像上において前記矩形領域の座標を特定する第2のステップと、
を含むことを特徴とするマーク認識方法。
【請求項12】
前記画素集合の分布範囲を近似する前記矩形領域として検出された前記収縮画像を、収縮処理時の収縮度を補償する膨張度で膨張処理して膨張画像を作成する第3のステップと、
前記膨張画像で前記認識対象領域の画像をマスク処理する第4のステップと、
前記マスク処理された認識対象領域の画像上で、予め印刷された文字を認識する第5のステップと、
をさらに含むことを特徴とする、請求項11に記載のマーク認識方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2008−77606(P2008−77606A)
【公開日】平成20年4月3日(2008.4.3)
【国際特許分類】
【出願番号】特願2006−259396(P2006−259396)
【出願日】平成18年9月25日(2006.9.25)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】