説明

文字認識装置及びその制御方法

【課題】 台紙に付着された帳票に記載されている文字を正確に認識することができる文字認識装置及びその制御方法を提供する。
【解決手段】 帳票の付着後の台紙の付着範囲を含む領域を光学的に読み取ってその読み取り結果の映像をデータとして出力する光学読取手段と、画像のうちの付着範囲の露出部分の形状に応じて画像上の帳票の位置及び傾きを検出する帳票検出手段と、画像のうちの帳票の位置に対応する部分を帳票画像として抽出する帳票画像抽出手段と、帳票画像を傾きに応じて傾き補正する傾き補正手段と、傾き補正後の帳票画像中の文字を認識する文字認識手段と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、台紙に付着された帳票に記載されている文字を認識する文字認識装置及びその制御方法に関する。
【背景技術】
【0002】
各種の帳票に記載された内容をデータ化するために文字認識方法が利用されている。例えば、特許文献1及び2には、帳票をキャリアシートと透明シートとの間に挟持させて搬送してスキャナやイメージセンサで帳票を読み取る方法が示されている。特許文献1の方法では、グレー色調を有するキャリアシートの面を、そのキャリアシートに面接触状態で保持されキャリアシートより面積の小さい帳票の読み取り面とともに光学的に読み取り、読み取られた面のうち前グレー色調を有する領域を検出することにより帳票の領域を検出して、その帳票の領域の情報を識別することが行われる。また、特許文献2の方法では、キャリアシートの帳票の支持面の色と帳票の色とを異ならせて両者間に色差を持たせてイメージセンサ上で帳票のエッジを特定し、帳票の画像情報の読み取ることが行われる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−10010号公報
【特許文献2】特開2003−162017号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、一般に、帳票は台紙(帳票台紙)に貼り付けられて整理されることが多い。そのため、帳票台紙に貼り付けられた帳票は帳票台紙上の所望の貼付位置からずれていたり、或いは傾いたりしているので、帳票に記載された内容を正しく読み取ることができない場合があった。
【0005】
そこで、本発明の目的は、台紙に付着された帳票に記載されている文字を正確に認識することができる文字認識装置及びその制御方法を提供することである。
【課題を解決するための手段】
【0006】
本発明の文字認識装置は、付着範囲が指定された台紙の前記付着範囲内に付着された前記帳票に記載されている文字を認識する文字認識装置であって、前記帳票の付着後の前記台紙の前記付着範囲を含む領域を光学的に読み取ってその読み取り結果の映像をデータとして出力する光学読取手段と、前記画像のうちの前記付着範囲の露出部分の形状に応じて前記画像上の前記帳票の位置及び傾きを検出する帳票検出手段と、前記画像のうちの前記帳票の位置に対応する部分を帳票画像として抽出する帳票画像抽出手段と、前記帳票画像を前記傾きに応じて傾き補正する傾き補正手段と、前記傾き補正後の前記帳票画像中の文字を認識する文字認識手段と、を備えることを特徴ととしている。
【0007】
本発明の文字認識装置の制御方法は、付着範囲が指定された台紙の前記付着範囲内に付着された前記帳票に記載されている文字を認識する文字認識装置の制御方法であって、前記帳票の付着後の前記台紙の前記付着範囲を含む領域を光学的に読み取ってその読み取り結果の映像をデータとして出力する光学読取ステップと、前記画像のうちの前記付着範囲の露出部分の形状に応じて前記画像上の前記帳票の位置及び傾きを検出する帳票検出ステップと、前記画像のうちの前記帳票の位置に対応する部分を帳票画像として抽出する帳票画像抽出ステップと、前記帳票画像を前記傾きに応じて傾き補正する傾き補正ステップと、前記傾き補正後の前記帳票画像中の文字を認識する文字認識ステップと、を含むことを特徴としている。
【発明の効果】
【0008】
本発明の文字認識装置及びその制御方法によれば、台紙のうちの帳票が付着された付着範囲を含む領域を光学的に読み取ってその読み取り結果の映像のうちの付着範囲の露出部分の形状に応じて画像上の帳票の位置及び傾きを検出するので、画像のうちの帳票の位置に対応する部分を帳票画像として抽出し、帳票画像を傾きに応じて傾き補正することにより、傾き補正後の帳票画像は台紙に付着された帳票を傾きなく表した映像となる。よって、傾き補正後の帳票画像に対して文字認識すれば正確な文字認識結果を得ることができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施例として文字認識装置の構成を示すブロック図である。
【図2】帳票が貼付される台紙、帳票、及び帳票の台紙への貼付例を示す図である。
【図3】図1の装置中の制御部の動作を示すフローチャートである。
【図4】図3の動作中の画像抽出処理を具体的に示すフローチャートである。
【図5】マークの露出部分の例、並びにその露出部分の凸頂点及び凹頂点を示す図である。
【図6】帳票の位置及び傾きを示す図である。
【図7】抽出された帳票の画像データを示す図である。
【図8】マークの切れ込み及び帳票の隅部分の切れ込みへの差し込み例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明の実施例を図面を参照しつつ詳細に説明する。
【0011】
図1は本発明の実施例として文字認識装置を示している。この文字認識装置は、台紙(帳票台紙)1に貼付された帳票(図2(b)の符号11)に記載されている文字を認識する装置である。文字認識装置は、画像入力処理部2、入力画像メモリ3、帳票検出部4、帳票画像補正部5、帳票画像メモリ6、文字認識部7、制御部8、入力部9、及び表示部10を備えている。これら各部2〜10はバス15によって互いに接続されている。
【0012】
画像入力処理部2は、例えば、イメージスキャナからなる光学読取手段であり、帳票台紙1を読み取って画像データとして出力する。入力画像メモリ3は画像入力処理部2から出力された画像データを格納する。
【0013】
帳票検出部4は凹頂点検出手段、帳票位置及び傾き検出手段及び帳票画像抽出手段を構成し、入力画像メモリ3に格納されている帳票台紙1の画像データから後述の帳票検出用マーク12a〜12dを検出し、帳票11の位置及び傾きを検出する。
【0014】
帳票画像補正部5は傾き補正手段であり、帳票検出部4によって検出された位置及び傾きの情報に基づいて入力画像メモリ3に格納されている台帳帳票1の画像データから帳票11部分の画像データを抽出し、その画像データを傾き補正する。帳票画像メモリ6は帳票画像補正部5によって補正された画像データを格納する。
【0015】
文字認識部7は文字認識手段であり、帳票画像メモリ6に格納されている帳票11の画像データに対して文字認識を実行する。
【0016】
制御部8は、文字認識装置全体を後述するように制御するものである。入力部9は、例えば、キーボードやマウスからなり、オペレータの入力操作を受け入れる。表示部10は、例えば、液晶ディスプレイからなり、オペレータに対して情報を表示する。
【0017】
入力画像メモリ3、帳票検出部4、帳票画像補正部5、帳票画像メモリ6、文字認識部7、制御部8、入力部9、及び表示部10はPC(パーソナルコンピュータ)によって構成することができる。
【0018】
帳票台紙1は図2(a)に示すように縦方向に若干長手の長方形の用紙であり、帳票台紙1に貼付される帳票11は図2(b)に示すように帳票台紙1より小さいサイズで横方向に長手の長方形の紙片である。帳票台紙1には帳票11の貼付位置を定める正方形で暗色の4つの帳票検出用マーク12a〜12dが印刷されている。4つのマーク12a〜12dの配置位置は帳票11のサイズに対応した付着範囲を示している。
【0019】
また、4つのマーク12a〜12dの各縦横の辺方向は帳票台紙1の縦横の辺方向と同一である。帳票11の長手の辺方向が帳票台紙1の短手の辺方向にほぼ一致した状態で帳票11の左上隅が左上のマーク12a上に位置するとき帳票11のその他の3つの隅(左下隅、右上隅、右下隅)は他のマーク12b〜12d(左下、右下、右上のマーク)上に位置する。帳票11はその4隅がマーク12a〜12d上に位置するように帳票台紙1に貼付されるとする。図2(c)に示すように、帳票11が帳票台紙1に対して若干の傾きをもって貼付された場合でも帳票11の4つの隅をマーク12a〜12d上に位置させることができる。各マーク12a〜12dの帳票台紙1上における位置は座標データとして保存されている。
【0020】
かかる構成の文字認識装置においては、オペレータによって入力部9に対して動作開始の入力操作が行われると、入力部9から動作開始の指令が制御部8に供給される。制御部8は動作開始の指令に応じて、図3に示すように、画像入力処理(ステップS1)、画像抽出処理(ステップS2)、そして、文字認識処理(ステップS3)の順に制御動作を実行する。なお、動作開始の入力操作の前にオペレータによって画像入力処理部2に読み取りのための帳票台紙1がセットされたとする。
【0021】
画像入力処理(光学読取ステップ)では、制御部8は画像入力処理部2に読み取り開始を指示し、その読み取り指示に応じて画像入力処理部2はセットされた帳票台紙1を読み取る。帳票台紙1の読み取りにより帳票台紙1についての画像がデータとして得られる。制御部8の制御により画像データは画像入力処理部2から入力画像メモリ3に供給され、入力画像メモリ3に格納される。
【0022】
画像抽出処理では、制御部8は帳票検出部4に画像抽出処理の指示を発し、その指示に応答して、図4に示すように、帳票検出部4は入力画像メモリ3に格納された画像データを読み出し(ステップS21)、その画像データから帳票検出用マーク12a〜12dの露出部分の凹頂点を検出し(ステップS22)、その凹頂点を結ぶ範囲を帳票11としてその帳票11の位置及び傾きを検出する(ステップS23)。ステップS22及びS23が帳票検出ステップである。
【0023】
左上、左下、右下、右上のマーク12a〜12d各々は貼付された帳票11によって部分的に隠されており、その他の部分が露出している。例えば、左上のマーク12aの露出部分は図5に示すような形状である。このマーク12aの露出部分の形状の凹頂点の座標を検出することが行われる。図5の場合に、マーク12aの露出部分には、帳票11と接していない3つの凸頂点A,B,Cの他に帳票11と接した2つの凸頂点D,Eがあり、凹頂点Fは凸頂点D,Eから伸びた直線が交わる点であり、帳票11の1つの隅である。左下、右下、右上のマーク12b〜12d各々の露出部分についても1つの凹頂点が存在する。凹頂点の検出方法としては、例えば、輪郭追跡を行って検出する方法、Hough変換などで直線を検出してその交点を求める方法等の方法を用いることができる。図6に示すように、左上、左下、右上、右下のマーク12a〜12d各々の露出部分の凹頂点F〜Iの座標が検出されると、その凹頂点の座標を左上のマーク12aから左下のマーク12b、右下のマーク12c、右上のマーク12d、そして左上のマーク12aの順に結んだ直線で囲まれた範囲が帳票11が位置する部分であるとして検出される。また、左上のマーク12aの露出部分の凹頂点Fを通る帳票台紙1の短手方向の直線と、左上のマーク12aの露出部分の凹頂点Fと右上のマーク12dの露出部分の凹頂点Iとを結ぶ直線との角度θが傾きとして検出される。これらの検出位置及び傾き情報は帳票画像補正部5に供給される。
【0024】
帳票画像補正部5は制御部8の指示に応じて入力画像メモリ3に格納された画像データのうちから帳票11の位置部分の画像データ(帳票画像)を抽出し(ステップS24:帳票画像抽出ステップ)、その傾き補正する(ステップS25:傾き補正ステップ)。この結果、図7に示すように、傾きがない帳票11の画像データが得られる。この画像データは制御部8の指示に応じて帳票画像メモリ6に格納される(ステップS26)。
【0025】
次に、文字認識処理(文字認識ステップ)では、制御部8の指示に応じて文字認識部7が帳票格納メモリ6に格納された画像データに対して文字認識を行い、認識結果を表示部10に出力する。この結果、帳票11に記された文字が表示部10に表示される。
【0026】
このように、帳票11が貼付された帳票台紙1において帳票11によるマークの露出形状によって帳票11の位置及び傾きが情報として検出され、その検出された位置情報に応じて帳票11部分の画像データが抽出され、更に傾き情報に応じて抽出画像データに対して傾き補正が行われるので、傾き補正後の画像データは帳票台紙1に貼付された帳票11を傾きなく表している故にその補正後の画像データを文字認識のために用いることにより文字認識を正しく実行することができる。
【0027】
なお、上記した実施例では、帳票台紙1に帳票検出用マーク12a〜12dを印刷し、その上に帳票11を貼り付ける場合について記載したが、帳票検出用マーク12a〜12dに切り込みを入れ、帳票11をその切り込みに差し込んでも良い。図8(a)に示すように、帳票検出用マーク12aの部分では切り込み13が付けられ、そこに帳票11の左上隅の部分が差し込まれる。その場合においては、帳票検出部4は画像抽出処理において図8(b)に示すようにマーク12aについて2つの凹頂点J,Kを検出する。マーク12a〜12d各々で2つの凹頂点が検出され、全部で8つの凹頂点に基づいて帳票11の位置及び傾きが検出されるので、帳票11の位置部分の画像データを抽出してその画像データの傾き補正をすることができる。なお、帳票11がマーク12a〜12dに切り込みに差し込まれると、帳票11の傾きがあっても小さいので、画像データの傾き補正処理は容易となる。
【0028】
更に、帳票検出用マークに剥離性の糊を塗布することによって、帳票の浮上りを低減する形態も可能である。
【0029】
また、上記した実施例においては、台紙1における帳票11の付着範囲が4つの暗色のマーク12a〜12dで指定されているが、付着範囲全部を暗色で印刷しても良い。更に、帳票11のサイズは定型でも良いし、非定型でも良い。付着範囲は帳票11のサイズより縦横共に若干大きくされていれば良い。また、マーク12a〜12dは四角形に限らず、楕円形等の他の形状でも良く、またマーク12a〜12dの色は帳票11の色と異なれば良い。
【符号の説明】
【0030】
1 台紙
2 画像入力処理部
3 入力画像メモリ
4 帳票検出部
5 帳票画像補正部
6 帳票画像メモリ
7 文字認識部
8 制御部
9 入力部
10 表示部
11 帳票
12a〜12d 帳票検出用マーク

【特許請求の範囲】
【請求項1】
付着範囲が指定された台紙の前記付着範囲内に付着された前記帳票に記載されている文字を認識する文字認識装置であって、
前記帳票の付着後の前記台紙の前記付着範囲を含む領域を光学的に読み取ってその読み取り結果の映像をデータとして出力する光学読取手段と、
前記画像のうちの前記付着範囲の露出部分の形状に応じて前記画像上の前記帳票の位置及び傾きを検出する帳票検出手段と、
前記画像のうちの前記帳票の位置に対応する部分を帳票画像として抽出する帳票画像抽出手段と、
前記帳票画像を前記傾きに応じて傾き補正する傾き補正手段と、
前記傾き補正後の前記帳票画像中の文字を認識する文字認識手段と、を備えることを特徴とする文字認識装置。
【請求項2】
前記帳票検出手段は、前記画像のうちの前記付着範囲の露出部分の形状の凹頂点を検出する凹頂点検出手段と、前記凹頂点を結ぶ直線によって形成される範囲を前記帳票として前記画像上の前記帳票の位置及び傾きを検出する帳票位置及び傾き検出手段と、を含むことを特徴とする請求項1記載の文字認識装置。
【請求項3】
前記付着範囲は前記帳票の4隅に対応した4つの同一形状の帳票検出用マークによって示されていることを特徴とする請求項1又は2記載の文字認識装置。
【請求項4】
前記帳票検出用マークは前記帳票の色とは異なる色で印刷されていることを特徴とする請求項3記載の文字認識装置。
【請求項5】
前記帳票の4隅各々は前記帳票検出用マーク内に貼付されることを特徴とする請求項3又は4記載の文字認識装置。
【請求項6】
前記帳票検出用マーク各々には前記帳票の隅部分が挿入される切り込みが形成されていることを特徴とする請求項3又は4記載の文字認識装置。
【請求項7】
付着範囲が指定された台紙の前記付着範囲内に付着された前記帳票に記載されている文字を認識する文字認識装置の制御方法であって、
前記帳票の付着後の前記台紙の前記付着範囲を含む領域を光学的に読み取ってその読み取り結果の映像をデータとして出力する光学読取ステップと、
前記画像のうちの前記付着範囲の露出部分の形状に応じて前記画像上の前記帳票の位置及び傾きを検出する帳票検出ステップと、
前記画像のうちの前記帳票の位置に対応する部分を帳票画像として抽出する帳票画像抽出ステップと、
前記帳票画像を前記傾きに応じて傾き補正する傾き補正ステップと、
前記傾き補正後の前記帳票画像中の文字を認識する文字認識ステップと、を含むことを特徴とする文字認識装置の制御方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate