説明

文字認識装置

【課題】マットから帳票が浮き上がった状態で画像取得した場合に、帳票の歪みの少ない部分については、文字認識を行うようにするのが効率的である。
【解決手段】帳票の画像を取得して、当該画像上の帳票部分の外形の歪みに応じて文字認識を行う文字認識装置であって、前記帳票部分の外形の歪み特徴を抽出する歪み特徴抽出部と、歪みパターンを帳票の部分ごとの歪みの大小に応じて分類した帳票歪み特徴DBと、前記抽出した帳票部分の歪み特徴を元に該当する歪みパターンを選択する歪み識別部と、選択された歪みパターンに応じて文字認識を行う文字認識部を備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票をマットにセットし、上部からセンサ部でイメージを読み取る非接触スキャナ装置を用いた帳票画像の歪みを判別して文字認識を行う文字認識装置に関するものである。
【背景技術】
【0002】
現在、金融営業店の窓口業務等にて、顧客が持ち込んだ帳票や本人確認書類等の種々の用紙の画像を取得するための、非接触型スキャナが用いられている。非接触型スキャナは、帳票を置くマット部の上方に設置されたカメラによって、帳票の画像を取得する形式のスキャナである。金融営業店の窓口業務においては、非接触型スキャナは、金融営業店窓口の窓口端末に接続され、画像取得の制御が行われる。非接触型スキャナは、フラットベッド型スキャナやシートフィード型スキャナに比べ、画像取得のための操作が簡便で所要時間が短い等の特徴を持っている。(例えば非特許文献1)
窓口にて取得された帳票の画像に対しては、光学的文字認識装置によって所定の文字認識処理が行われ、記入内容がデータ化され、金融取引に利用される。
以下に本発明の従来技術について説明する。
【0003】
<従来のシステム構成>
従来のシステムの概観を図6に示す。
従来のシステムは、非接触スキャナ装置101、光学式文字認識装置102、WS103から構成され、WS103はキーボード等の入力手段とCRT等の表示手段を備える。
図6において、非接触スキャナ装置101は上から見た図を示している。非接触スキャナ装置101、光学式文字認識装置102、については後述する。
WS103はシステム全体を制御するための端末であり、図示しないメモリやCRT等の表示部やキーボードマウス等の操作部を備えた、一般的なPC等が使用される。
なお、ここでは光学式文字認識装置102はハードウェアによって実現するものとして説明するが、WS103内に設けたソフトウェアであってもよい。
【0004】
<非接触スキャナ装置の構成>
非接触スキャナ装置101の構成は、図7に示すように、制御部101c、マット部101a、画像取得部101bから構成される。
制御部101cは、非接触スキャナ装置101全体の制御手段、光学式文字認識装置102との通信手段を有する。
マット部101aは、画像を取得する帳票を設置するための置き台である。マット部101aは図6においては網掛けで表現しているが、黒色等、画像上で帳票と容易に区別ができる色の材質が用いられる。これにより、取得した帳票画像はマット部が背景となるため、黒い背景色に対し、帳票が浮き上がって見えるような状態となる。このため、容易に帳票の辺を検出することが可能となる。
画像取得部101bは、マット部101a上の帳票を撮影し画像データに変換する機能を有する、CCDやC−MOS等を利用したカメラである。
【0005】
<光学式文字認識装置の構成>
光学式文字認識装置は、取得した帳票の画像から、帳票の種類を特定し、さらに当該帳票の文字認識すべき領域を特定し、文字認識を行う。
光学式文字認識装置102の構成は、図8に示すように、制御部102a、画像メモリ102b、帳票角検出部102c、フォーマット作成部102d、フォーマット読取部102e、文字領域補正部102f、文字認識部102gから構成される。また非接触スキャナ装置101およびWS103との図示しない通信手段を有する。
【0006】
光学式文字認識装置102の制御部102aは、光学文字認識装置102全体の制御を行う。
画像メモリ102bは、帳票画像データを保持する手段を有する。各処理部は、適宜画像メモリ102bを参照することにより、帳票画像を参照することができる。
帳票角検出部102cは、画像から帳票角を検出する手段を有する。帳票の角の検出は、例えば画像を走査して、画素の濃度の違いにより背景と帳票部分との境目すなわち帳票辺を検出する。得られた帳票辺となる画素を追跡して、XまたはY座標の変化量の正負が反転するか、変化が開始される場所を角と判断することができる。または、各帳票辺から任意に複数の点を選択し、ハフ変換等既知の技術を用いることにより各帳票辺ごとに直線または曲線に近似し、それらの交点を角として選択することもできる。
フォーマット作成部102dは、文字領域座標等の文字認識に必要なフォーマットを作成する手段を有する。フォーマット作成部102dについては後述する。
フォーマット読取部102eは、他の処理部に対してフォーマットの内容を読取る機能を提供する。
文字領域補正部102fは、フォーマットから文字領域座標を補正する手段を有する。文字領域補正部102fについては後述する。
文字認識部102gは、図示しない文字認識辞書とのパターンマッチングにより、文字を認識する機能を提供する。
【0007】
<フォーマット作成部>
フォーマット作成部102dの構成は、図9に示すように、制御部102d1、フォーマット保存部102d2、文字領域座標設定部102d3で構成される。また、他の処理部との図示しない通信処理部を有する。
【0008】
フォーマット作成部の制御部102d1は、フォーマット作成部102d全体の制御を行う。
フォーマット保存部102d2は、文字領域座標等の文字認識に必要なフォーマットを図示しないフォーマット記憶部に保存する機能を提供する。なお、以下フォーマットの取得は、フォーマット記憶部から行うものとする。
前記フォーマットには、各帳票の識別情報とともに、各文字領域ごとに帳票の基準となる角(例えば左上)からの相対座標が格納されている。文字認識部は、この情報を元に、帳票画像上の文字領域を特定し、記入されている文字を認識する。
文字領域座標設定部102d3は、フォーマット作成するオペレータの入力操作を受けて、上記の座標の他、文字認識に使用する辞書の種類等、必要な情報をフォーマットとして登録する。ここでは、オペレータはWS103を介してフォーマット作成部にデータを入力するものとする。
【0009】
<文字領域補正部>
文字領域補正部102fの構成は、図10に示すように、制御部102f1、文字領域位置補正部102f2で構成される。また、他の処理部との図示しない通信処理部を有する。
文字領域補正部102fの制御部102f1は、文字領域補正部102f全体の制御を行う。
【0010】
文字領域位置補正部102f2は、左上の角の座標から文字領域を補正する。なお、ここでは左上としたが、前記相対座標の基準となる角を左上としているためであり、例えば右上等、他のすべての角を基準とすることが可能である。
【0011】
<動作>
(a)フォーマット登録時
図11(a)は、非接触スキャナを用いた光学式文字認識システムにおける登録時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた登録帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S101)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S102)。続いて、文字領域座標設定部102d3にて、画像メモリ102bを参照して、WS103のCRTに画像を表示し、オペレータは、文字領域を設定する(S103)。続いて、フォーマット保存部102d2にて、別途指定したシートID等の各帳票の識別情報とともに帳票角座標と文字領域座標をフォーマットに保存する(S104)。
【0012】
(b)読取時
図11(b)は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部101bにて、マット部101a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ102bに取り込む(S201)。続いて、帳票角検出部102cにて、画像メモリ102bを参照して、画像上の帳票角を4点検出する(S202)。続いて、フォーマット読込部102eにて、当該帳票の種別に対応するフォーマット(登録画像の帳票角座標と文字領域座標)を読取り(S203)。続いて、文字領域補正部102fの文字領域位置補正部102f2にて、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、帳票角座標の左上端座標により、文字領域を補正する(S204)。続いて、文字認識部102gにて、文字を認識し(S205)、WS103のCRTに文字認識結果を表示する(S206)。なお、文字認識結果とともに、当該文字領域を切り出したイメージを確認イメージとして表示し、文字認識結果の確認に用いることが良く行われている。
【0013】
なお、当該帳票の種別の特定は、当該帳票画像から抽出した識別情報と前記フォーマットに登録されている識別情報とを比較し、一致するフォーマットを選択することによって行う。識別情報としては、シートIDや罫線特徴情報等が用いられる。
【非特許文献1】沖テクニカルレビュー2002年1月/第189号Vol.69 No.1「カラーダイレクトスキャナ」
【発明の開示】
【発明が解決しようとする課題】
【0014】
非接触型スキャナは前記のとおり、マット部に置かれた帳票を上方からカメラによって撮影することにより画像取得する構造である為、マットから帳票が浮き上がった状態で画像取得した場合に、帳票自体は歪んでいなくとも、画像上で帳票の歪みが生じる。
【0015】
図12(b)は、帳票の左上角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して表現したものである。このような場合、帳票の文字領域の基準となる角の部分が左上方に伸びたようにずれてしまっているために、文字認識を行った際、文字領域を図のように左上方に誤って補正してしまう。帳票上のすべての文字領域位置はひとつの帳票の角を基準点として位置が定まるため、他の文字領域についても一様にずれてしまう。このため、文字認識結果が誤読になったり、空白になったり、文字領域から実際の記入文字が外れることにより桁落ちしたりする等の影響が帳票全体で生じることになる。そのような場合、文字領域の確認イメージもまたずれて切り出されるので、修正がしづらいばかりでなく、桁落ちにも気づきづらいことになる。例えば、図12(b)の右下部分の文字領域は、基準となる角がずれたために、実際の記入位置から完全に外れてしまっている。このような場合には、実際には記入があるにもかかわらず空白とみなされてしまうことが生じる。このような場合、金融取引上の事故が発生する可能性がある。
このため、単純にはそのような歪みを検出した場合には当該帳票をリジェクトして歪みの原因を取り除かせて、再度同様な操作を行わせるようにすれば安全である。
【0016】
ところで、図12(b)の右下部分は実際にはほとんど歪んでおらず、左上部分の歪みによって文字領域がずれてしまうものである。このような場合は、左上以外の部分については、文字認識を行うようにすれば効率的である。たとえば、左上部分には記入者への説明書きが印刷等されており、それ以外の部分に文字認識の領域があるような場合は、左上部分は文字認識を行わない部分なのであるから、左上部分のゆがみによって再度同じ操作を要求されるのでは、作業の効率が悪い。
従って、このような状態の帳票画像が取得された場合には、帳票の歪みの少ない部分については、文字認識を行うようにするのが効率的である。
【課題を解決するための手段】
【0017】
このような課題を解決するために、本発明の文字認識装置は以下の構成を備える。
<構成1>
帳票の画像を取得して、当該画像上の帳票部分の外形の歪みに応じて文字認識を行う文字認識装置であって、前記帳票部分の外形の歪み特徴を抽出する歪み特徴抽出部と、歪みパターンを帳票の部分ごとの歪みの大小に応じて分類した帳票歪み特徴DBと、前記抽出した帳票部分の歪み特徴を元に該当する歪みパターンを選択する歪み識別部と、選択された歪みパターンに応じて文字認識を行う文字認識部を備えた。
<構成2>
前記文字認識部は選択された歪みパターンにより歪みの小さな部分について文字認識を行う。
<構成3>
前記文字認識部は歪みのパターンにより文字領域座標補正方法を選択す。
<構成4>
前記帳票部分の辺を分割した辺分割点を求める辺分割部を備え、前記歪み特徴抽出部は、各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度を歪み特徴として抽出する。
<構成5>
前記帳票部分の角を検出する角検出部を備え、前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する。
<構成6>
前記辺分割部は、前記分割を所定数で等分に分割する。
<構成7>
前記辺分割部は、角に近い部分の前記分割の間隔を短くする。
<構成8>
前記分割の間隔は、等分割した場合の分割点の位置を三角関数によって写像して決定する。
<構成9>
前記帳票歪み特徴DBには帳票の種別ごとの歪みパターンを帳票の種別ごとの識別情報に関連付けて予め記憶し、前記歪み識別部は、前記抽出した歪み特徴を前記識別情報を元に帳票歪み特徴DBの歪みパターンと比較することによって前記歪みパターンを選択する。
<構成10>
上記の文字認識装置を備えた、金融営業店端末。
【発明の効果】
【0018】
取得した画像上の帳票の外形情報から帳票歪み特徴を測定して、登録されているひずみパターンと比較することにより帳票の歪みのパターンを識別し、歪みの少ない部分について文字認識を行うことができる。
【発明を実施するための最良の形態】
【0019】
本発明の実施例について、以下のとおり説明する。
【実施例1】
【0020】
<実施例1の構成>
本システムの概観を図2に示す。
本システムは、非接触スキャナ装置201、光学式文字認識装置202、WS203から構成され、WS203はキーボード等の入力手段とCRT等の表示手段を備える。以下、従来のシステムと同じ部分については、説明を省略する。
【0021】
<非接触スキャナ装置の構成>
非接触スキャナ装置201の構成は、従来のシステムと同様である。
【0022】
<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、図1に示すように、制御部202a、画像メモリ202b、帳票角検出部202c、フォーマット作成部202d、フォーマット読取部202e、文字領域補正部202f、文字認識部202g、辺分割部202h、帳票歪み特徴抽出部202i、帳票歪み識別部202j、帳票歪み特徴DB作成部202k、帳票歪み特徴DB読取部202l、帳票歪み特徴DB202m、許容帳票歪み特徴DB202n、から構成される。
【0023】
制御部202a、画像メモリ202b、帳票角検出部202c、文字認識部202g、は従来と同じものであるので説明を省略する。
【0024】
フォーマット作成部202dは、従来のシステムの構成に対して、さらに歪み判定の基準となる基準歪み特徴情報を登録するための歪み特徴登録部202d4を備えている。フォーマット作成部202dについては、後述する。
【0025】
フォーマット読取部202eは、従来のシステムと同様にフォーマット記憶部の内容を読取る機能を提供する処理部であるが、本実施例に置いては、さらにフォーマット記憶部に登録されている基準歪み特徴を読み取り、出力する機能を持つ。
【0026】
文字領域補正部202fは、従来のシステムと異なる点は、帳票を左上、右上、右下、左下の4つの部分に分割し、それぞれの部分に含まれる文字領域を補正するための、左上端補正部、右上端補正部、右下端補正部、左下端補正部で構成される点である。
すなわち、左上端補正部は、左上の帳票端座標から文字領域を補正する手段を有する。右上端補正部は、右上の帳票端座標から文字領域を補正する手段を有する。右下端補正部は、右下の帳票端座標から文字領域を補正する手段を有する。左下端補正部は、左下の帳票端座標から文字領域を補正する手段を有する。
【0027】
帳票歪み識別部202jは、フォーマット読取部202eを用いてフォーマット記憶部から基準歪み特徴情報を取得し、帳票歪み特徴抽出部202iによって抽出される歪み特徴情報と比較することにより、帳票の歪みを判定し、後述の帳票歪み特徴DB202mを参照して想定する歪みパターンから該当するものを選択するとともに、後述の許容帳票歪み特徴DB202nを参照して、当該帳票において許容される歪みパターンかどうかを判定する機能を提供する。
【0028】
辺分割部202hは、帳票部分の各辺を所定の条件で分割し歪み特徴を抽出する基準となる辺分割点を求める機能を提供する。辺分割部202hについては、後述する。
【0029】
帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供する。帳票歪み特徴抽出部202iについては、後述する。
【0030】
<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。なお、図12(a)(b)と比べ網点の濃度が異なっているが、文字を見やすくためであり、濃度の違いに特に意味はない。
【0031】
図5(a)において、各記号は以下の意味を持つ。
Te:帳票部分の上辺の横幅
Be:帳票部分の下辺の横幅
Le:帳票部分の左辺の縦幅
Re:帳票部分の右辺の縦幅
n:上辺および下辺の分割数
m:左辺および右辺の分割数
Vex (x=1,2…n):上辺および下辺の対向する辺分割点を結んだ線分
Hey (y=1,2…m):左辺および右辺の対向する辺分割点を結んだ線分
θeyx(y=1,2…m)(x=1,2…n):VexおよびHeyの交点の角度
なお、それぞれの抽出方法は、後述する。
【0032】
本実施例では、1枚の基準帳票を用いて、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマット記憶部に記憶する。
【0033】
図5(b)は、判定対象となるとなる帳票画像の帳票部分について図5(a)と同じ処理で歪み特徴を抽出した様子である。
図5(b)は、帳票の左角が浮き上がった状態で画像取得した場合の帳票の歪みを、強調して記載したものである。記号の意味は、eがrに変化しただけで、図5(a)と同じである。
【0034】
<フォーマット作成部>
フォーマット作成部202eの内部構成は、図3に示すように、制御部202d1、フォーマット保存部202d2、文字領域座標設定部202d3、歪み特徴登録部202d4で構成される。また、他の処理部との図示しない通信処理部を有する。
【0035】
ここでは、従来システムに対して追加された、歪み特徴登録部202d4について説明する。
【0036】
歪み特徴登録部202d4は、基準とする帳票の帳票画像の帳票部分について抽出された歪み特徴情報を、フォーマット記憶部に登録する機能を提供する。例えば、オペレータがWS103を介してフォーマット作成部に開始指示を行うことにより、歪み特徴情報の抽出からフォーマット記憶部への登録までの一連の処理が行われる。
【0037】
なお、前記フォーマットは事前に登録されていれば良く、運用時には、事前にフォーマット記憶部に登録されたフォーマットが参照可能であれば足りる。従って、運用時にはフォーマット作成部202dは省略することが可能である。
【0038】
また、文字認識領域が左上、右上、左下、右下のどこにあるかの情報に従って、許容しうる歪みの発生領域を登録する。これは、文字認識領域の存在する位置によって自動的に行ってもよいし、オペレータに指定させてもよい。この情報は、図4のように許容帳票歪み特徴DB202nに登録される。
【0039】
<辺分割部>
辺分割部202hは、帳票部分の辺の分割を行う機能を提供する。
以下に、辺分割部202hにより、辺を分割する際の処理を説明する。
【0040】
まず、角検出部202cにより、従来システムと同様にして前記帳票部分の角が検出される。
辺分割部202hは、検出した角を結ぶ線分を求める。続いて、求めた線分をそれぞれ所定の数で等間隔に分割する。なお、この所定の数とは、図5(a)(b)におけるn、mであり、分割点の数は入力される帳票のサイズによらず一定になる。続いて、前記分割点より、例えば上辺および下辺であればY軸方向に(左辺および右辺であればx軸方向に)画素を走査して、背景色と帳票部分の濃度が変化する点を抽出することにより、前記線分の分割点に対応する各帳票辺の辺分割点を抽出することができる。
【0041】
<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、図のように対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、特徴として出力する。
【0042】
なお、帳票歪みの有無の評価は、以下のようにして行う。例えば角度を評価する場合の式は以下のとおりである。
[帳票歪み評価値]
θyx = | θeyx _ θryx | (y=1,2…m)(x=1,2…n)
[帳票歪み評価値の閾値]
θyxの閾値: θTHr
【0043】
<帳票歪み特徴DB>
想定する歪みパターンの例を、図14に示す。網掛け部が歪みが発生している部分、すなわち所定の閾値を超過している部分であり、歪みが大きい部分である。網掛けがない部分が、歪みが発生していないか発生していても歪みが小さい部分、すなわち所定の閾値以下の部分である。
【0044】
帳票歪み特徴DB202mは、図14に示した想定する歪みパターンに応じた帳票歪み特徴として、図13に示すように、各歪みパターンの名称、コード、歪みパターン条件を格納したものである。歪みパターン条件は、例えば、「左上角浮き上がり」の場合、前述のθeyxのうち、左上部分のみが閾値超過している場合が該当する。例えば、すべてのθeyxのうち、θe11〜θe33の9つの点についてのみ閾値超過している場合に、左上角浮き上がり(歪みパターンコード=A)であると判定できる。
また例えば、「左辺&右辺浮き上がり」の場合、前述のVexのうち、両端部分のみが他より長く、その割合が所定の閾値を超過している場合が該当する。例えば、すべてのVexの長さの平均と比べ、Ve1、Venの2本のみ閾値超過して長い場合に、「左辺&右辺浮き上がり」(歪みパターンコード=U)であると判定できる。
歪みパターン条件は、このように浮き上がり方と前述のVex、Hey、θeyxとの関係が記載されている。なお、実際には表中の文が論理式にて表現され記録されている。
【0045】
また、左上端補正部、右上端補正部、右下端補正部、左下端補正部のいずれの補正部が使用可能か情報が含まれている。例えば、図13の場合は、「左上角浮き上がり」の場合は左上端補正部のみ使用不可であり、それ以外は使用可能となっている。また、「左辺&右辺浮き上がり」の場合は、すべての角において歪みが発生すると考えられるので、すべての補正部が使用不可となっている。
帳票ゆがみ特徴DBは、後述のようにして帳票歪み特徴DB作成部202kにより登録される。
【0046】
<許容帳票歪み特徴DB>
許容帳票歪み特徴DB202nは、処理対象としてフォーマットを登録している各帳票に対して、それぞれ許容する歪みパターンの歪みパターンコードを登録したテーブルである。図4の例では、帳票001(帳票ID=001)が許容する帳票歪みパターンがA(左上角浮き上がり)であることが分かる。例えば、左上部分には記入者への説明書きが印刷等されており、それ以外の部分に文字認識の領域があるような帳票の場合が相当する。
【0047】
<帳票歪み特徴DB作成部>
帳票歪み特徴DB作成部202kは、前記帳票歪み特徴DBを202nを登録するための処理部である。具体的には、図14のような想定する帳票歪みパターンに相当する画像を故意に作成して読み込ませ、帳票歪みパターンごとの帳票歪み特徴を生成し、登録する。また、それぞれの帳票歪みパターンにおいて、歪みの発生度合いに応じて、左上端補正部、右上端補正部、右下端補正部、左下端補正部のいずれの補正部が使用可能かの情報が設定される。例えば、左上の領域について歪みが所定の閾値未満であれば、左上端補正部を使用可とする。それ以外の領域についても同様である。なお、すべての領域についてゆがみが所定の閾値以上であれば、すべての補正部が使用不可となる場合もありうる。
【0048】
<実施例1の動作>
(a)フォーマット作成時
図15(a)は、非接触スキャナを用いた光学式文字認識システムにおける前記基準歪み特徴情報の登録時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた基準となる登録帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S301)。ここで、基準帳票の画像は、歪みの無い状態で取得する必要があるため、浮き上がりや折れ曲がりが無い状態で置く必要がある。これを標準状態または基準状態と呼ぶ。
【0049】
続いて、帳票角検出部202cにて、帳票画像上の帳票角を4点検出する(S302)。
【0050】
続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S303)。
【0051】
続いて、帳票特徴抽出部202iにて、基準帳票画像の歪み特徴情報を抽出する(S304)。
【0052】
続いて、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報としてフォーマット記憶部に登録する。(S305)。
【0053】
なお、標準状態で取得した基準歪み特徴情報に含まれる角度は、すべてほぼ90度となると考えられるので、上記のように標準状態での歪み特徴を取得せずにすべての角度を90度とする歪み特徴情報を生成して登録することも可能である。ただし、上記のように標準状態での歪み特徴を取得して実際に歪み特徴情報を抽出すれば、カメラのレンズ等の特性により標準状態でも歪みが発生する場合の影響を排除することができるので、精度を向上させることができる。
【0054】
さらに、オペレータは取得した基準帳票画像を元に帳票毎の文字認識領域を指定し、フォーマットに登録する。指定した文字認識領域の情報は、基準となる角の座標情報とともに、基準角からの相対座標および領域サイズの情報が座標情報として従来どおりに登録される。しかる後に、フォーマットが保存される。(S306)
【0055】
(b) 帳票歪み特徴DB作成時
図15(b)は、非接触スキャナを用いた光学式文字認識システムにおける前記帳票歪み特徴DB作成時のフローチャートである。本実施例において、帳票歪み特徴DBはすべてのフォーマットについて共通であることを想定する。このため、帳票歪み特徴DB作成は、前記図15(a)の、フォーマット作成の前に、前記基準歪み特徴情報の登録に用いた帳票をによって行うことが望ましい。
【0056】
まず、マット部201a上に浮き上がりの有る状態で、帳票を置く。画像取得部201bにて、マット部201a上に置かれた登録帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S307)。
【0057】
続いて、帳票角検出部202cにて、帳票画像上の帳票角を4点検出する(S308)。
【0058】
続いて、帳票特徴抽出部202iにて、帳票画像の歪み特徴情報を抽出する(1309)。
【0059】
続いて、帳票歪み特徴DB作成部202kにて、帳票歪み特徴を学習し、帳票歪み特徴DBを作成する(S310)。
【0060】
S307〜S310の作業を、想定する帳票歪みパターン(例を図14に示す)全てについて行う。(S311)
【0061】
(c)読取時
図16は、非接触スキャナを用いた光学式文字認識システムにおける読取時のフローチャートである。まず、画像取得部201bにて、マット部201a上に置かれた読取帳票の読取りを行い、取得画像を画像メモリ202bに取り込む(S401)。
【0062】
続いて、帳票角検出部202cにて、画像メモリ202bを参照して、画像上の帳票角を4点検出する(S402)。
【0063】
続いて、辺分割部202hにより、帳票部分の辺を分割し、辺分割点を求める(S403)。
【0064】
続いて、帳票歪み特徴抽出部202iにて、画像の帳票部分の帳票歪み特徴を抽出する(S404)。
【0065】
続いて、フォーマット読取部202eは、フォーマット記憶部から基準歪み特徴情報を取得する。(S405)
【0066】
続いて、帳票歪み識別部202jにて、下記に示す帳票歪み評価値を計算し、あらかじめ設定されているそれぞれの閾値(θTHr)と比較することにより帳票歪み特徴を検出する。このとき、また、帳票歪み特徴DB読取部202lにより、帳票歪み特徴DB202mを参照して、該当する帳票歪みパターンが存在すれば、識別結果として帳票歪みパターンコードを出力する。該当する帳票歪みパターンが見つからなければ、識別失敗の旨を出力する。(S406)
【0067】
帳票歪み特長の識別に失敗した場合は(S407)、WS203のCRTに“歪み検出失敗”と表示し(S408)、さらにWS203のCRTに“帳票リジェクト”と表示する(S409)
【0068】
識別が成功の場合において、識別結果が歪み無しの場合は(S410)、フォーマット読取部202eにて、当該帳票の基準角の座標情報と文字認識領域の座標情報が読み取られる。(S411)。
続いて、従来同様に、基準となる角の座標(たとえば左上端座標)により、文字領域を補正する(S412)。続いて、文字認識部202gにて、文字を認識し(S413)、WS203のCRTに文字認識結果を表示する(S414)。
【0069】
識別結果が補正可能歪み特徴パタンの場合は、フォーマット読込部1006にて、フォーマット読取部202eにて、当該帳票の基準角の座標情報と文字認識領域の座標情報が読み取られる。(S415)。続いて、識別結果に応じて、文字領域補正部202fの左上端補正部、右上端補正部、右下端補正部、左下端補正部を適宜使用して、登録画像の帳票角座標・文字領域座標、読取画像の帳票角座標から、文字領域を補正する(S416)。
【0070】
例えば、識別結果が左上角浮き上がりの場合の補正の場合の例を図17に示す。
図に示すとおり、左上角近辺の文字領域は、補正不可能の為、左上近辺の文字領域をリジェクトとする。すなわち、文字認識結果を不読とする。左上角から遠い文字領域は、左上角以外の角座標から文字領域を補正する。すなわち、帳票を左上、右上、右下、左下の4つの部分に分割し、それぞれ前述の左上端補正部、右上端補正部、右下端補正部、左下端補正部にて補正する。
続いて、リジェクトではない文字領域において、文字認識部202gにて文字を認識し(S417)、WS203のCRTに文字認識結果を表示する(S418)。続いて、WS203のCRTに帳票歪み識別結果を表示する(S419)。識別結果が補正不可能歪み特徴パタンの場合は(S410)、WS203のCRTに帳票歪み識別結果を表示し(S420)、WS203のCRTに“帳票リジェクト”と表示する(S409)。
【0071】
このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度を基準歪み特徴とし、歪判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度を歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みを識別し、文字認識可能な領域については文字認識を行うとともに帳票歪みの識別結果を表示するので、オペレータに対して警告ができ、文字領域のずれによる金融取引の事故の発生を防止し、オペレータにとっても確認の負荷が減少するという、効果を得ることができる。
【0072】
また、想定する帳票の歪みについて、実際に当該歪みを発生させた画像を読み取って自動的に帳票歪みDBを作成するので、オペレータの登録作業の不可を軽減できる。
【0073】
また、前記辺分割点同士を結んだ線分の交点の角度のみを特徴とすることにより、非判定帳票が基準帳票と異なるサイズであっても同じ数の交点を得ることができるので、基準歪特徴データは共通のものを使用できるので、登録は1回のみでよく、新規な帳票を含めて画像の歪みの判定を行うことができる。
【実施例2】
【0074】
実施例1においては、対応する辺分割点同士を結んだ線分の交点の角度のみを歪み特徴とするとしたが、本実施例においては、前記線分の長さについても歪み特徴情報として用いる。このため、基準歪み特徴は帳票の種別毎に異なるものとなるので、基準歪み特徴情報はおよび各帳票のフォーマット毎に登録されることになる。また、帳票歪み特徴DBについても、帳票毎の情報として登録されることになる。
【0075】
<実施例2の構成>
本実施零におけるシステムの構成は、実施例1と同じく図2で示される。以下、実施例1と異なる部分についてのみ説明する。
【0076】
<光学式文字認識装置の構成>
光学式文字認識装置202の内部構成は、実施例1と同じく図1に示される。
制御部202a、画像メモリ202b、帳票角検出部202c、文字領域補正部202f、文字認識部202g、は従来と同じものであるので説明を省略する。
【0077】
フォーマット読取部202eは、本実施例においては、基準歪み特徴を、フォーマット毎に取得する機能を有する。
【0078】
帳票歪み特徴抽出部202iは、画像から帳票の歪み特徴を抽出する機能を提供するのは実施例1と同様であるが、各辺分割点を結ぶ線分の交点の角度に加えて、前記線分の長さについても、特徴情報として抽出する。帳票歪み特徴抽出部202iについては、後述する。
【0079】
<歪み特徴情報>
ここで、本実施例における歪み特徴情報について説明する。
図5(a)は、歪み情報の基準となる帳票画像の帳票部分について歪み特徴を抽出した様子である。各記号の意味は実施例1と同様である。
【0080】
本実施例では、1枚の基準帳票を用いて、Vex、Hey、θeyxを歪み特徴情報として抽出し、共通の基準歪み特徴情報としてフォーマットに記憶する。ここで基準歪み特徴は、実施例1と異なり、基準帳票は、フォーマットに登録されている帳票の種別毎に登録する必要がある。
図5(b)は、実施例1と同様であるので、説明を省略する。
【0081】
<フォーマット作成部>
フォーマット作成部202eの内部構成は、実施例1と同じく図3に示される。
歪み特徴登録部202d4は、基準歪み特徴を各帳票のフォーマットに関連づけてフォーマット記憶部に格納する。このため、基準歪み特徴情報は、各帳票ごとの文字情報の登録とともに行うと効率が良い。
【0082】
<帳票歪み特徴抽出部>
帳票歪み特徴抽出部202iは、辺分割部202hによって得られた辺分割点について、対向するもの同士を結んだ線分を求める。これらの線分は、図5(a)(b)におけるVex、Hey、Vrx、Hryのようになる。続いて、各交点の角度θeyxを求め、前記各線分の長さとともに、特徴として出力する。
【0083】
<帳票歪み特徴DB作成部>
帳票歪み特徴DB作成部202kは、帳票歪み特徴DB202mを、共通ではなく各帳票の帳票ID毎に登録する。このため、基準歪み特徴情報は、各帳票ごとの文字情報の登録とともに、当該帳票を用いて行う。
【0084】
<実施例2の動作>
(a)フォーマット作成時
本実施例における動作は、実施例1と同じく図15(a)にて説明される。S301〜S304については、実施例1と同様なので説明を省略する。
【0085】
S305では、歪み特徴登録部202d4にて、抽出した歪み特徴情報を基準歪み特徴情報として当該帳票のフォーマットに関連付けて登録する。
【0086】
(b) 帳票歪み特徴DB作成時
本実施例における動作は、実施例1と同じく図15(a)にて説明される。なお、本実施例においては、帳票歪み特徴DB作成は、各帳票ごとに行われる。すなわち、図13のような表が帳票ID毎に個別に登録される。それ以外は、実施例1と同様なので説明を省略する。
【0087】
(c)読取時
本実施例における動作は、実施例1と同じく図16にて説明される。S405、S406以外については、実施例1と同様なので説明を省略する。
【0088】
S405では、フォーマット読み取り部202eは、フォーマット記憶部から帳票画像の帳票の種別に対応する基準歪み特徴情報を取得する(405)。帳票の種別の特定には、既存の方法が適用されるが、例えば当該帳票のシートIDや罫線特徴等の特徴情報をフォーマットとともに登録しておき、特徴が一致するフォーマットを選択するようにしてもよい。または、WSのオペレータに対して帳票の種別の指定手段を提供し、指定された情報により帳票の種別を特定することにしても良い。
【0089】
S406では、帳票歪み識別部202jは下記に示す式にて帳票歪み評価値を計算する。
[帳票歪み評価値]
Vx = |Vex − Vrx| (x=1,2…n)
Hy = |Hey − Hry| (y=1,2 …m)
θyx = | θeyx − θryx | (y=1,2 …m)(x=1,2 …n)
[帳票歪み評価値の閾値]
Hxの閾値: VTHr
Hyの閾値: HTHr
θyxの閾値: θTHr
あらかじめ設定されているそれぞれの閾値(VTHr、HTHr、θTHr)と比較して帳票歪み特徴を検出する。そして、帳票歪み特徴DB読取部202lにより、当該帳票の帳票歪み特徴DB202mを参照して、該当する帳票歪みパターンが存在すれば、識別結果として帳票歪みパターンコードを出力する。該当する帳票歪みパターンが見つからなければ、識別失敗の旨を出力する。(S406)
【0090】
このように、基準帳票画像の各辺を所定の値で分割して辺分割点を求め、それぞれを結ぶ線分の交点の角度と各線分の長さとを基準歪み特徴として各帳票毎に登録し、歪み判定の際には、判定対象となる帳票画像の各辺を基準帳票と同様に分割し、同じくそれぞれを結ぶ線分の交点の角度と線分の長さを歪み特徴とし、前記基準歪み特徴と比較することによって、帳票の画像上の歪みが判定できるので、実施例1に対してさらに精度よく歪みの判定を行うことができる。
【0091】
なお、上述の実施例に置いて、角を結ぶ線分を等分するとしたが、帳票の浮き上がり等による歪みは帳票の角に近い部分ほど大きくなることから、帳票の角に近い部分の分割間隔を短くし、中央すなわち角から遠い部分の分割間隔を長くすることにより、辺分割点の密度を挙げるとさらに精度良く帳票部分の歪みを検出することができる。例えば、図5(a)(b)におけるn、mに対応する分割間隔を三角関数を用いて変換することにより、角に近い部分の分割間隔を短くすることが可能である。例えば、辺の中央を起点=0とし辺の角部を終点=π/2[rad]とすれば、辺を等分した点を正弦関数によって角に近くなるほど短い間隔となるように写像できる。例えば、中央から角までを3分割する場合、中央から1/3の地点は、sin((π/2)x(1/3))=sin(π/6)=0.5により、中央から角までの半分の地点に写像される。中央から2/3の地点は、sin((π/2)x(2/3))=sin(π/3)=約0.87により、中央から角までの約0.87倍の地点に写像される。
なお、実施例1において、基準歪み特徴情報は共通なものを1回登録すればよい、としたが、実施例2のような方法によって帳票ごとに基準歪み特徴情報を登録しても構わない。例えば、カメラのレンズ等の特性により帳票のサイズによって歪み方に差異が生じるような場合には、帳票ごとに基準歪み特徴情報を登録すれば、さらに精度を上げることができる。
【0092】
なお、上述の実施例において、光学式文字認識装置102とスキャナ装置201とを別の構成として説明したが、スキャナと光学式文字認識装置とは1体型で構成されていてもかまわない。
また、上述したそのような光学式文字認識装置102とWS203を組み合わせることにより、帳票画像の文字認識機能を備えた端末装置として機能させることもできる。特に、WS203が金融営業店窓口端末である場合には、帳票画像の文字認識機能を備えた金融営業店窓口端末として機能させることができる。
【図面の簡単な説明】
【0093】
【図1】本発明の光学式文字認識装置の機能ブロック
【図2】本発明のシステム構成
【図3】本発明のフォーマット作成部の機能ブロック
【図4】帳票ごとの許容帳票歪み特徴DB
【図5】帳票の歪み特徴の説明
【図6】従来のシステム構成
【図7】従来のスキャナの機能ブロック
【図8】従来の光学式文字認識装置の機能ブロック
【図9】従来のフォーマット作成部の機能ブロック
【図10】従来の文字領域補正部の機能ブロック
【図11】従来のフローチャート
【図12】帳票歪み時の取得画像と領域補正結果
【図13】帳票歪み特徴DB
【図14】歪みパターン例
【図15】本発明のフローチャート
【図16】本発明のフローチャート
【図17】帳票歪み時の取得画像と領域補正結果
【符号の説明】
【0094】
201 スキャナ装置
201a マット部
201b 画像取得部
202 光学式文字認識装置
203 WS
202a 制御部
202b 画像メモリ
202c 帳票角検出部
202d フォーマット作成部
202e フォーマット読取部
202f 文字領域補正部
202g 文字認識部
202h 辺分割部
202i 帳票歪み特徴抽出部
202j 帳票歪み識別部
202k 帳票歪み特徴DB作成部
202l 帳票歪み特徴DB読取部
202m 帳票歪み特徴DB
202n 許容帳票歪み特徴DB

【特許請求の範囲】
【請求項1】
帳票の画像を取得して、当該画像上の帳票部分の外形の歪みに応じて文字認識を行う文字認識装置であって、
前記帳票部分の外形の歪み特徴を抽出する歪み特徴抽出部と、
歪みパターンを帳票の部分ごとの歪みの大小に応じて分類した帳票歪み特徴DBと、
前記抽出した帳票部分の歪み特徴を元に該当する歪みパターンを選択する歪み識別部と、
選択された歪みパターンに応じて文字認識を行う文字認識部を備えた、
文字認識装置。
【請求項2】
前記文字認識部は選択された歪みパターンにより歪みの小さな部分について文字認識を行う、請求項1に記載の文字認識装置。
【請求項3】
前記文字認識部は歪みのパターンにより文字領域座標補正方法を選択する、
請求項1に記載の文字認識装置。
【請求項4】
前記帳票部分の辺を分割した辺分割点を求める辺分割部を備え、
前記歪み特徴抽出部は、各対向する辺の辺分割点を所定の対応条件によって結び、各線分の交点における線分同士の角度を歪み特徴として抽出する、
請求項1に記載の文字認識装置。
【請求項5】
前記帳票部分の角を検出する角検出部を備え、
前記辺分割部は、前記検出した角を結ぶ線をそれぞれ分割した点を求め、求めた点を前記帳票部分の辺に対応させることによって辺を分割する、請求項4に記載の文字認識装置。
【請求項6】
前記辺分割部は、前記分割を所定数で等分に分割する、請求項5に記載の文字認識装置。
【請求項7】
前記辺分割部は、角に近い部分の前記分割の間隔を短くする、請求項5に記載の文字認識装置。
【請求項8】
前記分割の間隔は、等分割した場合の分割点の位置を三角関数によって写像して決定する、請求項7に記載の文字認識装置。
【請求項9】
前記帳票歪み特徴DBには帳票の種別ごとの歪みパターンを帳票の種別ごとの識別情報に関連付けて予め記憶し、
前記歪み識別部は、前記抽出した歪み特徴を前記識別情報を元に帳票歪み特徴DBの歪みパターンと比較することによって前記歪みパターンを選択する、請求項1から8のいずれかに記載の文字認識装置。
【請求項10】
請求項1から9のいずれかに記載の文字認識装置を備えた、金融営業店端末。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate