説明

帳票認識処理装置

【課題】帳票イメージの誤読や不読時における再認識率を向上させ、修正作業の効率向上を図る。
【解決手段】帳票を光学的にスキャンして帳票のイメージを取得するスキャナ部と、スキャナ部で取得された帳票のイメージから、対象とするデータを認識する認識処理手段と、認識処理手段による認識結果のデータ及び帳票のイメージを表示する、タッチ式入力手段と備えた入力表示部と、認識処理手段によって誤読又は不読となった場合、入力表示部に表示された帳票のイメージ内に枠を指定する2点をタッチして枠を拡大又は縮小させ、又は枠を指定する1点をタッチして枠を所定方向へ移動させる枠表示制御手段とを有し、枠制御手段によって、枠を拡大又は縮小又は移動させた後、認識処理手段によって枠内に表示されたデータを再認識する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票認識処理装置に係り、特に、帳票の内容を自動認識する帳票認識処理装置における帳票イメージの誤読や不読時の処理に関する。
【背景技術】
【0002】
従来、帳票のデータを自動認識して読取る帳票認識処理装置において、認識の結果に誤読や不読が発生した場合、表示装置に表示された帳票イメージを、キーボード又はマウスを用いて、拡大や縮小、スクロール等の操作をして誤読や不読の箇所を検索し、オペレータが誤読や不読の内容を手直ししている。
【0003】
例えば、特許文献1には、表示面にタッチセンサを備えた表示部と、表示部の表示面にタッチした位置(マルチタッチ)を検出する手段を備え、表示部に表示された所望の範囲を拡大・縮小・移動ができ、拡大されたオブジェクトにおいても操作可能にすることができる表示制御の技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−266127公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記のように、従来の帳票認識処理装置においては自動認識結果の修正作業(誤読や不読の検索及び手直し)に手間が掛かっていた。
【0006】
本発明の目的は、帳票イメージの誤読や不読時における再認識率を向上させ、修正作業の効率向上を図ることにある。
【課題を解決するための手段】
【0007】
本発明は、好ましくは、帳票に記載されたデータを自動認識する帳票認識処理装置において、帳票を光学的にスキャンして該帳票のイメージを取得するスキャナ部と、該スキャナ部で取得された帳票のイメージから、対象とするデータを認識する認識処理手段と、該認識処理手段による認識結果のデータ及び該帳票のイメージを表示する、タッチ式入力手段と備えた入力表示部と、該入力表示部に表示された帳票のイメージ内に枠を指定する2点をタッチして枠を拡大又は縮小させ、又は枠を指定する1点をタッチして枠を所定方向へ移動させる枠表示制御手段を有し、該認識処理手段によって誤読又は不読となった場合、該枠制御手段によって、枠を拡大又は縮小又は移動させた後、前記認識処理手段によって該枠内に表示されたデータを再認識することを特徴とする帳票認識処理装置として構成される。
【0008】
好ましい例によれば、上記帳票認識処理装置において、該入力表示部に表示された帳票のイメージ内の2点をタッチして該イメージを拡大又は縮小させ、又は該イメージを指定する1点をタッチして該イメージを所定方向へ移動させるイメージ表示制御手段を有し、該認識処理手段によって誤読又は不読となった場合、該イメージ制御手段によって、該イメージを拡大又は縮小又は移動させた後、前記認識処理手段によって前記枠内に表示されたデータを再認識する。
【0009】
また、好ましい例によれば、上記帳票認識処理装置において、前記枠表示制御手段又は前記イメージ表示制御手段のいずれかを選択した後、前記認識処理手段によって前記枠内に表示されたデータを再認識する。
【発明の効果】
【0010】
本発明によれば、マルチタッチ式入力手段と備えた入力表示部の表示画面に表示される帳票イメージに対して、マルチタッチ操作して枠やイメージの拡大、縮小、移動の操作を行うことにより、帳票イメージの誤読や不読時における再認識率を向上させ、修正作業の効率向上を図ることができる。
【図面の簡単な説明】
【0011】
【図1】一実施形態による帳票認識処理装置における外観を示す図。
【図2】一実施形態による帳票認識処理装置における制御構成を示すブロック図。
【図3】一実施形態における表示制御アプリケーションによる処理機能を示すブロック図。
【図4】一実施形態による帳票認識処理装置におけるマルチタッチの入力モードを示す図。
【図5】一実施形態による帳票認識処理装置におけるマルチタッチの状態遷移を示す図。
【図6A】一実施形態による帳票認識処理装置における基本認識処理を示すフロー図。
【図6B】一実施形態による帳票認識処理装置における基本認識処理を示すフロー図。
【図7】一実施形態による帳票認識処理装置におけるお客様番号の再認識処理を示すフロー図。
【図8】帳票認識処理装置で認識される帳票のイメージ図。
【図9】自動認識された帳票と認識データの表示例を示す概念図。
【図10】お客様番号が認識されなかった場合の帳票の表示例を示す図。
【図11】帳票イメージの拡大と読取り領域設定枠の表示例を示す図。
【図12】一実施形態におけるマルチタッチ状態遷移許可(抑止)テーブルの例を示す図。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態について図面を参照しながら説明する。
図1は、一実施形態における帳票認識処理装置外観を示す。帳票認識処理装置1は、情報処理部10と、タッチセンサを内蔵した入力表示部12と、載台の上に置かれた帳票を光学的にスキャンしてその内容を読み取り帳票のイメージを取得する帳票スキャナ部13を有して構成される。入力表示部12は、指F1,F2やタッチペン等で画面の表示位置を接触することにより、画面に表示されている項目を選択したり、範囲を指定することができる。この例による入力表示部12は、マルチタッチ入力が可能である。マルチタッチとは、2本以上の指(F1,F2)を入力表示部12の画面に同時に接触することで、項目の選択や移動、範囲指定等を行なう動作をいう。帳票スキャナ部13は、帳票200に記載された問合せ番号情報72(収納期間73、お客様番号74、金額75を含む(図8参照))を含む帳票イメージを取得する自動認識デバイスである。
【0013】
図2は、帳票認識処理装置の制御構成を示す。
帳票認識処理装置1は、CPU11と、入力表示部12と、帳票スキャナ部13と、マウス15を備えるキーボード14と、メモリ17の各デバイスが、バスを介して接続して構成される。CPU11は、アプリケーションプログラムを実行して幾つかの機能を実現する。本例では、帳票認識処理装置1の各デバイスを全体的に制御する制御手段、帳票スキャナ部13で読み取られた帳票イメージから所定の記載内容を認識する認識処理手段、入力表示部12へのイメージの表示及びマルチタッチ入力を制御する表示制御手段、表示画面上で誤読や不読時の修正作業等の処理を行う修正手段、の各機能を実現する。後述するが、表示制御手段として更に、イメージの拡大、縮小、及び移動させるイメージ表示制御手段と、認識対象の枠の大きさを拡大、縮小、及び移動させる枠表示制御手段とを有する。
【0014】
記憶媒体16はHDD(ハードディスクドライブ)のような記憶装置であり、OS(オペレーションシステム)や表示制御アプリケーション等の各種アプリケーションを記憶し、それらをメモリ17にロードして、CPU11で実行する。表示制御アプリケーションの実行により上記表示制御手段及び修正手段が実現される。メモリ17は、表示データ等を一時的に記憶するフラッシュメモリ等の記憶媒体である。
【0015】
次に図3を参照して、CPU11で実行される表示制御アプリケーションによる表示制御手段の機能について説明する。
表示制御手段100は、検出制御部101、枠表示/消去実行部102、拡大/縮小/移動実行部103、記憶部104を有して構成される。検出制御部101は、入力表示部12の画面上に接触(タッチ)されるオペレータの指やタッチペン等の接触及びその位置を検出する。この位置の検出は、マルチタッチ入力により接触された2点タッチの右側に位置するタッチ点のY座標値に対して、左側に位置するタッチ点のY座標値が上位にあるか下位にあるかにより、2点タッチ右上・左下または2点タッチ右下・左上のタッチ動作を検出する。また、左右のタッチ点のY座標値が同じ場合は、タッチ動作を無効とする。
【0016】
枠表示/消去実行部102は、2点タッチ右下・左上のタッチ動作にて表示される枠の処理を行う。拡大/縮小/移動実行部103は、表示イメージデータや枠の拡大/縮小等の処理を行う。記憶部104は、オペレータの指やタッチペン等の接触を検出した検出情報を記憶する。検出情報とは、例えば、マルチタッチの入力モード、マルチタッチの状態遷移許可(抑止)テーブルである。このテーブルについては図12を参照して後述する。
【0017】
ここで、図12を参照して、マルチタッチ状態遷移許可(抑止)テーブルの構成について説明する。お客様番号の認識、収納期間の認識、金額の認識の処理時のマルチタッチの状態は、メモリ17に記憶されたマルチタッチ状態遷移許可(抑止)テーブルの設定に従って制御される。即ち、表示制御アプリケーション100の実行時にこのテーブルが参照され、その設定内容に基づく制御が行われる。テーブル中、○印は処理が許容され、×印は処理が抑止される。
例えば、認識結果のオペレータによるチェック作業(S106〜S108)時に誤って、MT2モードへの自動切替えとなる2点タッチ右下・左上51の操作を行ってもMT2モードを無効とするように制御される。また、MT2モードの状況下では、画面の拡大20・縮小21・移動22は動作しないように制御される。
【0018】
次に図4を参照して、帳票認識処理装置のマルチタッチの入力モードについて説明する。
(1)〜(3)は、MT1モード41におけるスキャン画面(取得された帳票イメージ)の拡大、縮小、移動の定義を示す。即ち、画面上に接触された2点を右上・左下方向の離れる方向へ移動させれば、帳票イメージは拡大され、逆に2点を近づく方向へ移動させれば、帳票イメージは縮小される。また、1点を右方向へ移動させれば、帳票イメージは右へ移動する。なお、図示していないが、1点を左方向へ移動させれば、帳票イメージは左へ移動する。
【0019】
(4)〜(6)は、MT2モード42における文字認識の領域設定時の枠(文字認識枠)30の拡大、枠の縮小、枠の移動の定義を示す。即ち、画面上に接触された2点を右下・左上方向の離れる方向へ移動させれば、帳票イメージ上に表示される枠は拡大され、逆に2点を近づく方向へ移動させれば、この枠は縮小される。また、1点を右方向へ移動させれば、この枠は右へ移動する。なお、図示していないが、1点を左方向へ移動させれば、この枠は左へ移動する。
【0020】
次に図5を参照して、マルチタッチの状態遷移について説明する。
タッチ入力の無効な状態(MT0モード)から、イメージ画面の拡大、縮小、移動の有効な状態(MT1モード)への切替えは、2点タッチ右上・左下50のタッチにより実行される。また、領域設定枠の拡大、縮小、移動の有効な状態(MT2モード)への切替えは、2点タッチ右下・左上51のタッチにより実行される。また、タッチ入力の無効な状態(MT0モード)への切替えは、エンタキーの接触52により実行される。
【0021】
次に、図6A,6Bを参照して、帳票認証処理装置の認識処理について説明する。
先ず、帳票スキャナ部13は、そこにセットされた帳票200の全体をスキャンして(S101)、得られた帳票イメージから認識のキーとなるペイジーマーク70を検索する(S102)。その結果、ペイジーマーク70が有り(定義有り帳票)の場合は、認識処理手段が帳票200の問合せ番号情報72における収納期間、お客様番号、金額を認識する(S103)。認識の結果は、図9のように、収納期間73、お客様番号74、金額75が入力表示部12の画面に表示される。
オペレータは、画面に表示された認識結果の内容を確認して、全て正しければ、キーボード14の確認キー(図示せず)を操作して、処理終了となる(S106〜S109)。即ち、お客様番号、収納期間、金額の表示をオペレータが確認して、それぞれ確認キーが操作されたことを制御手段が確認して、終了となる。
【0022】
一方、処理S102において、ペイジーマークが無い(定義無し帳票)場合は、帳票上のバーコード71を検索する(S104)。その結果、バーコード71が有りの場合は、バーコード71のパターンの内容を認識する(S105)。
認識結果は入力表示部12の画面に表示される。オペレータは表示内容をチェックして、全て正しければ、オペレータによる確認キーの操作により処理終了となる(S106〜S109)。
【0023】
また、処理S104でバーコード71が無い場合は、定義レス(定義無し)帳票の対象領域の切り出し処理を行う(S201)。まず、切り出された客様番号74の認識処理を行う(S202〜S204)。同様にして、切り出された収納期間73の認識処理(S205〜S207)、切り出された金額75の認識処理(S208〜S210)を行う。それぞれの処理(S202〜S210)では、切り出された領域の位置の特定、数値の認識、及び番号や金額が読めたかの判断の処理を行う(処理6.1、処理6.2、処理6.3)。
これらの認識処理の結果は入力表示部12の画面に表示される。オペレータは、画面の表示内容(図9参照)を1つ1つ確認して、正しければその都度確認キーを操作する(S106〜S109)。認識処理手段は、全ての認識処理に伴う確認キーの操作を検知すると、一連の認識処理を終了とする。
【0024】
次に図7を参照して、帳票認識処理装置における再認識処理の一例について説明する。
認識処理手段によって、問合せ番号情報のうちお客様番号74が認識できなかった場合(S204のNo)は、図10に示すように、表示画面のお客様番号74には「?」が表示される。この場合、オペレータは、2点タッチ右上・左下50を操作してMT1モードに切替える。これは、帳票イメージ200を拡大し、或いは認識領域設定(枠)を拡大して、当該枠内のデータを認識処理手段によって再認識することで、誤読又は不読の番号が認識可能になることを期待している。
【0025】
図7の例では、まず、MT1モードに切り替えて、帳票イメージを拡大してある大きさで表示する(S301)。次に、2点タッチ右下・左上51によりMT2モードに切替えて、認識対象領域となる枠30を拡大してある大きさの枠で表示する(S302)。この状態画面を、図11に示す。拡大された帳票イメージ200及び拡大された枠30の画面が表示されている。
【0026】
その後、認識処理手段は、枠30内にあるお客様番号74の再認識を行う(S303)。再認識の結果、お客様番号が認識できたら(S304)、次の認識処理(収納期間の認識処理(6.2)以降の処理)へ移行する。一方、お客様番号が認識できなかったら(S304のNo)、オペレータは表示された帳票イメージを目視で認識して、その認識したお客様番号のデータをキーボード14から入力する(S305)。入力されたお客様番号は画面の表示項目74に表示される。その後、次の認識処理へ移行する。
【0027】
なお、収納期間73及び金額75の認識処理で、これらが読めなかった場合にも、図7の処理動作と同様の処理が実行される。即ち、図7の「お客様番号」が、「収納期間」や「金額」に変わるだけで処理動作自体は同様であるので、それらの説明は省く。図7の例では、イメージの拡大(MT1)や枠の拡大(MT2)であるが、場合によっては、2点タッチの移動方向を変えることで、イメージを縮小や移動(MT1)する操作(イメージ表示制御手段)、或いは枠を縮小や移動(MT2)する操作(枠表示制御手段)を行うことも可能である。
【0028】
なお、本発明は上記実施例に限定されることなく、種々変形して実施できる。例えば、上記実施例では、図5に示すタッチ操作により、MT0〜MT1〜MT2間のモードの切り替えるとした。変形例では、タッチ操作でなく、キーボード14のファンクションキーF1〜F3のような特定キーの操作により、これら3つのモード間の切り替えを行ってもよい。即ち、これら特定キーの操作により、タッチ入力の無効な状態のモード(モード0)、又はイメージ画面の拡大、縮小、移動の有効な状態のモード(モード1)、又は領域設定枠の拡大、縮小、移動の有効な状態のモード(モード2)へ切り替えた後に、枠や帳票イメージの拡大や縮小、移動等の操作をマルチタッチによって図4に示す定義に従って行うことが可能である。
【符号の説明】
【0029】
1:帳票認証処理装置 10:情報処理部 11:CPU
12:入力表示部 13:帳票スキャナ部 14:キーボード
15:マウス 16:記憶媒体 17:メモリ F1,F2:指
20:画面の拡大 21:画面の縮小 22:画面の移動
30:枠 31:枠の拡大 32:枠の縮小 33:枠の移動
100:表示制御手段
101:検出制御部
102:枠表示/消去実行部
103:拡大/縮小/移動実行部
104:記憶部
200:帳票イメージ。

【特許請求の範囲】
【請求項1】
帳票に記載されたデータを自動認識する帳票認識処理装置において、
帳票を光学的にスキャンして該帳票のイメージを取得するスキャナ部と、
該スキャナ部で取得された帳票のイメージから、対象とするデータを認識する認識処理手段と、
該認識処理手段による認識結果のデータ及び該帳票のイメージを表示する、タッチ式入力手段と備えた入力表示部と、
該入力表示部に表示された帳票のイメージ内に枠を指定する2点をタッチして枠を拡大又は縮小させ、又は枠を指定する1点をタッチして枠を所定方向へ移動させる枠表示制御手段を有し、
該認識処理手段によって誤読又は不読となった場合、該枠制御手段によって、枠を拡大又は縮小又は移動させた後、前記認識処理手段によって該枠内に表示されたデータを再認識することを特徴とする帳票認識処理装置。
【請求項2】
請求項1に記載の帳票認識処理装置において、
該入力表示部に表示された帳票のイメージ内の2点をタッチして該イメージを拡大又は縮小させ、又は該イメージを指定する1点をタッチして該イメージを所定方向へ移動させるイメージ表示制御手段を有し、
該認識処理手段によって誤読又は不読となった場合、該イメージ制御手段によって、該イメージを拡大又は縮小又は移動させた後、前記認識処理手段によって前記枠内に表示されたデータを再認識することを特徴とする帳票認識処理装置。
【請求項3】
請求項1に記載の帳票認識処理装置において、
前記枠表示制御手段又は前記イメージ表示制御手段のいずれかを選択した後、前記認識処理手段によって前記枠内に表示されたデータを再認識する
ことを特徴とする帳票認識処理装置。
【請求項4】
請求項1乃至3のいずれかの項記載の帳票認識処理装置において、
特定キーの操作により、タッチ入力の無効な状態のモード(モード0)、又はイメージ画面の拡大、縮小、移動の有効な状態のモード(モード1)、又は領域設定枠の拡大、縮小、移動の有効な状態のモード(モード2)へ切替た後に、前記枠表示制御手段又は前記イメージ表示制御手段による制御を可能とすることを特徴とする帳票認識処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2012−123520(P2012−123520A)
【公開日】平成24年6月28日(2012.6.28)
【国際特許分類】
【出願番号】特願2010−272422(P2010−272422)
【出願日】平成22年12月7日(2010.12.7)
【出願人】(504373093)日立オムロンターミナルソリューションズ株式会社 (1,225)
【Fターム(参考)】