説明

帳票識別システム、帳票識別方法、および帳票処理プログラム

【課題】プレ印刷部分に識別子が重なっている場合においても文字列の認識精度の高い帳票識別システムを提供することである。
【解決手段】本実施形態の帳票識別システムは、帳票のイメージを読み取り、この読み取った帳票イメージに基づいて、帳票の種類を識別する帳票識別部と、前記帳票識別部で種類を識別された帳票に付与された識別子を蛍光インクで前記帳票に複数印字する識別子印字部と、前記帳票識別部で種類が識別できなかった帳票に対して入力された帳票の識別情報に、前記識別子を対応付けて記憶する記憶部と、前記帳票識別部で種類が識別できなかった帳票に印字された前記複数の識別子を認識する認識部と、を備える。帳票識別部は、種類が識別できなかった帳票の種類を、認識部の認識結果に基づいて記憶部を参照して識別する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、帳票識別システム、帳票識別方法、および帳票識別プログラムに関する。
【背景技術】
【0002】
従来、金融機関では、各支店において取り扱われた振込依頼書による電気料金、水道料金、電話料金等の公共料金や税金などの管理、仕分けのために、計算センターで本店や各支店から振込依頼書の収納済通知書を集め、帳票識別システムによって各帳票の記載事項を読み取り、払込先ごとに帳票をソートし、振込金額を合計するなどの処理を行っている。
【0003】
この帳票識別システムでは、最初(1パス目)の読み取りで帳票の種類が識別できなかった(識別リジェクトした)ためにポケットに分類できなかった帳票を、オペレータが帳票イメージや帳票を確認して種類を設定し、そのリジェクトした帳票束をもう一度読み取り(2パス目)、オペレータが設定した帳票の種類に従ってポケットに分類する、ということが一般的に行われている。
【0004】
ここで、2パス目で読み取りが行われた各帳票と、オペレータが設定した帳票の種類とを紐付ける方法として、1パス目において帳票に識別子として文字やバーコードを印刷し、この識別子とオペレータの設定した種類とを関連付けておき、2パス目に光学式文字読取装置(OCR:Optical Character Reader)やバーコードリーダ等で読み取った識別子に基づいてオペレータの設定を取り出し、帳票の仕分けを行う方法がある。
【0005】
また、帳票上に紫外線等の特殊な光源で読み取ることができる透明インク(蛍光インク)で印字した文字に紫外線を照射して励起させ、これにより発光する可視光をイメージセンサで検出して文字を読み取ることで、プレ印刷部分に識別子が重なっていても、文字列のみを認識することが可能な文字読取装置がある。
【0006】
しかしながら、帳票の紙自体に蛍光増白剤が含まれている場合や、帳票にプレ印刷したインクの種類などによって、帳票自体やプレ印刷の部分が紫外線によって発光してしまう場合、もしくはプレ印刷部分に識別子が重なった部分が発光しない場合など、識別子を正しく認識できないという問題がある。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2004−145383号公報
【特許文献2】特開2002−15312号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明が解決しようとする課題は、プレ印刷部分に識別子が重なっていて印刷された場合においても、印字された識別子の認識精度が高い帳票識別システムを提供することである。
【課題を解決するための手段】
【0009】
実施形態の帳票識別システムは、帳票のイメージを読み取り、この読み取った帳票イメージに基づいて、帳票の種類を識別する帳票識別部と、前記帳票識別部で種類を識別された帳票に付与された識別子を蛍光インクで前記帳票に複数印字する識別子印字部と、前記帳票識別部で種類が識別できなかった帳票に対して入力された帳票の識別情報に、前記識別子を対応付けて記憶する記憶部と、前記帳票識別部で種類が識別できなかった帳票に印字された前記複数の識別子を認識する認識部と、を備える。帳票識別部は、種類が識別できなかった帳票の種類を、認識部の認識結果に基づいて記憶部を参照して識別する。
【図面の簡単な説明】
【0010】
【図1】実施形態の帳票識別システムのハードウェア構成を示すブロック図
【図2】実施形態の帳票識別システムの機能構成を示すブロック図。
【図3】実施形態の帳票識別システムの帳票認識処理の動作の一例を示すフローチャート。
【図4】実施形態の帳票識別システムに入力される帳票の一例を示す図。
【図5】実施形態に係る識別子印字部により印字された帳票の一例を示す図。
【図6】実施形態に係る帳票再識別処理の一例を示すフローチャート。
【図7】実施形態に係るパターン認識部による文字認識処理の一例を示す図。
【図8】実施形態に係るパターン認識部による文字認識処理の一例を示す図。
【図9】実施形態に係るパターン認識部により算出された類似度の一例を示す図。
【発明を実施するための形態】
【0011】
以下、実施形態の帳票識別システムについて図1乃至図9を参照して説明する。
【0012】
図1は本実施形態の帳票識別システム1のハードウェア構成の一例を示す図である。
【0013】
帳票識別システム1は、金融機関の営業店それぞれから集められてきた帳票を装填されたホッパ100から、帳票1枚1枚を取り込んで記載事項を読み取ってイメージデータを作成するスキャナ200と、スキャナ200が読み取った帳票の種類の判定と帳票の文字認識とを行うサーバPC300と、文字認識処理が完了した帳票1枚1枚をサーバPC300が判定した種類毎に、ソートポケット400a,400b,400c,400d…にソートするソータ400とを備えている。なお、本実施形態のスキャナ200は、紫外線ランプ201を光源として備えており、紫外線のみにより発光するインクで印字された文字なども読み取ることが可能である。また、サーバPC300は文字認識のみでなく、バーコードなども認識可能である。すなわち、サーバPC300は、パターン認識を行う。
【0014】
図2は本実施形態の帳票識別システム1の機能構成の一例を示す図である。帳票識別システム1は、帳票搬送部2、スキャナ200とPCサーバ300である帳票処理部3、設定端末4、帳票仕分け部13、帳票の仕分けポケット15から構成され、入力された帳票を識別して種類毎に仕分けポケット15に排出する帳票識別処理を行う。帳票識別システム1が識別できなかった帳票は、オペレータによって種類を設定され、再度帳票識別システム1に入力される。
【0015】
帳票搬送部2は、スキャナ200の備えるホッパ100から取り込まれた帳票を搬送する機能を備える。
【0016】
帳票処理部3は、イメージ取得部5、帳票識別部6、識別子印字部7、パターン認識部8、類似度算出部9、類似度比較部10、帳票識別情報記憶部11、認識辞書記憶部12から構成される。なお、これらは図1に示したスキャナ200及びサーバPC300によって実現される。帳票処理部3は、入力された帳票を走査することによってその帳票のイメージデータを取得し、取得したイメージデータを用いて帳票の種類の識別を行う。また、帳票処理部3は帳票の文字認識を行う。
【0017】
イメージ取得部5は、帳票を走査することによってその帳票のイメージデータを取得し、帳票識別部6に転送する機能を有する。なお、イメージ取得部5は、紫外線を照射する紫外線ランプを備え、蛍光インクによって印字された帳票のイメージデータも取得可能である。
【0018】
帳票識別部6は、帳票識別情報記憶部11に記録されている帳票識別情報に基づいて、イメージ取得部5で読み込まれた帳票の種類を識別する機能を有する。帳票識別部6は、例えば帳票の種類ごとに固有のID、バーコード、帳票の罫線の位置、もしくは帳票に印字された文字や記入された文字などの帳票識別情報を読み取って、あらかじめ情帳票識別情報記憶部11に登録された帳票の種類ごとの帳票識別情報を参照して識別する。帳票識別部6は、種類を識別した帳票に識別子を付与する。すなわち、帳票識別情報記憶部11は、帳票を識別するための帳票識別情報を記憶している。
【0019】
識別子印字部7は、例えばプリンタであり、帳票裏面の所定の位置に例えば連続した文字列などの識別子を複数印字する。なお、印字する文字列は同一の文字列である。また、識別子印字部7であるプリンタは、例えば蛍光インクのインクリボンをカートリッジとして備えたインクリボン方式のプリンタである。この蛍光インクは、例えば360nm〜380nm程度の紫外線を照射することで励起され可視光を発光する。なお、識別子印字部7は、インクジェット方式のヘッドで構成されていてもよい。
【0020】
パターン認識部8は、類似度算出部9と類似度比較部10とを備え、認識辞書記憶部12に記憶された認識辞書を参照して入力された帳票の文字認識を行う。認識辞書記憶部12には、標準パターンが認識辞書として記憶されている。すなわち、パターン認識部8は、認識辞書を参照しつつ、帳票の文字認識を行う。
具体的には、パターン認識部8は、帳票のイメージデータから一文字ごと(パターン一つずつ)のイメージを切り出す文字抽出処理を行い、文字認識を行う。より詳細には、パターン認識部8の類似度算出部9は、一文字ごとのイメージデータと認識辞書記憶部12内の標準パターンとの類似度を複合類似度法などを用いて算出する。類似度比較部10は、類似度算出部9に出力された類似度を、複数の識別子の同じ箇所の文字毎に比較し、類似度が最も高い標準パターンを採用する。すなわち、パターン認識部8は、類似度比較部10が採用した標準パターンを文字イメージの認識結果として出力する。
【0021】
帳票仕分け部13は、帳票識別部6が識別した帳票の種類に基づいて、識別された帳票が指定ポケット15に入るようソータ400を制御する機能を有する。すなわち、帳票識別部6が種類を識別できた帳票は、帳票仕分け部13の指示よって、ソータ400が種類に応じて指定ポケット15に排出する。帳票識別部6が種類を識別できない帳票は、ソータ400がリジェクトポケット(図示しない)に排出する。
【0022】
設定端末4は、例えばパーソナルコンピュータである。オペレータは、帳票識別部6が識別できなかった帳票の種類を判定し、設定端末4を用いて、判定した種類を入力する。 帳票処理部6は、入力された帳票の種類を識別子と共に帳票識別情報記憶部11に登録する。
【0023】
ここで、図3を参照して、金融機関で振込依頼書による国民健康保険の払い込みを処理し、自治体毎に仕分けする場合の帳票識別システム1の帳票識別処理について説明する。
【0024】
図3は本実施形態に係る帳票識別処理の一例を示すフローチャートである。
【0025】
まず、スキャナ200が、ホッパ100から処理対象の帳票を帳票識別部3に取り込む(ステップS10)。スキャナ200が取り込んだ帳票は、イメージ読取部5に読み取られ、帳票のイメージデータを取得される(ステップS11)。入力される帳票の一例を図4に示す。
【0026】
図4は、国民健康保険の振込み依頼の帳票である。図4(a)は帳票の表面であり、図4(b)は帳票の裏面である。本実施形態では(a)の表面に振込みに関する内容が記載されており、(b)の裏面には振込みの際の注意事項が印刷されている。なお、裏面が白紙の場合もある。
【0027】
帳票処理部3に帳票のイメージデータが取得されると、帳票識別部6が、帳票識別情報記憶部11の帳票識別情報に基づいて、入力された帳票の種類を識別する(ステップS12)。本実施形態では、入力された帳票から取得した帳票のフォーマットを、帳票識別情報記憶部11に登録された帳票の種類ごとのフォーマットと照合して入力された帳票の種類を識別する。
【0028】
帳票識別部6が入力された帳票を識別できた場合(ステップS13がYes)、パターン認識部8は帳票の文字認識を行う(ステップS14)。帳票仕分け部13は、識別された帳票の種類に基づいて、ソータ400に対象の帳票を指定ポケット15に排出させ(ステップS15)、帳票識別処理を終了する。
【0029】
帳票識別部6は入力された帳票の種類を識別できなかった場合(ステップS13がNo)、識別子印字部7は識別できなかった帳票に、2列の識別子16a、16bを印字する(ステップS16)。なお、本実施形態では、印字は帳票の裏面に行う。
【0030】
図5に、図3のステップS16で識別子16a、識別子16bを印字された帳票の一例を示す。図5に示すように本実施形態では、図3のステップS16で印字された識別子16aはプレ印刷部分と重なっているため、紫外線を照射しても発光せず、正しく認識されない恐れがある。
【0031】
なお、本実施形態はステップS16で数字を印字しているが、印字する識別子は数字に限らず、アルファベットなどでも良い。また、識別子を印字する方向は、図5では同一行に横方向だが、縦方向に印字してもよい。また、2列に分けて印字してもよい。
【0032】
なお、識別子を印字する場所はあらかじめ設定されている。また、帳票をホッパ100にセットする毎に印字する場所を変更することも可能である。また、帳票のサイズごと印字する場所を変更してもよい。
【0033】
帳票識別部6が印字した後、帳票仕分け部13は、ソータ400に種類を識別できなかった帳票をリジェクトポケットに排出させ(ステップS17)、1回目の帳票識別処理を終了する。
【0034】
ここで、帳票識別部6が帳票の種類を識別できず、ソータ400のリジェクトポケットに排出された帳票は、オペレータによって一枚ずつ確認され、帳票の種類を設定される。具体的には、設定端末4にリジェクトされた帳票のイメージデータが表示される。オペレータは表示されたイメージデータを確認して帳票の種類を特定する。オペレータは、特定した帳票の種類を設定端末4を用いて帳票処理部3に入力する。帳票処理部3は、入力された帳票ごとの種類と、この帳票の識別子と対応付けて帳票識別情報記憶部11に登録する。
【0035】
その後、リジェクトされた帳票は、帳票識別部6によって帳票再識別処理を行われる。図6を参照して帳票再識別処理について説明する。
【0036】
図6は本実施形態に係る帳票識別部6の帳票再識別処理の一例を示すフローチャートである。
【0037】
まず、帳票搬送部2によって、対象の帳票が帳票処理部3に入力される(ステップS20)。帳票が入力されると、イメージ取得部5は、入力された帳票に紫外線を照射し(ステップS21)、蛍光インクで印字された識別子のイメージデータを取得する(ステップS22)。本実施形態では図5に示した識別子16aと識別子16bの2つのイメージデータが取得される。
【0038】
続いて、パターン認識部8は、識別子の文字認識を行う。図7に識別子のイメージデータの一例を示す。なお、図7に示すように、識別子16aは図5に示したプレ印刷部分に重なった部分のイメージデータが取得できなかったとする。
【0039】
ここで、図8及び図9を参照してパターン認識部8が行う文字認識について具体的に説明する。
【0040】
まず、パターン認識部8の類似度算出部9は、ステップS22で取得された各識別子の1つ目の文字のイメージを抽出する(ステップS23)。続いて類似度算出部9は、抽出した各文字イメージと認識辞書記憶部12に登録された各標準パターンとの類似度を算出する(ステップS24)。
【0041】
図8にステップS23およびステップS24のイメージ図を示す。図8に示すように、S23で識別子1から抽出された1つ目の文字イメージを文字1とする。また、識別子2から抽出された1つ目の文字イメージを文字2とする。
【0042】
また、図9に文字1と文字2について、類似度算出部9よって算出された類似度の一例を示す。図9は、文字1および文字2について、標準パターンごとに算出された類似度を示す類似度テーブル19である。
【0043】
図9西消すように、文字1に対する標準パターン「0」の類似度は「33」である。文字2に対する標準パターン「0」の類似度は「25」である。文字1に対する標準パターン1の類似度は「56」である。文字2に対する標準パターン1の類似度は「97」である。文字1に対する標準パターン2の類似度は「57」である。文字2に対する標準パターン2の類似度は「34」である。文字1に対する標準パターン3の類似度は「28」である。文字2に対する標準パターン3の類似度は「23」である。文字1に対する標準パターン4の類似度は「22」である。文字2に対する標準パターン4の類似度は「18」である。文字1に対する標準パターン5の類似度は「34」である。文字2に対する標準パターン5の類似度は「21」である。文字1に対する標準パターン6の類似度は「12」である。文字2に対する標準パターン6の類似度は「33」である。文字1に対する標準パターン7の類似度は「60」である。文字2に対する標準パターン7の類似度は「30」である。文字1に対する標準パターン「8」の類似度は「13」である。文字2に対する標準パターン8の類似度は「10」である。文字1に対する標準パターン9の類似度は「19」である。文字2に対する標準パターン9の類似度は「12」である。
【0044】
類似度比較部10は、標準パターン毎に算出された各文字の類似度に基づいて、最も類似度が高い標準パターンを採用する(ステップS25)。すなわち、類似度比較部10は最も類似度が高い標準パターンを認識結果とする。ここで、図9に示すように、文字1に対して類似度が最も高い標準パターンは「7」である。一方、文字2に対して類似度が最も高い標準パターンは「1」(網掛け)である。パターン認識部8は、このように文字ごとに類似度が高い標準パターンが異なる場合は、より高い類似度の標準パターンを採用する。したがって、パターン認識部8はここでは「1」を採用する。
図6のステップS26に戻る。類似度算出をしていない文字が識別子に存在する場合は(ステップS26がNo)、次の文字を抽出し(ステップS27)、ステップS24からの処理を繰り返す。
【0045】
最後の文字まで類似度を算出した場合は(ステップS26がYes)、パターン認識部8は、類似度比較部10が順次採用した標準パターンを識別子の認識結果とする(ステップS28)。
【0046】
帳票識別部6は、パターン認識部8によって認識された識別番号に基づいて帳票識別情報記憶部11を検索し、帳票の種類を識別する(ステップS29)。
【0047】
帳票仕分け部9は 帳票識別部6による識別結果の種類に基づいて、ソータ400に帳票を指定ポケット15に排出させる(ステップS30)。これにより、本実施形態の帳票再識別処理が終了する。
【0048】
上述したように、本実施形態の帳票識別システム1は、蛍光インクを用いて印字された識別子を2つ印字し、2つの識別子の比較に基づいて認識を行うことにより、帳票のプレ印刷の影響を受けずに識別子を認識することが可能となる。したがって、識別精度の高い帳票識別システムを提供することが可能となる。
【0049】
以上、本発明の実施形態を説明したが、この実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
例えば、上述の実施形態では、識別子として文字列を用いたが、バーコードとして印字しても良い。バーコードは一部の欠落に強いため、帳票のプレ印刷の影響を受けづらい。したがって、より識別精度を高めることができる。
【符号の説明】
【0050】
1…帳票識別システム、2…帳票搬送部、3…帳票識別サーバ、4…設定端末、5…イメージ取得部、6…帳票識別部、7…識別子印字部、8…パターン認識部、9…類似度算出部、10…類似度比較部、11…帳票識別情報記憶部、12…認識辞書記憶部、13…帳票仕分け部

【特許請求の範囲】
【請求項1】
帳票のイメージを読み取り、この読み取った帳票イメージに基づいて、帳票の種類を識別する帳票識別部と、
前記帳票識別部で種類を識別された帳票に付与された識別子を蛍光インクで前記帳票に複数印字する識別子印字部と、
前記帳票識別部で種類が識別できなかった帳票に対して入力された帳票の識別情報に、前記識別子を対応付けて記憶する記憶部と、
前記帳票識別部で種類が識別できなかった帳票に印字された前記複数の識別子を認識する認識部と、
を備え、
前記帳票識別部は、種類が識別できなかった帳票の種類を、前記認識部の認識結果に基づいて前記記憶部を参照して識別する帳票識別システム。
【請求項2】
帳票のイメージを読み取るステップと、
読み取られた帳票イメージに基づいて、前記帳票の種類を識別するステップと、
種類を識別された前記帳票に付与された識別子を蛍光インクで前記帳票に複数印字するステップと、
種類が識別できなかった帳票に対して入力された帳票の識別情報に、前記識別子を対応付けて記憶部に記憶するステップと、
種類が識別できなかった帳票に印字された前記複数の識別子を認識するステップと、
種類が識別できなかった帳票の種類を、前記認識結果に基づいて前記記憶部を参照して識別するステップと、
を備える帳票識別方法。
【請求項3】
帳票の識別情報を記憶する記憶部を備え、前記記憶部を参照して前記帳票の種類を識別する帳票識別システムの帳票識別プログラムであって、
コンピュータに、
帳票のイメージを読み取る機能と、
読み取られた帳票イメージに基づいて、前記帳票の種類を識別する機能と、
種類を識別された前記帳票に付与された識別子を蛍光インクで前記帳票に複数印字する機能と、
種類が識別できなかった帳票に対して入力された帳票の識別情報に、前記識別子を対応付けて前記記憶部に記憶する機能と、
種類が識別できなかった帳票に印字された前記複数の識別子を認識する機能と、
種類が識別できなかった帳票の種類を、前記認識結果に基づいて前記記憶部を参照して識別する機能と、
を実現させる帳票識別プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−252657(P2012−252657A)
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願番号】特願2011−126754(P2011−126754)
【出願日】平成23年6月6日(2011.6.6)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】