説明

文字認識システム及び文字認識方法

【課題】 効率的な修正を可能とする文字認識システムの提供。
【構成】 帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、フィールド毎に規則番号を付した帳票フォーマットファイル110と、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイル130とを設け、該規則番号により指定されたフィールドに記載された文字、例えば与信に用いる必須文字情報の認識を行う第1の認識を行い、この認識した認識結果データが与信審査に合格したとき、前記規則番号により他のフィールドに記載された文字、例えば会社住所等の付随情報の認識を行う第2の認識を行うもの。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票に記載された文字を光学的文字読取機能を用いて認識する光学文字読取装置における文字認識システム及び文字認識方法に係り、特に、帳票に複数の記入フィールドが存在し、特定の記入フィールドに記載された内容に応じて効率的に文字認識又は修正を行うことができる文字認識システム及び文字認識方法に関する。
【背景技術】
【0002】
一般に光学文字読取(OCR)システムは、スキャナの高速化や認識技術の高度化により、帳票の読み取り時間/読取り率が向上しているものの、不読や誤読はいまだにゼロとすることができず、このため不読や誤読文字を修正する時間がOCRシステムでのボトルネックとなっている。
【0003】
従来技術においては前記ボトルネックを低減させるために、帳票フォーマットと呼ぶ帳票の構造や複数の読取りフィールドの記載文字種などの属性を予め記憶させておき、各読取りフィールドの記載文字種などの属性に応じた文字認識を行うことによって、不読や誤読を低減する技術が下記特許文献により提案されている。
【特許文献1】特開2002−150219号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
前記従来技術は、予め定めた複数の読取りフィールドの記載文字種、例えば数字や漢字等の文字種の属性に応じた文字認識を行うことができるものの、やはり不読や誤読をゼロとすることができず、このため不読や誤読がOCRシステムでのボトルネックとなり、事務処理効率を向上することができないと言う不具合があった。また前記認識した文字を修正端末のオペレータが行う際、オペレータの熟練度を考慮せずに文字修正が行われていたため文字修正の効率が良くないという不具合もあった。
【0005】
本発明の目的は、前述の従来技術による不具合を解決することであり、読み取り対象である帳票の記載内容に着目して事務処理効率を向上することができる文字認識システム及び文字認識方法を提供することである。
【課題を解決するための手段】
【0006】
具体的に説明すると、本願発明は、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取システムにおいて、前記規則番号により指定されたフィールドに記載された文字の認識を行う第1の認識を行い、該認識した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された文字の認識を行う第2の認識を行うことを第1の特徴とし、この文字認識システムにおいて、前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、前記第1の文字認識を行う際、前記与信審査情報を記入するフィールドに記載された文字の認識を行い、前記第2の文字認識を行う際、前記付随情報を記入するフィールドに記載された文字の認識を行うことを第2の特徴とする。
【0007】
また本発明は、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取システムにおいて、前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正を行い、該修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正を行うことを第1の特徴とし、この文字認識システムにおいて、前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、前記第1の文字修正を行う際、前記与信審査情報を記入するフィールドに記載された認識文字の修正を行い、前記第2の文字修正を行う際、前記付随情報を記入するフィールドに記載された認識文字の修正を行うことを第2の特徴とする。
【0008】
また本発明は、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識システムにおいて、前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納し、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送することを第3の特徴とし、この文字認識システムにおいて、前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備え、前記転送を行うとき、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを第4の特徴とする。
【0009】
更に本発明は、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法において、前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを設け、前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正工程と、該第1の修正工程により修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正工程を含むことを第5の特徴とし、この文字認識方法において、前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、光学文字読取装置が、前記第1の修正工程により前記与信審査情報を記入するフィールドに記載された文字の修正を行い、前記第2の修正工程により前記付随情報を記入するフィールドに記載された文字の修正を行うことを第6の特徴とする。
【0010】
また本発明は、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法において、前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを設け、前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納する工程と、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送する工程とを行う第7の特徴とし、この文字認識方法において、前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備えるとき、前記転送工程において、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを第8の特徴とする。
【発明の効果】
【0011】
このように、本発明によれば、効率的な修正を行うために帳票のデータを分類する規則を定義し、帳票のフォーマット情報と共に、フィールドにその規則を符号化した情報を記憶し、それらを用いて認識文字情報を指定し、指定された情報を元にデータを入出力し、キー入力や修正画面の表示を行う修正手段を用いることにより、OCRなどから入力済みのデータを効率的に修正することができる。
【発明を実施するための最良の形態】
【0012】
以下、本発明による文字認識システム及び文字認識方法の一実施形態を図面を参照して詳細に説明する。図1は、本実施形態による文字認識システムの機能構成動作を示す図、図2は本実施形態による機器構成を示す図、図3は本実施形態に好適な帳票例を示す図、図4は本実施形態による帳票の帳票フォーマットを示す図、図5は本実施形態による帳票の文字認識結果を制御する制御パラメタを示す図、図6はクレジットカードの申込書の業務フローを説明するための図、図7は本実施形態に好適な各フィールドの集合を区別する規則の例を示す図である。
<原理説明>
【0013】
まず、本発明の原理について説明する。一般に光学文字認識を行う対象である帳票としては各種のものが考えられるが、帳票に記載される内容としては、例えば、各種サークル/施設等の入会申込書やクレジットカードの申込書等では、必須な本人確認情報や与信審査のために必要な必須情報が記載されるフィールドと、顧客サービス向上のためのマーケティングやセグメント化を行うための付随情報が記載されるフィールドが存在し、更に、同じ文字情報と言っても数字等の簡易に修正が可能な文字種と漢字等の熟練を要するオペレータが修正する方が好ましい文字種とが存在する。
【0014】
これを説明すると、本発明の対象となる対象帳票30は、図3に示す如く、施設の入会申込書の場合、例えば、氏名記入欄/生年月日欄/住所欄/勤め先の会社名/電話番号が個人確認情報並びに与信情報である必須情報の記入欄と、会社の住所/電話番号等の付随情報記入欄とに大別される。また、同時に当該対象帳票30は、郵便番号や電話番号等の数字等の簡易に修正が可能な文字種と、氏名や住所と言った漢字等の熟練を要するオペレータが修正する方が好ましい文字種が存在する。
【0015】
発明者は、前述の文字情報を読み取ったシステムが、前記氏名等の必須情報を審査し、この審査をパスした場合に他の付随情報を認識する必要が生じる特性に着目し、前記規則番号により指定された与信審査情報を記入するフィールドに記載された文字の修正を行う第1の修正を行い、該修正した認識結果データが所定の与信審査に合格したとき、前記規則番号により他の付随情報を記入するフィールドに記載された認識文字の修正を行う第2の修正を行う発明と、更に文字修正を行う際にはオペレータの能力差があることに着目し、前記規則番号により指定された数字及び漢字フィールドに記載された認識文字の修正を、前記規則番号により指定された修正端末に転送して効率的に文字修正を行う発明を成したものである。
<構成の説明>
【0016】
次に本実施形態による文字認識システム及び方法を図面を参照して説明する。本実施形態による文字認識システムが適用される機器構成は、図2に示す如く、帳票に記載された文字を光学的に読み取って認識する光学文字読取装置(OCR)25と、該OCR25を制御する帳票読取り端末20と、該帳票読取り端末20によって認識不能な不読文字や誤読文字を修正するための修正端末21及び22と、前記帳票読取り端末20によって読み取りが行われ、且つ修正端末21等により不読又は誤読文字を修正した認識結果データを格納する共有ディスク27と、該共有ディスク27に格納した認識結果データのうち、例えば氏名等の必須情報を入力して与信を行うための与信審査端末28と、前記帳票読取り端末20/修正端末21/修正端末22/共有ディスク27/与信審査端末28とを接続するネットワーク26とから構成される。
【0017】
この文字認識システムが適用される機器構成は、帳票読取り端末20が、OCR25が光学的に帳票から読み取った文字情報を認識してネットワーク26を介して共有ディスク27に一旦格納し、修正端末21等のオペレータが前記共有ディスク27に格納した認識結果データ(文字情報)並びにイメージデータを参照して誤読又は不読文字の修正を行った認識結果データを共有ディスク27に格納する様に構成されている。また前記与信審査端末28は、前記読み取った認識結果データの内、与信に必要な文字情報のみを参照して資格等の与信を行うものであるが、詳細動作については後述する。
【0018】
さて、本実施形態による文字認識システムの機能は、図1に示す如く、認識結果ファイル名等を含む制御パラメータを格納する制御パラメータファイル100と、読み取り対象である帳票のフォーマットを格納する帳票フォーマットファイル110と、前記制御パラメータファイル100及び帳票フォーマットファイル110を参照して帳票読み取りを制御し、認識結果ファイルを認識結果ファイル130(図2の共有ディスク27に相当)に格納する帳票読取りプログラム120と、該帳票読取りプログラム120が読み取った認識結果ファイルの修正を行う認識結果修正プログラム140とから構成され、これら構成機能は前記帳票読取り端末20に含まれる。尚、図1中の各構成を結んでいる線は、それぞれの構成が関係あることを示し、数値などで指定がない表示は1対1の関係であり、1...*の表示は1対多の関係を示す。また前記制御パラメータ及び帳票フォーマットは、予めフォーマット作成者が、帳票読取りプログラムや認識結果修正プログラムが規定する所定の方法で作成するものであって、具体的には、テキストエディタなどを用いてCSVやXMLなどの所定の形式で作成されるものである。
【0019】
前記OCR25の読み取り対象となる対象帳票は、前述の図3に示した如く記載形式であり、この対象帳票の帳票フォーマット40は、図4に示す如く、項番/この項番の名称/この項番に記載される文字の属性/前記必須情報か付随情報かを識別するための規則番号/記載される最大の文字数/該項番の位置(座標)/項番の意味の複数項目から構成され、本例では、項番1が、この項目の名称が「氏名1」/その文字属性が「カタカナ」/規則番号が「1」(必須情報)/文字数が「30」文字/位置が「0350,1850,0050,0120」/意味が「氏名:フリガナ」であり、規則番号「1」が優先処理項目、規則番号「2」が準優先項目として設定している。尚、当該規則番号は、前述した必須か否か等に限られるものではなく、例えばオペレータの能力差等の要因から効率的な修正を行うことができる規則(数字等の単純な修正と漢字等の比較的修正が困難な修正)であっても良い。
【0020】
前記規則番号は、読み取られる帳票の記載内容に応じて設定されるものであり、例えば帳票がクレジットカードの申込書の場合、この規則番号は、図7の規則71に示す如く、与信に必要なデータに対して「1」、与信完了後に修正を行うデータに対して「2」、全てのデータに対して「0」を設定することや、データエントリ会社の場合、生年月日やクレジット番号等の数字のみの文字情報のフィールドとして「3」、氏名/住所等の漢字を含む文字情報のフィールドとして「4」を設定する。
【0021】
前記帳票フォーマットファイル110は、図1に示す如く、前述した対象帳票フォーマット40の帳票長さ/幅/修正画面情報を格納した帳票フォーマット111と、各フィールドの位置情報/文字数等を格納したフィールド112と、該フィールド112毎の規則番号を格納したフィールド規則113と、該フィールドの画面内の位置情報を格納したフィールド修正画面114と、認識文字のチェック方式を格納したフィールドチェック情報115とから構成される。この制御パラメータファイル100に格納される制御パラメータは、図5に示す如く、帳票フォーマット例/修正する規則番号/認識結果ファイル名を格納した与信に必要なデータ修正を行うための制御パラメータ51と、同構成を格納した与信完了後データ修正を行うための制御パラメータ52が格納されている。
【0022】
前記帳票読取りプログラム120は、図1に示す如く、辞書を参照して文字認識を行う文字認識部122と、フィールド情報を参照して指定されたフィールドデータを制御するデータ入出力部123と、メニュー画面や修正画面を制御するための画面管理部124とから構成され、帳票読取り部121が、文字認識部122を用いてデータ入出力部123によって指定されたフィールド内の文字情報を認識する様に動作するものである。
【0023】
前記認識結果修正プログラム140は、指定された制御パラメータ名や規則番号に従って認識結果ファイル130に格納された文字認識結果を修正する認識結果修正部141と、フィールド情報を参照して指定されたフィールドデータを制御するデータ入出力部142と、メニュー画面や修正画面を制御するための画面管理部143とから構成される。
<動作説明>
【0024】
さて、この様に構成された文字認識システムは、図7の規則71を適用した帳票がクレジットカードの申込書の場合、図6に示す如く、規則番号1の文字情報である氏名等の必須情報の修正を行い(ステップ60)、この修正を行った氏名等の必須情報を用いてクレジットカードに入会可能か否かの与信を実施し(ステップ61)、次いで前記与信の審査結果がOKか否かの判定(ステップ62)を行い、該ステップ62により与信結果がNOのときには与信NG処理を行い、前記ステップ62により与信がOKと判定されたときには、カード発行や関連書類の顧客―の発送処理(ステップ64)を行った後に、前述の会社住所等の付随情報の修正処理を行う様に動作する。
【0025】
前記処理手順は、例えばデータエントリ会社の場合、規則番号1を漢字等の熟練を要する文字情報とし、規則番号2を数字等の修正が容易な文字情報とし、熟練者が漢字等の文字情報の修正を行った後に新人が数字の文字情報の修正を行うように変更しても良い。
【0026】
また本処理手順は、例えばデータエントリ会社において、規則番号1により指定されたフィールドから認識した認識文字を熟練者が操作する修正端末に送信し、規則番号2により指定されたフィールドから認識した認識文字を非熟練者が操作する修正端末に送信し、両者に平行して文字修正業務を分担することによって、効率的な文字修正を行うことができる。
【0027】
この様に本発明は、帳票内のフィールドをそれらの規則に応じて分類て、必要な部分のみを先に処理して、事務処理を効率化するとともに、顧客へのレスポンスのスピードを向上することができる。
【図面の簡単な説明】
【0028】
【図1】本発明の一実施形態による文字認識システムの機能構成動作を示す図。
【図2】本実施形態による機器構成を示す図。
【図3】本実施形態に好適な帳票例を示す図。
【図4】本実施形態による帳票の帳票フォーマットを示す図。
【図5】本実施形態による帳票の文字認識結果を制御する制御パラメータを示す図。
【図6】クレジットカードの申込書の業務フローを説明するための図。
【図7】本実施形態に好適な各フィールドの集合を区別する規則の例を示す図。
【符号の説明】
【0029】
20:帳票読取り端末、21〜22:修正端末、26:ネットワーク、27:共有ディスク、28:与信審査端末、30:対象帳票、40:帳票フォーマット、51〜52:制御パラメータ、71〜72:規則、100:制御パラメータファイル、110:帳票フォーマットファイル、111:帳票フォーマット、112:フィールド、113:フィールド規則、114:フィールド修正画面、115:フィールドチェック情報、120:プログラム、121:帳票読取り部、122:文字認識部、123:データ入出力部、124:画面管理部、130:認識結果ファイル、140:認識結果修正プログラム、141:認識結果修正部、142:データ入出力部、143:画面管理部。

【特許請求の範囲】
【請求項1】
前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取システムであって、
前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正を行い、該修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正を行うことを特徴とする文字認識システム。
【請求項2】
前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、前記第1の文字修正を行う際、前記与信審査情報を記入するフィールドに記載された認識文字の修正を行い、前記第2の文字修正を行う際、前記付随情報を記入するフィールドに記載された認識文字の修正を行うことを特徴とする請求項1記載の文字認識システム。
【請求項3】
前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを備え、複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識システムであって、
前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納し、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送することを特徴とする文字認識システム。
【請求項4】
前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備え、前記転送を行うとき、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを特徴とする請求項3記載の文字認識システム。
【請求項5】
複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法であって、
前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルとを設け、
前記規則番号により指定されたフィールドに記載された認識文字の修正を行う第1の修正工程と、該第1の修正工程により修正した認識結果データが所定の審査に合格したとき、前記規則番号により他のフィールドに記載された認識文字の修正を行う第2の修正工程を含むことを特徴とする文字認識方法。
【請求項6】
前記帳票が、与信審査情報を記入するフィールドと、付随情報を記入するフィールドとを備えるとき、光学文字読取装置が、前記第1の修正工程により前記与信審査情報を記入するフィールドに記載された文字の修正を行い、前記第2の修正工程により前記付随情報を記入するフィールドに記載された文字の修正を行うことを特徴とする請求項5記載の文字認識方法。
【請求項7】
複数のフィードから成る帳票に記載された文字を光学文字読取機能を用いて文字認識を行う光学文字読取装置の文字認識方法であって、
前記光学文字読取装置に、前記フィールド毎に規則番号を付した帳票フォーマットファイルと、文字認識を行った認識結果データを前記規則番号に対応して格納する認識結果ファイルと、認識した文字の修正を行う複数の修正端末とを設け、
前記規則番号により指定されたフィールドに記載された文字の認識結果データを前記規則番号に対応して認識結果ファイルに格納する工程と、該格納した認識結果データを認識結果ファイルから読み出して前記規則番号により指定された修正端末に転送する工程とを行う特徴とする文字認識方法。
【請求項8】
前記帳票が、数字のみを記入するフィールドと、漢字を含む文字情報を記入するフィールドとを備えるとき、前記転送工程において、数字のみを記入するフィールドの文字認識データと漢字を含む文字情報を記入するフィールドの文字認識データとを異なる修正端末に転送することを特徴とする請求項7記載の文字認識方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2007−11656(P2007−11656A)
【公開日】平成19年1月18日(2007.1.18)
【国際特許分類】
【出願番号】特願2005−191162(P2005−191162)
【出願日】平成17年6月30日(2005.6.30)
【出願人】(000233033)日立コンピュータ機器株式会社 (253)
【Fターム(参考)】