説明

帳票処理システム

【課題】帳票に記載された情報をテキストデータ化する一連の処理を、個人情報の保護を図りつつ、効率よく行う。
【解決手段】帳票の画像データから部分画像データを切り出す画像切り出し装置1と、部分画像データの内容をテキストデータとして入力する入力装置2と、テキストデータを結合する結合装置3と、を備える帳票処理システム100であって、画像切り出し装置1は、部分画像データを切り出し、部分画像データのファイルを暗号化して入力装置2に送信し、入力装置2は、部分画像データの内容をテキストデータとしてユーザにより入力し、暗号化されたファイル名のテキストデータを結合装置3に送信し、結合装置3は、暗号化されたファイルを復号し、復号されたファイル名に基づいてテキストデータを結合する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票に記載された情報をテキストデータ化する処理を行う帳票処理システムに関する。
【背景技術】
【0002】
従来、官公庁や企業において、様々な帳票から様々な情報をテキストデータ化する業務が行われている。
具体的には、例えば、各国税局や税務事務所では、給与報告書、確定申告書、源泉徴収票などの帳票に関して、帳票に記載された情報をテキストデータ化する業務が行われている。
これらの業務は、帳票を大量処理しなければならないものであり、また作業時期に偏りがあることから、外部の入力業者にデータ入力を委託せざるを得ない場合がある。
しかしながら、帳票には、氏名や住所の他に電話番号や職業、さらには銀行口座番号などが記載されているため、帳票現物は勿論のこと、例えば帳票をそのままスキャナ等で読み込んだだけの画像データでは、個人情報保護の観点から外部に持ち出すのは好ましくない。
【0003】
そこで、帳票に記載された各種情報をばらばらに管理できるようにして個人情報の保護を可能とした帳票処理装置が提案された(例えば、特許文献1、2参照。)。
かかる帳票処理装置では、帳票を画像読取機で読み取った後、読み取った画像データ内の罫線を検出することで、罫線により囲まれた複数の情報の記載枠を特定する。そして、それぞれの記載枠から部分画像データを切り出して、切り出された部分画像データのファイル名を暗号化し、暗号化されたファイル名を用いて、切り出された部分画像データを保存する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008−17053号公報
【特許文献2】特開2008−15702号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の帳票処理装置は、帳票の画像データから切り出された部分画像データを管理するだけに留まり、帳票から読み取った画像データの情報をテキストデータ化する一連の業務がシステム化されておらず、個人情報の保護と業務効率の向上の両立が図れていなかった。
また、帳票から読み取った画像データは、ノイズが入ったり、画像周縁部が黒ずんだりする場合がある。また、帳票は申込者などが自筆で記載するものであるため、読み取り前に記載枠外にインク汚れ等が付着していることもある。
上記した帳票処理装置は、読み取った画像データのエッジから検出を行い、最初に確認された「黒」部を罫線として検出し、そこを起点として記載枠を特定していく構成であった。このため記載枠外にノイズや黒ずみ、インク汚れ等があった場合にはこれを起点としてしまうので、記載枠(すなわち切り出しを行う範囲)が正確に特定されないという問題があった。
また、一度記載枠が特定されない場合には、即エラーとなる構成であったため、エラー発生率が高く、実用上好ましくないという問題があった。
【0006】
本発明の課題は、帳票に記載された情報をテキストデータ化する一連の処理を、情報の保護を図りつつ、効率よく行うことができる帳票処理システムを提供することである。
【課題を解決するための手段】
【0007】
前記課題を解決するために、請求項1に記載の発明は、
罫線で囲まれた記載枠を有する帳票に記載された情報を読み取った画像データから所定の部分画像データを切り出す画像切り出し装置と、前記部分画像データの内容をテキストデータとして入力する入力装置と、前記画像データに対応する前記テキストデータを結合する結合装置と、を備える帳票処理システムであって、
前記画像切り出し装置は、
前記画像データから部分画像データを切り出す切り出し手段と、
前記切り出し手段により切り出された部分画像データのファイル名を暗号化する暗号化手段と、
前記暗号化手段により暗号化されたファイル名の部分画像データを前記入力装置に通信ネットワークを介して送信する部分画像データ送信手段と、を備え、
前記入力装置は、
前記画像切り出し装置から送信された部分画像データの内容をテキストデータとしてユーザ操作により入力する入力手段と、
前記暗号化されたファイル名を含むテキストデータを前記結合装置に通信ネットワークを介して送信するテキストデータ送信手段と、を備え、
前記結合装置は、
前記入力装置から送信されたテキストデータに含まれる前記暗号化されたファイル名を復号する復号手段と、
前記復号手段により復号されたファイル名に基づいて、テキストデータを結合する結合手段と、を備えることを特徴とする。
【0008】
請求項2に記載の発明は、
請求項1記載の帳票処理システムにおいて、
前記画像切り取り装置は、
前記画像データを一方向に走査して罫線候補を検出する検出手段と、
前記検出手段により検出された前記罫線候補を基準として、予め設定された位置に基準枠を構成する罫線が存在するか否かによって、前記罫線候補を含む基準枠が存在するか否か判断する第1判断手段と、
前記第1判断手段により前記罫線候補を含む基準枠が存在すると判断された場合に、当該基準枠を基準として、予め設定された位置に記載枠が存在するか否かを判断する第2判断手段と、備え、
前記切り出し手段は、前記第2判断手段により全ての前記記載枠が存在すると判断された場合に、前記記載枠に基づいて前記部分画像データを切り出すことを特徴とする。
【0009】
請求項3に記載の発明は、
請求項2記載の帳票処理システムにおいて、
前記第1判断手段により、前記罫線候補を含む基準枠が存在しないと判断された場合、画像データを再走査して前記罫線候補と異なる第2罫線候補を検出する再検出手段を備え、
前記第1判断手段は、前記再検出手段により再検出された前記第2罫線候補を基準として、予め設定された位置に基準枠を構成する罫線が存在するか否かによって、前記第2罫線候補を含む基準枠が存在するか否か判断し、
前記第2判断手段は、前記第1判断手段により前記第2罫線候補を含む基準枠が存在すると判断された場合に、当該基準枠を基準として、予め設定された位置に記載枠が存在するか否かを判断することを特徴とする。
【0010】
請求項4に記載の発明は、
請求項2又は3記載の帳票処理システムにおいて、
ユーザが画像データにおける走査の開始点を指定するための指定手段を備え、
前記検出手段は、前記指定手段により指定された開始点から画像データの走査を開始することを特徴とする。
【発明の効果】
【0011】
本発明によれば、帳票に記載された情報をテキストデータ化するまでの一連の処理がシステム化されることとなり、業務効率の向上を図ることができる。
また、ファイル名が暗号化されているために部分画像データ同士を第三者が結びつけることができないため、帳票に記載された情報を保護することが可能となる。
従って、帳票に記載された情報をテキストデータ化する一連の処理を、情報の保護を図りつつ、効率よく行うことができる。
【図面の簡単な説明】
【0012】
【図1】帳票処理システムの全体構成を示す概要図である。
【図2】帳票処理装置に読み取られる帳票を例示した図である。
【図3】走査開始位置を指定する際の表示画面を例示した図である。
【図4】帳票の罫線の検出を説明するための図である。
【図5】帳票処理システムにおける処理動作を示すフローチャートである。
【図6】画像切り出し装置の切り出し処理動作を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、図面を参照して、本発明に係る帳票処理システムについて詳細に説明する。
【0014】
(全体構成)
本発明の実施の形態の帳票処理システム100は、画像切り出し装置1と、入力装置2と、結合装置3と、を備えて構成される。
【0015】
画像切り出し装置1は、罫線で囲まれた記載枠を有する帳票に記載された情報を読み取った画像データから所定の部分画像データを切り出して、切り出した部分画像データを、通信ネットワークNを介して入力装置2に送信する。
入力装置2は、部分画像データの内容をテキストデータとして入力し、入力したテキストデータを、通信ネットワークNを介して結合装置3に送信する。
通信ネットワークNは、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等の通信ネットワークNであり、電話回線網、ISDN(Integrated Services Digital Network)回線網、広域帯通信回線網、専用線、移動体通信網、通信衛星回線、CATV(Community Antenna TeleVision)回線網、光通信回線、無線通信回線等の各種通信回線と、それらを接続するインターネットサービスプロバイダを含む。特に、セキュリティー性の高いインターネットVPN(Virtual Private Network)が好適である。
結合装置3は、分離したテキストデータを結合し、元の画像データ(帳票)に対応する1つのテキストデータを構築する。
そして、この帳票処理システム100において、例えば、帳票に記載された情報をテキストデータ化する必要がある官公庁や企業が画像切り出し装置1と結合装置3を備え、外部委託業者が入力装置2を備えることで、帳票に記載された情報をテキストデータ化する外部委託業務のビジネスモデルが構築される。
【0016】
(画像切り出し装置)
画像切り出し装置1は、例えば、官公庁や企業における各事業所、各支店、或いは各店舗に設置されている。
画像切り出し装置1には、複数の画像読取機4a、4b、・・・が接続されている。
画像読取機4a、4b、・・・は、顧客が記載枠に情報を書き込んだ帳票を読み取り、読み取った帳票の画像データを画像切り出し装置1に転送する。
各画像読取機4a、4b、・・・は、画像切り出し装置1とケーブル等を介して接続される。
【0017】
ここで、本発明の実施の形態の帳票処理システム100に適用される帳票を図2に例示する。
帳票としては、例えば、給与報告書、確定申告書、源泉徴収票、生命保険の申し込み用紙、銀行ローンの申し込み用紙、クレジットカードの入会申し込み用紙などである。これらの帳票には、個人情報が記載される。
ここで、個人情報とは、一般に、個人を特定できる情報の組み合わせをいい、1)情報主体(氏名)、2)内容情報(生年月日、性別、職業等)、3)連絡情報(住所、電話番号等)によって構成されている。従って、例えば、氏名及び住所、氏名及び電話番号、などとされる。
帳票は、左側縁51と右側縁52、下側縁53と上側縁54を有し、帳票内において最も大きな枠である基準枠50が備えられており、基準枠50の内部或いは基準枠50の外部に各情報を記載する複数の記載枠が備えられている。
【0018】
画像切り出し装置1は、表示部11、入力部12、データ記憶部13、CPU(Central Processing Unit)14、RAM(Random Access Memory)15、プログラム記憶部16、通信部17等を備えて構成されている。
【0019】
表示部11は、例えばモニタ等であり、CPU14からの表示制御信号に従って、画面上に、例えば読み込んだ画像データ等を表示する。
【0020】
入力部12は、例えばキーボードやマウス等であり、指定手段として、例えば、ユーザが表示部11に表示された画像データを目視しながら、走査の開始点を指定する際などに利用される。
具体的には、例えば、図3(a)に示すように、ユーザが左側縁51の左側の一点P1を指定すると、点P1を走査開始点とし、右方向を走査方向として、走査が行われる。
また、図3(b)に示すように、ユーザが上側縁54の上側の一点P2を指定すると、点P2を走査開始点とし、下方向を走査方向として、走査が行われる。
このとき、P1の位置(左側縁51からの距離)や、P2の位置(上側縁54からの距離)は、任意に設定可能である。指定された走査開始点の位置は、予め設定されている基準線(左側縁51、或いは上側縁54)の位置からのピクセル数によって特定される。
【0021】
データ記憶部13は、CPU14によって演算処理された各種処理結果のデータなどを記憶する。具体的には、データ記憶部13には、後述の切り出しプログラム165の実行によって切り出された部分画像データを項目別に保存するための、複数の項目フォルダ131、132・・・が備えられており、例えば、帳票の氏名の記載枠の部分画像データは、項目フォルダ131に保存され、帳票の電話番号の記載枠の部分画像データは、項目フォルダ132に保存される。このように、住所、性別、生年月日などのそれぞれの部分画像データも、項目毎のそれぞれの項目フォルダに個別に保存される。
【0022】
また、データ記憶部13には、後述の第2判断プログラム164の実行の結果、識別ができなかった部分画像データなどを保存するNGフォルダ139が備えられている。
NGフォルダ139内に蓄積された部分画像データは、手動操作により表示部11の画面に表示させ目視で確認することができる。このため、帳票の記載不備等が確認でき、記載不備のある帳票を廃棄したり、申込者に再度帳票へ記載してもらうなどの対応に移行することができる。一方、部分画像データを目視で確認して、記載不備の無い帳票であることが確認できたときには、手動操作、すなわちキーボード入力やマウス入力などにより、個人情報に関する記載枠の画像データを切り出し、切り出した画像データのファイル名を付して、項目フォルダ131、132・・・のそれぞれに分類して保存する。
【0023】
CPU14は、例えば、プログラム記憶部16に記憶されている各種処理プログラムに従って、各種の制御処理を行う。
【0024】
RAM15は、CPU14により演算処理されたデータを格納するワークメモリエリアを形成している。
【0025】
プログラム記憶部16は、例えば、CPU14によって実行可能なシステムプログラムや、そのシステムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU14によって演算処理された各種処理結果のデータなどを記憶する。例えば、複数種類の帳票を同時に読み取る場合の、帳票の各種類ごとの基準枠の幅Lや、記載枠の位置情報等を記憶する。
なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形でプログラム記憶部16に記憶されている。
【0026】
具体的には、プログラム記憶部16には、例えば、検出プログラム161、第1判断プログラム162、再検出プログラム163、第2判断プログラム164、切り出しプログラム165、暗号化プログラム166、部分画像データ送信プログラム167、等が記憶されている。
【0027】
検出プログラム161は、CPU14に、画像データを一方向に走査して罫線候補を検出する機能を実現させるプログラムである。
ここで、画像読取機4a、4bで読み取られた帳票の画像データは、基本的には面内が白い部分(白部)と黒い部分(黒部)とを有しており、黒部を所定のしきい値を用いて認識することにより、2値化されたデータ群として処理できる。
「罫線候補」とは、画像データにおいて、基準枠50を構成する罫線の一部の黒部である。
具体的に、入力部12により走査開始点や走査方向が指定されると、CPU14は、当該指定された開始点から画像データの走査を開始し、走査中に所定の大きさの黒部が現れると、これを罫線候補として検出する。なお、黒部及び白部の位置は、絶対座標上の値を用いて把握可能である。
以下、図4に示すように、ユーザが左側縁51の左側の一点P1を走査開始点として指定し、点P1から右方向に走査を行う場合について説明する。図4は、基準枠50の左側にノイズが入った例である。
従って、図4の例では、P1から走査が開始されると、CPU14は、点X1において黒部を検出する。
CPU14は、かかる検出プログラム161を実行することにより、検出手段として機能する。
【0028】
第1判断プログラム162は、CPU14に、検出プログラム161の実行により検出された前記罫線候補を基準として、予め設定された位置に基準枠を構成する罫線が存在するか否かによって、前記罫線候補を含む基準枠が存在するか否か判断する機能を実現させるプログラムである。
また、第1判断プログラム162は、CPU14に、後述の再検出プログラム163の実行により再検出された第2罫線候補を基準として、予め設定された位置に基準枠を構成する罫線が存在するか否かによって、前記第2罫線候補を含む基準枠が存在するか否か判断する機能を実現させるプログラムである。
具体的に、CPU14は、黒部を検出すると、その黒部から予め記憶された帳票の基準枠の幅Lだけ離れた位置にも黒部があるか否かを判断する。そして、CPU14は、該当位置に黒部が検出された場合、罫線候補を含む基準枠が存在すると判断する一方、該当位置に黒部が検出されない場合、罫線候補を含む基準枠が存在しないと判断する。
つまり、CPU14は、検出した2つの黒部が、基準枠50を構成する左側縁51と右側縁52の一部であると判断する。
図4の例では、CPU14は、点X1において黒部が検出されたため、点X1の黒部を基準として、点X1からLだけ離れた点X3にも黒部が検出されるか判断するが、点X3では黒部が検出されないため、この位置には罫線候補を含む基準枠が存在しないと判断する。
また、CPU14は、点X2において黒部が検出されたため、点X2の黒部を基準として、点X2からLだけ離れた点X4にも黒部が検出されるか判断し、点X4では黒部が検出されるため、この位置に罫線候補を含む基準枠が存在すると判断する。
CPU14は、かかる第1判断プログラム162を実行することにより、検出手段として機能する。
【0029】
再検出プログラム163は、CPU14に、第1判断プログラム162の実行により、前記罫線候補を含む基準枠が存在しないと判断された場合、画像データを再走査して前記罫線候補と異なる第2罫線候補を検出する機能を実現させるプログラムである。
具体的に、CPU14は、同一の走査方向(この場合、右方向)への走査を再開し、走査中に所定の大きさの黒部が現れると、これを第2罫線候補として検出する。
図4の例では、CPU14は、点X1より走査を再開し、点X2において黒部を検出する。
CPU14は、かかる再検出プログラム163を実行することにより、再検出手段として機能する。
【0030】
第2判断プログラム164は、第1判断プログラム162の実行により前記罫線候補を含む基準枠が存在すると判断された場合に、当該基準枠を基準として、予め設定された位置に記載枠が存在するか否かを判断する機能を実現させるプログラムである。
具体的に、CPU14は、基準枠が存在すると判断された場合、予め記憶された帳票にかかるデータの中から、当該基準枠を備える種類の帳票を選択する。
そして、CPU14は、選択された帳票(基準枠を備えた帳票)の1つを更に選択し、この帳票が備えるべき全ての記載枠が、画像データ内にあるか否か(予め設定された位置に全ての記載枠が存在するか否か)を判断する。全ての記載枠とは、基準枠50の内部及び外部の全ての記載枠を指す。なお、CPU14は、かかる判断を、選択された種類の帳票のうち1つの帳票に行い、全ての記載枠が存在しないと判断した場合は、選択された種類の帳票のうちの別の帳票に対して同様の処理を順次実行する。
より具体的には、CPU14は、記載枠を構成する複数の罫線の全てが、所定の位置に存在するか否かを判断する。なお、かかる判断の手法が、基準枠の検出の手法と同様である。
CPU14は、かかる第2判断プログラム164を実行することにより、決定手段として機能する。
【0031】
切り出しプログラム165は、CPU14に、第2判断プログラム164の実行により全ての前記記載枠が存在すると判断された場合に、前記記載枠に基づいて部分画像データを切り出す機能を実現させるプログラムである。
具体的に、CPU14は、全ての前記記載枠が存在すると判断された場合、記載枠の罫線の位置において、画像データの切り出し処理を実行し、帳票の記載事項のうちの個人情報に関する項目を画像データから切り出す。
例えば、氏名の記載枠、電話番号の記載枠、住所の記載枠、銀行口座番号の記載枠、E−メールアドレスの記載枠、および職業の記載枠などが別々に部分画像データとして切り出される。
【0032】
なお、切り出された部分画像データは、項目フォルダ131、132・・・のそれぞれに保存される。具体的に、例えば、氏名の記載枠の部分画像データは、項目131のフォルダに保存され、電話番号の記載枠の部分画像データは、項目フォルダ132に保存される。つまり、項目フォルダ131、132・・・には、それ1つでは個人情報とはならないデータが保存されることとなる。
CPU14は、かかる切り出しプログラム165を実行することにより、切り出し手段として機能する。
【0033】
暗号化プログラム166は、CPU14に、切り出しプログラム165の実行により切り出された部分画像データのファイル名を暗号化する機能を実現させるプログラムである。
具体的に、CPU14は、項目フォルダ131、132・・・のそれぞれのフォルダに保存されている部分画像データのファイル名を、乱数情報及び時間情報を含んだ秘密鍵を用いた異なるファイル名に変換(暗号化)し、各項目フォルダ内の部分画像データを、ファイル名に基づいて第三者が結びつけることができなくなるようにする。ここで、時間情報も第三者が理解不能な数字の組み合わせ等に変換させている。
各フォルダ内の部分画像データを、第三者が結びつけることができないため、個人情報を保護することが可能となる。
なお、ファイル名には、同一の画像データから切り出された部分画像データに共通する識別データが含まれる。この識別データにより、結合装置3において画像データに対応するテキストデータの結合が可能となる。
CPU14は、かかる暗号化プログラム166を実行することにより、暗号化手段として機能する。
【0034】
部分画像データ送信プログラム167は、CPU14に、暗号化プログラム166の実行により暗号化されたファイル名の部分画像データを入力装置2に通信ネットワークNを介して送信する機能を実現させるプログラムである。
具体的には、CPU14は、インターネットVPN等の通信ネットワークNを介して、項目フォルダ131、132・・・のそれぞれに個別に保存された、暗号化されたファイル名の部分画像データを、入力装置2に送信する。
CPU14は、かかる部分画像データ送信プログラム167を実行することにより、部分画像データ送信手段として機能する。
【0035】
通信部17は、通信ネットワークNに接続して入力装置2とのデータ通信を行う。この機能は、通信モジュール、モデム、TA、有線用の通信ケーブルのジャックや制御回路などによって実現される。
【0036】
(入力装置)
入力装置2は、画像切り出し装置1に対して複数接続され、各入力装置2には、項目フォルダ131、132・・・が割り振られている。そして、各々の入力装置2には、割り振られた項目フォルダ内の部分画像データが送信されるようになっている。
具体的には、例えば、一の入力装置2には、帳票の氏名の項目フォルダ131に保存されている部分画像データが送信され、別の入力装置2には、帳票の電話番号の項目フォルダ132が送信される。
入力装置2は、表示部21、入力部22、CPU23、RAM24、記憶部25、通信部26等を備えて構成され、例えば、パソコン(PC;personal computer)等が利用可能である。
【0037】
表示部21は、例えばモニタ等であり、CPU23からの表示制御信号に従って、画面上に、例えば個人情報データを入力するための入力フォーム等の表示を行う。
具体的には、表示部21には、例えば、氏名、生年月日、性別、職業等、住所、電話番号等、メールアドレス、等の入力項目を有する入力フォームが表示されるようになっている。
【0038】
入力部22は、キーボードやマウス等であり、入力手段として、画像切り出し装置1から送信された部分画像データの内容を、テキストデータとして外部委託業者などによるユーザ操作により入力される際に利用される。
具体的には、入力部22は、オペレータが部分画像データを見ながら、表示部21の入力フォームに、氏名や電話番号などの情報をキーで入力する際に利用され、これにより、部分画像データのデータ群は、テキストデータに変換されることとなる。
また、切り取った画像データに表されている文字や数字を解読できるソフトウエアを使用し、文字や数字のテキストデータに自動変換することも可能である。
なお、このように部分画像データがテキストデータに変換された場合、テキストデータには、元の部分画像データの暗号化されたファイル名が取り込まれるようになっている。なお、テキストデータのファイル名の一部に、元の部分画像データのファイル名を含むこととしても良い。
【0039】
CPU23は、例えば、記憶部25に記憶されている各種処理プログラムに従って、各種の制御処理を行う。
【0040】
RAM24は、CPU23により演算処理されたデータを格納するワークメモリエリアを形成している。
【0041】
記憶部25は、例えば、CPU23によって実行可能なシステムプログラムや、そのシステムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU23によって演算処理された各種処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部25に記憶されている。
【0042】
具体的には、記憶部25には、例えば、テキストデータ送信プログラム251、等が記憶されている。
【0043】
テキストデータ送信プログラム251は、CPU23に、暗号化されたファイル名を含むテキストデータを結合装置3に通信ネットワークNを介して送信する機能を実現させるプログラムである。
具体的に、CPU23は、インターネットVPN等の通信ネットワークNを介して、画像データから変換された、暗号化されたファイル名を含むテキストデータを、結合装置3に送信する。
CPU23は、かかるテキストデータ送信プログラム251を実行することにより、テキストデータ送信手段として機能する。
【0044】
通信部26は、通信ネットワークNに接続して入力装置2及び結合装置3とのデータ通信を行う。この機能は、通信モジュール、モデム、TA、有線用の通信ケーブルのジャックや制御回路などによって実現される。
【0045】
(結合装置)
結合装置3は、CPU31、RAM32、記憶部33、通信部34等を備えて構成されている。
【0046】
CPU31は、例えば、記憶部33に記憶されている各種処理プログラムに従って、各種の制御処理を行う。
【0047】
RAM32は、CPU31により演算処理されたデータを格納するワークメモリエリアを形成している。
【0048】
記憶部33は、例えば、CPU31によって実行可能なシステムプログラムや、そのシステムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU31によって演算処理された各種処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部33に記憶されている。
【0049】
具体的には、記憶部33には、例えば、復号プログラム331、結合プログラム332、等が記憶されている。
【0050】
復号プログラム331は、CPU31に、入力装置2から送信されたテキストデータに含まれる暗号化されたファイル名を復号する機能を実現させるプログラムである。
具体的に、CPU31は、乱数情報及び時間情報を含んだ秘密鍵を用いたファイル名を、どの帳票から切り出されたものか識別可能な元のファイル名に変換する。
CPUは、かかる復号プログラムを実行することにより、復号手段として機能する。
【0051】
結合プログラム332は、CPU31に、復号手段により復号されたファイル名に基づいて、ファイル名のうち識別データが共通するテキストデータを結合する機能を実現させるプログラムである。
具体的に、CPU31は、復号プログラム331の実行により復号されたファイル名に基づいて、分離されたテキストデータを1つに集め、元の帳票に記載されていた内容に対応する1つのテキストデータを形成する。
従って、例えば、氏名、住所、電話番号、メールアドレス等の情報が元の帳票に対応して1つに結合される。
CPU31は、かかる結合プログラムを実行することにより、結合手段として機能する。
【0052】
通信部34は、通信ネットワークNに接続して結合装置3とのデータ通信を行う。この機能は、通信モジュール、モデム、TA、有線用の通信ケーブルのジャックや制御回路などによって実現される。
【0053】
(動作)
次に、帳票処理システム100における一連の処理動作について図5のフローチャートを用いて説明する。
なお、ステップS11〜S14は、画像切り出し装置1のCPU14によって実行され、ステップS15〜S17は入力装置2のCPU23によって実行され、ステップS18〜S20は結合装置3のCPU31によって実行される。
先ず、ステップS11において、画像読取機4a、4bにより読取られた画像データを取得する。
次いで、ステップS12において、CPU14は、画像データから部分画像データを切り出す切り出し処理を行う。
次いで、ステップS13において、CPU14は、切り出された部分画像データのファイル名を暗号化する。
次いで、ステップS14において、CPU14は、暗号化されたファイル名の部分画像データを入力装置2に送信する。
次いで、ステップS15において、CPU23は、画像切り出し装置1より送信された部分画像データを受信する。
次いで、ステップS16において、部分画像データの内容が、テキストデータとしてユーザ操作により入力される。
次いで、ステップS17において、CPU23は、暗号化されたファイル名を含むテキストデータを結合装置3に送信する。
次いで、ステップS18において、CPU31は、入力装置2より送信されたテキストデータを受信する。
次いで、ステップS19において、CPU31は、暗号化されたファイル名を復号する。
次いで、ステップS20において、CPU31は、復号されたファイル名に基づいて、ファイル名が共通するテキストデータを結合し、本処理を終了する。
【0054】
次に、上記ステップS12の切り出し処理について図6のフローチャートを用いて説明する。
先ず、ステップS121において、CPU14は、罫線候補を検出する。
次いで、ステップS122において、CPU14は、検出した罫線候補からの設定位置に、基準枠を構成する罫線が存在するか否かを判断し、基準枠を構成する罫線が存在しないと判断した場合(ステップS122:NO)、後述のステップS126に移行する。
一方、基準枠を構成する罫線が存在すると判断した場合(ステップS122:YES)、続くステップS123において、CPU14は、予め記憶された帳票のうちで、基準枠を備えたある帳票について、全ての記載枠が存在するか否かを判断する。
そして、ある帳票について、全ての記載枠が存在すると判断した場合、続くステップS124において、CPU14は、画像の切り出しを行い本処理を終了する。
一方、ある帳票について、全ての記載枠が存在していないと判断した場合(ステップS123:NO)、続くステップS125において、CPU14は、基準枠を備えた帳票のうち、確認していない帳票が存在するか否かを判断し、確認していない帳票が存在しない場合(ステップS125:NO)、CPU14は、後述のステップS126に移行する。
一方、確認していない帳票が存在する場合(ステップS125:YES)、CPU14は、前述のステップ123に戻って以降の処理を繰り返す。
次いで、ステップS126において、CPU14は、画像の走査が終了したか否かを判断し、走査が終了していない場合(ステップS126:NO)、上記ステップS121に戻って以降の処理を繰り返す。
一方、走査が終了している場合(ステップS126:YES)、続くステップS127において、CPU14は、検出不能と判断し、画像データをNGフォルダ139に記憶して本処理を終了する。
【0055】
以上のように、本実施形態の帳票処理システム100によれば、帳票に記載された情報をテキストデータ化するまでの一連の業務がシステム化されることとなり、業務効率の向上を図ることができる。
また、画像データから切り出した部分画像データは暗号化されたファイル名であるため、部分画像データ同士を第三者が結びつけることができず、帳票に記載された情報を保護することが可能となる。
即ち、帳票に記載された情報をテキストデータ化する一連の処理を、情報の保護を図りつつ、効率よく行うことができる。
【0056】
また、本実施形態の帳票処理システム100によれば、画像切り取り装置1は、画像データを一方向に走査して罫線候補を検出し、この罫線候補を基準として、予め設定された位置に基準枠を構成する罫線が存在するか否かによって、罫線候補を含む基準枠が存在するか否か判断する。そして、罫線候補を含む基準枠が存在すると判断された場合に、当該基準枠を基準として、予め設定された位置に記載枠が存在するか否かを判断し、全ての記載枠が存在すると判断された場合に、記載枠に基づいて部分画像データを切り出す構成となっている。
このため、画像データの記載枠の特定を正確に行うことができる。
【0057】
また、本実施形態の帳票処理システム100によれば、罫線候補を含む基準枠が存在しないと判断された場合、画像データを再走査して罫線候補と異なる第2罫線候補を検出する構成となっている。
このため、一度罫線候補を含む基準枠が存在しないと判断された場合にも、即エラーとなることがなく、エラー発生率を抑えることができ、実用上好適である。
【0058】
また、本実施形態の帳票処理システム100によれば、ユーザが画像データにおける走査の開始点を指定するための指定手段である入力部12を備え、入力部12により指定された開始点から画像データの走査を開始する構成となっている。
このため、ユーザが任意で、例えば画像データ周囲の汚れが重ならない位置等から走査を開始するよう指定することができ、効率よく走査を行うことができる。
【0059】
なお、上記実施形態においては、画像切り取り装置1と結合装置3を別の装置として記載しているが、1つの装置内に画像切り取り装置1及び結合装置3の機能を持たせる構成とすることもできる。
【0060】
また、上記実施形態においては、入力部12により走査開始点や走査方向を指定する構成として説明しているが、入力部12により走査開始点や走査方向が指定されない場合には、デフォルトとして設定された走査開始点(例えば、画像データの左端部)から、デフォルトとして設定された走査方向(例えば、右方向)に向かって画像データの走査を開始することとなる。
このとき、走査開始点が黒部であった場合には、走査方向に走査を行って白部を検出した時点より、上記した処理を実行する。
【0061】
また、上記実施形態においては、第2罫線候補まで検出する場合を例示して説明しているが、本実施形態の帳票処理システム100は、画像データの走査が終了するまで、罫線候補を何個でも検出可能であることは勿論である。
【符号の説明】
【0062】
1 画像切り出し装置
11 表示部
12 入力部(指定手段)
13 データ記憶部
131、132・・・項目フォルダ
139 NGフォルダ
14 CPU
15 RAM
16 プログラム記憶部
161 検出プログラム(検出手段)
162 第1判断プログラム(第1判断手段)
163 再検出プログラム(再検出手段)
164 第2判断プログラム(第2判断手段)
165 切り出しプログラム(切り出し手段)
166 暗号化プログラム(暗号化手段)
167 部分画像データ送信プログラム(部分画像データ送信手段)
2 入力装置
21 表示部
22 入力部(入力手段)
23 CPU
24 RAM
25 記憶部
251 テキストデータ送信プログラム(テキストデータ送信手段)
3 結合装置
31 CPU
32 RAM
33 記憶部
331 復号プログラム(復号手段)
332 結合プログラム(結合手段)
4a,4b 画像読取機
100 帳票処理システム
N 通信ネットワーク

【特許請求の範囲】
【請求項1】
罫線で囲まれた記載枠を有する帳票に記載された情報を読み取った画像データから所定の部分画像データを切り出す画像切り出し装置と、前記部分画像データの内容をテキストデータとして入力する入力装置と、前記画像データに対応する前記テキストデータを結合する結合装置と、を備える帳票処理システムであって、
前記画像切り出し装置は、
前記画像データから部分画像データを切り出す切り出し手段と、
前記切り出し手段により切り出された部分画像データのファイル名を暗号化する暗号化手段と、
前記暗号化手段により暗号化されたファイル名の部分画像データを前記入力装置に通信ネットワークを介して送信する部分画像データ送信手段と、を備え、
前記入力装置は、
前記画像切り出し装置から送信された部分画像データの内容をテキストデータとしてユーザ操作により入力する入力手段と、
前記暗号化されたファイル名を含むテキストデータを前記結合装置に通信ネットワークを介して送信するテキストデータ送信手段と、を備え、
前記結合装置は、
前記入力装置から送信されたテキストデータに含まれる前記暗号化されたファイル名を復号する復号手段と、
前記復号手段により復号されたファイル名に基づいて、テキストデータを結合する結合手段と、を備えることを特徴とする帳票処理システム。
【請求項2】
請求項1記載の帳票処理システムにおいて、
前記画像切り取り装置は、
前記画像データを一方向に走査して罫線候補を検出する検出手段と、
前記検出手段により検出された前記罫線候補を基準として、予め設定された位置に基準枠を構成する罫線が存在するか否かによって、前記罫線候補を含む基準枠が存在するか否か判断する第1判断手段と、
前記第1判断手段により前記罫線候補を含む基準枠が存在すると判断された場合に、当該基準枠を基準として、予め設定された位置に記載枠が存在するか否かを判断する第2判断手段と、備え、
前記切り出し手段は、前記第2判断手段により全ての前記記載枠が存在すると判断された場合に、前記記載枠に基づいて前記部分画像データを切り出すことを特徴とする帳票処理システム。
【請求項3】
請求項2記載の帳票処理システムにおいて、
前記第1判断手段により、前記罫線候補を含む基準枠が存在しないと判断された場合、画像データを再走査して前記罫線候補と異なる第2罫線候補を検出する再検出手段を備え、
前記第1判断手段は、前記再検出手段により再検出された前記第2罫線候補を基準として、予め設定された位置に基準枠を構成する罫線が存在するか否かによって、前記第2罫線候補を含む基準枠が存在するか否か判断し、
前記第2判断手段は、前記第1判断手段により前記第2罫線候補を含む基準枠が存在すると判断された場合に、当該基準枠を基準として、予め設定された位置に記載枠が存在するか否かを判断することを特徴とする帳票処理システム。
【請求項4】
請求項2又は3記載の帳票処理システムにおいて、
ユーザが画像データにおける走査の開始点を指定するための指定手段を備え、
前記検出手段は、前記指定手段により指定された開始点から画像データの走査を開始することを特徴とする帳票処理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate