説明

保管文書電子化システム及び保管文書電子化プログラム

【課題】文字認識用のイメージデータを既存のコンピュータデータと結びつけること。
【解決手段】読取処理部106で確定した読取文字と顧客マスタ110とを照合して顧客情報に基づいた名寄せ処理を行う名寄せ処理部108を設け、該名寄せ処理部108が確定した文書文字の顧客を特定する特定文字列を含む顧客情報を前記顧客マスタから抽出し、前記名寄せ処理部を用いて特定文字列を含む文書文字のイメージデータを顧客情報と関連付けた名寄せを行い画像データベース111に格納する保管文書電子化システム104。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、書類(紙)として保管されている契約書・申込書・証明書等の文書を電子化(イメージファイル化)すると共に顧客情報と名寄せして結びつけることができる保存文書電子化システム及び保存文書電子化プログラムに関する。
【背景技術】
【0002】
一般に、近年においては企業等においてコンピュータシステムの導入が進み、膨大な顧客情報が蓄積され、必要に応じて登録、更新、または参照が可能となっているが、紙である契約書・申込書・証明書・これらの写し等の文書は、金庫や書庫に従来のままの手法で保管するか外部倉庫会社等へ保管されているケースが多く、コンピュータシステムを利用した電子化が遅れる傾向にある。
【0003】
なお、文書の電子化に関する技術が記載された文献としては下記の特許文献が挙げられ、特許文献1には、誤認識文字を手書き修正するための手書き修正画面を表示する表示手段と、該手書き修正画面に対して行われたユーザ操作を検出する検出手段と、該検出手段の検出結果に基づいて文字コードを変更する変更手段とを設け、前記表示手段が、誤認識文字の元画像と修正対象の文字コードに対応した文字とを併設表示することによって、認識不可文字の修正時における作業効率を改善する技術が記載され、特許文献2には、手書き入力情報を受け付ける入出力I/F部と、手書き入力情報の文字コード情報と評価値とを生成する手書き文字認識エンジンと、手書き入力情報と文字コード情報及び評価値とが対応付けられた手書き評価データを蓄積する制御部と、手書き入力情報の修正を検出する修正入力検出部とを設け、手書き評価データに含まれる手書き入力情報の中から修正が検出された手書き入力情報の文字コード情報と同じ文字コード情報かつ評価値が所定の範囲内の値である手書き入力情報を抽出することによって、蓄積した手書き入力情報の誤記を容易に修正する技術が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2011−34284号公報
【特許文献2】特開2010−204745号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
前記した特許文献に記載の技術は、認識不能な手書き文字の修正作業の効率化及び誤記を容易に修正することができるものの、入力した電子化文書を既存のコンピュータデータと結びつける作業が煩雑であるという課題があった。
【0006】
本発明の目的は、前述の従来技術による課題を解決しようとするものであり、入力した文字認識用のイメージデータを既存のコンピュータデータと結びつけることができる保管文書電子化システム及び保管文書電子化プログラムを提供することである。
【課題を解決するための手段】
【0007】
前記目的を達成するために本発明は、文字を記載した文書を光学的にイメージデータとして読み込むスキャナと、表示部を含み該スキャナが読み込んだイメージデータを取り込む端末と、該端末とネットワークを介して接続される保管文書電子化システムであって、
特定文字列を含む顧客情報を格納する顧客マスタと、前記スキャナで読み込んだ文書のイメージデータを格納する画像データベースと、前記スキャナで取り込んだ文書の画像データ内の文字を読取り、読取文字を確定する読取処理部と、前記読取処理部で確定した読取文字と顧客マスタとを照合して顧客情報に基づいた名寄せ処理を行う名寄せ処理部とを備え、
前記文書のイメージデータをスキャナを用いてスキャンする第1工程と、該第1工程によりスキャンしたイメージデータを表示部に表示する第2工程と、イメージデータの読込範囲を指定する第3工程と、該第3工程により指定された読込範囲のイメージデータ光学的文字認識を行う第4工程と、該第4工程によって読み込んだ読込文字を表示部に表示する第5工程と、前記第2工程によって表示したスキャン文書文字と第5工程によって表示した読込文字が一致するか否かの判定結果を入力する第6工程と、該第6工程によって一致したと入力されたときに読み取り内容を確定する又は前記第6工程によって一致しないと入力されたとき、前記第5工程によって表示した文書文字に類似する他の類似候補文字に基づいて入力された文書文字を確定する第7工程と、前記第7工程によって確定した文書文字の顧客を特定する特定文字列を含む顧客情報を前記顧客マスタから抽出し、前記名寄せ処理部を用いて特定文字列を含む文書文字のイメージデータを顧客情報と関連付けた名寄せを行い前記画像データベースに格納する第8工程とを実行することを第1の特徴とする。
【0008】
また、本発明は、該第1の特徴の保管文書電子化システムにおいて、前記名寄せ処理部により顧客を特定した画像データにファイル名をネーミングするネーミング処理部を設け、該ネーミング処理部が前記第8工程によって画像データベースに格納する特定文字列と関連付けたイメージデータに一意のネーミングを付与する第9工程を実行することを第2の特徴とし、第第2の特徴の保管文書電子化システムにおいて、前記第9工程によってネーミングを付与したイメージデータに一意のバーコードを生成して画像データベースに格納することを第3の特徴とする。
【0009】
更に、本発明は、文字を記載した文書を光学的にイメージデータとして読み込むスキャナと、表示部を含み該スキャナが読み込んだイメージデータを取り込む端末と、該端末とネットワークを介して接続され、特定文字列を含む顧客情報を格納する顧客マスタと、前記スキャナで読み込んだ文書のイメージデータを格納する画像データベースと、前記スキャナで取り込んだ文書の画像データ内の文字を読取り、読取文字を確定する読取処理部と、前記読取処理部で確定した読取文字と顧客マスタとを照合して顧客情報に基づいた名寄せ処理を行う名寄せ処理部と、前記名寄せ処理部により顧客を特定した画像データにファイル名をネーミングするネーミング処理部とを備えたコンピュータシステムの保管文書電子化プログラムであって、
前記端末に、前記文書のイメージデータをスキャナを用いてスキャンする第1工程と、該第1工程によりスキャンしたイメージデータを表示部に表示する第2工程と、イメージデータの読込範囲を指定する第3工程と、該第3工程により指定された読込範囲のイメージデータ光学的文字認識を行う第4工程と、該第4工程によって読み込んだ読込文字を表示部に表示する第5工程と、前記第2工程によって表示したスキャン文書文字と第5工程によって表示した読込文字が一致するか否かの判定結果を入力する第6工程と、該第6工程によって一致したと入力されたときに読み取り内容を確定する又は前記第6工程によって一致しないと入力されたとき、前記第5工程によって表示した文書文字に類似する他の類似候補文字に基づいて入力された文書文字を確定する第7工程と、前記第7工程によって確定した文書文字の顧客を特定する特定文字列を含む顧客情報を前記顧客マスタから抽出し、前記名寄せ処理部を用いて特定文字列を含む文書文字のイメージデータを顧客情報と関連付けた名寄せを行い前記画像データベースに格納する第8工程とを実行させることを第4の特徴とする。
【0010】
また、本発明は、該第1の特徴の保管文書電子化プログラムにおいて、前記端末に、該ネーミング処理部が前記第8工程によって画像データベースに格納する特定文字列と関連付けたイメージデータに一意のネーミングを付与する第9工程を実行させることを第5の特徴とし、該第5の特徴の管文書電子化プログラムにおいて、前記端末に、前記第9工程によってネーミングを付与したイメージデータに一意のバーコードを生成して画像データベースに格納する第10工程を実行させることを第6の特徴とする。
【発明の効果】
【0011】
本発明による保管文書電子化システム及び保管文書電子化プログラムは、前記読取処理部で確定した読取文字と顧客マスタとを照合して顧客情報に基づいた名寄せ処理を行う名寄せ処理部を設け、該名寄せ処理部が、確定した文書文字の顧客を特定する特定文字列を含む顧客情報を前記顧客マスタから抽出し、前記名寄せ処理部を用いて特定文字列を含む文書文字のイメージデータを顧客情報と関連付けた名寄せを行い前記画像データベースに格納することによって、入力した文字認識用のイメージデータを既存の顧客データと結びつけることができる。
【図面の簡単な説明】
【0012】
【図1】本発明の実施形態による保管文書電子化システムを含むコンピュータシステム示す図。
【図2】本実施形態による保管文書電子化システムの読取処理のフロー図。
【図3】本実施形態による読取箇所指定・読取箇所表示・類似文字選択・手修正を説明するための図。
【図4】本実施形態による読取箇所設定処理のフロー図。
【図5】本実施形態による名寄せ処理のフロー図。
【図6】本実施形態によるネーミング処理のフロー図。
【図7】本実施形態による顧客マスタを説明するための図。
【図8】本実施形態による画像データベースを説明するための図。
【発明を実施するための形態】
【0013】
以下、本発明による保管文書電子化システム及び保管文書電子化プログラムの一実施形態を図面を参照して詳細に説明する。
[構成]
本実施形態による保管文書電子化プログラムを実行する保管文書電子化システムを含むコンピュータシステムは、図1に示す如く、紙文書に記載された文字等の文書を光学的にイメージデータとして読み込むスキャナ102と、該スキャナ102が読み込んだイメージデータを取り込むコンピュータである端末101と、該端末101とネットワーク103を介して接続される本実施形態の特徴である保管文書電子化システム104とを備え、該保管文書電子化システム104は、顧客の属性を含む顧客情報を格納する顧客マスタ110と、前記スキャナ102で読み込んだ文書のイメージデータを格納する画像データベース111と、前記スキャナ102で取り込んだ文書のイメージデータの必要部分の文字を読取り、読取文字を確定する読取処理部106と、該読取処理部106において読み込む読取頻度の高いイメージデータ位置(座標)を記憶し頻度の高い位置をデフォルト設定する読取位置設定処理部107と、該読取処理部106で確定した読取内容(読取文字)と顧客マスタ110とを照合して後述する名寄せ処理を行う名寄せ処理部108と、名寄せ処理部108により特定したイメージデータに自動でファイル名をネーミングするネーミング処理部109とを備える。
【0014】
前記顧客マスタ110は、図7(a)に示す如く、顧客を特定するためのユニークな番号である顧客番号と、顧客名の読みをカナ文字で表したカナ氏名と、顧客名の漢字表記である漢字氏名と、顧客の生年月日と、顧客の自宅郵便番号と、顧客の自宅カナ住所と、顧客の自宅漢字住所と、顧客の住所コードと、顧客の自宅電話と、顧客の携帯電話との各項目とから成り、具体的には、図7(b)に示すように、顧客番号「1234−5678」の顧客が、カナ氏名「ヒタチ タロウ」、漢字氏名「日立 太郎」、生年月日が「19800303」、自宅郵便番号「001−1234」、自宅カナ住所「トウキョウトシナガワク・・・」、自宅漢字住所「東京都品川区・・・」、住所コード「131234567」、自宅電話「03−246−3692」、携帯電話「090−1234−4321」の如く格納している。
【0015】
前記画像データベース111は、図8(a)に示す如く、顧客を特定するためのユニークな番号である顧客番号と、スキャナが読み込んだ画像に一意にネーミングした番号である管理番号と、該画像番号にリンクしたバーコードとの各項目とから成り、具体的には図8(b)に示すように、例えば、顧客番号「1」の顧客の管理番号が「1234−5678」、画像番号が「1234−0001−01」、バーコードが「1234−0001−01」の如く格納している。
【0016】
[動作]
さて、このように構成した保管文書電子化システムを含むコンピュータシステムは、図2に示す如く、端末101が、文書201のイメージデータをスキャナ102を用いてスキャンするステップ202と、このスキャンしたイメージデータを画面に表示するステップ203と、端末101の操作によって読取位置設定処理部107を用いてイメージデータの読込範囲又は箇所を指定するステップ205と、該ステップ205により指定した読込範囲の光学的文字認識(OCR)を行うステップ207と、該ステップ207によって読み込んだ読込文字を端末101の表示部に表示するステップ206と、前記ステップ203によって表示したスキャン文書文字と該ステップ206によって表示した文書文字(認識した文字)が一致するか否かの判定結果を入力するステップ208と、該ステップ208において一致(マッチ)したと判定したときに読み取り内容を確定して処理を終了するステップ211と、前記ステップ208において前記ステップ203によって表示したスキャン文書文字と該ステップ206によって表示した文書文字(認識した文字)が一致しない(アンマッチ)と判定したとき、他の認識候補となる類似文字を表示するステップ209と、操作者が端末101を用いて類似文字から該当の文字があるか否かを判定し、該当有ると判定したときに前記ステップ211に移行するステップ210と、該ステップ210において該当無しと判定したとき、操作者が端末101を用いて該当文字を手入力して前記ステップ211に移行するステップ212とを実行することによって、スキャナ102によってスキャンした文書201のイメージデータから文字を読み取る範囲を指定し、文字認識を行うことができる。
【0017】
前記図2におけるイメージデータの読込範囲又は箇所を指定するステップ205から読み取り内容を確定するステップ211における処理は、図3に示す如く、ステップ203によってイメージデータ301を表示し、該イメージデータ301内の読込範囲302〜304を操作者が指定して認識文字305〜307を表示し、該認識文字305の漢字「萩」が漢字308(「荻」)と誤認識されたとき、ポップアップ309として漢字「荻」310に類似する他の候補文字「萩」「科」「莉」が表示され、イメージデータ301の表示を参照した操作者の選択によって漢字「荻」310を選択することや、前記ポップアップ309内の候補文字内に該当の漢字がない場合、手入力修正画面311を用いて操作者が直接入力文字312を入力することによって行われる。
【0018】
また、本実施形態による保管文書電子化システムを含むコンピュータシステムは、前記図2のステップ205による読取箇所をクリック指定するステップ205が実行されたとき、図4に示す如く、読取箇所クリック指定のステップ401を契機として読み取った書式パターン(伝票等の記入枠等の書式パターン)を抽出するステップ405と、該ステップ405によって抽出した書式パターンの座標位置を画像データベース111に記憶するステップ408と、前記取箇所クリック指定のステップ401を契機としてスキャン文書表示画面406中の最終クリック位置の座標を画像データベース111に記録するステップ402と、該ステップ402によって記録した最終クリック位置(座標)の読み込む頻度が高い読取範囲の設定を行うステップ403と、書式パターンが画像データベース111に記録した同一の書式パターンの呼び出しが操作者によって指示されているか否かを判定し、指示されていないと判定したときに処理を終了するステップ404と、前記ステップ408に続いて前記ステップ403によって指定された最終クリック位置を設定して処理を終了するステップ407とを実行することによって、新たにスキャンした文書を画面表示する際、読取箇所として前回読取位置をステップ403によってデフォルト設定し、予め書式パターン登録した読取位置を指定する場合、ステップ404の操作によって書式パターンを呼び出して設定することができる。
【0019】
次に本実施形態による保管文書電子化システムを含むコンピュータシステムは、読み取った読取結果データ(認識した文字データ)中の同一カナ氏名と生年月日等の組み合わせ(特定文字列)をキーとし、顧客マスタ110を参照した名寄せ処理(例えば、顧客マスタ110に予め登録したカナ氏名及び生年月日の組み合わせが一致するデータを抽出して、同一顧客と判定し、同一顧客のデータとしてまとめる処理)を行うステップ502と、該ステップ502によって名寄せされた読取結果データがあるか否かを判定するステップ503と、該ステップ503によって名寄せされた読取結果データがない(該当なし)と判定したとき、エラー一覧を出力して処理を終了するステップ504と、前記ステップ503において名寄読取結果データがある(該当あり)と判定したとき、前記ステップ502による名寄読取結果データを顧客マスタ110も参照して表示部に表示するステップ506と、該ステップ506によって表示された名寄読取結果データを操作者が照合して顧客を特定することができたか否かの判定結果を入力し、顧客を特定することができないとの判定結果が入力されたとき、前記エラー一覧を出力するステップ504に戻るステップ507と、該ステップ507において顧客を特定することができたとの判定結果が入力されたとき、ユニークな画像番号となるネーミング処理へ移行するステップ508とを実行することによって、予め顧客マスタ110に登録した顧客情報とスキャナ102で読み込んだ文書201のイメージデータとを関連付けて名寄せすることができる。
【0020】
更に本実施形態による保管文書電子化システムを含むコンピュータシステムは、図6に示す如く、前記の処理のステップ508におけるネーミング処理において、名寄読取結果データを読み込むステップ602と、該読み込んだ名寄読取結果データに対して自動的にファイルネーミングを行い、一覧リスト出力604の印刷と顧客マスタ110への出力と文書画像データ(イメージデータ)605を出力するステップ603と、該ステップ603に続き、前記ファイルネーミングした名寄読取結果データ名をバーコードへ変換し、コードラベル出力607の印刷と画像データベース111への格納を行って処理を終了するステップ606とを実行することによって、自動的にネーミングした名寄読取結果データ名を画像データベース111に格納することができる。
【0021】
このように本実施形態による保管文書電子化システム及びプログラムは、イメージスキャナらによって読み込んだイメージデータ(電子化データ)を既存のコンピュータデータと結びつけることができ、このため企業における業務システムから各文書の参照が可能となり効率化が図れ、書庫等より現物の書類を都度出し入れすることがなくなるため、書類の紛失、および個人情報の流出等のリスクを低減することができる。
【符号の説明】
【0022】
101 端末、102 スキャナ、103 ネットワーク、
104 保管文書電子化システム、106 読取処理部、
107 読取位置設定処理部、108 名寄せ処理部、109 ネーミング処理部、
110 顧客マスタ、111 画像データベース、201 文書、
301 イメージデータ、305 認識文字、309 ポップアップ、
311 手入力修正画面、312 直接入力文字、406 スキャン文書表示画面、
505 顧客マスタ

【特許請求の範囲】
【請求項1】
文字を記載した文書を光学的にイメージデータとして読み込むスキャナと、表示部を含み該スキャナが読み込んだイメージデータを取り込む端末と、該端末とネットワークを介して接続される保管文書電子化システムであって、
特定文字列を含む顧客情報を格納する顧客マスタと、前記スキャナで読み込んだ文書のイメージデータを格納する画像データベースと、前記スキャナで取り込んだ文書の画像データ内の文字を読取り、読取文字を確定する読取処理部と、前記読取処理部で確定した読取文字と顧客マスタとを照合して顧客情報に基づいた名寄せ処理を行う名寄せ処理部とを備え、
前記文書のイメージデータをスキャナを用いてスキャンする第1工程と、該第1工程によりスキャンしたイメージデータを表示部に表示する第2工程と、イメージデータの読込範囲を指定する第3工程と、該第3工程により指定された読込範囲のイメージデータ光学的文字認識を行う第4工程と、該第4工程によって読み込んだ読込文字を表示部に表示する第5工程と、前記第2工程によって表示したスキャン文書文字と第5工程によって表示した読込文字が一致するか否かの判定結果を入力する第6工程と、該第6工程によって一致したと入力されたときに読み取り内容を確定する又は前記第6工程によって一致しないと入力されたとき、前記第5工程によって表示した文書文字に類似する他の類似候補文字に基づいて入力された文書文字を確定する第7工程と、前記第7工程によって確定した文書文字の顧客を特定する特定文字列を含む顧客情報を前記顧客マスタから抽出し、前記名寄せ処理部を用いて特定文字列を含む文書文字のイメージデータを顧客情報と関連付けた名寄せを行い前記画像データベースに格納する第8工程とを実行することを特徴とする保管文書電子化システム。
【請求項2】
前記名寄せ処理部により顧客を特定した画像データにファイル名をネーミングするネーミング処理部を設け、該ネーミング処理部が前記第8工程によって画像データベースに格納する特定文字列と関連付けたイメージデータに一意のネーミングを付与する第9工程を実行することを特徴とする請求項1記載の保管文書電子化システム。
【請求項3】
前記第9工程によってネーミングを付与したイメージデータに一意のバーコードを生成して画像データベースに格納する第10工程を実行することを特徴とする請求項2記載の保管文書電子化システム。
【請求項4】
文字を記載した文書を光学的にイメージデータとして読み込むスキャナと、表示部を含み該スキャナが読み込んだイメージデータを取り込む端末と、該端末とネットワークを介して接続され、特定文字列を含む顧客情報を格納する顧客マスタと、前記スキャナで読み込んだ文書のイメージデータを格納する画像データベースと、前記スキャナで取り込んだ文書の画像データ内の文字を読取り、読取文字を確定する読取処理部と、前記読取処理部で確定した読取文字と顧客マスタとを照合して顧客情報に基づいた名寄せ処理を行う名寄せ処理部と、前記名寄せ処理部により顧客を特定した画像データにファイル名をネーミングするネーミング処理部とを備えたコンピュータシステムの保管文書電子化プログラムであって、
前記端末に、前記文書のイメージデータをスキャナを用いてスキャンする第1工程と、該第1工程によりスキャンしたイメージデータを表示部に表示する第2工程と、イメージデータの読込範囲を指定する第3工程と、該第3工程により指定された読込範囲のイメージデータ光学的文字認識を行う第4工程と、該第4工程によって読み込んだ読込文字を表示部に表示する第5工程と、前記第2工程によって表示したスキャン文書文字と第5工程によって表示した読込文字が一致するか否かの判定結果を入力する第6工程と、該第6工程によって一致したと入力されたときに読み取り内容を確定する又は前記第6工程によって一致しないと入力されたとき、前記第5工程によって表示した文書文字に類似する他の類似候補文字に基づいて入力された文書文字を確定する第7工程と、前記第7工程によって確定した文書文字の顧客を特定する特定文字列を含む顧客情報を前記顧客マスタから抽出し、前記名寄せ処理部を用いて特定文字列を含む文書文字のイメージデータを顧客情報と関連付けた名寄せを行い前記画像データベースに格納する第8工程とを実行させることを特徴とする保管文書電子化プログラム。
【請求項5】
前記端末に、該ネーミング処理部が前記第8工程によって画像データベースに格納する特定文字列と関連付けたイメージデータに一意のネーミングを付与する第9工程を実行させることを特徴とする請求項4記載の保管文書電子化プログラム。
【請求項6】
前記端末に、前記第9工程によってネーミングを付与したイメージデータに一意のバーコードを生成して画像データベースに格納する第10工程を実行させることを特徴とする請求項5記載の保管文書電子化プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−92966(P2013−92966A)
【公開日】平成25年5月16日(2013.5.16)
【国際特許分類】
【出願番号】特願2011−235813(P2011−235813)
【出願日】平成23年10月27日(2011.10.27)
【出願人】(000233491)株式会社日立システムズ (394)
【Fターム(参考)】