説明

帳票処理システム、OCR装置、OCR処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法

【課題】帳票のOCR処理の精度を向上する。
【解決手段】本発明の帳票処理システム100は、帳票作成装置110とOCR装置120とを含み、帳票作成装置は、帳票152のレイアウトを示すレイアウト情報を生成するレイアウト生成部170と、生成されたレイアウト情報をOCR装置に送信するレイアウト送信部176とを有し、OCR装置は、帳票作成装置から送信されたレイアウト情報を取得するレイアウト取得部220と、取得されたレイアウト情報に基づき、スキャナ140が読み取った帳票の画像データに対してOCR処理を行うOCR処理部224とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票の作成および読取を行う帳票処理システム、OCR装置、OCR処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法に関する。
【背景技術】
【0002】
近年、様々な分野でペーパーレス化が進められているものの、例えば、組織の基幹業務では、伝票、勤怠表、アンケート用紙、テスト用紙、および病院の問診表等、依然、紙に印刷された帳票が用いられている。ユーザは、後から手書き等で帳票に書き込まれた情報を効率的に管理するため、スキャナで帳票を読み込み、OCR(Optical Character Reader)装置でOCR処理を施している。
【0003】
しかし、帳票のレイアウトや書式が適切でない場合、OCR処理が適切に行われない。そこで、ユーザが入力したOCR機種、行フィールド数、文字数に応じて、帳票の書式を自動生成する技術が公開されている(例えば、特許文献1)。また、帳票から読み取ったイメージデータと、選定基準とする複数の選定基準イメージデータとを比較し、帳票から読み取ったイメージデータに該当する選定基準イメージデータを選定して、その選定基準イメージデータに基づいてOCR処理を行う情報処理装置が提案されている(例えば、特許文献2)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平8−30659号公報
【特許文献2】特開2000−132542号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来、スキャナが読み取った帳票の画像データに対して、OCR装置で適切にOCR処理できないことがあった。
【0006】
そこで本発明は、このような課題に鑑み、帳票のOCR処理の精度を向上可能な、帳票処理システム、OCR装置、OCR処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法を提供することを目的としている。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明の帳票処理システムは、帳票作成装置とOCR装置とを含む帳票処理システムであって、帳票作成装置は、帳票のレイアウトを示すレイアウト情報を生成するレイアウト生成部と、生成されたレイアウト情報をOCR装置に送信するレイアウト送信部と、を有し、OCR装置は、帳票作成装置から送信されたレイアウト情報を取得するレイアウト取得部と、取得されたレイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行うOCR処理部とを有する。
【0008】
OCR装置は、レイアウト情報の生成を補助するアシスト情報を生成するアシスト生成部と、アシスト情報を帳票作成装置に送信するアシスト送信部と、をさらに有し、帳票作成装置は、送信されたアシスト情報を取得するアシスト取得部をさらに有し、レイアウト生成部は、取得されたアシスト情報に基づいてレイアウト情報を生成してもよい。
アシスト情報には、OCR装置のOCR処理部で用いられるアルゴリズムに関するアルゴリズム情報が含まれてもよい。
アシスト生成部は、OCR処理の結果に基づいて、取得されたレイアウト情報の改善点を示す改善情報を生成し、アシスト情報には、改善情報が含まれてもよい。
【0009】
帳票作成装置は、生成されたレイアウト情報に基づいて、OCR処理の結果と比較する基準となる基準データを生成する基準生成部をさらに有し、レイアウト送信部は、基準データをOCR装置に送信し、OCR装置は、送信された基準データを取得する基準取得部をさらに有し、アシスト生成部は、取得された基準データと、OCR処理の結果とに基づいて、改善情報を生成してもよい。
【0010】
帳票作成装置は、生成されたレイアウト情報をプリンタに出力するデータ出力部をさらに有し、生成されたレイアウト情報には、帳票における入力領域が可変である可変帳票を定義する可変情報が含まれ、データ出力部が、可変情報における入力領域が確定されたレイアウト情報を、プリンタに出力すると、レイアウト送信部は、可変情報における入力領域が確定されたレイアウト情報をOCR装置に送信してもよい。
【0011】
レイアウト送信部は、データ出力部が、少なくとも入力領域の形状又は数量が確定されたレイアウト情報をプリンタに出力した場合に、この入力領域が確定されたレイアウトの画像データの一部又は全部を、レイアウト情報の少なくとも一部としてOCR装置に送信してもよい。
レイアウト送信部は、レイアウトの一部が可変である可変帳票が印刷されたことを条件として、可変帳票の可変部分に相当する画像データをOCR装置に送信し、可変帳票の非可変部分に相当する画像データを、可変部分に相当する画像データとは異なるタイミングで、OCR装置に送信し、OCR処理部は、レイアウト送信部から別々に送信された、可変帳票の可変部分の画像データと、非可変部分の画像データとを合成して、OCR処理に用いるように構成してもよい。
OCR装置は、同一の可変帳票に基づいて生成された、可変部分が異なる複数のレイアウトの画像データを、それぞれの可変帳票に関連付けて管理するグループ管理手段をさらに有し、OCR処理部は、可変帳票の識別情報に基づいて、グループ管理手段により管理されている可変帳票を特定し、特定された可変帳票に関連付けられた画像データのいずれかを用いて、OCR処理を行ってもよい。
【0012】
帳票作成装置は、可変帳票が印刷された場合に、この印刷処理に関する情報をOCR装置に送信する印刷情報送信手段をさらに有し、OCR処理部は、印刷情報送信手段により送信された印刷処理に関する情報と、取得されたレイアウト情報とに基づき、OCR処理を行ってもよい。
印刷情報送信手段は、可変帳票の印刷枚数を、可変部分が確定された可変帳票に関連付けて送信し、OCR装置は、印刷情報送信手段により送信された印刷枚数に基づいて、グループ管理手段により管理されている複数の画像データに関して、優先順位を決定する優先順位決定手段をさらに有し、OCR処理部は、優先順位決定手段により決定された優先順位に従って、可変帳票に関連付けられた複数の画像データそれぞれと、スキャナが読み取った帳票の画像データとを比較してもよい。
印刷情報送信手段は、可変帳票が印刷された年月日を示す日付情報を、可変部分が確定された可変帳票に関連付けて送信し、OCR装置は、印刷情報送信手段により送信された日付情報及び印刷枚数に基づいて、グループ管理手段により管理されている複数の画像データのうち、削除すべき画像データを決定する削除手段をさらに有してもよい。
【0013】
上記課題を解決するために、本発明のOCR装置は、帳票を作成する帳票作成装置から送信された、帳票のレイアウトを示すレイアウト情報を取得するレイアウト取得部と、取得されたレイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行うOCR処理部とを有する。
レイアウト取得部によって、レイアウトの一部が可変である可変帳票のレイアウト情報が取得された場合に、この可変帳票のレイアウト情報に基づいて生成された、可変部分が異なる複数のレイアウトの画像データを記憶する記憶手段をさらに有し、OCR処理部は、記憶手段に記憶された複数の画像データと、スキャナが読み取った帳票の画像データとを比較して、OCR処理を行うように構成してもよい。
【0014】
上記課題を解決するために、本発明のOCR処理プログラムは、コンピュータを、帳票を作成する帳票作成装置から送信された、帳票のレイアウトを示すレイアウト情報を取得するレイアウト取得部と、取得されたレイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行うOCR処理部として機能させる。
【0015】
上記課題を解決するために、本発明の帳票作成装置は、帳票のレイアウトを示すレイアウト情報を生成するレイアウト生成部と、帳票に書き込まれた書き込み情報を解析するOCR装置に、生成されたレイアウト情報を送信するレイアウト送信部とを有する。
【0016】
上記課題を解決するために、本発明の帳票作成プログラムは、コンピュータを、帳票のレイアウトを示すレイアウト情報を生成するレイアウト生成部と、帳票に書き込まれた書き込み情報を解析するOCR装置に、生成されたレイアウト情報を送信するレイアウト送信部として機能させる。
【0017】
上記課題を解決するために、本発明の、帳票作成装置と、帳票作成装置に通信接続されたOCR装置とによって帳票の管理を行う帳票処理方法であって、帳票作成装置は、帳票のレイアウトを示すレイアウト情報を生成し、生成したレイアウト情報をOCR装置に送信し、OCR装置は、帳票作成装置から送信されたレイアウト情報を取得し、取得したレイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行う。
【発明の効果】
【0018】
以上説明したように本発明は、帳票のOCR処理の精度を向上することが可能となる。
【図面の簡単な説明】
【0019】
【図1】帳票処理システムの概略的な接続関係を示した説明図である。
【図2】帳票作成装置の構成を示した機能ブロック図である。
【図3】帳票のレイアウトの一例を示す説明図である。
【図4】レイアウト情報を説明するための説明図である。
【図5】OCR装置の構成を示した機能ブロック図である。
【図6】改善情報を説明するための説明図である。
【図7】帳票処理方法のテスト時の全体的な処理の流れを示したシーケンス図である。
【図8】帳票処理方法の運用時の全体的な処理の流れを示したシーケンス図である。
【図9】レイアウトの一部が可変である帳票を例示する図である。
【図10】変形例1の帳票作成装置110の構成を示した機能ブロック図である。
【図11】変形例1のOCR装置120の構成を示した機能ブロック図である。
【図12】変形例1において記憶装置204に記憶されるテーブルを例示する図である。
【図13】変形例1における運用時の全体的な処理の流れを示したシーケンス図である。
【発明を実施するための形態】
【0020】
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。
【0021】
(帳票処理システム100)
図1は、帳票処理システム100の概略的な接続関係を示した説明図である。帳票処理システム100は、帳票作成装置110と、OCR装置120と、プリンタ130と、スキャナ140とを含んで構成される。帳票作成装置110は、インターネット、LAN(Local Area Network)、専用回線等の通信網150を通じて、OCR装置120と接続されている。また、帳票作成装置110はプリンタ130と、OCR装置120はスキャナ140と例えばLANを通じて接続されている。
【0022】
帳票作成装置110は、ユーザによるレイアウトの作成入力を受け付けると、帳票152のレイアウトを示すレイアウト情報を生成する。そして、プリンタ130はその生成されたレイアウト情報の帳票152を印刷する。ユーザは、印刷された帳票152に、例えば業務上の情報を、手書き、押印および打刻等で記載する。帳票152への記載が完了すると、スキャナ140は、情報が記載された帳票152を読み取り、OCR装置120は、その読み取られた画像データに対してOCR処理を行い、帳票152に書き込まれた書込情報を取得する。
【0023】
例えば、ユーザが手動で入力したOCR機種、行フィールド数、文字数に応じて、帳票の書式を自動生成する帳票作成装置が提案されている。しかし、このような帳票作成装置は、作成する帳票の文字枠や帳票サイズを自動的に調整しているに過ぎず、OCR機種等を特定する煩わしさがあった。さらに、同一のレイアウトの帳票を繰り返し読み取る場合、ユーザは、OCR処理の精度を上げるように、OCR装置に対し、読み取る対象の帳票の読み取り位置等を指定しなければならなかった。
【0024】
本実施形態にかかる帳票処理システム100は、帳票作成装置110がレイアウト情報を生成すると、そのレイアウト情報をOCR装置120のOCR処理にも共用する。したがって、この帳票処理システム100によれば、ユーザの作業負担を軽減しつつ、OCR処理の精度を向上することが可能となる。以下、帳票作成装置110、OCR装置120の順にそれぞれの構成を詳細に述べる。
【0025】
(帳票作成装置110)
図2は、帳票作成装置110の構成を示した機能ブロック図である。帳票作成装置110は、表示部160と、操作部162と、中央制御部164とを含んで構成される。
【0026】
表示部160は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等で構成される。操作部162は、表示部160の表示面上に設置されたタッチパネル、操作キーが複数設けられたキーボード、マウス等のポインティングデバイス、十字キー、ジョイスティック等で構成される。帳票作成装置110は、表示部160にレイアウト作成画面を表示し、操作部162を通じたユーザの操作入力を受け付けて帳票152のレイアウトを生成する。
【0027】
図3は、帳票152のレイアウトの一例を示す説明図である。図3に示すように、帳票152のレイアウトとして、例えば、文字枠182a、文字182b、基準マーク182c、バーコード182d等の配置が設定される。ここで、基準マーク182cは、スキャナ140が読み取った画像データに対してOCR装置120がOCR処理を施す際、帳票152の方向およびレイアウトの位置の基準となる。また、バーコード182dは、任意の情報を所定の規則に従って符号化したものであり、例えば、帳票152を識別する帳票IDを示す。
【0028】
帳票作成装置110は、操作部162を通じたユーザの操作入力に応じて図3に示すようなレイアウトを設定する。このとき、帳票152は、規則性のある入力態様を纏めた領域である複数の入力領域184を含む。入力領域184は、例えば文字枠182aで囲まれている。入力領域184には、入力領域184毎に、書き込まれることが想定される文字種(英字、数字、日本語、記号等)や属性(手書文字、活字等)等を設定することが可能である。
【0029】
中央制御部164は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、帳票作成装置110全体を制御する。また、中央制御部164は、レイアウト生成部170と、アシスト取得部172と、基準生成部174と、レイアウト送信部176と、データ出力部178と、出力制御部180、読取制御部182としても機能する。
【0030】
レイアウト生成部170は、操作部162を通じたユーザの操作入力により設定されたレイアウトに応じて、帳票152のレイアウトを示すレイアウト情報を生成する。
【0031】
図4は、レイアウト情報を説明するための説明図である。レイアウト情報のうち、特に、図4(a)は、文字枠182aを、図4(b)は、文字182bを、図4(c)は、入力領域184を示す。図4(a)に示すように、文字枠182aのレイアウト情報は、例えば、レイアウトID190a、帳票ID190b、基準点座標190c、行列190d、寸法190e、線幅190f、線種190g、色190h等で構成される。
【0032】
レイアウトID190aは、その文字枠182aを識別する識別情報である。帳票ID190bは、帳票152の元となったレイアウト情報を識別する識別情報である。基準点座標190cは、その文字枠182aの基準となる点、例えば、文字枠182aの左下の点の座標を示す。本実施形態において、座標系は、例えば、帳票152の左下の基準マーク182cを原点として横方向をx軸、縦方向をy軸とする。行列190dは、その文字枠182aで囲まれる領域をさらに分割した場合の行と列の数を示す。また、レイアウト情報は、文字枠182aを、表単位で設定せずに、この文字枠182aで囲まれる領域をさらに分割したマス単位で設定したものであってもよい。
【0033】
寸法190eは、例えば、文字枠182aで囲まれる表をさらに分割したマスの幅と高さを示し、行や列によって幅や高さが異なる場合、行毎に、または列毎に設定される。文字枠182aの、線幅190f、線種190g、色190hも同様、行や列によって異なる場合、行毎に、または列毎に設定される。このとき、隣接する行や列で文字枠182aの線幅190f、線種190g、色190hが異なる場合、文字枠182aの挟まれた部分は、例えば、ユーザの操作入力によって後から為された設定を優先する。また、四方を罫線で囲んだ文字枠182aに限らず、罫線を単独で設定することもできる。
【0034】
図4(b)に示すように、文字182bのレイアウト情報は、例えば、レイアウトID190a、帳票ID190b、基準点座標190c、大きさ190i、内容190j等で構成される。大きさ190iは、文字182bの大きさを示し、内容190jは、「仕入伝票」「年」「月」「日」等、実際に印刷される文字182bそのものである。また、文字182bが、例えば、連番の伝票番号や顧客毎に異なる顧客番号であったりして、可変である場合、レイアウト情報に文字182bの変更規則を示す可変情報を含んでもよい。
【0035】
図4(c)に示すように、入力領域184のレイアウト情報は、例えば、レイアウトID190a、帳票ID190b、基準点座標190c、寸法190e、文字種190k、属性190l、色190m等で構成される。文字種190kは、上述したように、書き込まれることが想定される文字の種類であって、例えば、英字、数字、平仮名、片仮名、記号、日本語等を設定できる。属性190lは、書き込まれる手段が手書きであれば手書文字、印刷やデータ印等であれば活字等を設定することが可能である。
【0036】
図4に示すレイアウト情報は、一例に過ぎず、基準マーク182cやバーコード182dの他、帳票152に記載可能な様々な構成要素の情報が設定される。
【0037】
アシスト取得部172は、後述するOCR装置120から送信されたアシスト情報を取得する。レイアウト生成部170は、アシスト取得部172がアシスト情報を取得した場合、そのアシスト情報に基づいてレイアウト情報を生成することができる。アシスト情報には、OCR装置120のOCR処理部で用いられるアルゴリズムに関するアルゴリズム情報が含まれ、例えば、OCR装置120の機種名であったり、OCR装置120のOCR処理部で用いられるOCR処理ソフトウェアの名称であったりバージョンであったりする。
【0038】
レイアウト生成部170は、アシスト取得部172が取得したアルゴリズム情報に合わせて、レイアウト情報に制約を加える。例えば、ユーザの操作入力に応じて、文字枠182aを配置する場合、レイアウト生成部170は、その文字枠182aの線幅190fに下限値を設ける。この下限値は、例えば、アルゴリズム情報がOCR処理ソフトウェアの名称とバージョンであった場合、そのOCR処理ソフトウェアとバージョンで特定されるアルゴリズムの性能に基づいて、設定される。
【0039】
同様に、レイアウト生成部170は、基準マーク182cの大きさ190iと配置(基準点座標190c)、バーコード182dの大きさ190i、スキャナ140で読み取られないドロップアウトカラー、文字種190k、属性190l等の設定項目について、アルゴリズム情報に基づいて制約を加える。また、レイアウト生成部170は、ユーザが文字枠182a等の構成要素の配置を指示した場合、その構成要素のレイアウト情報に含まれる上述した設定項目の初期値を、アルゴリズム情報に基づいて定めてもよい。
【0040】
アルゴリズム情報を用いる構成により、帳票152のOCR処理の精度を確認するためのテストと、そのテストのOCR処理の結果を見てレイアウト情報を修正するといった作業の繰り返しの回数を減らすことができ、ユーザの作業負担を大幅に軽減することが可能となる。
【0041】
基準生成部174は、レイアウト生成部170が生成したレイアウト情報に基づいて、OCR装置120におけるOCR処理の結果と比較する基準となる基準データを生成する。基準データについては後に詳述する。
【0042】
レイアウト送信部176は、レイアウト情報や基準データをOCR装置120に送信する。データ出力部178は、レイアウト情報を印刷に対応した形式に変換してプリンタ130に出力する。
【0043】
出力制御部180は、帳票152が印刷される場合に、予め定められた印刷条件で印刷するようにプリンタ130を制御する。出力制御部180は、プリンタ130を直接制御する場合に限定されず、出力制御部180は、変更を禁止する印刷条件等の制御情報をプリンタ130に出力し、プリンタ130がその制御情報に基づいて、印刷条件を設定してもよい。
【0044】
むやみにプリンタ130で印刷条件が変更され、例えば縮小印刷をしてしまうと、印刷された帳票152の文字の大きさが小さくなったり線の太さが細くなったりして、OCR処理の精度が低下してしまう可能性がある。出力制御部180が、予め定められた印刷条件で印刷するようにプリンタ130を制御することで、そのような事態を回避することが可能となる。
【0045】
読取制御部182は、スキャナ140が、帳票152を読み取って画像データとする際の解像度、読み取った後に実行されるアプリケーションやコマンドを指定する指定情報を通信網150を通じてスキャナ140に出力する。かかる通信網150を通じた出力に限られず、読取制御部182は、指定情報を、例えばバーコード182dとして帳票152に埋め込み、スキャナ140は、そのバーコード182dから、指定情報を取得してもよい。
【0046】
かかる読取制御部182を備える構成により、OCR処理に適した解像度で画像データを生成させたり、スキャナ140のアプリケーションやコマンドで、生成後の画像データの補正を行わせたりすることができ、OCR処理の精度をさらに向上することが可能となる。
【0047】
(OCR装置120)
図5は、OCR装置120の構成を示した機能ブロック図である。OCR装置120は、表示部200と、操作部202と、記憶装置204と、中央制御部206とを含んで構成される。
【0048】
表示部200は、液晶ディスプレイ、有機ELディスプレイ等で構成される。操作部202は、表示部200の表示面上に設置されたタッチパネル、操作キーが複数設けられたキーボード、マウス等のポインティングデバイス、十字キー、ジョイスティック等で構成される。
【0049】
記憶装置204は、HDD(Hard Disk Drive)、フラッシュメモリ、不揮発性RAM(Random Access Memory)等で構成され、レイアウト情報等を記憶する。本実施形態において、記憶装置204は、OCR装置120と一体に形成されるが、かかる場合に限定されず、別体の、例えば、NAS(Network Attached Storage)や外付けのHDD、USB(Universal Serial Bus)メモリ等であってもよい。
【0050】
中央制御部206は、中央処理装置(CPU)、プログラム等が格納されたROM、ワークエリアとしてのRAM等を含む半導体集積回路により、OCR装置120全体を制御する。また、中央制御部206は、レイアウト取得部220、画像取得部222、OCR処理部224と、アシスト生成部226と、基準取得部228と、アシスト送信部230としても機能する。
【0051】
レイアウト取得部220は、帳票作成装置110から送信されたレイアウト情報を取得して記憶装置204に記憶させる。
【0052】
画像取得部222は、帳票152を読み取って生成した画像データをスキャナ140から取得する。
【0053】
OCR処理部224は、例えば、画像取得部222が取得した画像データの画像のうち、基準マーク182cの位置を基準として、バーコード182d等の形で記載された、帳票152の帳票IDを読み取る。また、OCR処理部224は、その帳票IDを含むレイアウト情報を記憶装置204から読み出し、読み出したレイアウト情報に基づいて、スキャナ140が読み取った帳票152の画像データに対してOCR処理(画像データから、その画像データが示す文字や数字等の内容を抽出する処理)を行う。
【0054】
本実施形態のOCR装置120は、帳票作成装置110から取得したレイアウト情報に基づいてOCR処理を行うため、例えば、文字枠182aの位置や、書込情報を読み取る位置が分かっており、OCR処理の精度を向上できる。また、帳票作成装置110で生成したレイアウト情報をOCR装置120で共用するため、ユーザは、同様の設定を帳票作成装置110とOCR装置120それぞれで行う必要がなく、ユーザの作業負担を軽減できる。さらに、一度作成した帳票152について、仕様変更や、OCR処理の結果に応じてOCR処理の精度を高める必要性に応じて、レイアウト情報の修正を行う場合においても、同様に、帳票作成装置110で修正したレイアウト情報を帳票作成装置110とOCR装置120とで共用して、ユーザの作業負担を軽減することが可能となる。
【0055】
また、レイアウト情報には、帳票152における入力領域184について、例えば、形状、大きさ190i、配置、分割数等が可変である可変帳票を定義する可変情報が含まれる。
【0056】
このような可変帳票を扱う場合に何らの手段を講じないと、OCR処理部224が、画像データのみに基づいてその入力領域184を推定せざるを得ず、適切なOCR結果を得られない場合がある。そこで本実施形態では、帳票作成装置110がユーザの操作入力に応じて、レイアウト情報中の可変情報の入力領域184の形状、大きさ190i、配置、分割数等を確定し、データ出力部178が、可変情報における入力領域184が確定された可変情報を含むレイアウト情報を、プリンタ130に出力すると、このデータ出力部178による出力を契機として、レイアウト送信部176は、この入力領域184が確定されたレイアウト情報をOCR装置120に送信する。また、プリンタ130において入力領域184の形状、大きさ190i、配置、分割数等が確定する場合、レイアウト送信部176は、プリンタ130からの実際の帳票152の印刷を契機に、この入力領域184が確定されたレイアウト情報をOCR装置120に送信するとしてもよい。
【0057】
かかる構成により、OCR装置120では、レイアウト情報の入力領域184が確定しているため、正確な入力領域184の情報に基づいて、OCR処理の精度を向上すると共に、OCR処理の対象となる領域が絞られるため処理負荷を低減することができる。
【0058】
また、この場合のレイアウト情報は、ユーザの操作入力に応じた帳票152のレイアウトの画像データであってもよい。例えば、OCR装置120は、スキャナ140が読み取った帳票152の画像データについて、例えば、罫線の位置等を、レイアウト情報である画像データに合わせて補正した後、OCR処理を行う。かかる構成によっても、OCR処理の精度を向上することが可能となる。
【0059】
アシスト生成部226は、レイアウト情報の生成を補助するアシスト情報を生成する。そして、アシスト情報には、レイアウト情報の改善点を示す改善情報も含まれる。アシスト情報のうち、アルゴリズム情報については上述したので、ここでは、改善情報について詳述する。
【0060】
図6は、改善情報を説明するための説明図である。特に、図6(a)は、レイアウト情報の一例を示し、図6(b)は、改善情報の一例を示し、図6(c)は、基準データの一例を示す。
【0061】
アシスト生成部226は、レイアウト取得部220が取得した、例えば図6(a)に示すような入力領域184についてのレイアウト情報を参照する。かかるレイアウト情報については図4(c)を用いて上述したため説明は省略する。
【0062】
また、アシスト生成部226は、OCR処理部224によるOCR処理の結果、参照したレイアウト情報で示される、書込情報を読み取れるはずの分割された入力領域184について、書込情報が読み取れたか否か(読み取りの成否)を確認する。例えば、手書き文字を読み取る場合、OCR処理部224は、OCR処理のソフトウェアに登録されている基準文字との照合の結果、最も近いと判断された文字について、基準文字との合致の度合いを示す指標値を、所定の閾値と比較して、読み取りの成否を判断する。この閾値は、ユーザの操作入力に応じて変更可能とする。
【0063】
アシスト生成部226は、OCR処理の結果に基づいて、図6(b)に示すように、レイアウト情報においてその分割された入力領域184を示すレイアウトID190aと、読み取りの成否(読取成否250)とを関連付けた改善情報を生成する。
【0064】
このように、改善情報は、例えば、OCR処理の結果、本来であれば書込情報を読み取れるはずの分割された入力領域184において読み取りに失敗したことを示す。レイアウト生成部170では、この改善情報に基づいて、例えば、読み取りに失敗した、分割された入力領域184を赤色で塗りつぶしたり、その分割された入力領域184を囲う文字枠182aを赤くしたりして、ユーザに改善を促す。そして、ユーザの操作入力に応じて、例えば、入力領域184や文字枠182aの大きさ190iを大きくする等の、レイアウト情報の修正を行いOCR処理の精度の向上を図る。
【0065】
かかる改善情報を用いる構成により、書込情報の読み取りの成否を入力領域184毎に確認せずとも自動的に提示されるため、ユーザの作業負担を軽減できるとともに、改善すべき点を見逃してしまう事態を回避できる。
【0066】
また、上述した帳票作成装置110の基準生成部174が生成する基準データを用い、改善情報をさらに有益なものとして効率的に改善を図ることができる。基準生成部174が生成する基準データは、レイアウト情報に含まれない、OCR処理の精度を確認するためのテストのために用いられるデータである。基準データは、例えば、図6(c)に示すように、分割された入力領域184を示すレイアウトID190aと、その分割された入力領域184にユーザがテストのために書き込む文字の大きさ260aと、内容260bとが含まれる。
【0067】
この場合、帳票152において分割された入力領域184に、予め、基準データに定められた、例えば大きさ260aや内容260bの文字をユーザが書き込む。また、手書き文字に限られず、プリンタ130で基準データに定められた文字を印刷してもよい。その場合、ユーザの手書き文字の上手下手に左右されず、スキャナ140による画像の歪み等を要因とする読み取りの失敗を確実に検出してOCR処理の精度を改善できる。その後、OCR装置120の画像取得部222がスキャナ140を介してその帳票152の画像データを取得する。
【0068】
基準取得部228は、レイアウト送信部176が送信した基準データを取得する。アシスト生成部226は、基準取得部228が取得した基準データと、OCR処理の結果とに基づいて、改善情報を生成する。
【0069】
アシスト生成部226は、例えば、その大きさ260aや内容260bが定められた文字等を示す基準データと、実際に文字等が書き込まれた帳票152の画像データのOCR処理の結果とを比較し、改善情報を生成し、後述するアシスト送信部230が、その改善情報を帳票作成装置110に送信する。帳票作成装置110は、その改善情報に基づいてレイアウト情報を修正する。かかる基準データを用いる構成により、文字の誤認がないか等、詳細な比較が可能となり、レイアウト情報の改善の精度を向上できる。
【0070】
上述したように、アルゴリズム情報や改善情報といったアシスト情報を用いることで、OCR装置120側で把握できる情報を帳票作成装置110が共有でき、帳票作成装置110のレイアウト生成部170は、OCR処理し易いレイアウト情報を生成することが可能となる。
【0071】
アシスト送信部230は、アシスト生成部226によって生成されたアシスト情報を帳票作成装置110に送信する。
【0072】
以上、説明した帳票作成装置110およびOCR装置120によって、ユーザの作業負担を大幅に軽減しつつ、OCR処理の精度を向上することが可能となる。また、コンピュータを、帳票作成装置110として機能させる帳票生成プログラムおよびOCR装置120として機能させるOCR処理プログラムや、その帳票生成プログラムまたはOCR処理プログラムを記憶した、コンピュータで読み取り可能なフレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disc)等の記憶媒体も提供される。ここで、プログラムは、任意の言語や記述方法にて記述されたデータ処理手段をいう。
【0073】
また、この帳票生成プログラムおよびOCR処理プログラムは、帳票作成装置110またはOCR装置120に通信網150を介して接続された任意のアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることもできる。
【0074】
(帳票処理方法)
次に、上述した帳票処理システムの運用を行う帳票処理方法を説明する。図7は、帳票処理方法のテスト時の全体的な処理の流れを示したシーケンス図であり、図8は、帳票処理方法の運用時の全体的な処理の流れを示したシーケンス図である。
【0075】
図7に示すように、OCR装置120がアルゴリズム情報を含むアシスト情報を帳票作成装置110に送信すると(S300)、帳票作成装置110では、レイアウト生成部170がユーザの操作入力に基づいて帳票152のレイアウトを示すレイアウト情報を生成する(S302)。そして、帳票152を印刷する操作入力に従い、データ出力部178は、入力領域184が確定したレイアウト情報を、印刷に対応した形式に変換してプリンタ130に出力する(S304)。プリンタ130は帳票152を印刷する(S306)。そして、基準生成部174は、入力領域184が確定したレイアウト情報に基づいて基準データを生成する(S308)。レイアウト送信部176は、レイアウト情報と基準データをOCR装置120に送信する(S310)。ユーザは、印刷された帳票152に、例えば表示部160に表示された基準データが示す、大きさ260aや内容260bが定められた文字等を記載する。
【0076】
印刷された帳票152に情報が記載された後、スキャナ140は、その情報が記載された帳票152を読み取り(S312)、画像データをOCR装置120に送信する(S314)。OCR装置120のOCR処理部224は、レイアウト情報に基づいて画像データに対してOCR処理を行う(S316)。そして、アシスト生成部226は、OCR処理の結果と基準データとに基づいて改善情報を生成する(S318)。アシスト送信部230は、改善情報を帳票作成装置110に送信する(S320)。帳票作成装置110のレイアウト生成部170は、改善情報に基づいて、ユーザに改善を促し、レイアウト情報を修正する(S322)。
【0077】
運用時において、図8に示すように、帳票152を印刷する操作入力に従い、帳票作成装置110のデータ出力部178は、入力領域184が確定されたレイアウト情報を、印刷に対応した形式に変換してプリンタ130に出力する(S340)。帳票作成装置110のレイアウト送信部176は、レイアウト情報をOCR装置120に送信する(S342)。プリンタ130は帳票152を印刷する(S344)。このときの帳票152のレイアウト情報は、図7で示した帳票処理方法を通じ、改善情報に基づいてすでに修正されたものとする。
【0078】
そして、ユーザが帳票152に業務上の情報を手書き等で帳票152に記載した後、スキャナ140は、記載された帳票152を読み取り(S346)、読み取った画像データをOCR装置120に送信すると(S348)、OCR装置120のOCR処理部224が、その画像データに対してOCR処理を行い書込情報を取得する(S350)。かかる画像データのレイアウトは図7においてすでに修正されているので、OCR処理の精度も高くなっている。
【0079】
このような帳票処理方法によれば、図7に示すテスト時、および図8に示す運用時のいずれにおいても、ユーザの作業負担を軽減しつつ、改善情報に基づいて修正されたレイアウト情報を用いることでOCR処理の精度を向上することが可能となる。
【0080】
[変形例1]
次に上記実施形態の変形例を説明する。
変形例1では、図9(A)に例示するような、レイアウトの一部が可変である帳票(以下、可変帳票)に対する処理を説明する。図9(A)に例示するように、可変帳票には、レイアウトが固定的な固定部分と、レイアウトが可変となる可変部分とが含まれている。可変部分では、図9(B)に例示するように、入力領域の数量が変化することにより、可変領域全体の形状も変化する。本例のように、可変部分が帳票の要部となっている場合には、これらの部分もOCR処理に用いた方が、OCR処理の精度向上が期待できる。なお、本例のOCR処理では、レイアウトの画像データと、スキャンされた画像データとを比較して、スキャンされた画像データを補正するステップと、補正された画像データから、レイアウト情報に基づいて文字列等を特定するステップとが含まれるため、なおさらである。
そこで、本変形例の帳票処理システム100は、可変帳票が帳票作成装置110で設計された場合に、プリンタ130により印刷された可変帳票(すなわち、可変部分が確定した可変帳票)をOCR装置120に蓄積し、蓄積された可変帳票のレイアウト情報及びレイアウトの画像データに基づいて、OCR処理を行う。なお、本変形例では、可変部分が確定された可変帳票のレイアウト情報及びレイアウトの画像データをOCR装置120に蓄積する形態を具体例として説明するが、レイアウト情報及びレイアウトの画像データを外部のサーバ等に蓄積し、これらのデータを必要に応じてOCR装置120に提供するようにしてもよい。
【0081】
図10は、変形例1の帳票作成装置110の構成を示した機能ブロック図である。なお、本図に示された各構成のうち、図2に示された構成と実質的に同一のものには同一の符号が付されている。
図10に例示するように、帳票作成装置110は、図2の帳票作成装置に、印刷情報送信部184を追加した構成をとる。
帳票作成装置110において、印刷情報送信部184は、可変帳票がプリンタ130によって印刷された場合に、この印刷処理に関する情報をOCR装置120に送信する。印刷処理に関する情報には、印刷枚数(印刷部数)、印刷日時(年月日)、及び、印刷時における可変部分の数量(可変させた量(可変量))などが含まれる。本例の印刷情報送信部184は、データ出力部178によって可変帳票のデータがプリンタ130に出力されたことを条件として、プリンタ130により印刷される印刷枚数及び印刷年月日を、印刷される可変帳票の帳票ID及び可変量に関連付けてOCR装置120に送信する。すなわち、本例の印刷情報送信部184は、可変帳票の可変部分が確定された場合に、確定された可変帳票に関連付けて、その印刷枚数及び印刷年月日をOCR装置120に送信する。
【0082】
変形例1のレイアウト送信部176は、可変帳票がプリンタ130により印刷されたことを条件として、可変部分が確定された可変帳票のレイアウト情報の全部又は一部をOCR装置120に送信する。例えば、レイアウト送信部176は、可変帳票の可変部分に相当する画像データを、可変帳票の固定部分に相当する画像データとは異なるタイミングで、OCR装置120に送信する。より具体的には、レイアウト送信部176は、可変帳票のレイアウト情報がレイアウト生成部170により生成されたことを条件として、可変帳票の固定部分に相当する画像データ及びレイアウト情報をOCR装置120に送信し、その後、この可変帳票のレイアウト情報に基づいて可変帳票がプリンタ130によって印刷されたことを条件として(すなわち、可変帳票の可変部分が確定されたことを条件として)、可変帳票の可変部分に相当する画像データ及びレイアウト情報をOCR装置120に送信する。なお、OCR装置120は、レイアウト送信部176から別々に受信した、固定部分の画像データと、可変部分の画像データとを合成して、帳票レイアウトの画像データとし、固定部分のレイアウト情報と、可変部分のレイアウト情報とを併せて、全体のレイアウト情報とする。
【0083】
図11は、変形例1のOCR装置120の構成を示した機能ブロック図である。なお、本図に示された各構成のうち、図5に示された構成と実質的に同一のものには同一の符号が付されている。
図11に例示するように、本変形例のOCR装置120は、図5のOCR装置に、グループ管理部232、優先順位決定部234、及びレイアウト削除部236を追加した構成をとる。
【0084】
OCR装置120において、グループ管理部232は、同一の可変帳票(未確定)に基づいて生成された、可変部分が異なる複数のレイアウトの画像データを、可変帳票(未確定)の識別情報に関連付けて管理する。すなわち、グループ管理部232は、同一の可変帳票(未確定)に基づいて生成された、可変部分が異なる複数のレイアウト情報及びその画像データをグループとして管理する。本例のグループ管理部232は、可変部分が確定された可変帳票のレイアウト情報及びその画像データを、可変帳票(未確定)の帳票IDに関連付けて記憶装置204に格納することにより、同一の可変帳票に基づいて生成された複数の可変帳票(確定)のレイアウト情報及び画像データをグループとして管理する。
【0085】
記憶装置204は、図12に例示するように、可変部分が確定された可変帳票のレイアウト情報及びそのレイアウトの画像データを、グループ管理部232により関連付けられた可変帳票(未確定)の帳票ID、レイアウト情報に基づき特定された可変量(可変部分に含まれる入力領域の数)、印刷情報送信部184により送信された印刷枚数及び最終印刷年月日、スキャナ140によりスキャンされた各可変帳票(確定)の読取枚数及び最終読取年月日、優先順位決定部234により決定されたグループ内の優先順位、並びに、レイアウト削除部236により決定された削除予定日に関連付けて記憶する。
【0086】
優先順位決定部234は、同一の可変帳票(未確定)に基づいて印刷された、可変部分の異なる各可変帳票(確定)の印刷枚数に基づいて、グループ内における、確定された各可変帳票の優先順位を決定する。より具体的には、優先順位決定部234は、それぞれのグループに属する可変帳票(すなわち、可変部分の異なる可変帳票)の印刷枚数及び最終印刷年月日と、各可変帳票の読取枚数及び最終読取年月日とに基づいて、グループ内における各可変帳票(確定)の優先順位を決定する。優先順位決定部234は、印刷枚数が多いほど、優先順位を高くし、最終印刷年月日が近いほど、優先順位を高くし、最終読取年月日が近いほど、優先順位を高くする。また、優先順位決定部234は、各可変帳票(確定)の印刷枚数と読取枚数とに基づいて、未読取となっている帳票の枚数を推定し、推定された未読取の帳票枚数が多いほど、優先順位を高くする。
【0087】
レイアウト削除部236は、同一の可変帳票(未確定)に基づいて印刷された、可変部分の異なる各可変帳票(確定)の印刷枚数と、その可変帳票(確定)の読取枚数とに基づいて、グループ管理から除外すべき可変帳票(確定)を決定し、決定された可変帳票を記憶装置204から削除する。より具体的には、レイアウト削除部236は、同一の可変帳票(未確定)に基づいて印刷された、可変部分の異なる各可変帳票(確定)の印刷枚数及び最終印刷年月日と、各可変帳票(確定)の読取枚数及び最終読取年月日とに基づいて、グループ管理から除外すべき削除予定日を可変帳票毎に決定し、決定された削除予定日に従って、可変帳票(確定)のレイアウト情報及びその画像データを記憶装置204から削除する。レイアウト削除部236は、印刷枚数が多いほど、削除予定日を遅くし、最終印刷年月日が近いほど、削除予定日を遅くし、最終読取年月日が近いほど、削除予定日を遅くする。また、レイアウト削除部236は、各可変帳票(確定)の印刷枚数と読取枚数とに基づいて、未読取となっている帳票の枚数を推定し、推定された未読取の帳票枚数が少ないほど、削除予定日を早くする。
【0088】
変形例1のOCR処理部224は、画像取得部222が取得した画像データの画像のうち、基準マーク182cの位置を基準として、バーコード182d等の形で記載された、帳票152の帳票IDを読み取り、読取られた帳票IDに基づいてグループを特定する。次に、OCR処理部224は、特定されたグループに属するレイアウトの画像データと、スキャナ140によりスキャンされた画像データとを、優先順位決定部234により決定された優先順位に従って比較し、既定条件以上に特徴が一致する画像データが見つかった場合に、見つかったレイアウトの画像データに基づいて、スキャンされた画像データを補正し、補正された画像データから、このレイアウトのレイアウト情報(入力領域の位置及び属性など)に従って、文字列などを抽出する。補正処理は、例えば、画像の傾き補正、画像の位置ずれ補正、及び、画像の歪み補正などである。
【0089】
図13は、変形例1における運用時の全体的な処理の流れを示したシーケンス図である。
図13に示すように、可変帳票を印刷する操作入力に従い、帳票作成装置110のデータ出力部178は、入力領域の数量が確定されたレイアウト情報を、印刷に対応した形式に変換してプリンタ130に出力する(S340)。帳票作成装置110のレイアウト送信部176は、可変部分のレイアウト情報及び画像データをOCR装置120に送信する(S342)。なお、可変帳票の固定部分のレイアウト情報及び画像データは、予めOCR装置120に送信されている。
プリンタ130は可変帳票(確定)を印刷する(S344)。プリンタ130は可変帳票の印刷処理が完了すると、完了した印刷処理の印刷枚数及び印刷年月日を帳票作成装置110に通知する(S346)。帳票作成装置110は、プリンタ130から通知された印刷枚数及び印刷年月日と、印刷された可変帳票の帳票ID及び可変量とをOCR装置120に送信する(S348)。OCR装置120は、図12に例示したデータベースを更新する(S350)。具体的には、OCR装置120は、新たに印刷された可変帳票の印刷枚数を加算し、かつ、最終印刷時を、通知された印刷年月日で書き換える。このデータベースの更新によって、優先順位決定部234は、各可変帳票の優先順位を更新し、レイアウト削除部236は、印刷された可変帳票の削除予定日を更新する。
【0090】
そして、ユーザが帳票に業務上の情報を手書き等で記載した後、スキャナ140は、記載された帳票を読み取り(S352)、読み取った画像データをOCR装置120に送信すると(S354)、OCR装置120のOCR処理部224が、その画像データに対してOCR処理を行い書込情報を取得する(S356)。具体的には、OCR処理部224は、帳票IDを特定し、特定された帳票IDに関連付けられたグループの画像データと、スキャンされた画像データとを、優先順位に従って比較し、既定以上に特徴が一致する可変帳票の画像データに基づいて、スキャンされた画像データを補正し、補正された画像データから、この可変帳票に関連付けられたレイアウト情報に基づいて、書込情報を取得する。
OCR処理が完了すると、OCR装置120は、スキャンされた画像データに対応する可変帳票に関して、図12に例示したデータベースを更新する(S358)。具体的には、OCR装置120は、読取枚数を加算し、最終読取時を現在の年月日に書き換え、これに伴って、削除予定日を更新する。
【0091】
このような帳票処理方法によれば、可変帳票に対するOCR処理の精度向上が期待できる。特に、可変帳票の可変部分は、OCR処理の対象として重要な部分であることが多いため、その部分でのOCR処理の精度向上は好適である。
なお、本変形例1では、可変帳票の画像データを帳票作成装置110が生成しOCR装置120に送信する形態を説明したが、これに限定されるものではなく、例えば、OCR装置120が、未確定の可変帳票のレイアウト情報に基づいて、可変部分が異なる複数のレイアウトの画像データを生成して、同一のレイアウト情報から生成された複数の画像データをグルーピングして記憶装置204に格納してもよい。
【0092】
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
【0093】
なお、本明細書の帳票処理方法における各工程は、必ずしもシーケンス図として記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。
【産業上の利用可能性】
【0094】
本発明は、帳票の作成および読取を行う帳票処理システム、OCR装置、OCR処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法に利用することができる。
【符号の説明】
【0095】
100 …帳票処理システム
110 …帳票作成装置
120 …OCR装置
130 …プリンタ
140 …スキャナ
152 …帳票
170 …レイアウト生成部
172 …アシスト取得部
174 …基準生成部
176 …レイアウト送信部
178 …データ出力部
220 …レイアウト取得部
224 …OCR処理部
226 …アシスト生成部
228 …基準取得部
230 …アシスト送信部

【特許請求の範囲】
【請求項1】
帳票作成装置とOCR装置とを含む帳票処理システムであって、
前記帳票作成装置は、
帳票のレイアウトを示すレイアウト情報を生成するレイアウト生成部と、
生成された前記レイアウト情報を前記OCR装置に送信するレイアウト送信部と、
を有し、
前記OCR装置は、
前記帳票作成装置から送信されたレイアウト情報を取得するレイアウト取得部と、
取得された前記レイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行うOCR処理部と、
を有する帳票処理システム。
【請求項2】
前記OCR装置は、
前記レイアウト情報の生成を補助するアシスト情報を生成するアシスト生成部と、
前記アシスト情報を前記帳票作成装置に送信するアシスト送信部と、
をさらに有し、
前記帳票作成装置は、
送信された前記アシスト情報を取得するアシスト取得部
をさらに有し、
前記レイアウト生成部は、取得された前記アシスト情報に基づいて前記レイアウト情報を生成する
請求項1に記載の帳票処理システム。
【請求項3】
前記アシスト情報には、前記OCR装置のOCR処理部で用いられるアルゴリズムに関するアルゴリズム情報が含まれる
請求項2に記載の帳票処理システム。
【請求項4】
前記アシスト生成部は、前記OCR処理の結果に基づいて、前記取得されたレイアウト情報の改善点を示す改善情報を生成し、
前記アシスト情報には、前記改善情報が含まれる
請求項2または3に記載の帳票処理システム。
【請求項5】
前記帳票作成装置は、
前記生成されたレイアウト情報に基づいて、前記OCR処理の結果と比較する基準となる基準データを生成する基準生成部をさらに有し、
前記レイアウト送信部は、前記基準データを前記OCR装置に送信し、
前記OCR装置は、
送信された前記基準データを取得する基準取得部をさらに有し、
前記アシスト生成部は、取得された前記基準データと、前記OCR処理の結果とに基づいて、前記改善情報を生成する
請求項4に記載の帳票処理システム。
【請求項6】
前記帳票作成装置は、
前記生成されたレイアウト情報をプリンタに出力するデータ出力部をさらに有し、
前記生成されたレイアウト情報には、帳票における入力領域が可変である可変帳票を定義する可変情報が含まれ、
前記データ出力部が、前記可変情報における入力領域が確定されたレイアウト情報を、前記プリンタに出力すると、前記レイアウト送信部は、前記入力領域が確定されたレイアウト情報を前記OCR装置に送信する
請求項1から5のいずれか1項に記載の帳票処理システム。
【請求項7】
前記レイアウト送信部は、前記データ出力部が、少なくとも前記入力領域の形状又は数量が確定されたレイアウト情報を前記プリンタに出力した場合に、この入力領域が確定されたレイアウトの画像データの一部又は全部を、前記レイアウト情報の少なくとも一部として前記OCR装置に送信する
請求項6に記載の帳票処理システム。
【請求項8】
前記レイアウト送信部は、レイアウトの一部が可変である可変帳票が印刷されたことを条件として、可変帳票の可変部分に相当する画像データを前記OCR装置に送信し、可変帳票の非可変部分に相当する画像データを、可変部分に相当する画像データとは異なるタイミングで、前記OCR装置に送信し、
前記OCR処理部は、前記レイアウト送信部から別々に送信された、可変帳票の可変部分の画像データと、非可変部分の画像データとを合成して、OCR処理に用いる
請求項7に記載の帳票処理システム。
【請求項9】
前記OCR装置は、
同一の可変帳票に基づいて生成された、可変部分が異なる複数のレイアウトの画像データを、それぞれの可変帳票に関連付けて管理するグループ管理手段をさらに有し、
前記OCR処理部は、可変帳票の識別情報に基づいて、前記グループ管理手段により管理されている可変帳票を特定し、特定された可変帳票に関連付けられた画像データのいずれかを用いて、OCR処理を行う
請求項7に記載の帳票処理システム。
【請求項10】
前記帳票作成装置は、
可変帳票が印刷された場合に、この印刷処理に関する情報を前記OCR装置に送信する印刷情報送信手段をさらに有し、
前記OCR処理部は、前記印刷情報送信手段により送信された印刷処理に関する情報と、取得された前記レイアウト情報とに基づき、OCR処理を行う
請求項9に記載の帳票処理システム。
【請求項11】
前記印刷情報送信手段は、可変帳票の印刷枚数を、可変部分が確定された可変帳票に関連付けて送信し、
前記OCR装置は、
前記印刷情報送信手段により送信された印刷枚数に基づいて、前記グループ管理手段により管理されている複数の画像データに関して、優先順位を決定する優先順位決定手段をさらに有し、
前記OCR処理部は、前記優先順位決定手段により決定された優先順位に従って、可変帳票に関連付けられた複数の画像データそれぞれと、前記スキャナが読み取った帳票の画像データとを比較する
請求項10に記載の帳票処理システム。
【請求項12】
前記印刷情報送信手段は、可変帳票が印刷された年月日を示す日付情報を、可変部分が確定された可変帳票に関連付けて送信し、
前記OCR装置は、
前記印刷情報送信手段により送信された日付情報及び印刷枚数に基づいて、前記グループ管理手段により管理されている複数の画像データのうち、削除すべき画像データを決定する削除手段をさらに有する
請求項11に記載の帳票処理システム。
【請求項13】
プリンタと画像読取装置とをさらに含み、
前記帳票作成装置は、
帳票が前記プリンタで印刷される場合に、予め定められた印刷条件で印刷するようにプリンタを制御する出力制御部と、
帳票が前記画像読取装置により読み取られる場合に、画像読取装置の動作方法を指定する読取制御部とをさらに有する
請求項1に記載の帳票処理システム。
【請求項14】
帳票を作成する帳票作成装置から送信された、帳票のレイアウトを示すレイアウト情報を取得するレイアウト取得部と、
取得された前記レイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行うOCR処理部と、
を有するOCR装置。
【請求項15】
前記レイアウト取得部によって、レイアウトの一部が可変である可変帳票のレイアウト情報が取得された場合に、この可変帳票のレイアウト情報に基づいて生成された、可変部分が異なる複数のレイアウトの画像データを記憶する記憶手段をさらに有し、
前記OCR処理部は、前記記憶手段に記憶された複数の画像データと、スキャナが読み取った帳票の画像データとを比較して、OCR処理を行う
請求項14に記載のOCR装置。
【請求項16】
コンピュータを、
帳票を作成する帳票作成装置から送信された、帳票のレイアウトを示すレイアウト情報を取得するレイアウト取得部と、
取得された前記レイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行うOCR処理部と、
して機能させるOCR処理プログラム。
【請求項17】
帳票のレイアウトを示すレイアウト情報を生成するレイアウト生成部と、
前記帳票に書き込まれた書き込み情報を解析するOCR装置に、生成された前記レイアウト情報を送信するレイアウト送信部と、
を有する帳票作成装置。
【請求項18】
コンピュータを、
帳票のレイアウトを示すレイアウト情報を生成するレイアウト生成部と、
前記帳票に書き込まれた書き込み情報を解析するOCR装置に、生成された前記レイアウト情報を送信するレイアウト送信部と、
して機能させる帳票作成プログラム。
【請求項19】
帳票作成装置と、前記帳票作成装置に通信接続されたOCR装置とによって帳票の管理を行う帳票処理方法であって、
前記帳票作成装置は、
帳票のレイアウトを示すレイアウト情報を生成し、
生成した前記レイアウト情報を前記OCR装置に送信し、
前記OCR装置は、
前記帳票作成装置から送信されたレイアウト情報を取得し、
取得した前記レイアウト情報に基づき、スキャナが読み取った帳票の画像データに対してOCR処理を行う
帳票処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2012−9005(P2012−9005A)
【公開日】平成24年1月12日(2012.1.12)
【国際特許分類】
【出願番号】特願2010−289066(P2010−289066)
【出願日】平成22年12月27日(2010.12.27)
【出願人】(000136136)株式会社PFU (354)
【Fターム(参考)】