説明

文書読取画像処理装置及びプログラム

【課題】 記入領域を含む複数の文書から読み取り画像を得た後で、記入領域の内容に不備がある読み取り画像に対応する文書を複数の文書から見つけ出す手間を省くことを目的とする。
【解決手段】 文書管理装置1は、複合機3のスキャン処理部32で読み取られた調査票の読み取り画像を受信すると、入力値検証部16により、調査票の読み取り画像を解析して調査項目に対する回答内容(記入内容)を検出し、検証ルール格納部13に格納されている検証ルールに基づく検証を行って、調査項目の記入内容に不備があるか否かを判定する。そして、記載不備の調査項目がある調査票が存在する場合には、その読み取り画像について印刷用紙作成部17により印刷用文書画像を作成し、その印刷指示を印刷指示部18により複合機3へ送信して印刷出力させる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書読取画像処理装置及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、スキャナ等のデバイスから読み込んだ画像や、FAX受信した画像を任意の文書管理システムに登録する機能を有する文書登録システムにおいて、上記デバイスから読み込まれた画像データにOCR処理等を施すことによって特定のテキストデータ(緊急など文字列)を取得し、この特定のテキストデータに従って文書画像の重要度を決定し、文書管理システムへの画像データの登録失敗の際には、重要度が反映された電子メールを送信することが開示されている。
【0003】
特許文献2には、原稿自動送り装置を用いた画像形成方法において、原稿を画像情報読み取り位置まで搬送する搬送工程と、原稿の画像情報有無を検知する白紙検知工程と、原稿片面の白紙状態が検知された時、原稿を反転させ再度画像情報読み取り位置まで反転搬送する反転工程と、画像情報読み取り位置にセツトされた画像情報ページ領域内の所定の画像情報を検出する検出工程と、検出された画像情報データから画像情報の画像方向を認識する認識工程と、各原稿の認識された画像方向データを比較し、各原稿の画像方向整合性を判定する判定工程と、原稿両面の白紙状態が検知された時、原稿に対応する用紙への画像形成を不作動とし、用紙を排出する排出工程とからなり、これらの工程を順次実行することにより、画像形成を行うことが開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−313489号公報
【特許文献2】特開平06−225053号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、記入領域を含む複数の文書から読み取り画像を得た後で、記入領域の内容に不備がある読み取り画像に対応する文書を複数の文書から見つけ出す手間を省くことを目的とする。
【課題を解決するための手段】
【0006】
第1の本発明は、記入領域を含む複数の文書をそれぞれ読み込んだ複数の読み取り画像を受け付ける受付手段と、前記受付手段により受け付けられた各読み取り画像について、その記入領域の内容が予め設定された検証規則を満たすか否かに応じてその読み取り画像を印刷出力させるか否かを制御する制御手段と、を備えたことを特徴とする文書読取画像処理装置である。
【0007】
第2の本発明は、第1の本発明において、前記制御手段は、前記読み取り画像をその記入領域の内容を消去した態様で印刷出力させる、ことを特徴とする。
【0008】
第3の本発明は、第1の本発明において、前記制御手段は、前記読み取り画像をその記入領域へ修正候補値を当て嵌めた態様で印刷出力させる、ことを特徴とする。
【0009】
第4の本発明は、記入領域を含む複数の文書をそれぞれ読み込んだ複数の読み取り画像を受け付ける受付機能と、前記受付機能により受け付けられた各読み取り画像について、その記入領域の内容が予め設定された検証規則を満たすか否かに応じてその読み取り画像を印刷出力させるか否かを制御する制御機能と、をコンピュータに実現させるためのプログラムである。
【0010】
第5の本発明は、読取装置と、文書読取画像処理装置と、印刷装置と、を備え、前記読取装置は、記入領域を含む複数の文書をそれぞれ画像読み取りする読取手段と、複数の読み取り画像を前記文書読取画像処理装置に送信する送信手段と、を備え、前記文書読取画像処理装置は、前記読取装置から送信された複数の読み取り画像を受信する受信手段と、受信した各読み取り画像について、その記入領域の内容が予め設定された検証規則を満たさない場合にその読み取り画像の印刷指示を送信手段により前記印刷装置に送信するか否かを制御する送信制御手段と、を備え、前記印刷装置は、前記文書読取画像処理装置から読み取り画像の印刷指示を受信する受信手段と、受信した読み取り画像の印刷指示に基づいてその読み取り画像を印刷する印刷手段と、を備えた、ことを特徴とする文書読取画像処理システムである。
【発明の効果】
【0011】
第1の本発明によると、記入領域を含む複数の文書から読み取り画像を得た後で、記入領域の内容に不備がある読み取り画像に対応する文書を複数の文書から見つけ出す手間を省くことができる。
【0012】
第2の本発明によると、記入領域の内容に不備がある文書を訂正して画像読み取りし直す作業が、当該文書の読み取り画像が印刷された用紙の記入領域へ記入して画像読み取りし直すだけで済むようになる。
【0013】
第3の本発明によると、回記入領域の内容に不備がある文書を訂正して画像読み取りし直す作業が、当該文書の読み取り画像が印刷された用紙の記入領域に設定された修正候補値の内容が正しい場合には、その用紙をそのまま画像読み取りし直すだけで済むようになる。
【0014】
第4の本発明によると、記入領域を含む複数の文書から読み取り画像を得た後で、記入領域の内容に不備がある読み取り画像に対応する文書を複数の文書から見つけ出す手間を省くことができる。
【0015】
第5の本発明によると、記入領域を含む複数の文書から読み取り画像を得た後で、記入領域の内容に不備がある読み取り画像に対応する文書を複数の文書から見つけ出す手間を省くことができる。
【図面の簡単な説明】
【0016】
【図1】本発明の一実施形態に係る文書管理システムの機能ブロックを例示する図である。
【図2】本発明の一実施形態に係る調査票の読み取り画像の検証時のフローを例示する図である。
【図3】本発明の一実施形態に係る不備がある調査票を例示する図である。
【図4】本発明の一実施形態に係る調査票の登録状況を例示する図である。
【図5】本発明の一実施形態に係る修正候補値を入力して印刷された調査票を例示する図である。
【図6】本発明の一実施形態に係る調査票の登録状況を例示する図である。
【図7】本発明の一実施形態に係る文書管理装置を構成するコンピュータのハードウェア構成を例示する図である。
【発明を実施するための形態】
【0017】
本発明の一実施形態について、図面を参照して説明する。
図1には、本発明の一実施形態に係る文書管理システムの機能ブロックを例示してある。
本例の文書管理システムには、紙文書の読み取り画像を収集して管理(蓄積)する文書管理装置1(文書読取画像処理装置の一例)と、印刷・複写・スキャン(画像読み取り)等の機能を複合的に備えた複合機3(読取装置及び印刷装置の一例)とを互いに通信可能に設けてある。
なお、以下の説明では、調査項目に対する回答が記入される調査票(調査用紙)を対象として収集・管理しているが、これに限定されるものではなく、記入領域を設けられた文書であればよい。
【0018】
本例の複合機3は、有線又は無線通信により他の装置との間でデータ送受信を行う通信部31、読み取り対象の紙文書(本例では回答記入済みの調査票)をスキャン(画像読み取り)してその読み取り画像を得るスキャン処理部32、印刷指示に基づいて対象画像を用紙等の記録媒体に印刷(記録)する印刷部33等の機能部を有している。
なお、本例では、読取装置及び印刷装置として複合機3を用いているが、それぞれを別体の装置により実現にしてもよい。
【0019】
本例の文書管理装置1は、文書メタデータ管理部11、文書コンテンツ管理部12、検証ルール格納部13、修正候補値格納部14、通信部15、入力値検証部16、印刷用紙作成部17、印刷指示部18、修正候補値作成部19、操作・UI表示部20等の機能部を有している。
【0020】
文書メタデータ管理部11は、電子文書の名称、作成日時、アクセス権限等の電子文書に係る属性データ(以下、文書メタデータという)を管理する。
文書コンテンツ管理部12は、電子文書の実データ(以下、文書コンテンツという)を管理する。
本例の文書管理システムでは、回答記入済みの調査票の読み取り画像を文書コンテンツとして文書コンテンツ管理部12に格納し、その文書メタデータを文書メタデータ管理部11に格納しており、これらの文書コンテンツ及び該当する文書メタデータは互いに文書識別情報により関連付けしてある。
【0021】
検証ルール格納部13は、本システムによる管理対象の調査票における各調査項目について、その回答内容(記入領域への記入内容)に不備があるか否かを検証するための検証ルール(検証規則)を格納してある。検証ルールとしては、例えば、調査票における各調査項目に対する回答入力欄(記入領域の一例)の位置を示す座標情報、必須入力の調査項目を識別する必須項目識別情報、調査項目に対する回答入力欄へ入力(記入)される値の属性(数値、ひらがな、カタカナ等)を定義する属性定義情報、調査項目の種別(氏名、住所、郵便番号等)を定義する種別定義情報などを用いており、管理対象の調査票及びその調査項目に対して関連付け設定されている。
【0022】
修正候補値格納部14は、記載不備の調査項目に対する修正候補値を取得する基となる候補データを格納してある。候補データとしては、例えば、語彙データベースや住所データベース等の既存のデータベース、文書コンテンツ管理部12や文書メタデータ管理部11の登録内容に基づいて生成される情報、調査実施者等のユーザにより予め設定された情報、などが用いられる。
【0023】
通信部15は、有線又は無線通信により他の装置との間でデータ送受信を行う。本例では、例えば、複合機3から調査票の読み取り画像を受信したり、記載不備が判明した調査票の読み取り画像の印刷指示を複合機3へ送信したりする。
【0024】
入力値検証部16は、複合機3から通信部15により受信して受け付けた調査票の読み取り画像を解析し、その調査票における各調査項目に対する入力値(対応する回答入力欄への記入内容)を検証する処理を行う。すなわち、対象の調査票の各調査項目に対応する検証ルールを検証ルール格納部13から読み出して、この検証ルールに基づいて各調査項目の回答内容に不備があるか否かを判定する。
【0025】
具体的には、例えば、まず、調査項目の回答入力欄の座標情報に対応する画像領域に対して文字読取処理を実行して記入内容(入力値)を検出し、更に、当該検出した入力値について、調査項目の属性定義情報に基づく入力値の属性の検証や、調査項目の種別定義情報及びその種別に対応するデータベース等に基づく入力値の妥当性の検証などを行い、属性不一致や妥当性欠如と判断される場合に、調査項目の回答内容に不備があると判定する。また、例えば、必須項目識別情報に対応する必須入力の調査項目について、その回答入力欄の座標情報に対応する画像領域に対して文字読取処理を実行したものの入力値を検出できない場合(記入漏れの場合)に、調査項目の回答内容に不備があると判定する。
【0026】
印刷用紙作成部17は、入力値検証部16により調査項目の回答内容に不備があると判定された調査票(記載不備の調査項目がある調査票)について、その読み取り画像における記載不備の調査項目に対する回答記入欄を空欄にした態様(記入内容を消去した態様)の印刷用文書画像の作成、又は、前記読み取り画像における記載不備の調査項目に対する回答記入欄へ修正候補値格納部14の候補データに基づく修正候補値を当て嵌めた態様の印刷用文書画像の作成を行う。
【0027】
ここで、記載不備の調査項目に対する回答記入欄を空欄にした態様の印刷用文書画像は、例えば、その調査票の読み取り画像における記載不備の調査項目の回答入力欄の座標情報に対応する画像領域を下地色(例えば白)で塗り潰して作成する。
また、記載不備の調査項目に対する回答記入欄へ修正候補値格納部14の候補データに基づく修正候補値を当て嵌めた態様の印刷用文書画像は、例えば、その調査票の読み取り画像における記載不備の調査項目の回答入力欄の座標情報に対応する画像領域を下地色で塗り潰した後に修正候補値を上書きして作成する。
なお、修正候補値格納部14の候補データに基づく修正候補値は、予め設定された選定基準に基づいて選定しており、例えば、現在の入力値に文字構成が最も類似すると判断されるものが選ばれる。
【0028】
印刷指示部18は、入力値検証部16により調査項目の回答内容に不備があると判定された調査票について、その読み取り画像又は印刷用紙作成部17により作成された印刷用文書画像の印刷指示を出力し、通信部15により複合機3へ送信させる。
ここで、印刷用紙作成部17により作成された印刷用文書画像の印刷指示を送信する場合には、記載不備の調査項目に対する回答記入欄を空欄にした態様の印刷用文書画像、又は、記載不備の調査項目に対する回答記入欄へ修正候補値を当て嵌めた態様の印刷用文書画像のいずれか一方を送信するようにしてもよく、或いは両方を送信するようにしてもよい。
【0029】
修正候補値作成部19は、文書コンテンツ管理部12や文書メタデータ管理部11の登録内容に基づいて、回答内容に不備がある調査項目に対する修正候補値を取得する基となる候補データを作成して修正候補値格納部14に格納する。具体的には、例えば、検証済みの過去の調査結果における回答内容を調査項目別に集計し、上位N件をその調査項目に係る候補データとする、等の処理を行う。
【0030】
操作・UI表示部20は、マウスやキーボード等の入力機器を用いて操作者により行われた各種の操作を受け付けたり、液晶パネル等の表示装置により各種の情報を表示出力して操作者に提供するユーザ・インタフェースである。
【0031】
次に、本例の文書管理装置1における調査票の読み取り画像の検証時の処理を、図2に例示する処理フローを参照して説明する。
本例のフローでは、文書管理装置1は、複合機3のスキャン処理部32により画像読み取りされて通信部31により送信された調査票の読み取り画像を通信部11により受信して受け付ける毎に、入力値検証部16が、調査票の読み取り画像を解析して調査項目に対する回答内容(記入内容)を検出し、検証ルール格納部13に格納されている検証ルールに基づく検証を行って(ステップS11)、調査項目の記入内容に不備があるか否かを判定する(ステップS12)。
この処理を収集対象の全ての調査票の読み取り画像について行って、記載不備の調査項目がない調査票と記載不備の調査項目がある調査票とに仕分ける。
【0032】
そして、記載不備の調査項目がある調査票が存在する場合には、その読み取り画像について印刷用紙作成部17が印刷用文書画像を作成し、その印刷指示を印刷指示部18が通信部15により複合機3へ送信し、複合機3の印刷部33により印刷出力させる(ステップS13)。また、記載不備の調査項目がない調査票の読み取り画像を束ねた成功文書と、記載不備の調査項目がある調査票の読み取り画像を束ねた失敗文書を作成して、これらを別文書として文書コンテンツ管理部12に格納すると共に、その文書メタデータを文書メタデータ管理部11に格納する(ステップS14)。
一方、記載不備の調査項目がある調査票が存在しない場合には、全ての調査票の読み取り画像を束ねた文書を文書コンテンツ管理部12に格納すると共に、その文書メタデータを文書メタデータ管理部11に格納する(ステップS15)。
【0033】
次に、本例に係る文書管理装置1における動作を、図3〜図6に例示する具体例を参照して説明する。
本例で用いる調査票は、図3に例示するように、株式会社B社が製品Aについての調査を行うものであり、調査対象者(本例では、製品Aの購入者)の氏名及び住所を記入する欄や、製品Aの利用頻度及び購入場所をリスト中から選択する欄などが設けられている。
【0034】
そして、例えば、100枚の調査票を複合機3のスキャン処理部32により順次画像読み取りして文書管理装置1の入力値検証部16により検証した結果、4枚目の調査票の住所記入欄に誤った住所(本例では“東京都高津区”)が記入されていることが判明し、4枚目の調査票は住所の調査項目に対する回答内容に不備があると判定された場合には、図4に例示するように、記載不備の調査項目がない調査票(4枚目以外の調査票)の読み取り画像を内容とした成功文書と、記載不備の調査項目がある調査票(4枚目の調査票)の読み取り画像を内容とした失敗文書を作成して、これらを別文書として登録する。なお、本例では、失敗文書へのアクセス権を特定の登録者(例えば、管理者や調査実施者)に限定している。
【0035】
また、記載不備の調査項目がある調査票(4枚目の調査票)について、図5に例示するように、誤った住所が記入された住所記入欄へ修正候補値(本例では“神奈川県川崎市高津区”)を当て嵌めた印刷用文書画像が印刷用紙作成部17により作成され、その印刷指示が印刷指示部18により出力されて複合機3へ送信され、複合機3の印刷部33により印刷出力される。
その後、当該印刷された調査票を作業者が確認し、住所記入欄の内容(修正候補値)が正しいと判断された場合には、この調査票を複合機3のスキャン処理部32により画像読み取りさせることで、その読み取り画像が文書管理装置1に送信される。そして、文書管理装置1では入力値検証部16により再度検証を行って、不備がない(不備が解消された)と判定された場合には、図6に例示するように、この読み取り画像を成功文書に統合すると共に失敗文書を削除する。
【0036】
なお、本例では単枚の調査票を用いているが、複数枚からなる調査票を用いてもよく、この場合には、記載不備の調査項目がある調査票について、全頁分の読み取り画像を印刷対象としてもよく、記載不備の調査項目がある頁の読み取り画像のみを印刷対象としてもよい。
【0037】
図7には、本例に係る文書管理装置1を構成するコンピュータの主要なハードウェアを例示している。
本例では、各種演算処理を行うCPU51、CPU51の作業領域となるRAM52、基本的な制御プログラムを記憶するROM53、本発明の一実施形態に係る文書読取画像処理装置の各機能部を実現するためのプログラムや各種データを記憶するHDD54、各種情報を表示出力するための表示装置や操作者により入力操作に用いられるキーボードやマウス等の機器とのインターフェースである入出力I/F55、他の装置との間で通信を行うインターフェースである通信I/F56、等のハードウェア資源を有するコンピュータにより構成されている。
そして、文書読取画像処理装置の各機能部を実現するためのプログラムをHDD54等から読み出してRAM52に展開し、これをCPU51により実行させることで、文書読取画像処理装置の各機能部を文書管理装置1上に実現している。
【0038】
なお、本例では、1台のコンピュータにより本発明の一実施形態に係る文書読取画像処理装置を実現しているが、各機能部を複数台のコンピュータに分散して設けて本発明の一実施形態に係る文書読取画像処理装置を実現してもよい。
また、本発明の一実施形態に係るプログラムは、例えば、当該プログラムを記憶したCD−ROM等の外部記憶媒体から読み込む形式や、通信回線等を介して受信する形式などにより、本例に係る文書管理装置1のコンピュータに設定される。
また、本例のようなソフトウェア構成により各機能部を実現する態様に限られず、それぞれの機能部を専用のハードウエアモジュールで実現するようにしてもよい。
【符号の説明】
【0039】
1:文書管理装置、 11:文書メタデータ管理部、 12:文書コンテンツ管理部、 13:検証ルール格納部、 14:修正候補値格納部、 15:通信部、 16:入力値検証部、 17:印刷用紙作成部、 18:印刷指示部、 19:修正候補値作成部、 20:操作・UI表示部、
3:複合機、 31:通信部、 32:スキャン処理部、 33:印刷部

【特許請求の範囲】
【請求項1】
記入領域を含む複数の文書をそれぞれ読み込んだ複数の読み取り画像を受け付ける受付手段と、
前記受付手段により受け付けられた各読み取り画像について、その記入領域の内容が予め設定された検証規則を満たすか否かに応じてその読み取り画像を印刷出力させるか否かを制御する制御手段と、
を備えたことを特徴とする文書読取画像処理装置。
【請求項2】
前記制御手段は、前記読み取り画像をその記入領域の内容を消去した態様で印刷出力させる、
ことを特徴とする請求項1に記載の文書読取画像処理装置。
【請求項3】
前記制御手段は、前記読み取り画像をその記入領域へ修正候補値を当て嵌めた態様で印刷出力させる、
ことを特徴とする請求項1に記載の文書読取画像処理装置。
【請求項4】
記入領域を含む複数の文書をそれぞれ読み込んだ複数の読み取り画像を受け付ける受付機能と、
前記受付機能により受け付けられた各読み取り画像について、その記入領域の内容が予め設定された検証規則を満たすか否かに応じてその読み取り画像を印刷出力させるか否かを制御する制御機能と、
をコンピュータに実現させるためのプログラム。
【請求項5】
読取装置と、文書読取画像処理装置と、印刷装置と、を備え、
前記読取装置は、記入領域を含む複数の文書をそれぞれ画像読み取りする読取手段と、複数の読み取り画像を前記文書読取画像処理装置に送信する送信手段と、を備え、
前記文書読取画像処理装置は、前記読取装置から送信された複数の読み取り画像を受信する受信手段と、受信した各読み取り画像について、その記入領域の内容が予め設定された検証規則を満たさない場合にその読み取り画像の印刷指示を送信手段により前記印刷装置に送信するか否かを制御する送信制御手段と、を備え、
前記印刷装置は、前記文書読取画像処理装置から読み取り画像の印刷指示を受信する受信手段と、受信した読み取り画像の印刷指示に基づいてその読み取り画像を印刷する印刷手段と、を備えた、
ことを特徴とする文書読取画像処理システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate