帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
【課題】処理対象領域が帳票紙面において占める位置を帳票様式から得られる情報をもとに判定することのできる帳票処理装置を提供する。
【解決手段】帳票1には、処理対象の情報が配置される領域2と、この領域2の位置を特定するための基準位置を示すとともに、領域2のサイズ情報を少なくとも表現したパターンが設けられている。帳票処理装置は、入力した帳票画像中のパターンにおける基準位置を検出すると共に領域2のサイズ情報を認識する。さらに帳票処理装置は、基準位置と領域2のサイズ情報とから領域2の全体の位置を求め、求めた領域内の画像に対する処理を行う。
【解決手段】帳票1には、処理対象の情報が配置される領域2と、この領域2の位置を特定するための基準位置を示すとともに、領域2のサイズ情報を少なくとも表現したパターンが設けられている。帳票処理装置は、入力した帳票画像中のパターンにおける基準位置を検出すると共に領域2のサイズ情報を認識する。さらに帳票処理装置は、基準位置と領域2のサイズ情報とから領域2の全体の位置を求め、求めた領域内の画像に対する処理を行う。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票の紙面において処理対象の情報が配置された領域を検出して、その領域内の情報に対して文字認識などの処理を行う帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラムに関する。
【背景技術】
【0002】
帳票処理装置は、帳票の紙面の画像(以下「帳票画像」と記述)において、処理対象である文字などの情報がどこの領域に配置されているかを判定し、その領域(以下「処理対象領域」と記述)の画像情報を対して文字認識などの処理を行っている。
【0003】
帳票画像の中の処理対象領域を判定する手段としては、処理対象領域に対して一定の関係をもつ位置にパターン識別が容易なマークを配置しておき、検出されたマークの位置を基準に処理対象領域の位置を判定する方法が知られている。たとえば、特許文献1においては、処理対象領域が存在する行の位置を特定のマークによって表す方式が開示されている。
【特許文献1】特開2001−195541号公報(段落0013、図2)
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、検出されたマークの位置から処理対象領域の位置を特定する方法では、処理対象領域のサイズが帳票処理装置にとって不明である場合に、その処理対象領域が帳票紙面において占める位置情報までは得られない。したがって、帳票上にサイズの異なる複数の処理対象領域が混在し、それぞれの処理対象領域を判定してその中の画像に対して文字認識などを行う運用を考えた場合、それぞれの処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式が求められる。
【0005】
本発明は、かかる事情を鑑み、処理対象領域が帳票紙面において占める位置を帳票様式から得られる情報をもとに判定することのできる帳票処理装置、さらには、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することのできる帳票様式作成装置、さらには、その帳票、帳票処理用のプログラム、帳票様式作成用のプログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
上記の目的を達成するために、本発明の帳票処理装置は、処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部とを具備することを特徴とする。
【0007】
前記領域は矩形の領域であり、前記領域特定部は、前記基準位置をもとに前記矩形の領域のあらかじめ決められた角の位置を特定し、この角の位置と前記領域のサイズ情報をもとに前記矩形の領域の全体の位置を求めるものであってもよい。
【0008】
本発明によれば、処理対象領域が帳票紙面において占める位置を、帳票様式から得られるパターンをもとに判定することができる。
【0009】
前記マークは、異なる回転角度では形状が一致しないパターンであってもよい。これにより、検出したマークの形状をもとに二次元空間での帳票画像の回転角度を判定し、帳票画像が正規の向きに対して回転した角度にある場合には回転補正を行うことができる。
【0010】
また、本発明の別の観点に基づく帳票様式作成装置は、処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部とを具備することを特徴とする。
【0011】
前記定義情報は、前記領域の位置およびサイズの情報を含むものであってもよい。
【0012】
また、本発明の帳票様式作成装置は、前記領域のサイズ情報を含む属性情報をライブラリとして記憶し、このライブラリとして記憶された前記領域の属性情報をユーザからの選択に応じて読み出し、新規の領域の作成のために再利用する領域情報再利用部をさらに具備するものとしてもよい。
【0013】
本発明の帳票様式作成装置によれば、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することができる。
【発明の効果】
【0014】
本発明によれば、処理対象領域が帳票紙面において占める位置を、帳票様式から得られる情報をもとに判定することができる。また、本発明の帳票様式作成装置によれば、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することができる。
【発明を実施するための最良の形態】
【0015】
以下、本発明の実施の形態を図面を用いて説明する。
【0016】
図1は本発明の実施形態である帳票処理装置によって読み取られる帳票の様式の例を示す図である。
【0017】
同図に示すように、この帳票1には、1以上の処理対象領域2(2−1,2−2,2−3)が設けられている。処理対象領域2とは、処理対象である文字(文字列)や画像などが記入される領域であり、後述する本実施形態の帳票処理装置によって文字認識や画像抽出などの処理が行われる対象の領域である。個々の処理対象領域2の近傍には、処理対象領域2の位置を特定するための基準位置を示すとともに、処理対象領域2のサイズ情報を少なくとも表現したパターンとして、基準位置マーク3(3−1,3−2,3−3)と属性情報パターン4(4−1,4−2,4−3)が配置されている。すなわち、帳票1には、個々の処理対象領域2(2−1,2−2,2−3)ごとに、基準位置マーク3(3−1,3−2,3−3)と属性情報パターン4(4−1,4−2,4−3)とからなるパターンが設けられている。ここで基準位置マーク3は、それぞれ近傍にある処理対象領域2および属性情報パターン4の帳票画像中の位置を特定するための基準位置を示すものである。属性情報パターン4は、処理対象領域2のサイズ情報を少なくとも表現したパターンである。
【0018】
図2は上記の基準位置マーク3と属性情報パターン4とからなるパターンの詳細を示している。
【0019】
基準位置マーク3は帳票画像の回転角度および基準位置を知るために最初に検出されるべきパターンであり、帳票処理装置が保有している標準パターンとのマッチングによって検出される。また、基準位置マーク3には、異なる回転角度では形状が一致しないパターンが採用されており、すなわち、二次元空間における基準位置マーク3の形状によって帳票画像の正規の向きを判定することができるパターンが採用されている。この実施形態では、たとえば、矩形(正方形)の領域を縦横均等に3×3の9個の領域に区分し、上記のパターン条件を満足するように、その中のいくつかを所定の色で塗り潰し、他の区分領域を白抜きとしたものが用いられている。
【0020】
この帳票1の様式の上記パターンにおいては、基準位置マーク3と属性情報パターン4との位置関係が規定されている。たとえば、基準位置マーク3の外接矩形3aの右下角P1から右に10mmオフセットした位置に属性情報パターン4の左下角P2があることが規定されている。上述したように基準位置マーク3には二次元空間における形状によって正規の向きを判定することができるパターンが採用されているので、基準位置マーク3の外接矩形3aの右下角P1とは、二次元空間において正規の向きに基準位置マーク3を配した場合の外接矩形の右下端を意味する。このように基準位置マーク3と属性情報パターン4との位置関係が規定されているので、基準位置マーク3の位置を基準に属性情報パターン4の位置を特定することができる。なお、基準位置マーク3は必ずしも本例のようなものに限らず、異なる回転角度では形状が一致しないパターンであればよい。また、基準位置マーク3と属性情報パターン4は必ずしも別々に設けられる必要はなく、たとえば、属性情報パターンが基準位置マークとしての機能を備えるものとしてもよい。
【0021】
属性情報パターン4は、等間隔に並んだそれぞれのビット記録領域4aの塗り潰しの有無によって二進数のビット値を表現したものである。たとえば、塗り潰されたビット記録領域4aのビット値を”1”、塗り潰されていないビット記録領域4aのビット値を”0”としている。なお、属性情報パターン4には、上記のほかに、バーコード、二次元コード、文字なども利用できる。また、これらを併用することも可能である。
【0022】
属性情報パターン4によって表現された処理対象領域2に関する属性情報としては、処理対象領域2の縦横のサイズ、記入内容の種別などがある。また、処理対象領域2に関する属性情報以外の情報、たとえば、様式の作成日時、作成者、関連する他の処理対象領域の識別子、その関連内容などを属性情報パターン4に含めるようにしてもよい。
【0023】
次に、基準位置マーク3と処理対象領域2との位置関係について説明する。
【0024】
本帳票1の様式においては、基準位置マーク3と処理対象領域2との位置関係が規定されている。たとえば、図2に示したように、基準位置マーク3の左下角P3から左に5mm、下に5mmの位置が処理対象領域2の左上角P4としてあらかじめ規定されている。基準位置マーク3は二次元空間における形状によって正規の向きを判定することのできるパターンであるため、基準位置マーク3の左下角P3とは、二次元空間において正規の向きに基準位置マーク3を配した場合の左下端を意味する。このように基準位置マーク3と処理対象領域2との位置関係が規定されているので、基準位置マーク3の特定の位置(左下角P3)を基準に処理対象領域2の特定の角(左上角P4)の位置を特定することができる。
【0025】
また、基準位置マーク3と処理対象領域2との位置関係を規定しておくのではなく、その位置関係を示す情報を属性情報として属性情報パターン4に付加しておき、この属性情報をもとに基準位置マーク3の位置を基準とする処理対象領域2の位置の特定を行うようにしてもよい。
【0026】
さらには、基準位置マーク3の位置を処理対象領域2の位置を特定するための基準とするのではなく、たとえば、図3に示すように、帳票1の左上角P5から処理対象領域2の左上角P6までの二軸方向の長さの値を属性情報パターン4に付加しておき、この情報をもとに、処理対象領域2の位置を特定するようにしてもよい。図3の例では、申請者の名前が記入される処理対象領域2(2−1)について、帳票1の左上角P5から右へ10mm、下へ30mmの位置がその処理対象領域2の左上角P6としている。他の処理対象領域2(2−2,2−3)についても同様である。
【0027】
次に、たとえば図4に示すように、一つの属性情報パターン4で複数の処理対象領域2(2−11,2−12,2−13,2−14,2−15)の属性情報を表現する方法について説明する。
【0028】
図5は一つの属性情報パターン4で表現された複数の処理対象領域2の属性情報を表形式で示した図である。実際には、この表の中の点線で囲まれた部分の情報(領域数、処理対象領域ごとの属性情報)が属性情報パターン4によって表現される。このように、複数の処理対象領域2(2−11,2−12,2−13,2−14,2−15)それぞれの、縦横のサイズ、記入内容の種別、基準位置マーク3の左下角P3の位置に対する左上角P11,P12,P13,P14,P15の位置の縦横のオフセット値(単位:mm)が一つの属性情報パターン4で表現されている。これにより、帳票処理装置では、一つの属性情報パターン4を検出してこれを認識すれば、複数の処理対象領域2の位置をそれぞれ特定することができ、処理の高速化を図ることができる。
【0029】
また、属性情報パターン4によって表現される情報に、他の処理対象領域2を特定する情報(識別番号、座標)を加えてもよい。たとえば、漢字とそのフリガナが別々に記入される複数の処理対象領域がある場合に、それぞれの処理対象領域に付随する属性情報パターンに、他方の処理対象領域を特定する情報を付加する。これによって帳票処理装置にて帳票が処理される際に、漢字とフリガナのそれぞれの文字認識結果を突き合わせて、文字認識結果の妥当性をチェックしたり、修正したりすることが可能になる。また、金額とその小計・合計が記入される複数の処理対象領域についても、関連する他の処理対象領域を特定する情報を属性情報パターンに追加しておくことによって、帳票処理装置にて帳票が処理される際に、金額の小計・合計のチェックを行うことができる。
【0030】
次に、帳票様式におけるパターンの変形例を説明する。
【0031】
図6は帳票様式におけるパターンの別の表現方法を示す図であり、処理対象領域の境界の罫線6に基準位置マーク3および属性情報パターン4を埋め込んだものである。
【0032】
ここで、基準位置マーク3は、縦と横の2本の罫線6,6の交点とこの交点から縦横それぞれの罫線6,6の切れ目6a,6b,6cまでの距離によって特徴付けられている。本例では、罫線6,6の交点から上に1mmの位置、左に1mmの位置、下に2mmの位置にそれぞれ罫線6の切れ目6a,6b,6cを設けたパターンを基準位置マーク3としている。
【0033】
一方、属性情報パターン4は横の罫線6の切れ目6dの配置によって表現されている。すなわち、横の罫線6に沿って等間隔に並んだそれぞれのビット記録領域61内での切れ目6dの有無で二進数のビット値が表現されている。たとえば、切れ目有りのビット記録領域61のビット値を”0”、切れ目無しのビット記録領域61のビット値を”1”としている。
【0034】
このようなパターンを採用することで、基準位置マーク3および属性情報パターン4のための専用の画像を用いることなく、帳票様式に基準位置マーク3および属性情報パターン4を含むパターンを付加することができる。
【0035】
次に、上記の帳票1を処理する帳票処理装置について説明する。
【0036】
本実施形態の帳票処理装置は、たとえば、CPU、記憶装置(ROM、RAM)、入力装置(キーボード、マウスなど)、表示装置などを含む典型的なコンピュータのハードウェア資源と、帳票処理のためのプログラムなどのソフトウェア資源とで構成される。あるいは、通信媒体を通じて接続された複数のコンピュータ上で帳票処理のためのプログラムによる処理を分散して行う構成としてもよい。あるいは、帳票処理の一部または全てを専用のハードウェアに置き換えて実現するようにしてもよい。本実施形態の帳票処理装置は、コンピュータに接続されたスキャナ装置(画像取り込み装置)によって読み込まれた帳票の画像を入力して処理するものであってもよいし、外部のスキャナ装置によって読み込まれた帳票の画像を伝送媒体や記憶媒体を通じて取り込んで処理するものであってもよい。
【0037】
図7は本実施形態の帳票処理装置の構成を示す機能ブロック図である。
【0038】
同図に示すように、本実施形態の帳票処理装置10は、帳票画像入力部11、記憶部12、処理対象領域特定部13、領域処理部14を有している。以上の各部は、コンピュータとこれを機能させるプログラムによって実現されている。
【0039】
帳票画像入力部11は、たとえばコンピュータに接続されたスキャナ装置によって読み込まれた帳票画像のデータ、あるいは伝送媒体や記憶媒体を通じて取得した帳票画像のデータを入力してRAMなどの記憶部12に記憶する部分である。
【0040】
処理対象領域特定部13は、記憶部12に記憶された帳票画像中のパターンを認識して帳票画像中の処理対象領域2の位置を特定する部分である。処理対象領域特定部13は、より具体的には、基準位置マーク検出部131、属性情報パターン認識部132、領域特定部133を備えている。ここで、基準位置マーク検出部131と属性情報パターン認識部132は、本発明のパターン認識部に相当する。基準位置マーク検出部131は、帳票画像の中からパターンにおける基準位置マーク3を検出する部分である。属性情報パターン認識部132は、基準位置マーク3と属性情報パターン4との間であらかじめ規定された位置関係をもとに、基準位置マーク検出部131により検出された基準位置マーク3の位置を基準に属性情報パターン4の位置を判定し、この属性情報パターン4を認識して処理対象領域2に関する属性情報を取得する部分である。基準位置マーク3と処理対象領域2との二軸方向の距離は一律に決められてので、領域特定部133は、基準位置マーク検出部131により検出された基準位置マーク3の位置と、属性情報パターン認識部132により得られた処理対象領域2に関する属性情報に含まれる当該処理対象領域のサイズ情報とから処理対象領域2の位置を特定することができる。
【0041】
領域処理部14は、処理対象領域特定部13によって判定された処理対象領域2の画像情報に対する所定の情報処理、たとえば文字認識処理や画像抽出処理などを行う部分である。
【0042】
次に、本実施形態の帳票処理装置10の動作を説明する。図8はこの動作の流れを示すフローチャートである。
【0043】
まず、帳票画像入力部11は図1および図2に示した様式を有する帳票画像を入力して記憶部12に記憶する(ステップS501)。次に、処理対象領域特定部13は、まず基準位置マーク検出部131にて、記憶部12に記憶された帳票画像中のパターンから基準位置マーク3を検出する(ステップS502)。ここで、基準位置マーク3には、異なる回転角度では形状が一致しないパターンが採用されている。したがって、処理対象領域特定部13は、検出した基準位置マーク3の形状をもとに二次元空間での帳票画像の回転角度を判定し、帳票画像が正規の向きに対して回転した角度にある場合には回転補正を行う。なお、この帳票画像の回転補正は、入力される帳票画像が回転補正された状態で入力される場合には無条件にスキップされる。
【0044】
次に、属性情報パターン認識部132は、記憶部12に記憶された帳票画像について、基準位置マーク3の位置を基準に属性情報パターン4の位置を特定する(ステップS503)。すなわち、属性情報パターン認識部132は、図2に示したように、基準位置マーク3の外接矩形3aの右下端P1から右に10mmオフセットした位置を属性情報パターン4の左下端P2として属性情報パターン4の位置を特定する。属性情報パターン4の左下端P2が分かれば属性情報パターン4の全体の位置を特定できる。属性情報パターン認識部132は、属性情報パターン4の位置を特定した後、属性情報パターン4を認識して処理対象領域に関する属性情報を取得して(ステップS504)、処理対象領域特定部13へ出力する。
【0045】
次に、処理対象領域特定部13は、基準位置マーク検出部131により検出された基準位置マーク3の位置と、属性情報パターン認識部132より取得した処理対象領域2に関する属性情報の中の処理対象領域2のサイズ情報とをもとに、帳票画像中の処理対象領域2の位置を判定して(ステップS505)、この判定結果を領域処理部14へ通知する。すなわち、本例では、図2に示したように、基準位置マーク3の左下端P3から左に5mm、下に5mmの位置が処理対象領域2の左上端P4として規定されているので、処理対象領域特定部13は、まずその処理対象領域2の左上端P4の座標を求める。続いて、処理対象領域特定部13は、この処理対象領域2の左上端P4の座標と、属性情報パターン認識部132より取得した処理対象領域2に関する属性情報の中の処理対象領域2のサイズ情報をもとに処理対象領域2の全体の位置を求める。そして処理対象領域特定部13は、求めた処理対象領域全体の座標位置を領域処理部14へ通知する。
【0046】
領域処理部14は、処理対象領域特定部13にて判定された処理対象領域2内の帳票画像について文字認識、画像抽出などの処理を行い(ステップS506)、その結果を出力する。
【0047】
以上の処理は、帳票1に存在するすべての処理対象領域2について繰り返される(ステップS507)。
【0048】
以上説明したように、本実施形態の帳票処理装置10によれば、帳票紙面において処理対象領域2が占める全体の位置を、帳票1の様式から得られる情報をもとに求めることができる。これにより、帳票1に様々なサイズの処理対象領域を混在させても、帳票処理装置10では個々の処理対象領域を正しく判断してそれぞれの領域内の画像情報に対する文字認識などの処理を行うことができる。
【0049】
次に、本実施形態の帳票様式を作成する装置について説明する。
【0050】
本実施形態の帳票様式作成装置は、たとえば、CPU、記憶装置(ROM、RAMなど)、入力装置(キーボード、マウスなど)、表示装置などを含む典型的なコンピュータのハードウェア資源と、帳票様式作成処理のためのプログラムなどのソフトウェア資源とで構成される。通信媒体を通じて接続された複数のコンピュータ上で帳票処理のためのプログラムによる処理を分散して行う構成としてもよい。あるいは、帳票処理の一部または全てを専用のハードウェアに置き換えて実現するようにしてもよい。本実施形態の帳票様式作成装置によって作成された帳票様式のデータは、コンピュータに接続された記録装置によって、着脱自在な記憶媒体に記録することが可能である。あるいは、伝送媒体を通じて他のコンピュータに伝送することも可能である。
【0051】
図9は本実施形態の帳票様式作成装置の構成を示す機能ブロック図である。
【0052】
本実施形態の帳票様式作成装置20は、ユーザによって作成された処理対象領域の定義情報を取得する領域指定部21と、領域指定部21にて取得された処理対象領域の定義情報をもとに当該処理対象領域を生成する領域生成部22と、処理対象領域の定義情報をもとに基準位置マークおよび属性情報パターンを含むパターンを生成するパターン生成部23と、領域生成部22にて生成された処理対象領域とパターン生成部23にて生成されたパターンとを組み合わせた帳票様式データを生成する様式データ生成部24と、様式データ生成部24にて生成された帳票様式データを汎用的なコンピュータとオペレーティングシステム上で印刷可能な形式のデータ(画像データ、ベクトルデータなど)に変換して出力する帳票様式データ出力部25とを備えている。
【0053】
次に、本実施形態の帳票様式作成装置20の動作を詳細を説明する。
【0054】
まず、ユーザによって作成された処理対象領域の定義情報を領域指定部21にて取得する。処理対象領域の定義情報は、表題、位置、サイズ、記入内容の種別などからなる。ユーザによって作成された処理対象領域の定義情報を取得する方法としては、たとえば、処理対象領域の定義情報をテキストデータの形式で記述したファイルをユーザに作成させ、そのテキストファイルを読み込むことによって行う方法などがある。
【0055】
図10は処理対象領域の定義情報が記述されたテキストファイルの例である。このテキストファイルでは、行の単位で個々の処理対象領域の定義情報31,32,33が記述される。たとえば処理対象領域の定義情報31において、「申請者」は表題、「10,30」は位置、「90,25」はサイズ、「氏名」は記入内容の種別を意味する。ここで、位置は、図3に示したように、帳票1の左上角P5から処理対象領域2の左上角P6までの二軸(Y軸,X軸)方向のオフセット値(単位:mm)である。サイズは二軸(Y軸,X軸)方向それぞれの長さ(単位:mm)である。
【0056】
また、処理対象領域の定義情報を入力には、次のようなGUI(グラフィカル・ユーザ・インターフェース)を利用してもよい。
【0057】
図11は処理対象領域の表題および記入内容の種別をユーザに指定させるためのGUIであるウィンドウ(ダイアログボックス)34の例である。このウィンドウ34には、処理対象領域の表題を入力可能なテキストボックス35と、記入内容の種別をプルダウンメニュー36の中から指定できるプルダウンボックス37とが設けられている。図12は処理対象領域2の位置とサイズをユーザに指定させるためのGUIである様式編集画面38の例である。この様式編集画面38でユーザはマウスなどの入力装置を操作することによってマウスカーソルを移動させて、処理対象領域2の位置とサイズを指定することができる。領域指定部21は、これらのGUIでユーザによって指定された処理対象領域の表題、記入内容の種別、位置、サイズを取得する。
【0058】
次に、領域生成部22は、領域指定部21にて取得された処理対象領域の定義情報をもとに、処理対象領域を生成して表示装置の画面に描画する。図13は図10に示した処理対象領域の定義情報をもとに3つの処理対象領域2(2−1,2−2,2−3)を生成した結果を示している。この際、各々の処理対象領域2(2−1,2−2,2−3)に対して表題5(5−1,5−2,5−3)が同時に付加される。
【0059】
次に、パターン生成部23は、処理対象領域の定義情報をもとに基準位置マーク3および属性情報パターン4を含むパターンを生成する。ここで、基準位置マーク3と処理対象領域2との位置関係は固定で規定されているので、処理対象領域2の位置をもとに基準位置マーク3の位置が決定される。また、基準位置マーク3の位置が決まれば、この基準位置マーク3との位置関係が固定で規定されている属性情報パターン4の位置も決まる。これにより、図14に示すように、図13に示した処理対象領域2(2−1,2−2,2−3)と、基準位置マーク3(3−1,3−2,3−3)および属性情報パターン4(4−1,4−2,4−3)を含むパターンとを合成した帳票様式が得られる。
【0060】
次に、帳票様式作成装置の別の実施形態を説明する。
【0061】
図15は本実施形態の帳票様式作成装置30の構成を示す機能ブロック図である。
【0062】
同図に示すように、本実施形態の帳票様式作成装置30は、図9に示した帳票様式作成装置20に領域情報再利用部26を加えたものである。その他の構成は図9に示した帳票様式作成装置20と同じである。領域情報再利用部26は、既に作成された帳票様式データを再利用して領域指定部21に対して新たに作成する処理対象領域の定義情報を提供するものである。
【0063】
次に、この領域情報再利用部26の具体的な機能について説明する。
【0064】
領域情報再利用部26は、既に作成された帳票様式データを取り込んで表示装置の画面にテンプレートとして表示させる。ここでユーザは、図16に示すように、表示装置の画面に表示された帳票様式の中の所望の処理対象領域2をマウス操作などによって選択することができる。所望の処理対象領域2が選択された状態でマウスの右クリック操作などが行われると、図17に示すように、選択された処理対象領域2に対して実施することの可能な処理コマンドのメニュー41が現れる。このメニュー41の中で所望の処理コマンドの実行がユーザによって指定されると、領域情報再利用部26はその指定された処理コマンドを実行する。
【0065】
メニュー41の中の「コピー」の実行が指定された場合、領域情報再利用部26は、図18に示すように、その処理対象領域2のコピーをユーザによって指定された場所に新しい処理対象領域42として追加する。これにより、処理対象領域2の表題、サイズ、記入内容の種別が同一の処理対象領域42が追加され、2つの処理対象領域2、42に関す定義情報が作成されたことになる。メニュー41の中の「削除」の実行が指定された場合には、領域情報再利用部26は選択状態にある処理対象領域を削除する。
【0066】
メニュー41の中の「属性変更」の実行が指定された場合には、領域情報再利用部26は、選択状態にある処理対象領域に関する属性情報(記入内容の種別、サイズなど)の変更内容を設定するためのダイアログボックスを表示して、このダイアログボックスにおいてユーザより入力された変更内容で、当該処理対象領域に関する属性情報の変更を行う。
【0067】
メニュー41の中の「ライブラリに追加」の実行が指定された場合、領域情報再利用部26は、選択状態にある処理対象領域に関する表題、サイズ、記入内容の種別をライブラリに登録する。ここで、ライブラリとは、再利用可能な処理対象領域に関する表題、サイズ、記入内容の種別を読み出し可能なように蓄積するデータベースである。このライブラリは、たとえばコンピュータに接続されたハードディスクドライブなどの外部記憶装置に格納されている。
【0068】
領域情報再利用部26には、ライブラリの内容を表示するコマンドが用意されている。ユーザによりこのコマンドの実行が指定された場合、領域情報再利用部26はライブラリに登録されているすべての処理対象領域に関する情報を表示装置に表示させる。図19はこのライブラリの登録情報の表示例を示す図である。ユーザは、このようなライブラリの登録情報の中から、所望の処理対象領域に関する情報を再利用の対象として選択することができる。
【0069】
また、このライブラリにおいては、処理対象領域に関する情報の一部が未定義であっても登録が許されている。たとえば、図20に示す例においては、処理対象領域のサイズと記入内容の種別がライブラリに登録されているものの、表題が登録されておらず未定義である。領域情報再利用部26は、ライブラリから未定義の情報を含む処理対象領域に関する情報がユーザによって選択された場合には、図21に示すように、ダイアログボックス43を表示して、その未定義の情報をユーザに埋めさせることができる。図19および図20の例では、表題が未指定である場合について示したが、縦横のサイズや記入内容の種別の場合も同様である。
【0070】
なお、上記の領域情報再利用部26の説明では、既存の帳票様式データからライブラリに登録する処理対象領域に関する情報をユーザが指定することとしたが、ライブラリにはいくつかの処理対象領域に関する情報がデフォルトで登録されていてもよい。
【0071】
本発明は、上述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
【図面の簡単な説明】
【0072】
【図1】本発明の実施形態にかかる帳票の様式の例を示す図である。
【図2】図1の帳票様式上のパターンの詳細を示す図である。
【図3】基準位置マークと処理対象領域との位置関係の例を示す図である。
【図4】一つの属性情報パターンで複数の処理対象領域の属性情報を表現する方法を示す図である。
【図5】一つの属性情報パターンで表現された複数の処理対象領域の属性情報を表形式で示す図である。
【図6】帳票様式におけるパターンの別の表現方法を示す図である。
【図7】本発明の実施形態にかかる帳票処理装置の機能ブロック図である。
【図8】図7の帳票処理装置の動作を説明するフローチャートである。
【図9】本発明の実施形態にかかる帳票様式作成装置の機能ブロック図である。
【図10】処理対象領域の定義情報が記述されたテキストファイルの例を示す図である。
【図11】処理対象領域の表題および記入内容の種別をユーザに指定させるためのGUIを示す図である。
【図12】処理対象領域の位置とサイズをユーザに指定させるためのGUIを示す図である。
【図13】図10の定義情報に基づいて生成された処理対象領域を示す図である。
【図14】図10の定義情報に基づいて生成された帳票様式を示す図である。
【図15】本発明の別の実施形態にかかる帳票様式作成装置の構成を示す機能ブロック図である。
【図16】領域情報再利用部の機能である処理対象領域の選択を説明するための図である。
【図17】領域情報再利用部の機能である処理コマンドのメニュー表示を示す図である。
【図18】領域情報再利用部の機能である処理対象領域のコピー処理を示す図である。
【図19】ライブラリの登録情報の表示例を示す図である。
【図20】未定義の情報を含むライブラリの登録情報の例を示す図である。
【図21】未定義の情報をユーザに埋めさせるGUIを示す図である。
【符号の説明】
【0073】
1…帳票、2…処理対象領域、3…基準位置マーク、4…属性情報パターン、10…帳票処理装置、11…帳票画像入力部、12…記憶部、13…処理対象領域特定部、14…領域処理部、20…帳票様式作成装置、21…領域指定部、22…領域生成部、23…パターン生成部、24…様式データ生成部、25…帳票様式データ出力部、26…領域情報再利用部、131…基準位置マーク検出部、132…属性情報パターン認識部、133…領域特定部。
【技術分野】
【0001】
本発明は、帳票の紙面において処理対象の情報が配置された領域を検出して、その領域内の情報に対して文字認識などの処理を行う帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラムに関する。
【背景技術】
【0002】
帳票処理装置は、帳票の紙面の画像(以下「帳票画像」と記述)において、処理対象である文字などの情報がどこの領域に配置されているかを判定し、その領域(以下「処理対象領域」と記述)の画像情報を対して文字認識などの処理を行っている。
【0003】
帳票画像の中の処理対象領域を判定する手段としては、処理対象領域に対して一定の関係をもつ位置にパターン識別が容易なマークを配置しておき、検出されたマークの位置を基準に処理対象領域の位置を判定する方法が知られている。たとえば、特許文献1においては、処理対象領域が存在する行の位置を特定のマークによって表す方式が開示されている。
【特許文献1】特開2001−195541号公報(段落0013、図2)
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、検出されたマークの位置から処理対象領域の位置を特定する方法では、処理対象領域のサイズが帳票処理装置にとって不明である場合に、その処理対象領域が帳票紙面において占める位置情報までは得られない。したがって、帳票上にサイズの異なる複数の処理対象領域が混在し、それぞれの処理対象領域を判定してその中の画像に対して文字認識などを行う運用を考えた場合、それぞれの処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式が求められる。
【0005】
本発明は、かかる事情を鑑み、処理対象領域が帳票紙面において占める位置を帳票様式から得られる情報をもとに判定することのできる帳票処理装置、さらには、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することのできる帳票様式作成装置、さらには、その帳票、帳票処理用のプログラム、帳票様式作成用のプログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
上記の目的を達成するために、本発明の帳票処理装置は、処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部とを具備することを特徴とする。
【0007】
前記領域は矩形の領域であり、前記領域特定部は、前記基準位置をもとに前記矩形の領域のあらかじめ決められた角の位置を特定し、この角の位置と前記領域のサイズ情報をもとに前記矩形の領域の全体の位置を求めるものであってもよい。
【0008】
本発明によれば、処理対象領域が帳票紙面において占める位置を、帳票様式から得られるパターンをもとに判定することができる。
【0009】
前記マークは、異なる回転角度では形状が一致しないパターンであってもよい。これにより、検出したマークの形状をもとに二次元空間での帳票画像の回転角度を判定し、帳票画像が正規の向きに対して回転した角度にある場合には回転補正を行うことができる。
【0010】
また、本発明の別の観点に基づく帳票様式作成装置は、処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部とを具備することを特徴とする。
【0011】
前記定義情報は、前記領域の位置およびサイズの情報を含むものであってもよい。
【0012】
また、本発明の帳票様式作成装置は、前記領域のサイズ情報を含む属性情報をライブラリとして記憶し、このライブラリとして記憶された前記領域の属性情報をユーザからの選択に応じて読み出し、新規の領域の作成のために再利用する領域情報再利用部をさらに具備するものとしてもよい。
【0013】
本発明の帳票様式作成装置によれば、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することができる。
【発明の効果】
【0014】
本発明によれば、処理対象領域が帳票紙面において占める位置を、帳票様式から得られる情報をもとに判定することができる。また、本発明の帳票様式作成装置によれば、処理対象領域が帳票紙面において占める位置の情報を帳票処理装置の側で取得できるような帳票様式を容易に作成することができる。
【発明を実施するための最良の形態】
【0015】
以下、本発明の実施の形態を図面を用いて説明する。
【0016】
図1は本発明の実施形態である帳票処理装置によって読み取られる帳票の様式の例を示す図である。
【0017】
同図に示すように、この帳票1には、1以上の処理対象領域2(2−1,2−2,2−3)が設けられている。処理対象領域2とは、処理対象である文字(文字列)や画像などが記入される領域であり、後述する本実施形態の帳票処理装置によって文字認識や画像抽出などの処理が行われる対象の領域である。個々の処理対象領域2の近傍には、処理対象領域2の位置を特定するための基準位置を示すとともに、処理対象領域2のサイズ情報を少なくとも表現したパターンとして、基準位置マーク3(3−1,3−2,3−3)と属性情報パターン4(4−1,4−2,4−3)が配置されている。すなわち、帳票1には、個々の処理対象領域2(2−1,2−2,2−3)ごとに、基準位置マーク3(3−1,3−2,3−3)と属性情報パターン4(4−1,4−2,4−3)とからなるパターンが設けられている。ここで基準位置マーク3は、それぞれ近傍にある処理対象領域2および属性情報パターン4の帳票画像中の位置を特定するための基準位置を示すものである。属性情報パターン4は、処理対象領域2のサイズ情報を少なくとも表現したパターンである。
【0018】
図2は上記の基準位置マーク3と属性情報パターン4とからなるパターンの詳細を示している。
【0019】
基準位置マーク3は帳票画像の回転角度および基準位置を知るために最初に検出されるべきパターンであり、帳票処理装置が保有している標準パターンとのマッチングによって検出される。また、基準位置マーク3には、異なる回転角度では形状が一致しないパターンが採用されており、すなわち、二次元空間における基準位置マーク3の形状によって帳票画像の正規の向きを判定することができるパターンが採用されている。この実施形態では、たとえば、矩形(正方形)の領域を縦横均等に3×3の9個の領域に区分し、上記のパターン条件を満足するように、その中のいくつかを所定の色で塗り潰し、他の区分領域を白抜きとしたものが用いられている。
【0020】
この帳票1の様式の上記パターンにおいては、基準位置マーク3と属性情報パターン4との位置関係が規定されている。たとえば、基準位置マーク3の外接矩形3aの右下角P1から右に10mmオフセットした位置に属性情報パターン4の左下角P2があることが規定されている。上述したように基準位置マーク3には二次元空間における形状によって正規の向きを判定することができるパターンが採用されているので、基準位置マーク3の外接矩形3aの右下角P1とは、二次元空間において正規の向きに基準位置マーク3を配した場合の外接矩形の右下端を意味する。このように基準位置マーク3と属性情報パターン4との位置関係が規定されているので、基準位置マーク3の位置を基準に属性情報パターン4の位置を特定することができる。なお、基準位置マーク3は必ずしも本例のようなものに限らず、異なる回転角度では形状が一致しないパターンであればよい。また、基準位置マーク3と属性情報パターン4は必ずしも別々に設けられる必要はなく、たとえば、属性情報パターンが基準位置マークとしての機能を備えるものとしてもよい。
【0021】
属性情報パターン4は、等間隔に並んだそれぞれのビット記録領域4aの塗り潰しの有無によって二進数のビット値を表現したものである。たとえば、塗り潰されたビット記録領域4aのビット値を”1”、塗り潰されていないビット記録領域4aのビット値を”0”としている。なお、属性情報パターン4には、上記のほかに、バーコード、二次元コード、文字なども利用できる。また、これらを併用することも可能である。
【0022】
属性情報パターン4によって表現された処理対象領域2に関する属性情報としては、処理対象領域2の縦横のサイズ、記入内容の種別などがある。また、処理対象領域2に関する属性情報以外の情報、たとえば、様式の作成日時、作成者、関連する他の処理対象領域の識別子、その関連内容などを属性情報パターン4に含めるようにしてもよい。
【0023】
次に、基準位置マーク3と処理対象領域2との位置関係について説明する。
【0024】
本帳票1の様式においては、基準位置マーク3と処理対象領域2との位置関係が規定されている。たとえば、図2に示したように、基準位置マーク3の左下角P3から左に5mm、下に5mmの位置が処理対象領域2の左上角P4としてあらかじめ規定されている。基準位置マーク3は二次元空間における形状によって正規の向きを判定することのできるパターンであるため、基準位置マーク3の左下角P3とは、二次元空間において正規の向きに基準位置マーク3を配した場合の左下端を意味する。このように基準位置マーク3と処理対象領域2との位置関係が規定されているので、基準位置マーク3の特定の位置(左下角P3)を基準に処理対象領域2の特定の角(左上角P4)の位置を特定することができる。
【0025】
また、基準位置マーク3と処理対象領域2との位置関係を規定しておくのではなく、その位置関係を示す情報を属性情報として属性情報パターン4に付加しておき、この属性情報をもとに基準位置マーク3の位置を基準とする処理対象領域2の位置の特定を行うようにしてもよい。
【0026】
さらには、基準位置マーク3の位置を処理対象領域2の位置を特定するための基準とするのではなく、たとえば、図3に示すように、帳票1の左上角P5から処理対象領域2の左上角P6までの二軸方向の長さの値を属性情報パターン4に付加しておき、この情報をもとに、処理対象領域2の位置を特定するようにしてもよい。図3の例では、申請者の名前が記入される処理対象領域2(2−1)について、帳票1の左上角P5から右へ10mm、下へ30mmの位置がその処理対象領域2の左上角P6としている。他の処理対象領域2(2−2,2−3)についても同様である。
【0027】
次に、たとえば図4に示すように、一つの属性情報パターン4で複数の処理対象領域2(2−11,2−12,2−13,2−14,2−15)の属性情報を表現する方法について説明する。
【0028】
図5は一つの属性情報パターン4で表現された複数の処理対象領域2の属性情報を表形式で示した図である。実際には、この表の中の点線で囲まれた部分の情報(領域数、処理対象領域ごとの属性情報)が属性情報パターン4によって表現される。このように、複数の処理対象領域2(2−11,2−12,2−13,2−14,2−15)それぞれの、縦横のサイズ、記入内容の種別、基準位置マーク3の左下角P3の位置に対する左上角P11,P12,P13,P14,P15の位置の縦横のオフセット値(単位:mm)が一つの属性情報パターン4で表現されている。これにより、帳票処理装置では、一つの属性情報パターン4を検出してこれを認識すれば、複数の処理対象領域2の位置をそれぞれ特定することができ、処理の高速化を図ることができる。
【0029】
また、属性情報パターン4によって表現される情報に、他の処理対象領域2を特定する情報(識別番号、座標)を加えてもよい。たとえば、漢字とそのフリガナが別々に記入される複数の処理対象領域がある場合に、それぞれの処理対象領域に付随する属性情報パターンに、他方の処理対象領域を特定する情報を付加する。これによって帳票処理装置にて帳票が処理される際に、漢字とフリガナのそれぞれの文字認識結果を突き合わせて、文字認識結果の妥当性をチェックしたり、修正したりすることが可能になる。また、金額とその小計・合計が記入される複数の処理対象領域についても、関連する他の処理対象領域を特定する情報を属性情報パターンに追加しておくことによって、帳票処理装置にて帳票が処理される際に、金額の小計・合計のチェックを行うことができる。
【0030】
次に、帳票様式におけるパターンの変形例を説明する。
【0031】
図6は帳票様式におけるパターンの別の表現方法を示す図であり、処理対象領域の境界の罫線6に基準位置マーク3および属性情報パターン4を埋め込んだものである。
【0032】
ここで、基準位置マーク3は、縦と横の2本の罫線6,6の交点とこの交点から縦横それぞれの罫線6,6の切れ目6a,6b,6cまでの距離によって特徴付けられている。本例では、罫線6,6の交点から上に1mmの位置、左に1mmの位置、下に2mmの位置にそれぞれ罫線6の切れ目6a,6b,6cを設けたパターンを基準位置マーク3としている。
【0033】
一方、属性情報パターン4は横の罫線6の切れ目6dの配置によって表現されている。すなわち、横の罫線6に沿って等間隔に並んだそれぞれのビット記録領域61内での切れ目6dの有無で二進数のビット値が表現されている。たとえば、切れ目有りのビット記録領域61のビット値を”0”、切れ目無しのビット記録領域61のビット値を”1”としている。
【0034】
このようなパターンを採用することで、基準位置マーク3および属性情報パターン4のための専用の画像を用いることなく、帳票様式に基準位置マーク3および属性情報パターン4を含むパターンを付加することができる。
【0035】
次に、上記の帳票1を処理する帳票処理装置について説明する。
【0036】
本実施形態の帳票処理装置は、たとえば、CPU、記憶装置(ROM、RAM)、入力装置(キーボード、マウスなど)、表示装置などを含む典型的なコンピュータのハードウェア資源と、帳票処理のためのプログラムなどのソフトウェア資源とで構成される。あるいは、通信媒体を通じて接続された複数のコンピュータ上で帳票処理のためのプログラムによる処理を分散して行う構成としてもよい。あるいは、帳票処理の一部または全てを専用のハードウェアに置き換えて実現するようにしてもよい。本実施形態の帳票処理装置は、コンピュータに接続されたスキャナ装置(画像取り込み装置)によって読み込まれた帳票の画像を入力して処理するものであってもよいし、外部のスキャナ装置によって読み込まれた帳票の画像を伝送媒体や記憶媒体を通じて取り込んで処理するものであってもよい。
【0037】
図7は本実施形態の帳票処理装置の構成を示す機能ブロック図である。
【0038】
同図に示すように、本実施形態の帳票処理装置10は、帳票画像入力部11、記憶部12、処理対象領域特定部13、領域処理部14を有している。以上の各部は、コンピュータとこれを機能させるプログラムによって実現されている。
【0039】
帳票画像入力部11は、たとえばコンピュータに接続されたスキャナ装置によって読み込まれた帳票画像のデータ、あるいは伝送媒体や記憶媒体を通じて取得した帳票画像のデータを入力してRAMなどの記憶部12に記憶する部分である。
【0040】
処理対象領域特定部13は、記憶部12に記憶された帳票画像中のパターンを認識して帳票画像中の処理対象領域2の位置を特定する部分である。処理対象領域特定部13は、より具体的には、基準位置マーク検出部131、属性情報パターン認識部132、領域特定部133を備えている。ここで、基準位置マーク検出部131と属性情報パターン認識部132は、本発明のパターン認識部に相当する。基準位置マーク検出部131は、帳票画像の中からパターンにおける基準位置マーク3を検出する部分である。属性情報パターン認識部132は、基準位置マーク3と属性情報パターン4との間であらかじめ規定された位置関係をもとに、基準位置マーク検出部131により検出された基準位置マーク3の位置を基準に属性情報パターン4の位置を判定し、この属性情報パターン4を認識して処理対象領域2に関する属性情報を取得する部分である。基準位置マーク3と処理対象領域2との二軸方向の距離は一律に決められてので、領域特定部133は、基準位置マーク検出部131により検出された基準位置マーク3の位置と、属性情報パターン認識部132により得られた処理対象領域2に関する属性情報に含まれる当該処理対象領域のサイズ情報とから処理対象領域2の位置を特定することができる。
【0041】
領域処理部14は、処理対象領域特定部13によって判定された処理対象領域2の画像情報に対する所定の情報処理、たとえば文字認識処理や画像抽出処理などを行う部分である。
【0042】
次に、本実施形態の帳票処理装置10の動作を説明する。図8はこの動作の流れを示すフローチャートである。
【0043】
まず、帳票画像入力部11は図1および図2に示した様式を有する帳票画像を入力して記憶部12に記憶する(ステップS501)。次に、処理対象領域特定部13は、まず基準位置マーク検出部131にて、記憶部12に記憶された帳票画像中のパターンから基準位置マーク3を検出する(ステップS502)。ここで、基準位置マーク3には、異なる回転角度では形状が一致しないパターンが採用されている。したがって、処理対象領域特定部13は、検出した基準位置マーク3の形状をもとに二次元空間での帳票画像の回転角度を判定し、帳票画像が正規の向きに対して回転した角度にある場合には回転補正を行う。なお、この帳票画像の回転補正は、入力される帳票画像が回転補正された状態で入力される場合には無条件にスキップされる。
【0044】
次に、属性情報パターン認識部132は、記憶部12に記憶された帳票画像について、基準位置マーク3の位置を基準に属性情報パターン4の位置を特定する(ステップS503)。すなわち、属性情報パターン認識部132は、図2に示したように、基準位置マーク3の外接矩形3aの右下端P1から右に10mmオフセットした位置を属性情報パターン4の左下端P2として属性情報パターン4の位置を特定する。属性情報パターン4の左下端P2が分かれば属性情報パターン4の全体の位置を特定できる。属性情報パターン認識部132は、属性情報パターン4の位置を特定した後、属性情報パターン4を認識して処理対象領域に関する属性情報を取得して(ステップS504)、処理対象領域特定部13へ出力する。
【0045】
次に、処理対象領域特定部13は、基準位置マーク検出部131により検出された基準位置マーク3の位置と、属性情報パターン認識部132より取得した処理対象領域2に関する属性情報の中の処理対象領域2のサイズ情報とをもとに、帳票画像中の処理対象領域2の位置を判定して(ステップS505)、この判定結果を領域処理部14へ通知する。すなわち、本例では、図2に示したように、基準位置マーク3の左下端P3から左に5mm、下に5mmの位置が処理対象領域2の左上端P4として規定されているので、処理対象領域特定部13は、まずその処理対象領域2の左上端P4の座標を求める。続いて、処理対象領域特定部13は、この処理対象領域2の左上端P4の座標と、属性情報パターン認識部132より取得した処理対象領域2に関する属性情報の中の処理対象領域2のサイズ情報をもとに処理対象領域2の全体の位置を求める。そして処理対象領域特定部13は、求めた処理対象領域全体の座標位置を領域処理部14へ通知する。
【0046】
領域処理部14は、処理対象領域特定部13にて判定された処理対象領域2内の帳票画像について文字認識、画像抽出などの処理を行い(ステップS506)、その結果を出力する。
【0047】
以上の処理は、帳票1に存在するすべての処理対象領域2について繰り返される(ステップS507)。
【0048】
以上説明したように、本実施形態の帳票処理装置10によれば、帳票紙面において処理対象領域2が占める全体の位置を、帳票1の様式から得られる情報をもとに求めることができる。これにより、帳票1に様々なサイズの処理対象領域を混在させても、帳票処理装置10では個々の処理対象領域を正しく判断してそれぞれの領域内の画像情報に対する文字認識などの処理を行うことができる。
【0049】
次に、本実施形態の帳票様式を作成する装置について説明する。
【0050】
本実施形態の帳票様式作成装置は、たとえば、CPU、記憶装置(ROM、RAMなど)、入力装置(キーボード、マウスなど)、表示装置などを含む典型的なコンピュータのハードウェア資源と、帳票様式作成処理のためのプログラムなどのソフトウェア資源とで構成される。通信媒体を通じて接続された複数のコンピュータ上で帳票処理のためのプログラムによる処理を分散して行う構成としてもよい。あるいは、帳票処理の一部または全てを専用のハードウェアに置き換えて実現するようにしてもよい。本実施形態の帳票様式作成装置によって作成された帳票様式のデータは、コンピュータに接続された記録装置によって、着脱自在な記憶媒体に記録することが可能である。あるいは、伝送媒体を通じて他のコンピュータに伝送することも可能である。
【0051】
図9は本実施形態の帳票様式作成装置の構成を示す機能ブロック図である。
【0052】
本実施形態の帳票様式作成装置20は、ユーザによって作成された処理対象領域の定義情報を取得する領域指定部21と、領域指定部21にて取得された処理対象領域の定義情報をもとに当該処理対象領域を生成する領域生成部22と、処理対象領域の定義情報をもとに基準位置マークおよび属性情報パターンを含むパターンを生成するパターン生成部23と、領域生成部22にて生成された処理対象領域とパターン生成部23にて生成されたパターンとを組み合わせた帳票様式データを生成する様式データ生成部24と、様式データ生成部24にて生成された帳票様式データを汎用的なコンピュータとオペレーティングシステム上で印刷可能な形式のデータ(画像データ、ベクトルデータなど)に変換して出力する帳票様式データ出力部25とを備えている。
【0053】
次に、本実施形態の帳票様式作成装置20の動作を詳細を説明する。
【0054】
まず、ユーザによって作成された処理対象領域の定義情報を領域指定部21にて取得する。処理対象領域の定義情報は、表題、位置、サイズ、記入内容の種別などからなる。ユーザによって作成された処理対象領域の定義情報を取得する方法としては、たとえば、処理対象領域の定義情報をテキストデータの形式で記述したファイルをユーザに作成させ、そのテキストファイルを読み込むことによって行う方法などがある。
【0055】
図10は処理対象領域の定義情報が記述されたテキストファイルの例である。このテキストファイルでは、行の単位で個々の処理対象領域の定義情報31,32,33が記述される。たとえば処理対象領域の定義情報31において、「申請者」は表題、「10,30」は位置、「90,25」はサイズ、「氏名」は記入内容の種別を意味する。ここで、位置は、図3に示したように、帳票1の左上角P5から処理対象領域2の左上角P6までの二軸(Y軸,X軸)方向のオフセット値(単位:mm)である。サイズは二軸(Y軸,X軸)方向それぞれの長さ(単位:mm)である。
【0056】
また、処理対象領域の定義情報を入力には、次のようなGUI(グラフィカル・ユーザ・インターフェース)を利用してもよい。
【0057】
図11は処理対象領域の表題および記入内容の種別をユーザに指定させるためのGUIであるウィンドウ(ダイアログボックス)34の例である。このウィンドウ34には、処理対象領域の表題を入力可能なテキストボックス35と、記入内容の種別をプルダウンメニュー36の中から指定できるプルダウンボックス37とが設けられている。図12は処理対象領域2の位置とサイズをユーザに指定させるためのGUIである様式編集画面38の例である。この様式編集画面38でユーザはマウスなどの入力装置を操作することによってマウスカーソルを移動させて、処理対象領域2の位置とサイズを指定することができる。領域指定部21は、これらのGUIでユーザによって指定された処理対象領域の表題、記入内容の種別、位置、サイズを取得する。
【0058】
次に、領域生成部22は、領域指定部21にて取得された処理対象領域の定義情報をもとに、処理対象領域を生成して表示装置の画面に描画する。図13は図10に示した処理対象領域の定義情報をもとに3つの処理対象領域2(2−1,2−2,2−3)を生成した結果を示している。この際、各々の処理対象領域2(2−1,2−2,2−3)に対して表題5(5−1,5−2,5−3)が同時に付加される。
【0059】
次に、パターン生成部23は、処理対象領域の定義情報をもとに基準位置マーク3および属性情報パターン4を含むパターンを生成する。ここで、基準位置マーク3と処理対象領域2との位置関係は固定で規定されているので、処理対象領域2の位置をもとに基準位置マーク3の位置が決定される。また、基準位置マーク3の位置が決まれば、この基準位置マーク3との位置関係が固定で規定されている属性情報パターン4の位置も決まる。これにより、図14に示すように、図13に示した処理対象領域2(2−1,2−2,2−3)と、基準位置マーク3(3−1,3−2,3−3)および属性情報パターン4(4−1,4−2,4−3)を含むパターンとを合成した帳票様式が得られる。
【0060】
次に、帳票様式作成装置の別の実施形態を説明する。
【0061】
図15は本実施形態の帳票様式作成装置30の構成を示す機能ブロック図である。
【0062】
同図に示すように、本実施形態の帳票様式作成装置30は、図9に示した帳票様式作成装置20に領域情報再利用部26を加えたものである。その他の構成は図9に示した帳票様式作成装置20と同じである。領域情報再利用部26は、既に作成された帳票様式データを再利用して領域指定部21に対して新たに作成する処理対象領域の定義情報を提供するものである。
【0063】
次に、この領域情報再利用部26の具体的な機能について説明する。
【0064】
領域情報再利用部26は、既に作成された帳票様式データを取り込んで表示装置の画面にテンプレートとして表示させる。ここでユーザは、図16に示すように、表示装置の画面に表示された帳票様式の中の所望の処理対象領域2をマウス操作などによって選択することができる。所望の処理対象領域2が選択された状態でマウスの右クリック操作などが行われると、図17に示すように、選択された処理対象領域2に対して実施することの可能な処理コマンドのメニュー41が現れる。このメニュー41の中で所望の処理コマンドの実行がユーザによって指定されると、領域情報再利用部26はその指定された処理コマンドを実行する。
【0065】
メニュー41の中の「コピー」の実行が指定された場合、領域情報再利用部26は、図18に示すように、その処理対象領域2のコピーをユーザによって指定された場所に新しい処理対象領域42として追加する。これにより、処理対象領域2の表題、サイズ、記入内容の種別が同一の処理対象領域42が追加され、2つの処理対象領域2、42に関す定義情報が作成されたことになる。メニュー41の中の「削除」の実行が指定された場合には、領域情報再利用部26は選択状態にある処理対象領域を削除する。
【0066】
メニュー41の中の「属性変更」の実行が指定された場合には、領域情報再利用部26は、選択状態にある処理対象領域に関する属性情報(記入内容の種別、サイズなど)の変更内容を設定するためのダイアログボックスを表示して、このダイアログボックスにおいてユーザより入力された変更内容で、当該処理対象領域に関する属性情報の変更を行う。
【0067】
メニュー41の中の「ライブラリに追加」の実行が指定された場合、領域情報再利用部26は、選択状態にある処理対象領域に関する表題、サイズ、記入内容の種別をライブラリに登録する。ここで、ライブラリとは、再利用可能な処理対象領域に関する表題、サイズ、記入内容の種別を読み出し可能なように蓄積するデータベースである。このライブラリは、たとえばコンピュータに接続されたハードディスクドライブなどの外部記憶装置に格納されている。
【0068】
領域情報再利用部26には、ライブラリの内容を表示するコマンドが用意されている。ユーザによりこのコマンドの実行が指定された場合、領域情報再利用部26はライブラリに登録されているすべての処理対象領域に関する情報を表示装置に表示させる。図19はこのライブラリの登録情報の表示例を示す図である。ユーザは、このようなライブラリの登録情報の中から、所望の処理対象領域に関する情報を再利用の対象として選択することができる。
【0069】
また、このライブラリにおいては、処理対象領域に関する情報の一部が未定義であっても登録が許されている。たとえば、図20に示す例においては、処理対象領域のサイズと記入内容の種別がライブラリに登録されているものの、表題が登録されておらず未定義である。領域情報再利用部26は、ライブラリから未定義の情報を含む処理対象領域に関する情報がユーザによって選択された場合には、図21に示すように、ダイアログボックス43を表示して、その未定義の情報をユーザに埋めさせることができる。図19および図20の例では、表題が未指定である場合について示したが、縦横のサイズや記入内容の種別の場合も同様である。
【0070】
なお、上記の領域情報再利用部26の説明では、既存の帳票様式データからライブラリに登録する処理対象領域に関する情報をユーザが指定することとしたが、ライブラリにはいくつかの処理対象領域に関する情報がデフォルトで登録されていてもよい。
【0071】
本発明は、上述の実施形態にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
【図面の簡単な説明】
【0072】
【図1】本発明の実施形態にかかる帳票の様式の例を示す図である。
【図2】図1の帳票様式上のパターンの詳細を示す図である。
【図3】基準位置マークと処理対象領域との位置関係の例を示す図である。
【図4】一つの属性情報パターンで複数の処理対象領域の属性情報を表現する方法を示す図である。
【図5】一つの属性情報パターンで表現された複数の処理対象領域の属性情報を表形式で示す図である。
【図6】帳票様式におけるパターンの別の表現方法を示す図である。
【図7】本発明の実施形態にかかる帳票処理装置の機能ブロック図である。
【図8】図7の帳票処理装置の動作を説明するフローチャートである。
【図9】本発明の実施形態にかかる帳票様式作成装置の機能ブロック図である。
【図10】処理対象領域の定義情報が記述されたテキストファイルの例を示す図である。
【図11】処理対象領域の表題および記入内容の種別をユーザに指定させるためのGUIを示す図である。
【図12】処理対象領域の位置とサイズをユーザに指定させるためのGUIを示す図である。
【図13】図10の定義情報に基づいて生成された処理対象領域を示す図である。
【図14】図10の定義情報に基づいて生成された帳票様式を示す図である。
【図15】本発明の別の実施形態にかかる帳票様式作成装置の構成を示す機能ブロック図である。
【図16】領域情報再利用部の機能である処理対象領域の選択を説明するための図である。
【図17】領域情報再利用部の機能である処理コマンドのメニュー表示を示す図である。
【図18】領域情報再利用部の機能である処理対象領域のコピー処理を示す図である。
【図19】ライブラリの登録情報の表示例を示す図である。
【図20】未定義の情報を含むライブラリの登録情報の例を示す図である。
【図21】未定義の情報をユーザに埋めさせるGUIを示す図である。
【符号の説明】
【0073】
1…帳票、2…処理対象領域、3…基準位置マーク、4…属性情報パターン、10…帳票処理装置、11…帳票画像入力部、12…記憶部、13…処理対象領域特定部、14…領域処理部、20…帳票様式作成装置、21…領域指定部、22…領域生成部、23…パターン生成部、24…様式データ生成部、25…帳票様式データ出力部、26…領域情報再利用部、131…基準位置マーク検出部、132…属性情報パターン認識部、133…領域特定部。
【特許請求の範囲】
【請求項1】
処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、
前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、
前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、
前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、
前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部と
を具備することを特徴とする帳票処理装置。
【請求項2】
前記領域は矩形の領域であり、
前記領域特定部は、前記基準位置をもとに前記矩形の領域のあらかじめ決められた角の位置を判定し、この角の位置と前記領域のサイズ情報をもとに前記矩形の領域の全体の位置を求めることを特徴とする請求項1に記載の帳票処理装置。
【請求項3】
前記マークは、異なる回転角度では形状が一致しないパターンであることを特徴とする請求項1または2に記載の帳票処理装置。
【請求項4】
処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、
前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、
前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、
前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部と
を具備することを特徴とする帳票様式作成装置。
【請求項5】
前記定義情報は、前記領域の位置およびサイズの情報を含むことを特徴とする請求項4に記載の帳票様式作成装置。
【請求項6】
前記領域のサイズ情報を含む属性情報をライブラリとして記憶し、このライブラリとして記憶された前記領域の属性情報をユーザからの選択に応じて読み出し、新規の領域の作成のために再利用する領域情報再利用部をさらに具備することを特徴とする請求項4または5に記載の帳票様式作成装置。
【請求項7】
処理対象の情報が配置される領域と、
前記領域の位置を特定するための基準位置を示すとともに前記領域のサイズ情報を少なくとも表現したパターンとが配置されていることを特徴とする帳票。
【請求項8】
前記パターンが、前記領域の境界の罫線に埋め込まれていることを特徴とする請求項6に記載の帳票。
【請求項9】
コンピュータを、
処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、
前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、
前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、
前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、
前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部として機能させることを特徴とする帳票処理用のプログラム。
【請求項10】
コンピュータを、
処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、
前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、
前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、
前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部として機能させることを特徴とする帳票様式作成用のプログラム。
【請求項1】
処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、
前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、
前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、
前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、
前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部と
を具備することを特徴とする帳票処理装置。
【請求項2】
前記領域は矩形の領域であり、
前記領域特定部は、前記基準位置をもとに前記矩形の領域のあらかじめ決められた角の位置を判定し、この角の位置と前記領域のサイズ情報をもとに前記矩形の領域の全体の位置を求めることを特徴とする請求項1に記載の帳票処理装置。
【請求項3】
前記マークは、異なる回転角度では形状が一致しないパターンであることを特徴とする請求項1または2に記載の帳票処理装置。
【請求項4】
処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、
前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、
前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、
前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部と
を具備することを特徴とする帳票様式作成装置。
【請求項5】
前記定義情報は、前記領域の位置およびサイズの情報を含むことを特徴とする請求項4に記載の帳票様式作成装置。
【請求項6】
前記領域のサイズ情報を含む属性情報をライブラリとして記憶し、このライブラリとして記憶された前記領域の属性情報をユーザからの選択に応じて読み出し、新規の領域の作成のために再利用する領域情報再利用部をさらに具備することを特徴とする請求項4または5に記載の帳票様式作成装置。
【請求項7】
処理対象の情報が配置される領域と、
前記領域の位置を特定するための基準位置を示すとともに前記領域のサイズ情報を少なくとも表現したパターンとが配置されていることを特徴とする帳票。
【請求項8】
前記パターンが、前記領域の境界の罫線に埋め込まれていることを特徴とする請求項6に記載の帳票。
【請求項9】
コンピュータを、
処理対象の情報が配置される領域と、この領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも表現したパターンとが配置された帳票の画像を入力する帳票画像入力部と、
前記帳票画像入力部により入力された前記帳票の画像を記憶する記憶部と、
前記記憶部に記憶された前記帳票の画像中の前記パターンから前記基準位置を検出するとともに、前記領域のサイズ情報を認識するパターン認識部と、
前記パターン認識部により検出された前記基準位置と、前記パターン認識部により認識された前記領域のサイズ情報とから前記領域の全体の位置を求める領域特定部と、
前記領域特定部により求められた前記領域内の画像に対する処理を行う領域処理部として機能させることを特徴とする帳票処理用のプログラム。
【請求項10】
コンピュータを、
処理対象の情報が配置される領域を定義する定義情報を取得する領域指定部と、
前記領域指定部にて取得された前記定義情報をもとに前記領域を生成する領域生成部と、
前記領域指定部にて取得された前記定義情報をもとに、前記領域の位置を特定するための基準位置を示すとともに、前記領域のサイズ情報を少なくとも示すパターンを生成するパターン生成部と、
前記領域生成部にて生成された前記領域と前記パターン生成部にて生成された前記パターンとを組み合わせて帳票様式データを生成する様式データ生成部として機能させることを特徴とする帳票様式作成用のプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【公開番号】特開2007−279828(P2007−279828A)
【公開日】平成19年10月25日(2007.10.25)
【国際特許分類】
【出願番号】特願2006−102063(P2006−102063)
【出願日】平成18年4月3日(2006.4.3)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
【公開日】平成19年10月25日(2007.10.25)
【国際特許分類】
【出願日】平成18年4月3日(2006.4.3)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
[ Back to top ]