説明

画像処理方法及び装置

【課題】より正確に文書画像における歪曲を取り除き、文書位置合わせの品質を確かにし、それによって、帳票テンプレートの正確性を高めることができる画像形成装置等を提供する。
【解決手段】罫線が抽出されて、実二次元空間にマッピングされる。マッピングされた罫線と罫線テンプレートのテンプレートセルとの間の対応が決定される。互いに対応するセルの対ごとに、テンプレートセル内の各画素の位置が、セル間のアフィン変換に基づいて、実二次元空間における実位置にマッピングされる。実位置に隣接する位置にある画像内の複数の画素の画素値に基づく画素値は、実位置に対応するテンプレートセル内の画素の画素値として生成される。画像に対応する合成画像は、生成された画素値を有するテンプレート内の画素と罫線テンプレートの罫線とをマージすることによって生成される。帳票テンプレートは、複数の画像に対応する合成画像に基づいて得られる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理技術に関する。
【背景技術】
【0002】
多くの文書画像形成システムにおいて、大量の帳票がコンピュータシステムにスキャンされ、コンピュータシステムは、得られた文書画像を処理して、必要な情報を取り出す。一般に、帳票は、予め印刷されている罫線と、例えばテキスト、シンボル等の決まった内容とを含む。可変な内容が、罫線によって囲まれているセル内に手書き又は印刷により記入されていることがある。書き込まれた又は印刷された情報を取り出すよう、コンピュータシステムは、最初に、帳票テンプレートとして罫線及び決まった内容を認識する。帳票テンプレートに従って、文書画像においてセルの領域を認識し、記入されている可変な内容の部分を得るよう罫線及び決まった内容の部分を取り除き、次いで、手書き又は印刷により記入された内容を認識することが可能である。
【0003】
帳票テンプレートを認識し、手書き又は印刷された内容をそれぞれのセルに割り当てるよう、文書画像を帳票テンプレートに登録することが一般的である。自動帳票処理方法においては、コンピュータシステムは、処理される全種類の帳票について帳票テンプレートを保持すべきであり、そのような帳票テンプレートには、帳票における罫線、セルの位置及び決まった内容が定義されている。帳票テンプレートは、例えば手動入力によりオペレータによって予め定義されてよく、あるいは、例えば、米国特許第6886136号明細書(特許文献1)に開示されている帳票テンプレート自動生成方法により、入力される文書画像に従って自動的に生成されてよい。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許第6886136号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、より正確に文書画像における歪曲を取り除き、文書位置合わせの品質を確かにし、それによって、帳票テンプレートの正確性を高めることができる画像形成装置及び方法を提供する。
【課題を解決するための手段】
【0006】
本発明の実施形態は、画像処理装置である。装置は、罫線抽出部と、対応決定部と、位置マッピング部と、画素値生成部と、画像生成部と、帳票テンプレート生成部とを有する。罫線抽出部は、複数の画像のそれぞれから罫線を抽出し、該抽出された罫線を実二次元空間にマッピングしてよい。対応決定部は、前記画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の前記抽出された罫線と前記罫線テンプレートの罫線との間の相対関係がより一致する位置に合わせ、前記マッピングされた罫線によって囲まれるセルと前記罫線テンプレートの罫線によって囲まれるテンプレートセルとの間の対応を決定してよい。位置マッピング部は、互いに対応するセルの各対に関して、当該対のセル間のアフィン変換に基づいて、前記テンプレートセル内の画素のそれぞれの位置を前記実二次元空間における実位置にマッピングしてよい。画素値生成部は、前記実位置に対応する前記テンプレートセル内の画素の画素値として、前記実位置に隣接する位置にある画像内の複数の画素の画素値に基づいて画素値を生成してよい。画像生成部は、前記罫線テンプレートの罫線を、生成された画素値を有する前記テンプレートセル内の画素とマージすることによって、各画像に対応する合成画像を生成してよい。帳票テンプレート生成部は、前記複数の画像に対応する合成画像に基づいて帳票テンプレートを取得してよい。
【0007】
本発明の実施形態は、画像処理装置によって実施される画像処理方法である。方法に従って、複数の画像のそれぞれから罫線を抽出し、該抽出された罫線を実二次元空間にマッピングすることが可能である。前記マッピングされた罫線によって囲まれるセルと前記罫線テンプレートの罫線によって囲まれるテンプレートセルとの間の対応は、前記画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の前記抽出された罫線と前記罫線テンプレートの罫線との間の相対関係がより一致する位置に合わせることで、決定される。互いに対応するセルの各対に関して、前記テンプレートセル内の画素のそれぞれの位置は、当該対のセル間のアフィン変換に基づいて、前記実二次元空間における実位置にマッピングされる。前記実位置に隣接する位置にある画像内の複数の画素の画素値に基づく画素値は、前記実位置に対応する前記テンプレートセル内の画素の画素値として生成される。各画像に対応する合成画像は、前記罫線テンプレートの罫線を、生成された画素値を有する前記テンプレートセル内の画素とマージすることによって、生成される。帳票テンプレートは、前記複数の画像に対応する合成画像に基づいて得られる。
【発明の効果】
【0008】
本発明の実施形態によれば、変形及び歪曲がセル単位で補正されるので、より正確に文書画像における歪曲を取り除き、文書位置合わせの品質を確かにし、それによって、帳票テンプレートの正確性を高めることができる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施形態に従う画像処理装置の構成例を表すブロック図である。
【図2】帳票を含む文書画像の一例を表す図である。
【図3】罫線テンプレートの一例を表す図である。
【図4】実二次元空間においてマッピングされた罫線及び該罫線によって囲まれているマッピングされたセルの例を表す図である。
【図5】テンプレートセルとマッピングされたセルとの間のアフィン変換を表す概略図である。
【図6】テンプレートセルにおける画素の位置から実二次元空間における実位置へのアフィン変換によるマッピングを表す概略図である。
【図7】テンプレートセルにおける画素の位置から実二次元空間における実位置への平行面間のアフィン変換によるマッピングを表す概略図である。
【図8】実位置と該実位置に隣接する画素の位置との間の関係を表す概略図である。
【図9】本発明の実施形態に従う画像処理方法のプロセス例を表すフローチャートである。
【図10】本発明の実施形態に従う罫線生成部の構成例を表すブロック図である。
【図11】本発明の実施形態に従う罫線テンプレート生成のプロセス例を表す概略図である。
【図12】本発明の装置及び方法を実施するためのコンピュータの構成例を表すブロック図である。
【発明を実施するための形態】
【0010】
本発明の上記及び/又は他の態様、特徴及び/又は利点は、添付の図面を参照することによって以下の記載を鑑みて容易に理解されるであろう。添付の図面において、同じ又は対応する技術的特徴又は構成要素は、同じ又は対応する参照符号により表される。
【0011】
ここで使用される用語は、特定の実施形態を記載するためだけのものであり、本発明を限定するものではない。ここで使用されるように、「1つの」及び「前記」等の要素の前に付された語は、複数を含まないことが明示的に示されない限りは、単数に限らず複数も含む。更に、語「有する」及び「含む」等の表現は、本明細書において使用される場合は、述べられている特徴、数値、ステップ、動作、要素及び/又は部品の存在を特定するが、1又はそれ以上の他の特徴、数値、ステップ、動作、要素、部品及び/又はそれらのグループの存在又は付加を排除しない。
【0012】
本発明の態様について、以下、本発明の実施形態に従う方法及び装置のフローチャート及び/又はブロック図を参照して記載する。明りょうさのために、当業者によって知られているが本発明とは無関係である構成要素及び処理に関する表現及び記載は、図面及び明細書において省略されていることに留意されたい。フローチャート及び/又はブロック図の各ブロック、並びにフローチャート及び/又はブロック図におけるブロックの組合せは、コンピュータプログラム命令によって実施可能であることは明らかである。それらのコンピュータプログラム命令は、コンピュータ又は他のプログラム可能なデータ処理装置のプロセッサを介して実行する命令が、フローチャート及び/又はブロック図の1以上のブロックにおいて特定される機能/動作を実施する手段を作り出すように、機械を生成するよう汎用コンピュータ、専用コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサへ与えられてよい。
【0013】
それらのコンピュータプログラム命令は、コンピュータ可読媒体に記憶されてよい。
【0014】
コンピュータプログラム命令は、また、コンピュータ又は他のプログラム可能な装置で実行される命令が、フローチャート及び/又はブロック図の1以上のブロックにおいて特定される機能/動作を実施するための処理を提供するように、コンピュータ又は他のプログラム可能な装置で実行される一連の演算ステップにコンピュータ実施処理を作り出させるよう、コンピュータ又は他のプログラム可能なデータ処理装置上にロードされてよい。
【0015】
図中のフローチャート及びブロック図は、本発明の様々な実施形態に従うシステム、方法及びコンピュータプログラムプロダクトの可能な実施の動作、機能及びアーキテクチャを表すことに留意されたい。これに関連して、フローチャート又はブロック図における各ブロックは、特定の論理機能を実施するための1又はそれ以上の実行可能な命令を有するコードの部分、セグメント又はモジュールを表してよい。また、幾つかの代替の実施において、ブロックにおいて示される機能は、図中に示されている順序を外れて行われてよいことに留意されたい。例えば、順番に示されている2つのブロックは、実際には、略同時に実行されてよく、あるいは、ブロックは、時々、関連する機能に依存して、反対の順序で実行されてよい。また、ブロック図及び/又はフローチャートの各ブロック、並びにブロック図及び/又はフローチャートにおけるブロックの組合せは、専用のハードウェア及びコンピュータ命令の特定の機能若しくは動作又は組合せを実行する専用のハードウェアに基づくシステムによって実施可能であることに留意されたい。
【0016】
先行技術の方法において、帳票テンプレートは、同じ帳票を有する文書画像を互いと合わせて、それらから比較的不変な部分を取り出す。しかし、文書画像を得る処理において、文書画像における帳票は、文書の傾きや回転等のために、変形及び歪曲され、特に、異なった範囲にまで局所的に変形及び歪曲されることがある。位置合わせによる文書の積分回転の影響を部分的に解消することが可能であるが、文書における局所的な変形及び局所的な歪曲の影響を解消することはできない。
【0017】
特に、帳票におけるセルは、例えばテキストやシンボル等の決まった内容を含むことがある。文書画像における異なった範囲までの局所的な変形及び歪曲は、このような内容を帳票テンプレート内に認識することを不可能にし、それにより、決まった内容は、文書画像を処理する際に、可変な内容として認識される。
【0018】
図1は、本発明の実施形態に従う画像処理装置100の構成例を表すブロック図である。
【0019】
図1に示されるように、装置100は、罫線抽出部101と、対応決定部102と、位置マッピング部103と、画素値生成部104と、画像生成部105と、帳票テンプレート生成部106とを有する。
【0020】
罫線抽出部101は、複数の画像のそれぞれから罫線を抽出し、抽出した罫線を実二次元空間にマッピングする。
【0021】
複数の画像のそれぞれは、同じ帳票を有する文書画像である。図2は、帳票を有する文書画像の一例を表す図である。図2に示されるように、それぞれのセルは罫線によって囲まれている。セルに含まれる淡色の文字は、決まった内容の部分であり、セルに含まれる濃色の文字は、手書き又は印刷された可変な内容の部分である。図2において、「0123456」、「John Smith」、「000000101」、「50,000.0」、「650.25」、「124.48」、「525.77」、「Principal:50,000.0」、「Tax Deducted:124.48」、「Interests:650.25」、「Interests After Tax:525.77」、及び「Henry(署名)」は濃色の文字で記されており、それ以外は淡色の文字で記されている。代替的に、仮に文書画像の端をデフォルト罫線とすることも可能であり、この場合において、非デフォルト罫線及びデフォルト罫線を交差するよう広げることによって、文書画像の端部分におけるセルを得ることが可能である。
【0022】
従来の方法により文書画像から罫線を抽出することが可能である。例えば、米国特許第7039235号明細書及び米国特許出願第2005/031208号明細書に記載される方法を採用することが可能である。更に、抽出された罫線を実二次元空間にマッピングするよう最小二乗法等の線形マッピング法(linear fitting method)を採用することが可能である。ここで、抽出された罫線上の点は、整数縦座標及び整数横座標としてその位置を有する文書画像内の画素に対応する。実二次元空間にマッピングされた罫線は、それぞれの関数により記載され、その上の点の位置は、離散的な整数値に限定されず、実数値であってよい。図4は、実二次元空間におけるマッピングされた罫線及び該罫線によって囲まれるマッピングされたセルの例を表す図である。図4に示されるように、X軸及びY軸に関する座標値(x,y)は、実二次元空間における点の位置を表す。直線401、402、403及び404はそれぞれ、抽出された罫線をマッピングさせることによって得られる実二次元空間内の線である。図4に示されるように、それらの直線は1つのセルを囲む。
【0023】
罫線抽出部101による処理を通じて、抽出された罫線と、マッピングされた罫線によって囲まれているマッピングされたセル110とを取得することが可能である。
【0024】
図1に戻ると、対応決定部102は、画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の抽出された罫線110と罫線テンプレート111の罫線との間の相対関係がより一致する位置に合わせ、マッピングされた罫線によって囲まれるセルと罫線テンプレート111の罫線によって囲まれるテンプレートセルとの間の対応を決定する。
【0025】
図3は、罫線テンプレートの一例を表す図である。図3に示されるように、罫線テンプレートは、罫線と、罫線によって囲まれているセルとを含む。複数の画像のランダムに選択された1つ又は特定の1つから罫線を抽出することによって、罫線テンプレートを形成することが可能である。
【0026】
各画像からの抽出された罫線を罫線テンプレートと合わせるために従来の方法を採用することが可能である。例えば、罫線テンプレートに対して抽出された罫線を連続的にシフトして、罫線テンプレートと抽出された罫線との間の類似度を計算することが可能である。罫線テンプレートと抽出された罫線との間の相対位置関係の下で最大類似度が得られる場合に、この相対位置関係の下で、罫線テンプレートは抽出された罫線と一致していると決定される。
【0027】
互いに一致する場合において、罫線テンプレート内のテンプレートセルと抽出された罫線によって囲まれるセルとの間の対応を決定することができる。抽出された罫線によって囲まれるセルとマッピングされたセルとの間の対応のために、罫線テンプレート内のテンプレートセルとマッピングされたセルとの間の対応を決定することができる。
【0028】
図1に戻ると、互いに対応するセル(罫線テンプレートにおけるテンプレートセル及び実二次元空間におけるマッピングされたセル)の各対に関して、位置マッピング部103は、当該対のセルの間のアフィン変換に基づいて、テンプレートセルにおける画素のそれぞれの位置を実二次元空間における実位置にマッピングする。
【0029】
図5は、テンプレートセルとマッピングされたセルとの間のアフィン変換を表す概略図である。
【0030】
アフィン変換は、アフィン平面(又は空間)からそれ自身への変換の一種である。アフィン変換の特性には、点の共直線性(又は同一平面特性)と、同一線形順序に並んだ3点の一定線分比特性とがある。図5に示されるように、平面501におけるセルABCDはテンプレートセルであり、平面502におけるセルA’B’C’D’は、セルABCDに対してアフィン変換を実行することによって得られるマッピングされたセルである。
【0031】
点の共直線性に従って、平面501における点A、E及びBは同一線形順序に並んでおり、平面501における点D、F及びCは同一線形順序に並んでいるから、点A、E及びBに対してアフィン変換を実行することによって得られる対応する点A’、E’及びB’は同一線形順序に並んでおり、点D、F及びCに対してアフィン変換を実行することによって得られる対応する点D’、F’及びC’は同一線形順序に並んでいる。同一線形順序に並んだ3点の一定線分比特性に従って、Len(A,E)/Len(E,B)=Len(A’,E’)/Len(E’,B’)、Len(D,F)/Len(F,C)=Len(D’,F’)/Len(F’,C’)。ここで、Len(,)は2点間の距離を表す。
【0032】
アフィン変換関係が、互いに対応するテンプレートセルとマッピングされたセルとの間に存在するとすれば、テンプレートセルにおけるいずれかの画素が上記特性を用いることによってマッピングされるセルにおける点を決定することが可能である。このようなマッピング方法は、一例として図6に示されるシナリオを考えることによって、後述される。
【0033】
図6は、テンプレートセルにおける画素の位置から実二次元空間における実位置へのアフィン変換に従うマッピングを表す概略図である。図6(b)は、(頂点P1、P3、P5及びP7を有する)テンプレートセル601を示し、図6(a)は、テンプレートセル601に対応する(頂点P1’、P3’、P5’及びP7’を有する)マッピングされたセル602を示す。テンプレートセル601におけるいずれかの点Pに関し、その点を2つの線の交点と考えることが可能である。一方の線は点P4及びP8において罫線と交差し、他方の線は点P2及びP6において罫線と交差する。頂点P1’、P3’、P5’及びP7’がそれぞれ、頂点P1、P3、P5及びP7に対応するとすれば、共直線性及び一定線分比特性に従って、点P2、P4、P6及びP8にそれぞれ対応するマッピングされたセル602における点P2’、P4’、P6’及びP8’を決定することが可能である。再び共直線性に従って、線P2’P6’と線P4’P8’との間の交点P’、すなわち、点Pに対応する点を決定することが可能である。交点P’の位置は、テンプレートセル601における画素の点Pがマッピングされている実二次元空間における実位置P’である。
【0034】
代替の実施形態において、アフィン変換は、平行な面の間のアフィン変換に単純化されてよい。この場合において、マッピングされたセルを、対応するテンプレートセルを回転させることにより得られたものと考えることが可能である。実施形態において、テンプレートセルに対するマッピングされたセルの回転角を計算し、該回転角に従ってテンプレートセルにおけるいずれかの点に対応するマッピングされたセルにおける点の位置を計算することが可能である。
【0035】
図7は、テンプレートセルにおける画素の点から実二次元空間における実位置への平行面間のアフィン変換に従うマッピングを表す概略図である。図7(b)はテンプレートセルを示し、図7(a)は、テンプレートセルに対応するマッピングされたセルを示す。テンプレートセルにおけるいずれかの点Pに関し、X軸及びY軸の一方(図7の例では、X軸と同じ方向にあるテンプレートセルの下の辺である。)と、テンプレートセルにおいて点P及び基準点を接続する接続線との間の角度αを計算することが可能である。基準点は、マッピングされたセルが配置されている面における、基準点に対応するマッピングされた基準点を決定することが可能である限り、テンプレートセルが配置されている面におけるいずれの点であってもよい。望ましくは、基準点は、例えばテンプレートセルの頂点等の、マッピングされた基準点の決定を容易にする点であってよい。マッピングされたセルに関して、X軸及びY軸の上記1つと、テンプレートセルの上記下の辺に対応するマッピングされたセルの辺との間の角度θが計算され、それによって、X軸及びY軸の上記1つと、上記接続線に対応するマッピングされたセルにおける線との間の角度α+θを得る。上記接続線及び該接続線に対応する線は同じ長さを有するので、マッピングされた基準点及び角度α+θを知っている場合において、実二次元空間における対応する点P’の位置を計算することが可能である。
【0036】
図1に戻ると、画素値生成部104は、実位置に対応するテンプレートセルにおける画素の画素値として、実位置に隣接した位置にある画像内の複数の画素の画素値に基づいて画素値を生成する。
【0037】
図8は、実位置と実位置に隣接する画素の位置との間の関係を表す概略図である。図8(a)は実位置(i’+a,j’+b)を示し、i’、j’は実数の整数部分であり、a、bは実数の少数部分である。実位置(i’+a,j’+b)に隣接する画素の位置は、それぞれ、(i’,j’)、(i’+1,j’)、(i’,j’+1)、(i’+1,j’+1)である。隣接する画素の位置は、記載される画素位置に限定されず、それらは、また、他の隣接画素の位置を有してよいことに留意されたい。図8(b)は、実位置に対応するテンプレートセルにおける画素の位置(i,j)を示す。
【0038】
一実施形態において、画素値生成部104は、実位置に隣接する位置を有する画素内の複数の画素の画素値(例えば、(i’,j’)、(i’+1,j’)、(i’,j’+1)、(i’+1,j’+1))の加重和を計算することによって、画素値を生成してよい。各画素の位置と実位置との間の距離が短ければ短いほど、対応する画素値の重みはますます大きくなる。例えば、(i’+a,j’+b)の実位置を考えると、生成される画素値は、(1−a)×(1−b)×f(i’,j’)+a×(1−b)×f(i’+1,j’)+b×(1−a)×f(i’,j’+1)+a×b×f(i’+1,j’+1)であってよい。ここで、f(x,y)は、画像内の画素(x,y)の画素値である。
【0039】
他の実施形態において、画素値生成部104は、実位置に隣接する位置を有する画像内の複数の画素の画素値(例えば、(i’,j’)、(i’+1,j’)、(i’,j’+1)、(i’+1,j’+1))の最小値、すなわち、min{f(i’,j’),f(i’+1,j’),f(i’,j’+1),f(i’+1,j’+1)}を、生成された画素値と見なしてよい。ここで、f(x,y)は、画像内の画素(x,y)の画素値である。
【0040】
図1に戻ると、画像生成部105は、罫線テンプレートの罫線を、生成された画素値を有するテンプレートセル内の画素とマージすることによって、画像に対応する合成画像112を生成する。すなわち、合成画像112は、罫線テンプレートにおける罫線と、テンプレートセルにおける非罫線画素とを含む。合成画像112における非罫線画素に関し、それらの画素値は、画素値生成部104によって得られた値である。
【0041】
帳票テンプレート生成部106は、複数の画像に対応する合成画像112に基づいて、帳票テンプレートを取得する。従来の方法が、複数の画像に対応する合成画像に基づいて帳票テンプレートを得るよう採用されてよい。例えば、米国特許第6886136号明細書に記載される方法を採用することが可能である。代替的に、帳票テンプレート生成部106は、次の方法により帳票テンプレートを取得して良い:帳票テンプレートにおける画素のそれぞれに関して、複数の合成画像における対応する画素の最小画素値が、当該画素の画素値として取得される。
【0042】
図9は、本発明の実施形態に従う画像処理方法のプロセス例を表すフローチャートである。
【0043】
図9に示されるように、方法はステップ900から始まる。ステップ902で、画像処理装置の罫線抽出部101が、罫線を複数の画像のそれぞれから抽出し、抽出された罫線を実二次元空間にマッピングする。
【0044】
複数の画像のそれぞれは、同じ帳票を含む文書画像である。それぞれのセルは、罫線によって囲まれている。セルに含まれる淡色の文字は、決まった内容の部分であり、セルに含まれる濃色の文字は、手書き又は印刷された可変な内容の部分である。代替的に、仮に文書の端をデフォルト罫線とすることも可能であり、この場合において、非デフォルト罫線及びデフォルト罫線を交差するよう広げることによって、文書画像の端部分におけるセルを得ることが可能である。
【0045】
従来の方法により文書画像から罫線を抽出することが可能である。例えば、米国特許第7039235号明細書及び米国特許出願第2005/031208号明細書に記載される方法を採用することが可能である。更に、抽出された罫線を実二次元空間にマッピングするよう最小二乗法等の線形マッピング法を採用することが可能である。ここで、抽出された罫線上の点は、整数縦座標及び整数横座標としてその位置を有する文書画像内の画素に対応する。実二次元空間にマッピングされた罫線は、それぞれの関数により記載され、その上の点の位置は、離散的な整数値に限定されず、実数値であってよい。
【0046】
ステップ902の処理により、抽出された罫線と、マッピングされた罫線によって囲まれるマッピングされたセルとを得ることが可能である。
【0047】
ステップ904で、画像処理装置の対応決定部102が、画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の抽出された罫線と罫線テンプレートの罫線との間の相対関係がより一致する位置に合わせ、マッピングされた罫線によって囲まれるセルと罫線テンプレートの罫線によって囲まれるテンプレートセルとの間の対応を決定する。
【0048】
複数の画像のランダムに選択された1つ又は特定の1つから罫線を抽出することによって、罫線テンプレートを形成することが可能である。
【0049】
画像のそれぞれからの抽出された罫線を罫線テンプレートと合わせるよう従来の方法を採用することが可能である。例えば、罫線テンプレートに対して抽出された罫線を連続的にシフトして、罫線テンプレートと抽出された罫線との間の類似度を計算することが可能である。罫線テンプレートと抽出された罫線との間の相対位置関係の下で最大類似度が得られる場合に、この相対位置関係の下で、罫線テンプレートは抽出された罫線と一致していると決定される。
【0050】
互いに一致する場合において、罫線テンプレート内のテンプレートセルと抽出された罫線によって囲まれるセルとの間の対応を決定することができる。抽出された罫線によって囲まれるセルとマッピングされたセルとの間の対応のために、罫線テンプレート内のテンプレートセルとマッピングされたセルとの間の対応を決定することができる。
【0051】
ステップ906で、画像処理装置の位置マッピング部103が、互いに対応するセル(罫線テンプレートにおけるテンプレートセル及び実二次元空間におけるマッピングされたセル)の各対に関して、テンプレートセルにおける画素のそれぞれの位置を、当該対のセルの間のアフィン変換に基づいて、実二次元空間における実位置にマッピングする。
【0052】
アフィン変換関係が、互いに対応するテンプレートセルとマッピングされたセルとの間に存在するとすれば、テンプレートセルにおけるいずれかの画素が共直線線及び一定線分非特性を用いることによってマッピングされるセルにおける点を決定することが可能である。
【0053】
代替の実施形態において、アフィン変換は、平行な面の間のアフィン変換に単純化されてよい。この場合において、マッピングされたセルを、対応するテンプレートセルを回転させることにより得られたものと考えることが可能である。実施形態において、テンプレートセルに対するマッピングされたセルの回転角を計算し、該回転角に従ってテンプレートセルにおけるいずれかの点に対応するマッピングされたセルにおける点の位置を計算することが可能である。
【0054】
ステップ908で、画像処理装置の画像値生成部104が、画素値を、実位置に対応するテンプレートにおける画素の画素値として、実位置に隣接する位置にある画像内の複数の画素の画素値に基づいて生成する。
【0055】
実位置(i’+a,j’+b)が仮定され、i’、j’は実数の整数部分であり、a、bは実数の少数部分である。実位置(i’+a,j’+b)に隣接する画素の位置は、それぞれ、(i’,j’)、(i’+1,j’)、(i’,j’+1)、(i’+1,j’+1)である。隣接する画素の位置は、記載される画素位置に限定されず、それらは、また、他の隣接画素の位置を有してよいことに留意されたい。実位置に対応するテンプレートセルにおける画素の位置は(i,j)である。
【0056】
一実施形態において、実位置に隣接する位置を有する画素内の複数の画素の画素値(例えば、(i’,j’)、(i’+1,j’)、(i’,j’+1)、(i’+1,j’+1))の加重和を計算することによって画素値を生成することが可能である。各画素の位置と実位置との間の距離が短ければ短いほど、対応する画素値の重みはますます大きくなる。例えば、(i’+a,j’+b)の実位置を考えると、生成される画素値は、(1−a)×(1−b)×f(i’,j’)+a×(1−b)×f(i’+1,j’)+b×(1−a)×f(i’,j’+1)+a×b×f(i’+1,j’+1)であってよい。ここで、f(x,y)は、画像内の画素(x,y)の画素値である。
【0057】
他の実施形態において、実位置に隣接する位置を有する画像内の複数の画素の画素値(例えば、(i’,j’)、(i’+1,j’)、(i’,j’+1)、(i’+1,j’+1))の最小値、すなわち、min{f(i’,j’),f(i’+1,j’),f(i’,j’+1),f(i’+1,j’+1)}を、生成された画素値と見なすことが可能である。ここで、f(x,y)は、画像内の画素(x,y)の画素値である。
【0058】
ステップ910で、画像処理装置の画像生成部105が、罫線テンプレートの罫線を、生成された画素値を有するテンプレートセルにおける画素とマージすることによって、画像に対応する合成画像112を生成する。すなわち、合成画像112は、罫線テンプレートにおける罫線と、テンプレートセルにおける非罫線画素とを含む。合成画像112における非罫線画素に関し、それらの画素値は、ステップ908により得られた値である。
【0059】
ステップ912で、帳票テンプレート生成部106が、複数の画像に対応する合成画像112に基づいて、帳票テンプレートを得る。従来の方法が、複数の画像に対応する合成画像に基づいて帳票テンプレートを得るよう採用されてよい。例えば、米国特許第6886136号明細書に記載される方法を採用することが可能である。方法はステップ914で終了する。代替的に、ステップ912で、次の方法により帳票テンプレートを取得することが可能である:帳票テンプレートにおける画素のそれぞれに関して、複数の合成画像における対応する画素の最小画素値が、当該画素の画素値として取得される。
【0060】
本発明の実施形態に従って、変形及び歪曲がセル単位で補正されるので、より正確に文書画像における歪曲を取り除き、文書位置合わせの品質を確かにし、それによって、帳票テンプレートの正確性を高めることができる。
【0061】
更に、複数の画像に基づいて罫線テンプレートを取得することも可能である。
【0062】
図10は、本発明の実施形態に従う罫線テンプレート生成部の構成例を表すブロック図である。この罫線テンプレート生成部は、独立して実施されてよく、あるいは、図1を参照して記載される装置に含まれてよい。
【0063】
図10に示されるように、罫線テンプレート生成部は、罫線累算部1001と、罫線テンプレート生成部1002とを有する。
【0064】
罫線累算部1001は、抽出された罫線を複数の画像の間で互いと合わせ、複数の画像の抽出された罫線における画素の画素値をブランク画像において累算する。
【0065】
罫線テンプレート生成部1002は、所定閾値よりも大きい累算値を有するブランク画像の画素を罫線において1とみなすことによって、罫線テンプレートを生成する。
【0066】
図11は、本発明の実施形態に従う罫線テンプレート生成のプロセス例を表す概略図である。
【0067】
図11に示されるように、プロセスの開始として、罫線1101,・・・,1101はそれぞれ、複数の画素から抽出される。抽出された罫線1101,・・・,1101は、複数の画像の間で、互いと合わせられる。ステップ1102で、複数の画像の抽出された罫線1101,・・・,1101における画素の画素値は、ブランク画像において累算される。ステップ1103で、罫線テンプレート1104は、所定閾値よりも大きい累算値を有するブランク画像の画素を罫線において1とみなすことによって、生成される。
【0068】
当業者には明らかなように、本発明の態様は、システム、方法又はコンピュータプログラムプロダクトとして具現されてよい。然るに、本発明の態様は、全体としてハードウェア実施形態を、全体としてソフトウェア実施形態(ファームウェア、常駐ソフトウェア、マクロコード等を含む。)を、又は本願において「回路」、「モジュール」若しくは「システム」と広く呼ばれるソフトウェア態様及びハードウェア態様を組み合わせた実施形態をとってよい。更に、本発明の態様は、コンピュータ可読プログラムコードを記録した1又はそれ以上のコンピュータ可読媒体において具現されるコンピュータプログラムプロダクトの形態をとってよい。
【0069】
1又はそれ以上のコンピュータ可読媒体の何らかの組合せが利用されてよい。コンピュータ可読媒体は、コンピュータ可読信号媒体又はコンピュータ可読記憶媒体であってよい。コンピュータ可読記憶媒体は、例えば、電子式、磁気式、光学式、赤外線式、又は半導体式のシステム、装置、若しくはデバイス、又はそれらのいずれかの適切な組合せであってよいが、これらに限られない。コンピュータ可読記憶媒体のより具体的な例(非包括的な列挙)には、次のものがある:携帯型コンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読出専用メモリ(ROM)、消去可能プログラム可能ROM(EPROM又はフラッシュメモリ)、携帯型コンパクトディスクROM(CD−ROM)、光記憶デバイス、磁気記憶デバイス、又はそれらのいずれかの適切な組合せ。本明細書との関連で、コンピュータ可読記憶媒体は、命令実行システム、装置又はデバイスによって又はそれに関連して使用されるプログラムを含む又は記憶することができる何らかの有形媒体であってよい。
【0070】
本発明の態様のための動作を行うコンピュータプログラムコードは、例えばJava(登録商標)、Smalltalk、C++等のオブジェクト指向のプログラミング言語と、例えばCプログラミング言語又は同様のプログラミング言語等の従来の手続き型プログラミング言語とを含む1又はそれ以上のプログラミング言語のいずれかの組合せで書かれてよい。プログラムコードは、全体としてユーザのコンピュータにおいて、又はスタンドアローンのソフトウェアパッケージとして、部分的にユーザのコンピュータにおいて、又は部分的にユーザのコンピュータにおいて、そして、部分的に遠隔のコンピュータにおいて、又は全体として遠隔のコンピュータ若しくはサーバにおいて、実行されてよい。後者の場合に、遠隔のコンピュータは、ローカルエリアネットワーク(LAN)若しくはワイドエリアネットワーク(WAN)を含む何らかのタイプのネットワークを通じてユーザのコンピュータに接続されてよく、あるいは、接続は(例えば、インターネットサービスプロバイダを用いてインターネットを通じて)外部コンピュータに対してなされてよい。
【0071】
図12は、本発明の装置及び方法を実施するためのコンピュータの構成例を表すブロック図である。
【0072】
図12において、中央演算処理ユニット(CPU)1201は、読出専用メモリ(ROM)1202に記憶されているプログラム、又は記憶部1208からランダムアクセスメモリ(RAM)1203にロードされるプログラムに従って、様々な処理を実行する。RAM1203には、CPU1201が様々な処理を実行する場合に必要とされるデータ等も必要に応じて記憶される。
【0073】
CPU1201、ROM1202及びRAM1203は、バス1204を介して互いに接続されている。入出力インターフェース1205もバス1204に接続されている。
【0074】
次の構成要素が入出力インターフェース1205に接続されている:キーボード、マウス等を含む入力部1206、陰極線管(CRT)、液晶ディスプレイ(LCD)等のディスプレイ及びラウドスピーカ等を含む出力部1207、ハードディスクを含む記憶部1208、並びにLANカード、モデム等のネットワークインターフェースカードを含む通信部1209。通信部1209は、インターネット等のネットワークを介して通信処理を行う。
【0075】
ドライブ1210も、必要に応じて、入出力インターフェース1205に接続される。例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等の取り外し可能な媒体1211が必要に応じてドライブ1210に実装され、それにより、その媒体から読み出されたコンピュータプログラムが必要に応じて記憶部1208にインストールされる。
【0076】
上記ステップ及び処理がソフトウェアによって実施される場合において、ソフトウェアを構成するプログラムは、インターネット等のネットワーク又は取り外し可能な媒体1211等の記憶媒体からインストールされる。
【0077】
当業者には明らかなように、この記憶媒体は、図12に表されるような、プログラムをユーザに提供するアプローチとは別個に供給されるプログラムを記憶している取り外し可能な媒体1211に限られない。取り外し可能な媒体1211の例には、磁気ディスク、光ディスク(コンパクトディスク−読出専用メモリ(CD−ROM)及びデジタルバーサタイルディスク(DVD)を含む。)、光磁気ディスク(ミニディスク(MD)を含む。)、及び半導体メモリがある。代替的に、記憶媒体は、プログラムを記憶しており且つそれに含まれる方法とともにユーザに提供されるROM1202、記憶部1208に含まれるハードディスク等であってよい。
【0078】
特許請求の範囲に記載される全ての手段若しくはステップ及び機能要素の対応する構成、材料、動作及び均等物は、具体的に請求される他の要素と組み合わせて機能を実行するよう何らかの構成、材料又は動作を含むよう意図される。本発明の記載は、例示及び説明のために提供されており、開示される形態において本発明を限定するよう意図されない。多くの改良及び変形は、本発明の適用範囲及び精神から逸脱しない範囲で、当業者に明らかであろう。実施形態は、本発明の原理及び実際の応用を最もよく説明するために、更に、当業者が想到される特定の使用に適した様々な変更を伴った様々な実施形態に関して本発明を理解することを可能にするために、選択及び記載された。
【0079】
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
複数の画像のそれぞれから罫線を抽出し、該抽出された罫線を実二次元空間にマッピングする罫線抽出部と、
前記画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の前記抽出された罫線と前記罫線テンプレートとの間の相対関係がより一致する位置に合わせ、前記マッピングされた罫線によって囲まれるセルと前記罫線テンプレートの罫線よって囲まれるテンプレートセルとの間の対応を決定する対応決定部と、
互いに対応するセルの各対に関して、当該対のセル間のアフィン変換に基づいて、前記テンプレートセル内の画素のそれぞれの位置を前記実二次元空間における実位置にマッピングする位置マッピング部と、
前記実位置に対応する前記テンプレートセル内の画素の画素値として、前記実位置に隣接する位置にある画像内の複数の画素の画素値に基づいて画素値を生成する画素値生成部と、
前記罫線テンプレートの罫線を、生成された画素値を有する前記テンプレートセル内の画素とマージすることによって、各画像に対応する合成画像を生成する画像生成部と、
前記複数の画像に対応する合成画像に基づいて帳票テンプレートを得る帳票テンプレート生成部と
を有する、画像処理装置。
(付記2)
前記複数の画像の間で前記抽出された罫線を互いと合わせ、前記複数の画像の前記抽出された罫線における画素の画素値をブランク画像において累算する罫線累算部と、
所定閾値よりも大きい累算値を有する前記ブランク画像の画素を前記罫線において1とみなすことによって、前記罫線テンプレートを生成する罫線テンプレート生成部と
を更に有する、付記1に記載の画像処理装置。
(付記3)
前記アフィン変換は、平行な面の間の1つである、
付記1又は2に記載の画像処理装置。
(付記4)
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、(1−a)×(1−b)×f(i,j)+a×(1−b)×f(i+1,j)+b×(1−a)×f(i,j+1)+a×b×f(i+1,j+1)であり、f(x、y)は、画像内の画素(x,y)の画素値である、
付記1又は2に記載の画像処理装置。
(付記5)
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)}であり、f(x、y)は、画像内の画素(x,y)の画素値である、
付記1又は2に記載の画像処理装置。
(付記6)
前記帳票テンプレート生成部は、更に、前記帳票テンプレート内の画素のそれぞれに関して、当該画素の画素値として複数の合成画像における対応する画素の最小画素値を取得するよう構成される、
付記1又は2に記載の画像処理装置。
(付記7)
複数の画像のそれぞれから罫線を抽出し、該抽出された罫線を実二次元空間にマッピングし、
前記画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の前記抽出された罫線と前記罫線テンプレートの罫線との間の相対関係がより一致する位置に合わせ、前記マッピングされた罫線によって囲まれるセルと前記罫線テンプレートの罫線によって囲まれるテンプレートセルとの間の対応を決定し、
互いに対応するセルの各対に関して、当該対のセル間のアフィン変換に基づいて、前記テンプレートセル内の画素のそれぞれの位置を前記実二次元空間における実位置にマッピングし、
前記実位置に対応する前記テンプレートセル内の画素の画素値として、前記実位置に隣接する位置にある画像内の複数の画素の画素値に基づいて画素値を生成し、
前記罫線テンプレートの罫線を、生成された画素値を有する前記テンプレートセル内の画素とマージすることによって、各画像に対応する合成画像を生成し、
前記複数の画像に対応する合成画像に基づいて帳票テンプレートを得る
処理を画像処理装置が実施することを特徴とする画像処理方法。
(付記8)
前記複数の画像の間で前記抽出された罫線を互いと合わせ、前記複数の画像の前記抽出された罫線における画素の画素値をブランク画像において累算し、
所定閾値よりも大きい累算値を有する前記ブランク画像の画素を前記罫線において1とみなすことによって、前記罫線テンプレートを生成する
更なる処理を前記画像処理装置が実施することを特徴とする、付記7に記載の画像処理方法。
(付記9)
前記アフィン変換は、平行な面の間の1つである、
付記7又は8に記載の画像処理装置。
(付記10)
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、(1−a)×(1−b)×f(i,j)+a×(1−b)×f(i+1,j)+b×(1−a)×f(i,j+1)+a×b×f(i+1,j+1)であり、f(x、y)は、画像内の画素(x,y)の画素値である、
付記7又は8に記載の画像処理方法。
(付記11)
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)}であり、f(x、y)は、画像内の画素(x,y)の画素値である、
付記7又は8に記載の画像処理方法。
(付記12)
前記帳票テンプレートを得る処理は、前記帳票テンプレート内の画素のそれぞれに関して、当該画素の画素値として複数の合成画像における対応する画素の最小画素値を取得する処理を有する、
付記7又は8に記載の画像処理方法。
【符号の説明】
【0080】
100 画像処理装置
101 罫線抽出部
102 対応決定部
103 位置マッピング部
104 画素値生成部
105 画像生成部
106 帳票テンプレート生成部
111,1104 罫線テンプレート
112 合成画像
601 テンプレートセル
602 マッピングされたセル
1001 罫線累算部
1002 罫線テンプレート生成部
1101,1101 罫線

【特許請求の範囲】
【請求項1】
複数の画像のそれぞれから罫線を抽出し、該抽出された罫線を実二次元空間にマッピングする罫線抽出部と、
前記画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の前記抽出された罫線と前記罫線テンプレートとの間の相対関係がより一致する位置に合わせ、前記マッピングされた罫線によって囲まれるセルと前記罫線テンプレートの罫線よって囲まれるテンプレートセルとの間の対応を決定する対応決定部と、
互いに対応するセルの各対に関して、当該対のセル間のアフィン変換に基づいて、前記テンプレートセル内の画素のそれぞれの位置を前記実二次元空間における実位置にマッピングする位置マッピング部と、
前記実位置に対応する前記テンプレートセル内の画素の画素値として、前記実位置に隣接する位置にある画像内の複数の画素の画素値に基づいて画素値を生成する画素値生成部と、
前記罫線テンプレートの罫線を、生成された画素値を有する前記テンプレートセル内の画素とマージすることによって、各画像に対応する合成画像を生成する画像生成部と、
前記複数の画像に対応する合成画像に基づいて帳票テンプレートを得る帳票テンプレート生成部と
を有する、画像処理装置。
【請求項2】
前記複数の画像の間で前記抽出された罫線を互いと合わせ、前記複数の画像の前記抽出された罫線における画素の画素値をブランク画像において累算する罫線累算部と、
所定閾値よりも大きい累算値を有する前記ブランク画像の画素を前記罫線において1とみなすことによって、前記罫線テンプレートを生成する罫線テンプレート生成部と
を更に有する、請求項1に記載の画像処理装置。
【請求項3】
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、(1−a)×(1−b)×f(i,j)+a×(1−b)×f(i+1,j)+b×(1−a)×f(i,j+1)+a×b×f(i+1,j+1)であり、f(x、y)は、画像内の画素(x,y)の画素値である、
請求項1又は2に記載の画像処理装置。
【請求項4】
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)}であり、f(x、y)は、画像内の画素(x,y)の画素値である、
請求項1又は2に記載の画像処理装置。
【請求項5】
前記帳票テンプレート生成部は、更に、前記帳票テンプレート内の画素のそれぞれに関して、当該画素の画素値として複数の合成画像における対応する画素の最小画素値を取得するよう構成される、
請求項1又は2に記載の画像処理装置。
【請求項6】
複数の画像のそれぞれから罫線を抽出し、該抽出された罫線を実二次元空間にマッピングし、
前記画像のいずれかから罫線を抽出して罫線テンプレートを形成し、各画像の前記抽出された罫線と前記罫線テンプレートの罫線との間の相対関係がより一致する位置に合わせ、前記マッピングされた罫線によって囲まれるセルと前記罫線テンプレートの罫線によって囲まれるテンプレートセルとの間の対応を決定し、
互いに対応するセルの各対に関して、当該対のセル間のアフィン変換に基づいて、前記テンプレートセル内の画素のそれぞれの位置を前記実二次元空間における実位置にマッピングし、
前記実位置に対応する前記テンプレートセル内の画素の画素値として、前記実位置に隣接する位置にある画像内の複数の画素の画素値に基づいて画素値を生成し、
前記罫線テンプレートの罫線を、生成された画素値を有する前記テンプレートセル内の画素とマージすることによって、各画像に対応する合成画像を生成し、
前記複数の画像に対応する合成画像に基づいて帳票テンプレートを得る
処理を画像処理装置が実施することを特徴とする画像処理方法。
【請求項7】
前記複数の画像の間で前記抽出された罫線を互いと合わせ、前記複数の画像の前記抽出された罫線における画素の画素値をブランク画像において累算し、
所定閾値よりも大きい累算値を有する前記ブランク画像の画素を前記罫線において1とみなすことによって、前記罫線テンプレートを生成する
更なる処置を前記画像処理装置が実施することを特徴とする、請求項6に記載の画像処理方法。
【請求項8】
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、(1−a)×(1−b)×f(i,j)+a×(1−b)×f(i+1,j)+b×(1−a)×f(i,j+1)+a×b×f(i+1,j+1)であり、f(x、y)は、画像内の画素(x,y)の画素値である、
請求項6又は7に記載の画像処理方法。
【請求項9】
前記実位置が(i+a,j+b)であるとすると、生成される画素値は、min{f(i,j),f(i+1,j),f(i,j+1),f(i+1,j+1)}であり、f(x、y)は、画像内の画素(x,y)の画素値である、
請求項6又は7に記載の画像処理方法。
【請求項10】
前記帳票テンプレートを得る処理は、前記帳票テンプレート内の画素のそれぞれに関して、当該画素の画素値として複数の合成画像における対応する画素の最小画素値を取得する処理を有する、
請求項6又は7に記載の画像処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2012−43433(P2012−43433A)
【公開日】平成24年3月1日(2012.3.1)
【国際特許分類】
【出願番号】特願2011−177999(P2011−177999)
【出願日】平成23年8月16日(2011.8.16)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】