説明

画像識別装置および画像識別方法

【課題】専用の帳票を必要とせず、罫線のない帳票にも適用可能で、しかも類似帳票を正しく識別することができる画像識別装置および画像識別方法を提供する。
【解決手段】第1の画像としてのマスター画像を入力するマスター画像入力部101と、第2の画像としてのデータ画像を入力するデータ画像入力部102と、マスター画像に対して指定されるマスク領域の組を入力するマスク領域入力部104と、マスター画像とデータ画像とを整合させる画像整合部103と、整合されたマスター画像とデータ画像との間で、マスク領域を除いた差分を抽出する差分抽出部105と、抽出された差分の大きさにもとづいてマスター画像とデータ画像との相違度を出力する相違度出力部106と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、識別対象であるデータ画像が、リファレンスであるマスター画像と同種のものか別種のものかを判定する画像識別装置および画像識別方法に関し、特にデータ画像とマスター画像を定型帳票画像とする帳票種識別の分野に関する。
【背景技術】
【0002】
定型帳票のデータ処理システムにおいては通常、帳票上に記入された文字の自動読み取り(OCR)を実行する際、各文字の記入位置情報等の帳票定義データをあわせて必要とする。したがって、複数種類の定型帳票を対象とする場合、帳票定義データが帳票種毎に異なるため、OCRに先立って、入力された画像の帳票種を識別する必要がある。
【0003】
従来は、各帳票種毎に特有のマークや記号を帳票上に印刷しておき、その有無を認識して帳票種を識別する方法が一般的であったが、専用の帳票設計が必要で、既存業務のシステム化に際して帳票の切り替えに伴う手間とコストがかかってしまうこと、マークや記号上にノイズ・つぶれ・かすれが発生すると識別できないこと、が問題となっていた。
【0004】
この問題を解決するため、例えば特許文献1では、罫線情報の照合にもとづいて帳票種識別を行う方法が示されている。この方法は、特有のマークや記号を必要とせず、罫線全体の情報を総合的に用いるので、入力画像の一部にノイズ・つぶれ・かすれがあっても識別が可能となるものの、罫線のない帳票には適用することができない。
【0005】
そこで、特許文献2に示された方法では、罫線に限らず、プレ印刷文字等を含めた複数の対応点を入力画像(データ画像)とリファレンス画像(マスター画像)との間で見い出し、対応点間の座標変換を求め、当該変換係数にもとづいて算出される相違度、あるいは係数と閾値との比較をもって、帳票種識別を行っている。
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記した方法では、デザイン・レイアウトの差異が小さい類似帳票種同士を正しく識別することが難しい。座標変換がもたらす幾何的なずれ作用・歪み作用の中には、異なる帳票種間で生じる「帳票デザイン・レイアウトの差異」による本質要因と、帳票種の同異を問わず生じる「帳票原稿上の文字記入・押印・汚れ」「画像データ上のノイズ・つぶれ・かすれ・傾き」による揺らぎ要因とが混在している。通常は、本質要因の及ぼす影響がずっと大きいので、十分に正しい識別を行うことができる。
【0007】
しかし、類似帳票種同士では本質要因の及ぼす影響が小さく、揺らぎ要因と同程度になってしまうことが多いため、結果的に識別を誤る可能性が高くなる。
【0008】
本発明は、上記課題を鑑みてなされたものであり、その目的とするところは、専用の帳票を必要とせず、罫線のない帳票にも適用可能で、しかも類似帳票を正しく識別することができる画像識別装置および画像識別方法を提供することにある。
【課題を解決するための手段】
【0009】
かかる目的を達成するために、本発明は、以下の特徴を有することとする。
【0010】
本発明に係る画像識別装置は、第1の画像としてのマスター画像を入力するマスター画像入力手段と、第2の画像としてのデータ画像を入力するデータ画像入力手段と、マスター画像に対して指定されるマスク領域の組を入力するマスク領域入力手段と、マスター画像とデータ画像とを整合させる画像整合手段と、整合されたマスター画像とデータ画像との間で、マスク領域を除いた差分を抽出する差分抽出手段と、抽出された差分の大きさにもとづいてマスター画像とデータ画像との相違度を出力する相違度出力部と、を備えることを特徴とする。
【発明の効果】
【0011】
本発明によれば、特有のマークや記号、また罫線のない帳票を含めた、多種多様な定型帳票を対象に、類似帳票種の識別を正しく行うことができる。
【図面の簡単な説明】
【0012】
【図1】本発明の第1の実施形態による画像識別装置の構成図である。
【図2】本発明の第1の実施形態によるフローチャートを示す図である。
【図3】本発明の前景マスク処理を示す図である。
【図4】本発明の整合変形を示す図である。
【図5】本発明の太め処理を示す図である。
【図6】本発明の減算処理を示す図である。
【図7】本発明のマスター画像減算結果を示す図である。
【図8】本発明の第2の実施形態によるフローチャートを示す図である。
【図9】本発明のデータ画像減算結果を示す図である。
【図10】本発明の第3の実施形態によるマージン処理を示す図である。
【図11】本発明の第4の実施形態によるコンピュータを示す構成図である。
【発明を実施するための形態】
【0013】
(第1の実施形態)
以下、発明の実施の形態について図面により詳細に説明する。図1は、本発明の第1の実施形態による画像識別装置の構成図である。
【0014】
画像識別装置は、マスター画像を入力するマスター画像入力部101と、データ画像を入力するデータ画像入力部102と、マスター画像とデータ画像とを整合させる画像整合部103と、マスター画像に対して指定されるマスク領域の組を入力するマスク領域入力部104と、整合されたマスター画像とデータ画像との間で、マスク領域を除いた差分を抽出する差分抽出部105と、抽出された差分の大きさに基づいてマスター画像とデータ画像との相違度を出力する相違度出力部106とを備えている。
【0015】
また、画像識別装置は、データを一時的に保存するマスター画像バッファ111とデータ画像バッファ112とアフィン変換係数バッファ113とマスク領域バッファ114と一時画像バッファA115と一時画像バッファB116とを備えている。
【0016】
図2は、本発明の第1の実施形態によるフローチャートを示す図である。以下、図2のフローチャートを参照しながら本発明の処理動作を説明する。
【0017】
まず、ある未記入帳票のマスター画像は、スキャナー等により構成されるマスター画像入力部101へ入力され(ステップS201)、白黒二値のデジタル画像データとしてマスター画像バッファ111へ保存される。同様に、何らかの記入済み帳票にあたるデータ画像は、スキャナー等により構成されるデータ画像入力部102へ入力され(ステップS202)、白黒二値のデジタル画像データとしてデータ画像バッファ112へ保存される。
【0018】
また、マスター画像上で文字が記入され得る矩形領域であるマスク領域の組は、各矩形の始点座標と終点座標からなるデータ列としてマスク領域入力部104に入力され(ステップS203)、マスク領域バッファ114へ保存される。
【0019】
つづいて、画像整合部103にて、バッファ上のマスター画像とデータ画像を互いに整合させるためのアフィン変換を求める(ステップS204)。本実施形態では、データ画像平面をマスター画像平面へ写像するアフィン変換のみを求め、その逆変換を求めることはしない。このアフィン変換を求める処理については公知の方法を用いることとし、ここでは説明を省略する。もし、マスター画像とデータ画像の差異があまりに大きい等の理由により、適切なアフィン変換を求めることができなかった場合は(ステップS204、No)、この時点で、データ画像をリジェクトする(ステップS205)。
【0020】
適切なアフィン変換が求まるとき(ステップS204、Yes)、その変換式は次のようなものである。
【0021】
[式1]
X=a*x+b*y+e
Y=c*x+d*y+f
(x,y):データ画像上の座標
(X,Y):対応するマスター画像上の座標
a,b,c,d,e,f:アフィン変換係数
【0022】
式中の係数a〜fは、アフィン変換係数バッファ113へ保存される。
【0023】
つづいて、図3に示すように、差分抽出部105にて、入力マスター画像に対し、マスク領域のいずれかに含まれるすべての画素値を、前景である黒に置き換えた画像データを一時画像バッファA115に作成する(ステップS206)。これは白画素=0・黒画素=1で表現される二値画像の場合、マスク領域内部の画素値をすべて1に置き換えることに相当する。視覚的には、マスター画像上で文字が記入され得る領域を黒く塗りつぶしたことになる。
【0024】
つづいて、データ画像座標(x,y)から、式1によって対応させられる一時画像バッファAの座標(X,Y)の画素値を各々並べた画像データを、一時画像バッファB116に作成する。この際、式1から求まる座標(X,Y)は小数点以下四捨五入するものとし、これがもしマスター画像の範囲をはみ出すような場合には、画素値=白とみなす。
【0025】
図4に示すように、一時画像バッファB上の画像データは、データ画像と同じ幅・高さを持つ画像データであり、アフィン変換にもとづいてマスター画像をデータ画像に整合するよう変形させた結果とみなすことができる(ステップS207)。
【0026】
つづいて、一時画像バッファB上の、前景マスク+整合変形されたマスター画像に対し、太め処理を行う。ここでは例として、図5に示すように、バッファ上の各黒画素について、当画素を中心とする3×3画素をすべて黒にする(ステップS208)。太め処理は、後段の減算処理において、アフィン変換が有する整合誤差を吸収するために行われる。太め処理された結果画像データは、一時画像バッファAに、既存内容を破棄して上書きされる。
【0027】
つづいて、データ画像から、前景マスク+整合変形+太め処理されたマスター画像を減算する(ステップS209)。画像の減算とは、データ画像バッファのある座標(x,y)の画素値をCd、一時画像バッファAの同座標の画素値をCmとしたとき、同座標における減算結果の画素値Csを、
・Cd=黒、Cm=黒ならばCs=白
・Cd=白、Cm=黒ならばCs=白
・Cd=黒、Cm=白ならばCs=黒
・Cd=白、Cm=白ならばCs=白
により決定する演算である(図6)。
【0028】
減算結果は、データ画像と同じ幅・高さを持つ画像データであり、帳票のプレ印刷部分、および予め文字が記入され得るとわかっているマスク領域を除いて、「未記入帳票には存在せず、記入済み帳票のみに存在する」差分が、黒画素として残っていると考えられる。前述の太め処理によって、マスター画像側の黒画素部分をやや広げてあるので、アフィン変換係数の推定誤差や座標値の四捨五入に起因する若干の整合誤差は、広げた黒画素範囲に吸収される。こうして得られた減算結果は、一時画像バッファBに、既存内容を破棄して上書きされる。
【0029】
つづいて、相違度出力部106にて、一時画像バッファB上の黒画素数をカウントし(ステップS210)、結果に対する画像サイズの影響を抑えるため、データ画像の面積で正規化した値を、相違度として出力する(ステップS211)。すなわち、
【0030】
[式2]
S=N/(W*H)
S:相違度
N:一時画像バッファB上の黒画素数
W:データ画像の幅
H:データ画像の高さ
【0031】
こうしてデータ画像と1つのマスター画像との相違度Sが得られる。データ画像が当該マスター画像と同じ帳票種であれば、減算結果画像は真っ白に近いはずなので、Sは低くなる。一方、データ画像が当該マスター画像とデザイン・レイアウトが異なる帳票種であれば、たとえ類似帳票同士であったとしても、減算結果画像には目視ではっきり確認できる大きさの黒画素塊が相当数残存するはずなので、Sは高くなる(図7)。
【0032】
すべてのマスター画像について、上記の方法を適用して相違度を取得した後、最も相違度の低いマスター画像の帳票種を、当該データ画像の帳票種であると判定することにより、画像識別(帳票種識別)が実現される。
【0033】
(第2の実施形態)
処理の前半は、先の第1の実施形態と同じであるから説明を省略する。第1の実施形態との違いは、差分抽出処理部にて、第1の実施形態で求めた相違度Sと異なる第2の相違度Tを算出し、画像識別に用いることである。
【0034】
図8は、本発明の第2の実施形態によるフローチャートを示す図である。以下、図8のフローチャートを参照しながら本発明の処理動作を説明する。
【0035】
ここではまず、第1の実施形態に従って、第1の相違度Sを算出する。続いて、差分抽出部にて、入力マスター画像に対し、マスク領域のいずれかに含まれるすべての画素値を、背景である白に置き換えた画像データを一時画像バッファAに、既存内容を破棄して上書きする(ステップS301)。これは白画素=0・黒画素=1で表現される二値画像の場合、マスク領域内部の画素値をすべて0に置き換えることに相当する。視覚的には、マスター画像上で文字が記入され得る領域を白く塗り潰したことになる。
【0036】
つづいて、第1の実施形態と同様に、アフィン変換に基づいてマスター画像をデータ画像に整合するよう変形させた画像データを、一時画像バッファBに、既存内容を破棄して上書きする(ステップS302)。
【0037】
つづいて、データ画像バッファ上のデータ画像に対し、第1の実施形態と同じ太め処理を行う(ステップS303)。太め処理された結果画像データは、一時画像バッファAに、既存内容を破棄して上書きされる。
【0038】
つづいて、背景マスク+整合変形処理されたマスター画像から、太め処理されたデータ画像を減算する(ステップS304)。この減算も第1の実施形態と同様、一時画像バッファBのある座標(x,y)の画素値をCm、一時画像バッファAの同座標の画素値をCdとしたとき、同座標における減算結果の画素値Csを、
・Cm=黒、Cd=黒ならばCs=白
・Cm=白、Cd=黒ならばCs=白
・Cm=黒、Cd=白ならばCs=黒
・Cm=白、Cd=白ならばCs=白
により決定する演算である。
【0039】
減算結果は、データ画像と同じ幅・高さを持つ画像データであり、「未記入帳票に存在していたのが、記入済み帳票では存在しない」差分が、黒画素として残っていると考えられる。前述の太め処理によってデータ画像側の黒画素部分をやや広げてあるので、アフィン変換係数の推定誤差や座標値の四捨五入に起因する若干の整合誤差は、広げた黒画素範囲に吸収される。こうして得られた減算結果は、一時画像バッファBに、既存内容を破棄して上書きされる。
【0040】
つづいて、相違度出力部にて、一時画像バッファB上の黒画素数をカウントし(ステップS305)、結果に対する画像サイズの影響を抑えるため、データ画像の面積で正規化した値を、第2の相違度として出力する(ステップS306)。すなわち、
【0041】
[式3]
T=K/(W*H)
T:第2相違度
K:一時画像バッファB上の黒画素数
W:データ画像の幅
H:データ画像の高さ
【0042】
こうしてデータ画像と1つのマスター画像との第2相違度Tが得られる。データ画像が当該マスター画像と同じ帳票種であれば、減算結果画像は真っ白に近いはずなので、Tは低くなる。一方、データ画像が当該マスター画像とデザイン・レイアウトが異なる帳票種であれば、たとえ類似帳票同士であったとしても、減算結果画像には目視ではっきり確認できる大きさの黒画素塊が相当数残存するはずなので、Tは高くなる(図9)。
【0043】
すべてのマスター画像について、上記の方法を適用して相違度S、Tを取得した後、両者の和(S+T)が最も低いマスター画像の帳票種を、当該データ画像の帳票種であると判定することにより、画像識別(帳票種識別)が実現される。
【0044】
(第3の実施形態)
マスター画像やデータ画像の原稿をスキャナー等で読み取る際には、紙のゆがみ・パンチ穴・スキャナー台への原稿の置き方・その他の要因により、画像の端に近い箇所に大きな影が写り込む場合がある。また、原稿がFAX受信文書である場合、上端や下端付近に受信日時や発信元が印字されてしまうことがある。これらはいずれも、差分にもとづく画像識別をかく乱する揺らぎ要因となり得る。
【0045】
第3の実施形態は、そのような揺らぎ要因を排除するためのものである。処理のほとんどは、先の第1または第2の実施形態と同じであるから説明を省略する。第1または第2の実施形態との違いは、差分抽出部の最初に、マスター画像およびデータ画像の端から所定幅のマージン部分を、白画素に置き換える処理を実行することである。
【0046】
具体的には、式1のアフィン変換が求まった後に続く処理として行う。本実施形態では、マージン幅を15ミリメートルとし、横解像度Hx(dpi)と縦解像度Hy(dpi)は、データ画像とマスター画像の間で一致しているものとする。すると、ミリメートルをピクセルに変換した横マージン画素幅Mx・縦マージン画素幅Myは、次のようになる。
【0047】
[式4]
Mx=Hx*15/25.4 (小数点以下切捨て)
My=Hy*15/25.4 (小数点以下切捨て)
【0048】
そして、マスター画像バッファ、およびデータ画像バッファ上の画像データに対し、図10に例示した点線から外側の領域に含まれるすべての画素値を白に置き換える。以降は第1または第2の実施形態に従う。
【0049】
(第4の実施形態)
本発明は、コンピュータ上のプログラムに実行させることもできる。図11は、本発明の第4の実施形態によるコンピュータを示す構成図である。
【0050】
CD−ROM401等の記録媒体に記録された本発明に関わるプログラムは、図のCD−ROMドライブ402を通じて(一旦ハードディスク403に蓄えられることもある)、実行時にはメモリ404上にロードされ、CPU405からの指令によってプログラムの処理ステップが順次実行される。マスター画像およびデータ画像に相当するデジタル画像データは、あらかじめハードディスク403上に蓄えられるか、または実行時に図示しないスキャナーを通じて取り込まれた後、メモリ404上にロードされて参照される。
【0051】
検査の判定結果は、メモリ404に保存され、必要に応じてハードディスク403に書き出されたり、ディスプレイ406に出力されたり、通信装置407を介してネットワーク上へ送出されたり、あるいは図示しないプリンターを通じて紙上に印字される。
【符号の説明】
【0052】
101 マスター画像入力部
102 データ画像入力部
103 画像整合部
104 マスク領域入力部
105 差分抽出部
106 相違度出力部
【先行技術文献】
【特許文献】
【0053】
【特許文献1】特開2003−109007号公報
【特許文献2】特許第3932201号公報

【特許請求の範囲】
【請求項1】
第1の画像としてのマスター画像を入力するマスター画像入力手段と、
第2の画像としてのデータ画像を入力するデータ画像入力手段と、
前記マスター画像に対して指定されるマスク領域の組を入力するマスク領域入力手段と、
前記マスター画像と前記データ画像とを整合させる画像整合手段と、
前記整合されたマスター画像とデータ画像との間で、前記マスク領域を除いた差分を抽出する差分抽出手段と、
抽出された差分の大きさに基づいて前記マスター画像と前記データ画像との相違度を出力する相違度出力部と、
を備えることを特徴とする画像識別装置。
【請求項2】
前記画像整合手段において、データ画像平面をマスター画像平面へ写像するアフィン変換、またはその逆変換を求めることを特徴とする請求項1記載の画像識別装置。
【請求項3】
前記差分抽出手段において、前記マスター画像上の前記マスク領域内の画素に前景属性を付与する前景マスク処理と、前記データ画像から前記マスター画像を減算するマスター画像減算処理を行うことを特徴とする、請求項1または2記載の画像識別装置。
【請求項4】
前記差分抽出手段において、前記マスター画像上の前記マスク領域内の画素に背景属性を付与する背景マスク処理と、前記マスター画像から前記データ画像を減算するデータ画像減算処理を行うことを特徴とする、請求項1〜3のいずれか1項に記載の画像識別装置。
【請求項5】
前記差分抽出手段において、前記マスター画像および前記データ画像の端から一定の、または都度動的に決定される幅のマージンに含まれる画素に背景属性を付与するマージン処理を行うことを特徴とする、請求項1〜4のいずれか1項に記載の画像識別装置。
【請求項6】
第1の画像としてのマスター画像、第2の画像としてのデータ画像、および前記マスター画像に対して指定されるマスク領域の組を入力するステップと、
前記マスター画像と前記データ画像とを整合させるステップと、
前記整合されたマスター画像とデータ画像との間で、前記マスク領域を除いた差分を抽出するステップと、
抽出された差分の大きさに基づいて前記マスター画像と前記データ画像との相違度を出力するステップと、からなることを特徴とする画像識別方法。
【請求項7】
前記マスター画像と前記データ画像とを整合させるステップは、データ画像平面をマスター画像平面へ写像するアフィン変換、またはその逆変換を求めるステップを含むことを特徴とする、請求項6記載の画像識別方法。
【請求項8】
前記整合されたマスター画像とデータ画像との間で、前記マスク領域を除いた差分を抽出するステップは、データ画像上で前景にあたり、かつ対応するマスター画像上の点が背景にあたり、かつ当該点が前記マスク領域のいずれにも包含されない点の集合を求めるステップを含むことを特徴とする、請求項6または7記載の画像識別方法。
【請求項9】
前記整合されたマスター画像とデータ画像との間で、前記マスク領域を除いた差分を抽出するステップは、前記データ画像上で背景にあたり、かつ対応する前記マスター画像上の点が前景にあたり、かつ当該点が前記マスク領域のいずれにも包含されない点の集合を求めるステップを含むことを特徴とする、請求項6〜8のいずれか1項に記載の画像識別方法。
【請求項10】
前記整合されたマスター画像とデータ画像との間で、前記マスク領域を除いた差分を抽出するステップは、前記マスター画像および前記データ画像の端から一定の、または都度動的に決定される幅のマージンを除いて差分を抽出することを特徴とする、請求項6〜9のいずれか1項に記載の画像識別方法。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2013−61764(P2013−61764A)
【公開日】平成25年4月4日(2013.4.4)
【国際特許分類】
【出願番号】特願2011−199273(P2011−199273)
【出願日】平成23年9月13日(2011.9.13)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】