画像処理装置、画像処理方法、画像形成装置、画像処理プログラム
【課題】帳票画像を読み取って罫線を認識する画像処理において、様々な形状を持つ罫線の角部を認識することができる。
【解決手段】幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理装置において、前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手段と、前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手段と、前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書と、前記特徴量抽出手段により抽出された特徴量と、前記特徴量辞書に保持されている前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手段と、を有する。
【解決手段】幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理装置において、前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手段と、前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手段と、前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書と、前記特徴量抽出手段により抽出された特徴量と、前記特徴量辞書に保持されている前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手段と、を有する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、画像形成装置、画像処理プログラムに関する。
【背景技術】
【0002】
スキャナ機能を有するMFP機(Multi Function Printer)などの画像処理装置において、表を含む帳票画像を読み取って処理を行う帳票認識処理が知られている。帳票認識処理において、帳票画像から表を形成する罫線を抽出し、ベクトルデータに変換したり、抽出した罫線をデジタルデータ化し、再利用したりする処理が行われる。当該処理を行うため、帳票画像から罫線を抽出する技術が既に公開されている。
【0003】
特許文献1に記載された技術によると、実線からなる罫線と、点線や破線等の非実線からなる罫線とで、異なる方法を用いて罫線を抽出する。実線罫線の場合、帳票画像から黒画素連結矩形を抽出し、罫線候補とする。実線でも罫線が分断されている場合があるため、あらかじめ統合許容パラメータを設定し、複数の黒画素連結矩形で統合許容パラメータの範囲内にあるものを統合し、実線罫線として認識する。非実線罫線の場合、線の種類に固有の長さの線を固有の間隔で固有の規則に従って繋いだパターンであるため、黒画素連結矩形の幅、高さ、及び隣接間距離のヒストグラムをとると、線種に固有の幅、高さ及び距離でピークを示す。このため、隣接した黒画素連結矩形間の距離を計算し、それらの幅、高さ及び距離のヒストグラムを計算し、ピークを示した幅、高さ、距離の黒画素連結矩形を統合し、非実線罫線として認識する。
【0004】
また、特許文献2に記載された技術によると、元の画像から潰れ気味の二値画像と、掠れ気味の二値画像を生成し、これらを用いて罫線を抽出する。潰れ気味の二値画像から線分候補領域を抽出し、各線分候補領域毎に掠れ気味の二値画像と元画像とを参照し、掠れ気味の二値画像を元画像で補完する処理が行われる。補完処理の結果、線分候補領域内で黒画素の割合が一定値以上である場合、その線分候補領域は実線罫線であると判断される。尚、特許文献2に記載された技術は、実線からなる罫線を抽出することを前提としており、破線や鎖線等の非実線罫線は想定していない。
【0005】
(特許文献1及び2参照)
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1の方法では、例えば非実線罫線において、幅、高さ及び距離のヒストグラムを作成し、黒画素連結矩形を罫線として認識する関係上、非実線罫線における罫線と罫線の交点が角丸等で構成されている場合の角部については認識することができない。固有の幅、高さ、距離でピークを示す法則が成り立たないためである。また、特許文献2の方法では、角部を含む領域について二値化画像を生成して、角丸等である角部の罫線を認識することができるものの、実線である罫線を認識することを前提としている。従って、罫線と罫線の交点が角丸等で構成され、なおかつ角部が点線である場合など、様々な形状を持つ角部について認識することができないという問題があった。
【0007】
本発明は、上記の点に鑑みてなされたものであって、帳票画像を読み取って罫線を認識する画像処理において、様々な形状を持つ罫線の角部を認識することのできる画像処理装置、画像処理方法及び画像形成装置、画像処理プログラムの提供を目的とする。
【課題を解決するための手段】
【0008】
そこで上記課題を解決するため、本発明の画像処理装置は、幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理装置において、前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手段と、前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手段と、前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書と、前記特徴量抽出手段により抽出された特徴量と、前記特徴量辞書に保持されている前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手段と、を有することを特徴とする。
【0009】
また、上記問題を解決するため、本発明は、上記画像処理装置における画像処理方法、上記画像処理装置を備える画像形成装置、上記画像処理方法をコンピュータに実行させる画像処理プログラムとしてもよい。
【発明の効果】
【0010】
本発明によれば、帳票画像を読み取って罫線を認識する画像処理において、様々な形状を持つ罫線の角部を認識することのできる画像処理装置、画像処理方法及び画像処理プログラムを提供することができる。
【図面の簡単な説明】
【0011】
【図1】画像処理装置1のハードウェア構成図である。
【図2】角丸罫線の一例である。
【図3】様々な形状の罫線の例である。
【図4】画像処理部108の機能ブロック図である。
【図5】罫線抽出処理の結果表示図である。
【図6】罫線領域の詳細を示す図である。
【図7】角部罫線領域について説明するための図である。
【図8】罫線抽出処理後の角丸箇所の拡大図である。
【図9】角部罫線領域を示す図である。
【図10】入力画像における角丸罫線と角部特徴量辞書107とのマッチングイメージを示す図である。
【図11】角丸罫線のパターン例である。
【図12】入力から出力までの処理の流れを示すフローチャートである。
【図13】画像処理部108における処理の流れを示すフローチャートである。
【図14】画像形成装置2のハードウェア構成図である。
【発明を実施するための形態】
【0012】
以下、図面に基づいて本発明の実施の形態を説明する。図1は、画像処理装置1のハードウェア構成図である。尚、以下の説明においては、便宜上、本実施の形態の説明に必要な構成要素が示されている。
【0013】
(画像処理装置1の構成と機能)
画像処理装置1は、一般的なスキャナ機能を有する装置である。画像処理装置1は、CPU101、スキャナ部102、外部記憶部103、入力画像メモリ部104、表示部105、操作部106、角部特徴量辞書107、画像処理部108、通信制御部109、出力メモリ部113を備える。外部記憶部103は、CD、DVDなどのメディア部111、及びHDD112を備える。通信制御部109は、ネットワーク網110に接続されている。
【0014】
CPU101は、画像処理装置1の制御を行う。スキャナ部102は、セットされた原稿をスキャンする。外部記憶部103は、メディア部111またはHDD112を用いて画像を保持する。入力画像メモリ部104は、スキャナ部102、外部記憶部103または通信制御部109から取得した入力画像を保持する。表示部105は、入力画像メモリ部104に保持された入力画像のプレビュー表示し、またはGUI画面を表示し、GUI画面において操作部106にてユーザ操作が行われる。
【0015】
角部特徴量辞書107は、予め罫線の角部の特徴量を辞書として保持する。画像処理部108は、入力画像メモリ部104に保持された入力画像に対し、罫線を抽出し、罫線の角部について角部特徴量辞書107の特徴量とマッチングを行うが、詳細は後述する。画像処理部108は、入力画像が多値画像であった場合に、入力画像から二値画像を生成する。出力メモリ部113は、画像処理部108において処理が行われた罫線についてのデータを保持する。通信制御部109は、ネットワーク網110から入力画像を取り寄せたり、処理結果の情報を配信する。
【0016】
(画像処理装置1の処理の概要)
図1において、スキャナ部102、外部記憶部103または通信制御部109から入力された画像が入力画像メモリ部104に保持され、画像処理部108に送られる。画像処理部108では、縦の罫線及び横の罫線が抽出され、罫線の角部である角部罫線領域が抽出される。画像処理部108において、角部罫線領域内の角部の罫線の特徴量が算出される。以下、罫線の角部が角丸で構成されている場合の角部を角丸罫線とする。
【0017】
角部特徴量辞書107には、あらかじめ縦罫線及び横罫線の交点である角部について、様々なパターンの角丸罫線についての特徴量が算出され、辞書として保持されている。画像処理部108において算出された特徴量と、角部特徴量辞書107に保持された特徴量の辞書との比較が行われる。所定の一致度を持つ特徴量を角部特徴量辞書107が保持していた場合、その特徴量に対応する角部のパターンが、角部候補領域内の角丸罫線であると認識される。認識された角丸罫線のデジタルデータと画像処理部108で抽出された縦罫線及び横罫線のデジタルデータが出力メモリ部113に蓄積され、必要に応じて再利用される。
【0018】
角丸罫線について、角部特徴量辞書107に角丸罫線の特徴量を辞書として保持し、入力画像の角部と比較して角丸罫線を認識することで、様々な形状の角丸罫線を取得することができる。
【0019】
(本実施例の対象とする罫線の一例)
本実施例の対象とする罫線について説明する。図2は、角丸罫線の一例である。帳票画像等においてよく見られる表のうち、角の丸い表について示す。本実施例では、このような表における直線状の罫線と、角部の角丸罫線とに分けて抽出する。
【0020】
図3は、様々な形状の罫線の例である。本実施例では、図2の一般的な角丸罫線だけでなく、b)の破線罫線における角丸部分も含め、これらすべての罫線について、角部も含めて正確に抽出することができる。尚、本願の抽出可能とする罫線については、この範囲に限定されるものではなく、多種多様にわたる角部を持つ罫線において対応が可能である。
【0021】
尚、角部が縦罫線及び横罫線で構成される場合は、本実施例の対象外である。
【0022】
(画像処理部108の構成と機能)
次に、画像処理部108の機能について説明する。図4は、画像処理部108の機能ブロック図である。
【0023】
画像処理部108は、画像処理装置1において入力された画像に対し処理を行う。画像処理装置108は、処理制御部201、画像入力部207、結果出力部208を備える。処理制御部201は、二値化処理部202、罫線抽出処理部203、角部罫線領域抽出部204、特徴量抽出部205、マッチング部206を備える。
【0024】
画像入力部207は、入力画像メモリ部104から画像処理部108への入力画像の受け取りを制御する。処理制御部201は、画像入力部207から入力された入力画像に対し、処理を実行する。結果出力部208は、処理制御部201において抽出された縦罫線及び横罫線、角丸罫線のデジタルデータを出力メモリ部113に出力する。
【0025】
二値化処理部202は、入力画像が多値画像である場合、入力画像から二値化画像を取得する。罫線抽出処理部203は、入力画像から縦の罫線及び横の罫線を抽出する。角部罫線領域抽出部204は、罫線抽出処理部203において抽出された縦の罫線及び横の罫線から縦の罫線領域及び横の罫線領域を抽出し、これらの罫線領域から角部の領域である角部罫線領域を抽出する。特徴量抽出部は、角部罫線領域抽出部において抽出された角部罫線領域内の入力画像から、所定の方法で特徴量を算出する。マッチング部206は、特徴量抽出部205で抽出された角部罫線領域内の入力画像の特徴量と、角部特徴量辞書107に保持された角部特徴量辞書107との比較を行い、所定の一致度を有する角部特徴量辞書107内の特徴量を選択する。
【0026】
(画像処理部108の処理)
画像入力部207から入力された入力画像に対し、罫線抽出処理部203において縦の罫線及び横の罫線を抽出する罫線抽出処理を行う。罫線の抽出方法については、本出願人が既に提案している特許文献1の技術を用いる。具体的には、実線罫線については入力画像から黒画素連結矩形を抽出し、罫線候補とする。実線でも罫線が分断されている場合があるため、あらかじめ統合許容パラメータを設定し、複数の黒画素連結矩形で統合許容パラメータの範囲内にあるものを統合し、実線罫線として認識する。点線、鎖線等の非実線罫線の場合は、黒画素連結矩形の幅、高さ、隣接距離間のヒストグラムを生成し、ピークを示した幅、高さ、距離の黒画素連結矩形を統合して非実線罫線として認識する。
【0027】
罫線抽出処理部203において、縦罫線及び横罫線が抽出されると、角部罫線領域抽出部204において縦罫線及び横罫線の座標を求め、それらの座標を罫線領域とする。縦罫線及び横罫線の抽出について、図5に示す。
【0028】
(罫線領域)
図5は、罫線抽出処理の結果表示図である。図2で示した角丸罫線の一例のうち、角部を除いた縦罫線Lm及び横罫線Lnを含む罫線が抽出されている。抽出された縦罫線及び横罫線の座標を罫線領域とする。罫線領域は、後述する角部罫線領域を求めるために必要となる。
【0029】
本実施例では縦罫線の罫線領域と横罫線の罫線領域が直角の位置関係にあることを想定している。縦罫線と横罫線が直線であって、直角の位置関係にある場合、各罫線領域は罫線自体の有する座標と同一である。例えば図5の縦罫線Lmと横罫線Lnの場合、罫線が直線であって直角の位置関係にあるため、各罫線領域は罫線自体の有する座標と同一となる。
【0030】
図6(a)(b)(c)(d)は罫線領域の詳細を示す図である。図6(a)のように縦罫線Lm2と横罫線Ln2が直角の位置関係にない場合、罫線領域は罫線のうち一辺(例えば図6(a)の場合Lm2)を基準に、直角の位置関係になるよう構成する。図6(b)のように、直線罫線であれば罫線の両端を含み、かつ基準となる一辺の罫線と直角の位置になるような矩形の領域を構成する。図6(a)の罫線について罫線領域を図示したのが図6(c)である。罫線領域Rm2と罫線領域Rn2が直角の位置関係になるよう構成している。尚、ここでは図6(b)の矩形を外接矩形とする。
【0031】
罫線が波線であるなど、直線でない場合であっても、罫線の外接矩形が罫線領域として抽出される。この場合、罫線領域は罫線を構成する画素のすべてを含むよう構成される。図6(d)は、罫線が波線である場合の罫線領域の構成例である。尚、ここで、罫線の外接矩形とは、罫線に外接している矩形である。
【0032】
(角部罫線領域)
罫線抽出処理部203において求めた罫線領域から、角部罫線領域を抽出する。図7は、角部罫線領域について説明するための図である。
【0033】
縦罫線の罫線領域と横罫線の罫線領域が連結せず、かつ縦罫線の罫線領域と横罫線の罫線領域の間隔が一定値に収まっている場合、角部に角丸罫線が存在する可能性が高いため、以下の手順で角部罫線領域を抽出する。
【0034】
図5において縦罫線及び横罫線が抽出されるが、角部の罫線については抽出されずに残っている。そのため、罫線領域から角丸部分を含む領域である角部罫線領域を求める。図5において抽出された罫線に対して角部罫線領域を求めた図が図7である。本実施例の場合、C1、C2、C3、C4が角部罫線領域である。
【0035】
角部罫線領域の求め方について説明する。図8は、罫線抽出処理後の角丸箇所の拡大図である。本実施例における角丸箇所は、縦罫線領域Rmの点A、B、横罫線領域RnのE、Fに囲まれた箇所である。
【0036】
図9において、角部罫線領域を示す。角部罫線領域C1は、点A及び点Eの座標から求めることができる矩形である。角部罫線領域に、角部の角丸罫線Mが示されている。この角丸罫線について、角部特徴量辞書107に保持されている角部特徴量辞書107との比較を行い、角部特徴量辞書107の角丸罫線と一致する角丸罫線を本実施例における角丸罫線とみなす処理を行う。
【0037】
(マッチングの概要)
角部罫線領域内における入力画像の角丸罫線と、角部特徴量辞書107との比較について、図10においてイメージ図を示す。図10は、入力画像の角丸罫線と角部特徴量辞書107の角丸罫線とのマッチングイメージを示す図である。
【0038】
図10(a)において、角部特徴量辞書107は様々な角丸罫線の特徴量を角部特徴量辞書として保持している。図10(a)ではわかりやすく角丸罫線の画素データの例を示しているが、実際に角部特徴量辞書107に保持するのは画素データではなく、これらの特徴量を数値で示した値である。
【0039】
図10(b)において、角部特徴量辞書107と入力画像中の角丸罫線とのマッチングを例示する。入力画像についても、角部特徴量辞書107と同様に特徴量を算出し、図に示すイメージで特徴量同士の比較を行い、一致する角部特徴量辞書107内の角丸罫線を入力画像の角丸罫線として抽出する。本図においてマッチングを画素データ上で行うよう表示しているが、実際は画素データ上での比較は行わず、特徴量である数値の比較で一致度を算出する。
【0040】
図4に戻る。角部罫線領域内の入力画像には、縦罫線及び横罫線の交点である角部が示されている。特徴量抽出部205において、角部罫線領域内の入力画像が有する特徴量を算出する。特徴量抽出部205において算出した特徴量と、角部特徴量辞書107において保持している特徴量の辞書との比較がマッチング部206で行われ、角部特徴量辞書107が保持する特徴量の中で所定の一致度を有する角丸罫線の特徴量が選択され、角部罫線領域内の角丸罫線であると認識される。罫線抽出処理部203で抽出された縦罫線及び横罫線のデジタルデータ、マッチング部206で認識された角丸罫線のデジタルデータが、結果出力部208で所定の出力装置に出力される。
【0041】
画像処理部108において、角部罫線領域を抽出し、角部特徴量辞書107にあらかじめ保持した特徴量の辞書との比較を行い、角丸罫線を認識することで、様々な形状の角丸罫線について認識することができる。
【0042】
(角部特徴量辞書107)
次に、角部特徴量辞書107について説明する。角部特徴量辞書107には、角部の罫線を特定する角部罫線特定データと、角部の罫線の特徴量とが対応付けられて格納されている。角部罫線特定データとは、例えば角部の罫線が円を四分割した場合の円弧であるときは、罫線を特定するデータは円の半径r、中心角θ(この場合は90度)である。また例えば、角部の罫線が楕円を四分割した場合の楕円の円弧であるときは、角部罫線特定データは、長軸の半径の長さra、短軸の半径の長さrb、中心角θ(この場合は90度)である。これらは一例であり、角部罫線特定データは、角部の罫線を特定することのできるあらゆるデータを含む。
【0043】
角部特徴量辞書107は、角部罫線特定データと、角部の特徴量とを対応させて格納している。角部の特徴量の算出方法については後述する。
【0044】
(特徴量の算出)
角部特徴量辞書107は、様々な角丸罫線の特徴量を辞書として保持する。図11(a)に、角丸罫線のパターン例を示す。例えばこれらの角丸罫線について特徴量を算出し、特徴量を辞書として保持する。
【0045】
特徴量の算出については、出願人が特許文献3において公開している、多層方向ヒストグラム法を用いる。具体的には、まず角部罫線領域を16分割する。次に、罫線を構成する画素のうち、白画素(背景画素)に隣接する画素を角丸罫線の輪郭画素とみなし、輪郭画素に8方向の方向コードを付ける。角部罫線領域の枠の各辺から対抗する辺に向かって角部罫線領域を横方向に走査し、白画素の次に出現する輪郭画素の方向コードを検出し、その方向コードが走査線上で何番目に検出されたかを記憶する。縦方向にも同様の処理を行う。
【0046】
角部罫線領域の分割領域毎に、横方向及び縦方向の2層の層別の方向コードのヒストグラムを求め、その各ヒストグラム値を成分とするベクトルを角丸罫線の特徴量とする。本実施形態の場合、角部罫線領域を16分割し、8方向の方向コードを2層に分けてヒストグラムを算出しているので、全体として256次元(=16×8×2)の特徴ベクトルが抽出される。尚、分割数及び方向数、層数は任意とする。
【0047】
辞書として保持する角丸罫線のパターンについて、それぞれ特徴量を算出し、この特徴量を辞書として角部特徴量辞書107に保持する。また、入力画像についても、角部罫線領域に含まれる角丸罫線について、同様の方法で特徴量を算出する。
【0048】
(特徴量のマッチング)
入力画像の角丸罫線と、角部特徴量辞書107とのマッチングは、それぞれから算出された特徴量の数値の比較によって行われる。マッチングは、上述の特許文献3、及び出願人の出願による特許文献5の技術を用いて行う。各々の特徴量を特徴ベクトルとし、特徴ベクトル間の距離が算出され、この距離が角部特徴量辞書107内の比較対象である特徴ベクトルに対して一定値(例えば90%)以上の一致度を有する場合、両罫線は一致するとみなす。一致した特徴量に対応する角部特徴量辞書107の角丸罫線を、入力画像の角丸罫線とみなして出力する。
【0049】
マッチングに関しては、本出願人による出願である特許文献6に開示された技術を用いることもできる。即ち、角部特徴量辞書107について特徴ベクトルでクラスタリングし、入力画像の角丸罫線の特徴ベクトルと各クラスタの代表とのマッチング処理を行い、最も高い一致度を示した代表を持つクラスタを有効クラスタとする。次に有効クラスタ内の各特徴ベクトルと、入力画像の角丸罫線の特徴ベクトルとの距離を算出し、最も高い一致度を示し、かつ一定値以上の一致度を有する特徴量について、入力画像中の角丸罫線に対応する角丸罫線であるとみなし、出力する。角部特徴量辞書107に保持した特徴量が膨大である場合、あらかじめクラスタリングしておくことで、マッチング時にコンピュータにかかる負荷を軽減できる。
【0050】
角部特徴量辞書107に保持するデータを、画素データではなく数値である特徴量とすることで、データ量を軽減できる。また、マッチングについて特徴量から一致度を算出する方法を採ることで、画素同士の比較を行うよりも少ない負荷でマッチング処理をすることができる。
【0051】
(入力から出力までの流れ)
次に、入力から出力までの処理の流れについて説明する。図12は、入力から出力までの処理の流れを示すフローチャートである。
【0052】
S101において、入力画像メモリ部104に画像データが入力される。原稿をスキャンして入力画像を取得するほか、デジタルカメラなどで撮影したデータ、ネットワーク経由で取得した画像データなど、様々な方法で画像データを取得する。入力画像は画像処理部108に送られ、画像入力部207を経由して処理制御部201が受け付ける。
【0053】
入力画像が多値画像である場合、S102において、二値化処理部202が二値化画像を生成する。二値化画像の生成については、本出願人による特許文献7に記載された技術のほか、一般的な技術を利用して行う。生成された二値化画像について、S103において罫線抽出処理部203、角部罫線領域抽出部204、特徴量抽出部205、マッチング部206において上述の処理がなされ、入力画像の角丸罫線と一致する角部特徴量辞書107内の角丸罫線が選択される。この角丸罫線を入力画像の角丸罫線とみなし、S104において結果出力部208から各罫線のデジタルデータ及び角丸罫線のデジタルデータが出力される。出力された各データは出力メモリ部113に蓄積され、必要に応じて利用される。
【0054】
(画像処理部108における処理の流れ)
画像処理部108における処理の流れについて説明する。図13は、画像処理部108における処理の流れを示すフローチャートである。この説明において、入力画像は二値画像であることを前提とする。
【0055】
S201において、入力画像について罫線抽出処理部203で縦罫線及び横罫線が抽出される。S202において、縦罫線及び横罫線の罫線領域が抽出され、座標値が求められる。この座標値に基づいて、S203で、角部罫線領域抽出部204によって角部罫線領域が抽出される。S202において罫線領域を抽出した結果、各罫線が連結しているか、もしくは抽出した縦罫線と横罫線の各罫線領域の間隔が一定値を超える場合、角部に角丸罫線が存在しないとして処理を終了する。
【0056】
S204において、特徴量抽出部205で、角部罫線領域内の入力画像中の角丸罫線について、上述した方法で特徴量が算出される。S205において、求めた入力画像中の角丸罫線の特徴量と、角部特徴量辞書107で保持された角部特徴量辞書107内の特徴量とのマッチングが行われ、マッチング部206によって一致度が算出される。一致度が例えば90%を越える角部特徴量辞書107内の角丸罫線について、入力画像中の角丸罫線であるとみなされ、S206において結果出力部208から出力される。
【0057】
尚、特徴量の算出に当たり、必要に応じてデータの正規化が行われる。
【0058】
予め多様な角丸罫線のパターンを特徴量である数値で保持し、入力画像の角部について特徴量を算出して一致度を算出し、一致する特徴量を入力画像の角丸罫線であるとみなす。この構成により、角丸罫線を有する罫線の抽出について、最小限のデータの保持で多様な角丸罫線を抽出することができる。
【0059】
(変形例)
尚、本実施例では角部が角丸で構成された角丸罫線を抽出することを前提とした。しかし、図11(b)のように角部が直線である場合も、同様の方法で抽出が可能である。しかし図11(c)のように、縦罫線と横罫線が直角に交わる場合は、罫線領域同士が連結しているため、本実施形態において想定していない。
【0060】
また、本願においては、上述の機能を有する画像処理装置を備える画像形成装置としてもよい。図14において、画像形成装置2のハードウェア構成図を示す。
【0061】
画像形成装置2は、スキャナ機能を有する一般的な複合機である。画像形成装置2は、画像処理装置1が備える機能を包含するほか、ARDF(Auto Reverse Document Feeder)301、イメージ変換部302、FAXmodem303、メーラ304、メモリ305、USB306、プリンタエンジン307、電源ユニット308を備える。
【0062】
本実施形態においては、ARDF301において読み取られた原稿画像に帳票が含まれる場合、操作部106の操作を通じて罫線を抽出し、角部罫線領域に含まれる角丸罫線について特徴量を算出する。メモリ305またはHDD112に保管された角部特徴量辞書107の角丸パターンの特徴量との比較が行われ、入力画像の角丸罫線が抽出される。抽出された罫線のデジタルデータ及び角丸罫線のデジタルデータがメモリ305に蓄積され、通信制御部109により外部に送信され、またはメーラ304でメール送信されるなど、操作に応じた所定の出力が行われる。抽出した罫線について紙上に形成する場合、プリンタエンジン307により印刷されて出力される。
【0063】
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0064】
1 画像処理装置
2 画像形成装置
107 角部特徴量辞書
108 画像処理部
202 二値化処理部
203 罫線抽出処理部
204 角部罫線領域抽出部
205 特徴量抽出部
206 マッチング部
307 プリンタエンジン
【先行技術文献】
【特許文献】
【0065】
【特許文献1】特開平04−291478号公報
【特許文献2】特開2002−133426号公報
【特許文献3】特開昭63−778号公報
【特許文献4】特開平10−105648号公報
【特許文献5】特開昭62−22187号公報
【特許文献6】特開平11−96304号公報
【特許文献7】特開2000−331118号公報
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、画像形成装置、画像処理プログラムに関する。
【背景技術】
【0002】
スキャナ機能を有するMFP機(Multi Function Printer)などの画像処理装置において、表を含む帳票画像を読み取って処理を行う帳票認識処理が知られている。帳票認識処理において、帳票画像から表を形成する罫線を抽出し、ベクトルデータに変換したり、抽出した罫線をデジタルデータ化し、再利用したりする処理が行われる。当該処理を行うため、帳票画像から罫線を抽出する技術が既に公開されている。
【0003】
特許文献1に記載された技術によると、実線からなる罫線と、点線や破線等の非実線からなる罫線とで、異なる方法を用いて罫線を抽出する。実線罫線の場合、帳票画像から黒画素連結矩形を抽出し、罫線候補とする。実線でも罫線が分断されている場合があるため、あらかじめ統合許容パラメータを設定し、複数の黒画素連結矩形で統合許容パラメータの範囲内にあるものを統合し、実線罫線として認識する。非実線罫線の場合、線の種類に固有の長さの線を固有の間隔で固有の規則に従って繋いだパターンであるため、黒画素連結矩形の幅、高さ、及び隣接間距離のヒストグラムをとると、線種に固有の幅、高さ及び距離でピークを示す。このため、隣接した黒画素連結矩形間の距離を計算し、それらの幅、高さ及び距離のヒストグラムを計算し、ピークを示した幅、高さ、距離の黒画素連結矩形を統合し、非実線罫線として認識する。
【0004】
また、特許文献2に記載された技術によると、元の画像から潰れ気味の二値画像と、掠れ気味の二値画像を生成し、これらを用いて罫線を抽出する。潰れ気味の二値画像から線分候補領域を抽出し、各線分候補領域毎に掠れ気味の二値画像と元画像とを参照し、掠れ気味の二値画像を元画像で補完する処理が行われる。補完処理の結果、線分候補領域内で黒画素の割合が一定値以上である場合、その線分候補領域は実線罫線であると判断される。尚、特許文献2に記載された技術は、実線からなる罫線を抽出することを前提としており、破線や鎖線等の非実線罫線は想定していない。
【0005】
(特許文献1及び2参照)
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかし、特許文献1の方法では、例えば非実線罫線において、幅、高さ及び距離のヒストグラムを作成し、黒画素連結矩形を罫線として認識する関係上、非実線罫線における罫線と罫線の交点が角丸等で構成されている場合の角部については認識することができない。固有の幅、高さ、距離でピークを示す法則が成り立たないためである。また、特許文献2の方法では、角部を含む領域について二値化画像を生成して、角丸等である角部の罫線を認識することができるものの、実線である罫線を認識することを前提としている。従って、罫線と罫線の交点が角丸等で構成され、なおかつ角部が点線である場合など、様々な形状を持つ角部について認識することができないという問題があった。
【0007】
本発明は、上記の点に鑑みてなされたものであって、帳票画像を読み取って罫線を認識する画像処理において、様々な形状を持つ罫線の角部を認識することのできる画像処理装置、画像処理方法及び画像形成装置、画像処理プログラムの提供を目的とする。
【課題を解決するための手段】
【0008】
そこで上記課題を解決するため、本発明の画像処理装置は、幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理装置において、前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手段と、前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手段と、前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書と、前記特徴量抽出手段により抽出された特徴量と、前記特徴量辞書に保持されている前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手段と、を有することを特徴とする。
【0009】
また、上記問題を解決するため、本発明は、上記画像処理装置における画像処理方法、上記画像処理装置を備える画像形成装置、上記画像処理方法をコンピュータに実行させる画像処理プログラムとしてもよい。
【発明の効果】
【0010】
本発明によれば、帳票画像を読み取って罫線を認識する画像処理において、様々な形状を持つ罫線の角部を認識することのできる画像処理装置、画像処理方法及び画像処理プログラムを提供することができる。
【図面の簡単な説明】
【0011】
【図1】画像処理装置1のハードウェア構成図である。
【図2】角丸罫線の一例である。
【図3】様々な形状の罫線の例である。
【図4】画像処理部108の機能ブロック図である。
【図5】罫線抽出処理の結果表示図である。
【図6】罫線領域の詳細を示す図である。
【図7】角部罫線領域について説明するための図である。
【図8】罫線抽出処理後の角丸箇所の拡大図である。
【図9】角部罫線領域を示す図である。
【図10】入力画像における角丸罫線と角部特徴量辞書107とのマッチングイメージを示す図である。
【図11】角丸罫線のパターン例である。
【図12】入力から出力までの処理の流れを示すフローチャートである。
【図13】画像処理部108における処理の流れを示すフローチャートである。
【図14】画像形成装置2のハードウェア構成図である。
【発明を実施するための形態】
【0012】
以下、図面に基づいて本発明の実施の形態を説明する。図1は、画像処理装置1のハードウェア構成図である。尚、以下の説明においては、便宜上、本実施の形態の説明に必要な構成要素が示されている。
【0013】
(画像処理装置1の構成と機能)
画像処理装置1は、一般的なスキャナ機能を有する装置である。画像処理装置1は、CPU101、スキャナ部102、外部記憶部103、入力画像メモリ部104、表示部105、操作部106、角部特徴量辞書107、画像処理部108、通信制御部109、出力メモリ部113を備える。外部記憶部103は、CD、DVDなどのメディア部111、及びHDD112を備える。通信制御部109は、ネットワーク網110に接続されている。
【0014】
CPU101は、画像処理装置1の制御を行う。スキャナ部102は、セットされた原稿をスキャンする。外部記憶部103は、メディア部111またはHDD112を用いて画像を保持する。入力画像メモリ部104は、スキャナ部102、外部記憶部103または通信制御部109から取得した入力画像を保持する。表示部105は、入力画像メモリ部104に保持された入力画像のプレビュー表示し、またはGUI画面を表示し、GUI画面において操作部106にてユーザ操作が行われる。
【0015】
角部特徴量辞書107は、予め罫線の角部の特徴量を辞書として保持する。画像処理部108は、入力画像メモリ部104に保持された入力画像に対し、罫線を抽出し、罫線の角部について角部特徴量辞書107の特徴量とマッチングを行うが、詳細は後述する。画像処理部108は、入力画像が多値画像であった場合に、入力画像から二値画像を生成する。出力メモリ部113は、画像処理部108において処理が行われた罫線についてのデータを保持する。通信制御部109は、ネットワーク網110から入力画像を取り寄せたり、処理結果の情報を配信する。
【0016】
(画像処理装置1の処理の概要)
図1において、スキャナ部102、外部記憶部103または通信制御部109から入力された画像が入力画像メモリ部104に保持され、画像処理部108に送られる。画像処理部108では、縦の罫線及び横の罫線が抽出され、罫線の角部である角部罫線領域が抽出される。画像処理部108において、角部罫線領域内の角部の罫線の特徴量が算出される。以下、罫線の角部が角丸で構成されている場合の角部を角丸罫線とする。
【0017】
角部特徴量辞書107には、あらかじめ縦罫線及び横罫線の交点である角部について、様々なパターンの角丸罫線についての特徴量が算出され、辞書として保持されている。画像処理部108において算出された特徴量と、角部特徴量辞書107に保持された特徴量の辞書との比較が行われる。所定の一致度を持つ特徴量を角部特徴量辞書107が保持していた場合、その特徴量に対応する角部のパターンが、角部候補領域内の角丸罫線であると認識される。認識された角丸罫線のデジタルデータと画像処理部108で抽出された縦罫線及び横罫線のデジタルデータが出力メモリ部113に蓄積され、必要に応じて再利用される。
【0018】
角丸罫線について、角部特徴量辞書107に角丸罫線の特徴量を辞書として保持し、入力画像の角部と比較して角丸罫線を認識することで、様々な形状の角丸罫線を取得することができる。
【0019】
(本実施例の対象とする罫線の一例)
本実施例の対象とする罫線について説明する。図2は、角丸罫線の一例である。帳票画像等においてよく見られる表のうち、角の丸い表について示す。本実施例では、このような表における直線状の罫線と、角部の角丸罫線とに分けて抽出する。
【0020】
図3は、様々な形状の罫線の例である。本実施例では、図2の一般的な角丸罫線だけでなく、b)の破線罫線における角丸部分も含め、これらすべての罫線について、角部も含めて正確に抽出することができる。尚、本願の抽出可能とする罫線については、この範囲に限定されるものではなく、多種多様にわたる角部を持つ罫線において対応が可能である。
【0021】
尚、角部が縦罫線及び横罫線で構成される場合は、本実施例の対象外である。
【0022】
(画像処理部108の構成と機能)
次に、画像処理部108の機能について説明する。図4は、画像処理部108の機能ブロック図である。
【0023】
画像処理部108は、画像処理装置1において入力された画像に対し処理を行う。画像処理装置108は、処理制御部201、画像入力部207、結果出力部208を備える。処理制御部201は、二値化処理部202、罫線抽出処理部203、角部罫線領域抽出部204、特徴量抽出部205、マッチング部206を備える。
【0024】
画像入力部207は、入力画像メモリ部104から画像処理部108への入力画像の受け取りを制御する。処理制御部201は、画像入力部207から入力された入力画像に対し、処理を実行する。結果出力部208は、処理制御部201において抽出された縦罫線及び横罫線、角丸罫線のデジタルデータを出力メモリ部113に出力する。
【0025】
二値化処理部202は、入力画像が多値画像である場合、入力画像から二値化画像を取得する。罫線抽出処理部203は、入力画像から縦の罫線及び横の罫線を抽出する。角部罫線領域抽出部204は、罫線抽出処理部203において抽出された縦の罫線及び横の罫線から縦の罫線領域及び横の罫線領域を抽出し、これらの罫線領域から角部の領域である角部罫線領域を抽出する。特徴量抽出部は、角部罫線領域抽出部において抽出された角部罫線領域内の入力画像から、所定の方法で特徴量を算出する。マッチング部206は、特徴量抽出部205で抽出された角部罫線領域内の入力画像の特徴量と、角部特徴量辞書107に保持された角部特徴量辞書107との比較を行い、所定の一致度を有する角部特徴量辞書107内の特徴量を選択する。
【0026】
(画像処理部108の処理)
画像入力部207から入力された入力画像に対し、罫線抽出処理部203において縦の罫線及び横の罫線を抽出する罫線抽出処理を行う。罫線の抽出方法については、本出願人が既に提案している特許文献1の技術を用いる。具体的には、実線罫線については入力画像から黒画素連結矩形を抽出し、罫線候補とする。実線でも罫線が分断されている場合があるため、あらかじめ統合許容パラメータを設定し、複数の黒画素連結矩形で統合許容パラメータの範囲内にあるものを統合し、実線罫線として認識する。点線、鎖線等の非実線罫線の場合は、黒画素連結矩形の幅、高さ、隣接距離間のヒストグラムを生成し、ピークを示した幅、高さ、距離の黒画素連結矩形を統合して非実線罫線として認識する。
【0027】
罫線抽出処理部203において、縦罫線及び横罫線が抽出されると、角部罫線領域抽出部204において縦罫線及び横罫線の座標を求め、それらの座標を罫線領域とする。縦罫線及び横罫線の抽出について、図5に示す。
【0028】
(罫線領域)
図5は、罫線抽出処理の結果表示図である。図2で示した角丸罫線の一例のうち、角部を除いた縦罫線Lm及び横罫線Lnを含む罫線が抽出されている。抽出された縦罫線及び横罫線の座標を罫線領域とする。罫線領域は、後述する角部罫線領域を求めるために必要となる。
【0029】
本実施例では縦罫線の罫線領域と横罫線の罫線領域が直角の位置関係にあることを想定している。縦罫線と横罫線が直線であって、直角の位置関係にある場合、各罫線領域は罫線自体の有する座標と同一である。例えば図5の縦罫線Lmと横罫線Lnの場合、罫線が直線であって直角の位置関係にあるため、各罫線領域は罫線自体の有する座標と同一となる。
【0030】
図6(a)(b)(c)(d)は罫線領域の詳細を示す図である。図6(a)のように縦罫線Lm2と横罫線Ln2が直角の位置関係にない場合、罫線領域は罫線のうち一辺(例えば図6(a)の場合Lm2)を基準に、直角の位置関係になるよう構成する。図6(b)のように、直線罫線であれば罫線の両端を含み、かつ基準となる一辺の罫線と直角の位置になるような矩形の領域を構成する。図6(a)の罫線について罫線領域を図示したのが図6(c)である。罫線領域Rm2と罫線領域Rn2が直角の位置関係になるよう構成している。尚、ここでは図6(b)の矩形を外接矩形とする。
【0031】
罫線が波線であるなど、直線でない場合であっても、罫線の外接矩形が罫線領域として抽出される。この場合、罫線領域は罫線を構成する画素のすべてを含むよう構成される。図6(d)は、罫線が波線である場合の罫線領域の構成例である。尚、ここで、罫線の外接矩形とは、罫線に外接している矩形である。
【0032】
(角部罫線領域)
罫線抽出処理部203において求めた罫線領域から、角部罫線領域を抽出する。図7は、角部罫線領域について説明するための図である。
【0033】
縦罫線の罫線領域と横罫線の罫線領域が連結せず、かつ縦罫線の罫線領域と横罫線の罫線領域の間隔が一定値に収まっている場合、角部に角丸罫線が存在する可能性が高いため、以下の手順で角部罫線領域を抽出する。
【0034】
図5において縦罫線及び横罫線が抽出されるが、角部の罫線については抽出されずに残っている。そのため、罫線領域から角丸部分を含む領域である角部罫線領域を求める。図5において抽出された罫線に対して角部罫線領域を求めた図が図7である。本実施例の場合、C1、C2、C3、C4が角部罫線領域である。
【0035】
角部罫線領域の求め方について説明する。図8は、罫線抽出処理後の角丸箇所の拡大図である。本実施例における角丸箇所は、縦罫線領域Rmの点A、B、横罫線領域RnのE、Fに囲まれた箇所である。
【0036】
図9において、角部罫線領域を示す。角部罫線領域C1は、点A及び点Eの座標から求めることができる矩形である。角部罫線領域に、角部の角丸罫線Mが示されている。この角丸罫線について、角部特徴量辞書107に保持されている角部特徴量辞書107との比較を行い、角部特徴量辞書107の角丸罫線と一致する角丸罫線を本実施例における角丸罫線とみなす処理を行う。
【0037】
(マッチングの概要)
角部罫線領域内における入力画像の角丸罫線と、角部特徴量辞書107との比較について、図10においてイメージ図を示す。図10は、入力画像の角丸罫線と角部特徴量辞書107の角丸罫線とのマッチングイメージを示す図である。
【0038】
図10(a)において、角部特徴量辞書107は様々な角丸罫線の特徴量を角部特徴量辞書として保持している。図10(a)ではわかりやすく角丸罫線の画素データの例を示しているが、実際に角部特徴量辞書107に保持するのは画素データではなく、これらの特徴量を数値で示した値である。
【0039】
図10(b)において、角部特徴量辞書107と入力画像中の角丸罫線とのマッチングを例示する。入力画像についても、角部特徴量辞書107と同様に特徴量を算出し、図に示すイメージで特徴量同士の比較を行い、一致する角部特徴量辞書107内の角丸罫線を入力画像の角丸罫線として抽出する。本図においてマッチングを画素データ上で行うよう表示しているが、実際は画素データ上での比較は行わず、特徴量である数値の比較で一致度を算出する。
【0040】
図4に戻る。角部罫線領域内の入力画像には、縦罫線及び横罫線の交点である角部が示されている。特徴量抽出部205において、角部罫線領域内の入力画像が有する特徴量を算出する。特徴量抽出部205において算出した特徴量と、角部特徴量辞書107において保持している特徴量の辞書との比較がマッチング部206で行われ、角部特徴量辞書107が保持する特徴量の中で所定の一致度を有する角丸罫線の特徴量が選択され、角部罫線領域内の角丸罫線であると認識される。罫線抽出処理部203で抽出された縦罫線及び横罫線のデジタルデータ、マッチング部206で認識された角丸罫線のデジタルデータが、結果出力部208で所定の出力装置に出力される。
【0041】
画像処理部108において、角部罫線領域を抽出し、角部特徴量辞書107にあらかじめ保持した特徴量の辞書との比較を行い、角丸罫線を認識することで、様々な形状の角丸罫線について認識することができる。
【0042】
(角部特徴量辞書107)
次に、角部特徴量辞書107について説明する。角部特徴量辞書107には、角部の罫線を特定する角部罫線特定データと、角部の罫線の特徴量とが対応付けられて格納されている。角部罫線特定データとは、例えば角部の罫線が円を四分割した場合の円弧であるときは、罫線を特定するデータは円の半径r、中心角θ(この場合は90度)である。また例えば、角部の罫線が楕円を四分割した場合の楕円の円弧であるときは、角部罫線特定データは、長軸の半径の長さra、短軸の半径の長さrb、中心角θ(この場合は90度)である。これらは一例であり、角部罫線特定データは、角部の罫線を特定することのできるあらゆるデータを含む。
【0043】
角部特徴量辞書107は、角部罫線特定データと、角部の特徴量とを対応させて格納している。角部の特徴量の算出方法については後述する。
【0044】
(特徴量の算出)
角部特徴量辞書107は、様々な角丸罫線の特徴量を辞書として保持する。図11(a)に、角丸罫線のパターン例を示す。例えばこれらの角丸罫線について特徴量を算出し、特徴量を辞書として保持する。
【0045】
特徴量の算出については、出願人が特許文献3において公開している、多層方向ヒストグラム法を用いる。具体的には、まず角部罫線領域を16分割する。次に、罫線を構成する画素のうち、白画素(背景画素)に隣接する画素を角丸罫線の輪郭画素とみなし、輪郭画素に8方向の方向コードを付ける。角部罫線領域の枠の各辺から対抗する辺に向かって角部罫線領域を横方向に走査し、白画素の次に出現する輪郭画素の方向コードを検出し、その方向コードが走査線上で何番目に検出されたかを記憶する。縦方向にも同様の処理を行う。
【0046】
角部罫線領域の分割領域毎に、横方向及び縦方向の2層の層別の方向コードのヒストグラムを求め、その各ヒストグラム値を成分とするベクトルを角丸罫線の特徴量とする。本実施形態の場合、角部罫線領域を16分割し、8方向の方向コードを2層に分けてヒストグラムを算出しているので、全体として256次元(=16×8×2)の特徴ベクトルが抽出される。尚、分割数及び方向数、層数は任意とする。
【0047】
辞書として保持する角丸罫線のパターンについて、それぞれ特徴量を算出し、この特徴量を辞書として角部特徴量辞書107に保持する。また、入力画像についても、角部罫線領域に含まれる角丸罫線について、同様の方法で特徴量を算出する。
【0048】
(特徴量のマッチング)
入力画像の角丸罫線と、角部特徴量辞書107とのマッチングは、それぞれから算出された特徴量の数値の比較によって行われる。マッチングは、上述の特許文献3、及び出願人の出願による特許文献5の技術を用いて行う。各々の特徴量を特徴ベクトルとし、特徴ベクトル間の距離が算出され、この距離が角部特徴量辞書107内の比較対象である特徴ベクトルに対して一定値(例えば90%)以上の一致度を有する場合、両罫線は一致するとみなす。一致した特徴量に対応する角部特徴量辞書107の角丸罫線を、入力画像の角丸罫線とみなして出力する。
【0049】
マッチングに関しては、本出願人による出願である特許文献6に開示された技術を用いることもできる。即ち、角部特徴量辞書107について特徴ベクトルでクラスタリングし、入力画像の角丸罫線の特徴ベクトルと各クラスタの代表とのマッチング処理を行い、最も高い一致度を示した代表を持つクラスタを有効クラスタとする。次に有効クラスタ内の各特徴ベクトルと、入力画像の角丸罫線の特徴ベクトルとの距離を算出し、最も高い一致度を示し、かつ一定値以上の一致度を有する特徴量について、入力画像中の角丸罫線に対応する角丸罫線であるとみなし、出力する。角部特徴量辞書107に保持した特徴量が膨大である場合、あらかじめクラスタリングしておくことで、マッチング時にコンピュータにかかる負荷を軽減できる。
【0050】
角部特徴量辞書107に保持するデータを、画素データではなく数値である特徴量とすることで、データ量を軽減できる。また、マッチングについて特徴量から一致度を算出する方法を採ることで、画素同士の比較を行うよりも少ない負荷でマッチング処理をすることができる。
【0051】
(入力から出力までの流れ)
次に、入力から出力までの処理の流れについて説明する。図12は、入力から出力までの処理の流れを示すフローチャートである。
【0052】
S101において、入力画像メモリ部104に画像データが入力される。原稿をスキャンして入力画像を取得するほか、デジタルカメラなどで撮影したデータ、ネットワーク経由で取得した画像データなど、様々な方法で画像データを取得する。入力画像は画像処理部108に送られ、画像入力部207を経由して処理制御部201が受け付ける。
【0053】
入力画像が多値画像である場合、S102において、二値化処理部202が二値化画像を生成する。二値化画像の生成については、本出願人による特許文献7に記載された技術のほか、一般的な技術を利用して行う。生成された二値化画像について、S103において罫線抽出処理部203、角部罫線領域抽出部204、特徴量抽出部205、マッチング部206において上述の処理がなされ、入力画像の角丸罫線と一致する角部特徴量辞書107内の角丸罫線が選択される。この角丸罫線を入力画像の角丸罫線とみなし、S104において結果出力部208から各罫線のデジタルデータ及び角丸罫線のデジタルデータが出力される。出力された各データは出力メモリ部113に蓄積され、必要に応じて利用される。
【0054】
(画像処理部108における処理の流れ)
画像処理部108における処理の流れについて説明する。図13は、画像処理部108における処理の流れを示すフローチャートである。この説明において、入力画像は二値画像であることを前提とする。
【0055】
S201において、入力画像について罫線抽出処理部203で縦罫線及び横罫線が抽出される。S202において、縦罫線及び横罫線の罫線領域が抽出され、座標値が求められる。この座標値に基づいて、S203で、角部罫線領域抽出部204によって角部罫線領域が抽出される。S202において罫線領域を抽出した結果、各罫線が連結しているか、もしくは抽出した縦罫線と横罫線の各罫線領域の間隔が一定値を超える場合、角部に角丸罫線が存在しないとして処理を終了する。
【0056】
S204において、特徴量抽出部205で、角部罫線領域内の入力画像中の角丸罫線について、上述した方法で特徴量が算出される。S205において、求めた入力画像中の角丸罫線の特徴量と、角部特徴量辞書107で保持された角部特徴量辞書107内の特徴量とのマッチングが行われ、マッチング部206によって一致度が算出される。一致度が例えば90%を越える角部特徴量辞書107内の角丸罫線について、入力画像中の角丸罫線であるとみなされ、S206において結果出力部208から出力される。
【0057】
尚、特徴量の算出に当たり、必要に応じてデータの正規化が行われる。
【0058】
予め多様な角丸罫線のパターンを特徴量である数値で保持し、入力画像の角部について特徴量を算出して一致度を算出し、一致する特徴量を入力画像の角丸罫線であるとみなす。この構成により、角丸罫線を有する罫線の抽出について、最小限のデータの保持で多様な角丸罫線を抽出することができる。
【0059】
(変形例)
尚、本実施例では角部が角丸で構成された角丸罫線を抽出することを前提とした。しかし、図11(b)のように角部が直線である場合も、同様の方法で抽出が可能である。しかし図11(c)のように、縦罫線と横罫線が直角に交わる場合は、罫線領域同士が連結しているため、本実施形態において想定していない。
【0060】
また、本願においては、上述の機能を有する画像処理装置を備える画像形成装置としてもよい。図14において、画像形成装置2のハードウェア構成図を示す。
【0061】
画像形成装置2は、スキャナ機能を有する一般的な複合機である。画像形成装置2は、画像処理装置1が備える機能を包含するほか、ARDF(Auto Reverse Document Feeder)301、イメージ変換部302、FAXmodem303、メーラ304、メモリ305、USB306、プリンタエンジン307、電源ユニット308を備える。
【0062】
本実施形態においては、ARDF301において読み取られた原稿画像に帳票が含まれる場合、操作部106の操作を通じて罫線を抽出し、角部罫線領域に含まれる角丸罫線について特徴量を算出する。メモリ305またはHDD112に保管された角部特徴量辞書107の角丸パターンの特徴量との比較が行われ、入力画像の角丸罫線が抽出される。抽出された罫線のデジタルデータ及び角丸罫線のデジタルデータがメモリ305に蓄積され、通信制御部109により外部に送信され、またはメーラ304でメール送信されるなど、操作に応じた所定の出力が行われる。抽出した罫線について紙上に形成する場合、プリンタエンジン307により印刷されて出力される。
【0063】
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0064】
1 画像処理装置
2 画像形成装置
107 角部特徴量辞書
108 画像処理部
202 二値化処理部
203 罫線抽出処理部
204 角部罫線領域抽出部
205 特徴量抽出部
206 マッチング部
307 プリンタエンジン
【先行技術文献】
【特許文献】
【0065】
【特許文献1】特開平04−291478号公報
【特許文献2】特開2002−133426号公報
【特許文献3】特開昭63−778号公報
【特許文献4】特開平10−105648号公報
【特許文献5】特開昭62−22187号公報
【特許文献6】特開平11−96304号公報
【特許文献7】特開2000−331118号公報
【特許請求の範囲】
【請求項1】
幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理装置において、
前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手段と、
前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手段と、
前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書と、
前記特徴量抽出手段により抽出された特徴量と、前記特徴量辞書に保持されている前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手段と、
を有することを特徴とする画像処理装置。
【請求項2】
読み取られた前記画像が多値画像の場合、読み取られた多値画像から二値画像を生成する二値画像生成手段を有し、
前記特徴量抽出手段は、前記二値画像から前記特徴量を抽出することを特徴とする、請求項1記載の画像処理装置。
【請求項3】
前記角部罫線領域抽出手段は、縦の罫線である縦罫線を有する縦罫線領域及び横の罫線である横罫線を有する横罫線領域に基づいて前記角部罫線領域を抽出することを特徴とする、請求項1または2記載の画像処理装置。
【請求項4】
前記縦罫線領域は、前記縦罫線の外接矩形の領域であり
前記横罫線領域は、前記横罫線の外接矩形の領域であり、
前記縦罫線領域または前記横罫線領域は、前記縦罫線または前記横罫線のいずれか一方を基準として直角の位置になるよう構成することを特徴とする、請求項3記載の画像処理装置。
【請求項5】
幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理方法において、
前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手順と、
前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手順と、
前記特徴量抽出手順により抽出された特徴量と、前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書に保持されている、前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手順と、
を有することを特徴とする画像処理方法。
【請求項6】
読み取られた前記画像が多値画像の場合、読み取られた多値画像から二値画像を生成する二値画像生成手順を有し、
前記特徴量抽出手順は、前記二値画像から前記特徴量を抽出することを特徴とする、請求項5記載の画像処理方法。
【請求項7】
前記角部罫線領域抽出手順は、縦の罫線を有する縦罫線領域及び横の罫線を有する横罫線領域に基づいて抽出することを特徴とする、請求項5又は6記載の画像処理方法。
【請求項8】
前記縦罫線領域及び横罫線領域は、縦罫線または横罫線が斜線の場合、罫線の両端点及び罫線を含むよう構成することを特徴とする、請求項7記載の画像処理方法。
【請求項9】
請求項1ないし4のいずれか一項に記載の画像処理装置と、
前記画像処理装置により画像処理を施された画像データに基づいて、用紙上に画像の形成を行うプリンタエンジンと、
を備えることを特徴とする画像形成装置。
【請求項10】
請求項5ないし8のいずれか一項に記載の画像処理方法をコンピュータに実行させる画像処理プログラム。
【請求項1】
幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理装置において、
前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手段と、
前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手段と、
前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書と、
前記特徴量抽出手段により抽出された特徴量と、前記特徴量辞書に保持されている前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手段と、
を有することを特徴とする画像処理装置。
【請求項2】
読み取られた前記画像が多値画像の場合、読み取られた多値画像から二値画像を生成する二値画像生成手段を有し、
前記特徴量抽出手段は、前記二値画像から前記特徴量を抽出することを特徴とする、請求項1記載の画像処理装置。
【請求項3】
前記角部罫線領域抽出手段は、縦の罫線である縦罫線を有する縦罫線領域及び横の罫線である横罫線を有する横罫線領域に基づいて前記角部罫線領域を抽出することを特徴とする、請求項1または2記載の画像処理装置。
【請求項4】
前記縦罫線領域は、前記縦罫線の外接矩形の領域であり
前記横罫線領域は、前記横罫線の外接矩形の領域であり、
前記縦罫線領域または前記横罫線領域は、前記縦罫線または前記横罫線のいずれか一方を基準として直角の位置になるよう構成することを特徴とする、請求項3記載の画像処理装置。
【請求項5】
幅と長さを有する罫線と、二つの罫線の角部領域に形成される角部罫線領域を有する画像を読み取る画像処理方法において、
前記画像から、前記角部罫線領域を抽出する角部罫線領域抽出手順と、
前記角部罫線領域の画像から、前記角部罫線領域の画像の特徴量を抽出する特徴量抽出手順と、
前記特徴量抽出手順により抽出された特徴量と、前記角部罫線領域の複数の角部のパターンに対応した特徴量を保持する特徴量辞書に保持されている、前記角部のパターンの特徴量とを比較して一致度を算出し、所定の一致度を有する前記角部のパターンを前記角部罫線として抽出する角部罫線抽出手順と、
を有することを特徴とする画像処理方法。
【請求項6】
読み取られた前記画像が多値画像の場合、読み取られた多値画像から二値画像を生成する二値画像生成手順を有し、
前記特徴量抽出手順は、前記二値画像から前記特徴量を抽出することを特徴とする、請求項5記載の画像処理方法。
【請求項7】
前記角部罫線領域抽出手順は、縦の罫線を有する縦罫線領域及び横の罫線を有する横罫線領域に基づいて抽出することを特徴とする、請求項5又は6記載の画像処理方法。
【請求項8】
前記縦罫線領域及び横罫線領域は、縦罫線または横罫線が斜線の場合、罫線の両端点及び罫線を含むよう構成することを特徴とする、請求項7記載の画像処理方法。
【請求項9】
請求項1ないし4のいずれか一項に記載の画像処理装置と、
前記画像処理装置により画像処理を施された画像データに基づいて、用紙上に画像の形成を行うプリンタエンジンと、
を備えることを特徴とする画像形成装置。
【請求項10】
請求項5ないし8のいずれか一項に記載の画像処理方法をコンピュータに実行させる画像処理プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2013−61839(P2013−61839A)
【公開日】平成25年4月4日(2013.4.4)
【国際特許分類】
【出願番号】特願2011−200326(P2011−200326)
【出願日】平成23年9月14日(2011.9.14)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
【公開日】平成25年4月4日(2013.4.4)
【国際特許分類】
【出願日】平成23年9月14日(2011.9.14)
【出願人】(000006747)株式会社リコー (37,907)
【Fターム(参考)】
[ Back to top ]