説明

画像処理装置及びプログラム

【課題】表内の罫線を除去する際に分離された文字画像を復元する。
【解決手段】罫線から成る表と該表に関連した情報とが接した文書を画像として入力し、表の罫線を特定し、表の罫線に基づき画像から罫線を除去する。除去された画像から該表に関連した情報の外接矩形を検出し、外接矩形の位置関係を特定し、該外接矩形を統合する。統合された外接矩形から罫線に接していた画素列を抽出して画素列を接続する。外接矩形を統合して、接続領域を制限することができるため、誤った画素の接続を簡単に抑制することができる。また画素列接続手段により文字切片の間を接続するだけであるため、従来よりも簡易で文字形状に大きな影響を与えずに、表内の罫線を除去し除去の際に生じた文字の分割を復元することが可能である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理の分野において、表内の罫線を除去し、除去の際に生じた文字の分割を復元するための技術に関する。
【背景技術】
【0002】
帳票文書は、予め表が印刷された帳票フォーマットに対し、文字や数字或いは記号など(以下、単に文字という)で表された各種情報を後から印字して作成される場合が多い。このように後から上書きする形で文字を印字した場合、予め印刷されている表と文字との間で位置ずれが発生し、例えば表を構成する罫線の一部と文字の一部とが交差してしまうことがある。このような交差があると、例えばコンピュータによる画像処理で表の罫線を除去した場合、その罫線の除去によって文字の一部も失われてしまう。よって、印字されていた文字で表されていた情報を認識しようとしても、文字そのものを判別できず、情報を正確に読み取ることができない。
【0003】
このような問題を改善する技術として特許文献1〜4に記載された技術がある。特許文献1には、2値画像から抽出された罫線を除去し、文字が罫線枠から部分的に突き抜けている場合にはその部分の黒画素を補間して復元することが開示されている。また、特許文献2には、2値画像上のランレングスデータをフィルタリングし、フィルタリング後のランレングスデータの連結成分データを生成し、連結成分の外形特徴から罫線と罫線以外の連結成分を区別し、罫線の連結成分の外接矩形領域から罫線の端点を検出し、罫線どうしの連続関係から罫線のかすれを判定し、かすれであると判定すれば該罫線どうしを接続することにより罫線を抽出することが開示されている。また、特許文献3には、罫線を除去した画像から文字部分の垂直分離成分を統合し、罫線除去処理によって除去してしまった文字部分の抽出を行い、抽出した文字部分を残存ノイズ除去後の画像に対し補完することで、除去された文字部分を復元することが開示されている。そして、特許文献4には、文字を構成する線の幅を算出しておき、文字枠と共に文字の一部が除去されているか否かを判定し、除去されている場合に、その除去された箇所を算出された幅の線で補完することが開示されている。
【特許文献1】特開平10−334184号公報
【特許文献2】特開平11−232382号公報
【特許文献3】特開2000−322510号公報
【特許文献4】特開2002−230481号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の方式では、復元すべき部分に単純に罫線と同じ幅の矩形を挿入するのみであり、修正後の文字形状が著しく損なわれる可能性がある。また、特許文献2に記載の方式では、罫線と接続するランレングスデータ、もしくは数ドット上下のランレングスデータという局所的な情報で対応する画素を決定しているため、対応付けの論理を状況によって細かく使い分けなければならない。また、特許文献3に記載の方式では、高さmのマスクを使用して、マスクの両端に画素がある場合には文字の欠損が生じていると判断して復元を行うが、例えば文字と罫線が斜めに交差しているなどのように欠損が非常に大きい場合には、文字を復元することは難しい。そして、特許文献4に記載の方式では、検出した文字線幅で復元するため、罫線と文字とが斜めに交差するなどの文字線幅以上の欠損が生じている場合には文字を復元することは難しい。
【0005】
このように、特許文献1〜4に開示された技術では、文字と罫線とが交差している状況によっては、欠損部分を復元できないとか或いは復元するためには処理を複雑化する必要がある、などの問題があった。
本発明は上記のような問題点に鑑みて為されたものであり、表の罫線を除去する処理に伴って文字の一部に欠損部分が生じた場合に、従来よりも簡易な処理でその文字の欠損部分を本来の文字に近い形状で復元することを目的のひとつとする。
【課題を解決するための手段】
【0006】
上記従来例の問題点を解決するため、本発明は、罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力手段と、前記画像入力手段によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定手段と、前記文字列を表す文字画像を構成する画素群から、前記罫線特定手段によって特定された罫線画像に接する画素列を抽出する画素列抽出手段と、前記罫線特定手段により特定された罫線画像を、前記画像入力手段によって入力された画像から除去する罫線除去手段と、前記画素列抽出手段によって抽出された画素列のうち、前記罫線画像を挟んで所定の位置関係にある画素列どうしを所定幅の線分画像で接続する画素列接続手段とを有することを特徴とする画像処理装置を提供する。本発明によれば、罫線画像の除去によって分離された文字画像の間を所定幅の線分画像で接続するだけであるため、従来よりも簡易に文字画像を復元できるし、また、文字の形状に大きな影響を与えることもない。
【0007】
また、本発明は、罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力手段と、前記画像入力手段によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定手段と、前記罫線特定手段により特定された罫線画像を、前記画像入力手段によって入力された画像から除去する罫線除去手段と、前記罫線除去手段によって罫線画像が除去された画像において、前記文字列を表す文字画像の外接矩形を検出する外接矩形検出手段と、前記外接矩形検出手段によって検出された複数の外接矩形のうち、前記罫線画像を挟んで所定の位置関係にある外接矩形を統合する外接矩形統合手段と、前記外接矩形統合手段によって統合された外接矩形の各々に内接する文字画像を構成する画素群のうち、前記罫線画像に接する画素列を抽出する画素列抽出手段と、前記罫線画像を挟んで所定の位置関係にある外接矩形の各々に内接する文字画像どうしの間で、前記抽出手段によって抽出された画素列を線分画像で接続する画素列接続手段とを有することを特徴とする画像処理装置を提供する。
本発明によれば、外接矩形を統合することで接続すべき画素列の範囲を制限することができるため、不適切な画素群を接続するような事態を生じさせにくくすることができる。また、分離された文字画像の間を線分画像で接続するだけであるため、従来よりも簡易に文字画像を復元できるし、また、文字の形状に大きな影響を与えることもない。
【0008】
上記の発明において、前記画素列接続手段は、前記罫線画像を挟んで所定の位置関係にある画素列どうしをグループ化するグルーピング手段と、各々のグループに含まれる複数の画素列のうち、前記罫線画像から見て一方の側にある画素列の個数と、前記罫線画像から見て他方の側にある画素列の個数とを計数する計数手段と、前記画素列の長さを算出する算出手段とを備え、前記一方の側にある画素列の個数と前記他方の側にある画素列の個数とが同じであり、且つ、接続すべき画素列の長さの差が閾値未満であれば、その接続すべき画素列の略中心点どうしを接続するようにしてもよい。また、前記画素列接続手段は、前記罫線画像を挟んで所定の位置関係にある画素列どうしをグループ化するグルーピング手段と、各々のグループに含まれる複数の画素列のうち、前記罫線画像から見て一方の側にある画素列の個数と、前記罫線画像から見て他方の側にある画素列の個数とを計数する計数手段と、前記画素列の長さを算出する算出手段とを備え、前記一方の側にある画素列の個数と前記他方の側にある画素列の個数とが同じであり、且つ、接続すべき画素列の長さの差が閾値を超えている場合には、短い方の画素列の略中心点と、長い方の画素列の端点から所定の距離だけ離れた点又は当該画素列の略中心点とを接続するようにしてもよい。また、前記画素列接続手段は、前記罫線画像を挟んで所定の位置関係にある画素列どうしをグループ化するグルーピング手段と、各々のグループに含まれる複数の画素列のうち、前記罫線画像から見て一方の側にある画素列の個数と、前記罫線画像から見て他方の側にある画素列の個数とを計数する計数手段とを備え、前記一方の側にある画素列の個数と前記他方の側にある画素列の個数とが異なっている場合には、画素列の数が多いほうの側にある各画素列の略中心点と、画素列の数が少ないほうの側にある画素列の端点から所定の距離だけ離れた点又は当該画素列の中心点とを接続するようにしてもよい。
【0009】
さらに本発明の一態様に係るプログラムは、コンピュータに、罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力機能と、前記画像入力機能によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定機能と、前記文字列を表す文字画像を構成する画素群から、前記罫線特定機能によって特定された罫線画像に接する画素列を抽出する画素列抽出機能と、前記罫線特定機能により特定された罫線画像を、前記画像入力機能によって入力された画像から除去する罫線除去機能と、前記画素列抽出機能によって抽出された画素列のうち、前記罫線画像を挟んで所定の位置関係にある画素列どうしを所定幅の線分画像で接続する画素列接続機能とを実現させる。また、本発明の別の態様に係るプログラムは、コンピュータに、罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力機能と、前記画像入力機能によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定機能と、前記罫線特定機能により特定された罫線画像を、前記画像入力機能によって入力された画像から除去する罫線除去機能と、前記罫線除去機能によって罫線画像が除去された画像において、前記文字列を表す文字画像の外接矩形を検出する外接矩形検出機能と、前記外接矩形検出機能によって検出された複数の外接矩形のうち、前記罫線画像を挟んで所定の位置関係にある外接矩形を統合する外接矩形統合機能と、前記外接矩形統合機能によって統合された外接矩形の各々に内接する文字画像を構成する画素群のうち、前記罫線画像に接する画素列を抽出する画素列抽出機能と、前記罫線画像を挟んで所定の位置関係にある外接矩形の各々に内接する文字画像どうしの間で、前記抽出機能によって抽出された画素列を線分画像で接続する画素列接続機能とを実現させる。
【発明の効果】
【0010】
本発明によると、表の罫線を除去する処理に伴って文字の一部に欠損部分が生じた場合に、従来よりも簡易な処理で、その文字の欠損部分を本来の文字に近い形状で復元することが可能となる。
【発明を実施するための最良の形態】
【0011】
図1は、本発明の一実施形態に係る画像処理装置1のハードウェア構成を示すブロック図である。この画像処理装置1は、典型的には、汎用のコンピュータシステムによって実現される。即ち、画像処理装置1は、図1に示すように、CPU(中央演算装置)40とメモリ42と各種I/O(入出力)インタフェース44とがバス46を介して接続された回路構成を有する。ハードディスク(記憶媒体)に対するデータの読み書きを行うハードディスクドライブ48や、CDやDVD、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対するデータの読み書きを行うディスクドライブ50や、キーボードのような操作部52や、液晶ディスプレイのような表示部54がI/Oインタフェース44を介してバス46に接続されている。これらのドライブ48,50に装着された記憶媒体には、後述するような処理手順が記述されたプログラムがCDやDVD等の記録媒体を経由して又はネットワーク経由で記憶される。そして、CPU40によって、これらの記憶媒体に記憶されたプログラムがメモリ42に読み出されて実行されることにより、図2に示す各種機能が実現されることになる。
【0012】
図2は、画像処理装置1の機能構成を示すブロック図であり、101は画像入力部、102は罫線特定部、103は接触画素群検出部、104は罫線除去部、105は外接矩形検出部、106は外接矩形統合部、107は画素列抽出部、108は画素列接続部を示している。画像入力部101は、I/Oインタフェース44経由で接続されたスキャナ装置(図示略)などから、原稿上の画像を画像データ(以下、単に原稿画像と略す)を取得し、画像処理装置1に入力する。このスキャナ装置は、例えば原稿載置台、光源、ラインセンサ及びA/D(アナログ/デジタル)変換器などからなり、ラインセンサの受光素子の並び方向(主走査方向)と直交する方向(副走査方向)にそのラインセンサを移動させることによって原稿上の画像を読み取り、これを画像データとして出力する。なお、スキャナ装置の読み取り方式は任意であり、原稿を移動させて読み取る方式などでも良い。
【0013】
この原稿画像に罫線から成る表とその表に関連する内容を表す文字列とが含まれている場合、罫線特定部102は、その原稿画像において罫線を表す罫線画像を特定する。接触画素群検出部103は、原稿画像において罫線画像とその罫線画像に接している文字画像とを検出する。罫線除去部104は、原稿画像から罫線画像を除去する。外接矩形検出部105は、罫線画像除去前にその罫線画像と接していた文字画像(文字画像の切片)に外接する矩形を外接矩形として検出する。外接矩形統合部106は、外接矩形検出部105によって検出された複数の外接矩形のうち、罫線画像を挟んで所定の位置関係にある外接矩形どうしを統合する。画素列抽出部107は、統合された外接矩形の各々に内接する文字画像を表す画素群のうち、罫線画像に接する画素列を抽出する。画素列接続部108は、罫線画像を挟んで所定の位置関係にある外接矩形の各々に内接する文字どうしの間で、画素列抽出部107によって抽出された画素列どうしを線分画像で接続する。
【0014】
以上のように構成された画像処理装置1の処理について、図3のフローチャートを参照しながら説明する。
まず、画像入力部101は、スキャナ装置などから原稿画像を取得して画像処理装置1に入力する(ステップ201)。本実施形態における処理対象は、罫線から成る表とその表に関連した情報(内容)を表す文字列である。そのため、画像入力部101は、入力された原稿画像に、表及びその表に関連した(内容)を表す文字列以外の画像が含まれているか否かを判断し(ステップ202)、含まれている場合には(ステップ202;YES)、その原稿画像において処理対象となる画像と処理対象でない画像とを分離して、処理対象の画像のみを抽出する(ステップ203)。このような画像の分離方法については、画像の属性を基に自動的に分離する表領域分離技術(例えば、特開平2−210586号公報参照)などがあり、公知の技術のため詳細な説明を省略する。また、例えば表示部54に表示された原稿画像上で操作者が操作部52により指定することにより、処理対象となる画像の抽出を行なうようにしてもよい。以下の処理は、このようにして抽出された、処理対象となる画像に対して実行される。
【0015】
次に、罫線特定部102は、原稿画像に含まれる罫線画像を特定する(ステップ204)。罫線画像を特定する方法としては、例えば原稿画像において所定長以上のランレングスデータを検出してそれを罫線画像とする方法や、原稿画像の水平/垂直方向の射影を取り、そのピーク値を取る領域を罫線画像とする方法などがある。罫線特定部102は、このような方法を用いて、原稿画像から罫線画像を抽出し、抽出した罫線画像の原稿画像中の位置(始点座標及び終点座標)を含む罫線特定情報を生成する。
【0016】
次に、接触画素群検出部103は、上記罫線特定情報によって表される位置にある罫線画像と、その罫線画像に接している文字画像とを検出する(ステップ205)。まず、接触画素群検出部103はラベリング処理を行う。つまり、接触画素群検出部103は、原稿画像を構成する各画素に対して或る画素が他の画素に接しているか否かを1つ1つ確認しながら、相互に連結する画素からなる連結画素群を特定し、その画素郡単位で異なるラベルを付与する。罫線画像は、表を表しているので、相当大きな領域を占める連結画素群になるはずである。また、その罫線画像に接している文字画像もその連結画素群の一部を成す。よって、罫線画像及びその罫線画像に接している文字画像が相当に大きな領域を占める連結画素群として抽出される。よって、接触画素群検出部103は、ラベリングされた各々の連結画素群のうち、一定領域以上の面積(画素数)を有する連結画素群を、罫線画像とその罫線画像に接している文字画像として抽出する。ここでいう「一定領域」とは、原稿画像中に含まれる各文字が占める領域よりも十分に大きい領域であればよい。
【0017】
ここで、図4(a)は、原稿画像の一部を例示する図である。図に示すように、「いろは」という文字画像は罫線画像に接していないのに対し、「35670」という文字画像は罫線画像に接している。このような原稿画像に対して、ステップ205の処理を施すと、「35670」という文字画像と罫線画像とが1つの連結画素群として認識される。そして、その連結画素群が占める領域は十分に大きいため、図4(b)に示すように、罫線画像とその罫線画像に接している文字画像として抽出されることになる。
【0018】
次に、罫線除去部104は、ステップ205で抽出された連結画素群から、ステップ204で生成された罫線特定情報によって表される罫線画像を除去する(ステップ206)。これにより、図4(b)に示す画像から、図4(c)に示すように、罫線画像に接している文字画像(本来の文字を表す文字画像の切片)のみを取り出すことができる。次に、外接矩形検出部105は、ステップ206で取り出された文字画像に外接する外接矩形を検出する(ステップ207)。これにより、図4(c)に示した文字画像から、図5に示すように複数の外接矩形401a〜401fが検出される(なお、図5は、図4中の文字画像「3」、「5」、「6」についてのみ例示している)。また、別の例で説明すると、図6に示すように、「カ」という文字画像が罫線画像で図中上下に分断されている場合には、複数の外接矩形601a〜601cが検出されることになる。
【0019】
次に、外接矩形統合部106は、外接矩形検出部105によって検出された複数の外接矩形のうち、罫線画像を挟んで所定の位置関係にある外接矩形どうしを統合する(ステップ208)。図5,6に示したように、罫線画像が除去されたことで、本来は1つの文字を表していたはずであった文字画像が幾つかの切片に分離している。この外接矩形統合部106は、分離してしまった文字画像を本来の文字を表す1つの画像に統合するための役割を果たすものである。
【0020】
具体的な統合処理は以下の通りである。
外接矩形統合部106は、ステップ207で検出した外接矩形が罫線画像を挟んだ位置関係にあり、且つ、それぞれの外接矩形において罫線と直交する方向から見た場合に互いに重なる領域が存在するような位置関係にあるか否かを判断する。外接矩形統合部106は、このような所定の位置関係にある外接矩形を見つけ出すと、その外接矩形どうしを統合する(ステップ208)。例えば、図5に示す例では、外接矩形401aと外接矩形401bとが上記の位置関係を満たしているから、これらが統合されて図7に示す外接矩形501aとなる。同様に、図5の外接矩形401cと外接矩形401dとが統合されて図7に示す外接矩形501cとなり、図5の外接矩形401eと外接矩形401fとが統合されて図7に示す外接矩形501eとなる。また、図6に示す例では、外接矩形601aと外接矩形601bとが上記の位置関係を満たしており、外接矩形601aと外接矩形601cとが上記の位置関係を満たしている。このような場合、外接矩形601aを介在して、外接矩形601a,601b、601cが上記の位置関係を満たすことになるから、これらの全てが統合されて、図8に示すような外接矩形700となる。
【0021】
次に、画素列抽出部107は、ステップ208において統合された外接矩形の各々に内接する文字画像を表す画素群のうち、接続すべき画素列を抽出する(ステップ209)。具体的には、画素列抽出部107は、罫線特定部102で特定した罫線特定情報を用いて、ステップ208において統合された外接矩形の各々に内接する文字画像から、罫線画像に接する1列分の画素列を抽出する。罫線特定情報によって罫線画像の位置を特定することができるので、その罫線画像のエッジ部分の隣りに位置する画素列を見つけ出し、これを抽出することは容易である。これにより、例えば図8に示した例の場合であれば、図9に示すように画素列701〜704が抽出されることになる。
【0022】
画素列接続部108は、画素列抽出部107が抽出した画素列のうち、罫線画像を挟んで所定の位置関係にある画素列どうしを接続する(ステップ210)。図10のフローチャートを用いて具体的に説明する。
まず、画素列接続部108は、罫線画像を挟んだ位置関係にあり、且つ、罫線画像が延びる方向に直交する方向から見た場合に互いに重なる領域が存在するような位置関係にある画素列どうしを、接続対象画素列としてグルーピングする(ステップ801)。図9の例では、画素列701と画素列703とが1つにグルーピングされ、画素列702と画素列704とが1つにグルーピングされる。次に、画素列接続部108は、グループ内に含まれる画素列の数を計数し、罫線画像から見て一方の側に存在する画素列の数と他方の側に存在する画素列の数とを比較する(ステップ802)。図9の例では、罫線画像から見て一方の側に存在する画素列は2個であり(画素列701,702)、罫線画像から見て他方の側に存在する画素列は2個であるから(画素列703,704)、画素列の数は罫線を挟んで同数である(ステップ802:同じ数)。
【0023】
次に、画素列接続部108は、接続対象画素列の長さ(列方向に連なる画素数)を比較する(ステップ803)。図9の例では、画素列701と画素列703、また、画素列702と画素列704はいずれもほぼ同じ長さ(列方向に連なる画素数の差が閾値未満)である。このような場合には(ステップ803;ほぼ同じ長さ)、画素列接続部108は、各々の画素列の中心点どうしを結ぶ線上に画素を挿入することで両者を所定幅の線分画像で接続する(ステップ804)。これにより、図11に示すように、画素列701の中心点901と画素列703の中心点903とが線分画像905aで接続され、画素列702の中心点902と画素列704の中心点904とが線分画像905bで接続される。そして、画素列接続部108は、更に未接続の接続対象画素列がある場合には(ステップ811;YES)、前述したステップ803の処理に戻り、上記の処理を繰り返す。
【0024】
一方、画素列の長さが異なる(列方向に連なる画素数の差が閾値以上)場合には(ステップ803;異なる長さ)、画素列接続部108の処理は次のようになる。つまり、図12に示すような画素列1001と、画素列1002とを接続するような場合である。画素列接続部108は、図13に示すように、短い方の画素列1002の中心点1102を求めた後、その画素列1002の端点からその中心点1102までの距離Lを求める(ステップ805)。次に、画素列接続部108は、短い方の画素列1002の各端点から長い方の画素列1001に対して垂線をそれぞれ下ろしたときに、その垂線と垂線の間に画素列1001の端点が含まれるか否かを判断する。そして、含まれる場合には、画素列接続部108は、長い方の画素列1001の中心点1101に近い方の端点から距離Lだけ離れた点1101を接続点として求める(ステップ806)。一方、垂線と垂線の間に長い方の画素列の端点が含まれない場合には、図14に示すように、その垂線と垂線の間に位置する中心点1203を長い画素列1201の接続点とする(ステップ806)。そして、画素列接続部108は、これらの画素列における接続点どうしを結ぶ線上に画素を挿入することで両者を所定幅の線分画像で接続する(ステップ807)。そして、画素列接続部108は、更に未接続の画素列がある場合には(ステップ811;YES)、前述したステップ803の処理に戻り、上記の処理を繰り返す。
【0025】
さて、ステップ802において、罫線を挟んで画素列の数が異なる場合がある(ステップ802;異なる数)。例えば図15に示すように、罫線画像から見て一方の側に存在する画素列は1個であるのに対し(画素列1301)、罫線画像から見て他方の側に存在する画素列は2個であるような場合である(画素列1302,1303)。この場合、画素列接続部108は、画素列の数が多い方の側にある画素列1302,1303から接続点の決定を試みる。
【0026】
まず、画素列接続部108は、画素列1302、画素列1303のうちいずれか一方の未接続の画素列(ここでは画素列1302)を選択する(ステップ808)。次に、画素列接続部108は、図16に示すように、この画素列1302の各端点から、その画素列1302に罫線画像を挟んで相対する画素列1301に対して垂線を下ろす。この2本の垂線と垂線の間に画素列1301の端点が含まれている場合には、画素列1302の端点から中心点1404までの距離Lを求める。そして、画素列接続部108は、相対する画素列1301において上記の垂線と垂線の間に含まれる端点から距離Lの点1403を画素列1301の接続点とする(ステップ809)。そして、これら2つの接続点の間を所定幅の線分画像で接続する(ステップ810)。
【0027】
一方、画素列1303と画素列1301とを接続するときのように、垂線と垂線の間に画素列1301の端点が含まれていない場合には、垂線と垂線との間の中心点1401を画素列1301の接続点として決定し(ステップ809)、これら2つの接続点の間を所定幅の線分画像で接続する(ステップ810)。なお、上記の説明において「中心点」とは、厳密に中心である必要はなく、文字形状に影響を与えなければ、中心点から所定範囲内にある点でも構わない。
【0028】
以上のような処理より、図17に示すようにして、本来は1つの文字画像であった画像部分(切片)を互いに連結させることができる。このようにして復元された文字画像に対して文字認識を施した場合、そのときに用いる認識アルゴリズムによって若干の認識精度の違いは生じるが、どのような認識アルゴリズムであっても相当の精度で文字を認識することができるようになる。そして、出力部109は、このようにして復元された文字画像を表示部54に表示したり、記憶媒体に記憶させるなどして出力する。
【0029】
以上説明したように、本実施形態によれば、外接矩形を統合することで接続すべき画素列の範囲を制限することができるため、不適切な画素群を接続するような事態を生じさせにくくすることができる。また、分離された文字画像の間を線分画像で接続するだけであるため、従来よりも簡易に文字画像を復元できるし、また、文字の形状に大きな影響を与えることもない。さらに、罫線画像と文字画像とを分離することができるので、例えば罫線画像(枠画像)を拡大したが故に罫線画像と文字画像とが交差した場合であっても、その文字画像だけを処理対象とすることもできる。
上記の実施形態において、画素列接続部108は、接続に要した線分画像の幅をさらに太くしてより自然な文字画像となるように整形するようにしてもよい。例えば、互いに接続した文字画像のうちの幅の狭い方の文字画像の幅になるまで線分画像を太くするようにすれば、より自然な文字画像になる。
なお、画像処理装置1はパーソナルコンピュータによって実現されるものに限らず、例えば複写機などに内蔵されるコンピュータによって実現されるものであってもよい。また、上述した実施形態においては、全て横罫線を例に挙げて説明しているが、これと同様の手法を縦罫線の場合に適用することももちろん可能である。
【図面の簡単な説明】
【0030】
【図1】本発明の実施の形態に係る画像処理装置のハードウェア構成を示す図である。
【図2】同画像処理装置の機能構成を示す図である。
【図3】同画像処理装置が実行する手順を示すフローチャートである。
【図4】同画像処理装置の処理の内容を例示する図である。
【図5】罫線画像に接する外接矩形の一例を表す図である。
【図6】罫線画像に接する外接矩形の一例を表す図である。
【図7】外接矩形を統合した例を示す図である。
【図8】外接矩形を統合した例を示す図である。
【図9】接続対象画素列の一例を表す図である。
【図10】画素列接続部が実行する手順を示すフローチャートである。
【図11】画素列の接続例を示す図である。
【図12】画素列の接続例を示す図である。
【図13】画素列の接続例を示す図である。
【図14】画素列の接続例を示す図である。
【図15】画素列の接続例を示す図である。
【図16】画素列の接続例を示す図である。
【図17】文字画像の復元結果の一例を表す図である。
【図18】文字画像の復元に要した線分画像の太さを変更した例を表す図である。
【符号の説明】
【0031】
101:画像入力部、102:罫線特定部、103:接触画素群検出部、104:罫線除去部、105:外接矩形検出部、106:外接矩形統合部、107:画素列抽出部、108:画素列接続部、109:出力部。

【特許請求の範囲】
【請求項1】
罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力手段と、
前記画像入力手段によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定手段と、
前記文字列を表す文字画像を構成する画素群から、前記罫線特定手段によって特定された罫線画像に接する画素列を抽出する画素列抽出手段と、
前記罫線特定手段により特定された罫線画像を、前記画像入力手段によって入力された画像から除去する罫線除去手段と、
前記画素列抽出手段によって抽出された画素列のうち、前記罫線画像を挟んで所定の位置関係にある画素列どうしを所定幅の線分画像で接続する画素列接続手段と
を有することを特徴とする画像処理装置。
【請求項2】
罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力手段と、
前記画像入力手段によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定手段と、
前記罫線特定手段により特定された罫線画像を、前記画像入力手段によって入力された画像から除去する罫線除去手段と、
前記罫線除去手段によって罫線画像が除去された画像において、前記文字列を表す文字画像の外接矩形を検出する外接矩形検出手段と、
前記外接矩形検出手段によって検出された複数の外接矩形のうち、前記罫線画像を挟んで所定の位置関係にある外接矩形を統合する外接矩形統合手段と、
前記外接矩形統合手段によって統合された外接矩形の各々に内接する文字画像を構成する画素群のうち、前記罫線画像に接する画素列を抽出する画素列抽出手段と、
前記罫線画像を挟んで所定の位置関係にある外接矩形の各々に内接する文字画像どうしの間で、前記抽出手段によって抽出された画素列を線分画像で接続する画素列接続手段と
を有することを特徴とする画像処理装置。
【請求項3】
前記画素列接続手段は、
前記罫線画像を挟んで所定の位置関係にある画素列どうしをグループ化するグルーピング手段と、
各々のグループに含まれる複数の画素列のうち、前記罫線画像から見て一方の側にある画素列の個数と、前記罫線画像から見て他方の側にある画素列の個数とを計数する計数手段と、
前記画素列の長さを算出する算出手段とを備え、
前記一方の側にある画素列の個数と前記他方の側にある画素列の個数とが同じであり、且つ、接続すべき画素列の長さの差が閾値未満であれば、その接続すべき画素列の略中心点どうしを接続することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
前記画素列接続手段は、
前記罫線画像を挟んで所定の位置関係にある画素列どうしをグループ化するグルーピング手段と、
各々のグループに含まれる複数の画素列のうち、前記罫線画像から見て一方の側にある画素列の個数と、前記罫線画像から見て他方の側にある画素列の個数とを計数する計数手段と、
前記画素列の長さを算出する算出手段とを備え、
前記一方の側にある画素列の個数と前記他方の側にある画素列の個数とが同じであり、且つ、接続すべき画素列の長さの差が閾値を超えている場合には、短い方の画素列の略中心点と、長い方の画素列の端点から所定の距離だけ離れた点又は当該画素列の略中心点とを接続することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項5】
前記画素列接続手段は、
前記罫線画像を挟んで所定の位置関係にある画素列どうしをグループ化するグルーピング手段と、
各々のグループに含まれる複数の画素列のうち、前記罫線画像から見て一方の側にある画素列の個数と、前記罫線画像から見て他方の側にある画素列の個数とを計数する計数手段とを備え、
前記一方の側にある画素列の個数と前記他方の側にある画素列の個数とが異なっている場合には、画素列の数が多いほうの側にある各画素列の略中心点と、画素列の数が少ないほうの側にある画素列の端点から所定の距離だけ離れた点又は当該画素列の中心点とを接続することを特徴とする請求項1又は2に記載の画像処理装置。
【請求項6】
コンピュータに、
罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力機能と、
前記画像入力機能によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定機能と、
前記文字列を表す文字画像を構成する画素群から、前記罫線特定機能によって特定された罫線画像に接する画素列を抽出する画素列抽出機能と、
前記罫線特定機能により特定された罫線画像を、前記画像入力機能によって入力された画像から除去する罫線除去機能と、
前記画素列抽出機能によって抽出された画素列のうち、前記罫線画像を挟んで所定の位置関係にある画素列どうしを所定幅の線分画像で接続する画素列接続機能と
を実現させるプログラム。
【請求項7】
コンピュータに、
罫線から成る表と該表に関連する内容を表す文字列とを含む文書を画像として入力する画像入力機能と、
前記画像入力機能によって入力された画像において、前記罫線を表す罫線画像を特定する罫線特定機能と、
前記罫線特定機能により特定された罫線画像を、前記画像入力機能によって入力された画像から除去する罫線除去機能と、
前記罫線除去機能によって罫線画像が除去された画像において、前記文字列を表す文字画像の外接矩形を検出する外接矩形検出機能と、
前記外接矩形検出機能によって検出された複数の外接矩形のうち、前記罫線画像を挟んで所定の位置関係にある外接矩形を統合する外接矩形統合機能と、
前記外接矩形統合機能によって統合された外接矩形の各々に内接する文字画像を構成する画素群のうち、前記罫線画像に接する画素列を抽出する画素列抽出機能と、
前記罫線画像を挟んで所定の位置関係にある外接矩形の各々に内接する文字画像どうしの間で、前記抽出機能によって抽出された画素列を線分画像で接続する画素列接続機能と
を実現させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公開番号】特開2007−241397(P2007−241397A)
【公開日】平成19年9月20日(2007.9.20)
【国際特許分類】
【出願番号】特願2006−59345(P2006−59345)
【出願日】平成18年3月6日(2006.3.6)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】