説明

文字認識装置、文字認識方法及びプログラム

【課題】等倍フォントの欧文文字を含む画像データの文字認識の際、原稿に存在し認識された本来の空白文字と、原稿には存在しない文字幅が相対的に狭い文字の前後であるが故に誤って認識された空白文字とを判別し、誤った空白文字のみを削除する文字認識装置の提供。
【解決手段】文字認識装置10は、読み取られた文書原稿から文字を認識し、空白文字を区切りとして単語単位に文字認識結果の文字列を補正する。認識されたアルファベット文字列それぞれに外接矩形を形成する外接矩形形成部17と、隣接する外接矩形の幅方向中央線間の距離に基づいて、等倍フォントであるか否かを判定する等倍フォント判定部19と、等倍フォントの場合に文字列中の空白文字の幅が所定幅より狭いことに基づいて当該空白文字が余剰と判定する余剰空白文字判定部20と、余剰と判定された空白文字を文字列から削除する削除部21とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像として読み取られた文書原稿から文字を認識し、空白文字を区切りとして単語単位に文字認識結果の文字列を補正する文字認識装置及び文字認識方法、並びに、該文字認識装置をコンピュータで実現するためのプログラムに関する。
【背景技術】
【0002】
ワープロ等で作成された文字が印刷された文書原稿を、コンピュータ等の情報処理装置で扱えるようにデジタル化する文字認識の技術が提案されている。文字認識技術では、文書原稿をイメージスキャナ等で読み込んで文字を認識し、文字を英数字、ひらがな又は漢字などの文字コードに変換して保存する。
【0003】
そして、認識後の文字列に言語処理的な解析処理を行い、文字の認識誤りを補正する処理が一般的に行われている。この補正処理としては、基本的に単語辞書との先頭一致による照合を行い、一致した辞書上の候補、または形態素解析等の言語解析の結果、適正と評価された候補を正解候補として、文字認識結果の文字列を修正するといった手法が一般的である。
【0004】
しかし、日本語帳票の文書原稿等といった、文字が所定の枠内に一定間隔で配置された文書原稿の場合、すなわち、文字が均等割り付けされた文書原稿の場合、実際は単語区切りでない文字と文字との間の空白を単語区切りと見なしてしまい、単語辞書との照合がうまくいかず、補正処理の効果を十分に得ることができない。
特許文献1には、この問題を解決するものとして、以下の技術が開示されている。すなわち、一行の文字列を表す文字列画像から切り出された1文字の画像と、それに隣接する1文字の画像との間の空白を検出し、該検出した空白が所定の大きさより大きい場合、上記1文字の画像とそれに隣接する1文字の画像とは、それぞれ、異なる単語に属する文字であると識別するもので、取り込まれた文書の画像中の所定の領域内の文字列画像については、上述の識別結果を無効とする技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平8−263587号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述の日本語帳票の文書原稿の場合だけでなく、本来は和文等の表示や印刷に適したMSゴシック等の等倍フォントの文字を含む文書原稿でも上述と同様の問題がある。具体的には、等倍フォントでは文字幅が相対的に狭い文字(「i」)等の前後の空白が、単語区切りの空白文字すなわちでないにも関わらず、単語区切りの空白文字と認識され、補正処理の効果を十分に得ることができない、という問題である。
特許文献1には、この問題に関し、何ら開示も示唆もされていない。
【0007】
本発明は、斯かる事情に鑑みてなされたものであって、その目的は、MSゴシック等の等倍フォントで構成された欧文文字を含む画像データの文字認識の際、原稿に存在し認識された本来の空白文字と、原稿には存在しない文字幅が相対的に狭い文字(「i」等)の前後であるが故に誤って認識された空白文字とを判別し、後者の誤った空白文字のみを削除する文字認識装置及び文字認識方法並びに該文字認識装置をコンピュータで実現するためのプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本発明の第1の技術手段は、画像として読み取られた文書原稿から文字を認識し、空白文字を区切りとして単語単位に文字認識結果の文字列を補正する文字認識装置において、認識されたアルファベット文字列それぞれに外接矩形を形成する外接矩形形成部と、隣接する前記外接矩形の幅方向中央線間の距離に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定する等倍フォント判定部と、等倍フォントと判定された場合に、前記文字列中の空白文字の文字幅が所定の幅よりも狭いことに基づいて当該空白文字が余剰空白文字であることを判定する余剰空白文字判定部と、前記余剰空白文字と判定された空白文字を前記文字列から削除する余剰空白文字削除部とを備えることを特徴としたものである。
【0009】
本発明の第2の技術手段は、第1の技術手段において、前記等倍フォント判定部が、1番目と2番目の前記外接矩形の幅方向中央線間の距離を基準値とし、他の隣接する前記外接矩形の幅方向中央線間の距離が前記基準値に基づいて定められる所定の範囲内である場合には、前記文字列のフォントが等倍フォントであると判定することを特徴としたものである。
【0010】
本発明の第3の技術手段は、第1の技術手段において、前記等倍フォント判定部が、前記隣接する外接矩形の幅方向中央線間の距離のヒストグラムをとり、該ヒストグラムに中央化傾向がある場合には、前記文字列のフォントが等倍フォントであると判定することを特徴としたものである。
【0011】
本発明の第4の技術手段は、第1〜3のいずれか1の技術手段において、前記等倍フォント判定部が、前記文字列の一部に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定することを特徴としたものである。
【0012】
本発明の第5の技術手段は、第4の技術手段において、前記等倍フォント判定部が、前記文字列のうち文字サイズが等しいと判定される部分に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定することを特徴としたものである。
【0013】
本発明の第6の技術手段は、第1〜第5のいずれか1の技術手段において、前記所定の幅が、前記外接矩形の幅方向中央線間の距離に基づいて決定されることを特徴としたものである。
【0014】
本発明の第7の技術手段は、第1〜第6のいずれか1の技術手段において、前記所定の幅は、前記文字列の空白文字の幅のヒストグラムに基づいて決定されることを特徴としたものである。
【0015】
本発明の第8の技術手段は、画像として読み取られた文書原稿から文字を認識し、空白文字を区切りとして単語単位に文字認識結果の文字列を補正する文字認識方法において、認識されたアルファベット文字列それぞれに外接矩形を形成し、隣接する前記外接矩形の幅方向中央線間の距離に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定し、等倍フォントと判定された場合に、前記文字列中の空白文字の文字幅が所定の幅よりも狭いことに基づいて当該空白文字が余剰空白文字であることを判定し、前記余剰空白文字と判定された余剰空白文字を前記文字列から削除することを特徴としたものである。
【0016】
本発明の第9の技術手段は、コンピュータを、第1〜第7のいずれか1の技術手段の文字認識装置として機能させることを特徴とするコンピュータプログラムである。
【発明の効果】
【0017】
本発明に文字認識装置によれば、MSゴシック等の等倍フォントで構成された欧文文字を含む画像データの文字認識の際、原稿に存在し認識された本来の空白文字と、原稿には存在しない文字幅が相対的に狭い文字の前後であるが故に誤って認識された空白文字とを判別し、後者の誤った空白文字のみを削除することができる。そのため、空白文字を区切りとして単語単位に文字認識結果の文字列を適正に補正できる。
【図面の簡単な説明】
【0018】
【図1】本発明の文字認識装置の一例の内部構成を示すブロック図である。
【図2】図1の文字認識装置が実行する処理の一例を示すフローチャートである。
【図3】図1の文字認識装置の文字認識対象となる原文書の一例を示す模式図である。
【図4】認識文字列データの一例を説明する図である。
【図5】外接矩形形成部が実行する外接矩形形成のイメージを示す模式図である。
【図6】認識文字列データと認識文字付属情報データの一例を示す表である。
【図7】外接矩形中央線導出部が実行する文字外接矩形中央線形成のイメージを示す模式図である。
【図8】認識された文字列から余剰空白文字を除去した文字列の一例を示す図である。
【図9】図2のステップS105のフォント情報取得処理を説明するフローチャートである。
【図10】図2のステップS107の余剰空白文字判定・削除処理を説明するフローチャートである。
【発明を実施するための形態】
【0019】
以下に、本発明に係る文字認識装置、文字認識方法及びプログラムについて、その実施形態を示す図面に基づいて詳述する。なお、以下の実施形態では、本発明に関わるプログラムを公知のパーソナルコンピュータ、サーバコンピュータ等に読み取らせ、パーソナルコンピュータ又はサーバコンピュータのCPU(Central Processing Unit)等に実行させることによって本発明に係る文字認識装置を実現する構成について説明する。しかし、等価な働きをするハードウェアによって本発明に係る文字認識装置を実現してもよい。
【0020】
図1は、本発明の文字認識装置の一例の内部構成を示すブロック図である。
本発明の文字認識装置は、画像として読み取られた文書原稿から文字を認識し、空白文字を区切りとする単語単位で文字認識結果を補正するもので、図1の参照符号10で例示するように、制御部11、ネットワークI/F部12、記憶部13、画像取得部14、レイアウト解析部15、文字認識部16、外接矩形形成部17、外接矩形中央線導出部18、等倍フォント判定部19、余剰空白文字判定部20、余剰空白文字削除部21、文字認識補正部22を備える。
【0021】
制御部11は、CPU、MPU(Micro Processing Unit)等であり、上述したような各部を制御すると共に、記憶部13に格納されている制御プログラムを適宜実行する。
【0022】
ネットワークI/F部12は、LAN(Local Area Network)又はWAN(Wide Area Network)等のIP(Internet Protocol)ネットワークに接続するためのインタフェースである。ネットワークI/F部12は、IPネットワークを介して外部装置との間で情報の送受信を行なう。
【0023】
記憶部13は、フラッシュROM(Read Only Memory)、EEPROM(Electrically Erasable and Programmable ROM)、HD(Hard Disk)などの記憶装置である。この記憶部13は、文字認識装置10を動作させるために必要な種々の制御プログラム、制御部11による制御プログラムの実行時に発生する種々のデータ等を記憶する。
記憶部13は、制御プログラムとして、例えば、空白文字を区切りとする単語単位で文字認識結果を補正する文字認識補正プログラム13a、不要な空白文字のデータを削除する空白削除プログラム13hを記憶している。
【0024】
また、記憶部13は、制御部11による制御プログラムの実行時に発生する種々のデータとして、原文書画像データ13b、レイアウト解析データ13c、認識文字列データ13d、認識文字付属情報データ13e、空白文字削除後文字列データ13f、文字認識補正後文字列データ13g等を記憶している。
【0025】
画像取得部14は、例えばスキャナであり、文字が記載された原文書画像の画像データを取得し、記憶部13に原文書画像データ13bとして記憶させる。
レイアウト解析部15は、画像取得部14によって取得された原文書画像のレイアウトを解析し、原文書画像に含まれる文字領域、画像領域、余白等の割付を解析するとともに、各領域の位置やサイズ等を特定し、記憶部13にレイアウト解析データ13cとして記憶させる。
【0026】
文字認識部16は、レイアウト解析部15によって抽出された個々の文字領域に含まれる文字を認識して文字列を取得するとともに、原文書画像中における文字の位置やサイズ等の特定を行い、記憶部13に認識文字列データ13d及び認識文字付属情報データ13eとして記憶させる。
【0027】
外接矩形形成部17は、文字認識結果である認識文字列データ13d及び認識文字付属情報データ13eを利用し、認識された文字列を構成する各アルファベット文字に対して文字外接矩形を形成する。
【0028】
外接矩形中央線導出部18は、形成した文字外接矩形それぞれの幅方向の中央線の位置を算出する。
【0029】
等倍フォント判定部19は、文字外接矩形の幅方向の中央線の位置情報を用いて、隣接する文字外接矩形の幅方向中央線間の距離に基づいて、文字列に用いられているフォントが等倍フォントであるか否か判定する。例えば、1番目と2番目の外接矩形の幅方向中央線間の距離を基準値とし、他の隣接する外接矩形の幅方向の中央線間の距離が上記基準値に基づいて定められる所定の範囲内である場合には、等倍フォントであると判定する。なお、上述の所定の範囲とは、上記基準値をXとした場合、例えば、X/1.1〜1.1X、もしくは、真の空白文字が挿入されているケースを想定した2X/1.1〜2.2Xである。また、隣接する外接矩形の幅方向中央線間の距離のヒストグラムをとり、該ヒストグラムに中央化傾向がある場合には、文字列のフォントが等倍フォントであると判定するようにしてもよい。この場合、ある一定区間の文字列の個々の幅を鳥瞰的に見た偏りのない判定処理が期待できる。
【0030】
また、等倍フォントであるか否かの判定は、認識した文字列の一部に基づいて行ってもよい。これにより判定処理の速度を向上させることができる。
さらに、上記判定は、認識した文字列のうち文字サイズが等しいと判定される部分に基づいて行ってもよい。これにより、1文書中に様々な文字サイズが混在している場合でも判定処理の精度を向上させることができる。なお、読取元の原稿において文字サイズが同じであっても、読み取った文字サイズは僅かに異なる場合がある。したがって、認識した文字サイズが僅かに異なっていても、文字認識装置10では、認識した文字サイズが等しいと判定する。
【0031】
なお、行頭または行末の文字を含む外接矩形中央線間では、それ以外の部分に比べ、正確な距離を得ることができない可能性があるので、行頭及び行末の文字は、等倍フォント判定の際の基準値を求める際や、等倍フォント判定対象から除くようにしておいてもよい。
【0032】
余剰空白文字判定部20は、文字列に用いられているフォントが等倍フォントである場合に、文字認識部16の結果である認識文字列データ13dに存在する空白文字各々について、当該空白文字の文字幅が所定の幅よりも狭いことに基づいて当該空白文字が余剰空白文字であることを判定する。上記所定の幅は、例えば、隣接する外接矩形の幅方向の中央線間の距離に基づいて定めてもよいし、また、文字列の空白文字の幅のヒストグラムに基づいて定めてもよい。後者の場合、ある一定区間の空白文字の個々の幅を鳥瞰的に見た偏りのない判定処理が期待できる。
【0033】
余剰空白文字削除部21は、余剰空白文字判定部20で、空白文字のうち余剰空白文字と判定された空白文字のみを認識文字列データ13dから削除し、記憶部13に空白文字削除後文字列データ13fとして記憶させる。
【0034】
以上のような構成により、文字認識装置10は、文字認識された文字列のフォントがMSゴシック等の等倍フォントの場合に、「i」等の幅が狭い文字の前後に文字認識の際に誤って挿入された空白文字を削除できる。
【0035】
なお、文字認識補正部22は、単語辞書を用い、空白文字削除後文字列データに基づいて、空白文字を区切りとする単語単位で文字認識結果を補正し、記憶部13に文字認識補正後文字列データ13gとして記憶させる。この補正の際、余剰空白文字を削除する前の文字列と余剰空白文字を削除した後の文字列とのそれぞれに単語辞書を用いた補正を行い、より適切は補正結果が得られた方の補正結果を出力するようにしてもよい。
【0036】
図2〜図8を用いて、図1の文字認識装置10が実行する処理の一例を説明する。図2は、上記処理の一例を示すフローチャートである。図3は、図1の文字認識装置10の文字認識対象となる原文書の一例を示す模式図である。図4は、認識文字列データ13dの一例を説明する図である。図5は、外接矩形形成部17が実行する外接矩形形成のイメージを示す模式図である。図6は、認識文字列データ13dと認識文字付属情報データ13eの一例を示す表である。図7は、外接矩形中央線導出部18が実行する文字外接矩形中央線形成のイメージを示す模式図である。図8は、認識された文字列から余剰空白文字を除去した文字列の一例を示す図である。
【0037】
制御部11は、画像取得部14によって、文字が記載された原文書の画像データを取得し、記憶部13に原文書画像データ13bとして記憶させる(ステップS100)。ここでは、図3の等倍フォントであるMSゴシックが用いられた「The presentation data」という文字列Iからなる原文書が文字認識対象であるものとする。
【0038】
制御部11は、ステップS100で原文書画像データを取得すると、レイアウト解析部15によって、原文書画像のレイアウトを解析させ、原文書画像に含まれる文字領域、画像領域、余白等の割付を解析させるとともに、各領域の位置やサイズ等を特定し、記憶部13にレイアウト解析データ13cとして記憶させる(ステップS101)。
そして、制御部11は、文字認識部16によって、レイアウト解析で抽出された個々の文字領域に含まれる文字を認識させ文字列として取得させるとともに、原文書画像中における文字の位置やサイズ等の特定を行わせ、記憶部13に認識文字列データ13d及び認識文字付属情報データ13eとして記憶させる(S102)。文字認識部16は、図3のMSゴシックの「The presentation data」という文字列Iからなる原文書からは、図4の「The presentati on data」という文字列Lを取得する。図4の文字列Lでは、文字「i」と文字「o」の間に原文書にはない空白文字が挿入されている。以下では、文字認識結果として図4の文字列Lを取得したものとして説明する。
【0039】
制御部11は、外接矩形形成部17によって、文字認識結果である認識文字列データ13d及び認識文字付属情報データ13eを利用し、図5に示すように各アルファベット文字に対して文字外接矩形Sを形成させる(S103)。例えば、図6の表T中の文字番号「0」である文字「T」の外接矩形は、当該文字「T」の座標値として、左X座標=97、上Y座標=592、右X座標=110、下Y座標=568が取得されることで形成される。
【0040】
また、制御部11は、外接矩形中央線導出部18によって、文字外接矩形それぞれについて、文字外接矩形中央線C(図7参照)の位置情報すなわち該矩形中央の幅方向の座標値を求める(S104)。例えば、文字番号「0」である文字「T」の外接矩形中央の幅方向の座標値は、左X座標=97と右X座標=110の平均値である「X座標=103.5」となる。
【0041】
そして、制御部11は、等倍フォント判定部19によって、各文字の外接矩形中央の幅方向の座標値(中央線C)に基づいて、該当文字列が等倍フォントであるか否かを示すフォント情報を取得し(ステップS105)、該フォント情報に基づいて等倍フォントか否かの判定を行う(ステップS106)。等倍フォントでない場合(NOの場合)にはそのまま処理を終了し、等倍フォントの場合(YES)の場合には、余剰空白文字判定部20によって、各空白文字が余剰空白文字か否かの判定を該空白文字の幅に基づいて行い、余剰空白と判定された場合は、余剰空白文字削除部21によって当該余剰空白文字を削除する(ステップS107)。これにより、図4のMSゴシックの「The presentati on data」という文字列Lから余剰空白文字を除いた図8の「The presentation data」という文字列Mを取得できる。
【0042】
図9は、図2のステップS105のフォント情報取得処理を説明するフローチャートである。
制御部11は、等倍フォント判定部19によって、外接矩形中央線の着目ポインタを1番目の外接矩形中央線に設定し(ステップS200)、2番目の外接矩形中央線が存在するか否か判定する(ステップS201)。存在しない場合(NOの場合)は、フォント情報取得処理を終了し、図2のメインの処理もステップS105〜S107の処理を行わずに終了し、一方、存在する場合(YESの場合)は、外接矩形中央線の着目ポインタを1つ進める(ステップS202)。
そして、ステップS104で求めた各文字の外接矩形中央線の位置情報を利用し、1番目の外接矩形中央線と2番目の外接矩形中央線間の距離を求め、基準値に設定する(ステップS203)。例えば、1番目の外接矩形中央線すなわち図6の1番目の文字である文字番号「0」の文字「T」の外接矩形の中央線は「X座標=103.5」であり、1番目の外接矩形中央線すなわち図6の2番目の文字である文字番号「1」の「h」の外接矩形の中央線は「X座標=120」であり、これらから上記外接矩形中央線間の距離120 − 103.5 =16.5を求め、基準値に設定する。
【0043】
次に、次の外接矩形中央線が存在するか否かの判定を行う(ステップS204)。存在する場合(YESの場合)、外接矩形中央線の着目ポインタを1つ進め(ステップS205)、テップS104で求めた各文字の外接矩形中央線の位置情報を利用し、上記ポインタで示される現在着目する外接矩形中央線と、1つ前の外接矩形中央線との距離を求める(ステップS206)。
【0044】
例えば、上記ポインタが3つ目に設定されている場合は、2番目の外接矩形中央線すなわち図6の2番目の文字である文字番号「1」の文字「h」の外接矩形の中央線の「X座標=120」と、3番目の外接矩形中央線すなわち図6の3番目の文字である文字番号「2」の「e」の外接矩形の中央線の「X座標=136」とから、3番目の文字外接矩形中央線と2番目の文字外接矩形中央線との距離136−120=16を求める。
【0045】
また、例えば、上記ポインタが4つ目に設定されている場合は、4番目の外接矩形中央線すなわち図6の5番目の文字である文字番号「4」の文字「p」の外接矩形の中央線の「X座標=167.5」と、3番目の外接矩形中央線すなわち図6の3番目の文字である文字番号「2」の「e」の外接矩形の中央線の「X座標=136」とから4番目の文字外接矩形中央線と3番目の文字外接矩形中央線との距離167.5−136=31.5を求める。
【0046】
そして、S206で求めた外接矩形中央線の着目ポインタで示される現在着目する外接矩形中央線と1つ前の外接矩形中央線との距離が、ステップS203で求めた基準値に基づいて定められる所定の範囲内か否かに基づいて判定する(ステップS207)。なお、所定の範囲とは、前述したように、基準値をXとした場合、例えば、X/1.1〜1.1X、もしくは、真の空白文字が挿入されているケースを想定した2X/1.1〜2.2Xである。
【0047】
ステップS207において、現在着目する外接矩形中央線と1つ前の外接矩形中央線との距離が所定の範囲内である場合、すなわち、上記距離がステップS203で求めた基準値の整数倍になっている場合(YESの場合)、「等倍フォントである」という判定結果を等倍フォント総合評価用バッファに格納し、ステップS204に戻る(ステップS208)。
また、ステップS207において、現在着目する外接矩形中央線と1つ前の外接矩形中央線との距離が所定の範囲内でない場合、すなわち、上記距離がステップS203で求めた基準値の整数倍になっていない場合(NOの場合)、「等倍フォントではない」という判定結果を等倍フォント総合評価用バッファに格納し、ステップS204に戻る(ステップS209)。
【0048】
例えば、上記ポインタが3つ目に設定されている場合、ステップS206で求めた3番目の文字外接矩形中央線と2番目の文字外接矩形中央線との距離16は、ステップS203で求めた基準値16.5に基づく所定の範囲15〜18.15の範囲内であるので、ステップS208において、「等倍フォント」という判定結果を等倍フォント総合評価用バッファに格納し、ステップS204に戻る。
【0049】
また、例えば、上記ポインタが4つ目に設定されている場合、ステップS206で求めた4番目の文字外接矩形中央線と3番目の文字外接矩形中央線との距離31.5は、ステップS203で求めた基準値16.5に基づく所定の範囲30〜36.3の範囲内であるので、ステップS208において、「等倍フォント」という判定結果を等倍フォント総合評価用バッファに格納し、ステップS204に戻る。
【0050】
ステップS204において、次の外接矩形中央線が存在しないと判定された場合(NOの場合)、等倍総合評価用バッファに格納されている「等倍フォントである」という判定結果や、「等倍フォントではない」という判定結果に基づいて、該当文字列が等倍フォントであるか否かを示すフォント情報を出力して(ステップS210)、図2のステップS106進む。ステップS210では、例えば、「等倍フォントである」という判定結果が90%以上を占めるならば、該当文字列が等倍フォントであるというフォント情報を出力する。
【0051】
図10は、図2のステップS107の余剰空白文字判定・削除処理を説明するフローチャートである。
まず、制御部11は、余剰空白文字判定部20によって、現在着目する空白文字の幅は所定の幅以下か否か判定し(ステップS300)、所定の幅以下でなく該空白文字が真の空白文字である場合(NOの場合)、ステップS302に進み、所定の幅以下であり該空白文字が余剰空白文字である場合(YESの場合)、ステップS301に進む。所定の幅とは、例えば、ステップS203で求めた基準値をXとした場合、例えば、X/1.2である。
【0052】
例えば、現在着目する空白文字が図6の文字番号「3」の空白文字の場合、該空白文字の幅は、文字番号「4」の文字の左X座標(=161)から文字番号「2」の文字の右X座標(=142)を減じた値「19」であり、ステップS203で求めた基準値(=16.5)に基づく所定の幅(=13.75)以下ではないので、ステップS302に進む。
例えば、現在着目する空白文字が図6の文字番号「14」の空白文字の場合、該空白文字の幅は、文字番号「15」の文字の左X座標(=321)から文字番号「13」の文字の右X座標(=312)を減じた値「9」であり、上記所定の幅(=13.75)以下であるので、ステップS301に進む。
【0053】
ステップS301では、余剰空白文字と判定された空白文字を削除し、ステップS302に進む。例えば、図6の文字番号「14」である空白文字は削除されることになる。
ステップS402では、現在着目する空白文字の次の空白文字が存在するかを判定し、次の空白文字が存在する場合(YESの場合)は、着目空白文字ポインタを1つ進め(ステップS303)、ステップS304に戻り、存在しない場合(NOの場合)は処理を終了する。
【符号の説明】
【0054】
10…文字認識装置、11…制御部、12…ネットワークI/F部、13…記憶部、13a…文字認識補正プログラム、13b…原文書画像データ、13c…レイアウト解析データ、13d…認識文字列データ、13e…認識文字付属情報データ、13f…空白文字削除後文字列データ、13g…文字認識補正後文字列データ、13h…空白削除プログラム、14…画像取得部、15…レイアウト解析部、16…文字認識部、17…外接矩形形成部、18…外接矩形中央線導出部、19…等倍フォント判定部、20…余剰空白文字判定部、21…余剰空白文字削除部、22…文字認識補正部。

【特許請求の範囲】
【請求項1】
画像として読み取られた文書原稿から文字を認識し、空白文字を区切りとして単語単位に文字認識結果の文字列を補正する文字認識装置において、
認識されたアルファベット文字列それぞれに外接矩形を形成する外接矩形形成部と、
隣接する前記外接矩形の幅方向中央線間の距離に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定する等倍フォント判定部と、
等倍フォントと判定された場合に、前記文字列中の空白文字の文字幅が所定の幅よりも狭いことに基づいて当該空白文字が余剰空白文字であることを判定する余剰空白文字判定部と、
前記余剰空白文字と判定された空白文字を前記文字列から削除する余剰空白文字削除部とを備えることを特徴とする文字認識装置。
【請求項2】
前記等倍フォント判定部は、1番目と2番目の前記外接矩形の幅方向中央線間の距離を基準値とし、他の隣接する前記外接矩形の幅方向中央線間の距離が前記基準値に基づいて定められる所定の範囲内である場合には、前記文字列のフォントが等倍フォントであると判定することを特徴とする請求項1に記載の文字認識装置。
【請求項3】
前記等倍フォント判定部は、前記隣接する外接矩形の幅方向中央線間の距離のヒストグラムをとり、該ヒストグラムに中央化傾向がある場合には、前記文字列のフォントが等倍フォントであると判定することを特徴とする請求項1に記載の文字認識装置。
【請求項4】
前記等倍フォント判定部は、前記文字列の一部に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定することを特徴する請求項1〜3のいずれか1項に記載の文字認識装置。
【請求項5】
前記等倍フォント判定部は、前記文字列のうち文字サイズが等しいと判定される部分に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定することを特徴とする請求項4に記載の文字認識装置。
【請求項6】
前記所定の幅は、前記外接矩形の幅方向中央線間の距離に基づいて決定されることを特徴とする請求項1〜5のいずれか1項に記載の文字認識装置。
【請求項7】
前記所定の幅は、前記文字列の空白文字の幅のヒストグラムに基づいて決定されることを特徴とする請求項1〜5のいずれか1項に記載の文字認識装置。
【請求項8】
画像として読み取られた文書原稿から文字を認識し、空白文字を区切りとして単語単位に文字認識結果の文字列を補正する文字認識方法において、
認識されたアルファベット文字列それぞれに外接矩形を形成し、
隣接する前記外接矩形の幅方向中央線間の距離に基づいて、前記文字列のフォントが等倍フォントであるか否かを判定し、
等倍フォントと判定された場合に、前記文字列中の空白文字の文字幅が所定の幅よりも狭いことに基づいて当該空白文字が余剰空白文字であることを判定し、
前記余剰空白文字と判定された余剰空白文字を前記文字列から削除することを特徴とする文字認識方法。
【請求項9】
コンピュータを、請求項1乃至7のいずれか1項に記載の文字認識装置として機能させることを特徴とするコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2013−33416(P2013−33416A)
【公開日】平成25年2月14日(2013.2.14)
【国際特許分類】
【出願番号】特願2011−169895(P2011−169895)
【出願日】平成23年8月3日(2011.8.3)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】