文字列認識装置、文字列認識プログラムおよび文字列認識方法
【課題】文字列を含む画像の文字認識を行う際に、文字部分を示す文字ブロックの誤認識を抑制する。
【解決手段】文字ブロック位置取得部1aは、項目名文字列と項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、項目名文字列を示す項目名文字ブロックと、内容文字列の一部または全部を示す内容文字ブロックとを抽出し、項目名文字ブロックと内容文字ブロックとの位置を示す位置情報を取得する。対応関係設定部1bは、文字ブロック位置取得部1aにより取得した位置情報に基づいて内容文字ブロックの位置から所定の方向に存在する項目名文字ブロックを抽出し、内容文字ブロックと抽出した項目名文字ブロックの項目名とを関連付け、文字ブロック統合部1eにより設定された関連付けの結果を対応関係記憶部1dに記憶させる。
【解決手段】文字ブロック位置取得部1aは、項目名文字列と項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、項目名文字列を示す項目名文字ブロックと、内容文字列の一部または全部を示す内容文字ブロックとを抽出し、項目名文字ブロックと内容文字ブロックとの位置を示す位置情報を取得する。対応関係設定部1bは、文字ブロック位置取得部1aにより取得した位置情報に基づいて内容文字ブロックの位置から所定の方向に存在する項目名文字ブロックを抽出し、内容文字ブロックと抽出した項目名文字ブロックの項目名とを関連付け、文字ブロック統合部1eにより設定された関連付けの結果を対応関係記憶部1dに記憶させる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は文字を含む画像の文字認識を行う文字列認識装置、文字列認識プログラムおよび文字列認識方法に関する。
【背景技術】
【0002】
IT(Information Technology)インフラが整った現在では、企業間での商取引に電子データ交換が頻繁に行われている。しかしながら、企業と個人との間の取引(B to C:Business to Consumer)では、依然、紙の帳票が頻繁に使用される。例えば、金融機関に公共料金を支払うときは、振込み用紙を金融機関に持っていき料金を支払う場合がある。また、宅配便を送るときは、紙の伝票に配送先住所を書き、役所等の申請窓口では、紙の書類に必要事項を記入し、提出することが行われている。さらに、企業間取引(B to B:Business to Business)においても、お互いデータ互換性がない場合や、通信プロトコルが異なる場合は、データ交換に紙の帳票を用いたり、取引データをPDF(Portable Document Format)等の電子帳票画像に変換し、送受信したりすることが行われている。
【0003】
これらの紙の帳票や電子帳票画像等について、画像中の文字成分を識別し、文字コードとして出力する光学式文字読取装置(OCR:Optical Character Reader)がある。OCRの機能は、コンピュータ上のソフトウェアで実現することも行われている。OCRでは、印刷文字、手書き文字等による文書が光学的に読み取られる。そして、OCRは、文書画像から文字成分を抽出して文字認識を行う。
【0004】
これらのような紙の帳票や電子帳票画像では、帳票内に記述されているデータの意味的な構造(論理構造)が失われているため、OCR等で電子化して計算機で処理する際の障害となる場合がある。例えば、帳票に発注品名と、個数、単価、合計金額が書かれていた場合、どの数字がどの品名に対する個数なのか、どの数字が合計金額を意味するのか、電子帳票の画像を解析して特定する必要がある。
【0005】
これに関して、帳票に含まれている項目名を示す項目名辞書を用いて、画像を解析して認識した文字列と照合することにより、「項目名文字列」と「データ文字列」とを判定する技術が知られている。
【0006】
また、画像から1または複数の文字を有する文字ブロックを抽出して、抽出した各ブロックについて文字認識が行われる場合がある。このような場合、辺や旁などを含め、文字の中に複数の独立をした部分がある漢字の文字認識では、例えば、その文字を1つの文字としてではなく、辺や旁などを各々別個の文字であると誤って認識(例えば“社”を“ネ”と“土”等)し、誤った認識に基づいて文字認識を行うブロックを判断することがあり、文字認識がうまくできないことがある。
【0007】
これに関して、画像の文字列を一旦、各連結成分に分解してから周辺の連結成分と組み合わせて統合矩形を生成し、生成した各統合矩形に対して文字認識を試みることによって文字認識結果(文字データ)を得る技術が知られている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2008−204226号公報
【特許文献2】特開2008−191833号公報
【非特許文献】
【0009】
【非特許文献1】“Finding All Cliques of an Undirected Graph", Coen Bron and Joep Kerbosch,Communications of the ACM, September 1973, Volume 16, Number 9, p575-577
【発明の概要】
【発明が解決しようとする課題】
【0010】
ここで、文字認識の対象の文字ブロックが有するある項目名(例えば「住所」等)に対する内容(項目値)として記載されている一連の文字列に区切れがある場合、それらの文字列をある項目名の値となる一連の文字列と認識できず、別個の文字列として誤認識される可能性があるという問題点がある。例えば「川崎市 中原区 上小田中」について、本来一体である「川崎市」と「中原区」と「上小田中」とを3個のデータとして誤認識してしまうことが考えられる。さらにこの場合、「川崎市」のみを「住所」に対応するデータとして誤認識すると共に、「中原区」および「上小田中」を他の項目に対応するデータと誤認識したり、対応する項目名が不明という判断をしてしまったりすることが考えられる。
【0011】
このように、従来の文字認識では、帳票等の複数の文字列が特定の意味を持って配置されている画像の文字認識を行った場合、これらの文字領域検出に、文字認識の対象の文字列が過剰に分割されて認識されたり、文字列中の認識文字の欠損などのエラーが発生したりすると、帳票の項目名と項目値(内容として記載されている文字列)との関連付けに失敗したり、文字列の抽出の際に誤認識が生じたりする場合があるという問題点があった。
【0012】
本発明はこのような点に鑑みてなされたものであり、文字列を含む画像の文字認識を行う際に、誤認識を抑制する文字列認識装置、文字列認識プログラムおよび文字列認識方法を提供することを目的とする。
【課題を解決するための手段】
【0013】
上記課題を解決するために、以下の機能を有する文字列認識装置が提供される。コンピュータは、画像の文字列認識をするために、画像記憶部、文字ブロック位置取得部、対応関係設定部を有する。画像記憶部は、項目名を示す文字を有する項目名文字列と項目名に対応する内容を示す文字を有する内容文字列とを有する画像を記憶する。文字ブロック位置取得部は、画像記憶部に記憶されている画像から、項目名文字列を示す項目名文字ブロックと、内容文字列の一部または全部を示す内容文字ブロックとを抽出し、項目名文字ブロックと内容文字ブロックとの位置を示す位置情報を取得する。次に、文字ブロック位置取得部は、項目名文字ブロックと内容文字ブロックとの位置を示す位置情報を取得する。対応関係設定部は、文字ブロック位置取得部により取得した位置情報に基づいて内容文字ブロックの位置から所定の方向に存在する項目名文字ブロックを抽出し、内容文字ブロックと抽出した項目名文字ブロックの項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる。
【発明の効果】
【0014】
文字列を含む画像の文字認識を行う際に、項目名と項目値との関連付けの誤りを抑制することにより、文字列の誤認識の発生を抑制することが可能となる。
【図面の簡単な説明】
【0015】
【図1】第1の実施の形態の機能を示すブロック図である。
【図2】第2の実施の形態の文字列認識装置のハードウェア構成例を示す図である。
【図3】第2の実施の形態の機能を示すブロック図である。
【図4】第2の実施の形態の文字列認識処理の手順を示すフローチャートである。
【図5】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図6】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図7】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図8】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図9】第2の実施の形態により第1の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。
【図10】第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
【図11】第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
【図12】第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
【図13】第2の実施の形態により第2の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。
【図14】第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【図15】第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【図16】第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【図17】第2の実施の形態により第3の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。
【図18】第2の実施の形態における第3の例の帳票画像における関連付けの様子を示す図である。
【図19】第2の実施の形態における第3の例の帳票画像における関連付けの様子を示す図である。
【図20】第2の実施の形態における第4の例の帳票画像における関連付けの様子を示す図である。
【図21】第2の実施の形態の項目名情報テーブルの例を示す図である。
【図22】第2の実施の形態のルールテーブルの例を示す図である。
【図23】第2の実施の形態のルールテーブルの例を示す図である。
【図24】第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。
【図25】第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。
【図26】第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。
【図27】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図28】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図29】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図30】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図31】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図32】第2の実施の形態の文字列候補テーブルの例を示す図である。
【図33】第2の実施の形態の文字列候補テーブルの例を示す図である。
【図34】第2の実施の形態の文字列候補テーブルにおける文字列候補の対応関係を表した文字列対応関係グラフを示す図である。
【図35】第3の実施の形態の機能を示すブロック図である。
【図36】第3の実施の形態の文字列認識処理の手順を示すフローチャートである。
【図37】第3の実施の形態の文字列認識処理の手順を示すフローチャートである。
【図38】第3の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図39】第3の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図40】第3の実施の形態の項目名情報テーブルの例を示す図である。
【図41】第3の実施の形態のルールテーブルの例を示す図である。
【図42】第3の実施の形態のルールテーブルの例を示す図である。
【発明を実施するための形態】
【0016】
以下、本実施の形態について図面を参照して説明する。
〔第1の実施の形態〕
図1は、第1の実施の形態の機能を示すブロック図である。文字列認識装置1は、帳票画像等の文字列を有する画像について文字認識を行い、項目名と内容(例えば、項目値)とを取得することにより、画像に含まれる文字列を認識する文字列認識を行う。文字列認識装置1は、文字ブロック位置取得部1a、対応関係設定部1b、画像記憶部1c、対応関係記憶部1d、文字ブロック統合部1eを有する。
【0017】
文字ブロック位置取得部1aは、画像記憶部1cに記憶されている画像から、項目名文字列を示す項目名文字ブロックと、内容文字列の一部または全部を示す内容ブロックとを抽出する。ここで、文字列認識装置1で文字列認識を行う画像は、例えば、項目名を示す文字を有する項目名文字列、項目名に対応する内容を示す内容文字列を有する帳票画像等の画像である。この画像は、例えば、帳票等の文書をスキャナ等で読み取るか、直接電子ファイルで作成された帳票等の文書を画像に変換することにより作成される。
【0018】
次に、文字ブロック位置取得部1aは、判定した項目名文字ブロックとそれ以外の文字ブロック(内容文字ブロックを含む)との位置を示す位置情報を取得する。この位置情報により、項目名文字ブロックの位置および項目名文字列以外の文字ブロックの位置が特定される。この位置情報は、項目名文字ブロックの位置およびそれ以外の文字ブロックの位置を、例えば、画像上の2次元座標で示してもよい。
【0019】
対応関係設定部1bは、文字ブロック位置取得部1aにより取得した位置情報に基づいて、内容文字ブロックの位置から所定の方向に存在する項目名文字ブロックを抽出し、内容文字ブロックと抽出した項目名文字ブロックの項目名とを関連付ける。同一の項目名に関連付けられた内容文字ブロック同士は、後述する文字ブロック統合部1eにより統合される。また、対応関係設定部1bは、関連付けた結果に基づいて文字ブロック統合部1eにより得られた項目名および内容文字列ならびにこれらの対応関係を対応関係記憶部1dに記憶させる。
【0020】
画像記憶部1cは、項目名を示す文字を有する項目名文字列と、項目名に対応する文字内容を示す内容文字列とを有する画像を示す画像情報を記憶する。画像記憶部1cに記憶されている画像は、項目名および内容を有する帳票等の文書の画像である。この画像は、スキャナ等の光学式読み取り装置で取得してもよく、コンピュータ等で直接電子ファイルで作成された帳票等の文書を画像に変換することにより取得してもよい。
【0021】
対応関係記憶部1dは、項目名と内容文字ブロックとを関連付けた結果を示す対応関係情報を記憶する。この対応関係情報により、画像に含まれている項目名、内容および項目名と内容との対応関係が示される。
【0022】
文字ブロック統合部1eは、同一の項目名に関連付けられた内容文字ブロック同士を統合し、項目名に対応する内容文字列に設定する。すなわち、文字ブロック統合部1eは、対応関係設定部1bによって関連付けられた内容文字ブロックを統合して項目名に関連付けて内容文字列とする。
【0023】
なお、本実施の形態の文字列認識装置1で取得する文書に示された内容は、数値を含む任意の文字数の文字列であり、光学認識等により文字認識が可能であれば、文字と同等または所定の意味を有する任意の個数の記号の列であってもよい。
【0024】
このような文字列認識装置1によれば、画像の文字認識を行う際に、文字認識で取得した内容の文字について、項目名との位置関係に基づいて対応関係を設定する。これにより、帳票画像が有する文字列と各内容の文字列との対応関係を設定する際に、対応関係の設定の誤りの発生を抑制する。その結果、内容の文字列認識における誤認識の発生を抑制することが可能となる。
【0025】
〔第2の実施の形態〕
次に、第2の形態の詳細を説明する。第2の実施の形態は、項目名および項目値を有する帳票を取り込んだ帳票画像等の文書を示す画像について、項目名文字列を抽出し、文字認識の結果得られた文字列を項目名文字列に関連付け、帳票等の文書において項目名に対応する内容を示す項目値文字列とすることにより、項目値文字列の誤認識および項目値文字列と項目名文字列との関連付けの誤認識を抑制したものである。
【0026】
図2は、第2の実施の形態の文字列認識装置のハードウェア構成例を示す図である。文字列認識装置100は、CPU101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。
【0027】
RAM102は、文字列認識装置100の主記憶装置として使用される。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。
【0028】
バス107に接続されている周辺機器としては、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105および通信インタフェース106がある。
【0029】
HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、文字列認識装置100の二次記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、二次記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。
【0030】
グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ11の画面に表示させる。モニタ11としては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。
【0031】
入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号をCPU101に送信する。なお、マウス13は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
【0032】
通信インタフェース106は、ネットワーク10に接続されている。通信インタフェース106は、ネットワーク10を介して、他のコンピュータとの間でデータの送受信を行うことができる。
【0033】
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。
図3は、第2の実施の形態の機能を示すブロック図である。本実施の形態の文字列認識装置100は、手書き文字、活字、プリンタ等による印字等、文字認識可能である任意の字体の文字に適用可能であるものとする。文字列認識装置100は、画像取得部111、項目名文字列抽出部112、関連付け部113、関連付け検証部114、文字領域統合部115、非項目名文字列文字認識部116、画像記憶部120、項目名情報記憶部151、文字列候補記憶部152、対応関係記憶部153、ルール記憶部154を有する。
【0034】
画像取得部111は、スキャナや他のコンピュータから通信回線を介して帳票等の文書の画像情報を取得し、取得した画像情報を画像記憶部120に記憶させる。
項目名文字列抽出部112は、項目名情報を項目名情報記憶部151から読み出し、画像記憶部120に記憶されている画像から、項目名文字列情報に基づいて画像中に存在する項目名文字列を抽出する。そして、また、項目名文字列抽出部112は、項目名文字列を示す項目名文字列領域(項目名文字ブロック)を抽出する。ここで、文字列認識装置100で文字列認識を行う画像は、例えば、項目名を示す項目名文字列、項目名に対応する項目値を示す項目値文字列を有する帳票画像等の画像である。この画像は、例えば、帳票等の文書をスキャナ等で読み取るか、直接電子ファイルで作成された帳票等の文書を画像に変換することにより作成される。また、画像中の項目名文字列領域以外の領域を非項目名文字列領域とする。また、項目値は、帳票等の文書において項目名に対応する内容である。また、項目値文字列は、項目名に対応する内容を示す文字を有する文字列であり、第1の実施の形態の内容文字列と対応する。
【0035】
また、項目名文字列抽出部112は、項目名文字列領域の位置および認識結果文字列(項目値文字ブロック)の位置を示す位置情報を取得する。この位置情報により、項目名文字列領域の位置および認識結果文字列の位置が特定される。この位置情報は、項目名文字列領域の位置および認識結果文字列の位置を、例えば、画像上の2次元座標で示してもよい。また、項目値文字ブロックは、項目値文字列の一部または全部を示し、第1の実施の形態の内容文字ブロックと対応する。
【0036】
項目名文字列抽出部112は、取得した画像中のそれぞれの連結要素と外接する矩形(以下、「外接矩形」という)を作成し、重なる外接矩形同士を統合することにより、項目名文字列領域を作成する。ここで、連結要素は、特定の画素が連結している領域である。また、特定の画素は、例えば、予め設定された画素値以上の画素等の基準で抽出される画素であり、認識対象の文字列の一部を示す画素である。
【0037】
関連付け部113は、ルール記憶部154に記憶されているルールに従って、非項目名文字列文字認識部116で取得された各認識結果文字列に対し、項目名文字列抽出部112により取得した位置情報に基づいて各認識結果文字列の位置から左方向または上方向に項目名文字列抽出部112で取得された項目名文字列を探索し、探索の結果により抽出された項目名と認識結果文字列とを関連付ける。なお、これに限らず、関連付け部113は、ルール記憶部154に記憶されているルールに従って、項目名文字列抽出部112により取得された位置情報に基づいて項目名文字列領域の位置から右方向または下方向に非項目名文字列文字認識部116で取得された各認識結果文字列を探索し、項目名文字列領域の項目名文字列が示す項目名と探索の結果得られた認識結果文字列とを関連付けてもよい。
【0038】
関連付け検証部114は、ルール記憶部154から項目名文字列と項目値文字列との関連付けにおいて満たすべきルールを読み出し、関連付け部113で生成された項目名と項目値との関連付けのうち、ルールに違反する関連付けを削除する。
【0039】
文字領域統合部115は、同一の項目名に関連付けられた認識結果文字列同士を統合し、項目名に対応する項目値文字列に設定する。すなわち、文字領域統合部115は、関連付け部113によって関連付け、関連付け検証部114によって関連付けを削除せずに維持した認識結果文字列を統合して項目名に関連付ける項目値文字列とする。これにより、認識結果文字列(非項目名文字列の認識結果)が統合され、項目名に対応する項目値文字列となる。次に、文字領域統合部115は、項目名と項目値文字列との関連付けの結果を対応関係記憶部153に記憶させる。
【0040】
これにより、項目値文字列が文字列として分割されている場合にも、分割されている文字列を統合して、項目値文字列を正しく再構成することができる。例えば、帳票に示された「金額 1,100円」について、項目名文字列が“金額”と認識され、項目値文字列が“1,”と“100円”とに分割されて認識された場合、本実施の形態では、分割された項目値文字列“1,”と“100円”を再構成して“1,100円”とすることができる。
【0041】
非項目名文字列文字認識部116は、非項目名文字列領域に対して文字認識を行うことにより、項目値文字列の一部または全部を示す認識結果文字列を抽出する。このとき、非項目名文字列文字認識部116は、認識結果文字列について1文字単位で文字認識を行って認識結果文字列を1文字の文字列として取得する。なお、非項目名文字列文字認識部116は、これに限らず、認識結果文字列について、任意の方法で区分した文字列単位で文字認識を行って認識結果文字列を取得してもよい。
【0042】
画像記憶部120は、項目名を示す文字を有する項目名文字列と項目名に対応する内容を示す文字を有する項目値文字列とを有する画像を記憶する。画像記憶部120に記憶されている画像は、項目名および項目値を有する帳票等の文書の画像である。この画像は、スキャナ等の光学式読み取り装置で取得してもよく、コンピュータ等により直接電子ファイルで作成された帳票等の文書を画像に変換することにより取得してもよい。
【0043】
項目名情報記憶部151は、例えば、『氏名』、『住所』等の項目名の項目値文字列を示す情報、項目名が複数の項目値と対応する連記表であるか否かを示す情報を有する項目名文字列情報を有する項目名情報を記憶する。
【0044】
文字列候補記憶部152では、詳しくは図32および図33において後述するが、項目名文字列抽出処理において認識結果文字の文字列候補を示す情報を記憶する。
対応関係記憶部153は、文字領域統合部115の関連付けにより項目名と認識結果文字列とを関連付けた結果を示す対応関係情報を記憶する。この対応関係情報により、画像に含まれている項目名および項目値ならびに項目名と項目値との対応関係が示される。
【0045】
ルール記憶部154は、項目名と認識結果文字列との関連付けのルールを記憶する。ルール記憶部154に記憶されているルールは、例えば、1つの認識結果文字列に対応関係を有する項目名が複数存在する場合の関連付けのルール、1つの項目名に対応関係を有する認識結果文字列が複数存在する場合の関連付けのルールを含む。また、1つの項目名に1つの認識結果文字列が対応関係を有する場合において、1つの項目名に関連付け可能な認識結果文字列が複数存在するときに、認識結果文字列を複数の項目名のうちの1つの正しい項目名と関連付けて他の対応関係を削除する関連付けのルールを含む。
【0046】
また、図1に示した第1の実施の形態の機能のうち、文字ブロック位置取得部1aの機能は、項目名文字列抽出部112、非項目名文字列文字認識部116で実現されている。また、対応関係設定部1b、文字ブロック統合部1eの機能は、関連付け部113、関連付け検証部114、文字領域統合部115で実現されている。
【0047】
なお、本実施の形態の文字列認識装置100で取得する文書に示された項目値は、数値を含む任意の文字数の文字列であり、光学認識等により文字認識が可能であれば、文字と同等または所定の意味を有する任意の個数の記号の列であってもよい。
【0048】
次に、文字列認識装置100によって実行される文字列認識処理の手順を説明する。
図4は、第2の実施の形態の文字列認識処理の手順を示すフローチャートである。文字列認識処理は、帳票の画像読み取りやユーザの文字列認識処理を実行する操作に基づいて、文字列認識装置100により実行が開始される。以下、図4に示す処理をステップ番号に沿って説明する。
【0049】
〔ステップS11〕項目名文字列抽出部112は、項目名情報記憶部151に記憶されている項目名情報を取得する。
〔ステップS12〕項目名文字列抽出部112は、帳票画像等から項目名文字列を抽出する項目名文字列抽出処理(図24から図26において後述)を実行する。
【0050】
〔ステップS13〕非項目名文字列文字認識部116は、ステップS12で取得した項目名文字列領域以外の非項目名文字列領域について文字認識を行い、認識結果文字列を取得する。
【0051】
〔ステップS14〕関連付け部113は、所定の位置関係に該当するステップS12で抽出した項目名文字列とステップS13で取得した認識結果文字列とを、ルール記憶部154に記憶されているルールに基づいて関連付ける。
【0052】
〔ステップS15〕関連付け検証部114は、ステップS14における関連付けについて検証し、検証の結果正しくない関連付けを削除する。
〔ステップS16〕文字領域統合部115は、ステップS14およびステップS15による関連付けによって、同一の項目名文字列に関連付けた認識結果文字列を統合して項目値文字列とする。次に、統合した項目値文字列を、項目名文字列が示す項目名に対応する項目値として設定する。
【0053】
〔ステップS17〕文字領域統合部115は、ステップS16で設定した帳票画像の項目名と項目値との対応関係を、対応関係記憶部153に記憶させる。
図5から図8は、第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【0054】
図5(A)は、帳票画像の第1の例であり、項目値と項目名とが1対1に対応する帳票画像210を示す。本実施の形態の文字列認識装置100は、文字列認識処理のステップS11およびステップS12により項目名情報記憶部151に記憶されている項目名情報に基づいて帳票画像210から項目名文字列を抽出する。項目名情報は、項目名の候補を示す文字列を含む。項目名の候補を示す文字列として、例えば『名前』、『氏名』、『住所』、『お住まい』、『ふりがな』、『職業』、『年齢』等がある。
【0055】
本実施の形態では、帳票画像210について文字認識を行い、認識の結果得られた文字列と項目名情報が示す項目名の候補を示す文字列とを比較して項目名文字列を抽出する。帳票画像210から項目名文字列を抽出する方法の詳細は、図24から図34において後述する。
【0056】
図5(B)は、帳票画像210に対する項目名文字列の抽出の結果得られる項目名文字列211a,211b,211c,211dを示す。図5(B)に示す例では、帳票画像210から、『住所』、『氏名』、『職業』、『年齢』の4つの項目名文字列211a,211b,211c,211dが抽出されている。
【0057】
図6に示すように、この項目名文字列の抽出に基づいて、帳票画像210を、項目名文字列領域212a,212b,212c,212dと、項目名文字列領域212a〜212d以外の領域である非項目名文字列領域212eとに分割することが可能になる。
【0058】
本実施の形態の文字列認識装置100は、ステップS13により帳票画像210の非項目名文字列領域212eについて文字認識を行い、認識結果文字列を取得して文字列認識を行う。本実施の形態では、非項目名文字列領域212eについて、1文字単位で文字認識を行う。ここで、ステップS13における文字認識は、従来の文字認識を用いてもよく、他の文字認識方法を用いてもよい。
【0059】
ここで、図7(A)および図7(B)に従って、ステップS14およびステップS15の処理を説明する。図7(A)および図7(B)は、帳票画像210の項目名文字列領域212a,212bおよび認識結果文字列213a,213b,213c,213d,213e,213f,213g,213h,213i,213j,213k,213l,213m,213o,213p,213q,213r,213s,213tを示す。本実施の形態の文字列認識装置100は、この項目名文字列領域212a,212bおよび認識結果文字列213a〜213tに基づき、ステップS13で取得した認識結果文字列について、ステップS14により、項目名文字列との関連付けを行う。このステップS14の関連付けでは、項目名文字列が位置する項目名文字列領域と認識結果文字列の位置とが、ルール記憶部154に記憶されているルール(図22および図23において後述)が示す所定の位置関係にある場合、項目名文字列が示す項目名と認識結果文字列とが関連付けられる。図7(A)の例では、項目名文字列領域212aと認識結果文字列213a〜213p、項目名文字列領域212aと認識結果文字列213q〜213t、項目名文字列領域212bと認識結果文字列213q〜213tの3組が、ルール記憶部154に記憶されているルールが示す所定の位置関係(例えば、認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在)を満たすものとして関連付けられる。
【0060】
通常、横書きの帳票では、項目名の右、下または右下に項目値が存在するので、文字列認識装置100は、上記認識結果文字列の左、上、または左上に存在する項目名文字列領域を探索する。なお、探索する方向に関しては、これに限らず、帳票毎や項目名毎に定義してもよい。
【0061】
図7(A)の例では、認識結果文字列213q(『東』)に関しては、左、上、左上に存在する項目名文字列領域を探索すると、項目名文字列領域212a,212bの2つが発見される。これにより、認識結果文字列213qは、項目名文字列領域212a,212bに関連付けられることになる。認識結果文字列213r〜213tについても同様に、項目名文字列領域212a,212bに関連付けられる。
【0062】
次に、文字列認識装置100は、ステップS15により項目名文字列と認識結果文字列との関連付けの検証および削除を行う。このステップS15の関連付けの検証および削除では、関連付けられた項目名文字列と認識結果文字列とが、ルール記憶部154に記憶されているルールに違反するか等に基づいて、関連付けが正しいか否かについて検証される。そして、検証の結果に基づき、ステップS14で関連付けられた、関連付けが正しくない項目名と認識結果文字列との関連付けが削除される。図7(A)に示すように、認識結果文字列213qは、ステップS14により項目名文字列領域212aおよび項目名文字列領域212bと関連付けられている。これに対し、ステップS15では、図7(B)に示すように、ルール記憶部154に記憶されているルール(例えば、認識結果文字列の中心の左方に項目名文字列領域が存在する場合、認識結果文字列の中心の左上方の項目名文字列への関連付けは削除)に基づいて、認識結果文字列213qと項目名文字列領域212aとの関連付けが削除される。認識結果文字列213r〜213tについても同様に、項目名文字列領域212aとの関連付けが削除される。このようにして、正しくない関連付けが削除され、正しい関連付けのみが維持される。
【0063】
ここで、ルール記憶部154に記憶されているルールとして、例えば、次の例が挙げられる。
例1:認識結果文字列の左方向、若しくは、上方向に項目名文字列領域が存在した場合、左上方向にある項目名文字列領域は無視する。
【0064】
例2:認識結果文字列が複数の項目名文字列と関連付けられた場合は、最も近いもの1つに絞る。
例3:認識結果文字列と項目名文字列領域との距離は、所定の値以下でなければならない。
【0065】
例4:認識結果文字列と項目名文字列との関連付けはセル罫線を跨いではいけない。
これらのルールは、帳票や、項目名によって任意に設定される。このルールを増やし、柔軟に組み合わせることで、様々な形式の帳票に対応することが可能になる。
【0066】
上記の例では、ステップS14の関連付けにより認識結果文字列213q〜213t(『東』、『京』、『太』、『郎』)を構成する各文字は2つの項目名文字列領域212a,212bに関連付けられている。これに、ステップS15の関連付けの検証により、上記の例1のルールが適用されると、項目名文字列領域212aへの関連付けは削除され、項目名文字列領域212bへの関連付けのみが維持される。
【0067】
次に、文字列認識装置100は、ステップS16により同一の項目名文字列に関連付けられた認識結果文字列を統合して項目値文字列とし、項目名と項目値との対応関係を設定する。具体的には、帳票画像210の項目名文字列211aに関連付けられた図7(A)に示す認識結果文字列213a〜213pが有する各文字を統合して、図8(A)に示すように項目値文字列215aとする。また、項目名文字列211aで示される項目名と項目値文字列215aで示される項目値とに対応関係を設定する。同様に、項目名文字列211bに関連付けられた図7(A)に示す認識結果文字列213q〜213tが有する各文字を統合して項目値文字列215bとする。また、項目名文字列211bで示される項目名と項目値文字列215bで示される項目値とに対応関係を設定する。
【0068】
以上のように、本実施の形態では、項目値文字列について1文字単位で文字認識を行い、1文字単位で項目名文字列と関連付ける。しかし、非項目名文字列領域に対する文字認識の結果、認識結果文字列が項目値文字列の通りに認識される場合もあれば、認識ミスにより認識結果文字列が本来の項目値文字列に比較して過剰に分割されている場合も生じ得る。本実施の形態では、認識結果文字列が項目値文字列よりも分割されて認識された場合にも正しい項目値文字列を得ることができる。具体的には、図8(B)に示すように、ステップS13において認識結果文字列216a,216b,216c,216d,216e,216f,216q,216r,216s,216tの1個または複数の文字を有する文字列が混在して得られたものとする。この場合、これらの認識結果文字列216a,216b,216c,216d,216e,216f,216q,216r,216s,216tについても、ステップS14からステップS17において1文字単位の文字認識の場合と同様に処理されることとなる。
【0069】
例えば、ステップS14により、図8(B)に示した項目値文字列216a(『神』)は、項目名文字列領域212aに関連付けられる。また、項目値文字列216b(『奈川』)は、項目名文字列領域212aに関連付けられる。以下同様に、項目値文字列216c〜216fは、項目名文字列領域212aに関連付けられる。また、項目値文字列216q〜216tは、項目名文字列領域212bに関連付けられる。
【0070】
図8(B)の例に従って、ステップS15において不要な関連付けが削除された後の関連付けの結果を以下に示す。
項目名文字列領域212aへの関連付け:認識結果文字列216a(『神』)、認識結果文字列216b(『奈川』)、認識結果文字列216c(『県』)、認識結果文字列216d(『川崎市』)、認識結果文字列216e(『小山』)、認識結果文字列216f(『1−23−4』)
項目名文字列領域212bへの関連付け:認識結果文字列216q(『東』)、認識結果文字列216r(『京』)、認識結果文字列216s(『太』)、認識結果文字列216t(『郎』)
次にステップS16により、同一の項目名文字列に関連付けられた認識結果文字列が統合され、項目値文字列とされる。
【0071】
本実施の形態によれば、項目名文字列の位置関係に基づいて、先に項目名文字列を認識し、次に非項目名文字列領域に対して文字認識を行う。次に、項目名文字列の位置関係に基づいて認識結果文字列を統合する事により、項目値文字列を取得している。これにより、文字認識のミスによって認識結果文字列が過剰に分割された場合でも、統合することにより正しい項目値文字列を得ることができる。
【0072】
また、以上により、本実施の形態は、例えば、帳票に罫線の存在しない場合における項目値の文字列領域の検出においても有効である。すなわち、罫線がない帳票の文字列認識を行う場合、レイアウト解析により、先に帳票上のすべての文字列領域を検出する場合がある。この場合、上記項目値文字列は、図8(B)の認識結果文字列216a〜216f(『神』、『奈川』、『県』、『川崎市』、『小山』、『1−23−4』)のように分離される可能性が存在する。仮に、このような項目値文字列が分離して認識された結果が得られた場合、項目名と項目値との対応付けに失敗することになる。
【0073】
これに対して、本実施の形態によれば、文字列認識に罫線を必要としないので、罫線がなく、上記のように項目値文字列が分離して認識される可能性がある場合にも上記項目値文字列について一体として認識することができる。
【0074】
図9は、第2の実施の形態により第1の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。図9に示す対応関係テーブル153aは、本実施の形態の文字列認識装置100による帳票画像210に対する文字列認識処理の実行の結果得られる項目名と項目値との対応関係を示す情報を記憶するテーブルである。対応関係テーブル153aは、対応関係記憶部153に記憶されている。対応関係テーブル153aには、“項目名”フィールド、“項目値”フィールドが設けられている。図9の例では、各フィールドの横方向に並べられた情報同士について対応関係が設定されている。
【0075】
“項目名”フィールドには、帳票画像210から取得した項目名が設定される。“項目値”フィールドには、帳票画像210から取得した項目値が設定される。図9の対応関係テーブル153aでは、帳票画像210に基づいて、項目名と項目値とが1対1の対応関係を有するように設定される。
【0076】
図10から図12は、第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
図5から図9において前述した帳票画像210は、項目名と項目値が1対1の対応関係を有していたが、本実施の形態は、例えば、2次元表のように1つの項目値に2の項目名が属するような、項目値と項目名とが1対多の対応関係を有する場合についても適用可能である。例えば、図10に示す2次元の無罫線表の帳票画像220を例に挙げて説明する。
【0077】
図10に示す帳票画像220は、帳票画像の第2の例であり、上部に項目名文字列221a,221b,221cを有し、左側に項目名文字列221d,221e,221fを有する。また、項目名文字列221a,221b,221cのうちのいずれか1つと項目名文字列221d,221e,221fのうちのいずれか1つとが交差する領域に、項目値文字列222を有する。
【0078】
本実施の形態の文字列認識装置100は、帳票画像220についても帳票画像210と同様に、文字列認識処理を実行する。このとき、文字列認識装置100は、図11に示すように、ステップS13で認識結果文字列224a,224b,224c,224d,224e,224f,224g,224h,224i,224jを取得する。次に、文字列認識装置100は、ステップS14により、項目名文字列領域223a,223e,223f等の各項目名文字列領域との位置関係に基づいて、項目名と認識結果文字列との関連付けを行う。図11の例では、このステップS14の関連付けにより、ルール記憶部154に記憶されているルールに基づいて、項目名文字列領域223aと認識結果文字列224a〜224h、項目名文字列領域223eと認識結果文字列224a〜224h、項目名文字列領域223aと認識結果文字列224i,224j、項目名文字列領域223eと認識結果文字列224i,224j、項目名文字列領域223fと認識結果文字列224i,224jの5組が関連付けられたものとする。
【0079】
次に、文字列認識装置100は、ステップS15により、ルール記憶部154に記憶されているルールに基づいて、項目名文字列と認識結果文字列との関連付けの検証および削除を行う。図12の例では、図11の例の関連付けの検証結果に基づいて、項目名文字列領域223eと認識結果文字列224i,224jの関連付けが削除されている。また、項目名文字列領域223aと認識結果文字列224a〜224h、項目名文字列領域223aと認識結果文字列224i,224j、項目名文字列領域223eと認識結果文字列224a〜224h、項目名文字列領域223fと認識結果文字列224i,224jの関連付けは維持されている。この後、ステップS16により、同一の項目名文字列に関連付けられた認識結果文字列ごとに統合し、項目名に対応する項目値文字列を取得する。
【0080】
図13は、第2の実施の形態により第2の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。図13に示す対応関係テーブル153bは、図9において前述した対応関係テーブル153aと同様、本実施の形態の文字列認識装置100による帳票画像220に対する文字列認識処理の実行の結果得られる項目名と項目値との対応関係を示す情報を記憶するテーブルである。対応関係テーブル153bは、対応関係記憶部153に記憶されている。対応関係テーブル153bには、“項目名”フィールド、“項目値”フィールドが設けられている。図13の例では、各フィールドの横方向に並べられた情報同士について対応関係が設定されている。
【0081】
対応関係テーブル153bの“項目名”フィールドには、2次元表である帳票画像220から取得した各列の項目名(項目名文字列221a〜221c)と各行の項目名(項目名文字列221d〜221e)のそれぞれを組み合わせた項目名が設定される。
【0082】
対応関係テーブル153bの“項目値”フィールドには、2次元表である帳票画像220から取得した各列の項目名と各行の行列成分であり、項目名のそれぞれを組み合わせた項目名に対応する項目値が設定される。
【0083】
本実施の形態では、以上のようにして対応関係テーブル153bに項目名と項目値との間で1対1の対応関係を設定することができる。
図14から図16は、第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【0084】
また、本実施の形態は、例えば、1つの項目名に複数の項目値が属するような、項目値と項目名とが多対1の対応関係を有する場合についても適用可能である。また、本実施の形態は、罫線を有する表については、罫線を利用して文字列認識を行うこともできる。例えば、図14に示す罫線を有する表の帳票画像230を例に挙げて説明する。
【0085】
図14に、帳票画像の第3の例であり、項目名と項目値とが1対多に対応する帳票画像230を示す。本実施の形態の文字列認識装置100は、上記の例と同様、文字列認識処理のステップS11およびステップS12により項目名情報記憶部151に記憶されている項目名情報に基づいて帳票画像230から項目名文字列を抽出する。
【0086】
図15は、帳票画像230に対する項目名文字列の抽出の結果得られる項目名文字列231a,231b,231c,231d,231e,231f,231gを示す。図15に示す例では、帳票画像230から、『記入年月日』、『申込者』、『銀行名』、『支店名』、『口座種別』、『口座番号』、『振込み金額』の7つの項目名文字列231a,231b,231c,231d,231e,231f,231gが抽出されている。本実施の形態の文字列認識装置100は、この項目名文字列の抽出に基づいて、帳票画像230を、上記の例と同様に、項目名文字列領域と非項目名文字列領域とに分割する。
【0087】
次に、図16に示すように、本実施の形態の文字列認識装置100は、帳票画像230の非項目名文字列領域について文字認識を行って認識結果文字列232a1,232a2,232a3,232a4,232a5,232a6,232a7,232a8,232a9,232a10,232a11,232b1,232b2,232b3,232b4,232c1,232c2,232c3,232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3を取得する。ここで、本実施の形態の文字列認識装置100は、後述するルールに基づき、文字認識の際に、帳票の罫線で囲まれたセルの内部に存在する文字は1つの文字列と認識することができる。具体的には、認識結果文字列232c1(『A銀行』)は、セルの内部に存在するので1つの文字列と認識される。従って、同様にセルの内部に存在する認識結果文字列232c2(『B銀行』)、認識結果文字列232c3(『C銀行』)は、それぞれ1つの文字列と認識される。また、認識結果文字列232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3についても同様に、それぞれが1つの文字列として認識される。
【0088】
次に、文字列認識装置100は、ルール記憶部154に記憶されているルールに従って、項目名文字列231a〜231gと認識結果文字列232a1〜232g3との関連付けを行う。次に、文字列認識装置100は、項目名文字列と認識結果文字列との関連付けの検証および削除を行う。これにより、項目名と項目値との対応関係が設定される。
【0089】
図16の例では、関連付けおよび検証の結果、項目名文字列231aと認識結果文字列232a1〜232a11、項目名文字列231bと認識結果文字列232b1〜232b4、項目名文字列231cと認識結果文字列232c1〜232c3、項目名文字列231dと認識結果文字列232d1〜232d3、項目名文字列231eと認識結果文字列232e1〜232e3、項目名文字列231fと認識結果文字列232f1〜232f3、項目名文字列231gと認識結果文字列232g1〜232g3の7組が関連付けられる。これに従い、関連付けられた項目名文字列と項目値文字列と間で、項目名と項目値との対応関係が設定される。
【0090】
具体的には、認識結果文字列232c1〜232c3は、項目名文字列231c(『銀行名』)に関連付けられる。そして、認識結果文字列232c1〜232c3は、同一の項目名文字列231cに関連付けられているので1つに統合され、項目名文字列231c(『銀行名』)に対応する項目値『A銀行(改行)B銀行(改行)C銀行』となる。また、認識結果文字列232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3についても同様に、それぞれ項目名文字列231d,231e,231f,231gに関連付けられる。そして、認識結果文字列232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3は、それぞれ関連付けられた同一の項目名文字列ごとに統合され、それぞれ項目名文字列231d,231e,231f,231gに対応する項目値となる。
【0091】
図17は、第2の実施の形態により第3の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。図17に示す対応関係テーブル153cは、上記の例と同様、本実施の形態の文字列認識装置100による帳票画像230に対する文字列認識処理の実行の結果得られる項目名と項目値との対応関係を示す情報を記憶するテーブルである。対応関係テーブル153cは、対応関係記憶部153に記憶されている。対応関係テーブル153cには、“項目名”フィールド、“項目値”フィールドが設けられている。図17の例では、各フィールドの横方向に並べられた情報同士について対応関係が設定されている。
【0092】
対応関係テーブル153cの“項目名”フィールドには、帳票画像230から取得した項目名(項目名文字列231a〜231g)が設定される。また、“項目値”フィールドには、帳票画像230から取得した項目値(認識結果文字列232a1〜232g3)が設定される。また、対応関係テーブル153cに示すように、本実施の形態では、帳票画像230が有する1の項目名と複数の項目値との対応関係(例えば、項目名『銀行名』に対して項目値『A銀行』、『B銀行』、『C銀行』等)を設定することができる。
【0093】
次に、項目名と項目値との関連付けについて説明する。
図18および図19は、第2の実施の形態における第3の例の帳票画像における関連付けの様子を示す図である。本実施の形態の文字列認識装置100は、上記のように帳票画像から項目名と項目値とを抽出し、上記の関連付けにより、抽出した項目名と認識結果文字列との対応関係を設定する。この関連付けは、ステップS14においてルール記憶部154に記憶されているルールに従って行われる。
【0094】
ここで、関連付けのルールの一例を示す。
・認識結果文字の上方または左方に項目名文字列領域が存在する場合は、その認識結果文字と項目名を関連付ける。ここで、上方または左方とは、その認識結果文字列の中心座標の上方向または左方向に項目名文字列の外接矩形が存在するかどうかで判定する。
・項目名文字列が表のセルに入っている場合は、そのセル枠を項目名文字列の外接矩形と見なす。
【0095】
上記のルールについて、図18に示す帳票画像230の項目名文字列231b(『申込者』)と認識結果文字232b1(『田』)との関連付けを例として説明する。
図18に示すように、上記ルールに従って認識結果文字列232b1の中心234b1から、左方および上方を探索すると、左方に項目名文字列231bの外接矩形233が存在するので、帳票画像230の項目名文字列231bと認識結果文字列232b1との関連付けが行われる。認識結果文字列232a1〜232a11,232b2〜232b4についても同様に、上記のルールに従って関連付けが行われる。
【0096】
次に、帳票の項目名文字列が表のセルに入っている場合の関連付けの上記のルールについて図19に従って説明する。
図19に示すように、帳票画像230の項目名文字列231c(『銀行名』)は、セル枠236に囲まれているものとする。この場合、上記ルールに従って認識結果文字列232c1(『A銀行』)の中心237c1から、左方および上方を探索すると、左方に項目名文字列231cのセル枠236が存在する。ここで、上記ルールに従い、セル枠236を項目名文字列231の外接矩形と見なす。これに基づいて、認識結果文字列の中心座標の上方向または左方向に項目名文字列の外接矩形が存在すると判定されることにより、帳票画像230の項目名文字列231cと認識結果文字列232c1との関連付けが行われる。また、認識結果文字列232c2,232c3,232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3についても同様に、上記のルールに従って関連付けが行われる。
【0097】
次に、帳票に項目名と項目値とが多対多で対応するものを含む場合の関連付けのルールについて説明する。
図20は、第2の実施の形態における第4の例の帳票画像における関連付けの様子を示す図である。図20は、帳票画像の第4の例であり、項目値と項目名とが多対多で対応するものを含む帳票画像240を示す。図20では、上記のルールに従って1対1で対応する項目名文字列241aと認識結果文字列242aの各文字、項目名文字列241bと認識結果文字列242bの各文字が関連付けられる。
【0098】
これに対し、認識結果文字列242cの項目値の左方には、項目名文字列241bが存在し、上方には項目名文字列241cが存在するので、上記のルールのみではいずれの項目名文字列と関連付けるべきか判定することができない。また、認識結果文字列242d,242eについても、同様に、左方には、項目名文字列241dが存在し、上方には項目名文字列241eが存在するので、上記のルールのみではいずれの項目名文字列と関連付けるべきか判定することができない。
【0099】
帳票画像240のように、多対多の対応関係を有する項目名と項目値とを有する帳票の文字列認識を行う場合、本実施の形態では、上記のルールに加えて、例えば以下のルールを追加することにより対応することができる。
・認識結果文字列の左方、上方、左上方のうちの異なる2方向に項目名文字列領域が存在することによりそれぞれの項目名文字列領域と関連付けられた場合であって、関連付けられた項目名が連記表に用いられる項目名であるときには、認識結果文字列と2つの項目名との関連付けは共に維持される。
・認識結果文字列の左方、上方、左上方のうちの異なる2方向に項目名文字列領域が存在することによりそれぞれの項目名文字列領域と関連付けられた場合であって、関連付けられた項目名が連記表に用いられない項目名であるときには、関連付けられた2つの項目名のうち、項目名と項目値との位置が近い関連付けのみを維持し、他方の関連付けを削除する。
【0100】
本実施の形態では、これらの追加するルールにより、認識結果文字列242cは、項目名文字列241bとの関連付けが削除され、項目名文字列241cとの関連付けが維持される。また、認識結果文字列242d,242eは、それぞれ項目名文字列241dとの関連付けおよび項目名文字列241eとの関連付けが共に維持される。
【0101】
なお、上記のルールおよび追加するルールは、あくまでも一例であり、本実施の形態の関連付けのルールは、帳票のフォーマットに応じて適宜設定することができる。
図21は、第2の実施の形態の項目名情報テーブルの例を示す図である。図21に示す項目名情報テーブル151aは、本実施の形態の文字列認識装置100による文字列認識処理を実行する際に適用される項目名情報を記憶するテーブルである。項目名情報テーブル151aは、項目名情報記憶部151に記憶されている。項目名情報テーブル151aには、“項目名番号”フィールド、“項目名文字列”フィールド、“連記表”フィールドが設けられている。各項目の横方向に並べられた情報同士が項目名情報として互いに関連付けられている。
【0102】
“項目名番号”フィールドには、各項目名を一意に特定可能に割り当てられた符号である項目名番号が設定される。“項目名文字列”フィールドには、帳票画像240等に使用される可能性がある項目名文字列が設定される。本実施の形態では、詳しくは図24から図34において後述するが、この項目名文字列フィールドに設定された項目名文字列を用いて項目名文字列の抽出を行う。“連記表”フィールドには、項目名番号で特定された項目名が複数の項目値と対応関係を有する連記表として使用される場合があるか否かを示す情報が設定される。項目名が連記表として使用される場合があれば、“連記表”フィールドに“有”が設定される。項目名が連記表として使用される場合がなければ、“連記表”フィールドに“無”が設定される。
【0103】
図22および図23は、第2の実施の形態のルールテーブルの例を示す図である。図22に示すルールテーブル154a、図23に示すルールテーブル154bは、本実施の形態の文字列認識装置100による文字列認識処理を実行する際に適用されるルールを記憶するテーブルである。ルールテーブル154a,154bは、ルール記憶部154に記憶されている。
【0104】
図22に示すルールテーブル154aには、“ルール”フィールド、“ルール内容”フィールドが設けられている。“ルール”フィールドには、ルールを特定可能な符号が設定される。“ルール内容”フィールドには、ルールの内容を定義する情報が設定される。説明の便宜上、“ルール”フィールドのルールは日本語により記述するが、これに限らず、コンピュータ言語やフラグ、データ、論理式等、文字列認識装置100においてルールに基づく関連付けに必要な処理を実行可能な形式で定義された情報を設定することができる。
【0105】
図22に示す以下のルールは、一般的な帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
[関連付けルール1]認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、認識結果文字列と項目名とを関連付ける。
【0106】
[関連付けルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
[関連付けルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、認識結果文字列に最も近い項目名文字列の関連付けのみ残す。
【0107】
[妥当性ルール1]認識結果文字列の中心の上方または左方に項目名文字列が存在する場合であって、認識結果文字列の中心の左上方に存在する他の項目名文字列への関連付けがあるとき、認識結果文字列の中心の左上方に存在する他の項目名文字列への関連付けは削除する。
【0108】
また、本実施の形態の関連付けのルールの別の例を示す。
図23に示すルールテーブル154bには、“適用範囲”フィールド、“ルール”フィールド、“ルール内容”フィールドが設けられている。“適用範囲”フィールドには、ルールが適用される項目名の範囲を示す情報が設定される。説明の便宜上、“ルール”フィールドと同様に“適用範囲”フィールドの適用範囲は日本語により記述するが、これに限らず、コンピュータ言語やフラグ、データ、論理式等、文字列認識装置100においてルールが適用される項目値の範囲の選択に必要な処理を実行可能な形式で定義された情報を設定することができる。
【0109】
図23に示す以下のルールは、連記表である項目を含む可能性があると共に、罫線を有する可能性があり、さらに2次元表である可能性がある帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
【0110】
・項目名の連記表が“有”
[ルール1]認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、認識結果文字列と項目名文字列とを関連付ける。
【0111】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
[ルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、認識結果文字列に最も近い項目名文字列の関連付けのみ残す。
【0112】
・項目名の連記表が“無”
[ルール1]認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、認識結果文字列と項目名文字列とを関連付ける。
【0113】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
なお、本実施の形態では、関連付けにおいて帳票のフォーマットに応じた任意のルールを設定することができる。
【0114】
次に、本実施の形態において帳票画像の項目名文字列領域を特定するために項目名を抽出する項目名文字列抽出処理について説明する。
図24から図26は、第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。項目名文字列抽出処理は、本実施の形態の文字列認識処理による呼び出しに基づいて文字列認識装置100により実行される。以下、図24から図26に示す処理をステップ番号に沿って説明する。
【0115】
〔ステップS21〕項目名文字列抽出部112は、項目名情報記憶部151から項目名情報に設定されているすべての項目名文字列を読み出す。読み出された項目名文字列は、ステップS28で、ステップS27における項目名文字列の文字認識の検証に使用される。
【0116】
〔ステップS22〕項目名文字列抽出部112は、帳票画像に対して連結要素解析を行い、連結要素を取得する。これにより、帳票画像の文字列の各文字について、文字の一部または全部であって形状が1つに連結されている要素である連結要素に分解される。
【0117】
〔ステップS23〕項目名文字列抽出部112は、ステップS22で取得した連結要素を組み合わせることにより、連結要素を統合して統合矩形を作成する。
〔ステップS24〕項目名文字列抽出部112は、ステップS23で作成した統合矩形のうち、未選択の統合矩形を1つ選択する。
【0118】
〔ステップS25〕項目名文字列抽出部112は、ステップS24で選択した統合矩形と、その統合矩形の周辺の統合矩形とを統合して、周辺統合矩形を生成する。
〔ステップS26〕項目名文字列抽出部112は、ステップS25で生成した周辺統合矩形のうち、未選択の周辺統合矩形を1つ選択する。
【0119】
〔ステップS27〕項目名文字列抽出部112は、ステップS26で選択した周辺統合矩形について文字認識を行い、認識結果文字を取得する。
〔ステップS28〕項目名文字列抽出部112は、ステップS27で取得した認識結果文字がステップS21で読み出した項目名文字列に含まれるか否かを判定する。認識結果文字が項目名文字列に含まれていれば、処理はステップS29に進められる。一方、認識結果文字が項目名文字列に含まれていなければ、処理はステップS31(図25)に進められる。
【0120】
〔ステップS29〕項目名文字列抽出部112は、ステップS27で取得した認識結果文字および認識結果文字の座標を記憶する。記憶された認識結果文字は、項目名文字列の候補の文字である文字候補となる。
【0121】
〔ステップS31〕項目名文字列抽出部112は、ステップS25で生成した周辺統合矩形のうち、所定の大きさ以下のすべての周辺統合矩形について選択済であるか否かを判定する。所定の大きさ以下のすべての周辺統合矩形について選択済であれば、処理はステップS32に進められる。一方、所定の大きさ以下の周辺統合矩形に選択されていないものがあれば、処理はステップS26(図24)に進められる。
【0122】
〔ステップS32〕項目名文字列抽出部112は、ステップS23で生成したすべての統合矩形について選択済であるか否かを判定する。すべての統合矩形について選択済であれば、処理はステップS32に進められる。一方、統合矩形に選択されていないものがあれば、処理はステップS24(図24)に進められる。
【0123】
〔ステップS33〕項目名文字列抽出部112は、探索する項目名文字列を1つ選択する。
〔ステップS34〕項目名文字列抽出部112は、認識結果文字からステップS33で選択された項目名文字列が有する文字を候補文字として抽出し、抽出した候補文字を行および列の項目とした文字列候補テーブルを作成する。このとき、文字列候補テーブルの各値には、初期値として“0”を設定する。
【0124】
〔ステップS35〕項目名文字列抽出部112は、文字列候補テーブルに項目名文字列の一部となる可能性がある組み合わせを設定する。
〔ステップS36〕項目名文字列抽出部112は、文字列候補テーブルに基づいて、ステップS33で抽出した候補文字同士を結んだ文字列候補対応関係グラフの最大クリークを探索する。
【0125】
〔ステップS37〕項目名文字列抽出部112は、ステップS36で探索した最大クリークの文字数と項目名文字列の文字数とからマッチング率Mを算出する。マッチング率Mは、最大クリークの文字数を、選択した項目名情報に示されている項目名文字列の文字数で割って算出される比率である。
【0126】
〔ステップS41〕項目名文字列抽出部112は、ステップS37で算出したマッチング率Mと所定の閾値αとを比較して、マッチング率Mが閾値α以上であるか否かを判定する。マッチング率Mが閾値α以上であれば、処理はステップS42に進められる。一方、マッチング率Mが閾値α未満であれば、処理はステップS43に進められる。閾値αは、例えば、帳票画像のフォーマット(例えば、項目名の種類や配置)や認識される文字の種類(例えば、文字を含むかまたは数字のみか、日本語文字を含むかまたは英字のみか、手書き文字か印字文字か)等の帳票の条件に応じて設定する。
【0127】
〔ステップS42〕項目名文字列抽出部112は、ステップS33で選択した項目名文字列および項目名文字列の座標を記憶する。記憶された項目名文字列および座標に基づいて帳票画像の項目名文字列領域が設定される。
【0128】
〔ステップS43〕項目名文字列抽出部112は、ステップS21で読み出したすべての項目名文字列について選択済であるか否かを判定する。すべての項目名文字列について選択済であれば、処理は復帰する。一方、項目名文字列に選択されていないものがあれば、処理はステップS33(図25)に進められる。
【0129】
図27から図31は、第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
図27(A)は、帳票画像の第5の例である帳票画像250を示す。帳票画像250に基づいて本実施の形態における項目名文字列の処理について説明する。
【0130】
本実施の形態の文字列認識装置100は、項目名文字列抽出処理のステップS21で項目名文字列を読み出す。次に、文字列認識装置100は、例えば、図27(B)の連結要素251aのように、ステップS22で連結要素解析を行い、帳票画像250が有するすべての文字列を分解して連結要素を抽出する。また、この連結要素を内部に含む長方形であって面積が最小となるものの外周を外接矩形(例えば、外接矩形251b1,251b2)とする。例えば、連結要素251aの外接矩形は251b1となる。次に、文字列認識装置100は、例えば、外接矩形251b1,251b2のように、ステップS23で連結要素の外接矩形であって互いに重なり合っているものを統合して統合矩形(例えば、図27(C)の統合矩形252)を生成する。
【0131】
次に、文字列認識装置100は、ステップS24で統合矩形のうちの1つを選択する。図28は、帳票画像250が有する文字の“株”の一部である「木偏」である選択統合矩形253が選択された場合の例を示す図である。次に、文字列認識装置100は、ステップS25で、選択した統合矩形の周辺(例えば、選択統合矩形253から所定範囲253a)に存在する他の統合矩形を0個以上組合せてそれらを統合し、周辺統合矩形を作成する。所定範囲253aは、帳票の文字の大きさ等に基づいて任意に設定することができる。
【0132】
次に、文字列認識装置100は、作成された統合矩形のうち、所定の大きさ以下の全ての統合矩形に対し、ステップS27で文字認識を行う。
次に、文字列認識装置100は、ステップS28で文字認識の結果得られた認識結果文字が、探索している項目名文字列の中に存在するか否かを判定する。判定の結果、認識結果文字が探索している項目名文字列に存在する場合は、文字列認識装置100は、ステップS29でその認識結果文字と座標とを記憶する。例えば、探索中の項目名が「商品番号」「貴社受付番号」「日付」の場合であって、認識結果文字が“株”であった場合、“株”は、いずれの項目名文字列にも含まれていないので、記憶されない。
【0133】
また、本実施の形態では、認識結果文字が重複した場合も認識結果文字は記録されない。例えば、ステップS23で帳票画像250が有する文字“社”の連結要素“ネ”が選択され、選択された連結要素“ネ”をその右方に隣接する連結要素“土”と統合した結果、認識結果文字“社”が得られたものとする。その後、ステップS23で連結要素“土”が選択され、選択された連結要素“土”の左方に隣接する連結要素“ネ”を統合しても認識結果文字“社”が得られる。この場合、同一の文字が2重に認識されることを防止するために、後者の認識結果文字は記憶しない。この重複の排除は、例えば、認識結果文字列の中心の座標をチェックし、中心が同一のものは記憶しないことにより実現してもよい。また、他の任意の方法で重複を排除してもよい。
【0134】
以上の項目名文字列抽出処理における文字認識について図28から図30に従って説明する。図28に示した選択統合矩形253を、所定範囲253aの連結要素と統合する場合、図29(A)に示す周辺統合矩形254a、図29(B)に示す周辺統合矩形254b、図30(A)に示す周辺統合矩形254c、図30(B)に示す周辺統合矩形254dの4種類の周辺統合矩形が生成可能である。
【0135】
本実施の形態の文字列認識装置100は、これらの周辺統合矩形254a〜254dについて文字認識を行う。ここで、以下の例を用いて具体的に説明する。例えば、探索中の項目名が「商品番号」「貴社受付番号」「日付」の場合であるものとする。また、周辺統合矩形254aは、選択統合矩形253の「木偏」を単独で統合矩形としたものであり、文字認識の結果、認識結果文字255a“木”が取得されたものとする。周辺統合矩形254bは、選択統合矩形253および左に隣接する“A”を統合して統合矩形としたものであり、文字認識の結果、認識結果文字255b“州”が取得されたものとする。周辺統合矩形254cは、選択統合矩形253および右に隣接する“朱”を統合して統合矩形としたものであり、文字認識の結果、認識結果文字255c“株”が取得されたものとする。周辺統合矩形254dは、選択統合矩形253および下に隣接する「“貴”の上側部分」を統合して統合矩形としたものであり、文字認識の結果、認識結果文字255d“塗”が取得されたものとする。
【0136】
この場合、周辺統合矩形254a〜254dのそれぞれから得られた認識結果文字255a〜255d(“木”、“州”、“株”、“塗”)は、探索中の項目名が有する文字「商品番号」「貴社受付番号」「日付」のいずれとも一致しない。従って、認識結果文字255a〜255dはいずれも記憶されない。
【0137】
次に、文字列認識装置100は、ステップS31で所定の大きさ以下のすべての周辺統合矩形が選択済になるまで、ステップS26からステップS29の処理を繰り返す。次に、文字列認識装置100は、ステップS32ですべての統合矩形が選択済になるまで、ステップS24からステップS31の処理を繰り返す。図27の例では、帳票画像250が有する“A”、“木”、“朱”、“式”、“会”の上側部分、“会”の下側部分、“ネ”、“土”のすべての連結要素について処理が繰り返される。
【0138】
本実施の形態では、このようにして取得される認識結果文字について、以下に示すように、ステップS33からステップS42の処理を繰り返して項目名文字列毎に探索を行う。
【0139】
図31に帳票画像250から項目名文字列「貴社受付番号」を探索する場合の例を示す。本実施の形態の文字列認識装置100は、ステップS33で項目名情報記憶部151に記憶されている項目名情報に設定されている項目名文字列から、探索する項目名文字列を1つ選択する。ここでは、項目名文字列「貴社受付番号」が選択されたものとする。これに基づいて、文字列認識装置100は、ステップS34で帳票画像250が有する文字列から項目名文字列「貴社受付番号」の各文字と一致する認識結果文字(a)〜(g)を抽出し、抽出した文字により文字列候補テーブル(図32において後述)を作成する。
【0140】
ここで、図31の帳票画像250における“受”は、ステップS27において例えば“愛”と誤認識されると共に、ステップS28で各項目名文字列が有するいずれの文字と一致しないと判定されたため記憶されなかったものとする。このように項目名の抽出において文字認識で誤認識があった場合でも、本実施の形態は項目名を抽出可能である。
【0141】
図32および図33は、第2の実施の形態の文字列候補テーブルの例を示す図である。図32に示す文字列候補テーブル152aおよび図33に示す文字列候補テーブル152bは、本実施の形態の文字列認識装置100による項目名文字列抽出処理において認識結果文字の文字列候補を示す情報を記憶するテーブルである。文字列候補テーブル152a,152bは、文字列候補記憶部152に記憶されている。
【0142】
文字列候補テーブル152a,152bには、行および列の項目として、ステップS33で選択された項目名文字列に含まれている認識結果文字(例えば、認識結果文字(a)〜(g))が文字列候補として設定されている。本実施の形態の文字列認識装置100では、選択した項目名文字列と一致する認識結果文字を項目としてステップS34において図32に示す初期状態の文字列候補テーブル152aを作成する。
【0143】
また、文字列候補テーブル152a,152bには、項目名文字列における文字列候補同士の前後の関連を示す値が設定される。以下に、文字列候補テーブル152a,152bに値が設定される際の設定条件について示す。項目名文字列において、ある認識結果文字以降に他の認識結果文字が存在していれば、ある認識結果文字の行であって他の認識結果文字の列の値に、“1”が設定される。項目名文字列において、ある認識結果文字以降に他の認識結果文字が存在しなければ、ある認識結果文字の行であって他の認識結果文字の列の値に、“0”が設定される。また、ある認識結果文字と他の認識結果文字とが同一の行に存在しない場合には、前述の条件を満たしていても値に“0”が設定される。
【0144】
具体的には、項目名文字列が「貴社受付番号」であって、ある認識結果文字が認識結果文字列(a)“貴”であり、他の認識結果文字が認識結果文字列(b)“社”である場合、「貴社受付番号」において認識結果文字列(a)“貴”の次に認識結果文字列(b)“社”が存在するので、対応する値に“1”が設定される。一方、ある認識結果文字が認識結果文字列(d)“番”であり、他の認識結果文字が認識結果文字列(a)“貴”である場合、「貴社受付番号」において認識結果文字列(d)“番”の次に認識結果文字列(a)“貴”が存在しないので、対応する値に“0”が設定される。また、ある認識結果文字が認識結果文字列(a)“貴”であり、他の認識結果文字が認識結果文字列(f)“社”である場合、「貴社受付番号」において認識結果文字列(a)“貴”の次に認識結果文字列(f)“社”が存在するが、認識結果文字列(a)“貴”と認識結果文字列(f)“社”とは同一の行に存在しないので、対応する値に“0”が設定される。
【0145】
次に、文字列認識装置100は、ステップS35で上記の設定条件に従って、図33に示す文字列候補テーブル152bのように、各文字列候補同士の組み合わせの値を設定していく。次に、文字列認識装置100は、文字列候補テーブル152bに定義される文字列候補同士の対応関係に基づいて、文字列候補の対応関係の最大クリークを探索する。
【0146】
図34は、第2の実施の形態の文字列候補テーブルにおける文字列候補の対応関係を表した文字列対応関係グラフを示す図である。
図34に示す文字列候補対応関係グラフ152b1は、説明の便宜上、本実施の形態の項目名文字列抽出処理によって文字列候補テーブル152bに定義された文字列候補の対応関係を表したグラフである。文字列候補対応関係グラフ152b1では、文字列候補である、認識結果文字(a)〜(g)がノード(node)に設定されている。また、文字列候補テーブル152bにおいて“1”が設定されている値に対応するノード間は、パス(path)が設定されている。
【0147】
ここで、クリーク(clique)は、グラフのすべてのノード同士の組み合わせについても互いにパスが存在する部分グラフである。最大クリークは、グラフから抽出されるクリークのうち、頂点数が最大のクリークである。本実施の形態の項目名文字列抽出処理で探索する最大クリークは、図34の例では、(a),(b),(c),(d),(e)となる。
【0148】
この最大クリークの探索については、様々な探索アルゴリズムが知られている。最大クリークの探索には、一例として上記の[非特許文献1]記載の方法を使用してもよい。
次に、文字列認識装置100は、ステップS37で最大クリークの文字数および項目名文字列の文字数から、項目名文字列のマッチング率Mを算出する。マッチング率Mは、最大クリークの文字数を、選択した項目名情報に示されている項目名文字列の文字数で割って算出される比率である。例えば、上記の例では、最大クリークの文字数が“5”であって項目名情報の項目名文字列が“貴社受付番号”であり文字数が“6”であるため、マッチング率M=5/6≒0.83となる。
【0149】
次に、文字列認識装置100は、ステップS41およびステップS42で、マッチング率Mが閾値α以上である場合は、その項目名文字列と項目名文字列の座標とを記憶する。次に、文字列認識装置100は、すべての項目名文字列が選択済になるまで、ステップS33からステップS42の処理を繰り返す。すべての項目名文字列に対し処理が終了すれば、帳票画像から項目名文字列の抽出が完了したものとして、項目名文字列抽出処理を終了して文字列認識処理に復帰する。
【0150】
以上説明したように、第2の実施の形態では、帳票画像の文字認識を行う際に、文字認識で取得した項目値の認識結果文字列について、項目名との位置関係に基づいて統合し、項目値文字列を設定する。これにより、帳票画像が有する文字列と各項目値の文字列との対応関係を設定する際に、対応関係の設定の誤りの発生を抑制する。その結果、項目値の文字列認識における誤認識の発生を抑制することが可能となる。
【0151】
また、ルールに基づいて項目名と項目値との対応関係を設定する。これにより、ルールを帳票等の文書のフォーマットに応じて適宜設定することにより、様々な形式の文書に適応させることができる。
【0152】
〔第3の実施の形態〕
次に第3の実施の形態について説明する。上記の第2の実施の形態との相違点を中心に説明し、同様の事項については同一の符号を用いると共に説明を省略する。第3の実施の形態は、文字列認識処理において項目値の文字列認識に連結要素を用いた例である。
【0153】
第2の実施の形態では、文字列認識処理において、項目名文字列領域の特定に連結要素による文字認識を行い、項目値文字列の文字列認識には、従来の文字認識を用いる。これに対して、第3の実施の形態では、項目値文字列の文字列認識にも連結要素による文字認識を用いる。
【0154】
図35は、第3の実施の形態の機能を示すブロック図である。本実施の形態の文字列認識装置300は、手書き文字、活字、プリンタ等による印字等、文字認識可能である任意の字体の文字に適用可能であるものとする。文字列認識装置300は、画像取得部111、項目名文字列抽出部312、関連付け部313、関連付け検証部314、連結要素統合部315、統合連結要素文字認識部316、文字カテゴリ限定部317、連結要素抽出部318、画像記憶部120、項目名情報記憶部351、文字列候補記憶部152、対応関係記憶部153、ルール記憶部354を有する。
【0155】
画像取得部111は、スキャナや他のコンピュータから通信回線を介して帳票等の文書の画像情報を取得し、取得した画像情報を画像記憶部120に記憶させる。
項目名文字列抽出部312は、項目名情報を項目名情報記憶部351から読み出し、画像記憶部120に記憶されている画像から、項目名文字列情報に基づいて画像中に存在する項目名文字列を抽出する。そして、また、項目名文字列抽出部312は、項目名文字列を示す項目名文字列領域(項目名文字ブロック)を抽出する。ここで、文字列認識装置300で文字列認識を行う画像は、例えば、項目名を示す項目名文字列、項目名に対応する項目値を示す項目値文字列を有する帳票画像等の画像である。この画像は、例えば、帳票等の文書をスキャナ等で読み取るか、直接電子ファイルで作成された帳票等の文書を画像に変換することにより作成される。また、画像中の項目名文字列領域以外の領域を非項目名文字列領域とする。また、項目値は、帳票等の文書において項目名に対応する内容である。また、項目値文字列は、項目名に対応する内容を示す文字を有する文字列であり、第1の実施の形態の内容文字列と対応する。
【0156】
また、項目名文字列抽出部312は、項目名文字列領域の位置および連結要素(項目値文字ブロック)の位置を示す位置情報を取得する。この位置情報により、項目名文字列領域の位置が特定される。この位置情報は、項目名文字列領域の位置を、例えば、画像上の2次元座標で示してもよい。また、項目値文字ブロックは、項目値文字列の一部または全部を示し、第1の実施の形態の内容文字ブロックと対応する。
【0157】
項目名文字列抽出部312は、取得した画像中のそれぞれの連結要素と外接する外接矩形を作成し、重なる外接矩形同士を統合することにより、項目名文字列領域を作成する。
関連付け部313は、ルール記憶部354に記憶されているルールに従って、非項目名文字列領域に存在する連結要素抽出部318で取得された各連結要素に対し、項目名文字列抽出部312により取得した位置情報に基づいて各連結要素の位置から左方向または上方向に項目名文字列抽出部312で取得された項目名文字列を探索し、探索の結果により抽出された項目名文字列が示す項目名と連結要素とを関連付ける。なお、これに限らず、関連付け部313は、ルール記憶部354に記憶されているルールに従って、項目名文字列抽出部312により取得された位置情報に基づいて項目名文字列抽出部312で取得された項目名文字列の位置から右方向または下方向に非項目名文字列領域に存在する連結要素抽出部318で取得された各連結要素を探索し、項目名文字列領域の項目名文字列が示す項目名と探索の結果得られた連結要素とを関連付けてもよい。
【0158】
関連付け検証部314は、ルール記憶部354から項目名文字列と連結要素との関連付けにおいて満たすべきルールを読み出し、関連付け部313で生成された項目名と連結要素との関連付けのうち、ルールに違反する関連付けを削除する。
【0159】
連結要素統合部315は、同一の項目名に関連付けられた連結要素同士を統合し、項目名に対応する統合外接矩形領域に設定する。すなわち、連結要素統合部315は、連結要素抽出部318により抽出し、関連付け部313によって関連付け、関連付け検証部314によって関連付けを削除されずに維持された連結要素を統合して項目名に関連付ける統合外接矩形領域を設定する。このとき連結要素統合部315は、連結要素が画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した外接矩形同士が重なっている連結要素の外接矩形を統合して統合外接矩形領域を設定する。
【0160】
統合連結要素文字認識部316は、設定した統合外接矩形領域について項目名文字列領域の項目名に対応する文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って項目値文字列を取得し、項目名文字列領域の項目名と取得した項目値文字列とを関連付けの結果として対応関係記憶部153に記憶させる。
【0161】
文字カテゴリ限定部317は、項目名情報記憶部351に記憶されている項目名情報から項目名に対応する項目値の文字カテゴリ情報を取得する。
連結要素抽出部318は、非項目名文字列領域に対して連結要素解析を行い、項目値文字列の一部を示す特定の画素が連結している領域である連結要素を抽出する。ここで、連結要素は、特定の画素が連結している領域である。また、特定の画素は、例えば、予め設定された画素値以上の画素等の基準で抽出される画素であり、認識対象の文字列の一部を示す画素である。
【0162】
画像記憶部120は、項目名を示す文字を有する項目名文字列と項目名に対応する内容を示す文字を有する項目値文字列とを有する画像を記憶する。画像記憶部120に記憶されている画像は、項目名および項目値を有する帳票等の文書の画像である。この画像は、スキャナ等の光学式読み取り装置で取得してもよく、コンピュータ等により直接電子ファイルで作成された帳票等の文書を画像に変換することにより取得してもよい。
【0163】
項目名情報記憶部351は、例えば、『氏名』、『住所』等の項目名の項目値文字列を示す情報、項目名が複数の項目値と対応する連記表であるか否かを示す情報を有する項目名文字列情報を有する項目名情報を記憶する。また、本実施の形態の項目名情報記憶部351は、項目名に対応する項目値文字列に使用できる文字の範囲である文字カテゴリを示す文字カテゴリ情報を、項目名情報において項目名と関連付けて記憶する。
【0164】
本実施の形態の文字列認識装置300では、項目値文字列領域について文字認識を行う場合、項目名情報記憶部351に記憶されている文字カテゴリ情報に基づいて文字カテゴリの限定を行う。すなわち、文字カテゴリ情報により文字認識時において項目名に対応する項目値文字列の文字カテゴリが分かっているので、その項目値に使用できる文字カテゴリを限定することができる。
【0165】
例えば、項目名が『日付』であれば、その項目値に現れる文字は、[0123456789年月日明治大正昭和平成西暦]の範囲に限定することができる。また、項目名が『フリガナ』であれば、その項目値には、カタカナ文字に限定できる。
【0166】
これらの事実を利用し、本実施の形態では、項目値文字列領域の文字認識を行う前にその項目値が取り得る文字カテゴリを決定し、その範囲内での文字認識を行う。これにより類似文字の誤認識を抑制することができる。
【0167】
例えば、
“2009年 1月 5日”
という年月日の表記があった場合、文字認識結果は、以下のように誤認識された場合について考える。
【0168】
“2OO9年 l月 S日”
つまり、“0”(ゼロ)は“O”(オー)、“1”(イチ)は、“l”(エル)、“5”(ゴ)は“S”(エス)のように文字認識誤りが発生する場合がある。ここで、文字認識時点で、文字カテゴリを数字に限定し、アルファベットは認識対象外としていれば、上記のような文字の誤認識を防止することが可能である。
【0169】
文字列候補記憶部152では、項目名文字列抽出処理において認識結果文字の文字列候補を示す情報を記憶する。
対応関係記憶部153は、項目名と統合認識結果文字列とを関連付けて示す対応関係情報を記憶する。この統合認識結果文字列は、統合連結要素文字認識部316によって文字認識した結果得られる。この対応関係情報により、画像に含まれている項目名および項目値ならびに項目名と項目値との対応関係が示される。
【0170】
ルール記憶部354は、項目名と連結要素との関連付けのルールを記憶する。ルール記憶部354に記憶されているルールは、例えば、1つの連結要素に対応関係を有する項目名が複数存在する場合の関連付けのルール、1つの項目名に対応関係を有する連結要素が複数存在する場合の関連付けのルールを含む。また、1つの項目名に1つの連結要素が対応関係を有する場合において、1つの項目名に関連付け可能な連結要素が複数存在するときに、連結要素を複数の項目名のうちの1つの正しい項目名と関連付けて他の対応関係を削除する関連付けのルールを含む。
【0171】
また、図1に示した第1の実施の形態の機能のうち、文字ブロック位置取得部1aの機能は、項目名文字列抽出部312、連結要素抽出部318で実現されている。また、対応関係設定部1b、文字ブロック統合部1eの機能は、関連付け部313、関連付け検証部314、連結要素統合部315、統合連結要素文字認識部316で実現されている。
【0172】
図36から図37は、第3の実施の形態の文字列認識処理の手順を示すフローチャートである。文字列認識処理は、帳票の画像読み取りやユーザの文字列認識処理を実行する操作に基づいて、文字列認識装置300により実行が開始される。以下、図36および図37に示す処理をステップ番号に沿って説明する。
【0173】
〔ステップS51〕項目名文字列抽出部312は、項目名情報記憶部351に記憶されている項目名情報を取得する。
〔ステップS52〕項目名文字列抽出部312は、帳票画像等から項目名文字列を抽出する項目名文字列抽出処理を実行する。
【0174】
〔ステップS53〕連結要素抽出部318は、ステップS52で取得した項目名文字列領域以外の非項目名文字列領域について連結要素の抽出を行い、連結要素を取得する。この非項目名文字列領域に対する連結要素は、第2の実施の形態の項目名文字列抽出におけるステップS22(図24、図27参照)と同様の処理によって取得する。
【0175】
〔ステップS54〕関連付け部313は、所定の位置関係に該当するステップS52で抽出した項目名文字列とステップS53で取得した連結要素とを、ルール記憶部354に記憶されているルールに基づいて関連付ける。
【0176】
〔ステップS55〕関連付け検証部314は、ステップS54における関連付けについて検証し、検証の結果正しくない関連付けを削除する。
〔ステップS56〕連結要素統合部315は、ステップS54およびステップS55による関連付けによって、同一の項目名文字列に関連付けた連結要素を統合して項目名文字列に対応する項目値文字列領域に設定する。
【0177】
〔ステップS61〕文字カテゴリ限定部317は、項目名情報記憶部351に記憶されている項目名情報から項目名文字列に対応する文字カテゴリを取得する。
〔ステップS62〕統合連結要素文字認識部316は、ステップS61で取得した文字カテゴリによって、ステップS56(図36)で設定した項目値文字列領域に文字認識を行い、認識結果である統合認識結果文字列を項目名文字列が示す項目名に対応する項目値として設定する。
【0178】
〔ステップS63〕統合連結要素文字認識部316は、ステップS62で設定した帳票画像の項目名と項目値との対応関係を、対応関係記憶部153に記憶させる。
図38および図39は、第3の実施の形態における第1の例の帳票画像の処理の様子を示す図である。図38(A)および図38(B)に従って、帳票画像410の項目名文字列領域412a,412bおよび連結要素416a1,・・・、連結要素416b1,・・・に基づいてステップS54およびステップS55の処理を説明する。本実施の形態の文字列認識装置300は、ステップS53で抽出した連結要素について、ステップS54により、項目名文字列との関連付けを行う。このステップS54の関連付けでは、項目名文字列が位置する項目名文字列領域と連結要素の位置とが、ルール記憶部354に記憶されているルールが示す所定の位置関係にある場合、項目名文字列が示す項目名と連結要素とが関連付けられる。
【0179】
ここで、図38(A)に示すように、本実施の形態の文字列認識処理のステップS51からステップS53の処理によって、帳票画像410において項目名文字列領域412a,412bが設定されているものとする。また、帳票画像410に含まれる項目値文字列「神奈川県川崎市小山 1−23−4」が有する連結要素416a1,416a2,416a3,416a4,416a5,416a6,416a7,416a8,・・・、項目値文字列「東京太郎」が有する連結要素416b1,416b2,416b3,416b4,416b5,・・・が抽出されているものとする。
【0180】
これに対して本実施の形態の文字列認識装置300は、ステップS54により項目名文字列領域412aと連結要素416a1,・・・、項目名文字列領域412aと連結要素416b1,・・・、項目名文字列領域412bと連結要素416b1,・・・の3組が、ルール記憶部354に記憶されているルールが示す所定の位置関係(例えば、連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在)を満たすものとして一旦関連付ける。
【0181】
次に、文字列認識装置300は、ステップS55により項目名文字列と連結要素との関連付けの検証および削除を行う。このステップS55の関連付けの検証および削除では、関連付けられた項目名文字列と連結要素とが、ルール記憶部354に記憶されているルールに違反するか等に基づいて、関連付けが正しいか否かについて検証される。そして、検証の結果に基づき、ステップS54で関連付けられた、関連付けが正しくない項目名と連結要素との関連付けが削除される。
【0182】
ステップS55において、ルール記憶部354に記憶されているルール(例えば、連結要素の中心の左方に項目名文字列領域が存在する場合、連結要素の中心の左上方の項目名文字列への関連付けは削除)に基づいて、項目名文字列領域412aと連結要素416b1,・・・については、図38(B)の点線の矢印で示すように、関連付けが削除される。このようにして、正しくない関連付けが削除され、正しい関連付けのみが維持される。
【0183】
本実施の形態の文字列認識装置300では、ステップS56によりステップS55で検証された関連付けに基づいて、同一の項目名文字列領域に関連付けられたすべての連結要素の外接矩形を1つに統合する。そして、統合後の外接矩形を、項目名に対応する項目値文字列領域に設定する。具体的には、図39に示すように、項目名文字列領域412aに関連付けられた各連結要素416a1,・・・の外接矩形が統合され、項目名文字列領域412aに対応する項目値文字列領域417aが設定される。また、項目名文字列領域412bに関連付けられた各連結要素416b1,・・・の外接矩形が統合され、項目名文字列領域412bに対応する項目値文字列領域417bが設定される。
【0184】
本実施の形態では、この設定された項目値文字列領域417a,417bについてステップS62でそれぞれ文字認識を行うことにより統合認識結果文字列を取得し、ステップS63でそれぞれ項目名文字列領域412a,412bと関連付けられる。
【0185】
このように、本実施の形態の文字列認識処理では、項目値文字列領域417a,417bを適切に設定することが可能になる。これにより、文字列認識の誤認識の発生を抑制することができる。
【0186】
図40は、第3の実施の形態の項目名情報テーブルの例を示す図である。図40に示す項目名情報テーブル351aは、本実施の形態の文字列認識装置300による文字列認識処理を実行する際に適用される項目名情報を記憶するテーブルである。項目名情報テーブル351aは、項目名情報記憶部351に記憶されている。項目名情報テーブル351aには、“項目名番号”フィールド、“項目名文字列”フィールド、“連記表”フィールド、“文字カテゴリ”フィールドが設けられている。各項目の横方向に並べられた情報同士が項目名情報として互いに関連付けられている。
【0187】
“文字カテゴリ”フィールドには、項目名番号で特定された項目名と対応関係を有する項目値が取り得る文字の種類を示す文字カテゴリが設定される。本実施の形態の文字列認識装置300は、文字列認識処理のステップS61で項目名情報から項目名文字列に対応する文字カテゴリを取得する。そして、文字列認識装置300は、ステップS62で項目名文字列に対応する項目値文字列領域を文字カテゴリの文字の範囲で文字認識を行い、項目名の項目値に設定することができる。これにより、項目値文字列領域の文字認識の誤認識の発生を抑制することができる。
【0188】
文字カテゴリには、例えば、全漢字(すべての漢字)、ひらがな、カタカナ、住所漢字(住所に使用されている漢字)、英数字記号(アルファベット、数字および記号)、数字(数字のみ)等のうち1つ、またはこれらを任意に組み合わせたものを設定することができる。さらに、人名漢字(氏名に使用可能な漢字)等の上記以外の文字カテゴリを追加して設定してもよい。
【0189】
図41および図42は、第3の実施の形態のルールテーブルの例を示す図である。図41に示すルールテーブル354a、図42に示すルールテーブル354bは、本実施の形態の文字列認識装置300による文字列認識処理を実行する際に適用されるルールを記憶するテーブルである。ルールテーブル354a,354bは、ルール記憶部354に記憶されている。
【0190】
図41に示すルールテーブル354aには、“ルール”フィールド、“ルール内容”フィールドが設けられている。図41に示す以下のルールは、一般的な帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
【0191】
[関連付けルール1]連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、連結要素と項目名とを関連付ける。
[関連付けルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
【0192】
[関連付けルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、連結要素に最も近い項目名文字列の関連付けのみ残す。
【0193】
[妥当性ルール1]連結要素の中心の上方または左方に項目名文字列領域が存在する場合であって、連結要素の中心の左上方に存在する他の項目名文字列への関連付けがあるとき、連結要素の中心の左上方に存在する他の項目名文字列への関連付けは削除する。
【0194】
また、本実施の形態の関連付けのルールの別の例を示す。
図42に示すルールテーブル354bには、“適用範囲”フィールド、“ルール”フィールド、“ルール内容”フィールドが設けられている。図42に示す以下のルールは、連記表である項目を含む可能性があると共に、罫線を有する可能性があり、さらに2次元表である可能性がある帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
【0195】
・項目名の連記表が“有”
[ルール1]連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、連結要素と項目名とを関連付ける。
【0196】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
[ルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、連結要素に最も近い項目名文字列の関連付けのみ残す。
【0197】
・項目名の連記表が“無”
[ルール1]連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、連結要素と項目名文字列とを関連付ける。
【0198】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
なお、本実施の形態では、関連付けにおいて帳票のフォーマットに応じた任意のルールを設定することができる。
【0199】
第3の実施の形態では、第2の実施の形態に加えて、連結要素に分解してから関連付けルールに従って連結要素を項目名に関連付けることにより、項目値文字列領域を適切に設定することが可能になる。これにより、文字列認識の誤認識の発生を抑制することができる。
【0200】
また、項目値の文字カテゴリを予め項目名に対応付けておき、項目名文字列に対応する項目値文字列領域を文字カテゴリの文字の範囲で文字認識を行い、項目名の項目値に設定することができる。これにより、項目値文字列領域の文字認識の誤認識の発生を抑制することができる。
【0201】
なお、上記の処理機能は、文字列認識装置によって実現することができる。その場合、サーバが有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムを文字列認識装置で実行することにより、上記処理機能が文字列認識装置上で実現される。処理内容を記述したプログラムは、文字列認識装置で読み取り可能な記録媒体に記録しておくことができる。文字列認識装置で読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disc)などがある。
【0202】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバ文字列認識装置の記憶装置に格納しておき、ネットワークを介して、サーバ文字列認識装置から他の文字列認識装置にそのプログラムを転送することもできる。
【0203】
プログラムを実行する文字列認識装置は、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバ文字列認識装置から転送されたプログラムを、自己の記憶装置に格納する。そして、文字列認識装置は、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、文字列認識装置は、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、文字列認識装置は、サーバ文字列認識装置からプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0204】
また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現することもできる。
【0205】
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。
【0206】
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
(付記1) 項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像を記憶する画像記憶部と、
前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得部と、
前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定部と、
を有することを特徴とする文字列認識装置。
【0207】
(付記2) 前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0208】
(付記3) 前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0209】
(付記4) 前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する前記文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記3記載の文字列認識装置。
【0210】
(付記5) 前記項目名の前記内容文字列を示す項目名文字列情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記文字ブロック位置取得部は、前記項目名情報記憶部に記憶されている前記項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記1記載の文字列認識装置。
【0211】
(付記6) 前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から左方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0212】
(付記7) 前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から上方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0213】
(付記8) 前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記非項目名文字領域について1文字単位で文字認識を行って前記認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記2記載の文字列認識装置。
【0214】
(付記9) 前記関連付けのルールを記憶するルール記憶部を有し、
前記対応関係設定部は、前記ルール記憶部に記憶されている前記ルールに従って、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0215】
(付記10) 前記ルール記憶部に記憶されている前記ルールは、1つの前記内容に対応関係を有する前記項目名が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記9記載の文字列認識装置。
【0216】
(付記11) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に対応関係を有する前記内容が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記9記載の文字列認識装置。
【0217】
(付記12) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に1つの前記内容が対応関係を有する場合において、1つの前記項目名に関連付け可能な前記内容が複数存在するときに、前記内容を複数の前記項目名のうちの1つの正しい項目名と関連付ける前記関連付けのルールを含むことを特徴とする付記9記載の文字列認識装置。
【0218】
(付記13) コンピュータに、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有する処理を実行させることを特徴とする文字列認識プログラム。
【0219】
(付記14) 前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0220】
(付記15) 前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0221】
(付記16) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する項目名情報記憶部に記憶されている前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記15記載の文字列認識プログラム。
【0222】
(付記17) 前記文字ブロック位置取得ステップでは、項目名情報記憶部に記憶されている前記項目名の前記内容文字列を示す項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記13記載の文字列認識プログラム。
【0223】
(付記18) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から左方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0224】
(付記19) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から上方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0225】
(付記20) 前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記非項目名文字領域について1文字単位で文字認識を行って前記認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記14記載の文字列認識プログラム。
【0226】
(付記21) 前記対応関係設定ステップは、ルール記憶部に記憶されている前記関連付けのルールに従って、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0227】
(付記22) 前記ルール記憶部に記憶されている前記ルールは、1つの前記内容に対応関係を有する前記項目名が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記21記載の文字列認識プログラム。
【0228】
(付記23) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に対応関係を有する前記内容が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記21記載の文字列認識プログラム。
【0229】
(付記24) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に1つの前記内容が対応関係を有する場合において、1つの前記項目名に関連付け可能な前記内容が複数存在するときに、前記内容を複数の前記項目名のうちの1つの正しい項目名と関連付ける前記関連付けのルールを含むことを特徴とする付記21記載の文字列認識プログラム。
【0230】
(付記25) コンピュータが、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有することを特徴とする文字列認識方法。
【0231】
(付記26) 前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0232】
(付記27) 前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0233】
(付記28) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する項目名情報記憶部に記憶されている前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記27記載の文字列認識方法。
【0234】
(付記29) 前記文字ブロック位置取得ステップでは、項目名情報記憶部に記憶されている前記項目名の前記内容文字列を示す項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記25記載の文字列認識方法。
【0235】
(付記30) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から左方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0236】
(付記31) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から上方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0237】
(付記32) 前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記非項目名文字領域について1文字単位で文字認識を行って前記認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記26記載の文字列認識方法。
【0238】
(付記33) 前記対応関係設定ステップは、ルール記憶部に記憶されている前記関連付けのルールに従って、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0239】
(付記34) 前記ルール記憶部に記憶されている前記ルールは、1つの前記内容に対応関係を有する前記項目名が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記33記載の文字列認識方法。
【0240】
(付記35) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に対応関係を有する前記内容が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記33記載の文字列認識方法。
【0241】
(付記36) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に1つの前記内容が対応関係を有する場合において、1つの前記項目名に関連付け可能な前記内容が複数存在するときに、前記内容を複数の前記項目名のうちの1つの正しい項目名と関連付ける前記関連付けのルールを含むことを特徴とする付記33記載の文字列認識方法。
【符号の説明】
【0242】
1 文字列認識装置
1a 文字ブロック位置取得部
1b 対応関係設定部
1c 画像記憶部
1d 対応関係記憶部
1e 文字ブロック統合部
【技術分野】
【0001】
本発明は文字を含む画像の文字認識を行う文字列認識装置、文字列認識プログラムおよび文字列認識方法に関する。
【背景技術】
【0002】
IT(Information Technology)インフラが整った現在では、企業間での商取引に電子データ交換が頻繁に行われている。しかしながら、企業と個人との間の取引(B to C:Business to Consumer)では、依然、紙の帳票が頻繁に使用される。例えば、金融機関に公共料金を支払うときは、振込み用紙を金融機関に持っていき料金を支払う場合がある。また、宅配便を送るときは、紙の伝票に配送先住所を書き、役所等の申請窓口では、紙の書類に必要事項を記入し、提出することが行われている。さらに、企業間取引(B to B:Business to Business)においても、お互いデータ互換性がない場合や、通信プロトコルが異なる場合は、データ交換に紙の帳票を用いたり、取引データをPDF(Portable Document Format)等の電子帳票画像に変換し、送受信したりすることが行われている。
【0003】
これらの紙の帳票や電子帳票画像等について、画像中の文字成分を識別し、文字コードとして出力する光学式文字読取装置(OCR:Optical Character Reader)がある。OCRの機能は、コンピュータ上のソフトウェアで実現することも行われている。OCRでは、印刷文字、手書き文字等による文書が光学的に読み取られる。そして、OCRは、文書画像から文字成分を抽出して文字認識を行う。
【0004】
これらのような紙の帳票や電子帳票画像では、帳票内に記述されているデータの意味的な構造(論理構造)が失われているため、OCR等で電子化して計算機で処理する際の障害となる場合がある。例えば、帳票に発注品名と、個数、単価、合計金額が書かれていた場合、どの数字がどの品名に対する個数なのか、どの数字が合計金額を意味するのか、電子帳票の画像を解析して特定する必要がある。
【0005】
これに関して、帳票に含まれている項目名を示す項目名辞書を用いて、画像を解析して認識した文字列と照合することにより、「項目名文字列」と「データ文字列」とを判定する技術が知られている。
【0006】
また、画像から1または複数の文字を有する文字ブロックを抽出して、抽出した各ブロックについて文字認識が行われる場合がある。このような場合、辺や旁などを含め、文字の中に複数の独立をした部分がある漢字の文字認識では、例えば、その文字を1つの文字としてではなく、辺や旁などを各々別個の文字であると誤って認識(例えば“社”を“ネ”と“土”等)し、誤った認識に基づいて文字認識を行うブロックを判断することがあり、文字認識がうまくできないことがある。
【0007】
これに関して、画像の文字列を一旦、各連結成分に分解してから周辺の連結成分と組み合わせて統合矩形を生成し、生成した各統合矩形に対して文字認識を試みることによって文字認識結果(文字データ)を得る技術が知られている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2008−204226号公報
【特許文献2】特開2008−191833号公報
【非特許文献】
【0009】
【非特許文献1】“Finding All Cliques of an Undirected Graph", Coen Bron and Joep Kerbosch,Communications of the ACM, September 1973, Volume 16, Number 9, p575-577
【発明の概要】
【発明が解決しようとする課題】
【0010】
ここで、文字認識の対象の文字ブロックが有するある項目名(例えば「住所」等)に対する内容(項目値)として記載されている一連の文字列に区切れがある場合、それらの文字列をある項目名の値となる一連の文字列と認識できず、別個の文字列として誤認識される可能性があるという問題点がある。例えば「川崎市 中原区 上小田中」について、本来一体である「川崎市」と「中原区」と「上小田中」とを3個のデータとして誤認識してしまうことが考えられる。さらにこの場合、「川崎市」のみを「住所」に対応するデータとして誤認識すると共に、「中原区」および「上小田中」を他の項目に対応するデータと誤認識したり、対応する項目名が不明という判断をしてしまったりすることが考えられる。
【0011】
このように、従来の文字認識では、帳票等の複数の文字列が特定の意味を持って配置されている画像の文字認識を行った場合、これらの文字領域検出に、文字認識の対象の文字列が過剰に分割されて認識されたり、文字列中の認識文字の欠損などのエラーが発生したりすると、帳票の項目名と項目値(内容として記載されている文字列)との関連付けに失敗したり、文字列の抽出の際に誤認識が生じたりする場合があるという問題点があった。
【0012】
本発明はこのような点に鑑みてなされたものであり、文字列を含む画像の文字認識を行う際に、誤認識を抑制する文字列認識装置、文字列認識プログラムおよび文字列認識方法を提供することを目的とする。
【課題を解決するための手段】
【0013】
上記課題を解決するために、以下の機能を有する文字列認識装置が提供される。コンピュータは、画像の文字列認識をするために、画像記憶部、文字ブロック位置取得部、対応関係設定部を有する。画像記憶部は、項目名を示す文字を有する項目名文字列と項目名に対応する内容を示す文字を有する内容文字列とを有する画像を記憶する。文字ブロック位置取得部は、画像記憶部に記憶されている画像から、項目名文字列を示す項目名文字ブロックと、内容文字列の一部または全部を示す内容文字ブロックとを抽出し、項目名文字ブロックと内容文字ブロックとの位置を示す位置情報を取得する。次に、文字ブロック位置取得部は、項目名文字ブロックと内容文字ブロックとの位置を示す位置情報を取得する。対応関係設定部は、文字ブロック位置取得部により取得した位置情報に基づいて内容文字ブロックの位置から所定の方向に存在する項目名文字ブロックを抽出し、内容文字ブロックと抽出した項目名文字ブロックの項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる。
【発明の効果】
【0014】
文字列を含む画像の文字認識を行う際に、項目名と項目値との関連付けの誤りを抑制することにより、文字列の誤認識の発生を抑制することが可能となる。
【図面の簡単な説明】
【0015】
【図1】第1の実施の形態の機能を示すブロック図である。
【図2】第2の実施の形態の文字列認識装置のハードウェア構成例を示す図である。
【図3】第2の実施の形態の機能を示すブロック図である。
【図4】第2の実施の形態の文字列認識処理の手順を示すフローチャートである。
【図5】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図6】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図7】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図8】第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図9】第2の実施の形態により第1の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。
【図10】第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
【図11】第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
【図12】第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
【図13】第2の実施の形態により第2の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。
【図14】第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【図15】第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【図16】第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【図17】第2の実施の形態により第3の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。
【図18】第2の実施の形態における第3の例の帳票画像における関連付けの様子を示す図である。
【図19】第2の実施の形態における第3の例の帳票画像における関連付けの様子を示す図である。
【図20】第2の実施の形態における第4の例の帳票画像における関連付けの様子を示す図である。
【図21】第2の実施の形態の項目名情報テーブルの例を示す図である。
【図22】第2の実施の形態のルールテーブルの例を示す図である。
【図23】第2の実施の形態のルールテーブルの例を示す図である。
【図24】第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。
【図25】第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。
【図26】第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。
【図27】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図28】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図29】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図30】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図31】第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
【図32】第2の実施の形態の文字列候補テーブルの例を示す図である。
【図33】第2の実施の形態の文字列候補テーブルの例を示す図である。
【図34】第2の実施の形態の文字列候補テーブルにおける文字列候補の対応関係を表した文字列対応関係グラフを示す図である。
【図35】第3の実施の形態の機能を示すブロック図である。
【図36】第3の実施の形態の文字列認識処理の手順を示すフローチャートである。
【図37】第3の実施の形態の文字列認識処理の手順を示すフローチャートである。
【図38】第3の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図39】第3の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【図40】第3の実施の形態の項目名情報テーブルの例を示す図である。
【図41】第3の実施の形態のルールテーブルの例を示す図である。
【図42】第3の実施の形態のルールテーブルの例を示す図である。
【発明を実施するための形態】
【0016】
以下、本実施の形態について図面を参照して説明する。
〔第1の実施の形態〕
図1は、第1の実施の形態の機能を示すブロック図である。文字列認識装置1は、帳票画像等の文字列を有する画像について文字認識を行い、項目名と内容(例えば、項目値)とを取得することにより、画像に含まれる文字列を認識する文字列認識を行う。文字列認識装置1は、文字ブロック位置取得部1a、対応関係設定部1b、画像記憶部1c、対応関係記憶部1d、文字ブロック統合部1eを有する。
【0017】
文字ブロック位置取得部1aは、画像記憶部1cに記憶されている画像から、項目名文字列を示す項目名文字ブロックと、内容文字列の一部または全部を示す内容ブロックとを抽出する。ここで、文字列認識装置1で文字列認識を行う画像は、例えば、項目名を示す文字を有する項目名文字列、項目名に対応する内容を示す内容文字列を有する帳票画像等の画像である。この画像は、例えば、帳票等の文書をスキャナ等で読み取るか、直接電子ファイルで作成された帳票等の文書を画像に変換することにより作成される。
【0018】
次に、文字ブロック位置取得部1aは、判定した項目名文字ブロックとそれ以外の文字ブロック(内容文字ブロックを含む)との位置を示す位置情報を取得する。この位置情報により、項目名文字ブロックの位置および項目名文字列以外の文字ブロックの位置が特定される。この位置情報は、項目名文字ブロックの位置およびそれ以外の文字ブロックの位置を、例えば、画像上の2次元座標で示してもよい。
【0019】
対応関係設定部1bは、文字ブロック位置取得部1aにより取得した位置情報に基づいて、内容文字ブロックの位置から所定の方向に存在する項目名文字ブロックを抽出し、内容文字ブロックと抽出した項目名文字ブロックの項目名とを関連付ける。同一の項目名に関連付けられた内容文字ブロック同士は、後述する文字ブロック統合部1eにより統合される。また、対応関係設定部1bは、関連付けた結果に基づいて文字ブロック統合部1eにより得られた項目名および内容文字列ならびにこれらの対応関係を対応関係記憶部1dに記憶させる。
【0020】
画像記憶部1cは、項目名を示す文字を有する項目名文字列と、項目名に対応する文字内容を示す内容文字列とを有する画像を示す画像情報を記憶する。画像記憶部1cに記憶されている画像は、項目名および内容を有する帳票等の文書の画像である。この画像は、スキャナ等の光学式読み取り装置で取得してもよく、コンピュータ等で直接電子ファイルで作成された帳票等の文書を画像に変換することにより取得してもよい。
【0021】
対応関係記憶部1dは、項目名と内容文字ブロックとを関連付けた結果を示す対応関係情報を記憶する。この対応関係情報により、画像に含まれている項目名、内容および項目名と内容との対応関係が示される。
【0022】
文字ブロック統合部1eは、同一の項目名に関連付けられた内容文字ブロック同士を統合し、項目名に対応する内容文字列に設定する。すなわち、文字ブロック統合部1eは、対応関係設定部1bによって関連付けられた内容文字ブロックを統合して項目名に関連付けて内容文字列とする。
【0023】
なお、本実施の形態の文字列認識装置1で取得する文書に示された内容は、数値を含む任意の文字数の文字列であり、光学認識等により文字認識が可能であれば、文字と同等または所定の意味を有する任意の個数の記号の列であってもよい。
【0024】
このような文字列認識装置1によれば、画像の文字認識を行う際に、文字認識で取得した内容の文字について、項目名との位置関係に基づいて対応関係を設定する。これにより、帳票画像が有する文字列と各内容の文字列との対応関係を設定する際に、対応関係の設定の誤りの発生を抑制する。その結果、内容の文字列認識における誤認識の発生を抑制することが可能となる。
【0025】
〔第2の実施の形態〕
次に、第2の形態の詳細を説明する。第2の実施の形態は、項目名および項目値を有する帳票を取り込んだ帳票画像等の文書を示す画像について、項目名文字列を抽出し、文字認識の結果得られた文字列を項目名文字列に関連付け、帳票等の文書において項目名に対応する内容を示す項目値文字列とすることにより、項目値文字列の誤認識および項目値文字列と項目名文字列との関連付けの誤認識を抑制したものである。
【0026】
図2は、第2の実施の形態の文字列認識装置のハードウェア構成例を示す図である。文字列認識装置100は、CPU101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102と複数の周辺機器が接続されている。
【0027】
RAM102は、文字列認識装置100の主記憶装置として使用される。RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。
【0028】
バス107に接続されている周辺機器としては、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105および通信インタフェース106がある。
【0029】
HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、文字列認識装置100の二次記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、二次記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。
【0030】
グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ11の画面に表示させる。モニタ11としては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。
【0031】
入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号をCPU101に送信する。なお、マウス13は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
【0032】
通信インタフェース106は、ネットワーク10に接続されている。通信インタフェース106は、ネットワーク10を介して、他のコンピュータとの間でデータの送受信を行うことができる。
【0033】
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。
図3は、第2の実施の形態の機能を示すブロック図である。本実施の形態の文字列認識装置100は、手書き文字、活字、プリンタ等による印字等、文字認識可能である任意の字体の文字に適用可能であるものとする。文字列認識装置100は、画像取得部111、項目名文字列抽出部112、関連付け部113、関連付け検証部114、文字領域統合部115、非項目名文字列文字認識部116、画像記憶部120、項目名情報記憶部151、文字列候補記憶部152、対応関係記憶部153、ルール記憶部154を有する。
【0034】
画像取得部111は、スキャナや他のコンピュータから通信回線を介して帳票等の文書の画像情報を取得し、取得した画像情報を画像記憶部120に記憶させる。
項目名文字列抽出部112は、項目名情報を項目名情報記憶部151から読み出し、画像記憶部120に記憶されている画像から、項目名文字列情報に基づいて画像中に存在する項目名文字列を抽出する。そして、また、項目名文字列抽出部112は、項目名文字列を示す項目名文字列領域(項目名文字ブロック)を抽出する。ここで、文字列認識装置100で文字列認識を行う画像は、例えば、項目名を示す項目名文字列、項目名に対応する項目値を示す項目値文字列を有する帳票画像等の画像である。この画像は、例えば、帳票等の文書をスキャナ等で読み取るか、直接電子ファイルで作成された帳票等の文書を画像に変換することにより作成される。また、画像中の項目名文字列領域以外の領域を非項目名文字列領域とする。また、項目値は、帳票等の文書において項目名に対応する内容である。また、項目値文字列は、項目名に対応する内容を示す文字を有する文字列であり、第1の実施の形態の内容文字列と対応する。
【0035】
また、項目名文字列抽出部112は、項目名文字列領域の位置および認識結果文字列(項目値文字ブロック)の位置を示す位置情報を取得する。この位置情報により、項目名文字列領域の位置および認識結果文字列の位置が特定される。この位置情報は、項目名文字列領域の位置および認識結果文字列の位置を、例えば、画像上の2次元座標で示してもよい。また、項目値文字ブロックは、項目値文字列の一部または全部を示し、第1の実施の形態の内容文字ブロックと対応する。
【0036】
項目名文字列抽出部112は、取得した画像中のそれぞれの連結要素と外接する矩形(以下、「外接矩形」という)を作成し、重なる外接矩形同士を統合することにより、項目名文字列領域を作成する。ここで、連結要素は、特定の画素が連結している領域である。また、特定の画素は、例えば、予め設定された画素値以上の画素等の基準で抽出される画素であり、認識対象の文字列の一部を示す画素である。
【0037】
関連付け部113は、ルール記憶部154に記憶されているルールに従って、非項目名文字列文字認識部116で取得された各認識結果文字列に対し、項目名文字列抽出部112により取得した位置情報に基づいて各認識結果文字列の位置から左方向または上方向に項目名文字列抽出部112で取得された項目名文字列を探索し、探索の結果により抽出された項目名と認識結果文字列とを関連付ける。なお、これに限らず、関連付け部113は、ルール記憶部154に記憶されているルールに従って、項目名文字列抽出部112により取得された位置情報に基づいて項目名文字列領域の位置から右方向または下方向に非項目名文字列文字認識部116で取得された各認識結果文字列を探索し、項目名文字列領域の項目名文字列が示す項目名と探索の結果得られた認識結果文字列とを関連付けてもよい。
【0038】
関連付け検証部114は、ルール記憶部154から項目名文字列と項目値文字列との関連付けにおいて満たすべきルールを読み出し、関連付け部113で生成された項目名と項目値との関連付けのうち、ルールに違反する関連付けを削除する。
【0039】
文字領域統合部115は、同一の項目名に関連付けられた認識結果文字列同士を統合し、項目名に対応する項目値文字列に設定する。すなわち、文字領域統合部115は、関連付け部113によって関連付け、関連付け検証部114によって関連付けを削除せずに維持した認識結果文字列を統合して項目名に関連付ける項目値文字列とする。これにより、認識結果文字列(非項目名文字列の認識結果)が統合され、項目名に対応する項目値文字列となる。次に、文字領域統合部115は、項目名と項目値文字列との関連付けの結果を対応関係記憶部153に記憶させる。
【0040】
これにより、項目値文字列が文字列として分割されている場合にも、分割されている文字列を統合して、項目値文字列を正しく再構成することができる。例えば、帳票に示された「金額 1,100円」について、項目名文字列が“金額”と認識され、項目値文字列が“1,”と“100円”とに分割されて認識された場合、本実施の形態では、分割された項目値文字列“1,”と“100円”を再構成して“1,100円”とすることができる。
【0041】
非項目名文字列文字認識部116は、非項目名文字列領域に対して文字認識を行うことにより、項目値文字列の一部または全部を示す認識結果文字列を抽出する。このとき、非項目名文字列文字認識部116は、認識結果文字列について1文字単位で文字認識を行って認識結果文字列を1文字の文字列として取得する。なお、非項目名文字列文字認識部116は、これに限らず、認識結果文字列について、任意の方法で区分した文字列単位で文字認識を行って認識結果文字列を取得してもよい。
【0042】
画像記憶部120は、項目名を示す文字を有する項目名文字列と項目名に対応する内容を示す文字を有する項目値文字列とを有する画像を記憶する。画像記憶部120に記憶されている画像は、項目名および項目値を有する帳票等の文書の画像である。この画像は、スキャナ等の光学式読み取り装置で取得してもよく、コンピュータ等により直接電子ファイルで作成された帳票等の文書を画像に変換することにより取得してもよい。
【0043】
項目名情報記憶部151は、例えば、『氏名』、『住所』等の項目名の項目値文字列を示す情報、項目名が複数の項目値と対応する連記表であるか否かを示す情報を有する項目名文字列情報を有する項目名情報を記憶する。
【0044】
文字列候補記憶部152では、詳しくは図32および図33において後述するが、項目名文字列抽出処理において認識結果文字の文字列候補を示す情報を記憶する。
対応関係記憶部153は、文字領域統合部115の関連付けにより項目名と認識結果文字列とを関連付けた結果を示す対応関係情報を記憶する。この対応関係情報により、画像に含まれている項目名および項目値ならびに項目名と項目値との対応関係が示される。
【0045】
ルール記憶部154は、項目名と認識結果文字列との関連付けのルールを記憶する。ルール記憶部154に記憶されているルールは、例えば、1つの認識結果文字列に対応関係を有する項目名が複数存在する場合の関連付けのルール、1つの項目名に対応関係を有する認識結果文字列が複数存在する場合の関連付けのルールを含む。また、1つの項目名に1つの認識結果文字列が対応関係を有する場合において、1つの項目名に関連付け可能な認識結果文字列が複数存在するときに、認識結果文字列を複数の項目名のうちの1つの正しい項目名と関連付けて他の対応関係を削除する関連付けのルールを含む。
【0046】
また、図1に示した第1の実施の形態の機能のうち、文字ブロック位置取得部1aの機能は、項目名文字列抽出部112、非項目名文字列文字認識部116で実現されている。また、対応関係設定部1b、文字ブロック統合部1eの機能は、関連付け部113、関連付け検証部114、文字領域統合部115で実現されている。
【0047】
なお、本実施の形態の文字列認識装置100で取得する文書に示された項目値は、数値を含む任意の文字数の文字列であり、光学認識等により文字認識が可能であれば、文字と同等または所定の意味を有する任意の個数の記号の列であってもよい。
【0048】
次に、文字列認識装置100によって実行される文字列認識処理の手順を説明する。
図4は、第2の実施の形態の文字列認識処理の手順を示すフローチャートである。文字列認識処理は、帳票の画像読み取りやユーザの文字列認識処理を実行する操作に基づいて、文字列認識装置100により実行が開始される。以下、図4に示す処理をステップ番号に沿って説明する。
【0049】
〔ステップS11〕項目名文字列抽出部112は、項目名情報記憶部151に記憶されている項目名情報を取得する。
〔ステップS12〕項目名文字列抽出部112は、帳票画像等から項目名文字列を抽出する項目名文字列抽出処理(図24から図26において後述)を実行する。
【0050】
〔ステップS13〕非項目名文字列文字認識部116は、ステップS12で取得した項目名文字列領域以外の非項目名文字列領域について文字認識を行い、認識結果文字列を取得する。
【0051】
〔ステップS14〕関連付け部113は、所定の位置関係に該当するステップS12で抽出した項目名文字列とステップS13で取得した認識結果文字列とを、ルール記憶部154に記憶されているルールに基づいて関連付ける。
【0052】
〔ステップS15〕関連付け検証部114は、ステップS14における関連付けについて検証し、検証の結果正しくない関連付けを削除する。
〔ステップS16〕文字領域統合部115は、ステップS14およびステップS15による関連付けによって、同一の項目名文字列に関連付けた認識結果文字列を統合して項目値文字列とする。次に、統合した項目値文字列を、項目名文字列が示す項目名に対応する項目値として設定する。
【0053】
〔ステップS17〕文字領域統合部115は、ステップS16で設定した帳票画像の項目名と項目値との対応関係を、対応関係記憶部153に記憶させる。
図5から図8は、第2の実施の形態における第1の例の帳票画像の処理の様子を示す図である。
【0054】
図5(A)は、帳票画像の第1の例であり、項目値と項目名とが1対1に対応する帳票画像210を示す。本実施の形態の文字列認識装置100は、文字列認識処理のステップS11およびステップS12により項目名情報記憶部151に記憶されている項目名情報に基づいて帳票画像210から項目名文字列を抽出する。項目名情報は、項目名の候補を示す文字列を含む。項目名の候補を示す文字列として、例えば『名前』、『氏名』、『住所』、『お住まい』、『ふりがな』、『職業』、『年齢』等がある。
【0055】
本実施の形態では、帳票画像210について文字認識を行い、認識の結果得られた文字列と項目名情報が示す項目名の候補を示す文字列とを比較して項目名文字列を抽出する。帳票画像210から項目名文字列を抽出する方法の詳細は、図24から図34において後述する。
【0056】
図5(B)は、帳票画像210に対する項目名文字列の抽出の結果得られる項目名文字列211a,211b,211c,211dを示す。図5(B)に示す例では、帳票画像210から、『住所』、『氏名』、『職業』、『年齢』の4つの項目名文字列211a,211b,211c,211dが抽出されている。
【0057】
図6に示すように、この項目名文字列の抽出に基づいて、帳票画像210を、項目名文字列領域212a,212b,212c,212dと、項目名文字列領域212a〜212d以外の領域である非項目名文字列領域212eとに分割することが可能になる。
【0058】
本実施の形態の文字列認識装置100は、ステップS13により帳票画像210の非項目名文字列領域212eについて文字認識を行い、認識結果文字列を取得して文字列認識を行う。本実施の形態では、非項目名文字列領域212eについて、1文字単位で文字認識を行う。ここで、ステップS13における文字認識は、従来の文字認識を用いてもよく、他の文字認識方法を用いてもよい。
【0059】
ここで、図7(A)および図7(B)に従って、ステップS14およびステップS15の処理を説明する。図7(A)および図7(B)は、帳票画像210の項目名文字列領域212a,212bおよび認識結果文字列213a,213b,213c,213d,213e,213f,213g,213h,213i,213j,213k,213l,213m,213o,213p,213q,213r,213s,213tを示す。本実施の形態の文字列認識装置100は、この項目名文字列領域212a,212bおよび認識結果文字列213a〜213tに基づき、ステップS13で取得した認識結果文字列について、ステップS14により、項目名文字列との関連付けを行う。このステップS14の関連付けでは、項目名文字列が位置する項目名文字列領域と認識結果文字列の位置とが、ルール記憶部154に記憶されているルール(図22および図23において後述)が示す所定の位置関係にある場合、項目名文字列が示す項目名と認識結果文字列とが関連付けられる。図7(A)の例では、項目名文字列領域212aと認識結果文字列213a〜213p、項目名文字列領域212aと認識結果文字列213q〜213t、項目名文字列領域212bと認識結果文字列213q〜213tの3組が、ルール記憶部154に記憶されているルールが示す所定の位置関係(例えば、認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在)を満たすものとして関連付けられる。
【0060】
通常、横書きの帳票では、項目名の右、下または右下に項目値が存在するので、文字列認識装置100は、上記認識結果文字列の左、上、または左上に存在する項目名文字列領域を探索する。なお、探索する方向に関しては、これに限らず、帳票毎や項目名毎に定義してもよい。
【0061】
図7(A)の例では、認識結果文字列213q(『東』)に関しては、左、上、左上に存在する項目名文字列領域を探索すると、項目名文字列領域212a,212bの2つが発見される。これにより、認識結果文字列213qは、項目名文字列領域212a,212bに関連付けられることになる。認識結果文字列213r〜213tについても同様に、項目名文字列領域212a,212bに関連付けられる。
【0062】
次に、文字列認識装置100は、ステップS15により項目名文字列と認識結果文字列との関連付けの検証および削除を行う。このステップS15の関連付けの検証および削除では、関連付けられた項目名文字列と認識結果文字列とが、ルール記憶部154に記憶されているルールに違反するか等に基づいて、関連付けが正しいか否かについて検証される。そして、検証の結果に基づき、ステップS14で関連付けられた、関連付けが正しくない項目名と認識結果文字列との関連付けが削除される。図7(A)に示すように、認識結果文字列213qは、ステップS14により項目名文字列領域212aおよび項目名文字列領域212bと関連付けられている。これに対し、ステップS15では、図7(B)に示すように、ルール記憶部154に記憶されているルール(例えば、認識結果文字列の中心の左方に項目名文字列領域が存在する場合、認識結果文字列の中心の左上方の項目名文字列への関連付けは削除)に基づいて、認識結果文字列213qと項目名文字列領域212aとの関連付けが削除される。認識結果文字列213r〜213tについても同様に、項目名文字列領域212aとの関連付けが削除される。このようにして、正しくない関連付けが削除され、正しい関連付けのみが維持される。
【0063】
ここで、ルール記憶部154に記憶されているルールとして、例えば、次の例が挙げられる。
例1:認識結果文字列の左方向、若しくは、上方向に項目名文字列領域が存在した場合、左上方向にある項目名文字列領域は無視する。
【0064】
例2:認識結果文字列が複数の項目名文字列と関連付けられた場合は、最も近いもの1つに絞る。
例3:認識結果文字列と項目名文字列領域との距離は、所定の値以下でなければならない。
【0065】
例4:認識結果文字列と項目名文字列との関連付けはセル罫線を跨いではいけない。
これらのルールは、帳票や、項目名によって任意に設定される。このルールを増やし、柔軟に組み合わせることで、様々な形式の帳票に対応することが可能になる。
【0066】
上記の例では、ステップS14の関連付けにより認識結果文字列213q〜213t(『東』、『京』、『太』、『郎』)を構成する各文字は2つの項目名文字列領域212a,212bに関連付けられている。これに、ステップS15の関連付けの検証により、上記の例1のルールが適用されると、項目名文字列領域212aへの関連付けは削除され、項目名文字列領域212bへの関連付けのみが維持される。
【0067】
次に、文字列認識装置100は、ステップS16により同一の項目名文字列に関連付けられた認識結果文字列を統合して項目値文字列とし、項目名と項目値との対応関係を設定する。具体的には、帳票画像210の項目名文字列211aに関連付けられた図7(A)に示す認識結果文字列213a〜213pが有する各文字を統合して、図8(A)に示すように項目値文字列215aとする。また、項目名文字列211aで示される項目名と項目値文字列215aで示される項目値とに対応関係を設定する。同様に、項目名文字列211bに関連付けられた図7(A)に示す認識結果文字列213q〜213tが有する各文字を統合して項目値文字列215bとする。また、項目名文字列211bで示される項目名と項目値文字列215bで示される項目値とに対応関係を設定する。
【0068】
以上のように、本実施の形態では、項目値文字列について1文字単位で文字認識を行い、1文字単位で項目名文字列と関連付ける。しかし、非項目名文字列領域に対する文字認識の結果、認識結果文字列が項目値文字列の通りに認識される場合もあれば、認識ミスにより認識結果文字列が本来の項目値文字列に比較して過剰に分割されている場合も生じ得る。本実施の形態では、認識結果文字列が項目値文字列よりも分割されて認識された場合にも正しい項目値文字列を得ることができる。具体的には、図8(B)に示すように、ステップS13において認識結果文字列216a,216b,216c,216d,216e,216f,216q,216r,216s,216tの1個または複数の文字を有する文字列が混在して得られたものとする。この場合、これらの認識結果文字列216a,216b,216c,216d,216e,216f,216q,216r,216s,216tについても、ステップS14からステップS17において1文字単位の文字認識の場合と同様に処理されることとなる。
【0069】
例えば、ステップS14により、図8(B)に示した項目値文字列216a(『神』)は、項目名文字列領域212aに関連付けられる。また、項目値文字列216b(『奈川』)は、項目名文字列領域212aに関連付けられる。以下同様に、項目値文字列216c〜216fは、項目名文字列領域212aに関連付けられる。また、項目値文字列216q〜216tは、項目名文字列領域212bに関連付けられる。
【0070】
図8(B)の例に従って、ステップS15において不要な関連付けが削除された後の関連付けの結果を以下に示す。
項目名文字列領域212aへの関連付け:認識結果文字列216a(『神』)、認識結果文字列216b(『奈川』)、認識結果文字列216c(『県』)、認識結果文字列216d(『川崎市』)、認識結果文字列216e(『小山』)、認識結果文字列216f(『1−23−4』)
項目名文字列領域212bへの関連付け:認識結果文字列216q(『東』)、認識結果文字列216r(『京』)、認識結果文字列216s(『太』)、認識結果文字列216t(『郎』)
次にステップS16により、同一の項目名文字列に関連付けられた認識結果文字列が統合され、項目値文字列とされる。
【0071】
本実施の形態によれば、項目名文字列の位置関係に基づいて、先に項目名文字列を認識し、次に非項目名文字列領域に対して文字認識を行う。次に、項目名文字列の位置関係に基づいて認識結果文字列を統合する事により、項目値文字列を取得している。これにより、文字認識のミスによって認識結果文字列が過剰に分割された場合でも、統合することにより正しい項目値文字列を得ることができる。
【0072】
また、以上により、本実施の形態は、例えば、帳票に罫線の存在しない場合における項目値の文字列領域の検出においても有効である。すなわち、罫線がない帳票の文字列認識を行う場合、レイアウト解析により、先に帳票上のすべての文字列領域を検出する場合がある。この場合、上記項目値文字列は、図8(B)の認識結果文字列216a〜216f(『神』、『奈川』、『県』、『川崎市』、『小山』、『1−23−4』)のように分離される可能性が存在する。仮に、このような項目値文字列が分離して認識された結果が得られた場合、項目名と項目値との対応付けに失敗することになる。
【0073】
これに対して、本実施の形態によれば、文字列認識に罫線を必要としないので、罫線がなく、上記のように項目値文字列が分離して認識される可能性がある場合にも上記項目値文字列について一体として認識することができる。
【0074】
図9は、第2の実施の形態により第1の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。図9に示す対応関係テーブル153aは、本実施の形態の文字列認識装置100による帳票画像210に対する文字列認識処理の実行の結果得られる項目名と項目値との対応関係を示す情報を記憶するテーブルである。対応関係テーブル153aは、対応関係記憶部153に記憶されている。対応関係テーブル153aには、“項目名”フィールド、“項目値”フィールドが設けられている。図9の例では、各フィールドの横方向に並べられた情報同士について対応関係が設定されている。
【0075】
“項目名”フィールドには、帳票画像210から取得した項目名が設定される。“項目値”フィールドには、帳票画像210から取得した項目値が設定される。図9の対応関係テーブル153aでは、帳票画像210に基づいて、項目名と項目値とが1対1の対応関係を有するように設定される。
【0076】
図10から図12は、第2の実施の形態における第2の例の帳票画像の処理の様子を示す図である。
図5から図9において前述した帳票画像210は、項目名と項目値が1対1の対応関係を有していたが、本実施の形態は、例えば、2次元表のように1つの項目値に2の項目名が属するような、項目値と項目名とが1対多の対応関係を有する場合についても適用可能である。例えば、図10に示す2次元の無罫線表の帳票画像220を例に挙げて説明する。
【0077】
図10に示す帳票画像220は、帳票画像の第2の例であり、上部に項目名文字列221a,221b,221cを有し、左側に項目名文字列221d,221e,221fを有する。また、項目名文字列221a,221b,221cのうちのいずれか1つと項目名文字列221d,221e,221fのうちのいずれか1つとが交差する領域に、項目値文字列222を有する。
【0078】
本実施の形態の文字列認識装置100は、帳票画像220についても帳票画像210と同様に、文字列認識処理を実行する。このとき、文字列認識装置100は、図11に示すように、ステップS13で認識結果文字列224a,224b,224c,224d,224e,224f,224g,224h,224i,224jを取得する。次に、文字列認識装置100は、ステップS14により、項目名文字列領域223a,223e,223f等の各項目名文字列領域との位置関係に基づいて、項目名と認識結果文字列との関連付けを行う。図11の例では、このステップS14の関連付けにより、ルール記憶部154に記憶されているルールに基づいて、項目名文字列領域223aと認識結果文字列224a〜224h、項目名文字列領域223eと認識結果文字列224a〜224h、項目名文字列領域223aと認識結果文字列224i,224j、項目名文字列領域223eと認識結果文字列224i,224j、項目名文字列領域223fと認識結果文字列224i,224jの5組が関連付けられたものとする。
【0079】
次に、文字列認識装置100は、ステップS15により、ルール記憶部154に記憶されているルールに基づいて、項目名文字列と認識結果文字列との関連付けの検証および削除を行う。図12の例では、図11の例の関連付けの検証結果に基づいて、項目名文字列領域223eと認識結果文字列224i,224jの関連付けが削除されている。また、項目名文字列領域223aと認識結果文字列224a〜224h、項目名文字列領域223aと認識結果文字列224i,224j、項目名文字列領域223eと認識結果文字列224a〜224h、項目名文字列領域223fと認識結果文字列224i,224jの関連付けは維持されている。この後、ステップS16により、同一の項目名文字列に関連付けられた認識結果文字列ごとに統合し、項目名に対応する項目値文字列を取得する。
【0080】
図13は、第2の実施の形態により第2の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。図13に示す対応関係テーブル153bは、図9において前述した対応関係テーブル153aと同様、本実施の形態の文字列認識装置100による帳票画像220に対する文字列認識処理の実行の結果得られる項目名と項目値との対応関係を示す情報を記憶するテーブルである。対応関係テーブル153bは、対応関係記憶部153に記憶されている。対応関係テーブル153bには、“項目名”フィールド、“項目値”フィールドが設けられている。図13の例では、各フィールドの横方向に並べられた情報同士について対応関係が設定されている。
【0081】
対応関係テーブル153bの“項目名”フィールドには、2次元表である帳票画像220から取得した各列の項目名(項目名文字列221a〜221c)と各行の項目名(項目名文字列221d〜221e)のそれぞれを組み合わせた項目名が設定される。
【0082】
対応関係テーブル153bの“項目値”フィールドには、2次元表である帳票画像220から取得した各列の項目名と各行の行列成分であり、項目名のそれぞれを組み合わせた項目名に対応する項目値が設定される。
【0083】
本実施の形態では、以上のようにして対応関係テーブル153bに項目名と項目値との間で1対1の対応関係を設定することができる。
図14から図16は、第2の実施の形態における第3の例の帳票画像の処理の様子を示す図である。
【0084】
また、本実施の形態は、例えば、1つの項目名に複数の項目値が属するような、項目値と項目名とが多対1の対応関係を有する場合についても適用可能である。また、本実施の形態は、罫線を有する表については、罫線を利用して文字列認識を行うこともできる。例えば、図14に示す罫線を有する表の帳票画像230を例に挙げて説明する。
【0085】
図14に、帳票画像の第3の例であり、項目名と項目値とが1対多に対応する帳票画像230を示す。本実施の形態の文字列認識装置100は、上記の例と同様、文字列認識処理のステップS11およびステップS12により項目名情報記憶部151に記憶されている項目名情報に基づいて帳票画像230から項目名文字列を抽出する。
【0086】
図15は、帳票画像230に対する項目名文字列の抽出の結果得られる項目名文字列231a,231b,231c,231d,231e,231f,231gを示す。図15に示す例では、帳票画像230から、『記入年月日』、『申込者』、『銀行名』、『支店名』、『口座種別』、『口座番号』、『振込み金額』の7つの項目名文字列231a,231b,231c,231d,231e,231f,231gが抽出されている。本実施の形態の文字列認識装置100は、この項目名文字列の抽出に基づいて、帳票画像230を、上記の例と同様に、項目名文字列領域と非項目名文字列領域とに分割する。
【0087】
次に、図16に示すように、本実施の形態の文字列認識装置100は、帳票画像230の非項目名文字列領域について文字認識を行って認識結果文字列232a1,232a2,232a3,232a4,232a5,232a6,232a7,232a8,232a9,232a10,232a11,232b1,232b2,232b3,232b4,232c1,232c2,232c3,232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3を取得する。ここで、本実施の形態の文字列認識装置100は、後述するルールに基づき、文字認識の際に、帳票の罫線で囲まれたセルの内部に存在する文字は1つの文字列と認識することができる。具体的には、認識結果文字列232c1(『A銀行』)は、セルの内部に存在するので1つの文字列と認識される。従って、同様にセルの内部に存在する認識結果文字列232c2(『B銀行』)、認識結果文字列232c3(『C銀行』)は、それぞれ1つの文字列と認識される。また、認識結果文字列232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3についても同様に、それぞれが1つの文字列として認識される。
【0088】
次に、文字列認識装置100は、ルール記憶部154に記憶されているルールに従って、項目名文字列231a〜231gと認識結果文字列232a1〜232g3との関連付けを行う。次に、文字列認識装置100は、項目名文字列と認識結果文字列との関連付けの検証および削除を行う。これにより、項目名と項目値との対応関係が設定される。
【0089】
図16の例では、関連付けおよび検証の結果、項目名文字列231aと認識結果文字列232a1〜232a11、項目名文字列231bと認識結果文字列232b1〜232b4、項目名文字列231cと認識結果文字列232c1〜232c3、項目名文字列231dと認識結果文字列232d1〜232d3、項目名文字列231eと認識結果文字列232e1〜232e3、項目名文字列231fと認識結果文字列232f1〜232f3、項目名文字列231gと認識結果文字列232g1〜232g3の7組が関連付けられる。これに従い、関連付けられた項目名文字列と項目値文字列と間で、項目名と項目値との対応関係が設定される。
【0090】
具体的には、認識結果文字列232c1〜232c3は、項目名文字列231c(『銀行名』)に関連付けられる。そして、認識結果文字列232c1〜232c3は、同一の項目名文字列231cに関連付けられているので1つに統合され、項目名文字列231c(『銀行名』)に対応する項目値『A銀行(改行)B銀行(改行)C銀行』となる。また、認識結果文字列232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3についても同様に、それぞれ項目名文字列231d,231e,231f,231gに関連付けられる。そして、認識結果文字列232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3は、それぞれ関連付けられた同一の項目名文字列ごとに統合され、それぞれ項目名文字列231d,231e,231f,231gに対応する項目値となる。
【0091】
図17は、第2の実施の形態により第3の例の帳票画像を処理して得られた対応関係テーブルの例を示す図である。図17に示す対応関係テーブル153cは、上記の例と同様、本実施の形態の文字列認識装置100による帳票画像230に対する文字列認識処理の実行の結果得られる項目名と項目値との対応関係を示す情報を記憶するテーブルである。対応関係テーブル153cは、対応関係記憶部153に記憶されている。対応関係テーブル153cには、“項目名”フィールド、“項目値”フィールドが設けられている。図17の例では、各フィールドの横方向に並べられた情報同士について対応関係が設定されている。
【0092】
対応関係テーブル153cの“項目名”フィールドには、帳票画像230から取得した項目名(項目名文字列231a〜231g)が設定される。また、“項目値”フィールドには、帳票画像230から取得した項目値(認識結果文字列232a1〜232g3)が設定される。また、対応関係テーブル153cに示すように、本実施の形態では、帳票画像230が有する1の項目名と複数の項目値との対応関係(例えば、項目名『銀行名』に対して項目値『A銀行』、『B銀行』、『C銀行』等)を設定することができる。
【0093】
次に、項目名と項目値との関連付けについて説明する。
図18および図19は、第2の実施の形態における第3の例の帳票画像における関連付けの様子を示す図である。本実施の形態の文字列認識装置100は、上記のように帳票画像から項目名と項目値とを抽出し、上記の関連付けにより、抽出した項目名と認識結果文字列との対応関係を設定する。この関連付けは、ステップS14においてルール記憶部154に記憶されているルールに従って行われる。
【0094】
ここで、関連付けのルールの一例を示す。
・認識結果文字の上方または左方に項目名文字列領域が存在する場合は、その認識結果文字と項目名を関連付ける。ここで、上方または左方とは、その認識結果文字列の中心座標の上方向または左方向に項目名文字列の外接矩形が存在するかどうかで判定する。
・項目名文字列が表のセルに入っている場合は、そのセル枠を項目名文字列の外接矩形と見なす。
【0095】
上記のルールについて、図18に示す帳票画像230の項目名文字列231b(『申込者』)と認識結果文字232b1(『田』)との関連付けを例として説明する。
図18に示すように、上記ルールに従って認識結果文字列232b1の中心234b1から、左方および上方を探索すると、左方に項目名文字列231bの外接矩形233が存在するので、帳票画像230の項目名文字列231bと認識結果文字列232b1との関連付けが行われる。認識結果文字列232a1〜232a11,232b2〜232b4についても同様に、上記のルールに従って関連付けが行われる。
【0096】
次に、帳票の項目名文字列が表のセルに入っている場合の関連付けの上記のルールについて図19に従って説明する。
図19に示すように、帳票画像230の項目名文字列231c(『銀行名』)は、セル枠236に囲まれているものとする。この場合、上記ルールに従って認識結果文字列232c1(『A銀行』)の中心237c1から、左方および上方を探索すると、左方に項目名文字列231cのセル枠236が存在する。ここで、上記ルールに従い、セル枠236を項目名文字列231の外接矩形と見なす。これに基づいて、認識結果文字列の中心座標の上方向または左方向に項目名文字列の外接矩形が存在すると判定されることにより、帳票画像230の項目名文字列231cと認識結果文字列232c1との関連付けが行われる。また、認識結果文字列232c2,232c3,232d1〜232d3,232e1〜232e3,232f1〜232f3,232g1〜232g3についても同様に、上記のルールに従って関連付けが行われる。
【0097】
次に、帳票に項目名と項目値とが多対多で対応するものを含む場合の関連付けのルールについて説明する。
図20は、第2の実施の形態における第4の例の帳票画像における関連付けの様子を示す図である。図20は、帳票画像の第4の例であり、項目値と項目名とが多対多で対応するものを含む帳票画像240を示す。図20では、上記のルールに従って1対1で対応する項目名文字列241aと認識結果文字列242aの各文字、項目名文字列241bと認識結果文字列242bの各文字が関連付けられる。
【0098】
これに対し、認識結果文字列242cの項目値の左方には、項目名文字列241bが存在し、上方には項目名文字列241cが存在するので、上記のルールのみではいずれの項目名文字列と関連付けるべきか判定することができない。また、認識結果文字列242d,242eについても、同様に、左方には、項目名文字列241dが存在し、上方には項目名文字列241eが存在するので、上記のルールのみではいずれの項目名文字列と関連付けるべきか判定することができない。
【0099】
帳票画像240のように、多対多の対応関係を有する項目名と項目値とを有する帳票の文字列認識を行う場合、本実施の形態では、上記のルールに加えて、例えば以下のルールを追加することにより対応することができる。
・認識結果文字列の左方、上方、左上方のうちの異なる2方向に項目名文字列領域が存在することによりそれぞれの項目名文字列領域と関連付けられた場合であって、関連付けられた項目名が連記表に用いられる項目名であるときには、認識結果文字列と2つの項目名との関連付けは共に維持される。
・認識結果文字列の左方、上方、左上方のうちの異なる2方向に項目名文字列領域が存在することによりそれぞれの項目名文字列領域と関連付けられた場合であって、関連付けられた項目名が連記表に用いられない項目名であるときには、関連付けられた2つの項目名のうち、項目名と項目値との位置が近い関連付けのみを維持し、他方の関連付けを削除する。
【0100】
本実施の形態では、これらの追加するルールにより、認識結果文字列242cは、項目名文字列241bとの関連付けが削除され、項目名文字列241cとの関連付けが維持される。また、認識結果文字列242d,242eは、それぞれ項目名文字列241dとの関連付けおよび項目名文字列241eとの関連付けが共に維持される。
【0101】
なお、上記のルールおよび追加するルールは、あくまでも一例であり、本実施の形態の関連付けのルールは、帳票のフォーマットに応じて適宜設定することができる。
図21は、第2の実施の形態の項目名情報テーブルの例を示す図である。図21に示す項目名情報テーブル151aは、本実施の形態の文字列認識装置100による文字列認識処理を実行する際に適用される項目名情報を記憶するテーブルである。項目名情報テーブル151aは、項目名情報記憶部151に記憶されている。項目名情報テーブル151aには、“項目名番号”フィールド、“項目名文字列”フィールド、“連記表”フィールドが設けられている。各項目の横方向に並べられた情報同士が項目名情報として互いに関連付けられている。
【0102】
“項目名番号”フィールドには、各項目名を一意に特定可能に割り当てられた符号である項目名番号が設定される。“項目名文字列”フィールドには、帳票画像240等に使用される可能性がある項目名文字列が設定される。本実施の形態では、詳しくは図24から図34において後述するが、この項目名文字列フィールドに設定された項目名文字列を用いて項目名文字列の抽出を行う。“連記表”フィールドには、項目名番号で特定された項目名が複数の項目値と対応関係を有する連記表として使用される場合があるか否かを示す情報が設定される。項目名が連記表として使用される場合があれば、“連記表”フィールドに“有”が設定される。項目名が連記表として使用される場合がなければ、“連記表”フィールドに“無”が設定される。
【0103】
図22および図23は、第2の実施の形態のルールテーブルの例を示す図である。図22に示すルールテーブル154a、図23に示すルールテーブル154bは、本実施の形態の文字列認識装置100による文字列認識処理を実行する際に適用されるルールを記憶するテーブルである。ルールテーブル154a,154bは、ルール記憶部154に記憶されている。
【0104】
図22に示すルールテーブル154aには、“ルール”フィールド、“ルール内容”フィールドが設けられている。“ルール”フィールドには、ルールを特定可能な符号が設定される。“ルール内容”フィールドには、ルールの内容を定義する情報が設定される。説明の便宜上、“ルール”フィールドのルールは日本語により記述するが、これに限らず、コンピュータ言語やフラグ、データ、論理式等、文字列認識装置100においてルールに基づく関連付けに必要な処理を実行可能な形式で定義された情報を設定することができる。
【0105】
図22に示す以下のルールは、一般的な帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
[関連付けルール1]認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、認識結果文字列と項目名とを関連付ける。
【0106】
[関連付けルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
[関連付けルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、認識結果文字列に最も近い項目名文字列の関連付けのみ残す。
【0107】
[妥当性ルール1]認識結果文字列の中心の上方または左方に項目名文字列が存在する場合であって、認識結果文字列の中心の左上方に存在する他の項目名文字列への関連付けがあるとき、認識結果文字列の中心の左上方に存在する他の項目名文字列への関連付けは削除する。
【0108】
また、本実施の形態の関連付けのルールの別の例を示す。
図23に示すルールテーブル154bには、“適用範囲”フィールド、“ルール”フィールド、“ルール内容”フィールドが設けられている。“適用範囲”フィールドには、ルールが適用される項目名の範囲を示す情報が設定される。説明の便宜上、“ルール”フィールドと同様に“適用範囲”フィールドの適用範囲は日本語により記述するが、これに限らず、コンピュータ言語やフラグ、データ、論理式等、文字列認識装置100においてルールが適用される項目値の範囲の選択に必要な処理を実行可能な形式で定義された情報を設定することができる。
【0109】
図23に示す以下のルールは、連記表である項目を含む可能性があると共に、罫線を有する可能性があり、さらに2次元表である可能性がある帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
【0110】
・項目名の連記表が“有”
[ルール1]認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、認識結果文字列と項目名文字列とを関連付ける。
【0111】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
[ルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、認識結果文字列に最も近い項目名文字列の関連付けのみ残す。
【0112】
・項目名の連記表が“無”
[ルール1]認識結果文字列の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、認識結果文字列と項目名文字列とを関連付ける。
【0113】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
なお、本実施の形態では、関連付けにおいて帳票のフォーマットに応じた任意のルールを設定することができる。
【0114】
次に、本実施の形態において帳票画像の項目名文字列領域を特定するために項目名を抽出する項目名文字列抽出処理について説明する。
図24から図26は、第2の実施の形態の項目名文字列抽出処理の手順を示すフローチャートである。項目名文字列抽出処理は、本実施の形態の文字列認識処理による呼び出しに基づいて文字列認識装置100により実行される。以下、図24から図26に示す処理をステップ番号に沿って説明する。
【0115】
〔ステップS21〕項目名文字列抽出部112は、項目名情報記憶部151から項目名情報に設定されているすべての項目名文字列を読み出す。読み出された項目名文字列は、ステップS28で、ステップS27における項目名文字列の文字認識の検証に使用される。
【0116】
〔ステップS22〕項目名文字列抽出部112は、帳票画像に対して連結要素解析を行い、連結要素を取得する。これにより、帳票画像の文字列の各文字について、文字の一部または全部であって形状が1つに連結されている要素である連結要素に分解される。
【0117】
〔ステップS23〕項目名文字列抽出部112は、ステップS22で取得した連結要素を組み合わせることにより、連結要素を統合して統合矩形を作成する。
〔ステップS24〕項目名文字列抽出部112は、ステップS23で作成した統合矩形のうち、未選択の統合矩形を1つ選択する。
【0118】
〔ステップS25〕項目名文字列抽出部112は、ステップS24で選択した統合矩形と、その統合矩形の周辺の統合矩形とを統合して、周辺統合矩形を生成する。
〔ステップS26〕項目名文字列抽出部112は、ステップS25で生成した周辺統合矩形のうち、未選択の周辺統合矩形を1つ選択する。
【0119】
〔ステップS27〕項目名文字列抽出部112は、ステップS26で選択した周辺統合矩形について文字認識を行い、認識結果文字を取得する。
〔ステップS28〕項目名文字列抽出部112は、ステップS27で取得した認識結果文字がステップS21で読み出した項目名文字列に含まれるか否かを判定する。認識結果文字が項目名文字列に含まれていれば、処理はステップS29に進められる。一方、認識結果文字が項目名文字列に含まれていなければ、処理はステップS31(図25)に進められる。
【0120】
〔ステップS29〕項目名文字列抽出部112は、ステップS27で取得した認識結果文字および認識結果文字の座標を記憶する。記憶された認識結果文字は、項目名文字列の候補の文字である文字候補となる。
【0121】
〔ステップS31〕項目名文字列抽出部112は、ステップS25で生成した周辺統合矩形のうち、所定の大きさ以下のすべての周辺統合矩形について選択済であるか否かを判定する。所定の大きさ以下のすべての周辺統合矩形について選択済であれば、処理はステップS32に進められる。一方、所定の大きさ以下の周辺統合矩形に選択されていないものがあれば、処理はステップS26(図24)に進められる。
【0122】
〔ステップS32〕項目名文字列抽出部112は、ステップS23で生成したすべての統合矩形について選択済であるか否かを判定する。すべての統合矩形について選択済であれば、処理はステップS32に進められる。一方、統合矩形に選択されていないものがあれば、処理はステップS24(図24)に進められる。
【0123】
〔ステップS33〕項目名文字列抽出部112は、探索する項目名文字列を1つ選択する。
〔ステップS34〕項目名文字列抽出部112は、認識結果文字からステップS33で選択された項目名文字列が有する文字を候補文字として抽出し、抽出した候補文字を行および列の項目とした文字列候補テーブルを作成する。このとき、文字列候補テーブルの各値には、初期値として“0”を設定する。
【0124】
〔ステップS35〕項目名文字列抽出部112は、文字列候補テーブルに項目名文字列の一部となる可能性がある組み合わせを設定する。
〔ステップS36〕項目名文字列抽出部112は、文字列候補テーブルに基づいて、ステップS33で抽出した候補文字同士を結んだ文字列候補対応関係グラフの最大クリークを探索する。
【0125】
〔ステップS37〕項目名文字列抽出部112は、ステップS36で探索した最大クリークの文字数と項目名文字列の文字数とからマッチング率Mを算出する。マッチング率Mは、最大クリークの文字数を、選択した項目名情報に示されている項目名文字列の文字数で割って算出される比率である。
【0126】
〔ステップS41〕項目名文字列抽出部112は、ステップS37で算出したマッチング率Mと所定の閾値αとを比較して、マッチング率Mが閾値α以上であるか否かを判定する。マッチング率Mが閾値α以上であれば、処理はステップS42に進められる。一方、マッチング率Mが閾値α未満であれば、処理はステップS43に進められる。閾値αは、例えば、帳票画像のフォーマット(例えば、項目名の種類や配置)や認識される文字の種類(例えば、文字を含むかまたは数字のみか、日本語文字を含むかまたは英字のみか、手書き文字か印字文字か)等の帳票の条件に応じて設定する。
【0127】
〔ステップS42〕項目名文字列抽出部112は、ステップS33で選択した項目名文字列および項目名文字列の座標を記憶する。記憶された項目名文字列および座標に基づいて帳票画像の項目名文字列領域が設定される。
【0128】
〔ステップS43〕項目名文字列抽出部112は、ステップS21で読み出したすべての項目名文字列について選択済であるか否かを判定する。すべての項目名文字列について選択済であれば、処理は復帰する。一方、項目名文字列に選択されていないものがあれば、処理はステップS33(図25)に進められる。
【0129】
図27から図31は、第2の実施の形態における項目名文字列の抽出の処理の様子を示す図である。
図27(A)は、帳票画像の第5の例である帳票画像250を示す。帳票画像250に基づいて本実施の形態における項目名文字列の処理について説明する。
【0130】
本実施の形態の文字列認識装置100は、項目名文字列抽出処理のステップS21で項目名文字列を読み出す。次に、文字列認識装置100は、例えば、図27(B)の連結要素251aのように、ステップS22で連結要素解析を行い、帳票画像250が有するすべての文字列を分解して連結要素を抽出する。また、この連結要素を内部に含む長方形であって面積が最小となるものの外周を外接矩形(例えば、外接矩形251b1,251b2)とする。例えば、連結要素251aの外接矩形は251b1となる。次に、文字列認識装置100は、例えば、外接矩形251b1,251b2のように、ステップS23で連結要素の外接矩形であって互いに重なり合っているものを統合して統合矩形(例えば、図27(C)の統合矩形252)を生成する。
【0131】
次に、文字列認識装置100は、ステップS24で統合矩形のうちの1つを選択する。図28は、帳票画像250が有する文字の“株”の一部である「木偏」である選択統合矩形253が選択された場合の例を示す図である。次に、文字列認識装置100は、ステップS25で、選択した統合矩形の周辺(例えば、選択統合矩形253から所定範囲253a)に存在する他の統合矩形を0個以上組合せてそれらを統合し、周辺統合矩形を作成する。所定範囲253aは、帳票の文字の大きさ等に基づいて任意に設定することができる。
【0132】
次に、文字列認識装置100は、作成された統合矩形のうち、所定の大きさ以下の全ての統合矩形に対し、ステップS27で文字認識を行う。
次に、文字列認識装置100は、ステップS28で文字認識の結果得られた認識結果文字が、探索している項目名文字列の中に存在するか否かを判定する。判定の結果、認識結果文字が探索している項目名文字列に存在する場合は、文字列認識装置100は、ステップS29でその認識結果文字と座標とを記憶する。例えば、探索中の項目名が「商品番号」「貴社受付番号」「日付」の場合であって、認識結果文字が“株”であった場合、“株”は、いずれの項目名文字列にも含まれていないので、記憶されない。
【0133】
また、本実施の形態では、認識結果文字が重複した場合も認識結果文字は記録されない。例えば、ステップS23で帳票画像250が有する文字“社”の連結要素“ネ”が選択され、選択された連結要素“ネ”をその右方に隣接する連結要素“土”と統合した結果、認識結果文字“社”が得られたものとする。その後、ステップS23で連結要素“土”が選択され、選択された連結要素“土”の左方に隣接する連結要素“ネ”を統合しても認識結果文字“社”が得られる。この場合、同一の文字が2重に認識されることを防止するために、後者の認識結果文字は記憶しない。この重複の排除は、例えば、認識結果文字列の中心の座標をチェックし、中心が同一のものは記憶しないことにより実現してもよい。また、他の任意の方法で重複を排除してもよい。
【0134】
以上の項目名文字列抽出処理における文字認識について図28から図30に従って説明する。図28に示した選択統合矩形253を、所定範囲253aの連結要素と統合する場合、図29(A)に示す周辺統合矩形254a、図29(B)に示す周辺統合矩形254b、図30(A)に示す周辺統合矩形254c、図30(B)に示す周辺統合矩形254dの4種類の周辺統合矩形が生成可能である。
【0135】
本実施の形態の文字列認識装置100は、これらの周辺統合矩形254a〜254dについて文字認識を行う。ここで、以下の例を用いて具体的に説明する。例えば、探索中の項目名が「商品番号」「貴社受付番号」「日付」の場合であるものとする。また、周辺統合矩形254aは、選択統合矩形253の「木偏」を単独で統合矩形としたものであり、文字認識の結果、認識結果文字255a“木”が取得されたものとする。周辺統合矩形254bは、選択統合矩形253および左に隣接する“A”を統合して統合矩形としたものであり、文字認識の結果、認識結果文字255b“州”が取得されたものとする。周辺統合矩形254cは、選択統合矩形253および右に隣接する“朱”を統合して統合矩形としたものであり、文字認識の結果、認識結果文字255c“株”が取得されたものとする。周辺統合矩形254dは、選択統合矩形253および下に隣接する「“貴”の上側部分」を統合して統合矩形としたものであり、文字認識の結果、認識結果文字255d“塗”が取得されたものとする。
【0136】
この場合、周辺統合矩形254a〜254dのそれぞれから得られた認識結果文字255a〜255d(“木”、“州”、“株”、“塗”)は、探索中の項目名が有する文字「商品番号」「貴社受付番号」「日付」のいずれとも一致しない。従って、認識結果文字255a〜255dはいずれも記憶されない。
【0137】
次に、文字列認識装置100は、ステップS31で所定の大きさ以下のすべての周辺統合矩形が選択済になるまで、ステップS26からステップS29の処理を繰り返す。次に、文字列認識装置100は、ステップS32ですべての統合矩形が選択済になるまで、ステップS24からステップS31の処理を繰り返す。図27の例では、帳票画像250が有する“A”、“木”、“朱”、“式”、“会”の上側部分、“会”の下側部分、“ネ”、“土”のすべての連結要素について処理が繰り返される。
【0138】
本実施の形態では、このようにして取得される認識結果文字について、以下に示すように、ステップS33からステップS42の処理を繰り返して項目名文字列毎に探索を行う。
【0139】
図31に帳票画像250から項目名文字列「貴社受付番号」を探索する場合の例を示す。本実施の形態の文字列認識装置100は、ステップS33で項目名情報記憶部151に記憶されている項目名情報に設定されている項目名文字列から、探索する項目名文字列を1つ選択する。ここでは、項目名文字列「貴社受付番号」が選択されたものとする。これに基づいて、文字列認識装置100は、ステップS34で帳票画像250が有する文字列から項目名文字列「貴社受付番号」の各文字と一致する認識結果文字(a)〜(g)を抽出し、抽出した文字により文字列候補テーブル(図32において後述)を作成する。
【0140】
ここで、図31の帳票画像250における“受”は、ステップS27において例えば“愛”と誤認識されると共に、ステップS28で各項目名文字列が有するいずれの文字と一致しないと判定されたため記憶されなかったものとする。このように項目名の抽出において文字認識で誤認識があった場合でも、本実施の形態は項目名を抽出可能である。
【0141】
図32および図33は、第2の実施の形態の文字列候補テーブルの例を示す図である。図32に示す文字列候補テーブル152aおよび図33に示す文字列候補テーブル152bは、本実施の形態の文字列認識装置100による項目名文字列抽出処理において認識結果文字の文字列候補を示す情報を記憶するテーブルである。文字列候補テーブル152a,152bは、文字列候補記憶部152に記憶されている。
【0142】
文字列候補テーブル152a,152bには、行および列の項目として、ステップS33で選択された項目名文字列に含まれている認識結果文字(例えば、認識結果文字(a)〜(g))が文字列候補として設定されている。本実施の形態の文字列認識装置100では、選択した項目名文字列と一致する認識結果文字を項目としてステップS34において図32に示す初期状態の文字列候補テーブル152aを作成する。
【0143】
また、文字列候補テーブル152a,152bには、項目名文字列における文字列候補同士の前後の関連を示す値が設定される。以下に、文字列候補テーブル152a,152bに値が設定される際の設定条件について示す。項目名文字列において、ある認識結果文字以降に他の認識結果文字が存在していれば、ある認識結果文字の行であって他の認識結果文字の列の値に、“1”が設定される。項目名文字列において、ある認識結果文字以降に他の認識結果文字が存在しなければ、ある認識結果文字の行であって他の認識結果文字の列の値に、“0”が設定される。また、ある認識結果文字と他の認識結果文字とが同一の行に存在しない場合には、前述の条件を満たしていても値に“0”が設定される。
【0144】
具体的には、項目名文字列が「貴社受付番号」であって、ある認識結果文字が認識結果文字列(a)“貴”であり、他の認識結果文字が認識結果文字列(b)“社”である場合、「貴社受付番号」において認識結果文字列(a)“貴”の次に認識結果文字列(b)“社”が存在するので、対応する値に“1”が設定される。一方、ある認識結果文字が認識結果文字列(d)“番”であり、他の認識結果文字が認識結果文字列(a)“貴”である場合、「貴社受付番号」において認識結果文字列(d)“番”の次に認識結果文字列(a)“貴”が存在しないので、対応する値に“0”が設定される。また、ある認識結果文字が認識結果文字列(a)“貴”であり、他の認識結果文字が認識結果文字列(f)“社”である場合、「貴社受付番号」において認識結果文字列(a)“貴”の次に認識結果文字列(f)“社”が存在するが、認識結果文字列(a)“貴”と認識結果文字列(f)“社”とは同一の行に存在しないので、対応する値に“0”が設定される。
【0145】
次に、文字列認識装置100は、ステップS35で上記の設定条件に従って、図33に示す文字列候補テーブル152bのように、各文字列候補同士の組み合わせの値を設定していく。次に、文字列認識装置100は、文字列候補テーブル152bに定義される文字列候補同士の対応関係に基づいて、文字列候補の対応関係の最大クリークを探索する。
【0146】
図34は、第2の実施の形態の文字列候補テーブルにおける文字列候補の対応関係を表した文字列対応関係グラフを示す図である。
図34に示す文字列候補対応関係グラフ152b1は、説明の便宜上、本実施の形態の項目名文字列抽出処理によって文字列候補テーブル152bに定義された文字列候補の対応関係を表したグラフである。文字列候補対応関係グラフ152b1では、文字列候補である、認識結果文字(a)〜(g)がノード(node)に設定されている。また、文字列候補テーブル152bにおいて“1”が設定されている値に対応するノード間は、パス(path)が設定されている。
【0147】
ここで、クリーク(clique)は、グラフのすべてのノード同士の組み合わせについても互いにパスが存在する部分グラフである。最大クリークは、グラフから抽出されるクリークのうち、頂点数が最大のクリークである。本実施の形態の項目名文字列抽出処理で探索する最大クリークは、図34の例では、(a),(b),(c),(d),(e)となる。
【0148】
この最大クリークの探索については、様々な探索アルゴリズムが知られている。最大クリークの探索には、一例として上記の[非特許文献1]記載の方法を使用してもよい。
次に、文字列認識装置100は、ステップS37で最大クリークの文字数および項目名文字列の文字数から、項目名文字列のマッチング率Mを算出する。マッチング率Mは、最大クリークの文字数を、選択した項目名情報に示されている項目名文字列の文字数で割って算出される比率である。例えば、上記の例では、最大クリークの文字数が“5”であって項目名情報の項目名文字列が“貴社受付番号”であり文字数が“6”であるため、マッチング率M=5/6≒0.83となる。
【0149】
次に、文字列認識装置100は、ステップS41およびステップS42で、マッチング率Mが閾値α以上である場合は、その項目名文字列と項目名文字列の座標とを記憶する。次に、文字列認識装置100は、すべての項目名文字列が選択済になるまで、ステップS33からステップS42の処理を繰り返す。すべての項目名文字列に対し処理が終了すれば、帳票画像から項目名文字列の抽出が完了したものとして、項目名文字列抽出処理を終了して文字列認識処理に復帰する。
【0150】
以上説明したように、第2の実施の形態では、帳票画像の文字認識を行う際に、文字認識で取得した項目値の認識結果文字列について、項目名との位置関係に基づいて統合し、項目値文字列を設定する。これにより、帳票画像が有する文字列と各項目値の文字列との対応関係を設定する際に、対応関係の設定の誤りの発生を抑制する。その結果、項目値の文字列認識における誤認識の発生を抑制することが可能となる。
【0151】
また、ルールに基づいて項目名と項目値との対応関係を設定する。これにより、ルールを帳票等の文書のフォーマットに応じて適宜設定することにより、様々な形式の文書に適応させることができる。
【0152】
〔第3の実施の形態〕
次に第3の実施の形態について説明する。上記の第2の実施の形態との相違点を中心に説明し、同様の事項については同一の符号を用いると共に説明を省略する。第3の実施の形態は、文字列認識処理において項目値の文字列認識に連結要素を用いた例である。
【0153】
第2の実施の形態では、文字列認識処理において、項目名文字列領域の特定に連結要素による文字認識を行い、項目値文字列の文字列認識には、従来の文字認識を用いる。これに対して、第3の実施の形態では、項目値文字列の文字列認識にも連結要素による文字認識を用いる。
【0154】
図35は、第3の実施の形態の機能を示すブロック図である。本実施の形態の文字列認識装置300は、手書き文字、活字、プリンタ等による印字等、文字認識可能である任意の字体の文字に適用可能であるものとする。文字列認識装置300は、画像取得部111、項目名文字列抽出部312、関連付け部313、関連付け検証部314、連結要素統合部315、統合連結要素文字認識部316、文字カテゴリ限定部317、連結要素抽出部318、画像記憶部120、項目名情報記憶部351、文字列候補記憶部152、対応関係記憶部153、ルール記憶部354を有する。
【0155】
画像取得部111は、スキャナや他のコンピュータから通信回線を介して帳票等の文書の画像情報を取得し、取得した画像情報を画像記憶部120に記憶させる。
項目名文字列抽出部312は、項目名情報を項目名情報記憶部351から読み出し、画像記憶部120に記憶されている画像から、項目名文字列情報に基づいて画像中に存在する項目名文字列を抽出する。そして、また、項目名文字列抽出部312は、項目名文字列を示す項目名文字列領域(項目名文字ブロック)を抽出する。ここで、文字列認識装置300で文字列認識を行う画像は、例えば、項目名を示す項目名文字列、項目名に対応する項目値を示す項目値文字列を有する帳票画像等の画像である。この画像は、例えば、帳票等の文書をスキャナ等で読み取るか、直接電子ファイルで作成された帳票等の文書を画像に変換することにより作成される。また、画像中の項目名文字列領域以外の領域を非項目名文字列領域とする。また、項目値は、帳票等の文書において項目名に対応する内容である。また、項目値文字列は、項目名に対応する内容を示す文字を有する文字列であり、第1の実施の形態の内容文字列と対応する。
【0156】
また、項目名文字列抽出部312は、項目名文字列領域の位置および連結要素(項目値文字ブロック)の位置を示す位置情報を取得する。この位置情報により、項目名文字列領域の位置が特定される。この位置情報は、項目名文字列領域の位置を、例えば、画像上の2次元座標で示してもよい。また、項目値文字ブロックは、項目値文字列の一部または全部を示し、第1の実施の形態の内容文字ブロックと対応する。
【0157】
項目名文字列抽出部312は、取得した画像中のそれぞれの連結要素と外接する外接矩形を作成し、重なる外接矩形同士を統合することにより、項目名文字列領域を作成する。
関連付け部313は、ルール記憶部354に記憶されているルールに従って、非項目名文字列領域に存在する連結要素抽出部318で取得された各連結要素に対し、項目名文字列抽出部312により取得した位置情報に基づいて各連結要素の位置から左方向または上方向に項目名文字列抽出部312で取得された項目名文字列を探索し、探索の結果により抽出された項目名文字列が示す項目名と連結要素とを関連付ける。なお、これに限らず、関連付け部313は、ルール記憶部354に記憶されているルールに従って、項目名文字列抽出部312により取得された位置情報に基づいて項目名文字列抽出部312で取得された項目名文字列の位置から右方向または下方向に非項目名文字列領域に存在する連結要素抽出部318で取得された各連結要素を探索し、項目名文字列領域の項目名文字列が示す項目名と探索の結果得られた連結要素とを関連付けてもよい。
【0158】
関連付け検証部314は、ルール記憶部354から項目名文字列と連結要素との関連付けにおいて満たすべきルールを読み出し、関連付け部313で生成された項目名と連結要素との関連付けのうち、ルールに違反する関連付けを削除する。
【0159】
連結要素統合部315は、同一の項目名に関連付けられた連結要素同士を統合し、項目名に対応する統合外接矩形領域に設定する。すなわち、連結要素統合部315は、連結要素抽出部318により抽出し、関連付け部313によって関連付け、関連付け検証部314によって関連付けを削除されずに維持された連結要素を統合して項目名に関連付ける統合外接矩形領域を設定する。このとき連結要素統合部315は、連結要素が画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した外接矩形同士が重なっている連結要素の外接矩形を統合して統合外接矩形領域を設定する。
【0160】
統合連結要素文字認識部316は、設定した統合外接矩形領域について項目名文字列領域の項目名に対応する文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って項目値文字列を取得し、項目名文字列領域の項目名と取得した項目値文字列とを関連付けの結果として対応関係記憶部153に記憶させる。
【0161】
文字カテゴリ限定部317は、項目名情報記憶部351に記憶されている項目名情報から項目名に対応する項目値の文字カテゴリ情報を取得する。
連結要素抽出部318は、非項目名文字列領域に対して連結要素解析を行い、項目値文字列の一部を示す特定の画素が連結している領域である連結要素を抽出する。ここで、連結要素は、特定の画素が連結している領域である。また、特定の画素は、例えば、予め設定された画素値以上の画素等の基準で抽出される画素であり、認識対象の文字列の一部を示す画素である。
【0162】
画像記憶部120は、項目名を示す文字を有する項目名文字列と項目名に対応する内容を示す文字を有する項目値文字列とを有する画像を記憶する。画像記憶部120に記憶されている画像は、項目名および項目値を有する帳票等の文書の画像である。この画像は、スキャナ等の光学式読み取り装置で取得してもよく、コンピュータ等により直接電子ファイルで作成された帳票等の文書を画像に変換することにより取得してもよい。
【0163】
項目名情報記憶部351は、例えば、『氏名』、『住所』等の項目名の項目値文字列を示す情報、項目名が複数の項目値と対応する連記表であるか否かを示す情報を有する項目名文字列情報を有する項目名情報を記憶する。また、本実施の形態の項目名情報記憶部351は、項目名に対応する項目値文字列に使用できる文字の範囲である文字カテゴリを示す文字カテゴリ情報を、項目名情報において項目名と関連付けて記憶する。
【0164】
本実施の形態の文字列認識装置300では、項目値文字列領域について文字認識を行う場合、項目名情報記憶部351に記憶されている文字カテゴリ情報に基づいて文字カテゴリの限定を行う。すなわち、文字カテゴリ情報により文字認識時において項目名に対応する項目値文字列の文字カテゴリが分かっているので、その項目値に使用できる文字カテゴリを限定することができる。
【0165】
例えば、項目名が『日付』であれば、その項目値に現れる文字は、[0123456789年月日明治大正昭和平成西暦]の範囲に限定することができる。また、項目名が『フリガナ』であれば、その項目値には、カタカナ文字に限定できる。
【0166】
これらの事実を利用し、本実施の形態では、項目値文字列領域の文字認識を行う前にその項目値が取り得る文字カテゴリを決定し、その範囲内での文字認識を行う。これにより類似文字の誤認識を抑制することができる。
【0167】
例えば、
“2009年 1月 5日”
という年月日の表記があった場合、文字認識結果は、以下のように誤認識された場合について考える。
【0168】
“2OO9年 l月 S日”
つまり、“0”(ゼロ)は“O”(オー)、“1”(イチ)は、“l”(エル)、“5”(ゴ)は“S”(エス)のように文字認識誤りが発生する場合がある。ここで、文字認識時点で、文字カテゴリを数字に限定し、アルファベットは認識対象外としていれば、上記のような文字の誤認識を防止することが可能である。
【0169】
文字列候補記憶部152では、項目名文字列抽出処理において認識結果文字の文字列候補を示す情報を記憶する。
対応関係記憶部153は、項目名と統合認識結果文字列とを関連付けて示す対応関係情報を記憶する。この統合認識結果文字列は、統合連結要素文字認識部316によって文字認識した結果得られる。この対応関係情報により、画像に含まれている項目名および項目値ならびに項目名と項目値との対応関係が示される。
【0170】
ルール記憶部354は、項目名と連結要素との関連付けのルールを記憶する。ルール記憶部354に記憶されているルールは、例えば、1つの連結要素に対応関係を有する項目名が複数存在する場合の関連付けのルール、1つの項目名に対応関係を有する連結要素が複数存在する場合の関連付けのルールを含む。また、1つの項目名に1つの連結要素が対応関係を有する場合において、1つの項目名に関連付け可能な連結要素が複数存在するときに、連結要素を複数の項目名のうちの1つの正しい項目名と関連付けて他の対応関係を削除する関連付けのルールを含む。
【0171】
また、図1に示した第1の実施の形態の機能のうち、文字ブロック位置取得部1aの機能は、項目名文字列抽出部312、連結要素抽出部318で実現されている。また、対応関係設定部1b、文字ブロック統合部1eの機能は、関連付け部313、関連付け検証部314、連結要素統合部315、統合連結要素文字認識部316で実現されている。
【0172】
図36から図37は、第3の実施の形態の文字列認識処理の手順を示すフローチャートである。文字列認識処理は、帳票の画像読み取りやユーザの文字列認識処理を実行する操作に基づいて、文字列認識装置300により実行が開始される。以下、図36および図37に示す処理をステップ番号に沿って説明する。
【0173】
〔ステップS51〕項目名文字列抽出部312は、項目名情報記憶部351に記憶されている項目名情報を取得する。
〔ステップS52〕項目名文字列抽出部312は、帳票画像等から項目名文字列を抽出する項目名文字列抽出処理を実行する。
【0174】
〔ステップS53〕連結要素抽出部318は、ステップS52で取得した項目名文字列領域以外の非項目名文字列領域について連結要素の抽出を行い、連結要素を取得する。この非項目名文字列領域に対する連結要素は、第2の実施の形態の項目名文字列抽出におけるステップS22(図24、図27参照)と同様の処理によって取得する。
【0175】
〔ステップS54〕関連付け部313は、所定の位置関係に該当するステップS52で抽出した項目名文字列とステップS53で取得した連結要素とを、ルール記憶部354に記憶されているルールに基づいて関連付ける。
【0176】
〔ステップS55〕関連付け検証部314は、ステップS54における関連付けについて検証し、検証の結果正しくない関連付けを削除する。
〔ステップS56〕連結要素統合部315は、ステップS54およびステップS55による関連付けによって、同一の項目名文字列に関連付けた連結要素を統合して項目名文字列に対応する項目値文字列領域に設定する。
【0177】
〔ステップS61〕文字カテゴリ限定部317は、項目名情報記憶部351に記憶されている項目名情報から項目名文字列に対応する文字カテゴリを取得する。
〔ステップS62〕統合連結要素文字認識部316は、ステップS61で取得した文字カテゴリによって、ステップS56(図36)で設定した項目値文字列領域に文字認識を行い、認識結果である統合認識結果文字列を項目名文字列が示す項目名に対応する項目値として設定する。
【0178】
〔ステップS63〕統合連結要素文字認識部316は、ステップS62で設定した帳票画像の項目名と項目値との対応関係を、対応関係記憶部153に記憶させる。
図38および図39は、第3の実施の形態における第1の例の帳票画像の処理の様子を示す図である。図38(A)および図38(B)に従って、帳票画像410の項目名文字列領域412a,412bおよび連結要素416a1,・・・、連結要素416b1,・・・に基づいてステップS54およびステップS55の処理を説明する。本実施の形態の文字列認識装置300は、ステップS53で抽出した連結要素について、ステップS54により、項目名文字列との関連付けを行う。このステップS54の関連付けでは、項目名文字列が位置する項目名文字列領域と連結要素の位置とが、ルール記憶部354に記憶されているルールが示す所定の位置関係にある場合、項目名文字列が示す項目名と連結要素とが関連付けられる。
【0179】
ここで、図38(A)に示すように、本実施の形態の文字列認識処理のステップS51からステップS53の処理によって、帳票画像410において項目名文字列領域412a,412bが設定されているものとする。また、帳票画像410に含まれる項目値文字列「神奈川県川崎市小山 1−23−4」が有する連結要素416a1,416a2,416a3,416a4,416a5,416a6,416a7,416a8,・・・、項目値文字列「東京太郎」が有する連結要素416b1,416b2,416b3,416b4,416b5,・・・が抽出されているものとする。
【0180】
これに対して本実施の形態の文字列認識装置300は、ステップS54により項目名文字列領域412aと連結要素416a1,・・・、項目名文字列領域412aと連結要素416b1,・・・、項目名文字列領域412bと連結要素416b1,・・・の3組が、ルール記憶部354に記憶されているルールが示す所定の位置関係(例えば、連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在)を満たすものとして一旦関連付ける。
【0181】
次に、文字列認識装置300は、ステップS55により項目名文字列と連結要素との関連付けの検証および削除を行う。このステップS55の関連付けの検証および削除では、関連付けられた項目名文字列と連結要素とが、ルール記憶部354に記憶されているルールに違反するか等に基づいて、関連付けが正しいか否かについて検証される。そして、検証の結果に基づき、ステップS54で関連付けられた、関連付けが正しくない項目名と連結要素との関連付けが削除される。
【0182】
ステップS55において、ルール記憶部354に記憶されているルール(例えば、連結要素の中心の左方に項目名文字列領域が存在する場合、連結要素の中心の左上方の項目名文字列への関連付けは削除)に基づいて、項目名文字列領域412aと連結要素416b1,・・・については、図38(B)の点線の矢印で示すように、関連付けが削除される。このようにして、正しくない関連付けが削除され、正しい関連付けのみが維持される。
【0183】
本実施の形態の文字列認識装置300では、ステップS56によりステップS55で検証された関連付けに基づいて、同一の項目名文字列領域に関連付けられたすべての連結要素の外接矩形を1つに統合する。そして、統合後の外接矩形を、項目名に対応する項目値文字列領域に設定する。具体的には、図39に示すように、項目名文字列領域412aに関連付けられた各連結要素416a1,・・・の外接矩形が統合され、項目名文字列領域412aに対応する項目値文字列領域417aが設定される。また、項目名文字列領域412bに関連付けられた各連結要素416b1,・・・の外接矩形が統合され、項目名文字列領域412bに対応する項目値文字列領域417bが設定される。
【0184】
本実施の形態では、この設定された項目値文字列領域417a,417bについてステップS62でそれぞれ文字認識を行うことにより統合認識結果文字列を取得し、ステップS63でそれぞれ項目名文字列領域412a,412bと関連付けられる。
【0185】
このように、本実施の形態の文字列認識処理では、項目値文字列領域417a,417bを適切に設定することが可能になる。これにより、文字列認識の誤認識の発生を抑制することができる。
【0186】
図40は、第3の実施の形態の項目名情報テーブルの例を示す図である。図40に示す項目名情報テーブル351aは、本実施の形態の文字列認識装置300による文字列認識処理を実行する際に適用される項目名情報を記憶するテーブルである。項目名情報テーブル351aは、項目名情報記憶部351に記憶されている。項目名情報テーブル351aには、“項目名番号”フィールド、“項目名文字列”フィールド、“連記表”フィールド、“文字カテゴリ”フィールドが設けられている。各項目の横方向に並べられた情報同士が項目名情報として互いに関連付けられている。
【0187】
“文字カテゴリ”フィールドには、項目名番号で特定された項目名と対応関係を有する項目値が取り得る文字の種類を示す文字カテゴリが設定される。本実施の形態の文字列認識装置300は、文字列認識処理のステップS61で項目名情報から項目名文字列に対応する文字カテゴリを取得する。そして、文字列認識装置300は、ステップS62で項目名文字列に対応する項目値文字列領域を文字カテゴリの文字の範囲で文字認識を行い、項目名の項目値に設定することができる。これにより、項目値文字列領域の文字認識の誤認識の発生を抑制することができる。
【0188】
文字カテゴリには、例えば、全漢字(すべての漢字)、ひらがな、カタカナ、住所漢字(住所に使用されている漢字)、英数字記号(アルファベット、数字および記号)、数字(数字のみ)等のうち1つ、またはこれらを任意に組み合わせたものを設定することができる。さらに、人名漢字(氏名に使用可能な漢字)等の上記以外の文字カテゴリを追加して設定してもよい。
【0189】
図41および図42は、第3の実施の形態のルールテーブルの例を示す図である。図41に示すルールテーブル354a、図42に示すルールテーブル354bは、本実施の形態の文字列認識装置300による文字列認識処理を実行する際に適用されるルールを記憶するテーブルである。ルールテーブル354a,354bは、ルール記憶部354に記憶されている。
【0190】
図41に示すルールテーブル354aには、“ルール”フィールド、“ルール内容”フィールドが設けられている。図41に示す以下のルールは、一般的な帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
【0191】
[関連付けルール1]連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、連結要素と項目名とを関連付ける。
[関連付けルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
【0192】
[関連付けルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、連結要素に最も近い項目名文字列の関連付けのみ残す。
【0193】
[妥当性ルール1]連結要素の中心の上方または左方に項目名文字列領域が存在する場合であって、連結要素の中心の左上方に存在する他の項目名文字列への関連付けがあるとき、連結要素の中心の左上方に存在する他の項目名文字列への関連付けは削除する。
【0194】
また、本実施の形態の関連付けのルールの別の例を示す。
図42に示すルールテーブル354bには、“適用範囲”フィールド、“ルール”フィールド、“ルール内容”フィールドが設けられている。図42に示す以下のルールは、連記表である項目を含む可能性があると共に、罫線を有する可能性があり、さらに2次元表である可能性がある帳票に対する文字列認識処理の関連付けに適用されるルールの一例である。
【0195】
・項目名の連記表が“有”
[ルール1]連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、連結要素と項目名とを関連付ける。
【0196】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
[ルール3]関連付けられた項目名が2個以上存在し、項目名の中に連記表に適用されないものが存在する場合、連結要素に最も近い項目名文字列の関連付けのみ残す。
【0197】
・項目名の連記表が“無”
[ルール1]連結要素の中心の上方、左方または左上方に項目名文字列領域の外接矩形が存在する場合、連結要素と項目名文字列とを関連付ける。
【0198】
[ルール2]項目名文字列が、表のセル内に存在する場合、セルの枠の矩形を、項目名文字列領域の外接矩形とみなす。
なお、本実施の形態では、関連付けにおいて帳票のフォーマットに応じた任意のルールを設定することができる。
【0199】
第3の実施の形態では、第2の実施の形態に加えて、連結要素に分解してから関連付けルールに従って連結要素を項目名に関連付けることにより、項目値文字列領域を適切に設定することが可能になる。これにより、文字列認識の誤認識の発生を抑制することができる。
【0200】
また、項目値の文字カテゴリを予め項目名に対応付けておき、項目名文字列に対応する項目値文字列領域を文字カテゴリの文字の範囲で文字認識を行い、項目名の項目値に設定することができる。これにより、項目値文字列領域の文字認識の誤認識の発生を抑制することができる。
【0201】
なお、上記の処理機能は、文字列認識装置によって実現することができる。その場合、サーバが有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムを文字列認識装置で実行することにより、上記処理機能が文字列認識装置上で実現される。処理内容を記述したプログラムは、文字列認識装置で読み取り可能な記録媒体に記録しておくことができる。文字列認識装置で読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disc)などがある。
【0202】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバ文字列認識装置の記憶装置に格納しておき、ネットワークを介して、サーバ文字列認識装置から他の文字列認識装置にそのプログラムを転送することもできる。
【0203】
プログラムを実行する文字列認識装置は、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバ文字列認識装置から転送されたプログラムを、自己の記憶装置に格納する。そして、文字列認識装置は、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、文字列認識装置は、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、文字列認識装置は、サーバ文字列認識装置からプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0204】
また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現することもできる。
【0205】
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。
【0206】
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
(付記1) 項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像を記憶する画像記憶部と、
前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得部と、
前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定部と、
を有することを特徴とする文字列認識装置。
【0207】
(付記2) 前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0208】
(付記3) 前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0209】
(付記4) 前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する前記文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記3記載の文字列認識装置。
【0210】
(付記5) 前記項目名の前記内容文字列を示す項目名文字列情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記文字ブロック位置取得部は、前記項目名情報記憶部に記憶されている前記項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記1記載の文字列認識装置。
【0211】
(付記6) 前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から左方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0212】
(付記7) 前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から上方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0213】
(付記8) 前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記非項目名文字領域について1文字単位で文字認識を行って前記認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記2記載の文字列認識装置。
【0214】
(付記9) 前記関連付けのルールを記憶するルール記憶部を有し、
前記対応関係設定部は、前記ルール記憶部に記憶されている前記ルールに従って、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記1記載の文字列認識装置。
【0215】
(付記10) 前記ルール記憶部に記憶されている前記ルールは、1つの前記内容に対応関係を有する前記項目名が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記9記載の文字列認識装置。
【0216】
(付記11) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に対応関係を有する前記内容が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記9記載の文字列認識装置。
【0217】
(付記12) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に1つの前記内容が対応関係を有する場合において、1つの前記項目名に関連付け可能な前記内容が複数存在するときに、前記内容を複数の前記項目名のうちの1つの正しい項目名と関連付ける前記関連付けのルールを含むことを特徴とする付記9記載の文字列認識装置。
【0218】
(付記13) コンピュータに、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有する処理を実行させることを特徴とする文字列認識プログラム。
【0219】
(付記14) 前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0220】
(付記15) 前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0221】
(付記16) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する項目名情報記憶部に記憶されている前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記15記載の文字列認識プログラム。
【0222】
(付記17) 前記文字ブロック位置取得ステップでは、項目名情報記憶部に記憶されている前記項目名の前記内容文字列を示す項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記13記載の文字列認識プログラム。
【0223】
(付記18) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から左方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0224】
(付記19) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から上方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0225】
(付記20) 前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記非項目名文字領域について1文字単位で文字認識を行って前記認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記14記載の文字列認識プログラム。
【0226】
(付記21) 前記対応関係設定ステップは、ルール記憶部に記憶されている前記関連付けのルールに従って、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記13記載の文字列認識プログラム。
【0227】
(付記22) 前記ルール記憶部に記憶されている前記ルールは、1つの前記内容に対応関係を有する前記項目名が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記21記載の文字列認識プログラム。
【0228】
(付記23) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に対応関係を有する前記内容が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記21記載の文字列認識プログラム。
【0229】
(付記24) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に1つの前記内容が対応関係を有する場合において、1つの前記項目名に関連付け可能な前記内容が複数存在するときに、前記内容を複数の前記項目名のうちの1つの正しい項目名と関連付ける前記関連付けのルールを含むことを特徴とする付記21記載の文字列認識プログラム。
【0230】
(付記25) コンピュータが、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有することを特徴とする文字列認識方法。
【0231】
(付記26) 前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0232】
(付記27) 前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0233】
(付記28) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する項目名情報記憶部に記憶されている前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする付記27記載の文字列認識方法。
【0234】
(付記29) 前記文字ブロック位置取得ステップでは、項目名情報記憶部に記憶されている前記項目名の前記内容文字列を示す項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記25記載の文字列認識方法。
【0235】
(付記30) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から左方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0236】
(付記31) 前記対応関係設定ステップでは、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から上方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0237】
(付記32) 前記文字ブロック位置取得ステップでは、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記非項目名文字領域について1文字単位で文字認識を行って前記認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする付記26記載の文字列認識方法。
【0238】
(付記33) 前記対応関係設定ステップは、ルール記憶部に記憶されている前記関連付けのルールに従って、前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする付記25記載の文字列認識方法。
【0239】
(付記34) 前記ルール記憶部に記憶されている前記ルールは、1つの前記内容に対応関係を有する前記項目名が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記33記載の文字列認識方法。
【0240】
(付記35) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に対応関係を有する前記内容が複数存在する場合の前記関連付けのルールを含むことを特徴とする付記33記載の文字列認識方法。
【0241】
(付記36) 前記ルール記憶部に記憶されている前記ルールは、1つの前記項目名に1つの前記内容が対応関係を有する場合において、1つの前記項目名に関連付け可能な前記内容が複数存在するときに、前記内容を複数の前記項目名のうちの1つの正しい項目名と関連付ける前記関連付けのルールを含むことを特徴とする付記33記載の文字列認識方法。
【符号の説明】
【0242】
1 文字列認識装置
1a 文字ブロック位置取得部
1b 対応関係設定部
1c 画像記憶部
1d 対応関係記憶部
1e 文字ブロック統合部
【特許請求の範囲】
【請求項1】
項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像を記憶する画像記憶部と、
前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得部と、
前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定部と、
を有することを特徴とする文字列認識装置。
【請求項2】
前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする請求項1記載の文字列認識装置。
【請求項3】
前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする請求項1記載の文字列認識装置。
【請求項4】
前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する前記文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする請求項3記載の文字列認識装置。
【請求項5】
前記項目名の前記内容文字列を示す項目名文字列情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記文字ブロック位置取得部は、前記項目名情報記憶部に記憶されている前記項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする請求項1記載の文字列認識装置。
【請求項6】
コンピュータに、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有する処理を実行させることを特徴とする文字列認識プログラム。
【請求項7】
コンピュータが、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有することを特徴とする文字列認識方法。
【請求項1】
項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像を記憶する画像記憶部と、
前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得部と、
前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定部と、
を有することを特徴とする文字列認識装置。
【請求項2】
前記内容文字ブロックは、前記内容文字列の一部または全部の文字列を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域について文字認識を行って認識結果文字列を取得し、取得した前記認識結果文字列を前記内容文字ブロックとして抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記認識結果文字列を同一の前記項目名文字ブロックが抽出されたもの同士について統合して前記内容文字列とし、前記項目名文字ブロックの前記項目名と統合した前記内容文字列とを関連付け、関連付けた結果を前記対応関係記憶部に記憶させることを特徴とする請求項1記載の文字列認識装置。
【請求項3】
前記内容文字ブロックは、前記内容文字列の一部を示す特定の画素が連結している領域である連結要素を有し、
前記文字ブロック位置取得部は、前記画像記憶部に記憶されている前記画像から、前記項目名文字列を示す前記項目名文字ブロックを抽出すると共に、前記項目名文字ブロック以外の領域である非項目名文字領域から前記連結要素に基づいて前記内容文字列の一部または全部を示す前記内容文字ブロックを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について、前記連結要素が前記画像中の他の連結要素と外接する矩形である外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする請求項1記載の文字列認識装置。
【請求項4】
前記項目名に対応する前記内容文字列の文字カテゴリを示す文字カテゴリ情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記対応関係設定部は、前記文字ブロック位置取得部により取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックの前記連結要素と抽出した前記項目名文字ブロックの前記項目名とを関連付け、前記内容文字ブロックが有する前記連結要素について前記外接矩形を設定し、設定した前記外接矩形同士が重なっている前記連結要素の前記外接矩形を統合して統合外接矩形領域を設定し、設定した前記統合外接矩形領域について前記項目名文字ブロックの前記項目名に対応する前記文字カテゴリ情報が示す文字カテゴリにおいて文字認識を行って前記内容文字列を取得し、抽出した前記項目名文字ブロックの前記項目名と取得した前記内容文字列とを関連付けの結果として前記対応関係記憶部に記憶させることを特徴とする請求項3記載の文字列認識装置。
【請求項5】
前記項目名の前記内容文字列を示す項目名文字列情報を有する項目名情報を記憶する項目名情報記憶部を有し、
前記文字ブロック位置取得部は、前記項目名情報記憶部に記憶されている前記項目名文字列情報に基づいて前記項目名文字列を示す前記項目名文字ブロックと、前記内容文字列の一部または全部を示す前記内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す前記位置情報を取得することを特徴とする請求項1記載の文字列認識装置。
【請求項6】
コンピュータに、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有する処理を実行させることを特徴とする文字列認識プログラム。
【請求項7】
コンピュータが、
画像記憶部に記憶されている項目名を示す文字を有する項目名文字列と前記項目名に対応する内容を示す文字を有する内容文字列とを有する画像から、前記項目名文字列を示す項目名文字ブロックと、前記内容文字列の一部または全部を示す内容文字ブロックとを抽出し、前記項目名文字ブロックと前記内容文字ブロックとの位置を示す位置情報を取得する文字ブロック位置取得ステップと、
前記文字ブロック位置取得ステップにより取得した前記位置情報に基づいて前記内容文字ブロックの位置から所定の方向に存在する前記項目名文字ブロックを抽出し、前記内容文字ブロックと抽出した前記項目名文字ブロックの前記項目名とを関連付け、関連付けた結果を対応関係記憶部に記憶させる対応関係設定ステップと、
を有することを特徴とする文字列認識方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【図38】
【図39】
【図40】
【図41】
【図42】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【図38】
【図39】
【図40】
【図41】
【図42】
【公開番号】特開2011−150466(P2011−150466A)
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願番号】特願2010−9965(P2010−9965)
【出願日】平成22年1月20日(2010.1.20)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願日】平成22年1月20日(2010.1.20)
【出願人】(000005223)富士通株式会社 (25,993)
【Fターム(参考)】
[ Back to top ]