パターン認識装置、パターン認識方法およびパターン認識プログラム

【課題】類似する文字の判別精度を向上することで文字認識率を向上する。
【解決手段】このパターン認識装置は、入力パターンを文字認識する一次認識部１１０と、一次認識部１１０から入力される文字候補について特徴部毎に文字認識を行う二次認識部１２０を備える。二次認識部１２０は類似文字のグループ毎の複数の類似文字識別部１２４−１〜１２４−Ｎを備える。類似文字識別部１２４−１は区分情報記憶部２００の区分情報を読出し入力パターンの領域のうち類似文字の判別に有効な第１領域Ａｐを密に、これ以外の第２領域Ａｑ,Ａｒ,Ａｓを疎に区分する区分部２０１と、小領域Ａｐ〜Ａｓに区分された文字パターンを各小領域が等しい幅になるように画像変換し類似文字判別用の文字パターンを生成する画像変換部２０２と、変換された文字パターンを文字認識して上記候補の最終判定を行う最終判定部１２７とを備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、例えば文字画像などのパターン画像を文字に変換するためのパターン認識を行うパターン認識装置、パターン認識方法およびパターン認識プログラムに関するものである。
【背景技術】
【０００２】
従来のパターン認識技術の一つに、予め類似文字をグループ分けし、それぞれのグループ毎に類似文字テーブルを設け、類似文字テーブルに存在する各文字毎の標準的な特徴と認識対象の文字の特徴との相違度を求めて、相違度の最も小さい文字を第１位の文字候補とする技術が提案されている（例えば特許文献１参照）。
【特許文献１】特開平０８−２７２９０９号公報
【発明の開示】
【発明が解決しようとする課題】
【０００３】
ところで、認識対象の文字の特徴部分は、文字全体の中の一部であり、小さいことが多く、従来のパターン認識技術により、認識対象の文字の特徴部分を抽出したときに、特徴部分が判別しにくい状況がある。
【０００４】
この場合、抽出した特徴部分と標準的な特徴とを比較しても得られた第１位の文字候補が必ずしも認識元の文字に一致または類似しているとは限らないという問題があった。
【０００５】
本発明はこのような課題を解決するためになされたもので、類似する文字の判別精度を向上することで、文字認識率を向上することのできるパターン認識装置、パターン認識方法およびパターン認識プログラムを提供することを目的とする。
【課題を解決するための手段】
【０００６】
上記の課題を解決するために本発明のパターン認識装置は、文字画像の入力を受け付ける受付部と、辞書データとこの辞書データに対応する文字コードとを含む文字認識用の第１辞書と辞書データとこの辞書データに対応する文字コードとを含み、類似する文字のグループ毎に設定された第２辞書とを記憶した辞書記憶部と、前記受付部により受け付けられた文字画像について前記辞書記憶部に記憶された第１辞書を用いて文字認識することで、認識結果となり得る文字コードの候補を出力する第１文字認識部と、前記文字画像の領域のうち類似文字の判別に有効な第１領域を密に、この第１領域以外の第２領域を疎に区分するための区分情報が、文字コード毎にグループ分けして設定された区分情報記憶部と、前記第１文字認識部から出力された文字コードに従って、前記区分情報記憶部の類似文字のグループの区分情報を読み出して、前記文字画像を疎および密の小領域に区分する区分部と、前記区分部により疎および密の小領域に区分された文字画像を、各小領域が等しい幅になるように変換することで、類似文字判別用の文字画像を生成する画像変換部と、前記画像変換部により変換された類似文字判別用の文字画像について前記辞書記憶部に記憶された該当グループの第２辞書を用いて文字認識する第２文字認識部とを備えることを特徴とする。
【０００７】
本発明のパターン認識プログラムは、コンピュータに入力された文字画像のパターン認識処理を実行させるパターン認識プログラムにおいて、前記コンピュータを、前記文字画像の入力を受け付ける受付部と、辞書データとこの辞書データに対応する文字コードとを含む文字認識用の第１辞書と辞書データとこの辞書データに対応する文字コードとを含み、類似する文字のグループ毎に設定された第２辞書とを記憶した辞書記憶部と、前記受付部により受け付けられた文字画像について前記辞書記憶部に記憶された第１辞書を用いて文字認識することで、認識結果となり得る文字コードの候補を出力する第１文字認識部と、前記文字画像の領域のうち類似文字の判別に有効な第１領域を密に、この第１領域以外の第２領域を疎に区分するための区分情報が、文字コード毎にグループ分けして設定された区分情報記憶部と、前記第１文字認識部から出力された文字コードに従って、前記区分情報記憶部の類似文字のグループの区分情報を読み出して、前記文字画像を疎および密の小領域に区分する区分部と、前記区分部により疎および密の小領域に区分された文字画像を、各小領域が等しい幅になるように変換することで、類似文字判別用の文字画像を生成する画像変換部と、前記画像変換部により変換された類似文字判別用の文字画像について前記辞書記憶部に記憶された該当グループの第２辞書を用いて文字認識する第２文字認識部として機能させることを特徴とする。
【０００８】
本発明のパターン認識方法は、文字画像の入力を受付部が受け付けるステップと、前記受付部により受け付けられた文字画像について、第１文字認識部が、辞書データと文字コードとを含む第１辞書を用いて文字認識することで、認識結果となり得る文字コードの候補を出力するステップと、前記第１文字認識部から出力された文字コードに従って、区分部が、前記文字画像の領域のうち類似文字の判別に有効な第１領域を密に、この第１領域以外の第２領域を疎に区分するための区分情報が文字コード毎にグループ分けして設定された区分情報記憶部から、類似文字のグループの区分情報を読み出して、前記文字画像を疎および密の小領域に区分するステップと、前記区分部により疎および密の小領域に区分された文字画像を、画像変換部が、各小領域が等しい幅になるように変換することで、類似文字判別用の文字画像を生成するステップと、前記画像変換部により変換された類似文字判別用の文字画像について、第２文字認識部が、辞書データとこの辞書データに対応する文字コードとを含み、類似する文字のグループ毎に設定された中の該当グループの第２辞書を用いて文字認識するステップとを有することを特徴とする。
【発明の効果】
【０００９】
本発明によれば、類似する文字の判別精度を向上することで、文字認識率を向上することができる。
【発明を実施するための最良の形態】
【００１０】
（第１の実施形態）
図１は本発明の第１の実施形態にかかるパターン認識装置の構成を示すブロック図である。同図に示すように、本実施形態のパターン認識装置１００は、受付部１、第１文字認識部としての一次認識部１１０および第１文字認識部としての二次認識部１２０、および認識結果記憶部３を備えている。
【００１１】
受付部１は、例えばスキャナ、外部通信インターフェース装置などであり、入力された文字画像データ（以下「入力パターン」と称す）を受け付ける。
【００１２】
一次認識部１１０は、特徴抽出部１１１とパターン識別部１１２と辞書記憶部１１３等を有している。特徴抽出部１１１は、入力パターンの特徴を濃度パターン法、加重方向ヒストグラム法などの公知の方法で抽出して特徴ベクトルを生成する。
【００１３】
辞書記憶部１１３には、標準的な文字画像に対応する辞書データとこの辞書データに対応する文字コードとを含む文字認識用の辞書（この辞書を「第１辞書」という。）が記憶されている。
【００１４】
パターン識別部１１２は、特徴抽出部１１１より入力された特徴ベクトルと、辞書記憶部１１３に記憶された検出対象文字種の標準の辞書データである特徴ベクトルとを照合して類似度の高い１以上の文字の候補を判定して、その判定結果（文字候補の文字コードと認識対象の入力パターン）を一次認識部１１０の出力として二次認識部１２０へ与える。
【００１５】
二次認識部１２０は、文字グループ対応テーブル１２５ａと、特徴抽出部１２１と、最終判定部１２７とを有している。
図２は文字グループ対応テーブル１２５ａを図示したものである。文字グループ対応テーブル１２５ａには、文字グループに対応する区分情報としてのパターン変換パラメータ、辞書記憶部１２３の辞書へのポインタが格納されている。
【００１６】
図２に示すように、文字グループ対応テーブル１２５ａは、類似文字のペアのコード対（文字コードｒ１、文字コードｒ２）とポインタ（ポインタｒ）をテーブルの１セットとして有している。この文字グループ対応テーブル１２５ａでは、ポインタｒの指し示す先にパターン変換パラメータｒ、パターン辞書ｒが格納されている。
【００１７】
この例では、ポインタとしているが、ここにパターン変換パラメータや辞書の実体を置いても良い。
例えば、パターン変換パラメータは、図２のｔｘ０〜ｔｘｍ、ｔｙ０〜ｔｙｍのテーブルのような形式で、パラメータのセットとして格納されている。
【００１８】
図２の文字グループ対応テーブル１２５ａは、文字グループ（１〜Ｎ）と類似文字識別部（区分情報として用いるパターン変換パラメータ（１〜Ｎ）とパターン辞書（１〜Ｎ））との対応を知るためのテーブルである。
【００１９】
文字グループ対応テーブル１２５ａによって、１位、２位の文字コードと同じ文字コードｒ１，ｒ２が登録されているグループを見つけ、そのポインタｒが指し示すパターン変換パラメータｒとパターン辞書ｒによって、類似文字識別を行なえる。この文字グループ対応テーブル１２５ａの例は、２文字の例であるが、３文字以上にするなど、文字数の可変に対応可能である。
【００２０】
特徴抽出部１２１は、類似文字識別部１２４−ｘ（類似文字識別部１２４−１，類似文字識別部１２４−１，・・・類似文字識別部１２４−Ｎ）と、切り替え部１２５と、特徴ベクトル生成部１２６とを有している。最終判定部１２７は、パターン識別部１２２と、辞書記憶部１２３とを有している。
【００２１】
類似文字識別部１２４−ｘは、類似する文字のグループ毎に複数設けられている。複数の類似文字識別部１２４−ｘでは、切り替え部１２５によって選択された一つの類似文字識別部（類似文字識別部１２４−０〜類似文字識別部１２４−Ｎのいずれか）が、受付部１により受け付けられた入力パターンを、予め設定された区分情報に従って区分し画像変換を行う。
【００２２】
例えば類似文字識別部１２４−１が「ぼ」の文字のグループの類似文字識別部であった場合、入力パターンの画像変換は、次のようにして行われる。
【００２３】
図３は「ぼ」が描かれた入力パターンの一例を示す図、図４は図３の入力パターンを所定のルールで、密な小領域Ａｐと、それ以外の疎な小領域Ａｑ，Ａｒ，Ａｓとに分割した様子を示す図である。
【００２４】
辞書記憶部１２３には、標準的な文字画像に対応する辞書データとこの辞書データに対応する文字コードとを含む類似文字認識用の辞書（第２辞書）が、類似する文字のグループ毎に分けて記憶されており、パターン識別部１２２は、一次認識された認識結果の候補の文字コードが、辞書記憶部１２３に記憶されている中の「ぼ」の文字のグループに属する場合、その「ぼ」の文字のグループの辞書を利用して文字認識する。類似文字認識用に類似する文字グループ毎に分けられている辞書を「第２辞書」という。なお、辞書記憶部１１３と辞書記憶部１２３は、一つの辞書記憶部として構成されていてもよい。
【００２５】
「ぼ」という文字を含む類似文字のグループには、「ぼ」の他に「ほ」「ぽ」「は」「ば」「ぱ」などが属している。これらの類似文字は、図３に示すように、文字全体の領域のうち右上の部分Ｓが、文字の識別にとって重要な部分、つまり類似パターン認識のために有効なエリアである。
【００２６】
そこで、「ぼ」という文字を含む類似文字のグループに対応する類似文字識別部１２４−１は、右上部分の小領域Ａｐについて比較的に密になるよう小さいエリア（例えば４×４画素等）に区分し、その他の部分領域については、比較的に疎になるよう区分する。
なお、小領域Ａｐの画素は最小単位、つまり１×１画素等でもよい。またこのサイズは整数値になっていなくても良く、１以下でも良い。
【００２７】
この例では、その他の部分領域のうち、小領域Ａｑは、小領域Ａｐの縦横方向に３倍の領域の１２×１２画素等に区分され、小領域Ａｒは、小領域Ａｐの横方向に３倍の１２×４画素に区分れ、小領域Ａｓは、小領域Ａｐの縦方向に３倍の４×１２画素等に区分される。
【００２８】
一つの類似文字識別部１２４−１は、区分情報記憶部２００、区分部２０１、画像変換部２０２を有している。
【００２９】
区分情報記憶部２００には、入力パターンを上記のような小領域Ａｐ〜Ａｓに区分するための区分情報がパラメータ、ルール、関数（図７参照）などで設定されている。
【００３０】
区分部２０１は、区分情報記憶部２００から読み出した区分情報に従って入力パターンを疎および密の小領域Ａｒ〜Ａｓに区分する。
【００３１】
画像変換部２０２は、区分部２０１により疎および密の小領域Ａｐ〜Ａｓに区分された入力パターンを、各小領域が等しい幅になるように画像変換することで、類似文字判別用に文字の形を変形させた文字画像データ（以下「文字パターン」と称す）を生成する。
【００３２】
類似文字識別部１２４−ｘでは、類似文字判別用の文字パターンについて、例えば濃度パターン法などによって特徴量を求める。ただし、この方法に限らず、加重方向ヒストグラム法など、他の公知の方法を用いてもよい。
【００３３】
また、「ぼ」のグループ以外の類似文字のグループ、例えば「大」、「太」などの文字を含む類似文字のグループについては、これらの類似文字の下部が認識にとって重要な部分となる。このため、
【００３４】
類似文字識別部１２４−ｘには、「ぼ」という文字を含む類似文字のグループに対して設けられた類似文字識別部１２４−１とは別の類似文字識別部（類似文字識別部１２４−２等）が用意されている。すなわち、この類似文字識別部１２４−２に設定された小領域は下部においては密に区分され、その他の小領域については疎に区分される。このように類似文字識別部１２４−ｘは、類似文字の判別にとって重要な部分が異なる類似文字のグループ毎に設けられている。
【００３５】
切り替え部１２５は、一次認識部１１０の認識結果を基に、類似文字識別が必要な場合には、少なくとも一つの類似文字識別部１２４−ｘを選択し、入力パターンを与える。
【００３６】
つまり、切り替え部１２５は、一次認識部１１０の認識結果である文字コードの候補の属する類似文字のグループを判定して、そのグループに対応する類似文字識別部１２４−ｘを選択し、その類似文字識別部１２４−ｘへ入力パターンを与える。
【００３７】
このためにパターン認識装置１００は、文字とグループと類似文字識別部１２４−ｘとの対応を知るための文字グループ対応テーブル１２５ａ（図２参照）を保持している必要がある。切り替え部１２５は、この文字グループ対応テーブル１２５ａを参照して文字候補の属するグループを特定し、さらにこのグループに対応する類似文字識別部１２４−ｘを選出し、類似識別のための計算を実行させる。
【００３８】
さらに具体的には、例えば、一次認識部１１０の認識結果として「ぼ」と「ぽ」という２つの文字候補が得られた場合に、切り替え部１２５は、これらの文字を含む類似文字のグループを判定して、そのグループに対応する類似文字識別部１２４−ｘ、つまり入力パターン全体（画像全体）の領域のうち、右上部分に部分領域が密に分割された類似文字識別部１２４−ｘを選択し、その類似文字識別部１２４−ｘへ入力パターンを与える。
【００３９】
特徴ベクトル生成部１２６は、切り替え部１２５により選択された類似文字識別部１２４−ｘによって変換された文字パターンの特徴量を表す特徴ベクトルを生成して、これを特徴抽出部１２１の出力として最終判定部１２７へ与える。
【００４０】
最終判定部１２７では、パターン識別部１２２が、特徴抽出部１２１からの出力である特徴ベクトルと、文字グループ対応テーブル１２５ａのポインタによって求められる辞書記憶部１２３に記憶された中の該当類似文字グループの辞書であるところの特徴ベクトルとを照合して文字認識を行い、一次認識で得られた文字コードの候補の中から類似度の最も高い文字コードを最終的な認識結果として認識結果記憶部３へ出力する。
【００４１】
認識結果記憶部３は、不揮発性のメモリまたはハードディスク装置等により実現される。認識結果記憶部３には、二次認識部１２０の最終判定部１２７により最終的に判定されたパターン認識結果の文字コードと、認識元の画像データである入力パターンとが対応して記憶される。
【００４２】
なお、一次認識の結果が「ぽ」のグループとは異なるグループの文字コード、例えば「大」などの文字候補が得られた場合は、辞書記憶部１２３に「大」の文字のグループとして記憶されている類似文字認識用の辞書を利用して文字認識が行われる。
【００４３】
この例では、辞書記憶部１２３とパターン識別部１２２を１つ設定するようにしているが、辞書記憶部１２３の辞書とパターン識別部１２２を類似文字識別部１２４−ｘに対応させて複数設定するようにし、切り替え部１２５の選択に応じた辞書記憶部１２３とパターン識別部１２２とを用いて、変換された文字パターンの識別を行うように構成しても良い。
【００４４】
すなわち、このパターン認識装置は、入力パターンの入力を受け付ける受付部１と、文字画像に対応する辞書データとこの辞書データに対応する文字コードとを含む文字認識用の第１辞書を記憶した辞書記憶部１１３と、辞書データとこの辞書データに対応する文字コードとを含み、類似する文字のグループ毎に分けて設定された第２辞書を記憶した辞書記憶部１２３と、受付部１により受け付けられた入力パターンについて辞書記憶部１１３に記憶された第１辞書を用いて文字認識することで、認識結果となり得る文字コードの候補を出力する第１文字認識部としての一次認識部１１０と、入力パターンの領域のうち類似文字の判別に有効な第１領域Ａｐを密に、これ以外の第２領域Ａｑ,Ａｒ,Ａｓを疎に区分するための区分情報（領域を区分するためのパラメータ、関数またはルール）が、文字コード毎にグループ分けして設定された区分情報記憶部２００と、一次認識部１１０から入力された文字コードの候補に従って、類似文字を識別する複数の類似文字識別部１２４−ｘの中の一つを選択する切り替え部１２５と、選択された類似文字識別部１２４−１の、区分情報記憶部２００の類似文字のグループの区分情報を読み出して、入力パターンを疎および密の小領域Ａｐ〜Ａｓに区分する区分部２０１と、区分部２０１により疎および密の小領域Ａｐ〜Ａｓに区分された入力パターンを、各小領域が均等な幅になるように画像変換することで、類似文字判別用の文字パターンを生成する画像変換部２０２と、画像変換部２０２により変換された類似文字判別用の文字パターンについて、辞書記憶部１２３の該当グループの第２辞書を用いて文字認識し、一次認識部１１０から入力された文字コードの候補についての最終判定（どれが正しいかの判定）を行う最終判定部１２７とを備える。
【００４５】
次に、図４乃至図６を参照してこの第１実施形態のパターン認識装置１００の動作を説明する。
【００４６】
このパターン認識装置１００では、対象文字の文字画像である入力パターンが受付部１によって受け付けられると（図４のステップ１０１）、その入力パターンが一次認識部１１０へ入力される。なお以降の説明ではステップを「Ｓ」と称す。
【００４７】
一次認識部１１０は、特徴抽出部１１１にて入力パターンから特徴を抽出して特徴ベクトルを生成してパターン識別部１１２へ与える。
【００４８】
パターン識別部１１２は、入力された特徴ベクトルと、辞書記憶部１１３に格納された標準の文字の特徴ベクトルとを照合して、類似度の高い１以上の文字コードを一次認識結果、つまり認識結果となり得る文字コードの候補として二次認識部１２０へ出力する（Ｓ１０２）。
【００４９】
二次認識部１２０は、一次認識部１１０より入力された文字コードの候補を特徴抽出部１２１の切り替え部１２５に入力する。
【００５０】
切り替え部１２５は、入力された文字コードが、類似文字識別部１２４−ｘの中のどの類似文字識別部１２４−１〜１２４−Ｎに属するかを判定し、文字コードが属する類似文字グループの類似文字識別部、例えば文字コードの候補が「ぽ」の場合は、認識対象の入力パターンを類似文字識別部１２４−１へ与える。
【００５１】
このとき、一次認識部１１０より得られた文字コードの候補が複数存在し、それぞれの文字コードの候補が属するグループが異なる場合には、それぞれのグループに対応する別々の類似文字識別部１２４−０〜類似文字識別部１２４−Ｎへ認識対象の入力パターンをそれぞれ入力する。
【００５２】
「ぽ」のグループの類似文字識別部１２４−１では、区分部２０１が、区分情報記憶部２００の類似文字のグループの区分情報を読み出して、入力パターンを疎および密の小領域に区分する（Ｓ１０３）。区分された入力パターンの様子を図５に示す。
【００５３】
画像変換部２０２は、区分部２０１により疎および密の小領域に区分された入力パターンを、各小領域が等しい幅になるように画像変換することで、図６に示すような類似文字判別用の文字パターン６１を生成し（Ｓ１０４）、生成した文字パターン６１の特徴量を計算してその結果を特徴ベクトル生成部１２６へ与える。
【００５４】
特徴ベクトル生成部１２６は、類似文字識別部１２４−１より与えられた文字パターン６１の特徴量を表す特徴ベクトルを生成して、最終判定部１２７へ出力する。
【００５５】
このとき、特徴ベクトル生成部１２６は、類似文字識別部１２４−１だけでなく、他の類似文字識別部１２４−ｘから文字パターンの特徴量が入力された場合には、それぞれに対応する特徴ベクトルが生成されて最終判定部１２７へ与えられる。
【００５６】
最終判定部１２７では、パターン識別部１２２が、特徴ベクトルを取得すると、この特徴ベクトルと、辞書記憶部１２３に格納された標準の文字の特徴ベクトルとを照合して類似度を計算し、一次認識結果の文字コードの候補と今回文字認識して得られた文字コードの中から、最も高い類似度が得られた文字コードを認識結果として出力する（Ｓ１０５）。
【００５７】
ここで、画像変換部２０２の動作について説明する。入力パターン（入力画像）の横方向の画素数をｘとし、文字パターンの縦方向の画素数をｙとすると、画像変換部２０２は、入力パターンを（ｘ＋１）個の縦線と（ｙ＋１）個の横線で区切る。
【００５８】
このとき、画像変換部２０２は、入力パターンが縦横の線で区切られてできる矩形がパターン識別に重要な部分では密に、そうでない部分では疎になるように縦横の線を設定する。
【００５９】
次に、画像変換部２０２は、変換後の文字パターン（出力画像）の中に同じ本数の縦線と横線を配置、つまり領域を等間隔に区切るように縦横の線を設定する。
【００６０】
このように変換後の文字パターンを等間隔に区切ってできる矩形は、変換後の文字パターンの１画素に対応している。この変換後の文字パターンの画素の座標値を（ｉ，ｊ）とする。一方、同じ本数の縦横の線で区切った入力パターンの矩形も変換後の文字パターンの矩形と１対１の対応している。これをＴ（ｉ，ｊ）と記載する。
【００６１】
Ｔ（ｉ，ｊ）の入力パターン中の位置を矩形の左上頂点を表す座標値(ｘｓｔ，ｙｓｔ)、右下頂点を表す座標値(ｘｅｎ，ｙｅｎ)と記述する。ｘｓｔは、矩形の領域を生成するための開始点のｘ座標を示す。ｘｅｎは、矩形の領域を生成するための終了点のｘ座標を示す。ｘ座標系のみに着目した場合、入力パターンの画素のｘ座標と、変換後の文字パターンの画素の位置ｉとの関係は図７に示すようになる。
【００６２】
図７は変換前の座標値ｉから変換後の座標値ｘへの座標変換関数ｆ（ｉ）の定義の例を示したものである。この例は、ｉ軸上にｉ０からｉ６までの点を設定し、これに対応するｘ座標値ｘ０〜ｘ６を設定し、（ｉｒ，ｘｒ）と（ｉｒ＋１、ｘｒ＋１）の間を線分で補間した折れ線グラフによってｆ（ｉ）を定義したものである。
【００６３】
この例で、ｉｒを等間隔で定義すれば、７個の値ｘ０〜ｘ６によって座標変換関数を定義することができる。これと同様にｙ軸方向でもｙ０〜ｙ６の値によって座標変換関数を定義することができる。このｘｒ、ｙｒの値のセットが区分情報としてのパターン変換パラメータの例であり、図２のｔｘ０〜ｔｘｍ、ｔｙ０〜ｔｙｍに対応している。
【００６４】
これにより、入力パターンのサイズをｗ，ｈとし、座標変換関数ｆ（ｉ），ｇ（ｊ）を図７に示すような形で準備して、この変換関数を用いて、ｘｓｔ＝ｆ（ｉ＊ｗ／ｎ），ｘｅｎ＝ｆ（（ｉ＋１）＊ｗ／ｎ），ｙｓｔ＝ｇ（ｊ＊ｈ／ｎ），ｙｅｎ＝ｇ（（ｊ＋１）＊ｈ／ｎ）によってＴ（ｉ，ｊ）の位置を定義し、これによって入力パターンを、文字パターンへ変形させる。
【００６５】
ここで、Ｔ（ｉ，ｊ）の位置から文字パターンの画素値を決める方法を説明する。
【００６６】
ｘ軸上において開始点ｘｓｔから終了点ｘｅｎまで、ｙ軸上において開始点ｙｓｔから終了点ｙｅｎまでで囲まれる領域を、文字パターン中の画素（ｉ，ｊ）に対応する入力パターン上での参照矩形領域とする。この矩形領域内の黒画素の占める割合を積算値ｒとして計算する。そして、これを出力画素値とする。
【００６７】
なお、画素が矩形内に中途半端に含まれるケースの場合、図８に示すように、参照矩形領域をブロックαとして計算する。
【００６８】
ブロックαにおける積算値ｒは、ブロックαに含まれる画素の画素値の積算値をブロックαの面積で割ったものである。画素Ａや画素Ｂのように、その一部分がブロックαに含まれているものについてはその重なりに相当する部分だけを積算する。
【００６９】
この例のケースでは画素の面積を１としたときのブロックαと重なり合っている部分の面積、すなわち面積Ａ、Ｂをそれぞれの画素の画素値に掛けたものをブロックαにおける積算値として積算していく。
【００７０】
画素Ｃのように画素すべてがブロックに含まれる場合にはそのまま積算する。この積算値をブロックαの面積で割ったものが積算値ｒである。
【００７１】
この積算値ｒを文字パターンの画素（ｉ，ｊ）の画素値とする。また、このとき、予め設定された閾値によって２値化処理を行い２値画像に変換することも可能である。このようにして求められた文字パターンに対してパターン認識を行う。
【００７２】
なお、この実施形態以外にも、画像変換パターン変形、入力パターンの認識に有効なエリアを広げる方向に、そうでないエリアを縮める方向に画像を変換する技術であれば、本発明に適用できることはいうまでもない。
【００７３】
従来の文字認識で非線形正規化法という手法がパターンを変形する手法が知られていたが、これはパターンの密度を画像内で一様になるように変形する手法であり、本実施例の変形とは異なるものである。
【００７４】
このようにこの第１実施形態のパターン認識装置によれば、入力パターンの認識にとって重要な部位の領域を密に区分し、そうでない部位の領域を疎に区分した後、各領域がほぼ等しい幅になるように画像変換して文字パターンを生成し、生成した文字パターンについて二次認識を行うので、類似文字の認識にとって重要な部分に対する着目を強めた特徴抽出を行うことができる。
【００７５】
すなわち、入力パターンの認識にとって重要な部位を大きく引き伸ばし、そうでない部位は小さく縮小することによって、認識にとって重要な部分の特徴量を計算するための情報量を増大させることで、類似文字の判別精度を高めることができる。
【００７６】
（第２の実施形態）
次に、図１０、図１１を参照して第２の実施形態について説明する。この第２実施形態は、上記第１実施形態の変形例であり、画像変換の際に使われるパラメータを学習によって求める例である。
【００７７】
第２の実施形態のパターン認識装置は、メモリ２１、画像変換部２２、特徴抽出部２３、辞書記憶部２４、パターン識別部２５、認識結果記憶部３、最適パラメータ判定部４、学習用パターン入力部５、辞書作成部６、暫定パラメータ生成部７、バッファ８および全体制御部９等を有する類似文字認識部１０を備えている。
【００７８】
メモリ２１には、区分情報として画像変換パラメータが記憶されている。画像変換部２２は、入力パターンを画像変換パラメータに従って文字パターンへ変換する。特徴抽出部２３は、変換された文字パターンから特徴を抽出する。
【００７９】
辞書記憶部２４には、標準の文字の特徴と対応する文字コードが記憶されている。パターン識別部２５は、特徴抽出部により抽出された特徴と辞書記憶部２４の文字の特徴とを照合して、特徴が合致した文字コードとその特徴を認識結果として認識結果記憶部３に記憶する。最適パラメータ判定部４は、バッファ８に保持されている中から最適なパラメータを判定する。
【００８０】
学習用パターン入力部５は、学習用の文字画像である学習用パターンの入力を受け付ける。辞書作成部６は、辞書を作成する。暫定パラメータ生成部７は、カレントパラメータから暫定パラメータを複数生成しバッファ８に一次記憶する。全体制御部９は、上記各部を制御して画像変換パラメータの学習機能を実現する。
【００８１】
すなわち、この第２実施形態のパターン認識装置は、区分情報が項目単位のパラメータで構成される場合、カレントパラメータと暫定パラメータの記憶部としてのバッファ８を有し、区分情報を学習によって自動生成するときに、カレントパラメータを構成する項目の変更、削除、追加のうち少なくとも一つを行うことによってカレントパラメータを変動させて複数の暫定パラメータを生成し、この暫定パラメータによって領域の区分、画像変換、文字認識を行い、その文字認識結果に基づいてカレントパラメータを更新し、これを繰り返すことにより、認識精度のよい区分情報を設定する学習部を備える。
【００８２】
続いて、図１１のフローチャートを参照してこの第２実施形態のパターン認識装置の動作を説明する。この場合、暫定パラメータ生成部７は、バッファ８に、カレントパラメータと暫定パラメータとを設定する。
【００８３】
暫定パラメータ生成部７は、画像変換パラメータの初期値としてメモリ２１に予め決めておいた画像変換パラメータ、例えば、何も変換しない等間隔なデータをバッファ８のカレントパラメータにセットする（Ｓ２０１）。
【００８４】
暫定パラメータ生成部７は、バッファ８に保持されているカレントパラメータの一部分を変更してＮ個の画像変換パラメータを作成し（Ｓ２０２）、これを暫定パラメータｉ（ｉ＝０，…，Ｎ−１）とする。
【００８５】
例えばＸ座標について言えば、ある位置から左の画像変換パラメータの値を微小量増加させる等の変更である。あるいは、１つの画像変換パラメータだけを増加させてもよい。
【００８６】
暫定パラメータ生成部７は、作成したＮ個の暫定パラメータをバッファ８に記憶する。
【００８７】
画像変換部２２は、ｉ＝０、つまりカウンタに０をセットして（Ｓ２０３）、認識対象の入力パターンを取り出すポインタを初期化する（Ｓ２０４）。
【００８８】
学習の際に、１つの暫定パラメータについて学習用の文字画像である学習用パターンが学習用パターン入力部５から辞書作成部６へ入力される。
【００８９】
すると、辞書作成部６は、画像変換部２２へ渡し、画像変換部２２は、バッファ８のカレントパラメータを用いて学習用パターンに対して変形処理を行い、辞書作成部６は、この変形したパターンから辞書を作成する（Ｓ２０５）。
【００９０】
受付部１により受け付けられた認識対象の入力パターンが画像変換部２２に入力されると（Ｓ２０６）、画像変換部２２は、バッファ８に保持されている暫定パラメータｉによって、その入力パターンを変形して（Ｓ２０７）、文字パターンを生成し、その文字パターンをから特徴抽出部２３が特徴を抽出し（Ｓ２０８）、抽出した特徴からパターン識別部２５が類似文字のパターン識別を行なう（Ｓ２０９）。
【００９１】
パターン識別部２５は、この際、学習用パターンで作成した辞書記憶部２４の辞書によって類似文字の識別を行う。
【００９２】
これら一連の処理をすべての入力パターンに対して実行し、都度、認識精度を得る。このようにして得られた認識精度と暫定パラメータとの組をメモリ２１に記憶しておく（Ｓ２１０〜Ｓ２１１）。
【００９３】
最適パラメータ判定部４は、一連の認識処理が終了すると（Ｓ２１２〜Ｓ２１４）、メモリ２１に記憶した暫定パラメータの中で最良の認識精度を示す暫定パラメータをバッファ８のカレントパラメータとしてセットする（Ｓ２１５）。これを繰り返して学習を行なう。
【００９４】
すなわち、最適パラメータ判定部４は、暫定パラメータを変動させて認識精度を求め、この値が徐々に良くなるようにバッファ８のカレントパラメータを更新していく。そして、学習が進まなくなる、つまり、前回の結果よりも認識精度が上がらなくなるまで学習を継続する（Ｓ２１５）。
【００９５】
最適パラメータ判定部４は、最終的に得られたカレントパラメータを学習結果としてバッファ８から読み出してメモリ２１に保存する（Ｓ２１６）。
【００９６】
パラメータの変更は上記ではパラメータの値の増減させる例で説明したが、この他、例えばパラメータを取り除く方法や追加させる方法等を適用することが可能である。
【００９７】
（第３の実施形態）
本発明において画像変換部２０２を次のように構成してもよい。出力する画素（ｉ，ｊ）に対応する入力パターンの矩形領域の頂点座標ｘｓｔ，ｘｅｎ，ｙｓｔ，ｙｅｎを縦横の線で区切られた矩形ではなく、任意の位置および大きさの矩形として、重要な部分に密に、そうで無い部分に疎に設定し、その座標値をパターン変換パラメータとして記憶しておき、そのパターン変換パラメータを用いて画像変換を行うことができる。またパターン変換パラメータの値を学習機能で更新して画像変換を行うことも可能である。
【００９８】
また、座標変換の式をｐ＝ｆ（ｉ，ｊ）、ｑ＝ｇ（ｉ，ｊ）で定義してこれによって画像変換を行うことができる。
【００９９】
この場合、変換後の文字パターンの画素の位置（ｉ，ｊ）に対応する入力パターンの画素位置が（ｐ，ｑ）として求まるが、これに基づいて文字パターンの画素値を以下のように決定する。
【０１００】
図９に示したように、（ｐ，ｑ）の位置が入力パターンの画像中の画素（ｋ，ｈ）の中にあり、その画素内の左上から（ｒ，ｓ）の位置に相当しているものとする。
【０１０１】
ここで、入力パターンの画素のサイズは、縦横それぞれ１とする。画素（ｒ，ｓ）の画素値をｖ（ｒ，ｓ）と書く。画素（ｒ，ｓ）に隣接する左の画素は（Ｋ−１，ｈ）、上の画素は（ｋ，ｈ−１）、左上の画素は（Ｋ−１，ｈ−１）とする。このとき、文字パターンの画素の値ｚを次式で定義する。
【０１０２】
ｚ＝（０．５＋ｒ）（０．５＋ｓ）ｖ（ｋ，ｈ）＋（０．５＋ｒ）（０．５−ｓ）ｖ（ｋ，ｈ−１）＋（０．５−ｒ）（０．５＋ｓ）ｖ(Ｋ−１，ｈ）＋（０．５−ｒ）（０．５−ｓ）ｖ（Ｋ−１，ｈ−１）
【０１０３】
なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。また、上記実施形態に開示されている複数の構成要素を適宜組み合わせることにより、種々の発明を構成できる。
【０１０４】
例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【０１０５】
具体的には、類似パターン認識を類似グループ毎に密なエリアの位置が異なる複数個のパターン変換を用意して複数の変換パターンを作成し、そのそれぞれについてパターン識別部で識別を行い、最終的に総合的な判断、例えばもっとも類似度の高いものを正解とするような判断によって最終的な認識結果を決めるようにしても良い。
【０１０６】
以上、複数種類の実施形態を説明したが、これらの実施形態では、パターン認識装置に画像変換部および学習機能を搭載したが、この他、これらの機能をパターン認識装置に搭載せずに、別途用意した画像変換部および学習機能が学習用パターンから画像変換および特徴抽出を行い、その抽出した特徴をパターン認識装置に入力するようにしてもよい。
【０１０７】
一方、パターン認識装置がパターン認識を行っている最中に、別途用意した学習機能が特徴抽出および学習処理を適宜行うようにしても良い。
【０１０８】
上記実施形態では、文字や画像等のデータを対象として説明したが、本発明は、これのみに限定されるものではなく、パターン認識可能な対象物であればどのようなデータでも適用できる。
【図面の簡単な説明】
【０１０９】
【図１】本発明の第１実施形態のパターン認識装置の構成を示す図である。
【図２】文字グループ対応テーブルを示す図である。
【図３】認識対象の文字画像である入力パターンの一例を示す図である。
【図４】パターン認識装置の動作を示すフローチャートである。
【図５】図３の入力パターンを疎および密に区分した様子を示す図である。
【図６】小領域が等しい幅になるように画像変換して生成した文字パターンを示す図である。
【図７】入力パターンを文字パターンへ変換するための変換グラフを示す図である。
【図８】画素が矩形内に中途半端に含まれるケースの計算方法を示す図である。
【図９】変換の際に文字パターンの画素値を決定するための仕組みを示す図である。
【図１０】第２実施形態のパターン認識装置の構成を示す図である。
【図１１】パターン認識装置の動作を示すフローチャートである。
【符号の説明】
【０１１０】
１…受付部、３…認識結果記憶部、４…最適パラメータ判定部、５…学習用パターン入力部、６…辞書作成部、７…暫定パラメータ生成部、８…バッファ、９…全体制御部
２１…メモリ、２２…画像変換部、２３…特徴抽出部、２４…辞書記憶部、２４…ターン識別部、２４…辞書記憶部、２５…パターン識別部、１００…パターン認識装置、１１０…一次認識部、１１１…特徴抽出部、１１２…パターン識別部、１１３…辞書記憶部
１２０…二次認識部、１２１…特徴抽出部、１２２…パターン識別部、１２３…辞書記憶部、１２４−ｘ…類似文字識別部、１２５…切り替え部、１２５ａ…文字グループ対応テーブル、１２６…特徴ベクトル生成部、１２７…最終判定部、２００…区分情報記憶部、２０１…区分部、２０２…画像変換部。

【特許請求の範囲】
【請求項１】
文字画像の入力を受け付ける受付部と、
辞書データとこの辞書データに対応する文字コードとを含む文字認識用の第１辞書と辞書データとこの辞書データに対応する文字コードとを含み、類似する文字のグループ毎に設定された第２辞書とを記憶した辞書記憶部と、
前記受付部により受け付けられた文字画像について前記辞書記憶部に記憶された第１辞書を用いて文字認識することで、認識結果となり得る文字コードの候補を出力する第１文字認識部と、
前記文字画像の領域のうち類似文字の判別に有効な第１領域を密に、この第１領域以外の第２領域を疎に区分するための区分情報が、文字コード毎にグループ分けして設定された区分情報記憶部と、
前記第１文字認識部から出力された文字コードに従って、前記区分情報記憶部の類似文字のグループの区分情報を読み出して、前記文字画像を疎および密の小領域に区分する区分部と、
前記区分部により疎および密の小領域に区分された文字画像を、各小領域が等しい幅になるように変換することで、類似文字判別用の文字画像を生成する画像変換部と、
前記画像変換部により変換された類似文字判別用の文字画像について前記辞書記憶部に記憶された該当グループの第２辞書を用いて文字認識する第２文字認識部と
を具備することを特徴とするパターン認識装置。
【請求項２】
請求項１記載のパターン認識装置において、
前記区分情報が項目単位のパラメータで構成される場合、カレントパラメータと暫定パラメータの記憶部を有し、前記区分情報を学習によって自動生成するときに、前記カレントパラメータを変動させて複数の暫定パラメータを生成し、この暫定パラメータによって領域の区分、画像変換、文字認識を行い、その文字認識結果に基づいて前記カレントパラメータを更新し、これを繰り返すことにより、認識精度のよい前記区分情報を設定する学習部を具備することを特徴とするパターン認識装置。
【請求項３】
コンピュータに入力された文字画像のパターン認識処理を実行させるパターン認識プログラムにおいて、
前記コンピュータを、
前記文字画像の入力を受け付ける受付部と、
辞書データとこの辞書データに対応する文字コードとを含む文字認識用の第１辞書と辞書データとこの辞書データに対応する文字コードとを含み、類似する文字のグループ毎に設定された第２辞書とを記憶した辞書記憶部と、
前記受付部により受け付けられた文字画像について前記辞書記憶部に記憶された第１辞書を用いて文字認識することで、認識結果となり得る文字コードの候補を出力する第１文字認識部と、
前記文字画像の領域のうち類似文字の判別に有効な第１領域を密に、この第１領域以外の第２領域を疎に区分するための区分情報が、文字コード毎にグループ分けして設定された区分情報記憶部と、
前記第１文字認識部から出力された文字コードに従って、前記区分情報記憶部の類似文字のグループの区分情報を読み出して、前記文字画像を疎および密の小領域に区分する区分部と、
前記区分部により疎および密の小領域に区分された文字画像を、各小領域が等しい幅になるように変換することで、類似文字判別用の文字画像を生成する画像変換部と、
前記画像変換部により変換された類似文字判別用の文字画像について前記辞書記憶部に記憶された該当グループの第２辞書を用いて文字認識する第２文字認識部
として機能させることを特徴とするパターン認識プログラム。
【請求項４】
文字画像の入力を受付部が受け付けるステップと、
前記受付部により受け付けられた文字画像について、第１文字認識部が、辞書データとこの辞書データに対応する文字コードとを含む第１辞書を用いて文字認識することで、認識結果となり得る文字コードの候補を出力するステップと、
前記第１文字認識部から出力された文字コードに従って、区分部が、前記文字画像の領域のうち類似文字の判別に有効な第１領域を密に、この第１領域以外の第２領域を疎に区分するための区分情報が文字コード毎にグループ分けして設定された区分情報記憶部から、類似文字のグループの区分情報を読み出して、前記文字画像を疎および密の小領域に区分するステップと、
前記区分部により疎および密の小領域に区分された文字画像を、画像変換部が、各小領域が等しい幅になるように変換することで、類似文字判別用の文字画像を生成するステップと、
前記画像変換部により変換された類似文字判別用の文字画像について、第２文字認識部が、辞書データとこの辞書データに対応する文字コードとを含み、類似する文字のグループ毎に設定された中の該当グループの第２辞書を用いて文字認識するステップと
を有することを特徴とするパターン認識方法。

【図１】