説明

画像処理装置および画像処理方法

【課題】文字画像から文字を認識する精度を向上する。
【解決手段】この画像処理装置は、文書画像が記憶されたメモリと、文字とその特徴データが対応して格納された認識辞書と、前記メモリから読み出した文書画像に対して所定の前処理を施して文字画像を生成する前処理部と、前記前処理部より生成された文字画像を、系統毎に異なる処理でいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算する複数の計算系統と、前記複数の計算系統による計算結果として得られる複数の類似度を一つに統合する類似度統合部とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および画像処理方法に関する。
【背景技術】
【0002】
画像処理装置としては、例えば画像に含まれる文字を認識する文字認識装置がある。文字認識装置において、複数の特徴量を用いて文字認識を行う技術の一つとして相互部分空間法という認識技術が提唱されている。この認識技術は1枚の文字画像の多様な特徴に着目して認識を行うものである(例えば非特許文献1参照)。
【0003】
一方、文字画像には、1枚ごとに位置ずれや角度などによる変動要因が存在する。これに対応してパターン認識を行うための一つの手法として部分空間法という技術が公開されているが、その対応能力は必ずしも完全とはいえない(例えば非特許文献2参照)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】前田賢一、渡辺貞一「局所的構造を導入したパターン・マッチング法」、電子通信学会論文誌Vol.J68-D, No.3, 1985.
【非特許文献2】石井健一郎ほか「わかりやすいパターン認識」(1998)、オーム社
【発明の概要】
【発明が解決しようとする課題】
【0005】
部分空間法では、例えば学習パターンの中にこれらの変動要因が多く含まれていなければ、実用上は必ずしも大きな対応能力を発揮しないこともあり得る。また、入力画像の変動が余りにも大きい場合、部分空間法といえども対応できず、認識精度が低下する。
【0006】
本発明はこのような課題を解決するためになされたもので、文字画像から文字を認識する精度を向上することのできる画像処理装置および画像処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記した課題を解決するために、本発明の画像処理装置は、文書画像が記憶されたメモリと、文字とその特徴データが対応して格納された認識辞書と、前記メモリから読み出した文書画像に対して所定の前処理を施して文字画像を生成する前処理部と、前記前処理部より生成された文字画像をいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算する第1計算系統と、前記文字画像を第1計算系統とは異なる処理でいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算する第2計算系統と、前記第1計算系統により計算された類似度と前記第2計算系統により計算された類似度とを一つに統合する類似度統合部とを具備することを特徴とする。
【0008】
本発明の画像処理方法は、文書画像が記憶されたメモリ、文字とその特徴データが対応して格納された認識辞書、前処理部、第1計算系統、第2計算系統、類似度統合部を有する画像処理装置による画像処理方法において、前記メモリから読み出した文書画像を前記前処理部が所定の前処理を施して文字画像を生成するステップと、前記文字画像を前記第1計算系統がいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算するステップと、前記第1計算系統とは異なる処理で前記文字画像を前記第2計算系統がいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算するステップと、前記第1計算系統により計算された類似度と前記第2計算系統により計算された類似度とを前記類似度統合部が一つに統合するステップとを有することを特徴とする。
【発明の効果】
【0009】
本発明によれば、文字画像から文字を認識する精度を向上することができる。
【図面の簡単な説明】
【0010】
【図1】本発明の一実施形態の画像処理装置の構成を示す図である。
【図2】画像処理装置の動作を示すフローチャートである。
【図3】4近傍ガウシアンフィルタを説明するための図である。
【図4】8近傍ガウシアンフィルタを説明するための図である。
【発明を実施するための形態】
【0011】
以下、図面を参照して、本発明の一つの実施の形態の画像処理装置を詳細に説明する。
【0012】
図1に示すように、この実施形態の画像処理装置は、入力部1、コンピュータ2(以下「PC2」と称す)、出力部3などを有している。
【0013】
入力部1は、カメラ・スキャナなどの外部入力装置であり、紙の文書(書類)からCCDセンサなどにより光学的に読み取った文書画像をPC2に入力する。出力部3は、例えばモニタなどの表示装置、プリンタなどの印刷装置であり、PC2から出力された認識結果のデータを出力(表示または印刷)する。
【0014】
PC2は、メモリ10、前処理部11、パターン生成部12a,12b、特徴抽出部13a,13b、認識辞書14a,14b、部分類似度計算部15a,15b、類似度統合部16などを有している。これら各部はコンピュータのハードディスクにインストールされたソフトウェアのモジュールとして実現される。なお、これら各部はハードウェアで構成してもよい。
【0015】
パターン生成部12a、特徴抽出部13a、認識辞書14a、部分類似度計算部15aは、第1計算系統4である。この第1計算系統4は、前処理部11より生成された文字画像22をいくつかの文字パターン23,24に変化させた上で認識辞書14aに格納されている文字27aとの類似度を計算する。
【0016】
パターン生成部12b、特徴抽出部13b、認識辞書14b、部分類似度計算部15bは、第2計算系統5である。この第2計算系統5は、前処理部11より生成された文字画像22を第1計算系統4とは異なる処理でいくつかの文字パターン25,26に変化させた上で認識辞書14aに格納されている文字27bとの類似度を計算する。
第1計算系統4および第2計算系統5は、前処理部11より生成された文字画像を、系統毎に異なる処理でいくつかのパターンに変化させた上で、対応する認識辞書14a,14bに格納されている文字との類似度を計算する複数の計算系統である。
【0017】
メモリ10は、オペレーティングシステム(OS)などのコンピュータ制御プログラムが読み込まれる領域として利用される他、上記各部による演算用および処理用の記憶領域として利用される。メモリ10には、例えば比較処理のための画像データや処理結果のデータなどが記憶される。
【0018】
前処理部11は、文字認識に使用する画像(文字画像)の部分的な切り出し、二値化、ノイズ除去、輪郭強調などの所定の前処理を行う。前処理部11は、所定の前処理として、文字画像の部分的な切り出し、二値化、ノイズ除去、輪郭強調などのうちの少なくとも一つを行うものとする。これら個々の画像処理技術については、既知の技術のため詳細な説明は省略する。
【0019】
パターン生成部12a,12bは、前処理部11で前処理済みの画像を拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換するなどの画像加工処理を行って、元の文字画像を変化(変形または変質)させた新たな画像を生成する。
パターン生成部12aは、文字画像に対して第1画像加工処理を行うことで複数の異なる文字パターン23,24を有する第1文字パターン群を生成する。パターン生成部12aは、第1画像加工処理として、例えば文字(黒画素)の移動処理を行うものとする。
パターン生成部12bは、文字画像に対して第2画像加工処理を行うことで複数の異なる文字パターン25,26を有する第2文字パターン群を生成する。パターン生成部12bは、第2画像加工処理として、例えば文字(黒画素)の移動処理と文字(黒画素)の拡張処理とを行うものとする。文字の移動処理とは、文字の取り得る範囲(文字枠)内で文字の位置をずらす(黒画素を平行移動する)処理である。文字の拡張処理とは文字の線を画素単位で太くする処理である。
【0020】
特徴抽出部13aは、パターン生成部12aにより生成された第1文字パターン群の中の個々の文字パターン23,24の特徴量(以下特徴データと称す)を抽出する。特徴抽出部13bは、パターン生成部12bにより生成された第2文字パターン群の中の個々の文字パターン25,26の特徴量(以下特徴データと称す)を抽出する。
【0021】
文字画像23,24と文字画像25,26とは、異なる種別の画像加工処理が行われた結果の画像であるものとする。異なる画像加工処理とは一部に同じ加工処理を含んでいてもよい。
【0022】
認識辞書14a,14bには、予め複数(多く)の文字とその特徴データが対応して格納されている。認識辞書14aには、パターン生成部12aで生成される文字パターン23,24を認識するための文字27aの特徴パターン(特徴データとテキストデータ)が格納されている。認識辞書14bには、パターン生成部12bで生成される文字パターン25,26を認識するための文字27bの特徴パターン(特徴データとテキストデータ)が格納されている。
【0023】
部分類似度計算部15aは、特徴抽出部13aにより抽出された複数の特徴データと認識辞書14aに格納されている文字の特徴データとの類似度を、演算により求める。
部分類似度計算部15bは、特徴抽出部13bにより抽出された複数の特徴データと認識辞書14bに格納されている文字の特徴データとの類似度を、演算により求める。演算とは、メモリ10に記憶されている式(5)〜式(7)に示す計算式(関数)に、特徴データを入れて計算することをいう。
【0024】
類似度統合部16は、第1計算系統4により計算された類似度と第2計算系統5により計算された類似度とを一つに統合する。より具体的には、類似度統合部16は、部分類似度計算部15a,15bによりそれぞれ計算された複数の部分類似度を一つに統合する。類似度の統合には、メモリ10に記憶されている式(8)で示す類似度統合関数σを用いる。
【0025】
以下、図2のフローチャートおよび図3,図4を参照してこの画像処理装置の動作を説明する。
【0026】
認識対象の文書をカメラ・スキャナなどの入力部1にセットして、デジタルカメラであれば撮影操作、またスキャナであればスキャン操作を行うと、入力部1により文書の画像が読み取られてPC2へデジタル画像(これを「文書画像21」と称す)として出力される。
【0027】
入力部1から出力された文書画像21がPC2に入力されると、その文書画像21は、前処理部11により一旦、メモリ10に記憶される(図2のステップS101)。
【0028】
文書画像21をメモリ10に記憶した後、前処理部11は、メモリ10から文書画像21を読み出し、読み出した文書画像21に対して所定の前処理を施して文字認識の対象となる文字画像22を生成し(ステップS102)、メモリ10に記憶する。所定の前処理とは、画像の部分切り出し、二値化、ノイズ除去、輪郭強調などの画像処理のうちの予め決められた処理である。所定の前処理により生成された文字画像22は、例えば「A」のような文字とする。
【0029】
パターン生成部12aは、メモリ10から文字画像22を読み出し、読み出した文字画像22(前処理済みの画像)に対して第1の画像加工処理を行うことで複数個の異なる文字パターン群(図1の文字パターン23,24)を生成し(ステップS103)、メモリ10に記憶する。第1の画像加工処理は、画像の拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換などの処理のうち予め決められた処理である。第1の画像加工処理により生成された文字パターン群を第1文字パターン群と言う。
【0030】
文字パターン23は、文字画像22(前処理済みの画像)に対して文字枠内左上に移動された文字「A」である。文字パターン24は、文字画像22(前処理済みの画像)に対して文字枠内左下に移動された文字「A」である。
また、パターン生成部12aとほぼ同時にパターン生成部12bは、メモリ10から文字画像22を読み出し、読み出した文字画像22(前処理済みの画像)に対して第2の画像加工処理を行うことで複数個の異なる文字パターン群(図1の文字パターン25,26)を生成し(ステップS104)、メモリ10に記憶する。第2の画像加工処理により生成された文字パターン群を第2文字パターン群と言う。
【0031】
第2の画像加工処理は、画像の拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換などの処理のうち予め決められた処理であり、第1の画像加工処理とは異なる処理である。
文字パターン25は、文字画像22(前処理済みの画像)に対して文字枠内右上に移動されかつ太字とされた文字「A」である。文字パターン26は、文字画像22(前処理済みの画像)に対して文字枠内右下に移動されかつ太字とされた文字「A」である。
【0032】
すなわち、第1の画像加工処理と第2の画像加工処理は、画像の拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換などの処理のうち予め決められた異なる処理である。
【0033】
特徴抽出部13aは、メモリ10から第1文字パターン群、つまり複数の文字パターン23,24を読み出し、読み出した文字パターン23,24からそれぞれの特徴データを抽出し(ステップS105)、メモリ10に記憶する。これとほぼ同時に特徴抽出部13bは、メモリ10から第2文字パターン群、つまり複数の文字パターン25,26を読み出し、読み出した文字パターン25,26からそれぞれの特徴データを抽出し(ステップS106)、メモリ10に記憶する。
【0034】
部分類似度計算部15a,15bは、メモリ10から文字パターン23,24それぞれの特徴データを読み出し、読み出した複数の特徴データと認識辞書14aから読み出した文字27aの特徴データとを用いて部分類似度を計算し(ステップS107)、メモリ10に記憶する。
【0035】
これとほぼ同時に部分類似度計算部15bは、メモリ10から文字パターン25,26それぞれの特徴データを読み出し、読み出した複数の特徴データと認識辞書14bから読み出した文字27bの特徴データとを用いて部分類似度を計算し(ステップS108)、メモリ10に記憶する。
【0036】
類似度統合部16は、計算されたそれぞれの文字パターン群の部分類似度をメモリ10より読み出して統合する(ステップS109)。
【0037】
そして、類似度統合部16は、統合した類似度を用いて、類似度の高い文字を認識辞書14a,14bから選出(ステップS110)、つまりパターン認識処理を行い、認識結果の文字(テキストデータおよび認識元の文字画像22)を出力部3へ出力し、出力部3が例えば表示装置であれば、認識結果を表示装置の画面に表示する。
【0038】
ここで、パターン生成部12a,12bが行う文字パターンの生成処理(画像処理)について説明する。
【0039】
パターン生成部12a,12bは、前処理部11で前処理済みの画像を拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換するなどの所定の画像加工処理を行って、元の文字画像22を切り出し範囲(文字枠の範囲)内で変動(変形または変質)させて新たな画像を複数生成し、生成した複数の画像を画像加工処理の方式に従ってグループ化(グループ分け)する。
【0040】
例えば1つ目のグループは前処理済画像に拡張処理を施したもの、2つ目のグループは前処理済画像に収縮処理を施したもの、3つ目のグループは前処理済画像に回転処理を施したもの、といったグループ分けが考えられる。
【0041】
画像拡張処理の一例として、例えば各画素について、その画素または上下左右4画素のうち1つ以上が黒ならばその画素も黒とするといった処理を行う。
【0042】
画像収縮処理の一例として、例えば各画素について、その画素または上下左右4画素のうち1つ以上が白ならばその画素も白とする(収縮)といった処理を行う。
【0043】
画像の回転および移動については、前処理済みの画像において座標xの画素値をf(x)で表したとき、
【数1】

で表されるRu[f],Ss[f]をそれぞれ、回転行列Uおよび移動量sをパラメータとする回転済み、または移動済み画像とすることができる。この処理によって、座標U-1x,(x−s)にあった黒点が座標xの位置にそれぞれ回転・平行移動する。
【0044】
画像の回転については、例えば10度刻みに90度までといったようにして回転する。また画像の移動については、例えば前処理済画像の辺や対角線の長さを基準に、例えば1/4などといった比率を用いて移動する。
【0045】
画像のぼかし、手ぶれ処理については、これらを実現する点拡がり関数(PSF)を準備し、前処理済みの画像に畳み込み処理を行い、それを再度二値化する。
【0046】
ぼかしに対応する点拡がり関数(PSF)は、図3に示すように、中心画素とその周囲8方向に隣接する画素とを配置した9画素モデルにおいて、中心の画素を「2」としたときに、その上下左右の画素を「1」とし、斜め方向の画素を「0」とする4近傍ガウシアンフィルタがある。
【0047】
また、この他、図4に示すように、中心画素とその周囲8方向に隣接する画素とを配置した9画素モデルにおいて、中心の画素を「4」としたときに、その上下左右の画素を「2」とし、斜め方向の画素を「1」とする8近傍ガウシアンフィルタなどを用いる。
【0048】
手ぶれに対応する点拡がり関数(PSF)としては、原点Oの近傍に一点Pを選び、
【数2】

として作ることができる。点拡がり関数(PSF)として1(y)を原画像f(x)に畳み込む処理は、
【数3】

と表せる。上記h(x)が畳み込み処理後の画像である。
【0049】
透視変換は、射影変換の名で広く知られており、一般的な射影幾何学の文献、例えば川又雄二郎「射影空間の幾何学」(2001)、朝倉書店等に開示されている射影変換の技術を利用するものとする。
【0050】
特徴抽出部13a,13bが前処理済みの画像(文字パターン23,24または25,26)から特徴量を抽出する処理を以下に示す。
例えば、画像に前述の方法でぼかし処理を施した上で、そのぼかし処理した画像を、画素値を成分とするベクトルとみなしてそのまま特徴量とする方法がある。このとき、上記画像のグループ毎に、異なった特徴抽出を行ってもよい。
【0051】
また、部分類似度計算部15a,15bがパターン認識処理を行う方法および認識辞書14a,14bの作成方法としては、非特許文献2に開示されているCLAFIC法に基づいて認識辞書14a,14bを作成した上で、複数の生成パターンの特徴量と、認識辞書14a,14bに登録済みの文字種との類似度を、相互部分空間法などを用いて計算する。
【0052】
相互部分空間法を用いた類似度の計算方法としては、例えば特徴抽出部13a,13bから入力された複数の特徴ベクトルのグループαの元
【数4】

を計算し、その固有ベクトルをuα,uαとした上で、0≦p≦m,0≦q≦nとなる整数p、qを選んだ上で、行列U=(uα,…uα),V=(v…v)を用いて定義される
【数5】

の最大固有値ραを求め、このραを類似度とする。ただし、左肩のtは転置を表す。このときραは、例えば二宮市三編著「数値計算のわざ」(2006)、共立出版)などに開示されている累乗法などの既知の計算方法を用いて計算する。ただし、v1 ,vn は辞書データであり、これは各文字種毎に予め準備した学習パターンy1,…,ynを用いて行列
【数6】

を計算し、その固有ベクトルをv1 ,vn とすることで計算できる。
【0053】
この例では、認識辞書14a,14bは、各パターン生成部12a,12bに対応する部分類似度計算部15a、15bごとに別の学習パターンを用意して個別に設けているが、全ての部分類似度計算部15a、15bにおいて共通の認識辞書を用いてもよい。
【0054】
類似度計算統合部16の処理としては、各グループの部分類似度がρ1,…,ρμと表されるとき、ある類似度統合関数σを用いて
【数7】

と定まるρを類似度とする。
【0055】
このとき、類似度統合関数σの定め方としては、部分類似度のうち最大のものを選ぶ方法、部分類似度が大きい順にいくつかを選びこれを平均する方法、部分類似度全体の平均を取る方法がある。また、選択した部分類似度に直接平均操作を施すかわりに、一度単調増加関数を用いて部分類似度の差を強調してもよい。
【0056】
そのためには、単調増加関数τを用いて
【数8】

などとする方法がある。ただし、rは1≦r≦μとなる整数であり、ρt(s)は、ρ1,…,ρμのうち大きいものからs番目の値である。
【0057】
さらに、τの例としては
【数9】

などが挙げられる。ただし、ρ0 ,βは定数として適当なものを別途選ぶ。
【0058】
類似度統合部16の別の実現方法として、非特許文献2に開示されているニューラルネットなどの既存の方法を用いてもよい。また、部分類似度計算部15a,15bおよび類似度統合部16において、顕著に類似度が高い文字種が存在しない場合、結果不明としてこれをリジェクトしてもよい。
【0059】
このようにこの実施形態の画像処理装置によれば、認識対象の文字画像の文字(黒画素)について積極的に部分的な変化(黒画素を所定のルールでずらしたり太くしたりする等)を起こさせた異なる文字パターンを含む文字パターン群を複数生成し、それぞれの文字パターン群の複数の特徴データと対応する認識辞書14a,14bの特徴データとの部分類似度を計算し、得られた部分類似度を一つに統合するので、文字認識精度を向上することができる。
【0060】
なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。
上記実施形態では、第1計算系統4と第2計算系統5の2つの計算系統を例示したが、この他、例えば第3計算系統、第4計算系統を加えても良く、その以上、多数(複数)の計算系統を加え、各計算系統の計算で得られた複数の類似度を統合しても良い。
この場合、複数の計算系統は、前処理部11より生成された文字画像を、系統毎に異なる処理でいくつかのパターンに変化させた上で、それぞれ対応する認識辞書14a,14bに格納されている文字との類似度を計算することになる。また類似度統合部6は、複数の計算系統による計算結果として得られる複数の類似度を一つに統合することになる。
【0061】
また、上記実施形態の各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよい。
さらに、プログラムを、コンピュータ読取可能なCD−ROMなどの記憶媒体に記憶しておき、プログラムを記憶媒体からコンピュータに読み取らせることで実現してもよい。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
【符号の説明】
【0062】
1…入力部、2…コンピュータ(PC)、3…出力部、4…第1計算系統、5…第2計算系統、10…メモリ、11…前処理部、12a,12b…パターン生成部、13a,13b…特徴抽出部、14a,14b…認識辞書、15a,15b…部分類似度計算部、16…類似度統合部。

【特許請求の範囲】
【請求項1】
文書画像が記憶されたメモリと、
文字とその特徴データが対応して格納された認識辞書と、
前記メモリから読み出した文書画像に対して所定の前処理を施して文字画像を生成する前処理部と、
前記前処理部より生成された文字画像をいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算する第1計算系統と、
前記文字画像を第1計算系統とは異なる処理でいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算する第2計算系統と、
前記第1計算系統により計算された類似度と前記第2計算系統により計算された類似度とを一つに統合する類似度統合部と
を具備することを特徴とする画像処理装置。
【請求項2】
文書画像が記憶されたメモリと、
文字とその特徴データが対応して格納された認識辞書と、
前記メモリから読み出した文書画像に対して所定の前処理を施して文字画像を生成する前処理部と、
前記前処理部より生成された文字画像に対して第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成する第1パターン生成部と、
前記前処理部より生成された文字画像に対して第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成する第2パターン生成部と、
前記第1パターン生成部により生成された第1文字パターン群の複数の文字パターンそれぞれから特徴データを抽出する第1特徴抽出部と、
前記第2パターン生成部により生成された第2文字パターン群の複数の文字パターンそれぞれからから特徴データを抽出する第2特徴抽出部と、
前記第1特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第1類似度計算部と、
前記第2特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第2類似度計算部と、
前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを所定の類似度統合関数により一つに統合する類似度統合部と
を具備することを特徴とする画像処理装置。
【請求項3】
請求項1乃至2いずれか記載の画像処理装置において、
前記前処理部は、
所定の前処理として、前記文字画像の部分的な切り出し、二値化、ノイズ除去、輪郭強調などのうちの少なくとも一つを行うことを特徴とする画像処理装置。
【請求項4】
請求項2記載の画像処理装置において、
前記第1パターン生成部は、
前記第1画像加工処理として、拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換のうちの少なくとも一つを行い、
前記第2パターン生成部は、
前記第2画像加工処理として、拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換のうち、前記第1画像加工処理とは異なる画像加工処理を行うことを特徴とする画像処理装置。
【請求項5】
請求項1乃至2いずれか記載の画像処理装置において、
前記類似度統合部は、
各文字パターン群の類似度がρ1,…,ρμと表されるとき、類似度統合関数σを用いて、類似度ρをσ(ρ1,…,ρμ)という計算式で計算することを特徴とする画像処理装置。
【請求項6】
請求項1乃至2いずれか記載の画像処理装置において、
前記類似度統合部は、
統合した類似度を用いて、類似度の高い文字を認識辞書から選出することを特徴とする画像処理装置。
【請求項7】
文書画像が記憶されたメモリ、文字とその特徴データが対応して格納された認識辞書、前処理部、第1計算系統、第2計算系統、類似度統合部を有する画像処理装置による画像処理方法において、
前記メモリから読み出した文書画像を前記前処理部が所定の前処理を施して文字画像を生成するステップと、
前記文字画像を前記第1計算系統がいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算するステップと、
前記第1計算系統とは異なる処理で前記文字画像を前記第2計算系統がいくつかのパターンに変化させた上で前記認識辞書に格納されている文字との類似度を計算するステップと、
前記第1計算系統により計算された類似度と前記第2計算系統により計算された類似度とを前記類似度統合部が一つに統合するステップと
を有することを特徴とする画像処理方法。
【請求項8】
文書画像が記憶されたメモリ、文字とその特徴データが対応して格納された認識辞書、前処理部、第1パターン生成部、第2パターン生成部、第1特徴抽出部、第2特徴抽出部、第1類似度計算部、第2類似度計算部、類似度統合部を有する画像処理装置による画像処理方法において、
前記メモリから文書画像を前記前処理部が読み出し、読み出した前記文書画像に対して所定の前処理を施して文字画像を生成するステップと、
前記文字画像に対して前記 第1パターン生成部が第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成するステップと、
前記文字画像に対して前記 第2パターン生成部が第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成するステップと、
前記第1画像加工処理を行うことにより生成された第1文字パターン群の複数の文字パターンそれぞれから前記第1特徴抽出部が特徴データを抽出する前記複数の文字パターンからそれぞれの特徴データを抽出するステップと、
前記第2画像加工処理を行うことにより生成された第2文字パターン群の複数の文字パターンそれぞれから前記第2特徴抽出部が特徴データを抽出するステップと、
前記第1特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第1類似度計算部が計算するステップと、
前記第2特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第2類似度計算部が計算するステップと、
前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを前記類似度統合部が一つに統合するステップと
を有することを特徴とする画像処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2010−182167(P2010−182167A)
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願番号】特願2009−26104(P2009−26104)
【出願日】平成21年2月6日(2009.2.6)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】