説明

文字認識装置及び文字認識方法

【課題】文字の潰れやボケを補完して文字輪郭線の形状を鮮明にし、文字認識精度を向上させることを目的とする。
【解決手段】2値化画像に基づいて認識された文字が所定の文字である場合に、画像及び2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成し、拡大画像から微分フィルタを用いて文字列の輪郭線を抽出した輪郭線抽出画像を生成する。また、輪郭線抽出画像の輝度を反転させた反転画像を生成し、反転画像から2値化反転画像を生成し、この2値化反転画像と拡大2値化画像との論理積画像を生成する。そして、論理積画像から2値化論理積画像を生成し、2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、車両番号等の文字列を認識する文字認識装置に係り、特に、画数が多く潰れて見える文字や、輪郭線の特徴が少なく区別しにくい文字などに対しても高精度に文字の認識を行うことができる文字認識装置に関するものである。
【背景技術】
【0002】
従来、車両のナンバープレートに記載された車両番号などの記載内容を自動認識する装置が知られている。
ナンバープレートの記載内容を認識するには、画像処理技術を用いた文字認識手法が用いられている。このような文字認識手法は、一般には、対象の文字画像を入力した後、文字と背景を分離するために2値化して文字線を強調し、文字であると判断できる領域を抽出する(文字切り出し処理)。文字切り出しされた領域において、文字の形状特徴(例えば輪郭線の方向特徴量など)を抽出し、パターン認識により文字を認識する。
【0003】
ところで、ナンバープレートは、その形状、大きさ、記載される文字列等が各国毎に相違し、例えば、画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)が含まれたナンバープレートも散見される。このような場合には、従来の文字認識装置では、正しい認識結果が得られないことがある。
そこで、特開2004−164469号公報(特許文献1)には、文字が潰れる箇所を予め形状パターンとして記録しておき、この形状パターンから潰れを補完する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−164469号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載された技術では、予め記録すべき形状パターンが多いことから、形状パターンを記憶するために大容量の記憶装置が必要となるという問題があった。
【0006】
本発明は、上記問題を解決するためになされたもので、大容量の記憶装置を設けることなく、文字列に画像処理を施すことにより、文字列の潰れやボケを補完して文字輪郭線の形状を鮮明にし、文字認識精度を向上させた文字認識装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明は以下の手段を採用する。
【0008】
本発明は、文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識装置であって、前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成する拡大手段と、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成する論理積画像生成手段と、前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識手段と、を備えたことを特徴とする文字認識装置を提供する。
【0009】
本発明によれば、文字列を撮影した画像から生成された2値化画像に基づいて認識された文字が、所定の文字であると判断された場合に、再度文字認識処理を行う。すなわち、まず文字列を撮影した画像と、この画像から生成された2値化画像とを所定の倍率で拡大する。ここで、所定の文字とは、例えば、画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などがあり、予め記憶装置などに記憶しておくことが好ましい。また、所定の倍率とは、後の処理で微分フィルタにより画像に含まれる文字の輪郭線を抽出する際に、より効果が出るような倍率に設定される。従って、入力される画像の文字のサイズにより異なるが、概ね、入力された画像の1.5倍以上2.0倍以下に設定されることが好ましい。この画像を拡大することで、後の輪郭線強調処理の効果をより高めることが出来る。また、後の処理で論理積画像を求めるときに、2値化された画像も同倍率で拡大されている必要があることから、ここでは、文字列を撮影した画像及びその2値化画像の双方を同倍率で拡大する。
【0010】
さらに、拡大された画像に対して、微分フィルタを用いて文字列の輪郭線を抽出した輪郭線抽出画像を生成するので、輪郭線からその輝度勾配の強度や方向を把握することができる。この輪郭線抽出画像を一旦反転させて反転画像を得た上で、反転画像を2値化して2値化反転画像を生成し、先に拡大された拡大2値化画像と2値化反転画像との論理積画像を生成する。これにより、潰れやボケが生じた文字の輪郭線の形状がより鮮明となる。そして、論理積画像を2値化して2値化論理積画像を生成し、2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。なお、ここで所定の文字認識特徴量とは、例えば、文字の輪郭線の方向特徴量や、局所領域の文字線の面積充填率などの構造特徴量があり、認識する文字に応じて特徴量を適宜選択し、選択した特徴量に基づいてマッチング処理を行うことが出来る。
【0011】
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
【0012】
本発明は、文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識装置であって、前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像を所定の倍率に拡大して拡大画像を生成する拡大手段と、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識手段と、を備えたことを特徴とする文字認識装置を提供する。
【0013】
本発明によれば、文字列を撮影した画像から生成された2値化画像に基づいて認識された文字が、所定の文字であると判断された場合に、再度文字認識処理を行う。すなわち、まず文字列を撮影した画像を所定の倍率で拡大する。この画像を拡大することで、後の輪郭線強調処理の効果をより高めることが出来る。さらに、拡大された画像に対して、微分フィルタを用いて文字列の輪郭線を抽出した輪郭線抽出画像を生成するので、輪郭線からその輝度勾配の強度や方向を把握することができる。この輪郭線抽出画像を2値化して2値化論理積画像を生成し、2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。
【0014】
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
【0015】
上記文字認識装置において、前記拡大画像に対して先鋭化処理を行う先鋭化手段を備え、前記輪郭線抽出手段は、前記先鋭化手段により先鋭化された拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成することが好ましい。
【0016】
先鋭化処理手段により拡大画像に先鋭化処理を行うことで、輪郭線抽出画像を生成した際に、輪郭線をさらに強調することができ、認識対象の文字の潰れやボケがより強い場合であっても、先鋭化によりさらに強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
【0017】
また、上記文字認識装置において、前記文字認識手段は、抽出する前記文字認識特徴量を異ならせ、異なる前記文字認識特徴量に基づいて複数回マッチング処理を行うことにより複数回文字を認識し、複数回の認識結果から最も認識頻度の高い文字を、最終的な認識結果として出力することが好ましい。
【0018】
文字認識特徴量を異ならせて複数回の文字認識処理を実行して、複数回の文字認識処理の結果に基づいて最終的な文字認識結果を出力するので、文字認識の信頼度が高まり、文字認識精度がより向上する。
【0019】
また、上記文字認識装置において、前記2値化論理積画像又は前記2値化輪郭線抽出画像から所定領域を選択する領域選択手段を備え、前記文字認識手段は、該所定領域に対してマッチング処理を行うことにより文字を認識することが好ましい。
【0020】
前記2値化論理積画像又は前記2値化輪郭線抽出画像から所定領域を選択し、選択された所定領域においてマッチング処理などの文字認識処理を実行するので、文字認識処理にかかる演算量が減少するため、文字認識処理に要する時間を短縮することが出来るとともに、潰れやボケとは無関係な領域に関する文字認識特徴量の影響を受けることなく、文字認識処理が可能となるので、文字認識精度がより向上する。なお、所定の領域とは、文字の潰れやボケが生じることにより誤認識を招来させる可能性のある領域であり、例えば、CとGとで潰れやボケが生じるのは文字の右下部分であり、WとMとでは文字の中心部分となる。所定の領域に関する情報、すなわち、潰れやボケが生じやすい領域に関する情報は、予め潰れ情報として例えば記憶手段等に記憶しておくことが好ましい。
【0021】
本発明は、文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成するステップと、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成するステップと、前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、を備えたことを特徴とする文字認識方法を提供する。
【0022】
本発明は、文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像を所定の倍率に拡大して拡大画像を生成するステップと、前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、を備えたことを特徴とする文字認識方法を提供する。
【発明の効果】
【0023】
このように、本発明によれば、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
【図面の簡単な説明】
【0024】
【図1】本発明の第1の実施形態にかかる文字認識装置の概略構成を示すブロック図である。
【図2】本発明の第1の実施形態にかかる文字認識装置における文字認識処理の過程を示すフローチャートである。
【図3】本発明の第2の実施形態にかかる文字認識装置の概略構成を示すブロック図である。
【図4】本発明の第2の実施形態にかかる文字認識装置における文字認識処理の過程を示すフローチャートである。
【図5】本発明の第1の実施形態にかかる文字認識装置の変形例における文字認識処理の過程を示すフローチャートである。
【図6】本発明の第1の実施形態にかかる文字認識装置の変形性における文字認識処理の過程を示すフローチャートである。
【発明を実施するための形態】
【0025】
以下に、本発明に係る文字認識装置の実施形態について、図面を参照して説明する。
〔第1の実施形態〕
図1は、本発明の第1の実施形態に係る文字認識装置の概略構成を示したブロック図である。
【0026】
本発明における文字認識装置10は、車両のナンバープレートを撮影して画像を得るカメラ11と、カメラ11で撮影した画像の入力を受ける画像入力部12と、画像入力部12に入力された画像に基づいて文字認識処理を実行する認識処理部13と、認識処理部13での認識結果を出力する認識結果出力部14を備えている。
【0027】
認識処理部13は、文字認識処理を実行するための演算を行うものであり、文字認識処理に関する各種演算処理を実行するCPU(中央演算処理装置)21、文字認識処理にかかるプログラム等を記憶する読み出し専用のメモリであるROM(Read Only Memory)22、CPU21の作業領域として機能する読み書き自在のメモリであるRAM(Random Access Memory)23、及び文字認識処理にかかるプログラムに基づく文字認識処理を実行するに際して必要となる種々のデータが格納された記憶装置24を備えている。
【0028】
また、認識処理部13は、文字認識手段としての文字認識部25、拡大手段としての拡大部26、輪郭線抽出手段としての輪郭線抽出部27、及び論理積画像生成手段としての論理積画像生成部28を備えている。
【0029】
文字認識部25は、画像入力部12により入力された画像から2値化画像を生成し、2値化画像に基づいて、この画像に含まれる文字を認識するとともに、後述する論理積画像生成部29により生成された論理積画像から2値化論理積画像を生成し、この2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。ここで、所定の文字認識特徴量とは、例えば、文字の輪郭線の方向特徴量や、局所領域の文字線の面積充填率などの構造特徴量があり、認識する文字に応じて特徴量を適宜選択し、選択した特徴量に基づいてマッチング処理を行うことが出来る。
【0030】
拡大部26は、CPU21により、文字認識部25により認識された文字が、所定の文字であると判断された場合に、この文字を含む画像と、この画像を2値化することにより得られた2値化画像を所定の倍率に拡大する。ここで、所定の文字とは、例えば、画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などであり、予め記憶装置24に記憶されている。また、所定の倍率とは、後述する輪郭線抽出部27において微分フィルタにより画像に含まれる文字の輪郭線を抽出する際に、より効果が出るような倍率に設定される。従って、入力される画像の文字のサイズにより異なるが、概ね、入力された画像の1.5倍以上2.0倍以下に設定されることが好ましい。
【0031】
輪郭線抽出部27は、画像入力部12により入力され、拡大部26で拡大された画像に対して、Sobel微分などの1次微分フィルタを用いて画像の空間1次微分を計算し、画像に含まれる文字の輪郭線を抽出する(輪郭線強調処理)。また、輪郭線強調処理がなされた画像に対して、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。このように、輪郭線強調処理及び輪郭線細線化処理をすることで輪郭線抽出画像を生成する。
【0032】
論理積画像生成部28は、まず輪郭線抽出画像の輝度を反転させた反転画像を生成し、反転画像から2値化反転画像を生成し、この2値化反転画像と拡大2値化画像との論理積画像を生成する。
【0033】
文字認識部25、拡大部26、輪郭線抽出部27、及び論理積画像生成部28は、いずれもCPU21が所定のROM22に格納された処理プログラムをRAM23に展開し、展開したプログラムを実行することによって実現される処理部であり、その処理については後述する。
【0034】
以下、本実施形態における文字認識処理について図2を参照して説明する。図2は、本実施形態における文字認識処理の過程を示すフローチャートである。
【0035】
図2に示すように、カメラ11で撮影されたナンバープレートの画像は認識処理部13に入力され、本実施形態における文字認識処理が開始される。すなわち、入力された画像を文字認識部25により2値化して2値化画像が生成され、ステップS100において、2値化画像に基づいて文字認識処理が行われる。すなわち、ステップS100では、文字認識部25が、2値化画像よって強調された文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。
【0036】
続いて次のステップS101では、ステップS100の認識結果に基づいて、類似度が1位、すなわち、類似度合いが最も高い文字が、上述した画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などの所定の文字に該当するか否かを判定する。この結果、所定の文字に該当すると判断された場合には次のステップS102に進み、ステップS102で、類似度が高い順に1位の文字と2位の文字とをさらに比較する。類似度が1位の文字の類似度と2位の文字が近い、すなわち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合には、ステップS103に進む。なお、ステップS101において、認識結果の文字が所定の文字に該当しないと判断された場合、及びステップS102において類似度が1位の文字と類似度が2の文字とに差があると判定された場合には、ステップS103以降の処理を行わずに本ルーチンを終了する。
【0037】
ステップS103では、拡大部26が、入力された画像と、この画像を2値化して得られた2値化画像を所定の倍率に拡大して、拡大画像と拡大2値化画像を生成する。次のステップS104では、輪郭線抽出部27が、ステップS103で拡大された拡大画像に対して、Sobelフィルタ等の微分フィルタにより画像データの空間1次微分を計算し、画像データの中の文字の輪郭線を抽出する(輪郭線強調処理)。さらに、輪郭線抽出部27は、ステップS105で、ステップS104において輪郭線強調処理がなされた画像に対して、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。このように、輪郭線強調処理及び輪郭線細線化処理をすることで輪郭線抽出画像を生成する。
【0038】
すなわち、輪郭線抽出部27が、ステップS104で輪郭線強調処理がなされた画像に対して、水平方向に勾配がある画素を抽出して輪郭線の方向を算出し(垂直エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。また同様に、ステップS104で輪郭線強調処理がなされた画像データに対して、垂直方向に勾配がある画素を抽出して輪郭線の方向を算出し(水平エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。
【0039】
続いて、ステップS106では、論理積画像生成部28が、輪郭線抽出画像に対して輝度を反転させて反転画像を生成し、さらにこの反転画像を2値化することにより2値化反転画像を生成する。そして、この2値化反転画像と拡大2値化画像との論理積を算出して論理積画像を生成する。
【0040】
ステップS107では、文字認識部25が、ステップS106で得られた論理積画像を2値化することにより2値化論理積画像を生成し、2値化画像よって強調された2値化論理積画像の文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。そして、類似度が最も高いとされた文字を認識結果として認識結果出力部14へ出力し、本ルーチンを終了する。
【0041】
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
【0042】
〔第2の実施形態〕
次に、本発明の第2の実施形態について、図3を用いて説明する。
【0043】
本実施形態の文字認識処理が上述した第1の実施形態と異なる点は、図3に示すように、論理積画像生成部を設けない点にある。すなわち、本実施形態の文字認識装置は、論理積画像を生成せずに、輪郭線抽出画像から2値化輪郭線抽出画像を生成し、この2値化輪郭線抽出画像に基づいて文字を認識する。以下、本実施形態の文字認識処理について、第1の実施形態と共通する点については説明を省略し、異なる点について説明する。
【0044】
本実施形態の文字認識装置30の認識処理部は、図3に示すように、文字認識手段としての文字認識部25、拡大手段としての拡大部26、及び輪郭線抽出手段としての輪郭線抽出部27を備えている。
【0045】
文字認識部25は、画像入力部12により入力された画像から2値化画像を生成し、2値化画像に基づいて、この画像に含まれる文字を認識するとともに、輪郭線抽出部27により生成された輪郭線抽出画像から2値化輪郭線抽出画像を生成し、この2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する。
以下、本実施形態における文字認識処理について図4を参照して説明する。図4は、本実施形態における文字認識処理の過程を示すフローチャートである。
【0046】
図4に示すように、カメラ11で撮影されたナンバープレートの画像は認識処理部13に入力され、本実施形態における文字認識処理が開始される。すなわち、入力された画像を文字認識部25により2値化して2値化画像が生成され、ステップS200において、2値化画像に基づいて文字認識処理が行われる。すなわち、ステップS200では、文字認識部25が、2値化画像よって強調された文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。
【0047】
続いて次のステップS201では、ステップS200の認識結果に基づいて、類似度が1位、すなわち、類似度合いが最も高い文字が、上述した画数が多いために潰れて見える文字(例えば、W、Mなど)や、文字輪郭線の特徴が乏しいために互いに区別するのが困難な文字(例えば、CとG、DとQと0など)などの所定の文字に該当するか否かを判定する。この結果、所定の文字に該当すると判断された場合には次のステップS202に進み、ステップS202で、類似度が高い順に1位の文字と2位の文字とをさらに比較する。類似度が1位の文字の類似度と2位の文字が近い、すなわち、類似度が1位の文字の類似度と2位の文字の類似度とに予め設定された閾値以上の差がない場合には、ステップS203に進む。なお、ステップS201において、認識結果の文字が所定の文字に該当しないと判断された場合、及びステップS202において類似度が1位の文字と類似度が2の文字とに差があると判定された場合には、ステップS203以降の処理を行わずに本ルーチンを終了する。
【0048】
ステップS203では、拡大部26が、入力された画像と、この画像を2値化して得られた2値化画像を所定の倍率に拡大して、拡大画像と拡大2値化画像を生成する。次のステップS204では、輪郭線抽出部27が、ステップS203で拡大された拡大画像に対して、Sobelフィルタ等の微分フィルタにより画像データの空間1次微分を計算し、画像データの中の文字の輪郭線を抽出する(輪郭線強調処理)。さらに、輪郭線抽出部27は、ステップS205で、ステップS204において輪郭線強調処理がなされた画像に対して、非極大輪郭画素を抑制することで輪郭線を細線化する(輪郭線細線化処理)。このように、輪郭線強調処理及び輪郭線細線化処理をすることで輪郭線抽出画像を生成する。
【0049】
すなわち、輪郭線抽出部27が、ステップS204で輪郭線強調処理がなされた画像に対して、水平方向に勾配がある画素を抽出して輪郭線の方向を算出し(垂直エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。また同様に、ステップS204で輪郭線強調処理がなされた画像データに対して、垂直方向に勾配がある画素を抽出して輪郭線の方向を算出し(水平エッジ画像生成)、輪郭線に垂直な方向で輪郭線輝度値がピーク値となる点(極大点)を探索し、これを真の輪郭線上の点として抽出する。
【0050】
続いて、ステップS206では、文字認識部25が輪郭線抽出画像を2値化することにより2値化輪郭線抽出画像を生成する。
【0051】
ステップS207では、文字認識部25が、ステップS206で得られた2値化輪郭線抽出画像の文字線に基づいて、文字であると判断できる領域を抽出し(文字切り出し処理)、切り出された領域において、文字認識特徴量として文字の形状特徴(例えば、輪郭線の方向特徴や構造特徴など)を抽出し、マッチング処理、すなわち、認識対象の文字と予め備えられたパターンとの比較によりその類似度を判定して文字を認識する。そして、類似度が最も高いとあされた文字を認識結果として認識結果出力部14へ出力し、本ルーチンを終了する。
【0052】
このように、文字認識対象の画像を拡大して輪郭線をより強調し、より強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
【0053】
なお、上述した第1の実施形態及び第2の実施形態の文字認識装置において、輪郭線抽出部27による輪郭線抽出画像の生成に先立って、拡大画像に対してアンシャープマスキング処理などの先鋭化処理を行う先鋭化処理手段(図示せず)を設けることもできる。先鋭化処理手段により拡大画像に先鋭化処理を行うことで、輪郭線抽出画像を生成した際に、輪郭線をさらに強調することができ、認識対象の文字の潰れやボケがより強い場合であっても、先鋭化によりさらに強調された輪郭線の明暗や輝度勾配に基づいて文字認識を行うので、入力された文字画像に潰れやボケが生じている場合であってもその輪郭線を鮮明に認識することができ、文字認識精度が向上する。
【0054】
また、文字の潰れやボケが生じることにより誤認識を招来させる可能性のある領域は、その文字によってある程度定められる。例えば、CとGとで潰れやボケが生じるのは文字の右下部分であり、WとMとでは文字の中心部分となる。このため、予めこれらの所定の文字において潰れやボケが生じやすい領域に関する情報を潰れ情報として記憶手段24等に記憶しておき、この潰れ情報に基づいて潰れやボケの生じる領域を選択する領域選択手段(図示せず)を設けることが出来る。
【0055】
図5は、第1の実施形態にかかる文字認識装置の変形例であって、領域選択手段を設けた文字認識装置にかかる文字認識処理の過程を示すフローチャートである。論理積画像の生成までの処理は、上述した図2のフローチャートにおけるステップS100からステップS106の処理と同様であるので説明を省略する。
図5に示すように、文字認識装置は、論理積画像を生成した後に、ステップS300で、図示しない領域選択手段により、潰れ情報に基づいて、認識対象の文字の潰れやボケが生じやすい領域を選択する。次のステップS301では、文字認識部25が、ステップS300で選択された領域内においてのみ、文字認識の基礎となる文字認識特徴量を抽出する。ステップS302では、文字認識部25が、先に抽出された文字認識特徴量に基づいて、選択された領域にのみ2値化やマッチング処理等の上記した文字認識処理を実行すればよい。第2の実施形態の文字認識装置においては、文字認識処理による輪郭線抽出画像の2値化に先立って、輪郭線抽出画像から所定の領域を選択し、選択された領域について上記したステップS301及びステップS302の文字認識処理を実行すればよい。
【0056】
このようにすることで、文字認識処理にかかる演算量が減少するため、文字認識処理に要する時間を短縮することが出来るとともに、潰れやボケとは無関係な領域に関する文字認識特徴量の影響を受けることなく、文字認識処理が可能となるので、文字認識精度がより向上する。
【0057】
上記した、先鋭化手段及び領域選択手段もCPU21が所定のROM22に格納された処理プログラムをRAM23に展開し、展開したプログラムを実行することによって実現される処理部として機能する。
【0058】
さらに、図6に示すように、文字認識手段は、論理積画像の生成後又は輪郭線抽出画像の生成後に、これらの画像から抽出する前記文字認識特徴量を異ならせ、異なる前記文字認識特徴量に基づいて複数回マッチング処理を行うことにより複数回文字を認識し、複数回の認識結果から最も認識頻度の高い文字を、最終的な認識結果として出力することもできる。
【0059】
図6は、第1の実施形態にかかる文字認識装置の変形例にかかる文字認識処理の過程を示すフローチャートである。論理積画像の生成までの処理は、上述した図2のフローチャートにおけるステップS100からステップS106の処理と同様であるので説明を省略する。
【0060】
図6に示すように、文字認識装置は、論理積画像を生成した後に、ステップS401、S501、S601で夫々、認識対象の文字から異なる文字認識特徴量を抽出する。すなわち、ステップS401では、輪郭線方向頻度を、ステップS501では、構造特徴を、ステップS601では、その他の文字認識特徴量を夫々抽出する。次のステップS402、S502、S602では、夫々の文字認識特徴量に基づいてマッチング処理を行うことにより文字を認識する。これらの処理は、平行して行ってもよく、順次行ってもよい。そして、ステップS403で、先のステップにおける認識結果に基づいて、最も類似度が高い文字、すなわち、最も認識頻度の高い文字を認識結果として、認識結果出力部14へ出力し本ルーチンを終了する。第2の実施形態の文字認識装置においては、文字認識処理による輪郭線抽出画像から異なる文字認識特徴量を抽出し、抽出された文字認識特徴量に基づいて夫々文字認識処理を実行すればよい。
このように、文字認識特徴量を異ならせて複数回の文字認識処理を実行して、複数回の文字認識処理の結果に基づいて最終的な文字認識結果を出力するので、文字認識の信頼度が高まり、文字認識精度がより向上する。
【符号の説明】
【0061】
10 文字認識装置
11 カメラ
12 画像入力部
13 認識処理部
14 認識結果出力部
25 文字認識部
26 拡大部
27 輪郭線抽出部
28 論理積画像生成部
30 文字認識装置

【特許請求の範囲】
【請求項1】
文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識装置であって、
前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成する拡大手段と、
前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、
前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成する論理積画像生成手段と、
前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識手段と、
を備えたことを特徴とする文字認識装置。
【請求項2】
文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識装置であって、
前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像を所定の倍率に拡大して拡大画像を生成する拡大手段と、
前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成する輪郭線抽出手段と、
前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識する文字認識手段と、
を備えたことを特徴とする文字認識装置。
【請求項3】
前記拡大画像に対して先鋭化処理を行う先鋭化手段を備え、
前記輪郭線抽出手段は、前記先鋭化手段により先鋭化された拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成することを特徴とする請求項1又は請求項2に記載の文字認識装置。
【請求項4】
前記文字認識手段は、抽出する前記文字認識特徴量を異ならせ、異なる前記文字認識特徴量に基づいて複数回マッチング処理を行うことにより複数回文字を認識し、複数回の認識結果から最も認識頻度の高い文字を、最終的な認識結果として出力することを特徴とする請求項1乃至請求項3の何れか1項に記載の文字認識装置。
【請求項5】
前記2値化論理積画像又は前記2値化輪郭線抽出画像から所定領域を選択する領域選択手段を備え、
前記文字認識手段は、該所定領域に対してマッチング処理を行うことにより文字を認識することを特徴とする文字認識方法。
【請求項6】
文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、
前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像及び前記2値化画像を所定の倍率に拡大して拡大画像及び拡大2値化画像を生成するステップと、
前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、
前記輪郭線抽出画像の輝度を反転させた反転画像を生成し、該反転画像から2値化反転画像を生成し、該2値化反転画像と前記拡大2値化画像との論理積画像を生成するステップと、
前記論理積画像から2値化論理積画像を生成し、該2値化論理積画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、
を備えたことを特徴とする文字認識方法。
【請求項7】
文字列を撮像した画像から2値化画像を生成し、該2値化画像に基づいて文字を認識する文字認識方法であって、
前記2値化画像に基づいて認識された文字が所定の文字である場合に、前記画像を所定の倍率に拡大して拡大画像を生成するステップと、
前記拡大画像から微分フィルタを用いて前記文字列の輪郭線を抽出した輪郭線抽出画像を生成するステップと、
前記輪郭線抽出画像から2値化輪郭線抽出画像を生成し、該2値化輪郭線抽出画像から所定の文字認識特徴量を抽出してマッチング処理を行うことにより文字を認識するステップと、
を備えたことを特徴とする文字認識方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−191909(P2010−191909A)
【公開日】平成22年9月2日(2010.9.2)
【国際特許分類】
【出願番号】特願2009−38389(P2009−38389)
【出願日】平成21年2月20日(2009.2.20)
【出願人】(000006208)三菱重工業株式会社 (10,378)
【Fターム(参考)】