画像認識装置、画像認識方法
【課題】画質の違いによらず安定して画像を認識できる画像認識装置および画像認識方法を提供する。
【解決手段】本発明の一態様に係る画像再生装置は、画像のぼけレベルを測定する測定部と、測定部で測定されたぼけレベルを閾値と比較する比較部と、測定部で測定されたぼけレベルが、閾値よりも小さい場合、画像にぼけレベルを大きくするぼけ変換フィルタを適用し、測定部で測定されたぼけレベルが、閾値よりも大きい場合、画像にぼけレベルを小さくする鮮鋭変換フィルタを適用する画像処理部と、画像処理部で処理された画像の特徴から画像を認識する認識部と、を具備する。
【解決手段】本発明の一態様に係る画像再生装置は、画像のぼけレベルを測定する測定部と、測定部で測定されたぼけレベルを閾値と比較する比較部と、測定部で測定されたぼけレベルが、閾値よりも小さい場合、画像にぼけレベルを大きくするぼけ変換フィルタを適用し、測定部で測定されたぼけレベルが、閾値よりも大きい場合、画像にぼけレベルを小さくする鮮鋭変換フィルタを適用する画像処理部と、画像処理部で処理された画像の特徴から画像を認識する認識部と、を具備する。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、予め辞書に登録されている画像パタンとの比較により入力画像を認識する画像認識装置および画像認識方法に関する。
【背景技術】
【0002】
従来の画像認識装置には、入力画像に所定の処理を行い正規化した標本化パタンを生成した後、この標本化パタンと、予め記憶部に登録されている複数のパタンとの類似度を比較して入力画像を認識していた。しかしながら、従来の画像認識装置は、類似度を算出するための演算処理が膨大であり、画像認識に時間がかかっていた。そこで、画像の各画素の濃淡(画素値)を特徴量として、入力画像を認識する方法が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平2−166583号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の画像認識装置では、画像の画質を考慮せず、すべての画像を一律に画像処理した後、画像認識していた。このため、画像認識の結果が、画像の画質に左右され安定した画像の認識ができなかった。
上記に鑑み、本発明は、画質の違いによらず安定して画像を認識できる画像認識装置および画像認識方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の一態様に係る画像認識装置は、画像のぼけレベルを測定する測定部と、測定部で測定されたぼけレベルを閾値と比較する比較部と、測定部で測定されたぼけレベルが、閾値よりも小さい場合、画像にぼけレベルを大きくするぼけ変換フィルタを適用し、測定部で測定されたぼけレベルが、閾値よりも大きい場合、画像にぼけレベルを小さくする鮮鋭変換フィルタを適用する画像処理部と、画像処理部で処理された画像の特徴から画像を認識する認識部と、を具備する。
【0006】
本発明の一態様に係る画像認識方法は、画像のぼけレベルを測定するステップと、ぼけレベルを閾値と比較するステップと、ぼけレベルが、閾値よりも小さい場合、画像にぼけレベルを大きくするぼけ変換フィルタを適用し、測定部で測定されたぼけレベルが、閾値よりも大きい場合、画像にぼけレベルを小さくする鮮鋭変換フィルタを適用するステップと、フィルタ適用後の画像の特徴から画像を認識するステップと、を具備する。
【発明の効果】
【0007】
本発明によれば、画質の違いによらず安定して画像を認識できる画像認識装置および画像認識方法を提供できる。
【図面の簡単な説明】
【0008】
【図1】第1の実施形態に係る画像認識装置の構成の一例を示した図である。
【図2】勾配フィルタの一例を示した図である。
【図3】勾配フィルタの一例を示した図である。
【図4】ぼけ変換フィルタの一例を示した図である。
【図5】ぼけ変換フィルタの一例を示した図である。
【図6】単位インパルスを示した図である。
【図7】単位インパルスに勾配フィルタを適用した結果を示した図である。
【図8】単位インパルスに合成フィルタを適用した結果を示した図である。
【図9】入力画像の一例を示した図である。
【図10】正規化後の画像の一例を示した図である。
【図11】第1の実施形態に係る画像認識装置の動作の一例を示したフローチャートである。
【図12】第2の実施形態に係る画像認識装置の構成の一例を示した図である。
【図13】第2の実施形態に係る画像認識装置の動作の一例を示したフローチャートである。
【発明を実施するための形態】
【0009】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
(第1の実施形態)
図1は、第1の実施形態に係る画像認識装置の構成の一例を示した図である。図2は、勾配フィルタの一例を示した図である。図3は、勾配フィルタの一例を示した図である。図4は、ぼけ変換フィルタの一例を示した図である。図5は、ぼけ変換フィルタの一例を示した図である。図6は、単位インパルスを示した図である。図7は、単位インパルスに勾配フィルタを適用した結果を示した図である。図8は、単位インパルスに合成フィルタを適用した結果を示した図である。図9は、入力画像の一例を示した図である。図10は、正規化後の画像の一例を示した図である。
【0010】
なお、画像認識においては、画像が適度にぼけている場合のほうが、画像の認識率が高くなることが知られている。そこで、第1の実施形態に係る画像認識装置1では、入力画像のぼけレベルを測定し、ぼけレベルが所定の値となるように画像をぼけ変換または鮮鋭変換した後に画像の認識を行っている。このため、第1の実施形態に係る画像認識装置1は、画像の画質の違いによらず安定して画像を認識できる。
【0011】
以下、図1ないし図10を用いて、第1の実施形態に係る画像認識装置1の構成について説明する。図1に示すように、この第1の実施形態に係る画像認識装置1は、記憶部11、記憶部12、正規化部13、ぼけ測定部14、ぼけ比較部15、画像処理部16、特徴抽出部17および認識部18を具備する。
【0012】
記憶部11には、勾配フィルタL、ぼけ変換フィルタGε、鮮鋭フィルタSδ、画像のぼけレベルを示すパラメータであるぼけ量βと最大値Mとの関係式、および目標値αなどが記憶されている。以下、各項目について説明する。
【0013】
(勾配フィルタL)
勾配フィルタLは、ぼけ測定部14において、正規化部13から入力される正規化画像のぼけ量βを測定する際に用いられる。この勾配フィルタLは、画像の2次元勾配を求めるフィルタであり、ラプラシアンフィルタ、Prewittフィルタ、Sobelフィルタ等が使用できる。
【0014】
図2、図3は、このような勾配フィルタLの一例を示した図である。図2には、4近傍ラプラシアンフィルタを示している。図3には、8近傍ラプラシアンフィルタを示している。
【0015】
(ぼけ変換フィルタGε)
ぼけ変換フィルタGεは、正規化部13で正規化された画像のぼけ量βを大きく(増大)するフィルタである。このようなフィルタとしては、下記(1)式を満たすものが使用できる。
【数1】
ここで、εは、画像のぼけレベルを示すパラメータである。
【0016】
(1)式は、パラメータε1を有するぼけ変換フィルタGε1と、パラメータε2を有するぼけ変換フィルタGε2とを連続して正規化画像に適用することが、パラメータε1+ε2を有するぼけ変換フィルタGε1+ε2を正規化画像に適用することと近似的に同じであればよいことを意味する。
【0017】
上記条件を満たすぼけ変換フィルタGεとしては、例えば、図4、図5に示すフィルタがある。図4は、4近傍ガウシアンフィルタを示した図である。図5は、8近傍ガウシアンフィルタを示した図である。ここで、パラメータεは、下記(2)式を満たす必要がある。
0<ε<1…(2)
【0018】
(鮮鋭変換フィルタSδ)
鮮鋭変換フィルタSδは、正規化部13で正規化された画像のぼけ量βを小さく(減少)するフィルタである。このようなフィルタとしては、下記(3)式を満たすものが使用できる。
【数2】
ここで、δは、画像の鮮鋭の度合いを示すパラメータである。
【0019】
(3)式は、パラメータεを有するぼけ変換フィルタGεと、パラメータδを有する鮮鋭変換フィルタSδとを連続して正規化画像に適用することが、パラメータε―δを有するぼけ変換フィルタGε―δを正規化画像に適用することと近似的に同じであればよいことを意味する。
【0020】
鮮鋭変換フィルタSδの一例として、図2に示す4近傍ラプラシアンフィルタを用いたものを下記(4)式に示す。
Sδ=I−δ・L4/(1−4δ)…(4)
Iは、恒等変換を表わしている。L4は、4近傍ラプラシアンフィルタを表わしている。
【0021】
(ぼけ量βと最大値Mとの関係式)
この第1の実施形態では、ぼけ量βを算出するために、図6に示す単位インパルスdがぼけによって劣化する過程を事前にシミュレートしている。そして、規格化画像のぼけ量βと、規格化画像に勾配フィルタLを適用した際に得られる各画素の絶対値の最大値Mとの関係式を導出している。
【0022】
図6中のKは、ぼけのない理想的な画像での画素値の最大値である。このKの値は、実験的に決定することができる。Mは、正規化部13で正規化された画像に上記勾配フィルタLを適用した際に得られる各画素の絶対値の最大値である。
【0023】
ぼけ量βと最大値Mとの関係式の導出は、以下のように行う。
1.単位インパルスdに、上述した勾配フィルタLと、ぼけ変換フィルタGεとを合成した合成フィルタL・Gεを適用する。
2.合成フィルタL・Gεを適用した後の画像の各画素の画素値の最大値を、εをパラメータとする関数P(ε)の解として、下記(5)式を定義する。
P(ε)=M…(5)
【0024】
そして、上記式(5)の解となるεをぼけ量βとすることで、画素値の最大値Mとぼけ量βとの関係式を得ることができる。(5)式を厳密に解くことが難しい場合は、近似解を用いてもよい。
【0025】
勾配フィルタLとして図2に示す4近傍ラプラシアンフィルタ、ぼけ変換フィルタGεとして図4に示す4近傍ガウシアンフィルタを用いた例を以下に示す。この場合、図6に示す単位インパルスdにぼけ変換フィルタGεを適用すると図7に示す結果が得られる。図6に示す単位インパルスdに、合成フィルタL・Gεを適用すると図8に示す結果が得られる。
【0026】
図7、図8に示す結果を(5)式へ適用すると下記(6)式を得ることができる。
β=1−M/4K…(6)
以上により、ぼけ量βと最大値Mとの関係式が導出される。
【0027】
(目標値α)
目標値αは、画像を効率的よく認識できる時の画像のぼけ量βである。ぼけ測定部14で測定される画像のぼけ量βを、この目標値αと一致もしくは近くなるように画像を処理することで、画質の違いによらず安定して画像を認識できる。
【0028】
この第1の実施形態では、目標値αを以下のようにして決定している。
1.この画像認識装置1に入力される可能性のある様々な画像を正規化した正規化画像を生成する。
2.勾配フィルタLを用いて、各正規化画像のぼけ量βを算出する。
3.算出されたぼけ量βの平均値αpを算出する。
4.ぼけ変換フィルタGのパラメータをαfとした際に下記(7)式で与えられるαを目標値とする。
α=αp+αf…(7)
【0029】
記憶部12は、入力画像の認識に必要な画像パタンが登録されている辞書メモリである。
【0030】
正規化部13は、入力画像を正規化して正規化画像を生成する。図9は、正規化部13へ入力される画像101の一例を示した図である。正規化部13は、図9に示す画像101が外部から入力されると、入力画像101から認識対象部分を切り出す。そして、この切り出した画像を画素値に応じて黒画素および白画素に2値化する。入力画像の2値化は行っても行わなくてもよい。
【0031】
次に、正規化部13は、2値化された画像の縦幅または横幅を、拡大もしくは縮小することにより、入力画像中の文字の大きさおよび位置を正規化する。図10は、正規化部13により正規化された画像を示した図である。この第1の実施形態では、入力画像は、画素の配列が11行×11列の画像に正規化される。図10では、白画素の値は“0”、黒画素の値は“1”となっている。画素の配列は、11行11列に限られず様々な配列を採用することができる。
【0032】
ぼけ測定部14は、正規化部13から入力される画像のぼけ量βを測定する。ぼけ測定部14は、記憶部11に記憶されている勾配フィルタLを読出し、正規化部13から入力される画像上に投影する。そして、勾配フィルタLで定義された重みに従って画像の画素値を算出する。
【0033】
例えば、図10に示す画像の左上の部分102へ、図2に示す4近傍ラプラシアンフィルタを投影した場合の画素値は、1となる。ぼけ測定部14は、図10に示す画像の左上の部分102から1画素分右方向へシフトしながら画素値を算出する。
【0034】
そして、画像の右端まで画素値を算出すると、下へ1画素分シフトする。そして、上記と同様の計算により画素値を算出する。ぼけ測定部14は、残りの部分についても同様にして画素値を算出する。画像の画素配列が11行11列であることから、ぼけ測定部14では、9行9列の合計81個の画素値が算出される。ぼけ量測定部では、この算出した81個の画素値の絶対値の中の最大値Mを取得する。
【0035】
次に、ぼけ測定部14は、取得した最大値Mを、記憶部11に記憶されている(5)式へ代入して、ぼけ量βを算出する。ノイズの影響を避けるために、算出された画素値の上位一定数を最大値の取得対象から外して、残りの中から最大値を取得してもよい。画素値は、必ずしも9行9列の合計81個を算出する必要はなく、例えば、2画素分シフトしながら画素値を算出するようにしてもよい。あるいは、画像の外には画素値0の画素があるものとみなし、11行11列の合計121個の画素値を算出してもよい。
【0036】
ぼけ量測定14にメモリを設け、該メモリに上記勾配フィルタLおよび(5)式を記憶しておくようにしてもよく、ぼけ測定部14で測定されたぼけ量βが、予め定めた範囲を外れている場合には、該画像を破棄して処理を中断してもよい。
【0037】
ぼけ比較部15は、ぼけ測定部14から入力されたぼけ量βを、記憶部11に記憶されている目標値αと比較する。ぼけ比較部15は、ぼけ量βが目標値αよりも小さい場合、正規化部13から入力された画像をぼけ変換するよう画像処理部16へ指示する。ぼけ比較部15は、ぼけ量βが目標値αよりも大きい場合、正規化部13から入力された画像を鮮鋭変換するよう画像処理部16へ指示する。ぼけ量βが目標値αと同じ値であれば、正規化部13から入力された画像をそのまま特徴抽出部17へ入力するよう画像処理部16へ指示する。ぼけ量比較部にメモリを設け、該メモリに上記目標値αを記憶しておくようにしてもよい。
【0038】
画像処理部16は、ぼけ比較部15からの指示に基づいて、正規化部13から入力された画像をぼけ変換または鮮鋭変換する。画像処理部16は、画像をぼけ変換する場合、記憶部11に記憶されているぼけ変換フィルタGεを読み出して画像へ適用する。この際のぼけ変換フィルタGεのパラメータεは、α−βに設定される。
【0039】
画像処理部16は、画像を鮮鋭変換する場合、記憶部11に記憶されている鮮鋭変換フィルタSδを読み出して、画像へ適用する。この際の鮮鋭変換フィルタSδのパラメータδは、β−αに設定される。
【0040】
特徴抽出部17は、画像処理部16から入力される画像処理後の画像の特徴を抽出する。この際、画像処理部16から入力される画像を構成する各画素値をベクトルとみなし、この画素値をそのまま特徴量として抽出するようにしてもよい。
【0041】
認識部18は、特徴抽出部17から入力される特徴量に最も近い特徴量を有する画像パタンを記憶部12に登録されている画像パタンから検索する。次に、認識部18は、検索した画像パタンを認識結果として出力する。認識部18における画像認識には、CLAFIC法などが使用できる。
【0042】
次に、第1の実施形態に係る画像認識装置1の動作について説明する。
図11は、画像認識装置1の動作の一例を示したフローチャートである。
【0043】
正規化部13は、入力画像を正規化する(ステップS101)。
ぼけ測定部14は、正規化部13から入力される画像のぼけ量βを算出する(ステップS102)。ぼけ比較部15は、ぼけ測定部14から入力されるぼけ量βを、ぼけ量の目標値αと比較する(ステップS103)。
【0044】
ぼけ比較部15は、ぼけ測定部14で算出されたぼけ量βが目標値αよりも小さい場合、正規化部13から入力された画像をぼけ変換するよう画像処理部16へ指示する。ぼけ比較部15は、ぼけ測定部14で算出されたぼけ量βが目標値αよりも大きい場合、正規化部13から入力された画像を鮮鋭変換するよう画像処理部16へ指示する。ぼけ比較部15は、ぼけ測定部14で算出されたぼけ量βが目標値αと同じ値である場合、正規化部13から入力された画像をそのまま特徴抽出部17へ入力するよう画像処理部16へ指示する。
【0045】
画像処理部16は、ぼけ比較部15からぼけ変換するよう指示を受けると、正規化部13から入力された画像をぼけ変換する(ステップS104)。画像処理部16は、ぼけ比較部15から鮮鋭変換するよう指示を受けると、正規化部13から入力された画像を鮮鋭変換する(ステップS105)。画像処理部16は、ぼけ比較部15からそのまま特徴抽出部17へ入力するよう指示を受けると、正規化部13から入力された画像をそのまま特徴抽出部17へ入力する(ステップS106)。
【0046】
特徴抽出部17は、画像処理部16から入力される画像処理後の画像の特徴を抽出する(ステップS107)。認識部18は、特徴抽出部17から入力される特徴量に最も近い特徴量を有する画像パタンを記憶部12から検索する。次に、認識部18は、検索した画像パタンを認識結果として出力する(ステップS108)。
【0047】
以上のように、この第1の実施形態に係る画像認識装置1は、入力画像のぼけ量βを測定する。そして、入力画像のぼけ量βが目標値αと異なる場合には、入力画像のぼけ変換または鮮鋭変換を施した後、画像を認識する。
【0048】
このため、画像の認識結果が、入力画像の画質の違いに左右されない。その結果、安定した画像認識が可能である。また、予めぼけ量βとMとの関係式を求めておき、この関係式に基づいて画像をぼけ変換または鮮鋭変換している。このため、一度のぼけ変換または鮮鋭変換で、画像認識に適切なぼけ量を有する画像に変換できる。
【0049】
(第2の実施形態)
第1の実施形態では、予めぼけ量βと画素値の最大値Mとの関係式を求め、該関係式により画像をぼけ変換または鮮鋭変換する実施形態について説明した。この第2の実施形態では、画素値の最大値Mが予め測定により算出された範囲内に収まるまで画像をぼけ変換または鮮鋭変換する実施形態について説明する。
【0050】
図12は、第2の実施形態に係る画像認識装置2の構成の一例を示した図である。以下、図12を使用して、この第2の実施形態に係る画像認識装置2を説明する。図1で説明した構成要素と同一の構成要素については、同一の符号を付して重複した説明を省略する。この第2の実施形態では、最大値Mが、ぼけレベルを表わすパラメータとなる。
【0051】
この第2の実施形態に係る画像認識装置2は、記憶部11A、記憶部12、正規化部13、ぼけ測定部14A、ぼけ比較部15A、画像処理部16A、特徴抽出部17、認識部18を具備する。
【0052】
記憶部11Aには、勾配フィルタL、ぼけ変換フィルタGε、鮮鋭フィルタSδ、閾値Tmax、閾値Tminなどが記憶されている。以下各項目について説明するが、勾配フィルタL、ぼけ変換フィルタGε、鮮鋭フィルタSδについては、第1の実施形態で説明したため重複した説明を省略する。
【0053】
(閾値Tmax、Tmin)
この第2の実施形態では、画像認識率が所定の認識率となる場合の画素値の最大値Mの範囲を予め測定しておき、この範囲を閾値Tmaxから閾値Tminの範囲として定めている。つまり、この第2の実施形態に係る画像認識装置2では、ぼけ測定部14Aで測定される画像の画素値の最大値Mが、この閾値Tmaxから閾値Tminの範囲にあれば、画像を認識できる。
【0054】
この第2の実施形態では、閾値Tmax、Tminを以下のようにして決定している。
1.この画像認識装置1に入力される可能性のある様々な画像を正規化した画像を生成する。
2.勾配フィルタLを用いて、各正規化された画像の画素値の最大値Mを算出する。
3.算出された最大値Mの平均値M0および標準偏差σを算出する。
4.下記(8)式で与えられる範囲を画素値の最大値Mの取り得る範囲として決定する。
【数3】
ここで、cは、定数である。また、M0+cσが閾値Tmax、M0−cσが閾値Tminとなる。
【0055】
ぼけ測定部14Aは、記憶部11Aに記憶されている勾配フィルタLを読出し、正規化部13、または画像処理部16Aから入力される画像上に投影する。そして、勾配フィルタLで定義された重みに従って画像の画素値を算出する。なお算出方法は、第1の実施形態で説明した方法と同じである。そして、ぼけ測定部14Aは、算出したすべての画素値の絶対値の中から最大値Mを取得する。
【0056】
なお、第1の実施形態と同様に、ノイズの影響を避けるために、算出された画素値の上位一定数を最大値の取得対象から外して、残りの中から最大値を取得してもよい。ぼけ測定部14Aで測定された画素値の最大値Mが、予め定めた範囲を外れている場合には、該画像を破棄して処理を中断してもよい。
【0057】
ぼけ比較部15Aは、ぼけ測定部14Aが取得した画素値の最大値Mが、記憶部11Aに記憶されている閾値Tmaxから閾値Tminの範囲内にあるか否かを判定する。ぼけ比較部15Aは、画素値の最大値Mが閾値Tminよりも小さい場合、正規化部13から入力される画像をぼけ変換するよう画像処理部16Aへ指示する。
【0058】
ぼけ比較部15Aは、画素値の最大値Mが閾値Tmaxよりも大きい場合、正規化部13から入力される画像を精鋭変換するよう画像処理部16Aへ指示する。ぼけ比較部15Aは、画素値の最大値Mが閾値Tmaxから閾値Tminの範囲内にある場合、正規化部13から入力される画像をそのまま特徴抽出部17へ入力するよう画像処理部16Aへ指示する。ぼけ比較部15Aにメモリを設け、該メモリに閾値Tmax、閾値Tminを記憶しておくようにしてもよい。
【0059】
画像処理部16Aは、ぼけ比較部15Aからの指示に基づいて、正規化部13から入力される画像をぼけ変換または鮮鋭変換する。画像処理部16Aは、画像をぼけ変換する場合、記憶部11Aに記憶されているぼけ変換フィルタGεを読み出して画像へ適用する。画像処理部16Aは、画像を鮮鋭変換する場合、記憶部11Aに記憶されている鮮鋭変換フィルタSδを読み出して、画像へ適用する。パラメータε、δには、十分に小さい値が設定される。
【0060】
なお、画像処理部16Aによりぼけ変換または鮮鋭変換された画像は、測定された画素値の最大値Mが、閾値Tmaxから閾値Tminの範囲内に入るまでぼけ変換または鮮鋭変換が繰り返される。この際、ぼけ変換フィルタGεのパラメータεおよび鮮鋭変換フィルタSδのパラメータδは、同一画像がぼけ変換または鮮鋭変換される毎に小さな値に設定される。
【0061】
このように、ぼけ変換フィルタGεまたは鮮鋭変換フィルタSδによるぼけレベルの変化量を段階的に小さくすることで、測定された画素値の最大値Mが、閾値Tmaxから閾値Tminの範囲内に収束しないことが防止できる。
【0062】
また、画像処理部16Aにて、同一の画像に対してぼけ変換または鮮鋭変換した回数を記憶しておき、該回数が一定値を超えた場合に該画像を破棄し、処理を中断するようにしてもよい。
【0063】
次に、第2の実施形態に係る画像認識装置2の動作について説明する。
図13は、画像認識装置2の動作の一例を示したフローチャートである。
【0064】
正規化部13は、入力画像を正規化する(ステップS201)。
ぼけ測定部14Aは、正規化部13から入力される画像の画素値を算出する。次に、ぼけ測定部14Aは、算出したすべての画素値の中から最大値Mを取得する(ステップS202)。
【0065】
ぼけ比較部15Aは、ぼけ測定部14Aが取得した画素値の最大値Mが、記憶部11Aに記憶されている閾値Tmaxから閾値Tminの範囲内にあるか否かを判定する(ステップS203)。ぼけ比較部15Aは、画素値の最大値Mが閾値Tminよりも小さい場合、正規化部13から入力される画像をぼけ変換するよう画像処理部16Aへ指示する。
【0066】
ぼけ比較部15Aは、画素値の最大値Mが閾値Tmaxよりも大きい場合、正規化部13から入力される画像を精鋭変換するよう画像処理部16Aへ指示する。ぼけ比較部15Aは、ぼけ測定部14Aが取得した画素値の最大値Mが、記憶部11Aに記憶されている閾値Tmaxから閾値Tminの範囲内にある場合、画像を特徴抽出部17へ入力するよう指示する。
【0067】
画像処理部16Aは、ぼけ比較部15Aからぼけ変換するよう指示を受けると、正規化部13から入力された画像をぼけ変換する(ステップS204)。画像処理部16Aは、ぼけ比較部15Aから鮮鋭変換するよう指示を受けると、正規化部13から入力された画像を鮮鋭変換する(ステップS205)。
【0068】
画像処理部16Aは、画像をぼけ変換または鮮鋭変換すると、ぼけ変換フィルタGεおよび鮮鋭変換フィルタSδのパラメータε、δの値を更新する(ステップS206)。この更新の際、パラメータε、δは、より小さい値に設定される。
【0069】
画像処理部16Aは、ぼけ比較部15Aから画像を特徴抽出部17へ入力するよう指示を受けると、画像を特徴抽出部17へ入力する(ステップS207)。画像処理部16Aは、画像を特徴抽出部17へ入力するとパラメータε、δの設定値をリセットする(ステップS208)。
【0070】
特徴抽出部17は、画像処理部16Aから入力される画像の特徴を抽出する(ステップS209)。認識部18は、特徴抽出部17から入力される特徴量に最も近い特徴量を有する画像パタンを記憶部12から検索する。次に、認識部18は、検索した画像パタンを認識結果として出力する(ステップS210)。
【0071】
画像処理部16Aによりぼけ変換または鮮鋭変換された画像は、測定された画素値の最大値Mが、閾値Tmaxから閾値Tminの範囲内に入るまで、ステップS203ないしステップS206の処理を繰り返す。
【0072】
以上のように、この第2の実施形態に係る画像認識装置2は、画素値の最大値Mが所定の範囲にあるか否かを判定する。そして最大値Mが所定の範囲内に入るまで画像をぼけ変換または鮮鋭変換した後、画像を認識する。このため、画像の認識結果が、入力画像の画質の違いに左右されずに安定した画像認識ができる。
【0073】
(その他の実施形態)
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0074】
1,2…画像認識装置、11,12…記憶部、13…正規化部、14…ぼけ測定部、15…ぼけ比較部、16…画像処理部、17…特徴抽出部、18…認識部。
【技術分野】
【0001】
この発明は、予め辞書に登録されている画像パタンとの比較により入力画像を認識する画像認識装置および画像認識方法に関する。
【背景技術】
【0002】
従来の画像認識装置には、入力画像に所定の処理を行い正規化した標本化パタンを生成した後、この標本化パタンと、予め記憶部に登録されている複数のパタンとの類似度を比較して入力画像を認識していた。しかしながら、従来の画像認識装置は、類似度を算出するための演算処理が膨大であり、画像認識に時間がかかっていた。そこで、画像の各画素の濃淡(画素値)を特徴量として、入力画像を認識する方法が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平2−166583号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の画像認識装置では、画像の画質を考慮せず、すべての画像を一律に画像処理した後、画像認識していた。このため、画像認識の結果が、画像の画質に左右され安定した画像の認識ができなかった。
上記に鑑み、本発明は、画質の違いによらず安定して画像を認識できる画像認識装置および画像認識方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の一態様に係る画像認識装置は、画像のぼけレベルを測定する測定部と、測定部で測定されたぼけレベルを閾値と比較する比較部と、測定部で測定されたぼけレベルが、閾値よりも小さい場合、画像にぼけレベルを大きくするぼけ変換フィルタを適用し、測定部で測定されたぼけレベルが、閾値よりも大きい場合、画像にぼけレベルを小さくする鮮鋭変換フィルタを適用する画像処理部と、画像処理部で処理された画像の特徴から画像を認識する認識部と、を具備する。
【0006】
本発明の一態様に係る画像認識方法は、画像のぼけレベルを測定するステップと、ぼけレベルを閾値と比較するステップと、ぼけレベルが、閾値よりも小さい場合、画像にぼけレベルを大きくするぼけ変換フィルタを適用し、測定部で測定されたぼけレベルが、閾値よりも大きい場合、画像にぼけレベルを小さくする鮮鋭変換フィルタを適用するステップと、フィルタ適用後の画像の特徴から画像を認識するステップと、を具備する。
【発明の効果】
【0007】
本発明によれば、画質の違いによらず安定して画像を認識できる画像認識装置および画像認識方法を提供できる。
【図面の簡単な説明】
【0008】
【図1】第1の実施形態に係る画像認識装置の構成の一例を示した図である。
【図2】勾配フィルタの一例を示した図である。
【図3】勾配フィルタの一例を示した図である。
【図4】ぼけ変換フィルタの一例を示した図である。
【図5】ぼけ変換フィルタの一例を示した図である。
【図6】単位インパルスを示した図である。
【図7】単位インパルスに勾配フィルタを適用した結果を示した図である。
【図8】単位インパルスに合成フィルタを適用した結果を示した図である。
【図9】入力画像の一例を示した図である。
【図10】正規化後の画像の一例を示した図である。
【図11】第1の実施形態に係る画像認識装置の動作の一例を示したフローチャートである。
【図12】第2の実施形態に係る画像認識装置の構成の一例を示した図である。
【図13】第2の実施形態に係る画像認識装置の動作の一例を示したフローチャートである。
【発明を実施するための形態】
【0009】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
(第1の実施形態)
図1は、第1の実施形態に係る画像認識装置の構成の一例を示した図である。図2は、勾配フィルタの一例を示した図である。図3は、勾配フィルタの一例を示した図である。図4は、ぼけ変換フィルタの一例を示した図である。図5は、ぼけ変換フィルタの一例を示した図である。図6は、単位インパルスを示した図である。図7は、単位インパルスに勾配フィルタを適用した結果を示した図である。図8は、単位インパルスに合成フィルタを適用した結果を示した図である。図9は、入力画像の一例を示した図である。図10は、正規化後の画像の一例を示した図である。
【0010】
なお、画像認識においては、画像が適度にぼけている場合のほうが、画像の認識率が高くなることが知られている。そこで、第1の実施形態に係る画像認識装置1では、入力画像のぼけレベルを測定し、ぼけレベルが所定の値となるように画像をぼけ変換または鮮鋭変換した後に画像の認識を行っている。このため、第1の実施形態に係る画像認識装置1は、画像の画質の違いによらず安定して画像を認識できる。
【0011】
以下、図1ないし図10を用いて、第1の実施形態に係る画像認識装置1の構成について説明する。図1に示すように、この第1の実施形態に係る画像認識装置1は、記憶部11、記憶部12、正規化部13、ぼけ測定部14、ぼけ比較部15、画像処理部16、特徴抽出部17および認識部18を具備する。
【0012】
記憶部11には、勾配フィルタL、ぼけ変換フィルタGε、鮮鋭フィルタSδ、画像のぼけレベルを示すパラメータであるぼけ量βと最大値Mとの関係式、および目標値αなどが記憶されている。以下、各項目について説明する。
【0013】
(勾配フィルタL)
勾配フィルタLは、ぼけ測定部14において、正規化部13から入力される正規化画像のぼけ量βを測定する際に用いられる。この勾配フィルタLは、画像の2次元勾配を求めるフィルタであり、ラプラシアンフィルタ、Prewittフィルタ、Sobelフィルタ等が使用できる。
【0014】
図2、図3は、このような勾配フィルタLの一例を示した図である。図2には、4近傍ラプラシアンフィルタを示している。図3には、8近傍ラプラシアンフィルタを示している。
【0015】
(ぼけ変換フィルタGε)
ぼけ変換フィルタGεは、正規化部13で正規化された画像のぼけ量βを大きく(増大)するフィルタである。このようなフィルタとしては、下記(1)式を満たすものが使用できる。
【数1】
ここで、εは、画像のぼけレベルを示すパラメータである。
【0016】
(1)式は、パラメータε1を有するぼけ変換フィルタGε1と、パラメータε2を有するぼけ変換フィルタGε2とを連続して正規化画像に適用することが、パラメータε1+ε2を有するぼけ変換フィルタGε1+ε2を正規化画像に適用することと近似的に同じであればよいことを意味する。
【0017】
上記条件を満たすぼけ変換フィルタGεとしては、例えば、図4、図5に示すフィルタがある。図4は、4近傍ガウシアンフィルタを示した図である。図5は、8近傍ガウシアンフィルタを示した図である。ここで、パラメータεは、下記(2)式を満たす必要がある。
0<ε<1…(2)
【0018】
(鮮鋭変換フィルタSδ)
鮮鋭変換フィルタSδは、正規化部13で正規化された画像のぼけ量βを小さく(減少)するフィルタである。このようなフィルタとしては、下記(3)式を満たすものが使用できる。
【数2】
ここで、δは、画像の鮮鋭の度合いを示すパラメータである。
【0019】
(3)式は、パラメータεを有するぼけ変換フィルタGεと、パラメータδを有する鮮鋭変換フィルタSδとを連続して正規化画像に適用することが、パラメータε―δを有するぼけ変換フィルタGε―δを正規化画像に適用することと近似的に同じであればよいことを意味する。
【0020】
鮮鋭変換フィルタSδの一例として、図2に示す4近傍ラプラシアンフィルタを用いたものを下記(4)式に示す。
Sδ=I−δ・L4/(1−4δ)…(4)
Iは、恒等変換を表わしている。L4は、4近傍ラプラシアンフィルタを表わしている。
【0021】
(ぼけ量βと最大値Mとの関係式)
この第1の実施形態では、ぼけ量βを算出するために、図6に示す単位インパルスdがぼけによって劣化する過程を事前にシミュレートしている。そして、規格化画像のぼけ量βと、規格化画像に勾配フィルタLを適用した際に得られる各画素の絶対値の最大値Mとの関係式を導出している。
【0022】
図6中のKは、ぼけのない理想的な画像での画素値の最大値である。このKの値は、実験的に決定することができる。Mは、正規化部13で正規化された画像に上記勾配フィルタLを適用した際に得られる各画素の絶対値の最大値である。
【0023】
ぼけ量βと最大値Mとの関係式の導出は、以下のように行う。
1.単位インパルスdに、上述した勾配フィルタLと、ぼけ変換フィルタGεとを合成した合成フィルタL・Gεを適用する。
2.合成フィルタL・Gεを適用した後の画像の各画素の画素値の最大値を、εをパラメータとする関数P(ε)の解として、下記(5)式を定義する。
P(ε)=M…(5)
【0024】
そして、上記式(5)の解となるεをぼけ量βとすることで、画素値の最大値Mとぼけ量βとの関係式を得ることができる。(5)式を厳密に解くことが難しい場合は、近似解を用いてもよい。
【0025】
勾配フィルタLとして図2に示す4近傍ラプラシアンフィルタ、ぼけ変換フィルタGεとして図4に示す4近傍ガウシアンフィルタを用いた例を以下に示す。この場合、図6に示す単位インパルスdにぼけ変換フィルタGεを適用すると図7に示す結果が得られる。図6に示す単位インパルスdに、合成フィルタL・Gεを適用すると図8に示す結果が得られる。
【0026】
図7、図8に示す結果を(5)式へ適用すると下記(6)式を得ることができる。
β=1−M/4K…(6)
以上により、ぼけ量βと最大値Mとの関係式が導出される。
【0027】
(目標値α)
目標値αは、画像を効率的よく認識できる時の画像のぼけ量βである。ぼけ測定部14で測定される画像のぼけ量βを、この目標値αと一致もしくは近くなるように画像を処理することで、画質の違いによらず安定して画像を認識できる。
【0028】
この第1の実施形態では、目標値αを以下のようにして決定している。
1.この画像認識装置1に入力される可能性のある様々な画像を正規化した正規化画像を生成する。
2.勾配フィルタLを用いて、各正規化画像のぼけ量βを算出する。
3.算出されたぼけ量βの平均値αpを算出する。
4.ぼけ変換フィルタGのパラメータをαfとした際に下記(7)式で与えられるαを目標値とする。
α=αp+αf…(7)
【0029】
記憶部12は、入力画像の認識に必要な画像パタンが登録されている辞書メモリである。
【0030】
正規化部13は、入力画像を正規化して正規化画像を生成する。図9は、正規化部13へ入力される画像101の一例を示した図である。正規化部13は、図9に示す画像101が外部から入力されると、入力画像101から認識対象部分を切り出す。そして、この切り出した画像を画素値に応じて黒画素および白画素に2値化する。入力画像の2値化は行っても行わなくてもよい。
【0031】
次に、正規化部13は、2値化された画像の縦幅または横幅を、拡大もしくは縮小することにより、入力画像中の文字の大きさおよび位置を正規化する。図10は、正規化部13により正規化された画像を示した図である。この第1の実施形態では、入力画像は、画素の配列が11行×11列の画像に正規化される。図10では、白画素の値は“0”、黒画素の値は“1”となっている。画素の配列は、11行11列に限られず様々な配列を採用することができる。
【0032】
ぼけ測定部14は、正規化部13から入力される画像のぼけ量βを測定する。ぼけ測定部14は、記憶部11に記憶されている勾配フィルタLを読出し、正規化部13から入力される画像上に投影する。そして、勾配フィルタLで定義された重みに従って画像の画素値を算出する。
【0033】
例えば、図10に示す画像の左上の部分102へ、図2に示す4近傍ラプラシアンフィルタを投影した場合の画素値は、1となる。ぼけ測定部14は、図10に示す画像の左上の部分102から1画素分右方向へシフトしながら画素値を算出する。
【0034】
そして、画像の右端まで画素値を算出すると、下へ1画素分シフトする。そして、上記と同様の計算により画素値を算出する。ぼけ測定部14は、残りの部分についても同様にして画素値を算出する。画像の画素配列が11行11列であることから、ぼけ測定部14では、9行9列の合計81個の画素値が算出される。ぼけ量測定部では、この算出した81個の画素値の絶対値の中の最大値Mを取得する。
【0035】
次に、ぼけ測定部14は、取得した最大値Mを、記憶部11に記憶されている(5)式へ代入して、ぼけ量βを算出する。ノイズの影響を避けるために、算出された画素値の上位一定数を最大値の取得対象から外して、残りの中から最大値を取得してもよい。画素値は、必ずしも9行9列の合計81個を算出する必要はなく、例えば、2画素分シフトしながら画素値を算出するようにしてもよい。あるいは、画像の外には画素値0の画素があるものとみなし、11行11列の合計121個の画素値を算出してもよい。
【0036】
ぼけ量測定14にメモリを設け、該メモリに上記勾配フィルタLおよび(5)式を記憶しておくようにしてもよく、ぼけ測定部14で測定されたぼけ量βが、予め定めた範囲を外れている場合には、該画像を破棄して処理を中断してもよい。
【0037】
ぼけ比較部15は、ぼけ測定部14から入力されたぼけ量βを、記憶部11に記憶されている目標値αと比較する。ぼけ比較部15は、ぼけ量βが目標値αよりも小さい場合、正規化部13から入力された画像をぼけ変換するよう画像処理部16へ指示する。ぼけ比較部15は、ぼけ量βが目標値αよりも大きい場合、正規化部13から入力された画像を鮮鋭変換するよう画像処理部16へ指示する。ぼけ量βが目標値αと同じ値であれば、正規化部13から入力された画像をそのまま特徴抽出部17へ入力するよう画像処理部16へ指示する。ぼけ量比較部にメモリを設け、該メモリに上記目標値αを記憶しておくようにしてもよい。
【0038】
画像処理部16は、ぼけ比較部15からの指示に基づいて、正規化部13から入力された画像をぼけ変換または鮮鋭変換する。画像処理部16は、画像をぼけ変換する場合、記憶部11に記憶されているぼけ変換フィルタGεを読み出して画像へ適用する。この際のぼけ変換フィルタGεのパラメータεは、α−βに設定される。
【0039】
画像処理部16は、画像を鮮鋭変換する場合、記憶部11に記憶されている鮮鋭変換フィルタSδを読み出して、画像へ適用する。この際の鮮鋭変換フィルタSδのパラメータδは、β−αに設定される。
【0040】
特徴抽出部17は、画像処理部16から入力される画像処理後の画像の特徴を抽出する。この際、画像処理部16から入力される画像を構成する各画素値をベクトルとみなし、この画素値をそのまま特徴量として抽出するようにしてもよい。
【0041】
認識部18は、特徴抽出部17から入力される特徴量に最も近い特徴量を有する画像パタンを記憶部12に登録されている画像パタンから検索する。次に、認識部18は、検索した画像パタンを認識結果として出力する。認識部18における画像認識には、CLAFIC法などが使用できる。
【0042】
次に、第1の実施形態に係る画像認識装置1の動作について説明する。
図11は、画像認識装置1の動作の一例を示したフローチャートである。
【0043】
正規化部13は、入力画像を正規化する(ステップS101)。
ぼけ測定部14は、正規化部13から入力される画像のぼけ量βを算出する(ステップS102)。ぼけ比較部15は、ぼけ測定部14から入力されるぼけ量βを、ぼけ量の目標値αと比較する(ステップS103)。
【0044】
ぼけ比較部15は、ぼけ測定部14で算出されたぼけ量βが目標値αよりも小さい場合、正規化部13から入力された画像をぼけ変換するよう画像処理部16へ指示する。ぼけ比較部15は、ぼけ測定部14で算出されたぼけ量βが目標値αよりも大きい場合、正規化部13から入力された画像を鮮鋭変換するよう画像処理部16へ指示する。ぼけ比較部15は、ぼけ測定部14で算出されたぼけ量βが目標値αと同じ値である場合、正規化部13から入力された画像をそのまま特徴抽出部17へ入力するよう画像処理部16へ指示する。
【0045】
画像処理部16は、ぼけ比較部15からぼけ変換するよう指示を受けると、正規化部13から入力された画像をぼけ変換する(ステップS104)。画像処理部16は、ぼけ比較部15から鮮鋭変換するよう指示を受けると、正規化部13から入力された画像を鮮鋭変換する(ステップS105)。画像処理部16は、ぼけ比較部15からそのまま特徴抽出部17へ入力するよう指示を受けると、正規化部13から入力された画像をそのまま特徴抽出部17へ入力する(ステップS106)。
【0046】
特徴抽出部17は、画像処理部16から入力される画像処理後の画像の特徴を抽出する(ステップS107)。認識部18は、特徴抽出部17から入力される特徴量に最も近い特徴量を有する画像パタンを記憶部12から検索する。次に、認識部18は、検索した画像パタンを認識結果として出力する(ステップS108)。
【0047】
以上のように、この第1の実施形態に係る画像認識装置1は、入力画像のぼけ量βを測定する。そして、入力画像のぼけ量βが目標値αと異なる場合には、入力画像のぼけ変換または鮮鋭変換を施した後、画像を認識する。
【0048】
このため、画像の認識結果が、入力画像の画質の違いに左右されない。その結果、安定した画像認識が可能である。また、予めぼけ量βとMとの関係式を求めておき、この関係式に基づいて画像をぼけ変換または鮮鋭変換している。このため、一度のぼけ変換または鮮鋭変換で、画像認識に適切なぼけ量を有する画像に変換できる。
【0049】
(第2の実施形態)
第1の実施形態では、予めぼけ量βと画素値の最大値Mとの関係式を求め、該関係式により画像をぼけ変換または鮮鋭変換する実施形態について説明した。この第2の実施形態では、画素値の最大値Mが予め測定により算出された範囲内に収まるまで画像をぼけ変換または鮮鋭変換する実施形態について説明する。
【0050】
図12は、第2の実施形態に係る画像認識装置2の構成の一例を示した図である。以下、図12を使用して、この第2の実施形態に係る画像認識装置2を説明する。図1で説明した構成要素と同一の構成要素については、同一の符号を付して重複した説明を省略する。この第2の実施形態では、最大値Mが、ぼけレベルを表わすパラメータとなる。
【0051】
この第2の実施形態に係る画像認識装置2は、記憶部11A、記憶部12、正規化部13、ぼけ測定部14A、ぼけ比較部15A、画像処理部16A、特徴抽出部17、認識部18を具備する。
【0052】
記憶部11Aには、勾配フィルタL、ぼけ変換フィルタGε、鮮鋭フィルタSδ、閾値Tmax、閾値Tminなどが記憶されている。以下各項目について説明するが、勾配フィルタL、ぼけ変換フィルタGε、鮮鋭フィルタSδについては、第1の実施形態で説明したため重複した説明を省略する。
【0053】
(閾値Tmax、Tmin)
この第2の実施形態では、画像認識率が所定の認識率となる場合の画素値の最大値Mの範囲を予め測定しておき、この範囲を閾値Tmaxから閾値Tminの範囲として定めている。つまり、この第2の実施形態に係る画像認識装置2では、ぼけ測定部14Aで測定される画像の画素値の最大値Mが、この閾値Tmaxから閾値Tminの範囲にあれば、画像を認識できる。
【0054】
この第2の実施形態では、閾値Tmax、Tminを以下のようにして決定している。
1.この画像認識装置1に入力される可能性のある様々な画像を正規化した画像を生成する。
2.勾配フィルタLを用いて、各正規化された画像の画素値の最大値Mを算出する。
3.算出された最大値Mの平均値M0および標準偏差σを算出する。
4.下記(8)式で与えられる範囲を画素値の最大値Mの取り得る範囲として決定する。
【数3】
ここで、cは、定数である。また、M0+cσが閾値Tmax、M0−cσが閾値Tminとなる。
【0055】
ぼけ測定部14Aは、記憶部11Aに記憶されている勾配フィルタLを読出し、正規化部13、または画像処理部16Aから入力される画像上に投影する。そして、勾配フィルタLで定義された重みに従って画像の画素値を算出する。なお算出方法は、第1の実施形態で説明した方法と同じである。そして、ぼけ測定部14Aは、算出したすべての画素値の絶対値の中から最大値Mを取得する。
【0056】
なお、第1の実施形態と同様に、ノイズの影響を避けるために、算出された画素値の上位一定数を最大値の取得対象から外して、残りの中から最大値を取得してもよい。ぼけ測定部14Aで測定された画素値の最大値Mが、予め定めた範囲を外れている場合には、該画像を破棄して処理を中断してもよい。
【0057】
ぼけ比較部15Aは、ぼけ測定部14Aが取得した画素値の最大値Mが、記憶部11Aに記憶されている閾値Tmaxから閾値Tminの範囲内にあるか否かを判定する。ぼけ比較部15Aは、画素値の最大値Mが閾値Tminよりも小さい場合、正規化部13から入力される画像をぼけ変換するよう画像処理部16Aへ指示する。
【0058】
ぼけ比較部15Aは、画素値の最大値Mが閾値Tmaxよりも大きい場合、正規化部13から入力される画像を精鋭変換するよう画像処理部16Aへ指示する。ぼけ比較部15Aは、画素値の最大値Mが閾値Tmaxから閾値Tminの範囲内にある場合、正規化部13から入力される画像をそのまま特徴抽出部17へ入力するよう画像処理部16Aへ指示する。ぼけ比較部15Aにメモリを設け、該メモリに閾値Tmax、閾値Tminを記憶しておくようにしてもよい。
【0059】
画像処理部16Aは、ぼけ比較部15Aからの指示に基づいて、正規化部13から入力される画像をぼけ変換または鮮鋭変換する。画像処理部16Aは、画像をぼけ変換する場合、記憶部11Aに記憶されているぼけ変換フィルタGεを読み出して画像へ適用する。画像処理部16Aは、画像を鮮鋭変換する場合、記憶部11Aに記憶されている鮮鋭変換フィルタSδを読み出して、画像へ適用する。パラメータε、δには、十分に小さい値が設定される。
【0060】
なお、画像処理部16Aによりぼけ変換または鮮鋭変換された画像は、測定された画素値の最大値Mが、閾値Tmaxから閾値Tminの範囲内に入るまでぼけ変換または鮮鋭変換が繰り返される。この際、ぼけ変換フィルタGεのパラメータεおよび鮮鋭変換フィルタSδのパラメータδは、同一画像がぼけ変換または鮮鋭変換される毎に小さな値に設定される。
【0061】
このように、ぼけ変換フィルタGεまたは鮮鋭変換フィルタSδによるぼけレベルの変化量を段階的に小さくすることで、測定された画素値の最大値Mが、閾値Tmaxから閾値Tminの範囲内に収束しないことが防止できる。
【0062】
また、画像処理部16Aにて、同一の画像に対してぼけ変換または鮮鋭変換した回数を記憶しておき、該回数が一定値を超えた場合に該画像を破棄し、処理を中断するようにしてもよい。
【0063】
次に、第2の実施形態に係る画像認識装置2の動作について説明する。
図13は、画像認識装置2の動作の一例を示したフローチャートである。
【0064】
正規化部13は、入力画像を正規化する(ステップS201)。
ぼけ測定部14Aは、正規化部13から入力される画像の画素値を算出する。次に、ぼけ測定部14Aは、算出したすべての画素値の中から最大値Mを取得する(ステップS202)。
【0065】
ぼけ比較部15Aは、ぼけ測定部14Aが取得した画素値の最大値Mが、記憶部11Aに記憶されている閾値Tmaxから閾値Tminの範囲内にあるか否かを判定する(ステップS203)。ぼけ比較部15Aは、画素値の最大値Mが閾値Tminよりも小さい場合、正規化部13から入力される画像をぼけ変換するよう画像処理部16Aへ指示する。
【0066】
ぼけ比較部15Aは、画素値の最大値Mが閾値Tmaxよりも大きい場合、正規化部13から入力される画像を精鋭変換するよう画像処理部16Aへ指示する。ぼけ比較部15Aは、ぼけ測定部14Aが取得した画素値の最大値Mが、記憶部11Aに記憶されている閾値Tmaxから閾値Tminの範囲内にある場合、画像を特徴抽出部17へ入力するよう指示する。
【0067】
画像処理部16Aは、ぼけ比較部15Aからぼけ変換するよう指示を受けると、正規化部13から入力された画像をぼけ変換する(ステップS204)。画像処理部16Aは、ぼけ比較部15Aから鮮鋭変換するよう指示を受けると、正規化部13から入力された画像を鮮鋭変換する(ステップS205)。
【0068】
画像処理部16Aは、画像をぼけ変換または鮮鋭変換すると、ぼけ変換フィルタGεおよび鮮鋭変換フィルタSδのパラメータε、δの値を更新する(ステップS206)。この更新の際、パラメータε、δは、より小さい値に設定される。
【0069】
画像処理部16Aは、ぼけ比較部15Aから画像を特徴抽出部17へ入力するよう指示を受けると、画像を特徴抽出部17へ入力する(ステップS207)。画像処理部16Aは、画像を特徴抽出部17へ入力するとパラメータε、δの設定値をリセットする(ステップS208)。
【0070】
特徴抽出部17は、画像処理部16Aから入力される画像の特徴を抽出する(ステップS209)。認識部18は、特徴抽出部17から入力される特徴量に最も近い特徴量を有する画像パタンを記憶部12から検索する。次に、認識部18は、検索した画像パタンを認識結果として出力する(ステップS210)。
【0071】
画像処理部16Aによりぼけ変換または鮮鋭変換された画像は、測定された画素値の最大値Mが、閾値Tmaxから閾値Tminの範囲内に入るまで、ステップS203ないしステップS206の処理を繰り返す。
【0072】
以上のように、この第2の実施形態に係る画像認識装置2は、画素値の最大値Mが所定の範囲にあるか否かを判定する。そして最大値Mが所定の範囲内に入るまで画像をぼけ変換または鮮鋭変換した後、画像を認識する。このため、画像の認識結果が、入力画像の画質の違いに左右されずに安定した画像認識ができる。
【0073】
(その他の実施形態)
本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【符号の説明】
【0074】
1,2…画像認識装置、11,12…記憶部、13…正規化部、14…ぼけ測定部、15…ぼけ比較部、16…画像処理部、17…特徴抽出部、18…認識部。
【特許請求の範囲】
【請求項1】
画像のぼけレベルを測定する測定部と、
前記測定部で測定されたぼけレベルを閾値と比較する比較部と、
前記測定部で測定されたぼけレベルが、前記閾値よりも小さい場合、前記画像に前記ぼけレベルを大きくするぼけ変換フィルタを適用し、前記測定部で測定されたぼけレベルが、前記閾値よりも大きい場合、前記画像に前記ぼけレベルを小さくする鮮鋭変換フィルタを適用する画像処理部と、
前記画像処理部で処理された画像の特徴から前記画像を認識する認識部と、
を具備することを特徴とする画像認識装置。
【請求項2】
前記閾値は、互いに異なる第1の値、第2の値からなり、
前記画像処理部は、前記測定部で測定されたぼけレベルが、前記第1の値以上で、かつ前記第2の値以下となるまで、前記比較部での比較結果に応じて前記画像にぼけ変換フィルタまたは鮮鋭変換フィルタを適用することを特徴とする請求項1に記載の画像認識装置。
【請求項3】
前記画像処理部は、前記ぼけ変換フィルタまたは前記鮮鋭変換フィルタによるぼけレベルの変化量を段階的に小さくすることを特徴とする請求項2に記載の画像認識装置。
【請求項4】
前記画像処理部は、前記ぼけ変換フィルタとしてガウシアンフィルタを用い、前記鮮鋭変換フィルタとしてラプラシアンフィルタを用いることを特徴とする請求項1ないし請求項3のいずれか1項に記載の画像認識装置。
【請求項5】
画像のぼけレベルを測定するステップと、
前記ぼけレベルを閾値と比較するステップと、
前記ぼけレベルが、前記閾値よりも小さい場合、前記画像に前記ぼけレベルを大きくするぼけ変換フィルタを適用し、前記測定部で測定されたぼけレベルが、前記閾値よりも大きい場合、前記画像に前記ぼけレベルを小さくする鮮鋭変換フィルタを適用するステップと、
前記フィルタ適用後の画像の特徴から前記画像を認識するステップと、
を具備することを特徴とする画像認識方法。
【請求項1】
画像のぼけレベルを測定する測定部と、
前記測定部で測定されたぼけレベルを閾値と比較する比較部と、
前記測定部で測定されたぼけレベルが、前記閾値よりも小さい場合、前記画像に前記ぼけレベルを大きくするぼけ変換フィルタを適用し、前記測定部で測定されたぼけレベルが、前記閾値よりも大きい場合、前記画像に前記ぼけレベルを小さくする鮮鋭変換フィルタを適用する画像処理部と、
前記画像処理部で処理された画像の特徴から前記画像を認識する認識部と、
を具備することを特徴とする画像認識装置。
【請求項2】
前記閾値は、互いに異なる第1の値、第2の値からなり、
前記画像処理部は、前記測定部で測定されたぼけレベルが、前記第1の値以上で、かつ前記第2の値以下となるまで、前記比較部での比較結果に応じて前記画像にぼけ変換フィルタまたは鮮鋭変換フィルタを適用することを特徴とする請求項1に記載の画像認識装置。
【請求項3】
前記画像処理部は、前記ぼけ変換フィルタまたは前記鮮鋭変換フィルタによるぼけレベルの変化量を段階的に小さくすることを特徴とする請求項2に記載の画像認識装置。
【請求項4】
前記画像処理部は、前記ぼけ変換フィルタとしてガウシアンフィルタを用い、前記鮮鋭変換フィルタとしてラプラシアンフィルタを用いることを特徴とする請求項1ないし請求項3のいずれか1項に記載の画像認識装置。
【請求項5】
画像のぼけレベルを測定するステップと、
前記ぼけレベルを閾値と比較するステップと、
前記ぼけレベルが、前記閾値よりも小さい場合、前記画像に前記ぼけレベルを大きくするぼけ変換フィルタを適用し、前記測定部で測定されたぼけレベルが、前記閾値よりも大きい場合、前記画像に前記ぼけレベルを小さくする鮮鋭変換フィルタを適用するステップと、
前記フィルタ適用後の画像の特徴から前記画像を認識するステップと、
を具備することを特徴とする画像認識方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2010−198188(P2010−198188A)
【公開日】平成22年9月9日(2010.9.9)
【国際特許分類】
【出願番号】特願2009−40770(P2009−40770)
【出願日】平成21年2月24日(2009.2.24)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
【公開日】平成22年9月9日(2010.9.9)
【国際特許分類】
【出願日】平成21年2月24日(2009.2.24)
【出願人】(000003078)株式会社東芝 (54,554)
【出願人】(301063496)東芝ソリューション株式会社 (1,478)
【Fターム(参考)】
[ Back to top ]