説明

文字列認識方法、コンピュータプログラム、記憶媒体

【課題】 デジタルカメラ等で撮影した画像から、ナンバープレートを高精度に認識する。
【解決手段】 本発明のナンバープレート認識装置は、入力画像からナンバープレート領域候補の四辺形を検出して、ナンバープレート領域候補に含まれる文字領域の文字認識を実行する。その際、認識対象となる文字画像の領域を任意に変えながら複数の認識結果を得、その結果を元に正しい認識結果を選択することによって、ノイズに影響されにくいナンバープレート認識を実現する。

【発明の詳細な説明】
【技術分野】
【0001】
画像からナンバープレートを自動的に読み取る装置における文字列認識方法、そのプログラム、プログラムを格納した記憶媒体に関する。
【背景技術】
【0002】
従来、本発明が属する技術分野は、道路に設置された固定カメラを用いるなどして、車両を撮影して当該車両のナンバープレートを読み取ることにより、交通管制等に利用されている。その際、ナンバープレート上のビスや汚れ等による誤認識の問題は、課題としてその解決に向けた取り組みがなされてきた。
【0003】
例えば、特許文献1では、文字パターンの配置情報を記憶する文字配置情報記憶手段を備えることにより、決められた配置に合わない部分の画像を排除する仕組みを提供することで、認識率の向上を図る技術が考えられている。
【0004】
また、特許文献2では、文字列画像を上側部分と下側部分とに区分し、下側のみを使用することで、上側部分にかかる影等のノイズの影響を排除する仕組みを提供することで認識率の向上を図る技術も考えられている。
【特許文献1】特開2003−346081号公報
【特許文献2】特開2006−309402号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、デジタルカメラのような固定されていないカメラで撮影された画像は、撮影条件(例えば、撮影角度や明るさや背景など)が変わるため、ナンバープレートを検出しその文字列を認識することは容易ではない。そのため、従来技術にあるような固定的な位置を使用したり画像の下側部分がより正確であるといった前提条件を設定し適用したりすることが難しい。
【0006】
本発明は、画像から得られたナンバープレート画像に含まれるビス等のノイズによる影響を軽減し、高精度にナンバープレート認識できるようにすることを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明のナンバープレート認識装置は、画像中の文字列領域を分割し文字領域列を得る文字領域列取得手段と、
前記文字領域列のうち任意の一部を選択し文字領域列候補を取得する文字領域列候補選択手段と、
上記文字領域列候補に対し文字認識を行い認識結果文字列候補を得る文字認識手段と、
複数の認識結果文字列候補から適切な認識結果文字列を選択する文字認識結果決定手段を備える
ことを特徴とする。
【発明の効果】
【0008】
ナンバープレート領域の検出精度および認識精度が向上する。
【発明を実施するための最良の形態】
【0009】
次に、本発明の詳細を実施例の記述に従って説明する。
【実施例1】
【0010】
図1は実施例1に係るナンバープレート認識装置の概略構成を示すブロック図である。
【0011】
101はCPUであり、ROM102に格納されている制御プログラムを実行することにより、本装置全体の制御を行う。102はROMであり、CPU101が実行するコンピュータプログラムや各種パラメータデータを格納する。コンピュータプログラムは、CPU101で実行されることにより、後述するフローチャートに示す各処理を実行するための各種手段として、当該装置(コンピュータ)を機能させる。なお、本実施例では、後述するフローチャートの各ステップに対応する処理を、コンピュータ(CPU)を用いてソフトウェアで実現することとするが、その処理の一部または全部を電子回路などのハードウェアで実現するようにしても構わない。また、本発明のナンバープレート認識装置は、汎用パソコンを用いて実現してもよいし、ナンバープレート認識専用の装置として実現するようにしても構わない。
【0012】
103はRAMであり、画像や各種情報を記憶する。また、RAM103は、CPUのワークエリアやデータの一時待避領域として機能する。
【0013】
104は外部記憶装置であり、辞書などの各種データを記憶する。外部記憶装置104は、例えば、ハードディスクやCD−ROM等で構成される。なお、本発明の装置をコンピュータに実現させるためのコンピュータプログラムは、このコンピュータ読取可能な外部記憶媒体に格納されていても構わないし、ネットワークを介して供給されるようにしても構わない。105はディスプレイであり、例えば、LCDやCRTで構成される。
【0014】
106は入力装置である。例えば、デジカメやスキャナ等の画像入力装置を接続するためのインターフェースであってもよいし、デジカメ等の画像入力装置そのものであっても構わない。また、デジタルカメラの機能の1つとして実現するために、デジカメ内部に本発明の装置構成を組み込んで実現しても構わない。
【0015】
107はネットワークインターフェース(I/F)であり、ネットワーク上に接続されている外部装置(例えば、サーバ、外部記憶装置、画像入力装置等)と通信し、プログラムやデータを読み込んだり、書き込んだりする。尚、ネットワークは、典型的にはインターネットやLANやWANや電話回線などのいわゆる通信ネットワークであり、データの送受信が可能であれば良い。また、ディスプレイ105や入力装置106は、ネットワークインターフェース108を介して接続されていても良い。
【0016】
このようなナンバープレート認識装置は、例えば図2に示すシステムにおいて実現される。図2は、本実施例1において採用可能なコンピュータシステムの構成例を示す図である。201はコンピュータ装置であり、デジタルカメラ202で撮影した画像データを受信して、ナンバープレート認識のための処理を実行する。
【0017】
次に、ナンバープレート認識処理について図3〜図9を用いて説明する。本実施例では、デジタルカメラ等で撮影した静止画像内に存在するナンバープレートの文字列を認識する。
【0018】
図3はナンバープレートの一例である。日本のナンバープレートの場合には、3つの文字列領域が存在する。301は陸運局名と分類番号が記載される領域、302は平仮名(もしくはアルファベット)の領域、303は一連指定番号の領域である。
【0019】
図4は、実施例1のナンバープレート認識装置におけるナンバープレート認識処理を示すフローチャートである。
【0020】
ステップS401では、画像からナンバープレート領域候補を複数検出する。ステップS401の詳細を図5に示す。
【0021】
ステップS402では、検出された複数のナンバープレート領域候補(四辺形領域)に対して、逆透視変換(歪み補正処理)を用い、正対画像を得る。
【0022】
ステップS403では、ステップS402で得られたナンバープレート領域候補の正対画像に対して、2値化処理を行う。
【0023】
ステップS404では、逆透視変換および2値化されたナンバープレート領域から図3で示したような3つの文字領域を抽出し、特に図3のうち301に該当する文字領域に対して、複数の文字領域の選択結果を作成する。ステップS404の詳細を図8に示す。
【0024】
ステップS405では、上記抽出した文字領域を抽出し、当該文字領域に対して、文字認識処理を行い、それぞれの文字に対する文字候補と類似度を得る。
【0025】
ステップS406では、ナンバープレート領域候補から得られた文字認識結果を用い、ナンバープレート認識結果の確定処理を行う。そして、その確定処理結果として得られるナンバープレート領域に関する情報(文字認識結果や位置情報など)を出力する。ステップS406の詳細を図10に示す。
【0026】
図5のステップS501では、当該画像の二値化を行う。
【0027】
ステップS502では、二値化された画像から、黒画素同士が上下左右斜めの8方向のいずれかで連結する黒画素の連結画素(黒画素塊)を検出する。なお、黒画素塊の内部に上下左右のいずれかで連結する白画素塊がある場合は、その白画素塊の内部に更に黒画素塊があるか検査する。
【0028】
ステップS503では、検出した黒画素の連結画素のうち、所定の大きさを有する複数の連結画素について、直線状に並んでいる複数の連結画素(連結画素列)の検出を行う。この連結画素列は、ナンバープレートの文字列の候補である。なお、ここで、検出対象の閾値に用いる所定の大きさ(サイズ)は、撮影されるであろうナンバープレートの文字サイズを想定して、予め設定しておくものとする。
【0029】
ステップS504では、当該検出された連結画素列から所定範囲内を、四辺形検出の処理対象範囲として設定し、四辺形検出処理を実行する。例えば、連結画素列の縦横それぞれ2倍のサイズの領域が、この処理対象領域として設定される。
【0030】
この四辺形検出処理は、まず、当該設定された処理対象範囲の画像を対象として、ハフ変換を用いて直線検出を行う。この直線検出は、所定数(例えば8本)以上の直線が検出されるまで、徐々に直線検出するための閾値を変更しながら直線検出処理を行う。この検出された直線を用いて1乃至複数の四辺形を形成する。なお、この四辺形は長方形とは限らない。
【0031】
ステップS505では、所定条件を満たす四辺形をナンバープレート領域候補とする。例えば、ステップS504で検出された四辺形の辺の比を、ナンバープレートの辺の比(基準値)と比較し、大きく異なる四辺形はナンバープレート領域候補から除外する。
【0032】
図6は、ナンバープレート検出処理の処理対象となった入力画像の例である。ここでは、この入力画像内のナンバープレート601〜603内の各文字に対応する黒画素の連結画素が検出されることになる。
【0033】
図7は、図6のナンバープレート601の付近を拡大した図である。例えば、ステップS503で、連結画素列702,703が検出されたものとする。このとき、ステップS504で、連結画素列702,703に基づき処理対象範囲701を設定して、四辺形検出処理を実行することにより、四辺形704〜706を検出する。そして、ステップS505で、各四辺形の辺の比を検査すると、四辺形706はナンバープレートの基準値と大きく異なると判断され、四辺形704と705とがナンバープレート領域候補として決定される。
【0034】
なお、ナンバープレート領域候補を検出する手法は、上述した以外の公知の技術を併用して、多くのナンバープレート領域候補を検出するようにしてもよい。例えば、ナンバープレートの枠の検出によってナンバープレート領域を検出する方法や、テンプレートマッチングで検出する方法などを用いることができる。このとき検知されるナンバープレート領域候補は、四辺形の領域で検出される。
【0035】
図8のステップS801では、ステップS403で2値化された画像から、予め既定された座標位置などを元に図3に示す301、302、303の領域を判定し確定する。
【0036】
ステップS802では、301に該当する領域の縦方向射影等で得られた黒画素領域の数をnとして、予め与えられる数値MINに対して大きければ、ステップS803を実行する。
【0037】
ステップS803では、301に該当する領域の縦方向射影等で得られた黒画素領域のうち、先頭及び最後尾それぞれ1つ分の黒画素領域を削った領域を、301に該当する文字領域の候補として保持する。
【0038】
ステップS804では、301に該当する領域の縦方向射影等で得られた黒画素領域の数をnとして、予め与えられる数値MINに1を加えた値に対して大きければ、ステップS805を実行する。
【0039】
ステップS805では、301に該当する領域の縦方向射影等で得られた黒画素領域のうち、先頭及び最後尾の2つ分の黒画素領域を削った領域を、301に該当する文字領域の候補として保持する。こうすることで、ステップS405で行う文字認識の際に、301に該当する部分の文字認識列候補が複数できることになる。ちなみに予め与えられる数値MINは、例えば301に該当する文字列の最小文字数としての4を与える。
【0040】
図9は、ナンバープレート検出処理の処理対象となった入力画像の例のうち、黒画素にビスなどのノイズがあるものである。
【0041】
図10のステップS1001では、ステップS404で得られた文字列領域のうち301に当たる領域の元画像に対するステップS405の文字認識結果に対し、認識支援辞書とのマッチングを行う。認識支援辞書とは、ナンバープレートで使用されうる陸運局名及び分類番号の組み合わせを登録したものである。マッチングの結果、ステップS405で得られた文字認識結果と一致すれば、それを当該ナンバープレートの文字列として確定する。
【0042】
ステップS1002では、ステップS404で得られた文字列領域のうち301に当たる領域の先頭の黒画素を省いた画像に対するステップS405の文字認識結果に対し、認識支援辞書とのマッチングを行う。マッチングの結果、ステップS405で得られた文字認識結果と一致すれば、それを当該ナンバープレートの文字列として確定する。
【0043】
ステップS1003では、ステップS404で得られた文字列領域のうち301に当たる領域の最後の黒画素を省いた画像に対するステップS405の文字認識結果に対し、認識支援辞書とのマッチングを行う。マッチングの結果、ステップS405で得られた文字認識結果と一致すれば、それを当該ナンバープレートの文字列として確定する。
【0044】
ステップS1004では、ステップS404で得られた文字列領域のうち301に当たる領域の最初と最後の黒画素を省いた画像に対するステップS405の文字認識結果に対し、認識支援辞書とのマッチングを行う。マッチングの結果、ステップS405で得られた文字認識結果と一致すれば、それを当該ナンバープレートの文字列として確定する。
【0045】
ステップS1005では、ステップS404で得られた文字列領域のうち301に当たる領域の元画像に対するステップS405の文字認識結果に対し、認識支援辞書による修正を試みる。具体的には、陸運局名部分の文字認識結果に対し、認識結果の一部が一致するなどの理由で正解とされるべき地名が類推される場合に、認識結果を修正する。文字の誤認識を修正可能であれば、それを当該ナンバープレートの文字列として確定する。
【0046】
ステップS1006では、ステップS404で得られた文字列領域のうち301に当たる領域の最初と最後の黒画素を省いた画像に対するステップS405の文字認識結果に対し、認識支援辞書による修正を試みる。文字の誤認識を修正可能であれば、それを当該ナンバープレートの文字列として確定する。
【0047】
ステップS1007では、ステップS404で得られた文字列領域のうち301に当たる領域の最後の黒画素を省いた画像に対するステップS405の文字認識結果に対し、認識支援辞書による修正を試みる。文字の誤認識を修正可能であれば、それを当該ナンバープレートの文字列として確定する。
【0048】
ステップS1008では、ステップS404で得られた文字列領域のうち301に当たる領域の最初と最後の黒画素を省いた画像に対するステップS405の文字認識結果に対し、認識支援辞書による修正を試みる。文字の誤認識を修正可能であれば、それを当該ナンバープレートの文字列として確定する。
【0049】
以上の処理によって、ナンバープレートの文字列の認識結果を確定する。なお、上記処理によっても一意にナンバープレート文字列の認識結果を確定できない場合、ナンバープレートではあるが文字認識が不十分である旨の処理結果を返すことが可能である。また、上記処理では、前段のステップにて文字列が確定した場合には後段の処理を行わないとしたが、その時点では確定せず処理を進め、文字認識の類似度や、事前に用意するナンバープレートのテンプレートに対する座標位置の正確さなどをパラメータとして、最終的な文字列の認識結果を確定することも可能である。あるいは、認識結果を確定せず、その候補を1つもしくは複数、確からしさを指標として返すことも可能である。
【図面の簡単な説明】
【0050】
【図1】実施例1に係るナンバープレート認識装置の概略構成を示すブロック図。
【図2】実施例1に係るナンバープレート認識装置の概略構成を示すシステム図。
【図3】実施例1に係るナンバープレートの一例を示す図。
【図4】ナンバープレート認識処理を示すフローチャート。
【図5】ナンバープレート領域候補検出処理のフローチャート。
【図6】入力画像の例。
【図7】入力画像の例の拡大図。
【図8】文字領域選択処理のフローチャート。
【図9】ビス等を抽出したナンバープレート領域の例。
【図10】ナンバープレート文字列確定処理を示すフローチャート。

【特許請求の範囲】
【請求項1】
画像中の文字列を認識する文字列認識方法であって、
画像中の文字列領域を分割し文字領域列を得るステップと、
前記文字領域列のうち任意の一部を選択し文字領域列候補を取得するステップと、
上記文字領域列候補に対し文字認識を行い認識結果文字列候補を得るステップと、
複数の認識結果文字列候補から適切な認識結果文字列を選択するステップを備える
文字列認識方法。
【請求項2】
請求項1に記載の文字列認識方法であって、
上記文字領域列のうち任意の一部を選択し文字領域列候補を取得するステップが、
上記文字領域列の全てを文字領域列候補とするステップと、
上記文字領域列の先頭の一文字領域を削除したものを文字領域列候補とするステップと、
上記文字領域列の末尾の一文字領域を削除したものを文字領域列候補とするステップと、
上位機文字領域列の先頭及び末尾の1文字領域づつを削除したものを文字領域列候補とするステップと、
の一部もしくは全てを備えることを特徴とする文字列認識方法。
【請求項3】
請求項2に記載の文字列認識方法であって、
上記文字領域列候補に対し文字認識を行い認識結果文字列候補を得るステップが、
上記文字領域列候補に対し文字認識を行うステップと、
上記文字認識結果の先頭の数文字が陸運支局名から始まり、かつ残りの文字が3桁以内の数字列である場合に、上記文字認識結果を認識結果文字列候補とするステップと、
上記文字認識結果の先頭の数文字に類似する陸運支局名を求めることができ、かつ残りの文字が3桁以内の数字列である場合に、上記文字認識結果を認識結果文字列候補とするステップと、
認識結果文字列候補は陸運支局名及び分類番号を構成しないと判断するステップと、
を備えることを特徴とする文字列認識方法。
【請求項4】
請求項3に記載の文字列認識方法であって、
複数の認識結果文字列候補から適切な認識結果文字列を選択するステップが、
認識結果文字列候補の先頭の数文字が陸運支局名から始まりかつ残りの文字が3桁以内の数字列であると判定されたものを選択するステップと、
認識結果文字列候補の先頭の数文字が陸運支局名から始まりかつ残りの文字が3桁以内の数字列であると判定されたものが存在しない場合に、認識結果文字列候補の先頭の数文字に基づき陸運支局名辞書から近似解を求め、かつ残りの文字が3桁以内の数字列であると判定されたものを選択するステップと、
を備えることを特徴とする文字列認識方法。
【請求項5】
コンピュータを、請求項1〜請求項4のいずれかに記載されている各ステップを達成するための手段として機能させるコンピュータプログラム。
【請求項6】
請求項5に記載のプログラムを格納したコンピュータ読取可能な記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2009−98867(P2009−98867A)
【公開日】平成21年5月7日(2009.5.7)
【国際特許分類】
【出願番号】特願2007−269140(P2007−269140)
【出願日】平成19年10月16日(2007.10.16)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】