説明

画像検出装置及び方法

【課題】特定文字列を含む画像領域を精度よく効率的に検出する。
【解決手段】矩形候補が検出できた場合、ステップS203において矩形内のOCR処理を試みる。ステップS204において、得られたOCR結果を用い、知識処理を行う。この知識処理とは、認識対象に「岩手」という単語があり知識辞書(文字認識辞書)に登録されている場合に、その単語の認識結果を実現するよう修正処理を行う処理である。ステップS205において、文字認識辞書を利用したステップS204の知識処理の結果がどのようになったかを判定する。知識処理が成功し、修正せずとも陸運支局名であった、もしくは陸運支局名に修正することが可能であった場合、その矩形は求める画像矩形であったと判定する。そして、ステップS206において、ステップS204の知識処理の結果を反映する等の処理を行い、検出処理を終了する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像から特定の文字列領域を検出する画像検出装置及び方法に関する。より詳細には、本発明は、文字の並びに関するフォーマットが決まっている対象物を認識し、画像から特定文字列を含む画像領域を検出する画像検出装置、方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
ナンバープレートのような、予めある程度の文字の並びに関するフォーマットが決まっている対象物の認識に際し、抽出手段と文字認識手段を分ける画像認識システムは数多く存在する。しかし、万が一抽出に失敗すると、即検出不能もしくは文字認識手段による誤認識が発生することになる。それを防ぐため、例えば路面を誤検出しないように検出方法を工夫するような技術が提案されている(例えば、特許文献1参照)。また、対象物の抽出に文字認識手段を直接使用する画像認識システムも存在する。例えば、ナンバープレートの一連の番号部分らしい部分を文字認識し、明らかに数字である場合にナンバープレート領域であると認識する技術が提案されている(例えば、特許文献2参照)。また、対象物の抽出と文字認識に所謂、知識処理を利用する手法もある(例えば特許文献3参照)。
【0003】
【特許文献1】特開2000−235618号公報
【特許文献2】特開2000−182181号公報
【特許文献3】特開2000−148912号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、抽出手段を工夫しても、例えば看板などの誤検出を防ぐことは難しく、また抽出に文字認識手段を使用しても、明らかに数字であると誤認識してしまった場合、誤検出を防ぐことはできない。
【0005】
本発明は、このような課題に鑑みてなされたもので、その目的とするところは、特定文字列を含む画像領域を精度よく効率的に検出する画像検出装置及び方法を提供することにある。
【課題を解決するための手段】
【0006】
このような目的を達成するために、本発明の画像検出装置は、画像から特定文字列(陸運支局名に使用されている文字)を含むか否かを判定すべき領域を抽出する領域抽出手段(101、S201)と、前記領域抽出手段によって抽出された前記領域を文字認識する文字認識手段(S203)と、前記文字認識手段による認識結果に対し第1の辞書(辞書B)に基づき修正を試みる認識結果修正手段(S204)と、前記認識結果修正手段による修正結果に基づき前記領域が前記特定文字列を含むか否かを判定する判定手段(S205)とを備えたことを特徴とする。
【0007】
また上記目的を達成するために、本発明の画像検出方法は、領域抽出手段が、画像から特定文字列を含むか否か可を判定すべき領域を抽出する領域抽出ステップと、文字認識手段が、前記領域抽出ステップにおいて抽出された前記領域を文字認識する文字認識ステップと、認識結果修正手段が、前記文字認識ステップにおける認識結果に対し第1の辞書に基づき修正を試みる認識結果修正ステップと、判定手段が、前記認識結果修正ステップにおける修正結果に基づき前記領域が前記特定文字列を含むか否かを判定する判定ステップとを備えることを特徴とする。
【0008】
また、上記目的を達成するために、本発明のプログラムは、上記に記載の画像検出方法の各ステップをコンピュータに実行させることを特徴とする。
【0009】
また、上記目的を達成するために、本発明の記録媒体は、上記に記載の画画像検出方法の各ステップをコンピュータに実行させるためのプログラムを記録したことを特徴とする。
【0010】
なお、上記目的を達成するための手段の説明において、特許請求の範囲の構成要素と対応する実施形態中の図中符号等を()で示した。ただし、特許請求の範囲に記載した構成要素は上記()部の実施形態の構成要素に限定されるものではない。
【発明の効果】
【0011】
本発明によれば、効率よく正確な画像検出処理が可能となり、特定文字列を含む画像領域を精度よく効率的に検出する効果を奏する。
【発明を実施するための最良の形態】
【0012】
以下、図面を参照して本発明を適用できる実施形態を詳細に説明する。尚、本明細書で参照される各図面において同様の機能を有する箇所には同一の符号を付している。
【0013】
[実施形態1]
本実施形態を説明するための最良の形態として、ナンバープレート画像を抽出する場合を例にあげる。ナンバープレートは決まった矩形内に文字列が配置され、陸運支局名に特定の文字の並びがあり知識処理を施すことが可能である。
【0014】
(装置構成)
図1は、本実施形態を実施するための装置の構成を示すブロック図である。図1に示す装置は、例えば汎用的なPC(personal computer)等のコンピュータが適用可能である。図中符号101は本装置全体の制御を行うCPU(central processing unit)、102は本装置を制御するプログラム等がロードされるRAM(random access memory)等のメモリである。103はプログラムファイル、データファイル、後述の各種辞書ファイル等が格納されているHDD(hard disk drive)等の外部記憶装置である。104は情報を表示するディスプレイ、105は情報を入力するためのキーボード・マウス等の入力装置、106はデジタルカメラ等の画像入力装置である。
【0015】
(動作説明)
図2は本実施形態におけるシステム全体の動作を示すフローチャートである。図2の処理手順は、CPU101が実行する処理の内容を示し、CPU101が、メモリ102にロードされた制御プログラムを読み出して実行することにより行われる。ステップS201において、CPU101は画像入力装置106によって入力された画像から特定画像の矩形を仮抽出する。図3は、本実施形態における求める特定画像を含む入力画像の一例を示す図である。この場合の抽出手段は、車両からの位置推定や画像のエッジ抽出による方法、内部の文字塊と思われる部分からの推測など、既存の検出手段を用いて構わない。本実施形態では、この矩形抽出方法には既存の技術ほどの精度は求めておらず、むしろ精度が悪い場合に本実施形態の効果が大きく発揮される。
【0016】
ステップS202において、CPU101は画像内から矩形候補が検出できなかった場合は、検出処理を終了する。図4は、本実施形態における矩形抽出部分の一例で、矩形候補が検出できた場合の矩形候補例を示す図である。CPU101は矩形候補が検出できた場合、必要に応じてノイズ除去や正対画像作成のための逆透視変換処理等の画像加工処理を加えた後、ステップS203において矩形内のOCR(optical character recognition)処理を試みる。図5は、矩形部分のOCR結果の一例を示す図である。
【0017】
ステップS204において、CPU101はステップS203で得られたOCR結果を用い、知識処理を行う。この知識処理とは、例えば引用文献3に示すような手法の応用であってよい。図6は、矩形部分のOCR結果の詳細の一例を示す図である。図5に示すOCR結果の先頭2文字の詳細な認識結果が、図6に示されるようなOCR結果の詳細である。すなわち、この知識処理とは、認識対象に「岩手」という単語があり知識辞書(文字認識辞書)に登録されている場合に、1文字目の第8候補と2文字目の第2候補を用いて「岩手」という認識結果を実現するよう修正処理を行う処理である。なお、図6に示す認識結果は、ナンバープレートの陸運支局名に使用されている文字のみを認識対象とした文字認識辞書AによりOCR処理をした結果である。文字認識辞書Aの場合、ステップS204の知識処理の仕様によっては「岩手」が候補として上がる可能性があり、図7は、この場合に矩形部分のOCR結果を知識処理した一例である。
【0018】
そこで、本実施形態では、認識のための文字認識辞書として、陸運支局名に使用されている以外の文字も加えた辞書Bを使用する。その文字認識辞書Bを利用した場合のステップS203、S204によるOCR結果を示した例が図8及び図9である。図8は、本実施形態における矩形部分のOCR結果の一例を示す図である。図9は、本実施形態における矩形部分のOCR結果の詳細の一例を示すである。この図9の例によると、認識結果にナンバープレートの陸運支局名に使用されている文字が一切含まれていないため、ステップS204の知識処理による陸運支局名の修正は不可能となる。
【0019】
CPU101はステップS205において、文字認識辞書Bを利用したステップS204の知識処理の結果がどのようになったかを判定する。もし知識処理が失敗し、どの陸運支局名にも修正できなかった場合、CPU101はその矩形は特定画像の矩形ではなかったと判定し、検出処理を終了する。知識処理が成功し、修正せずとも陸運支局名であった、もしくは陸運支局名に修正することが可能であった場合(例えば図7)、CPU101はその矩形は求める画像矩形であったと判定する。そして、CPU101はステップS206において、ステップS204の知識処理の結果を反映する等の処理を行い、検出処理を終了する。
【0020】
[実施形態2]
実施形態2は、実施形態1に記載したシステムにおいて、ナンバープレートを認識の対象とする場合を例に説明する。
【0021】
図10は、本実施形態における矩形部分のOCR結果の一例を示す図で、本実施形態の特徴を示す図である。図2のステップS203におけるOCR処理、ステップS204の知識処理において、知識処理が可能な陸運支局名を認識するための文字認識辞書Cと、それ以外の一連番号等を認識するための文字認識辞書Dとを別に用意する。陸運支局名認識のための文字認識辞書Cには、陸運支局名に使用されている以外の文字も加える(実施形態の文字認識辞書Bの同様)。一方、一連番号等を認識するための文字認識辞書Dには認識対象である数字もしくはひらがなのみを加える。
【0022】
[他の実施形態]
以上述べた実施形態の他に次の形態を実施できる。
(1)実施形態1では、求める領域を矩形としたが、必ずしも矩形である必要は無く、直線に囲まれた領域であってもよいことは、当業者には自明であろう。
(2)実施形態1、2では、説明に最良の形態としてナンバープレートを例に説明をした。しかしながら、人名を含む領域を対象としてもよい。例えば帳票に記入された人名でもよく、名札に記載された人名でもよい。単語辞書Eにはあらかじめ人名を登録しておき、実施形態1に記載の手順において、文字認識辞書Bに替えて辞書Eを使用することより、人名を含む矩形を検出することが可能である。
(3)住所を含む矩形を対象としてもよい。例えば帳票に記入された住所でもよく、交差点の信号部分に記載の交差点名でも、電柱に記載された住所でもよい。単語辞書Fにはあらかじめ住所を登録しておき、実施形態1に記載の手順において、文字認識辞書Bに替えて辞書Fを使用することより、住所を含む矩形を検出することが可能である。
(4)その他、四角形や楕円などのある領域の内部に存在し、商品名や企業名などの名詞や慣用句など、単語に相当するものを単語辞書に追加し、実施形態1または実施形態2に記載の方法を適用することによって、領域を精度よく検出できる。
(5)上述の実施形態は、各データ処理を順次実施するソフトウェアで実現できるものである。即ち、上述した実施の形態の機能を実現するコンピュータプログラムを記録したコンピュータ読み取り可能な記憶媒体(または、記録媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(または、CPUやMPU)が、記憶媒体に格納されたプログラムコードを読み出し、実行することによっても達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が、上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶したCD、MD、メモリカード、MO等のさまざまな記憶媒体に書き込み可能である。
【0023】
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態の機能が実現されるだけではない。即ち、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0024】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が、実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0025】
[実施形態の効果]
以上説明したように本実施形態によれば、画像検出装置は、以下の機能を有する。即ち、画像から特定文字列(陸運支局名に使用されている文字)を含むか否かを判定すべき領域を抽出する領域抽出手段(101、S201)と、上記領域抽出手段によって抽出された上記領域を文字認識する文字認識手段(S203)とを備える。さらに、上記文字認識手段による認識結果に対し第1の辞書(辞書B)に基づき修正を試みる認識結果修正手段(S204)を備える。さらに、上記認識結果修正手段による修正結果に基づき上記領域が上記特定文字列を含むか否かを判定する判定手段(S205)を備える(実施形態1)。
【0026】
以上の構成により、求める画像矩形によく似た画像の誤検出をより詳細に防ぐことが可能となり、検出精度が従来よりも向上する。それと共に、同時にOCR結果も知識処理を用いた修正結果が得られるという副次効果を得ることができる。
【0027】
ここで、上記第1の辞書は、上記特定文字列に含まれる文字と、上記特定文字列に含まれない文字とを含むことができる。
【0028】
また、上記認識結果修正手段は、上記領域内に認識対象が複数存在する場合、認識対象別に上記第1の辞書を含む複数の辞書を使用する(実施形態2、辞書C=辞書B、辞書D))ことができる。
【0029】
以上の構成により、検出に際し使用する文字部分(文字認識辞書Cによる)と文字認識のみに使用する文字部分(文字認識辞書Dによる)とで文字認識辞書を分けることにより、実施形態1に記載したシステムの精度をさらに向上させることが可能となる。
【0030】
また、上記第1の辞書のみが、上記認識結果修正手段により文字列を修正する認識対象とする文字以外の文字も含む(辞書B、辞書C)ことができる。
【0031】
また、上記第1の辞書は上記特定文字列を含むことができる。
【図面の簡単な説明】
【0032】
【図1】本発明を適用できる実施形態の環境を示すシステム構成図である。
【図2】本発明を適用できる実施形態のシステム全体の動作を示すフローチャートである。
【図3】本発明を適用できる実施形態の入力画像の例を示した図である。
【図4】本発明を適用できる実施形態の求める特定画像の矩形抽出部分を示した図である。
【図5】求める特定画像の矩形部分のOCR結果例を示した図である。
【図6】求める特定画像の矩形部分のOCR詳細結果例を示した図である。
【図7】求める特定画像の矩形部分のOCR結果を知識処理し修正した例を示した図である。
【図8】本発明を適用できる実施形態の求める特定画像の矩形部分のOCR結果例を示した図である。
【図9】本発明を適用できる実施形態の求める特定画像の矩形部分のOCR詳細結果例を示した図である。
【図10】本発明を適用できる実施形態の認識対象部分とその文字認識辞書との組み合わせ例を示した図である。
【符号の説明】
【0033】
101 CPU
102 メモリ
103 外部記憶装置
104 ディスプレイ
105 入力装置
106 画像入力装置

【特許請求の範囲】
【請求項1】
画像から特定文字列を含むか否かを判定すべき領域を抽出する領域抽出手段と、
前記領域抽出手段によって抽出された前記領域を文字認識する文字認識手段と、
前記文字認識手段による認識結果に対し第1の辞書に基づき修正を試みる認識結果修正手段と、
前記認識結果修正手段による修正結果に基づき前記領域が前記特定文字列を含むか否かを判定する判定手段と
を備えたことを特徴とする画像検出装置。
【請求項2】
前記第1の辞書は、前記特定文字列に含まれる文字と、前記特定文字列に含まれない文字とを含む
ことを特徴とする請求項1に記載の画像検出装置。
【請求項3】
前記認識結果修正手段は、前記領域内に認識対象が複数存在する場合、認識対象別に前記第1の辞書を含む複数の辞書を使用する
ことを特徴とする請求項1または2に記載の画像検出装置。
【請求項4】
前記第1の辞書のみが、前記認識結果修正手段により文字列を修正する認識対象とする文字以外の文字も含む
ことを特徴とする請求項1乃至3のいずれかに記載の画像検出装置。
【請求項5】
前記第1の辞書は前記特定文字列を含む
ことを特徴とする請求項1乃至4のいずれかに記載の画像検出装置。
【請求項6】
領域抽出手段が、画像から特定文字列を含むか否か可を判定すべき領域を抽出する領域抽出ステップと、
文字認識手段が、前記領域抽出ステップにおいて抽出された前記領域を文字認識する文字認識ステップと、
認識結果修正手段が、前記文字認識ステップにおける認識結果に対し第1の辞書に基づき修正を試みる認識結果修正ステップと、
判定手段が、前記認識結果修正ステップにおける修正結果に基づき前記領域が前記特定文字列を含むか否かを判定する判定ステップと
を備えることを特徴とする画像検出方法。
【請求項7】
請求項6に記載の画像検出方法の各ステップをコンピュータに実行させることを特徴とするプログラム。
【請求項8】
請求項6に記載の画像検出方法の各ステップをコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2009−80635(P2009−80635A)
【公開日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願番号】特願2007−249173(P2007−249173)
【出願日】平成19年9月26日(2007.9.26)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】