説明

パターン認識装置及びパターン認識方法、プログラム及び記録媒体

【課題】同じ対象物を指し示している文字パターンの位置やサイズが異なった状態の画像が複数存在した場合でも、同じ対象物を指し示した文字パターンとして扱えるようにする。
【解決手段】画像入力部101により、画像とともにこの画像の撮影地点、時刻等の付帯情報を入力し、画像データ蓄積部102に蓄積する。また、文字認識部103により画像中の文字認識を行い、認識結果を文字認識結果蓄積部104に蓄積する。この画像及び付帯情報と文字認識結果とから、指示部105で入力された解析条件に基づき、解析部106で対象物に関連する対象物文字情報を抽出して対象物を解析し、解析結果を結果出力部107で出力する。これにより、同じ対象物を指し示した文字パターンの変動を解析することで、対象物の変動を解析可能である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、変動する可能性のある対象物が記録されている複数の画像に基づき、同時に記録された文字情報を用いて、記録された対象物の変動を解析するために利用されるパターン認識技術に関する。
【背景技術】
【0002】
入力された画像を処理することにより、画像中に含まれる様々なパターンを認識するための技術が従来より提案されている。例えば、特許文献1においては、地図の内容が含まれる画像を処理して地図中の文字列を認識したり、動画中の所定位置に挿入された大きさが一定の文字列情報をパターン認識により認識することを想定している。
【0003】
例えば、特許文献1に開示されているような従来のパターン認識装置においては、画像中に含まれている文字パターンの位置やサイズ、文字認識の候補文字コードの一致度に応じて文字パターンを複数グループに分割し、グループに含まれる文字全体を用いて文字パターンに対応する文字コードを決定している。
【0004】
図14は特許文献1に記載された従来のパターン認識方法における制御の内容を示すフローチャートである。図14に示す制御において、文字候補獲得工程(S1〜S6)では、画像から文字パターンを抽出して、対応する候補文字コードとその確信度を獲得する。グルーピング工程(S3)では、文字パターンをグループ化して文字グループを生成する。一致文字グループ検出工程(S6)では、画像に含まれる生成された文字グループに含まれる獲得された候補文字コードのマッチングを、文字グループ間毎に行い、一致する文字グループを検出する。文字コード決定工程(S7〜S9)では、検出された一致する文字グループに含まれる候補文字コードごとに対応する確信度を集計し、集計された確信度に基づき、文字グループに含まれる文字パターンに対応する文字コードを決定する。
【特許文献1】特開平9−81689号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、前述した従来のパターン認識技術では、同じ対象物に付加された文字列であっても、その対象物が移動や大きさの変化等によって変動する場合には、同じ対象物に関連付けて扱うことはできなかった。
【0006】
従来技術では、画像中の文字の位置やサイズで文字パターンを複数グループに分割し、グループに含まれる文字全体を用いて文字パターンに対応する文字コードを決定しているので、同じ対象物を指し示している文字パターンが例えば撮影時刻の異なる複数の画像中にそれぞれ存在している場合であっても、対象物の位置やサイズが画像毎に異なった状態で存在していると、画像毎に独立した対象物を指し示す文字パターンとしてそれぞれ認識されることになる。このため、複数の画像について文字パターンと対象物との関連付けを行うことができない。
【0007】
例えば、道路上を移動する様々な車両をカメラで撮影して得られる動画像に基づいて車両を自動的に監視しようとするような場合には、それぞれの車両と各車両のナンバープレートに表示されている番号等の文字列、あるいは車両のボディに表示されている広告等の文字列の内容とを対応付けることができれば、それぞれの車両の状態を追跡することが可能になる。しかし、各車両の移動等に伴って対象物とそれを示す文字列パターンのサイズや位置が画像毎に変化することになるので、従来技術では文字列パターンは画像毎に独立したものとして扱われる。そのため、移動中の車両のような対象物については、例えば特定の車両とそのナンバープレートに表示されている番号等とを互いに関連付けて時系列の状態変化として管理することができなかった。
【0008】
本発明は、上記事情に鑑みてなされたもので、同じ対象物を指し示している文字パターンの位置やサイズが異なった状態の画像が複数存在した場合でも、同じ対象物を指し示した文字パターンとして扱うことが可能なパターン認識装置及びパターン認識方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明は、認識対象となる対象物が含まれる可能性のある画像及び前記画像に付帯する付帯情報を入力する画像入力部と、前記画像入力部で入力された画像及び付帯情報を蓄積する画像データ蓄積部と、前記画像入力部で入力された画像に含まれる文字を認識する文字認識部と、前記文字認識部で認識された文字認識結果を蓄積する文字認識結果蓄積部と、対象物の解析条件を入力する指示部と、前記指示部で入力された解析条件に基づき、前記画像データ蓄積部で蓄積された画像及び付帯情報と前記文字認識結果蓄積部で蓄積された文字認識結果とから、対象物に関連する対象物文字情報を抽出し対象物を解析する解析部と、前記解析部で解析された結果を出力する結果出力部とを備えるパターン認識装置を提供する。
上記構成によれば、入力した所定の解析条件に基づき、蓄積した画像及び付帯情報と蓄積した文字認識結果とから、対象物に関連する対象物文字情報を抽出して対象物を解析することで、例えば、複数の画像において、同じ対象物を指し示している文字パターンが位置やサイズが異なった状態でそれぞれ存在している場合であっても、複数の画像上で同じ対象物を指し示しているそれぞれの文字パターンを共通に扱うことが可能となる。このため、文字認識結果を用いて、例えば文字パターンの変動(移動など)を解析することにより、文字パターンが指し示す対象物の変動を解析することが可能になる。
前記付帯情報としては、例えば当該画像を撮影するカメラの設置位置や撮影時刻のような情報を用いることが想定される。つまり、例えば同じ地点で撮影され、撮影時刻が少しずれた複数の画像を処理するような場合には、これらの画像の中に同じ対象物(車両など)が含まれている可能性があるが、対象物及びそれを示す文字パターン(例えば車両のナンバープレート中の表示番号)の画像中の位置や大きさなどは画像毎に位置や大きさなどがずれている可能性が高く、完全に一致することは少ない。しかし、撮影地点の一致の有無や撮影時刻の違いなどを考慮して複数の画像を処理すれば、対象物及びそれを示す文字パターンの変動(移動など)を認識することが可能であり、複数の画像中にそれぞれ現れた同じ対象物及びそれを示す文字パターンを共通の要素として扱うことができ、対象物及びそれを示す文字パターンの変動の状況を検出することも可能になる。
【0010】
また、本発明は、上記のパターン認識装置であって、前記文字認識部は、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズとを含む情報を認識結果として求め、前記解析部は、前記候補文字コード及び評価値と、前記文字の位置及びサイズとを用いて解析を行うものを含む。
上記構成によれば、解析部が解析を行う際に、文字認識結果である候補文字コード及び評価値と、文字の位置及びサイズとを用いることで、例えば対象物の変動に伴ってそれを示す文字パターンが少しずつ異なる状態で複数の画像中にそれぞれ現れる場合であっても、それぞれの文字パターンが共通の対象物を示すものとして扱うことが容易になる。
例えば、文字認識が困難な場合には1つの文字パターンに対する認識結果として複数の候補文字コードが抽出されることになるが、抽出されたそれぞれの候補文字の確信度等を表す評価値を参照することにより、複数の候補文字の中から適切な1つの文字を選択することが可能になる。また、複数の画像の中でそれぞれ検出された文字パターンの位置やサイズの類似性を考慮することにより、各画像中の文字パターンが共通の対象物を示す文字か否かを識別可能になる。
【0011】
また、本発明は、上記のパターン認識装置であって、前記画像入力部は、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、前記解析部は、前記画像の撮影位置及び撮影時間を用いて解析を行うものを含む。
上記構成によれば、解析部が解析を行う際に、処理対象の画像の付帯情報として含まれている撮影位置及び撮影時間の情報を利用することで、複数の画像にそれぞれ現れた対象物及びそれを示す文字パターンが共通のものであるか否かを判断するのが容易になる。例えば、同じ地点で撮影され、撮影時刻が非常に近い2枚の画像のそれぞれに対象物及びそれを示す文字パターンが現れている場合に、複数画像中の対象物及び文字パターンが共通であるか否かを撮影時刻等の類似性から判断することが可能になる。
【0012】
また、本発明は、上記のパターン認識装置であって、前記画像入力部は、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、前記文字認識部は、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズを含む情報を認識結果として求め、前記解析部は、前記画像の撮影位置及び撮影時間と、前記文字コード及び評価値と、前記文字の位置及びサイズと、複数画像間の文字画像の類似度と、画像の色情報とを用いて解析を行うものを含む。
上記構成によれば、解析部が解析を行う際に、処理対象の画像の付帯情報として含まれている撮影位置及び撮影時間の情報と、更に文字認識結果として得られる文字コード及び評価値と、文字の位置及びサイズと、更に複数画像間の文字画像の類似度と、画像の色情報とを用いることで、複数の画像にそれぞれ現れた対象物及びそれを示す文字パターンが共通のものであるか否かを判断するのが容易になる。
例えば、同じ地点で撮影され、撮影時刻が非常に近い2枚の画像のそれぞれに対象物及びそれを示す文字パターンが現れている場合に、複数画像中の対象物及び文字パターンが共通であるか否かを撮影時刻等の類似性から判断することが可能になる。また、各文字パターンの文字認識結果として得られた文字コード及び評価値と、文字の位置及びサイズを利用してそれらの類似性を判定することにより、複数画像中の各文字パターンが共通の対象物を示すものか否かを判断可能になる。更に、複数画像間の文字画像の類似度と色情報とを利用することにより、複数画像中の各文字パターンが共通の対象物を示すものか否かの判断が容易になる。
【0013】
本発明は、認識対象となる対象物が含まれる可能性のある画像及び前記画像に付帯する付帯情報を入力する画像入力ステップと、前記画像入力ステップで入力された画像及び付帯情報を蓄積する画像データ蓄積ステップと、前記画像入力ステップで入力された画像に含まれる文字を認識する文字認識ステップと、前記文字認識ステップで認識された文字認識結果を蓄積する文字認識結果蓄積ステップと、対象物の解析条件を入力する指示ステップと、前記指示ステップで入力された解析条件に基づき、前記画像データ蓄積ステップで蓄積された画像及び付帯情報と前記文字認識結果蓄積ステップで蓄積された文字認識結果とから、対象物に関連する対象物文字情報を抽出し対象物を解析する解析ステップと、前記解析部で解析された結果を出力する結果出力ステップとを有するパターン認識方法を提供する。
上記手順によれば、入力した所定の解析条件に基づき、蓄積した画像及び付帯情報と蓄積した文字認識結果とから、対象物に関連する対象物文字情報を抽出して対象物を解析することで、例えば、複数の画像において、同じ対象物を指し示している文字パターンが位置やサイズが異なった状態でそれぞれ存在している場合であっても、複数の画像上で同じ対象物を指し示しているそれぞれの文字パターンを共通に扱うことが可能となる。このため、文字認識結果を用いて、例えば文字パターンの変動(移動など)を解析することにより、文字パターンが指し示す対象物の変動を解析することが可能になる。
【0014】
また、本発明は、上記のパターン認識方法であって、前記文字認識ステップにおいて、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズとを含む情報を認識結果として求め、前記解析ステップにおいて、前記候補文字コード及び評価値と、前記文字の位置及びサイズとを用いて解析を行うものを含む。
上記手順によれば、解析ステップにおいて解析を行う際に、文字認識結果である候補文字コード及び評価値と、文字の位置及びサイズとを用いることで、例えば対象物の変動に伴ってそれを示す文字パターンが少しずつ異なる状態で複数の画像中にそれぞれ現れる場合であっても、それぞれの文字パターンが共通の対象物を示すものとして扱うことが容易になる。
【0015】
また、本発明は、上記のパターン認識方法であって、前記画像入力ステップにおいて、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、前記解析ステップにおいて、前記画像の撮影位置及び撮影時間を用いて解析を行うものを含む。
上記手順によれば、解析ステップにおいて解析を行う際に、処理対象の画像の付帯情報として含まれている撮影位置及び撮影時間の情報を利用することで、複数の画像にそれぞれ現れた対象物及びそれを示す文字パターンが共通のものであるか否かを判断するのが容易になる。
【0016】
また、本発明は、上記のパターン認識方法であって、前記画像入力ステップにおいて、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、前記文字認識ステップにおいて、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズを含む情報を認識結果として求め、前記解析ステップにおいて、前記画像の撮影位置及び撮影時間と、前記文字コード及び評価値と、前記文字の位置及びサイズと、複数画像間の文字画像の類似度と、画像の色情報とを用いて解析を行うものを含む。
上記手順によれば、解析ステップにおいて解析を行う際に、処理対象の画像の付帯情報として含まれている撮影位置及び撮影時間の情報と、更に文字認識結果として得られる文字コード及び評価値と、文字の位置及びサイズと、更に複数画像間の文字画像の類似度と、画像の色情報とを用いることで、複数の画像にそれぞれ現れた対象物及びそれを示す文字パターンが共通のものであるか否かを判断するのが容易になる。
【0017】
また、本発明は、コンピュータに、上記のいずれかに記載のパターン認識方法の各ステップを実行させるためのプログラムを提供する。
また、本発明は、上記のプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【発明の効果】
【0018】
本発明によれば、同じ対象物を指し示している文字パターンの位置やサイズが異なった状態の画像が複数存在した場合でも、同じ対象物を指し示した文字パターンとして扱うことが可能なパターン認識装置及びパターン認識方法、プログラム及び記録媒体を提供できる。
【発明を実施するための最良の形態】
【0019】
(実施の形態1)
図1は、本発明の実施の形態に係るパターン認識装置の構成を示すブロック図である。本実施の形態のパターン認識装置は、画像入力部101、画像データ蓄積部102、文字認識部103、文字認識結果蓄積部104、指示部105、解析部106、結果出力部107を備えている。
【0020】
具体的には、このパターン認識装置は、例えば図2に示すような画像中に現れる認識対象物(この例では道路上を走行する車両)を認識するような用途に用いることを想定している。図2は実施の形態1のパターン認識装置に係る1箇所の撮影地点で撮影した画像列の例を示す模式図である。
【0021】
画像入力部101は、対象物が含まれる可能性のある画像について、画像及びそれに付帯する付帯情報を入力する。この付帯情報については、画像の撮影位置及び撮影時間の情報が含まれる。画像入力部101については、予め固定された撮影位置で例えば一定の時間間隔で静止画画像を周期的に撮影するカメラを利用して構成することができる。画像データ蓄積部102は、画像入力部101で入力された画像及び付帯情報を蓄積する。
【0022】
図2に示す例では、1箇所の撮影地点(Pa)でそれぞれ異なる時点で順番に撮影した複数枚の画像(Pa1)、(Pa2)、(Pa3)、・・・が画像入力部101から順に入力される場合を想定している。また、図2に示す例では、移動する車両を含むパターンが静止画の各画像(Pa1)、(Pa2)、(Pa3)にそれぞれ現れている。
【0023】
図3は実施の形態1に係る画像列の付帯情報の構成例を示す模式図である。この図3には、画像入力部101が図2に示したような画像列を入力する場合に、画像データ蓄積部102に蓄積される画像と各画像に対応した付帯情報の具体例が示されている。
【0024】
図3に示す例では、複数の画像(Pa1)、(Pa2)、(Pa3)、・・・のそれぞれについて、画像の他に撮影位置(地点)及び撮影時間(時刻)を表す付帯情報が含まれている。付帯情報の撮影位置(地点)の内容から、図3に示す複数の画像(Pa1)、(Pa2)、(Pa3)は、全て同じ撮影位置(地点)で撮影された画像であることが分かる。また、付帯情報の撮影時間(時刻)の内容から、図3に示す複数の画像(Pa1)、(Pa2)、(Pa3)は、少しずつずれた時刻に撮影された画像であることが分かる。
【0025】
文字認識部103は、画像入力部101で入力された画像に記録されている文字パターンを認識し、文字パターン毎に、対応する1つ又はそれ以上の候補文字を表す候補文字コード及び候補文字毎の評価値(文字認識結果の確信度等に相当する値)と、画像中の文字の位置座標及びサイズを含む認識結果を求める。文字認識結果蓄積部104は、文字認識部103で認識された文字認識結果を蓄積する。
【0026】
図4は実施の形態1に係る画像列の文字認識結果の情報の構成例を示す模式図である。この図4には、画像入力部101が図3に示したような画像及び付帯情報を入力する場合に、文字認識部103で認識され文字認識結果蓄積部104に蓄積される文字認識結果の具体例が示されている。
【0027】
図4に示す例では、図2に示した複数の画像(Pa1)、(Pa2)、(Pa3)のそれぞれについて、文字パターン毎に、各文字パターンを区別する情報(104a)と、1以上の候補文字コード(104b)と、候補文字毎の評価値(104c)と、文字パターンの始点及び終点の位置座標(104d)の情報が蓄積されている。
【0028】
例えば、文字認識部103において、図2に示す画像(Pa1)に現れている対象物である(車A)のナンバープレートに現れている番号の各文字パターンが認識されると、図4に示すように、画像(Pa1)に対応する各文字パターン(C7)、(C8)、(C9)、(C10)としてそれぞれ「1」、「2」、「3」、「4」の候補文字コードが検出され、候補毎の評価値と位置座標の情報が文字認識結果蓄積部104に蓄積される。また、各文字パターンの位置座標として始点及び終点の座標が含まれているので、文字パターンのサイズを検出することもできる。
【0029】
指示部105は、対象物の解析条件を入力する。具体的な解析条件としては、例えば認識対象物を特定するための文字列(例えばナンバープレート中の番号)を指定することが想定される。解析部106は、指示部105で入力された解析条件に基づき、画像データ蓄積部102で蓄積された画像及び付帯情報と文字認識結果蓄積部104で蓄積された文字認識結果から、文字コード及び評価値と、文字の位置及びサイズと、画像の撮影位置及び撮影時間と、色情報を用いて対象物に関連する対象物文字情報を抽出し対象物を解析する。
【0030】
結果出力部107は、解析部106で解析された結果を出力する。
【0031】
次に、本実施の形態のパターン認識装置の動作を説明する。図5は本実施の形態のパターン認識装置におけるパターン認識処理の手順の概略を示すフローチャートである。このパターン認識装置における処理動作は、本発明のパターン認識方法の実施の形態に係るものである。
【0032】
画像入力ステップS101では、画像入力部101において、対象物が含まれる可能性のある画像について、画像及び、画像の撮影位置及び撮影時間を含む画像に付帯する付帯情報を入力し、S102へ進む。
【0033】
画像データ蓄積ステップS102では、画像データ蓄積部102において、画像入力ステップS101で入力された画像及び付帯情報を蓄積し、S103に進む。
【0034】
文字認識ステップS103では、文字認識部103において、画像入力ステップS101で入力された画像に記録されている文字を認識し、候補文字コード及び評価値と、文字の位置及びサイズを含む認識結果を求め、S104へ進む。
【0035】
文字認識結果蓄積ステップS104では、文字認識結果蓄積部104において、文字認識ステップS103で認識された文字認識結果を蓄積し、S105へ進む。
【0036】
指示ステップS105では、指示部105において、対象物の解析条件を入力し、S106へ進む。
【0037】
解析ステップS106では、解析部106において、指示ステップS105で入力された解析条件に基づき、画像データ蓄積ステップS102で蓄積された画像及び付帯情報と文字認識結果蓄積ステップS104で蓄積された文字認識結果から、文字コード及び評価値と、文字の位置及びサイズと、画像の撮影位置及び撮影時間と、色情報を用いて対象物に関連する対象物文字情報を抽出し対象物を解析し、S107へ進む。
【0038】
結果出力ステップS107では、結果出力部107において、解析ステップS106で解析された結果を出力する。
【0039】
以下、本実施の形態のパターン認識装置の動作の具体例を説明する。ここでは、図2に示された画像列(Pa1)、(Pa2)、(Pa3)、・・・を処理してこれらの画像中に現れている対象物(車A)について解析する場合の処理を説明する。
【0040】
画像入力部101で入力され、画像データ蓄積部102に蓄積された各画像には、付帯情報として図3に示されているように、撮影地点と撮影時間(時刻)の情報が記録されている。
【0041】
また、文字認識部103で認識され文字認識結果蓄積部104に蓄積された文字認識結果の情報には、図4に示されているように、処理対象の各画像(Pa1、Pa2、Pa3)内のそれぞれの文字パターンについて、候補文字コード(104b)、候補毎の評価値(104c)、文字パターンの始点及び終点の位置座標(104d)がそれぞれ含まれている。
【0042】
図2に示したような画像列(Pa1)、(Pa2)、(Pa3)、・・・を処理する場合には、認識対象物となる(車A)を特定するために、(車A)の車体番号「1234」を例えば管理者の入力操作により指示部105に入力し、この車体番号「1234」を対象物の解析条件(指定文字列)として指示部105から指示することができる。このような指示を与えた場合の解析部106の制御内容の概略を図6に示す。
【0043】
図6は実施の形態1のパターン認識装置における車体番号が指示された場合の解析部の制御手順の概略を示すフローチャートである。以下、解析部106における制御処理の内容について説明する。
【0044】
S601では、解析部106は、文字認識結果蓄積部104の内容(図4参照)を参照して、画像(Pa1)の文字認識結果の候補文字コードに、評価値が50未満である一定基準を満たした文字列「1234」が存在するか判定する。存在すればS602に進み、存在しなければS603に進む。
【0045】
解析部106が図4に示す内容に含まれている画像(Pa1)を基に、図6に示すような処理を行うことによって、図7に示すような結果(各領域104e〜104hの記録内容)を得ることができる。図7は実施の形態1においての対象となる文字列について記録した処理結果の情報の構成を示す模式図である。なお、図4に示す各領域104a〜104dの内容と、図7に示す各領域104a〜104dの内容とは同一のものを表している。
【0046】
解析条件として文字列「1234」が指定された場合には、S601において、画像(Pa1)を処理する際に、図7に示されているように4つの文字パターン(C3)、(C4)、(C5)、(C6)の集合により構成される1つの文字列(L1)が検出できるので、S602に進む。
【0047】
S602では、画像(Pa1)の文字列(L1)に対応する検出情報として、図7に示すように該当する文字列(L1)に対応付けた領域(104e)に、撮影時刻(104f)、文字画像群(104g)、文字列座標(104h)を記憶する。ここで、撮影時刻(104f)の情報は、画像データ蓄積部102の内容から取得することができる。文字画像群(104g)の情報は、文字認識結果蓄積部104に記録されている各文字パターンの情報(104a)の中で、指定された文字列(L1)の各文字を表す要素の組み合わせとして記録される。すなわち、「1234」を表す文字列(L1)は、図7に示す文字パターン(C3)、(C4)、(C5)、(C6)の組み合わせとして領域104gに記録される。また、文字列(L1)の文字列座標(104h)については、文字パターン(C3)〜(C6)に対応する座標(104dの内容)から求められる文字列全体の始点及び終点の座標として領域104hに記録される。
【0048】
S603では、全ての画像について処理を実施したか判定し、完了していなければS601に進み、完了していればS604に進む。
【0049】
S602の処理によって、図7に示す各領域104e、104f、104g、104hに結果が記録される。図7に示す例では、2つの文字列(L1)、(L2)が検出できた場合を想定している。すなわち、画像(Pa1)を処理した結果として、指定された文字列「1234」に対応する文字列(L1)が画像(Pa1)の中から検出され、画像(Pa2)を処理した結果として、指定された文字列「1234」に対応する文字列(L2)が画像(Pa2)の中から検出され、これらが領域104e〜104hに記録される。
【0050】
S604では、解析部106は検出できた各文字列(L1,L2)の撮影時間(104fの内容)と文字列座標(104hの内容)の情報を利用し、図8に示すような判定基準に基づいて文字列の移動方向を判定する。図8は本実施の形態において用いる対象となる文字列の移動方向を判定する判定基準を表す模式図である。
【0051】
図7に示すような文字認識結果を処理する場合には、同じ文字列「1234」に対応する文字列として(L1)、(L2)が検出されているので、文字列(L1)と文字列(L2)とが同じ対象物(車A)を示すものかどうかを判定することができる。更に、同じ対象物(車A)を示す場合には、これらの文字列(L1)、(L2)の移動方向を検出できる。
【0052】
すなわち、文字列(L1)、(L2)は同じ撮影位置で撮影された複数の画像(Pa1)、(Pa2)から抽出されており、文字列の内容が指定された内容「1234」と同じであり、しかも画像(Pa1)、(Pa2)の撮影時間の差が小さいので、これらは同じ対象物(車A)を示す文字列であると判定できる。
【0053】
また、図8に示すような判定基準に基づいて文字列(L1)、(L2)の情報(図7に示す領域104e〜104hの内容)を処理することにより、文字列(L1)、(L2)に関する移動(対象物の移動に相当する)の状況を判定できる。
【0054】
図8に示す判定基準においては、「左移動」、「右移動」、「下移動」、「上移動」、「前進」、「後退」の6種類の判定条件を規定している。撮影時間の違いにより、図7中の文字列(L1)、(L2)は、それぞれ図8に示す(La)、(Lb)に相当する。つまり、撮影時刻が相対的に前の画像から検出された文字列が図8中の文字列(La)に対応し、撮影時刻が相対的に後の画像から検出された文字列が図8中の文字列(Lb)に相当する。図8中に示す各パラメータの意味は次の通りである。
LaYs:文字列(La)のパターンの始点Y座標位置
LaYe:文字列(La)のパターンの終点Y座標位置
LaXs:文字列(La)のパターンの始点X座標位置
LaXe:文字列(La)のパターンの終点X座標位置
LbYs:文字列(Lb)のパターンの始点Y座標位置
LbYe:文字列(Lb)のパターンの終点Y座標位置
LbXs:文字列(Lb)のパターンの始点X座標位置
LbXe:文字列(Lb)のパターンの終点X座標位置
【0055】
図8中に示すように、始点は画像中の当該パターンの左上端部座標を表し、終点は右下端部座標を表す。
【0056】
例えば、図7に示す領域104e〜104hの内容である文字列(L1)、(L2)について、解析部106が図8に示す判定基準との適合性を調べることにより、下移動の条件が成立する。すなわち、(LbYs<LaYs)、(LbYe<LaYe)、(LbXs≒LaXa)、(LbXe≒LaXe)の全ての条件を満たしているので、指定された文字列「1234」に相当する文字列(L1)、(L2)は下方向に進んでいると判定できる。よって、対象物(車A)は下方向に進んでいると解析できる。
【0057】
以上のように、対象物を指し示す文字の位置やサイズを利用することにより、上下左右への移動、前進後退、出現消滅などの対象物の移動状態が解析できる。
【0058】
(実施の形態2)
次に、実施の形態2として、複数の地点で撮影された画像を処理してパターン認識を行う例を示す。上述した実施の形態1では、図2に示したように同じ地点で撮影された複数の画像(Pa1)、(Pa1)、(Pa3)、・・・を処理する場合を想定しているが、以下の実施の形態2のように、複数の地点(Pb)、(Pc)、(Pd)で撮影された画像を処理してパターン認識することも可能である。
【0059】
図9は実施の形態2のパターン認識装置に係る3箇所の撮影地点で撮影した画像列の例を示す模式図である。ここで、3箇所の撮影地点(Pb)、(Pc)、(Pd)は同一の高速道路上にあり、上り線は撮影地点(Pb)、(Pc)、(Pd)の順で出現する場合を想定している。以下では、図9の画像列の中に撮影されている対象物(車B)について解析する場合を説明する。パターン認識装置の構成は図1に示したものと同様であり、ここでは説明を省略する。
【0060】
図10は実施の形態2に係る画像列の付帯情報の構成例を示す模式図である。この図10には、画像入力部101が図9に示したような画像列を入力する場合に、画像データ蓄積部102に蓄積される画像と各画像に対応した付帯情報の具体例が示されている。この例では、付帯情報において、撮影地点の起点距離(特定の起点位置からの距離)と撮影時間とが記録されている。
【0061】
図11は実施の形態2に係る画像列の文字認識結果の情報の構成例を示す模式図である。この図11には、画像入力部101が図10に示したような画像及び付帯情報を入力する場合に、文字認識部103で認識され文字認識結果蓄積部104に蓄積される文字認識結果の具体例が示されている。この場合、各画像内の全ての文字について、各文字パターンを区別する情報(104a)と、候補毎の候補文字コード(104b)と、候補毎の評価値(104c)と、文字の始点及び終点の位置座標(104d)とが記録されている。
【0062】
この例では、パターン認識装置を操作する管理者が、指示部105を操作することにより、撮影地点及び特定の画像中に現れている対象物を指定できる場合を想定している。このような指定を行った場合の解析部106の制御内容の概略を図12に示す。
【0063】
図12は実施の形態2のパターン認識装置における対象物が指定された場合の解析部の制御手順の概略を示すフローチャートである。ここでは、指示部105で管理者が撮影地点(Pc)の画像列の画像(Pc2)の中に現れている対象物(図9中の車B)を指定した場合の解析部106における制御処理の内容について説明する。
【0064】
S611では、解析条件を抽出する。例えば、管理者の指示した画像(Pc2)の撮影時間10:00(図10参照)と、管理者が指示した対象物の近辺の領域の文字認識結果(図11の内容の一部分)に含まれている各候補文字コード(104bの内容)の中で、評価値(104cの内容)が50未満である一定基準を満たした文字列「5673」、「5678」と、文字列「5673」に対応する文字画像群(C21,C22,C23,C24)及び文字列「5678」に対応する文字画像群(C21,C22,C23,C24)と、文字列「5673」に対応する文字位置の周辺の背景色である<赤>及び文字列「5678」に対応する文字位置の周辺の背景色である<赤>と、が解析条件になる。
【0065】
S612では、撮影時間条件と地点の位置関係から判定対象画像か否かを判定し、対象画像であればS613に進み、対象画像でなければS617に進む。具体的には、道路上の各車線における車両の進行方向が予め定まっていること、並びに複数の撮影地点間の移動に要する時間(50kmの移動に30分を要する)を考慮して、撮影地点(Pb)で対象となるのは、指定された画像(Pc2)の撮影時刻から30分早く撮影された画像(Pb1)以前に撮影された画像のみに限定する(図10参照)。また、撮影地点(Pc)で対象となるのは、画像(Pc2)前後に撮影された画像である。撮影地点(Pd)で対象となるのは、撮影地点間の移動に要する時間を考慮し、画像(Pd3)以降に撮影された画像のみに限定する。
【0066】
解析部106が図10に示す情報(画像データ蓄積部102の内容)及び図11に示す情報(文字認識結果蓄積部104の内容)を基に、図12のステップS613〜S616で示す処理を行うことにより、図13に示すような結果(各領域104e〜104jの記録内容)を得ることができる。図13は実施の形態2において対象となる文字列について記録した処理結果の情報の構成を示す模式図である。なお、図11に示した各領域104a〜104dの内容と図13に示した各領域104a〜104dの内容とは同一である。
【0067】
S613では、解析部106は順次入力される画像について、文字認識結果の候補文字コードに、評価値が50未満である一定基準を満たした文字列「5673」「5678」が存在するか判定し、存在すればS614に進み、存在しなければS617に進む。
【0068】
図13に示すように、検査対象の文字列「5678」については、画像(Pb1)から4つの文字パターン(C11)、(C12)、(C13)、(C14)の集合である文字列(L11)として検出され、画像(Pc2)から4つの文字パターン(C21)、(C22)、(C23)、(C24)の集合である文字列(L12)として検出される。
【0069】
また、検査対象の文字列「5673」は、画像(Pc2)から4つの文字パターン(C21)、(C22)、(C23)、(C24)の集合である文字列(L21)として検出され、画像(Pd3)から4つの文字パターン(C31)、(C32)、(C33)、(C34)の集合である文字列(L22)として検出される。
【0070】
S614では、検出された文字列(L11)、(L12)、(L21)、(L22)の文字画像群について、文字列「5678」に対応する文字画像群(C21,C22,C23,C24)又は文字列「5673」に対応する文字画像群(C21,C22,C23,C24)との類似度を求め、類似度が一定基準を満たしていればS615に進み、満たしていなければS617に進む。類似度は、文字認識部103における文字認識の評価値の算出方法と同様の方法で求められる。図13に示す例では、文字列(L11)、(L12)、(L21)、(L22)については類似度が基準を満たしているので、S615に進む。
【0071】
S615では、順次入力される文字列について、対応する文字位置の周辺の背景色を画像の中から検出し、類似色であればS616に進み、類似色でなければS617に進む。
【0072】
例えば、文字列「5678」の文字列(L11)、(L12)については、両方とも画像から検出された背景色が赤色であるため、図13に示す領域104jに<赤>として記録されており、文字列(L11)、(L12)を比較する場合にはこれらが類似色であると判断してS616に進む。
【0073】
一方、文字列「5673」の文字列(L21)については図13の領域104jに<赤>として記録され、文字列(L22)については領域104jに<白>として記録されているので、文字列(L21)、(L22)を比較する場合には両者の背景が類似色でないと判断してS617に進む。
【0074】
このように文字列の画像中の背景色を比較することにより、例えば認識対象物が車両である場合に、車両番号(ナンバープレートの表示内容)が似ている複数の車両が存在する場合であっても、車両の車体の色の違いにより複数の車両をそれぞれ区別することが容易になる。
【0075】
S616では、S612〜S615で最終的に有効な情報と見なされた(指定された対象物との関連性が高く互いに似ている)複数の文字列(L11)、(L12)についてそれらの起点距離、撮影時刻、文字画像群、文字列座標、背景色の情報が記憶される。
【0076】
例えば、図13に示す領域104eに記録されている文字列「5678」を示す文字列(L11)、(L12)については、両者の関連性が高いと判断されるので、各領域104f、104g、104h、104i、104jに記録されている起点距離、撮影時刻、文字画像群、文字列座標、背景色の情報が有効な情報としてS616で記録される。
【0077】
一方、図13に示す領域104eに記録されている文字列「5673」を示す文字列(L21)、(L22)については、背景色の違いなどの影響により両者の関連性が低いと判断されるので、これらは有効な情報として記録されない。
【0078】
S617では、全ての画像について処理を実施したか判定し、完了していなければS612に進み、完了していればS618に進む。
【0079】
S618では、解析条件の文字列毎に、検出できた各文字列(L)の起点距離、撮影時刻、文字列座標から、文字列の移動状態を判定し、その結果を対象物の移動状態とする。
【0080】
例えば、図13に示す有効な文字列(L11)、(L12)の情報(各領域104e、104f、104g、104h、104i、104jの内容に相当)に基づいて対象物(例えば図9に示す車B)を解析すると、対象物(車B)は、9:30の時刻に撮影地点(Pb)の追越車線(領域104iの位置座標から分かる)を通過し、10:00の時刻に撮影地点(Pc)の走行車線を通過し、まだ撮影地点(Pd)には到達していないと解析できる。
【0081】
以上のように、例えば車両のような対象物を指し示す文字(車両番号や広告表示など)の内容や位置やサイズに加えて、画像の撮影位置及び撮影時間や文字画像の類似度や色情報を利用することにより、対象物の移動状態を、より広範囲に渡って詳細かつ正確に解析できる。
【0082】
なお、本実施の形態では、対象物と同時に撮影され対象物を指し示すパターンが文字列である場合を想定しているが、ロゴやマークなど文字と同様の性質を持つパターンを用いてもよい。各処理における各種条件についても、同様の判定基準であれば、これに限るものではない。
【0083】
また、図1に示した画像入力部、画像データ蓄積部、文字認識部、文字認識結果蓄積部、解析部等の各機能ブロックについては、典型的には集積回路であるLSIとして実現されてもよい。集積回路化の手法は、LSIに限るものではない。これらは、個別に1チップ化されてもよいし、一部又は全部を含むように1チップ化されてもよい。この場合、LSIにおけるハードウェア回路の動作、またはプロセッサ上の所定のソフトウェアプログラムの動作による処理によって各機能を実現可能である。
【0084】
また、図5、図6、図12に示した各機能の処理ステップについては、コンピュータで実行可能なプログラムで記述されていてもよく、プログラムの実行により各機能を実現することも可能である。また、適当な記録媒体(例えばCD−ROM、DVDディスク等)からコンピュータにプログラムを読み込んでこれを実行しても良い。
【0085】
上述したように、本実施形態によれば、同じ対象物を指し示している文字パターンの位置やサイズが異なる状態で複数の画像にそれぞれ現れている場合でも、共通の文字パターンを同じ対象物を示すパターンとして扱うことができる。このため、同じ対象物を指し示した文字パターンの変動を解析することにより、文字パターンが指し示す対象物の変動を解析することができる。本実施形態は、例えば、監視カメラ等で撮影された画像の解析装置、広域監視システム等に応用が可能である。
【0086】
なお、本発明は上記の実施形態において示されたものに限定されるものではなく、明細書の記載、並びに周知の技術に基づいて、当業者が変更、応用することも本発明の予定するところであり、保護を求める範囲に含まれる。
【産業上の利用可能性】
【0087】
本発明は、同じ対象物を指し示している文字パターンの位置やサイズが異なった状態の画像が複数存在した場合でも、同じ対象物を指し示した文字パターンとして扱うことが可能となる効果を有し、例えば道路上を移動する様々な車両をカメラで撮影して得られる動画像に基づいて車両を自動的に監視するような場合など、変動する可能性のある対象物が記録されている複数の画像に基づき、同時に記録された文字情報を用いて、記録された対象物の変動を解析するために利用されるパターン認識装置及びパターン認識方法、プログラム及び記録媒体等として有用である。
【図面の簡単な説明】
【0088】
【図1】本発明の実施の形態に係るパターン認識装置の構成を示すブロック図
【図2】実施の形態1のパターン認識装置に係る1箇所の撮影地点で撮影した画像列の例を示す模式図
【図3】実施の形態1に係る画像列の付帯情報の構成例を示す模式図
【図4】実施の形態1に係る画像列の文字認識結果の情報の構成例を示す模式図
【図5】本実施の形態のパターン認識装置におけるパターン認識処理の手順の概略を示すフローチャート
【図6】実施の形態1のパターン認識装置における車体番号が指示された場合の解析部の制御手順の概略を示すフローチャート
【図7】実施の形態1において対象となる文字列について記録した処理結果の情報の構成を示す模式図
【図8】本実施の形態において用いる対象となる文字列の移動方向を判定する判定基準を表す模式図
【図9】実施の形態2のパターン認識装置に係る3箇所の撮影地点で撮影した画像列の例を示す模式図
【図10】実施の形態2に係る画像列の付帯情報の構成例を示す模式図
【図11】実施の形態2に係る画像列の文字認識結果の情報の構成例を示す模式図
【図12】実施の形態2のパターン認識装置における対象物が指定された場合の解析部の制御手順の概略を示すフローチャート
【図13】実施の形態2において対象となる文字列について記録した処理結果の情報の構成を示す模式図
【図14】従来のパターン認識方法における制御の内容を示すフローチャート
【符号の説明】
【0089】
101 画像入力部
102 画像データ蓄積部
103 文字認識部
104 文字認識結果蓄積部
105 指示部
106 解析部
107 結果出力部

【特許請求の範囲】
【請求項1】
認識対象となる対象物が含まれる可能性のある画像及び前記画像に付帯する付帯情報を入力する画像入力部と、
前記画像入力部で入力された画像及び付帯情報を蓄積する画像データ蓄積部と、
前記画像入力部で入力された画像に含まれる文字を認識する文字認識部と、
前記文字認識部で認識された文字認識結果を蓄積する文字認識結果蓄積部と、
対象物の解析条件を入力する指示部と、
前記指示部で入力された解析条件に基づき、前記画像データ蓄積部で蓄積された画像及び付帯情報と前記文字認識結果蓄積部で蓄積された文字認識結果とから、対象物に関連する対象物文字情報を抽出し対象物を解析する解析部と、
前記解析部で解析された結果を出力する結果出力部と
を備えるパターン認識装置。
【請求項2】
請求項1に記載のパターン認識装置であって、
前記文字認識部は、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズとを含む情報を認識結果として求め、
前記解析部は、前記候補文字コード及び評価値と、前記文字の位置及びサイズとを用いて解析を行うパターン認識装置。
【請求項3】
請求項1に記載のパターン認識装置であって、
前記画像入力部は、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、
前記解析部は、前記画像の撮影位置及び撮影時間を用いて解析を行うパターン認識装置。
【請求項4】
請求項1に記載のパターン認識装置であって、
前記画像入力部は、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、
前記文字認識部は、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズを含む情報を認識結果として求め、
前記解析部は、前記画像の撮影位置及び撮影時間と、前記文字コード及び評価値と、前記文字の位置及びサイズと、複数画像間の文字画像の類似度と、画像の色情報とを用いて解析を行うパターン認識装置。
【請求項5】
認識対象となる対象物が含まれる可能性のある画像及び前記画像に付帯する付帯情報を入力する画像入力ステップと、
前記画像入力ステップで入力された画像及び付帯情報を蓄積する画像データ蓄積ステップと、
前記画像入力ステップで入力された画像に含まれる文字を認識する文字認識ステップと、
前記文字認識ステップで認識された文字認識結果を蓄積する文字認識結果蓄積ステップと、
対象物の解析条件を入力する指示ステップと、
前記指示ステップで入力された解析条件に基づき、前記画像データ蓄積ステップで蓄積された画像及び付帯情報と前記文字認識結果蓄積ステップで蓄積された文字認識結果とから、対象物に関連する対象物文字情報を抽出し対象物を解析する解析ステップと、
前記解析部で解析された結果を出力する結果出力ステップと
を有するパターン認識方法。
【請求項6】
請求項5に記載のパターン認識方法であって、
前記文字認識ステップにおいて、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズとを含む情報を認識結果として求め、
前記解析ステップにおいて、前記候補文字コード及び評価値と、前記文字の位置及びサイズとを用いて解析を行うパターン認識方法。
【請求項7】
請求項5に記載のパターン認識方法であって、
前記画像入力ステップにおいて、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、
前記解析ステップにおいて、前記画像の撮影位置及び撮影時間を用いて解析を行うパターン認識方法。
【請求項8】
請求項5に記載のパターン認識方法であって、
前記画像入力ステップにおいて、前記付帯情報として少なくとも該当する画像に関する撮影位置及び撮影時間を含む情報を入力し、
前記文字認識ステップにおいて、文字パターンに対応する候補文字コード及び文字認識に関する評価値と、文字の位置及びサイズを含む情報を認識結果として求め、
前記解析ステップにおいて、前記画像の撮影位置及び撮影時間と、前記文字コード及び評価値と、前記文字の位置及びサイズと、複数画像間の文字画像の類似度と、画像の色情報とを用いて解析を行うパターン認識方法。
【請求項9】
コンピュータに、請求項5〜8のいずれかに記載のパターン認識方法の各ステップを実行させるためのプログラム。
【請求項10】
請求項9に記載のプログラムを記録したコンピュータで読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2009−301179(P2009−301179A)
【公開日】平成21年12月24日(2009.12.24)
【国際特許分類】
【出願番号】特願2008−152749(P2008−152749)
【出願日】平成20年6月11日(2008.6.11)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】