説明

画像識別装置

【課題】
本発明は,一定時間毎に入力される画像に対して画像識別を行う装置など,所定の所要時間内に画像識別を終了させる必要がある場合に,前記所要時間内に画像識別が終了するように画像識別アルゴリズムの計算量を自動的に調整することを目的とする。
【解決手段】
上記課題を解決するため,入力手段と,出力手段と,観測点数決定手段と,観測点位置決定手段と,を備え,前記観測点数決定手段は,画像識別の所要時間と観測点数との関係を計算手段の速度あるいは種類毎に関数あるいはデータベースとして記憶しており,前記入力手段から入力された計算手段の情報および所要時間の情報から,前記所要時間内に画像識別が完了する観測点数を決定し,前記観測点位置決定手段は,前記観測点数の分だけ観測点位置を決定し,前記出力手段を通じて前記観測点位置の集合を1種類出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は画像識別に関する発明であって,特に紙葉状の媒体識別に適する。
【背景技術】
【0002】
一般的に,画像識別は,識別精度と所要時間とのトレードオフが課題となる。多くの画素を参照した詳細な画像特徴を用いて識別を行うと識別精度は向上することが多いが,所要時間は長くなる。これを解決するための技術として特許文献1が知られている。
これは,識別対象が多く発生する時間帯は第一のアルゴリズムで画像識別を行い,識別対象が少なくなる時間帯に,第一のアルゴリズム実施時に蓄積した画像に対し,第二のアルゴリズムで再度識別を実行するという技術である。これは,画像識別の結果が利用されるまでの時間に余裕があることから可能な手法である。しかし,例えば,画像識別の結果を用いて媒体を分類する装置では,短時間(例えば500msなど)で結果を出力する必要があり,上記の手法は適用できなかった。
【0003】
【特許文献1】特開平04-242493
【発明の開示】
【発明が解決しようとする課題】
【0004】
本発明は,画像識別の結果を用いて媒体を分類する装置などの,所定の所要時間内に画像識別を終了させる必要がある場合に,前記所要時間内に画像識別が終了するように画像識別アルゴリズムの計算量を自動的に調整することを目的とする。
【課題を解決するための手段】
【0005】
上記課題を解決するため,本発明は,入力手段と,出力手段と,観測点数決定手段と,観測点位置決定手段と,を備え,前記観測点数決定手段は,画像識別の所要時間と観測点数との関係を計算手段の速度あるいは種類毎に関数あるいはデータベースとして記憶しており,前記入力手段から入力された計算手段の情報および所要時間の情報から,前記所要時間内に画像識別が完了する観測点数を決定し,前記観測点位置決定手段は,前記観測点数の分だけ観測点位置を決定し,前記出力手段を通じて前記観測点位置の集合を1種類出力する。
【発明の効果】
【0006】
画像識別を実施する装置の計算速度の違い,画像識別を実施する装置の利用状況の違いなどによって画像識別には異なる計算量が要求されるが,本発明によって画像識別の計算量を自動的に調整することが可能となる。
【0007】
(実施例1)
本発明の実施例1について説明する。図1は実施例1における画像識別アルゴリズム自動構成装置の構成を示すブロック図である。ここでは概要を説明し,詳細については図5,図6のフローを用いて後述する。まず,所要時間101および計算手段の情報102を画像識別アルゴリズム自動構成装置104に入力する。画像識別アルゴリズム自動構成装置104内部では,観測点数決定部105において,所要時間101内で処理が終わるだけの観測点数を決定する。観測点とは,画像識別の際に用いる画像上の場所のことをさす。続いて,観測点位置決定部106において観測点の位置を決定し,観測点位置102を出力する。
【0008】
図2のブロック図は,画像識別装置の構成を表している。撮影画像201が画像識別装置203に入力されると,まず観測点位置変換部204において,観測点位置の座標変換が実施される。この座標変換は,図3に示すように,位置・サイズに関して正規化された観測点位置303を,撮影画像301中の媒体302の位置・サイズに対応して変換するのが目的である。これによって,撮影画像301中の媒体302の位置・サイズの違いが吸収される。図3を,媒体の画像で表したものが図4である。撮影画像301中の媒体画像401に対して,位置・サイズを正規化した画像が画像402となる。
【0009】
観測点画素値取得部205では,観測点位置の画素値がとりだされる。特徴ベクトル正規化部206では,特徴ベクトルに正規化を施す。正規化は,例えば特徴ベクトルの要素の最大値が規定値(1もしくは255)となるように各要素に補正係数を乗算する方法,各要素の値の平均=0,分散=1となるように線形変換する方法,などがある。
識別部207では,入力された特徴ベクトルを用いた識別が実行され,識別結果202が返される。例えば,識別の目的が,入力画像が媒体A,B,Cのいずれなのかを判定するのが目的であれば,識別結果は媒体A,B,C,それらのいずれでもない,の4値の結果である。識別部206で利用される識別技術としては,例えばニューラルネットワーク,LVQ,2次識別関数,SVMといったものがある。
【0010】
画像識別アルゴリズム自動構成装置103における観測点数決定部104の処理を,図5のフローを用いて説明する。まず,選択すべき観測点数npに1をセットする(501)。続いて,観測点数がnpであったときの,観測点位置の画素を取得するのに要する所要時間tg(np),および識別に要する時間tc(np)の和をとり,その和と所定の所要時間tとを比較する(502)。tg(np)およびtc(np)は,計算手段の情報102によって異なる。算出方法には,その計算手段を用いてプログラムを走らせて算出する方法,あるいは計算手段の仕様と,画像識別アルゴリズムを実現するプログラムのステップ数から,ボトムアップに算出する方法などがある。図10に示すように,tg(np)のデータ1002およびtc(np)のデータ1003は,計算手段の種類やクロック周波数によって決定されるインデックス1001毎に,関数として記録しておくとよい。あるいは,クロック周波数clに対しては線形だと判断して,図11に示すように計算手段の種類によってだけ決定されるインデックス1101毎に記録しても良い。502の条件式の結果が真であれば,npを1つ増やし(503),502に戻る。502の条件式の結果が偽であれば,npを一つ減らし(504),終了する。

【0011】
【数1】


【0012】
【数2】

【0013】
次に観測点同士の最低間隔dを設定する(602)。この値は,例えば画像面積と選択すべき観測点数から次式を用いて求める手法がある。
【0014】
【数3】

【0015】
あるいは上記の値を基準として,その1/2,1/3といった値としてもよいし,あるいは固定的に5画素,10画素,といった値にしてもよい。
【0016】
次に,選択済みの観測点数nsに0をセットし(603),マスクを初期化する(604)。マスクされていない画素があるか否かを判定し(605),ない場合は観測点最低間隔dを1減らし(606),603に戻る。
【0017】
判定605でマスクされていない画素がある場合,マスクされていない画素のうちで識別有効度が最大の画素を,観測点として選択し(607),選択済みの観測点数nsを増やす(608)。nsと選択済みの観測点数npとを比較し(609),両者が同じであれば終了する。そうでなければ,観測点として選択した画素から,距離d画素以内の画素をマスクし(606),605へ戻る。
【0018】
なお,ここでは識別有効度が大きい画素から順に観測点として選択したが,ランダムに選択するという方法でもよい。また,観測点数点npのうち一部を識別有効度の大きい順に選択し,残りをランダムに選択する,という方法でも良い。
【0019】
(実施例2)
本発明の実施例2について説明する。図7は,本発明の実施例2における画像識別アルゴリズム自動構成装置の構成を示すブロック図である。
【0020】
観測点数決定部104の動作は,実施例1と同一である。観測点位置決定部105においては,実施例1と異なり,複数の候補を出力する。これは,例えば図6ステップ602における観測点間隔の最低間隔dを複数種類設定することにより,可能となる。
そして,上記観測点位置の複数候補を表示装置701に表示する。このときの表示方法としては,図8,図9に示すような二通りの方法がある。図8では,識別対象となる媒体3種類を左の列に配置し(801〜803),右の列に観測点位置の候補を配置している(804〜806)。図9では,識別対象となる媒体1種類を表示し,観測点位置の候補を重ねて表示している(901〜906)。具体的な描画方法は,観測点位置を表す図形(例えば円,×印など)を,媒体画像に直接書き加えるという方法である。表示に使う色に関しては,識別対象と,観測点位置を表す図形を,異なる彩度,色相にするとユーザにとって見やすい。例えば,媒体画像をグレーの濃淡画像で表示し,観測点位置を表す図形を赤,緑,青などの彩度の高い色で表示すると,ユーザにとって見やすい。
なお,表示する媒体の種類は,ユーザの入力によって切り替えると利便性が高まる。
【0021】
以上のように,実施例1では,計算手段と所定の所要時間を指定することにより,上記所要時間内に画像識別が終了するように観測点数を設定し,観測点の位置を自動的に設定できる。連像的に媒体を搬送して画像識別を実行する装置においては,画像識別を所定の時間内に終了させる必要があるが,本発明はその装置で利用する画像識別のアルゴリズム自動構成に適する。例えば搬送速度の異なる複数の画像識別装置があった場合,計算速度の異なる複数の画像識別装置があった場合,いちいち手動でアルゴリズムを再構成する必要なく,それぞれの装置に許された所要時間に応じて自動的に観測点数および観測点位置が決定される。
実施例1において,画像識別を常に一定の所要時間で終了させる必要があるときは,明示的に入力がなくともその所要時間が入力されているものとして画像識別アルゴリズム自動構成装置を動作させればよい。計算手段が常に一定である場合でも,同様である。
【0022】
実施例2においては,さらに,ユーザは表示された観測点位置の画像をみて,自分の経験則に基づいて適切だと思われる観測点位置を選択することができる。
【0023】
なお,実施例1,2では紙葉状の媒体を想定して説明を行ったが,それ以外の識別対象であっても,識別対象の位置ずれ,傾きが適切に補正できるという条件のもとで本発明は適用可能である。
【産業上の利用可能性】
【0024】
本発明は画像識別に関する発明であって,特に紙葉状の媒体を連続的に識別する装置への適用に適する。
【図面の簡単な説明】
【0025】
【図1】実施例1における画像識別アルゴリズム自動構成装置。
【図2】画像識別装置。
【図3】観測点位置と正規化観測点位置の関係。
【図4】媒体画像と正規化媒体画像の関係。
【図5】観測点数決定部104の動作フロー。
【図6】観測点位置決定部105の動作フロー。
【図7】実施例2における画像識別アルゴリズム自動構成装置。
【図8】観測点位置の表示方法1。
【図9】観測点位置の表示方法2。
【図10】計算手段と画像識別所要時間の関係1。
【図11】計算手段と画像識別所要時間の関係2。
【符号の説明】
【0026】
101 所要時間,102 計算手段の情報,103 観測点位置,104 画像識別アルゴリズム自動構成装置,105 観測点数決定部,106 観測点位置決定部、201 撮影画像,202 識別結果,203 画像識別装置,204 観測点位置変換部,205 観測点画素値取得部,206 特徴ベクトル正規化部,207 識別器、301 撮影画像,302 撮影画像上の観測点位置,303 観測点位置,304 正規化された観測点位置,401 正規化された媒体画像、701 表示装置,702 ユーザ入力装置、801〜803 媒体画像,804〜806 観測点位置を示す画像、901〜906 媒体画像に観測点位置を書き加えた画像、1001 計算手段の種類とクロック毎に決定されるインデックス,1102 計算手段の種類毎に決定されるインデックス,1002 画素取得の所要時間tg(np),1003 識別に要する時間tc(np)。

【特許請求の範囲】
【請求項1】
入力手段と,出力手段と,観測点数決定手段と,観測点位置決定手段と,を備え,
前記観測点数決定手段は,画像識別の所要時間と観測点数との関係を計算手段の速度あるいは種類毎に関数あるいはデータベースとして記憶しており,前記入力手段から入力された計算手段の情報および所要時間の情報から,前記所要時間内に画像識別が完了する観測点数を決定し,
前記観測点位置決定手段は,前記観測点数の分だけ観測点位置を決定し,前記出力手段を通じて前記観測点位置の集合を1種類出力する画像識別アルゴリズム自動構成装置。
【請求項2】
入力手段と,出力手段と,観測点数決定手段と,観測点位置決定手段と,を備え,
前記観測点数決定手段は,特定の計算手段を用いたときの画像識別の所要時間と観測点数との関係を関数あるいはデータベースとして記憶しており,前記入力手段から入力された所要時間の情報から,前記所要時間内に画像識別が完了する観測点数を決定し,
前記観測点位置決定手段は,前記観測点数の分だけ観測点位置を決定し,前記出力手段を通じて前記観測点位置の集合を1種類出力する画像識別アルゴリズム自動構成装置。
【請求項3】
入力手段と,出力手段と,観測点数決定手段と,観測点位置決定手段と,を備え,
前記観測点数決定手段は,計算手段の速度あるいは種類毎に,特定の所要時間内に画像処理が完了する観測点数の情報を記憶しており,前記入力手段から入力された計算手段の情報の情報から,前記特定の所要時間内に画像識別が完了する観測点数を決定し,
前記観測点位置決定手段は,前記観測点数の分だけ観測点位置を決定し,前記出力手段を通じて前記観測点位置の集合を1種類出力する画像識別アルゴリズム自動構成装置。
【請求項4】
請求項1乃至3記載の画像識別アルゴリズム自動構成装置であって,表示手段と,ユーザの操作を受け付けるユーザ入力手段とを備え,
前記観測点位置決定手段は,前記観測点位置の集合を複数種類決定し,
前記表示手段は,前記観測点位置の集合の複数種類を表示し,
ユーザ入力手段からの入力によって指定された,前記観測点位置の集合の1種類を前記出力手段に出力する画像識別アルゴリズム自動構成装置。
【請求項5】
請求項4記載の画像識別アルゴリズム自動構成装置であって,
前記表示手段は,画像識別アルゴリズムが識別対象とする1種類あるいは複数種類の媒体の画像と,前記観測点位置の集合の複数種類を各々図示した複数種類の画像を,並べて表示する画像識別アルゴリズム自動構成装置。
【請求項6】
請求項4記載の画像識別アルゴリズム自動構成装置であって,
前記表示手段は,画像識別アルゴリズムが識別対象とする1種類の媒体の画像,あるいは複数種類の媒体のうちの1種類の画像,に対して,
前記観測点位置を示す印を書き加えて表示する画像識別アルゴリズム自動構成装置。
【請求項7】
請求項6記載の画像識別アルゴリズム自動構成装置であって,
前記表示手段は,前記ユーザ入力手段からの入力によって,画像識別アルゴリズムが識別対象とする複数種類の媒体のうちの,いずれの媒体の画像を表示するか,を切り替える,画像識別アルゴリズム自動構成装置。
【請求項8】
請求項6記載の画像識別アルゴリズム自動構成装置であって,
前記表示手段は,表示する前記1種類の媒体の画像と,書き加える前記観測点位置を示す印とを,異なる彩度または異なる色相,あるいはその両方とする,画像識別アルゴリズム自動構成装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2008−287376(P2008−287376A)
【公開日】平成20年11月27日(2008.11.27)
【国際特許分類】
【出願番号】特願2007−129989(P2007−129989)
【出願日】平成19年5月16日(2007.5.16)
【出願人】(504373093)日立オムロンターミナルソリューションズ株式会社 (1,225)
【Fターム(参考)】