画像認識装置および画像認識方法
【課題】装置の小規模化を図ることができる画像認識装置を提供することである。
【解決手段】画像認識装置は、撮像装置によって撮像された1画面分の画像データ101の一部101aを用いて、認識対象物が、撮像された画像データ101の中に存在するか否かを判定する。具体的には、撮像装置によって撮像された画像データ101の一部101aが入力されると、その一部101aの中に、認識対象物を特定するデータが存在するか否かを判定する。そして、撮像装置によって撮像された画像データ101を構成する他の一部101b〜101dにおいても同様に判定を行い、最後の一部101dが入力され、判定が終了するタイミングで、認識対象物が、撮像された1画面分の画像データ101全体の中に存在するか否かを判定する。
【解決手段】画像認識装置は、撮像装置によって撮像された1画面分の画像データ101の一部101aを用いて、認識対象物が、撮像された画像データ101の中に存在するか否かを判定する。具体的には、撮像装置によって撮像された画像データ101の一部101aが入力されると、その一部101aの中に、認識対象物を特定するデータが存在するか否かを判定する。そして、撮像装置によって撮像された画像データ101を構成する他の一部101b〜101dにおいても同様に判定を行い、最後の一部101dが入力され、判定が終了するタイミングで、認識対象物が、撮像された1画面分の画像データ101全体の中に存在するか否かを判定する。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、画像認識装置および画像認識方法に関し、特に、カメラ等の撮像装置によって撮像された画像データの中から、特定の対象物を認識することができる画像認識装置および画像認識方法に関するものである。
【背景技術】
【0002】
カメラ等の撮像装置によって撮像された画像データの中から、特定の対象物を認識する技術は、例えば、特開2008−77626号公報(特許文献1)に開示されている。
【0003】
特許文献1によると、装置は、カメラによって撮像された画像データをフレームメモリに蓄積する。そして、フレームメモリに蓄積した画像データを加工等することによって、撮像された画像データの中から、特定の対象物を認識することとしている。
【特許文献1】特開2008−77626号公報(段落番号0023〜0027等)
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1に開示の技術では、対象物を認識するために、一旦撮像された画像データをフレームメモリに蓄積している。この場合、装置の規模が大きくなってしまう虞がある。
【0005】
この発明の目的は、装置の小規模化を図ることができる画像認識装置を提供することである。
【0006】
この発明の他の目的は、装置の小規模化を図ることができる画像認識方法を提供することである。
【課題を解決するための手段】
【0007】
この発明に係る画像認識装置は、被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識装置であって、撮像手段によって撮像された画像データの一部の入力を受け付ける画像入力受付手段と、画像入力受付手段に同期して作動し、予め定められた学習データに基づいて、画像入力受付手段により入力を受け付けた画像データの一部を用いて、認識対象物が存在するか否かを判定する画像判定手段とを備える。
【0008】
好ましくは、画像入力受付手段は、所定の走査順で、撮像手段によって撮像された画像データの一部の入力を受け付け、学習データは、認識対象物の少なくとも一部を特定するデータを有し、画像判定手段は、特定するデータを所定の走査順に並べることによって、画像入力受付手段に同期して作動する。
【0009】
さらに好ましくは、画像判定手段は、画像入力受付手段により入力を受け付けた画像データの一部において、特徴量を算出する算出手段と、算出手段によって算出された特徴量が、所定の閾値よりも大きいか否かを比較する閾値比較手段と、閾値比較手段によって比較された結果に対して、重みを付加する付加手段とを含む。
【0010】
さらに好ましくは、画像入力受付手段により入力を受け付けた画像データから、一定の大きさの画像データを抽出する抽出手段をさらに備える。
【0011】
さらに好ましくは、抽出手段は、画像入力受付手段により入力を受け付けた画像データを、所定のサイズの分割画像データに複数分割する分割手段と、分割手段により分割した複数の分割画像データの中から、所望の分割画像データを抜き出す抜出手段と、抜出手段により抜き出した分割画像データを合成して1つの画像データを形成する合成手段とを含む。
【0012】
この発明の他の局面においては、画像認識方法は、被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識方法である。そして、撮像手段によって撮像された画像データの一部の入力を受け付けるステップと、受け付けステップに同期して作動し、予め定められた学習データに基づいて、入力を受け付けた画像データの一部を用いて、認識対象物が存在するか否かを判定するステップとを備える。
【発明の効果】
【0013】
この発明に係る画像認識装置は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【0014】
また、この発明に係る画像認識方法は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【発明を実施するための最良の形態】
【0015】
まず、この発明の原理について説明する。
【0016】
従来の画像認識装置は、撮像装置によって撮像された1画面分の画像データを保存するフレームメモリを備える。画像認識装置は、撮像装置によって撮像された1画面分の画像データ全てをフレームメモリに保存する。そして、フレームメモリに保存した1画面分の画像データを用いて、認識対象物が、撮像された画像データの中に存在するか否かを判定する。図16は、従来の画像認識装置を用いて、撮像された画像データの中に、認識対象物としての矢印が存在するか否かを判定する場合における画像データ100の構成を示す図である。図16を参照して、画像認識装置は、撮像装置によって撮像された1画面分の画像データ100全てをフレームメモリに保存している。
【0017】
一方、図17は、この発明に係る画像認識装置を用いて、撮像された画像データの中に、認識対象物としての矢印が存在するか否かを判定する場合における画像データ101の構成を示す図である。図17を参照して、画像認識装置は、撮像装置によって撮像された1画面分の画像データ101の一部101aを用いて、認識対象物が、撮像された画像データ101の中に存在するか否かを判定する。具体的には、撮像装置によって撮像された画像データ101の一部101aが入力されると、その一部101aの中に、認識対象物を特定するデータが存在するか否かを判定する。すなわち、撮像された画像データ101の一部101aの入力に同期して、その一部101aの中に、認識対象物を特定するデータが存在するか否かを判定する。そして、撮像装置によって撮像された画像データ101を構成する他の一部101b〜101dにおいても同様に判定を行い、最後の一部101dが入力され、判定が終了するタイミングで、認識対象物が、撮像された1画面分の画像データ101全体の中に存在するか否かを判定する。
【0018】
以下、この発明に係る画像認識装置の実施の形態を図面を参照して詳細に説明する。図1は、この発明の一実施形態に係る画像認識装置10の構成を示すブロック図である。図1を参照して、画像認識装置10は、被写体を撮像可能な撮像手段としてのカメラ部9によって撮像された画像データの入力を受け付ける画像入力受付部11と、画像入力受付部11にて入力を受け付けた画像データの前処理を行う前処理部12と、前処理部12にて処理された画像データの切り出しおよび正規化を行うスキャン処理部13と、スキャン処理部13にて処理された画像データにおいて、HaarLike特徴量の算出を行う特徴量算出部14と、特徴量算出部14にて算出された結果に基づいて、入力を受け付けた画像データに、認識対象物が存在するか否かを判定する判定部15と、判定部15にて判定する際に用いる学習データを格納するデータ格納部16とを備える。
【0019】
図2は、図1に示す画像認識装置10を用いて、対象物の認識を行う場合の処理の流れを示すフローチャートである。図1および図2を参照して、画像認識装置10を用いて、対象物の認識を行う場合について説明する。なお、図2では、処理の大まかな流れのみを示し、詳細については、後述する。この実施形態においては、対象物として、矢印を採用し、矢印の認識を行う場合について説明する。
【0020】
まず、画像入力受付部11は、カメラ部9にて撮像された対象画像データの一部の入力を受け付ける(図2において、ステップS11、以下ステップを省略する)。そして、画像入力受付部11は、入力された対象画像データの一部を前処理部12に送信する。
【0021】
前処理部12は、画像入力受付部11にて入力を受け付けた対象画像データの一部において、輝度の補正等を行う(S12)。そして、補正等を終了すると、補正した対象画像データをスキャン処理部13に送信する。
【0022】
スキャン処理部13は、対象画像データの一部を用いて、一定の大きさの判定画像データを抽出する(S13)。そして、抽出した判定画像データを特徴量算出部14に送信する。
【0023】
特徴量算出部14は、データ格納部16に格納された学習データに基づき、判定画像データにおいて、HaarLike特徴量の算出を行う(S14)。
【0024】
判定部15は、学習データに基づき、特徴量算出部14にて算出した特徴量の結果から、判定画像データに、認識対象物の少なくとも一部を特定するデータ、ここでは、矢印の少なくとも一部を特定するデータが存在するか否かを判定する(S15)。
【0025】
そして、画像認識装置10は、上記したS11〜S15までの処理を、カメラ部9にて撮像された対象画像データの全てにおいて行うことによって、最終的な判定結果を出力する。すなわち、矢印が、カメラ部9にて撮像された1画面分の対象画像データ全体の中に存在するか否かを判定する。そして、その判定結果を外部へ出力する(S16)。
【0026】
図3は、画像入力受付部11の処理の詳細を示すフローチャートである。図1〜図3を参照して、画像入力受付部11の処理の詳細について説明する。
【0027】
画像入力受付部11は、カメラ部9にて撮像された対象画像データの一部の入力を受け付ける(S21)。図4は、対象画像データの一部20の一例を示す図である。なお、図4において、点線で、対象画像データの他の一部21〜23を示している。図4を参照して、対象画像データの一部20は、中央部に矢印の一部が配置されている。矢印は、右側を指している。対象画像データは、図4中の左上から右下に向かう方向に走査されることから、画像入力受付部11は、その走査順に、順次、対象画像データの一部20〜23の入力を受け付けている。具体的には、対象画像データの一部20を先頭に、21、22、23の順に受け付けている。対象画像データは、走査順に並んだ4つの対象画像データの一部20〜23を組み合わせたものである。対象画像データの始点は、対象画像データの一部20の左上に位置し、終点は、対象画像データの一部23の右下に位置する。ここで、画像入力受付部11は、画像入力受付手段として作動する。そして、順次、入力を受け付けた対象画像データの一部20を前処理部12に送信する(S22)。
【0028】
図5は、前処理部12の処理の詳細を示すフローチャートである。図1〜図5を参照して、前処理部12の処理の詳細について説明する。
【0029】
前処理部12は、画像入力受付部11にて入力を受け付けた対象画像データの一部20を、輝度信号と色信号とに分離する(S31)。そして、輝度信号のみを採用する。前処理部12は、輝度信号のみになった対象画像データの一部20において、輝度の補正を行う。また、前処理部12は、輝度信号のみになった対象画像データの一部20において、明るさの度合いを調整するガンマカーブの補正を行う(S32)。そして、補正した輝度信号のみになった対象画像データの一部20をスキャン処理部13に送信する(S33)。
【0030】
図6は、スキャン処理部13の処理の詳細を示すフローチャートである。図1〜図6を参照して、スキャン処理部13の処理の詳細について説明する。
【0031】
スキャン処理部13は、対象画像データの一部20を用いて、一定の大きさの判定画像データを抽出する。具体的には、対象画像データの一部20を、所定のサイズ、例えば、1ドット毎に格子状に分割する(S41)。図7は、対象画像データの一部20を格子状に分割した場合の一例を示す図であって、理解を容易にする観点から、格子の大きさを誇張して示している。そして、格子状に分割した対象画像データの一部20において、所定の間隔を空けて、所望の分割した画像データを抜き出す(S42)。例えば、図7において、分割画像データ20a、20b等を抜き出す。そして、抜き出した分割画像データを合成して、一定の大きさの1つの判定画像データを形成する(S43)。ここで、スキャン処理部13は、抽出手段、分割手段、抜出手段、および合成手段として作動する。
【0032】
すなわち、スキャン処理部13は、対象画像データの一部20から、後述する特徴量算出部14において特徴量を算出するために、データを切り出して大きさを一定にするための正規化を行う。これにより、切り出しおよび正規化を同時に行うことができるため、処理量の削減等を行うことができる。
【0033】
このようにして、対象画像データの一部20を用いて、一定の大きさの判定画像データを抽出する。図8は、抽出した判定画像データ25の一例を示す図である。なお、図示はしないが、判定画像データの全体においても対象画像データと同様に、走査順に並んだ4つの判定画像データ25を組み合わせたものである。また、判定画像データの全体の始点は、上記した対象画像データと同様に、左上に位置し、終点は、右下に位置する。そして、判定画像データ25を特徴量算出部14に送信する(S44)。
【0034】
図9〜図11は、特徴量算出部14および判定部15の処理の詳細を示すフローチャートであって、それぞれ第1の処理、第2の処理、判定処理を示している。図1〜図11を参照して、特徴量算出部14および判定部15の処理の詳細について説明する。
【0035】
まず、図9を参照して、特徴量算出部14は、判定画像データ25において、HaarLike特徴量の算出を行うために、第1の処理を開始する。第1の処理として、特徴量算出部14は、まず、判定処理を行う(S50)。
【0036】
そうすると、図11を参照して、特徴量算出部14は、特徴量の算出において利用する学習データを参照する(S60)。図12は、学習データの一例を示す図である。学習データは、どのような画像が矢印であるかを、アダブースト(Adaboost)演算処理にて、予め学習したデータのことであって、複数枚の矢印および矢印以外の画像を用意し、これらを用いて、統計的に学習処理させたデータである。学習データは、予め定められたデータであって、矢印の少なくとも一部を特定するデータを有している。
【0037】
また、学習データは、カメラ部9にて撮像された対象画像データの一部20〜23の個数分データを保持する。この実施形態においては、4つ分のデータを保持し、第1の値は、対象画像データの一部20に対応し、第2の値は、対象画像データの一部21に対応し、第3の値は、対象画像データの一部22に対応し、第4の値は、対象画像データの一部23に対応する。また、学習データは、矢印を認識するために最適な値が設定されたパラメータを保持する。パラメータは、特徴量の算出を行う領域の開始位置、領域のサイズ、特徴の種類、閾値、および重みから構成されている。
【0038】
領域の開始位置は、判定画像データ25のうち、特徴量の算出を行う領域の始点を示すものである。4つ分のデータにおいて、開始位置は、走査順に並んでいる。領域のサイズは、判定画像データ25のうち、上記した開始位置から、特徴量の算出を行う領域の範囲を示すものである。このサイズは、判定画像データ25に沿うサイズである。特徴の種類は、HaarLike特徴の種類を示し、ここでは、図13に示すパターンAおよびパターンBを採用する。パターンAは、横方向に隣り合うように白部分26aおよび黒部分27aが配置されており、白部分26aが左側に、黒部分27aが右側に配置されている。パターンBは、横方向に垂直な方向、すなわち、縦方向に隣り合うように白部分26bおよび黒部分27bが配置されており、白部分26bが下側に、黒部分27bが上側に配置されている。そして、判定画像データ25にパターンを当てはめることによって、特徴量の算出を行う。なお、図13においては、ハッチングによって、黒部分27a,27bを示している。閾値は、算出した特徴量の値が、いくつ以上であれば、矢印が存在するか否かを比較するための値である。重みは、上記した閾値によって比較した結果に対する重要度を示すものであって、矢印の少なくとも一部を特定するものであれば、強く重み付けを行い、矢印の少なくとも一部を特定しないものであれば、弱く重み付けを行う。
【0039】
図14は、パラメータの値として、図12に示す第1の値を用いることによって、HaarLike特徴量を算出する際の判定画像データ25の状態を示す図である。なお、図14において、点線で、対象画像データの他の一部21〜23から形成された、他の判定画像データ30〜32を示している。
【0040】
図14を参照して、領域の開始位置をP1(x0,y0)と、領域のサイズをw0(幅),h0(高さ)と、終了位置をP2(x0+w0,y0+h0)と、特徴の種類を「パターンB」としている。そして、判定画像データ25におけるパターンBの白部分26bの画素値を積算して求めた値から、判定画像データ25におけるパターンBの黒部分27bの画素値を積算して求めた値を減算(白部分26bの画素値を積算して求めた値−黒部分27bの画素値を積算して求めた値)することにより、HaarLike特徴量を算出する(S61)。そして、特徴量算出部14は、算出した特徴量を判定部15に送信する(S62)。ここで、特徴量算出部14は、算出手段として作動する。
【0041】
そうすると、判定部15は、送信された特徴量が所定の閾値、具体的には、学習データが示す閾値よりも大きいか否かを比較する(S63)。ここで、判定部15は、閾値比較手段として作動する。そして、S63において比較した結果に対し、学習データが示す重みを付加する(S64)。ここで、判定部15は、付加手段として作動する。さらに、S64において重みを付加した結果の各々を加算する(S65)。
【0042】
また、上記したように、画像入力受付部11は、走査順に並んだ対象画像データの一部20〜23の入力を順次受け付けている。したがって、S61における特徴量の算出は、対象画像データの一部20の入力に同期して作動する。すなわち、終了位置P2まで、対象画像データの入力が終了したタイミングで、対象画像データの一部20における特徴量の算出を行う。また、特徴量算出部14は、順次、算出した特徴量を判定部15に送信することから、S62からS65における比較等も、対象画像データの一部20の入力に同期して作動する。
【0043】
したがって、特徴量算出部14は、S61において、第1の値における特徴量の算出を終了すると、走査順に、第2の値における特徴量の算出に進む。すなわち、判定画像データ30における特徴量の算出に進む(S66において、NO)。このようにして、順次、学習データを参照して(S60)、学習データに設定されているパラメータの個数分、判定画像データ25、30〜32の特徴量を算出する(S61)。そして、判定部15においても同様に、順次、閾値との比較等を行い、重みを付加した結果の各々を加算する(S62からS65)。
【0044】
そして、パラメータの個数分終了すると(S66において、YES)、判定部15は、順次、S65において重みを付加した結果の各々を加算することにより得た値を用いて、矢印が、カメラ部9にて撮像された1画面分の対象画像データ全体の中に存在するか否かを判定する(S67)。したがって、最後の対象画像データの一部23の入力を受け付けて、重みを付加した結果を加算したタイミングで、矢印が、撮像された1画面分の対象画像データ全体の中に存在するか否かを判定する。ここで、判定部15は、画像判定手段として作動する。
【0045】
なお、(1)式は、S63からS67における判定部15の最終的な判定結果を求める式を示している。tは、学習データのパラメータの個数を示し、f(x)は、S67における最終的な認識判定結果を示し、αiは、S64における重みを示し、hi(x)は、S63における各々の比較結果を示している。
【0046】
【数1】
【0047】
また、判定部15は、S67において、矢印が存在すると判定すると(S67において、YES)、矢印が存在するという判定結果を外部へ出力する(S68)。
【0048】
また、矢印が存在しないと判定すると(S67において、NO)、判定画像データを抽出する位置を変更する(S69)。
【0049】
そうすると、図9を参照して、判定画像データを抽出する位置が終点に到達するまで(S51において、NO)、再度、特徴量の算出等、判定処理を繰り返し行う(S50)。その後、判定画像データを抽出する位置が終点に到達した場合には(S51において、YES)、判定画像データを抽出するサイズを小さく変更する(S52)。
【0050】
そうすると、図10を参照して、第2の処理を開始する。第2の処理として、判定部15は、判定画像データを抽出するサイズが、規定されたサイズより小さくなるまで(S71において、NO)再度、特徴量の算出等、第1の処理を繰り返し行う(S70)。その後、判定画像データを抽出するサイズが、規定されたサイズより小さくなった場合には(S71において、YES)、矢印が存在しないという判定結果を外部へ出力する(S72)。
【0051】
このように、画像認識装置10は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【0052】
また、このような画像認識方法は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【0053】
なお、上記の実施の形態においては、対象画像データの一部から判定画像データを抽出することにより、判定画像データを用いて、特徴量を算出する例について説明したが、これに限ることなく、対象画像データの一部をそのまま用いて、特徴量を算出してもよい。
【0054】
また、上記の実施の形態においては、対象物として、1つの矢印の認識を行う例について説明したが、これに限ることなく、複数種類の対象物の認識を行う場合にも適用することができる。例えば、右側を指す矢印と、左側を指す矢印とを認識する場合にも適用することができる。この場合、画像認識装置10は、対象物の数だけ判定部15を備える構成とする。すなわち、右側を指す矢印が存在するか否かを判定する判定部と、左側を指す矢印が存在するか否かを判定する判定部とを備える構成とする。
【0055】
また、上記の実施の形態においては、前処理部12において、画像入力受付部11にて入力を受け付けた対象画像データの一部20を、輝度信号と色信号とに分離し、輝度信号のみを採用する例について説明したが、これに限ることなく、色信号を採用してもよい。この場合、色によって対象物が存在するか否かを判定する。具体的には、画像データの所定の領域の平均の色を算出して、これを特徴量とする。例えば、所定の領域にて、赤色が多く使用されている場合には、所定の領域の平均の色は、赤色であると算出して、これを特徴量とする。そして、色によって対象物を特定するデータを有する学習データを用いて、算出した特徴量から、対象物が、画像データの中に存在するか否かを判定する。これにより、輝度信号では、判定が困難である対象物においても、容易に判定することができる。また、輝度信号および色信号を併用して採用してもよい。
【0056】
また、画像データの所定の領域の特徴点を算出して、これを特徴量とし、算出した特徴量から、対象物が、画像データの中に存在するか否かを判定してもよい。特徴点とは、画像中の形状境界となる点であって、例えば、所定の領域の特徴点の密度を算出して、これを特徴量とする。そして、特徴点の密度によって対象物を特定するデータを有する学習データを用いて、算出した特徴量から、対象物が、画像データの中に存在するか否かを判定してもよい。これにより、対象物の形状が複雑な場合であっても、容易に判定することができる。
【0057】
また、採用した輝度信号を周波数領域に変換することにより、周波数領域に変換した信号を用いて、対象物が、画像データの中に存在するか否かを判定してもよい。この場合、変換する際には、フーリエ変換やウェーブレット(Wavelet)変換を採用してもよい。これにより、例えば、対象物が、縦方向および横方向に、規則的に連続する模様であっても、容易に判定することができる。
【0058】
また、上記の実施の形態においては、特徴の種類として、図13に示すパターンを採用する例について説明したが、これに限ることなく、他のパターンを採用してもよい。
【0059】
また、上記の実施の形態においては、図4に示すように、画像データを4等分したものを画像データの一部とし、これを用いて、特徴量の算出を行う例について説明したが、これに限ることなく、例えば、図15の点線に示すように、矢印の指し示す方向である先端部や、後端部等を画像データの一部35a〜35eとし、これを用いて、特徴量の算出を行ってもよい。すなわち、対象物の特徴となる部分を示すデータであってもよい。また、特徴量の算出を行う領域のサイズや形状、位置等は、認識対象物や、対象物の特徴となる部分の大きさ等に応じて、様々なサイズや形状、位置等を用いることができる。
【0060】
また、上記の実施の形態においては、図11に示すS63において、判定部15は、送信された特徴量が、学習データが示す閾値よりも大きいか否かを比較する例について説明したが、これに限ることなく、閾値よりも小さいか否かを比較してもよいし、閾値と一致するか否かを比較してもよいし、他の方法で比較してもよい。
【0061】
また、上記の実施の形態においては、対象物として、矢印を採用する例について説明したが、これに限ることなく、他の物体が、画像データの中に存在するか否かを判定する際にも適用することができる。
【0062】
また、上記の実施の形態においては、画像判定手段は、画像認識手段に同期して作動する例について説明したが、これに限ることなく、画像判定手段と画像認識手段とを同期させるよう制御する制御手段を備える構成としてもよい。
【0063】
なお、この発明に係る画像認識装置10は、例えば、ロボット等に適用することができる。この場合、上記した矢印のような標識を外部に設置しておくのみで、ロボットに標識を認識させて、自律して動作させることができる。したがって、例えば、標識に無線等の発信装置を設け、ロボットに発信装置から発信された無線を受信する受信装置を設けることにより、ロボットを動作させる方法も考えられるが、この場合、無線等を使用することなく、自律して動作可能なロボットを安価に製造することができる。
【0064】
以上、図面を参照してこの発明の実施形態を説明したが、この発明は、図示した実施形態のものに限定されない。図示した実施形態に対して、この発明と同一の範囲内において、あるいは均等の範囲内において、種々の修正や変形を加えることが可能である。
【図面の簡単な説明】
【0065】
【図1】この発明の一実施形態に係る画像認識装置の構成を示すブロック図である。
【図2】図1に示す画像認識装置を用いて、対象物の認識を行う場合の処理の流れを示すフローチャートである。
【図3】画像入力受付部の処理の詳細を示すフローチャートである。
【図4】対象画像データの一部の一例を示す図である。
【図5】前処理部の処理の詳細を示すフローチャートである。
【図6】スキャン処理部の処理の詳細を示すフローチャートである。
【図7】対象画像データの一部を格子状に分割した場合の一例を示す図である。
【図8】抽出した判定画像データの一例を示す図である。
【図9】第1の処理を示すフローチャートである。
【図10】第2の処理を示すフローチャートである。
【図11】判定処理を示すフローチャートである。
【図12】学習データの一例を示す図である。
【図13】パターンAおよびパターンBを示す図である。
【図14】パラメータの値として、図12に示す第1の値を用いることによって、HaarLike特徴量を算出する際の判定画像データの状態を示す図である。
【図15】画像データの一部の他の例を示す図である。
【図16】従来の画像認識装置が、撮像された画像データの中に矢印が存在するか否かを判定する場合における画像データの構成を示す図である。
【図17】この発明に係る画像認識装置が、撮像された画像データの中に矢印が存在するか否かを判定する場合における画像データの構成を示す図である。
【符号の説明】
【0066】
9 カメラ部、10 画像認識装置、11 画像入力受付部、12 前処理部、13 スキャン処理部、14 特徴量算出部、15 判定部、16 データ格納部、20,21,22,23,35a,35b,35c,35d,35e 対象画像データ、20a,20b 分割画像データ、25,30,31,32 判定画像データ、26a,26b 白部分、27a,27b 黒部分。
【技術分野】
【0001】
この発明は、画像認識装置および画像認識方法に関し、特に、カメラ等の撮像装置によって撮像された画像データの中から、特定の対象物を認識することができる画像認識装置および画像認識方法に関するものである。
【背景技術】
【0002】
カメラ等の撮像装置によって撮像された画像データの中から、特定の対象物を認識する技術は、例えば、特開2008−77626号公報(特許文献1)に開示されている。
【0003】
特許文献1によると、装置は、カメラによって撮像された画像データをフレームメモリに蓄積する。そして、フレームメモリに蓄積した画像データを加工等することによって、撮像された画像データの中から、特定の対象物を認識することとしている。
【特許文献1】特開2008−77626号公報(段落番号0023〜0027等)
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1に開示の技術では、対象物を認識するために、一旦撮像された画像データをフレームメモリに蓄積している。この場合、装置の規模が大きくなってしまう虞がある。
【0005】
この発明の目的は、装置の小規模化を図ることができる画像認識装置を提供することである。
【0006】
この発明の他の目的は、装置の小規模化を図ることができる画像認識方法を提供することである。
【課題を解決するための手段】
【0007】
この発明に係る画像認識装置は、被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識装置であって、撮像手段によって撮像された画像データの一部の入力を受け付ける画像入力受付手段と、画像入力受付手段に同期して作動し、予め定められた学習データに基づいて、画像入力受付手段により入力を受け付けた画像データの一部を用いて、認識対象物が存在するか否かを判定する画像判定手段とを備える。
【0008】
好ましくは、画像入力受付手段は、所定の走査順で、撮像手段によって撮像された画像データの一部の入力を受け付け、学習データは、認識対象物の少なくとも一部を特定するデータを有し、画像判定手段は、特定するデータを所定の走査順に並べることによって、画像入力受付手段に同期して作動する。
【0009】
さらに好ましくは、画像判定手段は、画像入力受付手段により入力を受け付けた画像データの一部において、特徴量を算出する算出手段と、算出手段によって算出された特徴量が、所定の閾値よりも大きいか否かを比較する閾値比較手段と、閾値比較手段によって比較された結果に対して、重みを付加する付加手段とを含む。
【0010】
さらに好ましくは、画像入力受付手段により入力を受け付けた画像データから、一定の大きさの画像データを抽出する抽出手段をさらに備える。
【0011】
さらに好ましくは、抽出手段は、画像入力受付手段により入力を受け付けた画像データを、所定のサイズの分割画像データに複数分割する分割手段と、分割手段により分割した複数の分割画像データの中から、所望の分割画像データを抜き出す抜出手段と、抜出手段により抜き出した分割画像データを合成して1つの画像データを形成する合成手段とを含む。
【0012】
この発明の他の局面においては、画像認識方法は、被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識方法である。そして、撮像手段によって撮像された画像データの一部の入力を受け付けるステップと、受け付けステップに同期して作動し、予め定められた学習データに基づいて、入力を受け付けた画像データの一部を用いて、認識対象物が存在するか否かを判定するステップとを備える。
【発明の効果】
【0013】
この発明に係る画像認識装置は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【0014】
また、この発明に係る画像認識方法は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【発明を実施するための最良の形態】
【0015】
まず、この発明の原理について説明する。
【0016】
従来の画像認識装置は、撮像装置によって撮像された1画面分の画像データを保存するフレームメモリを備える。画像認識装置は、撮像装置によって撮像された1画面分の画像データ全てをフレームメモリに保存する。そして、フレームメモリに保存した1画面分の画像データを用いて、認識対象物が、撮像された画像データの中に存在するか否かを判定する。図16は、従来の画像認識装置を用いて、撮像された画像データの中に、認識対象物としての矢印が存在するか否かを判定する場合における画像データ100の構成を示す図である。図16を参照して、画像認識装置は、撮像装置によって撮像された1画面分の画像データ100全てをフレームメモリに保存している。
【0017】
一方、図17は、この発明に係る画像認識装置を用いて、撮像された画像データの中に、認識対象物としての矢印が存在するか否かを判定する場合における画像データ101の構成を示す図である。図17を参照して、画像認識装置は、撮像装置によって撮像された1画面分の画像データ101の一部101aを用いて、認識対象物が、撮像された画像データ101の中に存在するか否かを判定する。具体的には、撮像装置によって撮像された画像データ101の一部101aが入力されると、その一部101aの中に、認識対象物を特定するデータが存在するか否かを判定する。すなわち、撮像された画像データ101の一部101aの入力に同期して、その一部101aの中に、認識対象物を特定するデータが存在するか否かを判定する。そして、撮像装置によって撮像された画像データ101を構成する他の一部101b〜101dにおいても同様に判定を行い、最後の一部101dが入力され、判定が終了するタイミングで、認識対象物が、撮像された1画面分の画像データ101全体の中に存在するか否かを判定する。
【0018】
以下、この発明に係る画像認識装置の実施の形態を図面を参照して詳細に説明する。図1は、この発明の一実施形態に係る画像認識装置10の構成を示すブロック図である。図1を参照して、画像認識装置10は、被写体を撮像可能な撮像手段としてのカメラ部9によって撮像された画像データの入力を受け付ける画像入力受付部11と、画像入力受付部11にて入力を受け付けた画像データの前処理を行う前処理部12と、前処理部12にて処理された画像データの切り出しおよび正規化を行うスキャン処理部13と、スキャン処理部13にて処理された画像データにおいて、HaarLike特徴量の算出を行う特徴量算出部14と、特徴量算出部14にて算出された結果に基づいて、入力を受け付けた画像データに、認識対象物が存在するか否かを判定する判定部15と、判定部15にて判定する際に用いる学習データを格納するデータ格納部16とを備える。
【0019】
図2は、図1に示す画像認識装置10を用いて、対象物の認識を行う場合の処理の流れを示すフローチャートである。図1および図2を参照して、画像認識装置10を用いて、対象物の認識を行う場合について説明する。なお、図2では、処理の大まかな流れのみを示し、詳細については、後述する。この実施形態においては、対象物として、矢印を採用し、矢印の認識を行う場合について説明する。
【0020】
まず、画像入力受付部11は、カメラ部9にて撮像された対象画像データの一部の入力を受け付ける(図2において、ステップS11、以下ステップを省略する)。そして、画像入力受付部11は、入力された対象画像データの一部を前処理部12に送信する。
【0021】
前処理部12は、画像入力受付部11にて入力を受け付けた対象画像データの一部において、輝度の補正等を行う(S12)。そして、補正等を終了すると、補正した対象画像データをスキャン処理部13に送信する。
【0022】
スキャン処理部13は、対象画像データの一部を用いて、一定の大きさの判定画像データを抽出する(S13)。そして、抽出した判定画像データを特徴量算出部14に送信する。
【0023】
特徴量算出部14は、データ格納部16に格納された学習データに基づき、判定画像データにおいて、HaarLike特徴量の算出を行う(S14)。
【0024】
判定部15は、学習データに基づき、特徴量算出部14にて算出した特徴量の結果から、判定画像データに、認識対象物の少なくとも一部を特定するデータ、ここでは、矢印の少なくとも一部を特定するデータが存在するか否かを判定する(S15)。
【0025】
そして、画像認識装置10は、上記したS11〜S15までの処理を、カメラ部9にて撮像された対象画像データの全てにおいて行うことによって、最終的な判定結果を出力する。すなわち、矢印が、カメラ部9にて撮像された1画面分の対象画像データ全体の中に存在するか否かを判定する。そして、その判定結果を外部へ出力する(S16)。
【0026】
図3は、画像入力受付部11の処理の詳細を示すフローチャートである。図1〜図3を参照して、画像入力受付部11の処理の詳細について説明する。
【0027】
画像入力受付部11は、カメラ部9にて撮像された対象画像データの一部の入力を受け付ける(S21)。図4は、対象画像データの一部20の一例を示す図である。なお、図4において、点線で、対象画像データの他の一部21〜23を示している。図4を参照して、対象画像データの一部20は、中央部に矢印の一部が配置されている。矢印は、右側を指している。対象画像データは、図4中の左上から右下に向かう方向に走査されることから、画像入力受付部11は、その走査順に、順次、対象画像データの一部20〜23の入力を受け付けている。具体的には、対象画像データの一部20を先頭に、21、22、23の順に受け付けている。対象画像データは、走査順に並んだ4つの対象画像データの一部20〜23を組み合わせたものである。対象画像データの始点は、対象画像データの一部20の左上に位置し、終点は、対象画像データの一部23の右下に位置する。ここで、画像入力受付部11は、画像入力受付手段として作動する。そして、順次、入力を受け付けた対象画像データの一部20を前処理部12に送信する(S22)。
【0028】
図5は、前処理部12の処理の詳細を示すフローチャートである。図1〜図5を参照して、前処理部12の処理の詳細について説明する。
【0029】
前処理部12は、画像入力受付部11にて入力を受け付けた対象画像データの一部20を、輝度信号と色信号とに分離する(S31)。そして、輝度信号のみを採用する。前処理部12は、輝度信号のみになった対象画像データの一部20において、輝度の補正を行う。また、前処理部12は、輝度信号のみになった対象画像データの一部20において、明るさの度合いを調整するガンマカーブの補正を行う(S32)。そして、補正した輝度信号のみになった対象画像データの一部20をスキャン処理部13に送信する(S33)。
【0030】
図6は、スキャン処理部13の処理の詳細を示すフローチャートである。図1〜図6を参照して、スキャン処理部13の処理の詳細について説明する。
【0031】
スキャン処理部13は、対象画像データの一部20を用いて、一定の大きさの判定画像データを抽出する。具体的には、対象画像データの一部20を、所定のサイズ、例えば、1ドット毎に格子状に分割する(S41)。図7は、対象画像データの一部20を格子状に分割した場合の一例を示す図であって、理解を容易にする観点から、格子の大きさを誇張して示している。そして、格子状に分割した対象画像データの一部20において、所定の間隔を空けて、所望の分割した画像データを抜き出す(S42)。例えば、図7において、分割画像データ20a、20b等を抜き出す。そして、抜き出した分割画像データを合成して、一定の大きさの1つの判定画像データを形成する(S43)。ここで、スキャン処理部13は、抽出手段、分割手段、抜出手段、および合成手段として作動する。
【0032】
すなわち、スキャン処理部13は、対象画像データの一部20から、後述する特徴量算出部14において特徴量を算出するために、データを切り出して大きさを一定にするための正規化を行う。これにより、切り出しおよび正規化を同時に行うことができるため、処理量の削減等を行うことができる。
【0033】
このようにして、対象画像データの一部20を用いて、一定の大きさの判定画像データを抽出する。図8は、抽出した判定画像データ25の一例を示す図である。なお、図示はしないが、判定画像データの全体においても対象画像データと同様に、走査順に並んだ4つの判定画像データ25を組み合わせたものである。また、判定画像データの全体の始点は、上記した対象画像データと同様に、左上に位置し、終点は、右下に位置する。そして、判定画像データ25を特徴量算出部14に送信する(S44)。
【0034】
図9〜図11は、特徴量算出部14および判定部15の処理の詳細を示すフローチャートであって、それぞれ第1の処理、第2の処理、判定処理を示している。図1〜図11を参照して、特徴量算出部14および判定部15の処理の詳細について説明する。
【0035】
まず、図9を参照して、特徴量算出部14は、判定画像データ25において、HaarLike特徴量の算出を行うために、第1の処理を開始する。第1の処理として、特徴量算出部14は、まず、判定処理を行う(S50)。
【0036】
そうすると、図11を参照して、特徴量算出部14は、特徴量の算出において利用する学習データを参照する(S60)。図12は、学習データの一例を示す図である。学習データは、どのような画像が矢印であるかを、アダブースト(Adaboost)演算処理にて、予め学習したデータのことであって、複数枚の矢印および矢印以外の画像を用意し、これらを用いて、統計的に学習処理させたデータである。学習データは、予め定められたデータであって、矢印の少なくとも一部を特定するデータを有している。
【0037】
また、学習データは、カメラ部9にて撮像された対象画像データの一部20〜23の個数分データを保持する。この実施形態においては、4つ分のデータを保持し、第1の値は、対象画像データの一部20に対応し、第2の値は、対象画像データの一部21に対応し、第3の値は、対象画像データの一部22に対応し、第4の値は、対象画像データの一部23に対応する。また、学習データは、矢印を認識するために最適な値が設定されたパラメータを保持する。パラメータは、特徴量の算出を行う領域の開始位置、領域のサイズ、特徴の種類、閾値、および重みから構成されている。
【0038】
領域の開始位置は、判定画像データ25のうち、特徴量の算出を行う領域の始点を示すものである。4つ分のデータにおいて、開始位置は、走査順に並んでいる。領域のサイズは、判定画像データ25のうち、上記した開始位置から、特徴量の算出を行う領域の範囲を示すものである。このサイズは、判定画像データ25に沿うサイズである。特徴の種類は、HaarLike特徴の種類を示し、ここでは、図13に示すパターンAおよびパターンBを採用する。パターンAは、横方向に隣り合うように白部分26aおよび黒部分27aが配置されており、白部分26aが左側に、黒部分27aが右側に配置されている。パターンBは、横方向に垂直な方向、すなわち、縦方向に隣り合うように白部分26bおよび黒部分27bが配置されており、白部分26bが下側に、黒部分27bが上側に配置されている。そして、判定画像データ25にパターンを当てはめることによって、特徴量の算出を行う。なお、図13においては、ハッチングによって、黒部分27a,27bを示している。閾値は、算出した特徴量の値が、いくつ以上であれば、矢印が存在するか否かを比較するための値である。重みは、上記した閾値によって比較した結果に対する重要度を示すものであって、矢印の少なくとも一部を特定するものであれば、強く重み付けを行い、矢印の少なくとも一部を特定しないものであれば、弱く重み付けを行う。
【0039】
図14は、パラメータの値として、図12に示す第1の値を用いることによって、HaarLike特徴量を算出する際の判定画像データ25の状態を示す図である。なお、図14において、点線で、対象画像データの他の一部21〜23から形成された、他の判定画像データ30〜32を示している。
【0040】
図14を参照して、領域の開始位置をP1(x0,y0)と、領域のサイズをw0(幅),h0(高さ)と、終了位置をP2(x0+w0,y0+h0)と、特徴の種類を「パターンB」としている。そして、判定画像データ25におけるパターンBの白部分26bの画素値を積算して求めた値から、判定画像データ25におけるパターンBの黒部分27bの画素値を積算して求めた値を減算(白部分26bの画素値を積算して求めた値−黒部分27bの画素値を積算して求めた値)することにより、HaarLike特徴量を算出する(S61)。そして、特徴量算出部14は、算出した特徴量を判定部15に送信する(S62)。ここで、特徴量算出部14は、算出手段として作動する。
【0041】
そうすると、判定部15は、送信された特徴量が所定の閾値、具体的には、学習データが示す閾値よりも大きいか否かを比較する(S63)。ここで、判定部15は、閾値比較手段として作動する。そして、S63において比較した結果に対し、学習データが示す重みを付加する(S64)。ここで、判定部15は、付加手段として作動する。さらに、S64において重みを付加した結果の各々を加算する(S65)。
【0042】
また、上記したように、画像入力受付部11は、走査順に並んだ対象画像データの一部20〜23の入力を順次受け付けている。したがって、S61における特徴量の算出は、対象画像データの一部20の入力に同期して作動する。すなわち、終了位置P2まで、対象画像データの入力が終了したタイミングで、対象画像データの一部20における特徴量の算出を行う。また、特徴量算出部14は、順次、算出した特徴量を判定部15に送信することから、S62からS65における比較等も、対象画像データの一部20の入力に同期して作動する。
【0043】
したがって、特徴量算出部14は、S61において、第1の値における特徴量の算出を終了すると、走査順に、第2の値における特徴量の算出に進む。すなわち、判定画像データ30における特徴量の算出に進む(S66において、NO)。このようにして、順次、学習データを参照して(S60)、学習データに設定されているパラメータの個数分、判定画像データ25、30〜32の特徴量を算出する(S61)。そして、判定部15においても同様に、順次、閾値との比較等を行い、重みを付加した結果の各々を加算する(S62からS65)。
【0044】
そして、パラメータの個数分終了すると(S66において、YES)、判定部15は、順次、S65において重みを付加した結果の各々を加算することにより得た値を用いて、矢印が、カメラ部9にて撮像された1画面分の対象画像データ全体の中に存在するか否かを判定する(S67)。したがって、最後の対象画像データの一部23の入力を受け付けて、重みを付加した結果を加算したタイミングで、矢印が、撮像された1画面分の対象画像データ全体の中に存在するか否かを判定する。ここで、判定部15は、画像判定手段として作動する。
【0045】
なお、(1)式は、S63からS67における判定部15の最終的な判定結果を求める式を示している。tは、学習データのパラメータの個数を示し、f(x)は、S67における最終的な認識判定結果を示し、αiは、S64における重みを示し、hi(x)は、S63における各々の比較結果を示している。
【0046】
【数1】
【0047】
また、判定部15は、S67において、矢印が存在すると判定すると(S67において、YES)、矢印が存在するという判定結果を外部へ出力する(S68)。
【0048】
また、矢印が存在しないと判定すると(S67において、NO)、判定画像データを抽出する位置を変更する(S69)。
【0049】
そうすると、図9を参照して、判定画像データを抽出する位置が終点に到達するまで(S51において、NO)、再度、特徴量の算出等、判定処理を繰り返し行う(S50)。その後、判定画像データを抽出する位置が終点に到達した場合には(S51において、YES)、判定画像データを抽出するサイズを小さく変更する(S52)。
【0050】
そうすると、図10を参照して、第2の処理を開始する。第2の処理として、判定部15は、判定画像データを抽出するサイズが、規定されたサイズより小さくなるまで(S71において、NO)再度、特徴量の算出等、第1の処理を繰り返し行う(S70)。その後、判定画像データを抽出するサイズが、規定されたサイズより小さくなった場合には(S71において、YES)、矢印が存在しないという判定結果を外部へ出力する(S72)。
【0051】
このように、画像認識装置10は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【0052】
また、このような画像認識方法は、画像データの一部の入力を受け付けながら、認識対象物の判定を行うことができるため、撮像手段によって撮像された画像データを保存するためのメモリを不要とすることができる。すなわち、フレームメモリを不要とすることができる。その結果、装置の小規模化を図ることができる。
【0053】
なお、上記の実施の形態においては、対象画像データの一部から判定画像データを抽出することにより、判定画像データを用いて、特徴量を算出する例について説明したが、これに限ることなく、対象画像データの一部をそのまま用いて、特徴量を算出してもよい。
【0054】
また、上記の実施の形態においては、対象物として、1つの矢印の認識を行う例について説明したが、これに限ることなく、複数種類の対象物の認識を行う場合にも適用することができる。例えば、右側を指す矢印と、左側を指す矢印とを認識する場合にも適用することができる。この場合、画像認識装置10は、対象物の数だけ判定部15を備える構成とする。すなわち、右側を指す矢印が存在するか否かを判定する判定部と、左側を指す矢印が存在するか否かを判定する判定部とを備える構成とする。
【0055】
また、上記の実施の形態においては、前処理部12において、画像入力受付部11にて入力を受け付けた対象画像データの一部20を、輝度信号と色信号とに分離し、輝度信号のみを採用する例について説明したが、これに限ることなく、色信号を採用してもよい。この場合、色によって対象物が存在するか否かを判定する。具体的には、画像データの所定の領域の平均の色を算出して、これを特徴量とする。例えば、所定の領域にて、赤色が多く使用されている場合には、所定の領域の平均の色は、赤色であると算出して、これを特徴量とする。そして、色によって対象物を特定するデータを有する学習データを用いて、算出した特徴量から、対象物が、画像データの中に存在するか否かを判定する。これにより、輝度信号では、判定が困難である対象物においても、容易に判定することができる。また、輝度信号および色信号を併用して採用してもよい。
【0056】
また、画像データの所定の領域の特徴点を算出して、これを特徴量とし、算出した特徴量から、対象物が、画像データの中に存在するか否かを判定してもよい。特徴点とは、画像中の形状境界となる点であって、例えば、所定の領域の特徴点の密度を算出して、これを特徴量とする。そして、特徴点の密度によって対象物を特定するデータを有する学習データを用いて、算出した特徴量から、対象物が、画像データの中に存在するか否かを判定してもよい。これにより、対象物の形状が複雑な場合であっても、容易に判定することができる。
【0057】
また、採用した輝度信号を周波数領域に変換することにより、周波数領域に変換した信号を用いて、対象物が、画像データの中に存在するか否かを判定してもよい。この場合、変換する際には、フーリエ変換やウェーブレット(Wavelet)変換を採用してもよい。これにより、例えば、対象物が、縦方向および横方向に、規則的に連続する模様であっても、容易に判定することができる。
【0058】
また、上記の実施の形態においては、特徴の種類として、図13に示すパターンを採用する例について説明したが、これに限ることなく、他のパターンを採用してもよい。
【0059】
また、上記の実施の形態においては、図4に示すように、画像データを4等分したものを画像データの一部とし、これを用いて、特徴量の算出を行う例について説明したが、これに限ることなく、例えば、図15の点線に示すように、矢印の指し示す方向である先端部や、後端部等を画像データの一部35a〜35eとし、これを用いて、特徴量の算出を行ってもよい。すなわち、対象物の特徴となる部分を示すデータであってもよい。また、特徴量の算出を行う領域のサイズや形状、位置等は、認識対象物や、対象物の特徴となる部分の大きさ等に応じて、様々なサイズや形状、位置等を用いることができる。
【0060】
また、上記の実施の形態においては、図11に示すS63において、判定部15は、送信された特徴量が、学習データが示す閾値よりも大きいか否かを比較する例について説明したが、これに限ることなく、閾値よりも小さいか否かを比較してもよいし、閾値と一致するか否かを比較してもよいし、他の方法で比較してもよい。
【0061】
また、上記の実施の形態においては、対象物として、矢印を採用する例について説明したが、これに限ることなく、他の物体が、画像データの中に存在するか否かを判定する際にも適用することができる。
【0062】
また、上記の実施の形態においては、画像判定手段は、画像認識手段に同期して作動する例について説明したが、これに限ることなく、画像判定手段と画像認識手段とを同期させるよう制御する制御手段を備える構成としてもよい。
【0063】
なお、この発明に係る画像認識装置10は、例えば、ロボット等に適用することができる。この場合、上記した矢印のような標識を外部に設置しておくのみで、ロボットに標識を認識させて、自律して動作させることができる。したがって、例えば、標識に無線等の発信装置を設け、ロボットに発信装置から発信された無線を受信する受信装置を設けることにより、ロボットを動作させる方法も考えられるが、この場合、無線等を使用することなく、自律して動作可能なロボットを安価に製造することができる。
【0064】
以上、図面を参照してこの発明の実施形態を説明したが、この発明は、図示した実施形態のものに限定されない。図示した実施形態に対して、この発明と同一の範囲内において、あるいは均等の範囲内において、種々の修正や変形を加えることが可能である。
【図面の簡単な説明】
【0065】
【図1】この発明の一実施形態に係る画像認識装置の構成を示すブロック図である。
【図2】図1に示す画像認識装置を用いて、対象物の認識を行う場合の処理の流れを示すフローチャートである。
【図3】画像入力受付部の処理の詳細を示すフローチャートである。
【図4】対象画像データの一部の一例を示す図である。
【図5】前処理部の処理の詳細を示すフローチャートである。
【図6】スキャン処理部の処理の詳細を示すフローチャートである。
【図7】対象画像データの一部を格子状に分割した場合の一例を示す図である。
【図8】抽出した判定画像データの一例を示す図である。
【図9】第1の処理を示すフローチャートである。
【図10】第2の処理を示すフローチャートである。
【図11】判定処理を示すフローチャートである。
【図12】学習データの一例を示す図である。
【図13】パターンAおよびパターンBを示す図である。
【図14】パラメータの値として、図12に示す第1の値を用いることによって、HaarLike特徴量を算出する際の判定画像データの状態を示す図である。
【図15】画像データの一部の他の例を示す図である。
【図16】従来の画像認識装置が、撮像された画像データの中に矢印が存在するか否かを判定する場合における画像データの構成を示す図である。
【図17】この発明に係る画像認識装置が、撮像された画像データの中に矢印が存在するか否かを判定する場合における画像データの構成を示す図である。
【符号の説明】
【0066】
9 カメラ部、10 画像認識装置、11 画像入力受付部、12 前処理部、13 スキャン処理部、14 特徴量算出部、15 判定部、16 データ格納部、20,21,22,23,35a,35b,35c,35d,35e 対象画像データ、20a,20b 分割画像データ、25,30,31,32 判定画像データ、26a,26b 白部分、27a,27b 黒部分。
【特許請求の範囲】
【請求項1】
被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識装置であって、
前記撮像手段によって撮像された画像データの一部の入力を受け付ける画像入力受付手段と、
前記画像入力受付手段に同期して作動し、予め定められた学習データに基づいて、前記画像入力受付手段により入力を受け付けた前記画像データの一部を用いて、認識対象物が存在するか否かを判定する画像判定手段とを備える、画像認識装置。
【請求項2】
前記画像入力受付手段は、所定の走査順で、前記撮像手段によって撮像された画像データの一部の入力を受け付け、
前記学習データは、前記認識対象物の少なくとも一部を特定するデータを有し、
前記画像判定手段は、前記特定するデータを前記所定の走査順に並べることによって、前記画像入力受付手段に同期して作動する、請求項1に記載の画像認識装置。
【請求項3】
前記画像判定手段は、前記画像入力受付手段により入力を受け付けた前記画像データの一部において、特徴量を算出する算出手段と、
前記算出手段によって算出された前記特徴量が、所定の閾値よりも大きいか否かを比較する閾値比較手段と、
前記閾値比較手段によって比較された結果に対して、重みを付加する付加手段とを含む、請求項1または2に記載の画像認識装置。
【請求項4】
前記画像入力受付手段により入力を受け付けた画像データから、一定の大きさの画像データを抽出する抽出手段をさらに備える、請求項1〜3のいずれかに記載の画像認識装置。
【請求項5】
前記抽出手段は、前記画像入力受付手段により入力を受け付けた画像データを、所定のサイズの分割画像データに複数分割する分割手段と、
前記分割手段により分割した複数の前記分割画像データの中から、所望の分割画像データを抜き出す抜出手段と、
前記抜出手段により抜き出した前記分割画像データを合成して1つの画像データを形成する合成手段とを含む、請求項4に記載の画像認識装置。
【請求項6】
被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識方法であって、
撮像手段によって撮像された画像データの一部の入力を受け付けるステップと、
受け付けステップに同期して作動し、予め定められた学習データに基づいて、入力を受け付けた画像データの一部を用いて、認識対象物が存在するか否かを判定するステップとを備える、画像認識方法。
【請求項1】
被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識装置であって、
前記撮像手段によって撮像された画像データの一部の入力を受け付ける画像入力受付手段と、
前記画像入力受付手段に同期して作動し、予め定められた学習データに基づいて、前記画像入力受付手段により入力を受け付けた前記画像データの一部を用いて、認識対象物が存在するか否かを判定する画像判定手段とを備える、画像認識装置。
【請求項2】
前記画像入力受付手段は、所定の走査順で、前記撮像手段によって撮像された画像データの一部の入力を受け付け、
前記学習データは、前記認識対象物の少なくとも一部を特定するデータを有し、
前記画像判定手段は、前記特定するデータを前記所定の走査順に並べることによって、前記画像入力受付手段に同期して作動する、請求項1に記載の画像認識装置。
【請求項3】
前記画像判定手段は、前記画像入力受付手段により入力を受け付けた前記画像データの一部において、特徴量を算出する算出手段と、
前記算出手段によって算出された前記特徴量が、所定の閾値よりも大きいか否かを比較する閾値比較手段と、
前記閾値比較手段によって比較された結果に対して、重みを付加する付加手段とを含む、請求項1または2に記載の画像認識装置。
【請求項4】
前記画像入力受付手段により入力を受け付けた画像データから、一定の大きさの画像データを抽出する抽出手段をさらに備える、請求項1〜3のいずれかに記載の画像認識装置。
【請求項5】
前記抽出手段は、前記画像入力受付手段により入力を受け付けた画像データを、所定のサイズの分割画像データに複数分割する分割手段と、
前記分割手段により分割した複数の前記分割画像データの中から、所望の分割画像データを抜き出す抜出手段と、
前記抜出手段により抜き出した前記分割画像データを合成して1つの画像データを形成する合成手段とを含む、請求項4に記載の画像認識装置。
【請求項6】
被写体を撮像可能な撮像手段から入力された画像データを用いて、特定の対象物を認識可能な画像認識方法であって、
撮像手段によって撮像された画像データの一部の入力を受け付けるステップと、
受け付けステップに同期して作動し、予め定められた学習データに基づいて、入力を受け付けた画像データの一部を用いて、認識対象物が存在するか否かを判定するステップとを備える、画像認識方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2010−128972(P2010−128972A)
【公開日】平成22年6月10日(2010.6.10)
【国際特許分類】
【出願番号】特願2008−305212(P2008−305212)
【出願日】平成20年11月28日(2008.11.28)
【出願人】(501321394)株式会社レイトロン (14)
【Fターム(参考)】
【公開日】平成22年6月10日(2010.6.10)
【国際特許分類】
【出願日】平成20年11月28日(2008.11.28)
【出願人】(501321394)株式会社レイトロン (14)
【Fターム(参考)】
[ Back to top ]