画像認識装置、および、撮像装置
【課題】より正確な被写体位置でテンプレート画像を変更することができ、精度よく被写体位置の変化に追従して追尾することができる画像認識装置を提供する。
【解決手段】画像認識装置が、光学系による像を撮像する撮像部と、撮像部によって撮像した画像の中から特定の対象の像の位置を認識する認識部と、画像内の複数の位置に対応して設定された複数の焦点検出位置に対する光学系の焦点状態を検出する焦点検出部と、焦点状態に基づいて、複数の焦点検出位置のいずれかを選択する選択部と、認識部が認識した特定の対象の像の位置と、選択部が選択した焦点検出位置との位置関係に基づいて、特定の対象の像を変更する変更部と、を備える。
【解決手段】画像認識装置が、光学系による像を撮像する撮像部と、撮像部によって撮像した画像の中から特定の対象の像の位置を認識する認識部と、画像内の複数の位置に対応して設定された複数の焦点検出位置に対する光学系の焦点状態を検出する焦点検出部と、焦点状態に基づいて、複数の焦点検出位置のいずれかを選択する選択部と、認識部が認識した特定の対象の像の位置と、選択部が選択した焦点検出位置との位置関係に基づいて、特定の対象の像を変更する変更部と、を備える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像認識装置、および、当該画像認識装置を備える撮像装置に関する。
【背景技術】
【0002】
従来から、移動する被写体を撮影する際に、指示位置にある被写体像をテンプレート画像として取得し、繰り返し取得する画像中でテンプレート画像と類似した像の位置を検索(テンプレートマッチング)することで、画面を移動する被写体を追尾する画像認識装置を備えるカメラが提案されている。
【0003】
このような画像認識装置においては、最初に目標被写体にてテンプレート画像を取得したあと、被写体が動くことや、輝度条件が変化する場合に、最新の被写体の形状が、テンプレート画像取得時に対して変化してしまうことがある。このような場合に対応するため、テンプレート画像との差分演算結果によって、テンプレート画像に新たな被写体画像の情報を加えて変更する手法が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許第3704045号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、差分演算結果によってテンプレート画像を変更する場合、誤って背景へ追尾してしまった場合でも、テンプレート画像を変更するための条件を満たす場合には、その背景情報をテンプレート画像に加えていくこととなる。このような場合、テンプレート画像は、少しずつ本来の被写体情報とは異なる情報となってしまう可能性がある。
【0006】
このように、従来の技術にあっては、正確な被写体位置でテンプレート画像を変更することができない可能性があるため、精度よく被写体位置の変化に追従して追尾することができなくなる可能性があるという問題があった。
【0007】
本発明は、このような事情に鑑みてなされたもので、その目的は、より正確な被写体位置でテンプレート画像を変更することができ、精度よく被写体位置の変化に追従して追尾することができる画像認識装置、および、撮像装置を提供することにある。
【課題を解決するための手段】
【0008】
この発明は上述した課題を解決するためになされたもので、光学系による像を撮像する撮像部と、前記撮像部によって撮像した画像の中から特定の対象の像の位置を認識する認識部と、前記画像内の複数の位置に対応して設定された複数の焦点検出位置に対する前記光学系の焦点状態を検出する焦点検出部と、前記焦点状態に基づいて、前記複数の焦点検出位置のいずれかを選択する選択部と、前記認識部が認識した前記特定の対象の像の位置と、前記選択部が選択した焦点検出位置との位置関係に基づいて、前記特定の対象の像を変更する変更部と、を備えることを特徴とする画像認識装置である。
【0009】
また、この発明は、上記画像認識装置を備えることを特徴とする撮像装置である。
【発明の効果】
【0010】
この発明によれば、より正確な被写体位置でテンプレート画像を変更することができ、精度よく被写体位置の変化に追従して追尾することが可能となる。
【図面の簡単な説明】
【0011】
【図1】この発明の一実施形態によるカメラの構成の一例を示すブロック図である。
【図2】図1の制御部の構成の一例を示すブロック図である。
【図3】図1の撮像素子の構成の一例を示すブロック図である。
【図4】図3の撮像素子において、1つの撮像素子の構成の一例を示すブロック図である。
【図5】この発明の一実施形態によるカメラの動作を示すフローチャートである。
【図6】図5のステップS2の動作を詳細に示すフローチャートである。
【図7】図5のステップS4の動作を詳細に示すフローチャートである。
【図8】焦点検出エリアの一例を示す説明図である。
【図9】追尾被写体領域の一例を示す説明図である。
【図10】追尾エリアに対して、採用した焦点検出エリアが中央付近にある場合の一例を示す説明図である。
【図11】本実施形態によるテンプレート差分演算処理の一例を説明する説明図である。
【図12】追尾演算とAF演算とが直列に実行される場合の動作の一例を示すタイミングチャートである。
【図13】追尾演算とAF演算とが非同期に実行される場合の動作の一例を示すタイミングチャートである。
【発明を実施するための形態】
【0012】
以下、図面を参照して、本発明の実施の形態について説明する。図1は、この発明の一実施形態による画像認識装置を備える撮像装置の構成を示す概略ブロック図である。ここでは、撮像装置として、一眼レフデジタルスチルカメラ(以下、カメラとする)の場合について説明する。
【0013】
図1に示すように、カメラは、カメラ本体10と、このカメラ本体10に着脱されるレンズ22とを備えている。このレンズ22は、たとえば、交換レンズである。このレンズ22は、たとえば、焦点調節用レンズを備えている。
【0014】
このカメラにおいて、被写体光はレンズ22を通って、カメラ本体10に入射する。図示しないレリーズボタンが全押しされていない状態においては、レンズ22を通った被写体光は、図1において点線で示す位置にあるクイックリターンミラー11により反射されて焦点版13に結像し、さらにペンタプリズム14で接眼レンズ15に導かれる。
【0015】
また、クイックリターンミラー11により反射されて焦点版13に結像した被写体光は、プリズム17と結像レンズ18を通って、撮像素子(撮像部)19に入射して被写体像を結像する。そして、この撮像素子19は、光学系による被写体像を撮像する。
【0016】
また、レンズ22を通った被写体光は、図1において点線で示す位置にあるクイックリターンミラー11のハーフミラー部分を透過し、ミラー23により反射されて、レンズ22を介して測距素子25に入射する。
【0017】
測距素子25は、レリーズボタンの半押しスイッチが操作され半押し信号が入力されたことに応じて、入射された被写体光に基づいて測距し、測距した結果を焦点検出信号として制御部29に出力する。この測距素子25は、たとえば、焦点検出エリアに対応する一対のCCDラインセンサを複数有している。
【0018】
制御部29は、測距素子25からの焦点検出信号と、撮像素子19からの被写体像とに基づいて、レンズ22の焦点状態を検出し、当該検出した焦点状態に基づいて、レンズ22の焦点を調節する。たとえば、制御部29は、レンズ22が備えるアクチュエータなどの駆動部を介して、レンズ22の焦点調節用レンズの位置を調整する。
【0019】
一方、レリーズボタン全押しにより撮影制御が実行される場合には、クイックリターンミラー11が図1において実線で示す位置に回動して、クイックリターンミラー11は、撮影用撮像素子21への光路上から退避される。そのため、被写体光は、シャッタ20を介してCCD(Charge Coupled Devices)などで構成される撮影用撮像素子21上に結像する。そして、この撮影用撮像素子21は、結像した被写体光を撮像する。
【0020】
次に、図2を用いて、図1に示した制御部29の構成の一例について説明する。なお、同図において図1の各部に対応する部分には同一の符号を付け、その説明を省略する。
【0021】
焦点検出部34は、測距素子25からの焦点検出信号、すなわち、焦点検出エリアに対応する一対のCCDラインセンサから出力される焦点検出信号に基づいて、デフォーカス量など、光学系の焦点調節状態を検出し、焦点調節量を算出する。このようにして、この焦点検出部34は、画像内の複数の位置に対応して設定された複数の焦点検出位置に対する光学系の焦点状態を検出する。
【0022】
この焦点検出部34は、一例としては、選択部341を備えている。選択部341は、焦点状態に基づいて、測距素子25における複数の焦点検出位置のいずれかを選択する。たとえば、選択部341は、後述する追尾制御部32の認識部321によって認識された位置と光学系の焦点状態とに基づいて、複数の焦点検出位置のいずれかを選択する。
【0023】
レンズ駆動部35は、焦点検出部34からの焦点調節量に基づき、レンズ22に入射する被写体光が撮影用撮像素子21上で結像するように、レンズ22を合焦位置へ駆動する。なお、レンズ22の焦点や絞り値などのレンズ情報は、たとえば、レンズ22がカメラ本体10に取り付けられる場合に、記憶部33のレンズ情報記憶部331に記憶される。このレンズ駆動部35は、たとえば、焦点検出部34からの焦点調節量に、記憶部33のレンズ情報記憶部331から読み出したレンズ情報に基づいて定められる係数を乗じて、レンズ22を合焦位置へ駆動する駆動量を算出する。そして、レンズ駆動部35は、この算出した駆動量に基づいて、レンズ22を合焦位置へ駆動する。
【0024】
CCD制御部30は、撮像素子19を制御して、撮像素子19に被写体像を撮像させる。ここで、レリーズボタンの半押しスイッチが操作され、レリーズボタンから半押し信号が出力されている間は、クイックリターンミラー11が図1の点線位置の状態にあり、撮像素子19には、レンズ22を介した被写体像が結像されている。そのため、レリーズボタンから半押し信号が出力されている間は、撮像素子19は、常にレンズ22を通って入射される被写体像を取得することができる。よって、例えば半押しスイッチオンにより、CCD制御部30は、撮像素子19を介して追尾被写体の捕捉を開始し、以降この半押し信号が入力されている間は、繰り返し被写体像の画像を取得する事が可能である。
【0025】
A/D変換部31は、撮像素子19からの出力信号を、アナログデジタル変換して、追尾制御部32および露出演算部36に出力する。
【0026】
追尾制御部32は、A/D変換部31からの信号、すなわち、撮像素子19によって撮像した画像の中から、特定の対象の像の位置を認識し、認識した位置を焦点検出部34に出力する。
【0027】
この追尾制御部32は、一例としては、認識部321と変更部322とを備えている。認識部321は、撮像素子19によって撮像した画像の中から特定の対象の像の位置を認識する。この特定の対象の像とは、たとえば、追尾処理が開始される場合に、ユーザによる操作部の操作に応じて被写体像の中から選択された被写体像、または、顔認識技術等により選択された被写体像である。なお、追尾制御部32は、この特定の対象の像、すなわち、追尾処理が開始される場合に選択された被写体像を、たとえば、テンプレート画像記憶部332に記憶する。
【0028】
変更部322は、認識部321が認識した特定の対象の像の位置と、選択部341が選択した焦点検出位置との位置関係に基づいて、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。たとえば、変更部322は、選択部341によって選択された焦点検出位置が、認識部321によって認識された特定の対象の像の位置に対応する場合に、特定の対象の像を変更する。一例としては、変更部322は、選択部341によって選択された焦点検出位置が、認識部321によって認識された特定の対象の像の位置の中心位置に対応する場合に、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。
【0029】
また、変更部322は、選択部341によって選択された焦点検出位置と、認識部321によって認識された特定の対象の像の位置との間隔が、認識部321によって認識された特定の対象の像のサイズに基づいて定められる距離以下である場合に、選択部341によって選択された焦点検出位置が、認識部321によって認識された特定の対象の像の位置の中心位置に対応すると判定し、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。
【0030】
また、変更部322は、特定の対象の像の情報と、認識部321によって認識された位置における像の情報とに基づいて、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。
【0031】
また、変更部322は、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する場合に、特定の対象の像の情報量よりも、認識部321によって認識された像の情報量を多くする。
【0032】
なお、上述した認識部321は、撮像素子19によって撮像した画像の中から、テンプレート画像記憶部332に記憶されている特定の対象の像と一致する位置を検出することにより、撮像素子19によって撮像した画像の中から特定の対象の像の位置を認識する。そして、認識部321は、認識した特定の対象の像の位置を、焦点検出部34に出力する。
【0033】
露出演算部36は、A/D変換部31からの出力信号に基づいて露出を決定し、この決定した露出を露出制御制御信号として撮像制御部37へ出力する。この露出演算部36は、露出を決定する場合に、A/D変換部31からの出力信号において、追尾制御部32の認識部321によって認識された位置に対応する出力信号に基づいて、露出を決めてもよい。
【0034】
撮像制御部37は、露出演算部36からの露出制御制御信号に基づいて、シャッタ20の開閉を制御するとともに、撮影用撮像素子21による撮像を制御して、レンズ22からの被写体像を撮像する。
【0035】
なお、上述した追尾制御部32と、記憶部33と、焦点検出部34とにより、画像認識装置39が構成されている。
【0036】
図3、4は、撮像素子19の構成の一例を示す図である。撮像素子19はマトリクス状に配列された複数(図3の場合は16×12)の画素を備えている。このひとつの画素は、たとえば図4に示すように、3つの要素a、b、および、cから構成されており、この各要素に対応させてR、G、および、Bの原色フィルターを設けられることにより、結像画像のRGBの各色情報を得ることが可能である。
【0037】
次に、図5から図7のフローチャート、および、図8から図11の図に基づき、本実施形態によるカメラの動作を説明する。
【0038】
<初期画像取得>
まず、図5のステップS1において、追尾制御部32および露出演算部36は、A/D変換部31を介して、撮像素子19に結像した画像を初期画像として取得する。
【0039】
たとえば、この画像取得タイミングは、ファインダ16上に表示されている焦点検出エリア45を、撮影者が不図示の焦点検出エリア操作部を操作することで追尾被写体に対応するエリアを点灯させ、その状態で不図示のカメラのレリーズボタンを半押しすることで画像の取得制御が開始される(図8参照)。
【0040】
ここでは、撮影者自身が焦点検出エリアにて追尾被写体を指定する方法を述べたが、この方法にはよらない。たとえば、顔認識技術や移動体検出技術を用いた被写体検出技術により被写体を追尾被写体として検出し、この検出した追尾被写体に対応するエリアが選択されてもよい。
【0041】
ここで得た画像情報を、画素毎に下記RGB値で表す。
【0042】
R[x,y]、G[x,y]、B[x,y] ( x=1〜16, y=1〜12 )
【0043】
たとえば、露出演算部36は、このRGB値を元に、各画素の色情報RG、BGおよび、画像を取得した際の露光時間T、ゲインG、色合成係数Kr、Kg、Kbから、輝度情報Lを、次の(式1)から(式3)により算出する。
【0044】
RG[x,y]=Log2(R[x,y])-Log2(G[x,y]) … (式1)
BG[x,y]=Log2(B[x,y])-Log2(G[x,y]) … (式2)
L[x,y]=Log2(Kr×R[x,y]+Kg×G[x,y]+Kb×B[x,y])−Log2(T)−Log2(G) … (式3)
【0045】
<追尾初期処理>
次に、追尾制御部32は、追尾制御の初期処理を行う(ステップS2)。このステップS2の処理を、図6を用いて詳細に説明する。
【0046】
ステップS1にて取得した追尾初期画像より、追尾制御部32の認識部321は、撮影者が指示した位置(図8では焦点検出エリア45c)に対応する位置の撮像素子19の画像情報を、被写体色情報として、たとえば、記憶部33の被写体色情報記憶部333に記憶する(ステップS201)。
【0047】
次にステップS202にて、追尾制御部32の認識部321は、被写体色情報に似た色情報を持つ同色情報領域を追尾初期画像から検出し、その同色情報領域を追尾被写体領域47とする(ステップS203)。
【0048】
次にステップS203にて、追尾制御部32の認識部321は、決定した追尾初期画像における追尾被写体領域47をテンプレート画像48として、記憶部33のテンプレート画像記憶部332に、記憶する(ステップS204)。
【0049】
たとえば図9のように追尾被写体領域47の大きさが4×4画素、始点位置が(x、y)=(7、5)の場合は、テンプレート画像48の色情報は下記のように表される。
【0050】
RGref[rx,ry]=RG[x,y]
BGref[rx,ry]=BG[x,y]
Lref[rx,ry] =L[x,y] (ただし、rx,ry=1〜4、x=7〜10、y=5〜8)
【0051】
なお、ここでは被写体色情報をもとに追尾被写体領域47を決定しているが、処理を簡易にするために、一律4×4画素のように固定された領域サイズとして追尾被写体領域47を決定してもよい。また、色情報を用いず、レンズの距離情報に応じて領域サイズを可変としてもよい。
【0052】
次に、追尾制御部32の認識部321は、追尾被写体領域47を予め定められた画素分だけ拡大した領域、たとえば、追尾被写体領域47とこの追尾被写体領域47の周囲3画素の範囲を含めた領域を、図9に示すように、探索領域49として設定する(ステップS205)。
【0053】
以上説明した図6の処理により、たとえば、図9における探索領域49は、x=4〜13、y=2〜11の領域となる。その後、図6の処理をリターンして、以降、図5のステップS3からの処理が実行される。
【0054】
次に、図5に戻り、制御部29は、レリーズボタンの全押しスイッチが押されているかを判定し、レリーズボタンの全押しスイッチが押されている場合にはステップS10に処理を進め、レリーズボタンの全押しスイッチが押されていない場合にはステップS4に処理を進める(ステップS3)。
このステップS4に続く処理サイクルは、ステップS3に戻る。このようにして、レリーズの全押しが押されるまでの間、ステップS4に続く処理サイクルが実行される(ステップS3のN)。
【0055】
<テンプレート変更処理>
上述したステップS3において、レリーズボタンの全押しスイッチが押されていない場合には、追尾制御部32の認識部321は、ステップS4からの追尾処理のサイクルを開始する。まず、追尾制御部32の認識部321は、テンプレート画像の変更処理を実行する(ステップS4)。なお、上述したステップS4における追尾制御の初期処理を行った直後の場合(初回の実行時)には、追尾制御部32の認識部321は、このステップS4の処理を実行しない。
【0056】
ここでは、追尾制御部32の変更部322は、直前のAF制御による結果により、記憶部33のテンプレート画像記憶部332に記憶されているテンプレート画像を、変更する。なお、本実施形態でいうAF制御とは、焦点検出部34による焦点検出の制御のことである。
【0057】
このテンプレート画像の変更の方法は、たとえば元のテンプレート画像48の画像情報に、新被写体領域47の画像情報を特定の比率で加えて、変更する。このように変更することにより、テンプレート画像に最新の画像情報を少しずつ変更されるため、追尾被写体の位置の変化に追従しやすくなるようになる。
【0058】
この追尾制御部32の変更部322におけるテンプレート画像48の変更の演算は、たとえば、下記の(式5)から(式7)となる。この式中において、変更割合Kupを変化させて、変更割合Kupの値を0〜1の間で設定することによって、すでに持っているテンプレート情報、または新被写体位置の情報のどちらを多く残して変更するかの調節が可能である。
【0059】
RGref[rx,ry]=(1-Kup)×RGref[rx,ry] + Kup×RG[x,y] … (式5)
BGref[rx,ry]=(1-Kup)×BGref[rx,ry] + Kup×BG[x,y] … (式6)
Lref[rx,ry]=(1-Kup)× Lref[rx,ry] + Kup× L[x,y] … (式7)
(ただし、rx,ry=1〜4)
【0060】
ここで、このステップS4の処理を、図7を用いて詳細に説明する。まず、ステップS401にて、追尾制御部32の変更部322は、前回の追尾演算にて出力した追尾エリアに対し、焦点検出部34により合焦制御を行うエリアとして採用した焦点検出エリアが対応するか否かを判定する。
【0061】
追尾制御部32の変更部322は、対応するエリアがあると判断するのは、下記の2つのパターンのうち、いずれかのパターンを用いる。
・追尾エリアに対し、AF制御が採用した焦点検出エリアが1対1で対応する場合
・追尾エリアに対して、採用した焦点検出エリアが中央付近にある場合
【0062】
上述した「追尾エリアに対して、採用した焦点検出エリアが中央付近にある場合」を判断する方法として、たとえば次の方法がある。
まず、追尾エリアの中心と採用した焦点検出エリアの中心の距離Dとを算出し、この距離が追尾エリアの大きさFrmに対して、たとえば5割以下の場合(D≦0.5×Frm/2)は、エリアの中央付近にあると判定する(図10参照)。
【0063】
追尾制御部32の変更部322は、追尾エリアと採用した焦点検出エリアが対応すると判定した場合(ステップS401でYの場合)、上記変更式における変更割合Kupを、所定の値NewRatio(固定値)として、上述した(式5)から(式7)の変更の演算を行う(ステップS403、404)。
【0064】
このときの所定の値NewRatioは、たとえば0.6〜1.0の値として、現在のテンプレート情報に対して新被写体位置の情報を多く含ませて変更を行う。このようにすると、被写体の急激な変化でも対応可能なテンプレート画像とすることができる。
【0065】
なお、所定の変更割合値NewRatio=1.0とすると、テンプレート画像は完全に新画像情報のみとなり、過去の色情報は残らなくなる。この場合、たとえばAF制御によって誤検出された場合などには、被写体位置とは異なるところでの色情報となってしまい、その後本来の追尾被写体の位置には戻れなくなってしまう可能性がある。そのため、所定の変更割合値NewRatio<1.0として、過去のテンプレート画像も数割残しておく方が望ましい。
【0066】
<追尾演算処理>
図5の説明に戻り、ステップS5で、追尾制御部32の認識部321は、撮像素子19による画像取得タイミングで次画像を取得し、ステップS1の場合と同様に、色情報RG[x,y]、BG[x,y]および輝度情報 L[x,y]を算出する。
【0067】
続けて、ステップS6にて、追尾制御部32の認識部321は、テンプレート差分演算処理を行う。
追尾制御部32の認識部321は、先に設定された探索領域49に対して、その中でテンプレート画像48と同サイズの領域を順次切り出し、切り出し画像とテンプレート画像48の対応する画素毎に画像情報の差分値Diffを算出する。たとえば、追尾制御部32の認識部321は、図11(1)の点線太枠のように、探索領域49の中で一画素ずつ領域をずらしながら、テンプレート画像48との差分を取っていく。
【0068】
この差分値Diffの演算は、探索領域49の始点位置を(scx、scy)=(4、2)とすると、下記の(式8)により算出できる。この差分値Diffの値が小さい位置が、テンプレート画像と類似している、ということとなる。
【0069】
Diff[dx,dy] = Σ Σ{ABS(RG[scx+dx-1+rx, scy+dy-1+ry]−RGref[rx,ry])+
ABS(BG[scx+dx-1+rx, scy+dy-1+ry]−BGref[rx,ry])+
ABS( L[scx+dx-1+rx, scy+dy-1+ry]− Lref[rx,ry])} … (式8)
(ただし、dx,dy=1〜7、rx,ry=1〜4、scx=4、scy=2)
【0070】
この(式8)において、最初のΣは、rx=1から4の合計であり、2つ目のΣは、ry=1から4の合計である。
【0071】
<追尾エリア決定処理>
次に、ステップS7にて、追尾制御部32の認識部321は、新しい追尾被写体位置(追尾エリア)を決定する。
次に、追尾制御部32の認識部321は、ステップS6にて算出した差分値Diffの中で、最小(または極小)となる最小差分値MinDiffを検出し、この最小差分値MinDiffの位置を新被写体位置47とする(ステップS7)。
【0072】
<類似判定>
次に、追尾制御部32の認識部321は、あらかじめ決められた類似閾値Dthをもとに、本結果がテンプレート画像に類似しているか否かの判定を行う(ステップS8)。この判定結果は、たとえば追尾結果を応用したAF制御、AE制御などにおいて用いられる。
【0073】
<探索領域決定>
次に、追尾制御部32の認識部321は、ステップS205と同様に新追尾被写体領域47の周辺に探索領域49を設定し(ステップS9)、本処理をリターンする。
上述したステップS4からステップS9の処理により、半押し中の1回の追尾処理は終了する。
【0074】
その後、制御部29は、上述したステップS4からステップS9の半押し中の追尾処理(追尾処理サイクル)を、レリーズの全押しを検出するまで繰り返し実行する。そして、制御部29は、レリーズの全押しが検出された場合(ステップS3でYの場合)、この追尾処理サイクルを終了し、撮影制御を実行し(ステップS10)、追尾制御された被写体を撮像する。
【0075】
以上説明したように、本実施形態によれば、画像に基づいた追尾演算の結果をAF制御(焦点検出部34)へ渡し、AF制御では追尾演算結果とDef量の両方を用いて最終的な合焦エリアを決めるシステムにおいて、AF制御が追尾結果を採用した場合に、テンプレート画像を変更する。
【0076】
これにより、より正確な被写体位置でテンプレート画像を変更することができ、精度よく被写体位置の変化に追従して追尾することが可能となる。
【0077】
ところで、認識部321による特定の対象の像の位置を認識する処理を繰り返し実行する間に、選択部341による複数の焦点検出位置のいずれかを選択する処理が実行される。この場合、変更部322は、認識部321による認識処理の直前の認識処理において認識した特定の対象の像の位置と、認識部321による連続した認識処理の間に選択部341により選択された焦点検出位置とに基づいて、特定の対象の像を変更する。
【0078】
たとえば、追尾演算とAF演算の関係は、その制御方法により、両方の演算を交互に行う場合と(図12)、それぞれを非同期に実行する場合(図13)がある。なお、ここでいう追尾演算とは追尾制御部32による被写体の追尾であり、AF演算とは焦点検出部34による被写体の検出(追尾)である。
【0079】
図12のように、それぞれの演算を交互に行う場合は、変更部322は、直前にAFが採用した焦点検出エリアと、前回の追尾結果の位置との対応により、テンプレート変更を行うか否かの判定を行う。
【0080】
一方、図13のようにそれぞれを非同期に実行する場合やお互いの演算サイクルが異なる場合は、変更部322は、追尾演算を繰り返し行うサイクルの間に、AF演算が複数回実行される場合がある(図13参照)。
このようなときには、変更部322は、たとえば、前回の追尾演算終了後に実行された複数回のAF演算において採用した各焦点検出エリア情報のうち、1つでも前回の追尾結果に対応したエリアを採用していれば、テンプレート変更を行うと判定する。
【0081】
図12と図13とを用いて説明したように、認識部321による特定の対象の像の位置を認識する処理を繰り返し実行する間に、選択部341による複数の焦点検出位置のいずれかを選択する処理が実行される場合であっても、変更部322は、特定の対象の像を変更することができる。
【0082】
なお、上記の説明においては、撮像装置として、一眼レフデジタルスチルカメラの場合について説明したが、本実施形態による画像認識装置は、一眼レフデジタルスチルカメラの場合に限られるものではなく、デジタルスチルカメラ、ビデオカメラなど任意の撮像装置に用いることも可能である。また、画像認識装置のみを用いて、被写体を追尾することも可能である。
【0083】
また、記憶部33は、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性のメモリや、CD−ROM等の読み出しのみが可能な記憶媒体、RAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせにより構成されるものとする。
【0084】
なお、この制御部29および制御部29の各構成は専用のハードウェアにより実現されるものであってもよく、また、この制御部29および制御部29の各構成はメモリおよびCPU(中央演算装置)により構成され、制御部29および制御部29の各構成の機能を実現するためのプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。
【0085】
また、図2における制御部29および制御部29の各構成の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより制御部29および制御部29の各構成による処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0086】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0087】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0088】
10…カメラ本体、22…レンズ、11…クイックリターンミラー、13…焦点版、14…ペンタプリズム、15…接眼レンズ、17…プリズム、18…結像レンズ、19…撮像素子、20…シャッタ、21…撮影用撮像素子、25…測距素子、29…制御部、30…CCD制御部、31…A/D変換部、32…追尾制御部、321…認識部、322…変更部、33…記憶部、34…焦点検出部、341…選択部、35…レンズ駆動部、36…露出演算部、37…撮像制御部、331…レンズ情報記憶部、332…テンプレート画像記憶部、333…被写体色情報記憶部
【技術分野】
【0001】
本発明は、画像認識装置、および、当該画像認識装置を備える撮像装置に関する。
【背景技術】
【0002】
従来から、移動する被写体を撮影する際に、指示位置にある被写体像をテンプレート画像として取得し、繰り返し取得する画像中でテンプレート画像と類似した像の位置を検索(テンプレートマッチング)することで、画面を移動する被写体を追尾する画像認識装置を備えるカメラが提案されている。
【0003】
このような画像認識装置においては、最初に目標被写体にてテンプレート画像を取得したあと、被写体が動くことや、輝度条件が変化する場合に、最新の被写体の形状が、テンプレート画像取得時に対して変化してしまうことがある。このような場合に対応するため、テンプレート画像との差分演算結果によって、テンプレート画像に新たな被写体画像の情報を加えて変更する手法が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許第3704045号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、差分演算結果によってテンプレート画像を変更する場合、誤って背景へ追尾してしまった場合でも、テンプレート画像を変更するための条件を満たす場合には、その背景情報をテンプレート画像に加えていくこととなる。このような場合、テンプレート画像は、少しずつ本来の被写体情報とは異なる情報となってしまう可能性がある。
【0006】
このように、従来の技術にあっては、正確な被写体位置でテンプレート画像を変更することができない可能性があるため、精度よく被写体位置の変化に追従して追尾することができなくなる可能性があるという問題があった。
【0007】
本発明は、このような事情に鑑みてなされたもので、その目的は、より正確な被写体位置でテンプレート画像を変更することができ、精度よく被写体位置の変化に追従して追尾することができる画像認識装置、および、撮像装置を提供することにある。
【課題を解決するための手段】
【0008】
この発明は上述した課題を解決するためになされたもので、光学系による像を撮像する撮像部と、前記撮像部によって撮像した画像の中から特定の対象の像の位置を認識する認識部と、前記画像内の複数の位置に対応して設定された複数の焦点検出位置に対する前記光学系の焦点状態を検出する焦点検出部と、前記焦点状態に基づいて、前記複数の焦点検出位置のいずれかを選択する選択部と、前記認識部が認識した前記特定の対象の像の位置と、前記選択部が選択した焦点検出位置との位置関係に基づいて、前記特定の対象の像を変更する変更部と、を備えることを特徴とする画像認識装置である。
【0009】
また、この発明は、上記画像認識装置を備えることを特徴とする撮像装置である。
【発明の効果】
【0010】
この発明によれば、より正確な被写体位置でテンプレート画像を変更することができ、精度よく被写体位置の変化に追従して追尾することが可能となる。
【図面の簡単な説明】
【0011】
【図1】この発明の一実施形態によるカメラの構成の一例を示すブロック図である。
【図2】図1の制御部の構成の一例を示すブロック図である。
【図3】図1の撮像素子の構成の一例を示すブロック図である。
【図4】図3の撮像素子において、1つの撮像素子の構成の一例を示すブロック図である。
【図5】この発明の一実施形態によるカメラの動作を示すフローチャートである。
【図6】図5のステップS2の動作を詳細に示すフローチャートである。
【図7】図5のステップS4の動作を詳細に示すフローチャートである。
【図8】焦点検出エリアの一例を示す説明図である。
【図9】追尾被写体領域の一例を示す説明図である。
【図10】追尾エリアに対して、採用した焦点検出エリアが中央付近にある場合の一例を示す説明図である。
【図11】本実施形態によるテンプレート差分演算処理の一例を説明する説明図である。
【図12】追尾演算とAF演算とが直列に実行される場合の動作の一例を示すタイミングチャートである。
【図13】追尾演算とAF演算とが非同期に実行される場合の動作の一例を示すタイミングチャートである。
【発明を実施するための形態】
【0012】
以下、図面を参照して、本発明の実施の形態について説明する。図1は、この発明の一実施形態による画像認識装置を備える撮像装置の構成を示す概略ブロック図である。ここでは、撮像装置として、一眼レフデジタルスチルカメラ(以下、カメラとする)の場合について説明する。
【0013】
図1に示すように、カメラは、カメラ本体10と、このカメラ本体10に着脱されるレンズ22とを備えている。このレンズ22は、たとえば、交換レンズである。このレンズ22は、たとえば、焦点調節用レンズを備えている。
【0014】
このカメラにおいて、被写体光はレンズ22を通って、カメラ本体10に入射する。図示しないレリーズボタンが全押しされていない状態においては、レンズ22を通った被写体光は、図1において点線で示す位置にあるクイックリターンミラー11により反射されて焦点版13に結像し、さらにペンタプリズム14で接眼レンズ15に導かれる。
【0015】
また、クイックリターンミラー11により反射されて焦点版13に結像した被写体光は、プリズム17と結像レンズ18を通って、撮像素子(撮像部)19に入射して被写体像を結像する。そして、この撮像素子19は、光学系による被写体像を撮像する。
【0016】
また、レンズ22を通った被写体光は、図1において点線で示す位置にあるクイックリターンミラー11のハーフミラー部分を透過し、ミラー23により反射されて、レンズ22を介して測距素子25に入射する。
【0017】
測距素子25は、レリーズボタンの半押しスイッチが操作され半押し信号が入力されたことに応じて、入射された被写体光に基づいて測距し、測距した結果を焦点検出信号として制御部29に出力する。この測距素子25は、たとえば、焦点検出エリアに対応する一対のCCDラインセンサを複数有している。
【0018】
制御部29は、測距素子25からの焦点検出信号と、撮像素子19からの被写体像とに基づいて、レンズ22の焦点状態を検出し、当該検出した焦点状態に基づいて、レンズ22の焦点を調節する。たとえば、制御部29は、レンズ22が備えるアクチュエータなどの駆動部を介して、レンズ22の焦点調節用レンズの位置を調整する。
【0019】
一方、レリーズボタン全押しにより撮影制御が実行される場合には、クイックリターンミラー11が図1において実線で示す位置に回動して、クイックリターンミラー11は、撮影用撮像素子21への光路上から退避される。そのため、被写体光は、シャッタ20を介してCCD(Charge Coupled Devices)などで構成される撮影用撮像素子21上に結像する。そして、この撮影用撮像素子21は、結像した被写体光を撮像する。
【0020】
次に、図2を用いて、図1に示した制御部29の構成の一例について説明する。なお、同図において図1の各部に対応する部分には同一の符号を付け、その説明を省略する。
【0021】
焦点検出部34は、測距素子25からの焦点検出信号、すなわち、焦点検出エリアに対応する一対のCCDラインセンサから出力される焦点検出信号に基づいて、デフォーカス量など、光学系の焦点調節状態を検出し、焦点調節量を算出する。このようにして、この焦点検出部34は、画像内の複数の位置に対応して設定された複数の焦点検出位置に対する光学系の焦点状態を検出する。
【0022】
この焦点検出部34は、一例としては、選択部341を備えている。選択部341は、焦点状態に基づいて、測距素子25における複数の焦点検出位置のいずれかを選択する。たとえば、選択部341は、後述する追尾制御部32の認識部321によって認識された位置と光学系の焦点状態とに基づいて、複数の焦点検出位置のいずれかを選択する。
【0023】
レンズ駆動部35は、焦点検出部34からの焦点調節量に基づき、レンズ22に入射する被写体光が撮影用撮像素子21上で結像するように、レンズ22を合焦位置へ駆動する。なお、レンズ22の焦点や絞り値などのレンズ情報は、たとえば、レンズ22がカメラ本体10に取り付けられる場合に、記憶部33のレンズ情報記憶部331に記憶される。このレンズ駆動部35は、たとえば、焦点検出部34からの焦点調節量に、記憶部33のレンズ情報記憶部331から読み出したレンズ情報に基づいて定められる係数を乗じて、レンズ22を合焦位置へ駆動する駆動量を算出する。そして、レンズ駆動部35は、この算出した駆動量に基づいて、レンズ22を合焦位置へ駆動する。
【0024】
CCD制御部30は、撮像素子19を制御して、撮像素子19に被写体像を撮像させる。ここで、レリーズボタンの半押しスイッチが操作され、レリーズボタンから半押し信号が出力されている間は、クイックリターンミラー11が図1の点線位置の状態にあり、撮像素子19には、レンズ22を介した被写体像が結像されている。そのため、レリーズボタンから半押し信号が出力されている間は、撮像素子19は、常にレンズ22を通って入射される被写体像を取得することができる。よって、例えば半押しスイッチオンにより、CCD制御部30は、撮像素子19を介して追尾被写体の捕捉を開始し、以降この半押し信号が入力されている間は、繰り返し被写体像の画像を取得する事が可能である。
【0025】
A/D変換部31は、撮像素子19からの出力信号を、アナログデジタル変換して、追尾制御部32および露出演算部36に出力する。
【0026】
追尾制御部32は、A/D変換部31からの信号、すなわち、撮像素子19によって撮像した画像の中から、特定の対象の像の位置を認識し、認識した位置を焦点検出部34に出力する。
【0027】
この追尾制御部32は、一例としては、認識部321と変更部322とを備えている。認識部321は、撮像素子19によって撮像した画像の中から特定の対象の像の位置を認識する。この特定の対象の像とは、たとえば、追尾処理が開始される場合に、ユーザによる操作部の操作に応じて被写体像の中から選択された被写体像、または、顔認識技術等により選択された被写体像である。なお、追尾制御部32は、この特定の対象の像、すなわち、追尾処理が開始される場合に選択された被写体像を、たとえば、テンプレート画像記憶部332に記憶する。
【0028】
変更部322は、認識部321が認識した特定の対象の像の位置と、選択部341が選択した焦点検出位置との位置関係に基づいて、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。たとえば、変更部322は、選択部341によって選択された焦点検出位置が、認識部321によって認識された特定の対象の像の位置に対応する場合に、特定の対象の像を変更する。一例としては、変更部322は、選択部341によって選択された焦点検出位置が、認識部321によって認識された特定の対象の像の位置の中心位置に対応する場合に、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。
【0029】
また、変更部322は、選択部341によって選択された焦点検出位置と、認識部321によって認識された特定の対象の像の位置との間隔が、認識部321によって認識された特定の対象の像のサイズに基づいて定められる距離以下である場合に、選択部341によって選択された焦点検出位置が、認識部321によって認識された特定の対象の像の位置の中心位置に対応すると判定し、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。
【0030】
また、変更部322は、特定の対象の像の情報と、認識部321によって認識された位置における像の情報とに基づいて、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する。
【0031】
また、変更部322は、テンプレート画像記憶部332に記憶されている特定の対象の像を変更する場合に、特定の対象の像の情報量よりも、認識部321によって認識された像の情報量を多くする。
【0032】
なお、上述した認識部321は、撮像素子19によって撮像した画像の中から、テンプレート画像記憶部332に記憶されている特定の対象の像と一致する位置を検出することにより、撮像素子19によって撮像した画像の中から特定の対象の像の位置を認識する。そして、認識部321は、認識した特定の対象の像の位置を、焦点検出部34に出力する。
【0033】
露出演算部36は、A/D変換部31からの出力信号に基づいて露出を決定し、この決定した露出を露出制御制御信号として撮像制御部37へ出力する。この露出演算部36は、露出を決定する場合に、A/D変換部31からの出力信号において、追尾制御部32の認識部321によって認識された位置に対応する出力信号に基づいて、露出を決めてもよい。
【0034】
撮像制御部37は、露出演算部36からの露出制御制御信号に基づいて、シャッタ20の開閉を制御するとともに、撮影用撮像素子21による撮像を制御して、レンズ22からの被写体像を撮像する。
【0035】
なお、上述した追尾制御部32と、記憶部33と、焦点検出部34とにより、画像認識装置39が構成されている。
【0036】
図3、4は、撮像素子19の構成の一例を示す図である。撮像素子19はマトリクス状に配列された複数(図3の場合は16×12)の画素を備えている。このひとつの画素は、たとえば図4に示すように、3つの要素a、b、および、cから構成されており、この各要素に対応させてR、G、および、Bの原色フィルターを設けられることにより、結像画像のRGBの各色情報を得ることが可能である。
【0037】
次に、図5から図7のフローチャート、および、図8から図11の図に基づき、本実施形態によるカメラの動作を説明する。
【0038】
<初期画像取得>
まず、図5のステップS1において、追尾制御部32および露出演算部36は、A/D変換部31を介して、撮像素子19に結像した画像を初期画像として取得する。
【0039】
たとえば、この画像取得タイミングは、ファインダ16上に表示されている焦点検出エリア45を、撮影者が不図示の焦点検出エリア操作部を操作することで追尾被写体に対応するエリアを点灯させ、その状態で不図示のカメラのレリーズボタンを半押しすることで画像の取得制御が開始される(図8参照)。
【0040】
ここでは、撮影者自身が焦点検出エリアにて追尾被写体を指定する方法を述べたが、この方法にはよらない。たとえば、顔認識技術や移動体検出技術を用いた被写体検出技術により被写体を追尾被写体として検出し、この検出した追尾被写体に対応するエリアが選択されてもよい。
【0041】
ここで得た画像情報を、画素毎に下記RGB値で表す。
【0042】
R[x,y]、G[x,y]、B[x,y] ( x=1〜16, y=1〜12 )
【0043】
たとえば、露出演算部36は、このRGB値を元に、各画素の色情報RG、BGおよび、画像を取得した際の露光時間T、ゲインG、色合成係数Kr、Kg、Kbから、輝度情報Lを、次の(式1)から(式3)により算出する。
【0044】
RG[x,y]=Log2(R[x,y])-Log2(G[x,y]) … (式1)
BG[x,y]=Log2(B[x,y])-Log2(G[x,y]) … (式2)
L[x,y]=Log2(Kr×R[x,y]+Kg×G[x,y]+Kb×B[x,y])−Log2(T)−Log2(G) … (式3)
【0045】
<追尾初期処理>
次に、追尾制御部32は、追尾制御の初期処理を行う(ステップS2)。このステップS2の処理を、図6を用いて詳細に説明する。
【0046】
ステップS1にて取得した追尾初期画像より、追尾制御部32の認識部321は、撮影者が指示した位置(図8では焦点検出エリア45c)に対応する位置の撮像素子19の画像情報を、被写体色情報として、たとえば、記憶部33の被写体色情報記憶部333に記憶する(ステップS201)。
【0047】
次にステップS202にて、追尾制御部32の認識部321は、被写体色情報に似た色情報を持つ同色情報領域を追尾初期画像から検出し、その同色情報領域を追尾被写体領域47とする(ステップS203)。
【0048】
次にステップS203にて、追尾制御部32の認識部321は、決定した追尾初期画像における追尾被写体領域47をテンプレート画像48として、記憶部33のテンプレート画像記憶部332に、記憶する(ステップS204)。
【0049】
たとえば図9のように追尾被写体領域47の大きさが4×4画素、始点位置が(x、y)=(7、5)の場合は、テンプレート画像48の色情報は下記のように表される。
【0050】
RGref[rx,ry]=RG[x,y]
BGref[rx,ry]=BG[x,y]
Lref[rx,ry] =L[x,y] (ただし、rx,ry=1〜4、x=7〜10、y=5〜8)
【0051】
なお、ここでは被写体色情報をもとに追尾被写体領域47を決定しているが、処理を簡易にするために、一律4×4画素のように固定された領域サイズとして追尾被写体領域47を決定してもよい。また、色情報を用いず、レンズの距離情報に応じて領域サイズを可変としてもよい。
【0052】
次に、追尾制御部32の認識部321は、追尾被写体領域47を予め定められた画素分だけ拡大した領域、たとえば、追尾被写体領域47とこの追尾被写体領域47の周囲3画素の範囲を含めた領域を、図9に示すように、探索領域49として設定する(ステップS205)。
【0053】
以上説明した図6の処理により、たとえば、図9における探索領域49は、x=4〜13、y=2〜11の領域となる。その後、図6の処理をリターンして、以降、図5のステップS3からの処理が実行される。
【0054】
次に、図5に戻り、制御部29は、レリーズボタンの全押しスイッチが押されているかを判定し、レリーズボタンの全押しスイッチが押されている場合にはステップS10に処理を進め、レリーズボタンの全押しスイッチが押されていない場合にはステップS4に処理を進める(ステップS3)。
このステップS4に続く処理サイクルは、ステップS3に戻る。このようにして、レリーズの全押しが押されるまでの間、ステップS4に続く処理サイクルが実行される(ステップS3のN)。
【0055】
<テンプレート変更処理>
上述したステップS3において、レリーズボタンの全押しスイッチが押されていない場合には、追尾制御部32の認識部321は、ステップS4からの追尾処理のサイクルを開始する。まず、追尾制御部32の認識部321は、テンプレート画像の変更処理を実行する(ステップS4)。なお、上述したステップS4における追尾制御の初期処理を行った直後の場合(初回の実行時)には、追尾制御部32の認識部321は、このステップS4の処理を実行しない。
【0056】
ここでは、追尾制御部32の変更部322は、直前のAF制御による結果により、記憶部33のテンプレート画像記憶部332に記憶されているテンプレート画像を、変更する。なお、本実施形態でいうAF制御とは、焦点検出部34による焦点検出の制御のことである。
【0057】
このテンプレート画像の変更の方法は、たとえば元のテンプレート画像48の画像情報に、新被写体領域47の画像情報を特定の比率で加えて、変更する。このように変更することにより、テンプレート画像に最新の画像情報を少しずつ変更されるため、追尾被写体の位置の変化に追従しやすくなるようになる。
【0058】
この追尾制御部32の変更部322におけるテンプレート画像48の変更の演算は、たとえば、下記の(式5)から(式7)となる。この式中において、変更割合Kupを変化させて、変更割合Kupの値を0〜1の間で設定することによって、すでに持っているテンプレート情報、または新被写体位置の情報のどちらを多く残して変更するかの調節が可能である。
【0059】
RGref[rx,ry]=(1-Kup)×RGref[rx,ry] + Kup×RG[x,y] … (式5)
BGref[rx,ry]=(1-Kup)×BGref[rx,ry] + Kup×BG[x,y] … (式6)
Lref[rx,ry]=(1-Kup)× Lref[rx,ry] + Kup× L[x,y] … (式7)
(ただし、rx,ry=1〜4)
【0060】
ここで、このステップS4の処理を、図7を用いて詳細に説明する。まず、ステップS401にて、追尾制御部32の変更部322は、前回の追尾演算にて出力した追尾エリアに対し、焦点検出部34により合焦制御を行うエリアとして採用した焦点検出エリアが対応するか否かを判定する。
【0061】
追尾制御部32の変更部322は、対応するエリアがあると判断するのは、下記の2つのパターンのうち、いずれかのパターンを用いる。
・追尾エリアに対し、AF制御が採用した焦点検出エリアが1対1で対応する場合
・追尾エリアに対して、採用した焦点検出エリアが中央付近にある場合
【0062】
上述した「追尾エリアに対して、採用した焦点検出エリアが中央付近にある場合」を判断する方法として、たとえば次の方法がある。
まず、追尾エリアの中心と採用した焦点検出エリアの中心の距離Dとを算出し、この距離が追尾エリアの大きさFrmに対して、たとえば5割以下の場合(D≦0.5×Frm/2)は、エリアの中央付近にあると判定する(図10参照)。
【0063】
追尾制御部32の変更部322は、追尾エリアと採用した焦点検出エリアが対応すると判定した場合(ステップS401でYの場合)、上記変更式における変更割合Kupを、所定の値NewRatio(固定値)として、上述した(式5)から(式7)の変更の演算を行う(ステップS403、404)。
【0064】
このときの所定の値NewRatioは、たとえば0.6〜1.0の値として、現在のテンプレート情報に対して新被写体位置の情報を多く含ませて変更を行う。このようにすると、被写体の急激な変化でも対応可能なテンプレート画像とすることができる。
【0065】
なお、所定の変更割合値NewRatio=1.0とすると、テンプレート画像は完全に新画像情報のみとなり、過去の色情報は残らなくなる。この場合、たとえばAF制御によって誤検出された場合などには、被写体位置とは異なるところでの色情報となってしまい、その後本来の追尾被写体の位置には戻れなくなってしまう可能性がある。そのため、所定の変更割合値NewRatio<1.0として、過去のテンプレート画像も数割残しておく方が望ましい。
【0066】
<追尾演算処理>
図5の説明に戻り、ステップS5で、追尾制御部32の認識部321は、撮像素子19による画像取得タイミングで次画像を取得し、ステップS1の場合と同様に、色情報RG[x,y]、BG[x,y]および輝度情報 L[x,y]を算出する。
【0067】
続けて、ステップS6にて、追尾制御部32の認識部321は、テンプレート差分演算処理を行う。
追尾制御部32の認識部321は、先に設定された探索領域49に対して、その中でテンプレート画像48と同サイズの領域を順次切り出し、切り出し画像とテンプレート画像48の対応する画素毎に画像情報の差分値Diffを算出する。たとえば、追尾制御部32の認識部321は、図11(1)の点線太枠のように、探索領域49の中で一画素ずつ領域をずらしながら、テンプレート画像48との差分を取っていく。
【0068】
この差分値Diffの演算は、探索領域49の始点位置を(scx、scy)=(4、2)とすると、下記の(式8)により算出できる。この差分値Diffの値が小さい位置が、テンプレート画像と類似している、ということとなる。
【0069】
Diff[dx,dy] = Σ Σ{ABS(RG[scx+dx-1+rx, scy+dy-1+ry]−RGref[rx,ry])+
ABS(BG[scx+dx-1+rx, scy+dy-1+ry]−BGref[rx,ry])+
ABS( L[scx+dx-1+rx, scy+dy-1+ry]− Lref[rx,ry])} … (式8)
(ただし、dx,dy=1〜7、rx,ry=1〜4、scx=4、scy=2)
【0070】
この(式8)において、最初のΣは、rx=1から4の合計であり、2つ目のΣは、ry=1から4の合計である。
【0071】
<追尾エリア決定処理>
次に、ステップS7にて、追尾制御部32の認識部321は、新しい追尾被写体位置(追尾エリア)を決定する。
次に、追尾制御部32の認識部321は、ステップS6にて算出した差分値Diffの中で、最小(または極小)となる最小差分値MinDiffを検出し、この最小差分値MinDiffの位置を新被写体位置47とする(ステップS7)。
【0072】
<類似判定>
次に、追尾制御部32の認識部321は、あらかじめ決められた類似閾値Dthをもとに、本結果がテンプレート画像に類似しているか否かの判定を行う(ステップS8)。この判定結果は、たとえば追尾結果を応用したAF制御、AE制御などにおいて用いられる。
【0073】
<探索領域決定>
次に、追尾制御部32の認識部321は、ステップS205と同様に新追尾被写体領域47の周辺に探索領域49を設定し(ステップS9)、本処理をリターンする。
上述したステップS4からステップS9の処理により、半押し中の1回の追尾処理は終了する。
【0074】
その後、制御部29は、上述したステップS4からステップS9の半押し中の追尾処理(追尾処理サイクル)を、レリーズの全押しを検出するまで繰り返し実行する。そして、制御部29は、レリーズの全押しが検出された場合(ステップS3でYの場合)、この追尾処理サイクルを終了し、撮影制御を実行し(ステップS10)、追尾制御された被写体を撮像する。
【0075】
以上説明したように、本実施形態によれば、画像に基づいた追尾演算の結果をAF制御(焦点検出部34)へ渡し、AF制御では追尾演算結果とDef量の両方を用いて最終的な合焦エリアを決めるシステムにおいて、AF制御が追尾結果を採用した場合に、テンプレート画像を変更する。
【0076】
これにより、より正確な被写体位置でテンプレート画像を変更することができ、精度よく被写体位置の変化に追従して追尾することが可能となる。
【0077】
ところで、認識部321による特定の対象の像の位置を認識する処理を繰り返し実行する間に、選択部341による複数の焦点検出位置のいずれかを選択する処理が実行される。この場合、変更部322は、認識部321による認識処理の直前の認識処理において認識した特定の対象の像の位置と、認識部321による連続した認識処理の間に選択部341により選択された焦点検出位置とに基づいて、特定の対象の像を変更する。
【0078】
たとえば、追尾演算とAF演算の関係は、その制御方法により、両方の演算を交互に行う場合と(図12)、それぞれを非同期に実行する場合(図13)がある。なお、ここでいう追尾演算とは追尾制御部32による被写体の追尾であり、AF演算とは焦点検出部34による被写体の検出(追尾)である。
【0079】
図12のように、それぞれの演算を交互に行う場合は、変更部322は、直前にAFが採用した焦点検出エリアと、前回の追尾結果の位置との対応により、テンプレート変更を行うか否かの判定を行う。
【0080】
一方、図13のようにそれぞれを非同期に実行する場合やお互いの演算サイクルが異なる場合は、変更部322は、追尾演算を繰り返し行うサイクルの間に、AF演算が複数回実行される場合がある(図13参照)。
このようなときには、変更部322は、たとえば、前回の追尾演算終了後に実行された複数回のAF演算において採用した各焦点検出エリア情報のうち、1つでも前回の追尾結果に対応したエリアを採用していれば、テンプレート変更を行うと判定する。
【0081】
図12と図13とを用いて説明したように、認識部321による特定の対象の像の位置を認識する処理を繰り返し実行する間に、選択部341による複数の焦点検出位置のいずれかを選択する処理が実行される場合であっても、変更部322は、特定の対象の像を変更することができる。
【0082】
なお、上記の説明においては、撮像装置として、一眼レフデジタルスチルカメラの場合について説明したが、本実施形態による画像認識装置は、一眼レフデジタルスチルカメラの場合に限られるものではなく、デジタルスチルカメラ、ビデオカメラなど任意の撮像装置に用いることも可能である。また、画像認識装置のみを用いて、被写体を追尾することも可能である。
【0083】
また、記憶部33は、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性のメモリや、CD−ROM等の読み出しのみが可能な記憶媒体、RAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせにより構成されるものとする。
【0084】
なお、この制御部29および制御部29の各構成は専用のハードウェアにより実現されるものであってもよく、また、この制御部29および制御部29の各構成はメモリおよびCPU(中央演算装置)により構成され、制御部29および制御部29の各構成の機能を実現するためのプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。
【0085】
また、図2における制御部29および制御部29の各構成の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより制御部29および制御部29の各構成による処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0086】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0087】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0088】
10…カメラ本体、22…レンズ、11…クイックリターンミラー、13…焦点版、14…ペンタプリズム、15…接眼レンズ、17…プリズム、18…結像レンズ、19…撮像素子、20…シャッタ、21…撮影用撮像素子、25…測距素子、29…制御部、30…CCD制御部、31…A/D変換部、32…追尾制御部、321…認識部、322…変更部、33…記憶部、34…焦点検出部、341…選択部、35…レンズ駆動部、36…露出演算部、37…撮像制御部、331…レンズ情報記憶部、332…テンプレート画像記憶部、333…被写体色情報記憶部
【特許請求の範囲】
【請求項1】
光学系による像を撮像する撮像部と、
前記撮像部によって撮像した画像の中から特定の対象の像の位置を認識する認識部と、
前記画像内の複数の位置に対応して設定された複数の焦点検出位置に対する前記光学系の焦点状態を検出する焦点検出部と、
前記焦点状態に基づいて、前記複数の焦点検出位置のいずれかを選択する選択部と、
前記認識部が認識した前記特定の対象の像の位置と、前記選択部が選択した焦点検出位置との位置関係に基づいて、前記特定の対象の像を変更する変更部と、
を備えることを特徴とする画像認識装置。
【請求項2】
請求項1に記載の画像認識装置において、
前記選択部は、
前記認識部によって認識された位置と前記光学系の焦点状態とに基づいて、前記複数の焦点検出位置のいずれかを選択することを特徴とする画像認識装置。
【請求項3】
請求項1または請求項2に記載の画像認識装置において、
前記変更部は、
前記選択部によって選択された焦点検出位置が、前記認識部によって認識された前記特定の対象の像の位置に対応する場合に、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の画像認識装置において、
前記変更部は、
前記選択部によって選択された焦点検出位置が、前記認識部によって認識された前記特定の対象の像の位置の中心位置に対応する場合に、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項5】
請求項4に記載の画像認識装置において、
前記変更部は、
前記選択部によって選択された焦点検出位置と、前記認識部によって認識された前記特定の対象の像の位置との間隔が、前記認識部によって認識された前記特定の対象の像のサイズに基づいて定められる距離以下である場合に、前記選択部によって選択された焦点検出位置が、前記認識部によって認識された前記特定の対象の像の位置の中心位置に対応すると判定し、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項6】
請求項1から請求項5のいずれか1項に記載の画像認識装置において、
前記変更部は、
前記特定の対象の像の情報と、前記認識部によって認識された位置における像の情報とに基づいて、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項7】
請求項6に記載の画像認識装置において、
前記変更部は、
前記特定の対象の像の情報量よりも、前記認識部によって認識された像の情報量を多くすることを特徴とする画像認識装置。
【請求項8】
請求項1から請求項7のいずれか1項に記載の画像認識装置において、
前記認識部による前記特定の対象の像の位置を認識する処理を繰り返し実行する間に、前記選択部による前記複数の焦点検出位置のいずれかを選択する処理が実行される場合には、
前記変更部は、
前記認識部による認識処理の直前の認識処理において認識した前記特定の対象の像の位置と、前記認識部による連続した認識処理の間に前記選択部により選択された焦点検出位置とに基づいて、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項9】
請求項1から請求項8のいずれか1項に記載の画像認識装置を備えることを特徴とする撮像装置。
【請求項1】
光学系による像を撮像する撮像部と、
前記撮像部によって撮像した画像の中から特定の対象の像の位置を認識する認識部と、
前記画像内の複数の位置に対応して設定された複数の焦点検出位置に対する前記光学系の焦点状態を検出する焦点検出部と、
前記焦点状態に基づいて、前記複数の焦点検出位置のいずれかを選択する選択部と、
前記認識部が認識した前記特定の対象の像の位置と、前記選択部が選択した焦点検出位置との位置関係に基づいて、前記特定の対象の像を変更する変更部と、
を備えることを特徴とする画像認識装置。
【請求項2】
請求項1に記載の画像認識装置において、
前記選択部は、
前記認識部によって認識された位置と前記光学系の焦点状態とに基づいて、前記複数の焦点検出位置のいずれかを選択することを特徴とする画像認識装置。
【請求項3】
請求項1または請求項2に記載の画像認識装置において、
前記変更部は、
前記選択部によって選択された焦点検出位置が、前記認識部によって認識された前記特定の対象の像の位置に対応する場合に、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項4】
請求項1から請求項3のいずれか1項に記載の画像認識装置において、
前記変更部は、
前記選択部によって選択された焦点検出位置が、前記認識部によって認識された前記特定の対象の像の位置の中心位置に対応する場合に、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項5】
請求項4に記載の画像認識装置において、
前記変更部は、
前記選択部によって選択された焦点検出位置と、前記認識部によって認識された前記特定の対象の像の位置との間隔が、前記認識部によって認識された前記特定の対象の像のサイズに基づいて定められる距離以下である場合に、前記選択部によって選択された焦点検出位置が、前記認識部によって認識された前記特定の対象の像の位置の中心位置に対応すると判定し、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項6】
請求項1から請求項5のいずれか1項に記載の画像認識装置において、
前記変更部は、
前記特定の対象の像の情報と、前記認識部によって認識された位置における像の情報とに基づいて、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項7】
請求項6に記載の画像認識装置において、
前記変更部は、
前記特定の対象の像の情報量よりも、前記認識部によって認識された像の情報量を多くすることを特徴とする画像認識装置。
【請求項8】
請求項1から請求項7のいずれか1項に記載の画像認識装置において、
前記認識部による前記特定の対象の像の位置を認識する処理を繰り返し実行する間に、前記選択部による前記複数の焦点検出位置のいずれかを選択する処理が実行される場合には、
前記変更部は、
前記認識部による認識処理の直前の認識処理において認識した前記特定の対象の像の位置と、前記認識部による連続した認識処理の間に前記選択部により選択された焦点検出位置とに基づいて、前記特定の対象の像を変更することを特徴とする画像認識装置。
【請求項9】
請求項1から請求項8のいずれか1項に記載の画像認識装置を備えることを特徴とする撮像装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2011−71671(P2011−71671A)
【公開日】平成23年4月7日(2011.4.7)
【国際特許分類】
【出願番号】特願2009−219952(P2009−219952)
【出願日】平成21年9月25日(2009.9.25)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】
【公開日】平成23年4月7日(2011.4.7)
【国際特許分類】
【出願日】平成21年9月25日(2009.9.25)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】
[ Back to top ]