説明

画像処理装置、システム、方法、集積回路

【課題】個人認識用に登録する特徴データとして、より適切なもの(最適に近いもの)が選択可能とする。
【解決手段】玄関700haでの複数の画像4の、複数の特徴データ4Dより、それぞれの組み合わせ4cでの類似度4Sを計算する照合部104と、計算される複数の類似度4SMから、画像6に近似である高い確率107Pvを有する画像42の特徴データ42Dを特定し、個人認識処理において利用される登録データ4Duとして設定する制御部105とを備える画像処理装置100が構築される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力画像に含まれる顔領域から計算した特徴データと、予め設定された登録データとを照合することで、入力画像内の個人を認識する個人認識処理を行う画像処理装置及び画像処理システムに関するものである。
【背景技術】
【0002】
近年、様々な機器に、人物の顔や指などの身体的特徴を利用して、入力される画像から、個人を認識する個人認識機能が適用されている。また、合わせて、いかに正しく個人を認識できるようにするかという認識性能向上に向けた様々な提案がされている。その中の一つに、認識対象とする個人の特徴データを、登録データとして予め設定する際に、より適切(最適)な状態の特徴データを選択することで、その後の個人認識処理における認識性能を向上させるというものがある(例えば、特許文献1参照)。
【0003】
図8は、特許文献1に記載された、従来の個人特徴登録装置の動作を示すフロー図である。
【0004】
以下、図8を用いて、従来技術での処理の流れを説明する。
【0005】
ここでは、登録データとして設定される候補となる、5つの入力データを、F1、F2、F3、F4、F5とする。そしてF1〜F5から2つずつ選んで作った、10(=4+3+2+1)通りの組み合わせのそれぞれによる評価関数値(類似度を示す評価値で、類似度が高いほど小さい値をとる)を、それらの10通りの組み合わせうちのそれぞれの組み合わせについて計算し、計算された、これらの10個の評価関数値の中の、最小値を記録した組み合わせを求め、それが、例えばF1とF3の組み合わせによるものである場合には、登録データとして、F1又はF3を選択するものである。
【0006】
まず、パラメータKの値が、0にセットされる(ステップS800)。
【0007】
次に、処理対象となるデータが入力され(ステップS801)、その後、Kの値が1増加され(ステップS802)、Kの値が5を超えているか否かが判断される(ステップS803)。すなわち、ステップS801による、データの入力が、5回行われる(F1〜F5)。
【0008】
次に、パラメータMINに、十分に大きな値がセットされ(ステップS804)、そして、パラメータPに0がセットされ(ステップS805)、また、パラメータQに、P+1がセットされる(ステップS806)。そして、その後、評価関数値S(P,Q)が計算される(ステップS807)。
【0009】
次に、評価関数値S(P,Q)が、パラメータMINより小さいか否かが判断され(ステップS808)、小さい場合には(S808:Y)、MINにS(P,Q)が、MINPにPが、MINQにQがそれぞれセットされる(ステップS809)。
【0010】
次に、Qの値が1増加され(ステップS810)、Qの値が6を超えているか否かが判断される(ステップS811)。そして、Qの値が、6以下の場合には(ステップS811:N)、Pの値が1増加される(ステップS812)。
【0011】
次に、Pの値が5を超えているか否かが判断され(ステップS813)、Pの値が5未満ならば(ステップS813:Y)、ステップS806に戻り、5以上の場合には(ステップS813:N)、処理を終了し、5つの入力データ(F1〜F5)の内、FMINP、FMINQ(MINP、MINQは1〜5の何れかの整数)を、登録データとして選択する。
【0012】
以上説明したように、先行技術では、登録データを選択する際に、複数回、候補を入力し、これらの全てを、2つずつ組み合わせ、最も類似度の高い(先行技術の中では評価関数値が最小となると表記)データを選択する。つまり、最も類似度の高い組み合わせでのデータが選択される。
【先行技術文献】
【特許文献】
【0013】
【特許文献1】特開平2−178780号公報
【発明の概要】
【発明が解決しようとする課題】
【0014】
しかしながら、前記従来の構成では、最も類似度が高いデータを、登録データとして選択する。そして、次の状況が生じることが考えられる。つまり、候補となる、複数の入力データの中で、ある組み合わせ(特異点の組み合わせ)での2つのデータ間の類似度が非常に高いことが考えられる。そして、特異点の組み合わせにおけるそれら2つのデータ以外の全データでの、それぞれの組み合わせの2つの間での類似度も、ある程度高いことが考えられる。そして、一方で、特異点の組み合わせにおける2つのデータのそれぞれと、それらの2つのデータ以外のそれぞれのデータとの間の類似度が低いという状況が考えられる。この状況下では、複数の入力データ全体の中の、特異点となっている組み合わせのデータを、登録データとして選択することになる。そして、このようにして、特異点となる状態(組み合わせ)のデータを、登録データとして設定してしまうと、設定された登録データと、個人認識処理で照合する、比較的多くの入力画像との間での類似度が低くなり、認識率が著しく低下するという課題を有していた。
【0015】
本発明は、前記従来の課題を解決するもので、個人認識処理における登録データとして、より適切な(最適な)ものが選択できる画像処理装置を提供することを目的とする。
【0016】
なお、つまり、上記の特異点の組み合わせでのデータが、登録データとして設定されてしまうことが回避されて、設定される登録データが、確実に、適切にできる画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0017】
前記従来の課題を解決するために、本発明の画像処理装置は、同一の人物が撮像された、予め録画された複数の画像(後で画像を撮像する撮像装置と同じ撮像装置により、後での撮像よりも先に撮像された複数の画像)を記憶する画像記憶部と、前記画像記憶部に記憶されたそれぞれの前記画像から、前記人物の特徴を示す特徴データを計算する画像認識部と、前記画像認識部で計算した複数の前記特徴データを記憶する特徴データ記憶部と、前記特徴データ記憶部に記憶された複数の前記特徴データより、それぞれの組み合わせの2つの前記画像で計算される2つの前記特徴データの間の類似度(それら2つの前記特徴データが互いに類似するか否かを示す類似度)を計算する照合部と、計算される複数の前記類似度から、当該画像(第1の画像)に表れる前記特徴が、(別途)入力される、前記人物が録画された(、後で撮像される)画像に表れる前記特徴に近似である確率が、最も高い(比較的高い)確率である画像(第1の画像)の前記特徴データを特定し(それら複数の前記類似度により示される、先に撮像された複数の画像に含まれる、類似する他の画像の個数が、最も多い個数(比較的多い第1の個数)である画像(第1の画像)の特徴データ(第1の特徴データ)を特定し)、特定される前記特徴データを、前記人物が、(別途)入力される前記画像(後で撮像される画像)に写される人物と同一か否かが判定される個人認識処理において利用される登録データとして設定する制御部とを備える画像処理装置である。
【0018】
つまり、前記制御部は、当該画像との前記組み合わせで算出される前記類似度が、所定値以上の前記類似度である他の画像の個数が最も多い(比較的多い)画像(最も多い(比較的多い)ことにより、後で撮像される画像に近似である確率が、最も高い確率(比較的高い第1の確率)である(と推定される)第1の画像)の前記特徴データを、前記確率が最も高い前記画像の前記特徴データとして特定する。
【0019】
なお、つまり、例えば、予め録画された複数の画像のうちのそれぞれの画像は、住宅に来訪した人物が写された画像を、当該住宅の玄関において撮像する、当該住宅に設けられたドアホンシステムが有する撮像装置により、画像が撮像された、後の来訪時よりも1週間前の来訪時などの、先の来訪時に、当該撮像装置により撮像された、来訪した人物の画像などである。
【0020】
なお、例えば、具体的には、前記画像認識部は、記憶されたそれぞれの前記画像より、当該画像における顔領域を検出し、検出した前記顔領域から、前記人物の前記特徴を示す前記特徴データを計算し、前記制御部は、前記画像認識部を制御することで、前記画像記憶部に記憶された複数の前記画像のそれぞれに対する前記特徴データを計算させ、前記照合部を制御することで、それぞれの前記組み合わせの2つの前記画像での前記特徴データ間での前記類似度を計算させてもよい。
【0021】
本構成によって、個人認識処理における登録データとして、より適切(最適)なものを選択することができる。
【発明の効果】
【0022】
本発明の画像処理装置によれば、個人認識処理における登録データとして、より適切(最適)なものを選択することができる。
【0023】
そして、ドアホンシステムに設けられるのに適切な画像処理装置が構築できる。つまり、ひいては、このような画像処理装置が設けられた、より適切なドアホンシステムが構築できる。
【図面の簡単な説明】
【0024】
【図1】本発明の実施の形態1における画像処理装置のブロック図
【図2】本発明の実施の形態1における画像処理装置の動作を示すフロー図
【図3】本発明の実施の形態2における画像処理装置のブロック図
【図4】本発明の実施の形態2における画像処理装置の動作を示すフロー図
【図5】本発明の実施の形態1及び2のそれぞれにおける、画像処理装置への入力画像例を示す図
【図6a】本発明の実施の形態1における、複数の録画画像それぞれの顔領域から計算した特徴データ間の類似度を示す図
【図6b】本発明の実施の形態2における、複数の録画画像それぞれの顔領域から計算した特徴データ間の類似度と閾値との差分値を示す図
【図7】本発明の実施の形態3における画像処理システムのブロック図
【図8】従来の個人特徴登録装置の動作を示すフロー図
【図9】画像処理システムを示す図
【図10】画像処理装置を示す図
【図11】画像処理システムでの処理を示すフロー図
【発明を実施するための形態】
【0025】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0026】
実施の形態の画像処理装置は、同一の人物(図7、図9の人物2A)が撮像された、予め録画された複数の画像(先に撮像される複数の画像4(図1))を記憶する画像記憶部(図1、図9の画像記憶部101、図11のステップS91)と、前記画像記憶部に記憶されたそれぞれの前記画像から、(当該画像に表れた、)前記人物の特徴(特徴4x:図1)を示す特徴データ(特徴データ4D:図1)を計算する画像認識部(画像認識部102(図1、図9)、S92)と、前記画像認識部で計算した複数の前記特徴データ(図5のs[0]〜[4]、図9の特徴データ41D〜45D)を記憶する特徴データ記憶部(特徴データ記憶部103、S93)と、前記特徴データ記憶部に記憶された複数の前記特徴データ(s[0]〜[4])より、それぞれの組み合わせ(図9、図10の組み合わせ4c)の2つの前記画像(画像4a、4b)で計算される2つの前記特徴データ(図10の特徴データ4Da、4Db)の間の類似度(それら2つの前記特徴データ(の特徴)が互いに類似するか否か(画像4a、4bが互いに類似するか否か)を示す類似度4S(図1、図9)、図9の類似度群(複数の類似度)4SM))を計算する照合部(照合部104、S94)と、計算される複数の前記類似度4SMから(複数の前記類似度4SMに基づいて)、当該画像4(例えば、第1の画像42:図9)に表れる前記特徴4x(特徴42x)が、(複数の画像4の入力とは別途、予め定められた入力先(例えば画像記憶部)に)入力される、前記人物が録画された画像(複数の画像4を撮像する撮像装置703により、後で撮像される画像6(図9))に表れる前記特徴(特徴6x)に近似である確率(図9の確率107P)が、最も高い確率(大きな第1の確率107Pv)である画像(例えば第1の画像42)の前記特徴データ(第1の特徴データ42D)を特定し(複数の類似度4SMに基づいて、当該画像4(例えば第1の画像42)に類似することが示される他の画像(他の画像4F、他の画像42F(画像41、43))の個数107N(第1の個数107Nv)が、最も多い個数(比較的多い第1の個数107Nv(2個))である第1の画像42(の第1の特徴データ42D)を、最も高い確率(大きな第1の確率107Pv)の第1の画像42(の第1の特徴データ42D)と特定し)、特定される前記特徴データ(第1の特徴データ42D)を、前記人物が、(別途)入力される前記画像(後で撮像される画像6)に写される人物(人物22)と同一か否かが判定される(特定される前記特徴データにより示される特徴(特徴42x)が、後で撮像される画像(画像6)に表れる、人物(人物22)の特徴(特徴6x)に近似するか(一致するか)否かが判定される)個人認識処理(例えば、図9の認識処理部719aによる処理)において利用される登録データ(特徴データ4Du:図9)として(、予め定められた登録部(例えば、図9の登録データ記憶部103a)に)設定する制御部(制御部105、S95)とを備える(ドアホンシステム700、子機702、画像処理装置709など)。
【0027】
なお、上記された、画像6(の特徴6x)に近似する確率とは、例えば、複数のケースにおける複数の画像6のうちに占める、0以上の個数の、近似する画像6が占める割合(での確率)などをいう。
【0028】
つまり、例えば、次の動作がされる。
【0029】
すなわち、例えば、撮像された画像6(図9)に表れる、人物2Aの特徴6xが、人物2Aの特徴4xに近似であるか(一致するか)否かを判定する個人認識処理がされる前に、予め、撮像された複数の画像4(画像41〜45)が取得される(画像記憶部101、S91)。
【0030】
ここで、取得される複数の画像4のそれぞれは、住宅700h(図7)に来訪した人物2Aが写された画像6を、住宅700hの玄関700haにおいて撮像する、住宅700hに設けられたドアホンシステム700(図7)が有する撮像装置703により、画像6が撮像された、後の来訪時よりも1週間前の来訪時などの、先の来訪時に撮像された、来訪した人物2Aの画像などである。
【0031】
つまり、取得される複数の画像4は、互いに異なる、人物2Aの特徴4x(特徴41x〜45x)が表れた複数の画像4である。
【0032】
そして、取得される複数の画像4は、大きい第1の個数107Nv(例えば2個)だけの、当該第1の画像42に類似する画像42F(画像41、43)を含む第1の画像42について、当該第1の画像42に表れる第1の特徴42xが、画像6の特徴6xに、高い第1の確率107Pv(例えば、約(1+2)/5=3/5)で近似である(と推定される)ことを示す。
【0033】
そして、取得される複数の画像4は、小さい第2の個数107Nw(例えば1個)だけの、当該第2の画像44に類似する画像44F(画像45)を含む第2の画像44について、当該第2の画像44に表れる第2の特徴44xが、低い第2の確率107Pw(例えば、約(1+1)/5=2/5)で特徴6xに近似である(と推定される)ことを示す。
【0034】
なお、ここで、取得される複数の画像4に含まれる画像4は、例えば、他の画像(第1の画像42、第2の画像44)に表れる特徴4xに類似する特徴4xが表れる場合に、当該他の画像(第1の画像42等)に類似すると呼ばれる。
【0035】
そして、第1の画像42と、第2の画像44とが含まれる複数の画像4(例えば、画像41〜45)から、第1の画像42と、第2の画像44とがそれぞれ特定されてもよい(特定部105a(制御部105)、S95a)。
【0036】
そして、個人認識処理がされる際に、特定された第1の画像42における第1の特徴42xとの間での、一致の判定をさせ、特定された第2の画像44の第2の特徴44xとの間での、一致の判定をさせない制御がされる(登録処理部105b(制御部105)、S95b)。
【0037】
これにより、第1の特徴42xにおける高い第1の確率107Pvで、判定が成功する。つまり、低い第2の確率10Pwでしか成功しないことが回避されて、判定が成功する確率107Pが、高くできる。
【0038】
すなわち、より具体的には、例えば、次の動作がされてもよい。
【0039】
つまり、例えば、入力される前記画像(後で撮像される画像6)は、住宅(住宅700h)の居住者(図略)が留守の間において、当該住宅に前記人物(人物2A)が来訪する、1回目の来訪時(先の来訪時)より後における、2回目の来訪時(後の来訪時)に、当該人物が当該住宅を来訪する際に、当該住宅の玄関(玄関700ha)に設けられる撮像装置(ドアホンシステム700が有する撮像装置703)により撮像される、前記人物の画像でもよい。
【0040】
そして、それぞれの、予め録画される前記画像(先に撮像される画像4)は、前記居住者が留守の間における、1回目の来訪時に、前記撮像装置により撮像される、前記人物の画像でもよい。
【0041】
そして、前記画像記憶部は、1回目の来訪時に、前記撮像装置により撮像される複数の前記画像(複数の画像4:画像41〜45)を記憶してもよい。
【0042】
そして、前記制御部は、記憶される複数の前記画像のうちのそれぞれの前記画像(例えば、第1の画像42など)について、複数の前記画像(画像41〜45)のうちで、当該画像(第1の画像42)に表れる、前記人物の特徴(第1の特徴42x)に類似する、前記人物の前記特徴(特徴41x、43x)が表れる他の前記画像(他の画像4F(他の画像42F、画像41、43))の個数(個数107N(第1の個数107Nv(2個)))を特定する特定部(図9の特定部105a)を含んでもよい。
【0043】
そして、特定される、類似する前記特徴(例えば、特徴41x、43x)が表れる他の前記画像(画像4F(画像42F:画像41、43))の前記個数(個数107N)が、大きい第1の前記個数(第1の個数107Nv)である第1の前記画像(第1の画像42)は、第1の当該画像に表れる前記特徴(第1の特徴42x)が、2回目の来訪時の前記画像(画像6)に表れる、前記人物の前記特徴(特徴6x)に近似する確率(確率107P)が、高い第1の確率(第1の確率107Pv)である画像でもよい。
【0044】
そして、少ない第2の個数(第2の個数107Nw)が特定される第2の前記画像(第2の画像44)は、表れる前記特徴(第2の特徴44x)が、2回目の来訪時の前記画像(画像6)の前記特徴(特徴6x)に近似する確率が、低い第2の確率(第2の確率107Pw)である画像でもよい。
【0045】
そして、前記制御部は、大きい第1の前記個数(第1の個数107Nv)が特定されて、(表れる特徴(第1の特徴42x)が、)高い第1の前記確率(第1の確率107Pv)で、2回目の来訪時の前記画像(画像6)(の特徴6x)に近似である第1の前記画像(第1の画像42)からの第1の前記特徴データ(第1の特徴データ42D)を(、利用される特徴データ4Duとして)設定し、小さい第2の前記個数(第2の個数107Nw)が特定される第2の前記画像(第2の画像44)からの第2の前記特徴データ(第2の特徴データ44D)を設定しない登録処理部(図9の登録処理部105b)を含んでもよい。
【0046】
そして、設定される前記特徴データは、予め定められた登録部(図9の登録データ記憶部103a)により記憶されてもよい。
【0047】
なお、この登録部は、具体的には、例えば、特徴データ記憶部103(図1、図9など)の一部などでもよい。
【0048】
そして、記憶される当該特徴データは、当該特徴データ(第1の特徴データ42D)により示される前記特徴(第1の特徴42x)が、2回目の来訪時の前記画像(画像6)での前記特徴(特徴6x)に近似する(一致する)ことが検出された場合に、2回目の来訪時の前記画像に写される人物(人物22)が、1回目の来訪時の前記人物(人物2A)と同一と判定される前記個人認識処理で(、例えば、当該住宅700hに設けられたドアホンシステム700の認識処理部719aなどにより)利用されてもよい。
【0049】
つまり、住宅700hのドアホンシステム700は、例えば、1回目の来訪時の人物2Aと同一との判定がされた場合に、複数の種類の呼び出し音のうちで、同一と判定された人物2Aに対応する呼び出し音711C(図9)を出力するスピーカ710(図7)が設けられてもよい。
【0050】
なお、このドアホンシステム700は、例えば、複数の名前のうちで、同一と判定された人物2Aの名前2AN(図9)を、表示領域714Rに表示させる表示装置714が設けられてもよい。
【0051】
これにより、高い第1の確率107Pvで判定が成功する第1の特徴データ42D(第1の特徴42x)が利用され、低い第2の確率107Pwで成功する第2の特徴データ44D(第2の特徴44x)が利用されず、確実に、判定が成功し、ひいては、確実に、適切な呼び出し音711Cの出力等ができる。
【0052】
しかも、例えば、従来より、デジタルカメラが知られる。そして、このデジタルカメラでは、適切な画像(上述の、適切な第1の画像42を参照)を撮像するタイミングを指定する、撮像ボタンの押し下げの操作がされる。
【0053】
これに対して、本技術では、適切な第1の画像42が撮像されるタイミングを指定する、このような、撮像ボタンの押し下げなどの余計な操作がされないにも関わらず、第1の個数107Nが大きいことから、この第1の個数107Nに対応する適切な第1の画像42からの第1の特徴データ42Dが利用され、確実に、判定が成功できる。これにより、確実に判定が成功できるにも関わらず、居住者(ユーザ)の操作が少なくできる。
【0054】
これにより、ひいては、適切な第1の画像42が撮像される際に、上述のように、住居700hにおいて、居住者が留守で、操作がされなくても、確実に、判定が成功できる。
【0055】
これにより、確実に、判定が成功でき、しかも、ユーザによる操作が少なくできる。
【0056】
なお、こうして、複数の類似度4SMに基づいて、当該複数の類似度4SMにより示される、類似する他の画像4F(他の画像42F、他の画像44F)の個数107N(第1の個数107Nv、第2の個数107Nw)に応じた処理がされてもよい。
【0057】
ここで、1以上の、類似する他の画像4F(例えば、他の画像42F(画像41、43))との間での、1以上の類似度4SX(図9)のうちの、最大の類似度4Sが考えられる(先述された特許文献1を参照)。
【0058】
そして、不適切な第2の画像44における、最大の類似度4Sが、比較的大きくて(例えば、図6aの第5列における「99」を参照)、第2の画像44が、先述された、特異点の画像でもよい。
【0059】
そして、このような、第2の画像44が、特異点の画像か否かなどの、他の条件に関わらず、第2の画像44の第2の個数107Nwが小さく、第1の画像42の第1の個数107Nvが大きいことから、第1の画像42が利用され、第2の画像44は利用されず、判定が成功する確率107Pが高くできる。これにより、他の条件に関わらずに、十分確実に、判定が成功できる。
【0060】
なお、先述のように、それぞれの画像4(第1の画像42、第2の画像44)は、その画像4が有する、類似する他の画像4F(他の画像42F、44F)の個数107N(第1の個数107Nv、第2の個数107Nw)に対応する確率107Pv(第1の確率107Pv、第2の確率107Pw)で、後で撮像される画像6に近似する。
【0061】
つまり、先に撮像される画像4は、当該画像4が撮像される際に、写される人物2Aがいる領域(住宅700hの玄関700ha)が、後で画像6が撮像される際に、人物2Aがいる領域と同じ領域(住宅700hの玄関700ha)である画像である。
【0062】
そして、当該画像4は、撮像される際における、撮像される人物2Aの動きが、画像6が撮像される際における、人物2Aの動き(住宅700hの玄関700haでの動き)と同じ動き(住宅700hの玄関700haでの動き)であり、異なる動き(住宅700hの玄関700ha以外での動き)ではない画像である。
【0063】
そして、この画像4は、後で撮像される画像6を撮像する撮像装置703(図7)と同じ撮像装置703により画像6が撮像される際の、撮像装置703の位置、方向等と同じ位置、方向等で撮像される画像である。
【0064】
こうして、先に撮像される、それぞれの画像4は、撮像される複数の画像4における、類似する他の画像4Fの個数107Pに対応する確率が、画像6に近似する確率107Pである(と推定される)程度に、画像6が有する属性に近い属性を有する。
【0065】
つまり、前記制御部は、当該画像(例えば画像42)との前記組み合わせで算出される前記類似度(図9の類似度4S)が、所定値(第1の閾値Th1)以上の前記類似度(図10の大きな類似度4SH)である他の画像(図9の2個の画像42F)の個数(大きな個数107Nv:2個)が最も多い画像(画像42)の前記特徴データ(特徴データ42D)を、前記確率が最も高い前記画像の前記特徴データ(特徴データ4Du)として特定する。
【0066】
なお、例えば、具体的には、前記制御部は、前記照合部で計算される前記類似度と比較するための前記所定値(第1の閾値Th1)を記憶する閾値記憶部(閾値記憶部106)と、前記画像記憶部に記憶された、予め録画された複数の前記画像から計算される、それぞれの前記組み合わせ(組み合わせ4c)での2つの前記特徴データ(図10の特徴データ4Da、4Db)からの前記類似度(4S)と、記憶された前記所定値(Th1)とを比較する比較部(比較部107)と、前記比較部での比較で、前記類似度(類似度4S)が、前記所定値よりも大きい(大きな類似度4SH)と判定される場合に、当該類似度を計算する基となった2つの前記特徴データ(特徴データ4Da、4Db)のそれぞれに対応する(、当該照合結果カウンタにより記憶される)カウント値をインクリメントする照合結果カウンタ(照合結果カウンタ108)とを備え、それぞれの、前記所定値より大きいとの判定がされた前記組み合わせ(例えば、画像42、41での組み合わせ4cなど)でのインクリメントがされた後における、当該特徴データ(特徴データ42D)に対応する、前記照合結果カウンタの前記カウント値(個数107N)が、最大(2個)となる前記特徴データ(42D)を、前記登録データとして設定してもよい。
【0067】
なお、具体的には、例えば、図6a、図6bにより示されるように、それぞれの画像4(例えば、第1の画像42(recimg[1])、第2の画像44(recimg[3])など)について、その画像4に対応する値107Vが算出されてもよい(特定部105a、S95a)。
【0068】
そして、算出される値107Vは、その値107Vの画像4が有する、類似する他の画像4Fの個数107Nが、大きい第1の個数107Nv(第1の画像42での個数107N)である場合には、第1の値107Vvで、小さい第2の個数107Nw(第2の画像44での個数107N)である場合には、第2の値107Vwでもよい。
【0069】
なお、算出される値107Vは、個数107Nの値そのもの(2個、3個など:図6aを参照)でもよい。つまり、例えば、算出される値107Vは、上述された、それぞれのインクリメントの後における、その値107Vのカウント値でもよい。
【0070】
そして、算出される値107Vが、第1の値107Vvである場合には、その値107Vの画像4(第1の画像42、recimg[1])が利用され、第2の値107Vwである場合には、その値107Vの画像4(第2の画像44、recimg[3])が利用されなくてもよい(登録処理部105b、S95b)。
【0071】
そして、これにより、計算される複数の前記類似度から(算出される第1の値107Vvおよび第2の値107Vwに基づいて)、当該画像(画像4)に表れる前記特徴が、(別途)入力される、前記人物が録画された画像(画像6)に表れる前記特徴(特徴6x)に近似である確率が、最も高い確率(第1の確率107Pv)である画像(第1の画像42)の前記特徴データ(第1の特徴データ42D)として、第1の値107Vvが算出された第1の画像42における第1の特徴データ42Dが特定され、第2の値107Vwが算出された第2の画像44からの第2の特徴データ44Dが特定されなくてもよい。
【0072】
なお、例えば、具体的には、図6bで示されるように、算出される値107Vは、あるケース(代表的なケース(例えば、図6bの表で示されるケースなど))でのみ、上述されたような、個数107N(第1の個数107Nv、第2の個数107Nw)に対応する値(値107Vの内容:第1の値107Vvまたは第2の値107Vw)を有し、別のケース(例外的なケース)では、対応する値でなく、対応しない値を有してもよい。
【0073】
つまり、これにより、例外的なケースでも適切な処理がされて、より確実に、適切な処理がされてもよい。
【0074】
なお、図6bにおける処理がされる際には、例えば、図3で示されるように、減算部307および照合結果カウンタ308等が設けられて、差分値(差分値107d:図6b)の処理がされてもよい。
【0075】
なお、具体的には、こうして、個数107Nに対応する値107Vが算出されることにより、算出される値107V(第1の値107Vv、第2の値107Vw)に対応する個数107N(第1の個数107Nv、第2の個数107Nw)が、その値107Vの画像4における、類似する他の画像4F(他の画像42F、44F)の個数107Nとして特定されて、特定される個数107Nに対応する動作がされてもよい。
【0076】
なお、例えば、前記画像認識部は、記憶されたそれぞれの前記画像(画像4)より、当該画像における顔領域(図1の顔領域4r)を検出し、検出した前記顔領域から、前記人物の前記特徴(特徴4x)を示す前記特徴データ(特徴データ4D)を計算し、前記制御部は、前記画像認識部を制御することで、前記画像記憶部に記憶された複数の前記画像(図9の画像41〜45)のそれぞれに対する前記特徴データ(特徴データ41D〜45D)を計算させ、前記照合部を制御することで、それぞれの前記組み合わせ(組み合わせ4c)の2つの前記画像(画像4a、4b)での前記特徴データ(特徴データ4Da、4Db)の間での前記類似度(類似度4S)を計算させてもよい。
【0077】
以下、詳しく説明される。
【0078】
(実施の形態1)
図1は、本発明の実施の形態1における画像処理装置100のブロック図である。
【0079】
図1に示すように、画像処理装置100は、画像記憶部101、画像認識部102、特徴データ記憶部103、照合部104、制御部105を備える。
【0080】
また、制御部105は、閾値記憶部106、比較部107、照合結果カウンタ108を備える。
【0081】
画像記憶部101は、図示しない撮像装置で撮像されて、予め録画された、同じ人物Aの複数の画像(画像4)を記憶する。本実施の形態では、記憶する、予め録画された画像の数を、例えば、5つとする(図5等を参照)。
【0082】
画像認識部102は、画像記憶部101に記憶された画像(例えば画像4)より、顔領域(顔領域4r)を検出し、検出した顔領域から、個人の特徴を示す特徴データ(特徴データ4D)を計算する。
【0083】
なお、ここで、画像から顔領域を検出する方法としては、例えば、パターンマッチングを利用した方法などの、公知の適当な方法を使用すればよい。また、検出した顔領域から、特徴データを計算する方法も、公知の適当な方法でもよい。例えば、特徴データとして、目や鼻や口といった、顔の各パーツの位置や、それらの位置の間の位置関係の情報を用いるなどして、公知の適当な、特徴データ及びその計算方法が使用されてもよい。
【0084】
特徴データ記憶部103は、画像認識部102で計算された特徴データを記憶する。
【0085】
照合部104は、特徴データ記憶部103に記憶された2以上の特徴データに含まれる、2つの特徴データ(図10の特徴データ4Da、4Dbを参照)の間の類似度(類似度4S)を計算する。ここで、計算される類似度は、計算がされた組み合わせ(組み合わせ4c:図10)における2つの特徴データの間の相関値を示すもので、相関値が大きい方が、類似度が高く、相関値が小さい方が、類似度が低いとする。
【0086】
閾値記憶部106は、照合部104で計算される類似度と比較するための第1の閾値Th1(後述のように例えば70)を記憶する。
【0087】
なお、ここで、第1の閾値は、類似度、すなわち、2つの特徴データの間の相関値と比較できる次元の値とし、予め設定されているものとする。
【0088】
比較部107は、画像記憶部101に記憶された、予め録画された複数の画像(図5、図9の画像41〜45を参照)のうちのそれぞれの画像に対して計算される各特徴データ(図9の特徴データ41D〜45Dを参照)における、それぞれの組み合わせ(組み合わせ4c)での2つの特徴データ(特徴データ4Da、4Db)の間の類似度(類似度4S)と、記憶された、上述の第1の閾値とを比較する。
【0089】
照合結果カウンタ108は、比較部107での比較で、類似度が、第1の閾値よりも大きいと判定される場合に(図10の大きな類似度4SHを参照)、その類似度を計算する対象となった組み合わせ(組み合わせ4cH)の2つの特徴データに対応するカウント値(初期値は0)を、それぞれインクリメントする。
【0090】
なお、説明の便宜上、一方の画像4a(画像4)との間での類似度4Sが、第1の閾値Th1よりも大きな類似度4SHである他方の画像4bH(画像4)は、一方の画像4の仲間の画像と呼ばれ、第1の閾値Th1よりも小さい(第1の閾値Th1以下の)類似度4SLである他方の画像4bL(画像4)は、仲間でない画像と呼ばれる。
【0091】
また、このような、一方の画像4aの仲間である他方の画像4bHは、一方の画像4aに類似すると呼ばれ、仲間でない他方の画像4bLは、類似しないと呼ばれる。
【0092】
なお、例えば、こうして、一方の画像4aと、他方の画像4bとの間の類似度4Sが算出されることにより、算出される類似度4Sが、大きな類似度4SHの場合には、他方の画像4bが、仲間の画像4bHであることが判定され、小さな類似度4SLの場合には、仲間でない画像4bLと判定されてもよい。
【0093】
制御部105は、照合結果カウンタ108のカウント値(図9の個数107N)が最大(比較的大きな第1の個数107Nv)となる特徴データ(特徴データ42D)を、照合をする人物A(先述)の特徴を示す登録データ(特徴データ4Duを参照)として設定する。
【0094】
つまり、例えば、複数の特徴データ4Dのうちから、その特徴データ(例えば特徴データ42D)との間で、高い類似度4SH(図9)が算出される、仲間の特徴データ4D(2個の画像42Fの特徴データ41D、43D)の個数(大きな第1の個数107Nv:2個)が最も多い特徴データ4D(特徴データ42D)が特定されてもよい。
【0095】
そして、ここで、こうして設定される登録データ(特徴データ4Du)は、人物A(先述)の特徴を示す。そして、別途、入力される画像(図9の画像6を参照)に含まれる顔領域(図1の顔領域4rを参照)から計算した特徴データと、予め設定された当該登録データ(特徴データ4Du)とを照合することにより、入力画像(画像6)内の個人を認識する個人認識処理がされる。この個人認識処理において、照合(利用)する登録データとして、上述の、登録データの設定がされる。
【0096】
図2は、本発明の実施の形態1における画像処理装置100の動作を示すフロー図(フローチャート)である。
【0097】
まず、ステップS200において、照合結果カウンタ108(図1)のカウント値count[n](n=0,1,・・,4)を、n=0、1、・・、4について、それぞれ、0に初期化する。
【0098】
この後、ステップS201からステップS206において、画像記憶部101に記憶された各録画画像recimg[n](n=0,1,・・,4:図5)に対する、顔領域4rの検出、及び、顔領域からの、特徴データ(s[0]〜s[4])の計算を行う。
【0099】
まず、ステップS201において、ステップS202からステップS206まで(ステップS202R)におけるループ処理を、画像記憶部101に記憶された録画画像数(5つ、n=0,1,・・,4)分の回数のループ処理となるように、ステップS202Rの処理の繰り返しの回数をセットする。
【0100】
次に、ステップS202において、画像認識部102により、画像記憶部101に記憶された録画画像recimg[n]から、顔領域を検出し、検出した顔領域から、特徴データs[n]を計算する。
【0101】
次に、ステップS203において、ステップS202における、顔領域の検出で、正しく検出ができたかどうかを判定する。そして、この判定の結果が、肯定的の場合には(S203:Y)、ステップS204へ、否定的の場合には(S203:N)、ステップS205へそれぞれ遷移する。なお、すなわち、例えば、録画画像の中に、顔の一部若しくは全部が含まれていないなど、顔領域が検出できない場合があり、その場合には、処理をスキップする(S203:N)。
【0102】
次に、ステップS204において、ステップS202で計算した特徴データs[n]を、特徴データ記憶部103へ記憶する。
【0103】
また、ステップS205においては、ステップS202で顔領域が検出できず、特徴データも計算されていないために、特徴データs[n]を、空(null)として、特徴データ記憶部103へ記憶する。
【0104】
次に、ステップS206において、ステップS201でセットされた録画画像数(5つ、n=0,1,・・,4)分のループ処理が完了した場合には、ループ処理を抜け、ステップS206へ遷移し、完了していない場合には、ループ先頭へ遷移する。
【0105】
なお、例えば、あるケースでは、ステップS202において、recimg[0]〜[4]の何れの画像での処理でも、顔領域の検出が成功して、ステップS203において、何れの画像での処理でも、検出が成功したとの判定がされてもよい(ステップS203:Y)。
【0106】
こうして、S201〜S206において、それぞれの録画画像(recimg[0]〜[4])の特徴データ(s[0]〜[4])が計算されてもよい。
【0107】
この後、ステップS207からステップS214において、計算済みの、画像記憶部101に記憶された各録画画像に対する特徴データs[n](n=0,1,・・,4)からの、それぞれの組み合わせ(組み合わせ4c)での2つの特徴データ4Da、4Db間での類似度を計算する(S210)。
【0108】
また、計算されたそれぞれの類似度が、第1の閾値より大きい場合(S211:Y)の、その類似度が計算された特徴データ(組み合わせ4cHにおける2つの特徴データ4Dのそれぞれ)の、上述された、カウントの処理(カウント値のインクリメントの処理)(S212)を行う。
【0109】
まず、ステップS207において、ステップS208からステップS214まで(ステップS208R)のループ処理が、画像記憶部101に記憶された録画画像数(5つ、n=0,1,・・,4)分の回数でのループ処理となるように、ステップS208Rの処理が繰り返される、繰り返しの回数をセットする。
【0110】
次に、ステップS208において、ステップS209からステップS212まで(ステップS209R)のループ処理が、(画像記憶部101に記憶された録画画像数(5つ)−(n+1))分の回数でのループ処理となるように、繰り返しの回数をセットする。
【0111】
なお、ここで、この「(画像記憶部101に記憶された録画画像数(5つ)−(n+1))」の値は、具体的には次の通りである。つまり、この値は、n=0の時には4(m=1,2,3,4)であり(図6aの表(第1段)の第2行を参照)、n=1の時には3(m=2,3,4)であり(第3行)、n=2の時には、2(m=3,4)であり(第4行)、n=3の時には1(m=4)である(第5行)。
【0112】
つまり、例えば、ステップS209Rの処理が、互いに異なる2つの特徴データ4Da、4Db(s[m]、s[n])の組み合わせ4cのそれぞれについて行われてもよい。
【0113】
次に、ステップS209において、類似度を計算する対象の2つの特徴データ、つまり、特徴データs[n]とs[m]との何れも、空(null)でないか(特徴データs[n]が空でなく、かつ、特徴データs[m]も空でないとの条件が成立するか)を判定する。そして、判定の結果が、肯定的の場合には(S209:Y)、ステップS210へ遷移し、否定的の場合には(S209:N)、ステップS213へ遷移する。
【0114】
なお、例えば、あるケースでは、何れの組み合わせ4c(s[m]、s[n])における、ステップS209の処理でも、2つの特徴データs[m]、s[n]の何れも空でないとの判定がされてもよい(ステップS209:Y)。
【0115】
次に、ステップS210において、照合部104により、特徴データ記憶部103に記憶された、特徴データs[n]と、s[m]との間での類似度trecを計算する。
【0116】
次に、ステップS211において、ステップS210で計算された類似度trecが、第1の閾値Th1よりも大きいかどうかを判定し、結果が肯定的の場合には(S211:Y)、ステップS212へ遷移し、否定的の場合には(S211:N)、ステップS213へ遷移する。
【0117】
次に、ステップS212において、第1の閾値Th1よりも大きい類似度trec(S211:Y)を計算する対象となった組み合わせ4cにおける特徴データs[n]及びs[m]に対応するそれぞれのカウント値(count[n]及びcount[m])をインクリメントする。
【0118】
次に、ステップS213において、ステップS208でセットされた(録画画像数(5つ)−(n+1))分の回数のループ処理が完了した場合には、ループ処理を抜け、ステップS214へ遷移し、完了していない場合には、ループ先頭へ遷移する。
【0119】
次に、ステップS214において、ステップS207でセットされた録画画像数(5つ、n=0,1,・・,4)分の回数のループ処理が完了した場合には、ループ処理を抜け、ステップS215へ遷移し、完了していない場合には、ループ先頭へ遷移する。
【0120】
こうして、例えば、S207〜S214において、それぞれの組み合わせ4cについて、その組み合わせ4cでの類似度4Sが計算されてもよい。そして、計算されたそれぞれの類似度4Sについて、その類似度4Sが、第1の閾値Th1よりも高い類似度4SHか、低い類似度4SLかが判定されてもよい。
【0121】
この後、ステップS215からステップS220において、照合結果カウンタ108のカウント値(図9における個数107N)が、最大のカウント値(大きな第1の個数107Nv)である特徴データを、人物Aの特徴を示す登録データ(特徴データ4Du)として設定する。ここで、人物Aは、別途入力される画像(図9の画像6)に含まれる顔領域から計算した特徴データと、予め設定された、上記の登録データとを照合することで、入力画像(画像6)内の個人を認識する個人認識処理において、照合をする人物である。そして、上述の設定では、この人物Aの特徴を示す登録データとして、上述された、最大のカウント値を有する特徴データを設定する。
【0122】
まず、ステップS215において、照合結果カウンタ108の最大カウント値を保持するパラメータmax、及び、最大カウント値を示すインデックス値を保持するパラメータmaxnを、それぞれ、−MAX_VAL(maxが取り得る最小値)、及び、0で初期化する。
【0123】
次に、ステップS216において、ステップS217からステップS219まで(ステップS217R)のループ処理が、画像記憶部101に記憶された録画画像数(5つ、n=0,1,・・,4)分の回数のループ処理となるように、繰り返しの回数をセットする。
【0124】
次に、ステップS217において、照合結果カウンタ108のカウント値count[n]が、パラメータmaxよりも大きいかどうかを判定し、結果が肯定的の場合には(S217:Y)、ステップS218へ遷移し、否定的の場合には(S217:N)、ステップS219へ遷移する。
【0125】
次に、ステップS218において、パラメータmaxへ、照合結果カウンタ108のカウント値count[n]をセットすると共に、パラメータmaxnへ、カウント値count[n]のインデックス値nをセットする。
【0126】
次に、ステップS219において、ステップS216でセットされた録画画像数(5つ、n=0,1,・・,4)分のループ処理が完了した場合には、ループ処理を抜け、ステップS220へ遷移し、完了していない場合には、ループ先頭へ遷移する。
【0127】
次に、ステップS220において、照合結果カウンタ108のカウント値が最大となる特徴データを、個人認識処理において照合する人物Aの特徴を示す登録データsrefとして設定する。すなわち、登録データsrefとして設定される特徴データ(特徴データ4Du)は、次のような画像から計算される特徴データs[maxn]である。つまり、その画像とは、画像記憶部101に記憶された録画画像の中で、当該録画画像(画像42)との間で、第1の閾値Th1よりも大きい類似度が算出される他の録画画像(画像42F:画像41、43)の個数が、最も多い個数(第1の個数107Nv)である画像である。
【0128】
ここで、図5、及び、図6aを用いて、登録データが設定される過程を、より具体的に説明する。
【0129】
図5は、画像記憶部101に記憶された複数の録画画像recimg[n](n=0,1,・・,4)、及び、各録画画像から検出された顔領域4rを示す図である。
【0130】
図5に示すように、recimg[3]とrecimg[4]とは、顔向き等を含め、非常に、顔領域の状態が類似している。また、recimg[0]〜recimg[2]の、それぞれの組み合わせの2つの録画画像の間も、顔向きが、若干異なるが、ある程度類似している。但し、recimg[0]〜recimg[2]のそれぞれと、recimg[3]及びrecimg[4]のそれぞれとの間では、顔向きも大きく異なり、類似性は低い。
【0131】
図6aは、画像記憶部101に記憶された、複数の録画画像recimg[n](n=0,1,・・,4)のそれぞれ(縦軸、横軸)の顔領域から計算した、2つの特徴データの間の類似度を示す。
【0132】
つまり、それぞれの行(例えば、第3行のrecimg[1])における、それぞれの列(例えば、第3行の第5列)のデータ(25)は、その行の録画画像(recimg[1])の特徴データ(s[1])と、その列の録画画像(recimg[3])の特徴データ(s[3])との間の類似度を示す。
【0133】
なお、図6aの表における括弧書きに示されるように、第V行第W列(例えば、第5行第3列)の類似度は(V>W)、例えば、第W行第V列(例えば第3行第5列)の類似度と同じでもよい。
【0134】
図6aに示すように、recimg[3]とrecimg[4]との間の類似度が、最も高い(99)。また、recimg[0]〜recimg[2]のそれぞれの間の類似度(例えば、recimg[0]とrecimg[1]との間の80など)も、ある程度高い(60〜80)。
【0135】
一方、recimg[0]〜recimg[2]それぞれと、recimg[3]及びrecimg[4]の間の類似度(例えば、recimg[0]とrecimg[3]との間での20など)は低い(20〜30)。
【0136】
このように、recimg[3]とrecimg[4]との間の類似度などの、斜め線によるハッチングが付された4個の類似度600aは、ハッチングなしの、その他の6個の類似度600bよりも高い。
【0137】
そして、先述のように、第1の閾値Th1は、例えば70である。そして、例えば、これらの、6個の高い類似度600aのうちで、recimg[0]とrecimg[2]との間の類似度600a2(60)は、この第1の閾値Th1(70)よりも小さく、他の3個の類似度600a1は、70よりも大きい。
【0138】
よって、第1の閾値Th1が、70であった場合には、照合結果カウンタ108のカウント値count[n](n=0,1,・・,4)については、図6aの第2段に示されるように、count[0]=1+0+0+0=1個、count[1]=1+1+0+0=2個、count[2]=0+1+0+0=1個、count[3]=0+0+0+1個、count[4]=0+0+0+1個となる。
【0139】
なお、つまり、recimg[0]〜[4]が有する、仲間の画像の個数は、1個、2個、1個、1個、1個である。
【0140】
つまり、カウント値が最大となるのは、n=1のときである。よって画像記憶部101に記憶された複数の録画画像recimg[n](n=0,1,・・,4)の中で、n=1であるrecimg[1]の顔領域から計算された特徴データを、個人認識処理において照合する人物Aの特徴を示す登録データとして設定する。
【0141】
ここで、recimg[0]〜[4]の撮像がされた、1回目の来訪時に来訪した人物Aと同じ人物(ここでは人物A)が、1回目の来訪時よりも後の2回目の来訪時(先述された、画像6(図9)の撮像時)において、再び来訪した時が考えられる。
【0142】
この時に、図示しない撮像装置(図7の撮像装置703を参照)で撮像される画像について、次の通りであることが多い。
【0143】
つまり、初回撮像時(個人認識処理用登録データを設定する基準となる、複数の録画画像recimg[0]〜[4]を記憶する時)の画像4(recimg[0]〜[4])に対して、再撮像時(入力画像(画像6)に対して、設定した登録データ(特徴データ4Du)を用いて、個人認識処理を行う時)の画像(画像6)が、次のような画像であることが多い。つまり、再撮像時の画像(画像6)は、初回撮像時の画像(画像4)に対して、撮像装置前での挙動に関する、個人の癖なども関係して、全体的に、類似性の高い画像であることが多い。
【0144】
つまり、例えば、初回撮像時(1回目の来訪時)における複数の画像4(recimg[0]〜[4])のうちで、比較的大きな第1の個数107Nv(2個)だけの、仲間の他の画像42F(図9、2個)を有するが第1の画像42は、再撮像時(2回目の来訪時)における画像6に対して、類似し易いと推定される。
【0145】
つまり、第1の画像42が利用された際に、画像6の個人認識処理で、認識に成功する確率107Pは、比較的高い第1の確率107Pvであると推定される。
【0146】
そして、比較的小さい個数107Nwだけ、仲間の他の画像44Fを有する第2の画像44は、画像6に対して、類似し難いと推定される。
【0147】
つまり、第2の画像44が利用された際での確率107Pは、比較的低い第2の確率107Pwと推定される。
【0148】
このため、複数の録画画像(recimg[0]〜[4])の中で、当該録画画像との間で、所定値より大きい類似度が計算される他の画像(仲間の画像)4Fの個数(個数107N)が、最も多い個数(大きい第1の個数107Nv)である録画画像(第1の画像42、recimg[1])を選択することが好ましい。つまり、選択される当該画像(第1の画像42)からの特徴データ(第1の特徴データ42D、s[1])を登録データとすることで、再来訪時の、多くの入力画像(画像6)に対して、類似度が高くなる可能性が高く、良好な認識率を得ることができる。
【0149】
なお、recimg[1]の仲間の画像の個数は、図6aの第3段により示されるように、2個である。このため、仲間であるか、又は、同一である画像の個数は、recimg[1]自身の1個分を加えた、2+1=3個である(第4段)。
【0150】
他方、ここで、初回撮像時の画像(recimg[0]〜[4])の個数は、5個である。
【0151】
つまり、再撮像時の画像6が、このrecimg[1]に対して類似する(近似である、一致する)第1の確率107Pvは、大雑把には、3/5と推定される(第4段)。
【0152】
なお、図6aでは、第2段において、仲間の画像の個数(1個、2個、1個、1個、1個)が示されるのと共に、第3段において、仲間の画像の個数に1が加えられた、同一か、又は、仲間である画像の個数(2個、3個、2個、2個、2個)が示され、第4段では、推定される、再撮像時の画像6が、類似する画像である確率107Pが示される。
【0153】
以上のように、本実施の形態によれば、画像記憶部、画像認識部、特徴データ記憶部、照合部、制御部(閾値記憶部、比較部、照合結果カウンタ)を設ける。そして、制御部により、画像記憶部に記憶された録画画像(recimg[0]〜[4])の中で、その録画画像との間で、第1の閾値Th1よりも大きい類似度が計算される他の画像(仲間の画像)が、最も多く存在する録画画像(recimg[1])から計算された特徴データ(s[1])が特定される。そして、特定された、仲間の画像の個数が最も多い画像からの特徴データ(s[1])を、個人認識処理において照合する人物の特徴を示す登録データとして設定する。このことで、個人認識処理における認識率を向上することが可能となる。
【0154】
なお、本実施の形態において、画像記憶部101に記憶する、予め録画された画像の数を、5つとしたが、それ以外の数(但し3つ以上)としても、同様の効果が得られる。
【0155】
また、本実施の形態においての説明では、画像記憶部101に記憶する、予め録画された画像や、登録データの設定について、一人の人物(人物A)を対象とした説明としたが、複数の人物を対象とした構成としても、同様の効果が得られる。その場合には、画像記憶部101に記憶する、予め録画する画像用の領域や、特徴データ記憶部103に記憶する特徴データ、登録データ用の領域を、複数人分確保するように変更すれば良い。
【0156】
また、本実施の形態において、閾値記憶部106に記憶する第1の閾値Th1を、予め設定するものとした。一方、別途、設定値を設定して、設定された設定値を第1の閾値Th1として利用させる設定部を設けてもよい。こうして、設定値を可変とするようにしても、同様の効果が得られる。
【0157】
また、本実施の形態において、照合結果カウンタ108のカウント値が最大となる、一つの特徴データを、登録データとして設定した。一方、カウント値が大きい順に、複数の特徴データを、それぞれ、登録データとして設定してもよい。そして、個人認識処理では、設定された複数の登録データのうちの全ての登録データでの照合をするようにしても、同様の効果が得られる。
【0158】
また、本実施の形態においての動作は、画像記憶部101に記憶する、予め録画された画像それぞれに、一人の人物(人物A)だけが含まれることを前提とした動作とした。一方、このようではなくて、複数の人物が含まれる場合にも、同様の効果が得られる。その場合には、例えば、図2に示す動作において、録画画像や録画画像数を単位とした処理を、録画画像から検出された、顔領域や顔領域数を単位とする処理に変更すれば良い。
【0159】
また、本実施の形態において、個人認識処理において照合する人物の特徴を示す登録データとして、顔領域から計算した特徴データを使用した。一方、それ以外でも、画像から抽出可能な何らかの身体的特徴(指紋、虹彩等)や、行動的特徴(筆跡等)を使用しても、同様の効果が得られる。
【0160】
なお、上述のようにして、例えば、画像4から、画像4のなかの顔領域4rが検出されてもよい。
【0161】
一方で、顔領域4rの検出はされなくてもよい。
【0162】
具体的には、例えば、画像4(recimg[0]〜[4])は、より大きい画像に含まれる、より大きい画像の一部でもよい。そして、より大きい画像が撮像されることにより、画像4の撮像がされてもよい。
【0163】
そして、例えば、画像4は、より大きい画像から予め検出された顔領域の画像でもよい。
【0164】
例えば、このため、画像4の全体が顔領域4rで、画像4からの、顔領域4rの検出はされなくてもよい。
【0165】
(実施の形態2)
実施の形態2の画像処理装置は、前記制御部は、前記照合部で計算される前記類似度と比較するための前記所定値(第1の閾値Th1:図1)を記憶する閾値記憶部(閾値記憶部106)と、前記画像記憶部に記憶された、予め録画された複数の前記画像(画像41〜45)から計算される、それぞれの前記組み合わせでの2つの前記特徴データ(特徴データ4Da、4Db)からの前記類似度(類似度4S)と、記憶された前記所定値との間の差分値(図6bの差分値107d)を計算する減算部(図3の減算部307)と、前記減算部で計算した前記差分値を、当該差分値が計算された前記類似度を計算する基となった前記組み合わせの2つの前記特徴データ(特徴データ4Da、4Db)のそれぞれに対応するカウント値に加算する照合結果カウンタ(照合結果カウンタ308)とを備え、それぞれの前記組み合わせでの前記差分値(107d)について、可算がされた後における、前記照合結果カウンタの前記カウント値(値107V)が最大(図6bの値107Vv)となる前記特徴データ(特徴データ42D)を、前記登録データとして設定してもよい。
【0166】
つまり、それぞれの可算がされた後におけるカウント値は、例えば、そのカウント値に対応する(特徴データ4Dの)画像4に対応する値107V(先述:図6b)でもよい。
【0167】
そして、先述のように、あるケースにおいて、次の通りでもよい。
【0168】
つまり、算出される値107V(カウント値)の画像4が、先述の第1の画像42(recimg[1])であるときに、その値107Vが、第1の値107Vvで、第2の画像44(recimg[3])であるときに、第2の値107Vwでもよい(図6bで示されるケース)。
【0169】
そして、これにより、第1の値107Vvが算出された第1の画像42が利用され、第2の値107Vwが算出された第2の画像44が利用されなくてもよい(実施の形態1を参照)。
【0170】
そして、別のケース(例外的なケース、図略)では、第1の画像42(recimg[1])の値107Vとして、第2の値107Vwが算出され、第2の画像44(recimg[3]の値107Vとして、第1の値107Vvが算出されてもよい。
【0171】
そして、これにより、第1の画像42の第1の個数107Nvが大きく、第2の画像44の第2の個数107Nwが小さいにも関わらず、第1の画像42が利用されず、第2の画像44が利用されてもよい。
【0172】
これにより、例外的なケースでも、適切な処理がされて、より確実に、適切な処理がされてもよい。
【0173】
なお、このような処理における、より詳細な点は、例えば、以下の処理と同じ処理などである。
【0174】
図3は、本発明の実施の形態2における画像処理装置300のブロック図である。
【0175】
図3において、図1と同じ構成要素については同じ符号を用い、適宜、説明を省略する。
【0176】
図3に示すように、画像処理装置300は、画像記憶部101、画像認識部102、特徴データ記憶部103、照合部104、制御部305を備える。
【0177】
画像記憶部101、画像認識部102、特徴データ記憶部103、照合部104については、例えば、実施の形態1と同様である。
【0178】
また、制御部305は、閾値記憶部106、減算部307、照合結果カウンタ308を備える。
【0179】
閾値記憶部106については、例えば、実施の形態1と同様である。
【0180】
減算部307は、画像記憶部101に記憶された、予め録画された複数の画像のうちのそれぞれの画像(画像4)に対して計算される、各特徴データ間の類似度と、第1の閾値との間の差分値(図6bの差分値107d)を計算する。
【0181】
照合結果カウンタ308は、減算部307で計算した差分値を、当該差分値が計算される基となった類似度を計算する対象となった2つの特徴データのそれぞれに対応するカウント値(初期値は0)に加算する。
【0182】
制御部305は、照合結果カウンタ308のカウント値(差分値107d)が最大となる特徴データを、人物Aの特徴を示す登録データとして設定する。ここで、人物Aは、別途入力される画像に含まれる顔領域から計算した特徴データと、予め設定された登録データとを照合することで、入力画像内の個人を認識する個人認識処理において照合する人物である。
【0183】
図4は、本発明の実施の形態2における画像処理装置300の動作を示すフロー図である。
【0184】
図4において、図2での処理ステップと、同じ処理ステップについては、同じ符号を用い、重複した説明を適宜、省略する。
【0185】
ステップS200からステップS210までの処理については、例えば、実施の形態1と同様である。
【0186】
次に、ステップS411において、ステップS210で計算された類似度trecと、第1の閾値Th1との間における差分値diffを計算する。
【0187】
次に、ステップS412において、類似度trecを計算する対象となった特徴データs[n]、及び、s[m]に対応するカウント値count[n]、及び、count[m]に、それぞれ、ステップS411で計算した差分値diffを加算する。
【0188】
ステップS213からステップS220までについては、例えば、実施の形態1と同様である。
【0189】
ここで、図5及び図6bを用いて、登録データが設定される過程を、より具体的に説明する。
【0190】
図5は、実施の形態1の説明の通りである。
【0191】
図6bは、画像記憶部101に記憶された、複数の録画画像recimg[n](n=0,1,・・,4)のうちのそれぞれ(縦軸、横軸)から計算した、2つの特徴データ間の類似度と、第1の閾値とのの間の差分値(「類似度−第1の閾値」:差分値107d)を示す。
【0192】
なお、第1の閾値は、実施の形態1と同様に、例えば、70とする。
【0193】
図6bに示すように、recimg[3]と、recimg[4]との間での数値が、最も高い(30)。また、recimg[0]〜recimg[2]の、それぞれ組み合わせでの2つの録画画像の間での数値も、ある程度高い(−10〜10)。一方、recimg[0]〜recimg[2]のそれぞれと、recimg[3]及びrecimg[4]のそれぞれとの間の数値は低い(−50〜−40)。
【0194】
この場合の、照合結果カウンタ108のカウント値は、図6bの下部に示されるように、count[0]=−100(10+(−10)+(−50)+(−50))、count[1]=−70(10+10+(−45)+(−45))、count[2]=−80((−10)+10+(−40)+(−40))、count[3]=−105((−50)+(−45)+(−40)+30)、count[4]=−105((−50)+(−45)+(−40)+30)となる。なお、図6bの下部では、模式的な図示がされる。
【0195】
つまり、カウント値が最大となるのは、n=1のとき(カウント値=−70)である。
【0196】
よって、画像記憶部101に記憶された、複数の録画画像recimg[n](n=0,1,・・,4)の中から、recimg[1]の顔領域から計算された特徴データ(s[1])を、個人認識処理において照合する人物Aの特徴を示す登録データとして設定する。
【0197】
以上のように、本実施の形態によれば、画像記憶部、画像認識部、特徴データ記憶部、照合部、制御部(閾値記憶部、減算部、照合結果カウンタ)を設ける。そして、制御部により、画像記憶部に記憶された録画画像の中で、他の画像に対する類似度(差分値107d)の合計(評価値107V:図6b)が最も大きい画像(図6bにおけるrecimg[1])から計算された特徴データ(s[1])が特定される。そして、特定された特徴データを、個人認識処理において照合する人物の特徴を示す登録データとして設定する。このことで、個人認識処理における認識率を、向上することが可能となる。
【0198】
なお、本実施の形態において、画像記憶部101に記憶する、予め録画された複数の画像のうちのそれぞれの画像から計算した特徴データの間の類似度と、第1の閾値との間の差分値の合計が、最大となる特徴データを、登録データとした。
【0199】
一方、類似度そのものの合計が、最大となる特徴データを、登録データとしても、同様の効果が得られる。
【0200】
但し、こうした処理がされず、先述のように、差分値の処理がされて、差分値の合計が算出されてもよい。すなわち、こうして、差分値の合計が算出され、類似度をそのまま合計しないならば、照合結果カウンタ108のカウント値(サイズ)が大きくなってしまうことが回避できる。この点に着目するならば、差分値の処理がされて、第1の閾値の設定値に応じた処理がされる、先述の構成とするのが、より好ましい。
【0201】
(実施の形態3)
図7は、本発明の実施の形態3における画像処理システム700のブロック図である。
【0202】
図7に示すように、画像処理システム(ドアホンシステム)700は、カメラ子機701、親機702を備える。
【0203】
また、カメラ子機701は、撮像装置703、マイク704、スピーカー705、呼び出し釦706、カメラ子機IF部707を備える。
【0204】
また、親機702は、親機IF部708、画像処理装置709、マイク710、スピーカー711、応答釦712、登録釦713、表示装置714を備える。
【0205】
また、画像処理装置709は、画像記憶部715、画像認識部716、特徴データ記憶部717、照合部718、制御部719を備える。
【0206】
また、制御部719は、閾値記憶部720、比較部721、照合結果カウンタ722を備える。
【0207】
例えば、カメラ子機701は、住宅700hの宅外(例えば、玄関700ha等)に、また、親機702は宅内700hbに設置され、住宅へ来訪者(例えば、人物2A)が来訪した時に、居住者(宅内)が、来訪者(玄関先等)を、画像並びに音声で確認したり、居住者と来訪者との間での通話を実現する。
【0208】
つまり、画像処理システム700は、例えば、ドアホンのシステムなどである。
【0209】
撮像装置703は、来訪者の顔を含む画像を撮像する。
【0210】
マイク704は、来訪者の音声を集音する。
【0211】
スピーカー705は、親機702のマイク710で集音された、居住者の音声を拡声することで、来訪者と居住者との間での通話を可能とする。
【0212】
呼び出し釦706は、来訪者が、当該呼び出し釦706を押すことで、親機702のスピーカー711から、呼び出し音が出力され、居住者へ来訪が通知される釦である。
【0213】
カメラ子機IF部707は、撮像装置703、マイク704、スピーカー705、呼び出し釦706と、親機IF部708との間での、画像、音声、信号の通信や、例えば撮像装置703などの各制御対象の制御を行う。
【0214】
親機IF部708は、カメラ子機IF部707、画像処理装置709、マイク710、スピーカー711、応答釦712、登録釦713、表示部(表示装置)714の間での、画像、音声、信号の通信や、例えばカメラ子機IF部707などの各制御対象の制御を行う。
【0215】
画像記憶部715は、撮像装置703で撮像された画像(例えば画像6)、並びに、撮像装置703で撮像されて、予め録画された、同じ人物Aの複数の画像(例えば画像4)を記憶する。本実施の形態では、記憶する、予め録画された画像の数を、例えば5つとする。
【0216】
画像認識部716は、画像記憶部715に記憶された画像より顔領域を検出し、検出した顔領域から、個人の特徴を示す特徴データを計算する。
【0217】
なお、ここで、画像から顔領域を検出する方法は、例えば、パターンマッチングを利用したものなど、公知の適当な方法を使用すればよい。また、検出した顔領域から、特徴データを計算する方法は、例えば、特徴データとして、目や鼻や口といった顔の各パーツの位置や、それらの位置の間の位置関係の情報を用いるなど、こちらも、公知の適当な、特徴データ及びその計算方法を使用すればよい。
【0218】
特徴データ記憶部717は、画像認識部716で計算された特徴データを記憶する。
【0219】
照合部718は、特徴データ記憶部717に記憶された特徴データより、2つの特徴データ間の類似度を計算する。ここで類似度は、2つの特徴データ間の相関値を示すもので、相関値が大きい方が、類似度が高く、相関値が小さい方が、類似度が低いとする。
【0220】
閾値記憶部720は、照合部718で計算される類似度と比較するための、第1の閾値Th1及び第2の閾値Th2(図1の2点鎖線での図示を参照)をそれぞれ記憶する。
【0221】
なお、ここで、例えば、第1の閾値及び第2の閾値のそれぞれは、類似度、すなわち、特徴データ間の相関値と比較できる次元の値とし、予め設定されているものとする。
【0222】
比較部721は、画像記憶部715に記憶された、予め録画された複数の画像のうちのそれぞれの画像に対して計算される、それぞれの組み合わせの2つの特徴データ間の類似度と、第1の閾値とを比較する。
【0223】
照合結果カウンタ722は、比較部721での比較で、類似度が、第1の閾値よりも大きいと判定された場合に、その類似度を計算する対象となった2つの特徴データのそれぞれに対応するカウント値(初期値は0)を、インクリメントする。
【0224】
制御部719は、登録データ設定時(居住者が登録釦713を押した時)には、照合結果カウンタ722のカウント値が最大となる特徴データ(例えば第1の特徴データ42)を、個人認識処理において照合する人物A(人物2A)の特徴を示す登録データとして設定する。
【0225】
ここで、個人認識処理は、別途、撮像装置703で撮像され、入力される画像(画像6)に含まれる顔領域から計算した特徴データと、予め設定された当該登録データとを照合することで、入力画像内の個人を認識する処理(画像6に写された人物22が、人物2Aであることを判定する処理)である。
【0226】
そして、制御部719は、個人認識処理時(居住者により、前記操作で、個人認識処理用登録データが設定された状態で、来訪者が、呼び出し釦706を押すことで、撮像装置703により撮像され、入力される画像(画像6)内の個人を認識する時)には、画像記憶部715に記憶された、撮像装置703からの入力画像に対する特徴データと、予め設定された登録データとの間の類似度を計算し、計算された類似度が、第2の閾値Th2以上であれば、その入力画像内の個人は、登録された前記人物と同一の人物であると判定する。
【0227】
マイク710は、居住者の音声を集音する。
【0228】
スピーカー711は、カメラ子機701のマイク704で集音された、来訪者の音声を拡声することで、居住者と、来訪者との間での通話を可能とし、また、呼び出し釦706が押された時に、呼び出し音を出力することで、居住者へ、来訪者の来訪を通知する。
【0229】
応答釦712は、居住者が、その釦を押すことで、マイク710で集音された音声が、カメラ子機701のスピーカー705で拡声され、居住者と来訪者との間での通話ができる状態になる釦である。
【0230】
登録釦713は、居住者が、その釦を押すことで、画像処理装置709において、画像記憶部715に予め録画された画像から、個人認識処理で照合する登録データが設定される釦である。
【0231】
表示部714は、撮像装置703で撮像された画像等を表示する。
【0232】
なお、表示部714は、表示パネルなどの、表示がされる表示領域714Rを含んでもよい。そして、例えば、表示領域714Rにおいて、2回目の来訪時に撮像される画像6が表示されると共に、さらに、上述の判定で、同一と認識された人物(先述の人物A)の情報(名前2AN)が表示されてもよい。なお、例えば、2回目の来訪時までに、同一と認識された人物の名前2ANの文字列のデータが、ユーザにより入力されてもよい。
【0233】
以下、本実施の形態で示す画像処理システム700の動作の流れを説明する。
【0234】
まず、来訪者(人物Aとする)が、画像処理システム700を設置した住宅を来訪し、呼び出し釦706を押す。
【0235】
すると、撮像装置703により、来訪者の顔を含む画像が撮像開始される(撮像された画像は、表示部714での表示や、画像処理装置709での個人認識処理のために、画像記憶部715に一時的に記憶される)。
【0236】
そして、このような、撮像の開始がされるのと共に、スピーカー711から、呼び出し音が出力され、また、表示部714に、開始された撮影で撮像された画像が表示される。
【0237】
また、同時に、撮像装置703で、撮像された複数の画像を、別途所定の時間間隔で、画像記憶部715に録画する。
【0238】
そして、録画が完了したら、表示部714に、録画された録画画像が記憶されていることを示すマークを表示する。
【0239】
なお、本実施の形態では、例えば、上記された所定の時間間隔を、1秒間隔とし、また、記憶する、予め録画された画像の数を、5つ(recimg[n](n=0,1,・・,4))とする。
【0240】
なお、ここでは、個人認識用の登録データが設定されていないため、撮像装置703で撮像された画像に対する個人認識処理は実行されない。
【0241】
次に、スピーカー711から、呼び出し音が出力されたことで、居住者(在宅の場合)が、応答釦712を押して、マイク710、スピーカー711、マイク704、スピーカー705を介して、来訪者と通話し、対応する。
【0242】
次に、居住者は、表示部714に表示されている録画画像が記憶されていることを示すマーク(上述)を確認し、先の来訪者(人物A:図7、図9等の人物2A)を、個人認識対象として、登録データを設定する場合には、登録釦713を押す。
【0243】
登録釦713が押されると、画像処理装置709において、画像記憶部715に録画された複数の画像(recimg[n](n=0,1,・・,4))から、登録データsrefを設定する。ここでの、画像処理装置709での動作については、例えば、実施の形態1で説明した動作と同じでよいため、ここでの説明では、重複する説明を適宜、省略する。
【0244】
次に、来訪者(人物A)が、再度来訪し、呼び出し釦706を押すと、前記と同じ動作を行う。
【0245】
合わせて、画像処理装置709において、画像記憶部715に記憶された撮像装置703からの入力画像(画像6)に対する、個人認識処理を実行する。以下、より具体的に説明する。
【0246】
まず、画像認識部716において、画像記憶部715に記憶された入力画像inpimgより、顔領域を検出し、検出した顔領域から、個人の特徴(図9の特徴6x)を示す特徴データsinpを計算し、計算された特徴データsinpを、特徴データ記憶部717に記憶する。
【0247】
なお、ここで、画像から顔領域を検出する方法は、例えば、パターンマッチングを利用したものなど、公知の適当な方法を使用すればよい。また、検出した顔領域から、特徴データを計算する方法は、例えば、特徴データとして、目や鼻や口といった、顔の各パーツの位置や、それらの位置の間の位置関係の情報を用いるなどして、こちらも公知の適当な特徴データ及びその計算方法を使用すればよい。
【0248】
次に、照合部718において、特徴データ記憶部717に記憶された登録データsrefと、特徴データsinpとの間の類似度tinpを計算する。
【0249】
次に、制御部719(例えば、図9の認識処理部719a)において、照合部718で計算された類似度tinpと、閾値記憶部720に記憶された第2の閾値Th2とを比較し、類似度tinpが、第2の閾値Th2以上であれば、入力画像内の個人は、登録された人物Aと同一であると判定する。
【0250】
ここで、同じ人物(ここでは人物A)が来訪した時に、撮像装置703で撮像される画像について、初回の来訪時(個人認識処理用登録データを設定する基準となる、複数の録画画像を記憶する時)での画像に対して、再来訪時(入力画像に対し、設定した登録データを用いて、個人認識処理を行う時)での画像は、カメラ子機701前での挙動に関する、個人の癖なども関係して、全体的に、類似性が高いものになることが多い。そのため、複数の録画画像の中で、所定値より大きい類似度を持つ他の画像が、最も多く存在する画像を選択し、登録データとすることで、再来訪時の、多くの入力画像に対しても、類似度が高くなる可能性が高く、良好な認識率を得ることができる。
【0251】
以上のように、本実施の形態によれば、画像記憶部、画像認識部、特徴データ記憶部、照合部、制御部(閾値記憶部、比較部、照合結果カウンタ)を設け、制御部により、画像記憶部に記憶された録画画像の中で、第1の閾値より大きい類似度を持つ画像が、最も多く存在する画像から計算された特徴データを、個人認識処理において照合する人物の特徴を示す登録データとして設定することで、個人認識処理における認識率を向上することが可能となる。
【0252】
なお、本実施の形態において、画像記憶部715への、複数の撮像画像の録画について、直前の1回での来訪においての画像が残る(その前の録画画像は、上書きされる)構成での説明となっている。一方、複数回の来訪に対する画像が、過去の録画画像が上書きされることなく、個別に録画されるようにしても良い。つまり、例えば、互いに異なる来訪での画像が、互いに異なる記憶領域に記憶されてもよい。
【0253】
また、本実施の形態において、画像記憶部715への、複数の撮像画像の録画が完了した時に、表示部714にマークを表示するようにしている。一方、録画した画像の一つを縮小したサムネイル画像を表示するようにしても良い。そして、複数回の来訪に対する録画に対応する場合には、表示部714に、それぞれの来訪時のサムネイル画像を並べて表示するようにして、その中から、個人認識用の登録データとして設定する対象を、居住者に選択させるような構成にしても良い。
【0254】
また、本実施の形態においては、居住者が、登録釦713を押すことで、画像処理装置709において、画像記憶部715に予め録画された画像から、個人認識処理で照合する登録データを設定する。一方、このように、設定がされる時に、設定される登録データを計算する基となった画像を、表示部(表示装置)714に表示し、居住者に、登録確認を行う構成としても良い。
【0255】
なお、こうして、例えば、画像処理装置100は、画像記憶部101と、画像認識部102と、特徴データ記憶部103と、照合部104と、制御部105とを備え、予め録画された複数の画像(画像41〜45)のうちに、当該画像(第1の画像42)との間で、所定値以上の類似度が計算される他の画像(画像42F)が、最も多く存在する画像(第1の画像42)の特徴データ(特徴データ42D)を、個人認識処理において照合する登録データ(42Du)として設定してもよい。
【0256】
こうして、例えば、次の動作がされてもよい。なお、次の動作も、単なる一例である。また、次の動作は、例えば、ある局面でのみ行われてもよい。
【0257】
つまり、住宅700h(図7)に、人物2Aが来訪してもよい。
【0258】
そして、撮像装置703により、来訪する人物2Aの画像703Iが撮像されてもよい。
【0259】
なお、例えば、撮像される画像703Iが、表示装置714により、表示装置714の表示領域714Rに表示されてもよい(図7の表示領域714Rに示される画像6を参照)。
【0260】
つまり、住宅700hにおいて、この撮像装置703が含まれる、ドアホンのシステムなどである画像処理システム(ドアホンシステム)700が設けられてもよい。
【0261】
そして、住宅700hに、人物2Aが、2回目の来訪時(再撮像時、後の来訪時)に来訪するよりも前に、1回目の来訪時(初回撮像時、先の来訪時)においても、来訪してもよい。
【0262】
そして、1回目の来訪時に、人物2Aの写された画像4(図1等)が撮像されてもよい。
【0263】
そして、撮像される画像4において、写される人物2Aの特徴4x(図1)が表れてもよい。
【0264】
なお、具体的には、例えば、特徴4xは、画像4のうちの顔領域4rに表れる特徴でもよい。
【0265】
ここで、デジタルカメラなどの、従来の、画像が撮像される撮像装置では、多くのケースにおいて、例えば、デジタルカメラの撮像ボタンが押されて、撮像がされるタイミング指定されるなどして、撮像の行われるタイミングがユーザにより指定される。つまり、これにより、複数のタイミングでの複数の画像のうちで、ユーザにより指定されるタイミングでの適切な画像が撮像される。
【0266】
これに対して、本画像処理システム700において、画像4の撮像される1回目の来訪時は、例えば、住宅700hの居住者(ドアホンシステム700のユーザ)が留守の間などでもよい。このため、ユーザが不在で、ユーザによりタイミングが指定されることが不可能である。
【0267】
また、そもそも、留守でなくても、画像4が撮像される、1回目の来訪時の期間中においては、ユーザが、来訪する人物2Aと通話するなどしており、通話以外の行為をする余裕が少ない。
【0268】
そこで、例えば、画像4は、例えば、ユーザにより指定されたタイミングで撮像された画像ではない画像でもよい。
【0269】
そして、このような1回目の来訪時に、複数の画像4(図9、図5の画像41〜45、recimg[0]〜[4])が撮像されてもよい。
【0270】
そして、画像認識部102により、それら複数の画像4のうちのそれぞれの画像4から、その画像4の特徴4x(図1)を示す特徴データ4D(図1、図9の特徴データ41D〜45D)が算出されてもよい。
【0271】
そして、それら複数の画像4のうちの、それぞれの画像4a(図10)について、次の処理がされてもよい。
【0272】
つまり、照合部104により、それぞれの画像4aの特徴データ4Daと、他の画像4bの特徴データ4Dbとの間の類似度4S(図10、図1)が算出されてもよい。
【0273】
そして、比較部107により、算出される類似度4Sが、第1の閾値Th1(図1)よりも大きい類似度4SH(図10)であるか、第1の閾値Th1よりも小さい(第1の閾値Th1以下である)類似度4SLであるかが判定されてもよい。
【0274】
つまり、これにより、大きい類似度4SHと判定される場合に、特徴データ4Daに対して、特徴データ4Dbが類似することが判定され、つまり、画像4aに表れる特徴4axに対して、画像4bに表れる特徴4bxが類似することが判定されてもよい。
【0275】
そして、これにより、逆に、小さい類似度4SLと判定される場合に、特徴データ4Da(特徴4ax)に対して、特徴データ4Db(特徴4bx)が類似しないことが判定されてもよい。
【0276】
なお、ここで、特徴4bxが特徴4axに類似する場合には、これら特徴4bx、特徴4axに着目して、画像4bが、画像4aに類似すると呼ばれる。また、特徴4bxが特徴4axに類似しない場合には、画像4bが、画像4aに類似しないと呼ばれる。
【0277】
つまり、こうして、画像4bが、画像4aに類似するか否かの判定がされてもよい。
【0278】
そして、それぞれの画像4a(図9、図10:例えば、図9の第1の画像42)について、1回目の来訪時の複数の画像4に含まれる、その画像4aに類似する他の画像4F(図9:他の画像42F(画像41、43))の個数107N(図9:第1の個数107Nv(2個))が算出されてもよい(図11のS95aを参照)。
【0279】
なお、この算出は、例えば制御部105により行われてもよく、より具体的には、例えば、特定部105a(図9)により行われてもよい。なお、この特定部105aは、例えば、比較部107の一部などでもよい。
【0280】
なお、この算出のために、先述の照合結果カウンタ108が、上述の特定部105a等により利用されてもよい。
【0281】
そして、複数の画像4(例えば、図9における第1の画像42、第2の画像44)は、算出される、類似する他の画像4Fの個数107N(図9)が、大きい(最大の)第1の個数107Nvである第1の画像42と(2個の、他の画像42Fを参照)、小さい第2の個数107Nwである第2の画像44とを含んでもよい(1個の、他の画像44Fを参照)。
【0282】
一方で、2回目の来訪時に、来訪する人物2Aの画像6(図9)が撮像されてもよい。
【0283】
そして、先述のように、第1の画像42は、類似する他の画像42Fを、大きな第1の個数107Nvだけ有する。このため、この第1の画像42が、2回目の来訪時の画像6に類似する(近似である、一致する)確率107Pは、高い第1の確率107Pvであると推定されてもよい。
【0284】
そして、同様に、先述のように、第2の画像44は、類似する他の画像44Fを、小さな第2の個数107Nwだけ有するので、この第2の画像44が、画像6に類似する(近似である、一致する)確率107Pは、低い第2の確率107Pwと推定されてもよい。
【0285】
つまり、大きな第1の個数107Nvが算出されることにより、算出された大きな第1の個数107Nvだけの、類似する他の画像42Fを有する画像4(第1の画像42)が、高い第1の確率107Pvで、画像6に類似する(近似である、一致する)画像と特定されてもよい。
【0286】
そして、小さな第2の個数107Nwが算出されることにより、算出がされた画像4(第2の画像44)が、低い第2の確率107Pwで、画像6に類似する(近似である、一致する)画像と特定されてもよい。
【0287】
なお、例えば、先述のように、画像4が撮像される1回目の来訪時における、玄関700ha(図7)での、人物2Aの挙動は、例えば、2回目の来訪時における、挙動と同じ挙動、又は、近い挙動などであることが多いと考えられる。
【0288】
そして、大きな(最大の)第1の個数107Nv(2個)が算出された第1の画像42の第1の特徴42xを示す第1の特徴データ42Dが、利用される特徴データ4Du(図9:登録データ)として選択され、小さな第2の個数107Nw(1個)が算出された第2の画像44が、利用される特徴データ4Duとして選択されなくてもよい(図11のS95bを参照)。
【0289】
なお、この選択は、例えば、登録処理部105b(図9)により行われてもよい。なお、登録処理部105bは、例えば、比較部107の一部などでもよい。
【0290】
ここで、選択された特徴データ4Duは、当該特徴データ4Duにより示される特徴4x(図1)に対して、2回目の来訪時の画像6の特徴6xが近似(一致する)する場合に、画像6に写される人物22(図9)が、人物2A(と同一である)と判定され、近似しない場合に、人物2A(と同一)でないと判定される個人認識処理に利用されてもよい。
【0291】
ここで、近似するとは、例えば、特徴4xの予め定められた近傍の範囲に、他方の特徴6xが含まれることなどをいう。
【0292】
なお、例えば、こうして、個人認識処理で、画像6の人物22が、人物2A(人物21)と同一と判定されることにより、人物22が、人物2Aと認識されて、認識に成功する一方で、同一でないとの判定がされることにより、人物2Aでないと認識されて、認識に失敗してもよい。
【0293】
なお、この個人認識処理は、例えば、例えば、認識処理部719a(図7、図9)により行われてもよい。この認識処理部719aは、例えば、図7、図9に示されるように、画像処理装置100(例えば制御部105)の一部などでもよい。
【0294】
そして、さらに具体的には、例えば、選択される特徴データ4Duを記憶する(登録される(設定される))登録データ記憶部103a(図9)があってもよい。そして、例えば、登録データ記憶部103aは、画像処理装置(例えば特徴データ記憶部103)の一部などでもよい(図9を参照)。
【0295】
そして、例えば、画像6の人物22が、人物2Aと同一との判定がされた場合に、複数の種類の呼び出し音のうちで、同一と判定された人物2Aが来訪したことを示す、人物2Aに対応する呼び出し音711C(図9、図7)が、スピーカー711(図7)により出力されてもよい。なお、呼び出し音711Cは、例えば、いわゆるチャイムでもよい。
【0296】
また、例えば、同一との判定がされた場合に、複数の情報(例えば、複数の名前など)のうちで、同一と判定された人物2Aの情報(人物2Aの名前2AN(図7、図9)、住所、前回の来訪時(例えば1回目の来訪時)の情報(来訪の日時など))が、表示装置714(図7)により、当該表示装置714の表示領域714Rに表示されてもよい。
【0297】
これにより、ユーザ(住宅700hの居住者)が留守などで、ユーザにより、画像4が撮像されるタイミングが指定されないにも関わらず、高い第1の確率107Pvで画像6に近似して、高い第1の確率107Pvで同一との判定がされる第1の特徴データ41Dが利用され、低い第2の確率107Pwで同一との判定がされる第2の特徴データ44Dが利用されるのが回避される。
【0298】
つまり、これにより、高い第1の確率107Pvで、人物2Aの呼び出し音711Cの出力などの、来訪する人物2Aに対応する適切な動作がされ、低い第2の確率107Pwで、適切な動作がされることが回避される。
【0299】
これにより、より確実に、人物2Aの呼び出し音711Cの出力などの適切な動作ができる。
【0300】
こうして、複数の構成(例えば、画像記憶部101、登録処理部105bなど)が組み合わせられて、組み合わせからの相乗効果が生じる。これに対して、知られた従来例では、それらの複数の構成のうちの全部または一部を欠き、相乗効果は生じない。この点で、本技術は、従来例とは相違する。
【0301】
なお、上述の複数の機能が実装された集積回路100L(図9)が構築されてもよい。なお、ここで、この集積回路100Lは、例えば、図9に示されるように、少なくとも、画像認識部102と、照合部104と、制御部105との機能を備えてもよい。なお、集積回路100Lは、さらに他の機能(例えば、画像記憶部101の機能の全部または一部など)を備えてもよい。
【0302】
また、上述の複数の工程が含まれる方法が構築されてもよいし、上述の複数の機能をコンピュータに実行させるためのコンピュータプログラムが構築されてもいし、このコンピュータプログラムを通信する方法、このコンピュータプログラムのデータのデータ構造などが構築されてもよい。
【0303】
また、複数の実施形態における、複数の事項などの、互いに離れた箇所に記載される複数の事項が、適宜組み合わせられてもよい。それら複数の事項の記載により、組み合わせられた形態が開示される。
【0304】
また、単なる細部については、例えば、単に、公知の技術が利用されただけの形態が採られてもよいし、更なる改良発明が加えられた形態などが採られてもよい。
【0305】
また、単なる細部については、上述の説明の通りにされてもよいし、その他の形態にされてもよい。
【産業上の利用可能性】
【0306】
本発明にかかる画像処理装置は、カメラで撮影した画像に含まれる顔領域から計算した特徴データと、予め設定された登録データとを照合することで、画像内の個人を認識する個人認識処理を行うカメラシステム、及び、その応用分野において利用できる。
【符号の説明】
【0307】
100、300、709 画像処理装置
101、715 画像記憶部
102、716 画像認識部
103、717 特徴データ記憶部
104、718 照合部
105、305、719 制御部
106、720 閾値記憶部
107、721 比較部
108、308、722 照合結果カウンタ
307 減算部
600 類似度
700 画像処理システム
701 カメラ子機
702 親機
703 撮像装置
704、710 マイク
705、711 スピーカー
706 呼び出し釦
707 カメラ子機IF部
708 親機IF部
712 応答釦
713 登録釦
714 表示装置

【特許請求の範囲】
【請求項1】
同一の人物が撮像された、予め録画された複数の画像を記憶する画像記憶部と、
前記画像記憶部に記憶されたそれぞれの前記画像から、前記人物の特徴を示す特徴データを計算する画像認識部と、
前記画像認識部で計算した複数の前記特徴データを記憶する特徴データ記憶部と、
前記特徴データ記憶部に記憶された複数の前記特徴データより、それぞれの組み合わせの2つの前記画像で計算される2つの前記特徴データの間の類似度を計算する照合部と、
計算される複数の前記類似度から、当該画像に表れる前記特徴が、入力される、前記人物が録画された画像に表れる前記特徴に近似である確率が、最も高い確率である画像の前記特徴データを特定し、
特定される前記特徴データを、前記人物が、入力される前記画像に写される人物と同一か否かが判定される個人認識処理において利用される登録データとして設定する制御部とを備える画像処理装置。
【請求項2】
前記制御部は、当該画像との前記組み合わせで算出される前記類似度が、所定値以上の前記類似度である他の画像の個数が最も多い画像の前記特徴データを、前記確率が最も高い前記画像の前記特徴データとして特定する請求項1記載の画像処理装置。
【請求項3】
前記制御部は、
前記照合部で計算される前記類似度と比較するための前記所定値を記憶する閾値記憶部と、
前記画像記憶部に記憶された、予め録画された複数の前記画像から計算される、それぞれの前記組み合わせでの2つの前記特徴データからの前記類似度と、記憶された前記所定値とを比較する比較部と、
前記比較部での比較で、前記類似度が、前記所定値よりも大きいと判定される場合に、当該類似度を計算する基となった2つの前記特徴データのそれぞれに対応するカウント値をインクリメントする照合結果カウンタとを備え、
それぞれの、前記所定値より大きいとの判定がされた前記組み合わせでのインクリメントがされた後における、当該特徴データに対応する、前記照合結果カウンタの前記カウント値が、最大となる前記特徴データを、前記登録データとして設定する請求項2記載の画像処理装置。
【請求項4】
前記制御部は、
前記照合部で計算される前記類似度と比較するための前記所定値を記憶する閾値記憶部と、
前記画像記憶部に記憶された、予め録画された複数の前記画像から計算される、それぞれの前記組み合わせでの2つの前記特徴データからの前記類似度と、記憶された前記所定値との間の差分値を計算する減算部と、
前記減算部で計算した前記差分値を、当該差分値が計算された前記類似度を計算する基となった2つの前記特徴データのそれぞれに対応するカウント値に加算する照合結果カウンタとを備え、
それぞれの前記組み合わせでの前記差分値についての可算がされた後における、当該特徴データに対応する、前記照合結果カウンタの前記カウント値が、最大となる前記特徴データを、前記登録データとして設定する請求項1記載の画像処理装置。
【請求項5】
前記画像認識部は、記憶されたそれぞれの前記画像より、当該画像における顔領域を検出し、検出した前記顔領域から、前記人物の前記特徴を示す前記特徴データを計算し、
前記制御部は、前記画像認識部を制御することで、前記画像記憶部に記憶された複数の前記画像のそれぞれに対する前記特徴データを計算させ、前記照合部を制御することで、それぞれの前記組み合わせの2つの前記画像での前記特徴データの間での前記類似度を計算させる請求項1記載の画像処理装置。
【請求項6】
来訪者を撮像する撮像装置を備えたカメラ子機と、
請求項1記載の画像処理装置を備えた親機とを備え、
前記画像処理装置の前記制御部は、前記撮像装置で撮像された、入力される前記画像に対する個人認識処理を行い、当該個人認識処理をする際に、予め定められた登録部に設定された前記登録データを利用し、
前記画像記憶部は、前記撮像装置で撮像された、入力される前記画像と、同一の前記人物の予め録画された複数の前記画像とを記憶し、
前記制御部は、前記個人認識処理を行う時に、前記画像記憶部に記憶された、入力された前記画像に対する前記特徴データを計算し、計算されたその特徴データと、予め設定された前記登録データである前記特徴データとの間の前記類似度を計算して、計算された当該類似度が第2の所定値以上の類似度であれば、入力された前記画像内の個人は、前記登録データの設定がされた際における、記憶された複数の前記画像に撮像された前記人物と同一であると判定する画像処理システム。
【請求項7】
入力される前記画像は、住宅の居住者が留守の間において、当該住宅に人物が来訪する、1回目の来訪時より後における、2回目の来訪時に、当該人物が当該住宅を来訪する際に、当該住宅の玄関に設けられる撮像装置により撮像される、前記人物の画像であり、
それぞれの、予め録画される前記画像は、前記居住者が留守の間における、1回目の来訪時に、前記撮像装置により撮像される、前記人物の画像であり、
前記画像記憶部は、1回目の来訪時に、前記撮像装置により撮像される複数の前記画像を記憶し、
前記制御部は、記憶される複数の前記画像のうちのそれぞれの前記画像について、複数の前記画像のうちで、当該画像に表れる、前記人物の特徴に類似する、前記人物の前記特徴が表れる他の前記画像の個数を特定する特定部を含み、
特定される、類似する前記特徴が表れる他の前記画像の前記個数が、大きい第1の前記個数である第1の前記画像は、第1の当該画像に表れる前記特徴が、2回目の来訪時の前記画像に表れる、前記人物の前記特徴に近似する確率が、高い第1の確率である画像であり、
少ない第2の前記個数が特定される第2の前記画像は、表れる前記特徴が、2回目の来訪時の前記画像の前記特徴に近似する確率が、低い第2の確率である画像である請求項1記載の画像処理装置。
【請求項8】
前記制御部は、大きい第1の前記個数が特定されて、高い第1の前記確率で、2回目の来訪時の前記画像に近似である第1の前記画像からの第1の前記特徴データを設定し、小さい第2の前記個数が特定される第2の前記画像からの第2の前記特徴データを設定しない登録処理部を含み、
設定される前記特徴データは、予め定められた登録部により記憶され、
記憶される当該特徴データは、当該特徴データにより示される前記特徴が、2回目の来訪時の前記画像での前記特徴に近似することが検出された場合に、2回目の来訪時の前記画像に写される人物が、1回目の来訪時の前記人物と同一と判定される前記個人認識処理で利用される請求項7記載の画像処理装置。
【請求項9】
同一の人物が撮像された、予め録画された複数の画像を記憶する画像記憶工程と、
前記画像記憶工程で記憶されたそれぞれの前記画像から、前記人物の特徴を示す特徴データを計算する画像認識工程と、
前記画像認識工程で計算した複数の前記特徴データを記憶する特徴データ記憶工程と、
前記特徴データ記憶工程で記憶された複数の前記特徴データより、それぞれの組み合わせの2つの前記画像で計算される2つの前記特徴データの間の類似度を計算する照合工程と、
計算される複数の前記類似度から、当該画像に表れる前記特徴が、入力される、前記人物が録画された画像に表れる前記特徴に近似である確率が、最も高い確率である画像の前記特徴データを特定し、
特定される前記特徴データを、前記人物が、入力される前記画像に写される人物と同一か否かが判定される個人認識処理において利用される登録データとして設定する制御工程とを含む画像処理方法。
【請求項10】
同一の人物が撮像された、予め録画された複数の画像を記憶する画像記憶部に記憶されたそれぞれの前記画像から、前記人物の特徴を示す特徴データを計算する画像認識部と、
前記画像認識部で計算した複数の前記特徴データを記憶する特徴データ記憶部に記憶された複数の前記特徴データより、それぞれの組み合わせの2つの前記画像で計算される2つの前記特徴データの間の類似度を計算する照合部と、
計算される複数の前記類似度から、当該画像に表れる前記特徴が、入力される、前記人物が録画された画像に表れる前記特徴に近似である確率が、最も高い確率である画像の前記特徴データを特定し、
特定される前記特徴データを、前記人物が、入力される前記画像に写される人物と同一か否かが判定される個人認識処理において利用される登録データとして設定する制御部とを備える集積回路。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6a】
image rotate

【図6b】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2012−38085(P2012−38085A)
【公開日】平成24年2月23日(2012.2.23)
【国際特許分類】
【出願番号】特願2010−177616(P2010−177616)
【出願日】平成22年8月6日(2010.8.6)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】