説明

容姿判定装置、容姿判定プログラムおよびそれを記録した記録媒体

【課題】人物の撮影画像のデータから各部の特徴を表す表現を設定するためのルール(関数)を所望の種類だけ用意する。
【解決手段】撮影された人物の画像から顔などの各部の特徴を数値化したデータ(特徴データ)を容姿特徴データベース8に蓄えておく。また、人物の容姿(丸顔、色黒等)の特徴を表す容姿言葉を、特徴データと対応する容姿言葉を判定するための基準値とともに容姿判定データベース12に格納しておく。容姿言葉生成エンジン4は、特徴データがどの容姿言葉に結びつくか、特徴データと基準値との比較により判定し、当該特徴データと結びつく容姿言葉を統合データベース13に記録する。統合データベース13は、容姿言葉を当該人物の画像データとともに保存する。言葉登録エンジン5は、容姿判定データベース12に格納されている容姿言葉の変更、削除または追加する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人の容姿や状態を言葉にて表現することにより人の容姿や状態を容易に判定する容姿判定装置に関するものである。
【背景技術】
【0002】
従来、撮影された人物の画像(例えば顔の画像)を用いて当該人物の特徴を抽出し、その特徴を数値化することで、その特徴が予め登録されている人物の特徴と一致するか否かを判定する手法(例えば特許文献1)が知られている。このような手法は、個人認証技術として広く用いられている。
【0003】
特許文献1には、撮影した顔の画像データから顔の各部品の特徴量を決定して個人データとして顔画像データベースに登録しておき、検索時に顔部品の特徴量を入力することにより、その特徴量を有する画像データを表示することが記載されている。顔部品の特徴量は、所定のルールにしたがって、例えば、目については「細い」、「大きい」、「普通」といった特徴量が設定される。
【特許文献1】特開平11−85992号公報(1999年3月30日公開)
【発明の開示】
【発明が解決しようとする課題】
【0004】
上記の特許文献1に開示された技術では、特徴量を設定するための上記のルールが予め用意されているものと考えられる。このため、顔部品として所望の部品について特徴量を設定して登録することができない。例えば、顔部品として一般的でない、顎鬚や眉間といった特殊な顔部品の特徴量を設定するためのルールまでも標準で備えようとすると、多種類のルールを用意する必要があり、ルールを格納しておくデータベースの容量を大きくしなければならない。
【0005】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、特徴量を設定するためのルール(関数)を所望の種類だけ用意することにある。
【課題を解決するための手段】
【0006】
本発明に係る容姿判定装置は、上記課題を解決するために、撮影された人物のイメージから当該人物の各部の特徴を表すパラメータを抽出して特徴データベースに登録する特徴抽出手段と、人物の各部分の特徴を表現する特徴言葉と当該特徴言葉で表現される特徴を特定する条件とを前記パラメータが当該条件を満たすか否かを判定するための判定関数とともに登録している特徴言葉データベースと、前記特徴データベースに登録されているパラメータが特徴言葉データベースに登録された条件を満たすことを前記判定関数に基づいて判定すると、当該パラメータに対応する特徴言葉を特徴言葉データベースから抽出する特徴言葉抽出手段と、人物のイメージと抽出された特徴言葉とを対応付けて登録している対応データベースと、入力された特徴言葉とそれぞれ一致する特徴言葉を対応データベースにおいて検索し、入力された特徴言葉と一致する特徴言葉に対応するイメージを抽出するイメージ抽出手段と、新規の前記判定関数を前記特徴言葉データベースに追加すること、または前記特徴言葉データベースに登録されている前記判定関数を削除することの少なくともいずれか1つを行う判定関数加除手段とを備えていることを特徴としている。
【0007】
上記の構成では、撮影された人物のイメージから顔などの各部の特徴を表すパラメータ(数値化されたデータ)が特徴データベースに蓄えられる。一方、特徴言葉データベースには、人物の各部の特徴を表す特徴言葉(丸顔、色黒等)と、特徴言葉で表現される特徴を特定する条件とが、判定関数とともに特徴言葉データベースが格納されている。上記の条件としては、例えば「丸顔」の場合では顔の縦横サイズの比の範囲が挙げられる。
【0008】
ここで、特徴言葉抽出手段により、特徴データベースに登録されているパラメータが特徴言葉データベースに登録された条件を判定関数に基づいて満たすと判定された場合に、当該パラメータに対応する特徴言葉が特徴言葉データベースから抽出される。この抽出された特徴言葉は、対応データベースにおいて、人物のイメージと対応付けて登録される。これにより、人物のイメージにその人物を特徴付ける特徴言葉が結び付けられる。
【0009】
また、イメージ抽出手段によって、入力された特徴言葉とそれぞれ一致する特徴言葉が対応データベースにおいて検索され、入力された特徴言葉と一致する特徴言葉に対応するイメージが抽出される。これにより、容姿言葉を入力するだけで、その容姿言葉と結び付いたイメージを抽出することができる。
【0010】
また、判定関数加除手段によって、特徴言葉データベースに新たに判定関数が追加され、あるいは特徴言葉データベースから指定された判定関数が削除される。これにより、必要最小限の判定関数を特徴言葉データベースに登録することができる。
【0011】
前記容姿判定装置は、前記特徴言葉データベースに登録されている前記特徴言葉を変更する特徴言葉変更手段を備えていることが好ましい。これにより、ユーザの所望する特徴言葉を用意することができる。
【0012】
前記容姿判定装置において、前記特徴言葉データベースは、特徴言葉として際立った特徴を表現する特徴言葉を登録するとともに、撮影された人物の声のデータをイメージおよび特徴言葉とさらに対応付けて登録しており、イメージ抽出手段は、入力された特徴言葉とそれぞれ一致する特徴言葉を特徴言葉データベースにおいて検索するとともに、入力された声のデータを対応データベースにおいて検索し、入力された特徴言葉と一致する特徴言葉に対応するとともに、入力された声のデータと一致する声のデータに対応するイメージを抽出することが好ましい。
【0013】
この構成では、より印象の強い人物のイメージを抽出することができる。また、特徴言葉データベースに有名人の特徴を表す特徴言葉を格納しておけば、有名人に似た人物のイメージを容易に選別することができる。
【0014】
また、前記容姿判定装置において、前記特徴抽出手段は、時系列で撮影された人物の複数のイメージから当該人物の各部の特徴を表すパラメータをイメージ毎に抽出して前記特徴データベースに登録し、前記容姿判定装置は、さらに、人物の各部の状態の変化を特定する変化条件と当該変化条件を満たす動作状態を表現する状態言葉とを登録している状態言葉データベースと、特徴抽出手段によって抽出されたイメージ毎のパラメータが状態言葉データベースに登録されている前記変化条件を満たすと判定すると、状態言葉データベースから当該変化条件に対応する状態言葉を抽出する状態言葉抽出手段とを備えていることが好ましい。
【0015】
上記の構成では、特徴抽出手段によって、時系列で撮影された人物の複数のイメージから当該人物の各部の特徴を表すパラメータがイメージ毎に抽出され、予め特徴データベースに登録されている。一方、状態言葉データベースには、人物の各部分の状態の変化を特定する変化条件と当該変化条件を満たす動作状態を表現する状態言葉とが登録されている。例えば、部分として目を用いる場合、その変化条件としては、目の開閉や目の閉状態が挙げられる。また、それらの変化条件を果たす動作状態としては、まばたきや眠りが対応付けられる。
【0016】
ここで、状態言葉抽出手段により、抽出されたイメージ毎のパラメータが状態言葉データベースに登録されている変化条件を満たす場合、状態言葉データベースから当該変化条件に対応する状態言葉を抽出される。
【0017】
これにより、人の動きを検出することと併せて人物を認証することができる。それゆえ、写真による成り済ましの認証を拒否することができる。また、運転者の目の状態で居眠り状態を判定することや、口の状態であくびを判定することにより、運転者に警告を発するといった危険回避システムを構築することができる。
【0018】
本発明の容姿判定プログラムは、前記のいずれかの容姿判定装置の各手段としてコンピュータを機能させる。また、本発明の記録媒体は、当該容姿判定プログラムを記録したコンピュータ読み取り可能な記録媒体である。上記の容姿判定プログラムおよび記録媒体により、容姿判定装置と同様に、必要最小限の判定関数を特徴言葉データベースに登録することができる。
【発明の効果】
【0019】
本発明に係る容姿判定装置は、以上のように、新規の判定関数を特徴言葉データベースに追加すること、または前記特徴言葉データベースに登録されている前記判定関数を削除することの少なくともいずれか1つを行う判定関数加除手段を備えているので、必要最小限の判定関数を特徴言葉データベースに登録することができる。したがって、判定関数を格納するために必要な特徴言葉データベースの容量を削減することができるという効果を奏する。
【発明を実施するための最良の形態】
【0020】
本発明の一実施形態について図1ないし図9に基づいて説明すると、以下の通りである。
【0021】
図1に示すように、本実施形態に係る容姿判定システム1は、コンピュータ装置によって構成されており、CPU、メモリ(RAM、ROMなど)、外部記憶装置(ハードディスクドライブ、MOドライブなど)、表示装置および入力装置(キーボード、マウスなど)を有している。また、容姿判定システム1は、後述する容姿判定を行うために、特徴抽出エンジン2、声紋データ検出エンジン3、容姿言葉生成エンジン4、言葉登録エンジン5、状態言葉生成エンジン6、容姿言葉検索エンジン7、容姿特徴データベース8、声紋データベース9、容姿判定データベース10、第一印象データベース11、状態判定データベース12および統合データベース13を備えている。
【0022】
特徴抽出エンジン2には、カメラ14からの人物の画像データが入力される。カメラ14は、人物の画像(イメージ)を撮影して、ビットマップ形式などの画像データとして出力する。特徴抽出エンジン2は、カメラ2から入力された画像データ(例えば顔画像データ)に基づいて人物の顔などの各部を部品としてとらえ、各部品の位置、サイズ、色などを数値化して各部品の特徴を表す特徴データ(パラメータ)として、容姿特徴データベース8に書き込む。この特徴抽出エンジン2は、従来の顔認証に用いられる特徴抽出技術を適用でき、上記の特徴データは、例えば前述の特許文献1に記載された特徴量データに相当する。
【0023】
容姿特徴データベース8は、特徴抽出エンジン2から入力された特徴データを人物の画像データとともに人物毎にまとめて管理している。また、容姿特徴データベース8は、人物毎の特徴データを、別途入力された当該人物の個人情報(氏名、年齢、所属など)とともに管理していてもよい。
【0024】
声紋データ検出エンジン3は、マイク15から入力された人物の声の音声信号に基づいて声紋データを検出して声紋データベース9に書き込む。
【0025】
容姿言葉生成エンジン4は、容姿特徴データベース8に格納されている特徴データに基づき、判定関数および容姿言葉テーブルを用いて、人物の各部の特徴を表現する容姿言葉(特徴言葉)を生成する。各種の判定関数および容姿言葉テーブルは、容姿判定データベース10に個々に対応付けられて格納されている。
【0026】
容姿言葉テーブルは、各種の容姿言葉と特徴データがその容姿言葉に該当するか否かを判定するための特徴データの基準数値範囲(判定基準最大値および判定基準最小値)、すなわち、その容姿言葉で表現される特徴を特定する条件とを対応付けて格納しており、容姿言葉のグループ毎に用意されている。例えば、顔形状についてのグループの容姿言葉としては、「丸顔」、「面長」、「細面」などが用意されており、それぞれについて判定の基準数値範囲が設定されている。
【0027】
判定関数としては、単純容姿判定関数と複合容姿判定関数とが用意されている。単純容姿判定関数は、特徴データが容姿言葉に対応するか否か、すなわち特徴データが上記の条件を満たすか否かを判定するための関数であり、特徴データが容姿言葉テーブルに格納された基準数値範囲内の値であると判定すると、その基準数値範囲内の該当する容姿言葉を抽出する。複合容姿判定関数は、後述する統合データベースに格納されている判定用の複数の容姿言葉に基づいて他の容姿言葉を抽出するための関数であり、複数の判定用の容姿言葉に対応付けられた他の容姿言葉のうち一致した容姿言葉を容姿言葉テーブルから抽出する。
【0028】
容姿言葉生成エンジン4は、図2に示すように、単純容姿判定関数実行部41と複合容姿判定関数実行部42とを有している。
【0029】
単純容姿判定関数実行部41は、容姿判定データベース10から単純容姿判定用の判定関数(単純容姿判定関数)をロードして当該判定関数を実行し、その結果抽出した容姿言葉を容姿言葉データとして統合データベース13に格納する。また、単純容姿判定関数実行部41は、その容姿言葉に対応する特徴データの基になる顔画像データを容姿特徴データベース8から取り出すとともに、当該顔画像データに対応する声紋データを声紋データベース9から取り出して、容姿言葉データと関連付けて(対応付けて)統合データベース13に書き込む。統合データベース13においては、同一人物に関する容姿言葉データ、顔画像データおよび声紋データとで形成される統合データという形態で各データが管理されている。
【0030】
複合容姿判定関数実行部42は、容姿判定データベース10から複合容姿判定用の判定関数(複合容姿判定関数)をロードして当該判定関数を実行し、その結果抽出した容姿言葉を容姿言葉データとして上記と同様にして統合データベース13に格納する。
【0031】
顔画面データおよび声紋データには、人物のカメラ14による撮影時およびマイク15による集音時に特徴抽出エンジン2および声紋データ検出エンジン3によってそれぞれIDが付与されている。単純容姿判定関数実行部41および複合容姿判定関数実行部42は、そのIDに基づいて顔画面データおよび声紋データを同一人物のデータとしてそれぞれ容姿特徴データベース8および声紋データベース9から取り出す。
【0032】
また、容姿言葉生成エンジン4は、第一印象判定データベース11に格納されている判定関数および容姿言葉テーブルを用いて、容姿判定データベース10の判定関数および容姿言葉テーブルを用いた場合と同様に容姿言葉を抽出するが、特に、第一印象として残り易い、人物の際立った特徴を表す容姿言葉を抽出する。
【0033】
第一印象判定データベース11における容姿言葉テーブルは、「大きい目」、「えら」といった、初対面のときに第一印象として残り易い容姿言葉を格納している。
【0034】
状態言葉生成エンジン6は、容姿特徴データベース8に格納されている特徴データに基づき、判定関数および状態言葉テーブルを用いて、人の状態(動作や表情)を表現する状態言葉(特徴言葉)を生成する。状態言葉を判定するための各種の判定関数および状態言葉テーブルは、状態判定データベース12に個々に対応付けられて格納されている。
【0035】
状態言葉テーブルは、各種の状態言葉と特徴データがその容姿言葉に該当するか否かを判定するための特徴データの変化条件とを対応付けて格納しており、状態言葉のグループ毎に用意されている。例えば、目の状態のグループの容姿言葉としては、「眠り」、「まばたき」などが用意されており、それぞれについて判定の変化条件が設定されている。例えば、「まばたき」という状態言葉を判定するための変化条件としては、開いた状態の目の縦方向のサイズと、閉じた状態の目の縦方向のサイズとが用意されている。また、「眠り」という状態言葉を判定するための変化条件としては、閉じた状態の目の縦方向のサイズが用意されている。
【0036】
状態言葉生成エンジン6は、特徴データに基づいて人の状態を表す状態言葉を抽出することから、特徴データとしては、カメラ14によって所定時間内に複数回撮影された人物の複数の顔画像データから得られた特徴データが用いられる。例えば、まばたきの状態を判定する場合、まばたきで目を閉じるのは一瞬であるので、その瞬間をとらえるために、30秒間に1000回というように撮影の回数を多くする必要がある。逆に、眠りの状態を判定する場合、30秒間に2,3回というように撮影の回数は少なくてよい。
【0037】
状態言葉生成エンジン6は、上記の状態言葉を判定するために、図2に示すように、状態判定関数実行部61を有している。状態判定関数実行部61は、複数回の撮影に基づく特徴データに基づいて、状態判定データベース12から状態判定用の判定関数(状態判定関数)をロードして当該判定関数を実行し、その結果抽出した状態言葉を状態言葉データとして統合データベース13に格納する。また、状態判定関数実行部61は、その状態言葉に対応する特徴データの基になる顔画像データを容姿特徴データベース8から取り出すとともに、当該顔画像データに対応する声紋データを声紋データベース9から取り出して、状態言葉データと関連付けて統合データベース13に書き込む。統合データベース13においては、同一人物に関する状態言葉データ、顔画像データおよび声紋データとで形成される統合データという形態で各データが管理されている。
【0038】
なお、状態言葉データについては、上記のように声紋データと統合されていなくてもよい。
【0039】
言葉登録エンジン5は、容姿言葉および状態言葉の変更、追加、削除などを含む容姿言葉および状態言葉の改変を行う。この言葉登録エンジン5は、登録処理部51、言葉テーブル変更部52、判定関数削除部53および判定関数追加部54を有している。
【0040】
登録処理部51は、ユーザの指示に応じて言葉テーブル変更部52、判定関数削除部53または判定関数追加部54のいずれかを動作させる。
【0041】
なお、以降、容姿言葉テーブルおよび状態言葉テーブルを限定しない場合は、包括的に言葉テーブルと称する。
【0042】
言葉テーブル変更部52は、容姿判定システム1が備える図示しない表示装置に、ユーザが変更を指示した言葉テーブルを表示して、ユーザによる変更を受け付ける。言葉テーブル変更部52が受け付ける変更可能な要素としては、容姿言葉、状態言葉、基準数値範囲、変化条件が少なくとも挙げられる。言葉テーブル変更部52は、ユーザの変更指示を受け付けると、容姿判定データベース10における言葉テーブルを変更された言葉テーブルに書き替える。
【0043】
判定関数削除部53は、現在、容姿判定データベース10に登録されている判定関数とそれに対応する言葉テーブルの一覧を表示して、ユーザによる判定関数および言葉テーブルの削除入力を受け付ける。判定関数削除部53は、ユーザによる削除指示を受け付けると、容姿判定データベース10における当該判定関数および言葉テーブルを削除する。
【0044】
判定関数追加部54は、ユーザによって判定関数の追加の指示を受け付けると、追加が指示された判定関数およびそれに対応する言葉テーブルを容姿判定データベース10に追加する。このため、判定関数追加部54は、予めいくつかの判定関数とこれらに対応する言葉テーブルを用意しており、ユーザが選択可能となるように判定関数の一覧を表示装置に表示する。
【0045】
容姿言葉検索エンジン7は、入力された1つまたは複数の容姿言葉を統合データベースにおいて検索し、当該容姿言葉に一致する容姿言葉に対応する顔画像データの全てを表示装置に表示する。また、容姿言葉検索エンジン7は、検索モードにおいて、音声認証を行う場合、マイク17によって収録された音声に基づいて声紋データ検索エンジン3によって変換された声紋データを統合データベース13において検索する。容姿言葉検索エンジン7は、この検索の結果、当該声紋データと一致する声紋データに対応する顔画像データを、容姿言葉に対応して表示された上記の顔画像データにおいて特定する。
【0046】
続いて、上記のように構成される容姿判定システム1の動作について説明する。
【0047】
まず、容姿言葉生成エンジン4による容姿言葉の生成(抽出)について、図3のフローチャートを参照して説明する。
【0048】
最初に、単純容姿判定関数実行部41が、容姿特徴データベース8に格納されている特徴データについて対応する単純容姿判定関数を容姿判定データベース10からロードして実行する(S1)。
【0049】
このとき、例えば、図4(a)に示す顔形状判定関数を実行する場合、図4(b)に示すように、容姿特徴データベース8からの出力データのうち、顔の輪郭位置と縦横サイズを取得する(S11)。そして、顔の輪郭の縦サイズを横サイズで除算する(S12)。この除算結果が当てはまる判定基準最大値および判定基準最小値間の基準数値範囲を持つ容姿言葉を図4(c)に示すような顔形状に関する容姿言葉テーブルにおいて検索する(S13)。この結果、除算結果が当てはまる基準数値範囲を持つ全ての容姿言葉を単純容姿判定関数実行部41に返す。
【0050】
また、図5(a)に示す肌色判定関数を実行する場合、顔形状判定関数の実行時と同様、容姿特徴データベース8からの出力データのうち、顔の輪郭位置と縦横サイズを取得する(S21)。このとき、容姿特徴データベース8からの顔画像データに基づいて、顔の輪郭内の平均色を算出する(S22)。この平均値が当てはまる判定基準最大値および判定基準最小値間の基準数値範囲を持つ容姿言葉を図5(b)に示すような肌色に関する容姿言葉テーブルにおいて検索する(S23)。この結果、平均値が当てはまる基準数値範囲を持つ全ての容姿言葉を単純容姿判定関数実行部41に返す。
【0051】
このようにして、単純容姿判定関数実行部41は、容姿言葉を取得すると、その容姿言葉を判定結果として統合データベース13に記録する(S2)。そして、各特徴データに対応する必要な単純容姿判定関数を全て実行した場合は、複合容姿判定関数実行部42の処理に移行する。
【0052】
複合容姿判定関数実行部42が、統合データベース13に格納されている容姿言葉を参照して対応する複合容姿判定関数を容姿判定データベース10からロードして実行する(S4)。
【0053】
このとき、例えば、図6(a)に示す人種判定関数を実行する場合、統合データベース13から髪色判定結果(容姿言葉)と肌色判定結果(容姿言葉)とを取得する(S31)。そして、両判定結果のそれぞれの判定種(髪色と肌色)について、両判定結果が当てはまる容姿言葉(判定基準容姿言葉)を持つ容姿言葉を図6(b)に示すような人種に関する容姿言葉テーブルにおいて検索する(S32)。この結果、判定基準容姿言葉に対応する容姿言葉を複合容姿判定関数実行部42に返す。
【0054】
なお、図6(b)の容姿言葉テーブルにおける「参考度合」は、判定基準容姿言葉が全て対応する容姿言葉に結びつかない場合があるので、対応する度合を参考として示すために設けられている。
【0055】
このようにして、複合容姿判定関数実行部42は、容姿言葉を取得すると、その容姿言葉を判定結果として統合データベース13に記録する(S5)。そして、必要な複合容姿判定関数を全て実行すると容姿言葉生成の処理を終える。
【0056】
続いて、容姿判定システム1の状態言葉生成エンジン6による動作状態の判定について説明する。
【0057】
まず、カメラ14は、状態を判定するための人物を連続して撮影し続ける。特徴抽出エンジン2は、撮影された各顔画像データに基づいて特徴データを抽出し、容姿特徴データベース8に格納する。状態言葉生成エンジン6の状態判定関数実行部61は、容姿特徴データベース8に格納されている特徴データについて対応する状態判定関数を状態判定データベース12からロードして実行する。
【0058】
このとき、例えば、図8に示す目動作状態判定関数を実行する場合、容姿特徴データベース8から、特徴データとして平常時の左右の目の位置と縦横サイズとを取得する(S51)。そして、撮影された顔画像について、特徴データとしての左右の目の位置と縦横サイズとを取得する(S52)。さらに、取得した目の両縦サイズを比較することにより、平常時からの縦サイズの変化の有無を検出する(S53)。このとき、撮影した全ての顔画像についての縦サイズを平常時の縦サイズと比較する。その比較の結果が当てはまる変化条件(閉状態、開閉変化など)を持つ状態言葉を目動作状態に関する状態言葉テーブルにおいて検索する(S54)。この結果、比較結果が当てはまる変化条件を持つ全ての状態言葉を判定関数実行部61に返す。状態言葉生成エンジン6は、このようにして状態言葉を取得すると、その状態言葉を判定結果として統合データベース13に記録する。
【0059】
続いて、言葉登録エンジン5による容姿言葉および状態言葉の登録について、図8のフローチャートを参照して説明する。
【0060】
まず、登録処理部51が、ユーザによるモード選択によって、容姿言葉テーブルの変更が選択されたか否かを判定する(S41)。容姿言葉テーブルの変更が選択された場合(言葉テーブル変更モード)、言葉テーブル変更部52が、目的の言葉テーブルをユーザの指示にしたがって言葉テーブルを変更して(S42)、処理を終える。
【0061】
容姿言葉テーブルの変更が選択されなかった場合、登録処理部51が、ユーザによるモード選択によって、判定関数の削除が選択されたか否かを判定する(S43)。判定関数の削除が選択された場合(判定関数削除モード)、判定関数削除部53が、目的の判定関数とそれに対応する言葉テーブルとをユーザの指示にしたがって削除して(S44)、処理を終える。
【0062】
判定関数の削除が選択されなかった場合、登録処理部51が、ユーザによるモード選択によって、判定関数の追加が選択されたか否かを判定する(S45)。判定関数の追加が選択された場合(判定関数追加モード)、判定関数追加部54が、目的の判定関数とそれに対応する言葉テーブルとをユーザの指示にしたがって追加して(S46)、処理を終える。
【0063】
以上のように、容姿判定システム1は、抽出された人物の容姿の特徴に基づいて、その特徴を表現する容姿言葉を抽出し、その容姿言葉を人物の画像データとともに、統合データベース13に加える。これにより、入力された容姿言葉に基づいて統合データベース13を検索することで、入力容姿言葉と一致した容姿言葉に対応する全ての画像データを抽出して表示することができる。それゆえ、多数の人物画像から容姿言葉によって目標とする人物画像を選別することができ、犯罪捜査などにおいて、多数の前歴者の画像から目撃者の証言によって確度の高い順に候補を絞り込むことが可能となる。
【0064】
また、第一印象データベース11を用いて容姿言葉を抽出することにより、より印象の強い人物画像を選別することができる。第一印象データベース11に有名人の特徴を表す容姿言葉を格納しておけば、有名人に似た人物の画像を容易に選別することができる。
【0065】
また、統合データベース13に容姿言葉および顔画像データとともに、声紋データを組み合わせて登録しておくことにより、容姿言葉での画像の絞り込みに加えて、声紋で人物を特定することができ、より精度の高い人物認証を行うことができる。
【0066】
また、状態言葉生成エンジン6および状態判定データベース11を備えることにより、予め用意している平常時の画像データから得られる特徴データと撮影した画像データから得られる特徴データとを比較することで、人の動作状態や表情を状態言葉として抽出することができる。これにより、従来の顔認証技術では本人ではなく写真によっても認証されてしまうが、まばたきなどの人の動きを検出することと併せて顔認証を行うことにより、写真による成り済ましの認証を拒否することができる。また、運転者の目の状態で居眠り状態を判定することや、口の状態であくびを判定することにより、運転者に警告を発するといった危険回避システムを構築することができる。
【0067】
さらに、言葉登録エンジン5を備えることにより、容姿言葉や状態言葉の変更、削除および追加を容易に行うことができ、必要最小限の判定関数および言葉テーブルを各判定データベース10〜12に蓄えておけばよい。これにより、各判定データベース10〜12が判定関数および言葉テーブルの格納に必要な容量を削減することができる。
【0068】
なお、容姿判定システム1は、図1に示すように、単一のコンピュータによって構成されているが、図9に示すように、サーバー装置16およびクライアント装置17とで分離して構成されていてもよい。この構成では、クライアント装置17に特徴抽出エンジン2、声紋データ検出エンジン3、容姿特徴データベース8および声紋データベース9が設けられる一方、サーバー装置16には、それ以外の各エンジン5〜7および各データベース10〜13が設けられている。また、サーバー装置16に設けられたサーバー処理部19とクライアント装置17に設けられたクライアント処理部20によって、LAN18を介してファイルやデータのやり取りを行うための通信処理が実行される。
【0069】
このような構成により、サーバー装置16と離れた位置で画像や音声の入力を行うことができる。また、クライアント装置17をプログラマブル表示器やパネルコンピュータなどの操作表示機器で構成し、サーバー装置16をホストコンピュータによって構成することにより、プログラマブル表示器が設置された生産現場などで顔の撮影や声の収録を行うことができ、システム構成の自由度をより高めることが可能となる。
【0070】
最後に、前述の各エンジン2〜7は、CPUを用いてソフトウェアによって実現される。
【0071】
すなわち、容姿判定システム1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えたコンピュータによって実現される。そして、本発明の目的は、上述した機能を実現するソフトウェアである容姿判定システム1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、容姿判定システム1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
【0072】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フレキシブルディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0073】
また、容姿判定システム1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。
【0074】
なお、容姿判定システム1は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【0075】
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【産業上の利用可能性】
【0076】
本発明の容姿判定装置は、人物の容姿の特徴を表す容姿言葉を人物の画像と関連付けて保存しておくことにより、容姿言葉を基に画像を検索することで、容姿言葉で表される印象だけで画像を抽出することができるので、例えば、多数の人物画像から所望の人物画像を選別するという用途に適用できる。
【図面の簡単な説明】
【0077】
【図1】本発明の実施の一形態を示す容姿判定システムの構成を示すブロック図である。
【図2】上記容姿判定システムの要部の構成を示すブロック図である。
【図3】上記容姿判定システムにおける容姿言葉生成エンジンによる判定関数の実行処理の手順を示すフローチャートである。
【図4】(a)は上記容姿言葉生成エンジンが実行する単純容姿判定関数による処理手順を示すフローチャートであり、(b)は単純容姿判定関数の処理時に参照される特徴抽出エンジンの出力データを示す図であり、(c)は単純容姿判定関数の処理時に参照される容姿言葉テーブルを示す図である。
【図5】(a)は上記容姿言葉生成エンジンが実行する他の単純容姿判定関数による処理手順を示すフローチャートであり、(b)は他の単純容姿判定関数の処理時に参照される特徴抽出エンジンの出力データを示す図であり、(c)は他の単純容姿判定関数の処理時に参照される容姿言葉テーブルを示す図である。
【図6】(a)は上記容姿言葉生成エンジンが実行する複合容姿判定関数による処理手順を示すフローチャートであり、(b)は複合容姿判定関数の処理時に参照される容姿言葉テーブルを示す図である。
【図7】上記容姿判定システムにおける状態言葉生成エンジンが実行する状態判定関数による処理手順を示すフローチャートである。
【図8】上記容姿判定システムにおける言葉登録エンジンによる言葉テーブルの変更および判定関数の削除・追加の処理手順を示すフローチャートである。
【図9】本発明の実施の他の形態を示す容姿判定システムの構成を示すブロック図である。
【符号の説明】
【0078】
1 容姿判定システム(容姿判定装置)
2 特徴抽出エンジン(特徴抽出手段)
3 声紋データ検出エンジン
4 容姿言葉生成エンジン(特徴言葉抽出手段)
5 容姿言葉登録エンジン(判定関数加除手段,特徴言葉変更手段)
6 状態言葉生成エンジン(状態言葉抽出手段)
7 容姿言葉検索エンジン(イメージ抽出手段)
8 容姿特徴データベース
9 声紋データベース
10 容姿判定データベース(特徴言葉データベース)
11 第一印象データベース(特徴言葉データベース)
12 状態判定データベース(状態言葉データベース)
13 統合データベース(対応データベース)
14 カメラ
15 マイク

【特許請求の範囲】
【請求項1】
撮影された人物のイメージから当該人物の各部の特徴を表すパラメータを抽出して特徴データベースに登録する特徴抽出手段と、
人物の各部分の特徴を表現する特徴言葉と当該特徴言葉で表現される特徴を特定する条件とを前記パラメータが当該条件を満たすか否かを判定するための判定関数とともに登録している特徴言葉データベースと、
前記特徴データベースに登録されているパラメータが特徴言葉データベースに登録された条件を満たすことを前記判定関数に基づいて判定すると、当該パラメータに対応する特徴言葉を特徴言葉データベースから抽出する特徴言葉抽出手段と、
人物のイメージと抽出された特徴言葉とを対応付けて登録している対応データベースと、
入力された特徴言葉とそれぞれ一致する特徴言葉を対応データベースにおいて検索し、入力された特徴言葉と一致する特徴言葉に対応するイメージを抽出するイメージ抽出手段と、
新規の前記判定関数を前記特徴言葉データベースに追加すること、または前記特徴言葉データベースに登録されている前記判定関数を削除することの少なくともいずれか1つを行う判定関数加除手段とを備えていることをことを特徴とする容姿判定装置。
【請求項2】
前記特徴言葉データベースに登録されている前記特徴言葉を変更する特徴言葉変更手段を備えていることを特徴とする請求項1記載の容姿判定装置。
【請求項3】
前記特徴言葉データベースは、特徴言葉として際立った特徴を表現する特徴言葉を登録するとともに、撮影された人物の声のデータをイメージおよび特徴言葉とさらに対応付けて登録しており、
イメージ抽出手段は、入力された特徴言葉とそれぞれ一致する特徴言葉を特徴言葉データベースにおいて検索するとともに、入力された声のデータを対応データベースにおいて検索し、入力された特徴言葉と一致する特徴言葉に対応するとともに、入力された声のデータと一致する声のデータに対応するイメージを抽出することを特徴とする請求項1または2記載の容姿判定装置。
【請求項4】
前記特徴抽出手段は、時系列で撮影された人物の複数のイメージから当該人物の各部の特徴を表すパラメータをイメージ毎に抽出して前記特徴データベースに登録し、
容姿判定装置は、
人物の各部の状態の変化を特定する変化条件と当該変化条件を満たす動作状態を表現する状態言葉とを登録している状態言葉データベースと、
特徴抽出手段によって抽出されたイメージ毎のパラメータが状態言葉データベースに登録されている前記変化条件を満たすと判定すると、状態言葉データベースから当該変化条件に対応する状態言葉を抽出する状態言葉抽出手段と
を備えていることを特徴とする請求項1記載の容姿判定装置。
【請求項5】
請求項1ないし4のいずれか1項に記載の容姿判定装置の各手段としてコンピュータを機能させるための容姿判定プログラム。
【請求項6】
請求項5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2008−9560(P2008−9560A)
【公開日】平成20年1月17日(2008.1.17)
【国際特許分類】
【出願番号】特願2006−177208(P2006−177208)
【出願日】平成18年6月27日(2006.6.27)
【出願人】(000134109)株式会社デジタル (224)
【Fターム(参考)】