説明

感情認識装置、電子機器、感情認識方法、制御プログラム及び記録媒体

【課題】大規模な学習処理や辞書作成を行うことなく、顔画像から容易に感情を認識可能
な感情認識装置、電子機器、感情認識方法、制御プログラム及び記録媒体を提供する。
【解決手段】顔画像の周囲に分布する「場」であって、その強さが画像からの距離に依存
し、画像に近いほど大きな値を持つ視覚の誘導場を求め、この誘導場から等ポテンシャル
線の閉曲面の複雑度を求め、この複雑度とポテンシャル値との対応関係である関数を、誘
導場の分布情報として取得し、この関数に基づいて顔画像に対応する感情を判別するよう
にした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、顔画像から感情を認識可能な感情認識装置、電子機器、感情認識方法、制御
プログラム及び記録媒体に関する。
【背景技術】
【0002】
従来、顔画像から顔の特徴量を抽出し、特徴量がどの感情に対応するかを事前にサンプ
ル調査して得た辞書データに基づいて判定する感情認識装置が知られている(例えば特許
文献1乃至4参照)。この種の感情認識装置には、顔の特徴量として、目、鼻、口、眉毛
等の顔部品を用いる方式や、周波数分析或いはフィルタで得られた画像解析結果等の数量
値を用いる方式のものがある。
【特許文献1】特開2004−513462号公報
【特許文献2】特開2005−512248号公報
【特許文献3】特開2005−234686号公報
【特許文献4】特開2005−293539号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかし、従来の構成では、得られた特徴量と感情との対応関係を得る課程、すなわち、
学習が大変である。学習が大変なのはパターン認識全体に言えるが、顔画像の場合、どの
顔画像がどんな表情かを一つ一つ手作業でインデックスを付け、それに対応する特徴量の
パラメータを、例えば、ニューラルネット等を用いて決定していく膨大な作業が必要にな
ってしまう。
特に感情の場合には、例えば、微苦笑といったように、一種類の感情に明確に区別でき
ないことが多いため、顔画像のサンプルを多数用意して複数の感情が混在する場合も区別
可能にする必要があり、識別用辞書の作成作業が膨大になる。
さらに、パターン認識自体が得られた特徴量と、識別用辞書との整合に時間がかかる上
に、感情認識の場合は、複数の感情が混在するために、照合に大変時間がかかってしまう
等、検討すべき課題が多く、システム構成の障害の一つになっている。
【0004】
本発明は、上述した事情に鑑みてなされたものであり、大規模な学習処理や辞書作成を
行うことなく、顔画像から容易に感情を認識可能な感情認識装置、電子機器、感情認識方
法、制御プログラム及び記録媒体を提供することにある。
【課題を解決するための手段】
【0005】
上述課題を解決するため、本発明は、感情認識装置において、顔画像を入力する入力手
段と、前記顔画像の周囲に分布する「場」であって、その強さが顔画像からの距離に依存
し、顔画像に近いほど大きな値を持つ視覚の誘導場を求め、前記誘導場の分布情報に基づ
いて前記顔画像に対応する感情を判別する感情判別手段とを備えることを特徴とする。こ
の発明によれば、顔画像の視覚の誘導場を求め、この誘導場の分布情報に基づいて顔画像
に対応する感情を判別するので、大規模な学習処理や辞書作成を行うことなく、我々の物
の見方、感じ方に近い形で感情を判別することができる。
【0006】
上記構成において、前記感情判別手段は、前記顔画像の視覚の誘導場から等ポテンシャ
ル線の閉曲面の複雑度を求め、この複雑度と等ポテンシャル値との対応関係である曲線情
報を、前記誘導場の分布情報として取得し、前記曲線情報に基づいて感情を判別すること
が好ましい。この構成によれば、複雑度とポテンシャル値との対応関係である曲線情報を
、誘導場の分布情報として取得するので、誘導場の分布を数値化した情報を容易に得るこ
とができる。
【0007】
上記構成において、前記感情判別手段は、前記曲線情報を近似する関数を算出する関数
算出手段と、前記関数算出手段により算出される関数と、予め得たそれぞれの感情に対応
する関数との比較により感情を判定する感情判定手段とを有することが好ましい。この構
成によれば、関数算出手段により算出される関数と、予め得たそれぞれの感情に対応する
関数との比較により感情を判定するので、いずれの感情であるかを容易に判定することが
可能になる。
【0008】
この場合、前記関数特定手段は、シグモイド関数を算出することが好ましい。この構成
によれば、顔画像の視覚の誘導場の分布を示すのに好適なシグモイド関数で近似するので
、感情認識の判定精度を向上することができる。
【0009】
さらに、前記シグモイド関数は、複雑度をC、ポテンシャル値をpとし、レンジをa、
オフセット値をb、パラメータをT、p0とした場合に、
【数2】

で定義されるシグモイド関数であり、前記感情判定手段は、前記シグモイド関数のパラ
メータに基づいて感情を判定することが好ましい。この構成によれば、シグモイド関数の
パラメータに基づいて感情を容易に判定することができる。
【0010】
また、上記構成において、前記感情判定手段は、前記関数算出手段により算出されたシ
グモイド関数と、予め得たそれぞれの感情に対応するシグモイド関数との比較により感情
を判定することが好ましい。この構成によれば、関数算出手段により算出されたシグモイ
ド関数と、予め得たそれぞれの感情に対応するシグモイド関数との比較によりいずれの感
情か否かを容易に判定することができる。
この場合、前記感情判定手段は、予め得たそれぞれの感情に対応するシグモイド関数の
うち、前記関数算出手段により算出されたシグモイド関数に似た一又は複数のシグモイド
関数を算出し、似たシグモイド関数が一つだけ存在した場合は、その一つのシグモイド関
数に対応する感情と判定し、似たシグモイド関数が複数存在した場合は、その複数のシグ
モイド関数に対応する複数の感情が混在した状態と判定するようにしてもよい。この構成
によれば、感情間の狭間にある状態も識別可能になる。
【0011】
また、上記構成において、前記顔画像は二値画像であることが好ましい。この構成によ
れば、多値画像を感情認識する場合に比して計算量を低減することができ、判定速度の高
速化を図ることができる。また、本発明は、感情認識装置を備える電子機器に広く適用可
能である。
【0012】
また、本発明は、感情認識方法において、顔画像の周囲に分布する「場」であって、そ
の強さが顔画像からの距離に依存し、顔画像に近いほど大きな値を持つ視覚の誘導場を求
め、前記誘導場の分布情報に基づいて前記顔画像に対応する感情を認識することを特徴と
する。この発明によれば、顔画像の視覚の誘導場を求め、この誘導場の分布情報に基づい
て顔画像に対応する感情を判別するので、大規模な学習処理や辞書作成を行うことなく、
我々の物の見方、感じ方に近い形で感情を判別することができる。
【0013】
また、本発明は、以上説明した感情認識装置、電子機器及び感情認識方法に適用する他
、この発明を実施するための制御プログラムを電気通信回線を介してダウンロード可能に
したり、そのようなプログラムを、磁気記録媒体、光記録媒体、半導体記録媒体といった
、コンピュータに読み取り可能な記録媒体に記憶して配布する、といった態様でも実施さ
れ得る。
【0014】
本発明に係る感情認識装置、電子機器、感情認識方法、制御プログラム及び記録媒体に
よれば、顔画像の視覚の誘導場を求め、この誘導場の分布情報に基づいて顔画像に対応す
る感情を判別するので、大規模な学習処理や辞書作成を行うことなく、我々の物の見方、
感じ方に近い形で感情を判別することができる。
【発明を実施するための最良の形態】
【0015】
以下、図面を参照して本発明の実施形態を詳述する。本実施形態では、本発明を顔画像
の表情から感情を認識する感情認識装置に適用した場合を例に説明する。この感情認識装
置10では、「視覚の誘導場」という概念を用いて感情を認識するため、まず、視覚の誘
導場について説明する。
視覚の誘導場は、図形の周りに静電場のような場を仮定し、パターン認知などの視知覚
現象を説明する心理学的概念であり、横瀬善正著の“形の心理学”(名古屋大学出版会(
1986))に記載されている(以下、これを参考論文という)。
この参考論文では、視覚の誘導場(以下、単に誘導場と表記する)の分布の仕方が、例
えば、文字の類似性、錯視図形の解釈など、我々の物の見方、感じ方と関連するとしてい
る。この参考論文では、直線・円弧で構成された図形を対象としているため、任意のディ
ジタル画像の誘導場は求められない。ここでは、最初に白黒2値のディジタル画像(以下
、二値画像という)における誘導場の計算方法を示す。
【0016】
誘導場は基本的にクーロンポテンシャルと解釈できることから、パターンの外郭を構成
する画素を点電荷と仮定し、それらが作るクーロンポテンシャルの集積から、ディジタル
画像における誘導場の分布を計算する。
【0017】
図1はディジタル画像の画素配列を示す図である。図1に示すように、n個の点列から
構成される曲線f(s)によって、任意の点Pに誘導場が形成されるとする。この曲線f
(s)は線図形の線分や画図形の輪郭線に相当する。そして、曲線f(s)を構成する各
点p1,p2,・・・,pi,・・・,pnを正電荷1の点電荷と仮定し、点Pから曲線
f(s)上を走査して、曲線f(s)を構成するn個の点p1,p2,・・・,pi,・
・・,pnが見つかり、走査して見つかった曲線f(s)上の各点までの距離をriとす
ると、点Pにおける誘導場の強さMpは次のように定義される。
【0018】
【数3】

この式(2)を用いることにより、任意のディジタル画像の誘導場を求めることができ
る。また、曲線が複数ある場合、点Pにおける誘導場の強さは個々の曲線が点Pにつくる
誘導場の和になる。なお、式(2)は点Pから発した光が直接当たる部分のみ和をとると
いう制約条件がつく。例えば、点Pに対して、曲線f1(s),f2(s),f3(s)
が図2に示すように存在しているとすると、点Pから見えない部分、つまり、この場合、
曲線f1(s)に遮蔽されて点Pから見えない範囲Zに存在する部分の和はとらない。こ
の図2の例では、曲線f3(s)のすべてと曲線f2(s)の一部の和はとらないことに
なる。これを、ここでは遮蔽条件という。
【0019】
図3(A)は「A」という文字について、画素全てを電荷1の点電荷と仮定し、前述の
式(1)で計算した誘導場の例を示すものである。図3(A)の文字「A」周辺に地図の
等高線状に分布している細い線が誘導場における等ポテンシャル値を結んで描かれる等ポ
テンシャル線であり、中央から外に行くほど誘導場の強さ(ポテンシャル値)は弱くなり
、やがて0(零)に近づく。
図3(A)の誘導場の分布の形状・強さにおける特徴、特に「A」の頂点付近の分布が
他より鋭角な特徴は、前述の参考論文による四角形や三角形など、図形の角付近に関する
誘導場の分布の心理実験結果と一致する。
【0020】
また、図3(B)は、前述した遮蔽条件(任意の点Pから見えない範囲Zに存在する部
分の和はとらない)がなく、画素全てを電荷1の点電荷と仮定した誘導場の例であるが、
誘導場の分布は全体的に丸くなり、前述の参考論文による心理実験結果と異なったものと
なる。このように、遮蔽条件は誘導場を特徴づける上で重要なものとなる。
【0021】
このようにして、ある図形についての視覚の誘導場を得ることができる。なお、このよ
うな視覚の誘導場を用いた技術の例としては、例えば、「長石道博:“視覚の誘導場を用
いた読みやすい和文プロポーショナル表示”、映像メディア学会誌、Vol.52,No
.12,pp.1865−1872(1998」(以下、第1の論文という)や、「三好
正純、下塩義文、古賀広昭、井手口健:“視覚の誘導場理論を用いた感性にもとづく文字
配置の設計”、電子情報通信学会論文誌、82−A,9,1465−1473(1999
)」(以下、第2の論文という)がある。ちなみに、上述の第1の論文の著者は本発明の
発明者である。
【0022】
本実施形態では、このような視覚の誘導場を利用することによって、今まで人間の直感
や手作業に頼っていた画像の感性評価が可能となり、より具体的には、顔画像の視覚の誘
導場の分布を評価することで、顔の表情から感情認識の自動化を可能にしている。
詳述すると、本実施形態では、感情認識対象の顔画像の誘導場から等ポテンシャル線の
閉曲面の凹凸の度合いを示す複雑度を求める。この複雑度は、等ポテンシャル値がiの閉
曲線の複雑度をCiで表せば、次式(3)で求められる。
【0023】
【数4】

ここで、Liは、等ポテンシャル値iの等ポテンシャル面の周囲長であり、Siは面積
である。なお、周囲長Liは、等ポテンシャル面の輪郭を構成するドット数と考えること
ができ、面積Siは、等ポテンシャル面に存在するドット数と考えることができる。
【0024】
この式(3)によれば、周囲長Liが長く、面積Siが小さいほど、複雑度Ciの値が
大きくなり、つまり、等ポテンシャル線の凹凸が多い程、複雑度Ciの値が大きくなる。
そして、複雑度Ciと等ポテンシャル値i(以下、等ポテンシャル値iに限定されない
ポテンシャル値をpと表記する)とをグラフにして特性曲線を示すことによって、「対象
画像の視覚の誘導場の分布」を図表化することができる。
【0025】
顔画像の場合、「顔画像の視覚の誘導場の分布」(分布情報)である特性曲線は、おお
よそ単調増加関数になり、この関数、すなわち、「顔画像の視覚の誘導場の分布」を示す
曲線は、シグモイド関数で近似することができる。
図4は、シグモイド関数の一例を示している。シグモイド関数は、特に、同図に符号α
で示す立ち上がり部分に特徴があり、この立ち上がり部分を含めた曲線全体が、顔画像の
場合の複雑度Cとポテンシャル値pとの対応関係を示す特性曲線の傾向と良く似ている。
このため、本実施形態では、複雑度Cとポテンシャル値pとの対応関係を示す曲線情報
として、つまり、「顔画像の視覚の誘導場の分布」(分布情報)としてシグモイド関数を
得ることによって、「顔画像の視覚の誘導場の分布」を数値化した情報を容易に得ること
ができる。
【0026】
次に、感情毎の「顔画像の視覚の誘導場の分布」の算出方法の概要を説明する。ここで
は、基本的な感情のうち、「怒り」、「普通」、「喜び」のシグモイド関数を求める場合
を例に説明する。
図5(A)は、怒りの表情の顔画像の一例を示し、図5(B)はその顔画像の誘導場を
示す図である。また、図5(C)は、普通の表情の顔画像の一例を示し、図5(D)はそ
の顔画像の誘導場を示す図である。また、図5(E)は、怒りの顔画像の一例を示し、図
5(F)はその顔画像の誘導場を示す図である。なお、これら顔画像は、説明を分かり易
くするため、目、鼻、口の顔部品のみの極めて簡略化した画像例を示している。
「怒り」、「普通」及び「喜び」のシグモイド関数を計算する場合、まず、図5(A)
(C)(D)に示す「怒り」、「普通」及び「喜び」の顔画像について、図5(B)(D
)(F)に示すように、誘導場を各々計算し、各誘導場について、等ポテンシャル値i毎
に複雑度Ciを求め、これを複雑度Cとポテンシャル値pの関係を最小二乗法を用いて、
次式(4)で示すシグモイド関数で各々近似することによって得られる。
【0027】
【数5】

ここで、aはレンジであり、p0及びTはパラメータであり、bはオフセット値である

【0028】
上記算出に用いる顔画像のデータは、元画像となる撮影時の画像データ(カラー画像又
はグレースケール画像等の複数色、複数階調を有する画像)に対し、エッジを取り出して
、各画素を白と黒とに二値化した二値化画像のデータが使用される。
図6(A)(B)は、元画像を異なるしきい値で二値化した顔画像を示している。具体
的には、上記二値化の際には、顔の眼、鼻、口等の主要な顔部品が欠落しない程度のしき
い値に設定され、図6(B)に示すように、主要な顔部品を除く部分ができるだけ除去さ
れた二値画像に変換することが好ましい。この二値化画像は更にノイズ除去処理と孤立点
の除去処理とが施され、最終的に、図6(C)に示すように、眉、眼、鼻、口だけが抽出
された二値画像に変換される。なお、二値画像は、眼と鼻と口だけが判別可能な画像であ
ってもよい。これによって、主要な顔部品を抽出した二値画像を得ている。
【0029】
このようにして得られた6つの基本的な感情(普通、悲しみ、嫌悪、喜び、怒り、驚き
)の顔画像のシグモイド関数の一例を図7に示す。この図7において、曲線h1(p)が
、「普通」の表情をした顔画像のシグモイド関数を示し、曲線h2(p)が、「悲しみ」
の場合のシグモイド関数を示し、曲線h3(p)が「嫌悪」の場合のシグモイド関数を示
し、曲線h4(p)が、「喜び」の場合のシグモイド関数を示し、曲線h5(p)が、「
怒り」の場合のシグモイド関数を示し、曲線h6(p)が「驚き」の場合のシグモイド関
数を示している。
【0030】
「普通」の場合の曲線h1(p)を基準に考えると、「怒り」や「驚き」といった強い
感情の曲線h5(p),h6(p)の立ち上がりは急峻であり、「喜び」の曲線h4(p
)の複雑度Cがやや大きく、「嫌悪」や「悲しみ」といったネガティブな感情の曲線h3
(p),h2(p)の複雑度Cが小さい、といったように、感情により曲線の特性(形状
)が異なることが判る。
このように、感情毎に「顔画像の視覚の誘導場の分布」を示すシグモイド関数が異なる
ことに鑑み、本実施形態では、「顔画像の視覚の誘導場の分布」をシグモイド関数で近似
し、予め得たそれぞれの感情に対応する「顔画像の視覚の誘導場の分布」を示すシグモイ
ド関数との比較により、感情を容易に推定することが可能になる。
【0031】
例えば、「怒り」は、上述のパラメータTが0.04近辺の値となり、上述のレンジa
が300以上といったように特定することができ、この条件を満たすかどうかで「怒り」
の感情か否かを判定することができる。実際には、同じ感情でもシグモイド関数の曲線が
多少異なる場合が生じるので、予め複数種類の感情の顔画像の誘導場を計算し、複雑度を
求めてプロットすることによって感情毎のシグモイド関数の範囲を求めておくことが好ま
しい。この作業によって、例えば、図8(A)に概念的に示すように、ある感情Iの範囲
が決まり、図8(B)に示すように、感情Iのパラメータの範囲が定まる。同様にして、
他の感情IIのパラメータの範囲も定めることができる。本実施形態では、複数の感情毎
のパラメータ範囲を内部メモリに格納しておき、いずれのパラメータ範囲に属するかどう
かを判定することにより、感情を精度良く判別可能にしている。
【0032】
また、本構成では、図8(A)に示すように、感情毎の範囲が、複雑度Cとパラメータ
pの二次元平面で特定されるので、出現密度の大きいエリアを中心に範囲を区分けすれば
、十分に精度の高い範囲に容易に区分けすることができる。
これに対し、一般にパターン認識では、n次元空間(n=60以上)を区分けする必要
が生じるため、非常に沢山のサンプルを偏りなく集め、かつ、機械学習でうまく区分けを
決定する必要が生じ、その作業が繁雑化すると共に、学習処理にも時間がかかってしまう
。従って、本構成では、感情毎の範囲の区分け作業が、一般のパターン認識の場合に比し
て圧倒的に簡素化され、また、学習処理をしなくても容易かつ短時間で感情毎の範囲を定
めることが可能である。
【0033】
図9は、本実施形態に係る感情認識装置10の機能構成を示すブロック図である。この
感情認識装置10は、電子化された顔画像の誘導場を計算し、誘導場の分布に基づいて感
情を判定し、その結果を表示する装置である。
詳述すると、この感情認識装置10は、判定対象となる電子化された画像を入力する顔
画像入力部(入力手段)11と、この顔画像入力部11に入力された画像から顔画像を認
識して抽出する顔領域抽出部(領域抽出手段)12と、顔領域抽出部12で抽出された顔
領域から感情を判別する感情判別部(感情判別手段)13と、感情判別部13の判別結果
を表示する表示部(出力手段)14とを備えている。
【0034】
顔画像入力部11は、複数色及び複数階調の画像(以下、多値画像という)を入力し、
顔の眼、鼻、口等の主要な顔部品が欠落しない程度のしきい値で二値化する前述の二値化
処理等を施して二値画像に変換するものである。この顔画像入力部11への画像の入力方
法は、無線又は有線による通信で入力してもよいし、記録媒体に記録された画像データを
読み取って入力してもよい。また、この顔画像入力部11が、撮影機能を有し、撮影によ
り得た画像データを直接入力するものであってもよい。
なお、顔画像入力部11が、顔の眼、鼻、口等の主要な顔部品が欠落しない程度のしき
い値で二値化された二値画像を直接入力するものであってもよい。
【0035】
顔領域抽出部12は、肌色利用方式や顔部品検出方式等の公知の顔認識技術を利用して
顔領域を認識するものである。なお、肌色利用方式は、顔画像が肌色であることを利用し
て、色の分布を基準に肌色部分を顔領域と認識する方式であり、顔部品検出方式は、画像
中のエッジを基準に顔部品(眼、鼻、口等)を検出し、顔部品のある領域を顔領域と認識
する方式である。
【0036】
感情判別部13は、誘導場計算部(計算手段)21と、誘導場分布評価部22と、判定
部(判定手段)23とを備えている。誘導場計算部21は、顔領域抽出部12で抽出され
た顔領域の誘導場を計算するものである。
誘導場分布評価部22は、誘導場計算部21で計算された誘導場から「視覚の誘導場の
分布」を得て評価するものである。具体的には、この誘導場分布評価部22は、視覚の誘
導場に対し、式(3)により等ポテンシャル値i毎に複雑度Ciを求め、複雑度Cとポテ
ンシャル値pの関係を近似するシグモイド関数をそれぞれ計算により求める。これによっ
て、誘導場分布評価部22は、「視覚の誘導場の分布」を示すシグモイド関数(顔画像用
関数)を算出する関数算出手段として機能する。
【0037】
判定部23は、誘導場計算部21で計算されたシグモイド関数と、予め得たそれぞれの
感情(例えば、上述した6つの基本的な感情)に対応するシグモイド関数との比較により
感情を判定する感情判定手段として機能する。このように、感情判別部13を構成する誘
導場計算部21、誘導場分布評価部22及び判定部23は、上述した演算処理を行う演算
部で構成することができる。このため、実際には、感情判別部13の各部は、上記演算処
理をハードウェア処理で行う一又は複数の半導体集積回路で構成してもよいし、若しくは
、ソフトウェア処理で行うCPUやROMやRAMといった汎用のコンピュータで構成し
てもよいし、又は、視覚の誘導場の計算処理等の比較的重い演算処理はハードウェア処理
で行い、感情判定等の比較的軽い演算処理はソフトウェア処理で行うように構成してもよ
い。
【0038】
次に、感情認識装置10の処理フローを図10に示すフローチャートを参照しながら説
明する。まず、入力した二値画像に対し、顔領域抽出部12によって顔領域が抽出される
と、誘導場計算部21は、顔領域の誘導場を計算し(ステップS11)。誘導場分布評価
部22は、計算された誘導場の等ポテンシャル面毎の複雑度Cを計算する処理を開始する

ここで、上述した式(2)に定めた誘導場の計算定義式は、最小の画素距離が1の場合
、場の強さは0(零)から1の範囲となる。複雑度Cを計算するポテンシャル値pの範囲
は、多いほど後のシグモイド関数の近似精度が高まるが、計算時間の短縮化の観点から、
感情認識に有益な最小限の範囲に留めることが好ましい。
そこで、本実施形態では、複雑度Cの計算に際し、ポテンシャル値pは、0(零)以上
、かつ、1未満の区間で適当な範囲、例えば、ポテンシャル値pの最小値p1を0.03
とし、分解能の値Δpを0.01ステップとすることによって計算量を低減している。
【0039】
具体的には、誘導場分布評価部22は、まず、ポテンシャル値pを最小値p1に設定し
(ステップS12)、このポテンシャル値p(=p1)の等ポテンシャル面を抽出し(ス
テップS13)、等ポテンシャル値i(=p1)の閉曲面の周囲長Li及び面積Siを求
め、式(3)により複雑度Ciを計算する(ステップS14)。
続いて、誘導場分布評価部22は、ポテンシャル値pが最大値「1」未満であれば(ス
テップS5:YES)、ポテンシャル値pに分解能の値Δpを加算し(ステップS16)
、上述したステップS3の等ポテンシャル面の抽出処理と、ステップS14の複雑度Cの
計算処理とを繰り返すことにより、ポテンシャル値pが最小値p1から最大値「1」の範
囲で分解能Δp単位で複雑度Cを計算する。なお、最大値「1」の範囲まで複雑度cを計
算する場合に限らず、最大値を値「1」以下の値に変更してもよい。
【0040】
そして、ポテンシャル値pが最大値「1」に達すると(ステップS15:NO)、誘導
場分布評価部22は、得られた複数の複雑度Cと、各複雑度Cに対応するポテンシャル値
pとから、最小二乗法を用いて式(4)で示すシグモイド関数を決めるパラメータ(レン
ジa、オフセット値b、パラメータp0、T)を各々決定し、近似するシグモイド関数を
求める(ステップS17)。このステップS17の処理の際には、理論値からの誤差(残
差)の平方和を計算することにより、誤差の分散、つまり、近似誤差が求められる。
【0041】
この場合、近似誤差が、顔らしい画像か否かを示す情報に相当する。このため、近似誤
差が大きく、つまり、関数の相関が非常に低く、シグモイド関数で近似するのが困難な場
合は、対象が顔でない、或いは、非常に画像が劣化して表情認識できない状態と考えられ
る。なお、具体的閾値は、実サンプルを使って実験的に決定すればよい。このような場合
は、判定部23が、認識困難な旨を表示部14に表示することによって使用者に警告を報
知する。
【0042】
一方、近似誤差が小さい場合、判定部23は、予め得た感情毎のシグモイド関数のうち
、近似したシグモイド関数に似ている一つのシグモイド関数を算出し、つまり、近似する
シグモイド関数のパラメータ(レンジa、オフセット値b、パラメータp0、T等)が、
内部メモリに格納された感情毎のパラメータ範囲のいずれに該当するか否かを判定するこ
とにより、感情を判定し(ステップS18)、判定結果を画像やメッセージで表示部14
に表示し、顔画像の感情(表情)を使用者に通知することができる。
【0043】
以上説明したように、本実施形態によれば、顔画像の視覚の誘導場を求め、この誘導場
の分布情報をシグモイド関数で近似し、近似されたシグモイド関数に基づいて顔画像に対
応する感情を判別するので、我々の物の見方、感じ方に近い形で顔画像の感情(表情)を
判別することができ、しかも、近似したシグモイド関数から容易に感情認識することがで
きるので、感情認識の高速化(短時間化)が可能である。
また、顔画像の視覚の誘導場の分布を示すのに好適なシグモイド関数で近似するので、
感情認識の判定精度を向上することができる。
【0044】
この場合、近似されたシグモイド関数と、予め得たそれぞれの感情に対応するシグモイ
ド関数との比較により感情が判別され、より具体的には、シグモイド関数のパラメータが
いずれの感情のパラメータの範囲に属するか否かにより感情が判別されるので、パラメー
タと感情との対応関係を算出する作業が、二次元平面の識別作業で済む。このため、サン
プル数が膨大にしなくてもよいし、上記算出作業をニューラルネット等を用いて行うよう
にした場合でも、その処理時間が大幅に少なくて済む。
これにより、本実施形態では、一般のパターン認識に比して、大規模な学習処理や辞書
作成を行う必要がない分、認識前の事前作業が少なくて済むといった効果も奏する。
【0045】
なお、本発明は上述の実施形態に限定されるものではなく、本発明の目的を達成できる
範囲での変形、改良などは本発明に含まれるものである。例えば、上述の実施形態では、
本発明を、二値画像の顔画像を感情認識する場合に適用する場合を説明したが、これに限
らず、多値画像の顔画像を感情認識する場合にも適用可能である。
【0046】
以下、多値画像の顔画像を感情認識する場合を説明する。一般にディジタル機器は基本
的な色としてR(赤)・G(緑)・B(青)を採用しているものが多いので、色はこれの
RGBの組み合わせで表現されるものとする。なお、RGBはそれぞれが0から255ま
で変化するものとし、これらの組み合わせで色を表現するものとする。ちなみに、黒はR
=G=B=255の組み合わせ、白はR=G=B=0の組み合わせであり、それらの中間
の値を有するR=G=Bの組み合わせは無彩色(グレー)である。このように、RGBに
より色だけではなく階調も表現することができる。
この場合、特開2004−171115号公報(以下、これを参考技術文献という)の
技術を適用して以下のように計算される。詳述すると、図1において、各点p1,p2,
・・・,pi,・・・,pnの電荷はR,G,Bの階調(例えば、0から255)の影響
を受けるため、各電荷をQiとすると、点Pにおける誘導場の強さMpは式(5)のよう
に定義される。
【0047】
【数6】

【0048】
ここで、Qi(R,G,B)は、RGBそれぞれの独立の関数(Qi(R),Qi(G
),Qi(B))の線形結合であり、二値画像の場合、Qi(R=0,G=0,B=0)
=1であり、多値画像の場合、Qi(R,G,B)は1よりも大(Qi>1)となる。こ
れらQi(R),Qi(G),Qi(B)は、前述の参考技術文献によれば、階調(濃度
)が大きくなってある値に達すると飽和するほぼS字カーブを描く曲線となり、また、階
調(濃度)の変化に対してR(赤)が最も敏感であり、続いてB(青)、G(緑)の順と
なることが知られている。
これは、例えば、交通標識などにおいては注意を促す表示を行う際、色としては赤、青
の順で用いられ、緑はあまり用いられないことが多いことと一致している。このような注
意を促す度合いの大きさは誘導場の強さやエネルギであると考えられるが、それを根拠に
すると、Qiの色による変化の違いは、上述の交通標識の事例と一致している。したがっ
て、この式(5)で用いられるQiを得るための関数は心理実験などによって決定するこ
とができる。
【0049】
従って、式(5)を用いることにより、多値画像の誘導場を計算することができる。そ
して、この誘導場が決まれば、上述の実施形態とほぼ同様の処理で、複雑度Cを計算し、
得られた複数の複雑度Cとポテンシャル値pとの対応関係をシグモイド関数で近似し、近
似誤差やパラメータ(レンジa、オフセット値b、パラメータp0、T)に基づいて顔画
像から感情を判定することができる。
このように、多値画像の顔画像を感情認識する場合は、多値画像から二値画像に変換す
る必要がないため、かかる変換時の情報落ちがない分、判定精度を向上させることができ
る。
【0050】
但し、多値画像から感情認識する場合は、計算量が増えて計算時間が長くなってしまう
。このため、判定速度を優先する場合は、二値画像に変換して感情認識し、判定精度を優
先する場合は、多値画像のまま感情認識するというように、いずれの感情認識を行うかを
選択可能にしてもよい。
【0051】
また、上述の実施形態では、顔画像の視覚の誘導場の分布を示す顔画像用関数として、
シグモイド関数を用いる場合について説明したが、これに限らず、顔画像の視覚の誘導場
を表現可能な他の関数を適用してもよい。
また、上述の実施形態では、予め得たそれぞれの感情に対応するシグモイド関数のうち
、近似したシグモイド関数に似ている一つのシグモイド関数を算出することによっていず
れの感情かを判定する場合について説明したが、これに限らず、近似したシグモイド関数
に似ている複数のシグモイド関数が存在した場合は、これら複数のシグモイド関数に対応
する複数の感情が混在した状態、例えば、「怒り」と「驚き」が混在した状態と判定する
ようにしてもよい。この場合、予め得たそれぞれの感情に対応するシグモイド関数のうち
、近似したシグモイド関数に似た一又は複数のシグモイド関数が存在するか否かをパラメ
ータの比較により行うようにすればよい。この構成によれば、感情間の狭間にある状態も
識別可能になる。
【0052】
また、本発明は、以上説明した本発明を実施するための処理手順が記述された制御プロ
グラムを作成し、この制御プログラムを電気通信回線を介してダウンロード可能にしたり
、そのようなプログラムを、磁気記録媒体、光記録媒体、半導体記録媒体といった、コン
ピュータに読み取り可能な記録媒体に記憶して配布する、といった態様でも実施され可能
である。
なお、本実施形態に係る感情認識装置をカメラ、スキャナ、プロジェクタ、テレビ、プ
リンタ等のあらゆる電子機器が備える形態で実施することも可能である。例えば、上述し
た感情認識装置を備えるカメラは、撮影対象の顔画像に対応する感情を認識し、楽しい感
情と認識した場合は明るい色調補正を施すといったように、認識した感情に基づいて画像
補正を実行することが可能となる。また、上述した感情認識装置を備えるプリンタは、印
刷対象画像に含まれる顔画像に対応する感情を認識し、楽しい感情と認識した場合は、楽
しげなフレーム(枠)を自動が画像に付加して印刷するといったように、認識した感情に
基づいて画像を加工し、印刷することが可能となる。
【図面の簡単な説明】
【0053】
【図1】視覚の誘導場を説明するためのディジタル画像の画素配列を示す図である。
【図2】視覚の誘導場の強さを求める際の遮蔽条件を説明する図である。
【図3】(A)は文字「A」の視覚の誘導場を遮蔽条件を考慮した求めた場合を示す図であり、(B)は視覚の誘導場を遮蔽条件を考慮せずに求めた場合を示す図である。
【図4】シグモイド関数の一例を示す図である。
【図5】(A)は怒りの表情の顔画像の一例を示す図であり、(B)は(A)の誘導場を示す図であり、(C)は普通の表情の顔画像の一例を示す図であり、(D)は(C)の誘導場を示す図であり、(E)は喜びの表情の顔画像の一例を示す図であり、(F)は(E)の誘導場を示す図である。
【図6】(A)は主要な顔部品を除く部分があまり除去されていない顔の二値画像を示す図であり、(B)は主要な顔部品を除く部分ができるだけ除去された顔の二値画像を示す図であり、(C)は(B)の図から主要な顔部品を抽出した二値画像を示す図である。
【図7】感情毎の顔画像のシグモイド関数の一例を示す図である。
【図8】(A)は感情毎の範囲を示す図であり、(B)は感情毎のパラメータ範囲を示す図である。
【図9】本実施形態に係る感情認識装置の機能構成を示すブロック図である。
【図10】感情認識装置の処理フローを示すフローチャートである。
【符号の説明】
【0054】
10…感情認識装置、11…顔画像入力部(入力手段)、12…顔領域抽出部(領域抽
出手段)、13…感情判別部(感情判別手段)、14…表示部(出力手段)、21…誘導
場計算部(計算手段)、22…誘導場分布評価部(関数算出手段)、23…判定部(判定
手段)。

【特許請求の範囲】
【請求項1】
顔画像を入力する入力手段と、
前記顔画像の周囲に分布する「場」であって、その強さが顔画像からの距離に依存し、
顔画像に近いほど大きな値を持つ視覚の誘導場を求め、前記誘導場の分布情報に基づいて
前記顔画像に対応する感情を判別する感情判別手段と
を備えることを特徴とする感情認識装置。
【請求項2】
請求項1に記載の感情認識装置において、
前記感情判別手段は、前記顔画像の視覚の誘導場から等ポテンシャル線の閉曲面の複雑
度を求め、この複雑度と等ポテンシャル値との対応関係である曲線情報を、前記誘導場の
分布情報として取得し、前記曲線情報に基づいて感情を判別することを特徴とする画像認
識装置。
【請求項3】
請求項2に記載の感情認識装置において、
前記感情判別手段は、
前記曲線情報を近似する関数を算出する関数算出手段と、
前記関数算出手段により算出される関数と、予め得たそれぞれの感情に対応する関数と
の比較により感情を判定する感情判定手段とを有することを特徴とする画像認識装置。
【請求項4】
請求項3に記載の感情認識装置において、
前記関数特定手段は、シグモイド関数を算出することを特徴とする感情認識装置。
【請求項5】
請求項4に記載の感情認識装置において、
前記シグモイド関数は、複雑度をC、ポテンシャル値をpとし、レンジをa、オフセッ
ト値をb、パラメータをT、p0とした場合に、
【数1】

で定義されるシグモイド関数であり、
前記感情判定手段は、前記シグモイド関数のパラメータに基づいて感情を判定すること
を特徴とする感情認識装置。
【請求項6】
請求項5に記載の感情認識装置において、
前記感情判定手段は、前記関数算出手段により算出されたシグモイド関数と、予め得た
それぞれの感情に対応するシグモイド関数との比較により感情を判定することを特徴とす
る感情認識装置。
【請求項7】
請求項6に記載の感情認識装置において、
前記感情判定手段は、予め得たそれぞれの感情に対応するシグモイド関数のうち、前記
関数算出手段により算出されたシグモイド関数に似た一又は複数のシグモイド関数を算出
し、似たシグモイド関数が一つだけ存在した場合は、その一つのシグモイド関数に対応す
る感情と判定し、似たシグモイド関数が複数存在した場合は、その複数のシグモイド関数
に対応する複数の感情が混在した状態と判定することを特徴とする感情認識装置。
【請求項8】
請求項1乃至7のいずれかに記載の感情認識装置において、
前記顔画像は二値画像であることを特徴とする感情認識装置。
【請求項9】
請求項1に記載の感情認識装置を備えることを特徴とする電子機器。
【請求項10】
顔画像の周囲に分布する「場」であって、その強さが顔画像からの距離に依存し、顔画
像に近いほど大きな値を持つ視覚の誘導場を求め、前記誘導場の分布情報に基づいて前記
顔画像に対応する感情を認識することを特徴とする感情認識方法。
【請求項11】
コンピュータを、
顔画像を入力する入力手段と、
前記顔画像の周囲に分布する「場」であって、その強さが顔画像からの距離に依存し、
顔画像に近いほど大きな値を持つ視覚の誘導場を求め、前記誘導場の分布情報に基づいて
前記顔画像に対応する感情を判別する感情判別手段として機能させるための制御プログラ
ム。
【請求項12】
コンピュータを、
顔画像を入力する入力手段と、
前記顔画像の周囲に分布する「場」であって、その強さが顔画像からの距離に依存し、
顔画像に近いほど大きな値を持つ視覚の誘導場を求め、前記誘導場の分布情報に基づいて
前記顔画像に対応する感情を判別する感情判別手段として機能させるための制御プログラ
ムが記録されたコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2008−123399(P2008−123399A)
【公開日】平成20年5月29日(2008.5.29)
【国際特許分類】
【出願番号】特願2006−308727(P2006−308727)
【出願日】平成18年11月15日(2006.11.15)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】