説明

パターン認識装置、パターン認識方法及びプログラム

【課題】より信頼度の高いパターンの認識結果を得ることができるようにする。
【解決手段】入力データから複数の部分データを抽出し、前記抽出した複数の部分データそれぞれに対して、予め登録されている登録データの対応する部分データとの間で類似度を算出し、前記算出された複数の類似度を、学習されたパラメータを用いて、それぞれ複数の変換後類似度に変換する。このとき、入力データが登録データと同一のカテゴリに属するデータである場合に算出される類似度と、入力データが登録データと異なるカテゴリに属するデータである場合に算出される類似度とを差別化させるように学習されたパラメータを用いて変換する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はパターン認識装置、パターン認識方法及びプログラムに関し、例えば、顔などを識別するために用いて好適な技術に関する。
【背景技術】
【0002】
近年、画像処理により画像から対象パターンを検出する実用的な手法が提案されている。特に対象パターンを人間の顔とした場合には、様々な応用が考えられるため、その検出手法に関して盛んに研究開発が行われている。さらには、顔を検出するだけでなく、検出した顔が、予め登録している人物の中の誰であるのかを識別する顔認識の手法に関しても盛んに研究開発が行われている。これらの検出/認識手法においてよく用いられる技術としてマッチング手法がある。マッチング手法では、予め用意してあるテンプレート(登録画像)と処理対象画像(入力画像)との間で、正規化相関処理や距離算出処理等の識別処理により類似度を算出している。
【0003】
例えば特許文献1には、照明変動やオクルージョンの状態に関係なく、入力画像を正しく分類するように、入力画像と登録画像とをそれぞれ部分領域に分割して認識処理を行う手法が開示されている。特許文献1に示す手法では、まず、入力画像と登録画像とをそれぞれ部分領域に分割し、分割した部分領域同士の距離を算出する。続いて、各部分領域について得られた距離を平均して統合距離値を算出する。そして、これらの処理を各カテゴリの登録画像について行い、算出した統合距離値の最小値を求め、その最小値が閾値よりも小さい場合にその最小距離を持つカテゴリを認識結果として出力する。
【0004】
また、特許文献2には、2つの画像の共通パターンを探し出すために、一方の画像を部分領域に分割し、他方の画像に対して、スキャンさせながら相関値を算出する手法が開示されている。この手法では、スキャンさせた後に最大の相関値を算出した位置に対して、相関値の2乗である類似度を投票する。この処理を全ての部分領域で行うことにより投票空間において類似度の累積が行われ、その中の最大の類似度と閾値とを比較することによって、共通パターンの有無を判定している。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第4161659号公報
【特許文献2】特許第3997749号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1や特許文献2に示す手法では、部分領域毎に算出された距離や相関値を単純にそのまま加算して、最終的な類似度を算出している。そのため、以下に示すような問題点がある。
【0007】
例えば、距離を加算して類似度とした場合には、各部分領域で正規化されていないので、ある部分領域で極端に大きな距離が算出されると、平均値として統合距離値は大きくなる。このように、部分領域毎に得られる距離を加算したものを最終的な類似度(統合距離値)と定義すると、統合距離値同士を比較した場合に信頼度が低下するという問題点がある。
【0008】
また、相関値を加算して類似度とした場合には、一般的に相関値は間隔尺度ではないことから、相関値を加算(または加算結果から平均を算出)するという処理がなじまない。このように、部分領域毎に得られる相関値をそのまま加算したものを最終的な類似度(統合類似度)と定義すると、統合類似度同士を比較した場合に信頼度が低下するという問題点がある。
【0009】
このように、距離或いは相関値を単純に加算すると、特定の部分領域での結果が統合類似度に相対的に大きく影響を与えてしまう可能性がある。
【0010】
本発明は前述の問題点に鑑み、より信頼度の高いパターンの認識結果を得ることができるようにすることを目的としている。
【課題を解決するための手段】
【0011】
本発明のパターン認識装置は、入力データから複数の部分データを抽出し、前記抽出した複数の部分データそれぞれに対して、予め登録されている登録データの対応する部分データとの間で第1の類似度を算出する類似度算出手段と、前記類似度算出手段によって算出された複数の第1の類似度を、学習されたパラメータを用いて、それぞれ複数の第2の類似度に変換する変換手段と、前記変換手段によって変換された複数の第2の類似度を統合して第3の類似度を算出する統合手段と、前記統合手段によって算出された第3の類似度に基づいて、前記入力データが前記登録データと同一のカテゴリに属するデータであるか否かを識別する識別手段とを備え、前記変換手段は、入力データが登録データと同一のカテゴリに属するデータである場合に算出される類似度と、入力データが登録データと異なるカテゴリに属するデータである場合に算出される類似度とを差別化させるように学習されたパラメータを用いて変換することを特徴とする。
【発明の効果】
【0012】
本発明によれば、同一カテゴリである場合に算出される類似度と、異なるカテゴリである場合に算出される類似度との間に十分なマージンができる。したがって、類似度の信頼性が増加し、信頼度の高いパターンの認識結果を得ることができる。
【図面の簡単な説明】
【0013】
【図1】実施形態における顔認識システムの機能構成例を示すブロック図である。
【図2】部分領域の一例を示す図である。
【図3】部分領域データの一例を模式的に示した図である。
【図4】学習用の部分領域データの一例を模式的に示した図である。
【図5】イントラ類似度及びエクストラ類似度の分布例を示す図である。
【図6】イントラ類似度及びエクストラ類似度の頻度ヒストグラムを示す図である。
【図7】顔認識システムを構成する装置のハード構成例を示すブロック図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態における認識システムについて説明する。ここで、認識とは、認識対象がいくつかの概念(カテゴリ)に分類できる時に、観測された認識対象をそれらのカテゴリの1つに対応させる処理である。例えば顔認識とは、入力された画像中に存在する顔が、予め登録している人物の中の誰であるのかを識別する処理である。本実施形態では、パターン認識として顔認識を例にして説明する。なお、顔認識処理の前段である顔検出処理(画像中での顔の位置、サイズ、傾きの検出)において、公知の手法により顔が検出されているものとする。ここで本実施形態における顔の傾きとは、画像内の回転角度(面内回転角度)を指すものとする。
【0015】
本実施形態では、顔検出処理によって検出された顔の位置、サイズ、及び傾きに応じて顔の周囲画像が既に切り出されており、さらに予め定められた顔のサイズ、傾きに正規化されている。したがって、本実施形態による処理が行われる画像は、画像中において目、鼻、口等の位置が概ね揃っているものとする。また、本実施形態では、説明を簡単化するため、画像は全てグレースケール画像(輝度画像)であるものとする。
【0016】
次に、本実施形態に係る顔認識システムを実行するハードウェア構成について説明する。
図7は、本実施形態に係る顔認識システムを構成する情報処理装置のハードウェア構成例を示すブロック図である。
図7において、CPU(中央演算装置)1100は、本実施形態に係る顔認識システムをプログラムに従って実行する。プログラムメモリ1101には、CPU1100により実行されるプログラムが記憶されている。RAM1102は、CPU1100によりプログラムを実行する時に、各種情報を一時的に記憶するためのメモリとして機能する。ハードディスクドライブ1103は、画像ファイルや登録画像の部分領域データなどを記憶するための記憶媒体である。ディスプレイ1104は、本実施形態の処理によって出力される処理結果をユーザに提示するための表示装置である。制御バス・データバス1105は、これら各部とCPU1100とを接続するためのバスである。
【0017】
図7に示すハードウェア構成は、顔認識システムの全てをCPU1100の処理によって行う場合の構成であるが、一部の処理を専用ハードウェアに置き換えることも可能である。例えば、顔認識システムで行われる処理を専用ハードウェアで行うといったことも可能である。
【0018】
図1は、本実施形態における顔認識システム100の機能構成例を示すブロック図である。
図1において、顔認識システム100には、入力データとして処理対象画像が入力され、認識処理結果が出力される。認識処理結果としては、予め登録されている人物が処理対象画像中に存在すると判断した場合には、その人物を特定する情報が出力される。一方、予め登録されているどの人物も処理対象画像中に存在しないと判断した場合は、その旨が出力される。
【0019】
顔認識システム100の動作モードとしては、登録モードと認識モードとがある。登録モードの時には、部分領域データ抽出部101は、処理対象画像として登録画像(認識したい人物が映っている画像)を入力し、処理対象画像に対して複数の部分領域を設定してその部分領域データ(画素値)を抽出する。そして、登録部分領域データ格納部103に登録画像の部分領域データを格納する。一方、認識モードの時は、部分領域データ抽出部101は、処理対象画像として検査画像(認識したい人物が映っているか否かを調べたい画像)を入力する。そして、同様に処理対象画像に対して複数の部分領域を設定してその部分領域データ(画素値)を抽出する。そして、類似度算出部102は、登録モードの時に登録部分領域データ格納部103に格納した登録画像の部分領域データと、検査画像の部分領域データとの類似度を算出する。
【0020】
また、図1に示す処理対象画像とは、前述したように、公知の顔検出処理によって顔のサイズや傾きが一定になるように、元の画像から切り出され、正規化された画像である。
【0021】
部分領域情報格納部104には、処理対象画像に対して設定する部分領域それぞれの位置、大きさ、形状等の情報が格納されており、これらの情報は、予め決定されている。部分領域データ抽出部101は、部分領域情報格納部104に格納されているこれらの情報に基づいて複数の部分領域を設定する。
【0022】
図2は、部分領域の一例を示す図である。図2に示すように、処理対象画像200に対して部分領域201〜204が設定されている。なお、本実施形態では、部分領域の数は4つの例を示しているが、さらに多くても少なくてもよい。また、図2に示す例では、それぞれの部分領域は重ならないように配置されているが、一部重なっていてもよく、碁盤の目状に隙間なく配置されていてもよい。さらに、部分領域の大きさは全て同じでも異なっていてもよく、形状は矩形に限定されない。
【0023】
部分領域情報格納部104には、例えば図2に示すような部分領域201〜204の位置、大きさ、形状の情報が格納されている。位置の情報としては、顔検出処理によって切り出して正規化された画像であるため、処理対象画像200内の相対位置でよい。或いは、目や口等の器官位置を検出し、検出した器官位置を基準とする位置としてもよい。
【0024】
登録部分領域データ格納部103には、登録モードの時に部分領域データ抽出部101から出力される登録画像の部分領域データが格納される。このとき、その登録画像のID(登録画像中の人物を特定する情報)、及び画像番号(登録画像各々を特定する情報)も対応付けて格納される。一方、認識モードの時には、登録部分領域データ格納部103に格納さている登録画像の部分領域データがその対応するID、画像番号と共に出力される。なお、登録モードの時に複数の登録画像が登録されている場合には、全ての登録画像の部分領域データが出力される。
【0025】
図3は、登録部分領域データ格納部103に格納された部分領域データの一例を模式的に示した図である。図3に示す例では、4枚の登録画像に対してそれぞれ4つの部分領域データが格納されている。例えば「ID_0」の部分領域201のデータは「LA_0_0」である。4枚の登録画像のうち、最初の2枚のIDは「ID_0」であり、残りの2枚のIDはそれぞれ「ID_1」、「ID_2」である。なお、「ID_0」の2枚の登録画像は、IDは同じだが画像は異なるものである。
【0026】
類似度算出部102は認識モードの時に動作し、登録画像の部分領域データと、入力された検査画像の部分領域データとの間で、対応する部分領域毎の類似度(第1の類似度)を算出する。本実施形態では、部分領域データを単純に1次元ベクトル化し、登録画像と検査画像との対応する部分領域のベクトル間のなす角(θ)の余弦(cosθ)を算出し、算出した余弦(cosθ)の値を類似度とする。
【0027】
例えば、部分領域201〜204に対応する部分領域データ抽出部101から送られる検査画像の部分領域データを順に「LA_x_0」、「LA_x_1」、「LA_x_2」、「LA_x_3」とする。類似度算出部102は、「LA_x_0」に対して、図3に示す「LA_0_0_0」、「LA_0_1_0」、「LA_1_0_0」、「LA_2_0_0」との間で部分領域201に関する類似度を求める。さらに、部分領域202に対応する「LA_x_1」、部分領域203に対応する「LA_x_2」及び部分領域204に対応する「LA_x_3」に対して同様の処理を行う。このように、類似度算出部102から出力される類似度は、(部分領域の数)×(登録された画像枚数)に等しい数となり、図3に示す例の場合には16個の類似度が出力される。また、出力される類似度には、類似度を算出する際に用いられたIDと画像番号と部分領域名とが対応付けられているものとする。
【0028】
類似度変換パラメータ格納部105には、類似度算出部102から出力される類似度に対して、学習によって予め決定されている変換を行うためのパラメータが格納されている。本実施形態では、以下に示すような学習を行って類似度変換パラメータを算出する。
【0029】
まず、パラメータ学習用としてIDが付与された学習用顔画像に対し、顔検出処理を経て、部分領域データ抽出部101と同様の処理により部分領域データを抽出し、図4に示すようにID情報と対応付けておく。学習画像としては、IDの異なる顔画像だけでなく、IDが同一だが画像は異なるものも多数用意する。なお、学習においては、図1に示した顔認識システム100を使用する必要はなく、同じ機能をもつものを使用してもよい。
【0030】
次に、類似度算出部102は、部分領域毎に学習画像間で総当たりにより類似度を算出する。例えば図4に示すような学習用の部分領域を例に説明する。部分領域201においては、「LA_a_0_0」と「LA_a_1_0」との間の類似度、...、「LA_a_0_0」と「LA_b_0_0」との間の類似度、...というように全ての部分領域201のデータ間で総当たりにより類似度を算出する。
【0031】
このとき、類似度の算出に用いた2つの部分領域が同じIDに属する場合、その類似度をイントラ類似度と定義する。例えば、「LA_a_0_0」と「LA_a_1_0」との間で算出した類似度をイントラ類似度と定義する。同様に、類似度の算出に用いた2つの部分領域が異なるIDに属する場合、その類似度をエクストラ類似度と定義する。例えば、「LA_a_0_0」と「LA_b_0_0」との間で算出した類似度をエクストラ類似度と定義する。このような処理を行うことにより、部分領域毎にイントラ類似度とエクストラ類似度とが多数算出される。ここで、イントラ類似度のラベルを+1とし、エクストラ類似度のラベルを−1とする。
【0032】
次に、部分領域毎にイントラ類似度とエクストラ類似度とを分離する識別関数を非線形SVM(Support Vector Machine)により学習させる。このときの非線形カーネルとしてはガウシアンカーネルを採用する。このようにして学習で得られた部分領域毎の識別関数を類似度変換パラメータとし、類似度変換パラメータ格納部105に格納される。
【0033】
類似度変換部106は、類似度算出部102から送られてくる類似度に対し、類似度変換パラメータ格納部105に格納された類似度変換パラメータ(識別関数)を用いて、以下に示すような変換を部分領域毎に行い、変換後類似度(第2の類似度)を出力する。例えば、部分領域201に対応する類似度変換パラメータ(識別関数)に、類似度算出部102から送られてくる部分領域201の類似度を代入し、識別関数の出力値を得る。識別関数の出力値としては、符号(ラベル)等の2値化情報ではなく、識別関数の出力値をそのまま用い、この識別関数の出力値を部分領域の変換後類似度として出力する。この処理を全ての部分領域に対して行い、全部分領域の変換後類似度を算出して出力する。出力する変換後類似度には、変換後類似度の算出に用いられた登録画像のIDと画像番号と部分領域名とを対応付けておく。
【0034】
次に、類似度変換部106による変換処理に関して、図5を参照しながら詳細に説明する。図5において、横軸は類似度を示しており、縦軸は、学習のときに用いたラベル(+1或いは−1)の値を示している。また、図5における印501は、学習に用いたイントラ類似度をプロットしたものであり、印502は、学習に用いたエクストラ類似度をプロットしたものである。なお、図5に示す例では、簡略化してイントラ類似度及びエクストラ類似度をそれぞれ2点のみを示している。
【0035】
類似度変換部106では、識別関数の出力値をそのまま変換後類似度として用いている。したがって、前述の類似度変換パラメータの学習は、ラベル(+1或いは−1)を値として扱ったイントラ類似度及びエクストラ類似度の分布に対して、回帰関数を学習するのと同じである。図5の曲線503は、学習結果の回帰関数の例を示している。このようにして学習された回帰関数の出力値を変換後類似度として用いると、イントラ類似度は1.0に近い値に変換され、エクストラ類似度は−1.0に近い値に変換される。
【0036】
この様子を図6に模式的に示している。図6(a)には、変換前のイントラ類似度とエクストラ類似度との頻度ヒストグラムを示し、図6(b)には、変換後のイントラ類似度とエクストラ類似度との頻度ヒストグラムを示している。図6に示すように、変換後のイントラ類似度とエクストラ類似度との間の分離度は、変換前のイントラ類似度とエクストラ類似度との間の分離度に比べて向上していることがわかる。
【0037】
ここで分離度を向上させる意義について説明する。本実施形態では、複数の部分領域それぞれで算出される類似度に対して、イントラ類似度とエクストラ類似度との間の分離度を向上させるような変換を行う。仮に、部分領域を用いずに単一の領域(例えば顔全体を包含するような領域)で認識システムを構築する場合には、図6に示したようなヒストグラムが1つずつできるだけであり、分離度を向上させる意義は乏しい。つまり、入力画像と登録画像とが同一IDと判断するか、異なるIDと判断するかの閾値として、図6(a)に示すヒストグラムを用いても、図6(b)に示すヒストグラムを用いても、認識性能にはあまり差がない。
【0038】
しかしながら、部分領域が複数有り、類似度や変換後類似度が複数算出される場合には、複数の類似度や変換後類似度を統合して、閾値と比較することになる。したがって、各部分領域でのイントラ類似度とエクストラ類似度との間の分離度を高めておいた上で、統合処理を行ったほうが、統合後の類似度(統合類似度)においても高い分離度が期待できる。つまり、各部分領域の類似度をそのまま統合するよりも、変換後類似度に変換してから統合したほうが、認識性能を向上させることができる。複数の類似度の具体的な統合処理に関しては後述する。
【0039】
類似度統合部107は、部分領域毎に算出される変換後類似度を統合して統合類似度(第3の類似度)を算出する。そして、算出した統合類似度と予め決められた閾値とを比較して、認識処理結果を出力する。認識処理結果としては、入力画像が、予め登録している人物のうちの誰であるのか、あるいは該当する人物がいないといった判定結果となる。
【0040】
類似度統合部107には、類似度変換部106から変換後類似度が入力される。入力される変換後類似度の個数は、(部分領域の数)×(登録された画像枚数)であり、それぞれの変換後類似度には、その類似度を算出する際に用いられたIDと画像番号と部分領域名とが対応付けられている。類似度統合部107では、入力された変換後類似度に対して、画像番号が同一のもの同士を加算し、それぞれの画像番号ごとに統合類似度を算出する。次に、画像番号ごとに算出された統合類似度のうちから最大の統合類似度(最大統合類似度と呼ぶ)を持つ画像番号と、そのIDを特定する。その後、最大の統合類似度と、予め決められた閾値とを比較して、その最大統合類似度が閾値を超えた場合に、その最大統合類似度に関連付けられたID情報の人物が、検査画像中に存在すると判断する。一方、最大統合類似度が閾値を超えない場合は、登録しているどの人物も検査画像中に存在しないと判断する。
【0041】
本実施形態の顔認識システム100では、登録モードと認識モードとが存在するが、登録モードは必ずしも存在しなくてもよい。例えば、登録画像に対して、登録モードと同等の処理を予め他の装置等で行って部分領域データを算出しておき、登録部分領域データ格納部103に格納してもよい。
【0042】
また、本実施形態では、部分領域データ抽出部101は、部分領域情報格納部104に格納された部分領域の情報を用いて部分領域のデータ(画素値)を抽出している。一方、画素値ではなく、部分領域から何らかの特徴量抽出処理を行った結果を部分領域データとして出力してもよい。例えば、部分領域に対して、主成分分析を行った結果を部分領域データとしてもよい。その場合には、学習画像から、主成分分析に必要な射影行列を部分領域毎に算出しておいて、部分領域情報格納部104に格納しておけばよい。また、部分領域データ抽出部101において、各部分領域ごとに増分符号を算出し、それを部分領域データとしてもよい。
【0043】
また、本実施形態では、類似度変換パラメータを学習する際に、学習画像間で総当たりにより類似度を算出した。一方、学習画像の枚数が十分にある場合には、必ずしも総当りで類似度を算出する必要はなく、一部をサンプリングして類似度を算出してもよい。
【0044】
また、本実施形態では、類似度変換パラメータ格納部105に、部分領域毎の識別関数を類似度変換パラメータとして格納しているが、必ずしも識別関数そのものを格納しておく必要はない。例えば、識別関数をテーブル形式にして類似度変換パラメータとして格納してもよい。その場合、図5に示す曲線503を表現するテーブルを、部分領域の数だけ格納する。類似度変換パラメータをテーブル形式にすると、類似度変換部106での演算が軽量化される。つまり、識別関数そのものを類似度変換パラメータとした場合には、類似度変換部106において多数の積和演算を実行する必要があるのに対して、識別関数をテーブル形式にしたものを類似度変換パラメータとした場合には、その必要はなくなる。
【0045】
また、本実施形態では、類似度統合部107において、画像番号が同一のもの同士で変換後類似度を加算した値を統合類似度としたが、画像番号が同一である変換後類似度の平均値を統合類似度としてもよい。また、全ての部分領域の変換後類似度を加算するのではなく、画像番号ごとに、全ての部分領域の変換後類似度のうち、大きいほうから所定数の変換後類似度を選択し、選択した変換後類似度のみを加算して統合類似度としてもよい。また、単純に加算するのではなく、部分領域によって重み付けをして加算してもよい。
【0046】
また、本実施形態では、類似度変換パラメータの学習に非線形のSVMを用いたが、本発明はそれに限定されるものではない。本実施形態では、部分領域ごとの類似度をそのまま加算して統合類似度とするのではなく、イントラ類似度とエクストラ類似度とでより差別化させるように学習した変換を類似度に施してから統合類似度を算出する。したがって、この趣旨に沿った学習によって類似度変換パラメータを算出するものであってもよい。
【0047】
また、本実施形態では、類似度として、登録画像及び検査画像の対応する部分領域のベクトル間のなす角の余弦値としたが、例えば、ベクトル同士の正規化相関値や内積を用いてもよい。
【0048】
また、本実施形態では、顔認識システムに入力する入力データ、登録データとして画像を用いた場合の例を示したが、処理対象とするのは画像だけに限らず、音声データを用いた音声認識等でもよい。音声データのような時系列データでは、部分データとしては、時間で区切ったデータとすればよい。
【0049】
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【符号の説明】
【0050】
102 類似度算出部
106 類似度変換部
107 類似度統合部

【特許請求の範囲】
【請求項1】
入力データから複数の部分データを抽出し、前記抽出した複数の部分データそれぞれに対して、予め登録されている登録データの対応する部分データとの間で第1の類似度を算出する類似度算出手段と、
前記類似度算出手段によって算出された複数の第1の類似度を、学習されたパラメータを用いて、それぞれ複数の第2の類似度に変換する変換手段と、
前記変換手段によって変換された複数の第2の類似度を統合して第3の類似度を算出する統合手段と、
前記統合手段によって算出された第3の類似度に基づいて、前記入力データが前記登録データと同一のカテゴリに属するデータであるか否かを識別する識別手段とを備え、
前記変換手段は、入力データが登録データと同一のカテゴリに属するデータである場合に算出される類似度と、入力データが登録データと異なるカテゴリに属するデータである場合に算出される類似度とを差別化させるように学習されたパラメータを用いて変換することを特徴とするパターン認識装置。
【請求項2】
前記変換手段は、部分データごとに学習されたパラメータを用いて複数の第2の類似度に変換することを特徴とする請求項1に記載のパターン認識装置。
【請求項3】
前記変換手段は、非線形SVM(Support Vector Machine)により学習されたパラメータに前記第1の類似度を代入することによって、前記第2の類似度に変換することを特徴とする請求項1又は2に記載のパターン認識装置。
【請求項4】
前記非線形SVMのカーネルがガウシアンカーネルであることを特徴とする請求項3に記載のパターン認識装置。
【請求項5】
前記類似度算出手段は、前記入力データの部分データと、前記登録データの対応する部分データとの正規化相関値を用いて前記第1の類似度を算出することを特徴とする請求項1乃至4の何れか1項に記載のパターン認識装置。
【請求項6】
前記類似度算出手段は、前記入力データの部分データを示すベクトルと、前記登録データの対応する部分データを示すベクトルとの間のなす角の余弦を用いて前記第1の類似度を算出することを特徴とする請求項1乃至4の何れか1項に記載のパターン認識装置。
【請求項7】
前記統合手段は、前記複数の第2の類似度から値の大きい順に所定数の第2の類似度を選択し、前記選択した第2の類似度を統合することを特徴とする請求項1乃至6の何れか1項に記載のパターン認識装置。
【請求項8】
前記統合手段は、前記複数の第2の類似度のそれぞれに対して重み付けして、前記重み付けした第2の類似度を加算することを特徴とする請求項1乃至7の何れか1項に記載のパターン認識装置。
【請求項9】
入力データから複数の部分データを抽出し、前記抽出した複数の部分データそれぞれに対して、予め登録されている登録データの対応する部分データとの間で第1の類似度を算出する類似度算出工程と、
前記類似度算出工程において算出された複数の第1の類似度を、学習されたパラメータを用いて、それぞれ複数の第2の類似度に変換する変換工程と、
前記変換工程において変換された複数の第2の類似度を統合して第3の類似度を算出する統合工程と、
前記統合工程において算出された第3の類似度に基づいて、前記入力データが前記登録データと同一のカテゴリに属するデータであるか否かを識別する識別工程とを備え、
前記変換工程においては、入力データが登録データと同一のカテゴリに属するデータである場合に算出される類似度と、入力データが登録データと異なるカテゴリに属するデータである場合に算出される類似度とを差別化させるように学習されたパラメータを用いて変換することを特徴とするパターン認識方法。
【請求項10】
入力データから複数の部分データを抽出し、前記抽出した複数の部分データそれぞれに対して、予め登録されている登録データの対応する部分データとの間で第1の類似度を算出する類似度算出工程と、
前記類似度算出工程において算出された複数の第1の類似度を、学習されたパラメータを用いて、それぞれ複数の第2の類似度に変換する変換工程と、
前記変換工程において変換された複数の第2の類似度を統合して第3の類似度を算出する統合工程と、
前記統合工程において算出された第3の類似度に基づいて、前記入力データが前記登録データと同一のカテゴリに属するデータであるか否かを識別する識別工程とをコンピュータに実行させ、
前記変換工程においては、入力データが登録データと同一のカテゴリに属するデータである場合に算出される類似度と、入力データが登録データと異なるカテゴリに属するデータである場合に算出される類似度とを差別化させるように学習されたパラメータを用いて変換することを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−226616(P2012−226616A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2011−94435(P2011−94435)
【出願日】平成23年4月20日(2011.4.20)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】