説明

画像識別情報付与プログラム及び画像識別情報付与装置

【課題】画像に関する相関情報を用いて画像に対して複数の識別情報を付与する画像識別情報付与プログラム及び画像識別情報付与装置を提供する。
【解決手段】画像識別情報付与装置1は、複数のクエリ画像120からそれぞれ特徴量を抽出する特徴抽出部3と、特徴抽出部3によって抽出された特徴量から学習モデル130を用いてクエリ画像120に付与すべき複数のラベルに対してそれぞれ量子化値を計算するアノテーションスコア量子化部5と、ラベルの数に対応した数の確率場モデルを有し、ラベル毎の量子化値を複数の確率場モデルに入力し、クエリ画像120毎に複数のラベルに対するスコアを出力するラベル推定部7とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像識別情報付与プログラム及び画像識別情報付与装置に関する。
【背景技術】
【0002】
近年、画像アノテーション技術は、画像データベース管理における画像検索システム、画像認識システムなどのための一つの重要な技術となっている。この画像アノテーション技術により、ユーザは、例えば、必要とする画像と意味的に近い画像を検索できる。
【0003】
画像アノテーション技術として、例えば特許文献1〜4に開示されているものがある。これらは、未知画像に対する意味的なラベルを付与するが、手段としては画像の特徴量を抽出してから最近傍アルゴリズム(NN:Nearest Neighbor)を用いて、類似画像を検索し、検索された類似画像に付与されたラベルを用いてターゲット画像にレベルを付与する。しかしながら、最近傍アルゴリズムで抽出された画像のみからラベルを付与するという方法では、アノテーションの精度が高くないという問題があった。
【0004】
上記の問題を改善するため、特許文献5、6で提案されているものがある。これらは、画像特徴に対するラベルの出現頻度に基づいて、学習された識別器を用いて各ラベルの確率を推定する。
【0005】
また、既存の分類方法を改良するために、ラベルと特徴量の相関情報を正準相関分析(CCA:Canonical Correlation Analysis)でモデリングして、画像特徴量と意味的なラベルのギャップを埋めるモデルが提案されている(例えば非特許文献1参照。)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−352782号公報
【特許文献2】特開2007−109067号公報
【特許文献3】特開2009−188951号公報
【特許文献4】特開2010−271769号公報
【特許文献5】特開2000−353173号公報
【特許文献6】特開2009−48334号公報
【非特許文献】
【0007】
【非特許文献1】T.BAilloeul, C.Zhu and Y.Xu, “Automatic image tagging as a random walk with priors on the canonical correlation subspace”, MIR 2008
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかし、特許文献5、6に開示された方法では、識別器がオブジェクトのクラス毎に構築され、独立に各ラベルの事後確率を計算しているので、クラス間の相関を利用できないという問題がある。また、非特許文献1に開示された方法では、CCAにより構築したグラフモデルからランダムウォークでターゲット画像の特徴量からラベルを推定するものであり、局所的な最小値に陥る可能性があり、また計算時間もかかるという問題がある。
【0009】
本発明の課題は、画像に関する相関情報を用いて画像に対して複数の識別情報を付与する画像識別情報付与プログラム及び画像識別情報付与装置を提供することである。
【課題を解決するための手段】
【0010】
[1]コンピュータを、複数の画像からそれぞれ特徴量を抽出する抽出手段と、前記抽出手段によって抽出された前記特徴量から学習モデルを用いて前記画像に付与すべき複数の識別情報に対してそれぞれ第1の評価値を計算する計算手段と、前記識別情報の数に対応した数の確率場モデルを有し、前記複数の画像について前記計算手段によって計算された前記識別情報毎の前記第1の評価値を前記複数の確率場モデルに入力し、前記画像毎に前記複数の識別情報に対する第2の評価値を出力する出力手段として機能されるための画像識別情報付与プログラム。
【0011】
[2]前記出力手段の前記確率場モデルを前記複数の画像間の相関情報に基づいて最適化する最適化手段を、さらに備えた前記[1]に記載の画像識別情報付与プログラム。
【0012】
[3]前記出力手段の前記確率場モデルを前記複数の識別情報間の相関情報に基づいて最適化する最適化手段を、さらに備えた前記[1]に記載の画像識別情報付与プログラム。
【0013】
[4]複数の画像からそれぞれ特徴量を抽出する抽出手段と、前記抽出手段によって抽出された前記特徴量から学習モデルを用いて前記画像に付与すべき複数の識別情報に対してそれぞれ第1の評価値を計算する計算手段と、前記識別情報の数に対応した数のMRFモデルを有し、前記複数の画像について前記計算手段によって計算された前記識別情報毎の前記第1の評価値を前記複数の確率場モデルに入力し、前記画像毎に前記複数の識別情報に対する第2の評価値を出力する出力手段とを備えた画像識別情報付与装置。
【発明の効果】
【0014】
請求項1又は4に記載された発明によれば、画像に関する相関情報を用いて画像に対して複数の識別情報を付与することができる。
【0015】
請求項2に記載された発明によれば、複数の画像間の相関情報に基づいて画像に対して最適化された複数の識別情報を付与することができる。
【0016】
請求項3に記載された発明によれば、複数の識別情報間の相関情報に基づいて画像に対して最適化された複数の識別情報を付与することができる。
【図面の簡単な説明】
【0017】
【図1】図1は、本発明の第1の実施の形態に係る画像識別情報付与装置の構成例を示すブロック図である。
【図2】図2は、ラベル推定部の概略の構成例を示し、(a)は平面図、(b)は側面図である。
【図3】図3は、第1の実施の形態の動作例を示すフローチャートである。
【図4】図4は、本発明の第2の実施の形態に係る画像識別情報付与装置の構成例を示すブロック図である。
【発明を実施するための形態】
【0018】
以下、本発明の実施の形態について図面を参照して説明する。なお、各図中、実質的に同一の機能を有する構成要素については、同一の符号を付してその重複した説明を省略する。
【0019】
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る画像識別情報付与装置の構成例を示すブロック図である。この画像識別情報付与装置1は、画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8、アノテーション情報出力部9及び記憶部10を有して概略構成されている。
【0020】
従来のアノテーション手段は、学習コーパス(学習用画像と学習用画像に付与されたラベルとが対になったもの)中の学習用画像から周知の特徴抽出手法により特徴量を抽出し、特徴量とラベルとの関連を識別モデルとして学習する。学習された識別モデル、すなわち学習モデル130は、データベースに保存する。そして、クエリ画像(入力画像、未知画像ともいう。)120にラベルを付与するため、学習モデル130を用いてクエリ画像120に対して、ラベルの事後確率を計算し、最も高い値を持つラベルを推定結果とする。
【0021】
本明細書において、「アノテーション」とは、画像全体に対してラベルを付与することをいう。「ラベル」は、識別情報の一例であり、画像の全体又は部分領域の内容を表す識別情報、例えば単語である。
【0022】
本実施の形態は、ラベル事後確率計算部4によりラベルの事後確率を計算してから、画クエリ像120間の相関情報に基づいてMRFモデルもしくはCRFモデルでラベルの順位を調整してクエリ画像120にラベルを付与する。ここで、「MRFモデル」とは、マルコフ確率場(MRF:Markov Random Field)モデルのことであり、「CRFモデル」とは、条件付き確率場(CRF:Conditional Random Field)モデルのことである。これらのマルコフ確率場モデル及び条件付き確立場モデルは、確率場モデルの一例である。
【0023】
以下、本実施の形態の特徴的な部分、すなわち量子化部5、ノード接合部6及びラベル推定部7を中心に説明する。
【0024】
画像受付部2は、ラベルを付与する対象画像のクエリ画像120を受け付ける。
【0025】
特徴抽出部3は、抽出手段の一例であり、クエリ画像から特徴量を抽出する。特徴量は、例えばR,G,B等の色やテクスチャなどの画像特徴を並べたものである。
【0026】
ラベル事後確率計算部4は、特徴量fから各ラベルcの事後確率(P(c|f))を算出し、ラベル毎にアノテーションスコア(アナログ値)として出力する。
【0027】
記憶部10には、画像識別情報付与プログラム110等の各種のプログラム、クエリ画像120、学習モデル130、ラベル辞書140、リンク情報150等の各種のデータが格納されている。記憶部10は、例えばROM、RAM、HDD等により構成されている。
【0028】
アンテーション出力部9は、ラベル付与部8によって付与されたアノテーション情報(ラベルとスコア)を外部に出力するものであり、例えば液晶ディスプレイ等の表示部や、プリンタ等の印刷部を用いることができる。
【0029】
(量子化部)
従来のMRFやCRFを用いた画像アノテーション技術では、例えば非特許文献“Word co-occurrence and Markov Random Field for Improving Automatic Image Annotation ”H.J.Escalante, M.Montes and L.E.Sucar, BMVC,2007に開示されているように、ラベルの共起を用いてMRFモデルを構築し、ラベルの確率を観測値として入力し、入力画像に対してラベルを推定する。この従来技術では、画像のラベルを推定する隠れノードは複数のラベルから一つのラベルを選択するノードであり、したがって、1つの画像全体又は画像領域に対して1つのラベルしか付与できず、画像全体に複数のラベルを付与するアノテーションには適用できない。
【0030】
これを解決するために、本実施の形態は、各ラベルに対して1つのMRFもしくはCRFモデルを持ち、各モデルの隠れノードは量子化されたラベルの確率を持つ。そしてMRFもしくはCRFモデルで推定した量子化値によって、ラベルの順位を決め、1つの画像に対してスコアの高い複数のラベルを付与するものである。
【0031】
本実施の形態の量子化部5は、ラベル事後確率計算部4がラベル毎に算出したアナログ値であるアノテーションスコアを量子化する。量子化した値(量子化値)は、離散化した値(離散化値)である。アノテーションスコアのレベルを均等に量子化するため、ヒストグラム平坦化(Histogram Equalization)方法で決定する。量子化値は、後述するMRFモデル70〜70の各事後確率計算ノード72の隠れ変数の初期状態とされる。アノテーションスコア(アナログ値)とこれに対応する量子化値の一例を表1に示す。表1中、Mは画像の数であり、Nはラベルの数である。ここで、ラベル事後確率計算部4及び量子化部5は、計算手段の一例であり、ラベル事後確率計算部4が算出するアナログ値であるアノテーションスコア、及び量子化部5が出力する量子化値は、第1の評価値の一例である。
【0032】
【表1】

【0033】
(ノード接合部)
本実施の形態のノード接合部6は、画像間の相関情報に基づいて事後確率計算ノード72及び推定事後確率計算ノード73間を接合する接合リンク76の位置情報(リンク情報)150を生成し、生成したリンク情報150を記憶部10に格納する。入力側リンク75及び出力側リンク77は、予め付けられている。画像間の相関情報として、例えば画像の撮影時間、画像特徴量の類似度等を用いることができる。相関情報としてアノテーション(ラベル)間の相関を用いる例は、後述する。
【0034】
ノード接合部6は、一連の複数のクエリ画像(クエリ画像集合)120を入力して、画像間の相関情報を計算してから、MRFモデル0〜70の事後確率計算ノード72及び推定事後確率計算ノード73間の接合方法を決める。接合方法の一例として、画像間の特徴量の類似度がある閾値以上の場合、当該画像に対応する事後確率計算ノード72及び推定事後確率計算ノード73間に接合リンク76を付与し、画像間の類似度が閾値より小さい場合、対応するノード72、73間に接合リンク76を付与しない。また、撮影時刻がお互いに近い画像に対して接合リンク76を付与してもよい。リンク情報150の一例を表2に示す。画像の数は、事後確率計算ノード72の数、及び推定事後確率計算ノード73の数と同じである。表2において、「1」はノード72、73間に接合リンク76がある場合を示し、「0」はノード72、73間に接合リンク76がない場合を示す。
【0035】
【表2】

【0036】
また、リンク情報150は事前に画像の相関情報から生成することができるが、動的にリンク情報150を生成してもよい。すなわち、事後確立計算ノード72の隠れ変数の状態により、隠れ変数間の距離又は量子化値の差がある閾値以下の場合、ノード72、73間の接合リンク76を自動的に追加し、隠れ変数間の距離又は量子化値の差がある閾値より大きい場合、ノード72、73間の接合リンク76を自動的に除外してもよい。
【0037】
(ラベル推定部)
図2は、ラベル推定部7の概略の構成例を示す図である。ラベル推定部7は、ラベル毎に設けられたMRFモデル70〜70を有し、対応するMRFモデル70〜70のノード隠れ変数の初期状態の設定及びノードを繋げるリンク情報150を入力して、グラフカットメッセージ・パッシング方法(Yuri Boykov, O.Veksler, R.Zabih, “Fast Approximate Energy Minimization via Graph Cuts”,PAMI2001)により、ラベルの量子化状態を最適化する。
【0038】
各MRFモデル70〜70は、同一の構造を有しているので、代表としてMRFモデル70について説明する。MRFモデル70は、図2(a)に示すように、量子化値Qが入力される入力ノード71〜71と、アノテーションスコア量子化部5から出力された事後確率を保持する事後確率計算ノード72〜72と、推定の事後確率を計算する推定事後確率計算ノード73〜73と、ラベルのスコアを出力する出力ノード74〜74と、入力ノード71〜71と事後確率計算ノード72〜72を接合する入力側リンク75〜75と、事後確率計算ノード72〜72と推定事後確率計算ノード73〜73を接合する接合リンク76と、推定事後確率計算ノード73〜73と出力ノード74〜74を接合する出力側リンク77〜77とを有して概略構成されている。また、画像と入力ノード71〜71及び出力ノード74〜74は一対一に対応しているので、各MRFモデル70〜70の入力ノード71〜71及び出力ノード74〜74の数は、画像の数Mと同じである。
【0039】
例えば、最初の画像(Image1)の量子化値Q11〜Q1Nは、MRFモデル70〜70の各入力ノード71に入力し、次の画像(Image2)の量子化値Q21〜Q2Nは、MRFモデル70〜70の各入力ノード71に入力し、同様にM番目の画像(ImageM)の量子化値QM1〜QMNは、MRFモデル70〜70の各入力ノード71Mに入力し、その後MRFモデル70〜70の各出力ノード74〜74Mから画像1〜Mに対する各ラベルL〜Lのスコアが出力される。
【0040】
入力側リンク75〜75及び出力側リンク77〜77は、予め与えられている。接合リンク76は、リンク情報150に基づいてノード接合部6により与えられる。接合リンク76は、1つのMRFモデル70の事後確率計算ノード72〜72と推定事後確率計算ノード73〜73を接合するだけでなく、MRFモデル70〜70間でも接合する。
【0041】
以上の構成により、すべてMRFモデル70の各対応するノードの状態を比較して、画像に対するすべてラベルを付与する。すなわち、画像Mに対してはMRFモデル70〜70の出力ノード74Mの値を比較し、上位のラベルをその画像に対して付与する。ここで、ラベル推定部7は、出力手段の一例であり、出力ノード74から出力するラベルL〜Lのスコアは、第2の評価値の一例である。
【0042】
(第1の実施の形態の動作)
図3は、第1の実施の形態の動作例を示すフローチャートである。本実施の形態は、画像の相関情報に基づき、MRFモデル70〜70に接合リンク76を付けるのが特徴である。
【0043】
画像受付部2がクエリ画像120を受け付けると、特徴抽出部3は、クエリ画像120から特徴量を抽出する。
【0044】
ラベル事後確率計算部4は、周知の識別器により保存された学習モデル130を用いて、クエリ画像120に対する各ラベルの事後確率を計算し(S1)、その事後確率をアノテーションスコアとして出力する。
【0045】
量子化部5は、ラベル事後確率計算部4が出力したアノテーションスコアをあらかじめ定められた閾値に応じて量子化する(S4)。量子化された値は、隠れノードの初期値に設定され、その後グラフカットメッセージ・パッシング方法により、推定事後確率計算ノード73に隠れ変数の最終状態の推定結果が保持される。
【0046】
次に、すべての推定事後確率計算ノード73が処理した後に、ノード72、73間を繋げるリンク情報150を取得する。ノード接合部6は、画像の相関情報に基づいて接合リンク76を付ける(S5)。画像の相関情報が時間の場合、画像ペアの撮影時間の差が予め定められた時間(例えば5時間)以下の場合、該当するペアのノード72、73間に接合リンク76を付ける。また、異なる画像の撮影時間の差が予め定められた時間(例えば5時間)よりも大きい場合、該当するペアのノード72、73間に接合リンク76を付けない。
【0047】
画像の相関情報が画像の類似度である場合、画像から様々な特徴量を抽出する。例えば、RGB、normalized−RG、HSV(色空間)、LAB、robustHue特徴量(van de Weijer, C. Schmid, “Coloring Local Feature Extraction”, ECCV 2006を参照)、Gabor特徴量、DCT(Direction Curve Tangent)特徴量、SIFT(Scale Invariant Feature Transform)特徴量及びGIST(Generalized Search Tree)特徴量であり、いかなる特徴を用いてもよい。画像同士の類似度は、特徴量の距離とする。正規化した距離が0.5以下場合には画像ペアに対応するノード72、73のペアの間に接合リンク76を付ける。0.5より大きい場合には画像ペアに対応するノード72、73のペアの間に接合リンク76を付けない。
【0048】
以上のようにして1つのラベルに対応するMRFモデル70を構築する。次のステップでは、MRFモデル70を最適化する(S6)。すなわちラベルに対応するMRFモデル70〜70の事後確率計算ノード72に上記ステップS4で計算された隠れ変数状態を入力し、ノード72、73間を接合するリンク情報150を入力して、ノード72,73間に接合リンク76を付ける。上記ステップS4、S5、S6は、すべてのラベル及びノードについて行われる(S2、S3)。
【0049】
最後に、各ラベルに対応するMRFモデル70〜70を全部最適化し、1つの画像に対応するすべてのMRFモデル70〜70の推定事後確率計算ノード73〜73の隠れ変数の最終状態を統合し、その結果、画像に対するすべてアノテーションスコア調整できた。そして調整したアノテーションスコアの順位を付けて、高い順にクエリ画像にラベルを付与する(S7)。例えば、1つの画像(Image1)の量子化値Q11〜Q1Nを、MRFモデル70〜70の各入力ノード71に入力すると、すべてのMRFモデル70〜70の各推定事後確率計算ノード73の隠れ変数が出力ノード74から各ラベルL〜Lのスコアとして出力される。
【0050】
(第1の実施の形態の効果)
第1の実施の形態によれば、複数の画像間の相関情報に基づいてMRFモデルを最適化しているので、本構成を採用しない場合と比べて画像に対して高い精度で複数のラベルを付与することができる。
【0051】
[第2の実施の形態]
図4は、本発明の第2の実施の形態に係る画像識別情報付与装置の構成例を示すブロック図である。本実施の形態の画像識別情報付与装置1は、第1の実施の形態と同様に、画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8、アノテーション情報出力部9及び記憶部10を有して概略構成されている。本実施の形態は、第1の実施の形態とは、ノード接合部6が異なり、他は第1の実施の形態と同様に構成され、同様の作用を奏するので、その説明を省略する。
【0052】
本実施の形態のノード接合部6は、ラベルの相関情報に基づいてMRFモデル70の事後確率計算ノード72及び推定事後確率計算ノード73間に接合リンク76を生成し、生成した接合リンク76の位置情報であるリンク情報を記憶部10に保存する。ラベルの相関情報として、例えば、ある画像ペアに対して、量子化されたアノテーションスコアにより上位5つを列挙し、順位を問わず、画像ペアの同じラベルの数を数える。同じラベルの数は1つ以上の場合、対応するノード72、73間に接合リンク76を付与し、同じラベルの数がゼロの場合、対応するノード72、73間に接合リンク76を付与しない。
【0053】
(第2の実施の形態の効果)
第2の実施の形態によれば、複数のラベル間の相関情報に基づいてMRFモデルを最適化しているので、本構成を採用しない場合と比べて画像に対して高い精度で複数のラベルを付与することができる。
【実施例1】
【0054】
次に、本発明の実施例について、画像の数Mを100、量子化値の範囲を1から2000とした場合を例に挙げて説明する。ラベル事後確率計算部4が算出したアナログ値のアノテーションスコアは、量子化部5によって離散化値に変換される。表3は、アノテーションスコア(アナログ値)と量子化値(離散化値)の具体的な一例を示す。
【0055】
【表3】

【0056】
表3中、画像IDの下の括弧は、画像に付与すべき正解ラベルを示す。表3から、量子化部5が出力したアノテーションスコア(ラベル事後確率)のみで第1位のラベルを付けると、Image1、ImageMについて不正解となっていることから、精度が高くないことが分かる。
【0057】
ノード接合部6が作成したノード情報(ノード接合マトリクス)150の一例を表4に示す。表4中、「1」は画像間に時間的な相関があるため、ノード72、73間に接合リンク76がある場合を示し、「0」は画像間に時間的な相関が無いため、ノード72,73間に接合リンク76がない場合を示す。
【0058】
【表4】

【0059】
表5は、調整する前(MRFモデルの入力値)の量子化されたアノテーションスコア(量子化値)と、調整した後(MRFモデルの出力値)のアノテーションスコア(量子化値)である。
【0060】
【表5】

【0061】
ここでは、画像の数を100とし、量子化値の範囲を1から2000とする。表5中の量子化値は、アナログ値の量子化値がヒストグラム平坦化方法により離散化値に変換されたものである。表5中の画像IDの下の括弧は、画像に付けるべき正解ラベルを示す。表5の2列目と3列目はMRFモデル70を最適化する前のものである。最適化前のラベルは量子化値が高い順に並んでいる。最適化前の量子化値は表3と同じである。また、表5の4列目と5列目はMRFモデル70を最適化した後のものである。最適化後のラベルは、量子化値(調整アノテーションスコア)が高い順に並んでいる。以上の結果より、画像IDImage1については、最適化前はラベル「hug」が第1位であったが、最適化後はラベル「hand」が第1位となり、正解が得られている。また、画像IDImage100については、最適化前と最適化後で第1位のラベル「hand」は変わらない。しかし、第2位は最適化前のラベル「face」から最適化後はラベル「foot」に変わり、さらに量子化値も「117」から「148」に高くなり、正解に近くなるので、精度が高くなることが分かる。
【0062】
本実施例によれば、クエリ画像集合に対する、周知の情報検索の評価値であるF値(F-measure)は、0.536から0.549に向上した。本実施例は、画像の相関を用いたが、ラベルの相関を用いた場合も、本実施例と同様の効果が期待できる。
【0063】
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を変更しない範囲で種々に変形が可能である。例えば、画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8及びアノテーション情報出力部9の各機能は、コンピュータ読み取り可能な画像識別情報付与プログラム110に従ってCPUが動作することにより実現してもよい。また、上記実施の形態の画像受付部2、特徴抽出部3、ラベル事後確率計算部4、量子化部5、ノード接合部6、ラベル推定部7、ラベル付与部8及びアノテーション情報出力部9の全て又は一部をASIC等のハードウエアによって実現してもよい。
【0064】
また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入替え、削除、追加等は、本発明の要旨を変更しない範囲内で可能である。
【符号の説明】
【0065】
1…画像識別情報付与装置、2…画像受付部、3…特徴抽出部、4…ラベル事後確率計算部、5…量子化部、6…ノード接合部、7…ラベル推定部、8…ラベル付与部、9…アノテーション情報出力部、10…記憶部、70〜70…MRFモデル、71〜71…入力ノード、72〜72…事後確率計算ノード、73〜73…推定事後確率計算ノード、74〜74…出力ノード、75〜75…入力側リンク、76…接合リンク、77〜77…出力側リンク、110…画像識別情報付与プログラム、120…クエリ画像、130…学習モデル、140…ラベル辞書、150…リンク情報

【特許請求の範囲】
【請求項1】
コンピュータを、
複数の画像からそれぞれ特徴量を抽出する抽出手段と、
前記抽出手段によって抽出された前記特徴量から学習モデルを用いて前記画像に付与すべき複数の識別情報に対してそれぞれ第1の評価値を計算する計算手段と、
前記識別情報の数に対応した数の確率場モデルを有し、前記複数の画像について前記計算手段によって計算された前記識別情報毎の前記第1の評価値を前記複数の確率場モデルに入力し、前記画像毎に前記複数の識別情報に対する第2の評価値を出力する出力手段として機能されるための画像識別情報付与プログラム。
【請求項2】
前記出力手段の前記確率場モデルを前記複数の画像間の相関情報に基づいて最適化する最適化手段を、さらに備えた請求項1に記載の画像識別情報付与プログラム。
【請求項3】
前記出力手段の前記確率場モデルを前記複数の識別情報間の相関情報に基づいて最適化する最適化手段を、さらに備えた請求項1に記載の画像識別情報付与プログラム。
【請求項4】
複数の画像からそれぞれ特徴量を抽出する抽出手段と、
前記抽出手段によって抽出された前記特徴量から学習モデルを用いて前記画像に付与すべき複数の識別情報に対してそれぞれ第1の評価値を計算する計算手段と、
前記識別情報の数に対応した数の確率場モデルを有し、前記複数の画像について前記計算手段によって計算された前記識別情報毎の前記第1の評価値を前記複数の確率場モデルに入力し、前記画像毎に前記複数の識別情報に対する第2の評価値を出力する出力手段とを備えた画像識別情報付与装置。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2013−54458(P2013−54458A)
【公開日】平成25年3月21日(2013.3.21)
【国際特許分類】
【出願番号】特願2011−190967(P2011−190967)
【出願日】平成23年9月1日(2011.9.1)
【出願人】(000005496)富士ゼロックス株式会社 (21,908)
【Fターム(参考)】