説明

データ取得装置、方法及びプログラム

【課題】目的とするオブジェクトの認識に適したデータを画像集合から得ること。
【解決手段】目的のオブジェクトに係るものとして与えられた画像集合から最初に選択した画像を基準としその局所特徴量ごとにクラスタを生成し、以降に選択された画像の局所特徴量を、近似した特徴値のクラスタに分類してクラスタを更新してゆき、要素数の多いクラスタを基に抽出元の画像や特徴値をオブジェクト認識用のデータとして得る。これにより、多くの画像に共通の一般的特徴が重視され少数派の特徴は無視されるので、目的とするオブジェクトの認識に適したデータを画像集合から得ることが可能となる。特に、適切な画像を最初に選択すれば、クラスタへの分類を正しく方向づけ、オブジェクト認識の精度が改善できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対象物の認識に関する。
【背景技術】
【0002】
コンピュータにより画像からオブジェクト(例えば、建物、物品、人物、顔、動植物その他、各種の対象物)を認識する、いわゆるオブジェクト認識の分野において、認識対象とするオブジェクトを含む画像を複数用意して、学習しておくことで認識の精度を改善できることが知られている。そして、学習データとして、目的のオブジェクトを含む大量の画像を収集するには、対象とするオブジェクトの名称をクエリすなわち検索キーワードとした「Yahoo!検索(画像)」(非特許文献1参照)などの画像検索が利用可能である。また、特許文献1のように、検索キーとしてキーワードではなく画像すなわちクエリ画像を用い、類似画像検索により学習事例すなわち学習データを収集する技術も知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−92413号
【非特許文献】
【0004】
【非特許文献1】ヤフー株式会社、「Yahoo!検索(画像)」、[online]、[2011年10月14日検索]、インターネット〈URL: http://image-search.yahoo.co.jp/>
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、キーワードに基づく画像検索等により収集した画像集合には、必ずしも目的のオブジェクトが適切に写っていない画像がしばしば含まれる。不適切な画像の例は、話題は関連するがまったく異なる対象を写した画像、オブジェクトが明確に写っていない夜景、景色の他の要素が目立つ画像、部分拡大画像、特別な視点や手法、特殊映像効果による画像など多岐に亘る。これら不適切な画像を含んだままの画像集合を学習データとすると、オブジェクト認識の精度が低下するので、精度のよい学習データの獲得が重要な課題である。
【0006】
この点、特許文献1の技術では、収集の基準となる特徴量が固定的となり、収集される画像はクエリ画像に依存してしまうため学習データの精度に限界があった。
【0007】
上記の課題に対し、本発明の目的は、オブジェクト認識の精度を向上させる学習データを得ることである。
【課題を解決するための手段】
【0008】
上記の目的をふまえ、本発明の一態様(1)であるデータ取得装置は、画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出手段と、前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成手段と、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定手段と、前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新手段と、要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得手段と、を備えたことを特徴とする。
【0009】
本発明の他の態様(7)であるデータ取得方法は、上記態様を方法のカテゴリで捉えたもので、画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出処理と、前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成処理と、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定処理と、前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新処理と、要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得処理と、をコンピュータが実行することを特徴とする。
【0010】
本発明の他の態様(8)であるデータ取得用コンピュータ・プログラムは、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、コンピュータに、画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出させ、前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成させ、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定させ、前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新させ、要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得させることを特徴とする。
【0011】
本発明の上記態様では、目的のオブジェクトに係るものとして与えられた画像集合から最初に選択した画像を基準としその局所特徴量ごとにクラスタを生成し、以降に選択された画像の局所特徴量を、近似した特徴値のクラスタに分類してクラスタを更新してゆき、要素数の多いクラスタを基に抽出元の画像や特徴値をオブジェクト認識用のデータとして得る。
【0012】
これにより、多くの画像に共通の一般的特徴が重視され少数派の特徴は無視されるので、目的とするオブジェクトの認識に適したデータを画像集合から得ることが可能となる。特に、適切な画像を最初に選択すれば、クラスタへの分類を正しく方向づけ、オブジェクト認識の精度が改善できる。
【0013】
本発明の他の態様(2)は、上記いずれかの態様において、前記クラスタ更新手段は、2回目以降に選択された前記画像から抽出された前記局所特徴量に近似する前記特徴値が存在しない場合は、その局所特徴量に対応するクラスタを生成することを特徴とする。
【0014】
本発明の他の態様(3)は、上記いずれかの態様において、前記クラスタ更新手段は、前記画像集合の画像に基づいて更新した前記クラスタを、再度、同じ画像集合の画像に基づいて更新することを特徴とする。
【0015】
本発明の他の態様(4)は、上記いずれかの態様において、前記データ取得手段により取得されたデータを候補データとし、この候補データに基づく画像を前記画像集合から除いた新たな画像集合に対して、前記特徴量抽出手段、前記クラスタ生成手段、前記特徴値設定手段、前記クラスタ更新手段及びデータ取得手段により新たな候補データを取得させる再実行手段と、前記取得される候補データを比較し、画像数の多いものを最終的なオブジェクト認識用のデータとして選択する結果選択手段と、を備えたことを特徴とする。
【0016】
本発明の他の態様(5)は、上記いずれかの態様において、前記データ取得手段は、前記要素数の多い前記クラスタに分類された前記局所特徴量を抽出した抽出元の前記画像を、オブジェクト認識のための学習用データとして取得することを特徴とする。
【0017】
本発明の他の態様(6)は、上記いずれかの態様において、前記データ取得手段は、前記要素数の多い前記クラスタの前記特徴値を前記オブジェクト認識用のデータとして取得することを特徴とする。
【0018】
なお、上記の各態様は、明記しない他のカテゴリ(方法、プログラム、システムなど)としても把握することができ、方法やプログラムのカテゴリについては、装置のカテゴリで示した「手段」を、「処理」や「ステップ」のように適宜読み替えるものとする。また、処理やステップの順序は、本出願に直接明記のものに限定されず、順序を変更したり、一部の処理をまとめてもしくは随時一部分ずつ実行するなど、変更可能である。
【0019】
また、個々の手段、処理やステップを実現、実行する端末などのコンピュータは共通でもよいし、手段、処理やステップごとにもしくはタイミングごとに異なってもよい。また、上記「手段」の全部又は任意の一部を「部」(ユニット、セクション、モジュール等)と読み替えることができる。
【発明の効果】
【0020】
本発明によれば、オブジェクト認識の精度を向上させる学習データを得ることが可能となる。
【図面の簡単な説明】
【0021】
【図1】本発明の実施形態について構成を示す機能ブロック図。
【図2】本発明の実施形態におけるデータ例を示す図。
【図3】本発明の実施形態における処理手順を示すフローチャート。
【図4】本発明の実施形態における画像集合を示す概念図。
【図5】本発明の実施形態におけるクラスタへの分類を示す概念図。
【発明を実施するための形態】
【0022】
次に、本発明を実施するための形態(「実施形態」と呼ぶ)について図に沿って例示する。なお、背景技術や課題などで既に述べた内容と共通の前提事項は適宜省略する。
【0023】
〔1.構成〕
本実施形態は、図1の構成図に示すデータ取得装置1(以下「本装置1」や「本装置」とも呼ぶ)に関するもので、本装置1は、コンピュータの構成として少なくとも、CPUなどの演算制御部6と、主メモリや補助記憶装置等の記憶装置7と、通信ネットワークN(例えば、携帯電話、PHS、公衆無線LANなどの移動通信網、インターネットなど)との通信手段8(移動通信網との通信回路、無線LANアダプタなど)と、を有する。
【0024】
本装置1では、記憶装置7に記憶した所定のコンピュータ・プログラムを演算制御部6が実行することで、図1に示す各手段などの要素(20,30ほか)を実現する。実現される要素のうち情報の記憶手段の態様は自由で、記憶装置7上のファイルなど任意のデータ形式で実現できるほか、ネットワーク・コンピューティング(クラウド)によるリモート記憶などでもよい。
【0025】
また、記憶手段は、データの格納領域だけでなく、データの入出力や管理などの機能を含んでもよい。また、本出願に示す記憶手段の単位は説明上の便宜によるもので、適宜、構成を分けたり一体化できるほか、明示する記憶手段以外にも、各手段の処理データや処理結果などを記憶する記憶手段を適宜用いるものとする。
【0026】
なお、本願のフロー図などにおいて、記憶手段を表す円筒型の図形は、直接アクセス記憶への限定は意味せず、また、六角形は準備ではなく判断を表すものとする。また、図中(例えば図1)の矢印は、データや制御などの流れについて主要な方向を補助的に示すもので、他の流れを否定するものでも、方向の限定を意味するものでもない。例えばある方向のデータ取得の前後に、データ要求や確認応答(ACK)が逆方向に発生し得る。
【0027】
また、記憶手段以外の各手段は、以下に説明するような情報処理の機能・作用を実現・実行する処理手段であるが、これらは説明のために整理した機能単位であり、実際のハードウェア要素やソフトウェアモジュールとの一致は問わない。
【0028】
〔2.作用効果〕
上記のように構成された本装置1での処理手順を図3のフローチャートに示す。
【0029】
〔2−1.概要〕
まず、図3から概要のみ抽出して述べると、特徴量抽出手段20が、画像集合記憶手段15に記憶されている画像集合から画像を順次選択し、その画像から複数の局所特徴量を抽出する(ステップS11)。そして、クラスタ生成手段30は、画像集合から最初に選択された画像から抽出された局所特徴量ごとに、クラスタを生成する(ステップS12)。また、特徴値設定手段40は、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する(ステップS19)。
【0030】
そして、クラスタ更新手段50は、画像集合Sから画像が選択される都度、その画像から抽出された局所特徴量(ステップS13)について、クラスタの特徴値に近似する局所特徴量が所定数以上であれば(ステップS15:「YES」)、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新する(ステップS16)。その更新の結果、最終的にデータ取得手段60が、要素数の多い(例えば所定割合以上の)クラスタを基に、オブジェクト認識用のデータを取得する(ステップS22)。
以下、各処理について具体的に説明する。
【0031】
〔2−2.画像の選択とクラスタの生成〕
まず、与えられた画像集合Sに対する処理の最初において、特徴量抽出手段20は、画像集合Sからある画像(例えば画像aとする)を一つ選択し、その画像aから局所特徴量(例えばSIFT)を抽出する(ステップS11)。ここで、画像集合Sは、操作者が記憶媒体などで本装置1に与えてもよいが、本装置1が画像検索サーバ2などへ目的物の名称(例えば「東京タワー」など)を送信し、検索結果の画像を受信して画像集合Sとしてもよい。
【0032】
そして、クラスタ生成手段30は、画像集合Sから最初に選択された画像aから抽出された局所特徴量ごとに、クラスタを生成する(ステップS12)。クラスタは局所特徴量の集合により構成され、クラスタを表すデータはクラスタ記憶手段35に記憶されるが(例えば図2)、具体的なデータ構成や登録内容の実現態様は自由である。
【0033】
例えば、図2の例のようにクラスタごとに要素数すなわちそのクラスタに分類された局所特徴量の数(「要素数」)を記憶しておけば、要素数の多寡に応じたクラスタ単位の削除やデータの取得が容易になる。なお、クラスタと、クラスタに分類された局所特徴量との対応付けの態様も自由で、例えば、クラスタごとに局所特徴量のリストを持つ形でもよいし、逆に、抽出された局所特徴量ごとに、分類されたクラスタを示すクラスタIDなどのデータを持つ形でもよい。
【0034】
また、図5(概念図)の例では、各クラスタ01,02,03にそれぞれ、画像aから抽出した例えば「上向きの尖頭部がある」(図4において破線の円で示す局所特徴量a1)、「右向きの凸部がある」(図4において破線の円で示す局所特徴量a2)といった局所特徴量が分類されているが、実際には、局所特徴量毎に抽出元の画像を示す識別情報などもクラスタのデータに含めることが考えられる。クラスタの生成直後は、各クラスタに1つの局所特徴量が分類され、その局所特徴量がクラスタの特徴値を兼ねる。抽出された局所特徴量とクラスタの特徴値については、画像上における座標の位置を考慮して照合などの処理が行われる。座標の位置の照合に、値が略一致する特徴量の座標上での位置関係を用いることにより、オブジェクトが画像に写っている角度やサイズの相違にも対応できる。
【0035】
また、クラスタの生成は、単一の画像から抽出した局所特徴量ごとでもよいが、画像集合Sから最初に二つの画像a,bを選択し、それら二つの画像a,b間から抽出した類似する局所特徴量をransacなどのマッチング手法で座標の照合を行って対応づけ、照合により対応付けられた局所特徴量ごとにクラスタを作成することが望ましい。この場合、クラスタに対応付けられた局所特徴量の数が多ければ同一オブジェクトが存在すると判断でき、その局所特徴量の分布する座標の領域にオブジェクトが存在すると推定できる。
【0036】
なお、最初に選択した画像a,b間で対応付けることができた局所特徴量の数がゼロ又は所定以下で同一オブジェクトが存在しないと考えられる場合、画像a又はbに代えて、画像集合Sから別の画像cを選択し、局所特徴量の抽出と対応付けをやり直す。又は、集合Sに含まれる画像全体に対して局所特徴量のマッチングを行ってもよい。
【0037】
〔2−3.分類とクラスの新規生成〕
上記のように処理の最初にクラスタを生成した後、クラスタ更新手段50は、画像集合Sから画像が選択される都度、その画像から抽出された局所特徴量(ステップS13)と、全てのクラスタの特徴値とを、座標の比較を用いて照合する(ステップS14)。すなわち、ransacなどのマッチング手法によれば、局所特徴量のある座標の位置関係でオブジェクトの有無を判定でき、このransacなどのマッチング手法を用いて、画像から抽出した各局所特徴量と、各クラスタの特徴値との間で、座標と値の照合を行う。
【0038】
照合の結果、画像から抽出された局所特徴量のうち、クラスタの特徴値に近似していて座標の位置関係も一致している局所特徴量が所定数(一つでもよい)以上であれば(ステップS15:「YES」)、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新する(ステップS16)。近似の判断に、局所特徴量の座標と、クラスタの特徴値である画像上での座標の重心との位置関係を考慮することにより、同一のオブジェクトの存在する画像の判定精度が向上する。
【0039】
なお、最初に選択された画像a(ステップS11)からはクラスタが生成されるが(ステップS12)、クラスタ更新手段50は、その後、2回目以降に選択された画像から抽出された局所特徴量(ステップS13)のなかでクラスタに分類されなかったものについては(ステップS17:「NO」)、その局所特徴量に対応するクラスタを新たに生成する(ステップS18)。
【0040】
〔2−4.特徴値の設定ほか〕
また、特徴値設定手段40は、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する(ステップS19)。具体的には、クラスタごとに分類された局所特徴量について、特徴量空間上での重心と画像上での座標位置での重心を算出し、各クラスタの新たな特徴値として設定する。画像上での座標位置での重心は、多様な画像サイズや画像中におけるオブジェクトの回転や縮小拡大に対応するために、最初の画像の座標位置を基に、各画像ごとに回転角度や縮小拡大率を算出した後に座標を正規化する。
【0041】
クラスタの特徴値としてこれら重心を用いることで、どのような局所特徴量(特徴量空間上での重心)が、画像のどのあたり(画像上での座標位置での重心)にあるか、に基づいてクラスタへの分類が可能となる。特に、局所特徴量について画像上での座標位置を判断に含めることで処理精度が高まる。
【0042】
以上の処理を、未処理の画像が尽きる(ステップS20:「NO」)まで繰り返した後、オブジェクト認識用のデータの取得に進むが(ステップS22)、それに先立ってクラスタ内の要素数が所定以下のクラスタを削除してもよい(ステップS21)。これにより、例えば下記のようにクラスタの再更新をする際、少数しか存在しない特徴を分類対象から排除することで、主要な特徴に処理能力を集中できる。
【0043】
〔2−5.クラスタの再更新〕
また、ステップS13での画像の選択順序により、クラスタの特徴値は変動するため、図3に示したステップS13からの処理を、一旦処理済となったクラスタ群に対して再度繰り返して再更新すれば、オブジェクトの特質を精度よく表した特徴値を生成することができる。この場合、クラスタ更新手段50は、画像集合の画像に基づいて更新したクラスタを、再度、同じ画像集合の画像に基づいて更新する。
【0044】
〔2−6.データ取得の態様〕
以上のようにクラスタを更新した結果、最終的に、データ取得手段60は、要素数の多い(例えば所定割合以上の)クラスタを基に、オブジェクト認識用のデータを取得する(ステップS22)。
【0045】
オブジェクト認識用のデータについて、具体的な内容や形式は自由であるが、その第一の例は、データ取得手段60が、要素数の多いクラスタに分類された局所特徴量を抽出した抽出元の画像を、オブジェクト認識のための学習用データとして取得することである。
【0046】
例えば、図4の画像集合Sのうち、最初に画像aを選択すれば、目的のオブジェクト(例えば「○○タワー」)が明瞭に写っている画像a,c,fが取得の対象となり、「○○タワー」が一部のみ写っている画像b、夜景により不明瞭に写っている画像d、景色の一部として写っている画像e、他のオブジェクトの方が目立つ画像gは取得の対象とならない(説明上、×印で示している)。
【0047】
オブジェクト認識用のデータに関する第二の例は、データ取得手段60が、要素数の多いクラスタの特徴値又はそのクラスタに分類された局所特徴量をオブジェクト認識用のデータとして取得することである。図5の例の状態では、例えば、要素数が最多(3つ)であるクラスタ02の特徴値(例えば特徴量空間上での重心と画像上での座標位置での重心)がオブジェクト認識用のデータとなる。
【0048】
〔2−7.候補データの複数取得〕
また、オブジェクトの認識精度をさらに改善するには、オブジェクト認識用のデータを、複数取得することも考えられる。この場合、再実行手段70が、データ取得手段により取得されたデータを候補データとし、この候補データに基づく画像を画像集合から除いた新たな画像集合に対して、特徴量抽出手段20、クラスタ生成手段30、特徴値設定手段40、クラスタ更新手段50及びデータ取得手段60により新たな候補データを取得させる。
【0049】
そのうえで、結果選択手段80が、最初に取得された候補データと、新たに取得された候補データと、を比較し、画像数の多いものを最終的なオブジェクト認識用のデータとして選択する。
【0050】
〔3.効果〕
(1) 以上のように本実施形態では、目的のオブジェクトに係るものとして与えられた画像集合から最初に選択した画像を基準としその局所特徴量ごとにクラスタ(例えば図5、図2)を生成し(例えば図3のステップS12)、以降に選択された画像の局所特徴量を(ステップS13)、近似した特徴値のクラスタに分類してクラスタを更新してゆき(ステップS14〜S16)、要素数の多いクラスタを基に抽出元の画像や特徴値をオブジェクト認識用のデータとして得る(ステップS22)。
【0051】
これにより、オブジェクトに共通する特徴が重視され、少数派の特徴は無視されて、認識用のデータが収集されていくので、オブジェクトの認識に適したデータを画像集合から得ることが可能となる。特に、適切な画像を最初に選択すれば、クラスタへの分類を正しく方向づけ、オブジェクト認識に用いるデータの精度が改善できる。
【0052】
(2) 特に、本実施形態では、2つ目以降に選択された画像の局所特徴量に対応するクラスタがない場合に(ステップS17:「NO」)対応するクラスタを新たに生成することにより(ステップS18)、他の画像に含まれている可能性がある特徴も以降のクラスタ分類の対象とすることができ、オブジェクトの特徴を表すクラスタの生成漏れを防止できるので、オブジェクト認識の精度が改善できる。
【0053】
(3) また、本実施形態では、画像集合に基づく1巡目で分類されたクラスタに対しさらに、同じ画像集合に基づいて2巡目としてクラスタを更新する。これにより、局所特徴量の近似性判断の基準としたクラスタごとの特徴量空間での重心や画像座標上での重心について、1巡目である程度整った状態を活用して、そのクラスタの特徴値を補正していくことにより、さらに高精度なクラスタ分類に反映できるので、オブジェクトの認識精度がさらに改善できる。
【0054】
(4) さらに、本実施形態では、再実行手段70により、候補データを除いた画像集合から、更なる処理で別の候補データを取得し、結果選択手段80により、2つの候補データを比較し画像数の多いものを最終的なオブジェクト認識のデータとして選択する。
【0055】
これにより、最初に選択された画像に偶然、目的のオブジェクトとは別のオブジェクトが写っていても、より目的のオブジェクトを写した画像が多く残る候補データを最終的なオブジェクト認識用のデータとすることができる。このため、画像数の多いほうの候補データを選択することで正しい処理結果が得られ、オブジェクトの認識性が改善できる。
【0056】
(5) 加えて、本実施形態では、要素数の多いクラスタに追加された局所特徴量の抽出元である画像(例えば図7の画像a,c,f)を、オブジェクト認識のための学習用データとして取得することにより、実際のオブジェクト認識にはそれら画像に基づいて、用途などの事情に応じた任意のアルゴリズムを柔軟に適用可能となる。
【0057】
(6) とりわけ、本実施形態では、要素数の多いクラスタ(例えば図5のクラスタ02)の特徴値をオブジェクト認識用のデータとして取得することにより、そのデータを実際のオブジェクト認識における認識対象として円滑に活用可能となる。
【0058】
〔4.他の実施形態〕
なお、上記実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、本出願における構成図、データの図、フローチャートなどは例示に過ぎず、各要素の有無、その配置や処理実行などの順序、具体的内容などは適宜変更可能である。例えば、ステップS11で最初に選択する画像については、複数の画像を候補とし、その中から選択してもよい。具体的には、候補として選定した画像を基準画像とし、その基準画像と、集合S内の各画像との局所特徴量の照合を行い(ステップS15の処理)、マッチングする画像が多い基準の画像を最初の画像とすれば、より標準的なオブジェクトが存在する画像を用いて学習データを得ることができる。
【0059】
また、本装置1を構成する個々の手段を実現する態様は自由で、外部のサーバが提供している機能をAPI(アプリケーション・プログラム・インタフェース)やネットワーク・コンピューティング(いわゆるクラウドなど)で呼び出して実現するなど、本発明の構成は柔軟に変更できる。さらに、本発明に関する手段などの各要素は、コンピュータの演算制御部に限らず物理的な電子回路など他の情報処理機構で実現してもよい。
【符号の説明】
【0060】
01,02,03 各クラスタ
1 データ取得装置
2 画像検索サーバ
6 演算制御部
7 記憶装置
8 通信手段
15 画像集合記憶手段
20 特徴量抽出手段
30 クラスタ生成手段
35 クラスタ記憶手段
40 特徴値設定手段
50 クラスタ更新手段
60 データ取得手段
70 再実行手段
80 結果選択手段
a〜g 画像
a1,a2,a3,c1,c2,d2,d3 局所特徴量
N 通信ネットワーク
S 画像集合

【特許請求の範囲】
【請求項1】
画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出手段と、
前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成手段と、
各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定手段と、
前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新手段と、
要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得手段と、
を備えたことを特徴とするデータ取得装置。
【請求項2】
前記クラスタ更新手段は、
2回目以降に選択された前記画像から抽出された前記局所特徴量に近似する前記特徴値が存在しない場合は、その局所特徴量に対応するクラスタを生成することを特徴とする請求項1記載のデータ取得装置。
【請求項3】
前記クラスタ更新手段は、前記画像集合の画像に基づいて更新した前記クラスタを、再度、同じ画像集合の画像に基づいて更新することを特徴とする請求項1又は2記載のデータ取得装置。
【請求項4】
前記データ取得手段により取得されたデータを候補データとし、この候補データに基づく画像を前記画像集合から除いた新たな画像集合に対して、前記特徴量抽出手段、前記クラスタ生成手段、前記特徴値設定手段、前記クラスタ更新手段及びデータ取得手段により新たな候補データを取得させる再実行手段と、
前記取得される候補データを比較し、画像数の多いものを最終的なオブジェクト認識用のデータとして選択する結果選択手段と、
を備えたことを特徴とする請求項1から3のいずれか一項に記載のデータ取得装置。
【請求項5】
前記データ取得手段は、前記要素数の多い前記クラスタに分類された前記局所特徴量を抽出した抽出元の前記画像を、オブジェクト認識のための学習用データとして取得することを特徴とする請求項1から4のいずれか一項に記載のデータ取得装置。
【請求項6】
前記データ取得手段は、前記要素数の多い前記クラスタの前記特徴値を前記オブジェクト認識用のデータとして取得することを特徴とする請求項1から5のいずれか一項に記載のデータ取得装置。
【請求項7】
画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出処理と、
前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成処理と、
各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定処理と、
前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新処理と、
要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得処理と、
をコンピュータが実行することを特徴とするデータ取得方法。
【請求項8】
コンピュータに、
画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出させ、
前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成させ、
各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定させ、
前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新させ、
要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得させる
ことを特徴とするデータ取得用コンピュータ・プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2013−105373(P2013−105373A)
【公開日】平成25年5月30日(2013.5.30)
【国際特許分類】
【出願番号】特願2011−249676(P2011−249676)
【出願日】平成23年11月15日(2011.11.15)
【出願人】(500257300)ヤフー株式会社 (1,128)
【Fターム(参考)】