説明

画像処理装置およびプログラム

【課題】複数のアスペクト比、横撮り、縦撮りなどの複数の条件で撮影された画像を一括に選択して検索する場合に、すべての画像に適合した検索条件を指定することができないため、意図した検索ができないという問題があった。
【解決手段】検索対象画像を指定する検索対象画像指定手段と、検索条件を入力する検索条件入力手段と、前記検索対象画像からその特徴量を抽出する特徴量抽出手段と、前記特徴量を、入力された前記検索条件に適合するように変換する特徴量変換手段と、前記変換後の特徴量を使用して前記検索対象画像が検索条件に合致するか判定する判定手段とを具備する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像検索用の特徴量を入力し、この特徴量に対する検索条件に合致した画像を検索する画像処理装置およびプログラムに関するものである。
【背景技術】
【0002】
現在、デジタルカメラや、カメラ付き携帯電話が普及したため、デジタル画像を撮影する機会が増えてきている。一方で、CF(Compact Flash)(登録商標)カード、SD(Secure Digital)(登録商標)カード、メモリースティック(登録商標)といった不揮発性RAMを使用した記憶メディアの大容量化が進んでいる。これにともない、メディアに格納される画像の枚数が増えている。また、撮影した画像を、所有しているPC(Personal Computer)などに取り込んで、HDD(Hard Disk Drive)装置に格納し、閲覧、印刷すると言った使用環境が整ってきている。
【0003】
また、最近では、画像管理ソフトウェアとして、画像の閲覧や画像の選択操作をサポートするアプリケーションが増えてきている。その中には、JEIDAによって規格化されているExif(Exchangeable Image File Format)(登録商標)を使ったファイル管理機能を提供しているものがある。
【0004】
Exifでは、撮影時の情報をExif Tagという形式で保管する機能を提供している。このExif tagを使うことで、撮影時間、露出量、焦点距離、WB(Whtite Balance)などの情報を後で知ることが可能になっている。
例えば、撮影時間で管理している画像をソートして、カレンダーとリンクさせることで簡単に撮影時間による画像の検索を行えるUI(User Interface)を提供しているものがある。
【0005】
また別の機能として、ユーザが任意のtag情報を付加できる機能を提供している画像管理ソフトウェアも存在する。こういった画像管理ソフトウェアでは、ユーザが選択した一枚ないし複数の画像にキーワードを付加することができる。キーワードはどんな文字列でもよく、例えば、結婚式、入学式などをキーワードとして入れることが可能である。
【0006】
このようにキーワードを予め画像に付加しておくことで、ユーザは、結婚式、入学式といったキーワードを入力することで検索を行うことができる。
しかしながら、画像の枚数が増えてくると、様々な文字列のキーワードを画像に付加していくことはユーザの負担が大きくなり、なかなか画像を簡単に分類できるようなキーワードの付加ができなくなる。
【0007】
また、キーワードで画像を検索する場合、その画像を特定するようなキーワードは、長くなるか、複数の文字列を組み合わせたものとなる。
例えば、図10に示すような画像1001を検索して見つけたい場合を想定する。予め画像1001には”Aさん”、”Bさん”というキーワードがTag情報1002として付加されている。しかし、その他の画像1003にも同じキーワードがTag情報1004として付加されている。
【0008】
このような状態で、”Aさん”、”Bさん”というキーワードで検索を行うと、2つの画像1001,1003が検索結果として求められる。
しかし、実際には、画像1001は、この画像に向かって左側にAさん、右側にBさんが同じ大きさで写っている画像であるのに対し、画像1003は、二人の配置と顔の大きさが異なっている画像である。
【0009】
従って、画像1001のみを検索したい場合は、より詳しく、”Aさん”、”Bさん”、”Aさんは向かって右”といった構図に関する情報を追加する必要がある。ただし、構図に関する表現は個人でも、tagの付加時に統一的に付けることが必要である。また他の人が検索を行う様な場合には、キーワードの付け方が統一されていないと、キーワードの解析自体と検索自体が行えなくなる。
【0010】
さらにはそれぞれの顔の大きさといった情報がtagに付加されていなければ、検索結果を限定していくことが困難である。
このようにキーワードで画像を検索するには、統一的なキーワードを付加すること、および、より詳細な構図情報を付加することが求められる。このようなことを一般のユーザが定常的に行うことは困難である。
【0011】
以上に説明したような、キーワードによる画像の検索の問題を解決するための発明が、例えば特許文献1、特許文献2に開示されている。
特許文献1では、ユーザが描画した画像の特徴量を求めて、その特徴量と類似度の高い画像を検索結果として表示する方法が開示されている。この方法は、ユーザが検索条件をイラストとして入力できるので、キーワードよりも、検索のための高い表現能力を与えることが可能である。
また、特許文献2では、円形、三角形、四角形といった単純な図形を入力し、画像中の被写体との一致度を求めることで画像検索を行う方法が開示されている。
【先行技術文献】
【特許文献】
【0012】
【特許文献1】特開2000−076268号公報
【特許文献2】特開2001−084274号公報
【発明の概要】
【発明が解決しようとする課題】
【0013】
特許文献1、特許文献2共に、ユーザが入力するイラスト画像の特徴量を求め、その特徴量と類似度が高い画像を画像データベース(以下画像DBと記す)から検索し、その検索結果を表示するものである。
デジタルカメラなどの撮影機器で撮影された画像は、図10に示したように、横撮りの画像1001や縦撮り1003の画像が混在している。特に縦撮り1003の場合、ユーザが撮影機器を時計回りに90°回転させて撮影した場合と、反時計回りに90°回転させて撮影した場合とがある。
【0014】
通常の場合、画像データとして保存される撮影データは、撮影機器の撮像素子が横長の場合が多いため、撮影時の向きにかかわらず一般的に横長のデータとして保存される。従って、縦撮り画像1003は、横取り画像1001と同じ横長な画像として+90°または−90°回転した画像として保存される。図10に、時計回りに+90°回転した画像1003’を示す。
【0015】
従って、特許文献1、特許文献2のような方法で画像検索を行う場合、ユーザが入力した条件をそのまま画像データに適用するだけでは所望の結果を得ることができない問題がある。
つまり、二人が並んでいる画像を検索する場合に限定された画像の縦横アスペクト比のまま検索条件を入力しても、画像1001、1003’を同時に検索することはできない。また画像1003’を回転して上下左右を合わせた後で保存して画像1003とした場合でも、これら3枚の画像を検索することができない。
【0016】
このように従来の方法では、複数のアスペクト比、横撮り、縦撮りなどの複数の様々な条件で撮影された画像を一括に選択して検索する場合に、すべての画像に適合した検索条件を指定することができないため、意図した検索ができないという問題があった。
【課題を解決するための手段】
【0017】
上記問題を解決するために、本発明の画像検索装置は、複数の個人とリンクした顔画像から、顔画像を指定する指定手段と、検索対象画像に前記指定された顔画像と類似する画像が存在するか判定する判定手段と、前記判定手段により存在すると判定された画像を表示装置に表示させる処理手段とを有することを特徴とする。
【発明の効果】
【0018】
本発明によれば、複数のアスペクト比、横撮り、縦撮りなどの様々な複数の条件で撮影された画像を一括に選択して検索を行う場合に、一回の検索条件の指定だけで検索可能な画像処理装置およびプログラムを提供することができる。
【図面の簡単な説明】
【0019】
【図1】本発明による第1の実施形態の画像検索装置のブロック図である。
【図2】同実施形態における画像検索のフローチャートである。
【図3】同実施形態における画像検索アプリケーションのUIの一例である。
【図4】同実施形態における検索条件入力ダイアログのUIと検索条件入力座標系の一例を示す図である。
【図5】同実施形態における顔アイコンの変更方法を説明する図である。
【図6】同実施形態における画像の座標系の変換を説明する図である。
【図7】同実施形態における画像の座標系の変換を説明する図である。
【図8】同実施形態における画像の座標系の変換を説明する図である。
【図9】同実施形態における画像の座標系の変換を説明する図である。
【図10】従来のキーワードによる画像検索の例を示す図である。
【発明を実施するための形態】
【0020】
以下、添付図面を参照して本発明の好適な実施の形態を詳細に説明する。
【0021】
<第1の実施形態>
図1に、本発明の一実施形態である画像検索装置のブロック図を示す。
ここでは、画像検索装置としてPCを使用すると想定して説明するが、PC以外の単体または複数の汎用コンピュータや専用装置を使用することもできる。また、以下では、画像を検索する条件として、写真の主要な被写体の1つである人物、特に顔を検索条件とする画像検索に関して説明する。
【0022】
CPU 101は、中央演算ユニット(Central Processing Unit)であり、他の機能ブロックや装置の制御を行う。ブリッジ部102は、CPU 101と他の機能ブロックのデータのやり取りを制御する機能を提供している。
ROM(Read Only Memory)103は読み込み専用の不揮発性メモリであり、BIOS(Basic Input/Output System)と呼ばれるプログラムが格納されている。BIOSは画像検索装置が起動したときに最初に実行されるプログラムであり、2次記憶装置105、出力装置107、入力装置109などの周辺機器を制御するものである。
RAM(Random Access Memory)104は、高速の読み/書き可能な記憶領域を提供する。
【0023】
2次記憶装置105は、大容量の記憶領域を提供するHDDである。BIOSが実行されると、HDDに格納されているOS(Operating System)が実行される。OSはすべてのアプリケーションで利用可能な基本的な機能や、アプリケーションの管理、基本GUI(Graphical User Interface)を提供する。アプリケーションは、OSが提供するGUIを組み合わせることで、アプリケーション独自の機能を実現するUIを提供できる。OSや、他のアプリケーションの実行プログラムや、作業用に使用しているデータは、必要に応じてRAM 104または2次記憶装置105に格納される。
【0024】
表示制御部106は、OSやアプリケーションに対して行われるユーザの操作の結果をGUIの画像データとして生成し、表示装置107で表示するための制御を行う。表示装置107には液晶ディスプレイや、CRT(Cathode Ray Tube)ディスプレイが使用できる。
【0025】
I/O制御部108は、複数の入力装置109とのインターフェースを提供するものである。代表的なインターフェースとして、USB(Universal Serial Bus)やPS/2(Personal System/2)がある。
入力装置109には、キーボード、マウスといったユーザの意志に基づく指示を画像検索装置に入力するものがある。さらに、デジタルカメラや、USBメモリといった記憶装置などを接続することで、画像データを転送することも可能である。
【0026】
図2に本発明のフローチャートを示す。
本実施形態の画像検索装置による画像検索機能を、アプリケーションのGUIの一機能として提供する場合について説明する。従って、ユーザの指示がマウスやキーボードなどの入力装置109から入力されるため、インタラクティブな動作となる。図2に示した処理フローは、ユーザが画像を検索する際のフローの一例であるが、実際にはインタラクティブな動作となるためフローの途中から最初に戻るなど指示が行われても良い。ここでは説明を簡単にするために、典型的な操作フローについてのみ説明する。
【0027】
図3に画像検索装置で実行される画像検索アプリケーション301の起動時のUIを示す。はじめに、図3を参照し、図2のS01の画像選択ステップで画像を選択する操作を説明する。
【0028】
画像検索アプリケーション301(検索対象画像指定手段)は、フォルダー選択UI 302、画像一覧UI 303、選択画像一覧UI 304の3つの領域で構成されている。ポインティングUI 306(いわゆる、ポインタ)は、マウスなどの入力装置109の操作に応じて可動し、ユーザの操作を画像検索アプリケーション301に入力するためのUIである。
【0029】
フォルダー選択UI 302は、画像検索装置に格納されている画像データの保管場所を選択できる機能を提供している。図3ではポインティングUI 306によって、ある保管場所が指定された状態を示している。
画像一覧UI 303は、フォルダー選択UI 302で選択された保管場所にある画像データの一覧を表示している。選択画像一覧UI 304は、ユーザが選択した画像、またはユーザの指定によって検索された画像のみを表示する領域である。
【0030】
S01で、ユーザが、ポインティングUI 306を移動させて、フォルダー選択UI 302で希望するフォルダーを選択すると、そのフォルダー内に格納されている画像の一覧が、画像一覧UI 303に表示される。
検索を行わずに次の処理対象にしたい画像をポインティングUI 306で選択すると、選択された画像が選択画像一覧UI 304に表示される。例えばImage1 305を選択した場合、Image1 305が選択画像一覧UI 304に表示される。このとき、内部的にはImage1 305が次の処理の対象画像としてリストに登録される。表示はしていないが、フォルダー内の画像を全選択するボタンを用意することも可能である。また、異なるフォルダーを指定して、その中にある画像を追加して選択できる。
【0031】
しかし、後で説明する検索を行う場合、はじめに複数のフォルダーを選択する。選択が完了したらS02の検索条件の入力に移る。検索条件の入力に移るには、検索アプリケーション301の検索メニュー307、または検索ボタン308を選択することで、図4に示した検索ダイアログ401(検索条件入力手段の表示要素)が表示される。
ここでは、画像を検索する際に注目する主要被写体を、人物の顔として説明を続ける。人物の顔は、写真で最も撮影頻度の高い被写体である。従って、画像を検索する際にも、人物が画像中に存在するか?何人存在するか?画像のどこに存在するか?は、非常に有効な検索条件となる。
【0032】
次に、図4を参照して、図2のS02で実行される検索条件の入力方法を説明する。
検索ダイアログ401では顔数402と顔位置403を指定することが可能になっている。顔数402のチェックボックスがチェックされていると、画像中に存在する顔の数を指定することができる。ここで最大顔数、最小顔数を入力することで、
最小顔数 ≦ 画像中の顔数 ≦ 最大顔数
となる条件を設定することができる。
【0033】
次に、顔位置403のチェックボックスがチェックされると、顔の位置を指定することができる。追加ボタン404を選択すると、顔位置入力領域408に顔アイコン409が表示される。顔アイコン409は、ポインティングUI 410によって選択することで顔位置入力領域408内での位置を変更することも可能である。
【0034】
追加ボタン404を複数回選択することで、顔アイコン408を複数個設定することも可能である。また不必要と思われた顔アイコン408はポインティングUI 306で選択して、削除ボタン405を選択することですることで顔位置入力領域408から取り除くことも可能である。
【0035】
さらに、図5に示すように、顔アイコン501には2つのクリップポイント502,503が付いている。クリップポイント502は、顔アイコン501の大きさを調整するために使用する。クリップポイント503は、顔アイコン501の傾き調整するために使用する。
【0036】
図5(a)には、クリップポイント502をポインティングUI 504で選択し、ポインティングUI 504を右下に移動させることで顔アイコン501を拡大している様子を示したものである。同様に図5(b)には、クリップポイント503をポインティングUI 504で選択し、ポインティングUI 504を右斜め下に移動させることで顔アイコン501を時計回りに回転している様子を示したものである。
【0037】
以上に説明したような機能を提供することで、例えば、図4(b)に示す様な、画像中の向かって左の方に、指定した大きさの顔があり、顔数は1から20までの画像といった複雑な検索条件を簡単に指定することができる。
顔位置入力領域408の中は、400に示すような座標系が規定されている{を採用している}。この座標系では、画面に向かって、原点が中止点(x,y) = (0,0)、上辺y = −100、下辺y = 100、左辺x = −100、右辺x = 100となる。
【0038】
従って、顔アイコン409で指定された顔は、中心が(x,y) = (−60,0)にあって、顔の大きさ80、傾きが0°の顔となる。ここで顔の大きさとは顔アイコン409の矩形領域の一辺の長さとする。回転角は、紙面に向かって、上方向を基準として時計回り方向への回転角を正とする。
すべての指定を終えたらOKボタン406を選択することで、条件が確定しS03へ進む。また、Cancelボタン407を選択すると、検索条件の指定を止めてS01に戻ることも可能である。
【0039】
次いで、図2のS03(特徴量抽出工程)では、S01で選択された検索対象画像に含まれる主要被写体の特徴量の算出が行われる。ここで特徴量とは、S02で指定された画像中の顔の位置と大きさと傾きである。
【0040】
画像中の顔の検出方法は、従来より様々な方法が提案されている。例えば本出願人による特開2002−183731号公報に開示の発明がある。これによれば、まず、入力画像から目領域を検出し、目領域周辺を顔候補領域とする。そして、この顔候補領域に対して、画素毎の階調分布の勾配、および階調分布の勾配に基づく重みを算出する。これらの値と、あらかじめ設定されている理想的な顔基準画像の階調分布の勾配、階調分布の勾配に基づく重みを用いて顔候補領域と顔基準画像を比較する。これらの勾配間の角度の平均値または重みつき平均値が所定の閾値以下であった場合、入力画像は顔領域を有すると判定する方法が記載されている。
【0041】
また、特開2003−30667号公報では、まず画像中から肌色領域を検出し、同領域内において、人間の虹彩色画素を検出することにより、目の位置を検出することが可能であるとしている。
さらに、特開平8−63597号公報では、複数の顔の形状をしたテンプレートと画像とのマッチング度を計算し、マッチング度が最も高いテンプレートを選択する。そして、最も高かったマッチング度があらかじめ定められた閾値以上であれば、選択されたテンプレート内の領域を顔候補領域としている。このようにして、上記テンプレートを用いるこことで、目の位置を検出することが可能であるとしている。
【0042】
さらに、特開2000−105829号公報では、まず、鼻画像パターンをテンプレートとし、画像全体あるいは画像中の指定された領域を走査し、最もマッチする位置を鼻の位置として出力する。次いで、画像の鼻の位置よりも上の領域を目が存在する領域と考え、目画像パターンをテンプレートとして目存在領域を走査してマッチングをとり、ある閾値よりもマッチ度が大きい画素の集合である目存在候補位置集合を求める。さらに、目存在候補位置集合に含まれる連続した領域をクラスタとして分割し、各クラスタと鼻位置との距離を算出する。その距離が最も短くなるクラスタを目が存在するクラスタと決定することで、人の顔の器官位置の検出が可能であるとしている。
【0043】
その他、顔および顔内の器官位置を検出する方法としては、数多くの手法が提案されている。例えば、特開平8−77334号公報、特開2001−216515号公報、特開平5−197793号公報、特開平11−53525号公報などに提案されている。また、特開2000−132688号公報、特開2000−235648号公報、特開平11−250267号公報、特登録2541688号公報などにも提案されている。本発明においてはそれらのうちどのような手法を用いても良い。また、顔および顔内の器官位置の検出法については、上記記載に限定されることはなく、その他のどのような手法を用いても構わない。なお、顔および顔内の器官位置の検出に関しては、従来方法が様々な文献および特許で開示されているため、ここでの詳細な説明は省略する。
【0044】
上述のような方法によって元画像データの中にある人物の顔の数と顔領域の座標が得られ、この検出結果の顔座標データが得られる。ここでは、検出結果として顔領域を矩形領域とし、その4頂点の座標が出力されるものとする。顔検出を、図2のS01で選択された画像に対して行って顔検出結果を格納する。顔検出結果は複数個であることもある。当然ながら、S01で検出された顔座標は選択されたそれぞれの画像における座標となっている。そこで、この座標をS02で使用した検索ダイアログ401で指定された顔位置入力領域408の座標系と対応させる必要がある。
【0045】
このため、S04では、検索条件に適合するように、S03で検出された顔検出座標を顔位置入力領域408の座標系に変換する処理が行われる。その変換の方法を、図6,7を参照して説明する。
図6は横長の画像の例であり、図7は縦長の画像の例である。それぞれ2次元で表現され、604,704に示す方向にX,Yの座標軸をもつ。座標系601,701は検索ダイアログ401の座標系である。座標系601,701は、中心を原点とし、x,y共に−100から100間の値を取れる。
【0046】
座標系602,702は、横、縦の画素数がそれぞれW,Hである画像の座標系である。座標系602,702は、左上の点を原点(0,0)とし、右下の(W,H)までの値を取り得る座標系である。座標系603,703は、座標系601,701と同様に、中心を原点とし、X,Y共に−100から100間での値を取る座標系を画像に当てはめたものである。
座標系602,702で表現される任意の点P(x,y)が、相対的に同じ位置にある座標系603,703上での点P’(x’,y’)で表される。このときの変換式は、xが式(1)、yが式(2)で示される。
【0047】
【数1】

【0048】
【数2】

【0049】
この変換式(1),(2)を使って、S03で検出されたすべての顔の座標値を変換する。
次に、S05では、S02で指定された検索条件と、S04で変換された顔の座標から求められる情報との類似度を計算する。検索条件は、画像中に存在する顔の個数(顔数402で指定された値)と顔アイコン409の座表値(顔位置403で指定)である。ここで、顔アイコン409は複数指定されていても良い。
【0050】
最初にS03で検出された顔数が、S02で指定された顔数を満たすか判定し、条件を満たせば、すべての顔検出結果の座標と顔アイコン409の座標の類似度を計算する。類似度は、顔アイコン409と顔検出結果の、対応する4頂点の距離の和、または、各4頂点から計算できる中心点と矩形の大きさと矩形の角度(傾き)の一致度などを使うことができる。
【0051】
S06では顔数が条件を満たし、かつ類似すると判定された顔が存在したか判定する。すなわち、上記変換後の特徴量が検索条件と合致するか判定する。判定は、所定の閾値を予め決めておき、その値とS05で計算した類似度と比較して行う。ここで、閾値を超える類似度の顔が存在すればS07に進み、そこで画像がリストに登録される。一方、存在しない場合は、S08へ進む。
【0052】
S08では、S01で選択されたすべての画像に対し処理を行ったか判定し、まだ終了していなければS03へ進み、次の画像を処理する。すべての画像に対し処理が終了した場合、S09へ進み、これまでの検索結果を、表示装置107で表示する。
【0053】
検索結果は、画像検索アプリケーション301の中の選択画像一覧UI 304の表示を更新することで実現できる。このとき、S07において、類似度に応じて検索結果をソートすることで、選択画像一覧UI 304に表示される結果を、類似度の高い順に表示することも可能である。
【0054】
以上、人物の顔を検索条件として使用する画像検索装置を説明してきたが、検索条件は他のものであっても良い。例えば、個人を認識可能な個人認識方法を採用することでさらに付加価値の高い検索も可能になる。個人認識を利用する場合は、S02で、追加ボタン404で顔アイコン409を追加するときに、あらかじめ個人とリンクさせた顔アイコン409を複数選択しておき、その中から検索したい個人のアイコンを指定できるようにしておけばよい。
【0055】
また、顔、個人に限らず、注目被写体として何らかの物体(オブジェクト)を指定できるようにしても良い。例えば、車、建物といったものが考えられる。それぞれのオブジェクトを検出できる検出器または検出方法を使用することで、顔の場合と同様に検索を行うことが可能になる。
【0056】
また、ある種の撮影機器は、撮影時の傾きを検出してExif Tagに書き込めるものがある。このTag情報はOrientationと呼ばれるもので、この情報を解析することで、画像データの上下左右方向を合わせて表示することができる。検索時に、この情報を活用するかしないかを、ユーザに選択させることで、さらに画像の方向を意識しないで検索条件をそろえて検索することが可能になる。
【0057】
本実施形態の画像検索装置において、S02で入力した検索条件による画像検索結果が表示されるS09の後で、その検索結果がユーザの意図した結果ではないこともあり得る。このとき、検索結果を良くするために、絞り込み検索を提供することも可能である。絞り込み検索とは、ある検索結果に対して、さらに検索条件を追加して検索する方法である。検索ダイアログ401に、図示していないが、絞り込み検索というチェックボックスを設けておき、さらに顔検出アイコン409を追加する、顔数402の指定を変更するなどして検索条件を追加、修正する。この後で、前の検索結果の画像に対して検索を再度行って意図した検索結果が得られるまで繰り返すようにしても良い。
【0058】
この時に、図示はしていないが、絞り込み検索チェックボックスがチェックされた場合に、「顔数は合っていますか?」、「顔の方向は合っていますか?」などの補助的なメッセージを表示することで検索を助ける機能を設けても良い。
【0059】
<その他の実施形態>
上述した第1の実施形態では、アスペクト比が異なる撮影画像から注目被写体を含む撮影画像の検索を行う場合で、アスペクト比の固定された顔位置入力領域408に顔アイコン409を配置することで検索条件を入力できる実施形態を説明した。しかし、画像のX,Y軸を、顔位置入力領域408のアスペクト比にそれぞれあわせる方法を採用しているために、X,Y軸での拡大、縮小率が異なってしまう。したがって一致するのは、中心点のみしかなく、その他の領域は必ずずれてしまう。
【0060】
一般的に、中心付近の検索精度が高く、周辺において荒い検索条件の指定であっても実用上は問題ない。そのため、他の実施形態として、図8に示すような座標変換を行うことでより効果的な検索受験の入力が可能になる。
【0061】
画像の座標系801は、横、縦の画素数がそれぞれW,Hである画像の座標系である。この座標系801は、左上の点を原点(0,0)とし、右下の(W,H)までの値を取り得る座標系である。
【0062】
上記画像の座標系801を、検索ダイアログ401の座標系と同じ中心が原点で、X,Y共に−100から100間での値をとる座標系に802に変換する。
変換後の座標系802では、画像の横、または縦の画素数の少ない方(短辺方向)が、第1の実施形態と同じ変換が行われる。図8では、縦の画素数が横の画素数よりも少ないため、Y軸の座標が式(2)で変換される。
【0063】
一方、画素数が多い長辺方向であるX軸方向の座標の間隔は、ある所定の範囲、ここでは±60までは、Y軸と同じ座標間隔になるように変換される。図8では803の領域に当たる。その外側は、周辺に向かうほど間隔が広がり、両端が±100となるようにしている。変換前のxと、変換後のx’の関係は式(3),(4),(5)で表される。
【0064】
【数3】

【0065】
【数4】

【0066】
【数5】

【0067】
このときのxとx’の対応関係をグラフとして図9に示している。このように、座標系の中心付近は縦横が等倍で、端部付近は変倍されたような変換を行うことで顔位置入力領域408のアスペクト比と検索対象となる画像のアスペクト比が異なっていても検索条件が直感的に入力しやすい環境を提供できる。当然のことながら、縦が長い画像の場合にはX軸とY軸の変換を入れ変えればよい。
【0068】
また、S06の類似度の判定において、周辺付近に行くほど判定の許容度を大きく、つまり指定された検索条件と、顔位置、大きさ、角度など前述した特徴量を比較した場合の差の判定をゆるくする。これによって周辺ほど大きくなる検索条件の入力誤差を加味した検索が可能になる。
【0069】
また本発明の目的は、上述した諸実施形態で示したフローチャートの手順を実現するプログラムコードを記憶した記憶媒体から、システムあるいは装置のコンピュータ(またはCPUやMPU)がそのプログラムコードを読出し実行することによっても達成される。この場合、記憶媒体から読み出されたプログラムコードによって上述した実施形態の機能を実現することになる。そのため、このプログラムコード及びプログラムコードを記録または記憶したコンピュータ読取可能な記憶媒体も本発明の一つを構成することになる。
【0070】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、前述した実施形態の機能は、コンピュータが、読み出したプログラムを実行することによって実現される。また、このプログラムの実行とは、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行う場合も含まれる。
【0071】
さらに、前述した実施形態の機能は、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットによっても実現することもできる。この場合、まず、記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。こうした機能拡張ボードや機能拡張ユニットによる処理によっても前述した実施形態の機能が実現される。
【符号の説明】
【0072】
101…CPU
102…ブリッジ部
103…ROM
104…RAM
105…2次記憶装置
106…表示制御部
107…表示装置
108…I/O制御部
109…入力装置
301…画像検索UI
302…フォルダー選択UI
303…画像一覧UI
304…選択画像一覧UI
305…画像
306,410,504…ポインティングUI
306…検索メニュー
307…検索ボタン
401…検索ダイアログ
402…顔数入力
403…顔位入力
404…追加ボタン
405…削除ボタン
406…OKボタン
407…Cancelボタン
408…顔位置入力領域
409,501,503…顔アイコン

【特許請求の範囲】
【請求項1】
複数の個人とリンクした顔画像から、顔画像を指定する指定手段と、
検索対象画像に前記指定された顔画像と類似する画像が存在するか判定する判定手段と、
前記判定手段により存在すると判定された画像を表示装置に表示させる処理手段と
を有することを特徴とする画像処理装置。
【請求項2】
前記検索対象画像は選択されたフォルダの複数の画像であり、前記判定手段は前記複数の画像に対して前記判定を行うことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記判定の結果、類似度の高い順に画像は前記表示装置に表示されることを特徴とする請求項1に記載の画像処理装置。
【請求項4】
検索条件として、少なくとも前記指定された顔画像を顔位置入力領域内で指定する位置指定手段を有し、
前記検出対象画像から検出された顔の位置と前記検索条件に従い、前記判定手段は類似度を判定することを特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記指定された顔画像の傾きを調整する調整手段をさらに有することを特徴とする請求項4に記載の画像処理装置。
【請求項6】
前記検索条件として、さらに画像中に存在する顔数を指定する顔数指定手段をさらに有し、
前記判定手段は前記検索対象画像が検索条件の顔数が存在するか判定することを特徴とする請求項4に記載の画像処理装置。
【請求項7】
コンピュータを、
複数の個人とリンクした顔画像から、顔画像を指定する指定手段、
検索対象画像に前記指定された顔画像と類似する画像が存在するか判定する判定手段、
前記判定手段により存在すると判定された画像を表示装置に表示させる処理手段
として機能させるためのプログラム。
【請求項8】
前記検索対象画像は選択されたフォルダの複数の画像であり、前記判定手段は前記複数の画像に対して前記判定を行うことを特徴とする請求項7に記載のプログラム。
【請求項9】
前記判定の結果、類似度の高い順に画像は前記表示装置に表示されることを特徴とする請求項7に記載のプログラム。
【請求項10】
コンピュータをさらに、
検索条件として、少なくとも前記指定された顔画像を顔位置入力領域内で指定する位置指定手段として機能させ、
前記検出対象画像から検出された顔の位置と前記検索条件に従い、前記判定手段は類似度を判定することを特徴とする請求項7に記載のプログラム。
【請求項11】
コンピュータをさらに、
前記指定された顔画像の傾きを調整する調整手段として機能させることを特徴とする請求項10に記載のプログラム。
【請求項12】
コンピュータをさらに、
前記検索条件として、さらに画像中に存在する顔数を指定する顔数指定手段として機能させ、
前記判定手段は前記検索対象画像が検索条件の顔数が存在するか判定することを特徴とする請求項10に記載のプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−99147(P2012−99147A)
【公開日】平成24年5月24日(2012.5.24)
【国際特許分類】
【出願番号】特願2012−24257(P2012−24257)
【出願日】平成24年2月7日(2012.2.7)
【分割の表示】特願2007−123665(P2007−123665)の分割
【原出願日】平成19年5月8日(2007.5.8)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】