説明

情報処理装置、情報処理方法、およびプログラム

【課題】保存されている数多くの画像の中から、検索条件として与えられたキー画像の被写体に関連する画像を選抜する。
【解決手段】ステップS22で、キー画像が入力され、ステップS23で、キー画像が解析される。ステップS24で、キー画像で検出された顔に対応する人物IDが特定される。ステップS25では、選抜基準が関連人物画像または類似表情画像のどちらであるか確認され、関連人物画像の場合、ステップS26およびS27で、キー画像の人物と同じグループの人物の画像群から画像リストが生成される。類似表情画像の場合、ステップS28で、キー画像の人物が類似した表情で写っている画像群から画像リストが生成される。本発明は、例えば、デジタルスチルカメラに適用できる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関し、例えば、保存されている数多くの画像の中から、検索条件となるキー画像の被写体である人物に関連すると推定される人物が写っている画像を選択してスライドショーを実行する場合に用いて好適な情報処理装置、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
従来、デジタルスチルカメラには、いわゆるスライドショー機能が設けられているものが多い。このスライドショー機能によれば、撮像して保存した画像を、例えば撮影順に順次再生したり、ランダムな順序で再生したりしてディスプレイに表示することができる(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−110088号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、保存されている数多くの画像を従来のスライドショー機能によって表示させた場合、画像の枚数が多過ぎて全てを見終わるまでに多くの時間を要してしまう。これを防ぐためには、撮像された数多くの画像のうち、所定の条件に合致するものだけを選抜してスライドショーを実行するようにすればよい。
【0005】
本発明はこのような状況に鑑みてなされたものであり、保存されている数多くの画像の中から、検索条件として与えられたキー画像の被写体に関連する画像を選抜できるようにするものである。
【課題を解決するための手段】
【0006】
本発明の第1の側面である情報処理装置は、複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置において、画像に写っている人物の顔の特徴量を抽出する画像解析手段と、前記画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類する分類手段と、前記画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付ける対応付け手段と、同一の前記画像に一緒に写っている頻度に基づき、前記登録画像に写っている人物が属するグループを推定する推定手段と、既に解析されて、写っている人物の顔に人物IDが対応付けられ、前記人物が属するグループが推定されている複数の前記登録画像の中から、検索条件としてのキー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を選抜する選抜手段とを含む。
【0007】
本発明の第1の側面である情報処理装置は、前記画像解析手段による解析結果に基づき、前記登録画像の評価値を算出する算出手段をさらに含むことができ、前記選抜手段は、複数の前記登録画像の中から、前記キー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を前記評価値の順に選抜するようにすることができる。
【0008】
前記算出手段は、前記登録画像の構図にも基づき、前記登録画像の評価値を算出するようにすることができる。
【0009】
本発明の第1の側面である情報処理装置は、前記登録画像または前記キー画像のうち、少なくとも一方の画像を撮像する撮像手段をさらに含むことができる。
【0010】
本発明の第1の側面である情報処理方法は、複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の情報処理方法において、前記情報処理装置により、前記登録画像に写っている人物の顔の特徴量を抽出し、複数の前記登録画像それぞれから抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、同一の前記登録画像に一緒に写っている頻度に基づき、前記登録画像に写っている人物が属するグループを推定し、検索条件としてのキー画像に写っている人物の顔の特徴量を抽出し、前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、キー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を選抜するステップを含む。
【0011】
本発明の第1の側面であるプログラムは、複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の制御用のプログラムであって、前記登録画像に写っている人物の顔の特徴量を抽出し、複数の前記登録画像それぞれから抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、同一の前記登録画像に一緒に写っている頻度に基づき、前記登録画像に写っている人物が属するグループを推定し、検索条件としてのキー画像に写っている人物の顔の特徴量を抽出し、前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、キー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を選抜するステップを含む処理を情報処理装置のコンピュータに実行させる。
【0012】
本発明の第1の側面においては、登録画像に写っている人物の顔の特徴量が抽出され、複数の登録画像それぞれから抽出された顔の特徴量が、その類似性に基づいて、人物IDが付与されているクラスタに分類され、登録画像に写っている人物の顔に、その特徴量が分類されたクラスタに付与されている人物IDが対応付けられ、同一の前記登録画像に一緒に写っている頻度に基づき、登録画像に写っている人物が属するグループが推定される。さらに、検索条件としてのキー画像に写っている人物の顔の特徴量が抽出され、キー画像から抽出された顔の特徴量が、その類似性に基づいて、人物IDが付与されているクラスタに分類し、キー画像に写っている人物の顔に、その特徴量が分類されたクラスタに付与されている人物IDが対応付けられ、キー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像が選抜される。
【0013】
本発明の第2の側面である情報処理装置は、複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置において、画像に写っている人物の顔の表情を含む特徴量を抽出する画像解析手段と、前記画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類する分類手段と、前記画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付ける対応付け手段と、既に解析されて、写っている人物の顔に人物IDが対応付けられている複数の前記登録画像の中から、検索条件としてのキー画像に写っている人物がその表情と類似する表情で写っている画像を選抜する選抜手段とを含む。
【0014】
本発明の第2の側面である情報処理装置は、前記画像解析手段による解析結果に基づき、前記登録画像の評価値を算出する算出手段をさらに含むことができ、前記選抜手段は、複数の前記登録画像の中から、前記キー画像に写っている人物がその表情と類似する表情で写っている画像を前記評価値の順に選抜するようにすることができる。
【0015】
前記算出手段は、前記登録画像の構図にも基づき、前記登録画像の評価値を算出するようにすることができる。
【0016】
本発明の第2の側面である情報処理装置は、前記登録画像または前記キー画像のうち、少なくとも一方の画像を撮像する撮像手段をさらに含むことができる。
【0017】
本発明の第2の側面である情報処理方法は、複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の情報処理方法において、前記情報処理装置による、複数の前記登録画像に写っている人物の顔の表情を含む特徴量を抽出し、前記登録画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、検索条件としてのキー画像に写っている人物の顔の表情を含む特徴量を抽出し、前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、前記キー画像に写っている人物がその表情と類似する表情で写っている画像を選抜するステップを含む。
【0018】
本発明の第2の側面であるプログラムは、複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の制御用のプログラムであって、複数の前記登録画像に写っている人物の顔の表情を含む特徴量を抽出し、前記登録画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、検索条件としてのキー画像に写っている人物の顔の表情を含む特徴量を抽出し、前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、前記キー画像に写っている人物がその表情と類似する表情で写っている画像を選抜するステップを含む処理を情報処理装置のコンピュータに実行させる。
【0019】
本発明の第2の側面においては、複数の登録画像に写っている人物の顔の表情を含む特徴量が抽出され、登録画像から抽出された顔の特徴量が、その類似性に基づいて、人物IDが付与されているクラスタに分類され、登録画像に写っている人物の顔に、その特徴量が分類されたクラスタに付与されている人物IDが対応付けられる。さらに、検索条件としてのキー画像に写っている人物の顔の表情を含む特徴量が抽出され、キー画像から抽出された顔の特徴量が、その類似性に基づいて、人物IDが付与されているクラスタに分類され、キー画像に写っている人物の顔に、その特徴量が分類されたクラスタに付与されている人物IDを対応付けられ、キー画像に写っている人物がその表情と類似する表情で写っている画像が選抜される。
【発明の効果】
【0020】
本発明の第1の側面によれば、保存されている数多くの画像の中から、検索条件として与えられるキー画像の被写体である人物に関連すると推定される人物が写っている画像を選抜することができる。
【0021】
本発明の第2の側面によれば、保存されている数多くの画像の中から、検索条件となるキー画像の被写体である人物が類似した表情で写っている画像を選抜することができる。
【図面の簡単な説明】
【0022】
【図1】本発明を適用したデジタルスチルカメラの構成例を示すブロック図である。
【図2】制御部により実現される機能ブロックの構成例を示す図である。
【図3】顔のサイズについての抽出条件を示す図である。
【図4】顔の位置についての抽出条件を示す図である。
【図5】データベースの構成例を示す図である。
【図6】登録処理を説明するフローチャートである。
【図7】総合評価値算出処理を説明するフローチャートである。
【図8】再生処理を説明するフローチャートである。
【図9】コンピュータの構成例を示すブロック図である。
【発明を実施するための形態】
【0023】
以下、発明を実施するための最良の形態(以下、実施の形態と称する)について、図面を参照しながら詳細に説明する。なお、説明は、以下の順序で行なう。
1.実施の形態の概要
2.第1の実施の形態
3.第2の実施の形態
4.変形例
【0024】
<1.実施の形態の概要>
本願発明をデジタルスチルカメラに適用した第1の実施の形態は、撮像して保存した画像を対象としてデータベースを作成するための登録処理を実行する。その後、改めて検索条件とするキー画像を撮像して解析し、キー画像の解析結果とデータベースを照らし合わせることにより、撮像して保存した画像の中から、キー画像の被写体となっている人物に関連する画像を選抜したり、キー画像の被写体となっている人物が同じ表情で写っている画像を選抜したりする。そして、選抜した画像を用いてスライドショーなどを実行することができる。
【0025】
本願発明をコンピュータに適用した第2の実施の形態は、入力される多数の画像を対象としてデータベースを作成するための登録処理を実行する。その後、検索条件として与えられるキー画像を解析し、キー画像の解析結果とデータベースを照らし合わせることにより、入力された多数の画像の中から、キー画像の被写体となっている人物に関連する画像を選抜したり、キー画像の被写体となっている人物が同じ表情で写っている画像を選抜したりする。そして、選抜した画像を用いてスライドショーなどを実行することができる。
【0026】
<2.第1の実施の形態>
[デジタルスチルカメラの構成例]
図1は、第1の実施の形態であるデジタルスチルカメラの構成例を示している。

このデジタルスチルカメラ10は、制御部11、メモリ12、操作入力部13、位置情報取得部14、バス15、撮像部16、画像処理部17、符号化復号部18、記録部19、および表示部20から構成される。
【0027】
制御部11は、操作入力部13から入力されるユーザの操作に応じた操作信号に従い、デジタルスチルカメラ10に各部を制御する。また、制御部11は、メモリ12に記録されている制御用プログラムを実行することにより、図2に示す機能ブロックを実現し、後述する登録処理などを実行する。
【0028】
メモリ12には、制御用プログラムが予め記録されている。また、メモリ12には、後述する被写体データベース38(図5)や登録処理などの結果も保持される。
【0029】
操作入力部13は、デジタルスチルカメラ10の筺体に設けられるボタンや表示部20に積層されるタッチパネルなどのユーザインタフェースからなり、ユーザからの操作に応じた操作信号を発生して制御部11に出力する。
【0030】
位置情報取得部14は、撮像タイミングにおいて、GPS(Global Positioning System)信号を受信して解析することにより、撮像日時(年月日、時刻)および位置(緯度、経度、高度)を示す情報を取得する。ここで得られた撮像日時および位置を示す情報は、撮像された画像に対応付けて記録されるexif情報に採用される。なお、撮像日時については、制御部11に内蔵される時計の時刻情報を利用するようにしてもよい。
【0031】
撮像部16は、レンズ群とCCD、CMOSなどの光電変換素子を内蔵しており、レンズ群を介して入射される被写体の光学像を光電変換素子により画像信号に変換して画像処理部17に出力する。
【0032】
画像処理部17は、撮像部16から入力される画像信号に所定の画像処理を施して符号化復号部18に出力する。また、画像処理部17は、撮像時においては撮像部16から、再生時においては符号化復号部18から入力される画像信号の画素を間引くなどして表示用の画像信号を生成して表示部20に出力する。
【0033】
符号化復号部18は、撮像時において、画像処理部17から入力される画像信号をJPEG方式などに従って符号化し、その結果得られる画像符号化信号を記録部19に出力する。また、符号化復号部18は、再生時において、記録部19から入力される画像符号化信号を復号し、その結果得られる画像信号を画像処理部17に出力する。
【0034】
記録部19は、撮像時において、符号化復号部18から入力される画像符号化信号を記録メディア(不図示)に記録する。また、記録部19は、画像符号化信号に対応付けたexif情報も記録メディアに記録する。さらに、記録部19は、再生時において、記録メディアに記録されている画像符号化信号を読み出して符号化復号部18に出力する。
【0035】
表示部20は、液晶ディスプレイなどから成り、画像処理部17から入力される画像信号の画像を表示する。
【0036】
次に、図2は、制御部11が制御用プログラムを実行することにより実現される機能ブロックの構成例を示している。これらの機能ブロックがそれぞれ動作することにより、後述する登録処理や再生処理が行われる。ただし、図2に示す各機能ブロックをICチップなどのハードウェアにより構成するようにしてもよい。
【0037】
画像解析部31は、顔検出部41、構図検出部42、および特徴量抽出部43を内蔵し、登録処理時には、撮像されて記録メディアに記録されている画像を、再生処理時には、検索条件として与えられるキー画像を処理対象として解析し、解析結果を後段の評価値算出部32、クラスタリング処理部33、およびグループ推定部34に出力する。
【0038】
具体的には、顔検出部41は、処理対象の画像内に存在する人物の顔を検出する。構図検出部42は、検出された顔の数に基づいて、処理対象の画像の被写体の人数を推定し、例えば1人、2人、3乃至5人、10人未満、または10人以上の人数タイプに分類する。また、構図検出部42は、処理対象の画像を、縦長、または横長のどちらかに分類し、さらに、顔画像、上半身画像、または全身画像の構図タイプに分類する。
【0039】
特徴量抽出部43は、処理対象の画像から検出された顔のうち、顔のサイズについての抽出条件と、顔の位置についての抽出条件を満たす顔についてその特徴量を抽出する。また、特徴量抽出部43は、抽出した特徴量に基づいて、検出された顔の表情(大笑い、微笑、正視、カメラ目線、泣き顔、よそ見、目を閉じている、口を開けているなど)、人物の年齢、人物の性別を推定する。なお、顔のサイズについての抽出条件、および顔の位置についての抽出条件は、構図検出部42における分類結果の組み合わせに応じて予め設定されている。
【0040】
図3は、特徴量抽出部43における顔のサイズについての抽出条件を示している。同図において、画像内の円形は検出された顔を意味するものとする。
【0041】
同図Aは、人数タイプが1人で横長全身画像の場合を示しており、画像の縦幅1.0に対して顔の縦幅は0.1以上0.2未満とし、それ以外の顔は除外(特徴量を抽出しない)するようにする。同図Bは、人数タイプが1人で横長上半身画像の場合を示しており、画像の縦幅1.0に対して顔の縦幅は0.2以上0.4未満とし、それ以外は除外するようにする。同図Cは、人数タイプが1人で横長顔画像の場合を示しており、画像の縦幅1.0に対して顔の縦幅は0.4以上とし、それ以外は除外するようにする。
【0042】
この他、例えば、人数タイプが3乃至5人で横長上半身画像の場合、画像の縦幅1.0に対して各顔の縦幅は0.2以上0.4未満とされている。人数タイプが3乃至5人で横長全身画像の場合、画像の縦幅1.0に対して各顔の縦幅は0.1以上0.2未満とされている。人数タイプが10人以上で横長の場合、画像の縦幅1.0に対して各顔の縦幅は0.05以上0.3未満とされている。
【0043】
図4は、特徴量抽出部43における顔の位置についての抽出条件を示している。同図において、画像内の円形は検出された顔を意味するものとする。
【0044】
同図は、人数タイプが3乃至5人で横長上半身画像の場合の抽出条件を示しており、画像の縦幅1.0に対して上側0.1、下側0.15、画像の横幅1.0に対して左右0.1を除外範囲とし、この除外範囲内で検出された顔については除外するようにする。
【0045】
なお、上述した抽出条件は一例であり、顔の縦幅を示す値や除外範囲を示す値はこれに限定されるものではない。
【0046】
図2に戻る。評価値算出部32は、画像解析部31による解析結果に基づき、処理対象の画像に対して、構図と顔の表情の善し悪しを示す総合評価値を算出し、算出結果をデータベース管理部35に出力する。なお、この総合評価値の算出については、図7を参照して詳述する。
【0047】
クラスタリング処理部33は、データベース管理部35にて管理される同一人物クラスタ群71を参照することにより、処理対象の各画像において検出された顔の特徴量を、その類似性に基づいて同一人物クラスタに分類し、分類結果をデータベース管理部35に出力する。これにより、各画像に写っている類似した顔が同一のクラスタ(人物IDが付与された同一人物クラスタ)に分類されることになる。また、これにより、各画像において検出された顔に対して人物IDを対応付けることができる。
【0048】
グループ推定部34は、データベース管理部35にて管理される登場人物対応表72を参照することにより、複数の人物が同一の画像に一緒に写っている頻度(高い方から順に高頻度、中頻度、または低頻度)に応じて各人物をグルーピングする。さらに、その頻度と、推定された人物の性別と、年齢とに基づいて、各人物が属するグループクラスタを推定し、推定結果をデータベース管理部35に出力する。グループクラスタは、例えば、家族(親子、夫婦、兄弟姉妹を包含する)、友人、趣味関係の集団、仕事関係の集団などに分類されている。
【0049】
具体的には、例えば、以下のようなグループ判断基準に従ってグループが推定される。
高頻度であって、年齢差がある場合には親子である。
高頻度であって、性別が異なり、年齢差が比較的少ない場合には夫婦である。
高頻度であって、低年齢でその差が比較的少ない場合には兄弟姉妹である。
中頻度であって、性別が同じて年齢差が比較的少ない場合には友人である。
中頻度であって、人数が比較的多く、年齢差が比較的少ない場合には趣味関連の集団である。
中頻度であって、人数が比較的多く、成人年齢でその分布が広い場合には仕事関連の集団である。
【0050】
なお、低頻度の場合には、関わりがない複数の人物が偶然同一の画像に一緒に写っていると判断し、その人物については、グルーピングの対象から除外する。
【0051】
データベース管理部35は、クラスタリング処理部33による分類結果である同一人物クラスタ群71を管理する。また、データベース管理部35は、同一人物クラスタ群71と、評価値算出部32から入力される各画像の総合評価値に基づき、登場人物対応表72を生成して管理する。さらに、データベース管理部35は、グループ推定部34による推定結果であるグループクラスタ群73(いずれも図5)を管理する。
【0052】
図5は、データベース管理部35にて管理される同一人物クラスタ群71、登場人物対応表72、およびグループクラスタ群73の構成例を示している。
【0053】
同一人物クラスタ群71の各同一人物クラスタには、類似した特徴量(各画像にて検出された顔の特徴量)が集められており、各同一人物クラスタに対して、人物IDが付与されている。したがって、各画像から検出された顔の特徴量の分類先である同一人物クラスタの人物IDを当該顔の人物の人物IDとすることができる。
【0054】
登場人物対応表72には、各画像に対応付けて、検出された1以上の顔の特徴量(表情、推定年齢および性別を含む)とその人物IDが記録されている。また、各画像に対応付けて、その構図と顔の表情の善し悪しを示す総合評価値が記録されている。したがって、例えば、人物IDに基づいて、登場人物対応表72を検索することにより、当該人物IDに対応する人物が写っている画像を特定することができる。また、特徴量に含まれる所定の表情に基づいて、登場人物対応表72を検索することにより、当該表情の顔が写っている画像を特定することができる。
【0055】
グループクラスタ群73の各グループクラスタには、同一のグループに属すると推定された人物の人物IDが集められており、各グループクラスタに対しては、当該グループの種類(家族、友人、趣味関係の集団、仕事関係の集団など)を示す情報が付与されている。したがって、人物IDに基づいて、グループクラスタ群73を検索することにより、当該人物IDに対応する人物が属するグループとその種類を特定することができ、さらに、そのグループに属する他の人物の人物IDを取得することができる。
【0056】
図2戻る。画像リスト生成部36は、データベース管理部35にて管理される同一人物クラスタ群71、登場人物対応表72、およびグループクラスタ群73を参照することにより、キー画像に関連する画像を特定し、その一覧を示す画像リストを生成して再生制御部37に出力する。再生制御部37は、入力される画像リストに従い、スライドショーなどを実行させる。
【0057】
[動作説明]
デジタルスチルカメラ10の動作について説明する。
【0058】
初めに、登録処理について説明する。図6は、登録処理を説明するフローチャートである。
【0059】
この登録処理の前提として、デジタルスチルカメラ10の記録メディアには、既に人物が撮像されている複数の画像(以下、登録画像と称する)が保存されているものとする。この登録処理は、ユーザからの所定の操作に応じて開始される。
【0060】
ステップS1において、画像解析部31は、保存されている複数の登録画像のうちの1枚を順次処理対象に指定する。顔検出部41は、処理対象の登録画像から人物の顔を検出する。構図検出部42は、検出された顔の数に基づいて、処理対象の登録画像の人数タイプおよび構図タイプを分類する。
【0061】
ステップS2において、特徴量抽出部43は、検出された顔のうち、分類された人数タイプおよび構図タイプに基づいて決定される、顔のサイズについての抽出条件と、顔の位置についての抽出条件を満たさないものを除外する。ステップS3において、特徴量抽出部43は、除外されずに残った顔についてその特徴量を抽出する。また、特徴量抽出部43は、抽出した特徴量に基づいて、検出された顔の表情、人物の年齢、人物の性別を推定する。
【0062】
なお、ステップS1乃至S3の処理については、画像が撮像されたときに実行するようにしてもよい。
【0063】
ステップS4において、クラスタリング処理部33は、データベース管理部35にて管理される同一人物クラスタ群71を参照することにより、処理対象の登録画像において検出された顔の特徴量を、その類似性に基づいて同一人物クラスタに分類し、分類結果をデータベース管理部35に出力する。データベース管理部35は、クラスタリング処理部33による分類結果である同一人物クラスタ群71を管理する。
【0064】
ステップS5において、評価値算出部32は、画像解析部31による解析結果に基づき、処理対象の登録画像に対する総合評価値を算出し、算出結果をデータベース管理部35に出力する。データベース管理部35は、同一人物クラスタ群71と、評価値算出部32から入力される各画像の総合評価値に基づき、登場人物対応表72を生成して管理する。
【0065】
図7は、ステップS5における総合評価値算出処理を詳述するフローチャートである。
【0066】
ステップS11において、評価値算出部32は、登録画像の構図評価値を算出する。すなわち、登録画像に写っている人数(特徴量が抽出された顔の数)に応じて設定される条件の下、顔のサイズ、各顔の中心(重心)位置の縦方向および横方向の分散状況、隣り合う顔との距離、隣り合う顔のサイズの類似性、および隣り合う顔の高さの差の類似性に応じて点数を付与する。
【0067】
具体的には、顔のサイズについては、対象者全員の顔のサイズが、写っている人数に応じた条件において定められた範囲内である場合に所定の点数を付与する。各顔の中心位置の縦方向の分散状況については、分散が、写っている人数に応じた条件において定められた閾値内である場合に所定の点数を付与する。各顔の中心位置の横方向の分散状況については、左右対称性がある場合に所定の点数を付与する。隣り合う顔との距離については、隣り合う顔との距離を顔のサイズを基準として求め、その距離が小さいほど大きな点数を付与する。
【0068】
隣り合う顔のサイズの類似性については、隣り合う顔のサイズの差が少ない場合にはカメラから同一距離に位置していると考えられるので、その場合には所定の点数を付与する。ただし、隣り合う顔が大人の顔と子供の顔に場合には顔のサイズが元々異なるので、この点を配慮する。隣り合う顔の高さの差の類似性については、顔の高さが揃っている場合に所定の点数を付与する。
【0069】
このようにして付与された各点数にそれぞれ所定の重み係数を乗算し、これらを積算することにより構図評価値を算出する。
【0070】
ステップS12において、評価値算出部32は、登録画像の表情評価値を算出する。すすなわち、登録画像に写っている各顔(特徴量が抽出された顔)が良い表情の項目(例えば、大笑い、正視、およびカメラ目線とする)に該当している項目数に応じて点数を付与する。そして、各顔の平均値に所定の重み係数を乗算することにより、表情評価値を算出する。
【0071】
ステップS13において、評価値算出部32は、構図評価値と表情評価値とにそれぞれ所定の重み係数を乗算して、その結果を積算することにより総合評価値を算出する。
【0072】
以上のようにして、登録画像の総合評価値を算出した後、処理は図6のステップS6に進められる。
【0073】
ステップS6において、画像解析部31は、保存されている全ての登録画像を処理対象に指定したか否かを判断する。処理対象に指定されていない登録画像が残っている場合、処理はステップS1に戻されてそれ以降が繰り返される。そして、ステップS6において、保存されている全ての登録画像が処理対象に指定されたと判断された場合、処理はステップS7に進められる。
【0074】
ステップS7において、グループ推定部34は、データベース管理部35にて管理される登場人物対応表72を参照することにより、複数の人物が同一の画像に一緒に写っている頻度に応じて各人物をグルーピングする。さらに、その頻度と、推定された人物の性別と、年齢とに基づいて、各人物が属するグループクラスタを推定し、推定結果をデータベース管理部35に出力する。データベース管理部35は、グループ推定部34による推定結果であるグループクラスタ群73を管理する。以上で、登録処理が終了される。
【0075】
次に、再生処理について説明する。図8は、再生処理を説明するフローチャートである。
【0076】
この再生処理の前提として、キー画像の被写体となる人物が写っている画像を含む複数の登録画像を処理対象として既に登録処理が実行されており、データベース管理部35により、同一人物クラスタ群71、登場人物対応表72、およびグループクラスタ群73が管理されているものとする。この再生処理は、ユーザからの所定の操作に応じて開始される。
【0077】
ステップS21において、画像リスト生成部21は、ユーザの操作に従って選抜基準を設定する。選抜基準とは、複数の登録画像から画像を選抜するときの基準であり、撮像期間の設定、関連人物画像/類似表情画像の設定、本人/関連人物/両方の設定からなる。
【0078】
撮像期間の設定では、例えば、本日を基準として、1日以内、1週回以内、1か月以内、1年以内などを設定することができる。関連人物画像/類似表情画像の設定では、キー画像の人物に関連する人物(本人を含む)の画像(関連人物画像)を総合評価値に基づいて選抜するのか、またはキー画像の人物が類似した表情で写る画像を表情評価値に基づいて選抜するのかを設定できる。本人/関連人物/両方の設定では、キー画像の人物本人が写っている画像を主に選抜するのか、キー画像の人物に関連する人物(本人を含まず)が写っている画像を主に選抜するのか、またはそれをほぼ半数ずつ選抜するのかを設定できる。
【0079】
さらに、画像リスト生成部21は、ユーザの操作に従って再生順序を設定する。再生順序の設定では、選抜された画像の再生順序を、撮像日時順、総合評価値順、撮像日時をまんべんなく分散させた順、またはランダムの順に設定することができる。
【0080】
なお、選抜基準および再生順序は、再生処理が行われる毎にユーザが指定できるが、前回の設定を流用するように指定したり、ランダムに設定するように指定したりすることもできる。
【0081】
ステップS22において、ユーザに対してキー画像の撮像が促される。これに応じて、ユーザが任意の人物を被写体として撮像を行うと、その画像がキー画像として画像解析部31に入力される。なお、キー画像をその場で撮像するのではなく、保存されている画像の中からキー画像を指定するようにしてもよい。また、キー画像は1枚に限らず、複数であってもよい。
【0082】
ステップS23において、画像解析部31の顔検出部41は、キー画像から人物の顔を検出する。特徴量抽出部43は、検出された顔の特徴量を抽出するとともに、その顔の表情、人物の年齢、人物の性別を推定し、その結果をクラスタリング処理部33に出力する。
【0083】
ステップS24において、クラスタリング処理部33は、データベース管理部35にて管理される同一人物クラスタ群71を参照することにより、キー画像において検出された顔の特徴量をその類似性に基づいていずれかの同一人物クラスタに決定し、決定した同一人物クラスタに付与されている人物IDを特定して画像リスト生成部36に通知する。
【0084】
ステップS25において、画像リスト生成部36は、ステップS21で選抜基準の関連人物画像/類似表情画像の設定がどちらに設定されているかを確認し、関連人物画像に設定されている場合、処理をステップS26に進める。
【0085】
ステップS26において、画像リスト生成部36は、データベース管理部35により管理されるグループクラスタ群73を参照することにより、キー画像の人物に対して特定された人物IDが属するグループクラスタを特定し、特定したクループクラスタを構成する人物ID(キー画像の人物が属しているグループに属する人物の人物ID。キー画像の人物に対応する人物IDも含む)を取得する。
【0086】
ステップS27において、画像リスト生成部36は、データベース管理部35により管理される登場人物対応表72を参照することにより、取得した人物IDの人物が写っている登録画像を抽出する。これにより、キー画像の人物に関連する人物が写っている登録画像が抽出される。さらに、画像リスト生成部36は、抽出した登録画像の中から、ステップS21で設定された選抜基準に基づき、総合評価値が大きい方から所定の枚数だけ登録画像を絞り込むことにより画像リストを生成する。
【0087】
一方、ステップS26において、類似表情画像に設定されていると確認された場合、処理はステップS28に進められる。
【0088】
ステップS28において、画像リスト生成部36は、データベース管理部35により管理される登場人物対応表72を参照することにより、キー画像の人物が写っており、その表情が類似している登録画像を抽出する。ここで、表情が類似している登録画像を抽出するには、顔の特徴量のうちの表情に関する成分を多次元ベクトルとみなした場合の差分(ユークリッド距離)が所定の閾値以下のものを選べばよい。さらに、画像リスト生成部36は、抽出した登録画像の中から、ステップS21で設定された選抜基準に基づき、総合評価値が大きい方から所定の枚数だけ登録画像を絞り込むことにより画像リストを生成する。
【0089】
ステップS29において、再生制御部37は、画像リスト生成部36にて生成された画像リストに含まされる登録画像を、ステップS21で設定された再生順序に従って再生する。以上で再生処理は終了される。
【0090】
以上に説明した再生処理によれば、キー画像の人物に関連深い人物(本人を含む)が写っている登録画像を選抜するか、またはキー画像の人物が同じ表情で写っている登録画像を選抜することができる。そして、選抜した登録画像を用いてスライドショーなどを実行することができる。
【0091】
なお、再生処理は、上述したように、キー画像の被写体となる人物が写っている画像が登録画像に含まれていることを前提としているが、この前提は必須ではない。すなわち、キー画像の被写体となった人物が登録画像に写っていない場合にも、例えば、キー画像の被写体となった人物に似ている人物(親、子、兄弟のみならず、他人の場合もある)が写っている登録画像が選抜されるので、面白味のある画像リストを生成することができる。
【0092】
また、登録処理および再生処理によれば、スライドショーにて画像を見せたい相手をキー画像として撮像することにより、当該相手に適した画像(例えば、本人のみならず、その家族の画像など)を選抜して提示することができる。あるいは、キー撮像時と同様の表情の画像を選抜して提示することができる。
【0093】
<3.第2の実施の形態>
[コンピュータの構成例]
上述した第1の実施の形態であるデジタルスチルカメラ10においては、デジタルスチルカメラ10で撮像した画像を登録画像およびキー画像としていたが、第2の実施の形態であるコンピュータでは、入力される複数の画像を処理対象として登録処理を実行し、また外部から入力されるキー画像に基づいて再生処理を実行する。
【0094】
図9は、第2の実施の形態であるコンピュータの構成例を示している。このコンピュータ100において、CPU(Central Processing Unit)101,ROM(Read Only Memory)102,RAM(Random Access Memory)103は、バス104により相互に接続されている。
【0095】
バス104には、さらに、入出力インタフェース105が接続されている。入出力インタフェース105には、キーボード、マウス、マイクロホンなどよりなる入力部106、ディスプレイ、スピーカなどよりなる出力部107、ハードディスクや不揮発性のメモリなどよりなる記憶部108、ネットワークインタフェースなどよりなる通信部109、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111を駆動するドライブ110が接続されている。
【0096】
以上のように構成されるコンピュータでは、CPU101が、例えば、記憶部108に記憶されているプログラムを、入出力インタフェース105およびバス104を介して、RAM103にロードして実行することにより、上述した登録処理と再生処理が行われる。
【0097】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであってもよいし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであってもよい。
【0098】
<4.変形例>
なお、上述した第1および第2の実施の形態は、上述した内容に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。また、以下のように拡張することが考えられる。
【0099】
本発明は、スライドショーにおいて表示させる画像を選抜する場合だけでなく、例えば、写真集に載せる画像を選抜するような場合にも適用することができる。
【0100】
また、キー画像を検索条件として、画像を検索する場合にも適用することができる。
【0101】
さらに、複数の画像をキー画像とする場合、各キー画像に対応する選抜結果の論理和、または論理積をユーザに選択させて画像リストに反映させるようにしてもよい。これにより、例えば、キー画像として撮像した全員が写っている登録画像だけを選抜したり、キー画像として撮像した全員がそれぞれ個別に写っている登録画像を選抜したりすることができる。
【0102】
また、人物を撮像したときに、その撮像画像をキー画像として採用し、撮像画像のレビュー表示とともに、保存されている画像から類似した表情の画像を選抜して表示するようにしてもよい。
【0103】
さらに、キー画像の撮像タイミングをユーザの操作ではなくカメラ側に委ねるようにし、ファインダ画像内に人物が検出できたときにキー画像を撮像して、その人物に関連する画像や類似の表情の画像を選抜して表示するようにしてもよい。
【0104】
またさらに、キー画像として、風景を採用するようにしてもよい。これにより、例えば、山を撮像したキー画像に基づいて、類似した山岳の画像を選抜したり、海を撮像したキー画像に基づいて、類似した海岸の画像を選抜したりすることができる。
【符号の説明】
【0105】
10 デジタルスチルカメラ, 11 制御部, 12 メモリ, 13 操作入力部,14 位置情報取得部, 16 撮像部, 31 画像解析部, 32 評価値算出部, 33 クラスタリング処理部, 34 グループ推定部, 35 データベース管理部, 36 画像リスト生成部, 37 再生制御部, 41 顔検出部, 42 特徴量抽出部, 43 構図検出部, 100 コンピュータ, 101 CPU

【特許請求の範囲】
【請求項1】
複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置において、
画像に写っている人物の顔の特徴量を抽出する画像解析手段と、
前記画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類する分類手段と、
前記画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付ける対応付け手段と、
同一の前記画像に一緒に写っている頻度に基づき、前記登録画像に写っている人物が属するグループを推定する推定手段と、
既に解析されて、写っている人物の顔に人物IDが対応付けられ、前記人物が属するグループが推定されている複数の前記登録画像の中から、検索条件としてのキー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を選抜する選抜手段と
を含む情報処理装置。
【請求項2】
前記画像解析手段による解析結果に基づき、前記登録画像の評価値を算出する算出手段をさらに含み、
前記選抜手段は、複数の前記登録画像の中から、前記キー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を前記評価値の順に選抜する
請求項1に記載の情報処理装置。
【請求項3】
前記算出手段は、前記登録画像の構図にも基づき、前記登録画像の評価値を算出する
請求項2に記載の情報処理装置。
【請求項4】
前記登録画像または前記キー画像のうち、少なくとも一方の画像を撮像する撮像手段を
さらに含む請求項2に記載の情報処理装置。
【請求項5】
複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の情報処理方法において、
前記情報処理装置により、
前記登録画像に写っている人物の顔の特徴量を抽出し、
複数の前記登録画像それぞれから抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
同一の前記登録画像に一緒に写っている頻度に基づき、前記登録画像に写っている人物が属するグループを推定し、
検索条件としてのキー画像に写っている人物の顔の特徴量を抽出し、
前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
キー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を選抜する
ステップを含む情報処理方法。
【請求項6】
複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の制御用のプログラムであって、
前記登録画像に写っている人物の顔の特徴量を抽出し、
複数の前記登録画像それぞれから抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
同一の前記登録画像に一緒に写っている頻度に基づき、前記登録画像に写っている人物が属するグループを推定し、
検索条件としてのキー画像に写っている人物の顔の特徴量を抽出し、
前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
キー画像に写っている人物と同一のグループに属すると推定されている人物が写っている画像を選抜する
ステップを含む処理を情報処理装置のコンピュータに実行させるプログラム。
【請求項7】
複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置において、
画像に写っている人物の顔の表情を含む特徴量を抽出する画像解析手段と、
前記画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類する分類手段と、
前記画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付ける対応付け手段と、
既に解析されて、写っている人物の顔に人物IDが対応付けられている複数の前記登録画像の中から、検索条件としてのキー画像に写っている人物がその表情と類似する表情で写っている画像を選抜する選抜手段と
を含む情報処理装置。
【請求項8】
前記画像解析手段による解析結果に基づき、前記登録画像の評価値を算出する算出手段をさらに含み、
前記選抜手段は、複数の前記登録画像の中から、前記キー画像に写っている人物がその表情と類似する表情で写っている画像を前記評価値の順に選抜する
請求項7に記載の情報処理装置。
【請求項9】
前記算出手段は、前記登録画像の構図にも基づき、前記登録画像の評価値を算出する
請求項8に記載の情報処理装置。
【請求項10】
前記登録画像または前記キー画像のうち、少なくとも一方の画像を撮像する撮像手段を
さらに含む請求項8に記載の情報処理装置。
【請求項11】
複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の情報処理方法において、
前記情報処理装置による、
複数の前記登録画像に写っている人物の顔の表情を含む特徴量を抽出し、
前記登録画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
検索条件としてのキー画像に写っている人物の顔の表情を含む特徴量を抽出し、
前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
前記キー画像に写っている人物がその表情と類似する表情で写っている画像を選抜する
ステップを含む情報処理方法。
【請求項12】
複数の登録画像の中から検索条件に対応する画像を選抜する情報処理装置の制御用のプログラムであって、
複数の前記登録画像に写っている人物の顔の表情を含む特徴量を抽出し、
前記登録画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記登録画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
検索条件としてのキー画像に写っている人物の顔の表情を含む特徴量を抽出し、
前記キー画像から抽出された前記顔の特徴量を、その類似性に基づいて、人物IDが付与されているクラスタに分類し、
前記キー画像に写っている人物の顔に、その特徴量が分類された前記クラスタに付与されている前記人物IDを対応付け、
前記キー画像に写っている人物がその表情と類似する表情で写っている画像を選抜する
ステップを含む処理を情報処理装置のコンピュータに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−107997(P2011−107997A)
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願番号】特願2009−262513(P2009−262513)
【出願日】平成21年11月18日(2009.11.18)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】