説明

情報処理装置、情報処理方法及びプログラム

【課題】ユーザが注目する領域に関連する画像データを、煩雑な操作を行うことなく優先的に表示させる。
【解決手段】取得部1016は、ユーザによって指定された画像データの一部の領域を特定する。順序付け部1018は、上記領域に含まれるオブジェクトと、複数の画像データに含まれるオブジェクトとに基づいて、複数の画像データの表示順序を制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザが注目する領域に関連する画像データを優先的に表示させるための技術に関するものである。
【背景技術】
【0002】
近年、デジタルカメラ等に用いられる内蔵メモリの小型化、大容量化が促進され、大量の画像データが蓄積されるようになった。これにより、過去に撮影した画像データの蓄積数も増え、ユーザが多数の画像データの中から所望の画像データを見つけ出すのに長時間を要す等の問題があった。
【0003】
特許文献1には、写真の中の顔領域を検出し、顔領域の類似性に基づいて写真をグループ化することにより、同じ顔が写った写真を効率よく探すことができる技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2010−211785号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に開示される技術では、写真に複数の人の顔、例えば、A、B、Cの3人の顔が写っている場合、Aに興味がある場合でも、BやCが写った写真も同一グループ化されてしまう可能性がある。このため、Aが写った写真を探し出す妨げになるという問題がある。
【0006】
そこで、本発明の目的は、ユーザが注目する領域に関連する画像データを、煩雑な操作を行うことなく優先的に表示させることにある。
【課題を解決するための手段】
【0007】
本発明の情報処理装置は、ユーザによって指定された画像データの一部の領域を特定する特定手段と、前記特定手段により特定された前記領域に含まれるオブジェクトと、複数の画像データに含まれるオブジェクトとに基づいて、前記複数の画像データの表示順序を制御する制御手段とを有することを特徴とする。
【発明の効果】
【0008】
本発明によれば、ユーザが注目する領域に関連する画像データを、煩雑な操作を行うことなく優先的に表示させることが可能となる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施形態に係る情報処理装置である携帯端末の構成を示す図である。
【図2】本発明の実施形態において表示対象となる画像データについて説明するための図である。
【図3】保持部において保持される各画像データのメタデータの例を示す図である。
【図4】ユーザによる操作に応じてタッチパネル1002上に画像データを表示する処理を示すフローチャートである。
【図5】一致度の算出処理を示すフローチャートである。
【図6】キャッシュ上の画像データの格納状態と画像データの表示状態との関係を示す図である。
【図7】画像データに対するピンチ操作の例を説明するための図である。
【図8】画像データの閲覧時にオブジェクト認識を実行する場合の処理を示すフローチャートである。
【図9】本発明の第2の実施形態について説明するための図である。
【図10】画像データを拡大したときに、人物Aの一部が表示されている様子を示す図である。
【図11】画像データに付与されるメタデータの例を示す図である。
【図12】本発明の第3の実施形態について説明するための図である。
【図13】本発明の第4の実施形態について説明するための図である。
【図14】本発明の第5の実施形態について説明するための図である。
【発明を実施するための形態】
【0010】
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。
【0011】
先ず、本発明の第1の実施形態について説明する。第1の実施形態に係る情報処理装置は携帯電話であるものとする。本実施形態において、画像データは写真のデジタルデータであり、画像データ中のオブジェクトは写真に写った人物であるものとする。なお、写真に写っている人物に関する情報がメタデータとして予め画像データに付与されているものとする。以下では、上記のような画像データを携帯端末上でブラウズする場合について説明する。
【0012】
ユーザはフリック操作により、画像データを左右に移動させることで、様々な画像データを閲覧することができる。ここでフリック操作とは、タッチパネル上で指を滑らせるように移動する操作であり、画像データを左右に移動させることを意図した操作である。また、ユーザはピンチ操作により、表示中の画像データを、任意の位置を中心に拡大や縮小させることができる。ピンチ操作とは、2本の指をタッチパネル上で滑らせることにより、拡大や縮小を指示する操作である。
【0013】
図1は、本実施形態に係る情報処理装置である携帯端末の構成を示す図である。即ち、図1(a)は、携帯端末の外観を示している。図1(b)は、携帯端末の機能的な構成を示している。図1(c)は、携帯端末のハードウェア構成を示している。
【0014】
図1(a)において、1001は携帯端末である。1002は携帯端末1001のタッチパネル(LCD)である。
【0015】
図1(b)において、1011は入力部である。入力部1011は、タッチパネル1002に対するタッチ入力を受け付けるものであり、マルチタッチ入力を受け付けることが可能である。1012は表示部であり、タッチパネル1002上に画像データを表示する。1013は拡大・縮小部である。拡大・縮小部1013は、タッチパネル1002上におけるマルチタッチによるピンチ操作により、表示されている画像データを拡大又は縮小する。
【0016】
1014はスクロール部である。スクロール部1014は、タッチパネル1002上のフリック操作により、画像データを左右方向へ移動させる。1015は保持部であり、複数枚の画像データを保持する。1016は取得部であり、保持部1015から画像データを取得する。1017はキャッシュ部であり、表示する順序に従って画像データを後述のRAM1022上に保持する。1018は順序付け部であり、RAM1022上に保持される画像データの順序を変更する。1019は抽出部である。抽出部1019は、画像データに付与されるメタデータから、当該画像データに写っている人物に関する情報を抽出することにより、当該画像データに写っている人物を同定する。
【0017】
図1(c)において、1021はCPUであり、後述する携帯端末1001の動作手順を実現するためのプログラムを実行する。1022はRAMであり、上記プログラムの動作に必要な記憶領域を提供する。1023はROMであり、上記プログラムを保持する。1024はタッチパネルである。1025はメモリカードであり、画像データを記録する。1026は上記各構成を接続するバスである。
【0018】
なお、入力部1011、拡大・縮小部1013、表示部1012、スクロール部1014、取得部1016、キャッシュ部1017、順序付け部1018、抽出部1019は、CPU1021がROM1023から上記プログラムをRAM1022にロードし、実行することにより実現する構成である。保持部1015はメモリカード1025に対応する構成である。タッチパネル1024は図1のタッチパネル1002に対応する構成である。
【0019】
図2(a)は、保持部1015において保持される、画像データP2001と当該画像データP2001に付与されるメタデータ2002とを示している。メタデータ2002は、画像データP2001に写っている人物を識別する情報(A、B、C等)と、その人物の画像データP2001中における座標位置とを有している。ここで座標位置は、画像データP2001の左上を原点として、右端のx座標を100、下端のy座標を100とした値である。
【0020】
図2(b)は、RAM1022における画像データの格納状態とタッチパネル1002(1024)上における画像データの表示状態との関係を示している。キャッシュ部1017は、RAM1022の一部記憶領域であるキャッシュ2011を管理する。キャッシュ部1017は、取得部1016を介して保持部1015から複数の画像データを取得し、各画像データを、キャッシュ2011の[0]、[1]、[2]、[3]、[4]のうちの何れかの位置に書きこむ。表示部1012は、キャッシュ2011の[0]の位置に書き込まれた画像データPをタッチパネル1002上に表示する。順序付け部1018は、メタデータに基づいて、キャッシュ2011内に保持される画像データの順序を決定する。
【0021】
図3は、保持部1015において保持される各画像データのメタデータの例を示す図である。図3の3001は、画像データQのメタデータを示しており、図3の3002は、画像データRのメタデータを示しており、図3の3003は、画像データSのメタデータを示している。なお、図2(a)に示すように画像データPには人物A、B、Cが写っている。これに対し、図3の3001に示すように画像データQには人物A、Bが写っている。ここで取得部1016は、画像データPに写っている人物のうち、何人の人物が画像データQに写っているかを表す再現率を次のように算出する。
再現率=2人(=A、B)/3人(=画像データPに写っている人物数)=2/3
また取得部1016は、画像データQに写っている人物のうち、何人の人物が画像データPに写っているかを表す適合率を次のように算出する。
適合率=2人(=A、B)/2人(=画像データQに写っている人物数)=1
そして取得部1016は、画像データPと画像データQとの一致度を、再現率と適合率との積により次のように算出する。
画像データPと画像データQとの一致度=再現率×適合率=2/3×1=2/3
【0022】
同様にして、取得部1016は、画像データPと画像データRとの一致度、画像データPと画像データSとの一致度を次のように算出する。
画像データPと画像データRとの一致度=2/2×2/2=1
画像データPと画像データSとの一致度=2/3×1/2=2/3
【0023】
取得部1016は、保持部1015に保持された画像データの中から、上記のようにして算出した一致度が閾値以上(例えば、1/2以上)の画像データだけを取得する。そして、順序付け部1018は、取得部1016によって取得された画像データを、一致度の高いものから順次、キャッシュ2011の[0]、[1]、[2]、[3]、[4]の位置に格納していく。
【0024】
次に、図4のフローチャートを参照しながら、ユーザによる操作に応じてタッチパネル1002上に画像データを表示する処理について説明する。ステップS401において、入力部1011は、ユーザがタッチパネル1002上でフリック操作をしたか否かを判定する。フリック操作があった場合、処理はステップS402に移行する。一方、フリック操作がない場合、処理はステップS403に移行する。
【0025】
ステップS402において、表示部1012は、ユーザのフリック操作に応じて画像データを右方向又は左方向に移動させる。例えば、画像データP(キャッシュ2011上の[0]の位置の画像データ)が表示されている状態でユーザが左方向にフリックした場合、表示部1012は、表示中の画像データPを画面外まで左方向に移動させる。同時に、表示部1012は、図6に示すように、キャッシュ2011上の[1]の位置の画像データを画面右側から登場させて中央に表示させる。
【0026】
ステップS403において、入力部1011は、表示されている画像データP上でユーザによるピンチ操作があったか否かを判定する。ピンチ操作があった場合、処理はステップS404に移行する。一方、ピンチ操作がなかった場合、処理はステップS401に戻る。ステップS403において、拡大・縮小部1013は、ピンチ操作に応じて画像データを拡大又は縮小し、表示部1012は、拡大又は縮小された画像データを表示する。例えば、図7の画像データP7001に対して拡大操作に対応するピンチ操作があり、その結果、領域7002が拡大対象の領域として特定され、図7の7003に示すように、タッチパネル1002の全体を占めるように拡大されたものとする。また、タッチパネル1002の左上隅座標、右下隅座標がそれぞれ次のような値をとるものとする。
左上隅座標=(30,40)、右下隅座標=(90,90)
【0027】
ステップS405において、取得部1016は、拡大又は縮小された画像データのメタデータに基づいて、拡大又は縮小後の画像データに写っている人物を検出する。例えば、図7の例では、取得部1016は、画像データPのメタデータ2002に基づいて、人物A、Bが拡大後の画像データ7003に写っていることを検出する。ステップS406において、取得部1016は、拡大又は縮小された画像データに写っている人物に関し、当該画像データと、保持部1015に保持されている各画像データとの一致度を上述した方法で算出し直す。例えば、図7の例では、取得部1016は、拡大後の画像データに写っている人物A、Bに関し、当該画像データと、保持部1015に保持される各画像データとの一致度を上述した方法で算出し直す。
【0028】
次に、図5を参照しながら、一致度の算出処理について説明する。図5は、一致度の算出処理を示すフローチャートである。ステップS501において、取得部1016は、保持部1015から順に画像データを取り出すためのカウンタNを1にセットする。ステップS502において、取得部1016は、保持部1015からN番目の画像データを取得する。N番目の画像データが図3の3001に示す画像データQであった場合、ステップS503において、取得部1016は、拡大後の画像データPに写っている人物のうち、何人の人物が画像データQに写っているかを表す再現率を次のようにして算出する。
再現率=2人(=A、B)/2人(=拡大後の画像データPに写っている人物数)=1
ステップS504において、取得部1016は、画像データQに写っている人物のうち、何人の人物が拡大後の画像データPに写っているかを表す適合率を次のようにして算出する。
適合率=2人(=A、B)/2人(=画像データQに写っている人物数)=1
ステップS505において、取得部1016は、拡大後の画像データPと画像データQとの一致度を次のようにして算出する。
拡大後の画像データPと画像データQとの一致度=再現率×適合率=1×1=1
【0029】
ステップS506において、取得部1016は、現在対象としている画像データが、保持部1015に保持されている最後の画像データであるか否かを判定する。最後の画像データである場合、処理はステップS407に移行する。一方、最後の画像データではない場合、処理はステップS507に移行する。ステップS507において、取得部1016は、カウンタNを1加算する。そして処理はステップS502に戻り、次の画像データに対する処理が実行される。
【0030】
次の画像データが図3の3002に示す画像データRであった場合、ステップS503において、取得部1016は、拡大後の画像データPに写っている人物のうち、何人の人物が画像データRに写っているかを表す再現率を次のようにして算出する。
再現率=2人(=A、B)/2人(=拡大後の画像データPに写っている人物数)=1
ステップS504において、取得部1016は、画像データRに写っている人物のうち、何人の人物が拡大後の画像データPに写っているかを表す適合率を次のようにして算出する。
適合率=2人(=A、B)/3人(=画像データRに写っている人物数)=2/3
ステップS505において、取得部1016は、拡大後の画像データPと画像データRとの一致度を次のようにして算出する。
拡大後の画像データPと画像データRとの一致度=再現率×適合率=1×2/3=2/3
【0031】
次の画像データが図3の3003に示す画像データSであった場合、ステップS503において、取得部1016は、拡大後の画像データPに写っている人物のうち、何人の人物が画像データSに写っているかを表す再現率を次のようにして算出する。
再現率=1人(=B)/2人(=拡大後の画像データPに写っている人物数)=1/2
ステップS504において、取得部1016は、画像データSに写っている人物のうち、何人の人物が拡大後の画像データSに写っているかを表す適合率を次のようにして算出する。
適合率=1人(=B)/2人(=画像データSに写っている人物数)=1/2
ステップS505において、取得部1016は、拡大後の画像データPと画像データSとの一致度を次のようにして算出する。
拡大後の画像データPと画像データSとの一致度=再現率×適合率=1/2×1/2=1/4
【0032】
以上のようにして最後の画像データまで一致度を再計算すると、処理はステップS407に移行する。
【0033】
ステップS407において、取得部1016は、保持部1015に保持されている画像データの中から、以上のようにして再計算された一致度が閾値以上(例えば、1/2以上)の画像データだけを取得する。順序付け部1018は、取得部1016によって取得された画像データを、一致度の高いものから順次、キャッシュ2011の[0]、[1]、[2]、[3]、[4]の位置に格納していく。このようにして、キャッシュ2011に格納された画像データ及びその並び順は、図7(b)に示すように変化する。この後、ユーザがフリック操作によって画像データを左に移動させた場合、キャッシュ2011に格納された画像データが変更されているので、次に表示される画像データが画像データPを拡大する前とは異なっている。拡大後の画像データPには、人物A、Bのみが表示されており、人物Cは表示されていない。即ち、ユーザは人物A、Bに興味があり、人物Cには興味がないと考えられる。画像データPの拡大後、キャッシュ2011内では、人物A、Bが写った画像データが位置[0]の近くに来るように順序付けされているので、ユーザの興味に近い画像データが素早く見つけられるという効果がある。
【0034】
なお、本実施形態では、予め画像データに写っている人物に関するメタデータが画像データに付与されていることを前提としていたが、画像データの閲覧時に顔認識等のオブジェクト認識を実行するようにしてもよい。図8は、画像データの閲覧時にオブジェクト認識を実行する場合の処理を示すフローチャートである。ステップS801〜S804、ステップS806〜S807は、図4のステップS401〜S404、ステップS406〜S407と同じ処理である。ステップS805において、携帯電話は、図7の画像データの領域7002内で顔認識を行い、写っている人物を特定する。また携帯電話は、保持部1015に保持されている各画像データについても顔認識を行う。これにより、メタデータが予め付与された場合と同じ状態になるので、同様の方法により、キャッシュ2011における画像データの並べ替えを行うことができる。
【0035】
また、本実施形態では、再現率と適合率とに基づいて一致度を算出していたが、一致度の算出方法はこれに限るものではない。例えば、領域7002に写っている人物と対象となる画像データに写っている人物とが何人一致するかで一致度を求めてもよい。この場合、拡大後の画像データP(=写っている人物はA、B)と画像データQ(=写っている人物はA、B)との一致度は2(=AとB)、拡大後の画像データPと画像データR(=写っている人物はA、B、C)との一致度も2(=AとB)となる。再現率、適合率を利用した場合、上記のように画像データQの方が画像データRより一致度が高いと判定される。これは、画像データRにおいて、拡大後の画像データPには写っていない人物Cが写っており、その分一致度が低いと評価されるためである。このように再現率と適合率とを利用した方法の方が、より精度の高い一致度の算出が可能となる。
【0036】
また、本実施形態では、画像データを保持部1015(メモリカード1025)に保持し、一致度が閾値以上の画像データをキャッシュ2011に格納するようにしていたが、画像データは保持部1015(メモリカード1025)以外の場所に保持されていてもよいし、キャッシュを使用しない構成としてもよい。例えば、画像データはネットワーク上のサーバに置かれていて、それをネットワーク経由で取得するようにしてもよい。その際、キャッシュ2011を使用せず、一致度に基づく順序に従って画像データを表示するようにしてもよい。このようにしても、一致度に基づいて順序付けされている限り、ユーザの興味に近い画像データが素早く見つけられるという効果があることには変わりはない。但し、キャッシュ2011に格納することによって、画像データを左右移動したときの表示速度が向上し、キャッシュ2011に格納するものを一致度が閾値以上の画像データだけに絞ることによってメモリ使用量を削減できる、というさらなる効果がある。また、本実施形態では、フリック操作により画像データをスクロールさせていたが、キー押下や音声入力でスクロールさせるようにしてもよい。
【0037】
以上により、本実施形態によれば、ユーザが注目する領域に関連する画像データを、煩雑な操作を行うことなく優先的に表示させることが可能となる。
【0038】
次に、本発明の第2の実施形態について説明する。第1の実施形態では、図2(a)の2002に示すように、メタデータにおける人物の座標位置として、画像データに写っている人物の座標位置を用いている。この場合、図7の7003に示すように、人物Aの大部分と人物Bの一部とが表示されている場合でも、人物A、Bは同等に処理され、一致度算出の結果、キャッシュ2011による並べ替えが行われた。しかし、図7の7003に示すように、ユーザが画像データを拡大した場合、ユーザは人物Aにより興味があると考えられる。従って、人物Aが写った画像データが、人物Bが写った画像データより近くに来るようにキャッシュ2011による並べ替えが行われた方が、ユーザは所望の画像データをより効率よく探すことができると考えられる。
【0039】
そこで、画像データに写っている人物を囲む領域を、図9の9001に示す点線のような矩形領域で表し、図9の9002に示すようなメタデータが画像データに付与されるようにする。図10は、図7の7003に示すように画像データを拡大したときに、人物Aの一部が表示されている様子を示している。10001はタッチパネル1002の領域である。10002は人物Aの矩形領域であり、(x´、y´、w´、h´)は、メタデータ9002のような形式で記録された人物Aの矩形情報(x、y、w、h)から、拡大操作を施して得られる値である。10003は人物の矩形領域の中で、タッチパネル1002に表示されている部分を示している。人物Aの矩形領域の面積に対する、タッチパネル1002上で実際に表示されている人物Aの矩形領域の部分の面積の割合が、例えば0.9であったとする。人物Bについても同様に、人物Bの矩形領域の面積に対する、タッチパネル1002上で実際に表示されている人物Bの矩形領域の面積の割合が、例えば0.6であったとする。保持部1015には、図11の11001に示すメタデータが付与された画像データTと図11の11002に示すメタデータが付与された画像データUとが保持されているとする。取得部1016は、画像データPと画像データTとの一致度を次のように算出する。
【0040】
画像データTには、拡大後の画像データPに写っている人物A、Bの2人のうち、Aだけが写っているので、再現率及び適合率は次のように算出される。
再現率=0.9(=Aの面積の割合)/2人(=拡大後の画像データPに写っている人物数)=0.45
適合率=0.9(=Aの面積の割合)/2人(=画像データTに写っている人物数)=0.45
以上のようにして算出された再現率及び適合率から、画像データPと画像データTとの一致度は次のようにして算出される。
画像データPと画像データTとの一致度=再現率×適合率=0.45×0.45≒0.2
【0041】
一方、画像データUには、拡大後の画像データPに写っている人物A、Bの2人のうち、Bだけが写っているので、再現率及び適合率は次のように算出される。
再現率=0.6(=Bの面積割合)/2人(=拡大後の画像データPに写っている人物数)=0.3
適合率=0.6(=Bの面積割合)/2人(=画像データUに写っている人物数)=0.3
以上のようにして算出された再現率及び適合率から、画像データPと画像データTとの一致度が次のようにして算出される。
画像データPと画像データUとの一致度=再現率×適合率=0.3×0.3≒0.09
【0042】
このように、画像データPと画像データTとの一致度の方が、画像データPと画像データUとの一致度より大きくなる。従って、順序付け部1018は、キャッシュ2011において、画像データTが画像データUよりも画像データPに近くなるように順序付けを行うる。ユーザが図7の7003に示すように画像データPを拡大した場合、人物Bよりも人物Aにより興味があると考えられるため、この順序付けは妥当である。第1の実施形態の方法では、一致度は画像データT、Uともに1/2で同じになるが、本実施形態では、よりユーザの興味に即した画像データの順序付けがなされる、という効果がある。
【0043】
なお、第1の実施形態と同様、本実施形態でも、予め、画像データに写っている人物に関するメタデータが画像データに付与されていることを前提としていたが、画像データの閲覧時に顔認識処理を実行するようにしてもよいことはいうまでもない。また、本実施形態では、フリック操作により画像データをスクロールしていたが、キー押下や音声入力でスクロールするようにしてもよいことはいうまでもない。
【0044】
次に、本発明の第3の実施形態について説明する。第2の実施形態では、画像データに写っている人物の矩形領域を示す情報をメタデータとして保持していた。しかし、図12の12001に示す人物Cのように顔を傾けて写ったような場合、その領域を矩形領域で表すと、実際にその人物が占める領域よりも大きな領域になってしまい、面積割合に基づく一致度の算出精度が悪くなるという問題がある。これに対し、人物の矩形領域を楕円領域で近似し、その楕円領域を示す情報をメタデータとして持つようにする。これにより、面積割合による一致度の算出精度が向上する。楕円領域を示す情報は、図12の12003に示すように、中心座標(x,y)、長軸、短軸の長さa、b、傾きθで表され、図12の12002に示すような形式で保持される。この楕円に対し、第2の実施形態のように、各人物の楕円領域の面積に対する、タッチパネル1002上で実際に表示されている人物の楕円領域の面積の割合を算出し、一致度を算出することにより、キャッシュ2011の順序付けを行う。
【0045】
次に、本発明の第4の実施形態について説明する。第1〜第3の実施形態では、画像データの拡大、縮小操作に、マルチタッチによるピンチ操作を用いていたが、この限りではない。拡大率、縮小率を入力するダイアログを表示し、数字で拡大率、縮小率を入力するようにしてもよいし、音声入力で「拡大」、「縮小」のように発声して指示するようにしてもよい。又は、図13(a)の13002に示すような表示枠を表示し、ユーザがこの表示枠を指定し、その枠の範囲がタッチパネル1002全体に一致するように拡大するようにしてもよい。又は、タッチパネル1002に対する手書き入力を行い、図13(b)の13012に示すように、手書きで拡大対象の領域を指定するようにしてもよい。
【0046】
次に、本発明の第5の実施形態について説明する。第1の実施形態では、画像データを一致度が高い順に順序付けしていたが、その限りではない。例えば、低い順に順序付けしてもよい。これは、特定領域に含まれる人物が写っていない画像データを探したい場合に有効である。また、図14に示すように、表示中の画像データの左右交互に一致度の小さい順に並べてもよい。
【0047】
なお、第1〜第3の実施形態では、拡大又は縮小させる対象領域を一つだけ指定していたが、複数の対象領域を指定するようにしてもよい。また、第1〜第3の実施形態では、オブジェクト情報として人物とその位置情報、領域情報を用いていた。しかし、オブジェクトは人物以外でもよい。また、オブジェクトの位置を示す情報や領域を示す情報だけでなく、深度を示す情報、色を示す情報等を用いてもよい。また領域は、矩形領域や楕円領域だけでなく、あらゆる閉領域を用いることができる。
【0048】
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
【符号の説明】
【0049】
1001:携帯端末、1002:タッチパネル、1011:入力部、1012:表示部、1013:拡大・縮小部、1014:スクロール部、1015:保持部、1016:取得部、1017:キャッシュ部、1018:順序付け部、1019:抽出部

【特許請求の範囲】
【請求項1】
ユーザによって指定された画像データの一部の領域を特定する特定手段と、
前記特定手段により特定された前記領域に含まれるオブジェクトと、複数の画像データに含まれるオブジェクトとに基づいて、前記複数の画像データの表示順序を制御する制御手段とを有することを特徴とする情報処理装置。
【請求項2】
前記制御手段は、前記領域に含まれるオブジェクトと、前記複数の画像データに含まれるオブジェクトとに基づいて、前記画像データと前記複数の画像データとの一致度を算出し、当該一致度に基づいて、前記複数の画像データの表示順序を制御することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記制御手段は、前記複数の画像データ夫々について、前記領域に含まれるオブジェクトのうち、いくつのオブジェクトが当該画像データに含まれるかを表す再現率を算出するとともに、当該画像データに含まれるオブジェクトのうち、いくつのオブジェクトが前記領域に含まれるかを表す適合率を算出し、前記再現率と前記適合率とに基づいて前記一致度を算出することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記特定手段は、ユーザの操作に応じて拡大対象として指定された前記領域を特定することを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
【請求項5】
前記制御手段は、前記画像データに含まれるオブジェクトの位置に基づいて、前記領域に含まれるオブジェクトを判定することを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
【請求項6】
前記制御手段は、前記領域に含まれるオブジェクトを囲む閉領域の面積に対する、実際に表示される当該オブジェクトを囲む閉領域の面積の割合を算出し、当該面積の割合と、前記領域の含まれるオブジェクトと、前記複数の画像データに含まれるオブジェクトとに基づいて、前記画像データと前記複数の画像データとの一致度を算出することを特徴とする請求項2に記載の情報処理装置。
【請求項7】
前記制御手段は、前記複数の画像データのうち、前記一致度が閾値以上の画像データを抽出し、抽出した画像データの表示順序を制御することを特徴とする請求項2乃至6の何れか1項に記載の情報処理装置。
【請求項8】
前記画像データに含まれるオブジェクトの位置を示す情報、又は、当該オブジェクトを囲む閉領域を示す情報は、メタデータとして予め前記画像データに付与されていることを特徴とする請求項5又は6に記載の情報処理装置。
【請求項9】
前記画像データに含まれるオブジェクトの位置を示す情報、又は、当該オブジェクトを囲む閉領域を示す情報は、前記画像データから当該オブジェクトを認識することにより得られる情報であることを特徴とする請求項5又は6に記載の情報処理装置。
【請求項10】
情報処理装置によって実行される情報処理方法であって、
ユーザによって指定された画像データの一部の領域を特定する特定ステップと、
前記特定ステップにより特定された前記領域に含まれるオブジェクトと、複数の画像データに含まれるオブジェクトとに基づいて、前記複数の画像データの表示順序を制御する制御ステップとを有することを特徴とする情報処理方法。
【請求項11】
ユーザによって指定された画像データの一部の領域を特定する特定ステップと、
前記特定ステップにより特定された前記領域に含まれるオブジェクトと、複数の画像データに含まれるオブジェクトとに基づいて、前記複数の画像データの表示順序を制御する制御ステップとをコンピュータに実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2012−221062(P2012−221062A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−84020(P2011−84020)
【出願日】平成23年4月5日(2011.4.5)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】