画像ランキング方法、プログラム及び記憶媒体並びに画像表示システム

【課題】位置情報と画像特徴量の両方を考慮したランキングの方法、及び、このランキング方法を用いて画像を表示するシステムを提供こと。
【解決手段】場所情報を含む入力を受け付けるステップと、その入力に基づき画像を検索するステップと、検索した画像の特徴量ベクトルを抽出し、類似度行列を作成するステップと、画像のメタデータ内の位置情報と入力により示された位置との距離に基づきバイアスベクトルを作成するステップと、類似度行列とバイアスベクトルを用いて、下記（１）式を反復計算することによりランキングを作成するステップと、を含み、バイアスベクトルを作成するステップにおいて、距離が小さいほど大きなバイアスを与えることを特徴とするランキングを作成する方法。
Ｒ＝α（Ｓ×Ｒ）＋（１−α）Ｐ・・・（１）
但し、Ｒはランキング値、Ｓは正規化された類似度行列、Ｐは正規化されたバイアスベクトルである。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、画像ランキングの作成方法、プログラム及び記憶媒体並びにかかる方法を用いた画像表示システムに関する。
【背景技術】
【０００２】
近年、インターネット上には膨大な情報が存在し、その情報から如何に効率的に、有益な情報のみを検索できるかが大きな課題となっている。例えば、テキスト情報を検索する技術として、非特許文献１があることはよく知られており、これにより、膨大なテキスト情報から有益な情報を上位に表示するシステムが提供されている。
【０００３】
一方、インターネット上にはテキスト情報だけでなく、Ｗｅｂ上のアルバムサービスやＧＰＳ機能付きカメラの普及に伴い、撮影地点の緯度経度情報がメタデータとして付された画像の情報も膨大に存在しているが、テキスト検索ほど研究はまだ進んでいない。
【０００４】
このような、多くの画像情報から、ユーザにとって有益な画像のランキングを得る先行技術として、非特許文献２、３、４がある。
【０００５】
非特許文献２には、画像データベースの分析手法として、まず画像の近傍関係をグラフ化し、マルコフモデルによる画像間の遷移確率を求め、遷移確率行列の固有ベクトルを用いて、代表画像を決定する技術が開示されている。
【０００６】
非特許文献３には、非特許文献１のアルゴリズムを画像に適用し、Ｗｅｂページ間のリンク構造を表わす行列の代わりに、画像間の類似度を表わす行列を用い、画像のランク付けを行う技術（ＶｉｓｕａｌＲａｎｋ）が開示されている。この技術では、テキストベースの画像検索結果を修正するためにＶｉｓｕａｌＲａｎｋを用いているが、画像間の類似度にＳＩＦＴ(Scale Invariant Feature Transform)特徴の対応点数を利用している。このＳＩＦＴ特徴の対応点数による類似度は、商品画像やランドマーク画像など、同一物体が写っていて対応点の出やすい場合に有効である反面、上位画像に同一物体の画像が並びやすく、結果の多様性に欠けるという問題がある。
【０００７】
非特許文献４には、上記非特許文献３の問題を改良したものであり、まず画像のクラスタリングを行い、各クラスタについてＶｉｓｕａｌＲａｎｋを適用し、各クラスタについての結果を並列に提示することで、結果の多様性を確保する技術が開示されている。
【先行技術文献】
【非特許文献】
【０００８】
【非特許文献１】S. Brin and L. Page, “The anatomy of a large-scale hyper-textual Web search engine,” Computer networks and ISDN systems, vol.30, no.1-7, pp.107-117, 1998.
【非特許文献２】X.He, W.Y.Ma, and H.Zhang,“ImageRank: spectral techniques for structural analysis of image database,” IEEE ICME,2003.
【非特許文献３】Y.Jing and S.Baluja,“VisualRank: Applying pagerank to large-scale image search,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.30, no.11, 1870-1890, 2008
【非特許文献４】安倍満，吉田悠一，“Visualrankの多クラスへの拡張: 画像特徴量を用いた類似画像の自動分類とランキング付け手法" PRMU2008-178，pp.183-188
【発明の概要】
【発明が解決しようとする課題】
【０００９】
本願の発明者らは、大量の画像情報の中から、ユーザにとって関心があると思われる画像を上位に表示するための技術を鋭意研究した結果、先行技術文献では、全く考慮されていない位置情報を考慮し、位置情報を有する画像に対してＶｉｓｕａｌＲａｎｋ技術を適用し、画像の特徴量と位置情報の両方に基づくランキングを作成することが、画像情報の検索技術において有益であるとの知見を得た。
【００１０】
そこで、本発明は、上記知見に基づきなされたものであり、本発明の目的とするところは、位置情報と画像特徴量の両方を考慮したランキングの方法、及び、このランキング方法を用いて画像を表示するシステムを提供することにある。
【課題を解決するための手段】
【００１１】
上記課題を解決するために、本発明のある観点によれば、メタデータを有する画像を検索し、ランキングを作成する方法であって、場所情報を含む入力を受け付けるステップと、前記入力に基づき、前記画像を検索するステップと、前記検索した画像の特徴量ベクトルを抽出し、類似度行列を作成するステップと、前記検索した画像の前記メタデータ内の位置情報と前記入力により示された位置との距離に基づきバイアスベクトルを作成するステップと、前記類似度行列と前記バイアスベクトルを用いて、下記（１）式を反復計算することによりランキングを作成するステップと、を含み、前記バイアスベクトルを作成するステップにおいて、前記距離が小さいほど大きなバイアスを与えることを特徴とするランキングを作成する方法が提供される。但し、Ｒはランキング値、Ｓは正規化された類似度行列、Ｐは正規化されたバイアスベクトル、αは、バイアスの強さを調整するパラメータ（０＜＝α＜＝１）、である。
Ｒ＝α（Ｓ×Ｒ）＋（１−α）Ｐ・・・（１）
この構成によれば、大量の画像情報の中から、ユーザにとって関心があると思われる画像を上位に表示するためのランキング方法を提供することが可能となる。
【００１２】
また、前記特徴量ベクトルは、下記（２）式に基づき抽出されることを特徴としてもよい。但し、Ｓｖは視覚特徴量ベクトル、Ｓｔはメタデータ特徴量ベクトル、βは、視覚特徴量ベクトルとメタデータ特徴量ベクトルの重みを調整するパラメータ（０＜＝β＜＝１）、である。
Ｓ＝β×Ｓｖ＋（１−β）×Ｓｔ・・・（２）
この構成によれば、画像の視覚特徴量とメタデータ特徴量に基づくランキング方法を提供することが可能となる。
【００１３】
また、前記視覚特徴量ベクトルは、複数の画像から求められることを特徴としてもよい。
この構成によれば、複数の画像の視覚特徴量に基づくランキング方法を提供することが可能となる。
【００１４】
また、前記バイアスベクトルを作成するステップにおいて、複数の前記場所情報に基づき、バイアスベクトルを作成することを特徴としてもよい。
この構成によれば、複数の位置情報に基づくランキング方法を提供することが可能となる。
【００１５】
また、前記バイアスベクトルを作成するステップにおいて、前記距離が大きいほど大きなバイアスを与えることを特徴としてもよい。
この構成によれば、ユーザが関心のある位置から遠い位置の位置情報を有する画像を上位にランキングする方法を提供することが可能となる。
【００１６】
また、前記入力を受け付けるステップは、前記αの値の入力をさらに受け付けることを特徴としてもよい。
この構成によれば、画像の特徴量と位置情報の重みを変化させることにより、どちらの情報を優先させて上位にランキングするのか、ユーザの好みにより調整することが可能となる。
【００１７】
また、本発明の別の観点によれば、メタデータを有する画像を検索し、ランキングに基づき前記画像を表示するシステムであって、場所情報を含む入力を受け付ける入力受付部と、前記入力に基づき、前記画像を検索する検索部と、前記検索した画像の特徴量ベクトルを抽出し、類似度行列を作成する行列作成部と、前記検索した画像の前記メタデータ内の位置情報と前記入力により示された位置との距離に基づきバイアスベクトルを作成するバイアス作成部と、前記類似度行列と前記バイアスベクトルを用いて、下記（１）式を反復計算することによりランキングを作成するランキング計算部と、前記ランキングに基づき前記画像を表示する表示部と、を備え、前記バイアス作成部において、前記距離が小さいほど大きなバイアスを与えることを特徴とする画像表示システムが提供される。
但し、Ｒはランキング値、Ｓは正規化された類似度行列、Ｐは正規化されたバイアスベクトル、αは、バイアスの強さを調整するパラメータ（０＜＝α＜＝１）、である。
Ｒ＝α（Ｓ×Ｒ）＋（１−α）Ｐ・・・（１）
この構成によれば、大量の画像情報を検索し、ユーザにとって関心があると思われる画像を上位に表示するシステムを提供することが可能となる。
【発明の効果】
【００１８】
以上説明したように、本発明によれば、大量の画像情報の中から、ユーザにとって関心があると思われる画像を上位に表示することができる。
【図面の簡単な説明】
【００１９】
【図１】本発明の第１実施形態におけるランキングを作成する方法のフローチャート。
【図２】実験例１−１に用いたユーザインターフェース。
【図３】実験例１−１に用いた２５０語の名詞リスト。
【図４】実験例１−１に用いた１００語の形容詞リスト。
【図５】実験例１−１に用いた注目点の都市名と緯度・経度のリスト。
【図６】実験例１−１の結果を示す画像。クエリが“pyramid”で、注目点が、(a)カイロ、(b)パリ、(c)ニューヨーク、(d)シドニー。
【図７】実験例１−１の結果を示す画像。クエリが“traditional”で、注目点が、(a)東京、(b)シドニー、(c)リオデジャネイロ、(d)デリー。
【図８ａ】実験例１−２の結果を示す画像。“house”をクエリとし、αの値を１．０とした場合。
【図８ｂ】実験例１−２の結果を示す画像。“house”をクエリとし、αの値を０．９とした場合。
【図８ｃ】実験例１−２の結果を示す画像。“house”をクエリとし、αの値を０．８とした場合。
【図８ｄ】実験例１−２の結果を示す画像。“house”をクエリとし、αの値を０．５とした場合。
【図８ｅ】実験例１−２の結果を示す画像。“house”をクエリとし、αの値を０．０とした場合。
【図９】第２実施形態における、メタデータ特徴量による類似度を使用した場合の実験例２の結果を示す画像。
【図１０】第２実施形態における、視覚特徴量による類似度を使用した場合の実験例２の結果を示す画像。
【図１１】実験例３−１の結果を示す画像。クエリが“phone”で、注目点がパリである。(a)タグ特徴量による類似度を使用した場合。(b)視覚特徴量による類似度を使用した場合。(c)タグ特徴量による類似度と、視覚特徴量による類似度を合成して用いた場合。
【図１２】実験例３−２の結果を示す画像。クエリが“cat”で、注目点が東京である。(a)タグ特徴量による類似度を使用した場合。(b)視覚特徴量による類似度を使用した場合。(c)タグ特徴量による類似度と、視覚特徴量による類似度を合成して用いた場合。
【図１３】実験例４の結果を示す画像。クエリが“insect”で、注目点が、シドニー、デリー、ケープタウンの３地点とした場合。
【図１４ａ】実験例５−１の結果を示す画像。クエリが“castle”で、注目点が東京で、ポジティブなバイアスを用いた場合。
【図１４ｂ】実験例５−１の結果を示す画像。クエリが“castle”で、注目点が東京で、ネガティブなバイアスを用いた場合。
【図１５】実験例５−２の結果を示す画像。クエリが“arc de triomphe”で、注目点がパリで、ネガティブなバイアスを用いた場合。
【図１６】第６実施形態における、画像表示システムのブロック図。
【発明を実施するための形態】
【００２０】
＜第１実施形態＞
以下では、図面を参照しながら、本発明の各実施形態に係る方法及び装置等について説明する。
図１は、本実施形態におけるランキングを作成する方法のフローチャートである。なお、フローチャートにおいて、「Ｓ」は各処理のステップを示すものとする。
【００２１】
まず、ユーザから、検索する画像のクエリと場所情報の入力を受け付ける（Ｓ１００）。
画像のクエリは、典型的には言語からなり、名詞、形容詞、文章など、後述の画像検索の機能次第でどのようなテキスト情報も含むことができる。また、画像マッチングの技術を用い、画像を入力としてもよい。
【００２２】
検索される画像は、画像に関する付加情報、即ちメタデータを有する。そのメタデータは、画像に付された、画像を撮影した地点のＧＰＳ(Global Positioning System)情報、日時、方向、コメントなどを含む。典型的には、デジタルカメラ用の画像ファイルの規格Exif (Exchangeable Image File Format）にあるように、画像に付加された様々な情報を言う。
【００２３】
入力する場所情報とは、地域、地方、国、都市などの土地の地理上の位置を表わす情報であり、言語、地図情報、又は位置情報として表現できる。位置情報とは、座標系で表現される、二次元平面又は三次元空間における物理量を言い、典型的には、緯度、経度、高さなどからなるＧＰＳ情報である。
【００２４】
受け付けたクエリに関するメタデータ付き画像を検索する（Ｓ１１０）。このステップは、後続のステップの母集団となる画像を収集するステップであり、画像検索の方法自体は特に特定されない。典型的には、Ｆｌｉｃｋｒ（登録商標）、Ｇｏｏｇｌｅ（登録商標）、Ｙａｈｏｏ（登録商標）が提供するＡＰＩ（Application Programming Interface）の検索機能を用いたＷｅｂサービスを使用してもよい。もちろん、自ら画像データを有し、その中から、受け付けたクエリにヒットする画像を独自の機構で検索し、結果セットの画像を後続のステップの母集団としてもよい。
【００２５】
次に、検索した画像から視覚特徴量を抽出し、類似度行列を作成する（Ｓ１２０）。
検索した画像からの視覚特徴量の表現方法としては、カラーヒストグラムとＳＩＦＴ記述子によるＢａｇｏｆＦｅａｔｕｒｅｓ法を利用する。但し、これに限定されるものではなく、例えば、エッジヒストグラムやガボール特徴ヒストグラムなども利用できる。カラーヒストグラムは、画像中にどの色がどの程度の割合で出現しているかを示すヒストグラムであり、通常ＲＧＢ色空間を６４等分してヒストグラムを作成する。その結果、画像は、６４次元のベクトルで表現される。
【００２６】
ＢａｇｏｆＦｅａｔｕｒｅｓ法は、画像から局所特徴量を抽出し、その出現頻度のヒストグラムで画像を表現する方法である。局所特徴量とは、画像の一部分の特徴を記述する特徴量であり、画像中の複数の個所から抽出する。ＳＩＦＴ法は、特徴点の検出と特徴量の記述を行うアルゴリズムであり、検出した特徴点に対して、各画素に回転・スケール変化・照明変化による画像の変化に不変な特徴量を記述することができるので、特定物体認識だけでなく画像分類の特徴量としても有効である。
【００２７】
具体的には、以下のように行う。まず、収集した各画像について、局所特徴を抽出する個所を決定する。Difference of Gaussian(DoG)、ランダムサンプリング、グリッドサンプリングなど、様々な方法を取り得る。なお、後述の実験例ではランダムサンプリングを採用している。そして、この決定した個所から、ＳＩＦＴ法による特徴記述方法で、局所特徴を抽出する。
【００２８】
次に、抽出された特徴記述子を作成する。具体的には、ｋ−ｍｅａｎｓ法のクラスタリングによって得られる特徴記述子のクラスタの各中心を、ＢａｇｏｆＦｅａｔｕｒｅｓ法のためのコードブック要素とする。
【００２９】
そして、画像から抽出された特徴記述子を、最も近いコードブック要素へ割り振り、ヒストグラムを作成する。このようにして得られた特徴量の出現頻度ヒストグラムが、ＢａｇｏｆＦｅａｔｕｒｅｓ法での画像表現ベクトルであり、画像を、どのコードブック要素に近い特徴量がどの程度の割合で出現しているかというヒストグラムで表現したことになる。
【００３０】
次に、上記のようにして得られたカラーヒストグラムと特徴量出現頻度ヒストグラムを基に、ヒストグラムインタセクションにより、各画像間の類似度を求める。ヒストグラムインタセクションとは、比較する２つの画像のヒストグラムの各要素について、小さい方の値を採用し、これを全部の要素に亘り和を求め、その和が大きければ値が大きい、即ち、類似度が高いと評価するものである。具体的には、式１０の通り、カラーヒストグラムと特徴量出現頻度ヒストグラムのそれぞれで、類似度行列を求めておき、それらの線形和を取り合成することにより、両特徴量を混合した類似度行列を求めることができる。なお、式１０で、Scombineは合成した類似度行列、Scolorはカラーヒストグラムによる類似度行列、Sbofは特徴量出現頻度ヒストグラムによる類似度行列である。
【数１】

【００３１】
次に、本実施形態では、検索した画像のメタデータに含まれる位置情報と入力された場所の位置から、特徴量を補正するためのバイアスベクトルを作成する（Ｓ１３０）。具体的には、以下のように行う。
【００３２】
画像のメタデータに含まれる位置情報とは、典型的にはＧＰＳ情報であり、画像を撮影した位置などが緯度・経度で表わされている。また、入力された場所の位置とは、ユーザが関心のある注目する場所（注目点）として、地理上の位置を表わす情報であり、入力される時点では、言語、地図情報、又は位置情報として表現されるが、２地点間の地球上の距離を求めるために、最終的に、緯度・経度で表わされる。もちろん、２地点間の距離をデータとして有している場合には、下記のような計算をすることなく、その距離データを用いてもよいことは言うまでもない。
【００３３】
２地点間が緯度・経度で表わされる場合、２地点間の地球上の距離は、式１１に表わすように、地球を半径１の完全な球であると仮定し、球面三角法により計算できる。
【数２】

【００３４】
上記の２地点間の距離を基に、バイアスベクトルを式１２により作成する。
【数３】

【００３５】
このバイアスベクトルは、画像iに対応する要素であり、画像iが注目点Aに近いほど、即ち、両者の距離が小さいほど大きくなる。なお、好ましくは、このバイアスベクトルは、正規化されて用いられる。
また、地理上の距離が近くとも、文化的に相違する場合は距離を遠ざける（重みを小さくする）ようにしても良い。この場合は文化的相違に関する重みテーブルを別途設ける等、適宜周知の方法で実現できる。
【００３６】
次に、作成した類似度行列とバイアスベクトルを用いて、ＶｉｓｕａｌＲａｎｋを実行し、画像のランキングを得る（Ｓ１４０）。具体的には、ＶｉｓｕａｌＲａｎｋを実行し、ランキングを得るとは、式１の反復計算を行い、列ベクトルＲを収束させることである。
【数４】

【００３７】
類似度行列ＳにＶｉｓｕａｌＲａｎｋ値であるランキング値Ｒのベクトルをかけることで、ランキング値の更新を行い、この更新を、ランキング値Ｒが収束するまで繰り返し、その結果、ランキング値の大きい画像が上位画像となる。
【００３８】
ＲはＶｉｓｕａｌＲａｎｋベクトルで，各画像のＶｉｓｕａｌＲａｎｋ値が並ぶ。初期値は全画像について等しく、例えば、１．０としてよい。Ｓは、上記で求めた、画像の類似度行列の各列を正規化したものである。なお、Ｓは類似度行列を列ごとに正規化するのは、更新時にＶｉｓｕａｌＲａｎｋ値の合計を変化させないためである。
【００３９】
バイアスベクトルＰとして一様なベクトルを与えると、各画像のＶｉｓｕａｌＲａｎｋ値を均等化させる方向へ補正がかかる。一方、不均一なベクトルを与えると、一部の画像を強調する補正がかかる。
【００４０】
＜実験例１−１＞
図２は、ユーザから検索する画像のクエリと場所情報の入力を受け付けるユーザインターフェースである。母集団を後述するような方法で作成したため、特定の名詞や形容詞を選択してクエリを作成するようになっている。また、注目する場所も、メニュー形式で選択できるようになっている。もちろん、ユーザが自由に入力できるようなフィールドを備えていてもよい。
【００４１】
Ｆｌｉｃｋｒのオンラインアルバムサービスの検索機能ＡＰＩを使用し、図３と４に示す名詞２５０語、形容詞１００語、合計３５０語について検索し、位置情報付き画像を２０００枚ずつ収集した。また、Ｆｌｉｃｋｒでは、一部のユーザが類似した画像を大量に投稿していることがあるので、同一ユーザが投稿した画像の数を制限した。また、図５に示すように、注目する都市を１０都市選定し、その緯度・経度を注目点の位置情報として使用した。
【００４２】
画像を収集した後、上記単語ごとにＶｉｓｕａｌＲａｎｋ値を算出した。その際、カラーヒストグラムはＲＧＢ空間での６４次元とし、ＳＩＦＴ記述子による要素数は５００次元とした。
【００４３】
図６ａ〜ｄは、“pyramid”をクエリとした結果である。図６ａは、カイロを注目点とした結果であり、エジプトのピラミッドの画像が上位画像になっている。図６ｂは、パリが注目点であり、ルーブル美術館の前にあるピラミッド型の建築物が上位に表示される。図６ｃは、注目点がニューヨークであり、アメリカ東部で撮影された建築物の画像が上位に表示される。図６ｄは、注目点がシドニーであり、オーストラリアで撮影された“pyramid“に関する画像が上位に表示されている。
【００４４】
また、図７ａ〜ｄは、“traditional”をクエリとした結果である。図７ａは東京、図７ｂはシドニー、図７ｃはリオデジャネイロ、図７ｄはデリーである。各地域についての伝統的な衣装を着た人々の画像が得られた。即ち、例えば“traditional”と“東京”である場合、着物などを着た人の画像が上位にランキングされている。
このように、大量の画像情報を検索し、ユーザにとって関心があると思われる画像を上位に表示するためのランキング方法を提供することが可能となる。また、ＧＰＳ情報を用いることで、同一物体の画像を排除することも可能となる。
【００４５】
＜実験例１−２＞
また、式１のαを変化させると、以下のように、画像の特徴量と場所情報の重みを変化させることにより、上位に表示される画像に変化が起こるので、どちらの情報を優先させて上位にランキングするのか、ユーザの好みにより調整することが可能となる。
【００４６】
図８ａ〜ｅは、“house”をクエリとし、αの値を(a)１．０、(b)０．９、(c)０．８、(d)０．５、(e)０．０と変化させたものである。(a)では、α＝１なので、シドニーという場所情報の重みは一切入ってない状態であり、上位に表示されるのは、西洋の家の画像である。(b)では、α＝０．９なので、シドニーという場所情報の重みが１０％入ったものであり、オーストラリアの家の画像が上位になっている。(c)では、α＝０．８であり、さらにシドニーという場所情報の重みが増したものであり、オーストラリアの中でもシドニーに近い場所で撮影された画像が上位になっている。(d)では、α＝０．５、即ち、画像特徴量と場所情報の重みが５０：５０であり、シドニーに近い場所で撮影されただけで、見た目があまり“house”らしくない画像も上位に入っている。(e)では、α＝０であり、画像特徴量の重みは一切含まれず、シドニーという場所情報のみによるものであり、“house”とは関係がなく撮影場所がシドニーに近い順に表示される。
【００４７】
＜第２実施形態＞
本実施形態は、画像に付されたメタデータにおけるタグや説明のためのテキスト文の類似度を使用するものである。なお、画像に直接付されたテキスト文等だけでなく、画像が含まれるＷｅｂページのテキスト文を使用してもよい。この場合、類似度行列Ｓは以下の式２により求められる。なお、Svは視覚特徴量ベクトル、Stはメタデータ特徴量ベクトル、βは視覚特徴量ベクトルとメタデータ特徴量ベクトルの重みを調整するパラメータである。
【数５】

【００４８】
具体的には、画像に付されたテキストをクエリごとに集計し、多く付された上位例えば５００の種類のテキストをコードブックとし（但し、クエリ自体はコードブックには入れない）、そのテキストについてのバイナリベクトルを画像の特徴ベクトルとして、そのコードブックに関する５００次元のベクトルを画像ごとに作成する。それぞれの画像では、付されているテキストに対応する要素が１になり、逆に付されていない要素は０になる。画像間の類似度は、バイナリベクトルのコサイン類似度を使用する。例えば、画像に付されたテキストに対応する要素が１で他が０そのため画像X,Yの類似度は以下の式１３ようになる。
【数６】

【００４９】
＜実験例２＞
図９は、テキストによる類似度を使用し、“napoleon”をクエリとし、場所情報を“シドニー”とした場合の結果である。上位画像のほとんどがナポレオンフィッシュに関連する画像となっている。これに比べ、視覚特徴量のみを使用した場合は、図１０のように、無関係な画像も含まれている。テキストの内容は人により付けられているので、画像の特徴に直接関係のある場合が多いことに起因すると考えられる。
【００５０】
＜第３実施形態＞
本実施形態は、複数の画像の視覚特徴量とメタデータ特徴量（タグ特徴量）を混合するものである。例えば、２つの画像の視覚特徴量とメタデータ特徴量から、すべてが混合された類似度行列を求めるには、式１４のように計算できる。なお、Sv1、Sv2はそれぞれの視覚特徴量の類似度行列、Stはメタデータ特徴量の類似度行列である。
【数７】

【００５１】
＜実験例３−１＞
図１１ａ〜ｃは“phone”をクエリとし，パリを場所情報とした場合の結果である。
(a)ではタグ特徴量を用いて類似度を求めており、英国の赤い電話ボックスの画像が上位画像となっている。これらの画像には、“london”、“red”、“phonebooth”といったタグが共通して付与されていた。
(b)では視覚特徴量を用いて類似度を求めており、街中を写した黒っぽい画像が上位画像となっている。
(c)はタグ特徴量と視覚特徴量でそれぞれ求めた類似度を合成して用いた場合である。
赤い電話ボックスの全体を写した画像が主な上位画像となっている。
タグ特徴量によって赤い電話ボックスの画像が上位になりつつ、視覚特徴量によって電話ボックスの全体を写した画像が上位に選ばれたと考えられる。
【００５２】
＜実験例３−２＞
図１２ａ〜ｃは“cat”をクエリとし、東京を場所情報とした場合の結果である。
(a)ではタグ特徴量を用いて類似度を求めており、屋内で撮影された猫の画像が主な上位画像となっている。これらの画像には、“pets”、“cute”といったタグが共通して付与されていた。
(b)では視覚特徴量を用いて類似度を求めており、屋外で撮影された猫の画像が主な上位画像となっている。これは背景領域の類似性によるものと考えられる。
(c)はタグ特徴量と視覚特徴量でそれぞれ求めた類似度を合成して用いた場合である。
屋内での撮影画像と屋外での撮影画像のバランスが良くなり、上位画像の多様性が向上している。
これらのことは、視覚特徴量とタグ特徴量を組み合わせることで、より多角的な観点からみて尤もらしい上位画像を得られるようになる可能性や、上位画像の多様性が向上する可能性を示している。
【００５３】
＜第４実施形態＞
本実施形態では、複数の場所情報に基づき、バイアスベクトルを求めるものである。複数の場所情報のバイアスベクトルの平均、最大値、最小値などにより求めることができる。
【００５４】
＜実験例４＞
図１３は、“insect”をクエリとし、注目点として、シドニー・デリー・ケープタウンを場所情報とした場合の結果である。３つの場所情報それぞれについてバイアスベクトルを作成し、その平均ベクトルを使用している。インド洋を取り囲む３都市を使用することで、インド洋を囲む広い地域で撮影された虫の画像が上位画像として得られている。
【００５５】
＜第５実施形態＞
本実施形態では、場所情報で与えられた位置から遠い位置の位置情報を持つ画像に大きい値を与える、即ち、ネガティブなバイアスベクトルを求めるものである。式１５によりもとめることができる。例えば、パリ以外の凱旋門画像を検索したい場合に、場所情報の入力値として“パリ”を与えることができる。
【数８】

＜実験例５−１＞
図１４(a)は“castle”をクエリとし、東京を場所情報とした場合の結果である。
東京に近い場所で撮影された画像に大きいバイアス値を与えたため日本の城の画像が上位画像となった。
図１４(b)は、逆に、東京から遠い地点で撮影された画像に大きいバイアス値を与えた場合の結果である。日本から離れた各地で撮影された、城を主とした建物の画像が上位となっている。
＜実験例５−２＞
図１５は“arc de triomphe”をクエリとし、パリについてネガティブなバイアスベクトルを用いた場合の結果である。タイの凱旋門（パトゥーサイ）の画像や、中国の深センにあるフランスの凱旋門を模倣したものの画像が上位にきており、「パリ以外の凱旋門画像」が得られている。
【００５６】
上述したランキングを作成する方法を、コンピュータに実行させるためのプログラムとして実現することもできるし、コンピュータにより読み出され実行可能なプログラムとして記憶した記憶媒体として提供することもできる。
【００５７】
＜第６実施形態＞
図１６は、上述したランキングを作成する方法を実装した画像表示システムのブロック図である。
【００５８】
本実施形態における画像表示システム１の入力受付部１０は、ユーザ９９が関心のある検索しようとする画像のクエリと場所情報を、画像表示システム１への入力として、受け付ける。具体的には、図２に関して上述した通りである。
【００５９】
検索部２０は、入力受付部１０で受け付けた画像のクエリを基に、データベース内の画像データ１００やインターネット上の画像データ２００を検索する。行列作成部３０は、検索部２０により検索条件に合致し探し出された画像から特徴量を抽出し、類似度行列を作成する。また、バイアス作成部４０は、検索部２０により探し出された画像のメタデータに含まれる位置情報と入力受付部１０において入力された場所情報の位置から、特徴量を補正するためのバイアスベクトルを作成する。ランキング計算部５０は、行列作成部３０が作成した類似度行列とバイアス作成部４０が作成したバイアスベクトルを用いて、ＶｉｓｕａｌＲａｎｋを実行し、画像のランキングを得る。表示部６０は、ユーザ９９に対して、ランキング計算部５０が計算したランキングを基にした表示順に従い、画像を表示する。
これによれば、大量の画像情報を検索し、ユーザにとって関心があると思われる画像を上位に表示するシステムを提供することが可能となる。
【符号の説明】
【００６０】
１画像表示システム
１０入力受付部
２０検索部
３０行列作成部
４０バイアス作成部
５０ランキング計算部
６０表示部
９９ユーザ
１００データベース内の画像データ
２００インターネット上の画像データ

【特許請求の範囲】
【請求項１】
メタデータを有する画像を検索し、ランキングを作成する方法であって、
場所情報を含む入力を受け付けるステップと、
前記入力に基づき、前記画像を検索するステップと、
前記検索した画像の特徴量ベクトルを抽出し、類似度行列を作成するステップと、
前記検索した画像の前記メタデータ内の位置情報と前記入力により示された位置との距離に基づきバイアスベクトルを作成するステップと、
前記類似度行列と前記バイアスベクトルを用いて、下記（１）式を反復計算することによりランキングを作成するステップと、を含み、
前記バイアスベクトルを作成するステップにおいて、前記距離が小さいほど大きなバイアスを与えることを特徴とするランキングを作成する方法。
Ｒ＝α（Ｓ×Ｒ）＋（１−α）Ｐ・・・（１）
但し、
Ｒは、ランキング値、
Ｓは、類似度行列、
Ｐは、バイアスベクトル、
αは、バイアスの強さを調整するパラメータ（０＜＝α＜＝１）、である。
【請求項２】
前記特徴量ベクトルは、下記（２）式に基づき抽出されることを特徴とする請求項１にランキングを作成する方法。
Ｓ＝β×Ｓｖ＋（１−β）Ｓｔ・・・（２）
但し、
Ｓｖは、視覚特徴量ベクトル、
Ｓｔは、メタデータ特徴量ベクトル、
βは、視覚特徴量ベクトルとメタデータ特徴量ベクトルの重みを調整するパラメータ（０＜＝β＜＝１）、である。
【請求項３】
前記視覚特徴量ベクトルは、複数の画像から求められることを特徴とする請求項２に記載のランキングを作成する方法。
【請求項４】
前記バイアスベクトルを作成するステップにおいて、複数の前記場所情報に基づき、バイアスベクトルを作成することを特徴とする請求項１に記載のランキングを作成する方法。
【請求項５】
前記バイアスベクトルを作成するステップにおいて、前記距離が大きいほど大きなバイアスを与えることを特徴とする請求項１に記載のランキングを作成する方法。
【請求項６】
前記入力を受け付けるステップは、前記αの値の入力をさらに受け付けることを特徴とする請求項１に記載のランキングを作成する方法。
【請求項７】
メタデータを有する画像を検索し、ランキングに基づき前記画像を表示するシステムであって、
場所情報を含む入力を受け付ける入力受付部と、
前記入力に基づき、前記画像を検索する検索部と、
前記検索した画像の特徴量ベクトルを抽出し、類似度行列を作成する行列作成部と、
前記検索した画像の前記メタデータ内の位置情報と前記入力により示された位置との距離に基づきバイアスベクトルを作成するバイアス作成部と、
前記類似度行列と前記バイアスベクトルを用いて、下記（１）式を反復計算することによりランキングを作成するランキング計算部と、
前記ランキングに基づき前記画像を表示する表示部と、を備え、
前記バイアス作成部において、前記距離が小さいほど大きなバイアスを与えることを特徴とする画像表示システム。
Ｒ＝α（Ｓ×Ｒ）＋（１−α）Ｐ・・・（１）
但し、
Ｒは、ランキング値、
Ｓは、類似度行列、
Ｐは、バイアスベクトル、
αは、バイアスの強さを調整するパラメータ（０＜＝α＜＝１）、である。
【請求項８】
前記特徴量ベクトルは、下記（２）式に基づき抽出されることを特徴とする請求項７に記載の画像表示システム。
Ｓ＝β×Ｓｖ＋（１−β）Ｓｔ・・・（２）
但し、
Ｓｖは、視覚特徴量ベクトル、
Ｓｔは、メタデータ特徴量ベクトル、
βは、視覚特徴量ベクトルとメタデータ特徴量ベクトルの重みを調整するパラメータ（０＜＝β＜＝１）、である。
【請求項９】
前記視覚特徴量ベクトルは、複数の画像から求められることを特徴とする請求項８に記載の画像表示システム。
【請求項１０】
前記バイアス作成部において、複数の前記場所情報に基づき、バイアスベクトルを作成することを特徴とする請求項７に記載の画像表示システム。
【請求項１１】
前記バイアス作成部において、前記距離が大きいほど大きなバイアスを与えることを特徴とする請求項７に記載の画像表示システム。
【請求項１２】
前記入力受付部は、前記αの値の入力をさらに受け付けることを特徴とする請求項７に記載の画像表示システム。
【請求項１３】
請求項１乃至６のいずれかに記載のランキングを作成する方法を実行させるためのプログラム。
【請求項１４】
請求項１３に記載のプログラムを記録したコンピュータ読み取り可能な記憶媒体。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８ａ】

【図８ｂ】

【図８ｃ】

【図８ｄ】

【図８ｅ】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４ａ】

【図１４ｂ】

【図１５】

【図１６】

【公開番号】特開２０１１−２３８０５７（Ｐ２０１１−２３８０５７Ａ）
【公開日】平成２３年１１月２４日（２０１１．１１．２４）
【国際特許分類】

物理学 (1,541,580)
- 計算；計数 (381,677)
  - 電気的デジタルデータ処理 (228,215)
    - 特定の機能に特に適合したデジタル計算またはデータ処理の装置また... (34,028)
      - 情報検索；そのためのデータベース構造 (17,914)

【出願番号】特願２０１０−１０９４５４（Ｐ２０１０−１０９４５４）
【出願日】平成２２年５月１１日（２０１０．５．１１）
【新規性喪失の例外の表示】特許法第３０条第１項適用申請有り　平成２１年１１月１９日　社団法人電子情報通信学会発行の「電子情報通信学会技術研究報告　信学技報　Ｖｏｌ．１０９　Ｎｏ．３０６」に発表
【出願人】（５０４１３３１１０）国立大学法人電気通信大学 (383)
【Ｆターム（参考）】

検索装置 (67,127)

[ Back to top ]

画像ランキング方法、プログラム及び記憶媒体並びに画像表示システム

メニュー

スポンサーリンク

次の公報 »

« 前の公報

画像ランキング方法、プログラム及び記憶媒体並びに画像表示システム

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク