説明

画像データセットをナビゲートするための方法、装置、及びプログラム

【課題】本発明は、コンテンツだけでなく様々な特徴を用いることによって、画像データセットをナビゲートするための方法、及び装置を提供することを目的とする。
【解決手段】この方法は、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を画像データセットから検索し、利用可能な特徴セットからユーザが選択した第1特徴の受信し、利用可能な特徴セットからユーザが選択した第2特徴の受信し、検索された画像のうちの少なくともいくつかをグラフィカルユーザインタフェース上に同時に配列して表示する、ことを含む。この画像の配列は、第1特徴のみが選択された場合、第1特徴の異なるレベルを反映し、第1及び第2特徴が選択された場合、第1及び第2特徴のレベルの異なる組み合わせを反映する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像検索及び選択に関する。本発明は、特に、画像データベースを探索するナビゲーションシステム、及び方法に関する。
【背景技術】
【0002】
様々な用途(例えば、商業デザイン、編集作業、専門的デジタル写真、及び資産管理)において、後日使用するため、多数のデジタル画像が取得されて格納される。従来の探索技法による画像の検索は、時間のかかることが多い。例えば、画像コレクションが適切にタグ付けされている場合、ユーザは、テキストクエリ(例えば、「花」)を入力して、このクエリに応答する多数の画像(例えば、花を含むものとして手動でタグ付けされた画像)を検索する。他の検索方法は、特徴抽出技法に基づく。例えば、自動システムは、抽出された特徴の類似度に基づいて、手動でラベル付けされた画像のタグを、ラベル付けされていない画像に広めても良い。或いは、ユーザが花の画像を入力し、この入力画像の特徴と格納されている画像の特徴とを比較することによって、類似した画像が自動的に検索されてもよい。
【0003】
画像探索は、通常、明確な基準を用いることによって探索空間を狭く定めて区切ることと、十分に多くの利用可能画像サンプルをブラウズして、最も適した又は美的な魅力のある画像を確実に逃さないようにすることとの間における、妥協を伴う。これにより、ユーザには、比較的多くの画像サブセットが残される。従って、ブラウジングは、依然として、第1の画像選択方法である。
【0004】
現在のシステム(例えば、グーグルイメージズ(Google Images(登録商標))及びフリッカー(FLICKR(登録商標))は、コンテンツに基づいて画像探索を行い、美的な絞り込みをするための非常に基本的な選択肢を提供する。しかしながら、これらのシステムは、特徴を組み合わせて探索するためのツールを提供しない。これらのシステムにおいて、ユーザは、絞り込み基準シーケンスを選択して、繋ぎ合わせるのがせいぜいである。例えば、グーグルイメージズ(登録商標)では、ユーザは、例えば「空」というクエリのようなコンテンツによって探索し、次に、「青」というボックスをクリックすることによって、青空の画像を得ることができる。このようなタイプのブラウジングでは、選択された特徴の絞り込みと、非実際的特徴の異なる組み合わせの探査との間を、行ったり来たりすることとなる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許出願公開第2007/0005356号明細書
【特許文献2】米国特許出願公開第2007/0258648号明細書
【特許文献3】米国特許出願公開第2008/0069456号明細書
【特許文献4】米国特許出願公開第2006/0164664号明細書
【特許文献5】米国特許第5,357,352号明細書
【特許文献6】米国特許第5,363,209号明細書
【特許文献7】米国特許第5,371,615号明細書
【特許文献8】米国特許第5,414,538号明細書
【特許文献9】米国特許第5,450,217号明細書
【特許文献10】米国特許第5,450,502号明細書
【特許文献11】米国特許第5,802,214号明細書
【特許文献12】米国特許第5,347,374号明細書
【特許文献13】米国特許第7,031,534号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、コンテンツだけでなく様々な特徴を用いることによって、画像データセットをナビゲートするための方法、及び装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の実施形態の一態様によれば、画像データセットをナビゲートするためのユーザ支援方法が提供される。この方法は、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を画像データセットから検索し、利用可能な特徴セットからユーザが選択した第1特徴の受信し、利用可能な特徴セットからユーザが選択した第2特徴の受信する、ことを含む。この方法は、検索された画像のうちの少なくともいくつかを、グラフィカルユーザインタフェース上に同時に配列して表示することを更に含む。この画像の配列は、第1特徴のみが選択された場合、第1特徴の異なるレベルを反映する。また、この画像の配列は、第1及び第2特徴が選択された場合、ユーザが選択した第1特徴及び第2特徴のレベルの異なる組み合わせを反映する。
【0008】
この方法において、前記表示することは、検索された画像のうちの少なくともいくつかをグラフィカルユーザインタフェース上に同時にグループで表示することを含んでもよい。表示された各画像グループは、ユーザが選択した第1特徴及び第2特徴のレベルの異なる組み合わせに対応する。
【0009】
表示された画像グループは、選択された特徴の値に応じて順序付けされてもよい。
【0010】
前記表示することは、画像グループを二次元配列で表示することを含んでもよい。第1特徴は第1次元においてレベルが上昇し、第2特徴は第2次元においてレベルが上昇する。
【0011】
ディスプレイにおける各画像グループは、第1及び第2特徴の量子化値の組み合わせが、その他の各グループと異なってもよい。
【0012】
この方法は、第1特徴セットから第1特徴を選択する第1セレクタと、第2特徴セットから第2特徴を選択する第2セレクタとを、グラフィカルユーザインタフェース上に表示することを含んでもよい。
【0013】
第1特徴は美的特徴であり、第2特徴は感情的特徴であってもよい。
【0014】
この方法は、ユーザが第3特徴セットから第3特徴を選択できるようにすることを含んでもよい。表示された画像は、第1、第2、及び第3特徴から選択された少なくとも2つに応じてグループ化されている。
【0015】
特徴セットにおける各特徴に関し、異なる特徴値に対応する複数の量子化レベルが設けられると共に、画像データセットにおける各画像は、各特徴の量子化レベルのそれぞれと関連付けられる。
【0016】
特徴セットにおける各特徴に関し、少なくとも3つの量子化レベルがあってもよい。
【0017】
前記ユーザが選択した第1及び第2特徴の受信をもたらすことは、ユーザがグラフィカルユーザインタフェースを介して選択したものの受信をもたらすことを含んでもよい。
【0018】
この方法は、ユーザが選択した画像又は画像グループに対する最も近い画像及びほぼ同じ画像のうちの少なくとも1つを検索し、この最も近い画像及びほぼ同じ画像のうちの少なくとも1つをグラフィカルユーザインタフェース上に表示する、ことを含んでもよい。
【0019】
画像は、写真を含んでもよい。
【0020】
この方法は、データセットにおける画像の少なくとも一部をコンテンツに応じて自動的に分類することを含んでもよい。前記テキストクエリに応答する画像を検索することは、このような画像のコンテンツ分類に基づいてもよい。
【0021】
この方法は、画像を受容する収納ホルダを備えたドキュメントを、ユーザが選択した画像グループと同時に表示することを含んでもよい。ユーザは、この表示された画像グループから、収納ホルダに挿入する画像を選択することができる。
【0022】
表示された画像は、格納されているデータセットにおける対応する画像から取り出されたサムネイル画像であってもよい。
【0023】
前記表示することは、検索された画像の配列を表示することを含んでもよい。この配列における画像の位置は、特徴レベルの組み合わせに対応する。
【0024】
コンピュータプログラム製品は、コンピュータによって実行されると上述したような方法を行う命令を符号化する有形媒体を含んでもよい。
【0025】
ナビゲーションシステムは、上述したような方法を行う命令を格納するメモリと、この命令を実行するためにメモリと通じているプロセッサとを含んでもよい。
【0026】
別の態様では、画像データセットをナビゲートする装置は、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を関連する画像データセットから検索し、利用可能な特徴セットからユーザが選択した第1特徴を受信し、利用可能な特徴セットからユーザが選択した第2特徴を受信し、検索された画像を選択された特徴のレベルに基づいてグループに区分化し、検索された画像のグループのうちの少なくともいくつかを関連するグラフィカルユーザインタフェース上に表示するための、メモリに格納された命令を含む、ナビゲーションシステムを含む。メモリと通じているプロセッサが、この命令を実行する。
【0027】
命令は、第1特徴セットから第1特徴を選択する第1セレクタと第2特徴セットから第2特徴を選択する第2セレクタとを表示するための命令を更に含んでもよい。
【0028】
この表示するための命令は、画像グループを二次元配列で表示するための命令を含んでもよい。第1特徴は第1次元において値が上昇し、第2特徴は第2次元において値が上昇する。ディスプレイにおける各画像グループは、第1及び第2特徴値の組み合わせが、その他の各グループと異なる。
【0029】
第1特徴セット及び第2特徴セットにおける各特徴に関し、異なる特徴値に対応する複数の量子化レベルが設けられると共に、画像データセットにおける各画像は、各特徴の量子化レベルのそれぞれと関連付けられてもよい。
【0030】
別の態様では、ドキュメントに画像を追加する方法は、画像を受容する少なくとも1つの収納ホルダを備えたドキュメントを格納し、ユーザのテキストクエリを受信し、このテキストクエリに応答する画像を画像データセットから検索する、ことを含み、データセットにおける各画像は、コンテンツに応じて分類されると共に、特徴セットのそれぞれに対する特徴値と関連付けられる。この方法は、特徴セットからユーザが選択した第1特徴及び第2特徴を受信し、検索された画像のうちの少なくともいくつかをグラフィカルユーザインタフェース上に表示し(表示された画像は、ユーザが選択した第1及び第2特徴に応じてグループ化される)、表示された画像グループから収納ホルダのうちの1つに挿入する画像をユーザが選択できるようにする、ことを更に含む。
【図面の簡単な説明】
【0031】
【図1】画像ナビゲーションシステム及び方法の一例の概要を示すブロック図である。
【図2】画像ナビゲーション装置の機能ブロック図である。
【図3】画像ナビゲーションのユーザ支援方法の一例を示すフローチャートである。
【図4】図2の装置のグラフィカルユーザインタフェースのスクリーンショットの一例を示す図であって、コンテンツベースのクエリに応答する画像を表示している。
【図5】図2の装置のグラフィカルユーザインタフェースのスクリーンショットを示す図であって、画像を区分化する2つの特徴F1及びF2の選択に従って、二次元配列で画像を表示している。
【図6】図2の装置のグラフィカルユーザインタフェースのスクリーンショットを示す図であって、図5の配列の区分のうちの1つからの画像セットと、これらの画像のうちの選択されたもので充填される隣接したテンプレートとを示している。
【発明を実施するための形態】
【0032】
本発明の例示的実施形態は、画像のデータベースをナビゲートして探索するシステム、装置、及び方法に関する。このシステム、装置、及び方法では、コンテンツベースの探索技法と特徴ベースの探索とを組み合わせることができる。選択される特徴は、美的特徴及び/又は感情的特徴である。画像のデータセットをナビゲートする際、このシステムは、ユーザが、テキストクエリによって特定の意味的カテゴリ(例えば、花)を選択し、次に、この選択されたカテゴリにおいて、特徴の異なる組み合わせを用い、繰り返して少なくとも1つの画像サブセットを探査できるようにすることによって、探索空間を作成しやすくする。この例示的実施形態では、ユーザは、美的特徴(光、コントラスト、ぼやけ、色など)及び感情的特徴(例えば、感謝(appreciation)、活動)を含む特徴セットから選択することができる。
【0033】
異なる細分性(クラスタ、ほぼ同じ画像(near-duplicates)の探査など)によって画像データベースをナビゲートし、適切な画像によってドキュメントドラフトを繰り返し作成するために、様々な可視化戦略(クラスタ化、モザイクなど)がユーザに提供される。
【0034】
図1を参照すると、この例としてのシステム及び方法の概要が示されている。このシステム及び方法は、多数(例えば、何百、何千、又は何百万)の画像(例えば、写真画像及び/又はグラフィック画像)コレクションのような、資産を含むデータベース10に依存している。特徴抽出12では、コンテンツベースの特徴14、感情的特徴16、及び美的特徴18のうちの1つ以上に基づいて、データベース10から画像を選択することができる。探索空間作成20では、このデータベースから画像サブセットを得て、これらの画像を、特徴の組み合わせに基づいてクラスタ化して表示できるように、カテゴリ化22、クラスタ化24、及び検索26方法/コンポーネントのうちの1つ以上を用いて区分化する。可視化28では、この画像サブセットの少なくとも一部の表示を、ユーザ30が見るために生成する。
【0035】
図2を参照すると、ユーザが画像データセットをナビゲートするのを支援する装置40が、デジタル処理デバイス(例えば、コンピュータ)の形態で示されている。このコンピュータ40は、デジタルプロセッサ42(例えば、コンピュータのCPU)と、これに関連付けられたメモリ(ここでは、メインメモリ44及びデータメモリ46として示されている)と、を含む。
【0036】
このコンピュータ40は、入力インタフェース50及び出力インタフェース52を含み、これらのインタフェースは、結合されていても分離されていてもよい。インタフェース50は、データベース10として機能するデータメモリ46に格納されている電子データオブジェクト54(画像)のデータセットを受信する。当然のことながら、このデータベース10は、コンピュータ40から遠隔配置され、適した通信リンクによってアクセスされてもよい。データセット10における画像54の全部又は一部56は、コンテンツタグによってラベル付けされている。このコンテンツタグは、ユーザによるその画像コンテンツに関する記述及び/又はその画像に関する何らかのコメントを含んでもよい。例えば、1つの画像54は、「春の花」という記述と「3月の華やいだ我が庭」のようなコメントによってタグ付けされる。画像がテキストで囲まれている場合には、この囲んでいるテキストからコンテンツタグを取り出すことができる。自動タグ付け方法を用いて、ラベル付けされていない画像にタグを広めてもよい。
【0037】
データベース10における画像54は、あらゆるファイルフォーマット(例えば、JPEG、TIFFなど)であってよい。これらの画像は、個別画像であってもビデオ画像であってもよい。通常、各デジタル画像は、その画像を形成するピクセル配列に対する画像データを含む。この画像データは、色分解セット(例えば、RGB)のそれぞれに対する色材値(例えば、グレースケール値)を含む、或いは、異なる色を表現することのできる別の色空間で表される。通常、「グレースケール」とは、どのように表されるにしても(RGB、YCbCrなど)、あらゆる単色チャネルの光学濃度値を指す。
【0038】
また、インタフェース50又は別個のインタフェースは、データベース10から1つ以上の画像を受容する収納ホルダ(空間)60を備えたドキュメント58(例として、テンプレート)を受信するように構成されてもよい。
【0039】
インタフェース52は、選択画像54が追加された修正ドキュメント62を出力する。
【0040】
例としての入力インタフェース50及び出力インタフェース52は、有線及び無線ネットワークインタフェース(例えば、モデム)、又は、ローカルインタフェース(例えば、USBポート、ディスクドライブなど)を含む。コンピュータのこれらのコンポーネント42、44、46、50、52は、データ/制御バス64によって、通信するように相互接続されている。
【0041】
グラフィカルユーザインタフェース(GUI)70は、表示画面72(例えば、カラーモニタ又は液晶ディスプレイ画面)と、テキストクエリを入力するためのユーザ入力デバイス(例えば、キーボード74、キーパッド、タッチスクリーンデバイス、カーソル制御デバイス76、音声テキスト変換器が関連付けられたマイクロホン、又はこれらの組み合わせ)と、を含む。このGUI70は、1つ以上の有線又は無線リンク78を介して、コンピュータ40と通信するように繋がれている。GUI70は、この例示的実施形態では、コンピュータ40にローカル接続されているが、別の実施形態では、クライアントコンピュータ(図示せず)に繋がれて、次に、このクライアントコンピュータが、ウェブブラウザ、有線又は無線ネットワーク、或いはその他の通信リンクを介して、コンピュータ40に繋がれてもよい。
【0042】
デジタルプロセッサ42は、例えば、シングルコアプロセッサ、デュアルコアプロセッサ(又は、より一般的には、マルチコアプロセッサ)、デジタルプロセッサ及びこれと連動する数値演算コプロセッサ、デジタルコントローラなどによって、様々に実施されてよい。コンピュータ40は、1つ以上の専用又は汎用計算デバイス(例えば、サーバコンピュータ、デスクトップ若しくはラップトップコンピュータ、パームトップコンピュータ、携帯端末(PDA)、カメラ、又は、この例としての方法を行う命令を実行することのできるその他の計算デバイス)を含んでもよい。
【0043】
メモリ44及び46は、分離されていても結合されていてもよく、あらゆるタイプのコンピュータ可読媒体(例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、磁気ディスク若しくはテープ、光ディスク、フラッシュメモリ、又はホログラムメモリ)を含んでもよい。一実施形態では、これらのメモリ44及び46は、ランダムアクセスメモリと読み出し専用メモリの組み合わせから成る。
【0044】
コンピュータ40は、画像ナビゲーションシステム80を実施するのに適したプログラミング及び/又はハードワイヤードファームウェアによって構成されている。この例としてのナビゲーションシステム80は、この例としての方法を行うソフトウェア命令(メモリ44に格納されてプロセッサ42によって実行される)の形態をしている。
【0045】
このナビゲーションシステム80は、特徴抽出コンポーネント12、探索空間作成コンポーネント20、及び可視化コンポーネント28を含み、これらのコンポーネントはそれぞれ、(図1に示されているように)1つ以上の別個のソフトウェアツールを含んでいてもよいし、1つのツールとして結合されていてもよい。
【0046】
特徴抽出コンポーネント12は、ユーザの探索要求が入力される前に、格納されている画像54を処理することができる。この例示的実施形態では、特徴抽出コンポーネント12のコンテンツ特徴抽出器14(図1)は、ラベル付けされていない画像54にコンテンツベースのタグ(意味ラベル)を付与するように訓練(trained)された分類器(又は、二値分類器セット)を含む。この訓練は、ラベル付けされた画像(例えば、データセットにおけるタグ付き画像56)から成る訓練セットに基づいてもよい。これらのラベルは、画像の分類に関する先験的情報、例えば、手動で付与された種類ラベル、を表す。厳格な二値分類では、ラベルは、例えば、オブジェクトが特定の種類に割り当てられる場合には「+1」、そうでない場合には「−1」であってもよい。寛大な二値分類では、ラベルは、例えば、その種類に入る可能性を示す範囲[0,1]内の値であってもよい。別の実施形態では、データセット10全体がコンテンツ特徴によってタグ付けされてもよく、これにより、分類器は必要でなくなる。コンテンツタグは、その画像に関連付けられたテキストコンテンツから、更に又は代わりに抽出されてもよい。
【0047】
感情的特徴抽出器16は、感情に関連付けられた特徴を画像から抽出し、利用可能な感情的特徴セットのそれぞれに対する特徴値に対応して画像にラベルを付与する。
【0048】
美的特徴抽出器18は、美に関連付けられた特徴を画像から抽出し、利用可能な美的特徴セットのそれぞれに対する特徴値に対応して画像にラベルを付与する。
【0049】
図3を参照すると、図2の装置によって行われるコンピュータ実施方法が示されている。この方法は、S100において開始する。
【0050】
S102において、画像54のデータセット10が入力され、処理中、このデータセットは、コンピュータメモリ46に格納されてもよい。
【0051】
S104(特徴抽出)において、特徴(例えば、コンテンツ、美的、及び感情的特徴)が、データベースにおける各画像に対して抽出され、例えば、関連付けられたメタデータ又はその他のタグとして格納される。
【0052】
S106において、GUI70を介してユーザのテキストクエリが受信され、このクエリに応答するデータセット画像のサブセット(例えば、クエリ語に対応する「コンテンツ」ラベルによってタグ付けされた画像)が検索される。
【0053】
S108(探索空間作成)において、ユーザのコンテンツ選択に基づいて、探索空間が作成され、図4のスクリーンショット84に示されているように表示される。検索される全画像が、このときに表示されてもよい。
【0054】
S110において、ユーザ30が選択可能な美的/感情的特徴のうちのいくつかを選択され、ユーザが選択した美的及び/又は感情的特徴が、GUI70を介して受信される。当然のことながら、このようなコンテンツ、美的、及び/又は感情的特徴の選択は、どんな順序で進められてもよい。
【0055】
S112において、ユーザが選択したコンテンツ、美的、及び/又は感情的特徴に基づいて、探索空間が区分化され、これにより画像がグループ化される。画像は、ソフトウェアツール(例えば、K平均法など)のセットを用いて処理されてグループ化されてもよく、これにより、視覚的に一貫性のある探索空間が作成される。このような画像のグループ化は、以下に説明するように、ユーザが選択した特徴に応じて探索空間をクラスタ化又は区分化する、K平均法を用いて行うことができる。
【0056】
S114(可視化)において、ユーザが特徴を選択することによって作成した探索空間が可視化される。探索空間を可視化するには、様々な様式(例えば、クラスタ、モザイク、又はその他のタイプのグループ)を利用してもよい。この例示的実施形態では、図5のスクリーンショット86に示されているように、可視化段階において、二次元配列されたn=9の画像グループ92、94、96(空きグループ)、98、100、102、104、106、及び108が、2つの選択された特徴に対して作成される。当然のことながら、検索画像が区分化されて表示されるグループの数nは、あらゆる適切な数(例えば、4、6、8、9、10、12、又はそれ以上)であってよい。グループの数がより多い場合には、これらのグループをカスケード表示してもよく、ユーザは、選択されたグループセットをクリックして又は別の方法で選択して見ることができる。各グループは、例えば、画面の異なる領域に配置されることによって、且つ/又は、目に見える境界線87が間に設けられることによって、その他のグループと視覚的に区別されてもよい。一実施形態では、これらのグループは単にクラスタ配列されるだけでもよく、間の境界線ははっきりとしないが、各特徴レベルの順序は互いに垂直な方向においてほぼ保たれる。3つ以上の特徴が選択される場合には、ユーザがこれらのグループを見ることのできるその他の方法(例えば、階層表示)がより適切であってもよい。
【0057】
S116において、ユーザは、関心のある1つ以上の画像(後でGUIに表示される)を含むものとして、クラスタのうちの1つを選択してもよい。ユーザは、より詳しく調べるために、例えば、その画像グループ又はその画像グループが配置されている領域をクリックすることによって、画像グループのうちの1つを選択することができる。次に、この選択された画像グループが、画面の一領域に表示される。残りの画像グループは、ディスプレイから削除されてもよい。
【0058】
レイアウトドラフトボタン142を選択することによって、例えば、表示された画像グループの近くで、ドキュメントテンプレート58を同時に見られるようにしてもよい。図6のスクリーンショット88に示されているように、ユーザは、表示画像のうちの選択した画像を、このテンプレート上の適切な収納ホルダ60内にドラッグアンドドロップすることができる。或いは又は更に、選択画像は、まずライトボックス110にドラッグすることができ、ユーザがこのライトボックス内の画像のうちの1つ以上をテンプレート58上にドラッグアンドドロップすることに決めるまで、このライトボックスに表示される。このライトボックス110は、より早い段階で保存された、以前のあらゆる選択画像も収容することができる。
【0059】
ユーザの選択において、この方法は、ユーザが美的/感情的特徴の異なる組み合わせを選択する場合にはS110へ戻ってもよいし、新たなコンテンツ探索が入力される場合には、S106へ戻ってもよい。
【0060】
S118において、ユーザは、選択グループ内に表示されている画像のうちの1つ以上に類似した画像を見たいと望んでもよい。一実施形態では、ユーザは、データベースからK個の最も近い画像(nearest neighbors)を検索するように選択するか、或いは、ほぼ同じ画像を探すように要求することができる。これらの近い画像/同じ画像は、表示グループ内の画像とは異なる基準に基づいて、データベースから選択される。このようにして、同じコンテンツベースのタグによってタグ付けされていない画像が、検索されて表示されてもよい。例えば、最も近い画像は、色ヒストグラムの類似度に基づいて検索されてもよい。その結果、コンテンツは全く異なっていたとしても、色は類似した画像が表示される。ほぼ同じ画像は、そのグループ内の1つ又は全部の画像との低レベル又は高レベル特徴の類似度に基づいて識別することができる。
【0061】
K個の最も近い画像(K-nearest neighbor(KNN))を識別するには、様々な方法がある。例えば、色ヒストグラムを用いることができる。例えば、赤、緑、及び青チャネルのそれぞれの範囲は、16ビン(bin)に量子化される。画像のヒストグラムは、この量子化空間で得られる。K個の最も近い画像は、ヒストグラムの類似度に基づいて得られる。最も近い画像を識別する方法については、例えば、マシュー ギヨーマン(Matthieu Guillaumin)、外、「TagProp:画像に自動的に注釈付けするための最も近いモデルにおける識別メトリック学習(TagProp: Discriminative metric learning in nearest neighbor models for image auto-annotation)」、コンピュータビジョン国際会議(ICCV:International Conference on Computer Vision)、2009年に説明されている。
【0062】
S120において、ユーザがドキュメントテンプレートに満足すると、この埋められた(filled template)テンプレート62は、例えば、プリンタ、ディスプレイ72、又はその他の出力デバイスに出力されるか、或いは、後日検索するためにメモリに格納される。ユーザが単に1つの画像又は画像セットを選択しているだけの場合、この画像は、後日検索するために特定のタグによってタグ付けされてもよいし、システムから出力されてもよい。
【0063】
この方法は、S122において終了する。
【0064】
この例としての方法は、1つ以上の汎用コンピュータ、専用コンピュータなどにおいて実施されてもよい。
【0065】
図3に示した方法は、コンピュータにおいて実行される有形で非一時的なコンピュータプログラム製品で実施されてもよい。このコンピュータプログラム製品は、制御プログラムが記録されている有形で非一時的なコンピュータ可読記録媒体(例えば、この方法を行うように構成されたディスク、ハードドライブなど)であってもよい。
【0066】
次に、この方法及び装置の様々な態様について、より詳細に説明する。
【0067】
上述したように、この例としてのシステム80、方法、及びグラフィカルユーザインタフェース70は、創造的資産54のデータベース10をナビゲートして探索できるようにする。既存のシステムに勝るこのシステム80の1つの利点は、既存のコンテンツベースの探索技法と美的/感情的特徴とを組み合わせることができるという点である。ユーザは、特定の意味的カテゴリ(例えば、花)を選択し、このカテゴリにおいて、美的及び/又は感情的特徴(例えば、光、コントラスト、ぼやけ、色、感謝、活動)の異なる組み合わせを用い、繰り返して画像を探査することによって、探索空間を作成することができる。
【0068】
このシステム80の例示的実施形態では、これらの特徴は、オフラインで(即ち、ユーザがクエリを出す前に)計算される。一例として、以下のような特徴が使用される。
【0069】
1.コンテンツベースの特徴
この例示的実施形態では、ユーザは、意味的コンテンツに基づいて最初の探索を行い、次に、様々な特徴(例えば、画像の美又は感情)によって検索画像をブラウズすることができる。
【0070】
コンテンツベースの特徴に関する種類ラベルとしては、一般的な可視オブジェクトカテゴリ(例えば、花、風景、海景、空、乗り物、人、建物、動物など)、及び/又は特定のテーマ(例えば、パーティー、結婚式、スポーツイベント、夏、冬など)が挙げられる。一実施形態では、これらの種類は、グラフィックデザイナーが関心のある特定分野に対応するように調整されてもよい。コンテンツベースの種類の数は、限定されないが、少なくとも2つであり、例えば、約5〜50、又はそれ以上であってもよい。
【0071】
通常、画像コンテンツに基づいたカテゴリ化技法には、入力画像を一般的に理解される記述に変換する作業セットが含まれてもよい。高レベルコンテンツに基づいて、画像にキーワードを付与する自動化技法が開発されてきた。このような技法では、全景を解析するか又は画像内のオブジェクトに重点をおくことができる。キーワードの付与は、信頼値と関連付けられる。次に、画像は、信頼値が閾値を超えるキーワードによってラベル付けされる。
【0072】
テキストベースの探索に適した画像にタグ付けする一例としては、画像表現(例えば、フィッシャー表現(Fisher representations))が、視覚的な一般分類器(generic visual classifier(GVC))によって用いられてもよく、これにより、画像は、予め定義及び訓練されたカテゴリによって自動的に注釈付けされる。
【0073】
この方法では、画像のパッチセットのそれぞれに対し、低レベル画像記述子が、例えば特徴ベクトルとして抽出される。この抽出された低レベル画像記述子に基づいて、各パッチに対し、表現(例えば、フィッシャーベクトル(Fisher vector))が、例えば連結によって生成されてもよい。このパッチ表現又は低レベル画像記述子に基づいて、その画像の高レベル表現が抽出される。この例示的実施形態では、この高レベル表現は、ベクトル(例えば、フィッシャーベクトル)である。
【0074】
一実施形態では、各特徴タイプに対し、ガウス混合モデル(Gaussian Mixture Models(GMM))を用いて視覚的語彙が構築される。このようなGMMを用いた特徴空間における視覚的語彙の作成は、F.ペロニン(F. Perronnin)らによる「視覚的な一般カテゴリ化に適応させた語彙(Adapted Vocabularies for Generic Visual Categorization)」(コンピュータビジョン欧州会議(ECCV:European Conference on Computer Vision)2006)に説明されている方法によって行われてもよい。ある方法では、訓練セット全体に関して広く構築された1つの視覚的語彙が用いられるが、別の実施形態では、カテゴリ特有画像を用いて、訓練セット全体に関して(普遍的に)訓練された視覚的語彙を各カテゴリに適応させることによって、性能が向上する。次に、二部ヒストグラムセット(1カテゴリに1つ)によって画像が特徴付けられ、各ヒストグラムは、その画像コンテンツが普遍的語彙又は対応するカテゴリ語彙によって最適に作成されているかどうかを説明している。特許文献1を参照されたい。
【0075】
画像の高レベル表現を生成するには、例えば、特許文献1、特許文献2、特許文献3、G.チュルカ(G. Csurka)らによる「バッグオブキーポインツによる視覚的なカテゴリ化(Visual Categorization with Bag of Keypoints)」(コンピュータビジョンにおける統計学習に関するECCVワークショップ(ECCV workshop on Statistical Learning in Computer Vision)2004)、及び、F.ペロニンらによる「画像をカテゴリ化するための視覚的語彙に関するフィッシャーカーネル(Fisher kernel on visual vocabularies for image categorization)」(コンピュータビジョン及びパターン認識に関する電気電子技術者協会(IEEE:Institute of Electrical and Electronics Engineers)会議(CVPR)の会報 (Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition (CVPR))2007)に開示されているような、本明細書中で使用される様々な方法がある。上記最後のF.ペロニンらによる参照文献及び特許文献2には、フィッシャーベクトルに基づいたフィッシャーカーネル(FK)表現が説明されている。
【0076】
バッグオブビジュアルワーズ(Bag-of-Visual Words(BOVW))表現では、画像は、まず視覚的ワード数のヒストグラムによって特徴付けられる。視覚的語彙は、画像の訓練セットから自動的に構築される。
【0077】
これらの方法全てにおいてパッチから抽出される低レベル画像記述子は、一般的に、各パッチの様相を要約する又は特徴付ける定量値(例えば、空間周波数成分、平均輝度、色特性(カラー画像の場合)、階調度値、及び/又はその他の特性値)である。低レベル画像記述子は、関心領域(ROI:regions of interest)において局所的に抽出される。このROIは、画像をセグメント化することによって、特定関心ポイント検出器を利用することによって、規則的な格子を考慮することによって、或いは、単に画像パッチを無作為に抽出することによって、得ることができる。ある実施形態では、各パッチから少なくとも約50の低レベル画像記述子が抽出されるが、抽出することのできる画像記述子は、いずれの特定の数又はタイプにも限定されず、例えば、計算能力によっては、1000又は百万の低レベル画像記述子が抽出されてもよい。この例示的実施形態では、低レベル画像記述子は、局所的な(例えば、ピクセルの)色の統計及び/又はテクスチャを含む。色の統計に関しては、局所的なRGB統計(例えば、平均及び標準偏差)が計算されてもよい。テクスチャに関しては、(色の変化を表す)階調の向きが、各パッチに対しヒストグラム(スケール不変特徴変換(Scale Invariant Feature Transform(SIFT))のような特徴)として計算されてもよい。この例示的実施形態では、2つ(又はそれ以上)のタイプの低レベル画像記述子(例えば、色及びテクスチャ)が別々に抽出され、高レベル表現は、2つのフィッシャーベクトル(各特徴タイプに対して1つ)の組み合わせに基づいている。別の実施形態では、(ロウ(Lowe)による「局所的なスケール不変特徴からのオブジェクト認識(Object Recognition From Local Scale-Invariant Features)」(ICCV、1999)によって説明されているような)SIFT記述子が、各パッチに関して計算される。
【0078】
分類器(二値分類器セットから成っていてもよい)は、画像表現(例えば、フィッシャーベクトル)及び訓練画像56のラベルに関して訓練される。一実施形態では、例えばサポートベクトルマシン(Support Vector Machine(SVM))分類器のように、機械学習分類方法が用いられる。別の実施形態では、訓練される分類器は、あらゆる識別分類器(即ち、種類境界を作成する分類器)(例えば、フィッシャーカーネル(FK)又はニューラルネットワーク)であってよい。次に、この訓練された分類器を用いて、ラベル付けされていない画像に、その画像がある種類に属する確率を表すラベルが付与される。或いは、この分類器は、このような確率値を閾値処理することによって生成されるイエス/ノー二値ラベルを付与してもよい。
【0079】
この例示的実施形態では、ユーザがクエリを入力する前にコンテンツベースのタグ付けが行われるが、ユーザが例えばオンラインデータベースから画像グループを選択することによって、テキストクエリの入力後にデータセットが作られることもある、と考えられる。この場合、カテゴリに応じた画像のコンテンツベースのタグ付けは、テキストクエリが入力された後に行われてもよい。
【0080】
2.感情的及び美的特徴
その他の特徴のそれぞれに関し、画像のデータセット10が量子化されてもよい(即ち、その特徴に対する値の範囲をカバーする区分セットのうちの1つに割り当てられてもよい)。所定の特徴に対する区分がそれぞれ同数の画像を収容してもよいし、或いは、特徴空間が特徴値に応じてその他の方法で区分化されてもよい。例えば、色特徴「赤」に関し、コレクションにおける全ての画像に、例えば(RGB色空間における)平均ピクセル赤色相に基づいて、赤さの値が付与される。画像が区分化される量子化レベルの数に応じて、赤さのスコアが最も高い画像が第1レベルに、次にスコアが高い画像セットが第2レベルに、というように割り当てられる。量子化レベルの数は、特徴によって異なっていてもよいし、全ての特徴に対して同じであってもよい。1つの特徴に対する量子化レベルの数は、データセットにおける画像の数及び選択可能な特徴の数に応じて、約2〜10(例えば、少なくとも3)が有用に用いられてもよい。例えば、二次元配列に関して、2つの特徴が選択される場合、各次元において3つの量子化レベルがあると、3×3の配列(9グループ)が生成される。
【0081】
この例示的実施形態では、感情的又は美的概念分類器を学習する必要なく、画像データから直接的に感情的及び美的特徴が決定される。これらの感情的及び美的概念は、非常に主観的で、学習するのが困難である。このような概念による画像のタグ付けに関して強い意思決定を行うには、限界がある。従って、この例示的実施形態では、タグ付けの代わりに、感情的又は美的概念が高レベル特徴と考えられる(即ち、画像自体から抽出された低レベル特徴に基づく)。このような高レベル特徴に基づいて、画像(後で量子化される)にスコアが付与される。
【0082】
この例としての方法により、美的又は感情的カテゴリ化が高精度である必要なく、或いは、異なる様相を1つの画像値にまとめる必要なく、これらの特徴の異なる組み合わせによって探索できる柔軟性が提供される。
【0083】
2A.美的特徴
使用される美的特徴の例としては、明度、コントラスト、ぼやけ、色相、画像サイズなどが挙げられる。タイプによって、まず1つの特徴グループが選択可能である。例えば、全般的な特徴タイプ「色」に関し、選択可能な特徴としては、赤、青、緑などが挙げられる。画像の特徴値を量子化するには、様々な方法があり、これらの方法は、最初はピクセル色材値の分析に基づいてもよい。例えば、特許文献4を参照されたい。
【0084】
美的特徴を決定する技法については、例えば、特許文献5、特許文献6、特許文献7、特許文献8、特許文献9、特許文献10、特許文献11、特許文献12、及び特許文献13に説明されており、これらの技法には、統計値(例えば、ノイズ測定量、又は、低解像度バージョンの画像に関する輝度及び色度分布)を生成することが含まれてもよい。例えば、特許文献8を参照されたい。
【0085】
明度とは、画像の輝度を指す。これは、1つの画像における全ピクセルの明度値の平均である。各明度値は、ピクセルのRGBから濃淡値を算出するか、或いは、ピクセルのRGBを輝度色空間(例えば、HSV(Vの値は明度))に変換することにより、計算することができる。
【0086】
コントラストとは、ダイナミックレンジの有効利用を指す。(例えば、特許文献7、及び、ヤンケ(Yan Ke)らによる「写真品質評価のための高レベル特徴の設計(The Design of High-Level Features for Photo Quality Assessment)」(CVPR06)を参照されたい。)
【0087】
彩度とは、画像におけるカラーオブジェクトの鮮やかさを指す。グレーの多い色ほど、彩度が低いと見なされるのに対し、入っているグレーが非常に少ない明るい色は、彩度が高いと見なされる。色の彩度は、画像に対する感情的反応に影響を与える。このシステムは、例えば、特許文献9に説明されているように、HSV空間における色彩度値を検出して、各画像に対し量子化平均彩度値をもたらす。
【0088】
画像のぼやけは、一般的には、カメラとオリジナルシーンとの相対運動又は焦点の外れた光学系によって生じる、帯域幅低減の一形態である。画像のぼやけは、ガウスフィルタ(Gaussian filter)によって画像を平滑化してぼやけた画像を得ることにより計算できる。このぼやけは、ぼやけた画像の二次元フーリエ変換を閾値処理することによって得られる画像の最大周波数に比例する。例えば、上記ヤンケらによる「写真品質評価のための高レベル特徴の設計」(CVPR06)を参照されたい。
【0089】
色相とは、目が検出する色の第1特性を指す。色相は、ピクセルのRGB値をHSVに変換した後の、ピクセルのHSV色空間表現におけるHの値と考えられる。
【0090】
画像サイズとは、1つの画像におけるピクセルの数を指す。画像サイズは、1つの画像のピクセル幅とピクセル高さとをかけることによって計算される。
【0091】
露出量とは、写真の撮影中にカメラセンサに当たる光の量を指す。露出量は、明度と同じであると考えられる。
【0092】
例えば、画像のダイナミクス、遠近感、及びコンポジションのような、他の特徴が考えられる。
【0093】
2B.感情的特徴
感情的特徴の例としては、感謝及び活動が挙げられる。
【0094】
一実施形態では、色と感情との関係を利用することによって、画像をその主色に基づいた様々な感情的特徴に応じて量子化することができる(例えば、L.C.ウー(L.C. Ou)らによる「色の感情及び色の好みの研究(A study of colour emotion and colour preference)」(カラーリサーチアンドアプリケーション(COLOR research and application)29、2004、p.232〜240)、M.ソリー(M. Solli)及びR.レンツ(R. Lenz)による「カラー画像検索における感情的満足(Emotional Satisfaction In Color Image Retrieval)」(画像解析に関するスウェーデンシンポジウム2008会報(Proc. Swedish Symposium on Image Analysis 2008)、並びに、M.ソリー及びR.レンツによる「画像の分類及び検索に対する色の感情(Color Emotions for Image Classification and Retrieval)」(グラフィックス、イメージング、及びビジョンにおける色に関する会議(CGIV:Conference on Colour in Graphics, Imaging and Vision)2008)参照)。
【0095】
別の実施形態では、画像のあらゆる人々の顔の表情が、様々な感情的特徴(例えば、嬉しい/悲しい、怒った/落ち着いた、など)に応じて識別されて量子化される(例えば、B.ファゼル(B. Fasel)及びJ.ルーティン(J. Luettin)による「顔の表情の自動解析:概説(Automatic Facial Expression Analysis: a survey)」(パターン認識(Pattern Recognition)第36巻、p.259〜275、2003)、並びに、M.パンティック(M. Pantic)及びL.J.M ロスクランツ(L. J. M Rothkrantz)による「顔の表情を自動解析するエキスパートシステム(Expert system for automatic analysis of facial expressions)」(エルゼビア(ELSEVIER)社、イメージアンドビジョンコンピューティング(Image and Vision Computing)第18巻、p.881〜905、2000)参照)。
【0096】
(例えば、テレゲン−ワトソン−クラークモデル(Tellegen-Watson-Clark model)を用いる)別の実施形態では、複数の感情的特徴のそれぞれに対して個別の分類器モデルが訓練され、各特徴は、ラベル付けされたデータセットのタグ及び画像から抽出された記述子を用いて、1組の相反する感情(愉快−不愉快、従事(engagement)−解放(disengagement)など)を表す。訓練された分類器は、各特徴に対するスコアを各画像に出力する(例えば、各特徴に対する量子化値又は順位をデータセットにおける画像に付与する)ことができ、このスコアを用いることによって画像をグループ化することができる。
【0097】
別の方法では、標準的な低レベル特徴(色、ガボール特徴(Gabor features)、SIFT特徴)を用いることによって、手動で注釈付けされたデータから感情を予測することができる。
【0098】
可視化
付与されたコンテンツ、美的、及び感情的特徴に基づいて、ユーザは、特徴を単独で又は組み合わせて選択することにより、探索空間を作成することができる。表示される画像グループの数は、選択される各特徴の量子化レベル及び選択される特徴の数によって決まる。
【0099】
一般的な探索ワークフローは、(1)1つ以上の特徴(例えば、コンテンツ、コンテンツ+美的など)を用いて、探索空間を作成し(S108)、(2)この探索空間を他の特徴に基づいて大まかに再編成することによって、視覚的一貫性を高め(S112)と、(3)ほぼ同じ画像又は最も近い画像を可視化することによって、的を絞って探索空間を探査すること(S118)と、を含んでもよい。
【0100】
ブラウジング処理を容易にするため、この例としてのシステム80は、(例えば、テキスト探索クエリの結果の)探索空間を、異なる組み合わせ及び異なる数の特徴で絞り込むことができる。例えば、ユーザが、見る人に好感を与える青空の画像を探索している場合、テキストクエリ「空」と2つの特徴「青」及び「感謝」を選択すると、空の画像が検索されて視覚的に一貫するように表示される。更に、この例としてのユーザインタフェースは、創造的資産のナビゲーションを容易にするだけでなく、(最終的に画像収納ホルダを含む)作業ドラフトドキュメントと代わりの選択画像とを「組み合わせて」可視化することにより視覚的コンテンツの作成も支援する。
【0101】
この例示的実施形態の範囲を限定するよう意図することなく、以下の実施例は、ドキュメントを作成するための、このシステム80の一使用法を説明する。
【0102】
図4を参照すると、データセット10における画像は、最大350のサムネイル画像(データベースに格納されているオリジナル画像から生成される、ピクセル解像度を下げた且つ/又は切り取られた画像であってもよい)が同じページに提示されるように、コンパクトに可視化されて提示される。ユーザは、まず、探索ボックス120にキーワードを入力するか、或いは、メニュー(例えば、GUIに表示されるドロップダウンメニュー)からキーワードを選択することによって、テキストクエリを入力する。次に、コンテンツ探索空間が生成される。例えば、図4に示されているように、ユーザは、テキスト入力ボックス120に探索クエリ(例えば、「花」)を入力し、セレクタ122を用いて、検索する画像の数(例えば、150)を選択することができる。分類器が確率的なものである場合、このシステム80は、花の画像である確率が最も高く付与された150の画像を検索して、これらの画像をGUIディスプレイ72に表示する。例えば、図4は、テキストクエリ「花」によって得られた画像サブセットの一部を示している。
【0103】
例えば、検索した数が、ディスプレイ上で一度にすぐに見られる数より多い場合、ユーザは、スクロールバー124を用いて、検索した画像セット全体をスクロールダウンすることができる。
【0104】
クエリを絞り込むため、ユーザは、複数の特徴セレクタ126、128、130のうちの1つ以上を作動させることにより、美的及び感情的特徴から選択することができる。ユーザは、例えば、赤の色特徴を用いて画像をグループ化することに決め、色特徴セレクタ126を用いて赤の色特徴を選択してもよい。赤の色特徴によって赤さが高いものから低いものへ減少順に一次元において仕分けされた画像グループは、GUI上に、例えば、左から右へ且つ/又は上から下へ、同時に表示される。この例示的実施形態では、6つのグループが同時に配列表示される。
【0105】
次に、ユーザは、第2の特徴(例えば、別の美的特徴)を追加することに決め、例えば、美的特徴セレクタ128を用いて明度特徴を選択してもよい。図5のスクリーンショット86に示されているように、二次元において(即ち、明度の美的特徴F1で横に且つ赤の色特徴F2で縦に)仕分けされた画像グループが、GUIディスプレイ72に同時に表示される。特徴F2も選択されている場合には、表示グループを適切な数に維持するため、特徴F1の量子化レベルは自動的に削減されてもよい。例えば、データベースにおける画像がラベル付けされている第1の特徴に対して6つの量子化レベルがある場合、隣接した量子化レベルの組を合わせて、3つの量子化レベルにしてもよい。
【0106】
図5から明らかであるように、ディスプレイの各領域は、異なる画像グループを示しており、各グループは、選択された第1及び第2の特徴の量子化レベルの異なる組み合わせに対応している。従って、選択された特徴の量子化レベルに当てはまる画像が、ディスプレイの適切な領域に表示される。この例としての配列では、左から右へ且つ上から下へ特徴値の高い順になっており、即ち、最も赤くて明るい画像が左上のグループ92にあり、最も赤くなくて明るくない画像が右下のグループ108にある。例えば、ディスプレイの左上にある領域132は、赤さの量子化レベルが1で明度の量子化レベルが1である(即ち、赤さが高く明度が高い)画像を含む。全ての領域に画像が含まれるわけではない。例えば、領域134は、データベース10におけるカテゴリ「花」に、特徴「明度」の量子化レベルが3で特徴「赤さ」の量子化レベルが1である画像がないため、空いている。図4に示されている画像に関し、1グループに多くの画像がありすぎて一度に表示できない場合には、画像グループを個別にスクロールすることができる。
【0107】
この例示的実施形態では、一度に最大1つの色特徴(例えば、赤、緑、及び青のうちの1つ)を選択することができる。第2の特徴に関しては、別の美的特徴或いは感情的特徴を選択することができる。
【0108】
次に、例えば、感情的特徴セレクタ130を用いて、第3の特徴を選択し、三次元配列又はその適切な二次元表現を生成してもよい。或いは、ユーザは、第1及び第2の特徴の一方又は両方を変更して二次元表示を変更することに決めてもよい。
【0109】
ユーザは、画像グループが分けて示されるのではなく、選択された特徴を反映するように単純に順序付けされる(例えば、最も赤い画像が配列の左上にあるグループにクラスタ化され、最も明るくない画像が右下にあるグループにクラスタ化され、グループ間の境界線は表示されない)よう、要求することができる。ユーザは、順序セレクタ136をクリックして、画像をこのように表示させることができる。当然のことながら、これらの画像は、特徴(例えば、「赤さ」及び「コントラスト」)の様々な組み合わせによって、容易にグループ化して順序付けすることができる。
【0110】
次に、ユーザは、表示されたグループのうちの1つにおける画像の色及び明度が特定のドキュメントに対して適切であると判断し、そのグループをクリックする(クリックすると、そのグループがディスプレイに表示される)。ユーザは、ライトボックスアイコン138をクリックして、ライトボックス110を呼び出してもよく、このライトボックス110の中には、選択画像のうちの選択されたものを最終選択の候補画像としてドラッグして入れることができる。ユーザは、レイアウトドラフトセレクタボタン142をクリックすることができ、これにより、ディスプレイに表示されるドキュメント58にアクセスできるようになる(図6)。スクリーンショット88に示されているように、選択された画像グループ、ライトボックス110、及びドキュメントテンプレート58が同時に表示される。ユーザは、最も近い画像/同じ画像セレクタ146をクリックすることによって、最も近い画像又はほぼ同じ画像が表示されるよう選択することができる。或いは、このような最も近い画像/ほぼ同じ画像は、画像のうちの選択されたものをクリックすることによって検索されてもよい。
【0111】
ユーザは、画像のうちの選択されたものを(例えば、ライトボックス110から)ドキュメント58上にドラッグアンドドロップして、その画像がデザインニーズを満たすかどうか確かめてもよい。この選択画像54は、より早い段階で保存された、以前のあらゆる選択画像を収容する、ドキュメントテンプレート58に追加される。ユーザは、より多くの画像を探すためにこの処理を1回以上繰り返した後、レイアウトドラフトセレクタ142をクリックして、図2及び図6に示されているような埋められたドキュメント62の完成を確認してもよい。
【0112】
テキスト探索クエリに依存した既存の探索方法に対し、このシステムは、クエリをパラメータ化することによって探索を絞り込むことができる。例えば、ユーザは、明度及び/又は赤さのレベルを設定することができる。また、探索結果の視覚的一貫性が高く、探索空間の探査が非常に簡単であるため、ユーザは、関心のある画像が最もありそうなグループだけを選択して、そのグループにおける画像のサムネイルをスクロールするか、或いは、その選択された画像グループでディスプレイを満たすことができる。ユーザが特定のサムネイルに関心がある場合、対応する画像がその最も近い画像と共に表示される。
【0113】
このナビゲーションシステムは、選択された美的、色、及び感情的特徴によって導かれる非常に大きな画像データベースをナビゲートするインタフェースを、グラフィックデザイナーに提供する。
【符号の説明】
【0114】
64 データ/制御バス
70 GUI
72 表示画面
76 カーソル制御デバイス
78 リンク
84、86、88 スクリーンショット
87 境界線
110 ライトボックス
120 探索ボックス
122、126、128、130、136、138、142、146 セレクタ
124 スクロールバー
132、134 領域

【特許請求の範囲】
【請求項1】
画像データセットのナビゲートにおいてユーザ支援方法であって、
前記ユーザのテキストクエリを受信し、
前記テキストクエリに応答する画像を、画像データセットから検索し、
利用可能な特徴のセットから前記ユーザが選択した第1特徴を受信し、
前記利用可能な特徴のセットから前記ユーザが選択した第2特徴を受信し、
検索された前記画像のうちの少なくともいくつかを、グラフィカルユーザインタフェース上に同時に配列して表示する、
ことを含む、方法であって、
前記画像の配列は、第1特徴のみが選択された場合、前記第1特徴の異なるレベルを反映し、第1特徴及び第2特徴が選択された場合、前記ユーザが選択した前記第1及び第2特徴のレベルの異なる組み合わせを反映する、
方法。
【請求項2】
前記表示することは、検索された前記画像のうちの少なくともいくつかを、前記グラフィカルユーザインタフェース上に同時にグループで表示することを含み、表示された前記各画像グループは、前記ユーザが選択した前記第1特徴及び第2特徴のレベルの異なる組み合わせに対応する、請求項1に記載の方法。
【請求項3】
コンピュータに、請求項1に記載の方法を実行させるためのプログラム。
【請求項4】
画像データセットをナビゲートするための装置であって、
ユーザのテキストクエリを受信し、
前記クエリに応答する画像を、関連する画像データセットから検索し、
利用可能な特徴セットから前記ユーザが選択した第1特徴を受信し、
前記利用可能な特徴セットから前記ユーザが選択した第2特徴を受信し、
検索された前記画像のうちの少なくともいくつかを、関連するグラフィカルユーザインタフェース上に表示し、表示された前記画像が、選択された前記第1及び第2特徴のレベルに応じてグループ化する、
ためのメモリに格納された命令を含む、ナビゲーションシステムと、
前記命令を実行するための、前記メモリと通じているプロセッサと、
を備える、装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−154687(P2011−154687A)
【公開日】平成23年8月11日(2011.8.11)
【国際特許分類】
【出願番号】特願2011−12909(P2011−12909)
【出願日】平成23年1月25日(2011.1.25)
【出願人】(596170170)ゼロックス コーポレイション (1,961)
【氏名又は名称原語表記】XEROX CORPORATION
【Fターム(参考)】