説明

画像データの管理

【課題】 画像データのデータベースを容易に構築し、画像データを用いて画像データに関する情報を取得することができる画像データのデータベースを構築すること。
【解決手段】CPU111は、WWWサーバから画像データを取得し、取得した画像データから撮影位置情報および特徴量を取得する。CPU111は、画像データを取得したWebデータを解析してキーワードを取得する。CPU111は、取得した撮影位置情報、特徴量およびキーワードを、取得した画像データに関連づけて画像データベースに登録する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データを管理する技術に関する。
【背景技術】
【0002】
従来、入力されたキーワードに基づいてテキストベースにてWebページを検索するシステムが広く実用化されている。これに対して、入力された画像データに基づく画像ベースの画像データベースとしては、任意の画像データが入力されると、入力された画像データの位置情報に基づいて、画像データベースから類似画像データが検索され、類似画像データの撮影場所名が、入力された画像データの撮影場所名として特定される技術が知られている。この画像データベースでは、画像データに対して撮影場所名を関連付けて登録することによって画像データベースが構築されている。
【0003】
【特許文献1】特開2002−373168号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、画像データに対して撮影場所名を関連付けて画像データベースを構築する場合、画像データの収集作業および画像データに対して撮影場所名を関連付ける作業が要求され、かかる作業は容易でないという問題があった。すなわち、画像データベースを構築するためには大量の画像データが必要となり、そのような大量の画像データを集める作業、集められた画像データに対して撮影場所名を関連付ける作業は非常に手間のかかる作業である。
【0005】
また、従来の画像データベースでは、画像データの撮影場所名を特定することはできても、画像データに関するその他の情報、例えば、撮影場所名から連想される情報については取得することができないという問題があった。さらに、撮影場所名のみでは所望の被写体を有する画像データを検索することができない場合があった。
【0006】
本発明は、上記課題を解決するためになされたものであり、画像データのデータベースを容易に構築することを目的とする。また、画像データを用いて画像データに関する情報を取得することができる画像データのデータベースを構築することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために本発明の第1の態様は、画像データベースを構築するデータベース構築装置を提供する。本発明の第1の態様に係るデータベース構築装置は、任意の画像データを取得する画像データ取得手段と、前記取得された画像データに関連する撮影位置情報を取得する撮影位置情報取得手段と、前記取得された画像データの特徴量を取得する特徴量取得手段と、前記取得された画像データに関連するキーワードを取得するキーワード取得手段と、前記取得された撮影位置情報、特徴量およびキーワードを関連付けて記憶装置に格納する格納実行手段とを備える。
【0008】
本発明の第1の態様に係るデータベース構築装置によれば、任意の画像データを取得し、取得された画像データに関連する撮影位置情報、特徴量およびキーワードを取得し、取得された撮影位置情報、特徴量およびキーワードを関連付けて記憶装置に格納するので、画像データのデータベースを容易に構築することができると共に、画像データを用いて画像データに関する情報を取得することができる画像データのデータベースを構築することができる。
【0009】
本発明の第1の態様に係るデータベース構築装置において、前記格納実行手段はさらに、前記撮影位置情報、特徴量およびキーワードを前記画像データに関連付けて前記記憶装置に格納しても良い。かかる場合には、撮影位置情報、特徴量およびキーワードに関連付けられている画像データを容易かつ確実に取得することができる。
【0010】
本発明の第1の態様に係るデータベース構築装置において前記画像データの取得は、画像データが関連付けられているWebページデータから画像データを取得することにより実行されても良い。かかる場合には、多くの画像データを容易に取得することができる。
【0011】
本発明の第1の態様に係るデータベース構築装置において、前記キーワードの取得は、前記取得された画像データが関連付けられているWebページデータからキーワードを抽出することによって実行されても良い。かかる場合には、画像データに関するキーワードを容易に取得することができる。
【0012】
本発明の第1の態様に係るデータベース構築装置において、前記画像データには撮影位置情報が付帯されており、前記撮影位置情報の取得は、前記位置情報を用いて実行されても良い。かかる場合には、画像データの正確な撮影位置情報を容易に取得することができる。
【0013】
本発明の第1の態様に係るデータベース構築装置において、前記撮影位置情報の取得は、前記取得された画像データが関連付けられているWebページデータから撮影位置情報を抽出することによって実行されても良い。かかる場合には、画像データに撮影位置情報が付帯されていない場合にも、画像データの撮影位置情報を取得することができる。
【0014】
本発明の第1の態様に係るデータベース構築装置はさらに、前記取得した画像データに対してオブジェクト分離処理を実行するオブジェクト分離手段を備え、前記格納実行手段は、前記分離されたオブジェクト毎に前記記憶装置に対する前記画像データの格納を実行しても良い。かかる場合には、画像データを、更にオブジェクト単位にて区別することができる。
【0015】
本発明の第1の態様に係るデータベース構築装置において、前記キーワード取得手段は複数のキーワードを取得し、前記データベース構築装置はさらに、前記取得された各キーワードに対して重み付け係数を付与する重み付け手段を備えても良い。かかる場合には、キーワード毎に軽重を付与することができる。
【0016】
本発明の第1の態様に係るデータベース構築装置において、前記重み付け係数は、前記Webページデータにおける前記各キーワードの記述位置、記述用タグの種類によって決定されても良い。かかる場合には、Webページデータにおける各キーワードの記述位置、記述用タグの種類によって客観的に重み付け係数を決定することができる。
【0017】
本発明の第2の態様は、各画像データに対して撮影位置情報とキーワードとが関連付けられて格納されている画像データベースを利用する画像データ管理装置を提供する。本発明の第2の態様に係る画像データ管理装置は、処理対象となる画像データを特定するための画像データ特定手段と、前記特定された画像データに関連する撮影位置情報を取得する撮影位置情報取得手段と、前記取得された撮影位置情報を用いて、前記画像データベースからキーワードを取得するキーワード取得手段と、前記取得されたキーワードと前記特定された画像データとを対応付ける対応付け手段とを備える。
【0018】
本発明の第2の態様に係る画像データ管理装置によれば、特定された画像データに関連する撮影位置情報を用いて、画像データベースからキーワードを取得し、取得されたキーワードと特定された画像データとを対応付けるので、画像データを用いて画像データに関する情報を取得することができる。
【0019】
本発明の第2の態様に係る画像データ管理装置はさらに、前記特定された画像データの特徴量を取得する特徴量取得手段を備え、前記画像データベースにおける各画像データには前記撮影位置情報およびキーワードに加えて画像データの特徴量が関連付けられており、前記キーワード取得手段は、前記撮影位置情報に加えて、前記特徴量を用いて前記キーワードを取得しても良い。かかる場合には、特定された画像データに対するキーワードの検索精度を向上させることができる。
【0020】
本発明の第2の態様に係る画像データ管理装置において、前記キーワードの取得は、前記特定された画像データの撮影位置および特徴量と同一または類似する撮影位置および特徴量が関連付けられている複数の画像データからそれぞれキーワードを抽出することによって実行されても良い。かかる場合には、複数のキーワードを取得することができる。
【0021】
本発明の第2の態様に係る画像データ管理装置において、
前記キーワード取得手段は、
前記特定された画像データの撮影位置および特徴量と同一または類似する撮影位置お よび特徴量が関連付けられている複数の検索画像データを取得する検索画像データ取得 手段と、
前記特定された画像データの撮影位置および特徴量と、各前記検索画像データの撮影 位置および特徴量を用いて、前記特定された画像データに対する前記検索画像データの 類似度を算出する類似度算出手段と、
前記算出された類似度に応じて、前記複数の検索画像データに関連付けられている各 キーワードに対して重み付けを行う重み付け手段と、
前記重み付けられたキーワードの中から重み付けの大きなキーワードを、前記特定さ れた画像データに対応付けるべきキーワードとして選択するキーワード選択手段とを備 えても良い。かかる場合には、特定された画像データに、より適切なキーワードを取得することができる。
【0022】
本発明の第2の態様に係る画像データ管理装置はさらに、前記特定された画像データから主たるオブジェクトを抽出する主オブジェクト抽出手段を備え、前記画像データベースにおける各画像データに関連付けられている特徴量は各画像データにおける主オブジェクトの特徴量であり、前記キーワード取得手段は、前記抽出された主オブジェクトの特徴量を用いて前記画像データベースからキーワードを取得しても良い。かかる場合には、特定された画像データの主オブジェクトに適切なキーワードを取得することができる。
【0023】
本発明の第3の態様は、画像データベースを構築するデータベース構築方法を提供する。本発明の第3の態様に係るデータベース構築方法は、Webページデータから任意の画像データを取得し、前記取得された画像データに関連する撮影位置情報を取得し、前記取得された画像データに関連するキーワードを取得し、前記取得された撮影位置情報およびキーワードと画像データとを関連付けて記憶装置に格納することを備える。
【0024】
本発明の第3の態様に係るデータベース構築方法によれば、本発明の第1の態様に係るデータベース構築装置と同様の作用効果を得ることができると共に、本発明の第3の態様に係るデータベース構築方法は、本発明の第1の態様に係るデータベース構築装置と同様にして種々の態様にて実現され得る。
【0025】
本発明の第4の態様は、各画像データに対して撮影位置情報とキーワードとが関連付けられて格納されている画像データベースを利用する画像データ管理方法を提供する。本発明の第4の態様に係る画像データ管理方法は、処理対象となる画像データを特定し、前記特定された画像データに関連する撮影位置情報を取得し、前記取得された撮影位置情報を用いて、前記画像データベースからキーワードを取得し、前記取得されたキーワードと前記特定された画像データとを対応付けて記憶装置に保存することを備える。
【0026】
本発明の第4の態様に係る画像データ管理方法によれば、本発明の第2の態様に係る画像データ管理装置と同様の作用効果を得ることができると共に、本発明の第4の態様に係る画像データ管理方法は、本発明の第2の態様に係る画像データ管理装置と同様にして種々の態様にて実現され得る。
【0027】
本発明の第3および第4の態様に係る方法は、この他にも、プログラム、およびプログラムを記録したコンピュータが読み取り可能な記録媒体としても実現され得る。
【図面の簡単な説明】
【0028】
【図1】本実施例に係る画像データベース構築装置および画像データ管理装置を含む画像データベースシステムの概略構成を示す説明図である。
【図2】本実施例に係る画像データベース構築装置の主要な構成要素を示す概略図である。
【図3】本実施例に係る画像データベース構築装置によって実行されるプログラムおよびモジュールを模式的に示す説明図である。
【図4】本実施例に係る画像データ管理装置の主要な構成要素を示す概略図である。
【図5】本実施例に係る画像データ管理装置によって実行されるプログラムおよびモジュールを模式的に示す説明図である。
【図6】本実施例における画像データベース構築処理において実行される処理ルーチンを示すフローチャートである。
【図7】HTMLタグによって記述されているWebページデータに基づき表示されるWebページの一例を示す説明図である。
【図8】本実施例において取得される画像データの構成を模式的に示す説明図である。
【図9】本実施例において実行される画像データの特徴量の取得処理を説明するための説明図である。
【図10】本実施例に係る画像データベース構築処理において構築される画像データベースの一例を示す説明図である。
【図11】本実施例における画像データ管理処理において実行される処理ルーチンを示すフローチャートである。
【図12】特定画像データに対して検索されたキーワードの表示例を示す説明図である。
【発明を実施するための形態】
【0029】
以下、本発明に係る画像データベース構築装置および画像データ管理装置について図面を参照しつつ、実施例に基づいて説明する。
【0030】
図1を参照して本実施例に係る画像データベース構築装置および、画像データ管理装置を含む画像データベースシステムについて説明する。図1は本実施例に係る画像データベース構築装置および画像データ管理装置を含む画像データベースシステムの概略構成を示す説明図である。
【0031】
画像データベースシステムは、画像データベース構築装置10、画像データサーバ20、画像データ管理装置30を備えている。画像データベース構築装置10および画像データ管理装置30は、通信線を介して画像データベース20と接続されている。
【0032】
画像データベース構築装置10は、インターネット40を介してWebページデータから任意の画像データを取得し、取得した画像データから特徴量を、取得した画像データのヘッダ部から撮影位置情報を取得する。画像データベース構築装置10はさらに、画像データを取得したWebページデータからキーワード、撮影位置情報を取得する。画像データベース構築装置10は、取得したキーワード、撮影位置情報および特徴量を画像データ単位で関連付けて画像データサーバに格納して、画像データベースを構築する。
【0033】
画像データサーバ20は、画像データベース構築装置10および画像データ管理装置30との間で通信を実行するための通信制御回路、1または複数の記憶装置、記憶装置を制御する記憶装置制御回路を備えている。
【0034】
画像データ管理装置30は、キーワードを取得すべき画像データが特定されると、画像データから特徴量を取得し、画像データのヘッダから撮影位置情報を取得する。画像データ管理装置30は、取得した特徴量および撮影位置情報に一致または類似(近似)する特徴量および撮影位置情報との組み合わせ、すなわち、取得した特徴量および撮影位置情報に一致または類似する特徴量および撮影位置情報とを含む画像データ、を検索し、検索された組み合わせに含まれるキーワードを取得する。画像データ管理装置30は、取得したキーワードを特定された画像データに関連付ける。
【0035】
画像データベース構築装置:
図2および図3を参照して、画像データベース構築装置10の内部構成について説明する。図2は本実施例に係る画像データベース構築装置の主要な構成要素を示す概略図である。図3は本実施例に係る画像データベース構築装置によって実行されるプログラムおよびモジュールを模式的に示す説明図である。
【0036】
本実施例に係る画像データベース構築装置10は、例えば、インターネットに接続可能な一般的な計算機である。画像データベース構築装置10は、図2に示すように、制御回路11、入出力操作部12、データ入出力部13を備えている。制御回路11は、画像データの取得、キーワード、撮影位置情報および特徴量の取得、画像データに対するキーワード、撮影位置情報および特徴量の関連付けといった画像データベース用データの作成処理を始めとする各種演算処理を実行する中央演算装置(CPU)111、取得した画像データ、取得したキーワード、撮影位置情報および特徴量等の各種データを一時的に格納するランダムアクセスメモリ(RAM)112、CPU111によって実行されるプログラム、例えば、画像データベース構築プログラムを格納するリードオンリメモリ(ROM)および/またはハードディスク(HDD)113を備えている。
【0037】
入力操作部12は、外部からの入力を受け付けるインターフェース部であり、例えば、キーボード、マウスといった外部入力装置が接続される。ユーザからの指示は、外部入力装置を介して画像データベース構築装置10に入力される。
【0038】
データ入出力部13は、ネットワーク接続ケーブルが接続される端子、並びに信号変換処理機能を有し、ネットワークを介して外部計算機との間で画像データをやりとりするために用いられる。より具体的には、データ入出力部13は、ローカルエリアネットワークを介して画像データサーバ20に接続され、さらに図示しないルータを介してインターネットに接続されている。
【0039】
画像データベース構築装置10にはさらに、表示器15が接続されている。表示器15には、取得したキーワードの一覧が表示され、また、画像データサーバ20に登録されている画像データベースが表示される。
【0040】
図3を参照してROM/HDD113に格納され、CPU111によって実行される画像データベース構築プログラムP1について説明する。画像データベース構築プログラムP1は、画像データ取得モジュールM1、撮影位置情報取得モジュールM2、キーワード取得モジュールM3、特徴量取得モジュールM4、格納実行モジュールM5、オブジェクト分離モジュールM6、重み付けモジュールM7を備えている。
【0041】
画像データ取得モジュールM1は、HTTP(Hypertext Transfer Protocol)を利用して、インターネットを介してHTML(Hyper Text Markup Language)形式で記述されているWebページデータにアクセスして、関連づけられている画像データを取得する。画像データ取得モジュールM1には、Webページデータ閲覧ソフトが備える、HTMLタグを解釈するための機能が備えられている。なお、本実施例では、HTML形式で記述されているHTMLデータおよびHTMLデータに関連づけられている画像データをWebページデータと呼ぶ。Webページデータは、Webページデータ閲覧ソフト(例えば、ブラウザソフト)を介して、所定のフォーマットで記述されたWebページとして表示器上に表示される。また、Webページデータは、一般的には、WWWサーバと呼ばれているインターネット上のサーバコンピュータに格納されており、URL(Uniform Resource Locator)を指定することによってアクセスすることができる。
【0042】
画像データ取得モジュールM1は、例えば、予め登録されているWebページデータのURLに順次アクセスして画像データを検索し、画像データを取得する。あるいは、基本となるURLのリスト(シードリスト)を用いてURLにアクセスし、アクセス先のWebに含まれているリンクを辿って他のURLにアクセスして画像データを検索し、取得する。インターネットを介してWebページを巡回する技術は、当業者に良く知られており、例えば、前者は登録型、後者はロボット巡回型と呼ばれている。なお、画像データ取得モジュールM1は、画像データのみを取得せず、画像データが関連づけられているWebページデータも同時に取得する。
【0043】
撮影位置情報取得モジュールM2は、画像データ取得モジュールM1によって取得された画像データに関する撮影位置情報を取得する。具体的には、画像データのヘッダにGPS情報(経度、緯度、撮影方向の各情報)が記述されている場合には、記述されている経度、緯度情報が撮影位置情報として取得される。あるいは、画像データを取得したWebページデータにおける記述(文書)から、例えば、地名、建物に関する記述を抽出し、抽出された地名、建物の情報を経度、緯度情報に変換することによって撮影位置情報が取得される。なお、抽出された単語が地名に該当するか否かは予め備えられている辞書データと対比することによって判断される。
【0044】
キーワード取得モジュールM3は、画像データ取得モジュールM1によって取得された画像データに関するキーワードを取得する。キーワード取得モジュールM3には、Webページデータデータ閲覧ソフトが備える、HTMLタグを解釈するための機能が備えられている。具体的には、画像データを取得したWebページデータにおける文書を形態素解析によって形態素(品詞)に分割し、複合名詞、単名詞に該当する単語をキーワードとして抽出する。したがって、1つの画像データに対して複数のキーワードが取得され得る。あるいは、HTMLタグの内、特定のタグによって記述されている単語をキーワードとして採用しても良い。
【0045】
特徴量取得モジュールM4は、画像データ取得モジュールM1によって取得された画像データを解析して、例えば、画像データの統計値を算出し、特徴量として取得する。
【0046】
格納実行モジュールM5は、画像データと、その画像データから取得された撮影位置情報、特徴量およびキーワードとを関連付けて画像データサーバ20に格納して画像データバースを構築する。
【0047】
オブジェクト分離モジュールM6は、取得された画像データからオブジェクト(被写体)を抽出、分離する。オブジェクトの分離に当たっては、主オブジェクトのみを抽出してもよく、あるいは、主オブジェクトに加えて他のオブジェクトを抽出しても良い。オブジェクトの抽出が行われる場合には、画像データ単位ではなく、より詳細なオブジェクト単位にて画像データベースが構築される。かかる場合、特徴量は、オブジェクト単位にて取得されることが好ましい。
【0048】
重み付けモジュールM7は、キーワード取得モジュールM3によって取得されたキーワードに対して重み付けを行う。具体的には、例えば、Webページ上においてキーワードが記述されている位置、HTMLタグの種類によって、キーワードに対して重み付け係数を付与する。
【0049】
画像データ管理装置:
図4および図5を参照して、画像データ管理装置30の内部構成について説明する。図4は本実施例に係る画像データ管理装置の主要な構成要素を示す概略図である。図5は本実施例に係る画像データ管理装置によって実行されるプログラムおよびモジュールを模式的に示す説明図である。
【0050】
本実施例に係る画像データ管理装置30は、例えば、データベースに対して接続可能な一般的な計算機である。画像データ管理装置30は、図4に示すように、制御回路31、入出力操作部32、データ入出力部33を備えている。制御回路31は、画像データの特定、特定された画像データからの撮影位置情報および特徴量の取得、特定された画像データに対するキーワードの取得といった画像データベースを用いた画像データの管理処理を始めとする各種演算処理を実行する中央演算装置(CPU)311、取得した画像データ、取得したキーワード、撮影位置情報および特徴量等の各種データを一時的に格納するランダムアクセスメモリ(RAM)312、CPU311によって実行されるプログラム、例えば、画像データ管理プログラムを格納するリードオンリメモリ(ROM)および/またはハードディスク(HDD)313を備えている。
【0051】
入力操作部32は、外部からの入力を受け付けるインターフェース部であり、例えば、キーボード、マウスといった外部入力装置が接続される。画像データを特定するユーザからの指示は、外部入力装置を介して画像データ管理装置30に入力される。
【0052】
データ入出力部33は、ネットワーク接続ケーブルが接続される端子、並びに信号変換処理機能を有し、ネットワークを介して外部計算機との間で画像データをやりとりするために用いられる。より具体的には、データ入出力部33は、ローカルエリアネットワークを介して画像データサーバ20に接続されている。
【0053】
画像データ管理装置30にはさらに、表示器35が接続されている。表示器35には、特定された画像データについて取得されたキーワードの一覧が表示され、また、画像データサーバ20に登録されている画像データベースが表示される。
【0054】
図5を参照してROM/HDD313に格納され、CPU311によって実行される画像データ管理プログラムP2について説明する。画像データ管理プログラムP2は、画像データ特定モジュールM21、撮影位置情報取得モジュールM22、特徴量取得モジュールM23、キーワード取得モジュールM24、対応付けモジュールM25、主オブジェクト抽出モジュールM26を備えている。
【0055】
画像データ特定モジュールM21は、画像データベースを利用してキーワードを取得し、関連付けるための特定画像データを特定する。具体的には、ユーザからの選択または特定指示の入力を受けて画像データを特定する。あるいは、ディジタルスチルカメラから画像データ管理装置30に送信されてきた画像データを順次、特定画像データとして特定する。
【0056】
撮影位置情報取得モジュールM22は、画像データ特定モジュールM21によって特定された画像データから画像データに関する撮影位置情報を取得する。具体的には、撮影位置情報取得モジュールM22は、画像データのヘッダに記述されているGPS情報(経度、緯度、撮影方向の各情報)から、経度、緯度情報を、撮影位置情報として取得する。
【0057】
特徴量取得モジュールM23は、画像データ特定モジュールM21によって取得された画像データを解析して、例えば、画像データの統計値を算出し、特徴量として取得する。
【0058】
キーワード取得モジュールM24は、取得された撮影位置情報および特徴量を用いて画像データベースからキーワードを取得する。キーワード取得モジュールM24は、検索画像データ取得モジュールM241、類似度算出モジュールM242、重み付けモジュールM243、キーワード選択モジュールM244をサブモジュールとして備えている。
【0059】
検索画像データ取得モジュールM241は、特定画像データに類似する画像データを画像データベースから検索し、検索画像データとして取得する。具体的には、特定画像データの撮影位置情報および特徴量に対して、所定の範囲内にある撮影位置情報および特徴量を有する画像データを検索画像データとして取得する。
【0060】
類似度算出モジュールM242は、取得された各検索画像データについて、撮影位置情報および特徴量を用いて類似度を算出する。類似度の算出には、例えば、多次元ベクトルが用いられる。なお、類似度は、撮影位置情報、特徴量毎に算出されても良い。
【0061】
重み付けモジュールM243は、類似度算出モジュールM242によって算出された類似度に応じて、各検索画像データに関連付けられているキーワードに対して重み付けを行う。
【0062】
キーワード選択モジュールM244は、重み付けモジュールM243によって重み付けされたキーワードの中から上位の(重み付け係数が大きな)キーワードを選択して、特定画像データに関連付けるべきキーワードとする。具体的には、キーワード選択モジュールM244は、同一のキーワードについて重み付け係数を積算してキーワード群を得て、そのキーワード群の中から重み付け係数が大きなキーワードを1つまたは複数選択する。
【0063】
対応付けモジュールM25は、取得したキーワードを特定画像データに対応付ける。対応付けられた画像データは、例えば、HDD313に保存される。特定画像データに対するキーワードの対応付けは、例えば、画像データのヘッダにキーワードを格納することにより、あるいは、画像データとキーワードと対応付けるファイルを生成することによって実現され得る。
【0064】
主オブジェクト抽出モジュールM26は、特定画像データから主たる被写体を抽出する。一般的に、画像には複数の被写体が含まれており、特徴量は各被写体の影響を受けるため、画像データの区別が容易でない。そこで、画像データの主オブジェクトを抽出し、主オブジェクトの特徴量を用いて検索画像データを取得することによって画像データ(キーワード)の検索精度の向上が図られる。
【0065】
画像データベース構築処理:
図6〜図10を参照して本実施例に係る画像データベース構築処理について説明する。図6は本実施例における画像データベース構築処理において実行される処理ルーチンを示すフローチャートである。図7はHTMLタグによって記述されているWebページデータに基づき表示されるWebページの一例を示す説明図である。図8は本実施例において取得される画像データの構成を模式的に示す説明図である。図9は本実施例において実行される画像データの特徴量の取得処理を説明するための説明図である。図10は本実施例に係る画像データベース構築処理において構築される画像データベースの一例を示す説明図である。
【0066】
本処理ルーチンが開始すると、CPU111はインターネットを介してWebページデータから画像データを取得する(ステップS100)。図7に示すように、WebページデータはHTMLタグによって記述されていると共に関連づけられている画像データの保存先を有している。既述のように、Webページデータは、WWWサーバ上に格納されており、URLによって特定され、アクセスすることができる。アクセスの対象となるWebページデータは、例えば、予め登録されているWebページデータであっても良く、あるいは、ロボット型検索によってアクセスされる任意のWebページデータであっても良い。前者の場合には、予め登録されているWebページデータのURLをリスト化しておき、リストに従って検索エンジンが順次、Webページデータにアクセスして画像データを取得する。後者の場合には、検索エンジンは、基本となるシーズリストに挙げられているWebページデータ上のリンクを辿ってシーズリストに挙げられていないWebページデータにも順次アクセスして画像データを取得する。いずれの場合も、画像データの収集作業は検索エンジン(画像データ取得モジュール)によって自動的(自立的)に実行される。
【0067】
画像データが取得されると、CPU111は、画像データに関する撮影位置情報を取得する(ステップS102)。図8に示すように、画像データのヘッダにGPS情報が記述されている場合には、CPU111は、GPS情報を用いて画像データ撮影位置情報を取得する。Exifフォーマットに従う画像データのヘッダには、GPS情報として、緯度、経度、撮影方向の情報を記述するためのGPSタグが規定の位置に用意されており、CPU111は、画像データのヘッダからGPSタグを検索した場合には、画像データから直接、緯度、経度を撮影位置情報として取得することができる。
【0068】
一方、画像データのヘッダにGPSタグが記述されていない場合には、CPU111は、画像データを取得したWebページデータから撮影位置情報を抽出する。一般的に、画像データを含むWebページデータには、画像データを説明するための説明文が含まれており、また、画像データを表示するためのHTMLタグにはマウスオーバした場合に、画像データの内容をテキストで表示するための記述が含まれている。したがって、例えば、Webページデータから撮影地名が得られる場合には、予め用意された撮影地名−緯度、経度の対応テーブルから、得られた撮影地名に対応する緯度、経度を取得することによって撮影位置情報が得られる。なお、Webページデータの説明文から、単語を抽出する具体的な処理については、キーワード取得処理において説明する。
【0069】
CPU111は、取得した画像データから特徴量を取得する(ステップS104)。特徴量を取得する前に、CPU111は、取得した画像データをRGBデータに変換する。一般的に、Webページデータ上において用いられる画像データはjpegフォーマットのデータであることが多く、この場合には、YcbCrからRGBデータへの色変換処理が実行される。特徴量の取得としては種々の手法が知られている。例えば、R、G、B各成分のヒストグラムを用いる手法、最大・最小輝度値および平均輝度値を用いる手法が知られている。本実施例では、MPEG−7において採用されている、色配置(Color Layout)の手法を用いて特徴量を抽出する。
【0070】
色配置の手法では、CPU111は、画像データを8×8の小ブロックに分割し、各小ブロックを構成する画素データの値(R、G、B)の平均値(Rave、Gave、Bave)を各小ブロックの代表値(Rrep、Grep、Brep)として用いる。CPU111は求めた代表値を用いて8×8の画素データから構成される縮小画素データを作成する。CPU111は、作成した縮小画像データ(RGBデータ)をYCbCrデータに変換し、更に、Y、Cb、Crの各成分について離散コサイン変換(DCT)を行う。DCTによって、画像データは周波数成分に変換される。なお、離散コサイン変換は当業者において周知な変換処理であるから詳細な説明は省略する。
【0071】
例えば、図9に示すように、Y、Cb、Crの各成分について8×8の係数値が算出される。すなわち、
Yc[8][8]={yc00, yc01, yc02...yc76,yc77}
Cbc[8][8]={cbc00, cbc01, cbc02...cbc76,cbc77}
Crc[8][8]={crc00, crc01, crc02...crc76,crc77}
となり、画像データ(画像)との位置関係は、例えば図9に示すとおりとなる。図9に示すように、係数値が大きくなるにつれて周波数は高くなる。
【0072】
CPU111は、画像データを取得したWebページデータからキーワードを抽出する(ステップS106)。すなわち、画像データが貼り付けられていたHTML文書からキーワードが抽出される。キーワードの抽出は、画像データを取得したWebページデータにおけるHTML文書からを形態素解析によって形態素(品詞)に分割し、複合名詞、単名詞に該当する単語をキーワードとして抽出する。形態素解析の手法は種々提案されており、本実施例では、いずれかの手法を利用してキーワードを抽出する。あるいは、例えば、図7に示すHTMLタグを有するWebページデータでは、HTMLタグに記述されている単語からキーワードを抽出しても良い。
【0073】
また、HTMLタグの内、以下のタグによって記述されている単語には重み付けしても良い。あるいは、重み付け係数を大きくしても良い。
画像表示タグ <IMG SRC = " " ALT = " ">
ページタイトル <TITLE>
キーワード <META name = "keyword" content = " ">
内容説明 <META name = "description" content = " ">
見出しタグ <H1>
【0074】
図7の例では、画像表示タグに「奈良公園」と、ページタイトルタグに「奈良」および「奈良公園」と、キーワードタグに「奈良公園」と、内容説明タグに「東大寺」と、見出しタグに「奈良公園」と記述されている。これらタグに記述されている単語には重み付けがなされる。重み付けに当たっては、例えば、見出しタグ、内容説明タグ、キーワードタグ、ページタイトルタグ、画像表示タグの順に重み付け係数を大きくしても良い。さらに、画像表示タグの近くに配置されているキーワードに対して大きな重み付け係数を付しても良い。すなわち、Webページデータにおける単語の配置位置に応じて重み付け係数を変えても良い。
【0075】
CPU111は、取得した撮影位置情報、特徴量およびキーワードを画像データに関連づけて画像データベースに登録して(ステップS108)本処理ルーチンを終了する。以上の各ステップは、画像データをWebページデータから取得する度に実行される。画像データの取得は、逐次実行されてもよく、所定数の画像データを取得したところで終了されても良い。また、画像データベースには、取得した撮影位置情報、特徴量およびキーワードが関連づけられて格納されていても良い。すなわち、画像データを介して、撮影位置情報、特徴量およびキーワードが関連付けられている画像データベースであっても良い。
【0076】
画像データベースへの登録に当たって、キーワードについては、重み付け係数が所定のしきい値を超えたキーワードのみを画像データベースに登録する。例えば、図10に示す画像データベースが得られる。すなわち、画像データ(ファイル名)に対して、撮影位置情報、画像の特徴量、キーワード(重み付け係数)が関連づけられている。なお、既述のように、画像データは撮影位置情報、特徴量およびキーワードを関連付けるための指標として用いられるだけでも良い。かかる場合には画像データの実データはデータベースに格納されず、例えば、画像データの実データ(Webページデータ)を格納するWWWサーバへのリンク情報のみが格納されていてもよく、あるいは、画像データの実データの格納場所に関する情報は格納されなくても良い。
【0077】
以上説明した本実施例にかかる画像データベース構築装置10によれば、WWWサーバから画像データが取得され、取得された画像データに対して撮影位置情報、特徴量およびキーワードが関連づけられた画像データベースを作成することができる。したがって、画像データに基づいて画像データに関する情報(キーワード)を検索することができる画像データベースを容易に作成することができる。すなわち、ユーザは画像データを取得し、画像データに対して関連づけるために、キーボード等の入力操作部を介して撮影位置情報、特徴量およびキーワードを入力することなく、画像データベースを作成することができる。
【0078】
また、WWWサーバから画像データを取得するので、数多くの画像データを取得することが可能となり、画像データベースの信頼度を向上させることができる。すなわち、数多くの画像データを取得することによって、多様な画像データを取り込むことが可能となり、キーワードの検索が望まれる画像データに対して、より正確なキーワードを抽出することができる画像データベースを作成することができる。
【0079】
さらに、撮影位置情報の取得に当たっては画像データのヘッダ部に記述されているGPS情報またはWebページデータから抽出された撮影位置情報が取得されるので、的確な撮影位置情報を取得することができる。また、キーワードの取得に当たっては、Webデータに含まれている単語が用いられると共に、HTMLタグの種類、単語の記述位置に応じてキーワードに対して重み付け係数が付されるので、より的確なキーワードの取得、順に付けができる。
【0080】
また、本実施例にかかる画像データベース構築装置10には、撮影位置情報、特徴量およびキーワードと画像データとが関連付けられて格納されているので、画像データが格納されているサーバの消滅、リンク切れの影響を受けることなく、容易且つ確実に、撮影位置情報、特徴量およびキーワードに関連付けられている画像データを利用することができる。
【0081】
さらにまた、画像データベースには、各画像データの特徴量が登録されるので、キーワードの検索が望まれる画像データに対して、より的確な画像データを検索することが可能となり、この結果、適切なキーワードを提供することができる。
【0082】
画像データベースの精度を上げるために、以下の処理を実行しても良い。
(1)画像データからオブジェクト抽出を行い、抽出したオブジェクト毎に特徴量を取得し、オブジェクト単位で画像データベースを作成する。
画像データからのオブジェクトの抽出は、例えば、画像データ(画像)におけるオブジェクトの位置、オブジェクトの外形、オブジェクトの色彩値、オブジェクトの周波数成分に基づいて実行される。また、画像データに含まれる全てのオブジェクトを対象とせず、主たるオブジェクト(主オブジェクト)のみを抽出し、主オブジェクトについて特徴量を取得しても良い。かかる場合には、画像データのクラス分けが明確になると共に、画像データに適したキーワードの検索精度を向上させることができる。
【0083】
(2)上記処理によって作成された画像データベースに対して、ユーザの操作によって、参照画像データとして不適切な画像データの削除、不適切なキーワードの削除、適切なキーワードの追加が実行されても良い。ユーザによるキーワードの整理を許すことによって、画像データベースの特徴を出すことが可能になると共に、キーワードの適切化によって、画像データに適したキーワードの検索精度を向上させることができる。
【0084】
さらに、画像データベースにおける検索速度を向上させるために、画像データのクラスタリングを行っても良い。クラスタリングに当たっては、撮影位置情報の近い画像データを集め、画像特徴量の類似度、キーワードの内容によって画像データをグループ化し、各グループ毎に撮影位置情報、画像特徴量、キーワードの代表値を求め、各グループと各代表値とを関連づけてデータベース化する。代表値としては、例えば、各グループ内の撮影位置情報、画像特徴量の平均値を取り、キーワードについては重み付け係数を積算して上位のキーワードを用いるようにすれば良い。クラスタリングを行うことによって、いたずらに詳細な条件検索を実行する必要がなくなり、キーワードの検索速度を向上させることができる。
【0085】
画像特徴量の類似度は、比較対象となる2つの画像データの特徴量の距離を用いて求められる。例えば、ユークリッド距離を用いる場合には、以下の式によって距離D(類似度あるいは非類似度)が算出される。
【0086】
【数1】

【0087】
なお、Ycp、Ycbp、Ycrpは画像データPの特徴量係数、Ycq、Ycbq、Ycrqは画像データQの特徴量係数を示し、本実施例の例では、変数i,jについて共にn=7となる。
【0088】
画像データ管理処理:
図11および図12を参照して本実施例に係る画像データ管理処理について説明する。図11は本実施例における画像データ管理処理において実行される処理ルーチンを示すフローチャートである。図12は特定画像データに対して検索されたキーワードの表示例を示す説明図である。本実施例における画像データの管理処理では、特定された画像データに適するキーワードを抽出する処理である。
【0089】
CPU311は、ユーザによって選択された画像データをキーワードの検索対象となる特定画像データとして特定する(ステップS200)。あるいは、CPU311は、ディジタルスチルカメラから供給された複数の画像データを順次特定画像データとして特定しても良い。ディジタルスチルカメラからの画像データの供給形態は、接続ケーブルを介した態様、あるいは、メモリカードによる態様のいずれであっても良い。
【0090】
CPU311は、特定された画像データから撮影位置情報を取得する(ステップS202)。画像データのヘッダ部には既述の通りGPS情報が記述されており、CPU311は、このGPS情報から撮影位置情報として緯度、経度情報を取得する。
【0091】
CPU311は、特定された画像データから特徴量を抽出する(ステップS204)。特徴量は、既述のいずれかの手法によって抽出可能であるが、本実施例では、色配置の手法によって特徴量が取得される。
【0092】
CPU311は、画像データベースにアクセスして、特定画像データの撮影位置情報に近い撮影位置情報を有する画像データ(検索画像データ)を検索し、取得する(ステップS206)。具体的には、特定画像データの撮影位置情報(緯度、経度)の所定範囲内の撮影位置情報(緯度、経度)が関連づけられている検索画像データを取得する。この結果、特定画像データの撮影位置情報に一致または類似する撮影位置情報を有する検索画像データが取得される。
【0093】
CPU311は、検索画像データの中から、特定画像データの特徴量と一致または類似する特徴量を有する画像データを取得する(ステップS208)。具体的には、記述の式1を用いて特定画像データの特徴量に対する検索画像データの特徴量の類似度を算出し、類似度が上位の(距離Dが小さい上位の)画像データを取得する。
【0094】
CPU311は、取得された画像データに関連づけられているキーワードを取得し、画像表示装置35にリスト形式で表示し(ステップS210)、本処理ルーチンを終了する。検索画像データの中から、特定画像データの特徴量と一致または類似する特徴量を有する画像データを取得する(ステップS208)。複数のキーワードが取得される場合には、CPU311は、先に算出した類似度に基づく重み付け係数を算出し、予めキーワードに付されている重み付け係数に積算または加算して、図12に示すように、キーワードの順位付けを行いリスト形式にて表示する。
【0095】
以上説明した本実施例にかかる画像データ管理装置30によれば、画像データベースを利用して特定画像データに関連づけるべきキーワードを簡便に取得することができると共に、特定画像データに対して適切なキーワードを取得することができる。この結果、画像データに対して自動的に、キーワードをコメントとして挿入することが可能となり、画像データを知人に渡す場合において、ユーザ自身でコメントを挿入する必要がなく、利便性を向上させることができる。画像データに対するキーワードの挿入は、キーワードを画像データのヘッダ部に記述することにより、あるいは、画像データとキーワードとを関連づける別のデータを作成することによって実現される。
【0096】
さらに、被写体の名称がわからない画像データを特定画像データとすることによって、被写体の名称あるいは被写体に関わるキーワードを取得することができる。すなわち、画像データをベースにして、画像データに関わる情報を検索することができる。
【0097】
特定画像データに対する検索画像データの絞り込みにおいては、例えば、特定画像データから主オブジェクトを抽出し、主オブジェクトの特徴量を抽出し、主オブジェクトの特徴量を用いて検索画像データを取得しても良い。この場合、画像データベースにも主オブジェクトの特徴量が登録されていることが好ましい。
【0098】
・その他の実施例:
上記実施例では、撮影位置情報、特徴量およびキーワードと画像データとが画像データベースに格納されているが、撮影位置情報、特徴量およびキーワードのみを画像データベースに格納しても良い。かかる場合には、画像データベースの容量を削減することができる。また、画像データベースに画像データが格納されていない場合であっても、撮影位置情報、特徴量およびキーワードが関連付けられているので、検索対象となる画像データの撮影位置情報および特徴量を用いることによって、検索対象の画像データに適したキーワードを取得することができる。したがって、第1の実施例において述べたのと同様の利点を得ることができる。
【0099】
上記実施例では、撮影位置情報、特徴量およびキーワードが画像データと関連付けられて画像データベースに格納されているが、撮影位置情報とキーワードのみが画像データに関連付けられていても良い。かかる場合には、キーワードの検索精度は低下するものの、撮影位置情報に基づいて、画像データに適するキーワードを取得することができる。
【0100】
上記実施例では、画像データベース構築処理、画像データ管理処理がソフトウェア的に、すなわちコンピュータプログラムの態様にて実行されているが、上記各処理(ステップ)を実行する論理回路を備えたハードウェア回路を用いて実行されてもよい。かかる場合には、CPU111、311の負荷を軽減することができると共に、より高速な各処理を実現することができる。ハードウェア回路は、例えば、パーソナルコンピュータに対するアドオンカードとして実装され得る。
【0101】
以上、いくつかの実施例に基づき本発明に係る画像データベース構築装置、画像データ管理装置、画像データベース構築方法(プログラム)、画像データ管理方法(プログラム)を説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることはもちろんである。
【符号の説明】
【0102】
10…画像データベース構築装置
11…制御回路
111…中央演算装置(CPU)
112…ランダムアクセスメモリ(RAM)
113…リードオンリメモリ(ROM)/ハードディスクドライブ(HDD)
12…入力操作部
13…データ入出力部
15…表示器
20…画像データサーバ
30…画像データ管理装置
31…制御回路
311…中央演算装置(CPU)
312…ランダムアクセスメモリ(RAM)
313…リードオンリメモリ(ROM)/ハードディスクドライブ(HDD)
32…入力操作部
33…データ入出力部
35…表示器
P1…画像データベース構築プログラム
P2…画像データ管理プログラム
M1…画像データ取得モジュール
M2…撮影位置情報取得モジュール
M3…キーワード取得モジュール
M4…特徴量取得モジュール
M5…格納実行モジュール
M6…オブジェクト分離モジュール
M7…重み付けモジュール
M21…画像データ特定モジュール
M22…撮影位置情報取得モジュール
M23…特徴量取得モジュール
M24…キーワード取得モジュール
M241…検索画像データ取得モジュール
M242…類似度算出モジュール
M243…重み付けモジュール
M244…キーワード選択モジュール
M25…対応付けモジュール
M26…主オブジェクト抽出モジュール

【特許請求の範囲】
【請求項1】
画像データベースを構築するデータベース構築装置であって、
任意の画像データを取得する画像データ取得手段と、
前記取得された画像データに関連する撮影位置情報を取得する撮影位置情報取得手段と、
前記取得された画像データの特徴量を取得する特徴量取得手段を備え、
前記取得された画像データに関連するキーワードを取得するキーワード取得手段と、
前記取得された撮影位置情報、特徴量およびキーワードを関連付けて記憶装置に格納する格納実行手段とを備えるデータベース構築装置。
【請求項2】
請求項1に記載のデータベース構築装置において、
前記格納実行手段はさらに、前記撮影位置情報、特徴量およびキーワードを前記画像データに関連付けて前記記憶装置に格納するデータベース構築装置。
【請求項3】
請求項1に記載のデータベース構築装置において
前記画像データの取得は、画像データが関連付けられているWebページデータから画像データを取得することにより実行されるデータベース構築装置。
【請求項4】
請求項3に記載のデータベース構築装置において、
前記キーワードの取得は、前記取得された画像データが関連付けられているWebページデータからキーワードを抽出することによって実行されるデータベース構築装置。
【請求項5】
請求項1に記載のデータベース構築装置において
前記画像データには撮影位置情報が付帯されており、
前記撮影位置情報の取得は、前記位置情報を用いて実行されるデータベース構築装置。
【請求項6】
請求項3に記載のデータベース構築装置において、
前記撮影位置情報の取得は、前記取得された画像データが関連付けられているWebページデータから撮影位置情報を抽出することによって実行されるデータベース構築装置。
【請求項7】
請求項2に記載のデータベース構築装置はさらに、
前記取得した画像データに対してオブジェクト分離処理を実行するオブジェクト分離手段を備え、
前記格納実行手段は、前記分離されたオブジェクト毎に前記記憶装置に対する前記画像データの格納を実行するデータベース構築装置。
【請求項8】
請求項4に記載のデータベース構築装置において、
前記キーワード取得手段は複数のキーワードを取得し、
前記データベース構築装置はさらに、
前記取得された各キーワードに対して重み付け係数を付与する重み付け手段を備えるデータベース構築装置。
【請求項9】
請求項8に記載のデータベース構築装置において、
前記重み付け係数は、前記Webページデータにおける前記各キーワードの記述位置、記述用タグの種類によって決定されるデータベース構築装置。
【請求項10】
各画像データに対して撮影位置情報とキーワードとが関連付けられて格納されている画像データベースを利用する画像データ管理装置であって、
処理対象となる画像データを特定するための画像データ特定手段と、
前記特定された画像データに関連する撮影位置情報を取得する撮影位置情報取得手段と、
前記取得された撮影位置情報を用いて、前記画像データベースからキーワードを取得するキーワード取得手段と、
前記取得されたキーワードと前記特定された画像データとを対応付ける対応付け手段とを備える画像データ管理装置。
【請求項11】
請求項10に記載の画像データ管理装置はさらに、
前記特定された画像データの特徴量を取得する特徴量取得手段を備え、
前記画像データベースにおける各画像データには前記撮影位置情報およびキーワードに加えて画像データの特徴量が関連付けられており、
前記キーワード取得手段は、前記撮影位置情報に加えて、前記特徴量を用いて前記キーワードを取得する画像データ管理装置。
【請求項12】
請求項11に記載の画像データ管理装置において、
前記キーワードの取得は、前記特定された画像データの撮影位置および特徴量と同一または類似する撮影位置および特徴量が関連付けられている複数の画像データからそれぞれキーワードを抽出することによって実行される画像データ管理装置。
【請求項13】
請求項11に記載の画像データ管理装置において、
前記キーワード取得手段は、
前記特定された画像データの撮影位置および特徴量と同一または類似する撮影位置お よび特徴量が関連付けられている複数の検索画像データを取得する検索画像データ取得 手段と、
前記特定された画像データの撮影位置および特徴量と、各前記検索画像データの撮影 位置および特徴量を用いて、前記特定された画像データに対する前記検索画像データの 類似度を算出する類似度算出手段と、
前記算出された類似度に応じて、前記複数の検索画像データに関連付けられている各 キーワードに対して重み付けを行う重み付け手段と、
前記重み付けられたキーワードの中から重み付けの大きなキーワードを、前記特定さ れた画像データに対応付けるべきキーワードとして選択するキーワード選択手段とを備 える
画像データ管理装置。
【請求項14】
請求項12に記載の画像データ管理装置はさらに、
前記特定された画像データから主たるオブジェクトを抽出する主オブジェクト抽出手段を備え、
前記画像データベースにおける各画像データに関連付けられている特徴量は各画像データにおける主オブジェクトの特徴量であり、
前記キーワード取得手段は、前記抽出された主オブジェクトの特徴量を用いて前記画像データベースからキーワードを取得する画像データ管理装置。
【請求項15】
画像データベースを構築するデータベース構築方法であって、
Webページデータから任意の画像データを取得し、
前記取得された画像データに関連する撮影位置情報を取得し、
前記取得された画像データの特徴量を取得し、
前記取得された画像データに関連するキーワードを取得し、
前記取得された撮影位置情報、特徴量およびキーワードを関連付けて記憶装置に格納するデータベース構築方法。
【請求項16】
各画像データに対して撮影位置情報とキーワードとが関連付けられて格納されている画像データベースを利用する画像データ管理方法であって、
処理対象となる画像データを特定し、
前記特定された画像データに関連する撮影位置情報を取得し、
前記取得された撮影位置情報を用いて、前記画像データベースからキーワードを取得し、
前記取得されたキーワードと前記特定された画像データとを対応付けて記憶装置に保存する画像データ管理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2010−134952(P2010−134952A)
【公開日】平成22年6月17日(2010.6.17)
【国際特許分類】
【出願番号】特願2010−10132(P2010−10132)
【出願日】平成22年1月20日(2010.1.20)
【分割の表示】特願2005−93507(P2005−93507)の分割
【原出願日】平成17年3月29日(2005.3.29)
【出願人】(000002369)セイコーエプソン株式会社 (51,324)
【Fターム(参考)】