説明

画像処理装置、画像処理方法および制御プログラム

【課題】人間が直感的にクエリ画像に類似すると考える画像を効率的に検索する。
【解決手段】ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定部21と、クエリ画像からオブジェクトを抽出するオブジェクト抽出部22と、オブジェクト抽出部22の抽出したオブジェクトを複数合成することで、複数のオブジェクトを含む合成クエリ画像を作成する合成クエリ画像作成部25と、合成クエリ画像に類似する画像を検索する検索部27と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像を検索する画像処理装置、画像処理方法および制御プログラムに関するものである。
【背景技術】
【0002】
近年、クエリ画像に類似する画像を検索する技術が開発されている。
【0003】
例えば、特許文献1には、クエリ画像に対してエッジ検出を行い、線分情報のみからなる概略画像に基づいて、クエリ画像に類似する画像を検索する技術が記載されている。より具体的には、特許文献1には、クエリ画像全体のエッジ強度に基づく大局的しきい値と、クエリ画像に含まれる注目画素およびその近傍の画素のエッジ強度に基づく局所的しきい値とを算出し、大局的しきい値および局所的しきい値のうちの大きい方の値に基づいて、注目画素がエッジであるか否かを判定し、クエリ画像から概略画像を作成する概略画像作成装置が記載されている。
【0004】
また、特許文献2には、複数のクエリ画像を組み合わせて検索を行う画像処理装置であって、クエリ画像の組み合わせを規定する論理式を感覚的な操作で指定可能な画像処理装置が記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第2806666号公報(1998年9月30日発行)
【特許文献2】特開2010−250426号公報(2010年11月4日公開)
【非特許文献】
【0006】
【非特許文献1】Laurent Itti、外2名、「A Model of Saliency-Based Visual Attention for Rapid Scene Analysis」、IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE、VOL. 20, NO. 11、NOVEMBER 1998
【非特許文献2】「ディジタル画像処理」、第2版、財団法人 画像情報教育振興協会、2009年3月2日、p196−199
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述のような従来技術は、それぞれ次のような問題がある。
【0008】
例えば、建物Aが写っている画像をユーザが検索しようとしたときに、ユーザがクエリ画像として、建物Aの画像を用いるとする。また、クエリ画像である建物Aの画像には、建物A以外に他の物体や背景等が含まれているとする。この場合、特許文献1に記載の技術では、クエリ画像である、建物Aの画像の全領域(全画素)を概略画像とするため、作成した概略画像には、建物A以外の他の物体や背景等の情報が含まれる。
【0009】
そのため、特許文献1に記載の技術を利用した画像検索装置は、作成した概略画像で検索する場合、建物Aに類似する物体が写っている画像を検索すると共に、建物A以外の他の物体や背景等が写っている画像を検索する。すなわち、上記画像検索装置は、ユーザの所望する建物Aに類似する画像以外の画像も検索する。よって、特許文献1に記載の技術を利用した場合、画像検索装置が余計な検索処理を行うという問題がある。
【0010】
また、上述のように、特許文献1に記載の技術を利用した画像検索装置は、建物Aに類似する物体が写っている画像以外に、建物Aが写っておらず、建物A以外の他の物体や背景等が写っている画像も検索結果として表示する。そのため、ユーザが検索結果の中から建物Aが写っている画像を探すのに手間が掛かる。
【0011】
また、例えば、特許文献2に記載の技術において、花Bおよび花Cが写っている画像をユーザが検索しようとしたときに、ユーザがクエリ画像として、花Bの画像と花Cの画像を用いるとする。この場合、特許文献2に記載の技術では、花Bに類似する物体が写っている画像と、花Cに類似する物体が写っている画像とを一旦検索した後、各検索結果の論理積をユーザに提示する。すなわち、特許文献2に記載の画像処理装置は、ユーザの所望する花Bに類似する物体および花Cに類似する物体が写っている画像以外の画像も検索する。よって、特許文献2に記載の画像処理装置が余計な検索処理を行うという問題がある。
【0012】
また、一般的に、論理式を正確に理解しているユーザは多くない。そのため、論理式を理解していないユーザは、クエリ画像の組み合わせによる検索結果を予測することができない。よって、特許文献2に記載の技術では、ユーザはクエリ画像を用いた直感的な検索を行うことが難しい。
【0013】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、人間が直感的にクエリ画像に類似すると考える画像を効率的に検索する画像処理装置、画像処理方法および制御プログラムを実現することにある。
【課題を解決するための手段】
【0014】
本発明に係る画像処理装置は、上記課題を解決するために、ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定手段と、上記クエリ画像からオブジェクトを検出するオブジェクト検出手段と、上記オブジェクト検出手段の検出した上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成する合成クエリ画像生成手段と、上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する画像検索手段と、を備えることを特徴としている。
【0015】
本発明に係る画像処理方法は、上記課題を解決するために、ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定ステップと、上記クエリ画像からオブジェクトを検出するオブジェクト検出ステップと、上記オブジェクト検出ステップにおいて検出された上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成する合成クエリ画像生成ステップと、上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する画像検索ステップとを含むことを特徴としている。
【0016】
ここで、ユーザは、複数のオブジェクトを含む1または複数のクエリ画像に類似する画像を検索する場合、一般的に、これらのクエリ画像に含まれる複数のオブジェクトを含む画像に類似する画像を探していると予想される。
【0017】
上記オブジェクト検出手段は、上記クエリ画像特定手段がユーザからの指定に基づいて特定したクエリ画像からオブジェクトを検出し、上記合成クエリ画像生成手段は、上記オブジェクト検出手段の検出した上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成し、上記画像検索手段は、上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する。
【0018】
そのため、ユーザの指定したクエリ画像からオブジェクトを自動的に検出することができる。よって、クエリ画像から検出されたオブジェクトを含む合成クエリ画像を用いて検索することにより、ユーザが探している画像を効率的に検索することができる。すなわち、画像処理装置において不要な検索処理を削減することができる。
【0019】
そのため、上記クエリ画像に基づいてクエリ画像に類似する画像を検索する際に、複数のオブジェクトを含む合成クエリ画像を使用することによって、ユーザは、上記クエリ画像を指定するだけで、直感的に、所望する画像を検索することができるという効果を奏する。
【0020】
また、複数のオブジェクトを含む合成クエリ画像を用いて検索することにより、オブジェクト単位で検索するのではなく、複数のオブジェクトを含む合成クエリ画像単位で検索するため、画像処理装置の処理負荷を軽減することができる。
【0021】
本発明に係る画像処理装置は、上記合成クエリ画像上における上記オブジェクトの位置およびサイズの少なくとも何れかを調整する合成クエリ画像調整手段をさらに備え、上記画像検索手段は、上記合成クエリ画像調整手段が調整した合成クエリ画像に類似する画像を検索することが好ましい。
【0022】
一般的に、ユーザは、2つの画像が類似しているか否かを判断する際に、各画像に含まれるオブジェクトの位置および/またはサイズを相互に比較して判断する。
【0023】
上記の構成によれば、上記合成クエリ画像調整手段が上記合成クエリ画像生成手段の生成した合成クエリ画像に含まれるオブジェクトの当該合成クエリ画像上における位置およびサイズの少なくとも何れかを調整する。そして、上記画像検索手段が、上記合成クエリ画像調整手段が調整後の合成クエリ画像に類似する画像を検索する。これにより、合成クエリ画像と類似する画像であって、当該合成クエリ画像上におけるオブジェクトの位置および/またはサイズが類似するオブジェクトを含む画像を検索することができる。よって、ユーザが直感的に類似すると考える画像をより効果的、効率的に検索することができる。
【0024】
本発明に係る画像処理装置は、ユーザからの入力を受け付ける入力手段をさらに備え、上記合成クエリ画像生成手段は、上記入力手段に入力された指示に基づいて、上記オブジェクト検出手段の検出した上記オブジェクトを複数選択し、選択した複数のオブジェクトを合成することが好ましい。
【0025】
上記の構成によれば、上記合成クエリ画像生成手段は、上記入力手段に入力されたユーザの指示に基づいて、上記オブジェクト検出手段の検出したオブジェクトを複数選択し、選択した複数のオブジェクトを合成する。そのため、上記合成クエリ画像生成手段は、ユーザが探している画像に含まれるオブジェクトと類似するオブジェクトを選択することができる。よって、ユーザが探している画像に含まれるオブジェクトと類似するオブジェクトを含む合成クエリ画像を生成することができる。よって、ユーザが探している画像と類似する画像をより効果的、効率的に検索することができる。
【0026】
本発明に係る画像処理装置は、ユーザからの入力を受け付ける入力手段をさらに備え、上記合成クエリ画像調整手段は、上記入力手段に入力された指示に基づいて、上記合成クエリ画像上における上記オブジェクトの位置およびサイズの少なくとも何れかを調整することが好ましい。
【0027】
上記の構成によれば、上記合成クエリ画像調整手段は、上記入力手段に入力されたユーザの指示に基づいて、上記合成クエリ画像生成手段の生成した合成クエリ画像上における上記オブジェクトの位置およびサイズの少なくとも何れかを調整する。そのため、ユーザが探している画像に含まれるオブジェクトと、画像上の位置および/またはサイズが類似するオブジェクトを含む合成クエリ画像を生成することができる。よって、ユーザが探している画像と類似する画像をより効果的、効率的に検索することができる。
【0028】
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記画像処理装置の各手段として動作させることにより、上記画像処理装置をコンピュータにて実現させる制御プログラム、及びそれを記録したコンピュータ読み取り可能な記録媒体も本発明の範疇に入る。
【発明の効果】
【0029】
以上のように、本発明に係る画像処理装置は、ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定手段と、上記クエリ画像からオブジェクトを検出するオブジェクト検出手段と、上記オブジェクト検出手段の検出した上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成する合成クエリ画像生成手段と、上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する画像検索手段と、を備えている構成である。
【0030】
また、本発明に係る画像処理方法は、ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定ステップと、上記クエリ画像からオブジェクトを検出するオブジェクト検出ステップと、上記オブジェクト検出ステップにおいて検出された上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成する合成クエリ画像生成ステップと、上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する画像検索ステップとを含む。
【0031】
従って、上記クエリ画像に基づいてクエリ画像に類似する画像を検索する際に、複数のオブジェクトを含む合成クエリ画像を使用することによって、ユーザは、上記クエリ画像を指定するだけで、直感的に、所望する画像を検索することができるという効果を奏する。
【図面の簡単な説明】
【0032】
【図1】本発明の実施形態を示すものであり、画像処理装置の要部構成の一例を示すブロック図である。
【図2】本発明の概要を示す図である。
【図3】上記画像処理装置の合成クエリ画像調整部が位置および/またはサイズを調整した合成クエリ画像を示す図である。
【図4】上記画像処理装置における画像検索処理の一例を示すフローチャートである。
【図5】上記画像検索処理において上記画像処理装置の表示部に表示される表示画面例を示す図である。
【図6】上記画像検索処理において上記画像処理装置の表示部に表示される表示画面例を示す図である。
【図7】上記画像検索処理において上記画像処理装置の表示部に表示される他の表示画面例を示す図である。
【発明を実施するための形態】
【0033】
〔概要〕
本発明に係る画像処理装置は、ユーザの指定した1または複数のクエリ画像に基づいて、クエリ画像に類似する画像を検索するための検索用画像情報(合成クエリ画像)を生成するものである。
【0034】
具体的には、図2に示すように、画像SP1のような建物Dの前に人物Eが写っている画像を探す際に、建物Dが写っている画像QP1および人物Eが写っている画像QP2をクエリ画像としてユーザが選択したとする。このとき、本発明に係る画像処理装置は、画像QP1およびQP2から、それぞれ建物Dを示す情報および人物Eを示す情報を抽出する。次に、本発明に係る画像処理装置は、抽出した情報を1つの画像に合成し、画像SP1を検索するための検索用画像である合成クエリ画像CQP1を作成する。
【0035】
そして、本発明に係る画像処理装置は、作成した合成クエリ画像CQP1に類似する画像を検索し、その検索結果を表示する。ユーザは、表示された検索結果の中から、所望する画像を選択する。
【0036】
このように、本発明に係る画像処理装置は、ユーザが所望する画像SP1に類似する合成クエリ画像CQP1を、ユーザが指定したクエリ画像(P1およびP2)から作成するものである。
【0037】
以下では、本発明の一実施形態について図1から図7に基づいて説明する。
【0038】
〔画像処理装置の構成〕
図1は、画像処理装置1の要部構成の一例を示すブロック図である。図1に示すように、画像処理装置1は、制御部11、記憶部12、画像入力部13、操作部(入力手段)14、通信部15および表示部16を備えている。なお、画像処理装置1は、音声入力部、音声出力部等の部材を備えていてもよいが、発明の特徴点とは関係がないため当該部材を図示していない。
【0039】
画像入力部13は、画像提供装置3から画像を取得するものである。画像提供装置3は、保持している画像または取得した画像を他の装置に提供する装置であれば何でもよい。例えば、画像提供装置3は、デジタルカメラ、デジタルテレビ、PC、携帯電話機、PDA(Personal Digital Assistant)、ゲーム機、USB(Universal Serial Bus)メモリ等の記憶装置などである。
【0040】
操作部14は、ユーザが画像処理装置1に指示信号を入力し、画像処理装置1を操作するためのものである。操作部14は、キーボード、マウス、キーパッド、操作ボタンなどの入力機器等で構成されているものであってもよい。また、操作部14と表示部16とが一体となっているタッチパネルであってもよい。また、操作部14は、画像処理装置1と別体のリモートコントローラ等の遠隔制御装置であってもよい。
【0041】
通信部15は、無線通信手段または有線通信手段によって、画像データベース2等の他の装置と通信を行い、制御部11の指示に従って、データのやりとりを行うものである。例えば、通信部15は、制御部11の指示に従って、画像データベース2から画像を取得する。
【0042】
画像データベース2は、画像を保持している記憶装置またはWebサーバ等である。
【0043】
表示部16は、制御部11の指示に従って画像を表示するものである。表示部16は、制御部11の指示に従って画像を表示するものであればよく、例えば、LCD(液晶ディスプレイ)、有機ELディスプレイ、プラズマディスプレイなどを適用することが可能である。
【0044】
制御部11は、記憶部12から一時記憶部(不図示)に読み出されたプログラムを実行することにより、各種の演算を行うと共に、画像処理装置1が備える各部を統括的に制御するものである。
【0045】
本実施形態では、制御部11は、機能ブロックとして、クエリ画像特定部(クエリ画像特定手段)21、オブジェクト抽出部(オブジェクト検出手段)22、合成クエリ画像作成部(合成クエリ画像生成手段)25、合成クエリ画像調整部(合成クエリ画像調整手段)26および検索部(画像検索手段)27を備える構成である。これらの制御部11の各機能ブロック(21、22、25〜27)は、CPU(central processing unit)が、ROM(read only memory)等で実現された記憶装置に記憶されているプログラムをRAM(random access memory)等で実現された一時記憶部に読み出して実行することで実現できる。
【0046】
クエリ画像特定部21は、ユーザが指定した画像をクエリ画像として特定するものである。具体的には、表示部16に表示されている画像をユーザが操作部14を使用して指定すると、クエリ画像特定部21は、ユーザの指定した画像を示す情報を操作部14から取得して、取得した情報の示す画像をクエリ画像として特定する。
【0047】
なお、ユーザがクエリ画像として指定する画像は、1つであってもよいし、複数であってもよい。つまり、クエリ画像特定部21が特定する画像(クエリ画像)は、1つでもよいし、複数であってもよい。
【0048】
上記の「表示部16に表示されている画像」とは、例えば、制御部11が、画像入力部13を介して画像提供装置3から画像を取得し、取得した画像を表示部16に表示した画像であってもよい。また、ユーザがWebの閲覧をしている状態など、制御部11が、通信部15を介して画像データベース2から画像を取得し、取得した画像を表示部16に表示した画像であってもよい。また、制御部11が、画像記憶部31から画像を読み出し、読み出した画像を表示部16に表示した画像であってもよい。
【0049】
また、表示部16に表示されている画像からユーザがクエリ画像を選択することに限らない。例えば、ユーザは、画像データベース2、画像提供装置3、または画像記憶部31における画像データのディレクトリアドレス等を指定して、画像データベース2、画像提供装置3、または画像記憶部31が保持する画像をクエリ画像として指定してもよい。
【0050】
クエリ画像特定部21は、画像入力部13から、または、通信部15を介して画像データベース2から、または、画像記憶部31から、特定した画像(クエリ画像)を取得する。クエリ画像特定部21は、取得したクエリ画像をオブジェクト抽出部22に出力する。
【0051】
オブジェクト抽出部22は、クエリ画像特定部21からクエリ画像を取得し、取得したクエリ画像からオブジェクトを検出して、検出したオブジェクトを抽出するものである。オブジェクト抽出部22は、抽出したオブジェクトを示すオブジェクト情報を生成し、生成したオブジェクト情報を合成クエリ画像作成部25に出力する。
【0052】
また、オブジェクト抽出部22は、オブジェクト情報を生成する際に、各オブジェクトのクエリ画像における位置およびサイズをそれぞれ示す位置情報およびサイズ情報を当該オブジェクトの付加情報として、オブジェクト情報に付加してもよい。
【0053】
ここで、オブジェクトとは、建物や人物等の物体、海や夕焼け空等の背景、または、「○」や「△」等の抽象的な模様などを含むものである。また、オブジェクト情報とは、画像中のオブジェクトの領域の画素群の画素値を示す情報であってもよいし、また、オブジェクトのエッジ(輪郭)を示すエッジ情報などのオブジェクトの特徴量を示す情報であってもよい。また、上記オブジェクトの付加情報は、位置情報およびサイズ情報の両方を含んでいなくてもよく、少なくとも1つを含んでいればよい。
【0054】
オブジェクト抽出部22は、物体検出部23および領域抽出部24を備え、より詳細には、物体検出部23および領域抽出部24が、オブジェクト情報を生成する。
【0055】
物体検出部23は、オブジェクトの標準的な画像である画像テンプレートを記憶部12から読み出し、クエリ画像と画像テンプレートとのマッチングを行い、クエリ画像の中に、マッチングした画像テンプレートと同じオブジェクトが含まれているか否かを判定するものである。物体検出部23は、マッチングした画像テンプレートと同じオブジェクトが含まれていると判定すると、当該オブジェクトをクエリ画像から抽出し、抽出したオブジェクトを示すオブジェクト情報を生成する。
【0056】
また、物体検出部23は、オブジェクトの標準的な画像の特徴量を示す特徴量テンプレートを記憶部12から読み出すと共に、クエリ画像の特徴量を算出し、クエリ画像の特徴量と特徴量テンプレートとのマッチングを行う。そして、クエリ画像の中に、マッチングした特徴量テンプレートの示す特徴量を有するオブジェクトと同じオブジェクトが含まれているか否かを判定する。物体検出部23は、マッチングした特徴量テンプレートの示す特徴量を有するオブジェクトと同じオブジェクトが含まれていると判定すると、当該オブジェクトをクエリ画像から抽出し、抽出したオブジェクトを示すオブジェクト情報を生成する。
【0057】
例えば、物体検出部23は、顔、人(身体)、ペット、車などを検出してもよいし、さらに、個体(個人など)を特定して検出してもよい。また、物体検出部23は、海、山、夕焼け空などの背景(シーン)を検出してもよい。
【0058】
また、物体検出部23は、画像テンプレートまたは特徴量テンプレートに当該テンプレートの示すオブジェクトの名称が対応付けられている場合、抽出したオブジェクトを示すオブジェクト情報に、当該オブジェクトの名称を示すオブジェクト名称情報を付加情報として付加してもよい。
【0059】
領域抽出部24は、Saliency Map(非特許文献1を参照)や領域分割処理(セグメンテーション:非特許文献2を参照)などのアルゴリズムを用いて、クエリ画像の中から特徴的な領域(画素群)を抽出し、抽出した領域をオブジェクトの領域として特定し、オブジェクト情報を生成するものである。
【0060】
領域抽出部24は、例えば、Saliency Mapを用いる場合、クエリ画像から、色、輝度、エッジ等の特徴量のコントラストを示すfeature mapをそれぞれ生成し、各feature mapの各画素を加算平均してsaliency map(SM)を生成し、SMにおけるコントラストが高い領域(例えば、画素値が所定値以上の画素群)を抽出する。Saliency Mapは、人間の視覚処理をモデル化したものであり、Saliency Mapを用いて領域を抽出することにより、人間が注目しやすい(注目すると考えられる)領域を自動的に特定することができる。
【0061】
また、領域分割処理として、具体的には、近接画素の統合による領域分割処理、画素特徴量のクラス分けによる領域分割処理、または、エッジを利用したスネーク(snakes)と呼ばれる手法による領域分割処理等を適用してもよい。
【0062】
合成クエリ画像作成部25は、オブジェクト抽出部22が生成したオブジェクト情報の示すオブジェクトの中から、1つまたは複数のオブジェクトを選択し、選択したオブジェクトをブランク画像に貼り付けて合成クエリ画像を作成するものである。
【0063】
合成クエリ画像作成部25は、操作部14に入力されるユーザからの指示に従って、オブジェクトを選択してもよいし、予め定めた所定の選択ルールに従って、オブジェクトを選択してもよい。
【0064】
上記選択ルールとは、例えば、オブジェクトの組み合わせ全てで実施するものであってもよいし、さらに、オブジェクトが2つ以上の組み合わせ全て、オブジェクトが3つ以上の組み合わせ全て等であってもよい。
【0065】
具体的には、オブジェクト抽出部22が「L」、「M」、「N」の3つのオブジェクトをそれぞれ示すオブジェクト情報を生成したとする。この場合、合成クエリ画像作成部25は、「L」、「M」、「N」、「LとM」、「MとN」、「NとL」、「LとMとN」の7通りの組み合わせで選択し、7つの合成クエリ画像を作成してもよい。
【0066】
また、各オブジェクトの組み合わせを排除するルールを予め定めておいてもよい。例えば、各オブジェクトの組み合わせを排除するルールとして、「MとN」の組み合わせを排除するものとして定めている場合、上記の選択ルールに基づいて実施すると、「L」、「M」、「N」、「LとM」、「NとL」、「LとMとN」の6通りの組み合わせで選択される(なお、このとき、「LとMとN」も「MとN」の組み合わせが含まれているとして排除してもよい)。なお、この場合、物体検出部23が少なくともオブジェクト「M」と「N」の名称を特定しているものとする。
【0067】
合成クエリ画像作成部25は、選択したオブジェクトを示すオブジェクト情報に付加情報が付加されている場合、当該付加情報の示す位置情報およびサイズ情報の示す位置およびサイズに従って、ブランク画像における当該オブジェクトの位置およびサイズを決定する。一方、付加情報が付加されていない場合、合成クエリ画像作成部25は、ブランク画像における当該オブジェクトの位置およびサイズを、予め定めた所定の配置ルールに従って、決定する。上記配置ルールとは、例えば、選択したオブジェクト数でブランク画像を分割し、分割された各領域に各オブジェクトが収まるように配置するなどである。
【0068】
合成クエリ画像作成部25は、作成した合成クエリ画像を示す合成クエリ画像情報を合成クエリ画像調整部26に出力する。
【0069】
合成クエリ画像調整部26は、合成クエリ画像作成部25が作成した合成クエリ画像に含まれるオブジェクトの、当該合成クエリ画像における位置およびサイズを調整するものである。合成クエリ画像調整部26は、位置およびサイズを調整した合成クエリ画像を示す合成クエリ画像情報を検索部27に出力する。
【0070】
合成クエリ画像調整部26は、操作部14に入力されるユーザからの指示に従って、合成クエリ画像におけるオブジェクトの位置およびサイズを調整してもよいし、予め定めた所定の調整ルールに従って、合成クエリ画像におけるオブジェクトの位置およびサイズを調整してもよい。
【0071】
上記調整ルールとは、例えば、物体検出部23によって合成クエリ画像に含まれるオブジェクトの名称が特定されている場合、建物のオブジェクトの前に人物のオブジェクトを配置するなどである。
【0072】
例えば、合成クエリ画像調整部26は、図2に示す合成クエリ画像CQP1から、図3(a)または(b)に示す合成クエリ画像のように、オブジェクトの合成クエリ画像における位置および/またはサイズを調整する。
【0073】
検索部27は、合成クエリ画像調整部26から合成クエリ画像情報を取得し、画像データベース2および/または画像記憶部31が保持する画像の中から、取得した合成クエリ画像情報の示す合成クエリ画像に類似する画像を検索する。
【0074】
検索部27は、検索結果を表示部16に表示し、より合成クエリ画像に類似する画像を検索結果の上位に表示する。合成クエリ画像との類似の程度を示す指標を類似度とすると、検索部27は、類似度が高い画像を、検索結果のより上位に表示する。
【0075】
また、検索部27は、合成クエリ画像におけるオブジェクトの位置および/またはサイズに基づいて、各検索対象画像の合成クエリ画像との類似度を決定してもよい。具体的には、合成クエリ画像に含まれるオブジェクトと同じオブジェクトを有する検索対象画像が複数ある場合、検索対象画像におけるオブジェクトの位置またはサイズが、合成クエリ画像における当該オブジェクトの位置またはサイズと近いものほど、類似度が高くなるようにしてもよい。
【0076】
また、検索部27は、合成クエリ画像が複数ある場合、操作部14を介して、ユーザから選択(指定)された合成クエリ画像のみを用いて検索を行ってもよい。
【0077】
記憶部12は、制御部11が参照するプログラムやデータ等を格納するものであり、画像記憶部31、テンプレート記憶部32、アルゴリズム記憶部33、選択ルール記憶部34、配置ルール記憶部35および調整ルール記憶部36を備える。
【0078】
画像記憶部31は、ユーザがクエリ画像として指定する画像や、検索部27が合成クエリ画像に基づいて検索を行う検索対象の画像等を格納するものである。
【0079】
テンプレート記憶部32は、物体検出部23が物体を検出する際に使用する画像テンプレートや特徴量テンプレートを格納するものである。
【0080】
アルゴリズム記憶部33は、領域抽出部24が所定の領域を抽出する際に使用する上述のアルゴリズムを格納するものである。
【0081】
選択ルール記憶部34は、合成クエリ画像作成部25が自動的にオブジェクトを選択する際に使用する選択ルールを格納するものである。
【0082】
配置ルール記憶部35は、合成クエリ画像作成部25が自動的にオブジェクトの配置を決定する際に使用する配置ルールを格納するものである。
【0083】
調整ルール記憶部36は、合成クエリ画像調整部26が自動的にオブジェクトの位置およびサイズを調整する際に使用する調整ルールを格納するものである。
【0084】
〔画像検索処理〕
次に、画像処理装置1における画像検索処理について図4に基づいて説明する。図4は、画像処理装置1における画像検索処理の一例を示すフローチャートである。図4に示す処理例では、合成クエリ画像作成部25および合成クエリ画像調整部26がユーザの指示に基づいて、合成クエリ画像を作成および調整を行う例を示す。
【0085】
図4に示すように、クエリ画像特定部21は、操作部14を介して画像をクエリ画像として指定する指示が入力されるのを待つ(S1)。ユーザがWeb閲覧時等に画像をクエリ画像として指定する操作が入力されると(S1でYES)、クエリ画像特定部21は、入力された指示に従って、ユーザの指定する画像をクエリ画像として特定する(S2)。そして、クエリ画像特定部21は、特定したクエリ画像をオブジェクト抽出部22に出力する。
【0086】
オブジェクト抽出部22は、クエリ画像特定部21からクエリ画像を取得し、取得したクエリ画像からオブジェクトを抽出する(S3)。そして、オブジェクト抽出部22は、抽出したオブジェクトを表示部16に表示する(S4)。また、オブジェクト抽出部22は、抽出したオブジェクトを示すオブジェクト情報を生成し、生成したオブジェクト情報を合成クエリ画像作成部25に出力する。
【0087】
次に、合成クエリ画像作成部25は、表示部16に表示しているオブジェクトの中から合成クエリ画像に組み込むオブジェクトを選択するユーザの指示が入力されるのを待つ(S5)。ここで、所定期間ユーザの指示が入力されなかったり、表示部16に表示中のオブジェクトを合成クエリ画像に組み込まない旨の指示が入力されたりすると(S5でNO)、S1に戻って、クエリ画像が指定されるのを待つ。
【0088】
一方、オブジェクトを選択する指示が入力されると(S5でYES)、合成クエリ画像作成部25は、入力された指示に従って、ユーザの指定するオブジェクトをブランク画像に貼り付けて合成クエリ画像を作成する(S6)。そして、合成クエリ画像作成部25は、作成した合成クエリ画像を表示部16に表示する(S7)。また、合成クエリ画像作成部25は、作成した合成クエリ画像を示す合成クエリ画像情報を合成クエリ画像調整部26に出力する。
【0089】
次に、合成クエリ画像調整部26は、合成クエリ画像のオブジェクトの位置またはサイズを調整する指示が入力されるのを待つ(S8)。ここで、所定期間ユーザの指示が入力されなかったり、オブジェクトの位置およびサイズを調整しない旨の指示が入力されたりすると(S8でNO)、合成クエリ画像調整部26は、合成クエリ画像を示す合成クエリ画像情報を検索部27に出力する。
【0090】
一方、オブジェクトの位置またはサイズを調整する指示が入力されると(S8でYES)、合成クエリ画像調整部26は、入力された指示に従って、ユーザの指定するオブジェクトの合成クエリ画像における位置またはサイズを調整する(S9)。そして、合成クエリ画像調整部26は、調整した合成クエリ画像を表示部16に表示する(S10)。また、合成クエリ画像調整部26は、調整した合成クエリ画像を示す合成クエリ画像情報を検索部27に出力する。
【0091】
検索部27は、合成クエリ画像調整部26から合成クエリ画像情報を取得すると、操作部14を介して、ユーザから合成終了指示が入力されるのを待つ(S11)。ユーザから合成終了指示ではなく、クエリ画像の追加の指示が入力されると(S11でNO)、S1に戻って、クエリ画像が指定されるのを待つ。
【0092】
一方、合成終了指示が入力されると(S11でYES)、検索部27は、画像データベース2および/または画像記憶部31が保持する画像の中から、取得した合成クエリ画像情報の示す合成クエリ画像に類似する画像を検索する(S12)。そして、検索部27は、検索結果を表示部16に表示する(S13)。
【0093】
なお、合成クエリ画像作成部25および合成クエリ画像調整部26が、ユーザの指示ではなく自動で行う場合は、S5およびS8の判断処理は必要ない。また、この場合、S4、S7およびS10において、表示部16にオブジェクトまたは合成クエリ画像を表示しなくてもよい。
【0094】
〔表示画面例1〕
次に、上記画像検索処理において表示部16に表示される表示画面例を図5および図6に基づいて説明する。図5および図6は、画像検索処理において表示部16に表示される表示画面例を示す図である。図5および図6に示す例では、画像入力部13が画像提供装置3から取得した画像をユーザがクエリ画像として選択するものとする。また、オブジェクト抽出部22が各クエリ画像における最も特徴的なオブジェクトを1つ抽出するものとし、また、合成クエリ画像作成部25がユーザの指示に基づいて貼り付けるオブジェクトを選択するものとする。
【0095】
まず、図5(a)に示すように、画像入力部13が画像提供装置3から取得した入力画像P1を制御部11が表示部16に表示する。ここで、ユーザが操作部14を介して表示部16に表示されている入力画像P1をクエリ画像として選択すると、クエリ画像特定部21が入力画像P1をクエリ画像QP1として特定する。
【0096】
そして、オブジェクト抽出部22は、クエリ画像QP1からオブジェクトOBJ1を抽出して、図5(b)に示すように、抽出したオブジェクトOBJ1を表示部16に表示する。ここで、ユーザが操作部14を介して表示部16に表示されているオブジェクトOBJ1を合成クエリ画像に含めるものとして選択すると、合成クエリ画像作成部25がブランク画像にオブジェクトOBJ1を貼り付けて、合成クエリ画像CQP1aを作成する。
【0097】
合成クエリ画像作成部25は、図5(c)に示すように、作成した合成クエリ画像CQP1aを表示部16に表示する。なお、図5(c)に示す例では、合成クエリ画像CQP1aに含まれるオブジェクトOBJ1を線画で表示しているがこれに限るものではない。例えば、図5(b)に示すように、クエリ画像QP1からそのまま抽出した画像を表示してもよい。
【0098】
また、このとき、ユーザが画面表示切替操作を行うことによって、図5(d)に示すように、制御部11は、合成クエリ画像を作成するために使用したクエリ画像に関する情報を表示してもよい。図5(d)に示す例では、制御部11は、表示部16に、クエリ画像QP1のサムネイル画像と、クエリ画像QP1から抽出したオブジェクトの有無と、顔検出の有無とを表示する。
【0099】
合成クエリ画像作成部25が、図5(c)に示す合成クエリ画像CQP1aを作成した後、さらに、画像入力部13が画像提供装置3から入力画像P2を取得したとする。上述のように、制御部11は、図6(a)に示すように画像入力部13が取得した入力画像P2を表示部16に表示する。ここで、ユーザが操作部14を介して表示部16に表示されている入力画像P2をクエリ画像として選択すると、クエリ画像特定部21が入力画像P2をクエリ画像QP2として特定する。
【0100】
そして、オブジェクト抽出部22は、クエリ画像QP2からオブジェクトOBJ2を抽出して、図6(b)に示すように、抽出したオブジェクトOBJ2を表示部16に表示する。ここで、ユーザが操作部14を介して表示部16に表示されているオブジェクトOBJ2を合成クエリ画像に含めるものとして選択すると、合成クエリ画像作成部25が先ほど作成した合成クエリ画像CQP1aにオブジェクトOBJ2を貼り付けて、合成クエリ画像CQP1を作成する。
【0101】
合成クエリ画像作成部25は、図6(c)に示すように、作成した合成クエリ画像CQP1を表示部16に表示する。また、このとき、ユーザが画面表示切替操作を行うことによって、図6(d)に示すように、制御部11は、合成クエリ画像を作成するために使用したクエリ画像に関する情報を表示してもよい。図6(d)に示す例では、クエリ画像QP1およびQP2に関する情報が表示されている。
【0102】
〔表示画面例2〕
次に、上記画像検索処理において表示部16に表示される他の表示画面例を図7に基づいて説明する。図7は、画像検索処理において表示部16に表示される他の表示画面例を示す図である。図7に示す例では、画像入力部13が画像提供装置3から取得した画像P1およびP2をユーザがクエリ画像として選択するものとする。また、オブジェクト抽出部22が各クエリ画像から複数のオブジェクトを抽出するものとし、また、合成クエリ画像作成部25が自動的にオブジェクトを選択して合成クエリ画像を作成するものとする。
【0103】
オブジェクト抽出部22は、クエリ画像QP1およびQP2からそれぞれオブジェクトを抽出して、図7(a)に示すように、クエリ画像QP1から抽出したオブジェクトOBJ1、OBJ3およびOBJ4、並びに、クエリ画像QP2から抽出したオブジェクトOBJ2およびOBJ5を表示部16に表示する。
【0104】
次に、合成クエリ画像作成部25が自動的にオブジェクトOBJ1〜5の中から、オブジェクトを選択して、オブジェクトOBJ1およびOBJ2を含む合成クエリ画像CQP1と、オブジェクトOBJ3およびOBJ4を含む合成クエリ画像CQP2とを作成する。合成クエリ画像作成部25は、図7(b)に示すように、作成した合成クエリ画像CQP1およびCQP2を表示部16に表示する。
【0105】
〔補足〕
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【0106】
最後に、画像処理装置1の各ブロック、特に制御部11は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
【0107】
すなわち、画像処理装置1は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM、上記プログラムを展開するRAM、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである画像処理装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記画像処理装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
【0108】
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
【0109】
また、画像処理装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
【産業上の利用可能性】
【0110】
本発明は、クエリ画像に類似する画像を検索する画像処理装置に利用することができる。
【符号の説明】
【0111】
1 画像処理装置
14 操作部(入力手段)
21 クエリ画像特定部(クエリ画像特定手段)
22 オブジェクト抽出部(オブジェクト検出手段)
25 合成クエリ画像作成部(合成クエリ画像生成手段)
26 合成クエリ画像調整部(合成クエリ画像調整手段)
27 検索部(画像検索手段)

【特許請求の範囲】
【請求項1】
ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定手段と、
上記クエリ画像からオブジェクトを検出するオブジェクト検出手段と、
上記オブジェクト検出手段の検出した上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成する合成クエリ画像生成手段と、
上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する画像検索手段と、を備えることを特徴とする画像処理装置。
【請求項2】
上記合成クエリ画像上における上記オブジェクトの位置およびサイズの少なくとも何れかを調整する合成クエリ画像調整手段をさらに備え、
上記画像検索手段は、上記合成クエリ画像調整手段が調整した合成クエリ画像に類似する画像を検索することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
ユーザからの入力を受け付ける入力手段をさらに備え、
上記合成クエリ画像生成手段は、上記入力手段に入力された指示に基づいて、上記オブジェクト検出手段の検出した上記オブジェクトを複数選択し、選択した複数のオブジェクトを合成することを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
ユーザからの入力を受け付ける入力手段をさらに備え、
上記合成クエリ画像調整手段は、上記入力手段に入力された指示に基づいて、上記合成クエリ画像上における上記オブジェクトの位置およびサイズの少なくとも何れかを調整することを特徴とする請求項2に記載の画像処理装置。
【請求項5】
ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定ステップと、
上記クエリ画像からオブジェクトを検出するオブジェクト検出ステップと、
上記オブジェクト検出ステップにおいて検出された上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成する合成クエリ画像生成ステップと、
上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する画像検索ステップとを含むことを特徴とする画像処理方法。
【請求項6】
ユーザからの指定に基づきクエリ画像を特定するクエリ画像特定ステップと、
上記クエリ画像からオブジェクトを検出するオブジェクト検出ステップと、
上記オブジェクト検出ステップにおいて検出された上記オブジェクトを複数合成することで、複数の上記オブジェクトを含む合成クエリ画像を生成する合成クエリ画像生成ステップと、
上記合成クエリ画像に基づいて、上記合成クエリ画像に類似する画像を検索する画像検索ステップとを含む画像処理方法をコンピュータに実行させるための制御プログラム。

【図1】
image rotate

【図4】
image rotate

【図2】
image rotate

【図3】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−190349(P2012−190349A)
【公開日】平成24年10月4日(2012.10.4)
【国際特許分類】
【出願番号】特願2011−54649(P2011−54649)
【出願日】平成23年3月11日(2011.3.11)
【出願人】(000002945)オムロン株式会社 (3,542)
【Fターム(参考)】