説明

注目領域抽出装置およびそれを用いた自動構図決定装置

【構成】 注目領域抽出装置およびそれを用いた自動構図決定装置10は、画像生成装置14を含み、画像生成装置14はカメラ12で撮影した映像からパノラマ画像の現画像を生成する。注目領域抽出装置20は、画像生成装置14から与えられる原画像から注目領域を抽出する。つまり、原画像の物理的特徴に従って人間の主観に合った評価をし、評価した結果に従って注目領域を抽出する。構図切り取り装置22は、抽出した注目領域および隣接する画像領域を、メモリ24に記憶された画家が描いた絵画や写真家が撮影した写真に関するデータを参照して、原画像から切り取る。つまり、絵画画像や写真画像と同じ構図で切り取ることができる。
【効果】 人間の主観に適合した注目領域を抽出することができる。また、バランスの良い構図を自動で決定することができる。

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は注目領域抽出装置およびそれを用いた自動構図決定装置に関し、特に例えば原画像から注目領域を抽出し、抽出した注目領域を画家や写真家などの専門家が制作した絵の構図に適合して収まるように原画像から切り取る、注目領域抽出装置およびそれを用いた自動構図決定装置に関する。
【0002】ここで、注目領域とは、画像や映像において人が注目する領域をいう。
【0003】
【従来の技術】この種の従来技術として、画像から観測者が注目領域を抽出する手法に関しては、種々の方法が提案されている。(1)Milanese,Itti およびKochらは、画像中の不連続部分を注目領域と仮定し、画像から得られる複数の物理的特徴に対応する特徴マップ(濃淡画像)を生成し、次に、各特徴マップの不連続部分を求め、それらを統合したものを注目領域として抽出している。
【0004】(2)Milaneseらは、各特徴マップの不連続部分を大きさが固定された複数のDifference-of-ofiented-Gaussiansフィルタを用いて特徴マップをフィルタリングし、出力が最大となるフィルタリング結果を選択して求めた。Itti,Kochらは各特徴マップを各々の平均値との二乗誤差で正規化し、全ての特徴マップを線形結合により統合した。そして、Difference of Gaussianフィルタにより統合特徴マップを再帰的にフィルタリングし、最終的に得られるフィルタリング結果の局所的なピークを注目領域として抽出していた。
【0005】このように、MilaneseやIttiらは、フィルタリングや弛緩法などの画素レベルの処理により注目領域を抽出していた。
【0006】(3)Martinや竹内らは、画像から得られる輝度情報をシャノンの情報理論に基づいて評価し、その結果得られる情報量の高い部分を注目領域としていた。この方式では輝度値の分散が大きい領域つまり複雑に見える領域や明るい領域が主に抽出される。
【0007】また、従来のカメラでは、人間が被写体および被写体の構図を手動で決定していた。
【0008】
【発明が解決しようとする課題】しかし、(1)や(2)の手法では、画像によって注目領域の大きさが異なるため、大きさが固定されたフィルタを用いて注目領域を的確に抽出するのが困難であった。また、(3)の手法では、たとえば複雑な模様の壁の前に置かれた黒色の花瓶の絵のように、複雑に見える領域、あるいは明るい領域が必ずしも注目領域と一致するとは言えない絵の場合には、注目領域を的確に抽出するのが困難であった。さらに、このような提案では、観測者(人間)の主観と抽出結果との照合を行った例が少なく、実際に人間の主観に適合する注目領域を抽出できるかどうかが疑問であった。
【0009】また、従来のカメラでは写真に対するセンスのない一般の人が構図を決定した場合、必ずしもバランスの良い写真を撮影できるとは限らない。
【0010】それゆえに、この発明の主たる目的は、人間の主観に適合した注目領域を的確に抽出することができる、注目領域抽出装置を提供することである。
【0011】また、この発明の他の目的は、バランスの良い構図を自動で決定することができる、自動構図決定装置を提供することである。
【0012】
【課題を解決するための手段】第1の発明は、原画像から注目領域を抜き出す注目領域抽出装置であって、物理的特徴に基づいて誘目度(目立ち度)を評価する評価手段、および評価手段の評価結果に応じて注目領域を抽出する抽出手段を備える、注目領域抽出装置である。
【0013】第2の発明は、第1の発明に記載の注目領域抽出装置を用いた自動構図決定装置であって、基準構図を有する基準画像に関するデータを保持する保持手段、および基準構図を参照して注目領域の画像を原画像から切り取る切取手段を備える、自動構図決定装置である。
【0014】
【作用】第1の発明の注目領域抽出装置では、評価手段が原画像の物理的特徴に従って誘目度を評価する。ここで、誘目度とは、人間の主観に合ったパラメータをいう。抽出手段は、評価結果から一番目立つ領域を注目領域として抽出する。つまり、評価手段は物理的特徴に従って人間の主観に合った評価をするので、人間の主観に適合した注目領域を抽出することができる。
【0015】たとえば、物理的特徴が色の異質度を含む場合、各領域の色の違いに基づいて誘目度を評価することができる。
【0016】また、物理的特徴が、色の異質度に加えて、形の異質度、面積の異質度およびテクスチャ(模様)の異質度をさらに含むので、この4つの異質度の少なくとも1つの異質度に基づいて誘目度を評価すれば、原画像の特徴に応じて的確に誘目度を評価することができる。
【0017】また、色の3要素(色相、彩度、明度)についても評価する場合であれば、人間の主観による目立つ色(赤色)に近い領域を最も目立つ領域と評価することができる。
【0018】さらに、空間周波数や原画像における各領域の面積についても評価すれば、最も目立つ領域の評価をさらに的確に判断することができる。
【0019】また、撮影手段で所望の映像を撮影し、たとえば撮影した映像に対応する画像を合成し、原画像を生成することもできる。
【0020】たとえば、撮影手段に含まれるカメラの位置および高さを固定し、360°回転して撮影できるようにしておけば、接合手段が1フレーム毎の画像を接合することにより、360°の範囲内でパノラマ画像の原画像を生成することができる。
【0021】第2の発明の自動構図決定装置では、保持手段が、たとえば画家が描いた絵画や写真家が撮影した写真に対応する絵画画像および写真画像を基準画像とし、この基準画像に関するデータを保持する。切取手段は、この基準画像に関するデータを参照して注目領域の画像を原画像から切り取るので、バランスの良い構図を自動で決定することができる。
【0022】また、複数の基準画像に関するデータを保持しておけば、選択手段が注目領域の画像に適した構図を選択できるので、あらゆる画像についてバランスの良い構図を決定することができる。
【0023】上述のような基準画像に関するデータは、少なくとも基準画像に対応する画像データ、被写体の形状データおよび被写体の位置データを含むので、注目領域に適した構図を選択し、バランスの良い構図を自動で決定できる。つまり、あたかも被写体をその構図で撮影したかのような写真を生成することができる。
【0024】
【発明の効果】この発明によれば、人間の主観に合った物理的特徴の評価結果に従って注目領域を抽出するので、人間の主観に適合した注目領域を抽出することができる。
【0025】他の発明によれば、基準画像の基準構図を用いて注目領域を原画像から切り取るので、バランスの良い構図を自動で決定することができる。
【0026】この発明の上述の目的,その他の目的,特徴および利点は、図面を参照して行う以下の実施例の詳細な説明から一層明らかとなろう。
【0027】
【実施例】図1を参照して、この実施例の自動構図決定装置10は、ビデオカメラ(以下、単に「カメラ」という。)12を含む。カメラ12は、たとえば三脚などを用いて撮影位置(位置および高さ)が固定され、360°回転して撮影できる。カメラ12で撮影した映像が画像生成装置14に入力され、撮影した映像から原画像としてのパノラマ画像が生成される。なお、カメラ12は360°回転できるので、画像生成装置14は360°の範囲内でパノラマ画像を生成できる。
【0028】画像生成装置14は、ビデオキャプチャ16および画像接合装置18を含み、図2に示すフロー図に従ってパノラマ画像を生成する。つまり、カメラ12で撮影が開始されると、画像生成装置14は処理を開始し、ステップS1で、ビデオキャプチャ16を用いて最初のビデオフレーム(1フレーム目)をキャプチャし、その1フレーム目に対応する画像から合成画像を生成した後、画像接合装置18を用いてその合成画像からグレースケール画像を生成する。
【0029】続くステップS3では、次のフレームをキャプチャし、1フレーム目と同様にグレースケール画像を生成する。ステップS5では、現フレーム(対象フレーム)に対応する合成画像をどの位置から合成すればよいかを決定するため、図3に示すような対象フレームのグレースケール画像から探索テンプレートを切り出す。この探索テンプレートの幅は50画素であり、その高さはフレーム画像と同じである。また、この探索プレートは、対象フレームの原点から切り出される。
【0030】続いてステップS7では、合成画像のグレースケール画像から探索範囲を設定し、探索範囲から探索テンプレートと同じ大きさの画像を切り出す。つまり、探索範囲の幅は100画素であり、その高さはフレーム画像と同じである。また、フレーム画像の左上を原点((x,y)=(1,1))としたとき、探索プレートのx座標はフレーム画像の幅から100だけ引いた位置であり、そのy座標は1である。
【0031】次に、ステップS9では、探索範囲から探索テンプレートと同じ大きさの画像を切り出し、切り出した画像および探索プレートに対応する互いの画素値の差の絶対値を算出する。続くステップS11では、画素値の差が最小(0)であるかどうかを判断する。ステップS11で“YES”であれば、切り出した画像が探索プレートと同じ大きさであると判断し、ステップS13に進む。一方、ステップS11で“NO”であれば、切り出した画像と探索プレートとの大きさが異なると判断し、ステップS15で探索範囲をx軸の正の方向に1画素ずらしてから、ステップS5に戻る。このように、1画素ずつずらしながら、切り出した画像と探索テンプレートとが同じ大きさになるまで、処理が繰り返される。
【0032】ステップS13では、差の絶対値が最小(0)である時のX座標を算出する。続くステップS17では、算出したX座標で合成画像と対象フレーム画像とを重ね合わせ、新たな合成画像を生成する。そして、ステップS19では生成した合成画像からグレースケール画像を生成し、ステップS21でパノラマ画像が生成されたかどうかを判断する。ステップS21で“NO”であれば、つまりパノラマ画像が生成されてなければ、ステップS3に戻る。一方、ステップS21で“YES”であれば、図4(A)に示すようなパノラマ画像(原画像)が生成されたと判断し、ステップS23で原画像を後段の注目領域抽出装置20(図1)に出力し、処理を終了する。
【0033】図1に戻って、注目領域抽出装置20は、与えられた原画像から最も目立つ領域(注目領域)を抽出する。具体的には、注目領域抽出装置20は、図5に示すフロー図に従って処理をする。つまり、原画像が画像生成装置14から与えられると、注目領域抽出装置20は処理を開始し、ステップS31で原画像を領域分割する。具体的には、図4(B)に示すように、原画像を図領域と絵領域に分割する。この領域分割の方法には、1997IEEEにおいてW.Y.MaやB.S.Manjunath らが「Edge Flow:A Framework of Boundary Detection and Image Segmentation」に記載した“edge flow ”に基づく境界検出方法が適用される。簡単に説明すると、この方法は画像の各場所における色や模様の変化方向を求め、変化方向と変化の強さ(大小)からなるedge flow ベクトルを決定する。そして、反復処理によりedge flow ベクトルを各ベクトルの方向へ伝搬し、最終的ベクトル同士がぶつかり合う場所を各領域の境界線とする。
【0034】したがって、ステップS33では、図4(C)に示すような分割した図領域を抽出し、ステップS35で図領域の誘目度を評価する。つまり、図領域の誘目度パラメータを求める。ここで、発明者が行った主観評価実験により、誘目度の評価に必要な物理的特徴は、色の異質度,テクスチャの異質度,形の異質度および面積の異質度,色,空間周波数および面積であることが分かった。また、一般に人間の主観評価結果と物理的特性との関係はS字曲線で表されることが多いため、誘目度の評価には数1に示すべ一夕関数が用いられる。
【0035】
【数1】


【0036】このベータ関数を用いて、数2に示すような誘目度の評価関数が定義される。
【0037】
【数2】


【0038】また、数2に示す各領域の上記4つの異質度に対する誘目度HETは数3で定義される。
【0039】
【数3】


【0040】さらに、各物理的特徴の異質度Hは、特徴値と全領域の平均特徴値との差をd,差dの平均値をdm,差dの標準偏差をstdとしたとき、数4に従って算出される。
【0041】
【数4】


【0042】つまり、各領域の色の異質度HCは、CIE L* a* b* 知覚均等色空間における色差式を用いて領域の平均色と全領域の平均色との色差、色差平均、色差の標準偏差を算出し、算出した結果を数4に代入して求められる。なお、色差式は、1994「色彩科学ハンドブック」に詳細に記載されている。具体的には、画像の各画素の色情報(R,G,B)を均等知覚色空間L* a* b* に変換し、その空間におけるユークリッド距離を色差としている。つまり、色差式は、数5のように示される。
【0043】
【数5】


【0044】次に、テクスチャの異質度HTについて説明する。テクスチャは、1996IEEEにおいてB.S.Manjunath や W.Y.Ma らが「Texture Features for Browsing and Retrieval of Image Data 」に記載したテクスチャ特徴ベクトルで表現され、またテクスチャ間の差はテクスチャ特徴ベクトル間のユークリッド距離によって表現される。
【0045】ここで、テクスチャ特徴ベクトルは、大きさと方向の異なる複数のガボールフィルタで構成したガボールフィルタバンクにより画像をフィルタリングしたときの応答を要素とするベクトルで表現される。ただし、複数のガボールフィルタによりフィルタリングした場合は、各応答には直交性がないため、フィルタリングした結果には冗長な情報が含まれる可能性がある。そこで、ガボールフイルタバンク内の各フィルタのパラメータは、上述の1996IEEEに記載されている手法によって決定される。具体的には、数6で示されるガボールフィルタのθ、a、σuおよびσvを数7で求める。なお、この手法は、図6に示すように、隣接するフィルタがHalf-Peak で接するようにフィルタのスケール(大きさ)および方位パラメータを定めるものであり、テクスチャ特徴を表現するために、24個のフィルタ(4スケール、6方向)が用いられる。
【0046】
【数6】


【0047】
【数7】


【0048】この数6によって、テクスチャ特徴ベクトルが表現される。したがって、各領域のテクスチャの異質度HTは、全領域の平均ベクトルとの距離、距離の平均値、距離の標準偏差を数4に代入することにより算出される。
【0049】さらに、各領域の面積の異質度HSは、全領域の平均面積との差、差の平均値、差の標準偏差を数4に代入することにより算出される。
【0050】さらにまた、各領域の形の異質度HShは、領域の外形の異質度と、領域が包含する穴の異質度を数8に示すように統合して得られる。
【0051】
【数8】


【0052】ここで、形の違いについては、形状そのものの違いと、図形を回転することによる見え方の違いとの両方を考慮する必要がある。そこで、1984/3「電気通信学会論文誌」において上坂吉則が「開曲線にも適用できる新しいフーリエ記述子」に記載したP型フーリエ記述子を用いて、形状を記述することができる。この場合、P型フーリエ変換後の各周波数に対するパワーを検出すれば、2つの図形の形状が同じときには、パワーが一致する。また、フーリエ記述子を用いれば、形状と回転角が一致するときに限り、フーリエ記述子が一致する。したがって、フーリエ記述子と各周波数に対するパワーとによって、2つの図形の形状と外見とがどの程度一致するかを評価することができる。
【0053】以上から、外形の特徴はフーリエ係数とパワーとからなるベクトルで表現でき、また外形の差は同特徴ベクトル間のユークリッド距離を用いて表現できる。したがって、各領域の外形の異質度HShは、全領域の平均ベクトルとの距離、距離の平均値、距離の標準偏差を数4に代入して算出される。
【0054】次に、穴の異質度Hhoに関して説明する。領域が包含する穴の特徴を表現するためには、穴の形状だけでなく、穴の数および穴の位置も考慮する必要がある。穴の位置の違いは、領域の一次モーメントを求めることで定義できる。なお、一次モーメントは、1992「画像解析ハンドブック」に記載されている。したがって、穴の特徴は、数9に示すようなベクトルで表現した。なお、穴の順番は、画像の原点に近い順にしてある。
【0055】
【数9】


【0056】したがって、各領域の穴の異質度Hhoは、全領域の平均ベクトルとの距離、距離の平均値、距離の標準偏差を数4に代入して算出される。
【0057】また、数2に示す特徴誘目度FPは、数10に示すように定義できる。
【0058】
【数10】


【0059】数10において、まず色の誘目度PCについて説明する。
【0060】従来研究おいて、1)暖色の方が寒色よりも目立つ、2)彩度が高いほうが目立つ、3)明度が高いほうが目立つと報告されている。1)に関しては、神作らが行った実験によって、赤色は背景色に依存せず誘目度の高い色であると報告されている。この結果に基づき、この実施例では、赤色(R,G,B=255,0,0)が最も誘目度の高い色相とし、色相が赤色に近いほど誘目度が高いと仮定する。ここで、色相を上述の1992「画像解析ハンドブック」に詳細に記載されたHSI双六角錐カラーモデルを用いて求めると、赤色(R,G,B=255,0,0)の色相は0である。つまり、HSI双六角錐カラーモデルは、BK(黒)を原点とし、それに対極する点がW(白)とされる。そして、BKとWとを結ぶ直線のほぼ中央であり、かつその直線に直交するようにR(赤),M(マゼンダ),B(青),C(シアン),G(緑)、Y(イエロ)を頂点とする六角形が形成される。このように形成されたHSI双六角錐カラーモデルの色空間が用いられる。なお、色空間とは、知覚色を空間の一点として表示するために用いる直交三次元座標系の空間をいう。つまり、この実施例ではHSI双六角錐カラーモデルを用いて色相を求めるため、色相が0に近いほど色相の誘目度Heが大きくなる。このため、色相の誘目度Heは、数11に示す式によって算出される。
【0061】
【数11】


【0062】また、2)に関しては、彩度と誘目度の間には線形的な関係がある。したがって、この実施例では、彩度の誘目度は、HSI双六角錐カラーモデルにおける彩度そのものを用いることとした。
【0063】さらに、3)に関しては、人間の感覚量と明度との関係に関する研究において、Semmelrothは数12で示す関係が成り立つことを示した。なお、数12に示す関係は、1996「新編 感覚・知覚 心理学ハンドブック」において、大山,今井,和気らによって示される。
【0064】
【数12】


【0065】また、数12において、k=0.65,m=0.4,n=0.2の場合に、人間の感覚量とよく合うことが示された。したがって、この実施例では、Semmelrothによって示された式を明度の誘目度とした。
【0066】上述のような色の3要素(色相、彩度、明度)に対する誘目度を数13を用いて線形結合し、色の誘目度PCが定義される。
【0067】
【数13】


【0068】次に、テクスチャ(空間周波数)の誘目度PTについて説明する。
【0069】人間の視覚系においては、特定の空間周波数で感度が最大となるような帯域通過器の性質を持つことが明らかにされている。これまで、久保田や西澤らは、視覚の空間周波数特性を数14のように定式化している。なお、空間周波数特性の式は、1986/5「電気通信学会論文誌」において、久保田らによって「テレビジョン系の3次元雑音評価関数とその高品位テレビへの応用」に記載されている。なお、数14では、空間周波数の単位をcpd(視覚1°あたりのサイクル数)に変換してある。
【0070】
【数14】


【0071】この数14に示す視覚反応Vによって、テクスチャ(空間周波数)の誘目度PTが定義される。
【0072】続いて、面積の誘目度PSについて説明する。
【0073】一般に画像が提示された直後は、画像の中心から近いオブジェクトの方が目立つと言われており、また、注視点が移動されると、移動した注視点に近いオブジェクトの方が誘目度が高くなると言われている。これを、場の誘目度と定義する。このように、ある点(注視点)を中心とし、その点から遠ざかる毎に各点の誘目度が徐々に小さくなることをモデル化するために、数15に示す2次元ガウス関数が用いられる。ただし、注視点が移動した時間に応じてガウス関数の中心が変化すると仮定してある。
【0074】
【数15】


【0075】ここで、ガウス関数の広がり係数σは視点から画像までの距離dに依存する。つまり、距離dが大きくなれば、一度に観測可能な範囲が広くなる。一般に、人間の可視視野は20度〜30度である。そこで、提示される画像の画面高をHとし、視距離をd・Hとしたときの広がり係数σを数16のように定義することができる。なお、Pixは垂直方向の画素数であり、θは20度〜30度(0.176<tan θ/2<0.268)である。
【0076】
【数16】


【0077】ここで、領域が画素の集合であることを考慮すれば、領域の面積の誘目度PSは、領域の画素の場の誘目度の和で表現可能である。したがって、面積の誘目度PSは数17のように定義される。
【0078】
【数17】


【0079】このように、定義した誘目度の評価関数により、ステップS37で各図領域の誘目度を評価し、ステップS39で誘目度が最大となる図領域を求める。つまり、最も目立つ領域を注目領域に決定する。したがって、図4(D)に示すような注目領域を抽出することができる。
【0080】なお、この実施例では、誘目度の評価関数の各係数は、[wh1,wh2,wh3,wh4]=[0.039,0.010,0.027,0.020],[wf1,wf2,wf3]=[0.132,0.005,0.100],[m,n]=[1.358,4.250]を用い、数14のθを20度とし、また視距離dを1mとし,P型フーリエ係数を第10次までとした。
【0081】また、この実施例では、上記8つの物理的特徴を用いて誘目度を評価するようにしたが、これはあらゆる特徴を有する複数の画像に適合させるためであり、全ての物理的特徴について必ずしも評価する必要はない。
【0082】続いてステップS41では、決定した注目領域に隣接する図領域を求め、注目領域と隣接図領域との色差およびテクスチャ特徴ベクトルのユークリッド距離を求め、色差が2.0以内であり、かつテクスチャ特徴ベクトルのユークリッド距離が0.3以内であるものを注目領域とともに抽出して、処理を終了する。なお、色差は、上述したように、数5に示すようなCIE L* a* b* 知覚均等色空間における色差式により求められる。また、テクスチャ特徴ベクトルは、数6に従って求められる。
【0083】図1に戻って、注目領域抽出装置20で抽出された注目領域は、構図切り取り装置22に与えられる。構図切り取り装置22にはメモリ24が接続され、メモリ24には画家が描いた絵や写真家が撮影した写真に関する複数のデータが記憶されている。構図切り取り装置22は、メモリ24に記憶されたデータを参照して、画家や写真家の構図に合わせて原画像から注目領域を切り取る。具体的には、構図切り取り装置22は、図7に示すフロー図に従って注目領域を切り取る。つまり、注目領域抽出装置20で注目領域および隣接する図領域が抽出されると構図切り取り装置22は処理を開始し、ステップS51で、注目領域の外周画素を求める。つまり、抽出した注目領域の縁を求める。続くステップS53では、上述の上坂が記載した論文の手法により、第10次までのP型フーリエ係数を求め、注目領域を形状ベクトルにする。
【0084】ここで、メモリ24に記憶されたデータは、絵画画像や写真画像などの基準画像に対応する画像データ、その絵画画像や写真画像から被写体を抽出してP型フーリエ係数により被写体の外周形状を記述した形状ベクトルのデータ、および図8に示すような被写体の位置情報に対応する位置データである。つまり、被写体の位置データは、基準画像の基準構図のデータであり、被写体を囲む外接矩形の横の辺の長さをa、縦の辺の長さをb、外接矩形の原点(画像左上の頂点に最も近い頂点)の位置を(w1,h1)、外接矩形の終点(画像右下の頂点に最も近い頂点)の位置(画像右下の頂点を基準とした位置)を(w2,h2)とした場合に、数18のようなベクトルで表される。
【0085】
【数18】位置データ[kx1,ky1,kx2,ky2]=[w1/a,h1/b,w2/a,h2/b]
続いて、ステップS55でステップS53で求めた形状ベクトルとメモリ24に格納された絵画画像や写真画像の形状ベクトルとのユーグリッド距離を求め、つまり基準構図のデータとのマッチングを実行し、ステップS57で領域の形状が最も類似したデータを取得する。言い換えると、最もユークリッド距離が小さい絵画画像の被写体の位置データを取得する。つまり、複数の画像データから注目領域および隣接する図領域に最適な画像データが選択される。そして、ステップS59で、注目領域の外接矩形を求め、外接矩形の原点と終点から数19に従って原画像の一部を切り取る。なお、数19では、*は乗算を意味する。
【0086】
【数19】X1=x1−W*kx1Y1=y1−H*ky1X2=x2+W*kx2Y2=y2+W*ky2ただし、注目領域の外接矩形の幅をW、高さをH、外接矩形の原点を(x1,y1)、終点を(x2,y2)とする。また、X1<1のときX1=1,Y1<1のときY1=1,X2>原画像の幅のときX2=原画像の幅,Y2>原画像の高さのときY2=原画像の高さとする。このとき、切り取る矩形(画像)の頂点座標は数20のように示される。
【0087】
【数20】切り取る画像の頂点座標=[(X1,Y1),(X1,Y2),(X2,Y1),(X2,Y2)]
続いて、ステップS61で切り取った結果(画像)を出力して、処理を終了する。
【0088】したがって、図9(A)に示すような絵画画像の構図に合わせて、図9(B)に示すような注目領域および隣接する図領域を切り取ることができる。
【0089】この実施例によれば、上述したような物理的特徴に従って原画像から最も目立つ領域(注目領域)を抽出するので、人間の主観に適合した注目領域を抽出することができる。
【0090】また、抽出した注目領域を画家が描いた絵画や写真家が撮影した写真の構図に合わせて切り取るので、被写体をあたかもその構図で撮影したかのような写真を生成することができる。つまり、バランスのよい構図を自動で決定することができる。
【0091】なお、この注目領域抽出装置は画像領域の誘目度を人間の主観に適合して求めることができるので、たとえば、ディジタル圧縮画像・映像の品質評価において、評価対象となる画像や映像の各領域の目立ち度(誘目度)に応じて、その領域に重みづけを行うような客観的な評価を実行するような装置に適用することができる。
【0092】また、印刷分野では、品質管理の自動化において、印刷ずれ等の問題を軽視できる領域とそうでない領域とを誘目度に応じて自動で判断できる装置に適用することができる。
【0093】さらに、デザイン分野、特に広告に使用するポスター制作等においては、企業が最も訴えたい部分が目立っているのか否かを客観的に評価する装置に適用することができる。
【0094】また、ユーザが目立つ服装である場合には、注目領域抽出装置を用いてカメラの回転,チルトおよびズームを制御すれば、カメラが自動でユーザを追うことができる。したがって、たとえば所定のタイミングでシャッタを切るようにすれば、ユーザのスナップ写真を撮ることができる。さらに、撮影した画像(原画像)から構図決定装置を用いて自動で構図を決定することにより、バランスの良いユーザのスナップ写真を作成することができる。
【図面の簡単な説明】
【図1】この発明の一実施例を示す図解図である。
【図2】図1実施例に示す画像生成装置の処理の一部を示すフロー図である。
【図3】図1実施例の画像接合装置で原画像を合成する方法を示す図解図である。
【図4】図1実施例に示す注目領域抽出装置の処理の一部を示すフロー図である。
【図5】図4に示すフロー図に従って注目領域を抽出する方法を示す図解図である。
【図6】ガボールフィルタを示す図解図である。
【図7】図1実施例に示す構図切り取り装置の処理の一部を示すフロー図である。
【図8】図7に示すフロー図に従って画像を切り取る場合の位置情報を示す図解図である。
【図9】図7に示すフロー図に従って画像を切り取る場合に参照する画家の絵画画像および参照して切り取った画像を示す図解図である。
【符号の説明】
10 …注目領域抽出装置を用いた自動構図決定装置
12 …カメラ
14 …画像生成装置
16 …ビデオキャプチャ
18 …画像接合装置
20 …注目度抽出装置
22 …構図切り取り装置
24 …メモリ

【特許請求の範囲】
【請求項1】原画像から注目領域を抜き出す注目領域抽出装置であって、物理的特徴に基づいて誘目度を評価する評価手段、および前記評価手段の評価結果に応じて前記注目領域を抽出する抽出手段を備える、注目領域抽出装置。
【請求項2】前記物理的特徴は色の異質度を含む、請求項1記載の注目領域抽出装置。
【請求項3】前記物理的特徴は形の異質度、面積の異質度およびテクスチャの異質度をさらに含み、前記評価手段は、4つの異質度のうち少なくとも1つの異質度に基づいて前記誘目度を評価する、請求項2記載の注目領域抽出装置。
【請求項4】前記物理的特徴は色をさらに含む、請求項1ないし3のいずれかに記載の注目領域抽出装置。
【請求項5】前記物理的特徴は前記原画像における領域の面積および空間周波数をさらに含む、請求項4記載の注目領域抽出装置。
【請求項6】所望の映像を撮影する撮影手段、および前記映像に基づいて前記原画像を生成する画像生成手段をさらに備える、請求項1ないし5のいずれかに記載の注目領域抽出装置。
【請求項7】前記撮影手段はカメラ、および前記カメラを回転駆動する駆動手段を含み、前記画像生成手段は前記カメラで撮影される前記映像を1フレーム毎に接合する接合手段を含む、請求項6記載の注目領域抽出装置。
【請求項8】請求項1ないし7のいずれかに記載の注目領域抽出装置を用いた自動構図決定装置であって、基準構図を有する基準画像に関するデータを保持する保持手段、および前記基準構図を参照して注目領域の画像を原画像から切り取る切取手段を備える、自動構図決定装置。
【請求項9】前記保持手段は複数の前記基準画像に関するデータを保持し、前記注目領域の画像に適合した前記データを選択する選択手段をさらに備える、請求項8記載の自動構図決定装置。
【請求項10】前記データは、少なくとも前記基準画像に対応する画像データ、被写体の形状データおよび被写体の位置データを含む、請求項8または9記載の自動構図決定装置。

【図1】
image rotate


【図3】
image rotate


【図4】
image rotate


【図6】
image rotate


【図8】
image rotate


【図2】
image rotate


【図9】
image rotate


【図5】
image rotate


【図7】
image rotate


【公開番号】特開2001−126070(P2001−126070A)
【公開日】平成13年5月11日(2001.5.11)
【国際特許分類】
【出願番号】特願平11−306884
【出願日】平成11年10月28日(1999.10.28)
【出願人】(595147700)株式会社エイ・ティ・アール知能映像通信研究所 (3)
【Fターム(参考)】