説明

画像処理装置および方法、並びにプログラム

【課題】より細かなシーン判定を行う。
【解決手段】周波数情報抽出部32は、入力画像の周波数情報を抽出し、色情報抽出部34は、入力画像の色情報を抽出し、特徴量算出部36は、周波数情報抽出部32によって抽出された周波数情報と、色情報抽出部34によって抽出された色情報とに基づいて、入力画像の特徴量を算出し、シーン判定部37は、特徴量算出部36によって算出された特徴量から、入力画像のシーンを判定する。本発明は、撮影シーンを判定する画像処理装置に適用することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置および方法、並びにプログラムに関し、特に、より細かなシーン判定を行うことができるようにする画像処理装置および方法、並びにプログラムに関する。
【背景技術】
【0002】
デジタルカメラ等の撮像装置によって撮影された画像データに対して、データ解析を行い、解析結果に基づいて、その撮影場面(撮影シーン)を判定する技術が知られている。
【0003】
しかしながら、画像データの周波数情報(輝度信号)のみに基づいて撮影シーンを判定した場合、画像データにおける色までは判定することができなかった。
【0004】
そこで、例えば、画像データを特徴付ける色相である特徴的色相を決定することで、撮影シーンを判定することが提案されている(例えば、特許文献1参照)。
【0005】
【特許文献1】特開2008−154261号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、撮影シーンが風景であった場合、その風景を特徴付ける色相は1つに限らない。特に、同じ風景であっても、異なる季節の風景の画像であれば、それぞれの画像を特徴付ける色相は多色にわたり、特許文献1の手法では、細かなシーン判定を行うことができない恐れがある。
【0007】
本発明は、このような状況に鑑みてなされたものであり、より細かなシーン判定を行うことができるようにするものである。
【課題を解決するための手段】
【0008】
本発明の一側面の画像処理装置は、入力画像の周波数情報を抽出する周波数情報抽出手段と、前記入力画像の色情報を抽出する色情報抽出手段と、周波数情報抽出手段によって抽出された前記周波数情報と、前記色情報抽出手段によって抽出された前記色情報とに基づいて、前記入力画像の特徴量を算出する特徴量算出手段と、前記特徴量算出手段によって算出された前記特徴量から、前記入力画像のシーンを判定するシーン判定手段とを備える。
【0009】
前記画像処理装置には、前記入力画像をブロックに分割する分割手段をさらに設け、前記周波数情報抽出手段には、前記ブロック毎に前記入力画像の周波数情報を抽出させ、前記色情報抽出手段には、前記ブロック毎に前記入力画像の色情報を抽出させることができる。
【0010】
前記画像処理装置には、前記周波数情報抽出手段によって抽出された前記周波数情報の、前記ブロック毎の積算値が、所定の閾値以上である前記ブロックに対して、重みを設定する重み設定手段をさらに設け、前記特徴量算出手段には、前記周波数情報と、前記重み設定手段によって重みが設定された前記ブロックの前記色情報とに基づいて、前記入力画像の特徴量を算出させることができる。
【0011】
前記画像処理装置には、前記ブロック毎の前記入力画像において、エッジ領域を検出するエッジ領域検出手段をさらに設け、前記重み設定手段には、前記エッジ領域を除いた前記ブロック毎の前記周波数情報の積算値が、所定の閾値以上である前記ブロックに対して、重みを設定させることができる。
【0012】
前記画像処理装置には、前記入力画像の各画素の彩度を算出する彩度算出手段と、前記彩度算出手段によって抽出された前記彩度の、前記ブロック毎の積算値が、所定の閾値以上である前記ブロックに対して、重みを設定する重み設定手段をさらに設け、前記特徴量算出手段には、前記周波数情報と、前記重み設定手段によって重みが設定された前記ブロックの前記色情報とに基づいて、前記入力画像の特徴量を算出させることができる。
【0013】
前記画像処理装置には、前記入力画像の前記色情報に基づいて、前記ブロック毎の最頻色を表す最頻色情報を設定する最頻色設定手段をさらに設け、前記特徴量算出手段には、前記周波数情報と、前記最頻色設定手段によって設定された前記ブロック毎の前記最頻色情報とに基づいて、前記入力画像の特徴量を算出させることができる。
【0014】
本発明の一側面の画像処理方法は、入力画像の周波数情報を抽出する周波数情報抽出ステップと、前記入力画像の色情報を抽出する色情報抽出ステップと、周波数情報抽出ステップにおいて抽出された前記周波数情報と、前記色情報抽出ステップにおいて抽出された前記色情報とに基づいて、前記入力画像の特徴量を算出する特徴量算出ステップと、前記特徴量算出ステップによって算出された前記特徴量から、前記入力画像のシーンを判定するシーン判定ステップとを含む。
【0015】
本発明の一側面のプログラムは、入力画像の周波数情報を抽出する周波数情報抽出ステップと、前記入力画像の色情報を抽出する色情報抽出ステップと、周波数情報抽出ステップにおいて抽出された前記周波数情報と、前記色情報抽出ステップにおいて抽出された前記色情報とに基づいて、前記入力画像の特徴量を算出する特徴量算出ステップと、前記特徴量算出ステップによって算出された前記特徴量から、前記入力画像のシーンを判定するシーン判定ステップとを含む処理をコンピュータに実行させる。
【0016】
本発明の一側面においては、入力画像の周波数情報が抽出され、入力画像の色情報が抽出され、抽出された周波数情報と色情報とに基づいて、入力画像の特徴量が算出され、算出された特徴量から、入力画像のシーンが判定される。
【発明の効果】
【0017】
本発明の一側面によれば、より細かなシーン判定を行うことが可能となる。
【発明を実施するための最良の形態】
【0018】
以下、本発明の実施の形態について図を参照して説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態
2.第2の実施の形態
3.第3の実施の形態
【0019】
<1.第1の実施の形態>
[画像処理装置の構成例]
図1は、本発明を適用した画像処理装置の一実施の形態の機能構成例を示している。
【0020】
図1の画像処理装置11は、例えば、デジタルカメラ等の撮像装置から入力された入力画像の特徴量を算出し、その特徴量に基づいて、その入力画像のシーンを判定し、判定結果を、他の画像処理装置に出力する。他の画像処理装置は、その判定結果に基づいて、複数の画像の自動分類を行ったり、画質の自動調整を行ったりする。
【0021】
画像処理装置11は、分割部31、周波数情報抽出部32、エッジ領域検出部33、色情報抽出部34、色情報重要度設定部35、特徴量算出部36、およびシーン判定部37から構成される。
【0022】
分割部31は、入力された入力画像を所定の大きさのブロックに分割し、周波数情報抽出部32、エッジ領域検出部33、および色情報抽出部34に供給する。
【0023】
周波数情報抽出部32は、分割部31から供給されたブロック毎に、所定のフィルタを用いて空間周波数の周波数成分を表す周波数情報を抽出し、色情報重要度設定部35および特徴量算出部36に供給する。
【0024】
エッジ領域検出部33は、分割部31から供給されたブロック毎に、所定のフィルタを用いてエッジ領域を検出し、そのエッジ領域を表すエッジ領域情報を、色情報重要度設定部35に供給する。
【0025】
色情報抽出部34は、分割部31から供給されたブロック毎に、色情報を抽出し、特徴量算出部36に供給する。より具体的には、色情報抽出部34は、各ブロックを構成する各画素について、以下の式(1)に従ってRGB(Red Green Blue)色空間で表現される画素値をHSV(Hue,Saturation,Brightness)色空間で表現される画素値に変換して得られる色相Hueを抽出する。
【0026】
【数1】

【0027】
式(1)において、MAXは、R,G,B各値のうちの最大値であり、MINは、R,G,B各値のうちの最小値である。また、MAX-MIN=0であるときは、Hue=0とする。さらに、Hue<0またはHue≧360であるときは、Hue mod 360(Hueを360で除算した結果得られる剰余)の値をHueとする。
【0028】
色情報重要度設定部35は、周波数情報抽出部32からの周波数情報、および、エッジ領域検出部33からのエッジ領域情報に基づいて、色情報抽出部34において抽出されたブロック毎の色情報に対する色情報重要度(重み)を設定する。色情報重要度設定部35は、設定したブロック毎の色情報重要度を、特徴量算出部36に供給する。
【0029】
色情報重要度設定部35は、積算部35a、閾値判定部35b、および設定部35cを備えている。
【0030】
積算部35aは、エッジ領域検出部33からのエッジ領域情報で表されるエッジ領域を除いたブロックの領域について、周波数情報抽出部32からの周波数情報に基づいて、周波数出力の振幅に対応する特性値を積算する。
【0031】
閾値判定部35bは、注目ブロック内の特性値の積算値が、所定の閾値以上であるか否かを判定する。
【0032】
設定部35cは、閾値判定部35bの判定結果に応じて、色情報重要度を設定する。
【0033】
特徴量算出部36は、ブロック毎の、周波数情報抽出部32からの周波数情報、色情報抽出部34からの色情報、および、色情報重要度設定部35からの色情報重要度に基づいて、入力画像の特徴量を算出し、シーン判定部37に供給する。
【0034】
シーン判定部37は、特徴量算出部36からの特徴量を基に、入力画像のシーンを判定し、その判定結果を、他の画像処理装置に出力する。
【0035】
[画像処理装置のシーン判定処理]
次に、図2のフローチャートを参照して、図1の画像処理装置11のシーン判定処理について説明する。
【0036】
ステップS11において、分割部31は、入力された入力画像を所定の大きさのブロックに分割し、周波数情報抽出部32、エッジ領域検出部33、および色情報抽出部34に供給する。例えば、分割部31は、図3の左側に示される、平原を撮影した入力画像を、図3の右側に示されるような、16個(=4×4)のブロックに分割する。なお、図3においては、各ブロックは、互いに重なることなく、同一形状、同一画素数で分割されているが、これに限らず、ブロック同士が重なっていたり、各ブロックの形状や画素数が同一でなくてもよい。分割されるブロック数についても、16個に限るものではなく、その他の数のブロック数に分割するようにしてもよい。
【0037】
ステップS12において、周波数情報抽出部32は、分割部31から供給されたブロック毎に、所定のフィルタを用いて空間周波数の周波数成分を表す周波数情報を抽出し、色情報重要度設定部35および特徴量算出部36に供給する。より具体的には、周波数情報抽出部32は、ブロック毎の画素に対してフーリエ変換を用いて周波数領域に変換し、例えば、図4に示されるような周波数振幅特性を有するGaborフィルタを用いて周波数情報を抽出する。ここでは、図4に示されるフーリエ空間上で、8種類の方向と、4種類のスケール(周波数領域)を採用した32個のガボアフィルタにより、32次元の周波数情報が得られる。さらに、周波数情報抽出部32は、周波数領域に変換されたブロック毎に、各周波数帯域についての周波数逆変換を施し、画素空間に変換する。なお、周波数情報の抽出においては、上述のGaborフィルタに限らず、例えば、BPF(Band Pass Filter)を用いるようにしてもよい。
【0038】
ステップS13において、エッジ領域検出部33は、分割部31から供給されたブロック毎に、Laplacianフィルタを用いてエッジ領域を検出し、そのエッジ領域を表すエッジ領域情報を、色情報重要度設定部35に供給する。より具体的には、エッジ領域検出部33は、Laplacianフィルタの出力に対して、各ブロックの画素毎に、その大きさと空間的な連続性を評価し、各画素が、エッジ領域の画素であるか否かを判定することで、エッジ領域を検出する。なお、エッジ領域の検出に用いられるフィルタは、Laplacianフィルタに限らず、例えば、SobelフィルタやPrewittフィルタを用いるようにしてもよい。
【0039】
ステップS14において、色情報抽出部34は、分割部31から供給されたブロック毎に、色情報を抽出し、特徴量算出部36に供給する。より具体的には、色情報抽出部34は、各ブロックを構成する各画素について、RGB色空間で表現される画素値をHSV色空間で表現される画素値に変換して得られる色相Hueを抽出する。なお、ここでは、色情報として、色相Hueを抽出しているが、これに限らず、RGB値をそのまま色情報として用いるようにしてもよい。
【0040】
ステップS15において、色情報重要度設定部35は、周波数情報抽出部32からの周波数情報、および、エッジ領域検出部33からのエッジ領域情報に基づいて、ブロック毎の色情報に対する色情報重要度を設定する、色情報重要度設定処理を行う。
【0041】
[色情報重要度設定部の色情報重要度設定処理]
ここで、図5のフローチャートを参照して、図2のフローチャートのステップS15における色情報重要度設定処理について説明する。
【0042】
ステップS31において、色情報重要度設定部35の積算部35aは、エッジ領域検出部33からのエッジ領域情報で表されるエッジ領域を除いたブロック(以下、注目ブロックともいう)の領域について、周波数情報抽出部32からの周波数情報に基づいて、周波数出力の振幅に対応する特性値を積算する。
【0043】
ステップS32において、閾値判定部35bは、注目ブロック内の特性値の積算値が、所定の閾値TH_sum以上であるか否かを判定する。
【0044】
ステップS32において、特性値の積算値が、所定の閾値TH_sum以上であると判定された場合、ステップS33において、設定部35cは、図6に示されるように、注目ブロックの色情報重要度として1を設定し、処理は、ステップS35に進む。
【0045】
図6は、周波数出力の振幅の特性値の積算値(振幅積算値)に対する色情報重要度の値の変化を示している。
【0046】
図6によれば、振幅積算値が、所定の閾値TH_sum以上であるとき、色情報重要度は1となり、所定の閾値TH_sum以上でないとき、色情報重要度は0となる。
【0047】
一方、ステップS33において、特性値の積算値(振幅積算値)が、所定の閾値TH_sum以上でないと判定された場合、ステップS33において、設定部35cは、図6に示されるように、注目ブロックの色情報重要度として0を設定し、処理は、ステップS35に進む。
【0048】
ステップS35において、設定部35cは、全てのブロックについて色情報重要度を設定したか否かを判定する。
【0049】
ステップS35において、全てのブロックについて色情報重要度を設定していないと判定された場合、処理は、ステップS31に戻り、全てのブロックについて色情報重要度を設定するまで、ステップS31乃至S35の処理が繰り返される。
【0050】
一方、ステップS35において、全てのブロックについて色情報重要度を設定したと判定された場合、処理は、図2のフローチャートのステップS15に戻る。
【0051】
このようにして、1個のブロックに対して、1つの色情報重要度が設定される。
【0052】
以上の処理によれば、エッジ領域を除いた、いわゆるテクスチャ領域の総量が、所定の値より多いブロックのみに対して、重みを設定することができる。
【0053】
なお、以上においては、色情報重要度は、閾値TH_sumによる2値としたが、周波数情報に関する特性値の積算値に応じて、0乃至1の間の値を連続的にとる連続値であってもよい。
【0054】
また、閾値処理において、周波数出力の振幅に対応する特性値に対してノイズ除去を行った後に算出した積算値を用いるようにしてもよいし、注目ブロックにおいて、最大となる特性値を用いるようにしてもよい。
【0055】
図2のフローチャートに戻り、ステップS16において、特徴量算出部36は、ブロック毎の、周波数情報抽出部32からの周波数情報、色情報抽出部34からの色情報、および、色情報重要度設定部35からの色情報重要度に基づいて、入力画像の特徴量を算出し、シーン判定部37に供給する。
【0056】
より具体的には、特徴量算出部36は、周波数情報に基づいて、ブロック毎の周波数出力の振幅に対応する特性値を積算する。これにより、周波数情報についての特徴量として、16(ブロック数)×8(周波数方向)×4(周波数領域)=512次元のベクトルが得られる。
【0057】
また、特徴量算出部36は、色情報に基づいて、ブロック毎の色情報を積算し、その積算値と、ブロック毎に設定された色情報重要度とを乗算する。これにより、色情報についての特徴量として、16(ブロック数)×1(色情報積算値)=16次元のベクトルが得られる。なお、色情報重要度が0であるブロックの色情報は0として扱われる。
【0058】
このようにして、特徴量算出部36は、周波数情報および色情報から、512(次元)+16(次元)=528(次元)のベクトルを特徴量として算出する。
【0059】
ステップS17において、シーン判定部37は、特徴量算出部36からの特徴量(ベクトル)に応じて、入力画像のシーンを判定し、その判定結果を、他の画像処理装置に出力する。より具体的には、シーン判定部37は、予め設定した学習用画像と、例えば、SVM(Support Vector Machines)等の機械学習とを用いてシーン判定を行う。
【0060】
SVMにおいては、2クラス判定(1対1の判定)が行われ、例えば、「平原・夏」のクラスとそれ以外のクラス、「平原・冬」のクラスとそれ以外のクラス、・・・のように判定され、それぞれのスコアが比較され、最もスコアの高いクラスが、判定結果とされる。
【0061】
なお、シーン判定部37は、SVMを用いることとしたが、これに限らず、例えば、ニューラルネットワークを用いたパターン認識や、パターンマッチング等によるパターン認識を用いるようにしてもよい。
【0062】
以上の処理によれば、周波数情報と、周波数出力の振幅の大きいブロックの色情報とに基づいた特徴量が算出される。すなわち、例えば、図7で示されるような、葉の生い茂った並木道や、図8に示されるような、一面に花が咲き誇った花畑等の、高周波数成分の領域(高周波領域)を含む風景の画像に対して、その高周波領域の色情報に重みを設定した特徴量を得ることができる。結果として、図7において高周波領域である並木の色が、緑色であるか黄色であるかを判定することができ、例えば、そのシーンが、単に「並木道」ではなく、「夏の並木道」であるか、または「秋の並木道」であるかを判定することができる。また、図8において高周波領域である花畑の色が、白色であるか黄色であるかを判定することができ、そのシーンが、単に「花畑」ではなく、「秋の花畑」であるか「夏の花畑」であるかを判定することができる。
【0063】
このように、同じような風景に対して、色によって季節を判定することができるので、より細かなシーン判定を行うことが可能となる。
【0064】
以上においては、入力画像において、高周波数成分の領域の色に対して重みを設定する構成について説明してきたが、入力画像において、高彩度の領域の色に対して重みを設定するようにしてもよい。
【0065】
<2.第2の実施の形態>
[画像処理装置の構成例]
図9は、入力画像において、高彩度の領域の色に対して重みを設定するようにした画像処理装置の構成例を示している。なお、図9の画像処理装置111において、図1の画像処理装置11に設けられたものと同様の機能を備える構成については、同一名称および同一符号を付するものとし、その説明は、適宜省略するものとする。
【0066】
すなわち、図9の画像処理装置111において、図1の画像処理装置11と異なるのは、エッジ領域検出部33および色情報重要度設定部35に代えて、彩度算出部131および色情報重要度設定部132を設けた点である。
【0067】
なお、図9において、周波数情報抽出部32は、分割部31から供給されたブロック毎に、所定のフィルタを用いて空間周波数の周波数成分を表す周波数情報を抽出し、特徴量算出部36のみに供給する。
【0068】
彩度算出部131は、分割部31から供給されたブロック毎に、彩度を算出し、色情報重要度設定部132に供給する。より具体的には、彩度算出部131は、各ブロックを構成する各画素について、以下の式(2)に従って得られる彩度Saturationを算出する。
【0069】
【数2】

【0070】
式(2)において、MAXは、R,G,B各値のうちの最大値であり、MINは、R,G,B各値のうちの最小値である。また、MAX=0であるときは、Saturation=0とする。
【0071】
色情報重要度設定部132は、彩度算出部131からの彩度に基づいて、色情報抽出部34において抽出されたブロック毎の色情報に対する色情報重要度(重み)を設定する。色情報重要度設定部132は、設定したブロック毎の色情報重要度を、特徴量算出部36に供給する。
【0072】
色情報重要度設定部132は、積算部132a、閾値判定部132b、および設定部132cを備えている。
【0073】
積算部132aは、注目ブロック内の各画素について算出された彩度を積算する。
【0074】
閾値判定部132bは、注目ブロック内の彩度の積算値が、所定の閾値以上であるか否かを判定する。
【0075】
設定部132cは、閾値判定部132bの判定結果に応じて、色情報重要度を設定する。
【0076】
[画像処理装置のシーン判定処理]
次に、図10のフローチャートを参照して、図9の画像処理装置111のシーン判定処理について説明する。なお、図10のフローチャートにおけるステップS111,S112,S114,S116,S117の処理は、図2のフローチャートを参照して説明したステップS11,S12,S14,S16,S17の処理と同様であるので、その説明は省略するものとする。
【0077】
すなわち、ステップS113において、彩度算出部131は、分割部31から供給されたブロック毎に、彩度を算出し、色情報重要度設定部132に供給する。
【0078】
ステップS115において、色情報重要度設定部132は、彩度算出部131からの彩度に基づいて、ブロック毎の色情報に対する色情報重要度を設定する、色情報重要度設定処理を行う。
【0079】
[色情報重要度設定部の色情報重要度設定処理]
ここで、図11のフローチャートを参照して、図10のフローチャートのステップS115における色情報重要度設定処理について説明する。
【0080】
ステップS131において、色情報重要度設定部132の積算部132aは、注目ブロック内の各画素について算出された彩度を積算する。
【0081】
ステップS132において、閾値判定部132bは、注目ブロック内の彩度の積算値が、所定の閾値TH_sat以上であるか否かを判定する。
【0082】
ステップS132において、彩度の積算値が、所定の閾値TH_sat以上であると判定された場合、ステップS133において、設定部132cは、図12に示されるように、注目ブロックの色情報重要度として1を設定し、処理は、ステップS135に進む。
【0083】
図12は、彩度の積算値(Saturation積算値)に対する色情報重要度の値の変化を示している。
【0084】
図12によれば、Saturation積算値が、所定の閾値TH_sat以上であるとき、色情報重要度は1となり、所定の閾値TH_sat以上でないとき、色情報重要度は0となる。
【0085】
一方、ステップS133において、彩度の積算値(Saturation積算値)が、所定の閾値TH_sat以上でないと判定された場合、ステップS134において、設定部132cは、図12に示されるように、注目ブロックの色情報重要度として0を設定し、処理は、ステップS135に進む。
【0086】
ステップS135において、設定部132cは、全てのブロックについて色情報重要度を設定したか否かを判定する。
【0087】
ステップS135において、全てのブロックについて色情報重要度を設定していないと判定された場合、処理は、ステップS131に戻り、全てのブロックについて色情報重要度を設定するまで、ステップS131乃至S135の処理が繰り返される。
【0088】
一方、ステップS135において、全てのブロックについて色情報重要度を設定したと判定された場合、処理は、図10のフローチャートのステップS115に戻る。
【0089】
このようにして、1個のブロックに対して、1つの色情報重要度が設定される。
【0090】
以上の処理によれば、彩度が平均的に高いブロックのみに対して、重みを設定することができる。
【0091】
なお、以上においては、色情報重要度は、閾値TH_satによる2値としたが、彩度の積算値に応じて、0乃至1の間の値を連続的にとる連続値であってもよい。
【0092】
また、閾値処理において、注目ブロックにおいて、最大となる彩度を用いるようにしてもよい。
【0093】
以上の処理によれば、周波数情報と、彩度の高いブロックの色情報とに基づいた特徴量が算出される。すなわち、例えば、図13で示されるような、マクロ撮影された花や、図14に示されるような、野菜の一例としてのパプリカ等の、鮮やかな色を持つ被写体の画像に対して、彩度の高い領域の色情報に重みを設定した特徴量を得ることができる。結果として、図13において花びらの色が、紫色であるか黄色であるかを判定することができ、例えば、そのシーン(被写体)が、単に「花」ではなく、「紫色の花」であるか、または「黄色の花」であるかを判定することができる。また、図14においてパプリカの色が、赤色であるか黄色であるかを判定することができ、そのシーン(被写体)が、単に「野菜」ではなく、「赤色の野菜」であるか「黄色の野菜」であるかを判定することができる。
【0094】
このように、同じような形状の物体(被写体)に対して、色を判定することができるので、より細かなシーン判定を行うことが可能となる。
【0095】
以上においては、入力画像において、高彩度の領域の色に対して重みを設定して特徴量を算出する構成について説明してきたが、入力画像において、出現頻度の高い色に基づいて特徴量を算出するようにしてもよい。
【0096】
<3.第3の実施の形態>
[画像処理装置の構成例]
図15は、入力画像において、出現頻度の高い色に基づいて特徴量を算出するようにした画像処理装置の構成例を示している。なお、図15の画像処理装置211において、図1の画像処理装置11に設けられたものと同様の機能を備える構成については、同一名称および同一符号を付するものとし、その説明は、適宜省略するものとする。
【0097】
すなわち、図15の画像処理装置211において、図1の画像処理装置11と異なるのは、エッジ領域検出部33および色情報重要度設定部35を削除し、頻度解析部231を新たに設け、特徴量抽出部36に代えて、特徴量抽出部232を設けた点である。
【0098】
頻度解析部231は、色情報抽出部34からのブロック毎の色情報に対して、予め設定された階級に基づいてヒストグラム解析を行い、解析結果を基に、各ブロックにおける最頻色を表す最頻色情報を設定し、特徴量算出部232に供給する。
【0099】
頻度解析部231は、解析部231aおよび設定部231bを備えている。
【0100】
解析部231aは、注目ブロック内の各画素の色情報(色相)についてヒストグラム解析を行う。
【0101】
設定部231bは、解析部231aによるヒストグラム解析の解析結果を基に、注目ブロックにおける最頻色を表す最頻色情報を設定する。
【0102】
特徴量抽出部232は、ブロック毎の、周波数情報抽出部32からの周波数情報、および、頻度解析部231からの最頻色情報に基づいて、入力画像の特徴量を算出し、シーン判定部37に供給する。
【0103】
[画像処理装置のシーン判定処理]
次に、図16のフローチャートを参照して、図15の画像処理装置211のシーン判定処理について説明する。なお、図16のフローチャートにおけるステップS211乃至S213,S216の処理は、図2のフローチャートを参照して説明したステップS11,S12,S14,S17の処理と同様であるので、その説明は省略するものとする。
【0104】
すなわち、ステップS214において、頻度解析部231は、色情報抽出部34からのブロック毎の色情報に対して、予め設定された階級に基づいてヒストグラム解析を行い、各ブロックにおける最頻色を表す最頻色情報を設定する、最頻色設定処理を行う。
【0105】
[頻度解析部の最頻色設定処理]
ここで、図17のフローチャートを参照して、図16のフローチャートのステップS214における最頻色設定処理について説明する。
【0106】
ステップS231において、頻度解析部231の解析部231aは、注目ブロック内の各画素の色情報(色相)についてヒストグラム解析を行う。
【0107】
ステップS232において、設定部231bは、解析部231aによるヒストグラム解析の解析結果を基に、注目ブロックにおける最頻色を表す最頻色情報を設定する。
【0108】
ステップS233において、設定部231bは、全てのブロックについて最頻色情報を設定したか否かを判定する。
【0109】
ステップS233において、全てのブロックについて最頻色情報を設定していないと判定された場合、処理は、ステップS231に戻り、全てのブロックについて最頻色情報を設定するまで、ステップS231乃至S233の処理が繰り返される。
【0110】
一方、ステップS233において、全てのブロックについて色情報重要度を設定したと判定された場合、処理は、図16のフローチャートのステップS214に戻る。
【0111】
このようにして、1個のブロックに対して、1つの最頻色情報が設定される。
【0112】
図16のフローチャートに戻り、ステップS215において、特徴量算出部232は、ブロック毎の、周波数情報抽出部32からの周波数情報、および、頻度解析部231からの最頻色情報に基づいて、入力画像の特徴量を算出し、シーン判定部37に供給する。
【0113】
すなわち、特徴量算出部232は、周波数情報についての特徴量として、512次元のベクトルを得る他、最頻色情報に基づいて、色情報についての特徴量として、16(ブロック数)×1(最頻色情報)=16次元のベクトルを得る。
【0114】
このようにして、特徴量算出部36は、周波数情報および色情報から、512(次元)+16(次元)=528(次元)のベクトルを特徴量として算出する。
【0115】
以上の処理によれば、周波数情報と、ブロック毎の最頻色情報とに基づいた特徴量が算出される。すなわち、例えば、図18で示されるような、浜辺の画像に対して、ブロック毎の最頻色情報に基づいて特徴量を得ることができる。結果として、図18中、下方に示される砂浜の色が、灰色であるか白色であるかを判定することができ、例えば、そのシーンが、単に「浜辺」ではなく、「日本の浜辺」であるか、または「南国の浜辺」であるかを判定することができる。同様に、図示しないが、例えば、空の色が、朱色であるか青色であるかを判定することができ、そのシーンが、単に「空」ではなく、「夕焼け空」であるか「昼間の空」であるかを判定することができる。さらに、例えば、人間の肌の色が、肌色であるか、黒色であるか、または白色であるかを判定することができ、そのシーン(被写体)が、単に「人間」ではなく、「黄色人種」であるか、「黒人」であるか、または「白人」であるかを判定することができる。
【0116】
このように、同じような形状の物体に対して、色を判定することができるので、より細かなシーン判定を行うことが可能となる。
【0117】
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等に、プログラム記録媒体からインストールされる。
【0118】
図19は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
【0119】
コンピュータにおいて、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。
【0120】
バス904には、さらに、入出力インタフェース905が接続されている。入出力インタフェース905には、キーボード、マウス、マイクロホン等よりなる入力部906、ディスプレイ、スピーカ等よりなる出力部907、ハードディスクや不揮発性のメモリ等よりなる記憶部908、ネットワークインタフェース等よりなる通信部909、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等のリムーバブルメディア911を駆動するドライブ910が接続されている。
【0121】
以上のように構成されるコンピュータでは、CPU901が、例えば、記憶部908に記憶されているプログラムを、入出力インタフェース905およびバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
【0122】
コンピュータ(CPU901)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリ等よりなるパッケージメディアであるリムーバブルメディア911に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0123】
そして、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インタフェース905を介して、記憶部908にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部909で受信し、記憶部908にインストールすることができる。その他、プログラムは、ROM902や記憶部908に、あらかじめインストールしておくことができる。
【0124】
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0125】
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0126】
【図1】本発明を適用した画像処理装置の一実施の形態の機能構成例を示す図である。
【図2】図1の画像処理装置のシーン判定処理について説明するフローチャートである。
【図3】入力画像の分割について説明する図である。
【図4】周波数情報の抽出について説明する図である。
【図5】色情報重要度設定処理について説明するフローチャートである。
【図6】色情報重要度の設定について説明する図である。
【図7】シーン判定される画像の例を示す図である。
【図8】シーン判定される画像の例を示す図である。
【図9】画像処理装置の他の構成例を示すブロック図である。
【図10】図9の画像処理装置のシーン判定処理について説明するフローチャートである。
【図11】色情報重要度設定処理について説明するフローチャートである。
【図12】色情報重要度の設定について説明する図である。
【図13】シーン判定される画像の例を示す図である。
【図14】シーン判定される画像の例を示す図である。
【図15】画像処理装置のさらに他の構成例を示すブロック図である。
【図16】図15の画像処理装置のシーン判定処理について説明するフローチャートである。
【図17】最頻色設定処理について説明するフローチャートである。
【図18】シーン判定される画像の例を示す図である。
【図19】コンピュータのハードウェアの構成例を示すブロック図である。
【符号の説明】
【0127】
11 画像処理装置, 31 分割部, 32 周波数情報抽出部, 33 エッジ領域検出部, 34 色情報抽出部, 35 色情報重要度設定部, 36 特徴量算出部, 37 シーン判定部, 111 画像処理装置, 131 彩度算出部, 132 色情報重要度設定部, 211 画像処理装置, 231 頻度解析部, 232 特徴量算出部

【特許請求の範囲】
【請求項1】
入力画像の周波数情報を抽出する周波数情報抽出手段と、
前記入力画像の色情報を抽出する色情報抽出手段と、
周波数情報抽出手段によって抽出された前記周波数情報と、前記色情報抽出手段によって抽出された前記色情報とに基づいて、前記入力画像の特徴量を算出する特徴量算出手段と、
前記特徴量算出手段によって算出された前記特徴量から、前記入力画像のシーンを判定するシーン判定手段と
を備える画像処理装置。
【請求項2】
前記入力画像をブロックに分割する分割手段をさらに備え、
前記周波数情報抽出手段は、前記ブロック毎に前記入力画像の周波数情報を抽出し、
前記色情報抽出手段は、前記ブロック毎に前記入力画像の色情報を抽出する
請求項1に記載の画像処理装置。
【請求項3】
前記周波数情報抽出手段によって抽出された前記周波数情報の、前記ブロック毎の積算値が、所定の閾値以上である前記ブロックに対して、重みを設定する重み設定手段をさらに備え、
前記特徴量算出手段は、前記周波数情報と、前記重み設定手段によって重みが設定された前記ブロックの前記色情報とに基づいて、前記入力画像の特徴量を算出する
請求項2に記載の画像処理装置。
【請求項4】
前記ブロック毎の前記入力画像において、エッジ領域を検出するエッジ領域検出手段をさらに備え、
前記重み設定手段は、前記エッジ領域を除いた前記ブロック毎の前記周波数情報の積算値が、所定の閾値以上である前記ブロックに対して、重みを設定する
請求項3に記載の画像処理装置。
【請求項5】
前記入力画像の各画素の彩度を算出する彩度算出手段と、
前記彩度算出手段によって抽出された前記彩度の、前記ブロック毎の積算値が、所定の閾値以上である前記ブロックに対して、重みを設定する重み設定手段をさらに備え、
前記特徴量算出手段は、前記周波数情報と、前記重み設定手段によって重みが設定された前記ブロックの前記色情報とに基づいて、前記入力画像の特徴量を算出する
請求項2に記載の画像処理装置。
【請求項6】
前記入力画像の前記色情報に基づいて、前記ブロック毎の最頻色を表す最頻色情報を設定する最頻色設定手段をさらに備え、
前記特徴量算出手段は、前記周波数情報と、前記最頻色設定手段によって設定された前記ブロック毎の前記最頻色情報とに基づいて、前記入力画像の特徴量を算出する
請求項2に記載の画像処理装置。
【請求項7】
入力画像の周波数情報を抽出する周波数情報抽出ステップと、
前記入力画像の色情報を抽出する色情報抽出ステップと、
周波数情報抽出ステップにおいて抽出された前記周波数情報と、前記色情報抽出ステップにおいて抽出された前記色情報とに基づいて、前記入力画像の特徴量を算出する特徴量算出ステップと、
前記特徴量算出ステップによって算出された前記特徴量から、前記入力画像のシーンを判定するシーン判定ステップと
を含む画像処理方法。
【請求項8】
入力画像の周波数情報を抽出する周波数情報抽出ステップと、
前記入力画像の色情報を抽出する色情報抽出ステップと、
周波数情報抽出ステップにおいて抽出された前記周波数情報と、前記色情報抽出ステップにおいて抽出された前記色情報とに基づいて、前記入力画像の特徴量を算出する特徴量算出ステップと、
前記特徴量算出ステップによって算出された前記特徴量から、前記入力画像のシーンを判定するシーン判定ステップと
を含む処理をコンピュータに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2010−61599(P2010−61599A)
【公開日】平成22年3月18日(2010.3.18)
【国際特許分類】
【出願番号】特願2008−229311(P2008−229311)
【出願日】平成20年9月8日(2008.9.8)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】