情報処理方法、情報処理装置及びプログラム

【課題】シーン識別処理の誤識別を軽減する。
【解決手段】情報処理方法は、画像データから、前記画像データの示す画像の特徴を示すデータを取得するステップと、前記画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得するステップと、前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別するステップと、を有する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、情報処理方法、情報処理装置及びプログラムに関する。
【背景技術】
【０００２】
デジタルスチルカメラには撮影モードを設定するモード設定ダイヤルを持つものがある。ユーザがダイヤルで撮影モードを設定すると、デジタルスチルカメラは撮影モードに応じた撮影条件（露光時間等）を決定し、撮影を行う。撮影が行われると、デジタルスチルカメラは、画像ファイルを生成する。この画像ファイルには、撮影した画像の画像データに、撮影時の撮影条件等の付加データが付加されている。
【０００３】
一方、付加データに応じて画像データに画像処理することも行われている。例えば、プリンタが画像ファイルに基づいて印刷を行うとき、付加データの示す撮影条件に応じて画像データを補正し、補正した画像データに従って印刷することが行われている。
【特許文献１】特開２００１−２３８１７７号公報
【発明の開示】
【発明が解決しようとする課題】
【０００４】
ユーザが撮影モードを設定し忘れたために、撮影条件に不適切な撮影モードが設定されたまま、撮影が行われることがある。例えば、夜景モードが設定されたまま、日中の風景が撮影されることがある。この場合、画像ファイルの画像データは日中の風景の画像であるにも関わらず、付加データには夜景モードを示すデータが記憶されることになる。このような場合に、付加データの示す夜景モードに従って画像データの示す画像を識別すると、誤識別の確率が高くなる。なお、このような誤識別は、ダイヤル設定ミスによって生じる場合に限られず、画像データの内容と付加データの内容との不一致によって生じる。
【０００５】
本発明は、誤識別の確率を軽減することを目的とする。
【課題を解決するための手段】
【０００６】
上記目的を達成するための主たる発明は、画像データから、前記画像データの示す画像の特徴を示すデータを取得するステップと、前記画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得するステップと、前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別するステップと、を有することを特徴とする情報処理方法である。
【０００７】
本発明の他の特徴については、本明細書及び添付図面の記載により明らかにする。
【発明を実施するための最良の形態】
【０００８】
本明細書及び添付図面の記載により、少なくとも、以下の事項が明らかとなる。
【０００９】
画像データから、前記画像データの示す画像の特徴を示すデータを取得するステップと、前記画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得するステップと、前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別するステップと、を有することを特徴とする情報処理方法が明らかになる。
このような情報処理方法によれば、誤識別の確率を軽減することができる。
【００１０】
また、前記シーンに関するデータ以外のデータは、前記画像データを生成したときの撮影装置の制御データであることが望ましい。特に、前記制御データは、前記画像の明るさに関連するデータであることが好ましい。また、前記制御データは、前記画像の色に関連するデータであることが好ましい。これにより、誤識別の確率を軽減することができる。
【００１１】
また、前記画像の特徴を示すデータを取得するステップは、前記画像の全体の特徴を示すデータと、前記画像に含まれる部分画像の特徴を示すデータとを取得し、前記シーンを識別するステップは、前記画像の全体の特徴を示すデータを用いて、前記画像データの示す画像のシーンを識別する全体識別ステップと、前記部分画像の特徴を示すデータを用いて、前記画像データの示す画像のシーンを識別する部分識別ステップと、を有し、前記全体識別ステップにおいて前記画像のシーンを識別できない場合、前記部分識別ステップが行われ、前記全体識別ステップにおいて前記画像のシーンを識別できた場合、前記部分識別ステップは行われないことが望ましい。これにより、処理速度が速くなる。
【００１２】
また、前記全体識別ステップは、前記画像の全体の特徴を示すデータを用いて、前記画像が所定のシーンである確率に応じた評価値を算出し、前記評価値が第１閾値より大きければ、前記画像が前記所定のシーンであると識別でき、前記部分識別ステップは、前記部分画像の特徴を示すデータを用いて、前記画像が前記所定のシーンであることを識別し、前記全体識別ステップにおける前記評価値が第２閾値より小さい場合、前記部分識別ステップは行われないことが望ましい。これにより、処理速度が速くなる。
【００１３】
また、前記シーンを識別するステップは、前記特徴量に基づいて、前記画像が第１シーンであることを識別する第１シーン識別ステップと、前記特徴量に基づいて、前記画像が第１シーンとは異なる第２シーンであることを識別する第２シーン識別ステップと、を有し、前記第１シーン識別ステップは、前記特徴量に基づいて、前記画像が前記第１シーンである確率に応じた評価値を算出し、前記評価値が第１閾値より大きければ、前記画像が第１シーンであると識別でき、前記シーンを識別するステップにおいて、前記第１識別ステップにおける前記評価値が第３閾値より大きければ、前記第２シーン識別ステップを行わないことが望ましい。これにより、処理速度が速くなる。
【００１４】
画像データから、前記画像データの示す画像の特徴を示すデータを取得する第１取得手段と、画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得する第２取得手段と、前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別する識別手段と、を備えることを特徴とする情報処理装置が明らかになる。
【００１５】
また、情報処理装置に、画像データから、前記画像データの示す画像の特徴を示すデータを取得するステップと、画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得するステップと、前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別するステップと、を実行させるプログラムも明らかになる。
【００１６】
＝＝＝全体構成＝＝＝
図１は、画像処理システムの説明図である。この画像処理システムは、デジタルスチルカメラ２と、プリンタ４とを備える。
【００１７】
デジタルスチルカメラ２は、被写体をデジタルデバイス（ＣＣＤなど）に結像させることによりデジタル画像を取得するカメラである。デジタルスチルカメラ２には、モード設定ダイヤル２Ａが設けられている。ユーザは、ダイヤル２Ａによって、撮影条件に応じた撮影モードを設定することができる。例えば、ダイヤル２Ａによって「夜景」モードが設定されると、デジタルスチルカメラ２は、シャッター速度を遅くしたり、ＩＳＯ感度を高くしたりして、夜景撮影に適した撮影条件にて撮影を行う。
【００１８】
デジタルスチルカメラ２は、ファイルフォーマット規格に準拠して、撮影により生成した画像ファイルをメモリカード６に保存する。画像ファイルには、撮影した画像のデジタルデータ（画像データ）だけでなく、撮影時の撮影条件（撮影データ）等の付加データも保存される。
【００１９】
プリンタ４は、画像データの示す画像を紙に印刷する印刷装置である。プリンタ４には、メモリカード６を挿入するスロット２１が設けられている。ユーザは、デジタルスチルカメラ２で撮影した後、デジタルスチルカメラ２からメモリカード６を取り出し、スロット２１にメモリカード６を挿入することができる。
【００２０】
図２は、プリンタ４の構成の説明図である。プリンタ４は、印刷機構１０と、この印刷機構１０を制御するプリンタ側コントローラ２０とを備える。印刷機構１０は、インクを吐出するヘッド１１と、ヘッド１１を制御するヘッド制御部１２と、紙を搬送するため等のモータ１３と、センサ１４とを有する。プリンタ側コントローラ２０は、メモリカード６からデータを送受信するためのメモリ用スロット２１と、ＣＰＵ２２と、メモリ２３と、モータ１３を制御する制御ユニット２４と、駆動信号（駆動波形）を生成する駆動信号生成部２５とを有する。
【００２１】
メモリカード６がスロット２１に挿入されると、プリンタ側コントローラ２０は、メモリカード６に保存されている画像ファイルを読み出してメモリ２３に記憶する。そして、プリンタ側コントローラ２０は、画像ファイルの画像データを、印刷機構１０で印刷するための印刷データに変換し、印刷データに基づいて印刷機構１０を制御し、紙に画像を印刷する。この一連の動作は、「ダイレクトプリント」と呼ばれている。
【００２２】
なお、「ダイレクトプリント」は、メモリカード６をスロット２１に挿入することによって行われるだけでなく、デジタルスチルカメラ２とプリンタ４とをケーブル（不図示）で接続することによっても可能である。
【００２３】
＝＝＝画像ファイルの構造＝＝＝
画像ファイルは、画像データと、付加データとから構成されている。画像データは、複数の画素データから構成されている。画素データは、画素の色情報（階調値）を示すデータである。画素がマトリクス状に配置されることによって、画像が構成される。このため、画像データは、画像を示すデータである。付加データには、画像データの特性を示すデータや、撮影データや、サムネイル画像データ等が含まれる。
【００２４】
以下、画像ファイルの具体的な構造について説明する。
図３は、画像ファイルの構造の説明図である。図中の左側には画像ファイルの全体構成が示されており、右側にはＡＰＰ１領域の構成が示されている。
【００２５】
画像ファイルは、ＳＯＩ（Start of image）を示すマーカで始まり、ＥＯＩ（End of Image）を示すマーカで終わる。ＳＯＩを示すマーカの後に、ＡＰＰ１のデータ領域の開始を示すＡＰＰ１マーカがある。ＡＰＰ１マーカの後のＡＰＰ１のデータ領域には、撮影データやサムネイル画像等の付加データが含まれている。また、ＳＯＳ（Start of Stream）を示すマーカの後には、画像データが含まれている。
【００２６】
ＡＰＰ１マーカの後、ＡＰＰ１のデータ領域のサイズを示す情報があり、ＥＸＩＦヘッダとＴＩＦＦヘッダが続き、ＩＦＤ領域となる。
【００２７】
各ＩＦＤ領域は、複数のディレクトリエントリと、次のＩＦＤ領域の位置を示すリンクと、データエリアとを有する。例えば、最初のＩＦＤ０（IFD of main image）では次のＩＦＤ１（IFD of thumbnail image）の位置がリンクされる。但し、ここではＩＦＤ１の次のＩＦＤが存在しないのでＩＦＤ１では他のＩＦＤへのリンクは行われない。各ディレクトリエントリには、タグとデータ部が含まれる。格納すべきデータ量が小さい場合にはデータ部に実際のデータがそのまま格納され、データ量が多い場合には実際のデータはＩＦＤ０データエリアに格納されて、データ部にはデータの格納場所を示すポインタが格納される。なお、ＩＦＤ０には、ＥｘｉｆＳｕｂＩＦＤの格納場所を意味するタグ（Exif IFD Pointer）と、ＥｘｉｆＳｕｂＩＦＤの格納場所を示すポインタ（オフセット値）とが格納されているディレクトリエントリがある。
【００２８】
ＥｘｉｆＳｕｂＩＦＤ領域は、複数のディレクトリエントリを有する。このディレクトリエントリにも、タグとデータ部が含まれる。格納すべきデータ量が小さい場合にはデータ部に実際のデータがそのまま格納され、データ量が多い場合には実際のデータはＥｘｉｆＳｕｂＩＦＤデータエリアに格納されて、データ部にはデータの格納場所を示すポインタが格納される。なお、ＥｘｉｆＳｕｂＩＦＤの中には、ＭａｋｅｒｎｏｔｅＩＦＤの格納場所を意味するタグと、ＭａｋｅｒｎｏｔｅＩＦＤの格納場所を示すポインタとが格納されている。
【００２９】
ＭａｋｅｒｎｏｔｅＩＦＤ領域は、複数のディレクトリエントリを有する。このディレクトリエントリにも、タグとデータ部が含まれる。格納すべきデータ量が小さい場合にはデータ部に実際のデータがそのまま格納され、データ量が多い場合には実際のデータはＭａｋｅｒｎｏｔｅＩＦＤデータエリアにデータが格納されて、データ部にはデータの格納場所を示すポインタが格納される。但し、ＭａｋｅｒｎｏｔｅＩＦＤ領域ではデータの格納形式を自由に定義できるので、必ずしもこの形式でデータを格納しなくても良い。以下の説明では、ＭａｋｅｒｎｏｔｅＩＦＤ領域に格納されるデータのことを「ＭａｋｅｒＮｏｔｅデータ」と呼ぶ。
【００３０】
図４Ａは、ＩＦＤ０で使われるタグの説明図である。図に示す通り、ＩＦＤ０には一般的なデータ（画像データの特性を示すデータ）が格納され、詳細な撮影データは格納されていない。
図４Ｂは、ＥｘｉｆＳｕｂＩＦＤで使われるタグの説明図である。図に示す通り、ＥｘｉｆＳｕｂＩＦＤには詳細な撮影データが格納されている。なお、シーン識別処理の際に抽出される撮影データの大部分は、ＥｘｉｆＳｕｂＩＦＤに格納されている撮影データである。なお、撮影シーンタイプタグ（Scene Capture Type）は、撮影シーンのタイプを示すタグである。また、Ｍａｋｅｒｎｏｔｅタグは、ＭａｋｅｒｎｏｔｅＩＦＤの格納場所を意味するタグである。
【００３１】
ＥｘｉｆＳｕｂＩＦＤ領域の撮影シーンタイプタグに対するデータ部（撮影シーンタイプデータ）が、「ゼロ」ならば「標準」を意味し、「１」ならば「風景」を意味し、「２」ならば「人物」を意味し、「３」ならば「夜景」を意味する。なお、ＥｘｉｆＳｕｂＩＦＤに格納されたデータは規格化されているため、この撮影シーンタイプデータの内容を誰でも知ることが可能である。
【００３２】
本実施形態では、Ｍａｋｅｒｎｏｔｅデータの一つに、撮影モードデータが含まれている。この撮影モードデータでは、モード設定ダイヤル２Ａで設定されたモード毎に異なる値を示す。但し、ＭａｋｅｒＮｏｔｅデータは、メーカ毎に形式が異なるため、ＭａｋｅｒＮｏｔｅデータの形式が分からなければ、撮影モードデータの内容を知ることはできない。
【００３３】
図５は、モード設定ダイヤル２Ａの設定とデータとの対応表である。ＥｘｉｆＳｕｂＩＦＤで使われる撮影シーンタイプタグは、ファイルフォーマット規格に準拠しているため、特定できるシーンが限定されており、「夕景」等のシーンを特定するデータをデータ部に格納することはできない。一方、ＭａｋｅｒＮｏｔｅデータは自由に定義できるので、ＭａｋｅｒＮｏｔｅデータの一つである撮影モードタグにより、モード設定ダイヤル２Ａの撮影モードを特定するデータをデータ部に格納できる。
【００３４】
前述のデジタルスチルカメラ２は、モード設定ダイヤル２Ａの設定に応じた撮影条件にて撮影を行った後、上記の画像ファイルを作成し、メモリカード６に保存する。この画像ファイルには、モード設定ダイヤル２Ａに応じた撮影シーンタイプデータ及び撮影モードデータが、画像データに付加されるシーン情報として、それぞれＥｘｉｆＳｕｂＩＦＤ領域及びＭａｋｅｒｎｏｔｅＩＦＤ領域に格納される。
【００３５】
＝＝＝自動補正機能の概要＝＝＝
「人物」の写真を印刷するときには、肌色をきれいにしたいという要求がある。また、「風景」の写真を印刷するときには、空の青色を強調し、木や草の緑色を強調したいという要求がある。そこで、本実施形態のプリンタ４は、画像ファイルを分析して自動的に適した補正処理を行う自動補正機能を備えている。
【００３６】
図６は、プリンタ４の自動補正機能の説明図である。図中のプリンタ側コントローラ２０の各要素は、ソフトウェアとハードウェアによって実現される。
【００３７】
記憶部３１は、メモリ２３の一部の領域及びＣＰＵ２２によって実現される。メモリカード６から読み出された画像ファイルの全部又は一部は、記憶部３１の画像記憶部３１Ａに展開される。また、プリンタ側コントローラ２０の各要素の演算結果は、記憶部３１の結果記憶部３１Ｂに格納される。
【００３８】
顔識別部３２は、ＣＰＵ２２と、メモリ２３に記憶された顔識別プログラムとによって実現される。顔識別部３２は、画像記憶部３１Ａに記憶された画像データを分析し、顔の有無を識別する。顔識別部３２によって顔が有ると識別された場合、識別対象となる画像が「人物」のシーンに属すると識別される。この場合、シーン識別部３３によるシーン識別処理は行われない。顔識別部３２による顔識別処理は、既に広く行われている処理と同様なので、詳細な説明は省略する。
【００３９】
シーン識別部３３は、ＣＰＵ２２と、メモリ２３に記憶されたシーン識別プログラムとによって実現される。シーン識別部３３は、画像記憶部３１Ａに記憶された画像ファイルを分析し、画像データの示す画像のシーンを識別する。顔識別部３２によって顔が無いと識別された場合に、シーン識別部３３によるシーン識別処理が行われる。後述するように、シーン識別部３３は、識別対象となる画像が「風景」、「夕景」、「夜景」、「花」、「紅葉」、「その他」のいずれの画像であるかを識別する。
【００４０】
図７は、画像のシーンと補正内容との関係の説明図である。
画像補正部３４は、ＣＰＵ２２と、メモリ２３に記憶された画像補正プログラムとによって実現される。画像補正部３４は、記憶部３１の結果記憶部３１Ｂ（後述）に記憶されている識別結果（顔識別部３２やシーン識別部３３の識別結果）に基づいて、画像記憶部３１Ａの画像データを補正する。例えば、シーン識別部３３の識別結果が「風景」である場合には、青色を強調し、緑色を強調するような補正が行われる。なお、画像補正部３４は、シーンの識別結果だけでなく、画像ファイルの撮影データの内容も反映して、画像データを補正しても良い。例えば、露出補正がマイナスの場合、暗い雰囲気の画像を明るくしないように画像データを補正しても良い。
【００４１】
プリンタ制御部３５は、ＣＰＵ２２、駆動信号生成部２５、制御ユニット２４及びメモリ２３に記憶されたプリンタ制御プログラムによって、実現される。プリンタ制御部３５は、補正後の画像データを印刷データに変換し、印刷機構１０に画像を印刷させる。
【００４２】
＝＝＝シーン識別処理＝＝＝
図８は、シーン識別部３３によるシーン識別処理のフロー図である。図９は、シーン識別部３３の機能の説明図である。図中のシーン識別部３３の各要素は、ソフトウェアとハードウェアによって実現される。
【００４３】
最初に、特徴量取得部４０が、記憶部３１の画像記憶部３１Ａに展開された画像データを分析し、部分特徴量を取得する（Ｓ１０１）。具体的には、特徴量取得部４０は、画像データを８×８の６４ブロックに分割し、各ブロックの色平均と分散を算出し、この色平均と分散を部分特徴量として取得する。なお、ここでは各画素はＹＣＣ色空間における階調値のデータをもっており、各ブロックごとに、Ｙの平均値、Ｃｂの平均値及びＣｒの平均値がそれぞれ算出され、Ｙの分散、Ｃｂの分散及びＣｒの分散がそれぞれ算出される。つまり、各ブロックごとに３つの色平均と３つの分散が部分特徴量として算出される。これらの色平均や分散は、各ブロックにおける部分画像の特徴を示すものである。なお、ＲＧＢ色空間における平均値や分散を算出しても良い。
ブロックごとに色平均と分散が算出されるので、特徴量取得部４０は、画像記憶部３１Ａには画像データの全てを展開せずに、ブロック分の画像データをブロック順に展開する。このため、画像記憶部３１Ａは、必ずしも画像ファイルの全てを展開できるだけの容量を備えていなくても良い。
【００４４】
次に、特徴量取得部４０が、全体特徴量を取得する（Ｓ１０２）。具体的には、特徴量取得部４０は、画像データの全体の色平均、分散、重心及び撮影情報を、全体特徴量として取得する。なお、これらの色平均や分散は、画像の全体の特徴を示すものである。画像データ全体の色平均、分散及び重心は、先に算出した部分特徴量を用いて算出される。このため、全体特徴量を算出する際に、画像データを再度展開する必要がないので、全体特徴量の算出速度が速くなる。全体識別処理（後述）は部分識別処理（後述）よりも先に行われるにも関わらず、全体特徴量が部分特徴量よりも後に求められるのは、このように算出速度を速めるためである。なお、撮影情報は、画像ファイルの撮影データから抽出される。具体的には、絞り値、シャッター速度、フラッシュ発光の有無などの情報が全体特徴量として用いられる。但し、画像ファイルの撮影データの全てが全体特徴量として用いられるわけではない。
【００４５】
次に、全体識別器５０が、全体識別処理を行う（Ｓ１０３）。全体識別処理とは、全体特徴量に基づいて、画像データの示す画像のシーンを識別（推定）する処理である。全体識別処理の詳細については、後述する。
【００４６】
全体識別処理によってシーンの識別ができる場合（Ｓ１０４でＹＥＳ）、シーン識別部３３は、記憶部３１の結果記憶部３１Ｂに識別結果を記憶することによってシーンを決定し（Ｓ１０９）、シーン識別処理を終了する。つまり、全体識別処理によってシーンの識別ができた場合（Ｓ１０４でＹＥＳ）、部分識別処理や統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。
全体識別処理によってシーンの識別ができない場合（Ｓ１０４でＮＯ）、次に部分識別器６０が、部分識別処理を行う（Ｓ１０５）。部分識別処理とは、部分特徴量に基づいて、画像データの示す画像全体のシーンを識別する処理である。部分識別処理の詳細については、後述する。
【００４７】
部分識別処理によってシーンの識別ができる場合（Ｓ１０６でＹＥＳ）、シーン識別部３３は、記憶部３１の結果記憶部３１Ｂ識別結果をに記憶することによってシーンを決定し（Ｓ１０９）、シーン識別処理を終了する。つまり、部分識別処理によってシーンの識別ができた場合（Ｓ１０６でＹＥＳ）、統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。
部分識別処理によってシーンの識別ができない場合（Ｓ１０６でＮＯ）、次に統合識別器７０が、統合識別処理を行う（Ｓ１０７）。統合識別処理の詳細については、後述する。
【００４８】
統合識別処理によってシーンの識別ができる場合（Ｓ１０８でＹＥＳ）、シーン識別部３３は、記憶部３１の結果記憶部３１Ｂに識別結果を記憶することによってシーンを決定し（Ｓ１０９）、シーン識別処理を終了する。一方、統合識別処理によってシーンの識別ができない場合（Ｓ１０８でＮＯ）、画像データの示す画像が「その他」のシーン（「風景」、「夕景」、「夜景」、「花」又は「紅葉」以外のシーン）である旨の識別結果を結果記憶部３１Ｂに記憶する（Ｓ１１０）。
【００４９】
＝＝＝全体識別処理＝＝＝
図１０は、全体識別処理のフロー図である。ここでは図９も参照しながら全体識別処理について説明する。
まず、全体識別器５０は、複数のサブ識別器５１の中から１つのサブ識別器５１を選択する（Ｓ２０１）。全体識別器５０には、識別対象となる画像（識別対象画像）が特定のシーンに属するか否かを識別するサブ識別器５１が５つ設けられている。５つのサブ識別器５１は、それぞれ風景、夕景、夜景、花、紅葉のシーンを識別する。ここでは、全体識別器５０は、風景→夕景→夜景→花→紅葉の順に、サブ識別器５１を選択する。このため、最初には、識別対象画像が風景のシーンに属するか否かを識別するサブ識別器５１（風景識別器５１Ｌ）が選択される。
【００５０】
次に、全体識別器５０は、識別対象テーブルを参照し、選択したサブ識別器５１を用いてシーンを識別すべきか否かを判断する（Ｓ２０２）。
【００５１】
図１１は、識別対象テーブルの説明図である。この識別対象テーブルは、記憶部３１の結果記憶部３１Ｂに記憶される。識別対象テーブルは、最初の段階では全ての欄がゼロに設定される。Ｓ２０２の処理では、「否定」欄が参照され、ゼロであればＹＥＳと判断され、１であればＮＯと判断される。ここでは、全体識別器５０は、識別対象テーブルにおける「風景」欄の「否定」欄を参照し、ゼロであるのでＹＥＳと判断する。
【００５２】
次に、サブ識別器５１は、全体特徴量に基づいて、識別対象画像が特定のシーンに属する確率に応じた値（評価値）を算出する（Ｓ２０３）。本実施形態のサブ識別器５１には、サポートベクタマシン（ＳＶＭ）による識別手法が用いられている。なお、サポートベクタマシンについては、後述する。識別対象画像が特定のシーンに属する場合、サブ識別器５１の判別式は、プラスの値になりやすい。識別対象画像が特定のシーンに属しない場合、サブ識別器５１の判別式は、マイナスの値になりやすい。また、判別式は、識別対象画像が特定のシーンに属する確率が高いほど、大きい値になる。このため、判別式の値が大きければ、識別対象画像が特定のシーンに属する確率が高くなり、判別式の値が小さければ、識別対象画像が特定のシーンに属する確率が低くなる。
【００５３】
このため、判別式の値（評価値）は、識別対象画像が特定のシーンに属することの確からしさである確信度を示す。なお、以下の説明における確信度は、判別式の値そのものを指しても良いし、判別式の値から求められる正答率（後述）を指しても良い。なお、判別式の値そのもの、又は、判別式の値から求められる正答率（後述）は、識別対象画像が特定のシーンに属する確率に応じた「評価値」（評価結果）でもある。
【００５４】
次に、サブ識別器５１は、判別式の値（確信度）が肯定閾値より大きいか否かを判断する（Ｓ２０４）。判別式の値が肯定閾値より大きければ、サブ識別器５１は、識別対象画像が特定のシーンに属すると判断することになる。
【００５５】
図１２は、全体識別処理の肯定閾値の説明図である。同図において、横軸は肯定閾値を示し、縦軸はRecall又はPrecisionの確率を示す。図１３は、RecallとPrecisionの説明図である。判別式の値が肯定閾値以上の場合には識別結果はPositiveであり、判別式の値が肯定閾値以上でない場合には識別結果はNegativeである。
【００５６】
Recallは、再現率や検出率を示すものである。Recallは、特定のシーンの画像の総数に対する、特定のシーンに属すると識別された画像の数の割合である。言い換えると、Recallは、特定のシーンの画像をサブ識別器５１に識別させたときに、サブ識別器５１がPositiveと識別する確率（特定のシーンの画像が特定のシーンに属すると識別される確率）を示すものである。例えば、風景画像を風景識別器５１Ｌに識別させたときに、風景のシーンに属すると風景識別器５１Ｌが識別する確率を示すものである。
【００５７】
Precisionは、正答率や正解率を示すものである。Precisionは、Positiveと識別された画像の総数に対する、特定のシーンの画像の数の割合である。言い換えると、Precisionは、特定のシーンを識別するサブ識別器５１がPositiveと識別したときに、識別対象の画像が特定のシーンである確率を示すものである。例えば、風景識別器５１Ｌが風景のシーンに属すると識別したときに、その識別した画像が本当に風景画像である確率を示すものである。
【００５８】
図１２から分かる通り、肯定閾値を大きくするほど、Precisionが大きくなる。このため、肯定閾値を大きくするほど、例えば風景のシーンに属すると識別された画像が風景画像である確率が高くなる。つまり、肯定閾値を大きくするほど、誤識別の確率が低くなる。
一方、肯定閾値を大きくするほど、Recallは小さくなる。この結果、例えば、風景画像を風景識別器５１Ｌで識別した場合であっても、風景のシーンに属すると正しく識別しにくくなる。ところで、識別対象画像が風景のシーンに属すると識別できれば（Ｓ２０４でＹＥＳ）、残りの別のシーン（夕景など）の識別を行わないようにして全体識別処理の速度を速めている。このため、肯定閾値を大きくするほど、全体識別処理の速度は低下することになる。また、全体識別処理によってシーンが識別できれば部分識別処理を行わないようにしてシーン識別処理の速度を速めているため（Ｓ１０４）、肯定閾値を大きくするほど、シーン識別処理の速度は低下することになる。
つまり、肯定閾値が小さすぎると誤識別の確率が高くなり、大きすぎると処理速度が低下することになる。本実施形態では、正答率（Precision）を９７．５％に設定するため、風景の肯定閾値は１．７２に設定されている。
【００５９】
判別式の値が肯定閾値より大きければ（Ｓ２０４でＹＥＳ）、サブ識別器５１は、識別対象画像が特定のシーンに属すると判断し、肯定フラグを立てる（Ｓ２０５）。「肯定フラグを立てる」とは、図１１の「肯定」欄を１にすることである。この場合、全体識別器５０は、次のサブ識別器５１による識別を行わずに、全体識別処理を終了する。例えば、風景画像であると識別できれば、夕景などの識別を行わずに、全体識別処理を終了する。この場合、次のサブ識別器５１による識別を省略しているので、全体識別処理の速度を速めることができる。
判別式の値が肯定閾値より大きくなければ（Ｓ２０４でＮＯ）、サブ識別器５１は、識別対象画像が特定のシーンに属すると判断できず、次のＳ２０６の処理を行う。
【００６０】
次に、サブ識別器５１は、判別式の値と否定閾値とを比較する（Ｓ２０６）。これにより、サブ識別器５１は、識別対象画像が所定のシーンに属しないかを判断する。このような判断としては、２種類ある。第１に、ある特定のシーンのサブ識別器５１の判別式の値が第１否定閾値より小さければ、その特定のシーンに識別対象画像が属しないと判断されることになる。例えば、風景識別器５１Ｌの判別式の値が第１否定閾値より小さければ、識別対象画像が風景のシーンに属しないと判断されることになる。第２に、ある特定のシーンのサブ識別器５１の判別式の値が第２否定閾値より大きければ、その特定のシーンとは別のシーンに識別対象画像が属しないと判断されることになる。例えば、風景識別器５１Ｌの判別式の値が第２否定閾値より大きければ、識別対象画像が夜景のシーンに属しないと判断されることになる。
【００６１】
図１４は、第１否定閾値の説明図である。同図において、横軸は第１否定閾値を示し、縦軸は確率を示す。グラフの太線は、True Negative Recallのグラフであり、風景画像以外の画像を風景画像ではないと正しく識別する確率を示している。グラフの細線は、False Negative Recallのグラフであり、風景画像なのに風景画像ではないと誤って識別する確率を示している。
【００６２】
図１４から分かる通り、第１否定閾値を小さくするほど、False Negative Recallが小さくなる。このため、第１否定閾値を小さくするほど、例えば風景のシーンに属しないと識別された画像が風景画像である確率が低くなる。つまり、誤識別の確率が低くなる。
一方、第１否定閾値を小さくするほど、True Negative Recallも小さくなる。この結果、風景画像以外の画像を風景画像ではないと識別しにくくなる。その一方、識別対象画像が特定シーンでないことを識別できれば、部分識別処理の際に、その特定シーンのサブ部分識別器６１による処理を省略してシーン識別処理速度を速めている（後述、図１７のＳ３０２）。このため、第１否定閾値を小さくするほど、シーン識別処理速度は低下する。
つまり、第１否定閾値が大きすぎると誤識別の確率が高くなり、小さすぎると処理速度が低下することになる。本実施形態では、False Negative Recallを２．５％に設定するため、第１否定閾値は−１．０１に設定されている。
【００６３】
ところで、ある画像が風景のシーンに属する確率が高ければ、必然的にその画像が夜景のシーンに属する確率は低くなる。このため、風景識別器５１Ｌの判別式の値が大きい場合には、夜景ではないと識別できる場合がある。このような識別を行うために、第２否定閾値が設けられる。
【００６４】
図１５は、第２否定閾値の説明図である。同図において、横軸は風景の判別式の値を示し、縦軸は確率を示す。同図には、図１２のRecallとPrecisionのグラフとともに、夜景のRecallのグラフが点線で描かれている。この点線のグラフに注目すると、風景の判別式の値が−０．４４よりも大きければ、その画像が夜景画像である確率は２．５％である。言い換えると、風景の判別式の値が−０．４４より大きい場合にその画像が夜景画像でないと識別しても、誤識別の確率は２．５％にすぎない。そこで、本実施形態では、第２否定閾値が−０．４４に設定されている。
【００６５】
そして、判別式の値が第１否定閾値より小さい場合、又は、判別式の値が第２否定閾値より大きい場合（Ｓ２０６でＹＥＳ）、サブ識別器５１は、識別対象画像が所定のシーンに属しないと判断し、否定フラグを立てる（Ｓ２０７）。「否定フラグを立てる」とは、図１１の「否定」欄を１にすることである。例えば、第１否定閾値に基づいて識別対象画像が風景のシーンに属しないと判断された場合、「風景」欄の「否定」欄が１になる。また、第２否定閾値に基づいて識別対象画像が夜景のシーンに属しないと判断された場合、「夜景」欄の「否定」欄が１になる。
【００６６】
図１６Ａは、上記で説明した風景識別器５１Ｌにおける閾値の説明図である。風景識別器５１Ｌには、肯定閾値及び否定閾値が予め設定されている。肯定閾値として１．７２が設定されている。否定閾値には第１否定閾値と第２否定閾値とがある。第１否定閾値として−１．０１が設定されている。また、第２否定閾値として、風景以外の各シーンにそれぞれ値が設定されている。
【００６７】
図１６Ｂは、上記で説明した風景識別器５１Ｌの処理の概要の説明図である。ここでは、説明の簡略化のため、第２否定閾値については夜景についてのみ説明する。風景識別器５１Ｌは、判別式の値が１．７２より大きければ（Ｓ２０４でＹＥＳ）、識別対象画像が風景のシーンに属すると判断する。また、判別式の値が１．７２以下であり（Ｓ２０４でＮＯ）、−０．４４より大きければ（Ｓ２０６でＹＥＳ）、風景識別器５１Ｌは、識別対象画像が夜景のシーンに属しないと判断する。また、判別式の値が−１．０１より小さければ（Ｓ２０６でＹＥＳ）、風景識別器５１Ｌは、識別対象画像が風景のシーンに属しないと判断する。なお、風景識別器５１Ｌは、夕景や紅葉についても、第２否定閾値に基づいて、識別対象画像がそのシーンに属しないかを判断する。但し、花の第２否定閾値は肯定閾値よりも大きいため、識別対象画像が花のシーンに属しないことを風景識別器５１Ｌが判断することはない。
【００６８】
Ｓ２０２においてＮＯの場合、Ｓ２０６でＮＯの場合、又はＳ２０７の処理を終えた場合、全体識別器５０は、次のサブ識別器５１の有無を判断する（Ｓ２０８）。ここでは風景識別器５１Ｌによる処理を終えた後なので、全体識別器５０は、Ｓ２０８において、次のサブ識別器５１（夕景識別器５１Ｓ）があると判断する。
【００６９】
そして、Ｓ２０５の処理を終えた場合（識別対象画像が特定のシーンに属すると判断された場合）、又は、Ｓ２０８において次のサブ識別器５１がないと判断された場合（識別対象画像が特定のシーンに属すると判断できなかった場合）、全体識別器５０は、全体識別処理を終了する。
【００７０】
なお、既に説明した通り、全体識別処理が終了すると、シーン識別部３３は、全体識別処理によってシーンの識別ができたか否かを判断する（図８のＳ１０４）。このとき、シーン識別部３３は、図１１の識別対象テーブルを参照し、「肯定」欄に１があるか否かを判断することになる。
【００７１】
全体識別処理によってシーンの識別ができた場合（Ｓ１０４でＹＥＳ）、部分識別処理や統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。
【００７２】
＝＝＝部分識別処理＝＝＝
図１７は、部分識別処理のフロー図である。部分識別処理は、全体識別処理によってシーンの識別ができなかった場合（図８のＳ１０４でＮＯ）に行われる。以下に説明するように、部分識別処理は、分割された分割画像のシーンをそれぞれ識別することによって、画像全体のシーンを識別する処理である。ここでは図９も参照しながら部分識別処理について説明する。
【００７３】
まず、部分識別器６０は、複数のサブ部分識別器６１の中から１つのサブ部分識別器６１を選択する（Ｓ３０１）。部分識別器６０には、サブ部分識別器６１が３つ設けられている。各サブ部分識別器６１は、８×８の６４ブロックに分割された部分画像がそれぞれ特定のシーンに属するか否かを識別する。ここでの３つのサブ部分識別器６１は、それぞれ夕景、花、紅葉のシーンを識別する。部分識別器６０は、夕景→花→紅葉の順に、サブ部分識別器６１を選択する。このため、最初には、部分画像が夕景のシーンに属するか否かを識別するサブ部分識別器６１（夕景部分識別器６１Ｓ）が選択される。
【００７４】
次に、部分識別器６０は、識別対象テーブル（図１１）を参照し、選択したサブ部分識別器６１を用いてシーンを識別すべきか否かを判断する（Ｓ３０２）。ここでは、部分識別器６０は、識別対象テーブルにおける「夕景」欄の「否定」欄を参照し、ゼロであればＹＥＳと判断し、１であればＮＯと判断する。なお、全体識別処理の際に、夕景識別器５１Ｓが第１否定閾値により否定フラグを立てたとき、又は、他のサブ識別器５１が第２否定閾値により否定フラグを立てたとき、このＳ３０２でＮＯと判断される。仮にＮＯと判断されると夕景の部分識別処理は省略されることになるので、部分識別処理の速度が速くなる。但し、ここでは説明の都合上、ＹＥＳと判断されるものとする。
【００７５】
次に、サブ部分識別器６１は、８×８の６４ブロックに分割された部分画像の中から、１つの部分画像を選択する（Ｓ３０３）。
図１８は、夕景部分識別器６１Ｓが選択する部分画像の順番の説明図である。部分画像から画像全体のシーンを識別するような場合、識別に用いられる部分画像は、被写体が存在する部分であることが望ましい。そこで、本実施形態では、数千枚のサンプルの夕景画像を用意し、各夕景画像を８×８の６４ブロックに分割し、夕景部分画像（夕景の太陽と空の部分画像）を含むブロックを抽出し、抽出されたブロックの位置に基づいて各ブロックにおける夕景部分画像の存在確率を算出した。そして、本実施形態では、存在確率の高いブロックから順番に、部分画像が選択される。なお、図に示す選択順序の情報は、プログラムの一部としてメモリ２３に格納されている。
【００７６】
なお、夕景画像の場合、画像の中央付近から上半分に夕景の空が広がっていることが多いため、中央付近から上半分のブロックにおいて存在確率が高くなる。また、夕景画像の場合、画像の下１／３では逆光で陰になり、部分画像単体では夕景か夜景か区別がつかないことが多いため、下１／３のブロックにおいて存在確率が低くなる。花画像の場合、花を中央付近に配置させる構図にすることが多いため、中央付近における花部分画像の存在確率が高くなる。
【００７７】
次に、サブ部分識別器６１は、選択された部分画像の部分特徴量に基づいて、その部分画像が特定のシーンに属するか否かを判断する（Ｓ３０４）。サブ部分識別器６１には、全体識別器５０のサブ識別器５１と同様に、サポートベクタマシン（ＳＶＭ）による判別手法が用いられている。なお、サポートベクタマシンについては、後述する。判別式の値が正の値であれば、部分画像が特定のシーンに属すると判断し、サブ部分識別器６１は正カウント値をインクリメントする。また、判別式の値が負の値であれば、部分画像が特定のシーンに属しないと判断し、サブ部分識別器６１は負カウント値をインクリメントする。
【００７８】
次に、サブ部分識別器６１は、正カウント値が肯定閾値よりも大きい否かを判断する（Ｓ３０５）。なお、正カウント値は、特定のシーンに属すると判断された部分画像の数を示すものである。正カウント値が肯定閾値より大きければ（Ｓ３０５でＹＥＳ）、サブ部分識別器６１は、識別対象画像が特定のシーンに属すると判断し、肯定フラグを立てる（Ｓ３０６）。この場合、部分識別器６０は、次のサブ部分識別器６１による識別を行わずに、部分識別処理を終了する。例えば、夕景画像であると識別できれば、花や紅葉の識別を行わずに、部分識別処理を終了する。この場合、次のサブ部分識別器６１による識別を省略しているので、部分識別処理の速度を速めることができる。
正カウント値が肯定閾値より大きくなければ（Ｓ３０５でＮＯ）、サブ部分識別器６１は、識別対象画像が特定のシーンに属すると判断できず、次のＳ３０７の処理を行う。
【００７９】
サブ部分識別器６１は、正カウント値と残りの部分画像数との和が肯定閾値よりも小さければ（Ｓ３０７でＹＥＳ）、Ｓ３０９の処理へ進む。正カウント値と残りの部分画像数との和が肯定閾値よりも小さい場合、残り全ての部分画像によって正カウント値がインクリメントされても正カウント値が肯定閾値より大きくなることがないので、Ｓ３０９に処理を進めることによって、残りの部分画像についてサポートベクタマシンによる識別を省略する。これにより、部分識別処理の速度を速めることができる。
【００８０】
サブ部分識別器６１がＳ３０７でＮＯと判断した場合、サブ部分識別器６１は、次の部分画像の有無を判断する（Ｓ３０８）。なお、本実施形態では、６４個に分割された部分画像の全てを順に選択していない。図１８において太枠で示された上位１０番目までの１０個の部分画像だけを順に選択している。このため、１０番目の部分画像の識別を終えれば、サブ部分識別器６１は、Ｓ３０８において次の部分画像はないと判断する。（この点を考慮して、Ｓ３０７の「残りの部分画像数」も決定される。）
図１９は、上位１０番目までの１０個の部分画像だけで夕景画像の識別をしたときのRecall及びPrecisionのグラフである。図に示すような肯定閾値を設定すれば、正答率（Precision）を８０％程度に設定でき、再現率（Recall）を９０％程度に設定でき、精度の高い識別が可能である。
【００８１】
本実施形態では、１０個の部分画像だけで夕景画像の識別を行っている。このため、本実施形態では、６４個の全ての部分画像を用いて夕景画像の識別を行うよりも、部分識別処理の速度を速めることができる。
また、本実施形態では、夕景部分画像の存在確率の高い上位１０番目の部分画像を用いて夕景画像の識別を行っている。このため、本実施形態では、存在確率を無視して抽出された１０個の部分画像を用いて夕景画像の識別を行うよりも、Recall及びPrecisionをともに高く設定することが可能になる。
また、本実施形態では、夕景部分画像の存在確率の高い順に部分画像を選択している。この結果、早い段階でＳ３０５の判断がＹＥＳになりやすくなる。このため、本実施形態では、存在確率の高低を無視した順で部分画像を選択したときよりも、部分識別処理の速度を速めることができる。
【００８２】
Ｓ３０７においてＹＥＳと判断された場合、又は、Ｓ３０８において次の部分画像がないと判断された場合、サブ部分識別器６１は、負カウント値が否定閾値よりも大きいか否かを判断する（Ｓ３０９）。この否定閾値は、前述の全体識別処理における否定閾値（図１０のＳ２０６）とほぼ同様の機能を果たすものなので、詳しい説明は省略する。Ｓ３０９でＹＥＳと判断された場合、図１０のＳ２０７と同様に、否定フラグを立てる。
【００８３】
Ｓ３０２においてＮＯの場合、Ｓ３０９でＮＯの場合、又はＳ３１０の処理を終えた場合、部分識別器６０は、次のサブ部分識別器６１の有無を判断する（Ｓ３１１）。夕景部分識別器６１Ｓによる処理を終えた後の場合、サブ部分識別器６１として花部分識別器６１Ｆや紅葉部分識別器６１Ｒがまだあるので、部分識別器６０は、Ｓ３１１において、次のサブ部分識別器６１があると判断する。
【００８４】
そして、Ｓ３０６の処理を終えた場合（識別対象画像が特定のシーンに属すると判断された場合）、又は、Ｓ３１１において次のサブ部分識別器６１がないと判断された場合（識別対象画像が特定のシーンに属すると判断できなかった場合）、部分識別器６０は、部分識別処理を終了する。
【００８５】
なお、既に説明した通り、部分識別処理が終了すると、シーン識別部３３は、部分識別処理によってシーンの識別ができたか否かを判断する（図８のＳ１０６）。このとき、シーン識別部３３は、図１１の識別対象テーブルを参照し、「肯定」欄に１があるか否かを判断することになる。
【００８６】
部分識別処理によってシーンの識別ができた場合（Ｓ１０６でＹＥＳ）、統合識別処理が省略される。これにより、シーン識別処理の速度が速くなる。
【００８７】
＝＝＝サポートベクタマシン＝＝＝
統合識別処理について説明する前に、全体識別処理のサブ識別器５１や部分識別処理のサブ部分識別器６１において用いられているサポートベクタマシン（ＳＶＭ）について説明する。
【００８８】
図２０Ａは、線形サポートベクタマシンによる判別の説明図である。ここでは、２つの特徴量ｘ１、ｘ２によって、学習用サンプルを２次元空間に示している。学習用サンプルは２つのクラスＡ、Ｂに分けられている。図中では、クラスＡに属するサンプルは丸で示されており、クラスＢに属するサンプルは四角で示されている。
学習用サンプルを用いた学習によって、２次元空間を２つに分ける境界が定義される。境界は、＜ｗ・ｘ＞＋ｂ＝０で定義される（なお、ｘ＝（ｘ１，ｘ２）であり、ｗは重みベクトルであり、＜ｗ・ｘ＞はｗとｘの内積である）。但し、境界は、マージンが最大になるように、学習用サンプルを用いた学習によって定義される。つまり、図の場合、境界は、太点線ではなく、太実線のようになる。
判別は、判別式ｆ（ｘ）＝＜ｗ・ｘ＞＋ｂを用いて行われる。ある入力ｘ（この入力ｘは学習用サンプルとは別である）について、ｆ（ｘ）＞０であればクラスＡに属すると判別され、ｆ（ｘ）＜０であればクラスＢに属すると判別される。
ここでは２次元空間を用いて説明しているが、これに限られない（つまり、特徴量は２以上でも良い）。この場合、境界は超平面で定義される。
【００８９】
ところで、２つのクラスに線形関数で分離できないことがある。このような場合に線形サポートベクタマシンによる判別を行うと、判別結果の精度が低下する。そこで、入力空間の特徴量を非線形変換すれば、すなわち入力空間からある特徴空間へ非線形写像すれば、特徴空間において線形関数で分離することができるようになる。非線形サポートベクタマシンでは、これを利用している。
【００９０】
図２０Ｂは、カーネル関数を用いた判別の説明図である。ここでは、２つの特徴量ｘ１、ｘ２によって、学習用サンプルを２次元空間に示している。図２０Ｂの入力空間からの非線形写像が図２０Ａのような特徴空間になれば、線形関数で２つのクラスに分離することが可能になる。この特徴空間においてマージンが最大になるように境界が定義されれば、特徴空間における境界の逆写像が、図２０Ｂに示す境界になる。この結果、図２０Ｂに示すように、境界は非線形になる。
【００９１】
本実施形態ではガウスカーネルを利用することにより、判別式ｆ（ｘ）は次式のようになる（なお、Ｍは特徴量の数であり、Ｎは学習用サンプルの数（若しくは境界に寄与する学習用サンプルの数）であり、ｗ_ｉは重み係数であり、ｙ_ｊは学習用サンプルの特徴量であり、ｘ_ｊは入力ｘの特徴量である）。
【数１】

【００９２】
ある入力ｘ（この入力ｘは学習用サンプルとは別である）について、ｆ（ｘ）＞０であればクラスＡに属すると判別され、ｆ（ｘ）＜０であればクラスＢに属すると判別される。また、判別式ｆ（ｘ）の値が大きい値になるほど、入力ｘ（この入力ｘは学習用サンプルとは別である）がクラスＡに属する確率が高くなる。逆に、判別式ｆ（ｘ）の値が小さい値になるほど、入力ｘ（この入力ｘは学習用サンプルとは別である）がクラスＡに属する確率が低くなる。前述の全体識別処理のサブ識別器５１や部分識別処理のサブ部分識別器６１では、上記のサポートベクタマシンの判別式ｆ（ｘ）の値を用いている。
【００９３】
なお、学習用サンプルとは別に評価用サンプルが用意されている。前述のRecallやPrecisionのグラフは、評価用サンプルに対する識別結果に基づくものである。
【００９４】
＜本実施形態で用いられる特徴量について＞
前述したように、ユーザは、モード設定ダイヤル２Ａによって、撮影モードを設定することができる。そして、デジタルスチルカメラ２は、設定された撮影モードや撮影時の測光結果等に基づいて、撮影条件（露光時間、ＩＳＯ感度等）を決定し、決定した撮影条件にて被写体を撮影する。撮影後、デジタルスチルカメラ２は、撮影時の撮影条件を示す撮影データを、画像データとともに、画像ファイルとしてメモリカード６に保存する。
【００９５】
ところで、ユーザが撮影モードを設定し忘れたために、撮影条件に不適切な撮影モードが設定されたまま、撮影が行われることがある。例えば、夜景モードが設定されたまま、日中の風景が撮影されることがある。この場合、画像ファイルの画像データは日中の風景の画像であるにも関わらず、撮影データには夜景モードを示すデータが記憶されることになる（例えば図５の撮影シーンタイプデータが「３」になる）。
【００９６】
仮に撮影シーンタイプデータや撮影モードデータを特徴量とすると、ユーザが撮影モードの設定を忘れたときに、その画像を誤識別する確率が高くなる。この場合、不適切な撮影モードで撮影された画像に対し、更に誤識別結果に基づく補正が施されることになり、補正結果が劣悪なものになるおそれがある。
【００９７】
そこで、本実施形態では、付加データにシーン情報（撮影シーンタイプデータや撮影モードデータ）が含まれていても、このシーン情報は特徴量として抽出しないことにしている。つまり、本実施形態では、画像データに基づいて取得される特徴量と、シーン情報以外の付加データとを特徴量としている。なお、シーン情報以外の付加データを特徴量とする場合、露出時間（Exposure Time）、Ｆ値（F Number）、シャッタースピード（Shutter Speed Value）、絞り値（Aperture Value）、露光補正値（Exposure Bias Value）、レンズ最小Ｆ値（Max Aperture Value）、被写体距離（Subject Distance）、測光方式（Metering Mode）、光源（Light Source）、フラッシュ（Flash）、ホワイトバランス（White Balance）など、幅広い撮影データを特徴量とすることができる。
【００９８】
シーン情報以外の上記の付加データのうち、デジタルスチルカメラの制御内容を示す制御データを特徴量とすれば、誤識別する確率を減らすことが可能になる。なぜなら、デジタルスチルカメラの制御に応じて画像データの画質が異なるため、制御データを特徴量として識別処理を行えば、撮影時のデジタルスチルカメラの制御内容を考慮して画質を識別することになるからである。デジタルスチルカメラの制御データとしては、例えば、撮影時のデジタルスチルカメラの動作を示すデータ（例えば、絞り値、シャッタースピードなど）や、撮影後のデジタルスチルカメラの画像処理を示すデータ（例えば、ホワイトバランスなど）が含まれる。
【００９９】
制御データのうち、特に明るさに関連する制御データを特徴量とすれば、誤識別する確率を減らすことが可能になる。明るさに関連する制御データとしては、例えば、絞り値、シャッタースピード、ＩＳＯ感度などが含まれる。つまり、明るさに関連する制御データは、言い換えると、デジタルスチルカメラのＣＣＤに入る光量に関連するデータでもある。
仮に、同程度に暗い２つの画像を識別する際に画像の明るさに関連する制御データを特徴量とせずに識別処理が行われると、どちらも例えば「夜景」に識別されるかもしれない。しかし、例えばシャッタースピードを特徴量とすれば、シャッタースピードが長いにも関わらず暗い画像なのか、シャッタースピードが短いために暗い画像なのかを考慮して、識別を行うことができる。逆光による暗い画像の場合にはシャッタースピードが短いため、シャッタースピードを特徴量とすれば、逆光による暗い画像を「夜景」と誤識別する確率を減らすことができる。
【０１００】
また、制御データのうち、画像の色に関連する制御データを特徴量とすれば、誤識別する確率を減らすことが可能になる。画像の色に関連する制御データとしては、例えばホワイトバランスなどが含まれる。
仮に、同程度に赤味の強い２つの画像を識別する際に、画像の色に関連するデータを特徴量とせずに識別処理が行われると、どちらも例えば「夕景」に識別されるかもしれない。しかし、例えばホワイトバランスを特徴量とすれば、赤色を強調する画像処理のために赤味の強い画像なのか、赤色を強調する画像処理が行われていないにも関わらず赤味の強い画像なのかを考慮して、識別を行うことができる。ホワイトバランスを特徴量にすることによって前者の画像よりも後者の画像が「夕景」に識別され難くなれば、誤識別する確率を減らすことが可能になる。
【０１０１】
特徴量に用いられる付加データは、連続的な値を示すものもあるし、離散的な値を示すものもある。例えば、シャッタースピードや絞り値などの物理的な量を示す付加データの場合、連続的な値を示すことになる。一方、測光方式やフラッシュのＯＮ／ＯＦＦを示す付加データの場合、離散的な値を示すことになる。いずれの場合であっても、前述の判別式ｆ（ｘ）の特徴量ｙ_ｊ（学習用サンプルの特徴量）や特徴量ｘ_ｊ（入力ｘの特徴量）として、付加データの示す値を用いることができる。
【０１０２】
そして本実施形態では、学習用サンプルから特徴量を取得し、この特徴量を用いて判別式を求める。求められた判別式は、サブ識別器５１やサブ部分識別器６１を構成するためのプログラムの一部に組み込まれることになる。そして、識別対象画像の属するシーンを識別するときに、画像ファイルから特徴量を取得し、判別式の値を算出し、この判別式の値に基づいて識別を行うことになる。
【０１０３】
なお、シーン情報を特徴量にしつつ、ダイヤル設定ミスがあっても正解率を高めるようにするためには、ダイヤル設定ミスを含む学習用サンプルを用意する必要がある。しかし、このような学習用サンプルを用意することは困難であり、また、仮に用意できても学習用サンプルの数が増えてしまう。また、学習用サンプルの数が増えると判別式の計算量が増えてしまい、識別器の処理速度が低下する。このような点からも、シーン情報は特徴量にしないことが望ましい。
【０１０４】
本実施形態によれば、識別対象画像を誤識別する確率を軽減することができる。また、ユーザが撮影モードの設定を忘れたときの画像こそ、不適切な撮影モードで撮影されているため、適切に識別されて適切に補正が施されたときの効果が大きい。
【０１０５】
＝＝＝統合識別処理＝＝＝
前述の全体識別処理や部分識別処理では、サブ識別器５１やサブ部分識別器６１における肯定閾値を比較的高めに設定し、Precision（正解率）を高めに設定している。なぜならば、例えば全体識別部の風景識別器５１Ｌの正解率が低く設定されると、風景識別器５１Ｌが紅葉画像を風景画像であると誤識別してしまい、紅葉識別器５１Ｒによる識別を行う前に全体識別処理を終えてしまう事態が発生してしまうからである。本実施形態では、Precision（正解率）が高めに設定されることにより、特定のシーンに属する画像が特定のシーンのサブ識別器５１（又はサブ部分識別器６１）に識別されるようになる（例えば紅葉画像が紅葉識別器５１Ｒ（又は紅葉部分識別器６１Ｒ）によって識別されるようになる）。
【０１０６】
但し、全体識別処理や部分識別処理のPrecision（正解率）を高めに設定すると、全体識別処理や部分識別処理ではシーンの識別ができなくなる可能性が高くなる。そこで、本実施形態では、全体識別処理及び部分識別処理によってシーンの識別ができなかった場合、以下に説明する統合識別処理が行われる。
【０１０７】
図２１は、統合識別処理のフロー図である。以下に説明するように、統合識別処理は、全体識別処理の各サブ識別器５１の判別式の値に基づいて、最も確信度の高いシーンを選択する処理である。
【０１０８】
まず、統合識別器７０は、５つのサブ識別器５１の判別式の値に基づいて、正となるシーンを抽出する（Ｓ４０１）。このとき、全体識別処理の際に各サブ識別器５１が算出した判別式の値が用いられる。
【０１０９】
次に、統合識別器７０は、判別式の値が正のシーンが存在するか否かを判断する（Ｓ４０２）。
判別式の値が正のシーンが存在する場合（Ｓ４０２でＹＥＳ）、最大値のシーンの欄に肯定フラグを立てて（Ｓ４０３）、統合識別処理を終了する。これにより、最大値のシーンに識別対象画像が属すると判断される。
一方、判別式の値が正であるシーンが存在しない場合（Ｓ４０２でＮＯ）、肯定フラグを立てずに、統合識別処理を終了する。これにより、図１１の識別対象テーブルの肯定欄において、１のシーンが無いままの状態になる。つまり、識別対象画像が、どのシーンに属するか識別できなかったことになる。
【０１１０】
なお、既に説明した通り、統合識別処理が終了すると、シーン識別部３３は、統合識別処理によってシーンの識別ができたか否かを判断する（図８のＳ１０８）。このとき、シーン識別部３３は、図１１の識別対象テーブルを参照し、「肯定」欄に１があるか否かを判断することになる。Ｓ４０２でＮＯとの判断の場合、Ｓ１０８の判断もＮＯになる。
【０１１１】
＝＝＝その他の実施の形態＝＝＝
一実施形態としてのプリンタ等を説明したが、上記の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることは言うまでもない。特に、以下に述べる実施形態であっても、本発明に含まれるものである。
【０１１２】
＜プリンタについて＞
前述の実施形態ではプリンタ４がシーン識別処理等をしていたが、デジタルスチルカメラ２がシーン識別処理等をしても良い。また、上記のシーン識別処理を行う情報処理装置は、プリンタ４やデジタルスチルカメラ２に限られるものではない。例えば、大量の画像ファイルを保存するフォトストレージのような情報処理装置が、上記のシーン識別処理を行っても良い。もちろん、パーソナルコンピュータやインターネット上に設置されたサーバーが、上記のシーン識別処理を行っても良い。
【０１１３】
＜画像ファイルについて＞
前述の画像ファイルはＥｘｉｆ形式であったが、画像ファイルフォーマットはこれに限られるものではない。また、前述の画像ファイルは静止画であるが、動画であっても良い。要するに、画像ファイルが画像データと付加データとを備えていれば、前述のようなシーン識別処理を行うことが可能である。
【０１１４】
＜サポートベクタマシンについて＞
前述のサブ識別器５１やサブ部分識別器６１には、サポートベクタマシン（ＳＶＭ）による識別手法が用いられている。しかし、識別対象画像が特定シーンに属するか否かの識別手法は、サポートベクタマシンを用いるものに限られるものではない。例えば、ニューラルネットワーク等のパターン認識を採用しても良い。
【０１１５】
＝＝＝まとめ＝＝＝
（１）前述の実施形態では、プリンタ側コントローラ２０は、画像データから、画像データの示す画像の色平均・分散などを算出する。また、プリンタ側コントローラ２０は、画像データに付加されている付加データから、シーン情報以外の撮影データを取得する。そして、プリンタ側コントローラ２０は、これらの取得したデータを特徴量として、全体識別処理等の識別処理を行い、画像データの示す画像のシーンを識別している。
前述の実施形態では、特徴量にはシーン情報が含まれていない。これは、シーン情報を特徴量とすると、ユーザが撮影モードの設定を忘れたときに、その画像を誤識別する確率が高くなるためである。
【０１１６】
（２）前述の実施形態では、撮影時（画像データを生成したときに相当）のデジタルスチルカメラ（撮影装置に相当）の制御データを特徴量にして、画像のシーンを識別している。このように制御データを特徴量として識別処理を行えば、撮影時のデジタルスチルカメラの制御内容を考慮して画質を識別できるので、誤識別する確率を減らすことが可能になる。
【０１１７】
（３）前述の実施形態では、絞り値やシャッタースピード等の明るさに関連する制御データを特徴量にして、画像のシーンを識別している。これにより、同程度の明るさの画像であっても、識別結果が異なることがある。また、これにより、誤識別する確率を減らすことが可能になる。
【０１１８】
（４）前述の実施形態では、ホワイトバランス等の画像の色に関連する制御データを特徴量にして、画像のシーンを識別している。これにより、同程度の色味の画像であっても、識別結果が異なることがある。また、これにより、誤識別する確率を減らすことが可能になる。
【０１１９】
（５）前述のシーン識別処理では、全体識別処理によってシーンの識別ができない場合（Ｓ１０５でＮＯ）、部分識別処理が行われる（Ｓ１０６）。一方、全体識別処理によってシーンの識別ができた場合（Ｓ１０５でＹＥＳ）、部分識別処理は行われない。これにより、シーン識別処理の速度が速くなる。
【０１２０】
（６）前述の全体識別処理では、サブ識別器５１がサポートベクタマシンによる判別式の値（評価値に相当）を算出し、この値が肯定閾値（第１閾値に相当）より大きければ（Ｓ２０４でＹＥＳ）、特定のシーンであることを識別する（Ｓ２０５）。一方、判別式の値が第１否定閾値（第２閾値に相当）よりも小さければ（Ｓ２０６でＹＥＳ）、否定フラグがたち（Ｓ２０７）、部分識別処理において、その特定のシーンの部分識別処理が省略される（Ｓ３０２）。
例えば、全体識別処理の際に夕景識別器５１Ｓの判別式の値が第１否定閾値よりも小さければ（Ｓ２０６でＹＥＳ）、もはや識別対象画像が夕景画像である確率が低いので、部分識別処理の際に夕景部分識別器６１Ｓを用いても意味が無い。そこで、全体識別処理の際に夕景識別器５１Ｓの判別式の値が第１否定閾値よりも小さければ（Ｓ２０６でＹＥＳ）、図１１の「夕景」欄の「否定」欄を１にして（Ｓ２０７）、部分識別処理の際に、夕景部分識別器６１Ｓによる処理を省略する（Ｓ３０２でＮＯ）。これにより、シーン識別処理の速度が速くなる。（なお、図１６Ａ及び図１６Ｂも参照。）
（７）前述の全体識別処理は、風景識別器５１Ｌを用いた識別処理（第１シーン識別ステップに相当）と、夜景識別器５１Ｎを用いた識別処理（第２シーン識別ステップに相当）とを行う。
ところで、ある画像が風景のシーンに属する確率が高ければ、必然的にその画像が夜景のシーンに属する確率は低くなる。このため、風景識別器５１Ｌの判別式の値（評価値に相当）が大きい場合には、夜景ではないと識別できる場合がある。
そこで、前述の実施形態では、第２否定閾値（第３閾値に相当）が設けられている（図１６Ｂ参照）。そして、風景識別器５１Ｌの判別式の値が夜景の否定閾値（−０．４４）よりも大きい場合（Ｓ２０６でＹＥＳ）、図１１の「夜景」欄の「否定」欄を１にして（Ｓ２０７）、全体識別処理の際に夜景識別器５１Ｎによる処理を省略する（Ｓ２０２でＮＯ）。これにより、シーン識別処理の速度が速くなる。
【０１２１】
（８）前述のプリンタ４（情報処理装置に相当）は、プリンタ側コントローラ２０を備えている（図２参照）。そして、プリンタ側コントローラ２０は、画像データから、画像データの示す画像の色平均・分散などを算出する。また、プリンタ側コントローラ２０は、画像データに付加されている付加データから、シーン情報以外の撮影データを取得する。そして、プリンタ側コントローラ２０は、これらの取得したデータを特徴量として、全体識別処理等の識別処理を行い、画像データの示す画像のシーンを識別している。
これにより、シーン情報を特徴量とせずに識別処理を行うことになるので、ユーザが撮影モードの設定を忘れたときであっても、誤識別の確率を軽減できる。
【０１２２】
（９）前述のメモリ２３には図８の処理をプリンタ４に実行させるプログラムが記憶されている。すなわち、このプログラムは、前記画像データから、前記画像データの示す画像の特徴を示すデータを取得するコードと、画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得するコードと、取得したデータを特徴量として、前記画像データの示す画像のシーンを識別するコードとを備えている。
このようなプログラムによれば、情報処理装置の誤識別の確率を軽減できる。
【図面の簡単な説明】
【０１２３】
【図１】画像処理システムの説明図である。
【図２】プリンタの構成の説明図である。
【図３】画像ファイルの構造の説明図である。
【図４】図４Ａは、ＩＦＤ０で使われるタグの説明図である。図４Ｂは、ＥｘｉｆＳｕｂＩＦＤで使われるタグの説明図である。
【図５】モード設定ダイヤルの設定とデータとの対応表である。
【図６】プリンタの自動補正機能の説明図である。
【図７】画像のシーンと補正内容との関係の説明図である。
【図８】シーン識別部によるシーン識別処理のフロー図である。
【図９】シーン識別部の機能の説明図である。
【図１０】全体識別処理のフロー図である。
【図１１】識別対象テーブルの説明図である。
【図１２】全体識別処理の肯定閾値の説明図である。
【図１３】RecallとPrecisionの説明図である。
【図１４】第１否定閾値の説明図である。
【図１５】第２否定閾値の説明図である。
【図１６】図１６Ａは、風景識別器における閾値の説明図である。図１６Ｂは、風景識別器の処理の概要の説明図である。
【図１７】部分識別処理のフロー図である。
【図１８】夕景部分識別器が選択する部分画像の順番の説明図である。
【図１９】上位１０番目までの１０個の部分画像だけで夕景画像の識別をしたときのRecall及びPrecisionのグラフである。
【図２０】図２０Ａは、線形サポートベクタマシンによる判別の説明図である。図２０Ｂは、カーネル関数を用いた判別の説明図である。
【図２１】統合識別処理のフロー図である。
【符号の説明】
【０１２４】
２デジタルスチルカメラ、２Ａモード設定ダイヤル、
４プリンタ、６メモリカード、１０印刷機構、
１１ヘッド、１２ヘッド制御部、１３モータ、１４センサ、
２０プリンタ側コントローラ、２１スロット、２２ＣＰＵ、
２３メモリ、２４制御ユニット、２５駆動信号生成部、
３１記憶部、３１Ａ画像記憶部、３１Ｂ結果記憶部、
３２顔識別部、３３シーン識別部、３４画像補正部、
３５プリンタ制御部、４０特徴量取得部、５０全体識別器、
５１サブ識別器、５１Ｌ風景識別器、５１Ｓ夕景識別器、
５１Ｎ夜景識別器、５１Ｆ花識別器、５１Ｒ紅葉識別器、
６０部分識別器、６１サブ部分識別器、６１Ｓ夕景部分識別器、
６１Ｆ花部分識別器、６１Ｒ紅葉部分識別器、７０統合識別器、

【特許請求の範囲】
【請求項１】
画像データから、前記画像データの示す画像の特徴を示すデータを取得するステップと、
前記画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得するステップと、
前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別するステップと、
を有することを特徴とする情報処理方法。
【請求項２】
請求項１に記載の情報処理方法であって、
前記シーンに関するデータ以外のデータは、前記画像データを生成したときの撮影装置の制御データである
ことを特徴とする情報処理方法。
【請求項３】
請求項２に記載の情報処理方法であって、
前記制御データは、前記画像の明るさに関連するデータである
ことを特徴とする情報処理方法。
【請求項４】
請求項２に記載の情報処理方法であって、
前記制御データは、前記画像の色に関連するデータである
ことを特徴とする情報処理方法。
【請求項５】
請求項１〜４のいずれかに記載の情報処理方法であって、
前記画像の特徴を示すデータを取得するステップは、
前記画像の全体の特徴を示すデータと、前記画像に含まれる部分画像の特徴を示すデータとを取得し、
前記シーンを識別するステップは、
前記画像の全体の特徴を示すデータを用いて、前記画像データの示す画像のシーンを識別する全体識別ステップと、
前記部分画像の特徴を示すデータを用いて、前記画像データの示す画像のシーンを識別する部分識別ステップと、
を有し、
前記全体識別ステップにおいて前記画像のシーンを識別できない場合、前記部分識別ステップが行われ、
前記全体識別ステップにおいて前記画像のシーンを識別できた場合、前記部分識別ステップは行われない
ことを特徴とする情報処理方法。
【請求項６】
請求項５に記載の情報処理方法であって、
前記全体識別ステップは、
前記画像の全体の特徴を示すデータを用いて、前記画像が所定のシーンである確率に応じた評価値を算出し、
前記評価値が第１閾値より大きければ、前記画像が前記所定のシーンであると識別でき、
前記部分識別ステップは、
前記部分画像の特徴を示すデータを用いて、前記画像が前記所定のシーンであることを識別し、
前記全体識別ステップにおける前記評価値が第２閾値より小さい場合、前記部分識別ステップは行われない
ことを特徴とする情報処理方法。
【請求項７】
請求項１〜４のいずれかに記載の情報処理方法であって、
前記シーンを識別するステップは、
前記特徴量に基づいて、前記画像が第１シーンであることを識別する第１シーン識別ステップと、
前記特徴量に基づいて、前記画像が第１シーンとは異なる第２シーンであることを識別する第２シーン識別ステップと、
を有し、
前記第１シーン識別ステップは、
前記特徴量に基づいて、前記画像が前記第１シーンである確率に応じた評価値を算出し、
前記評価値が第１閾値より大きければ、前記画像が第１シーンであると識別でき、
前記シーンを識別するステップにおいて、
前記第１識別ステップにおける前記評価値が第３閾値より大きければ、前記第２シーン識別ステップを行わない
ことを特徴とする情報処理方法。
【請求項８】
画像データから、前記画像データの示す画像の特徴を示すデータを取得する第１取得手段と、
画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得する第２取得手段と、
前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別する識別手段と、
を備えることを特徴とする情報処理装置。
【請求項９】
情報処理装置に、
画像データから、前記画像データの示す画像の特徴を示すデータを取得するステップと、
画像データに付加されている付加データから、シーンに関するデータ以外のデータを取得するステップと、
取前記画像の特徴を示すデータと、前記シーンに関するデータ以外のデータとを特徴量として、前記画像のシーンを識別するステップと、
を実行させるプログラム。

【図１】