説明

撮像装置及びコンピュータ読み取り可能な記憶媒体

【課題】 被写体画像から容易に人物等の特定の被写体を検出し、それに合わせてAF、AR、AWB等を行えるようにする。
【解決手段】 CCD3で撮像した画像信号は処理された後、評価値検出部9で被写体の人物部分を識別するための評価値が生成し、この評価値に基づいて人物部分を識別する。マイクロプロセッサ12は上記の識別結果を用いてカメラの光量調節部1、自動焦点調節部2、白バランス調節部7を制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像を撮影する撮像装置から得られる画像信号から特定の被写体を検出して撮像動作を行う撮像装置及びコンピュータ読み取り可能な記憶媒体に関するものである。
【背景技術】
【0002】
民生用のビデオカメラ等の撮像装置においては、従来より自動露光制御装置(AE)、自動焦点制御装置(AF)、自動白バランス補正装置(AWB)等が装備されている。それらの制御方法として従来から主に用いられるのは、撮影した画像信号から、何らかの評価値、例えば自動露光制御であれば撮影した画像の輝度分布、自動焦点制御では所定の周波数成分レベル、白バランス補正では各色信号のレベルの分布等を抽出し、それらの評価値に基づき所定のアルゴリズムで上記各制御を行っている(例えば、特許文献1参照)。
【0003】
さて、AF、AE、AWBを行う主たる目的は、撮影したい被写体を撮影者が意識しなくても、露出レベル、焦点距離、白バランス等を常に良好な状態に保ち、撮影ができるようにすることにある。しかしながら上記従来の各制御方法では、被写体が何であろうと画像の所定の範囲から抽出される評価量に従って制御するため、場合によって被写体以外の対象物に対して上記各制御が行われ、撮影者の意図に合わないことが生じる。こうした問題の従来の解決方法として、被写体は撮影画像の中央にあることが多いということから、上記各制御用の評価値を画像の中央付近の範囲からのみ抽出するという方式がとられている。
【0004】
【特許文献1】特開平4−271674号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記従来の方式では、被写体が画面の中央にあることが前提となっているため、限られた撮影条件のもとでしか効果がない。
【0006】
従って、本発明は、画像信号から特定のパターンを容易に識別できるようにし、カメラに適用した場合に特定の被写体に対してAF、AE、AWBを行えるようにすることを目的としている。
【課題を解決するための手段】
【0007】
本発明の撮像装置の第1の態様は、撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手段と、検出された位置に対して自動焦点制御を行う焦点制御手段とを有することを特徴とする。
本発明の撮像装置の第2の態様は、撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手段と、検出された位置に対して自動露光制御を行う露光制御手段とを有することを特徴とする。
本発明の撮像装置の第3の態様は、撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手段と、検出された位置に対して自動白バランス補正を行う白バランス制御手段とを有することを特徴とする。
本発明のコンピュータ読み取り可能な記憶媒体の第1の態様は、撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手順と、検出された位置に対して自動焦点制御を行う焦点制御手順とをコンピュータに実行させるためのプログラムを記憶したことを特徴とする。
本発明のコンピュータ読み取り可能な記憶媒体の第2の態様は、撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手順と、検出された位置に対して自動露光制御を行う露光制御手順とをコンピュータに実行させるためのプログラムを記憶したことを特徴とする。
本発明のコンピュータ読み取り可能な記憶媒体の第3の態様は、撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手順と、検出された位置に対して自動白バランス補正を行う白バランス制御手順とをコンピュータに実行させるためのプログラムを記憶したことを特徴とする。
【発明の効果】
【0008】
本発明によれば、撮像画像の中から特定の被写体を検出し、当該被写体に関してより効果的な処理、例えば自動露光制御、自動焦点制御、自動白バランス調整等を行うことができる。
【発明を実施するための最良の形態】
【0009】
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。
【0010】
<第1の実施形態>
図1は、本発明の第1の実施形態に係る撮像装置の構成を示すものであって、撮影された映像から人物を特定し、当該人物に対してAF、AE、AWBの各機能を重点的に動作させるものである。図1において、1は絞り等の光量調節部、2はレンズを含む自動焦点調節部、3はCCD撮像素子、4はオートゲインコントロール部、5はA/Dコンバータ、6は第1の画像信号処理部、7は白バランスゲイン調節部、8は第2の画像信号処理部、9は撮影された画像内の人物の部分を識別するための評価用信号を生成する評価値検出部、10は第1のマイクロプロセッサ、11は多層フィードフォワード型ニューラルネットワークであって、パターン識別の正確さを表す評価値を検出して出力する手段を含む。12は第2のマイクロプロセッサ、13は輝度信号出力端子、14は色信号出力端子である。
【0011】
次に動作について説明する。CCD撮像素子3には、光量調節部1、自動焦点調節部2により調節された光学像が結像され、この光学像を光電変換してCCD画像信号として出力する。このCCD画像信号は、オートゲインコントロール部4により適切な振幅に調節された後、第1の画像信号処理部6で処理されて所定の形式の信号とされ、さらに白バランスゲイン調節部7で上記所定の形式の信号に対して白バランスゲイン調節される。次に第2の画像信号処理部8で輝度信号Yと色信号Cとに分離され、輝度信号Yは、輝度信号出力端子13から出力され、色信号Cは色信号出力端子14から出力される。
【0012】
また、評価値検出部9には、各画像信号処理部6、8から所定の形式の画像信号が送られ、撮影した画像内の人物の部分を識別するための評価用信号が生成される。この評価値検出部9の出力評価値は、第1のマイクロプロセッサ10と多層フィードフォワード型ニューラルネットワーク11とに送られる。
【0013】
この多層フィードフォワード型ニューラルネットワーク11は、あらかじめ様々な撮影条件における上記評価値を入力したとき、画像内の人物の部分を正しく識別するように学習させたものである。従って、学習させた撮影条件と同じかまたはそれに近い場合には、上記ニューラルネットワーク11は、適切に人物部分の識別を行うと共に、その識別の正確さを表す評価値が出力される。第2のマイクロプロセッサ12は、上記正確さを表す評価値を検出し、所定以上の評価値と判定された場合は、ニューラルネットワーク11の識別結果を用いて、光量調節部1、自動焦点調節部2、白バランスゲイン調節部7を画像の人物の部分に対して効果的に働くような制御信号を生成して制御する。
【0014】
一方、学習させた撮影条件と著しく異なるような特殊な状態では、上記ニューラルネットワーク11の識別結果は適切なものとはならず、かつ上記正確さを表す評価値もそうした状態を表すことになる。第1のマイクロプロセッサ10は上記正確さを表す評価値を検出し、上記ニューラルネットワーク11が誤って識別した状態においてのみ、ニューラルネットワーク11に代わって画像内の人物の部分を識別するように動作する。その動作のプログラムは、ニューラルネットワーク11が誤って識別するような条件を、このニューラルネットワーク11の学習時にあらかじめ特定して置き、これら特定の場合に対応するように組まれたものである。そのため比較的小さなプログラム量で済み、第1のマイクロプロセッサ10の負荷も、その能力内で十分対応可能なものとなっている。
【0015】
また、第2のマイクロプロセッサ12では、上記正確さを表す評価値に基づいて第1のマイクロプロセッサ10の識別結果から、光量調節部1、自動焦点調節部2、白バランスゲイン調節部7を画像の人物の部分に対して効果的に働くように制御する。
【0016】
<第2の実施形態>
次に、本発明の第2の実施形態について説明する。図2は、本発明の第2の実施形態に係る撮像装置の構成を示す図であり、第1の実施形態と同様に、撮影された映像から人物を特定し、当該人物に対してAF、AE、AWBの各機能を重点的に動作させるものである。図2において、1は光量調節部、2は自動焦点調節部、3はCCD撮像素子、4はオートゲインコントロール部、5はA/Dコンバータ、6は第1の画像信号処理部、7は白バランス調節部、8は第2の画像信号処理部である。
【0017】
9は評価値検出部で、撮影画像を水平、垂直8×8の64個のブロックに分割し、各ブロックの肌色と黒の平均レベル(合計128個)とを出力する。10は第1のマイクロプロセッサ、13は輝度信号出力端子、14は色信号出力端子である。
【0018】
11は入力層、中間層、出力層からなる多層フィードフォワード型ニューラルネットワークであって、入力層は128個のセル、中間層はSigmoid関数の出力特性を持つ32個のセル、出力層はSigmoid関数の出力特性を持つ9個のセルからなり、入力層は評価値検出部9の出力する128個の肌色及び黒の各ブロック平均レベルが入力される。また、出力層の9個のセルは、画面を3×3の領域分割した各領域対応し、当該領域に人物が存在する場合には1、存在しない場合には0を出力するように学習させたものである。また、中間層32個の各セルは、各々のセルの出力値を別途外部に読み出せる構成としたものである。
【0019】
15は、上記ニューラルネットワーク11の識別結果が信頼できるものであるかを検出する識別結果検出部、16は第2のマイクロプロセッサである。
【0020】
次に動作について説明する。CCD撮像素子3には、光量調節部1、自動焦点調節部2により調節された光学像が結像され、この光学像を光電変換してCCD画像信号として出力する。このCCD画像信号は、オートゲインコントロール部4により適切な振幅に調節された後、第1の画像信号処理部6で処理されて所定の形式の信号とされ、さらに白バランスゲイン調節部7で上記所定の形式の信号に対して白バランスゲインを調節される。次に第2の画像信号処理部8で輝度信号Yと色信号Cとに分離され、輝度信号Yは、輝度信号出力端子13から出力され、色信号Cは色信号出力端子14から出力される。
【0021】
また、評価値検出部9には、第2の画像信号処理部8から輝度信号および色差信号として画像信号が送られる。評価値検出部9では、まず、上記輝度信号と色差信号で表される1フィールドまたは1フレームの画像を水平・垂直に8×8の64個の小ブロックに分割し、次に、各ブロック毎に肌色と黒の平均レベルをそれぞれ計算して出力する。従って、この評価値検出部9からは合計128個の評価値(肌色64個、黒64個)が出力される。上記128個の評価値は第1のマイクロプロセッサ10と多層フィードフォワード型ニューラルネットワーク11とに入力される。
【0022】
上記ニューラルネットワーク11は、あらかじめ様々な条件の人物を含む入力画像、例えば一人の人物の正面、側面、ズームアップ、またはワイド画面等や、複数の人物の画像等、多数のテスト画像に対して、評価値検出部9で評価値を作成して、これを学習データとして用い、出力層の9個のセルが、その時出力すべき答えを教師データとしてあらかじめ学習させたものである(出力層の9個のセルは、前述の通り画面を9個の小領域に分割したときの各領域に対応する)。
【0023】
従って、学習させた撮影条件と同じかまたはそれに近い場合には、上記ニューラルネットワーク11は、適切に人物部分の識別を行う。逆に、学習した条件と著しく異なる場合、ニューラルネットワーク11による識別結果は誤ったものとなる。
【0024】
多層フィードフォワード型ニューラルネットワーク11の出力結果が正しいかどうかを判断するには、出力層の出力値以外にも、中間層の出力値から推測することができる。これは以下の理由による。即ち、多層フィードフォワード型ニューラルネットワークは、その学習の過程で、入力データに対する出力と教師データとの差に基づき、各セル間のネットの重み係数を少しずつ変更してゆき、変更後の出力と教師データとの差を出し、これを何回も繰り返して学習してゆく。中間層の各セルでは、入力層の128個のセルの出力値に当該中間層のセルにつながるネットの重みをかけた128個の入力値を全て加算し、それにSigmoid関数をかけた値が出力されるが、Sigmoid関数は例えば最小値が0で最大値が1となるような出力値の上下に飽和する非線形関数である。
【0025】
従って、多層フィードフォワード型ニューラルネットワークが学習の過程で順調に所望の機能を学習するためには、ネットの重み係数を微小に変化させたとき、中間層の出力値も微小に変化できなければならない。換言すれば、うまく学習が完了した状態では、中間層の出力は、例えば0または1などの飽和状態にはならないと考えることができる。
【0026】
従って、識別結果検出部12では、多層フィードフォワード型ニューラルネットワーク11の中間層の32個のセルの出力がどれも飽和状態でなければ、当該ニューラルネットワークの識別結果は正、前記32個の出力のうちのどれかが飽和状態であれば、誤であるとする。第1のマイクロプロセッサ10は、識別結果検出部15が誤の検出をした場合に、ニューラルネットワーク11に代わり、画像内の人物の部分を検出するように動作する。その動作のプログラムは、ニューラルネットワーク11が誤って識別するような条件を、ニューラルネットワーク11の学習時にあらかじめ特定し、これら特定の場合に対応するように組まれたものである。そのため比較的小さなプログラム量ですみ、第1のマイクロプロセッサ10の負荷も、その能力内で十分対応可能なものとなっている。
【0027】
また、第2のマイクロプロセッサ16では識別結果検出部15の出力が正の場合はニューラルネットワーク11の識別結果を用い、誤の場合は第1のマイクロプロセッサ10の識別結果を用いて画像内の人物の場所を特定し、光量調節部1、自動焦点調節部2、白バランス調節部7を画像の人物の部分に対して効果的に働くように制御する。
【0028】
尚、図1、図2の機能ブロックによるシステムは、ハード的に構成してもよく、また、CPUやメモリ等から成るマイクロコンピュータシステムに構成してもよい。マイクロコンピュータシステムに構成する場合、上記メモリは本発明による記憶媒体を構成する。この記憶媒体には、図1、図2について前述した処理を実行するためのプログラムが記憶されている。またこの記憶媒体としてはROM、RAM等の半導体メモリ、光ディスク、光磁気ディスク、磁気媒体等を用いてもよく、これらをCD−ROM、フロィピディスク、磁気テープ、不揮発性のメモリカード等して用いてもよい。
【0029】
上述したように、上記の実施形態においては、従来のコンピュータのようにプログラムに基づく直列処理では困難なパターン識別やクラスタリング等を、あらかじめ学習させることにより比較的容易に行うことができる多層フィードフォワード型ニューラルネットワークを用い、特定の輝度分布、エッジの形、色等の特徴量が、撮像画像中に見いだされた時、その位置を出力し、当該位置に対してAF、AE、AWBを重点的に制御するという構成にしている。
【0030】
ただし、上記多層フィードフォワード型ニューラルネットワークは、識別すべきパターンの数が増える程、規模の増大、学習の困難さの増大、学習後の精度の低下(正解率の低下)をまねくということが一般的に言える。従って、上記特定被写体の検出を全て多層フィードフォワード型ニューラルネットワークで行っても、所望の機能を得ることが困難であると考えられる。
【0031】
そこで上記実施形態では、あえて多層フィードフォワード型ニューラルネットワークで、全ての特定被写体検出を行うのではなく、所定の規模と検出能力を持つニューラルネットワークで特定被写体の検出を行うが、ニューラルネットワークが誤って被写体検出を行う状態を検出し、その場合には多層フィードフォワード型ニューラルネットワークに代わって被写体検出を行う第2の識別部を設けている。
【0032】
これにより、多層フィードフォワード型ニューラルネットワークは適当な規模のもので、例えば90〜95%の正解率を持つものとし、残りの5〜10%は第2の識別部でカバーする。このようにして、全体としての特定被写体検出の能力を高めることを実現することができる。
【図面の簡単な説明】
【0033】
【図1】本発明の第1の実施形態に係る撮像装置の構成を示すブロック図である。
【図2】本発明の第2の実施形態に係る撮像装置の構成を示すブロック図である。
【符号の説明】
【0034】
1 光量調節部
2 自動焦点調節部
3 CCD撮像素子
6 第1の画像信号処理部
7 白バランスゲイン調節部
8 第2の画像信号処理部
9 評価値検出部
10 第1のマイクロプロセッサ
11 多層フィードフォワード型ニューラルネットワーク
12、16 第2のマイクロプロセッサ
15 識別結果検出部

【特許請求の範囲】
【請求項1】
撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手段と、
検出された位置に対して自動焦点制御を行う焦点制御手段とを有することを特徴とする撮像装置。
【請求項2】
撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手段と、
検出された位置に対して自動露光制御を行う露光制御手段とを有することを特徴とする撮像装置。
【請求項3】
撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手段と、
検出された位置に対して自動白バランス補正を行う白バランス制御手段とを有することを特徴とする撮像装置。
【請求項4】
前記検出手段は、前記撮像画像のエッジの形と識別パターンを比較することによって特定被写体の位置を検出することを特徴とする請求項1から3の何れか1項に記載の撮像装置。
【請求項5】
前記検出手段は、前記撮像画像の輝度分布と識別パターンを比較することによって特定被写体の位置を検出することを特徴とする請求項1から4の何れか1項に記載の撮像装置。
【請求項6】
前記検出手段は、特定の人物の複数画像から前記識別パターンを形成することを特徴とする請求項1から5の何れか1項に記載の撮像装置。
【請求項7】
前記検出手段は、前記撮像画像と識別パターンとを比較することによって特定被写体の位置を検出する多層フィードフォワード型ニューラルネットワークを用いた第1の検出手段と、前記第1の検出手段の検出結果が誤っていると判定した場合に、前記撮像画像から前記特定被写体の位置を検出する第2の検出手段とを有することを特徴とする請求項1から6の何れか1項に記載の撮像装置。
【請求項8】
前記第1及び第2の検出手段は、前記撮像画像について前記識別パターンに関する評価を行う評価手段を有し、その評価値に基づいてそれぞれ特定被写体の位置を検出することを特徴とする請求項7に記載の撮像装置。
【請求項9】
前記多層フィードフォワード型ニューラルネットワークは、中間層に、大小双方向に飽和レベルを持つ非線形の入出力特性を有し、前記第2の検出手段は、前記中間層のセルの出力が、前記飽和レベルにない場合には前記第1の検出手段の検出結果を正、前記飽和レベル又はそれに所定の範囲で近い値の場合は前記第1の検出手段の検出結果を誤とすることを特徴とする請求項7に記載の撮像装置。
【請求項10】
撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手順と、
検出された位置に対して自動焦点制御を行う焦点制御手順とをコンピュータに実行させるためのプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
【請求項11】
撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手順と、
検出された位置に対して自動露光制御を行う露光制御手順とをコンピュータに実行させるためのプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
【請求項12】
撮像素子から得られた撮像画像から、識別パターンと比較することによって特定被写体の位置を検出する検出手順と、
検出された位置に対して自動白バランス補正を行う白バランス制御手順とをコンピュータに実行させるためのプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
【請求項13】
前記検出手順は、前記撮像画像のエッジの形と識別パターンを比較することによって特定被写体の位置を検出することを特徴とする請求項10から12の何れか1項に記載のコンピュータ読み取り可能な記憶媒体。
【請求項14】
前記検出手順は、前記撮像画像の輝度分布と識別パターンを比較することによって特定被写体の位置を検出することを特徴とする請求項10から13の何れか1項に記載のコンピュータ読み取り可能な記憶媒体。
【請求項15】
前記検出手順は、特定の人物の複数画像から前記識別パターンを形成することを特徴とする請求項10から14の何れか1項に記載のコンピュータ読み取り可能な記憶媒体。
【請求項16】
前記検出手順は、前記撮像画像と識別パターンとを比較することによって特定被写体の位置を検出する多層フィードフォワード型ニューラルネットワークを用いた第1の検出手順と、前記第1の検出手順の検出結果が誤っていると判定した場合に、前記撮像画像から前記特定被写体の位置を検出する第2の検出手順とを含むことを特徴とする請求項10から15の何れか1項に記載のコンピュータ読み取り可能な記憶媒体。
【請求項17】
前記第1及び第2の検出手順は、前記撮像画像について前記識別パターンに関する評価を行う評価手順を含み、その評価値に基づいてそれぞれ特定被写体の位置を検出することを特徴とする請求項16に記載のコンピュータ読み取り可能な記憶媒体。
【請求項18】
前記多層フィードフォワード型ニューラルネットワークは、中間層に、大小双方向に飽和レベルを持つ非線形の入出力特性を有し、前記第2の検出手順は、前記中間層のセルの出力が、前記飽和レベルにない場合には前記第1の検出手順の検出結果を正、前記飽和レベル又はそれに所定の範囲で近い値の場合は前記第1の検出手順の検出結果を誤とすることを特徴とする請求項17に記載のコンピュータ読み取り可能な記憶媒体。

【図1】
image rotate



【図2】
image rotate


【公開番号】特開2005−160122(P2005−160122A)
【公開日】平成17年6月16日(2005.6.16)
【国際特許分類】
【出願番号】特願2005−61281(P2005−61281)
【出願日】平成17年3月4日(2005.3.4)
【分割の表示】特願平10−54866の分割
【原出願日】平成10年3月6日(1998.3.6)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】