説明

カラー機器の特性付け方法及び装置、画像色補正方法及び装置、カラー画像データ伝送及び/又は記録方法及び記録媒体

電子カメラによって撮像されたカラー画像のデータに対して色補正を行う色補正方法及び色補正装置は、ニューラルネットワーク、多層パーセプトロンモデル及び/又は強制ニューロ−ファジイ干渉システムモデルを用いて、推定された光源に基づいて、カラー画像を表すデータに対する色補正を決定し、カラー画像を表すデータに対する補正を行う。色補正されたデータを表すデータは、記録又は伝送される。電子カメラによって撮像された画像データを記録するデータ記録方法は、カラー画像を撮像し、そのカラー画像を表すデータを出力し、撮像されたカラー画像の光源を推定し、推定された光源を表すデータを出力し、カラー画像を表すデータと推定された光源を表すデータを記録する。電子カメラによって撮像された画像データを伝送するデータ伝送方法は、カラー画像を撮像し、そのカラー画像を表すデータを出力し、撮像されたカラー画像の光源を推定し、推定された光源を表すデータを出力し、カラー画像を表すデータと推定された光源を表すデータを伝送する。

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、画像の色補正(color correction)に関し、特に電子カラーカメラ(electronic color camera)により得られるカラー画像の色補正を行い、色補正データを出力(transmission)する色補正方法及び装置(color device characterization)と、カラー画像の色補正データを記録した記録媒体に関する。
【0002】
【従来の技術】
従来、電子カラーカメラによって撮像された画像に対して色補正を行う方法には2つの方法がある。第1の方法は、電子カラーカメラの出力データを、色精度(color accuracy)を高め、電子カラーカメラの出力色空間(output color space)と等しい色空間に直接変換するものである。例えば、電子カラーカメラの出力空間が後述するYUVであるとき、その色補正モデル(color correction model)の入力及び出力空間は、YUVであるが、その出力されたYUVデータの色精度は高くなっている。以下、この方法を「機器固有色補正(device specific color correction)」と呼ぶ。「YUV」は画像伝送においてよく用いられる色表現(color representation)である。「Y」は輝度を表し、「U」は青から黄を引いた色にほぼ一致する色の要素を表し、「V」は赤からシアンを引いた色にほぼ一致する色の要素を表している。他の色表現としては、「RGB(赤、緑、青)」や、1つの輝度要素と2つの色差要素からなる色空間を表す「YCC」がある。上述したYUVは、YCC色表現の一例である。YIQは、YCC色表現の他の例であり、ここで、「I」は黄色っぽい赤から薄い青を引いた色にほぼ一致する色の要素を表し、「Q」は紫から緑色っぽい黄を引いた色にほぼ一致する色の要素を表す。YCbCr(輝度、色差−青、色差−赤)は、YCC色表現の更に他の例である。
【0003】
色補正の第2の方法は、2つのステップに分割される。第1のステップでは、電子カラーカメラの出力色空間は、一旦元の測色空間(colorimetric space、XYZ又はL*a*b)に変換される。この測色空間は、国際照明委員会(International Illumination Committee:CIE)、元々フランス語で公表されている)によって定められた空間である。測色空間は、人間の目によって認識される自然の物体の色を表現するものである。測色空間で表現された色情報は、電子カラーカメラによって撮像された画像の元の色に一致する。第2のステップにおいて、このような測色空間に変換された色情報は、出力機器(コンピュータのモニタ又はプリンタ)に特化された色空間に変換され、その全体の画像処理操作(entire image path)によって表色的に正確な色表現が実現される。この2つのステップの概念は、国際色彩委員会(International Color Committee:ICC)におけるカラープロファイルフォーマット(color profile format)に即しており、このプロファイルフォーマットは、色表現に比較的高い精度が求められるコンピュータの画像処理において広く用いられているフォーマットである。ICCの概念に基づいた色補正の分野では、中間測色空間(intermediate colorimetric space)は、しばしば「機器独立色空間(device independent color space)」と呼ばれる。したがって、この色補正方法は、「機器独立色補正(device independent color correction)」と呼ばれる。
【0004】
上述した機器独立色補正を行うためには、電子カラーカメラの色変換の逆写像(inverse function)を求める必要がある。このステップは、電子カラーカメラのための「色補正装置の特性付け(color device characterization)」と呼ばれ、電子カラーカメラによって撮像された画像の色補正を行う際に、このような特性付けが採用される。電子カラーカメラの色変換の逆写像を求める従来の方法は、イメージスキャナ(image scanner)の色変換の逆写像を求めるために広く用いられている方法を応用したものである。ほとんどの電子カラーカメラは、イメージスキャナの信号処理と類似した信号処理を行っているので、この方法は効率的であると考えられている。
【0005】
FIG.1は、イメージスキャナとほとんどの電子カラーカメラの両方において採用されている信号処理を示すブロック図である。FIG.1に示すように、イメージセンサカメラ100のイメージセンサ104に入力されるデータを、測色空間XYZにおけるデータとすると、これらのデータは、入力端子101、102、103にそれぞれ供給される。イメージセンサ104の出力空間はRGBであり、イメージセンサカメラ100の出力空間はYCCである。イメージセンサカメラ100からの出力データは、それぞれYデータ、Cデータ、Cデータに対応している出力端子110、111、112から得られる。
【0006】
FIG.1に示すイメージセンサカメラ100における色変換の逆写像を近似するために、FIG.2に示す単純な逆方向モデル(inverse-model)を用いることができる。FIG.2において、各ブロックは、FIG.1における対応するブロックの逆変換を行う必要がある。対応するブロックは、104と124、151と161、152と162、153と163、109と122である。特に、マトリクス回路(matrix)104、109は、それぞれマトリクス回路124、122の逆マトリクス回路である必要がある。通常、1次元ルックアップテーブル(one-dimensional lookup table:1D−LUT)151、152、153によって実現されている階調特性曲線(tone reproduction curve:TRC)は、それぞれ1D−LUT161、162、163の逆写像である必要がある。この色補正モデルは、マトリクス回路とTRCからなるため、「TRC−マトリクスモデル(TRC-matrix model)」と呼ばれる。
【0007】
FIG.1及びFIG.2に示すように、イメージセンサ104の色変換は、3×3マトリクス回路124による線形変換(linear transformation)で近似される。電子カラーカメラの色理論(color science)によれば、イメージセンサのスペクトル解析特性(spectral analysis characteristics)は、CIEにおいて規定されている等色関数(color matching function)xyzの線形結合(linear combination)で表されるのが理想であるとされ、これらの関数は、人間の目の色感度を表すスペクトル関数のセット(set)である。全ての電子カラーカメラは、これらの理想的な特性を指標として設計されているため、多くの場合、3×3マトリクス回路は、電子カラーカメラで用いられるイメージセンサを近似することができ、これにより、電子カラーカメラの色変換の逆写像を非常に正確に求めることができる。しかしながら、このTRC−マトリクスモデル法(TRC-matrix model approach)では、条件により正確な色補正が行えない場合がある。
【0008】
近似の精度(approximation accuracy)
イメージセンサの色変換を、TRC−マトリクスモデルにおける3×3マトリクス回路(FIG.2の124)でうまく近似することができないとき、正確な色補正を行うことがでなくなる。この状態は、多くの初歩的な電子カラーカメラにおいて生じることがある。また、この状態は、電子カラーカメラの信号処理が、FIG.1に示す構成に一致せず、FIG.2に示す構成が、もはや電子カラーカメラの逆モデルでないときに生じる。例えば、FIG.3は、CMYG(シアン、マゼンタ、イエロー、グリーン、「補色(complementary color)」ともいわれる。)の電子カラーカメラにおいて通常用いられている信号処理を示すブロック図である。一見して、FIG.2は、FIG.3の信号処理の逆モデルとして機能することができない。また、CMYG電子カラーカメラの信号処理を行うための構造が複雑なため、FIG.3に示す回路によって行われる信号処理の単純な逆モデルを構築することは容易ではない。
【0009】
光源依存性(illuminant dependency)
電子カラーカメラには、それがスチルカメラであるか、静止画を連続して、又は動画を記録するカメラであるかに関わらず、特有の問題、具体的には色変換が光源に依存するという問題がある。イメージスキャナは、いかなる場合でも、ある定まった備え付けの光源を用いて画像を撮像するのに対して、電子カラーカメラは、様々な光源、例えば夜明け、日中又は夕方の屋外、蛍光灯、白熱灯又は他の種類の人工照明を有する屋内、人工照明の組合せ、自然(屋外)照明と人工照明の組合せの下に画像を撮像する。電子カラーカメラには、画像の撮像時の光源を推定する機能があり、その電子カラーカメラにおける光源の推定に基づいて、電子カラーカメラのR、G、Bチャンネルのゲイン設定が調整され、最終的な出力画像において白い物体に対してR=G=Bとなるように調整される。この機能は、「ホワイトバランス調整」と呼ばれ、ゲイン調整は、図示しないが、FIG.1のイメージセンサ104と1D−LUT105の間で行われる。通常、電子カラーカメラの色変換は、ホワイトバランス調整の設定によって変化する。すなわち、電子カラーカメラは、その色変換において光源依存性を有する。これは、電子カラーカメラによって生じる色歪み又はエラーが光源に依存して変化することを意味している。したがって、色補正を高い精度で行うためには、あり得る全ての光源に対応できる電子カラーカメラの色変換の逆写像を用意する必要があるが、それは実質的に不可能である。この問題を解決する1つの方法として、数種類の代表的な光源の下での色変換の逆写像(通常、TRC−マトリクスモデル又は3次元ルックアップテーブルのいずれかを用いたICC色プロファイルの形で)を複数準備しておく方法がある。そして、ユーザは、どの逆写像が、ユーザが実際に画像を撮像したときの光源に最も適合するかを考えて、予め設けられている(preset)逆変換のセットの中から手動で選択しなければならない。これは、ユーザにとって負担になるばかりか、ユーザが適切に選択しなかった場合には、色補正が正しく行われないことになる。さらに、画像の撮像時の実際の光源が、予め設けられている逆写像の中にない場合にも、色補正が正しく行われないことになる。これがルックアップテーブル(TRC−マトリクス)に基づく方法における制約(limitation)である。このルックアップテーブルに基づいた方法における他の制約としては、複数の光源下では色補正が正しく行われないことがある。TRC−マトリクスモデル法に代わる方法として、3次元ルックアップテーブル(3D−LUT)がある。この3D−LUTは、TRC−マトリクスよりも正確であるが、補正モデルのサイズが巨大であり、TRC−マトリクスモデル法の場合と同様に、複数の光源下では適切な色補正が行われない。したがって、任意の光源下で、電子カラーカメラによって撮像された画像の色補正を正確に行う方法及び装置が所望されている。
【0010】
発明の開示 本発明の目的は、様々な光源下で電子カラーカメラによって撮像された画像の色補正を行う色補正方法及び装置を提供することである。
【0011】
また、本発明の目的は、カラー機器(color device)の特性付け(characterization)を行う方法及び装置を提供することである。
【0012】
さらに、本発明の目的は、組み合わせられた光源下で電子カラーカメラによって撮像された画像の色補正を行う色補正方法及び装置を提供することである。
【0013】
さらにまた、本発明の目的は、色補正されたカラー画像を表すデータが記録された記録媒体を提供することである。
【0014】
さらにまた、本発明の目的は、色補正されたカラー画像を表すデータを伝送するデータ伝送方法を提供することである。
【0015】
本発明の特徴は、カラー画像を表すデータに対する補正を決定するためのルックアップテーブル法の限界を克服するために、ニューラルネットワークを関数の近似装置として用いることによって、カラー画像に対する色補正を行うことである。
【0016】
また、本発明の特徴は、カラー画像を表すデータに対する補正を決定するために、ニューラルネットワークの一種である多層パーセプトロン(multilayer perceptron:MLP)を用いることによって、カラー画像に対する色補正を行うことである。
【0017】
さらに、本発明の特徴は、カラー画像を表すデータに対する補正を決定するために、強制ニューロ−ファジイ干渉システム(coactive neuro-fussy inference system:CANFIS)モデルニューラルネットワークの一種である多層パーセプトロン(multilayer perceptron:MLP)を用いることによって、カラー画像に対する色補正を行うことである。
【0018】
さらにまた、本発明の特徴は、複数光源下で、電子カラーカメラによって撮像されたカラー画像に対して自動色補正を行うことである。
【0019】
さらにまた、本発明の特徴は、画像データをXYZ空間に変換することにより、白色点及びカメラの外での高度な光源の推定による色をより正確に得られることである。
【0020】
さらにまた、本発明の特徴は、教示データセットを修正又は置き換えることにより、色の恒常性を容易に実現することである。
【0021】
本発明の利点は、電子カラーカメラによって撮像された画像を、従来のTRC−マトリクス法で達成できるよりも高い精度で色補正することである。
【0022】
また、本発明の利点は、電子カラーカメラのユーザが、撮影中や写真の表示及び/又は印刷時に、色補正に時間をかけずに、構図に集中できることである。
【0023】
本発明は、電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正方法において、ニューラルネットワークを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップとを有する色補正方法を提供する。
【0024】
また、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正方法において、多層パーセプトロンモデルを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップとを有する色補正方法を提供する。
【0025】
さらに、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正方法において、強制ニューロ−ファジイ干渉システムモデルを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップとを有する色補正方法を提供する。
【0026】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正装置において、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定し、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うニューラルネットワークを備える色補正装置を提供する。
【0027】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正装置において、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定し、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行う多層パーセプトロンモデルを備える色補正装置を提供する。
【0028】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正装置において、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定し、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行う強制ニューロ−ファジイ干渉システムモデルを備える色補正装置を提供する。
【0029】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正データが記録された記録媒体において、ニューラルネットワークを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップと、補正されたデータを表すデータを記録媒体に記録するステップによって用意される記録媒体を提供する。
【0030】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正データが記録された記録媒体において、多層パーセプトロンモデルを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップと、補正されたデータを表すデータを記録媒体に記録するステップによって用意される記録媒体を提供する。
【0031】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正データが記録された記録媒体において、強制ニューロ−ファジイ干渉システムモデルを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップと、補正されたデータを表すデータを記録媒体に記録するステップによって用意される記録媒体を提供する。
【0032】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正されたデータを伝送するデータ伝送方法において、ニューラルネットワークを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップと、補正されたデータを表すデータを伝送するステップを有するデータ伝送方法を提供する。
【0033】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正されたデータを伝送するデータ伝送方法において、多層パーセプトロンモデルを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップと、補正されたデータを表すデータを伝送するステップを有するデータ伝送方法を提供する。
【0034】
さらにまた、本発明は、電子カラーカメラによって撮像されたカラー画像の色補正されたデータを伝送するデータ伝送方法において、強制ニューロ−ファジイ干渉システムモデルを用いて、カラー画像の推定された光源に基づいてカラー画像を表すデータに対する補正を決定するステップと、光源は複数の光源からなっており、カラー画像を表すデータに対して補正を行うステップと、補正されたデータを表すデータを伝送するステップを有するデータ伝送方法を提供する。
【0035】
さらにまた、本発明は、電子カメラによって撮像された画像データを記録するデータ記録方法において、カラー画像を撮像して、画像を表すデータを出力するステップと、撮像されたカラー画像における光源を推定して、推定された光源を表すデータを出力するステップと、画像を表すデータと推定された光源を表すデータとを記録するステップとを有するデータ記録方法を提供する。
【0036】
さらにまた、本発明は、電子カメラによって撮像された画像データを伝送するデータ伝送方法において、カラー画像を撮像して、画像を表すデータを出力するステップと、撮像されたカラー画像における光源を推定して、推定された光源を表すデータを出力するステップと、画像を表すデータと推定された光源を表すデータとを伝送するステップとを有するデータ伝送方法を提供する。
【0037】
これらと他の目的、特徴及び利点は、以下の詳細な説明と添付の図面を参照することにより明らかになる。
【0038】
【発明の実施の形態】
上述した課題を解決するために、ニューラルネットワーク(例えばMLP)又はCANFISニューロ−ファジイモデルが用いられる。本発明は、「機器固有(device specific)」方式と「機器独立(device independent)」方式の両方に応用することができるが、ここで開示している実施の形態では、機器独立の色補正について説明する。なお、MLPは、良く知られたニューラルネットワークのうちの一種類にすぎない。また、ここでは、ニューラルネットワークについて述べるが、MLP又は他の種類のニューラルネットワークを用いることができる。
【0039】
MLPを用いた単一の光源での色補正 上述したように、TRC−マトリクスモデル(FIG.1)を用いた色補正が1つの定まった既知の光源下でも正確に行われないのは、電子カラーカメラが、理想的ではなく(non-ideality)、線形でなく(nonlinearity)、また構造的に複雑であることに起因している。補正の精度を高めるために、TRC−マトリクスモデルの代わりに、FIG.4Aに示すニューラルネットワーク又はFIG.4Bに示すMLPモデルを用いることができる。FIG.4Aにおいて、いかなる種類のニューラルネットワーク、例えばFIG.4BのMLPを用いることができる。このニューラルネットワークモデル(例えばMLP)では、1つの定まった光源に基づいて補正が行われるため、以下、この補正を「単一光源」色補正と呼ぶ。ニューラルネットワーク(例えばMLP)を用いた色補正モデルは、これまで、色変換が非常に非線形であり、(電子カラーカメラの場合における光源の色に対応した)白色点(white point)が定まっているとされているようなプリンタ等の画像機器にのみ用いられてきた。
【0040】
FIG.4Aに示すように、画像データは、Y入力端子1、C入力端子2、C入力端子3を介してニューラルネットワーク4に入力される。画像データは、電子カラーカメラから供給される。電子カラーカメラの代わりに、再生装置及び/又は伝送媒体から画像データを入力端子1、2、3に供給するようにしてもよい。色補正に必要な光源情報は電子カラーカメラからのみ得られるので、後者の例においては、光源情報は、画像データとともに記録及び/又は伝送されるか、いずれの方法によってニューラルネットワーク4に入力される必要がある。電子カラーカメラからの画像データを伝送又は記録する場合、多くの画像データフォーマットには、イメージプリンタでは使用されない領域又は空間(space)が含まれている。このような領域又は空間は、通常、撮像日、電子カラーカメラの機種又は電子カラーカメラの製造元を記録するために用いることができる。したがって、1つ以上の未使用の領域又は空間を光源情報に割り当てることができ、画像データを光源情報とともに記録及び/又は伝送した後に、その画像データに色補正を施す。
【0041】
ニューラルネットワーク4は、測色空間XYZおけるX出力端子5、Y出力端子6、Z力端子7を備える。FIG.4Bに示すように、MLPは、電子カラーカメラからの出力値(RGB又はYCC)のための、参照符号11、12、13でそれぞれ示される3つの入力ノードY、U、Vを備える。また、MLPは、参照符号14、15、16でそれぞれ示される3つの出力ノードX、Y、Zを備える。出力ノードX、Y、Zは、機器独立色補正では測色値(XYZ又はL*a*b)を、機器固有色補正ではRGB又はYCCの目標出力値を出力する。これらの測色値又は色補正された出力値は、出力機器の特性付けモデル(characterization model)を介して、プリンタ又は表示モニタ等の画像出力機器に供給される。これらの値は、直接画像出力機器に供給されてもよい。あるいは、これらの値は、符号化及び/又は圧縮された後、記録装置によって磁気ディスク、光ディスク、光磁気ディスク、個体メモリ等の記録媒体に記録されたり、インターネット、電話回線、専用線、無線、光媒体等の伝送媒体を介して伝送される。
【0042】
MLPのパラメータを最適化するために、「教示」データ集合(training data set)と呼ばれる入力−出力サンプル集合(a set of input-output samples)が与えられる。入力−出力サンプル集合は、入力YUVと所望の出力XYZの対である代表色サンプル(representative color sample)を含んでいる。そして、与えられた課題(task)は、非線形最小二乗の問題(nonlinear least squares problem)として数式で表され、この目的は、所望の出力とそのモデルの出力間の二乗誤差(squared error measure)を最小化することによって、MLPのパラメータを最適化することである。
【0043】
二乗誤差である求める関数E(.)は、残差(residual)ベクトルr(θ)を用いて、以下のように表される。
【0044】
E(θ)=(1/2)r(θ)r(θ)
パラメータの最適化は、そのモデルによって最終的に所望の出力が得られるように反復して行われる。この反復プロセスは、ニューラルネットワークの分野では「教示」(又は「学習(learning)」)と呼ばれる。
【0045】
MLPの近似性能(approximation capacity)は、多くの場合、「教示」データセットとは異なり、パラメータの調整には用いられない「チェック(checking)」データセットと呼ばれるデータセットを用いて評価される。ニューラルネットワーク、特にMLPの1つの重要な利点は、教示データセット以外の入力データに対して解が得られることである。
【0046】
上述した「機器独立」色補正の問題において、MLPは、電子カラーカメラの応答信号(例えばRGB又はYCC)から測色値(例えばXYZ又はL*a*b)へのマッピングを作成するように学習させられる。「機器固有」色補正の問題において、MLPの望ましいマッピングは、エラーがある電子カラーカメラの応答信号(RGB又はYCC)から、それに対応する正しいRGB又はYCC信号にマッピングすることである。いずれにしろ、これらの入力−出力サンプルは、色空間全体に均一に分布する標準マクベスカラーチェッカ(standard ColorChecker)又はマンセルカラーパッチ(Munsell color patch)を用いて集められる。
【0047】
なお、ある単一の光源下でデータが集められる場合、課題はいわゆる単一光源の問題となり、この問題はイメージスキャナによって撮像された画像の色補正において偏在するものである。
【0048】
MLPを用いた複数の光源での色補正 FIG.5に示すように、(画像の撮像時の)任意の光源下で電子カラーカメラによって撮像された画像の色補正を自動的に行うために、MLPモデルが用いられる。MLPモデルは、機器独立補正の場合、画像の撮像時に用いられる光源によって、そのマッピング、すなわち電子カラーカメラの逆写像を自動的に調整するように学習させられる。以下、これを「複数光源(multi-illuminant)」色補正と呼ぶ。画像の撮像時にどの光源が用いられたかを正確に知ることは難しいので、MLPモデルは、電子カラーカメラが内蔵する光源推定データ(すなわちホワイトバランスデータ)を用いる代わりに、FIG.5の上部に示すように、例えば光源の色に対して測定されたR、G、Bから得られるR/G値及びB/G値を用いる。FIG.5において、「パナホワイト」は、日本国大阪の松下電器産業株式会社によって日本で販売されている「白色」蛍光管の商標である。「メロウd」は、日本国東京の東芝ライテック株式会社によって日本で販売されている「自然光」タイプの蛍光管の商標である。なお、FIG.5の上部(ホワイトバランス面)の代わりにFIG.13を用いてもよい。
【0049】
複数光源に対する色補正において用いられるMLPモデルには、光源情報を入力するためのさらなるノードが必要である。例えば、光源の色度が2つの値のセットで示される場合は、2つのさらなる入力ノードが用いられる。その結果、この課題におけるMLPモデルは、FIG.5に示すように、参照符号17、18、19、20、21でそれぞれ示される5つの入力ノードB/G、R/G、Y、U、Vと、参照符号22、23、24でそれぞれ示される3つの出力ノードX、Y、Zとを有する。出力X、Y、Zは、変換、正規化、符号化及び/又は圧縮された後、磁気ディスク、光ディスク、光磁気ディスク、個体メモリ等の記録媒体に記録されたり、インターネット、電話回線、専用線、無線、光媒体等の伝送媒体を介して伝送されてる。
【0050】
本発明の実施の形態では、複数光源の色補正モデルを学習するために、以下のステップが用いられる。
(1)複数の代表的な光源下において、電子カラーカメラからの出力値と、カラーサンプルのセットからの測色値(機器独立補正に対して)とを測定する。ここで、Nは、カラーサンプルの数であり、Mは、対象とする代表的な光源の数であり、したがって、教示データセットの総量は、N*Mである。
(2)各光源について、ホワイトバランスを合わせるためのRGBチャンネルのゲインデータを測定するか、又は光源の色に対するRGBチャンネルの信号値を測定する。
(3)測定された3つの値を、例えばR/GとB/Gのような2つの色度値(chromaticity value)に変換する。これらのデータは、後述するCANFISニューロ−ファジイモデルのためのファジイメンバーシップ関数を構築する方法において、光源情報をより特性付けるために、更なる処理が施される。
(4)上述したように、MLPは、データセット(1)を用いて学習させられる。同時に、データ(1)が測定されるときの光源情報であるデータセット(3)が入力ノード17(B/G)及び18(R/G)供給される。
【0051】
上述したステップが完了した後、MLPモデルは、電子カラーカメラの出力値と光源情報を入力することによって、元の場面の測色値を出力する。電子カラーカメラの色変換における光源依存性は、光源情報を参照することによって自動的に補償される。画像の撮像時に実際に用いられた光源が、MLPの学習に用いられた代表的な光源のいずれにも一致しないときは、MLPは、電子カラーカメラの光源間の色変換の逆写像を自動的に近似する。
【0052】
MLPモデルの学習法 MLPは、非線形特性を有しているので、上述したNN非線形の最小二乗の問題を解くための有効な反復法が求められる。多くの試験によって、レベンバーグ−マーカート式のアルゴリズム(Levenberg-Marquardt type algorithm)のドッグレッグトラストリージョン(dogleg trust region)の実施がこの問題を解くのに有効であることが分かった。より詳しくは、ドッグレッグ(dogleg)法によって、トラストリージョン(trust region)内での制限されたレベンバーグ−マーカート(Levenberg-Marquardt)ステップの有効な区分的線形近似が導かれる。
【0053】
FIG.6A及びFIG.6Bは、コーシー(Cauchy)ステップとニュートン(Newton)又はガウス−ニュートン(Gauss-Newton)ステップによって描かれた2次元のサブスペースにおいて、ドッグレッグステップがトラストリージョンステップを近似する様子を示している。(FIG.6Aで強調表示されている)区分的線形のくの字形の軌道とトラストリージョンの境界線との接点は、次の3つのステップのうちの1つによって導かれる。
1.制限コーシーステップ
【0054】
【数1】


【0055】
トラスト半径(trust radius)Rnowが、上記の式で表されるコーシーステップSCauchyの長さよりも短いとき、制限コーシーステップは次にように表される。
【0056】
【数2】


【0057】
ここで、gとHは、それぞれグラディエントベクトル(gradient vector)とヘシアンマトリクス(Hessian matrix)である。
2.ニュートンステップ トラスト半径が、ニュートンステップの長さ以上であるとき、ニュートンステップは次のように表される。
【0058】
【数3】


【0059】
3.ドッグレッグステップ トラスト半径がコーシーステップとニュートンステップとの間の長さであるとき、ドッグレッグステップは次にように表される。
【0060】
【数4】


【0061】
モデルの最適化のために、これらのステップのうちの1つが、次のような反復方式によって、反復毎に用いられる。
【0062】
θnextnow+ηd ここで、dは方向ベクトルであり、ηはその方向に進む程度を規制する特定の正のステップの大きさである。FIG.6Aのパラメータhは、次のような単純な計算で求められる。
【0063】
【数5】


【0064】
ここで、Pnowは次のようである。
【0065】
【数6】


【0066】
ドッグレッグトラストリージョン法の利点は、そのアルゴリズムを強力にして、最急降下法(全体の収束特性(global convergence property))とニュートン法(速い局部的な収束特性(fast local convergence property))とをスムーズに切り替えられることである。例えば、次のステップが不具合であるとき、ドッグレッグアルゴリズムはそのステップの長さを短くして、単一のトラストリージョン制御に基づいて、そのステップを同時にかつ効果的に最急降下の方向に曲げる。
【0067】
以下の表1は、単一の光源(D65−光源)の問題における3つの代表的な非線形の最適化のアルゴリズムの収束速度を比較している。
【0068】
【表1】


【0069】
これは、3つの代表的な学習アルゴリズムにおける、TRC−マトリクス式のモデルとMLPモデルとの間の測定されたXYZ値の二乗平均誤差を比較している。なお、最後の列「停止期間(stopped epoch)」において、7個の隠れユニットを用いた(3×7×3)モデルにのみ、必要な実行時間が括弧書きで示されている。表1から明らかなように、単一光源の色補正の問題においては、ドッグレッグ主導のレベンベルグ−マルカルドのアルゴリズムを用いる場合が、表1に示す他の試験された学習法を用いる場合よりも速く収束する。このようなパフォーマンスの比較は、Color device characterization of electronic cameras by solving adaptive networks nonlinear least squares oriblems, Eiji Mizutani (本出願の発明者), Kenichi Nishio (本出願のもう1人の発明者), Naoya Katoh and Michael Blasgen, 8th IEEE International Conference on Fussy Systems (FUZZ-IEEE' 99), Seoul, Korea, August 22-25, 1999で更に論じられている。この論文とその図面は、参考のために添付してある。さらに、ドッグレッグトラストリージョンのアルゴリズムは、Computing Powell's Dogleg Steps for Solving Adaptive Networks Nonlinear Least Squares Problems, Eiji Mizutani(本出願の発明者),8th International Fuzzy Systems Association World Congress (IFSA'99), Hsinchu, Taiwan, August 17-20, 1999とPowell's dogleg trust-region steps with the quasi-Newton augmented Hessian for neural nonlinear least-squares learning, Eiji Mizutani(本出願の発明者), The IEEE International Conference on Neural Networks, Washington D.C., July 10-16, 1999とで更に論じられている。この2つの論文とその図面は、参考のために添付してある。
【0070】
FIG.7は、単一のMLPアプローチと、従来のルックアップテーブルに基づいた(TRC−マトリクス)アプローチとのD65光源下での色差を比較している。ここでは、25個の全ての色差(24個のマクベスカラーチェッカと1個の「完全な黒」のカラーサンプル)が10より小さくなければならない。MLPに基づいた方法では、色差がD65光源下で25個の全てのカラーサンプルにおいて上限のしきい値(10に設定されている)を下回っているのに対し、従来のルックアップテーブルに基づいた(TRCマトリクス)方法ではそのようになっていないことが、FIG.7によって明確に示されている。
【0071】
CANFISニューロ−ファジイモデルを用いた複数光源での色補正 CANFISニューロ−ファジイモデルは、問題に特定された知識に基づいて自動的に「複数光源」での色補正を行うために特に作られており、この問題に特定された知識とは、ファジイif-then規則の集合を表す。具体的には、「IF部」はファジイメンバーシップ関数(MF)で表され、「THEN部」はローカルエキスパート(local-expert)MLPによって構築されている。これは、いわゆる「ニューラル規則を持ったCANFIS」モデルである。
【0072】
具体的には、ファジイメンバーシップ関数を構築する方法に関して後述するように、4つのファジイ規則が、ファジイ分割に従って、2次元に変換されたホワイトバランス面上に示されている。その結果のCANFISニューロ−ファジイモデルは、FIG.8に示すように、4つのファジイMF(各軸に2つずつ)と4つの対応するローカルエキスパートMLPからなる。入力ベクトルは、IF部(MF)とTHEN部(MLP)の次の2つのベクトルに分割される。
【0073】
1.ファジイMFに供給される撮像時の光源情報である2つの入力信号
2.ローカルエキスパートMLPに供給される電子カラーカメラからの出力信号(例えばYUV)である3つの入力信号
CANFISモデルは、次の式によって、ローカルエキスパートMLPからの出力信号の処理された合計を、最終的な出力ベクトルA(例えばX、Y、Zの色信号)として計算する。
【0074】
【数7】


【0075】
ここで、gとOは、それぞれi番目の発火強度(firing strength)とi番目のMLPの出力ベクトルである。各発火強度は、IF部のMF出力からの出力信号によって求められたものであり、対応するTHEN部のMLPが最終的な出力にどれだけ影響を与えたかを表している。この文脈では、IF部のMFの集合は、発火したTHEN部のMLPからの出力を統合した集積部としての役割を果たす。
【0076】
通常、集積部はベル形の微分可能なファジイMFからなっており、その近隣のMFと十分な重複部分があるように設定されている。したがって、対応する全てのローカルエキスパートMLPは、Aの値を導く式によって最終的な出力を出すように補間的に機能する。一方、集積部が重複部分のない長方形のMFでできていて、スイッチング部となっている場合、単一のローカルエキスパートMLPのみが最終的な出力に貢献することになる。g値のうちの1つのみが「ユニット」となり、それ以外は全て「0」となる。このような単一の0でないgは、i番目の「発火した」ローカルエキスパートMLPと対応している。すなわち、ローカルエキスパートMLPは、補間的というよりむしろ競合的に機能している。換言すれば、CANFISの概念は、スイッチングのような極端なケースを除いて、基本的にファジイMFとローカルエキスパートMLPの中の相乗作用にある。
【0077】
CANFISモデルには、ローカルエキスパートMLPにのみ適切な建設的又はアルゴリズミックな修正を行うだけで、(ファジイ規則が意味のある限界に保たれるように)ファジイMFの数を増やさずに、学習能力を増大させることができるという利点がある。例えば、このような修正によって、MLPの隠れノード/レイヤの数が調整される。なお、THEN部のMLPの隠れ部分が取り除かれると、CANFISモデルはローカルチューニングラジアル基底関数ネットワーク(Radial Basis Function Network:RBFN)モデルとされてもよい。すなわち、CANFISモデルは汎用のローカルチューニングニューラルネットワークと見なされてもよい。
【0078】
このモデルの欠点を挙げるとすれば、単一のMLPモデルと比較して、構造が複雑で、より多くの学習データが必要であるために学習が遅いことである。したがって、課題が限られた少ない量の学習データのみを有する場合は、単一のMLPモデルを選択する方がよい。複数光源での色補正のためのCANFISニューロファジイモデルを学習する方法とともに、CANFISモデルによって得られた実験結果を以下に示す。
【0079】
線形規則のあるCANFISのモデルは、周知の高木−菅野(「TSK」又は「菅野式」とも呼ばれる)ファジイ推論モデルと同等である。制御工学の分野では、迅速な応答が重要であるため、このTSKモデルは圧倒的に最も広く用いられているファジイシステムである。この迅速さは、線形規則の実行が非線形規則の実行より遙かに単純であるために計算上の優位があるからである。
【0080】
CANFISモデリングと線形規則を持ったCANFISは、テキストNeuro-Fuzzy and Soft Computing, A Computational Approach to Learning and Machine Intelligence, by Jyh-Shing Roger Jang, Chuen-Tsai Sun and Eiji Mizutani(本出願の発明者), Prentice Hall, Upper Saddle River, New Jersey 07458, 1997, third printingの369〜400頁及び572〜592頁で詳しく説明されている。このページ部分とその図面は、参考のために添付してある。
【0081】
上述したCANFISニューロ−ファジイモデルを用いた複数光源での色補正のためのファジイメンバーシップ関数を構築する方法 ファジイ分割 CANFISニューロ−ファジイモデルでは、ファジイメンバーシップ関数(MF)がMF入力空間を複数のローカルエキスパートの領域に分割する。したがって、ある特定のローカルエキスパートの領域の中心に近づいたデータはそのほかのローカルエキスパートのパラメータの更新にそれほど影響を受けない。このローカルチューニングの機構によって、「ローカルエキスパート」が主にそれ自体のローカル領域の近辺で局地的に最適に学習することができる。
【0082】
FIG.9に示す複数光源の問題において、ハロゲンの光源の領域のデータは、ホワイトバランス面上の「自然光の光源」曲線の他端にあるD90光源の領域のローカルエキスパートのMLPに大きな影響を与えないようになっている。これらの2つの対極する領域は適切な分割により何かしらの方法で分割されているはずである。ファジイMFは、FIG.10に示すように、(「はっきり」ではなく)「あいまい」な方法で、ホワイトバランス面上の光源の領域を分割するのに重要な役割を果たしている。FIG.10において、ハロゲンとD65の2つの代表的な光源が選択され、「自然光の光源」の曲線に対応するX軸上の2つのMFの最初の中心点が決定される。これは、その曲線におけるその位置が課題の中で重要な特性として選択されていることを意味する。FIG.10におけるX軸上の2つの符号「A1」と「A2」は、それぞれ「ハロゲン」と「D65」を表しており、ここでは、 A1−MFの値/程度は、その光源が「ハロゲン」の光源にどれだけ近いかを示しており、 A2−MFの値/程度は、その光源が「D65」の光源にどれだけ近いかを示している。
【0083】
1つの特性だけでは、各光源の領域を適切に示すのに十分でないことは明白である。別の重要な特性は、「自然光」の光源と「蛍光」の光源との区別である。したがって、2つの対応するMF(「蛍光」はB1で、「自然光」はB2)がY軸に構築されており、蛍光の光源と自然光の光源との近さを表している。ここでは、 B1−MFの値は、「蛍光」の光源の曲線にどれだけ近いかを示しており、 B2−MFの値は、「自然光」の光源の曲線にどれだけ近いかを示している。
【0084】
このように、FIG.9の「混合」の曲線における各混合した光源は、例えば、40%の自然光の光源と60%の蛍光の光源からなる光源の場合のように、「自然光」の光源又は「蛍光」の光源に対するメンバーシップの程度によって特性付けされている。FIG.9において、「ルピカエース」は、日本国東京の三菱電機株式会社によって日本で販売されている「自然光」タイプの蛍光管の商標である。FIG.9とFIG.10におけるX軸とY軸は等しくないため、特定の「非線形」の座標変換が必要である。このような座標変換を以下に示す。
【0085】
ホワイトバランス面における非線形座標変換 FIG.11は、元のR/B−G/Bのホワイトバランス面における試験的なデータセットの実際のデータ分布を示している。FIG.11をFIG.10に合わせるには、適切な座標変換を行う必要がある。まず、単純な目盛の均等化が行われ、FIG.12のようになる。次に、ニューラルネットワーク非線形座標変換が行われ、FIG.13のようになり、FIG.13はFIG.10の座標と合うデカルト座標となっている。なお、多くの他の非線形変換でもよい。
【0086】
非線形座標変換によって、単純な「格子」分割が行われるため、これの重要性は軽視できない。ラジアル基底関数ネットワーク(radial basis function network:RBFN)によってよく作られる「散布」分割には幾つかの利点がある。RBFNは、上述したテキストNeuro-Fuzzy and Soft Computing, A Computational Approach to Learning and Machine Intelligenceの238〜246頁及び369〜400頁、特に373頁の図13.3で詳しく説明されており、このページ部分とその図面は、参考のために添付してある。
【0087】
更に詳しくは、非線形座標変換には次の利点がある。
1.言語的解釈性は十分に高く保たれ、人間の直感的な理解に合致する。
2.要求される(基礎)関数の数が少なくなる。
【0088】
利点1は、散布又は樹形の分割の場合には明確な言語的ラベルが各MFにうまく現れないことを示唆している。利点2は、例えば、X−Y座標面上に9つのローカル領域を作るために、RBFNでは9つの基礎関数が必要であるのに対して、CANFISモデルでは6つのMF(各軸に対して3つのMF)が必要であるということを示している。したがって、関数パラメータの総数が異なることになる。分割に関するより詳細な説明は、上述したテキストNeuro-Fuzzy and Soft Computing, A Computational Approach to Learning and Machine Intelligenceの86、87頁でなされており、このページ部分とその図面は、参考のために添付してある。
【0089】
複数光源での色補正のためのCANFISニューロ−ファジイモデルの学習法 CANFISニューロ−ファジイモデルを用いた複数光源での色補正に関連して、上述したCANFISニューロ−ファジイモデルを学習するために、多くの非線形最適化アルゴリズムを採用してもよい。モデルは、FIG.8に示すように、次の2つの主なパラメータの成分からなる。
【0090】
(1)ファジイMF(IF部)
(2)ローカルエキスパートMLP(THEN部)
これら2つの成分のパラメータを更新するための最適化アルゴリズムを適用するのには多くの選択肢がある。例えば、次の方法がある。
【0091】
(方法A)IF部のMFとTHEN部のMLPの両方に同じ最適化アルゴリズムを適用する。
【0092】
(方法B)IF部のMFとTHEN部のMLPに異なる最適化アルゴリズムを適用する。
【0093】
これらの方法は、システム主体又は構成要素主体のいずれかの方法で実施されうる。システム主体の学習では、CANFISニューロ−ファジイモデルのMFとMLPの全ての構成要素は、1つのシステムとして同時に学習させられ、その最終的な出力は上述したようにAの値を出すための上述した式によって計算される。構成要素主体の学習では、各MF又はMLPは、独立して調整/学習させられ、全ての構成要素がまとめられてCANFISニューロ−ファジイモデルを構成し、その最終的な出力は上述したようにAの値を出すための上述した式によって計算される。
【0094】
FIG.8を参照して、構成要素主体法についてより詳細に説明すると、各ローカルエキスパートMLPは、通常所望の最終的な出力ベクトルA(すなわち、X、Y、Z)を出力ベクトルOとして出力するように学習させられる。一方で、システム主体の学習法では、(上述した)最終的な出力ベクトルAは所望の3つの値X、Y、Zに合致するようになされているが、各ローカルエキスパートMLPの出力ベクトルOは必ずしもそれに近くなくてもよい。すなわち、出力ベクトルOは不明でもよい。FIG.8には、各ローカルエキスパートMLPの3つの出力ノードがX、Y、Zによって表されているが、これは、単にどのノードがどの信号と対応しているかを示すためである。
【0095】
更に、教示データの処理によって次の3つの異なるパラメータ更新モードがある。
【0096】
(1)オンラインのパターン毎の更新モード (2)ブロック毎の更新モード (3)バッチ更新モード したがって、CANFISモデルへの最適化アルゴリズムの適用方法は多くある。なお、方法Aと方法Bのいずれが用いられるかに関わらず、構成要素主体の学習は、高精度な結果を得るのには疑問がある。これは、上述したようにAの値を出すための上述した式に依存しているにもかかわらず、ローカルエキスパートMLPの出力は、ファジイMFの発火強度から独立して最適化されているからである。したがって、カラー画像の色補正に必要なように、CANFISモデルによって非常に正確な入力/出力マッピングを行うことが必要なときは特に、もう一方のシステム主体の学習のほうが遙かに実用的に重要である。
【0097】
概して、ニューロ−ファジイシステムにおいて、MFのパラメータと比べるとMLPのパラメータは最適値からかけ離れているという重要な見解が得られる。これは、ファジイMFの初期のパラメータは問題に特定された知識に基づいて決定されているのに対して、ローカルエキスパートMLPの初期のパラメータは任意に初期化されているためである。したがって、MFとMLPに対して異なる最適化アルゴリズムを適用する(すなわち、方法Bを採用する)こと、特に、MLPに対してより速いアルゴリズムを、MFに対してより遅いアルゴリズムを適用することが可能である。この考え方での典型的な実施は、ANFIS(すなわち、線形規則を持った単一出力のCANFISモデル)によるハイブリッド学習であり、これは、「線形」の後項(consequent)ファジイシステムに限られるが、速い「線形」の最小二乗と遅い最急降下法との組み合わせである。このようなハイブリッド学習は、上述したテキストNeuro-Fuzzy and Soft Computing, A Computational Approach to Learning and Machine Intelligenceの219〜220頁及び222〜223頁で詳しく説明されており、このページ部分とその図面は、参考のために添付してある。
【0098】
システム主体の学習法による方法Aは、ニューラル規則を持ったCANFISモデルと同じ考え方で考えられてもよい。例えば、「バッチ」モードでMFに最急降下法を適用し、「オンラインのパターン毎」のモードでMLPに最急降下法を適用することによるものである。この方策は、次の単純な発見的規則によって改善される。
【0099】
規則:ファジイMFのパラメータを学習段階のうちの初期段階で修正する。
【0100】
表2は、チェックエラーが縮小されるか又は所定の反復制限数である2000000にされるとき、MLP及びCANFISモデルによって得られる4つの代表的な結果を示している。「パラメータ数」欄はパラメータの数を示し、「RMSE」は二乗平均誤差を示している。「不適切なサンプル数」と書かれている欄は最も重要で、色差が上限のしきい値(10に設定されている)より大きかったカラーサンプルの数を示している。4つのモデルは全て、オンラインのパターン毎の更新モードで、広く用いられている最急降下法を用いて学習させられる。
【0101】
【表2】


【0102】
実験#4の結果は、次の発見的規則を用いて得られた。
【0103】
規則:ファジイMFのパラメータを500000回の後に更新し始める。
【0104】
出力色空間の選択 本発明の開示では、色補正モデルの出力色空間としてXYZ空間が主に用いられている。先に述べたように、機器独立色補正では、出力色空間はL*a*b又はXnYnZn(正規化されたXYZ空間)でもよい。機器固有色補正では、カラー画像の撮像機器にとって色補正の出力となるならば、いかなる色空間でもよいし、又はユーザの特定の要求に従って任意に定義された色空間でもよい。出力色空間を変えるには、目標の出力データを色補正モデルの教示データセットに変えるだけで達成される。
【0105】
光源への依存性に関して上述したように、光源の色においてR=G=Bが保たれるように電子カラーカメラの出力値がホワイトバランス補正されている。XnYnZnとL*a*bの色空間も、その定義において同様に動作し、3つの刺激値は光源の色の値によって正規化される。このような色空間は、正規化された色空間と称される。この動作は人間の目の色順応を表している。
【0106】
FIG.1に示すように、電子カラーカメラの出力値は、ガンマ補正されたRGBに基づいている。L*a*bの色空間の定義においても同様の動作が行われ、このような色空間は非線形の色空間と見なされる。非線形マッピングは、明度(人間の輝度認識の基準)との相関を表し、色の物理的特性よりむしろ人間の目によって認識された色を説明する。
【0107】
XYZのような正規化されていない線形の色空間は、複数光源色補正モデルの出力色空間として用いられるとき有効である。電子カラーカメラにおいて自動的に行われる光源の推定が間違っているために、電子カラーカメラによって撮像された画像の白色点が間違ってしまうことがある。このような場合のために、色補正モデルの出力空間がXYZである場合は、白色点の補正は、画像の撮像後に電子カラーカメラの外で行われてもよい。出力空間が非線形の色空間である場合は、出力データは白色点の補正を行うためにいったん線形空間に供給されなければならないため、白色点補正はより複雑になる。
【0108】
光源への依存性に関して上述したように、電子カラーカメラの色変換は、そのホワイトバランスの設定に基づいて行われる機能である。撮像時の光源の推定が正しくても正しくなくても、電子カラーカメラの色変換は、例えばR/GとB/Gといった電子カラーカメラのホワイトバランス情報を参照して独自に決定される。したがって、入力画像の白色点が間違っていても、複数光源色補正モデルから出力されるXYZ値は、元の色の物理的特性を正確に表している。ユーザは、白色点が電子カラーカメラによって撮像された画像において違っていると分かったときは、ユーザはまず、複数光源色補正モデルからのXYZで示される画像データを出力し、次に、撮像時に行うとしたら計算処理上費用がかかりすぎてしまうような洗練された方法を用いて、画像の光源を推定し直すことができる。この方法によって、補正された色空間における画像データに対して再調整が行われるため、白色点だけでなく、その再調整された白色点の周辺に分布された色も正確になる。正規化されていない線形の色空間も、イメージセンサからの出力(生の画像データ)の部分に作られた空間となることができる。
【0109】
色の恒常性 画像の撮像時にどの光源が実際に使われても、D50(CIEによって規定されている色温度が5000Kの白色光)のような1つの定まった標準の光源下で画像が撮像されたかのような色を再現する電子カラーカメラを多くのユーザは好むことが知られている。これは、「色の恒常性」の色再現と呼ばれる。MLP又はCANFISニューロ−ファジイモデルのいずれかを用いて、上述した複数光源色補正モデルの教示データセットを適切に修正することにより、上述した「色の恒常性」を持った色補正が容易に実現される。
【0110】
なお、本発明に適用できるニューラルネットワークの一例として、MLPを挙げているが、ラジアル基底関数ネットワーク(radial basis function network:RBFN)や、モジュラーニューラルネットワーク等の他の種類のニューラルネットワークを用いてもよい。
【0111】
また、本発明の各実施の形態はコンピュータ上で動作するソフトウェアとして実行されてもよいし、又はコンピュータ上で動作する画像処理ソフトウェアの機能を果たすものとして実行されてもよい。このような例では、そのソフトウェアによって画像データファイルが開かれてもよいし、また、本発明のどの実施の形態も、JPEG、JIF又はBMPフォーマットのファイルのような画像データに適用されて、そのような画像データに対して色補正が行われるようにしてもよい。
【0112】
更に、本発明に係る方法及び装置は電子カラーカメラの中のイメージセンサのようなカラー撮像機器の構成要素の特性付けを行うために適用されてもよい。さらにまた、このような特性付けは、そのようなイメージセンサの質が所望のものではない場合にそれを補正するのに用いられてもよい。
【0113】
特定の実施の形態のみが詳細に説明されたが、この分野において普通の能力を有する人は、ここで説明したことから逸脱することなく多くの応用が可能であることを十分に理解しているであろう。このような応用は全て、添付の請求項の範囲内に含まれるはずである。
【図面の簡単な説明】
【図1】
FIG.1は、イメージスキャナと電子カラーカメラの両方に採用されている信号処理を示すブロック図である。
【図2】
FIG.2は、FIG.1の信号処理に続いて採用される逆の信号処理を示すブロック図である。
【図3】
FIG.3は、補色電子カラーカメラにおいてよく用いられる信号処理を示すブロック図である。
【図4】
FIG.4Aは、電子カメラにおける色変換の逆写像(又はマッピング)の生成にニューラルネットワークを導入した本発明を適用した色補正装置の実施の形態を示すブロック図である。
【図5】
FIG.4Bは、電子カメラにおける色変換の逆写像(又はマッピング)の生成に多層パーセプトロンを導入した本発明を適用した色補正装置の実施の形態を示すブロック図である。
【図6】
FIG.5は、色補正され、出力空間で変換された画像の生成に単一の多層パーセプトロンを導入した本発明を適用した色補正装置の実施の形態を示すブロック図である。
【図7】
FIG.6Aは、コーシー(Cauchy)ステップとニュートン(Newton)ステップによって決定された区分的線形曲線を有し、θCauchyを通る軌道によってθNowとθNewtonyとを結ぶドッグレッグ(dogleg)軌道を示す図である。
【図8】
FIG.6Bは、θNowに通じており、トラストリージョン(trust regio)内において制限されたレベンバーグ−マーカート(Levenberg-Marquardt)ステップに対する区分的線形近似であるドッグレッグ(dogleg)ステップを示す図である。
【図9】
FIG.7は、単一の多層パーセプトロンアプローチと、従来のルックアップテーブルに基づいた(TRC−マトリクス)アプローチとのD65光源下での色差の比較を示すグラフである。
【図10】
FIG.8は、本発明を適用したCANFISニューロ−ファジイモデルの構成を示す図である。
【図11】
FIG.9は、代表的な光源と、それに関する「自然光」と「蛍光」の曲線を示すグラフである。
【図12】
FIG.10は、変換されたホワイトバランス面での4つのベル形のメンバーシップ関数によるあいまいな分割を示すグラフである。
【図13】
FIG.11は、ホワイトバランス面の元の座標におけるデータ分布を示す図である。
【図14】
FIG.12は、ホワイトバランス面の正規化された座標におけるデータ分布を示す図である。
【図15】
FIG.13は、ホワイトバランス面の変換された座標におけるニューラルネットワークによって変換されたデータ分布を示す図である。

【特許請求の範囲】
【請求項1】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正方法において、 ニューラルネットワークを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップとを有する色補正方法。
【請求項2】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項1記載の色補正方法。
【請求項3】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項1記載の色補正方法。
【請求項4】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正方法において、 多層パーセプトロンモデルを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップとを有する色補正方法。
【請求項5】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項4記載の色補正方法。
【請求項6】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項4記載の色補正方法。
【請求項7】 上記多層パーセプトロンモデルは、レベンバーグ−マーカート式のアルゴリズム(Levenberg-Marquardt type algorithm)のドッグレッグトラストリージョン(dogleg trust region)の実施に基づいて学習することを特徴とする請求項4記載の色補正方法。
【請求項8】 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項4記載の色補正方法。
【請求項9】 各ニューラルネットワークの教示データを、標準光源下での測色値として用いるステップを更に有する請求項4記載の色補正方法。
【請求項10】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正方法において、 強制ニューロ−ファジイ干渉システムモデルを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップとを有する色補正方法。
【請求項11】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項10記載の色補正方法。
【請求項12】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項10記載の色補正方法。
【請求項13】 ファジイメンバーシップ関数からなる集積部は、カラー画像の撮像時における光源の推定に基づいて、ローカルエキスパート多層パーセプトロンの出力の加重和を計算することを特徴とする請求項10記載の色補正方法。
【請求項14】 上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築するステップを更に有する請求項13記載の色補正方法。
【請求項15】 上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項10記載の色補正方法。
【請求項16】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項13記載の色補正方法。
【請求項17】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、パラメータ更新の発見的規則に従って同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項13記載の色補正方法。
【請求項18】 上記ファジイメンバーシップ関数の少なくとも2つは重複することを特徴とする請求項13乃至17のいずれか1項に記載の色補正方法。
【請求項19】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正方法において、 スイッチングを有する強制ニューロ−ファジイ干渉システムを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップを有する色補正方法。
【請求項20】 代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項10記載の色補正方法。
【請求項21】 代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項10記載の色補正方法。
【請求項22】 代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いるステップを更に有する請求項10記載の色補正方法。
【請求項23】 代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いるステップを更に有する請求項10記載の色補正方法。
【請求項24】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正装置において、 上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定し、上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うニューラルネットワークを備える色補正装置。
【請求項25】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項24記載の色補正装置。
【請求項26】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項24記載の色補正装置。
【請求項27】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正装置において、 上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定し、上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行う多層パーセプトロンモデルを備える色補正装置。
【請求項28】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項27記載の色補正装置。
【請求項29】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項27記載の色補正装置。
【請求項30】 上記多層パーセプトロンモデルは、レベンバーグ−マーカート式のアルゴリズム(Levenberg-Marquardt type algorithm)のドッグレッグトラストリージョン(dogleg trust region)に基づいて学習することを特徴とする請求項27記載の色補正装置。
【請求項31】 上記多層パーセプトロンモデルは、上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力することを特徴とする請求項27記載の色補正装置。
【請求項32】 上記多層パーセプトロンモデルは、各ニューラルネットワークの教示データを、標準光源下での測色値として用いることを特徴とする請求項27記載の色補正装置。
【請求項33】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正装置において、 上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定し、上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行う強制ニューロ−ファジイ干渉システムモデルを備える色補正装置。
【請求項34】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項33記載の色補正装置。
【請求項35】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項33記載の色補正装置。
【請求項36】 ファジイメンバーシップ関数からなる集積部は、カラー画像の撮像時における光源の推定に基づいて、ローカルエキスパート多層パーセプトロンの出力の加重和を計算することを特徴とする請求項33記載の色補正装置。
【請求項37】 ファジイメンバーシップ関数は、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって構築されることを特徴とする請求項36記載の色補正装置。
【請求項38】 上記強制ニューロ−ファジイ干渉システムモデルは、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより学習することを特徴とする請求項33記載の色補正装置。
【請求項39】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルは、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより学習することを特徴とする請求項36記載の色補正装置。
【請求項40】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、パラメータ更新の発見的規則に従って同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルは、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより学習することを特徴とする請求項36記載の色補正装置。
【請求項41】 上記ファジイメンバーシップ関数の少なくとも2つは重複することを特徴とする請求項36乃至40のいずれか1項に記載の色補正装置。
【請求項42】 電子カラーカメラによって撮像されたカラー画像の色補正を行う色補正装置において、 上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定する、スイッチングを有する強制ニューロ−ファジイ干渉システムを備える色補正装置。
【請求項43】 強制ニューロ−ファジイ干渉システムは、代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけ、上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力することを特徴とする請求項33記載の色補正装置。
【請求項44】 強制ニューロ−ファジイ干渉システムは、代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけ、上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力することを特徴とする請求項33記載の色補正装置。
【請求項45】 強制ニューロ−ファジイ干渉システムは、代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけ、標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いることを特徴とする請求項33記載の色補正装置。
【請求項46】 強制ニューロ−ファジイ干渉システムは、代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけ、標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いることを特徴とする請求項33記載の色補正装置。
【請求項47】 電子カラーカメラによって撮像されたカラー画像の色補正データが記録された記録媒体において、上記記録媒体は、 ニューラルネットワークを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップと、 上記補正されたデータを表すデータを上記記録媒体に記録するステップによって用意される記録媒体。
【請求項48】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項47記載の記録媒体。
【請求項49】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項47記載の記録媒体。
【請求項50】 電子カラーカメラによって撮像されたカラー画像の色補正データが記録された記録媒体において、上記記録媒体は、 多層パーセプトロンモデルを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップと、 上記補正されたデータを表すデータを上記記録媒体に記録するステップによって用意される記録媒体。
【請求項51】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項50記載の記録媒体。
【請求項52】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項50記載の記録媒体。
【請求項53】 上記多層パーセプトロンモデルは、レベンバーグ−マーカート式のアルゴリズム(Levenberg-Marquardt type algorithm)のドッグレッグトラストリージョン(dogleg trust region)に基づいて学習することを特徴とする請求項50記載の記録媒体。
【請求項54】 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項54記載の記録媒体。
【請求項55】 各ニューラルネットワークの教示データを、標準光源下での測色値として用いるステップを更に有する請求項50記載の記録媒体。
【請求項56】 電子カラーカメラによって撮像されたカラー画像の色補正データが記録された記録媒体において、上記記録媒体は、 強制ニューロ−ファジイ干渉システムモデルを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップと、 上記補正されたデータを表すデータを上記記録媒体に記録するステップによって用意される記録媒体。
【請求項57】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項56記載の記録媒体。
【請求項58】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項56記載の記録媒体。
【請求項59】 ファジイメンバーシップ関数からなる集積部は、カラー画像の撮像時における光源の推定に基づいて、ローカルエキスパート多層パーセプトロンの出力の加重和を計算することを特徴とする請求項56記載の記録媒体。
【請求項60】 上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築するステップを更に有する請求項59記載の記録媒体。
【請求項61】 上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項56記載の記録媒体。
【請求項62】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項59記載の記録媒体。
【請求項63】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、パラメータ更新の発見的規則に従って同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項59記載の記録媒体。
【請求項64】 上記ファジイメンバーシップ関数の少なくとも2つは重複することを特徴とする請求項59乃至63のいずれか1項に記載の記録媒体。
【請求項65】 電子カラーカメラによって撮像されたカラー画像の色補正データが記録された記録媒体において、上記記録媒体は、 スイッチングを有する強制ニューロ−ファジイ干渉システムを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記補正されたデータを表すデータを上記記録媒体に記録するステップによって用意される記録媒体。
【請求項66】 代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項56記載の記録媒体。
【請求項67】 代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項56記載の記録媒体。
【請求項68】 代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いるステップを更に有する請求項56記載の記録媒体。
【請求項69】 代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いるステップを更に有する請求項56記載の記録媒体。
【請求項70】 電子カラーカメラによって撮像されたカラー画像の色補正されたデータを伝送するデータ伝送方法において、 ニューラルネットワークを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップと、 上記補正されたデータを表すデータを伝送するステップを有するデータ伝送方法。
【請求項71】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項70記載のデータ伝送方法。
【請求項72】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項70記載のデータ伝送方法。
【請求項73】 電子カラーカメラによって撮像されたカラー画像の色補正されたデータを伝送するデータ伝送方法において、 多層パーセプトロンモデルを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップと、 上記補正されたデータを表すデータを伝送するステップを有するデータ伝送方法。
【請求項74】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項73記載のデータ伝送方法。
【請求項75】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項73記載のデータ伝送方法。
【請求項76】 上記多層パーセプトロンモデルは、レベンバーグ−マーカート式のアルゴリズム(Levenberg-Marquardt type algorithm)のドッグレッグトラストリージョン(dogleg trust region)に基づいて学習することを特徴とする請求項73記載のデータ伝送方法。
【請求項77】 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項73記載のデータ伝送方法。
【請求項78】 各ニューラルネットワークの教示データを、標準光源下での測色値として用いるステップを更に有する請求項79記載のデータ伝送方法。
【請求項79】 電子カラーカメラによって撮像されたカラー画像の色補正されたデータを伝送するデータ伝送方法において、 強制ニューロ−ファジイ干渉システムモデルを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記光源は複数の光源からなっており、上記カラー画像を表すデータに対して補正を行うステップと、 上記補正されたデータを表すデータを伝送するステップを有するデータ伝送方法。
【請求項80】 上記電子カラーカメラは少なくとも1つの静止画像を撮像することを特徴とする請求項79記載のデータ伝送方法。
【請求項81】 上記電子カラーカメラは動画像の連続を撮像することを特徴とする請求項79記載のデータ伝送方法。
【請求項82】 ファジイメンバーシップ関数からなる集積部は、カラー画像の撮像時における光源の推定に基づいて、ローカルエキスパート多層パーセプトロンの出力の加重和を計算することを特徴とする請求項79記載のデータ伝送方法。
【請求項83】 上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築するステップを更に有する請求項82記載のデータ伝送方法。
【請求項84】 上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項79記載のデータ伝送方法。
【請求項85】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項82記載のデータ伝送方法。
【請求項86】 ファジイメンバーシップ関数及びローカルエキスパート多層パーセプトロンの全てのパラメータは、パラメータ更新の発見的規則に従って同時に更新され、上記強制ニューロ−ファジイ干渉システムモデルにおいて推定された光源の特性付けを行うために、ホワイトバランス面に対してニューラルネットワークの非線形の座標変換を行うことによって、ファジイメンバーシップ関数を構築することにより、上記強制ニューロ−ファジイ干渉システムモデルを学習するステップを更に有する請求項82記載のデータ伝送方法。
【請求項87】 上記ファジイメンバーシップ関数の少なくとも2つは重複することを特徴とする請求項82乃至86のいずれか1項に記載のデータ伝送方法。
【請求項88】 電子カラーカメラによって撮像されたカラー画像の色補正されたデータを伝送するデータ伝送方法において、 スイッチングを有する強制ニューロ−ファジイ干渉システムを用いて、上記カラー画像の推定された光源に基づいて上記カラー画像を表すデータに対する補正を決定するステップと、 上記補正されたデータを表すデータを伝送するステップを有するデータ伝送方法。
【請求項89】 代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項79記載のデータ伝送方法。
【請求項90】 代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 上記色補正された画像の出力色空間を、上記光源の色度座標により正規化しない空間として出力するステップを更に有する請求項79記載のデータ伝送方法。
【請求項91】 代表的な光源それぞれに対応する別々のニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いるステップを更に有する請求項79記載のデータ伝送方法。
【請求項92】 代表的な光源それぞれに対応するニューラルネットワークを用いて、色変換逆マップ(color conversion inverse map)を見つけるステップと、 標準的な光源下で、各ニューラルネットワークの教示データを測色値として用いるステップを更に有する請求項79記載のデータ伝送方法。
【請求項93】 上記カラー画像を表すデータは、上記光源に関する情報を含んでいることを特徴とする請求項1、4又は10のいずれか1項に記載の色補正方法。
【請求項94】 上記カラー画像を表すデータは、上記光源に関する情報を含んでいることを特徴とする請求項24、27又は33のいずれか1項に記載の色補正装置。
【請求項95】 電子カメラによって撮像された画像データを記録するデータ記録方法において、 カラー画像を撮像して、上記画像を表すデータを出力するステップと、 上記撮像されたカラー画像における光源を推定して、上記推定された光源を表すデータを出力するステップと、 上記画像を表すデータと上記推定された光源を表すデータとを記録するステップとを有するデータ記録方法。
【請求項96】 電子カメラによって撮像された画像データを伝送するデータ伝送方法において、 カラー画像を撮像して、上記画像を表すデータを出力するステップと、 上記撮像されたカラー画像における光源を推定して、上記推定された光源を表すデータを出力するステップと、 上記画像を表すデータと上記推定された光源を表すデータとを伝送するステップとを有するデータ伝送方法。

【図1】
image rotate


【図2】
image rotate


【図3】
image rotate


【図4】
image rotate


【図5】
image rotate


【図6】
image rotate


【図7】
image rotate


【図8】
image rotate


【図9】
image rotate


【図10】
image rotate


【図11】
image rotate


【図12】
image rotate


【図13】
image rotate


【図14】
image rotate


【図15】
image rotate


【公表番号】特表2002−543695(P2002−543695A)
【公表日】平成14年12月17日(2002.12.17)
【国際特許分類】
【出願番号】特願2000−614670(P2000−614670)
【出願日】平成12年4月28日(2000.4.28)
【国際出願番号】PCT/US00/11504
【国際公開番号】WO00/65847
【国際公開日】平成12年11月2日(2000.11.2)
【出願人】
【氏名又は名称】ソニー株式会社
【Fターム(参考)】