写真画像処理方法、写真画像処理装置、及び事象推定方法
【課題】入出力の直積空間内で学習サンプルから推定した共分散行列を用いて、マハラノビス汎距離を最小化する出力を求める写像演算を用いることにより、欠損画像の高精度な修復等が可能な写真画像処理方法及び写真画像処理装置を提供する。
【解決手段】写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップとを備えた写真処理方法。
【解決手段】写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップとを備えた写真処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マハラノビス(Mahalanobis)汎距離の最小化処理を用いた高次元線形写像演算により、処理対象となる写真画像を変換する写真画像処理方法、写真画像処理装置、及び事象推定方法に関する。
【背景技術】
【0002】
非特許文献1から4に開示されているように、高次元ベクトル間の写像演算は、欠損画像の修復、画像の陰影推定・除去等に広範囲に用いられている。
【0003】
単純な回帰計算で写像を求める場合、入出力の直積空間に分布する同じ学習サンプルに対して入出力の割り当てを変えると再計算が必要になる、サンプル数よりも入力次元数が高い場合に「多重共線形性」に起因する回帰計算の精度低下が起きる等の問題に直面する。これは、サンプル数よりも入力の次元数が高い場合に、入力変数間に一次従属関係が生じ、計算が不安定になることを指す。
【0004】
この問題を回避するために、非特許文献5には、主成分分析(PCA:Principal Component Analysis)により入力の次元圧縮をして回帰計算を行う手法であるPCR(Principal Component Regression)が提案されているが、出力とは無関係に入力だけを次元圧縮するために、出力との相関が強い入力成分まで弱めることがある。
【0005】
これを回避するために、入出力の空間で同時に基底を求め、個々の入出力をこれら基底の線形和で表わしたときの係数間の回帰係数を求める手法であるPLS(Projection to Latent Structure)も提案されているが、上述の再計算の問題は回避できない。
【0006】
このように回帰計算では、入力変数の独立性を仮定しており、その独立性が崩れると、著しい精度低下が起きる。また、出力変数に関しても独立性が仮定されており、写像関数は出力変数の数だけ求められる。従って、各出力が互いに独立に変化する可能性があるため、画像のように出力変数間の相関が強いデータの写像にはあまり適さないと言える。
【0007】
これらの問題を回避するために、入出力の直積空間内で学習サンプルから構成した部分空間を利用して入出力間の写像である「部分空間写像」を求める方法もある。尚、共分散行列の固有ベクトルで張られる空間の場合、元の空間の原点を含まないため超平面と呼ぶべきであるが、本明細書ではこの場合も部分空間と呼ぶ。
【0008】
この方法では、入出力変数の独立性を仮定せず、むしろこれらの相関関係を部分空間として表している。このため、入力次元数の増加により、むしろ共線形性の問題は生じ難くなる。また、同じ学習サンプルに対する入出力の変更も自由にできるという利点がある。さらに、出力変数間の相関を考慮しているため、出力値が独立に変動しにくく、画像など出力値の空間的連続性を保存しなければならない用途に適している。
【非特許文献1】天野敏之、佐藤幸男:固有空間法を用いたBPLPによる画像補間 、電子情報通信学会論文誌D-II、 Vol.J85-D-II、 No.3、 pp.457-465 (2002)
【非特許文献2】N.Otsu and T.Kasvand、 “Image restoration by multipler regression analysis approach、” Proc. of ICPR、 pp.155-158、 1984.
【非特許文献3】S. Baker、 T. Kanade、 “Limits on super-resolution and how to break them、” In: Proc. Of CVPR. South Carolina、 vol. 2、 pp. 372-379、 2000
【非特許文献4】島野、 長尾、 岡部、 佐藤、 佐藤、 ”任意照明下顔認識のための顔表面の位置相関を考慮したMAP推定”、 情報処理学会CVIM論文誌、 Vol.47、 No.SIG10 (CVIM 15)、 pp.162-172、 July 2006.
【非特許文献5】D. A. Belsley、 E. Kuh、 and R. E. Welsch、 Regression Diagnostics; Identifying Influential Data and Sources of Collinearity、 John Wiley & Sons、 New York、 1980
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしこの手法は、図1に示すように、入力の次元数が低い場合に、入力の補空間と部分空間との交わりが広がるため、写像が不安定になるという問題がある。また、部分空間の次元数が増加しても同様の問題が生じる。これらは、出力変数間の独立性を仮定しないために、十分な入力が与えられないと、出力変数間に多重共線形性が残ることに起因する問題である。
【0010】
これらの問題を回避するには、入力空間の次元数を上げるか、または、部分空間の次元数を下げる必要がある。しかし、与えられる問題によって入出力空間の次元数は定められており、意図的にこれを変えることはできず、部分空間の次元数を下げることは、データ分布を粗く近似することになるため、写像の精度を低下させてしまう。このような問題は、カーネルPCAで得られる非線形部分空間でも生じ得る普遍的問題であり、これが解決できれば線形・非線形を問わず、幅広いクラスの写像計算全般の安定化につながる。
【0011】
本発明の目的は、入出力の直積空間内で学習サンプルから推定した共分散行列を用いて、マハラノビス汎距離を最小化する出力を求める写像演算を用いることにより、例えば、欠損画像の高精度な修復等が可能な写真画像処理方法、写真画像処理装置、及び事象推定方法を提供する点にある。
【課題を解決するための手段】
【0012】
上述の目的を達成するため、本発明による写真画像処理方法の第一の特徴構成は、特許請求の範囲の書類の請求項1に記載した通り、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップとを備えている点にある。
【0013】
第一ステップでは、学習サンプルである画像の各画素データが成分として配列された複数のベクトル画像が教師画像として入力され、第二ステップでは、学習サンプルに基づいて入出力の直積空間内で共分散行列が推定される。第三ステップでは、処理対象ベクトル画像が入力され、共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点が求められ、第四ステップでは、最小マハラノビス汎距離を与える直積空間内の点から処理対象ベクトル画像に対応する出力が求められる。
【0014】
通常の回帰計算や部分空間写像は、最小二乗法による回帰直線・平面の推定問題に帰着する。しかし高次元ベクトル間の写像では、条件数が不足し、ユニークな最小二乗解が決定できないケースがしばしば発生する。このような場合、部分空間写像では出力ベクトルのノルムを最小化するなど、写像とは無関係な条件を導入して計算の安定化が図られる。これに対し本発明によれば、条件数の不足をマハラノビス汎距離、すなわち学習データの分布により補うため、安定な挙動が実現できる。本発明によれば、部分空間を介した線形写像を一般化した形式になり、上述の多重共線形性の問題は生じない。
【0015】
同第二の特徴構成は、同請求項2に記載した通り、上述の第一特徴構成に加えて、前記共分散行列が非正則である場合に、前記第三ステップで、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離と、前記部分空間の補空間への射影残差に所定の重み変数を乗じた値とを加算した目的関数を生成し、当該目的関数の値が最小となる直積空間内の点を求める点にある。
【0016】
第一の特徴構成による方法では、共分散行列が非正則である場合には、演算結果が自明ではないため、共分散行列に対応したMoore-Penrose型一般逆行列を用いたマハラノビス汎距離と、前記部分空間の補空間への射影残差に所定の重み変数を乗じた値とを加算した目的関数を生成し、当該目的関数の値が最小となる直積空間内の点を求めることにより近似解が得られる。
【0017】
同第三の特徴構成は、同請求項3に記載した通り、上述の第一特徴構成に加えて、前記共分散行列が非正則である場合に、前記第三ステップは、前記部分空間と前記出力超平面の交わりの基底ベクトルを求めるステップと、交わりに含まれる点を前記基底ベクトルの線形式で求めるステップと、前記線形式の係数を調整することにより、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離を最小とする直積空間内の点を求めるステップを備えている点にある。
【0018】
共分散行列が非正則である場合には、演算結果が自明ではないため、部分空間と出力超平面の交わりに含まれる点を基底ベクトルの線形式で求め、線形式の係数を調整することにより、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離を最小とする直積空間内の点を求めることにより厳密解が得られる。
【0019】
本発明による写真画像処理装置の第一の特徴構成は、同請求項4に記載した通り、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一処理部と、入出力の直積空間内で学習サンプルから共分散行列を推定する第二処理部と、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三処理部と、求められた点から処理対象ベクトル画像に対応する出力を求める第四処理部と備えている点にある。
【0020】
本発明による線形写像演算を用いた事象推定方法は、複数のパラメータを成分とする複数のベクトルデータを事象を表す学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された推定対象ベクトルデータに直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から推定対象ベクトルデータに対応する出力を推定事象として求める第四ステップとを備えている点にある。
【発明の効果】
【0021】
以上説明した通り、本発明によれば、入出力の直積空間内で学習サンプルから推定した共分散行列を用いて、マハラノビス汎距離を最小化する出力を求める写像演算を用いることにより、例えば、欠損画像の高精度な修復等が可能な写真画像処理方法、写真画像処理装置、及び事象推定方法を提供することができるようになった。
【発明を実施するための最良の形態】
【0022】
以下、本発明による写真画像処理方法及び写真画像処理装置の実施の形態について説明する。
【0023】
図13に示すように、写真画像処理装置1は、印画紙Pに対して出力画像データに基づいた露光処理を行ない、露光された印画紙を現像処理して写真プリントを生成出力する写真プリンタ2と、写真画像に対するプリントオーダ情報を設定入力するとともに、各種の画像補正処理を行ない、原画像から編集処理した出力画像データを写真プリンタ2に出力する操作ステーション3を備えて構成されている。
【0024】
操作ステーション3は、現像済みの写真フィルムFから画像を読み込むフィルムスキャナ31と、デジタルスチルカメラ等で撮影された画像データが格納されたメモリカード等の画像データ記憶メディアMから画像データを読み取るメディアドライバ32と、コントローラ33としての汎用コンピュータ等を備えている。
【0025】
図13及び図14に示すように、写真プリンタ2は、ロール状の印画紙Pを収容した二系統の印画紙マガジン21と、印画紙マガジン21から引き出された印画紙Pを所定のプリントサイズに切断するシートカッター22と、切断後の印画紙Pの背面にコマ番号等のプリント情報を印字するバックプリント部23と、プリントデータに基づいて印画紙Pを露光する露光部24と、露光後の印画紙Pを現像、漂白、定着するための各処理液が充填された複数の処理槽25a、25b、25cを備えた現像処理部25が印画紙Pの搬送経路に沿って配置され、現像処理後に乾燥処理された印画紙Pが排出される横送りコンベア26と、横送りコンベア26に集積された複数枚の印画紙(写真プリント)Pがオーダー単位で仕分けられるソータ27を備えている。
【0026】
露光部24には、搬送機構28によって副走査方向に搬送される印画紙Pに対して、搬送方向に直交する主走査方向に前記プリントデータに基づき変調されたRGB三色のレーザ光線束を出力して露光する露光ヘッド24aが収容されている。
【0027】
搬送経路に沿って配置された露光部24や現像処理部25に、所定のプロセス速度で印画紙Pを搬送する複数のローラ対でなる搬送機構28が配置され、露光部24の前後には印画紙Pを複列に搬送可能なチャッカー式搬送機構28aが設けられている。
【0028】
操作ステーション3に設けられたコントローラ33には、汎用のオペレーティングシステムの管理下で動作し、写真処理装置1の各種の画像処理や入出力制御を実行するための複数のアプリケーションプログラムがインストールされ、オペレータとの操作インターフェースとしてモニタ34、キーボード35、マウス36等が接続されている。当該アプリケーションプログラムに本発明による画像処理プログラムが含まれる。
【0029】
コントローラ33は、そのハードウェア及びソフトウェアが協働して写真処理プロセスを実行するブロックで、以下に、各機能ブロックに分けて説明する。
【0030】
図15に示すように、コントローラ33は、フィルムスキャナ31やメディアドライバ32によって読み取られた原画像としての写真画像データを受け取り、所定の前処理を行なってメモリ41に転送する画像入力部40と、モニタ34の画面にプリントオーダ情報や画像編集情報を表示するとともに、それらに対して必要なデータ入力のための操作用アイコンを表示するグラフィック操作画面を生成し、或いは表示されたグラフィック操作画面に対するキーボード35やマウス36からの入力操作に基づいて各種の制御コマンドを生成するグラフィックユーザーインターフェース部42と、画像入力部40から転送される写真画像データ及び画像処理部47による補正処理後の写真画像データやそのときの補正パラメータ、更には設定されたプリントオーダ情報等が所定領域に区画されて格納されるメモリ41と、プリントオーダ情報を生成するオーダー処理部43と、メモリ41に格納された各写真画像データに対してコマ画像毎または所定枚数のコマ画像に濃度補正処理やコントラスト補正処理等を行なう画像処理部47を備えている。
【0031】
さらに、グラフィックユーザーインターフェース部42からの表示コマンドに基づいてメモリ41に展開された画像データや各種の入出力用グラフィックデータ等をモニタ34に表示処理するビデオRAM等を備えた表示制御部46と、各種の補正処理が終了した最終の補正画像を写真プリンタ2に出力するためのプリントデータを生成するプリントデータ生成部44と、顧客のオーダーに応じて最終の補正画像をCD−R等の記憶媒体に書き込むためのファイル形式に変換するフォーマッタ部45等を備えている。
【0032】
フィルムスキャナ31は、フィルムFに記録された画像を低解像度ではあるものの高速で読み取るプレスキャンモードと、低速ではあるものの高解像度で読み取る本スキャンモードの二モードで作動するように構成され、プレスキャンモードで読み込まれた低解像度の画像に対して各種の補正処理が行なわれ、その際に前記メモリ41に記憶された補正パラメータに基づいて本スキャンモードで読み込まれた高解像度の画像に対する最終の補正処理が実行されてプリンタ2に出力される。
【0033】
同様に、メディアドライバ32から読み込まれた画像ファイルには高解像度の撮影画像とそのサムネイル画像が含まれ、サムネイル画像に対して後述の各種の補正処理が行なわれ、その際にメモリ41に記憶された補正パラメータに基づいて高解像度の撮影画像に対する最終の補正処理が実行される。尚、画像ファイルにサムネイル画像が含まれないときには、画像入力部40で高解像度の撮影画像からサムネイル画像が生成されてメモリ41に転送される。
【0034】
このように、頻繁に試行錯誤される各種の編集処理が低解像度の画像に対して実行されることによりコントローラ33の演算負荷が低減されるように構成されている。
【0035】
画像処理部47には、メモリ41に格納された原画像である写真画像データに対して撮影レンズに起因する歪を補正する歪補正部50と、粒状ノイズを抑制する粒状ノイズ抑制処理部51と、画像のエッジを強調し、ノイズを抑制する鮮鋭化処理部52と、自然なカラーを再現できるようにカラーバランスを調整するカラー補正部53と、写真プリントのサイズに適した画像サイズに変換する拡縮処理部54と、本発明による写真画像処理方法及び装置を具現化する線形写像演算部55等の複数の画像処理ブロックを備えている。
【0036】
図16に示すように、線形写像演算部55は、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一処理部と、入出力の直積空間内で学習サンプルから共分散行列を推定する第二処理部と、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三処理部と、求められた点から処理対象ベクトル画像に対応する出力を求める第四処理部と備えている。
【0037】
以下、線形写像演算部55による写真画像処理方法の原理及び実際の処理手順について、部分空間写像と対比しながら詳述する。
【0038】
〔直積空間を介した写像計算〕
本発明の説明の前に、先ず、空間RN内での主成分分析に基づいて、入力空間Rrのベクトルに対応する出力空間RN−rの要素を求める方法について述べる。但し、ベクトルx(以下の説明では、「ベクトルx」等を単に「x」と表記する場合もある。)は平均0共分散Cの正規分布に従うものとする。
【0039】
xのうち観測された部分、つまり、学習サンプル或は処理対象画像の画像ベクトル(入力)を、
【数1】
【0040】
xのうち未観測の部分、つまり、入力された処理対象画像の出力画像ベクトル(出力)を、
【数2】
【0041】
と表す。但し、φi(i=1,・・・,N)は任意の正規直交基底Φ1=[φ1・・・φr],Φ2=[φr+1・・・φN]である。
【0042】
Φ1,Φ2が張る空間Rr,RN−rを、それぞれ、「入力空間」、「出力空間」と呼ぶ。通常、出力空間には入力yは含まれないが、yを含む出力空間と平行な超平面を「出力超平面」と呼ぶ。本質的に、この出力超平面内の探索を通じて出力が決定される。ここでΦ1=[φ1・・・φN]とすると、明らかに、次式が成り立ち、
【数3】
【0043】
従って、
〔数4〕
P1+P2=I
〔数5〕
x=y+z
〔数6〕
yTZ=0
も成り立つ。例えば、
【数7】
【0044】
とすれば、φiは正規直交基底となり、
【数8】
【数9】
【0045】
となるため、次式が成立し、
【数10】
【0046】
P1+P2=I,x=y+z,yTZ=0となることが確認できる。
【0047】
また、共分散行列Cとその固有値、固有ベクトルをλi,Vi(i=1,・・・,M),M≦Nと表し、これらを用いて、以下の行列を定義する。
【数11】
,
【0048】
〔部分空間を介した写像〕
線形回帰を行う方法として、図2に示す部分空間を用いた方法について述べる。具体的には、学習サンプルから求めた共分散行列Cの固有値問題を解くことによって得られる正規直交基底Viが張る部分空間上にyとzの和が乗るように、出力zを求める方法である。
【0049】
この部分空間への射影行列はW=VMVMTとなる。これを用いて、ベクトルxの射影先Wxを求めることができる。このとき射影残差の2乗は、次式で表される。
【数12】
【0050】
但しIは単位行列である。WW=W、及び、WT=Wという性質から、上式はさらに以下のように簡単化できる。
【数13】
【0051】
これは、部分空間の直交補空間への射影の長さの2乗を表している。S=I−W,x=y+zとして、〔数13〕に代入すると、(y+z)TS(y+z)が得られ、これを最小化すれば、補空間への射影成分が最小化される出力zSが計算できる。
【0052】
変数の素性を明示的に表すと、
【数14】
【0053】
となるので、この式をzで偏微分し、z=zSとした結果が0であることから、次式が得られる。
【数15】
【0054】
この式中のP2TSP1や、P2TSP2は正則ではないので、出力はMoore-Penrose型一般逆行列(+記号)を用いて、以下のように表される。
【数16】
【0055】
さらに、自明な項を除き、整理すると次の解が得られる。
【数17】
【0056】
この式中で、学習で求める部分が、S=I−VMVMTであり、入出力はP2を変化させるだけで切り替えられる。
【0057】
図3は、64×64の画像1021枚から求めた1020次元の部分空間を介した写像計算を行った結果を示す。入出力の直積空間は64×64=4096次元、入力は1024次元、出力は3072次元である。この例のように入力の次元数が出力に比べて低い場合には部分空間を介した写像の精度は低下しやすい。
【0058】
これは、〔数17〕が〔数15〕を満足する最小ノルム解となっているためであり、例えば図1のケースでは、交わりの中で最短のベクトルが求められる。このため、図3の場合は学習サンプルの平均画像に近い画像が現れる。
【0059】
〔本発明によるマハラノビス汎距離最小化による写像〕
共分散行列の逆行列C−1を用いた直積空間内でのマハラノビス汎距離xTC−1xを最小化することによって出力zc−1を求める本発明による写真画像処理方法について、図4を参照して述べる。図4中、破線は等距離面を示す。以下、この手法をMahalanobis-distance Minimization Mapping、略して「M3」と表記する場合もある。
【0060】
マハラノビス汎距離の式を展開すると、
【数18】
【0061】
となり、変数の素性を明示的に表すと次式が得られる。
【数19】
【0062】
この式をzで偏微分し、z=zc−1とした結果が0であることから、次式が得られる。
【数20】
【0063】
この式中のP2TSP1や、P2TSP2は正則ではないので、出力はMoore-Penrose型一般逆行列を用いて、以下のように表される。
【数21】
【0064】
このうち、自明な項を除き、〔数17〕の場合と同様に整理すると次式の解が得られる。この場合もP2だけで入出力空間を変更できる。
【数22】
【0065】
〔本発明による演算法〕
〔数17〕と〔数22〕を比較すると、SとC−1が異なるだけで式の構造は同じであることが分かる。前者は、部分空間の補空間に対する射影行列、後者は共分散行列の逆行列である。
【0066】
但し、共分散行列C=VMΛMVMT及びその逆行列C−1=VMΛM−1VMTは、正則でない場合、Cの固有値(ΛMの対角成分)が0の要素に対応するΛM−1の要素を∞と計算しなければ、〔数22〕は不正確な写像になる。
【0067】
仮に一般逆行列C+=VMΛM+VMTで代替すると、固有値0に対応するΛM+の要素は0であるため、部分空間の補空間に射影される成分にペナルティが与えられない。
【0068】
このためxTC+xを計算すると、図5に示すように、本来マハラノビス汎距離が無限大となる筈の部分空間外部にも、補空間に沿って同じ距離の値が漏れ出てしまう。従って、〔数22〕C+を用いると、部分空間外部でもxTC+xが小さくなり、不正確な写像になる。
【0069】
本発明では、図6に示すように、入力に直交する出力超平面と部分空間との両方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求め、これに対応する出力を求める。具体的には、次に示す近似解法と、厳密解法の二つの手法を採用する。
【0070】
〔近似解法〕
ここで示す近似解法は、〔数17〕と〔数22〕を正則化の立場から融合するというアプローチである。具体的には、以下の数式による値を最小化するzを求める手法となる。
【数23】
【0071】
但し、αは正則化パラメータである。これは、部分空間の補空間への射影成分とマハラノビス汎距離の重み付き和を最小化する目的関数である。〔数23〕は、次の行列を用いた2次形式になっている。
【数24】
【0072】
これはrank(C−1*)=Nの正則行列であり、これを用いた2次形式は直積空間の原点で最小値0を持つ。〔数22〕中のC−1の代わりにC−1*を用いれば,出力超平面上で2次形式の値を極小化する出力zC−1*が求められる。〔数22〕は、行列と一般逆行列の積になるため、αの絶対的値はキャンセルされ、実質的にはαによってC+とSとの相対的比率が変化するのみである。
【0073】
図7に示すように、このαを変化させると、以下に述べるように解が変化する。即ち、αが0であるとき、部分空間から遠く離れた最小マハラノビス解と一致し、αが正の小さな値であるとき、マハラノビス距離を極小化する傾向が強い反面、部分空間からの逸脱を許してしまい、α→∞であるとき、部分空間からの逸脱は小さくなるものの、マハラノビス距離の評価は弱まり、最小ノルム解に漸近する。
【0074】
このように、αの値をいかに設定しても正確な解は求まらないものの、αの値が適切であれば、実用上問題ない程度の精度の結果が得られる。尚、αの値は、処理対象画像の特性に基づいて予め実験等を介して決定される。
【0075】
〔厳密解法〕
この解法は、以下の考え方及び手順に基づく。即ち、部分空間と入力に直交する出力超平面の交わりの基底ベクトルを求め、交わりに含まれる点を基底ベクトルの線形式で求める。さらに、その係数を調整することにより、C+を用いたマハラノビス距離を最小化する。
【0076】
交わりの部分の基底ベクトルは、P2Wd=λdを満足するλ=1の固有ベクトルとなる。これは、最小正準角を求める際に解かれる固有値問題と同じ形式であるが、次の点が異なる。正準角を求める際にはλ=1の固有値は捨てられるのに対して、この厳密解ではλ=1の固有ベクトルを積極的に利用する。
【0077】
これは、「WとP2による射影を順次行っても長さが変わらないベクトルは、出力超平面と部分空間の交わりの中に含まれる」という事実に基づいている。本発明では、λ=1に対応する固有ベクトルdiを交わり部分の基底として利用する。以降、これら固有ベクトルから成る行列をD=[d1・・・dk]と表す。
【0078】
実際の交わりに含まれる点を表すためには、交わりに含まれる1点xSが必要になる。xSとしては、図6の最小ノルム解zS+yが利用できる。このとき、交わりに含まれる点集合は次式で表わされる。但し、aはk次元係数ベクトルである。
【数25】
【0079】
従って、xT(a)C+x(a)を最小化するa*を求めることにより、本発明による出力zM3=P2x(a*)が算出できる。
【数26】
【0080】
であるので、
【数27】
【0081】
が成立する。これを解き、
【数28】
【0082】
が得られるので、zM3=P2x(a*)が算出できる。但し、以下の二つケースに関しては例外処理が必要となる。即ち、P2Wd=λdを満足するλ=1の固有ベクトルが存在しない場合には、交点は唯一に決定できるため、出力は最小ノルム解zSになる。また、P2Wd=λdを満足するλ=1の固有ベクトルが出力と同じ次元数(N−r)個ある場合には、出力は出力空間全域を自由に移動でき、最小真柄のビス解zC+に一致する。但し、このケースでは、共分散行列Cは正則になっており、zC+=zC−である。
【0083】
xS=zS+yと仮定して以上の式を整理すると、〔数17〕、〔数25〕、〔数28〕から、以下のように表される。
【数29】
【0084】
このマトリクスを特異値分解したとき、以下の式が得られる。但し、UyTはK×N、ΛRはK×K、UzはK×Nの行列であり、KはΛRの非零の特異値の個数である。
【数30】
【0085】
従って、写像計算にはN次元ベクトルの内積K回、スカラの乗算K回、K次元ベクトルの内積N回が必要であり、写像計算のオーダはO(NK)となる。従って、Kの値が小さければ、高速な計算も可能になる。
【0086】
図16に示すように、線形写像演算部55では、先ず、構成画素数が等しい複数枚のサンプル画像が第一処理部に入力され、各画素データを成分とする複数のベクトル画像としてメモリ41に記憶される。例えば、64画素×64画素のサンプル画像であれば、4096次元のベクトル画像がR,G,Bの三色について夫々メモリに格納される。
【0087】
第二処理部では、サンプル画像から共分散行列の推定処理が色成分毎に実行される。第三処理部では、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める演算処理が色成分毎に実行される。
【0088】
処理対象ベクトル画像とは、欠損画像の修復処理、或は、超解像化処理等が必要な画像である。第三処理部では、上述した近似解法または厳密解法の何れかに基づいて直積空間内の点が求められ、第四処理部では、それに基づいて処理対象ベクトル画像に対応する出力画像が生成されてメモリ41に書き込まれる。
【0089】
本発明による線形写像演算は、RGB色成分毎に実行されるものであるが、YCC等に変換された輝度、色相に対しても同様に処理可能であり、RGBの補色であるCMY色成分毎に実行されるものであってもよい。
【0090】
学習サンプル内の何れかの画像が処理対象画像として入力される場合には、厳密解法を採用することにより、高精度な出力画像が獲得でき、学習サンプルとは異なる処理対象画像が入力される場合には、厳密解法と近似解法の何れが適切であるか、判断が困難であるため、少なくとも高速処理が必要な場合には、近似解法を採用することが好ましい。
【0091】
つまり、第一処理部で、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップが実行され、第二処理部で、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップが実行され、第三処理部で、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップが実行され、第四処理部で、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップが実行される。
【0092】
これらの処理を実行するプログラムは、コントローラ33に備えたハードディスク等の記憶媒体にインストールされ、OSの管理下で実行されるものである。また、専用の写真処理装置ではなく、汎用のパーソナルコンピュータにこれらのプログラムがインストールされ、コンピュータ上で処理されるように構成されるものであってもよい。
【実施例】
【0093】
以下では、〔数22〕、〔数23〕を用いた近似解法、及び、〔数25〕、〔数28〕を用いた厳密解法の写像演算と、〔数17〕を用いた部分空間を介した写像演算を、上述した写真処理装置を用いて行なった比較結果を示す。尚、近似解法では正則化パラメータであるαを0.05として実験を行った。
【0094】
〔低次元空間でのシミュレーション〕
図8は、3次元データを用いて写像計算のシミュレーションを行った結果である。学習に使用したデータは、2次元の正規乱数を平面上で発生させ、これを回転させて生成した3次元のベクトル5000個である。
【0095】
この学習サンプルに対して主成分分析を行い、2次元の部分空間を構成した。入力1次元、出力2次元として部分空間写像、共分散行列の一般逆行列を用いた写像計算法、近似解法、厳密解法について実験を行った。
【0096】
図8から、部分空間写像では、写像結果zSは部分空間の上に拘束されていることが分かる。しかし入力次元数が低いため部分空間と入力空間の交点が唯一に決まらないため、最小ノルム解が求められてしまう。
【0097】
一方、共分散行列の一般逆行列を用いた写像演算法では、部分空間の拘束をせずにマハラノビス距離のみを最小化することになるため、写像結果zC+は部分空間から大きく逸脱してしまう。
【0098】
これに対して本発明による厳密解zM3は、近似解zC−1*と近いが、zC−1*は部分空間から逸脱していて、zM3は部分空間に拘束されていることが確認できる。
【0099】
〔画像の欠損推定実験〕
画像データを用いた欠損推定の実験では学習サンプルとしてCAS-PEAL顔画像データベースから無作為に抽出した1021枚の正面顔画像の主成分分析を行い、1020次元の部分空間を構成した。テスト画像としてはCAS-PEALと、Yale face database Bのデータベースから抽出した学習サンプルに含まれない画像を用いた。
【0100】
各画像は両眼位置が揃うように回転とスケーリングを行い、64×64のサイズで切り出して使用している。入出力直積空間の次元数は、64×64=4096次元であり、入力の次元数は4096×3/4=3072、4096×1/2=2048、4096×1/4=1024の3通りである。
【0101】
図9及び図10に、学習画像の一部を欠損させて復元した画像例と入力次元数に対する画素あたりの平均誤差の関係を示す。この図から部分空間写像は入力次元数が高い場合には精度の高い写像が計算できているが、入力次元数が低下すると、急激に計算精度が低下することが分かる。これは元々点であった出力超平面と部分空間の交わりが、入力次元数の低下とともに高次元化した結果、この空間に沿って出力がドリフトし、最小ノルム解に向かって移動したためである。
【0102】
これと比べると厳密解法では入力次元数が低下しても精度の高い写像計算が行えており、入力が画像の1/4の大きさでもほぼ同一人物と見なせる画像が求められている。これは、出力超平面と部分空間の交わりの点が高次元化しても、最小ノルムの条件を用いず、この空間に沿ってマハラノビス距離を最小化する方向に移動した結果、学習データが元々分布していた付近から離れることなくそこに停留するためである。
【0103】
近似解法は必ずしも原画像の人物とは一致しないが、部分空間写像に比べると写像の破綻が起きにくい。このことは、直観的にも定量的にも確認できる。図11及び図12に、テスト画像(未学習データ)を与えた場合の復元結果を示す。この場合も同様に部分空間写像は不安定で、復元された顔領域は白くなっている。このように部分空間写像の精度が推定すべき画素欠損部の拡大にともなって低下する場合でも、部分空間の補空間への射影成分は十分小さく、画像全体としては正確に部分空間の上に乗っていることを確認している。
【0104】
厳密解法及び近似解法を定量的に比較してみると、この場合わずかではあるが厳密解法が優れていることが分かる。しかし、生成された画像の自然さという点では、近似解の方が比較的緩やかなコントラストの画像となっており、好ましい性質を持っている。
【0105】
いずれにせよ、これらの結果には、絶対的な意味で精度の高いものは含まれていない。この一因は、学習データ数が十分多くないために、入力および出力に類似した画像データがなかったためと考えられる。
【0106】
次に、欠損の与え方を空間的に均一にした場合の結果について述べる。この実験では、画像をチェッカーパターン状に入力と出力に分けて写像を行っている。実験で試したのは、各矩形の大きさを1画素、2×2画素、3×3画素とした場合の3通りであり、入力を抽出した原画像はテスト画像の一枚である。
【0107】
図から、同じ入力次元数であっても、空間的に一様に分布する入力である方が写像計算の精度が高いことが分かる。このことは図9〜図12と見比べても明らかである。この理由は、部分空間と入力空間の間の角が小さくなるためであると考えられる。
【0108】
しかしこの実験の設定では、部分空間と出力空間の間の交わりに存在するベクトルが少なくなるため、厳密解法の写像はケース1、即ち、部分空間写像と等しくなり、近似解法の方が厳密解法の写像よりも精度が上がっている。これは、最適な写像結果を求めるのに、部分空間を構成する学習データが少ない場合、部分空間に拘束してしまうのが必ずしも良い結果になるとは限らないからである。このため、部分空間に強く拘束する厳密解法よりも部分空間からの逸脱を許容する近似解法の方が高精度になる場合もある。
【0109】
つまり、本発明は、入出力の直積空間内で学習サンプルから推定した共分散行列を用いて計算されるマハラノビス汎距離を最小化する高次元線形写像計算法を用いた写真画像処理方法であり、これは、入出力空間内で確率分布を求め、入力に対して、確率密度を最大化する出力を推定する手法を、正規分布の場合に具体化したものとして解釈することができる。
【0110】
従来法との比較により、部分空間を介した写像よりも自然で正確な計算ができることが確認された。この傾向は、入力次元数が少なく、出力次元数が高い場合に特に顕著である。また、部分空間の補空間への射影成分とマハラノビス汎距離の両方を最小化する写像計算を行っており、共線形性の問題が発生しにくい安定な構造をしている。
【0111】
本発明は、図12(a)に示すような文字がオーバーライトされた欠損画像から原画像を修復したり、図12(b)に示すような低解像度画像を高解像度画像に超解像化したり、図12(c)に示すような画像の陰影を推定し、陰影を除去したり、さらには、ボケ画像の鮮鋭化処理、ぶれ画像の修復処理等に幅広く適用できる。
【0112】
図12(a)に示すような欠損画像から原画像を修復する場合には、欠損画像を複数の領域に分割し、オーバーライトされた文字による欠損が無い複数の分割領域をサンプル画像として第一処理部に入力し、欠損が発生している分割領域を処理対象画像として第三処理部に入力し、修復された分割画像を合成することにより欠損が無い原画像を得ることができる。
【0113】
一例として、実験の最後で示した間引いた画像からの原画像の推定は、幻影処理(Hallucination)の特殊例とみなすことができる。
【0114】
通常の回帰計算と比べると、共線形性の問題が発生しにくいことに加えて、直積空間内の確率分布さえ求めておけば、この空間を互いに直交するΦ1とΦ2の直積空間とみなすことによって任意の独立な成分間の写像計算が行える点が大きく異なる。
【0115】
例えば、Fourier基底を用いれば低周波数成分Φ1から、高周波数成分Φ2への写像、つまり、ボケ画像の鮮鋭化処理も同じ枠組みで適用できる。
【0116】
さらに、本発明による線形写像演算方法は、写真画像の修復処理等以外の事象の推定にも用いることができる。
【0117】
例えば、季節情報、消費者物価情報、売上実績情報、株価情報等の複数のパラメータで構成する株価ベクトルデータを学習サンプルとして入力することにより株化を推定したり、人口密度情報、住民年齢情報、交通量情報、競合店売上情報等の複数の立地条件パラメータで構成する営業ベクトルデータを学習サンプルとして入力することにより、新規出店時の売上げを推定するような場合にも活用することができる。
【0118】
つまり、本発明による線形写像演算を用いた事象推定方法は、複数のパラメータを成分とする複数のベクトルデータを事象を表す学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された推定対象ベクトルデータに直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から推定対象ベクトルデータに対応する出力を推定事象として求める第四ステップとを備えることにより構成できる。
【0119】
そして、この場合にも、上述した近似解を求める方法、厳密解を求める方法が好適に用いられる。
【0120】
尚、上述した実施形態は、本発明の一例に過ぎず、本発明の作用効果を奏する範囲において各ブロックの具体的構成等を適宜変更設計できることは言うまでもない。
【図面の簡単な説明】
【0121】
【図1】入力の次元が低い場合の部分空間を介した写像の退化現象(入力1次元から出力2次元の場合)の説明図
【図2】部分空間を用いた写像演算の説明図
【図3】部分空間を介した写像演算の説明図
【図4】本発明による回帰演算の説明図
【図5】M<Nの場合のマハラノビス汎距離xTC+xの等距離面の説明図
【図6】部分空間を介した写像と本発明の違いを示す説明図
【図7】正則化パラメータαの変化による近似解zC−1*+yの変化を示す説明図
【図8】三次元直積空間を用いた写像演算の説明図
【図9】(a)は学習画像の一部を欠損させて、本発明により復元した画像の説明図、(b)は入力次元数に対する画素あたりの平均誤差の関係の説明図
【図10】(a)は未学習画像の一部を欠損させて、本発明により復元した画像の説明図、(b)は入力次元数に対する画素あたりの平均誤差の関係の説明図
【図11】(a)は間引き処理した未学習画像を、本発明により復元した画像の説明図、(b)は空間的均一さと写像精度の変化の説明図
【図12】本発明の用途を示し、(a)は文字がオーバーライトされた欠損画像から原画像を修復する場合の説明図、(b)は低解像度画像を高解像度画像に超解像化する場合の説明図、(c)は画像の陰影を推定し、陰影を除去する場合の説明図
【図13】写真画像処理装置の外観説明図
【図14】写真プリンタの説明図
【図15】写真画像処理装置の機能ブロック構成図
【図16】線形写像演算部の機能ブロック構成図
【符号の説明】
【0122】
1:写真画像処理装置
47:画像処理部
55:線形写像演算部
【技術分野】
【0001】
本発明は、マハラノビス(Mahalanobis)汎距離の最小化処理を用いた高次元線形写像演算により、処理対象となる写真画像を変換する写真画像処理方法、写真画像処理装置、及び事象推定方法に関する。
【背景技術】
【0002】
非特許文献1から4に開示されているように、高次元ベクトル間の写像演算は、欠損画像の修復、画像の陰影推定・除去等に広範囲に用いられている。
【0003】
単純な回帰計算で写像を求める場合、入出力の直積空間に分布する同じ学習サンプルに対して入出力の割り当てを変えると再計算が必要になる、サンプル数よりも入力次元数が高い場合に「多重共線形性」に起因する回帰計算の精度低下が起きる等の問題に直面する。これは、サンプル数よりも入力の次元数が高い場合に、入力変数間に一次従属関係が生じ、計算が不安定になることを指す。
【0004】
この問題を回避するために、非特許文献5には、主成分分析(PCA:Principal Component Analysis)により入力の次元圧縮をして回帰計算を行う手法であるPCR(Principal Component Regression)が提案されているが、出力とは無関係に入力だけを次元圧縮するために、出力との相関が強い入力成分まで弱めることがある。
【0005】
これを回避するために、入出力の空間で同時に基底を求め、個々の入出力をこれら基底の線形和で表わしたときの係数間の回帰係数を求める手法であるPLS(Projection to Latent Structure)も提案されているが、上述の再計算の問題は回避できない。
【0006】
このように回帰計算では、入力変数の独立性を仮定しており、その独立性が崩れると、著しい精度低下が起きる。また、出力変数に関しても独立性が仮定されており、写像関数は出力変数の数だけ求められる。従って、各出力が互いに独立に変化する可能性があるため、画像のように出力変数間の相関が強いデータの写像にはあまり適さないと言える。
【0007】
これらの問題を回避するために、入出力の直積空間内で学習サンプルから構成した部分空間を利用して入出力間の写像である「部分空間写像」を求める方法もある。尚、共分散行列の固有ベクトルで張られる空間の場合、元の空間の原点を含まないため超平面と呼ぶべきであるが、本明細書ではこの場合も部分空間と呼ぶ。
【0008】
この方法では、入出力変数の独立性を仮定せず、むしろこれらの相関関係を部分空間として表している。このため、入力次元数の増加により、むしろ共線形性の問題は生じ難くなる。また、同じ学習サンプルに対する入出力の変更も自由にできるという利点がある。さらに、出力変数間の相関を考慮しているため、出力値が独立に変動しにくく、画像など出力値の空間的連続性を保存しなければならない用途に適している。
【非特許文献1】天野敏之、佐藤幸男:固有空間法を用いたBPLPによる画像補間 、電子情報通信学会論文誌D-II、 Vol.J85-D-II、 No.3、 pp.457-465 (2002)
【非特許文献2】N.Otsu and T.Kasvand、 “Image restoration by multipler regression analysis approach、” Proc. of ICPR、 pp.155-158、 1984.
【非特許文献3】S. Baker、 T. Kanade、 “Limits on super-resolution and how to break them、” In: Proc. Of CVPR. South Carolina、 vol. 2、 pp. 372-379、 2000
【非特許文献4】島野、 長尾、 岡部、 佐藤、 佐藤、 ”任意照明下顔認識のための顔表面の位置相関を考慮したMAP推定”、 情報処理学会CVIM論文誌、 Vol.47、 No.SIG10 (CVIM 15)、 pp.162-172、 July 2006.
【非特許文献5】D. A. Belsley、 E. Kuh、 and R. E. Welsch、 Regression Diagnostics; Identifying Influential Data and Sources of Collinearity、 John Wiley & Sons、 New York、 1980
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしこの手法は、図1に示すように、入力の次元数が低い場合に、入力の補空間と部分空間との交わりが広がるため、写像が不安定になるという問題がある。また、部分空間の次元数が増加しても同様の問題が生じる。これらは、出力変数間の独立性を仮定しないために、十分な入力が与えられないと、出力変数間に多重共線形性が残ることに起因する問題である。
【0010】
これらの問題を回避するには、入力空間の次元数を上げるか、または、部分空間の次元数を下げる必要がある。しかし、与えられる問題によって入出力空間の次元数は定められており、意図的にこれを変えることはできず、部分空間の次元数を下げることは、データ分布を粗く近似することになるため、写像の精度を低下させてしまう。このような問題は、カーネルPCAで得られる非線形部分空間でも生じ得る普遍的問題であり、これが解決できれば線形・非線形を問わず、幅広いクラスの写像計算全般の安定化につながる。
【0011】
本発明の目的は、入出力の直積空間内で学習サンプルから推定した共分散行列を用いて、マハラノビス汎距離を最小化する出力を求める写像演算を用いることにより、例えば、欠損画像の高精度な修復等が可能な写真画像処理方法、写真画像処理装置、及び事象推定方法を提供する点にある。
【課題を解決するための手段】
【0012】
上述の目的を達成するため、本発明による写真画像処理方法の第一の特徴構成は、特許請求の範囲の書類の請求項1に記載した通り、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップとを備えている点にある。
【0013】
第一ステップでは、学習サンプルである画像の各画素データが成分として配列された複数のベクトル画像が教師画像として入力され、第二ステップでは、学習サンプルに基づいて入出力の直積空間内で共分散行列が推定される。第三ステップでは、処理対象ベクトル画像が入力され、共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点が求められ、第四ステップでは、最小マハラノビス汎距離を与える直積空間内の点から処理対象ベクトル画像に対応する出力が求められる。
【0014】
通常の回帰計算や部分空間写像は、最小二乗法による回帰直線・平面の推定問題に帰着する。しかし高次元ベクトル間の写像では、条件数が不足し、ユニークな最小二乗解が決定できないケースがしばしば発生する。このような場合、部分空間写像では出力ベクトルのノルムを最小化するなど、写像とは無関係な条件を導入して計算の安定化が図られる。これに対し本発明によれば、条件数の不足をマハラノビス汎距離、すなわち学習データの分布により補うため、安定な挙動が実現できる。本発明によれば、部分空間を介した線形写像を一般化した形式になり、上述の多重共線形性の問題は生じない。
【0015】
同第二の特徴構成は、同請求項2に記載した通り、上述の第一特徴構成に加えて、前記共分散行列が非正則である場合に、前記第三ステップで、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離と、前記部分空間の補空間への射影残差に所定の重み変数を乗じた値とを加算した目的関数を生成し、当該目的関数の値が最小となる直積空間内の点を求める点にある。
【0016】
第一の特徴構成による方法では、共分散行列が非正則である場合には、演算結果が自明ではないため、共分散行列に対応したMoore-Penrose型一般逆行列を用いたマハラノビス汎距離と、前記部分空間の補空間への射影残差に所定の重み変数を乗じた値とを加算した目的関数を生成し、当該目的関数の値が最小となる直積空間内の点を求めることにより近似解が得られる。
【0017】
同第三の特徴構成は、同請求項3に記載した通り、上述の第一特徴構成に加えて、前記共分散行列が非正則である場合に、前記第三ステップは、前記部分空間と前記出力超平面の交わりの基底ベクトルを求めるステップと、交わりに含まれる点を前記基底ベクトルの線形式で求めるステップと、前記線形式の係数を調整することにより、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離を最小とする直積空間内の点を求めるステップを備えている点にある。
【0018】
共分散行列が非正則である場合には、演算結果が自明ではないため、部分空間と出力超平面の交わりに含まれる点を基底ベクトルの線形式で求め、線形式の係数を調整することにより、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離を最小とする直積空間内の点を求めることにより厳密解が得られる。
【0019】
本発明による写真画像処理装置の第一の特徴構成は、同請求項4に記載した通り、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一処理部と、入出力の直積空間内で学習サンプルから共分散行列を推定する第二処理部と、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三処理部と、求められた点から処理対象ベクトル画像に対応する出力を求める第四処理部と備えている点にある。
【0020】
本発明による線形写像演算を用いた事象推定方法は、複数のパラメータを成分とする複数のベクトルデータを事象を表す学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された推定対象ベクトルデータに直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から推定対象ベクトルデータに対応する出力を推定事象として求める第四ステップとを備えている点にある。
【発明の効果】
【0021】
以上説明した通り、本発明によれば、入出力の直積空間内で学習サンプルから推定した共分散行列を用いて、マハラノビス汎距離を最小化する出力を求める写像演算を用いることにより、例えば、欠損画像の高精度な修復等が可能な写真画像処理方法、写真画像処理装置、及び事象推定方法を提供することができるようになった。
【発明を実施するための最良の形態】
【0022】
以下、本発明による写真画像処理方法及び写真画像処理装置の実施の形態について説明する。
【0023】
図13に示すように、写真画像処理装置1は、印画紙Pに対して出力画像データに基づいた露光処理を行ない、露光された印画紙を現像処理して写真プリントを生成出力する写真プリンタ2と、写真画像に対するプリントオーダ情報を設定入力するとともに、各種の画像補正処理を行ない、原画像から編集処理した出力画像データを写真プリンタ2に出力する操作ステーション3を備えて構成されている。
【0024】
操作ステーション3は、現像済みの写真フィルムFから画像を読み込むフィルムスキャナ31と、デジタルスチルカメラ等で撮影された画像データが格納されたメモリカード等の画像データ記憶メディアMから画像データを読み取るメディアドライバ32と、コントローラ33としての汎用コンピュータ等を備えている。
【0025】
図13及び図14に示すように、写真プリンタ2は、ロール状の印画紙Pを収容した二系統の印画紙マガジン21と、印画紙マガジン21から引き出された印画紙Pを所定のプリントサイズに切断するシートカッター22と、切断後の印画紙Pの背面にコマ番号等のプリント情報を印字するバックプリント部23と、プリントデータに基づいて印画紙Pを露光する露光部24と、露光後の印画紙Pを現像、漂白、定着するための各処理液が充填された複数の処理槽25a、25b、25cを備えた現像処理部25が印画紙Pの搬送経路に沿って配置され、現像処理後に乾燥処理された印画紙Pが排出される横送りコンベア26と、横送りコンベア26に集積された複数枚の印画紙(写真プリント)Pがオーダー単位で仕分けられるソータ27を備えている。
【0026】
露光部24には、搬送機構28によって副走査方向に搬送される印画紙Pに対して、搬送方向に直交する主走査方向に前記プリントデータに基づき変調されたRGB三色のレーザ光線束を出力して露光する露光ヘッド24aが収容されている。
【0027】
搬送経路に沿って配置された露光部24や現像処理部25に、所定のプロセス速度で印画紙Pを搬送する複数のローラ対でなる搬送機構28が配置され、露光部24の前後には印画紙Pを複列に搬送可能なチャッカー式搬送機構28aが設けられている。
【0028】
操作ステーション3に設けられたコントローラ33には、汎用のオペレーティングシステムの管理下で動作し、写真処理装置1の各種の画像処理や入出力制御を実行するための複数のアプリケーションプログラムがインストールされ、オペレータとの操作インターフェースとしてモニタ34、キーボード35、マウス36等が接続されている。当該アプリケーションプログラムに本発明による画像処理プログラムが含まれる。
【0029】
コントローラ33は、そのハードウェア及びソフトウェアが協働して写真処理プロセスを実行するブロックで、以下に、各機能ブロックに分けて説明する。
【0030】
図15に示すように、コントローラ33は、フィルムスキャナ31やメディアドライバ32によって読み取られた原画像としての写真画像データを受け取り、所定の前処理を行なってメモリ41に転送する画像入力部40と、モニタ34の画面にプリントオーダ情報や画像編集情報を表示するとともに、それらに対して必要なデータ入力のための操作用アイコンを表示するグラフィック操作画面を生成し、或いは表示されたグラフィック操作画面に対するキーボード35やマウス36からの入力操作に基づいて各種の制御コマンドを生成するグラフィックユーザーインターフェース部42と、画像入力部40から転送される写真画像データ及び画像処理部47による補正処理後の写真画像データやそのときの補正パラメータ、更には設定されたプリントオーダ情報等が所定領域に区画されて格納されるメモリ41と、プリントオーダ情報を生成するオーダー処理部43と、メモリ41に格納された各写真画像データに対してコマ画像毎または所定枚数のコマ画像に濃度補正処理やコントラスト補正処理等を行なう画像処理部47を備えている。
【0031】
さらに、グラフィックユーザーインターフェース部42からの表示コマンドに基づいてメモリ41に展開された画像データや各種の入出力用グラフィックデータ等をモニタ34に表示処理するビデオRAM等を備えた表示制御部46と、各種の補正処理が終了した最終の補正画像を写真プリンタ2に出力するためのプリントデータを生成するプリントデータ生成部44と、顧客のオーダーに応じて最終の補正画像をCD−R等の記憶媒体に書き込むためのファイル形式に変換するフォーマッタ部45等を備えている。
【0032】
フィルムスキャナ31は、フィルムFに記録された画像を低解像度ではあるものの高速で読み取るプレスキャンモードと、低速ではあるものの高解像度で読み取る本スキャンモードの二モードで作動するように構成され、プレスキャンモードで読み込まれた低解像度の画像に対して各種の補正処理が行なわれ、その際に前記メモリ41に記憶された補正パラメータに基づいて本スキャンモードで読み込まれた高解像度の画像に対する最終の補正処理が実行されてプリンタ2に出力される。
【0033】
同様に、メディアドライバ32から読み込まれた画像ファイルには高解像度の撮影画像とそのサムネイル画像が含まれ、サムネイル画像に対して後述の各種の補正処理が行なわれ、その際にメモリ41に記憶された補正パラメータに基づいて高解像度の撮影画像に対する最終の補正処理が実行される。尚、画像ファイルにサムネイル画像が含まれないときには、画像入力部40で高解像度の撮影画像からサムネイル画像が生成されてメモリ41に転送される。
【0034】
このように、頻繁に試行錯誤される各種の編集処理が低解像度の画像に対して実行されることによりコントローラ33の演算負荷が低減されるように構成されている。
【0035】
画像処理部47には、メモリ41に格納された原画像である写真画像データに対して撮影レンズに起因する歪を補正する歪補正部50と、粒状ノイズを抑制する粒状ノイズ抑制処理部51と、画像のエッジを強調し、ノイズを抑制する鮮鋭化処理部52と、自然なカラーを再現できるようにカラーバランスを調整するカラー補正部53と、写真プリントのサイズに適した画像サイズに変換する拡縮処理部54と、本発明による写真画像処理方法及び装置を具現化する線形写像演算部55等の複数の画像処理ブロックを備えている。
【0036】
図16に示すように、線形写像演算部55は、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一処理部と、入出力の直積空間内で学習サンプルから共分散行列を推定する第二処理部と、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三処理部と、求められた点から処理対象ベクトル画像に対応する出力を求める第四処理部と備えている。
【0037】
以下、線形写像演算部55による写真画像処理方法の原理及び実際の処理手順について、部分空間写像と対比しながら詳述する。
【0038】
〔直積空間を介した写像計算〕
本発明の説明の前に、先ず、空間RN内での主成分分析に基づいて、入力空間Rrのベクトルに対応する出力空間RN−rの要素を求める方法について述べる。但し、ベクトルx(以下の説明では、「ベクトルx」等を単に「x」と表記する場合もある。)は平均0共分散Cの正規分布に従うものとする。
【0039】
xのうち観測された部分、つまり、学習サンプル或は処理対象画像の画像ベクトル(入力)を、
【数1】
【0040】
xのうち未観測の部分、つまり、入力された処理対象画像の出力画像ベクトル(出力)を、
【数2】
【0041】
と表す。但し、φi(i=1,・・・,N)は任意の正規直交基底Φ1=[φ1・・・φr],Φ2=[φr+1・・・φN]である。
【0042】
Φ1,Φ2が張る空間Rr,RN−rを、それぞれ、「入力空間」、「出力空間」と呼ぶ。通常、出力空間には入力yは含まれないが、yを含む出力空間と平行な超平面を「出力超平面」と呼ぶ。本質的に、この出力超平面内の探索を通じて出力が決定される。ここでΦ1=[φ1・・・φN]とすると、明らかに、次式が成り立ち、
【数3】
【0043】
従って、
〔数4〕
P1+P2=I
〔数5〕
x=y+z
〔数6〕
yTZ=0
も成り立つ。例えば、
【数7】
【0044】
とすれば、φiは正規直交基底となり、
【数8】
【数9】
【0045】
となるため、次式が成立し、
【数10】
【0046】
P1+P2=I,x=y+z,yTZ=0となることが確認できる。
【0047】
また、共分散行列Cとその固有値、固有ベクトルをλi,Vi(i=1,・・・,M),M≦Nと表し、これらを用いて、以下の行列を定義する。
【数11】
,
【0048】
〔部分空間を介した写像〕
線形回帰を行う方法として、図2に示す部分空間を用いた方法について述べる。具体的には、学習サンプルから求めた共分散行列Cの固有値問題を解くことによって得られる正規直交基底Viが張る部分空間上にyとzの和が乗るように、出力zを求める方法である。
【0049】
この部分空間への射影行列はW=VMVMTとなる。これを用いて、ベクトルxの射影先Wxを求めることができる。このとき射影残差の2乗は、次式で表される。
【数12】
【0050】
但しIは単位行列である。WW=W、及び、WT=Wという性質から、上式はさらに以下のように簡単化できる。
【数13】
【0051】
これは、部分空間の直交補空間への射影の長さの2乗を表している。S=I−W,x=y+zとして、〔数13〕に代入すると、(y+z)TS(y+z)が得られ、これを最小化すれば、補空間への射影成分が最小化される出力zSが計算できる。
【0052】
変数の素性を明示的に表すと、
【数14】
【0053】
となるので、この式をzで偏微分し、z=zSとした結果が0であることから、次式が得られる。
【数15】
【0054】
この式中のP2TSP1や、P2TSP2は正則ではないので、出力はMoore-Penrose型一般逆行列(+記号)を用いて、以下のように表される。
【数16】
【0055】
さらに、自明な項を除き、整理すると次の解が得られる。
【数17】
【0056】
この式中で、学習で求める部分が、S=I−VMVMTであり、入出力はP2を変化させるだけで切り替えられる。
【0057】
図3は、64×64の画像1021枚から求めた1020次元の部分空間を介した写像計算を行った結果を示す。入出力の直積空間は64×64=4096次元、入力は1024次元、出力は3072次元である。この例のように入力の次元数が出力に比べて低い場合には部分空間を介した写像の精度は低下しやすい。
【0058】
これは、〔数17〕が〔数15〕を満足する最小ノルム解となっているためであり、例えば図1のケースでは、交わりの中で最短のベクトルが求められる。このため、図3の場合は学習サンプルの平均画像に近い画像が現れる。
【0059】
〔本発明によるマハラノビス汎距離最小化による写像〕
共分散行列の逆行列C−1を用いた直積空間内でのマハラノビス汎距離xTC−1xを最小化することによって出力zc−1を求める本発明による写真画像処理方法について、図4を参照して述べる。図4中、破線は等距離面を示す。以下、この手法をMahalanobis-distance Minimization Mapping、略して「M3」と表記する場合もある。
【0060】
マハラノビス汎距離の式を展開すると、
【数18】
【0061】
となり、変数の素性を明示的に表すと次式が得られる。
【数19】
【0062】
この式をzで偏微分し、z=zc−1とした結果が0であることから、次式が得られる。
【数20】
【0063】
この式中のP2TSP1や、P2TSP2は正則ではないので、出力はMoore-Penrose型一般逆行列を用いて、以下のように表される。
【数21】
【0064】
このうち、自明な項を除き、〔数17〕の場合と同様に整理すると次式の解が得られる。この場合もP2だけで入出力空間を変更できる。
【数22】
【0065】
〔本発明による演算法〕
〔数17〕と〔数22〕を比較すると、SとC−1が異なるだけで式の構造は同じであることが分かる。前者は、部分空間の補空間に対する射影行列、後者は共分散行列の逆行列である。
【0066】
但し、共分散行列C=VMΛMVMT及びその逆行列C−1=VMΛM−1VMTは、正則でない場合、Cの固有値(ΛMの対角成分)が0の要素に対応するΛM−1の要素を∞と計算しなければ、〔数22〕は不正確な写像になる。
【0067】
仮に一般逆行列C+=VMΛM+VMTで代替すると、固有値0に対応するΛM+の要素は0であるため、部分空間の補空間に射影される成分にペナルティが与えられない。
【0068】
このためxTC+xを計算すると、図5に示すように、本来マハラノビス汎距離が無限大となる筈の部分空間外部にも、補空間に沿って同じ距離の値が漏れ出てしまう。従って、〔数22〕C+を用いると、部分空間外部でもxTC+xが小さくなり、不正確な写像になる。
【0069】
本発明では、図6に示すように、入力に直交する出力超平面と部分空間との両方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求め、これに対応する出力を求める。具体的には、次に示す近似解法と、厳密解法の二つの手法を採用する。
【0070】
〔近似解法〕
ここで示す近似解法は、〔数17〕と〔数22〕を正則化の立場から融合するというアプローチである。具体的には、以下の数式による値を最小化するzを求める手法となる。
【数23】
【0071】
但し、αは正則化パラメータである。これは、部分空間の補空間への射影成分とマハラノビス汎距離の重み付き和を最小化する目的関数である。〔数23〕は、次の行列を用いた2次形式になっている。
【数24】
【0072】
これはrank(C−1*)=Nの正則行列であり、これを用いた2次形式は直積空間の原点で最小値0を持つ。〔数22〕中のC−1の代わりにC−1*を用いれば,出力超平面上で2次形式の値を極小化する出力zC−1*が求められる。〔数22〕は、行列と一般逆行列の積になるため、αの絶対的値はキャンセルされ、実質的にはαによってC+とSとの相対的比率が変化するのみである。
【0073】
図7に示すように、このαを変化させると、以下に述べるように解が変化する。即ち、αが0であるとき、部分空間から遠く離れた最小マハラノビス解と一致し、αが正の小さな値であるとき、マハラノビス距離を極小化する傾向が強い反面、部分空間からの逸脱を許してしまい、α→∞であるとき、部分空間からの逸脱は小さくなるものの、マハラノビス距離の評価は弱まり、最小ノルム解に漸近する。
【0074】
このように、αの値をいかに設定しても正確な解は求まらないものの、αの値が適切であれば、実用上問題ない程度の精度の結果が得られる。尚、αの値は、処理対象画像の特性に基づいて予め実験等を介して決定される。
【0075】
〔厳密解法〕
この解法は、以下の考え方及び手順に基づく。即ち、部分空間と入力に直交する出力超平面の交わりの基底ベクトルを求め、交わりに含まれる点を基底ベクトルの線形式で求める。さらに、その係数を調整することにより、C+を用いたマハラノビス距離を最小化する。
【0076】
交わりの部分の基底ベクトルは、P2Wd=λdを満足するλ=1の固有ベクトルとなる。これは、最小正準角を求める際に解かれる固有値問題と同じ形式であるが、次の点が異なる。正準角を求める際にはλ=1の固有値は捨てられるのに対して、この厳密解ではλ=1の固有ベクトルを積極的に利用する。
【0077】
これは、「WとP2による射影を順次行っても長さが変わらないベクトルは、出力超平面と部分空間の交わりの中に含まれる」という事実に基づいている。本発明では、λ=1に対応する固有ベクトルdiを交わり部分の基底として利用する。以降、これら固有ベクトルから成る行列をD=[d1・・・dk]と表す。
【0078】
実際の交わりに含まれる点を表すためには、交わりに含まれる1点xSが必要になる。xSとしては、図6の最小ノルム解zS+yが利用できる。このとき、交わりに含まれる点集合は次式で表わされる。但し、aはk次元係数ベクトルである。
【数25】
【0079】
従って、xT(a)C+x(a)を最小化するa*を求めることにより、本発明による出力zM3=P2x(a*)が算出できる。
【数26】
【0080】
であるので、
【数27】
【0081】
が成立する。これを解き、
【数28】
【0082】
が得られるので、zM3=P2x(a*)が算出できる。但し、以下の二つケースに関しては例外処理が必要となる。即ち、P2Wd=λdを満足するλ=1の固有ベクトルが存在しない場合には、交点は唯一に決定できるため、出力は最小ノルム解zSになる。また、P2Wd=λdを満足するλ=1の固有ベクトルが出力と同じ次元数(N−r)個ある場合には、出力は出力空間全域を自由に移動でき、最小真柄のビス解zC+に一致する。但し、このケースでは、共分散行列Cは正則になっており、zC+=zC−である。
【0083】
xS=zS+yと仮定して以上の式を整理すると、〔数17〕、〔数25〕、〔数28〕から、以下のように表される。
【数29】
【0084】
このマトリクスを特異値分解したとき、以下の式が得られる。但し、UyTはK×N、ΛRはK×K、UzはK×Nの行列であり、KはΛRの非零の特異値の個数である。
【数30】
【0085】
従って、写像計算にはN次元ベクトルの内積K回、スカラの乗算K回、K次元ベクトルの内積N回が必要であり、写像計算のオーダはO(NK)となる。従って、Kの値が小さければ、高速な計算も可能になる。
【0086】
図16に示すように、線形写像演算部55では、先ず、構成画素数が等しい複数枚のサンプル画像が第一処理部に入力され、各画素データを成分とする複数のベクトル画像としてメモリ41に記憶される。例えば、64画素×64画素のサンプル画像であれば、4096次元のベクトル画像がR,G,Bの三色について夫々メモリに格納される。
【0087】
第二処理部では、サンプル画像から共分散行列の推定処理が色成分毎に実行される。第三処理部では、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める演算処理が色成分毎に実行される。
【0088】
処理対象ベクトル画像とは、欠損画像の修復処理、或は、超解像化処理等が必要な画像である。第三処理部では、上述した近似解法または厳密解法の何れかに基づいて直積空間内の点が求められ、第四処理部では、それに基づいて処理対象ベクトル画像に対応する出力画像が生成されてメモリ41に書き込まれる。
【0089】
本発明による線形写像演算は、RGB色成分毎に実行されるものであるが、YCC等に変換された輝度、色相に対しても同様に処理可能であり、RGBの補色であるCMY色成分毎に実行されるものであってもよい。
【0090】
学習サンプル内の何れかの画像が処理対象画像として入力される場合には、厳密解法を採用することにより、高精度な出力画像が獲得でき、学習サンプルとは異なる処理対象画像が入力される場合には、厳密解法と近似解法の何れが適切であるか、判断が困難であるため、少なくとも高速処理が必要な場合には、近似解法を採用することが好ましい。
【0091】
つまり、第一処理部で、写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップが実行され、第二処理部で、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップが実行され、第三処理部で、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップが実行され、第四処理部で、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップが実行される。
【0092】
これらの処理を実行するプログラムは、コントローラ33に備えたハードディスク等の記憶媒体にインストールされ、OSの管理下で実行されるものである。また、専用の写真処理装置ではなく、汎用のパーソナルコンピュータにこれらのプログラムがインストールされ、コンピュータ上で処理されるように構成されるものであってもよい。
【実施例】
【0093】
以下では、〔数22〕、〔数23〕を用いた近似解法、及び、〔数25〕、〔数28〕を用いた厳密解法の写像演算と、〔数17〕を用いた部分空間を介した写像演算を、上述した写真処理装置を用いて行なった比較結果を示す。尚、近似解法では正則化パラメータであるαを0.05として実験を行った。
【0094】
〔低次元空間でのシミュレーション〕
図8は、3次元データを用いて写像計算のシミュレーションを行った結果である。学習に使用したデータは、2次元の正規乱数を平面上で発生させ、これを回転させて生成した3次元のベクトル5000個である。
【0095】
この学習サンプルに対して主成分分析を行い、2次元の部分空間を構成した。入力1次元、出力2次元として部分空間写像、共分散行列の一般逆行列を用いた写像計算法、近似解法、厳密解法について実験を行った。
【0096】
図8から、部分空間写像では、写像結果zSは部分空間の上に拘束されていることが分かる。しかし入力次元数が低いため部分空間と入力空間の交点が唯一に決まらないため、最小ノルム解が求められてしまう。
【0097】
一方、共分散行列の一般逆行列を用いた写像演算法では、部分空間の拘束をせずにマハラノビス距離のみを最小化することになるため、写像結果zC+は部分空間から大きく逸脱してしまう。
【0098】
これに対して本発明による厳密解zM3は、近似解zC−1*と近いが、zC−1*は部分空間から逸脱していて、zM3は部分空間に拘束されていることが確認できる。
【0099】
〔画像の欠損推定実験〕
画像データを用いた欠損推定の実験では学習サンプルとしてCAS-PEAL顔画像データベースから無作為に抽出した1021枚の正面顔画像の主成分分析を行い、1020次元の部分空間を構成した。テスト画像としてはCAS-PEALと、Yale face database Bのデータベースから抽出した学習サンプルに含まれない画像を用いた。
【0100】
各画像は両眼位置が揃うように回転とスケーリングを行い、64×64のサイズで切り出して使用している。入出力直積空間の次元数は、64×64=4096次元であり、入力の次元数は4096×3/4=3072、4096×1/2=2048、4096×1/4=1024の3通りである。
【0101】
図9及び図10に、学習画像の一部を欠損させて復元した画像例と入力次元数に対する画素あたりの平均誤差の関係を示す。この図から部分空間写像は入力次元数が高い場合には精度の高い写像が計算できているが、入力次元数が低下すると、急激に計算精度が低下することが分かる。これは元々点であった出力超平面と部分空間の交わりが、入力次元数の低下とともに高次元化した結果、この空間に沿って出力がドリフトし、最小ノルム解に向かって移動したためである。
【0102】
これと比べると厳密解法では入力次元数が低下しても精度の高い写像計算が行えており、入力が画像の1/4の大きさでもほぼ同一人物と見なせる画像が求められている。これは、出力超平面と部分空間の交わりの点が高次元化しても、最小ノルムの条件を用いず、この空間に沿ってマハラノビス距離を最小化する方向に移動した結果、学習データが元々分布していた付近から離れることなくそこに停留するためである。
【0103】
近似解法は必ずしも原画像の人物とは一致しないが、部分空間写像に比べると写像の破綻が起きにくい。このことは、直観的にも定量的にも確認できる。図11及び図12に、テスト画像(未学習データ)を与えた場合の復元結果を示す。この場合も同様に部分空間写像は不安定で、復元された顔領域は白くなっている。このように部分空間写像の精度が推定すべき画素欠損部の拡大にともなって低下する場合でも、部分空間の補空間への射影成分は十分小さく、画像全体としては正確に部分空間の上に乗っていることを確認している。
【0104】
厳密解法及び近似解法を定量的に比較してみると、この場合わずかではあるが厳密解法が優れていることが分かる。しかし、生成された画像の自然さという点では、近似解の方が比較的緩やかなコントラストの画像となっており、好ましい性質を持っている。
【0105】
いずれにせよ、これらの結果には、絶対的な意味で精度の高いものは含まれていない。この一因は、学習データ数が十分多くないために、入力および出力に類似した画像データがなかったためと考えられる。
【0106】
次に、欠損の与え方を空間的に均一にした場合の結果について述べる。この実験では、画像をチェッカーパターン状に入力と出力に分けて写像を行っている。実験で試したのは、各矩形の大きさを1画素、2×2画素、3×3画素とした場合の3通りであり、入力を抽出した原画像はテスト画像の一枚である。
【0107】
図から、同じ入力次元数であっても、空間的に一様に分布する入力である方が写像計算の精度が高いことが分かる。このことは図9〜図12と見比べても明らかである。この理由は、部分空間と入力空間の間の角が小さくなるためであると考えられる。
【0108】
しかしこの実験の設定では、部分空間と出力空間の間の交わりに存在するベクトルが少なくなるため、厳密解法の写像はケース1、即ち、部分空間写像と等しくなり、近似解法の方が厳密解法の写像よりも精度が上がっている。これは、最適な写像結果を求めるのに、部分空間を構成する学習データが少ない場合、部分空間に拘束してしまうのが必ずしも良い結果になるとは限らないからである。このため、部分空間に強く拘束する厳密解法よりも部分空間からの逸脱を許容する近似解法の方が高精度になる場合もある。
【0109】
つまり、本発明は、入出力の直積空間内で学習サンプルから推定した共分散行列を用いて計算されるマハラノビス汎距離を最小化する高次元線形写像計算法を用いた写真画像処理方法であり、これは、入出力空間内で確率分布を求め、入力に対して、確率密度を最大化する出力を推定する手法を、正規分布の場合に具体化したものとして解釈することができる。
【0110】
従来法との比較により、部分空間を介した写像よりも自然で正確な計算ができることが確認された。この傾向は、入力次元数が少なく、出力次元数が高い場合に特に顕著である。また、部分空間の補空間への射影成分とマハラノビス汎距離の両方を最小化する写像計算を行っており、共線形性の問題が発生しにくい安定な構造をしている。
【0111】
本発明は、図12(a)に示すような文字がオーバーライトされた欠損画像から原画像を修復したり、図12(b)に示すような低解像度画像を高解像度画像に超解像化したり、図12(c)に示すような画像の陰影を推定し、陰影を除去したり、さらには、ボケ画像の鮮鋭化処理、ぶれ画像の修復処理等に幅広く適用できる。
【0112】
図12(a)に示すような欠損画像から原画像を修復する場合には、欠損画像を複数の領域に分割し、オーバーライトされた文字による欠損が無い複数の分割領域をサンプル画像として第一処理部に入力し、欠損が発生している分割領域を処理対象画像として第三処理部に入力し、修復された分割画像を合成することにより欠損が無い原画像を得ることができる。
【0113】
一例として、実験の最後で示した間引いた画像からの原画像の推定は、幻影処理(Hallucination)の特殊例とみなすことができる。
【0114】
通常の回帰計算と比べると、共線形性の問題が発生しにくいことに加えて、直積空間内の確率分布さえ求めておけば、この空間を互いに直交するΦ1とΦ2の直積空間とみなすことによって任意の独立な成分間の写像計算が行える点が大きく異なる。
【0115】
例えば、Fourier基底を用いれば低周波数成分Φ1から、高周波数成分Φ2への写像、つまり、ボケ画像の鮮鋭化処理も同じ枠組みで適用できる。
【0116】
さらに、本発明による線形写像演算方法は、写真画像の修復処理等以外の事象の推定にも用いることができる。
【0117】
例えば、季節情報、消費者物価情報、売上実績情報、株価情報等の複数のパラメータで構成する株価ベクトルデータを学習サンプルとして入力することにより株化を推定したり、人口密度情報、住民年齢情報、交通量情報、競合店売上情報等の複数の立地条件パラメータで構成する営業ベクトルデータを学習サンプルとして入力することにより、新規出店時の売上げを推定するような場合にも活用することができる。
【0118】
つまり、本発明による線形写像演算を用いた事象推定方法は、複数のパラメータを成分とする複数のベクトルデータを事象を表す学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された推定対象ベクトルデータに直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から推定対象ベクトルデータに対応する出力を推定事象として求める第四ステップとを備えることにより構成できる。
【0119】
そして、この場合にも、上述した近似解を求める方法、厳密解を求める方法が好適に用いられる。
【0120】
尚、上述した実施形態は、本発明の一例に過ぎず、本発明の作用効果を奏する範囲において各ブロックの具体的構成等を適宜変更設計できることは言うまでもない。
【図面の簡単な説明】
【0121】
【図1】入力の次元が低い場合の部分空間を介した写像の退化現象(入力1次元から出力2次元の場合)の説明図
【図2】部分空間を用いた写像演算の説明図
【図3】部分空間を介した写像演算の説明図
【図4】本発明による回帰演算の説明図
【図5】M<Nの場合のマハラノビス汎距離xTC+xの等距離面の説明図
【図6】部分空間を介した写像と本発明の違いを示す説明図
【図7】正則化パラメータαの変化による近似解zC−1*+yの変化を示す説明図
【図8】三次元直積空間を用いた写像演算の説明図
【図9】(a)は学習画像の一部を欠損させて、本発明により復元した画像の説明図、(b)は入力次元数に対する画素あたりの平均誤差の関係の説明図
【図10】(a)は未学習画像の一部を欠損させて、本発明により復元した画像の説明図、(b)は入力次元数に対する画素あたりの平均誤差の関係の説明図
【図11】(a)は間引き処理した未学習画像を、本発明により復元した画像の説明図、(b)は空間的均一さと写像精度の変化の説明図
【図12】本発明の用途を示し、(a)は文字がオーバーライトされた欠損画像から原画像を修復する場合の説明図、(b)は低解像度画像を高解像度画像に超解像化する場合の説明図、(c)は画像の陰影を推定し、陰影を除去する場合の説明図
【図13】写真画像処理装置の外観説明図
【図14】写真プリンタの説明図
【図15】写真画像処理装置の機能ブロック構成図
【図16】線形写像演算部の機能ブロック構成図
【符号の説明】
【0122】
1:写真画像処理装置
47:画像処理部
55:線形写像演算部
【特許請求の範囲】
【請求項1】
写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップとを備えている写真画像処理方法。
【請求項2】
前記共分散行列が非正則である場合に、前記第三ステップで、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離と、前記部分空間の補空間への射影残差に所定の重み変数を乗じた値とを加算した目的関数を生成し、当該目的関数の値が最小となる直積空間内の点を求める請求項1記載の写真画像処理方法。
【請求項3】
前記共分散行列が非正則である場合に、前記第三ステップは、前記部分空間と前記出力超平面の交わりの基底ベクトルを求めるステップと、交わりに含まれる点を前記基底ベクトルの線形式で求めるステップと、前記線形式の係数を調整することにより、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離を最小とする直積空間内の点を求めるステップを備えている請求項1記載の写真画像処理方法。
【請求項4】
写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一処理部と、入出力の直積空間内で学習サンプルから共分散行列を推定する第二処理部と、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三処理部と、求められた点から処理対象ベクトル画像に対応する出力を求める第四処理部と備えている写真画像処理装置。
【請求項5】
複数のパラメータを成分とする複数のベクトルデータを事象を表す学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された推定対象ベクトルデータに直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から推定対象ベクトルデータに対応する出力を推定事象として求める第四ステップとを備えている線形写像演算を用いた事象推定方法。
【請求項1】
写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から処理対象ベクトル画像に対応する出力を求める第四ステップとを備えている写真画像処理方法。
【請求項2】
前記共分散行列が非正則である場合に、前記第三ステップで、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離と、前記部分空間の補空間への射影残差に所定の重み変数を乗じた値とを加算した目的関数を生成し、当該目的関数の値が最小となる直積空間内の点を求める請求項1記載の写真画像処理方法。
【請求項3】
前記共分散行列が非正則である場合に、前記第三ステップは、前記部分空間と前記出力超平面の交わりの基底ベクトルを求めるステップと、交わりに含まれる点を前記基底ベクトルの線形式で求めるステップと、前記線形式の係数を調整することにより、Moore-Penrose型一般逆行列を用いたマハラノビス汎距離を最小とする直積空間内の点を求めるステップを備えている請求項1記載の写真画像処理方法。
【請求項4】
写真画像を構成する各画素データを成分とする複数のベクトル画像を学習サンプルとして入力する第一処理部と、入出力の直積空間内で学習サンプルから共分散行列を推定する第二処理部と、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された処理対象ベクトル画像に直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三処理部と、求められた点から処理対象ベクトル画像に対応する出力を求める第四処理部と備えている写真画像処理装置。
【請求項5】
複数のパラメータを成分とする複数のベクトルデータを事象を表す学習サンプルとして入力する第一ステップと、入出力の直積空間内で学習サンプルから共分散行列を推定する第二ステップと、推定された共分散行列の固有値問題を解くことにより得られる正規直交基底が張る部分空間と、入力された推定対象ベクトルデータに直交する出力超平面の双方に含まれ、且つ、最小マハラノビス汎距離を与える直積空間内の点を求める第三ステップと、求められた点から推定対象ベクトルデータに対応する出力を推定事象として求める第四ステップとを備えている線形写像演算を用いた事象推定方法。
【図1】
【図2】
【図4】
【図6】
【図7】
【図13】
【図14】
【図15】
【図3】
【図5】
【図8】
【図9】
【図10】
【図11】
【図12】
【図16】
【図2】
【図4】
【図6】
【図7】
【図13】
【図14】
【図15】
【図3】
【図5】
【図8】
【図9】
【図10】
【図11】
【図12】
【図16】
【公開番号】特開2010−33199(P2010−33199A)
【公開日】平成22年2月12日(2010.2.12)
【国際特許分類】
【出願番号】特願2008−192867(P2008−192867)
【出願日】平成20年7月25日(2008.7.25)
【出願人】(000135313)ノーリツ鋼機株式会社 (1,824)
【出願人】(504145283)国立大学法人 和歌山大学 (62)
【Fターム(参考)】
【公開日】平成22年2月12日(2010.2.12)
【国際特許分類】
【出願日】平成20年7月25日(2008.7.25)
【出願人】(000135313)ノーリツ鋼機株式会社 (1,824)
【出願人】(504145283)国立大学法人 和歌山大学 (62)
【Fターム(参考)】
[ Back to top ]