説明

画像処理装置、画像処理方法、およびプログラム、並びに学習装置

【課題】汎用的に生じる輝度依存性があるノイズを画像から除去する。
【解決手段】ノイズ量タップ抽出部14は、入力画像より高画質な出力画像内の注目画素の位置およびその周辺の位置に対応する入力画像内の複数の画素値をノイズ量タップとして抽出する。ノイズ量演算部15は、ノイズ量タップの画素値のそれぞれについて推定ノイズ量を求める。予測係数生成部16は、予め学習された処理係数と入力画像内のノイズ量タップの画素値のそれぞれについての推定ノイズ量との演算により、予測係数を生成する。予測部18は、出力画像内の注目画像の位置およびその周辺の位置に対応する入力画像内の複数の画素値からなる予測タップと予測係数との演算により、出力画像内の注目画素の画素値を生成する。本発明は、例えば、ノイズ除去処理を行う画像処理装置に適用することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法、およびプログラム、並びに学習装置に関し、特に、汎用的に生じる輝度依存性があるノイズを画像から除去することができるようにした画像処理装置、画像処理方法、およびプログラム、並びに学習装置に関する。
【背景技術】
【0002】
従来、画像からノイズを除去するノイズ除去処理では、ノイズを白色として扱い、周辺画素を足し合わせることでノイズを除去していた。
【0003】
これに対して、近年、ノイズ除去処理において、ノイズの色に偏りがあり、ノイズが有色であるものとすることにより、ノイズを白色として扱う場合に比べて、高精度のノイズ除去を行うことが考えられている。
【0004】
例えば、ノイズ除去処理において、開口部を遮光した黒色画素において生成する黒色画素信号を有効画素から出力される画素信号から減じることにより、製造誤差により混入された固定パターンのノイズ(FPN)を除去することが考案されている(例えば、特許文献1参照)。このノイズ除去処理では、製造誤差によるノイズを除去するため、製品ごとに黒色画素信号を検出する必要がある。
【0005】
【特許文献1】特開2007−116292号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
一方、ノイズ除去処理において、例えば製造過程には依存しない、イメージセンサ自体が汎用的に有する輝度依存性があるノイズ(以下、輝度依存性ノイズという)を除去することは考えられていなかった。
【0007】
本発明は、このような状況に鑑みてなされたものであり、汎用的に生じる輝度依存性があるノイズを画像から除去することができるようにするものである。
【課題を解決するための手段】
【0008】
本発明の第1の側面の画像処理装置は、第1の画像を、より高画質な第2の画像に変換する画像処理装置において、前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出する第1の画素値抽出手段と、前記第1の画素値抽出手段により抽出された前記複数の画素値のそれぞれについて推定ノイズ量を求める推定ノイズ量演算手段と、前記第1の画像に対応する生徒画像内の画素値の推定ノイズ量と第1の処理係数との演算により求められた第2の処理係数と、前記生徒画像との演算により、その生徒画像よりも高質な前記第2の画像に対応する教師画像を生成する関係式に基づく正規方程式により予め学習された前記第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、第2の処理係数を生成する処理係数生成手段と、前記第2の画像内の注目画像の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出する第2の画素値抽出手段と、前記第2の画素値抽出手段により抽出された前記複数の画素値と、前記第2の処理係数との演算により、前記第2の画像内の注目画素の画素値を生成する予測手段とを備える。
【0009】
本発明の第1の側面の画像処理装置において、前記関係式は、前記教師画像内の注目画素の位置およびその周辺の位置に対応する前記生徒画像内のN個の画素の画素値から求められるN個の前記推定ノイズ量と、N×Nの行列式で表される前記第1の処理係数との行列演算により、N個の前記第2の処理係数を求め、そのN個の第2の処理係数と前記生徒画像内のN個の画素の画素値との線形一次結合により、前記教師画像内の注目画素を生成する関係を表す式であるようにすることができる。
【0010】
本発明の第1の側面の画像処理装置において、前記推定ノイズ量は、前記生徒画像内の画素値の2次式で求められるようにすることができる。
【0011】
本発明の第1の側面の画像処理装置は、前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値としてのクラスタップの特徴に応じて、前記注目画素に対するクラスを生成するクラス分類手段をさらに設け、前記処理係数生成手段は、前記クラスごとの前記正規方程式により予め学習された前記クラスごとの前記第1の処理係数のうちの、前記クラス分類手段により生成された前記クラスの第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、前記第2の処理係数を生成することができる。
【0012】
本発明の第1の側面の画像処理方法は、第1の画像を、より高画質な第2の画像に変換する画像処理装置の画像処理方法において、前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、その抽出された前記複数の画素値のそれぞれについて推定ノイズ量を求め、前記第1の画像に対応する生徒画像内の画素値の推定ノイズ量と第1の処理係数との演算により求められた第2の処理係数と、前記生徒画像との演算により、その生徒画像よりも高質な前記第2の画像に対応する教師画像を生成する関係式に基づく正規方程式により予め学習された前記第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、第2の処理係数を求め、前記第2の画像内の注目画像の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、その抽出された前記複数の画素値と、前記第2の処理係数との演算により、前記第2の画像内の注目画素の画素値を生成するステップを含む。
【0013】
本発明の第2の側面のプログラムは、第1の画像を、より高画質な第2の画像に変換する画像処理を、コンピュータに行わせるプログラムにおいて、前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、その抽出された前記複数の画素値のそれぞれについて推定ノイズ量を求め、前記第1の画像に対応する生徒画像内の画素値の推定ノイズ量と第1の処理係数との演算により求められた第2の処理係数と、前記生徒画像との演算により、その生徒画像よりも高質な前記第2の画像に対応する教師画像を生成する関係式に基づく正規方程式により予め学習された前記第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、第2の処理係数を求め、前記第2の画像内の注目画像の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、その抽出された前記複数の画素値と、前記第2の処理係数との演算により、前記第2の画像内の注目画素の画素値を生成するステップを含む画像処理をコンピュータに行わせる。
【0014】
本発明の第2の側面の学習装置は、輝度依存性があるノイズを含む生徒画像内の画素値より推定ノイズ量を求め、その推定ノイズ量と第1の処理係数との演算により第2の処理係数を求め、その第2の処理係数と前記生徒画像との演算により、その生徒画像よりも高画質な教師画像を生成する関係式を解法するために、前記生徒画像の画素値と前記教師画像の画素値を用いて正規方程式を生成する正規方程式生成手段と、前記正規方程式を解法することにより、前記第1の処理係数を生成する係数生成手段とを備える
【0015】
本発明の第2の側面の学習装置において、前記関係式は、前記教師画像内の注目画素の位置およびその周辺の位置に対応する前記生徒画像内のN個の画素の画素値から求められるN個の前記推定ノイズ量と、N×Nの行列式で表される前記第1の処理係数との行列演算により、N個の前記第2の処理係数を求め、そのN個の第2の処理係数と前記生徒画像内のN個の画素の画素値との線形一次結合により、前記教師画像内の注目画素を生成する関係を表す式であるようにすることができる。
【0016】
本発明の第2の側面の学習装置において、前記推定ノイズ量は、前記生徒画像内の画素値の2次式で求められるようにすることができる。
【0017】
本発明の第2の側面の学習装置は、前記教師画像内の注目画素の位置およびその周辺の位置に対応する前記生徒画像内の複数の画素値としてのクラスタップの特徴に応じて、前記注目画素に対するクラスを生成するクラス分類手段をさらに設け、前記正規方程式生成手段は、前記クラス分類手段により生成されたクラスごとに、前記生徒画像の画素値と前記注目画素の画素値を用いて前記正規方程式を生成することができる。
【0018】
本発明の第1の側面においては、第1の画像より高画質な第2の画像内の注目画素の位置およびその周辺の位置に対応する第1の画像内の複数の画素値が抽出され、その抽出された複数の画素値のそれぞれについて推定ノイズ量が求められ、第1の画像に対応する生徒画像内の画素値の推定ノイズ量と第1の処理係数との演算により求められた第2の処理係数と、生徒画像との演算により、その生徒画像よりも高質な第2の画像に対応する教師画像を生成する関係式に基づく正規方程式により予め学習された第1の処理係数と、第1の画像内の複数の画素値のそれぞれについての推定ノイズ量との演算により、第2の処理係数が求められ、第2の画像内の注目画像の位置およびその周辺の位置に対応する第1の画像内の複数の画素値が抽出され、その抽出された複数の画素値と、第2の処理係数との演算により、第2の画像内の注目画素の画素値が生成される。
【0019】
本発明の第2の側面においては、輝度依存性があるノイズを含む生徒画像内の画素値より推定ノイズ量を求め、その推定ノイズ量と第1の処理係数との演算により第2の処理係数を求め、その第2の処理係数と生徒画像との演算により、その生徒画像よりも高画質な教師画像を生成する関係式を解法するために、生徒画像の画素値と教師画像の画素値を用いて正規方程式が生成され、正規方程式を解法することにより、第1の処理係数が生成される。
【発明の効果】
【0020】
以上のように、本発明の第1の側面によれば、汎用的に生じる輝度依存性があるノイズを画像から除去することができる。
【0021】
本発明の第2の側面によれば、汎用的に生じる輝度依存性があるノイズを画像から除去するための処理係数を生成することができる。
【発明を実施するための最良の形態】
【0022】
図1は、本発明を適用した画像処理装置10の一実施の形態の構成例を示している。
【0023】
図1の画像処理装置10は、クラスタップ抽出部11、クラス分類部12、係数記憶部13、ノイズ量タップ抽出部14、ノイズ量演算部15、予測係数生成部16、予測タップ抽出部17、および予測部18により構成される。
【0024】
画像処理装置10は、これから生成される出力画像の注目画素に対するクラスを生成し、そのクラスの処理係数と、入力画像の輝度依存性ノイズの分散値であるノイズ量の推定値(以下、推定ノイズ量という)とにより求められた予測係数と、入力画像とを用いて、入力画像から、より高画質な出力画像の予測値を生成するクラス分類適応処理を行う。
【0025】
なお、この画像処理装置10でクラス分類適応処理に用いられる処理係数は、例えば、輝度依存性ノイズを含む画像と、その輝度依存性ノイズが除去された画像とを用いた学習(詳細は後述する)により求められたものである。従って、画像処理装置10は、クラス分類適応処理により、輝度依存性ノイズを除去した高画質な画像を生成することができる。このことから、画像処理装置10におけるクラス分類適応処理は、いわば、入力画像から輝度依存性ノイズを除去するノイズ除去処理であるということができる。
【0026】
図1の画像処理装置10において、クラスタップ抽出部11は、出力画像(この出力画像は、これから生成される画像であり、現段階では存在しないため、仮想的に想定される)を構成する画素を、順次、注目画素として決定する。クラスタップ抽出部11は、その注目画素をクラスに分類するために用いる、注目画素の位置およびその周辺の位置に対応する入力画像内の複数の画素の画素値を、入力画像からクラスタップとして抽出する。クラスタップ抽出部11は、クラスタップをクラス分類部12に供給する。
【0027】
クラス分類部12は、クラスタップ抽出部11から供給されるクラスタップの特徴に応じて、注目画素をクラスに分類することにより、注目画素に対するクラスを生成する。注目画素をクラスに分類する方法としては、例えば、ADRCなどを採用することができる。ADRCを用いる方法では、クラスタップを構成する画素値がADRC処理され、その結果得られるADRCコードにしたがって、注目画素のクラスが決定される。これにより、クラスタップの相関(波形)により、注目画素がクラスに分類される。
【0028】
なお、KビットADRCにおいては、例えば、クラスタップを構成する画素値の最大値MAXと最小値MINが検出され、DR=MAX-MINを、クラスタップとしての複数の画素値の集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップとしての複数の画素値それぞれがKビットに再量子化される。即ち、クラスタップとしての各画素値から、最小値MINが減算され、その減算値がDR/2Kで除算(量子化)される。そして、以上のようにして得られる、クラスタップとしてのKビットのデータを、所定の順番で並べたビット列が、ADRCコードとされる。
【0029】
従って、クラスタップが、例えば、1ビットADRC処理される場合には、そのクラスタップとしての各画素値は、最小値MINが減算された後に、最大値MAXと最小値MINとの差の1/2で除算され(小数点以下切り捨て)、これにより、各データが1ビットとされる(2値化される)。そして、その1ビットのデータを所定の順番で並べたビット列が、ADRCコードとされる。クラス分類部12により生成された注目画素に対するクラスは、係数記憶部13に供給される。
【0030】
係数記憶部13は、後述する学習によって求められているクラスごとの最適な処理係数を記憶している。係数記憶部13は、クラス分類部12から供給されるクラスに対応する処理係数を読み出し、予測係数生成部16に供給する。
【0031】
ノイズ量タップ抽出部14は、クラスタップ抽出部11と同様に、出力画像を構成する画素を、順次、注目画素として決定する。ノイズ量タップ抽出部14は、注目画素に対応する推定ノイズ量を演算するために用いる、注目画素の位置およびその周辺の位置に対応する入力画像内の複数の画素の画素値を、入力画像からノイズ量タップとして抽出する。ノイズ量タップ抽出部14は、ノイズ量タップをノイズ量演算部15に供給する。
【0032】
ノイズ量演算部15は、ノイズ量タップ抽出部14から供給されるノイズ量タップから、注目画素に対応する推定ノイズ量を演算し、予測係数生成部16に供給する。
【0033】
予測係数生成部16は、係数記憶部13から供給される処理係数と、ノイズ量演算部15から供給される推定ノイズ量とを用いて所定の行列演算を行うことにより、予測係数を生成する。予測係数生成部16は、予測係数を予測部18に供給する。
【0034】
予測タップ抽出部17は、クラスタップ抽出部11やノイズ量タップ抽出部14と同様に、出力画像を構成する画素を、順次、注目画素として決定する。予測タップ抽出部17は、注目画素を予測するために用いる、注目画素の位置およびその周辺の位置に対応する入力画像内の複数の画素の画素値を、入力画像から予測タップとして抽出する。予測タップ抽出部17は、予測タップを予測部18に供給する。
【0035】
予測部18は、予測係数生成部16から供給される予測係数と、予測タップ抽出部17から供給される予測タップとを用いて、注目画素を予測する予測演算を行い、注目画素の画素値の予測値を、出力画像を構成する注目画素の画素値として生成する。予測部18は、予測演算により求められた画素値から構成される出力画像を出力する。
【0036】
次に、図2を参照して、図1のノイズ量演算部15による推定ノイズ量の演算について説明する。
【0037】
図2のグラフは、2種類のイメージセンサが有するノイズ量の光量(輝度)依存性を示している。なお、図2において、横軸は、総光量、即ち画素値を表し、縦軸は、ノイズ量を表す。
【0038】
図2に示すように、イメージセンサが有するノイズ量は輝度依存性があり、ノイズ量をσとし、画素値の真値をLとすると、ノイズ量σは、以下の式(1)に示すように、画素値の真値Lの2次式で表すことができる。なお、式(1)において、a,b、およびcは、イメージセンサに固有のパラメータである。
【0039】
【数1】

【0040】
式(1)によれば、画素値の真値Lから、その画素値の真値Lに対応する画素のノイズ量を演算することができる。従って、ノイズ量演算部15は、式(1)の演算を行うことによりノイズ量を求めればよいが、実際には、画素値の真値、即ち輝度依存性ノイズが含まれない画素値は取得することができないので、ノイズを含む画素値L´を用いて、以下の式(2)の演算を行うことにより、推定ノイズ量σ´を演算する。
【0041】
【数2】

【0042】
次に、図3乃至図5を参照して、図1の画像処理装置10におけるクラス分類適応処理について説明する。
【0043】
図1の画像処理装置10において、予測部18が、所定の予測演算として、例えば線形1次予測演算を行うものとすると、出力画像を構成する画素値yは、次の線形1次式によって求められる。
【0044】
【数3】

【0045】
なお、式(3)において、Xは、出力画像の画素値yについての予測タップを構成する入力画像のn個の画素の画素値からなるn次元ベクトル(X=(x0,x1,・・・,xn))であり、Wは、そのn個の画素の画素値のそれぞれと乗算される予測係数からなるn次元ベクトル(W=(w0,w1,・・・,wn))を表す。即ち、予測タップを構成する画素の個数と、予測係数Wを構成する予測係数の個数は同一である。
【0046】
ここで、予測係数Wは、後述する学習によって最適なものが求められるが、高精度のノイズ除去処理を行うためには、その学習の規範として、以下の2つの項目が必要である。
【0047】
第1の項目は、予測タップの相関(波形)によって予測係数Wを変化させることである。即ち、第1の項目は、予測タップを構成する画素値のうち、注目画素の画素値と近い画素値ほど、その画素値と乗算される予測係数Wが大きくなるようにすることである。
【0048】
例えば、図3に示すように、予測タップが、注目画素の位置に対応する入力画像の画素の画素値x1、その画素値x1と近い画素値x0、および、画素値x1と遠い画素値x2から構成されるとすると、画素値x0と乗算される予測係数w0が、その画素値x0より画素値x1に遠い画素値x2と乗算される予測係数w2に比べて大きくなるように、予測係数Wを学習する必要がある。
【0049】
また、第2の項目は、入力画像の推定ノイズ量σ´によって予測係数Wを変化させることである。即ち、第2の項目は、予測タップを構成する画素値のうち、推定ノイズ量σ´の少ない画素値ほど、その画素値と乗算される予測係数Wが大きくなるようにすることである。
【0050】
例えば、図3に示すように、予測タップが、注目画素の位置に対応する入力画像の画素の画素値x1、推定ノイズ量σ0の画素値x0、および、その推定ノイズ量σ0より大きい推定ノイズ量σ2の画素値x2から構成されるとすると、画素値x0と乗算される予測係数w0が、その画素値x0の推定ノイズ量σ0より大きい推定ノイズ量σ2の画素値x2と乗算される予測係数w2に比べて大きくなるように、予測係数Wを学習する必要がある。
【0051】
以上のような規範により最適な予測係数を学習する方法として、クラスタップの相関と推定ノイズ量σ´によって注目画素をクラスに分類し、クラスごとに予測係数を求めるクラス分類学習がある。しかしながら、この場合、クラス数が爆発し、予測係数を学習することが困難である。例えば、図4に示すように、クラスタップが3×3の画素の画素値から構成される場合、クラスタップの相関を各画素の画素値を1ビットADRC処理したもので表し、各画素の推定ノイズ量σ´を3ビットで表すと、総クラス数は約6.9×1010(=512×89)個となる。
【0052】
そこで、後述する学習では、クラスタップの相関によって分類されたクラスごとの最適な処理係数が求められ、画像処理装置10は、クラス分類適応処理において、その処理係数を推定ノイズ量σ´に応じて最適化し、それを予測係数Wとして予測演算を行う。
【0053】
即ち、クラス分類学習の最大の意義は、クラスごとに予測係数の値を変更することである。例えば、図5に示すように、2つの異なるクラスにおいて、予測タップ内の各画素値と乗算される予測係数は異なっている。なお、図5において、横軸は、予測タップを構成する画素値に対応する画素の位置を表し、縦軸は、その画素の画素値と乗算される予測係数を表している。
【0054】
そこで、画像処理装置10は、以下の式(4)にしたがって、学習により求められたクラスタップの相関によって分類されたクラスごとの最適な処理係数を基に、推定ノイズ量σ´に応じて予測係数Wを変化させることにより、クラス数を爆発させずに、クラスタップの相関と推定ノイズ量によって注目画素を分類して学習した場合と同様に、予測係数を最適化する。
【0055】
【数4】

【0056】
式(4)において、W0とWσ´iは、n次元ベクトルの予測係数Wに対応するn次元ベクトルの処理係数である。また、mは、ノイズ量タップを構成する画素値の個数であり、σ´iは、ノイズ量タップ内のi番目の画素値の推定ノイズ量である。なお、ノイズ量タップを構成する画素値の個数mは、予測タップを構成する画素値の個数nと同一であっても、異なっていてもよい。
【0057】
また、式(4)を行列式で表すと、以下の式となる。
【0058】
【数5】

【0059】
式(5)において、w0,0,w0,1,・・・w0,nは、n次元ベクトルの処理係数W0のn個の要素を表し、wσi´,0, wσi´,1,・・・,wσi´,nは、n次元ベクトルの処理係数Wσ´iのn個の要素を表している。

次に、図6のフローチャートを参照して、図1の画像処理装置10によるノイズ除去処理について説明する。
【0060】
ステップS11において、クラスタップ抽出部11、ノイズ量タップ抽出部14、および予測タップ抽出部17は、出力画像を構成する複数の画素のうちのまだ注目画素とされていない1つを、注目画素として決定する。ステップS12において、クラスタップ抽出部11は、入力画像から注目画素に対応するクラスタップを抽出し、クラス分類部12に供給する。
【0061】
ステップS13において、クラス分類部12は、クラスタップ抽出部11から供給されるクラスタップの特徴に応じて、注目画素をクラスに分類することにより、注目画素に対するクラスを生成する。そして、クラス分類部12は、生成された注目画素に対するクラスを係数記憶部13に供給する。
【0062】
ステップS14において、ノイズ量タップ抽出部14は、入力画像から注目画素に対応するノイズ量タップを抽出し、ノイズ量演算部15に供給する。ステップS15において、ノイズ量演算部15は、ノイズ量タップ抽出部14から供給されるノイズ量タップから、式(2)にしたがって注目画素に対応する推定ノイズ量σ´を演算し、予測係数生成部16に供給する。
【0063】
ステップS16において、係数記憶部13は、クラス分類部12から供給されるクラスに対応する処理係数を読み出し、予測係数生成部16に供給する。ステップS17において、予測係数生成部16は、係数記憶部13から供給される処理係数と、ノイズ量演算部15から供給される推定ノイズ量σ´とを用いて、上述した式(5)の行列演算を行うことにより、予測係数Wを生成する。予測係数生成部16は、予測係数Wを予測部18に供給する。
【0064】
ステップS18において、予測タップ抽出部17は、入力画像から注目画素に対応する予測タップを抽出し、予測部18に供給する。ステップS19において、予測部18は、予測係数生成部16から供給される予測係数Wと、予測タップ抽出部17から供給される予測タップとを用いて、上述した式(3)の予測演算を行い、注目画素の画素値の予測値を、出力画像を構成する注目画素の画素値として生成する。ステップS20において、クラスタップ抽出部11、ノイズ量タップ抽出部14、および予測タップ抽出部17は、出力画像を構成する全ての画素を注目画素に決定したかを判定する。
【0065】
ステップS20で、出力画像を構成する全ての画素をまだ注目画素に決定していないと判定された場合、処理はステップS11に戻り、上述した処理が繰り返される。
【0066】
一方、ステップS20で、出力画像を構成する全ての画素を注目画素に決定したと判定された場合、ステップS21において、予測部18は、予測演算により生成された画素値から構成される出力画像を出力し、処理は終了する。
【0067】
以上のように、画像処理装置10は、後述する学習により求められているクラスタップの相関によって分類されたクラスごとの処理係数と、推定ノイズ量σ´とを用いて予測係数Wを生成するので、クラス数を爆発させずに、クラスタップの相関と推定ノイズ量σ´に応じた最適な予測係数Wを生成することができる。これにより、画像処理装置10は、予測係数Wを用いて高精度のノイズ除去処理を行い、輝度依存性ノイズが除去された高画質の出力画像を生成することができる。
【0068】
また、実験によると、画像処理装置10における出力画像のS/N比は、クラスタップの相関と推定ノイズ量σ´とを用いて分類されたクラスごとに学習された予測係数を用いて、従来のクラス分類適応処理により求められた出力画像のS/N比に比べて大きくなる。例えば、予測タップとノイズ量タップを構成する画素値の数が9個である場合、実験では、前者が36.5となり、後者が35.6となった。これにより、画像処理装置10は、より高画質な出力画像を生成することができることがわかる。
【0069】
次に、画像処理装置10で予測係数Wの生成に用いられる処理係数の学習について説明する。この処理係数の学習は、例えば、最小自乗法を利用することによって行われる。
【0070】
具体的には、いま、第kサンプルの出力画像の画素の画素値の真値をykと表し、その第kサンプルの出力画像の画素についての予測タップを構成する入力画像のn次元ベクトルXをXk(Xk=(xk0,xk1,・・・,xkn))と表し、予測係数Wが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最小化関数Qは、以下の式(6)で表される。
【0071】
【数6】

【0072】
なお、式(6)において、Nは、出力画像の画素値ykと、その画素値ykについての予測タップを構成する入力画像のn次元ベクトルとのセット学習に用いるサンプル数(学習用のサンプルの数)である。
【0073】
式(6)の最小化関数Qの最小値(極小値)は、最小化関数Qを全ての変数で偏微分したものを0とする処理係数によって与えられる。従って、式(6)の最小化関数Qを全ての変数で偏微分し、その値が0となるように構築された図7の足し込み行列の連立一次方程式を解くことにより、最適な処理係数が求められる。
【0074】
図7の足し込み行列は、小ブロック(左辺の左側の行列の場合n×n行列からなる小ブロック、左辺の右側の行列と右辺の行列の場合n×1行列からなる小ブロック)に分けられ、左辺の左側の行列および右辺の行列の各小ブロックは、従来のクラス分類適応処理における線形1次予測演算に対応する足し込み行列の各要素に対して、その小ブロックの位置に応じた推定ノイズ量σ´の値を乗算することにより構成される。なお、図7において、iおよびj(0≦i,j≦n)は、予測タップ内の画素値に対応する画素の位置を表している。
【0075】
図7の足し込み行列は、クラスごとに生成され、最適な処理係数がクラスごとに求められる。
【0076】
画像処理装置10のクラス分類適応処理によれば、以上のようにして求められるクラスごとの処理係数を用いて式(5)の行列演算を行うことにより予測係数Wが生成され、その予測係数Wを用いて式(3)の予測演算を行うことにより、入力画像が出力画像に変換される。
【0077】
図8は、図1の画像処理装置10により用いられる処理係数を学習する学習装置30の構成例を示している。
【0078】
図8の学習装置30は、学習対記憶部31、クラスタップ抽出部32、クラス分類部33、ノイズ量タップ抽出部34、ノイズ量演算部35、予測タップ抽出部36、正規方程式生成部37、係数生成部38、および係数記憶部39により構成される。
【0079】
学習装置30において、学習対記憶部31は、処理係数の学習における生徒としての、画像処理装置10における入力画像に相当する輝度依存性ノイズを含む画像(以下、生徒画像という)と、教師としての、その入力画像から変換された理想的な出力画像に相当する画像(以下、教師画像という)とのセットを、学習対として記憶している。
【0080】
そして、学習対記憶部31は、学習対のうちの生徒画像を、クラスタップ抽出部32、ノイズ量タップ抽出部34、および予測タップ抽出部36に出力し、教師画像を正規方程式生成部37に出力する。
【0081】
クラスタップ抽出部32は、図1のクラスタップ抽出部11と同様に、教師画像を構成する画素のそれぞれを、順次、注目画素として決定する。クラスタップ抽出部32は、その注目画素をクラスに分類するために用いる、注目画素の位置およびその周辺の位置に対応する生徒画像内の複数の画素の画素値を、生徒画像からクラスタップとして抽出する。クラスタップ抽出部32は、クラスタップをクラス分類部33に供給する。
【0082】
クラス分類部33は、図1のクラス分類部12と同様に、クラスタップ抽出部32から供給されるクラスタップの特徴に応じて、注目画素をクラスに分類することにより、注目画素に対するクラスを生成する。クラス分類部33は、そのクラスを正規方程式生成部37に供給する。
【0083】
ノイズ量タップ抽出部34は、クラスタップ抽出部32と同様に、教師画像を構成する画素のそれぞれを、順次、注目画素として決定する。ノイズ量タップ抽出部34は、図1のノイズ量タップ抽出部14と同様に、注目画素に対応する推定ノイズ量σ´を演算するために用いる、注目画素の位置およびその周辺の位置に対応する生徒画像内の複数の画素の画素値を、生徒画像からノイズ量タップとして抽出する。ノイズ量タップ抽出部34は、ノイズ量タップをノイズ量演算部35に供給する。
【0084】
ノイズ量演算部35は、図1のノイズ量演算部15と同様に、ノイズ量タップ抽出部34から供給されるノイズ量タップから、式(2)にしたがって注目画素に対応する推定ノイズ量σ´を演算し、正規方程式生成部37に供給する。
【0085】
予測タップ抽出部36は、クラスタップ抽出部32やノイズ量タップ抽出部34と同様に、教師画像を構成する画素のそれぞれを、順次、注目画素として決定する。予測タップ抽出部36は、図1の予測タップ抽出部17と同様に、注目画素を予測するために用いる、注目画素の位置およびその周辺の位置に対応する生徒画像内の複数の画素の画素値を、生徒画像から予測タップとして抽出する。予測タップ抽出部36は、その予測タップを正規方程式生成部37に供給する。
【0086】
正規方程式生成部37は、クラス分類部33から供給されるクラスごとに、ノイズ量演算部35から供給される推定ノイズ量σ´、予測タップ抽出部36から供給される予測タップ、および学習対記憶部31から入力される教師画像を用いて足し込みを行った足し込み行列(図7)を、正規方程式として生成する。
【0087】
具体的には、正規方程式生成部37は、クラスごとに、図7の足し込み行列において、第kサンプルの予測タップを構成する生徒画像の各画素値をXk(Xk=(xk0,xk1,・・・,xkn))として代入し、第kサンプルの教師画像の注目画素の画素値をykとして代入し、その注目画素に対応する推定ノイズ量σ´を代入することにより、正規方程式を生成する。
【0088】
なお、足し込み行列は、上述したように、式(6)の最小化関数を0にするものである。従って、正規方程式生成部37により生成される正規方程式は、推定ノイズ量σ´と処理係数とにより求められた予測係数Wと生徒画像の予測タップとの乗算により、教師画像を生成する式(3)に相当する式を解法して、処理係数を求めるための式であるといえる。正規方程式生成部37により生成された正規方程式は、係数生成部38に供給される。
【0089】
係数生成部38は、正規方程式生成部37から供給される正規方程式を解法することにより、処理係数を生成する。係数生成部38は、その処理係数を係数記憶部39に記憶させる。以上のようにして学習され、係数生成部38に記憶された処理係数は、図1の係数記憶部13に記憶され、画像処理装置10において用いられる。
【0090】
次に、図9のフローチャートを参照して、図8の学習装置30による学習処理について説明する。
【0091】
ステップS30において、学習対記憶部31は、記憶している学習対のうちのまだ出力していない学習対を出力する。具体的には、学習対記憶部31は、学習対のうちの生徒画像を、クラスタップ抽出部32、ノイズ量タップ抽出部34、および予測タップ抽出部36に入力し、教師画像を正規方程式生成部37に入力する。
【0092】
ステップS31において、クラスタップ抽出部32、ノイズ量タップ抽出部34、および予測タップ抽出部36は、図1のクラスタップ抽出部11と同様に、教師画像を構成する複数の画素のうちのまだ注目画素とされていない1つを、注目画素として決定する。
【0093】
ステップS32において、クラスタップ抽出部32は、生徒画像から注目画素に対応するクラスタップを抽出し、クラス分類部33に供給する。ステップS33において、クラス分類部33は、図1のクラス分類部12と同様に、クラスタップ抽出部32から供給されるクラスタップの特徴に応じて、注目画素をクラスに分類することにより、注目画素に対するクラスを生成する。クラス分類部33は、そのクラスを正規方程式生成部37に供給する。
【0094】
ステップS34において、ノイズ量タップ抽出部34は、図1のノイズ量タップ抽出部14と同様に、生徒画像から注目画素に対応するノイズ量タップを抽出し、ノイズ量演算部35に供給する。
【0095】
ステップS35において、ノイズ量演算部35は、図1のノイズ量演算部15と同様に、ノイズ量タップ抽出部34から供給されるノイズ量タップから、式(2)にしたがって注目画素に対応する推定ノイズ量σ´を演算し、正規方程式生成部37に供給する。
【0096】
ステップS36において、予測タップ抽出部36は、図1の予測タップ抽出部17と同様に、生徒画像から注目画素に対応する予測タップを抽出し、正規方程式生成部37に供給する。
【0097】
ステップS37において、正規方程式生成部37は、クラス分類部33から供給されるクラスごとに、ノイズ量演算部35から供給される推定ノイズ量σ´、予測タップ抽出部36から供給される予測タップ、および学習対記憶部31から入力される教師画像を用いて、足し込み行列(図7)に対して足し込みを行う。
【0098】
ステップS38において、クラスタップ抽出部32、ノイズ量タップ抽出部34、および予測タップ抽出部36は、教師画像を構成する全ての画素を注目画素に決定したかを判定する。ステップS38で、教師画像を構成する全ての画素をまだ注目画素に決定していないと判定された場合、処理はステップS31に戻り、上述した処理が繰り返される。
【0099】
一方、ステップS38で、教師画像を構成する全ての画素を注目画素に決定したと判定された場合、ステップS39において、学習対記憶部31は、全ての学習対に対してステップS30乃至S38の処理が行われたか、即ち、記憶している全ての学習対を出力したかを判定する。ステップS39で、まだ全ての学習対に対してステップS30乃至S38の処理が行われていないと判定された場合、処理はステップS30に戻り、上述した処理が繰り返される。
【0100】
また、ステップS39で、全ての学習対に対してステップS30乃至S38の処理が行われたと判定された場合、正規方程式生成部37は、ステップS37で足し込みが行われることにより生成された正規方程式を、係数生成部38に供給する。
【0101】
そして、ステップS40において、係数生成部38は、正規方程式生成部37から供給される正規方程式を解法することにより、処理係数を生成し、係数記憶部39に記憶させる。
【0102】
以上のように、学習装置30は、クラスタップの相関によって分類されるクラスごとに、輝度依存性ノイズを含む生徒画像と、輝度依存性ノイズが除去された理想的な画像である教師画像とを用いて最適な処理係数を学習するので、画像処理装置10は、その処理係数と推定ノイズ量σ´とを用いて予測係数Wを生成することにより、クラス数を爆発させずに、クラスタップの相関と推定ノイズ量σ´に応じた、輝度依存性ノイズの除去に最適な予測係数Wを生成することができる。その結果、画像処理装置10は、輝度依存性ノイズが除去された高画質の出力画像を生成することができる。
【0103】
なお、上述した説明では、注目画素をクラスタップの相関に応じてクラスに分類したが、クラスに分類しなくてもよい。
【0104】
次に、上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
【0105】
そこで、図10は、上述した一連の処理をプログラムにより実行するコンピュータ300のハードウエア構成例を示している。
【0106】
コンピュータ300において、CPU(Central Processing Unit)301,ROM(Read Only Memory)302,RAM(Random Access Memory)303は、バス304により相互に接続されている。
【0107】
バス304には、さらに、入出力インターフェース305が接続されている。入出力インターフェース305には、キーボード、マウス、マイクロホン、リモートコントローラから送信されてくる指令を受信する受信部などよりなる入力部306、ディスプレイ、スピーカなどよりなる出力部307、ハードディスクや不揮発性のメモリなどよりなる記憶部308、ネットワークインタフェースなどよりなる通信部309、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア311を駆動するドライブ310が接続されている。
【0108】
以上のように構成されるコンピュータ300では、CPU301が、例えば、記憶部308に記憶されているプログラムを、入出力インターフェース305およびおバス304を介して、RAM303にロードして実行することにより、上述した一連の処理が行われる。
【0109】
コンピュータ300のCPU301が実行するプログラムは、例えば、リムーバブルメディア311に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
【0110】
そして、プログラムは、リムーバブルメディア311をドライブ310に装着することにより、入出力インターフェース305を介して、記憶部308にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部309で受信し、記憶部308にインストールすることができる。その他、プログラムは、ROM302や記憶部308に、あらかじめインストールしておくことができる。
【0111】
なお、コンピュータ300が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
【0112】
また、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
【図面の簡単な説明】
【0113】
【図1】本発明を適用した画像処理装置の一実施の形態の構成例を示すブロック図である。
【図2】2種類のイメージセンサが有するノイズ量の光量依存性を示す図である。
【図3】予測係数の学習の規範について説明する図である。
【図4】3×3の画素の画素値からなるクラスタップを示す図である。
【図5】予測タップを構成する各画素値と乗算される予測係数を示す図である。
【図6】図1の画像処理装置によるノイズ除去処理について説明するフローチャートである。
【図7】足し込み行列を示す図である。
【図8】処理係数を学習する学習装置の構成例を示すブロック図である。
【図9】図8の学習装置による学習処理について説明するフローチャートである。
【図10】コンピュータのハードウエア構成例を示すブロック図である。
【符号の説明】
【0114】
10 画像処理装置, 12 クラス分類部, 14 ノイズ量タップ抽出部, 15 ノイズ量演算部, 16 予測係数生成部, 17 予測タップ抽出部, 18 予測部, 30 学習装置, 33 クラス分類部, 37 正規方程式生成部, 38 係数生成部

【特許請求の範囲】
【請求項1】
第1の画像を、より高画質な第2の画像に変換する画像処理装置において、
前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出する第1の画素値抽出手段と、
前記第1の画素値抽出手段により抽出された前記複数の画素値のそれぞれについて推定ノイズ量を求める推定ノイズ量演算手段と、
前記第1の画像に対応する生徒画像内の画素値の推定ノイズ量と第1の処理係数との演算により求められた第2の処理係数と、前記生徒画像との演算により、その生徒画像よりも高質な前記第2の画像に対応する教師画像を生成する関係式に基づく正規方程式により予め学習された前記第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、第2の処理係数を生成する処理係数生成手段と、
前記第2の画像内の注目画像の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出する第2の画素値抽出手段と、
前記第2の画素値抽出手段により抽出された前記複数の画素値と、前記第2の処理係数との演算により、前記第2の画像内の注目画素の画素値を生成する予測手段と
を備える画像処理装置。
【請求項2】
前記関係式は、前記教師画像内の注目画素の位置およびその周辺の位置に対応する前記生徒画像内のN個の画素の画素値から求められるN個の前記推定ノイズ量と、N×Nの行列式で表される前記第1の処理係数との行列演算により、N個の前記第2の処理係数を求め、そのN個の第2の処理係数と前記生徒画像内のN個の画素の画素値との線形一次結合により、前記教師画像内の注目画素を生成する関係を表す式である
請求項1に記載の画像処理装置。
【請求項3】
前記推定ノイズ量は、前記生徒画像内の画素値の2次式で求められる
請求項1に記載の画像処理装置。
【請求項4】
前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値としてのクラスタップの特徴に応じて、前記注目画素に対するクラスを生成するクラス分類手段
をさらに備え、
前記処理係数生成手段は、前記クラスごとの前記正規方程式により予め学習された前記クラスごとの前記第1の処理係数のうちの、前記クラス分類手段により生成された前記クラスの第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、前記第2の処理係数を生成する
請求項1に記載の画像処理装置。
【請求項5】
第1の画像を、より高画質な第2の画像に変換する画像処理装置の画像処理方法において、
前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、
その抽出された前記複数の画素値のそれぞれについて推定ノイズ量を求め、
前記第1の画像に対応する生徒画像内の画素値の推定ノイズ量と第1の処理係数との演算により求められた第2の処理係数と、前記生徒画像との演算により、その生徒画像よりも高質な前記第2の画像に対応する教師画像を生成する関係式に基づく正規方程式により予め学習された前記第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、第2の処理係数を求め、
前記第2の画像内の注目画像の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、
その抽出された前記複数の画素値と、前記第2の処理係数との演算により、前記第2の画像内の注目画素の画素値を生成する
ステップを含む画像処理方法。
【請求項6】
第1の画像を、より高画質な第2の画像に変換する画像処理を、コンピュータに行わせるプログラムにおいて、
前記第2の画像内の注目画素の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、
その抽出された前記複数の画素値のそれぞれについて推定ノイズ量を求め、
前記第1の画像に対応する生徒画像内の画素値の推定ノイズ量と第1の処理係数との演算により求められた第2の処理係数と、前記生徒画像との演算により、その生徒画像よりも高質な前記第2の画像に対応する教師画像を生成する関係式に基づく正規方程式により予め学習された前記第1の処理係数と、前記第1の画像内の前記複数の画素値のそれぞれについての推定ノイズ量との演算により、第2の処理係数を求め、
前記第2の画像内の注目画像の位置およびその周辺の位置に対応する前記第1の画像内の複数の画素値を抽出し、
その抽出された前記複数の画素値と、前記第2の処理係数との演算により、前記第2の画像内の注目画素の画素値を生成する
ステップを含む画像処理をコンピュータに行わせるプログラム。
【請求項7】
輝度依存性があるノイズを含む生徒画像内の画素値より推定ノイズ量を求め、その推定ノイズ量と第1の処理係数との演算により第2の処理係数を求め、その第2の処理係数と前記生徒画像との演算により、その生徒画像よりも高画質な教師画像を生成する関係式を解法するために、前記生徒画像の画素値と前記教師画像の画素値を用いて正規方程式を生成する正規方程式生成手段と、
前記正規方程式を解法することにより、前記第1の処理係数を生成する係数生成手段と
を備える学習装置。
【請求項8】
前記関係式は、前記教師画像内の注目画素の位置およびその周辺の位置に対応する前記生徒画像内のN個の画素の画素値から求められるN個の前記推定ノイズ量と、N×Nの行列式で表される前記第1の処理係数との行列演算により、N個の前記第2の処理係数を求め、そのN個の第2の処理係数と前記生徒画像内のN個の画素の画素値との線形一次結合により、前記教師画像内の注目画素を生成する関係を表す式である
請求項7に記載の学習装置。
【請求項9】
前記推定ノイズ量は、前記生徒画像内の画素値の2次式で求められる
請求項7に記載の学習装置。
【請求項10】
前記教師画像内の注目画素の位置およびその周辺の位置に対応する前記生徒画像内の複数の画素値としてのクラスタップの特徴に応じて、前記注目画素に対するクラスを生成するクラス分類手段
をさらに備え、
前記正規方程式生成手段は、前記クラス分類手段により生成されたクラスごとに、前記生徒画像の画素値と前記注目画素の画素値を用いて前記正規方程式を生成する
請求項7に記載の学習装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2009−153003(P2009−153003A)
【公開日】平成21年7月9日(2009.7.9)
【国際特許分類】
【出願番号】特願2007−330452(P2007−330452)
【出願日】平成19年12月21日(2007.12.21)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】