データ品位を向上する方法及びシステム
【課題】シーンまたは信号を表現する画像データ、ビデオデータ、及び音声データの品位(例えば解像度)を、シーンまたは信号の同一部分の高品位表現及び低品位表現上で学習させた品位向上関数によって品位向上させる。
【解決手段】学習アルゴリズムは、シーンまたはシーンの一部分の低品位画像を、同じシーンまたはシーンの一部分の高品位画像と共に用いて、品位向上関数のパラメータを最適化する。次に最適化した品位向上関数を用いて、シーンまたはシーンの一部分の他の低品位画像を品位向上させる。信号の一部分の低分解能サンプル、及び同じ信号部分の高分解能サンプルを用いて品位向上関数を学習させ、そしてこの品位向上関数を用いて信号の残り部分を品位向上させることによって、音声データを品位向上させる。
【解決手段】学習アルゴリズムは、シーンまたはシーンの一部分の低品位画像を、同じシーンまたはシーンの一部分の高品位画像と共に用いて、品位向上関数のパラメータを最適化する。次に最適化した品位向上関数を用いて、シーンまたはシーンの一部分の他の低品位画像を品位向上させる。信号の一部分の低分解能サンプル、及び同じ信号部分の高分解能サンプルを用いて品位向上関数を学習させ、そしてこの品位向上関数を用いて信号の残り部分を品位向上させることによって、音声データを品位向上させる。
【発明の詳細な説明】
【背景技術】
【0001】
(関連出願のクロスリファレンス)
本願は、米国特許暫定出願番号60/367,324、発明の名称”Enhanced Imaging Using Self-Training Sensors”、2002年3月25日出願にもとづいて優先権を主張し、この特許出願全体を参考文献として本明細書に含める。
【0002】
(連邦政府による資金提供を受けた研究開発の記載)
本発明は、部分的に、米国科学技術財団の研究助成番号IIS-00-85864の下に米国政府からの支援を受けたものである。従って、米国政府は本発明において一定の権利を有する。
【技術分野】
【0003】
(発明の背景)
ビデオカメラあるいはスチル(静止画)カメラのような撮像装置(イメージャ)は、シーン(被写体の光景)から出る光を受光して検出することによってシーンを撮像する。シーン中の特定点から入射する光信号は、輝度、波長スペクトル、及び偏光のような特性を有する。これに加えて、撮像装置が受光する全視野は、撮像装置が光を受光する角度によって変化する。もちろん、特定の光線または光束を受光する角度は、シーンの光が出る点の位置に依存する。
【0004】
多くの応用が、視野の精密かつ正確な測定を必要とする。例えば、イメージベース・レンダリング(Image Based Rendering:IBR)では、シーンを撮像し、そして再レンダリングして、シーンの周りの航法(ナビゲーション)を模擬する。空間及び方向の両方についての全視野の測定は、シーンの幾何学的構造の抽出を可能にする。他の例として、各材料から反射した光、及び各照明源から出る光は、それ自身の特徴的なスペクトル曲線及び偏光特性を有する。高いスペクトル分解能によって、異なる種類の材料及び照明を識別すること、及び/または異なる模擬照明下でシーンを再レンダリングすることが可能になる。シーン中の点からの光の偏光を測定することは、シーン中の点に存在する材料の種類に関するさらなる情報を提供する。偏光情報も、屋外のシーンをレンダリング(表示画像作成)する際に気象条件の影響を補償するため、及び深度、即ち撮像装置からシーン中の点までの距離の測定を手助けするために用いられてきた。以上の例に見られるように、視野を精密かつ正確に測定するシステムには、種々の有益な応用がある。
【0005】
しかし、従来の撮像装置は、輝度分解能、スペクトル分解能、波長、及び偏光−即ち、輝度、波長、及び偏光の差を見分ける能力が限られ、そして、空間解像度−即ち、シーン中の各点の位置の相違を見分ける能力も限られている。例えば、現在は、空間解像度の高い画像を捕捉することが可能なディジタル・スチルカメラが存在する。しかし、関係するデータ量が多いので、これらのカメラは高解像度のビデオを生成することができない。他方では、30フレーム/秒という上等な時間分解能でビデオを捕捉することができる廉価なカメラが存在する。しかし、こうしたビデオカメラは、低い空間解像度しか提供しない。高い時間分解能かつ高い空間解像度を有する撮像装置を設計することは、特に困難である。多次元の高解像度に関連する技術的問題に加えて、基本的な物理的問題がしばしば存在する。例えば、暗い光条件はより長い露光時間を必要とし、時間分解能がより粗くなり、従って、動体の撮像における「ぼけ」を生じさせる。
【0006】
上述した問題に応える1つの方法は、視野の異なる態様を測定するために、「併置」する(即ち、同じ視点を有する)複数のセンサを使用する。例えば、熱撮像装置、距離計、及び可視光カメラを併置する。一部の場合は、複数センサの方法によって、露光と時間分解能との間のトレードオフのような、単一のセンサに存在する物理的限界の一部を克服することができる。しかし、こうした方法は、追加的な撮像リソースを必要とする。利用可能なリソースが限られている状況−例えば、固定数の画素、固定量のメモリ、及び露光と時間とのトレードオフが存在する状況では、これらのリソースをできる限り効率的に使用することが望ましい。
【0007】
視野が、互いに無関係な任意数の輝度の集合であるとした場合には、より大規模で、より高速で、より高密度にまとめた複数のセンサを構成すること以外の解決法に、少しの可能性が存在する。しかし、視野には、膨大な構造及び冗長性が存在する。例えば、視点が少し移動すると、シーンの見え方は一般に、予測可能なように変化する。これに加えて、単色の材料を見渡したスペクトル応答は、比較的一様であることが多い。さらに、シーン中の物体の動きは、規則的で予測可能なことが多い。例えば、大部分の物体は堅く、そして多くの場合に、物体はほぼ一定速度で移動しがちである。これらの要因のすべてが、視野内に大きな冗長性を生じさせる。その結果、視野の領域内のあらゆる点で視野をサンプリング(標本化)して、視野を再構成、近似、あるいは予測することは、通常は必要でない。
【0008】
上述した視野における冗長性を利用するために、この冗長性に関するいくつかの仮定をすることができる。例えば、(内挿)補間及びサンプリング理論は、信号の規則性についての仮定を用いて、限定数のサンプルからこの信号を復活させる。特によく知られている例として、ナイキスト理論は、サンプリングする信号の帯域が限られている−即ち、この信号が有限範囲内の周波数成分を有するものとすれば、最大限必要な信号サンプリング周波数は限られる、ということを述べている。画像に関しては、こうした有限周波数範囲の要求は、端部及び角のような不連続部分に許される鮮鋭度についての制限となる。ナイキスト理論に用いられる関数は三角関数であるが、画像の補間のために多項式も用いることができる。簡単な例は、双線形補間及び双三次元(bi-cubic)補間を含む。不都合なことに、簡単な補間技法から可能な改善は限られている。特に、こうした技法によって提供される解像度の増加は一般に、かなり小幅である。さらに、自然画像は、補間技法に固有の数学的仮定に従わないことが多いので、こうした方法は美観上不快なアーティファクト(歪像)を生じさせ得る。
【0009】
画像を粗くサンプリングして結果的なデータを有効に補間することは、ローパス(低域通過)フィルタとして作用する。従って、画像の空間解像度を増加させることは、画像の「ぼけを減らす」問題として表現することができる。擬似逆(Pseudo Inverse)フィルタ及びウィーナ・フィルタのような鮮鋭化フィルタは、ガウス性のぼけを減らすために用いられてきた。以前に用いられた他の方法は、ベイズ分析、端部に沿った補間、適応フィルタ処理、ウェブレット分析、フラクタル補間、凸集合上への投影、変分法、及びレベルセットを含む。こうした方法は基本的な補間を改善するが、これらの方法は局所的な画像構造を用いるか、あるいは視野の挙動に先立って全体を仮定したものを適用する、即ち視野の規則性についての仮定を適用するに過ぎないので、これらの方法が冗長性を利用する能力は幾分限られる。
【0010】
サンプリング及び補間に関するものは、「超解像」として知られている技法があり、この技法では、比較的粗いサンプリングを複数回実行して、サンプリングの有効分解能を改善する。上述した補間法のように、超解像は、視野の規則性についての仮定を行い、近年、理論的限界があることが示されている。
【0011】
広範囲にわたる視野を捕捉するための、種々のマルチカメラ(多カメラ)システムが提案されている。こうしたシステムは一般に、補間画像のワーピング(ねじり)を用いて、欠損したデータを埋めている。例えば、ハイブリッド撮像では、異なる特性−例えば異なるフレームレートまたは空間解像度を有する複数のカメラを用いて画像を捕捉する。視野の大部分は、計算されたカメラの幾何形状にもとづいて、補間と画像ワーピングとの組合せを用いて埋められる。
【0012】
追加的な方法は、テクスチャ合成及びシーンの統計量にもとづくものである。視野における冗長性の構造についての数学的仮定を行うのではなく、統計量またはパターン分析を用いて、冗長性をモデル化して利用する。1つの技法は、異なる尺度での画素の相関を用いる。他の方法は、毎日のシーンの、種々の異なるテクスチャ及び種々の異なる画像を用いて、モデルを「学習」させる。この学習の方法では、学習アルゴリズムが、画像における冗長性を抽出し利用して、画像を改善して画像の解像度を増加させることができるようにすべきである。人間の顔の高解像度画像を低解像度のデータから合成する周知の「hallucinating faces(幻覚顔)」法におけるように、画像の種類の領域が非常に限られていれば、こうした学習の方法が解像度を劇的に改善する。しかし、より広範な領域をモデル化する試みは一般に、機械学習の標準性の問題が生じる。例えば、モデルを非常に特別な領域で学習させれば、このモデルは特定の学習データに過剰に適合して、一般性に乏しくなる。例えば、解像度向上アルゴリズムを顔で学習させて建物に適用すれば、このアルゴリズムは、アーティファクトを生じさせやすく、そして品位向上の結果が低度になりやすくなる。他方では、モデルを非常に広範な画像の種類の領域で学習させれば、このモデルは、ほとんどの画像に生じるごく一般的な冗長性を学習するに過ぎない。その結果、広範な学習を行ったモデルは大部分の領域についてある程度の利益をもたらすが、いずれの領域についても格別良好な結果はもたらさない。
【0013】
(発明の概要)
従って、本発明の目的は、ハードウエア資源(リソース)を効率的に用いつつ、画像データ(例えばビデオ及び静止画像データ)及び音声データのようなデータの品位を向上させる方法及びシステムを提供することにある。
【0014】
本発明の他の目的は、こうしたデータ品位の向上を、視覚的に不快なアーティファクトのような不所望な副作用を回避する方法で提供することにある。
【0015】
本発明のさらに他の目的は、広く異なる種類の画像、音声、等に対して良好な性能を有するデータ品位向上を提供することにある。
【0016】
これら及び他の目的は、品位を向上させるデータ集合の一部分で学習させた品位向上関数によって達成される。例えば、システムがシーン全体(全景)から低品位の画像データを捕捉して、このシーンの狭い視野から高品位の画像データを捕捉することができる。シーンの一部分を表現する高品位の画像データ、及びこのシーンの同一部分を表現する低品位の画像データの対応部分を、画像データのこれらの集合にもとづいて品位向上関数を学習させる学習アルゴリズムによって処理する。換言すれば、前記品位向上関数が1つ以上のパラメータを有して、前記品位向上関数が、前記低品位画像データの前記部分から、前記高品位画像に非常に近いデータ集合を導出することができるように、前記学習アルゴリズムは、これらのパラメータのうちどの値が最適であるかを決定する。前記品位向上関数は、シーン全体の前記低品位画像によって表現されるのと同じシーンから取り出した高品位及び低品位のデータ、即ち品位を向上させるデータそのもので学習させるので、前記品位向上関数は最も関係するデータ集合向きに最適化される。学習後には、前記品位向上関数を用いて、残りの低品位データを品位向上させる。このシステムはこのようにして、従来のシステムに関連する欠点(例えば新たな領域についての貧弱な性能)をなくして、学習で品位向上させる撮像の利益を提供する。
【0017】
上述した手順は画像データに限らず、オーディオ(即ち音声)データにも適用することができる。サンプリングしたオーディオ信号を品位向上させるために、信号を表現する低品位のデータ集合を、同じ信号の一部分を表現する高品位のデータ集合と共に捕捉する。信号の一部分を表現する前記高品位のデータ集合、及び前記低品位のデータ集合のこれに対応する部分を学習アルゴリズムによって処理し、この学習アルゴリズムは、前記品位向上関数の1つ以上のパラメータの最適な学習値を定める。前記品位向上関数が、前記低品位のデータ集合から、前記高品位のデータ集合に非常に近いデータ集合を導出する動作を行うように、前記学習パラメータを選択する。一旦学習を実行すると、前記品位向上関数を用いて、残りの前記低品位データを品位向上させる。
【0018】
本発明の追加的な態様によれば、品位が変化する画像列を用いて、品位向上関数を学習させ、そしてこの品位向上関数を用いて、前記画像列中の低品位画像を品位向上させることができる。シーンの高解像度画像、及び同じシーンの低解像度画像を学習アルゴリズムによって処理して、品位向上関数の1つ以上のパラメータの学習値を定める。これらのパラメータ値によって、前記品位向上関数が、前記低品位画像から、前記高品位画像に非常に近い画像を導出する動作を行うように、前記パラメータの学習値を定める。一旦、前記品位向上関数のパラメータを学習させると、前記品位向上関数を用いて、同じシーンの追加的な低品位画像を処理して高品位画像を導出する。
【0019】
本発明のさらなる目的、特徴、及び利点は、以下の図面を参照した詳細な説明より明らかになり、これらの図面は本発明の実施例を示す。
これらの図面を通して、特に断わりのない限り、同一参照番号及び符号は、実施例における同じ形状、素子、構成要素、または部分を表わす。
【0020】
(実施例の詳細な説明)
本発明によれば、同じシーンまたは信号の低品位及び高品位のサンプリング(標本化)を行って、低い品位を有するデータ、並びにこれに対応する高い品位を有するデータを生成することによって、データ品位を向上させることができる。これらの低品位データ及びこれに対応する高品位データは共に、シーンまたは信号の同一部分を表現し、これらのデータを用いてデータ品位向上関数を学習させて、次にこのデータ品位向上関数を用いて、シーンまたは信号の残りの部分を表わす追加的な低品位データの品位を向上させることができる。本明細書で用いる「品位」とは、例えば、データの空間解像度を称することができるが、空間解像度に限定する必要はない。「品位」は、実際には、データがシーン、視野、オーディオ信号、等を表現する精度及び/または正確性に関するあらゆる特性とすることができる。例えば、品位は、輝度分解能(例えば画素当たりのビット数)、スベクトル分解能(例えば、光または他の放射を異なるスペクトル成分に分解する際のスペクトル成分の数)、偏光分解能(例えば、光または他の放射を偏光成分に分解できる精度)、時間分解能(例えば、1秒当たりのビデオフレーム数または1秒当たりのオーディオサンプル(標本)数)、信号レベル分解能(例えば、オーディオ・データストリームにおけるサンプル当たりのビット数)、及び/または信号対雑音比である。品位とは、例えば、画像の次の属性を称することもできる:
画像中に出現する端部(エッジ)が、シーン中の対象物(オブジェクト)の端部の実際位置を表現する精度、
画像が、入射する視野内に存在する実際の色を表現する精度、及び/または、
入射する視野の明るさのコントラストまたは色のコントラストを画像中に表現する精度。
【0021】
図2及び図4に、本発明により画像データの品位を向上させる好適な手順を示す。図に示す手順では、シーンを撮像して、低い品位を有するこのシーンの画像を生成する(ステップ202)。シーンの一部分は、高品位の画像データ−即ち、ステップ202で生成したデータよりも高い品位を有するデータを生成すべく撮像する(ステップ204)。図1に、こうして生成した画像データの集合の好例を示す。図に示すデータ集合は、シーンの広い視野の、低い空間解像度の384×384画素の画像IS、及びこのシーンの狭い視野の、高い空間解像度の256×256画素の画像IQを含む。ISの中央の128×128画素の部分集合(図中の白い四角形で囲んだ部分)を
で表わし、この部分は、高い空間解像度の画像IQを低い解像度にしたものに相当する。「空間解像度」とは、例えば、遠近法の投影による単位深さにおける平面上の単位面積当たりの画素数を称することができる。従って、画像IQは画像ISよりも総画素数が少なく、画像IQはISよりも高い解像度を有する。選択肢として、低解像度のデータ集合
は、低解像度の全体画像ISの一部分を選択することによって、あるいは、高解像度画像IQを低解像度画像ISの解像度に劣化させることによって得ることができる。例えば、平均化のためのガウスぼかしカーネル(Gaussian blur kernel)を高解像度データに適用し、これに続いて、低解像度画像を模擬するためのサブサンプリング(副標本化)を行うことができる。代表的なガウスぼかしカーネルは、要素の値が正規化した二次元ガウス関数G=Kexp((-x2-y2)/σ2)にもとづく(例えば9×9)正方行列である。画像は、画素毎に新たな値を計算することによってぼかされ、これらの新たな値は、当該画素を囲む正方形状の近傍(例えば9×9の正方形状の近傍)の全画素の加重平均である。加重平均を計算するために、前記近傍内の各画素の値に、ぼかしカーネルの対応する要素の値を乗じて、結果的な積を加算する。結果的な積の総和が、中心画素の新たな値となる。画像の各画素を上述した手順によって個別に処理して、新たなぼかし画像を生成する。
【0022】
高品位データIQ、及びこれに対応する低品位画像ISの部分集合
を学習アルゴリズム402によって処理して(ステップ206)、品位向上関数406の1つ以上のパラメータの学習値404を決定して、この決定は、学習パラメータ404を品位向上関数406に用いる場合に、関数406が、低品位データISの部分集合
から高品位データIQに非常に近いデータを導出する動作をするように行う。一旦、品位向上関数の適切なパラメータを学習させると、結果的な最適化された関数を用いて、低品位のデータ集合ISの残り部分IRを処理して、シーンの残り部分を表現するデータ集合IR’を導出することができる(ステップ208)。高品位のデータ集合IQとIR’とを組み合わせて(ステップ408)、シーン全体の高品位画像IHを導出することができる。
【0023】
選択肢として、低品位データの部分集合
及び高品位のデータ集合IQを、1つ以上の「学習対」−即ち画像データの集合内の種々の異なる領域から取り出した小部分を選択することによって処理することができる。図7に、図1に示す低品位画像及び高品位画像
及びIQのデータ集合から導出することのできる多数の学習対を示す。図7に示す、低解像度の、5×5画素の画像パッチ(片)PS1、PS2、PS3、及びPS4は
から取り出したものであり、これらに対応する高解像度の、10×10画素の画像片PQ1、PQ2、PQ3、及びPQ4はIQから取り出したものである。結果的なパッチの対−即ち(PS1,PQ1)、(PS2,PQ2)、(PS3,PQ3)、及び(PS4,PQ4)は、学習アルゴリズム402用の学習データを提供する。
【0024】
品位向上関数406は、(学習アルゴリズム402において)一組の学習対(PS1,PQ1),...,(PSK,PQK)への多項式の回帰を適用することによって学習させて、ここにKは学習対の数を表わす。まず、学習アルゴリズム402は、25画素の低解像度パッチPSnの値を並べて、25要素の行ベクトルWSnを形成する。これら25画素の値は都合の良い順に並べることができるが、すべてのパッチについて同じ順序を用いる。次に、各パッチのベクトルを並べて、次の行列にする:
【数1】
ここに、Tはベクトルまたは行列の転置を表わす。
WS1は1番目の、低解像度の、5×5画素のパッチPS1を表わすベクトルであり、そして、zi(WS1)(i=1,...,25)は、このパッチPS1のi番目の値を表わすものとする。学習アルゴリズム402の効率を改善するために、アルゴリズム402は2次の多項式のみを考えることが好ましい。従って、tをすべての2次及びより低次の単項式のリストあるいはベクトルとし、即ちtは、(a)値1、(b)各画素の値、及び(c)パッチPS1の種々の画素を互いに掛け合わせるかあるいは二乗することによって形成することのできるすべての2次の単項式を含み、次式のようになる:
【数2】
【0025】
低解像度のパッチ毎に、これらの単項式の行ベクトルを形成する。例えば、パッチPS1に対応する行ベクトルは、t(WS1):=(t1(WS1),...tp(WS1))となる。図8に示すように、パッチPS1が25画素を有すれば、これに対応する行ベクトルt(WS1)は651個の要素を有する。各パッチについての行ベクトルを並べて、次式の行列にする:
【数3】
【0026】
図に示す例では、空間解像度の4:1の向上を実行している。従って、与えられた低解像度パッチ内の各低解像度画素が、この低解像度パッチに対応する高解像度パッチ内の4つの高解像度画素に対応する。例えば、図8に示すように、5×5のパッチPS1内の画素802が、このパッチPS1に対応する高解像度パッチPQ1内のそれぞれ位置a、b、c、及びdにある4つの画素804、806、808、及び810に対応し、各位置a、b、c、及びdは、低解像度パッチPS1の中央にある画素802の位置との関係で規定される。高解像度画素804、806、808、及び810は、数学的にはそれぞれ(WQ1)a、(WQ1)b、(WQ1)c、及び(WQ1)dのように表わすことができる。図に示す例では、高解像度パッチPQ1の中央にある4つの画素804、806、808、及び810のみを学習用に用いて、高解像度パッチPQ1の残りの画素は用いる必要がない。最終的には、品位向上関数の集合の学習させる各関数を用いて、低解像度パッチ全体に対して前記4つの高解像度画素のうちの1つを取り出す動作を行い、パッチ全体はパッチの中央にある画素の近傍として見ることができ、取り出した1つの画素を、前記近傍の中央にある低解像度画素と置き換える。例えば、5×5の低解像度の近傍/パッチにもとづく4:1の空間解像度の向上の場合には、4つの別個の解像度向上関数fa、fb、fc、及びfdが、低解像パッチの全体に対して、4つの画素位置a、b、c、及びdにある、対応する4つの高解像度画素のうちの1つを取り出す動作を行う。学習アルゴリズム402は、品位向上関数fa、fb、fc、及びfdが最適化されていれば−即ち、これらの関数の係数が適切に選定されていれば、低解像度パッチ(例えば図8に示すPS1)内の全画素の値から所定の高解像度画素(例えば画素804)を取り出すことができるべきである、という原理で動作する。与えられた画素位置m(m=a、b、c、またはd)に対する係数が行ベクトルCm=(cm1,...,cmk)Tを形成し、ここで、ベクトルCm中の係数の値は、どの高解像度画素を取り出すか、即ち、取り出す画素が位置a、b、c、またはdのいずれにあるかに依存する。換言すれば、4つの高品位画素の位置a、b、c、またはdは異なる係数の組を有し:即ち、関数fa、fb、fc、及
びfdに対しそれぞれCa、Cb、Cc、及びCdを有する。各々が低解像度パッチ及び対応する4つの高解像度画素を有する複数の学習対を用いることが好ましく、これら4つの高解像度画素はそれぞれ位置a、b、c、及びdにある。すべての学習対から取り出した、与えられた画素位置mに関連する値を用いて、この画素位置mに存在するそれぞれの高品位画素の値を並べて、次式の行列にすることができる:
【数4】
ここに、m=a、b、c、及びdである。
Cmの係数が適正に定められているものとすれば、これら4つの画素位置のいずれか1つ−即ち、与えられた任意のmについて、Cmは次の行列方程式が解けるものであるべきである:
【数5】
(4)式の形の行列方程式におけるベクトルCmに対する解を見つけるための周知の線形代数技法がいくつか存在する。例えば、t(WS)Tt(WS)が可逆であれば、学習アルゴリズム402は、Cmを次式のように計算することができる:
【数6】
(5)式は、(4)式におけるCmに対する最小二乗解を提供し−即ち、Cmに対する、(4)式の左辺と右辺の二乗差の総和を最小にするベクトル要素値の集合を提供する。
【0027】
本実施例では、学習段階の出力結果は、4つの係数ベクトルCa、Cb、Cc、及びCdである。従って、これらのベクトルCa、Cb、Cc、及びCdは、4つの多項式品位向上関数それぞれfa、fb、fc、及びfdの係数を含み、これらの関数は、任意に与えられた5×5の低解像度パッチL上で、このパッチLの近傍の中央にある、対応する4つの高解像度画素Hmを取り出す動作を行うことができ、ここに、
【数7】
m=a、b、c、及びdである。図1に示す画像部分集合IRのような低解像度画像データ集合または部分集合を品位向上させるために、品位向上アルゴリズム(図2のステップ208)は一般に、データ集合IRの最初の5×5パッチL(例えば、図1に示す、左上隅のパッチL)を処理して、高解像度画像データ集合IR’の、パッチLに対応する近傍の中心にある4つの高解像度画素Ha、Hb、Hc、及びHdを生成することによって始まる。次にこのアルゴリズムは、低解像度画素1つ分だけ(例えば右に)移動することによって次のパッチを処理して、4つの高解像度画素の隣接組を生成する。換言すれば、続けて処理する低解像度パッチどうしの間に、例えば4×5画素の重複領域が存在し、これにより、生成される高解像度画像データ集合IR’がシーン領域を完全にカバーすることを保証することが好ましい。この重複は、垂直方向及び水平方向共に存在すべきである。
【0028】
なお、以上の説明は異なる空間解像度を有するデータ集合に重きをおいてきたが、図2及び図4に示す手順は、異なる輝度分解能(例えば、異なる数のグレーレベル(輝度階調)及び/または画素当たりのビット数)を有するデータ集合を処理するために用いることもできる。再び図1、図2、及び図4を参照して説明する。低品位画像ISが低い輝度分解能を有する画像であり、高品位画像IQが高い輝度分解能を有する画像であれば、共にシーンの同一部分を表現する、高品位画像IQ及び低品位画像ISの最初の部分集合
を学習アルゴリズム402によって処理して(ステップ206)、品位向上関数406のパラメータ404を定める。品位向上関数406はこのように最適化され、従って、低い輝度分解能の画像ISの残りの部分集合IRの分解能を向上させて、シーンの残り部分の高い輝度分解能の画像IR’を導出するために用いることができる。次に、高品位画像IQとIR’とを組み合わせて(ステップ408)、シーン全体の改善された画像IHを提供することができ、この画像は、最初に捕捉したシーンの低品位画像ISよりも高い輝度分解能を有する。
【0029】
図9Aに、本発明による品位向上用の高品位及び低品位のデータを収集する好適なシステムを示す。図に示す撮像システムは、比較的広い視野908を有するが比較的低品位の(例えば空間解像度または輝度分解能が低い)第1撮像装置902と、より狭い視野910を有するが高品位の(例えば空間解像度または輝度分解能が高い)第2撮像装置904と、ビームスプリッタ906とを具えている。ビームスプリッタ906は、入射光を、低品位撮像装置902及び高品位撮像装置904の両方に指向させて、これらの撮像装置902及び904を用いて、図1に示す低品位画像IS及び高品位画像IQを生成することができる。選択肢として、このシステムは、図1、図2、及び図4を参照して上述したデータ品位向上を実行する処理装置930を具えることもでき、処理装置930は例えば、コンピュータまたは特定目的の処理論理回路で構成することができる。その代わりに、あるいはこれに加えて、処理装置930は撮像装置902及び904の一方または両方に内蔵させることができる。
【0030】
図9Bに、学習アルゴリズム及び上述した品位向上手順に用いる画像データを生成する好適なシステムを、追加的に示す。図に示すシステムは、カメラ912及び曲面鏡920を具えて、これらはシーンの広角像を提供する。鏡920は、例えば放物面鏡とすることができ、低解像度(低品位)の視野914、高解像度(高品位)の視野918、及び中位の解像度(品位)の視野916を提供する。高解像度の視野918及び/または中位の解像度の視野916から収集したデータを劣化させて、元々捕捉した高解像度及び中位の解像度のデータと組み合わせて用いる低解像度の学習データを提供することができる。選択肢として、図9Aを参照して上述した処理装置930をカメラ912内に内蔵させることができる。
【0031】
図9Cに、多解像度の撮像システムの追加的な例を示す。この撮像システムは、低解像度部分928及び高解像度部分926のあるCCDアレイ924を有するカメラ922を具えている。高解像度部分926は高解像度の視野910内のデータを捕捉し、低解像度部分928は低解像度の視野908からのデータを捕捉する。撮像装置922は、高解像度部分926から、その視野910の低解像度データを直接取得しないが、この高解像度部分910から収集した前記視野の高解像度データを上述したように劣化させて、CCDアレイ924の高解像度部分926によって収集した高解像度データと組み合わせて用いる低品位の学習データを導出することができる。
【0032】
なお、以上の例は、多項式回帰にもとづく学習アルゴリズムに重きをおいてきたが、同じシーンからの低解像度データ及び高解像度データ上での学習の技法はこうした学習アルゴリズムに限定されない。実際には、回帰を用いてデータ品位向上関数のパラメータを調整するあらゆる学習アルゴリズムを用いることができる。適切なアルゴリズムの追加的な例は、当業者には良く知られた次の周知の学習アルゴリズムを含む:ベイズ決定法、最大尤度法、線形判別法、ニューラルネットワーク、遺伝的プログラミング、及び支持ベクトルマシンのようなカーネル法。
【0033】
本発明による品位向上手順は、音声/オーディオデータを品位向上させるために用いることもでき、これを図3、5、及び6に示す。図に示す手順では、音声信号を検出して、低品位の音声データ集合ASを生成する(ステップ502)。低品位データ集合ASは、第1及び第2の音声部分
及びARを含み、これらは例えば時刻t1から時刻t2までに収集したデータ、及び時刻t2から時刻t3までに収集したデータである。高品位音声データの集合AQは、音声信号の、第1の低品位データの部分集合
を生成するために用いたのと同じ部分をサンプリングすることによって生成する(ステップ504)。例えば音声信号を、前記低品位のデータ集合AS(部分集合
及びARを含む)を導出するための22kHz、及び高品位音声データ集合AQを生成するための44kHzでサンプリングすることができる。その代わりに、あるいはこれに加えて、低品位データ集合ASの第1部分集合
を、高品位データAQを劣化させることによって−例えば2サンプル毎に1サンプルを消去することによって導出することができる。音声データの品位は、信号レベルの分解能−例えば1サンプル当たりのビット数によって規定することもできる。例えば、低品位データが1サンプル当たり8ビットを有して、高品位データが1サンプル当たり16ビットを有することができる。
【0034】
いずれの場合にも、高分解能(高品位)音声データAQ、及び低分解能(低品位)音声データの第1部分集合
を、学習アルゴリズム602用の学習対として用いて、品位向上関数606の最適化したパラメータ604を導出することができる(ステップ506)。例えば、品位向上関数606が多項式関数であれば、多項式の係数ベクトルCa、Cb、Cc等は学習アルゴリズム602によって導出される。いずれの場合にも、品位向上関数606の学習させたパラメータ604を一旦定めると、この品位向上関数を学習させたパラメータと共に用いて低品位音声データの第2部分集合ARを処理して、音声信号の残り部分を表現する高品位音声データAR’が導出される(ステップ508)。こうして導出した高品位音声データAR’を、高品位にサンプリングした音声データAQと組み合わせて(ステップ608)、音声信号全体を表現する高品位音声データAHの完全な集合を導出することができる。
【0035】
本発明の追加的な態様によれば、品位向上関数を、異なる品位−例えば異なる空間解像度を有する一組のビデオフレーム上で学習させることができ、このことを図11及び図14に示す。図に示す手順では、シーンを撮像して、第1の高品位画像1102(例えば高品位ビデオフレーム)を生成する(ステップ1402)。シーンを再び撮像して、第1の低品位画像/ビデオフレーム1104を生成する(ステップ1404)。高品位画像1102及び低品位画像1104を上述したような学習アルゴリズムにおける学習対として用いて、品位向上関数のパラメータを定める(ステップ1406)。1つ以上の低解像度フレーム(例えば低品位画像1106)が生成されると(ステップ1408)、品位向上関数を学習させたパラメータと共に用いて、追加的な低品位画像を処理して、追加的な高品位画像を導出することができる(ステップ1410)。しかし、図14は上述した手順を、追加的な低品位データを捕捉する前に学習アルゴリズムを適用するように示しているが、この学習アルゴリズムは、すべての、あるいは大部分の画像データを捕捉した後でも同じように容易に適用することができる。
【0036】
図10A及び図10Cに、図14に示す手順に用いる画像データを生成するための好適なシステムを示す。図10Aに示すシステムは、高解像度ビデオカメラ1002、低解像度ビデオカメラ1004、及び入射光を2つのカメラ1002及び1004に分配するためのビームスプリッタ1006を具えている。同じ入射ビームをカメラ1002及び1004の両方で撮像するので、システムは単一の視点1014を持っているものと考えることができる。選択肢として、高解像度カメラ1002を低いフレームレートにして、低解像度カメラ1004を高いフレームレートにすることができる。例えば、高解像度カメラ1002が1000×1000画素の空間解像度を有するビデオデータを1秒当たり3フレームのフレームレートで生成して、低解像度カメラ1004が500×500画素の空間解像度を有するビデオデータを1秒当たり30フレームのフレームレートで生成することができる。
【0037】
図10Aに示すシステムと同様に、図10Cに示すシステムは、高解像度ビデオカメラ1002及び低解像度ビデオカメラ1004を具えている。しかし、図10Cに示すシステムはビームスプリッタ1006を具えていない。むしろ、図10Cに示す2つのカメラ1002及び1004はそれぞれ、異なる視点1012及び1014を有する。カメラ1002及び1004の視点1012と1014とは近接していることが好ましく−特に、視点1012と1014とが撮像するシーンの深度(被写体深度)に比べて十分近接して、視差調整を少ししか、あるいは全く必要としないことが好ましい。図14に示す手順を用いて、カメラ1002及び1004によって生成した高解像度及び低解像度の画像(図14に示すステップ1402及び1404で生成した画像)を処理して、その上で、上述した品位向上関数を学習させて(ステップ1406)、低解像度カメラ1004によって生成されたさらなる低解像度画像を、前記品位向上関数によって品位向上させて、高解像度画像を導出する(ステップ1410)。品位向上させた画像の視点は通常、低解像度画像を生成するために用いた低解像度カメラ1004の視点に等しいかあるいは近接し、前記品位向上させた画像はこの低解像度画像から導出している。
【0038】
図10Bに、図14に示す手順に用いる画像データを生成するのに適したCCDアレイ1008を示す。図に示すCCDアレイ1008を用いて、個々の素子を(例えば4画素のグループに)一群にまとめて「超画素」1010を形成することによって、解像度を変化させてデータを生成することができる。各超画素内の4つの画素は、例えばこれら4画素の値を平均することによって一群にすることができる。こうした画素の一群化(クラスタリング)は有利である、というのは、装置の空間解像度は低下するが、一群化はCCDアレイ1008がより高いフレームレートでサンプリングを行うことを可能にする。画素はフレーム毎に一群化する必要はない。連続するフレームの解像度は−例えば、連続する9個の低解像度画像を高いフレームレートで捕捉し、これに続いて1つの高解像度画像を捕捉することによって、変化させることができる。図11及び図14を参照して上述したように、高解像度画像及び1つ以上の低解像度画像を用いて品位向上関数を学習させることによって、低解像度画像を品位向上させて高解像度画像を導出することができる。その結果、前記システムは高解像度のビデオを高いフレームレートで生成することができる。
【0039】
本発明によれば、画像データのスペクトル分解能も向上させることができる。図12に、高いスペクトル分解能の部分と低いスペクトル分解能の部分とを有する画像データを生成するシステムを示す。このシステムは、ビデオカメラ1202、ビームスプリッタ1204、スリット1206、第1レンズ1208、プリズム1210、第2レンズ1212、及びCCDアレイ1214を具えている。ビームスプリッタ1204は、入射光の一部を通過させてビデオカメラ1202に向けて、残りの光をスリット1206に向けて指向させて、スリット1206から狭いビーム1216が第1レンズ1208を通ってプリズム1210に入る。プリズム1210は、このビームの種々のスペクトル成分を異なる方向に指向させる。これらの成分は第2レンズ1212を通過して、CCDアレイ1214によって受光され検出される。CCDアレイ1214の結果的な出力は、スリット1206を通過する光の狭いビーム1216に存在する波長の高いスペクトル分解能の測定値である。ビデオカメラ1202がカラービデオカメラであっても、こうしたカメラは一般に、粗い赤色、緑色、及び青色(RGB)の情報を提供するに過ぎない。これとは対照的に、CCDアレイ1214によって受光した光はスリット1206及びプリズム1210を通っているので、この光に存在する種々の波長は、CCDアレイ1214全体にわたって水平方向に拡散されている。結果的なスペクトル情報は、CCDアレイ1214の水平次元の画素数と同数のスペクトル成分の測定値を含む。図13に、図12に示すシステムによって生み出されるビデオカメラを示す。ビデオカメラの各フレーム内には、カメラ1202によって生成された低品位(この場合は低いスペクトル分解能)画像ISが存在し、低品位画像ISは第1データ部分集合
及び第2データ部分集合IRを含む。各フレーム内には、CCDアレイ1214によって生成された高品位(この場合は高いスペクトル分解能)データ集合IQも含まれ、高品位データ集合IQは、低品位データ集合ISの第1部分集合
と同じ部分のシーンを表現する。図1に示す画像データIS及びIQと同様に、図13に示す画像データを、図2及び図4に示す学習及び品位向上手順に従って、例えば図12に示す処理装置930によって処理して、シーン全体を表現する画像を導出することができるが、低品位画像ISに存在するスペクトル情報量よりもずっと多くのスペクトル情報量を有する。選択肢として、1302のビデオシーケンス(画像列)は、シーケンス1302の各フレームが低スペクトル分解能データIS及び高スペクトル分解能データIQを含み、このシーケンスを捕捉して品位向上させて、シーン全体を高いスペクトル分解能で表現するビデオシーケンスを導出することができる。
【0040】
図1〜14に示す方法及びシステムは、図1〜8、11、13、及び14によって規定される適切なソフトウエアの制御下で動作する種々の標準的な処理装置によって実現できることは、当業者にとって明らかである。図15に、本発明の方法を実行するのに適した好適な処理ハードウエア930を機能ブロック図で示す。こうした処理装置930は随意的に、図9B及び図9Cに示すように、画像データを生成するために使用する上述した撮像装置の1つ以上に内蔵させるか、あるいは、図9A及び図12に示すように独立した装置とすることができる。図に示す装置930は一般に、処理ユニット1510、制御論理回路1520、及びメモリユニット1550を具えている。この処理装置は、タイマ1530及び入力/出力ポート1540も具えていることが好ましい。この装置は、処理ユニット1510に使用するマイクロプロセッサに応じて、コプロセッサ1560も具えることができる。制御論理回路1520は、処理ユニット1510と合同して、メモリユニット1550と入力/出力ポート1540との間の通信を取り扱うために必要な制御を行う。タイマ1530は、処理ユニット1510用及び制御論理回路1520用のタイミング基準信号を供給する。コプロセッサ1560は、暗号アルゴリズムが必要とする演算のような複雑な演算をリアルタイム(実時間)で実行する強化された能力を提供する。
【0041】
メモリユニット1550は、揮発性メモリ及び不揮発性メモリ、及びリードオンリー(読出し専用)メモリ及びプログラマブル(プログラム可能な)メモリのような異なる種類のメモリを含むことができる。例えば、図15に示すように、メモリユニット1550は、リードオンリーメモリ(ROM)1552、電気的に消去可能なプログラマブル・リードオンリーメモリ(EEPROM)1554、及びランダムアクセスメモリ(RAM)1556を含むことができる。異なるプロセッサ、メモリ構成、データ構造、等を用いて本発明を実施することができ、本発明は特定のプラットフォームに限定されない。
【0042】
図1〜8、11、13、及び14によって規定されるソフトウエアは、当業者にとって明らかな広範なプログラム言語で記述することができる。例えば、本発明によるソフトウエア・アルゴリズムは、周知のプログラム言語であるMATLAB(登録商標)数学ツールというプログラミング言語で記述されている。MATLAB(登録商標)言語で記述された好適なアルゴリズム用のソースコードを、本明細書に添付した付録A、B、及びCに示す。
【0043】
なお、以上の画像品位向上の説明は、可視光スペクトルの範囲内で見たシーンの撮像装置に重きを置いてきたが、本明細書に開示する技法は、紫外線、赤外線、X線、レーダー、超音波、等を含むあらゆる形態の放射の撮像に適用可能であるが、これらに限定されない。
【0044】
本発明は特定の好適な実施例に関連して説明してきたが、特許請求の範囲に記載したに本発明の範囲を逸脱することなしに、開示した実施例に対して種々の変更、置換、及び代替を行うことができることは明らかである。
【0045】
(付録A)
2次多項式のベクトルtを計算するための好適なアルゴリズムのMATLAB(登録商標)ソースコード
%ここでは”t”関数を計算するが、
%z1*z2のような項は無視して、z1^2, z2^2のような項のみを考える。
%これにより、近似精度は低下するが、効率は改善される。
function fsVect=nbhdToFS(a, nbhd, degree)
%積の項なし
nV=nbhd(:);
nLen=prod(size(nV));
fsVect=zeros(nLen*degree, 1);
fsVect(1:nLen)=nV;
for deg=2:degree
fsVect((((deg-1)*nLen)+1):(deg*nLen)) = ...
nbhd().*...
fsVect((((deg-2)*nLen)+1):((deg-1)*nLen));
end
【0046】
(付録B)
好適な学習アルゴリズムのMATLAB(登録商標)ソースコード
%以下は、品位向上用の係数を学習させるためのMATLABソースコードである。
%polyLearnedModel構成器
function a=polyLearnedModel(fctr, nbhdSize, degree, lrSeq, hrSeq)
a.null=”;
if 0==nargin
%Create a dummy model
a.fctr=0;
a.nbhdSize=[1, 1];
a.degree=-1;
a.params=[];
b=enhancementModel(‘polyLearnedModel’, [1, 1]’);
a=class(a, ‘polyLearnedModel’, b);
elseif 1==nargin
if isa(fctr, ‘polyLearnedModel’);
a=fctr;
else
errstr=[num2str(fctr), ...
‘Not polyLearnedModel object’];
error(errstr);
end
elseif 5==nargin
a.fctr=fctr;
a.nbhdSize=nbhdSize;
a.degree=degree;
a.params=[];
dummy=polyLearnedModel;
params=interpKernel(fctr, nbhdSize, degree, lrSeq, hrSeq, dummy);
b=engancementModel(‘polyLearnedModel’, params);
a.params=params;
a=class(a, ‘polyLearnedModel’, b);
else
error(‘Argument wrong type’)
end
return
function kernVals=...
interpKernel(fctr, nSize, degree, lrSeq, hrseq, modl)
%正規化及びDC成分の減算を可能にするため変数
%DCSUB=0;
epsilon=2^(-26);
%epsilon=0
lrSeqSize=size(lrSeq);
hrSeqSize=size(hrSeq);
if prod((fctr*lrSeqSize)==hrSeqSize)&(2==length(lrSeqSize))
;%Ok
elseif prod((fctr*lrSeqSize(1:2))==hrSeqSize(1:2))&...
(length(lrSeqSize)<=3)
;%Ok
else
error(‘Images sequences improper sizes with respect to fctr’)
end
% ’In polyLearnedModel構成器 fvSize’
fvSize=size(nbhdToFS(modl, zeros(nSize), degree));
featVectLen=prod(fvSize);
fvMat=zeros([featVectLen, featVectLen]);
outMat=zeros([featVectLen, fctr^2]);
inRows=1:(lrSeqSize(1)-(nSize(1)+1));
inCols=1:(lrSeqSize(2)-(nSize(2)+1));
nRad=floor((1/2)*nSize);
hrOffset=(fctr*(nRad-(~mod(nSize, 2))))+...
(~mod(nSize, 2)).*[fctr/2, fctr/2]+1;
if (legth(lrSeqSize)<3)
numIms=1;
elseif (3==length(IrSeqSize))
numIms=lrSeqSize(3);
else
error(‘Images sequences improper sizes’)
end
for imInd=1:numIms
if (length(lrSeqSize)<3)
lrIm=lrSeq;
hrIm=hrSeq;
elseif (3==length(lrSeqSize))
lrIm=lrSeq(:, :, imInd);
hrIm=hrSeq(:, :, imInd);
end
for inR=inRows
for inC=inCols
inN=getNbhd(inR, inC, lrIm, nSize);
featVect=nbhdToFS(modl, inN, degree);
fvMat=fvMat+featVect*featVect’;
out=fctr*[(inR-1), (inC-1)]+hrOffset;
outN=getNbhd(out(1), out(2), hrIm, [fctr, fctr]);
outMat=outMat+featVect*outN(:)’;
end
end
end
‘cond’
cond(fvMat)
‘rank’
rank(fvMat)
‘size’
size(fvMat)
if (abs(max(fvMat(:)))>epsilon)|...
(abs(min(fvMat(:)))>epsilon)
%SVDを用いて解く
[U, S, V]=svd(fvMat);
%実際に0に近い固有値は消去しなければならない。
Nz=(abs(S)>epsilon);
InvS=(ones(size(nz))./((~nz)+S)).*nz;
KernVals=V*invS*U’*outMat;
Else
%非常に特異なfvMat
kernVals=zeros(featVectLen, fctr^2);
end
return
% [“, num2str()]
function inNbhd=getNbhd(iR, iC, im, imNbhdSize)
indsR=(iR-1)+(1:inNbhdSize(1));
indsC=(iC-1)+(1:inNbhdSize(2));
inNbhd=im(indsR, indsC);
return
【0047】
(付録C)
学習係数を用いて画像解像度を向上させる好適なアルゴリズムのMATLAB(登録商標)ソースコード
function newIm=improveImage(modl, im)
nSize=modl.nbhdSize;
imDize=size(im);
fctr=modl.fctr;
if (nSize(1)>imSize(1))|(nSize(2)>imSize(2))
error(‘Neighborhood larger than image,')
end
nbhdRad=floor((1/2)*nSize);
eImSize=fctr*(imSize-nSize+ones(nSize)));
newIm=zeros(eImSize);
nbhdsRow=1:(imSize(1)-nSize(1)+1);
nbhdsCol=1:(imSize(2)-nSize(2)+1);
nbhdRInds=0:(nSize(1)-1);
nbhdCInds=0:(nSize(2)-1);
for nR=nbhdsRow
for nC=nbhdsCol
nbhd=im(nR+nbhdRInds, nC+nbhdCInds);
newValues=nbhdFunc(nbhd, modl);
newBlock=reshape(newValues, [fctr, fctr]);
newIm(fctr*(nR-1)+(1:fctr), ...
fctr*(nC-1)+(1:fctr))=newBlock;
end
end
return;
function newVals=nbhdFunc(nbhd, modl)
%DCSUB=0;
nSize=size(nbhd);
degree=get(modl, ‘degree’);
fsVect=nbhdToFS(modl, nbhd, degree);
newVals=((fsVect)’*(modl.params))’;
return
【図面の簡単な説明】
【0048】
【図1】本発明により処理される画像データの好例を示す図である。
【図2】本発明により画像データの品位を向上させる好適な手順を示すフロー図である。
【図3】本発明により処理される音声データの好例を示す図である。
【図4】本発明により画像データの品位を向上させる好適な手順を示すブロック図である。
【図5】本発明により音声データの品位を向上させる好適な手順を示すフロー図である。
【図6】本発明により音声の品位を向上させる追加的な好適な手順を示すブロック図である。
【図7】本発明により処理される画像データの好例を示す図である。
【図8】本発明により処理される画像データの追加的な好例を示す図である。
【図9A】本発明により画像データの品位を向上させるシステムを示す図である。
【図9B】本発明により画像データの品位を向上させる追加的なシステムを示す図である。
【図9C】本発明により画像データの品位を向上させる他のシステムを示す図である。
【図10A】本発明により画像データの品位を向上させるさらに他のシステムを示す図である。
【図10B】本発明により画像データの品位を向上させるさらに他のシステムを示す図である。
【図11】本発明により処理されるビデオシーケンスの好例を示す図である。
【図12】本発明により画像データを生成するシステムを示す図である。
【図13】本発明により処理されるビデオ及び静止画像データの好例を示す図である。
【図14】本発明により画像データの品位を向上させる好適なシステムを示す図である。
【図15】図1〜14に示すシステム及び手順に用いる好適な処理装置を示すブロック図である。
【背景技術】
【0001】
(関連出願のクロスリファレンス)
本願は、米国特許暫定出願番号60/367,324、発明の名称”Enhanced Imaging Using Self-Training Sensors”、2002年3月25日出願にもとづいて優先権を主張し、この特許出願全体を参考文献として本明細書に含める。
【0002】
(連邦政府による資金提供を受けた研究開発の記載)
本発明は、部分的に、米国科学技術財団の研究助成番号IIS-00-85864の下に米国政府からの支援を受けたものである。従って、米国政府は本発明において一定の権利を有する。
【技術分野】
【0003】
(発明の背景)
ビデオカメラあるいはスチル(静止画)カメラのような撮像装置(イメージャ)は、シーン(被写体の光景)から出る光を受光して検出することによってシーンを撮像する。シーン中の特定点から入射する光信号は、輝度、波長スペクトル、及び偏光のような特性を有する。これに加えて、撮像装置が受光する全視野は、撮像装置が光を受光する角度によって変化する。もちろん、特定の光線または光束を受光する角度は、シーンの光が出る点の位置に依存する。
【0004】
多くの応用が、視野の精密かつ正確な測定を必要とする。例えば、イメージベース・レンダリング(Image Based Rendering:IBR)では、シーンを撮像し、そして再レンダリングして、シーンの周りの航法(ナビゲーション)を模擬する。空間及び方向の両方についての全視野の測定は、シーンの幾何学的構造の抽出を可能にする。他の例として、各材料から反射した光、及び各照明源から出る光は、それ自身の特徴的なスペクトル曲線及び偏光特性を有する。高いスペクトル分解能によって、異なる種類の材料及び照明を識別すること、及び/または異なる模擬照明下でシーンを再レンダリングすることが可能になる。シーン中の点からの光の偏光を測定することは、シーン中の点に存在する材料の種類に関するさらなる情報を提供する。偏光情報も、屋外のシーンをレンダリング(表示画像作成)する際に気象条件の影響を補償するため、及び深度、即ち撮像装置からシーン中の点までの距離の測定を手助けするために用いられてきた。以上の例に見られるように、視野を精密かつ正確に測定するシステムには、種々の有益な応用がある。
【0005】
しかし、従来の撮像装置は、輝度分解能、スペクトル分解能、波長、及び偏光−即ち、輝度、波長、及び偏光の差を見分ける能力が限られ、そして、空間解像度−即ち、シーン中の各点の位置の相違を見分ける能力も限られている。例えば、現在は、空間解像度の高い画像を捕捉することが可能なディジタル・スチルカメラが存在する。しかし、関係するデータ量が多いので、これらのカメラは高解像度のビデオを生成することができない。他方では、30フレーム/秒という上等な時間分解能でビデオを捕捉することができる廉価なカメラが存在する。しかし、こうしたビデオカメラは、低い空間解像度しか提供しない。高い時間分解能かつ高い空間解像度を有する撮像装置を設計することは、特に困難である。多次元の高解像度に関連する技術的問題に加えて、基本的な物理的問題がしばしば存在する。例えば、暗い光条件はより長い露光時間を必要とし、時間分解能がより粗くなり、従って、動体の撮像における「ぼけ」を生じさせる。
【0006】
上述した問題に応える1つの方法は、視野の異なる態様を測定するために、「併置」する(即ち、同じ視点を有する)複数のセンサを使用する。例えば、熱撮像装置、距離計、及び可視光カメラを併置する。一部の場合は、複数センサの方法によって、露光と時間分解能との間のトレードオフのような、単一のセンサに存在する物理的限界の一部を克服することができる。しかし、こうした方法は、追加的な撮像リソースを必要とする。利用可能なリソースが限られている状況−例えば、固定数の画素、固定量のメモリ、及び露光と時間とのトレードオフが存在する状況では、これらのリソースをできる限り効率的に使用することが望ましい。
【0007】
視野が、互いに無関係な任意数の輝度の集合であるとした場合には、より大規模で、より高速で、より高密度にまとめた複数のセンサを構成すること以外の解決法に、少しの可能性が存在する。しかし、視野には、膨大な構造及び冗長性が存在する。例えば、視点が少し移動すると、シーンの見え方は一般に、予測可能なように変化する。これに加えて、単色の材料を見渡したスペクトル応答は、比較的一様であることが多い。さらに、シーン中の物体の動きは、規則的で予測可能なことが多い。例えば、大部分の物体は堅く、そして多くの場合に、物体はほぼ一定速度で移動しがちである。これらの要因のすべてが、視野内に大きな冗長性を生じさせる。その結果、視野の領域内のあらゆる点で視野をサンプリング(標本化)して、視野を再構成、近似、あるいは予測することは、通常は必要でない。
【0008】
上述した視野における冗長性を利用するために、この冗長性に関するいくつかの仮定をすることができる。例えば、(内挿)補間及びサンプリング理論は、信号の規則性についての仮定を用いて、限定数のサンプルからこの信号を復活させる。特によく知られている例として、ナイキスト理論は、サンプリングする信号の帯域が限られている−即ち、この信号が有限範囲内の周波数成分を有するものとすれば、最大限必要な信号サンプリング周波数は限られる、ということを述べている。画像に関しては、こうした有限周波数範囲の要求は、端部及び角のような不連続部分に許される鮮鋭度についての制限となる。ナイキスト理論に用いられる関数は三角関数であるが、画像の補間のために多項式も用いることができる。簡単な例は、双線形補間及び双三次元(bi-cubic)補間を含む。不都合なことに、簡単な補間技法から可能な改善は限られている。特に、こうした技法によって提供される解像度の増加は一般に、かなり小幅である。さらに、自然画像は、補間技法に固有の数学的仮定に従わないことが多いので、こうした方法は美観上不快なアーティファクト(歪像)を生じさせ得る。
【0009】
画像を粗くサンプリングして結果的なデータを有効に補間することは、ローパス(低域通過)フィルタとして作用する。従って、画像の空間解像度を増加させることは、画像の「ぼけを減らす」問題として表現することができる。擬似逆(Pseudo Inverse)フィルタ及びウィーナ・フィルタのような鮮鋭化フィルタは、ガウス性のぼけを減らすために用いられてきた。以前に用いられた他の方法は、ベイズ分析、端部に沿った補間、適応フィルタ処理、ウェブレット分析、フラクタル補間、凸集合上への投影、変分法、及びレベルセットを含む。こうした方法は基本的な補間を改善するが、これらの方法は局所的な画像構造を用いるか、あるいは視野の挙動に先立って全体を仮定したものを適用する、即ち視野の規則性についての仮定を適用するに過ぎないので、これらの方法が冗長性を利用する能力は幾分限られる。
【0010】
サンプリング及び補間に関するものは、「超解像」として知られている技法があり、この技法では、比較的粗いサンプリングを複数回実行して、サンプリングの有効分解能を改善する。上述した補間法のように、超解像は、視野の規則性についての仮定を行い、近年、理論的限界があることが示されている。
【0011】
広範囲にわたる視野を捕捉するための、種々のマルチカメラ(多カメラ)システムが提案されている。こうしたシステムは一般に、補間画像のワーピング(ねじり)を用いて、欠損したデータを埋めている。例えば、ハイブリッド撮像では、異なる特性−例えば異なるフレームレートまたは空間解像度を有する複数のカメラを用いて画像を捕捉する。視野の大部分は、計算されたカメラの幾何形状にもとづいて、補間と画像ワーピングとの組合せを用いて埋められる。
【0012】
追加的な方法は、テクスチャ合成及びシーンの統計量にもとづくものである。視野における冗長性の構造についての数学的仮定を行うのではなく、統計量またはパターン分析を用いて、冗長性をモデル化して利用する。1つの技法は、異なる尺度での画素の相関を用いる。他の方法は、毎日のシーンの、種々の異なるテクスチャ及び種々の異なる画像を用いて、モデルを「学習」させる。この学習の方法では、学習アルゴリズムが、画像における冗長性を抽出し利用して、画像を改善して画像の解像度を増加させることができるようにすべきである。人間の顔の高解像度画像を低解像度のデータから合成する周知の「hallucinating faces(幻覚顔)」法におけるように、画像の種類の領域が非常に限られていれば、こうした学習の方法が解像度を劇的に改善する。しかし、より広範な領域をモデル化する試みは一般に、機械学習の標準性の問題が生じる。例えば、モデルを非常に特別な領域で学習させれば、このモデルは特定の学習データに過剰に適合して、一般性に乏しくなる。例えば、解像度向上アルゴリズムを顔で学習させて建物に適用すれば、このアルゴリズムは、アーティファクトを生じさせやすく、そして品位向上の結果が低度になりやすくなる。他方では、モデルを非常に広範な画像の種類の領域で学習させれば、このモデルは、ほとんどの画像に生じるごく一般的な冗長性を学習するに過ぎない。その結果、広範な学習を行ったモデルは大部分の領域についてある程度の利益をもたらすが、いずれの領域についても格別良好な結果はもたらさない。
【0013】
(発明の概要)
従って、本発明の目的は、ハードウエア資源(リソース)を効率的に用いつつ、画像データ(例えばビデオ及び静止画像データ)及び音声データのようなデータの品位を向上させる方法及びシステムを提供することにある。
【0014】
本発明の他の目的は、こうしたデータ品位の向上を、視覚的に不快なアーティファクトのような不所望な副作用を回避する方法で提供することにある。
【0015】
本発明のさらに他の目的は、広く異なる種類の画像、音声、等に対して良好な性能を有するデータ品位向上を提供することにある。
【0016】
これら及び他の目的は、品位を向上させるデータ集合の一部分で学習させた品位向上関数によって達成される。例えば、システムがシーン全体(全景)から低品位の画像データを捕捉して、このシーンの狭い視野から高品位の画像データを捕捉することができる。シーンの一部分を表現する高品位の画像データ、及びこのシーンの同一部分を表現する低品位の画像データの対応部分を、画像データのこれらの集合にもとづいて品位向上関数を学習させる学習アルゴリズムによって処理する。換言すれば、前記品位向上関数が1つ以上のパラメータを有して、前記品位向上関数が、前記低品位画像データの前記部分から、前記高品位画像に非常に近いデータ集合を導出することができるように、前記学習アルゴリズムは、これらのパラメータのうちどの値が最適であるかを決定する。前記品位向上関数は、シーン全体の前記低品位画像によって表現されるのと同じシーンから取り出した高品位及び低品位のデータ、即ち品位を向上させるデータそのもので学習させるので、前記品位向上関数は最も関係するデータ集合向きに最適化される。学習後には、前記品位向上関数を用いて、残りの低品位データを品位向上させる。このシステムはこのようにして、従来のシステムに関連する欠点(例えば新たな領域についての貧弱な性能)をなくして、学習で品位向上させる撮像の利益を提供する。
【0017】
上述した手順は画像データに限らず、オーディオ(即ち音声)データにも適用することができる。サンプリングしたオーディオ信号を品位向上させるために、信号を表現する低品位のデータ集合を、同じ信号の一部分を表現する高品位のデータ集合と共に捕捉する。信号の一部分を表現する前記高品位のデータ集合、及び前記低品位のデータ集合のこれに対応する部分を学習アルゴリズムによって処理し、この学習アルゴリズムは、前記品位向上関数の1つ以上のパラメータの最適な学習値を定める。前記品位向上関数が、前記低品位のデータ集合から、前記高品位のデータ集合に非常に近いデータ集合を導出する動作を行うように、前記学習パラメータを選択する。一旦学習を実行すると、前記品位向上関数を用いて、残りの前記低品位データを品位向上させる。
【0018】
本発明の追加的な態様によれば、品位が変化する画像列を用いて、品位向上関数を学習させ、そしてこの品位向上関数を用いて、前記画像列中の低品位画像を品位向上させることができる。シーンの高解像度画像、及び同じシーンの低解像度画像を学習アルゴリズムによって処理して、品位向上関数の1つ以上のパラメータの学習値を定める。これらのパラメータ値によって、前記品位向上関数が、前記低品位画像から、前記高品位画像に非常に近い画像を導出する動作を行うように、前記パラメータの学習値を定める。一旦、前記品位向上関数のパラメータを学習させると、前記品位向上関数を用いて、同じシーンの追加的な低品位画像を処理して高品位画像を導出する。
【0019】
本発明のさらなる目的、特徴、及び利点は、以下の図面を参照した詳細な説明より明らかになり、これらの図面は本発明の実施例を示す。
これらの図面を通して、特に断わりのない限り、同一参照番号及び符号は、実施例における同じ形状、素子、構成要素、または部分を表わす。
【0020】
(実施例の詳細な説明)
本発明によれば、同じシーンまたは信号の低品位及び高品位のサンプリング(標本化)を行って、低い品位を有するデータ、並びにこれに対応する高い品位を有するデータを生成することによって、データ品位を向上させることができる。これらの低品位データ及びこれに対応する高品位データは共に、シーンまたは信号の同一部分を表現し、これらのデータを用いてデータ品位向上関数を学習させて、次にこのデータ品位向上関数を用いて、シーンまたは信号の残りの部分を表わす追加的な低品位データの品位を向上させることができる。本明細書で用いる「品位」とは、例えば、データの空間解像度を称することができるが、空間解像度に限定する必要はない。「品位」は、実際には、データがシーン、視野、オーディオ信号、等を表現する精度及び/または正確性に関するあらゆる特性とすることができる。例えば、品位は、輝度分解能(例えば画素当たりのビット数)、スベクトル分解能(例えば、光または他の放射を異なるスペクトル成分に分解する際のスペクトル成分の数)、偏光分解能(例えば、光または他の放射を偏光成分に分解できる精度)、時間分解能(例えば、1秒当たりのビデオフレーム数または1秒当たりのオーディオサンプル(標本)数)、信号レベル分解能(例えば、オーディオ・データストリームにおけるサンプル当たりのビット数)、及び/または信号対雑音比である。品位とは、例えば、画像の次の属性を称することもできる:
画像中に出現する端部(エッジ)が、シーン中の対象物(オブジェクト)の端部の実際位置を表現する精度、
画像が、入射する視野内に存在する実際の色を表現する精度、及び/または、
入射する視野の明るさのコントラストまたは色のコントラストを画像中に表現する精度。
【0021】
図2及び図4に、本発明により画像データの品位を向上させる好適な手順を示す。図に示す手順では、シーンを撮像して、低い品位を有するこのシーンの画像を生成する(ステップ202)。シーンの一部分は、高品位の画像データ−即ち、ステップ202で生成したデータよりも高い品位を有するデータを生成すべく撮像する(ステップ204)。図1に、こうして生成した画像データの集合の好例を示す。図に示すデータ集合は、シーンの広い視野の、低い空間解像度の384×384画素の画像IS、及びこのシーンの狭い視野の、高い空間解像度の256×256画素の画像IQを含む。ISの中央の128×128画素の部分集合(図中の白い四角形で囲んだ部分)を
で表わし、この部分は、高い空間解像度の画像IQを低い解像度にしたものに相当する。「空間解像度」とは、例えば、遠近法の投影による単位深さにおける平面上の単位面積当たりの画素数を称することができる。従って、画像IQは画像ISよりも総画素数が少なく、画像IQはISよりも高い解像度を有する。選択肢として、低解像度のデータ集合
は、低解像度の全体画像ISの一部分を選択することによって、あるいは、高解像度画像IQを低解像度画像ISの解像度に劣化させることによって得ることができる。例えば、平均化のためのガウスぼかしカーネル(Gaussian blur kernel)を高解像度データに適用し、これに続いて、低解像度画像を模擬するためのサブサンプリング(副標本化)を行うことができる。代表的なガウスぼかしカーネルは、要素の値が正規化した二次元ガウス関数G=Kexp((-x2-y2)/σ2)にもとづく(例えば9×9)正方行列である。画像は、画素毎に新たな値を計算することによってぼかされ、これらの新たな値は、当該画素を囲む正方形状の近傍(例えば9×9の正方形状の近傍)の全画素の加重平均である。加重平均を計算するために、前記近傍内の各画素の値に、ぼかしカーネルの対応する要素の値を乗じて、結果的な積を加算する。結果的な積の総和が、中心画素の新たな値となる。画像の各画素を上述した手順によって個別に処理して、新たなぼかし画像を生成する。
【0022】
高品位データIQ、及びこれに対応する低品位画像ISの部分集合
を学習アルゴリズム402によって処理して(ステップ206)、品位向上関数406の1つ以上のパラメータの学習値404を決定して、この決定は、学習パラメータ404を品位向上関数406に用いる場合に、関数406が、低品位データISの部分集合
から高品位データIQに非常に近いデータを導出する動作をするように行う。一旦、品位向上関数の適切なパラメータを学習させると、結果的な最適化された関数を用いて、低品位のデータ集合ISの残り部分IRを処理して、シーンの残り部分を表現するデータ集合IR’を導出することができる(ステップ208)。高品位のデータ集合IQとIR’とを組み合わせて(ステップ408)、シーン全体の高品位画像IHを導出することができる。
【0023】
選択肢として、低品位データの部分集合
及び高品位のデータ集合IQを、1つ以上の「学習対」−即ち画像データの集合内の種々の異なる領域から取り出した小部分を選択することによって処理することができる。図7に、図1に示す低品位画像及び高品位画像
及びIQのデータ集合から導出することのできる多数の学習対を示す。図7に示す、低解像度の、5×5画素の画像パッチ(片)PS1、PS2、PS3、及びPS4は
から取り出したものであり、これらに対応する高解像度の、10×10画素の画像片PQ1、PQ2、PQ3、及びPQ4はIQから取り出したものである。結果的なパッチの対−即ち(PS1,PQ1)、(PS2,PQ2)、(PS3,PQ3)、及び(PS4,PQ4)は、学習アルゴリズム402用の学習データを提供する。
【0024】
品位向上関数406は、(学習アルゴリズム402において)一組の学習対(PS1,PQ1),...,(PSK,PQK)への多項式の回帰を適用することによって学習させて、ここにKは学習対の数を表わす。まず、学習アルゴリズム402は、25画素の低解像度パッチPSnの値を並べて、25要素の行ベクトルWSnを形成する。これら25画素の値は都合の良い順に並べることができるが、すべてのパッチについて同じ順序を用いる。次に、各パッチのベクトルを並べて、次の行列にする:
【数1】
ここに、Tはベクトルまたは行列の転置を表わす。
WS1は1番目の、低解像度の、5×5画素のパッチPS1を表わすベクトルであり、そして、zi(WS1)(i=1,...,25)は、このパッチPS1のi番目の値を表わすものとする。学習アルゴリズム402の効率を改善するために、アルゴリズム402は2次の多項式のみを考えることが好ましい。従って、tをすべての2次及びより低次の単項式のリストあるいはベクトルとし、即ちtは、(a)値1、(b)各画素の値、及び(c)パッチPS1の種々の画素を互いに掛け合わせるかあるいは二乗することによって形成することのできるすべての2次の単項式を含み、次式のようになる:
【数2】
【0025】
低解像度のパッチ毎に、これらの単項式の行ベクトルを形成する。例えば、パッチPS1に対応する行ベクトルは、t(WS1):=(t1(WS1),...tp(WS1))となる。図8に示すように、パッチPS1が25画素を有すれば、これに対応する行ベクトルt(WS1)は651個の要素を有する。各パッチについての行ベクトルを並べて、次式の行列にする:
【数3】
【0026】
図に示す例では、空間解像度の4:1の向上を実行している。従って、与えられた低解像度パッチ内の各低解像度画素が、この低解像度パッチに対応する高解像度パッチ内の4つの高解像度画素に対応する。例えば、図8に示すように、5×5のパッチPS1内の画素802が、このパッチPS1に対応する高解像度パッチPQ1内のそれぞれ位置a、b、c、及びdにある4つの画素804、806、808、及び810に対応し、各位置a、b、c、及びdは、低解像度パッチPS1の中央にある画素802の位置との関係で規定される。高解像度画素804、806、808、及び810は、数学的にはそれぞれ(WQ1)a、(WQ1)b、(WQ1)c、及び(WQ1)dのように表わすことができる。図に示す例では、高解像度パッチPQ1の中央にある4つの画素804、806、808、及び810のみを学習用に用いて、高解像度パッチPQ1の残りの画素は用いる必要がない。最終的には、品位向上関数の集合の学習させる各関数を用いて、低解像度パッチ全体に対して前記4つの高解像度画素のうちの1つを取り出す動作を行い、パッチ全体はパッチの中央にある画素の近傍として見ることができ、取り出した1つの画素を、前記近傍の中央にある低解像度画素と置き換える。例えば、5×5の低解像度の近傍/パッチにもとづく4:1の空間解像度の向上の場合には、4つの別個の解像度向上関数fa、fb、fc、及びfdが、低解像パッチの全体に対して、4つの画素位置a、b、c、及びdにある、対応する4つの高解像度画素のうちの1つを取り出す動作を行う。学習アルゴリズム402は、品位向上関数fa、fb、fc、及びfdが最適化されていれば−即ち、これらの関数の係数が適切に選定されていれば、低解像度パッチ(例えば図8に示すPS1)内の全画素の値から所定の高解像度画素(例えば画素804)を取り出すことができるべきである、という原理で動作する。与えられた画素位置m(m=a、b、c、またはd)に対する係数が行ベクトルCm=(cm1,...,cmk)Tを形成し、ここで、ベクトルCm中の係数の値は、どの高解像度画素を取り出すか、即ち、取り出す画素が位置a、b、c、またはdのいずれにあるかに依存する。換言すれば、4つの高品位画素の位置a、b、c、またはdは異なる係数の組を有し:即ち、関数fa、fb、fc、及
びfdに対しそれぞれCa、Cb、Cc、及びCdを有する。各々が低解像度パッチ及び対応する4つの高解像度画素を有する複数の学習対を用いることが好ましく、これら4つの高解像度画素はそれぞれ位置a、b、c、及びdにある。すべての学習対から取り出した、与えられた画素位置mに関連する値を用いて、この画素位置mに存在するそれぞれの高品位画素の値を並べて、次式の行列にすることができる:
【数4】
ここに、m=a、b、c、及びdである。
Cmの係数が適正に定められているものとすれば、これら4つの画素位置のいずれか1つ−即ち、与えられた任意のmについて、Cmは次の行列方程式が解けるものであるべきである:
【数5】
(4)式の形の行列方程式におけるベクトルCmに対する解を見つけるための周知の線形代数技法がいくつか存在する。例えば、t(WS)Tt(WS)が可逆であれば、学習アルゴリズム402は、Cmを次式のように計算することができる:
【数6】
(5)式は、(4)式におけるCmに対する最小二乗解を提供し−即ち、Cmに対する、(4)式の左辺と右辺の二乗差の総和を最小にするベクトル要素値の集合を提供する。
【0027】
本実施例では、学習段階の出力結果は、4つの係数ベクトルCa、Cb、Cc、及びCdである。従って、これらのベクトルCa、Cb、Cc、及びCdは、4つの多項式品位向上関数それぞれfa、fb、fc、及びfdの係数を含み、これらの関数は、任意に与えられた5×5の低解像度パッチL上で、このパッチLの近傍の中央にある、対応する4つの高解像度画素Hmを取り出す動作を行うことができ、ここに、
【数7】
m=a、b、c、及びdである。図1に示す画像部分集合IRのような低解像度画像データ集合または部分集合を品位向上させるために、品位向上アルゴリズム(図2のステップ208)は一般に、データ集合IRの最初の5×5パッチL(例えば、図1に示す、左上隅のパッチL)を処理して、高解像度画像データ集合IR’の、パッチLに対応する近傍の中心にある4つの高解像度画素Ha、Hb、Hc、及びHdを生成することによって始まる。次にこのアルゴリズムは、低解像度画素1つ分だけ(例えば右に)移動することによって次のパッチを処理して、4つの高解像度画素の隣接組を生成する。換言すれば、続けて処理する低解像度パッチどうしの間に、例えば4×5画素の重複領域が存在し、これにより、生成される高解像度画像データ集合IR’がシーン領域を完全にカバーすることを保証することが好ましい。この重複は、垂直方向及び水平方向共に存在すべきである。
【0028】
なお、以上の説明は異なる空間解像度を有するデータ集合に重きをおいてきたが、図2及び図4に示す手順は、異なる輝度分解能(例えば、異なる数のグレーレベル(輝度階調)及び/または画素当たりのビット数)を有するデータ集合を処理するために用いることもできる。再び図1、図2、及び図4を参照して説明する。低品位画像ISが低い輝度分解能を有する画像であり、高品位画像IQが高い輝度分解能を有する画像であれば、共にシーンの同一部分を表現する、高品位画像IQ及び低品位画像ISの最初の部分集合
を学習アルゴリズム402によって処理して(ステップ206)、品位向上関数406のパラメータ404を定める。品位向上関数406はこのように最適化され、従って、低い輝度分解能の画像ISの残りの部分集合IRの分解能を向上させて、シーンの残り部分の高い輝度分解能の画像IR’を導出するために用いることができる。次に、高品位画像IQとIR’とを組み合わせて(ステップ408)、シーン全体の改善された画像IHを提供することができ、この画像は、最初に捕捉したシーンの低品位画像ISよりも高い輝度分解能を有する。
【0029】
図9Aに、本発明による品位向上用の高品位及び低品位のデータを収集する好適なシステムを示す。図に示す撮像システムは、比較的広い視野908を有するが比較的低品位の(例えば空間解像度または輝度分解能が低い)第1撮像装置902と、より狭い視野910を有するが高品位の(例えば空間解像度または輝度分解能が高い)第2撮像装置904と、ビームスプリッタ906とを具えている。ビームスプリッタ906は、入射光を、低品位撮像装置902及び高品位撮像装置904の両方に指向させて、これらの撮像装置902及び904を用いて、図1に示す低品位画像IS及び高品位画像IQを生成することができる。選択肢として、このシステムは、図1、図2、及び図4を参照して上述したデータ品位向上を実行する処理装置930を具えることもでき、処理装置930は例えば、コンピュータまたは特定目的の処理論理回路で構成することができる。その代わりに、あるいはこれに加えて、処理装置930は撮像装置902及び904の一方または両方に内蔵させることができる。
【0030】
図9Bに、学習アルゴリズム及び上述した品位向上手順に用いる画像データを生成する好適なシステムを、追加的に示す。図に示すシステムは、カメラ912及び曲面鏡920を具えて、これらはシーンの広角像を提供する。鏡920は、例えば放物面鏡とすることができ、低解像度(低品位)の視野914、高解像度(高品位)の視野918、及び中位の解像度(品位)の視野916を提供する。高解像度の視野918及び/または中位の解像度の視野916から収集したデータを劣化させて、元々捕捉した高解像度及び中位の解像度のデータと組み合わせて用いる低解像度の学習データを提供することができる。選択肢として、図9Aを参照して上述した処理装置930をカメラ912内に内蔵させることができる。
【0031】
図9Cに、多解像度の撮像システムの追加的な例を示す。この撮像システムは、低解像度部分928及び高解像度部分926のあるCCDアレイ924を有するカメラ922を具えている。高解像度部分926は高解像度の視野910内のデータを捕捉し、低解像度部分928は低解像度の視野908からのデータを捕捉する。撮像装置922は、高解像度部分926から、その視野910の低解像度データを直接取得しないが、この高解像度部分910から収集した前記視野の高解像度データを上述したように劣化させて、CCDアレイ924の高解像度部分926によって収集した高解像度データと組み合わせて用いる低品位の学習データを導出することができる。
【0032】
なお、以上の例は、多項式回帰にもとづく学習アルゴリズムに重きをおいてきたが、同じシーンからの低解像度データ及び高解像度データ上での学習の技法はこうした学習アルゴリズムに限定されない。実際には、回帰を用いてデータ品位向上関数のパラメータを調整するあらゆる学習アルゴリズムを用いることができる。適切なアルゴリズムの追加的な例は、当業者には良く知られた次の周知の学習アルゴリズムを含む:ベイズ決定法、最大尤度法、線形判別法、ニューラルネットワーク、遺伝的プログラミング、及び支持ベクトルマシンのようなカーネル法。
【0033】
本発明による品位向上手順は、音声/オーディオデータを品位向上させるために用いることもでき、これを図3、5、及び6に示す。図に示す手順では、音声信号を検出して、低品位の音声データ集合ASを生成する(ステップ502)。低品位データ集合ASは、第1及び第2の音声部分
及びARを含み、これらは例えば時刻t1から時刻t2までに収集したデータ、及び時刻t2から時刻t3までに収集したデータである。高品位音声データの集合AQは、音声信号の、第1の低品位データの部分集合
を生成するために用いたのと同じ部分をサンプリングすることによって生成する(ステップ504)。例えば音声信号を、前記低品位のデータ集合AS(部分集合
及びARを含む)を導出するための22kHz、及び高品位音声データ集合AQを生成するための44kHzでサンプリングすることができる。その代わりに、あるいはこれに加えて、低品位データ集合ASの第1部分集合
を、高品位データAQを劣化させることによって−例えば2サンプル毎に1サンプルを消去することによって導出することができる。音声データの品位は、信号レベルの分解能−例えば1サンプル当たりのビット数によって規定することもできる。例えば、低品位データが1サンプル当たり8ビットを有して、高品位データが1サンプル当たり16ビットを有することができる。
【0034】
いずれの場合にも、高分解能(高品位)音声データAQ、及び低分解能(低品位)音声データの第1部分集合
を、学習アルゴリズム602用の学習対として用いて、品位向上関数606の最適化したパラメータ604を導出することができる(ステップ506)。例えば、品位向上関数606が多項式関数であれば、多項式の係数ベクトルCa、Cb、Cc等は学習アルゴリズム602によって導出される。いずれの場合にも、品位向上関数606の学習させたパラメータ604を一旦定めると、この品位向上関数を学習させたパラメータと共に用いて低品位音声データの第2部分集合ARを処理して、音声信号の残り部分を表現する高品位音声データAR’が導出される(ステップ508)。こうして導出した高品位音声データAR’を、高品位にサンプリングした音声データAQと組み合わせて(ステップ608)、音声信号全体を表現する高品位音声データAHの完全な集合を導出することができる。
【0035】
本発明の追加的な態様によれば、品位向上関数を、異なる品位−例えば異なる空間解像度を有する一組のビデオフレーム上で学習させることができ、このことを図11及び図14に示す。図に示す手順では、シーンを撮像して、第1の高品位画像1102(例えば高品位ビデオフレーム)を生成する(ステップ1402)。シーンを再び撮像して、第1の低品位画像/ビデオフレーム1104を生成する(ステップ1404)。高品位画像1102及び低品位画像1104を上述したような学習アルゴリズムにおける学習対として用いて、品位向上関数のパラメータを定める(ステップ1406)。1つ以上の低解像度フレーム(例えば低品位画像1106)が生成されると(ステップ1408)、品位向上関数を学習させたパラメータと共に用いて、追加的な低品位画像を処理して、追加的な高品位画像を導出することができる(ステップ1410)。しかし、図14は上述した手順を、追加的な低品位データを捕捉する前に学習アルゴリズムを適用するように示しているが、この学習アルゴリズムは、すべての、あるいは大部分の画像データを捕捉した後でも同じように容易に適用することができる。
【0036】
図10A及び図10Cに、図14に示す手順に用いる画像データを生成するための好適なシステムを示す。図10Aに示すシステムは、高解像度ビデオカメラ1002、低解像度ビデオカメラ1004、及び入射光を2つのカメラ1002及び1004に分配するためのビームスプリッタ1006を具えている。同じ入射ビームをカメラ1002及び1004の両方で撮像するので、システムは単一の視点1014を持っているものと考えることができる。選択肢として、高解像度カメラ1002を低いフレームレートにして、低解像度カメラ1004を高いフレームレートにすることができる。例えば、高解像度カメラ1002が1000×1000画素の空間解像度を有するビデオデータを1秒当たり3フレームのフレームレートで生成して、低解像度カメラ1004が500×500画素の空間解像度を有するビデオデータを1秒当たり30フレームのフレームレートで生成することができる。
【0037】
図10Aに示すシステムと同様に、図10Cに示すシステムは、高解像度ビデオカメラ1002及び低解像度ビデオカメラ1004を具えている。しかし、図10Cに示すシステムはビームスプリッタ1006を具えていない。むしろ、図10Cに示す2つのカメラ1002及び1004はそれぞれ、異なる視点1012及び1014を有する。カメラ1002及び1004の視点1012と1014とは近接していることが好ましく−特に、視点1012と1014とが撮像するシーンの深度(被写体深度)に比べて十分近接して、視差調整を少ししか、あるいは全く必要としないことが好ましい。図14に示す手順を用いて、カメラ1002及び1004によって生成した高解像度及び低解像度の画像(図14に示すステップ1402及び1404で生成した画像)を処理して、その上で、上述した品位向上関数を学習させて(ステップ1406)、低解像度カメラ1004によって生成されたさらなる低解像度画像を、前記品位向上関数によって品位向上させて、高解像度画像を導出する(ステップ1410)。品位向上させた画像の視点は通常、低解像度画像を生成するために用いた低解像度カメラ1004の視点に等しいかあるいは近接し、前記品位向上させた画像はこの低解像度画像から導出している。
【0038】
図10Bに、図14に示す手順に用いる画像データを生成するのに適したCCDアレイ1008を示す。図に示すCCDアレイ1008を用いて、個々の素子を(例えば4画素のグループに)一群にまとめて「超画素」1010を形成することによって、解像度を変化させてデータを生成することができる。各超画素内の4つの画素は、例えばこれら4画素の値を平均することによって一群にすることができる。こうした画素の一群化(クラスタリング)は有利である、というのは、装置の空間解像度は低下するが、一群化はCCDアレイ1008がより高いフレームレートでサンプリングを行うことを可能にする。画素はフレーム毎に一群化する必要はない。連続するフレームの解像度は−例えば、連続する9個の低解像度画像を高いフレームレートで捕捉し、これに続いて1つの高解像度画像を捕捉することによって、変化させることができる。図11及び図14を参照して上述したように、高解像度画像及び1つ以上の低解像度画像を用いて品位向上関数を学習させることによって、低解像度画像を品位向上させて高解像度画像を導出することができる。その結果、前記システムは高解像度のビデオを高いフレームレートで生成することができる。
【0039】
本発明によれば、画像データのスペクトル分解能も向上させることができる。図12に、高いスペクトル分解能の部分と低いスペクトル分解能の部分とを有する画像データを生成するシステムを示す。このシステムは、ビデオカメラ1202、ビームスプリッタ1204、スリット1206、第1レンズ1208、プリズム1210、第2レンズ1212、及びCCDアレイ1214を具えている。ビームスプリッタ1204は、入射光の一部を通過させてビデオカメラ1202に向けて、残りの光をスリット1206に向けて指向させて、スリット1206から狭いビーム1216が第1レンズ1208を通ってプリズム1210に入る。プリズム1210は、このビームの種々のスペクトル成分を異なる方向に指向させる。これらの成分は第2レンズ1212を通過して、CCDアレイ1214によって受光され検出される。CCDアレイ1214の結果的な出力は、スリット1206を通過する光の狭いビーム1216に存在する波長の高いスペクトル分解能の測定値である。ビデオカメラ1202がカラービデオカメラであっても、こうしたカメラは一般に、粗い赤色、緑色、及び青色(RGB)の情報を提供するに過ぎない。これとは対照的に、CCDアレイ1214によって受光した光はスリット1206及びプリズム1210を通っているので、この光に存在する種々の波長は、CCDアレイ1214全体にわたって水平方向に拡散されている。結果的なスペクトル情報は、CCDアレイ1214の水平次元の画素数と同数のスペクトル成分の測定値を含む。図13に、図12に示すシステムによって生み出されるビデオカメラを示す。ビデオカメラの各フレーム内には、カメラ1202によって生成された低品位(この場合は低いスペクトル分解能)画像ISが存在し、低品位画像ISは第1データ部分集合
及び第2データ部分集合IRを含む。各フレーム内には、CCDアレイ1214によって生成された高品位(この場合は高いスペクトル分解能)データ集合IQも含まれ、高品位データ集合IQは、低品位データ集合ISの第1部分集合
と同じ部分のシーンを表現する。図1に示す画像データIS及びIQと同様に、図13に示す画像データを、図2及び図4に示す学習及び品位向上手順に従って、例えば図12に示す処理装置930によって処理して、シーン全体を表現する画像を導出することができるが、低品位画像ISに存在するスペクトル情報量よりもずっと多くのスペクトル情報量を有する。選択肢として、1302のビデオシーケンス(画像列)は、シーケンス1302の各フレームが低スペクトル分解能データIS及び高スペクトル分解能データIQを含み、このシーケンスを捕捉して品位向上させて、シーン全体を高いスペクトル分解能で表現するビデオシーケンスを導出することができる。
【0040】
図1〜14に示す方法及びシステムは、図1〜8、11、13、及び14によって規定される適切なソフトウエアの制御下で動作する種々の標準的な処理装置によって実現できることは、当業者にとって明らかである。図15に、本発明の方法を実行するのに適した好適な処理ハードウエア930を機能ブロック図で示す。こうした処理装置930は随意的に、図9B及び図9Cに示すように、画像データを生成するために使用する上述した撮像装置の1つ以上に内蔵させるか、あるいは、図9A及び図12に示すように独立した装置とすることができる。図に示す装置930は一般に、処理ユニット1510、制御論理回路1520、及びメモリユニット1550を具えている。この処理装置は、タイマ1530及び入力/出力ポート1540も具えていることが好ましい。この装置は、処理ユニット1510に使用するマイクロプロセッサに応じて、コプロセッサ1560も具えることができる。制御論理回路1520は、処理ユニット1510と合同して、メモリユニット1550と入力/出力ポート1540との間の通信を取り扱うために必要な制御を行う。タイマ1530は、処理ユニット1510用及び制御論理回路1520用のタイミング基準信号を供給する。コプロセッサ1560は、暗号アルゴリズムが必要とする演算のような複雑な演算をリアルタイム(実時間)で実行する強化された能力を提供する。
【0041】
メモリユニット1550は、揮発性メモリ及び不揮発性メモリ、及びリードオンリー(読出し専用)メモリ及びプログラマブル(プログラム可能な)メモリのような異なる種類のメモリを含むことができる。例えば、図15に示すように、メモリユニット1550は、リードオンリーメモリ(ROM)1552、電気的に消去可能なプログラマブル・リードオンリーメモリ(EEPROM)1554、及びランダムアクセスメモリ(RAM)1556を含むことができる。異なるプロセッサ、メモリ構成、データ構造、等を用いて本発明を実施することができ、本発明は特定のプラットフォームに限定されない。
【0042】
図1〜8、11、13、及び14によって規定されるソフトウエアは、当業者にとって明らかな広範なプログラム言語で記述することができる。例えば、本発明によるソフトウエア・アルゴリズムは、周知のプログラム言語であるMATLAB(登録商標)数学ツールというプログラミング言語で記述されている。MATLAB(登録商標)言語で記述された好適なアルゴリズム用のソースコードを、本明細書に添付した付録A、B、及びCに示す。
【0043】
なお、以上の画像品位向上の説明は、可視光スペクトルの範囲内で見たシーンの撮像装置に重きを置いてきたが、本明細書に開示する技法は、紫外線、赤外線、X線、レーダー、超音波、等を含むあらゆる形態の放射の撮像に適用可能であるが、これらに限定されない。
【0044】
本発明は特定の好適な実施例に関連して説明してきたが、特許請求の範囲に記載したに本発明の範囲を逸脱することなしに、開示した実施例に対して種々の変更、置換、及び代替を行うことができることは明らかである。
【0045】
(付録A)
2次多項式のベクトルtを計算するための好適なアルゴリズムのMATLAB(登録商標)ソースコード
%ここでは”t”関数を計算するが、
%z1*z2のような項は無視して、z1^2, z2^2のような項のみを考える。
%これにより、近似精度は低下するが、効率は改善される。
function fsVect=nbhdToFS(a, nbhd, degree)
%積の項なし
nV=nbhd(:);
nLen=prod(size(nV));
fsVect=zeros(nLen*degree, 1);
fsVect(1:nLen)=nV;
for deg=2:degree
fsVect((((deg-1)*nLen)+1):(deg*nLen)) = ...
nbhd().*...
fsVect((((deg-2)*nLen)+1):((deg-1)*nLen));
end
【0046】
(付録B)
好適な学習アルゴリズムのMATLAB(登録商標)ソースコード
%以下は、品位向上用の係数を学習させるためのMATLABソースコードである。
%polyLearnedModel構成器
function a=polyLearnedModel(fctr, nbhdSize, degree, lrSeq, hrSeq)
a.null=”;
if 0==nargin
%Create a dummy model
a.fctr=0;
a.nbhdSize=[1, 1];
a.degree=-1;
a.params=[];
b=enhancementModel(‘polyLearnedModel’, [1, 1]’);
a=class(a, ‘polyLearnedModel’, b);
elseif 1==nargin
if isa(fctr, ‘polyLearnedModel’);
a=fctr;
else
errstr=[num2str(fctr), ...
‘Not polyLearnedModel object’];
error(errstr);
end
elseif 5==nargin
a.fctr=fctr;
a.nbhdSize=nbhdSize;
a.degree=degree;
a.params=[];
dummy=polyLearnedModel;
params=interpKernel(fctr, nbhdSize, degree, lrSeq, hrSeq, dummy);
b=engancementModel(‘polyLearnedModel’, params);
a.params=params;
a=class(a, ‘polyLearnedModel’, b);
else
error(‘Argument wrong type’)
end
return
function kernVals=...
interpKernel(fctr, nSize, degree, lrSeq, hrseq, modl)
%正規化及びDC成分の減算を可能にするため変数
%DCSUB=0;
epsilon=2^(-26);
%epsilon=0
lrSeqSize=size(lrSeq);
hrSeqSize=size(hrSeq);
if prod((fctr*lrSeqSize)==hrSeqSize)&(2==length(lrSeqSize))
;%Ok
elseif prod((fctr*lrSeqSize(1:2))==hrSeqSize(1:2))&...
(length(lrSeqSize)<=3)
;%Ok
else
error(‘Images sequences improper sizes with respect to fctr’)
end
% ’In polyLearnedModel構成器 fvSize’
fvSize=size(nbhdToFS(modl, zeros(nSize), degree));
featVectLen=prod(fvSize);
fvMat=zeros([featVectLen, featVectLen]);
outMat=zeros([featVectLen, fctr^2]);
inRows=1:(lrSeqSize(1)-(nSize(1)+1));
inCols=1:(lrSeqSize(2)-(nSize(2)+1));
nRad=floor((1/2)*nSize);
hrOffset=(fctr*(nRad-(~mod(nSize, 2))))+...
(~mod(nSize, 2)).*[fctr/2, fctr/2]+1;
if (legth(lrSeqSize)<3)
numIms=1;
elseif (3==length(IrSeqSize))
numIms=lrSeqSize(3);
else
error(‘Images sequences improper sizes’)
end
for imInd=1:numIms
if (length(lrSeqSize)<3)
lrIm=lrSeq;
hrIm=hrSeq;
elseif (3==length(lrSeqSize))
lrIm=lrSeq(:, :, imInd);
hrIm=hrSeq(:, :, imInd);
end
for inR=inRows
for inC=inCols
inN=getNbhd(inR, inC, lrIm, nSize);
featVect=nbhdToFS(modl, inN, degree);
fvMat=fvMat+featVect*featVect’;
out=fctr*[(inR-1), (inC-1)]+hrOffset;
outN=getNbhd(out(1), out(2), hrIm, [fctr, fctr]);
outMat=outMat+featVect*outN(:)’;
end
end
end
‘cond’
cond(fvMat)
‘rank’
rank(fvMat)
‘size’
size(fvMat)
if (abs(max(fvMat(:)))>epsilon)|...
(abs(min(fvMat(:)))>epsilon)
%SVDを用いて解く
[U, S, V]=svd(fvMat);
%実際に0に近い固有値は消去しなければならない。
Nz=(abs(S)>epsilon);
InvS=(ones(size(nz))./((~nz)+S)).*nz;
KernVals=V*invS*U’*outMat;
Else
%非常に特異なfvMat
kernVals=zeros(featVectLen, fctr^2);
end
return
% [“, num2str()]
function inNbhd=getNbhd(iR, iC, im, imNbhdSize)
indsR=(iR-1)+(1:inNbhdSize(1));
indsC=(iC-1)+(1:inNbhdSize(2));
inNbhd=im(indsR, indsC);
return
【0047】
(付録C)
学習係数を用いて画像解像度を向上させる好適なアルゴリズムのMATLAB(登録商標)ソースコード
function newIm=improveImage(modl, im)
nSize=modl.nbhdSize;
imDize=size(im);
fctr=modl.fctr;
if (nSize(1)>imSize(1))|(nSize(2)>imSize(2))
error(‘Neighborhood larger than image,')
end
nbhdRad=floor((1/2)*nSize);
eImSize=fctr*(imSize-nSize+ones(nSize)));
newIm=zeros(eImSize);
nbhdsRow=1:(imSize(1)-nSize(1)+1);
nbhdsCol=1:(imSize(2)-nSize(2)+1);
nbhdRInds=0:(nSize(1)-1);
nbhdCInds=0:(nSize(2)-1);
for nR=nbhdsRow
for nC=nbhdsCol
nbhd=im(nR+nbhdRInds, nC+nbhdCInds);
newValues=nbhdFunc(nbhd, modl);
newBlock=reshape(newValues, [fctr, fctr]);
newIm(fctr*(nR-1)+(1:fctr), ...
fctr*(nC-1)+(1:fctr))=newBlock;
end
end
return;
function newVals=nbhdFunc(nbhd, modl)
%DCSUB=0;
nSize=size(nbhd);
degree=get(modl, ‘degree’);
fsVect=nbhdToFS(modl, nbhd, degree);
newVals=((fsVect)’*(modl.params))’;
return
【図面の簡単な説明】
【0048】
【図1】本発明により処理される画像データの好例を示す図である。
【図2】本発明により画像データの品位を向上させる好適な手順を示すフロー図である。
【図3】本発明により処理される音声データの好例を示す図である。
【図4】本発明により画像データの品位を向上させる好適な手順を示すブロック図である。
【図5】本発明により音声データの品位を向上させる好適な手順を示すフロー図である。
【図6】本発明により音声の品位を向上させる追加的な好適な手順を示すブロック図である。
【図7】本発明により処理される画像データの好例を示す図である。
【図8】本発明により処理される画像データの追加的な好例を示す図である。
【図9A】本発明により画像データの品位を向上させるシステムを示す図である。
【図9B】本発明により画像データの品位を向上させる追加的なシステムを示す図である。
【図9C】本発明により画像データの品位を向上させる他のシステムを示す図である。
【図10A】本発明により画像データの品位を向上させるさらに他のシステムを示す図である。
【図10B】本発明により画像データの品位を向上させるさらに他のシステムを示す図である。
【図11】本発明により処理されるビデオシーケンスの好例を示す図である。
【図12】本発明により画像データを生成するシステムを示す図である。
【図13】本発明により処理されるビデオ及び静止画像データの好例を示す図である。
【図14】本発明により画像データの品位を向上させる好適なシステムを示す図である。
【図15】図1〜14に示すシステム及び手順に用いる好適な処理装置を示すブロック図である。
【特許請求の範囲】
【請求項1】
シーンを表現する第1の低品位画像のデータ品位を、前記シーンの一部分を表現する高品位画像、前記シーンの前記一部分を表現する第2の低品位画像、及び少なくとも1つのパラメータを有する品位向上関数を用いて向上させる方法であって、前記シーンの前記一部分が前記シーン全体よりも小さく、前記高品位画像が第1の品位を有し、前記第1の低品位画像及び前記第2の低品位画像が第2の品位を有し、前記第1の品位が前記第2の品位より高いデータ品位向上方法において、
前記高品位画像及び前記第2の低品位画像を学習アルゴリズムによって処理して、前記少なくとも1つのパラメータの学習値を決定するステップであって、前記品位向上関数が、前記第2の低品位画像にもとづいて、前記少なくとも1つのパラメータの前記学習値を用いて、前記高品位画像を近似する画像を導出する機能を有するステップと、
前記第1の低品位画像を、前記品位向上関数によって、前記少なくとも1つのパラメータの前記学習値を用いて処理して、前記第2の品位より高い第3の品位を有する画像を導出するステップと
を具えていることを特徴とするデータ品位向上方法。
【請求項2】
前記第1の品位が第1の分解能から成り、前記第2の品位が第2の分解能から成り、前記第3の品位が第3の分解能から成ることを特徴とする請求項1に記載の方法。
【請求項3】
前記第1の分解能が、第1の空間解像度、第1の輝度分解能、第1のスペクトル分解能、及び第1の偏光分解能のうちの少なくとも1つから成り、前記第2の分解能が、第2の空間解像度、第2の輝度分解能、第2のスペクトル分解能、及び第2の偏光分解能のうちの少なくとも1つから成り、前記第3の分解能が、第3の空間解像度、第3の輝度分解能、第3のスペクトル分解能、及び第3の偏光分解能のうちの少なくとも1つから成ることを特徴とする請求項2に記載の方法。
【請求項4】
前記第1の品位が第1の信号対雑音比から成り、前記第2の品位が第2の信号対雑音比から成り、前記第3の品位が第3の信号対雑音比から成ることを特徴とする請求項1に記載の方法。
【請求項5】
前記品位向上関数が多項式関数から成り、前記少なくとも1つのパラメータが、前記多項式関数の1つ以上の係数から成ることを特徴とする請求項1に記載の方法。
【請求項6】
前記学習アルゴリズムが、前記1つ以上の係数の各々の値を、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項5に記載の方法。
【請求項7】
前記学習アルゴリズムが、前記1つ以上のパラメータを、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項1に記載の方法。
【請求項8】
前記高品位画像が第1視点から見たシーンを表現し、前記第1の低品位画像が第2視点から見たシーンを表現し、前記第2の低品位画像が第3視点から見たシーンを表現し、前記第2の視点及び前記第3の視点が前記第1の視点に近接していることを特徴とする請求項1に記載の方法。
【請求項9】
シーンを表現する第1の低品位画像のデータ品位を、前記シーンの一部分を表現する高品位画像、前記シーンの前記一部分を表現する第2の低品位画像、及び少なくとも1つのパラメータを有する品位向上関数を用いて向上させるシステムであって、前記シーンの前記一部分が前記シーン全体よりも小さく、前記高品位画像が第1の品位を有し、前記第1の低品位画像及び前記第2の低品位画像が第2の品位を有し、前記第1の品位が前記第2の品位より高いデータ品位向上システムにおいて、
該システムが処理装置を具えて、該処理装置が、
前記高品位画像及び前記第2の低品位画像を学習アルゴリズムによって処理して、前記少なくとも1つのパラメータの学習値を決定するステップであって、前記品位向上関数が、前記第2の低品位画像にもとづいて、前記少なくとも1つのパラメータの前記学習値を用いて、前記高品位画像を近似する画像を導出すべく動作可能であるステップと、
前記第1の低品位画像を、前記少なくとも1つのパラメータの前記学習値を用いて前記品位向上関数によって処理して、前記第2の品位より高い第3の品位を有する画像を導出するステップと
を実行すべく構成されていることを特徴とするデータ品位向上システム。
【請求項10】
前記第1の品位が第1の分解能から成り、前記第2の品位が第2の分解能から成り、前記第3の品位が第3の分解能から成ることを特徴とする請求項9に記載のシステム。
【請求項11】
前記第1の分解能が、第1の空間解像度、第1の輝度分解能、第1のスペクトル分解能、及び第1の偏光分解能のうちの少なくとも1つから成り、前記第2の分解能が、第2の空間解像度、第2の輝度分解能、第2のスペクトル分解能、及び第2の偏光分解能のうちの少なくとも1つから成り、前記第3の分解能が、第3の空間解像度、第3の輝度分解能、第3のスペクトル分解能、及び第3の偏光分解能のうちの少なくとも1つから成ることを特徴とする請求項10に記載のシステム。
【請求項12】
前記第1の品位が第1の信号対雑音比から成り、前記第2の品位が第2の信号対雑音比から成り、前記第3の品位が第3の信号対雑音比から成ることを特徴とする請求項9に記載のシステム。
【請求項13】
前記品位向上関数が多項式関数から成り、前記少なくとも1つのパラメータが、前記多項式関数の1つ以上の係数から成ることを特徴とする請求項9に記載のシステム。
【請求項14】
前記学習アルゴリズムが、前記1つ以上の係数の各々の値を、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項13に記載のシステム。
【請求項15】
前記学習アルゴリズムが、前記1つ以上のパラメータを、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項9に記載のシステム。
【請求項16】
前記高品位画像が第1視点から見たシーンを表現し、前記第1の低品位画像が第2視点から見たシーンを表現し、前記第2の低品位画像が第3視点から見たシーンを表現し、前記第2の視点及び前記第3の視点が前記第1の視点に近接していることを特徴とする請求項9に記載のシステム。
【請求項1】
シーンを表現する第1の低品位画像のデータ品位を、前記シーンの一部分を表現する高品位画像、前記シーンの前記一部分を表現する第2の低品位画像、及び少なくとも1つのパラメータを有する品位向上関数を用いて向上させる方法であって、前記シーンの前記一部分が前記シーン全体よりも小さく、前記高品位画像が第1の品位を有し、前記第1の低品位画像及び前記第2の低品位画像が第2の品位を有し、前記第1の品位が前記第2の品位より高いデータ品位向上方法において、
前記高品位画像及び前記第2の低品位画像を学習アルゴリズムによって処理して、前記少なくとも1つのパラメータの学習値を決定するステップであって、前記品位向上関数が、前記第2の低品位画像にもとづいて、前記少なくとも1つのパラメータの前記学習値を用いて、前記高品位画像を近似する画像を導出する機能を有するステップと、
前記第1の低品位画像を、前記品位向上関数によって、前記少なくとも1つのパラメータの前記学習値を用いて処理して、前記第2の品位より高い第3の品位を有する画像を導出するステップと
を具えていることを特徴とするデータ品位向上方法。
【請求項2】
前記第1の品位が第1の分解能から成り、前記第2の品位が第2の分解能から成り、前記第3の品位が第3の分解能から成ることを特徴とする請求項1に記載の方法。
【請求項3】
前記第1の分解能が、第1の空間解像度、第1の輝度分解能、第1のスペクトル分解能、及び第1の偏光分解能のうちの少なくとも1つから成り、前記第2の分解能が、第2の空間解像度、第2の輝度分解能、第2のスペクトル分解能、及び第2の偏光分解能のうちの少なくとも1つから成り、前記第3の分解能が、第3の空間解像度、第3の輝度分解能、第3のスペクトル分解能、及び第3の偏光分解能のうちの少なくとも1つから成ることを特徴とする請求項2に記載の方法。
【請求項4】
前記第1の品位が第1の信号対雑音比から成り、前記第2の品位が第2の信号対雑音比から成り、前記第3の品位が第3の信号対雑音比から成ることを特徴とする請求項1に記載の方法。
【請求項5】
前記品位向上関数が多項式関数から成り、前記少なくとも1つのパラメータが、前記多項式関数の1つ以上の係数から成ることを特徴とする請求項1に記載の方法。
【請求項6】
前記学習アルゴリズムが、前記1つ以上の係数の各々の値を、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項5に記載の方法。
【請求項7】
前記学習アルゴリズムが、前記1つ以上のパラメータを、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項1に記載の方法。
【請求項8】
前記高品位画像が第1視点から見たシーンを表現し、前記第1の低品位画像が第2視点から見たシーンを表現し、前記第2の低品位画像が第3視点から見たシーンを表現し、前記第2の視点及び前記第3の視点が前記第1の視点に近接していることを特徴とする請求項1に記載の方法。
【請求項9】
シーンを表現する第1の低品位画像のデータ品位を、前記シーンの一部分を表現する高品位画像、前記シーンの前記一部分を表現する第2の低品位画像、及び少なくとも1つのパラメータを有する品位向上関数を用いて向上させるシステムであって、前記シーンの前記一部分が前記シーン全体よりも小さく、前記高品位画像が第1の品位を有し、前記第1の低品位画像及び前記第2の低品位画像が第2の品位を有し、前記第1の品位が前記第2の品位より高いデータ品位向上システムにおいて、
該システムが処理装置を具えて、該処理装置が、
前記高品位画像及び前記第2の低品位画像を学習アルゴリズムによって処理して、前記少なくとも1つのパラメータの学習値を決定するステップであって、前記品位向上関数が、前記第2の低品位画像にもとづいて、前記少なくとも1つのパラメータの前記学習値を用いて、前記高品位画像を近似する画像を導出すべく動作可能であるステップと、
前記第1の低品位画像を、前記少なくとも1つのパラメータの前記学習値を用いて前記品位向上関数によって処理して、前記第2の品位より高い第3の品位を有する画像を導出するステップと
を実行すべく構成されていることを特徴とするデータ品位向上システム。
【請求項10】
前記第1の品位が第1の分解能から成り、前記第2の品位が第2の分解能から成り、前記第3の品位が第3の分解能から成ることを特徴とする請求項9に記載のシステム。
【請求項11】
前記第1の分解能が、第1の空間解像度、第1の輝度分解能、第1のスペクトル分解能、及び第1の偏光分解能のうちの少なくとも1つから成り、前記第2の分解能が、第2の空間解像度、第2の輝度分解能、第2のスペクトル分解能、及び第2の偏光分解能のうちの少なくとも1つから成り、前記第3の分解能が、第3の空間解像度、第3の輝度分解能、第3のスペクトル分解能、及び第3の偏光分解能のうちの少なくとも1つから成ることを特徴とする請求項10に記載のシステム。
【請求項12】
前記第1の品位が第1の信号対雑音比から成り、前記第2の品位が第2の信号対雑音比から成り、前記第3の品位が第3の信号対雑音比から成ることを特徴とする請求項9に記載のシステム。
【請求項13】
前記品位向上関数が多項式関数から成り、前記少なくとも1つのパラメータが、前記多項式関数の1つ以上の係数から成ることを特徴とする請求項9に記載のシステム。
【請求項14】
前記学習アルゴリズムが、前記1つ以上の係数の各々の値を、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項13に記載のシステム。
【請求項15】
前記学習アルゴリズムが、前記1つ以上のパラメータを、前記高品位画像と前記高品位画像を近似する前記画像との間の二乗誤差値の総和を最小化する値に決定するステップを具えていることを特徴とする請求項9に記載のシステム。
【請求項16】
前記高品位画像が第1視点から見たシーンを表現し、前記第1の低品位画像が第2視点から見たシーンを表現し、前記第2の低品位画像が第3視点から見たシーンを表現し、前記第2の視点及び前記第3の視点が前記第1の視点に近接していることを特徴とする請求項9に記載のシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9A】
【図9B】
【図9C】
【図10A】
【図10B】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9A】
【図9B】
【図9C】
【図10A】
【図10B】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2009−20879(P2009−20879A)
【公開日】平成21年1月29日(2009.1.29)
【国際特許分類】
【出願番号】特願2008−172576(P2008−172576)
【出願日】平成20年7月1日(2008.7.1)
【分割の表示】特願2003−581477(P2003−581477)の分割
【原出願日】平成15年3月25日(2003.3.25)
【出願人】(500382473)ザ トラスティーズ オブ コロンビア ユニヴァーシティ イン ザ シティ オブ ニューヨーク (17)
【Fターム(参考)】
【公開日】平成21年1月29日(2009.1.29)
【国際特許分類】
【出願日】平成20年7月1日(2008.7.1)
【分割の表示】特願2003−581477(P2003−581477)の分割
【原出願日】平成15年3月25日(2003.3.25)
【出願人】(500382473)ザ トラスティーズ オブ コロンビア ユニヴァーシティ イン ザ シティ オブ ニューヨーク (17)
【Fターム(参考)】
[ Back to top ]