説明

超解像処理装置及び超解像処理方法

【課題】時間的に連続する複数の画像フレーム間において、フリッカーの発生を抑制できる超解像処理装置等を提供する。
【解決手段】学習データベースを用いて高周波成分を付加する方式の超解像処理において、まず、入力画像と、入力画像をフレーム遅延させた遅延入力画像との間の動きを検出し、動きベクトルを求める。次に遅延入力画像と同じ時刻のフレームの、前記動きベクトルにより動き補償された位置の超解像処理に用いた学習高周波パッチと同じ学習高周波パッチを選択されやすいように、入力画像の対象ブロックにおけるパッチ抽出時の評価値を更新する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力画像に学習データベースを用いた超解像処理を行うことにより出力画像を生成する超解像処理装置及び超解像処理方法に関する。
【背景技術】
【0002】
近年、家庭用テレビ及びPC(パーソナルコンピュータ)用ディスプレイなどの表示デバイスの表示解像度が向上している。例えば、フルハイビジョン(1920画素×1080画素)又はそれ以上の表示能力(表示解像度)を持つ高解像度の表示デバイスが開発されている。このため既存のDVD(Digital Versatile Disc)などの標準画質(720画素×480画素など)の映像コンテンツをこのような高解像度の表示デバイスの全画面で表示する場合、映像コンテンツを構成する画像の解像度を、高解像度の表示デバイスの表示解像度まで増やすために高解像度化処理を行う必要がある。
【0003】
高解像度化処理の手法として、現在の主流として知られているのは線形フィルタを用いた拡大処理である。さらに、近年、高解像度化処理の手法として、入力画像に存在しない高い解像度の情報を生成できる超解像と呼ばれる手法が注目されてきている(例えば非特許文献1)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】Freeman,W.T.Jones,T.R.Pasztor,E.C.,“Example−based super−resolution”,Computer Graphics and Applications,IEEE,March−April 2002
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記従来の構成では、時間的に連続する複数の画像フレーム間において、オブジェクトが時間方向にゆらいでしまうという問題がある。
【0006】
本発明は、かかる問題に鑑みてなされたものであって、時間的に連続する複数の画像フレーム間において、フリッカーの発生を抑制できる超解像処理装置及び超解像処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するために、本発明の一態様に係る超解像処理装置は、入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成する超解像処理装置であって、前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、前記入力画像から特徴量をブロック単位で抽出する特徴量抽出部と、前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出部と、前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出部と、前記動き検出部により検出された動きに基づき、前記パッチ抽出部により前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応させてマッピングされた過去データをブロック単位で動き補償する動き補償部と、前記入力画像と前記パッチ抽出部により抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算部とを備え、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する。
【0008】
なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたは記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
【0009】
すなわち、上記のように一態様に係る超解像処理装置として実現できるだけでなく、超解像処理装置に含まれる特徴的な手段をステップとする超解像処理方法として実現したり、そのような特徴的なステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の非一時的なコンピュータ読み取り可能な記録媒体、及びインターネット等の伝送媒体を介して流通させることができるのは言うまでもない。また、本発明は、このような超解像処理装置の機能の一部又は全てを実現する半導体集積回路(LSI)として実現してもよい。
【発明の効果】
【0010】
本発明によれば、時間的に連続する複数の画像フレーム間において、フリッカーの発生を抑制できる超解像処理装置等を実現することができる。
【図面の簡単な説明】
【0011】
【図1】図1は、実施の形態1に係る超解像処理装置の構成を示すブロック図である。
【図2】図2は、実施の形態1に係る超解像処理装置の動作例を示す図である。
【図3】図3は、実施の形態1に係る遅延入力画像のブロックに対するデータベースインデックスが動き補償されて動き補償データベースインデックスを得ることを説明するための図である。
【図4】図4は、実施の形態1に係る超解像処理装置の超解像処理を説明するためのフローチャートである。
【図5】図5は、実施の形態1に係る学習データベースに格納される画像変換が行われたパッチペアの1例を説明するための図である。
【図6】図6は、実施の形態2に係る超解像処理装置の構成を示すブロック図である。
【図7】図7は、実施の形態2に係る超解像処理装置の動作例を示す図である。
【図8】図8は、実施の形態2に係る超解像処理装置の超解像処理を説明するためのフローチャートである。
【図9A】図9Aは、実施の形態3に係る記録媒体の物理フォーマットの例を示す図である。
【図9B】図9Bは、実施の形態3に係る記録媒体の構成を示す図である。
【図9C】図9Cは、実施の形態3に係るコンピュータシステムの構成を示す図である。
【図10】図10は、実施の形態4におけるテレビジョン受像機のブロック図である。
【図11】図11は、従来の超解像処理装置の構成を示すブロック図である。
【図12】図12は、学習データベースを生成するための学習データベース生成装置の構成を示すブロック図である。
【図13】図13は、従来の超解像処理装置の動作例を示す図である。
【発明を実施するための形態】
【0012】
(本発明の基礎となった知見)
本発明者は、「背景技術」の欄において記載した非特許文献1に開示される技術に関し、以下のような問題が生じることを見出した。
【0013】
従来の超解像処理方法としては、非特許文献1に示される学習型超解像がある。この非特許文献1の方法を以下に説明する。
【0014】
<超解像処理装置900の構成と動作1>
図11は、超解像処理装置900の構成を示すブロック図である。図11に示す超解像処理装置900は、低解像度の入力画像(D911)から拡大画像(D913)を生成する拡大部901と、拡大画像(D913)から入力特徴量(D914)を生成する特徴量抽出部902と、入力特徴量(D914)、学習特徴量(D915)及び学習高周波パッチ(D916)から推定高周波パッチ(D917)を生成するパッチ抽出部903と、拡大画像(D913)と推定高周波パッチ(D917)とを加算することにより出力画像(D912)を生成する加算部904と、学習特徴量(D915)及び学習高周波パッチ(D916)を出力する学習データベース905とを備えている。
【0015】
拡大部901は、超解像処理の目標解像度の倍率をNとして、入力画像(D911)を水平及び垂直方向にそれぞれN倍に拡大することにより、拡大画像(D913)を生成する。例えば、拡大部901は、バイキュービック法又はスプライン補間法などの画素補間手法を用いて入力画像(D911)を拡大する。
【0016】
特徴量抽出部902は、線形フィルタ操作などを用いて拡大画像(D913)の高周波成分を入力特徴量(D914)として抽出する。
【0017】
パッチ抽出部903は、入力特徴量(D914)に対して、固定の小ブロック単位で次の処理を行う。パッチ抽出部903は、学習データベース905に格納された多数の学習特徴量(D915)の中から、入力特徴量(D914)の対象画像ブロックに最も類似した学習特徴量(D915)を検索する。ここで、パッチとは、ブロック化されたデータのことを指すものとする。また、パッチ抽出部903は、両パッチ間の距離を画素間差分の絶対値和又は自乗和などで定義する。そして、パッチ抽出部903は、その距離の小ささに応じて類似度の大きさを判断する。検索処理により、最も類似した学習特徴量(D915)が決定されると、パッチ抽出部903は、学習データベース905内で、学習特徴量(D915)とペアで格納されている学習高周波パッチ(D916)を取得し、取得した学習高周波パッチ(D916)を推定高周波パッチ(D917)として出力する。
【0018】
加算部904は、拡大画像(D913)の対象ブロック位置のパッチと、推定高周波パッチ(D917)とを画素単位で加算し、加算結果を出力画像(D912)として出力する。
【0019】
次に、超解像処理装置900に含まれる学習データベース905を生成する方法を以下に説明する。
【0020】
<学習データベース生成装置950の構成と動作>
図12は、学習データベース905を生成するための学習データベース生成装置950の構成を示すブロック図である。この学習データベース生成装置950は、事前にデジタルカメラで撮影した実画像などから収集した学習画像(D961)から学習低周波画像(D962)を生成するローパスフィルタ部951と、学習低周波画像(D962)から学習低解像度画像(D963)を生成する縮小部952と、学習低解像度画像(D963)から学習低周波画像(D964)を生成する拡大部953と、学習低周波画像(D964)から学習特徴量(D915)を生成するハイパスフィルタ部954と、学習画像(D961)から学習高周波パッチ(D916)を生成するハイパスフィルタ部955と、学習特徴量(D915)および学習高周波パッチ(D916)を格納する学習データベース905とを有する。
【0021】
ローパスフィルタ部951は、線形フィルタ操作などを用いて学習画像(D961)の低周波成分を学習低周波画像(D962)として抽出する。
【0022】
縮小部952は、学習低周波画像(D962)を水平及び垂直方向にそれぞれN分の1に縮小することにより学習低解像度画像(D963)を生成する。
【0023】
拡大部953は、学習低解像度画像(D963)を水平及び垂直方向にそれぞれN倍に拡大することにより学習低周波画像(D964)を生成する。
【0024】
ハイパスフィルタ部954は、線形フィルタ操作などを用いて学習低周波画像(D964)の高周波成分を抽出し、その抽出結果を上記固定ブロック単位で切り出すことにより、複数の学習特徴量(D915)を生成する。
【0025】
ハイパスフィルタ部955は、線形フィルタ操作などを用いて学習画像(D961)の高周波成分を抽出し、その抽出結果を上記固定ブロック単位に切り出すことにより、複数の学習高周波パッチ(D916)を生成する。
【0026】
学習データベース905は、同一のブロック位置から生成された学習特徴量(D915)と学習高周波パッチ(D916)とを1つのパッチペアとして対応付けする。そして、対応関係と両画像パッチのデータとを格納する。
【0027】
<超解像処理装置900の動作2>
以上のようにして、超解像処理装置900における学習データベース905には、事前にデジタルカメラで撮影した実画像などから収集された、実際の特徴量と高周波画像との関係が数多く記憶される。したがって、超解像処理装置900は、入力特徴量(D914)と最も関連があると考えられる高周波画像パッチを検索できる。さらに、検索した高周波画像パッチが拡大画像(D913)に付加されることで、入力画像(D911)には含まれない失われた高周波成分が付加されることになる。これにより、超解像処理装置900は、より高精細な出力画像(D912)を生成できる。
【0028】
<超解像処理装置900の動作例>
超解像処理装置900の具体的な動作例を以下、説明する。図13は、超解像処理装置900の動作例を示す図である。
【0029】
図13には、超解像処理装置900により入力画像(D911)に超解像処理を施し、高精細な出力画像(D912)を生成する様子の一例が示されている。
【0030】
入力画像(D911)から拡大画像(D913)を生成する際は、フレーム全体を一度に拡大処理してもよく、対象ブロック(例えば図中の対象ブロック)ごとに拡大処理をしてもよい。ここで、拡大画像(D913)は、拡大処理によりぼけた画像となっている。これに対し、パッチ抽出部903によって学習データベース905から抽出された推定高周波パッチ(D917)が、加算部904によって拡大画像(D913)に加算されることで、より精細度の向上した出力画像(D912)が生成される。
【0031】
しかしながら、上記の従来技術では、時間的に連続する複数の画像フレーム間において、オブジェクトが時間方向にゆらいでしまうという問題がある。具体的には、時間的に連続する複数の画像フレーム(以下、単にフレームと呼ぶ)間において、同じオブジェクトが、ランダムノイズの混入やオブジェクトの移動および変形などでごくわずかに変化しているに過ぎない場合でも、パッチ抽出部903は、前後のフレーム間で異なる学習特徴量(D915)を検索してしまうことがある。このとき、対応する学習高周波パッチ(D916)が異なるために、超解像処理がされた出力画像(D912)は、同じオブジェクトであってもフレームごとに異なる画像となり、オブジェクトが時間方向にゆらいでしまう(換言するとフリッカーが発生してしまう)という問題がある。
【0032】
そこで、本発明の一態様は、かかる問題に鑑みてなされたものであって、時間的に連続する複数の画像フレーム間において、フリッカーの発生を抑制できる超解像処理装置及び超解像処理方法を提供することを目的とする。
【0033】
上記目的を達成するために、第1の態様に係る超解像処理装置は、入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成する超解像処理装置であって、前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、前記入力画像から特徴量をブロック単位で抽出する特徴量抽出部と、前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出部と、前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出部と、前記動き検出部により検出された動きに基づき、前記パッチ抽出部により前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応させてマッピングされた過去データをブロック単位で動き補償する動き補償部と、前記入力画像と前記パッチ抽出部により抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算部とを備え、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する。
【0034】
この構成により、入力画像に対して時間方向にゆらぎにくく安定した高周波成分を付加する超解像処理を行うことができるので、時間的に連続する複数の画像フレーム間において、フリッカーの発生を抑制できる超解像処理装置を実現することができる。
【0035】
具体的には、本構成により、動き補償された過去データのブロックの特定情報で特定される学習高周波パッチが選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0036】
ここで、第2の態様に係る超解像処理装置は、第1の態様において、例えば、前記特定情報は、前記パッチ抽出部により前記過去入力画像に対して抽出された学習高周波パッチと当該学習高周波パッチに対応づけられた学習特徴量とを特定するデータベースインデックスであり、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックのデータベースインデックスにより特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正するとしてもよい。
【0037】
この構成により、動き補償された過去データのブロックのデータベースインデックスで特定される学習高周波パッチが選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0038】
また、第3の態様に係る超解像処理装置は、第1の態様において、例えば、前記特定情報は、前記パッチ抽出部により前記過去入力画像に対して抽出された学習高周波パッチであり、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの学習高周波パッチと対応づけられた学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正するとしてもよい。
【0039】
この構成により、動き補償された過去データのブロックの学習高周波パッチが選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0040】
また、第4の態様に係る超解像処理装置は、第1の態様〜第3の態様のいずれかにおいて、例えば、前記評価値は、前記類似度が高いほど小さい値を示し、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりもc1(c1>0)だけ減ずる値に修正するとしてもよい。
【0041】
この構成により、動き補償された過去データのブロックの特定情報で特定される学習高周波パッチが選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0042】
また、第5の態様に係る超解像処理装置は、第1の態様〜第3の態様のいずれかにおいて、例えば、前記評価値は、前記類似度が高いほど小さい値を示し、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合の評価値にc2(0<c1<1)を乗ずる値に修正するとしてもよい。
【0043】
この構成により、動き補償された過去データのブロックの特定情報で特定される学習高周波パッチが選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0044】
また、第6の態様に係る超解像処理装置は、第1の態様〜第5の態様のいずれかにおいて、例えば、前記動き検出部は、さらに、前記動きの検出の確からしさを示す動き確度情報を算出し、前記パッチ抽出部、さらに、前記動き確度情報に基づいて、前記動きの検出が確からしいと判断する場合に、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値に対する修正量を大きくするとしてもよい。
【0045】
この構成により、動き補償された過去データのブロックの特定情報で特定される学習高周波パッチが選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0046】
また、第7の態様に係る超解像処理装置は、第1の態様〜第5の態様のいずれかにおいて、例えば、前記動き検出部は、さらに、前記動きの検出の確からしさを示す動き確度情報を算出し、前記パッチ抽出部は、前記動き確度情報に基づいて、前記動きの検出が確からしいと判断する場合にのみ、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正するとしてもよい。
【0047】
この構成により、動き補償された過去データのブロックの特定情報で特定される学習高周波パッチが選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0048】
ここで、第8の態様に係る超解像処理装置は、第7の態様において、例えば、前記動き確度情報は、前記動き補償部により動き補償された過去データのブロックと、対応する前記入力画像のブロックとの類似度が高いほど、前記動きの検出がより確からしい旨を示すとしてもよい。
【0049】
また、第9の態様に係る超解像処理装置は、第7の態様において、例えば、前記動き確度情報は、前記動き補償部により動き補償された過去データのブロックと、対応する前記入力画像における対象ブロックとの間における各画素同士の差分絶対値和を含むとしてもよい。
【0050】
また、第10の態様に係る超解像処理装置は、第9の態様において、例えば、前記動き確度情報は、前記差分絶対値和の値が小さいほど、前記動き補償部により動き補償された過去データのブロックと、対応する前記入力画像のブロックとの類似度が高いとしてもよい。
【0051】
この構成により、動き補償された過去データのブロックの特定情報で特定される学習高周波パッチと類似した学習高周波成分が選択されやすくなるので、時間方向の連続性が高くなり、高周波ゆらぎの少ない安定した高精彩な出力画像を得ることができる。
【0052】
また、第11の態様に係る超解像処理装置は、第1の態様〜第10の態様のいずれかにおいて、例えば、さらに、前記入力画像を所望の画像サイズに拡大して出力する拡大部を備え、前記特徴量抽出部は、前記拡大部により拡大された前記入力画像から特徴量を抽出し、前記加算部は、前記拡大部により拡大された前記入力画像と前記パッチ抽出部により抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成するとしてもよい。
【0053】
また、第12の態様に係る超解像処理装置は、第2の態様において、例えば、前記学習データベースには、類似した学習高周波パッチ同士が同じクラスに属するように分類されており、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックのデータベースインデックスにより特定される学習特徴量と対応付けられた学習高周波パッチと同じクラスに属する学習高周波パッチにおける学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正するとしてもよい。
【0054】
また、上記目的を達成するために、第12の態様に係る超解像処理方法は、例えば、入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成する超解像処理方法であって、前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、前記入力画像から特徴量をブロック単位で抽出する特徴量抽出ステップと、前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出ステップと、前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出ステップと、前記動き検出ステップにおいて検出された動きに基づき、前記パッチ抽出ステップにおいて前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応されてマッピングされた過去データをブロック単位で動き補償する動き補償ステップと、前記入力画像と前記パッチ抽出ステップにおいて抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算ステップとを含み、前記パッチ抽出ステップでは、前記入力画像のブロックと対応する前記動き補償ステップにおいて動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する。
【0055】
また、上記目的を達成するために、第13の態様に係る超解像処理を行うためのプログラムは、入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成するためのプログラムを記録した非一時的なコンピュータ読み取り可能な記録媒体であって、前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、前記入力画像から特徴量をブロック単位で抽出する特徴量抽出ステップと、前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出ステップと、前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出ステップと、前記動き検出ステップにおいて検出された動きに基づき、前記パッチ抽出ステップにおいて前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応されてマッピングされた過去データをブロック単位で動き補償する動き補償ステップと、前記入力画像と前記パッチ抽出ステップにおいて抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算ステップとを含み、前記パッチ抽出ステップでは、前記入力画像のブロックと対応する前記動き補償ステップにおいて動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する。
【0056】
また、上記目的を達成するために、第14の態様に係る集積回路は、例えば、入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成する集積回路であって、前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、前記入力画像から特徴量をブロック単位で抽出する特徴量抽出部と、前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出部と、前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出部と、前記動き検出部により検出された動きに基づき、前記パッチ抽出部により前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応されてマッピングされた過去データをブロック単位で動き補償する動き補償部と、前記入力画像と前記パッチ抽出部により抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算部とを備え、前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する。
【0057】
なお、以下で説明する実施の形態は、いずれも本発明の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
【0058】
以下、本発明を実施するための形態について、図面を参照しながら説明する。
【0059】
(実施の形態1)
図1は、本発明の実施の形態1に係る超解像処理装置100の構成を示すブロック図である。
【0060】
図1に示す超解像処理装置100は、入力画像(D111)に学習データベース105を用いた超解像処理を行うことにより、入力画像(D111)より解像度が大きい出力画像(D112)を生成する。この超解像処理装置100は、拡大部101と、特徴量抽出部102と、パッチ抽出部103と、加算部104と、学習データベース105と、フレーム遅延部111と、動き検出部112と、フレーム遅延部113と、動き補償部114とを備える。
【0061】
拡大部101は、入力画像(D111)を所望の画像サイズに拡大して出力する。具体的には、拡大部101は、入力画像(D111)を所望の画像サイズに拡大した拡大画像(D113)を生成する。なお、入力画像(D111)があらかじめ拡大されている場合や、入力画像(D111)の時点で画像の周波数分布が低周波に偏っている場合などは、入力画像サイズを増加させなくとも超解像効果が得られることから、拡大部101を省略してもよい。この場合、拡大画像(D113)は、入力画像(D111)で代替できる。
【0062】
特徴量抽出部102は、拡大部101により拡大された入力画像(D111)から入力特徴量(D114)を抽出する。具体的には、特徴量抽出部102は、拡大画像(D113)から、特徴量を抽出して入力特徴量(D114)として出力する。なお、特徴量抽出部102は、入力画像(D111)から入力特徴量(D114)をブロック単位で抽出するとしてもよい。
【0063】
ここで、特徴量とは、例えば、拡大画像(D113)の高周波成分であり、ハイパスフィルタを用いることで抽出される。また、特徴量は例えば、拡大画像(D113)のバンドパス成分であり、バンドパスフィルタを用いることで抽出させるとしてもよい。なお、特徴量は、拡大画像(D113)から抽出される任意の特徴量であってよいし、拡大画像(D113)の代わりに、入力画像(D111)から直接抽出されるとしてもよい。また、特徴量は、1次元のスカラー量であっても、複数次元を有するベクトル量であってもよい。
【0064】
フレーム遅延部111は、内部に第1のフレームメモリ121を有しており、これを用いて入力画像(D111)をフレーム単位で遅延させて、遅延入力画像(D123)を出力する。
【0065】
動き検出部112は、入力画像(D111)とその入力画像(D111)より時間的に前の入力画像(D111)である遅延入力画像(D123)との間の動きをブロック単位で検出する。具体的には、動き検出部112は、入力画像(D111)と、遅延入力画像(D123)との間の、画像内オブジェクトの動きを検出し、検出した動き(動き量)を示す動きベクトル(D124)を出力する。なお、動きの検出は、所定のブロック単位で行ってもよく、また、画像内のオブジェクトごとに任意に領域を分割して、その領域単位で行ってもよい。
【0066】
また、動き検出部112は、動きの検出の確からしさを示す動き確度情報を算出する。具体的には、動き検出部112は、検出した動きの確からしさを示す動き確度情報(D128)を算出して出力する。ここで、動き確度情報は、動き補償部114により動き補償された過去のデータの過去データのブロックのデータベースインデックスのブロックと、対応する入力画像のブロックとの類似度が高いほど、動きの検出がより確からしい旨を示す。例えば、動き確度情報(D128)は、入力画像(D111)における対象ブロックと、動き補償した位置の遅延入力画像(D123)との間の各画素同士の差分絶対値和である。また、動き確度情報(D128)は、例えば、入力画像(D111)における対象ブロックと、動き補償した位置の遅延入力画像(D123)との間の各画素同士の差分自乗和である。なお、動き確度情報(D128)は、間引かれた画素における差分絶対値和または差分自乗和などでもよく、それ以外の方法で求めた動き補償した位置の遅延入力画像(D123)との間の類似度を示す指標であってもよい。なお、差分絶対値和の値が小さいほど、動き確度情報(D128)は類似度が高いことを示す。さらには、上記指標に、その他の評価指標を組み合わせたものであってもよい。
【0067】
フレーム遅延部113は、内部に第2のフレームメモリ123を有しており、1フレーム分の各ブロック位置のデータベースインデックス(D125)をフレーム単位で遅延させて、遅延データベースインデックス(D126)を出力する。
【0068】
動き補償部114は、動き検出部112により検出された動きに基づき、パッチ抽出部103により過去の入力画像(D111)に対して抽出された学習特徴量(D115)を特定するための特定情報が過去の入力画像のブロック毎に対応させてマッピングされた過去データをブロック単位で動き補償する。具体的には、動き補償部114は、動きベクトル(D124)に示される動き量に従って遅延データベースインデックス(D126)を動き補償し、動き補償データベースインデックス(D127)を出力する。
【0069】
なお、ここでいう過去の入力画像とは、超解像処理装置100に入力された入力画像(D111)の時間順序を示している。換言すると、超解像処理装置100により出力された出力画像(D112)が表示される順序(表示時刻)を示すものではない。同様に、過去データは、この過去の入力画像(D111)に対するデータを示しているに過ぎない。
【0070】
パッチ抽出部103は、学習データベース105に格納されている複数の学習特徴量(D115)それぞれと、入力特徴量(D114)との類似度を示す評価値をブロック単位で算出し、学習データベース105から、算出した評価値が示す入力特徴量(D114)に最も類似する学習特徴量(D115)と対応づけられた学習高周波パッチ(D116)を抽出する。また、パッチ抽出部103は、入力画像(D111)のブロックと対応する動き補償部114により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する入力特徴量(D114)との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する。
【0071】
ここで、特定情報は、パッチ抽出部103により過去の入力画像(D111)に対して抽出された学習高周波パッチ(D116)と当該学習高周波パッチ(D116)に対応づけられた学習特徴量(D115)とを特定するデータベースインデックスである。本実施の形態では、パッチ抽出部103は、入力画像(D111)のブロックと対応する動き補償部114により動き補償された過去データのブロックのデータベースインデックスにより特定される学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する入力特徴量(D114)との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正する。
【0072】
評価値は、類似度が高いほど小さい値を示す。この場合、例えば、パッチ抽出部103は、入力画像(D111)のブロックと対応する動き補償部114により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する入力特徴量(D114)との評価値を、当該過去データのブロックの特定情報を用いない場合よりもc1(c1>0)だけ減ずる値に修正するとしてもよい。また、パッチ抽出部103は、入力画像(D111)のブロックと対応する動き補償部114により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する入力特徴量(D114)との評価値を、当該過去データのブロックの特定情報を用いない場合の評価値にc2(0<c1<1)を乗ずる値に修正するとしてもよい。
【0073】
なお、パッチ抽出部103は、さらに、動き確度情報(D128)に基づいて、動きの検出が確からしいと判断する場合に、入力画像(D111)のブロックと対応する動き補償部114により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する入力特徴量(D114)との評価値に対する修正量を大きくするとしてもよい。また、パッチ抽出部103は、動き確度情報(D128)に基づいて、動きの検出が確からしいと判断する場合にのみ、入力画像(D111)のブロックと対応する動き補償部114により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する入力特徴量(D114)との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正するとしてもよい。
【0074】
より具体的には、本実施の形態では、パッチ抽出部103は、入力特徴量(D114)と学習特徴量(D115)との類似度が大きいほど値が小さくなる評価値を用いて、評価値が最小の学習特徴量(D115)を検索する。パッチ抽出部103は、検索により得た学習特徴量(D115)に対応する学習高周波パッチ(D116)を、推定高周波パッチ(D117)として出力する。
【0075】
また、パッチ抽出部103は、検索より得た学習特徴量(D115)および学習高周波パッチ(D116)のペアに対応するデータベースインデックスを、データベースインデックス(D125)として出力する。
【0076】
ここで、パッチ抽出部103は、動き確度情報(D128)により動き検出が確からしいと判断した場合、上記検索時の評価値を、動き補償データベースインデックス(D127)と等しいデータベースインデックスを持つ学習特徴量(D115)に対して、修正しない場合の評価値と比べて同じかより小さい値に修正した上で検索を行う。一方、動き確度情報(D128)により動き検出が確からしくないと判断した場合、評価値の修正は行わない。なお、パッチ抽出部103は、動き確度情報(D128)に関わらず評価値の修正を常に実施するとしても構わない。
【0077】
加算部104は、拡大部101により拡大された入力画像(D111)とパッチ抽出部103により抽出された学習高周波パッチ(D116)とをブロック単位で加算することにより、出力画像を生成する。具体的には、加算部104は、拡大画像(D113)と、推定高周波パッチ(D117)とを加算することにより出力画像(D112)を生成する。なお、加算部104は、入力画像(D111)とパッチ抽出部103により抽出された学習高周波パッチ(D116)とをブロック単位で加算することにより、出力画像を生成するとしてもよい。
【0078】
学習データベース105は、学習画像の高周波成分から得られたデータである学習高周波パッチ(D116)と、その学習画像の少なくとも低周波成分から得られたデータである学習特徴量(D115)とが対応づけられたパッチペアを複数格納している。なお、学習データベース105は、図12を用いて説明した学習データベース905と同様の方法で予め作成されている。本実施の形態では、学習データベース105は、同一のブロック位置から生成された学習特徴量(D115)と学習高周波パッチ(D116)とを1つのパッチペアとして対応付けて格納されるとともに、その対応付けを示す対応関係データベースインデックス(D125)も格納している。
【0079】
これにより、本実施の形態に係る超解像処理装置100は、パッチ抽出部103でデータベースを検索する際に、データベースインデックスが、前後のフレームの動き補償された動き補償データベースインデックスとの一致を考慮することで、出力画像において時間方向の画像ゆらぎを低減することができる。
【0080】
図2は、実施の形態1に係る超解像処理装置の動作例を示す図である。図3は、実施の形態1に係る遅延入力画像のブロックに対するデータベースインデックスが動き補償されて動き補償データベースインデックスを得ることを説明するための図である。
【0081】
以下、動き補償データベースインデックス(D127)を得るまでの過程を説明する。
【0082】
入力画像(D111)をフレーム遅延部111により遅延させた遅延入力画像(D123)は、例えば、入力画像の時刻をtとすると、時刻t−1などとなる。
【0083】
なお、遅延入力画像(D123)は、入力画像(D111)に対して時間的に直前のフレームでなくても構わず、時間的に2フレーム以上前のフレームであってもよい。また、遅延入力画像(D123)は、例えばMPEGやH.264などといった時間的に後のフレームを先に符号化したものを復号した場合などで、入力画像(D111)よりも時間的に後、すなわち未来の時刻のフレームであっても構わない。つまり、遅延入力画像(D123)の時刻はt−2であっても、t+1であっても、それ以外であっても構わない。
【0084】
図2の(a)に示す入力画像(D111)は、飛行機が右上に向かって飛んでいる例である。図2の(a)に示すように、入力画像(D111)における飛行機の位置は、遅延入力画像(D123)よりも右上へ移動している。
【0085】
動き検出部112は、入力画像(D111)中の対象ブロックの画像と類似したブロックを、第1のフレームメモリ121に格納された遅延入力画像(D123)の中から探索し、その位置を動き補償位置とする。そして動き補償位置から対象ブロック位置までの移動量を動きベクトル(D124)として算出する。
【0086】
ここで、例えば、動きベクトル(D124)の値を(dx,dy)として、対象ブロックの左上位置が(x,y)とすると、動き補償位置(左上)は(x+dx,y+dy)で求められる。動き検出の方法については、例えば非特許文献2「ディジタル画像圧縮の基礎:安田浩、渡辺裕/日経BP出版センター/1.3.2節」に説明されている動き検出法を利用してもよい。なお、それ以外の任意の動き検出法を利用してもよい。
【0087】
さらに、対象ブロックと動き補償位置のブロックとの類似度を、ブロック内の各画素同士のSAD演算(Sum of Absolute Differences: 差分絶対値和)によって求め、動き確度情報(D128)として出力する。なお、算出方法はこの方法に限られず、例えば差分自乗和など任意の方法で類似度を求めるとしてもよい。これにより、動き確度情報(D128)は、値が小さいほど類似度が高い(動き検出が確からしい)ことを意味する。
【0088】
図2の(b)は、遅延入力画像(D123)と同じ時刻の、パッチ抽出部103によって抽出された学習高周波パッチ(D116)を示すデータベースインデックス(D125)が、フレーム遅延部113によって第2のフレームメモリ123に格納された状態を示している。
【0089】
ここで、データベースインデックス(D125)とは、学習データベース105中の、学習特徴量(D115)と学習高周波パッチ(D116)とのペアを一意に識別するためのインデックス番号である。例えば、超解像処理の単位ブロックサイズが10×10画素、入力画像(D111)のサイズが1920×1080画素だとすると、フレームあたりの処理ブロック数は192×108個で、この数の、遅延入力画像(D123)と同じ時刻の遅延データベースインデックス(D126)が、第2のフレームメモリ123中に格納される。
【0090】
遅延データベースインデックス(D126)のうち、対象ブロックに対応する動き補償された位置は、第2のフレームメモリ123における2次元位置を(X,Y)として、例えば、
【数1】

として求められる。ここで、bxおよびbyは、それぞれ、超解像処理単位ブロックの水平サイズおよび垂直サイズであり、round()は、小数点以下を四捨五入する関数である。なお、位置の求め方は、round()の代わりに、小数点以下切捨て、小数点以下切り上げ、など、任意の方法で整数化してもよい。
【0091】
この位置(X,Y)の遅延データベースインデックス(D126)を、動き補償データベースインデックス(D127)とする。
【0092】
つまり、図3に示すように、前フレームすなわち遅延入力画像(D123)に対する処理結果を、動き補償して取得する。
【0093】
換言すると、まず、動き補償部114は、動き検出部112により検出された動きに基づき、パッチ抽出部103により過去の入力画像(D111)に対して抽出された学習特徴量(D115)を特定するためのデータベースインデックス(D125)が過去の入力画像のブロック毎に対応させてマッピングされた過去データをブロック単位で動き補償した動き補償データベースインデックス(D127)を生成する。
【0094】
次に、パッチ抽出部103では、動き確度情報(D128)、入力特徴量(D114)、動き補償データベースインデックス(D127)に基づいて、学習データベース105中の各学習特徴量(D115)に対する評価値を算出する。そして、パッチ抽出部103は、学習データベース105から、算出した評価値が示す入力特徴量(D114)に最も類似する学習特徴量(D115)と対応づけられた学習高周波パッチ(D116)を抽出する。このようにして、時間連続性を考慮して学習特徴量(D115)を検索することができるので、時間連続性を考慮した学習高周波パッチ(D116)を抽出することができる。
【0095】
以下、パッチ抽出部103が、評価値(以下、評価値eと記載)を算出する方法について説明する。
【0096】
例えば、パッチ抽出部103は、評価値eを以下のように算出する。
【0097】
【数2】

【0098】
ここで、入力特徴量をInF、学習特徴量をTrF、特徴量の各要素成分を示す記号を(i,j)、特徴量の各要素成分同士のSAD演算をsad()としている。またc1は正の定数である。なお、例えば動き確度情報(D128)の値があらかじめ設定した閾値よりも小さい場合に、動き確度が高い、それ以外を動き確度が低い、と判断する。
【0099】
また、例えば、パッチ抽出部103は、評価値eを以下のように算出してもよい。
【0100】
【数3】

【0101】
ここで、c2は0<c2<1なる定数である。
【0102】
また、例えば、パッチ抽出部103は、評価値eを以下のように算出してもよい。
【0103】
【数4】

【0104】
ここで、mc_sadは、動き確度情報(D128)の値であり、動き検出の確度が高いほど小さい値を持ち、func1()は、広義単調減少関数である。
【0105】
また、例えば、パッチ抽出部103は、評価値eを以下のように算出してもよい。
【0106】
【数5】

【0107】
ここで、func2()は、広義単調増加関数であり、値域は0以上1以下である。
【0108】
なお、パッチ抽出部103は、評価値eを算出する際に上記の例以外の算出式を用いてもよい。動き検出の確度が同じ、かつ、入力特徴量(D114)と学習特徴量(D116)との類似度が同じである条件下で、学習データベースインデックス(D125)が動き補償データベースインデックス(D127)と異なる場合に比べて同じ場合の方が、評価値eが小さくなるような算出式を用いてもよい。また、入力特徴量(D114)と学習特徴量(D116)との類似度が同じ、かつ、学習データベースインデックスが動き補償データベースインデックス(D127)と同じである条件下で、動き確度がより高い場合、すなわち動き確度情報(D128)の値がより小さい場合に、評価値eが同じかより小さくなるような算出式を用いてもよい。
【0109】
また、学習データベースインデックスによって示される学習高周波パッチ(D116)が、動き補償データベースインデックス(D127)によって示される学習高周波パッチ(D116)と類似しているかどうかを判断するとしてもよい。この場合、より類似しているほど、評価値eを同じか小さくするように制御する。また、類似の度合いは、例えば、学習高周波パッチ(D116)同士のSAD演算で得られる。なお、あらかじめ類似の度合いが大きいものを、近いデータベースインデックスの値に割り当てておいて、データベースインデックスの値を比較するだけで類似の度合いを判断してもよい。
【0110】
以上のように、動き検出が成功している場合には、動き補償データベースインデックス(D127)で特定される学習特徴量(D115)の評価値eがより小さくなることでよりパッチ抽出部103に検索(選択)されやすくなる。それにより、パッチ抽出部103が抽出する推定高周波パッチ(D117)の時間連続性が高まる。また動き検出が失敗している場合は、評価値eの修正量が小さくなるため、時間連続性を考慮せずに、入力特徴量により類似した学習特徴量(D115)が検索される。よって、必要に応じて時間連続性が考慮され、高周波ゆらぎの少ない、安定した高精彩な出力画像を得ることができる。
【0111】
<超解像処理方法>
図4は、実施の形態1に係る超解像処理装置100の超解像処理を説明するためのフローチャートである。
【0112】
まず、フレーム遅延部111は、入力画像(D111)を第1のフレームメモリ121に格納する(S101)。
【0113】
次に、拡大部101は、入力画像(D111)を所望の画像サイズに拡大した拡大画像(D113)を生成する(S102)。
【0114】
なお、入力画像があらかじめ拡大されている場合や、入力画像の時点で画像の周波数分布が低周波に偏っている場合などは、入力画像サイズを増加させなくとも超解像効果が得られる。その場合、S102を省略、すなわち、拡大部B101を省略し、拡大画像(D113)は、入力画像(D111)となる。
【0115】
次に、特徴量抽出部102は、拡大画像(D113)から、特徴量を抽出して入力特徴量(D114)として出力する(S103)。
【0116】
次に、動き検出部112は、入力画像(D111)と、遅延入力画像(D123)との間の、画像内オブジェクトなどの動きを検出する。そして、動き検出部112は、検出した動き(動き量)を示す動きベクトル(D124)を出力する。ここで、遅延入力画像(D123)は、S107で第1のフレームメモリ121に格納された前フレーム(過去の入力画像)の画像データである。そのため、最初に処理するフレームではまだ生成されておらず、この処理は行わない。なお、動きの検出は、所定のブロック単位で行ってもよく、また、画像内のオブジェクトごとに任意に領域を分割して、その領域単位で行ってもよい。ここで、動き検出部112は、さらに、検出した動きの確からしさを示す動き確度情報(D128)を出力する(S104)。
【0117】
次に、動き補償部114は、S104で求めた動きベクトル(D124)に示される動き量に従って遅延データベースインデックス(D126)を動き補償して生成した動き補償データベースインデックス(D127)を出力する。なお、遅延データベースインデックス(D126)は、前フレームでのS107で生成されるため、最初に処理するフレームではまだ生成されておらず、この処理は行わない(S105)。
【0118】
次に、パッチ抽出部103は、入力特徴量(D114)と学習特徴量(D115)との類似度がより大きいほど、小さくなる評価値を用いて、評価値が最小の学習特徴量(D115)を検索する。パッチ抽出部103は、検索して得た学習特徴量(D115)に対応する学習高周波パッチ(D116)を抽出し、推定高周波パッチ(D117)として出力する(S106)。
【0119】
ここで、パッチ抽出部103は、動き確度情報(D128)により動き検出が確からしいと判断した場合、上記検索時の評価値は、動き補償データベースインデックス(D127)と等しいデータベースインデックス(D125)を持つ学習特徴量(D115)に対しては、評価値を同じかより小さい値に修正した上で検索を行う。一方、動き確度情報(D128)により動き検出が確からしくないと判断した場合、評価値の修正は行わない。なお、動き確度情報(D128)に関わらず評価値の修正を常に実施しても構わない。
【0120】
次に、パッチ抽出部103で検索して得た(選択した)学習特徴量(D115)および学習高周波パッチ(D116)のペアに対応するデータベースインデックス(D125)を、フレーム遅延部113においてインデックスメモリ(第2のフレームメモリ123)に格納する(S107)。
【0121】
ここで、パッチ抽出部103は、さらに、動き補償データベースインデックス(D127)と等しいデータベースインデックス(D125)を持つ学習特徴量(D115)に対しては、その評価値をより小さく修正した上で検索を行う。
【0122】
次に、加算部104は、拡大画像(D113)と、推定高周波パッチ(D117)とを加算することにより出力画像(D112)を生成する(S108)。
【0123】
<効果>
以上のように、前後の時刻のフレームにおける動き補償された学習データベースインデックスと同じ学習データベースインデックスで示される学習特徴量に対する評価値をより小さい値にする。それにより、動き補償された位置で選択された学習高周波パッチ(D116)と同じものを選択されやすくすることができるので、付加される推定高周波パッチ(D117)の時間連続性を高めることができ、高周波のゆらぎが少ない、高精細な出力画像を生成することができる。
【0124】
以上、本実施の形態によれば、入力画像に対して時間方向にゆらぎにくく安定した高周波成分を付加する超解像処理を行うことができるので、時間的に連続する複数の画像フレーム間において、フリッカーの発生を抑制できる超解像処理装置を実現することができる。
【0125】
なお、実施の形態1では、学習データベース105は、図12を用いて説明した学習データベース905と同様の方法で予め作成されているとしたが、それに限らない。
【0126】
例えば、学習データベース105は、学習画像の高周波成分から得られたデータである学習高周波パッチ(D116)と、その学習画像の少なくとも低周波成分から得られたデータである学習特徴量(D115)とのパッチペアだけでなく、パッチペアである学習特徴量(D115)と学習高周波パッチ(D116)とを回転、転置などの画像変換を行ったものをパッチペアとして複数格納していてもよい。
【0127】
その場合、データベースインデックス(D125)と共に、画像変換の方法を示す画像変換インデックスを保持することが好ましい。そして、パッチ抽出部103は、動き補償位置のデータベースインデックス(D125)と画像変換インデックスが一致するパッチに対する評価値を下げるとすればよい。
【0128】
ここで、回転、転置などの画像変換を行ったパッチペアの一例を用いて説明する。
【0129】
図5は、実施の形態1に係る学習データベースに格納される画像変換が行われたパッチペアの1例を説明するための図である。ここで、図5では、1個の学習特徴量(D115)を示すデータP12からL個の学習特徴量(D115)を示すデータP120が生成されている場合の例を示している。なお、画像変換が行われた学習高周波パッチ(D116)を生成する場合も同様であるため、学習特徴量(D115)の場合のみを説明する。
【0130】
図5の例では、学習特徴量(D115)を示すデータP12を2次元配列とみなし、横方向や縦方向に配列を反転させたり、配列の転置を行ったり、配列の要素である数値データの正負符号やビットを反転させることで、L=16個の学習特徴量(D115)を示すデータを生成している。なお、配列の要素である数値データpが例えば0〜255に正規化されている場合、数値データの正負符号の反転は255−pを意味する。
【0131】
一般に、P120の生成は次式で表される。
【0132】
P120[k][l]=G(P12[k],l) ・・・(1)
【0133】
ただし、G(X,l)はXからパラメータlを用いて新しいパターンを生成する関数であり、k=1,・・・,Kである。パラメータlは、例えば図5の例では、l=1,・・・,Lである。
【0134】
なお、L個の学習特徴量(D115)を示すデータを生成する方法は、上記のみによらず、例えば、パッチ抽出部103が検索に使用するデータサイズよりも大きなデータを学習データベース105で保持している場合は、配列要素を平行移動させたり、アフィン変換などを用いて配列パターンの回転等の変形を行ったりしても良い。このとき、非整数位置の配列データが必要な場合は、例えばバイキュービック法により補間生成すればよい。
【0135】
また、学習データベース105に格納されるパッチペアの構成は、上記の場合に限られない。例えば、学習データベース105は、類似したパッチ同士が同じクラスに属するように分類した情報が格納されているとしてもよい。その場合、パッチ抽出部103は、動き補償データベースインデックス(D127)と同じクラスに属するパッチ(例えば学習高周波パッチ(D116))に関して、評価値を下げる処理を行う。
【0136】
より具体的には、学習データベース105には、類似した学習高周波パッチ(D116)同士が同じクラスに属するようにクラス分類されている。この場合、パッチ抽出部103は、入力画像(D111)のブロックと対応する、動き補償部114により動き補償された過去データのブロックのデータベースインデックス(D125)により特定される学習特徴量(D115)と対応付けられた学習高周波パッチ(D116)と同じクラスに属する学習高周波パッチ(D116)における学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正すればよい。
【0137】
なお、上記クラス分類には、K−means法を用いても良く、その他のクラス分類手法を用いても良い。また、各パッチが複数のクラスに属するようなクラス分類を行っても良い。また、上記類似の度合いを測る指標としては、画素単位のSADやSSDが考えられるが、それ以外の指標であってもよい。
【0138】
(実施の形態2)
以下、実施の形態2について説明する。なお、以降の実施の形態では、既に説明した実施の形態と同様の要素に関しては説明を省略し、相違点を主に説明する。また、各実施の形態において同様の要素には同一の符号を付している。
【0139】
以下、実施の形態2に係る超解像処理装置200について説明する。図6は、実施の形態2に係る超解像処理装置の構成を示すブロック図である。なお、図1と同様の要素には同一の符号を付しており、詳細な説明は省略する。
【0140】
図6に示す超解像処理装置200は、入力画像(D111)に学習データベース105を用いた超解像処理を行うことにより、入力画像(D111)より解像度が大きい出力画像(D112)を生成する。
【0141】
図6に示す超解像処理装置200は、実施の形態1に係る超解像処理装置100に対して、パッチ抽出部203とフレーム遅延部213と、動き補償部214との構成が異なる。なお、入力画像(D111)があらかじめ拡大されている場合や、入力画像(D111)の時点で画像の周波数分布が低周波に偏っている場合などは、入力画像(D111)のサイズを増加させなくとも超解像効果が得られる。そのことから、実施の形態1と同様拡大部101を省略してもよい。この場合、拡大画像(D113)は、入力画像(D111)で代えられる。
【0142】
フレーム遅延部213は、内部に第2のフレームメモリ123を有しており、1フレーム分の各ブロック位置の推定高周波パッチ(D117)をフレーム単位で遅延させて、遅延高周波成分(D226)を出力する。
【0143】
動き補償部214は、動き検出部112により検出された動きに基づき、パッチ抽出部103により過去の入力画像(D111)に対して抽出された学習特徴量(D115)を特定するための特定情報が過去の入力画像のブロック毎に対応させてマッピングされた過去データをブロック単位で動き補償する。具体的には、動きベクトル(D124)に示される動き量に従って遅延高周波成分(D226)を動き補償し、動き補償高周波成分(D227)を出力する。
【0144】
パッチ抽出部203は、学習データベース105に格納されている複数の学習特徴量(D115)それぞれと、入力特徴量(D114)との類似度を示す評価値をブロック単位で算出し、学習データベース105から、算出した評価値の示す入力特徴量(D114)に最も類似する学習特徴量(D115)と対応づけられた学習高周波パッチ(D116)を抽出する。
【0145】
ここで、特定情報は、パッチ抽出部203により過去の入力画像(D111)に対して抽出された学習高周波パッチ(D116)である。本実施の形態では、パッチ抽出部203は、入力画像(D111)のブロックと対応する動き補償部214により動き補償された過去データのブロックの学習高周波パッチ(D116)と対応づけられた学習特徴量(D115)と、当該入力画像(D111)のブロックに対応する入力特徴量(D114)との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正する。なお、その他については、上述したパッチ抽出部103と同様であるため説明を省略する。
【0146】
より具体的には、本実施の形態では、具体的には、パッチ抽出部203は、入力特徴量(D114)と学習特徴量(D115)との類似度が大きいほど小さくなる評価値を用いて、評価値が最小の学習特徴量(D115)を検索する。パッチ抽出部203は、検索して得た学習特徴量(D115)に対応する学習高周波パッチ(D116)を、推定高周波パッチ(D117)として出力する。
【0147】
ここで、パッチ抽出部103は、上記検索時の評価値を、動き補償高周波成分(D227)と学習高周波パッチ(D116)との類似度が大きいほど、評価値を同じかより小さい値に修正した上で検索を行う。さらに、パッチ抽出部103は、動き確度情報(D128)により示される動き検出の確からしさが高いほど、すなわちより確からしいほど、該評価値の修正量を同じかより大きく修正して算出した上で検索を行う。
【0148】
これにより、本実施の形態に係る超解像処理装置200は、拡大画像(D113)に無い高周波成分を付加する際に、前後のフレームの動き補償された高周波成分との類似度を考慮することで、出力画像において時間方向の画像ゆらぎを低減することができる。
【0149】
図7は、実施の形態2に係る超解像処理装置の動作例を示す図である。
【0150】
以下、図7を用いて、動き補償高周波成分(D227)を得るまでの過程を説明する。
【0151】
なお、図7の(a)の説明は、図2の(a)と同じとなるので、説明を省略する。動きベクトル(D124)の値を(dx,dy)として、対象ブロックの左上位置が(x,y)とすると、動き補償位置(左上)は(x+dx,y+dy)で求められる。
【0152】
図7の(b)は、遅延入力画像(D123)と同じ時刻の、パッチ抽出部203によって抽出された推定高周波パッチ(D117)が、フレーム遅延部213によって第2のフレームメモリ123に格納された状態を示している。
【0153】
ここで、拡大部101による拡大率を水平rx、垂直ryとすると、遅延入力画像の1フレームの画像サイズに対する、遅延高周波成分の1フレームの画像サイズは、水平rx、垂直ry倍で表せる。なお、拡大部101が省略されている場合は、rx=1、ry=1とする。
【0154】
したがって、動き補償高周波成分(D227)の左上位置(X,Y)は、以下のように求められる。
【0155】
【数6】

【0156】
そして、この位置(X,Y)の遅延高周波成分(D226)を、動き補償高周波成分(D227)とする。
【0157】
つまり、前フレームすなわち遅延入力画像(D123)に対する処理結果を、動き補償して取得する。
【0158】
換言すると、まず、動き補償部214は、動き検出部112により検出された動きに基づき、パッチ抽出部103により過去の入力画像(D111)に対して抽出された推定高周波パッチ(D117)が過去の入力画像のブロック毎に対応させてマッピングされた過去データをブロック単位で動き補償して動き補償高周波成分(D227)を生成する。
【0159】
次に、パッチ抽出部203では、入力特徴量(D114)、動き補償高周波成分(D227)に基づいて、学習データベース105中の各学習特徴量(D115)に対する評価値を算出する。そして、パッチ抽出部203は、学習データベース105から、算出した評価値が示す入力特徴量(D114)に最も類似する学習特徴量(D115)と対応づけられた学習高周波パッチ(D116)を抽出する。このようにして、時間連続性を考慮して学習特徴量(D115)を検索することができるので、時間連続性を考慮した学習高周波パッチ(D116)を抽出することができる。
【0160】
以下、パッチ抽出部203が、評価値(以下、評価値eと記載)を算出する方法について説明する。
【0161】
例えば、パッチ抽出部203は、評価値eを以下のように算出する。
【0162】
【数7】

【0163】
ここで、入力特徴量をInF、学習特徴量をTrF、動き補償高周波成分をMCTrH、学習高周波パッチ(D116)をTrH、特徴量の各要素成分同士のSAD演算(差分絶対値を累算する演算)をsad()とし、func3()は、広義単調増加関数であり、値域は0以下である。
【0164】
また、例えば、パッチ抽出部203は、評価値eを以下のように算出してもよい。
【0165】
【数8】

【0166】
ここで、func4()は、広義単調増加関数であり、値域は0以上1以下である。
【0167】
また、例えば、パッチ抽出部203は、評価値eを以下のように算出してもよい。
【0168】
【数9】

【0169】
ここで、mc_sadは、動き確度情報(D128)の値であり、動き検出の確度が高いほど小さい値を持ち、func5()およびfunc6()は、広義単調増加関数である。
【0170】
なお、パッチ抽出部203は、評価値eを算出する際に上記の例以外の算出式を用いてもよい。動き検出の確度が同じ、かつ入力特徴量(D114)と学習特徴量(D116)との類似度が同じである条件下で、学習高周波パッチ(D116)と動き補償高周波成分(D227)の類似度が大きいほど評価値eが同じか小さくなるような算出式を用いてもよい。また、入力特徴量(D114)と学習特徴量(D116)との類似度が同じであり、かつ学習高周波パッチ(D116)と動き補償高周波成分(D227)の類似度が同じである条件下で、動き検出の確度が高いほど評価値eが同じか小さくなるような算出式を用いてもよい。
【0171】
以上のように、動き検出が成功している場合には、学習特徴量(D116)が動き補償高周波成分(D227)に類似するほど評価値eがより小さくなる傾向がある。そのため、パッチ抽出部103に検索(選択)されやすくなるので、推定高周波パッチ(D116)の時間連続性が高まる。また動き検出が失敗している場合は、評価値eの修正量が小さくなるため、時間連続性を考慮せずに、入力特徴量により類似した学習特徴量(D115)が検索される。よって、必要に応じて時間連続性が考慮され、高周波ゆらぎの少ない、安定した高精彩な出力画像を得ることができる。
【0172】
<超解像処理方法>
図8は、実施の形態1に係る超解像処理装置200の超解像処理方法を説明するためのフローチャートである。なお、図4で説明したステップと同様のステップについては、説明を省略する。具体的には、S201〜S204と、S208とは、図4のS101〜S204およびS108と同様の処理を行うため説明を省略する。
【0173】
S205において、動き補償部214は、S104で求めた動きベクトル(D124)に示される動き量に従って遅延高周波成分(D226)を動き補償して生成した動き補償高周波成分(D227)を出力する。なお、遅延高周波成分(D226)は、前フレームでのS207で生成されるため、最初に処理するフレームではまだ生成されておらず、この処理は行わない(S205)。
【0174】
次に、パッチ抽出部203は、入力特徴量(D114)と学習特徴量(D115)との類似度が大きいほど小さくなる評価値を用いて、評価値が最小の学習特徴量(D115)を検索する。パッチ抽出部203は、検索して得た学習特徴量(D115)に対応する学習高周波パッチ(D116)を抽出し、推定高周波パッチ(D117)として出力する(S206)。
【0175】
次に、パッチ抽出部203は、抽出した推定高周波パッチ(D117)を、フレーム遅延部213におけるインデックスメモリ(第2のフレームメモリ123)に格納する(S207)。
【0176】
ここで、パッチ抽出部103は、さらに、動き補償高周波成分(D227)と学習高周波パッチ(D116)との類似度がより高いほど、その評価値を同じかより小さく修正した上で検索を行う。
【0177】
<効果>
以上のように、学習高周波パッチ(D116)が、前後の時刻のフレームにおける動き補償高周波成分(D227)と類似している場合に評価値をより小さい値にする。それにより、動き補償された位置で選択された学習高周波パッチ(D116)を選択されやすくすることができるので、付加される推定高周波パッチ(D117)の時間連続性を高めることができ、高周波のゆらぎが少ない、高精細な出力画像を生成することができる。
【0178】
以上、本実施の形態によれば、入力画像に対して時間方向にゆらぎにくく安定した高周波成分を付加する超解像処理を行うことができるので、時間的に連続する複数の画像フレーム間において、フリッカーの発生を抑制できる超解像処理装置を実現することができる。
【0179】
なお、本実施の形態では、学習データベース105は、図12を用いて説明した学習データベース905と同様の方法で予め作成されているとして説明が、それに限らない。
【0180】
例えば、学習データベース105は、実施の形態1と同様、学習画像の高周波成分から得られたデータである学習高周波パッチ(D116)と、その学習画像の少なくとも低周波成分から得られたデータである学習特徴量(D115)とのパッチペアだけでなく、パッチペアである学習特徴量(D115)と学習高周波パッチ(D116)とを回転、転置などの画像変換を行ったパッチペアを複数格納していてもよい。
【0181】
すなわち、パッチ抽出部203は、学習データベース105に格納されている回転、転置などの画像変換が行われたパッチペアのうちから学習高周波パッチ(D116)を選択し推定高周波パッチ(D117)として利用してもよい。その場合、パッチ抽出部203における類似度の評価は、動き補償画像と、学習データベース105の学習高周波パッチ(D116)を画像変換した学習高周波パッチ(D116)との類似度の評価とすることが望ましい。
【0182】
(実施の形態3)
さらに、上記各実施の形態で示した超解像処理方法の構成を実現するためのプログラムを、フレキシブルディスク等の記憶媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
【0183】
図9A〜図9Cは、本発明の実施の形態3として、上記実施の形態1または2の超解像処理方法を格納したフレキシブルディスクを用いて、コンピュータシステムにより当該超解像処理方法を実施する場合の説明図である。
【0184】
図9Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示す。図9Aは、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。したがって、上記プログラムを格納したフレキシブルディスクFDでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムとしての超解像処理方法が記録されている。
【0185】
また、図9Cは、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムとしての超解像処理方法を、フレキシブルディスクドライブFDDを介して書き込む。また、フレキシブルディスクFD内のプログラムにより上記超解像処理方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブFDDによりプログラムをフレキシブルディスクFDから読み出し、コンピュータシステムCsに転送する。
【0186】
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ハードディスク、CD−ROM、メモリカード、ROMカセット等、プログラムを記録できるものであれば同様に実施できる。
【0187】
(実施の形態4)
本発明の実施の形態4では、超解像処理装置、超解像処理方法、及び超解像処理プログラムを用いたテレビジョン受像機を、図10を用いて説明する。
【0188】
図10は、実施の形態4におけるテレビジョン受像機のブロック図である。
【0189】
テレビジョン受像機800は、放送受信装置801と、入力選択装置802と、画像処理装置803と、パネル駆動装置804と、ディスプレイパネル805とを備える。図10において、説明の都合上、各装置801から804はテレビジョン受像機800の外部に配置しているが、実際はテレビジョン受像機800の内部に配置されている。
【0190】
放送受信装置801は、外部アンテナ(図示せず)から出力されるアンテナ出力信号(D821)から放送電波を受信し、当該放送電波を復調した映像信号を放送映像信号(D822)として出力する。
【0191】
入力選択装置802は、DVD或いはBD(Blu−ray Disc)レコーダ、又はDVD或いはBDプレイヤなどの外部映像機器から出力された外部映像信号(D820)と、放送映像信号(D822)とのうち、ユーザーによる選択に従っていずれか一方を選択する。そして、入力選択装置802は、選択した映像信号を入力映像信号(D823)として出力する。
【0192】
画像処理装置803は、入力映像信号(D823)がインターレース信号の場合は、当該入力映像信号(D823)をプログレッシブ信号に変換するI/P変換を施したり、入力映像信号(D823)に対してコントラストを改善する画質改善処理を施したりする。また、画像処理装置803は、本発明の実施の形態1に係る超解像処理装置100を備え、上述した超解像処理方法、又は、超解像処理プログラムを用いた超解像処理を入力映像信号(D823)に施す。そして、画像処理装置803は、その結果を画質改善映像信号(D824)として出力する。なお、画像処理装置803は、実施の形態2に係る超解像処理装置を備えてもよい。
【0193】
パネル駆動装置804は、画質改善映像信号(D824)を、ディスプレイパネル805を駆動するための専用信号に変換し、変換後の信号をパネル駆動用映像信号(D825)として出力する。
【0194】
ディスプレイパネル805は、パネル駆動用映像信号(D825)に従って電気信号を光信号に変換し、変換した光信号により所望の映像を表示する。
【0195】
このように、上記実施の形態の超解像処理装置、超解像処理方法、及び超解像処理プログラムをテレビジョン受像機800に用いることが可能である。そして、当該テレビジョン受像機800は、上記実施の形態で説明した効果を得ることができる。なお、上記実施の形態の超解像処理装置、超解像処理方法、及び超解像処理プログラムは、テレビジョン受像機に限らず、同様にして、レコーダ機器、プレイヤ機器及び携帯機器などの様々なデジタル映像機器に用いることが可能であり、いずれの場合も上記実施の形態で説明した効果を得ることができる。ここで、レコーダ機器とは、DVDレコーダ、BDレコーダ、及びハードディスクレコーダ等である。プレイヤ機器とは、例えば、DVDプレイヤ、及びBDプレイヤ等である。携帯機器とは、携帯電話、及びPDA(Personal Digital Assistant)等である。
【0196】
(その他変形例)
なお、本発明を上記実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。
【0197】
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、及びマウスなどから構成されるコンピュータシステムである。前記RAM又はハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
【0198】
(2)上記の各装置を構成する構成要素の一部又は全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、及びRAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
【0199】
(3)上記の各装置を構成する構成要素の一部又は全部は、各装置に脱着可能なICカード又は単体のモジュールから構成されているとしてもよい。前記ICカード又は前記モジュールは、マイクロプロセッサ、ROM、及びRAMなどから構成されるコンピュータシステムである。前記ICカード又は前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカード又は前記モジュールは、その機能を達成する。このICカード又はこのモジュールは、耐タンパ性を有するとしてもよい。
【0200】
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
【0201】
また、本発明は、前記コンピュータプログラム、又は、前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO(Magneto Optical Disc)、DVD、DVD−ROM、DVD−RAM、BD、又は半導体メモリなどに記録したものとしてもよい。また、本発明は、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
【0202】
また、本発明は、前記コンピュータプログラム又は前記デジタル信号を、電気通信回線、無線或いは有線通信回線、インターネットを代表とするネットワーク、又はデータ放送等を経由して伝送するものとしてもよい。
【0203】
また、本発明は、マイクロプロセッサとメモリとを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムに従って動作するとしてもよい。
【0204】
また、前記プログラム、或いは、前記デジタル信号を前記記録媒体に記録して移送することにより、又は、前記プログラム、或いは前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
【0205】
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
【産業上の利用可能性】
【0206】
本発明は超解像処理装置に適用できる。また、本発明は、テレビジョン受像機、DVDレコーダ、BDレコーダ、ハードディスクレコーダ、DVDプレイヤ、及びBDプレイヤ等のデジタル映像機器に有用である。また、本発明は、超解像処理方法、及び超解像処理プログラムに有用である。
【符号の説明】
【0207】
100、200、900 超解像処理装置
101、901 拡大部
102、902 徴量抽出部
103、203、903 パッチ抽出部
104、904 加算部
105、905 学習データベース
111、113、213 フレーム遅延部
112 動き検出部
114、214 動き補償部
121、123 フレームメモリ
950 学習データベース生成装置
951 ローパスフィルタ部
952 縮小部
953 拡大部
954、955 ハイパスフィルタ部

【特許請求の範囲】
【請求項1】
入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成する超解像処理装置であって、
前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、
前記入力画像から特徴量をブロック単位で抽出する特徴量抽出部と、
前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出部と、
前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出部と、
前記動き検出部により検出された動きに基づき、前記パッチ抽出部により前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応させてマッピングされた過去データをブロック単位で動き補償する動き補償部と、
前記入力画像と前記パッチ抽出部により抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算部とを備え、
前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する、
超解像処理装置。
【請求項2】
前記特定情報は、前記パッチ抽出部により前記過去入力画像に対して抽出された学習高周波パッチと当該学習高周波パッチに対応づけられた学習特徴量とを特定するデータベースインデックスであり、
前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックのデータベースインデックスにより特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正する、
請求項1に記載の超解像処理装置。
【請求項3】
前記特定情報は、前記パッチ抽出部により前記過去入力画像に対して抽出された学習高周波パッチであり、
前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの学習高周波パッチと対応づけられた学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正する、
請求項1に記載の超解像処理装置。
【請求項4】
前記評価値は、前記類似度が高いほど小さい値を示し、
前記パッチ抽出部は、
前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりもc1(c1>0)だけ減ずる値に修正する、
請求項1〜3のいずれか1項に記載の超解像処理装置。
【請求項5】
前記評価値は、前記類似度が高いほど小さい値を示し、
前記パッチ抽出部は、
前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合の評価値にc2(0<c1<1)を乗ずる値に修正する、
請求項1〜3のいずれかに1項に記載の超解像処理装置。
【請求項6】
前記動き検出部は、さらに、前記動きの検出の確からしさを示す動き確度情報を算出し、
前記パッチ抽出部、さらに、
前記動き確度情報に基づいて、前記動きの検出が確からしいと判断する場合に、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値に対する修正量を大きくする、
請求項1〜5のいずれか1項に記載の超解像処理装置。
【請求項7】
前記動き検出部は、さらに、前記動きの検出の確からしさを示す動き確度情報を算出し、
前記パッチ抽出部は、
前記動き確度情報に基づいて、前記動きの検出が確からしいと判断する場合にのみ、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正する、
請求項1〜5のいずれか1項に記載の超解像処理装置。
【請求項8】
前記動き確度情報は、
前記動き補償部により動き補償された過去データのブロックと、対応する前記入力画像のブロックとの類似度が高いほど、前記動きの検出がより確からしい旨を示す、
請求項7に記載の超解像処理装置。
【請求項9】
前記動き確度情報は、
前記動き補償部により動き補償された過去データのブロックと、対応する前記入力画像における対象ブロックとの間における各画素同士の差分絶対値和を含む、
請求項7に記載の超解像処理装置。
【請求項10】
前記動き確度情報は、前記差分絶対値和の値が小さいほど、前記動き補償部により動き補償された過去データのブロックと、対応する前記入力画像のブロックとの類似度が高い、
請求項9に記載の超解像処理装置。
【請求項11】
さらに、前記入力画像を所望の画像サイズに拡大して出力する拡大部を備え、
前記特徴量抽出部は、前記拡大部により拡大された前記入力画像から特徴量を抽出し、
前記加算部は、前記拡大部により拡大された前記入力画像と前記パッチ抽出部により抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する、
請求項1〜10のいずれか1項に記載の超解像処理装置。
【請求項12】
前記学習データベースには、類似した学習高周波パッチ同士が同じクラスに属するように分類されており、
前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックのデータベースインデックスにより特定される学習特徴量と対応付けられた学習高周波パッチと同じクラスに属する学習高周波パッチにおける学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正する、
請求項2に記載の超解像処理装置。
【請求項13】
入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成する超解像処理方法であって、
前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、
前記入力画像から特徴量をブロック単位で抽出する特徴量抽出ステップと、
前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出ステップと、
前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出ステップと、
前記動き検出ステップにおいて検出された動きに基づき、前記パッチ抽出ステップにおいて前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応されてマッピングされた過去データをブロック単位で動き補償する動き補償ステップと、
前記入力画像と前記パッチ抽出ステップにおいて抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算ステップとを含み、
前記パッチ抽出ステップでは、前記入力画像のブロックと対応する前記動き補償ステップにおいて動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する、
超解像処理方法。
【請求項14】
入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成するためのプログラムを記録した非一時的なコンピュータ読み取り可能な記録媒体であって、
前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、
前記入力画像から特徴量をブロック単位で抽出する特徴量抽出ステップと、
前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出ステップと、
前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出ステップと、
前記動き検出ステップにおいて検出された動きに基づき、前記パッチ抽出ステップにおいて前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応されてマッピングされた過去データをブロック単位で動き補償する動き補償ステップと、
前記入力画像と前記パッチ抽出ステップにおいて抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算ステップとを含み、
前記パッチ抽出ステップでは、前記入力画像のブロックと対応する前記動き補償ステップにおいて動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する、
ことをコンピュータに実行させるプログラムを記録した非一時的なコンピュータ読み取り可能な記録媒体。
【請求項15】
入力画像に学習データベースを用いた超解像処理を行うことにより、前記入力画像より高い解像度を有する出力画像を生成する集積回路であって、
前記学習データベースには、学習画像の高周波成分から得られたデータである学習高周波パッチと、前記学習画像の少なくとも低周波成分から得られたデータである学習特徴量とが対応づけられたパッチペアが複数格納されており、
前記入力画像から特徴量をブロック単位で抽出する特徴量抽出部と、
前記学習データベースに格納されている複数の学習特徴量それぞれと、前記特徴量との類似度を示す評価値をブロック単位で算出し、前記学習データベースから、算出した前記評価値の示す前記特徴量に最も類似する学習特徴量と対応づけられた学習高周波パッチを抽出するパッチ抽出部と、
前記入力画像と前記入力画像より時間的に前の入力画像である過去入力画像との間の動きをブロック単位で検出する動き検出部と、
前記動き検出部により検出された動きに基づき、前記パッチ抽出部により前記過去入力画像に対して抽出された学習特徴量を特定するための特定情報が前記過去入力画像のブロック毎に対応されてマッピングされた過去データをブロック単位で動き補償する動き補償部と、
前記入力画像と前記パッチ抽出部により抽出された学習高周波パッチとをブロック単位で加算することにより、前記出力画像を生成する加算部とを備え、
前記パッチ抽出部は、前記入力画像のブロックと対応する前記動き補償部により動き補償された過去データのブロックの特定情報に基づき特定される学習特徴量と、当該入力画像のブロックに対応する前記特徴量との評価値を、当該過去データのブロックの特定情報を用いない場合よりも高い類似度を示す値に修正して算出する、
集積回路。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図9C】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2013−31163(P2013−31163A)
【公開日】平成25年2月7日(2013.2.7)
【国際特許分類】
【出願番号】特願2012−139111(P2012−139111)
【出願日】平成24年6月20日(2012.6.20)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLU−RAY DISC
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】