説明

解像度変換装置、解像度変換方法及び動画像復号化装置

【課題】符号化画像に対する復号化の過程で、解像度変換処理と符号化歪み除去処理とを一度に施すことを可能とし、画像信号に対する信号処理を簡易な構成で容易に実現し得るようにした解像度変換装置、解像度変換方法及び動画像復号化装置を提供すること。
【解決手段】実施の形態によれば、解像度変換装置は、生成手段と出力手段とを備えている。生成手段は、それぞれが直交変換係数を含む、垂直方向P個×水平方向Q個(P,Qは正の整数でP=Q=1は除く)の対象ブロックで示される画像領域に対応して1つのブロックを設定し、当該ブロックに対して垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数の総数とは異なる数の直交変換係数を生成する。出力手段は、生成手段により生成した直交変換係数を逆直交変換して画像ブロックを生成し、その生成した画像ブロックを画像フレームの対応する位置に配置する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明の実施の形態は、例えばデジタルテレビジョン放送受信機等に使用される解像度変換装置、解像度変換方法及び動画像復号化装置に関する。
【背景技術】
【0002】
周知のように、現在、デジタル化された画像信号に対して高能率符号化による圧縮された情報を用いて、記録媒体により長時間のコンテンツを記録する装置や、衛星や地上局等からのデジタル放送波やネットワークを介してコンテンツを配信するサービスが実用化されている。
【0003】
このようなサービスにおいては、膨大な情報量を持つ画像・音声の情報を大量に放送・伝送するために、大きな圧縮率を実現する高能率符号化が必要となっている。この動画像の高能率符号化として国際規格であるMPEG2(moving picture experts group phase 2)等の符号化方式が用いられている。
【0004】
この符号化方式においては、画像信号の隣接画素間(空間方向)の相関、及び、隣接するフレーム間やフィールド間(時間方向)の相関を利用して情報量を圧縮する方式を用いている。すなわち、入力フレームの画像信号は、輝度信号で水平方向16画素×垂直方向16画素のマクロブロックと呼ばれる処理単位に分割される。
【0005】
この分割されたマクロブロックのデータは、さらに、水平方向8画素×垂直方向8画素単位の2次元ブロックに分割され、離散直交変換の一種である2次元DCT(discrete cosine transform:離散コサイン変換)処理が行なわれる。画像符号化装置は、このDCT処理により得られたDCT係数(離散コサイン変換係数)に対して量子化を行ない、それに対してエントロピー符号化を行なって符号化データを生成する。
【0006】
ところで、このように、DCT処理や量子化による符号化アルゴリズムを使って画像を圧縮する場合、この量子化により元の情報が失われるので、復号画像にブロック歪みやモスキート歪みといった符号化歪みが生じてしまい、高精度の画像復元を行なうことができなくなる。このため、復号化後の画像信号に対して、画像の量子化に伴なって失われた情報を高精度に復元する符号化歪み除去処理を施すことが必要となる。
【0007】
また、符号化された画像に対して、復号化側で解像度変換を行なう場合には、復号化後の画像信号に対して、上記した符号化歪み除去処理とは別個に解像度変換処理を施すことが必要となり、画像信号に対する信号処理が煩雑になっている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2001−320587号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
符号化画像に対して復号化を行なう過程で、解像度変換処理と符号化歪み除去処理とを一度に施すことを可能とし、画像信号に対する信号処理を簡易な構成で容易に実現し得るようにした解像度変換装置、解像度変換方法及び動画像復号化装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
実施の形態によれば、解像度変換装置は、生成手段と出力手段とを備えている。生成手段は、それぞれが直交変換係数を含む、垂直方向P個×水平方向Q個(P,Qは正の整数でP=Q=1は除く)の対象ブロックで示される画像領域に対応して1つのブロックを設定し、当該ブロックに対して垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数の総数とは異なる数の直交変換係数を生成する。出力手段は、生成手段により生成した直交変換係数を逆直交変換して画像ブロックを生成し、その生成した画像ブロックを画像フレームの対応する位置に配置する。
【図面の簡単な説明】
【0011】
【図1】現状における一般的な動画像符号化装置の一例を説明するために示すブロック構成図。
【図2】現状における一般的な動画像復号化装置の一例を説明するために示すブロック構成図。
【図3】実施の形態における動画像復号化装置によって行なわれる解像度変換処理動作の一例を説明するために示す図。
【図4】実施の形態における動画像復号化装置の一例を説明するために示すブロック構成図。
【図5】実施の形態における動画像復号化装置によって行なわれる解像度変換処理動作の他の例を説明するために示す図。
【図6】実施の形態における動画像復号化装置によって行なわれる解像度変換処理動作のさらに他の例を説明するために示す図。
【図7】実施の形態における動画像復号化装置の他の例を説明するために示すブロック構成図。
【図8】実施の形態における動画像復号化装置のさらに他の例を説明するために示すブロック構成図。
【図9】実施の形態における動画像復号化装置のさらに他の例を説明するために示すブロック構成図。
【図10】実施の形態における動画像復号化装置のさらに他の例を説明するために示すブロック構成図。
【発明を実施するための形態】
【0012】
以下、実施の形態に係る解像度変換技術を説明するに先立ち、現状における一般的な動画像符号化技術及び動画像復号化技術について簡単に説明する。まず、図1は、MPEG2規格等の高能率符号化処理を行なう一般的な動画像符号化装置11の構成を示している。すなわち、入力端子12に供給された画像信号は、ブロック分割部13に供給される。
【0013】
このブロック分割部13は、入力された画像信号を水平方向N画素、垂直方向N画素の符号化対象ブロックに分割し、符号化対象ブロック信号S1を生成する。そして、このブロック分割部13で生成された符号化対象ブロック信号S1は、減算部14の一方の入力端に供給される。
【0014】
また、この減算部14の他方の入力端には、動き補償・予測部15で作成された参照ブロック信号S2が供給されている。この動き補償・予測部15は、上記符号化対象ブロック信号S1に対して、参照フレームバッファ16に保存されているローカル復号画像から抽出したローカル復号画像信号S3を用いて動き補償予測を行ない、参照ブロック信号S2を作成している。
【0015】
そして、上記減算部14は、符号化対象ブロック信号S1から参照ブロック信号S2を減算して、予測残差ブロック信号S4を算出する。この減算部14から出力される予測残差ブロック信号S4は、直交変換部17に供給されて離散コサイン変換(DCT)等の2次元直交変換処理が施される。
【0016】
この直交変換部17による直交変換処理によって得られた予測残差直交変換係数信号S5は、量子化部18に供給されて量子化処理が施されることにより、情報量の削減が行なわれる。この量子化部18による量子化処理によって得られた量子化値信号S6は、エントロピー符号化部19に供給されて、動き補償予測の情報等とともにエントロピー符号化され、符号化データとして出力端子20から取り出される。
【0017】
一方、引き続く画像フレームの符号化における動き補償予測参照に備えるために、ローカル復号画像が生成されて参照フレームバッファ16に保存される。すなわち、直交変換係数を量子化した量子化値信号S6は、逆量子化部21に供給されて予測残差直交変換係数信号S7が生成される。この予測残差直交変換係数信号S7は、逆直交変換部22に供給されて2次元逆直交変換処理が行なわれることにより、予測残差ブロック信号S8が得られる。
【0018】
そして、この逆直交変換部22から得られる予測残差ブロック信号S8と、上記動き補償・予測部15から得られる参照ブロック信号S2とを加算部23に供給して加算することによりローカル復号画像信号S9が生成される。このローカル復号画像信号S9は、ループフィルタ24によりローカル復号画像の画質劣化を低減する処理を行なった後、参照フレームバッファ16に保存される。
【0019】
なお、符号化方式によっては、ループフィルタ24を用いないものもある。例えばMPEG2等では規格上ループフィルタは存在しない。このため、ループフィルタを用いない規格に準拠する符号化データを対象とする場合には、上記ループフィルタは何も処理を行なわずに、入力をそのまま出力することになる。
【0020】
図2は、上記した動画像符号化装置11によって生成された符号化データを復号化するための一般的な動画像復号化装置25の構成を示している。すなわち、上記動画像符号化装置11から出力された符号化データは、入力端子26を介してエントロピー符号復号化部27に供給される。
【0021】
このエントロピー符号復号化部27は、入力された符号化データに対してエントロピー符号に対する復号化を行ない、予測残差直交変換係数の復号された量子化値信号S10を生成する。この量子化値信号S10は、逆量子化部28及び逆直交変換部29に順次供給される。
【0022】
このうち、逆量子化部28は、入力された量子化値信号S10を逆量子化することで予測残差直交変換係数信号S11を生成し、逆直交変換部29に出力している。また、この逆直交変換部29は、入力された予測残差直交変換係数信号S11に2次元逆直交変換を行なって復号された予測残差信号S12を生成し、加算部30の一方の入力端に出力している。
【0023】
この加算部30の他方の入力端には、動き補償・予測部31で作成された参照ブロック信号S13が供給されている。この動き補償・予測部31は、符号化データに多重化されて送られてきた動き補償予測の情報を用いて、フレームバッファ32から取得したローカル復号画像信号S14から、参照ブロック信号S13を作成している。
【0024】
そして、上記加算部30は、予測残差信号S12と参照ブロック信号S13とを加算して、復号された対象ブロック信号S15を算出する。この対象ブロック信号S15は、ループフィルタ33によって歪みの低減処理が行なわれた後、フレームバッファ32内の画像フレーム内の元の位置に置かれることにより復号画像が得られる。この復号画像は、引き続く画像フレームの復号に備えて、フレームバッファ32に保存される。この場合、符号化側でループフィルタ24が用いられた場合は、復号側でも同じループフィルタ33が用いられる。
【0025】
復号画像に対して、一般的には、さらに以下の処理が行なわれる。すなわち、上記フレームバッファ32に保存された復号画像は、符号化歪み除去フィルタ34に供給されて符号化歪みを低減する処理が行なわれ、その後、さらに、解像度変換部35に供給され、表示装置の解像度等に合わせて解像度の変換処理が行なわれて、出力端子36から取り出される。
【0026】
ここで、この解像度変換部35としては、処理の複雑度と得られる画質とによって、以下のように大きく3つに分類することができる。なお、以下の説明では、主に低い解像度の画像をより高い解像度の画像にする場合を想定して説明している。
【0027】
(1) 単純な補間フィルタと再サンプリングによる方法
この方法は、処理は簡単であるが、出力される高解像度画像では単純に画素数の水増しが行なわれているだけであり、画像の高周波成分が増えるわけではない。このため、解像度変換の倍率を高くしていくとぼけた画像となり、出力画像の質としては良くない。
【0028】
(2) 単純な補間フィルタに加えて高周波成分を強調する方法
この方法は、単純に高周波成分を強調する方法に加えて、より高度な処理を付加するようにしている。付加する処理としては、エッジ成分を検出してそれを綺麗にする処理や、符号化歪みを強調しないように抑える処理を行なうものもある。
【0029】
(3) さらに高度な処理を行なう方法
フレーム内超解像、あるいは、複数フレーム超解像と呼ばれる技術で、近年広く使われるようになってきた技術がこれに相当する。
【0030】
以上に述べたように、現状における一般的な動画像復号化技術では、復号化後の画像信号に対して、量子化に伴なって生じる符号化歪みを低減するために、符号化歪み除去フィルタ34を用いて符号化歪み除去処理を施すことが必要となる。また、復号化側で解像度変換を行なう場合には、復号化後の画像信号に対して、上記した符号化歪み除去処理とは別個に、解像度変換部35を用いて解像度変換処理を施すことが必要となり、画像信号に対する信号処理が煩雑になっている。
【0031】
そこで、ここで説明する実施の形態では、符号化画像に対して復号化を行なう過程で、解像度変換処理と符号化歪み除去処理とを一度に施すことを可能とし、画像信号に対する信号処理を簡易な構成で容易に実現し得るようにしている。
【0032】
以下、実施の形態について図面を参照して詳細に説明する。図3は、この実施の形態における解像度変換処理動作を説明するものである。ここでは、水平方向8画素×垂直方向8画素でなる符号化対象ブロックに対して直交変換処理を行なう符号化方式で符号化された画像信号に対して、復号化側で、水平方向の解像度を4/3(3分の4倍)にし、垂直方向の解像度は変えない解像度変換処理を行なう場合を例にとり、その処理動作について説明する。
【0033】
図3では、ブロック分割された入力画像から切り出した、水平方向に連続する3個の符号化対象ブロックに対する処理動作を示している。この各ブロックは、それぞれが、水平方向8画素×垂直方向8画素からなる符号化対象ブロックに対して2次元直交変換を行ない、得られた水平方向8個×垂直方向8個の直交変換係数を量子化したものからなる。
【0034】
ここで、1つのブロックが水平方向8個×垂直方向8個の直交変換係数からなる、連続する3つのブロックは、水平方向に見ると、合計で8×3=24個の直交変換係数を含むことになる。そして、水平方向の解像度を4/3倍にするためには、同じ画像の領域を表現するために、水平方向に24×4/3=32個の変換係数が必要となる。
【0035】
このために、この実施の形態では、入力となる垂直方向8個×水平方向(8×3=)24個でなるブロックの直交変換係数(192個)に対して、線型フィルタを掛けることにより、垂直方向8個×水平方向32個=256個の直交変換係数を推定生成する。
【0036】
このようにして生成された垂直方向8個×水平方向32個のサイズの直交変換係数ブロックに対して、垂直方向8個×水平方向32個のサイズに対応した2次元逆直交変換処理を行なうことにより、垂直方向8画素×水平方向32画素からなる出力画像ブロックが得られる。
【0037】
そして、この得られた画像ブロックを画像内の適切な位置に配置し、適切なアスペクト比(縦横比)になるようにして出力することにより、最終的に水平方向の解像度が4/3倍の高解像度出力画像を得ることができる。
【0038】
これに対し、先行技術では、1つの直交変換係数ブロックに着目して、そこに含まれる変換係数の数を増減する処理を行ない、1つの直交変換係数ブロックを出力するという処理が行なわれている。
【0039】
このとき、入力される直交変換係数ブロックが垂直方向M個×水平方向N個の直交変換係数からなり、出力する直交変換係数ブロックが垂直方向K個×水平方向L個の直交変換係数からなるとすると、解像度変換の倍率は、垂直方向にK/M倍、水平方向にL/N倍となる。
【0040】
すなわち、この現状の方法では、設定できる倍率として、垂直方向では分母がMとなる有理数、水平方向では分母がNとなる有理数に限定されることになる。そして、一般的に広く利用されている動画像符号化方式であるMPEG2では、M=N=8である。また、他の符号化方式でも、M及びNとして4あるいは8が採用されていることが多い。
【0041】
一方で、地上デジタル放送をより解像度の高いパネルに表示する場合等には、L/3倍というように、分母が3であるような倍率の変換が要求されることがある。ところが、現状における直交変換係数空間の操作による解像度変換方式では、先に説明したように、分母が3となるような変換倍率の解像度変換は実現不可能である。
【0042】
これに対して、この実施の形態では、垂直方向P個、水平方向Q個の直交変換係数ブロックをまとめて入力することにより、実現可能な解像度変換の倍率は、垂直方向にK/(PM)倍、水平方向にL/(QN)倍となる。例えば、Q=3、N=8とすると、水平方向にL/24倍という変換倍率が実現可能となり、分母が3であるような倍率も含めて、より自由度の高い倍率設定を行なうことができるようになる。
【0043】
複数ブロックをまとめることによる効果は、このように自由度の高い倍率設定ができることと同時に、以下で説明するように、基底長の長い表現によるより高画質な出力画像が得られることである。これは、1つのブロックを処理対象とする現状の技術では実現不可能である。
【0044】
すなわち、上記した実施の形態において特徴的なことは、直交変換の基底長が短い変換係数ブロックを複数個用いて、より長い基底長の直交変換係数ブロックを得ていることである。要するに、解像度変換を直交変換係数面で行なうためには、倍率に応じた数の直交変換係数を生成する必要がある。その際に、例えば垂直方向8個×水平方向8個でなる基底長の直交変換係数ブロック3つから、同じ垂直方向8個×水平方向8個の基底長を持つ直交変換係数ブロックを4つ生成するというのではなく、図3に示した例では、垂直方向8個×水平方向32個の基底長を持つ直交変換係数ブロックを1つ生成するという処理を行なっている。
【0045】
また、解像度変換で、入力画像よりもより高い解像度の出力画像を得る場合には、入力データ数よりも多くのデータを得る必要がある。そのために、この実施の形態では、入力データに対する線型変換として出力データを得ている。これは、行列を用いて数式で表わすと、以下のようになる。
【0046】
Y=HX … (1)
上式において、Xは入力直交変換係数ブロックの集合を縦行列として表現したものであり、図3に示した例では、垂直方向192個×水平方向1個の行列である。Yは出力直交変換係数ブロックの集合を縦行列として表現したものであり、図3に示した例では、垂直方向256個×水平方向1個の行列である。
【0047】
行列Hは入力データに対する線型変換の重みを表す行列であり、上の例では、垂直方向256個×水平方向192個の要素からなる行列である。この行列Hは、最適な出力Yが得られるように予め作成しておく。そのために、基準となる高解像度画像と、それをダウンサンプリングして作成した多数の低解像度画像とを用意しておき、高解像度画像から得られる垂直方向8個×水平方向32個の直交変換係数と、低解像度画像の対応する領域から得られる垂直方向8個×水平方向8個でなるブロック3ブロックに対して量子化した直交変換係数との相関を求めて、最適な推定が行なえるように求める。
【0048】
このとき、相関の無い直交変換係数間に対応する行列Hの要素はゼロになり、相関の有る係数間に対応する行列Hの要素のみが非ゼロの値となる。この結果、行列Hの多くの要素はゼロとなるため、実際に必要となる演算量は、行列Hのサイズから通常必要とされる積和の回数よりも遙かに少ない回数の演算で済むことになる。
【0049】
推定を行なう出力直交変換係数ブロックをより長い基底長とすることにより、高周波成分の推定をより自然に行なうことが可能となり、結果として、より高画質な出力画像を得ることができる。すなわち、直交変換としてよく用いられる離散コサイン変換を例にとると、例えばエッジ成分を離散コサイン変換した場合に、ある周波数に対応する変換係数と、その整数倍に対応する変換係数とが、その大きさが等比数列を成してきれいに出現する。
【0050】
これは、音響における倍音成分や、電波における高調波成分に対応するもので、画像の空間周波数成分において発生するものである。このような整数倍の周波数に相当する変換係数が、より長い基底長の変換を用いた場合には、より高い倍数のところまで表現できるため、より自然な周波数スペクトルの画像を得ることができるのである。
【0051】
さらに、このような推定を行なうことにより、符号化の際の直交変換係数に対する量子化による情報損失をある程度回復する効果も得られる。一般に、量子化による情報損失のため、出力画像に歪みが発生し画質劣化が引き起こされる。これは、エッジ周辺のもやもやした歪み(モスキート歪み)、ブロック境界の不連続な画像の変化(ブロック歪み)、細かい模様の画像領域がざらざらした感じになる歪みといった画質劣化として知覚される。
【0052】
この符号化歪みは、このような画質劣化として知覚されるだけではなく、解像度変換の際に高度な処理を行なう妨げにもなる。これを適切に処理しないと、解像度変換処理により符号化歪みを強調してしまったり、超解像処理のような解像度感を向上させる処理を適用できる画像領域が限られてしまうという悪影響を引き起こし、一方で、適切に処理するためには煩雑な適応処理が必要となる。
【0053】
この実施の形態では、上式(1)の行列Hを求める際に、量子化された低解像度画像の直交変換係数と、量子化していない高解像度画像の直交変換係数との相関を用いる。これにより、低解像度画像の量子化された直交変換係数から、より高解像度な画像に対して、量子化によって情報が失われる前の直交変換係数の推測を行なう。また、入力として、複数の直交変換係数ブロックを用いることにより、ランダムに発生する符号化歪みを加え合わせる効果が生じ、符号化歪みは統計的により小さな分散を持つようになる。
【0054】
以上のように、この実施の形態では、第1に、より自由な解像度変換倍率の設定が可能になる。第2に、長い基底長の変換係数を推定することによって、より自然な高周波成分の推測を行なうことが可能になる。また、第3に、量子化によって失われた情報を補う効果により、符号化歪みの軽減した高品質の出力画像を得ることが可能となっている。
【0055】
これは、上式(1)で示した線型推定を一様に適応するだけで、上記の第2,第3の2つの効果を同時に実現している。現状では、符号化歪み除去フィルタによる歪み低減処理と解像度変換処理とを別々に行なっており、しかも、高品質な出力画像を得るために、高度な処理を行なう場合においては、それぞれの処理において複雑な適応処理を必要としていたが、この実施の形態では、単純な線型処理を一回行なうだけで、2つの機能を同時にかつ安定して実現することが可能となっている。
【0056】
図4は、上記のように図3を用いて説明した解像度変換処理動作を実現するための動画像復号化装置37の一例を示している。図4において、図2と同一符号が付された、エントロピー符号復号化部27、逆量子化部28、垂直方向M個×水平方向N個の直交変換係数に対して2次元逆直交変換を行なうM×N逆直交変換部29、加算部30、動き補償・予測部31、フレームバッファ32、ループフィルタ33等については、図2で説明した動画像復号化装置25と同じ処理動作を行なっている。この部分は、フレーム間予測符号化を用いた動画像の符号化方式において、符号化側で使う参照フレームを復号側でも全く同じく再現し同じ参照ブロックを生成するために必要となるものである。
【0057】
この実施の形態で説明する動画像復号化装置37では、これに加えて、M×N直交変換部38、加算部39、解像度変換部40及びフレームバッファ41を備えている。このうち、M×N直交変換部38は、動き補償・予測部31から出力される参照ブロック信号S13に2次元直交変換を行ない、垂直方向M個×水平方向N個の参照ブロック直交変換係数を生成している。
【0058】
また、上記加算部39は、M×N直交変換部38の出力である参照ブロック直交変換係数信号S16と、上記逆量子化部28の出力である予測残差直交変換係数信号S11とを加算し、その加算結果である直交変換係数を解像度変換部40に出力している。この解像度変換部40は、変換係数バッファ40a、K×L変換係数線型推定部40b及びK×L逆直交変換部40cを備えている。
【0059】
このうち、変換係数バッファ40aは、加算部39から出力される直交変換係数信号S17を一時的に保存する。また、上記K×L変換係数線型推定部40bは、変換係数バッファ40aから垂直方向P個×水平方向Q個(P,Qは正の整数でP=Q=1は除く)でなり、隣接ブロックを使用する場合には、その使用する隣接ブロックの個数を加えたS個の直交変換係数ブロック(対象ブロック)を読み出し、その読み出した全ブロックを用いて垂直方向K個×水平方向L個の直交変換係数を有する直交変換係数ブロックを線型推定する。
【0060】
さらに、上記K×L逆直交変換部40cは、線型推定されたK×L個の直交変換係数に対して2次元逆直交変換を実行する。そして、このK×L逆直交変換部40cから得られた画像ブロックが、フレームバッファ41に供給されて画像フレーム内の適切な位置に配置され、最終的な出力画像として出力端子42から取り出される。なお、図4に示した動画像復号化装置37の処理動作を、図3で説明した例に対応させると、M=N=K=8、L=32、P=1、Q=3、S=3となる。
【0061】
ここで、図4に示した動画像復号化装置37が解像度変換処理を行なうために必要な要素は、変換係数バッファ40a、K×L変換係数線型推定部40b及びK×L逆直交変換部40cであり、これらにより解像度変換部40が構成される。また、現状における動画像復号化装置25に無いM×N直交変換部38及び加算部39は、現状の動画像復号化装置25で得られる予測残差直交変換係数ブロックを、この実施の形態で示す動画像復号化装置37の解像度変換部40で必要とする直交変換係数ブロックにするために設けられている。
【0062】
図3で説明した解像度変換処理動作では、垂直方向8個×水平方向8個の直交変換係数を有するブロックを3つ用いて線型推定を行なっていたが、線型推定に用いる直交変換係数ブロックをより多数使用することにより、さらに良好な線型推定を行なうことが可能となる。
【0063】
例えば、図5に示すように、推定対象ブロックと画像フレーム内で同一位置にある3つのブロックに加えて、その上に隣接する3つのブロックと、左右に隣接する2つのブロックとの合計8つのブロックを入力として、8×32のブロックを1つ推定して出力することができる。これは、図4に示した動画像復号化装置37において、M=N=K=8、L=32、P=1、Q=3、S=8とした例である。
【0064】
このとき、上式(1)のXは垂直方向512個×水平方向1個の縦行列であり、Hは垂直方向256個×水平方向512個の要素からなる行列となる。このように、推定対象ブロックに隣接するブロックの直交変換係数も線型推定に用いることによって、より高い倍率の解像度変換を行なう場合、つまり、線型推定する直交変換係数の数が多い場合においても、安定した質の高い線型推定を行なうことができるようになる。
【0065】
また、図5に示した8つのブロックに加えて、推定対象ブロックの下側に隣接する3つのブロックも用いて、合計11ブロック(S=11)を利用するようにすることも効果的である。また、推定対象ブロックと画像の性質が異なるような隣接ブロックは除外して線型推定を行なうことも、安定した線型推定を行なう上で効果的である。
【0066】
さらに、図6に示すように、推定対象ブロックに隣接する、推定処理済みブロックの推定直交変換係数も、推定対象ブロックの直交変換係数推定に用いることが可能である。すなわち、線型推定に用いるデータは、数が多いほど、また、その質が良いほど、線型推定の結果が良好になる。
【0067】
このため、隣接するブロックのデータとして、推定処理を行なう前の低解像度画像の量子化誤差をより多く含んだ直交変換係数ブロックではなく、推定処理を行なった後の高解像度画像に対する量子化歪みが低減された直交変換係数ブロックのみ、または、その両方のブロックを用いることによって、より安定した線型推定が可能となる。
【0068】
図7は、推定処理を行なった後の高解像度画像に対する量子化歪みが低減された直交変換係数ブロックを線型推定に用いる動画像復号化装置37の一例を示している。図7において、図4と同一部分に同一符号を付して説明すると、図4に示した動画像復号化装置37の構成に加えて、K×L変換係数線型推定部の出力を一時的に記憶するための推定変換係数バッファ40dを備え、この推定変換係数バッファ40dから推定済み隣接ブロックの変換係数データを読み出して、K×L変換係数線型推定部40bに入力するパスが設けられる。
【0069】
図8は、図7に示した動画像復号化装置37の変形例を示している。すなわち、図7に示した動画像復号化装置37では、逆直交変換を行なった後の予測残差信号S12に参照ブロック信号S13を加える処理を行なうとともに、解像度変換部40に与える直交変換係数を得るために、参照ブロック信号S13を2次元直交変換して、予測残差直交変換係数信号S11に加える処理を行なっている。
【0070】
これに対し、図8に示す動画像復号化装置37では、参照フレームを生成するために必要な予測残差成分と参照ブロック成分との加算を直交変換面で行なっている。このようにすることにより、解像度変換部40に与える直交変換係数を生成するための加算処理と、参照フレームを生成するための加算処理をまとめることが可能となり、結果として、加算部30を減らすことが可能となる。
【0071】
これは、直交変換が線型な処理であって、直交変換の前で加算を行なっても、直交変換の後で加算を行なっても、どちらも本質的に同じ処理になるためである。また、このようにしても、解像度変換部40に関しては、図7と全く同じである。さらに、図8に示した加算部30を減らした構成は、図4の構成、または、次に述べる図9の構成を用いた場合にも、適用することができる。
【0072】
図9は、図7に示した動画像復号化装置37のさらに他の変形例を示している。すなわち、図9に示す動画像復号化装置37は、図7に示した動画像復号化装置37のK×L変換係数線型推定部40bとK×L逆直交変換部40cとを、1つのK×L画素値線型推定部40eとしてまとめた構成となっている。
【0073】
これは、K×L変換係数線型推定部40bもK×L逆直交変換部40cも、どちらも数学的には単に行列を乗算するだけの処理であるため、その2つの行列の積を予め求めておくことにより、行列の積を計算する処理を一度で済ませることができることに対応する。このような構成とすることにより、変換係数バッファ40aから読み出したS個の直交変換係数ブロックから、直接的に垂直方向K個×水平方向L個の画素でなる高解像度出力ブロックを得ることが可能となる。
【0074】
また、図6で説明したように、推定済み隣接ブロックを線型推定の入力として使用する場合には、推定済み隣接ブロックの直交変換係数のかわりに、推定済み隣接ブロックの画素値をそのまま線型推定の入力とする。このことにより、図7で必要とした推定変換係数バッファ40dは不要となり、最終的な出力画像を記憶するフレームバッファ41から推定済み隣接ブロックの画素値を得る構成となる。
【0075】
以上では、フレーム間予測/残差符号化を行なう符号化フレームに対する復号化処理及び解像度変換処理について説明している。これに対し、図10は、例えばMPEG2規格に準拠した符号化方式におけるI(intra-coded)ピクチャ等のように、予測を行なわないフレームの符号化データに対する動画像復号化装置37の構成を示している。
【0076】
この場合には、逆量子化部28の出力は、予測残差信号の直交変換係数ではなく、画像信号の直交変換係数となっているため、参照ブロックの直交変換係数を加える処理は不要となり、逆量子化部28の出力が直接的に解像度変換部40に供給されて、変換係数バッファ40a以降の解像度変換処理が進められる。
【0077】
一方、引き続く画像フレームの符号化において、このフレームが参照フレームとして必要となる場合は、逆量子化部28の出力に対して垂直方向M個×水平方向N個の2次元逆直交変換が行なわれる。そして、ループフィルタ33を必要とする符号化の場合にはその処理が行なわれた後、復号画像がフレームバッファ32に記憶されて後の復号処理に備えることになる。
【0078】
また、静止画の符号化や、動画像の符号化でフレーム内符号化しか用いない符号化方式の場合には、この垂直方向M個×水平方向N個のM×N逆直交変換部29及びそれ以降のループフィルタ33、フレームバッファ32は不要となる。このことは、図4または図9に示した構成を用いた場合でも全く同様である。
【0079】
以上の説明において、解像度変換部40では、主としてより高い解像度に変換することを想定した説明を行なってきたが、これに限らず、より低い解像度に変換する場合でも全く同様に処理を行なうことができる。この場合には、符号化歪み低減効果がより効果的に発揮されることになる。
【0080】
また、出力すべき解像度の画像を得るために、入力の直交変換係数ブロックを複数まとめ、それと同じ画像位置にブロックを1つ設定し、そのブロックに対して解像度変換倍率に基づいた必要とする数の直交変換係数を線型推定する際に、入力ブロックを複数まとめる方法には任意性が存在する。
【0081】
例えば、解像度を垂直方向及び水平方向にそれぞれ2倍に変換する場合を考えると、垂直方向8個×水平方向8個の直交変換係数からなるブロックを、垂直方向に2ブロック、水平方向に2ブロックまとめたものを入力ブロックとし、垂直方向32個×水平方向32個の直交変換係数ブロックを出力することが考えられる。
【0082】
また、垂直方向に4ブロック、水平方向に4ブロックをまとめたものを入力ブロックとし、垂直方向64個×水平方向64個の直交変換係数ブロックを出力するようにすることや、それ以外の組み合わせによることも考えることができる。
【0083】
この場合、より長い基底長を用いることにより、より自然な高周波成分を得ることが可能となり、品質の高い出力画像となるが、その反面、逆直交変換部40cの演算量増加、変換係数バッファ40aで必要とする容量の増加、複数ブロックの入力待ちによる遅延の増加といった事態が発生するため、複数ブロックとして何個のブロックにするかは、出力画像の品質や、処理量等の許容範囲からバランスの良い値に設定をすることになる。
【0084】
さらに、出力ブロック内の直交変換係数の基底長は、2の冪乗とすると、逆直交変換部40cにおいて高速変換アルゴリズムを簡単に採用することができるため、一般には都合が良いことが多いが、これは必ずしも、2の冪乗である必要は無い。
【0085】
もちろん、コンピュータ上で動作するソフトウェアで実施しても良い。
【0086】
なお、この発明は上記した実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。また、上記した実施の形態に開示されている複数の構成要素を適宜に組み合わせることにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素から幾つかの構成要素を削除しても良いものである。さらに、異なる実施の形態に係る構成要素を適宜組み合わせても良いものである。
【符号の説明】
【0087】
11…動画像符号化装置、12…入力端子、13…ブロック分割部、14…減算部、15…動き補償・予測部、16…参照フレームバッファ、17…直交変換部、18…量子化部、19…エントロピー符号化部、20…出力端子、21…逆量子化部、22…逆直交変換部、23…加算部、24…ループフィルタ、25…動画像復号化装置、26…入力端子、27…エントロピー符号復号化部、28…逆量子化部、29…M×N逆直交変換部、30…加算部、31…動き補償・予測部、32…フレームバッファ、33…ループフィルタ、34…符号化歪み除去フィルタ、35…解像度変換部、36…出力端子、37…動画像復号化装置、38…M×N直交変換部、39…加算部、40…解像度変換部、40a…変換係数バッファ、40b…K×L変換係数線型推定部、40c…K×L逆直交変換部、40d…推定変換係数バッファ、40e…K×L画素値線型推定部、41…フレームバッファ、42…出力端子。

【特許請求の範囲】
【請求項1】
それぞれが直交変換係数を含む、垂直方向P個×水平方向Q個(P,Qは正の整数でP=Q=1は除く)の対象ブロックで示される画像領域に対応して1つのブロックを設定し、当該設定ブロックに対して前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数の総数とは異なる数の直交変換係数を生成する生成手段と、
前記生成手段により生成した直交変換係数を逆直交変換して画像ブロックを生成し、その生成した画像ブロックを画像フレームの対応する位置に配置する出力手段とを具備する解像度変換装置。
【請求項2】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数から、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項1記載の解像度変換装置。
【請求項3】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数と、前記垂直方向P個×水平方向Q個の対象ブロックに隣接する対象ブロックに含まれる直交変換係数とから、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項1記載の解像度変換装置。
【請求項4】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数と、前記設定ブロックに隣接する推定済みブロックに含まれる直交変換係数とから、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項1記載の解像度変換装置。
【請求項5】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数と、前記垂直方向P個×水平方向Q個の対象ブロックに隣接する対象ブロックに含まれる直交変換係数と、前記設定ブロックに隣接する推定済みブロックに含まれる直交変換係数とから、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項1記載の解像度変換装置。
【請求項6】
符号化データから復号化された対象ブロックの予測残差直交変換係数を生成する逆量子化手段と、
復号化された対象ブロックに動き補償予測を行なって得た参照ブロックの直交変換係数を生成する直交変換手段と、
前記逆量子化手段が生成する予測残差直交変換係数と前記直交変換手段が生成する直交変換係数とを加算する加算手段と、
前記加算手段で加算した直交変換係数をそれぞれが含む、垂直方向P個×水平方向Q個(P,Qは正の整数でP=Q=1は除く)の対象ブロックで示される画像領域に対応して1つのブロックを設定し、当該設定ブロックに対して前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数の総数とは異なる数の直交変換係数を生成する生成手段と、
前記生成手段により生成した直交変換係数を逆直交変換して画像ブロックを生成し、その生成した画像ブロックを画像フレームの対応する位置に配置する出力手段とを具備する動画像復号化装置。
【請求項7】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数から、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項6記載の動画像復号化装置。
【請求項8】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数と、前記垂直方向P個×水平方向Q個の対象ブロックに隣接する対象ブロックに含まれる直交変換係数とから、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項6記載の動画像復号化装置。
【請求項9】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数と、前記設定ブロックに隣接する推定済みブロックに含まれる直交変換係数とから、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項6記載の動画像復号化装置。
【請求項10】
前記生成手段は、前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数と、前記垂直方向P個×水平方向Q個の対象ブロックに隣接する対象ブロックに含まれる直交変換係数と、前記設定ブロックに隣接する推定済みブロックに含まれる直交変換係数とから、線型推定により前記設定ブロックに対する直交変換係数を生成する請求項6記載の動画像復号化装置。
【請求項11】
それぞれが直交変換係数を含む、垂直方向P個×水平方向Q個(P,Qは正の整数でP=Q=1は除く)の対象ブロックで示される画像領域に対応して1つのブロックを設定し、
設定したブロックに対して前記垂直方向P個×水平方向Q個の対象ブロックに含まれる直交変換係数の総数とは異なる数の直交変換係数を生成し、
生成した直交変換係数を逆直交変換して画像ブロックを生成し、
生成した画像ブロックを画像フレームの対応する位置に配置する解像度変換方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2013−98730(P2013−98730A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−239386(P2011−239386)
【出願日】平成23年10月31日(2011.10.31)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】