説明

画像復号装置、逆直交変換制御方法、プログラム及び画像符号化装置

【課題】処理量の増加を抑えつつ、4×4以外のブロックにもDSTを選択可能とすることで、符号化効率を向上させる。
【解決手段】複数の予測方向を用いて画面内予測を行う画像復号装置であって、逆直交変換の対象データである変換ブロックと、前記画面内予測で用いられたブロックを示す予測ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定部と、判定部による判定結果に基づき、逆離散コサイン変換と、予測方向に依存して予め設定された水平・垂直方向に対する逆離散コサイン変換及び/又は逆離散サイン変換と、のいずれの氏処理を行うかを制御する制御部と、制御部により制御された逆直交変換処理を変換ブロックに対して行う逆変換部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の予測方向を用いて画面内予測を行う画像復号装置、逆直交変換制御方法、プログラム及び画像符号化装置に関する。
【背景技術】
【0002】
近年マルチメディア化が進み、動画像を扱う機会が多くなってきている。画像データは情報量が大きく、画像の集合である動画像は、テレビ放送の主流であるハイビジョン(1920×1080)放送で1Gbit/secを超える情報量である。
【0003】
そのため、動画像データは、H.264/AVC(Advanced Video Coding)や規格化作業中のHEVC(High Efficiency Video Coding)などに代表される符号化標準技術によって、情報量を圧縮して伝送・蓄積が行われている。
【0004】
HEVCでは、従来の符号化技術のように画面を左上から符号化単位であるブロック状に単純に分割するのではなく、新たに階層分割を採用し、複数階層のブロック分割を可能とする。また、複数のブロックに分割された符号化単位は、CU(Coding Unit)や符号化ブロックとも呼ぶ。
【0005】
図1は、HEVCによるブロック分割の一例を示す図である。図1に示すように、HEVCでは、4×4、8×8、16×16、32×32などのサイズに画像を分割して、符号化を行うことができる。
【0006】
また、HEVCでは、予測誤差信号を効率的に表現するため、CUを階層分割し、変換単位に分けることができる。変換単位は、TU(Transform Unit)や変換ブロックとも呼ぶ。
【0007】
図2は、CUとTUとの関係を示す図である。図2に示すように、例えば32×32のCUに対し、階層分割0回のTUは32×32のCUと同じブロックであり、階層分割1回のTUは、16×16に分割されたブロックである。また、階層分割2回のTUは、8×8に分割されたブロックである。
【0008】
なお、TUは、CUのサイズに応じて階層分割されるので、各階層におけるTUのサイズはCUのサイズに応じてそれぞれ異なる。
【0009】
また、HEVCでは、CUを複数種類の矩形領域である予測単位に分割し、それぞれの予測単位で予測処理が行われる。この予測単位は、PU(Prediction Unit)や予測ブロックとも呼ぶ。
【0010】
図3は、画面間予測又は画面内予測で用いられる予測ブロックの一例を示す図である。図3に示すように、CUは、4つの種類のPUに分けることが可能である。例えば、2N×2NのCUに対して、2N×2NのPU、N×NのPU、N×2NのPU、2N×NのPUに分けられる。PUは、CUのサイズに応じて様々な種類が存在する。
【0011】
ここで、分割されたブロックに対し、画面内符号化(イントラ符号化)では、画面内の空間的な信号予測を行い、この技術を画面内予測(イントラ予測)と呼ぶ。HEVCで検討されているイントラ予測には複数の方法がある。
【0012】
その方法のうちの1つに、符号化ブロックの周囲にある、既に符号化が行われ復号された信号を参照して、この符号化ブロックの信号を予測する技術について説明する。符号化器では、予測に用いるための信号として、復号器で知りうる信号を利用する。そのため、符号化器は、内部に復号器と同等の処理を行うローカルデコーダを備え、符号化された信号は順次復号される。
【0013】
よって、符号化対象である符号化ブロックの信号の周囲に位置する所定の信号は、既にローカルデコーダにより復号されている。HEVCの場合、従来の符号化処理と同じく、符号化対象である符号化ブロックの左及び上側に位置するブロックは、既に復号されており、復号された信号を用いて符号化ブロックの信号を予測する。
【0014】
この予測の基本原理は、H.264/AVCのイントラ予測と同様にして信号予測が行われる(非特許文献1)。HEVCでは、信号予測の方向がH.264/AVCよりも増加しており、最大で33方向の信号予測が行われる。
【0015】
図4は、HEVCによるイントラ予測の予測方向を示す図である。図4に示すように、HEVCでは、33方向の予測方向を用いてイントラ予測が行われる。
【0016】
また、映像信号の場合、平均的に隣接画素間の相関が高いため、この予測によると参照信号に隣接する信号は予測精度が高く、参照信号から遠方に位置する信号ほど予測精度が低くなる。
【0017】
予測による参照信号と原信号との差分を予測誤差信号と呼び、予測誤差信号は、直交変換によって符号化される。従来の符号化技術では、直交変換として、2次元DCT(Discrete Cosine Transform:離散コサイン変換)又は整数化された2次元DCTを用いる。
【0018】
HEVCでは、DCTに加え、イントラ予測の予測モードに依存した複数の直交変換を選択することができる予定である。直交変換としては、DCTと、離散サイン変換タイプ7(Discrete Sine Transform type VII:以下、DSTと呼ぶ)との切り替えを行う。
【0019】
よって、HEVCでは、2次元信号に対し、水平方向・垂直方向で、異なる直交変換の組み合わせを選択可能とする。一般的に選択肢を増やすと、いずれの直交変換を選択したかを復号器に伝送するための識別フラグを必要とする。しかし、この識別フラグが追加情報となり、符号化による情報量削減の効率が低下してしまう。
【0020】
そこで、この符号化効率の低減を抑制するため、変換ブロックが4×4、8×8のブロックサイズに限定し、イントラ予測の予測方向に応じて、水平方向・垂直方向に対しDCT、DSTのいずれを用いて符号化するかを予め設定しておく技術がある(非特許文献2、3)。
【0021】
これにより、事前に設定されたDCTとDSTとの組み合わせを記述したテーブルを符号化器、復号器の双方で用意することで、識別フラグが不要となり、符号化効率の低下を防止することができる。
【先行技術文献】
【非特許文献】
【0022】
【非特許文献1】大久保榮監修,「改訂三版 H.264/AVC 教科書」,インプレス R&D,p.264−268,2009年1月1日
【非特許文献2】Ankur Saxena,「CE7: Mode-dependent DCT/DST without 4*4 full matrix multiplication for intra prediction (JCTVC-E125)」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, CH, 16-23 March, 2011
【非特許文献3】Ankur Saxena,「CE7: Mode-dependent 8x8 DCT/DST for Intra Prediction (JCTVC-F282)」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011
【発明の概要】
【発明が解決しようとする課題】
【0023】
しかしながら、予測誤差信号の性質は、ブロックサイズが大きくなるにしたがって、このブロックを構成する画素数に対して参照信号に隣接する画素数が小さくなり失われる。このため、DSTを選択することによる符号化効率の改善効果は比較的小さいブロックに限定される。したがって、DSTを選択可能とするのは、非特許文献2に記載された技術のように4×4のブロックに限定される。
【0024】
また、DSTを選択可能とする方式として、非特許文献3では、全ての8×8の変換ブロックに適用しているため、処理量が増加してしまい、処理量の増加による符号化効率の効果が少ないという問題点がある。
【0025】
そこで、上記課題に鑑みてなされたものであり、処理量の増加を抑えつつ、4×4以外のブロックにもDSTを選択可能とすることで、符号化効率を向上させることができる画像復号装置、逆直交変換制御方法、プログラム及び画像符号化装置を提供することを目的とする。
【課題を解決するための手段】
【0026】
本発明の一態様における画像復号装置は、複数の予測方向を用いて画面内予測を行う画像復号装置であって、逆直交変換の対象データである変換ブロックと、前記画面内予測で用いられたブロックを示す予測ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定部と、前記判定部による判定結果に基づき、逆離散コサイン変換と、前記予測方向に依存して予め設定された水平・垂直方向に対する逆離散コサイン変換及び/又は逆離散サイン変換と、のいずれの処理を行うかを制御する制御部と、前記制御部により制御された逆直交変換処理を前記変換ブロックに対して行う逆変換部と、を備える。
【0027】
また、前記条件は、前記変換ブロックのサイズが8×8であり、画像が所定サイズに分割された符号化ブロックからの階層分割回数が0であり、前記制御部は、前記条件を満たすとき、前記逆離散コサイン変換及び/又は逆離散サイン変換の処理を前記逆変換部が行うよう制御するとしてもよい。
【0028】
また、前記条件は、前記予測ブロックのサイズと前記変換ブロックのサイズとが、8×8以下で同じサイズであり、前記制御部は、前記条件を満たすとき、前記逆離散コサイン変換及び/又は逆離散サイン変換の処理を前記逆変換部が行うよう制御するとしてもよい。
【0029】
また、前記条件は、前記予測ブロックは長辺が16以下の長方形であり、前記制御部は、前記条件を満たすとき、前記逆離散コサイン変換及び/又は逆離散サイン変換の処理を前記逆変換部が行うよう制御するとしてもよい。
【0030】
また、本発明の他の態様における逆直交変換制御方法では、逆直交変換の対象データである変換ブロックと、前記画面内予測で用いられたブロックを示す予測ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定ステップと、前記判定ステップによる判定結果に基づき、逆離散コサイン変換と、画面内予測で用いられる予測方向に依存して予め設定された水平・垂直方向に対する逆離散コサイン変換及び/又は逆離散サイン変換と、のいずれの処理を行うかを制御する制御ステップと、前記制御ステップにより制御された逆直交変換処理を前記変換ブロックに対して行う逆変換ステップとをコンピュータが実行する。
【0031】
また、本発明の他の態様におけるプログラムは、逆直交変換の対象データである変換ブロックと、前記画面内予測で用いられたブロックを示す予測ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定ステップと、前記判定ステップによる判定結果に基づき、逆離散コサイン変換と、画面内予測で用いられる予測方向に依存して予め設定された水平・垂直方向に対する逆離散コサイン変換及び/又は逆離散サイン変換と、のいずれの処理を行うかを制御する制御ステップと、前記制御ステップにより制御された逆直交変換を前記変換ブロックに行う逆変換ステップとをコンピュータに実行させる。
【0032】
また、本発明の他の態様における画像符号化装置は、画像が所定サイズに分割された符号化対象ブロックに含まれ、前記画面内予測に用いられるブロックを示す予測ブロックと、前記符号化対象ブロックが階層分割により1又は複数に分割された変換ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定部と、前記判定部による判定結果に基づき、離散コサイン変換と、前記予測方向に依存して予め設定された水平・垂直方向に対する離散コサイン変換及び/又は離散サイン変換と、のいずれの処理を行うかを制御する制御部と、前記制御部により制御された直交変換処理を前記変換ブロックに対して行う変換部と、を備える。
【発明の効果】
【0033】
本発明によれば、処理量の増加を抑えつつ、4×4以外のブロックにもDSTを選択可能とすることで、符号化効率を向上させることができる。
【図面の簡単な説明】
【0034】
【図1】HEVCによるブロック分割の一例を示す図。
【図2】CUとTUとの関係を示す図。
【図3】イントラ予測部の構成の一例を示すブロック図。
【図4】HEVCによるイントラ予測の予測方向を示す図。
【図5】予測ブロックと変換ブロックと予測効率との関係を示す図。
【図6】実施例1における画像符号化装置の概略構成の一例を示すブロック図。
【図7】直交変換部の構成の一例を示すブロック図。
【図8】直交変換制御処理(その1)の一例を示すフローチャート。
【図9】直交変換制御処理(その2)の一例を示すフローチャート。
【図10】直交変換制御処理(その3)の一例を示すフローチャート。
【図11】実施例2における画像復号装置の構成の一例を示すブロック図。
【図12】逆直交変換部の構成の一例を示すブロック図。
【図13】実施例3における画像処理装置の構成の一例を示すブロック図。
【発明を実施するための形態】
【0035】
まず、以下に説明する各実施例の前提について説明する。前述した通り、イントラ予測の予測方向に依存したDCTとDSTとの切り替えは、最も小さいブロックサイズに対して効果を示しており、4×4を超えるサイズのブロックに対しては効果を示すとは限らない。
【0036】
ここで、イントラ予測の予測方向は、1又は複数の変換ブロックで構成される予測ブロックによって決定される。予測ブロックは、例えばイントラ予測で用いられる予測対象のブロックを表す。同一の予測ブロックに含まれる1又は複数の変換ブロックは、同じ予測方向で予測を行う。
【0037】
一方、予測ブロックが複数の変換ブロックを含む場合、個々の変換ブロックごとに選択された予測方法による予測精度は様々である。よって、予測方向に応じて一律に予め決められたDCTとDSTとの組み合わせで符号化を行うと、符号化効率が向上する場合と、向上しない場合がある。
【0038】
そのため各変換ブロックでの改善効率を平均すると効果を示す予測が選択されているが個々の変換ブロックで最適な予測が行われているとは限らない。そのような変換ブロックにおいてはDSTが想定通り効果を示すとは限らない。
【0039】
そこで、発明者らは、予測ブロック内の変換ブロックで、予測誤差信号の傾向が一様である場合に、信号の方向性を利用した予測誤差信号の傾向は、DSTが想定する信号に近似されることが高い確率で保証されると考えた。
【0040】
すなわち、予測ブロック内の変換ブロックで、予測誤差信号の傾向が一様である場合のみに、DSTの選択を可能とすると、効率的に符号化効率を改善することができる。予測ブロック内の変換ブロックで、予測誤差信号の傾向が一様である場合とは、例えば、予測ブロックと変換ブロックとのブロックサイズが一致する場合である。このときのブロックサイズは、8×8又は4×4である。
【0041】
また、予測ブロックが長方形の場合にも、各予測ブロックの絵柄が別であるために各予測ブロックに分割されることを考慮すると、これらの予測ブロック内の変換ブロックで、予測誤差信号の傾向が一様である場合があると考えられる。以下、予測誤差信号の傾向を、予測効率とも呼ぶ。
【0042】
図5は、予測ブロックと変換ブロックと予測効率との関係を示す図である。図5に示す矢印は予測方向を表す。図5(A)は、予測ブロックpu11と変換ブロックtu11とが同じサイズである場合を示す。図5(A)に示す例では、予測ブロックpu11と変換ブロックtu11とが同じサイズであるため、予測効率が一様である。よって、図5(A)に示す場合に、予測方向に依存したDCTとDSTとを選択可能とすればよい。
【0043】
図5(B)は、予測ブロックpu21が4つの変換ブロックtu21〜24に分割されている場合を示す。図5(B)に示す例では、予測効率が様々であるため、予測ブロックが分割されている。図5(B)に示す場合には、通常のDCTを用いればよい。
【0044】
図5(C)は、予測ブロックpu31、32に分割されている例を示す。図5(C)の場合は、予測ブロックpu31と予測ブロックpu32とで予測方向が異なるが、これにより、各予測ブロック内で予測効率が一様になる可能性が高まる。よって、図5(C)に示す予測ブロックpu31内の変換ブロックtu31、32、及び予測ブロックpu32内の変換ブロックtu33、34には、予測方向に依存したDCTとDSTとを選択可能にすればよい。
【0045】
以上の前提に基づく各実施例について、以下、添付図面を参照しながら詳細に説明する。
【0046】
[実施例1]
<構成>
図6は、実施例1における画像符号化装置10の概略構成の一例を示すブロック図である。図6に示す例では、画像符号化装置10は、前処理部100、予測誤差信号生成部101、直交変換部102、量子化部103、エントロピー符号化部104、逆量子化部105、逆直交変換部106、復号画像生成部107、デブロッキングフィルタ部108、ループフィルタ部109、復号画像記憶部110、イントラ予測部111、インター予測部112、動きベクトル計算部113、符号化制御及びヘッダ生成部114及び予測画像選択部115を有する。各部についての概略を以下に説明する。
【0047】
前処理部100は、ピクチャタイプに合わせてピクチャを並べ替え、ピクチャタイプ及びフレームごとのフレーム画像等を順次出力する。また、前処理部100は、ブロック分割なども行う。
【0048】
予測誤差信号生成部101は、入力された動画像データの符号化対象画像が、例えば32×32、16×16、8×8画素などのブロックに分割されたブロックデータを取得する。
【0049】
予測誤差信号生成部101は、そのブロックデータと、予測画像選択部115から出力される予測画像のブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部101は、生成された予測誤差信号を直交変換部102に出力する。
【0050】
直交変換部102は、入力された予測誤差信号を直交変換処理する。直交変換部102は、イントラ予測の場合の予測誤差信号に対し、予測方向に依存したDCTとDSTとの組み合わせを用いて直交変換可能とする。直交変換部102の詳細は、図7を用いて後述する。直交変換部102は、直交変換処理によって水平及び垂直方向の周波数成分に分離された信号を量子化部103に出力する。
【0051】
量子化部103は、直交変換部102からの出力信号を量子化する。量子化部103は、量子化することによって出力信号の符号量を低減し、この出力信号をエントロピー符号化部104及び逆量子化部105に出力する。
【0052】
エントロピー符号化部104は、量子化部103からの出力信号や動きベクトル計算部113から出力された動きベクトル情報やループフィルタ部109からのフィルタ係数などをエントロピー符号化して出力する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
【0053】
逆量子化部105は、量子化部103からの出力信号を逆量子化してから逆直交変換部106に出力する。逆直交変換部106は、逆量子化部105からの出力信号を逆直交変換処理してから復号画像生成部107に出力する。これら逆量子化部105及び逆直交変換部106によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
【0054】
復号画像生成部107は、インター予測部112で動き補償された画像のブロックデータと、逆量子化部105及び逆直交変換部106により復号処理された予測誤差信号とを加算する。復号画像生成部107は、加算して生成した復号画像のブロックデータを、デブロッキングフィルタ部108に出力する。
【0055】
デブロッキングフィルタ部108は、復号画像生成部107から出力された復号画像に対し、ブロック歪を低減するためのフィルタをかけ、ループフィルタ部109に出力する。
【0056】
ループフィルタ部109は、例えばALF(Adaptive Loop Filter)であり、デブロッキングフィルタ処理された復号画像と、入力画像とを用いてフィルタ処理を行う。フィルタ処理は、例えばウィナーフィルタ(Wiener Filter)が用いられるが、その他のフィルタでも良い。
【0057】
また、ループフィルタ部109は、入力画像を所定サイズ毎のグループに分け、グループ毎に適切なフィルタ係数を生成する。ループフィルタ部109は、デブロッキングフィルタ処理された復号画像を、所定サイズ毎にグループ分けし、生成したフィルタ係数を用いてグループ毎にフィルタ処理を行う。ループフィルタ部109は、フィルタ処理結果を復号画像記憶部110に出力し、参照画像として蓄積させる。所定サイズは、例えば、直交変換サイズである。
【0058】
復号画像記憶部110は、入力した復号画像のブロックデータを新たな参照画像のデータとして記憶し、イントラ予測部111、インター予測部112及び動きベクトル計算部113に出力する。
【0059】
イントラ予測部111は、符号化対象画像の処理対象ブロックに対して、すでに符号化された参照画素から予測画像を生成する。イントラ予測部111は、複数の予測方向を用いて予測を行い、最適な予測方向を決定する。決定された予測方向や予測ブロックの情報を含む予測情報は、直交変換部102に出力される。
【0060】
インター予測部112は、復号画像記憶部110から取得した参照画像のデータを動きベクトル計算部113から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。
【0061】
動きベクトル計算部113は、符号化対象画像におけるブロックデータと、復号画像記憶部110から取得する参照画像とを用いて、動きベクトルを求める。動きベクトルとは、ブロック単位で参照画像内から処理対象ブロックに最も類似している位置を探索するブロックマッチング技術を用いて求められるブロック単位の空間的なずれを示す値である。
【0062】
動きベクトル計算部113は、求めた動きベクトルをインター予測部112に出力し、動きベクトルや参照画像を示す情報を含む動きベクトル情報をエントロピー符号化部104に出力する。
【0063】
イントラ予測部111とインター予測部112から出力されたブロックデータは、予測画像選択部115に入力される。
【0064】
予測画像選択部115は、イントラ予測部111とインター予測部112から取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部101に出力される。
【0065】
また、符号化制御及びヘッダ生成部114について、符号化の全体制御とヘッダ生成を行う。符号化制御及びヘッダ生成部114は、イントラ予測部111に対して、スライス分割有無の通知、デブロッキングフィルタ部108に対して、デブロッキングフィルタ有無の通知、動きベクトル計算部113に対して参照画像の制限通知などを行う。
【0066】
符号化制御及びヘッダ生成部114は、その制御結果を用いて、ヘッダ情報を生成する。生成されたヘッダ情報は、エントロピー符号化部104に出力され、画像データ、動きベクトルデータとともにストリームとして出力される。
【0067】
<直交変換部の構成>
次に、直交変換部102の構成について説明する。図7は、直交変換部102の構成の一例を示すブロック図である。図7に示す直交変換部102は、本発明にかかるイントラ予測の予測誤差信号に対する直交変換についての構成を示す。
【0068】
図7に示す直交変換部102は、判定部201、制御部202、変換部203を有する。判定部201は、予測情報を取得し、予測ブロックと変換ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する。この条件は、予測ブロック内の変換ブロックで、予測誤差信号の傾向が一様になるための条件である。
【0069】
例えば、以下の3つの条件が考えられる。
・条件1
変換ブロックのサイズが8×8で、符号化ブロックからの階層分割が0回であること
・条件2
予測ブロックのサイズと変換ブロックのサイズとが8×8以下で同じサイズであること
・条件3
予測ブロックが、長辺が16以下の長方形(例えば16×8、8×16)であること
条件1では、イントラ符号化の場合、ブロックの関係は、CU≧PU≧TUであり、TUの階層分割は、CUからの階層分割回数を数えるため、TUが8×8で、階層分割回数が0であれば、CU=PU=TUとなる。よって、条件1は、予測ブロックと変換ブロックとが8×8のサイズであるかを判定するための条件である。
【0070】
条件2では、予測ブロックのサイズと変換ブロックのサイズとが同じであり、そのサイズが8×8、4×4で同じであるかを判定するための条件である。
【0071】
条件3では、予測ブロックが長方形(長辺が16以下)であり、変換ブロックが4×4又は8×8であるかを判定するための条件である。なお、予測ブロックが長方形であれば、必然的に変換ブロックは正方形に分割されるので、条件としては、予測ブロックが長方形(長辺≦16)であるかを判定すればよい。また、長方形は、長辺が16以下の長方形に限定すると、変換ブロックのブロックサイズが小さくなり、DSTの効果が発揮されやすくなる。
【0072】
判定部201は、条件1〜3のいずれかを判定するよう設定しておき、条件を満たすか否かの判定結果を制御部202に出力する。なお、判定部201は、条件1と3、条件2と3とを組み合わせて判定するようにしてもよい。
【0073】
制御部202は、判定部201から判定結果を取得し、判定結果に基づいて、予測誤差信号に対し、DCT処理をするか、予測方向に依存した水平・垂直方向に対するDCT/DSTの組み合わせを処理するかを制御する。
【0074】
制御部202は、条件を満たすことを示す判定結果である場合、予測方向依存DCT/DST部205に予測誤差信号を処理するよう指示する。また、制御部202は、条件を満たさないことを示す判定結果である場合、DCT部204に予測誤差信号を処理するよう指示する。
【0075】
変換部203は、イントラ符号化の予測誤差信号に対し、直交変換を行う。変換部203は、DCT部204と予測方向依存DCT/DST部205とを有する。
【0076】
DCT部204は、予測誤差信号に対し、水平方向・垂直方向のDCT処理を行い、量子化部103に直交変換された信号を出力する。
【0077】
予測方向依存DCT/DST部205は、イントラ予測部111で決定された予測方向に応じて、水平方向・垂直方向に対しDCT及び/又はDST処理を行う。予測方向依存DCT/DST部205は、予測方向に応じて、水平方向に適用するのはDCTかDSTか、垂直方向に適用するのはDCTかDSTかを示すテーブルを保持しておく。
【0078】
よって、予測方向依存DCT/DST部205は、予測方向が分かると、テーブルを参照して、水平方向に適用する直交変換、垂直方向に適用する直交変換を決めることができる。予測方向依存DCT/DST部205は、直交変換された信号を量子化部103に出力する。
【0079】
これにより、ブロックサイズが比較的小さく、予測ブロック内の予測効率が一様であると予想される変換ブロックに対し、DSTを選択可能とすることができる。
【0080】
なお、図7に示す例では、判定部201と制御部202とを直交変換部102に含める構成で説明したが、判定部201と制御部202とを直交変換部102とは独立して直交変換制御部として構成してもよい。
【0081】
<動作>
次に、実施例1における画像符号化装置10の動作について説明する。以下では、条件1〜3それぞれの場合における直交変換制御処理について説明する。
【0082】
図8は、直交変換制御処理(その1)の一例を示すフローチャートである。図8に示す処理は、1つの変換ブロックに対し、条件1を満たすか否かを判定条件とする直交変換制御処理である。
【0083】
ステップS100で、判定部201は、変換ブロックは4×4のサイズであるか否かを判定する。4×4のサイズであれば(ステップS100−YES)ステップS103に進み、4×4のサイズでなければ(ステップS100−NO)ステップS101に進む。ステップS101で、判定部201は、変換ブロックは8×8のサイズであるか否かを判定する。8×8のサイズであれば(ステップS101−YES)ステップS102に進み、8×8のサイズでなければ(ステップS101−NO)ステップS104に進む。
【0084】
ステップS102で、判定部201は、変換ブロックの階層分割は0回であるか否かを判定する。階層分割が0回であれば(ステップS102−YES)ステップS103に進み、階層分割が0回でなければ(ステップS102−NO)ステップS104に進む。
【0085】
ステップS103で、制御部202は、変換ブロックの予測誤差信号に対し、予測方向依存DCT/DST部205を使用するよう制御する。
【0086】
ステップS104で、制御部202は、変換ブロックの予測誤差信号に対し、DCT部204を使用するよう制御する。
【0087】
ステップS105で、変換部203は、使用が決定されたDCT部204又は予測方向依存DCT/DST部205のいずれかを用いて、変換ブロックの予測誤差信号に対して直交変換処理を行う。
【0088】
図9は、直交変換制御処理(その2)の一例を示すフローチャートである。図9に示す処理は、1つの変換ブロックに対し、条件2を満たすか否かを判定条件とする直交変換制御処理である。
【0089】
ステップS201で、判定部201は、予測ブロックと変換ブロックは8×8以下のサイズで、同じサイズであるか否かを判定する。8×8以下の同じサイズであれば(ステップS201−YES)ステップS202に進み、8×8以下の同じサイズでなければ(ステップS201−NO)ステップS203に進む。
【0090】
ステップS202で、制御部202は、変換ブロックの予測誤差信号に対し、予測方向依存DCT/DST部205を使用するよう制御する。
【0091】
ステップS203で、制御部202は、変換ブロックの予測誤差信号に対し、DCT部204を使用するよう制御する。
【0092】
ステップS204で、変換部203は、使用が決定されたDCT部204又は予測方向依存DCT/DST部205のいずれかを用いて、変換ブロックの予測誤差信号に対して直交変換処理を行う。
【0093】
図10は、直交変換制御処理(その3)の一例を示すフローチャートである。図10に示す処理は、1つの変換ブロックに対し、条件3を満たすか否かを判定条件とする直交変換制御処理である。
【0094】
ステップS301で、判定部201は、予測ブロックは長方形(長辺が16以下)であるか否かを判定する。長辺が16以下の長方形であれば(ステップS301−YES)ステップS302に進み、長辺が16以下の長方形のサイズでなければ(ステップS301−NO)ステップS303に進む。なお、ステップS301で、判定部201は、予測ブロックが16×8、8×16の長方形であり、変換ブロックが8×8であるか否かを判定してもよい。変換ブロックが必然的に分割されるサイズであれば、予測ブロック内の予測効率が一様である可能性がある。
【0095】
ステップS302で、制御部202は、変換ブロックの予測誤差信号に対し、予測方向依存DCT/DST部205を使用するよう制御する。
【0096】
ステップS303で、制御部202は、変換ブロックの予測誤差信号に対し、DCT部204を使用するよう制御する。
【0097】
ステップS304で、変換部203は、使用が決定されたDCT部204又は予測方向依存DCT/DST部205のいずれかを用いて、変換ブロックの予測誤差信号に対して直交変換処理を行う。
【0098】
以上の直交変換制御処理により、DSTを効果的に用いることができる変換ブロックに対して、DSTを選択可能とすることにより、符号化効率を向上させることができる。
【0099】
以上、実施例1によれば、処理量の増加を抑えつつ、4×4以外のブロックにもDSTを選択可能とすることで、符号化効率を向上させることができる。
【0100】
[実施例2]
次に、実施例2における画像復号装置30について説明する。実施例2における画像復号装置30は、実施例1における画像符号化装置10で符号化されたビットストリームを復号する装置である。
【0101】
図11は、実施例2における画像復号装置30の概略構成の一例を示すブロック図である。図11に示すように、画像復号装置30は、エントロピー復号部301、逆量子化部302、逆直交変換部303、イントラ予測部304、復号情報記憶部305、インター予測部306、予測画像選択部307、復号画像生成部308、デブロッキングフィルタ部309、ループフィルタ部310、及びフレームメモリ311を有する。各部についての概略を以下に説明する。
【0102】
エントロピー復号部301は、ビットストリームが入力されると、画像符号化装置10のエントロピー符号化に対応するエントロピー復号を行う。エントロピー復号部301により復号された予測誤差信号などは逆量子化部302に出力される。また、復号したフィルタ係数や、インター予測されている場合の、復号された動きベクトルなどは復号情報記憶部305に出力される。
【0103】
また、エントロピー復号部301は、イントラ予測の場合、イントラ予測部304にその旨通知する。また、エントロピー復号部301は、復号対象画像がインター予測されているか、イントラ予測されているかを予測画像選択部307に通知する。
【0104】
逆量子化部302は、エントロピー復号部301からの出力信号に対して逆量子化処理を行う。逆量子化された出力信号は逆直交変換部303に出力される。
【0105】
逆直交変換部303は、逆量子化部302からの出力信号の復号ブロックに対して逆直交変換処理を行い、残差信号を生成する。逆直交変換部303は、イントラ予測の場合、逆DCT(IDCT)処理をするか、予測方向に依存して決定される逆DCT/逆DST(IDST)処理をするかを制御する。逆直交変換部303の詳細は、図12を用いて後述する。残差信号は復号画像生成部308に出力される。
【0106】
イントラ予測部304は、フレームメモリ311から取得する復号対象画像のすでに復号化された周辺画素から、複数の予測方向を用いて予測画像を生成する。予測画像の生成に用いた予測方向や予測ブロックの情報を予測情報として逆直交変換部303に出力する。
【0107】
復号情報記憶部305は、復号されたループフィルタのフィルタ係数や動きベクトルや分割モードなどの復号情報を記憶する。
【0108】
インター予測部306は、フレームメモリ311から取得した参照画像のデータを復号情報記憶部305から取得する動きベクトルや分割モードを用いて動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。
【0109】
予測画像選択部307は、イントラ予測画像、又はインター予測画像どちらか一方の予測画像を選択する。選択されたブロックデータは、復号画像生成部308に出力される。
【0110】
復号画像生成部308は、予測画像選択部307から出力される予測画像と、逆直交変換部303から出力される残差信号とを加算し、復号画像を生成する。生成された復号画像はデブロッキングフィルタ部309に出力される。
【0111】
デブロッキングフィルタ部309は、復号画像生成部308から出力された復号画像に対し、ブロック歪を低減するためのフィルタをかけ、ループフィルタ部310に出力する。
【0112】
ループフィルタ部310は、復号情報記憶部305から取得したフィルタ係数を用いて、復号画像の所定サイズ毎にフィルタ処理を行う。所定サイズは、例えば逆直交変換サイズである。ループフィルタ処理後の復号画像をフレームメモリ311に出力する。なお、ループフィルタ後の復号画像は表示装置などに出力されてもよい。
【0113】
フレームメモリ311は、参照画像となる復号画像などを記憶する。なお、復号情報記憶手段305とフレームメモリ311は、分けた構成にしているが、同じ記憶部であってもよい。
【0114】
<逆直交変換部の構成>
次に、逆直交変換部303の構成について説明する。図12は、逆直交変換部303の構成の一例を示すブロック図である。図12に示す逆直交変換部303は、判定部401、制御部402、逆変換部403を有する。
【0115】
判定部401は、図7に示す判定部201と同様の機能を有するので説明を省略する。なお、判定部401は、変換ブロック毎に、画像符号化装置10の判定部201と同じ条件で判定を行う。
【0116】
制御部402は、判定部401の判定結果に基づき、IDCT部403で処理するか、予測方向依存IDCT/IDST部404で処理するかを制御する。
【0117】
制御部402は、条件を満たすことを示す判定結果である場合、予測方向依存IDCT/IDST部405に逆量子化された信号を処理するよう指示する。また、制御部402は、条件を満たさないことを示す判定結果である場合、IDCT部404に逆量子化された信号を処理するよう指示する。
【0118】
逆変換部403は、変換ブロックの逆量子化された信号に対し、逆直交変換を行う。逆変換部403は、IDCT部404と予測方向依存IDCT/IDST部405とを有する。
【0119】
IDCT部404は、逆量子化された信号に対し、水平方向・垂直方向のIDCT処理を行い、復号画像生成部308に逆直交変換された信号を出力する。
【0120】
予測方向依存IDCT/IDST部405は、イントラ予測部304で復号、抽出された予測方向に応じて、逆量子化された信号の水平方向・垂直方向に対しIDCT及び/又はIDST処理を行う。予測方向依存IDCT/IDST部405は、予測方向に応じて、水平方向に適用するのはIDCTかIDSTか、垂直方向に適用するのはIDCTかIDSTかを示すテーブルを保持しておく。このテーブルは、画像符号化措置10と同じテーブルである。
【0121】
よって、予測方向依存IDCT/IDST部405は、予測方向が分かると、テーブルを参照して、水平方向に適用する逆直交変換、垂直方向に適用する逆直交変換を決めることができる。予測方向依存IDCT/IDST部405は、逆直交変換された信号を復号画像生成部308に出力する。
【0122】
これにより、判定部401及び制御部402は、画像符号化装置10の処理と同様の処理を行うことができる。なお、判定部401と制御部402とは、逆直交変換部303とは独立して逆直交変換制御部として構成されてもよい。
【0123】
<動作>
画像復号装置30における逆直交変換処理は、基本的には、図8〜10に示す処理と同様である。異なるところは、直交変換が逆直交変換になることである。
【0124】
以上、実施例2によれば、実施例1における画像符号化装置10で符号化したビットストリームを適切に復号することができる。
【0125】
[実施例3]
図13は、実施例3における画像処理装置50の構成の一例を示すブロック図である。図13に示す画像処理装置50は、上述した実施例1で説明した画像符号化処理又は実施例2で説明した画像復号処理をソフトウェアで実装した装置の一例である。
【0126】
図13に示すように、画像処理装置50は、制御部501、主記憶部502、補助記憶部503、ドライブ装置504、ネットワークI/F部506、入力部507、表示部508を有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
【0127】
制御部501は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。また、制御部501は、主記憶部502又は補助記憶部503に記憶された直交変換制御処理を含む画像符号化処理のプログラム、又は逆直交変換制御処理を含む画像復号処理のプログラムを実行する演算装置である。制御部501は、入力部507や記憶装置からデータを受け取り、演算、加工した上で、表示部508や記憶装置などに出力する。
【0128】
制御部501は、直交変換制御処理を含む画像符号化処理、又は逆直交変換制御処理を含む画像復号処理のプログラムを実行することで、各実施例で説明した処理を実現することができる。
【0129】
主記憶部502は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部502は、制御部501が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
【0130】
補助記憶部503は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
【0131】
ドライブ装置504は、記録媒体505、例えばフレキシブルディスクからプログラムを読み出し、記憶部にインストールする。
【0132】
また、記録媒体505に、所定のプログラムを格納し、この記録媒体505に格納されたプログラムはドライブ装置504を介して画像処理装置50にインストールされる。インストールされた所定のプログラムは、画像処理装置50により実行可能となる。
【0133】
ネットワークI/F部506は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と画像処理装置50とのインターフェースである。
【0134】
入力部507は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部508の表示画面上でキーの選択等を行うためのマウスやスライスパット等を有する。また、入力部507は、ユーザが制御部501に操作指示を与えたり、データを入力したりするためのユーザインターフェースである。
【0135】
表示部508は、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等により構成され、制御部501から入力される表示データに応じた表示が行われる。
【0136】
なお、図6に示す復号画像記憶部111は、例えば主記憶部502又は補助記憶部503により実現され、図6に示す復号画像記憶部111以外の構成は、例えば制御部501及びワークメモリとしての主記憶部502により実現されうる。
【0137】
また、図11に示す復号情報記憶部305及びフレームメモリ311は、例えば主記憶部502又は補助記憶部503により実現され、図11に示す復号情報記憶部305及びフレームメモリ311以外の構成は、例えば制御部501及びワークメモリとしての主記憶部502により実現されうる。
【0138】
画像処理装置50で実行されるプログラムは、実施例1や実施例2で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部501が補助記憶部503からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部502上にロードされ、1又は複数の各部が主記憶部502上に生成されるようになっている。
【0139】
このように、上述した実施例1で説明した画像符号化処理や実施例2で説明した画像復号処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、各実施例で説明した処理を実現することができる。
【0140】
また、このプログラムを記録媒体505に記録し、このプログラムが記録された記録媒体505をコンピュータや携帯端末に読み取らせて、前述したフィルタ処理を実現させることも可能である。なお、記録媒体505は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。また、上述した各実施例で説明した処理は、1つ又は複数の集積回路に実装してもよい。
【0141】
なお、実施例3における画像処理装置50は、上記の通り、画像符号化装置10、画像復号装置30としての機能を有する。
【0142】
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記変形例以外にも種々の変形及び変更が可能である。
【符号の説明】
【0143】
10 画像符号化装置
30 画像復号装置
50 画像処理装置
101 予測画像生成部
102 直交変換部
103 量子化部
104 エントロピー符号化部
105 逆量子化部
106 逆直交変換部
107 復号画像生成部
108 デブロッキングフィルタ部
109 ループフィルタ部
110 復号画像記憶部
111 イントラ予測部
112 インター予測部
113 動きベクトル計算部
114 符号化制御及びヘッダ生成部
115 予測画像選択部
201 判定部
202 制御部
203 変換部
204 DCT部
205 予測方向依存DCT/DST部
303 逆直交変換部
401 判定部
402 制御部
403 逆変換部
404 IDCT部
405 予測依存IDCT/IDST部
501 制御部
502 主記憶部
503 補助記憶部
504 ドライブ装置

【特許請求の範囲】
【請求項1】
複数の予測方向を用いて画面内予測を行う画像復号装置であって、
逆直交変換の対象データである変換ブロックと、前記画面内予測で用いられたブロックを示す予測ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定部と、
前記判定部による判定結果に基づき、逆離散コサイン変換と、前記予測方向に依存して予め設定された水平・垂直方向に対する逆離散コサイン変換及び/又は逆離散サイン変換と、のいずれの処理を行うかを制御する制御部と、
前記制御部により制御された逆直交変換処理を前記変換ブロックに対して行う逆変換部と、
を備える画像復号装置。
【請求項2】
前記条件は、前記変換ブロックのサイズが8×8であり、画像が所定サイズで分割された符号化ブロックからの階層分割回数が0であり、
前記制御部は、
前記条件を満たすとき、前記逆離散コサイン変換及び/又は逆離散サイン変換の処理を前記逆変換部が行うよう制御する請求項1記載の画像復号装置。
【請求項3】
前記条件は、前記予測ブロックのサイズと前記変換ブロックのサイズとが、8×8以下で同じサイズであり、
前記制御部は、
前記条件を満たすとき、前記逆離散コサイン変換及び/又は逆離散サイン変換の処理を前記逆変換部が行うよう制御する請求項1記載の画像復号装置。
【請求項4】
前記条件は、前記予測ブロックが、長辺が16以下の長方形であり、
前記制御部は、
前記条件を満たすとき、前記逆離散コサイン変換及び/又は逆離散サイン変換の処理を前記逆変換部が行うよう制御する請求項1記載の画像復号装置。
【請求項5】
逆直交変換の対象データである変換ブロックと、前記画面内予測で用いられたブロックを示す予測ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定ステップと、
前記判定ステップによる判定結果に基づき、逆離散コサイン変換と、画面内予測で用いられた予測方向に依存して予め設定された水平・垂直方向に対する逆離散コサイン変換及び/又は逆離散サイン変換と、のいずれの処理を行うかを制御する制御ステップと、
前記制御ステップにより制御された逆直交変換処理を前記変換ブロックに対して行う逆変換ステップとをコンピュータが実行する逆直交変換制御方法。
【請求項6】
逆直交変換の対象データである変換ブロックと、前記画面内予測で用いられたブロックを示す予測ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定ステップと、
前記判定ステップによる判定結果に基づき、逆離散コサイン変換と、画面内予測で用いられた予測方向に依存して予め設定された水平・垂直方向に対する逆離散コサイン変換及び/又は逆離散サイン変換と、のいずれの処理を行うかを制御する制御ステップと、
前記制御ステップにより制御された逆直交変換を前記変換ブロックに行う逆変換ステップとをコンピュータに実行させるためのプログラム。
【請求項7】
複数の予測方向を用いて画面内予測を行う画像符号化装置であって、
画像が所定サイズに分割された符号化対象ブロックに含まれ、前記画面内予測に用いられるブロックを示す予測ブロックと、前記符号化対象ブロックが階層分割により1又は複数に分割された変換ブロックとが、ブロックサイズに関する条件を満たすか否かを判定する判定部と、
前記判定部による判定結果に基づき、離散コサイン変換と、前記予測方向に依存して予め設定された水平・垂直方向に対する離散コサイン変換及び/又は離散サイン変換と、のいずれの処理を行うかを制御する制御部と、
前記制御部により制御された直交変換処理を前記変換ブロックに対して行う変換部と、
を備える画像符号化装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2013−98970(P2013−98970A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−243356(P2011−243356)
【出願日】平成23年11月7日(2011.11.7)
【出願人】(000004352)日本放送協会 (2,206)
【Fターム(参考)】