ビデオ符号化/復号化用の動き補償装置及びその方法
【課題】カラー映像用のビデオ符号化/復号化装置及びその方法を提供する。
【解決手段】第一動き予測部100は、入力映像の第一の動き予測結果に基づいて入力映像に対する第一予測誤差映像を算出する。映像情報把握部110は、R-G-B映像の色成分のうち所定の色成分を基準色成分に設定し、入力映像がY-Cb-Cr映像であるかR-G-B映像であるかを把握し、入力映像の色成分が基準色成分であるか否かを把握する。第二動き予測部120は、入力映像がR-G-Bであり、入力映像の色成分が基準色成分以外の色成分であれば、基準色成分に基づいて第一予測誤差映像に対する動き予測を行って第二予測誤差映像を算出する。これにより、色情報による最適の符号化/復号化を行う。
【解決手段】第一動き予測部100は、入力映像の第一の動き予測結果に基づいて入力映像に対する第一予測誤差映像を算出する。映像情報把握部110は、R-G-B映像の色成分のうち所定の色成分を基準色成分に設定し、入力映像がY-Cb-Cr映像であるかR-G-B映像であるかを把握し、入力映像の色成分が基準色成分であるか否かを把握する。第二動き予測部120は、入力映像がR-G-Bであり、入力映像の色成分が基準色成分以外の色成分であれば、基準色成分に基づいて第一予測誤差映像に対する動き予測を行って第二予測誤差映像を算出する。これにより、色情報による最適の符号化/復号化を行う。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ビデオ符号化/復号化用の動き補償装置及びその方法に関する。
【背景技術】
【0002】
従来のビデオ(ビデオ信号)圧縮方法は、圧縮率を高めるために、機器から直接取得できるR−G−Bなどの映像形式を圧縮に適したY−Cb−Crなどの映像形式に変換する。また、従来のビデオ圧縮方法は、圧縮効率を高めるためにCb成分及びCr成分を四分の一のサイズに減らして符号化する。しかし、従来のビデオ圧縮方法は、高品質の映像復元を必要とするアプリケーションに適するものとはいえない。それは、Cb成分及びCr成分のサブサンプリングによってChroma(Cb、Cr)成分にエネルギー損失が発生し、さらにR−G−B成分をY−Cb−Cr成分に変換する時に映像の品質損失が発生するためである。このような損失を減らすためには、Cb成分及びCr成分をY成分と同じ解像度で符号化する必要がある。
【0003】
もし、Y−Cb−Cr成分を符号化するとき、さらに良い品質を所望するのであれば、R−G−B成分を直接符号化することにより、Y−Cb−Cr成分に変換する時に発生する損失をなくして、映像品質の損失を低減する必要がある。しかし、従来のビデオ圧縮手法は、従来型のY−Cb−Cr符号化器を利用してR−G−B成分を符号化するものであり、R−G−Bカラー成分に存在するY−Cb−Cr成分とは異なる特性を利用することができない。このような従来の手法として代表的なものが、2つの国際標準化機構であるISO/IECのMPEG及びITU−TのVCEGによる、共同ビデオチーム(Joint Video Team)のAVC/H.264標準化技術である。
【0004】
しかし、R−G−B成分とY−Cb−Cr成分では、映像の特性が異なるため、従来のY−Cb−Cr符号化器でR−G−B成分を符号化すると、符号化効率が大きく低下する。例えば、Y−Cb−Cr映像は、空間上、同じ位置でY、Cb、Crの各成分間に相関関係がほとんどないが、一方、R−G−B映像は各成分間に相関関係が残っている。
【0005】
また、R−G−B映像では、R、G、Bの各成分間の周波数特性が類似しているが、Y−Cb−Cr映像では、R−G−B映像から変換する時に行われる処理によって、Luma成分であるY成分とChroma成分であるCb及びCr値とが相異なる周波数特性を有するものとなる。このように、従来のビデオ圧縮方法では、R−G−B映像及びY−Cb−Cr映像の特性を正確に符号化に反映できなかった。また、従来のビデオ圧縮方法は、符号化する際に、映像のサイズによる周波数特性の変化を考慮するものではなかった。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明が解決しようとする技術的課題は、インタープレーン(inter-plane)予測を利用してR−G−B映像の符号化/復号化効率を高めるビデオ符号化/復号化装置及びその方法を提供することである。
【0007】
本発明が解決しようとする他の技術的課題は、ビデオ符号化/復号化に際し、色情報及び解像度情報による効率的な動き補償を行う動き補償装置及びその方法を提供することである。
【0008】
本発明が解決しようとする他の技術的課題は、ビデオ符号化/復号化に際し、色情報及び解像度情報によって効率的にブロック効果(ノイズ/歪)を低減するデブロッキングフィルタ装置及びその方法を提供することである。
【課題を解決するための手段】
【0009】
前記課題を達成するための本発明によるビデオ符号化装置は、入力映像の第1動き予測結果に基づいて前記入力映像に対する第1予測誤差映像を算出する第1動き予測部と、R−G−B映像の色成分のうち所定の色成分を基準色成分と設定し、前記入力映像がY−Cb−Cr映像であるか前記R−G−B映像であるかを把握し、前記入力映像の色成分が前記基準色成分であるか否かを把握する映像情報把握部と、前記入力映像が前記R−G−B映像であり、前記入力映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記第1予測誤差映像に対する動き予測を行って第2予測誤差映像を算出する第2動き予測部と、を含む。
【0010】
前記課題を達成するための本発明によるビデオ符号化方法は、入力映像の第1動き予測結果に基づいて前記入力映像に対する第1予測誤差映像を算出する段階と、R−G−B映像の色成分のうち所定の色成分を基準色成分と設定し、前記入力映像がY−Cb−Cr映像であるか前記R−G−B映像であるかを把握し、前記入力映像の色成分が前記基準色成分であるか否かを把握する段階と、前記入力映像が前記R−G−B映像であり、前記入力映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記第1予測誤差映像に対する動き予測を行って第2予測誤差映像を算出する段階と、を含む。
【0011】
前記課題を達成するための本発明によるビデオ復号化装置は、符号化映像に所定の演算を行って前記符号化映像から復元された第1予測誤差映像を算出する第1復元部と、前記符号化映像がR−G−B映像であるかY−Cb−Cr映像であるかを把握し、前記符号化映像の色成分がR−G−B映像の基準色成分であるか否かを把握する映像情報把握部と、前記符号化映像が前記R−G−B映像であり、前記符号化映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記符号化映像から復元された第2予測誤差映像を算出する第2復元部と、前記第1予測誤差映像および第2予測誤差映像に基づいて復元された前記符号化映像に対する復号化映像のブロック効果を減少させるデブロッキングフィルタと、を含む。
【0012】
前記課題を達成するための本発明によるビデオ復号化方法は、符号化映像に所定の演算を行って前記符号化映像から復元された第1予測誤差映像を算出する段階と、前記符号化映像がR−G−B映像であるかY−Cb−Cr映像であるかを把握し、前記符号化映像の色成分がR−G−B映像の基準色成分であるか否かを把握する段階と、前記符号化映像が前記R−G−B映像であり、前記符号化映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記符号化映像から復元された第2予測誤差映像を算出する段階と、前記第1予測誤差映像及び第2予測誤差映像に基づいて復元された前記符号化映像に対する復号化映像のブロック効果を減少させる段階と、を含む。
【0013】
前記課題を達成するための本発明によるビデオ符号化/復号化装置用の動き補償装置は、入力映像の色情報を把握する映像情報把握部と、前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、前記補間結果に対して動き補償を行う動き補償部と、を含む。
【0014】
前記課題を達成するための本発明によるビデオ符号化/復号化用の動き補償方法は、入力映像の色情報を把握する段階と、前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する段階と、前記補間結果に対して動き補償を行う段階と、を含む。
【0015】
前記課題を達成するための本発明によるビデオ符号化/復号化装置用の動き補償装置の他の実施形態は、入力映像の解像度及び色情報を把握する映像情報把握部と、前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、前記補間結果に対して動き補償を行う動き補償部と、を含む。
【0016】
前記課題を達成するための本発明によるビデオ符号化/復号化用の動き補償方法の他の実施形態は、入力映像の解像度及び色情報を把握する段階と、前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、前記補間結果に対して動き補償を行う段階と、を含む。
【0017】
前記課題を達成するための本発明によるデブロッキングフィルタ装置は、復号化対象映像の色情報を把握する映像情報把握部と、前記色情報に基づいて前記復号化対象映像のブロック効果を減少させるデブロッキングフィルタの長さを選択するデブロッキングフィルタ選択部と、前記選択された長さのデブロッキングフィルタを利用して前記復号化対象映像をフィルタリングするフィルタリング部と、を含む。
【0018】
前記課題を達成するための本発明によるデブロッキングフィルタ選択方法は、復号化対象映像の色情報を把握する段階と、前記色情報に基づいて前記復号化対象映像のブロック効果を減少させるデブロッキングフィルタの長さを選択する段階と、前記選択された長さのデブロッキングフィルタを利用して前記復号化対象映像をフィルタリングする段階と、を含む。
【0019】
本発明は、上述のような形態により、色情報及び解像度特性による最適の符号化/復号化を行う。
【発明の効果】
【0020】
本発明は、入力映像の色成分特性と解像度特性とを考慮して、ビデオデータを効率的に符号化及び復号化できる。R−G−B映像の場合は、特に、インタープレーン予測を使用して符号化効率を改善する。本発明は、R−G−B映像を直接符号化する場合、高品質の映像情報が必要なデジタル映画及びデジタルアーカイブなどの応用に適している。
【0021】
また、本発明は、符号化及び復号化のプロセスにおける動き補償とデブロッキングフィルタの方法で、色成分の特性及び映像解像度特性を利用した。フィルタリング過程を経て映像品質を改善するこれら方法を、映像の特性に適合するように構成することにより、符号化効率を改善する。したがって、Y−Cb−Cr映像だけではなく、R−G−B映像に対しても、それぞれの特性に適する符号化及び復号化が可能である。
【図面の簡単な説明】
【0022】
【図1A】本発明によるビデオ符号化装置の一実施例の構成を示すブロック図である。
【図1B】本発明によるビデオ符号化装置の一実施例の構成を示すブロック図である。
【図2】本発明によるビデオ符号化方法の一実施例を示すフローチャートである。
【図3A】本発明によるビデオ復号化装置の一実施例の構成を示すブロック図である。
【図3B】本発明によるビデオ復号化方法の一実施例を示すフローチャートである。
【図4】映像の色情報による動き補償装置の一実施例の構成を示すブロック図である。
【図5】映像の色情報による動き補償方法の一実施例を示すフローチャートである。
【図6】映像の色情報及び解像度情報による動き補償装置の一実施例の構成を示すブロック図である。
【図7】映像の色情報及び解像度情報による動き補償方法の一実施例を示すフローチャートである。
【図8】長いフィルタタップを利用した補間方法を示す図面である。
【図9】短いフィルタタップを利用した補間方法を示す図面である。
【図10】映像の色情報によるデブロッキングフィルタの構成を示すブロック図である。
【図11】映像の色情報によるデブロッキングフィルタ選択方法の一実施例を示すフローチャートである。
【図12A】デブロッキングフィルタが適用されるマクロブロックの垂直/水平境界を示す図面である。
【図12B】デブロッキングフィルタが適用されるマクロブロックの垂直/水平境界を示す図面である。
【図13A】4×4ブロックの垂直/水平境界の映像サンプルを示す図面である。
【図13B】4×4ブロックの垂直/水平境界の映像サンプルを示す図面である。
【図14A】本発明によるインタープレーン予測符号化実施例の結果を示す図面である。
【図14B】本発明によるインタープレーン予測符号化実施例の結果を示す図面である。
【図15A】本発明による動き補償装置を利用した符号化実施例の結果を示す図面である。
【図15B】本発明による動き補償装置を利用した符号化実施例の結果を示す図面である。
【発明を実施するための形態】
【0023】
以下、添付された図面を参照して本発明によるビデオ符号化/復号化装置とその方法、動き補償装置とその方法及びデブロッキングフィルタ装置とその方法について詳細に説明する。
【0024】
図1Aは、本発明によるビデオ符号化装置の一実施例の構成を示す図面である。
【0025】
図1Aに示すように、本発明によるビデオ符号化装置は、第1動き予測部100と、映像情報把握部110と、第2動き予測部120と、符号化部130とにより構成される。第1動き予測部100は、インタープレーン予測部101と、イントラプレーン予測部104と、予測誤差算出部107とにより構成される。
【0026】
第1動き予測部100のインタープレーン予測部101及びイントラプレーン予測部104は、それぞれ入力映像に対して時/空間的に隣接した映像に基づいて動き予測を行う。インタープレーン予測部101は、入力映像と時間的に隣接した先行復元映像を利用して動き予測を行い、イントラプレーン予測部104は、空間的に隣接した入力映像の符号化単位ブロックを利用して動き予測を行う。一般に、最初の入力映像に対しては先行する復元映像がないので、イントラプレーン予測部104が動き予測を行い、以後の入力映像に対してはインタープレーン予測部101が動き予測を行う。予測誤差算出部107は、インタープレーン予測部101又はイントラプレーン予測部104の動き予測結果と入力映像との差を利用して第1予測誤差映像を算出する。
【0027】
また、第1動き予測部100は、入力映像の色情報及び解像度情報によって動き補償のために使用するフィルタタップの長さを異にする。これについては、その詳細を、図4乃至図9を参照して後述する。
【0028】
映像情報把握部110は、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握する。また、映像情報把握部110は、入力映像の色成分を把握する。すなわち、映像情報把握部110は、入力映像の色成分がR−G−B映像のR成分、G成分、B成分であるか、又はY−Cb−Cr映像のY成分(Luma)、Cb成分、Cr成分(Chroma)であるかを把握する。そして、映像情報把握部110は、R−G−B映像の色成分のうち所定の色成分を本発明によるイントラプレーン予測のための基準色成分と設定する。基準色成分は、R、G、B成分のうち何れか一つの成分が任意に設定され、以下ではG成分を基準色成分に設定したものと仮定する。
【0029】
第2動き予測部120は、入力映像の色成分がR−G−B映像の基準色成分以外の色成分であれば、基準色成分に基づいて、第1動き予測部100から出力される第1予測誤差映像に対して、動き予測を行って第2予測誤差映像を算出する。第2動き予測部120で使われる基準色成分は、現在の入力映像の前に入力されて符号化された後に再び復号化された値である。具体的には、第2動き予測部120は、符号化され且つ復号化された基準色成分の予測誤差映像に基づいて動き予測を行う。
【0030】
例えば、基準色成分がG成分であり、入力映像の色成分がB成分である場合、第1動き予測部100は、入力映像の動き予測結果に基づいてB成分及びG成分に対する第1予測誤差を算出する。そして、映像情報把握部110は、入力映像がR−G−B映像であり、入力映像の色成分が基準色成分(G成分)以外の成分(B成分)であることを把握する。第2動き予測部120は、符号化された後に再び復号化された基準色成分(G成分)の第1符号化予測誤差映像に基づいて、入力映像(B成分)の第1予測誤差映像に対するインタープレーン予測を行って第2予測誤差映像を算出する。すなわち、B成分の入力映像は、第1動き予測部100及び第2動き予測部120によって二回の予測過程を経る。
【0031】
符号化部130は、第1動き予測部100による第1予測誤差映像及び第2動き予測部110による第2予測誤差映像を符号化してビットストリームを生成する。具体的には、符号化部130は、予測誤差映像を離散コサイン変換(Discrete Cosine Transform:DCT)132又は離散整数変換132して、変換された値を量子化134及びエントロピー符号化136して符号化映像(ビットストリーム)を生成する。
【0032】
Y−Cb−Cr映像は、R−G−B映像から色座標空間変換方式によって変換されるので、Y−Cb−Cr映像とR−G−B映像とは符号化側面で相異なる特性を有する。すなわち、Y−Cb−Cr映像のY、Cb、Cr成分は、空間上同じ位置の各成分間に相関関係がほとんどないが、一方で、R−G−B映像は、各成分間に相関関係が残っている。したがって、本発明によるビデオ符号化装置は、入力映像がR−G−B映像であるかY−Cb−Cr映像であるかによって、符号化する時に使用する予測方法を異にする。
【0033】
結局、本発明によるビデオ符号化装置は、R−G−B映像の色成分のうち何れか一つを基準色成分と設定し、設定された基準色成分は、従来の符号化方法で符号化する。そして、ビデオ符号化装置は、R−G−B映像の基準色成分以外の残りの2つの色成分を、空間上隣接した画素又は時間上隣接した画素を利用して予測した後、予測された結果を基準色成分に基づいて再び予測する。
【0034】
図1Bは、本発明によるビデオ符号化装置の一実施例の構成を示す図面である。
【0035】
図1Bに示すように、本発明によるビデオ符号化装置は、第1動き予測部100と、映像情報把握部110と、第2動き予測部120と、符号化部130と、第1復元部140と、第2復元部150と、デブロッキングフィルタ160とにより構成される。また、第1動き予測部100は、インタープレーン予測部101と、イントラプレーン予測部104と、予測誤差算出部107とにより構成される。
【0036】
入力映像F(n)170は、Y−Cb−Cr映像又はR−G−B映像である。本発明によるビデオ符号化装置において、入力映像170は、ブロック単位で処理される。第1動き予測部100は、インタープレーン予測部101とイントラプレーン予測部104とにより構成される。インタープレーン予測部101は、動き予測部(Motion Estimation unit:ME)102及び動き補償部(Motion Compensation unit:MC)103を含み、符号化効率を高めるために、以前の復元映像Fr(n−1)
172に基づいて動きを推定し且つ予測する。イントラプレーン予測部104は、空間推定部(Spatial Estimation unit:SE)105及び空間予測部(Spatial
Prediction unit:SP)106を含み、空間的に隣接しているブロックに基づいて動きを推定し且つ予測する。
【0037】
Y−Cb−Cr(或いはY−U−V)映像とR−G−B映像のそれぞれの色成分によって、動き補償に使用する補間方法(interpolation)は異なる。まず、予測誤差算出部107は、入力映像170と、インタープレーン予測部101又はイントラプレーン予測部104の動き予測結果と、に基づいて符号化予測誤差映像ΔF(n)を得る。もし、入力映像170がY−Cb−Cr映像であれば、予測誤差算出部107は、ΔF(n)から予測誤差ΔY(n)、ΔU(n)、ΔV(n)を得る。一方、入力映像170がR−G−B映像であれば、予測誤差算出部107は、ΔF(n)から予測誤差ΔR(n)、ΔG(n)、ΔB(n)を得る。
【0038】
符号化部130は、Y−Cb−Cr映像のΔY(n)、ΔU(n)、ΔV(n)と、R−G−B映像のΔG(n)とを、DCT(又は、離散整数変換)132、量子化134、エントロピー符号化136を経て圧縮する。
【0039】
入力映像170がR−G−B映像であれば、第2動き予測部120の誤差予測部(Residue Prediction unit:RP)122は、R成分及びB成分の予測誤差映像ΔB(n)及びΔR(n)を、復元されたG成分の予測誤差映像ΔGr(n)を利用してインタープレーン予測する。そして、符号化部130は、インタープレーン予測によって得た予測誤差映像ΔB′(n)及びΔR′(n)を、DCT(又は、離散整数変換)132、量子化134、エントロピー符号化136を経て圧縮する。DCTは、ISO/IECのMPEG−4パート2標準化技術であり、離散整数変換は、ISO/IECのMPEG及びITU−TのVCEGによる共同ビデオチームが策定したAVC/H.264標準化技術である。
【0040】
第1復元部140は、符号化部130が変換132及び量子化134した復元対象映像を、空間的に近接したブロック或いは時間的に後で入力される映像を利用した予測で使用できるように、逆量子化144し、逆DCT(IDCT:Inverse DCT)(又は、逆離散整数変換)142を行って、当該映像のそれぞれの色成分に対する予測誤差映像を生成する。
【0041】
第1復元部140は、復元対象映像がY−Cb−Cr映像であれば、復元された予測誤差映像ΔYr(n)、ΔUr(n)、ΔVr(n)を得る。また、第1復元部140は、復元対象映像がR−G−B映像であれば、復元された予測誤差映像ΔGr(n)、ΔB′r(n)、ΔR′r(n)を得る。ΔGr(n)は、第2動き予測部120によるインタープレーン予測のためにバッファ124に保存される。
【0042】
第2復元部150は、復元対象映像の色成分がR成分及びB成分であれば、G成分の復元された予測誤差映像ΔGr(n)を利用してR成分及びB成分の復元された予測誤差映像ΔBr(n)及びΔRr(n)を得る。Y−Cb−Cr映像の復元誤差映像ΔYr(n)、ΔUr(n)、ΔVr(n)或いはR−G−B映像の復元誤差映像ΔGr(n)、ΔBr(n)、ΔRr(n)は、デブロッキングフィルタ160の入力Fr(n)となる。
【0043】
デブロッキングフィルタ(ループフィルタ)160は、Fr(n)と第1動き予測部100によるインタープレーン予測又はイントラプレーン予測の結果を第2復元部150の出力値と加算して求めた復元された映像をフィルタリングすることにより、ブロック効果を低減する。本発明によるデブロッキングフィルタ160は、Y−Cb−Cr(或いは、Y−U−V)映像とR−G−B映像との各成分によってブロックの境界領域で使用するフィルタタップの長さが異なるものを用いる。これについての詳細は、図10及び図11を参照して後述する。
【0044】
図2は、本発明によるビデオ符号化方法の一実施例を示すフローチャートである。
【0045】
図1A及び図2を参照して、本発明のビデオ符号化方法を説明する。まず、第1動き予測部100は、入力映像に対して時/空間上予測(インタープレーン予測/イントラプレーン予測)を行う(S200)。映像情報把握部110は、R−G−B映像の基準色成分としてG成分を設定し、入力映像がR−G−B映像であるか否かを判断する(S210)。もし、入力映像がR−G−B映像であれば、映像情報把握部110は、入力映像の色成分が基準色成分のG成分であるか否かを判断する(S220)。もし、入力映像の色成分がR成分又はB成分であれば、第2動き予測部120は、復元されたG成分の予測誤差映像を利用して各成分のインタープレーン予測を行う(S230)。言い換えれば、本発明によるビデオ符号化方法は、R−G−B映像の基準色成分以外の成分に対して第1動き予測部100によって動き予測を行い、基準色成分に基づいて再び動き予測を行う。第1動き予測部100又は第2動き予測部120によって算出された予測誤差映像は、DCT或いは離散整数変換、量子化、エントロピー符号化を通じて圧縮される。
【0046】
R−G−B映像の基準色成分以外の色成分であるR成分及びB成分に適用されるイントラプレーン予測について、以下その原理を詳細に説明する。まず、空間的に隣接した映像或いは時間的に隣接した映像値を利用して予測した値を入力映像から減算してG成分の予測誤差映像ΔGを得る。この予測誤差映像は、次の数式1の通りである。
【0047】
【数1】
ここで、GpはG成分を空間的に隣接したG成分映像或いは時間的に隣接したG成分映像を利用して予測した値である。この予測誤差映像が実際にエントロピー符号化される。
【0048】
Y−Cr−Cb成分と違って、G成分、R成分、B成分間には依然として大きな相関度がある。G成分との類似性を利用するために、まず、R成分及びB成分を、G成分と同様に、時/空間上の予測にかける。ここで、得た予測誤差映像ΔR及びΔGは、次の通りである。
【0049】
【数2】
【0050】
【数3】
ここで、Rp及びBpは、R成分及びB成分を空間的に隣接した映像或いは時間的に隣接した映像を利用して予測したものである。ここで得た予測誤差映像を、符号化された後に再び復号化されたG成分の予測誤差映像の線形変換した値で減算してインタープレーン予測されたR成分及びB成分の予測誤差映像ΔR′及びΔG′を得る。以上の処理は、次の数式4及び数式5のように表すことができる。
【0051】
【数4】
【0052】
【数5】
これらの値は、R成分及びB成分の時/空間上の予測誤差ΔR及びΔBに比べて、符号化するデータの量が少なくなっており、符号化効率が改善されたことがわかる。これは、予測誤差映像ΔG、ΔR、ΔB間の相関度が大きいので、ΔGとΔR及びΔGとΔBの関係を線形の関数で表現することで、ΔR及びΔBをΔGの関数に近似させることができるためである。以下の数式において、a及びb(数式6、7)は、R成分の予測誤差をG成分の予測誤差を利用して予測するときに近似させた線形関数の傾き及び偏差となり、c及びd(数式8、9)は、B成分の予測誤差をG成分の予測誤差を利用して予測するときに近似させた線形関数の傾き及び偏差である。
【0053】
【数6】
【0054】
【数7】
【0055】
【数8】
【0056】
【数9】
ここで、cov(・)は共分散を表し、E(・)は値の平均、そして、σ2は分散を表す。
【0057】
図3Aは、本発明によるビデオ復号化装置の一実施例の構成を示すブロック図である。
【0058】
図3Aに示すように、本発明によるビデオ復号化装置は、第1復元部300と、映像情報把握部310と、第2復元部320と、動き推定部330と、デブロッキングフィルタ340とにより構成される。
【0059】
本発明によるビデオ復号化装置は、図1Bのビデオ符号化装置の過程と反対の過程とを経て圧縮されたビットストリーム(すなわち、符号化映像)から映像を復元する。第1復元部300は、圧縮されたデータを、エントロピー復号化302、逆量子化304、逆離散整数変換306して、Y−Cb−Cr映像の場合、各成分の復元された予測誤差映像ΔYr(n)、ΔUr(n)、ΔVr(n)を得る。一方、第1復元部300は、圧縮されたビットストリームがR−G−B映像であれば、復元された予測誤差映像ΔGr(n)、ΔB′r(n)、ΔR′r(n)を得る。
【0060】
映像情報把握部310は、圧縮されたビットストリームがY−Cb−Cr映像であるかR−G−B映像であるかを把握し、圧縮されたビットストリームの色成分がR−G−B映像の基準色成分であるか否かを把握する。以下の説明では、基準色成分をG成分と仮定する。
【0061】
圧縮されたビットストリームがY−Cb−Cr映像であるか、又はR−G−B映像の基準色成分(G成分)であれば、第1復元部300によって復元された予測誤差映像が動き推定部330の入力に使われる予測誤差映像ΔFr(n)となる。
【0062】
第2復元部320は、圧縮されたビットストリームがR−G−B映像のB成分又はR成分(すなわち、基準色成分以外の成分)であれば、G成分の予測誤差映像ΔGr(n)をR成分及びB成分の予測誤差映像復元のためのインタープレーン予測のために保存する。
【0063】
一方、第2復元部320は、R成分及びB成分の予測誤差映像ΔB′r(n)及びΔR′r(n)をG成分の復元された予測誤差映像ΔGr(n)を利用して復元した予測誤差映像ΔBr(n)及びΔRr(n)を得る。R成分及びB成分の場合、その値(ΔBr(n)及びΔRr(n))がΔFr(n)となる。
【0064】
第2復元部320は、ビットストリームがビデオ符号化装置(図1A、図1B参照)でインタープレーン予測を利用して符号化された場合には、動き推定部330のMC(Motion Comparator)332による先行映像Fr(n−1)350のインタープレーン予測値と第1復元部300による予測誤差映像とを加算してR−G−B或いはY−Cb−Cr映像の各成分の復元された値を得る。一方、第2復元部320は、ビットストリームがイントラプレーン予測を利用して符号化された場合には、動き推定部330のSP(Spatial
Predictor)334によるイントラプレーン予測値と第1復元部300による予測誤差映像とを加算してR−G−B或いはY−Cb−Cr映像の各成分の復元された値を得る。ここで、動き推定部330のMC332によるインタープレーン予測は、Y−Cb−Cr(或いは、Y−U−V)映像とR−G−B映像との各成分によって動き補償するときに使用する補間方法を異にする。これについての詳細は、図4乃至図9を参照して後述する。第2復元部320によって復元された値は、ブロック効果を低減するデブロッキングフィルタ340を経て各色成分の復元映像Fr(n)352(すなわち、前記ビットストリームとしての符号化映像に対する復号化映像)となる。
【0065】
デブロッキングフィルタ340は、Y−Cb−Cr(或いは、Y−U−V)映像とR−G−B映像との各成分によって、ブロックの境界領域で使用するフィルタタップの長さを異にする。これについての詳細は、図10及び図11を参照して後述する。
【0066】
図3Bは、本発明によるビデオ復号化方法の一実施例を示すフローチャートである。
【0067】
図3A及び図3Bを参照して、本発明によるビデオ復号化方法の一実施例を説明する。まず、第1復元部300は、ビットストリームから第1予測誤差映像を算出する(S350)。そして、映像情報把握部310は、ビットストリームがY−Cb−Cr映像であるかR−G−B映像であるかを把握し、ビットストリームの色成分がR−G−B映像の基準色成分であるか否かを把握する(S355)。
【0068】
第2復元部320は、ビットストリームがR−G−B映像であり、ビットストリームの色成分がR−G−B映像の基準色(G)成分以外の成分(R、B成分)であれば、第1復元部300によって算出された第1予測誤差映像を基準色(G)成分の第1予測誤差映像を利用して予測し、第2予測誤差映像を得る(S360)。
【0069】
第2復元部320は、第1予測誤差映像及び第2予測誤差映像を、動き推定部330の先行映像に対する動き予測結果と加算して、復元された映像(前記符号化映像に対する復号化映像)を獲得する(S365)。デブロッキングフィルタ340は、復元された映像のブロック効果を減少させ、最終復元された映像Fr(n)352を得る(S370)。
【0070】
図4は、本発明による動き補償装置の一実施例の構成を示す図面である。
【0071】
図4に示すように、本発明による動き補償装置103,332は、映像情報把握部(図示せず)と、フィルタタップ選択部400と、長いフィルタタップ補間部410と、短いフィルタタップ補間部420と、動き補償部(Motion Compensator:MC)430とにより構成される。
【0072】
R−G−B映像は、R、G、Bの各成分間の周波数特性が類似しているが、Y−Cb−Cr映像は、Luma成分であるY成分とChroma成分であるCb成分及びCr成分との周波数特性が異なる。そして、Y−Cb−Cr映像では、一般に、Chroma成分はLuma成分に比べて低周波成分が多く、相関度も大きい。図4は、このような映像の色成分によって異なる方法により先行フレームを利用した動き予測を行う、動き補償装置の構成を示すブロック図である。
【0073】
映像情報把握部(図示せず)は、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握し、入力映像の色成分がR−G−B映像の基準色成分であるか否かを把握する。一般に、R−G−B映像の基準色成分はG成分である。
【0074】
フィルタタップ選択部400は、映像情報把握部(図示せず)から受信した入力映像の色成分情報402に基づき、長いフィルタタップ補間部410又は短いフィルタタップ補間部420を選択する。すなわち、フィルタタップ選択部400は、入力映像のそれぞれの色成分に基づいて最適の動き推定のためのフィルタタップを選択する。長いフィルタタップは一般に6タップフィルタであり、短いフィルタタップは2タップフィルタである。
【0075】
例えば、フィルタタップ選択部400は、入力映像がY−Cb−Cr映像であるか、又は入力映像の色成分がR−G−B映像の基準色成分以外の成分であれば、6タップフィルタ補間部を選択し、入力映像の色成分がR−G−B映像の基準色成分であれば、2タップフィルタ補間部を選択する。
【0076】
補間部410,420は、フィルタタップ選択部400によって選択されると、動き補償のために入力映像を補間する。このとき、それぞれの補間部410,420は、先行フレームの動きベクトル412に基づいて入力映像を補間する。
【0077】
例えば、補間部410,420は、それぞれ、6タップフィルタの補間部410と双一次補間する補間部420とにより構成することができる。この場合、フィルタタップ選択部400によって6タップフィルタの補間部410が選択されれば、6タップフィルタの補間部410は入力映像を補間する。
【0078】
補間部410,420によって補間された入力映像は、MC430によって動き補償される。
【0079】
図5は、本発明による動き補償方法の一実施例を示すフローチャートである。以下、図4の装置構成ブロック図と図5のフローチャートを参照しつつ、入力映像の色成分による動き補償方法について説明する。
【0080】
図4及び図5に示すように、フィルタタップ選択部400は、映像情報把握部(図示せず)から受信した色情報に基づいてフィルタタップを選択する(S500)。もし、入力映像の色成分がR−G−B成分であれば(S510)、フィルタタップ選択部400はR−G−B映像の各成分に対して同じ補間方法を選択する(S520)。例えば、フィルタタップ選択部400は、R−G−B各成分のすべてに対して同じように、すなわち、すべてに長いフィルタタップ補間部410を選択して適用するか、すべてに短いフィルタタップ補間部420を選択して適用する。
【0081】
入力映像の色成分がR−G−B成分ではなく、Y−Cb−Cr成分であれば、映像情報把握部(図示せず)は、入力映像の色成分がY成分(Luma)であるか否かを判断する(S530)。もし、入力映像の色成分がLuma成分であれば、フィルタタップ選択部400は、入力映像が長いタップのフィルタを通じて補間されるように長いフィルタタップを有する補間部410を選択する(S540)。もし、入力映像の色成分がChroma成分(Cb,Cr)であれば、フィルタタップ選択部400は短いフィルタタップ補間部420を選択する(S550)。
【0082】
このようにフィルタタップの長さを入力映像の色成分ごとに異ならしめる理由は、入力映像の色成分に高周波成分が多ければ、周囲に多くの画素を使用する長いフィルタタップ補間方法が高周波成分をよく復元する可能性が大きいためである。一方、低周波成分が多ければ、周囲に少ない画素を使用する短いフィルタタップが、長いフィルタタップと性能において差がなく、複雑度の面ではかえって有利である。
【0083】
図6は、本発明による動き補償装置の他の実施例の構成を示すブロック図である。
【0084】
図6に示すように、本発明による動き補償装置103,332は、映像情報把握部(図示せず)と、フィルタタップ選択部600と、長いフィルタタップ補間部610と、短いフィルタタップ補間部620と、動き補償部(Motion Compensator:MC)630とにより構成される。
【0085】
映像の色成分602だけでなく、映像のサイズ或いは解像度情報604も周波数特性に影響を及ぼす。図6を参照して、色情報以外に映像の解像度情報に基づき異なる動き補償方法を採用する動き補償装置について説明する。
【0086】
映像情報把握部(図示せず)は、入力映像の色成分及び解像度情報を把握する。具体的に、映像情報把握部(図示せず)は、入力映像が高解像度であるか低解像度であるかを把握し、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握し、入力映像の色成分がR−G−B映像の基準色成分であるか否かを把握する。
【0087】
フィルタタップ選択部600は、映像情報把握部(図示せず)によって把握された入力映像の色情報及び解像度情報によってフィルタタップの長さを選択する。具体的に、フィルタタップ選択部600は、入力映像が高解像度映像であるか、又は入力映像の色成分がY−Cb−Cr映像のLuma(Y)成分以外の成分であれば、短いタップのフィルタを選択する。そして、フィルタタップ選択部600は、入力映像が低解像度映像であるか、入力映像がR−G−B映像であるか、入力映像の色成分がY−Cb−Cr映像のLuma(Y)成分であれば、長いタップのフィルタを選択する。一般に、長いフィルタタップは6タップフィルタであり、短いフィルタタップは2タップフィルタである。
【0088】
補間部610,620は、長いフィルタタップを使用する補間部610及び短いフィルタタップを使用する補間部620により構成され、先行フレームの動き情報(Motion Vector:MV)に相当する映像情報を補間する。
【0089】
MC 630は、補間部によって補間された入力映像を動き補償する。
【0090】
図7は、本発明による動き補償方法の他の実施例を示すフローチャートであって、色成分及び解像度情報を利用して動き補償を行う方法を表す。
【0091】
図6及び図7を参照して色成分及び解像度情報を利用した動き補償方法について説明する。まず、映像情報把握部(図示せず)は、入力映像の映像サイズ情報を入力されて(S700)、入力映像が高解像度映像であるか否かを判断する(S710)。本発明で、高解像度はHD(High Definition)解像度である1280×720映像サイズを基準として、これより大きい映像を意味する。この基準となる値は、適用される環境と応用とによって変わる。
【0092】
もし、入力映像が高解像度映像であれば、フィルタタップ選択部600は、短いフィルタタップを使用する補間部を選択する(S750)。これは、高解像度映像の場合、低周波成分が多く含まれていて、敢えて長いフィルタタップを使用しなくてもよいためである。高解像度映像の場合、実際映像の小さな領域を多数の画素で表示するため、画素間の変化程度が小さい。この場合、長いフィルタタップと短いフィルタタップ間にビデオ品質の差が小さいので、複雑度を考慮して、フィルタタップ選択部600は短いフィルタタップ補間部620を選択する。
【0093】
もし、入力映像が低解像度映像であれば、映像情報把握部(図示せず)は、色情報を入力されて(S700)、入力映像がR−G−B成分であるか否かを判断する(S720)。もし、入力映像の色成分がR−G−B成分であれば(S730)、フィルタタップ選択部600は、各成分すべてに対して長いタップのフィルタを使用して補間するように長いフィルタタップ補間部610を選択する(S740)。もし、入力映像の色成分がR−G−B成分ではなく、Y−Cb−Cr成分であれば、映像情報把握部(図示せず)は、Y(Luma)成分であるか否かを判断する(S730)。もし、入力映像の色成分がLuma成分であれば、フィルタタップ選択部600は長いタップのフィルタを選択する(S740)。もし、入力映像の色成分がChroma成分であれば、フィルタタップ選択部600は短いタップのフィルタを選択する(S750)。
【0094】
図8は、動き補償のために先行フレームの映像を垂直/水平方向にそれぞれ4倍ずつ補間する場合に、6タップフィルタを使用した例を示す図面である。
【0095】
6タップフィルタは、MPEG−4のAVC/H.264で使用する方式である。図8で、先行フレームの画素AからUまで与えられた時、1/4或いは1/2解像度の画素aからsを、次のような方式で求める。
【0096】
まず、垂直或いは水平方向に1/2解像度の位置にあるb及びhは、周囲の6つの画素を利用して、次のように補間する(数式10、数式11のb1及びh1は、それぞれb及びhを求めるための中間結果である)。
【0097】
【数10】
【0098】
【数11】
【0099】
【数12】
【0100】
【数13】
ここで、Clip1(x)は、xを映像画素のビット範囲内へ切断(クリップ)することを意味する。もし、8ビット映像であれば、Clip1(x)は、xが0より小さければ0とし、255より大きければ255とし、その他の値であればその値をそのまま維持させる。補間に使用したフィルタタップは、比較的周囲の画素を多く利用した6タップフィルタ(1,−5,20,20,−5,1)である。
【0101】
垂直及び水平方向に1/2解像度の位置にあるj画素は、以前に復元された垂直或いは水平方向の1/2解像度にある周囲の画素を利用して、次の数式14及び数式15のように補間する。
【0102】
【数14】
【0103】
【数15】
ここで、周囲画素cc、dd、h1、m1、ee、ff或いはaa、bb、b、s1、gg、hhは、前記数式10及び数式11と同様に、6タップフィルタを使用して補間した中間結果である。
【0104】
1/2解像度の最後の値であるs及びmは、前記数式12及び数式13によってs1及びm1から復元される。
【0105】
1/4解像度の位置にあるa、c、d、n、f、i、k、qは、二つの垂直或いは水平方向に隣接した画素の平均によって、次のように求める。
【0106】
【数16】
1/4解像度の位置にあるe、g、p、rは、二つの対角線方向に隣接した画素の平均によって、次のように求める。
【0107】
【数17】
図9は、動き補償するために先行フレームの映像を垂直/水平方向にそれぞれ4倍ずつ補間する時、短いフィルタタップの一例として双一次補間方法を使用した例である。この双一次補間方法は、MPEG−4
AVC/H.264で使用する方式である。
【0108】
先行フレームの画素A、B、C、Dで1/4或いは1/2の解像度の画素aを次のように求める。
【0109】
【数18】
ここで、dxはaがA或いはCから水平方向に離れた距離を1/4解像度で表示した値である。そして、dyはaがA或いはBから垂直方向に離れた距離を1/4解像度で表示した値である。
【0110】
図9を参照すれば、双一次補間方法は、図7に示す方法と異なり、使用する周囲の画素が比較的少なく、補間する値と近接した距離の周囲値を用いるものであることがわかる。
【0111】
図10は、本発明による色成分特性を利用したデブロッキングフィルタの一実施例の構成を示すブロック図である。動き補償だけでなく、映像復元後に発生するブロック効果を低減するためのデブロッキングフィルタにも映像の色成分特性を利用する。図10を参照して、このような映像の色成分によって異なるデブロッキングフィルタ適用方法を採用するデブロッキングフィルタの一実施例について説明する。
【0112】
図10に示すように、デブロッキングフィルタ160,340は、映像情報把握部(図示せず)と、デブロッキングフィルタ選択部1000と、フィルタリング部(長いタップのデブロッキングフィルタ1010,短いタップのデブロッキングフィルタ1020)とにより構成される。
【0113】
映像情報把握部(図示せず)は、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握し、入力映像の色成分がY−Cb−Cr映像のLuma(Y)成分であるか否かを把握する。
【0114】
デブロッキングフィルタ選択部1000は、入力映像の色成分に基づいて相異なる長さのフィルタタップより構成されたデブロッキングフィルタ1010,1020のうち何れか一つのデブロッキングフィルタを選択する。例えば、デブロッキングフィルタ選択部1000は、入力映像がR−G−B映像であるか、又は入力映像の色成分がY−Gb−Gr映像のLuma(Y)成分であれば、長いタップのデブロッキングフィルタ1010を選択する。そして、デブロッキングフィルタ選択部1000は、入力映像がY−Cb−Cr映像のChroma(Cb,Cr)成分であれば、短いタップのデブロッキングフィルタ1020を選択する。
【0115】
フィルタリング部1010,1020はそれぞれ異なる長さのタップのデブロッキングフィルタより構成され、デブロッキングフィルタ選択部1000によって選択されたデブロッキングフィルタ1010,1020を利用して入力映像をフィルタリングする。
【0116】
フィルタリング部1010,1020は、ブロック単位の符号化モードと、CBP(Coded Block Pattern)と、先行フレームの動き情報(MV,MC)のための参照映像番号と、インターレース映像である場合のフィールド情報とによってフィルタリング適用の有無を決定して最終的に映像のブロック効果を取り除く。
【0117】
図11は、入力映像の色成分によってデブロッキングフィルタタップを選択する方法を示すフローチャートである。
【0118】
図10及び図11を参照して説明すれば、デブロッキングフィルタ選択部1000は、映像情報把握部(図示せず)から色情報を入力されて(S1100)、入力映像の色成分がR−G−B成分であるか否かを判断する(S1110)。もし、入力映像がR−G−B成分であれば、デブロッキングフィルタ選択部1000は、各成分に対して同じ方式のフィルタタップ係数を選択する(S1130)。一般に、長いタップのフィルタを選択する。もし、R−G−B成分ではなく、Y−Cb−Cr(Y−U−V)成分であれば、映像情報把握部(図示せず)は、入力映像の色成分がY成分(Luma)であるか否かを判断する(S1120)。もし、入力映像の色成分がLuma(Y)成分であれば、デブロッキングフィルタ選択部1000は長いフィルタタップ1010を選択する(S1140)。もし、Chroma成分であれば、フィルタタップ選択部1000は短いフィルタタップ1020を選択する(S1150)。
【0119】
図12は、16×16マクロブロック内でブロック効果を減らすためにデブロッキングフィルタが適用される垂直/水平方向の境界を示す図面である。
【0120】
マクロブロック内で16個の4×4ブロックに分けられ、それぞれ符号化されるので、ブロック効果は、この4×4ブロック境界から発生する。図12Aに示すように、まず、垂直境界1201,1202,1203,1204に対してデブロッキングフィルタが適用される。次いで、図12Bに示すように、水平境界1205,1206,1207,1208に対してデブロッキングフィルタが適用される。
【0121】
図13は、4×4ブロックの垂直/水平境界でデブロッキングフィルタに適用する時に利用される係数を表す図面である。
【0122】
垂直境界の場合、図13Aのように、p0、p1、p2、p3、q0、q1、q2、q3画素値及びフィルタタップを使用してブロック効果を減らすようにp0、p1、p2、q0、q1、q2の画素値を変える。図13Bは、水平境界でデブロッキングフィルタに適用される画素を表す。
【0123】
4×4ブロックごとに損失の程度が異なるので、フィルタ係数が変わり、フィルタ適用如何も決定しなければならない。このために、図10のようにブロック単位の符号化モードと、CBPと、先行フレームの動き情報MV、MCのための参照映像番号と、インターレース映像である場合のフィールド情報とを利用して既定の臨界値を利用してデブロッキングフィルタ適用如何、フィルタ係数の長さなどを決定する。基本的なフィルタリング方法は、MPEG−4
AVC/H.264で使用する方式を使用した。4×4ブロックにフィルタ適用如何を決定するための値filterFlagは、次のように決定される。
【0124】
【数19】
ここで、filterFlagが1である場合にだけデブロッキングフィルタを適用する。αとβとは量子化値が大きくなれば、値が大きくなり、周囲画素の変化量によってデブロッキングフィルタの適用を決定する臨界値である。Bs(フィルタ強度)は、デブロッキングフィルタを適用する場合、フィルタを通じて何れの画素情報まで値を変化させるかを表す値である。0から4の値を有し、0である場合、フィルタを適用せずに1から4へ行くほどフィルタの係数を長くし、p0、p1、p2、p3、q0、q1、q2、q3のうち多数の画素がブロック効果を減らすようにその値が変わる。また、1から4へ行くほど、大きい値が変わりうる。
【0125】
まず、色成分がR−G−B成分であるか、又はY−Cb−Cr映像のY成分である場合、適用される長いタップ係数フィルタは、次のように数式20乃至数式29を使用して定義できる。
【0126】
Bsが4以下であれば、境界に最も近接したp0及びq0は、その値が次のようにp′0及びq′0に変わる。
【0127】
【数20】
【0128】
【数21】
ここで、Clip3(min,max,x)は、xを最小値minと最大値max間に位置させる。Clip1(x)は、数式12でのClip1(x)と意味が同じである。tcは、画素が所定値以上か以下には値を有しないようにする臨界値である。ここで、Bsが大きければ、tcも大きい値を有するようになって画素の変化程度が大きくなる。
【0129】
p1及びq1の場合に、フィルタリング如何を決定するために、次の値を定義する。
【0130】
【数22】
p1は、apがβより小さければ、次のようにp′1に変わり、そうでなければ、変わらない。
【0131】
【数23】
q1は、aqがβより小さければ、次のようにq′1に変わり、そうでなければ、変わらない。
【0132】
【数24】
Bsが4であれば、まず、フィルタ係数の長さを決定するためのTp及びTqの値を次のように定義する。
【0133】
【数25】
もし、Tpが1であれば、p0、p1、p2は、次のようにフィルタ係数を長くしてp′0、p′1、p′2に変わる。
【0134】
【数26】
そうではなく、Tpが0であれば、次のようにp0だけがフィルタ係数を短くしてp′0に変わる。
【0135】
【数27】
もし、Tqが1であれば、q0、q1、q2は、次のようにフィルタ係数を長くしてq′0、q′1、q′2に変わる。
【0136】
【数28】
【0137】
そうではなく、Tqが0であれば、次のようにq0だけがフィルタ係数を短くしてp′0に変わる。
【0138】
【数29】
【0139】
Y−Cb−Cr映像のうち色成分がCbやCrであれば、短いタップフィルタ係数を利用して次のように定義できる。まず、Bsが4以下であれば、p0及びq0は、数式21のようにそれぞれp′0及びq′0となる。R−G−B映像及びY成分と違って、p1及びq1はその値が変わらない。Bsが4であれば、p0及びq0の値だけが数式27及び数式29を利用してp′0及びq′0となる。R−G−B映像及びY成分と違って、p1及びq1はその値が変わらない。
【0140】
図14は、R−G−B映像が入力映像である場合に、本発明によるインタープレーン予測による結果を示す図面である。言い換えれば、図14は、本発明でのインタープレーン予測を使用した場合とそうではない場合とに対して比較した結果である。
【0141】
使用した入力映像は、1280×720サイズのCREW映像であり、これに対する結果を4個所のビット率でPSNRと表示した。図14Aは、空間上の予測だけを使用したイントラモードだけを使用したものであって、図14Bは、時/空間上の予測を何れも使用した結果である。図示されたように、同じビット率で3〜4dB以上の利得が発生することがわかる。
【0142】
図15Aは、入力映像としてR−G−B映像を使用した時、動き補償のために6タップフィルタを使用した場合(MC_LL)とG成分の場合とは6タップフィルタ、R−B成分の場合は双一次フィルタを使用した場合(MC_LC)を640×352 Harbour映像に対して比較した結果である。
【0143】
本発明のMC_LL方式が同じビット率でPSNR利得が発生することがわかる。
【0144】
図15Bは、入力映像としてY−Cb−Cr映像を使用した時、動き補償のためにY成分の場合は6タップフィルタを使用し、Cb−Cr成分の場合は双一次を使用した場合(MC_LC)とY−Cb−Cr何れも6タップフィルタを使用した場合(MC_LL)とを640×352 Harbour映像に対して比較した結果を表す。図15Bを参照すれば、本発明により、Y−Cb−Crそれぞれの成分に対してモード同じビット率でPSNRが改善されることがわかる。
【0145】
本発明はまた、コンピュータ可読記録媒体にコンピュータ可読コードとして具現可能である。コンピュータ可読記録媒体は、コンピュータシステムによって読取られるデータが保存される全ての種類の記録装置を含む。コンピュータ可読記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがあり、また、キャリアウェーブ(例えば、インターネットを通じた伝送)状に具現されるものも含む。また、コンピュータ可読記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータ可読コードが保存されかつ実行されうる。
【0146】
以上、本発明についてその望ましい実施例を中心に説明した。当業者は、本発明の本質的な特性から外れない範囲で変形された形態に具現できることがわかる。したがって、開示された実施例を限定的な観点ではなく、説明的な観点で考慮しなければならない。本発明の範囲は、特許請求の範囲内にあらわれており、それと同等な範囲内にある全ての差異点は、本発明に含まれていると解釈されなくてはならない。
【産業上の利用可能性】
【0147】
本発明は、映像を圧縮して保存するビデオレコーダ、DVD、カムコーダ、デジタルTVなどに適用して映像を効率的に圧縮、復元できる。
【符号の説明】
【0148】
100:第1動き予測部
101:インタープレーン予測部
102:ME
103:MC
104:イントラプレーン予測部
105:SE
106:SP
107:予測誤差算出部
110:映像情報把握部
120:第2動き予測部
122:誤差予測部
124:予測誤差映像
130:符号化部
132:離散コサイン変換(又は離散整数変換)
134:量子化
136:エントロピー符号化
140:第1復元部
142:T-1
144:Q-1
150:第2復元部
152:誤差補償部
160:デブロッキングフィルタ
170:F(n)
172:Fr(n−1)
174:Fr(n)
180:ΔFn(n)
【技術分野】
【0001】
本発明は、ビデオ符号化/復号化用の動き補償装置及びその方法に関する。
【背景技術】
【0002】
従来のビデオ(ビデオ信号)圧縮方法は、圧縮率を高めるために、機器から直接取得できるR−G−Bなどの映像形式を圧縮に適したY−Cb−Crなどの映像形式に変換する。また、従来のビデオ圧縮方法は、圧縮効率を高めるためにCb成分及びCr成分を四分の一のサイズに減らして符号化する。しかし、従来のビデオ圧縮方法は、高品質の映像復元を必要とするアプリケーションに適するものとはいえない。それは、Cb成分及びCr成分のサブサンプリングによってChroma(Cb、Cr)成分にエネルギー損失が発生し、さらにR−G−B成分をY−Cb−Cr成分に変換する時に映像の品質損失が発生するためである。このような損失を減らすためには、Cb成分及びCr成分をY成分と同じ解像度で符号化する必要がある。
【0003】
もし、Y−Cb−Cr成分を符号化するとき、さらに良い品質を所望するのであれば、R−G−B成分を直接符号化することにより、Y−Cb−Cr成分に変換する時に発生する損失をなくして、映像品質の損失を低減する必要がある。しかし、従来のビデオ圧縮手法は、従来型のY−Cb−Cr符号化器を利用してR−G−B成分を符号化するものであり、R−G−Bカラー成分に存在するY−Cb−Cr成分とは異なる特性を利用することができない。このような従来の手法として代表的なものが、2つの国際標準化機構であるISO/IECのMPEG及びITU−TのVCEGによる、共同ビデオチーム(Joint Video Team)のAVC/H.264標準化技術である。
【0004】
しかし、R−G−B成分とY−Cb−Cr成分では、映像の特性が異なるため、従来のY−Cb−Cr符号化器でR−G−B成分を符号化すると、符号化効率が大きく低下する。例えば、Y−Cb−Cr映像は、空間上、同じ位置でY、Cb、Crの各成分間に相関関係がほとんどないが、一方、R−G−B映像は各成分間に相関関係が残っている。
【0005】
また、R−G−B映像では、R、G、Bの各成分間の周波数特性が類似しているが、Y−Cb−Cr映像では、R−G−B映像から変換する時に行われる処理によって、Luma成分であるY成分とChroma成分であるCb及びCr値とが相異なる周波数特性を有するものとなる。このように、従来のビデオ圧縮方法では、R−G−B映像及びY−Cb−Cr映像の特性を正確に符号化に反映できなかった。また、従来のビデオ圧縮方法は、符号化する際に、映像のサイズによる周波数特性の変化を考慮するものではなかった。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明が解決しようとする技術的課題は、インタープレーン(inter-plane)予測を利用してR−G−B映像の符号化/復号化効率を高めるビデオ符号化/復号化装置及びその方法を提供することである。
【0007】
本発明が解決しようとする他の技術的課題は、ビデオ符号化/復号化に際し、色情報及び解像度情報による効率的な動き補償を行う動き補償装置及びその方法を提供することである。
【0008】
本発明が解決しようとする他の技術的課題は、ビデオ符号化/復号化に際し、色情報及び解像度情報によって効率的にブロック効果(ノイズ/歪)を低減するデブロッキングフィルタ装置及びその方法を提供することである。
【課題を解決するための手段】
【0009】
前記課題を達成するための本発明によるビデオ符号化装置は、入力映像の第1動き予測結果に基づいて前記入力映像に対する第1予測誤差映像を算出する第1動き予測部と、R−G−B映像の色成分のうち所定の色成分を基準色成分と設定し、前記入力映像がY−Cb−Cr映像であるか前記R−G−B映像であるかを把握し、前記入力映像の色成分が前記基準色成分であるか否かを把握する映像情報把握部と、前記入力映像が前記R−G−B映像であり、前記入力映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記第1予測誤差映像に対する動き予測を行って第2予測誤差映像を算出する第2動き予測部と、を含む。
【0010】
前記課題を達成するための本発明によるビデオ符号化方法は、入力映像の第1動き予測結果に基づいて前記入力映像に対する第1予測誤差映像を算出する段階と、R−G−B映像の色成分のうち所定の色成分を基準色成分と設定し、前記入力映像がY−Cb−Cr映像であるか前記R−G−B映像であるかを把握し、前記入力映像の色成分が前記基準色成分であるか否かを把握する段階と、前記入力映像が前記R−G−B映像であり、前記入力映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記第1予測誤差映像に対する動き予測を行って第2予測誤差映像を算出する段階と、を含む。
【0011】
前記課題を達成するための本発明によるビデオ復号化装置は、符号化映像に所定の演算を行って前記符号化映像から復元された第1予測誤差映像を算出する第1復元部と、前記符号化映像がR−G−B映像であるかY−Cb−Cr映像であるかを把握し、前記符号化映像の色成分がR−G−B映像の基準色成分であるか否かを把握する映像情報把握部と、前記符号化映像が前記R−G−B映像であり、前記符号化映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記符号化映像から復元された第2予測誤差映像を算出する第2復元部と、前記第1予測誤差映像および第2予測誤差映像に基づいて復元された前記符号化映像に対する復号化映像のブロック効果を減少させるデブロッキングフィルタと、を含む。
【0012】
前記課題を達成するための本発明によるビデオ復号化方法は、符号化映像に所定の演算を行って前記符号化映像から復元された第1予測誤差映像を算出する段階と、前記符号化映像がR−G−B映像であるかY−Cb−Cr映像であるかを把握し、前記符号化映像の色成分がR−G−B映像の基準色成分であるか否かを把握する段階と、前記符号化映像が前記R−G−B映像であり、前記符号化映像の色成分が前記基準色成分以外の色成分であれば、前記基準色成分に基づいて前記符号化映像から復元された第2予測誤差映像を算出する段階と、前記第1予測誤差映像及び第2予測誤差映像に基づいて復元された前記符号化映像に対する復号化映像のブロック効果を減少させる段階と、を含む。
【0013】
前記課題を達成するための本発明によるビデオ符号化/復号化装置用の動き補償装置は、入力映像の色情報を把握する映像情報把握部と、前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、前記補間結果に対して動き補償を行う動き補償部と、を含む。
【0014】
前記課題を達成するための本発明によるビデオ符号化/復号化用の動き補償方法は、入力映像の色情報を把握する段階と、前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する段階と、前記補間結果に対して動き補償を行う段階と、を含む。
【0015】
前記課題を達成するための本発明によるビデオ符号化/復号化装置用の動き補償装置の他の実施形態は、入力映像の解像度及び色情報を把握する映像情報把握部と、前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、前記補間結果に対して動き補償を行う動き補償部と、を含む。
【0016】
前記課題を達成するための本発明によるビデオ符号化/復号化用の動き補償方法の他の実施形態は、入力映像の解像度及び色情報を把握する段階と、前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、前記補間結果に対して動き補償を行う段階と、を含む。
【0017】
前記課題を達成するための本発明によるデブロッキングフィルタ装置は、復号化対象映像の色情報を把握する映像情報把握部と、前記色情報に基づいて前記復号化対象映像のブロック効果を減少させるデブロッキングフィルタの長さを選択するデブロッキングフィルタ選択部と、前記選択された長さのデブロッキングフィルタを利用して前記復号化対象映像をフィルタリングするフィルタリング部と、を含む。
【0018】
前記課題を達成するための本発明によるデブロッキングフィルタ選択方法は、復号化対象映像の色情報を把握する段階と、前記色情報に基づいて前記復号化対象映像のブロック効果を減少させるデブロッキングフィルタの長さを選択する段階と、前記選択された長さのデブロッキングフィルタを利用して前記復号化対象映像をフィルタリングする段階と、を含む。
【0019】
本発明は、上述のような形態により、色情報及び解像度特性による最適の符号化/復号化を行う。
【発明の効果】
【0020】
本発明は、入力映像の色成分特性と解像度特性とを考慮して、ビデオデータを効率的に符号化及び復号化できる。R−G−B映像の場合は、特に、インタープレーン予測を使用して符号化効率を改善する。本発明は、R−G−B映像を直接符号化する場合、高品質の映像情報が必要なデジタル映画及びデジタルアーカイブなどの応用に適している。
【0021】
また、本発明は、符号化及び復号化のプロセスにおける動き補償とデブロッキングフィルタの方法で、色成分の特性及び映像解像度特性を利用した。フィルタリング過程を経て映像品質を改善するこれら方法を、映像の特性に適合するように構成することにより、符号化効率を改善する。したがって、Y−Cb−Cr映像だけではなく、R−G−B映像に対しても、それぞれの特性に適する符号化及び復号化が可能である。
【図面の簡単な説明】
【0022】
【図1A】本発明によるビデオ符号化装置の一実施例の構成を示すブロック図である。
【図1B】本発明によるビデオ符号化装置の一実施例の構成を示すブロック図である。
【図2】本発明によるビデオ符号化方法の一実施例を示すフローチャートである。
【図3A】本発明によるビデオ復号化装置の一実施例の構成を示すブロック図である。
【図3B】本発明によるビデオ復号化方法の一実施例を示すフローチャートである。
【図4】映像の色情報による動き補償装置の一実施例の構成を示すブロック図である。
【図5】映像の色情報による動き補償方法の一実施例を示すフローチャートである。
【図6】映像の色情報及び解像度情報による動き補償装置の一実施例の構成を示すブロック図である。
【図7】映像の色情報及び解像度情報による動き補償方法の一実施例を示すフローチャートである。
【図8】長いフィルタタップを利用した補間方法を示す図面である。
【図9】短いフィルタタップを利用した補間方法を示す図面である。
【図10】映像の色情報によるデブロッキングフィルタの構成を示すブロック図である。
【図11】映像の色情報によるデブロッキングフィルタ選択方法の一実施例を示すフローチャートである。
【図12A】デブロッキングフィルタが適用されるマクロブロックの垂直/水平境界を示す図面である。
【図12B】デブロッキングフィルタが適用されるマクロブロックの垂直/水平境界を示す図面である。
【図13A】4×4ブロックの垂直/水平境界の映像サンプルを示す図面である。
【図13B】4×4ブロックの垂直/水平境界の映像サンプルを示す図面である。
【図14A】本発明によるインタープレーン予測符号化実施例の結果を示す図面である。
【図14B】本発明によるインタープレーン予測符号化実施例の結果を示す図面である。
【図15A】本発明による動き補償装置を利用した符号化実施例の結果を示す図面である。
【図15B】本発明による動き補償装置を利用した符号化実施例の結果を示す図面である。
【発明を実施するための形態】
【0023】
以下、添付された図面を参照して本発明によるビデオ符号化/復号化装置とその方法、動き補償装置とその方法及びデブロッキングフィルタ装置とその方法について詳細に説明する。
【0024】
図1Aは、本発明によるビデオ符号化装置の一実施例の構成を示す図面である。
【0025】
図1Aに示すように、本発明によるビデオ符号化装置は、第1動き予測部100と、映像情報把握部110と、第2動き予測部120と、符号化部130とにより構成される。第1動き予測部100は、インタープレーン予測部101と、イントラプレーン予測部104と、予測誤差算出部107とにより構成される。
【0026】
第1動き予測部100のインタープレーン予測部101及びイントラプレーン予測部104は、それぞれ入力映像に対して時/空間的に隣接した映像に基づいて動き予測を行う。インタープレーン予測部101は、入力映像と時間的に隣接した先行復元映像を利用して動き予測を行い、イントラプレーン予測部104は、空間的に隣接した入力映像の符号化単位ブロックを利用して動き予測を行う。一般に、最初の入力映像に対しては先行する復元映像がないので、イントラプレーン予測部104が動き予測を行い、以後の入力映像に対してはインタープレーン予測部101が動き予測を行う。予測誤差算出部107は、インタープレーン予測部101又はイントラプレーン予測部104の動き予測結果と入力映像との差を利用して第1予測誤差映像を算出する。
【0027】
また、第1動き予測部100は、入力映像の色情報及び解像度情報によって動き補償のために使用するフィルタタップの長さを異にする。これについては、その詳細を、図4乃至図9を参照して後述する。
【0028】
映像情報把握部110は、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握する。また、映像情報把握部110は、入力映像の色成分を把握する。すなわち、映像情報把握部110は、入力映像の色成分がR−G−B映像のR成分、G成分、B成分であるか、又はY−Cb−Cr映像のY成分(Luma)、Cb成分、Cr成分(Chroma)であるかを把握する。そして、映像情報把握部110は、R−G−B映像の色成分のうち所定の色成分を本発明によるイントラプレーン予測のための基準色成分と設定する。基準色成分は、R、G、B成分のうち何れか一つの成分が任意に設定され、以下ではG成分を基準色成分に設定したものと仮定する。
【0029】
第2動き予測部120は、入力映像の色成分がR−G−B映像の基準色成分以外の色成分であれば、基準色成分に基づいて、第1動き予測部100から出力される第1予測誤差映像に対して、動き予測を行って第2予測誤差映像を算出する。第2動き予測部120で使われる基準色成分は、現在の入力映像の前に入力されて符号化された後に再び復号化された値である。具体的には、第2動き予測部120は、符号化され且つ復号化された基準色成分の予測誤差映像に基づいて動き予測を行う。
【0030】
例えば、基準色成分がG成分であり、入力映像の色成分がB成分である場合、第1動き予測部100は、入力映像の動き予測結果に基づいてB成分及びG成分に対する第1予測誤差を算出する。そして、映像情報把握部110は、入力映像がR−G−B映像であり、入力映像の色成分が基準色成分(G成分)以外の成分(B成分)であることを把握する。第2動き予測部120は、符号化された後に再び復号化された基準色成分(G成分)の第1符号化予測誤差映像に基づいて、入力映像(B成分)の第1予測誤差映像に対するインタープレーン予測を行って第2予測誤差映像を算出する。すなわち、B成分の入力映像は、第1動き予測部100及び第2動き予測部120によって二回の予測過程を経る。
【0031】
符号化部130は、第1動き予測部100による第1予測誤差映像及び第2動き予測部110による第2予測誤差映像を符号化してビットストリームを生成する。具体的には、符号化部130は、予測誤差映像を離散コサイン変換(Discrete Cosine Transform:DCT)132又は離散整数変換132して、変換された値を量子化134及びエントロピー符号化136して符号化映像(ビットストリーム)を生成する。
【0032】
Y−Cb−Cr映像は、R−G−B映像から色座標空間変換方式によって変換されるので、Y−Cb−Cr映像とR−G−B映像とは符号化側面で相異なる特性を有する。すなわち、Y−Cb−Cr映像のY、Cb、Cr成分は、空間上同じ位置の各成分間に相関関係がほとんどないが、一方で、R−G−B映像は、各成分間に相関関係が残っている。したがって、本発明によるビデオ符号化装置は、入力映像がR−G−B映像であるかY−Cb−Cr映像であるかによって、符号化する時に使用する予測方法を異にする。
【0033】
結局、本発明によるビデオ符号化装置は、R−G−B映像の色成分のうち何れか一つを基準色成分と設定し、設定された基準色成分は、従来の符号化方法で符号化する。そして、ビデオ符号化装置は、R−G−B映像の基準色成分以外の残りの2つの色成分を、空間上隣接した画素又は時間上隣接した画素を利用して予測した後、予測された結果を基準色成分に基づいて再び予測する。
【0034】
図1Bは、本発明によるビデオ符号化装置の一実施例の構成を示す図面である。
【0035】
図1Bに示すように、本発明によるビデオ符号化装置は、第1動き予測部100と、映像情報把握部110と、第2動き予測部120と、符号化部130と、第1復元部140と、第2復元部150と、デブロッキングフィルタ160とにより構成される。また、第1動き予測部100は、インタープレーン予測部101と、イントラプレーン予測部104と、予測誤差算出部107とにより構成される。
【0036】
入力映像F(n)170は、Y−Cb−Cr映像又はR−G−B映像である。本発明によるビデオ符号化装置において、入力映像170は、ブロック単位で処理される。第1動き予測部100は、インタープレーン予測部101とイントラプレーン予測部104とにより構成される。インタープレーン予測部101は、動き予測部(Motion Estimation unit:ME)102及び動き補償部(Motion Compensation unit:MC)103を含み、符号化効率を高めるために、以前の復元映像Fr(n−1)
172に基づいて動きを推定し且つ予測する。イントラプレーン予測部104は、空間推定部(Spatial Estimation unit:SE)105及び空間予測部(Spatial
Prediction unit:SP)106を含み、空間的に隣接しているブロックに基づいて動きを推定し且つ予測する。
【0037】
Y−Cb−Cr(或いはY−U−V)映像とR−G−B映像のそれぞれの色成分によって、動き補償に使用する補間方法(interpolation)は異なる。まず、予測誤差算出部107は、入力映像170と、インタープレーン予測部101又はイントラプレーン予測部104の動き予測結果と、に基づいて符号化予測誤差映像ΔF(n)を得る。もし、入力映像170がY−Cb−Cr映像であれば、予測誤差算出部107は、ΔF(n)から予測誤差ΔY(n)、ΔU(n)、ΔV(n)を得る。一方、入力映像170がR−G−B映像であれば、予測誤差算出部107は、ΔF(n)から予測誤差ΔR(n)、ΔG(n)、ΔB(n)を得る。
【0038】
符号化部130は、Y−Cb−Cr映像のΔY(n)、ΔU(n)、ΔV(n)と、R−G−B映像のΔG(n)とを、DCT(又は、離散整数変換)132、量子化134、エントロピー符号化136を経て圧縮する。
【0039】
入力映像170がR−G−B映像であれば、第2動き予測部120の誤差予測部(Residue Prediction unit:RP)122は、R成分及びB成分の予測誤差映像ΔB(n)及びΔR(n)を、復元されたG成分の予測誤差映像ΔGr(n)を利用してインタープレーン予測する。そして、符号化部130は、インタープレーン予測によって得た予測誤差映像ΔB′(n)及びΔR′(n)を、DCT(又は、離散整数変換)132、量子化134、エントロピー符号化136を経て圧縮する。DCTは、ISO/IECのMPEG−4パート2標準化技術であり、離散整数変換は、ISO/IECのMPEG及びITU−TのVCEGによる共同ビデオチームが策定したAVC/H.264標準化技術である。
【0040】
第1復元部140は、符号化部130が変換132及び量子化134した復元対象映像を、空間的に近接したブロック或いは時間的に後で入力される映像を利用した予測で使用できるように、逆量子化144し、逆DCT(IDCT:Inverse DCT)(又は、逆離散整数変換)142を行って、当該映像のそれぞれの色成分に対する予測誤差映像を生成する。
【0041】
第1復元部140は、復元対象映像がY−Cb−Cr映像であれば、復元された予測誤差映像ΔYr(n)、ΔUr(n)、ΔVr(n)を得る。また、第1復元部140は、復元対象映像がR−G−B映像であれば、復元された予測誤差映像ΔGr(n)、ΔB′r(n)、ΔR′r(n)を得る。ΔGr(n)は、第2動き予測部120によるインタープレーン予測のためにバッファ124に保存される。
【0042】
第2復元部150は、復元対象映像の色成分がR成分及びB成分であれば、G成分の復元された予測誤差映像ΔGr(n)を利用してR成分及びB成分の復元された予測誤差映像ΔBr(n)及びΔRr(n)を得る。Y−Cb−Cr映像の復元誤差映像ΔYr(n)、ΔUr(n)、ΔVr(n)或いはR−G−B映像の復元誤差映像ΔGr(n)、ΔBr(n)、ΔRr(n)は、デブロッキングフィルタ160の入力Fr(n)となる。
【0043】
デブロッキングフィルタ(ループフィルタ)160は、Fr(n)と第1動き予測部100によるインタープレーン予測又はイントラプレーン予測の結果を第2復元部150の出力値と加算して求めた復元された映像をフィルタリングすることにより、ブロック効果を低減する。本発明によるデブロッキングフィルタ160は、Y−Cb−Cr(或いは、Y−U−V)映像とR−G−B映像との各成分によってブロックの境界領域で使用するフィルタタップの長さが異なるものを用いる。これについての詳細は、図10及び図11を参照して後述する。
【0044】
図2は、本発明によるビデオ符号化方法の一実施例を示すフローチャートである。
【0045】
図1A及び図2を参照して、本発明のビデオ符号化方法を説明する。まず、第1動き予測部100は、入力映像に対して時/空間上予測(インタープレーン予測/イントラプレーン予測)を行う(S200)。映像情報把握部110は、R−G−B映像の基準色成分としてG成分を設定し、入力映像がR−G−B映像であるか否かを判断する(S210)。もし、入力映像がR−G−B映像であれば、映像情報把握部110は、入力映像の色成分が基準色成分のG成分であるか否かを判断する(S220)。もし、入力映像の色成分がR成分又はB成分であれば、第2動き予測部120は、復元されたG成分の予測誤差映像を利用して各成分のインタープレーン予測を行う(S230)。言い換えれば、本発明によるビデオ符号化方法は、R−G−B映像の基準色成分以外の成分に対して第1動き予測部100によって動き予測を行い、基準色成分に基づいて再び動き予測を行う。第1動き予測部100又は第2動き予測部120によって算出された予測誤差映像は、DCT或いは離散整数変換、量子化、エントロピー符号化を通じて圧縮される。
【0046】
R−G−B映像の基準色成分以外の色成分であるR成分及びB成分に適用されるイントラプレーン予測について、以下その原理を詳細に説明する。まず、空間的に隣接した映像或いは時間的に隣接した映像値を利用して予測した値を入力映像から減算してG成分の予測誤差映像ΔGを得る。この予測誤差映像は、次の数式1の通りである。
【0047】
【数1】
ここで、GpはG成分を空間的に隣接したG成分映像或いは時間的に隣接したG成分映像を利用して予測した値である。この予測誤差映像が実際にエントロピー符号化される。
【0048】
Y−Cr−Cb成分と違って、G成分、R成分、B成分間には依然として大きな相関度がある。G成分との類似性を利用するために、まず、R成分及びB成分を、G成分と同様に、時/空間上の予測にかける。ここで、得た予測誤差映像ΔR及びΔGは、次の通りである。
【0049】
【数2】
【0050】
【数3】
ここで、Rp及びBpは、R成分及びB成分を空間的に隣接した映像或いは時間的に隣接した映像を利用して予測したものである。ここで得た予測誤差映像を、符号化された後に再び復号化されたG成分の予測誤差映像の線形変換した値で減算してインタープレーン予測されたR成分及びB成分の予測誤差映像ΔR′及びΔG′を得る。以上の処理は、次の数式4及び数式5のように表すことができる。
【0051】
【数4】
【0052】
【数5】
これらの値は、R成分及びB成分の時/空間上の予測誤差ΔR及びΔBに比べて、符号化するデータの量が少なくなっており、符号化効率が改善されたことがわかる。これは、予測誤差映像ΔG、ΔR、ΔB間の相関度が大きいので、ΔGとΔR及びΔGとΔBの関係を線形の関数で表現することで、ΔR及びΔBをΔGの関数に近似させることができるためである。以下の数式において、a及びb(数式6、7)は、R成分の予測誤差をG成分の予測誤差を利用して予測するときに近似させた線形関数の傾き及び偏差となり、c及びd(数式8、9)は、B成分の予測誤差をG成分の予測誤差を利用して予測するときに近似させた線形関数の傾き及び偏差である。
【0053】
【数6】
【0054】
【数7】
【0055】
【数8】
【0056】
【数9】
ここで、cov(・)は共分散を表し、E(・)は値の平均、そして、σ2は分散を表す。
【0057】
図3Aは、本発明によるビデオ復号化装置の一実施例の構成を示すブロック図である。
【0058】
図3Aに示すように、本発明によるビデオ復号化装置は、第1復元部300と、映像情報把握部310と、第2復元部320と、動き推定部330と、デブロッキングフィルタ340とにより構成される。
【0059】
本発明によるビデオ復号化装置は、図1Bのビデオ符号化装置の過程と反対の過程とを経て圧縮されたビットストリーム(すなわち、符号化映像)から映像を復元する。第1復元部300は、圧縮されたデータを、エントロピー復号化302、逆量子化304、逆離散整数変換306して、Y−Cb−Cr映像の場合、各成分の復元された予測誤差映像ΔYr(n)、ΔUr(n)、ΔVr(n)を得る。一方、第1復元部300は、圧縮されたビットストリームがR−G−B映像であれば、復元された予測誤差映像ΔGr(n)、ΔB′r(n)、ΔR′r(n)を得る。
【0060】
映像情報把握部310は、圧縮されたビットストリームがY−Cb−Cr映像であるかR−G−B映像であるかを把握し、圧縮されたビットストリームの色成分がR−G−B映像の基準色成分であるか否かを把握する。以下の説明では、基準色成分をG成分と仮定する。
【0061】
圧縮されたビットストリームがY−Cb−Cr映像であるか、又はR−G−B映像の基準色成分(G成分)であれば、第1復元部300によって復元された予測誤差映像が動き推定部330の入力に使われる予測誤差映像ΔFr(n)となる。
【0062】
第2復元部320は、圧縮されたビットストリームがR−G−B映像のB成分又はR成分(すなわち、基準色成分以外の成分)であれば、G成分の予測誤差映像ΔGr(n)をR成分及びB成分の予測誤差映像復元のためのインタープレーン予測のために保存する。
【0063】
一方、第2復元部320は、R成分及びB成分の予測誤差映像ΔB′r(n)及びΔR′r(n)をG成分の復元された予測誤差映像ΔGr(n)を利用して復元した予測誤差映像ΔBr(n)及びΔRr(n)を得る。R成分及びB成分の場合、その値(ΔBr(n)及びΔRr(n))がΔFr(n)となる。
【0064】
第2復元部320は、ビットストリームがビデオ符号化装置(図1A、図1B参照)でインタープレーン予測を利用して符号化された場合には、動き推定部330のMC(Motion Comparator)332による先行映像Fr(n−1)350のインタープレーン予測値と第1復元部300による予測誤差映像とを加算してR−G−B或いはY−Cb−Cr映像の各成分の復元された値を得る。一方、第2復元部320は、ビットストリームがイントラプレーン予測を利用して符号化された場合には、動き推定部330のSP(Spatial
Predictor)334によるイントラプレーン予測値と第1復元部300による予測誤差映像とを加算してR−G−B或いはY−Cb−Cr映像の各成分の復元された値を得る。ここで、動き推定部330のMC332によるインタープレーン予測は、Y−Cb−Cr(或いは、Y−U−V)映像とR−G−B映像との各成分によって動き補償するときに使用する補間方法を異にする。これについての詳細は、図4乃至図9を参照して後述する。第2復元部320によって復元された値は、ブロック効果を低減するデブロッキングフィルタ340を経て各色成分の復元映像Fr(n)352(すなわち、前記ビットストリームとしての符号化映像に対する復号化映像)となる。
【0065】
デブロッキングフィルタ340は、Y−Cb−Cr(或いは、Y−U−V)映像とR−G−B映像との各成分によって、ブロックの境界領域で使用するフィルタタップの長さを異にする。これについての詳細は、図10及び図11を参照して後述する。
【0066】
図3Bは、本発明によるビデオ復号化方法の一実施例を示すフローチャートである。
【0067】
図3A及び図3Bを参照して、本発明によるビデオ復号化方法の一実施例を説明する。まず、第1復元部300は、ビットストリームから第1予測誤差映像を算出する(S350)。そして、映像情報把握部310は、ビットストリームがY−Cb−Cr映像であるかR−G−B映像であるかを把握し、ビットストリームの色成分がR−G−B映像の基準色成分であるか否かを把握する(S355)。
【0068】
第2復元部320は、ビットストリームがR−G−B映像であり、ビットストリームの色成分がR−G−B映像の基準色(G)成分以外の成分(R、B成分)であれば、第1復元部300によって算出された第1予測誤差映像を基準色(G)成分の第1予測誤差映像を利用して予測し、第2予測誤差映像を得る(S360)。
【0069】
第2復元部320は、第1予測誤差映像及び第2予測誤差映像を、動き推定部330の先行映像に対する動き予測結果と加算して、復元された映像(前記符号化映像に対する復号化映像)を獲得する(S365)。デブロッキングフィルタ340は、復元された映像のブロック効果を減少させ、最終復元された映像Fr(n)352を得る(S370)。
【0070】
図4は、本発明による動き補償装置の一実施例の構成を示す図面である。
【0071】
図4に示すように、本発明による動き補償装置103,332は、映像情報把握部(図示せず)と、フィルタタップ選択部400と、長いフィルタタップ補間部410と、短いフィルタタップ補間部420と、動き補償部(Motion Compensator:MC)430とにより構成される。
【0072】
R−G−B映像は、R、G、Bの各成分間の周波数特性が類似しているが、Y−Cb−Cr映像は、Luma成分であるY成分とChroma成分であるCb成分及びCr成分との周波数特性が異なる。そして、Y−Cb−Cr映像では、一般に、Chroma成分はLuma成分に比べて低周波成分が多く、相関度も大きい。図4は、このような映像の色成分によって異なる方法により先行フレームを利用した動き予測を行う、動き補償装置の構成を示すブロック図である。
【0073】
映像情報把握部(図示せず)は、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握し、入力映像の色成分がR−G−B映像の基準色成分であるか否かを把握する。一般に、R−G−B映像の基準色成分はG成分である。
【0074】
フィルタタップ選択部400は、映像情報把握部(図示せず)から受信した入力映像の色成分情報402に基づき、長いフィルタタップ補間部410又は短いフィルタタップ補間部420を選択する。すなわち、フィルタタップ選択部400は、入力映像のそれぞれの色成分に基づいて最適の動き推定のためのフィルタタップを選択する。長いフィルタタップは一般に6タップフィルタであり、短いフィルタタップは2タップフィルタである。
【0075】
例えば、フィルタタップ選択部400は、入力映像がY−Cb−Cr映像であるか、又は入力映像の色成分がR−G−B映像の基準色成分以外の成分であれば、6タップフィルタ補間部を選択し、入力映像の色成分がR−G−B映像の基準色成分であれば、2タップフィルタ補間部を選択する。
【0076】
補間部410,420は、フィルタタップ選択部400によって選択されると、動き補償のために入力映像を補間する。このとき、それぞれの補間部410,420は、先行フレームの動きベクトル412に基づいて入力映像を補間する。
【0077】
例えば、補間部410,420は、それぞれ、6タップフィルタの補間部410と双一次補間する補間部420とにより構成することができる。この場合、フィルタタップ選択部400によって6タップフィルタの補間部410が選択されれば、6タップフィルタの補間部410は入力映像を補間する。
【0078】
補間部410,420によって補間された入力映像は、MC430によって動き補償される。
【0079】
図5は、本発明による動き補償方法の一実施例を示すフローチャートである。以下、図4の装置構成ブロック図と図5のフローチャートを参照しつつ、入力映像の色成分による動き補償方法について説明する。
【0080】
図4及び図5に示すように、フィルタタップ選択部400は、映像情報把握部(図示せず)から受信した色情報に基づいてフィルタタップを選択する(S500)。もし、入力映像の色成分がR−G−B成分であれば(S510)、フィルタタップ選択部400はR−G−B映像の各成分に対して同じ補間方法を選択する(S520)。例えば、フィルタタップ選択部400は、R−G−B各成分のすべてに対して同じように、すなわち、すべてに長いフィルタタップ補間部410を選択して適用するか、すべてに短いフィルタタップ補間部420を選択して適用する。
【0081】
入力映像の色成分がR−G−B成分ではなく、Y−Cb−Cr成分であれば、映像情報把握部(図示せず)は、入力映像の色成分がY成分(Luma)であるか否かを判断する(S530)。もし、入力映像の色成分がLuma成分であれば、フィルタタップ選択部400は、入力映像が長いタップのフィルタを通じて補間されるように長いフィルタタップを有する補間部410を選択する(S540)。もし、入力映像の色成分がChroma成分(Cb,Cr)であれば、フィルタタップ選択部400は短いフィルタタップ補間部420を選択する(S550)。
【0082】
このようにフィルタタップの長さを入力映像の色成分ごとに異ならしめる理由は、入力映像の色成分に高周波成分が多ければ、周囲に多くの画素を使用する長いフィルタタップ補間方法が高周波成分をよく復元する可能性が大きいためである。一方、低周波成分が多ければ、周囲に少ない画素を使用する短いフィルタタップが、長いフィルタタップと性能において差がなく、複雑度の面ではかえって有利である。
【0083】
図6は、本発明による動き補償装置の他の実施例の構成を示すブロック図である。
【0084】
図6に示すように、本発明による動き補償装置103,332は、映像情報把握部(図示せず)と、フィルタタップ選択部600と、長いフィルタタップ補間部610と、短いフィルタタップ補間部620と、動き補償部(Motion Compensator:MC)630とにより構成される。
【0085】
映像の色成分602だけでなく、映像のサイズ或いは解像度情報604も周波数特性に影響を及ぼす。図6を参照して、色情報以外に映像の解像度情報に基づき異なる動き補償方法を採用する動き補償装置について説明する。
【0086】
映像情報把握部(図示せず)は、入力映像の色成分及び解像度情報を把握する。具体的に、映像情報把握部(図示せず)は、入力映像が高解像度であるか低解像度であるかを把握し、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握し、入力映像の色成分がR−G−B映像の基準色成分であるか否かを把握する。
【0087】
フィルタタップ選択部600は、映像情報把握部(図示せず)によって把握された入力映像の色情報及び解像度情報によってフィルタタップの長さを選択する。具体的に、フィルタタップ選択部600は、入力映像が高解像度映像であるか、又は入力映像の色成分がY−Cb−Cr映像のLuma(Y)成分以外の成分であれば、短いタップのフィルタを選択する。そして、フィルタタップ選択部600は、入力映像が低解像度映像であるか、入力映像がR−G−B映像であるか、入力映像の色成分がY−Cb−Cr映像のLuma(Y)成分であれば、長いタップのフィルタを選択する。一般に、長いフィルタタップは6タップフィルタであり、短いフィルタタップは2タップフィルタである。
【0088】
補間部610,620は、長いフィルタタップを使用する補間部610及び短いフィルタタップを使用する補間部620により構成され、先行フレームの動き情報(Motion Vector:MV)に相当する映像情報を補間する。
【0089】
MC 630は、補間部によって補間された入力映像を動き補償する。
【0090】
図7は、本発明による動き補償方法の他の実施例を示すフローチャートであって、色成分及び解像度情報を利用して動き補償を行う方法を表す。
【0091】
図6及び図7を参照して色成分及び解像度情報を利用した動き補償方法について説明する。まず、映像情報把握部(図示せず)は、入力映像の映像サイズ情報を入力されて(S700)、入力映像が高解像度映像であるか否かを判断する(S710)。本発明で、高解像度はHD(High Definition)解像度である1280×720映像サイズを基準として、これより大きい映像を意味する。この基準となる値は、適用される環境と応用とによって変わる。
【0092】
もし、入力映像が高解像度映像であれば、フィルタタップ選択部600は、短いフィルタタップを使用する補間部を選択する(S750)。これは、高解像度映像の場合、低周波成分が多く含まれていて、敢えて長いフィルタタップを使用しなくてもよいためである。高解像度映像の場合、実際映像の小さな領域を多数の画素で表示するため、画素間の変化程度が小さい。この場合、長いフィルタタップと短いフィルタタップ間にビデオ品質の差が小さいので、複雑度を考慮して、フィルタタップ選択部600は短いフィルタタップ補間部620を選択する。
【0093】
もし、入力映像が低解像度映像であれば、映像情報把握部(図示せず)は、色情報を入力されて(S700)、入力映像がR−G−B成分であるか否かを判断する(S720)。もし、入力映像の色成分がR−G−B成分であれば(S730)、フィルタタップ選択部600は、各成分すべてに対して長いタップのフィルタを使用して補間するように長いフィルタタップ補間部610を選択する(S740)。もし、入力映像の色成分がR−G−B成分ではなく、Y−Cb−Cr成分であれば、映像情報把握部(図示せず)は、Y(Luma)成分であるか否かを判断する(S730)。もし、入力映像の色成分がLuma成分であれば、フィルタタップ選択部600は長いタップのフィルタを選択する(S740)。もし、入力映像の色成分がChroma成分であれば、フィルタタップ選択部600は短いタップのフィルタを選択する(S750)。
【0094】
図8は、動き補償のために先行フレームの映像を垂直/水平方向にそれぞれ4倍ずつ補間する場合に、6タップフィルタを使用した例を示す図面である。
【0095】
6タップフィルタは、MPEG−4のAVC/H.264で使用する方式である。図8で、先行フレームの画素AからUまで与えられた時、1/4或いは1/2解像度の画素aからsを、次のような方式で求める。
【0096】
まず、垂直或いは水平方向に1/2解像度の位置にあるb及びhは、周囲の6つの画素を利用して、次のように補間する(数式10、数式11のb1及びh1は、それぞれb及びhを求めるための中間結果である)。
【0097】
【数10】
【0098】
【数11】
【0099】
【数12】
【0100】
【数13】
ここで、Clip1(x)は、xを映像画素のビット範囲内へ切断(クリップ)することを意味する。もし、8ビット映像であれば、Clip1(x)は、xが0より小さければ0とし、255より大きければ255とし、その他の値であればその値をそのまま維持させる。補間に使用したフィルタタップは、比較的周囲の画素を多く利用した6タップフィルタ(1,−5,20,20,−5,1)である。
【0101】
垂直及び水平方向に1/2解像度の位置にあるj画素は、以前に復元された垂直或いは水平方向の1/2解像度にある周囲の画素を利用して、次の数式14及び数式15のように補間する。
【0102】
【数14】
【0103】
【数15】
ここで、周囲画素cc、dd、h1、m1、ee、ff或いはaa、bb、b、s1、gg、hhは、前記数式10及び数式11と同様に、6タップフィルタを使用して補間した中間結果である。
【0104】
1/2解像度の最後の値であるs及びmは、前記数式12及び数式13によってs1及びm1から復元される。
【0105】
1/4解像度の位置にあるa、c、d、n、f、i、k、qは、二つの垂直或いは水平方向に隣接した画素の平均によって、次のように求める。
【0106】
【数16】
1/4解像度の位置にあるe、g、p、rは、二つの対角線方向に隣接した画素の平均によって、次のように求める。
【0107】
【数17】
図9は、動き補償するために先行フレームの映像を垂直/水平方向にそれぞれ4倍ずつ補間する時、短いフィルタタップの一例として双一次補間方法を使用した例である。この双一次補間方法は、MPEG−4
AVC/H.264で使用する方式である。
【0108】
先行フレームの画素A、B、C、Dで1/4或いは1/2の解像度の画素aを次のように求める。
【0109】
【数18】
ここで、dxはaがA或いはCから水平方向に離れた距離を1/4解像度で表示した値である。そして、dyはaがA或いはBから垂直方向に離れた距離を1/4解像度で表示した値である。
【0110】
図9を参照すれば、双一次補間方法は、図7に示す方法と異なり、使用する周囲の画素が比較的少なく、補間する値と近接した距離の周囲値を用いるものであることがわかる。
【0111】
図10は、本発明による色成分特性を利用したデブロッキングフィルタの一実施例の構成を示すブロック図である。動き補償だけでなく、映像復元後に発生するブロック効果を低減するためのデブロッキングフィルタにも映像の色成分特性を利用する。図10を参照して、このような映像の色成分によって異なるデブロッキングフィルタ適用方法を採用するデブロッキングフィルタの一実施例について説明する。
【0112】
図10に示すように、デブロッキングフィルタ160,340は、映像情報把握部(図示せず)と、デブロッキングフィルタ選択部1000と、フィルタリング部(長いタップのデブロッキングフィルタ1010,短いタップのデブロッキングフィルタ1020)とにより構成される。
【0113】
映像情報把握部(図示せず)は、入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを把握し、入力映像の色成分がY−Cb−Cr映像のLuma(Y)成分であるか否かを把握する。
【0114】
デブロッキングフィルタ選択部1000は、入力映像の色成分に基づいて相異なる長さのフィルタタップより構成されたデブロッキングフィルタ1010,1020のうち何れか一つのデブロッキングフィルタを選択する。例えば、デブロッキングフィルタ選択部1000は、入力映像がR−G−B映像であるか、又は入力映像の色成分がY−Gb−Gr映像のLuma(Y)成分であれば、長いタップのデブロッキングフィルタ1010を選択する。そして、デブロッキングフィルタ選択部1000は、入力映像がY−Cb−Cr映像のChroma(Cb,Cr)成分であれば、短いタップのデブロッキングフィルタ1020を選択する。
【0115】
フィルタリング部1010,1020はそれぞれ異なる長さのタップのデブロッキングフィルタより構成され、デブロッキングフィルタ選択部1000によって選択されたデブロッキングフィルタ1010,1020を利用して入力映像をフィルタリングする。
【0116】
フィルタリング部1010,1020は、ブロック単位の符号化モードと、CBP(Coded Block Pattern)と、先行フレームの動き情報(MV,MC)のための参照映像番号と、インターレース映像である場合のフィールド情報とによってフィルタリング適用の有無を決定して最終的に映像のブロック効果を取り除く。
【0117】
図11は、入力映像の色成分によってデブロッキングフィルタタップを選択する方法を示すフローチャートである。
【0118】
図10及び図11を参照して説明すれば、デブロッキングフィルタ選択部1000は、映像情報把握部(図示せず)から色情報を入力されて(S1100)、入力映像の色成分がR−G−B成分であるか否かを判断する(S1110)。もし、入力映像がR−G−B成分であれば、デブロッキングフィルタ選択部1000は、各成分に対して同じ方式のフィルタタップ係数を選択する(S1130)。一般に、長いタップのフィルタを選択する。もし、R−G−B成分ではなく、Y−Cb−Cr(Y−U−V)成分であれば、映像情報把握部(図示せず)は、入力映像の色成分がY成分(Luma)であるか否かを判断する(S1120)。もし、入力映像の色成分がLuma(Y)成分であれば、デブロッキングフィルタ選択部1000は長いフィルタタップ1010を選択する(S1140)。もし、Chroma成分であれば、フィルタタップ選択部1000は短いフィルタタップ1020を選択する(S1150)。
【0119】
図12は、16×16マクロブロック内でブロック効果を減らすためにデブロッキングフィルタが適用される垂直/水平方向の境界を示す図面である。
【0120】
マクロブロック内で16個の4×4ブロックに分けられ、それぞれ符号化されるので、ブロック効果は、この4×4ブロック境界から発生する。図12Aに示すように、まず、垂直境界1201,1202,1203,1204に対してデブロッキングフィルタが適用される。次いで、図12Bに示すように、水平境界1205,1206,1207,1208に対してデブロッキングフィルタが適用される。
【0121】
図13は、4×4ブロックの垂直/水平境界でデブロッキングフィルタに適用する時に利用される係数を表す図面である。
【0122】
垂直境界の場合、図13Aのように、p0、p1、p2、p3、q0、q1、q2、q3画素値及びフィルタタップを使用してブロック効果を減らすようにp0、p1、p2、q0、q1、q2の画素値を変える。図13Bは、水平境界でデブロッキングフィルタに適用される画素を表す。
【0123】
4×4ブロックごとに損失の程度が異なるので、フィルタ係数が変わり、フィルタ適用如何も決定しなければならない。このために、図10のようにブロック単位の符号化モードと、CBPと、先行フレームの動き情報MV、MCのための参照映像番号と、インターレース映像である場合のフィールド情報とを利用して既定の臨界値を利用してデブロッキングフィルタ適用如何、フィルタ係数の長さなどを決定する。基本的なフィルタリング方法は、MPEG−4
AVC/H.264で使用する方式を使用した。4×4ブロックにフィルタ適用如何を決定するための値filterFlagは、次のように決定される。
【0124】
【数19】
ここで、filterFlagが1である場合にだけデブロッキングフィルタを適用する。αとβとは量子化値が大きくなれば、値が大きくなり、周囲画素の変化量によってデブロッキングフィルタの適用を決定する臨界値である。Bs(フィルタ強度)は、デブロッキングフィルタを適用する場合、フィルタを通じて何れの画素情報まで値を変化させるかを表す値である。0から4の値を有し、0である場合、フィルタを適用せずに1から4へ行くほどフィルタの係数を長くし、p0、p1、p2、p3、q0、q1、q2、q3のうち多数の画素がブロック効果を減らすようにその値が変わる。また、1から4へ行くほど、大きい値が変わりうる。
【0125】
まず、色成分がR−G−B成分であるか、又はY−Cb−Cr映像のY成分である場合、適用される長いタップ係数フィルタは、次のように数式20乃至数式29を使用して定義できる。
【0126】
Bsが4以下であれば、境界に最も近接したp0及びq0は、その値が次のようにp′0及びq′0に変わる。
【0127】
【数20】
【0128】
【数21】
ここで、Clip3(min,max,x)は、xを最小値minと最大値max間に位置させる。Clip1(x)は、数式12でのClip1(x)と意味が同じである。tcは、画素が所定値以上か以下には値を有しないようにする臨界値である。ここで、Bsが大きければ、tcも大きい値を有するようになって画素の変化程度が大きくなる。
【0129】
p1及びq1の場合に、フィルタリング如何を決定するために、次の値を定義する。
【0130】
【数22】
p1は、apがβより小さければ、次のようにp′1に変わり、そうでなければ、変わらない。
【0131】
【数23】
q1は、aqがβより小さければ、次のようにq′1に変わり、そうでなければ、変わらない。
【0132】
【数24】
Bsが4であれば、まず、フィルタ係数の長さを決定するためのTp及びTqの値を次のように定義する。
【0133】
【数25】
もし、Tpが1であれば、p0、p1、p2は、次のようにフィルタ係数を長くしてp′0、p′1、p′2に変わる。
【0134】
【数26】
そうではなく、Tpが0であれば、次のようにp0だけがフィルタ係数を短くしてp′0に変わる。
【0135】
【数27】
もし、Tqが1であれば、q0、q1、q2は、次のようにフィルタ係数を長くしてq′0、q′1、q′2に変わる。
【0136】
【数28】
【0137】
そうではなく、Tqが0であれば、次のようにq0だけがフィルタ係数を短くしてp′0に変わる。
【0138】
【数29】
【0139】
Y−Cb−Cr映像のうち色成分がCbやCrであれば、短いタップフィルタ係数を利用して次のように定義できる。まず、Bsが4以下であれば、p0及びq0は、数式21のようにそれぞれp′0及びq′0となる。R−G−B映像及びY成分と違って、p1及びq1はその値が変わらない。Bsが4であれば、p0及びq0の値だけが数式27及び数式29を利用してp′0及びq′0となる。R−G−B映像及びY成分と違って、p1及びq1はその値が変わらない。
【0140】
図14は、R−G−B映像が入力映像である場合に、本発明によるインタープレーン予測による結果を示す図面である。言い換えれば、図14は、本発明でのインタープレーン予測を使用した場合とそうではない場合とに対して比較した結果である。
【0141】
使用した入力映像は、1280×720サイズのCREW映像であり、これに対する結果を4個所のビット率でPSNRと表示した。図14Aは、空間上の予測だけを使用したイントラモードだけを使用したものであって、図14Bは、時/空間上の予測を何れも使用した結果である。図示されたように、同じビット率で3〜4dB以上の利得が発生することがわかる。
【0142】
図15Aは、入力映像としてR−G−B映像を使用した時、動き補償のために6タップフィルタを使用した場合(MC_LL)とG成分の場合とは6タップフィルタ、R−B成分の場合は双一次フィルタを使用した場合(MC_LC)を640×352 Harbour映像に対して比較した結果である。
【0143】
本発明のMC_LL方式が同じビット率でPSNR利得が発生することがわかる。
【0144】
図15Bは、入力映像としてY−Cb−Cr映像を使用した時、動き補償のためにY成分の場合は6タップフィルタを使用し、Cb−Cr成分の場合は双一次を使用した場合(MC_LC)とY−Cb−Cr何れも6タップフィルタを使用した場合(MC_LL)とを640×352 Harbour映像に対して比較した結果を表す。図15Bを参照すれば、本発明により、Y−Cb−Crそれぞれの成分に対してモード同じビット率でPSNRが改善されることがわかる。
【0145】
本発明はまた、コンピュータ可読記録媒体にコンピュータ可読コードとして具現可能である。コンピュータ可読記録媒体は、コンピュータシステムによって読取られるデータが保存される全ての種類の記録装置を含む。コンピュータ可読記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがあり、また、キャリアウェーブ(例えば、インターネットを通じた伝送)状に具現されるものも含む。また、コンピュータ可読記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータ可読コードが保存されかつ実行されうる。
【0146】
以上、本発明についてその望ましい実施例を中心に説明した。当業者は、本発明の本質的な特性から外れない範囲で変形された形態に具現できることがわかる。したがって、開示された実施例を限定的な観点ではなく、説明的な観点で考慮しなければならない。本発明の範囲は、特許請求の範囲内にあらわれており、それと同等な範囲内にある全ての差異点は、本発明に含まれていると解釈されなくてはならない。
【産業上の利用可能性】
【0147】
本発明は、映像を圧縮して保存するビデオレコーダ、DVD、カムコーダ、デジタルTVなどに適用して映像を効率的に圧縮、復元できる。
【符号の説明】
【0148】
100:第1動き予測部
101:インタープレーン予測部
102:ME
103:MC
104:イントラプレーン予測部
105:SE
106:SP
107:予測誤差算出部
110:映像情報把握部
120:第2動き予測部
122:誤差予測部
124:予測誤差映像
130:符号化部
132:離散コサイン変換(又は離散整数変換)
134:量子化
136:エントロピー符号化
140:第1復元部
142:T-1
144:Q-1
150:第2復元部
152:誤差補償部
160:デブロッキングフィルタ
170:F(n)
172:Fr(n−1)
174:Fr(n)
180:ΔFn(n)
【特許請求の範囲】
【請求項1】
入力映像の色情報を判定する映像情報判定部と、
前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間部と、
前記補間結果に対して動き補償を行う動き補償部と、
を含むことを特徴とするビデオ符号化/復号化装置用の動き補償装置。
【請求項2】
前記映像情報判定部は、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する、
請求項1記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項3】
前記フィルタタップ選択部は、前記入力映像がR−G−B映像であるか、又は前記入力映像の色成分がY成分であれば、6タップフィルタを選択し、前記入力映像の色成分がY−Cb−Cr映像のCb成分又はCr成分であれば、2タップフィルタを選択する、
請求項1記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項4】
入力映像の色情報を判定する段階と、
前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する段階と、
前記補間結果に対して動き補償を行う段階と、
を含むことを特徴とするビデオ符号化/復号化用の動き補償方法。
【請求項5】
前記映像情報判定段階は、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する段階を含む、
請求項4記載のビデオ符号化/復号化用の動き補償方法。
【請求項6】
前記フィルタタップ選択段階は、前記入力映像がR−G−B映像であるか、又は前記入力映像の色成分がY成分であれば、6タップフィルタを選択し、前記入力映像の色成分がY−Cb−Cr映像のCb成分又はCr成分であれば、2タップフィルタを選択する段階を含む、
請求項4記載のビデオ符号化/復号化用の動き補償方法。
【請求項7】
入力映像の解像度及び色情報を判定する映像情報判定部と、
前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間部と、
前記補間結果に対して動き補償を行う動き補償部と、
を含むことを特徴とするビデオ符号化/復号化装置用の動き補償装置。
【請求項8】
前記映像情報判定部は、前記入力映像が高解像度映像であるか否かを判定し、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する、
請求項7記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項9】
前記フィルタタップ選択部は、前記入力映像が高解像度であるか、又は前記入力映像の色成分がY成分であれば、2タップフィルタを選択し、前記入力映像が低解像度であるか、前記入力映像がR−G−B映像であるか、前記入力映像の色成分がCb成分又はCr成分であれば、6タップフィルタを選択する、
請求項7記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項10】
入力映像の解像度及び色情報を判定する段階と、
前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、
前記補間結果に対して動き補償を行う段階と、
を含むことを特徴とするビデオ符号化/復号化装置用の動き補償方法。
【請求項11】
前記映像情報判定段階は、前記入力映像が高解像度映像であるか否かを判定し、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する段階を含む、
請求項10記載のビデオ符号化/復号化用の動き補償方法。
【請求項12】
前記フィルタタップ選択段階は、前記入力映像が高解像度であるか、又は前記入力映像の色成分がY成分であれば、2タップフィルタを選択し、前記入力映像が低解像度であるか、前記入力映像がR−G−B映像であるか、前記入力映像の色成分がCb成分又はCr成分であれば、6タップフィルタを選択する段階を含む、
請求項10記載のビデオ符号化/復号化用の動き補償方法。
【請求項13】
請求項4記載の方法をコンピュータで実行可能なプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項1】
入力映像の色情報を判定する映像情報判定部と、
前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間部と、
前記補間結果に対して動き補償を行う動き補償部と、
を含むことを特徴とするビデオ符号化/復号化装置用の動き補償装置。
【請求項2】
前記映像情報判定部は、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する、
請求項1記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項3】
前記フィルタタップ選択部は、前記入力映像がR−G−B映像であるか、又は前記入力映像の色成分がY成分であれば、6タップフィルタを選択し、前記入力映像の色成分がY−Cb−Cr映像のCb成分又はCr成分であれば、2タップフィルタを選択する、
請求項1記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項4】
入力映像の色情報を判定する段階と、
前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する段階と、
前記補間結果に対して動き補償を行う段階と、
を含むことを特徴とするビデオ符号化/復号化用の動き補償方法。
【請求項5】
前記映像情報判定段階は、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する段階を含む、
請求項4記載のビデオ符号化/復号化用の動き補償方法。
【請求項6】
前記フィルタタップ選択段階は、前記入力映像がR−G−B映像であるか、又は前記入力映像の色成分がY成分であれば、6タップフィルタを選択し、前記入力映像の色成分がY−Cb−Cr映像のCb成分又はCr成分であれば、2タップフィルタを選択する段階を含む、
請求項4記載のビデオ符号化/復号化用の動き補償方法。
【請求項7】
入力映像の解像度及び色情報を判定する映像情報判定部と、
前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択するフィルタタップ選択部と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間部と、
前記補間結果に対して動き補償を行う動き補償部と、
を含むことを特徴とするビデオ符号化/復号化装置用の動き補償装置。
【請求項8】
前記映像情報判定部は、前記入力映像が高解像度映像であるか否かを判定し、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する、
請求項7記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項9】
前記フィルタタップ選択部は、前記入力映像が高解像度であるか、又は前記入力映像の色成分がY成分であれば、2タップフィルタを選択し、前記入力映像が低解像度であるか、前記入力映像がR−G−B映像であるか、前記入力映像の色成分がCb成分又はCr成分であれば、6タップフィルタを選択する、
請求項7記載のビデオ符号化/復号化装置用の動き補償装置。
【請求項10】
入力映像の解像度及び色情報を判定する段階と、
前記入力映像の解像度及び前記入力映像の色情報に基づいて補間のためのフィルタタップの長さを選択する段階と、
前記選択された長さのフィルタタップを利用して前記入力映像を補間する補間器と、
前記補間結果に対して動き補償を行う段階と、
を含むことを特徴とするビデオ符号化/復号化装置用の動き補償方法。
【請求項11】
前記映像情報判定段階は、前記入力映像が高解像度映像であるか否かを判定し、前記入力映像がY−Cb−Cr映像であるかR−G−B映像であるかを判定し、前記入力映像の色成分がY成分であるか否かを判定する段階を含む、
請求項10記載のビデオ符号化/復号化用の動き補償方法。
【請求項12】
前記フィルタタップ選択段階は、前記入力映像が高解像度であるか、又は前記入力映像の色成分がY成分であれば、2タップフィルタを選択し、前記入力映像が低解像度であるか、前記入力映像がR−G−B映像であるか、前記入力映像の色成分がCb成分又はCr成分であれば、6タップフィルタを選択する段階を含む、
請求項10記載のビデオ符号化/復号化用の動き補償方法。
【請求項13】
請求項4記載の方法をコンピュータで実行可能なプログラムを記録したコンピュータ読み取り可能な記録媒体。
【図1A】
【図1B】
【図2】
【図3A】
【図3B】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13A】
【図13B】
【図14A】
【図14B】
【図15A】
【図15B】
【図1B】
【図2】
【図3A】
【図3B】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図13A】
【図13B】
【図14A】
【図14B】
【図15A】
【図15B】
【公開番号】特開2011−45128(P2011−45128A)
【公開日】平成23年3月3日(2011.3.3)
【国際特許分類】
【出願番号】特願2010−239749(P2010−239749)
【出願日】平成22年10月26日(2010.10.26)
【分割の表示】特願2004−210266(P2004−210266)の分割
【原出願日】平成16年7月16日(2004.7.16)
【出願人】(390019839)三星電子株式会社 (8,520)
【氏名又は名称原語表記】SAMSUNG ELECTRONICS CO.,LTD.
【住所又は居所原語表記】416,Maetan−dong,Yeongtong−gu,Suwon−si,Gyeonggi−do 442−742(KR)
【Fターム(参考)】
【公開日】平成23年3月3日(2011.3.3)
【国際特許分類】
【出願日】平成22年10月26日(2010.10.26)
【分割の表示】特願2004−210266(P2004−210266)の分割
【原出願日】平成16年7月16日(2004.7.16)
【出願人】(390019839)三星電子株式会社 (8,520)
【氏名又は名称原語表記】SAMSUNG ELECTRONICS CO.,LTD.
【住所又は居所原語表記】416,Maetan−dong,Yeongtong−gu,Suwon−si,Gyeonggi−do 442−742(KR)
【Fターム(参考)】
[ Back to top ]