説明

画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム

【課題】視点画像を符号化した際に発生するブロックノイズを目立たなくする画像符号化装置を提供すること。
【解決手段】少なくとも一つの観察視点に対応する視点画像を符号化する視点画像符号化部と、観察視点からの各被写体までの距離を示す奥行き画像を符号化する奥行き画像符号化部とを備える画像符号化装置であって、奥行き画像符号化部は、奥行き画像について、視点画像を符号化する際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、視点画像符号化部は、画素値分布分析部の分析結果に基づき、視点画像の符号化時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えることを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラムに関する。
【背景技術】
【0002】
複数視点の画像を記録または伝送することによって、視聴者の好みの観察角度からの画像を観賞することができる。DVD(Digital Versatile Disc)−Videoで利用されるマルチアングル映像は、あらかじめ視聴者が興味を持ちそうな、あるいは制作者側が見せたい観察視点または観察対象の映像を、同時刻で並行して複数用意しておき、視聴者の操作によって表示する映像を切り替える機能である。
このようなマルチアングル映像の機能を実現するためには、対応する複数の映像を全て記録しておく必要があるが、制作者側で特に見せたい、あるいは視聴者からの要望が高そうなシーンや視点数に限定することによって、記録メディアの容量を超えない範囲で映像を制作している。
【0003】
しかし、たとえばスポーツやコンサートあるいは舞台演劇などの映像に対して、視聴者が興味を持つ視点は様々であり、上記のような手段では、視聴者の多様な要望に応える映像を提供することは困難である。
このような問題に対して、特許文献1では、複数の視点画像を符号化すると共に、複数の視点画像から生成した奥行き画像も符号化し、両者を含む符号化ストリームを生成する画像符号化装置を開示している。奥行き画像は、視点画像内の各被写体が、それぞれ観察位置からどれだけ離れているかを示す情報であり、奥行き画像を利用することによって、限られた入力視点画像から、任意の視点位置に対応する映像を生成することができる。
【0004】
図8は、一つの視点画像とそれに対応する奥行き画像をもとにして、任意の視点位置からの映像を生成する様子を示したものである。図のように、視点画像41と奥行き画像42が入力として与えられている場合を想定する。視点画像41は、視点43からあるシーンを撮影したものであり、撮影した際のカメラの位置や撮影方向に関する情報や、撮影したシーンに関するカメラからの距離の情報も併せて得られている。奥行き画像42は、視点画像41に含まれる被写体や背景までの視点43からの距離(奥行き)の値を所定範囲で数値化し、輝度値として画像化したものである。
【0005】
この奥行き画像42と、撮影時のカメラやシーンに関する情報(以後、撮影条件情報と記す)を用いると、視点画像41内の各被写体の3次元空間上の位置を計算することができ、撮影した3Dシーン40を仮想的に再現することができる。そして、所望の仮想視点位置44に関するカメラの位置や撮影方向などの情報を与えてやることにより、視点位置44に対応する視点画像45を生成することができる。このとき、視点43から見えない領域すなわち視点画像41に映っていない領域の画像は計算できないが、周囲の情報から補間もしくは推定することで、視点画像41には映っていないが仮想視点画像45に映っているべき領域を生成する。
【0006】
以上のように、限られた数の視点画像と奥行き画像を符号化し、記録または伝送することによって、比較的少ないデータ量で、多くの視点に対応する映像を生成し、視聴者の多様な要望を満たすことが可能になる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2010−157823号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1などのような視点画像の符号化においては、ブロックノイズが発生するという問題がある。
【0009】
本発明は、このような事情に鑑みてなされたもので、その目的は、視点画像を符号化した際に発生するブロックノイズを目立たなくする画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0010】
(1)この発明は上述した課題を解決するためになされたもので、本発明の一態様は、少なくとも一つの観察視点に対応する視点画像を符号化する視点画像符号化部と、前記観察視点からの各被写体までの距離を示す奥行き画像を符号化する奥行き画像符号化部とを備える画像符号化装置であって、前記奥行き画像符号化部は、前記奥行き画像について、前記視点画像を符号化する際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、前記視点画像符号化部は、前記画素値分布分析部の分析結果に基づき、前記視点画像の符号化時に適用するデブロッキングフィルタのフィルタの強度を決定するフィルタ制御部を備えることを特徴とする。
【0011】
(2)また、本発明の他の態様は、上述の画像符号化装置であって、前記画素値分布分析部は、前記分析の際に、前記符号化単位の境界で接する2つの領域各々を代表する距離値の差分を算出し、前記フィルタ制御部は、前記差分に応じて、前記差分に対応する前記境界における前記フィルタ強度を決定することを特徴とする。
【0012】
(3)また、本発明の他の態様は、上述の画像符号化装置であって、前記フィルタ制御部は、前記差分の絶対値が小さいほど、前記フィルタ強度を強くすることを特徴とする。
【0013】
(4)また、本発明の他の態様は、上述の画像符号化装置であって、前記2つの領域各々を代表する距離値は、前記境界に接する2つの画素各々の画素値であることを特徴とする。
【0014】
(5)また、本発明の他の態様は、上述の画像符号化装置であって、前記2つの領域各々を代表する距離値は、前記境界に接する第1の画素と、該第1の画素の前記境界の反対側に位置する1つまたは複数の第2の画素とからなる画素群の画素値の平均であることを特徴とする。
【0015】
(6)また、本発明の他の態様は、上述の画像符号化装置であって、前記画素値分布分析部が分析する奥行き画像は、前記奥行き画像符号化部が符号化したものを復号したものであることを特徴とする。
【0016】
(7)また、本発明の他の態様は、少なくとも一つの観察視点に対応する視点画像が符号化された符号化視点画像を復号する視点画像復号部と、前記観察視点からの各被写体までの距離を示す奥行き画像符号化された符号化奥行き画像を復号する奥行き画像復号部とを備える画像復号装置であって、前記奥行き画像復号部は、前記符号化奥行き画像を復号した画像について、前記符号化視点画像が符号化された際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、前記視点画像復号部は、前記画素値分布分析部の分析結果に基づき、前記符号化視点画の復号時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えることを特徴とする。
【0017】
(8)また、本発明の他の態様は、上述の画像復号装置であって、前記画素値分布分析部は、前記分析の際に、前記符号化単位の境界で接する2つの領域各々を代表する距離値の差分を算出し、前記フィルタ制御部は、前記差分に応じて、前記差分に対応する前記境界における前記フィルタ強度を決定することを特徴とする。
【0018】
(9)また、本発明の他の態様は、上述の画像復号装置であって、前記フィルタ制御部は、前記差分の絶対値が小さいほど、前記フィルタ強度を強くすることを特徴とする。
【0019】
(10)また、本発明の他の態様は、上述の画像復号装置であって、前記2つの領域各々を代表する距離値は、前記境界に接する2つの画素各々の画素値であることを特徴とする。
【0020】
(11)また、本発明の他の態様は、上述の画像復号装置であって、領域を代表する距離値は、前記境界に接する第1の画素と、該第1の画素の前記境界の反対側に位置する1つまたは複数の第2の画素とからなる画素群の画素値の平均であることを特徴とする。
【0021】
(12)また、本発明の他の態様は、少なくとも一つの観察視点に対応する視点画像を符号化する視点画像符号化ステップと、前記観察視点からの各被写体までの距離を示す奥行き画像を符号化する奥行き画像符号化ステップとを有する画像符号化方法であって、前記視点画像符号化ステップは、前記奥行き画像について、前記視点画像を符号化する際の符号化単位に応じた画素値の分布を分析する画素値分布分析ステップを有し、前記視点画像符号化ステップは、前記画素値分布分析ステップの分析結果に基づき、前記視点画像の符号化時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御ステップを有することを特徴とする。
【0022】
(13)また、本発明の他の態様は、少なくとも一つの観察視点に対応する視点画像が符号化された符号化視点画像を復号する視点画像復号ステップと、前記観察視点からの各被写体までの距離を示す奥行き画像符号化された符号化奥行き画像を復号する奥行き画像復号ステップとを有する画像復号方法であって、前記奥行き画像復号ステップは、前記符号化奥行き画像を復号した画像について、前記符号化視点画像が符号化された際の符号化単位に応じた画素値の分布を分析する画素値分布分析ステップを有し、前記視点画像復号ステップは、前記画素値分布分析ステップの分析結果に基づき、前記符号化視点画の復号時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御ステップを有することを特徴とする。
【0023】
(14)また、本発明の他の態様は、コンピュータを、少なくとも一つの観察視点に対応する視点画像を符号化する視点画像符号化部、前記観察視点からの各被写体までの距離を示す奥行き画像を符号化する奥行き画像符号化部として機能させるためのプログラムであって、前記奥行き画像符号化部は、前記奥行き画像について、前記視点画像を符号化する際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、前記視点画像符号化部は、前記画素値分布分析部の分析結果に基づき、前記視点画像の符号化時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えることを特徴とする。
【0024】
(15)また、本発明の他の態様は、コンピュータを、少なくとも一つの観察視点に対応する視点画像が符号化された符号化視点画像を復号する視点画像復号部、前記観察視点からの各被写体までの距離を示す奥行き画像符号化された符号化奥行き画像を復号する奥行き画像復号部として機能させるためのプログラムであって、前記奥行き画像復号部は、前記符号化奥行き画像を復号した画像について、前記符号化視点画像が符号化された際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、前記視点画像復号部は、前記画素値分布分析部の分析結果に基づき、前記符号化視点画の復号時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えることを特徴とする。
【発明の効果】
【0025】
この発明によれば、視点画像を符号化した際に発生するブロックノイズを目立たなくすることができる。
【図面の簡単な説明】
【0026】
【図1】本発明の第1の実施形態に係る画像符号化装置1の内部構成を示す概略ブロック図である。
【図2】同実施形態に係る視点画像圧縮符号化部11の内部構成を示す概略ブロック図である。
【図3】同実施形態に係るデブロッキングフィルタ部1103によるフィルタ処理の対象画素位置を示す図である。
【図4】同実施形態に係る奥行き画像圧縮符号化部12の内部構成を示す概略ブロック図である。
【図5】本発明の第2の実施形態に係る画像復号装置2の構成を示す概略ブロック図である。
【図6】同実施形態に係る視点画像復号部21の内部構成を示す概略ブロック図である。
【図7】同実施形態に係る奥行き画像復号部22の内部構成を示す概略ブロック図である。
【図8】従来の、視点画像と奥行き画像とに基づき任意の視点位置からの映像を生成する方法を説明する概念図である。
【発明を実施するための形態】
【0027】
[第1の実施形態]
以下、図面を参照して、本発明の第1の実施形態について説明する。図1は、本実施形態に係る画像符号化装置1の内部構成を示す概略ブロック図である。画像符号化装置1は、視点画像圧縮符号化部11、奥行き画像圧縮符号化部12、撮影条件情報符号化部13を含んで構成される。
【0028】
視点画像圧縮符号化部11は、入力される単一または複数の観察視点に対応する視点画像pを、その情報量を削減するように圧縮し符号化して、符号化視点画像epを生成する。その際、後述する奥行き画像圧縮符号化部12からの奥行き値分布情報ddを利用する。視点画像圧縮符号化部11の詳細については後述する。
奥行き画像圧縮符号化部12は、入力される単一または複数の奥行き画像dを、その情報量を削減するように圧縮し符号化して、符号化奥行き画像edを生成する。なお、入力される奥行き画像dは、視点画像pの観察視点からの各被写体までの距離を示す。また、圧縮符号化の過程で、後述する符号化単位に応じた奥行き値分布情報ddを生成し、視点画像圧縮符号化部11へ伝送する。奥行き画像圧縮符号化部12の詳細については後述する。
【0029】
撮影条件情報符号化部13は、視点画像pの撮影または生成の際の、撮影シーンとカメラに関するパラメータである撮影条件情報cを符号化する。撮影条件情報cには、カメラの位置や撮影方向に関する情報と、撮影したシーンに関するカメラからの距離の最近値と最遠値を含む。撮影条件情報cは、視点画像pや奥行き画像dと比べるとその情報量は少ないため、符号化の際に視点画像pや奥行き画像dに対するような情報量の削減は行わず、各情報やパラメータを所定の順序に従って連続して伝送する。
【0030】
次に、視点画像圧縮符号化部11について説明する。図2は、画像符号化装置1に含まれる視点画像圧縮符号化部11の内部構成を示す概略ブロック図である。視点画像圧縮符号化部11は、DCT量子化部1101、逆量子化逆DCT部1102、デブロッキングフィルタ部1103、参照メモリ1104、動きベクトル検出部1105、画面間予測部1106、画面内予測部1107、符号化モード切替部1108、減算部1109、加算部1110、エントロピー符号化部1111、フィルタ制御部1112を含んで構成される。
【0031】
視点画像圧縮符号化部11は、視点画像pを圧縮符号化する。なお、視点画像pは静止画でも動画像でもよい。視点画像圧縮符号化部11は、圧縮符号化の処理を、所定の小領域を単位として行う。小領域は、視点画像pを16×16画素単位で分割したマクロブロック、あるいは、マクロブロックをさらに分割した8×8画素、4×4画素、8×4画素などのブロックである。以下の視点画像圧縮符号化部11を構成する各部の処理は、全てこの小領域単位に行う。なお、各処理において適用する小領域を、どのようなサイズとするかは、入力画像の大きさ、アプリケーションなどに応じて決定するが、ここでは詳細な説明を省略する。なお、小領域のサイズは、1つの視点画像p内で均一でなくてもよい。
【0032】
DCT量子化部1101は、減算部1109が出力する予測誤差信号に対してDCT(Discrete Cosine Transform;離散コサイン変換)の演算および量子化を行う。この際、減算部1109の出力画像を空間周波数ごとに分解した上で、視覚的に知覚されにくい高周波成分の情報を一部捨てて、画像の情報量を削減する。
逆量子化逆DCT部1102は、前述のDCT量子化部1101の逆処理を行う。逆処理の結果は、画面内予測部1107および画面間予測部1106で使用される。
加算部1110は、逆量子化逆DCT部1102による逆処理の結果と後述する予測処理によって得られる予測画像とを加算することによって、局部復号画像を生成する。
【0033】
デブロッキングフィルタ部1103は、加算部1110が生成した局部復号画像に対して、符号化によるブロック歪みを緩和するためのフィルタ処理を行う。デブロッキングフィルタ処理の詳細については後述する。
参照メモリ1104は、デブロッキングフィルタ部1103によりフィルタ処理された局部復号画像を保存する。
【0034】
動きベクトル検出部1105は、参照メモリ1104に保存された局部復号画像と、装置外部から入力される視点画像pとの間で、動きベクトルを検出する。動きベクトルは、視点画像p内の符号化対象領域に対応して、参照画像内で最も類似度の高い領域を指す情報である。なお、参照画像は、参照メモリ1104に保存された局部復号画像の中から、動きベクトル検出部1105によって選択される。動きベクトル検出部1105は、得られた動きベクトルを、画面間予測部1106およびエントロピー符号化部1111へ出力する。
【0035】
画面間予測部1106は、動きベクトル検出部1105が検出した動きベクトルに対応する参照画像内の領域を読み出して予測画像を生成する。
画面内予測部1107は、参照メモリ1104に保存された局部復号画像を参照し、符号化対象領域に対応する予測画像を生成する。
符号化モード切替部1108は、符号化効率の観点で符号化モードを決定し、前記画面間予測部1106または画面内予測部1107で生成された予測画像の中から、決定した符号化モードに対応する予測画像を選択し、加算部1110および減算部1109へ出力する。
【0036】
減算部1109は、装置外部から入力される視点画像pから符号化モード切替部1108が出力した予測画像を減算し、予測誤差信号を生成する。
エントロピー符号化部1111は、DCT量子化部1101で生成される符号化された予測誤差信号と、動きベクトル検出部1105で得られる動きベクトルと、符号化モード切替部1108が決定した符号化モードを示す情報などを、指数ゴロム符号や統計的な性質を利用して、全体の符号量(ビット数)が削減されるように可変長符号化する。エントロピー符号化部1111により可変長符号化された情報は、符号化視点画像epとして、視点画像圧縮符号化部11から出力される。
【0037】
フィルタ制御部1112は、後述する奥行き画像圧縮符号化部12から奥行き値分布情報ddを受け取り、視点画像pの符号化時に適用するデブロッキングフィルタのフィルタの強度(後述するBs、tc’)を決定し、デブロッキングフィルタ部1103へ出力する。フィルタの強度を決定する手順については後述する。
【0038】
ここで、フィルタ制御部1112およびデブロッキングフィルタ部1103の処理の詳細について説明する。デブロッキングフィルタ部1103は、画像のブロック境界の画素値を平滑化することで、符号化時に生じるブロック歪みを緩和して、符号化画質を向上させることを目的とするものである。フィルタ制御部1112は、後述するフィルタ強度Bsおよび係数tc’を、奥行き値分布情報ddを用いて決定することで、デブロッキングフィルタ部1103におけるフィルタの強度を制御する。
【0039】
図3は、デブロッキングフィルタ部1103によるフィルタ処理の対象画素位置を示す図である。図3は、16画素×16画素で構成されるマクロブロック30を、4画素×4画素のブロック(ブロック31、32、33、36、37など)に分割し、これらのブロックを圧縮符号化の処理を行う単位である小領域としている場合の例である。フィルタ処理の対象は、マクロブロックまたはブロックの境界を挟んだ画素列である。
【0040】
図3のマクロブロック30の垂直方向の端に位置し、水平方向に隣接するブロック31、32の境界に注目すると、例えば、ブロック31と32の境界を挟んだ8画素(p0,p1,p2,p3,q0,q1,q2,q3)からなる画素列34aがフィルタ処理の対象である。なお、画素列34aは、左端から画素p3、p2、p1、p0、q0、q1、q2、q3の順に並んでおり、画素p0とq0との間にブロック31と32の境界がある。この画素列34aに対してフィルタ処理を施すことによって、画素列34b(p0’,p1’,p2’,p3’,q0’,q1’,q2’,q3’)を得る。同様に、マクロブロック30の水平方向の端に位置し、垂直方向に隣接するブロック31、33の境界に注目すると、例えば、ブロック31と33の境界を挟んだ8画素(p0,p1,p2,p3,q0,q1,q2,q3)からなる画素列35aがフィルタ処理の対象である。なお、画素列35aは、上端から画素p3、p2、p1、p0、q0、q1、q2、q3の順に並んでおり、画素p0とq0との間にブロック31と33の境界がある。この画素列35aにフィルタ処理を施すことによって、画素列35b(p0’,p1’,p2’,p3’,q0’,q1’,q2’,q3’)を得る。
【0041】
また、マクロブロック30の垂直方向の端に位置し、水平方向に隣接するブロック36、37の境界に注目すると、例えば、マクロブロック30の垂直方向の端から1画素離れたラインに位置し、ブロック36と37の境界を挟んだ8画素(p0,p1,p2,p3,q0,q1,q2,q3)からなる画素列38aがフィルタ処理の対象である。なお、画素列38aは、左端から画素p3、p2、p1、p0、q0、q1、q2、q3の順に並んでおり、画素p0とq0との間にブロック36と37の境界がある。この画素列38aに対してフィルタ処理を施すことによって、画素列38b(p0’,p1’,p2’,p3’,q0’,q1’,q2’,q3’)を得る。なお、上述の画素列34a、35bは、マクロブロック30の端(境界)に位置するが、フィルタ処理の対象は、画素列38aのようにマクロブロック30の端(境界)に位置しないものも含まれる。
【0042】
フィルタ制御部1112は、まず、フィルタ処理の対象となる画素列毎に、ブロック境界のフィルタ強度Bsを、表1のような基準で決定する。表中のイントラマクロブロックとは、イントラ(画面内)予測モードで符号化されたマクロブロックを意味する。なお、表1において、画素がDCT係数を持つとは、該画素を含むブロックがDCT係数を持つことを意味する。また、画素がDCT係数を持たないとは、該画素を含むブロックがDCT係数を持たないことを意味する。すなわち、減算部1109が出力する予測誤差信号が示す値が、該画素を含むブロックにおいては全て0に充分近いときは、これを離散コサイン変換し、量子化すると0となる。このようなときを、DCT係数を持たないという。
【0043】
【表1】

【0044】
Bs=4の時が最も強いフィルタリングであり、Bs=0の時にはフィルタリングなしである。フィルタ制御部1112は、表2に示すようなフィルタ強度Bsと量子化パラメータA’との組み合わせと、係数tc’との対応付けを記憶している。フィルタ制御部1112は、Bs=1〜3のときには、記憶している表2を参照し、フィルタ強度Bsと量子化パラメータA’とに基づき、係数tc’を決定する。なお、フィルタ制御部1112は、DCT量子化部1101における量子化に応じて決まる量子化パラメータAに、当該画素列のインデックスαを加えて量子化パラメータA’を算出する。
【0045】
量子化パラメータは、DCT変換係数を量子化する際のステップ数に対応する変数である。量子化の処理は、変換係数を量子化ステップQsで除算し、その結果を整数値に丸めることであり、その逆に、量子化された変換係数に量子化ステップQsを乗算して元の変換係数に戻す処理が逆量子化である。量子化ステップを大きくすれば、量子化によって変換係数の値が大幅に小さくなり、符号化に必要なビット数を少なくすることができる。量子化パラメータAは、基本的に量子化ステップQsより小さな値を持ち、所定の演算を施すことによって量子化ステップQsを算出できるように定めておく。例えばAを6で除算した余り(A%6)に対応した6通りのステップ数Qs0のテーブルを定めておき、これと、Aを6で除算した商(A/6)を指数に持つ2の累乗(2A/6)を乗算することで量子化ステップQsを算出する。このような関係を定めておくことにより、伝送する量子化パラメータの値0〜51に対して、得られる量子化ステップは、その最大値が最小値の256倍の数値を持つことになり、少ない伝送量で多くのパターンの量子化処理を表すことができる。なお、量子化パラメータAは、複数のブロック単位で同一の値を使用してもよいし、ブロック単位で異なる値を使用してもよい。
【0046】
【表2】

【0047】
デブロッキングフィルタ部1103は、図3に示したような画素列毎に、フィルタ制御部1112が決定したフィルタ強度Bsおよび係数tc’に従い、フィルタ処理を行う。上述のように、フィルタ強度Bs=0のときには、対応する画素列に対してフィルタリングを行わない。また、フィルタ強度Bs=1〜3のときには、対応する画素列に対して下記のようなフィルタリングを行う。
【0048】
p0、q0に関しては、デブロッキングフィルタ部1103は、(式1)、(式2)の演算を行い、フィルタリング結果であるp0’とq0’とを得る。
p0’=p0+d ・・・(式1)
q0’=q0−d ・・・(式2)
ここで、
d=Clip3〔−tc,tc,{4*(q0−p0)+(p1−q1)+4}/8〕・・・(式3)
である。
なお、Clip3(a,b,c)は、cの値がa〜bの範囲を超えないようにクリップ処理を行うことを意味する。
【0049】
また、p1、q1に関しては、デブロッキングフィルタ部1103は、(式4)、(式5)の演算を行い、フィルタリング結果であるp1’とq1’とを得る。
p1’=p1+Clip3〔−tc,tc,{p2+(p0+q0+1)/2−(2*p1)}/2〕 ・・・(式4)
q1’=q1+Clip3〔−tc,tc,{q2+(p0+q0+1)/2−(2*q1)}/2〕 ・・・(式5)
上記の式3〜式5において、
tc=tc’+β (βは、量子化パラメータAに依存して0〜2の値をとる)
である。
このようにフィルタ強度Bs=1から3のときは、係数tcに大きな値が設定されると、式1〜式5に従ってp0,q0,p1,q1のフィルタリング時に大きな画素値の変化を許容することになる。すなわち、係数tc’が大きいほど強いフィルタリングが施される。
【0050】
Bs=4のときには、デブロッキングフィルタ部1103は、フィルタ強度Bs=1〜3よりも強いフィルタリングになるような係数を用いて、3タップ〜5タップのFIR(Finite Impulse Response)フィルタを施す。このように、デブロッキングフィルタ部1103は、フィルタ制御部1112が決定したBs値、係数tc’に応じて、フィルタの強度が変化するので、ブロック歪みが生じにくい領域の解像度を損ねないようにしながら、適応的にブロック歪みの除去を行うことができる。
そして、本実施形態によるフィルタ制御部1112は、奥行き値分布情報ddに基づき、Bs値、係数tc’を決定しているので、奥行き画像dの性質に応じてフィルタの強度を制御することができる。
【0051】
次に、奥行き画像圧縮符号化部12について説明する。図4は、画像符号化装置1に含まれる奥行き画像圧縮符号化部12の内部構成を示す概略ブロック図である。奥行き画像圧縮符号化部12は基本的に、視点画像圧縮符号化部11と共通の構成を備えており、DCT量子化部1201、逆量子化逆DCT部1202、デブロッキングフィルタ部1203、参照メモリ1204、動きベクトル検出部1205、画面間予測部1206、画面内予測部1207、符号化モード切替部1208、減算部1209、加算部1210、エントロピー符号化部1211、フィルタ制御部1212、画素値分布分析部1213を含んで構成される。
【0052】
奥行き画像圧縮符号化部12は、視点画像圧縮符号化部11と、以下の3点が異なる。まず、1点目は、処理対象が輝度値のみである奥行き画像dである点である。2点目は、フィルタ制御部1212が、奥行き値分布情報ddを用いない、すなわち、量子化パラメータA’に変えてDCT量子化部1201の量子化パラメータを用いる点である。3点目は、画素値分布分析部1213を含むことである。ここでは、画素値分布分析部1213についてのみ説明し、その他の各部については、説明を省略する。
【0053】
画素値分布分析部1213は、参照メモリ1204が記憶する奥行き画像の局部復号画像について、ブロックに応じた画素値の分布を分析する。画素値分布分析部1213は、この分析の結果として、ブロック境界を挟む2つの画素毎にインデックスαを決定し、奥行き値分布情報ddとして出力する。画素値分布分析部1213は、2画素間の画素値の差分の絶対値と、インデックスαとの対応を表すテーブルを記憶している。画素値分布分析部1213は、ブロック境界を挟む2つの画素毎に、該2画素間の画素値の差分の絶対値を算出し、このテーブルを参照して、インデックスαを決定する。このテーブルは、例えば、表3のようなテーブルであり、2画素間の画素値の差分の絶対値が小さいほど、インデックスαの値が大きくなっている。
【0054】
【表3】

【0055】
インデックスαは、上述のように、ブロック境界を挟む2つの画素毎に値を持つので、図3に示すような画素列34a、35a、38aなどごとに独立した値を持つ。すなわち、奥行き値分布情報ddは、画素列34a、35a、38aなどごとインデックスαを示せるような構成である。
【0056】
このように、インデックスαは、正の値であり、奥行き値の差分が小さいほど、値が大きくなり、したがって、量子化パラメータA’も大きくなる。量子化パラメータA’が大きくなると係数tc’も大きくなり、フィルタの強度は強くなる。ブロック境界で奥行き値の差が小さいということは、同一被写体がブロック境界にまたがって位置している可能性が高いことを意味するが、同一被写体がブロック境界にまたがっている場合、ブロック歪みがあると視覚的に目立ちやすい。したがって、そのようなケースでフィルタの強度を強めることによって、目立ちやすいブロック歪みを低減させることができる。
【0057】
なお、量子化パラメータA’=A+αの結果が最大値51を超えてしまう場合には、フィルタ制御部1112が量子化パラメータA’=51にクリッピングして、表2に従ってもよいし、フィルタ強度Bsの値を一つ上げるようにしてもよい。
また、フィルタ制御部1112は、量子化パラメータAをそのまま用い、インデックスαの解釈を、例えばα=0〜4とα=5〜6の2段階に分け、α=0〜4の場合には、フィルタ強度Bsの変更なしとし、α=5〜6の場合のみ、フィルタ強度Bsを強くするようにしてもよい。
【0058】
また、本実施形態では、画素値分布分析部1213は、奥行き値分布情報ddを生成する際、ブロックの境界で接する画素位置p0とq0に対応する奥行き画像の画素値(奥行き値、距離値)を参照し、これらの差分を算出した。しかし、画素値分布分析部1213は、ブロックの境界で接する2つの領域各々を代表する距離値を参照すればよく、例えば、画素位置p0〜p3からなる領域とq0〜q3からなる領域とに対応する奥行き画像の画素値を参照するようにしてもよい。その際は、例えば、p0〜p3に対応する奥行き値の平均値と、q0〜q3に対応する奥行き値の平均値との差分の絶対値に対応するインデックスαを、表3のテーブルから取得する。また、この平均値は、境界に近い画素の奥行き値ほど、重みを大きくするなどした加重平均であってもよい。
【0059】
以上のように、奥行き画像圧縮符号化部12に含まれる画素値分布分析部1213が、奥行き画像における奥行き値の分布状態を分析し、その分析結果である奥行き値分布情報を、視点画像圧縮符号化部11に含まれるフィルタ制御部1112へ出力する。奥行き値分布情報を受信したフィルタ制御部1112は、前述の通り、視点画像のデブロッキングフィルタ処理を行う際のフィルタの強度を決定し、デブロッキングフィルタ部1103へ出力する。この一連の処理によって、デブロッキングフィルタ処理を行う際に、視点画像の符号化条件だけでなく奥行き画像の性質も利用するので、フィルタ処理を施す領域(例えば画素列34a)が同様の奥行き値を備える、すなわち同一の被写体に含まれるか否かを簡便に判定することができる。そして、同一の被写体に含まれる領域のフィルタ強度を強めるようにフィルタ強度を変更することで、より目立ちやすいブロック歪みを除去することができる。
【0060】
なお、本実施形態において、奥行き画像dは、画像符号化装置1の外部から入力されるデータとして扱っているが、画像符号化装置1が奥行き画像dを生成する手段を備えてもよい。奥行き画像dを生成する方法としては、複数の視点画像からブロックマッチングにより推定する方法や、赤外線や超音波などを被写体に向けて放射しその反射時間を測定して被写体までの距離を算出する方法等を用いてもよい。
【0061】
[第2の実施形態]
次に、図面を参照して、本発明の第2の実施形態について説明する。図5は、本実施形態に係る画像復号装置2の構成を示す概略ブロック図である。画像復号装置2は、視点画像復号部21、奥行き画像復号部22、撮影条件情報復号部23を含んで構成される。
【0062】
視点画像復号部21は、符号化視点画像epを復号し、視点画像p’を復元する。その際、後述する奥行き画像復号部22からの奥行き値分布情報ddを利用する。視点画像復号部21の詳細については後述する。符号化視点画像epは、例えば、第1の実施形態の視点画像圧縮符号化部11が生成した符号化視点画像である。
奥行き画像復号部22は、符号化奥行き画像edを復号し、奥行き画像d’を復元する。符号化奥行き画像edは、例えば、第1の実施形態の奥行き画像圧縮符号化部12が生成した符号化奥行き画像edである。また、奥行き画像復号部22は、復号の過程で、符号化単位に応じた奥行き値分布情報ddを生成し、視点画像復号部21へ伝送する。奥行き画像復号部22の詳細については後述する。
撮影条件情報復号部23は、符号化撮影条件情報ecを復号し、撮影条件情報cを復元する。符号化撮影条件情報ecは、例えば、第1の実施形態の撮影条件情報符号化部13が生成した符号化撮影条件情報ecである。
【0063】
次に、視点画像復号部21について説明する。図6は、画像復号装置2に含まれる視点画像復号部21の内部構成を示す概略ブロック図である。視点画像復号部21は、エントロピー復号部2101、逆量子化逆DCT部2102、デブロッキングフィルタ部2103、参照メモリ2104、動き補償/画面間予測部2105、画面内予測部2106、復号モード切替部2107、加算部2108、フィルタ制御部2109を含んで構成される。
【0064】
視点画像復号部21は、符号化視点画像epをその符号化単位ごとに復号する。符号化単位は、16×16画素単位のマクロブロックを基本とし、さらに8×8画素や4×4画素などの単位で符号化されている場合もある。以下の各部の処理は全てこの符号化単位で行う。
【0065】
エントロピー復号部2101は、指数ゴロム符号やあらかじめ設定された符号と信号の対応関係に基づいて可変長符号化されたデータである符号化視点画像epを、もとの信号に復元する。復元された信号のうち、変換・量子化係数は逆量子化逆DCT部2102へ、動きベクトルを含む画面間予測に関する情報は動き補償/画面間予測部2105へ、画面内予測に関する情報は画面内予測部2106へ、それぞれ出力する。なお、変換・量子化係数は、第1の実施形態における予測誤差信号を符号化したものである。
【0066】
逆量子化逆DCT部2102は、エントロピー復号部2101から入力される変換・量子化係数を逆量子化および逆DCT変換し、予測誤差信号を復元する。逆量子化逆DCT部2102の処理は、第1の実施形態の視点画像圧縮符号化部11に含まれる逆量子化逆DCT部1102と同等である。
加算部2108は、前述の逆量子化逆DCT部2102で復元された予測誤差信号と、後述する動き補償/画面間予測部2105および画面内予測部2106で得られる予測画像とを加算して、局部復号画像を生成する。
【0067】
デブロッキングフィルタ部2103は、加算部2108が生成した局部復号画像に対して、符号化によるブロック歪みを緩和するためのデブロッキングフィルタ処理を行う。デブロッキングフィルタ部2103の処理は、第1の実施形態の視点画像圧縮符号化部11に含まれるデブロッキングフィルタ部1103と同等である。
参照メモリ2104は、デブロッキングフィルタ部2103がフィルタ処理した局部復号画像を保存する。
【0068】
動き補償/画面間予測部2105は、参照メモリ2104に保存された局部復号画像と、復号された画面間予測情報とから予測画像を生成する。
画面内予測部2106は、参照メモリ2104に保存された局部復号画像と、復号された画面内予測情報とから予測画像を生成する。
復号モード切替部2107は、符号化単位ごとに、前記動き補償/画面間予測部2105または画面内予測部2106で生成された予測画像のいずれかを選択し、加算部2108へ伝送する。
【0069】
フィルタ制御部2109は、後述する奥行き画像復号部22から奥行き値分布情報ddを受け取り、デブロッキングフィルタ処理を行う際のフィルタの強度(Bs、tc’)を決定し、デブロッキングフィルタ部2103へ出力する。フィルタ制御部2109におけるフィルタの強度を決定する手順は、第1の実施形態の視点画像圧縮符号化部11に含まれるフィルタ制御部1112と同様である。
【0070】
次に、奥行き画像復号部22について説明する。図7は、画像復号装置2に含まれる奥行き画像復号部22の内部構成を示す概略ブロック図である。奥行き画像復号部22は基本的に、視点画像復号部21と共通の構成を備えており、両者の違いは、奥行き画像復号部22が、視点画像復号部21が備えているフィルタ制御部2109を含まず、画素値分布分析部2209を含むことである。
画素値分布分析部2209は、第1の実施形態の奥行き画像圧縮符号化部12に含まれる画素値分布分析部1213と同様の処理を行う。すなわち、画素値分布分析部2209は、加算部1210が生成した奥行き画像の局部復号画像を分析し、符号化単位の境界に対応する奥行き画像内の画素値の関係に基づいて、表3に示したような奥行き値分布情報dd(インデックスα)を生成する。
【0071】
以上のように、デブロッキングフィルタ処理を行う際に、視点画像の符号化条件だけでなく奥行き画像の性質も利用することによって、フィルタ処理を施す領域が同様の奥行き値を備える、すなわち同一の被写体に含まれるか否かを簡便に判定することができ、同一の被写体に含まれる領域のフィルタ強度を強めるようにフィルタ強度を変更することで、より目立ちやすいブロック歪みを除去することができる。
また、視点画像復号部21および奥行き画像復号部22において、視点画像圧縮符号化部11および奥行き画像圧縮符号化部12と同じ基準でデブロッキングフィルタ処理のフィルタ強度を決定し、それに従ってフィルタ処理を行うことによって、符号化時と同一のフィルタ結果を得ることができ、符号化・復号による誤差を生じることなく、ブロック歪みを除去しながら視点画像を復元することができる。
【0072】
なお、上述の各実施形態において、画素値分布分析部1213、2209は、デブロッキングフィルタ部1203、2203によるフィルタ処理前の奥行き画像を対象にして分析しているが、フィルタ処理後の奥行き画像を対象にしてもよい。このとき、フィルタ処理前とするかフィルタ処理後とするかを、画素値分布分析部1213と、画素値分布分析部2209との間で一致させておくことが望ましい。
また、図1における画像符号化装置1、または図5の画像復号装置2の全機能または一部機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各装置を実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0073】
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0074】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【符号の説明】
【0075】
1・・・画像符号化装置
11・・・視点画像圧縮符号化部
12・・・奥行き画像圧縮符号化部
13・・・撮影条件情報符号化部
1101、1201・・・DCT量子化部
1102、1202・・・逆量子化逆DCT部
1103、1203・・・デブロッキングフィルタ部
1104、1204・・・参照メモリ
1105、1205・・・動きベクトル検出部
1106、1206・・・画面間予測部
1107、1207・・・画面内予測部
1108、1208・・・符号化モード切替部
1109、1209・・・減算部
1110、1210・・・加算部
1111、1211・・・エントロピー符号化部
1112、1212・・・フィルタ制御部
1213・・・画素値分布分析部
2・・・画像復号装置
21・・・視点画像復号部
22・・・奥行き画像復号部
23・・・撮影条件情報復号部
2101、2201・・・エントロピー復号部
2102、2202・・・逆量子化逆DCT部
2103、2203・・・デブロッキングフィルタ部
2104、2204・・・参照メモリ
2105、2205・・・動き補償/画面内予測部
2106、2206・・・画面内予測部
2107、2207・・・符号化モード切替部
2108、2208・・・加算部
2109・・・フィルタ制御部
2209・・・画素値分布分析部

【特許請求の範囲】
【請求項1】
少なくとも一つの観察視点に対応する視点画像を符号化する視点画像符号化部と、前記観察視点からの各被写体までの距離を示す奥行き画像を符号化する奥行き画像符号化部とを備える画像符号化装置であって、
前記奥行き画像符号化部は、前記奥行き画像について、前記視点画像を符号化する際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、
前記視点画像符号化部は、前記画素値分布分析部の分析結果に基づき、前記視点画像の符号化時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えること
を特徴とする画像符号化装置。
【請求項2】
前記画素値分布分析部は、前記分析の際に、前記符号化単位の境界で接する2つの領域各々を代表する距離値の差分を算出し、
前記フィルタ制御部は、前記差分に応じて、前記差分に対応する前記境界における前記フィルタ強度を決定すること
を特徴とする請求項1に記載の画像符号化装置。
【請求項3】
前記フィルタ制御部は、前記差分の絶対値が小さいほど、前記フィルタ強度を強くすることを特徴とする請求項2に記載の画像符号化装置。
【請求項4】
前記2つの領域各々を代表する距離値は、前記境界に接する2つの画素各々の画素値であることを特徴とする請求項2に記載の画像符号化装置。
【請求項5】
前記2つの領域各々を代表する距離値は、前記境界に接する第1の画素と、該第1の画素の前記境界の反対側に位置する1つまたは複数の第2の画素とからなる画素群の画素値の平均であることを特徴とする請求項2に記載の画像符号化装置。
【請求項6】
前記画素値分布分析部が分析する奥行き画像は、前記奥行き画像符号化部が符号化したものを復号したものであることを特徴とする請求項1に記載の画像符号化装置。
【請求項7】
少なくとも一つの観察視点に対応する視点画像が符号化された符号化視点画像を復号する視点画像復号部と、前記観察視点からの各被写体までの距離を示す奥行き画像符号化された符号化奥行き画像を復号する奥行き画像復号部とを備える画像復号装置であって、
前記奥行き画像復号部は、前記符号化奥行き画像を復号した画像について、前記符号化視点画像が符号化された際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、
前記視点画像復号部は、前記画素値分布分析部の分析結果に基づき、前記符号化視点画の復号時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えること
を特徴とする画像復号装置。
【請求項8】
前記画素値分布分析部は、前記分析の際に、前記符号化単位の境界で接する2つの領域各々を代表する距離値の差分を算出し、
前記フィルタ制御部は、前記差分に応じて、前記差分に対応する前記境界における前記フィルタ強度を決定すること
を特徴とする請求項7に記載の画像復号装置。
【請求項9】
前記フィルタ制御部は、前記差分の絶対値が小さいほど、前記フィルタ強度を強くすることを特徴とする請求項8に記載の画像復号装置。
【請求項10】
前記2つの領域各々を代表する距離値は、前記境界に接する2つの画素各々の画素値であることを特徴とする請求項8に記載の画像復号装置。
【請求項11】
前記領域を代表する距離値は、前記境界に接する第1の画素と、該第1の画素の前記境界の反対側に位置する1つまたは複数の第2の画素とからなる画素群の画素値の平均であることを特徴とする請求項8に記載の画像復号装置。
【請求項12】
少なくとも一つの観察視点に対応する視点画像を符号化する視点画像符号化ステップと、前記観察視点からの各被写体までの距離を示す奥行き画像を符号化する奥行き画像符号化ステップとを有する画像符号化方法であって、
前記視点画像符号化ステップは、前記奥行き画像について、前記視点画像を符号化する際の符号化単位に応じた画素値の分布を分析する画素値分布分析ステップを有し、
前記視点画像符号化ステップは、前記画素値分布分析ステップの分析結果に基づき、前記視点画像の符号化時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御ステップを有すること
を特徴とする画像符号化方法。
【請求項13】
少なくとも一つの観察視点に対応する視点画像が符号化された符号化視点画像を復号する視点画像復号ステップと、前記観察視点からの各被写体までの距離を示す奥行き画像符号化された符号化奥行き画像を復号する奥行き画像復号ステップとを有する画像復号方法であって、
前記奥行き画像復号ステップは、前記符号化奥行き画像を復号した画像について、前記符号化視点画像が符号化された際の符号化単位に応じた画素値の分布を分析する画素値分布分析ステップを有し、
前記視点画像復号ステップは、前記画素値分布分析ステップの分析結果に基づき、前記符号化視点画の復号時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御ステップを有すること
を特徴とする画像復号方法。
【請求項14】
コンピュータを、
少なくとも一つの観察視点に対応する視点画像を符号化する視点画像符号化部、
前記観察視点からの各被写体までの距離を示す奥行き画像を符号化する奥行き画像符号化部
として機能させるためのプログラムであって、
前記奥行き画像符号化部は、前記奥行き画像について、前記視点画像を符号化する際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、
前記視点画像符号化部は、前記画素値分布分析部の分析結果に基づき、前記視点画像の符号化時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えること
を特徴とするプログラム。
【請求項15】
コンピュータを、
少なくとも一つの観察視点に対応する視点画像が符号化された符号化視点画像を復号する視点画像復号部、
前記観察視点からの各被写体までの距離を示す奥行き画像符号化された符号化奥行き画像を復号する奥行き画像復号部
として機能させるためのプログラムであって、
前記奥行き画像復号部は、前記符号化奥行き画像を復号した画像について、前記符号化視点画像が符号化された際の符号化単位に応じた画素値の分布を分析する画素値分布分析部を備え、
前記視点画像復号部は、前記画素値分布分析部の分析結果に基づき、前記符号化視点画の復号時に適用するデブロッキングフィルタのフィルタ強度を決定するフィルタ制御部を備えること
を特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate