動画像符号化装置及びプログラム
【課題】 動きや変化の小さい領域と大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域とも復号エラーを抑えることができる動画像符号化装置を提供する。
【解決手段】 入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、この変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段とを備える動画像符号化装置に関する。そして、対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、WZ符号化手段から領域ごとのレートを取り込み、このレートに基づいて、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段を有することを特徴とする。
【解決手段】 入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、この変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段とを備える動画像符号化装置に関する。そして、対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、WZ符号化手段から領域ごとのレートを取り込み、このレートに基づいて、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段を有することを特徴とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は動画像符号化装置及びプログラムに関し、例えば、Slepian−Wolfの定理及びWyner−Zivの定理に基づき動画像を符号化する場合に適用し得るものである。
【背景技術】
【0002】
動画像符号化技術として、Slepian−Wolfの定理及びWyner−Zivの定理に基づき構築されたDVC(Distributed Video Coding)がある(特許文献1参照)。
【0003】
H.264/AVCをはじめとする一般的な動画像符号化技術と比較したときに、DVCのもっとも大きな特徴は、DVCのエンコーダが動き推定を伴った予測画像の生成処理を持たないことである。代わりに、予測画像の生成処理はデコーダが担っている。DVCの符号化は、原画像のWyner−Ziv符号(量子化器と誤り訂正符号の組み合わせを利用することが多い)を生成することによって行われ、復号は、予測画像に含まれる誤差をWyner−Ziv符号によって訂正することで行われる。以上の構成から、DVCは、「エンコーダ(符号化装置)が低負荷で、デコーダ(復号装置)が高負荷になる」という、従来方式とは正反対の性質を持つ。
【0004】
まず、図12を用いて、DVCにおけるWZフレーム画像(非キーフレーム画像)の符号化装置(WZフレーム符号化装置)を説明する。WZフレーム符号化装置にキーフレーム画像の符号化装置を加えたものが、DVCの動画像符号化装置となる。
【0005】
WZフレーム符号化装置100は、変換部101とWZ符号化部102とを有する。WZ符号化部602は、量子化部103とSW符号化部104とを有する。
【0006】
WZフレーム画像WZFは変換部101に与えられ、変換部101は、WZフレーム画像WZFに対して少なくとも相関除去処理を含む所定の変換処理を行い、得られた変換量P101がWZ符号化部102に与えられる。所定の変換処理は、例えば、フレーム間差分処理、動き補償予測画像との差分処理、又は、直交変換処理(離散コサイン変換など)などのような相関除去処理を少なくとも1つは含む処理である。例えば、フレーム間差分処理後に離散コサイン変換を行うものであっても良い。
【0007】
WZ符号化部102は、変換量P101を外部から設定されたビットデプス(量子化ビット数)BDに従ってWyner−Ziv符号化(以下、WZ符号化と呼ぶ)し、WZストリームSTを出力する。より具体的に言うと、量子化部103が、変換量P101をビットデプスBPに従って量子化し、SW符号化部104が、得られた量子化値P103を、誤り訂正符号などに符号化することによって、Slepian−Wolf符号化(以下、SW符号化と呼ぶ)し、WZストリームSTを出力する。
【0008】
量子化部103は、量子化値P103のビットデプスが外部から設定されたビットデプスBPになるように、変換量P101の量子化を行う。
【0009】
例えば、ビットデプスBPに2が設定された場合には、量子化値P103は4通りの値をとることができるので、図13のように変換量のダイナミックレンジ内を4分割し、それぞれの区間に2ビットの量子化値a2、b2、c2、d2を割り当てる。また例えば、ビットデプスBPに3が設定された場合には、量子化値P103は8通りの値をとることができるので、図14や図15のように変換量のダイナミックレンジ内を8分割し、それぞれの区間に3ビットの量子化値a3、b3、c3、d3、e3、f3、g3、h3を割り当てる。
【0010】
従来では、量子化に、ミッドトレッド型量子化器を適用していた。ミッドトレッド型量子化器は、変換量P101がゼロ近傍の値のときに、同じ量子化値に量子化する量子化器である。図13や図15は、ミッドトレッド型量子化器の例である。例えば、図13の場合、ゼロ近傍の変換量P101は値b2に量子化され、図15の場合、ゼロ近傍の変換量P101は値d3に量子化される。
【0011】
一方、ミッドトレッド型量子化器を適用しなければ、ゼロよりわずかに小さいマイナスの値とゼロよりわずかに大きいプラスの値とが異なる値に量子化される。図14は、ミッドトレッド型ではない量子化器の例であり、ゼロよりわずかに小さいマイナスの値は量子化値c3に変換され、ゼロよりわずかに大きいプラスのちは量子化値dに変換される。
【0012】
相関除去されている変換量P101は、ゼロを中心にして分散した値をとることが知られているので、原画像の変換量がゼロよりわずかに大きいプラスの値をとり、予測画像の変換量がゼロよりわずかに小さいマイナスの値をとる状況は十分発生し得る。相関除去して直交変換を行っている場合には、特に交流成分の分布はゼロを中心に分散したものとなる。ミッドトレッド型量子化器を適用している場合、原画像や予測画像がゼロを中心に分散する状況でも、原画像や予測画像の量子化値は共に同じ値に量子化され、符号量の増大は回避される。
【0013】
なお、ミッドトレッド型量子化器を用いて一様量子化したい場合、量子化値は奇数個の区間を表す値を必要とするので、上記の例のように量子化値P103が偶数個の値しか表現できない場合は、どこかの区間が非一様になることを認めなければならない。図13の例では、区間c2と区間d2の量子化ステップが、その他の区間の量子化ステップの半分になることを認めており、図15の例では、区間g3と区間h3の量子化ステップが、その他の区間の量子化ステップの半分になることを認めている。
【0014】
SW符号化部104では、量子化値P103をSW符号化する。LDPC符号やターボ符号などの誤り訂正符号がSW符号として採用されることが多い。SW符号化部104では、量子化値P103を、周波数帯域ごとに分離し(但し、変換部101が直交変換処理を実行していることを要する)、周波数帯域ごとにビットプレーンを生成し、ビットプレーンを誤り訂正符号化できるサイズに分割して、それぞれを誤り訂正符号化する。結果として、フレームが幾つかの領域に分割され、領域ごとの誤り訂正符号が生成されたことになる。
【0015】
なお、SW符号化部104は、デコーダが生成する予測画像の誤り率に応じて、領域ごとの誤り訂正符号ごとに、適切な誤り訂正符号のレート(符号量)を設定する必要がある。適切なレートを推定する方法には、デコーダからのフィードバックを利用する方式やエンコーダで予測画像を生成する方式などがあるが、本発明は、レート推定方法がいずれかに限定されるものではないので、その説明は省略する。
【先行技術文献】
【特許文献】
【0016】
【特許文献1】特開2009−141688号公報
【発明の概要】
【発明が解決しようとする課題】
【0017】
しかしながら、ビットデプスを一定値に固定して符号化した場合、動きや変化の小さい領域では復号エラーが小さくなるが、動きや変化の大きい領域では復号エラーが大きくなるという問題が発生する。
【0018】
かかる不都合を解決するため、あらかじめビットデプスを大きな値にすることも考えられるが、この場合には、動きや変化の小さい領域(もともと復号エラーが小さく、さらに復号エラーを抑えても、画質に与える影響が少ない領域)のレートが増える。又は、動画像符号化技術で一般的に利用されている動きベクトル検出によって、動きや変化を検出し、動きや変化の大きい領域ではビットデプスを大きくすることも考えられるが、この場合には、SW符号化部104の処理負担が大きくなる。
【0019】
そのため、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、レートや処理負担をさほど増加させることなく、両領域とも復号エラーを抑えることができる動画像符号化装置及びプログラムが望まれている。
【課題を解決するための手段】
【0020】
第1の本発明は、入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段とを備える動画像符号化装置において、対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段を有することを特徴とする。
【0021】
第2の本発明の動画像符号化プログラムは、動画像符号化装置に搭載されるコンピュータを、(1)入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、(2)上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段と、(3)対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段として機能させることを特徴とする。
【0022】
第3の本発明は、キーフレーム画像をフレーム内符号化方式で符号化する第1の動画像符号化装置部と、非キーフレーム画像を符号化する第2の動画像符号化装置部とを有する動画像符号化装置において、上記第2の動画像符号化装置部として、第1の本発明の動画像符号化装置を適用したことを特徴とする。
【発明の効果】
【0023】
本発明の動画像符号化装置及びプログラムによれば、動きや変化の小さい領域か動きや変化の大きい領域かをレートの値で推測し、量子化でのビットデプスを領域毎に決定するようにしたので、処理負担をさほど増加させることなく、対向装置での復号エラーを抑えることができる。
【図面の簡単な説明】
【0024】
【図1】第1の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図2】第1の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図3】第2の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図4】第2の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図5】第3の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図6】第3の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図7】第3の実施形態におけるビットデプス再決定方法の説明図である。
【図8】第4の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図9】第4の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図10】第5の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図11】第5の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図12】従来のWZフレーム符号化装置の構成を示すブロック図である。
【図13】ビットデプスが2の場合の入力値と量子化値との関係を示す説明図である。
【図14】ビットデプスが3の場合の入力値と量子化値との関係を示す説明図(1)である。
【図15】ビットデプスが3の場合の入力値と量子化値との関係を示す説明図(2)である。
【発明を実施するための形態】
【0025】
(0)各実施形態に共通する考え方
後述する第1〜第5の実施形態は、エンコーダ(WZフレーム符号化装置)において、デコーダ(WZフレーム復号装置)の予測画像の精度を低負荷で推定し、固定値のビットデプスで生じるビットデプスの不足領域、つまりビットデプスを追加したときに、追加された符号が有効に活用される領域を発見し、その領域のビットデプスを追加しようとしたものである。
【0026】
(A)第1の実施形態
以下、本発明による動画像符号化装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態の動画像符号化装置は、DVCにおけるWZフレーム符号化装置である。なお、第1の実施形態に係るWZフレーム符号化装置にキーフレーム画像の符号化装置を加えたものは、DVCの動画像符号化装置となる。
【0027】
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、上述した図12との同一、対応部分には同一、対応符号を付して示している。第1の実施形態に係るWZフレーム符号化装置は、CPUと、CPUが実行するプログラムとで構築することができるが、機能的には、図1で表すことができる。
【0028】
図1において、第1の実施形態に係るWZフレーム符号化装置100Aは、変換部101と、WZ符号化部102Aと、ビットデプス決定部105とを有する。WZ符号化部102Aは、量子化部103と、SW符号化部104Aと、二次量子化部106とを有する。
【0029】
変換部101及び量子化部103は、図12で説明したものと同様である。但し、量子化部103には、基準ビットデプスBDrefが与えられるので、量子化部103は、基準ビットデプスBDrefに従って変換量P101を量子化する。また、量子化部103は、ミッドトレッド型量子化器であるとする。
【0030】
WZ符号化部102Aは、変換量P101を、基準ビットデプスBDref又はビットデプスBD103に従ってWZ符号化し、レートRT104AとWZストリームSTとを出力するものである。
【0031】
ビットデプス決定部105は、基準ビットデプスBDrefとレートRT104AとパラメータPRとから、動画像の特徴に応じて適応的に制御されたビットデプスBD103を求めるものである。
【0032】
WZ符号化部102AにおけるSW符号化部104Aは、一次動作として、量子化値P103をSW符号化したときのレートRT104Aを出力し、二次動作として、二次量子化値P106をSW符号化し、WZストリームSTを出力するものである。
【0033】
二次量子化部106は、変換量P101を、量子化値P103とビットデプスBD103とに従って量子化し、二次量子化値P106を出力するものである。
【0034】
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態に係るWZフレーム符号化装置100Aの動作を、図1に加え、図2を参照しながら説明する。図2は、WZフレーム符号化装置100Aの動作を示すフローチャートである。
【0035】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFに対して所定の変換方法による変換が適用され、変換量P101が得られる(ステップS101)。ここで、変換方法は、背景技術の項で説明したのと同様な方法である。次に、ミッドトレッド型量子化器構成の量子化部103において、基準ビットデプスBDrefに従って、変換量P101が量子化される(ステップS102)。ここまでの処理は、従来と同様である。
【0036】
次に、SW符号化部104Aにおいて、量子化値P103をSW符号化したときのレートRT104Aが求められる(ステップS103)。レートRT104Aの算出方法は、フィードバック方式や予測画像を用いる方式など、既存の算出方法を適用できる。
【0037】
さらに、ビットデプス決定部105において、動画像の特徴に応じて適応的に制御されたビットデプスBD103が求められ、WZ符号化部102Aに出力される(ステップS104)。動きや変化の小さい領域ではレートRT104Aが小さく、動きや変化の大きい領域ではレートRT104Aが大きいという仮定に基づき、ビットデプス決定部105は、適応的な制御を実施する。ビットデプスBD103を決める具体的な方法を数例挙げると、以下の通りである。なお、ビットデプス決定部105が利用するパラメータPRには、閾値が含まれ、ビットデプスBD103の決定方法によっては、オフセットデプスも含まれる。
【0038】
(1)レートRT104Aが閾値以上の場合、基準ビットデプスBDrefにパラメータPRより与えられたオフセットデプスを加えたものをビットデプスBD103として出力し、レートRT104Aが閾値未満の場合、基準ビットデプスBDrefをビットデプスBD103として出力する。
【0039】
(2)レートRT104Aが閾値以上の場合、基準ビットデプスBDrefに、レートRT104Aの大きさに応じて求められたオフセットデプスを加えたものをビットデプスBD103として出力し、レートRT104Aが閾値未満の場合、基準ビットデプスBDrefをビットデプスBD103として出力する。
【0040】
(3)レートRT104Aが閾値以上の場合、基準ビットデプスBDrefに、レートRT104Aの大きさに応じて求められたオフセットデプスとパラメータPRより与えられたオフセットデプスとを加えたものをビットデプスBD103として出力し、レートRT104Aが閾値未満の場合、基準ビットデプスBDrefをビットデプスBD103として出力する。
【0041】
ここで、レートRT104Aの大きさに応じて求められるオフセットデプスは、例えば、レートRT104Aの値に定数倍処理をすることによって求める。
【0042】
また、レートRT104Aを閾値と比較する方法として、レートRT104Aに含まれる情報の中で、「任意数個のビットプレーンのSW符号のレートの総和と閾値を比較する方法」や「任意数個のビットプレーンのSW符号のレートの総和を求めるときに、各ビットプレーンのレートに対して、ビットプレーンの位に応じた重みを乗じ、その総和と閾値を比較する方法」や「最下位ビットプレーンのSW符号のレートと閾値を比較する方法」などがある。
【0043】
ビットデプスBD103が出力されると、二次量子化部106において、ビットデプスBD103に基づいて、変換量P101が量子化され、二次量子化値P106が出力される(ステップS105)。二次量子化部106における量子化方法(二次量子化方法)を二例挙げれば、以下の通りである。
【0044】
(1)量子化値P103を表すビット列と、量子化値P103が示す量子化区間内を追加されたビット数(=ビットデプスBD103−基準ビットデプスBDref)のビットでさらに細かく量子化することで生成した追加ビットとを連結して二次量子化値P106として出力する。
【0045】
(2)量子化部103と同様に、ミッドトレッド型量子化器を用いて、変換量P101をビットデプスBD103で量子化し、その結果を、二次量子化値P106として出力する。
【0046】
但し、ビットデプスBD103と、量子化値P103を得た基準ビットデプスBDrefが同じ場合には、二次量子化部106は量子化値P103をそのまま二次量子化値P106として出力するようにしても良い。
【0047】
2つの二次量子化方法を具体例を挙げて説明する。基準ビットデプスBDrefが2であるときに、ミッドトレッド型量子化器で量子化すると、量子化区間の配置は、例えば、図13となる。ビットデプスBD103が3であるときに、第1の二次量子化方法で二次量子化を行うと、量子化値a21〜d2をそれぞれ、追加ビット数1で定まる2分割した部分のいずれかに振り分けるので、量子化区間の配置は、例えば図14となる。ビットデプスBD103が3であるときに、第2の二次量子化方法で二次量子化を行うと、量子化を最初からビットデプス3で行っているのと同様であるので、量子化区間の配置は、例えば図15になる。第2の二次量子化方法は、ビットデプスBD103に従って、再び量子化処理を行う必要があるため、第1の二次量子化方法に比べると、計算負荷が上昇する。一方、第2の二次量子化方法は、ミッドトレッド型量子化されているため、背景技術の項で説明した通り、符号化効率を高めることができる。
【0048】
最後に、SW符号化部104Aにおいて、二次量子化値P106をSW符号化し、WZストリームSTとして出力する(ステップS106)。このとき、例えば、量子化値P103と二次量子化値P106が同じ値である場合など、ステップS103のレート計算時に行っていたSW符号化と同じSW符号化を行うことになる場合には、新たなSW符号化を実行せず、ステップS103の計算結果を利用するようにしても良い。
【0049】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、SW符号のレートが大きい領域は、動きや変化が大きいという仮定に基づき、動画像の特徴に応じて、ビットデプスを適応的に制御するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0050】
ここで、ビットデプスの適応制御の有無に拘らず、計算が必要なSW符号のレートに基づきビットデプスの制御を行っているため、エンコーダの負荷が低いというWZ符号化の特徴を維持しながら、ビットデプスの適応制御を実現できる。また、例えば、動きや変化が少なくてビットデプスを増やす必要のない画像を符号化した場合、追加で必要となる処理は、レートRT104Aに基づきビットデプスを計算する処理のみであり、処理負担はごく僅か増加するに過ぎない。
【0051】
(B)第2の実施形態
次に、本発明による動画像符号化装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。第2の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0052】
(B−1)第2の実施形態の構成
図3は、第2の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、上述した図1との同一、対応部分には同一、対応符号を付して示している。
【0053】
図3において、第2の実施形態に係るWZフレーム符号化装置100Bは、変換部101と、WZ符号化部102Bと、ビットデプス決定部105Bを有する。WZ符号化部102Bは、量子化部103Bと、SW符号化部104Bと、ディレイ用メモリ部207とを有する。変換部101は、第1の実施形態のものと同様であるので、その説明は省略する。
【0054】
ビットデプス決定部105Bは、基準ビットデプスBDrefと、WZ符号化部102Bから与えられた遅延後レートRT207と、パラメータPRとから、量子化部103Bが適用するビットデプスBD105Bを決定するものである。
【0055】
WZ符号化部102Bの量子化部103Bは、変換量P101を、ビットデプスBD105Bに従ってミッドトレッド型量子化器によって量子化し、量子化値P103Bを出力するものである。
【0056】
SW符号化部104Bは、量子化値P103BをSW符号化し、WZストリームSTを出力すると共に、SW符号化の過程で得られるSW符号のレートRT104Bをディレイ用メモリ部207に与えるものである。
【0057】
ディレイ用メモリ部207は、レートRT104Bを所定のフレーム数だけ遅延させ、遅延後レートRT207としてビットデプス決定部105Bに与えるものである。
【0058】
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態に係るWZフレーム符号化装置100Bの動作を、図3に加え、図4を参照しながら説明する。図4は、WZフレーム符号化装置100Bの動作を示すフローチャートである。
【0059】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFは、所定の変換方法によって変換され、変換量P101が得られる(ステップS201)。ミッドトレッド型量子化器構成の量子化部103Bにおいて、基準ビットデプスBD105Bに従って、変換量P101が量子化される(ステップS202)。SW符号化部104Bにおいて、量子化値P103BがSW符号化され、WZストリームSTがデコーダに向けて出力されると共に、レートRT104Bが出力する(ステップS203)。
【0060】
レートRT104Bは、ディレイ用メモリ部207を介して、所定フレーム数だけ遅延されてレートRT207としてビットデプス決定部105Bに出力される(ステップS204)。そして、ビットデプス決定部105Bにおいて、動画像の特徴に応じて適応的に制御されたビットデプスBD105Bが求められ、量子化部103Bに出力される(ステップS205)。
【0061】
ビットデプス決定部105Bは、所定フレーム数だけ前のレートに基づき、ビットデブスBD105Bを決めていることになる。例えば、ディレイ用メモリ部207が、ビットデプス決定部105Bを1フレームだけ遅延させてレートRT207として出力する場合には、ビットデプス決定部105Bは、1フレーム前のレートに基づき、ビットデブスBD105Bを決めていることになる。
【0062】
ここで、ディレイ用メモリ部207は、撮影時刻の近いフレーム間において、動きや変化の大きい領域の位置は高い相関を持つという仮定に基づき加えられている。
【0063】
ビットデプスBD105Bは、第1の実施形態で説明した方法で決定される。但し、ディレイ用メモリ部207がリセットされた直後であって、所定フレーム数だけ前のレートがない場合には、基準ビットデプスBDrefがビットデプスBD105Bとして出力される。
【0064】
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、SW符号のレートが大きい領域は、動きや変化が大きいという仮定、及び、撮影時刻の近いフレーム間において、動きや変化の大きい領域の位置は高い相関を持つという仮定の下で、動画像の特徴が反映されている所定フレーム数だけ前のレートに応じて、ビットデプスを適応的に制御するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0065】
ここで、第2の実施形態によれば、ビットデプスを計算する処理以外では、レートを遅延させる処理だけが負荷を増大させる程度である。符号化効率の向上が可能なミッドトレッド型量子化器のみを用いたWZ符号化を実現できる。
【0066】
(C)第3の実施形態
次に、本発明による動画像符号化装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。第3の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0067】
(C−1)第3の実施形態の構成
図5は、第3の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、第2の実施形態に係る図3との同一、対応部分には同一、対応符号を付して示している。
【0068】
図5及び図3の比較から明らかなように、第3の実施形態に係るWZフレーム符号化装置100Cは、第2の実施形態の構成に加えて、ビットデプス再決定部308を有する。
【0069】
ビットデプス再決定部308は、ビットデプス決定部105Bから出力されたビットデプスBD105Bを基に、物体が動くことも考慮したビットデプスBD308を再計算し、再計算後のビットデブスBD308を量子化部103Bに出力するものである。なお、ビットデプス決定部105B及びビットデプス再決定部308とで、ビットデプス決定部が構成されていると見ることができる。
【0070】
ビットデプス再決定部308以外の各部の機能は、第2の実施形態と同様であるので、その説明は省略する。
【0071】
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態に係るWZフレーム符号化装置100Cの動作を、図5に加え、図6を参照しながら説明する。図6は、WZフレーム符号化装置100Cの動作を示すフローチャートであり、第2の実施形態に係る図4との同一、対応ステップには同一、対応符号を付して示している。
【0072】
ステップS201〜S205の処理は、第2の実施形態と同様である。但し、ステップS202において、量子化部103Bが参照するビットデプスが、ビットデプス再決定部308が再決定したビットデプスBD308である点や、ステップS205において、ビットデプス決定部105Bによって求められたビットデプスBD105Bが量子化部103Bではなくビットデプス再決定部308に与えられる点が、第2の実施形態と異なっている。
【0073】
ビットデプス決定部105BによってビットデプスBD105Bが決定されると、ビットデプス再決定部308において、ビットデプスBD105Bを基に、物体が動くことも考慮したビットデプスを再計算し、ビットデプスBD308を量子化部103Bに出力する(ステップS306)。
【0074】
物体が動くことも考慮したビットデプスの再計算方法として、例えば、「ビットデブスBD103Bを参照し、ビットデプスの高い領域の近傍に、ビットデプスの低い領域が存在している場合、当該ビットデプスの低い領域のビットデプスを、当該ビットデプスの高い領域のビットデブスと同じ値にする」という方法を挙げることができる。
【0075】
この方法に従った再決定の様子を図7に示している。図7(A)は、再決定前のビットデプスBD105Bを示しており、ある1つの領域AR4のビットデプスだけが「3」で他の領域AR1〜AR3、AR5〜AR9のビットデプスが「2」である。「近傍」を接していることとすると、ビットデプスが「3」の領域AR4に接している領域は領域AR2、AR3、AR5、AR6であるので、図7(B)に示すように、これら領域AR2、AR3、AR5、AR6のビットデプスが「2」から「3」に変更される。
【0076】
(C−3)第3の実施形態の効果
第3の実施形態によっても、第2の実施形態と同様な効果を奏することができる。さらに、第3の実施形態によれば、物体の動きを考慮してビットデプスを再決定するので、撮影時刻の近いフレーム間において、動きや変化の大きい領域の位置が等しくなかった場合でも、動きや変化の大きい領域のビットデプスを大きくできる可能性を高めることでき、
デコーダでの復号エラーを一段と抑えることが期待できる。
【0077】
(D)第4の実施形態
次に、本発明による動画像符号化装置及びプログラムの第4の実施形態を、図面を参照しながら説明する。第4の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0078】
(D−1)第4の実施形態の構成
図8は、第4の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0079】
図8及び図1の比較から明らかなように、第4の実施形態に係るWZフレーム符号化装置100Dは、第1の実施形態の構成に加えて、パラメータ制御部409を有する。
【0080】
パラメータ制御部409は、目標レートTGRTとWZ符号化部102Aから出力されたレートRT102AとからパラメータPR409を求めて、ビットデプス決定部105に与えるものである。
【0081】
WZ符号化部102Aは、第1の実施形態と同様なものであるが、動作段階に応じて、使用するビットデプスが変化したり、出力が変化したりする。WZ符号化部102Aは、基準ビットデプスBDrefを用いて変換量P101をWZ符号化し、そのときのレートをレートRT102Aとして出力する一次動作と、ビットデプス決定部105からのビットデプスBD105を用いて変換量P101をWZ符号化し、そのときのレートをレートRT102Aとして出力する二次動作と、ビットデプス決定部105からの収束したビットデプスBD105を用いて変換量P101をWZ符号化し、WZストリームSTを出力する三次動作とを実行するものであり、ビットデプスBD105が収束するまで二次動作を繰り返すものである。
【0082】
(D−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態に係るWZフレーム符号化装置100Dの動作を、図8に加え、図9を参照しながら説明する。図9は、WZフレーム符号化装置100Dの動作を示すフローチャートである。
【0083】
まず、パラメータ制御部409において、内部に有するオフセットビットデプスや閾値が、初期値(ゼロ以上の値)に初期化される(ステップS401)。
【0084】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFに対して所定の変換方法による変換が適用され、変換量P101が得られる(ステップS402)。
【0085】
WZ符号化部102Aにおいて、基準ビットデプスBDrefを用いて変換量P101がWZ符号化され、そのときのレートがレートRT102Aとして出力される(ステップS403)。レートの算出方法は、第1の実施形態と同様である。
【0086】
パラメータ制御部409において、レートRT102Aと目標レートTGRTとが比較され、レートRT102Aが目標レートTGRTに近づくようにバラメータが制御され、制御後のパラメータPR409がビットデプス決定部105に出力される(ステップS404)。
【0087】
パラメータPR409の制御方法としては、以下に例示するような方法を挙げることができる。
【0088】
(1)バラメータPR409がオフセットビットデプスと閾値とから構成される場合、レートRT102Aと目標レートTGRTとを比較して、レートRT102Aが目標レートTGRTよりも低い場合、閾値がゼロより大きいときは閾値を所定量(閾値についての所定量)だけ減少し、閾値がゼロ以下のときは、オフセットビットデプスの値を所定量(オフセットビットデプスについての所定量)だけ増やすと共に閾値を初期値に戻す。
【0089】
(2)パラメータPR409が閾値から構成される場合、レートRT102Aと目標レートTGRTとを比較して、レートRT102Aが目標レートTGRTよりも低い場合には、閾値を所定量だけ減少させる。
【0090】
パラメータPR409が更新(制御)されると、ビットデプス決定部105において、動画像の特徴に応じて適応的に制御されたビットデプスBD105が求められ、WZ符号化部102Aに出力される(ステップS405)。この際のビットデプスBD105の決定方法は、第1の実施形態と同様である。但し、固定パラメータPRではなく、制御されたパラメータPR409を用いてビットデプスBD105を計算しており、この点は、第1の実施形態と異なっている。
【0091】
ビットデプス決定部105若しくはWZ符号化部102Aにおいて、ビットデプスBD105が収束したと捉えて良いか否かが判別される(ステップS406)。例えば、前回決定されたビットデプスBD105(基準ビットデプスのこともあり得る)と今回決定されたビットデプスBD105とが全ての領域について同じ値の場合、若しくは、異なる領域数が所定数以下で、相違領域におけるビットデプスの差も所定値以内の場合に収束したと判別する。
【0092】
収束していない場合には、WZ符号化部102Aにおいて、ビットデプスBD105を用いてWZ符号化され、そのときのレートがレートRT102Aとして出力され(ステップS407)、上述したステップS404の処理に戻る。この際のレートの算出方法も、第1の実施形態と同様である。なお、この第4の実施形態だけでなく、レートの再計算を要する実施形態においては、WZ符号化部内のSW符号化部が、計算で得られたレートと、その計算に用いたビット列を保持しておき、同じビット列のレートを計算するときは保持されているレートを利用するようにしても良い。すなわち、他の領域が繰り返しのトリガになっていても、収束した領域もあり、このような領域については、過去の計数レートを利用するようにしても良い。
【0093】
収束した場合には、WZ符号化部102Aにおいて、収束したビットデプスBD105を用いて変換量P101がWZ符号化され、その結果がWZストリームSTとして出力される(ステップS408)。
【0094】
(D−3)第4の実施形態の効果
以上のように、第4の実施形態によれば、目標レートに近付くように、ビットデプスの決定に必要なパラメータを自動で制御した上で、ビットデプスを決定するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0095】
ここで、動画像の場合、時刻によって適切なパラメータは変化していくため、パラメータの制御機能を備えない場合には、「想定しているよりも大きなレートを必要とするフレームが発生し得る」が、第4の実施形態では、このような不都合を回避することができる。
【0096】
(E)第5の実施形態
次に、本発明による動画像符号化装置及びプログラムの第5の実施形態を、図面を参照しながら説明する。第5の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0097】
(E−1)第5の実施形態の構成
図10は、第5の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、第3の実施形態に係る図5との同一、対応部分には同一、対応符号を付して示している。
【0098】
図10及び図5の比較から明らかなように、第5の実施形態に係るWZフレーム符号化装置100Eは、第3の実施形態の構成に加えて、パラメータ制御部409Eを有する。パラメータ制御部409Eは、パラメータを制御するという機能面は第4の実施形態と同様であるが、後述する動作の項の説明で明らかにするように、具体的な制御方法は、第4の実施形態のものと多少異なっている。
【0099】
なお、第5の実施形態に係るWZフレーム符号化装置100Eは、第3の実施形態の技術的特徴と第4の実施形態の技術的特徴とを組み合わせたものであるが、第2の実施形態の技術的特徴と第4の実施形態の技術的特徴とを組み合わせて、WZフレーム符号化装置を構築しても良いことは勿論である。
【0100】
この第5の実施形態の場合、WZ符号化部102Bが、ディレイ用メモリ部207を内蔵していることやビットデプス再決定部308を備えていることに鑑み、ビットデプス決定部105からのビットデプスBD105が収束するまで繰り返し処理することを実行しない。
【0101】
(E−2)第5の実施形態の動作
次に、以上のような構成を有する第5の実施形態に係るWZフレーム符号化装置100Eの動作を、図10に加え、図11を参照しながら説明する。図11は、WZフレーム符号化装置100Eの動作を示すフローチャートである。
【0102】
まず、パラメータ制御部409Eにおいて、内部に有するオフセットビットデプスや閾値が、初期値(ゼロ以上の値)に初期化される(ステップS501)。
【0103】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFに対して所定の変換方法による変換が適用され、変換量P101が得られる(ステップS502)。
【0104】
WZ符号化部102Bにおいて、ビットデプス決定部103が決定し、それをビットデプス再決定部308が再決定した後のビットデプスBD308が用いられて、変換量P101がWZ符号化され、WZストリームSTが出力されると共に、遅延後のレートRT207がパラメータ制御部409Eに出力される(ステップS503)。このステップS503の処理は、第3の実施形態の処理と同様である。
【0105】
パラメータ制御部409Eにおいて、レートRT207と目標レートTGRTとが比較され、レートRT207が目標レートTGRTに近付くようにパラメータPR409Eが制御され、そのパラメータPR409Eがビットデプス決定部103に出力される(ステップS504)。
【0106】
パラメータPR409Eの制御方法としては、以下に例示する方法を挙げることができる。繰り返し処理を実行しないことを考慮し、第4の実施形態の制御方法とは多少異なっている。
【0107】
(1)第1の制御方法は、パラメータPR409Eがオフセットビットデプスと閾値とから構成される場合に適用される方法であり、まず、レートRT207と目標レートTDRTとを比較する。レートRT207が目標レートRT207よりも低い場合であって、閾値がゼロより大きいときは閾値を所定量だけ減少させ、閾値がゼロ以下のときは、オフセットビットデプスの値を所定量だけ増やすと共に閾値を初期値に戻す。一方、レートRT207が目標レートTGRTよりも高い場合であって、閾値が初期値未満のときは閾値を所定量だけ増加させ、閾値が初期値以上のときは、オフセットビットデプスをゼロ又はゼロ以上の所定値に設定し、閾値を初期値又はゼロ以上の所定値に設定する。
【0108】
(2)第2の制御方法は、パラメータPR09が閾値から構成される場合に適用される方法であり、まず、レートRT207と目標レートTGRTとを比較する。レートRT207が目標レートTGRTよりも低い場合には、閾値を所定量だけ小さくする。一方、レートRT207が目標レートTGRTよりも高い場合であって、閾値が初期値未満のときに、閾値を所定量だけ大きくする。
【0109】
パラメータPR409Eの制御後、ビットデプス決定部103において、動画像の特徴に応じて適応的に制御されたビットデプスBD103が求められ、ビットデプス再決定部308において、ビットデプスBD103に基づいて、ビットデプスが再決定され、得られたビットデプスBD308がWZ符号化部102Bに出力される(ステップS505)。ビットデプス決定部103やビットデプス再決定部308の決定方法は、第3の実施形態と同様である。ビットデプス決定部103について言えば、固定パラメータPRではなく、制御されたパラメータPR409Eを用いてビットデプスを計算する点が、第3の実施形態と異なっている。
【0110】
(E−3)第5の実施形態の効果
以上のように、第5の実施形態によれば、目標レートに近付くように、ビットデプスの決定に必要なパラメータを自動で制御した上で、ビットデプスを決定するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0111】
ここで、動画像の場合、時刻によって適切なパラメータは変化していくため、パラメータの制御機能を備えない場合には、「想定しているよりも大きなレートを必要とするフレームが発生し得る」が、第5の実施形態では、このような不都合を回避することができる。
【0112】
(F)他の実施形態
上記各実施形態においては、WZ符号のレートの高さに応じて基準ビットデプスよりビットデプスを増やす場合を説明したが、当初に適用される基準ビットデプスを大き目に設定しておき、レートの低さに応じてビットデプスを減らすようにしても良い。この場合、ビットデプス決定部は、基準ビットデプスBDrefにオフセットビットデプスやレートの大きさに応じて求められるオフセットを加えるのではなく、基準ビットデプスからオフセットビットデプスやレートの大きさに応じて求められるオフセットを減らすことで、ビットデプス決定部から出力するビットデプスを計算することとなる。
【0113】
さらに、ビットデプスの制御は、増大方向への制御や、減少方向への制御だけでなく、増減制御であっても良い。
【0114】
上記各実施形態の動画像符号化装置であるWZフレーム符号化装置は、例えば、チップ化されたり、専用プログラムとして構築されたりして取引されるものであっても良く、また、キーフレームの符号化装置と同じチップに搭載されたり、キーフレームの符号化装置に係るプログラムと共にアプリケーションとして取引されたりしても良い。すなわち、DVC方式に従う動画像符号化装置の一部として、上記各実施形態の動画像符号化装置が盛り込まれていても良い。
【符号の説明】
【0115】
100A〜100E…WZフレーム符号化装置、101…変換部、102A、102B…WZ符号化部、103、103B…量子化部、104A、104B…SW符号化部、105、105B…ビットデプス決定部、106…二次量子化部、207…ディレイ用メモリ部、308…ビットデプス再決定部、409、409E…パラメータ制御部。
【技術分野】
【0001】
本発明は動画像符号化装置及びプログラムに関し、例えば、Slepian−Wolfの定理及びWyner−Zivの定理に基づき動画像を符号化する場合に適用し得るものである。
【背景技術】
【0002】
動画像符号化技術として、Slepian−Wolfの定理及びWyner−Zivの定理に基づき構築されたDVC(Distributed Video Coding)がある(特許文献1参照)。
【0003】
H.264/AVCをはじめとする一般的な動画像符号化技術と比較したときに、DVCのもっとも大きな特徴は、DVCのエンコーダが動き推定を伴った予測画像の生成処理を持たないことである。代わりに、予測画像の生成処理はデコーダが担っている。DVCの符号化は、原画像のWyner−Ziv符号(量子化器と誤り訂正符号の組み合わせを利用することが多い)を生成することによって行われ、復号は、予測画像に含まれる誤差をWyner−Ziv符号によって訂正することで行われる。以上の構成から、DVCは、「エンコーダ(符号化装置)が低負荷で、デコーダ(復号装置)が高負荷になる」という、従来方式とは正反対の性質を持つ。
【0004】
まず、図12を用いて、DVCにおけるWZフレーム画像(非キーフレーム画像)の符号化装置(WZフレーム符号化装置)を説明する。WZフレーム符号化装置にキーフレーム画像の符号化装置を加えたものが、DVCの動画像符号化装置となる。
【0005】
WZフレーム符号化装置100は、変換部101とWZ符号化部102とを有する。WZ符号化部602は、量子化部103とSW符号化部104とを有する。
【0006】
WZフレーム画像WZFは変換部101に与えられ、変換部101は、WZフレーム画像WZFに対して少なくとも相関除去処理を含む所定の変換処理を行い、得られた変換量P101がWZ符号化部102に与えられる。所定の変換処理は、例えば、フレーム間差分処理、動き補償予測画像との差分処理、又は、直交変換処理(離散コサイン変換など)などのような相関除去処理を少なくとも1つは含む処理である。例えば、フレーム間差分処理後に離散コサイン変換を行うものであっても良い。
【0007】
WZ符号化部102は、変換量P101を外部から設定されたビットデプス(量子化ビット数)BDに従ってWyner−Ziv符号化(以下、WZ符号化と呼ぶ)し、WZストリームSTを出力する。より具体的に言うと、量子化部103が、変換量P101をビットデプスBPに従って量子化し、SW符号化部104が、得られた量子化値P103を、誤り訂正符号などに符号化することによって、Slepian−Wolf符号化(以下、SW符号化と呼ぶ)し、WZストリームSTを出力する。
【0008】
量子化部103は、量子化値P103のビットデプスが外部から設定されたビットデプスBPになるように、変換量P101の量子化を行う。
【0009】
例えば、ビットデプスBPに2が設定された場合には、量子化値P103は4通りの値をとることができるので、図13のように変換量のダイナミックレンジ内を4分割し、それぞれの区間に2ビットの量子化値a2、b2、c2、d2を割り当てる。また例えば、ビットデプスBPに3が設定された場合には、量子化値P103は8通りの値をとることができるので、図14や図15のように変換量のダイナミックレンジ内を8分割し、それぞれの区間に3ビットの量子化値a3、b3、c3、d3、e3、f3、g3、h3を割り当てる。
【0010】
従来では、量子化に、ミッドトレッド型量子化器を適用していた。ミッドトレッド型量子化器は、変換量P101がゼロ近傍の値のときに、同じ量子化値に量子化する量子化器である。図13や図15は、ミッドトレッド型量子化器の例である。例えば、図13の場合、ゼロ近傍の変換量P101は値b2に量子化され、図15の場合、ゼロ近傍の変換量P101は値d3に量子化される。
【0011】
一方、ミッドトレッド型量子化器を適用しなければ、ゼロよりわずかに小さいマイナスの値とゼロよりわずかに大きいプラスの値とが異なる値に量子化される。図14は、ミッドトレッド型ではない量子化器の例であり、ゼロよりわずかに小さいマイナスの値は量子化値c3に変換され、ゼロよりわずかに大きいプラスのちは量子化値dに変換される。
【0012】
相関除去されている変換量P101は、ゼロを中心にして分散した値をとることが知られているので、原画像の変換量がゼロよりわずかに大きいプラスの値をとり、予測画像の変換量がゼロよりわずかに小さいマイナスの値をとる状況は十分発生し得る。相関除去して直交変換を行っている場合には、特に交流成分の分布はゼロを中心に分散したものとなる。ミッドトレッド型量子化器を適用している場合、原画像や予測画像がゼロを中心に分散する状況でも、原画像や予測画像の量子化値は共に同じ値に量子化され、符号量の増大は回避される。
【0013】
なお、ミッドトレッド型量子化器を用いて一様量子化したい場合、量子化値は奇数個の区間を表す値を必要とするので、上記の例のように量子化値P103が偶数個の値しか表現できない場合は、どこかの区間が非一様になることを認めなければならない。図13の例では、区間c2と区間d2の量子化ステップが、その他の区間の量子化ステップの半分になることを認めており、図15の例では、区間g3と区間h3の量子化ステップが、その他の区間の量子化ステップの半分になることを認めている。
【0014】
SW符号化部104では、量子化値P103をSW符号化する。LDPC符号やターボ符号などの誤り訂正符号がSW符号として採用されることが多い。SW符号化部104では、量子化値P103を、周波数帯域ごとに分離し(但し、変換部101が直交変換処理を実行していることを要する)、周波数帯域ごとにビットプレーンを生成し、ビットプレーンを誤り訂正符号化できるサイズに分割して、それぞれを誤り訂正符号化する。結果として、フレームが幾つかの領域に分割され、領域ごとの誤り訂正符号が生成されたことになる。
【0015】
なお、SW符号化部104は、デコーダが生成する予測画像の誤り率に応じて、領域ごとの誤り訂正符号ごとに、適切な誤り訂正符号のレート(符号量)を設定する必要がある。適切なレートを推定する方法には、デコーダからのフィードバックを利用する方式やエンコーダで予測画像を生成する方式などがあるが、本発明は、レート推定方法がいずれかに限定されるものではないので、その説明は省略する。
【先行技術文献】
【特許文献】
【0016】
【特許文献1】特開2009−141688号公報
【発明の概要】
【発明が解決しようとする課題】
【0017】
しかしながら、ビットデプスを一定値に固定して符号化した場合、動きや変化の小さい領域では復号エラーが小さくなるが、動きや変化の大きい領域では復号エラーが大きくなるという問題が発生する。
【0018】
かかる不都合を解決するため、あらかじめビットデプスを大きな値にすることも考えられるが、この場合には、動きや変化の小さい領域(もともと復号エラーが小さく、さらに復号エラーを抑えても、画質に与える影響が少ない領域)のレートが増える。又は、動画像符号化技術で一般的に利用されている動きベクトル検出によって、動きや変化を検出し、動きや変化の大きい領域ではビットデプスを大きくすることも考えられるが、この場合には、SW符号化部104の処理負担が大きくなる。
【0019】
そのため、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、レートや処理負担をさほど増加させることなく、両領域とも復号エラーを抑えることができる動画像符号化装置及びプログラムが望まれている。
【課題を解決するための手段】
【0020】
第1の本発明は、入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段とを備える動画像符号化装置において、対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段を有することを特徴とする。
【0021】
第2の本発明の動画像符号化プログラムは、動画像符号化装置に搭載されるコンピュータを、(1)入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、(2)上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段と、(3)対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段として機能させることを特徴とする。
【0022】
第3の本発明は、キーフレーム画像をフレーム内符号化方式で符号化する第1の動画像符号化装置部と、非キーフレーム画像を符号化する第2の動画像符号化装置部とを有する動画像符号化装置において、上記第2の動画像符号化装置部として、第1の本発明の動画像符号化装置を適用したことを特徴とする。
【発明の効果】
【0023】
本発明の動画像符号化装置及びプログラムによれば、動きや変化の小さい領域か動きや変化の大きい領域かをレートの値で推測し、量子化でのビットデプスを領域毎に決定するようにしたので、処理負担をさほど増加させることなく、対向装置での復号エラーを抑えることができる。
【図面の簡単な説明】
【0024】
【図1】第1の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図2】第1の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図3】第2の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図4】第2の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図5】第3の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図6】第3の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図7】第3の実施形態におけるビットデプス再決定方法の説明図である。
【図8】第4の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図9】第4の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図10】第5の実施形態に係るWZフレーム符号化装置の構成を示すブロック図である。
【図11】第5の実施形態に係るWZフレーム符号化装置の動作を示すフローチャートである。
【図12】従来のWZフレーム符号化装置の構成を示すブロック図である。
【図13】ビットデプスが2の場合の入力値と量子化値との関係を示す説明図である。
【図14】ビットデプスが3の場合の入力値と量子化値との関係を示す説明図(1)である。
【図15】ビットデプスが3の場合の入力値と量子化値との関係を示す説明図(2)である。
【発明を実施するための形態】
【0025】
(0)各実施形態に共通する考え方
後述する第1〜第5の実施形態は、エンコーダ(WZフレーム符号化装置)において、デコーダ(WZフレーム復号装置)の予測画像の精度を低負荷で推定し、固定値のビットデプスで生じるビットデプスの不足領域、つまりビットデプスを追加したときに、追加された符号が有効に活用される領域を発見し、その領域のビットデプスを追加しようとしたものである。
【0026】
(A)第1の実施形態
以下、本発明による動画像符号化装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。第1の実施形態の動画像符号化装置は、DVCにおけるWZフレーム符号化装置である。なお、第1の実施形態に係るWZフレーム符号化装置にキーフレーム画像の符号化装置を加えたものは、DVCの動画像符号化装置となる。
【0027】
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、上述した図12との同一、対応部分には同一、対応符号を付して示している。第1の実施形態に係るWZフレーム符号化装置は、CPUと、CPUが実行するプログラムとで構築することができるが、機能的には、図1で表すことができる。
【0028】
図1において、第1の実施形態に係るWZフレーム符号化装置100Aは、変換部101と、WZ符号化部102Aと、ビットデプス決定部105とを有する。WZ符号化部102Aは、量子化部103と、SW符号化部104Aと、二次量子化部106とを有する。
【0029】
変換部101及び量子化部103は、図12で説明したものと同様である。但し、量子化部103には、基準ビットデプスBDrefが与えられるので、量子化部103は、基準ビットデプスBDrefに従って変換量P101を量子化する。また、量子化部103は、ミッドトレッド型量子化器であるとする。
【0030】
WZ符号化部102Aは、変換量P101を、基準ビットデプスBDref又はビットデプスBD103に従ってWZ符号化し、レートRT104AとWZストリームSTとを出力するものである。
【0031】
ビットデプス決定部105は、基準ビットデプスBDrefとレートRT104AとパラメータPRとから、動画像の特徴に応じて適応的に制御されたビットデプスBD103を求めるものである。
【0032】
WZ符号化部102AにおけるSW符号化部104Aは、一次動作として、量子化値P103をSW符号化したときのレートRT104Aを出力し、二次動作として、二次量子化値P106をSW符号化し、WZストリームSTを出力するものである。
【0033】
二次量子化部106は、変換量P101を、量子化値P103とビットデプスBD103とに従って量子化し、二次量子化値P106を出力するものである。
【0034】
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態に係るWZフレーム符号化装置100Aの動作を、図1に加え、図2を参照しながら説明する。図2は、WZフレーム符号化装置100Aの動作を示すフローチャートである。
【0035】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFに対して所定の変換方法による変換が適用され、変換量P101が得られる(ステップS101)。ここで、変換方法は、背景技術の項で説明したのと同様な方法である。次に、ミッドトレッド型量子化器構成の量子化部103において、基準ビットデプスBDrefに従って、変換量P101が量子化される(ステップS102)。ここまでの処理は、従来と同様である。
【0036】
次に、SW符号化部104Aにおいて、量子化値P103をSW符号化したときのレートRT104Aが求められる(ステップS103)。レートRT104Aの算出方法は、フィードバック方式や予測画像を用いる方式など、既存の算出方法を適用できる。
【0037】
さらに、ビットデプス決定部105において、動画像の特徴に応じて適応的に制御されたビットデプスBD103が求められ、WZ符号化部102Aに出力される(ステップS104)。動きや変化の小さい領域ではレートRT104Aが小さく、動きや変化の大きい領域ではレートRT104Aが大きいという仮定に基づき、ビットデプス決定部105は、適応的な制御を実施する。ビットデプスBD103を決める具体的な方法を数例挙げると、以下の通りである。なお、ビットデプス決定部105が利用するパラメータPRには、閾値が含まれ、ビットデプスBD103の決定方法によっては、オフセットデプスも含まれる。
【0038】
(1)レートRT104Aが閾値以上の場合、基準ビットデプスBDrefにパラメータPRより与えられたオフセットデプスを加えたものをビットデプスBD103として出力し、レートRT104Aが閾値未満の場合、基準ビットデプスBDrefをビットデプスBD103として出力する。
【0039】
(2)レートRT104Aが閾値以上の場合、基準ビットデプスBDrefに、レートRT104Aの大きさに応じて求められたオフセットデプスを加えたものをビットデプスBD103として出力し、レートRT104Aが閾値未満の場合、基準ビットデプスBDrefをビットデプスBD103として出力する。
【0040】
(3)レートRT104Aが閾値以上の場合、基準ビットデプスBDrefに、レートRT104Aの大きさに応じて求められたオフセットデプスとパラメータPRより与えられたオフセットデプスとを加えたものをビットデプスBD103として出力し、レートRT104Aが閾値未満の場合、基準ビットデプスBDrefをビットデプスBD103として出力する。
【0041】
ここで、レートRT104Aの大きさに応じて求められるオフセットデプスは、例えば、レートRT104Aの値に定数倍処理をすることによって求める。
【0042】
また、レートRT104Aを閾値と比較する方法として、レートRT104Aに含まれる情報の中で、「任意数個のビットプレーンのSW符号のレートの総和と閾値を比較する方法」や「任意数個のビットプレーンのSW符号のレートの総和を求めるときに、各ビットプレーンのレートに対して、ビットプレーンの位に応じた重みを乗じ、その総和と閾値を比較する方法」や「最下位ビットプレーンのSW符号のレートと閾値を比較する方法」などがある。
【0043】
ビットデプスBD103が出力されると、二次量子化部106において、ビットデプスBD103に基づいて、変換量P101が量子化され、二次量子化値P106が出力される(ステップS105)。二次量子化部106における量子化方法(二次量子化方法)を二例挙げれば、以下の通りである。
【0044】
(1)量子化値P103を表すビット列と、量子化値P103が示す量子化区間内を追加されたビット数(=ビットデプスBD103−基準ビットデプスBDref)のビットでさらに細かく量子化することで生成した追加ビットとを連結して二次量子化値P106として出力する。
【0045】
(2)量子化部103と同様に、ミッドトレッド型量子化器を用いて、変換量P101をビットデプスBD103で量子化し、その結果を、二次量子化値P106として出力する。
【0046】
但し、ビットデプスBD103と、量子化値P103を得た基準ビットデプスBDrefが同じ場合には、二次量子化部106は量子化値P103をそのまま二次量子化値P106として出力するようにしても良い。
【0047】
2つの二次量子化方法を具体例を挙げて説明する。基準ビットデプスBDrefが2であるときに、ミッドトレッド型量子化器で量子化すると、量子化区間の配置は、例えば、図13となる。ビットデプスBD103が3であるときに、第1の二次量子化方法で二次量子化を行うと、量子化値a21〜d2をそれぞれ、追加ビット数1で定まる2分割した部分のいずれかに振り分けるので、量子化区間の配置は、例えば図14となる。ビットデプスBD103が3であるときに、第2の二次量子化方法で二次量子化を行うと、量子化を最初からビットデプス3で行っているのと同様であるので、量子化区間の配置は、例えば図15になる。第2の二次量子化方法は、ビットデプスBD103に従って、再び量子化処理を行う必要があるため、第1の二次量子化方法に比べると、計算負荷が上昇する。一方、第2の二次量子化方法は、ミッドトレッド型量子化されているため、背景技術の項で説明した通り、符号化効率を高めることができる。
【0048】
最後に、SW符号化部104Aにおいて、二次量子化値P106をSW符号化し、WZストリームSTとして出力する(ステップS106)。このとき、例えば、量子化値P103と二次量子化値P106が同じ値である場合など、ステップS103のレート計算時に行っていたSW符号化と同じSW符号化を行うことになる場合には、新たなSW符号化を実行せず、ステップS103の計算結果を利用するようにしても良い。
【0049】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、SW符号のレートが大きい領域は、動きや変化が大きいという仮定に基づき、動画像の特徴に応じて、ビットデプスを適応的に制御するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0050】
ここで、ビットデプスの適応制御の有無に拘らず、計算が必要なSW符号のレートに基づきビットデプスの制御を行っているため、エンコーダの負荷が低いというWZ符号化の特徴を維持しながら、ビットデプスの適応制御を実現できる。また、例えば、動きや変化が少なくてビットデプスを増やす必要のない画像を符号化した場合、追加で必要となる処理は、レートRT104Aに基づきビットデプスを計算する処理のみであり、処理負担はごく僅か増加するに過ぎない。
【0051】
(B)第2の実施形態
次に、本発明による動画像符号化装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。第2の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0052】
(B−1)第2の実施形態の構成
図3は、第2の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、上述した図1との同一、対応部分には同一、対応符号を付して示している。
【0053】
図3において、第2の実施形態に係るWZフレーム符号化装置100Bは、変換部101と、WZ符号化部102Bと、ビットデプス決定部105Bを有する。WZ符号化部102Bは、量子化部103Bと、SW符号化部104Bと、ディレイ用メモリ部207とを有する。変換部101は、第1の実施形態のものと同様であるので、その説明は省略する。
【0054】
ビットデプス決定部105Bは、基準ビットデプスBDrefと、WZ符号化部102Bから与えられた遅延後レートRT207と、パラメータPRとから、量子化部103Bが適用するビットデプスBD105Bを決定するものである。
【0055】
WZ符号化部102Bの量子化部103Bは、変換量P101を、ビットデプスBD105Bに従ってミッドトレッド型量子化器によって量子化し、量子化値P103Bを出力するものである。
【0056】
SW符号化部104Bは、量子化値P103BをSW符号化し、WZストリームSTを出力すると共に、SW符号化の過程で得られるSW符号のレートRT104Bをディレイ用メモリ部207に与えるものである。
【0057】
ディレイ用メモリ部207は、レートRT104Bを所定のフレーム数だけ遅延させ、遅延後レートRT207としてビットデプス決定部105Bに与えるものである。
【0058】
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態に係るWZフレーム符号化装置100Bの動作を、図3に加え、図4を参照しながら説明する。図4は、WZフレーム符号化装置100Bの動作を示すフローチャートである。
【0059】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFは、所定の変換方法によって変換され、変換量P101が得られる(ステップS201)。ミッドトレッド型量子化器構成の量子化部103Bにおいて、基準ビットデプスBD105Bに従って、変換量P101が量子化される(ステップS202)。SW符号化部104Bにおいて、量子化値P103BがSW符号化され、WZストリームSTがデコーダに向けて出力されると共に、レートRT104Bが出力する(ステップS203)。
【0060】
レートRT104Bは、ディレイ用メモリ部207を介して、所定フレーム数だけ遅延されてレートRT207としてビットデプス決定部105Bに出力される(ステップS204)。そして、ビットデプス決定部105Bにおいて、動画像の特徴に応じて適応的に制御されたビットデプスBD105Bが求められ、量子化部103Bに出力される(ステップS205)。
【0061】
ビットデプス決定部105Bは、所定フレーム数だけ前のレートに基づき、ビットデブスBD105Bを決めていることになる。例えば、ディレイ用メモリ部207が、ビットデプス決定部105Bを1フレームだけ遅延させてレートRT207として出力する場合には、ビットデプス決定部105Bは、1フレーム前のレートに基づき、ビットデブスBD105Bを決めていることになる。
【0062】
ここで、ディレイ用メモリ部207は、撮影時刻の近いフレーム間において、動きや変化の大きい領域の位置は高い相関を持つという仮定に基づき加えられている。
【0063】
ビットデプスBD105Bは、第1の実施形態で説明した方法で決定される。但し、ディレイ用メモリ部207がリセットされた直後であって、所定フレーム数だけ前のレートがない場合には、基準ビットデプスBDrefがビットデプスBD105Bとして出力される。
【0064】
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、SW符号のレートが大きい領域は、動きや変化が大きいという仮定、及び、撮影時刻の近いフレーム間において、動きや変化の大きい領域の位置は高い相関を持つという仮定の下で、動画像の特徴が反映されている所定フレーム数だけ前のレートに応じて、ビットデプスを適応的に制御するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0065】
ここで、第2の実施形態によれば、ビットデプスを計算する処理以外では、レートを遅延させる処理だけが負荷を増大させる程度である。符号化効率の向上が可能なミッドトレッド型量子化器のみを用いたWZ符号化を実現できる。
【0066】
(C)第3の実施形態
次に、本発明による動画像符号化装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。第3の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0067】
(C−1)第3の実施形態の構成
図5は、第3の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、第2の実施形態に係る図3との同一、対応部分には同一、対応符号を付して示している。
【0068】
図5及び図3の比較から明らかなように、第3の実施形態に係るWZフレーム符号化装置100Cは、第2の実施形態の構成に加えて、ビットデプス再決定部308を有する。
【0069】
ビットデプス再決定部308は、ビットデプス決定部105Bから出力されたビットデプスBD105Bを基に、物体が動くことも考慮したビットデプスBD308を再計算し、再計算後のビットデブスBD308を量子化部103Bに出力するものである。なお、ビットデプス決定部105B及びビットデプス再決定部308とで、ビットデプス決定部が構成されていると見ることができる。
【0070】
ビットデプス再決定部308以外の各部の機能は、第2の実施形態と同様であるので、その説明は省略する。
【0071】
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態に係るWZフレーム符号化装置100Cの動作を、図5に加え、図6を参照しながら説明する。図6は、WZフレーム符号化装置100Cの動作を示すフローチャートであり、第2の実施形態に係る図4との同一、対応ステップには同一、対応符号を付して示している。
【0072】
ステップS201〜S205の処理は、第2の実施形態と同様である。但し、ステップS202において、量子化部103Bが参照するビットデプスが、ビットデプス再決定部308が再決定したビットデプスBD308である点や、ステップS205において、ビットデプス決定部105Bによって求められたビットデプスBD105Bが量子化部103Bではなくビットデプス再決定部308に与えられる点が、第2の実施形態と異なっている。
【0073】
ビットデプス決定部105BによってビットデプスBD105Bが決定されると、ビットデプス再決定部308において、ビットデプスBD105Bを基に、物体が動くことも考慮したビットデプスを再計算し、ビットデプスBD308を量子化部103Bに出力する(ステップS306)。
【0074】
物体が動くことも考慮したビットデプスの再計算方法として、例えば、「ビットデブスBD103Bを参照し、ビットデプスの高い領域の近傍に、ビットデプスの低い領域が存在している場合、当該ビットデプスの低い領域のビットデプスを、当該ビットデプスの高い領域のビットデブスと同じ値にする」という方法を挙げることができる。
【0075】
この方法に従った再決定の様子を図7に示している。図7(A)は、再決定前のビットデプスBD105Bを示しており、ある1つの領域AR4のビットデプスだけが「3」で他の領域AR1〜AR3、AR5〜AR9のビットデプスが「2」である。「近傍」を接していることとすると、ビットデプスが「3」の領域AR4に接している領域は領域AR2、AR3、AR5、AR6であるので、図7(B)に示すように、これら領域AR2、AR3、AR5、AR6のビットデプスが「2」から「3」に変更される。
【0076】
(C−3)第3の実施形態の効果
第3の実施形態によっても、第2の実施形態と同様な効果を奏することができる。さらに、第3の実施形態によれば、物体の動きを考慮してビットデプスを再決定するので、撮影時刻の近いフレーム間において、動きや変化の大きい領域の位置が等しくなかった場合でも、動きや変化の大きい領域のビットデプスを大きくできる可能性を高めることでき、
デコーダでの復号エラーを一段と抑えることが期待できる。
【0077】
(D)第4の実施形態
次に、本発明による動画像符号化装置及びプログラムの第4の実施形態を、図面を参照しながら説明する。第4の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0078】
(D−1)第4の実施形態の構成
図8は、第4の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0079】
図8及び図1の比較から明らかなように、第4の実施形態に係るWZフレーム符号化装置100Dは、第1の実施形態の構成に加えて、パラメータ制御部409を有する。
【0080】
パラメータ制御部409は、目標レートTGRTとWZ符号化部102Aから出力されたレートRT102AとからパラメータPR409を求めて、ビットデプス決定部105に与えるものである。
【0081】
WZ符号化部102Aは、第1の実施形態と同様なものであるが、動作段階に応じて、使用するビットデプスが変化したり、出力が変化したりする。WZ符号化部102Aは、基準ビットデプスBDrefを用いて変換量P101をWZ符号化し、そのときのレートをレートRT102Aとして出力する一次動作と、ビットデプス決定部105からのビットデプスBD105を用いて変換量P101をWZ符号化し、そのときのレートをレートRT102Aとして出力する二次動作と、ビットデプス決定部105からの収束したビットデプスBD105を用いて変換量P101をWZ符号化し、WZストリームSTを出力する三次動作とを実行するものであり、ビットデプスBD105が収束するまで二次動作を繰り返すものである。
【0082】
(D−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態に係るWZフレーム符号化装置100Dの動作を、図8に加え、図9を参照しながら説明する。図9は、WZフレーム符号化装置100Dの動作を示すフローチャートである。
【0083】
まず、パラメータ制御部409において、内部に有するオフセットビットデプスや閾値が、初期値(ゼロ以上の値)に初期化される(ステップS401)。
【0084】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFに対して所定の変換方法による変換が適用され、変換量P101が得られる(ステップS402)。
【0085】
WZ符号化部102Aにおいて、基準ビットデプスBDrefを用いて変換量P101がWZ符号化され、そのときのレートがレートRT102Aとして出力される(ステップS403)。レートの算出方法は、第1の実施形態と同様である。
【0086】
パラメータ制御部409において、レートRT102Aと目標レートTGRTとが比較され、レートRT102Aが目標レートTGRTに近づくようにバラメータが制御され、制御後のパラメータPR409がビットデプス決定部105に出力される(ステップS404)。
【0087】
パラメータPR409の制御方法としては、以下に例示するような方法を挙げることができる。
【0088】
(1)バラメータPR409がオフセットビットデプスと閾値とから構成される場合、レートRT102Aと目標レートTGRTとを比較して、レートRT102Aが目標レートTGRTよりも低い場合、閾値がゼロより大きいときは閾値を所定量(閾値についての所定量)だけ減少し、閾値がゼロ以下のときは、オフセットビットデプスの値を所定量(オフセットビットデプスについての所定量)だけ増やすと共に閾値を初期値に戻す。
【0089】
(2)パラメータPR409が閾値から構成される場合、レートRT102Aと目標レートTGRTとを比較して、レートRT102Aが目標レートTGRTよりも低い場合には、閾値を所定量だけ減少させる。
【0090】
パラメータPR409が更新(制御)されると、ビットデプス決定部105において、動画像の特徴に応じて適応的に制御されたビットデプスBD105が求められ、WZ符号化部102Aに出力される(ステップS405)。この際のビットデプスBD105の決定方法は、第1の実施形態と同様である。但し、固定パラメータPRではなく、制御されたパラメータPR409を用いてビットデプスBD105を計算しており、この点は、第1の実施形態と異なっている。
【0091】
ビットデプス決定部105若しくはWZ符号化部102Aにおいて、ビットデプスBD105が収束したと捉えて良いか否かが判別される(ステップS406)。例えば、前回決定されたビットデプスBD105(基準ビットデプスのこともあり得る)と今回決定されたビットデプスBD105とが全ての領域について同じ値の場合、若しくは、異なる領域数が所定数以下で、相違領域におけるビットデプスの差も所定値以内の場合に収束したと判別する。
【0092】
収束していない場合には、WZ符号化部102Aにおいて、ビットデプスBD105を用いてWZ符号化され、そのときのレートがレートRT102Aとして出力され(ステップS407)、上述したステップS404の処理に戻る。この際のレートの算出方法も、第1の実施形態と同様である。なお、この第4の実施形態だけでなく、レートの再計算を要する実施形態においては、WZ符号化部内のSW符号化部が、計算で得られたレートと、その計算に用いたビット列を保持しておき、同じビット列のレートを計算するときは保持されているレートを利用するようにしても良い。すなわち、他の領域が繰り返しのトリガになっていても、収束した領域もあり、このような領域については、過去の計数レートを利用するようにしても良い。
【0093】
収束した場合には、WZ符号化部102Aにおいて、収束したビットデプスBD105を用いて変換量P101がWZ符号化され、その結果がWZストリームSTとして出力される(ステップS408)。
【0094】
(D−3)第4の実施形態の効果
以上のように、第4の実施形態によれば、目標レートに近付くように、ビットデプスの決定に必要なパラメータを自動で制御した上で、ビットデプスを決定するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0095】
ここで、動画像の場合、時刻によって適切なパラメータは変化していくため、パラメータの制御機能を備えない場合には、「想定しているよりも大きなレートを必要とするフレームが発生し得る」が、第4の実施形態では、このような不都合を回避することができる。
【0096】
(E)第5の実施形態
次に、本発明による動画像符号化装置及びプログラムの第5の実施形態を、図面を参照しながら説明する。第5の実施形態の動画像符号化装置も、DVCにおけるWZフレーム符号化装置である。
【0097】
(E−1)第5の実施形態の構成
図10は、第5の実施形態に係るWZフレーム符号化装置の構成を示すブロック図であり、第3の実施形態に係る図5との同一、対応部分には同一、対応符号を付して示している。
【0098】
図10及び図5の比較から明らかなように、第5の実施形態に係るWZフレーム符号化装置100Eは、第3の実施形態の構成に加えて、パラメータ制御部409Eを有する。パラメータ制御部409Eは、パラメータを制御するという機能面は第4の実施形態と同様であるが、後述する動作の項の説明で明らかにするように、具体的な制御方法は、第4の実施形態のものと多少異なっている。
【0099】
なお、第5の実施形態に係るWZフレーム符号化装置100Eは、第3の実施形態の技術的特徴と第4の実施形態の技術的特徴とを組み合わせたものであるが、第2の実施形態の技術的特徴と第4の実施形態の技術的特徴とを組み合わせて、WZフレーム符号化装置を構築しても良いことは勿論である。
【0100】
この第5の実施形態の場合、WZ符号化部102Bが、ディレイ用メモリ部207を内蔵していることやビットデプス再決定部308を備えていることに鑑み、ビットデプス決定部105からのビットデプスBD105が収束するまで繰り返し処理することを実行しない。
【0101】
(E−2)第5の実施形態の動作
次に、以上のような構成を有する第5の実施形態に係るWZフレーム符号化装置100Eの動作を、図10に加え、図11を参照しながら説明する。図11は、WZフレーム符号化装置100Eの動作を示すフローチャートである。
【0102】
まず、パラメータ制御部409Eにおいて、内部に有するオフセットビットデプスや閾値が、初期値(ゼロ以上の値)に初期化される(ステップS501)。
【0103】
WZフレーム画像WZFが入力されると、変換部101において、WZフレーム画像WZFに対して所定の変換方法による変換が適用され、変換量P101が得られる(ステップS502)。
【0104】
WZ符号化部102Bにおいて、ビットデプス決定部103が決定し、それをビットデプス再決定部308が再決定した後のビットデプスBD308が用いられて、変換量P101がWZ符号化され、WZストリームSTが出力されると共に、遅延後のレートRT207がパラメータ制御部409Eに出力される(ステップS503)。このステップS503の処理は、第3の実施形態の処理と同様である。
【0105】
パラメータ制御部409Eにおいて、レートRT207と目標レートTGRTとが比較され、レートRT207が目標レートTGRTに近付くようにパラメータPR409Eが制御され、そのパラメータPR409Eがビットデプス決定部103に出力される(ステップS504)。
【0106】
パラメータPR409Eの制御方法としては、以下に例示する方法を挙げることができる。繰り返し処理を実行しないことを考慮し、第4の実施形態の制御方法とは多少異なっている。
【0107】
(1)第1の制御方法は、パラメータPR409Eがオフセットビットデプスと閾値とから構成される場合に適用される方法であり、まず、レートRT207と目標レートTDRTとを比較する。レートRT207が目標レートRT207よりも低い場合であって、閾値がゼロより大きいときは閾値を所定量だけ減少させ、閾値がゼロ以下のときは、オフセットビットデプスの値を所定量だけ増やすと共に閾値を初期値に戻す。一方、レートRT207が目標レートTGRTよりも高い場合であって、閾値が初期値未満のときは閾値を所定量だけ増加させ、閾値が初期値以上のときは、オフセットビットデプスをゼロ又はゼロ以上の所定値に設定し、閾値を初期値又はゼロ以上の所定値に設定する。
【0108】
(2)第2の制御方法は、パラメータPR09が閾値から構成される場合に適用される方法であり、まず、レートRT207と目標レートTGRTとを比較する。レートRT207が目標レートTGRTよりも低い場合には、閾値を所定量だけ小さくする。一方、レートRT207が目標レートTGRTよりも高い場合であって、閾値が初期値未満のときに、閾値を所定量だけ大きくする。
【0109】
パラメータPR409Eの制御後、ビットデプス決定部103において、動画像の特徴に応じて適応的に制御されたビットデプスBD103が求められ、ビットデプス再決定部308において、ビットデプスBD103に基づいて、ビットデプスが再決定され、得られたビットデプスBD308がWZ符号化部102Bに出力される(ステップS505)。ビットデプス決定部103やビットデプス再決定部308の決定方法は、第3の実施形態と同様である。ビットデプス決定部103について言えば、固定パラメータPRではなく、制御されたパラメータPR409Eを用いてビットデプスを計算する点が、第3の実施形態と異なっている。
【0110】
(E−3)第5の実施形態の効果
以上のように、第5の実施形態によれば、目標レートに近付くように、ビットデプスの決定に必要なパラメータを自動で制御した上で、ビットデプスを決定するようにしたので、動きや変化の小さい領域と動きや変化の大きい領域とが混在していても、処理負担をさほど増加させることなく、両領域ともにデコーダでの復号エラーを抑えることができる。
【0111】
ここで、動画像の場合、時刻によって適切なパラメータは変化していくため、パラメータの制御機能を備えない場合には、「想定しているよりも大きなレートを必要とするフレームが発生し得る」が、第5の実施形態では、このような不都合を回避することができる。
【0112】
(F)他の実施形態
上記各実施形態においては、WZ符号のレートの高さに応じて基準ビットデプスよりビットデプスを増やす場合を説明したが、当初に適用される基準ビットデプスを大き目に設定しておき、レートの低さに応じてビットデプスを減らすようにしても良い。この場合、ビットデプス決定部は、基準ビットデプスBDrefにオフセットビットデプスやレートの大きさに応じて求められるオフセットを加えるのではなく、基準ビットデプスからオフセットビットデプスやレートの大きさに応じて求められるオフセットを減らすことで、ビットデプス決定部から出力するビットデプスを計算することとなる。
【0113】
さらに、ビットデプスの制御は、増大方向への制御や、減少方向への制御だけでなく、増減制御であっても良い。
【0114】
上記各実施形態の動画像符号化装置であるWZフレーム符号化装置は、例えば、チップ化されたり、専用プログラムとして構築されたりして取引されるものであっても良く、また、キーフレームの符号化装置と同じチップに搭載されたり、キーフレームの符号化装置に係るプログラムと共にアプリケーションとして取引されたりしても良い。すなわち、DVC方式に従う動画像符号化装置の一部として、上記各実施形態の動画像符号化装置が盛り込まれていても良い。
【符号の説明】
【0115】
100A〜100E…WZフレーム符号化装置、101…変換部、102A、102B…WZ符号化部、103、103B…量子化部、104A、104B…SW符号化部、105、105B…ビットデプス決定部、106…二次量子化部、207…ディレイ用メモリ部、308…ビットデプス再決定部、409、409E…パラメータ制御部。
【特許請求の範囲】
【請求項1】
入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段とを備える動画像符号化装置において、
対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段を有することを特徴とする動画像符号化装置。
【請求項2】
上記WZ符号化手段は、計算で得られたレートを所定フレーム数だけ遅延させて上記ビットデプス決定手段に与えるレート遅延部を有することを特徴とする請求項1に記載の動画像符号化装置。
【請求項3】
上記ビットデプス決定手段は、
上記WZ符号化手段から取り込んだレートに基づいて、領域ごとのビットデプスを仮決定する仮決定部と、
仮決定されたビットデプスが高い領域を、入力フレーム画像上の物体の動きがある領域として扱い、その近傍の領域も、物体の動きがある領域の可能性が高いとして、ビットデプスを修正するビットデプス再決定部とを有する
ことを特徴とする請求項2に記載の動画像符号化装置。
【請求項4】
上記WZ符号化手段から上記ビットデプス決定手段に与えられるレートが与えられ、このレートと、予め設定されている目標レートとの相違に基づいて、上記ビットデプス決定手段が、上記WZ符号化手段から取り込んだレートを評価する際に用いる閾値を少なくとも制御するパラメータ制御手段を有することを特徴とする請求項1〜3のいずれかに記載の動画像符号化装置。
【請求項5】
上記パラメータ制御手段は、与えられたレートと目標レートとの相違に基づいて、上記ビットデプス決定手段が、ビットデプスを更新させる際の変化分を制御することを特徴とする請求項4に記載の動画像符号化装置。
【請求項6】
上記WZ符号化手段は、基準ビットデプスで上記変換量を量子化する第1の量子化部と、上記ビットデプス決定手段が決定したビットデプスで上記変換量を量子化する第2の量子化部とを有し、上記第1の量子化部からの量子化値に基づいて上記ビットデプス決定手段に与えるレートを計算し、上記第2の量子化部からの量子化値に基づいてWZストリームを得ることを特徴とする請求項1に記載の動画像符号化装置。
【請求項7】
上記第2の量子化部は、上記第1の量子化部からの量子化値を利用して、上記ビットデプス決定手段が決定したビットデプスで上記変換量を量子化した量子化値を得ることを特徴とする請求項6に記載の動画像符号化装置。
【請求項8】
上記WZ符号化手段から上記ビットデプス決定手段に与えられるレートが与えられ、このレートと、予め設定されている目標レートとの相違に基づいて、上記ビットデプス決定手段が、上記WZ符号化手段から取り込んだレートを評価する際に用いる閾値を少なくとも制御するパラメータ制御手段を有することを特徴とする請求項6又は7に記載の動画像符号化装置。
【請求項9】
上記パラメータ制御手段は、与えられたレートと目標レートとの相違に基づいて、上記ビットデプス決定手段が、ビットデプスを更新させる際の変化分を制御することを特徴とする請求項8に記載の動画像符号化装置。
【請求項10】
上記ビットデプス決定手段は、上記パラメータ制御手段からパラメータが与えられるごとにビットデプスを決定し直すものであり、ビットデプスが収束したときに決定を停止し、上記WZ符号化手段は、収束したビットデプスを適用してWZストリームを得ることを特徴とする請求項8又は9に記載の動画像符号化装置。
【請求項11】
動画像符号化装置に搭載されるコンピュータを、
入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、
上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段と、
対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段と
して機能させることを特徴とする動画像符号化プログラム。
【請求項12】
キーフレーム画像をフレーム内符号化方式で符号化する第1の動画像符号化装置部と、非キーフレーム画像を符号化する第2の動画像符号化装置部とを有する動画像符号化装置において、
上記第2の動画像符号化装置部として、請求項1に記載の動画像符号化装置を適用したことを特徴とする動画像符号化装置。
【請求項1】
入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段とを備える動画像符号化装置において、
対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段を有することを特徴とする動画像符号化装置。
【請求項2】
上記WZ符号化手段は、計算で得られたレートを所定フレーム数だけ遅延させて上記ビットデプス決定手段に与えるレート遅延部を有することを特徴とする請求項1に記載の動画像符号化装置。
【請求項3】
上記ビットデプス決定手段は、
上記WZ符号化手段から取り込んだレートに基づいて、領域ごとのビットデプスを仮決定する仮決定部と、
仮決定されたビットデプスが高い領域を、入力フレーム画像上の物体の動きがある領域として扱い、その近傍の領域も、物体の動きがある領域の可能性が高いとして、ビットデプスを修正するビットデプス再決定部とを有する
ことを特徴とする請求項2に記載の動画像符号化装置。
【請求項4】
上記WZ符号化手段から上記ビットデプス決定手段に与えられるレートが与えられ、このレートと、予め設定されている目標レートとの相違に基づいて、上記ビットデプス決定手段が、上記WZ符号化手段から取り込んだレートを評価する際に用いる閾値を少なくとも制御するパラメータ制御手段を有することを特徴とする請求項1〜3のいずれかに記載の動画像符号化装置。
【請求項5】
上記パラメータ制御手段は、与えられたレートと目標レートとの相違に基づいて、上記ビットデプス決定手段が、ビットデプスを更新させる際の変化分を制御することを特徴とする請求項4に記載の動画像符号化装置。
【請求項6】
上記WZ符号化手段は、基準ビットデプスで上記変換量を量子化する第1の量子化部と、上記ビットデプス決定手段が決定したビットデプスで上記変換量を量子化する第2の量子化部とを有し、上記第1の量子化部からの量子化値に基づいて上記ビットデプス決定手段に与えるレートを計算し、上記第2の量子化部からの量子化値に基づいてWZストリームを得ることを特徴とする請求項1に記載の動画像符号化装置。
【請求項7】
上記第2の量子化部は、上記第1の量子化部からの量子化値を利用して、上記ビットデプス決定手段が決定したビットデプスで上記変換量を量子化した量子化値を得ることを特徴とする請求項6に記載の動画像符号化装置。
【請求項8】
上記WZ符号化手段から上記ビットデプス決定手段に与えられるレートが与えられ、このレートと、予め設定されている目標レートとの相違に基づいて、上記ビットデプス決定手段が、上記WZ符号化手段から取り込んだレートを評価する際に用いる閾値を少なくとも制御するパラメータ制御手段を有することを特徴とする請求項6又は7に記載の動画像符号化装置。
【請求項9】
上記パラメータ制御手段は、与えられたレートと目標レートとの相違に基づいて、上記ビットデプス決定手段が、ビットデプスを更新させる際の変化分を制御することを特徴とする請求項8に記載の動画像符号化装置。
【請求項10】
上記ビットデプス決定手段は、上記パラメータ制御手段からパラメータが与えられるごとにビットデプスを決定し直すものであり、ビットデプスが収束したときに決定を停止し、上記WZ符号化手段は、収束したビットデプスを適用してWZストリームを得ることを特徴とする請求項8又は9に記載の動画像符号化装置。
【請求項11】
動画像符号化装置に搭載されるコンピュータを、
入力フレーム画像に対し、相関除去処理を含む所定の変換処理を施して変換量を得る変換手段と、
上記変換量を量子化した後、SW符号化してWZストリームを得るWZ符号化手段と、
対向する動画像復号装置の予測画像の領域ごとの精度を表す推定情報として、上記WZ符号化手段から領域ごとのレートを取り込み、上記変換量を量子化して、WZストリームを得るSW符号化処理が施される量子化値を得る際のビットデプスを領域ごとに決定するビットデプス決定手段と
して機能させることを特徴とする動画像符号化プログラム。
【請求項12】
キーフレーム画像をフレーム内符号化方式で符号化する第1の動画像符号化装置部と、非キーフレーム画像を符号化する第2の動画像符号化装置部とを有する動画像符号化装置において、
上記第2の動画像符号化装置部として、請求項1に記載の動画像符号化装置を適用したことを特徴とする動画像符号化装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2013−66092(P2013−66092A)
【公開日】平成25年4月11日(2013.4.11)
【国際特許分類】
【出願番号】特願2011−204113(P2011−204113)
【出願日】平成23年9月20日(2011.9.20)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】
【公開日】平成25年4月11日(2013.4.11)
【国際特許分類】
【出願日】平成23年9月20日(2011.9.20)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】
[ Back to top ]