説明

画像符号化方法、装置及びプログラム

【課題】復号化時に符号化時の適応量子化などの効果を容易に確認可能とすること。
【解決手段】画像符号化装置は、適応量子化方法、符号化モード判定方法及び動き検出方法の少なくとも一つを含む符号化制御方法と前記符号化制御方法に基づいて変動する符号化パラメータのレベルに応じた色変換方法とを示す入力パラメータを設定するパラメータ設定部106、前記符号化制御方法に従って入力画像を解析して前記符号化パラメータを算出する画像解析部101、前記色変換方法及び前記符号化パラメータに従って前記入力画像に色変換を含む加工を施して加工画像を生成する画像加工部103と、プレビューモードと非プレビューモードとの選択を行うモード選択部102、及び前記入力パラメータの符号化制御方法と前記符号化パラメータに従って、前記プレビューモード時は前記入力画像を符号化し、前記非プレビューモード時は前記加工画像を符号化する符号化部104を有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像または静止画のための画像符号化方法、装置及びプログラムに係り、特に符号化側しか所持していない情報を復号化時に容易に確認することを可能とする技術に関する。
【背景技術】
【0002】
一般に、DVD(Digital Versatile Disc)やHD DVD(high-definition DVD)のような次世代DVD(特にセルビデオ)におけるオーサリング作業では、画像符号化装置の符号化パラメータをシーン毎に調整し、画質を最大限高めるように調整の反復作業を行う。この際、符号化パラメータの調整の効果を確認するために、画像復号化装置で圧縮された動画像データを再生して符号化パラメータの調整による画質の変化を目視で確認することが行われる。しかし、このような画質の変化を目視だけで確認するのは、多くの労力と豊富な経験が必要である。
【0003】
そこで、圧縮された動画像データに含まれる付加情報を復号化し、それを画像の表示画面上にオーバレイする画像復号化装置(例えば、非特許文献1参照)を用いて確認することで、符号化パラメータの調整効果を確認しやすくなる。動画像データに含まれる、オーバレイされる付加情報として、例えば動きベクトル、量子化パラメータ、符号化モード及び発生符号量などの情報が挙げられる。
【非特許文献1】ニコンシステム H.264解析ツール(NH264B1・M1・H1)製品説明書
【発明の開示】
【発明が解決しようとする課題】
【0004】
画像符号化装置では、一般にビットレート制御と適応量子化のために量子化パラメータの制御が行われる。適応量子化は、入力画像のアクティビティに基づいて行われる。この場合、例えば適応量子化の強度を変えるために、符号化パラメータを調整して量子化パラメータを上下に変化させたとすると、この変動はビットレート制御による量子化パラメータの変化と重なる。このため、ユーザは画像復号化時に、表示画面上にオーバレイされている量子化パラメータからアクティビティに基づいた適応量子化の効果が十分確認できない。
【0005】
また、画像符号化装置において入力画像の顔領域を検出し、顔領域で量子化パラメータを下げるように制御する適応量子化が行われる場合がある。一方、アクティビティに基づく適応量子化では、顔領域の目、鼻及び口などのテクスチャの細かい部分の影響で逆に量子化パラメータが上がるように制御される可能性がある。このような場合、顔領域ではアクティビティに基づく適応量子化と、顔領域の検出に基づく適応量子化によるそれぞれの量子化パラメータの変化が相殺される。従って、ユーザは画像復号化時に再生画像の表示画面上にオーバレイされている量子化パラメータを見ても、画像符号化装置の各制御が正しく動作しているか確認することができない。
【0006】
本発明は、復号化時に符号化時の適応量子化などの効果を容易に確認することを可能とする画像符号化方法及び装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の課題を解決するため、本発明の一観点によると適応量子化方法、符号化モード判定方法及び動き検出方法の少なくとも一つを含む符号化制御方法と前記符号化制御方法に基づいて変動する符号化パラメータのレベルに応じた色変換方法とを示す入力パラメータを設定するパラメータ設定部と、前記符号化制御方法に従って入力画像を解析して前記符号化パラメータを算出する画像解析部と、前記色変換方法及び前記符号化パラメータに従って前記入力画像に色変換を含む加工を施して加工画像を生成する画像加工部と、プレビューモードと非プレビューモードとの選択を行うモード選択部と、前記入力パラメータの符号化制御方法と前記符号化パラメータに従って、前記プレビューモード時は前記入力画像を符号化し、前記非プレビューモード時は前記加工画像を符号化する符号化部と、を具備することを特徴とする画像符号化装置が提供される。
【発明の効果】
【0008】
本発明によれば、プレビューモードにおいて入力画像に対して符号化パラメータのレベル(例えば、適応量子化における量子化パラメータの値)に応じた色変換による加工を行うことにより、適応量子化、符号化モード判定方法及び動き検出などに関する情報のうち本来画像符号化装置しか所持していない情報を画像復号化装置において容易に確認することが可能となる。
【0009】
また、画像復号化装置により符号化データを復号して画像を再生するだけで、画面上の表示から適応量子化などの効果を容易に確認できるため、特別なシステムの構築の必要がなく、コストの増加もない。
【発明を実施するための最良の形態】
【0010】
以下、図面を参照して本発明の実施形態について説明する。
図1に示されるように、本発明の一実施形態に係る画像符号化装置は、入力画像11を符号化して符号化データ(符号化ビットストリームと呼ばれる)20を出力する装置であり、画像解析部101、プレビューモード/非プレビューモードの選択を行うためのモード選択部102、画像加工部103、符号化部104、ユーザ入力部105及びパラメータ設定部106を有する。入力画像11は、例えばハードディスクドライブのような画像記憶装置100から読み出されるデジタルの画像データである。
【0011】
図1の画像符号化装置は、選択部102によってプレビューモード/非プレビューモードの選択が可能である。例えば、ユーザ(オーサリング作業を行うオペレータ)がユーザ入力部105を介してプレビューモードを選択すると、画像加工部103を経由して符号化部104において入力画像11の符号化が行われる。一方、非プレビューモードを選択すると、入力画像11は画像加工部103を経由せずに符号化部104において直接符号化される。
【0012】
一方、図2に示されるように、画像符号化装置により得られる符号化データ20(符号化ビットストリーム)は、ハードディスクドライブのような符号化データ記憶装置200に記憶される。記憶装置200に記憶された符号化データは、必要なときに画像復号化装置201により復号され、画像表示装置202により表示される。なお、プレビューモードにおいて符号化データを符号化データ記憶装置200を介さずに画像復号化装置201により復号し、画像表示装置202により表示してもよい。
【0013】
次に、図1に示した画像符号化装置の各部について説明する。
画像解析部101は、入力画像11について入力パラメータ設定部106により設定される入力パラメータのうちの、ユーザによって指定された符号化制御方法を示す符号化制御方法指示情報13に従って入力画像11を解析し、符号化パラメータ12を算出して出力する。符号化制御方法及び画像解析方法については、後に詳しく説明する。
【0014】
画像加工部103は、符号化パラメータ12と、入力パラメータ設定部106により設定される入力パラメータのうちの、ユーザによって指定された色変換方法を示す色変換方法指示情報14に従って入力画像10に色変換を含む加工を施して加工画像を生成する。モード選択部102は、ユーザからの指示によってプレビューモードと非プレビューモードとの選択を行う。色変換方法の詳細については、後に述べる。
【0015】
画像符号化装置は、モード選択部102によりプレビューモードと非プレビューモードの選択が可能である。プレビューモードで入力画像11を符号化する場合は、入力画像11及び画像解析部102からモード選択部102を介して出力される符号化パラメータ12は画像加工部103に入力され、前述のように入力画像11が加工される。画像加工部103によって生成される加工画像は符号化部104に入力され、符号化パラメータ12と符号化制御方法指示情報13に従って符号化される。
【0016】
一方、非プレビューモードで入力画像11を符号化する場合は、入力画像11及び画像解析部102から出力される符号化パラメータ12は画像加工部103をバイパスして符号化部104に直接入力され、入力画像11は符号化パラメータ12と符号化制御方法指示情報13に従って符号化される。
【0017】
本実施形態では、入力画像11は動画像であるとして説明するが、入力画像11は静止画であってもよい。入力画像11が動画像の場合、符号化部104の符号化方式は、例えばMPEG−1、MPEG−2、MPEG−4、H.264、またはVC−1など、公知の様々な動画像圧縮符号化方式のうちの任意の方式を用いてもよい。本実施形態では、例として符号化部104はH.264を用いるものとする。一方、入力画像11が静止画の場合、符号化部104は例えばJPEG、JPEG2000、またはH.264イントラなど、公知の様々な静止画圧縮符号化方式のうちの任意の方式を用いればよい。
【0018】
また、以降の説明では画像解析部101での解析や符号化パラメータの算出は、すべてマクロブロック単位で処理するものとして説明するが、複数のマクロブロックをまとめた単位で画像解析部101の処理を行っても構わない。
【0019】
次に、図3に示すフローチャートを用いて本実施形態に係る画像符号化装置の動作について説明する。
【0020】
まず、ユーザ入力部105を介して与えられるユーザからの指示に従って、入力パラメータ設定部106により符号化制御方法及び色変換方法を設定する(ステップS1)。符号化制御方法とは、符号化部104の符号化動作を制御する方法であり、例えば適応量子化方法、符号化モード判定方法及び動き検出方法の少なくとも一つを指す。色変換方法とは、入力画像11の色を変換する方法を指し、例えば入力画像11のうちの色差成分のみを変換する方法などを指す。なお、設定される符号化制御方法は複数あってもよく、各符号化制御方法に対応した色変換方法が存在すればよい。例えば、符号化制御方法が複数存在するが、色変換方法の数は全ての符号化制御方法に共通に対応する1つでもよいし、または符号化制御方法の数より少ない数であってもよい。また、各符号化制御方法にそれぞれ別々の色変換方法を対応させてもよい。
【0021】
次に、画像解析部101において入力パラメータ設定部106により設定された符号化制御方法に基づいて入力画像11を解析する。具体的には、画像解析部101は入力画像11について予めユーザによって指定された特徴、例えばアクティビティ、色成分、または画面間差分などを解析し、解析結果に従って符号化パラメータ12を算出する(ステップS2)。但し、入力画像11が静止画の場合、画像解析部101が解析する特徴に画面間差分は含まれない。
【0022】
次に、ユーザ入力部105によりプレビューモードが選択されているか、非プレビューモードが選択されているかどうかを調べ(ステップS3)、その結果に応じてモード選択信号15をモード選択部102に送る。
【0023】
ここで、プレビューモードが選択されていれば、モード選択部102によって入力画像11及び画像解析部102からの符号化パラメータ12を画像加工部103に入力し、パラメータ設定部106からの色変換方法指示情報14によって示される、ユーザにより指定された色変換方法に従って入力画像11を加工する(ステップS4)。具体的には、符号化制御方法に応じて変動する符号化パラメータのレベルの変動に基づいて、入力画像11の色変換を行う。次に、ステップS4により生成される加工画像を符号化部104により符号化する(ステップS5)。
【0024】
このプレビューモードでは、符号化部104から出力される符号化データ20は画像復号化装置201により復号化され、再生画像21が画像表示装置202で表示(プレビュー)される。このときユーザは、画像表示装置202の表示画像中の色変換の状態から適応量子化の効果を確認することができる。この点については、以下に具体例を挙げて説明する。
【0025】
一方、非プレビューモードが選択されていれば、モード選択部102によって画像加工部103をバイパスさせ、入力画像11及び画像解析部102から出力される符号化パラメータ12を直接符号化部104に入力して入力画像11を符号化する(ステップS5)。この非プレビューモードでは、符号化部104から出力される符号化データ20は通常は符号化データ記憶装置200に記憶され、適時読み出されて画像復号化装置201により復号化される。
【0026】
符号化部104は、入力画像11が存在すれば符号化処理を継続し、入力画像11がなければ符号化処理を終了する。符号化処理を継続する場合、ユーザによる入力パラメータの変更がなければステップS2に戻り、変更があればステップS1に戻って入力パラメータ、すなわち符号化制御方法と色変換方法を再度設定しなおす。
【0027】
次に、符号化制御方法及び色変換方法について詳細に説明する。
(1)<符号化制御方法について>
パラメータ設定部106によって設定される入力パラメータの一つである符号化制御方法としては、例えば(1)適応量子化方法、(2)符号化モード判定方法及び(3)動き検出方法が挙げられる。以下、それぞれの場合について具体的に述べる。
【0028】
(1−1)適応量子化方法
適応量子化では、以下のように量子化パラメータをアクティビティに基づいて制御する方法、顔尤度に基づいて制御する方法、特定色検出に基づいて制御する方法、及びエッジ検出に基づいて制御する方法のうちの少なくとも一つを用いる。
【0029】
(1−1−1)アクティビティに基づく量子化パラメータの制御方法
一般に、画像のアクティビティの高い領域の画質劣化は目立ちにくく、アクティビティの低い領域の画質劣化は目立ちやすい。従って、画像のアクティビティに応じて量子化パラメータを制御することで主観画質が改善できる場合がある。
【0030】
そこで、アクティビティ大→量子化パラメータ大(例えば、量子化パラメータオフセット大(プラス))、アクティビティ小→量子化パラメータ小(例えば、量子化パラメータオフセット小(マイナス))となるように、符号化制御方法(適応量子化方法)を設定する。
【0031】
(1−1−2)顔尤度に基づく量子化パラメータの制御方法
画面内に人の顔があれば、一般的に顔は最も注目されることから、他の領域に比べて画質劣化が知覚されやすい。従って、顔検出を行って画像内で顔と判定された部分(顔領域)に対して量子化パラメータを制御することで、主観画質が改善できる場合がある。
【0032】
そこで、顔検出結果を受けて顔である確率(顔尤度)が高い→量子化パラメータオフセット小(マイナス)、顔である確率が低い→量子化パラメータオフセット大(プラス)となるように、符号化制御方法(適応量子化方法)を設定する。
【0033】
(1−1−3)特定色の色類似度に基づく量子化パラメータの制御方法
上記のように人の顔も注目領域の一つであるが、顔だけでなく首や手、体も注目領域となり得る。このため、肌色を検出してその部分に対して量子化パラメータを制御することで主観画質が改善できる場合がある。また、暗部や鮮明な(サチュレーションが高い)赤は符号化歪みが目立ちやすいため、色領域を検出して特定色の領域に対して量子化パラメータを制御することで主観画質が改善できる場合がある。
【0034】
そこで、入力画像11のうち肌色、暗部、鮮明な赤などの、ユーザによって予め指定される特定色との類似度(色類似度)が高い代表色の領域→量子化パラメータオフセット小(マイナス)、特定色との類似度が低い代表色の領域→量子化パラメータオフセット大(プラス)となるように、符号化制御方法(適応量子化方法)を設定する。
【0035】
(1−1−4)エッジ尤度に基づく量子化パラメータの制御方法
画像内の文字などの急峻なエッジにおいては、符号化により高周波成分がなくなるとリンギングが発生して主観画質が低下する場合がある。従って、エッジ検出によりエッジと判定された部分に対して量子化パラメータを制御することで主観画質が改善できる場合がある。
【0036】
そこで、エッジ領域(エッジ尤度大)→量子化パラメータオフセット小(マイナス)、エッジ領域以外(エッジ尤度小)→量子化パラメータオフセット大(プラス)となるように、符号化制御方法(適応量子化方法)を設定する。
【0037】
なお、上記の符号化制御方法では適応量子化において量子化パラメータオフセットを顔尤度、特定色検出結果またはエッジ尤度に応じて大、小の方向に制御するとしたが、一方向の制御でもよい。例えば、肌色領域であれば量子化パラメータオフセットを小さくするという制御のみでよく、その他の領域を大きくしなくてもよい。実際の符号化処理ではビットレート制御による量子化パラメータの制御がかかるため、ある領域の量子化パラメータを下げれば、その他の領域においては相対的に量子化パラメータが大きくなるためである。
【0038】
(1−2)符号化モード判定方法
(1−2−1)アクティビティに基づくコスト関数の制御
一般に符号化モード判定は、次式(1)に示すコストCostを最小化する符号化モードを選ぶ方法が一般である。
【数1】

【0039】
ここで、Distortionは歪み、λはラグランジェの未定乗数、Rateは発生符号量をそれぞれ表す。
【0040】
歪みと発生符号量のバランスをとるためのλは通常、画面内では一定である場合が多いが、画像のアクティビティに応じて符号化モード判定のコストバランスをとるλを変更することで画質が改善できる場合がある。そこで、λbaseを基準にλを調整するための係数α(λ=α×λbase)がアクティビティ大→α大、アクティビティ小→α小となるように、符号化制御方法(符号化モード判定方法)を設定する。
【0041】
(1−3)動き検出方法
(1−3−1)アクティビティに基づくコスト関数の制御
動き検出方法は、前記符号化モード判定方法とほぼ同様に、動きベクトルを決定する際に、前記のコストCostを最小化する動きベクトルを探索する方法が一般的である。但し、この場合のRateは一般的には動きベクトルの情報のみを表す。画像のアクティビティに応じて動きベクトルのコストバランスをとるλを変更することで、画質改善ができる場合があるため、λを調整するための係数(λ=β×λbase)がアクティビティ大→β大、アクティビティ小→β小となるように、符号化制御方法(動きベクトル検出方法)を設定する。
【0042】
(1−3−2)動き検出アルゴリズムに基づく制御
動き検出アルゴリズムには様々な手法がある。例えば、フルサーチ、階層サーチ、ダイヤモンドサーチ及びヘキサゴンサーチなどが挙げられる。階層サーチ、ダイヤモンドサーチ及びヘキサゴンサーチは、フルサーチと比べて、アーリーターミネーションや間引き処理によって、演算量が少なく高速な動き検出が可能である一方で、これらの高速動きベクトル検出アルゴリズムは局所解に陥りやすい。
【0043】
すなわち、符号化しようとするカレント画像と、既に符号化された、局部復号により得られる参照画像との間の差分が小さければ、動きも少ないと予測されるため、上記のような高速の動きベクトル検出アルゴリズムでもフルサーチと比較して遜色がない。一方、カレント画像と参照画像間の差分が大きければ、動きが大きいと予測されるため、高速動きベクトル検出アルゴリズムとフルサーチとの差が大きくなりやすい。そこで、カレント画像と参照画像間の差分大→フルサーチ、差分小→階層サーチ、ダイヤモンドサーチまたはヘキサゴンサーチとなるように、符号化制御方法(動きベクトル検出方法)を設定する。
【0044】
(2)<色変換方法について>
(2−1)色差変換
画像加工部103においては、符号化制御方法に応じて変動する符号化パラメータのレベル(例えば、符号化制御方法が適応量子化の場合、量子化パラメータの値)の変動に基づいて入力画像11の色変換を行う。この色変換に際して、輝度信号まで変換してしまうと入力画像11の情報が損なわれ、例えばオブジェクトがどのような形状であったかなどが不明瞭となる。
【0045】
そこで、入力画像11のうち輝度信号については変換せず、色差信号のみを変換することで、入力画像11の形状等の情報を残しつつ、符号化パラメータのレベルの変動に応じた色変化が確認できる。本実施形態のように符号化部104の符号化方式がH.264の場合、入力画像11はYUV(YCbCr)信号で構成されるため、色変換に際しては色差信号、すなわちUV(CbCr)のみを変換する。例えば、量子化パラメータオフセットの値が大きければ、より赤くなるようにV(Cr)の値を大きくし、逆に量子化パラメータオフセットの値が小さければ、より青くなるようにU(Cb)の値を大きくする、という色変換方法を設定する。
【0046】
(2−2)ユーザ指定の変換
例えば、量子化パラメータオフセットの値が−10であれば、Y=現信号、U(Cb)=240、V(Cr)=128といったように、直接的に指定した色を変換するようにユーザが色変換方法を設定する。このように色変換方法をユーザが指定することは、特に同じ符号化パラメータに影響を与える符号化制御方法を採用した場合に有効である。
【0047】
例えば、色変換と同時に符号化制御方法としてアクティビティによる適応量子化と顔尤度による適応量子化を用いる場合は、アクティビティによる適応量子化による量子化パラメータオフセットの変動が赤となり、顔尤度による適応量子化による量子化パラメータオフセットの変動が青となるような色変換方法を設定すれば、アクティビティ及び顔尤度の両方による適応量子化の効果がある領域では、赤成分と青成分が混ざった色が生成されるため、それらの効果が判別可能となる。
【0048】
(2−3)その他の色変換
例えば、符号化パラメータの大小によってボケ具合を変えても良いし、コントラストを上下させる方法を用いてもよい。また、入力画像11の輝度信号を反転(Y=240−Ybase)させるような色変換を行ってもよい。その他、色変換方法は様々挙げられるが、量子化パラメータのような符号化パラメータのレベルの変動を目視確認しやすいような方法を行うことが好ましい。
【0049】
(3)<画像解析方法について>
次に、画像解析部101における画像解析方法について具体的に説明する。画像解析方法には、さらに符号化パラメータ算出方法も含まれるとする。画像解析方法は、符号化制御方法に応じて決定される。以下、符号化制御方法が前述した(1−1)適応量子化方法、(1−2)符号化モード判定方法及び(1−3)動きベクトル検出方法のそれぞれの場合にそれぞれ対応する画像解析方法を述べる。
【0050】
(3−1)<適応量子化方法に対応する画像解析方法>
(3−1−1)適応量子化方法が(1−1−1)「アクティビティに基づく量子化パラメータの制御方法」の場合
パラメータ設定部106により設定された符号化制御方法が適応量子化方法のうち、特にアクティビティに基づく量子化パラメータの制御方法の場合、画像解析部101では入力画像11のアクティビティを解析(算出)する。符号化パラメータの制御は一般的にマクロブロック単位が最小粒度であるため、アクティビティの算出はマクロブロック単位で行う。
【0051】
アクティビティとしては、入力画像11の分散や標準偏差が挙げられる。算出されたマクロブロック毎のアクティビティから、例えば、次式(2)を用いて量子化パラメータオフセットを算出する。
【数2】

【0052】
ここでmaxMB_actは一画面内あるいは複数画面内の最大マクロブロックアクティビティ、minMB_actは一画面内あるいは複数画面内の最小マクロブロックアクティビティ、MB_actは対象となるマクロブロックのアクティビティ、Scaleはユーザによって指定される、量子化パラメータの制御範囲をそれぞれ表す。
【0053】
(3−1−2)適応量子化方法が(1−1−2)「顔尤度に基づく量子化パラメータの制御方法」の場合
パラメータ設定部106により設定された符号化制御方法が適応量子化方法のうち、特に顔尤度に基づく量子化パラメータの制御方法の場合、画像解析部101は入力画像11から顔領域を検出して顔尤度を算出する。顔検出のロジックは様々挙げられるが、例えば、顔データベースを用いたテンプレートマッチングであれば、マッチングの差分が小さいほど顔尤度が高くなるように顔検出を行うことが可能である。ただし、本実施形態は顔検出のロジックに依存するものではなく、顔であるか否かを判定できればよい。
【0054】
テンプレートマッチングを行う粒度(例えば、1画素単位でマッチングを行うなど)によって得られる顔尤度の粒度が異なるが、最終的に量子化パラメータオフセットを制御することを考慮すれば、顔尤度はマクロブロック単位に統合されている必要がある。マクロブロック単位よりも細かい粒度で顔尤度が算出されていれば、マクロブロック内で平均化すればよいし、粗い粒度で顔尤度が算出されていれば、面積比で算出すればよい。
【0055】
マクロブロック単位の顔尤度から量子化パラメータオフセットを算出する方法は、前述のアクティビティの代わりに顔尤度となったものを使用してもよい。あるいは、単純に顔尤度が所定の閾値以上であれば量子化パラメータオフセットを所定の値にするという方法でもよい。
【0056】
(3−1−3)適応量子化方法が(1−1−3)「特定色の色類似度に基づく量子化パラメータの制御方法の場合
パラメータ設定部106により設定された符号化制御方法が適応量子化方法のうち、特に色類似度に基づく量子化パラメータの制御方法の場合、画像解析部101では入力画像11について指定された特定色との類似度(色類似度)を算出する。符号化パラメータの制御は、一般的にマクロブロック単位が最小粒度であるため、マクロブロック単位で色類似度の算出を行う。
【0057】
このために、まずマクロブロック単位の代表色を算出する。代表色の算出方法としては、マクロブロック内の色の平均値あるいは中央値でもよいし、サブサンプルした値の平均値あるいは中央値でもよい。マクロブロック単位の色類似度は、代表色と指定された特定色との差として算出される。例えば、特定色がYUVで指定されれば、Y,U及びVのそれぞれの絶対値差分和を算出すればよい。また、例えば、暗部を検出するという目的で特定色が設定されるのであれば、Yの差分に対して重みを大きくし、U及びVに対しては重みを小さくするという方法もある。
【0058】
こうして算出されるマクロブロック単位の色類似度から符号化パラメータである量子化パラメータオフセットを算出する際には、前述のアクティビティの代わりに色類似度を使用することみできる。あるいは、色類似度が単純に所定の閾値以上であれば量子化パラメータオフセットを所定の値にするという方法でもよい。
【0059】
なお、ここではYUV表色系で特定色が指定されているとしているが、RGB表色系、HSV表色系などで指定されてもよい。例えば、HSV表色系で特定色が指定されたとすれば、入力画像11(YUV信号)をRGB信号へと変換した後、HSV信号に変換して類似度を計算してもよい。また、指定されたHSV表色系の色をRGBへ変換した後、YUVに変換して入力画像11との類似度を計算してもよい。
【0060】
(3−1−4)適応量子化方法が(1−1−4)「エッジ尤度に基づく量子化パラメータの制御方法」の場合
パラメータ設定部106により設定された符号化制御方法が適応量子化方法のうち、特にエッジ尤度に基づく量子化パラメータの制御方法であれば、画像解析部101では入力画像11からエッジ領域を検出する。
【0061】
エッジ検出のロジックは様々挙げられるが、例えば、エッジ検出オペレータ(ソベルなど)によるエッジ検出であれば、急峻なエッジであるほどエッジ成分の値(エッジ尤度)が大きくなるようにエッジ検出を行うことが可能である。ただし、本実施形態はエッジ検出のロジックに依存するものではなく、エッジであるか否かを判定できれば動作することが可能な方法であればよい。エッジ検出オペレータによるエッジ検出は、前述の顔検出におけるテンプレートマッチングと同様の処理で実現でき、量子化パラメータオフセットも同様の処理で算出可能である。
【0062】
(3−2)<符号化モード判定方法に対応する画像解析方法>
(3−2−1)アクティビティに基づくコスト関数の制御の場合
パラメータ設定部106により設定された符号化制御方法が符号化モード判定方法のうち、特にアクティビティに基づく符号化モード判定のコスト関数の制御方法であれば、画像解析部101では適応量子化方法の場合について述べたように、アクティビティを算出する。算出されたマクロブロック毎のアクティビティから、例えば次式(3)を用いてλを調整する係数αを算出する。
【数3】

【0063】
あるいは、単純にアクティビティが所定の閾値以上であればλを調整する係数αを所定の値にするという方法でもよい。
【0064】
(3−3)<動き検出方法に対応する画像解析方法>
(3−3−1)アクティビティに基づくコスト関数の制御
パラメータ設定部106により設定された符号化制御方法が動き検出方法のうち、特にアクティビティに基づくコスト関数の制御方法であれば、画像解析部101では(3−2−1)で述べた符号化モード判定に対応する画像解析方法の(3−2−1)アクティビティに基づくコスト関数の制御の場合と同様の処理を行うため、その説明は割愛する。
【0065】
(3−3−2)動き検出アルゴリズムに基づく制御
パラメータ設定部106により設定された符号化制御方法が動き検出方法のうち、特に画面間差分に基づく動き検出アルゴリズムの選択方法であれば、画像解析部101では入力画像11から画面間差分を算出する。符号化パラメータの制御は、一般的にマクロブロック単位が最小粒度であるため、画面間差分についてもマクロブロック単位で算出を行うようにする。
【0066】
画面間差分の算出方法としては、空間的に同じ座標の画面間から差分を算出する方法でもよいし、参照する画像の所定範囲内から最小の画面間差分を算出する方法でもよい。算出された画面間差分から動き検出アルゴリズムを選択する方法は、例えば画面間差分が所定の閾値以上であればフルサーチを選択し、所定の閾値以下であればダイヤモンドサーチを選択するという方法でよい。
【0067】
表1〜表7には、以上述べた符号化制御方法と色変換方法(ただし、色差変換のみ)とを対応付けたテーブルであり、画像加工部103は画像解析部101で算出された符号化パラメータとパラメータ設定部106で設定された色変換方法に従って入力画像11を例えば表1〜表7に基づいて変換することにより加工する。すなわち、図示しない記憶装置に表1〜7に示されるようなテーブルが保持されており、画像加工部103は当該テーブルを参照して入力画像11に対して加工を行う。
【0068】
表1は、アクティビティに基づく適応量子化の場合、すなわち符号化制御方法が前記(1−1−1)のアクティビティに基づく量子化パラメータの制御方法である場合のアクティビティの変化に対する量子化パラメータオフセットと色差変換値(変換後の色差信号)との関係を示している。色変換方法がユーザ指定であれば、色差変換値の上下の代わりに指定された色(YUVすべての成分、あるいはUVのみ)が当てはめられる。また、表1では量子化パラメータオフセットの制御範囲、すなわち先の式(2)のscaleが+10〜−10の21階調となっているが、これらはユーザの設定で自由に設定可能である。これらの点については、表2〜表7も同様である。
【表1】

【0069】
表2は、顔尤度に基づく適応量子化の場合、すなわち符号化制御方法が前記(1−1−2)の顔尤度に基づく量子化パラメータの制御方法である場合の顔尤度の変化に対する量子化パラメータオフセットと色差変換値との関係を示している。
【表2】

【0070】
表3は、特定色検出に基づく適応量子化の場合、すなわち符号化制御方法が前記(1−1−3)の特定色の色類似度に基づく量子化パラメータの制御方法である場合の色類似度(色の差)の変化に対する量子化パラメータオフセットと色差変換値との関係を示している。
【表3】

【0071】
表4は、エッジ尤度に基づく適応量子化の場合、すなわち符号化制御方法が前記(1−1−4)のエッジ尤度に基づく量子化パラメータの制御方法である場合のエッジ尤度の変化に対する量子化パラメータオフセットと色差変換値との関係を示している。
【表4】

【0072】
表5は、符号化制御方法が前記(1−2)の符号化モード判定方法であって、(1−2−1)のアクティビティに基づくコスト関数の制御方法である場合のアクティビティの変化に対するラグランジェの未定乗数λの調整係数α(すなわちλbaseを基準にλを調整するための係数)と色差変換値との関係を示している。
【表5】

【0073】
表6は、符号化制御方法が前記(1−3)の動き検出方法のうちの(1−3−1)のアクティビティに基づくコスト関数の制御方法である場合のアクティビティの変化に対するλの調整係数αと色差変換値との関係を示している。
【表6】

【0074】
最後に、表7は符号化制御方法が前記(1−3)の動き検出方法のうちの(1−3−2)の動き検出アルゴリズムに基づく制御方法である場合の画面間差分の変化に対するλの動く検出アルゴリズムと色差変換値との関係を示している。
【表7】

【0075】
以上のようなテーブルを用いてプレビューモードで画像加工部103において入力画像11に対し色変換による加工を行い、加工画像を符号化部104によって符号化することにより、符号化データを画像復号化装置201により復号して画像表示装置202で表示した際、色変換の結果から適応量子化等の効果を確認することができる。
【0076】
図4〜図6を用いて、本実施形態による効果の一例について説明する。入力画像11が図4に示すような人の画像であり、これに対して例えば特定色、特に肌色に基づく適応量子化方法が符号化制御方法として設定され、また色変換方法として肌色らしいほどマクロブロックを濃く塗りつぶすというような方法が設定されたとする。この場合、画像加工部103の処理により図5に示すような加工画像が得られる。さらに、ユーザが設定する強度(前述のアクティビティに基づく適応量子化であげられるScale)を強くすれば、図6に示すような加工画像が得られる。
【0077】
以上の説明では入力画像11が動画像の場合について述べたが、入力画像11が静止画であって、符号化部104の符号化方式が例えばJPEGであったとした場合、アクティビティや顔尤度、エッジ尤度、色類似度に基づく適応量子化は動画像の場合と同様に行うことが可能である。ただし、静止画の場合、当然のことながら動き検出のアルゴリズムや動き検出方法に関しては例外となる。
【0078】
なお、上述した本発明の実施形態に係る画像符号化装置は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いることでも実現することが可能である。すなわち、例えば特に画像解析部101、画像加工部103及び符号化部104については、コンピュータ装置に搭載されたプロセッサにプログラムを実行させることにより実現することができる。このとき、画像符号化装置は上記のプログラムをコンピュータ装置にあらかじめインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータ装置に適宜インストールすることで実現してもよい。また、画像記憶装置100及び符号化データ記憶装置は、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスクもしくはCD−R、CD−RW、DVD−RAM、DVD−Rなどの記憶媒体などを適宜利用して実現することができる。
【0079】
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
【図面の簡単な説明】
【0080】
【図1】本発明の一実施形態に係る画像符号化装置を示すブロック図
【図2】図1の画像符号化装置に対応する画像復号化装置及を含む再生側システムを示すブロック図
【図3】図1の画像符号化装置の処理手順を示すフローチャート
【図4】入力画像の一例を示す図
【図5】本実施形態による加工後の入力画像の例を示す図
【図6】本実施形態による加工後の入力画像の例を示す図
【符号の説明】
【0081】
100・・・画像記憶装置
101・・・画像解析部
102・・・モード選択部
103・・・画像加工部
104・・・符号化部
105・・・ユーザ入力部
106・・・入力パラメータ設定部
200・・・符号化データ記憶装置む
201・・・画像復号化装置
202・・・画像表示装置
11・・・入力画像
12・・・符号化パラメータ
13・・・符号化制御方法指示情報
14・・・色変換方法指示情報
20・・・符号化データ
21・・・再生画像

【特許請求の範囲】
【請求項1】
適応量子化方法、符号化モード判定方法及び動き検出方法の少なくとも一つを含む符号化制御方法と前記符号化制御方法に基づいて変動する符号化パラメータのレベルに応じた色変換方法とを示す入力パラメータを設定するステップと、
前記符号化制御方法に従って入力画像を解析して前記符号化パラメータを算出するステップと、
前記色変換方法及び前記符号化パラメータに従って前記入力画像に色変換を含む加工を施して加工画像を生成するステップと、
プレビューモードと非プレビューモードとの選択を行うステップと、
前記入力パラメータの符号化制御方法と前記符号化パラメータに従って、前記非プレビューモード時は前記入力画像を符号化し、前記プレビューモード時は前記加工画像を符号化するステップと、を具備することを特徴とする画像符号化方法。
【請求項2】
適応量子化方法、符号化モード判定方法及び動き検出方法の少なくとも一つを含む符号化制御方法と前記符号化制御方法に基づいて変動する符号化パラメータのレベルに応じた色変換方法とを示す入力パラメータを設定するパラメータ設定部と、
前記符号化制御方法に従って入力画像を解析して前記符号化パラメータを算出する画像解析部と、
前記色変換方法及び前記符号化パラメータに従って前記入力画像に色変換を含む加工を施して加工画像を生成する画像加工部と、
プレビューモードと非プレビューモードとの選択を行うモード選択部と、
前記入力パラメータの符号化制御方法と前記符号化パラメータに従って、前記非プレビューモード時は前記入力画像を符号化し、前記プレビューモード時は前記加工画像を符号化する符号化部と、を具備することを特徴とする画像符号化装置。
【請求項3】
前記色変換方法は、前記符号化パラメータのレベルに応じて前記入力画像の色差信号を変換する方法であることを特徴とする請求項2記載の画像符号化装置。
【請求項4】
前記符号化制御方法は、前記入力画像のアクティビティの大小に基づいて量子化パラメータの大小を制御する方法であって、前記画像解析部は、前記アクティビティを算出することを特徴とする請求項2記載の画像符号化装置。
【請求項5】
前記符号化制御方法は、前記入力画像の顔尤度に基づいて量子化パラメータの大小を制御する方法であって、前記画像解析部は、前記入力画像から顔領域を検出して前記顔尤度を算出することを特徴とする請求項2記載の画像符号化装置。
【請求項6】
前記符号化制御方法は、前記入力画像内のエッジ尤度に基づいて量子化パラメータの大小を制御する方法であって、前記画像解析部は、前記入力画像からエッジ領域を検出して前記エッジ尤度を算出することを特徴とする請求項2記載の画像符号化装置。
【請求項7】
前記符号化制御方法は、指定された特定色と前記入力画像内の指定された領域毎の代表色との類似度に基づいて量子化パラメータの大小を制御する方法であって、前記画像解析部は、前記類似度を算出することを特徴とする請求項2記載の画像符号化装置。
【請求項8】
前記符号化制御方法は、前記入力画像のアクティビティの大小に基づいて符号化モード判定のコスト関数を制御する方法であって、前記画像解析部は、前記アクティビティを算出することを特徴とする請求項2記載の画像符号化装置。
【請求項9】
前記符号化制御方法は、前記入力画像内のアクティビティの大小に基づいて動きベクトル検出のコスト関数を制御する方法であって、前記画像解析部は、前記アクティビティを算出することを特徴とする請求項2記載の画像符号化装置。
【請求項10】
前記符号化制御方法は、前記入力画像の画面間差分の大小に基づいて動き検出アルゴリズムを選択する方法であって、前記画像解析部は、前記画面間差分を算出することを特徴とする請求項2記載の画像符号化装置。
【請求項11】
適応量子化方法、符号化モード判定方法及び動き検出方法の少なくとも一つを含む符号化制御方法と前記符号化制御方法に基づいて変動する符号化パラメータのレベルに応じた色変換方法とを示す入力パラメータを設定することと、
前記符号化制御方法に従って入力画像を解析して前記符号化パラメータを算出することと、
前記色変換方法及び前記符号化パラメータに従って前記入力画像に色変換を含む加工を施して加工画像を生成することと、
プレビューモードと非プレビューモードとの選択を行うことと、
前記入力パラメータの符号化制御方法と前記符号化パラメータに従って、前記非プレビューモード時は前記入力画像を符号化し、前記プレビューモード時は前記加工画像を符号化することと、を含む画像符号化処理をコンピュータに行わせるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2009−141815(P2009−141815A)
【公開日】平成21年6月25日(2009.6.25)
【国際特許分類】
【出願番号】特願2007−317641(P2007−317641)
【出願日】平成19年12月7日(2007.12.7)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】