説明

映像符号化装置

【課題】従来の適応的フィールド・フレーム符号化(AFF)による映像符号化方法では、1つの入力画像に対して、フレーム単位もしくは16×32画素ブロック単位で、フレーム符号化とフィールド符号化という処理の異なる符号化を複数回行う必要があった。これにより、AFF方式を用いない場合に比べて処理量が2倍以上に増加してしまうという課題があった。
【解決手段】入力画像がインタレース画像である場合に、AFFのモード判定を行うAFFモード判定部(140)と、AFFモード判定部(140)によるモード判定の判定結果に応じて入力画像を符号化する映像符号化部(110)と、を有する映像符号化装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像を符号化する映像符号化装置に関し、特に、適応的フィールド・フレーム符号化を行う映像符号化装置に関する。
【背景技術】
【0002】
近年、ブロードバンドネットワークの発達による動画配信コンテンツの増加や、DVDなどの大容量記憶媒体と大画面映像表示機器の利用などにより、動画符号化技術は必要不可欠な技術となっている。また、撮像デバイスや表示デバイスの高解像度化と共に、動画符号化技術において高解像度で符号化する技術も必要不可欠となっている。
【0003】
符号化処理とは、映像符号化装置に入力される原画像をより少ないデータ量のストリームに変換する処理であるが、高解像度かつ高画質な符号化が可能な動画符号化技術の一つとして、国際標準であるH.264/AVCが存在する。H.264/AVC符号化方式では、画面内予測(フレーム内予測)や画面間予測(フレーム間予測)等の予測技術を用いて符号化を行う。また、H.264/AVCによる符号化処理では、一般的には、原画像に対して16×16の画素で構成されるマクロブロック(以下、適宜「MB」という)と呼ばれる単位で処理が行われる。
【0004】
ところで、H.264/AVC符号化で用いられる予測方式には、主に画面内予測と画面間予測の二つの予測方式があるが、画面内予測では、予測の単位となるブロックのサイズや予測方向の組み合わせに応じて複数の予測方式が用意されている。画面間予測においても、予測の単位となるブロックのサイズに応じて複数の予測方式が用意されている。H.264/AVCでは、目標とする画質や符号量に応じてこれらの予測方式を動的に選択することで、高画質かつ高圧縮な符号化方式を実現している。
【0005】
ここで、図18を用いて、H.264/AVC符号化の概要について説明する。図18は、従来のH.264/AVC符号化処理を行う映像符号化装置の構成を示す図である。
【0006】
画面内予測を用いた符号化処理では、モード選択部930が画面内予測部910を選択する。そして、画面内予測部910、直交変換部940、量子化部950、および可変長符号化部980を経て、原画像90からストリーム91を得る。また、画面間予測を用いた符号化処理では、モード選択部930が画面間予測部920を選択する。そして、画面間予測部920、直交変換部940、量子化部950、および可変長符号化部980を経て、原画像90からストリーム91を得る。
【0007】
画面内予測部910には、原画像90および再構成画像92が入力される。再構成画像92は、逆直交変換部970から出力される復元差分画像97と、モード選択部930によって出力される予測画像95とが足し合わされて構成される画像である。
【0008】
そして、原画像90と再構成画像92とから、画面内予測処理により適切な画面内予測モードを選択し、画面内予測モードのモード情報を表す画面内予測情報D81、予測結果である画面内予測画像93、および原画像90と画面内予測画像93との差分を表す画面内予測誤差D82を生成する。また、画面内予測情報D81には、画面内予測を行った際のブロックサイズを表す画面内予測ブロックタイプや、画面内予測の方向を表す画面内予測モード情報が含まれる。
【0009】
画面間予測部920は、原画像90と、その前後(過去または未来)の原画像から生成された再構成画像92の入力を受け付け、画面間予測情報D83、画面間予測画像94、および原画像90と画面間予測画像94との差分を表す画面間予測誤差D84を生成する。画面間予測情報D83には、画面間予測を行った際のブロックサイズを表す画面間予測ブロックタイプや、動き補償を行った結果の動きベクトル情報が含まれる。
【0010】
符号化制御部990は、画面内予測部910から入力される画面内予測誤差D82、画面間予測部920から入力される画面間予測誤差D84、および可変長符号化部980から入力される符号量情報D86(後述)から、符号化モード選択アルゴリズムに従い、画面内予測および画面間予測のいずれかの符号化モードを決定する。そして、決定した符号化モードを示す符号化モード選択情報D87をモード選択部930に出力する。また、レート制御アルゴリズムに従い、量子化係数D88を決定し、量子化部950に出力する。
【0011】
なお、符号化モード選択アルゴリズムおよびレート制御アルゴリズムは、ストリーム91の符号量および画質に大きな影響を与えるため、符号化対象となる原画像90の内容や映像符号化の用途によって様々な方式が存在している。
【0012】
モード選択部930は、符号化制御部990から入力された符号化モード選択情報D87に従い、画面内予測部910が選択されている場合は画面内予測画像93を、画面間予測部920が選択されている場合は画面間予測画像94を、予測画像95として出力する。
【0013】
直交変換部940は、原画像90と予測画像95との差分である差分画像96から、直交変換処理によって周波数成分D89を生成する。
【0014】
量子化部950は、符号化制御部990から入力される量子化係数D88と、直交変換部940から入力される周波数成分D89とから量子化処理を行い、情報量を削減した量子化値D90を出力する。
【0015】
逆量子化部960は、量子化値D90に対して逆量子化処理を行い、復元周波数成分D91を生成する。
【0016】
逆直交変換部970は、復元周波数成分D91に対して逆直交変換処理を行い、復元差分画像97を生成する。そして、生成された復元差分画像97と、モード選択部930によって出力された予測画像95とが足し合わされて、再構成画像92として記憶される。
【0017】
可変長符号化部980は、量子化値D90と、画面内予測情報D81もしくは画面間予測情報D83を、より少ないデータ量のデータ列に符号化し、ストリーム91として出力する。また、符号量情報D86を符号化制御部990に出力する。符号量情報D86は可変長符号化後のストリーム91の符号量を示す情報である。
【0018】
図18に示される従来の映像符号化装置において、入力される原画像90には、インタレース(Interlace)とプログレッシブ(Progressive)の二種類が存在する。図19は、インタレース(Interlace)とプログレッシブ(Progressive)について説明する図である。
【0019】
図19(a)に示されるように、インタレースは、プログレッシブに対して画像縦方向1/2に間引いた画像によって構成され、画面上端から奇数ラインだけ抜き出したトップフィールド(top−field)と、偶数ラインだけ抜き出したボトムフィールド(bottom−field)とを交互に描画することで全体を表示する。
【0020】
一方、図19(b)に示されるように、プログレッシブは、間引き処理されないフルサイズの画像によって構成される。
【0021】
ところで、H.264/AVCでは、原画像90がインタレースの場合に、符号化効率を向上させることが可能な適応型フィールド・フレーム符号化(Adaptive−FieldFrameCoding)(以下、「AFF」という)と呼ばれる符号化ツールを備えている(例えば、特許文献1)。
【0022】
図20は、従来のH.264/AVCの適応型フィールド・フレーム符号化(AFF)について説明する図である。AFFは、入力画像がインタレースの場合に、図20(a)に示されるようにトップフィールドとボトムフィールドを一つのフレームとして符号化するフレーム符号化(frame−coding)と、図20(b)に示されるようにトップフィールドとボトムフィールドを別々のピクチャとして符号化するフィールド符号化(field−coding)とを、フレーム単位で切り替えながら符号化する符号化処理方法である。
【0023】
映像の動きが小さい場合や明るさの変化がない場合など、トップフィールドとボトムフィールドに差が少ない場合は、フィールド符号化と比べてフレーム符号化の方が縦方向の画素密度が二倍になり画像内での画素相関が高くなる。よって、画面内予測の精度が向上し、符号化効率が向上することが期待できる。さらに、画面間予測においても、フィールド符号化と比べてフレーム符号化の方が、画素密度の向上により画素ブロックでの予測効率が向上するため、より大きな予測ブロックが選ばれやすくなり符号化効率が向上することが期待できる。
【0024】
一方で、画像内の動きや明るさの変化が大きく、トップフィールドとボトムフィールドの画像間で変化が生じる場合には、フレーム符号化では画像内での画素相関が低くなる。よって、画面内予測および画面間予測のいずれにおいても、フレーム符号化を行うとフィールド符号化を行う場合よりも符号化効率が低下してしまう。
【0025】
このように、H.264/AVCのAFFを使用する場合は、符号化効率を向上させるために、画像の状況に応じてフィールド符号化とフレーム符号化とを適切に切り替えることが重要となる。
【0026】
また、図21は、従来のAFFの符号化モード決定方法の概要を示す図である。従来のH.264/AVCの参照ソフトウェアJMなどでは、AFFの符号化モードを決定するためにマルチパス手法を用いていた。
【0027】
具体的には、原画像90をフレーム符号化用の映像符号化部810とフィールド符号化用の映像符号化部820の両方で符号化し、AFFモード選択部830でいずれか一方の出力ストリームを選択し、これを最終的なストリーム91として出力する。
【0028】
また、AFFには、ピクチャごとにフィールド符号化とフレーム符号化を切り替える方法と、マクロブロックごとにフィールド符号化とフレーム符号化を切り替える方法が存在する。前者はピクチャ適応型フィールド・フレーム符号化(PAFF)、後者はマクロブロック適応型フィールド・フレーム符号化(MBAFF)と呼ばれる。
【0029】
図22は、従来のPAFFおよびMBAFFにおける符号化モード決定方法の概要を示す図である。H.264/AVC規格では、PAFFとMBAFFは入れ子の関係となっており、PAFFでフレーム符号化が選択された場合のみMBAFFを使用することができる関係となっている。PAFFを使用する場合には、フレームに対して、映像符号化部860と映像符号化部870の二系統を用いて、映像符号化部860でフレーム符号化を、映像符号化部870でフィールド符号化を行う。そして、PAFFモード選択部880において、フレームごとに、それぞれの符号化結果からどちらのAFF符号化モードの方が符号化効率が良くなるかを判定し、より効率の良い方の符号化結果を選択する。
【0030】
PAFFでフレーム符号化が選択された場合には、さらにMBAFFを使用することができる。MBAFFを使用する場合にも同様に、映像符号化部として二系統の映像符号化部861、862を用いて、一方の映像符号化部861でフレーム符号化を、他方の映像符号化部862でフィールド符号化を行い、16×32(横画素数×縦画素数。以下同様。)のスーパーMBごとに、それぞれの符号化結果からどちらのAFF符号化モードの方が、符号化効率が良くなるかを判定し、より効率の良い方の符号化結果をMBAFFモード選択部863で選択する。
【0031】
そして、MBAFFモード選択部863およびPAFFモード選択部880で、それぞれ、16×32のスーパーMBごと、フレームごとにいずれか一方の出力ストリームを選択し、これを最終的なストリーム91として出力する。
【先行技術文献】
【特許文献】
【0032】
【特許文献1】特開2008−283595号公報
【発明の概要】
【発明が解決しようとする課題】
【0033】
しかしながら、従来の符号化方法では、1つの入力画像に対して、フレーム単位もしくは16×32画素ブロック単位で、フレーム符号化とフィールド符号化という処理の異なる符号化を複数回行う必要があった。これにより、AFFを使用した場合は、使用しない場合に比べて処理量が2倍以上に増加してしまうという課題があった。
【0034】
そこで、本発明は、このような課題に鑑み、適応的フィールド・フレーム符号化(AFF)を行う映像符号化装置であって、AFFを使用する場合における符号化処理の処理量を削減することが可能な映像符号化装置を提供することを目的とする。
【課題を解決するための手段】
【0035】
上記課題を解決するために、本発明の一態様によれば、入力画像がインタレース画像である場合に、適応的フィールド・フレーム符号化(Adaptive−FieldFrameCoding)のモード判定を行うAFFモード判定部と、前記AFFモード判定部による前記モード判定の判定結果に応じて前記入力画像を符号化する映像符号化部と、を有する映像符号化装置が提供される。
【0036】
この構成によれば、符号化効率を保ちつつ、符号化処理の処理量を削減することが可能である。
【0037】
本発明の他の態様によれば、前記AFFモード判定部は、前記入力画像のフィールド符号化時とフレーム符号化時における画素差分を比較することで前記モード判定を行うことを特徴とする映像符号化装置が提供される。
【0038】
本発明の他の態様によれば、前記AFFモード判定部は、前記映像符号化部において符号化処理が行われたピクチャの画面間予測の結果である動きベクトル情報を用いて前記モード判定を行うことを特徴とする映像符号化装置が提供される。
【発明の効果】
【0039】
本発明によれば、符号化効率を保ちつつ、符号化処理の処理量を削減することが可能である。
【図面の簡単な説明】
【0040】
【図1】本発明の一実施形態に係る映像符号化装置における符号化方法の概念を示す図である。
【図2】本発明の一実施形態に係る映像符号化装置の構成の一例を示す図である。
【図3】映像符号化部110の構成の一例を示す図である。
【図4】原画像生成部150の動作を説明する図である。
【図5】原画像生成部150の構成の一例を示す図である。
【図6】再構成画像変換部160の動作(ライト)を説明する図である。
【図7】再構成画像変換部160の動作(リード)を説明する図である。
【図8】再構成画像変換部160の構成の一例を示す図である。
【図9】VPD方式におけるFRM差分とFLD差分の算出において用いられる画素の並び順の一例を示す図である。
【図10】VPD方式のAFFモード判定の処理フローの一例を示すフロー図である。
【図11】VPD方式におけるFRM差分とFLD差分の算出において用いられる画素の並び順の一例を示す図である。
【図12】VPD方式におけるFRM差分とFLD差分の算出において用いられる画素の並び順の一例を示す図である。
【図13】MV方式の8×8画素ブロック単位のMV導出の概念を示す図である。
【図14】MV方式のAFFモード判定の処理フローの一例を示すフロー図である。
【図15】AFFモードの統合判定の処理フローの一例を示すフロー図である。
【図16】AFFモード判定部140の構成の一例を示す図である。
【図17】本発明の一実施形態に係る映像符号化装置のハードウェア構成の一例を示すブロック図である。
【図18】従来のH.264/AVC符号化処理を行う映像符号化装置の構成を示す図である。
【図19】インタレース(Interlace)とプログレッシブ(Progressive)について説明する図である。
【図20】従来のH.264/AVCの適応型フィールド・フレーム符号化について説明する図である。
【図21】従来のAFFの符号化モード決定方法の概要を示す図である。
【図22】従来のPAFFおよびMBAFFにおける符号化モード決定方法の概要を示す図である。
【発明を実施するための形態】
【0041】
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の説明において参照する各図では、他の図と同等部分は同一符号によって示される。
【0042】
(符号化方法の概念)
図1は、本実施形態に係る映像符号化装置における符号化方法の概念を示す図である。
【0043】
本実施形態に係る符号化方法では、映像符号化装置に入力される原画像10の符号化を行う(S02)前に、フレーム符号化とフィールド符号化のいずれの方法で符号化した方が、符号化効率が良いかを判定するAFFモード判定を行い(S01)、このAFFモード判定の結果に従ってフレーム符号化かフィールド符号化のいずれか一方のみの符号化を行う。
【0044】
これにより、従来の符号化方法に対して符号化効率をほとんど落とすことなく、符号化処理の処理量を削減することができる。
【0045】
(映像符号化装置の構成)
図2は、本実施形態に係る映像符号化装置の構成の一例を示す図である。映像符号化装置1は、H.264/AVC符号化を行う映像符号化部110、再構成画像を蓄積する外部メモリ120、符号化モードの決定などを行う符号化制御部130、AFFモードの判定を行うAFFモード判定部140、判定されたAFFモードに基づいて入力画像9から原画像10を生成する原画像生成部150、映像符号化部110と外部メモリ120との間でAFFモードに合わせて再構成画像を変換する再構成画像変換部160、および再構成画像変換部160と外部メモリ120との間を仲介するメモリバス170を含んで構成される。
【0046】
映像符号化部110は、原画像生成部150から16×16画素のマクロブロック(MB)単位で出力される原画像10を受け付け、符号化制御部130から出力される符号化モード情報に従って画面間予測もしくは画面内予測によるH.264/AVC符号化を行い、ストリーム11を出力する。
【0047】
符号化制御部130は、映像符号化装置1の外部からの符号化設定情報S1の入力を受け付けるとともに、映像符号化部110からの符号化に関する情報の入力を受け付ける。符号化設定情報S1は、映像符号化部110の動作を制御するための情報である。また、映像符号化部110に画面間予測もしくは画面内予測のいずれかの符号化モードを示す符号化モード選択情報を出力する。
【0048】
AFFモード判定部140は、映像符号化装置1の外部から入力される入力画像9、映像符号化部110から入力される動きベクトル(MV)情報に基づいて、AFFモード判定を行い、判定結果をAFFモード判定情報として出力する。
【0049】
原画像生成部150は、AFFモード判定部140から出力されるAFFモード判定情報に基づいて、映像符号化装置1の外部から入力される入力画像9を変換し、原画像10を生成して映像符号化部110に出力する。
【0050】
再構成画像変換部160は、映像符号化部110から外部メモリ120に対して再構成画像のデータが書き込み・読み出しが行われる際に、AFFモード判定部140から出力されるAFFモード判定情報に基づいて再構成画像のデータの変換を行う。
【0051】
外部メモリ120は、映像符号化部110が一時的に再構成画像を蓄積するために用いられるメモリである。すなわち、外部メモリ120は、メモリバス170を経由して、映像符号化部110から出力される再構成画像をバッファリングする。外部メモリ120は、例えばDRAM等の揮発性メモリで構成される。
【0052】
以下、主要な構成について詳述する。
【0053】
(映像符号化部110)
以下、映像符号化部110について詳述する。図3は、映像符号化部110の構成の一例を示す図である(なお、図3においては映像符号化部110とその他の構成との関連性を示すために、映像符号化部110以外の構成も示されている)。
【0054】
図3に示されるように、映像符号化部110は、画面内予測部210、画面間予測部220、モード選択部230、直交変換部240、量子化部250、逆量子化部260、逆直交変換部270、および可変長符号化部280を含んで構成される。
【0055】
画面内予測部210は、原画像生成部150(図2)から出力される原画像10が入力されるととともに、カレントMB(符号化処理中のマクロブロック)の周囲の再構成画像12が入力され、画面内予測情報D1、画面内予測結果である画面内予測画像13、および原画像10と画面内予測画像13との差分を表す画面内予測誤差D2を生成する。そして、画面内予測情報D1は可変長符号化部280に、画面内予測画像13はモード選択部230に、画面内予測誤差D2は符号化制御部130に、それぞれ出力する。
【0056】
画面間予測部220は、原画像生成部150(図2)から出力される原画像10が入力されるとともに、再構成画像変換部160において過去または未来の原画像10(処理中の原画像10よりも前または後に入力された原画像10)から生成された再構成画像12’が入力される。なお、この再構成画像12’は、メモリコントローラ(再構成画像変換部160)が、外部メモリ120に保存されている再構成画像12を読み出すものである。
【0057】
そして、動きベクトル情報を含む画面間予測情報D3、画面間予測結果である画面間予測画像14、および原画像10と画面間予測画像14との差分を表す画面間予測誤差D4を生成する。そして、画面間予測情報D3は可変長符号化部280に、画面間予測画像14はモード選択部230に、画面間予測誤差D4は符号化制御部130に、それぞれ出力する。
【0058】
なお、符号化制御部130は、画面内予測部210から出力される画面内予測誤差D2、画面間予測部220から出力される画面間予測誤差D4、および可変長符号化部280から出力される符号量情報D6から、符号化モード選択アルゴリズムに従って符号化モード(画面間予測もしくは画面内予測)を決定し、決定した符号化モードを示す符号化モード選択情報D7をモード選択部230に出力する。また、レート制御アルゴリズムに従って量子化係数D8を決定し、量子化部250に出力する。
【0059】
符号化制御部130で用いられる符号化モード選択アルゴリズムおよびレート制御アルゴリズムは、ストリームの符号量および画質に大きな影響を与えるため、符号化対象となる原画像10の内容や映像符号化の用途によって様々な方式が存在する。
【0060】
モード選択部230は、符号化制御部130から入力された画面内予測および画面間予測のいずれかの符号化モードを示す符号化モード選択情報D7に従い、符号化モード選択情報D7において画面内予測が選択されている場合は画面内予測画像13を、画面間予測が選択されている場合は画面間予測画像14を、予測画像15として出力する。
【0061】
直交変換部240は、原画像10と予測画像15との差分である差分画像16に対して直交変換処理を行って周波数成分D9を生成し、量子化部250に出力する。
【0062】
量子化部250は、符号化制御部130から出力される量子化係数D8と、直交変換部240から出力される周波数成分D9とから量子化処理を行い、情報量を削減した量子化値D10を出力する。
【0063】
逆量子化部260は、量子化値D10に対して逆量子化処理を行い、復元周波数成分D11を生成して逆直交変換部270に出力する。
【0064】
逆直交変換部270は、復元周波数成分D11に対して逆直交変換処理を行い、復元差分画像17を生成して出力する。なお、この復元差分画像17と、モード選択部230によって選択された予測画像15とが足し合わされて再構成画像12が生成され、生成された再構成画像12は外部メモリ120に記憶される。
【0065】
可変長符号化部280は、量子化値D10と、画面内予測情報D1又は画面間予測情報D3とを、より少ないデータ量のデータ列に符号化し(可変長符号化)、ストリーム11として出力するとともに、符号量情報D6を符号化制御部130に出力する。符号量情報D6は可変長符号化後のストリーム11の符号量を示す情報である。
【0066】
(原画像生成部150)
以下、原画像生成部150について詳述する。図4は、原画像生成部150の動作を説明する図である。
【0067】
上述したように、映像符号化部110では、16×16画素のMB単位で符号化処理が行われる。そこで、原画像生成部150は、AFFモード判定部140から出力されるAFFモード判定情報を受け付け、このAFFモード判定情報により示されるAFFモード判定結果に応じて入力画像9を変換し、MB単位の原画像10として出力する。
【0068】
入力画像9がインタレース画像の場合は、AFFモード判定部140のAFFモード判定結果に応じて出力する原画像10を生成する。この時、AFFモード判定結果がフィールド符号化を示している場合は、入力画像9のトップフィールドとボトムフィールドのどちらか一方から16×16画素を切り出してMB単位の原画像10として出力する(図4(a))。
【0069】
一方で、AFFモード判定結果がフレーム符号化を示している場合は、トップフィールドとボトムフィールドの両方から16×8画素を切り出し、トップフィールドとボトムフィールドを1ライン毎に交互に並べて16×16画素に変換してからMB単位の原画像10として出力する(図4(b))。
【0070】
なお、入力画像9がプログレッシブ画像の場合はAFF処理が行われないため、AFFモード判定結果によらず、16×16画素をそのまま切り出してMB単位の原画像10として出力する。
【0071】
図5は、原画像生成部150の構成の一例を示す図である。原画像生成部150は、原画像変換部151と、原画像用メモリ152とを含んで構成される。
【0072】
原画像用メモリ152は、入力画像9がインタレース画像の場合にのみ使用されるメモリであり、原画像10を1フィールド分バッファリングするためのメモリである。
【0073】
原画像変換部151は、AFFモード判定部140(図2)から出力されるAFFモード判定情報D21に応じて入力画像9を変換する。具体的には、入力画像9がインタレース画像であり、かつAFFモード判定情報D21においてフィールド符号化モードが選択されている場合は、原画像用メモリ152から入力画像9のトップフィールドもしくはボトムフィールドのいずれか一方から16×16画素分を読み出してMB単位の原画像10として出力する。
【0074】
一方、入力画像9がインタレース画像であり、AFFモード判定情報D21においてフレーム符号化モードが選択されている場合は、原画像用メモリ152から入力画像9のトップフィールドとボトムフィールドとを、それぞれ16×8画素分読み出し、トップフィールドとボトムフィールドとを1ラインごとに交互に並べて16×16画素でMB単位の原画像10として出力する。
【0075】
なお、原画像変換部151は、入力された入力画像9がプログレッシブ画像の場合は、入力画像9を16×16画素でそのまま原画像10として出力する。
【0076】
(再構成画像変換部160)
以下、再構成画像変換部160について詳述する。図6および図7は、再構成画像変換部160の動作を説明する図である。再構成画像変換の動作のうち、再構成画像12のライト(書き込み)に関わるものを図6に、再構成画像12のリード(読み出し)に関わるものを図7に示す。
【0077】
再構成画像変換部160は、AFFモード判定部140から出力されるAFFモード判定情報D21に応じて、映像符号化部110から出力される再構成画像12を変換して外部メモリ120に書き出す一方で、外部メモリ120から適切なタイミングで読み出した再構成画像12を変換して映像符号化部110に供給する動作を行う。
【0078】
(ライト動作)
入力画像9がプログレッシブ画像か、もしくは入力画像9がインタレース画像でかつAFFモード判定情報D21がフィールド符号化モードを示している場合は、再構成画像12を変換せずにそのまま外部メモリ120に書き出す(図6(b))。
【0079】
一方で、入力画像9がインタレース画像でかつAFFモード判定情報D21がフレーム符号化を示している場合は、再構成画像12をトップフィールドとボトムフィールドに分割して外部メモリ120に書き出す(図6(a))。
【0080】
(リード動作)
入力画像9がプログレッシブ画像か、もしくは入力画像9がインタレース画像でかつAFFモード判定情報D21がフィールド符号化モードを示している場合は、そのまま外部メモリ120から再構成画像12を読み出す(図7(b))。
【0081】
一方で、入力画像9がインタレース画像でかつAFFモード判定情報D21がフレーム符号化を示している場合は、トップフィールド用とボトムフィールド用の2つのメモリ領域から画像データを読み出し、1ラインごとに交互に並び替えを行うことで1枚の再構成画像12として出力する(図7(a))。
【0082】
図8は、再構成画像変換部160の構成の一例を示す図である。再構成画像変換部160は、再構成画像ライト部161と、再構成画像リード部162とを含んで構成される。
【0083】
再構成画像ライト部161は、AFFモード判定情報D21の入力を受け付け、このAFFモード判定情報D21に応じて映像符号化部110から出力される再構成画像12を変換し外部メモリ120に書き出す。具体的には、入力画像9がインタレース画像で、かつAFFモード判定情報D21がフレーム符号化モードを示している場合は、受け付けた再構成画像12をトップフィールドとボトムフィールドとに分割して外部メモリ120に書き出す。
【0084】
一方で、入力画像9がプログレッシブ画像か、もしくは入力画像9がインタレース画像でかつAFFモード判定情報D21がフィールド符号化モードを示している場合には、再構成画像12をそのまま外部メモリ120に書き出す。
【0085】
再構成画像リード部162は、AFFモード判定情報D21に応じて外部メモリ120から読み出した再構成画像12を変換し、映像符号化部110に出力する。具体的には、再構成画像リード部162は、入力画像9がインタレース画像でかつAFFモード判定情報D21がフレーム符号化モードを示している場合は、外部メモリ120からトップフィールドとボトムフィールドの同じ画素位置から画素値を読み出し、1ラインごとに交互に並べて再構成画像12として出力する。
【0086】
一方で、入力画像9がプログレッシブ画像か、入力画像9がインタレース画像でかつAFFモード判定情報がフィールド符号化モードを示している場合には、外部メモリ120から読み出した再構成画像12をそのまま映像符号化部110へ出力する。
【0087】
(AFFモード判定部140)
以下、AFFモード判定部140におけるAFFモード判定のアルゴリズムについて説明する。
【0088】
本実施形態においては、AFFモード判定アルゴリズムには、一例として、入力画像9のテクスチャ情報を用いるVPD(Vertical Pixel Difference)方式と、画面間予測部220から出力される動きベクトル(MV)情報を用いるMV方式の2方式を利用する。
【0089】
そして、AFFモード判定部140では、この2つの方式によってAFFモード判定を行った上で、これらの判定結果を統合して最終的なAFFモードを決定してAFFモード判定情報を出力する。
【0090】
(VPD方式)
まず、AFFモード判定アルゴリズムのうち、入力画像9のテクスチャ情報に基づいてAFFモード判定を行うVPD方式について説明する。
【0091】
VPD方式は、入力画像9のテクスチャ情報から画素単位でフレーム差分(以下、「FRM差分」という)とフィールド差分(以下、「FLD差分」という)の2つの特徴量を計算し、これらの計算結果を比較することでAFFモード判定を行う方式である。
【0092】
図9に示されるように、以下に説明するVPD方式では、一例として、画像中、縦方向において同じ位置に並ぶ各フィールドの画素T1、B1、T2、B2、T3、B3、・・・の画素値を用いてFRM差分とFLD差分とを算出する。具体的には、FRM差分とFLD差分は以下の式(1)、式(2)によって算出することが可能である。なお、以下の算出式は、画素Bnの位置に対して画素差分により各特徴量(FRM差分、FLD差分)を算出するものである。(式(1)、式(2)において、VTnは画素Tnの画素値、VBnは画素Bnの画素値、abs(x)はxの絶対値である。)

【0093】
【数1】



VPD方式のAFFモード判定の処理フローの一例を図10に示す。
【0094】
まず、初期値として、FRM符号化画素数=0、FLD符号化画素数=0、と設定する(ステップS1201)。
【0095】
上記の式(1)、式(2)によりFRM差分値とFLD差分値を計算する(ステップS102)。ステップS102で算出されたFRM差分とFLD差分とを比較し、FRM差分値≧FLD差分値であれば(ステップS103)、FLD符号化画素数を1加算し(ステップS104)、FRM差分<FLD差分であれば(ステップS103)、FRM符号化画素数を1加算する(ステップS105)。
【0096】
ピクチャ適応型フィールド・フレーム符号化(PAFF)における判定ならば1フレーム、マクロブロック適応型フィールド・フレーム符号化(MBAFF)における判定ならば16×32画素の評価対象範囲内の画素値に対してステップS102〜ステップS105の処理を繰り返す(ステップS106)。
【0097】
上記の評価対象の評価が完了した場合には、FRM符号化画素数とFLD符号化画素数とを比較し、FRM符号化画素数≧FLD符号化画素数であれば(ステップS107)、“フレーム符号化”をVPD判定結果として出力し(ステップS108)、FRM符号化画素数<FLD符号化画素数であれば(ステップS107)、“フィールド符号化”をVPD判定結果として出力する(ステップS109)。ここで出力されたVPD判定結果は、後述する統合判定に用いられる。
【0098】
なお、上記のVPD方式におけるFRM差分とFLD差分を算出する式(1)および式(2)は、フレーム符号化時とフィールド符号化時のテクスチャの差分を計算することがその目的である。よって、この目的に沿うものであれば上記の式(1)および式(2)とは異なる計算式を用いても有効である。例えば、以下のような計算式を採用してもよい。以下の式(3)および式(4)は、画素Bnの位置に対して画素差分により各特徴量(FRM差分、FLD差分)を算出するものである。

【0099】
【数2】



さらに、このVPD方式のFRM差分とFLD差分の上記算出式(1)〜(4)で計算に用いる画素値は、フレーム符号化時とフィールド符号化時のテクスチャの差分を計算するために用いられるものである。よって、この目的に沿うものであれば、必ずしも画像中、縦方向に並ぶ画素の画素値である必要はなく、例えば、図11に示されるように、画像中において斜め方向に並ぶ画素T1、B1、T2、B2、T3、B3、・・・の画素値であっても有効である。
【0100】
また、同様に、図12に示されるように、画像中、異なる複数の方向21〜25に並ぶ画素列の中から、最も画素差分が小さくなる画素列の画素差分を特徴量として用いる方法も有効である。このように、画素差分が小さくなる方向の画素差分を特徴量として用いることにより、評価画素内にエッジがある場合にエッジに沿った特徴量を判定に用いることで、一般に人間の目で注視されやすいエッジの画質を向上させることができるという利点がある。
【0101】
(MV方式)
MV方式は、画面間予測部220から前ピクチャの動きベクトル(以下、「MV」という)の入力を受け付け、この動きベクトルの大きさと閾値(以下、「MV閾値」という)とを比較することでAFFモード判定を行う方式である。以下、MV方式によるAFFモード判定について説明する。
【0102】
まず、AFFモード判定部140は、画面間予測部220からMV(動きベクトル)を取得する。このとき、MVは8×8画素ブロック単位などに統一する。図13は、MV方式の8×8画素ブロック単位のMV導出の概念を示す図である。
【0103】
具体的には、16×16画素ブロックのMVが1つである場合は、各8×8画素ブロックに対して16×16画素ブロックのMVを割り当てる(図13(a))。8×16画素ブロックもしくは16×8画素ブロックのMVについては、各8×8画素ブロックの個数分のMVを割り当てる(図13(b))。
【0104】
4×4画素ブロック、4×8画素ブロック、8×4画素ブロックについては、8×8画素ブロックごとに内部に含まれる4×4画素ブロック単位のMVを平均してMVを求める(図13(c))。
【0105】
なお、MVはフレーム符号化されたものとフィールド符号化されたものの、どちらでもよい。また、MVの取得単位は、図13の例では8×8画素ブロックとしたが、これに限らず、4×4画素ブロック単位や16×16画素ブロック単位などでも構わない。
【0106】
次に、以下の式(5)により動きベクトルコストMVCostを計算する。

【0107】
【数3】



式(5)において、MVxはX座標のMV、MVyはY座標のMVであり、WxとWyはそれぞれMVxとMVyの重みである。重みWxとWyは任意の値を設定可能とするが、AFFモード判定では、画像中の縦方向の動きのほうが横方向の動きよりも重要となるため、Wx=0.5、Wy=1、等とWyをWxよりも大きな値に設定するのが好ましい。
【0108】
MV方式のAFFモード判定の処理フローの一例を図14に示す。
【0109】
まず、初期値として、FRM符号化MV数=0、FLD符号化MV数=0、と設定する(ステップS201)。
【0110】
次に、上記式(5)により動きベクトルコストMVCostを算出する(ステップS202)。MVCost<MV閾値である場合は(ステップS203)、FRM符号化MV数を1インクリメントし(ステップS205)、MVCost≧MV閾値の場合は(ステップS203)、FLD符号化MV数を1インクリメントする(ステップS204)。この方式では、縦方向の動きの大きい画像ではFRM符号化よりもFLD符号化の方が符号化効率が高くなることを利用して、FRM符号化とFLD符号化のどちらに適した動きベクトルが多いのかを評価することを意図している。なお、ステップS203におけるMV閾値は、画像サイズによって適当な値が異なるため、映像符号化装置1の外部の装置等から設定可能とするのが好ましい。
【0111】
ピクチャ適応型フィールド・フレーム符号化(PAFF)における判定ならば1フレーム、マクロブロック適応型フィールド・フレーム符号化(MBAFF)における判定ならば16×32画素の評価対象範囲内の画素ブロックが有するMVに対してステップS022〜ステップS205の処理を繰り返す(ステップS206)。
【0112】
上記の評価対象の評価が完了した場合には、FLD符号化MV数とFRM符号化MV数とを比較し、FRM符号化MV数≧FLD符号化MV数であれば(ステップS207)、“フレーム符号化”をMV判定結果として出力し(ステップS208)、FRM符号化MV数<FLD符号化MV数であれば(ステップS207)、“フィールド符号化”をMV判定結果として出力する(ステップS209)。なお、ここで出力されたMV判定結果は、後述する統合判定に用いられる。
【0113】
また、上記のMVCostを計算するための式(5)は、MVの大きさを計算することがその目的である。よって、MVの大きさを計算可能な式であれば異なる計算式を用いてもよい。例えば、以下のような計算式を採用しても構わない。

【0114】
【数4】



【0115】
上記に説明したMV方式は、従来の映像符号化装置と同様の仕組みを利用できるため、実装コストが低く、従来の映像符号化装置と比較しても処理量の増加はほとんど無いという利点がある。
【0116】
(VPD方式とMV方式の統合判定)
本実施形態においては、AFFモード判定部140では、上述したVPD方式とMV方式によりAFFモードの判定を行った後、これらの判定結果を統合して最終的なAFFモードを決定する。
【0117】
図15は、統合判定の処理フローの一例を示すフロー図である。
【0118】
まず、VPD判定結果を取得する(ステップS301)。本ステップでの処理は、具体的には図10に示される処理である。また、MV判定結果を取得する(ステップS302)。本ステップでの処理は、具体的には図14に示される処理である。
【0119】
ここで、AFFモード判定部140では、ステップS301で取得されたVPD判定結果を有効とするか無効とするかを示すVPDイネーブル(VPD判定フラグ)と、ステップS302で取得されたMV判定結果を有効とするか無効とするかを示すMVイネーブル(MV判定フラグ)を有している。以下の処理においては、VPD判定結果、MV判定結果、VPD判定フラグ、およびMV判定フラグの内容に応じて最終的なAFFモード判定が行われる(ステップS303、S304)。
【0120】
すなわち、VPD判定結果とMV判定結果の双方が“フレーム符号化”であれば、最終的なAFFモード判定結果として“フレーム符号化”を出力する(ステップS305)。
【0121】
VPD判定結果が“フレーム符号化”であり、かつMV判定結果が“フィールド符号化”の場合であって、VPD判定フラグが有効の場合は“フレーム符号化”を出力し(ステップS305)、無効の場合は“フィールド符号化”を出力する(ステップS306)。
【0122】
VPD判定結果が“フィールド符号化”であり、かつMV判定結果が“フレーム符号化”の場合であって、MV判定フラグが有効の場合は“フレーム符号化”を出力し(ステップS305)、MV判定フラグが無効の場合は“フィールド符号化”を出力する(ステップS306)。
【0123】
VPD判定結果とMV判定結果の双方が“フィールド符号化”である場合は、最終的なAFFモード判定結果として“フィールド符号化”を出力する(ステップS306)。
【0124】
図16は、AFFモード判定部140の構成の一例を示す図である。AFFモード判定部140は、VPD判定部141と、MV判定部142と、統合判定部143と、変更部144と、を含んで構成される。
【0125】
VPD判定部141は、VPDバッファ141aに画素情報D31をバッファリングし、VPD方式に従って図10に示されるAFFモード判定処理を行い、この判定結果であるVPD判定結果を出力する。
【0126】
MV判定部142は、映像符号化部110の画面間予測部220から入力されるMV情報D32をMVバッファ142aにバッファリングし、符号化制御部130から入力されるMV閾値D33を用いて、MV方式に従って図14に示されるAFFモード判定処理を行い、この判定結果であるMV判定結果を出力する。
【0127】
統合判定部143は、符号化制御部130からVPDフラグ(VPDイネーブル)信号とMVフラグ(MVイネーブル)信号の入力を受け付ける。そして、このVPDフラグ信号、MVフラグ信号、VPD判定部141からのVPD判定結果、およびMV判定部142からのMV判定結果から、図15に示される統合判定アルゴリズムに従って、最終的なAFFモードの判定結果を出力する。
【0128】
変更部144は、統合判定部143におけるAFFモード判定に関する設定を変更する。例えば、VPD判定部141におけるVPD判定結果とMV判定部142におけるMV判定結果とに対する重み(例えば、後述する式(7)における重みWvpd、Wmv)を映像符号化装置1の動作設定に応じて自動的に変更する場合が挙げられる。また、ユーザの入力操作を受け付けることによって手動でその都度変更される等となっていてもよい。
【0129】
以上説明したAFFモード判定方法によれば、VPD方式とMV方式という原理の異なる2つのAFFモード判定方式を組み合わせることで、それぞれの方式で不得意とする入力画像や符号化状況に対しても適切なモード選択を行うことができ、符号化効率を向上させることができる。
【0130】
ところで、VPD方式とMV方式においては、上記説明した方法以外にも、AFFモード判定に利用可能な情報や、AFFモード判定処理において生じる遅延などに応じて、様々なアルゴリズムを選択することが可能である。以下、AFFモード判定方法の変形例について説明する。
【0131】
(AFFモード判定方法の変形例)
以下では、統合判定部143にて実行される統合判定アルゴリズムにおいて重み付けを用いる方法(以下、「重み付け統合判定」という)について説明する。
【0132】
具体的には、統合判定部143は、VPD方式のFRM符号化画素数とFLD符号化画素数、およびMV方式のFRM符号化MV数とFLD符号化MV数を用いて、以下の判定式を用いてAFFモード評価を行う。(下記式(7)において、WvpdはVPD方式に対する重み係数、WmvはMV方式に対する重み係数)

【0133】
【数5】



統合判定部143は、最終的なAFFモード判定結果として、上記式(7)の判定式が成立する場合には“フィールド符号化”を、成立しない場合には“フレーム符号化”を選択する。
【0134】
本例の重み付け統合判定によれば、画像サイズや符号化処理状況に応じて適切な重み係数WvpdとWmvを指定することで符号化処理効率を向上させることが可能となる。
【0135】
ところで、MV方式では画面間予測結果であるMVを判定に用いるため、符号化処理中のカレントピクチャのMVを使用することはできないという特徴がある。そのため、MV方式では、AFFモード判定を行うタイミングと画面間予測処理の動作タイミングとの間に存在する遅延が大きければ大きいほど前ピクチャの画面間予測結果を使用する必要がある。これにより、AFFモードの判定精度が落ちてしまう可能性がある。
【0136】
一方、VPD方式では、入力画像9をAFFモード判定に使用しているため、入力画像9を構成する画素を保持するための内部バッファを備える必要がある。また、AFFモード評価の評価単位に合わせて画素を保持するために、画像サイズが大きくなるとバッファも大きなものが必要になる、という特徴がある。
【0137】
そのため、VPD方式では、使用可能な画素バッファ量が決まっている場合は画像サイズに応じて確保できる縦画素ライン数が変わるため、画像サイズが大きくなると確保できる縦ピクセルライン数が減少してしまい、AFFモード判定の精度が落ちてしまう可能性がある。
【0138】
そこで、統合判定アルゴリズムに重み付け統合判定を用いる際に、映像符号化装置1の動作時にユーザが要求する遅延量や画像サイズに応じて、重み付け統合判定のVPD方式とMV方式の重み係数を変更部144によって変更することで、AFFモード判定の精度の低下を防止することが可能である。
【0139】
以下、重み係数の変更方法の一例について説明する。
【0140】
本例では、VPD方式に影響を与える画像サイズは、1920×1080と720×480のいずれかが選択されるものとする。
【0141】
また、1920×1080で1MB毎に縦1画素ラインで16画素分のバッファを持つとする。この場合、720×480の画像では画像サイズの比率が約1/6となるため、同じ容量のバッファにおいては、1MBあたり縦6画素ラインで96画素をバッファリングすることが可能となる。
【0142】
そのため、VPD方式では画像サイズが1920×1080である場合よりも、画像サイズが720×480である場合の方が、高精度なAFFモード判定が可能となる。
【0143】
そこで、例えば、VPD方式の重み係数Wvpdに画像サイズ1920×1080の場合は“1”を、画像サイズ720×480の場合は“2”を指定すること等により、画像サイズによるAFFモード判定の精度の違いに対応することが可能になる。
【0144】
また、本例では、MV方式に影響を与える遅延量は、1フレーム遅延と2フレーム遅延のいずれかが選択されるものとする。
【0145】
この時、1フレーム遅延の場合では、MV方式は、1フレーム+1フレーム=2フレーム前のピクチャの画面間予測結果のMVを使用する。一方で、2フレーム遅延では、MV方式は、1フレーム+2フレーム=3フレーム前のピクチャの画面間予測結果のMVを使用することとなる。
【0146】
したがって、MV方式では、2フレーム遅延の場合よりも1フレーム遅延の場合の方がより高精度なAFFモード判定が可能となる。
【0147】
そこで、例えば、MV方式の重み係数Wmvに1フレーム遅延の場合は“4”を、2フレーム遅延の場合には“3”を指定すること等により、要求される遅延時間によって生じるAFFモード判定の精度の違いに対応することが可能となる。
【0148】
このように、VPD方式とMV方式の重み付け統合判定に関して、各方式において影響のある映像符号化装置1の動作パラメータに応じて重み係数WvpdとWmvの値を変更部144で変更することで、より高精度なAFFモード判定を行うことができ、符号化効率を向上することが可能となる。
【0149】
なお、重み付け統合判定の重み係数に影響を与える要素として、上記の変形例では遅延量と画素バッファ量を挙げたがこれに限定されるものではなく、VPD方式とMV方式の判定精度に影響を与える要素であれば他のものにも適用可能である。
【0150】
また、VPD方式とMV方式の重み係数WvpdとWmvの値についても、上記説明中に示した数値には限られず、他の値であってもよい。
【0151】
以上のAFFモード判定方法によれば、必要な判定精度や符号化遅延に応じて2方式のAFFモード判定の結果に重み付けをすることで、用途に応じた適切なAFFモード判定方法を選択することが可能である。これにより、さらに符号化効率を向上させることが可能である。
(映像符号化装置のハードウェア構成)
図17は、本実施形態による映像符号化装置のハードウェア構成の一例を示すブロック図である。図17に示されるコンピュータ装置である映像符号化装置1において、CPU301は、ROM304および/またはハードディスクドライブ306に格納されたプログラムに従い、RAM305を一次記憶用ワークメモリとして利用して、システム全体を制御する。
【0152】
これにより、上記説明した本実施形態に係る映像符号化装置における映像符号化部110、符号化制御部130、AFFモード判定部140、原画像生成部150、および再構成画像変換部160における処理が実現される。また、本実施形態に係る映像符号化装置における外部メモリ120は、RAM305やハードディスクドライブ306等により実現可能である。
【0153】
また、上記説明した入力画像9、原画像10、ストリーム11、再構成画像12、符号化設定情報S1、AFFモード判定情報D21、画素情報D31、MV(動きベクトル)情報D32、MV閾値D33、およびその他のデータは、RAM305やハードディスクドライブ306等の記憶領域に記憶されるデータである。
【0154】
さらに、CPU301は、マウス302aまたはキーボード302を介して入力されるユーザの指示に従い、ハードディスクドライブ306に格納されたプログラムに基づき、本実施形態に係る映像符号化処理における各種データの設定変更等を実行する。ディスプレイインタフェース303には、CRTやLCDなどのディスプレイが接続され、CPU301が実行する映像符号化処理の設定変更画面、処理経過、処理結果等のユーザに対する情報等が表示される。
【0155】
リムーバブルメディアドライブ307は、主に、リムーバブルメディアからハードディスクドライブ306へファイルを書き込んだり、ハードディスクドライブ306から読み出したファイルをリムーバブルメディアへ書き込む場合に利用される。リムーバブルメディアとしては、フロッピディスク(FD)、CD−ROM、CD−R、CD−R/W、DVD−ROM、DVD−R、DVD−R/W、DVD−RAMやMO、あるいはメモリカード、CFカード、スマートメディア、SDカード、メモリスティックなどが利用可能である。
【0156】
ネットワークインタフェース308は、コンピュータ装置である映像符号化装置1を外部のネットワークへ接続するためのインタフェースである。例えば、入力画像9はネットワークインタフェース308を介して映像符号化装置1に入力され、符号化処理後のストリーム11はネットワークインタフェース308を介して映像符号化装置1から外部の装置等に出力される。
【0157】
なお、図17に示した本実施形態に係る映像符号化装置のハードウェア構成は一例に過ぎず、その他の任意のハードウェア構成を用いることができることはいうまでもない。
(まとめ)
以上のとおり、本実施形態によれば、符号化効率を保ちつつ、符号化処理の処理量を削減することが可能である。
【0158】
なお、本発明の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本発明が目的とするものと均等な効果をもたらすすべての実施形態をも含む。さらに、本発明の範囲は、すべての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。
【0159】
(付記)
以上に、本発明に係る実施形態について詳細に説明したことからも明らかなように、前述の実施形態の一部または全部は、以下の各付記のようにも記載することができる。しかしながら、以下の各付記は、あくまでも、本発明の単なる例示に過ぎず、本発明は、かかる場合のみに限るものではない。
【0160】
(付記1)
入力画像がインタレース画像である場合に、適応的フィールド・フレーム符号化(Adaptive−FieldFrameCoding)のモード判定を行うAFFモード判定部と、
前記AFFモード判定部による前記モード判定の判定結果に応じて前記入力画像を符号化する映像符号化部と、
を有する映像符号化装置。
【0161】
この構成によれば、符号化効率を保ちつつ、符号化処理の処理量を削減することが可能である。
【0162】
(付記2)
前記AFFモード判定部は、前記入力画像のフィールド符号化時とフレーム符号化時における画素差分を比較することで前記モード判定を行うことを特徴とする付記1に記載の映像符号化装置。
【0163】
(付記3)
前記AFFモード判定部は、前記映像符号化部において符号化処理が行われたピクチャの画面間予測の結果である動きベクトル情報を用いて前記モード判定を行うことを特徴とする付記1又は2に記載の映像符号化装置。
【0164】
(付記4)
前記AFFモード判定部は、
前記入力画像のフィールド符号化時とフレーム符号化時における画素差分を比較することで適応的フィールド・フレーム符号化のモード判定を行うVPD(Vertical Pixel Difference)判定部と、
前記映像符号化部において符号化処理が行われたピクチャの画面間予測の結果である動きベクトル情報を用いて適応的フィールド・フレーム符号化のモード判定を行うMV(Motion Vector)判定部と、
前記VPD判定部におけるモード判定結果と、前記MV判定部におけるモード判定結果とから、前記モード判定を行う統合判定部と、
を有する付記1から3のいずれか一項に記載の映像符号化装置。
【0165】
この構成によれば、VPD方式とMV方式という原理の異なる2つのAFFモード判定方式を組み合わせることで、それぞれの方式で不得意とする入力画像や符号化状況に対しても適切なモード選択を行うことができ、符号化効率を向上させることができる。
【0166】
(付記5)
前記統合判定部は、前記VPD判定部におけるモード判定結果と、前記MV判定部におけるモード判定結果とに対して重み付けを行うことで前記モード判定を行うことを特徴とする付記4に記載の映像符号化装置。
【0167】
この構成によれば、画像サイズや符号化処理状況に応じて適切な重み係数を指定することで符号化処理効率を向上させることが可能となる。
【0168】
(付記6)
前記AFFモード判定部は、
前記統合判定部における前記モード判定に関する設定を変更する変更部をさらに有する付記4又は5に記載の映像符号化装置。
【0169】
この構成によれば、VPD方式とMV方式の各方式において影響のある映像符号化装置の動作パラメータに応じて重み係数の値を変更することで、より高精度なAFFモード判定を行うことができ、符号化効率を向上することが可能となる。
【0170】
(付記7)
AFFモード判定部と、映像符号化部と、を有する映像符号化装置が実行する映像符号化方法であって、
前記AFFモード判定部により、入力画像がインタレース画像である場合に、適応的フィールド・フレーム符号化(Adaptive−FieldFrameCoding)のモード判定を行う第1のステップと、
前記映像符号化部により、前記第1のステップにおける前記モード判定の判定結果に応じて前記入力画像を符号化する第2のステップと、
を有する映像符号化方法。
【0171】
この構成によれば、符号化効率を保ちつつ、符号化処理の処理量を削減することが可能である。
【0172】
(付記8)
コンピュータに、
入力画像がインタレース画像である場合に、適応的フィールド・フレーム符号化(Adaptive−FieldFrameCoding)のモード判定を行う第1のステップと、
前記第1のステップにおける前記モード判定の判定結果に応じて前記入力画像を符号化する第2のステップと、
を実行させるための映像符号化プログラム。
【0173】
この構成によれば、符号化効率を保ちつつ、符号化処理の処理量を削減することが可能である。
【符号の説明】
【0174】
1 映像符号化装置
9 入力画像
10 原画像
11 ストリーム
12、12’ 再構成画像
13 画面内予測画像
14 画面間予測画像
15 予測画像
16 差分画像
17 復元差分画像
110 映像符号化部
120 外部メモリ
130 符号化制御部
140 AFFモード判定部
141 VPD判定部
141a VPDバッファ
142 MV判定部
142a MVバッファ
143 統合判定部
144 変更部
150 原画像生成部
151 原画像変換部
152 原画像用メモリ
160 再構成画像変換部
161 再構成画像ライト部
162 再構成画像リード部
170 メモリバス
210 画面内予測部
220 画面間予測部
230 モード選択部
240 直交変換部
250 量子化部
260 逆量子化部
270 逆直交変換部
280 可変長符号化部
302 キーボード
302a マウス
303 ディスプレイインタフェース
306 ハードディスクドライブ
307 リムーバブルメディアドライブ
308 ネットワークインタフェース
D1 画面内予測情報
D2 画面内予測誤差
D3 画面間予測情報
D4 画面間予測誤差
D6 符号量情報
D7 符号化モード選択情報
D8 量子化係数
D9 周波数成分
D10 量子化値
D11 復元周波数成分
D21 モード判定情報
D31 画素情報
D32 MV(動きベクトル)情報
D33 MV(動きベクトル)閾値
D81 画面内予測情報
D82 画面内予測誤差
D83 画面間予測情報
D84 画面間予測誤差
D86 符号量情報
D87 符号化モード選択情報
D88 量子化係数
D89 周波数成分
D90 量子化値
D91 復元周波数成分
S1 符号化設定情報
90 原画像
91 ストリーム
92 再構成画像
93 画面内予測画像
94 画面間予測画像
95 予測画像
96 差分画像
97 復元差分画像
810 フレーム符号化を行う映像符号化部
820 フィールド符号化を行う映像符号化部
830 AFFモード選択部
860 PAFFにおいてフレーム符号化を行う映像符号化部
861 MBAFFにおいてフレーム符号化を行う映像符号化部
862 MBAFFにおいてフィールド符号化を行う映像符号化部
863 MBAFFモード選択部
870 PAFFにおいてフィールド符号化を行う映像符号化部
880 PAFFモード選択部
910 画面内予測部
920 画面間予測部
930 モード選択部
940 直交変換部
950 量子化部
960 逆量子化部
970 逆直交変換部
980 可変長符号化部
990 符号化制御部

【特許請求の範囲】
【請求項1】
入力画像がインタレース画像である場合に、適応的フィールド・フレーム符号化(Adaptive−FieldFrameCoding)のモード判定を行うAFFモード判定部と、
前記AFFモード判定部による前記モード判定の判定結果に応じて前記入力画像を符号化する映像符号化部と、
を有する映像符号化装置。
【請求項2】
前記AFFモード判定部は、前記入力画像のフィールド符号化時とフレーム符号化時における画素差分を比較することで前記モード判定を行うことを特徴とする請求項1に記載の映像符号化装置。
【請求項3】
前記AFFモード判定部は、前記映像符号化部において符号化処理が行われたピクチャの画面間予測の結果である動きベクトル情報を用いて前記モード判定を行うことを特徴とする請求項1又は2に記載の映像符号化装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate


【公開番号】特開2012−253476(P2012−253476A)
【公開日】平成24年12月20日(2012.12.20)
【国際特許分類】
【出願番号】特願2011−123083(P2011−123083)
【出願日】平成23年6月1日(2011.6.1)
【出願人】(000001122)株式会社日立国際電気 (5,007)
【Fターム(参考)】