映像信号符号化
【解決手段】 映像信号の符号化方法およびシステムは、符号化された信号がリンク上で効率的に送信されるとともに復号および表示された際に推定される知覚品質の点で所定の基準を満たすように圧縮された符号化された信号を提供する。これは、符号化側で、知覚品質メトリック(PQM)システム(32)を利用して推定される知覚品質を数量化する制御ユニット(24)、数量化されたPQMを信号が送信前に満たさなければならないユーザ定義の基準と比較する制御ロジック(34)を設けることによって達成される。または、制御ユニットは、例えば事前濾波を使用して信号を修正するか、修正された符号化パラメータを用いてその品質を上げるように信号を再符号化するように動作可能である。これによって、数量化されたPQMが基準に近づく。この符号化・修正・符号化シーケンスの多数の繰り返しが、結果得るPQMが基準を満たし送信される前に必要かもしれない。
【発明の詳細な説明】
【背景技術】
【0001】
本発明は、複数のフレームを表わす映像信号を符号化する方法およびシステムに関し、特に、符号化された信号についての品質測度を導出する映像信号を符号化する方法およびシステムに関する。
【0002】
ディジタル映像信号が、通信リンクを通して効率的に送信されることができるように符号化することが知られている。ソースデータは、例えば画素のブロックの予測、離散コサイン変換(DCT)、量子化、ランレングス符号化、および統計・心理物理的冗長性を利用する他の圧縮技術のような良く知られている技術を使用して、送信される必要のあるデータ量を低減するような方法で符号化される。良く知られている映像符号化アルゴリズム/規格はMPEG2およびH.264/MPEG−4 AVCを含んでいる。また、他の既知の規格が存在することが認識されるだろう。通信リンクの復号側において、符号化映像を表示装置にそれを出力することができるように復号する(あるいは伸長)ためにソフトウェアが設けられている。
【0003】
データリンクを介して送信されるデータ量を低減する点では有用であるが、量子化プロセス(無ノイズ符号化ではない)を伴った映像信号を圧縮する工程は、歪みを導入し、したがって、映像の質を低減し得る。多くの符号化アルゴリズムは、歪みが見る人によって可能な限りほとんど知覚されないように人間視覚システム(HVS)の限界を活用する傾向がある。歪みを測定する1つの方法は、復号された映像シーケンス内の知覚可能な歪みのレベルに注目し、その結果を平均して平均オピニオン評点(MOS)を得ることを含んでいる。しかしながら、この人の手による工程は時間のかかるものであり得、訓練された人が、意味のあるデータを提供するために適切に映像の代表的な主題サンプルを判断することを要求する。そこで、知覚品質を評価するソフトウェア・ツール(いわゆる知覚品質メトリック(PQM)ツール)を設けることが知られている。そのようなPQMツールは通信リンクの復号器側に設けられる。出願人の国際特許出願番号GB2006/004155は典型的なPQMツールについて詳細に記述している。
【0004】
商用映像システム(例えばインターネット・プロトコル・テレビ(IPTV)システム)では、知覚品質は重要な問題である。チャネルの性質は符号化器側でデータ圧縮を必要とするだろう。しかしながら、IPTVサービス・プロバイダの顧客は、映像品質の点においてサービスの一定レベルを期待する。また、したがって、サービス・プロバイダは、送信された映像が、(常にではないとしても)大量の送信の場合に顧客の期待を満たすだろうということを保証することを切望している。
【発明の概要】
【0005】
本発明の第1の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、(c)前記品質測度が前記所定の品質基準を満たさない場合、前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、ことを具備する方法が提供される。
【0006】
知覚品質メトリックは、知覚される映像の品質(すなわち人間の視聴者によって知覚されるような映像の品質)を客観的に評価または予測するように構成されているメトリックまたはモデルを意味すると理解される。これは、結果得る品質測度が自動的に一貫して適用されることが可能であることを意味する。
【0007】
本方法は、映像信号と関連付けられている品質測度が所定の品質基準を満たさない場合にこの映像信号の繰り返しの再符号化を提供する。この再符号化は、前記少なくとも1つの符号化パラメータの修正値または映像信号の修正された形態を使用する。こうすることによって、フィードバック構成が使用されて、符号化された信号が品質要求事項の何らかの形態を満たすことを保証する。そのような方法は、IPTVのような商用の適用形態において顧客に対する最小レベルのサービスを保証したい映像コンテンツ・サービス・プロバイダにとって特に利益を提供し得る。一旦品質測度が所定の品質基準を満たすものとして確認されるとステップ(c)は実行される必要がないことが認識されるだろう。
【0008】
本方法は、好ましくは通信リンクの符号器側で実行され、また前記品質測度が前記所定の品質基準を満たす場合のみ、前記符号化された信号を通信リンク上で映像復号器に送信することをさらに具備する。
【0009】
ステップ(c)において、前記符号化パラメータの値または前記映像信号に適用される修正の量は、ステップ(b)において生成される前記品質測度の値の関数であり得る。
【0010】
本方法は第1および第2信号部分に対して実行され得、前記第2信号部分は、前記品質測度が前記第1信号部分について前記所定の品質基準を満たす場合に符号化される。
【0011】
前記品質測度は、好ましくは所定のアルゴリズムを用いて生成される数値であり、前記品質測度は、前記数値が所定の範囲内にある場合に前記所定の品質基準を満たす。前記所定の範囲は第1および第2境界値によって定義され得、前記適用される修正は、前記品質測度の値が後続の繰り返しにおいて前記境界値の一方に近づく変化に帰着する。
【0012】
前記符号化された信号は、複数の個別に識別可能なフレーム群(GOF)を表わし得、 品質測度は各GOFに対して導出可能であって、ステップ(c)において、前記少なくとも1つの符号化パラメータの修正された値または前記映像信号の修正された形態は前記所定の品質基準を満たさない各GOFに適用される。
【0013】
本方法は、各々がステップ(c)において適用される択一的なプロファイルを定義する複数の修正プロファイルを提供し、1つ以上の選択規則に応じて前記複数のプロファイルのうちの1つを選択する、ことをさらに具備し得る。たとえば、連続する所定数のGOFが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択される。前記第1プロファイルは、適用されると前記GOFに対応する前記映像信号の濾波された形態を再符号化するように構成されている。前記濾波は、前記GOFの各フレームを符号化するのに必要なビット数を減じることを具備し得る。所定数のGOFを具備するセグメントにおいて一部のGOFのみが前記所定の品質基準を満たさない場合に第2プロファイルが選択される。前記第2プロファイルは、適用されると各不合格GOFに対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている。
【0014】
各フレームについてのさらなる品質測度が生成され得る。あるフレームについての前記さらなる品質測度が前記所定の品質基準を満たさない場合、フレーム内分析が該フレームに対して実行されて該フレームのどの部分が修正を必要としているかを判断する。
【0015】
上記の少なくとも1つの符号化パラメータは、量子化ステップ幅を含み得る。この場合、ステップ(c)は量子化ステップ幅の修正された値を適用することを具備する。択一的にまたは付加的に、前記少なくとも1つの符号化パラメータは、符号化ビットレートを含み得る。この場合、ステップ(c)は前記符号化ビットレートの修正された値を適用することを具備する。
【0016】
本発明の第2の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、(b)知覚品質メトリックを使用して符号化された信号についての数値の形態の品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し(前記品質基準は上限および下限を有する数値の範囲によって定義されている)、(c)前記品質測度が前記所定の品質基準を満たさない場合、前記少なくとも1つの符号化パラメータを修正するとともに前記値が前記値の範囲に入るまでステップ(a)乃至(c)を繰り返す、ことを具備する方法が提供される。
【0017】
本発明の第3の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、(c)前記品質測度が前記所定の品質基準を満たさない場合、複数の修正プロファイルのうちの1つを選択するとともに前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、ことを具備し、所定数のフレームを具備する前記映像信号のセグメントが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択され、前記第1プロファイルが、適用されると前記映像セグメントの濾波された形態を再符号化するように構成されており、所定数のフレームを具備する前記映像信号のセグメント内のフレーム部分集合またはフレーム群のみが前記所定の品質基準を満たさない場合に第2プロファイルが選択され、前記第2プロファイルが、適用されると各不合格フレームまたはフレーム群に対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている方法が提供される。
【0018】
本発明の第4の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化することであって、前記符号化された信号が複数の個別に識別可能なフレーム群(GOF)を表わしており、(b)複数のGOFを具備する映像セグメントについて、知覚品質メトリックを使用して各GOFについての品質測度を生成し、(c)前記品質測度が所定の品質レベルを下回っている前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを下回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、(d)前記品質測度が所定の品質レベルを上回っている同じ前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを上回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、(e)(c)および(d)において修正された前記符号化パラメータを使用して前記映像セグメントを再符号化する、ことを具備する方法が提供される。
【0019】
プロセッサ上で実行されると前記プロセッサに上記の方法を実行させるプロセッサ・コードを運ぶためのキャリア媒体が提供され得る。
【0020】
本発明の第5の側面によれば、少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して複数のフレームを表す映像信号を符号化するように構成されている映像符号化器と、前記映像符号化器からの前記符号化された信号を受け取るためのものであって、前記符号化された信号についての品質測度を生成し、前記品質測度が所定の品質基準を満たすかを確認し、前記品質測度が前記所定の品質基準を満たさない場合、前記映像符号化器に前記少なくとも1つの符号化パラメータについての修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまで前記映像信号を繰り返し再符号化させるように構成されているコントローラと、を具備する映像符号化システムが提供される。
【0021】
前記コントローラは、前記品質測度が前記所定の品質基準を満たす場合のみ、前記符号化された信号を通信リンク上で映像復号器に送信するように構成され得る。前記コントローラは、使用の際、前記符号化パラメータの値または前記映像信号に適用される修正の量が生成される前記品質測度の値の関数であるように構成され得る。本システムは、前記映像符号器からの所定数の符号化されたフレームを受信および保存するためのバッファをさらに具備し得る。前記バッファは、以前に送信されたフレームの組について生成された前記品質測度が前記所定の品質基準を満たさないことを示す前記コントローラからの制御信号に応答して前記符号化されたフレームを前記コントローラに送信するように構成されている。 前記コントローラにおける前記品質測度は所定のアルゴリズムを用いて生成される数値とされることが可能である。前記数値が所定の範囲内にある場合、前記品質測度が前記所定の品質基準を満たす。前記所定の範囲は、第1および第2境界値によって定義され得、前記コントローラにおいて適用される修正は、前記品質測度の値が後続の繰り返しにおいて前記境界値の一方に近づく変化に帰着する。前記符号化器によって生成された前記符号化された信号は、複数の個別に識別可能なフレーム群(GOF)を表わし得る。前記コントローラは、各GOFに対して品質測度を生成し、前記所定の品質基準を満たさない各GOFに対して前記少なくとも1つの符号化パラメータの修正された値または前記映像信号の修正された形態を適用するように構成されている。前記コントローラは、各々がステップ(c)において適用される択一的なプロファイルを定義する複数の修正プロファイルを提供し得、また、1つ以上の選択規則に応じて前記複数のプロファイルのうちの1つを選択するように構成されている。前記コントローラは、使用の際、連続する所定数のGOFが前記所定の品質基準を満たさない場合に第1修正プロファイルを選択するように構成されることが可能である。前記第1プロファイルは、前記コントローラによって適用されると前記GOFに対応する前記映像信号の濾波された形態を再符号化するように構成されている。前記濾波は、前記GOFの各フレームを符号化するのに必要なビット数を減じることを具備することを具備し得る。前記コントローラは、使用の際、所定数のGOFを具備するセグメントにおいて一部のGOFのみが前記所定の品質基準を満たさない場合に第2プロファイルを選択するように構成されることが可能である。前記第2プロファイルは、前記コントローラによって適用されると各不合格GOFに対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている。前記コントローラは、各フレームについてのさらなる品質測度を生成するように構成され得る。あるフレームについての前記さらなる品質測度が前記所定の品質基準を満たさない場合、フレーム内分析が該フレームに対して実行されて該フレームのどの部分が修正を必要としているかを判断する。前記少なくとも1つの符号化パラメータは量子化ステップ幅を含み得、ステップ(c)は量子化ステップ幅の修正された値を適用することを具備する。前記少なくとも1つの符号化パラメータは符号化ビットレートを含み得、ステップ(c)が前記符号化ビットレートの修正された値を適用することを具備する。
【0022】
次に、本発明が、添付図面を参照して例として記述される。
【図面の簡単な説明】
【0023】
【図1】本発明に従った符号化システムがコンテンツ・サービス・プロバイダ側で用いられ得るところの商用映像システムのブロック図。
【図2】本発明に従った、一般化された映像符号化システムのブロック図。
【図3】符号化された映像についての品質測度を示すために用いられることが可能な代替的な知覚品質測定スケールを数の形態で示す。
【図4】本発明の好ましい実施形態に従ったH.264の映像符号化システムのブロック図。
【図5】品質シナリオについて複数のフレームに関して取得された例示的な知覚品質測度を示すグラフ。
【図6】品質シナリオについて複数のフレームに関して取得された例示的な知覚品質測度を示すグラフ。
【図7】品質シナリオについて複数のフレームに関して取得された例示的な知覚品質測度を示すグラフ。
【図8】映像シーケンスの品質の評価のための、好ましい実施形態での使用に適する、知覚品質測定装置を機能の観点から示すブロック図。
【図9】図8の装置において、水平コントラスト測度が画像内の画素についてのどのように計算されるかを示す。
【図10】図8の装置において、垂直コントラスト測度が図9の画像内の画素についてのどのように計算されるかを示す。
【図11】トレーニング・シーケンスについてのAvPSNR対測定されたMOSを示す。
【図12】トレーニング・シーケンスについてのAvQP対測定されたMOSを示す。
【図13】トレーニング・シーケンスについてのCS対測定されたMOSを示す。
【図14】AvQP/CSモデルについての評価されたMOS対測定されたMOSを示す。
【発明を実施するための形態】
【0024】
次に、映像信号を符号化する方法およびシステムが詳細に記述される。この方法およびシステムにおける目的は、信号がリンク上で効率的に送信され得るとともにこの信号が複合および表示される際に推定された知覚品質の点において所定の基準を満たすために圧縮される信号を通信リンクの符号化側で提供することである。このことは、知覚品質メトリック(PQM)システムを利用して推定知覚品質の数量化する制御ユニットと、該数量化されたPQMを信号が送信に先立って満たさなければならないユーザ定義の基準と比較する制御ロジックと、を符号化側で設けることによって達成される。基準を満たす場合、信号は単に通信リンクを介して前方へ送信される。そうでなければ、コントロール・システムは、信号を例えば、事前濾波を用いて修正するかまたは修正された符号化パラメータを用いてその品質を改善するような方法で信号を再符号化するように動作可能である。このことは、数量化されたPQMを基準に向かって収束させることである。この符号化・修正・符号化シーケンスを多く繰り返すことは、結果生じるPQMがその基準を満たして送信される前に必要である。有利なことに、一旦符号化と基準のための初期値パラメータがユーザによってセットされれば、本システムは自動的に動作することができる。したがって、映像コンテンツのプロバイダは、プロバイダに要求される最小の双方向交流で、視聴者が最低のサービス水準、すなわち改善されたサービス水準を満たすコンテンツを復号し視聴するだろうという以前よりも高い確信を有する。
【0025】
図1を参照すると、そのような符号化システムを使用することが有利な商用システムの一例が示されている。図において、コンテンツ・サービス・プロバイダ10は、複数の顧客にディジタル形式の映像コンテンツを送信する。これらの顧客は、それぞれのセットトップ・ボックス(STB)12をテレビジョンセット(テレビ)14への出力に用いて、ディジタル信号を受け取るとともに復号する。コンテンツは、様々な方法、例えば地上放送アンテナ16を用いる無線リンク、または銅または光ファイバー・ケーブルを利用する、IPリンク18のような「インターネットに通じた(wired)」接続を通して送信され得る。後者の方法はますます一般的になっており、一般にIPTVと呼ばれる。衛星放送はさらなる選択肢である。確かに、一部のサービス・プロバイダは、例えば無線リンクを通して無料放送のコンテンツを放送すると同時にIPTVリンクを用いてビデオ・オン・デマンド(VOD)サービスを提供することによって複数の通信方式を組合せて実行する。どちらの方法が用いられても、サービス・プロバイダ10は、映像信号を、サービス・プロバイダと顧客のSTB12の間の有限の帯域幅リンクを通して効率的にそれを送信することができるようにソース・ディジタル信号が圧縮されるような方法で映像信号を符号化することを要求される。この工程は時にソース符号化と呼ばれ、多くの符号化アルゴリズムまたは規格が知られている。以下の記述は、H.264/MPEG−4 AVC規格の使用を想定している。ただし、他の映像符号化規格が用いられることが可能であることが理解されるべきである。各STB12において、復号器が、符号化器で用いられる規格に従って受信信号を復号するために設けられる。
【0026】
図2を参照すると、上記の品質管理機能を使用する、一般化された符号化システムのブロック図が示されている。ソース映像20は、選択された符号化規格に従って動作するように設計された符号化器22に供給される。ソース映像20は、フレームのシーケンスを含む映像コンテンツをディジタル形式で表わす。各フレームは、n×m個の画像素子または画素を含む。符号化器22は、多くのユーザ定義のパラメータ、特に符号化ビットレートさらに随意で符号化プロファイルに従って動作する。後者については、ある符号化規格は圧縮の所定の水準をもたらす具体的な符号化プロファイルを定義する。ビットレートおよび符号化プロファイルに加えて、ユーザは、さらに知覚の品質の合格水準に対応する一連の品質値を定義する品質閾値を指定する。ユーザはさらに最適の目標品質を設定し得る。
【0027】
品質閾値および目標は、符号化器22に供給されていることが示されているが、次のステージ(すなわち制御ユニット24)に直接供給されてもよい。
【0028】
制御ユニット24は符号化された映像データおよび上記の品質閾値および目標品質を受け取るように設計されている。制御ユニット24内には、サービス・プロバイダが何を必要とするかに依存して個々のフレームまたはフレーム群の知覚品質を示すために後に用いられることが可能な1つまたは複数の数値を生成するPQMシステム32がある。下に挙げられた具体例では、我々は、平均オピニオン評点(MOS)と呼ばれる測度を生成する。MOSは、我々が一般に今後参照する品質パラメータである。PQMシステム32が生成できるMOS値の範囲は予め定められている。また、多くの標準化されたシステムが、ITU-R Recommendationによって提供されている。図3aは、5ポイントのスケールを示す。ここでは、値「1」は悪い水準の知覚品質を示し、他方、「5」は優良を表わしている。図3bは、代替的な1対100スケールを示す。ここでは、「0」が最低の品質を表わし、「100」が最高品質を表わす。PQMシステム32は既知のPQMシステム(例えば完全参照システム、無参照システム、簡易参照システム)から構成されることが可能である。読み手が別のタイプおよびそれらの一般的な動作原理を知っていると思われる。純粋な無参照PQMシステムの場合には、未加工の符号化ビット・ストリームへアクセスすることが必要なことの全てである。完全参照PQMシステムの場合は、ソース映像のコピーが必要である。したがって、図2中に点線が存在している。簡易参照PQMシステムは、ソース内容に関する、全てではなく一部の情報を必要とする。以下尾の詳細な記述では、我々は、異なる品質情報を生成するためにビット・ストリームおよび複合された内容の両方を必要とするハイブリッド・ビット・ストリーム/復号器無参照PQMシステム32の使用について記述する。従って、PQMシステム32は復号器(この具体的事例ではH.264復号器)を含んでいるだろう。
【0029】
PQMシステムによって生成されることが可能な情報のタイプは、パラメータの次の非網羅的なリストを含んでいる:
・フィールド/フレーム毎平均オピニオン評点MOSFn
・映像ユニット/画像群平均オピニオン評点MOSGOP
・品質の一時的変化(MOSFn−MOSFn−1)
・平均オピニオン評点の映像ユニット変化(MOSGop(k)−MOSGop(k−i))
・空間上の複雑性
・空間上のマスキング
・一時的複雑性
・(フィールド/フレーム毎)量子化器ステップ幅
・ビットレート
・スライス構造
・マクロブロックサイズおよび構成
・動きベクトル値
制御装置24内にさらに設けられているのは、PQMシステム32によって生成された1つまたは各パラメータ(詳細な説明においては、1つのMOS値が用いられている)を受け取って、示されている品質測度が、ユーザ入力によって閾値および目標値によって定義された品質値の範囲内にあるか否かを判断するように構成されているロジック回路34である。そうである場合、制御ロジック34は映像を「合格」とし、映像は後の送信に備えて格納されるか、直ちに送信される。そうでない場合、制御ロジック34は映像を「不合格」とし、映像は送信も格納もされない。代わりに、映像データ(すなわち不合格のフレームまたはフレーム群に対応するソース映像データ)は、符号化前に事前濾波された映像データとともに、および/または修正済符号化パラメータ(典型的には、量子化ステップ幅(QSS)または符号化ビットレートの修正された値)を用いて、再び符号化される。符号化パラメータを事前濾波するか修正するかどうかの選択は、制御装置のロジック34の一部として提供される所定の修正規則に基づく。この規則は、次の符号化反復において品質測度が閾値によって定義された合格品質範囲に少なくとも近づくものとして定義される。さらに、後に説明されるように、適用される修正のタイプおよび/または量は、PQMシステム32によって生成されたパラメータの1つ以上に依存する。図2は、フレームまたはフレーム群が再符号化および符号化器22のための更新されたパラメータの組を要求していることを示す制御信号をソース映像に供給するものとして個別のモジュール28を示している。実際上、これは、制御装置24の不可欠な部分を形成し得る。
【0030】
上記のように、品質測度が範囲内に収まり、また映像が記憶装置に渡され、また/または前方への送信の前に、多くの再符号化の繰返しが必要であるかもしれない。時間が重要な(time critical)適用形態では、映像データが送信される前の繰返しの回数が所定回数に制限されてもよい。
【0031】
一般化された符号化システムの操作手順が、次に記述される。
【0032】
まず、ソース映像20が符号化器に提示される。操作者は関連する符号化パラメータ、例えばQSS、符号化ビットレート、符号化プロファイル、品質閾値、を設定する。その後、符号化された出力が制御装置24のPQMシステム32に渡される。PQMシステムのタイプに応じて、PQMシステム32が完全参照またはビット・ストリーム/復号器ハイブリッド法を使用する場合、符号化された映像は例えば復号を要求し得る。知覚品質測定値は各フレームに対して取得される。この測定値は、以前に列挙されたパラメータの1つ以上を提供する。測定法は、品質の瞬間的且つ局部的測度(例えばMOSi、MOSGOP)を出力し得る。次の段階は品質閾値によって定義される範囲に対する品質測定値を検査することを含んでいる。本検査は品質パラメータの任意の1つまたは組合せを使用し得る。ただし、以下に記述される実施形態では、1つの品質パラメータが生成および検査される。MOSGOP測度が最も重要なものであると考えられる。なぜなら、MOSi閾値未満への時折の低下は許容されるべきと考えられるからである。さらに、不合格だった内容に対処するかの決定は、好ましいか必要なビットレート制限で動作しつつ目標品質に合致するように品質を調節するために複数のGOPを考慮に入れることが推奨される。
【0033】
品質閾値以内にある映像コンテンツは格納または移送のために渡される。制御ロジック中の品質閾値検査に不合格のコンテンツは、このコンテンツの事前濾波されたバージョンを使用して、また/または修正済の符号化パラメータを使用して、再符号化される。我々は合格品質範囲を定義するために閾値を使用することについて記述するが、システムが、これよりも上にあれば品質検査に合格するという下限だけを使用して正しく機能することが認識されるだろう。しかしながら、我々の詳細な実行形態では、上限と下限の両方が設定される。また、ある状況では、上限すなわち高品質閾値の外側にあるデータを再符号化することが有利であり得る。
【0034】
修正された符号化パラメータが必要であるとコントロール・システムの制御ロジックが判断する場合、これらが所定の規則に従って生成され、符号化器に送られる。本プロセスが繰り返し実行されて符号化、測定、再符号化することができる。繰り返しは、映像品質が許容可能になるまで、あるいは定義済みの最大の繰返し回数に達するまで続く。新しい値は、符号化パラメータ(例えばQSS、符号化プロファイル、符号化ビットレートなど)の全てあるいは一部に対して提供され得る。非常に単純な例において、符号化ビットレートは、例えば、各繰返しについての百分率値によってビットレートを修正することによって、あるいは代わりに参照表(LUT)を参照することによって、符号化され得る。LUTは、PQMシステム32によって大きなコンテンツ・データベースを前もって処理することにより定義され得る。その後、LUTは、映像属性(例えば異なる空間上の複雑性または時間上の複雑性)、および符号化器パラメータ値(例えば量子化マップ)と並んで生成されたMOS値によって構築される。一旦コンテンツが制御装置24のPQMシステム32において測定されると、その後、不合格のコンテンツの特性が品質閾値と一緒にLUTに写像され、LUTから新しいパラメータまたはパラメータ・セットが生成されて符号化器22に渡される。
【0035】
空間上エラー写像を行なう(PQMシステムによって使用される)知覚モデルは、知覚品質情報を使用して特にエラーの傾向のある部分を対象にして品質を改善することができる。例えば、新しい符号化器パラメータの組を定義するには、その品質判定基準を満たすフレームは生成された新しい値を有さず、他方、不合格のフレームは新しいパラメータの組を有する。同様に、空間の領域では、画像のうちの品質境界内にある部分には新しい符号化値は提供されず、画像のうちの品質検査に不合格の部分には新しいパラメータが割り当てられることが可能である。ビットレートが主な制約である場合、本方法は、多くのGOP(例えば関連する受信器バッファのサイズと等価なGOPの組)に亘って空間上および時間上の品質を検討することによって動作する。この結果、(a)例えばQSSを増加させることによって、上側の品質境界を越えているフレームあるいはフレームの一部の品質が減じられる、および/または(b)例えばQSSを減じることによって、下側の品質境界未満のフレームあるいはフレームの一部の品質が増加させられる。
【0036】
符号化パラメータを修正することの代わりとして、制御ロジック34は、実際のソース映像20を変更する(すなわち事前濾波する)ことが適切であると判断し得る。符号化された映像の問題部分を特定することによって、品質測定値を使用して、符号化器22を強調する(stress)ソース映像のセグメントまたは領域を特定することが可能である。例えば、ソース映像20のある部分が動きが速くまたは細かな細部を有するものと特定され、PQMシステム32で低い品質を示す場合、特定の事前濾波が適用されることが可能である。制御装置24は、次の繰返しのためにデータの品質を改善する目的で、例えば画像解像度を減じるかあるいは空間周波数フィルタを適用することによって対応するソース・コンテンツを修正する命令を事前フィルタに送ることができる。
【0037】
品質管理ユニットを使用する符号化システムのより詳細な例が、次に記述される。
【0038】
図4を参照すると、符号化システムは、H.264符号化器42を利用して、フレームFnのシーケンスとして提供されるソース・コンテンツ40を符号化する。H.264符号化器42の構成および動作は良く知られており、詳細な記述は本明細書において提示されない。一般に、第一段44は、動き推定と動き補償を含む予測符号化を行なって、予測スライスおよびデータの残余値を生成する。後段では、変換符号化46、量子化48、画像並び替え50およびエントロピー符号化52が、例えば、CAVCLまたはCABACを使用して行なわれる。符号化された出力データは、本明細書でネットワーク抽象層(NAL)ユニット54と呼ばれる信号/データパケットに入れられる。
【0039】
符号化システムは、図2において示されるとともに図に関して記述された一般化された制御装置24のような、符号化されたデータの推定知覚品質を測定するためのPQMシステム32および制御ロジック34を含んでいる品質管理単位(QCU)56をさらに含み、品質が所定の品質判定基準を満たすかどうか判断し、満たさない場合、その信号および/またはそれの符号化を修正して品質を向上させる。信号は前処理フィルタ62を使用して修正される。符号化は、H.264符号化器42の量子化器部48へ入力される1つ以上のパラメータを修正することによって修正される。QCU56が符号化済映像を合格とした場合、符号化された映像は、後の、通信リンク/チャネルでの送信のために映像バッファ60に転送される。
【0040】
使用の際、操作者は、2Mbit/秒の目標符号化ビットレートを設定する。また、2秒の受信器バッファが指定される。操作者は、さらに上限および下限と目標品質とを指定することにより、品質判定基準を定義する。図3aにおいて示される5点の目盛が使用される。また、上限=4.0、下限=2.8および目標=3.4の値の例が使用される。符号化・測定・再符号化の繰返しの回数は3に制限されている。値はすべて符号化器42へ入力される。ただし、上限および下限、目標、および繰返しの制限は、QCU56に直接供給されてもよい。
【0041】
符号化されたNALユニット58はQCU56に送られる。その目的は、不合格のGOPまたはGOP内のフレームが無いかまたは最小で、下限より上でかつ好ましくは目標品質付近の比較的一貫した品質の映像コンテンツを生成することである。
【0042】
QCU56はPQMシステムを使用して、知覚品質測定を行なう。PQMシステムは、任意のタイプの既知のPQMシステム32とすることができる。実例を示すために、我々は同時係属の国際特許出願番号GB2006/004155に記述されているようなハイブリッド・ビット・ストリーム/復号器PQMシステムを使用する。その内容は、参照することによって本明細書に組込まれる。この種のPQMシステムのさらなる細部はこの記述の終わりに与えられる。
【0043】
PQMシステム32は2秒受信器バッファに従って映像データのセグメントに対して動作する。すなわち、2秒バッファ(図示せず)が符号化器およびPQMシステムの間に設けられる。後者は、このバッファからGOPを受け取り、受け取ったGOPを分析するように構成されている。QCU56および符号化器42は、さらなるGOPが、現在のGOPが処理され終わるまで、すなわち、現在のGOPが送信に向けて渡されるまで、バッファからPQMシステム32に供給されないように協力して動作する。唯一これが生じるのは、新しいGOPが受け取られた時である。不合格のコンテンツに対しては、符号化器42は、量子化器48に対する修正済の値についての指示を受け取るか、または次の前濾波後に入力される新しいソース・コンテンツを待つ。この目的のために、QCU56は符号化器42への次の制御信号のうちの1つを生成するように構成される:
制御信号 意味
0 合格映像、次の2秒のコンテンツ・セグメントを符号化せよ
1 不合格映像、新しい量子化器パラメータ(例えばQSS、ビットレート)を待て
2 不合格映像、新しい事前濾波されたソース入力を待て
QCU56の内には、不合格映像が次にどのように処理されるべきかを判断する多くの規則が設けられている。それは、どの事前濾波(ある場合)が適用されるべきか、また/または、量子化パラメータがどのように修正されるべきか、を判断することである。この規則は不合格のセグメントが3つの品質プロファイルA〜Cのどれに当てはまるか同定することを含んでいる。次に、各プロファイルが、関連するプロファイルの識別に応じてQCUロジック34によって取られる通信アクションと共に、現実のシナリオとの関連で次に考察される。この目的のために、PAL映像の2秒を表わし、よって50のフレームを含んだ映像データ・セグメントを想定する。各GOPが10個のフレームを含むものとする。
【0044】
プロファイルA:全体またはほとんどのセグメントが不合格
このシナリオでは、2秒のセグメントのデータの全体が品質判定基準を満たさない。図5は、この状況に帰着し得る出力をグラフの形態で示す。あらゆるGOPについて、品質要求事項を満たすための符号化プロセスを操作する余地はほとんどない。したがって、この場合、再符号化前にソース映像が事前濾波される。制御信号「2」が符号化器42に送られる。事前濾波は、空間上および時間上周波数濾波の一方または両方を行なうことによって、映像の複雑性を減少させる。あるいは、画像が、例えば最大解像度度から4分の3または3分の2の解像度まで減じられ得る。その後、濾波されたソースが符号化器42に渡されるとともに繰返し回数が増加させられる。
【0045】
プロファイルB:ほとんどのセグメントが合格で若干が不合格
このシナリオでは、検討中のセグメントの少数が不合格である。図6は、帰着し得る出力をグラフの形態で示す。セグメントの期間、GOP5〜GOP7は下限未満へと低下している。この場合、QCUは、不合格のGOPに関する情報を抽出し、かつ修正された符号化パラメータ(例えばQSS)を生成することを命じられる。制御信号「1」が符号化器42に渡される。さらに、品質の低下のための良好な候補であることとして標的GOP、この場合、GOP3、GOP9、およびGOP10が特定される。この点で、不合格のGOPの品質を改善するために、QSSを減じることによる圧縮コストがかかることが認識される。目標品質を超えているGOPを特定することができれば、我々はもちろん最小の品質要求事項を満たしながら補正を行うように管理された方法でそれらの品質を減じ得る。もちろん、第2のGOPの候補、例えばGOP1、GOP2、およびGOP8が特定されることも可能である。
【0046】
QCU56の内の制御ロジック34はGOP1〜10の全てについて修正されたQSS値を生成するように構成されている。これらの修正されたQSS値は、関連するGOP中の各フレームについて、LUTを参照することによって、またはQSSを調整することによって取得される。例えば、あるGOPが下限を下回っている場合、この下限より下において0.5MOSごとにQSSが1ずつ減じられることが可能である。品質が範囲以内にある場合、品質の下限を0.5MOS上回っているGOPだけが、例えば各0.5MOSごとに1ずつQSSを増加させられることにより修正される。これらの修正量が例であり、より小さいまたはより大きな値が異なる品質範囲に使用されてもよいことに注意されたい。品質範囲が小さい場合、MOSの小さな変化が使用されてQSSを調整するべきである。下記の表1は、図6に示される各GOPに関連するQSSの変化例を示す。これらの新しいパラメータ値は、符号化器42の量子化器に直接渡される。この量子化器は、制御信号「1」を受け取っている場合、GOPを再符号化する。繰返し回数がインクリメントされ、また、コンテンツが品質要求事項を満たすとQCU56が判断するか、最大繰返し回数である3が満たされるすまで、プロセスは継続する。
【表1】
【0047】
GOP4がそれを構成するフレームにわたって品質の大規模な変化を有していることに注目する価値がある。これを補償する、平均MOSとフレーム相互間でのMOSの変化が検査される方法が採用されることが可能である。品質閾値を下回っているフレームの割合が例えば30%を超えている場合、QCUは閾値を下回っているフレームのみについてMOSを再計算し、これらのフレームのみにQSSの変更を適用し得る。GOP内の品質閾値を上回っているフレームはそのままにしておく(あるいは、品質閾値を上回っているフレームが>0.5MOSである場合、これらのフレームについてのQSSが増加されてもよい)。下記の表2において示される数値は、変化し得る品質GOPを扱うためのこのアプローチを示している。やはり、30%の閾値が単に例であることに注意されたい。
【0048】
個々のGOP内のフレーム相互間で異なるこのQSS修正も、全フレームが品質閾値を下回っているGOPに適用されることが可能である。不合格範囲が大きく異なり得る場合、いくつかのフレームは(例えば)2の減少を要求してもよい。一方で、他のフレームは、約1の変更を要求し得る。ほんの少数の不合格のフレーム(例えば30%未満)を含んでいるGOPについては、これらは無視され得る。
【表2】
【0049】
プロファイルC:ほとんどのセグメントが合格し、一部が境界を下回るおよび上回る
このシナリオは図7にグラフの形態で示されている。若干のコンテンツは下限未満であることによって不合格であり、若干のコンテンツは良好過ぎることによって、つまり上限を超えていることによって不合格であった。残りのコンテンツは、品質境界内に収まっていた。上記のように、QCU56は各GOP、または品質が可変のGOP内のフレームを修正する。この事例では、しかしながら、最初の繰返しは、GOP2、4、9、10の品質を上げるとともに、この改善をGOP5、6、7の品質を下げることによって埋め合わせることによって、品質範囲外のGOPS、すなわちGOP2、GOP4、GOP5、GOP6、GOP7、GOP9およびGOP10に対処する。
【0050】
プロファイルBおよびCは、同様の状況、すなわち、ほとんどのセグメントが合格し、しかし若干のセグメントが不合格である状況を扱うことを意図されている。両方の例は、QSSの適応がどのように使用されて映像の不合格部分を回復することができるかを示す。プロファイルBでは、その意図は、映像の不合格部分が、GOPおよびフレームの両方について、どのように改善され得るかを示すことである。GOPの例は、複数のGOPが不合格または目標品質である状況に制限されている。いくつかの目標品質GOPはQSSを増加させられており、また、このことが使用されて不合格のGOPについてのQSSの減少を埋め合わせる。ただし、トレードオフの平衡は必ずしも保たれていない。つまり、QSSの増加量よりも多くの減少量が適用され得る。フレームの例は、若干の目標および若干の不合格を伴って品質が劇的に変化する1つのGOPにわたってQSSの修正がどのように適用され得るか示す。やはり、QSSの不平衡なトレードオフが使用されて品質境界内にあるGOP内にあるフレーム品質を得ることができる。プロファイルCの意図は、実際に1組のGOPが3つのレベルすなわち不合格、目標、そして目標を越えている、すなわち、良好過ぎの品質を有している場合、QSS(あるいは他のパラメータ)の修正がどのように適用され得るか示すことである。ユーザの体験にとって一貫した品質が好ましく、また、「良好過ぎる」セグメントから取り上げて不合格セグメントに与えることによって、複数のGOPにわたってより予測され易くより一貫した品質が得られることが知られている。
【0051】
本明細書において提示されている(操作者が一貫して目標ビットレートを上回るコンテンツを送信する能力を有している)全ての例について、ビットレートの増加が品質目標を満たすために適用され得る。この場合、信号が符号化器42に送られてコンテンツについての目標ビットレートを増加させる。この方法は、映像信号に適用されるビットレートを動的に調整する知覚的に感知可能な方法を提供する。参照表、例えば上記の参照表が、QCU56が新しい符号化レートを選択するために参照され得る。QSSが、特に有用な品質指標であると知られているとともに本例において使用されるPQMについて主要なものであることを受けて、QSSがビットレートの代わりに使用されてきた。上記のプロファイルAのように品質プロファイルが全て不合格である場合、ビットレートを修正することがより適切であり得る。しかしながら、目標ビットレートが符号化に対する主な制約であって、また操作者が目標ビットレートをこれが満たされることを期待して通常設定するので、本例において使用されているハイブリッド・ビット・ストリーム/復号PQMシステム32を使用する場合、QSSを事前濾波することまたは調整することが最良のアプローチであると考えられる。
【0052】
結論として、上記のPQMシステム32において使用されることが可能な知覚品質測定法およびシステムの一例が次に記述される。他のそのような測定法が使用されることが可能であることが認識される。
【0053】
知覚品質測定システム
本システムの目的は、複数のフレームを表す映像信号についての品質の基準を生成することである。映像信号は、以下を有している:元の形態; 映像信号が、可変量子化器ステップ幅を利用する圧縮アルゴリズムを使用して符号化された信号がそれと関連可能な量子化器ステップ幅パラメータを有するように符号化されている符号化された形態; 符号化された映像信号の少なくとも一部が元の形態に再変換されている復号された形態。本システムは、次のステップを行なうように構成されている:a)上記の量子化器ステップ幅パラメータの関数である第1品質測度を生成し; b)復号された形態の映像信号によって表わされるフレームの少なくとも一部の空間上の複雑性の関数である第2品質測度を生成し; c)第1および第2測度を組み合わせる。
【0054】
符号化された映像シーケンスからステップ幅が導出可能であり、また複雑性測度が復号された信号から取得されるので、元の映像信号を参照する必要が減じられる。さらに、多くの符号化方式ではステップ幅が映像シーケンスとともにパラメータとして送信されるので、便利なことに、このパラメータを使用して、このパラメータを新たに計算する必要なしに映像品質を予測することができる。重要なことに、ステップ幅と組み合わせて複雑性測度を使用することが、映像品質の指標としてのステップ幅または複雑性の信頼度のみから得られる信頼度よりも品質測度の信頼度を改善することが分かった。
【0055】
システムの概観
下記の実施形態は、無参照型で復号器を基盤とする映像品質評価ツールに関する。本ツールのためのアルゴリズムは、映像復号器の内部で動作可能であり、各復号されたマクロブロックについての量子化器ステップ幅パラメータ(通常、入来する符号化された映像ストリームに含まれている変数)および各復号された画像の画素強度値を使用して復号された映像の主観的品質の評価を作成する。スライディング・ウィンドウ平均画素強度差(画素のコントラスト測度)計算が、各フレームの復号された画素に対して行なわれる。また、その結果得る平均(TCF)は、映像のノイズ・マスキング特性の基準として使用される。その後、品質推定値が、TCFパラメータの重み関数およびステップ幅パラメータの平均から作られる。重み関数は、復号されたシーケンスおよびシーケンスについて前もって取得された主観的スコアの特性のトレーニング・データベースに対する多重回帰分析によって予め求められる。一方ではステップ幅の、他方ではスライディング・ウィンドウ平均画素強度差の組合せを使用して複雑性を推定することは、主観的品質の良好な推定値を提供する。
【0056】
原則として、使用される測定プロセスは、変換符号化を使用するとともに量子化器ステップ幅が可変な圧縮技術を使用して符号化された映像信号に一般に適用可能である。しかしながら、以下に記述されるものは、H.264規格に従って符号化される信号との使用に向けて設計されている。本プロセスは、H.261、H.263および(フレームを基盤とする)MPEG2のような他のDCTベースの標準コーデックにも適用される。
【0057】
本測定法は非侵入性または「無参照」型である。すなわち、本測定方法は元の信号のコピーにアクセスする必要性を有さない。本方法は適切な復号器内での使用向けに設計されている。本方法が、符号化されたビット・ストリームおよび復号された映像の両方からのパラメータへのアクセスを必要とするからである。
【0058】
図8に示される装置では、入力信号は入力1で受け取られ、各画像の次のパラメータを復号するとともに出力する映像復号器に渡す。
【0059】
復号された画像(D)
画素内の水平方向の復号された画像サイズ(Px)
画素内の垂直方向の復号された画像サイズ(Py)
マクロブロック内の水平方向の復号された画像(Mx)
マクロブロック内の垂直方向の復号された画像サイズ(My)
量子化器ステップ幅パラメータの組(Q)。
【0060】
装置内には、2つの分析経路がある。それらは、画像平均された量子化器ステップ幅信号QPF(ユニット3)および画像平均されたコントラスト測度CF(ユニット4)を算出する役目をする。次に、ユニット5は、信号QPFおよびCFを時間平均して信号TQPFとTCFをそれぞれ与える。最後に、これらの信号はユニット6で組み合わせられて復号された映像シーケンスDについての主観的品質の推定値PMOSを与える。個々のハードウェア要素によって要素3〜6が実現されることが可能である。しかし、より便利な実現形態は適切にプログラムされたプロセッサを使用して、それらの段階をすべて行なうことである。
【0061】
Qを画像平均する
このことは、復号器からの出力された量子化器ステップ幅信号Qを使用する。Qは、現在の復号された画像の各マクロブロックについて1つの量子化器ステップ幅パラメータ値QPを含んでいる。H.264については、量子化器パラメータQPは、変換係数を符号化するために使用される線形の量子化器の間隔QSTEPを定義する。実際には、QPは、所定の間隔の表に索引を付ける。この表においては、QPが6増分するごとにQSTEPは幅が2倍になる。画像平均された量子化器パラメータQPFは、以下に従ってユニット3で算出される。
【数1】
【0062】
ここで、MxおよびMyは、それぞれ画像の水平および垂直方向のマクロブロックの個数であり、Q(i、j)は、位置(i、j)でのマクロブロックについての量子化器ステップ幅パラメータである。
【0063】
コントラスト測度を算出する
図9および図10は、水平方向サイズが画素Px個および垂直方向サイズが画素Py個の画像内の位置(x,y)の画素p(x,y)についてのコントラスト測度がどのように計算されるかを示している。
【0064】
水平方向のコントラスト測度を計算するための分析は図9に示されている。この図において、コントラスト測度は、影付きの部分によって示された画素p(x,y)に関して算出される。サイズが同じ隣接する複数の領域が選択される(そのうちの1つは影付きの画素を含んでいる)。各領域は、影付きの画素が位置する行の(好ましくは連続する)画素の組から形成される。各領域の画素強度が平均され、次に、これらの平均の差分の絶対値が、下記の等式(2)によって算出される。コントラスト測度は、この差分の値である。図10に示されているように、垂直のコントラスト測度が同様の方法で計算される。ここで、上側の画素の組および下側の画素の組が選択される。選択される画素の各々は同じ列の上にある。影付きの画素は、上側の組と下側の組との間の境界に隣接する。上側および下側の組内の画素の強度が平均され、次に各組の平均強度の差分が評価される。この差分の絶対値が、下記の等式(3)に示されている垂直方向のコントラスト、すなわち、垂直方向のコントラストの測度である。本例では、影付きの画素は下側の組に含まれている。しかしながら、コントラスト測度と関連付けられる画素の位置は任意である。ただし、それが、比較最中の画素の組によって共有される境界の近くにあることが条件である。
【0065】
したがって、水平方向コントラスト測度を取得するために、長さHである行部分が比較され、他方、垂直方向コントラスト測度を取得するために、長さVである列部分が比較される(長さHおよびVは同じであり得るが、同じであることは必須ではない)。コントラスト測度は、位置が一方では行部分の共通の境界および他方では列部分の共通の境界に局所的な画素に対応付けられる。
【0066】
次に、そのように算出された水平方向コントラスト測度および垂直方向コントラスト速度が比較され、2つの値(等式(4)において示されているように、水平・垂直方向測度と呼ばれる)のうちの大きい方が、影付きの画素と関連付けられてメモリに格納される。
【0067】
この手順は、画像の(それぞれ画像の垂直方向・水平方向の端からの垂直方向距離Vおよび水平方向距離Hの範囲内の)各画素について繰り返される。これによって、HまたはVのウィンドウサイズを用いて画素に対するスライディング・ウィンドウ分析を提供する。次に、画像(フレーム)内の各画素の水平方向および垂直方向測度が平均されて全体的画素差分測度CF(等式(5)を参照)を与える。次に、各画像に関連したこの全体的測度が複数の画像にわたって平均されて、シーケンス平均された測度、すなわち等式(7)によって時間平均された測度TCFを取得する。全体的(CF)測度が平均される対象の画像の数は、映像シーケンスの性質および場面変化の時間間隔に依存し、数秒程度であり得る。明らかなことに、特に量子化ステップ幅が画像ごとに変化する場合、画像の一部だけがこのように分析される必要がある。
【0068】
画像内の異なる場所でのコントラストを測定するとともに平均を取ることによって、画像の複雑性の単純な測度が取得される。画像の複雑性が歪みを覆い隠すことがあり、それ故に、画像が所与の歪みについてより良い品質であると視聴者に信じさせる場合があるので、画像の複雑性の度合いが使用されて視聴者によって映像信号と対応付けされる品質の主観的度合いをある程度予測することができる。
【0069】
影付きの画素に関するそれぞれの領域の幅(H)または高さ(V)は、視聴者が複雑性について気が付く詳細さの程度に関係する。したがって、画像が遠くから見られるのであれば、HとVは視聴者が画像に接近することが意図される状況での場合よりも大きくなるように選択される。一般に、画像からの視聴者にとって快適な距離は画像のサイズに依存するので、HおよびVのサイズおよびVは画素サイズおよび画素寸法に依存する(典型的にはより大きなディスプレイはより多くの画素ではなくより大きな画素を有する。ただし、ある所与の画素密度についてはディスプレイサイズも要因となり得る)。典型的には、HおよびVは、各々、それぞれの画像寸法の0.5%と2%の間にあることが予想される。例えば、水平方向に720個の画素があるとともに平均のための組がそれぞれ4つの画素を含んでいる場合、水平方向の値は4*100/720=0.56%であり得、また、垂直方向においては、垂直方向に576個の画素がある場合、4*100/576=0.69%であり得る。
【0070】
コントラスト測度を算出するための分析は、以下の等式を参照して次のように記述されることが可能である。この計算は復号された映像画像Dを使用して各画像の画像平均された複雑性測度CFを決定する。CFは、復号された映像についてのスライディング・ウィンドウ画素分析を最初に行なうことにより決定される。図2(これは水平方向サイズが画素Px個および垂直方向サイズが画素Py個の画像内の画素p(x,y)についての水平方向分析を示している)では、水平方向コントラスト測度Chは、復号されたシーケンスDのn´番目の画像について、以下に従って計算される。
【数2】
【0071】
Hは、水平方向画素分析のためのウィンドウ長さである。Ch(n,x,y)は、復号された映像シーケンスDのn´番目の画像の画素p(x,y)のための水平方向コントラスト・パラメータである。D(n,x,y)は、復号された映像シーケンスDのn´番目の画像の画素p(x,y)の強度である。
【0072】
対応する垂直方向画素分析を示す図10では、垂直方向コントラスト測度Cvは、以下に従って計算される:
【数3】
【0073】
ここで、Vは、垂直方向画素分析のためのウィンドウ長さである。
【0074】
次に、ChとCvが組み合わせられて水平垂直方向測度Chvを与え得る。
【0075】
Chv(n,x,y)=max(Ch(n,x,y),Cv,(n,x,y)) (4)
X=H−1…Px−H−1
y=V−1…Py−V−1
ここで、適用形態によっては、水平方向・垂直方向成分を別々のままにして主観的品質の評価(ユニット6)の際に各々に異なる重み付けパラメータが適用されることを可能にする方が良い場合があることが注目されるべきである。
【0076】
最後に、全体的な画像平均された画素差分測度CFが、コントラスト値Ch、Cvおよび(または)Chvから、以下に従って計算される。
【数4】
【0077】
時間平均する
このことは、画像平均されたパラメータQPFおよびCFを使用して、対応する時間平均されたパラメータTQPFおよびTCFを以下に従って決定する。
【数5】
【0078】
パラメータ平均算出は、MOS推定値が必要な時間間隔にわたって行なわれるべきである。これは、TQPFとTCFの1対を算出する1つの分析期間かもしれないし、一連のパラメータを算出する一連の間隔かもしれない。典型的に秒単位の長さのウィンドウ間隔で、CFおよびQPF時間シーケンスを貫いて時間に関して分析ウィンドウを「滑らせる」ことによって、連続的な分析が達成され得る。
【0079】
MOSを推定する
このことは、時間平均されたパラメータTQPFおよびTCFを使用して、復号されたシーケンスDの対応する期間についての主観的に測定された平均オピニオン評点の推定値PMOSを作成する。TQPFは、復号されたシーケンス内のノイズの推定に寄与し、TCFは、そのノイズが映像シーケンスのコンテンツによってどれくらい覆い隠され得るかの推定に寄付する。PMOSは、以下に従って、パラメータの組合せから計算される。
【0080】
PMOS=F1(TPQF)+F2(TCF)+K0 (8)
F1およびF2はAvQpおよびCS内の適切な線形または非線形の関数である。K0は定数である。PMOSは予測された平均オピニオン評点で、1…5の範囲内にある。5が優良品質に、1が悪い品質に等しい。F1、F2、およびK0は、多くの商用統計ソフトパッケージにおいて利用可能な適切な(例えば、線形、多項式、対数型の)回帰分析によって決定され得る。そのような分析は、既知の主観的品質のトレーニング・シーケンスの組を必要とする。次に、F1、F2、およびK0によって定義されたモデルは、MOSを独立変数としTQPFおよびTCFを従属変数として用いて回帰分析によって導出され得る。典型的に、この、結果得るモデルが使用されてトレーニングにおいて使用される劣化に類似の劣化(コーデック・タイプおよび圧縮率)にさらされた検査シーケンスの品質を予測する。しかしながら、映像コンテンツは異なり得る。
【0081】
最大解像度(full resolution)放送の素材のH.264圧縮については、適切な線形モデルは、
PMOS=−0.135*TPQF+0.04*CS+7.442 (9)
であることが見出された。
【0082】
そして、その結果得る推定値は、以下に従って制限されている。
【0083】
if(PMOS>5)PMOS=5
if(PMOS<I)PMOS=1 (10)
以下に、上記の実施形態の様々な側面の補足説明が提供される。
【0084】
導入:分析の際にソース映像シーケンスおよび劣化した映像シーケンスの両方を利用する完全参照型映像品質測定ツールは放送映像についての映像品質を高精度で予測できることが示された。既に劣化した「参照」シーケンスにアクセスしない無参照型技術のデザインは、より困難な提議である。
【0085】
無参照型分析の別の形態は、復号器またはネットワーク中のどこかで、符号化されたビット・ストリームへアクセスすることによって達成され得る。そのような「ビット・ストリーム」分析は、量子化器ステップ幅、動きベクトル、およびブロック統計のような符号化パラメータに容易にアクセスできるという長所を有する。これは、フレーム・バッファ分析に対しては利用不可能である。ビット・ストリーム分析は、逆変換または動き予測されたマクロブロックの再構成無しの、復号されたパラメータの簡単な計算の分析から、映像シーケンスの完全復号まで及び得る。
【0086】
PSNRは、映像符号化器および完全参照型映像品質測定ツールの両方における主観的な映像品質の評価において使用される測度である。無参照型ツールでは、PSNRは直接計算されることが不能であるが、推定されることは可能である。ここで、我々は、完全参照PSNR測度を性能で凌駕し得るH.264/AVC復号器内で動作する無参照型映像品質予測技術を紹介する。
【0087】
第1に、結果が、PSNR測度を様々なH.264符号化されたシーケンスに対して使用するベンチマーク品質推定に提供される。第2に、平均量子化器ステップ幅(AvQP)の測度を使用して主観的品質を推定するビット・ストリーム技術に対する考察が与えられる。PSNRへの単なる近似ではなく、このビット・ストリーム無参照型測度は、品質推定について完全参照PSNR測度を性能で凌駕することができることが示されている。
【0088】
最後に、ノイズ・マスキング(CS)の測度が導入される。これは、PSNRおよび量子化器ステップ幅に基づいた品質推定技術の両方の性能をさらに向上させる。測度は、復号された画像シーケンスの画素差分分析に基づいており、映像復号器内で算出される。結果得る、復号器を基板とする無参照型モデルは、0.91を超える測定された主観的スコアと推定された主観的スコアとの間の相関を達成することが示されている。
【0089】
映像検査素材 − トレーニングおよびテスト・データベース:
本技術をトレーニングおよびテストするために使用される映像データベースは、18個の異なる8秒のシーケンス(全て、625の放送フォーマット)から構成された。トレーニング・セットは9つのシーケンスから構成された。シーケンスのうちの6つはVQEG1データベースから、また、残りの3つは他のところから調達された。テスト・セットは9つの異なるシーケンスから構成された。VQEG1コンテンツはよく知られており、VQEGウェブサイトからダウンロードされることが可能である。品質パラメータは各シーケンスの継続時間にわたる平均に基づくことになっているので、動きおよび細部が一貫している特性を備えるコンテンツを選択することが重要であった。シーケンスの詳細は表4に示されている。
【表3】
【0090】
映像テスト素材 − 符号化:
H.264符号化器JM7.5cを使用してトレーニング・シーケンスおよびテスト・シーケンスの全てが符号化された。各々に対して同じ符号化器オプションが設定されている。符号化器設定の主な特長は次の通りであった:
I、P、B、P、B、P、…フレームパタン; レート制御無効; 量子化パラメータ(QP)固定; 適応性フレーム/フィールド符号化有効; ループ濾波無効。
【0091】
非常に多様な符号化器設定を用いて、上記の設定を一定に保つとともに各ソース・ファイルに対する検査の相互間で量子化器ステップ幅パラメータだけを変えることにした。
【0092】
公式の単刺激主観テストが12個の対象をトレーニング・セットとテスト・セットの両方に使用して行なわれた。平均MOSの結果は、表5(トレーニング・セット)および表6(テスト・セット)に示されている。
【表4】
【表5】
【0093】
品質推定 − ピーク信号対雑音比:ピーク信号対雑音比(PSNR)は、一般に使用されている品質の完全参照型測度であり、多くの映像符号化器における最適化のための重要な測度である。正確に並べられた参照シーケンスおよび劣化したシーケンスを用いれば、PSNRは算出される直接的測度であり、時間平均された測度(AvPSNR)が以下に従って計算されてもよい。
【数6】
【0094】
ここで、s(n,x,y)およびd(n,x,y)は、ソース・シーケンスsおよび劣化シーケンスdからの水平方向において画素X個(x=0…X−1)および垂直方向においてY個の画素(y=0…Y−1)の寸法のN個のフレームのうちのn´番目のフレーム内の対応する画素強度値(0…255)である。この等式が使用されて、9つのトレーニング・シーケンスの各々の8秒間の平均PSNRを計算した。平均測定MOSに対する平均PSNRのプロットが図11に示されている。
【0095】
平均PSNRが25dBのMOSスコアが考慮される場合、データのコンテンツ依存の性質が示されている。データ中のMOSスコアが3の範囲は、知覚される品質を推定するためにPSNRを使用することが不正確である可能性を示す。多項式回帰分析は、MOSとAvPSNRのデータ間の0.78の相関および0.715のRMS残留を産出する。
【0096】
品質推定 − 量子化器ステップ幅:H.264については、量子化器パラメータQPは、変換係数を符号化するために使用される線形量子化器の間隔QSTEPを定義する。QPは、所定の間隔値の表に索引を付ける。ここでは、QSTEPは、QPが6増分するごとに大きさが2倍になる。
【0097】
トレーニング・セットの各テストに対して、QPは、PおよびIマクロブロックについては20、28、32、36、40、または44の1つの値に固定されており、Bマクロブロックについては2大きい。図12は、9つのトレーニング・シーケンスの各々についての平均MOSに対する平均QPのプロットを示している。
【0098】
MOSと平均QPとの間の多項式回帰分析は、0.924の相関および0.424のRMS残留を産出する。さらに、様々なQP値での予測されるMOS範囲がAvPSNRについての範囲を著しく下回ることは明白である。
【0099】
量子化器ステップ幅によるPSNRの推定値は、量子化範囲内のエラー値の一様分布の近似に依存する。しかしながら、大多数の係数が0まで「中心切り取り(center-clipped)」される場合、この近似は大きなステップ幅で且つ低ビットレートについては成り立たない。やや意外にも、結果は、AvQPがPSNRより主観的点数のより良い予測値であり得ることを示している。H.264におけるQPおよび実際の量子化器ステップ幅の間の非線形写像が何らかの形で多項式分析を緩和し得る可能性が減少し、実際のステップ幅対MOSについても同様の結果が得られたことはここで注目されるべきである。
【0100】
画素コントラスト測度 − 歪みマスキング:歪みマスキングは、符号化された映像シーケンス内の歪みの知覚に影響する重要な要素である。そのようなマスキングは、スペクトル上の、または時間上の、または空間上の同じ地点における信号とノイズ成分とを人間の知覚機構が識別できないために生じる。そのような考慮事項は、ビットの効率的配分が不可欠である映像符号化器の設計において非常に重要である。この分野における研究は変換と画素の両方の領域の中で行なわれてきた。ここでは、画素領域だけが考慮される。
【0101】
画素コントラスト測度 − 画素差分コントラスト測度:ここで、画素領域における分析によって画像シーケンスのマスキング特性を決定するという考え方が、映像品質推定に適用される。実験は、スライディング・ウィンドウ画素差分分析によって算出されたコントラスト測度が非常に良好に機能することを明らかにした。
【0102】
画素差分コントラスト測度ChおよびCvは上記の等式(2)および(3)によって算出される。ここで、Hは水平方向画素分析用のウィンドウ長さであり、Vは垂直方向画素分析用のウィンドウ長さである。次に、等式(4)に従って、ChとCvが組み合わせられて水平・垂直方向測度Chvを与える。次に、Chvが使用されて、等式(5)に従ってフレームについての全体の画素差分測度CFを算出し、続いて、上記の等式(6)において定義されるようにシーケンス平均された測度CSを算出し得る。シーケンス平均測度CS(上ではTCFと称されている)は、H=4およびV=2を使用して、復号されたトレーニング・シーケンスの各々ついて算出され、その平均量子化器ステップ幅に対してプロットされた結果は図13に示されている。
【0103】
図13中の結果は、図11のPSNR対MOS結果、およびより少ない程度で図12のAvQstep対MOS結果と、この順序で著しい類似性を示す。「カレンダー」および「岩」シーケンスは最も高いCS値を有しており、また、PSNRおよびAvQstepの両方において良好な範囲にわたって最も高いMOS値を有している。同様に、「カヌー」および「稚魚」シーケンスは最低のCS値を有しており、そして最低のMOS値群内にある。したがって、復号された画素から算出されたCS測度は、シーケンスのノイズ・マスキング特性と関係を有しているようである。高いCSは、所与のPSNRについて、マスキングが高く、ひいてはMOSが高いことを意味する。無参照型品質推定におけるCS測度の潜在的用途が、下に述べられている多重回帰分析に含められることによって調べられた。
【0104】
結果:第1に、トレーニング・セット用の平均MOS(従属変数)は、多くの商用統計ソフトパッケージ(例えばStatviewTM)において利用可能なもののような標準多項式/対数型回帰分析を使用して、PSNR(独立変数)によってモデル化された。これについては、www.statview.comを参照されたい。次に、結果得るモデルが、テスト・シーケンスに対して使用された。次に、これが、AvQPを独立変数として使用して繰り返された。このプロセスが、各場合でのCSを補助的独立変数として用いて繰り返された。結果得る、推定MOS値と測定MOS値との間の相関およびRMS残差は、表7に示されている。
【表6】
【0105】
結果は、シーケンス平均されたコントラスト測度(CS)をPSNRまたはAvQPに基づいたMOS推定モデルに含めることが、トレーニング・セットおよびテスト・データ・セットの両方について成績を向上させることを示している。AvQPパラメータおよびCSパラメータを使用するモデルの成績は特に良好であって、トレーニング(0.95)およびより印象的なことにテスト(0.916)の両方について0.9を超える相関を達成した。
【0106】
AvQP/CSモデルについての各トレーニング結果およびテスト結果は、図14において散布図の形態で示されている。
【0107】
結論:H.264の映像復号器における主観的映像品質推定のための2つのパラメータ・モデルが提供された。映像シーケンスにわたって平均されたH.264量子化器ステップ幅インデックスに相当するAvQPパラメータは、ノイズの推定に寄与する。復号された画素のスライディング・ウィンドウ差分分析を使用して算出されるCSパラメータは、映像コンテンツのノイズ・マスキング特性の示度を付加する。これらのパラメータが一緒に使用されると、復号器において驚くほど正確な主観的品質推定が達成され得ることが示されている。
【0108】
8秒のトレーニング・シーケンスおよびテスト・シーケンスは、時間にわたる画像特性の著しい変動を減じる目的で選択された。その意図は、測定MOSスコアが一時的で明瞭な歪みによって過度に重み付けされないように、劣化が一貫している特性を備えた復号されたシーケンスを使用することであった。こうすることによって、シーケンス平均されたパラメータを使用するMOSスコアのモデル化が、より実用的かつより正確なプロセスになる。
【0109】
等式(5)において定義されているコントラスト測度CFは、取得された画像の全体についての各画素に対して行なわれている平均に依存する。空間上・時間上のブロックに対するCFの分析が有益であり得ることが分かった。
【背景技術】
【0001】
本発明は、複数のフレームを表わす映像信号を符号化する方法およびシステムに関し、特に、符号化された信号についての品質測度を導出する映像信号を符号化する方法およびシステムに関する。
【0002】
ディジタル映像信号が、通信リンクを通して効率的に送信されることができるように符号化することが知られている。ソースデータは、例えば画素のブロックの予測、離散コサイン変換(DCT)、量子化、ランレングス符号化、および統計・心理物理的冗長性を利用する他の圧縮技術のような良く知られている技術を使用して、送信される必要のあるデータ量を低減するような方法で符号化される。良く知られている映像符号化アルゴリズム/規格はMPEG2およびH.264/MPEG−4 AVCを含んでいる。また、他の既知の規格が存在することが認識されるだろう。通信リンクの復号側において、符号化映像を表示装置にそれを出力することができるように復号する(あるいは伸長)ためにソフトウェアが設けられている。
【0003】
データリンクを介して送信されるデータ量を低減する点では有用であるが、量子化プロセス(無ノイズ符号化ではない)を伴った映像信号を圧縮する工程は、歪みを導入し、したがって、映像の質を低減し得る。多くの符号化アルゴリズムは、歪みが見る人によって可能な限りほとんど知覚されないように人間視覚システム(HVS)の限界を活用する傾向がある。歪みを測定する1つの方法は、復号された映像シーケンス内の知覚可能な歪みのレベルに注目し、その結果を平均して平均オピニオン評点(MOS)を得ることを含んでいる。しかしながら、この人の手による工程は時間のかかるものであり得、訓練された人が、意味のあるデータを提供するために適切に映像の代表的な主題サンプルを判断することを要求する。そこで、知覚品質を評価するソフトウェア・ツール(いわゆる知覚品質メトリック(PQM)ツール)を設けることが知られている。そのようなPQMツールは通信リンクの復号器側に設けられる。出願人の国際特許出願番号GB2006/004155は典型的なPQMツールについて詳細に記述している。
【0004】
商用映像システム(例えばインターネット・プロトコル・テレビ(IPTV)システム)では、知覚品質は重要な問題である。チャネルの性質は符号化器側でデータ圧縮を必要とするだろう。しかしながら、IPTVサービス・プロバイダの顧客は、映像品質の点においてサービスの一定レベルを期待する。また、したがって、サービス・プロバイダは、送信された映像が、(常にではないとしても)大量の送信の場合に顧客の期待を満たすだろうということを保証することを切望している。
【発明の概要】
【0005】
本発明の第1の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、(c)前記品質測度が前記所定の品質基準を満たさない場合、前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、ことを具備する方法が提供される。
【0006】
知覚品質メトリックは、知覚される映像の品質(すなわち人間の視聴者によって知覚されるような映像の品質)を客観的に評価または予測するように構成されているメトリックまたはモデルを意味すると理解される。これは、結果得る品質測度が自動的に一貫して適用されることが可能であることを意味する。
【0007】
本方法は、映像信号と関連付けられている品質測度が所定の品質基準を満たさない場合にこの映像信号の繰り返しの再符号化を提供する。この再符号化は、前記少なくとも1つの符号化パラメータの修正値または映像信号の修正された形態を使用する。こうすることによって、フィードバック構成が使用されて、符号化された信号が品質要求事項の何らかの形態を満たすことを保証する。そのような方法は、IPTVのような商用の適用形態において顧客に対する最小レベルのサービスを保証したい映像コンテンツ・サービス・プロバイダにとって特に利益を提供し得る。一旦品質測度が所定の品質基準を満たすものとして確認されるとステップ(c)は実行される必要がないことが認識されるだろう。
【0008】
本方法は、好ましくは通信リンクの符号器側で実行され、また前記品質測度が前記所定の品質基準を満たす場合のみ、前記符号化された信号を通信リンク上で映像復号器に送信することをさらに具備する。
【0009】
ステップ(c)において、前記符号化パラメータの値または前記映像信号に適用される修正の量は、ステップ(b)において生成される前記品質測度の値の関数であり得る。
【0010】
本方法は第1および第2信号部分に対して実行され得、前記第2信号部分は、前記品質測度が前記第1信号部分について前記所定の品質基準を満たす場合に符号化される。
【0011】
前記品質測度は、好ましくは所定のアルゴリズムを用いて生成される数値であり、前記品質測度は、前記数値が所定の範囲内にある場合に前記所定の品質基準を満たす。前記所定の範囲は第1および第2境界値によって定義され得、前記適用される修正は、前記品質測度の値が後続の繰り返しにおいて前記境界値の一方に近づく変化に帰着する。
【0012】
前記符号化された信号は、複数の個別に識別可能なフレーム群(GOF)を表わし得、 品質測度は各GOFに対して導出可能であって、ステップ(c)において、前記少なくとも1つの符号化パラメータの修正された値または前記映像信号の修正された形態は前記所定の品質基準を満たさない各GOFに適用される。
【0013】
本方法は、各々がステップ(c)において適用される択一的なプロファイルを定義する複数の修正プロファイルを提供し、1つ以上の選択規則に応じて前記複数のプロファイルのうちの1つを選択する、ことをさらに具備し得る。たとえば、連続する所定数のGOFが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択される。前記第1プロファイルは、適用されると前記GOFに対応する前記映像信号の濾波された形態を再符号化するように構成されている。前記濾波は、前記GOFの各フレームを符号化するのに必要なビット数を減じることを具備し得る。所定数のGOFを具備するセグメントにおいて一部のGOFのみが前記所定の品質基準を満たさない場合に第2プロファイルが選択される。前記第2プロファイルは、適用されると各不合格GOFに対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている。
【0014】
各フレームについてのさらなる品質測度が生成され得る。あるフレームについての前記さらなる品質測度が前記所定の品質基準を満たさない場合、フレーム内分析が該フレームに対して実行されて該フレームのどの部分が修正を必要としているかを判断する。
【0015】
上記の少なくとも1つの符号化パラメータは、量子化ステップ幅を含み得る。この場合、ステップ(c)は量子化ステップ幅の修正された値を適用することを具備する。択一的にまたは付加的に、前記少なくとも1つの符号化パラメータは、符号化ビットレートを含み得る。この場合、ステップ(c)は前記符号化ビットレートの修正された値を適用することを具備する。
【0016】
本発明の第2の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、(b)知覚品質メトリックを使用して符号化された信号についての数値の形態の品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し(前記品質基準は上限および下限を有する数値の範囲によって定義されている)、(c)前記品質測度が前記所定の品質基準を満たさない場合、前記少なくとも1つの符号化パラメータを修正するとともに前記値が前記値の範囲に入るまでステップ(a)乃至(c)を繰り返す、ことを具備する方法が提供される。
【0017】
本発明の第3の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、(c)前記品質測度が前記所定の品質基準を満たさない場合、複数の修正プロファイルのうちの1つを選択するとともに前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、ことを具備し、所定数のフレームを具備する前記映像信号のセグメントが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択され、前記第1プロファイルが、適用されると前記映像セグメントの濾波された形態を再符号化するように構成されており、所定数のフレームを具備する前記映像信号のセグメント内のフレーム部分集合またはフレーム群のみが前記所定の品質基準を満たさない場合に第2プロファイルが選択され、前記第2プロファイルが、適用されると各不合格フレームまたはフレーム群に対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている方法が提供される。
【0018】
本発明の第4の側面によれば、複数のフレームを表す映像信号を符号化する方法であって、(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化することであって、前記符号化された信号が複数の個別に識別可能なフレーム群(GOF)を表わしており、(b)複数のGOFを具備する映像セグメントについて、知覚品質メトリックを使用して各GOFについての品質測度を生成し、(c)前記品質測度が所定の品質レベルを下回っている前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを下回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、(d)前記品質測度が所定の品質レベルを上回っている同じ前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを上回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、(e)(c)および(d)において修正された前記符号化パラメータを使用して前記映像セグメントを再符号化する、ことを具備する方法が提供される。
【0019】
プロセッサ上で実行されると前記プロセッサに上記の方法を実行させるプロセッサ・コードを運ぶためのキャリア媒体が提供され得る。
【0020】
本発明の第5の側面によれば、少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して複数のフレームを表す映像信号を符号化するように構成されている映像符号化器と、前記映像符号化器からの前記符号化された信号を受け取るためのものであって、前記符号化された信号についての品質測度を生成し、前記品質測度が所定の品質基準を満たすかを確認し、前記品質測度が前記所定の品質基準を満たさない場合、前記映像符号化器に前記少なくとも1つの符号化パラメータについての修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまで前記映像信号を繰り返し再符号化させるように構成されているコントローラと、を具備する映像符号化システムが提供される。
【0021】
前記コントローラは、前記品質測度が前記所定の品質基準を満たす場合のみ、前記符号化された信号を通信リンク上で映像復号器に送信するように構成され得る。前記コントローラは、使用の際、前記符号化パラメータの値または前記映像信号に適用される修正の量が生成される前記品質測度の値の関数であるように構成され得る。本システムは、前記映像符号器からの所定数の符号化されたフレームを受信および保存するためのバッファをさらに具備し得る。前記バッファは、以前に送信されたフレームの組について生成された前記品質測度が前記所定の品質基準を満たさないことを示す前記コントローラからの制御信号に応答して前記符号化されたフレームを前記コントローラに送信するように構成されている。 前記コントローラにおける前記品質測度は所定のアルゴリズムを用いて生成される数値とされることが可能である。前記数値が所定の範囲内にある場合、前記品質測度が前記所定の品質基準を満たす。前記所定の範囲は、第1および第2境界値によって定義され得、前記コントローラにおいて適用される修正は、前記品質測度の値が後続の繰り返しにおいて前記境界値の一方に近づく変化に帰着する。前記符号化器によって生成された前記符号化された信号は、複数の個別に識別可能なフレーム群(GOF)を表わし得る。前記コントローラは、各GOFに対して品質測度を生成し、前記所定の品質基準を満たさない各GOFに対して前記少なくとも1つの符号化パラメータの修正された値または前記映像信号の修正された形態を適用するように構成されている。前記コントローラは、各々がステップ(c)において適用される択一的なプロファイルを定義する複数の修正プロファイルを提供し得、また、1つ以上の選択規則に応じて前記複数のプロファイルのうちの1つを選択するように構成されている。前記コントローラは、使用の際、連続する所定数のGOFが前記所定の品質基準を満たさない場合に第1修正プロファイルを選択するように構成されることが可能である。前記第1プロファイルは、前記コントローラによって適用されると前記GOFに対応する前記映像信号の濾波された形態を再符号化するように構成されている。前記濾波は、前記GOFの各フレームを符号化するのに必要なビット数を減じることを具備することを具備し得る。前記コントローラは、使用の際、所定数のGOFを具備するセグメントにおいて一部のGOFのみが前記所定の品質基準を満たさない場合に第2プロファイルを選択するように構成されることが可能である。前記第2プロファイルは、前記コントローラによって適用されると各不合格GOFに対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている。前記コントローラは、各フレームについてのさらなる品質測度を生成するように構成され得る。あるフレームについての前記さらなる品質測度が前記所定の品質基準を満たさない場合、フレーム内分析が該フレームに対して実行されて該フレームのどの部分が修正を必要としているかを判断する。前記少なくとも1つの符号化パラメータは量子化ステップ幅を含み得、ステップ(c)は量子化ステップ幅の修正された値を適用することを具備する。前記少なくとも1つの符号化パラメータは符号化ビットレートを含み得、ステップ(c)が前記符号化ビットレートの修正された値を適用することを具備する。
【0022】
次に、本発明が、添付図面を参照して例として記述される。
【図面の簡単な説明】
【0023】
【図1】本発明に従った符号化システムがコンテンツ・サービス・プロバイダ側で用いられ得るところの商用映像システムのブロック図。
【図2】本発明に従った、一般化された映像符号化システムのブロック図。
【図3】符号化された映像についての品質測度を示すために用いられることが可能な代替的な知覚品質測定スケールを数の形態で示す。
【図4】本発明の好ましい実施形態に従ったH.264の映像符号化システムのブロック図。
【図5】品質シナリオについて複数のフレームに関して取得された例示的な知覚品質測度を示すグラフ。
【図6】品質シナリオについて複数のフレームに関して取得された例示的な知覚品質測度を示すグラフ。
【図7】品質シナリオについて複数のフレームに関して取得された例示的な知覚品質測度を示すグラフ。
【図8】映像シーケンスの品質の評価のための、好ましい実施形態での使用に適する、知覚品質測定装置を機能の観点から示すブロック図。
【図9】図8の装置において、水平コントラスト測度が画像内の画素についてのどのように計算されるかを示す。
【図10】図8の装置において、垂直コントラスト測度が図9の画像内の画素についてのどのように計算されるかを示す。
【図11】トレーニング・シーケンスについてのAvPSNR対測定されたMOSを示す。
【図12】トレーニング・シーケンスについてのAvQP対測定されたMOSを示す。
【図13】トレーニング・シーケンスについてのCS対測定されたMOSを示す。
【図14】AvQP/CSモデルについての評価されたMOS対測定されたMOSを示す。
【発明を実施するための形態】
【0024】
次に、映像信号を符号化する方法およびシステムが詳細に記述される。この方法およびシステムにおける目的は、信号がリンク上で効率的に送信され得るとともにこの信号が複合および表示される際に推定された知覚品質の点において所定の基準を満たすために圧縮される信号を通信リンクの符号化側で提供することである。このことは、知覚品質メトリック(PQM)システムを利用して推定知覚品質の数量化する制御ユニットと、該数量化されたPQMを信号が送信に先立って満たさなければならないユーザ定義の基準と比較する制御ロジックと、を符号化側で設けることによって達成される。基準を満たす場合、信号は単に通信リンクを介して前方へ送信される。そうでなければ、コントロール・システムは、信号を例えば、事前濾波を用いて修正するかまたは修正された符号化パラメータを用いてその品質を改善するような方法で信号を再符号化するように動作可能である。このことは、数量化されたPQMを基準に向かって収束させることである。この符号化・修正・符号化シーケンスを多く繰り返すことは、結果生じるPQMがその基準を満たして送信される前に必要である。有利なことに、一旦符号化と基準のための初期値パラメータがユーザによってセットされれば、本システムは自動的に動作することができる。したがって、映像コンテンツのプロバイダは、プロバイダに要求される最小の双方向交流で、視聴者が最低のサービス水準、すなわち改善されたサービス水準を満たすコンテンツを復号し視聴するだろうという以前よりも高い確信を有する。
【0025】
図1を参照すると、そのような符号化システムを使用することが有利な商用システムの一例が示されている。図において、コンテンツ・サービス・プロバイダ10は、複数の顧客にディジタル形式の映像コンテンツを送信する。これらの顧客は、それぞれのセットトップ・ボックス(STB)12をテレビジョンセット(テレビ)14への出力に用いて、ディジタル信号を受け取るとともに復号する。コンテンツは、様々な方法、例えば地上放送アンテナ16を用いる無線リンク、または銅または光ファイバー・ケーブルを利用する、IPリンク18のような「インターネットに通じた(wired)」接続を通して送信され得る。後者の方法はますます一般的になっており、一般にIPTVと呼ばれる。衛星放送はさらなる選択肢である。確かに、一部のサービス・プロバイダは、例えば無線リンクを通して無料放送のコンテンツを放送すると同時にIPTVリンクを用いてビデオ・オン・デマンド(VOD)サービスを提供することによって複数の通信方式を組合せて実行する。どちらの方法が用いられても、サービス・プロバイダ10は、映像信号を、サービス・プロバイダと顧客のSTB12の間の有限の帯域幅リンクを通して効率的にそれを送信することができるようにソース・ディジタル信号が圧縮されるような方法で映像信号を符号化することを要求される。この工程は時にソース符号化と呼ばれ、多くの符号化アルゴリズムまたは規格が知られている。以下の記述は、H.264/MPEG−4 AVC規格の使用を想定している。ただし、他の映像符号化規格が用いられることが可能であることが理解されるべきである。各STB12において、復号器が、符号化器で用いられる規格に従って受信信号を復号するために設けられる。
【0026】
図2を参照すると、上記の品質管理機能を使用する、一般化された符号化システムのブロック図が示されている。ソース映像20は、選択された符号化規格に従って動作するように設計された符号化器22に供給される。ソース映像20は、フレームのシーケンスを含む映像コンテンツをディジタル形式で表わす。各フレームは、n×m個の画像素子または画素を含む。符号化器22は、多くのユーザ定義のパラメータ、特に符号化ビットレートさらに随意で符号化プロファイルに従って動作する。後者については、ある符号化規格は圧縮の所定の水準をもたらす具体的な符号化プロファイルを定義する。ビットレートおよび符号化プロファイルに加えて、ユーザは、さらに知覚の品質の合格水準に対応する一連の品質値を定義する品質閾値を指定する。ユーザはさらに最適の目標品質を設定し得る。
【0027】
品質閾値および目標は、符号化器22に供給されていることが示されているが、次のステージ(すなわち制御ユニット24)に直接供給されてもよい。
【0028】
制御ユニット24は符号化された映像データおよび上記の品質閾値および目標品質を受け取るように設計されている。制御ユニット24内には、サービス・プロバイダが何を必要とするかに依存して個々のフレームまたはフレーム群の知覚品質を示すために後に用いられることが可能な1つまたは複数の数値を生成するPQMシステム32がある。下に挙げられた具体例では、我々は、平均オピニオン評点(MOS)と呼ばれる測度を生成する。MOSは、我々が一般に今後参照する品質パラメータである。PQMシステム32が生成できるMOS値の範囲は予め定められている。また、多くの標準化されたシステムが、ITU-R Recommendationによって提供されている。図3aは、5ポイントのスケールを示す。ここでは、値「1」は悪い水準の知覚品質を示し、他方、「5」は優良を表わしている。図3bは、代替的な1対100スケールを示す。ここでは、「0」が最低の品質を表わし、「100」が最高品質を表わす。PQMシステム32は既知のPQMシステム(例えば完全参照システム、無参照システム、簡易参照システム)から構成されることが可能である。読み手が別のタイプおよびそれらの一般的な動作原理を知っていると思われる。純粋な無参照PQMシステムの場合には、未加工の符号化ビット・ストリームへアクセスすることが必要なことの全てである。完全参照PQMシステムの場合は、ソース映像のコピーが必要である。したがって、図2中に点線が存在している。簡易参照PQMシステムは、ソース内容に関する、全てではなく一部の情報を必要とする。以下尾の詳細な記述では、我々は、異なる品質情報を生成するためにビット・ストリームおよび複合された内容の両方を必要とするハイブリッド・ビット・ストリーム/復号器無参照PQMシステム32の使用について記述する。従って、PQMシステム32は復号器(この具体的事例ではH.264復号器)を含んでいるだろう。
【0029】
PQMシステムによって生成されることが可能な情報のタイプは、パラメータの次の非網羅的なリストを含んでいる:
・フィールド/フレーム毎平均オピニオン評点MOSFn
・映像ユニット/画像群平均オピニオン評点MOSGOP
・品質の一時的変化(MOSFn−MOSFn−1)
・平均オピニオン評点の映像ユニット変化(MOSGop(k)−MOSGop(k−i))
・空間上の複雑性
・空間上のマスキング
・一時的複雑性
・(フィールド/フレーム毎)量子化器ステップ幅
・ビットレート
・スライス構造
・マクロブロックサイズおよび構成
・動きベクトル値
制御装置24内にさらに設けられているのは、PQMシステム32によって生成された1つまたは各パラメータ(詳細な説明においては、1つのMOS値が用いられている)を受け取って、示されている品質測度が、ユーザ入力によって閾値および目標値によって定義された品質値の範囲内にあるか否かを判断するように構成されているロジック回路34である。そうである場合、制御ロジック34は映像を「合格」とし、映像は後の送信に備えて格納されるか、直ちに送信される。そうでない場合、制御ロジック34は映像を「不合格」とし、映像は送信も格納もされない。代わりに、映像データ(すなわち不合格のフレームまたはフレーム群に対応するソース映像データ)は、符号化前に事前濾波された映像データとともに、および/または修正済符号化パラメータ(典型的には、量子化ステップ幅(QSS)または符号化ビットレートの修正された値)を用いて、再び符号化される。符号化パラメータを事前濾波するか修正するかどうかの選択は、制御装置のロジック34の一部として提供される所定の修正規則に基づく。この規則は、次の符号化反復において品質測度が閾値によって定義された合格品質範囲に少なくとも近づくものとして定義される。さらに、後に説明されるように、適用される修正のタイプおよび/または量は、PQMシステム32によって生成されたパラメータの1つ以上に依存する。図2は、フレームまたはフレーム群が再符号化および符号化器22のための更新されたパラメータの組を要求していることを示す制御信号をソース映像に供給するものとして個別のモジュール28を示している。実際上、これは、制御装置24の不可欠な部分を形成し得る。
【0030】
上記のように、品質測度が範囲内に収まり、また映像が記憶装置に渡され、また/または前方への送信の前に、多くの再符号化の繰返しが必要であるかもしれない。時間が重要な(time critical)適用形態では、映像データが送信される前の繰返しの回数が所定回数に制限されてもよい。
【0031】
一般化された符号化システムの操作手順が、次に記述される。
【0032】
まず、ソース映像20が符号化器に提示される。操作者は関連する符号化パラメータ、例えばQSS、符号化ビットレート、符号化プロファイル、品質閾値、を設定する。その後、符号化された出力が制御装置24のPQMシステム32に渡される。PQMシステムのタイプに応じて、PQMシステム32が完全参照またはビット・ストリーム/復号器ハイブリッド法を使用する場合、符号化された映像は例えば復号を要求し得る。知覚品質測定値は各フレームに対して取得される。この測定値は、以前に列挙されたパラメータの1つ以上を提供する。測定法は、品質の瞬間的且つ局部的測度(例えばMOSi、MOSGOP)を出力し得る。次の段階は品質閾値によって定義される範囲に対する品質測定値を検査することを含んでいる。本検査は品質パラメータの任意の1つまたは組合せを使用し得る。ただし、以下に記述される実施形態では、1つの品質パラメータが生成および検査される。MOSGOP測度が最も重要なものであると考えられる。なぜなら、MOSi閾値未満への時折の低下は許容されるべきと考えられるからである。さらに、不合格だった内容に対処するかの決定は、好ましいか必要なビットレート制限で動作しつつ目標品質に合致するように品質を調節するために複数のGOPを考慮に入れることが推奨される。
【0033】
品質閾値以内にある映像コンテンツは格納または移送のために渡される。制御ロジック中の品質閾値検査に不合格のコンテンツは、このコンテンツの事前濾波されたバージョンを使用して、また/または修正済の符号化パラメータを使用して、再符号化される。我々は合格品質範囲を定義するために閾値を使用することについて記述するが、システムが、これよりも上にあれば品質検査に合格するという下限だけを使用して正しく機能することが認識されるだろう。しかしながら、我々の詳細な実行形態では、上限と下限の両方が設定される。また、ある状況では、上限すなわち高品質閾値の外側にあるデータを再符号化することが有利であり得る。
【0034】
修正された符号化パラメータが必要であるとコントロール・システムの制御ロジックが判断する場合、これらが所定の規則に従って生成され、符号化器に送られる。本プロセスが繰り返し実行されて符号化、測定、再符号化することができる。繰り返しは、映像品質が許容可能になるまで、あるいは定義済みの最大の繰返し回数に達するまで続く。新しい値は、符号化パラメータ(例えばQSS、符号化プロファイル、符号化ビットレートなど)の全てあるいは一部に対して提供され得る。非常に単純な例において、符号化ビットレートは、例えば、各繰返しについての百分率値によってビットレートを修正することによって、あるいは代わりに参照表(LUT)を参照することによって、符号化され得る。LUTは、PQMシステム32によって大きなコンテンツ・データベースを前もって処理することにより定義され得る。その後、LUTは、映像属性(例えば異なる空間上の複雑性または時間上の複雑性)、および符号化器パラメータ値(例えば量子化マップ)と並んで生成されたMOS値によって構築される。一旦コンテンツが制御装置24のPQMシステム32において測定されると、その後、不合格のコンテンツの特性が品質閾値と一緒にLUTに写像され、LUTから新しいパラメータまたはパラメータ・セットが生成されて符号化器22に渡される。
【0035】
空間上エラー写像を行なう(PQMシステムによって使用される)知覚モデルは、知覚品質情報を使用して特にエラーの傾向のある部分を対象にして品質を改善することができる。例えば、新しい符号化器パラメータの組を定義するには、その品質判定基準を満たすフレームは生成された新しい値を有さず、他方、不合格のフレームは新しいパラメータの組を有する。同様に、空間の領域では、画像のうちの品質境界内にある部分には新しい符号化値は提供されず、画像のうちの品質検査に不合格の部分には新しいパラメータが割り当てられることが可能である。ビットレートが主な制約である場合、本方法は、多くのGOP(例えば関連する受信器バッファのサイズと等価なGOPの組)に亘って空間上および時間上の品質を検討することによって動作する。この結果、(a)例えばQSSを増加させることによって、上側の品質境界を越えているフレームあるいはフレームの一部の品質が減じられる、および/または(b)例えばQSSを減じることによって、下側の品質境界未満のフレームあるいはフレームの一部の品質が増加させられる。
【0036】
符号化パラメータを修正することの代わりとして、制御ロジック34は、実際のソース映像20を変更する(すなわち事前濾波する)ことが適切であると判断し得る。符号化された映像の問題部分を特定することによって、品質測定値を使用して、符号化器22を強調する(stress)ソース映像のセグメントまたは領域を特定することが可能である。例えば、ソース映像20のある部分が動きが速くまたは細かな細部を有するものと特定され、PQMシステム32で低い品質を示す場合、特定の事前濾波が適用されることが可能である。制御装置24は、次の繰返しのためにデータの品質を改善する目的で、例えば画像解像度を減じるかあるいは空間周波数フィルタを適用することによって対応するソース・コンテンツを修正する命令を事前フィルタに送ることができる。
【0037】
品質管理ユニットを使用する符号化システムのより詳細な例が、次に記述される。
【0038】
図4を参照すると、符号化システムは、H.264符号化器42を利用して、フレームFnのシーケンスとして提供されるソース・コンテンツ40を符号化する。H.264符号化器42の構成および動作は良く知られており、詳細な記述は本明細書において提示されない。一般に、第一段44は、動き推定と動き補償を含む予測符号化を行なって、予測スライスおよびデータの残余値を生成する。後段では、変換符号化46、量子化48、画像並び替え50およびエントロピー符号化52が、例えば、CAVCLまたはCABACを使用して行なわれる。符号化された出力データは、本明細書でネットワーク抽象層(NAL)ユニット54と呼ばれる信号/データパケットに入れられる。
【0039】
符号化システムは、図2において示されるとともに図に関して記述された一般化された制御装置24のような、符号化されたデータの推定知覚品質を測定するためのPQMシステム32および制御ロジック34を含んでいる品質管理単位(QCU)56をさらに含み、品質が所定の品質判定基準を満たすかどうか判断し、満たさない場合、その信号および/またはそれの符号化を修正して品質を向上させる。信号は前処理フィルタ62を使用して修正される。符号化は、H.264符号化器42の量子化器部48へ入力される1つ以上のパラメータを修正することによって修正される。QCU56が符号化済映像を合格とした場合、符号化された映像は、後の、通信リンク/チャネルでの送信のために映像バッファ60に転送される。
【0040】
使用の際、操作者は、2Mbit/秒の目標符号化ビットレートを設定する。また、2秒の受信器バッファが指定される。操作者は、さらに上限および下限と目標品質とを指定することにより、品質判定基準を定義する。図3aにおいて示される5点の目盛が使用される。また、上限=4.0、下限=2.8および目標=3.4の値の例が使用される。符号化・測定・再符号化の繰返しの回数は3に制限されている。値はすべて符号化器42へ入力される。ただし、上限および下限、目標、および繰返しの制限は、QCU56に直接供給されてもよい。
【0041】
符号化されたNALユニット58はQCU56に送られる。その目的は、不合格のGOPまたはGOP内のフレームが無いかまたは最小で、下限より上でかつ好ましくは目標品質付近の比較的一貫した品質の映像コンテンツを生成することである。
【0042】
QCU56はPQMシステムを使用して、知覚品質測定を行なう。PQMシステムは、任意のタイプの既知のPQMシステム32とすることができる。実例を示すために、我々は同時係属の国際特許出願番号GB2006/004155に記述されているようなハイブリッド・ビット・ストリーム/復号器PQMシステムを使用する。その内容は、参照することによって本明細書に組込まれる。この種のPQMシステムのさらなる細部はこの記述の終わりに与えられる。
【0043】
PQMシステム32は2秒受信器バッファに従って映像データのセグメントに対して動作する。すなわち、2秒バッファ(図示せず)が符号化器およびPQMシステムの間に設けられる。後者は、このバッファからGOPを受け取り、受け取ったGOPを分析するように構成されている。QCU56および符号化器42は、さらなるGOPが、現在のGOPが処理され終わるまで、すなわち、現在のGOPが送信に向けて渡されるまで、バッファからPQMシステム32に供給されないように協力して動作する。唯一これが生じるのは、新しいGOPが受け取られた時である。不合格のコンテンツに対しては、符号化器42は、量子化器48に対する修正済の値についての指示を受け取るか、または次の前濾波後に入力される新しいソース・コンテンツを待つ。この目的のために、QCU56は符号化器42への次の制御信号のうちの1つを生成するように構成される:
制御信号 意味
0 合格映像、次の2秒のコンテンツ・セグメントを符号化せよ
1 不合格映像、新しい量子化器パラメータ(例えばQSS、ビットレート)を待て
2 不合格映像、新しい事前濾波されたソース入力を待て
QCU56の内には、不合格映像が次にどのように処理されるべきかを判断する多くの規則が設けられている。それは、どの事前濾波(ある場合)が適用されるべきか、また/または、量子化パラメータがどのように修正されるべきか、を判断することである。この規則は不合格のセグメントが3つの品質プロファイルA〜Cのどれに当てはまるか同定することを含んでいる。次に、各プロファイルが、関連するプロファイルの識別に応じてQCUロジック34によって取られる通信アクションと共に、現実のシナリオとの関連で次に考察される。この目的のために、PAL映像の2秒を表わし、よって50のフレームを含んだ映像データ・セグメントを想定する。各GOPが10個のフレームを含むものとする。
【0044】
プロファイルA:全体またはほとんどのセグメントが不合格
このシナリオでは、2秒のセグメントのデータの全体が品質判定基準を満たさない。図5は、この状況に帰着し得る出力をグラフの形態で示す。あらゆるGOPについて、品質要求事項を満たすための符号化プロセスを操作する余地はほとんどない。したがって、この場合、再符号化前にソース映像が事前濾波される。制御信号「2」が符号化器42に送られる。事前濾波は、空間上および時間上周波数濾波の一方または両方を行なうことによって、映像の複雑性を減少させる。あるいは、画像が、例えば最大解像度度から4分の3または3分の2の解像度まで減じられ得る。その後、濾波されたソースが符号化器42に渡されるとともに繰返し回数が増加させられる。
【0045】
プロファイルB:ほとんどのセグメントが合格で若干が不合格
このシナリオでは、検討中のセグメントの少数が不合格である。図6は、帰着し得る出力をグラフの形態で示す。セグメントの期間、GOP5〜GOP7は下限未満へと低下している。この場合、QCUは、不合格のGOPに関する情報を抽出し、かつ修正された符号化パラメータ(例えばQSS)を生成することを命じられる。制御信号「1」が符号化器42に渡される。さらに、品質の低下のための良好な候補であることとして標的GOP、この場合、GOP3、GOP9、およびGOP10が特定される。この点で、不合格のGOPの品質を改善するために、QSSを減じることによる圧縮コストがかかることが認識される。目標品質を超えているGOPを特定することができれば、我々はもちろん最小の品質要求事項を満たしながら補正を行うように管理された方法でそれらの品質を減じ得る。もちろん、第2のGOPの候補、例えばGOP1、GOP2、およびGOP8が特定されることも可能である。
【0046】
QCU56の内の制御ロジック34はGOP1〜10の全てについて修正されたQSS値を生成するように構成されている。これらの修正されたQSS値は、関連するGOP中の各フレームについて、LUTを参照することによって、またはQSSを調整することによって取得される。例えば、あるGOPが下限を下回っている場合、この下限より下において0.5MOSごとにQSSが1ずつ減じられることが可能である。品質が範囲以内にある場合、品質の下限を0.5MOS上回っているGOPだけが、例えば各0.5MOSごとに1ずつQSSを増加させられることにより修正される。これらの修正量が例であり、より小さいまたはより大きな値が異なる品質範囲に使用されてもよいことに注意されたい。品質範囲が小さい場合、MOSの小さな変化が使用されてQSSを調整するべきである。下記の表1は、図6に示される各GOPに関連するQSSの変化例を示す。これらの新しいパラメータ値は、符号化器42の量子化器に直接渡される。この量子化器は、制御信号「1」を受け取っている場合、GOPを再符号化する。繰返し回数がインクリメントされ、また、コンテンツが品質要求事項を満たすとQCU56が判断するか、最大繰返し回数である3が満たされるすまで、プロセスは継続する。
【表1】
【0047】
GOP4がそれを構成するフレームにわたって品質の大規模な変化を有していることに注目する価値がある。これを補償する、平均MOSとフレーム相互間でのMOSの変化が検査される方法が採用されることが可能である。品質閾値を下回っているフレームの割合が例えば30%を超えている場合、QCUは閾値を下回っているフレームのみについてMOSを再計算し、これらのフレームのみにQSSの変更を適用し得る。GOP内の品質閾値を上回っているフレームはそのままにしておく(あるいは、品質閾値を上回っているフレームが>0.5MOSである場合、これらのフレームについてのQSSが増加されてもよい)。下記の表2において示される数値は、変化し得る品質GOPを扱うためのこのアプローチを示している。やはり、30%の閾値が単に例であることに注意されたい。
【0048】
個々のGOP内のフレーム相互間で異なるこのQSS修正も、全フレームが品質閾値を下回っているGOPに適用されることが可能である。不合格範囲が大きく異なり得る場合、いくつかのフレームは(例えば)2の減少を要求してもよい。一方で、他のフレームは、約1の変更を要求し得る。ほんの少数の不合格のフレーム(例えば30%未満)を含んでいるGOPについては、これらは無視され得る。
【表2】
【0049】
プロファイルC:ほとんどのセグメントが合格し、一部が境界を下回るおよび上回る
このシナリオは図7にグラフの形態で示されている。若干のコンテンツは下限未満であることによって不合格であり、若干のコンテンツは良好過ぎることによって、つまり上限を超えていることによって不合格であった。残りのコンテンツは、品質境界内に収まっていた。上記のように、QCU56は各GOP、または品質が可変のGOP内のフレームを修正する。この事例では、しかしながら、最初の繰返しは、GOP2、4、9、10の品質を上げるとともに、この改善をGOP5、6、7の品質を下げることによって埋め合わせることによって、品質範囲外のGOPS、すなわちGOP2、GOP4、GOP5、GOP6、GOP7、GOP9およびGOP10に対処する。
【0050】
プロファイルBおよびCは、同様の状況、すなわち、ほとんどのセグメントが合格し、しかし若干のセグメントが不合格である状況を扱うことを意図されている。両方の例は、QSSの適応がどのように使用されて映像の不合格部分を回復することができるかを示す。プロファイルBでは、その意図は、映像の不合格部分が、GOPおよびフレームの両方について、どのように改善され得るかを示すことである。GOPの例は、複数のGOPが不合格または目標品質である状況に制限されている。いくつかの目標品質GOPはQSSを増加させられており、また、このことが使用されて不合格のGOPについてのQSSの減少を埋め合わせる。ただし、トレードオフの平衡は必ずしも保たれていない。つまり、QSSの増加量よりも多くの減少量が適用され得る。フレームの例は、若干の目標および若干の不合格を伴って品質が劇的に変化する1つのGOPにわたってQSSの修正がどのように適用され得るか示す。やはり、QSSの不平衡なトレードオフが使用されて品質境界内にあるGOP内にあるフレーム品質を得ることができる。プロファイルCの意図は、実際に1組のGOPが3つのレベルすなわち不合格、目標、そして目標を越えている、すなわち、良好過ぎの品質を有している場合、QSS(あるいは他のパラメータ)の修正がどのように適用され得るか示すことである。ユーザの体験にとって一貫した品質が好ましく、また、「良好過ぎる」セグメントから取り上げて不合格セグメントに与えることによって、複数のGOPにわたってより予測され易くより一貫した品質が得られることが知られている。
【0051】
本明細書において提示されている(操作者が一貫して目標ビットレートを上回るコンテンツを送信する能力を有している)全ての例について、ビットレートの増加が品質目標を満たすために適用され得る。この場合、信号が符号化器42に送られてコンテンツについての目標ビットレートを増加させる。この方法は、映像信号に適用されるビットレートを動的に調整する知覚的に感知可能な方法を提供する。参照表、例えば上記の参照表が、QCU56が新しい符号化レートを選択するために参照され得る。QSSが、特に有用な品質指標であると知られているとともに本例において使用されるPQMについて主要なものであることを受けて、QSSがビットレートの代わりに使用されてきた。上記のプロファイルAのように品質プロファイルが全て不合格である場合、ビットレートを修正することがより適切であり得る。しかしながら、目標ビットレートが符号化に対する主な制約であって、また操作者が目標ビットレートをこれが満たされることを期待して通常設定するので、本例において使用されているハイブリッド・ビット・ストリーム/復号PQMシステム32を使用する場合、QSSを事前濾波することまたは調整することが最良のアプローチであると考えられる。
【0052】
結論として、上記のPQMシステム32において使用されることが可能な知覚品質測定法およびシステムの一例が次に記述される。他のそのような測定法が使用されることが可能であることが認識される。
【0053】
知覚品質測定システム
本システムの目的は、複数のフレームを表す映像信号についての品質の基準を生成することである。映像信号は、以下を有している:元の形態; 映像信号が、可変量子化器ステップ幅を利用する圧縮アルゴリズムを使用して符号化された信号がそれと関連可能な量子化器ステップ幅パラメータを有するように符号化されている符号化された形態; 符号化された映像信号の少なくとも一部が元の形態に再変換されている復号された形態。本システムは、次のステップを行なうように構成されている:a)上記の量子化器ステップ幅パラメータの関数である第1品質測度を生成し; b)復号された形態の映像信号によって表わされるフレームの少なくとも一部の空間上の複雑性の関数である第2品質測度を生成し; c)第1および第2測度を組み合わせる。
【0054】
符号化された映像シーケンスからステップ幅が導出可能であり、また複雑性測度が復号された信号から取得されるので、元の映像信号を参照する必要が減じられる。さらに、多くの符号化方式ではステップ幅が映像シーケンスとともにパラメータとして送信されるので、便利なことに、このパラメータを使用して、このパラメータを新たに計算する必要なしに映像品質を予測することができる。重要なことに、ステップ幅と組み合わせて複雑性測度を使用することが、映像品質の指標としてのステップ幅または複雑性の信頼度のみから得られる信頼度よりも品質測度の信頼度を改善することが分かった。
【0055】
システムの概観
下記の実施形態は、無参照型で復号器を基盤とする映像品質評価ツールに関する。本ツールのためのアルゴリズムは、映像復号器の内部で動作可能であり、各復号されたマクロブロックについての量子化器ステップ幅パラメータ(通常、入来する符号化された映像ストリームに含まれている変数)および各復号された画像の画素強度値を使用して復号された映像の主観的品質の評価を作成する。スライディング・ウィンドウ平均画素強度差(画素のコントラスト測度)計算が、各フレームの復号された画素に対して行なわれる。また、その結果得る平均(TCF)は、映像のノイズ・マスキング特性の基準として使用される。その後、品質推定値が、TCFパラメータの重み関数およびステップ幅パラメータの平均から作られる。重み関数は、復号されたシーケンスおよびシーケンスについて前もって取得された主観的スコアの特性のトレーニング・データベースに対する多重回帰分析によって予め求められる。一方ではステップ幅の、他方ではスライディング・ウィンドウ平均画素強度差の組合せを使用して複雑性を推定することは、主観的品質の良好な推定値を提供する。
【0056】
原則として、使用される測定プロセスは、変換符号化を使用するとともに量子化器ステップ幅が可変な圧縮技術を使用して符号化された映像信号に一般に適用可能である。しかしながら、以下に記述されるものは、H.264規格に従って符号化される信号との使用に向けて設計されている。本プロセスは、H.261、H.263および(フレームを基盤とする)MPEG2のような他のDCTベースの標準コーデックにも適用される。
【0057】
本測定法は非侵入性または「無参照」型である。すなわち、本測定方法は元の信号のコピーにアクセスする必要性を有さない。本方法は適切な復号器内での使用向けに設計されている。本方法が、符号化されたビット・ストリームおよび復号された映像の両方からのパラメータへのアクセスを必要とするからである。
【0058】
図8に示される装置では、入力信号は入力1で受け取られ、各画像の次のパラメータを復号するとともに出力する映像復号器に渡す。
【0059】
復号された画像(D)
画素内の水平方向の復号された画像サイズ(Px)
画素内の垂直方向の復号された画像サイズ(Py)
マクロブロック内の水平方向の復号された画像(Mx)
マクロブロック内の垂直方向の復号された画像サイズ(My)
量子化器ステップ幅パラメータの組(Q)。
【0060】
装置内には、2つの分析経路がある。それらは、画像平均された量子化器ステップ幅信号QPF(ユニット3)および画像平均されたコントラスト測度CF(ユニット4)を算出する役目をする。次に、ユニット5は、信号QPFおよびCFを時間平均して信号TQPFとTCFをそれぞれ与える。最後に、これらの信号はユニット6で組み合わせられて復号された映像シーケンスDについての主観的品質の推定値PMOSを与える。個々のハードウェア要素によって要素3〜6が実現されることが可能である。しかし、より便利な実現形態は適切にプログラムされたプロセッサを使用して、それらの段階をすべて行なうことである。
【0061】
Qを画像平均する
このことは、復号器からの出力された量子化器ステップ幅信号Qを使用する。Qは、現在の復号された画像の各マクロブロックについて1つの量子化器ステップ幅パラメータ値QPを含んでいる。H.264については、量子化器パラメータQPは、変換係数を符号化するために使用される線形の量子化器の間隔QSTEPを定義する。実際には、QPは、所定の間隔の表に索引を付ける。この表においては、QPが6増分するごとにQSTEPは幅が2倍になる。画像平均された量子化器パラメータQPFは、以下に従ってユニット3で算出される。
【数1】
【0062】
ここで、MxおよびMyは、それぞれ画像の水平および垂直方向のマクロブロックの個数であり、Q(i、j)は、位置(i、j)でのマクロブロックについての量子化器ステップ幅パラメータである。
【0063】
コントラスト測度を算出する
図9および図10は、水平方向サイズが画素Px個および垂直方向サイズが画素Py個の画像内の位置(x,y)の画素p(x,y)についてのコントラスト測度がどのように計算されるかを示している。
【0064】
水平方向のコントラスト測度を計算するための分析は図9に示されている。この図において、コントラスト測度は、影付きの部分によって示された画素p(x,y)に関して算出される。サイズが同じ隣接する複数の領域が選択される(そのうちの1つは影付きの画素を含んでいる)。各領域は、影付きの画素が位置する行の(好ましくは連続する)画素の組から形成される。各領域の画素強度が平均され、次に、これらの平均の差分の絶対値が、下記の等式(2)によって算出される。コントラスト測度は、この差分の値である。図10に示されているように、垂直のコントラスト測度が同様の方法で計算される。ここで、上側の画素の組および下側の画素の組が選択される。選択される画素の各々は同じ列の上にある。影付きの画素は、上側の組と下側の組との間の境界に隣接する。上側および下側の組内の画素の強度が平均され、次に各組の平均強度の差分が評価される。この差分の絶対値が、下記の等式(3)に示されている垂直方向のコントラスト、すなわち、垂直方向のコントラストの測度である。本例では、影付きの画素は下側の組に含まれている。しかしながら、コントラスト測度と関連付けられる画素の位置は任意である。ただし、それが、比較最中の画素の組によって共有される境界の近くにあることが条件である。
【0065】
したがって、水平方向コントラスト測度を取得するために、長さHである行部分が比較され、他方、垂直方向コントラスト測度を取得するために、長さVである列部分が比較される(長さHおよびVは同じであり得るが、同じであることは必須ではない)。コントラスト測度は、位置が一方では行部分の共通の境界および他方では列部分の共通の境界に局所的な画素に対応付けられる。
【0066】
次に、そのように算出された水平方向コントラスト測度および垂直方向コントラスト速度が比較され、2つの値(等式(4)において示されているように、水平・垂直方向測度と呼ばれる)のうちの大きい方が、影付きの画素と関連付けられてメモリに格納される。
【0067】
この手順は、画像の(それぞれ画像の垂直方向・水平方向の端からの垂直方向距離Vおよび水平方向距離Hの範囲内の)各画素について繰り返される。これによって、HまたはVのウィンドウサイズを用いて画素に対するスライディング・ウィンドウ分析を提供する。次に、画像(フレーム)内の各画素の水平方向および垂直方向測度が平均されて全体的画素差分測度CF(等式(5)を参照)を与える。次に、各画像に関連したこの全体的測度が複数の画像にわたって平均されて、シーケンス平均された測度、すなわち等式(7)によって時間平均された測度TCFを取得する。全体的(CF)測度が平均される対象の画像の数は、映像シーケンスの性質および場面変化の時間間隔に依存し、数秒程度であり得る。明らかなことに、特に量子化ステップ幅が画像ごとに変化する場合、画像の一部だけがこのように分析される必要がある。
【0068】
画像内の異なる場所でのコントラストを測定するとともに平均を取ることによって、画像の複雑性の単純な測度が取得される。画像の複雑性が歪みを覆い隠すことがあり、それ故に、画像が所与の歪みについてより良い品質であると視聴者に信じさせる場合があるので、画像の複雑性の度合いが使用されて視聴者によって映像信号と対応付けされる品質の主観的度合いをある程度予測することができる。
【0069】
影付きの画素に関するそれぞれの領域の幅(H)または高さ(V)は、視聴者が複雑性について気が付く詳細さの程度に関係する。したがって、画像が遠くから見られるのであれば、HとVは視聴者が画像に接近することが意図される状況での場合よりも大きくなるように選択される。一般に、画像からの視聴者にとって快適な距離は画像のサイズに依存するので、HおよびVのサイズおよびVは画素サイズおよび画素寸法に依存する(典型的にはより大きなディスプレイはより多くの画素ではなくより大きな画素を有する。ただし、ある所与の画素密度についてはディスプレイサイズも要因となり得る)。典型的には、HおよびVは、各々、それぞれの画像寸法の0.5%と2%の間にあることが予想される。例えば、水平方向に720個の画素があるとともに平均のための組がそれぞれ4つの画素を含んでいる場合、水平方向の値は4*100/720=0.56%であり得、また、垂直方向においては、垂直方向に576個の画素がある場合、4*100/576=0.69%であり得る。
【0070】
コントラスト測度を算出するための分析は、以下の等式を参照して次のように記述されることが可能である。この計算は復号された映像画像Dを使用して各画像の画像平均された複雑性測度CFを決定する。CFは、復号された映像についてのスライディング・ウィンドウ画素分析を最初に行なうことにより決定される。図2(これは水平方向サイズが画素Px個および垂直方向サイズが画素Py個の画像内の画素p(x,y)についての水平方向分析を示している)では、水平方向コントラスト測度Chは、復号されたシーケンスDのn´番目の画像について、以下に従って計算される。
【数2】
【0071】
Hは、水平方向画素分析のためのウィンドウ長さである。Ch(n,x,y)は、復号された映像シーケンスDのn´番目の画像の画素p(x,y)のための水平方向コントラスト・パラメータである。D(n,x,y)は、復号された映像シーケンスDのn´番目の画像の画素p(x,y)の強度である。
【0072】
対応する垂直方向画素分析を示す図10では、垂直方向コントラスト測度Cvは、以下に従って計算される:
【数3】
【0073】
ここで、Vは、垂直方向画素分析のためのウィンドウ長さである。
【0074】
次に、ChとCvが組み合わせられて水平垂直方向測度Chvを与え得る。
【0075】
Chv(n,x,y)=max(Ch(n,x,y),Cv,(n,x,y)) (4)
X=H−1…Px−H−1
y=V−1…Py−V−1
ここで、適用形態によっては、水平方向・垂直方向成分を別々のままにして主観的品質の評価(ユニット6)の際に各々に異なる重み付けパラメータが適用されることを可能にする方が良い場合があることが注目されるべきである。
【0076】
最後に、全体的な画像平均された画素差分測度CFが、コントラスト値Ch、Cvおよび(または)Chvから、以下に従って計算される。
【数4】
【0077】
時間平均する
このことは、画像平均されたパラメータQPFおよびCFを使用して、対応する時間平均されたパラメータTQPFおよびTCFを以下に従って決定する。
【数5】
【0078】
パラメータ平均算出は、MOS推定値が必要な時間間隔にわたって行なわれるべきである。これは、TQPFとTCFの1対を算出する1つの分析期間かもしれないし、一連のパラメータを算出する一連の間隔かもしれない。典型的に秒単位の長さのウィンドウ間隔で、CFおよびQPF時間シーケンスを貫いて時間に関して分析ウィンドウを「滑らせる」ことによって、連続的な分析が達成され得る。
【0079】
MOSを推定する
このことは、時間平均されたパラメータTQPFおよびTCFを使用して、復号されたシーケンスDの対応する期間についての主観的に測定された平均オピニオン評点の推定値PMOSを作成する。TQPFは、復号されたシーケンス内のノイズの推定に寄与し、TCFは、そのノイズが映像シーケンスのコンテンツによってどれくらい覆い隠され得るかの推定に寄付する。PMOSは、以下に従って、パラメータの組合せから計算される。
【0080】
PMOS=F1(TPQF)+F2(TCF)+K0 (8)
F1およびF2はAvQpおよびCS内の適切な線形または非線形の関数である。K0は定数である。PMOSは予測された平均オピニオン評点で、1…5の範囲内にある。5が優良品質に、1が悪い品質に等しい。F1、F2、およびK0は、多くの商用統計ソフトパッケージにおいて利用可能な適切な(例えば、線形、多項式、対数型の)回帰分析によって決定され得る。そのような分析は、既知の主観的品質のトレーニング・シーケンスの組を必要とする。次に、F1、F2、およびK0によって定義されたモデルは、MOSを独立変数としTQPFおよびTCFを従属変数として用いて回帰分析によって導出され得る。典型的に、この、結果得るモデルが使用されてトレーニングにおいて使用される劣化に類似の劣化(コーデック・タイプおよび圧縮率)にさらされた検査シーケンスの品質を予測する。しかしながら、映像コンテンツは異なり得る。
【0081】
最大解像度(full resolution)放送の素材のH.264圧縮については、適切な線形モデルは、
PMOS=−0.135*TPQF+0.04*CS+7.442 (9)
であることが見出された。
【0082】
そして、その結果得る推定値は、以下に従って制限されている。
【0083】
if(PMOS>5)PMOS=5
if(PMOS<I)PMOS=1 (10)
以下に、上記の実施形態の様々な側面の補足説明が提供される。
【0084】
導入:分析の際にソース映像シーケンスおよび劣化した映像シーケンスの両方を利用する完全参照型映像品質測定ツールは放送映像についての映像品質を高精度で予測できることが示された。既に劣化した「参照」シーケンスにアクセスしない無参照型技術のデザインは、より困難な提議である。
【0085】
無参照型分析の別の形態は、復号器またはネットワーク中のどこかで、符号化されたビット・ストリームへアクセスすることによって達成され得る。そのような「ビット・ストリーム」分析は、量子化器ステップ幅、動きベクトル、およびブロック統計のような符号化パラメータに容易にアクセスできるという長所を有する。これは、フレーム・バッファ分析に対しては利用不可能である。ビット・ストリーム分析は、逆変換または動き予測されたマクロブロックの再構成無しの、復号されたパラメータの簡単な計算の分析から、映像シーケンスの完全復号まで及び得る。
【0086】
PSNRは、映像符号化器および完全参照型映像品質測定ツールの両方における主観的な映像品質の評価において使用される測度である。無参照型ツールでは、PSNRは直接計算されることが不能であるが、推定されることは可能である。ここで、我々は、完全参照PSNR測度を性能で凌駕し得るH.264/AVC復号器内で動作する無参照型映像品質予測技術を紹介する。
【0087】
第1に、結果が、PSNR測度を様々なH.264符号化されたシーケンスに対して使用するベンチマーク品質推定に提供される。第2に、平均量子化器ステップ幅(AvQP)の測度を使用して主観的品質を推定するビット・ストリーム技術に対する考察が与えられる。PSNRへの単なる近似ではなく、このビット・ストリーム無参照型測度は、品質推定について完全参照PSNR測度を性能で凌駕することができることが示されている。
【0088】
最後に、ノイズ・マスキング(CS)の測度が導入される。これは、PSNRおよび量子化器ステップ幅に基づいた品質推定技術の両方の性能をさらに向上させる。測度は、復号された画像シーケンスの画素差分分析に基づいており、映像復号器内で算出される。結果得る、復号器を基板とする無参照型モデルは、0.91を超える測定された主観的スコアと推定された主観的スコアとの間の相関を達成することが示されている。
【0089】
映像検査素材 − トレーニングおよびテスト・データベース:
本技術をトレーニングおよびテストするために使用される映像データベースは、18個の異なる8秒のシーケンス(全て、625の放送フォーマット)から構成された。トレーニング・セットは9つのシーケンスから構成された。シーケンスのうちの6つはVQEG1データベースから、また、残りの3つは他のところから調達された。テスト・セットは9つの異なるシーケンスから構成された。VQEG1コンテンツはよく知られており、VQEGウェブサイトからダウンロードされることが可能である。品質パラメータは各シーケンスの継続時間にわたる平均に基づくことになっているので、動きおよび細部が一貫している特性を備えるコンテンツを選択することが重要であった。シーケンスの詳細は表4に示されている。
【表3】
【0090】
映像テスト素材 − 符号化:
H.264符号化器JM7.5cを使用してトレーニング・シーケンスおよびテスト・シーケンスの全てが符号化された。各々に対して同じ符号化器オプションが設定されている。符号化器設定の主な特長は次の通りであった:
I、P、B、P、B、P、…フレームパタン; レート制御無効; 量子化パラメータ(QP)固定; 適応性フレーム/フィールド符号化有効; ループ濾波無効。
【0091】
非常に多様な符号化器設定を用いて、上記の設定を一定に保つとともに各ソース・ファイルに対する検査の相互間で量子化器ステップ幅パラメータだけを変えることにした。
【0092】
公式の単刺激主観テストが12個の対象をトレーニング・セットとテスト・セットの両方に使用して行なわれた。平均MOSの結果は、表5(トレーニング・セット)および表6(テスト・セット)に示されている。
【表4】
【表5】
【0093】
品質推定 − ピーク信号対雑音比:ピーク信号対雑音比(PSNR)は、一般に使用されている品質の完全参照型測度であり、多くの映像符号化器における最適化のための重要な測度である。正確に並べられた参照シーケンスおよび劣化したシーケンスを用いれば、PSNRは算出される直接的測度であり、時間平均された測度(AvPSNR)が以下に従って計算されてもよい。
【数6】
【0094】
ここで、s(n,x,y)およびd(n,x,y)は、ソース・シーケンスsおよび劣化シーケンスdからの水平方向において画素X個(x=0…X−1)および垂直方向においてY個の画素(y=0…Y−1)の寸法のN個のフレームのうちのn´番目のフレーム内の対応する画素強度値(0…255)である。この等式が使用されて、9つのトレーニング・シーケンスの各々の8秒間の平均PSNRを計算した。平均測定MOSに対する平均PSNRのプロットが図11に示されている。
【0095】
平均PSNRが25dBのMOSスコアが考慮される場合、データのコンテンツ依存の性質が示されている。データ中のMOSスコアが3の範囲は、知覚される品質を推定するためにPSNRを使用することが不正確である可能性を示す。多項式回帰分析は、MOSとAvPSNRのデータ間の0.78の相関および0.715のRMS残留を産出する。
【0096】
品質推定 − 量子化器ステップ幅:H.264については、量子化器パラメータQPは、変換係数を符号化するために使用される線形量子化器の間隔QSTEPを定義する。QPは、所定の間隔値の表に索引を付ける。ここでは、QSTEPは、QPが6増分するごとに大きさが2倍になる。
【0097】
トレーニング・セットの各テストに対して、QPは、PおよびIマクロブロックについては20、28、32、36、40、または44の1つの値に固定されており、Bマクロブロックについては2大きい。図12は、9つのトレーニング・シーケンスの各々についての平均MOSに対する平均QPのプロットを示している。
【0098】
MOSと平均QPとの間の多項式回帰分析は、0.924の相関および0.424のRMS残留を産出する。さらに、様々なQP値での予測されるMOS範囲がAvPSNRについての範囲を著しく下回ることは明白である。
【0099】
量子化器ステップ幅によるPSNRの推定値は、量子化範囲内のエラー値の一様分布の近似に依存する。しかしながら、大多数の係数が0まで「中心切り取り(center-clipped)」される場合、この近似は大きなステップ幅で且つ低ビットレートについては成り立たない。やや意外にも、結果は、AvQPがPSNRより主観的点数のより良い予測値であり得ることを示している。H.264におけるQPおよび実際の量子化器ステップ幅の間の非線形写像が何らかの形で多項式分析を緩和し得る可能性が減少し、実際のステップ幅対MOSについても同様の結果が得られたことはここで注目されるべきである。
【0100】
画素コントラスト測度 − 歪みマスキング:歪みマスキングは、符号化された映像シーケンス内の歪みの知覚に影響する重要な要素である。そのようなマスキングは、スペクトル上の、または時間上の、または空間上の同じ地点における信号とノイズ成分とを人間の知覚機構が識別できないために生じる。そのような考慮事項は、ビットの効率的配分が不可欠である映像符号化器の設計において非常に重要である。この分野における研究は変換と画素の両方の領域の中で行なわれてきた。ここでは、画素領域だけが考慮される。
【0101】
画素コントラスト測度 − 画素差分コントラスト測度:ここで、画素領域における分析によって画像シーケンスのマスキング特性を決定するという考え方が、映像品質推定に適用される。実験は、スライディング・ウィンドウ画素差分分析によって算出されたコントラスト測度が非常に良好に機能することを明らかにした。
【0102】
画素差分コントラスト測度ChおよびCvは上記の等式(2)および(3)によって算出される。ここで、Hは水平方向画素分析用のウィンドウ長さであり、Vは垂直方向画素分析用のウィンドウ長さである。次に、等式(4)に従って、ChとCvが組み合わせられて水平・垂直方向測度Chvを与える。次に、Chvが使用されて、等式(5)に従ってフレームについての全体の画素差分測度CFを算出し、続いて、上記の等式(6)において定義されるようにシーケンス平均された測度CSを算出し得る。シーケンス平均測度CS(上ではTCFと称されている)は、H=4およびV=2を使用して、復号されたトレーニング・シーケンスの各々ついて算出され、その平均量子化器ステップ幅に対してプロットされた結果は図13に示されている。
【0103】
図13中の結果は、図11のPSNR対MOS結果、およびより少ない程度で図12のAvQstep対MOS結果と、この順序で著しい類似性を示す。「カレンダー」および「岩」シーケンスは最も高いCS値を有しており、また、PSNRおよびAvQstepの両方において良好な範囲にわたって最も高いMOS値を有している。同様に、「カヌー」および「稚魚」シーケンスは最低のCS値を有しており、そして最低のMOS値群内にある。したがって、復号された画素から算出されたCS測度は、シーケンスのノイズ・マスキング特性と関係を有しているようである。高いCSは、所与のPSNRについて、マスキングが高く、ひいてはMOSが高いことを意味する。無参照型品質推定におけるCS測度の潜在的用途が、下に述べられている多重回帰分析に含められることによって調べられた。
【0104】
結果:第1に、トレーニング・セット用の平均MOS(従属変数)は、多くの商用統計ソフトパッケージ(例えばStatviewTM)において利用可能なもののような標準多項式/対数型回帰分析を使用して、PSNR(独立変数)によってモデル化された。これについては、www.statview.comを参照されたい。次に、結果得るモデルが、テスト・シーケンスに対して使用された。次に、これが、AvQPを独立変数として使用して繰り返された。このプロセスが、各場合でのCSを補助的独立変数として用いて繰り返された。結果得る、推定MOS値と測定MOS値との間の相関およびRMS残差は、表7に示されている。
【表6】
【0105】
結果は、シーケンス平均されたコントラスト測度(CS)をPSNRまたはAvQPに基づいたMOS推定モデルに含めることが、トレーニング・セットおよびテスト・データ・セットの両方について成績を向上させることを示している。AvQPパラメータおよびCSパラメータを使用するモデルの成績は特に良好であって、トレーニング(0.95)およびより印象的なことにテスト(0.916)の両方について0.9を超える相関を達成した。
【0106】
AvQP/CSモデルについての各トレーニング結果およびテスト結果は、図14において散布図の形態で示されている。
【0107】
結論:H.264の映像復号器における主観的映像品質推定のための2つのパラメータ・モデルが提供された。映像シーケンスにわたって平均されたH.264量子化器ステップ幅インデックスに相当するAvQPパラメータは、ノイズの推定に寄与する。復号された画素のスライディング・ウィンドウ差分分析を使用して算出されるCSパラメータは、映像コンテンツのノイズ・マスキング特性の示度を付加する。これらのパラメータが一緒に使用されると、復号器において驚くほど正確な主観的品質推定が達成され得ることが示されている。
【0108】
8秒のトレーニング・シーケンスおよびテスト・シーケンスは、時間にわたる画像特性の著しい変動を減じる目的で選択された。その意図は、測定MOSスコアが一時的で明瞭な歪みによって過度に重み付けされないように、劣化が一貫している特性を備えた復号されたシーケンスを使用することであった。こうすることによって、シーケンス平均されたパラメータを使用するMOSスコアのモデル化が、より実用的かつより正確なプロセスになる。
【0109】
等式(5)において定義されているコントラスト測度CFは、取得された画像の全体についての各画素に対して行なわれている平均に依存する。空間上・時間上のブロックに対するCFの分析が有益であり得ることが分かった。
【特許請求の範囲】
【請求項1】
複数のフレームを表す映像信号を符号化する方法であって、
(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、
(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、
(c)前記品質測度が前記所定の品質基準を満たさない場合、前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、
ことを具備する方法。
【請求項2】
前記品質測度が前記所定の品質基準を満たす場合のみ、前記符号化された信号を通信リンク上で映像復号器に送信することをさらに含む、請求項1の方法。
【請求項3】
ステップ(c)において、前記符号化パラメータの値または前記映像信号に適用される修正の量が、ステップ(b)において生成される前記品質測度の値の関数である、請求項1または2の方法。
【請求項4】
前記方法が第1および第2信号部分に対して実行され、
前記品質測度が前記第1信号部分について前記所定の品質基準を満たす場合に前記第2信号部分が符号化される、
請求項1乃至3のいずれか1項の方法。
【請求項5】
前記品質測度が所定のアルゴリズムを用いて生成される数値であり、
前記数値が所定の範囲内にある場合、前記品質測度が前記所定の品質基準を満たす、
請求項1乃至4のいずれか1項の方法。
【請求項6】
前記所定の範囲が第1および第2境界値によって定義され、
前記適用される修正が、前記品質測度の値が後続の繰り返しにおいて前記境界値の一方に近づく変化に帰着する、
請求項5の方法。
【請求項7】
前記符号化された信号が、複数の個別に識別可能なフレーム群(GOF)を表わし、
品質測度が各GOFに対して導出可能であって、
ステップ(c)において、前記少なくとも1つの符号化パラメータの修正された値または前記映像信号の修正された形態が前記所定の品質基準を満たさない各GOFに適用される、
請求項7の方法。
【請求項8】
各々がステップ(c)において適用される択一的なプロファイルを定義する複数の修正プロファイルを提供し、
1つ以上の選択規則に応じて前記複数のプロファイルのうちの1つを選択する、
ことをさらに具備する請求項7の方法。
【請求項9】
連続する所定数のGOFが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択され、
前記第1プロファイルが、適用されると前記GOFに対応する前記映像信号の濾波された形態を再符号化するように構成されている、
請求項8の方法。
【請求項10】
前記濾波が、前記GOFの各フレームを符号化するのに必要なビット数を減じることを具備する、請求項9の方法。
【請求項11】
所定数のGOFを具備するセグメントにおいて一部のGOFのみが前記所定の品質基準を満たさない場合に第2プロファイルが選択され、
前記第2プロファイルが、適用されると各不合格GOFに対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている、
請求項8乃至10のいずれか1項の方法。
【請求項12】
各フレームについてのさらなる品質測度が生成され、
あるフレームについての前記さらなる品質測度が前記所定の品質基準を満たさない場合、フレーム内分析が該フレームに対して実行されて該フレームのどの部分が修正を必要としているかを判断する、
請求項1乃至11のいずれか1項の方法。
【請求項13】
前記少なくとも1つの符号化パラメータが量子化ステップ幅を含み、
ステップ(c)が量子化ステップ幅の修正された値を適用することを具備する、
請求項1乃至12のいずれか1項の方法。
【請求項14】
前記少なくとも1つの符号化パラメータが符号化ビットレートを含み、
ステップ(c)が前記符号化ビットレートの修正された値を適用することを具備する、
請求項1乃至13のいずれか1項の方法。
【請求項15】
複数のフレームを表す映像信号を符号化する方法であって、
(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、
(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、
(c)前記品質測度が前記所定の品質基準を満たさない場合、複数の修正プロファイルのうちの1つを選択するとともに前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、
ことを具備し、
所定数のフレームを具備する前記映像信号のセグメントが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択され、
前記第1プロファイルが、適用されると前記映像セグメントの濾波された形態を再符号化するように構成されており、
所定数のフレームを具備する前記映像信号のセグメント内のフレーム部分集合またはフレーム群のみが前記所定の品質基準を満たさない場合に第2プロファイルが選択され、
前記第2プロファイルが、適用されると各不合格フレームまたはフレーム群に対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている、
方法。
【請求項16】
複数のフレームを表す映像信号を符号化する方法であって、
(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化することであって、 前記符号化された信号が複数の個別に識別可能なフレーム群(GOF)を表わしており、
(b)複数のGOFを具備する映像セグメントについて、知覚品質メトリックを使用して各GOFについての品質測度を生成し、
(c)前記品質測度が所定の品質レベルを下回っている前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを下回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、
(d)前記品質測度が所定の品質レベルを上回っている同じ前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを上回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、
(e)(c)および(d)において修正された前記符号化パラメータを使用して前記映像セグメントを再符号化する、
ことを具備する方法。
【請求項17】
プロセッサ上で実行されると前記プロセッサに請求項1乃至16のいずれか1項の方法を実行させるプロセッサ・コードを運ぶためのキャリア媒体。
【請求項18】
少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して複数のフレームを表す映像信号を符号化するように構成されている映像符号化器と、
前記映像符号化器からの前記符号化された信号を受け取るためのものであって、知覚品質メトリックを使用して前記符号化された信号についての品質測度を生成し、前記品質測度が所定の品質基準を満たすかを確認し、前記品質測度が前記所定の品質基準を満たさない場合、前記映像符号化器に前記少なくとも1つの符号化パラメータについての修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまで前記映像信号を繰り返し再符号化させるように構成されているコントローラと、
を具備する映像符号化システム。
【請求項19】
映像データの少なくとも1つのチャネルを複数の受信器へとそれぞれのIPリンク上で送信するように構成されているとともに請求項18において定義されている符号化システムを具備するIPTVサービス供給システム。
【請求項1】
複数のフレームを表す映像信号を符号化する方法であって、
(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、
(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、
(c)前記品質測度が前記所定の品質基準を満たさない場合、前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、
ことを具備する方法。
【請求項2】
前記品質測度が前記所定の品質基準を満たす場合のみ、前記符号化された信号を通信リンク上で映像復号器に送信することをさらに含む、請求項1の方法。
【請求項3】
ステップ(c)において、前記符号化パラメータの値または前記映像信号に適用される修正の量が、ステップ(b)において生成される前記品質測度の値の関数である、請求項1または2の方法。
【請求項4】
前記方法が第1および第2信号部分に対して実行され、
前記品質測度が前記第1信号部分について前記所定の品質基準を満たす場合に前記第2信号部分が符号化される、
請求項1乃至3のいずれか1項の方法。
【請求項5】
前記品質測度が所定のアルゴリズムを用いて生成される数値であり、
前記数値が所定の範囲内にある場合、前記品質測度が前記所定の品質基準を満たす、
請求項1乃至4のいずれか1項の方法。
【請求項6】
前記所定の範囲が第1および第2境界値によって定義され、
前記適用される修正が、前記品質測度の値が後続の繰り返しにおいて前記境界値の一方に近づく変化に帰着する、
請求項5の方法。
【請求項7】
前記符号化された信号が、複数の個別に識別可能なフレーム群(GOF)を表わし、
品質測度が各GOFに対して導出可能であって、
ステップ(c)において、前記少なくとも1つの符号化パラメータの修正された値または前記映像信号の修正された形態が前記所定の品質基準を満たさない各GOFに適用される、
請求項7の方法。
【請求項8】
各々がステップ(c)において適用される択一的なプロファイルを定義する複数の修正プロファイルを提供し、
1つ以上の選択規則に応じて前記複数のプロファイルのうちの1つを選択する、
ことをさらに具備する請求項7の方法。
【請求項9】
連続する所定数のGOFが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択され、
前記第1プロファイルが、適用されると前記GOFに対応する前記映像信号の濾波された形態を再符号化するように構成されている、
請求項8の方法。
【請求項10】
前記濾波が、前記GOFの各フレームを符号化するのに必要なビット数を減じることを具備する、請求項9の方法。
【請求項11】
所定数のGOFを具備するセグメントにおいて一部のGOFのみが前記所定の品質基準を満たさない場合に第2プロファイルが選択され、
前記第2プロファイルが、適用されると各不合格GOFに対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている、
請求項8乃至10のいずれか1項の方法。
【請求項12】
各フレームについてのさらなる品質測度が生成され、
あるフレームについての前記さらなる品質測度が前記所定の品質基準を満たさない場合、フレーム内分析が該フレームに対して実行されて該フレームのどの部分が修正を必要としているかを判断する、
請求項1乃至11のいずれか1項の方法。
【請求項13】
前記少なくとも1つの符号化パラメータが量子化ステップ幅を含み、
ステップ(c)が量子化ステップ幅の修正された値を適用することを具備する、
請求項1乃至12のいずれか1項の方法。
【請求項14】
前記少なくとも1つの符号化パラメータが符号化ビットレートを含み、
ステップ(c)が前記符号化ビットレートの修正された値を適用することを具備する、
請求項1乃至13のいずれか1項の方法。
【請求項15】
複数のフレームを表す映像信号を符号化する方法であって、
(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化し、
(b)知覚品質メトリックを使用して符号化された信号についての品質測度を生成するとともに前記品質測度が所定の品質基準を満たすかを確認し、
(c)前記品質測度が前記所定の品質基準を満たさない場合、複数の修正プロファイルのうちの1つを選択するとともに前記少なくとも1つの符号化パラメータの修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまでステップ(a)乃至(c)を繰り返す、
ことを具備し、
所定数のフレームを具備する前記映像信号のセグメントが前記所定の品質基準を満たさない場合に第1修正プロファイルが選択され、
前記第1プロファイルが、適用されると前記映像セグメントの濾波された形態を再符号化するように構成されており、
所定数のフレームを具備する前記映像信号のセグメント内のフレーム部分集合またはフレーム群のみが前記所定の品質基準を満たさない場合に第2プロファイルが選択され、
前記第2プロファイルが、適用されると各不合格フレームまたはフレーム群に対応する前記映像信号を修正された符号化パラメータを使用して再符号化するように構成されている、
方法。
【請求項16】
複数のフレームを表す映像信号を符号化する方法であって、
(a)少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して前記映像信号またはその一部を符号化することであって、 前記符号化された信号が複数の個別に識別可能なフレーム群(GOF)を表わしており、
(b)複数のGOFを具備する映像セグメントについて、知覚品質メトリックを使用して各GOFについての品質測度を生成し、
(c)前記品質測度が所定の品質レベルを下回っている前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを下回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、
(d)前記品質測度が所定の品質レベルを上回っている同じ前記映像セグメント内の1つ以上のGOFを特定し、再符号化されたときに前記品質測度が前記所定の品質レベルを満たすか前記所定の品質レベルに近づくように品質レベルを上回るGOFについて用いられる前記少なくとも1つの符号化パラメータを修正し、
(e)(c)および(d)において修正された前記符号化パラメータを使用して前記映像セグメントを再符号化する、
ことを具備する方法。
【請求項17】
プロセッサ上で実行されると前記プロセッサに請求項1乃至16のいずれか1項の方法を実行させるプロセッサ・コードを運ぶためのキャリア媒体。
【請求項18】
少なくとも1つの符号化パラメータを利用する圧縮アルゴリズムを使用して複数のフレームを表す映像信号を符号化するように構成されている映像符号化器と、
前記映像符号化器からの前記符号化された信号を受け取るためのものであって、知覚品質メトリックを使用して前記符号化された信号についての品質測度を生成し、前記品質測度が所定の品質基準を満たすかを確認し、前記品質測度が前記所定の品質基準を満たさない場合、前記映像符号化器に前記少なくとも1つの符号化パラメータについての修正値または前記映像信号の修正された形態を用いて前記品質測度が前記所定の品質基準を満たすまで前記映像信号を繰り返し再符号化させるように構成されているコントローラと、
を具備する映像符号化システム。
【請求項19】
映像データの少なくとも1つのチャネルを複数の受信器へとそれぞれのIPリンク上で送信するように構成されているとともに請求項18において定義されている符号化システムを具備するIPTVサービス供給システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公表番号】特表2010−515392(P2010−515392A)
【公表日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願番号】特願2009−544442(P2009−544442)
【出願日】平成20年1月3日(2008.1.3)
【国際出願番号】PCT/GB2008/000010
【国際公開番号】WO2008/081185
【国際公開日】平成20年7月10日(2008.7.10)
【出願人】(390028587)ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー (104)
【氏名又は名称原語表記】BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY
【Fターム(参考)】
【公表日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願日】平成20年1月3日(2008.1.3)
【国際出願番号】PCT/GB2008/000010
【国際公開番号】WO2008/081185
【国際公開日】平成20年7月10日(2008.7.10)
【出願人】(390028587)ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー (104)
【氏名又は名称原語表記】BRITISH TELECOMMUNICATIONS PUBLIC LIMITED COMPANY
【Fターム(参考)】
[ Back to top ]