説明

映像品質推定装置及び方法及びプログラム

【課題】 原映像信号を用いずに、劣化映像信号のみからコンテンツ依存性を多面的に考慮して映像品質を推定する。
【解決手段】 本発明は、映像配信で用いるパケットのヘッダ情報及びパケットに含まれる映像ビットストリームを復号し得られる映像信号から特徴量を算出する。具体的には、映像配信で用いるパケットのヘッダ情報から単位時間あたりのパケットもしくはビットレートを算出する、もしくは、映像ビットストリームを復号して得られる映像信号から動き量を算出する、もしくは、映像ビットストリームを復号して得られる映像信号からブロックノイズ量を算出する、もしくは、これらの組み合わせにより特徴量を算出する。算出されたビットレートから平均映像品質を算出し、平均映像品質と、ブロックノイズ量と、動き量を基に、映像品質を算出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像品質推定装置及び方法及びプログラムに係り、特に、IPネットワーク経由で行う映像通信の映像品質を推定する映像品質推定装置及び方法及びプログラムに関する。
【背景技術】
【0002】
IP網の広帯域化、端末機器の高性能化,映像符号化技術の進歩に伴い、映像メディアを用いた映像通信サービス(例えば、IPTVサービス、TV電話サービスなど)が普及してきている。
【0003】
映像メディアを用いた通信では、ネットワークの利用効率を向上させるため映像メディアの情報量の圧縮(映像符号化)が行われる。映像符号化による映像情報の削減により、映像信号にモザイク状の歪(ブロックノイズ)、ぼけ、にじみ、ぎくしゃく感などの現象が発生し、ユーザが知覚する品質(ユーザ体感品質:QoE(Quality of Experience))が低下する。
【0004】
上記サービスを品質良く提供するためには、サービス提供に先立った品質設計やサービス提供中の品質管理が重要となり、このためには、ユーザが享受する品質を適切に定量化し、しかも簡便かつ効率的な映像品質評価技術が必要となる。
【0005】
従来、劣化のない映像信号(原映像信号)と符号化劣化やパケット損失劣化が発生した映像信号(劣化映像信号)の画素情報を比較することで映像品質を推定する映像品質評価法がある(例えば、特許文献1、非特許文献1,2参照)。
【0006】
また、パケットのヘッダ情報から映像品質に影響を与える品質パラメータ(ビットレート,パケット損失率など)を算出し、品質パラメータから映像品質を推定する映像品質評価法がある(例えば、特許文献2参照)。
【0007】
さらに、品質パラメータと、画素情報から算出される映像コンテンツの特徴量を用いることで映像品質を推定する映像品質評価法がある(例えば、非特許文献3参照)。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特許4257333号公報
【特許文献2】特許4490483号公報
【非特許文献】
【0009】
【非特許文献1】ITU-T勧告J。144
【非特許文献2】ITU-T勧告J。247
【非特許文献3】K. Yamagishi, T。 Kawano, and T. Hayashi, "Hybrid video-quality-estimation model for IPTV services," IEEE GLOBECOM 2009, CQPRM13-1, Nov. 2009.
【発明の概要】
【発明が解決しようとする課題】
【0010】
しかしながら、特許文献1及び非特許文献1、2の技術は、原映像信号を必要とするため、原映像信号を入手できない環境では適用できないという制限がある。
【0011】
また、特許文献2の技術は、原映像信号を必要としない技術であるが、映像コンテンツの特徴(例えば、動きの多い映像など)の違いによる品質のゆらぎ(コンテンツ依存性)は考慮できない。図1は、主観品質評価実験の結果を基に、ビットレートと映像品質の関係をグラフ化したものである。図1のように、同じビットレート条件でも、映像コンテンツの違いにより映像品質が異なる。映像品質を正確に推定するためには、コンテンツ依存性を加味する必要がある。
【0012】
さらに、非特許文献3の技術はコンテンツ依存性を考慮するために、品質パラメータに加え、画素情報から算出されるコンテンツの特徴を定量化した特徴量(コンテンツ特徴量)を用いている。しかし、多種多様なコンテンツの特徴を画素情報に基づくコンテンツ特徴量のみで表現するのは難しく、コンテンツ特徴量だけでは、完全にコンテンツ依存性を考慮したとはいい難い。
【0013】
本発明は、上記に鑑みてなされたもので、その目的とするところは、原映像信号を用いずに、劣化映像信号のみからコンテンツ依存性を多面的に考慮して映像品質を推定する装置及び方法及びプログラムを提供することである。
【課題を解決するための手段】
【0014】
上記の課題を解決するため、本発明は、ネットワークを介して映像を配信するサービスに対してユーザが体感する映像品質を推定する映像品質推定装置であって、
映像配信で用いるパケットのヘッダ情報及び前記パケットに含まれる映像ビットストリームを復号し得られる映像信号から、特徴量を算出する特徴量導出手段と、
前記特徴量から映像品質を算出する映像品質導出手段と、
を有し、
前記特徴量導出手段は、
前記映像配信で用いるパケットのヘッダ情報から単位時間あたりのパケットもしくは映像ビットストリームのビット量(ビットレート)を算出するビットレート算出手段、
もしくは、
前記映像ビットストリームを復号して得られる映像信号から動き量を算出する動き量算出手段、
もしくは、
前記映像ビットストリームを復号して得られる映像信号からブロックノイズ量を算出するブロックノイズ量算出手段、
もしくは、
これらの組み合わせを備え、
前記映像品質導出手段は、
前記ビットレートと、前記ブロックノイズ量と、前記動き量から映像品質を推定する映像品質推定手段を備えることを特徴とする。
【発明の効果】
【0015】
上記にように、本発明によれば、パケットヘッダ情報と映像信号からコンテンツの特徴及び符号化劣化を定量化した特徴量を抽出し映像通信サービスの映像品質値を推定できる。そのため、サービスを利用するユーザに対してある一定以上の品質を保っているかどうかをより正確に判断することができる。これにより、提供中のサービスの品質実態を把握・管理することが可能となる。
【図面の簡単な説明】
【0016】
【図1】映像品質のコンテンツ依存性を示す図である。
【図2】動き量の品質特性を示す図である。
【図3】本発明の一実施の形態における映像品質推定装置の構成図である。
【図4】本発明の一実施の形態におけるブロックノイズ量算出部における符号化ブロック境界領域を示す図である。
【図5】本発明の一実施の形態におけるビットレートと平均映像品質の関係を示す図である。
【発明を実施するための形態】
【0017】
以下図面と共に、本発明の実施の形態を説明する。
【0018】
本発明では、パケットヘッダ情報から得られる品質パラメータと画素情報から得られるコンテンツの特徴量に、画素情報から得られる符号化劣化を定量化した特徴量をコンテンツ依存性を評価する項目に加えることで、コンテンツの特徴だけではなく、コンテンツの違いによる劣化も考慮することで、コンテンツ依存性を多面的に捉え、映像品質を推定する精度を向上させる。
【0019】
具体的には、パケットヘッダ情報から得られる品質パラメータとして「ビットレート」、画素情報から得られるコンテンツの特徴量として「動き量」、画素情報から得られる符号化劣化を定量化した特徴量として「ブロックノイズ量」を用いてコンテンツ依存性を考慮し、映像品質を推定する。
【0020】
(1)ビットレート(パケットヘッダ情報)
ビットレートとは、パケットもしくは、パケットに含まれる映像ビットストリームの時間単位あたりのビット量を表す。パケットのヘッダ情報(例えば、IPパケットヘッダに含まれるパケット長とRTPパケットのヘッダに含まれるタイムスタンプ)を用いて単位時間あたりのビット量を計算することで、ビットレートは算出される。
【0021】
映像符号化は情報量の圧縮のために映像情報を削減している。そのため、ビットレートが高い/低いは、映像情報の削減量の少ない/多いを意味し、同じ映像コンテンツに限れば、ビットレートが高いほど品質は高く、逆に、ビットレートが低くなるほど映像情報の削減量が多くなり、品質は低くなる。このことから、映像品質に影響を与える特徴量の一つとして符号化劣化を定量化したビットレートを用いる。
【0022】
(3)動き量(コンテンツ特徴量)
映像情報の中には、冗長性のあるものや、人間の知覚的に認識されないものもあり、そういった映像情報は削減しても、品質はあまり低下しない。このように、映像情報の削減量が品質に及ぼす影響の大小に作用する。映像情報が有するコンテンツの特徴の一つとして、品質に及ぼす影響の大きい「動き」を用い、「動き」を定量化した特徴量をコンテンツ依存性の評価項目とする。
【0023】
動きを定量化した動き量の算出方法を以下で説明する、全ての隣接する2つフレームの組に対し、フレーム間の同じ画素位置の輝度値の差分値を全ての画素において求め、その差分値の標準偏差を算出する。このように求めた標準偏差を全ての隣接するフレームの組で平均した値を動き量とする。
【0024】
映像符号化は画素値の時間的な冗長性を削減して情報量を圧縮している。そのため、画素の時間的変化、つまり、動きが多い映像は、画素値の時間的冗長性が低くなり、品質を保って情報を圧縮するのが難しくなる。逆に、動きが少ない映像は、画素値の時間的冗長性が高くなり、品質を保って情報を圧縮し易くなる。図2は、ビットレートと映像品質の関係を示しており、プロット点が濃いほど、動き量が小さいことを示し、プロット点が薄いほど、動き量が大きいことを示す。同じビットレート条件では、動き量が大きいほど、品質が低くなる傾向がある。
【0025】
(3)ブロックノイズ量(劣化特徴量)
劣化映像信号において発生した「劣化」の中でも主要な符号化劣化である「ブロックノイズ」を定量化した「ブロックノイズ量」をコンテンツ依存性の評価項目とする。
【0026】
映像符号化は、フレームもしくはフィールドを矩形ブロック(符号化ブロック)に区分し、符号化ブロック毎に情報を削減しているため、符号化ブロックの境界付近に原映像信号には存在しない画素値(輝度値及び色差値)の不自然な段差が生じる。こうした劣化をブロックノイズという。ブロックノイズを定量化したブロックノイズ量の算出方法を以下で説明する。
【0027】
対象とする映像信号にエッジ抽出フィルタを適用する。このとき、符号化ブロックの境界付近(符号化ブロック境界領域)にブロックノイズにより発生したエッジが抽出される。
【0028】
次に、フレーム毎に符号化ブロック境界領域のエッジ量を算出する。符号化ブロック境界領域には、原映像信号のエッジも含まれるため、符号化ブロック境界領域以外の領域のエッジ量で符号化ブロック境界領域のエッジ量を除算し、正規化する。正規化した値を全フレームで平均した値をブロックノイズ量とする。
【0029】
ブロックノイズ量が増加すると、符号化ブロックの境界付近にブロックノイズが発生し、映像品質が低下する。
【0030】
図3は、本発明の一実施の形態における映像品質推定装置の構成図である。
【0031】
同図に示す映像品質推定装置は、特徴導出部10と映像品質導出部20から構成される。
【0032】
特徴導出部10は、ビットレート算出部100、ブロックノイズ量算出部101、動き量算出部102から構成される。
【0033】
特徴量導出部10は、映像通信に用いるIPパケット及びIPパケットに含まれる映像ビットストリームを復号した映像信号を入力とする。IPパケットをビットレート算出部100に、映像信号をブロックノイズ量算出部101と動き量算出部102に入力する。
【0034】
ビットレート算出部100は、入力されたIPパケットから、単位時間あたりのIPパケットもしくは映像ビットストリームのビット量(ビットレートBr)を算出する。例えば、IPパケットのヘッダに含まれるパケット長とRTP(Real time Transport Protocol)ヘッダに含まれるタイムスタンプを用いて算出することができる。ビットレートBrを映像品質導出部20に入力する。
【0035】
ブロックノイズ量算出部101は、入力された映像信号(本実施の形態では映像信号に含まれる輝度信号に適用するが,色差信号でもよい)からブロックノイズ量Bを算出する。ブロックノイズ量Bは、文献1(河野,山岸,岡本,"IPTVサービスを対象としたNR型メディアレイヤモデルの提案," 信学技報, CQ 109(373), pp.137-142, Jan. 2010)に記載のブロックノイズ量を用いる。
【0036】
まず,入力された映像信号に、エッジ抽出フィルタを適用する.このとき,適用後の信号をエッジ映像信号とする。本実施の形態では、エッジ抽出フィルタとしてCanny Edge Detector(文献2:"A Computational Approach to Edge Detection," by J.F. Canny, IEEE Transactions on Pattern Analysis and Machine Intelligence, 8, pp.769-798, 1986)を使用する。エッジ抽出フィルタとしては、Sobelフィルタやラプラスフィルタを適用することができるが、Canny Edge Detectorを利用すると、精度良くブロックノイズを抽出できる。
【0037】
次に、符号化ブロック境界領域と非符号化ブロック境界領域を定義する。符号化ブロック境界領域は、離散コサイン変換及び量子化の処理単位である符号化ブロックの境界付近の画素の集合である。本実施の形態では、図4のように、符号化ブロック境界線(図の黒の線)に隣接する画素の集合、ブロック境界線を含む画素及びその画素に隣接する画素の集合を符号化ブロック境界領域とする。なお、符号化ブロック境界線の位置はコーデックの種類により異なる。また、解像度変換などの画像処理により、コーデックで定義されているブロック境界位置と一致しないことがある。例えば、解像度1440×1080の符号化映像を、解像度1920×1080の映像にサイズ変換する場合、8×8のブロックサイズは10.66×8のブロックサイズとなる。符号化ブロック境界線の位置についてはシステムに基づいて予め設定しておくか、推定する必要があり、本実施の形態では、ブロック境界位置が予め設定されている場合の例を示す。一方、非符号化ブロック境界領域は、符号化ブロック境界領域以外の全ての画素の集合を示す。
【0038】
次に、フレーム毎にエッジ映像信号の符号化ブロック境界領域内に位置する画素値の合計を符号化ブロック境界領域の総画素数で除算した値B1(f)を算出する。ここでfはフレーム番号を示す。ブロックノイズのエッジは、符号化ブロック境界領域に発生するため、ブロックノイズが強くなると、B1(f)が大きくなる。しかし、原映像信号のエッジも符号化ブロック境界領域に含まれるため、フレーム毎にエッジ映像信号の非符号化ブロック境界領域内に位置する画素値の合計を非符号化ブロック境界領域の総画素数で除算した値
B2(f)を算出し、B1(f)をB2(f)で除算し原映像信号のエッジの影響を取り除く。次式のように、
B1(f)/B2(f)
を全てのフレームで平均した値をブロックノイズ量Bとする。
【0039】
【数1】

ここでNは総フレーム数を示す。
【0040】
動き量算出部102は,入力された映像信号から,動き量Mを算出する.動き量Mは文献3(ITU−T勧告P.910)に記載のTI(Temporal perceptual information)をベースとしている。
【0041】
まず、隣接するフレーム間の同じ画素位置の輝度値の差分値m(f,w,h)を次式のように算出する。
【0042】
M(f,w,h) = y(f,w,h) − y(f−1,w,h)
ここでy(f,w,h)は映像信号のfフレーム目の画素位置(w,h)の輝度値を示す。
【0043】
次に、次式のように隣接するフレームの組毎にm(f,w,h)の標準偏差を算出し、全ての隣接するフレームの組で平均した値を動き量Mとする。
【0044】
【数2】

上記において、stdspace(m(f,w,h))は、m(f,w,h)の標準偏差をフレームf毎に出力する関数、Nは総フレーム数を示す。
【0045】
映像品質導出部20は平均映像品質算出部200と映像品質算出部201から構成される。映像品質導出部20は、入力されたビットレートを平均映像品質算出部200に入力し、入力されたブロックノイズ量と動き量を映像品質算出部201に入力する。
【0046】
平均映像品質算出部200は、入力されたビットレートBrから平均映像品質を算出する。平均映像品質は、特許文献2の平均映像品質を用いる。図5は、ビットレートBrと、ビットレート毎のある映像コンテンツ群の平均映像品質(平均映像品質Vqave)の関係を示す。ビットレートBrの増加に伴い、平均映像品質Vqaveも増加し、品質の上限値に収束する.一方,ビットレートBrの減少に伴い,平均映像品質Vqaveも減少し、品質の下限値に収束する。この品質特性を数式化し、その数式にビットレートBrを入力することで、平均映像品質を算出する。本実施の形態では以下の数式を用いる。
【0047】
【数3】

但し、v1,v2,v3はコーデック種別、サービス種別、映像解像度などにより決まる係数である。表1のように、予め,コーデック種別(H.264,MPEG-2など)、サービス種別(IPTV,テレビ電話など)、映像解像度(1080i,720pなど)の組み合わせ毎に、モデル係数のテーブルとして保持する必要がある。これらのテーブルは主観品質評価実験の結果に基づいて作成される。
【0048】
【表1】

映像品質算出部201は、入力された平均映像品質Vqave,ブロックノイズ量B,動き量Mから映像品質Vqを算出する。次式のように、映像品質Vqは、平均映像品質Vqave,ブロックノイズ量B,動き量M,及び、それらをかけ合わせたものの線形和として算出される。
【0049】
Vq=v4 Vqave+v5 B + v6 M + v7 Vqave B + v8 Vqave M + v9 B M+v10
但し、v4,v,v,v,v,v,v10はコーデック種別,サービス種別,映像解像度などにより決まる係数で表1のように、予め、コーデック種別(H.264,MPEG-2など)、サービス種別(IPTV,テレビ電話など)、映像解像度(1080i,720pなど)の組み合わせ毎に,モデル係数のテーブルとして保持する必要がある。これらのテーブルは主観品質評価実験の結果に基づいて作成される。
【0050】
なお、図3に示す映像品質推定装置の構成要素の各動作をプログラムとして構築し、映像品質推定装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
【0051】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0052】
10 特徴量導出部
20 映像品質導出部
100 ビットレート算出部
101 ブロックノイズ量算出部
102 動き量算出部
200 平均映像品質算出部
201 映像品質算出部

【特許請求の範囲】
【請求項1】
ネットワークを介して映像を配信するサービスに対してユーザが体感する映像品質を推定する映像品質推定装置であって、
映像配信で用いるパケットのヘッダ情報及び前記パケットに含まれる映像ビットストリームを復号し得られる映像信号から、特徴量を算出する特徴量導出手段と、
前記特徴量から映像品質を算出する映像品質導出手段と、
を有し、
前記特徴量導出手段は、
前記映像配信で用いるパケットのヘッダ情報から単位時間あたりのパケットもしくは映像ビットストリームのビット量(ビットレート)を算出するビットレート算出手段、
もしくは、
前記映像ビットストリームを復号して得られる映像信号から動き量を算出する動き量算出手段、
もしくは、
前記映像ビットストリームを復号して得られる映像信号からブロックノイズ量を算出するブロックノイズ量算出手段、
もしくは、
これらの組み合わせを備え、
前記映像品質導出手段は、
前記ビットレートと、前記ブロックノイズ量と、前記動き量から映像品質を推定する映像品質推定手段を備える
ことを特徴とする映像品質推定装置。
【請求項2】
前記動き量算出手段は、
前記映像信号に基づき,映像コンテンツの画素値の時間方向の変化を定量化した動き量を算出する手段と、
前記映像信号に基づき,隣接する2つのフレーム間の同じ画素位置の画素値の差分値の標準偏差を、隣接する2つのフレーム組毎に算出し、前記標準偏差を全ての隣接する2つのフレーム組で平均した値を動き量として算出する手段と、
を含む請求項1記載の映像品質推定装置。
【請求項3】
前記ブロックノイズ量算出手段は、
前記映像信号にエッジ抽出フィルタを適用し、エッジ映像信号を生成する手段と、
前記エッジ映像信号について、映像符号化方式における離散コサイン変換の適用単位である矩形ブロックに関する境界線の近隣領域の画素の集合を符号化ブロック境界領域とし、符号化ブロック境界領域以外の画素の集合を非符号化ブロック境界領域として、フレーム毎に分類する手段と、
前記エッジ映像信号からフレーム毎に符号化ブロック境界領域のエッジ量(符号化ブロック境界領域エッジ量)を算出する手段と、
前記エッジ映像信号からフレーム毎に非符号化ブロック境界領域のエッジ量(非符号化ブロック境界領域エッジ量)を算出する手段と、
フレーム毎に前記符号化ブロック境界領域エッジ量を前記非符号化ブロック境界領域エッジ量で除算し、除算した値を全フレームで平均した値をブロックノイズ量として算出する手段と、
を含む請求項2記載の映像品質推定装置。
【請求項4】
前記映像品質推定手段は、
前記ビットレートから平均映像品質(ビットレート毎の複数コンテンツの映像品質の平均値)を算出する平均映像品質算出手段と、
前記平均映像品質算出手段で算出された当該平均映像品質と、前記ブロックノイズ量算出手段で算出された前記ブロックノイズ量と、前記動き量算出手段で算出された前記動き量を基に,映像品質を算出する映像品質算出手段と、
を含む請求項1記載の映像品質推定装置。
【請求項5】
前記平均映像品質算出手段は、
前記ビットレートから平均映像品質を算出するモデル式と、
コーデック種別、サービス種別、映像解像度といった品質特性に対応して、予め,その品質特性に応じたモデル式の係数のテーブルと、
を備える請求項4記載の映像品質推定装置。
【請求項6】
前記映像品質推定手段は、
前記平均映像品質、前記動き量、前記ブロックノイズ量から映像品質を算出するモデル式と、
コーデック種別、サービス種別、映像解像度といった品質特性に対応して、予め、その品質特性に応じたモデル式の係数のテーブルと、
を備える請求項4記載の映像品質推定装置。
【請求項7】
ネットワークを介して映像を配信するサービスに対してユーザが体感する映像品質を推定する映像品質推定方法であって、
特徴量導出手段が、映像配信で用いるパケットのヘッダ情報及び前記パケットに含まれる映像ビットストリームを復号し得られる映像信号から、コンテンツの特徴及び符号化劣化を定量化した特徴量を算出する特徴量導出ステップと、
映像品質導出手段が、前記特徴量から映像品質を算出する映像品質導出ステップと、
を行うことを特徴とする映像品質推定方法。
【請求項8】
前記特徴量導出ステップにおいて、
前記映像配信で用いるパケットのヘッダ情報から単位時間あたりのパケットもしくは映像ビットストリームのビット量(ビットレート)を算出する、
もしくは、
前記映像ビットストリームを復号して得られる映像信号から動き量を算出する、
もしくは、
前記映像ビットストリームを復号して得られる映像信号からブロックノイズ量を算出する、
もしくは、
これらの組み合わせにより前記特徴量を算出し、
前記映像品質導出ステップにおいて、
前記ビットレートと、前記ブロックノイズ量と、前記動き量から映像品質を推定する
請求項7記載の映像品質推定方法。
【請求項9】
前記映像品質導出ステップにおいて、
前記ビットレートから平均映像品質(ビットレート毎の複数コンテンツの映像品質の平均値)を算出し、
前記平均映像品質と、前記ブロックノイズ量と、前記動き量を基に、映像品質を算出する、
請求項8記載の映像品質推定方法。
【請求項10】
請求項1乃至6のいずれか1項に記載の映像品質推定装置を構成する各手段としてコンピュータを機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2012−142848(P2012−142848A)
【公開日】平成24年7月26日(2012.7.26)
【国際特許分類】
【出願番号】特願2011−622(P2011−622)
【出願日】平成23年1月5日(2011.1.5)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 平成22年11月11日 社団法人電子情報通信学会発行の「電子情報通信学会技術研究報告 信学技報 Vol.110 No.287」に発表
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】