説明

映像品質客観評価装置及び方法及びプログラム

【課題】劣化映像のエッジ映像に基づきエッジ映像のエッジ量及びテクスチャ量を導出し、正確な映像品質推定を行う映像品質客観評価装置を提供する。
【解決手段】本発明は、入力された劣化映像からエッジ量及びテクスチャ量を導出するエッジ・テクスチャ量抽出部と、劣化映像及びエッジ・テクスチャ量抽出部から導出されるエッジ量とテクスチャ量から少なくとも1つの特徴量を導出する特徴量抽出部と、特徴量抽出部から出力される特徴量に基づき映像品質評価値を導出する映像品質推定部を設けた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像品質客観評価装置及び方法及びプログラムに係り、特に、インターネットのようなIP(Internet Protocol)ネットワーク経由で行うIPTVサービス、映像配信サービス、TV電話サービスなどにおける映像品質を客観的に評価する映像品質客観評価装置及び方法及びプログラムに関する。
【背景技術】
【0002】
インターネットアクセス回線の高速・広帯域化に伴い、インターネットを介して映像や音声を含む映像メディアを端末間あるいはサーバと端末との間で転送する映像通信サービスの普及が期待されている。
【0003】
インターネットは、必ずしも通信品質が保証されていないネットワークであるため、音声および映像メディアなどを用いて通信を行う場合、ユーザ端末間のネットワークの回線帯域が狭いことによるビットレートの低下、回線が輻輳することでパケット損失やパケット転送遅延が発生し、音声や映像メディアなどに対してユーザが知覚する品質(ユーザ体感品質:QoE(Quality of Experience))が劣化してしまう。
【0004】
具体的には、映像を符号化すると、フレーム内の映像信号にブロック単位の処理による劣化が生じたり、映像信号の高周波成分が失われることにより、映像全体の精細感が低くなる。
【0005】
結果として、ユーザは受信した映像に、ぼけ、にじみ、モザイク状の歪み等を知覚する。
【0006】
上記のような映像通信サービスを良好な品質で提供していることを確認するためには、サービス提供前もしくは提供中に、ユーザが体感する映像の品質を測定し、ユーザに対して提供される映像の品質が高いことを監視することが重要となる。
【0007】
したがって、ユーザが体感する映像の品質を適切に表現することができる映像品質客観評価技術が必要とされている。
【0008】
従来、映像品質を評価する手法として、主観品質評価法(例えば、非特許文献1参照)や客観品質評価法(例えば、非特許文献2参照)がある。
【0009】
主観品質評価法は、複数のユーザが実際に映像を視聴し、体感した品質を5段階(9段階や11段階の場合もある)の品質尺度(非常に良い、良い、ふつう、悪い、非常に悪い)や妨害尺度(劣化が全く認められない、劣化が認められるが気にならない、劣化がわずかに気になる、劣化が気になる、劣化が非常に気になる)などにより評価し、全ユーザ数で各条件(例えば、パケット損失率0%でビットレートが20Mbps)の映像品質評価値を平均し、その値をMOS(Mean Opinipn Score)値やDMOS(Degradation Mean Opinion Score)値として定義している。
【0010】
しかしながら、主観品質評価は、特別な専用機材(モニタなど)や評価環境(室内照度や室内騒音など)を調整可能な評価施設を必要とするだけではなく、多数のユーザが実際に映像を評価する必要がある。そのため、ユーザが実際に評価を完了するまでに時間がかかってしまい、品質をリアルタイムに評価する場合には不向きである。
【0011】
そこで、映像品質に影響を与える特徴量(例えば、ビットレートやフレーム単位のビット量、パケット損失情報など)を利用し、映像品質評価値を出力する客観品質評価法の開発が望まれている。
【0012】
従来の客観品質推定法の1つに、符号化前の原映像と符号化後の劣化映像を入力とし、両者の映像信号(つまり、画素値)を比較し、映像品質に影響を与える特徴量から映像品質評価値を導出する技術がある(例えば、非特許文献2参照)。
【0013】
また、従来の客観品質評価法の1つに、符号化前の原映像を用いず、符号化後の劣化映像を入力とし、この劣化映像信号から映像品質に影響を与える特徴量を導出し、映像品質評価値を導出する技術がある(例えば、非特許文献3〜7参照)。
【0014】
さらに、従来の客観品質評価法の1つに、送信されたパケットを入力とし、これらパケットから映像品質に影響を与える特徴量を導出し、映像品質評価値を導出する技術がある(例えば、非特許文献8、9参照)。
【0015】
従来の客観品質評価法の多くは、上記のように、パケットや映像信号(画素値)を用いて映像品質評価値を推定するものであった。
【先行技術文献】
【非特許文献】
【0016】
【非特許文献1】ITU-T勧告P.910
【非特許文献2】ITU-T勧告J.247
【非特許文献3】J. Yang, H. Choi, and T. Kim, "Noise estimation for blocking artifacts reduction in DCT coded images," IEEE Trans. on CSVT, vol. 10, no. 7, pp. 1116-1134, Oct. 2000.
【非特許文献4】S. Minami and A. Zakhor, "An optimization approach for removing blocking effects in transform coding," IEEE Trans. on CSVT, vol. 5, no. 2, pp. 74-82, Apr. 1995.
【非特許文献5】H. R. Wu and M. Yuen, "A generalized block-edge impairment metric for video coding," IEEE Sig. Proc. Let., vol. 4, no. 11, pp. 317-320, Nov. 1997.
【非特許文献6】S. Suthaharan, "Perceptual quality metric for digital video coding," IEE El. Let., vol. 39, no. 5, pp. 431-433, Mar. 2003.
【非特許文献7】P. Marziliano, F. Dufaux, S. Winkler, and T. Ebrahimi, "A no-reference perceptual blur metric," IEEE ICIP, vol. 3, pp. 57-60, Sep. 2002.
【非特許文献8】K. Yamagishi and T. Hayashi, "Non-intrusive Packet-layer Model for Monitoring Video Quality of IPTV Services," IEICE Trans. Fundamentals, vol. E92-A, no. 12, pp. 3297--3306, Dec. 2009.
【非特許文献9】K. Watanabe, K. Yamagishi, J. Okamoto, and A. Takahashi, "Proposal of new QoE assessment approach for quality management of IPTV services," IEEE ICIP 2008, pp. 2060--2063, Oct. 2008.
【非特許文献10】Stephane Pechard, Patrick Le Callet, Mathieu Carnec, Dominique Barba, "A NEW METHODOLOGY TO ESTIMATE THE IMPACT OF H.264 ARTEFACTS ON SUBJECTIVE VIDEO QUALITY," VPQM2007, 2007
【発明の概要】
【発明が解決しようとする課題】
【0017】
しかしながら、非特許文献2の技術は、原映像信号を用いるため、原映像信号がないような場合の品質評価には利用できないといった問題がある。
【0018】
また、非特許文献3〜7の技術は、劣化映像のみから映像品質を評価する技術であるが、ブロックノイズやブラー(ぼけ)ノイズを適切に定量化できず、映像品質推定精度が低いといった問題があった。
【0019】
具体的には、非特許文献3〜6の技術は、ブロック境界線に隣接する画素の差分に基づきブロックノイズを抽出している。しかしながら、映像信号は、しばしば、解像度変換(例えば、1440×1080から1920×1080等)が行われるため、ブロック境界線に隣接する画素のみからブロックノイズを適切に抽出することは困難である。
【0020】
また、非特許文献7の技術は、エッジ位置からブラーノイズを抽出する方法であるが、エッジは符号化やポストフィルタにより劣化するため、ブラーノイズを適切に抽出することは困難である。
【0021】
さらに、非特許文献8と9の技術は、送信されたパケット情報に基づいて映像品質を評価するため、デコード後に実施されるポストフィルタやPLC(Packet-loss concealment)が映像品質に与える影響を考慮できないといった問題があった。
【0022】
本発明は、上記の点に鑑みなされたもので、上述の問題を解決すべく、非特許文献10に記載される技術(劣化映像Sobel filterを適用し、各画素をエッジ部とテクスチャ部等に分類する方法)から得られたクラスタリング画像から映像品質に影響を与える特徴量を導出し、映像品質評価値を推定することで、映像通信サービスの映像品質値を高精度に推定することが可能な映像品質客観評価装置及び方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0023】
図1は、本発明の原理構成図である。
【0024】
本発明(請求項1)は、映像品質を客観的に評価する映像品質客観評価装置であって、
入力された劣化映像からエッジ量及びテクスチャ量を導出するエッジ・テクスチャ量抽出手段100と、
エッジ・テクスチャ量抽出手段100から導出されるエッジ量とテクスチャ量から導出される特徴量または、劣化映像から導出される特徴量の少なくとも1つの特徴量を導出する特徴量抽出手段200と、
特徴量抽出手段200から出力される特徴量に基づき映像品質評価値を導出する映像品質推定手段300と、を備える。
【0025】
また、本発明(請求項2)は、請求項1のエッジ・テクスチャ量抽出手段100において、
入力された劣化映像をキャプチャしエッジ画像を作成し、該エッジ画像の各画素の値に基づきクラスタリングを実施し、クラスタリング画像を導出するクラスタリング手段と、
クラスタリング手段により導出されたクラスタリング画像をフィルタリングし、フィルタリング画像を作成するフィルタリング手段と、
クラスタリング手段により導出されたクラスタリング画像とフィルタリング手段から導出されたフィルタリング画像との差分値から差分クラスタリング画像を作成する差分クラスタリング画像導出手段と
差分クラスタリング画像導出手段により導出された差分クラスタリング画像のエッジ量とテクスチャ量を映像フレーム単位にカウントするカウント手段と、を含む。
【0026】
また、本発明(請求項3)は、請求項1の特徴量抽出手段200において、
エッジ・テクスチャ量抽出手段より映像フレーム単位に抽出されたエッジ量及びテクスチャ量に基づき、推定対象の映像の全映像フレームに対するエッジ量の合計値と、同様に、推定対象の映像の全映像フレームに対するテクスチャ量の合計値を算出し、該エッジ量の合計値を該テクスチャ量の合計値で除算した映像フレーム平均特徴量を導出する映像フレーム平均特徴量導出手段を含み、
映像品質推定手段300において、映像フレーム平均特徴量を用いて映像品質評価値を求める手段を含む。
【0027】
また、本発明(請求項4)は、請求項1または3の特徴量抽出手段200において、
エッジ・テクスチャ量抽出手段より映像フレーム単位に抽出されたエッジ量及びテクスチャ量に基づき、映像フレーム単位にエッジ量の合計値をテクスチャ量の合計値で除算した映像フレーム特徴量を導出する映像フレーム特徴量導出手段と、
推定対象の映像のある一定区間の複数の映像フレームに対し、映像フレーム特徴量導出手段から導出された映像フレーム特徴量を合計し、映像フレーム数で除算した平均特徴量を導出する平均特徴量導出手段と、
平均特徴量導出手段より導出される推定対象の映像のある一定区間の複数の映像フレームの平均特徴量に対し、推定対象の全区間の複数の平均特徴量の最大の値を示す最大特徴量を導出する最大特徴量導出手段と、
平均特徴量導出手段より導出された推定対象の映像のある一定区間の複数の映像フレームの平均特徴量に対し、推定対象の全区間の複数の平均特徴量の標準偏差をとった標準偏差特徴量を導出する標準偏差特徴量導出手段と、を更に有し、
映像品質推定手段300において、映像フレーム平均特徴量、最大特徴量、及び、標準偏差特徴量の少なくともいずれか1つを用いて映像品質評価値を求める手段を含む。
【0028】
また、本発明(請求項5)は、請求項1,3、または4の特徴量抽出手段200において、
入力された劣化映像から映像の動きを示す動き量を導出する動き量導出手段を更に有し、
映像品質推定手段300において、映像フレーム平均特徴量、最大特徴量、標準偏差特徴量、及び、動き量の少なくともいずれか1つを用いて映像品質評価値を求める手段を含む。
【0029】
図2は、本発明の原理を説明するための図である。
【0030】
本発明(請求項6)は、映像品質を客観的に評価する映像品質客観評価方法であって、
映像品質客観評価装置が、
入力された劣化映像からエッジ量及びテクスチャ量を導出するエッジ・テクスチャ量抽出ステップ(ステップ1)と、
エッジ・テクスチャ量抽出ステップから導出されるエッジ量とテクスチャ量から導出される特徴量または、劣化映像から導出される特徴量の少なくとも1つの特徴量を導出する特徴量抽出ステップ(ステップ2)と、
特徴量抽出ステップから出力される特徴量に基づき映像品質評価値を導出する映像品質推定ステップ(ステップ3)と、を行う。
【0031】
また、本発明(請求項7)は、請求項6のエッジ・テクスチャ量抽出ステップにおいて、
入力された劣化映像をキャプチャしエッジ画像を作成し、該エッジ画像の各画素の値に基づきクラスタリングを実施し、クラスタリング画像を導出するクラスタリングステップと、
クラスタリングステップにより導出されたクラスタリング画像をフィルタリングし、フィルタリング画像を作成するフィルタリングステップと、
クラスタリングステップにより導出されたクラスタリング画像とフィルタリングステップから導出されたフィルタリング画像との差分値から差分クラスタリング画像を作成する差分クラスタリング画像導出ステップと
差分クラスタリング画像導出ステップにより導出された差分クラスタリング画像のエッジ量とテクスチャ量を映像フレーム単位にカウントするカウントステップと、を行う。
【0032】
また、本発明(請求項8)は、請求項6の特徴量抽出ステップにおいて、
エッジ・テクスチャ量抽出ステップより映像フレーム単位に抽出されたエッジ量及びテクスチャ量に基づき、推定対象の映像の全映像フレームに対するエッジ量の合計値と、同様に、推定対象の映像の全映像フレームに対するテクスチャ量の合計値を算出し、該エッジ量の合計値を該テクスチャ量の合計値で除算した映像フレーム平均特徴量を導出する映像フレーム平均特徴量導出ステップを行い、
映像品質推定ステップにおいて、映像フレーム平均特徴量を用いて映像品質評価値を求める。
【0033】
また、本発明(請求項9)は、請求項6または8の特徴量抽出ステップにおいて、
エッジ・テクスチャ量抽出ステップより映像フレーム単位に抽出されたエッジ量及びテクスチャ量に基づき、映像フレーム単位にエッジ量の合計値をテクスチャ量の合計値で除算した映像フレーム特徴量を導出する映像フレーム特徴量導出ステップと、
推定対象の映像のある一定区間の複数の映像フレームに対し、映像フレーム特徴量導出ステップから導出された映像フレーム特徴量を合計し、映像フレーム数で除算した平均特徴量を導出する平均特徴量導出ステップと、
平均特徴量導出ステップより導出される推定対象の映像のある一定区間の複数の映像フレームの平均特徴量に対し、推定対象の全区間の複数の平均特徴量の最大の値を示す最大特徴量を導出する最大特徴量導出ステップと、
平均特徴量導出ステップより導出された推定対象の映像のある一定区間の複数の映像フレームの平均特徴量に対し、推定対象の全区間の複数の平均特徴量の標準偏差をとった標準偏差特徴量を導出する標準偏差特徴量導出ステップと、を更に行い、
映像品質推定ステップにおいて、映像フレーム平均特徴量、最大特徴量、及び、標準偏差特徴量の少なくともいずれか1つを用いて映像品質評価値を求める。
【0034】
また、本発明(請求項10)は、請求項6,8、または9の特徴量抽出ステップにおいて、
入力された劣化映像から映像の動きを示す動き量を導出する動き量導出ステップを更に行い、
映像品質推定ステップにおいて、映像フレーム平均特徴量、最大特徴量、標準偏差特徴量、及び、動き量の少なくともいずれか1つを用いて映像品質評価値を求める。
【0035】
本発明(請求項11)は、請求項1乃至5のいずれか1項に記載の映像品質客観評価装置を構成する各手段としてコンピュータを機能させるための映像品質客観評価プログラムである。
【発明の効果】
【0036】
従来、隣接画素やエッジ位置を用いてブロックノイズやブラー(ぼけ)ノイズを導出していたため,解像度変換やフィルタリングが行われた際に、ブロックノイズやブラーノイズを適切に抽出できないために映像品質推定精度が著しく低下していた。
【0037】
これに対し、本発明は、劣化映像に適用されたクラスタリング処理に基づき分類されたC3(エッジ量)とC4(テクスチャ量)から、映像全体の複雑さを表す映像フレーム平均特徴量と、特定の映像フレーム数毎の特徴量の変動から映像シーンの変化度合を表す最大特徴量と標準偏差特徴量と、映像の動き量とを導出することにより、解像度変換やフィルタリングが行われた際にも映像品質値を適切に推定できるように改善した。
【0038】
したがって、映像通信サービスの提供者は、本発明によりユーザが実際に視聴する映像通信サービスの映像について映像品質値を監視可能となるため、提供中のサービスがユーザに対してある一定以上の品質を保っているか否かを容易に判断することができる。
【0039】
このため、映像通信サービスの提供者は、提供中のサービスの品質実態を従来より詳細に把握・管理することが可能となる。
【図面の簡単な説明】
【0040】
【図1】本発明の原理構成図である。
【図2】本発明の原理を説明するための図である。
【図3】本発明の一実施の形態における映像品質客観評価装置の構成図である。
【図4】本発明の一実施の形態における領域分割方法を示す図である。
【図5】本発明の一実施の形態における差分クラスタリング画像の導出過程を概念的に説明するための図である。
【図6】本発明の一実施の形態における映像品質客観評価装置の動作のフローチャートである。
【発明を実施するための形態】
【0041】
以下、図面と共に本発明の実施の形態を説明する。
【0042】
本発明の本実施の形態にかかる映像品質客観評価装置は、劣化映像にクラスタリング処理を施し、クラスタリング画像を作成し、そのクラスタリング画像から特徴量を導出し、映像品質を定量的に表した映像品質評価値を導出して客観的な映像品質評価を実現するものである。
【0043】
例えば、本実施の形態においては、インターネットのようなIPネットワーク経由で行うIPTVサービス、映像配信サービス、TV電話サービスなど映像通信における客観的な映像品質評価を実現するために、劣化映像を分析し、これらの映像通信に関わる映像品質に影響を与える特徴量を定量的に表した映像品質値を導出する。
【0044】
図3は、本発明の一実施の形態における映像品質客観評価装置の構成を示す。
【0045】
図3に示すように、本実施の形態にかかる映像品質客観評価装置1は、エッジ・テクスチャ量抽出部100と、特徴量抽出部200と、映像品質推定部300とから構成されている。
【0046】
エッジ・テクスチャ量抽出部100は、クラスタリング部10と、フィルタリング部11と、差分クラスタリング画像導出部12と、カウント部13とから構成されている。
【0047】
特徴量抽出部200は、映像フレーム平均特徴量導出部14と、映像フレーム特徴量導出部15と、平均特徴量導出部16、最大特徴量導出部17と、標準偏差特徴量導出部18と、動き量導出部19とから構成されている。
【0048】
エッジ・テクスチャ量抽出部100のクラスタリング部10は、入力された劣化映像I(x,y,f)にSobelフィルタFx及びFyをかけ、垂直方向(Y方向)のエッジ画像、水平方向(X方向)のエッジ画像Sx(x,y,f)及びSy(x,y,f)を導出する。具体的には、対象画素の隣接8画素の情報を用い、以下の式(1)に基づきエッジ画像を作成する。
【0049】
【数1】

各画素に対し導出された垂直及び水平方向のエッジ値を、図4に示す領域分割方法でC1〜C4の4つのクラスに分類されたクラスタリング画像C(x,y)(xは水平画素位置、yは垂直画素位置)(クラスタリング画像はクラスC1〜C4に対応するクラスタリング値1〜4の値を持つ)を作成し、フィルタリング部11と差分クラスタリング画像導出部12に出力する。
【0050】
エッジ・テクスチャ量抽出部100のフィルタリング部11は、クラスタリング部10より出力されたクラスタリング画像C(x,y)に、図5に示すように、Erosionフィルタ及びDilatationフィルタをかけフィルタリング画像を作成する。図5は、4つのクラスにクラスタリングされた画像(8×8画素の画像)に対して、パディング無し(A)と、パディング有り(B)の例を示している。
【0051】
具体的には、クラスタリング画像C(x,y)(xは水平画素位置、yは垂直画素位置)に以下の式(2)に基づきErosionフィルタを施し、Erosion画像E(x,y)を作成する。
【0052】
次に、Erosion画像に式(3)に基づきDilatationフィルタを施し、Dilatation画像D(x,y)(つまり、フィルタリング画像)を作成し、差分クラスタリング画像導出部12に出力する。2種類のフィルタリングをかけることで、クラスタリング画像C(x,y)を平滑化したフィルタリング画像D(x,y)ができることになり、両者の差分からC3とC4を適切に抽出できる。
【0053】
【数2】

ただし、画面の端の画素に対しては、画面外に画素がないため、画面の端の画素値をパディングするか、もしくは画面の端の画素を処理しないことで対応する。
【0054】
差分クラスタリング画像導出部12は、クラスタリング部10より出力されたクラスタリング画像C(x,y)と、フィルタリング部11より出力されたフィルタリング画像D(x,y)との差分値(差分クラスタリング画像:C(x,y)-D(x,y)+1、もし、C(x,y)-D(x,y)+1が1未満の場合は1とする)を導出する。
【0055】
エッジ・テクスチャ量抽出部100のカウント部13は、差分クラスタリング画像の中で、クラスタリング値が3(エッジ量)と示された画素数NC3と、クラスタリング値が4(テクスチャ量)と示された画素数NC4をカウントする。
【0056】
エッジ・テクスチャ量抽出部100の映像フレーム平均特徴量導出部14は、以下の式(4)により、カウント部13より出力された映像フレーム毎のNC3を全映像フレームにわたって加算し映像フレーム数で除算した値を、映像フレーム毎のNC4を全映像フレームにわたって加算し映像フレーム数で除算した値で除算した映像フレーム平均特徴量Pを導出する。
【0057】
【数3】

ここで、fは映像フレーム番号、Fは総映像フレーム数(例えば、推定対象の映像が30fps、10秒分の場合、300フレームとなる)を示す。
【0058】
特徴量抽出部200の映像フレーム特徴量導出部15は、映像フレーム毎に、カウント部13より出力された映像フレーム毎のNC3を、映像フレーム毎のNC4で除算した映像フレーム特徴量P(f)を以下の式(5)に基づき導出する。
【0059】
【数4】

ここで、fは映像フレーム番号を示す。
【0060】
特徴量抽出部200の平均特徴量導出部16は、ある一定の区間(Zフレーム、例えば、10フレーム)を一区間とし、その区間の映像フレーム特徴量P(f)の平均値を平均特徴量Pt(k)とする。
【0061】
【数5】

ここで、fは映像フレーム番号、kは平均区間の番号(例えば、推定対象の映像が300フレームから構成され、Zが10フレームの場合、kは0〜29の値となる)を示す。
【0062】
特徴量抽出部200の最大特徴量導出部17は、平均特徴量導出部16より出力された平均特徴量Pt(k)の中で最大の値を最大特徴量MaxPtとして導出する(例えば、Pt(0)〜Pt(29)の中で、Pt(10)が最大であった場合、Pt(10)がMaxPtとなる)。
【0063】
【数6】

特徴量抽出部200の標準偏差特徴量導出部18は、平均特徴量導出部16より出力された平均特徴量Pt(k)の標準偏差を標準偏差特徴量StdPtとして導出する。
【0064】
【数7】

ここで、Stdevは、標準偏差を計算する演算子を表す。
【0065】
特徴量抽出部200の動き量導出部19は、映像フレーム間の動きを示す動き量TIを導出する。P、MaxPt、StdPtは映像フレーム単位に導出される特徴量の統計値であり,映像の動きとは無関係の特徴量であるため、動き量を考慮することで正確な品質推定が可能となる。
【0066】
【数8】

ここで、式(7)のI(x,y,f)は水平方向x、垂直方向y、映像フレーム番号fの画素を示す。また、M(f)はI(x,y,f)とI(x,y,f−1)との差分画像、式(8)、(9)のTI(f)は映像フレーム毎のフレーム関差分値の標準偏差、式(9)のFは総映像フレーム数(例えば、30fpsの映像10秒分の場合、300フレームとなる)を示す。
【0067】
映像品質推定部300は、映像フレーム平均特徴量導出部14より出力される映像フレーム平均特徴量P、最大特徴量導出部17より出力される最大特徴量MaxPt、標準偏差特徴量導出部18より出力される標準偏差特徴量StdPt、動き量導出部19より出力される動き量TIより、推定対象である映像の映像品質評価値(Vq)を以下の式(10)に基づき導出する。
【0068】
【数9】

ここで、a〜iは、映像フォーマット(例えば、QCIF,VGA,HDなど)に固有の係数とする。
【0069】
ただし、Vqは3次関数で表現されているが、以下に示すような式(11)で表現してもよい。
【0070】
【数10】

ここで、j〜lは、映像フォーマット(例えば、QCIF,VGA,HDなど)に固有の係数とする。なお、上記の式(10)では、特徴量抽出部200より出力されたP,MaxPt,StdPt,TIの全てを用いて映像品質評価値(Vq)を求める例を示しているが、これは最良の形態であり、この例に限定されることなく、これらの値の少なくともいずれか1つを用いてVqを求めてもよい。
【0071】
図6は、本発明の一実施の形態における映像品質客観評価装置の動作のフローチャートである。以下、同図に基づいて、本実施の形態にかかる映像品質客観評価装置1の動作について説明する。
【0072】
映像品質客観評価装置1のクラスタリング部10に、劣化映像が入力されると(S101)、クラスタリング部10は、入力された劣化映像I(x,y,f)にSobelフィルタをかけ、前述の式(1)によりエッジ画像Sx(x,y,f)及びSy(x,y,f)を導出し、エッジ画像Sx(x,y,f)及びSy(x,y,f)を用い、1〜4のクラスにクラスタリングし、クラスタリング画像C(x,y,f)を導出し、フィルタリング部11及び差分クラスタリング画像導出部12へ出力する(S102)。
【0073】
フィルタリング部11は、クラスタリング部10によって導出されたクラスタリング画像C(x,y,f)を入力として、Erosionフィルタ及びDilatationフィルタをかけ、式(2)、(3)によりフィルタリング画像D(x,y,f)を導出し、差分クラスタリング画像導出部12へ出力する(S103)。
【0074】
差分クラスタリング画像導出部12は、クラスタリング部10より出力されたクラスタリング画像C(x,y,f)からフィルタリング部11より出力されたフィルタリング画像D(x,y,f)の差分値をとり、1を加え、1〜4の値を持つ差分クラスタリング画像を導出し、カウント部13へ出力する(S104)。
【0075】
カウント部13は、差分クラスタリング画像導出部12より出力された差分クラスタリング画像のC3(エッジ量)とC4(テクスチャ量)の画素数を映像フレーム毎にカウントし、映像フレーム平均特徴量導出部 14及び映像フレーム特徴量導出部15へ出力する(S105)。
【0076】
映像フレーム平均特徴量導出部14は、カウント部13より出力されたC3とC4の画素数を、全映像フレームに対して、前述の式(5)によりC3の総数をC4の総数で除算した映像フレーム平均特徴量Pを導出し、映像品質推定部20へ出力する(S106)。
【0077】
特徴量抽出部200の映像フレーム特徴量導出部15は、カウント部13より出力されたC3とC4の画素数を各映像フレームに対し、前述の式(6)により、C3の画素数をC4の画素数で除算し、映像フレーム毎の映像フレーム特徴量P(f)を導出し、平均特徴量導出部16へ出力する(S107)。
【0078】
平均特徴量導出部16は、映像フレーム特徴量導出部15より出力された映像フレーム特徴量P(f)を特定の映像フレーム数毎に平均し、平均特徴量Pt(k)を導出し、最大特徴量導出部17及び標準偏差特徴量導出部18に出力する(S108)。
【0079】
最大特徴量導出部17は、平均特徴量Pt(k)の中で最大である最大特徴量MaxPtを導出し、映像品質推定部20へ出力する(S109)。
【0080】
標準偏差特徴量導出部18は、平均特徴量Pt(k)の標準偏差を示す標準偏差特徴量StdPtを導出し、映像品質推定部20へ出力する(S110)。
【0081】
動き量導出部19は、前述の式(7)、(8)、(9)により映像の動きを示す動き量TIを導出し、映像品質推定部20へ出力する(S111)。
【0082】
映像品質推定部300は、映像フレーム平均特徴量P、最大特徴量MaxPt、標準偏差特徴量StdPt及び動き量TIから、前述の式(10)、(11)により映像品質評価値を導出し、映像品質評価値Vqを出力し(S112)、処理を終了する。
【0083】
このように、本実施の形態によれば、劣化映像からSobelフィルタを用いて、エッジ画像を作成し、エッジとテクスチャの強い画素をクラスタリング処理により抽出し、符号化劣化を考慮した映像品質値を算出することができるため、正確な客観品質推定法による映像品質推定が可能となる。
【0084】
したがって、映像通信サービスの提供者は、提供中のサービスがユーザに対してある一定以上の品質を保っているか否かを容易に判断することができ、提供中のサービスの品質実態をリアルタイムで把握・管理することが可能となる。
【0085】
なお、本実施の形態にかかる映像品質客観評価装置1は、CPU(中央演算装置)やメモリ、インターフェースからなるコンピュータにコンピュータプログラムをインストールすることによって実現され、上述した映像品質客観評価装置1の各種機能は、上記コンピュータの各種ハードウェア資源と上記コンピュータプログラム(ソフトウェア)とが協働して実現される。
【0086】
図3に示す映像品質客観評価装置1の構成要素の動作をプログラムとして構築し、当該映像品質客観評価装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
【0087】
さらに、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
【0088】
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【産業上の利用可能性】
【0089】
本発明は、IPネットワーク経由で行うIPTVサービス、映像配信サービス、TV電話サービスなどの映像通信の映像品質値を推定する映像品質客観評価装置に利用できる。
【符号の説明】
【0090】
10 クラスタリング部
11 フィルタリング部
12 差分クラスタリング画像導出部
13 カウント部
14 映像フレーム平均特徴量導出部
15 映像フレーム特徴量導出部
16 平均特徴量導出部
17 最大特徴量導出部
18 標準偏差特徴量導出部
19 動き量導出部
100 エッジ・テクスチャ量抽出手段、エッジ・テクスチャ量抽出部
200 特徴量抽出手段、特徴量抽出部
300 映像品質推定手段、映像品質推定部

【特許請求の範囲】
【請求項1】
映像品質を客観的に評価する映像品質客観評価装置であって、
入力された劣化映像からエッジ量及びテクスチャ量を導出するエッジ・テクスチャ量抽出手段と、
前記エッジ・テクスチャ量抽出手段から導出される前記エッジ量と前記テクスチャ量から導出される特徴量または、前記劣化映像から導出される特徴量の少なくとも1つの特徴量を導出する特徴量抽出手段と、
前記特徴量抽出手段から出力される前記特徴量に基づき映像品質評価値を導出する映像品質推定手段と
を備えることを特徴とする映像品質客観評価装置。
【請求項2】
前記エッジ・テクスチャ量抽出手段は、
入力された劣化映像をキャプチャしエッジ画像を作成し、該エッジ画像の各画素の値に基づきクラスタリングを実施し、クラスタリング画像を導出するクラスタリング手段と、
前記クラスタリング手段により導出された前記クラスタリング画像をフィルタリングし、フィルタリング画像を作成するフィルタリング手段と、
前記クラスタリング手段により導出された前記クラスタリング画像と前記フィルタリング手段から導出された前記フィルタリング画像との差分値から差分クラスタリング画像を作成する差分クラスタリング画像導出手段と
前記差分クラスタリング画像導出手段により導出された前記差分クラスタリング画像のエッジ量とテクスチャ量を映像フレーム単位にカウントするカウント手段と、を含む
ことを特徴とする請求項1記載の映像品質客観評価装置。
【請求項3】
前記特徴量抽出手段は、
前記エッジ・テクスチャ量抽出手段より映像フレーム単位に抽出された前記エッジ量及び前記テクスチャ量に基づき、推定対象の映像の全映像フレームに対するエッジ量の合計値と、同様に、推定対象の映像の全映像フレームに対するテクスチャ量の合計値を算出し、該エッジ量の合計値を該テクスチャ量の合計値で除算した映像フレーム平均特徴量を導出する映像フレーム平均特徴量導出手段を含み、
前記映像品質推定手段は、
前記映像フレーム平均特徴量を用いて前記映像品質評価値を求める手段を含む
ことを特徴とする請求項1記載の映像品質客観評価装置。
【請求項4】
前記特徴量抽出手段は、
前記エッジ・テクスチャ量抽出手段より映像フレーム単位に抽出された前記エッジ量及び前記テクスチャ量に基づき、映像フレーム単位にエッジ量の合計値をテクスチャ量の合計値で除算した映像フレーム特徴量を導出する映像フレーム特徴量導出手段と、
推定対象の映像のある一定区間の複数の映像フレームに対し、前記映像フレーム特徴量導出手段から導出された前記映像フレーム特徴量を合計し、映像フレーム数で除算した平均特徴量を導出する平均特徴量導出手段と、
前記平均特徴量導出手段より導出される推定対象の映像のある一定区間の複数の映像フレームの前記平均特徴量に対し、推定対象の全区間の複数の平均特徴量の最大の値を示す最大特徴量を導出する最大特徴量導出手段と、
前記平均特徴量導出手段より導出された推定対象の映像のある一定区間の複数の映像フレームの平均特徴量に対し、推定対象の全区間の複数の平均特徴量の標準偏差をとった標準偏差特徴量を導出する標準偏差特徴量導出手段と、を更に有し、
前記映像品質推定手段は、
前記映像フレーム平均特徴量、前記最大特徴量、及び、前記標準偏差特徴量の少なくともいずれか1つを用いて前記映像品質評価値を求める手段を含む
ことを特徴とする請求項1または3記載の映像品質客観評価装置。
【請求項5】
前記特徴量抽出手段は、
入力された劣化映像から映像の動きを示す動き量を導出する動き量導出手段を更に有し、
前記映像品質推定手段は、
前記映像フレーム平均特徴量、前記最大特徴量、前記標準偏差特徴量、及び、前記動き量の少なくともいずれか1つを用いて前記映像品質評価値を求める手段を含む
ことを特徴とする請求項1,3,4のいずれか1項に記載の映像品質客観評価装置。
【請求項6】
映像品質を客観的に評価する映像品質客観評価方法であって、
映像品質客観評価装置が、
入力された劣化映像からエッジ量及びテクスチャ量を導出するエッジ・テクスチャ量抽出ステップと、
前記エッジ・テクスチャ量抽出ステップから導出される前記エッジ量と前記テクスチャ量から導出される特徴量または、前記劣化映像から導出される特徴量の少なくとも1つの特徴量を導出する特徴量抽出ステップと、
前記特徴量抽出ステップから出力される前記特徴量に基づき映像品質評価値を導出する映像品質推定ステップと
を行うことを特徴とする映像品質客観評価方法。
【請求項7】
前記エッジ・テクスチャ量抽出ステップは、
入力された劣化映像をキャプチャしエッジ画像を作成し、該エッジ画像の各画素の値に基づきクラスタリングを実施し、クラスタリング画像を導出するクラスタリングステップと、
前記クラスタリングステップにより導出された前記クラスタリング画像をフィルタリングし、フィルタリング画像を作成するフィルタリングステップと、
前記クラスタリングステップにより導出された前記クラスタリング画像と前記フィルタリングステップから導出された前記フィルタリング画像との差分値から差分クラスタリング画像を作成する差分クラスタリング画像導出ステップと
前記差分クラスタリング画像導出ステップにより導出された前記差分クラスタリング画像のエッジ量とテクスチャ量を映像フレーム単位にカウントするカウントステップと、
を行うことを特徴とする請求項6記載の映像品質客観評価方法。
【請求項8】
前記特徴量抽出ステップは、
前記エッジ・テクスチャ量抽出ステップより映像フレーム単位に抽出された前記エッジ量及び前記テクスチャ量に基づき、推定対象の映像の全映像フレームに対するエッジ量の合計値と、同様に、推定対象の映像の全映像フレームに対するテクスチャ量の合計値を算出し、該エッジ量の合計値を該テクスチャ量の合計値で除算した映像フレーム平均特徴量を導出する映像フレーム平均特徴量導出ステップを行い、
前記映像品質推定ステップは、
前記映像フレーム平均特徴量を用いて前記映像品質評価値を求める
ことを特徴とする請求項6記載の映像品質客観評価方法。
【請求項9】
前記特徴量抽出ステップは、
前記エッジ・テクスチャ量抽出ステップより映像フレーム単位に抽出された前記エッジ量及び前記テクスチャ量に基づき、映像フレーム単位にエッジ量の合計値をテクスチャ量の合計値で除算した映像フレーム特徴量を導出する映像フレーム特徴量導出ステップと、
推定対象の映像のある一定区間の複数の映像フレームに対し、前記映像フレーム特徴量導出ステップから導出された前記映像フレーム特徴量を合計し、映像フレーム数で除算した平均特徴量を導出する平均特徴量導出ステップと、
前記平均特徴量導出ステップより導出される推定対象の映像のある一定区間の複数の映像フレームの前記平均特徴量に対し、推定対象の全区間の複数の平均特徴量の最大の値を示す最大特徴量を導出する最大特徴量導出ステップと、
前記平均特徴量導出ステップより導出された推定対象の映像のある一定区間の複数の映像フレームの平均特徴量に対し、推定対象の全区間の複数の平均特徴量の標準偏差をとった標準偏差特徴量を導出する標準偏差特徴量導出ステップと、を更に行い、
前記映像品質推定ステップは、
前記映像フレーム平均特徴量、前記最大特徴量、及び、前記標準偏差特徴量の少なくともいずれか1つを用いて前記映像品質評価値を求める
ことを特徴とする請求項6または8記載の映像品質客観評価方法。
【請求項10】
前記特徴量抽出ステップは、
入力された劣化映像から映像の動きを示す動き量を導出する動き量導出ステップを更に行い、
前記映像品質推定ステップは、
前記映像フレーム平均特徴量、前記最大特徴量、前記標準偏差特徴量、及び、前記動き量の少なくともいずれか1つを用いて前記映像品質評価値を求める
ことを特徴とする請求項6,8,9のいずれか1項に記載の映像品質客観評価方法。
【請求項11】
請求項1乃至5のいずれか1項に記載の映像品質客観評価装置を構成する各手段としてコンピュータを機能させるための映像品質客観評価プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−205252(P2011−205252A)
【公開日】平成23年10月13日(2011.10.13)
【国際特許分類】
【出願番号】特願2010−68797(P2010−68797)
【出願日】平成22年3月24日(2010.3.24)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】