説明

映像品質推定装置、方法、およびプログラム

【課題】フレームレートと単位フレーム当たりの符号量の、映像品質に対するトレードオフが考慮された、具体的で有用な品質設計・管理指針を得る。
【解決手段】映像メディアに関する単位時間当たりの符号化ビット数を示す入力符号化ビットレート221Aと、単位時間当たりのフレーム数を示す入力フレームレート221Bを入力として、これら主パラメータ221に対する主観映像品質を推定する際、推定モデル特定部212により、入力フレームレート221Bに基づいて映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデル222を特定し、特定された推定モデル222を用いて入力符号化ビットレート221Aに対応する主観映像品質を推定し主観映像品質推定値223として出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像通信技術に関し、特に複数のフレームに符号化した映像メディアを端末で受信再生した際に視聴者が実感する主観映像品質を推定する映像品質推定技術に関する。
【背景技術】
【0002】
インターネットアクセス回線の高速・広帯域化に伴い、インターネットを介して映像さらには音声を含む映像メディアを端末間あるいはサーバ−端末間で転送する映像通信サービスの普及が期待されている。
この種の映像通信サービスでは、映像メディアの転送効率を改善するため、映像メディアが持つ画素間あるいは画像間の自己相関性や人間の視覚特性を利用して、映像メディアを複数のフレームに符号化して転送するという符号化通信方式が用いられる。
【0003】
一方、映像通信サービスに利用されるインターネットなどのベスト・エフォート型ネットワークでは、必ずしも通信品質が保証されているわけではない。このため、インターネットを介して映像メディアなどの時間的連続性を有するストリーミング系コンテンツを転送する際、通信回線の帯域が狭い場合や通信回線が輻輳した場合には、通信回線を介して受信再生した映像メディアに対して視聴者が実感する品質、すなわち主観映像品質の劣化として知覚されやすい。また、アプリケーションによる符号化により、映像に符号化歪みが加わり、主観映像品質の劣化として知覚されやすい。具体的には、映像メディアに品質劣化が加わると、映像のぼけ、にじみ、モザイク状の歪み、ぎくしゃく感として知覚される。
【0004】
このように、映像メディアを転送する映像通信サービスでは、品質劣化が知覚されやすく、映像通信サービスを良好な品質で提供するためには、サービス提供に先立ったアプリケーションおよびネットワークの品質設計やサービス開始後の品質管理が重要となる。したがって、視聴者が享受する映像品質を適切に表現でき、しかも簡便かつ効率的な映像品質評価技術が必要とされる。
【0005】
従来、このようなストリーミング系コンテンツの1つである音声メディアの品質を推定する技術として、ITU−T勧告P.862(International Telecommunication Union-Telecommunication Standardization Sector)において、音声信号を入力とする音声品質客観評価法PESQ(Perceptual Evaluation of Speech Quality)が規定されている。また、ITU−T勧告G.107において、音声品質パラメータを入力とする音声品質推定法が記載されており、VoIP(Voice over IP)での品質設計に利用されている。
【0006】
一方、映像メディアの品質を推定する技術としては、映像信号を入力とする映像品質客観評価法が勧告として提案されている(例えば、非特許文献1など参照)。また、映像品質パラメータを入力とする映像品質推定を行うものも提案されている(例えば、非特許文献2など参照)。これによれば、映像品質と各映像品質パラメータの関係から映像品質を定式化し、これら積の線形和により映像品質を定式化している。また、符号化パラメータとパケット損失を考慮した品質推定モデルも提案されている(例えば、非特許文献3など参照)。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】ITU−T勧告J.144
【非特許文献2】山岸,林、「映像コミュニケーションサービスに対する表示サイズ・解像度を考慮した映像品質推定モデル」、社団法人電子情報通信学会、信学技法CQ2005-60、2005/09、pp.61-64
【非特許文献3】荒山,北脇,山田、「符号化パラメータとパケット損失を考慮したAV通信品質の推定モデル」、社団法人電子情報通信学会、信学技法CQ2005-77、2005/11、pp.57-60
【発明の概要】
【発明が解決しようとする課題】
【0008】
アプリケーションおよびネットワークの品質設計や品質管理では、映像通信サービスに関する各種条件に対応する、具体的で有用な品質設計・管理指針が必要となる。特に、映像通信サービスの映像品質を左右する多くの要因すなわち映像品質パラメータが存在するため、これら映像品質パラメータが、映像品質にどのような影響を与えるか、どの映像品質パラメータを改善すれば映像品質がどの程度よくなるかという品質設計・管理指針を得ることが重要となる。
【0009】
映像品質に大きな影響を与える要因として、映像メディアに対する符号化処理の内容を示す符号化ビットレートとフレームレートがある。符号化ビットレートは、映像メディアに関する単位時間当たりの符号化ビット数を示す値であり、フレームレートは、映像メディアに関する単位時間当たりのフレーム数を示す値である。
【0010】
ある符号化ビットレートで映像を符号化して提供する際、高いフレームレートで映像を符号化すると映像が滑らかになって時間的な映像品質を向上できるが、単位フレーム当たりの符号量が低減して空間的な映像劣化が顕著となり、結果として映像品質が低下する場合がある。また、単位フレーム当たりの符号量を高くして符号化すると空間的な映像劣化が改善されて映像品質は向上するが、単位時間当たりのフレーム数が低減して時間的にぎくしゃくしコマ飛び状態となり、結果として映像品質が劣化する場合がある。
【0011】
したがって、これら単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して、これら符号化ビットレートとフレームレートをそれぞれどの程度に設定すると、どの程度の映像品質が得られるか、という具体的で有用な品質設計・管理指針が、サービス提供に先立ったネットワークの品質設計やサービス開始後の品質管理において重要となる。
【0012】
しかしながら、前述の非特許文献1に記載されている、映像信号を入力とする客観品質評価法では、映像の特徴量すなわち空間的および時間的歪みから算出される特徴量を考慮して映像品質を推定している。このため、映像通信サービスの映像品質を左右する多くの要因すなわち各映像品質パラメータが、映像品質に対してどのような影響を与えているか不明確であるため、どの映像品質パラメータを改善すれば映像品質がどの程度よくなるか、という品質設計・管理指針を得ることができない。
【0013】
また、前述の非特許文献2および非特許文献3には、映像品質パラメータを入力とする映像品質推定法が記載されているが、単位フレーム当たりの符号量とフレームレートの映像品質に対するトレードオフが考慮されておらず、アプリケーションおよびネットワークの品質設計や品質管理において具体的で有用な品質設計・管理指針を得ることができない、という問題点がある。
【0014】
また、非特許文献2は、映像品質と各映像品質パラメータの関係から映像品質を定式化しているが、各符号化ビットレートに対する最適フレームレートを適切に算出することができず、映像品質を適切に推定できないという問題点がある。
また、非特許文献3は、符号化ビットレートとパケット損失の関係から映像品質を定式化した映像品質推定法であり、時間的劣化の一要因であるフレームレートが考慮されていないといった問題点がある。さらに、映像品質は符号化ビットレートの増加に伴い、任意の最大値に収束する特性を有しているのに対して、非特許文献3では、映像品質を二次関数で推定しているため、ある符号化ビットレート以上になると映像品質の低下を招く推定モデルとなり、上記特性と反する結果を示している。
【0015】
本発明はこのような課題を解決するためのものであり、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフが考慮された、具体的で有用な品質設計・管理指針を得ることができる映像品質推定装置、方法、およびプログラムを提供することを目的としている。
【課題を解決するための手段】
【0016】
このような目的を達成するために、本発明にかかる映像品質推定装置は、複数のフレームに符号化した映像メディアに関する、単位時間当たりの符号化ビット数を示す入力符号化ビットレートおよび単位時間当たりのフレーム数を示す入力フレームレートを取得するパラメータ取得部と、入力フレームレートに基づいて入力符号化ビットレートと主観映像品質との関係を示す推定モデルを特定する推定モデル特定部と、特定された推定モデルを用いて入力符号化ビットレートに対応する主観映像品質を推定し、通信網を介して任意の端末で受信し再生した映像メディアから視聴者が実感する主観映像品質の推定値として出力する映像品質推定部とを備え、推定モデル特定部は、入力フレームレートで送信された映像メディアの主観映像品質の最良値を示す最良映像品質を算出する最良映像品質算出部と、入力フレームレートで送信された映像メディアの主観映像品質に関する変化度合いを示す映像品質第1変化指標を算出する映像品質第1変化指標算出部と、入力フレームレートで送信された映像メディアの主観映像品質に関する変化度合いを示す映像品質第2変化指標を算出する映像品質第2変化指標算出部と、最良映像品質、映像品質第1変化指標、および映像品質第2変化指標を含む推定モデル特定パラメータに基づいて推定モデルを生成する推定モデル生成部とを備えている。
【0017】
また、本発明にかかる映像品質推定方法は、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、端末で再生された当該映像メディアから視聴者が実感する主観映像品質の推定値を所定の推定モデルを用いて算出する映像品質推定装置で用いられる映像品質推定方法であって、パラメータ取得部が、映像メディアに関する、単位時間当たりの符号化ビット数を示す入力符号化ビットレートおよび単位時間当たりのフレーム数を示す入力フレームレートを取得するパラメータ取得ステップと、推定モデル特定部が、入力フレームレートに基づいて入力符号化ビットレートと主観映像品質との関係を示す推定モデルを特定する推定モデル特定ステップと、映像品質推定部が、特定された推定モデルを用いて入力符号化ビットレートに対応する主観映像品質を推定し推定値として出力する映像品質推定ステップとを備え、推定モデル特定ステップは、入力フレームレートで送信された映像メディアの主観映像品質の最良値を示す最良映像品質を算出する最良映像品質算出ステップと、入力フレームレートで送信された映像メディアの主観映像品質に関する変化度合いを示す映像品質第1変化指標を算出する映像品質第1変化指標算出ステップと、入力フレームレートで送信された映像メディアの主観映像品質に関する変化度合いを示す映像品質第2変化指標を算出する映像品質第2変化指標算出ステップと、最良映像品質、映像品質第1変化指標、および映像品質第2変化指標を含む推定モデル特定パラメータに基づいて推定モデルを生成する推定モデル生成ステップとを備えている。
【0018】
また、本発明にかかるプログラムは、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、端末で再生された当該映像メディアから視聴者が実感する主観映像品質の推定値を所定の推定モデルを用いて算出する映像品質推定装置のコンピュータに、パラメータ取得部が、映像メディアに関する、単位時間当たりの符号化ビット数を示す入力符号化ビットレートおよび単位時間当たりのフレーム数を示す入力フレームレートを取得するパラメータ取得ステップと、推定モデル特定部が、入力符号化ビットレートに基づいて入力フレームレートと主観映像品質との関係を示す推定モデルを特定する推定モデル特定ステップと、映像品質推定部が、特定された推定モデルを用いて入力フレームレートに対応する主観映像品質を推定し推定値として出力する映像品質推定ステップとを実行させ、推定モデル特定ステップは、入力符号化ビットレートで送信された映像メディアの主観映像品質が最良となるフレームレートを示す最適フレームレートを算出する最適フレームレート算出ステップと、入力符号化ビットレートで送信された映像メディアの主観映像品質の最良値を示す最良映像品質を算出する最良映像品質算出ステップと、最適フレームレートと最良映像品質とを含む推定モデル特定パラメータに基づいて推定モデルを生成する推定モデル生成ステップとを備えている。
【発明の効果】
【0019】
本発明によれば、映像メディアに関する単位時間当たりの符号化ビット数を示す入力符号化ビットレートと、単位時間当たりのフレーム数を示す入力フレームレートを入力として、これら主パラメータに対する主観映像品質を推定する際、推定モデル特定部により、入力フレームレートに基づいて映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデルが特定され、この推定モデルを用いて入力符号化ビットレートに対応する主観映像品質が推定される。
【0020】
これにより、推定条件として入力された入力フレームレートに対応する推定モデルを参照して、同じく推定条件として入力された入力符号化ビットレートに対応する映像品質推定値を得ることができる。
したがって、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して、これら符号化ビットレートとフレームレートをそれぞれどの程度に設定すると、どの程度の映像品質が得られるか、という具体的で有用な品質設計・管理指針を得ることができ、サービス提供に先立ったアプリケーションおよびネットワークの品質設計やサービス開始後の品質管理に大いに役立てることができる。
【図面の簡単な説明】
【0021】
【図1】図1は、本発明の第1の実施の形態にかかる映像品質推定装置の構成を示すブロック図である。
【図2】図2は、本発明の第1の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図である。
【図3】図3は、映像通信サービスにおける映像メディアのフレームレート−主観映像品質特性を示すグラフである。
【図4】図4は、符号化ビットレート−最適フレームレート特性を示すグラフである。
【図5】図5は、符号化ビットレート−最良映像品質特性を示すグラフである。
【図6】図6は、ガウス関数を示す説明図である。
【図7】図7は、ガウス関数でモデル化されたフレームレート−主観映像品質特性を示す説明図である。
【図8】図8は、符号化ビットレート−映像品質劣化指標特性を示すグラフである。
【図9】図9は、本発明の第1の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートである。
【図10】図10は、推定モデル特定パラメータ情報の構成例である。
【図11】図11は、本発明の第2の実施の形態にかかる映像品質推定装置の構成を示すブロック図である。
【図12】図12は、本発明の第2の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図である。
【図13】図13は、係数DBの構成例を示す説明図である。
【図14】図14は、ロジスティック関数を示す説明図である。
【図15】図15は、ロジスティック関数でモデル化された符号化ビットレート−最良映像品質特性を示す説明図である。
【図16】図16は、本発明の第2の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートである。
【図17】図17は、本実施の形態を適用した映像品質推定装置の推定精度を示すグラフである。
【図18】図18は、従来の映像品質推定装置の推定精度を示すグラフである。
【図19】図19は、本発明の第3の実施の形態にかかる映像品質推定装置の構成を示すブロック図である。
【図20】図20は、本発明の第3の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図である。
【図21】図21は、映像通信サービスにおける映像メディアの符号化ビットレート−主観映像品質特性を示すグラフである。
【図22】図22は、ロジスティック関数を示す説明図である。
【図23】図23は、ロジスティック関数でモデル化された符号化ビットレート−主観映像品質特性を示す説明図である。
【図24】図24は、フレームレート−最良映像品質特性を示すグラフである。
【図25】図25は、フレームレート−映像品質第1変化指標特性を示すグラフである。
【図26】図26は、フレームレート−映像品質第2変化指標特性を示すグラフである。
【図27】図27は、本発明の第3の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートである。
【図28】図28は、推定モデル特定パラメータ情報の構成例である。
【図29】図29は、本発明の第4の実施の形態にかかる映像品質推定装置の構成を示すブロック図である。
【図30】図30は、本発明の第4の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図である。
【図31】図31は、係数DBの構成例を示す説明図である。
【図32】図32は、本発明の第4の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートである。
【図33】図33は、本実施の形態を適用した映像品質推定装置の推定精度を示すグラフである。
【発明を実施するための形態】
【0022】
次に、本発明の実施の形態について図面を参照して説明する。
[第1の実施の形態]
まず、図1を参照して、本発明の第1の実施の形態にかかる映像品質推定装置について説明する。図1は、本発明の第1の実施の形態にかかる映像品質推定装置の構成を示すブロック図である。
この映像品質推定装置100は、入力された情報を演算処理するコンピュータなどの情報処理装置からなり、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、その映像メディアに関する推定条件を入力として、端末で再生された当該映像メディアから視聴者が実感する主観映像品質の推定値を所定の推定モデルを用いて算出する。
【0023】
本実施の形態は、映像メディアに関する単位時間当たりの符号化ビット数を示す入力符号化ビットレートと、単位時間当たりのフレーム数を示す入力フレームレートを入力として、これら主パラメータに対する主観映像品質を推定する際、入力符号化ビットレートに基づいて映像メディアのフレームレートと主観映像品質との関係を示す推定モデルを特定し、特定された推定モデルを用いて入力フレームレートに対応する主観映像品質を推定し推定値として出力するようにしたものである。
【0024】
[映像品質推定装置]
次に、図1および図2を参照して、本発明の第1の実施の形態にかかる映像品質推定装置の構成について詳細に説明する。図2は、本発明の第1の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図である。
【0025】
映像品質推定装置100には、主な機能部として、パラメータ取得部111、推定モデル特定部112、および映像品質推定部113が設けられている。これら機能部は、専用の演算処理回路部で実現してもよいが、CPUなどのマイクロプロセッサとその周辺回路を設け、予め用意されているプログラムを読み込んでマイクロプロセッサで実行することにより、上記ハードウェアとプログラムを協働させることにより上記機能部を実現してもよい。また、これら機能部で用いられる処理情報はメモリやハードディスクなどの記憶装置からなる後述の各記憶部で記憶され、これら機能部間でやり取りされる処理情報は同じく記憶装置からなる記憶部(図示せず)を介してやり取りされる。また、上記プログラムを記憶部に格納しておいてもよい。この他、映像品質推定装置100には、一般的な情報処理装置と同様に、記憶装置、操作入力装置、画面表示装置などの各種基本的構成が設けられている。
【0026】
パラメータ取得部111は、評価対象となる映像通信サービスに関する各種の推定条件110を取得する機能と、推定条件110から映像メディアの符号化処理に関するフレームレートと符号化ビットレートを抽出する機能と、これらを入力フレームレートfr(121A)および入力符号化ビットレートbr(121B)からなる主パラメータ121として出力する機能とを有している。推定条件110については、キーボードなどの操作入力装置を用いてオペレータ操作により入力してもよく、データ入出力を行うデータ入出力装置を用いて外部装置、記録媒体、あるいは通信網から取得してもよく、さらには実際の映像通信サービスから計測してもよい。
【0027】
推定モデル特定部112は、パラメータ取得部111から出力された主パラメータ121の入力符号化ビットレート121Bに基づいて、映像メディアのフレームレートと主観映像品質との関係を示す推定モデル122を特定するための推定モデル特定パラメータ132を算出する機能を有している。
映像品質推定部113は、推定モデル特定部112で特定された推定モデル122を参照して、主パラメータ121の入力フレームレート121Aに対応する主観映像品質を推定し、所望の主観映像品質推定値123として出力する機能を有している。
【0028】
推定モデル特定部112は、図2に示すように、さらにいくつかの機能部から構成されている。主な機能部としては、推定モデル特定パラメータ132を算出する部として、最適フレームレート算出部112A、最良映像品質算出部112B、映像品質劣化指標算出部112C、および推定モデル生成部112Dがある。
推定モデル特定パラメータ132は、推定モデル122として用いる関数の形状を特定する値からなる。本実施の形態では、少なくとも以下の最適フレームレートと最良映像品質を推定モデル特定パラメータ132として用いているが、映像品質劣化指標に代表される他のパラメータを推定モデル特定パラメータ132に加えてもよい。
【0029】
最適フレームレート算出部112Aは、記憶部(第1の記憶部)131Mの符号化ビットレート−最適フレームレート特性131Aを参照して、入力符号化ビットレートbr(121B)で送信された映像メディアの主観映像品質が最良となるフレームレートを示す最適フレームレートofr(br)(132A)を、推定モデル特定パラメータ132の1つとして算出する機能を有している。
最良映像品質算出部112Bは、記憶部131Mの符号化ビットレート−最良映像品質特性131Bを参照して、入力符号化ビットレート121Bで送信された映像メディアの主観映像品質の最良値を示す最良映像品質α(br)(132B)を、推定モデル特定パラメータ132の1つとして算出する機能を有している。
【0030】
映像品質劣化指標算出部112Cは、記憶部131Mの符号化ビットレート−映像品質劣化指標特性131Cを参照して、入力符号化ビットレート121Bで送信された映像メディアに関する、その主観映像品質の最良値を示す最良映像品質132Bからの劣化度合いを示す映像品質劣化指標ω(br)(132C)を、推定モデル特定パラメータ132の1つとして算出する機能を有している。
これら、符号化ビットレート−最適フレームレート特性131A、符号化ビットレート−最良映像品質特性131B、および符号化ビットレート−映像品質劣化指標特性131Cは、推定モデル特定パラメータ導出特性131として予め用意され、記憶部131M(第1の記憶部)に記憶されている。
【0031】
推定モデル生成部112Dは、最適フレームレート算出部112Aで算出された最適フレームレートofr(br)、最良映像品質算出部112Bで算出された最良映像品質α(br)、および映像品質劣化指標算出部112Cで算出された映像品質劣化指標ω(br)からなる各推定モデル特定パラメータ132の値を所定の関数式に代入することにより、主パラメータ121の入力フレームレート121Aに対応する主観映像品質を推定するための推定モデル122を生成する機能を有している。
【0032】
[主観映像品質特性]
次に、図3を参照して、映像通信サービスにおける映像メディアの主観映像品質特性について説明する。図3は、映像通信サービスにおける映像メディアのフレームレート−主観映像品質特性を示すグラフである。図3において、横軸はフレームレートfr(fps)、縦軸は主観映像品質値MOS(fr,br)(MOS値)を示し、符号化ビットレートbrごとの特性が示されている。
【0033】
映像メディアの主観映像品質に対して、単位フレーム当たりの符号量とフレームレートはトレードオフの関係にある。
具体的には、ある符号化ビットレートで映像を符号化して提供する際、高いフレームレートで映像を符号化すると映像が滑らかになって時間的な映像品質を向上できるが、単位フレーム当たりの符号量が低減して空間的な映像劣化が顕著となり、結果として映像品質が低下する場合がある。また、単位フレーム当たりの符号量を高くして符号化すると空間的な映像劣化が改善されて映像品質は向上するが、単位時間当たりのフレーム数が低減して時間的にぎくしゃくしコマ飛び状態となり、結果として映像品質が劣化する場合がある。
【0034】
したがって、図3に示すように、各符号化ビットレートに対して、映像品質が最大すなわち最良映像品質となる最適なフレームレートすなわち最適フレームレートが存在し、最適フレームレートを超えてフレームレートを増加させても映像品質が改善されない特性を持つことがわかる。例えば、符号化ビットレートbr=256[kbbs]の場合、主観映像品質特性は、フレームレートfr=10[fps]のときの最良映像品質=3[MOS]を頂点として凸型をなす特性となる。
【0035】
また、このような主観映像品質特性は、異なる符号化ビットレートであっても同様の形状となり、各主観映像品質特性の座標位置は、その頂点すなわち最適フレームレートと最良映像品質からなる推定モデル特定パラメータで特定することができる。
本実施の形態は、このような主観映像品質特性の性質に着目して、推定モデル特定部112により、入力符号化ビットレート121Bに基づいて映像メディアのフレームレートと主観映像品質との関係を示す推定モデル122を特定し、映像品質推定部113により、推定モデル特定部112で特定された推定モデル122を用いて入力フレームレート121Aに対応する主観映像品質推定値123を推定している。
【0036】
[推定モデル特定パラメータの導出]
次に、推定モデル特定部112における推定モデル特定パラメータの導出について詳細に説明する。
推定モデル特定部112により、入力符号化ビットレート121Bに基づいて映像メディアのフレームレートと主観映像品質との関係を示す推定モデル122を特定する場合、入力符号化ビットレート121Bに対応する推定モデル特定パラメータとして、最適フレームレート132Aと最良映像品質132Bを導出する必要がある。
本実施の形態では、次のような符号化ビットレート−最適フレームレート特性131Aや符号化ビットレート−最良映像品質特性131Bを推定モデル特定パラメータ導出特性131として予め用意しておき、これら特性を参照して、入力符号化ビットレート121Bに対応する推定モデル特定パラメータ132を導出している。
【0037】
図3に示された各特性のうち、映像メディアが最良映像品質で再生されている場合の符号化ビットレートとそのときのフレームレートすなわち最適フレームレートの関係は、符号化ビットレートの増加とともに最適フレームレートが単調増加し、その後ある最大フレームレートに収束する。
図4は、このような符号化ビットレート−最適フレームレート特性を示すグラフである。図4において、横軸は符号化ビットレートbr(kbps)、縦軸は最適フレームレートofr(br)(fps)を示している。
【0038】
一方、図3に示された各特性のうち、映像メディアが最適フレームレートで送信された場合の符号化ビットレートと映像品質すなわち最良映像品質の関係は、符号化ビットレートの増加とともに映像品質が増加し、ある最大値(最大主観映像品質値)に収束するとともに、符号化ビットレートの低下とともに映像品質も低下し、ある最小値に収束する、という傾向が見られる。
図5は、このような符号化ビットレート−最良映像品質特性を示すグラフである。図5において、横軸は符号化ビットレートbr(kbps)、縦軸は最良映像品質α(br)を示している。なお、映像品質は、「1」を基準値として最大「5」までの値をとるMOS値で表されるのに対し、推定モデル122の最良映像品質α(br)として用いる場合には「0」を基準値として最大「4」までの値をとるが、両者は基準値が違うだけでその尺度は実質的に同じものであり、以下では特に区別しない。
【0039】
この符号化ビットレート−最良映像品質特性によれば、高い符号化ビットレートを設定しても、ある符号化ビットレートにおいて映像品質が飽和しており、符号化ビットレートを必要以上に高くしても視聴者が視覚的に映像品質の向上を検知することができない、という人間の視覚特性と一致する。また、符号化ビットレートを下げすぎると映像品質の劣化が顕著となり、結果として最低映像品質に収束している。これは、例えば人物の顔が画面内で移動しているような映像では、目や鼻の輪郭がぼけて平坦になり、顔自体を認識できなくなる、という実際の現象と一致している。
【0040】
[推定モデル]
次に、推定モデル特定部112で用いる推定モデルとその特定方法について詳細に説明する。
推定モデル特定パラメータ132である最適フレームレート132Aと最良映像品質132Bを頂点とする凸型の特性を関数で表す場合、図6に示すようなガウス関数を利用できる。図6は、ガウス関数を示す説明図である。
ガウス関数は、頂点Pを最大値として左右に減衰する凸型を示す関数であり、その頂点Pのx座標と最大振幅を用いて関数式を表現できる。頂点Pのx座標をxcとし、最大振幅をAとし、y軸の基準値(最低値)をy0とし、凸型特性の開き幅を示す係数をωとした場合、任意の変数xに対する関数yの値は、次のような式(1)で求められる。
【0041】
【数1】

【0042】
したがって、変数xを映像メディアのフレームレートの対数値とし、関数値yを主観映像品質とし、頂点Pの変数xを符号化ビットレートに対応する最適フレームレートの対数値とし、最大振幅Aを符号化ビットレートに対応する最良映像品質α(br)とした場合、任意のフレームレートに対する主観映像品質は、次の式(2)で求めることができ、結果として、入力符号化ビットレート121Bに対応する推定モデルすなわちフレームレート−主観映像品質特性を特定することができる。図7は、ガウス関数でモデル化されたフレームレート−主観映像品質特性を示す説明図である。
【0043】
【数2】

【0044】
この際、式(2)で用いるα(br)およびG(fr,br)は、「0」を基準値として最大「4」までの値をとるため、このG(fr,br)に「1」を加えることにより、MOS値(1〜5)で表現した実際の映像品質値となる。
【0045】
また、ガウス関数では、係数ωを用いて凸型特性の開き幅を特定しているが、符号化ビットレートに対応するフレームレート−主観映像品質特性ごとに異なる開き幅を用いる必要がある場合には、符号化ビットレートに応じた映像品質劣化指標ω(br)(132C)を用いればよい。
映像品質劣化指標ω(br)は、入力符号化ビットレート121Bで送信された映像メディアに関する、その主観映像品質の最良値を示す最良映像品質132Bからの劣化度合いを示す指標であり、ガウス関数の係数ωに相当する。
【0046】
図3に示された各特性のうち、符号化ビットレートと主観映像品質の劣化度合いの関係は、符号化ビットレートが高くなるほど劣化度合いが滑らかになり、符号化ビットレートが低くなるほど劣化度合いが大きくなる。したがって、符号化ビットレートと映像品質劣化指標の関係は、符号化ビットレートが高くなるほどフレームレート−主観映像品質特性の凸型の開き幅が大きくなって映像品質劣化指標も大きくなり、符号化ビットレートが低くなるほどフレームレート−主観映像品質特性の凸型の開き幅が小さくなって映像品質劣化指標も小さくなる傾向がある。
【0047】
図8は、このような符号化ビットレート−映像品質劣化指標特性を示すグラフである。図8において、横軸は符号化ビットレートbr(kbps)、縦軸は映像品質劣化指標ω(br)を示している。なお、図8は、ガウス関数で表現した推定モデルにおける符号化ビットレート−映像品質劣化指標特性であり、他の推定モデルを用いた場合には、その推定モデルに対応する係数を示す映像品質劣化指標の符号化ビットレート−映像品質劣化指標特性を用いればよい。
【0048】
なお、推定対象となる映像通信サービスによっては、個々の符号化ビットレートに対応するフレームレート−主観映像品質特性ごとに個別の開き幅を用いる必要がない場合もあり、各符号化ビットレートに対応するフレームレート−主観映像品質特性で共通化できる場合もある。したがって、このような場合には、映像品質劣化指標ω(br)として定数を用いることができる。
【0049】
[第1の実施の形態の動作]
次に、図9を参照して、本発明の第1の実施の形態にかかる映像品質推定装置の動作について説明する。図9は、本発明の第1の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートである。
【0050】
映像品質推定装置100は、オペレータからの指示操作や推定条件110の入力に応じて、図9の映像品質推定処理を開始する。なお、ここでは、推定モデル特定パラメータとして、最適フレームレート132Aおよび最良映像品質132Bに加え、映像品質劣化指標132Cを用いる場合を例として説明する。また、映像品質推定装置100には、前述した符号化ビットレート−最適フレームレート特性131A(図4参照)、符号化ビットレート−最良映像品質特性131B(図5参照)、および符号化ビットレート−映像品質劣化指標特性131C(図8参照)が予め用意され、関数式として記憶部131Mに記憶されているものとする。
【0051】
まず、パラメータ取得部111は、評価対象となる映像通信サービスに関する各種の推定条件110を取得し、推定条件110から映像メディアの符号化処理に関するフレームレートと符号化ビットレートを抽出し、これら入力フレームレートfr(121A)および入力符号化ビットレートbr(121B)を主パラメータ121として出力する(ステップS100)。
【0052】
推定モデル特定部112は、パラメータ取得部111から出力された主パラメータ121の入力符号化ビットレート121Bに基づいて映像メディアのフレームレートと主観映像品質との関係を示す推定モデル122を特定する。
具体的には、まず、最適フレームレート算出部112Aにより、記憶部131Mの符号化ビットレート−最適フレームレート特性131Aを参照して、入力符号化ビットレートbr(121B)に対応する最適フレームレートofr(br)(132A)を算出する(ステップS101)。
【0053】
続いて、推定モデル特定部112は、最良映像品質算出部112Bにより、記憶部131Mの符号化ビットレート−最良映像品質特性131Bを参照して、入力符号化ビットレートbr(121B)に対応する最良映像品質α(br)(132B)を算出する(ステップS102)。
同様にして、推定モデル特定部112は、映像品質劣化指標算出部112Cにより、記憶部131Mの符号化ビットレート−映像品質劣化指標特性131Cを参照して、入力符号化ビットレートbr(121B)に対応する映像品質劣化指標ω(br)(132C)を算出する(ステップS103)。
【0054】
このようにして各推定モデル特定パラメータ132を算出した後、推定モデル特定部112は、推定モデル生成部112Dにより、これら推定モデル特定パラメータ132の最適フレームレートofr(br)、最良映像品質α(br)、および映像品質劣化指標ω(br)の実際の値を前述した式(2)へ代入することにより、推定モデルMOS(fr,br)すなわちフレームレート−主観映像品質特性を特定する(ステップS104)。
【0055】
この後、映像品質推定装置100は、映像品質推定部113により、推定モデル特定部112で特定された推定モデル122を参照して、パラメータ取得部111から出力された主パラメータ121の入力フレームレート121Aに対応する映像品質を算出し、評価対象となる映像通信サービスを利用して端末で再生された映像メディアから視聴者が実感する主観映像品質推定値123として出力し(ステップS105)、一連の映像品質推定処理を終了する。
【0056】
このように、本実施の形態は、映像メディアに関する単位時間当たりの符号化ビット数を示す入力符号化ビットレート121Bと、単位時間当たりのフレーム数を示す入力フレームレート121Aを入力として、これら主パラメータ121に対する主観映像品質を推定する際、推定モデル特定部112により、入力符号化ビットレート121Bに基づいて映像メディアのフレームレートと主観映像品質との関係を示す推定モデル122を特定し、特定された推定モデル122を用いて入力フレームレート121Aに対応する主観映像品質を推定し推定値123として出力している。
【0057】
これにより、推定条件110として入力された入力符号化ビットレート121Bに対応する推定モデル122を参照して、同じく推定条件110として入力された入力フレームレート121Aに対応する主観映像品質推定値123を得ることができる。
したがって、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して、これら符号化ビットレートとフレームレートをそれぞれどの程度に設定すると、どの程度の映像品質が得られるか、という具体的で有用な品質設計・管理指針を得ることができ、サービス提供に先立ったアプリケーションおよびネットワークの品質設計やサービス開始後の品質管理に大いに役立てることができる。
【0058】
例えば、所望の映像品質で映像メディアを配信したい場合、本実施の形態にかかる映像品質推定装置100を用いれば、カメラで撮影した映像をどの程度の符号化ビットレートとフレームレートで符号化すれば所望の映像品質を満足するかを具体的に把握することができる。特に、ネットワークの制約条件により、符号化ビットレートが制限される場合が多く、このような場合には、当該符号化ビットレートを固定化して本実施の形態にかかる映像品質推定装置100を適用すれば、フレームレートと映像品質との関係を容易かつ具体的に把握できる。
【0059】
本実施の形態では、推定モデル特定パラメータ132を算出する際に用いる、符号化ビットレート−最適フレームレート特性131A、符号化ビットレート−最良映像品質特性131B、および符号化ビットレート−映像品質劣化指標特性131Cが予め関数式の形で用意され記憶部131Mで記憶されている場合を例として説明したが、推定モデル特定パラメータの導出に用いるこれら推定モデル特定パラメータ導出特性131については関数式に限定されるものではなく、入力符号化ビットレートに対応する値として記憶部131Mで記憶しておいてもよい。
【0060】
図10は、入力符号化ビットレートと各推定モデル特定パラメータとの対応関係を示す推定モデル特定パラメータ情報の構成例である。この推定モデル特定パラメータ情報は、入力符号化ビットレートbr(121B)と、これに対応する最適フレームレートofr(br)(132A)、最良映像品質α(br)(132B)、および映像品質劣化指標ω(br)(132C)との組からなり、予め上記推定モデル特定パラメータ導出特性131に基づき算出して記憶部131Mに記憶されている。
このような推定モデル特定パラメータ情報を参照して、入力符号化ビットレート121Bに対応する推定モデル特定パラメータ132を導出してもよい。
【0061】
[第2の実施の形態]
次に、図11および図12を参照して、本発明の第2の実施の形態にかかる映像品質推定装置について説明する。図11は、本発明の第2の実施の形態にかかる映像品質推定装置の構成を示すブロック図であり、前述した図1と同じまたは同等部分には同一符号を付してある。図12は、本発明の第2の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図であり、前述した図2と同じまたは同等部分には同一符号を付してある。
【0062】
第1の実施の形態では、予め用意されている推定モデル特定パラメータ導出特性131を参照して入力符号化ビットレートに対応する推定モデル特定パラメータ132を導出する場合を例として説明した。本実施の形態では、評価対象となる映像通信サービスに関する各種の推定条件110のうち、映像通信サービスの通信種別、映像メディアを再生する端末の再生性能、あるいは映像メディアを再生する端末の再生環境に基づいて、推定条件110に応じた推定モデル特定パラメータ導出特性131を逐次特定する場合について説明する。
【0063】
第1の実施の形態(図1参照)と比較して、本実施の形態にかかる映像品質推定装置100には、係数取得部114と係数データベース(以下、係数DBという)125が追加されている。
係数取得部114は、記憶部125M(第2の記憶部)の係数DB125を参照して、パラメータ取得部111により推定条件110から取得された副パラメータ124に対応する特性係数126を取得する機能を有している。
【0064】
図13は、係数DBの構成例を示す説明図である。係数DB125は、各種副パラメータ124とこれに対応する各特性係数a,b,c,…,g(126)との組を示すデータベースである。副パラメータ124には、映像通信サービスの通信種別を示す通信種別パラメータ124A、映像メディアを再生する端末の再生性能を示す再生性能パラメータ124B、あるいは映像メディアを再生する端末の再生環境を示す再生環境パラメータ124Cがある。
【0065】
通信種別パラメータ124Aの具体例としては、評価対象となる映像通信サービスで行われる通信種別を示す「タスク」がある。
再生性能パラメータ124Bの具体例としては、映像メディアの符号化に関する「符号化方式」、「映像フォーマット」、「キーフレーム」のほか、端末でのメディア再生機能に関する「モニタサイズ」、「モニタ解像度」などがある。
再生環境パラメータ124Cの具体例としては、端末でのメディア再生の際の「室内照度」などがある。
【0066】
副パラメータ124は、これらパラメータ例に限定されるものではなく、評価対象となる映像通信サービスや映像メディアの内容に応じて任意に取捨選択すればよく、少なくともこれら通信種別パラメータ124A、再生性能パラメータ124B、および再生環境パラメータ124Cのうちの1つ以上から構成されていればよい。
【0067】
係数取得部114は、予め用意された記憶部125Mの係数DB125を参照して、副パラメータ124に対応する特性係数126を取得する。特性係数126は、推定モデル特定パラメータ132の導出に用いる推定モデル特定パラメータ導出特性を特定するための係数である。
推定モデル特定部112は、係数取得部114で取得された特性係数126により特定された推定モデル特定パラメータ導出特性131、すなわち符号化ビットレート−最適フレームレート特性131A、符号化ビットレート−最良映像品質特性131B、および符号化ビットレート−映像品質劣化指標特性131Cを特定する。
【0068】
[推定モデル特定パラメータ導出特性]
次に、推定モデル特定部112で用いる推定モデル特定パラメータ導出特性131について詳細に説明する。
推定モデル特定パラメータ導出特性131は、係数取得部114により係数DB125から取得される特性係数126を用いてそれぞれ次のようにモデル化することができる。
【0069】
まず、推定モデル特定パラメータ導出特性131の符号化ビットレート−最適フレームレート特性131Aは、前述した図4に示すように、符号化ビットレートの増加とともに最適フレームレートが単調増加し、その後ある最大フレームレートに収束する傾向があり、例えば一般的な線形関数でモデル化することができる。したがって、符号化ビットレートをbrとし、これに対応する最適フレームレートをofr(br)とし、係数をa,bとした場合、符号化ビットレート−最適フレームレート特性131Aは、次の式(3)で表すことができる。
【0070】
【数3】

【0071】
次に、推定モデル特定パラメータ導出特性131の符号化ビットレート−最良映像品質特性131Bは、前述した図5に示すように、符号化ビットレートの増加とともに映像品質が増加し、ある最大値に収束するとともに、符号化ビットレートの低下とともに映像品質も低下し、ある最小値に収束する傾向があり、例えば一般的なロジスティック(Logistic)関数でモデル化することができる。
【0072】
図14は、ロジスティック関数を示す説明図である。ロジスティック関数は、係数p>1のとき変数xの増加に応じて関数yの値が単調増加する関数であり、変数xの減少に応じて関数値yが最小値へ収束し、変数xの増大に応じて関数値yが最大値へ収束する。最小値をA1、最大値をA2、係数をp,x0とした場合、任意の変数xに対する関数yの値は、最大値A2の項と最大値A2からの減少分を示す分数項からなる、次の式(4)で求められる。
【0073】
【数4】

【0074】
したがって、変数xを符号化ビットレートbrとし、これに対応する関数値yを最良映像品質α(br)とし、最大値A2を特性係数c、最小値A1を「0ゼロ」、係数x0を特性係数d、係数pを特性係数eとした場合、符号化ビットレート−最良映像品質特性131Bは、次の式(5)で表すことができる。図15は、ロジスティック関数でモデル化された符号化ビットレート−最良映像品質特性を示す説明図である。
【0075】
【数5】

【0076】
次に、推定モデル特定パラメータ導出特性131の符号化ビットレート−映像品質劣化指標特性131Cは、前述した図8に示すように、符号化ビットレートが高くなるほど映像品質劣化指標も大きくなり、符号化ビットレートが低くなるほど映像品質劣化指標も小さくなる傾向があり、例えば一般的な線形関数でモデル化することができる。したがって、符号化ビットレートをbrとし、これに対応する映像品質劣化指標をω(br)とし、係数をf,gとした場合、符号化ビットレート−映像品質劣化指標特性131Cは、次の式(6)で表すことができる。
【0077】
【数6】

【0078】
なお、推定モデル特定パラメータ導出特性131のモデル化については、前述した線形関数やロジスティック関数に限定されるものではなく、他の関数を用いてもよい。例えば、評価対象となる映像通信サービスや映像メディアの内容、ネットワーク性能、あるいは推定条件110の内容によっては、ある程度限定された範囲の入力符号化ビットレートや入力フレームレートでの映像品質推定処理で十分なため、このような局所的な見方が可能な場合には、前述したように、推定モデル特定パラメータ導出特性131を線形関数等の単純な関数でモデル化することができる。
【0079】
これに対して、入力符号化ビットレートや入力フレームレートに対して推定モデル特定パラメータの変化が大きい場合には、例えば指数関数などの他の関数を用いて符号化ビットレート−最適フレームレート特性131Aを表してもよい。指数関数を用いてモデル化した場合、最適フレームレートofr(br)および映像品質劣化指標ω(br)は、係数をh,i,j,k,l,mとして、式(7)で表すことができる。
【0080】
【数7】

【0081】
[第2の実施の形態の動作]
次に、図16を参照して、本発明の第2の実施の形態にかかる映像品質推定装置の動作について説明する。図16は、本発明の第2の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートであり、前述した図9と同じまたは同等部分には同一符号を付してある。
【0082】
映像品質推定装置100は、オペレータからの指示操作や推定条件110の入力に応じて、図16の映像品質推定処理を開始する。なお、ここでは、推定モデル特定パラメータとして、最適フレームレート132Aおよび最良映像品質132Bに加え、映像品質劣化指標132Cを用いる場合を例として説明する。また、副パラメータ124として通信種別パラメータ124A、再生性能パラメータ124B、および再生環境パラメータ124Cを用いるものとし、記憶部125Mの係数DB125には、副パラメータ124と特性係数126との組が予め格納されているものとする。
【0083】
まず、パラメータ取得部111は、評価対象となる映像通信サービスに関する各種の推定条件110を取得し、推定条件110から映像メディアの符号化処理に関するフレームレートと符号化ビットレートを抽出し、これら入力フレームレートfr(121A)および入力符号化ビットレートbr(121B)を主パラメータ121として出力する(ステップS100)。また、パラメータ取得部111は、推定条件110から通信種別パラメータ124A、再生性能パラメータ124B、および再生環境パラメータ124Cを抽出し、これらを副パラメータ124として出力する(ステップS110)。
【0084】
次に、係数取得部114は、記憶部125Mの係数DB125を参照して、副パラメータ124の値に対応する特性係数a,b,c,…,g(126)を取得して出力する(ステップS111)。
これに応じて推定モデル特定部112は、最適フレームレート算出部112Aにより、特性係数126のうち係数a,bにより特定される符号化ビットレート−最適フレームレート特性131Aを参照して、入力符号化ビットレートbr(121B)に対応する最適フレームレートofr(br)(132A)を算出する(ステップS101)。
【0085】
また、推定モデル特定部112は、最良映像品質算出部112Bにより、特性係数126のうち係数c,d,eにより特定される符号化ビットレート−最良映像品質特性131Bを参照して、入力符号化ビットレートbr(121B)に対応する最良映像品質α(br)(132B)を算出する(ステップS102)。
同様にして、推定モデル特定部112は、映像品質劣化指標算出部112Cにより、特性係数126のうち係数f,gにより特定される符号化ビットレート−映像品質劣化指標特性131Cを参照して、入力符号化ビットレートbr(121B)に対応する映像品質劣化指標ω(br)(132C)を算出する(ステップS103)。
【0086】
このようにして各推定モデル特定パラメータ132を算出した後、推定モデル特定部112は、推定モデル生成部112Dにより、これら推定モデル特定パラメータ132の最適フレームレートofr(br)、最良映像品質α(br)、および映像品質劣化指標ω(br)の実際の値を前述した式(2)へ代入することにより、推定モデルMOS(fr,br)すなわちフレームレート−主観映像品質特性を特定する(ステップS104)。
【0087】
この後、映像品質推定装置100は、映像品質推定部113により、推定モデル特定部112で特定された推定モデル122を参照して、パラメータ取得部111から出力された主パラメータ121の入力フレームレート121Aに対応する映像品質を算出し、評価対象となる映像通信サービスを利用して端末で再生された映像メディアから視聴者が実感する主観映像品質の主観映像品質推定値123として出力し(ステップS105)、一連の映像品質推定処理を終了する。
【0088】
このように、本実施の形態は、パラメータ取得部111で取得された、通信種別パラメータ124A、再生性能パラメータ124B、および再生環境パラメータ124Cのうちの1つ以上からなる副パラメータ124に対応する特性係数126を、記憶部125Mの係数DB125から係数取得部114により取得し、推定モデル特定部112により、これら特性係数126により特定される推定モデル特定パラメータ導出特性131に基づいて、入力符号化ビットレート121Bに対応する推定モデル特定パラメータ132を算出するようにしたので、評価対象となる映像通信サービスや端末の具体的な性質に基づく推定モデル特定パラメータ132を導出することができ、映像品質推定の精度を向上させることができる。
【0089】
特に、従来技術では、映像品質を推定する場合、評価対象となる映像通信サービスで用いる符号化方式や端末ごとに、映像品質推定モデルを用意しなければならなかった。しかしながら、本実施の形態によれば、映像品質推定モデルが符号化方式や端末に依存せず、映像品質推定モデルに用いる係数を符号化方式や端末に応じて参照するだけで、同じ映像品質推定モデルを利用できる。したがって、異なる環境の映像通信サービスに対して柔軟に対応することができる。
【0090】
図17は、本実施の形態を適用した映像品質推定装置の推定精度を示すグラフである。図18は、文献2に基づく従来の映像品質推定装置の推定精度を示すグラフである。これら図17および図18において、横軸は映像品質推定装置を用いて推定した主観映像品質の推定値(MOS値)を示し、縦軸は視聴者が実際にオピニオン評価した主観映像品質の評価値(MOS値)を示している。図18に比較して、図17のほうが、評価値と推定値の誤差が少なく、推定精度が向上していることがわかる。なお、これらは特定の推定条件下での比較結果であるが、異なる符号化方式や端末を用いた場合でも、同様の比較結果が確認されている。
【0091】
[第3の実施の形態]
まず、図19を参照して、本発明の第3の実施の形態にかかる映像品質推定装置について説明する。図19は、本発明の第3の実施の形態にかかる映像品質推定装置の構成を示すブロック図である。
この映像品質推定装置200は、入力された情報を演算処理するコンピュータなどの情報処理装置からなり、複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、その映像メディアに関する推定条件を入力として、端末で再生された当該映像メディアから視聴者が実感する主観映像品質の推定値を所定の推定モデルを用いて算出する。
【0092】
本実施の形態は、映像メディアに関する単位時間当たりの符号化ビット数を示す入力符号化ビットレートと、単位時間当たりのフレーム数を示す入力フレームレートを入力として、これら主パラメータに対する主観映像品質を推定する際、入力フレームレートに基づいて映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデルを特定し、特定された推定モデルを用いて入力符号化ビットレートに対応する主観映像品質を推定し推定値として出力するようにしたものである。
【0093】
[映像品質推定装置]
次に、図19および図20を参照して、本発明の第3の実施の形態にかかる映像品質推定装置の構成について詳細に説明する。図20は、本発明の第3の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図である。
【0094】
映像品質推定装置200には、主な機能部として、パラメータ取得部211、推定モデル特定部212、および映像品質推定部213が設けられている。これら機能部は、専用の演算処理回路部で実現してもよいが、CPUなどのマイクロプロセッサとその周辺回路を設け、予め用意されているプログラムを読み込んでマイクロプロセッサで実行することにより、上記ハードウェアとプログラムを協働させることにより上記機能部を実現してもよい。また、これら機能部で用いられる処理情報はメモリやハードディスクなどの記憶装置からなる後述の各記憶部で記憶され、これら機能部間でやり取りされる処理情報は同じく記憶装置からなる記憶部(図示せず)を介してやり取りされる。また、上記プログラムを記憶部に格納しておいてもよい。この他、映像品質推定装置200には、一般的な情報処理装置と同様に、記憶装置、操作入力装置、画面表示装置などの各種基本的構成が設けられている。
【0095】
パラメータ取得部211は、評価対象となる映像通信サービスに関する各種の推定条件210を取得する機能と、推定条件210から映像メディアの符号化処理に関する符号化ビットレートとフレームレートを抽出する機能と、これらを入力符号化ビットレートbr(221A)および入力フレームレートfr(221B)からなる主パラメータ221として出力する機能とを有している。推定条件210については、キーボードなどの操作入力装置を用いてオペレータ操作により入力してもよく、データ入出力を行うデータ入出力装置を用いて外部装置、記録媒体、あるいは通信網から取得してもよく、さらには実際の映像通信サービスから計測してもよい。
【0096】
推定モデル特定部212は、パラメータ取得部211から出力された主パラメータ221の入力フレームレート221Bに基づいて、映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデル222を特定するための推定モデル特定パラメータ232を算出する機能を有している。
映像品質推定部213は、推定モデル特定部212で特定された推定モデル222を参照して、主パラメータ221の入力符号化ビットレート221Aに対応する主観映像品質を推定し、所望の主観映像品質推定値223として出力する機能を有している。
【0097】
推定モデル特定部212は、図20に示すように、さらにいくつかの機能部から構成されている。主な機能部としては、推定モデル特定パラメータ232を算出する部として、最良映像品質算出部212A、映像品質第1変化指標算出部212B、映像品質第2変化指標算出部212C、および推定モデル生成部212Dがある。
推定モデル特定パラメータ232は、推定モデル222として用いる関数の形状を特定する値からなる。本実施の形態では、少なくとも以下の最良映像品質、映像品質第1変化指標、および映像品質第2変化指標を推定モデル特定パラメータ232として用いているが、他のパラメータを推定モデル特定パラメータ232に加えてもよい。
【0098】
最良映像品質算出部212Aは、記憶部231M(第3の記憶部)のフレームレート−最良映像品質特性231Aを参照して、入力フレームレート221Bで送信された映像メディアの主観映像品質の最良値を示す最良映像品質β(fr)(232A)を、推定モデル特定パラメータ232の1つとして算出する機能を有している。
映像品質第1変化指標算出部212Bは、記憶部231Mのフレームレート−映像品質第1変化指標特性231Bを参照して、入力フレームレート221Bで送信された映像メディアに関する、その主観映像品質の最良値を示す最良映像品質232Aからの変化(劣化)度合いを示す映像品質第1変化指標s(fr)(232B)を、推定モデル特定パラメータ232の1つとして算出する機能を有している。
【0099】
映像品質第2変化指標算出部212Cは、記憶部231Mのフレームレート−映像品質第2変化指標特性231Cを参照して、入力フレームレート221Bで送信された映像メディアに関する、その主観映像品質の最良値を示す最良映像品質232Aからの変化(劣化)度合いを示す映像品質第2変化指標t(fr)(232C)を、推定モデル特定パラメータ232の1つとして算出する機能を有している。
これら、フレームレート−最良映像品質特性231A、フレームレート−映像品質第1変化指標特性231B、およびフレームレート−映像品質第2変化指標特性231Cは、推定モデル特定パラメータ導出特性231として予め用意され、記憶部231M(第3の記憶部)に記憶されている。
【0100】
推定モデル生成部212Dは、最良映像品質算出部212Aで算出された最良映像品質β(br)、映像品質第1変化指標算出部212Bで算出された映像品質第1変化指標s(fr)、および映像品質第2変化指標算出部212Cで算出された映像品質第2変化指標t(fr)からなる各推定モデル特定パラメータ232の値を所定の関数式に代入することにより、主パラメータ221の入力フレームレート221Bに対応する主観映像品質を推定するための推定モデル222を生成する機能を有している。
【0101】
[主観映像品質特性]
次に、図21を参照して、映像通信サービスにおける映像メディアの主観映像品質特性について説明する。図21は、映像通信サービスにおける映像メディアの符号化ビットレート−主観映像品質特性を示すグラフである。図21において、横軸は符号化ビットレートbr(kbps)、縦軸は主観映像品質値MOS(fr,br)(MOS値)を示し、フレームレートfrごとの特性が示されている。
【0102】
映像メディアの主観映像品質に対して、単位フレーム当たりの符号量とフレームレートはトレードオフの関係にある。
具体的には、ある符号化ビットレートで映像を符号化して提供する際、高いフレームレートで映像を符号化すると映像が滑らかになって時間的な映像品質を向上できるが、単位フレーム当たりの符号量が低減して空間的な映像劣化が顕著となり、結果として映像品質が低下する場合がある。また、単位フレーム当たりの符号量を高くして符号化すると空間的な映像劣化が改善されて映像品質は向上するが、単位時間当たりのフレーム数が低減して時間的にぎくしゃくしコマ飛び状態となり、結果として映像品質が劣化する場合がある。
【0103】
ここで、フレームレートをそれぞれ一定とした場合、そのときの映像品質は、図21に示すように、符号化ビットレートの増加に応じて単調増加し、当該フレームレートで送信された映像メディアの最良映像品質へ収束する特性を持つ。例えば、フレームレートfr=10[fbs]の場合、主観映像品質特性は、符号化ビットレートbrの増加に応じて単調増加し、符号化ビットレートbr=1000[kbps]付近で最良映像品質=3.8[MOS]に収束する特性となる。
【0104】
また、このような主観映像品質特性は、異なるフレームレートであっても同様の形状となり、各主観映像品質特性の座標位置は、その最良映像品質と最良映像品質に対する変化度合いを示す映像品質変化指標からなる推定モデル特定パラメータで特定することができる。
本実施の形態は、このような主観映像品質特性の性質に着目して、推定モデル特定部212により、入力フレームレート221Bに基づいて映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデル222を特定し、映像品質推定部213により、推定モデル特定部212で特定された推定モデル222を用いて入力符号化ビットレート221Aに対応する主観映像品質推定値223を推定している。
【0105】
[推定モデル]
次に、推定モデル特定部212で用いる推定モデルと推定モデル特定パラメータの導出について詳細に説明する。
図21に示した、符号化ビットレート−主観映像品質特性は、符号化ビットレートの増加に応じて単調増加し、当該フレームレートで送信された映像メディアの最良映像品質へ収束する特性を持つ傾向があり、例えば一般的なロジスティック(Logistic)関数でモデル化することができる。
【0106】
図22は、ロジスティック関数を示す説明図である。ロジスティック関数は、係数r>1のとき変数xの増加に応じて関数yの値が単調増加する関数であり、変数xの減少に応じて関数値yが最小値へ収束し、変数xの増大に応じて関数値yが最大値へ収束する。最小値をA3、最大値をA4、係数をq,rとした場合、任意の変数xに対する関数yの値は、最大値A4の項と最大値A4からの減少分を示す分数項からなる、次の式(8)で求められる。
【0107】
【数8】

【0108】
したがって、変数xを符号化ビットレートbrとし、これに対応する関数値yを主観映像品質MOS(fr,br)とし、最大値A4を入力フレームレートfrにおける最良映像品質β(fr)、最小値A3を「1」、係数qを映像品質第1変化指標s(fr)、係数rを映像品質第2変化指標t(fr)とした場合、任意の符号化ビットレートbrに対する主観映像品質MOSは、次の(9)式で求めることができ、結果として、入力フレームレート221Bに対応する推定モデル222すなわち符号化ビットレート−主観映像品質特性を特定することができる。図23は、ロジスティック関数でモデル化された符号化ビットレート−主観映像品質特性を示す説明図である。
【0109】
【数9】

【0110】
したがって、推定モデル特定部212により、入力フレームレート221Bに基づいて映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデル222を特定する場合、入力フレームレート221Bに対応する推定モデル特定パラメータとして、最良映像品質232A、映像品質第1変化指標232B、および映像品質第2変化指標232Cを導出する必要がある。特に、映像品質第1変化指標s(fr)および映像品質第2変化指標t(fr)は、ロジスティック関数の分数項において最大値A4からの減少分すなわち最良映像品質β(fr)からの変化(劣化)分を算出するために用いられており、それぞれ当該フレームレートfrにおける主観映像品質に関する変化度合いを示す変化指標として、推定モデル222の特定に必要となる。
【0111】
本実施の形態では、次のようなフレームレート−最良映像品質特性231A、フレームレート−映像品質第1変化指標特性231B、およびフレームレート−映像品質第2変化指標特性231Cを推定モデル特定パラメータ導出特性231として予め用意しておき、これら特性を参照して、入力フレームレート221Bに対応する推定モデル特定パラメータ232をそれぞれ導出している。
【0112】
図21に示された各特性において、送信された映像メディアのフレームレートとそのときの最良映像品質との関係は、フレームレートfrの増加とともにそれぞれ最良映像品質β(fr)が増加し、ある最大値(最大主観映像品質値)に収束する、という傾向が見られる。
図24は、このようなフレームレート−最良映像品質特性を示すグラフである。図24において、横軸はフレームレートfr(fps)、縦軸は最良映像品質β(fr)(MOS値)を示している。
【0113】
一方、送信された映像メディアのフレームレートとそのときの映像品質第1変化指標との関係は、フレームレートの増加とともにそれぞれ映像品質第1変化指標が単調増加する、という傾向が見られる。
図25は、このようなフレームレート−映像品質第1変化指標特性を示すグラフである。図25において、横軸はフレームレートfr(fps)、縦軸は映像品質第1変化指標s(fr)を示している。
【0114】
また、送信された映像メディアのフレームレートとそのときの映像品質第2変化指標との関係は、フレームレートの増加とともにそれぞれ映像品質第2変化指標が単調減少する、という傾向が見られる。
図26は、このようなフレームレート−映像品質第2変化指標特性を示すグラフである。図26において、横軸はフレームレートfr(fps)、縦軸は映像品質第2変化指標t(fr)を示している。
【0115】
[第3の実施の形態の動作]
次に、図27を参照して、本発明の第3の実施の形態にかかる映像品質推定装置の動作について説明する。図27は、本発明の第3の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートである。
【0116】
映像品質推定装置200は、オペレータからの指示操作や推定条件210の入力に応じて、図27の映像品質推定処理を開始する。なお、ここでは、映像品質推定装置200には、前述したフレームレート−最良映像品質特性231A(図24参照)、フレームレート−映像品質第1変化指標特性231B(図25参照)、およびフレームレート−映像品質第2変化指標特性231C(図26参照)が予め用意され、関数式として記憶部231Mに記憶されているものとする。
【0117】
まず、パラメータ取得部211は、評価対象となる映像通信サービスに関する各種の推定条件210を取得し、推定条件210から映像メディアの符号化処理に関する符号化ビットレートとフレームレートを抽出し、これら入力符号化ビットレートbr(221A)および入力フレームレートfr(221B)を主パラメータ221として出力する(ステップS200)。
【0118】
推定モデル特定部212は、パラメータ取得部211から出力された主パラメータ221の入力フレームレート221Bに基づいて映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデル222を特定する。
具体的には、まず、最良映像品質算出部212Aにより、記憶部231Mのフレームレート−最良映像品質特性231Aを参照して、入力フレームレートfr(221B)に対応する最良映像品質β(fr)(232A)を算出する(ステップS201)。
【0119】
続いて、推定モデル特定部212は、映像品質第1変化指標算出部212Bにより、記憶部231Mのフレームレート−映像品質第1変化指標特性231Bを参照して、入力フレームレートfr(221B)に対応する映像品質第1変化指標s(fr)(232B)を算出する(ステップS202)。
同様にして、推定モデル特定部212は、映像品質第2変化指標算出部212Cにより、記憶部231Mのフレームレート−映像品質第2変化指標特性231Cを参照して、入力フレームレートfr(221B)に対応する映像品質第2変化指標t(fr)(232C)を算出する(ステップS203)。
【0120】
このようにして各推定モデル特定パラメータ232を算出した後、推定モデル特定部212は、推定モデル生成部212Dにより、これら推定モデル特定パラメータ232の最良映像品質β(fr)、映像品質第1変化指標s(fr)および映像品質第2変化指標t(fr)の実際の値を前述した式(9)へ代入することにより、推定モデル222すなわち符号化ビットレート−主観映像品質特性を特定する(ステップS204)。
【0121】
この後、映像品質推定装置200は、映像品質推定部213により、推定モデル特定部212で特定された推定モデル222を参照して、パラメータ取得部211から出力された主パラメータ221の入力符号化ビットレート221Aに対応する映像品質を算出し、評価対象となる映像通信サービスを利用して端末で再生された映像メディアから視聴者が実感する主観映像品質推定値223として出力し(ステップS205)、一連の映像品質推定処理を終了する。
【0122】
このように、本実施の形態は、映像メディアに関する単位時間当たりの符号化ビット数を示す入力符号化ビットレート221Aと、単位時間当たりのフレーム数を示す入力フレームレート221Bを入力として、これら主パラメータ221に対する主観映像品質を推定する際、推定モデル特定部212により、入力フレームレート221Bに基づいて映像メディアの符号化ビットレートと主観映像品質との関係を示す推定モデル222を特定し、特定された推定モデル222を用いて入力符号化ビットレート221Aに対応する主観映像品質を推定し主観映像品質推定値223として出力している。
【0123】
これにより、推定条件210として入力された入力フレームレート221Bに対応する推定モデル222を参照して、同じく推定条件210として入力された入力符号化ビットレート221Aに対応する主観映像品質推定値223を得ることができる。
したがって、単位フレーム当たりの符号量とフレームレートの、映像品質に対するトレードオフを考慮して、これら符号化ビットレートとフレームレートをそれぞれどの程度に設定すると、どの程度の映像品質が得られるか、という具体的で有用な品質設計・管理指針を得ることができ、サービス提供に先立ったアプリケーションおよびネットワークの品質設計やサービス開始後の品質管理に大いに役立てることができる。
【0124】
例えば、所望の映像品質で映像メディアを配信したい場合、本実施の形態にかかる映像品質推定装置200を用いれば、カメラで撮影した映像をどの程度の符号化ビットレートとフレームレートで符号化すれば所望の映像品質を満足するかを具体的に把握することができる。特に、ネットワークの制約条件により、符号化ビットレートが制限される場合が多く、このような場合には、当該符号化ビットレートを固定化して本実施の形態にかかる映像品質推定装置200を適用すれば、フレームレートと映像品質との関係を容易かつ具体的に把握できる。
【0125】
本実施の形態では、推定モデル特定パラメータ232を算出する際に用いる、フレームレート−最良映像品質特性231A、フレームレート−映像品質第1変化指標特性231B、およびフレームレート−映像品質第2変化指標特性231Cが予め関数式の形で用意されている場合を例として説明したが、推定モデル特定パラメータの導出に用いるこれら推定モデル特定パラメータ導出特性231については関数式に限定されるものではなく、入力フレームレートに対応する値として記憶部231Mで記憶しておいてもよい。
【0126】
図28は、入力フレームレートと各推定モデル特定パラメータとの対応関係を示す推定モデル特定パラメータ情報の構成例である。この推定モデル特定パラメータ情報は、入力フレームレートfr(221B)と、これに対応する最良映像品質β(fr)(232A)、映像品質第1変化指標s(fr)(232B)、および映像品質第2変化指標t(fr)(232C)との組からなり、予め上記推定モデル特定パラメータ導出特性231に基づき算出して記憶部231Mに記憶されている。
このような推定モデル特定パラメータ情報を参照して、入力フレームレート221Bに対応する推定モデル特定パラメータ232を導出してもよい。
【0127】
[第4の実施の形態]
次に、図29および図30を参照して、本発明の第4の実施の形態にかかる映像品質推定装置について説明する。図29は、本発明の第4の実施の形態にかかる映像品質推定装置の構成を示すブロック図であり、前述した図19と同じまたは同等部分には同一符号を付してある。図30は、本発明の第4の実施の形態にかかる映像品質推定装置の推定モデル特定部の構成を示すブロック図であり、前述した図20と同じまたは同等部分には同一符号を付してある。
【0128】
第3の実施の形態では、予め用意されている推定モデル特定パラメータ導出特性231を参照して入力フレームレートに対応する推定モデル特定パラメータ232を導出する場合を例として説明した。本実施の形態では、評価対象となる映像通信サービスに関する各種の推定条件210のうち、映像通信サービスの通信種別、映像メディアを再生する端末の再生性能、あるいは映像メディアを再生する端末の再生環境に基づいて、推定条件210に応じた推定モデル特定パラメータ導出特性231を逐次特定する場合について説明する。
【0129】
第3の実施の形態(図19参照)と比較して、本実施の形態にかかる映像品質推定装置200には、係数取得部214と係数データベース(以下、係数DBという)225が追加されている。
係数取得部214は、記憶部225M(第4の記憶部)の係数DB225を参照して、パラメータ取得部211により推定条件210から取得された副パラメータ224に対応する特性係数226を取得する機能を有している。
【0130】
図31は、係数DBの構成例を示す説明図である。係数DB225は、各種副パラメータ224とこれに対応する各特性係数a',b',c',…,h'(226)との組を示すデータベースである。副パラメータ224には、映像通信サービスの通信種別を示す通信種別パラメータ224A、映像メディアを再生する端末の再生性能を示す再生性能パラメータ224B、あるいは映像メディアを再生する端末の再生環境を示す再生環境パラメータ224Cがある。
【0131】
通信種別パラメータ224Aの具体例としては、評価対象となる映像通信サービスで行われる通信種別を示す「タスク」がある。
再生性能パラメータ224Bの具体例としては、映像メディアの符号化に関する「符号化方式」、「映像フォーマット」、「キーフレーム」のほか、端末でのメディア再生機能に関する「モニタサイズ」、「モニタ解像度」などがある。
再生環境パラメータ224Cの具体例としては、端末でのメディア再生の際の「室内照度」などがある。
【0132】
副パラメータ224は、これらパラメータ例に限定されるものではなく、評価対象となる映像通信サービスや映像メディアの内容に応じて任意に取捨選択すればよく、少なくともこれら通信種別パラメータ224A、再生性能パラメータ224B、および再生環境パラメータ224Cのうちの1つ以上から構成されていればよい。
【0133】
係数取得部214は、予め用意された記憶部225Mの係数DB225を参照して、副パラメータ224に対応する特性係数226を取得する。特性係数226は、推定モデル特定パラメータ232の導出に用いる推定モデル特定パラメータ導出特性を特定するための係数である。
推定モデル特定部212は、係数取得部214で取得された特性係数226により特定された推定モデル特定パラメータ導出特性231、すなわちフレームレート−最良映像品質特性231A、フレームレート−映像品質第1変化指標特性231B、およびフレームレート−映像品質第2変化指標特性231Cを特定する。
【0134】
[推定モデル特定パラメータ導出特性]
次に、推定モデル特定部212で用いる推定モデル特定パラメータ導出特性231について詳細に説明する。
推定モデル特定パラメータ導出特性231は、係数取得部214により係数DB225から取得される特性係数226を用いてそれぞれ次のようにモデル化することができる。
【0135】
まず、推定モデル特定パラメータ導出特性231のフレームレート−最良映像品質特性231Aは、前述した図24に示すように、フレームレートの増加とともに最良映像品質が単調増加し、その後ある最大主観映像品質に収束する傾向があり、例えば一般的な指数関数でモデル化することができる。したがって、フレームレートをfrとし、これに対応する最良映像品質をβ(fr)とし、係数をa',b',c'とした場合、フレームレート−最良映像品質特性231Aは、次の式(10)で表すことができる。
【0136】
【数10】

【0137】
次に、推定モデル特定パラメータ導出特性231のフレームレート−映像品質第1変化指標特性231Bは、前述した図25に示すように、フレームレートの増加とともに映像品質第1変化指標が単調増加する傾向があり、例えば一般的な指数関数でモデル化することができる。したがって、フレームレートをfrとし、これに対応する映像品質第1変化指標をs(fr)とし、係数をd',e',f'とした場合、フレームレート−映像品質第1変化指標特性231Bは、次の式(11)で表すことができる。
【0138】
【数11】

【0139】
また、推定モデル特定パラメータ導出特性231のフレームレート−映像品質第2変化指標特性231Cは、前述した図26に示すように、フレームレートの増加とともに映像品質第2変化指標が単調減少する傾向があり、例えば一般的な線形関数でモデル化することができる。したがって、フレームレートをfrとし、これに対応する映像品質第2変化指標をt(fr)とし、係数をg',h'とした場合、フレームレート−映像品質第2変化指標特性231Cは、次の式(12)で表すことができる。
【0140】
【数12】

【0141】
なお、推定モデル特定パラメータ導出特性231のモデル化については、前述した指数関数や線形関数に限定されるものではなく、他の関数を用いてもよい。例えば、評価対象となる映像通信サービスや映像メディアの内容、ネットワーク性能、あるいは推定条件210の内容によっては、ある程度限定された範囲の入力符号化ビットレートや入力フレームレートでの映像品質推定処理で十分なため、このような局所的な見方が可能な場合には、前述したように、フレームレート−最良映像品質特性231Aやフレームレート−映像品質第1変化指標特性231Bを線形関数等の単純な関数でモデル化することができる。
【0142】
これに対して、入力符号化ビットレートや入力フレームレートに対して推定モデル特定パラメータの変化が大きい場合には、例えば指数関数やロジスティック関数などの他の関数を用いて、フレームレート−映像品質第2変化指標特性231C、さらにはフレームレート−最良映像品質特性231Aやフレームレート−映像品質第1変化指標特性231Bをモデル化してもよい。
【0143】
[第4の実施の形態の動作]
次に、図32を参照して、本発明の第4の実施の形態にかかる映像品質推定装置の動作について説明する。図32は、本発明の第4の実施の形態にかかる映像品質推定装置の映像品質推定処理を示すフローチャートであり、前述した図27と同じまたは同等部分には同一符号を付してある。
【0144】
映像品質推定装置200は、オペレータからの指示操作や推定条件210の入力に応じて、図32の映像品質推定処理を開始する。なお、ここでは、副パラメータ224として通信種別パラメータ224A、再生性能パラメータ224B、および再生環境パラメータ224Cを用いるものとし、記憶部225Mの係数DB225には、副パラメータ224と特性係数226との組が予め格納されているものとする。
【0145】
まず、パラメータ取得部211は、評価対象となる映像通信サービスに関する各種の推定条件210を取得し、推定条件210から映像メディアの符号化処理に関する符号化ビットレートとフレームレートを抽出し、これら入力符号化ビットレートbr(221A)および入力フレームレートfr(221B)を主パラメータ221として出力する(ステップS200)。また、パラメータ取得部211は、推定条件210から通信種別パラメータ224A、再生性能パラメータ224B、および再生環境パラメータ224Cを抽出し、これらを副パラメータ224として出力する(ステップS210)。
【0146】
次に、係数取得部214は、記憶部225Mの係数DB225を参照して、副パラメータ224の値に対応する特性係数a',b',c',…,h'(226)を取得して出力する(ステップS211)。
これに応じて推定モデル特定部212は、最良映像品質算出部212Aにより、特性係数226のうち係数a',b',c'により特定されるフレームレート−最良映像品質特性231Aを参照して、入力フレームレートfr(221B)に対応する最良映像品質β(fr)(232A)を算出する(ステップS201)。
【0147】
また、推定モデル特定部212は、映像品質第1変化指標算出部212Bにより、特性係数226のうち係数d',e',f'により特定されるフレームレート−映像品質第1変化指標特性231Bを参照して、入力フレームレートfr(221B)に対応する映像品質第1変化指標s(fr)(232B)を算出する(ステップS202)。
同様にして、推定モデル特定部212は、映像品質第2変化指標算出部212Cにより、特性係数226のうち係数g',h'により特定されるフレームレート−映像品質第2変化指標特性231Cを参照して、入力フレームレートfr(221B)に対応する映像品質第2変化指標t(fr)(232C)を算出する(ステップS203)。
【0148】
このようにして各推定モデル特定パラメータ232を算出した後、推定モデル特定部212は、推定モデル生成部212Dにより、これら推定モデル特定パラメータ232の最良映像品質β(fr)、映像品質第1変化指標s(fr)、および映像品質第2変化指標t(fr)の実際の値を前述した式(9)へ代入することにより、推定モデル222すなわち符号化ビットレート−主観映像品質特性を特定する(ステップS204)。
【0149】
この後、映像品質推定装置200は、映像品質推定部213により、推定モデル特定部212で特定された推定モデル222を参照して、パラメータ取得部211から出力された主パラメータ221の入力符号化ビットレート221Aに対応する映像品質を算出し、評価対象となる映像通信サービスを利用して端末で再生された映像メディアから視聴者が実感する主観映像品質の主観映像品質推定値223として出力し(ステップS205)、一連の映像品質推定処理を終了する。
【0150】
このように、本実施の形態は、パラメータ取得部211で取得された、通信種別パラメータ224A、再生性能パラメータ224B、および再生環境パラメータ224Cのうちの1つ以上からなる副パラメータ224に対応する特性係数226を、記憶部225Mの係数DB225から係数取得部214により取得し、推定モデル特定部212により、これら特性係数226により特定される推定モデル特定パラメータ導出特性231に基づいて、入力フレームレート221Bに対応する推定モデル特定パラメータ232を算出するようにしたので、評価対象となる映像通信サービスや端末の具体的な性質に基づく推定モデル特定パラメータ232を導出することができ、映像品質推定の精度を向上させることができる。
【0151】
特に、従来技術では、映像品質を推定する場合、評価対象となる映像通信サービスで用いる符号化方式や端末ごとに、映像品質推定モデルを用意しなければならなかった。しかしながら、本実施の形態によれば、映像品質推定モデルが符号化方式や端末に依存せず、映像品質推定モデルに用いる係数を符号化方式や端末に応じて参照するだけで、同じ映像品質推定モデルを利用できる。したがって、異なる環境の映像通信サービスに対して柔軟に対応することができる。
【0152】
図33は、本実施の形態を適用した映像品質推定装置の推定精度を示すグラフである。図33において、横軸は映像品質推定装置を用いて推定した主観映像品質の推定値(MOS値)を示し、縦軸は視聴者が実際にオピニオン評価した主観映像品質の評価値(MOS値)を示している。前述した文献2に基づく従来の映像品質推定装置の推定精度を示す図18に比較して、図33のほうが、評価値と推定値の誤差が少なく、推定精度が向上していることがわかる。なお、これらは特定の推定条件下での比較結果であるが、異なる符号化方式や端末を用いた場合でも、同様の比較結果が確認されている。
【0153】
[各実施の形態の拡張]
以上の第1および第2の実施の形態では、ガウス関数を用いて推定モデル122をモデル化した場合を例として説明したが、これに限定されるものではなく、二次関数や高次関数などの他の関数を用いてもよい。また、推定モデル122が関数でモデル化されている場合を例として説明したが、関数以外の他のモデル、例えばニューラルネットワークや事例ベースなど、入出力特性のみが特定されるようなブラックボックスモデルであってもよい。
【0154】
また、第2の実施の形態で用いた係数DB125の副パラメータと特性係数126の対応関係については、各種副パラメータの組合せごとに各推定モデル特定パラメータ導出特性131を実測し、得られた計測データに対して最小二乗による収束演算を行うことにより、各特性係数126を算出してもよく、このような特性係数算出のための構成を映像品質推定装置100に実装してもよい。
【0155】
また、第3および第4実施の形態では、ロジスティック関数を用いて推定モデル222をモデル化した場合を例として説明したが、これに限定されるものではなく、二次関数や高次関数などの他の関数を用いてもよい。また、推定モデル222が関数でモデル化されている場合を例として説明したが、関数以外の他のモデル、例えばニューラルネットワークや事例ベースなど、入出力特性のみが特定されるようなブラックボックスモデルであってもよい。
【0156】
また、第4の実施の形態で用いた係数DB225の副パラメータと特性係数226の対応関係については、各種副パラメータの組合せごとに各推定モデル特定パラメータ導出特性231を実測し、得られた計測データに対して最小二乗による収束演算を行うことにより、各特性係数226を算出してもよく、このような特性係数算出のための構成を映像品質推定装置200に実装してもよい。
【0157】
また、各実施の形態では、記憶部131M,125M,231M,225Mなどの記憶部がそれぞれ別個の記憶装置から構成されている場合を例として説明したが、これに限定されるものではなく、各記憶部のうち複数あるいは全部を1つの記憶装置で構成してもよい。
【符号の説明】
【0158】
100…映像品質推定装置、110…推定条件、111…パラメータ取得部、112…推定モデル特定部、112A…最適フレームレート算出部、112B…最良映像品質算出部、112C…映像品質劣化指標算出部、113…映像品質推定部、114…係数取得部、121…主パラメータ、121A…入力フレームレート(fr)、121B…入力符号化ビットレート(br)、122…推定モデル、123…主観映像品質推定値、124…副パラメータ、124A…通信種別パラメータ、124B…再生性能パラメータ、124C…再生環境パラメータ、125…係数DB、126…特性係数、131…推定モデル特定パラメータ導出特性、131A…符号化ビットレート−最適フレームレート特性、131B…符号化ビットレート−最良映像品質特性、131C…符号化ビットレート−映像品質劣化指標特性、132…推定モデル特定パラメータ、132A…最適フレームレート(ofr(br))、132B…最良映像品質(α(br))、132C…映像品質劣化指標(ω(br))、200…映像品質推定装置、210…推定条件、211…パラメータ取得部、212…推定モデル特定部、212A…最良映像品質算出部、212B…映像品質第1変化指標算出部、212C…映像品質第2変化指標算出部、213…映像品質推定部、214…係数取得部、221…主パラメータ、221A…入力符号化ビットレート(br)、221B…入力フレームレート(fr)、222…推定モデル、223…主観映像品質推定値、224…副パラメータ、224A…通信種別パラメータ、224B…再生性能パラメータ、224C…再生環境パラメータ、225…係数DB、226…特性係数、231…推定モデル特定パラメータ導出特性、231A…フレームレート−最良映像品質特性、231B…フレームレート−映像品質第1変化指標特性、231C…フレームレート−映像品質第2変化指標特性、232…推定モデル特定パラメータ、232A…最良映像品質(β(fr))、232B…映像品質第1変化指標(s(fr))、232C…映像品質第2変化指標(t(fr))。

【特許請求の範囲】
【請求項1】
複数のフレームに符号化した映像メディアに関する、単位時間当たりの符号化ビット数を示す入力符号化ビットレートおよび単位時間当たりのフレーム数を示す入力フレームレートを取得するパラメータ取得部と、
前記入力フレームレートに基づいて前記入力符号化ビットレートと主観映像品質との関係を示す推定モデルを特定する推定モデル特定部と、
特定された前記推定モデルを用いて前記入力符号化ビットレートに対応する主観映像品質を推定し、通信網を介して任意の端末で受信し再生した前記映像メディアから視聴者が実感する主観映像品質の推定値として出力する映像品質推定部と
を備え、
前記推定モデル特定部は、前記入力フレームレートで送信された前記映像メディアの主観映像品質の最良値を示す最良映像品質を算出する最良映像品質算出部と、前記入力フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第1変化指標を算出する映像品質第1変化指標算出部と、前記入力フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第2変化指標を算出する映像品質第2変化指標算出部と、前記最良映像品質、前記映像品質第1変化指標、および前記映像品質第2変化指標を含む推定モデル特定パラメータに基づいて前記推定モデルを生成する推定モデル生成部とを備える
ことを特徴とする映像品質推定装置。
【請求項2】
請求項1に記載の映像品質推定装置において、
前記推定モデルは、前記映像メディアのフレームレートが前記入力フレームレートで一定の場合に、前記映像メディアの符号化ビットレートの増加に応じて前記主観映像品質が前記映像品質第1変化指標および前記映像品質第2変化指標に基づく変化度合いで単調増加し前記最良映像品質へ収束する符号化ビットレート−映像品質特性からなることを特徴とする映像品質推定装置。
【請求項3】
請求項2に記載の映像品質推定装置において、
前記推定モデルは、前記映像メディアの符号化ビットレートの増加に応じて単調増加し前記最良映像品質へ収束するロジスティック関数からなることを特徴とする映像品質推定装置。
【請求項4】
請求項1に記載の映像品質推定装置において、
前記最良映像品質算出部は、前記フレームレートの増加に応じて前記最良映像品質が単調増加した後に所定の最大値に収束するフレームレート−最良映像品質特性に基づいて、前記入力フレームレートに対応する最良映像品質を算出することを特徴とする映像品質推定装置。
【請求項5】
請求項1に記載の映像品質推定装置において、
前記映像品質第1変化指標算出部は、前記フレームレートの増加に応じて前記映像品質第1変化指標が単調増加するフレームレート−映像品質第1変化指標特性に基づいて、前記入力フレームレートに対応する映像品質第1変化指標を算出することを特徴とする映像品質推定装置。
【請求項6】
請求項1に記載の映像品質推定装置において、
前記映像品質第2変化指標算出部は、前記フレームレートの増加に応じて前記映像品質第2変化指標が単調減少するフレームレート−映像品質第2変化指標特性に基づいて、前記入力フレームレートに対応する映像品質第2変化指標を算出することを特徴とする映像品質推定装置。
【請求項7】
請求項1に記載の映像品質推定装置において、
前記映像メディアのフレームレートと当該フレームレートで送信された前記映像メディアの主観映像品質の最良値を示す最良映像品質との関係を示すフレームレート−最良映像品質特性と、前記映像メディアのフレームレートと当該フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第1変化指標との関係を示すフレームレート−映像品質第1変化指標特性と、前記映像メディアのフレームレートと当該フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第2変化指標との関係を示すフレームレート−映像品質第2変化指標特性とを記憶する第3の記憶部をさらに備え、
前記最良映像品質算出部は、前記フレームレート−最良映像品質特性を参照して前記入力フレームレートに対応する最良映像品質を算出し、前記映像品質第1変化指標算出部は、前記フレームレート−映像品質第1変化指標特性を参照して前記入力フレームレートに対応する映像品質第1変化指標を算出し、前記映像品質第2変化指標算出部は、前記フレームレート−映像品質第2変化指標特性を参照して前記入力フレームレートに対応する映像品質第2変化指標を算出する
ことを特徴とする映像品質推定装置。
【請求項8】
請求項1に記載の映像品質推定装置において、
前記映像通信の種別を示す通信種別パラメータ、前記端末における前記映像メディアの再生性能を示す再生性能パラメータ、または前記端末で前記映像メディアを再生する際の周囲環境を示す再生環境パラメータのうちの1つ以上からなる副パラメータについて、前記推定モデル特定パラメータの導出に用いる特性係数との対応関係を記憶する第4の記憶部と、前記第4の記憶部を参照して前記パラメータ取得部で取得された副パラメータに対応する特性係数を取得する係数取得部とをさらに備え、
前記推定モデル特定部は、前記特性係数により特定される、符号化ビットレートと任意の推定モデル特定パラメータとの関係を示す推定モデル特定パラメータ導出特性に基づいて、前記入力符号化ビットレートに対応する当該推定モデル特定パラメータを算出する
ことを特徴とする映像品質推定装置。
【請求項9】
複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、前記端末で再生された当該映像メディアから視聴者が実感する主観映像品質の推定値を所定の推定モデルを用いて算出する映像品質推定装置で用いられる映像品質推定方法であって、
パラメータ取得部が、前記映像メディアに関する、単位時間当たりの符号化ビット数を示す入力符号化ビットレートおよび単位時間当たりのフレーム数を示す入力フレームレートを取得するパラメータ取得ステップと、
推定モデル特定部が、前記入力フレームレートに基づいて前記入力符号化ビットレートと主観映像品質との関係を示す推定モデルを特定する推定モデル特定ステップと、
映像品質推定部が、特定された前記推定モデルを用いて前記入力符号化ビットレートに対応する主観映像品質を推定し前記推定値として出力する映像品質推定ステップと
を備え、
前記推定モデル特定ステップは、前記入力フレームレートで送信された前記映像メディアの主観映像品質の最良値を示す最良映像品質を算出する最良映像品質算出ステップと、前記入力フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第1変化指標を算出する映像品質第1変化指標算出ステップと、前記入力フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第2変化指標を算出する映像品質第2変化指標算出ステップと、前記最良映像品質、前記映像品質第1変化指標、および前記映像品質第2変化指標を含む推定モデル特定パラメータに基づいて前記推定モデルを生成する推定モデル生成ステップとを備える
ことを特徴とする映像品質推定方法。
【請求項10】
請求項9に記載の映像品質推定方法において、
前記推定モデルは、前記映像メディアのフレームレートが前記入力フレームレートで一定の場合に、前記映像メディアの符号化ビットレートの増加に応じて前記主観映像品質が前記映像品質第1変化指標および前記映像品質第2変化指標に基づく変化度合いで単調増加し前記最良映像品質へ収束する符号化ビットレート−映像品質特性からなることを特徴とする映像品質推定方法。
【請求項11】
請求項10に記載の映像品質推定方法において、
前記推定モデルは、前記映像メディアの符号化ビットレートの増加に応じて単調増加し前記最良映像品質へ収束するロジスティック関数を用いることを特徴とする映像品質推定方法。
【請求項12】
請求項9に記載の映像品質推定方法において、
前記最良映像品質算出ステップは、前記フレームレートの増加に応じて前記最良映像品質が単調増加した後に所定の最大値に収束するフレームレート−最良映像品質特性に基づいて、前記入力フレームレートに対応する最良映像品質を算出することを特徴とする映像品質推定方法。
【請求項13】
請求項9に記載の映像品質推定方法において、
前記映像品質第1変化指標算出ステップは、前記フレームレートの増加に応じて前記映像品質第1変化指標が単調増加するフレームレート−映像品質第1変化指標特性に基づいて、前記入力フレームレートに対応する映像品質第1変化指標を算出することを特徴とする映像品質推定方法。
【請求項14】
請求項9に記載の映像品質推定方法において、
前記映像品質第2変化指標算出ステップは、前記フレームレートの増加に応じて前記映像品質第2変化指標が単調減少するフレームレート−映像品質第2変化指標特性に基づいて、前記入力フレームレートに対応する映像品質第2変化指標を算出することを特徴とする映像品質推定方法。
【請求項15】
請求項9に記載の映像品質推定方法において、
第3の記憶部により、前記映像メディアのフレームレートと当該フレームレートで送信された前記映像メディアの主観映像品質の最良値を示す最良映像品質との関係を示すフレームレート−最良映像品質特性と、前記映像メディアのフレームレートと当該フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第1変化指標との関係を示すフレームレート−映像品質第1変化指標特性と、前記映像メディアのフレームレートと当該フレームレートで送信された前記映像メディアの主観映像品質に関する変化度合いを示す映像品質第2変化指標との関係を示すフレームレート−映像品質第2変化指標特性とを記憶する第3の記憶ステップをさらに備え、
前記最良映像品質算出ステップは、前記フレームレート−最良映像品質特性を参照して前記入力フレームレートに対応する最良映像品質を算出し、前記映像品質第1変化指標算出ステップは、前記フレームレート−映像品質第1変化指標特性を参照して前記入力フレームレートに対応する映像品質第1変化指標を算出し、前記映像品質第2変化指標算出ステップは、前記フレームレート−映像品質第2変化指標特性を参照して前記入力フレームレートに対応する映像品質第2変化指標を算出する
ことを特徴とする映像品質推定方法。
【請求項16】
請求項9に記載の映像品質推定方法において、
第4の記憶部により、前記映像通信の種別を示す通信種別パラメータ、前記端末における前記映像メディアの再生性能を示す再生性能パラメータ、または前記端末で前記映像メディアを再生する際の周囲環境を示す再生環境パラメータのうちの1つ以上からなる副パラメータについて、前記推定モデル特定パラメータの導出に用いる特性係数との対応関係を記憶する第4の記憶ステップと、係数取得部により、前記第4の記憶部を参照して前記パラメータ取得ステップで取得された副パラメータに対応する特性係数を取得する係数取得ステップとをさらに備え、
前記推定モデル特定ステップは、前記特性係数により特定される、符号化ビットレートと任意の推定モデル特定パラメータとの関係を示す推定モデル特定パラメータ導出特性に基づいて、前記入力符号化ビットレートに対応する当該推定モデル特定パラメータを算出する
ことを特徴とする映像品質推定方法。
【請求項17】
複数のフレームに符号化した映像メディアを任意の端末へ通信網を介して送信する映像通信について、前記端末で再生された当該映像メディアから視聴者が実感する主観映像品質の推定値を所定の推定モデルを用いて算出する映像品質推定装置のコンピュータに、
パラメータ取得部が、前記映像メディアに関する、単位時間当たりの符号化ビット数を示す入力符号化ビットレートおよび単位時間当たりのフレーム数を示す入力フレームレートを取得するパラメータ取得ステップと、
推定モデル特定部が、前記入力符号化ビットレートに基づいて前記入力フレームレートと主観映像品質との関係を示す推定モデルを特定する推定モデル特定ステップと、
映像品質推定部が、特定された前記推定モデルを用いて前記入力フレームレートに対応する主観映像品質を推定し前記推定値として出力する映像品質推定ステップと
を実行させ、
前記推定モデル特定ステップは、前記入力符号化ビットレートで送信された前記映像メディアの主観映像品質が最良となるフレームレートを示す最適フレームレートを算出する最適フレームレート算出ステップと、前記入力符号化ビットレートで送信された前記映像メディアの主観映像品質の最良値を示す最良映像品質を算出する最良映像品質算出ステップと、前記最適フレームレートと前記最良映像品質とを含む推定モデル特定パラメータに基づいて前記推定モデルを生成する推定モデル生成ステップとを備える
ことを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate

【図30】
image rotate

【図31】
image rotate

【図32】
image rotate

【図33】
image rotate


【公開番号】特開2010−252400(P2010−252400A)
【公開日】平成22年11月4日(2010.11.4)
【国際特許分類】
【出願番号】特願2010−178792(P2010−178792)
【出願日】平成22年8月9日(2010.8.9)
【分割の表示】特願2007−516127(P2007−516127)の分割
【原出願日】平成18年11月28日(2006.11.28)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】