説明

映像処理装置及び方法及びプログラム

【課題】 人的・時間的なコストをかけずに、指定された閾値内に映像品質を保ち、映像コンテンツの解像度に解像度変換させてデータ量を削減する。
【解決手段】 本発明は、入力映像データについて、指定された映像品質の条件を満たす解像度の中から最小の解像度(最適解像度)を算出し、入力映像データから、映像データのエッジ量と解像度(入力解像度)を算出し、エッジ量と入力解像度から最適解像度を算出する。このとき、映像コンテンツの解像度(変換前)を低下させる解像度変換による映像品質の低下の度合いの値が、予め指定された閾値内になるような変換後の解像度のうち、最小の解像度(最適解像度)となる解像度を算出し、当該解像度で実際に映像コンテンツの解像度を変換する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像処理装置及び方法及びプログラムに係り、特に、入力される映像コンテンツ(以下、「入力映像コンテンツ」と記す)について、一定の映像品質を維持したまま映像コンテンツの解像度を下げることにより、映像コンテンツのデータ量を削減する映像処理装置及び方法及びプログラムに関する。
【背景技術】
【0002】
地上テレビ放送のデジタル化により、一般家庭にもFull-HDサイズの映像コンテンツを視聴可能な環境が整ってきた。それに伴い、映像配信サービスやパッケージメディアにおいてもFull-HDサイズの映像コンテンツの提供が開始されている。高解像度の映像コンテンツは画質の高さがユーザへの訴求点になっているが、データ量が多くなるため映像データを保存するためのストレージや伝送するためのネットワークの設備コストが大きな負担になる。
【0003】
ここで解像度と映像品質の関係について説明する。図1は、7種類の映像コンテンツそれぞれにおいて、解像度変換(Full-HD 1920×1080⇒Half-HD 960×1080)が与える品質への影響の差異を表している。図1において、映像コンテンツ5〜7は解像度の低下に伴い映像品質の低下の度合いが大きくなる。すなわち、解像度の低下によって映像品質が低下しているのに対し、映像コンテンツ1〜4は解像度の差がほとんど映像品質に影響を及ぼしていない。図1が示すように、映像コンテンツによっては、映像コンテンツの解像度の低下が映像品質の低下に影響を及ぼさない閾値があるため、映像コンテンツ毎に、映像品質の低下に影響を及ぼさない必要最低限の解像度に設定することにより、映像コンテンツのデータ量を削減することができる。
【0004】
従来、非特許文献1では映像の製作者が事前にシーン毎に優先度や動きの激しさをメタ情報として付与し、その情報に基づいて解像度を変化させる技術が記載されている。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】村田嘉利、増田彰久、太田賢、石原進、水野忠則、"モバイルマルチメディアストリーミングサービスのためのコンテンツ指向時空間的解像度制御方式", 情報処理学会論文誌,Vol.43,No.12,pp.3838−3847、2002(12).
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、映像製作者が事前にシーン毎に優先度や動きの激しさをメタ情報として付与し、その情報に基づいて映像品質を考慮して変動させる技術(非特許文献1)は、シーン毎に製作者が対応する必要があり、人的・時間的なコストが増大するという問題がある。
【0007】
本発明は、上記に鑑みてなされたもので、映像コンテンツのデータから得られるコンテンツ特徴量を用いることにより、人的・時間的なコストをかけずに、人間が知覚する映像品質(映像品質の低下の度合い)について、指定された条件を満たす、すなわち指定された閾値内に映像品質を保つ、映像コンテンツの解像度に解像度変換させてデータ量を削減することであり、指定された映像品質の条件に応じた映像コンテンツの解像度に変換する、映像処理装置、方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するため、本発明は、入力された映像データ(以下、「入力映像データ」と記す)について、指定された映像品質の条件を満たす解像度に、入力映像データの解像度を変換する映像処理装置であって、
前記入力映像データについて、指定された映像品質の条件を満たす解像度の中から最小の解像度(最適解像度)を算出する最適映像パラメータ導出手段と、
前記最適映像パラメータ導出手段で算出した前記最適解像度に基づいて、前記入力映像データの解像度を変換して最適化映像データを出力する映像最適化処理手段と、
を備え、
前記最適映像パラメータ導出手段は、
前記入力映像データから、前記映像データのエッジ量と解像度(入力解像度)を算出するエッジ量算出手段と、
前記エッジ量と前記入力解像度から前記最適解像度を算出する最適解像度算出手段と、
を含む。
【発明の効果】
【0009】
本発明によれば、入力映像コンテンツの映像品質を一定に保ったまま映像コンテンツの解像度を下げることにより、映像コンテンツのデータ量を削減することができる。そのため、映像品質を指定された閾値を越えて低下させて、映像品質に影響を及ぼすことなく、ストレージの容量削減や通信のトラヒック削減を可能とし、コスト削減に繋がる。
【図面の簡単な説明】
【0010】
【図1】映像コンテンツ毎の解像度変換時の映像品質低下の度合いである。
【図2】エッジ映像データである。
【図3】映像コンテンツのエッジ量と解像度変換時の映像品質低下の度合いの関係である。
【図4】本発明の一実施の形態における映像処理装置の構成図である。
【図5】本発明の一実施の形態におけるエッジ量と解像度変換時の映像品質低下の度合いの関係を表したモデル式である。
【図6】本発明の一実施の形態における最適解像度算出部の構成図である。
【図7】本発明の一実施の形態における映像処理装置の動作のフローチャートである。
【発明を実施するための形態】
【0011】
以下図面と共に、本発明の実施の形態を説明する。
【0012】
本発明は、指定された映像品質の条件に応じた映像コンテンツの解像度に変換するための装置、方法を提供するものであるが、具体的には、映像コンテンツの解像度(変換前)を低下させる解像度変換による映像品質の低下の度合いの値が、予め指定された閾値内になるような変換後の解像度の内、最小の解像度(最適解像度)となる解像度を算出し、当該解像度で実際に映像コンテンツの解像度を変換する処理を行う。
【0013】
本願発明は、解像度の低下が「人間が知覚する映像品質の低下の度合い」に与える影響に関する実験結果に基づき定義した、「解像度変換前後の映像品質の低下の度合いのモデル式」を基に、最適解像度を算出する点が特徴となる。
【0014】
本発明の解決手段を説明する。本発明では、入力される映像コンテンツの画素情報から得られるコンテンツの特徴量であるエッジ量を用いることにより、指定された映像品質の条件を満たすことが可能な最小の映像コンテンツの解像度(最適解像度)を算出し、入力された映像コンテンツの解像度を当該最適解像度に解像度変換することで、指定された一定の映像品質を維持した状態で、映像コンテンツのデータ量の変換を可能とする。
【0015】
指定された映像品質の条件を満たすとは、「映像品質の低下の度合い」を指定された閾値内に保つことである。
【0016】
映像コンテンツにおける、解像度の変換による映像品質の低下の原因として、解像度の変換によって映像コンテンツのエッジ(輪郭線)が消失するもしくは歪んでしまうことが挙げられる。このことから、エッジを多く含む映像コンテンツほど、解像度の変換時に映像品質の低下の度合いが大きくなると考えられるため、エッジの量から最適解像度を算出する技術を提供する。
【0017】
エッジの量は例えばソーベルフィルタ、ラプラシアンフィルタ、プレヴィットフィルタ、キャニーエッジフィルタなどの既知のエッジ抽出フィルタを適用し得られるエッジ映像データ(図2)に対して、フレーム毎の画素値の平均値または全てのフレームにおける、フレーム毎の画素値の標準偏差の平均値もしくは最大値として計算される。
【0018】
図3は映像コンテンツのエッジ量と解像度の変換時の映像品質低下の度合いの関係を示している。図3が示すようにエッジ量が大きくなると、解像度の変換時の映像品質の低下の度合いが大きくなる関係がある。この関係を、解像度の変換の前後の解像度の組み合わせ(例えば、1920×1080から1440×1080、1920×1080から960×1080、1920×1080から1280×720など)毎にモデル化する。このモデルを用いることで、入力映像コンテンツの解像度と解像度の変換時の解像度との組み合わせ毎に、エッジ量と解像度変換時の映像品質の低下の度合いを算出し、映像品質の低下の度合いが指定された閾値内を保ち、一定の映像品質を維持する最小の解像度を最適解像度として算出できることになる。
【0019】
図4は、本発明の一実施の形態における映像処理装置の構成を示す。
【0020】
同図に示す映像処理装置は、最適映像パラメータ導出部1、映像最適化処理部2から構成される。映像コンテンツのデータ(以下、「映像データ」と記す)を入力とし、映像コンテンツの解像度を最適解像度に解像度変換した映像データ(以下、「最適化映像データ」と記す)を出力とする。本映像処理装置に入力された映像データは、最適化映像パラメータ導出部1と映像最適化処理部2への入力とされる。
【0021】
また、「映像品質」とは映像品質の低下の度合いとし、「指定された映像品質の条件」とは、指定された閾値以下に、解像度変換による映像品質の低下の度合いを保つことである。
【0022】
最適化映像パラメータ導出部1は、エッジ量算出部11と最適解像度算出部12で構成される。最適化映像パラメータ導出部1は映像データを入力とし、エッジ量算出部11において、入力された映像データをもとにエッジ量、入力解像度を算出して、最適解像度算出部12への入力として出力され、最適解像度算出部12において、エッジ量算出部11で算出されたエッジ量、入力解像度をもとに、最適解像度を算出し、入力解像度と最適化解像度を出力して、映像最適化処理部2への入力として出力される。
【0023】
エッジ量算出部11では、入力された映像データに含まれる輝度レイヤの各フレームに対して、例えばソーベルフィルタ、ラプラシアンフィルタ、プレヴィットフィルタ、キャニーエッジフィルタ(文献1「"A Computational Approach to Edge Detection," by J.F. Canny, IEEE Transactions on Pattern Analysis and Machine Intelligence, 8, pp.769-798, 1986」)などの既知のエッジ抽出フィルタを適用して、エッジ映像データを生成する。本実施の形態では次式のようにソーベルフィルタを用いてエッジ映像データE(w,h,f)を算出する。
【0024】
【数1】

ここでy(w,h,f)はf番目のフレームの画素位置(w,h)の輝度値を示す。
【0025】
生成したエッジ映像データの各フレームの画素値の標準偏差(もしくは平均値)を基に、全フレームの平均値(もしくは最大値)をエッジ量として算出する。本実施の形態では次式のように標準偏差の平均値を用いてエッジ量eを算出する。
【0026】
【数2】

ここで、上記式中の関数stdspace[ ]は、フレーム毎にフレーム内の画素値の標準偏差を出力する関数、Nはフレームの総数を示す。
【0027】
エッジ量算出部11では、算出したエッジ量eを最適解像度算出部12に入力すると共に、入力された映像データに含まれるメタデータをもとに、入力された映像データの解像度(以下、「入力解像度」と記す)を参照し、入力解像度を最適解像度算出部12に入力する。なお、メタデータはAVIやmp4などのファイルフォーマット毎にデータ構造が定められている。また、メタデータを含まない映像データの場合は、入力を受け付けない、もしくはデフォルトの入力解像度を用いる、もしくは手動で設定する必要がある。
【0028】
最適解像度算出部12は、解像度の変換の前後の解像度の組み合わせ(例えば、1920×1080と1440×1080,1920×080と960×1080,1920×1080と720×1080,1920×1080と720×480など)毎に、図5に示すようなエッジ量と解像度の変換時の映像品質の低下の度合いとの関係を表したモデル式及びモデル式の係数(モデル係数)を備える。本実施の形態では、モデル式は統一のものを用いるが、解像度の組み合わせ毎にモデル式を変えてもよい。モデル係数は事前に実験によって得られた品質の実測値、もしくは文献2「ITU-T勧告J.247」のような映像品質客観評価モデルを用いて映像データから得られる品質の推定値を用いて、最小二乗法などにより解像度の組み合わせ毎に求められる。モデル式及びモデル係数は図6に示すように記憶部122に蓄積されており、演算処理部121から参照される。なお初期設定後にモデル式及びモデル係数を変更してもよい。
【0029】
最適解像度算出部12における、最適解像度の算出方法を説明する。
【0030】
入力されたエッジ量と入力解像度をもとに、入力解像度と解像度の変換後の解像度との組み合わせに対応する予め策定されたモデル式毎に、入力されたエッジ量に対応する映像品質の低下の度合いを算出し、解像度の変換時の映像品質の低下の度合いが予め指定された特定の閾値以下になる入力解像度と解像度変換後の解像度の組み合わせの内、変換後の解像度が最小になる解像度を最適解像度として算出し、当該最適解像度及び入力された入力解像度を映像最適化処理部2への入力として出力する。閾値は図6に示すように記憶部122に蓄積され、演算処理部から参照される。閾値を低く設定すれば品質の低下が小さくなるがデータ量の削減効果も小さくなり、閾値を高く設定すれば品質の低下が大きくなるがデータ量の削減効果も大きくなる。閾値の設定は本発明を組み込んだ装置等を用いるサービス事業者などの運用ポリシーに基づいて決定される。なお、初期設定後に閾値を変更してもよい。本実施の形態では、以下のモデル式を用いる。
【0031】
【数3】

ここでdVQは解像度の変換時の映像品質の低下の度合い、eはエッジ量を表す。また、v1,v2,v3は係数であり解像度変換前後の解像度の組み合わせ毎に、事前に主観品質評価実験等で得られる映像品質と、入力された映像データから得られるエッジ量を用いて、最小二乗法などによりモデル式を最適化する必要がある。本モデル式は、エッジ量が低下するとdVQが0に収束し、エッジ量が増加するとdVQがv1に収束する特性を持つ。
【0032】
映像最適化処理部2は、最適映像パラメータ導出部1で出力された最適解像度と入力解像度、本映像処理装置に入力された映像データを入力とし、入力された最適解像度よりも入力解像度が大きい場合は、例えば、ニアレストネイバー法、バイリニア法、バイキュービック法、平均画素法などの既知の画像縮小アルゴリズムを用いて入力映像データの解像度を最適解像度に解像度変換し、最適化映像データを生成する。また、入力された最適解像度が入力解像度よりも小さい場合は、画像縮小アルゴリズムを用いて入力された映像データを最適化映像データとして出力する。
【0033】
次に図7のフローチャートを用いて本実施形態の処理フローを説明する。
【0034】
まず、エッジ量算出部11は、入力された映像データからエッジ量と入力解像度を算出し最適解像度算出部12に算出したエッジ量と入力解像度を入力する(ステップ1)。
【0035】
次に、最適解像度算出部12は、入力されたエッジ量と入力解像度から最適解像度を算出し、映像最適化処理部2に算出した最適解像度と入力された入力解像度を入力する(ステップ2)。
【0036】
そして、映像最適化処理部2は入力された映像データと最適解像度と入力解像度から最適化映像データを生成する(ステップ3)。
【0037】
上記のように、指定された映像品質の条件(映像品質の低下の度合い)に応じて映像コンテンツの解像度を変換することにより、指定された閾値内に映像品質を保つことが可能となる。これにより、人的・時間的なコストをかけずに映像品質を考慮して解像度を変動させる処理を実現することができる。
【0038】
なお、上記の図4に示す映像処理装置の構成要素の各動作をプログラムとして構築し、映像処理装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
【0039】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【符号の説明】
【0040】
1 最適映像パラメータ導出部
2 映像最適化処理部
11 エッジ量算出部
12 最適解像度算出部
121 演算処理部
122 記憶部

【特許請求の範囲】
【請求項1】
入力された映像データ(以下、「入力映像データ」と記す)について、指定された映像品質の条件を満たす解像度に、入力映像データの解像度を変換する映像処理装置であって、
前記入力映像データについて、指定された映像品質の条件を満たす解像度の中から最小の解像度(最適解像度)を算出する最適映像パラメータ導出手段と、
前記最適映像パラメータ導出手段で算出した前記最適解像度に基づいて、前記入力映像データの解像度を変換して最適化映像データを出力する映像最適化処理手段と、
を備え、
前記最適映像パラメータ導出手段は、
前記入力映像データから、前記映像データのエッジ量と解像度(入力解像度)を算出するエッジ量算出手段と、
前記エッジ量と前記入力解像度から前記最適解像度を算出する最適解像度算出手段と、
を含むことを特徴とする映像処理装置。
【請求項2】
前記エッジ量算出手段は、
前記入力映像データの輝度レイヤの各フレームに対してエッジ抽出フィルタを適用して、エッジ映像データに変換する手段と、
前記エッジ映像データのフレーム毎に画素値の特徴量を算出し、算出した前記フレーム毎の画素値の特徴量をもとに、全フレームのエッジ量として算出する手段と、
を含むことを特徴とする請求項1記載の映像処理装置。
【請求項3】
前記最適解像度算出手段は、
解像度変換の前と後の解像度の組み合わせ毎に、前記エッジ量と解像度の解像度変換時の映像品質の関係を表したモデル式を設定し、前記入力解像度を解像度変換前の解像度として、当該解像度変換の前と後の解像度の組み合わせ毎に設定された該モデル式に基づいて、前記エッジ量から解像度変換時の映像品質の値を算出し、当該指定された映像品質の条件を満たす解像度の組み合わせの内、解像度変換後の解像度が最小になる解像度を最適解像度として出力する手段を含む、
ことを特徴とする請求項1記載の映像処理装置。
【請求項4】
入力された映像データ(以下、「入力映像データ」と記す)について、指定された映像品質の条件を満たす解像度に、入力映像データの解像度を変換する映像処理方法であって、
最適映像パラメータ導出手段が、前記入力映像データについて、指定された映像品質の条件を満たす解像度の中から最小の解像度(最適解像度)を算出する最適映像パラメータ導出ステップと、
映像最適化処理手段が、前記最適映像パラメータ導出手段で算出した前記最適解像度に基づいて、前記入力映像データの解像度を変換して最適化映像データを出力する映像最適化処理ステップと、
を備え、
前記最適映像パラメータ導出ステップにおいて、
前記入力映像データから、前記映像データのエッジ量と解像度(入力解像度)を算出するエッジ量算出ステップと、
前記エッジ量と前記入力解像度から前記最適解像度を算出する最適解像度算出ステップと、を含むことを特徴とする映像処理方法。
【請求項5】
前記エッジ量算出ステップにおいて、
前記入力映像データの輝度レイヤの各フレームに対してエッジ抽出フィルタを適用して、エッジ映像データに変換するステップと、
前記エッジ映像データのフレーム毎に画素値の特徴量を算出し、算出した前記フレーム毎の画素値の特徴量をもとに、全フレームのエッジ量として算出するステップと、
を含むことを特徴とする請求項4記載の映像処理方法。
【請求項6】
前記最適解像度算出ステップにおいて、
解像度変換の前と後の解像度の組み合わせ毎に、前記エッジ量と解像度の解像度変換時の映像品質の関係を表したモデル式を設定し、前記入力解像度を解像度変換前の解像度として、当該解像度変換の前と後の解像度の組み合わせ毎に設定された該モデル式に基づいて、前記エッジ量から解像度変換時の映像品質の値を算出し、当該指定された映像品質の条件を満たす解像度の組み合わせの内、解像度変換後の解像度が最小になる解像度を最適解像度として出力するステップを含む、
ことを特徴とする請求項4記載の映像処理方法。
【請求項7】
コンピュータを、
請求項1乃至3のいずれか1項に記載の映像処理装置の各手段として機能させるための映像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2013−46400(P2013−46400A)
【公開日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願番号】特願2011−185308(P2011−185308)
【出願日】平成23年8月26日(2011.8.26)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】