説明

相対カラー品質の自然言語評価システム及び方法

【課題】基準及びソース・イメージの間の相対カラー品質の客観的評価の自然言語を提供する。
【解決手段】カラー変換器110が基準イメージ及びソース・イメージの間の差測定値を受け、差測定値に基づいてカラー・アトリビュート変化を求める。カラー・アトリビュートは、例えば、色相シフト、彩度変化、カラー多様性を含む。マグニチュード・インデックス・ファシリティ120は、求めたカラー・アトリビュート変化のマグニチュードを求める。自然言語選択器130は、カラー・アトリビュート変化及びこの変化のマグニチュードを自然言語に割り当て、カラー・アトリビュート変化及びこの変化のマグニチュードのレポートを行う。出力は、テキスト又はオーディオ形式若しくはテキスト及びオーディオ形式の両方にてユーザに伝達される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、画像品質分析に関し、特に、自然言語を用いて基準イメージ及びソース・イメージの間の相対カラー品質の評価を行うシステムに関する。
【背景技術】
【0002】
ビデオは、しばしばオリジナルのビデオ・ストリームから変調ビデオ・ストリームに変化される。変化の要因は、変調ビデオ・ストリームが伝送されるターゲット媒体の帯域幅にしばしば関連するが、ビデオの変調には種々の理由がある。ビデオを処理する他の理由には、例えば、編集、圧縮及び復元、再フォーマット、ビデオ挿入及びオーバーレイ、伝送エラーの最小化、異なる表示用のカラー変調がある。
【0003】
ビデオ業界は、変調ビデオのカラー再現の限界に直面している。すなわち、ビデオ業界は、結果として生じるビデオが許容される標準を定めている。規則正しく現れる1つの問題は、オリジナルのビデオから変調ビデオへのカラー・シフト(色ずれ)である。カラー・シフトは、ほとんどのビデオ処理にて一般的であり、また、カラーの判断が生理学に基づくので必然的に主観となるため、経験的に評価するのが困難である。
【0004】
カラーのかかる問題のある変化を検出する従来方法は、次のa〜eのいずれかが必要である。すなわち、a)ビデオの前後の直接観察であるが、これには、時間がかかり、しばしばビデオ・ソースの前後の両方を同時に観察することができない。b)解釈するために熟練した操作者を必要とするベクトルスコープ又は「カラー」を用いるが、その場合にも、ヒューマン・ビジョン(人間の視覚)モデル・アスペクトの不足のために操作者がミスをするかもしれない、即ち、カラーの輝度が足らないためにベクトルスコープ上で黒がしばしば明るいカラーとして現れる。c)「カラー」(YUVのUV又はRGBベース)のピーク信号対ノイズ比(PSNR)自動化測定であるが、ベクトルスコープでの問題解決のように、ヒューマン・ビジョン・モデル・アスペクトの不足による課題をある。d)テクトロニクス社製PQA300型品質アナライザの如きヒューマン・ビジョン・モデル形式のビデオ品質分析製品は、カラーでの知覚が可能なチャンスが生じるかを判断できるが、特定の観察条件に対するいくつかの場合においては、たとえカラーが異なって現れても、カラーがどの様に異なるかを正確に予測するのに必要である重要な調節メカニズムの多くが不足している。e)動画カラー状況モデル(MICAM:Moving Image Color Appearance Model)の如く進歩したヒューマン・ビジョン・モデル技術を用いる。なお、この技術は、2009年12月10日出願の米国特許出願第12/635456号(米国特許出願公開第2010/0149344号明細書)「ビデオ品質評価予測のための動画カラー状況モデルを実現する方法及び装置」(特開2010−141897号に対応)に記載されている。しかし、熟練していない操作者にとってはMICAMの出力を解釈するのが困難であり、また、変調ビデオのいくつかの区別を正しく認識することは専門家でも困難である。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2010−141897号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
そこで、本発明は、従来技術の上述及びその他の制限を解決するものである。
【課題を解決するための手段】
【0007】
本発明の態様は、以下の通りである。
(1)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価するシステムであって;上記基準イメージ及び上記ソース・イメージの間の差測定値(差の測定値)を受けると共に、上記差測定値に基づいてカラー・アトリビュート変化を求めるカラー変換器と;求めた上記カラー・アトリビュート変化のマグニチュード(大きさ)を求めるマグニチュード・インデックス・ファシリティ(手段)と;上記カラー・アトリビュート変化及び該カラー・アトリビュート変化の上記マグニチュードに関する自然言語のレポートを発生する自然言語選択器と;上記自然言語のレポートを上記システムのユーザに伝達する出力モジュールとを具えている。
(2)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様1のシステムであって;上記カラー変換器が色相シフト決定ファシリティ(手段)であり、上記カラー・アトリビュート変化が上記基準イメージ及び上記ソース・イメージの間の色相シフトである。
(3)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様1のシステムであって;上記カラー変換器が彩度(飽和)決定ファシリティ(手段)であり、上記カラー・アトリビュート変化が上記基準イメージ及び上記ソース・イメージの間の彩度差である。
(4)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様1のシステムであって;上記カラー変換器がカラー変動決定ファシリティ(手段)であり、上記カラー・アトリビュート変化が上記基準イメージ及び上記ソース・イメージの間のカラー多様性変動である。
(5)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様1のシステムであって;上記出力モジュールは、上記自然言語のレポートを受けると共に上記システムのユーザにオーディオのレポートを発生する音声合成モジュールである。
(6)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様1のシステムであって;ユーザ入力を受けて、上記評価に含まれる上記基準イメージ及び上記ソース・イメージの部分の境界を定める関心領域選択器を更に具える。
(7)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様6のシステムであって;上記関心領域選択器が空間選択器である。
(8)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様6のシステムであって;上記関心領域選択器が時間選択器である。
(9)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価する態様1のシステムであって;上記基準イメージ及び上記ソース・イメージの各々がビデオ・イメージである。
(10)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する方法であって;上記基準イメージ及び上記ソース・イメージの間のカラー比較差の測定値(カラーを比較した結果の差の測定値)の入力を受け;上記カラー比較差の測定値を2次元カラー空間差(2次元カラー空間での差)に変換し;上記2次元カラー空間内で上記差に基づいてカラー・アトリビュート変化を求め;上記カラー・アトリビュート変化のマグニチュードを求め;上記カラー・アトリビュート変化のマグニチュードを自然言語ワードの集合の1つに割り当て;上記割り当てたマグニチュード及び上記2次元カラー空間差から上記自然言語での評価を行い、上記自然言語での評価を出力する。
(11)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する態様10方法であって;上記2次元カラー空間がCIECAM02と一致する。
(12)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する態様10方法であって;上記2次元カラー空間内の上記差に基づくカラー・アトリビュート変化を求めることは、上記基準イメージ及び上記ソース・イメージの間の色相シフトを求めることである。
(13)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する態様10方法であって;上記2次元カラー空間内の上記差に基づくカラー・アトリビュート変化を求めることは、上記基準イメージ及び上記ソース・イメージの間の彩度測定値を求めることである。
(14)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する態様10方法であって;上記2次元カラー空間内の上記差に基づくカラー・アトリビュート変化を求めることは、上記基準イメージ及び上記ソース・イメージの間のカラー変動測定値を求めることである。
(15)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する態様10方法であって;更に、上記基準イメージ及び評価対象試験イメージの各々の関心領域を選択する。
(16)基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する態様10方法であって;更に、上記自然言語評価の音声レポートを発生する。
【図面の簡単な説明】
【0008】
【図1】本発明の実施例による自然言語評価システムのブロック図である。
【図2】CIECAM02標準によるカラー記述のための2次元フレームワークの従来図である。
【図3】図1の自然言語発生器システムの構成要素を例示する実施例のブロック図である。
【図4】本発明の実施例により自然言語にて色相シフト及びレンダリングを測定する処理例の流れ図である。
【図5】本発明の実施例により自然言語にて彩度シフト及びレンダリングを測定する処理例の流れ図である。
【図6】本発明の実施例により自然言語にてカラー多様性及び/又はカラー変動並びにレンダリングを測定する処理例の流れ図である。
【発明を実施するための形態】
【0009】
本発明の概念においては、基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価するシステムを提供する。このシステムは、カラー変換器を含んでおり、このカラー変換器は、基準イメージ及びソース・イメージの間の差の測定値を受け、この差測定値に基づいてカラー・アトリビュートの変化を求める。カラー・アトリビュートは、例えば、色相シフト、彩度変化、カラー変動を含んでいる。よって、マグニチュード・インデックス・ファシリティは、求めたカラー・アトリビュート変化のマグニチュードを求める。さらに、自然言語選択器は、カラー・アトリビュート変化及びこの変化のマグニチュードを自然言語に割り当て、カラー・アトリビュート変化及びこのカラー・アトリビュート変化のマグニチュードのレポートを発生する。次に、この出力は、テキスト又はオーディオのいずれかの形式、又はテキスト及びオーディオの両方の形式でユーザに伝達される。
【0010】
本発明の他の概念においては、基準イメージ及びソース・イメージの間の相対カラー品質の評価を自然言語で提供する。これら方法は、基準イメージ及びソース・イメージの間のカラーを比較した差の測定値を受け、このカラー比較差測定値を2次元カラー空間での差に変換する。この差から、カラー・アトリビュートの変化を求め、このカラー・アトリビュート変化とそのマグニチュードとを自然言語ワードの集合に割り当てて、この比較によるユーザ用レポートを発生する。
【実施例】
【0011】
図1は、本発明の実施例による自然言語評価システム10のブロック図である。
【0012】
変調又は処理済みビデオと未処理ビデオとの関係を人間が観察するために、ビデオの全体的な印象は、次の1〜3に要約できる。1)増加した飽和又は非飽和の如きカラー彩度の変化。2)カラーの色相の全体的なシフトであるが、一般的には白のシフトが最も明瞭になる(即ち、より緑又はよりマゼンタ/紫を帯びた白の如く、異なるカラー温度又は色合いの変化)。3)彩度の変化と色相における全体的なシフトとの組合せ。本発明の実施例は、かかる比較を自然言語で表す出力を発生する。これにより、変調ビデオの評価の際に、ビデオ作成担当者が一層容易に比較結果を使用できる。
【0013】
自然言語評価システム10は、上述のMICAMの例12を含んでいる。MICAM12において、夫々一連のイメージでもよい試験イメージ(ソース・イメージ)及び基準イメージが、オプションである別々のフォーマット変換器20、21への入力として受信される。フォーマット変換器20、21は、入力を表示モジュール(モデル)24、25用のフォーマットに変換する。次に、これら表示モジュール24、25は、夫々の入力を変換して、ビュー・モデル手段28、29及び知覚モデル手段30、31の各々の入力用に光をシミュレーションする。知覚モデル手段30、31の各々は、CIECAM02{a,b}の単位で、空間的(例えば、ピクセル)及び時間的(例えば、フレーム)のサンプル毎に各カラー応答を出力する。CIECAM02は、CIEテクニカル・コミティー8−01が2002年に発行した周知のカラー・マネージメント・システム用カラー・アピアランス・モデリングである。知覚差予測手段40は、これら各{a,b}ビデオ応答を用いて、基準イメージ(単数/複数)及び変調(試験)イメージ(単数/複数)の間の知覚した差を見積る。
【0014】
知覚モデル手段30、31の他に、テクトロニクス社製PQA500/600型品質アナライザの如き認知モデル手段をシステムに追加することができる。イメージ内の関心領域を選択器42により選択できる。この関心領域は、空間又は時間のいずれか若しくは空間及び時間の両方における領域でもよい。いくつかの実施例において、ディフォルトの関心領域は、試験イメージ及び基準イメージの全長にわたる全フレーム(単数/複数)である。MICAM12の出力は、図1に示すように、統計的概要手段44の出力である。この統計的概要手段44は、選択器42の出力を受け、試験イメージ(単数/複数)及び基準イメージ(単数/複数)の間における比較の1組の統計的概略を出力する。国際的な標準は、静的なイメージ・カラー・パッチ用の推奨カラー・モデリングを実現するが、ビデオに十分正確なカラー視覚モデルを作る基本としてCIECAM02を用いる。CIECAM02をデザインし、校正し、確認して、色差のしきい値、方向及びマグニチュード(大きさ)を決定する。
【0015】
しかし、上述の米国特許出願公開第2010/0149344号明細書に記載された如く、MICAMの最終出力は、(PQR、即ち、ピクチャ品質評価、予測に加えて)差平均オピニオン・スコア(DMOS:Difference Mean Opinion Score)の如きビデオ品質概要スコアを予測するように設計されている。MICAM12が試験イメージ(単数/複数)及び基準イメージ(単数/複数)用のCIECAM02カラー空間での{a,b}座標を作成し、次に、DMOS及びPQRメトリクス(尺度)以上に試験及び基準の色差の統計的分析を潜在的にエネーブルするが、これは、ユーザに価値のあるカラーの直接的評価を直接的に伝達しない。
【0016】
図2は、CIECAM02標準によりカラーを記述するための2次元フレームワークの従来の図である。図2に示す如き直角座標にCIECAM02のLabを示す。フレームワーク80は、「a」軸に沿って「赤色がかった」から「緑色がかった」を記述すると共に、「b」軸に沿って「黄色がかった」から「青色がかった」を記述する。{a,b}面と垂直な軸は、ルミナンスを記述する。「a」及び「b」の両方の軸は、正方向及び負方向に延びる。「a」軸及び「b」軸の合流点である原点からある角度で延びる{a,b}面でのライン上でカラーを記述する。このラインに沿うカラーは、異なる彩度(飽和)レベルにある。しかし、CIECAM02は、他のカラーに侵入する前に、任意の特定のカラー・ゾーンがどのくらい広いかについて、許容誤差のせいにしない。また、CIECAM02が個別のカラーの彩度を求める方法を含んでいるが、これは、多数のカラーの傾向を扱うのでもなく、カラー変化の自然言語で評価するのでもない。
【0017】
再び図1を参照する。MICAM12の出力が自然言語生成システム50に入力する。この自然言語生成システム50は、後述のように、データの種々の処理を行い、色相の分類と、最上の量子化と、増加対減少指示とのために入力データをしきい値と比較する。更に図を参照して、詳細及び実例を説明する。
【0018】
図3は、図1の自然言語生成システム50の構成要素の実施例100のブロック図である。図3の自然言語生成システム100は、カラー変換器としてのアトリビュート測定部110を含んでおり、このアトリビュート測定部110は、3個のサブシステムを含んでいる。これらサブシステムは、色相測定ファシリティ(色相シフト決定ファシリティ)112と、彩度測定ファシリティ(彩度決定ファシリティ)114と、カラー多様性/変動測定ファシリティ(カラー変動決定ファシリティ)116とである。これらファシリティ(手段)112、114、116は、図1のMICAM12から入力を受けて、出力を発生する。
【0019】
色相測定ファシリティ112は、基準イメージからの試験イメージの色相シフト(図1)の測定値を発生する。
【0020】
[総合色相シフト]
色相測定ファシリティ112は、試験及び基準差データ{a,b}の平均(平均値の差、又は差値の平均の好適実施例のいずれか)である{mean aDiff, mean bDiff}をMICAM12の出力から得て、総合色相シフトを求める。色相シフト角度は、CIECAM02色相角度関数h(a,b)を用いて計算する。
平均色相差角度=h(mean aDiff, mean bDiff)
=atan(mean bDiff, mean aDiff)
ここで、atan関数は、図2の{a,b}グラフの4象限全て(即ち、0度から360度)の通じての固有の角度を計算する。これを図4の流れ400の処理410として示す。
【0021】
次に、処理420にて、平均色差角度又は色相角度をカージナル(基本)カラーの限界と比較する。これは、1989年発行のカラー・リサーチ・アンド・アプリケーション14(1)の6−15のアール・エム・ボイントン、アール・イー・マクロウリィ及びケイ・ウチカワによる論文「2つの方法により計算したカラー・カテゴリーのセントロイド(Centroids of Color Categories Computed by Two Methods)」(以下、単に「ボイントン論文」という)に記載の如く、知覚増分カラー空間に等しいオプティカル・ソサイエティ・オブ・アメリカ(Optical Society of America:OSA)のgjL(包括的なイメージ・ライブラリ:generic image library)に基づいて発生される如きものである。
【0022】
より詳細には、このボイントン論文及び類似の論文からのデータに基づいて、色相の変化を記述するカージナル色相と共に各カージナル色相の最大色相角度を求める。使用したこれら論文は、異なる文化及び対応する異なる言語のネイティブ・スピーカの影響を受けているが、ボイントン論文は、主に英語及び日本語を母国語とする人々に焦点を合わせ、根本的に基本カラーの分類が存するカラー空間の広い部分を識別する。例えば、ボイントン論文は、OSA(Optical Society of America)gjLカラー空間におけるピンク、赤、茶色、オレンジ、黄色、緑、青及び紫のプロットを含んでいる。茶色は、赤及びオレンジと色相角度にて充分に一致するので(L軸で表す明るさ/ルミナンスにより主に区別する)、用いない。これは、ピンク、赤、茶色、オレンジ、黄色、緑、青及び紫をカージナル・カラーとして残す。連続的なカージナル・カラーの間のカラーは、対応する名称の間にハイフォン又はスラッシュを付けて系統的に名付けることができる。例えば、緑及び黄色の領域の間にあるカラーは、「緑黄色」又は「緑/黄色」と呼ぶ。
【0023】
ボイントン論文のカージナル・カラーの境界は、OSAカラー空間にわたってカラーを完全にサンプリングし、カージナル・カラー分類にて各々を分類することにより識別される(又は行わない)。各カージナル・カラー分類の1組のカラーは、OSAのgjLからxyYに変換され、更に、CIECAM02ドキュメントに要約された方法を用いてCIECAM02{ab}空間及び対応する色相角度h(a,b)に変換される。
【0024】
CIE1931xyYカラー空間を含むCIEの総合的なカラー空間及び色差モデル(多くの写真/スペクトラム分析製品における現在の共有/標準)は、Luv、Labを含むCIEからの多くの改良(CIECAM02を含む)と、CIE色差モデルとを含む。これらの多くは、数百から数千のカラー名称のエントリとカラー空間座標への割り当てとの関連テーブル(表)を有する。カラー空間座標の一部として準命名規則を用いる1つのカラー空間は、マンセル表色尺度である。これは、米国ニューヨークのジョン・ウィリー・アンド・サンズが1982年に出版したガンター・ウズテッキ及びダブリュ・エス・スタイルズによる定量的データ及び公式集の第2版「カラー・サイエンス:概念及び方法」に記載のように、CIExyYに割り当てる例である。しかし、これら技術/標準には、上述のPQA及びMICAMシステムの如くビデオを直接評価するのに使用できるものがない。さらに、PQA及びMICAMシステムの出力は、フレーム毎のピクチャ毎に標準ユニットを用いる(即ち、空間及び時間でのロケーション当たり、出力ユニットが夫々CIE{u,v}及びCIECAM02{a,b}である)。一方、カラー名称への割り当ては、総合カラー・シフト分析に対して用いるには特殊であり、他の言語にうまく翻訳できない特定文化の言語を用いる傾向がある。また、ボイントン論文のように分類するのと一緒に、カラーのオピニオンを形成するときに、カラー量子化が行われる点を考慮していない。
【0025】
再び図4を参照する。処理420は、カラー比較及び量子化を示しており、表1(色相カラー)を参照してこの実施例を説明する。表1は、図2に示すCIECAM02{a,b}空間を用いて最大及び最小の角度により測定されたカージナル・カラーの決定済み境界である。表1の如きテーブルは、色相測定ファシリティ112内の、又はこのファシリティ112に結合された色相テーブル113として蓄積できる。
【0026】
【表1】

【0027】
図4の処理430にて、これらカージナル色相角度を、処理410で求めた色相角度と比較して、この色相をカージナルの1つ、即ち、「中間カージナル」色相に量子化する。連続したカージナル・カラーの間のカラーは、対応する名称の間にハイフォン又はスラッシュを用いて系統的に命名できる。例えば、緑及び黄色の間にあるカラーを「緑黄色」又は「緑/黄色」と呼ぶ。よって、色相分類を確立できる。
【0028】
再び図3を参照する。色相分類は、後述の彩度測定及びカラー多様性の測定とは別に、マグニチュード決定器(マグニチュード・インデックス・ファシリティ)120に進む。
【0029】
各カージナル・カラーの領域内のカラーの重心(centroid)に対して{mean aDiff, mean bDiff}のベクトル長を正規化し、CIECAM02{a,b}に変換されたボイントン論文からのデータを再び用い、上述と同様な方法を用いて、カラー変化の相対マグニチュードを求めることができる。正規化に用いる基準マグニチュードを表2(対向する色相カラー)に示すが、これは、マグニチュード・テーブル121のように、マグニチュード決定器120内に含むことができる。
【0030】
【表2】

【0031】
[例1]
例1は、次のようになる。
角度:=13
mag:=赤0.12
refMag:=赤
relMag:=mag/refMag
relMag=0.12
なお、magがマグニチュード、refMagが基準マグニチュード、relMagが相対マグニチュードを夫々表す。
【0032】
例えば、色差角度が13に決まり表1から「赤」になると、対向色相が表2から「緑青」になる。さらに、マグニチュードが上述の式に示すように0.12と求まる。この処理を図4の処理440に示す。
【0033】
カラーの変化の正規化したマグニチュードをマグニチュード決定器120から自然言語選択器130に渡して、色相及び対向色相の両方に対する分類量子化の1組のしきい値に応じて、自然言語テーブル131から適切な量的最上ワード(語)又はフレーズ(句)を選択する。これを図4の処理450に示す。
【0034】
特定の色彩シフトしきい値用の自然言語テーブルの例を表3(最上のしきい値及び量子化ビン)に示す。
【0035】
【表3】

【0036】
色相、対向色相及び最上が図3の色相測定ファシリティ112、マグニチュード決定器120及び自然言語選択器130により夫々求まると、基準イメージ(単数/複数)の色相を試験イメージ(単数/複数)と比較する自然言語センテンス(文)が次のように自然言語選択器130により発生する。
【0037】
全体的に、ビデオは、{色相}({最上2})より大きく{対向する色相}よりも小さい{最上1}に見える。
これは、上述の例1からのデータを用いて次のようになる。
「全体的に、ビデオは、赤よりも幾分大きく(青緑よりも幾分小さく)見える。」
これを図4の処理460に示す。その処理結果を出力モジュールにより出力する。
【0038】
[飽和の総合変化]
図3及び図5を参照して、彩度測定ファシリティ114(図3)の機能を説明する。
【0039】
彩度測定ファシリティ114(図3)は、MICAM12(図1)から試験及び規準の絶対値の平均{mean(|a|), mean(|b|)}を受け、これを用いて、基準イメージ(単数/複数)及び試験イメージ(単数/複数)の間の総合彩度(飽和)変化を求める。
【0040】
まず、これらの各値の試験及び基準の間の差を次のように求めるが、これを図5の例示する流れ500の処理510に示す。
diffOfMeanAbs_a = meanAbsTest_a - meanAbsRef_a
なお、diffOfMeanAbs_a(aの絶対値の平均の差)は、図1の「mean Abs(a)Diff」(絶対値aの差の平均)に対応する。また、meanAbsTest_aが試験aの絶対値の平均を表し、meanAbsRef_aが基準aの絶対値の平均を表す。動作にて平均と差を求める順序は交換可能であるが、a又はbの絶対値を求めることが最初である点に留意されたい。
【0041】
図5の処理520にてdiffOfMeanAbs_a及びdiffOfMeanAbs_bの各々の絶対値を夫々用い、分類量子化用の1組のしきい値に応じて、自然言語テーブル131(図3)から適切な量的な最上のワード又はフレーズを選択する。ここで、各符号を用いて、「より大きい」又は「より小さい」の間で選択する。
【0042】
[例2]
例2は、次のようになる。次の値
meanAbsTest_a:=0.1
meanAbsRef_a:=0.11
meanAbsTest_b:=0.08
meanAbsRef_b:=0.1
が彩度測定ファシリティ114に入力すると、
diffOfMeanAbs_a: = meanAbsTest_a - meanAbsRef_a = -0.01
diffOfMeanAbs_b: = meanAbsTest_b - meanAbsRef_b = -0.02
となる。
【0043】
まず、図5の処理510で説明するように、試験イメージ(単数/複数)及び基準イメージ(単数/複数)の間の距離(差)を上述のように求める。次に、処理520において、各距離の量子化ビンを求める。これは、どのインデックス値がdiffOfMeanAbs_a及びdiffOfMeanAbs_bの各々に対応するかを求めることを意味する。両方の距離を同じビン(テーブル3の同じしきい値レベル)に量子化すると、図3の自然言語選択器130は、図5の処理530及び540に示す如き特定の条件を記述するために次のテキストを発生する。
総合的に、ビデオ・カラーは、{最上1}{飽和/非飽和より大きい}に見える。
これは、例2からのデータを用いて、
「総合的に、ビデオ・カラーは、わずかに非飽和に見える」となる。この処理540の処理結果を出力モジュールにより出力する。
【0044】
[例3]
例3は、次のようになる。
以下の値
meanAbsTest_a:=0.3
meanAbsRef_a:=0.11
meanAbsTest_b:=0.08
meanAbsRef_b:=0.1
が彩度測定ファシリティ114に入力すると、
diffOfMeanAbs_a := meanAbsTest_a - meanAbsRef_a = 0.19
diffOfMeanAbs_b := meanAbsTest_b - meanAbsRef_b =- 0.02
となる。
【0045】
ここでは、例2と異なり、「a」及び「b」用の量子化ビンがテーブル3により異なっているとき、図3の自然言語選択器130が次のテキストを発生する。
総合的に、ビデオは、{最上1}{より飽和/非飽和}赤及び/又は緑と、{最上2}{より飽和/非飽和}青及び/又は黄色とを有する。
これは、例3からのデータを用いて、次のようになる。
総合的に、ビデオは、{最上1}{より飽和/非飽和}赤及び/又は緑と、{最上2}{より飽和/非飽和}青及び/又は黄色とを有する。
これは、例3からのデータを用いて、
「総合的に、ビデオは、目立つ、より飽和の赤及び/又は緑と、わずかに非飽和の青及び/又は黄色とを有する」となる。
【0046】
[カラー多様性/変動における総合変化]
カラー多様性/変動測定ファシリティ116(図3)は、MICAM12の出力から試験及び基準イメージ(単数/複数)の標準偏差を求める。
まず、図6に示す流れ600の処理610に示すように、試験イメージ(単数/複数)の標準偏差(stdevTest_a)及び基準イメージ(単数/複数)の標準偏差(stdevRef_a)の間の差(diffStdev_a)を次のように求める。
diffStdev_a = stdevTest_a - stdevRef_a
ここで、diffStdev_aは、図1のstdev(a)Diffに対応する。
【0047】
次に、diffStdev_a及びdiffStdev_bの各々の絶対値を夫々用いて、例えば、分類量子化用の1組のしきい値に応じて、図3の自然言語テーブル131から適切な量的最上ワード又はフレーズを選択する。図3の自然言語選択器130は、比較の各符号を用いて、「より大きい」又は「より小さい」の間の選択を行う。
【0048】
以下の例は、自然言語への総合色相シフト測定変換の方法を更に示す。
【0049】
[例4]
例4は、次のようになる。
次の値
stdevTest_a:=0.1
stdevRev_a:=0.11
stdevTest_b:=0.08
stdevRev_b:=0.1
をカラー多様性/変動測定ファシリティ116に入力すると、
diffStdev_a := stdevTest_a - stdevRef_a = -0.01
diffStdev_b := stdevTest_b - stdevRef_b = -0.02
となる。
【0050】
diffStdev_a及びdiffStdev_bの各々の標準偏差での差を自然言語テーブル131(図3)内のしきい値と比較して、各値の対応量子化ビンを選択する。
【0051】
diffStdev_a及びdiffStdev_bの両方が同じ値に量子化をすると、図6の処理630及び640に示すように、図3の自然言語選択器130は、特定の条件を記述するために次のテキストを発生する。
総合的に、ビデオは、{最上1}{より大きい/より小さい}から多様性を有する。
これは、例4において、diffStdev_a及びdiffStdev_bが共にビン1に量子化されるので、
「総合的に、ビデオは、わずかに小さいカラー多様性を有する」
となる。この処理640の処理結果を出力モジュールにより出力する。
【0052】
[例5]
例5は,次のようになる。
次の値
stdevTest_a:=0.3
stdevRev_a:=0.11
stdevTest_b:=0.08
stdevRev_b:=0.1
がカラー多様性/変動測定ファシリティ116に入力すると、
diffStdev_a := stdevTest_a - stdevRef_a = -0.19
diffStdev_b := stdevTest_b - stdevRef_b = -0.02
となる。
【0053】
diffStdev_a及びdiffStdev_bの各々の標準偏差での差を自然言語テーブル131(図3)内のしきい値と比較して、各値の対応量子化ビンを選択する。
【0054】
diffStdev_a及びdiffStdev_bの両方が異なる値に量子化されると、図6の処理630及び640にて特定条件を記述するために、図3の自然言語選択器130は、次のテキストを発生する。
総合的に、ビデオは、赤及び/又は緑での{最上1}{より大きい/より小さい}多様性と、青及び/又は黄色での{最上2}{より大きい/より小さい}多様性とを有する。
これは、例5において、diffStdev_aがビン2に量子化され、diffStdev_bがビン1に量子化されるので、
「総合的に、ビデオは、赤及び/又は緑にて目立つより大きい多様性と、青及び/又は黄色にてわずかに小さい多様性とを有する」
となる。
【0055】
再び図1及び図3を参照する。上述では、出力モジュールがテキストに書いた自然言語を発生する例を説明したが、本発明の別の実施例では、出力モジュールとして音声モジュール60、140を追加的に含んでいる。音声モジュール(音声合成モジュール)60及び140は、音声プロセッサを含んでおり、この音声プロセッサは、自然言語生成システム50、自然言語選択器130からの自然言語評価を受けて、この評価のオーディオ・メッセージを発生する。これら実施例は、テキスト・メッセージを読取るのが不便ないくつかの場合に重要である。例えば、ビデオ・エディタは、ビデオを観察しながら、変調されたビデオを実時間で編集できる一方、本発明の実施例は、測定したアトリビュートの音声プロンプト(指示メッセージ)を実時間で周期的に提供する。この方法にて、ビデオ・エッジは、操作者の目線が処理済みビデオ・ストリームに集中できるようにし、編集処理期間中に変化するカラー・アトリビュートのレポートを操作者が読む必要もなく、オリジナル・ビデオを調べる必要もない。
【0056】
上述の如く、本発明の実施例は、基準及びソース(試験)イメージの間の相対カラー品質の自然言語の客観的な評価を行うシステムを含む。このシステムは、カラー変換器を含んでおり、このカラー変換器は、基準イメージ及びソース・イメージの間の差測定値を受けて、この差測定値に基づいてカラー・アトリビュート変化を求める。カラー・アトリビュートは、例えば、色相シフト、彩度変化及びカラー変動を含んでいる。さらに、マグニチュード・インデックス・ファシリティは、求めたカラー・アトリビュート変化のマグニチュードを求める。さらに、自然言語選択器は、カラー・アトリビュート変化と、この変化のマグニチュードを自然言語に割り当て、カラー・アトリビュート変化とこのカラー・アトリビュート変化のマグニチュードとのレポートを行う。この出力は、テキスト又はオーディオ形式で、若しくはテキスト及びオーディオの両方の形式でユーザに伝達される。
【0057】
本発明の特定実施例について上述したが、本発明の要旨がこれら実施例に限定されないことは明らかである。本発明の要旨を逸脱することなく種々の変形変更が可能である。
【符号の説明】
【0058】
10 自然言語評価システム
12 MICAM
20、21 フォーマット変換器
24、25 表示モジュール
28、29 ビュー・モデル
30、31 知覚モデル
40 知覚差予測手段
42 関心領域選択器
44 統計的概要手段
50 自然言語生成システム
60 音声(合成)モジュール(出力モジュール)
80 フレームワーク
100 自然言語生成システム
110 アトリビュート測定部(カラー変換器)
112 位相測定ファシリティ(位相シフト決定ファシリティ)
113 色相テーブル
114 彩度測定ファシリティ(彩度決定ファシリティ)
115 彩度テーブル
116 カラー多様性/変動測定ファシリティ(カラー変動決定ファシリティ)
117 カラー・テーブル
120 マグニチュード決定器(マグニチュード・インデックス・ファシリティ)
121 マグニチュード・テーブル
130 自然言語選択器
131 自然言語テーブル
140 音声モジュール(出力モジュール)

【特許請求の範囲】
【請求項1】
基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で客観的に評価するシステムであって、
上記基準イメージ及び上記ソース・イメージの間の差測定値を受けると共に、上記差測定値に基づいてカラー・アトリビュート変化を求めるカラー変換器と、
求めた上記カラー・アトリビュート変化のマグニチュードを求めるマグニチュード・インデックス・ファシリティと、
上記カラー・アトリビュート変化及び該カラー・アトリビュート変化の上記マグニチュードに関する自然言語のレポートを発生する自然言語選択器と、
上記自然言語のレポートを上記システムのユーザに伝達する出力モジュールと
を具えた相対カラー品質の自然言語評価システム。
【請求項2】
基準イメージ及びソース・イメージの間の相対カラー品質を自然言語で評価する方法であって、
上記基準イメージ及び上記ソース・イメージの間のカラー比較差の測定値を入力として受け、
上記カラー比較差の測定値を2次元カラー空間差に変換し、
上記2次元カラー空間内で上記差に基づいてカラー・アトリビュート変化を求め、
上記カラー・アトリビュート変化のマグニチュードを求め、
上記カラー・アトリビュート変化のマグニチュードを自然言語ワードの集合の1つに割り当て、
上記割り当てたマグニチュード及び上記2次元カラー空間差から上記自然言語での評価を行い、
上記自然言語での評価を出力する
ことを特徴とする相対カラー品質の自然言語評価方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−227914(P2012−227914A)
【公開日】平成24年11月15日(2012.11.15)
【国際特許分類】
【出願番号】特願2012−61892(P2012−61892)
【出願日】平成24年3月19日(2012.3.19)
【出願人】(391002340)テクトロニクス・インコーポレイテッド (234)
【氏名又は名称原語表記】TEKTRONIX,INC.
【Fターム(参考)】