説明

イメージ信号の圧縮方法及び装置

DCTよりさらに効率的な圧縮を提供しつつも、最小のオーバーヘッド情報を有するイメージ信号の圧縮方式を提供する。DCT変換マトリックスの行間と列間との部分的な交換の程度を示すアングル・パラメータに対して、さまざまな値を適用してDCT変換マトリックスの行間と列間との部分的な交換を行う。かようなDCT変換マトリックスの修正を介して、さらに効率的な圧縮係数マトリックスを生成する。パラメータとして使われたアングル・パラメータをそのまま保存したり伝送するならば、オーバーヘッドがあまりにも大きくなる。アングル・パラメータのランダム・シーケンスを生成し、シーケンス上のそれぞれのアングル・パラメータに対して、圧縮係数マトリックスを生成して圧縮率を求める過程を反復し、最も高い圧縮率を有するアングル・パラメータを求める。ここで、最も高い圧縮率を有するアングル・パラメータ自体を保存したり伝送せずに、当該アングル・パラメータのランダム・シーケンス上での番号を求め、これを保存したり伝送する。これにより、平均6%ほどの圧縮率上昇をもたらすことができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、イメージ信号の圧縮に係り、特に、トランスフォーム・マトリックスの修正(modification of transform matrix)によって圧縮率を向上させるイメージ信号の圧縮方法及び装置に関する。
【背景技術】
【0002】
DCT(discrete cosine transform)は、ビデオ、イメージまたはオーディオの圧縮に使われる周知の技術である。最近何年間、さらに効率的なコーディング方式を見出すための多くの試みがあった。オーディオ・コーディングでは、パラメトリック・コーディングがDCTよりさらに良好な結果を示している。二次元(2D)データについては、KLT(Karhunen Loevetransform)係数が最小ビットインターバルを有するが、オーバーヘッド情報のサイズが非常に大きくなるという問題点がある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明では、DCTよりさらに効率的な圧縮を提供しつつも、最小のオーバーヘッド情報を有するイメージ信号の圧縮方式を提供するものである。
【課題を解決するための手段】
【0004】
本発明では、DCT変換マトリックスの行間と列間との部分的な交換の程度を示すパラメータに対してさまざまな値を使用し、DCT変換マトリックスの行間と列間との部分的な交換を行う。本発明では、かようなパラメータをアングル・パラメータと呼ぶ。かようなDCT変換マトリックスの修正を介して、さらに効率的な圧縮係数マトリックスを生成する。
【0005】
使われたアングル・パラメータの値をそのまま保存したり伝送するならば、オーバーヘッドがあまりにも大きくなる。本発明では、アングル・パラメータのランダム・シーケンスを生成し、シーケンス上のそれぞれのアングル・パラメータに対して、圧縮係数マトリックスを生成して圧縮率を求める過程を反復し、最も高い圧縮率を有するアングル・パラメータを求める。ここで、最も高い圧縮率を有するアングル・パラメータ自体を保存したり伝送せずに、当該アングル・パラメータのランダム・シーケンス上での番号を求め、これを保存したり伝送する。
【0006】
本発明によるイメージ信号圧縮方法は、DCT変換マトリックスの行間と列間との部分的な交換を行う段階と、前記行間と列間との部分的な交換が行われたDCT変換マトリックスを使用し、圧縮しようとするイメージ信号をDCT変換する段階と、前記DCT変換されたイメージ信号を圧縮する段階と、前記DCT変換マトリックスの行間と列間との部分的な交換の程度を示すアングル・パラメータに対してさまざまな値を適用し、前記DCT変換マトリックスの行間と列間との部分的な交換を行うことと、前記圧縮しようとするイメージ信号をDCT変換することと、前記DCT変換されたイメージ信号を圧縮することとを反復遂行し、最も高い圧縮率に対応するアングル・パラメータを選択する段階とを含むことを特徴とする。
【0007】
前記アングル・パラメータは、オイラー・アングルであることが望ましい。
【0008】
前記DCT変換マトリックスの行間と列間との部分的な交換を行う段階は、前記DCT変換マトリックス左側の前記行間の部分的な交換に該当するマトリックスを乗じ、前記DCT変換マトリックス右側の前記列間の部分的な交換に該当するマトリックスを乗じる段階を含むことが望ましい。
【0009】
前記行間の部分的な交換に該当するマトリックスは、
【0010】
【数1】

であり、前記マトリックスで、
【0011】
【数2】

であり、前記α,β,γは、オイラー・アングルであることが望ましい。
【0012】
前記最も高い圧縮率に対応するアングル・パラメータを選択する段階は、前記アングル・パラメータに対して、ランダム・シーケンスを生成する段階と、前記ランダム・シーケンスの値それぞれに対し、前記DCT変換マトリックスの行間と列間との部分的な交換を行うことと、前記圧縮しようとするイメージ信号をDCT変換することと、前記DCT変換されたイメージ信号を圧縮することとを含み、前記イメージ信号に対する圧縮率を求める段階と、前記ランダム・シーケンスの値それぞれに対して求めた圧縮率のうち、最も高い圧縮率を求める段階と、前記最も高い圧縮率に対応するアングル・パラメータの値を選択する段階とを含むことが望ましい。
【0013】
前記イメージ信号の圧縮方法は、前記最も高い圧縮率に対応するアングル・パラメータの値の前記ランダム・シーケンス上の番号を求める段階と、前記最も高い圧縮率で圧縮されたイメージ信号、及び前記対応するランダム・シーケンス上の番号を保存したり、デコーダ側に伝送する段階とをさらに含むことが望ましい。
【0014】
前記アングル・パラメータに対して生成するランダム・シーケンスは、レーマーの擬似乱数(pseudo-random number)であることが望ましい。
【0015】
前記アングル・パラメータに対してさまざまな値を適用し、前記DCT変換マトリックスの行間と列間との部分的な交換を行う段階と、前記圧縮しようとするイメージ信号をDCT変換する段階と、前記DCT変換されたイメージ信号を圧縮する段階とを反復遂行し、最も高い圧縮率に対応するアングル・パラメータを選択する段階は、モンテカルロ法(Monte Carlo method)を使用し、前記DCT変換マトリックスの行間と列間との部分的な交換を行う段階と、前記圧縮しようとするイメージ信号をDCT変換する段階と、前記DCT変換されたイメージ信号を圧縮する段階とを反復遂行する段階と含むことが望ましい。
【0016】
また、前記オイラー・アングルは、0°近くまたは180°近くの値を有することが望ましい。
【0017】
本発明によるイメージ信号圧縮装置は、DCT変換マトリックスの行間と列間との部分的な交換を行う行間と列間との交換部と、前記行間と列間との部分的な交換が行われたDCT変換マトリックスを使用し、圧縮しようとするイメージ信号をDCT変換するDCT変換部と、前記DCT変換されたイメージ信号を圧縮するイメージ圧縮部と、前記DCT変換マトリックスの行間と列間との部分的な交換の程度を示すアングル・パラメータに対してさまざまな値を適用し、前記行間と列間との交換部、DCT変換部及びイメージ圧縮部を反復動作させ、最も高い圧縮率に対応するアングル・パラメータを選択する制御部とを含むことを特徴とする。
【0018】
前記アングル・パラメータは、オイラー・アングルであることが望ましい。
【0019】
前記行間と列間との交換部は、前記DCT変換マトリックス左側の前記行間の部分的な交換に該当するマトリックスを乗じ、前記DCT変換マトリックス右側の前記列間の部分的な交換に該当するマトリックスを乗じることが望ましい。
【0020】
前記制御部は、前記アングル・パラメータに対して、ランダム・シーケンスを生成し、前記ランダム・シーケンスの値それぞれに対し、前記行間と列間との交換部、DCT変換部及びイメージ圧縮部を動作させ、前記イメージ信号に対する圧縮率を求め、前記ランダム・シーケンスの値それぞれに対して求めた圧縮率のうち、最も高い圧縮率を求め、前記最も高い圧縮率に対応するアングル・パラメータの値を選択することが望ましい。
【0021】
また、前記制御部は、前記最も高い圧縮率に対応するアングル・パラメータの値の前記ランダム・シーケンス上の番号を求め、前記最も高い圧縮率で圧縮されたイメージ信号及び対応する前記ランダム・シーケンス上の番号を保存したり、デコーダ側に伝送することが望ましい。
【0022】
また、前記制御部は、モンテカルロ法を使用し、前記行間と列間との交換部、DCT変換部及びイメージ圧縮部を反復動作させて最も高い圧縮率に対応するアングル・パラメータを選択することが望ましい。
【発明の効果】
【0023】
本発明によるイメージ信号圧縮方法及び装置によれば、イメージ信号自体の圧縮率を向上させると同時に、変換マトリックスを修正するためのパラメータ自体を圧縮するための方式を提供し、オーバーヘッドを減少させる。従って、全体的に保存したり、デコーダ側に伝送せねばならないデータの量が減少する。
【図面の簡単な説明】
【0024】
【図1】DCT変換マトリックスの行間と列間との交換について説明するための図である。
【図2】DCT変換マトリックスの行間と列間との交換について説明するための図である。
【図3】オイラー・アングルについて示した図である。
【図4】モンテカルロ法での均一グリッドポイントと擬似ランダムポイントとの比較のための図である。
【図5】本発明の一実施形態によるイメージ信号圧縮装置のブロック図である。
【図6】本発明の一実施形態によるイメージ信号圧縮方法のフローチャートである。
【図7】本発明による圧縮率の上昇を表したグラフである。
【図8】本発明による圧縮率の上昇を表したグラフである。
【発明を実施するための形態】
【0025】
以下、添付された図面を参照しつつ、本発明によるイメージ信号の圧縮方法及び装置について詳細に説明する。
【0026】
<マトリックスの行間と列間との交換>
本発明では、DCT(discrete cosine transform)マトリックスの行間と列間との部分的な交換を行う。かようなDCTマトリックスの修正を介して、さらに効率的な圧縮係数マトリックスを生成する。
【0027】
図1と図2とを参照しつつ、DCTマトリックスの行間と列間との交換について説明する。
【0028】
本発明で行間の部分的な交換というのは、行間を全部交換するのではなく、パラメータの値によって部分的に交換することを意味する。
【0029】
2行の行であるAとBとの交換は、パラメータaの値によって、次の式(1)のように定義されうる。
行A(new)=cos(a)*行A(old)+sin(a)*行B(old)
行B(new)=sin(a)*行A(old)+cos(a)*行B(old) (1)
式(1)を参照するに、パラメータa(angle)は、角の役割を行うということが分かる。従って、本発明では、このように、DCTマトリックスの行間と列間との部分的な交換の程度を示すパラメータをアングル・パラメータと呼ぶ。
【0030】
パラメータaの値が0°である場合、交換が起こらない場合を意味する。また、パラメータaの値が90°である場合、行間の全部交換が起こる場合を意味する。
【0031】
また、パラメータaの値が90°より大きく、180°より小さい値を有する場合、行間の交換と共に、エレメント値の符号(sign)が変更される場合を示す。パラメータaの値が180°である場合、行間の交換が起こらないが、それぞれの行に含まれたエレメントの符号がいずれも変更される。
【0032】
本発明で、列間の部分的な交換は、前記行間の部分的な交換のような方式で定義される。
【0033】
図1は、4x4 DCTトランスフォーム・マトリックスの場合を示している。図1を参照するに、行間の交換に3つのパラメータα,α,αが使われ、列間の交換に3つのパラメータα,α,αが使われる。
【0034】
また、図2は、8x8トランスフォーム・マトリックスの場合を示している。図2の場合には、α,α,α,α,α,αが行間の交換に使われておち、α,α,α,α10,α11,α12が列間の交換に使われている。
【0035】
図1で、パラメータα,α,αの適用順序によって、互いに異なる結果が導き出される。すなわち、3つのパラメータは、互いに独立的ではない。パラメータαをまず適用し、パラメータαを適用した場合のマトリックス値と、パラメータαをまず適用し、パラメータαを適用する場合のマトリックス値は異なる。
【0036】
本発明で、マトリックスの行間または列間の交換について詳細に注意深くみれば、三次元上の座標軸の回転と類似していることが分かる。すなわち、3列がそれぞれ三次元座標上のX,Y,Z軸に対応する。
【0037】
三次元上の座標軸の回転においても、どの軸をまず回転させるかによって、結果が変わる。従って、三次元上の座標軸の回転を示す方式について多くの試みがあり、そのうち代表的なものがオイラー・アングル(Euler angles)である。
【0038】
<オイラー・アングル>
図3は、オイラー・アングルについて示した図である。図3を参照するに、α,β,γの3つの角(angle)がオイラー・アングルを示している。図3で、X,Y,Z軸は、回転前の座標軸を示し、X’,Y’,Z’軸は、回転後の座標軸を示す。N軸は、XY平面とX‘Y’平面との交線(intersection)である。N軸をline of nodesと呼ぶ。
【0039】
角αは、Z軸を回転軸とするX軸とN軸との間の角度である。角βは、N軸を回転軸とするZ軸とZ’軸との間の角度である。角γは、Z’軸を回転軸とするN軸とX’軸との間の角度である。
【0040】
オイラー・アングルを適用した座標軸の回転をマトリックス形態で示せば、次の式(2)の通りである。
【0041】
【数3】

第1のマトリックスは、Z’軸を回転軸とする回転(rotation around Z’)を示す。第2のマトリックスは、N軸を回転軸とする回転(rotation around N)を示す。第3のマトリックスは、Z軸を回転軸とする回転(rotation around Z)を示す。
【0042】
本発明では、マトリックスの行間と列間との交換を、オイラー・アングルを使用する座標軸の回転で示すことが望ましい。
【0043】
<本発明の概要>
圧縮を効率的に行うための最適のトランスフォーム・マトリックスを見出すことは、パラメータに対する強いノンスムース依存性(strongly non-smooth dependence on parameter)を有する古典的なマルチパラメータ問題(multi parameter problem)である。このような問題を解決するために、モンテカルロ法(Monte Carlo method)が使われる。モンテカルロ法におけるランダムポイントの生成には、レーマーの数列(Lemer’s sequence number)が使われうる。レーマーの数列を使用することによって、パラメータとして使われるアングル・パラメータ自体を保存したり伝送する代わりに、1つの(整数だけを保存したり伝送できるようになる。従って、使われたパラメータ値をデコーダ側に知らせるために必要なオーバーヘッドが減少する。
【0044】
すなわち、最適の実施形態で使われるアイテムは、次の通りである。
【0045】
1.DCTマトリックスの可逆変換
2.さらに効率的なコーディングのためのエネルギーの再配置
3.レーマーの数を使用した付加される情報の最小化
図1と図2とを再び参照するに、DCTマトリックスで、回転によって修正される部分は黒色であり、修正されない部分は、白色で示している。図1の4x4トランスフォームブロックでは、6個のアングル・パラメータが行間と列間とのエネルギー再配置による15個のエレメントの修正を示している。図2の8x8ブロックでは、12個のアングル・パラメータが60個のエレメントの修正に関係する。
【0046】
図1を参照するに、行間の交換において、3個のアングル・パラメータが必要であり、列間の交換においてまた、3個のアングル・パラメータが必要であることが分かる。従って、4x4ブロックにおいては、6個のアングル・パラメータが必要である。
【0047】
図2を参照するに、行間の交換に、6個のアングル・パラメータが必要であり、列間の交換に、6個のアングル・パラメータが必要である。従って、8x8ブロックにおいては、全12個のアングル・パラメータが必要である。
【0048】
<発明の構造>
本発明の構造は、次の通りである。
【0049】
1段階−直交トランスフォーム・ファミリーパラメータ化(orthogonal transform family parameterization)
2段階−モンテカルロ法
3段階−レーマーの擬似乱数(Lemer’s pseudo-random numbers)
4段階−最適化されたアングル・パラメータのための変域のローカリゼーション(localization of diapason for optimal angle parameters)
5段階−準最適化されたベーシス(quasi-optimal basis)
<発明の動作>
ビデオ自体の圧縮率を向上させるために追加されるパラメータの数があまりにも多くなるならば、圧縮を使用せずに、ビデオ信号自体を伝送するのがかえって望ましいという状況になる。例えば、4x4ブロックで、イメージ信号を圧縮し、ほぼ0に近いサイズにしたとしても、16個の追加的なパラメータを必要とするならば、ビデオデータの圧縮のために、何も行う必要がなくなる。なぜならば、これは、16個のピクセル値をパラメータ自体としてデコーダに伝送するのと同一であるためである。
【0050】
このように、イメージ信号自体を圧縮すると同時に、追加されるオーバーヘッドを最小化することが望ましいということが分かる。
【0051】
本発明での目標は、最小限の付加される情報を使用し、ビデオシーケンスを圧縮するためのトランスフォームを最適化することである。
【0052】
<1段階−直交トランスフォーム・ファミリーパラメータ化>
現在のデータトランスフォームを最適化するために、ベーシスを固有に記述するパラメータの集合を決定する必要がある。ベーシスは、トランスフォーム・マトリックスによって表現される。従って、ベーシスの修正は、トランスフォーム・マトリックスの修正によって表現される。
【0053】
ベーシス修正の主な方法として、ベーシス回転を選択する。本発明で、ベーシスの回転は、アングル・パラメータを使用して行われる。アングル・パラメータを使用したベーシスの回転を、イメージ・トランスフォームの最適化に適用することは、新規アイディアである。本発明で、前記アングル・パラメータは、オイラー・アングルであることが望ましい。しかし、マトリックスの行間と列間との部分的な交換の程度を示すものであるならば、いかなるものでも本発明によるアングル・パラメータになり、従って、本発明によるアングル・パラメータは、オイラー・アングルに限定されるものではない。以下では、オイラー・アングルを使用した実施形態について説明する。
【0054】
トランスフォーム最適化の観点から、オイラー・アングル回転は、DCTマトリックスDの左側積
【0055】
【数4】

及び右側積
【0056】
【数5】

を使用し、次の式(3)のように定義される。
【0057】
【数6】

ここで、D’は、回転によって修正されたDCTマトリックスである。
【0058】
マトリックス
【0059】
【数7】

は、DCTマトリックスDの行間の交換を行う。マトリックス
【0060】
【数8】

は、DCT係数マトリックスDの列間の交換を行う。
【0061】
4x4ブロックにおけるマトリックス
【0062】
【数9】

の一例は、次の式(4)のようである。
【0063】
【数10】

ここで、式(4)で、α,β,γはオイラー・アングルである。
【0064】
従って、4x4ブロックの場合、オイラー・アングルは、6個のパラメータα,α,α,α,α,αの集合によって、15個のDCT係数の修正を記述する。8x8トランスフォームについては、12個のオイラー・アングルα,α,α,α,α,α,α,α,α,α10,α11,α12が60個のDCT係数の修正を記述する。このように、トランスフォーム修正を技術するためのパラメータの縮小を十分に行うことが、提案された発明の第1のアイテムである。
【0065】
<2段階−モンテカルロ法>
自由度が6個のアングル・パラメータ(8x8トランスフォームの場合、12個のアングル・パラメータ)に減少した後、最適化の問題を、ビット節約の観点から調べる必要がある。すなわち、アングルの集合を選択する方法を最適化せねばならない。
【0066】
このような最適化問題には、パラメータの高次元ドメイン(6または12個のアングル・パラメータ)が使われるという点と、イメージの圧縮が使われたパラメータに、ノンスムース(non-smooth)に依存するという点とに困難さがある。このような問題は、伝統的にモンテカルロ法によって解決されたた。
【0067】
モンテカルロ法の核心を要約すれば、多数の試みを行うことである。すなわち、さまざまなポイントでの関数値(本発明では、圧縮率)を測定し、最も良好なポイントを選択することである。モンテカルロ法では、多次元ドメインでのランダムポイントの品質(quality)が非常に重要である(特に、次元が増加することによって、さらに重要である)。このようなアプリケーションでは、均一グリッド(uniform grid)ポイントよりも、擬似ランダム(pseudo-random)ポイントがさらに好まれるということが知られている。簡単に2Dケースについて述べれば、図4の通りである。
【0068】
図4の左側には、均一グリッドポイントが図示されており、右側には、擬似ランダム・シーケンスによる最初の16個のポイントが図示されている。
【0069】
均一グリッドポイントを使用する場合、モンテカルロ法の16回の試みにもかかわらず、第1のパラメータ(及び第2のパラメータ)に対し、4個の異なる値しか検査されていない。一方、擬似ランダム・シーケンスを使用する場合、16回の試みによって、第1のパラメータ(及び第2のパラメータ)に対し、16個の互いに異なる値を検査している。すなわち、擬似ランダムポイントを使用する場合、16個の値に対し、第1のパラメータと第2のパラメータとの互いに異なる値について十分に調べることが可能である。特に、パラメータの数が増加することによって、モンテカルロ方式において、均一グリッドポイントよりは、擬似ランダム・シーケンスを使用することが有利であることが容易に分かるのである。
【0070】
モンテカルロ法は、最適化問題を解決するための効率性を提供するために、非常に重要である。
【0071】
<3段階−レーマーの擬似乱数>
擬似乱数列(pseudo-random sequence)を生成する方式には、さまざまがある。最も効率的な方式の1つのレーマーの数を使用するのである。これは、人工的に生成される数列であり、均一に分布された実際の乱数に最も近い性質である。レーマーの数列を生成するアルゴリズムは周知であるので、本明細書では、詳細な説明を省略する。本発明で目的とするところを満足するためには、少なくとも1013個の反復されないポイントを提供せねばならない。レーマーの数列は、生成アルゴリズムが知られている人工的な数列であるから、デコーダ側で容易に再計算できる。
【0072】
レーマーの数列を使用することによって、パラメータの集合、すなわちアングル・パラメータを1つの情報(すなわち、ランダム・シーケンス上の番号)を使用してコーディングできる。
【0073】
六次元または12次元パラメータドメインで、一つずつランダムポイントを生成し、これを利用して圧縮を行って圧縮率を測定した後、最適のポイントを選択する。最適のパラメータの集合自体を保存したり伝送する代わりに、前記最適のパラメータ・ポイントがシーケンス上で発生した位置に対応する数を保存したり伝送すればよい。
【0074】
もしモンテカルロ法で、2個のポイントに対する検査を行ったならば、pビットの情報のみをオーバーヘッドとして有することになる。
【0075】
<4段階−最適化されたアングル・パラメータのための変域のローカリゼーション>
本発明の発明者らは、実験を介して、最適化された回転アングルは、0°近くまたは180°(πラジアン)近くの値を有するということを発見した。これは、DCTベーシスが、すでにほぼ最適化された状態であることを示す。
【0076】
従って、本発明によるアングル・パラメータは、部分的な列間と行間の部分的な交換(オイラー・アングルの場合、0°近くのアングル)を行ったり、部分的な交換及びベーシスエレメントのサインの変更(オイラー・アングルの場合、180°近くのアングル)を行う必要があるだけである。
【0077】
すなわち、本発明で使われるパラメータの変域(diapason)は、ドメインの特定部分に限定されるのであるが、これをローカリゼーション(localization)という。
【0078】
パラメータの変域に対するローカリゼーションを行うことによって、オーバーヘッドに対するビット数が減少する。図4で、検査せねばならないポイントが特定部分に限定される場合を仮定すれば、検査せねばならない面積が減るということが分かる。単位面積当たり検査するポイントの数が増加することによって圧縮率が向上するが、同じ圧縮率向上のために、ローカリゼーション前後を比較してみれば、ローカリゼーションが適用される場合に検査せねばならないポイントの数が減少することが分かる。
【0079】
また、検査するポイントの数が固定されているならば(すなわち、オーバーヘッドとして使用するビット数が固定されている場合)、ローカリゼーションが適用される場合、単位面積当たりさらに多くのポイントを検査できるようになるので、圧縮率がより上昇することになる。
【0080】
<5段階−準最適化されたベーシス>
前記1段階ないし4段階の具現によって、あらゆるブロック(4x4または8x8)に対する最適化されたベーシスを選択することが可能になる。高いビットレートでは、ブロック当たり8または10バイトのオーバーヘッドが追加されうる。ビットレートが低くなる場合、準最適化されたベーシスを選択することが望ましい。
【0081】
準最適化されたベーシスとは、1つのマクロブロックまたはフレームに含まれたあらゆるブロック、または一部ブロックの集合に対して、同じ回転を適用することを意味する。
【0082】
それぞれのブロックに対して最適化された回転を適用するならば、イメージ自体に対する圧縮率は上昇するが、オーバーヘッドが増加することになる。
【0083】
1ブロック、ブロックの集合、1つのマクロブロック、1つのフレームのうち、いずれのブロックグループに対しても同じ回転を適用するについては、多様な実験によって決定されうる。
【0084】
低いビットレートでは、回転後にブロックの多くの部分で量子化係数値が0になる。従って、かようなブロックに対しては、回転アングル値についての付加情報を伝送する必要がない。
【0085】
<実施形態>
図5は、本発明の一実施形態によるイメージ信号圧縮装置のブロック図である。図5を参照するに、本発明によるイメージ信号圧縮装置100は、行間と列間との交換部110、DCT変換部120、イメージ圧縮部130及び制御部140を含むことが望ましい。
【0086】
行間と列間との交換部110は、DCTマトリックスの行間と列間との部分的な交換を行う。式(3)で見た通り、行間と列間との交換部110は、DCTマトリックスの左側の行間の部分的な交換に該当するマトリックス
【0087】
【数11】

を乗じ、DCTマトリックスの右側の列間の部分的な交換に該当するマトリックス
【0088】
【数12】

を乗じることが望ましいが、これに限定されるものではなく、他の方式でDCTマトリックスの行間と列間との部分的な交換を行うこともできる。
【0089】
DCT変換部120は、前記行間と列間との部分的な交換が行われたDCTマトリックスを使用し、圧縮しようとするイメージ信号をDCT変換する。これを数式で示せば、次の式(5)の通りである。
【0090】
【数13】

前記式(5)で、D’は、修正されたDCTマトリックスであり、Sは、圧縮しようとするイメージ信号マトリックスである。
【0091】
イメージ圧縮部130は、DCT変換されたイメージ信号(前記Y)を圧縮する。
【0092】
制御部140は、アングル・パラメータに対してさまざまな値を適用し、前記行間と列間との交換部110、DCT変換部120及びイメージ圧縮部130を反復動作させ(以下、「反復動作」とする)、最も高い圧縮率に対応するアングル・パラメータを選択する。
【0093】
制御部140は、モンテカルロ法を使用し、多数のアングル・パラメータに対して、前記反復動作を遂行し、最も高い圧縮率に対応するアングル・パラメータを選択する。
【0094】
このために、制御部140は、アングル・パラメータに対してランダム・シーケンスを生成し、ランダム・シーケンスの値それぞれに対して前記反復動作を行い、イメージ信号に対する圧縮率を求め、最も高い圧縮率を有するアングル・パラメータの値を選択する。
【0095】
また、制御部140は、オーバーヘッドを減らすために、アングル・パラメータの値を直接保存したり伝送せずに、最も高い圧縮率に対応するアングル・パラメータ値のランダム・シーケンス上の番号(すなわち、位置)を求め、対応する圧縮されたイメージ信号及びランダム・シーケンス上の番号を保存したり、デコーダ側に伝送する。
【0096】
前述の通り、前記ランダム・シーケンスは、レーマーの擬似乱数であることが望ましい。
【0097】
図6は、本発明の一実施形態によるイメージ信号圧縮方法のフローチャートである。
【0098】
まず、レーマーの擬似乱数を生成する(S200)。検査するポイントの数を、n個と仮定する。
【0099】
変数iに1からnまでを代入し、次の動作を反復遂行する。
【0100】
まず、iに1を代入する(S205)。
【0101】
レーマーの擬似乱数列で、i番目のアングル・パラメータを選択する(S210)。選択されたアングル・パラメータを使用し、DCTマトリックスの行間と列間との部分的な交換を行う(S220)。これは式(3)で述べた通りである。
【0102】
前記修正されたDCTマトリックスD’を使用し、イメージ信号SをDCT変換する(S230)。これは、式(5)で述べた通りである。
【0103】
DCT変換されたイメージYを圧縮し、圧縮されたイメージ(compressed image)
【0104】
【数14】

を生成し(S240)、圧縮率
【0105】
【数15】

を求める(S250)。
【0106】
n番目のポイントであるか否かを確認し(S260)、n個のポイントをいずれも検査していないのであるならば、iを1増加し、レーマーの乱数列の次の位置を指定し(S270)、S210ないしS260を反復遂行する。
【0107】
n個のポイントに対して圧縮率をいずれも求めたならば、最も高い圧縮率
【0108】
【数16】

を有するpを求め(S280)、
【0109】
【数17】

とpとを保存したり、デコーダ側に伝送する(S290)。
【0110】
<本発明のメリット>
1.本発明は、強力な数的基礎に基づく。
2.本発明によるイメージ信号圧縮方式によれば、ビデオ圧縮で、平均して6%レベルの利得をもたらす。低いビットレートでは、最大16%の利得も可能である。図7及び図8を参照するに、多様なQP及びテストビデオシーケンスについて、8x8ブロックの場合に平均6%、4x4ブロックの場合に平均5.25%の圧縮率増加をもたらす。
3.実験によれば、本発明を適用する場合、PSNR(peak signal-to-noise ratio)が約100ほどと非常に高い値を得ることができる。従って、ほぼ無損失ビデオコーディングが可能である。
4.量子化エラーをかなり減少させられる。
【0111】
<代替例>
本発明の一実施形態では、直交トランスフォームに対して、オイラー・アングルをパラメータとして使用した。しかし、前記言及のように、異なるパラメータ化方法がまた、均等例として適用可能である。
【0112】
また、パラメータの集合に対して、1つの整数で表現するというアイディアは、ベーシスの回転だけではなく、付加情報の転換を要する他の方法にも適用可能である。
【0113】
オーバーヘッドを除外すれば、ベーシス回転によって得ることができる最も高い圧出率上昇は、20%ほどである。しかし、オーバーヘッドの付加によって圧縮率上昇は、6%ほどとなる。オーバーヘッドをより減らすことによって、圧縮率のゲインは、前記の20%に接近するであろう。
【0114】
本発明は、コンピュータで読み取り可能な記録媒体に、コンピュータ(情報処理機能を有する装置をいずれも含む)が読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録装置の例としては、ROM(read-only memory)、RAM(random-access memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。
【0115】
たとえ前記説明が多様な実施形態に適用される本発明の新規特徴に焦点を当てて説明したとしても、本技術分野に熟達した技術を有した当業者ならば、本発明の範囲を外れずに、前記説明された装置及び方法の形態及び細部事項で、多様な削除、代替、及び変更が可能であるということを理解するであろう。従って、本発明の範囲は、前記説明でよりも、特許請求の範囲によって定義されるのである。特許請求の範囲の均等範囲のうちのあらゆる変形は、本発明の範囲に含まれるのである。

【特許請求の範囲】
【請求項1】
イメージ信号を圧縮する方法において、
変換マトリックスの行間と列間との部分的な交換を行う段階と、
前記行間と列間との部分的な交換が行われた変換マトリックスを使用し、圧縮しようとするイメージ信号をDCT変換する段階と、
前記DCT変換されたイメージ信号を圧縮する段階と、
前記変換マトリックスの行間と列間との部分的な交換の程度を示すアングル・パラメータに対してさまざまな値を適用し、前記変換マトリックスの行間と列間との部分的な交換を行うことと、前記圧縮しようとするイメージ信号をDCT変換することと、前記DCT変換されたイメージ信号を圧縮することとを反復遂行し、最も高い圧縮率に対応するアングル・パラメータを選択する段階とを含むことを特徴とするイメージ信号の圧縮方法。
【請求項2】
前記アングル・パラメータは、オイラー・アングルであることを特徴とする請求項1に記載のイメージ信号の圧縮方法。
【請求項3】
前記変換マトリックスの行間と列間との部分的な交換を行う段階は、
前記変換マトリックス左側の前記行間の部分的な交換に該当するマトリックスを乗じ、前記変換マトリックス右側の前記列間の部分的な交換に該当するマトリックスを乗じる段階を含むことを特徴とする請求項1に記載のイメージ信号の圧縮方法。
【請求項4】
前記行間の部分的な交換に該当するマトリックスは、
【数18】

であり、
前記マトリックスで、
【数19】

前記α,β,γは、オイラー・アングルであることを特徴とする請求項3に記載のイメージ信号の圧縮方法。
【請求項5】
前記最も高い圧縮率に対応するアングル・パラメータを選択する段階は、
前記アングル・パラメータに対して、ランダム・シーケンスを生成する段階と、
前記ランダム・シーケンスの値それぞれに対し、前記変換マトリックスの行間と列間との部分的な交換を行うことと、前記圧縮しようとするイメージ信号をDCT変換することと、前記DCT変換されたイメージ信号を圧縮することとを含み、前記イメージ信号に対する圧縮率を求める段階と、
前記ランダム・シーケンスの値それぞれに対して求めた圧縮率のうち、最も高い圧縮率を求める段階と、
前記最も高い圧縮率に対応するアングル・パラメータの値を選択する段階とを含むことを特徴とする請求項1に記載のイメージ信号の圧縮方法。
【請求項6】
前記最も高い圧縮率に対応するアングル・パラメータの値の前記ランダム・シーケンス上の番号を求める段階と、
前記最も高い圧縮率で圧縮されたイメージ信号、及び前記対応するランダム・シーケンス上の番号を保存したり、デコーダ側に伝送する段階をさらに含むことを特徴とする請求項5に記載のイメージ信号の圧縮方法。
【請求項7】
前記アングル・パラメータに対して生成するランダム・シーケンスは、レーマーの擬似乱数であることを特徴とする請求項5に記載のイメージ信号の圧縮方法。
【請求項8】
前記アングル・パラメータに対してさまざまな値を適用し、前記変換マトリックスの行間と列間との部分的な交換を行うことと、前記圧縮しようとするイメージ信号をDCT変換することと、前記DCT変換されたイメージ信号を圧縮することとを反復遂行し、最も高い圧縮率に対応するアングル・パラメータを選択する段階は、
モンテカルロ法を使用し、前記変換マトリックスの行間と列間との部分的な交換を行うことと、前記圧縮しようとするイメージ信号をDCT変換することと、前記DCT変換されたイメージ信号を圧縮することとを反復遂行する段階を含むことを特徴とする請求項1に記載のイメージ信号の圧縮方法。
【請求項9】
前記オイラー・アングルは、0°近くまたは180°近くの値を有することを特徴とする請求項2に記載のイメージ信号の圧縮方法。
【請求項10】
イメージ信号を圧縮する装置において、
変換マトリックスの行間と列間との部分的な交換を行う行間と列間との交換部と、
前記行間と列間との部分的な交換が行われた変換マトリックスを使用し、圧縮しようとするイメージ信号をDCT変換するDCT変換部と、
前記DCT変換されたイメージ信号を圧縮するイメージ圧縮部と、
前記変換マトリックスの行間と列間との部分的な交換の程度を示すアングル・パラメータに対してさまざまな値を適用し、前記行間と列間との交換部、DCT変換部及びイメージ圧縮部を反復動作させ、最も高い圧縮率に対応するアングル・パラメータを選択する制御部とを含むことを特徴とするイメージ信号の圧縮装置。
【請求項11】
前記アングル・パラメータは、オイラー・アングルであることを特徴とする請求項10に記載のイメージ信号の圧縮装置。
【請求項12】
前記行間と列間との交換部は、
前記変換マトリックス左側の前記行間の部分的な交換に該当するマトリックスを乗じ、前記変換マトリックス右側の前記列間の部分的な交換に該当するマトリックスを乗じることを特徴とする請求項10に記載のイメージ信号の圧縮装置。
【請求項13】
前記行間の部分的な交換に該当するマトリックスは、
【数20】

であり、前記マトリックスで、
【数21】

前記α,β,γは、オイラー・アングルである特徴とする請求項12に記載のイメージ信号の圧縮装置。
【請求項14】
前記制御部は、
前記アングル・パラメータに対して、ランダム・シーケンスを生成し、前記ランダム・シーケンスの値それぞれに対し、前記行間と列間との交換部、DCT変換部及びイメージ圧縮部を動作させ、前記イメージ信号に対する圧縮率を求め、前記ランダム・シーケンスの値それぞれに対して求めた圧縮率のうち、最も高い圧縮率を求め、前記最も高い圧縮率に対応するアングル・パラメータの値を選択することを特徴とする請求項10に記載のイメージ信号の圧縮装置。
【請求項15】
前記制御部は、
前記最も高い圧縮率に対応するアングル・パラメータの値の前記ランダム・シーケンス上の番号を求め、前記最も高い圧縮率で圧縮されたイメージ信号、及び前記対応するランダム・シーケンス上の番号を保存したり、デコーダ側に伝送することを特徴とする請求項14に記載のイメージ信号の圧縮装置。
【請求項16】
前記アングル・パラメータに対して生成するランダム・シーケンスは、レーマーの擬似乱数であることを特徴とする請求項14に記載のイメージ信号の圧縮装置。
【請求項17】
前記制御部は、
モンテカルロ法を使用し、前記行間と列間との交換部、DCT変換部及びイメージ圧縮部を反復動作させて最も高い圧縮率に対応するアングル・パラメータを選択することを特徴とする請求項10に記載のイメージ信号の圧縮装置。
【請求項18】
前記オイラー・アングルは、0°近くまたは180°近くの値を有することを特徴とする請求項11に記載のイメージ信号の圧縮装置。
【請求項19】
イメージ信号を圧縮する方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体において、
前記イメージ信号圧縮方法は、
変換マトリックスの行間と列間との部分的な交換を行う段階と、
前記行間と列間との部分的な交換が行われた変換マトリックスを使用し、圧縮しようとするイメージ信号をDCT変換する段階と、
前記DCT変換されたイメージ信号を圧縮する段階と、
前記変換マトリックスの行間と列間との部分的な交換の程度を示すアングル・パラメータに対してさまざまな値を適用し、前記変換マトリックスの行間と列間との部分的な交換を行うことと、前記圧縮しようとするイメージ信号をDCT変換することと、前記DCT変換されたイメージ信号を圧縮することとを反復遂行し、最も高い圧縮率に対応するアングル・パラメータを選択する段階とを含むことを特徴とするコンピュータで読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公表番号】特表2011−502390(P2011−502390A)
【公表日】平成23年1月20日(2011.1.20)
【国際特許分類】
【出願番号】特願2010−530918(P2010−530918)
【出願日】平成20年6月30日(2008.6.30)
【国際出願番号】PCT/KR2008/003857
【国際公開番号】WO2009/054594
【国際公開日】平成21年4月30日(2009.4.30)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】