符号化処理装置及び符号化処理方法
【課題】 画像データの圧縮効率を更に向上させることにある。
【解決手段】 少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離し(ステップS2)、輝度プレーン内に存在する輝度差の補正を行し(ステップS3)、輝度差の補正処理の後に前記画像データの符号化処理を行う(ステップS7)。
【解決手段】 少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離し(ステップS2)、輝度プレーン内に存在する輝度差の補正を行し(ステップS3)、輝度差の補正処理の後に前記画像データの符号化処理を行う(ステップS7)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データを符号化処理するための符号化処理装置及び符号化処理方法に関するものである。
【背景技術】
【0002】
近年、デジタルカメラの発達により、自然画像を容易にデジタル情報化出来るように成って来ている。また近頃では静止画だけでなく、動画をも撮影可能なスチル&ムービーカメラも台頭しつつある。
【0003】
前記カメラは大量のメモリを消費するため、高効率なカラー画像圧縮方法が望まれている。また、前記カメラは電子ズームを前提としているため、前記ズーム時でも高精細な画像を提供出来る必要がある。しかし従来の主なコーデックであるJPEGやMPEGは非可逆圧縮方法であるため、前記高精細な画像を再生するには不向きなものになっている。
【0004】
また、前記カメラは動画撮影時においても、前記動画中の任意のフレームを静止画として抽出できるのが望ましい。その点で、前記動画専用コーデックであるMPEGは失格である。また、近年の表示装置の性能向上によって、従来の放送規格であるNTSCやMPEG等が提供する画像の品質はその限界を呈しつつ有る。
【0005】
このような状況で注目されつつあるのが、JPEG2000と呼ばれる新しい可逆、非可逆圧縮方法である。前記圧縮方法は本質的には静止画圧縮方法であり、可逆、非可逆圧縮の両方で基本的には同一の圧縮アルゴリズム(ウェーブレット変換)を採用している。しかし前記可逆圧縮の圧縮率は余り高くなく、1/2程度である。また前記圧縮方法は動画圧縮にも適用可能で、例えば非可逆圧縮の圧縮率1/8程度で良好な動画像を提供する事ができる。
【0006】
特許文献1には、スキャン方向を変換する方式が開示され、特許文献2には、画像分割して最適な圧縮方法を選択、採用する方式が開示されている。また、特許文献3には、画像分割にヒストグラムを使用する方式が開示され、特許文献4には、属性マップ/オブジェクトに基づいて画像圧縮する方式が開示されている。また、特許文献5には、ラン長の分布から画像の種類を判別する方式が開示され、特許文献6には、色差信号を原点の周りに回転する方式が開示されている。
【0007】
また他の静止画可逆圧縮方法には、例えばGIF、PNG、JPEG−LS、CALIC、TMW等が有る。
【0008】
【特許文献1】特開平8−126009号公報
【特許文献2】特開2000−333019号公報
【特許文献3】特開2001−22931号公報
【特許文献4】特開2001−169120号公報
【特許文献5】特開2002−163658号公報
【特許文献6】特許第3334242号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
前記高精細な画像を提供するカラー画像可逆圧縮方法、コーデックが実現すれば、前記動画像等の記録に莫大なメモリは必要でなくなる。しかしながら、前述したスチル&ムービーカメラは現状ではそのメモリ量、メモリコストが障壁となっており、本格的なカメラは未だ実現の時期を迎えていない。
【0010】
また前記NTSC規格においても公知の技術によって2枚のフィールド画像から1枚のフレーム画像を形成可能ではあるものの、前記2枚のフィールド画像間ではその撮像時間が僅かに異なっている為、高速に移動する物体等がブレる事が有る。従って動画中から静止画をも抽出する前記スチル&ムービーカメラにおいては、その記録方式は前記NTSC等が採用しているインターレース方式ではなくプログレッシブスキャン方式である事が望ましい。すると必然的に、前記圧縮方法は静止画を基本としたものになる。
【0011】
前記静止画の可逆圧縮効率は1/3程度と言われているが実証されたものではなく、その圧縮率は前記静止画の性質に大きく依存する。
【0012】
そこで、本発明の目的は、画像データの圧縮効率を更に向上させることにある。
【課題を解決するための手段】
【0013】
本発明の符号化処理装置の第1の態様は、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正手段と、前記傾斜補正手段による輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理手段とを有すること特徴とする。
本発明の符号化処理装置の第2の態様は、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減手段と、前記プレーン削減手段によるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理手段とを有することを特徴とする。
本発明の符号化処理方法の第1の態様は、画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正ステップと、前記傾斜補正ステップによる輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むこと特徴とする。
本発明の符号化処理方法の第2の態様は、画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減ステップと、前記プレーン削減ステップによるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むことを特徴とする。
本発明のプログラムは、前記の符号化処理方法の第1又は第2の態様をコンピュータに実行させることを特徴とする。
本発明のコンピュータ読み取り可能な記録媒体は、前記のプログラムを記録したことを特徴とする。
【発明の効果】
【0014】
本発明によれば、画像データの圧縮効率を更に向上させることが可能となる。
【発明を実施するための最良の形態】
【0015】
以下、本発明の好適な実施形態を、添付図面を参照しながら詳細に説明する。
【0016】
先ず、本発明の実施形態の概要について説明する。以下に説明する実施形態は圧縮効率の改善を、以下の項目で示した技術によって行う。
(1)静止画像の部分画像への分割
(2)1枚の輝度プレーンと2枚の色差プレーンへの分離
(3)輝度プレーンの傾斜補正
(4)色差プレーンの色座標の決定
(5)色差プレーンの情報を用いたオブジェクト検出、画像分割
(6)最適予測方向の決定
(7)最適予測方向を考慮した符号化方向の決定
(8)ファイル情報量を減少させる為の輝度プレーンと色差プレーンでの共用化検討
(9)点欠陥の例外処理
【0017】
(3)は主にランモード時の圧縮率改善を狙ったものである。公知のように、殆どのコーデックはランモードと予測誤差モード(算術符号化モード)を用意している。そのうち飛躍的に圧縮率が高くなるのは、前者を多用できる画像である。
【0018】
圧縮対象である自然画像は、被写体オブジェクトに外部から太陽やランプ等の照明光が当たったものと考える事ができる。既存の自然画像を画像解析してみると、図6に示すように、上下方向に大きな輝度差が観察されるのが通常である。この輝度差は、例えばあるVGA画像では平均35階調/256階調(14%)にも達する。
【0019】
これは前記オブジェクトの反射率は各部分でほぼ同一で有るのに対して、前記照明光の分布はそれとは対照的に上下方向で大きく異なっていることが原因である。即ち、一般に画像の上部は明るく輝度が高く、下部は暗く輝度が低い。
【0020】
本発明の実施形態においては、符号化を行う前にこれらの輝度差の補正を行う。具体的には主に上下方向に線形あるいは低次の関数を用いて補正を行った後に符号化を行う。これらの変換操作による画像圧縮ファイルの情報量の増加は、前記線形あるいは低次の関数の係数分だけであるので、事実上無視できるほど小さい。
【0021】
(4)の色差プレーンの色座標決定方法には、大別して2つの方法がある。従来の2枚の色差プレーンとは、例えば(B−G,R−G)や(U,V)であった。しかし、部分画像に分割され特定の被写体オブジェクトがその部分画像の大半に写り込む場合には、前記画像を構成する画素の画素値の大半が特定の1色で占められるような場合も想定される。そのような場合に、前記予め決められた色差プレーン座標を用いるのは非効率的である。
【0022】
そこで1つの方法とは、前記特定の1色を例えば画素値のヒストグラム等から求め、その色に対して2枚の色差プレーンを回転して、一方のプレーンの色差座標をその色に合わせ込み、他方のプレーンの色差座標をその色と直交するように変換する。
【0023】
具体的にはカラー画像の色の三原色をC1,C2,C3とすると、それと定数C0を合わせた計4つの項からなる線形量K1,K2を新しい色差プレーンの色座標とする訳である。
K1=α*C0+β*C1+γ*C2+δ*C3・・・(式1)
K2=ε*C0+ζ*C1+η*C2+θ*C3・・・(式2)
ここでα〜θは、線形結合の係数である。定数項C0は、前記K1,K2が負の値にならないように設けている訳である。ここでの情報量、ファイルサイズの増加は、先の自由度8の係数が表す数値64ビット:8バイト程度である。
【0024】
他の方法とは、前記色差プレーンの色座標を前記三原色の線形結合ではなく、(R/W,B/W)や(R/G,B/G)とする方法である。但し、ここでは可逆圧縮技術であるから、前記色座標に用いる値は例えばカメラ出力等の由緒正しい量である必要がある。既に整数で表現されているビットマップ画像から前記色座標のそれを求めても、その効果は無効である(丸め誤差が出るため)。あくまでも、アナログ出力(光量等)を直接R/W等にAD変換した値、例えば前記カメラ出力である必要が有る。
【0025】
前述したように被写体オブジェクトの色(反射率R)が場所によらず一定であるとすると、前記被写体に当たる照明光の光量I0が変化したとしても(輝度変化)、先の色座標Kはその値を変えない所が良い所である。
Ir=I0*Rr・・・(式3)
Kr=Ir/(Ir+Ig+Ib)=Rr/(Rr+Rg+Rb)・・・(式4)
ここでIは反射光量であり、添字のr,g,bは色の三原色、赤、緑、青に各々対応している。
【0026】
それに対して従来は輝度が変化すると、輝度プレーンの画素値以外に色差プレーンのそれも値を変える為、同一画素値が連続する時に利用出来るランモードを利用する事が出来ず、圧縮率が低下していた。本発明の実施形態では、前記色差プレーンのダイナミックレンジが従来の例えば8ビット(256階調)から増加するため(8+10=18ビット)多少余分な中間ファイルサイズが必要となる。但し圧縮後のそれは前記圧縮効率が改善されるから、問題とはならない。
【0027】
(5)の部分画像への分割は、従来のコーデックに見られていたように、画一的な分割ではなく、前記カラー画像中に含まれるオブジェクトを充分に考慮したものである事が望ましい。そのような方法としては、以下の3つの方法が考えられる。
【0028】
まず1つ目は、前記オブジェクトの抽出を色差プレーンの情報を用いる方法である。
現実的にはオブジェクトの抽出とは先のランモード採用の可否であるから、同一色が連続する部分を同一オブジェクトとみなす事もできる。それは前記色差プレーンの画素値を観察する事で可能である。
【0029】
2つ目は、前記オブジェクトが複数の部分画像に跨ることなく、同一の部分画像中に配置されるようにする事である。その為には、前記分割する部分画像の大きさを各カラー画像間で異なる任意の大きさとする事である。即ち、前記画像の分割は、その画像中に含まれるオブジェクトの大きさを考慮してから決定される。
【0030】
また3つ目は、前記分割画像の分割開始地点をカラー画像の左上から任意の位置まで平行移動して変更し分割を開始する事である。これによれば少なくとも前記オブジェクトを部分画像の中心に据える事ができる。画像の端面処理の問題は、上を下に、左を右にサイクリック状に連続させる事で回避する事ができる。ここでの情報量、ファイルサイズの増加は、前記画像の大きさを表すビット数(数ビット)程度である。
【0031】
(6)の予測方法は、従来のコーデックでも種々検討されている部分である。であるが、その改善効率は必ずしも高くない。本発明の実施形態では注目画素の周囲の少なくとも4方向、望ましくは8方向以上で前記予測値を求め、その予測誤差を最小とする最適予測方向を求め、その方向を圧縮符号化の方向として採用を行う。その際、5ピッチ以上離れた画素をも用いて長距離相関を求め、前記予測値を予測する。前記予測には、例えば線形予測(LPC)を用いる。
【0032】
従来のロスレスJPEGでは、1ピッチ離れた(つまりは隣接する)左上方向の3画素の値を参照して前記予測値を計算している。また前記JPEG−LSでは、同じく4画素の値を参照している。また前記CALICでは、2ピッチ離れた左上方向の計7画素の値を参照している。また前記TMWは注目画素から1ピッチ離れた周辺8画素の値を前記線形予測に用いている。であるが、本発明の実施形態ではこれらとは距離(ピッチ数)と画素並びにおいて異なっている。
【0033】
本発明の実施形態において長距離相関を用いるのは、図11に示したように比較的長距離(数画素)まで、前記注目画素との相関が認められるからである。グラフの横軸は注目画素からの距離であり、縦軸はその画素と前記注目画素との階調差の絶対値である。グラフの各線は、13種のVGAカラー画像の全画素(640*480)の平均値を示している。例えばグラフが水平になる地点を無相関になる地点であるとみなすと、図の例では5画素以上まで相関が存在する事になる。
【0034】
またLPC予測においては一般に、次数が高くなるほど(即ち沢山の画素情報を用いるほど)その予測精度は向上する。この長距離相関の存在は、今後展開される多画素、高精細画像においては、より顕著化されるものと考えられる。
【0035】
また従来はエッジの検出等を比較的近距離の画素を調べて行っていたが、これでは不正確である。やはり本発明の実施形態のように長距離相関を調べ、その相関が高い(つまりは予測誤差が小さい)、エッジである可能性が高い方向を予測に用いるべきである。
【0036】
また図11では前記予測の方向は、注目画素の周囲0度(水平方向)、45度、90度(垂直方向)、135度、の計4方向であるが、この数は任意である。一般には対向する方向の予測値は近く、また前記最小な予測誤差を示す最適な予測方向は、水平方向である場合が多い。しかし、特殊な画像も稀には存在するので、やはりその予測方向の選択は全方向(360度)から行われるべきである。
【0037】
さて、(7)の必要理由を従来のコーデックを用いて説明を行う。従来のコーデックでは、予測画素に主に左上のそれを用いていた。これは符号化方向が左上から右下に向かっていたからであり、左上方向は各画素の画素値yiが確定済みであるため、それらの画素値yiと予測誤差Δeを用いて注目画素の実際値yを求める事が可能であるからである。
y=f(yi)+Δe・・・(式5)
【0038】
それに対して右下の画素値は未だ未確定なため、それを用いても前記実際値yを計算する事は不可能である。このように、本発明の実施形態では予め予測の最適方向を求めた後に、それに見合った符号化方向を決定する。
【0039】
本発明の実施形態において使用する予測方向の指定は、例えば8方向では僅か3ビットであるため、その情報量、ファイルサイズの増加は事実上無視する事ができる。
【0040】
また(8)は、従来、輝度プレーンと色差プレーンとの符号化は、各々独立に行われるのが常であった。であるが、被写体オブジェクト+照明光という自然画像においては、前記両プレーンに共通する情報量が存在する筈である。仮にそのような情報量をプレーン間で統合出来れば、圧縮画像全体の情報量を減少可能であり、前記圧縮率の大幅な改善が見込める。
【0041】
本発明の実施形態ではこれを、以下の2つの方法によって実現している。一つ目は、プレーン枚数の削減である。ほぼ単色から成る画像の特定の部分画像においては、前記輝度プレーン1枚、色差プレーン2枚という前提が、必ずしも必要ではなくなる。その場合には、輝度プレーン1枚+色差プレーン1枚、あるいは色差プレーン2枚から前記輝度プレーンを計算式で求めても良い。勿論、色差プレーン1枚で済む場合も、稀には存在するだろう。
【0042】
その具体的な方法とは、圧縮前に画素値等のテーブルを両プレーン間で比較する事である。各々の画素値同士が両プレーン間である簡単な式で表せるならば、一方のプレーンは必要ではなくなる。また両者の相関が予め決められた閾値よりも高ければ、上述のように隣接相関、予測誤差を用いた公知の符号化方法ではなく、前記プレーン間の相関を用いて予測誤差を求めた方が良い場合も生じる。例えばP1とP2での各画素値をy1、y2とすると、予測誤差Δeは以下のように表される。
y2=α*y1+β+Δe・・・(式6)
ここでα、βは定数である。
【0043】
二つ目は、オブジェクトの位置や画像分割の方法などである。また、画像によっては前記各分割画像での最適予測方向、符号化方向をも共用化出来るかもしれない。
【0044】
また(9)は、撮像センサに必然的に存在する欠陥画素を考慮したものである。多画素な撮像センサには表示装置と同様に、多数の点欠陥が存在する。それらは通常例えばフレームメモリ上等で画像処理、補正されるため、一般には目立つ事はない。であるが、高々1点の点欠陥の為に、前記圧縮率を飛躍的に高めるランモードが中断される恐れも有る。またプレーン間での相関を利用する場合など、点欠陥として除去する画素が少数の場合には、充分に圧縮率改善に寄与する。
【0045】
本発明の実施形態による情報量、ファイルサイズの増大は、点欠陥数*(座標を表すビット数:数ビット+階調ビット数:8ビット)程度である。
【0046】
このように、現在マンモスコーデックと呼ばれるそれで有っても半導体集積回路の回路規模や演算速度の改善は誠に目覚しいので(各々3年4倍、3年8倍)、前記コーデックが将来的には最適化されたそれになる可能性がある。
【0047】
静止画、動画圧縮に必要なのは第一に圧縮画像ファイルサイズ、第二にデコード時間であるので、他を犠牲にした構成も充分に考えられ得る。また並列コンピューティング技術も進歩するので、前記並列処理を充分に考慮したコーデックである必要がある。本発明は上記の点でも、時代に適応している。
【0048】
次に、本発明の実施形態を具体的に説明する。図12は、本発明の実施形態に適用される撮像装置のシステム構成を示す図である。図12において、10は撮影レンズ、12は絞り機能を備えるシャッタ、14は光学像を電気信号に変換する撮像素子、16は撮像素子14のアナログ信号出力をデジタル信号に変換するA/D変換器である。
【0049】
18は撮像素子14、A/D変換器17、D/A変換器26にクロック信号や制御信号を供給するタイミング発生回路であり、メモリ制御回路22及びシステム制御回路50により制御される。
【0050】
15はCDS(相関二重サンプリング)回路、16はプログラマブルゲインアンプ(PGA)である。
【0051】
20は画像処理回路であり、A/D変換器17からのデータ或いはメモリ制御回路22からのデータに対して所定の画素補間処理や色変換処理を行う。
【0052】
また、画像処理回路20においては、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてシステム制御回路50が露光制御手段40、測距制御手段42に対して制御を行う、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(ストロボプリ発光)処理を行っている。
【0053】
さらに、画像処理回路20においては、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
【0054】
22はメモリ制御回路であり、A/D変換器17、タイミング発生回路18、画像処理回路20、画像表示メモリ24、D/A変換器26、メモリ30、圧縮・伸長回路32を制御する。
【0055】
A/D変換器17のデータが画像処理回路20、メモリ制御回路22を介して、或いはA/D変換器17のデータが直接メモリ制御回路22を介して、画像表示メモリ24或いはメモリ30に書き込まれる。
【0056】
24は画像表示メモリ、26はD/A変換器、28はTFT LCD等から成る画像表
示部であり、画像表示メモリ24に書き込まれた表示用の画像データはD/A変換器26を介して画像表示部28により表示される。画像表示部28を用いて撮像した画像データを逐次表示すれば、電子ファインダ機能を実現することが可能である。
【0057】
30は撮影した静止画像や動画像を格納するためのメモリであり、所定枚数の静止画像や所定時間の動画像を格納するのに十分な記憶量を備えている。これにより、複数枚の静止画像を連続して撮影する連写撮影やパノラマ撮影の場合にも、高速かつ大量の画像書き込みをメモリ30に対して行うことが可能となる。また、メモリ30はシステム制御回路50の作業領域としても使用することが可能である。
【0058】
32は、画像データを圧縮伸長する圧縮・伸長回路であり、メモリ30に格納された画像を読み込んで圧縮処理或いは伸長処理を行い、処理を終えたデータをメモリ30に書き込む。
【0059】
40は絞り機能を備えるシャッタ12を制御する露光制御手段であり、ストロボ48と連携することによりストロボ調光機能も有するものである。
【0060】
42は撮影レンズ10のフォーカシングを制御する測距制御手段、44は撮影レンズ10のズーミングを制御するズーム制御手段、46はバリアである保護手段102の動作を制御するバリア制御手段である。
【0061】
48はストロボであり、AF補助光の投光機能、ストロボ調光機能も有する。露光制御手段40、測距制御手段42はTTL方式を用いて制御されており、撮像した画像データを画像処理回路20によって演算した演算結果に基づき、システム制御回路50が露光制御手段40、測距制御手段42に対して制御を行う。
【0062】
50は撮像装置100全体を制御するシステム制御回路、52はシステム制御回路50の動作用の定数、変数、プログラム等を記憶するメモリである。
【0063】
54はシステム制御回路50でのプログラムの実行に応じて、文字、画像、音声等を用いて動作状態やメッセージ等を表示する液晶表示装置、スピーカ等の表示部であり、撮像装置100の操作部近辺の視認し易い位置に単数或いは複数個所設置され、例えばLCDやLED、発音素子等の組み合わせにより構成されている。
【0064】
56は電気的に消去・記録可能な不揮発性メモリであり、例えばEEPROM、フラッシュメモリ等が用いられる。
【0065】
60、62、64、70及び72は、システム制御回路50の各種の動作指示を入力するための操作手段であり、スイッチやダイアル、タッチパネル、視線検知によるポインティング、音声認識装置等の単数或いは複数の組み合わせで構成される。
【0066】
60は電源スイッチ(メインスイッチ)で、画像処理装置100の電源オン、電源オフの各モードを切り替え設定することが出来る。また、画像処理装置100に接続された各種付属装置の電源オン、電源オフの設定も合わせて切り替え設定することが出来る。
【0067】
62はシャッタスイッチSW1で、不図示のシャッタボタンの操作途中でONとなり、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理、EF(ストロボプリ発光)処理等の動作開始を指示する。
【0068】
64はシャッタスイッチSW2で、不図示のシャッタボタンの操作完了でONとなり、撮像素子14から読み出した信号をA/D変換器17、メモリ制御回路22を介してメモリ30に画像データを書き込む露光処理、画像処理回路20やメモリ制御回路22での演算を用いた現像処理、メモリ30から画像データを読み出し、圧縮・伸長回路32で圧縮を行い、記録媒体200に画像データを書き込む記録処理という一連の処理の動作開始を指示する。70は各種ボタンやタッチパネル等からなる操作部である。
【0069】
72はモードダイアルスイッチで、自動撮影モード、撮影モード、パノラマ撮影モード、再生モード、マルチ画面再生・消去モード、PC接続モード等の各機能モードを切り替え設定することが出来る。
【0070】
80は電源制御手段で、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成されており、電池の装着の有無、電池の種類、電池残量の検出を行い、検出結果及びシステム制御回路50の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体を含む各部へ供給する。
【0071】
82はコネクタ、84はコネクタ、86はアルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li-ion電池等の二次電池、ACアダプタ等からなる電源手段である。
【0072】
90はメモリカードやハードディスク等の記録媒体とのインタフェース、92はメモリカードやハードディスク等の記録媒体と接続を行うコネクタである。
【0073】
102は、撮像装置100のレンズ10を含む撮像部を覆う事により、撮像部の汚れや破損を防止するバリアである保護手段である。
【0074】
104は光学ファインダであり、画像表示部28による電子ファインダ機能を使用すること無しに、光学ファインダのみを用いて撮影を行うことが可能である。また、光学ファインダ104内には、表示部54の一部の機能、例えば、合焦表示、手振れ警告表示、ストロボ充電表示、シャッタスピード表示、絞り値表示、露出補正表示などが設置されている。
【0075】
200はメモリカードやハードディスク等の記録媒体である。記録媒体200は、半導体メモリや磁気ディスク等から構成される記録部202、撮像装置100とのインタフェース204、撮像装置100と接続を行うコネクタ206を備えている。なお、記録媒体200は本実施形態では撮像装置100に内蔵される構成として説明しているが、外部に構成されることも本発明の範疇内である。
【0076】
以下に説明する実施形態は、主に画像処理回路20及び圧縮・伸張回路32によって実現されるものである。先ず、本発明の第1の実施形態について説明する。本実施形態における、カラー画像の可逆圧縮方法のメインルーチンを図1に示す。
【0077】
本実施形態は図5に示したように各画素に8ビットのRGB色情報を有するVGA画像(640*480画素)51を可逆圧縮するものであり、前記画像はまず大きさ80*60画素の部分画像52に64分割される(ステップS1)。
【0078】
次いで下記の式7〜9に基づいて、輝度プレーン(Y)と色差プレーン(Cb、Cr)の分離が行われる(ステップS2)。
Y=R+2*G+B・・・(式7)
Cb=B−G・・・(式8)
Cr=R−G・・・(式9)
ここでR、G、Bは各画素での画素値(RGB値)である。
【0079】
次いで各部分画像の輝度プレーンYにおいて、画素値の傾斜補正がy方向のみで行われる(ステップS3)。これはまず行(j)毎に各画素値Y(i,j)を加算した値Y(j)を求める。
Y(j)=ΣY(i,j)・・・(式10)
和はiに対して取られる。
【0080】
それを下記の式11によって1次式で近似する。
Y(j)p=a*i+b・・・(式11)
上記aやbの値は、例えば公知の最小自乗法などで求められる。ここでY(j)pは先のY(j)の近似値である。
【0081】
このY(j)pを先の画素値Y(i,j)から引く事によって、前記傾斜補正が行われる。
ΔY(i,j)=Y(i,j)−Y(j)p・・・(式12)
【0082】
実際に符号化されるのは、式12のΔY(i,j)で表される量(差分)である。また先の2つの係数a、b(情報量16ビット)は、前記各部分画像毎に記録、保存される。
【0083】
次いで色差プレーンの座標変換が、各部分画像毎に独立に行われる(ステップS4)。まず最初に各色差プレーン(CrまたはCb)で、部分画像全体の画素に対して画素値Cr(i,j)、Cb(i,j)のヒストグラムが取られる。そのヒストグラム中での最大頻度を示す値を各々Crfreq、Cbfreqとすると、式13で決められる回転角θで色座標(Cr、Cb)を回転してできる、式14、式15で示される新たな色座標(K1,K2)を用いて、更にヒストグラムを求める。色座標(Cr、Cb)と色座標(K1,K2)との関係を図7に示す。
tanθ=Cbfreq/Crfreq・・・(式13)
K1=Cr*cosθ+Cb*sinθ・・・(式14)
K2=−Cr*sinθ+Cb*cosθ・・・(式15)
【0084】
そして前記両色差プレーンK1、K2で、下記の量を計算する。
H=−ΣPi*(logPi/log2)・・・(式16)
和はiに対して取られる。
Pi=N(Kn(i))/(80*60)・・・(式17)
式16は良く知られた、圧縮限界を示す式(エントロピー式)である。ここでKn(i)は、各色差プレーンのヒストグラムにおける、値iを示す度数である。また80*60は、前記部分画像の総画素数である。従ってlogPiは、その値iの度数が示す確率である。
【0085】
各色差プレーンK1、K2で求めた式16の値H1、H2の和H1+H2が予め決められた値(閾値)よりも小さい場合には、前記色差座標K1、K2を符号化座標に採用する。また前記和が前記閾値を越える場合には、先の最頻値Crfreq、Cbfreqの周囲あるいはセカンドピーク(次に頻度が高い値)の周囲についても、同様な調査を行う。それでも前記関係を満足しない場合には、前記和の中で最も小さな和を示す色差座標を前記符号化の座標に採用する。
【0086】
本実施形態が本ステップで行っている事は、前記色情報を一方の座標(この場合はK1)に集中して符号化効率を高める工夫である。
【0087】
次に公知の予測符号化手法を用いて、符号化の為の差分情報を求める。その為には前記予測に用いられる画素予測値を求める必要が有るが、本実施形態では前記予測を図8に示したように注目画素の5画素外方の8方向から、予測を行う(ステップS5)。
【0088】
注目画素をP0、それから1ピッチ離れた画素をP1、以下同様に5ピッチ離れた画素をP5とすると、公知の線形予測法(LPC)によって予測誤差ΔPは、次の式18、式19によって求められる。
ΔP=P0−Pproj・・・(式18)
Pproj=−u*P1−v*P2−w*P3−x*P4−y*P5・・・(式19)
ここでu,v,w,x,yの各係数は、前記部分画像全体の画素に対して最適化されている。
【0089】
前記予測誤差ΔPの最小自乗和は、前記予測の方向毎に異なる値を示す。そのうち最小の最小自乗和を示す方向を、本実施形態は予測の最適方向として採用する。
【0090】
最適な予測方向が求まったならば、次は各画素の符号化方向を決める(ステップS6)。図9に示すように、符号化の方向94は前記予測の最適方向93と同じ方向である。
本実施形態では各部分画像の各行毎に、並列処理的な符号化が行われる。その際に、右側の出発画素91から4画素分は式19では符号化が不可能であるが、存在しない画素の値は0であるとして式19を解釈、流用する。最後に公知の算術符号化で符号化が行われる(ステップS7)。
【0091】
本実施形態によれば、輝度プレーンの傾斜補正を行っているため、ランモード採用の割合が増加し、圧縮率が改善される。また部分画像毎に色差座標を変更しているため、それだけその部分画像に含まれる特定色を効率良く符号化可能である。またその符号化も、最適な方向を選択して符号化を行っているため、前記符号化の効率は良好である。
【0092】
本実施形態はVGAカラー画像以外の任意のカラー画像にも、用いる事ができる。またその部分画像への分割数や分割画像の大きさも任意である。また本実施形態に用いる式7〜式9で示される輝度色差プレーンの分離方法は、その他の公知の方法でも構わない。例えば、輝度YはY=R+G+Bで有っても良い。
【0093】
また式12で示される輝度プレーンの傾き補正は、一次式の補正だけでなくより高次の補正式でも構わない。その場合にはその増えた係数分だけ多少、画像圧縮に必要な情報量は増加する。また前記輝度の補正は、y方向だけでなく、x方向(水平方向)に行っても無論構わない。
【0094】
また色座標の選定は式14、式15で表現される座標回転だけでなく、先の式1、式2で表されるより一般的な線形式で有っても、勿論構わない。また本実施形態は可逆圧縮を対象としているので、前記色差座標K1,K2が表す階調値は、実数値であるよりも整数値である方が望ましい(計算で丸め誤差が出るため)。従って前記色差座標K1,K2の選定は、それらを考慮して決定する必要が有る。そのような座標には、下記の式20、式21のようなものがある。
K1=αCr+βCb・・・(式20)
K2=αCr−βCb・・・(式21)
ここでα、βは整数である。
【0095】
またK1、K2の各階調値は公知のように、最小値K1min、K2minを各々の値から引くことによって、0または正の整数とする事ができる。このようにしておくと、後の符号化が容易となる。
【0096】
また前記色差座標K1、K2の選択の際に使用する選択基準は何も先のエントロピー式である必要はなく、例えば従来コーデックのTMWのように、実際に圧縮を行ってそのコードサイズを知り最小なコードを生成するK1、K2を選択しても良い。
【0097】
また前記予測の方向は何も8方向に限る事はなく、全方位を考慮した4方向以上で有りさえすれば良い。またその次数も、その予測精度を向上させるために、画素ピッチ3以上画素を含む任意の数で良い。また前記予測は線形予測だけでなく、公知の任意の予測方法でも構わない。また符号化の方法は、公知の、例えばハフマン符号化等でも構わない。
【0098】
次に、本発明の第2の実施形態について説明する。本実施形態における、VGAカラー画像の可逆圧縮のメインルーチンを図2に示す。本実施形態では画像分割に先立ってオブジェクトの検出を行う。
【0099】
まず前述のように、輝度色差プレーンの分離を行う(ステップS11)。次いで図10に示すように、前記色差プレーン101で、オブジェクト102の検出を行う(ステップ12)。
【0100】
その方法とは、各色差プレーンで画素値のヒストグラムを作成し、前記画素値がその最頻値±Δを示す領域を、前記オブジェクト102であると認識する。ここでΔの値は、256階調の場合、0から3程度の値である。前記検出されたオブジェクト102を考慮して、前記VGA画像の分割を行う(ステップS13)。
【0101】
分割の方法とは、まず最初に前記オブジェクトの横と縦の大きさLx、Lyと重心位置(Gx,Gy)を検出する。次いで前記オブジェクトの大きさと想定する分割部分画像の大きさ(通常は40*30〜160*120)とを比較して、前記分割線103のピッチを決定する。前記オブジェクト102の大きさが大きい場合には、図10に示したように複数の部分画像に跨って前記オブジェクト102が存在するようになる。
【0102】
前記画像の分割に際しては、図に示したように前記重心位置(Gx,Gy)を考慮してその分割開始位置を決定する。前記画像を分割する分割線103は、前記画像101上で等間隔に引かれる。
【0103】
次いで前述したように、前記オブジェクト102の色に適した色差プレーンの座標系が決定される(ステップS14)。次いで、圧縮後のファイルサイズを小さくするために(つまりは圧縮率改善)、前記3枚のプレーン間での圧縮情報の共用化が検討される(ステップS15)。検討される項目と順序は、以下の通りである。
(1)プレーン枚数の削減
(2)予測方法の変更
(3)色差座標系の座標パラメータの共通化
【0104】
一番圧縮効率が上がるのはプレーン枚数の削減であるから、まず最初に、これの可否を検討する。その方法とは、3枚のプレーンを調べ、その各プレーンの全画素値Pn(i,j)間に、以下の関係が成立する時である。
Pm(i,j)=A*Pn(i,j)+B・・・(式22)
ここでPm(i,j)、Pn(i,j)は任意の2枚のプレーンの画素値であり、A、Bは定数である。
【0105】
勿論自然画像でこのような事が生じるのは稀であるが、例えばパワーポイント等で作成した図面の場合や分割画像の全画素数が小さくなった場合には、その確率も無視できないほどに高くなる。また前記プレーンの削減の有無は、前記圧縮ファイルのヘッダ部分に書き込まれる。それに要する情報量の増大は、僅か数ビットである。
【0106】
次いで(2)の予測方法の変更であるが、通常の場合の符号化は各プレーン内での画素値の隣接相関を用いて行われるが、(1)ほどで無いにしても式22に近いような関係が両プレーン間で成立している場合には、前記隣接相関を用いず各プレーン間の相関を用いた方が圧縮効率が向上する場合もある。つまり前述の線形予測を用いず、符号化の対象情報として、先のPm(i,j)−A*Pn(i,j)−Bを用いる訳である。どちらを用いるかの判定は、先のエントロピー式で行う。前記隣接相関の見積もりは、前記予測方向を水平方向として求めたそれで、仮に行われる。
【0107】
(3)の座標パラメータの共通化とは、部分画像毎に求めた色差座標変換係数の中で共通化できるものが存在するか、の検討である。もし共通化できるものがある場合には、前記圧縮後のファイルのヘッダに整理して書き込まれる。前記係数の共通化による情報量の削減の程度は、前記係数が示す情報量(数バイト)*共通な部分画像枚数程度である。
【0108】
次いで前述したように最適な予測方向の検出(ステップS16)、符号化方向の決定(ステップS17)が行われる。
【0109】
前記予測値の検出に他のプレーンとの相関を利用する場合には、前記ステップS16の一部の工程は省略される。最後に同様に符号化が行われる(ステップS18)。
【0110】
本実施形態によれば、オブジェクトを考慮した画像分割が行われているので、前記連続的なオブジェクトを圧縮する際の圧縮効率が向上する。またその効果は全体に波及する。また前記プレーン間での情報共用化の検討も行われるので、更にその圧縮効率も向上する。
【0111】
また本実施形態のオブジェクトの抽出は、各プレーン間で各々別々に行われても良い。その場合には、前記部分画像への分割は別の位置、大きさ、形状になる。また前記抽出は、輝度プレーンで行われても良い。本実施形態のオブジェクトの抽出の目的は圧縮効率の向上にあるので、抽出されるオブジェクトは、必ずしも被写体オブジェクトで無くとも良い。また前記部分画像への分割は、必ずしも同じ大きさ、等ピッチでなくとも良い。また前記情報量の共用化には、先の3項目以外にも適用する事ができる。また共用の判断に用いたエントロピー式は、実際の圧縮結果、ファイルサイズ(コードサイズ)であっても構わない。
【0112】
次に本発明の第3の実施形態について説明する。本実施形態における、VGA画像の可逆圧縮方法のメインルーチンを図3に示す。図3のステップS21〜S24迄は、図2のステップS11〜S14と同じであるため説明は省略する。
【0113】
ステップS25のプレーン間共用化検討では、先の(1)プレーン枚数の削減工程で、任意の2枚のプレーン間相関を調べる。具体的には、先の(22)式で予想される予測値との差、予測誤差Pm(i,j)−A*Pn(i,j)−Bの自乗和を計算する。その値が予め決められた値(閾値)よりも小さい場合には、前述のように隣接相関を用いた予測方法ではなく、プレーン間の相関を用いた方法に符号化方法を変更するわけである。
【0114】
またステップS26では同様に8方向から前記長距離相関を用いたLPC予測で、予測値と予測誤差を求める。その際、予測誤差の大きな画素に対しては、
(1)その画素座標を記憶する。
(2)大きな予測誤差を部分画像毎に設けられているヘッダ部分に記憶する。
(3)予測誤差を0と置く。
という作業(点欠陥法)で、前記大きな予測誤差による表現ビット数の増加を防ぐ。ステップS27からステップS29は、第2の実施形態と同じである。
【0115】
本実施形態によれば、大きな予測誤差を示す画素を点欠陥として扱い、その画素値(予測誤差)を別途記録する事によって、前記圧縮後の情報量を減少可能である。本実施形態の点欠陥法は、例えばオブジェクト境界等に存在する階調段差を別途記録し、その中の比較的平坦、連続的なオブジェクト内部のみを効率的に符号化する事ができる。また時々見られる、デジタルカメラ等の画素欠陥補正の失敗による非連続的な輝点が存在する画像などに対しても、その悪影響を除去する事ができる。
【0116】
次に本発明の第4の実施形態について説明する。本実施形態における、デジタルカメラの静止画像取得のメインルーチンを図4に示す。ステップS31はCCD等の撮像センサによる静止画像の撮像工程である。
【0117】
前記撮像センサは、出力として式23〜25で表される輝度Y、色差K1、K2を出力する。
Y=W=R+G+B・・・(式23)
K1=R/W・・・(式24)
K2=B/W・・・(式25)
【0118】
前記出力は前記撮像センサの最終段で256階調のデジタル信号に変換されている。ステップS32はその撮像したアナログ信号をフレームメモリに移送しデジタル信号として記憶する工程である。
【0119】
前記撮像センサから出力された輝度Yや色差K1、K2信号は、ADコンバータ等で最大256階調のデジタル信号に変換される。変換されたデジタル画像情報は、前記デジタルカメラ内に存在するフレームメモリに記憶される(ステップS33)。
【0120】
ステップS34では前述したように画像分割が行われ、各部分画像毎に最適な色差プレーン座標が選択される(ステップS35)。その選択方法とは、式26、式27に示すとおりである。
J1=αK1+βK2・・・(式26)
J2=αK1−βK2・・・(式27)
ここでJ1、J2は新しい色差座標系であり、α、βは整数である。
【0121】
次いで算術符号により圧縮が行われ(ステップS36)、圧縮された画像は記録媒体に記録される(ステップS37)。
【0122】
本実施形態によれば前記色差プレーンが前記輝度プレーンと完全に分離しているため、仮に被写体オブジェクトに当たる照明光の強度分布にムラが有る場合にも、前記色差プレーンでは連続な画素値となるため、ランモードや予測符号化の効率が向上する。その為、出力される圧縮画像のファイルサイズも小さくなる。
【0123】
本実施形態に用いる色差座標は何もR/WやB/Wに限ることはなく、例えばR/GやB/Gその他で有っても構わない。選択のポイントは、輝度プレーンとは完全に分離している事である。また本実施形態はデジタルカメラだけではなく、他の撮像系に容易に適用する事ができる。
【0124】
以上のように、本発明の実施形態によれば、全体画像を分割して生じる各部分画像の性質に応じた符号化手法が各々の画像符号化で採用するため、全体画像の圧縮効率を向上させることが可能となる。
【0125】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。
【0126】
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0127】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0128】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(基本システム或いはオペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0129】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【図面の簡単な説明】
【0130】
【図1】本発明の第1の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図2】本発明の第2の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図3】本発明の第3の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図4】本発明の第4の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図5】VGA画像に対する分割方法を説明するための図である。
【図6】上下方向の輝度差を説明するための図である。
【図7】色座標(Cr、Cb)と新たな色座標(K1,K2)との関係を示す図である。
【図8】画素予測値を求めるための予測方向を説明するための図である。
【図9】符号化方向と画素予測値を求めるための予測方向との関係を示す図である。
【図10】オブジェクトと分割画像との関係を説明するための図である。
【図11】注目画素と周辺画素との相関を説明するための図である。
【図12】本発明の実施形態に適用可能な撮像装置の構成を示す図である。
【符号の説明】
【0131】
10:撮影レンズ
12:シャッタ
14:撮像素子
15:CDS回路
16:PGA
17:A/D変換器
18:タイミング発生回路
20:画像処理回路
22:メモリ制御回路
24:画像表示メモリ
26:D/A変換器
28:画像表示部
30:メモリ
32:画像圧縮・伸長回路
40:露光制御手段
42:測距制御手段
44:ズーム制御手段
46:バリア制御手段
48:ストロボ
50:システム制御回路
52:メモリ
54:表示部
56:不揮発性メモリ
60:電源スイッチ(メインスイッチ)
62:シャッタスイッチSW1
64:シャッタスイッチSW2
70:操作部
72:モードダイアルスイッチ
80:電源制御手段
82、84、92、206:コネクタ
86:電源手段
90、204:インタフェース
100:撮像装置
102:保護手段
104:光学ファインダ
200:記録媒体
202:記録部
【技術分野】
【0001】
本発明は、画像データを符号化処理するための符号化処理装置及び符号化処理方法に関するものである。
【背景技術】
【0002】
近年、デジタルカメラの発達により、自然画像を容易にデジタル情報化出来るように成って来ている。また近頃では静止画だけでなく、動画をも撮影可能なスチル&ムービーカメラも台頭しつつある。
【0003】
前記カメラは大量のメモリを消費するため、高効率なカラー画像圧縮方法が望まれている。また、前記カメラは電子ズームを前提としているため、前記ズーム時でも高精細な画像を提供出来る必要がある。しかし従来の主なコーデックであるJPEGやMPEGは非可逆圧縮方法であるため、前記高精細な画像を再生するには不向きなものになっている。
【0004】
また、前記カメラは動画撮影時においても、前記動画中の任意のフレームを静止画として抽出できるのが望ましい。その点で、前記動画専用コーデックであるMPEGは失格である。また、近年の表示装置の性能向上によって、従来の放送規格であるNTSCやMPEG等が提供する画像の品質はその限界を呈しつつ有る。
【0005】
このような状況で注目されつつあるのが、JPEG2000と呼ばれる新しい可逆、非可逆圧縮方法である。前記圧縮方法は本質的には静止画圧縮方法であり、可逆、非可逆圧縮の両方で基本的には同一の圧縮アルゴリズム(ウェーブレット変換)を採用している。しかし前記可逆圧縮の圧縮率は余り高くなく、1/2程度である。また前記圧縮方法は動画圧縮にも適用可能で、例えば非可逆圧縮の圧縮率1/8程度で良好な動画像を提供する事ができる。
【0006】
特許文献1には、スキャン方向を変換する方式が開示され、特許文献2には、画像分割して最適な圧縮方法を選択、採用する方式が開示されている。また、特許文献3には、画像分割にヒストグラムを使用する方式が開示され、特許文献4には、属性マップ/オブジェクトに基づいて画像圧縮する方式が開示されている。また、特許文献5には、ラン長の分布から画像の種類を判別する方式が開示され、特許文献6には、色差信号を原点の周りに回転する方式が開示されている。
【0007】
また他の静止画可逆圧縮方法には、例えばGIF、PNG、JPEG−LS、CALIC、TMW等が有る。
【0008】
【特許文献1】特開平8−126009号公報
【特許文献2】特開2000−333019号公報
【特許文献3】特開2001−22931号公報
【特許文献4】特開2001−169120号公報
【特許文献5】特開2002−163658号公報
【特許文献6】特許第3334242号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
前記高精細な画像を提供するカラー画像可逆圧縮方法、コーデックが実現すれば、前記動画像等の記録に莫大なメモリは必要でなくなる。しかしながら、前述したスチル&ムービーカメラは現状ではそのメモリ量、メモリコストが障壁となっており、本格的なカメラは未だ実現の時期を迎えていない。
【0010】
また前記NTSC規格においても公知の技術によって2枚のフィールド画像から1枚のフレーム画像を形成可能ではあるものの、前記2枚のフィールド画像間ではその撮像時間が僅かに異なっている為、高速に移動する物体等がブレる事が有る。従って動画中から静止画をも抽出する前記スチル&ムービーカメラにおいては、その記録方式は前記NTSC等が採用しているインターレース方式ではなくプログレッシブスキャン方式である事が望ましい。すると必然的に、前記圧縮方法は静止画を基本としたものになる。
【0011】
前記静止画の可逆圧縮効率は1/3程度と言われているが実証されたものではなく、その圧縮率は前記静止画の性質に大きく依存する。
【0012】
そこで、本発明の目的は、画像データの圧縮効率を更に向上させることにある。
【課題を解決するための手段】
【0013】
本発明の符号化処理装置の第1の態様は、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正手段と、前記傾斜補正手段による輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理手段とを有すること特徴とする。
本発明の符号化処理装置の第2の態様は、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減手段と、前記プレーン削減手段によるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理手段とを有することを特徴とする。
本発明の符号化処理方法の第1の態様は、画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正ステップと、前記傾斜補正ステップによる輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むこと特徴とする。
本発明の符号化処理方法の第2の態様は、画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減ステップと、前記プレーン削減ステップによるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むことを特徴とする。
本発明のプログラムは、前記の符号化処理方法の第1又は第2の態様をコンピュータに実行させることを特徴とする。
本発明のコンピュータ読み取り可能な記録媒体は、前記のプログラムを記録したことを特徴とする。
【発明の効果】
【0014】
本発明によれば、画像データの圧縮効率を更に向上させることが可能となる。
【発明を実施するための最良の形態】
【0015】
以下、本発明の好適な実施形態を、添付図面を参照しながら詳細に説明する。
【0016】
先ず、本発明の実施形態の概要について説明する。以下に説明する実施形態は圧縮効率の改善を、以下の項目で示した技術によって行う。
(1)静止画像の部分画像への分割
(2)1枚の輝度プレーンと2枚の色差プレーンへの分離
(3)輝度プレーンの傾斜補正
(4)色差プレーンの色座標の決定
(5)色差プレーンの情報を用いたオブジェクト検出、画像分割
(6)最適予測方向の決定
(7)最適予測方向を考慮した符号化方向の決定
(8)ファイル情報量を減少させる為の輝度プレーンと色差プレーンでの共用化検討
(9)点欠陥の例外処理
【0017】
(3)は主にランモード時の圧縮率改善を狙ったものである。公知のように、殆どのコーデックはランモードと予測誤差モード(算術符号化モード)を用意している。そのうち飛躍的に圧縮率が高くなるのは、前者を多用できる画像である。
【0018】
圧縮対象である自然画像は、被写体オブジェクトに外部から太陽やランプ等の照明光が当たったものと考える事ができる。既存の自然画像を画像解析してみると、図6に示すように、上下方向に大きな輝度差が観察されるのが通常である。この輝度差は、例えばあるVGA画像では平均35階調/256階調(14%)にも達する。
【0019】
これは前記オブジェクトの反射率は各部分でほぼ同一で有るのに対して、前記照明光の分布はそれとは対照的に上下方向で大きく異なっていることが原因である。即ち、一般に画像の上部は明るく輝度が高く、下部は暗く輝度が低い。
【0020】
本発明の実施形態においては、符号化を行う前にこれらの輝度差の補正を行う。具体的には主に上下方向に線形あるいは低次の関数を用いて補正を行った後に符号化を行う。これらの変換操作による画像圧縮ファイルの情報量の増加は、前記線形あるいは低次の関数の係数分だけであるので、事実上無視できるほど小さい。
【0021】
(4)の色差プレーンの色座標決定方法には、大別して2つの方法がある。従来の2枚の色差プレーンとは、例えば(B−G,R−G)や(U,V)であった。しかし、部分画像に分割され特定の被写体オブジェクトがその部分画像の大半に写り込む場合には、前記画像を構成する画素の画素値の大半が特定の1色で占められるような場合も想定される。そのような場合に、前記予め決められた色差プレーン座標を用いるのは非効率的である。
【0022】
そこで1つの方法とは、前記特定の1色を例えば画素値のヒストグラム等から求め、その色に対して2枚の色差プレーンを回転して、一方のプレーンの色差座標をその色に合わせ込み、他方のプレーンの色差座標をその色と直交するように変換する。
【0023】
具体的にはカラー画像の色の三原色をC1,C2,C3とすると、それと定数C0を合わせた計4つの項からなる線形量K1,K2を新しい色差プレーンの色座標とする訳である。
K1=α*C0+β*C1+γ*C2+δ*C3・・・(式1)
K2=ε*C0+ζ*C1+η*C2+θ*C3・・・(式2)
ここでα〜θは、線形結合の係数である。定数項C0は、前記K1,K2が負の値にならないように設けている訳である。ここでの情報量、ファイルサイズの増加は、先の自由度8の係数が表す数値64ビット:8バイト程度である。
【0024】
他の方法とは、前記色差プレーンの色座標を前記三原色の線形結合ではなく、(R/W,B/W)や(R/G,B/G)とする方法である。但し、ここでは可逆圧縮技術であるから、前記色座標に用いる値は例えばカメラ出力等の由緒正しい量である必要がある。既に整数で表現されているビットマップ画像から前記色座標のそれを求めても、その効果は無効である(丸め誤差が出るため)。あくまでも、アナログ出力(光量等)を直接R/W等にAD変換した値、例えば前記カメラ出力である必要が有る。
【0025】
前述したように被写体オブジェクトの色(反射率R)が場所によらず一定であるとすると、前記被写体に当たる照明光の光量I0が変化したとしても(輝度変化)、先の色座標Kはその値を変えない所が良い所である。
Ir=I0*Rr・・・(式3)
Kr=Ir/(Ir+Ig+Ib)=Rr/(Rr+Rg+Rb)・・・(式4)
ここでIは反射光量であり、添字のr,g,bは色の三原色、赤、緑、青に各々対応している。
【0026】
それに対して従来は輝度が変化すると、輝度プレーンの画素値以外に色差プレーンのそれも値を変える為、同一画素値が連続する時に利用出来るランモードを利用する事が出来ず、圧縮率が低下していた。本発明の実施形態では、前記色差プレーンのダイナミックレンジが従来の例えば8ビット(256階調)から増加するため(8+10=18ビット)多少余分な中間ファイルサイズが必要となる。但し圧縮後のそれは前記圧縮効率が改善されるから、問題とはならない。
【0027】
(5)の部分画像への分割は、従来のコーデックに見られていたように、画一的な分割ではなく、前記カラー画像中に含まれるオブジェクトを充分に考慮したものである事が望ましい。そのような方法としては、以下の3つの方法が考えられる。
【0028】
まず1つ目は、前記オブジェクトの抽出を色差プレーンの情報を用いる方法である。
現実的にはオブジェクトの抽出とは先のランモード採用の可否であるから、同一色が連続する部分を同一オブジェクトとみなす事もできる。それは前記色差プレーンの画素値を観察する事で可能である。
【0029】
2つ目は、前記オブジェクトが複数の部分画像に跨ることなく、同一の部分画像中に配置されるようにする事である。その為には、前記分割する部分画像の大きさを各カラー画像間で異なる任意の大きさとする事である。即ち、前記画像の分割は、その画像中に含まれるオブジェクトの大きさを考慮してから決定される。
【0030】
また3つ目は、前記分割画像の分割開始地点をカラー画像の左上から任意の位置まで平行移動して変更し分割を開始する事である。これによれば少なくとも前記オブジェクトを部分画像の中心に据える事ができる。画像の端面処理の問題は、上を下に、左を右にサイクリック状に連続させる事で回避する事ができる。ここでの情報量、ファイルサイズの増加は、前記画像の大きさを表すビット数(数ビット)程度である。
【0031】
(6)の予測方法は、従来のコーデックでも種々検討されている部分である。であるが、その改善効率は必ずしも高くない。本発明の実施形態では注目画素の周囲の少なくとも4方向、望ましくは8方向以上で前記予測値を求め、その予測誤差を最小とする最適予測方向を求め、その方向を圧縮符号化の方向として採用を行う。その際、5ピッチ以上離れた画素をも用いて長距離相関を求め、前記予測値を予測する。前記予測には、例えば線形予測(LPC)を用いる。
【0032】
従来のロスレスJPEGでは、1ピッチ離れた(つまりは隣接する)左上方向の3画素の値を参照して前記予測値を計算している。また前記JPEG−LSでは、同じく4画素の値を参照している。また前記CALICでは、2ピッチ離れた左上方向の計7画素の値を参照している。また前記TMWは注目画素から1ピッチ離れた周辺8画素の値を前記線形予測に用いている。であるが、本発明の実施形態ではこれらとは距離(ピッチ数)と画素並びにおいて異なっている。
【0033】
本発明の実施形態において長距離相関を用いるのは、図11に示したように比較的長距離(数画素)まで、前記注目画素との相関が認められるからである。グラフの横軸は注目画素からの距離であり、縦軸はその画素と前記注目画素との階調差の絶対値である。グラフの各線は、13種のVGAカラー画像の全画素(640*480)の平均値を示している。例えばグラフが水平になる地点を無相関になる地点であるとみなすと、図の例では5画素以上まで相関が存在する事になる。
【0034】
またLPC予測においては一般に、次数が高くなるほど(即ち沢山の画素情報を用いるほど)その予測精度は向上する。この長距離相関の存在は、今後展開される多画素、高精細画像においては、より顕著化されるものと考えられる。
【0035】
また従来はエッジの検出等を比較的近距離の画素を調べて行っていたが、これでは不正確である。やはり本発明の実施形態のように長距離相関を調べ、その相関が高い(つまりは予測誤差が小さい)、エッジである可能性が高い方向を予測に用いるべきである。
【0036】
また図11では前記予測の方向は、注目画素の周囲0度(水平方向)、45度、90度(垂直方向)、135度、の計4方向であるが、この数は任意である。一般には対向する方向の予測値は近く、また前記最小な予測誤差を示す最適な予測方向は、水平方向である場合が多い。しかし、特殊な画像も稀には存在するので、やはりその予測方向の選択は全方向(360度)から行われるべきである。
【0037】
さて、(7)の必要理由を従来のコーデックを用いて説明を行う。従来のコーデックでは、予測画素に主に左上のそれを用いていた。これは符号化方向が左上から右下に向かっていたからであり、左上方向は各画素の画素値yiが確定済みであるため、それらの画素値yiと予測誤差Δeを用いて注目画素の実際値yを求める事が可能であるからである。
y=f(yi)+Δe・・・(式5)
【0038】
それに対して右下の画素値は未だ未確定なため、それを用いても前記実際値yを計算する事は不可能である。このように、本発明の実施形態では予め予測の最適方向を求めた後に、それに見合った符号化方向を決定する。
【0039】
本発明の実施形態において使用する予測方向の指定は、例えば8方向では僅か3ビットであるため、その情報量、ファイルサイズの増加は事実上無視する事ができる。
【0040】
また(8)は、従来、輝度プレーンと色差プレーンとの符号化は、各々独立に行われるのが常であった。であるが、被写体オブジェクト+照明光という自然画像においては、前記両プレーンに共通する情報量が存在する筈である。仮にそのような情報量をプレーン間で統合出来れば、圧縮画像全体の情報量を減少可能であり、前記圧縮率の大幅な改善が見込める。
【0041】
本発明の実施形態ではこれを、以下の2つの方法によって実現している。一つ目は、プレーン枚数の削減である。ほぼ単色から成る画像の特定の部分画像においては、前記輝度プレーン1枚、色差プレーン2枚という前提が、必ずしも必要ではなくなる。その場合には、輝度プレーン1枚+色差プレーン1枚、あるいは色差プレーン2枚から前記輝度プレーンを計算式で求めても良い。勿論、色差プレーン1枚で済む場合も、稀には存在するだろう。
【0042】
その具体的な方法とは、圧縮前に画素値等のテーブルを両プレーン間で比較する事である。各々の画素値同士が両プレーン間である簡単な式で表せるならば、一方のプレーンは必要ではなくなる。また両者の相関が予め決められた閾値よりも高ければ、上述のように隣接相関、予測誤差を用いた公知の符号化方法ではなく、前記プレーン間の相関を用いて予測誤差を求めた方が良い場合も生じる。例えばP1とP2での各画素値をy1、y2とすると、予測誤差Δeは以下のように表される。
y2=α*y1+β+Δe・・・(式6)
ここでα、βは定数である。
【0043】
二つ目は、オブジェクトの位置や画像分割の方法などである。また、画像によっては前記各分割画像での最適予測方向、符号化方向をも共用化出来るかもしれない。
【0044】
また(9)は、撮像センサに必然的に存在する欠陥画素を考慮したものである。多画素な撮像センサには表示装置と同様に、多数の点欠陥が存在する。それらは通常例えばフレームメモリ上等で画像処理、補正されるため、一般には目立つ事はない。であるが、高々1点の点欠陥の為に、前記圧縮率を飛躍的に高めるランモードが中断される恐れも有る。またプレーン間での相関を利用する場合など、点欠陥として除去する画素が少数の場合には、充分に圧縮率改善に寄与する。
【0045】
本発明の実施形態による情報量、ファイルサイズの増大は、点欠陥数*(座標を表すビット数:数ビット+階調ビット数:8ビット)程度である。
【0046】
このように、現在マンモスコーデックと呼ばれるそれで有っても半導体集積回路の回路規模や演算速度の改善は誠に目覚しいので(各々3年4倍、3年8倍)、前記コーデックが将来的には最適化されたそれになる可能性がある。
【0047】
静止画、動画圧縮に必要なのは第一に圧縮画像ファイルサイズ、第二にデコード時間であるので、他を犠牲にした構成も充分に考えられ得る。また並列コンピューティング技術も進歩するので、前記並列処理を充分に考慮したコーデックである必要がある。本発明は上記の点でも、時代に適応している。
【0048】
次に、本発明の実施形態を具体的に説明する。図12は、本発明の実施形態に適用される撮像装置のシステム構成を示す図である。図12において、10は撮影レンズ、12は絞り機能を備えるシャッタ、14は光学像を電気信号に変換する撮像素子、16は撮像素子14のアナログ信号出力をデジタル信号に変換するA/D変換器である。
【0049】
18は撮像素子14、A/D変換器17、D/A変換器26にクロック信号や制御信号を供給するタイミング発生回路であり、メモリ制御回路22及びシステム制御回路50により制御される。
【0050】
15はCDS(相関二重サンプリング)回路、16はプログラマブルゲインアンプ(PGA)である。
【0051】
20は画像処理回路であり、A/D変換器17からのデータ或いはメモリ制御回路22からのデータに対して所定の画素補間処理や色変換処理を行う。
【0052】
また、画像処理回路20においては、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてシステム制御回路50が露光制御手段40、測距制御手段42に対して制御を行う、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(ストロボプリ発光)処理を行っている。
【0053】
さらに、画像処理回路20においては、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
【0054】
22はメモリ制御回路であり、A/D変換器17、タイミング発生回路18、画像処理回路20、画像表示メモリ24、D/A変換器26、メモリ30、圧縮・伸長回路32を制御する。
【0055】
A/D変換器17のデータが画像処理回路20、メモリ制御回路22を介して、或いはA/D変換器17のデータが直接メモリ制御回路22を介して、画像表示メモリ24或いはメモリ30に書き込まれる。
【0056】
24は画像表示メモリ、26はD/A変換器、28はTFT LCD等から成る画像表
示部であり、画像表示メモリ24に書き込まれた表示用の画像データはD/A変換器26を介して画像表示部28により表示される。画像表示部28を用いて撮像した画像データを逐次表示すれば、電子ファインダ機能を実現することが可能である。
【0057】
30は撮影した静止画像や動画像を格納するためのメモリであり、所定枚数の静止画像や所定時間の動画像を格納するのに十分な記憶量を備えている。これにより、複数枚の静止画像を連続して撮影する連写撮影やパノラマ撮影の場合にも、高速かつ大量の画像書き込みをメモリ30に対して行うことが可能となる。また、メモリ30はシステム制御回路50の作業領域としても使用することが可能である。
【0058】
32は、画像データを圧縮伸長する圧縮・伸長回路であり、メモリ30に格納された画像を読み込んで圧縮処理或いは伸長処理を行い、処理を終えたデータをメモリ30に書き込む。
【0059】
40は絞り機能を備えるシャッタ12を制御する露光制御手段であり、ストロボ48と連携することによりストロボ調光機能も有するものである。
【0060】
42は撮影レンズ10のフォーカシングを制御する測距制御手段、44は撮影レンズ10のズーミングを制御するズーム制御手段、46はバリアである保護手段102の動作を制御するバリア制御手段である。
【0061】
48はストロボであり、AF補助光の投光機能、ストロボ調光機能も有する。露光制御手段40、測距制御手段42はTTL方式を用いて制御されており、撮像した画像データを画像処理回路20によって演算した演算結果に基づき、システム制御回路50が露光制御手段40、測距制御手段42に対して制御を行う。
【0062】
50は撮像装置100全体を制御するシステム制御回路、52はシステム制御回路50の動作用の定数、変数、プログラム等を記憶するメモリである。
【0063】
54はシステム制御回路50でのプログラムの実行に応じて、文字、画像、音声等を用いて動作状態やメッセージ等を表示する液晶表示装置、スピーカ等の表示部であり、撮像装置100の操作部近辺の視認し易い位置に単数或いは複数個所設置され、例えばLCDやLED、発音素子等の組み合わせにより構成されている。
【0064】
56は電気的に消去・記録可能な不揮発性メモリであり、例えばEEPROM、フラッシュメモリ等が用いられる。
【0065】
60、62、64、70及び72は、システム制御回路50の各種の動作指示を入力するための操作手段であり、スイッチやダイアル、タッチパネル、視線検知によるポインティング、音声認識装置等の単数或いは複数の組み合わせで構成される。
【0066】
60は電源スイッチ(メインスイッチ)で、画像処理装置100の電源オン、電源オフの各モードを切り替え設定することが出来る。また、画像処理装置100に接続された各種付属装置の電源オン、電源オフの設定も合わせて切り替え設定することが出来る。
【0067】
62はシャッタスイッチSW1で、不図示のシャッタボタンの操作途中でONとなり、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理、EF(ストロボプリ発光)処理等の動作開始を指示する。
【0068】
64はシャッタスイッチSW2で、不図示のシャッタボタンの操作完了でONとなり、撮像素子14から読み出した信号をA/D変換器17、メモリ制御回路22を介してメモリ30に画像データを書き込む露光処理、画像処理回路20やメモリ制御回路22での演算を用いた現像処理、メモリ30から画像データを読み出し、圧縮・伸長回路32で圧縮を行い、記録媒体200に画像データを書き込む記録処理という一連の処理の動作開始を指示する。70は各種ボタンやタッチパネル等からなる操作部である。
【0069】
72はモードダイアルスイッチで、自動撮影モード、撮影モード、パノラマ撮影モード、再生モード、マルチ画面再生・消去モード、PC接続モード等の各機能モードを切り替え設定することが出来る。
【0070】
80は電源制御手段で、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成されており、電池の装着の有無、電池の種類、電池残量の検出を行い、検出結果及びシステム制御回路50の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体を含む各部へ供給する。
【0071】
82はコネクタ、84はコネクタ、86はアルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li-ion電池等の二次電池、ACアダプタ等からなる電源手段である。
【0072】
90はメモリカードやハードディスク等の記録媒体とのインタフェース、92はメモリカードやハードディスク等の記録媒体と接続を行うコネクタである。
【0073】
102は、撮像装置100のレンズ10を含む撮像部を覆う事により、撮像部の汚れや破損を防止するバリアである保護手段である。
【0074】
104は光学ファインダであり、画像表示部28による電子ファインダ機能を使用すること無しに、光学ファインダのみを用いて撮影を行うことが可能である。また、光学ファインダ104内には、表示部54の一部の機能、例えば、合焦表示、手振れ警告表示、ストロボ充電表示、シャッタスピード表示、絞り値表示、露出補正表示などが設置されている。
【0075】
200はメモリカードやハードディスク等の記録媒体である。記録媒体200は、半導体メモリや磁気ディスク等から構成される記録部202、撮像装置100とのインタフェース204、撮像装置100と接続を行うコネクタ206を備えている。なお、記録媒体200は本実施形態では撮像装置100に内蔵される構成として説明しているが、外部に構成されることも本発明の範疇内である。
【0076】
以下に説明する実施形態は、主に画像処理回路20及び圧縮・伸張回路32によって実現されるものである。先ず、本発明の第1の実施形態について説明する。本実施形態における、カラー画像の可逆圧縮方法のメインルーチンを図1に示す。
【0077】
本実施形態は図5に示したように各画素に8ビットのRGB色情報を有するVGA画像(640*480画素)51を可逆圧縮するものであり、前記画像はまず大きさ80*60画素の部分画像52に64分割される(ステップS1)。
【0078】
次いで下記の式7〜9に基づいて、輝度プレーン(Y)と色差プレーン(Cb、Cr)の分離が行われる(ステップS2)。
Y=R+2*G+B・・・(式7)
Cb=B−G・・・(式8)
Cr=R−G・・・(式9)
ここでR、G、Bは各画素での画素値(RGB値)である。
【0079】
次いで各部分画像の輝度プレーンYにおいて、画素値の傾斜補正がy方向のみで行われる(ステップS3)。これはまず行(j)毎に各画素値Y(i,j)を加算した値Y(j)を求める。
Y(j)=ΣY(i,j)・・・(式10)
和はiに対して取られる。
【0080】
それを下記の式11によって1次式で近似する。
Y(j)p=a*i+b・・・(式11)
上記aやbの値は、例えば公知の最小自乗法などで求められる。ここでY(j)pは先のY(j)の近似値である。
【0081】
このY(j)pを先の画素値Y(i,j)から引く事によって、前記傾斜補正が行われる。
ΔY(i,j)=Y(i,j)−Y(j)p・・・(式12)
【0082】
実際に符号化されるのは、式12のΔY(i,j)で表される量(差分)である。また先の2つの係数a、b(情報量16ビット)は、前記各部分画像毎に記録、保存される。
【0083】
次いで色差プレーンの座標変換が、各部分画像毎に独立に行われる(ステップS4)。まず最初に各色差プレーン(CrまたはCb)で、部分画像全体の画素に対して画素値Cr(i,j)、Cb(i,j)のヒストグラムが取られる。そのヒストグラム中での最大頻度を示す値を各々Crfreq、Cbfreqとすると、式13で決められる回転角θで色座標(Cr、Cb)を回転してできる、式14、式15で示される新たな色座標(K1,K2)を用いて、更にヒストグラムを求める。色座標(Cr、Cb)と色座標(K1,K2)との関係を図7に示す。
tanθ=Cbfreq/Crfreq・・・(式13)
K1=Cr*cosθ+Cb*sinθ・・・(式14)
K2=−Cr*sinθ+Cb*cosθ・・・(式15)
【0084】
そして前記両色差プレーンK1、K2で、下記の量を計算する。
H=−ΣPi*(logPi/log2)・・・(式16)
和はiに対して取られる。
Pi=N(Kn(i))/(80*60)・・・(式17)
式16は良く知られた、圧縮限界を示す式(エントロピー式)である。ここでKn(i)は、各色差プレーンのヒストグラムにおける、値iを示す度数である。また80*60は、前記部分画像の総画素数である。従ってlogPiは、その値iの度数が示す確率である。
【0085】
各色差プレーンK1、K2で求めた式16の値H1、H2の和H1+H2が予め決められた値(閾値)よりも小さい場合には、前記色差座標K1、K2を符号化座標に採用する。また前記和が前記閾値を越える場合には、先の最頻値Crfreq、Cbfreqの周囲あるいはセカンドピーク(次に頻度が高い値)の周囲についても、同様な調査を行う。それでも前記関係を満足しない場合には、前記和の中で最も小さな和を示す色差座標を前記符号化の座標に採用する。
【0086】
本実施形態が本ステップで行っている事は、前記色情報を一方の座標(この場合はK1)に集中して符号化効率を高める工夫である。
【0087】
次に公知の予測符号化手法を用いて、符号化の為の差分情報を求める。その為には前記予測に用いられる画素予測値を求める必要が有るが、本実施形態では前記予測を図8に示したように注目画素の5画素外方の8方向から、予測を行う(ステップS5)。
【0088】
注目画素をP0、それから1ピッチ離れた画素をP1、以下同様に5ピッチ離れた画素をP5とすると、公知の線形予測法(LPC)によって予測誤差ΔPは、次の式18、式19によって求められる。
ΔP=P0−Pproj・・・(式18)
Pproj=−u*P1−v*P2−w*P3−x*P4−y*P5・・・(式19)
ここでu,v,w,x,yの各係数は、前記部分画像全体の画素に対して最適化されている。
【0089】
前記予測誤差ΔPの最小自乗和は、前記予測の方向毎に異なる値を示す。そのうち最小の最小自乗和を示す方向を、本実施形態は予測の最適方向として採用する。
【0090】
最適な予測方向が求まったならば、次は各画素の符号化方向を決める(ステップS6)。図9に示すように、符号化の方向94は前記予測の最適方向93と同じ方向である。
本実施形態では各部分画像の各行毎に、並列処理的な符号化が行われる。その際に、右側の出発画素91から4画素分は式19では符号化が不可能であるが、存在しない画素の値は0であるとして式19を解釈、流用する。最後に公知の算術符号化で符号化が行われる(ステップS7)。
【0091】
本実施形態によれば、輝度プレーンの傾斜補正を行っているため、ランモード採用の割合が増加し、圧縮率が改善される。また部分画像毎に色差座標を変更しているため、それだけその部分画像に含まれる特定色を効率良く符号化可能である。またその符号化も、最適な方向を選択して符号化を行っているため、前記符号化の効率は良好である。
【0092】
本実施形態はVGAカラー画像以外の任意のカラー画像にも、用いる事ができる。またその部分画像への分割数や分割画像の大きさも任意である。また本実施形態に用いる式7〜式9で示される輝度色差プレーンの分離方法は、その他の公知の方法でも構わない。例えば、輝度YはY=R+G+Bで有っても良い。
【0093】
また式12で示される輝度プレーンの傾き補正は、一次式の補正だけでなくより高次の補正式でも構わない。その場合にはその増えた係数分だけ多少、画像圧縮に必要な情報量は増加する。また前記輝度の補正は、y方向だけでなく、x方向(水平方向)に行っても無論構わない。
【0094】
また色座標の選定は式14、式15で表現される座標回転だけでなく、先の式1、式2で表されるより一般的な線形式で有っても、勿論構わない。また本実施形態は可逆圧縮を対象としているので、前記色差座標K1,K2が表す階調値は、実数値であるよりも整数値である方が望ましい(計算で丸め誤差が出るため)。従って前記色差座標K1,K2の選定は、それらを考慮して決定する必要が有る。そのような座標には、下記の式20、式21のようなものがある。
K1=αCr+βCb・・・(式20)
K2=αCr−βCb・・・(式21)
ここでα、βは整数である。
【0095】
またK1、K2の各階調値は公知のように、最小値K1min、K2minを各々の値から引くことによって、0または正の整数とする事ができる。このようにしておくと、後の符号化が容易となる。
【0096】
また前記色差座標K1、K2の選択の際に使用する選択基準は何も先のエントロピー式である必要はなく、例えば従来コーデックのTMWのように、実際に圧縮を行ってそのコードサイズを知り最小なコードを生成するK1、K2を選択しても良い。
【0097】
また前記予測の方向は何も8方向に限る事はなく、全方位を考慮した4方向以上で有りさえすれば良い。またその次数も、その予測精度を向上させるために、画素ピッチ3以上画素を含む任意の数で良い。また前記予測は線形予測だけでなく、公知の任意の予測方法でも構わない。また符号化の方法は、公知の、例えばハフマン符号化等でも構わない。
【0098】
次に、本発明の第2の実施形態について説明する。本実施形態における、VGAカラー画像の可逆圧縮のメインルーチンを図2に示す。本実施形態では画像分割に先立ってオブジェクトの検出を行う。
【0099】
まず前述のように、輝度色差プレーンの分離を行う(ステップS11)。次いで図10に示すように、前記色差プレーン101で、オブジェクト102の検出を行う(ステップ12)。
【0100】
その方法とは、各色差プレーンで画素値のヒストグラムを作成し、前記画素値がその最頻値±Δを示す領域を、前記オブジェクト102であると認識する。ここでΔの値は、256階調の場合、0から3程度の値である。前記検出されたオブジェクト102を考慮して、前記VGA画像の分割を行う(ステップS13)。
【0101】
分割の方法とは、まず最初に前記オブジェクトの横と縦の大きさLx、Lyと重心位置(Gx,Gy)を検出する。次いで前記オブジェクトの大きさと想定する分割部分画像の大きさ(通常は40*30〜160*120)とを比較して、前記分割線103のピッチを決定する。前記オブジェクト102の大きさが大きい場合には、図10に示したように複数の部分画像に跨って前記オブジェクト102が存在するようになる。
【0102】
前記画像の分割に際しては、図に示したように前記重心位置(Gx,Gy)を考慮してその分割開始位置を決定する。前記画像を分割する分割線103は、前記画像101上で等間隔に引かれる。
【0103】
次いで前述したように、前記オブジェクト102の色に適した色差プレーンの座標系が決定される(ステップS14)。次いで、圧縮後のファイルサイズを小さくするために(つまりは圧縮率改善)、前記3枚のプレーン間での圧縮情報の共用化が検討される(ステップS15)。検討される項目と順序は、以下の通りである。
(1)プレーン枚数の削減
(2)予測方法の変更
(3)色差座標系の座標パラメータの共通化
【0104】
一番圧縮効率が上がるのはプレーン枚数の削減であるから、まず最初に、これの可否を検討する。その方法とは、3枚のプレーンを調べ、その各プレーンの全画素値Pn(i,j)間に、以下の関係が成立する時である。
Pm(i,j)=A*Pn(i,j)+B・・・(式22)
ここでPm(i,j)、Pn(i,j)は任意の2枚のプレーンの画素値であり、A、Bは定数である。
【0105】
勿論自然画像でこのような事が生じるのは稀であるが、例えばパワーポイント等で作成した図面の場合や分割画像の全画素数が小さくなった場合には、その確率も無視できないほどに高くなる。また前記プレーンの削減の有無は、前記圧縮ファイルのヘッダ部分に書き込まれる。それに要する情報量の増大は、僅か数ビットである。
【0106】
次いで(2)の予測方法の変更であるが、通常の場合の符号化は各プレーン内での画素値の隣接相関を用いて行われるが、(1)ほどで無いにしても式22に近いような関係が両プレーン間で成立している場合には、前記隣接相関を用いず各プレーン間の相関を用いた方が圧縮効率が向上する場合もある。つまり前述の線形予測を用いず、符号化の対象情報として、先のPm(i,j)−A*Pn(i,j)−Bを用いる訳である。どちらを用いるかの判定は、先のエントロピー式で行う。前記隣接相関の見積もりは、前記予測方向を水平方向として求めたそれで、仮に行われる。
【0107】
(3)の座標パラメータの共通化とは、部分画像毎に求めた色差座標変換係数の中で共通化できるものが存在するか、の検討である。もし共通化できるものがある場合には、前記圧縮後のファイルのヘッダに整理して書き込まれる。前記係数の共通化による情報量の削減の程度は、前記係数が示す情報量(数バイト)*共通な部分画像枚数程度である。
【0108】
次いで前述したように最適な予測方向の検出(ステップS16)、符号化方向の決定(ステップS17)が行われる。
【0109】
前記予測値の検出に他のプレーンとの相関を利用する場合には、前記ステップS16の一部の工程は省略される。最後に同様に符号化が行われる(ステップS18)。
【0110】
本実施形態によれば、オブジェクトを考慮した画像分割が行われているので、前記連続的なオブジェクトを圧縮する際の圧縮効率が向上する。またその効果は全体に波及する。また前記プレーン間での情報共用化の検討も行われるので、更にその圧縮効率も向上する。
【0111】
また本実施形態のオブジェクトの抽出は、各プレーン間で各々別々に行われても良い。その場合には、前記部分画像への分割は別の位置、大きさ、形状になる。また前記抽出は、輝度プレーンで行われても良い。本実施形態のオブジェクトの抽出の目的は圧縮効率の向上にあるので、抽出されるオブジェクトは、必ずしも被写体オブジェクトで無くとも良い。また前記部分画像への分割は、必ずしも同じ大きさ、等ピッチでなくとも良い。また前記情報量の共用化には、先の3項目以外にも適用する事ができる。また共用の判断に用いたエントロピー式は、実際の圧縮結果、ファイルサイズ(コードサイズ)であっても構わない。
【0112】
次に本発明の第3の実施形態について説明する。本実施形態における、VGA画像の可逆圧縮方法のメインルーチンを図3に示す。図3のステップS21〜S24迄は、図2のステップS11〜S14と同じであるため説明は省略する。
【0113】
ステップS25のプレーン間共用化検討では、先の(1)プレーン枚数の削減工程で、任意の2枚のプレーン間相関を調べる。具体的には、先の(22)式で予想される予測値との差、予測誤差Pm(i,j)−A*Pn(i,j)−Bの自乗和を計算する。その値が予め決められた値(閾値)よりも小さい場合には、前述のように隣接相関を用いた予測方法ではなく、プレーン間の相関を用いた方法に符号化方法を変更するわけである。
【0114】
またステップS26では同様に8方向から前記長距離相関を用いたLPC予測で、予測値と予測誤差を求める。その際、予測誤差の大きな画素に対しては、
(1)その画素座標を記憶する。
(2)大きな予測誤差を部分画像毎に設けられているヘッダ部分に記憶する。
(3)予測誤差を0と置く。
という作業(点欠陥法)で、前記大きな予測誤差による表現ビット数の増加を防ぐ。ステップS27からステップS29は、第2の実施形態と同じである。
【0115】
本実施形態によれば、大きな予測誤差を示す画素を点欠陥として扱い、その画素値(予測誤差)を別途記録する事によって、前記圧縮後の情報量を減少可能である。本実施形態の点欠陥法は、例えばオブジェクト境界等に存在する階調段差を別途記録し、その中の比較的平坦、連続的なオブジェクト内部のみを効率的に符号化する事ができる。また時々見られる、デジタルカメラ等の画素欠陥補正の失敗による非連続的な輝点が存在する画像などに対しても、その悪影響を除去する事ができる。
【0116】
次に本発明の第4の実施形態について説明する。本実施形態における、デジタルカメラの静止画像取得のメインルーチンを図4に示す。ステップS31はCCD等の撮像センサによる静止画像の撮像工程である。
【0117】
前記撮像センサは、出力として式23〜25で表される輝度Y、色差K1、K2を出力する。
Y=W=R+G+B・・・(式23)
K1=R/W・・・(式24)
K2=B/W・・・(式25)
【0118】
前記出力は前記撮像センサの最終段で256階調のデジタル信号に変換されている。ステップS32はその撮像したアナログ信号をフレームメモリに移送しデジタル信号として記憶する工程である。
【0119】
前記撮像センサから出力された輝度Yや色差K1、K2信号は、ADコンバータ等で最大256階調のデジタル信号に変換される。変換されたデジタル画像情報は、前記デジタルカメラ内に存在するフレームメモリに記憶される(ステップS33)。
【0120】
ステップS34では前述したように画像分割が行われ、各部分画像毎に最適な色差プレーン座標が選択される(ステップS35)。その選択方法とは、式26、式27に示すとおりである。
J1=αK1+βK2・・・(式26)
J2=αK1−βK2・・・(式27)
ここでJ1、J2は新しい色差座標系であり、α、βは整数である。
【0121】
次いで算術符号により圧縮が行われ(ステップS36)、圧縮された画像は記録媒体に記録される(ステップS37)。
【0122】
本実施形態によれば前記色差プレーンが前記輝度プレーンと完全に分離しているため、仮に被写体オブジェクトに当たる照明光の強度分布にムラが有る場合にも、前記色差プレーンでは連続な画素値となるため、ランモードや予測符号化の効率が向上する。その為、出力される圧縮画像のファイルサイズも小さくなる。
【0123】
本実施形態に用いる色差座標は何もR/WやB/Wに限ることはなく、例えばR/GやB/Gその他で有っても構わない。選択のポイントは、輝度プレーンとは完全に分離している事である。また本実施形態はデジタルカメラだけではなく、他の撮像系に容易に適用する事ができる。
【0124】
以上のように、本発明の実施形態によれば、全体画像を分割して生じる各部分画像の性質に応じた符号化手法が各々の画像符号化で採用するため、全体画像の圧縮効率を向上させることが可能となる。
【0125】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。
【0126】
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0127】
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0128】
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(基本システム或いはオペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0129】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【図面の簡単な説明】
【0130】
【図1】本発明の第1の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図2】本発明の第2の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図3】本発明の第3の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図4】本発明の第4の実施形態におけるカラー画像の可逆圧縮方法のメインルーチンを示す図である。
【図5】VGA画像に対する分割方法を説明するための図である。
【図6】上下方向の輝度差を説明するための図である。
【図7】色座標(Cr、Cb)と新たな色座標(K1,K2)との関係を示す図である。
【図8】画素予測値を求めるための予測方向を説明するための図である。
【図9】符号化方向と画素予測値を求めるための予測方向との関係を示す図である。
【図10】オブジェクトと分割画像との関係を説明するための図である。
【図11】注目画素と周辺画素との相関を説明するための図である。
【図12】本発明の実施形態に適用可能な撮像装置の構成を示す図である。
【符号の説明】
【0131】
10:撮影レンズ
12:シャッタ
14:撮像素子
15:CDS回路
16:PGA
17:A/D変換器
18:タイミング発生回路
20:画像処理回路
22:メモリ制御回路
24:画像表示メモリ
26:D/A変換器
28:画像表示部
30:メモリ
32:画像圧縮・伸長回路
40:露光制御手段
42:測距制御手段
44:ズーム制御手段
46:バリア制御手段
48:ストロボ
50:システム制御回路
52:メモリ
54:表示部
56:不揮発性メモリ
60:電源スイッチ(メインスイッチ)
62:シャッタスイッチSW1
64:シャッタスイッチSW2
70:操作部
72:モードダイアルスイッチ
80:電源制御手段
82、84、92、206:コネクタ
86:電源手段
90、204:インタフェース
100:撮像装置
102:保護手段
104:光学ファインダ
200:記録媒体
202:記録部
【特許請求の範囲】
【請求項1】
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、
前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正手段と、
前記傾斜補正手段による輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理手段とを有すること特徴とする符号化処理装置。
【請求項2】
前記傾斜補正手段は、前記輝度プレーン内の上下方向の輝度差を補正することを特徴とする請求項1に記載の符号化処理装置。
【請求項3】
少なくとも2枚の前記色差プレーン内で最大頻度を示す値に基づいて、前記色差プレーンの色座標変換を行う座標変換手段を更に有し、
前記符号化処理手段は、前記座標変換手段により座標変換された前記色差プレーンを符号化処理に用いることを特徴とする請求項1又は2に記載の符号化処理装置。
【請求項4】
注目画素を基点とする複数方向から夫々、予測誤差を求める予測誤差算出手段と、
前記複数方向毎に夫々求められた予測誤差に基づいて、前記注目画素の画素値を予測するための方向を決定する予測方向決定手段とを更に有し、
前記予測処理手段は、前記予測方向決定手段により決定された予測方向に基づいて、咳画像データの符号化方向を決定することを特徴とする請求項1乃至3の何れか1項に記載の符号化処理装置。
【請求項5】
前記予測誤差算出手段は、前記複数方向の夫々について前記注目画素から少なくとも5ピッチ以上離れた画素まで用いて予測誤差を求めることを特徴とする請求項4に記載の符号化処理装置。
【請求項6】
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、
前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減手段と、
前記プレーン削減手段によるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理手段とを有することを特徴とする符号化処理装置。
【請求項7】
前記輝度プレーン及び前記色差プレーン間の相関に基づいて、プレーン間の相関を用いて注目画素の画素値を予測する画素値予測手段を更に有し、
前記符号化処理手段は、前記画素値予測手段により予測される画素値を用いて前記画像データの符号化処理を行うことを特徴とする請求項6に記載の符号化処理装置。
【請求項8】
前記色差プレーンを複数に分割する分割手段と、
前記色差プレーン内で最大頻度を示す値に基づいて、前記色差プレーンの色座標変換を行う座標変換手段と、
前記座標変換手段による色座標変換処理にて用いられる色座標変換処理に係る情報を、前記分割手段による分割領域間で共用する情報共用手段とを有することを特徴とする請求項6又は7に記載の符号化処理装置。
【請求項9】
前記分割手段は、前記画像データ内に存在するオブジェクトの大きさに基づいて、前記分割領域の大きさを決定することを特徴とする請求項8に記載の符号化処理装置。
【請求項10】
前記分割手段は、前記オブジェクトの重心位置に基づいて、分割の開始位置を定め、前記開始位置から分割線を平行移動させて分割領域を決定することを特徴とする請求項8又は9に記載の符号化処理装置。
【請求項11】
前記予測誤差算出手段により算出された前記予測誤差が所定の値より大きい場合、前記予測誤差を所定の値に変更する予測誤差値変更手段を更に有することを特徴とする請求項4に記載の符号化処理装置。
【請求項12】
画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、
前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正ステップと、
前記傾斜補正ステップによる輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むこと特徴とする符号化処理方法。
【請求項13】
画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、
前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減ステップと、
前記プレーン削減ステップによるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むことを特徴とする符号化処理方法。
【請求項14】
請求項12又は13に記載の符号化処理方法をコンピュータに実行させるためのプログラム。
【請求項15】
請求項14に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項1】
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、
前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正手段と、
前記傾斜補正手段による輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理手段とを有すること特徴とする符号化処理装置。
【請求項2】
前記傾斜補正手段は、前記輝度プレーン内の上下方向の輝度差を補正することを特徴とする請求項1に記載の符号化処理装置。
【請求項3】
少なくとも2枚の前記色差プレーン内で最大頻度を示す値に基づいて、前記色差プレーンの色座標変換を行う座標変換手段を更に有し、
前記符号化処理手段は、前記座標変換手段により座標変換された前記色差プレーンを符号化処理に用いることを特徴とする請求項1又は2に記載の符号化処理装置。
【請求項4】
注目画素を基点とする複数方向から夫々、予測誤差を求める予測誤差算出手段と、
前記複数方向毎に夫々求められた予測誤差に基づいて、前記注目画素の画素値を予測するための方向を決定する予測方向決定手段とを更に有し、
前記予測処理手段は、前記予測方向決定手段により決定された予測方向に基づいて、咳画像データの符号化方向を決定することを特徴とする請求項1乃至3の何れか1項に記載の符号化処理装置。
【請求項5】
前記予測誤差算出手段は、前記複数方向の夫々について前記注目画素から少なくとも5ピッチ以上離れた画素まで用いて予測誤差を求めることを特徴とする請求項4に記載の符号化処理装置。
【請求項6】
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離手段と、
前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減手段と、
前記プレーン削減手段によるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理手段とを有することを特徴とする符号化処理装置。
【請求項7】
前記輝度プレーン及び前記色差プレーン間の相関に基づいて、プレーン間の相関を用いて注目画素の画素値を予測する画素値予測手段を更に有し、
前記符号化処理手段は、前記画素値予測手段により予測される画素値を用いて前記画像データの符号化処理を行うことを特徴とする請求項6に記載の符号化処理装置。
【請求項8】
前記色差プレーンを複数に分割する分割手段と、
前記色差プレーン内で最大頻度を示す値に基づいて、前記色差プレーンの色座標変換を行う座標変換手段と、
前記座標変換手段による色座標変換処理にて用いられる色座標変換処理に係る情報を、前記分割手段による分割領域間で共用する情報共用手段とを有することを特徴とする請求項6又は7に記載の符号化処理装置。
【請求項9】
前記分割手段は、前記画像データ内に存在するオブジェクトの大きさに基づいて、前記分割領域の大きさを決定することを特徴とする請求項8に記載の符号化処理装置。
【請求項10】
前記分割手段は、前記オブジェクトの重心位置に基づいて、分割の開始位置を定め、前記開始位置から分割線を平行移動させて分割領域を決定することを特徴とする請求項8又は9に記載の符号化処理装置。
【請求項11】
前記予測誤差算出手段により算出された前記予測誤差が所定の値より大きい場合、前記予測誤差を所定の値に変更する予測誤差値変更手段を更に有することを特徴とする請求項4に記載の符号化処理装置。
【請求項12】
画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、
前記輝度プレーン内に存在する輝度差の補正を行う傾斜補正ステップと、
前記傾斜補正ステップによる輝度差の補正処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むこと特徴とする符号化処理方法。
【請求項13】
画像データの符号化処理を行う符号化処理装置による符号化処理方法であって、
少なくとも1枚の輝度を示す輝度プレーンと少なくとも1枚の色差を示す色差プレーンとに画像データを分離する分離ステップと、
前記輝度プレーン及び前記色差プレーン間の相関に基づいて、前記輝度プレーン及び前記色差プレーンのうちから少なくとも1枚のプレーンを削減するプレーン削減ステップと、
前記プレーン削減ステップによるプレーン削減処理の後に前記画像データの符号化処理を行う符号化処理ステップとを含むことを特徴とする符号化処理方法。
【請求項14】
請求項12又は13に記載の符号化処理方法をコンピュータに実行させるためのプログラム。
【請求項15】
請求項14に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2006−340198(P2006−340198A)
【公開日】平成18年12月14日(2006.12.14)
【国際特許分類】
【出願番号】特願2005−164413(P2005−164413)
【出願日】平成17年6月3日(2005.6.3)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
【公開日】平成18年12月14日(2006.12.14)
【国際特許分類】
【出願日】平成17年6月3日(2005.6.3)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】
[ Back to top ]