画像信号の符号化方法および装置
【課題】演算の簡易化と圧縮効率の高効率化を同時に実現する画像信号の符号化方法および装置を提供することを目的とするものである。
【解決手段】
信号の列を3次元ブロック化して、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割して、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する画像信号の符号化方法において、 3次元ブロックH1を、複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なさる前記ブロックを集めたものI1,I3,J1,J2,J3を前記塊とする。
【解決手段】
信号の列を3次元ブロック化して、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割して、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する画像信号の符号化方法において、 3次元ブロックH1を、複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なさる前記ブロックを集めたものI1,I3,J1,J2,J3を前記塊とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像信号を符号化して、画像信号を圧縮する方法および装置に関するものである。
【背景技術】
【0002】
例えば、無線テレビ電話や携帯情報端末(PDA)のようなパーソナルビデオコミュニケーションシステムが急速に普及しつつある。パーソナルビデオコミュニケーションシステムにおいては、画像信号の符号化による信号圧縮は最も重要な技術のひとつである。現在、MPEG1,MPEG2,MPEG4,H.261あるいはH.263などの画像信号の符号化方式がよく知られている。しかし、これらの符号化方式は、符号化および復号化の計算が複雑で手間がかかるで、電池のエネルギー消費量が大きく、PDAによる通信には不都合である。
【0003】
この問題を解決するために、3次元階層ツリー構造の一種である八分木法を用いて、3次元画像や動画の信号圧縮を行うことが提案されている(非特許文献1〜4)。
【0004】
八分木法を用いる画像信号の圧縮方法は、概略、次のようなものである。
図12は八分木法による階層ツリー構造の概念図である。上位の3次元ブロックA1は画像信号の列を4×4×4画素にブロック化したものであり、8個の中位の3次元ブロックB1〜B8に分割され、前記8個の中位の3次元ブロックB1〜B8のうち、2個の3次元ブロックB5およびB8はそれぞれ更に下位の3次元ブロックC1〜C8および3次元ブロックC9〜C16に分割される。
【0005】
3次元ブロックの分割を行うか否かの判断は、ある階層の3次元ブロックに含まれる画素が同一と見なせることを基準におこなわれる。つまり、同一と見なせない場合には、下位の3次元ブロックに分割し、同一と見なせる場合は分割を停止する。そして、分割された3次元ブロックのそれぞれに含まれる画素が同一と見なせるまで分割が続けられる。図12の例では、3次元ブロックA1に含まれる4×4×4個の画素の輝度が同一と見なせないので、8個の3次元ブロックB1〜B8に分割されている。また、分割された前記8個の3次元ブロックのうち、3次元ブロックB5およびB8のそれぞれに含まれる画素は同一と見なせないので、さらにそれぞれ8個の下位の3次元ブロックに分割されている。一方、3次元ブロックB1〜B4,B6,B7のそれぞれに含まれる画素は同一と見なせるので、それ以上の分割は行われない。
【0006】
なお、分割を行うか否か(同一と見なせるか否か)の具体的な判断基準は、種々の形式が提案されているが、下記の(数1)のような簡単な条件式で表現することもできる。
【0007】
max(Xi)−min(Xi)< th (数1)
【0008】
ここで、Xiはブロックに含まれる画素のレベル(輝度あるいは濃度)であり、thは所定の閾値である。つまり、(数1)はブロックに含まれる全ての画素のレベルが閾値thの幅に収まっていれば、分割を中止し、収まっていなければ、更に分割を続けることを意味する。
【0009】
このように、画像信号の3次元ブロックを、その3次元ブロックに含まれる画素のレベルが全て同一であると見なせるまで分割し、その分割されたブロックの構造データとそのブロックに含まれる画素のレベルを組にしたものを画像信号として記述すれば、全ての画素について画素情報を一つ一つ記述する場合に比べて信号量を小さくできる。つまり信号圧縮が行われる訳である。
【非特許文献1】C. L. Jackins and S. L. Tanimoto ”Oct-trees and their use in representing three dimensional objects”, CGIP, vol. 14, pp. 249-270, 1980.
【非特許文献2】M. Yau and S. N. Srihari ”Recursive generation of hierarchical data structures for multidimensional digital images”, Proc. PRIP'82, pp. 485-490, 1982
【非特許文献3】D. Meagher ”Geometric modeling using octree encoding”, CGIP, vol. 19, pp. 129-147, 1982
【非特許文献4】N. Ahuja and C. Nash ”Octree representation of moving objects” CVGIP, vol. 26, pp. 207-216, 1984
【発明の開示】
【発明が解決しようとする課題】
【0010】
八分木法を用いる画像信号の圧縮方法は、加算、減算、比較あるいはビットシフトのような単純な演算で構成されているので、MPEG1等に比べて計算が簡単であった。しかしながら、この方式は3次元ブロックの一部に同一と見なせない部分があると、その3次元ブロック全体を8分割するので、必要以上の分割が行われ、圧縮効率が低くなるという問題があった。
【0011】
例えば、図12の上位の3次元ブロックA1を構成する64個の画素の内、下位の3次元ブロックC1、C16に相当する2個の画素の輝度が、他の62個の画素と大きく異なり、他の62個の画素の輝度は同一と見なせる場合を考えてみる。このような場合でも、八分木法では最上位の3次元ブロックA1を8分割して、8個の中位の3次元ブロックB1〜B8を作成し、中位の3次元ブロックB5およびB8をさらにそれぞれ、8分割して、16個の下位の3次元ブロックC1〜C16を作成しているから、上位の3次元ブロックA1を中位の3次元ブロック6個、下位の3次元ブロック16個の合計22個に分割することになる。結局、64個の画素を22個のブロックにまとめた訳であり、圧縮率は1/3程度に留まる。
【0012】
このように、八分木法を用いる画像信号の圧縮は圧縮効率が低いので、実用性に難点があった。そこで、本発明は演算の簡易化と圧縮効率の高効率化を同時に実現する画像信号の符号化方法および装置を提供することを目的とするものである。
【課題を解決するための手段】
【0013】
本発明の画像信号の符号化方法の第1の構成は、画像信号の列を3次元ブロック化して、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割して、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する画像信号の符号化方法において、前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを連結したものを前記塊とすることを特徴とする。
【0014】
本発明の画像信号の符号化方法の第2の構成は前記第1の構成に加えて、前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする。
【0015】
この構成により、そこに含まれる全ての画素の画素レベルが同一と見なされる任意形状の一連のサブブロックを塊として取り扱うから、不必要な分割を回避することができるので、画像信号の圧縮率が高くなる。
【0016】
本発明の画像信号の符号化方法の第3の構成は前記第2の構成に加えて、そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割して、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする。
【0017】
この構成により、前記サブブロックをさらにマイクロブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割するから、画質が向上する。
【0018】
本発明の画像信号の符号化方法の第4の構成は、前記第2または第3の構成に加えて、四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正することを特徴とする。
【0019】
この構成により、直接比較すればリンクされないサブブロックが、リンクの繰り返しにより同一の画素の塊として扱われること回避できるので、画質が向上する。
【0020】
本発明の画像信号の符号化方法の第5の構成は、前記第2ないし第4の構成に加えて、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする。
【0021】
この構成により、簡単な演算で「有効/無効」を判断するので、演算時間および消費電力を節約することができる。
【0022】
本発明の画像信号の符号化方法の第6の構成は、前記第1ないし第5の構成に加えて、前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする。
【0023】
この構成により、3次元ブロックの分割形式が単純なので、演算が簡単になり、演算時間および消費電力を更に節約することができる。
【0024】
本発明の画像信号の符号化装置の第1の構成は、画像信号の列を3次元ブロック化する手段と、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割する手段と、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する手段を備えた画像信号の符号化装置において、前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを集めて、前記塊とする手段を備えたことを特徴とする。
【0025】
本発明の画像信号の符号化装置の第2の構成は前記第1の構成に加えて、前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする。
【0026】
本発明の画像信号の符号化装置の第3の構成は、前記第2の構成に加えて、そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割する手段と、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする。
【0027】
本発明の画像信号の符号化装置の第4の構成は、前記第2または第3の構成に加えて、四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正する手段を有することを特徴とする。
【0028】
本発明の画像信号の符号化装置の第5の構成は、前記第2ないし第4の構成に加えて、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする。
【0029】
本発明の画像信号の符号化装置の第6の構成は、前記第1ないし第5の構成に加えて、前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする。
【発明の効果】
【0030】
以上説明したように、本発明は、演算の簡易化と圧縮効率の高効率化および高画質化の要求に同時に答えることができる画像信号の符号化方法および装置を提供することができる。そして、本発明は無線テレビ電話や携帯情報端末(PDA)のようなパーソナルビデオコミュニケーションシステムに適した方法および装置として実用性が高い。
【発明を実施するための最良の形態】
【0031】
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
【実施例】
【0032】
図1は、本発明の実施例に係る適応階層ツリー構造の概念図である。上位の3次元ブロックH1は画像信号の列を4×4×4画素の立方体にブロック化したものであり、3個の任意形状のサブブロックI1〜I3に分割される。サブブロックI1およびI2は、2×2×2画素からなる単位立方体であり、サブブロックI3は、6個の前記単位立方体が連結されたものである。さらに、サブブロックI2は3個のマイクロブロックJ1〜J3に分割されている。マイクロブロックJ1およびJ3はそれぞれ2個の画素から構成され、マイクロブロックJ2は4個の画素から構成されている。そして、サブブロックI1に含まれる画素の画素レベルは全て同一と見なされる。同様にサブブロックI3およびマイクロブロックJ1、J2、J3にそれぞれ含まれる画素の画素レベルは全て同一と見なされる。
【0033】
このように、前記適応階層ツリー構造においては、上位の3次元ブロックは、そこに含まれる画素の画素レベルが全て同一と見なされるまで、分割を繰り返して、何個かの任意の形状の下位の3次元ブロックに分割される。この下位の3次元ブロックの構造データと前記下位の3次元ブロックに含まれる画素の画素レベルを量子化したデータを組み合わせることによって、画像データは圧縮される。
【0034】
これから、前記適応階層ツリーを作成するために、8個(=2×2×2)のサブブロックから構成される立方体ブロックを、任意形状の下位のブロックに分割する手順を説明する。
【0035】
図2および図3は、立方体ブロックの分割手順を説明する図である。図2に示すように、立方体ブロックNは8個のサブブロックP(1)〜P(8)から構成されている。ここで、サブブロックP(1)〜P(8)の互いの関係を表示する12本のリンクL12〜L78を仮想する。
【0036】
リンクL12、L34、L56およびL78は、それぞれリンクP(1)とP(2)とP(3)とP(4)、P(5)とP(6)およびP(7)とP(8)を結ぶリンクであり、横方向リンクと呼ぶことにする。
【0037】
リンクL13、L24、L57およびL68は、それぞれリンクP(1)とP(3)とP(2)とP(4)、P(5)とP(7)およびP(6)とP(8)を結ぶリンクであり、縦方向リンクと呼ぶことにする。
【0038】
リンクL15、L26、L37およびL48は、それぞれリンクP(1)とP(5)とP(2)とP(6)、P(3)とP(7)およびP(4)とP(8)を結ぶリンクであり、奥行き方向リンクと呼ぶことにする。
【0039】
さて、図3(a)に示すように8個のサブブロックP(1)〜P(8)の画素レベルが大きく異なる場合は、隣接するサブブロックP(1)〜P(8)のどれを組み合わせても同一と見なせるものはないから、すべてのリンクL12〜L78は「無効」(図では点線で表示している)状態にあると考える。また、サブブロックP(1)とサブブロックP(5)に含まれる画素の画素レベルが同一と見なされ、他のサブブロックのレベルが異なる場合は、図3(b)に示すように、リンクL15が「有効」(図では太実線で表示している)状態にあると考え、サブブロックP(1)とサブブロックP(5)を併合して、1つのブロックとして取り扱い、他の6個のサブブロックはそれぞれを独立したブロックとして取り扱う。また、全てのサブブロックP(1)〜P(8)のレベルが同一と見なせる場合は、図3(c)に示すように、すべてのリンクL12〜L78が「有効」状態にあると考え、8個のサブブロックP(1)〜P(8)を全て併合して、1つのブロックとして取り扱う。
【0040】
このように、8個のサブブロックP(1)〜P(8)の中から併合可能な組み合わせ、すなわち、そこに含まれる全ての画素の画素レベルが同一とみなせるようなサブブロックP(1)〜P(8)の組み合わせを選び出して、サブブロックの塊を作成する問題は、12個のリンクL12〜L78のそれぞれについて、「有効」または「無効」を決定する問題に帰着できる。なお、8個のサブブロックP(1)〜P(8)の併合のパターンは、2の12乗通り、すなわち4096通りあることになるが、後述する「併合補正」の処理によって、不合理な組み合わせを排除すると、本発明の方法で選択可能な組み合わせは984通りになる。
【0041】
そこで、12個のリンクL12〜L78のそれぞれについて、「有効」または「無効」を決定する手順を、図4〜図8を参照しながら説明する。
【0042】
図4は、8個のサブブロックP(1)〜P(8)の併合の可否を決定する概略手順を説明する図である。この概略手順は、横方向リンクの有効・無効を検討して横方向に並ぶサブブロック同士の併合の可能性を判断する第1ステップ、縦方向リンクの有効・無効を検討して縦方向に並ぶサブブロック同士の併合の可能性を判断する第2ステップ、前記第1ステップで判断した横方向のサブブロックの併合と前記第2ステップで判断した縦方向の併合の間に不合理が生じた場合に前記縦方向の併合の判断を取り消す第3ステップ、奥行き方向リンクの有効・無効を検討して奥行き方向に並ぶサブブロック同士の併合の可能性を判断する第4ステップ、および前記第1ステップないし前記第3ステップで判断したサブブロックの横方向および縦方向の併合と前記第4ステップで判断したサブブロックの奥行き方向の併合の間に不合理が生じた場合に前記奥行き方向の併合の判断を取り消す第5ステップに大きく分けられる。以下、第1ステップから順を追って、12個のリンクL12〜L78の「有効/「無効」を決定する手順を説明する。
【0043】
(第1ステップ)
符号化の対象となる画像信号の列はビデオメモリ1に記憶されている。このビデオメモリ1から画像信号の列を逐次読み出して、前記画像信号の列をサブブロックP(1)〜P(8)からなる3次元ブロックにして、パイプラインレジスタ2に記憶する。次に、サブブロックP(1)〜P(8)に属する画素の画素レベルをパイプラインレジスタ2から読み出し、領域併合判断モジュール31〜34に入力する。領域併合判断モジュール31はサブブロックP(1)に属する画素の画素レベルとサブブロックP(2)に属する画素の画素レベルを比較してサブブロックP(1)とサブブロックP(2)の併合の可否を判断するモジュールである。同様に、領域併合判断モジュール32はサブブロックP(3)とサブブロックP(4)の、領域併合判断モジュール33はサブブロックP(5)とサブブロックP(6)の、領域併合判断モジュール34はサブブロックP(7)とサブブロックP(8)の併合の可否をそれぞれ判断するモジュールである。
【0044】
(領域併合判断モジュール)
図5は、領域併合判断モジュールの入出力を模式化した図である。なお、領域併合判断モジュール31〜34および後述する領域併合判断モジュール51〜54、領域併合判断モジュール81〜84の処理は全く同一である。
【0045】
領域併合判断モジュールの入力は、Iamax,Iamin,Ibmax,IbminおよびThの5種である。ここで、添え字a,bは併合判断の対象となるサブブロックP(1)〜P(8)の番号を示している。すなわち、Iamax,Iaminは領域併合判断の対象となる一方の領域(サブブロックP(a))に属する画素の画素レベルの最大値と最小値であり、Ibmax,Ibminは他方の領域(サブブロックP(b))に属する画素の画素レベルの最大値と最小値である。また、Thは画素レベルを同一と見なすか否か(つまり、領域併合の可否)を判断するための閾値である。
【0046】
領域併合判断モジュール21の出力は、Oamax,Oamin,Obmax,ObminおよびLinkの5種である。Oamax,Oaminは前記一方の領域(サブブロックP(a))に属する画素の画素レベルの代表値であり、Obmax,Obminは前記他方の領域(サブブロックP(b))に属する画素の画素レベルの代表値である。Linkは領域併合の可否を表示するためのフラグである。
【0047】
領域併合が成されない場合は、代表値Oamax,Oamin,Obmax,Obminはそれぞれ最大値、最小値Iamax,Iamin,Ibmax,Ibminに等しい。
【0048】
領域併合が成される場合は、OamaxおよびObmaxは、前記一方の領域(サブブロックP(a))または前記他方の領域(サブブロックP(b))に属する画素の画素レベルの最大値(つまり、IamaxまたはIbmaxのいずれか大きい方の値)に等しくなり、OaminおよびObminは前記一方の領域(サブブロックP(a))または前記他方の領域(サブブロックP(b))に属する画素の画素レベルの最小値(つまり、IaminまたはIbminのいずれか小さい方の値)に等しくなる。領域併合が成される場合は前記一方の領域(サブブロックP(a))および前記他方の領域(サブブロックP(b))に属する画素の画素レベルが同一であると見なされるから、画素レベルの代表値も統一されるのである。
【0049】
次に、領域併合の可否の判断の手順と、代表値Oamax,Oamin,Obmax,Obminを決定する手順を詳述する。
【0050】
まず、下記の(数2)に示すように、IamaxとIbmaxの値を比較していずれか大きい値をImaxとする。つまりImaxはサブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルの最大値である。
【0051】
Imax=max(Iamax,Ibmax) (数2)
【0052】
つぎに、(数3)に示すように、IaminとIbminの値を比較していずれか小さい値をIminとする。つまりIminはサブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルの最小値である。
【0053】
Imin=min(Iamin,Ibmin) (数3)
【0054】
さらに、(数4)に示すように、ImaxとIminの差D、すなわち、サブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルの変動幅(ダイナミックレンジ)を求める。
【0055】
D=Imax−Imin (数4)
【0056】
次に、変動幅Dと閾値Thを比較する。変動幅Dが閾値Thより小さければ、サブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルは同一と見なせるから、「併合は可」と判断され、リンクLabは「有効」とされる。この時、フラグLinkに「1」を立てる。逆に変動幅Dが閾値Thresholdと等しいか、より大きければ、サブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルは同一と見なせないから、「併合は不可」と判断され、リンクLabは「無効」とされる。この時、フラグLinkに「0」を立てる。
【0057】
以後の説明では、リンクLabのフラグLinkの値を単にLabと表記することにする。つまり、Lab=1ならば、リンクLabは「有効」であり、サブブロックP(a)とサブブロックP(b)の「併合は可」とされていることを意味し、Lab=0ならば、リンクLabは「無効」であり、サブブロックP(a)とサブブロックP(b)の「併合は不可」とされていることを意味する。
【0058】
最後に、Oamax,Oamin,Obmax,Obminに(表1)に示す値を代入する。つまり、Lab=0の時は、サブブロックP(a)とサブブロックP(b)の併合は不可だから、Oamax,Oamin,Obmax,Obminの値は元のままであり、Iamax,Iamin,Ibmax,Ibminがそれぞれ代入される。Lab=1の時は、サブブロックP(a)とサブブロックP(b)の併合は可だから、OamaxとObmaxはImaxに統一され、OaminとOaminはIminに統一される。これらの値を出力して、領域併合判断モジュールの処理は終わる。
【0059】
【表1】
【0060】
同様に、領域併合判断モジュール32〜34もそれぞれの判断対象のサブブロックに対して、同様の処理を行う。なお、領域併合判断モジュール31〜34の処理は互いに独立しているから、パラレルに処理することも出来るが、シリアルに処理しても良い。また、領域併合判断モジュール31〜34の出力はパイプラインレジスタ4に記憶される。
【0061】
(第2ステップ)
パイプラインレジスタ4から前記第1ステップの処理後のサブブロックP(1)〜P(8)の画素レベルの最大値I1max〜I8maxおよび最小値I1min〜I8minを読み出して、領域併合判断モジュール51〜54に入力する。領域併合判断モジュール51はサブブロックP(1)とサブブロックP(3)の併合の可否を判断するモジュールである。同様に、領域併合判断モジュール52はサブブロックP(2)とサブブロックP(4)の、領域併合判断モジュール53はサブブロックP(5)とサブブロックP(7)の、領域併合判断モジュール54はサブブロックP(6)とサブブロックP(8)の併合の可否をそれぞれ判断するモジュールである。
【0062】
領域併合判断モジュール51〜54では、前述の領域併合判断モジュール31〜34と同様の処理が行われ、サブブロックP(1)〜P(8)の縦方向の併合の可否が判断される。領域併合判断モジュール41〜44の処理も互いに独立しているから、パラレルに処理することも出来るが、シリアルに処理しても良い。
【0063】
(第3ステップ)
前記第2ステップの処理結果は、4併合補正モジュール61、62に入力されて処理される。4併合補正モジュール61はサブブロックP(1)〜P(4)の横方向併合と縦方向併合の不合理を補正するモジュールであり、4併合補正モジュール62はサブブロックP(5)〜P(8)の横方向併合と縦方向併合の不合理を補正するモジュールである。
【0064】
4併合補正モジュール61、62の処理内容を説明する前に、「併合補正」の概念を説明する。
【0065】
図6は、「併合補正」の概念を説明する図である。まず、サブブロックP(1)〜P(4)が与えられて(図6(a))、横方向併合を検討した結果、サブブロックP(1)とP(2)は併合可(リンクL12は「有効」)であるが、サブブロックP(3)とP(4)は併合不可(リンクL34は「無効」)となった(図6(b))。次に縦方向併合を検討すると、サブブロックP(1)とP(3)は併合可(リンクL13は「有効」)であり、サブブロックP(2)とP(4)も併合可(リンクL24は「有効」)となった(図6(c))。このように、四辺形を構成する4つのリンクのうち3つのリンクが「有効」となる場合がある。
【0066】
この場合、サブブロックP(1)とP(2)が併合されるとともに、サブブロックP(1)とP(3)、サブブロックP(2)とP(4)が併合されるので、結局、サブブロックP(1)〜P(4)が全て併合され1つのブロックとして取り扱われることになる。前述したように、サブブロックP(3)とP(4)を直接比較すると、画素レベルの差が大きいので併合不可とされるにも関わらず、併合を繰り返した結果、同一の画素レベルに統一されてしまう訳である。このような不合理を放置すると、本来、その画面に存在する画素レベルの高低が消されてしまうので、画質が低下する場合がある。
【0067】
そこで、4個のサブブロックを結ぶ4本のリンクの内、3本が「有効」で1本が「無効」とされた時に、「有効」とされた前記3本のリンクのいずれか1本を「無効」として、そのリンクで結合されるサブブロックの併合を行わないことにした。この処理を本明細書では「併合補正」と呼ぶことにする。
【0068】
さて、3本のリンクの中から「無効」にする1本を選ぶ方法は各種考えられる。例えば、3本のリンクの変動幅(ダイナミックレンジ)を比較して、変動幅の一番大きいリンクを「無効」にするようにすれば、画素レベルの変化をより忠実に再現できる。しかし、本実施例では計算の簡易化のために、リンクの添え字の番号の古いものを「無効」にすることにしたので、リンクL24を「無効」にした(図6(d))。
【0069】
(4併合補正モジュール)
図7は、4併合補正モジュール61、62の入出力を模式化した図である。なお、4併合補正モジュール61および4併合補正モジュール62の処理は全く同一である。
【0070】
4併合補正モジュール61,62の入力は、Iamax,Iamin,Jamax,Jamin,Ibmax,Ibmin,Jbmax,Jbmin,Icmax,Icmin,Jcmax,Jcmin,Idmax,Idmin,Jdmax,Jdmin,およびLab,Lcd,Lac,Lbdの20種である。添え字a,b,c,dは4併合補正の対象であるサブブロックP(1)〜P(8)の番号を示している。Iamax,IaminはサブブロックP(a)に属する画素の画素レベルの代表値であって、第2ステップ終了後つまり縦方向の領域併合判断モジュール51〜54の処理後の値である。また、Jamax,JaminはサブブロックP(a)に属する画素の画素レベルの代表値であって、第1ステップ終了後つまり横方向の領域併合判断モジュール31〜34の処理後の値である。同様に、Ibmax〜IdminはサブブロックP(b)〜P(d)に属する画素の画素レベルの代表値であって、第2ステップ終了後の値である。また、Jbmax,JdminはサブブロックP(b)〜P(d)に属する画素の画素レベルの代表値であって、第1ステップ終了後の値である。
【0071】
4併合補正モジュールの61,62の出力は、Oamax,Oamin,Obmax,Obmin,Ocmax,Ocmin,Odmax,OdminおよびL’ac,L’bdの10種である。添え字a,b,c,dは4併合補正の対象であるサブブロックP(1)〜P(8)の番号を示している。Oamax〜OdminはサブブロックP(b)〜P(d)に属する画素の画素レベルの代表値である。また、L’ac,L’bdはサブブロックP(a),P(c)間およびP(b),P(d)間の併合の可否を表示するフラグLinkである。
【0072】
図8は、4併合補正の規則を説明する図である。4併合補正モジュール61、62にフラグLab,Lcd,Lac,Lbdが入力されると、この規則にしたがって、縦方向リンクのフラグLacおよびLbdの値は、L’ac,L’bdに変更される。
【0073】
図8に示すように、サブブロックP(a)〜P(b)について4併合補正が必要となる場合は下記のパターン1〜4の4通りの場合がある。
(パターン1)
横方向リンクLabが「無効」、横方向リンクLcd、縦方向リンクLacおよび縦方向リンクLbdが「有効」(Lab=0、Lcd=Lac=Lbd=1)の場合は、縦方向リンクLacをそのまま(L’ac=1)にして、縦方向リンクLbdを補正して「無効」(L’bd=0)にする。
(パターン2)
横方向リンクLabが「有効」で、横方向リンクLcdが「無効」、縦方向リンクLacおよび縦方向リンクLbdが「有効」(Lab=1、Lcd=0、Lac=Lbd=1)の場合は、縦方向リンクLacをそのまま(L’ac=1)にして、縦方向リンクLbdを補正して「無効」(L’bd=0)にする。
(パターン3)
横方向リンクLab、Lcdが「有効」で、縦方向リンクLacが「無効」、縦方向リンクLbdが「有効」(Lab=Lcd=1、Lac=0、Lbd=1)の場合は、縦方向リンクLacをそのまま(L’ac=0)にして、縦方向リンクLbdを補正して「無効」(L’bd=0)にする。
(パターン4)
横方向リンクLab、横方向リンクLcdおよび縦方向リンクLacが「有効」で、縦方向リンクLbdが「無効」(Lab=Lcd=Lac=1、Lbd=0)の場合は、縦方向リンクLacを補正(L’ac=0)して、縦方向リンクLbdをそのまま(L’bd=0)にする。
以上のパターン1〜4に当てはまらない場合は、補正は行わない。つまり、縦方向リンクLacおよび縦方向リンクLbdともにそのまま(L’ac=Lac、L’bd=Lbd)にする。
【0074】
以上説明した補正の規則を纏めると、表2のようになる。
【0075】
【表2】
【0076】
縦方向リンクLacおよび縦方向リンクLbdの補正が終わったら、各サブブロックP(a)〜P(d)に属する画素の画素レベルの代表値Oamax,Oamin,Obmax,Obminbmin,Ocmax,Ocmin,Odmax,Odminを、表3および表4に示す規則に従って決定する。
【0077】
【表3】
【0078】
【表4】
【0079】
以下に、表3,表4の規則を簡単に説明する。
CASE1:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンク、縦方向リンクの両方が「無効」だから、サブブロックP(a)、サブブロックP(b)に属する画素の画素レベルの代表値は、サブブロックP(a)およびサブブロックP(b)についての横方向の領域併合判断後の値が採用される
【0080】
CASE2:サブブロックP(a)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には横方向についての領域併合判断後の値が採用される。サブブロックP(b)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0081】
CASE3:サブブロックP(a)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合判断後の値が採用される。サブブロックP(b)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には横方向についての領域併合判断後の値が採用される。
【0082】
CASE4:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、サブブロックP(a)およびサブブロックP(b)の画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合判断後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0083】
CASE5:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンクが「有効」であり、縦方向リンクが「無効」だから、画素レベルの代表値にはサブブロックP(a)およびサブブロックP(b)についての横方向の領域併合判断後の値が採用される。
【0084】
CASE6:サブブロックP(a)については、横方向リンクが「有効」、縦方向リンクが「無効」であり、サブブロックP(b)については、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(a)、サブブロックP(b)およびサブブロック(d)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(a)およびサブブロックP(b)の代表値はサブブロックP(b)とサブブロックP(d)についての縦方向の領域併合判断後の代表値が採用される。
【0085】
CASE7:サブブロックP(a)については、横方向リンクおよび縦方向リンクが「有効」であり、サブブロックP(b)については、横方向リンクが「有効」、縦方向リンクが「無効」だから、サブブロックP(a)、サブブロックP(b)およびサブブロック(c)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(a)およびサブブロックP(b)の代表値はサブブロックP(a)とサブブロックP(c)についての縦方向の領域併合判断後の代表値が採用される。
【0086】
CASE8:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(a)およびサブブロックP(b)の画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)ついての縦方向の領域併合後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0087】
CASE9:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンク、縦方向リンクの両方が「無効」だから、サブブロックP(c)、サブブロックP(d)に属する画素の画素レベルの代表値は、サブブロックP(c)およびサブブロックP(d)についての横方向の領域併合判断後の値が採用される。
【0088】
CASE10:サブブロックP(c)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には。サブブロックP(c)およびサブブロックP(d)についての横方向の領域併合判断後の値が採用される。サブブロックP(d)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0089】
CASE11:サブブロックP(c)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合判断後の値が採用される。サブブロックP(d)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には、サブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0090】
CASE12:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、サブブロックP(c)およびサブブロックP(d)の画素レベルの代表値には、サブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0091】
CASE13:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンクが「有効」であり、縦方向リンクが「無効」だから、画素レベルの代表値には、サブブロックP(c)およびサブブロックP(d)についての横方向の領域併合判断後の値が採用される。
【0092】
CASE14:サブブロックP(c)については、横方向リンクが「有効」、縦方向リンクが「無効」であり、サブブロックP(d)については、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(c)、サブブロックP(d)およびサブブロック(b)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(c)およびサブブロックP(d)の代表値はサブブロックP(b)とサブブロックP(d)についての縦方向の領域併合判断後の代表値が採用される。
【0093】
CASE15:サブブロックP(c)については、横方向リンクおよび縦方向リンクが「有効」であり、サブブロックP(d)については、横方向リンクが「有効」、縦方向リンクが「無効」だから、サブブロックP(c)、サブブロックP(d)およびサブブロック(a)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(c)およびサブブロックP(d)の代表値はサブブロックP(a)とサブブロックP(c)についての縦方向の領域併合判断後の代表値が採用される。
【0094】
CASE16:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(c)およびサブブロックP(d)の画素レベルの代表値には、サブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0095】
4併合補正モジュール61および62の処理結果を、パイプラインレジスタ7に書き込んで、第3ステップは終了する。なお、4併合補正モジュール61および62は互いに独立しているから、パラレルに処理しても、シリアルに処理してもよい。
【0096】
(第4ステップ)
第4ステップでは奥行き方向リンクについて、領域併合判断を行うため、パイプラインレジスタ7から第3ステップの処理結果を読み出して、領域併合判断モジュール81〜84に入力する。領域併合判断モジュール81はサブブロックP(1)とサブブロックP(5)の併合の可否を判断するモジュールである。また、領域併合判断モジュール82はサブブロックP(3)とサブブロックP(7)の、領域併合判断モジュール83はサブブロックP(2)とサブブロックP(6)の、領域併合判断モジュール84はサブブロックP(4)とサブブロックP(8)の併合の可否をそれぞれ判断するモジュールである。
【0097】
領域併合判断モジュール81〜84では、領域併合判断モジュール31〜34および領域併合判断モジュール51〜54と同様に、各サブブロックP(1)〜P(8)に含まれる画素の画素レベルを比較して、併合の可否を判断する。
【0098】
なお、領域併合判断モジュール81〜84は互いに独立しているので、パラレル処理、シリアル処理のいずれでもよい。
【0099】
(第5ステップ)
前記第4ステップの処理結果は、8併合補正モジュール91に入力されて処理される。8併合補正モジュール91はサブブロックP(1)〜P(8)の横方向併合と奥行き縦方向併合の不合理および横方向併合と奥行き縦方向併合の不合理を補正するモジュールである。8併合補正モジュール91は4併合補正モジュール61,62と同様に、4個のサブブロックを結ぶ4本のリンクの内、3本が「有効」で1本が「無効」とされた時に、「有効」とされた前記3本のリンクのいずれか1本を「無効」にする処理を行うモジュールであり、次の6組のサブブロックの組、(P(1)、P(2)、P(5)、P(6))、(P(1)、P(3)、P(5)、P(7))、((P(2)、P(4)、P(6)、P(8))、(P(3)、P(4)、P(7)、P(8))、(P(1)、P(4)、P(5)、P(8))および(P(2)、P(3)、P(6)、P(7))について、奥行き方向のリンクの補正を検討し、その結果を重ね合わせて、前記奥行き方向のリンクの「有効/無効」を決定する。以下に、この補正の手順を詳述する。
【0100】
サブブロックの組、(P(1)、P(2)、P(5)、P(6))については、リンクL12,L56,L15,L26の「有効/無効」を表示するフラグL12,L56,L15,L26の組み合わせを表5に示す規則に当てはめて、L(1)15,L(1)26の値を求める。
【0101】
【表5】
【0102】
サブブロックの組、(P(1)、P(3)、P(5)、P(7))については、フラグL13,L57,L15,L37の組み合わせを表6に示す規則に当てはめて、L(2)15,L(1)37の値を求める。
【0103】
【表6】
【0104】
サブブロックの組、(P(2)、P(4)、P(6)、P(8))については、フラグL24,L68,L26,L48の組み合わせを表7に示す規則に当てはめて、L(2)26,L(1)48の値を求める。
【0105】
【表7】
【0106】
サブブロックの組、(P(3)、P(4)、P(7)、P(8))については、フラグL34,L78,L37,L48の組み合わせを表8に示す規則に当てはめて、L(2)37,L(2)48の値を求める。
【0107】
【表8】
【0108】
サブブロックの組、(P(1)、P(4)、P(5)、P(8))については、フラグL14,L58,L15,L48の組み合わせを表9に示す規則に当てはめて、L(3)15,L(3)48の値を求める。
【0109】
【表9】
【0110】
なお、フラグL14およびL58は、サブブロックP(1)とP(4)およびP(5)とP(8)の併合の有無を表示するフラグであり、(数5)で与えられる。
【0111】
L14=(L12andL24)or(L13andL34)
L58=(L56andL68)or(L57andL78) (数5)
【0112】
サブブロックの組、(P(2)、P(3)、P(6)、P(7))については、フラグL23,L67,L26,L37の組み合わせを表9に示す規則に当てはめて、フラグL26,L37の値をL(3)26,L(3)37に変更する。
【0113】
【表9】
【0114】
なお、フラグL23およびL67は、サブブロックP(2)とP(3)およびP(6)とP(7)の併合の有無を表示するフラグであり、下記の(数6)で与えられる。
【0115】
L23=(L12andL13)or(L24andL34)
L67=(L56andL57)or(L68andL78) (数6)
【0116】
これで、サブブロックP(1)〜P(8)の6通りの組み合わせについてのフラグL15、L26、L37、L48の補正値L(1)15〜L(3)48が得られた。あるリンクについて、前記6通りの組み合わせの少なくとも1つで補正する必要があれば、そのリンクを補正する必要があるので、(数7)に示すように補正値L(1)15〜L(3)48の論理積をL’15、L’26、L’37、L’48とし、フラグL15、L26、L37、L48をこれらと置き換える。
【0117】
L’15=L(1)15andL(2)15andL(3)15
L’26=L(1)26andL(2)26andL(3)26
L’37=L(1)37andL(2)37andL(3)37
L’48=L(1)48andL(2)48andL(3)48 (数7)
【0118】
以上の演算結果をパイプラインレジスタ10に書き込んで、第5ステップは終了する。
【0119】
以上、第1ステップから第5ステップの処理を行うことで、12本のリンクL12〜L78の「有効/無効」が決定される。8個のサブブロックからなるブロックは、幾つかの「有効」なリンクで結合されたサブブロックの「塊」に分割される。また、サブブロックに含まれる画素の画素レベルは同一と見なせない場合は、そのサブブロックについて、第1ステップから第5ステップの処理を行って、「そこに含まれる全ての画素の画素レベルが同一と見なせる」マイクロブロックの「塊」に分割する。これを繰り返して、立体ブロックN全体を、「そこに含まれる全ての画素の画素レベルが同一と見なせる塊」に分割する。そして、この「塊」に含まれる画素の画素レベルを量子化して、量子化した画素データと「塊」の構造データを組にして、ハフマン符号の手法によって可変長符号に変換する。
【0120】
以上、本発明の実施例を、画像信号の符号化方法として説明してきたが、本発明の方法を実施する装置は、コンピュータに本発明の方法をプログラムの形で組み込むことにより簡単に構成できる。また、図4に示したような各モジュールに機能を分割して専用のハードウェアを用意すれば、演算をさらに高速化することができる。
【0121】
最後に、本発明の符号化方法の性能を従来の方法と比較して示す。なお、すべての比較は、ビデオフレームの輝度成分(Y)について行っているが、圧縮率については、輝度成分(Y)と2つの色差成分(Cr、Cb)を含んでいる。また、客観的比較を行うために、本発明の方法と八分木法については、同一の量子化のステップを使用した。量子化段階のハフマン符号とツリー構造情報は各符号化手法のそれぞれについて作成した。
【0122】
図9に、原画像と本発明の方法によって符号化した画像データによる画像、および従来の方法による画像を示す。図9(a)は、原画像であり、図9(b)は、MPEG4 TM5による画像、図9(c)は、本発明の方法による画像、図9(d)は、八分木法による画像である、比較のために、圧縮率は同レベルに揃えている。図から解るように、本発明の方法による画像の画質は、MPEG4 TM5による画像に比べて遜色がなく、八分木法による画像に比べると遙かに優れている。
【0123】
表10は、各方法による演算数の比較を示す表である。この表から、本発明の方法の操作数はMPEG4の約6分の1であり、バッテリーの負担が小さいことが解る。
【0124】
【表10】
【0125】
表11は、各方法による符号化に要する時間を示している。本発明の符号化手法および八分木法による符号化時間は、MPEG4の10分の1以下である。なお、ここに示した時間は、ペンティアム4(登録商標) 2.4GHzパーソナルコンピュータ上で動作させた場合であり、OSはウィンドウズXP(登録商標)である。
【0126】
【表11】
【0127】
図10は、各方法について、圧縮率と画質の関係を表示するグラフであり、画質はピーク信号−ノイズ比(PSNR)で表示している。図中で「ADAPTIVE」と表示した太い実線が本発明の実験結果を示し、「MPEG4」と表示した細い実線はMPEG4 TM5による実験結果を、「OCTREE」と表示した破線は八分木法による実験結果をそれぞれ示している。圧縮率0.5bit/pelにおいて、本発明の符号化手法のPSNRはMPEG4に対して約0.6dB小さいが、八分木法に対しては約1.2dB優れている。
【0128】
図11は、各方法について、圧縮率0.5bit/pelの条件の下で各フレームの画質を表示するグラフである。図中で「ADAPTIVE」と表示した太い実線が本発明の実験結果を示し、「MPEG4」と表示した細い実線はMPEG4 TM5による実験結果を、「OCTREE」と表示した破線は八分木法による実験結果をそれぞれ示している。PSNRの傾向は図10と同様に、MPEG4、本発明の方法、八分木法の順だが、PSNRの分布は本発明の方法が3者の中で最も狭い。
【0129】
なお、本実施例では、3次元ブロック化された画像信号をサブブロックに分割するとともに、サブブロックを連結する仮想的な「リンク」という概念を導入して、「リンク」で連結されたサブブロックを、そこに含まれるすべての画素の画素レベルを同一と見なし得る画像信号の塊として取り扱うことにより、画像信号を符号化圧縮する方法および装置を示したが、本発明は「リンク」を用いるものに限られるものではない。3次元ブロック化された画像信号をそこに含まれるすべての画素の画素レベルを同一と見なし得る任意形状のサブブロックの塊に分割する画像信号の符号化方法は、本発明の技術的範囲に含まれる。
【図面の簡単な説明】
【0130】
【図1】本発明の実施例に係る適応階層ツリー構造の概念図である。
【図2】立方体ブロックの分割手順を説明する図である。
【図3】立方体ブロックの分割手順を説明する図である。
【図4】8個のサブブロックの併合の可否を決定する概略手順を説明する図である。
【図5】領域併合判断モジュールの入出力を模式化した図である。
【図6】併合補正の概念を説明する図である。
【図7】4併合補正モジュールの入出力を模式化した図である。
【図8】4併合補正の規則を説明する図である。
【図9】原画像、本発明の方法による画像、および従来の方法による画像の例である。
【図10】圧縮率と画質の関係を表示するグラフである。
【図11】各フレームの画質を表示するグラフである。
【図12】八分木法による階層ツリー構造の概念図である。
【符号の説明】
【0131】
1 ビデオメモリ
2 パイプラインレジスタ
31〜34 領域併合判断モジュール
4 パイプラインレジスタ
51〜54 領域併合判断モジュール
61,62 4併合補正モジュール
7 パイプラインレジスタ
81〜84 領域併合判断モジュール
91 8併合補正モジュール
10 パイプラインレジスタ
【技術分野】
【0001】
本発明は、画像信号を符号化して、画像信号を圧縮する方法および装置に関するものである。
【背景技術】
【0002】
例えば、無線テレビ電話や携帯情報端末(PDA)のようなパーソナルビデオコミュニケーションシステムが急速に普及しつつある。パーソナルビデオコミュニケーションシステムにおいては、画像信号の符号化による信号圧縮は最も重要な技術のひとつである。現在、MPEG1,MPEG2,MPEG4,H.261あるいはH.263などの画像信号の符号化方式がよく知られている。しかし、これらの符号化方式は、符号化および復号化の計算が複雑で手間がかかるで、電池のエネルギー消費量が大きく、PDAによる通信には不都合である。
【0003】
この問題を解決するために、3次元階層ツリー構造の一種である八分木法を用いて、3次元画像や動画の信号圧縮を行うことが提案されている(非特許文献1〜4)。
【0004】
八分木法を用いる画像信号の圧縮方法は、概略、次のようなものである。
図12は八分木法による階層ツリー構造の概念図である。上位の3次元ブロックA1は画像信号の列を4×4×4画素にブロック化したものであり、8個の中位の3次元ブロックB1〜B8に分割され、前記8個の中位の3次元ブロックB1〜B8のうち、2個の3次元ブロックB5およびB8はそれぞれ更に下位の3次元ブロックC1〜C8および3次元ブロックC9〜C16に分割される。
【0005】
3次元ブロックの分割を行うか否かの判断は、ある階層の3次元ブロックに含まれる画素が同一と見なせることを基準におこなわれる。つまり、同一と見なせない場合には、下位の3次元ブロックに分割し、同一と見なせる場合は分割を停止する。そして、分割された3次元ブロックのそれぞれに含まれる画素が同一と見なせるまで分割が続けられる。図12の例では、3次元ブロックA1に含まれる4×4×4個の画素の輝度が同一と見なせないので、8個の3次元ブロックB1〜B8に分割されている。また、分割された前記8個の3次元ブロックのうち、3次元ブロックB5およびB8のそれぞれに含まれる画素は同一と見なせないので、さらにそれぞれ8個の下位の3次元ブロックに分割されている。一方、3次元ブロックB1〜B4,B6,B7のそれぞれに含まれる画素は同一と見なせるので、それ以上の分割は行われない。
【0006】
なお、分割を行うか否か(同一と見なせるか否か)の具体的な判断基準は、種々の形式が提案されているが、下記の(数1)のような簡単な条件式で表現することもできる。
【0007】
max(Xi)−min(Xi)< th (数1)
【0008】
ここで、Xiはブロックに含まれる画素のレベル(輝度あるいは濃度)であり、thは所定の閾値である。つまり、(数1)はブロックに含まれる全ての画素のレベルが閾値thの幅に収まっていれば、分割を中止し、収まっていなければ、更に分割を続けることを意味する。
【0009】
このように、画像信号の3次元ブロックを、その3次元ブロックに含まれる画素のレベルが全て同一であると見なせるまで分割し、その分割されたブロックの構造データとそのブロックに含まれる画素のレベルを組にしたものを画像信号として記述すれば、全ての画素について画素情報を一つ一つ記述する場合に比べて信号量を小さくできる。つまり信号圧縮が行われる訳である。
【非特許文献1】C. L. Jackins and S. L. Tanimoto ”Oct-trees and their use in representing three dimensional objects”, CGIP, vol. 14, pp. 249-270, 1980.
【非特許文献2】M. Yau and S. N. Srihari ”Recursive generation of hierarchical data structures for multidimensional digital images”, Proc. PRIP'82, pp. 485-490, 1982
【非特許文献3】D. Meagher ”Geometric modeling using octree encoding”, CGIP, vol. 19, pp. 129-147, 1982
【非特許文献4】N. Ahuja and C. Nash ”Octree representation of moving objects” CVGIP, vol. 26, pp. 207-216, 1984
【発明の開示】
【発明が解決しようとする課題】
【0010】
八分木法を用いる画像信号の圧縮方法は、加算、減算、比較あるいはビットシフトのような単純な演算で構成されているので、MPEG1等に比べて計算が簡単であった。しかしながら、この方式は3次元ブロックの一部に同一と見なせない部分があると、その3次元ブロック全体を8分割するので、必要以上の分割が行われ、圧縮効率が低くなるという問題があった。
【0011】
例えば、図12の上位の3次元ブロックA1を構成する64個の画素の内、下位の3次元ブロックC1、C16に相当する2個の画素の輝度が、他の62個の画素と大きく異なり、他の62個の画素の輝度は同一と見なせる場合を考えてみる。このような場合でも、八分木法では最上位の3次元ブロックA1を8分割して、8個の中位の3次元ブロックB1〜B8を作成し、中位の3次元ブロックB5およびB8をさらにそれぞれ、8分割して、16個の下位の3次元ブロックC1〜C16を作成しているから、上位の3次元ブロックA1を中位の3次元ブロック6個、下位の3次元ブロック16個の合計22個に分割することになる。結局、64個の画素を22個のブロックにまとめた訳であり、圧縮率は1/3程度に留まる。
【0012】
このように、八分木法を用いる画像信号の圧縮は圧縮効率が低いので、実用性に難点があった。そこで、本発明は演算の簡易化と圧縮効率の高効率化を同時に実現する画像信号の符号化方法および装置を提供することを目的とするものである。
【課題を解決するための手段】
【0013】
本発明の画像信号の符号化方法の第1の構成は、画像信号の列を3次元ブロック化して、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割して、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する画像信号の符号化方法において、前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを連結したものを前記塊とすることを特徴とする。
【0014】
本発明の画像信号の符号化方法の第2の構成は前記第1の構成に加えて、前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする。
【0015】
この構成により、そこに含まれる全ての画素の画素レベルが同一と見なされる任意形状の一連のサブブロックを塊として取り扱うから、不必要な分割を回避することができるので、画像信号の圧縮率が高くなる。
【0016】
本発明の画像信号の符号化方法の第3の構成は前記第2の構成に加えて、そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割して、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする。
【0017】
この構成により、前記サブブロックをさらにマイクロブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割するから、画質が向上する。
【0018】
本発明の画像信号の符号化方法の第4の構成は、前記第2または第3の構成に加えて、四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正することを特徴とする。
【0019】
この構成により、直接比較すればリンクされないサブブロックが、リンクの繰り返しにより同一の画素の塊として扱われること回避できるので、画質が向上する。
【0020】
本発明の画像信号の符号化方法の第5の構成は、前記第2ないし第4の構成に加えて、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする。
【0021】
この構成により、簡単な演算で「有効/無効」を判断するので、演算時間および消費電力を節約することができる。
【0022】
本発明の画像信号の符号化方法の第6の構成は、前記第1ないし第5の構成に加えて、前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする。
【0023】
この構成により、3次元ブロックの分割形式が単純なので、演算が簡単になり、演算時間および消費電力を更に節約することができる。
【0024】
本発明の画像信号の符号化装置の第1の構成は、画像信号の列を3次元ブロック化する手段と、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割する手段と、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する手段を備えた画像信号の符号化装置において、前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを集めて、前記塊とする手段を備えたことを特徴とする。
【0025】
本発明の画像信号の符号化装置の第2の構成は前記第1の構成に加えて、前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする。
【0026】
本発明の画像信号の符号化装置の第3の構成は、前記第2の構成に加えて、そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割する手段と、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする。
【0027】
本発明の画像信号の符号化装置の第4の構成は、前記第2または第3の構成に加えて、四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正する手段を有することを特徴とする。
【0028】
本発明の画像信号の符号化装置の第5の構成は、前記第2ないし第4の構成に加えて、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする。
【0029】
本発明の画像信号の符号化装置の第6の構成は、前記第1ないし第5の構成に加えて、前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする。
【発明の効果】
【0030】
以上説明したように、本発明は、演算の簡易化と圧縮効率の高効率化および高画質化の要求に同時に答えることができる画像信号の符号化方法および装置を提供することができる。そして、本発明は無線テレビ電話や携帯情報端末(PDA)のようなパーソナルビデオコミュニケーションシステムに適した方法および装置として実用性が高い。
【発明を実施するための最良の形態】
【0031】
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
【実施例】
【0032】
図1は、本発明の実施例に係る適応階層ツリー構造の概念図である。上位の3次元ブロックH1は画像信号の列を4×4×4画素の立方体にブロック化したものであり、3個の任意形状のサブブロックI1〜I3に分割される。サブブロックI1およびI2は、2×2×2画素からなる単位立方体であり、サブブロックI3は、6個の前記単位立方体が連結されたものである。さらに、サブブロックI2は3個のマイクロブロックJ1〜J3に分割されている。マイクロブロックJ1およびJ3はそれぞれ2個の画素から構成され、マイクロブロックJ2は4個の画素から構成されている。そして、サブブロックI1に含まれる画素の画素レベルは全て同一と見なされる。同様にサブブロックI3およびマイクロブロックJ1、J2、J3にそれぞれ含まれる画素の画素レベルは全て同一と見なされる。
【0033】
このように、前記適応階層ツリー構造においては、上位の3次元ブロックは、そこに含まれる画素の画素レベルが全て同一と見なされるまで、分割を繰り返して、何個かの任意の形状の下位の3次元ブロックに分割される。この下位の3次元ブロックの構造データと前記下位の3次元ブロックに含まれる画素の画素レベルを量子化したデータを組み合わせることによって、画像データは圧縮される。
【0034】
これから、前記適応階層ツリーを作成するために、8個(=2×2×2)のサブブロックから構成される立方体ブロックを、任意形状の下位のブロックに分割する手順を説明する。
【0035】
図2および図3は、立方体ブロックの分割手順を説明する図である。図2に示すように、立方体ブロックNは8個のサブブロックP(1)〜P(8)から構成されている。ここで、サブブロックP(1)〜P(8)の互いの関係を表示する12本のリンクL12〜L78を仮想する。
【0036】
リンクL12、L34、L56およびL78は、それぞれリンクP(1)とP(2)とP(3)とP(4)、P(5)とP(6)およびP(7)とP(8)を結ぶリンクであり、横方向リンクと呼ぶことにする。
【0037】
リンクL13、L24、L57およびL68は、それぞれリンクP(1)とP(3)とP(2)とP(4)、P(5)とP(7)およびP(6)とP(8)を結ぶリンクであり、縦方向リンクと呼ぶことにする。
【0038】
リンクL15、L26、L37およびL48は、それぞれリンクP(1)とP(5)とP(2)とP(6)、P(3)とP(7)およびP(4)とP(8)を結ぶリンクであり、奥行き方向リンクと呼ぶことにする。
【0039】
さて、図3(a)に示すように8個のサブブロックP(1)〜P(8)の画素レベルが大きく異なる場合は、隣接するサブブロックP(1)〜P(8)のどれを組み合わせても同一と見なせるものはないから、すべてのリンクL12〜L78は「無効」(図では点線で表示している)状態にあると考える。また、サブブロックP(1)とサブブロックP(5)に含まれる画素の画素レベルが同一と見なされ、他のサブブロックのレベルが異なる場合は、図3(b)に示すように、リンクL15が「有効」(図では太実線で表示している)状態にあると考え、サブブロックP(1)とサブブロックP(5)を併合して、1つのブロックとして取り扱い、他の6個のサブブロックはそれぞれを独立したブロックとして取り扱う。また、全てのサブブロックP(1)〜P(8)のレベルが同一と見なせる場合は、図3(c)に示すように、すべてのリンクL12〜L78が「有効」状態にあると考え、8個のサブブロックP(1)〜P(8)を全て併合して、1つのブロックとして取り扱う。
【0040】
このように、8個のサブブロックP(1)〜P(8)の中から併合可能な組み合わせ、すなわち、そこに含まれる全ての画素の画素レベルが同一とみなせるようなサブブロックP(1)〜P(8)の組み合わせを選び出して、サブブロックの塊を作成する問題は、12個のリンクL12〜L78のそれぞれについて、「有効」または「無効」を決定する問題に帰着できる。なお、8個のサブブロックP(1)〜P(8)の併合のパターンは、2の12乗通り、すなわち4096通りあることになるが、後述する「併合補正」の処理によって、不合理な組み合わせを排除すると、本発明の方法で選択可能な組み合わせは984通りになる。
【0041】
そこで、12個のリンクL12〜L78のそれぞれについて、「有効」または「無効」を決定する手順を、図4〜図8を参照しながら説明する。
【0042】
図4は、8個のサブブロックP(1)〜P(8)の併合の可否を決定する概略手順を説明する図である。この概略手順は、横方向リンクの有効・無効を検討して横方向に並ぶサブブロック同士の併合の可能性を判断する第1ステップ、縦方向リンクの有効・無効を検討して縦方向に並ぶサブブロック同士の併合の可能性を判断する第2ステップ、前記第1ステップで判断した横方向のサブブロックの併合と前記第2ステップで判断した縦方向の併合の間に不合理が生じた場合に前記縦方向の併合の判断を取り消す第3ステップ、奥行き方向リンクの有効・無効を検討して奥行き方向に並ぶサブブロック同士の併合の可能性を判断する第4ステップ、および前記第1ステップないし前記第3ステップで判断したサブブロックの横方向および縦方向の併合と前記第4ステップで判断したサブブロックの奥行き方向の併合の間に不合理が生じた場合に前記奥行き方向の併合の判断を取り消す第5ステップに大きく分けられる。以下、第1ステップから順を追って、12個のリンクL12〜L78の「有効/「無効」を決定する手順を説明する。
【0043】
(第1ステップ)
符号化の対象となる画像信号の列はビデオメモリ1に記憶されている。このビデオメモリ1から画像信号の列を逐次読み出して、前記画像信号の列をサブブロックP(1)〜P(8)からなる3次元ブロックにして、パイプラインレジスタ2に記憶する。次に、サブブロックP(1)〜P(8)に属する画素の画素レベルをパイプラインレジスタ2から読み出し、領域併合判断モジュール31〜34に入力する。領域併合判断モジュール31はサブブロックP(1)に属する画素の画素レベルとサブブロックP(2)に属する画素の画素レベルを比較してサブブロックP(1)とサブブロックP(2)の併合の可否を判断するモジュールである。同様に、領域併合判断モジュール32はサブブロックP(3)とサブブロックP(4)の、領域併合判断モジュール33はサブブロックP(5)とサブブロックP(6)の、領域併合判断モジュール34はサブブロックP(7)とサブブロックP(8)の併合の可否をそれぞれ判断するモジュールである。
【0044】
(領域併合判断モジュール)
図5は、領域併合判断モジュールの入出力を模式化した図である。なお、領域併合判断モジュール31〜34および後述する領域併合判断モジュール51〜54、領域併合判断モジュール81〜84の処理は全く同一である。
【0045】
領域併合判断モジュールの入力は、Iamax,Iamin,Ibmax,IbminおよびThの5種である。ここで、添え字a,bは併合判断の対象となるサブブロックP(1)〜P(8)の番号を示している。すなわち、Iamax,Iaminは領域併合判断の対象となる一方の領域(サブブロックP(a))に属する画素の画素レベルの最大値と最小値であり、Ibmax,Ibminは他方の領域(サブブロックP(b))に属する画素の画素レベルの最大値と最小値である。また、Thは画素レベルを同一と見なすか否か(つまり、領域併合の可否)を判断するための閾値である。
【0046】
領域併合判断モジュール21の出力は、Oamax,Oamin,Obmax,ObminおよびLinkの5種である。Oamax,Oaminは前記一方の領域(サブブロックP(a))に属する画素の画素レベルの代表値であり、Obmax,Obminは前記他方の領域(サブブロックP(b))に属する画素の画素レベルの代表値である。Linkは領域併合の可否を表示するためのフラグである。
【0047】
領域併合が成されない場合は、代表値Oamax,Oamin,Obmax,Obminはそれぞれ最大値、最小値Iamax,Iamin,Ibmax,Ibminに等しい。
【0048】
領域併合が成される場合は、OamaxおよびObmaxは、前記一方の領域(サブブロックP(a))または前記他方の領域(サブブロックP(b))に属する画素の画素レベルの最大値(つまり、IamaxまたはIbmaxのいずれか大きい方の値)に等しくなり、OaminおよびObminは前記一方の領域(サブブロックP(a))または前記他方の領域(サブブロックP(b))に属する画素の画素レベルの最小値(つまり、IaminまたはIbminのいずれか小さい方の値)に等しくなる。領域併合が成される場合は前記一方の領域(サブブロックP(a))および前記他方の領域(サブブロックP(b))に属する画素の画素レベルが同一であると見なされるから、画素レベルの代表値も統一されるのである。
【0049】
次に、領域併合の可否の判断の手順と、代表値Oamax,Oamin,Obmax,Obminを決定する手順を詳述する。
【0050】
まず、下記の(数2)に示すように、IamaxとIbmaxの値を比較していずれか大きい値をImaxとする。つまりImaxはサブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルの最大値である。
【0051】
Imax=max(Iamax,Ibmax) (数2)
【0052】
つぎに、(数3)に示すように、IaminとIbminの値を比較していずれか小さい値をIminとする。つまりIminはサブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルの最小値である。
【0053】
Imin=min(Iamin,Ibmin) (数3)
【0054】
さらに、(数4)に示すように、ImaxとIminの差D、すなわち、サブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルの変動幅(ダイナミックレンジ)を求める。
【0055】
D=Imax−Imin (数4)
【0056】
次に、変動幅Dと閾値Thを比較する。変動幅Dが閾値Thより小さければ、サブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルは同一と見なせるから、「併合は可」と判断され、リンクLabは「有効」とされる。この時、フラグLinkに「1」を立てる。逆に変動幅Dが閾値Thresholdと等しいか、より大きければ、サブブロックP(a)とサブブロックP(b)を併合した領域に属する画素の画素レベルは同一と見なせないから、「併合は不可」と判断され、リンクLabは「無効」とされる。この時、フラグLinkに「0」を立てる。
【0057】
以後の説明では、リンクLabのフラグLinkの値を単にLabと表記することにする。つまり、Lab=1ならば、リンクLabは「有効」であり、サブブロックP(a)とサブブロックP(b)の「併合は可」とされていることを意味し、Lab=0ならば、リンクLabは「無効」であり、サブブロックP(a)とサブブロックP(b)の「併合は不可」とされていることを意味する。
【0058】
最後に、Oamax,Oamin,Obmax,Obminに(表1)に示す値を代入する。つまり、Lab=0の時は、サブブロックP(a)とサブブロックP(b)の併合は不可だから、Oamax,Oamin,Obmax,Obminの値は元のままであり、Iamax,Iamin,Ibmax,Ibminがそれぞれ代入される。Lab=1の時は、サブブロックP(a)とサブブロックP(b)の併合は可だから、OamaxとObmaxはImaxに統一され、OaminとOaminはIminに統一される。これらの値を出力して、領域併合判断モジュールの処理は終わる。
【0059】
【表1】
【0060】
同様に、領域併合判断モジュール32〜34もそれぞれの判断対象のサブブロックに対して、同様の処理を行う。なお、領域併合判断モジュール31〜34の処理は互いに独立しているから、パラレルに処理することも出来るが、シリアルに処理しても良い。また、領域併合判断モジュール31〜34の出力はパイプラインレジスタ4に記憶される。
【0061】
(第2ステップ)
パイプラインレジスタ4から前記第1ステップの処理後のサブブロックP(1)〜P(8)の画素レベルの最大値I1max〜I8maxおよび最小値I1min〜I8minを読み出して、領域併合判断モジュール51〜54に入力する。領域併合判断モジュール51はサブブロックP(1)とサブブロックP(3)の併合の可否を判断するモジュールである。同様に、領域併合判断モジュール52はサブブロックP(2)とサブブロックP(4)の、領域併合判断モジュール53はサブブロックP(5)とサブブロックP(7)の、領域併合判断モジュール54はサブブロックP(6)とサブブロックP(8)の併合の可否をそれぞれ判断するモジュールである。
【0062】
領域併合判断モジュール51〜54では、前述の領域併合判断モジュール31〜34と同様の処理が行われ、サブブロックP(1)〜P(8)の縦方向の併合の可否が判断される。領域併合判断モジュール41〜44の処理も互いに独立しているから、パラレルに処理することも出来るが、シリアルに処理しても良い。
【0063】
(第3ステップ)
前記第2ステップの処理結果は、4併合補正モジュール61、62に入力されて処理される。4併合補正モジュール61はサブブロックP(1)〜P(4)の横方向併合と縦方向併合の不合理を補正するモジュールであり、4併合補正モジュール62はサブブロックP(5)〜P(8)の横方向併合と縦方向併合の不合理を補正するモジュールである。
【0064】
4併合補正モジュール61、62の処理内容を説明する前に、「併合補正」の概念を説明する。
【0065】
図6は、「併合補正」の概念を説明する図である。まず、サブブロックP(1)〜P(4)が与えられて(図6(a))、横方向併合を検討した結果、サブブロックP(1)とP(2)は併合可(リンクL12は「有効」)であるが、サブブロックP(3)とP(4)は併合不可(リンクL34は「無効」)となった(図6(b))。次に縦方向併合を検討すると、サブブロックP(1)とP(3)は併合可(リンクL13は「有効」)であり、サブブロックP(2)とP(4)も併合可(リンクL24は「有効」)となった(図6(c))。このように、四辺形を構成する4つのリンクのうち3つのリンクが「有効」となる場合がある。
【0066】
この場合、サブブロックP(1)とP(2)が併合されるとともに、サブブロックP(1)とP(3)、サブブロックP(2)とP(4)が併合されるので、結局、サブブロックP(1)〜P(4)が全て併合され1つのブロックとして取り扱われることになる。前述したように、サブブロックP(3)とP(4)を直接比較すると、画素レベルの差が大きいので併合不可とされるにも関わらず、併合を繰り返した結果、同一の画素レベルに統一されてしまう訳である。このような不合理を放置すると、本来、その画面に存在する画素レベルの高低が消されてしまうので、画質が低下する場合がある。
【0067】
そこで、4個のサブブロックを結ぶ4本のリンクの内、3本が「有効」で1本が「無効」とされた時に、「有効」とされた前記3本のリンクのいずれか1本を「無効」として、そのリンクで結合されるサブブロックの併合を行わないことにした。この処理を本明細書では「併合補正」と呼ぶことにする。
【0068】
さて、3本のリンクの中から「無効」にする1本を選ぶ方法は各種考えられる。例えば、3本のリンクの変動幅(ダイナミックレンジ)を比較して、変動幅の一番大きいリンクを「無効」にするようにすれば、画素レベルの変化をより忠実に再現できる。しかし、本実施例では計算の簡易化のために、リンクの添え字の番号の古いものを「無効」にすることにしたので、リンクL24を「無効」にした(図6(d))。
【0069】
(4併合補正モジュール)
図7は、4併合補正モジュール61、62の入出力を模式化した図である。なお、4併合補正モジュール61および4併合補正モジュール62の処理は全く同一である。
【0070】
4併合補正モジュール61,62の入力は、Iamax,Iamin,Jamax,Jamin,Ibmax,Ibmin,Jbmax,Jbmin,Icmax,Icmin,Jcmax,Jcmin,Idmax,Idmin,Jdmax,Jdmin,およびLab,Lcd,Lac,Lbdの20種である。添え字a,b,c,dは4併合補正の対象であるサブブロックP(1)〜P(8)の番号を示している。Iamax,IaminはサブブロックP(a)に属する画素の画素レベルの代表値であって、第2ステップ終了後つまり縦方向の領域併合判断モジュール51〜54の処理後の値である。また、Jamax,JaminはサブブロックP(a)に属する画素の画素レベルの代表値であって、第1ステップ終了後つまり横方向の領域併合判断モジュール31〜34の処理後の値である。同様に、Ibmax〜IdminはサブブロックP(b)〜P(d)に属する画素の画素レベルの代表値であって、第2ステップ終了後の値である。また、Jbmax,JdminはサブブロックP(b)〜P(d)に属する画素の画素レベルの代表値であって、第1ステップ終了後の値である。
【0071】
4併合補正モジュールの61,62の出力は、Oamax,Oamin,Obmax,Obmin,Ocmax,Ocmin,Odmax,OdminおよびL’ac,L’bdの10種である。添え字a,b,c,dは4併合補正の対象であるサブブロックP(1)〜P(8)の番号を示している。Oamax〜OdminはサブブロックP(b)〜P(d)に属する画素の画素レベルの代表値である。また、L’ac,L’bdはサブブロックP(a),P(c)間およびP(b),P(d)間の併合の可否を表示するフラグLinkである。
【0072】
図8は、4併合補正の規則を説明する図である。4併合補正モジュール61、62にフラグLab,Lcd,Lac,Lbdが入力されると、この規則にしたがって、縦方向リンクのフラグLacおよびLbdの値は、L’ac,L’bdに変更される。
【0073】
図8に示すように、サブブロックP(a)〜P(b)について4併合補正が必要となる場合は下記のパターン1〜4の4通りの場合がある。
(パターン1)
横方向リンクLabが「無効」、横方向リンクLcd、縦方向リンクLacおよび縦方向リンクLbdが「有効」(Lab=0、Lcd=Lac=Lbd=1)の場合は、縦方向リンクLacをそのまま(L’ac=1)にして、縦方向リンクLbdを補正して「無効」(L’bd=0)にする。
(パターン2)
横方向リンクLabが「有効」で、横方向リンクLcdが「無効」、縦方向リンクLacおよび縦方向リンクLbdが「有効」(Lab=1、Lcd=0、Lac=Lbd=1)の場合は、縦方向リンクLacをそのまま(L’ac=1)にして、縦方向リンクLbdを補正して「無効」(L’bd=0)にする。
(パターン3)
横方向リンクLab、Lcdが「有効」で、縦方向リンクLacが「無効」、縦方向リンクLbdが「有効」(Lab=Lcd=1、Lac=0、Lbd=1)の場合は、縦方向リンクLacをそのまま(L’ac=0)にして、縦方向リンクLbdを補正して「無効」(L’bd=0)にする。
(パターン4)
横方向リンクLab、横方向リンクLcdおよび縦方向リンクLacが「有効」で、縦方向リンクLbdが「無効」(Lab=Lcd=Lac=1、Lbd=0)の場合は、縦方向リンクLacを補正(L’ac=0)して、縦方向リンクLbdをそのまま(L’bd=0)にする。
以上のパターン1〜4に当てはまらない場合は、補正は行わない。つまり、縦方向リンクLacおよび縦方向リンクLbdともにそのまま(L’ac=Lac、L’bd=Lbd)にする。
【0074】
以上説明した補正の規則を纏めると、表2のようになる。
【0075】
【表2】
【0076】
縦方向リンクLacおよび縦方向リンクLbdの補正が終わったら、各サブブロックP(a)〜P(d)に属する画素の画素レベルの代表値Oamax,Oamin,Obmax,Obminbmin,Ocmax,Ocmin,Odmax,Odminを、表3および表4に示す規則に従って決定する。
【0077】
【表3】
【0078】
【表4】
【0079】
以下に、表3,表4の規則を簡単に説明する。
CASE1:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンク、縦方向リンクの両方が「無効」だから、サブブロックP(a)、サブブロックP(b)に属する画素の画素レベルの代表値は、サブブロックP(a)およびサブブロックP(b)についての横方向の領域併合判断後の値が採用される
【0080】
CASE2:サブブロックP(a)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には横方向についての領域併合判断後の値が採用される。サブブロックP(b)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0081】
CASE3:サブブロックP(a)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合判断後の値が採用される。サブブロックP(b)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には横方向についての領域併合判断後の値が採用される。
【0082】
CASE4:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、サブブロックP(a)およびサブブロックP(b)の画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合判断後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0083】
CASE5:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンクが「有効」であり、縦方向リンクが「無効」だから、画素レベルの代表値にはサブブロックP(a)およびサブブロックP(b)についての横方向の領域併合判断後の値が採用される。
【0084】
CASE6:サブブロックP(a)については、横方向リンクが「有効」、縦方向リンクが「無効」であり、サブブロックP(b)については、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(a)、サブブロックP(b)およびサブブロック(d)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(a)およびサブブロックP(b)の代表値はサブブロックP(b)とサブブロックP(d)についての縦方向の領域併合判断後の代表値が採用される。
【0085】
CASE7:サブブロックP(a)については、横方向リンクおよび縦方向リンクが「有効」であり、サブブロックP(b)については、横方向リンクが「有効」、縦方向リンクが「無効」だから、サブブロックP(a)、サブブロックP(b)およびサブブロック(c)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(a)およびサブブロックP(b)の代表値はサブブロックP(a)とサブブロックP(c)についての縦方向の領域併合判断後の代表値が採用される。
【0086】
CASE8:サブブロックP(a)、サブブロックP(b)のいずれについても、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(a)およびサブブロックP(b)の画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)ついての縦方向の領域併合後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0087】
CASE9:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンク、縦方向リンクの両方が「無効」だから、サブブロックP(c)、サブブロックP(d)に属する画素の画素レベルの代表値は、サブブロックP(c)およびサブブロックP(d)についての横方向の領域併合判断後の値が採用される。
【0088】
CASE10:サブブロックP(c)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には。サブブロックP(c)およびサブブロックP(d)についての横方向の領域併合判断後の値が採用される。サブブロックP(d)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0089】
CASE11:サブブロックP(c)については、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、画素レベルの代表値にはサブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合判断後の値が採用される。サブブロックP(d)については、横方向リンク、縦方向リンクの両方が「無効」だから、画素レベルの代表値には、サブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0090】
CASE12:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンクが「無効」であり、縦方向リンクが「有効」だから、サブブロックP(c)およびサブブロックP(d)の画素レベルの代表値には、サブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0091】
CASE13:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンクが「有効」であり、縦方向リンクが「無効」だから、画素レベルの代表値には、サブブロックP(c)およびサブブロックP(d)についての横方向の領域併合判断後の値が採用される。
【0092】
CASE14:サブブロックP(c)については、横方向リンクが「有効」、縦方向リンクが「無効」であり、サブブロックP(d)については、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(c)、サブブロックP(d)およびサブブロック(b)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(c)およびサブブロックP(d)の代表値はサブブロックP(b)とサブブロックP(d)についての縦方向の領域併合判断後の代表値が採用される。
【0093】
CASE15:サブブロックP(c)については、横方向リンクおよび縦方向リンクが「有効」であり、サブブロックP(d)については、横方向リンクが「有効」、縦方向リンクが「無効」だから、サブブロックP(c)、サブブロックP(d)およびサブブロック(a)がリンクで結合され、画素レベルが同一と見なされていることになる。したがって、サブブロックP(c)およびサブブロックP(d)の代表値はサブブロックP(a)とサブブロックP(c)についての縦方向の領域併合判断後の代表値が採用される。
【0094】
CASE16:サブブロックP(c)、サブブロックP(d)のいずれについても、横方向リンクおよび縦方向リンクが「有効」だから、サブブロックP(c)およびサブブロックP(d)の画素レベルの代表値には、サブブロックP(a)およびサブブロックP(c)についての縦方向の領域併合後、およびサブブロックP(b)およびサブブロックP(d)についての縦方向の領域併合判断後の値が採用される。
【0095】
4併合補正モジュール61および62の処理結果を、パイプラインレジスタ7に書き込んで、第3ステップは終了する。なお、4併合補正モジュール61および62は互いに独立しているから、パラレルに処理しても、シリアルに処理してもよい。
【0096】
(第4ステップ)
第4ステップでは奥行き方向リンクについて、領域併合判断を行うため、パイプラインレジスタ7から第3ステップの処理結果を読み出して、領域併合判断モジュール81〜84に入力する。領域併合判断モジュール81はサブブロックP(1)とサブブロックP(5)の併合の可否を判断するモジュールである。また、領域併合判断モジュール82はサブブロックP(3)とサブブロックP(7)の、領域併合判断モジュール83はサブブロックP(2)とサブブロックP(6)の、領域併合判断モジュール84はサブブロックP(4)とサブブロックP(8)の併合の可否をそれぞれ判断するモジュールである。
【0097】
領域併合判断モジュール81〜84では、領域併合判断モジュール31〜34および領域併合判断モジュール51〜54と同様に、各サブブロックP(1)〜P(8)に含まれる画素の画素レベルを比較して、併合の可否を判断する。
【0098】
なお、領域併合判断モジュール81〜84は互いに独立しているので、パラレル処理、シリアル処理のいずれでもよい。
【0099】
(第5ステップ)
前記第4ステップの処理結果は、8併合補正モジュール91に入力されて処理される。8併合補正モジュール91はサブブロックP(1)〜P(8)の横方向併合と奥行き縦方向併合の不合理および横方向併合と奥行き縦方向併合の不合理を補正するモジュールである。8併合補正モジュール91は4併合補正モジュール61,62と同様に、4個のサブブロックを結ぶ4本のリンクの内、3本が「有効」で1本が「無効」とされた時に、「有効」とされた前記3本のリンクのいずれか1本を「無効」にする処理を行うモジュールであり、次の6組のサブブロックの組、(P(1)、P(2)、P(5)、P(6))、(P(1)、P(3)、P(5)、P(7))、((P(2)、P(4)、P(6)、P(8))、(P(3)、P(4)、P(7)、P(8))、(P(1)、P(4)、P(5)、P(8))および(P(2)、P(3)、P(6)、P(7))について、奥行き方向のリンクの補正を検討し、その結果を重ね合わせて、前記奥行き方向のリンクの「有効/無効」を決定する。以下に、この補正の手順を詳述する。
【0100】
サブブロックの組、(P(1)、P(2)、P(5)、P(6))については、リンクL12,L56,L15,L26の「有効/無効」を表示するフラグL12,L56,L15,L26の組み合わせを表5に示す規則に当てはめて、L(1)15,L(1)26の値を求める。
【0101】
【表5】
【0102】
サブブロックの組、(P(1)、P(3)、P(5)、P(7))については、フラグL13,L57,L15,L37の組み合わせを表6に示す規則に当てはめて、L(2)15,L(1)37の値を求める。
【0103】
【表6】
【0104】
サブブロックの組、(P(2)、P(4)、P(6)、P(8))については、フラグL24,L68,L26,L48の組み合わせを表7に示す規則に当てはめて、L(2)26,L(1)48の値を求める。
【0105】
【表7】
【0106】
サブブロックの組、(P(3)、P(4)、P(7)、P(8))については、フラグL34,L78,L37,L48の組み合わせを表8に示す規則に当てはめて、L(2)37,L(2)48の値を求める。
【0107】
【表8】
【0108】
サブブロックの組、(P(1)、P(4)、P(5)、P(8))については、フラグL14,L58,L15,L48の組み合わせを表9に示す規則に当てはめて、L(3)15,L(3)48の値を求める。
【0109】
【表9】
【0110】
なお、フラグL14およびL58は、サブブロックP(1)とP(4)およびP(5)とP(8)の併合の有無を表示するフラグであり、(数5)で与えられる。
【0111】
L14=(L12andL24)or(L13andL34)
L58=(L56andL68)or(L57andL78) (数5)
【0112】
サブブロックの組、(P(2)、P(3)、P(6)、P(7))については、フラグL23,L67,L26,L37の組み合わせを表9に示す規則に当てはめて、フラグL26,L37の値をL(3)26,L(3)37に変更する。
【0113】
【表9】
【0114】
なお、フラグL23およびL67は、サブブロックP(2)とP(3)およびP(6)とP(7)の併合の有無を表示するフラグであり、下記の(数6)で与えられる。
【0115】
L23=(L12andL13)or(L24andL34)
L67=(L56andL57)or(L68andL78) (数6)
【0116】
これで、サブブロックP(1)〜P(8)の6通りの組み合わせについてのフラグL15、L26、L37、L48の補正値L(1)15〜L(3)48が得られた。あるリンクについて、前記6通りの組み合わせの少なくとも1つで補正する必要があれば、そのリンクを補正する必要があるので、(数7)に示すように補正値L(1)15〜L(3)48の論理積をL’15、L’26、L’37、L’48とし、フラグL15、L26、L37、L48をこれらと置き換える。
【0117】
L’15=L(1)15andL(2)15andL(3)15
L’26=L(1)26andL(2)26andL(3)26
L’37=L(1)37andL(2)37andL(3)37
L’48=L(1)48andL(2)48andL(3)48 (数7)
【0118】
以上の演算結果をパイプラインレジスタ10に書き込んで、第5ステップは終了する。
【0119】
以上、第1ステップから第5ステップの処理を行うことで、12本のリンクL12〜L78の「有効/無効」が決定される。8個のサブブロックからなるブロックは、幾つかの「有効」なリンクで結合されたサブブロックの「塊」に分割される。また、サブブロックに含まれる画素の画素レベルは同一と見なせない場合は、そのサブブロックについて、第1ステップから第5ステップの処理を行って、「そこに含まれる全ての画素の画素レベルが同一と見なせる」マイクロブロックの「塊」に分割する。これを繰り返して、立体ブロックN全体を、「そこに含まれる全ての画素の画素レベルが同一と見なせる塊」に分割する。そして、この「塊」に含まれる画素の画素レベルを量子化して、量子化した画素データと「塊」の構造データを組にして、ハフマン符号の手法によって可変長符号に変換する。
【0120】
以上、本発明の実施例を、画像信号の符号化方法として説明してきたが、本発明の方法を実施する装置は、コンピュータに本発明の方法をプログラムの形で組み込むことにより簡単に構成できる。また、図4に示したような各モジュールに機能を分割して専用のハードウェアを用意すれば、演算をさらに高速化することができる。
【0121】
最後に、本発明の符号化方法の性能を従来の方法と比較して示す。なお、すべての比較は、ビデオフレームの輝度成分(Y)について行っているが、圧縮率については、輝度成分(Y)と2つの色差成分(Cr、Cb)を含んでいる。また、客観的比較を行うために、本発明の方法と八分木法については、同一の量子化のステップを使用した。量子化段階のハフマン符号とツリー構造情報は各符号化手法のそれぞれについて作成した。
【0122】
図9に、原画像と本発明の方法によって符号化した画像データによる画像、および従来の方法による画像を示す。図9(a)は、原画像であり、図9(b)は、MPEG4 TM5による画像、図9(c)は、本発明の方法による画像、図9(d)は、八分木法による画像である、比較のために、圧縮率は同レベルに揃えている。図から解るように、本発明の方法による画像の画質は、MPEG4 TM5による画像に比べて遜色がなく、八分木法による画像に比べると遙かに優れている。
【0123】
表10は、各方法による演算数の比較を示す表である。この表から、本発明の方法の操作数はMPEG4の約6分の1であり、バッテリーの負担が小さいことが解る。
【0124】
【表10】
【0125】
表11は、各方法による符号化に要する時間を示している。本発明の符号化手法および八分木法による符号化時間は、MPEG4の10分の1以下である。なお、ここに示した時間は、ペンティアム4(登録商標) 2.4GHzパーソナルコンピュータ上で動作させた場合であり、OSはウィンドウズXP(登録商標)である。
【0126】
【表11】
【0127】
図10は、各方法について、圧縮率と画質の関係を表示するグラフであり、画質はピーク信号−ノイズ比(PSNR)で表示している。図中で「ADAPTIVE」と表示した太い実線が本発明の実験結果を示し、「MPEG4」と表示した細い実線はMPEG4 TM5による実験結果を、「OCTREE」と表示した破線は八分木法による実験結果をそれぞれ示している。圧縮率0.5bit/pelにおいて、本発明の符号化手法のPSNRはMPEG4に対して約0.6dB小さいが、八分木法に対しては約1.2dB優れている。
【0128】
図11は、各方法について、圧縮率0.5bit/pelの条件の下で各フレームの画質を表示するグラフである。図中で「ADAPTIVE」と表示した太い実線が本発明の実験結果を示し、「MPEG4」と表示した細い実線はMPEG4 TM5による実験結果を、「OCTREE」と表示した破線は八分木法による実験結果をそれぞれ示している。PSNRの傾向は図10と同様に、MPEG4、本発明の方法、八分木法の順だが、PSNRの分布は本発明の方法が3者の中で最も狭い。
【0129】
なお、本実施例では、3次元ブロック化された画像信号をサブブロックに分割するとともに、サブブロックを連結する仮想的な「リンク」という概念を導入して、「リンク」で連結されたサブブロックを、そこに含まれるすべての画素の画素レベルを同一と見なし得る画像信号の塊として取り扱うことにより、画像信号を符号化圧縮する方法および装置を示したが、本発明は「リンク」を用いるものに限られるものではない。3次元ブロック化された画像信号をそこに含まれるすべての画素の画素レベルを同一と見なし得る任意形状のサブブロックの塊に分割する画像信号の符号化方法は、本発明の技術的範囲に含まれる。
【図面の簡単な説明】
【0130】
【図1】本発明の実施例に係る適応階層ツリー構造の概念図である。
【図2】立方体ブロックの分割手順を説明する図である。
【図3】立方体ブロックの分割手順を説明する図である。
【図4】8個のサブブロックの併合の可否を決定する概略手順を説明する図である。
【図5】領域併合判断モジュールの入出力を模式化した図である。
【図6】併合補正の概念を説明する図である。
【図7】4併合補正モジュールの入出力を模式化した図である。
【図8】4併合補正の規則を説明する図である。
【図9】原画像、本発明の方法による画像、および従来の方法による画像の例である。
【図10】圧縮率と画質の関係を表示するグラフである。
【図11】各フレームの画質を表示するグラフである。
【図12】八分木法による階層ツリー構造の概念図である。
【符号の説明】
【0131】
1 ビデオメモリ
2 パイプラインレジスタ
31〜34 領域併合判断モジュール
4 パイプラインレジスタ
51〜54 領域併合判断モジュール
61,62 4併合補正モジュール
7 パイプラインレジスタ
81〜84 領域併合判断モジュール
91 8併合補正モジュール
10 パイプラインレジスタ
【特許請求の範囲】
【請求項1】
画像信号の列を3次元ブロック化して、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割して、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する画像信号の符号化方法において、
前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを集めて、前記塊とすることを特徴とする画像信号の符号化方法。
【請求項2】
前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする請求項1に記載の画像信号の符号化方法。
【請求項3】
そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割して、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする請求項2に記載の画像信号の符号化方法。
【請求項4】
四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正することを特徴とする請求項2または請求項3に記載の画像信号の符号化方法。
【請求項5】
前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする請求項2ないし請求項4の何れか1項に記載の画像信号の符号化方法。
【請求項6】
前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする請求項1ないし請求項5の何れか1項に記載の画像信号の符号化方法。
【請求項7】
画像信号の列を3次元ブロック化する手段と、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割する手段と、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する手段を備えた画像信号の符号化装置において、
前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを集めて、前記塊とする手段を備えたことを特徴とする画像信号の符号化装置。
【請求項8】
前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする画像データの符号装置。
【請求項9】
そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割する手段と、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする請求項8に記載の画像信号の符号化装置。
【請求項10】
四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正する手段を有することを特徴とする請求項8または請求項9に記載の画像信号の符号化装置。
【請求項11】
前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする請求項8ないし請求項10の何れか1項に記載の画像信号の符号化装置。
【請求項12】
前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする請求項7ないし請求項11の何れか1項に記載の画像信号の符号化装置。
【請求項1】
画像信号の列を3次元ブロック化して、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割して、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する画像信号の符号化方法において、
前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを集めて、前記塊とすることを特徴とする画像信号の符号化方法。
【請求項2】
前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする請求項1に記載の画像信号の符号化方法。
【請求項3】
そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割して、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とし、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする請求項2に記載の画像信号の符号化方法。
【請求項4】
四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正することを特徴とする請求項2または請求項3に記載の画像信号の符号化方法。
【請求項5】
前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする請求項2ないし請求項4の何れか1項に記載の画像信号の符号化方法。
【請求項6】
前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする請求項1ないし請求項5の何れか1項に記載の画像信号の符号化方法。
【請求項7】
画像信号の列を3次元ブロック化する手段と、前記3次元ブロックをそこに含まれる全ての画素の画素レベルが同一と見なされる塊に分割する手段と、前記塊の構造データと前記塊に含まれる画素の画素レベルを量子化したデータを組にして記述する手段を備えた画像信号の符号化装置において、
前記3次元ブロックを複数のサブブロックに分割して、そこに含まれる全ての画素の画素レベルが同一と見なされる前記サブブロックを集めて、前記塊とする手段を備えたことを特徴とする画像信号の符号化装置。
【請求項8】
前記複数のサブブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記サブブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記サブブロックを前記塊とすることを特徴とする画像データの符号装置。
【請求項9】
そこに含まれる全ての画素の画素レベルが同一と見なされない前記サブブロックを、複数のマイクロブロックに分割する手段と、前記複数のマイクロブロックを相互に連結するリンクを仮想して、前記リンクで連結される2個の前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされる時には前記リンクを「有効」とし、前記マイクロブロックに含まれる全ての画素の画素レベルが同一と見なされない時には前記リンクを「無効」とする手段を備え、「有効」な前記リンクで連結された一連の前記マイクロブロックを前記塊とすることを特徴とする請求項8に記載の画像信号の符号化装置。
【請求項10】
四辺形を形成する4本の前記リンクの内3本が「有効」とされた場合に、前記3本のリンクの何れか1本を「有効」から「無効」に補正する手段を有することを特徴とする請求項8または請求項9に記載の画像信号の符号化装置。
【請求項11】
前記リンクで連結される2個の前記サブブロックに含まれる全ての画素の画素レベルの最大値と最小値の差が所定の閾値より小さい場合に、前記リンクを「有効」とすることを特徴とする請求項8ないし請求項10の何れか1項に記載の画像信号の符号化装置。
【請求項12】
前記3次元ブロックを、各軸方向に2分割して合計8個のサブブロックに分割することを特徴とする請求項7ないし請求項11の何れか1項に記載の画像信号の符号化装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2006−108792(P2006−108792A)
【公開日】平成18年4月20日(2006.4.20)
【国際特許分類】
【出願番号】特願2004−289020(P2004−289020)
【出願日】平成16年9月30日(2004.9.30)
【出願人】(391043332)財団法人福岡県産業・科学技術振興財団 (53)
【出願人】(899000068)学校法人早稲田大学 (602)
【Fターム(参考)】
【公開日】平成18年4月20日(2006.4.20)
【国際特許分類】
【出願日】平成16年9月30日(2004.9.30)
【出願人】(391043332)財団法人福岡県産業・科学技術振興財団 (53)
【出願人】(899000068)学校法人早稲田大学 (602)
【Fターム(参考)】
[ Back to top ]