二次元画像の透視変換

【課題】埋め込まれたデバイスで透視変換を行なう。
【解決手段】埋め込まれたデバイスは、目的画像選択機構と、変換機構とを含む。変換機構は、目的画像に透視変換関数を適用して、目的画像を、目的画像の前景の視点における、より大きい幅から、目的画像の消失点へ向かって、より小さい幅へ変化させ、かつ目的画像を、目的画像の前景の視点における、より大きい拡張量およびより小さい圧縮量から、目的画像の消失点へ向かって、より小さい拡張量およびより大きい圧縮量へ変化させる。

【発明の詳細な説明】
【優先権の主張】
【０００１】
本特許出願は、２００４年９月２８日に出願され、本発明の譲受人に譲渡され、本明細書において参照によって明示的に取り入れられている米国仮出願第６０／６１４，２１６号（“Perspective Transformation for Two-Dimensional Images”）に対して優先権を主張している。
【技術分野】
【０００２】
本開示の態様は、ディジタル画像の操作に関する。他の態様は、画像処理特徴をもつ移動電話に関する。
【背景技術】
【０００３】
ディジタル画像の操作とは、ディジタル画像に対して行われ得る多くの種々のタイプの修正および変換を示す。画像操作の実施の例は、透視変換、回転、拡大、ピンチング、ラッピング、エッジ検出、およびフィルタリングを含む。
【０００４】
透視縮約（perspective foreshortening）の技術は、画家が、対象物の三次元の奥行きおよび距離を二次元の面上でシミュレートするのに使用される。例えば、より近い物体をより大きい物体として、より遠い物体をより小さい物体として塗る、または描くことによって、および物体の線および角度を慎重に描画することによって、画家は、二次元空間において、三次元性の錯覚を作り出すことができる。数学用語において、透視図（perspective view）とは、三次元の空間を二次元の平面へ投影したものである。
【発明の概要】
【０００５】
開示の１つの態様は、埋め込まれたデバイス（embedded device）に関する。埋め込まれたデバイスは、目的画像選択機構と、変換機構とを含む。変換機構は、目的画像に透視変換関数を適用して、目的画像を、目的画像の前景の視点における、より大きい幅から、目的画像の消失点へ向かって、より小さい幅へ変化させ、かつ目的画像を、目的画像の前景の視点における、より大きい拡張量およびより小さい圧縮量から、目的画像の消失点へ向かって、より小さい拡張量およびより大きい圧縮量へ変化させる。
【図面の簡単な説明】
【０００６】
【図１】画像に対して変換を行うことができる例示的な埋め込まれたデバイスのブロック図。
【図２】画像の透視変換のためのマッピング機能の特性を示す画像の模式図。
【図３ａ】示されている方法を使用する変換前の元のサイズの５２０×３９０画素の画像を示す図。
【図３ｂ】示されている実施形態にしたがう方法によって、変換のための種々のパラメータを使用して、図３ａの画像を変換した画像を示す図。
【図４】画像に対して変換を行うことができる整数マイクロプロセッサを備えた例示的な埋め込まれたデバイスのブロック図。
【図５】画像に対して変換を行うことができる浮動小数点マイクロプロセッサを備えた例示的な埋め込まれたデバイスのブロック図。
【図６】変換方法の実施に関与するタスクを示す概略的なフローチャート。
【図７】ポータブルデバイスにおける変換方法の使用を示す、ディジタルカメラを備えた移動電話を示す図。
【図８ａ】消失点がカメラに近いときの、４つの異なる方向の中の１つの方向における画像の透視図を生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【図８ｂ】消失点がカメラに近いときの、４つの異なる方向の中の１つの方向における画像の透視図を生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【図８ｃ】消失点がカメラに近いときの、４つの異なる方向の中の１つの方向における画像の透視図を生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【図８ｄ】消失点がカメラに近いときの、４つの異なる方向の中の１つの方向における画像の透視図を生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【図９ａ】消失点がカメラから遠いときの、画像の異なる透視図の１つを生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【図９ｂ】消失点がカメラから遠いときの、画像の異なる透視図の１つを生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【図１０ａ】消失点が中心から外れて、カメラの近いときの、画像の異なる透視図の１つを生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【図１０ｂ】消失点が中心から外れて、カメラの近いときの、画像の異なる透視図の１つを生成するために、種々のパラメータを使用して、示されている実施形態にしたがう方法によって変換された図３ａの画像を示す図。
【発明を実施するための形態】
【０００７】
実施形態は、添付の図面を参照して記載される。これらの図面において、同じ参照符号は、図面全体において同じ要素を表わす。
【０００８】
図１は、例示的な埋め込まれたデバイス10のブロック図であり、これは、示されている実施形態において、無線移動通信デバイスを含む。示されている埋め込まれたデバイス10は、システムバス14と、システムバス14を介して埋め込まれたデバイス10の他の部分に接続され、それらによってアクセス可能であるデバイスメモリ16(示されているデバイス10内のメインメモリ)と、システムバス14に接続されたハードウェアエンティティ18とを含む。ハードウェアエンティティ18の少なくとも幾つかは、メインメモリ16へのアクセスおよびその使用に関与する動作を行う。ハードウェアエンティティ18は、マイクロプロセッサ、ＡＳＩＣ、および他のハードウェアを含み得る。
【０００９】
グラフィックスエンティティ20は、システムバス14に接続されている。グラフィックスエンティティ20は、より大きい統合システムのコアまたは一部分(例えば、システムオンチップ（system on a chip, SoC）)を含むか、グラフィックスアクセラレータ（graphics accelerator）のようなグラフィックスチップを含み得る。示されている実施形態において、グラフィックスエンティティ20は、グラフィックスパイプライン(図示されていない)、グラフィックスクロック23、緩衝器22、およびグラフィックスエンティティ20をシステムバス14に連結させるバスインターフェース19を含む。
【００１０】
緩衝器22は、グラフィックスエンティティ20による画素ごとの処理に使用されるデータを保持する。緩衝器22は、メインメモリ16内の緩衝器(図示されていない)からの、画素情報のような、画素に関係するデータの局部記憶装置を与える。
【００１１】
示されている実施形態において、グラフィックスエンティティ20は、画像の透視変換を行うことができる。その目的のために、グラフィックスエンティティ20は、表示するため、およびユーザが変換される画像を選択できるようにするための目的画像選択機構（image of interest selecting mechanism, IIS mechanism）24と、画像変換を行うための変換デバイス26とをさらに含む。図示されているように、目的画像選択機構24は、埋め込まれたデバイス10のユーザインターフェース28に連結されている。埋め込まれたデバイス10によって行われ得る画像変換は、さらに詳しく別途記載される。埋め込まれたデバイス10が操作する画像は、埋め込まれたデバイス10のメインメモリ16、埋め込まれたデバイスの緩衝器22、または埋め込まれたデバイスと相互運用可能な機械読み出し可能媒体に記憶され得る。さらに加えて、示されている実施形態では、グラフィックスエンティティ20は、変換機能を行うが、他の実施形態では、それらの機能は他のハードウェア18によって行われ得る。
【００１２】
図２は、画像50の模式図である。画像50は、示されている変換機構によって変換される。変換機構は、透視変換関数を画像50に適用する。参照番号56において、結果の一点透視画像（one-point perspective image）が、概略的に示されている。一点透視画像56は、画像50の前景の視点における、より大きい幅から、画像50の消失点58へ向かって、より小さい幅へ変化する。本明細書において使用されているように、“消失点（vanishing point）”という用語は、一点透視画像56の全ての平行線が収束する点を指す。
【００１３】
図２に示されているように、画像50は、幅（width, W）および高さ(height, H)をもつ。幅Ｗおよび高さＨは、画素の単位で表現されているが、他の測定単位が使用されてもよい。画像50の高さＨは、図２のｙ軸52に沿って伸び、画像の幅Ｗは、ｘ軸54に沿って伸びている。図示されているように、図２において、画像50の幅の座標は、０からＷ−１まで伸び、高さの座標は、０からＨ−１まで伸びている。
【００１４】
図２に示されているように、一点透視画像56は、上端の幅Ｄ、高さＨ、および下端の幅Ｗをもつ。下端の幅Ｗ、高さＨ、および上端の幅Ｄは、画素の単位で表現されているが、他の測定単位が使用されてもよい。
【００１５】
画像50は、最初に、ディジタル写真撮影、ディジタル化に続くフィルム写真撮影、非写真源からのディジタル化、きれいなディジタルのイラストレーション／レンダリングを含む多くのやり方で生成され得る。特定のタイプの画像に対する本明細書において提示されている画像変換方法の個々の実施、および特定のプラットフォームまたはコンピューティングシステムは、さらに詳しく別途記載される。
【００１６】
ほとんどの画像変換は、数式の組によって表わされる数学的変換関数の組として示されることができ、これらの式は、変換が実施される個々のプラットフォームに関係なく、画像に対して行われる演算を表わす。示されている実施形態のための透視変換関数の１つの例示的な組を示す数式は、式（１）および（２）として、次に与えられる。画像50内の各画素において、次の式が成立する。
【数１】

【００１７】
式（１）ないし（６）において、(ｘ_ｉｎ，ｙ_ｉｎ)は、入力画素の位置であり、（ｘ_ｏｕｔ，ｙ_ｏｕｔ）は、出力画素の位置であり、ｘ_{ｓｈｉｆｔ}は、一点透視画像56の上端の幅の左端点のｘ座標である。Ｗは、画像50の幅であり、これは、画像56の下端の幅でもある。Ｈは、画像50および画像56の両者の高さである。Ｄは、画像56における２本の平行エッジの短い方の長さである。消失点が画像より上にあるので、この場合は、短い方の平行エッジは、上端のエッジである。消失点が、元の画像50の左側、右側、または下側にあるとき、結果の透視画像56は、左側、右側、または下側へ向かって先細になる。このような場合は、短い方の平行エッジは、画像の左側、右側、または下側にある。
【００１８】
式（６）において、定数ａ、ｂ、ｃ、およびｄは、経験的に判断され、任意のサイズのあらゆる画像に使用されることができる。これらの定数は、一点透視画像56における透視縮約効果の量および滑らかさを決める。例えば、（ａ，ｂ，ｃ，ｄ）に対する１組の可能な値は、(０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５)である。
【００１９】
式（２）および（６）は、透視画像における拡張および圧縮量を決める。式（２）の因数ｋは、透視画像における拡張および圧縮の量およびバリエーションを制御する。式（６）によって示されているように、因数ｋは、カメラ(すなわち、視点)と、消失点58との間の距離によって決まる。したがって、因数ｋは、一点透視画像56の高さＨ、上端の幅Ｄ、および下端の幅Ｗの関数として変化する。応用において、目的画像は、目的画像の前景の視点における、より大きい拡張量およびより小さい圧縮量から、目的画像の消失点へ向かって、より小さい拡張量およびより大きい圧縮量へ変化する。
【００２０】
幅の比（Ｄ／Ｗ）は、０ないし１の間で変化し、消失点の位置によって決まる。小さい比率は、消失点がカメラに近いことを示す。大きい比率は、消失点がカメラから遠いことを示す。例えば、１に等しい幅の比は、消失点が無限遠にあることを示す。
【００２１】
ｙ座標の値は、カメラと画像内の点との間の距離を表わす。小さいｙ座標は、点がカメラに近いことを示す。その代わりに、大きいｙ座標は、点がカメラから遠いことを表わす。
【００２２】
応用において、消失点が無限遠にあるとき、式（１）ないし（６）を使用して、５２０×３９０画素の画像を透視変換すると、図３ａに示されている画像が生成され、これは、元の画像に相当する。さらに加えて、ｋ＝１、Ｗ＝５２０画素、Ｈ＝３９０画素、Ｄ＝２６０画素、およびｘ_{ｓｈｉｆｔ}＝１３０画素であるとき、式（１）ないし（６）を使用して、５２０×３９０画素の画像を透視変換すると、図３ｂに示されている画像が生成される。なお、画像の下端は、カメラに近く、画像の上端は、カメラから遠い。
【００２３】
上述の式の具体的な使用例として、図３ｂの画像を一例として使用すると、ｋ＝１、Ｄ＝２６０画素、およびｘ_{ｓｈｉｆｔ}＝１３０画素であるとき、式（２）は、次の式に約される。
【数２】

【００２４】
図３ｂに示されているように、元の画像の領域が、カメラにより近くなるほど、透視画像において、その領域はより拡張される。この透視縮約効果を得るために、ｙ座標の値を１対２でマッピングすることが望ましい。例えば、ｙ_ｉｎ＝１であり、結果が整数に丸められるとき、式（７）は、次のようになる。
【数３】

【００２５】
同様に、ｙ_ｉｎ＝２であるときは、次のようになる。
【数４】

【００２６】
結果によって示されているように、ｙ_ｉｎ＝１に対するｙ_ｏｕｔの値とｙ_ｉｎ＝２に対するｙ_ｏｕｔの値の間にはギャップがある。このギャップは、事実上、ｙ_ｏｕｔ＝２において、出力画素が生成されず、したがって、その位置における最初の出力画像には、出力画素が存在しないことを意味する。しかしながら、最初の出力画像内の空の画素の位置は、存在している画素を使用して、画素を補間および複製することによって埋められ、ｙ_ｉｎの画素値の望ましい１対２のマッピングで、最終的な出力画像を生成することができる。
【００２７】
図３ｂに示されているように、元の画像の領域が、カメラからより遠くなるほど、透視画像において、その領域はより圧縮される。この透視縮約効果を得るために、入力画素と出力画素との２対１のマッピングが望ましい。例えば、ｙ_ｉｎ＝Ｈ−３＝３８７であり、結果が整数に丸められるとき、式（７）は、次のようになる。
【数５】

【００２８】
同様に、ｙ_ｉｎ＝Ｈ−２＝３８８であるときは、次のようになる。
【数６】

【００２９】
結果によって示されているように、ｙ_ｏｕｔの値間には、差異はなく、したがって、望ましい２対１のマッピングになる。他の実施形態において、異なる度合いの透視縮約が望まれるときは、式（６）における定数ａ、ｂ、ｃ、およびｄを調節して、希望の透視効果を生むｋの種々の値を得ることができる。
【００３０】
変換方法は、整数マイクロプロセッサのような、限定された能力をもつコンピューティングシステム上で実行されるように実施され得る。幾つかの整数マイクロプロセッサは、浮動小数点(すなわち、１０進法)の数学エミュレータを含むが、エミュレータを使用することは、より時間がかかり、計算のコストが高くなり得る。変換は、整数演算を使用して実施され得る。
【００３１】
整数マイクロプロセッサ上で、式（１）ないし（６）のような変換式を実施するとき、２つの考慮すべき事柄が生じる。すなわち、整数演算のみを使用して、これらの式における冪関数を計算することと、整数のオーバーフロー(すなわち、計算される数が、マイクロプロセッサが処理できる最大整数を超える状態)を避けるように、演算を順序付けることとである。
【００３２】
図４は、整数演算を使用して、上述の変換を行う例示的な埋め込まれたデバイス60のブロック図である。埋め込まれたデバイス60は、システムバス14に接続されたメインメモリ16、インターフェース19によってシステムバス14に接続されたグラフィックスエンティティ66、およびシステムバス14に接続された整数マイクロプロセッサ61を含んでいる。埋め込まれたデバイス60は、マイクロプロセッサに接続された変換演算ファシリテータ（transformation operations facilitator）62を含んでいる。変換演算ファシリテータ62の中には、整数演算ファシリテータ(integer operations facilitator)64が含まれている。
【００３３】
変換演算ファシリテータ62は、式（６）における冪関数を計算し、マイクロプロセッサ61と互換性のあるやり方で、他の変換演算を行う。整数演算ファシリテータ64は、式（１）ないし（６）における必要な計算の全てが、整数演算を使用して、整数マイクロプロセッサ61における整数のオーバーフローを避ける計算順で行われることを保証する。(両者の構成要素62、64の機能、および行われる計算は、さらに詳しく別途記載される)。デバイス60のような埋め込まれたデバイスの長所は、浮動小数点エミュレータが使用されないことであり、これは、整数マイクロプロセッサ61上での変換をより効率的にする。変換演算ファシリテータ62および整数演算ファシリテータ64は、ハードウェアにおいて、ソフトウェアにおいて、ハードウェアとソフトウェアとのある組合せにおいて、あるいはマイクロプロセッサ61と互換性のある何か他のやり方で実施され得る。
【００３４】
示されている実施形態において、式（６）における冪関数を計算するために、関数のテイラー級数の展開が使用される。任意の冪関数において、テイラー級数の展開は、式（８）によって与えられる。
【数７】

【００３５】
任意のテイラー級数におけるように、加えられる項が、より多くなるのにしたがって、近似値は、より正確になる。しかしながら、使用されるテイラー級数の項が、より多くなるのにしたがって、処理は、計算のコストがより高くなる。さらに加えて、テイラー級数の連続する項が、最終的な結果に加える精度の量は、次第に小さくなる。したがって、冪関数を計算するのに使用されるテイラー級数の項の数は、希望の精度と、使用可能な計算能力とによって決まる。別途さらに詳しく記載される１つの実施において、テイラー級数の最初の４つの項が、極端な計算能力を要求することなく、十分な精度を与えることが分かった。ａ＝２として、テイラー級数の最初の４つの項を使用すると、式（８）は、式（９）に約される。
【数８】

【００３６】
式（９）は、厳密には整数項を含んでいないが、計算を行うために、非整数の項を整数に変換することができる。例えば、２の自然対数に２^１０を乗算し（すなわち、左に１０ビットシフトをし)、最も近い整数に丸め、７１０にすることができる。中間の算術演算は、２の自然対数に対するこの整数表現を使用して、計算され得る。中間の算術演算の全てを計算した後で、２^１０で除算する（すなわち、右に１０ビットシフトする）ことによって、最終的な結果を得ることができる。通常は、大きい整数の因数を使用し、したがって、多数の有効桁を使用して、可能な限り高い精度を保つことができる。しかしながら、より低い精度が望ましいときは、より小さい整数の因数を使用することができる。さらに加えて、浮動小数点数を整数に変換するとき、任意の大きい因数を使用することができるが、示されている実施形態では、２の冪が使用されており、比較的に遅い乗算の演算を、比較的に速いビットシフトの動作に代えることができる。
【００３７】
透視の操作のために、式（９）の４つの項のテイラー級数の近似値と、２^１６の整数変換の乗数とを使用する３２ビットの整数マイクロプロセッサのための実施コードのサンプルを次に与える。
【表１】

【００３８】
上述のコードの断片において、６５５３６は、１×２^１６であり、演算は、３２ビットのマイクロプロセッサ上での整数のオーバーフローを避けるように順序付けられている。テイラー級数の値は、中間の変数ｃ１、ｃ２、およびｃ３で記憶される。最後のシフティングの動作は、２^１６の乗数の影響を取り除く。
【００３９】
上述のコードの断片は、３２ビットの整数マイクロプロセッサに対して実時間の結果を与えることが分かっている。この記載されている実施形態は、Ｃでコード化され、３２ビットのマイクロプロセッサ上で実施されているが、他の実施形態では、Ｃ、Ｃ＋＋、Ｊａｖａ（登録商標）、およびアセンブラを含む任意のプログラミング言語でコード化され、６４ビットのマイクロプロセッサおよび１２８ビットのマイクロプロセッサを含む任意の能力をもつマイクロプロセッサ上で実施され得る。その実施では、整数のみの演算を使用する必要も、オーバーフローを避けるように順序付ける必要もない。これらの方法は、整数マイクロプロセッサ上で実施されると、ディジタルカメラを備えた移動電話またはポータブル電子デバイスにおける画像処理機能として与えられ得る。これらの方法は、ソフトウェア、ハードウェア、またはソフトウェアとハードウェアとの任意の組合せにおいて、マイクロプロセッサ、ＡＳＩＣ、またはそれらを実施するのに十分な計算能力をもつ任意の他のプラットフォーム上で実施され得ることも理解されるはずである。
【００４０】
図５は、浮動小数点演算を使用して、上述の変換を行う例示的な埋め込まれたデバイス70のブロック図である。埋め込まれたデバイス70の構成要素は、埋め込まれたデバイス60の構成要素に概ね似ており、したがって、同様の構成要素に対しては、上述の記述で十分であるだろう。埋め込まれたデバイス60とは異なり、埋め込まれたデバイス70は、浮動小数点マイクロプロセッサ72を含んでいる。埋め込まれたデバイス70は、浮動小数点マイクロプロセッサ72に連結された変換演算ファシリテータ74をさらに含んでいるが、変換演算ファシリテータ74は、整数演算ファシリテータをもっていない。埋め込まれたデバイス70では、計算は、浮動小数点数を使用して行われ、例えば、式（１）ないし（６）の項を整数へ変換するタスクを省いている。示されている変換方法の整数のみの実施は、埋め込まれたデバイス70上で行なわれるとき、正しく機能するであろうが、マイクロプロセッサ72の浮動小数点の能力を使用することが好都合である。
【００４１】
図６は、画像に透視変換を適用する方法100を示すより一般的なフローチャートである。方法100は、必要な計算を行うことができる任意のプラットフォーム上で実施され得る。
【００４２】
方法100は、動作（act）102から始まり、制御は、動作104へ進む。動作104において、ユーザは、目的の入力画像を選択する。目的画像が選択されると、方法100は、続いて動作106へ進み、動作106において、入力画像の画素が選択される。動作106の後で、方法100は、続いて動作108へ進む。動作108において、画素は、上述の演算を行うことによって変換され、出力画像の結果の出力画素が生成される。次に、制御は動作109、すなわち、入力画像内に他の画素が残っているかどうかが判断される決定タスクへ進む。画像内に他の画素が残っている（参照番号109に対してイエスである）ときは、方法100の制御は、参照番号106へ戻る。画像内に他の画素が残っていない（参照番号109に対してノーである）ときは、制御は参照番号110へ進む。動作110において、完全な透視画像を生成するのに必要なこととして、出力画像内の欠けている画素の補間または複製が行なわれ得る。(最も単純な場合において、必要な画素の複製は、最も近い隣り合う画素の複写によって行われ得る)。完全な可視画像を生成するのに必要とされる他のタスク、例えば、出力画像ファイルに対するヘッダ情報の書き込みも、動作110において行われ得る。動作110が完了すると、方法100は終了し、動作112において、戻る。
【００４３】
上述の一部において、変換される画像は、ＲＧＢ（red-green-blue）フォーマットであると仮定されており、各画像の画素は、その画素の赤の内容の値、緑の内容の値、および青の内容の値をもつ。しかしながら、示されている変換方法は、最初にＲＧＢへ変換することなく、他の画像形式に対して直接に使用できる。ＲＧＢフォーマットの画像は、比較的に変換し易いので、これは好都合であるが、圧縮するのがより難しく、一般に、より大きい記憶空間を消費する。
【００４４】
２つの他の一般的な画像フォーマットは、ＹＣｂＣｒとＹＣｒＣｂとである。ＲＧＢ画像では、各画素について、赤、緑、および青の色の値に関して、データが記憶されるが、ＹＣｂＣｒおよびＹＣｒＣｂのフォーマットでは、各画素について、ルミナンス(Ｙ)の値およびクロミナンス(Ｃｂ、Ｃｒ)の値を記録することによって、画像データを記憶する。ＹＣｂＣｒおよびＹＣｒＣｂのフォーマットは、それらが共通のＪＰＥＧの画像ファイルフォーマットにおいて使用されているので、一般的である。
【００４５】
画像変換が、ディジタルカメラのようなポータブルデバイス上で実施されるとき、ＲＧＢ、ＹＣｂＣｒ、およびＹＣｒＣｂの３つのフォーマットの全てが、ディジタルカメラにおいて使用され得るので、これらのフォーマットの画像に対して操作できることは好都合である。それは、ディジタル画像の生成および処理のやり方のためである。
【００４６】
例えば、ほとんどのディジタルカメラの画像センサは、全３色の光ではなく、赤、緑、または青の光の１つのみに対して感知可能な個々のセンサセルから構成されている。したがって、個々のセルは、一般に、バイエルパターン（Bayer pattern）と呼ばれるパターンで配置されており、緑に対して感知可能なセルは、赤に対して感知可能なセルと、青に対して感知可能なセルとの間に、交互に分散させられている。人間の視覚系は、緑に対してより敏感であり、より多くの緑のセルを含むことは、知覚される画像品質を高める傾向があるので、消費者製品では、緑のセルが、通常、支配的（predominate）である。１つの典型的なバイエルパターンにおいて、１６個のセルの配列は、８個の緑のセル、４個の赤のセル、および４個の青のセルを含み、これらは、ほぼチェス盤のパターンで配置され得る。画像が、バイエルパターン内の１色のセルを使用するディジタルデバイスによって得られるとき、生の画像は、通常、各画素が赤の値、緑の値、および青の値をもつように補間され、少なくとも処理の中間段階において、ＲＧＢ画像として記憶される。画像は、圧縮および記憶のために、ＹＣｂＣｒまたはＹＣｒＣｂにさらに変換され得る。
【００４７】
ＹＣｂＣｒおよびＹＣｒＣｂのフォーマットの画像は、上述の変換を適用することによって、直接的に処理され得るが、追加のタスクが、例えば、副標本をとられたＹＣｂＣｒおよびＹＣｒＣｂ画像を用いて行われ得る幾つかの環境がある。副標本をとられた画像において、幾つかのクロミナンス値は、ファイルのサイズを低減するために、捨てられるか、または、副標本をとられる。例えば、一般的なＨ２Ｖ１のＹＣｂＣｒの４：２：２のフォーマットでは、画素の列は、副標本をとられるが、画素の行は、影響されない。この副標本をとる方式において、列に、０から番号を付けるとき、偶数列のみが、Ｃｂ成分をもち、奇数列のみが、Ｃｒ成分をもつ。別の副標本をとるフォーマットは、ＹＣｂＣｒの４：２：０のフォーマットであり、各２×２の画素配列は、１つのＣｂ値および１つのＣｒ値を共有する。ＹＣｒＣｂフォーマットは、概ね、ＹＣｂＣｒと同じであるが、Ｃｂ成分とＣｒ成分の順序が逆にされる。
【００４８】
上述の変換方法は、副標本をとられたＹＣｂＣｒおよびＹＣｒＣｂフォーマットに直接的に適用され得るが、そうすると、Ｃｂ成分とＣｒ成分とを正確に交互にしたとき、目的の画像にならないことがある。この問題を克服するために、副標本をとられた画像から、隣り合う画素の対を考慮して、適切なＣｂ値およびＣｒ値を複製し、各画素がＣｂ値とＣｒ値とをもつようにすることによって、仮の副標本をとられていない画像(ＹＣｂＣｒ４：４：４またはＹＣｒＣｂ４：４：４)を生成し得る。変換後に、記憶するために、余分なＣｂ値およびＣｒ値は捨てられ得る。発明者によって行われた試験では、ＲＧＢ画像の処理結果と、ＹＣｂＣｒおよびＹＣｒＣｂフォーマットにおける同じ画像の処理結果との間に、視覚的に知覚可能な差は示されなかった。
【００４９】
図７は、ディジタルカメラ202を備えた移動電話200の実施形態を示している。移動電話200およびそのディジタルカメラ202は、図１の目的画像選択機構24と、変換デバイス26、または本明細書に記載されている画像変換を行うための他の機構とを含んでいる。使用において、ユーザは、移動電話200のディジタルカメラ202を使用して、ディジタル写真を撮り、次に、移動電話200の処理能力を使用して、変換を行う。図７に示されているように、ディジタル画像204は、移動電話200のディスプレイスクリーン206上に表示される。ディスプレイスクリーン206は、グラフィックスエンティティ20によって駆動される比較的に小型の液晶ディスプレイであり得る。他のタイプのディスプレイスクリーン206も使用され得る。図示されているように、画像204は、眺望しているように、一点透視画へ変換されている。画像204に一時的に重ねられたオーバーレイまたはプルダウンメニュー214は、透視変換の大きさおよび方向の変更命令を与え得る。ユーザは、数字／文字キー212の幾つかの組合せを使用して、画像204上の透視縮約効果を変更するように指示され得る。実施によって、ユーザは、上述のように、変換関数のパラメータの値を直接的に変更できるときと、できないときがある。例えば、ユーザは、“透視因数”のような設定を簡単に変更でき、その値は、個々のパラメータ値にマップされる。
【００５０】
実施によって、例えば、変換が、常に、同じ所定のマッピング値で透視変換されるように、変換パラメータは、ハードコード化されるか、またはデバイスへプリセットされてもよい。
【００５１】
次の記述では、上述の実施形態にしたがう、記憶された画像の透視変換の実時間の応用を示す幾つかの例の結果を与える。各示されている事例は、幅の比、開始座標、および方向の種々の組合せを使用した、変換画像の透視図を与えている。
【００５２】
図８は、幅の比、開始座標、および方向の４つの異なる組合せを使用して、５２０×３９０の画像に対する透視変換方法の応用を示している。図８ａは、消失点が視点に近いときの、処理された５２０×３９０の画像の、上に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝１３０、Ｗ＝５２０、Ｄ／Ｗ＝０．２５、Ｈ＝３９０、ｘ_{ｓｈｉｆｔ}＝１９５、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）をもつ画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００５３】
図８ｂは、消失点が視点に近いときの、処理された５２０×３９０の画像の、下に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝１３０、Ｗ＝５２０、Ｄ／Ｗ＝０．２５、Ｈ＝３９０、ｘ_{ｓｈｉｆｔ}＝１９５、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）をもつ画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００５４】
図８ｃは、消失点が視点に近いときの、処理された５２０×３９０の画像の、左に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝１３０、Ｗ＝３９０、Ｄ／Ｗ＝０．３３３、Ｈ＝５２０、ｘ_{ｓｈｉｆｔ}＝１３０、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）をもつ画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００５５】
図８ｄは、消失点が視点に近いときの、処理された５２０×３９０の画像の、右に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝１３０、Ｗ＝３９０、Ｄ／Ｗ＝０．３３３、Ｈ＝５２０、ｘ_{ｓｈｉｆｔ}＝１３０、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）をもつ画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００５６】
図９は、幅の比、開始座標、および方向の２つの異なる組合せを使用して、５２０×３９０の画像に対する透視変換方法の応用を示している。図９ａは、消失点が視点から遠いときの、処理された５２０×３９０の画像の、上に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝４５０、Ｗ＝５２０、Ｄ／Ｗ＝０．８６５、Ｈ＝３９０、ｘ_{ｓｈｉｆｔ}＝３５、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）をもつ画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００５７】
図９ｂは、消失点が視点から遠いときの、処理された５２０×３９０の画像の、左に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝３３８、Ｗ＝３９０、Ｄ／Ｗ＝０．８６７、Ｈ＝５２０、ｘ_{ｓｈｉｆｔ}＝２６、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）をもつ画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００５８】
図１０は、幅の比、開始座標、および方向の２つの異なる組合せを使用して、５２０×３９０の画像に対する透視変換方法の応用を示している。図１０ａは、消失点が中心から外れて、視点に近いときの、処理された５２０×３９０の画像の、上に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝６５、Ｗ＝５２０、Ｄ／Ｗ＝０．１２５、Ｈ＝３９０、ｘ_{ｓｈｉｆｔ}＝０、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）の画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００５９】
図１０ｂは、消失点が中心から外れて、視点に近いときの、処理された５２０×３９０の画像の、左に方向を定められた透視図を示している。式（１）ないし（６）は、Ｄ＝６５、Ｗ＝３９０、Ｄ／Ｗ＝０．１６７、Ｈ＝５２０、ｘ_{ｓｈｉｆｔ}＝０、および（ａ，ｂ，ｃ，ｄ）＝（０．００４０２，−１．８７７３６，０．５０６９７，０．８７５８５）の画像に適用される。なお、全ての測定値は、画素の単位で表現されている。
【００６０】
ある特定の示された実施形態が記載されているが、本明細書に使用されている文章（words）は、制限の文章ではなく、説明の文章である。例えば、請求項の範囲内で、変更が行われ得る。

【特許請求の範囲】
【請求項１】
目的画像選択機構と、
目的画像に透視変換関数を適用して、目的画像を、目的画像の前景の視点における、より大きい幅から、目的画像の消失点へ向かってより小さい幅へ変化させ、かつ目的画像を、目的画像の前景の視点における、より大きい拡張量およびより小さい圧縮量から、目的画像の消失点へ向かって、より小さい拡張量およびより大きい圧縮量へ変化させる変換機構とを含む埋め込まれたデバイス。
【請求項２】
目的画像選択機構を制御するユーザインターフェースをさらに含む請求項１記載の埋め込まれたデバイス。
【請求項３】
グラフィックスエンティティをさらに含み、目的画像選択機構および変換機構が、グラフィックスエンティティに連結されている請求項１記載の埋め込まれたデバイス。
【請求項４】
システムバスと、
メインメモリと、
グラフィックスエンティティに連結されたディスプレイスクリーンとをさらに含み、メインメモリおよびグラフィックスエンティティが、システムバスに連結されている請求項３記載の埋め込まれたデバイス。
【請求項５】
埋め込まれたデバイスが、移動電話である請求項１記載の埋め込まれたデバイス。
【請求項６】
移動電話が、ディジタルカメラを含んでいる請求項５記載の埋め込まれたデバイス。
【請求項７】
透視変換機構が、整数演算ファシリテータおよび整数プロセッサを含み、整数演算のみを使用して、透視変換を行う請求項１記載の埋め込まれたデバイス。
【請求項８】
ユーザインターフェースが、ユーザが透視変換のためのパラメータを選択できるようにするオプションを含む請求項１記載の埋め込まれたデバイス。
【請求項９】
透視変換が、長さＤおよびＷの２本の平行エッジをもつ出力画像を生成し、Ｄは、短い方のエッジの長さであり、短い方のエッジは、ｘ座標ｘ_{ｓｔａｒｔ}から始まり、変換機構は、次の式（１）および（２）を実行し、
【数１】

ｋは、透視画像における拡張および圧縮の量および滑らかさを示す定数であり、Ｗは、画素における目的画像の幅であり、Ｈは、画素における目的画像の高さであり、ｘ_ｉｎおよびｙ_ｉｎは、画素における目的画像の入力画素の座標であり、ｘ_ｏｕｔおよびｙ_ｏｕｔは、画素における出力画素の座標である請求項１記載の埋め込まれたデバイス。
【請求項１０】
整数演算ファシリテータが、オーバーフローを避けるように、変換の計算を順序付ける計算順序付け機構を含む請求項７記載の埋め込まれたデバイス。
【請求項１１】
変換機構が、実時間で透視変換を行う請求項１記載の埋め込まれたデバイス。
【請求項１２】
グラフィックスエンティティが、変換された目的画像をディスプレイスクリーン上に表示するディスプレイ機構を含む請求項４記載の埋め込まれたデバイス。
【請求項１３】
データでコード化される機械読み出し可能媒体であって、コード化されたデータが、目的画像を選択することと、
目的画像に透視変換を適用し、目的画像を、目的画像の前景の視点における、より大きい幅から、目的画像の消失点へ向かって、より小さい幅へ変化させ、かつ目的画像を、目的画像の前景の視点における、より大きい拡張量およびより小さい圧縮量から、目的画像の消失点へ向かって、より小さい拡張量およびより大きい圧縮量へ変化させることとを行う機械と相互運用可能である機械読み出し可能媒体。
【請求項１４】
コード化されたデータが、適用が整数演算のみで行われるようにする機械と相互運用可能である請求項１３記載の機械読み出し可能媒体。
【請求項１５】
コード化されたデータが、ユーザが透視変換のためのパラメータを選択できるようする機械と相互運用可能である請求項１４記載の機械読み出し可能媒体。
【請求項１６】
コード化されたデータが、変換された目的画像が台形の形であるようにする機械と相互運用可能である請求項１３記載の機械読み出し可能媒体。
【請求項１７】
コード化されたデータが、長さＤおよびＷの２本の平行エッジをもつ出力画像を生成する透視変換を行う機械と相互運用可能であり、Ｄは、短い方のエッジの長さであり、短い方のエッジは、ｘ座標ｘ_{ｓｔａｒｔ}から始まり、コード化されたデータは、透視変換が次の式（１）および（２）にしたがって行われるようにし、
【数２】

ｋは、透視画像における拡張および圧縮の量および滑らかさを示す定数であり、Ｗは、画素における目的画像の幅であり、Ｈは、画素における目的画像の高さであり、ｘ_ｉｎおよびｙ_ｉｎは、画素における目的画像の入力画素の座標であり、ｘ_ｏｕｔおよびｙ_ｏｕｔは、画素における出力画素の座標である請求項１３記載の機械読み出し可能媒体。
【請求項１８】
コード化されたデータが、変換機構に、オーバーフローを避けるように、所定の計算順序で計算を行わせる機械と相互運用可能である請求項１３記載の機械読み出し可能媒体。
【請求項１９】
コード化されたデータが、透視変換が実時間で行われるようにする機械と相互運用可能である請求項１３記載の機械読み出し可能媒体。
【請求項２０】
コード化されたデータが、埋め込まれたデバイスにおいて透視変換が行われるようにする機械と相互運用可能である請求項１３記載の機械読み出し可能媒体。
【請求項２１】
コード化されたデータが、移動電話において透視変換が行われるようにする機械と相互運用可能である請求項１３記載の機械読み出し可能媒体。
【請求項２２】
移動電話が、ディジタルカメラを含んでいる請求項２１記載の機械読み出し可能媒体。
【請求項２３】
コード化されたデータが、整数マイクロプロセッサを使用して、透視変換が行われるようにする機械と相互運用可能である請求項２２記載の機械読み出し可能媒体。
【請求項２４】
受信機／送信機組立体と、
マイクロプロセッサと、
マイクロプロセッサに連結された目的画像選択機構と、
マイクロプロセッサに連結されていて、目的画像に透視変換関数を適用し、目的画像を、目的画像の前景の視点における、より大きい幅から、目的画像の消失点へ向かって、より小さい幅へ変化させ、かつ目的画像を、目的画像の前景の視点における、より大きい拡張量およびより小さい圧縮量から、目的画像の消失点へ向かって、より小さい拡張量およびより大きい圧縮量へ変化させる変換機構とを含む移動電話。
【請求項２５】
マイクロプロセッサが、整数マイクロプロセッサである請求項２４記載の移動電話。
【請求項２６】
変換機構が、整数演算のみを使用して、透視変換を適用する請求項２４記載の移動電話。
【請求項２７】
目的画像を選択する手段と、
透視変換を目的画像に適用して、目的画像を、目的画像の前景の視点における、より大きい幅から、目的画像の消失点へ向かって、より小さい幅へ変化させる手段とを含む装置。
【請求項２８】
適用手段が、整数演算のみを使用して、透視変換を行う手段を含む請求項２７記載の装置。
【請求項２９】
ユーザが目的画像を選択できるようにする手段をさらに含む請求項２７記載の装置。
【請求項３０】
変換された目的画像が、台形の形である請求項２８記載の装置。
【請求項３１】
透視変換が、長さＤおよびＷの２本の平行エッジをもつ出力画像を生成し、Ｄは、短い方のエッジの長さであり、短い方のエッジは、ｘ座標ｘ_{ｓｔａｒｔ}から始まり、透視変換は、次の式（１）および（２）によって表わされ、
【数３】

ｋは、透視画像における拡張および圧縮の量および滑らかさを示す定数であり、Ｗは、画素における目的画像の幅であり、Ｈは、画素における目的画像の高さであり、ｘ_ｉｎおよびｙ_ｉｎは、画素における目的画像の入力画素の座標であり、ｘ_ｏｕｔおよびｙ_ｏｕｔは、画素における出力画素の座標である請求項２７記載の装置。

【図１】

【図２】

【図３ａ】

【図３ｂ】

【図４】

【図５】

【図６】

【図７】

【図８ａ】

【図８ｂ】

【図８ｃ】

【図８ｄ】

【図９ａ】

【図９ｂ】

【図１０ａ】

【図１０ｂ】

【公開番号】特開２０１２−１０４１１４（Ｐ２０１２−１０４１１４Ａ）
【公開日】平成２４年５月３１日（２０１２．５．３１）
【国際特許分類】

【外国語出願】
【出願番号】特願２０１１−２４３６７４（Ｐ２０１１−２４３６７４）
【出願日】平成２３年１１月７日（２０１１．１１．７）
【分割の表示】特願２００７−５３４８１８（Ｐ２００７−５３４８１８）の分割
【原出願日】平成１７年９月２８日（２００５．９．２８）
【出願人】（５９５０２０６４３）クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】ＱＵＡＬＣＯＭＭ　ＩＮＣＯＲＰＯＲＡＴＥＤ
【Ｆターム（参考）】

[ Back to top ]

二次元画像の透視変換

メニュー

スポンサーリンク

次の公報 »

« 前の公報

二次元画像の透視変換

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク