説明

デジタルイメージ安定化のための、ビデオデータ処理方法及びイメージ処理回路、並びにこれを用いるカメラ

【課題】フレーム(frame)の静的な背景を識別するデジタルイメージ安定化(DIS)方法を提供する。
【解決手段】選択回路4100、4200は、複数のタイルモーションベクトル(Tile MV)と特徴点モーションベクトル(FP MV)との各スコアリングに基づいて、ビデオフレームの場面内の静止/背景客体を表わす主要変換を選択し、移動客体除外回路4400は、静止/背景グループのヒストリーと複数のモーションベクトルグループの各々のヒストリーとに基づいて大型移動客体を除く。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の概念による実施例は、デジタルイメージ安定化(digital image−stabilization、DIS)に係り、特に、カメラ場面(scene)内の客体(objects)の移動を識別(identify)し、前記カメラの意図された動き(モーション、motion)と意図されていない動きとの間を区分(distinguish)する、ビデオデータ処理方法及びイメージ処理回路、並びにこれを用いるカメラに関する。

【背景技術】
【0002】
デジタルカメラ(digital cameras)、デジタルビデオカメラ(digital video cameras)、及びこのようなカメラ撮像ツール(camera capture)を含むハンドヘルドデバイス(hand−held devices)は、そのカメラを操作者が手で操作して、イメージ又はビデオを撮影(capture)するために度々使われる。従って、カメラは、イメージ又はビデオを撮影する際に、手ぶれや、ジッタを発生しうる。ジッタは、水平成分、垂直成分、及び回転成分を含みうる。ジッタがあると、手撮りビデオ(hand−captured video)を見る人の見る気を逸らせ(distracting)又は見る気を失わせる(disorienting)。従って、デジタル的にカメラ軌跡(trajectory)、すなわち、連続したフレームの各対の間から検出されたジッタ、を推定し、同一場面に対するビデオフレームのシーケンスからこのジッタをフィルタリングするためにデジタル回路を使うことが必要になる。
【0003】
静止しているか、移動しているかを問わず安定した(steady)ビデオカメラによって製作されたビデオは、撮影されたビデオに主に滑らかなモーション(並進(translation)又は回転(rotational))を含む。一方、不安定な(unsteady)ビデオカメラは、ビデオイメージの全体に亘って高周波数の(並進性(translational)及び/又は回転性の(rotational))ジッタを含むビデオを生産する。
【0004】
デジタルイメージ安定化(DIS)システムは、まず所望しない(意図されていない)モーション(motion)を推定した後、それの訂正をイメージシーケンスに適用する。
このように安定化したビデオの実際の視覚的効果は、カメラ軌跡推定の品質に大きく依存する。
従来のデジタルイメージ安定化(DIS)方法は、2つの連続したフレームの間のジッタ性モーション(jittery motion)の推定の根拠として、識別された特徴点(feature points)を使う。
従って、従来のDIS技術では、ジッタ性カメラ移動は、経時的に近接した複数のフレームの間の識別可能な“特徴点”のモーションベクトル(motion vectors)を計算することで感知される。
特徴点に対して計算されたモーションベクトルは、場面内の実在する客体に複数のモーションベクトルを関連付けるために、“グループ化”される。
このようなグループ化(grouping)は、場面内で移動する小型の客体をカメラ又は場面のグローバルモーション(global motion)から区分する。
カメラ又は場面のグローバルモーションは、意図されたグローバルモーション、例えば、パンニング(panning)グローバルモーションと意図されていないグローバルモーション、例えば、ジッタリ(jittery)グローバルモーションとに、分析の上、区分される。
【0005】
ジッタを、保存又は表示されたビデオにおいて正確に補償し、正確に除去するためには、カメラの軌跡を感知して測定することと、前記ジッタを正確に特徴づけることとが要求される。しかし、ノイズの多い、又は平坦で変化のない(flat)場面のビデオのような特別な場合には、特徴点追跡(tracking)は信頼できない。特徴点モーションベクトル(feature−point motion vectors)を得るためには、最もマッチングする点を、絶対差の和(sum of absolute difference、SAD)の計算に基づいて探さなければならない。しかし、最小のSADは、ノイズが多く且つ薄暗い(low−light)場面、又は青い空のようなフラットな場面の場合、SADが最小であるからといって、その点が正確なマッチング点であることを必ずしも保証しない。
【0006】
数学的には、アフィン幾何学(affine geometry)は、アフィン変換、すなわち、非特異線形変換及び並進(non−singular linear transformation and translation)によって変わらず保持される幾何学的性質の研究である。
アフィン行列(Affine matrix)と呼ばれる、一群の数値係数(numerical coefficient)によって定義される方程式の数学的システムは、連続したフレームの各ペア(pair)の間で、又はこれらの一部(例えば、フレーム内で移動する客体)の間で感知された平行移動(lateral、例えば、上、下移動)、回転、及び伸縮(scalar、例えば、ズームイン、ズームアウト)を特徴づけるために開発された。
従って、アフィン変換T(n)は、各特徴点がビデオフレームイメージ(video frame image)内の区別可能な点であるとして、イメージ内に見える選択された特徴点からなる識別されたグループのモーションをコンパクトに記述できる。
グループのこのような数学的な記述説明は、線形変位、回転角、伸縮(scale)などを含みうる。
各グループの線形変位モーションM(n)は、多重フレーム(n−1、n、n+1番目などのフレーム)に対するアフィン変換T(n)内の情報の部分集合である。
【0007】
従って、カメラのジッタは、場面内に静止して実在する客体(actually−stationary objects)、例えば、岩、テーブル、駐車中の車、山、太陽、に関連した主要変換(principal transform)(P(n))、又はグローバル変換(global transform)と呼ばれる第1アフィン変換行列により特徴づけられ、一方、フレーム内の移動客体、例えば、鳥、人、球、動く車、通り過ぎる汽車は、追加的なアフィン行列によって特徴づけられる。小モーションM(n)の変換は、大体、主要変換P(n)である。しかし、極小モーションM(n)の変換が必然的に常に前記主要変換P(n)であるというわけではない。
【0008】
カメラモーション、例えば、ユーザのハンドジッタによって発生するカメラモーションを指し示す(indicate)主要変換(主要インターフレーム(inter−frame)変換、P(n))は、1つ以上の関心点(“特徴点”)を感知することによって、計算されて選択される。連続したフレームの間の特徴点のモーションベクトルは、ビデオ圧縮の分野で採択される多様な検索方法を用いて計算されうる。特定の客体と関連づけられてグループ化された複数の特徴点モーションベクトルは、その客体のアフィン変換の計算に使われ、該アフィン変換はアフィン方程式によって、客体の感知されたモーションを定義する。
【0009】
イメージを安定化するためには、まず、不安定なカメラによって引き起こされた主要モーションが場面内の移動する客体から弁別される。もし、ジッタ(カメラ軌跡(camera trajectory))がなければ、静止して実在する客体、例えば、岩のエッジ、山の峰の各感知された特徴点は、2以上の連続したフレームの各々内の同じ場所で発見されると予想される(また、その場合、感知された特徴点のモーションベクトルは全て、ヌル(null)として測定される)。もし、ジッタ(カメラ軌跡)があれば、静止して実在する客体、例えば、岩のエッジ、山の峰の各感知された特徴点は、2以上の連続したフレームの各々内の相異なる場所で発見されると予想され、その場合、感知された特徴点のモーションベクトルは全て有限な値として測定される。
しかし、場面によっては、ジッタモーションに比べて同じであるか、小さいか、又は大きい、測定可能なモーションベクトルを有する大きな移動客体、例えば、通り過ぎる汽車又は通り過ぎるトラックがフレーム内に登場し、フレームの漸増する領域をカバーし、遂には全場面をカバーする場合がある。全ビデオ場面をカバーするような大きい移動客体は、従来のDIS方法にとり特に難問として残っている。こういう場合が生起すると、従来のDIS回路は、大きな移動客体の変換を主要変換P(n)として誤まって識別し、混乱しかねない。
【発明の概要】
【発明が解決しようとする課題】
【0010】
本発明が解決しようとする技術的な課題は、実際に移動する客体から静的な背景を識別するために、タイルモーションベクトルグループ変換(tile motionvector group transforms)と特徴点モーションベクトルグループ変換(feature point motion vector group transforms)とのうちから主要変換を選択することに基づいて、フレーム(frame)の静的な背景を識別するデジタルイメージ安定化(DIS)方法を提供することにある。
【課題を解決するための手段】
【0011】
本発明の概念の一面は、タイルモーションベクトル(Tile MV)グループと特徴点モーションベクトル(FP MV)グループとの複数の変換の各々のスコアリング(scoring)に基づいて、ビデオフレームの場面内の静止又は背景(両者を一般に区別せず合わせて、以下、「静止/背景」とする)客体を表わす主要変換P(n)を選択する段階と、前記静止/背景グループのヒストリー(history)と前記複数のモーションベクトルグループの各々のヒストリーとに基づいて、大きい移動客体を除く段階と、を含むデジタルイメージ安定化方法を提供する。
【0012】
本発明が果たそうとする他の技術的な課題は、特徴点モーションベクトル(feature point motion vector、FP MV)グループの複数の変換の各々のスコアリングに基づいて、ビデオフレーム(video frame)の場面内の静止/背景客体を表わす主要変換P(n)を選択する方法を提供することにある。
【0013】
本発明が果たそうとするまた他の技術的な課題は、タイルモーションベクトル(Tile MV)グループと特徴点モーションベクトル(FP MV)グループとの複数の変換の各々のスコアリングに基づいて、ビデオフレームの場面内の静止/背景客体を表わす主要変換P(n)を選択する方法を提供することにある。
【0014】
本発明の概念の他面は、静的な(背景)グループのヒストリーと複数のモーションベクトルグループの各々のヒストリーとに基づいて、ビデオフレーム全体をカバーするほど大きい移動客体を除く段階を含むデジタルイメージ安定化方法を提供する。
【0015】
本発明の概念の一面は、本明細書に開示されたDIS方法を行うのに適したデジタルイメージ安定化回路を提供する。連続したビデオフレームの間のカメラ軌跡を推定し、ビデオフレームのシーケンスからカメラの軌跡によって引き起こされるジッタをフィルタリングさせる(filter out)方法又は回路は、ビデオカメラ自体に含まれ、撮影されたビデオフレームの保存に先立って、例えば、もし、ビデオカメラがリアルタイムMPEGエンコーダを含めば、MPEGエンコーディング前又は途中で、リアルタイムで前記ジッタを除くように作動できる。
別の方法として、連続したビデオフレームの間のカメラ軌跡を推定し、ビデオフレームの保存されたシーケンスからジッタをフィルタリングさせるDIS回路は、デジタルイメージ安定化(DIS)方法を具現するソフトウェアによって制御される汎用マイクロコンピュータであり、ASIC内に具現されたMEPGビデオエンコーダのようにデジタルイメージ安定化(DIS)方法を行うように活用される専用ハードウェアであり得る。
【発明の効果】
【0016】
本発明の概念の一実施例の要点は、アフィン(インターフレーム)変換T(n)で表わされる、時系列上の第n番目の時点における、第i番目のモーションベクトルグループの変換を評価し、そのうちから(静的な)背景を表わすために最善の主要変換P(n)を選択するために、一連のスコアリング関数(scoring functions)を適用する方法である。
本方法は、主要変換P(n)を選択する時、変換ヒストリー、変換モーション、変換特徴、及び(垂直の又は水平の)変換規模(transform extent)の各特性に係る関数を含むが、これに限定されない関数を含む成分関数を同時に考慮する。
このような特性(characteristics)の各々は、スコアリング成分に寄与する。このようなスコアリング成分の総体(ensemble)は、候補としての各変換T(n)に対する全体スコアQ(n)を与える。
最上の全体スコアQ(n)を有する(インターフレーム)変換T(n)が主要(インターフレーム)変換P(n)として選択され、本発明によるDIS方法の後続の補償段階で使われる。
本発明の実施例によるスコアリング及び選択方法は、(インターフレーム)変換のマイナーな摂動に敏感ではない。
従って、本方法は、このようなマイナーな摂動に非常に敏感な従来の方法、例えば、マルチレベルアドホック二進決定ルーチン(multi−level ad−hoc binary decision routines)より優れる。
【0017】
以下に添付図面を参照しながら、本発明の概念の実施形態について詳細に説明する。ただし、本発明はここで説明される実施形態から多様に変形されて実施できるものと理解すべきであり、ここで説明される実施形態に限定されるものと理解すべきでない。むしろ、これらの実施形態は、発明の開示が徹底的且つ完全であり、本発明の概念の範囲を当業者に十分に伝えるように用意されている。説明の全体を通して類似符番は類似要素を指す。
【図面の簡単な説明】
【0018】
本発明の詳細な説明で引用される図面をより十分に理解するために、各図面の詳細な説明が提供される。
【図1】本発明の実施例によるデジタルイメージ安定化(DIS)回路のブロック図である。
【図2】タイルベクトルグループのアフィン(affine)変換を計算する図1のDIS回路内の感知ユニットのブロック図である。
【図3】タイルグループ変換と特徴グループ変換とからなる(インターフレーム)変換T(n)をスコアリングに基づいて、主要(静止/背景)変換P(n)を選択する図1のDIS回路の軌跡ユニットのブロック図である。
【図4】(A)は、図1のDIS回路のDIS方法内の段階を行うグループ変換スコアリング及び選択回路の一実施例のブロック図であり、(B)は、ヒストリースコア計算ユニットの一実施例のブロック図である。
【図5】コレクティブ変換スコアリング及び選択回路の一実施例のブロック図である。
【図6】移動客体除外回路の一実施例を示すブロック図である。
【図7】本発明の概念の実施例によるプロセス段階を示すフローチャートである。
【発明を実施するための形態】
【0019】
本発明の一実施例によって、各撮影されたビデオフレームは、デジタルイメージ安定化に適するように優れた特徴点分布を提供する特徴点をアルゴリズミックに選択するために、少数の互いに重ならないタイル(典型的には、標準画質の場合4×4タイル、及び高精細画質の場合6×6タイル)に分けられる。イメージの異なる領域は、適当な特徴点の密度が異なりうる。極端な場合、例えば、雲一点ない青空の場合に、フレームの領域によっては、如何なる適当な特徴点を有さないこともある。他の部分で、潜在的な特徴点は、非常に稠密である。
【0020】
得られた特徴点分布は、ビデオフレームの小さい領域、例えば、重ならないタイル、に基づき、各タイル内の特徴点の個数は、前記タイルのイメージ輝度データの分散σに比例して線形的に増加する。より関心のあるイメージデータのタイルと、それによるより多い特徴点に対する要求は、より高い分散σを有するように予測される。本願と同日に出願済の発明、“デジタルイメージ安定化装置及び方法”(ドケット(docket)番号8729−357)を見れば、同時に僅かな局所的状態情報を要するだけで、各タイルに含まれた特徴点の間の最小距離(MIN_DIST)を設定することによって、ハードウェア具現コストを低減できる手順が描写されている。前記の同時出願発明の開示内容は、参照文献として本願に含まれる。
【0021】
もし、場面が薄暗い状態で撮影されれば、それは、相対的により多いノイズを有し、特徴点のピクセルの個数は、タイル内のピクセルの個数より遥かに少ないので、ノイズ効果は、タイルより特徴点により大きく作用する。前記タイル内のピクセルの個数が大きいと、ノイズ消去(キャンセル)効果を提供し、このような場合には、ダウンサンプリングされた(downsampled)タイルをベースとするモーションベクトルがより正確である。
【0022】
たとえ場面が薄暗い状態で撮影されないとしても、もし場面が過度にフラット(flat)になれば、タイルベースのモーションベクトルは、より正確である。もし、タイル場面(tile scene)が、曇り空又は青い空のように非常にフラットになれば、若干の特徴点が存在し、フラットタイル内のこのような特徴点は、次のフレーム内の多くの場所内に類似レベルのマッチング点を見出しうる。しかし、タイルベースマッチングは、小さな特徴点探索領域にのみ依存するものではなく、タイルの全てのパターンが、タイルマッチングプロセスに貢献できる。結果的に、タイルベースモーションベクトルは、場面がフラットになる時により信頼できる。
【0023】
特徴点モーションベクトルグループの最も高いスコアでも、所定の(予め決められた)閾値より低い時、我々は、特徴点ベースモーションベクトル(feature−point based motion vectors)の代わりに、タイルベースモーションベクトルを使うように決定し、このような戦略は、高いノイズ又はフラットな場面で効果的に作動する。
【0024】
本発明の概念の実施例によって、我々は、背景と大きな客体の動きとを表わす推定されたモーションベクトルを選択する一方、より小さな客体は、それらと関連した正確なモーションベクトルを有する必要がない。より小さな客体に対するある不正確なベクトルは、DISアルゴリズムの以後の段階で除去されうる。
【0025】
グローバル動き又はカメラ動きのために、意味のある(of significance)大きい静止客体の特徴点は、一貫した方法(coherent way)で移動すると予測される。我々は、独立して動く十分に大きな客体は、少なくとも1つのタイルの過半(majority)をカバーすることを認知し、従って、小さな客体のモーションはタイル自体のモーションベクトルに殆ど影響しないので、それらのモーションは、タイル自体の優勢(predominate)モーションとして推定されうる。
【0026】
我々は、最低の解像度でブロックマッチング(block matching)を用いてタイル別に1つのモーションベクトルを得る。タイルベースモーションベクトルは、高いノイズ又はフラット場面ビデオのような特別な場合におけるカメラ軌跡決定に使われる。
【0027】
与えられたタイルに対するモーションベクトルは、絶対差の和(SAD)を最小にするベクトルである。そして、各タイル内の特徴点のモーションベクトルを計算するプロセスは、階層的モーション推定アルゴリズム(hierarchical motion estimation algorithm)を使うことによって、そして、タイルのモーションベクトルを開始ベクトルとして使い、ローカル動きよりもタイル動きを優先(preferring)することによって、計算量を減らすように変更されうる。
少なくとも1つのタイルの過半をカバーする十分に大きな客体は、隣接したタイルに拡張できるので、各タイル内のいくつかの特徴点は、一般に、それらが発見されたタイルのモーションベクトルよりも隣接したタイルのモーションベクトルにより強く関連する。
従って、全ての隣接したタイルのモーションベクトルを、ある与えられたタイルの特徴点のモーションベクトルに対するブロックマッチング探索のマルチプル開始ベクトル(multiple start vectors)として使うことが効果的である。従って、選択された特徴点のモーションベクトルを得るために使われる開始ベクトルは、それが存在するならば、その特徴点が属するタイルのモーションベクトルと、そのタイルの四方向の直接的な隣りのタイル(上側タイル、左側タイル、右側タイル、下側タイル)に属するモーションベクトルである。
使われる開始ベクトルごとに、我々は、単に特徴点モーションベクトルに対するローカル探索(local search)のために、非常に小さな範囲を使う。この目的は、各々の、そして、全ての特徴点に対する正確なベクトルを決定するものではない(悪いモーションベクトルは、一連のDISプロセッシング内で後で選別除去される)。
むしろ、関心のある特徴点は、単に背景又は大きい客体に属するものである。そのような特徴点に対して、タイルモーションベクトルのうちの1つは、丁度良いか、関心のある特徴点のモーションベクトルに近似していなければならず、それにより、各選択されたタイルモーションベクトルに対する小さなローカル探索は十分である。
小さなローカルブロックマッチング探索(local block matching search)は、タイル内の全ての選択された特徴点に対する開始ベクトルの集合の各々を巡って高解像度ドメインにおいて実行される。この高解像度は、元のビデオ解像度、又は2又は4のfs3ファクタによって副標本化された(subsampled)ものであり得る。
【0028】
図1は、本発明の概念の実施例と関連したDIS方法を行うデジタルイメージ安定化(DIS)回路のブロック図である。前記DIS回路は、受信されたジャーキー(jerky、手振れなどでギクシャクした)ビデオを分析し、インターフレーム変換(以下、「インターフレーム」を削除して、単に「変換」ともいう)T(n)を出力する感知ユニット(detection unit、DU)2000、前記インターフレーム変換T(n)のうちから主要変換P(n)を選択し、選択された主要変換P(n)を用いて補償変換C(n)を出力する軌跡ユニット(trajectory unit、TU)4000、及び前記補償変換C(n)を用いて、前記ジャーキービデオを修正して安定化されたビデオを出力する補償ユニット(compensation unit、CU)6000を含む。
【0029】
感知ユニット2000は、ビデオデータの受信されたフレーム内の特徴点FPのインターフレームモーションベクトル(特徴点モーションベクトル)と、重ならないタイルのインターフレームモーションベクトル(タイルモーションベクトル)と、を推定する。これに基づき、感知ユニット2000は、FPモーションベクトルグループ変換と、タイルベクトルグループ変換とからなるインターフレーム変換T(n)をさらに出力する。
以下、FPモーションベクトルグループ変換を、特徴点グループ変換T(FP,i)(n)と略し、タイルモーションベクトルグループ変換を、タイルグループ変換T(tile,i)(n)と略し、両者を合わせたものを(インターフレーム)変換T(n)とする。
【0030】
軌跡ユニット4000は、インターフレーム変換T(n)のうち1つを主要変換P(n)として選択し、大きな移動客体が場面をカバーしている場合は単位変換(Unity_Transform、即ち、無変換)を選択する。従って、小さな移動客体のインターフレーム変換と、全体フレームに進入しこれをカバーできる大きな移動客体のインターフレーム変換と、を除く。
【0031】
図2は、図1のDIS回路のDIS方法の段階として、タイルベクトルグループのアフィン変換を計算する、図1のDIS回路内の感知ユニット2000のブロック図である。感知ユニット2000は、特徴点回路3000、モーションベクトル(MV)グループ化回路1300、及びモーションベクトル(MV)グループアフィン変換計算器2010を含む。
【0032】
特徴点回路3000は、ビデオデータの各フレームを受信し、各ビデオフレームを少数((j×k)個)の互いに重ならないタイルに分割する。タイルの個数(j×k)は、SDビデオ(standard definition video)のための4×4からHDビデオ(High−definition video)のための6×6までの範囲を有し、(4〜8)×(4〜8)の範囲内の他の数字も可能であり、有利である。前記タイルサイズは、独立して動く十分に大きな客体が少なくとも1つのタイルの過半をカバーできるように選択され、小さな客体のモーションは無視してもよい一方、十分に大きな客体のモーションは、DIS目的によって撮影されうる。特徴点回路3000は、受信されたビデオフレーム内の特徴点(SFPs)を識別して選択し、特徴点のモーションベクトル(SFP MVs)と、タイルのモーションベクトル(Tile MVs)とを出力する。
【0033】
特徴点回路3000は、特徴点選択器(feature point selector)とモーションベクトル計算器(motion−vector calculator)と共有されたRAMメモリ350とを含む。前記特徴点選択器は、ハリスコーナー(Harris−Corner)特徴点候補識別器、及び特徴点候補分類器をさらに含む。コンピュータパワーを節約し、要求される複数の動作の個数を減少させるために、特徴点回路3000は、ルーマ(luma、輝度)データにのみ動作し、1つ以上のダウンサンプラー及び階層的ブロックマッチング探索ユニットを含む。
【0034】
特徴点回路3000は、各タイルに対して1つのモーションベクトルを推定する。このタイルモーションベクトル(Tile MV)推定は、入力イメージの中央をカバーする重ならないタイル(例えば、特徴点分類アルゴリズム内に使われるのと同じタイル)に基づいて行われる。タイルの各々に対して、フルブロックマッチング探索は、深くダウンサンプリングされたイメージに対して行われる。フル探索ブロックマッチングは、全てのタイルに対して行われ、得られたタイルモーションベクトル(Tile MV)は、メモリ350のタイルMVリスト356に保存されて、以後の使用、例えば、特徴点モーションベクトル(メモリ350のSFP_MVリスト352に保存される)の推定のための、及び静止客体感知のための階層的ブロックマッチング探索ユニット内での開始ベクトルとしての使用に備える。
【0035】
特徴点回路3000は、望ましくは、ビデオフレームの小領域(タイル)に基づいた分布を有する、特徴点のモーションリスト(SFP_MV)352を提供する。タイル別の特徴点の最大個数は、タイルのイメージ輝度データ(luminance image data)の分散σによって線形的に増加する。DIS方法にとって優れた特徴点とは、適当なモーション推定アルゴリズムが適用されると、曖昧ではないモーションベクトルを算出する特徴点である。
イメージ内の特徴点を識別するために、ハリスコーナー感知アルゴリズムが、ビデオフレームの各ピクセルに適用されて、そのピクセルが特徴点として如何ほど適するかを測定する。イメージの相異なる領域(タイル)は、識別された特徴点候補の相異なる密度を有しうる。
【0036】
特徴点回路3000は望ましくは、各タイルのモーションベクトルを計算するためのタイルベクトル計算器機能を行うモーションベクトル計算器、及び各選択された特徴点(selected feature point、SFP)のモーションベクトルを決定し、出力するための階層的ブロックマッチング検索ユニットを含む。
タイルベクトル計算器は、現在フレーム(F)の深くダウンサンプリングされたルーマデータを使って、各タイルのモーションベクトルを計算する。階層的ブロックマッチング検索ユニットは、2つの連続したフレームの、最大解像度の又はダウンサンプリングされたルーマデータを用いて選択された特徴点の各々のモーションベクトルを決定し、得られたタイルモーションベクトルを後で開始ベクトルとして使用する。
【0037】
全ての特徴点とタイルに関連したデータは、次のDISブロック、具体的には、モーションベクトルグループ化回路1300に伝達される。
【0038】
モーションベクトルグループ化回路1300は、FPモーションベクトルとタイルモーションベクトルとに対してグループ化アルゴリズムを施す。モーションベクトルグループ化回路1300は、ペアリングアルゴリズムコントローラ1302と、これによって選択されたベクトルの各対を比較してグループ化決定を行うモーションベクトル比較器1310を含む。
【0039】
特徴点グループ化回路1300は、FPモーションベクトルを、選択された特徴点(SFPs)のモーションベクトルを場面内の客体と関連付けるように、グループ化する。その際、このグループ化は、連続したビデオフレームの間の、該客体の認知された相対的動作に基づいて行なわれる。
特徴点グループ化回路1300は、タイルモーションベクトルを場面内の客体と関連付けるようにグループ化する。その際、このグループ化は、連続したビデオフレームの間の、該客体の認知された相対的動作に基づいて行なわれる。
【0040】
特徴点グループ化回路1300は、RAMメモリ350を特徴点回路3000と共有する。メモリ350のSPF MVリスト(SPF MV list)352部分は、選択された特徴点(SFPs)の位置とモーションベクトルのリストとを含む。メモリ350のタイルMVリスト356は、重ならないタイルの位置とモーションベクトルのリストとを含む。
【0041】
ペアリングアルゴリズムコントローラ1302は、どの特徴点(モーションベクトル)及びどのタイル(モーションベクトル)が他のどのものと以前にペアされたか、どれがペアリングされずに(unpair)で残ったか、及びどれが全体的にグループ化から除外されるか、についての履歴(トラック)を保持する。ペアリングアルゴリズムコントローラ1302は、反復的にモーションベクトルの対を、(ベクトルA&ベクトルB)の形でMV比較器1310への入力として提供する。
【0042】
特徴点グループ化回路1300内のペアリングアルゴリズムコントローラ1302は、SPF MVリスト352とタイルMVリスト356とにアクセスし、モーションベクトル比較器1310内の比較のために、ベクトルAとベクトルBとを選択する。一連のベクトルA−ベクトルBの比較結果、1つ以上のベクトルのグループ、例えば、選択された特徴点のグループとタイルのグループ、が生成された場合、ペアリングアルゴリズムコントローラ1302は、グループ化されたモーションベクトル又はその羅列リスト(descriptive list)をメモリ350のFP MVグループインベントリ354とタイルMVグループインベントリ358とに書込む。
【0043】
モーションベクトル(MV)グループアフィン変換計算器2010は、特徴点モーションベクトルの各グループのインターフレーム変換を計算し、タイルモーションベクトルの各グループのインターフレーム変換を計算し、それらをいずれもインターフレーム変換T(n)として出力する。
【0044】
図3は、図1のDIS回路のDIS方法の段階に関連して、タイルMVグループ変換と特徴点MVグループ変換とからなるインターフレーム変換T(n)をスコアリングする方法に基づいて、主要(静止/背景)変換P(n)を選択するための、図1のDIS回路の軌跡ユニット(TU)4000のブロック図である。
【0045】
軌跡ユニット4000は、タイルグループ変換スコアリング及び選択回路4100−1(ただし、図4Aでは、4100)、特徴点グループ変換スコアリング及び選択回路4100−2(ただし、図4Aでは、4100)、コレクティブ変換スコアリング及び選択回路4200、移動客体除外回路4400、及び適応的補償フィルター8000を含む。
【0046】
軌跡ユニット4000は、場面内の移動客体を無視することで、不安定なカメラによって引き起こされる主要モーションを識別し、選択した主要変換P(n)をフィルタリングし、補償変換C(n)を出力する。軌跡ユニット4000は、受信されたインターフレーム変換T(n)のうちから主要変換P(n)を選択する際に、複数の一連のスコアリング関数を使う。
【0047】
図4(A)は、図1のDIS回路の軌跡ユニット4000のグループ変換スコアリング及び選択回路4100のブロック図である。グループ変換スコアリング及び選択回路4100は、変換スコア計算器4150、変換品質計算器4160、及び図1のDIS回路のDIS方法の段階を行うグループ変換及び品質選択器4170を含む。
グループ変換スコアリング及び選択回路4100は、インターフレーム変換T(n)入力として、タイルグループインターフレーム変換(T(tile,i)(n))を適用すると、タイル又は特徴点グループ主要変換GP(n)として、タイルグループ主要変換(GPtile(n))を出力し(4100−1)、インターフレーム変換T(n)入力として、FP(=特徴点)インターフレーム変換(T(FP,i)(n))を適用すると、タイル又は特徴点グループ主要変換GP(n)として、特徴点グループ主要変換(GPFP(n))を出力する(4100−2)。
【0048】
図4(B)は、図4(A)のグループ変換スコアリング及び選択回路4100内のヒストリースコア計算ユニット4110−1の一実施例のブロック図である。
【0049】
図4(A)及び4(B)を参照すると、グループ変換スコアリング及び選択回路4100は、ヒストリースコア計算ユニット4110(例えば、図4(B)に示した4110−1)、モーションスコア計算ユニット4120、特徴スコア計算ユニット4130、及び規模スコア計算ユニット4140に加えて、変換スコアS(n)を計算する変換スコア計算器4150、変換品質Q(n)を計算する変換品質計算器4160、及びグループ変換及び品質選択器4170(例えば、4170−1)を含む。
【0050】
図4(A)のグループ変換スコアリング及び選択回路4100のグループ変換及び品質選択器4170は、変換スコア計算器4150から受信された(各インターフレーム変換T(n)の)全体変換スコアS(n)に基づいて小さい移動客体のインターフレーム変換を排除することにより、インターフレーム変換T(n)のうち1つをグループ主要変換GP(n)として選択し、グループ主要変換GP(n)とそれに関連した品質Q(n)を出力する。
【0051】
(n)を感知ユニット2000から受信された全ての受信された変換候補のうちi番目の変換とする。ここで、nは、時系列上の第n番目の時点におけるフレームを意味する。GP(n)は、フレーム時間nでの選択されたグループ主要変換である。すなわち、選択されたiに対して、GP(n)=T(n)である。
【0052】
各T(n)に対して、変換スコアS(n)計算器4150は、ヒストリースコア計算ユニット4110(例えば、4110−1)からヒストリースコアH(n)を受信し、モーションスコア計算ユニット4120からモーションスコアM(n)を受信し、特徴スコア計算ユニット4130から特徴スコアF(n)を受信し、規模スコア計算ユニット4140から規模スコアE(n)を受信し、変換スコアS(n)を下記の式に基づいて計算する。
(n)=H(n)*M(n)*F(n)*E(n)
【0053】
各T(n)に対して、変換品質計算器4160は、特徴スコア計算ユニット4130から特徴スコアF(n)を受信し、規模スコア計算ユニット4140から規模スコアE(n)を受信し、下記の式に基づいて変換品質Q(n)を計算する。
(n)=F(n)+E(n)
【0054】
最も大きな値S(n)を有するT(n)は、図4(A)のグループ変換スコアリング及び選択回路4100のグループ変換選択器4170によってグループ主要変換GP(n)として選択される。従って、実施例によって、図1のDIS回路のDIS補償ユニット6000内で、最も高いスコアS(n)を有するインターフレーム変換候補T(n)は、グループ主要変換GP(n)として選択され、ジッタ(jittery)カメラモーションを補償するための補償変換C(n)を生産するために、後述するように、適応的にフィルタリングされる。
【0055】
ヒストリースコア計算ユニット4110(例えば、4110−1)は、グループ主要変換GP(n)のヒストリーを保存し、グループ主要変換GP(n)の保存されたヒストリーの所定長(HL)に基づいて、各T(n)に対するヒストリースコアH(n)を計算、例えば、感知ユニット2000から各T(n)が受信された順次に計算する。前記HLは、先行フレームの所定の個数を表わす整数である。入ってくるT(n)は、数学的に以前に選択されたグループ主要変換GP(n−1)...GP(n−k)を保存するHLの各々と比較される。ここで、前記kは、1(直前フレーム:n−1を意味する)からHK(時間的により遠いフレーム:n−HK)までの範囲を有する、フレーム時間指数を表わす整数である。フレーム変換候補T(n)は、以前に選択され、保存されているHL個のグループ主要変換(GP(n−1)〜GP(n−HL))とより高い相関を有するほどより高いヒストリースコアH(n)を与えられる。
【0056】
(n)と各GP(n−k)との間の相関係数H(i,k)(n)は、1から、範囲[0、1]内で正規化されたノルム(normalized norm)を差引いた値(1−|T(n)−GP(n−k)|)であり、H(i,k)(n)=1の場合、最も高い相関を指し示す。
【0057】
各相関係数H(i,k)(n)=(1−|T(n)−|GP(n−k)|))の貢献は、相応するヒストリーウエートHW(k)によって重み付けされる。
【0058】
ヒストリースコアH(n)は、全体相関係数であり、ヒストリーウエートHW(k)によって重み付けされた相関係数H(i,k)(n)の和である。ここで、1<k<HLであり、前記HLは、ヒストリー長(以前フレームの個数)である。即ち、

(n)= S[1−|T(n)−GP(n−k)|*HW(k)],
for 1<k<HL.

【0059】
ヒストリーウエートHW(n−HL)〜HW(n−1)は、それらの総和が1になり、ヒストリースコアH(n)出力が非線形的に正規化され、且つ連続した範囲([0、1])を有するように選択されるのが望ましい。
【0060】
図4(B)に示したヒストリースコア計算ユニット4110のハードウェア具現例4110−1は、以前に選択された、HL個のグループ主要変換GP(n−1)〜GP(n−HL)を保存し、比較器4114に並列出力するための、(n−1)〜(n−HL)のHL個のタップを有するFIFO(first−in−first−out)メモリバッファ4111を含む。比較器4114は、現在(フレーム時点n)のインターフレーム変換T(n)を、以前に選択され保存されているHL個のグループ主要変換GP(n−1)〜GP(n−HL)の各々と比較し、ヒストリーウエートHW(n−1)ないしHW(n−HL)によってウェイティングされた各比較結果を、連続区間[0、1]で全体相関係数をヒストリースコアH(n)として出力する全体ヒストリースコア計算器4116に供給する。
【0061】
モーションスコア計算ユニット4120は、各T(n)を受信し、T(n)のみに基づいて、そのモーションスコアM(n)を計算する。他の実施例の場合には、モーションスコア計算ユニット4120は、モーションスコアM(n)を計算するために、感知ユニット2000に保存された情報を受信できる。小さいモーションに対する変換T(n)は、高いモーションスコアM(n)を有し、グループ主要変換GP(n)になる可能性が高い。各インターフレーム変換T(n)に対して、モーションスコア計算ユニット4120は、モーションスコアM(n)を計算する。
【0062】
(n)は、小さいモーションに対応して大きい値を有し、大きいモーションに対応して小さい値を有する。モーションスコアM(n)は、変換の水平、垂直、又は全体線形変位に基づく。モーションスコアM(n)は、線形変位に逆相関し、好ましくは連続区間[0、1]を有するように非線形的に正規化される。
【0063】
特徴スコア計算ユニット4130は、各T(n)を受信し、T(n)のみに基づいて、その特徴スコアF(n)を計算する。他の実施例の場合には、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算するために、感知ユニット2000に保存された情報を受信できる。各インターフレーム変換T(n)に対して、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算する。
特徴スコアF(n)は、各インターフレーム変換T(n)によって代表される特徴点グループを作るためにともにグループ化された特徴点の個数と関連付けられる。変換T(n)は、グループ別特徴点をより多く有するほどより高い特徴スコアF(n)を有する。特徴スコアF(n)は、好ましくは連続区間[0、1]を有するように非線形的に正規化される。
【0064】
規模スコア計算ユニット4140は、各T(n)を受信し、T(n)のみに基づいて、その規模スコアE(n)を計算する。他の実施例の場合には、規模スコア計算ユニット4140は、規模スコアE(n)を計算するために、感知ユニット2000に保存された情報を受信できる。各インターフレーム変換T(n)に対して、規模スコア計算ユニット4140は、規模スコアE(n)を計算する。広い領域をカバーする特徴点を有する変換T(n)は、カバーする領域が大きいほど、より高くスコアリングされる。規模スコアE(n)は、より広い領域をカバーすることに対応してより大きい値を有し、反対により狭い領域をカバーすることに対応してより小さい値を有する。規模スコアE(n)は、その変換のグループに属する全ての特徴点を含む長方形領域の高さと幅との積に関連する。規模スコアE(n)は、好ましくは連続区間[0、1]を有するように非線形的に正規化される。
【0065】
本発明の概念による多様な実施例は、除外しないとビデオ安定化に所望しない結果を引き起こしかねない、全体場面を横切って動く大きな客体を除くために、場面ヒストリー分析を使う。適切な場面ヒストリー分析がなければ、主要変換選択器は、大きな移動客体(特に、それが全体画面をカバーするならば)に対応する変換候補を選択してしまい易い。場面ヒストリー分析を使うならば、大きな客体が横切って動いて全体場面を満たす場合、変換候補T(n)は、不安定カメラに対応する主要変換P(n)を含まないと判断できる。
【0066】
図5は、図1のDIS回路の軌跡ユニット4000のコレクティブ変換スコアリング及び選択回路4200の一実施例のブロック図である。コレクティブ変換スコアリング及び選択回路4200は、コレクティブ判定CD(n)を計算するコレクティブ判定計算器4250と図1のDIS回路のDIS方法の段階としてコレクティブ主要変換CP(n)を出力するコレクティブ変換選択器4260とを含む。
【0067】
図5のコレクティブ判定計算器4250は、特徴点グループ変換品質QFP(n)、タイルグループ変換品質QTile(n)、及び感知ユニット2000から受信された特徴点グループ変換候補の個数KFG(n)からコレクティブ判定CD(n)を算出する。
【0068】
実施例によっては、コレクティブ判定計算器4250は、特徴点グループ変換候補の個数KFG(n)から非線形的に正規化されたフラグメンテーションメジャー(fragmentation measure;Θ(n))を計算し、Θ(n)は、KFG(n)が小さい時に0であり、Θ(n)は、KFG(n)が大きい時に1である。従って、Θ(n)値が1に近いことは、ビデオ場面の全ての特徴点が多くの特徴点グループに分裂されたものを表わし、反対に、Θ(n)値が0に近いことは、ビデオ場面の全ての特徴点が、少ない特徴点グループに分裂されたものを表わす。
【0069】
コレクティブ判定計算器4250は、Q(n)とΘ(n)*Q(n)とを比較することによって、コレクティブ判定CD(n)を出力し、もし、Q(n)>(Θ(n)*Q(n))であれば、コレクティブ判定CD(n)は、特徴点グループを選択するように設定される。そして、もし、Q(n)<=Θ(n)*Q(n)であれば、コレクティブ判定CD(n)は、タイルグループを選択するように設定される。この公式で、もし特徴点グループが分裂されていないならば、Θ(n)値が0に近く、前記特徴点グループは、より選択されやすい。一方、もし特徴点グループが分裂されたならば、Θ(n)値が1に近く、タイルグループ変換品質QTile(n)は、特徴点グループ変換品質QFP(n)と対等の立場で比較される。
【0070】
コレクティブ変換選択器4260は、特徴点グループ主要変換GPFP(n)とタイルグループ主要変換GPTile(n)との間で選択を行う。コレクティブ変換選択器4260は、コレクティブ判定CD(n)によって制御されて、出力コレクティブ主要変換CP(n)は、CD(n)が特徴点グループとして設定される時、特徴点グループ主要変換GPFP(n)として設定され、そうではない場合、タイルグループ主要変換GPTile(n)として設定される。
【0071】
本実施例で、コレクティブ変換スコアリング及び選択回路4200は、特徴点グループ変換品質QFP(n)及びタイルグループ変換品質QTile(n)に基づいて選択を行う。このようなグループ変換品質は、特徴スコア計算ユニット4130と規模スコア計算ユニット4140とからの入力を受信する図4(A)の変換品質計算器4160によって計算される。
【0072】
特徴スコア計算ユニット4130は、その特徴点グループ変換T(FP,i)(n)とタイルグループ変換T(tile,i)(n)の各々の場合について、変換T(n)の特徴スコアF(n)を計算する。本実施例で、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算する目的で感知ユニット2000に保存された情報を受信する。
各インターフレーム変換T(n)に対して、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算する。より多い特徴点又はより多いタイルが属するグループの変換T(n)は、より高い特徴スコアF(n)を有し、これは最終的には、特徴点グループ変換品質QFP(n)又はタイルグループ変換品質QTile(n)の各々がより高くなるように寄与する。
実施例によっては、タイル別特徴点の個数は、特徴点グループ変換T(FP,i)(n)の特徴スコアF(n)を支配できる。他の実施例の場合に、タイルの個数は、タイルグループ変換T(Tile,i)(n)の特徴スコアF(n)を支配できる。タイル別特徴点の個数、及び/又は、タイルベクトルの各グループ内のタイルの個数は、感知ユニット2000から直接得られうる。
【0073】
規模スコア計算ユニット4140は、特徴点グループ変換及びタイルグループ変換の各々の場合について、変換T(n)の規模スコアE(n)を計算する。本実施例で、特徴スコア計算ユニット4130は、規模スコアF(n)を計算するために感知ユニット2000に保存された情報を受信する。特徴点又はタイルのグループ変換は、より広い領域に亘るほどより高くスコアリングされる。
タイルモーションベクトルの各グループ内の、特徴点の個数とタイルの次元は、感知ユニット2000から直接得られうる。同様に、特徴点モーションベクトルの各グループ内の水平及び垂直方向の規模は、感知ユニット2000から直接得られうる。
特徴点グループ又はタイルグループは、より広い領域に亘るほどより高い規模スコアE(n)を有し、その結果、最終的には、特徴点グループ変換品質QFP(n)又はタイルグループ変換品質QTile(n)の各々はより高くなるように寄与する。本実施例で、規模スコア計算ユニット4140は、規模スコアE(n)を計算するために感知ユニット2000から保存された規模情報を受信する。
【0074】
コレクティブ主要変換CP(n)が、コレクティブ変換スコアリング及び選択回路4200によって選択された後、移動客体除外回路4400は、選択されたコレクティブ主要変換CP(n)が全体場面で動き、全体場面をカバーする大型移動客体であるか否かを判断する。前記除外が効果的な場合、単位変換UTが代替物として生成され、DISシステムの補償回路のために選択された主要変換P(n)として提供される結果、安定化されたビデオは、不正確に又は不必要に大型移動客体の変換をしない。
【0075】
実施例によっては、移動客体除外方法は、2種の観測に基づいて活性化される。ここで、前記2種の観測は、既に存在する静止した背景(P(n)のヒストリーによって指し示される)と、静止した背景と大型移動客体が共存している時間の長さである。
【0076】
移動客体除外方法は、下記のシナリオを扱うのに非常に効果的である。
最初の場面は、移動客体があるかないかを問わず、そのほとんどが静止した背景である。次いで大型移動客体が場面に進入し、漸次的により大きな領域をカバーする。次に前記大型移動客体は、(殆ど)全体場面をカバーする。次に前記大型移動客体は、場面を離れ始め、背景が再び表われ始める。最後に前記大型移動客体は、遂に消える。
【0077】
前記移動客体分析器は、以下の手順で、除外シナリオを感知する。
連続して静的なMVグループの存在は、ほとんど静止した背景となる場面を指し示す。
連続して類似した速度のMVグループのカウント増加は、場面内に入ってくる客体を指し示す。
前記傾向が続き、時点nで連続して類似した速度のMVグループが全体場面をカバーし、静的なMVグループが消えれば、前記除外シナリオが検出される。
【0078】
除外判定ED(n)は、除外変換選択器に送られる。除外変換選択器は、ED(n)が除外シナリオを指し示さなければ、コレクティブ主要変換CP(n)を選択し、そのシナリオ内で主要変換P(n)は、基準変換として設定される。従って、大型移動客体が全体場面をカバーする時にも、安定化されたビデオは不正確に大型移動客体に沿わない。
【0079】
図6は、図1のDIS回路の軌跡ユニット4000の移動客体除外回路4400の一実施例のブロック図である。移動客体除外回路4400は、移動客体分析器4470及び図1のDIS回路のDIS方法内の段階を行う除外変換選択器4480を含む。
【0080】
移動客体除外回路4400は、場面のヒストリーを保存するための複数のグループヒストリー回路4410、4420、4430、及び4440、及び移動客体分析器4470を含む。唯一の指定された静的なグループGが常に存在するが、0又はそれ以上の現在モーショングループG(N≧K>0)があり得る。また、次のフレームにおいて、現在モーショングループGのうちの1つになりうる新たなモーショングループGN+1があり得る。(例えば、K(n+1)=K(n)+1)
【0081】
静的なグループGは、関連したグループヒストリーGHを有する。第K番目の現在モーショングループGは、関連したモーションベクトルMだけではなく、関連したグループヒストリーGHも有する。各現在モーショングループGは、基本的にフレームnまで経時的に類似した速度のT(n)の各々に対して低域通過フィルターされた|T(n)|であるモーションベクトルMを有する。
【0082】
各新たなモーショングループGは、その生成の時点で初期化された関連するグループヒストリーGH(n)を有する。移動客体分析器4470は、複数のグループヒストリーGH(n)、GH(n)、...GH(n)、及びGH(n)を含む場面ヒストリーとGH(n)とを受信し、それらから除外判定ED(n)を計算する。
【0083】
除外変換選択器4480は、単位変換UTとコレクティブ主要変換CP(n)との間の選択を行う。除外変換選択器4480は、除外判定ED(n)によって制御されて、ED(n)が活性化された時、出力主要変換P(n)は、単位変換UTとして設定され、そうではない場合、コレクティブ主要変換CP(n)として設定される。単位変換UTは、補償ユニットが補償の間に何もしないようにする。従って、移動客体分析器4470が“大型移動客体”シナリオを感知し、除外判定ED(n)を活性化する時、もしそうではない場合、主要変換P(n)として選択されていたかもしれない大型移動客体の変換は、選択された主要変換P(n)とならずに除外される。実際に、大型移動客体の変換は、それが感知されると、図1の補償ユニット6000によって行われる補償から除外される。
【0084】
図7は、図6の移動客体除外回路4400内のモーショングループヒストリー回路4410〜4440の一実施例で行われる段階を詳しく説明する混合されたブロックダイヤグラムフローチャートである。移動客体除外回路4400は、図1のDIS回路のDIS方法の段階を行う。図7は、静的なグループG、現在モーショングループG、及び新たに生成されたモーショングループGN+1に各々対応する代表的なグループヒストリー回路4410、4430、及び4440を詳しく図示する。
【0085】
図6の移動客体除外回路4400の移動客体分析器4470によってグループヒストリー回路(例えば、4410)から受信されたグループヒストリー(例えば、H(n))は、各グループと関連した2種のヒストリーデータ、選択ヒストリー(例えば、SH(n))と現在ヒストリー(例えば、EH(n))とを含む。
【0086】
移動客体分析器4470は、次のように除外シナリオを感知する。
静的な変換G(n)が、グループヒストリーGH内で、連続して存在し且つ選択されていると指し示されている場合は、複数のフレームに亘りほとんどが静止した背景の場面が存在することを表わす。特定のモーショングループGが、グループヒストリーGH内で、連続して存在し且つ漸次的に増加する場合は、ある客体が場面内に入ってくるということを表わす。もし、存在及びモーションのこの傾向が持続されれば、そして、時点(n)で、静的な変換がGに属しなくなり、且つ選択された変換P(n)がGに属する場合は、大型移動客体シナリオが感知され、活性化された除外判定ED(n)が主要変換選択器4160−2に送られる。もし、ED(n)が大型客体除外シナリオを指し示すならば、主要変換P(n)は、単位変換として設定される。そうではない場合、主要変換P(n)は、あるスコアリング関数によって選択されたいずれかのT(n)になる。
【0087】
グループヒストリー回路4410、4420、4430、及び4440の各々は、受信されたインターフレーム変換T(n)のうち1つに関連した各グループに対して3種類のヒストリー情報の保存及び処理を行う。グループヒストリーの前記3種類とは、選択ヒストリー、現在ヒストリー、及びモーションヒストリーである。静的なグループGは、映像安定化開始時に空ヒストリーとして生成される。静的なグループGのモーションヒストリーは省略され、ヌルと推定されうる。モーショングループG、...、G、...、Gは、DISビデオプロセッシングのコースの間にダイナミックに(dynamically)生成されるか、削除されうる。
【0088】
図7を参照すると、静的なグループG0、N個の現在モーショングループG、及び新たに生成されたモーショングループG(N+1)に各々対応するグループヒストリー回路4410、4430、及び4440は、グループヒストリーGH、GH、及びGH(N+1)を提供する。
【0089】
モーショングループGのグループヒストリー回路4410は、選択ヒストリーSHと存在ヒストリーEHとの保存のためのヒストリーメモリを含む。存在ヒストリーEHは、インターフレーム変換T(n)が以前フレーム内のモーショングループGに結合されたか否かを指し示す過去1フレーム当たり1ビットのデータからなる。選択ヒストリーSHは、モーショングループGに結合されたインターフレーム変換T(n)が以前フレーム内の主要変換P(n)として選択されたか否かを指し示す過去1フレーム当たり1ビットのデータからなる。
【0090】
グループG0はモーションヒストリーMを欠く。何故なら、グループG0は静的と考えているので、選択された主要変換P(n)を含む如何なるT(n)が静的なグループG0に属するか否かの判定(判定段階dS4418)が、T(n)を、多様なヒストリーに基づいたモーションベクトルMと比較するよりは、ある閾値thdと比較することで決められるかえらである。静的なグループGのグループヒストリー回路4410は、静的なグループGは、ビデオ安定化開始時に空のヒストリーとして生成される。
【0091】
もし、フレームnの間にT(n)が、|T(n)|<thdを満足すれば(判定段階dS4418の「はい」分岐)、
このT(n)は、Gに属する。
存在ヒストリーEHは、フレームnで静的な変換の存在を指し示すようにアップデートされる。
もし、P(n)=このT(n)、であれば、選択ヒストリーSHは、このT(n)が選択されたことを指し示すようにアップデートされる。
【0092】
そうではない場合(判定段階dS4418の「いいえ」分岐)、即ち、フレームnの間に、|T(n)|<thd、を満足させなければ、T(n)は、存在モーショングループG〜Gの各々内のグループヒストリーと比較される。
【0093】
モーショングループGのグループヒストリー回路4430は、選択ヒストリーSH、及び存在ヒストリーEH、及びモーションヒストリーMの保存のためのヒストリーKメモリを含む。存在ヒストリーEHは、インターフレーム変換T(n)が以前フレーム内のモーショングループGに属するか否かを指し示す過去1フレーム当たり1ビットのデータからなる。選択ヒストリーSHは、モーショングループGに属したインターフレーム変換T(n)が以前フレーム内の主要変換P(n)として選択されたか否かを指し示す過去1フレーム当たり1ビットのデータからなる。
【0094】
モーションヒストリーMは、グループGの全体的なモーションのベクトルMを指し示す情報を保存する。
各T(n)は、またモーションベクトル(M)にでマッピング(map)する。各モーショングループGは、モーションベクトルMにマッピングする。
|T(n)|を、T(n)のモーションベクトルのサイズとし、|T(n)−M|を、現在モーショングループGのモーションベクトルMからのT(n)の偏差とする(ここで、1≦K≦Nであり、Nは現在の現在モーショングループの個数)。
N個存在するモーショングループのうちから最小の|T(n)−M|を有するモーショングループGは、T(n)が最もマッチングしたグループGを指し示す。この配属(join)判断は、|T(n)−M|を所定の閾値thdと比較して決定されうる。従って、例えば、判定段階dS4438で、もし、1とNとの間の特定のJ及び全てのKで|T(n)−M|≦|T(n)−M|であり、|T(n)−M|<thdであれば(判定段階dS4438の「はい」分岐)、前記T(n)は、現存するモーショングループGに配属される。
【0095】
もし、全てのKに対して、|T(n)−MJ|<thdであり、|T(n)−M|<|T(n)−M|であれば(判定段階dS4438の「はい」分岐)、
(n)は、Gに属する。
モーションヒストリーMは、新たに属したT(n)を反映するように調整される。
現在ヒストリーEHは、フレームnでモーショングループGの存在を指し示すようにアップデートされる。
もし、P(n)=このT(n)、であれば、選択ヒストリーSHは、この、T(n)=P(n)の選択を指し示すためにアップデートされる。
【0096】
一方、もし、判定段階dS4438がT(n)及び全ての現存するモーショングループG〜Gに対して反復され、Mのうち何れも|T(n)−M|<thd、を満足させなかったならば(判定段階dS4438の「いいえ」分岐)、前記T(n)は、新たに形成されたモーショングループGN+1に属する(S4449段階)。もし、このT(n)が、新たに形成されたモーショングループGN+1に属するならば(S4449段階)、
(n)は、新たに形成されたモーショングループGN+1に属する。
モーションヒストリーMN+1は、このT(n)のモーションベクトルとして設定される。
存在ヒストリーEHN+1は、フレームnで新たなモーショングループGN+1の存在を指し示すように初期化される。
もし、P(n)=このT(n)であれば、選択ヒストリーSHN+1は、この、T(n)=P(n)の選択を指し示すようにアップデートされる。
【0097】
ある所定の時間、即ち、ある所定の数のフレームに亘って、何れのあるT(n)も配属されないモーショングループ(G〜Gのうちの)は、削除される。
【0098】
前記開示された発明内容は、あくまでも実施例の説明であると考えられるべきであって、本発明の範囲を制限するものではない。添付の請求項は、本発明の思想と範疇に属する全ての変更、追加、及び他の実施例までを含むものと理解しなければならない。従って、法によって許容される最大の範囲において、本発明の範疇は、後続する請求項及びその均等物を許される限り最広義に解釈することによって決定されなければならず、前述した詳細な説明によって制限、限定されてはならない。
【符号の説明】
【0099】
350 メモリ、RAMメモリ
352 SFP_MVリスト
354 FP MVグループインベントリ
356 タイルMVリスト
358 タイルMVグループインベントリ
1300 モーションベクトル(MV)グループ化回路
1302 ペアリングアルゴリズムコントローラ
1310 モーションベクトル比較器
2000 感知ユニット(DU)
2010 モーションベクトル(MV)グループアフィン変換計算器
3000 特徴点回路
4000 軌跡ユニット(TU)
4100 グループ変換スコアリング及び選択回路
4100−1 タイルグループ変換スコアリング及び選択回路
4100−2 特徴点グループ変換スコアリング及び選択回路
4110−1 ヒストリースコア計算ユニット
4111 FIFOメモリバッファ
4114 比較器
4116 全体ヒストリースコア計算器
4120 モーションスコア計算ユニット
4130 特徴スコア計算ユニット
4140 規模スコア計算ユニット
4150 変換スコア計算器
4160 変換品質計算器
4170 グループ変換及び品質選択器
4200 コレクティブ変換スコアリング及び選択回路
4400 移動客体除外回路
4410 グループヒストリー回路、静的なグループG
4420 グループヒストリー回路、現在モーショングループG
4430 グループヒストリー回路、現在モーショングループG
4440 グループヒストリー回路、新たなモーショングループGN+1
4470 移動客体分析器
4480 除外変換選択器
6000 補償ユニット(CU)
8000 適応的補償フィルター


【特許請求の範囲】
【請求項1】
スコアリング関数を用いて、第1サイズを有するピクセルブロックのモーションベクトルの第1グループのインターフレーム変換(以下、単に変換という)のうちから選択することによって、場面(scene)の第1主要変換を識別する段階を含み、
前記スコアリング関数は、変換特徴点個数スコアと変換規模スコアとのうちの少なくとも1つを含むことを特徴とするビデオデータ処理方法。
【請求項2】
前記ビデオデータ処理方法は、
前記スコアリング関数を用いて第2サイズを有するピクセルブロックのモーションベクトルの第2グループの変換のうちから選択することによって、前記場面の第2主要変換を識別する段階をさらに含み、
前記第2サイズを有する前記ピクセルブロックは、タイルであり、
モーションベクトルの前記第1グループは、T(n)のうちの、変換T(FP,i)(n)を有する特徴点モーションベクトルのグループであり、モーションベクトルの前記第2グループは、T(n)のうちの、変換T(tile,i)(n)を有する重ならないタイルモーションベクトルのグループであり、
ここで、T(n)は、時系列上の第n番目の時点における、第i番目の変換であることを特徴とする請求項1に記載のビデオデータ処理方法。
【請求項3】
前記スコアリング関数は、変換ヒストリースコア、及び変換モーションスコア、変換特徴点個数スコア、及び変換規模スコアのうちの少なくとも1つを含み、
前記変換ヒストリースコアリング関数は、|T(n)−P(n−k)|に基づいてT(n)とP(n−k)との間の相関係数H(i,k)(n)を計算する段階を含み、
ここでP(n−k)は、時系列上の第(n−k)番目の時点における前記第1又は第2主要変換であり、
(n)の変換ヒストリースコアH(n)は、1と前記変換ヒストリーの所定長(HL)との間の全てのkに対するH(i,k)(n)の加重和である全体相関係数であることを特徴とする請求項2に記載のビデオデータ処理方法。
【請求項4】
前記スコアリング関数は、変換モーションスコア、及び変換ヒストリースコア、変換特徴点個数スコア、及び変換規模スコアのうちの少なくとも1つを含み、
前記変換モーションスコアリング関数は、前記変換の水平の線形移動であるT(n)の変換モーションスコアM(n)を計算する段階を含み、
変換モーションスコアM(n)は、連続した範囲[0、1]内で非線形的に正規化されていることを特徴とする請求項2に記載のビデオデータ処理方法。
【請求項5】
前記スコアリング関数は、変換特徴点個数スコア、及び変換ヒストリースコア、変換モーションスコア、及び変換規模スコアのうちの少なくとも1つを含み、
前記変換特徴スコアリング関数は、前記変換と関連した特徴点の個数であるT(n)の変換特徴スコアF(n)を計算する段階を含み、
変換特徴スコアF(n)は、[0、1]の範囲内で非線形的に正規化されていることを特徴とする請求項2に記載のビデオデータ処理方法。
【請求項6】
前記スコアリング関数は、変換規模スコア、及び変換ヒストリースコア、変換モーションスコア、及び変換特徴点個数スコアのうちの少なくとも何れか1つを含み、
変換規模の前記関数は、T(n)の変換規模スコアE(n)は、前記変換内の前記特徴によってカバーされる領域であり、
変換規模スコアE(n)は、[0、1]の範囲内で非線形的に正規化されていることを特徴とする請求項2に記載のビデオデータ処理方法。
【請求項7】
前記スコアリング関数は、変換ヒストリースコアH(n)、変換モーションスコアM(n)、変換特徴点個数スコアF(n)、及び変換規模スコアE(n)を含み、
前記スコアリング関数H(n)、M(n)、F(n)、及びE(n)のうちの少なくとも2つの最も高い組合わせを有する前記変換T(n)は、前記主要変換P(n)として選択されることを特徴とする請求項1に記載のビデオデータ処理方法。
【請求項8】
前記ビデオデータ処理方法は、前記主要変換P(n)をカメラ動きに対して補償するように処理する段階をさらに含むことを特徴とする請求項7に記載のビデオデータ処理方法。
【請求項9】
前記ビデオデータ処理方法は、
前記場面内の大型移動客体(objects)を識別する段階と、
前記大型移動客体と対応する主要変換P(n)を除く(exclude)段階と、
をさらに含むことを特徴とする請求項1に記載のビデオデータ処理方法。
【請求項10】
前記大型移動客体を識別する段階は、各T(n)に対して、現存するモーショングループのヒストリーと現存する静的なグループの場面ヒストリーとを比較する段階を含むことを特徴とする請求項9に記載のビデオデータ処理方法。
【請求項11】
前記ビデオデータ処理方法は、T(n)の計算された変換品質Q(n)が所定の閾値より小さければ、変換T(tile,i)(n)のうちから前記主要変換P(n)を選択する段階をさらに含み、
前記変換品質Q(n)は、前記変換点グループ内の変換点の個数と変換T(FP,i)(n)の前記変換点グループの前記規模とに基づくことを特徴とする請求項2に記載のビデオデータ処理方法。
【請求項12】
第1サイズを有するピクセルブロックに基づいて、場面のモーションベクトルの第1グループを保存し、第2サイズを有するピクセルブロックに基づいて、前記場面のモーションベクトルの第2グループを保存する第1メモリと、
ビデオデータ処理方法を行うプロセッサによって実行される保存されたプログラムを有する第2メモリと、を含み、
前記ビデオデータ処理方法は、
変換ヒストリースコア、変換モーションスコア、変換特徴点個数スコア、及び変換規模スコアのうちの少なくとも2つを含むスコアリング関数を用いて、前記第1モーションベクトルグループの前記変換のうちから選択することによって、第1主要変換を識別する段階と、
前記スコアリング関数を用いて第2サイズを有するピクセルブロックのモーションベクトルの第1グループの前記変換のうちから選択することによって、第2主要変換を識別する段階と、
を含むことを特徴とするイメージ処理回路。
【請求項13】
前記第2サイズを有する前記ピクセルブロックは、タイルであり、モーションベクトルの前記第1グループは、T(n)のうちから変換T(FP,i)(n)を有する特徴点モーションベクトルのグループであり、
モーションベクトルの前記第2グループは、T(n)のうちから変換T(tile,i)(n)を有する重ならないタイルモーションベクトルのグループであり、
ここで、T(n)は、時系列上の第n番目の時点における、第i番目の変換であることを特徴とする請求項12に記載のイメージ処理回路。
【請求項14】
変換ヒストリーの前記関数は、|T(n)−P(n−k)|に基づいて、T(n)とP(n−k)との間の相関係数H(i,k)(n)を計算する段階を含み、
(n)の変換ヒストリースコアH(n)は、1と前記変換ヒストリーの所定長(HL)との間の全てのkに対するH(i,k)(n)の加重和である全体相関係数であることを特徴とする請求項13に記載のイメージ処理回路。
【請求項15】
前記変換モーションスコアリング関数は、
前記変換の前記水平的な線形移動であるT(n)の変換モーションスコアM(n)と、
前記範囲[0、1]内でモーションスコアM(n)は、非線形的に正規化されていることを特徴とする請求項13に記載のイメージ処理回路。
【請求項16】
前記変換特徴スコアリング関数は、前記変換と関連した変換点の個数であるT(n)の変換特徴スコアF(n)を計算する段階を含み、変換特徴スコアF(n)は、前記範囲[0、1]内で非線形的に正規化されていることを特徴とする請求項13に記載のイメージ処理回路。
【請求項17】
前記変換規模スコアリング関数は、前記変換内の前記特徴によってカバーされる前記領域であるT(n)の変換規模スコアE(n)を計算する段階を含み、変換規模スコアE(n)は、前記範囲[0、1]内で非線形的に正規化されていることを特徴とする請求項13に記載のイメージ処理回路。
【請求項18】
前記スコアリング関数H(n)、M(n)(n)、F(n)、及びE(n)のうちの少なくとも2つの最も高い組合わせを有する前記変換T(n)は、前記主要変換P(n)として選択される請求項12に記載のイメージ処理回路。
【請求項19】
前記イメージ処理回路は、前記主要変換P(n)をカメラ動きに対して補償するように処理する段階をさらに含むことを特徴とする請求項18に記載のイメージ処理回路。
【請求項20】
前記イメージ処理回路は、
前記場面内の大型移動客体を識別する段階と、
前記大型移動客体と対応する主要変換P(n)を除く段階と、
をさらに含むことを特徴とする請求項12に記載のイメージ処理回路。
【請求項21】
前記大型移動客体を識別する段階は、各T(n)に対して、現存するモーショングループのヒストリーと現存する静的なグループの場面ヒストリーとを比較する段階を含むことを特徴とする請求項20に記載のイメージ処理回路。
【請求項22】
前記イメージ処理回路は、T(FP,i)(n)の変換を有する特徴点グループ内の特徴点の個数に基づき、T(FP,i)(n)の変換を有する前記特徴点グループの前記規模に基づいた信頼(confidence)スコアが所定の閾値より小さければ、変換T(tile,i)(n)のうちから前記主要変換P(n)を選択する段階をさらに含むことを特徴とする請求項13に記載のイメージ処理回路。
【請求項23】
もしも、
連続した静的なモーションベクトルグループの存在が殆ど静止した背景を含む現存場面(existed scene)を指し示し、
或る一つの客体が、前記場面内に進入すると感知され、
時間nで連続した類似した速度のモーションベクトルグループが、前記場面の全体をカバーし、
前記静的なモーションベクトルグループが存在しなくなる、
場合には、前記主要変換が除外される、ことを特徴とする請求項20に記載のイメージ処理回路。
【請求項24】
第1時点ムと第2時点とで場面のイメージを撮影し、前記撮影されたイメージをイメージデータの第1及び第2フレームに変換するイメージセンサー回路と、
イメージ処理回路と、を含み、前記イメージ処理回路は、
第1サイズを有するピクセルブロックに基づいて、前記場面のモーションベクトルの第1グループを保存し、第1サイズを有するピクセルブロックに基づいて、前記場面のモーションベクトルの第2グループを保存する第1メモリと、
ビデオデータ処理方法を行うプロセッサによって実行される保存されたプログラムを有する第2メモリと、を含み、
前記ビデオデータ処理方法は、
変換ヒストリースコア、変換モーションスコア、変換特徴点個数スコア、及び変換規模スコアのうちの少なくとも2つを含むスコアリング関数を用いて、前記第1モーションベクトルグループの前記変換のうちから選択することによって、第1主要変換を識別する段階と、
前記スコアリング関数を用いて、前記第2モーションベクトルグループの前記変換のうちから選択することによって、第2主要変換を識別する段階と、
を含むことを特徴とするカメラ。
【請求項25】
前記スコアリング関数は、連続した関数であることを特徴とする請求項24に記載のカメラ。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−165364(P2012−165364A)
【公開日】平成24年8月30日(2012.8.30)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−280088(P2011−280088)
【出願日】平成23年12月21日(2011.12.21)
【出願人】(390019839)三星電子株式会社 (8,520)
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
【住所又は居所原語表記】129,Samsung−ro,Yeongtong−gu,Suwon−si,Gyeonggi−do,Republic of Korea
【Fターム(参考)】