説明

適応フィルタリングを利用したデジタルイメージ安定化方法

【課題】補償ウィンドウオーバーエクスカーションのヒストリー(history)に基づいてビデオフレームの場面で止められた/背景客体を代表する主要(principal)変換/補償変換P(n)を適応的にフィルタリングする段階を含むデジタルイメージ安定化方法を提供する。
【解決手段】デジタルイメージ安定化方法ビデオは、タイルモーションベクトル(Tile MV)グループの複数の変換のそれぞれと特徴点モーションベクトル(FP MV)グループのそれぞれとのスコアリングに基づいて、フレームの場面内の停止/背景客体を表わす主要変換を選択する段階と、停止(背景)グループのヒストリーと複数のモーションベクトルグループのそれぞれのヒストリーとに基づいて大型移動客体を除外させる段階と、を含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の概念は、デジタルイメージ安定化(digital image−stabilization、DIS)に関し、特に、キャプチャーされたビデオフレーム(captured video frames)の補償ウィンドウ(compensationwindows)のオーバーエクスカーション(over−excursion)を減らすための方法に関する。
【背景技術】
【0002】
デジタルカメラ、デジタルビデオカメラ、及びこのようなカメラを含むハンドヘルドデバイス(hand−held devices)は、カメラが、操作者の手で動作される間に、イメージまたはビデオをキャプチャー(capture)するために度々使われる。そのため、ビデオカメラは、イメージまたはビデオをキャプチャーする間に、手ぶれや、ジッタ(jitter)が発生しうる。ジッタ(jitter)は、水平成分、垂直成分、及び回転成分を含みうる。ジッタは、ハンドキャプチャードビデオ(hand−captured video)を、これを見る人にディストラクティング(distracting)またはディスオリエンティング(disorienting)するように作ることができ、したがって、デジタル的にカメラ軌跡を推定し(すなわち、連続したフレームの各対の間から検出されたジッタ)、同じ場面(scene)のビデオフレームのシーケンス(sequence)からジッタをフィルタリング(filter out)するためのデジタル回路を使うことが要求される。
【0003】
静的もしくは動的に安定したビデオカメラによって製作されたビデオは、キャプチャーされたビデオに主に滑らかなモーション、例えば、並進(translation)または回転(rotational)を含んでいる。一方、不安定なビデオカメラは、ビデオイメージの全体に亘って高周波数のジッタ(並進及び/または回転)を含むビデオとなる。
【0004】
デジタルイメージ安定化(DIS)システムは、まず所望しない(意図されていない)モーション(motion)を推定した後、訂正をイメージシーケンスに適用する。正確なグローバルモーション(global motion)の推定(カメラ軌跡推定)は、ビデオ安定化アルゴリズムの核心である。安定化されたビデオの視覚的効果は、カメラ軌跡推定の質に大きく依存する。カメラ/場面のグローバルモーションは、意図されたグローバルモーション、例えば、パンニング(panning)グローバルモーションと意図されていないグローバルモーション、例えば、ジッタリ(jittery)グローバルモーションとを区別するために分析され、補償変換P(n)は、意図されていないジッタリモーションを補償するために生成される。ビデオ安定化アルゴリズムは、ユーザが所望するカメラモーションが保持される間にジッタモーションを除去する。一般的に、カメラモーションが遅く線形的であるか、単調な間に、迅速で(すなわち、高周波数の)非線形的な手ぶれまたはプラットフォームの振動によってジッタが引き起こされる。グローバルモーション(カメラ軌跡)ベクトルは、マッチングされる特徴点ペア(feature point pair)を使って隣接したフレームの間で計算された補償変換P(n)のアフィン変換パラメータ(affine transformationparameters)に含まれる。
【0005】
前記補償変換P(n)は、アフィン変換であり得る。数学で、アフィン幾何学は、アフィン変換によって変わらないように保持される幾何学的性質、すなわち、非特異線形変換及び変形(non−singular linear transformationand translation)の研究である。アフィン行列と呼ばれる数字で表われる係数によって定義される方程式の数学的システムは、連続したフレームの各ペア(pair)の間で、またはこれらの一部(例えば、フレーム内の移動客体)の間で感知された移動の側面(lateral、例えば、上/下)、回転、及びスカラー(scalar、例えば、ズームイン(zoom in)またはズームアウト(zoom out))の性質を表わすために発展した。したがって、カメラジッタの補償のための補償変換P(n)は、画面で実際に止められたある客体(例えば、岩、テーブル、駐車された車、山、太陽)に関連した第1アフィン変換行列(Affine transform matrix)に特性化されうる。ほとんどの場合に、手ぶれとプラットフォームの振動の結果からビデオフレームの並進、回転、及びスケーリング(scaling)が発生する。このようなものなどをモデリング(modeling)するために、6つのパラメータ(parameter)のアフィン変換が要求される。
【0006】
たとえ補償変換P(n)が所望しないジッタモーションに対する補償を行うために正確に生成されても、その結果の補償フレームは、キャプチャーされた入力ビデオフレームに関連した意味のあるオシレーティング(oscillating)動きを有し、キャプチャーされた入力ビデオフレームで使用可能なイメージデータを超えて拡張されうる。この結果、補償ウィンドウ(window)のオーバーエクスカーションが発生することがある。
【0007】
ビデオに含まれたジャーキーモーション(jerky motion)を除去するために、補償ユニット(compensation unit)は、各入力ビデオフレームの境界地域(boundary regions)の一部を切り取る(crop)。除去された境界地域の量は、クロッピング比率(cropping ratio)によって計量されうる。大きなクロッピング比率は、境界のさらに多い領域が除去されることを意味する。
【0008】
出力ビデオフレームは、入力ビデオフレームに重なった補償ウィンドウとしてモデリングされうる(例えば、図1の場合)。例えば、補償ウィンドウは、入力ビデオフレームに対して回転、シフト(shift)、スケーリングされうる。
【0009】
与えられたクロッピング比率に対して、補償ウィンドウの動きの量は、補償ウィンドウエクスカーション(compensation window excursion)と呼ばれる。入力ビデオフレーム境界を越えた補償ウィンドウの動きは、補償ウィンドウオーバーエクスカーション(compensation window over−excursion)と呼ばれる。
【0010】
もし、ジッタがなければ(例えば、所望していないカメラ軌跡がなければ)、補償変換P(n)(実際に止められた客体(actually−stationary objects)の特徴点に基づいた)は、少なくとも2つ以上のフレームのそれぞれで同じ位置になると予想することができる。もし、高周波数のジッタがあれば、減少したディグリー(degree)または減少した周波数の補償ウィンドウオーバーエクスカーションを有する空間的に安定した(spatially stabilized)ビデオとすることが要求される。
【0011】
十分ではないビデオ安定化とオーバーエクスカーションとの間で、適応的に均衡を取るフィルタリング(filtering)方法の要求が存在する。
【発明の概要】
【発明が解決しようとする課題】
【0012】
本発明は、上記従来技術に鑑みてなされたものであって、本発明の目的は、補償ウィンドウオーバーエクスカーションのヒストリー(history)に基づいてビデオフレームの場面で止められた/背景客体を代表する主要(principal)変換/補償変換P(n)を適応的にフィルタリングする段階を含むデジタルイメージ安定化方法を提供することにある。
【0013】
また、本発明の目的は、強補償(strong compensation、SC)フィルターを用いて高効率と予測可能なジッタ除去方法とを提供することにある。前記SCフィルターは、高周波数−選択的な高次線形時不変デジタルフィルター(highly frequency−selective high−order linear time−invariant digital filter)である。前記SCフィルターを使ったジャーキー入力ビデオの効果的なフィルタリングは、キャプチャーされた入力ビデオフレームの間の補償ウィンドウの意味のある動きを意味する。与えられたクロッピング比率に対して、前記補償ウィンドウの動きの量は、補償ウィンドウエクスカーション(excursion)と呼ばれる。キャプチャーされた入力ビデオフレーム境界を越えた補償ウィンドウの動きは、補償ウィンドウオーバーエクスカーションと呼ばれる。入力ビデオの大きな移動のための前記SCフィルターの厳格な適用は、さらに多い補償ウィンドウオーバーエクスカーションの代価で非常に安定した出力ビデオを生産する。一方、さらに低い周波数−選択的な(lower frequency−selective)特性を有する弱補償(weak compensation、WC)フィルターは、さらに低い安定性の出力ビデオの代価でさらに低い補償ウィンドウオーバーエクスカーションを生産する。
【0014】
また、本発明の目的は、優れたビデオ安定性の特性を保持する一方、入力ビデオの大きな動きとともに発生する過度なオーバーエクスカーションを防止するために構成される適応的補償(adaptive compensation、AC)フィルターを提供することにある。
【課題を解決するための手段】
【0015】
上記目的を達成するためになされた本発明の一実施態様による線形時不変フィルター(linear time−variant filter)は、予測可能な特性を提供するために、SCフィルターを補完するWCフィルターを含む。WCフィルターとSCフィルターとの組み合わせは、複数のKフレームの間に補償ウィンドウエクスカーションのヒストリーに基づいて制御される。ヒストリー内の小さなエクスカーションは、現在フレームnに対するSCフィルターの大きな影響を許容する一方、ヒストリー内の大きなエクスカーションは、現在フレームnに対するWCフィルターの大きな影響を妥当なものに作る。ヒストリー内の中間値(medium)のエクスカーションは、SCフィルターとWCフィルターとの比例的な影響を配分する。
【0016】
上記目的を達成するためになされた本発明の一実施態様による線形時不変フィルターに含まれたDIS方法を行うためのデジタルイメージ安定化回路は、ビデオカメラ内に含まれ、キャプチャーされたビデオフレームの保存に先立って(例えば、ビデオカメラがリアルタイムMPEGエンコーダ(encoder)を含むとすれば、MEPGエンコーディング(encoding)に先立って、またはMPEGエンコーディングを行う間に)、リアルタイムでジッタを除去することに活性化されうる。選択的に連続したビデオフレームのカメラ軌跡を推定し、ビデオフレームの保存されたシーケンスからジッタをフィルタリングできるDIS回路は、デジタルイメージ安定化方法を行うのに最適化されたASIC(application specific integrated circuit)に具現されたMEPGビデオエンコーダのように、一般的な目的のデジタルイメージ安定化方法を具現するためのソフトウェアによって制御されるマイクロコンピュータ(microcomputer)または専用ハードウェアであり得る。
【0017】
本発明の概念による実施形態の特徴は、計算された主要変換/補償P(n)変換を計算し、オーバーエクスカーションの除去に最適化されたフィルタリングされた主要/補償P’(n)を出力するためのフィルタリング強度を選択するための補償ウィンドウオーバーエクスカーションヒストリーデータの連続した保存である。
【0018】
前記方法は、垂直方向−上側、垂直方向−下側、水平方向−右側、及び水平方向−左側を同時に測定し、フィルタリング係数E(n)を選択するために、それらのうちから極点(peak)を検出する。
【図面の簡単な説明】
【0019】
本発明の詳細な説明で引用される図面をより十分に理解するために、各図面の詳細な説明が提供される。
【0020】
【図1】本発明の概念の実施形態によるデジタルイメージ安定化(DIS)方法を行うDIS回路のブロック図である。
【図2】複数のタイルベクトルグループ(tile vector groups)のアフィン(affine)変換を演算するための図1に示されたDIS回路に含まれた感知ユニットのブロック図である。
【図3】図1に示されたDIS回路に含まれたタイルグループ変換と特徴グループ変換T(n)とのスコアリング(scoring)に基づいて主要(固定/背景)変換P(n)を選択するための軌跡ユニットの一実施形態によるブロック図である。
【図4】(A)は、図1に示されたDIS回路のDIS方法の段階を行うための本発明の一実施形態によるグループ変換スコアリング(group transform scoring)及び選択回路のブロック図である。(B)は、本発明の一実施形態によるヒストリースコア(story score)計算ユニットのブロック図である。
【図5】本発明の一実施形態によるコレクティブ変換スコアリング(collective transform scoring)及び選択回路のブロック図である。
【図6】本発明の一実施形態による移動客体除外回路(moving object exclusion circuit)のブロック図である。
【図7】本発明の概念の一実施形態による処理段階を示すフローチャートである。
【図8】キャプチャーされたビデオフレームと本発明の概念の一実施形態によるDIS方法に含まれた段階で計算される補償ウィンドウとを示す図である。
【図9】DISを行うDISモジュールのブロック図である。
【図10】本発明の概念の一実施形態による適応的補償フィルターモジュールのブロック図である。
【図11】本発明の概念の一実施形態による適応的補償フィルターモジュールの概略的なブロック図である。
【発明を実施するための形態】
【0021】
本発明の一実施形態によって、各キャプチャーされたビデオフレームは、デジタルイメージ安定化に適するように優れた特徴点分布(feature point distribution)を提供する特徴点をアルゴリズム的に選択する目的で、少ない数の重ならないタイル(tiles、典型的に、標準画質のための4×4タイル、及び高画質のための6×6タイル)に分けられる。
前記イメージの他の部分は、適した特徴点の他の密度を有しうる。極端的な場合、例えば、雲一つない青空の場合に、フレームの部分は、如何なる適した特徴点を有さないこともある。他の部分で、潜在的な特徴点は、非常に稠密である。
【0022】
得られた特徴点分布は、ビデオフレーム、例えば、重ならないタイルの小さな部分に基づき、各タイル内の特徴点の個数が、前記タイルの発光イメージデータの分散σによって線形的に増加する。さらに関心のあるイメージデータのタイルと、それによるさらに多い特徴点に対する要求は、さらに高い分散σを有することが予測される。同時に係留中である出願番号8729−357(“デジタルイメージ安定化装置及び方法”)を見れば、同時に、単に小さなローカル状態情報のみを要求するにもかかわらず、各タイルに含まれた特徴点の間の最小距離(MIN_DIST)を設定することによって、ハードウェア具現コストを減少させる過程が描写されている。前記出願番号8729−357の公開文献は、参照文献としてこれに含まれる。
【0023】
もし、場面が低光条件(low light condition)でキャプチャーされれば、それは、相対的にさらに多いノイズを有し、特徴点のピクセル(pixels)の個数は、タイル内のピクセルの個数より遥かに少ないために、ノイズ効果は、タイルより特徴点にさらに大きく作用する。タイル内のピクセルのさらに大きな個数は、ノイズ消去効果を提供し、このような場合に、ダウンサンプリングされたタイル基盤モーションベクトル(downsampled tile−based motionvector)がさらに正確である。
【0024】
たとえ場面が低光条件でキャプチャーされないとしても、もし場面が過度にフラット(flat)になれば、タイル基盤モーションベクトル(tile−based motion vector)は、さらに正確である。もし、タイル場面が、曇った空または青い空のように非常にフラットになれば、若干の特徴点があり、フラットタイル(flat tile)内のこのような特徴点は、次のフレーム内の多くの場所内のマッチング点(matching point)と類似したレベルを見つけることができる。しかし、タイル基盤マッチング(tile−based matching)は、小さな特徴点探索領域にのみ依存するものではなく、タイルのあらゆるパターンが、タイルマッチングプロセスに貢献することができる。結果的に、タイル基盤モーションベクトルは、場面がフラットになる時にさらに信頼することができる。
【0025】
特徴点モーションベクトルグループ(feature point motion vector groups)の最も高いスコアがスレショルド値(threshold)より小さい時、我々は、特徴点基盤モーションベクトルの代わりに、タイル基盤モーションベクトル(tile−based motion vectors)を使うように決定し、このような方策は、高いノイズまたはフラットな場面で効果的に作用する。
【0026】
本発明の概念の実施形態によって、我々は、背景と大きな客体の動きとを表わす推定されたモーションベクトルを選択する一方、さらに小さな物体は、それらと関連した正確なモーションベクトルを有する必要がない。さらに小さな客体に対するある不正確なベクトルは、DISアルゴリズムの以後の段階で除去されうる。
【0027】
グローバル動き(global movement)またはカメラ動き(cameramovement)のために、意味のある(of significance)大きな静的な物体の特徴点は、一貫した経路を移動することが予測される。我々は、独立して動く十分に大きな物体は、少なくとも1つのタイルのほとんどをカバー(cover)することを認知し、したがって、小さな物体のモーションがタイル自体のモーションベクトルで少ない効果を有する限り、それらのモーションは、タイル自体の優勢(predominate)モーションとして推定されうる。
【0028】
我々は、最低の解像度でブロックマッチング(block matching)を用いてタイル毎に1つのモーションベクトルを得る。タイル基盤モーションベクトルは、高いノイズまたはフラット場面ビデオのような特別な場合でのカメラ軌跡決定のために使われる。
【0029】
与えられたタイルに対するモーションベクトルは、絶対差の和(sum of absolute difference:SAD)を最小にすることである。そして、各タイル内の特徴点のモーションベクトルを計算するプロセスは、階層的モーション推定アルゴリズムの使うことによって、そして、タイルのモーションベクトルを開始ベクトルとして使って、ローカル動き上のタイル動きを使用して(preferring)、計算量を減らすように変更されうる。少なくとも一つのタイルのほとんどをカバーする十分に大きな物体は、燐接したタイルに確張することができるために、各タイル内のいくつかの特徴点は、それらが発見されたタイルのモーションベクトルより燐接したタイルのモーションベクトルにさらに強く関連づけることができる。したがって、あらゆる隣接したタイルのモーションベクトルを、ある与えられたタイルの特徴点のモーションベクトルに対するブロックマッチング探索のマルチプル(multiple)開始ベクトルとして使うことが効果的である。したがって、選択された特徴点のモーションベクトルを得るために使われる開始ベクトルは、それが存在するならば、四方向の直接的な隣接タイル(上側タイル、左側タイル、右側タイル、下側タイル)に属するモーションベクトルと同様に特徴点が属するタイルのモーションベクトルである。使われる開始ベクトルごとに、我々は、単に特徴点モーションベクトルに対するローカル探索(local search)のために、非常に小さな範囲を使う。これの目的は、それぞれの、そして、あらゆる特徴点に対する正確なベクトルを決定するものではない(バッド(bad)モーションベクトルは、DISプロセッシングチェーン(chain)内において後で分類される)。むしろ、関心のある特徴点は、単に背景または大きな客体に属するものである。そのような特徴点に対して、タイルモーションベクトルのうちの1つは、良いか、関心のある特徴点のモーションベクトルに近くなければならず、それにより、各選択されたタイルモーションベクトルに対する小さなローカル探索は十分である。小さなローカルブロックマッチング探索(small local block matching search)は、タイル内のあらゆる選択された特徴点に対する開始ベクトルの集合(set)のそれぞれ周辺の高解像度ドメイン(これは、オリジナルビデオ解像度、または2または4のfs3要素によって副標本化された(subsampled)ものであり得る)で行われる。
【0030】
図1は、本発明の概念の実施形態と関連したDIS方法を行うデジタルイメージ安定化(DIS)回路のブロック図である。前記DIS回路は、受信されたジャーキービデオ(jerky video)を分析し、インターフレーム変換(inter−frame transforms;T(n))を出力する感知ユニット(detection unit)2000、インターフレーム変換T(n)のうちから選択された主要変換/補償変換P(n)を出力する軌跡ユニット(trajectory unit)4000、及び選択された主要変換/補償変換P(n)を用いて、ジャーキービデオを修正して安定化したビデオを出力する補償ユニット(compensation unit)6000を含む。
【0031】
感知ユニット2000は、ビデオデータの受信されたフレーム内の特徴点(FP)のインターフレームモーションベクトルと重ならないタイル(タイルベクトル)のインターフレームモーションベクトルとを推定する。感知ユニット2000は、FPモーションベクトルグループ変換(FP motion vector group transforms)とタイルベクトルグループ変換T(n)とをさらに出力する。
【0032】
軌跡ユニット4000は、インターフレーム変換T(n)のうち1つを主要変換P(n)として選択し、小さな移動客体と動いて全体フレームをカバーすることができる大きな移動客体のインターフレーム変換を除く。
【0033】
図2は、図1のDIS回路のDIS方法の段階としてタイルベクトルグループのアフィン変換を計算する図1のDIS回路内の感知ユニットのブロック図である。感知ユニット2000は、特徴点回路(feature point circuit)3000、モーションベクトル(MV)グループ化回路(motion vector(MV)grouping circuit)1300、及びモーションベクトル(MV)グループアフィン変換計算器(motion vector(MV)group affine transform calculator)2010を含む。
【0034】
特徴点回路3000は、ビデオデータの各フレームを受信し、各ビデオフレームを重ならないタイルの小さな数字j×kで割る。タイルの個数j×kは、SDビデオ(standard definition video)のための4×4からHDビデオ(High−definition video)のための6×6までの範囲を有し、(4..8)×(4..8)の範囲内の他の数字も可能であり、有利である。前記タイルサイズは、独立して動く十分に大きな物体が少なくとも1つのタイルのほとんどをカバーできるように選択され、小さな客体のモーションは無視してもよい一方、十分に大きな客体のモーションは、DIS目的によってキャプチャーされうる。特徴点回路3000は、受信されたビデオフレーム内の特徴点(SFPs)を識別して選択し、特徴点とタイルのモーションベクトル(SFP MVs and Tile MVs)とを出力する。
【0035】
特徴点回路3000は、特徴点選択器(feature point selector)とモーションベクトル計算器(motion−vector calculator)と共有されたRAMメモリ350とを含む。特徴点選択器は、ハリスコーナー特徴点候補識別器(Harris−Corner feature point candidate identifier)、及び特徴点候補分類器(feature point candidate sorter)をさらに含む。コンピュータパワー(computational power)を節約し、要求される複数の動作(operations)の個数を減少させるために、特徴点回路3000は、ルーマ(luma)データにのみ動作し、1つ以上のダウンサンプラー(downsamplers)及び階層的ブロックマッチング探索ユニット(hierarchical block−matching search unit)を含む。
【0036】
特徴点回路3000は、あらゆるタイルに対する1つのモーションベクトルを推定する。タイルモーションベクトル(Tile MV)推定は、入力イメージの中央をカバーする重ならないタイル(例えば、特徴点分類アルゴリズム(feature point sorting algorithm)内に使われる同じタイル)に基づいて行われる。タイルのそれぞれに対して、フルブロックマッチング探索(full blockmatching search)は、十分にダウンサンプリングされた(down sampled)イメージに行われる。フル探索ブロックマッチング(full−search block matching)は、あらゆるタイルに対して行われ、タイルモーションベクトル(Tile MV)は、以後の使用、例えば、特徴点(352に保存されたSFP MV)のモーションベクトルを得るか、静的な客体感知のための階層的ブロックマッチング探索ユニット内で開始ベクトルとしての使用のために保存される(356)。
【0037】
特徴点回路3000は、望ましくは、ビデオフレームのタイルと呼ばれる小さな部分(タイル)に基づいた分布を有する特徴点のリスト352を提供する。タイル別特徴点の最大個数は、タイルの発光イメージデータ(luminance image data)の分散σによって線形的に増加する。DIS方法のための優れた特徴点は、適したモーション推定アルゴリズムが適用される時、曖昧ではない(non−ambiguous)モーションベクトルを算出する点である。イメージ内の特徴点を識別するために、ハリスコーナー感知アルゴリズム(Harris Corner detection algorithm)は、このようなピクセルが特徴点として如何ほど適するかを測定するために、ビデオフレームのピクセルに適用される。イメージの相異なる部分(タイル)は、識別された特徴点候補の相異なる密度を有しうる。
【0038】
特徴点回路3000は、好ましくは、各タイルのモーションベクトルを計算するためのタイルベクトル計算器(tile−vector calculator)の関数を行うモーションベクトル計算器(motion−vector calculator)及び各選択された特徴点(selected feature point;SFP)のモーションベクトルを決定し、出力するための階層的ブロックマッチング検索ユニット(hierarchical block−matching search unit)を含む。タイルベクトル計算器は、現在フレーム(F)の十分にダウンサンプリングされたルーマデータを使って、各タイルのモーションベクトルを計算する。階層的ブロックマッチング検索ユニットは、最大解像度のまたは2つの連続したフレームのダウンサンプリングされたルーマデータを用いて選択された特徴点のそれぞれのモーションベクトルを決定し、タイルベクトルを開始ベクトルとして使用できる。
【0039】
データに関連したあらゆる特徴点とタイルは、次のDISブロック、具体的に、モーションベクトルグループ化回路(motion vector grouping circuit)1300に伝達される。
【0040】
モーションベクトルグループ化回路1300は、FPモーションベクトルとタイルモーションベクトルとに対してグループ化アルゴリズムを行う。モーションベクトルグループ化回路1300は、ペアリングアルゴリズムコントローラ(pairing algorithm controller)1302によって選択されたベクトルの各対を比較することによって、グループ化決定(grouping decisions)を行うモーションベクトル比較器(motion vector comparator)1310を含む。
【0041】
特徴点グループ化回路(feature point grouping circuit)1300は、連続したビデオフレームの間で客体の認知された(perceived)関連動作に基づいて、FPモーションベクトルを場面内の客体とともに選択された特徴点(SFPs)のモーションベクトルで関連するようにグループ化する。特徴点グループ化回路1300は、また連続したビデオフレームの間で客体の認知された関連動作に基づいて、タイルモーションベクトルを場面内の客体と関連するようにグループ化する。
【0042】
特徴点グループ化回路1300は、RAMメモリ350を特徴点回路3000と共有する。メモリ350のSPF MVリスト(SPF MV list)352部分は、選択された特徴点(SFPs)の位置とモーションベクトルのリストとを含む。メモリ350のタイルMVリスト(tile MV list)356部分は、重ならないタイルの位置とモーションベクトルのリストとを含む。
【0043】
ペアリングアルゴリズムコントローラ(pairing algorithm controller)1302は、ある特徴点とタイル(モーションベクトル)とがある他のものと以前にペアリングされたか、如何なるものがアンペア(unpair)として残ったか、及び如何なるものが全体的にグループ化から除外されるかについてのトラックを保持する。ペアリングアルゴリズムは、反復的にモーションベクトルの対(ベクトルA&ベクトルB)をMV比較器1310への入力として提供する。
【0044】
特徴点グループ化回路1300内のペアリングアルゴリズムコントローラ1302は、SPF MVリスト352とタイルMVリスト356とにアクセス(access)し、モーションベクトル比較器1310内の比較のためのベクトルAとベクトルBとを選択する。一連のベクトルA−ベクトルBの比較結果、1つ以上のベクトルのグループ、例えば、選択された特徴点のグループとタイルのグループとである場合、ペアリングアルゴリズムコントローラ1302は、グループ化されたモーションベクトルまたはその技術的なリスト(descriptive list)をメモリ350のFP MVグループインベントリ(inventories)354部分とタイルMVグループインベントリ358部分とに書き込みする。
【0045】
モーションベクトル(MV)グループアフィン変換計算器2010は、特徴点モーションベクトルの各グループのインターフレーム変換を計算し、タイルモーションベクトルの各グループのインターフレーム変換を計算し、それらをいずれもT(n)として出力する。
【0046】
図3は、図1のDIS回路のDIS方法の段階と関連したタイルグループ変換と特徴グループ変換T(n)とのスコアリング方法に基づいて主要(静的な/背景)変換P(n)を選択するための図1のDIS回路の軌跡ユニット(TU)4000のブロック図である。
【0047】
軌跡ユニット(trajectory unit;図3の4000)は、タイルグループ変換スコアリング及び選択回路(tile group transform scoring and selection circuit)4100−1(または、図4の(A)の4100)、特徴グループ変換スコアリング及び選択回路(feature group transform scoring and selection circuit)4100−2(図4の(A)の4100)、コレクティブグループ選択回路(collective group selection circuit;図5の4200)、移動客体除外回路(moving object exclusion circuit;図6の4400)、及び適応的補償フィルター(adaptive compensation filter;図10及び図11の8000)を含む。
【0048】
軌跡ユニット4000は、場面内の移動客体を無視する一方、アンステディ(unsteady)カメラによって引き起こされる主要モーションP(n)を識別し、選択された主要変換P(n)をフィルタリングし、補償変換(compensation transform;C(n))を出力する。軌跡ユニット4000は、受信されたインターフレーム変換T(n)のうちから主要変換P(n)を選択するように多数の連続したスコアリング関数を使う。
【0049】
図4の(A)は、図1のDIS回路の軌跡ユニット4000のグループ変換スコアリング及び選択回路(group transform scoring and selection circuit)4100のブロック図である。グループ変換スコアリング及び選択回路4100は、変換スコア計算器(transform score calculator)4150、変換品質計算器(transform quality calculator)4160、及び図1のDIS回路のDIS方法の段階を行うグループ変換及び品質選択器(group transform and quality selector)4170を含む。グループ変換スコアリング及び選択回路4100は、タイルグループインターフレーム変換(tile group inter−frame transform;TTile,i(n))からタイルグループ主要変換(tile groupprincipal transform;GPTile(n))を出力し(4100−1)、FPインターフレーム変換(FP inter−frame transform;TFP,i(n))から特徴グループ主要変換(feature group principaltransform;GPFP(n))を出力する(4100−2)。
【0050】
図4の(B)は、図4の(A)のグループ変換スコアリング及び選択回路4100内のヒストリースコア計算ユニット(history score calculation unit)4110−1の一実施形態のブロック図である。
【0051】
図4の(A)及び(B)を参照すると、グループ変換スコアリング及び選択回路4100は、ヒストリースコア計算ユニット4110(例えば、4110−1)、モーションスコア計算ユニット4120、特徴スコア計算ユニット4130に加えて規模スコア計算ユニット4140、変換スコアS(n)計算器4150、変換品質Q(n)計算器4160、及びグループ変換及び品質選択器4170(例えば、4170−1)を含む。
【0052】
図4の(A)のグループ変換スコアリング及び選択回路4100のグループ変換及び品質選択器4170は、全体変換スコア計算器4150から受信された(各インターフレーム変換T(n)の)全体変換スコアS(n)に基づいて(小さな移動客体のインターフレーム変換を排除させることで)、インターフレーム変換T(n)のうち1つをグループ主要変換GP(n)として選択し、グループ主要変換GP(n)とそれに関連した品質Q(n)とを出力する。
【0053】
(n)は、感知ユニット2000から受信されたあらゆる受信された変換候補(transform candidates)のうちi番目の変換である。ここで、nは、フレームと時間的に連続した性質(time sequence nature)を表わす。GP(n)は、フレーム時間nでの選択されたグループ主要変換(selected group principal transform)である。すなわち、選択されたiに対して、GP(n)=T(n)である。
【0054】
各T(n)に対して、全体変換スコアS(n)計算器4150は、ヒストリースコア計算ユニット4110(例えば、4110−1)からヒストリースコアH(n)を受信し、モーションスコア計算ユニット4120からモーションスコアM(n)を受信し、特徴スコア計算ユニット4130から特徴スコアF(n)を受信し、規模スコア計算ユニット4140から規模スコアE(n)を受信し、全体変換スコアS(n)を下記の式に基づいて計算する。
(n)=H(n)*M(n)*F(n)*E(n)
【0055】
各T(n)に対して、変換品質Q(n)計算器4160は、特徴スコア計算ユニット4130から特徴スコアF(n)を受信し、規模スコア計算ユニット4140から規模スコアE(n)を受信し、下記の式に基づいて変換品質Q(n)を計算する。
(n)=F(n)+E(n)
【0056】
最も大きな値S(n)を有するT(n)は、図4の(A)のグループ変換スコアリング及び選択回路4100のグループ変換選択器4170によってグループ主要変換GP(n)として選択されうる。したがって、実施形態によって、図1のDIS回路のDIS補償ユニット6000内で、最も高いスコアS(n)を有するインターフレーム変換候補T(n)は、グループ主要変換GP(n)として選択され、ジッタカメラモーションを補償するための補償変換C(n)を生産するために適応的にフィルタリングされる。
【0057】
ヒストリースコア計算ユニット4110(例えば、4110−1)は、グループ主要変換GP(n)のヒストリーを保存し、グループ主要変換GP(n)の保存されたヒストリーの所定長(HL)に基づいて、各T(n)に対するヒストリースコアH(n)を計算し、例えば、感知ユニット2000から各T(n)が受信された順に計算する。HLは、先行フレームの所定の個数を表わす整数である。入ってくるT(n)は、数学的に以前に選択されたグループ主要変換GP(n−1)...GP(n−k)を保存するHLのそれぞれと比較される。ここで、kは、1(直前フレーム:n−1を意味する)からHK(時間的にさらに遠いフレーム:n−HK)までの範囲を有するインテグラルフレームタイムインデックス(integral frame−time index)である。T(n)の変換は、以前に選択されたグループ主要変換(GP(n−1)からGP(n−HL))を保存するHLとさらに高いコリレーション(correlation)を有するほどさらに高いヒストリースコアH(n)とを有する。
【0058】
(n)と各GP(n−k)との間のコリレーションHi,k(n)は、範囲[0、1]内で1から正規化されたノルム(normalized norm)を差引いた値(1−|T(n)−GP(n−k)|)であり、1のようなHi,k(n)の値は、最も高いコリレーションを示す。
【0059】
各コリレーションHi,k(n)(1−|T(n)−GP(n−k)|))の貢献は、相応するヒストリーウエート(history−weight;HW(k))によってウェイティングされる(weighted)。
【0060】
ヒストリースコアH(n)は、全体コリレーションであり、Hi,k(n)の和にウェイティングされたHW(n−k)である。ここで、1<k<HLであり、HLは、ヒストリー長(以前フレームの個数)である。したがって、
(n)=Σ[1−|T(n)−GP(n−k)|*HW(k)]
1<k<HL
【0061】
ウエート(weights)のHW(n−HL)で、HW(n−1)はそれらの和が1と同じであり、ヒストリースコアH(n)出力が非線形的に正規化され、連続した範囲([0、1])を有するように選択される。
【0062】
図4の(B)に示されたヒストリースコア計算ユニット4110のハードウェア具現例4110−1は、保存されたコンテンツを比較器4114に出力するために(n−1でn−HLに対する)、HLタップ(HL taps)を有するHLを以前に選択されたグループ主要変換GP(n−1)ないしGP(n−HL)に保存するためのFIFO(first−in−first−out)メモリバッファ(memory buffer)を含む。比較器4114は、電流T(n)を以前に選択されたグループ主要変換GP(n−1)ないしGP(n−HL)に保存されたHLのそれぞれと比較し、ヒストリーウエートHW(n−1)ないしHW(n−HL)によってウェイティングされた各比較結果を、連続区間[0、1]で全体コリレーションを全体ヒストリースコアH(n)として出力する全体ヒストリースコア計算器4116に出力する。
【0063】
モーションスコア計算ユニット(motion score calculationunit)4120は、各T(n)を受信し、T(n)にのみ基づいて、そのモーションスコアM(n)を計算する。他の実施形態において、モーションスコア計算ユニット4120は、モーションスコアM(n)を計算するための目的で感知ユニット2000から保存された情報を受信することができる。小さなモーションに対する変換は、高いモーションスコアM(n)を有し、グループ主要変換GP(n)になることがさらに好ましい。T(n)のうちから各インターフレーム変換に対して、モーションスコア計算ユニット4120は、モーションスコアM(n)を計算する。
【0064】
(n)は、小さなモーションに対応して大きな値を有し、大きなモーションに対応して小さな値を有する。モーションM(n)は、変換の水平、垂直、または全体線形移動に基づくことができる。モーションスコアM(n)は、線形移動に反対に関連し、より適切に連続区間[0、1]を有するように非線形的に正規化される。
【0065】
特徴スコア計算ユニット4130は、各T(n)を受信し、T(n)にのみ基づいて、その特徴スコアF(n)を計算する。他の実施形態によって、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算するための目的で感知ユニット2000から保存された情報を受信することができる。T(n)のうちの各インターフレーム変換に対して、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算する。特徴スコアF(n)は、T(n)のうちから各インターフレーム変換によって表現される特徴点グループを作るためにともにグループ化された特徴点の個数と関連する。T(n)のうちの変換は、グループ別特徴点をさらに多く有するほどさらに高い特徴スコアF(n)を有する。特徴スコアF(n)は、より適切に連続区間[0、1]を有するように非線形的に正規化される。
【0066】
規模スコア計算ユニット(extent score calculation unit)4140は、各T(n)を受信し、T(n)に基づいて、その規模スコアE(n)を計算する。他の実施形態において、規模スコア計算ユニット4140は、規模スコアE(n)を計算するための目的で感知ユニット2000から保存された情報を受信することができる。T(n)のうちから各インターフレーム変換に対して、規模スコア計算ユニット4140は、規模スコアE(n)を計算する。広い領域をカバーする特徴点を有するT(n)の変換は、カバーする領域が大きいほど、さらに高くスコアリングされる。規模スコアE(n)は、さらに広い領域をカバーすることに対応してさらに大きな値を有し、反対にさらに狭い領域をカバーすることに対応してさらに小さな値を有する。規模スコアE(n)は、変換のグループのあらゆる特徴点を含む長方形領域の高さと幅との積に関連する。規模スコアE(n)は、より適切に連続区間[0、1]を有するように非線形的に正規化される。
【0067】
本発明の概念による多様な実施形態は、除外させなければ、ビデオ安定化に所望しない結果を引き起こす全体場面を横切って動く大きな客体を除くために、場面ヒストリー分析を使う。適切な場面ヒストリー分析がなければ、主要変換選択器は、大きな移動客体(特に、それが全体画面をカバーするならば)に対応する変換候補を選択する。我々は、大きな客体が横切って動いて全体場面を満たす場合、変換候補T(n)は、アンステディカメラに対応する主要変換P(n)を含まないことが分かる。
【0068】
図5は、図1のDIS回路の軌跡ユニット4000のコレクティブ変換スコアリング及び選択回路(collective transform scoring and selection circuit)4200の一実施形態のブロック図である。コレクティブ変換スコアリング及び選択回路4200は、コレクティブ判定(collective decision;CD(n))を計算するコレクティブ判定計算器(collective decision calculator)4250と図1のDIS回路のDIS方法の段階としてコレクティブ主要変換(collective principaltransform;CP(n))を出力するコレクティブ変換選択器(collective transform selector)4260とを含む。
【0069】
図5のコレクティブ判定計算器4250は、特徴グループ変換品質(feature group transform quality;QFP(n))、タイルグループ変換品質(tile group transform quality;QTile(n))、及び感知ユニット2000から受信された特徴グループ変換候補(feature grouptransform candidates;KFG(n))の個数からコレクティブ判定CD(n)を算出する。
【0070】
実施形態において、コレクティブ判定計算器4250は、特徴グループの個数KFG(n)から非線形的に正規化されたフラグメンテーションメジャー(fragmentation measure;Θ(n))を計算し、Θ(n)は、KFG(n)が小さい時に0であり、Θ(n)は、KFG(n)が大きい時に1である。したがって、Θ(n)値が1に近いことは、ビデオ場面のあらゆる特徴点が多くの特徴グループに分割されたものを表わし、反対に、Θ(n)値が0に近いことは、ビデオ場面のあらゆる特徴点が、少ない特徴グループに分割されたものを表わす。
【0071】
コレクティブ判定計算器4250は、Q(n)とΘ(n)*Q(n)とを比較することによって、コレクティブ判定CD(n)を出力し、もし、Q(n)>Θ(n)*Q(n)であれば、コレクティブ判定CD(n)は、特徴グループを選択するように設定される。そして、もし、Q(n)<=Θ(n)*Q(n)であれば、コレクティブ判定CD(n)は、タイルグループを選択するように設定される。この公式で、もし特徴グループが分割されていないならば、Θ(n)値が0に近く、特徴グループは、さらに選択されやすい。一方、もし特徴グループが分割されたならば、Θ(n)値が1に近く、タイルグループ変換品質QTile(n)は、特徴グループ変換品質QFP(n)と対等の立場で比較される。
【0072】
コレクティブ変換選択器4260は、特徴グループ主要変換GPFP(n)とタイルグループ主要変換GPTile(n)との間で選択を行う。コレクティブ変換選択器4260は、コレクティブ判定CD(n)によって制御されて、出力コレクティブ主要変換CP(n)は、CD(n)が特徴グループとして設定される時、特徴グループ主要変換GPFP(n)として設定され、そうではない場合、タイルグループ主要変換GPTile(n)として設定される。
【0073】
本実施形態で、コレクティブ変換スコアリング及び選択回路4200は、特徴グループ変換品質QFP(n)及びタイルグループ変換品質QTile(n)に基づいて選択を行う。このようなグループ変換品質は、特徴スコア計算ユニット4130と規模スコア計算ユニット4140とからの入力を受信する図4Aの変換品質計算器4160によって計算される。
【0074】
特徴スコア計算ユニット(feature score calculation unit)4130は、その特徴基盤(feature−based)とタイル基盤(tile−based)変換T(n)の特徴スコアF(n)を計算する。本実施形態で、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算する目的で感知ユニット2000から保存された情報を受信する。
【0075】
(n)間の各インターフレーム変換に対して、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算する。1つのグループのさらに多い特徴点または1つのグループのさらに多いタイルの変換T(n)は、さらに高い特徴スコアF(n)を有し、これは、特徴グループ変換品質QFP(n)またはタイルグループ変換品質QTile(n)のそれぞれがさらに高くなるようにする。実施形態において、タイル別特徴点の個数は、特徴基盤変換T(n)のスコア特徴スコアF(n)を支配することができる。他の実施形態において、タイルの個数は、タイル基盤変換T(n)のスコア特徴スコアF(n)を支配することができる。タイル別特徴点の個数、及び/またはタイルベクトルの各グループ内のタイルの個数は、感知ユニット2000から直接得ることができる。
【0076】
規模スコア計算ユニット4140は、特徴基盤及びタイル基盤変換T(n)の規模スコアE(n)を計算する。本実施形態で、特徴スコア計算ユニット4130は、特徴スコアF(n)を計算するための目的で感知ユニット2000から保存された情報を受信する。特徴点またはタイルの変換は、さらに広い領域に亘るほどさらに高くスコアリングされうる。特徴点の個数とタイルベクトルの各グループ内のタイルの次元は、感知ユニット2000から直接得ることができる。同様に、特徴基盤モーションベクトルの各グループの水平及び垂直方向の規模は、感知ユニット2000から直接得ることができる。特徴グループまたはタイルグループは、さらに広い領域に亘るほどさらに高い規模スコアE(n)を有し、その結果、特徴グループ変換品質QFP(n)またはタイルグループ変換品質QTile(n)のそれぞれはさらに高くなる。本実施形態で、規模スコア計算ユニット4140は、規模スコアE(n)を計算するための目的で感知ユニット2000から保存された規模情報を受信する。
【0077】
コレクティブ主要変換CP(n)が、コレクティブ変換スコアリング及び選択回路4200によって選択された後、大型客体除外ハードウェア(large object exclusion hardware)は、選択されたコレクティブ主要変換CP(n)が全体場面で動き、全体場面をカバーする大型移動客体であるか否かを判断する。前記除外(exclusion)が効果的な場合、単位変換(unity transform;UT)が代替物として生成され、DISシステムの補償回路のために選択された主要変換P(n)として提供されて、安定化されたビデオは、不正確にまたは不明に大型移動客体の変換をしない。
【0078】
実施形態において、移動客体除外方法は、2種の観測に基づいて活性化される。ここで、前記2種の観測は、既に存在する静的な背景(P(n)のヒストリーによって指示される)と、静的な背景と大型移動客体の共存の時間周期である。
【0079】
移動客体除外方法は、次のシナリオを扱うのに非常に効果的である。場面は、移動客体があるかないかのほとんど静的な背景である。大型移動客体は、場面に進入し、漸次的にさらに大きな領域をカバーする。前記大型移動客体は、全体場面をカバーする。前記大型移動客体は、場面を離れ始め、背景が再び表われ始める。前記大型移動客体は、遂に消える。
【0080】
移動客体分析器(moving object anlayzer)は、除外シナリオ(IF)を感知する。
連続して静的なMVグループの存在は、ほとんど静的な背景になった場面を示している。
連続して類似した速度のMVグループのカウント増加は、場面内に入ってくる客体を示している。
前述のトレンドが続き、時間nで連続して類似した速度のMVグループが全体場面をカバーし、静的なMVグループが消えれば、除外シナリオが検出される。
【0081】
除外判定ED(n)は、除外変換選択器に送られる。除外変換選択器は、ED(n)が除外シナリオを指示しなければ、コレクティブ主要変換CP(n)を選択し、そのシナリオ内で主要変換P(n)は、基準変換として設定される。したがって、大型移動客体が全体場面をカバーする時にも、安定化されたビデオは大型移動客体に不正確に追従しない。
【0082】
図6は、図1のDIS回路の軌跡ユニット4000の移動客体除外回路4400の一実施形態のブロック図である。移動客体除外回路4400は、移動客体分析器4470及び図1のDIS回路のDIS方法内の段階を行う除外変換選択器4480を含む。
【0083】
移動客体除外回路4400は、場面のヒストリーを保存するための複数のグループヒストリー回路4410、4420、4430、及び4440、及び移動客体分析器4470を含む。いつでも、指定された静的なグループGが1つだけあるが、0またはそれ以上の現在(existing)モーショングループG(k>0)があり得る。また、次のフレームの間に、k(例えば、k(n+1)=k(n)+1)現在モーショングループGのうち1つになりうる新たなモーショングループGがあり得る。
【0084】
静的なグループGは、関連したグループヒストリーGHを有する。k現在モーショングループGは、関連したモーションベクトルMだけではなく、関連したグループヒストリーGHも有する。各現在モーショングループGは、基本的にフレームnまで経時的に類似した速度のT(n)のそれぞれに対して低域通過フィルターがかけられた(low−pass filtered)|T(n)|であるモーションベクトルMを有する。
【0085】
新たなモーショングループGの各々は、その生成(creation)の時間に初期化された関連したグループヒストリーGH(n)を有する。移動客体分析器4470は、複数のグループヒストリーGH(n)、GH(n)、...GH(n)、及びGH(n)を含む場面ヒストリーとGH(n)とを受信し、それらから除外判定(exclusiondecision;ED(n))を計算する。
【0086】
除外変換選択器(exclusion transform selector)4480は、単位変換(UT)とコレクティブ主要変換CP(n)との間の選択を行う。除外変換選択器4480は、除外判定ED(n)によって制御されて、ED(n)が活性化された時、出力主要変換P(n)は、単位変換(UT)として設定され、そうではない場合には、コレクティブ主要変換CP(n)として設定される。単位変換(UT)は、補償ユニットが補償の間に何もしないようにしうる。したがって、移動客体分析器4470が“大型移動客体”シナリオを感知し、除外判定ED(n)を活性化する時、そうではない場合、主要変換P(n)として選択されうる大型移動客体の変換は、選択された主要変換P(n)になるものから除外される。要するに、大型移動客体の変換は、感知された時には、図1の補償ユニット6000によって行われる補償から除外される。
【0087】
図7は、図6の移動客体除外回路4400内のモーショングループヒストリー回路の一実施形態で行われる段階を詳しく説明するための複合ブロックダイヤグラムフローチャートであり、図1のDIS回路のDIS方法を実施する段階で構成されている。図7は、静的なグループG、現在モーショングループG、及び新たに生成されたモーショングループGN+1にそれぞれ対応する代表的なグループヒストリー回路4410、4430、及び4440を詳しく図示する。
【0088】
図6の移動客体除外回路4400の移動客体分析器4470によってグループヒストリー回路(例えば、4410)から受信されたグループヒストリー(例えば、H(n))は、各グループと関連した2種のヒストリーデータ、選択ヒストリー(例えば、SH(n))と現在ヒストリー(Existence−History、例えば、EH(n))とを含む。
【0089】
移動客体分析器(moving objet analyzer)4470は、次のように除外シナリオを感知する。静的な変換G(n)のグループヒストリーGH内で指示された連続した存在(existence)及び選択は、多数のフレームの間に存在したほとんどの静的な背景の場面を示している。具体的なモーショングループGのグループヒストリーGH内の連続する存在の漸次的に増加する数字は、客体が場面内に入ってくるということを表わす。もし、存在及びモーションの現趨勢が持続されれば、そして、時間(n)で選択された変換P(n)がGに結合するものを除き、静的な変換がGに属しなければ、大型移動客体シナリオが感知され、活性化された除外判定ED(n)が主要変換選択器4160−2に送られる。もし、ED(n)が大型客体除外シナリオ(largeobject exclusion scenario)を指示するならば、主要変換P(n)は、単位変換として設定され、そうではない場合には、主要変換P(n)は、T(n)のあるスコアリング関数によって選択される。
【0090】
グループヒストリー回路4410、4420、4430、及び4440のそれぞれは、受信されたインターフレーム変換T(n)のうちの1つに関連した各グループに対するヒストリー情報の3種類の保存及び処理を行う。グループヒストリーの前記3種類は、選択ヒストリー、現在ヒストリー(existence−history)、及びモーションヒストリーである。静的なグループGは、映像安定化開始時に空いているヒストリーとともに生成される。静的なグループGのモーションヒストリーは省略され、ヌル(null)と推定されうる。モーショングループG、...、G、...、Gは、DISビデオプロセッシングのコースの間にダイナミックに(dynamically)生成されるか、削除されうる。
【0091】
図7を参照すると、静的なグループG、N現在モーショングループG、及び新たに生成されたモーショングループGN+1にそれぞれ対応するグループヒストリー回路4410、4430、及び4440は、グループヒストリーGH、GH、及びGHN+1を提供する。
【0092】
モーショングループGのグループヒストリー回路4410は、選択ヒストリーSHと存在ヒストリーEHとの保存のためのヒストリーメモリを含む。存在ヒストリーEHは、インターフレーム変換T(n)が以前フレーム内のモーショングループGに結合されたか否かを示す過去フレーム値当たり1ビットである。選択ヒストリーSHは、モーショングループGに結合されたインターフレーム変換T(n)が以前フレーム内の主要変換P(n)として選択されたか否かを示す過去フレーム値当たり1ビットである。
【0093】
グループGが静的とみなされ、選択された主要変換P(n)を含む如何なるT(n)が静的なグループGに属するか否かの判定(判定段階dS4418)について、T(n)を多様なヒストリーに基づいたモーションベクトルMよりスレショルド値thdと比較することに依存するために、静的なグループGのグループヒストリー回路4410は、モーションヒストリーMを省略する。静的なグループGは、ビデオ安定化開始時に空いているヒストリーとともに作られる。
【0094】
もし、フレームnの間にT(n)が、|T(n)|<thdを満足すれば(判定段階dS4418の「はい」のブランチ)、このT(n)は、Gに属し、存在ヒストリーEHは、フレームnで静的な変換の存在を指示するためにアップデートされる。
もし、P(n)=T(n)であれば、選択ヒストリーSHは、T(n)選択を指示するためにアップデートされる。
【0095】
(n)が、|T(n)|<thdを満足しない場合(判定段階dS4418の「いいえ」のブランチ)、フレームの間に|T(n)|<thdを満足させなければ、T(n)は、存在モーショングループG〜G内のそれぞれのグループヒストリーと比較される。
【0096】
モーショングループGのグループヒストリー回路4430は、選択ヒストリーSH、及び存在ヒストリーEH、及びモーションヒストリーMの保存のためのヒストリーメモリを含む。存在ヒストリーEHは、インターフレーム変換T(n)が以前フレーム内のモーショングループGに属するか否かを示す過去フレーム値当たり1ビットである。選択ヒストリーSHは、モーショングループGに属したインターフレーム変換T(n)が以前フレーム内の主要変換P(n)として選択されたか否かを示す以前フレーム値当たり1ビットである。
【0097】
モーションヒストリーMは、グループGの全体的なモーションのベクトルMを指示する情報を保存する。各T(n)は、またモーションベクトル(M)でマッピング(map)する。各モーショングループGは、モーションベクトルMでマッピングする。|T(n)|をT(n)のモーションベクトルのサイズとし、|T(n)−M|を1≦K≦N(Nは、現在の現在モーショングループの個数)で現在モーショングループGのモーションベクトルMからT(n)の偏差とする。N個存在するモーショングループのうち最小の|T(n)−M|を有するモーショングループGは、T(n)に対する最もマッチングされるグループGを示す。ジョイン(join)判断は、|T(n)−M|を所定のスレショルド値thdと比較して決定されうる。したがって、例えば、判定段階dS4438で、もし、1とNとの間の特定のJ及びすべてのKで|T(n)−M|≦|T(n)−M|であり、|T(n)−M|<thdであれば(判定段階dS4438の「はい」のブランチ)、T(n)は、存在するモーショングループGにジョインする。
【0098】
もし、すべてのKに対して、|T(n)−M|<thdであり、|T(n)−M|<|T(n)−M|であれば(判定段階dS4438の「はい」のブランチ)、T(n)は、Gに属する。
モーションヒストリーMは、新たに属したT(n)を反映するように調整される。
現在ヒストリーEHは、フレームnでモーショングループGの存在を指示するためにアップデート(update)される。
もし、P(n)=T(n)であれば、選択ヒストリーSHは、T(n)=P(n)の選択を指示するためにアップデートされる。
【0099】
一方、もし、判定段階dS4438がT(n)及びあらゆる存在するモーショングループG〜Gのために反復され、Mのうちいずれも|T(n)−M|<thdを満足させなかったならば(判定段階dS4438の「いいえ」のブランチ)、T(n)は、新たに形成されたモーショングループGN+1に属する(S4449段階)。もし、このT(n)が、新たに形成されたモーショングループGN+1に属するならば(S4449段階)、T(n)は、新たに形成されたモーショングループGN+1に属する。
【0100】
モーションヒストリーMN+1は、このT(n)のモーションベクトルとして設定される。
存在ヒストリーEHN+1は、フレームnで新たなモーショングループGN+1の存在を指示するために初期化される。
もし、P(n)=T(n)であれば、選択ヒストリーSHN+1は、T(n)=P(n)の選択を指示するためにアップデートされる。
時間の拡張された期間(フレーム)にジョイン(join)するT(n)を除くモーショングループ(G〜Gのうちの)は、削除される。
【0101】
図8は、時間nにおける、キャプチャーされたビデオフレームと主要変換P(n)から計算された補償変換C(n)に対応する補償ウィンドウとを示す図であり、減少した垂直オーバーエクスカーションv1を示している。補償ウィンドウの垂直オーバーエクスカーションは、本発明の実施形態によるDIS方法の段階で垂直オーバーエクスカーションv1として測定される。
【0102】
図8を参照すると、キャプチャーされたビデオフレームの補償変換C(n)に相応する補償ウィンドウは、垂直オーバーエクスカーションv0またはv1、水平オーバーエクスカーションu0またはu1、または垂直オーバーエクスカーションv0またはv1、及び水平オーバーエクスカーションu0またはu1いずれもを有しうる。それぞれの潜在的なオーバーエクスカーションv0、v1、u0、及びu1は、補償変換C(n)の並進成分、補償変換C(n)の回転成分、または補償変換C(n)の並進成分及び回転成分の組み合わせによって発生することがある。
エクスカーションのヒストリーに基づいて、各キャプチャーされたビデオフレームに対するフィルタリングされた補償変換C(n)を出力するために、主要変換P(n)を適応的にフィルタリングすることによって、オーバーエクスカーションv0、v1、u0、及びu1を最小化することが望ましい。
【0103】
図9は、本発明の概念による他の実施形態によってDISを行うDIS回路のブロック図である。DIS回路は、受信されたジャーキービデオを分析し、インターフレーム変換T(n)を出力する感知ユニット2000、T(n)のうちから主要変換P(n)を識別する主要変換選択回路4100、4200、及び4400、及び主要変換P(n)を補償変換C(n)にフィルタリングする適応的補償フィルター8000を含む軌跡ユニット4000、及びジャーキービデオフレームを補償変換C(n)の使用により修正することによって、安定化されたビデオを出力する補償ユニット6000を含む。
【0104】
主要変換選択回路4100、4200、及び4400は、場面内の移動客体のインターフレーム変換T(n)を無視し、アンステディカメラによって発生したグローバルモーションのインターフレーム変換T(n)を識別することによって、インターフレーム変換T(n)のうちから1つを主要変換P(n)として選択し、その選択したものを計算された主要変換P(n)として出力する。したがって、DIS回路の主要変換選択回路4100、4200、及び4400は、インターフレーム変換T(n)のうち1つを計算された主要変換P(n)として選択して出力する。補償変換C(n)は、主要変換P(n)を適応的にフィルタリングすることで得られる。補償変換C(n)は、相応する入力ビデオイメージとの関係で安定化されたビデオイメージ(補償ウィンドウ)の幾何学的構造の表現である。前記表現は、位置、アングル(angle)、サイズなどを含む。補償変換に使われるいくつかは、普通類似変換(similarity transform)及びアフィン変換であるが、本発明の概念は前記変換に限定されないが、ここでは、本発明の概念による一実施形態の方法の説明のためにアフィン変換を使う。
【0105】
主要変換選択回路4100、4200、及び4400は、順にフレームの連続したシーケンスの選択された主要変換P(n−∞)、...P(n−1)、P(n)を適応的補償フィルター8000に出力する。主要変換P(n−∞)は、反復的な(無限インパルス応答(infinite impulse response、IIR))フィルターの使用を指示する。適応的補償フィルター8000は、主要変換P(n−∞)、...P(n−1)、P(n)の配列によって表現されるジッタモーションから意図されたカメラ軌跡を推定し、推定したカメラ軌跡によって補償変換C(n)を出力する。
【0106】
安定化されたビデオの視覚的効果は、適応的補償フィルター8000の品質に大きく依存する。従来の軌跡推定方法は、モーションベクトル積分とカルマンフィルター(Kalman filter)などを含む。しかし、これらと他の従来の軌跡推定方法は、ジャーキービデオ特性の広い範囲で正しく行われない。本発明の概念による実施形態では、適応的補償フィルター8000がジャーキーモーション(jerky motions)をフィルタリングし、安定化されたビデオを生産するのに使われる。
【0107】
図10は、本発明の一実施形態による図9に示されたDIS回路の軌跡ユニット4000の適応的補償フィルター8000のブロック図である。適応的補償フィルター8000は、補償ウィンドウエクスカーションのヒストリーに基づいて主要変換P(n)を適応的にフィルタリングする。適応的補償フィルター8000は、フレームの連続したシーケンスの受信された主要変換P(n−∞)、...P(n−1)、P(n)に基づいて主要変換P(n)をフィルタリングし、適応的にフィルタリングされた補償変換C(n)を出力する。
【0108】
適応的補償フィルター8000は、強補償フィルター(strong compensation(SC)filter)8700、弱補償フィルター(weak compensation(WC)filter)8600、コントロール信号E(n)を出力するための適応的フィルターコントロール回路8500、及びエクスカーション調節ミキサー(excursion modulated mixer)8200を含む。強補償フィルター8700は、高周波数−選択的高次線形時不変デジタルフィルター(highlyfrequency−selective high−order linear time−invariant digital filter)であり、非常にジャーキーな入力ビデオのフィルタリングに効果的である。
一方、弱補償フィルター8600は、より少なめに安定した出力ビデオで少ない補償ウィンドウオーバーエクスカーションを生産するさらに低い周波数−選択的性質を有する。
【0109】
適応的補償フィルター8000は、強補償フィルター8700と弱補償フィルター8600との効果的な組み合わせである。エクスカーション調節ミキサー8200は、生成されたコントロール信号E(n)に基づいて出力する強補償フィルター8700と弱補償フィルター8600とのミキシング(mixing)を行い、補償ウィンドウエクスカーションのヒストリーに基づいて適応的フィルターコントローラ8500によって出力する。
【0110】
図11は、図9のDIS回路の軌跡ユニット4000の適応的補償フィルター8000の最初の実施形態8000−1のブロック図である。本実施形態において、適応的補償フィルター8000−1は、強補償フィルター8700と弱補償フィルター8600、及び適応的フィルターコントローラ8500−1のエクスカーション計算器8510へのフィードバックループ(feedback loop)を含む。
【0111】
図11を参照すると、強補償フィルター8700は、視覚的によく安定化されたビデオを得て高周波数−選択的な出力F(n)を有するために、1.0Hzでカットオフ(cutoff)周波数を有し、急激なロールオフ(rolloff)を有する高次線形時不変循環デジタルフィルター(high−order linear time−invariant recursive digital filter)である。
【0112】
弱補償フィルター8600は、高次または低次線形時不変循環デジタルフィルターである。弱補償フィルター8600は、オーバーエクスカーションを減らすために、1Hzよりさらに高いカットオフ周波数を有し、緩やかなロールオフを有するさらに低い周波数−選択的な出力G(n)を有する。
【0113】
適応的補償フィルター8000−1のエクスカーション調節ミキサー8200−1は、スカラーコントロール信号E(n)によって強補償フィルター8700の出力F(n)と弱補償フィルター8600の出力G(n)とを結合するエクスカーション調節適応的フィルタリングを行う。強補償フィルター8700の出力F(n)と弱補償フィルター8600の出力G(n)は、いずれも中間に起こる補償変換であり、エクスカーション調節ミキサー8200−1の出力C(n)も補償変換である。エクスカーション調節ミキサー8200−1は、C(n)(C(n)=(1−E(n))*F(n)+E(n)*G(n))を出力する。ここで、E(n)は、[0、1]の範囲での非線形的に正規化されたスカラーコントロール信号である。“*”は、スカラーと変換との間の乗算演算であり、変換にマッピングされる。“+”は、2つの変換の間の加算演算であり、変換にマッピングされる。したがって、本実施形態で、適応的補償フィルター8000−1は、強補償フィルター8700と弱補償フィルター8600との線形結合であり、適応的補償フィルター8000−1は、線形重畳(linear superposition)の原則によって知られた安定した性質を有する効果的な高次線形時不変循環デジタルフィルターである。
【0114】
線形結合された補償変換C(n)は、補償ウィンドウエクスカーションのヒストリーに基づいてスカラーコントロール信号E(n)によって制御される。ヒストリー内の小さなエクスカーションは、小さなE(n)を生産するので、現在フレームnに対する強補償フィルター8700の影響は大きくなる一方、ヒストリー内の大きなエクスカーションは、1に近いE(n)を生産するので、現在フレームnに対する弱補償フィルター8600の影響が大きくなる。ヒストリー内の中間値のエクスカーションは、強補償フィルター8700と弱補償フィルター8600との影響に比例するように割り当てられる。
【0115】
したがって、強補償フィルター8700は、小さなエクスカーションに主たる貢献を提供し、それは、高周波数ジッタをフィルタリングするのに非常に効果的である。そして、さらに大きなエクスカーションで弱補償フィルター8600の貢献がさらに多くなるために、オーバーエクスカーションの発生が急減する。適応的補償フィルター8000−1は、優れたビデオ安定化の性質を保持しながら、入力ビデオの大きな動きによる過度なオーバーエクスカーションを防止することができる。
【0116】
図11を参照すると、適応的フィルターコントローラ8500−1は、エクスカーション計算器8510、4つのエクスカーションヒストリー積分器8520、及び調節因子計算器8530−1を含む。適応的フィルターコントローラ8500−1は、フィードバックループの一部である。エクスカーション計算器8510は、以前の適応的補償フィルター出力C(n−∞)、...C(n−2)、C(n−1)から得られたE(n)を出力する。ここでnは、時間連続した性質を表わし、E(n)とC(n)は、実現不可能な遅延のないループを形成しない。したがって、本実施形態は、リアルタイムビデオ安定化に適し、予測可能な性質の概略的な線形時不変フィルターを含む。
【0117】
エクスカーション計算器8510は、エクスカーション調節ミキサー8200−1によって出力された補償変換C(n)のフィードバックを受信する。エクスカーション計算器8510は、補償ウィンドウの4つのエッジの位置に基づいてフレームごとに左側、右側、下方、上側のエクスカーションを別途に計算するために、u0計算器、u1計算器、v0計算器、及びv1計算器を含む(図8参照)。
【0118】
適応的補償フィルター8000−1は、循環フィルターを通したエクスカーションヒストリーを含む。エクスカーション計算器8510の各面の出力は、本質的に低域通過循環フィルター(low−pass recursive filter)であるエクスカーションヒストリー積分器によってそれぞれ時間に対して積分される。各低域通過循環フィルターHu0、Hu1、Hv0、及びHv1の出力は、調節因子計算器8530−1に供給される。調節因子計算器8530−1は、4つの時間に対して積分されたエクスカーション量Hu0、Huu1、Hv0、及びHv1のうちから最大値を選択し、連続区間[0、1]で非線形的に正規化されたスカラーコントロール信号E(n)を生成する。
【0119】
調節因子計算器8530−1は、F(n)とG(n)とのミキシングを調節するために、非線形的に正規化されたスカラーコントロール信号E(n)を出力する。小さな値のE(n)は、小さなエクスカーションのヒストリーを意味し、大きな値のE(n)は、大きなエクスカーションのヒストリーを意味する。
【0120】
したがって、補償変換C(n)を生成させ、出力するためのスカラーコントロール信号E(n)の制御下のF(n)とG(n)とのミキシングは、補償ウィンドウエクスカーションのヒストリーに基づく。本実施形態は、周波数オーバーエクスカーションのない優れた安定化を提供し、公知の周波数応答と予測可能な安定化性質とを有し、リアルタイムビデオ安定化に適切である。
【0121】
上記開示した説明事項は、実施形態として考慮されたものであるので、本発明は、これに制限されてはならず、添付の請求項は、発明の思想によって変形、添加、及び他の実施形態まで含むものと理解しなければならない。したがって、本発明の範囲は、法によって許容される最大の範囲まで許容されなければならず、前述した詳細な説明によって制限的に解釈されてはならない。


【特許請求の範囲】
【請求項1】
カメラによってキャプチャーされたビデオフレーム内のモーションベクトルの変換から補償されるカメラ動きを表わす補償変換を識別する段階と、
補償ウィンドウ(compensation window)の過度なオーバーエクスカーション(over−excursion)を防止するために、非線形的に正規化された時積分されたエクスカーション(non−linearly normalized time−integrated excursions)に基づいて補償変換を適応的フィルタリング(filtering)する段階と、
を含むことを特徴とするビデオデータ処理方法。
【請求項2】
前記適応的フィルタリングする段階は、
前記補償変換の強補償(SC)フィルタリングを行う高周波数−選択的高次線形時不変循環フィルター(highly frequency−selective high−order linear time−invariant recursive filter)と、前記補償変換の弱補償(WC)フィルタリングを行う低周波数−選択的高次線形時不変循環フィルター(lower frequency−selective high−order)、または低周波数−選択的低次線形時不変循環フィルター(lower−order linear time−invariant recursivefilter)とのスカラー組み合わせ(scalar combination)を含むことを特徴とする請求項1に記載のビデオデータ処理方法。
【請求項3】
前記適応的フィルタリングする段階は、
小さなエクスカーションヒストリー(small excursion history)に基づいて現在フレームに対して、前記強補償(SC)フィルターの大きな影響力を配分する段階と、
大きなエクスカーションヒストリー(large excursion history)に対して、前記現在フレームに対して弱補償(WC)フィルターの大きな影響力を配分する段階と、
を含むことを特徴とする請求項2に記載のビデオデータ処理方法。
【請求項4】
複数の中間エクスカーション(medium excursions)のエクスカーションヒストリーに対して、前記強補償(SC)フィルターと前記弱補償(WC)フィルターとの影響力の比率を配分する段階をさらに含むことを特徴とする請求項3に記載のビデオデータ処理方法。
【請求項5】
前記非線形的に正規化された時積分されたエクスカーションは、前記エクスカーションヒストリーの少なくとも4つの時積分されたエクスカーションサイズのうちから最大サイズM(n)を選択することを特徴とする請求項1に記載のビデオデータ処理方法。
【請求項6】
E(n)は、小さなエクスカーションから大きなエクスカーションまでのヒストリーから区間[0、1]でM(n)の非線形的に正規化された値であることを特徴とする請求項5に記載のビデオデータ処理方法。
【請求項7】
前記強補償(SC)フィルタリングは、前記弱補償(WC)フィルタリングに対して設定された遮断周波数より低い遮断周波数で設定されることを特徴とする請求項2に記載のビデオデータ処理方法。
【請求項8】
前記強補償(SC)フィルタリングは、前記弱補償(WC)フィルタリングでのロールオフより急激なロールオフ(rolloff)の使用を含むことを特徴とする請求項7に記載のビデオデータ処理方法。
【請求項9】
前記強補償フィルタリングは、ほぼ1Hz程度の遮断周波数を有することを特徴とする請求項7に記載のビデオデータ処理方法。
【請求項10】
前記強補償(SC)フィルター及び前記弱補償(WC)フィルターの前記影響力の配分は、0から1までの連続区間内で非線形的に正規化された値に基づくことを特徴とする請求項3に記載のビデオデータ処理方法。
【請求項11】
イメージデータのフレームを受信するための受信器と、
第1モーション特性を有するモーションベクトルの第1グループと、第2モーション特性を有するモーションベクトルの第2グループとを保存するためのメモリと、
前記モーションベクトルの前記第1グループと前記第2グループとの変換から補償されるカメラ動きを表わす補償変換を識別するための変換選択器と、
非線形的に正規化された時積分されたエクスカーションに基づいて、補償ウィンドウの過度なオーバーエクスカーションを防止するための適応フィルターと、
を含むことを特徴とするイメージ処理回路。
【請求項12】
前記補償変換の強補償フィルタリングを行うためのさらに高い周波数−選択的な高次線形時不変フィルターと前記補償変換の弱補償フィルタリングを行うためのさらに低い周波数−選択的な低次線形時不変フィルターとを組み合わせるためのミキサー(mixer)をさらに含むことを特徴とする請求項11に記載のイメージ処理回路。
【請求項13】
前記適応フィルターは、小さなエクスカーションのエクスカーションヒストリーに基づいて、現在フレームに対する前記強補償フィルターのさらに大きな影響力を配分し、大きなエクスカーションのエクスカーションヒストリーに対する前記現在フレームに対する前記弱補償フィルターのさらに大きな影響力を配分することを特徴とする請求項12に記載のイメージ処理回路。
【請求項14】
複数の中間エクスカーションのエクスカーションヒストリーに対する前記強補償フィルターと前記弱補償フィルターとの影響力の比率を配分する段階をさらに含むことを特徴とする請求項13に記載のイメージ処理回路。
【請求項15】
非線形的に正規化された信号を出力するために、エクスカーションヒストリーの4つの時積分されたエクスカーションサイズのうちから最大サイズを計算するための調節因子計算器をさらに含むことを特徴とする請求項12に記載のイメージ処理回路。
【請求項16】
前記非線形的に正規化された信号は、0から1の範囲内で前記強補償フィルターと前記弱補償フィルターとのスカラー値でミキシングすることを調節するために前記ミキサーに入力されることを特徴とする請求項15に記載のイメージ処理回路。
【請求項17】
前記強補償フィルターは、前記弱補償フィルターに対して設定された遮断周波数よりさらに低い遮断周波数で設定されたことを特徴とする請求項13に記載のイメージ処理回路。
【請求項18】
前記強補償フィルターは、前記弱補償フィルターでのロールオフより急激なロールオフの使用を含むことを特徴とする請求項17に記載のイメージ処理回路。
【請求項19】
前記適応フィルターは、循環フィルターの使用によってエクスカーションヒストリーを保存することを特徴とする請求項11に記載のイメージ処理回路。
【請求項20】
前記モーションベクトルの前記第1グループの変換は、選択された特徴点の動作を表現し、前記モーションベクトルの前記第2グループの変換は、ビデオフレームから分割された重ならないタイルの動作を表現することを特徴とする請求項11に記載のイメージ処理回路。
【請求項21】
イメージをキャプチャーするためのイメージセンサーと、
キャプチャーされたイメージをイメージデータのフレームに変換するためのイメージデータ回路と、
イメージ処理回路と、を含み、前記イメージ処理回路は、
前記イメージデータの前記フレームを受信するための受信器と、
客体の動作を感知し、モーションベクトルを生成するためのモーションベクトル感知器と、
前記モーションベクトルの変換から補償されるカメラ動きを表現する補償変換を識別するための変換選択器と、
補償ウィンドウのオーバーエクスカーションをフィルタリングするための適応フィルターと、
前記補償変換と前記適応フィルターの出力に基づいて、キャプチャーされたイメージを調節するための補償ユニットと、
を含むことを特徴とするカメラ。
【請求項22】
前記モーションベクトルを特徴点グループとタイルグループとを含む少なくとも2つ以上のグループのうちの1つにグループ化するためのグループ化回路をさらに含み、
前記タイルグループは、ビデオフレームから分割された重ならないタイルを含むことを特徴とする請求項21に記載のカメラ。
【請求項23】
前記変換選択器は、ヒストリースコア、モーションスコア、特徴スコア、及び規模スコアから選択された複数のスコアリング関数に基づいて前記補償変換を識別することを特徴とする請求項21に記載のカメラ。
【請求項24】
前記適応フィルターは、非線形的に正規化された時積分されたエクスカーションに基づいて補償ウィンドウの過度なオーバーエクスカーションを防止することを特徴とする請求項21に記載のカメラ。
【請求項25】
前記適応フィルターは、循環フィルターの使用によってエクスカーションヒストリーを保存することを特徴とする請求項21に記載のカメラ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2012−165365(P2012−165365A)
【公開日】平成24年8月30日(2012.8.30)
【国際特許分類】
【外国語出願】
【出願番号】特願2011−281534(P2011−281534)
【出願日】平成23年12月22日(2011.12.22)
【出願人】(390019839)三星電子株式会社 (8,520)
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
【住所又は居所原語表記】129,Samsung−ro,Yeongtong−gu,Suwon−si,Gyeonggi−do,Republic of Korea
【Fターム(参考)】