説明

動き検出方法

【目的】従来の方法と全く異なる動き検出方法を提供する。
【構成】nフレームの画素信号をn−1フレームおよびn+1フレームの画素信号を使用した線形1次結合式で表現する。次に、n−1フレームおよびn+1フレームの画素信号に対応する線形1次結合式の係数を算出する。次に、n−1フレームの画素信号に対応する係数およびn+1フレームの画素信号に対応する係数より、夫々最大の係数を検出すると共に、その検出された係数に対応する画素位置を特定し、その画素位置に基づいてn−1フレームからnフレームおよびnフレームからn+1フレームへの画像の動き量および動き方向を示す動きベクトルMVを求める。画素位置と動きベクトルとの対応は予めとられている。

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、画像の動き量および動き方向を検出する動き検出方法に関する。
【0002】
【従来の技術】従来、画像の動き量および動き方向を検出する動き検出方法として、ブロックマッチング法、勾配法等が周知である。ここで、ブロックマッチング法は、例えばフレーム間で所定ブロック内の対応する画素信号の差を求め、ブロック内での差の積算値が最小となるように一方のブロックを移動することで動きベクトルを求めるものである。また、勾配法は、画像のある位置における勾配とフレーム間差から移動量を求めるものである。
【0003】
【発明が解決しようとする課題】従来、上述したように動き検出方法として種々の方法が提案されているが、この発明では従来の方法と全く異なる動き検出方法を提供するものである。
【0004】
【課題を解決するための手段】この発明は、あるフレームの画素信号を前および後の双方のフレームまたはいずれかのフレームの画素信号を使用した線形1次結合式で表現し、前および後の双方のフレームあるいはいずれかのフレームの画素信号に対応する線形1次結合式の係数を算出し、算出された係数より画像の動き量および動き方向を求めるものである。例えば、算出された係数のうち最大の係数を検出し、その係数に対応する画素位置を特定することで画像の動き量および動き方向が求められる。
【0005】
【作用】この発明においては、算出された係数より画像の動き量および動き方向を求めるものである。係数が大きいということは、その係数に対応する前および後のフレームの画素信号は現フレームの画素信号と関連性が高いことを意味している。そのため、例えば最大の係数に対応する画素位置を特定することで、画像の動き量および動き方向を求めることが可能となる。
【0006】
【実施例】以下、この発明に係る動き検出方法の一実施例について説明する。
【0007】まず、図1の例のように、n−1フレーム、nフレーム、n+1フレームの3フレームを考える。そして、nフレームの画素信号を18タップの線形1次結合モデルで表わすものとする。すなわち、nフレームの画素信号yを、n−1フレームおよびn+1フレームの画素信号xi(i=1〜18)にそれぞれ係数wi(i=1〜18)を掛けた線形1次結合式で表現する。
【0008】
【数1】


【0009】次に、上述したような線形1次結合式の係数wiを求める。この場合、画素位置を空間方向に1画素ずつずらし、画素信号xiと、画素信号yをそれぞれ代入し、数2に示すように行列式XW=Yを形成する。ここで、Wは係数行列を示している。
【0010】
【数2】


【0011】例えば、画像を大きなブロックに分割して、各ブロックで1個の係数組を求めるとすれば、数2の行列式より1ブロックの画素数mだけの連立方程式が得られる。これはタップ数nよりもはるかに多い数となる。このm個の連立方程式を解くことで係数wiを求める。
【0012】本例では、連立方程式を最小二乗法で解いていく。つまり、数3の式に示すように、数2の行列式に残差行列Eが加えられた形とし、二乗誤差が最小となるように係数行列Wを決定する。
【0013】
【数3】


【0014】数3の式から各係数wiの最確値を見いだすには、数4の式を最小にする条件、すなわち数5で表わされるn個の条件をいれて、これを満足するw1,w2,w3,・・・,wnを見いだせばよい。
【0015】
【数4】


【0016】
【数5】


【0017】数3の式より数6の式が得られ、数5の式の条件をi=1,2,・・・,nについて立てれば、数7の式が得られる。
【0018】
【数6】


【0019】
【数7】


【0020】ここで、数3および数7の式から、数8の正規方程式が得られる。
【0021】
【数8】


【0022】この数8の正規方程式は未知数がn個だけある連立方程式であるから、これより最確値たる各係数wiを求めることができる。正確には、数8の正規方程式でwiにかかる数9のマトリックスが正則であれば解くことができる。
【0023】
【数9】


【0024】実際には、例えばガウス−ジョーダン(Gauss−Jordan)の消去法(掃き出し法)を用いて連立法定式を解くことになる。
【0025】このようにして、1ブロックにつき1組の係数wi(i=1〜n)を求めることができる。
【0026】次に、算出されたn−1フレームの画素信号に対応する係数およびn+1フレームの画素信号に対応する係数より、それぞれ最大の係数を検出すると共に、その検出された係数に対応する画素位置を特定し、画像の動き量および動き方向を動きベクトルとして求める。ここで、係数が大きいということは、その係数に対応するn−1フレームおよびn+1フレームの画素信号xiとnフレームの画素信号yの関連性が高いということを意味している。
【0027】例えば、図1に示すような18タップの線形1次結合モデルであって、n−1フレームの画素信号x1〜x9に対応する係数w1〜w9およびn+1フレームの画素信号x10〜x18に対応する係数w10〜w18が、図2R>2に示すように算出された場合を考える。この場合、係数w1〜w9のうち最も大きな係数としてw4が検出され、また係数w10〜w18のうち最も大きな係数としてw14,w15(w14,w15はほぼ同じ)が検出され、対応する画素位置が特定される。
【0028】動きベクトルと画素位置とは、例えば図3に示すように対応がとられている。そのため、係数w4に対応する画素位置に関連して(+1,0)の動きベクトルを選択し、これをn−1フレームからnフレームへの画像の動き量および動き方向を示す動きベクトルとする。また、係数w14,w15に対応する画素位置に関連して(0,0),(+1,0)の動きベクトルを選択し、これらの平均である(+0.5,0)をnフレームからn+1フレームへの画像の動き量および動き方向を示す動きベクトルとする。なお、動きベクトル(a,b)において、aは水平方向成分、bは垂直方向成分を示している。
【0029】図4は、以上述べた動き検出方法を使用する動き検出回路の構成を示している。
【0030】図において、ビデオデータSVは正規方程式形成回路1に供給され、nフレームの画素信号yが、n−1フレームおよびn+1フレームの画素信号xiにそれぞれ係数wiが掛けられた線形1次結合式で表現され、最終的に数8の正規方程式が形成される。
【0031】正規方程式形成回路1より出力される正規方程式のデータは係数演算回路2に供給され、掃き出し法等によって係数wiが演算される。この演算回路2で算出された係数wiのデータは最大値検出回路3に供給される。最大値検出回路3では、n−1フレームの画素信号に対応する係数およびn+1フレームの画素信号に対応する係数より、それぞれ最大の係数が検出される。
【0032】検出回路3で検出された係数のデータは画素位置特定回路4に供給される。この特定回路4では、検出された係数に対応する画素位置が特定される。特定回路4より出力される画素位置のデータは動きベクトル演算回路5に供給され、n−1フレームからnフレームおよびnフレームからn+1フレームへの画像の動き量および動き方向を示す動きベクトルMVが求められる。この場合、画素位置と動きベクトルとの対応が予めとられている。
【0033】なお、上述実施例においては、n−1、n、n+1の3フレームで18タップの線形1次結合モデルを使用したものであるが、基本的には空間的なタップの広がりによって求め得る動き量の大きさが決定される。ただし、タップ数を増やすと計算時間が大変長くかかるという不都合がある。そこで、大きな動きを表現できるモデルとして、サブサンプル構造を使用して空間的なタップの広がりを大きくすることが考えられる。
【0034】例えば、図5に示すような1/2の間引きパターン(82タップ)が考えられる。これにより、タップ数が同じでも、空間的なタップの広がりを大きくすることができる。この場合、数10に示すように、nフレームの画素信号yを、n−1フレームおよびn+1フレームの画素信号xi(i=1〜82)にそれぞれ係数wi(i=1〜82)を掛けた線形1次結合式で表現できる。
【0035】
【数10】


【0036】なお、1/2の間引きの他に、同様に1/4、1/8等にも間引きできることは勿論である。図6は、間引き処理を行なう場合の動き検出回路の構成を示しており、正規方程式形成回路2の前段に間引き回路6が挿入される。図6において、図4と対応する部分には同一符号を付して示している。
【0037】また、上述実施例においては、nフレームの画素信号を、その前後のn−1フレームおよびn+1フレームの双方の画素信号を使用して線形1次結合式で表現し、n−1フレームからnフレームおよびnフレームからn+1フレームへの動きを検出するものであるが、nフレームの画素信号を、n−1フレームまたはn+1フレームの画素信号を使用して線形1次結合式で表現することで、n−1フレームからnフレームまたはnフレームからn+1フレームへの動きを検出するようにしてもよい。
【0038】また、上述実施例においては、算出された係数のうち最大の係数を検出し、その係数に対応する画素位置を特定することで画像の動き量および動き方向を求めるものであるが、大きい方から複数個の係数を検出し、それらの係数に対応する画素位置を特定することで画像の動き量および動き方向を求めるようにしてもよい。
【0039】
【発明の効果】この発明によれば、あるフレームの画素信号を前および後の双方のフレームまたはいずれかのフレームの画素信号を使用した線形1次結合式で表現し、前および後の双方のフレームあるいはいずれかのフレームの画素信号に対応する線形1次結合式の係数を算出し、算出された係数より画像の動き量および動き方向を求めるものであり、画像の動き量および動き方向を良好に求めることができる。
【0040】また、前後のフレームの画素信号として間引き処理後の画素信号を使用することで、タップ数の増加を少なくして空間的なタップの広がりを大きくできる。これにより、計算時間を抑制しながら大きな動きの検出も可能となる利益がある。
【図面の簡単な説明】
【図1】この発明に係る動き検出方法を説明するための線形1次結合モデルの一例を示す図である。
【図2】算出された係数例を示す図である。
【図3】動きベクトルと画素位置との対応例を示す図である。
【図4】動き検出回路の一例を示すブロック図である。
【図5】この発明に係る動き検出方法を説明するための線形1次結合モデルの他の例を示す図である。
【図6】動き検出回路の他の例を示すブロック図である。
【符号の説明】
1 正規方程式形成回路
2 係数演算回路
3 最大値検出回路
4 画素位置特定回路
5 動きベクトル演算回路
6 間引き回路

【特許請求の範囲】
【請求項1】 あるフレームの画素信号を前および後の双方のフレームまたはいずれかのフレームの画素信号を使用した線形1次結合式で表現し、上記前および後の双方のフレームまたはいずれかのフレームの画素信号に対応する上記線形1次結合式の係数を算出し、上記算出された係数より画像の動き量および動き方向を求めることを特徴とする動き検出方法。
【請求項2】 上記算出された上記前のフレームの画素信号に対応する係数および上記後のフレームの画素信号に対応する係数よりそれぞれ最大の係数を検出し、その検出された係数に対応する画素位置を特定することで画像の動き量および動き方向を求めることを特徴とする請求項1記載の動き検出方法。
【請求項3】 上記算出された上記前のフレームの画素信号に対応する係数および上記後のフレームの画素信号に対応する係数よりそれぞれ大きい方から複数個の係数を検出し、それらの検出された係数に対応する画素位置を特定することで画像の動き量および動き方向を求めることを特徴とする請求項1記載の動き検出方法。
【請求項4】 上記前後のフレームの画素信号は間引き処理後の画素信号であることを特徴とする請求項1記載の動き検出方法。

【図1】
image rotate


【図2】
image rotate


【図3】
image rotate


【図4】
image rotate


【図5】
image rotate


【図6】
image rotate


【公開番号】特開平7−46588
【公開日】平成7年(1995)2月14日
【国際特許分類】
【出願番号】特願平5−185026
【出願日】平成5年(1993)7月27日
【出願人】(000002185)ソニー株式会社 (34,172)