説明

オブジェクト追跡方法及び装置

【課題】 ビデオにおけるオブジェクトを追跡する装置及び方法を提供する。詳細には、撮影されたシーンにおけるオブジェクトの現実感を向上させる方法及び装置を提供する。
【解決手段】 ビデオの最初のフレーム及び最後のフレームを特定し、検出されたオブジェクトの経路に、出力された位置データを改善する補正処理を施すことによって、現実感の向上が実現される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オブジェクト追跡方法及び装置に関する。
【背景技術】
【0002】
現在、一連の画像にわたってオブジェクトの位置を追跡することが必要とされている。この技術の一例は、スポーツ関連のテレビジョン放送である。ライブのスポーツイベントの撮影中に、ビデオクリップ中の、ピッチ(グラウンド)上でのボールの位置を追跡してハイライト表示し、そのイベントに関する他の情報を正確に取得することが有用である。この正確に取得された情報は、後にそのスポーツイベントのコンピューターシミュレーションを形成する際に用いることができる。例えば、コンピュータゲーム業界において、現実のスポーツイベントを仮想空間に再構築する可能性がある。現実のスポーツイベントを正確に仮想空間に移し替えるために、撮影したビデオクリップを用いて、グラウンド上でのボールの位置及びボールの軌跡を、試合を通して正確且つ現実的に求める必要がある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】米国特許第6072504号明細書
【特許文献2】国際公開WO2007/045001号パンフレット
【特許文献3】国際公開WO2008/069995号パンフレット
【特許文献4】国際公開WO2007/035878号パンフレット
【特許文献5】米国特許公開第2007/0086622号明細書
【特許文献6】国際公開WO2006/077806号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0004】
これを達成するための一つの方法は、操作者がスポーツイベントの撮影画像を見て、ビデオのフレーム毎に、例えばグラウンド上のボールの位置を記録することである。しかしながら、これには多くの欠点がある。第1に、この手法には非常に時間と手間がかかる。第2に、スタジアムにおいてビデオを撮影しているテレビジョンカメラは1つの位置に固定されていない(すなわち、カメラがボールを追ってパン及びチルトする)ため、操作者がフレーム毎にボールの位置を記録しても、グラウンド上のボールの位置を特定する正確な情報を提供することができない。
【0005】
本発明の実施形態は、グラウンド上のボールの位置を現実的に求めるという課題に対処することを目的とする。
【0006】
本発明の第1の態様によれば、或る位置に固定された少なくとも1台のカメラによって撮影され、第1のフラグ付きフレーム及び第2のフラグ付きフレームを有する、或る場所を映したビデオにおけるオブジェクトを追跡するオブジェクト追跡方法が提供される。当該方法は、前記ビデオの前記第1のフラグ付きフレームにおける第1のアンカーポイントを検出し、前記第1のフラグ付きフレーム及びそれ以降のフレームにおいて、前記場所内での前記オブジェクトの位置を検出し、前記ビデオの前記第2のフラグ付きフレームにおける第2のアンカーポイントを検出し、前記第2のフラグ付きフレームにおいて、前記場所内での前記オブジェクトの位置を検出し、前記第1のフラグ付きフレームから前記第2のフラグ付きフレームまでの各フレームにおいて、前記場所内での前記オブジェクトの位置を、多項式に従って調整し、前記第1のフラグ付きフレーム及び前記第2のフラグ付きフレームにおいて検出されたアンカーポイントにおいて発生したアクションを識別するメタデータが定義され、前記アクションは、所定のアクションリストから選択される。
【0007】
これにより、前記場所内での前記オブジェクトのモデリングの現実感がより向上するため、有用である。この現実感は、前記オブジェクトの位置を、前記場所を撮影したビデオクリップから導出することにより、向上する。多項式は、対象となるオブジェクトについてのいかなる事前知識や物理モデルも有することなく、前記場所内での前記オブジェクトの種々の異なる動きに適合することができる。
【0008】
さらに、発生したアクションを識別するメタデータを、アクションの所定のリストから選択できるようにすることにより、さらなる利点が提供される。これにより、アクションを選択する速度が速くなる。
【0009】
前記多項式は、前記ビデオの前記第1のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置から、前記ビデオの前記第2のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置にわたる。
【0010】
前記ビデオの前記各フレームにおける前記オブジェクトの検出された位置と、前記多項式によって定義された前記ビデオの前記各フレームにおける前記場所内での前記オブジェクトの位置との間の誤差が最小限となるように、前記多項式のパラメータが選択される。
【0011】
前記第2のアンカーポイントは、前記オブジェクトの方向変化に応じて検出される。
【0012】
前記多項式は、多項式補間法を用いて生成される。
【0013】
前記多項式は、ファンデルモンド行列を用いて生成される。
【0014】
前記ビデオにおけるオブジェクトを追跡する前に、当該ビデオのフレームにおいて、前記場所における既知の位置に対応する複数の位置を規定し、前記ビデオの前記フレームから、前記場所内での前記既知の位置を基準として、前記ビデオにおける他の位置を規定する。
【0015】
前記場所は、少なくとも1本の直線を有し、前記ビデオにおける前記オブジェクトを追跡する前に、前記カメラによって撮影された前記ビデオにおける前記直線の位置が、前記場所における前記直線に対応するように適合される。
【0016】
前記オブジェクトの前記調整された位置は、仮想環境内での前記オブジェクトの位置を定義するために用いられる。
【0017】
本発明の第2の態様によれば、或る位置に固定された少なくとも1台のカメラによって撮影され、第1のフラグ付きフレーム及び第2のフラグ付きフレームを有する、或る場所を映したビデオにおけるオブジェクトを追跡するオブジェクト追跡装置が提供される。当該装置は、前記ビデオの前記第1のフラグ付きフレームにおける第1のアンカーポイントを検出する第1の検出部と、前記第1のフラグ付きフレーム及びそれ以降のフレームにおいて、前記場所内での前記オブジェクトの位置を検出する第2の検出部と、前記ビデオの前記第1のフラグ付きフレームにおける第2のアンカーポイントを検出し、前記第2のフラグ付きフレームにおいて、前記場所内での前記オブジェクトの位置を検出する第3の検出部と、前記第1のフラグ付きフレームから前記第2のフラグ付きフレームまでの各フレームにおいて、前記場所内での前記オブジェクトの位置を、多項式に従って調整する処理部とを具備し、前記第1のフラグ付きフレーム及び前記第2のフラグ付きフレームにおいて検出されたアンカーポイントにおいて発生したアクションを識別するメタデータが定義され、前記アクションは、所定のアクションリストから選択される。
【0018】
前記多項式は、前記ビデオの前記第1のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置から、前記ビデオの前記第2のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置にわたる。
【0019】
前記ビデオの前記各フレームにおける前記オブジェクトの検出された位置と、前記多項式によって定義された前記ビデオの前記各フレームにおける前記場所内での前記オブジェクトの位置との間の誤差が最小限となるように、前記多項式のパラメータが選択される。
【0020】
前記第2のアンカーポイントは、前記オブジェクトの方向変化に応じて検出される。
【0021】
前記多項式は、多項式補間法を用いて生成される。
【0022】
前記多項式は、ファンデルモンド行列を用いて生成される。
【0023】
係数を行列として計算された多項式は、従来の多項式解よりも処理し易いため、本発明の実施形態がコンピュータにおいて実現される際に有用である。
【0024】
前記処理部は、前記ビデオにおけるオブジェクトを追跡する前に、当該ビデオのフレームにおいて、前記場所における既知の位置に対応する複数の位置を規定し、
前記ビデオの前記フレームから、前記場所内での前記既知の位置を基準として、前記ビデオにおける他の位置を規定する。
【0025】
前記場所は、少なくとも1本の直線を有し、前記ビデオにおける前記オブジェクトを追跡する前に、前記カメラによって撮影された前記ビデオにおける前記直線の位置が、前記場所における前記直線に対応するように適合される。
【0026】
前記オブジェクトの前記調整された位置は、仮想環境内での前記オブジェクトの位置を定義するために用いられる。
【0027】
ビデオマテリアル、及び当該ビデオマテリアルに関連付けられた、本発明の一実施形態に係る方法に従って生成された前記調整された位置データを格納した記憶媒体と、仮想環境を生成する処理部とを具備するコンピュータも提供される。前記仮想環境は、当該仮想環境内の前記記憶された、前記ビデオマテリアルに関連付けられ、調整された位置データに対応する位置に位置する前記オブジェクトを含む。
【0028】
ビデオマテリアル、及び当該ビデオマテリアルに関連付けられた、本発明の一実施形態に係る方法に従って生成された前記調整された位置データを有する記憶媒体。
【0029】
本発明の別の態様によれば、或る位置に固定された少なくとも1台のカメラと、本発明の一実施形態に係る装置とを具備する、或る場所内のオブジェクトを撮影及び追跡するシステムも提供される。
【0030】
コンピュータに、本発明の一実施形態に係る方法の各ステップを実行させるためのプログラムも提供される。
【0031】
本発明の一実施形態に係るプログラムを格納した記憶媒体も提供される。
【図面の簡単な説明】
【0032】
【図1】サッカーグラウンドを上から見た図である。
【図2】本発明の一実施形態に係る画像処理センターの概略図である。
【図3】三角測量を説明する図である。
【図4A】図1に示されるカメラから見た、サッカーグラウンドの一部の展望図である。
【図4B】本発明の一実施形態に係る、図4Aに示す画像における線の補正を説明する図である。
【図5A】本発明の実施形態に係るオブジェクト追跡の例を示す図である。
【図5B】本発明の実施形態に係るオブジェクト追跡の例を示す図である。
【図5C】本発明の実施形態に係るオブジェクト追跡の例を示す図である。
【図5D】本発明の実施形態に係るオブジェクト追跡の例を示す図である。
【図5E】本発明の実施形態に係るオブジェクト追跡の例を示す図である。
【図5F】本発明の実施形態に係るオブジェクト追跡の例を示す図である。
【図6A】本発明の実施形態に係るオブジェクト追跡の別の例を示す図である。
【図6B】本発明の実施形態に係るオブジェクト追跡の別の例を示す図である。
【図6C】本発明の実施形態に係るオブジェクト追跡の別の例を示す図である。
【図6D】本発明の実施形態に係るオブジェクト追跡の別の例を示す図である。
【図6E】本発明の実施形態に係るオブジェクト追跡の別の例を示す図である。
【図7】本発明の実施形態に係るオブジェクト追跡の別の例を示す図である。
【図8】本発明の実施形態を用いることができるコンピュータを示す図である。
【発明を実施するための形態】
【0033】
本発明の上記及びその他の目的、特徴及び利点は、添付の図面を参照して、以下の例示的な実施形態の詳細な説明により明らかになる。
【0034】
図1を参照して、プレイ領域102A〜102Dによって規定されたサッカーのグラウンドが示されている。他のサッカーグラウンドと同様に、プレイ領域を規定する複数の他の線(ペナルティボックス、センターサークル等)も設けられている。このような線の1つは、図1に示すペナルティボックス104の縁に沿っている。
【0035】
図1には、任意選択された基準点106も示される。図1には3つの基準点のみが示されるが、実施形態においては、各カメラについて任意の数の基準点が選択されてよい。これらの基準点は、試合を通して変化せず、この場合、図1に示すペナルティボックスの1つの角、ペナルティスポット、及びグラウンドのコーナーに配置される。しかしながら、これらの基準点はグラウンド100上のどこに配置されてもよい。この基準点の重要性は、後に図4A及び図4Bを参照して説明する。なお、上記では、サッカーグラウンドに関連する実施形態を説明したが、任意のスポーツのグラウンド、又は静的なレイアウトを有する任意の場所も等価に用いることができる。
【0036】
サッカーグラウンド100から画像を撮影するために、図1のカメラ構成が採用される。詳細には、ビデオカメラ108及び110がそれぞれ、サッカーグラウンド100上の所謂「18ヤードライン」に配置される。好ましくは、これらのカメラは高精細カメラであり、その視野はゴールエリアまでにわたる。これらのカメラは視野が固定されている。また、サッカーグラウンド100のセンターラインに位置するカメラ構成112も設けられる。各カメラの視野はわずかに重なっており、カメラ構成112によって提供される3つの異なる視野を「スティッチ」することにより、サッカーグラウンド100全体の合成画像が生成される。このスティッチは周知の技術であるため(例えば、英国特許公開第2 444 533号には、このような構成及び画像のスティッチが詳述されている)、この特定の特徴は、本明細書において詳しくは説明しない。カメラ構成112は、3つのカメラ要素を有する。各カメラ要素は、1つの位置に固定され、視野が固定された高精細カメラである。
【0037】
18ヤードカメラ108及び110からの出力並びにカメラ構成112からの出力は、図2を参照して説明する画像処理センター114に供給される。各カメラは、固定された視野、既知の位置、及び焦点距離等の既知のパラメータを有する。したがって、これらのパラメータは固定であるため、2台のカメラからの出力を用いて、三角測量法により、グラウンド100上のボールの位置を求めることができる。これは、図3に関連して後に説明する。
【0038】
詳細な実施形態では、18ヤードカメラ108の出力とカメラ構成112の出力を共に用いて、視野内のオブジェクトの位置を三角測量する。また、他方の18ヤードカメラ110とカメラ構成112を共に用いて、視野内のオブジェクトの位置を三角測量する。
【0039】
図2を参照して、各カメラ108及び110並びにカメラ構成112からの出力は、画像処理センター114内に位置する画像処理部200に供給される。画像処理部200は、高精細画像の処理に特に適したコンピュータである。このようなコンピュータの1つは、所謂Cell Processorである。
【0040】
画像処理部200には、各18ヤードカメラ108及び110、並びにカメラ構成112からの画像データを記憶するために用いられる記憶媒体202が取り付けられる。これに加えて、記憶媒体202は、グラウンド100上のボールの位置データ、及びビデオコンテンツに関するその他のメタデータを記憶する。メタデータとは、一般に「データについてのデータ」を意味する技術用語である。画像処理の文脈では、メタデータは、カメラマンの詳細情報、場所についての詳細情報、グッドショットマーカ(good shot marker)、及びビデオマテリアルについての他の情報を含む。しかしながら、本発明の実施形態では、メタデータはビデオの各フレームのコンテンツに関する情報を含む。これらの情報は、例えばグラウンド100上の選手の位置、各フレームにおいて行われたアクションの詳細情報、グラウンド100上のボールの位置を特定する情報等である。通常、メタデータのデータ量は、ビデオデータのデータ量よりも少ない。
【0041】
さらに、記憶媒体202には、較正情報が記憶される。この較正情報は、三角測量を実行可能にする情報を提供する。この較正情報は、図1における固定された点を参照して記述される。上述のように、図1の構成における各カメラは、互いに対して、且つグラウンド100に対して固定される。したがって、システムの較正中に、グラウンド100上において複数の位置を規定し(ここでは、グラウンド上での物理的な位置の分かっている3つの位置)、グラウンドの寸法、及び焦点距離等のカメラのパラメータを知ることにより、画像処理部200が、各カメラが撮影した画像の各画素と、サッカーグラウンド100上の対応する位置との関係を規定する較正データを生成することが可能となる。言い換えれば、2台のカメラによって出力された画像上でのオブジェクトの位置から、グラウンド100上のそのオブジェクトの位置が計算される。この較正情報は、三角測量を実行する際に用いられ、場合によっては「カメラマトリクス」とよばれる。これは、図3を参照して説明する。
【0042】
図3において、18ヤードカメラ108及びカメラ構成112のうちの1つのカメラ要素から出力された2つの画像平面3002及び3004が存在する。説明を簡潔にするために、画像平面3002及び3004には1つのオブジェクト3006のみが示される。オブジェクト3006は、「現実」のグラウンド100上の位置(すなわち、3次元上の位置)にある。オブジェクト3006は画像平面3002上の位置3012にあり、且つ画像平面3004上の位置3014にある。三角測量により、画像平面3002及び3004上のオブジェクトの位置から、グラウンド100上のオブジェクト3006の位置を求めることが可能である。
【0043】
3次元空間に向けて(すなわち、画像平面に対して垂直に)、画像平面3002におけるオブジェクト3006の位置3012からの直線3010又は細い円錐、及び、それに対応する、画像平面3004におけるオブジェクト3006の位置3014からの直線3008又は細い円錐が引かれている場合、これらの線が交差する点がオブジェクト3006の位置と見なされる。
【0044】
しかしながら、当業者には理解されるように、システムの較正において本質的に存在する誤差により、直線3008と直線3010とが必ずしも実際に交差するわけではない。これに対処するために、実施形態では、直線3008と直線3010とを結ぶ最短ベクトルが求められ、このベクトルの中間点が、オブジェクト3006の位置として決定される。この方法を用いて、直線3008と直線3010とが実際に交差している場合、オブジェクト3006の位置はその交差点となる。システムの較正中、オブジェクト3006は、基準点106のうちの1つであり、オブジェクトの検出及び追跡中、オブジェクト3006はグラウンド100上にある(例えば、選手又はボールである)。
【0045】
図2に戻り、記憶媒体202は、画像処理センター114に内蔵されるハードディスクドライブ又は光媒体であってよい。或いは、記憶媒体202は、メモリースティック(登録商標)等の取り外し可能な媒体であってもよい。同様に、記憶媒体202はこれらの2種類の記憶媒体の組み合わせであってもよいことは明らかである。
【0046】
画像処理部200には、ユーザ端末204も接続される。図示しないが、ユーザ端末204は、少なくとも1つのユーザ入力部を有することが想定される。ユーザ入力部により、操作者がユーザ端末、及びその後に画像処理部200に情報を提供することが可能になる。ユーザ端末204には、各カメラ108及び110又はカメラ構成112から提供された画像マテリアルを、リアルタイムで、又は記憶媒体202を介して表示するユーザディスプレイ206が設けられている。ユーザディスプレイ206には、グラフィカルユーザインタフェースも表示される。グラフィカルユーザインタフェースにより、ユーザは画像処理部200を制御し、画像処理部200と対話できるようになる。
【0047】
図4Aにおいて、18ヤードカメラ108からの視野が示される。図4Aに示すように、2本の線104及び104’が示されている。線104’は、18ヤードカメラ108によって提供される、18ヤードラインの画像である。線104は、サッカーグラウンド100上の実際の線である。線104’がわずかにカーブして見える現象は、18ヤードカメラ108のレンズ歪によるものである。レンズ歪は、直線をカーブして見せる効果がある。レンズ歪は、18ヤードカメラ108によって撮影された画像を用いてサッカーグラウンド100上でのオブジェクトの位置を評価する際に問題となる。これは、較正データを生成する際に、レンズ歪を容易に測定することができないためである。
【0048】
そこで、本発明の実施形態では、ユーザ端末294の操作者が、18ヤードカメラ108及び110並びにカメラ構成112からの出力を見て、これらの線を直線に直し、オブジェクト追跡の際に収集される、グラウンド上でのオブジェクトの位置データが、レンズの歪みによって損なわれないようにする。この線の補正を図4Bに示す。ユーザ端末204の操作者は、18ヤードライン104を直線に描き直す。記憶媒体202に記憶されたグラウンド100の寸法が、この変更に対応して更新される。
【0049】
システムの較正中に(すなわち、オブジェクトの検出又は追跡が行われる前に)この線の補正を実行することにより、その後に検出又は追跡されるオブジェクトの位置の精度が向上する。
【0050】
図5A〜図5Fを参照して、サッカーグラウンド100のセンターサークルの周囲に、複数の選手が示される。詳細には、図5において、選手A400、選手B401、及び選手C402が具体的に参照される。選手A及び選手BはチームAとしてプレイし、選手CはチームBとしてプレイする。なお、各選手は、選手を囲む2種類のハイライトのいずれか一方によってハイライト表示される。選手Cは、チームAのハイライト404によってハイライト表示され、選手A及びBは、チームBのハイライト406によってハイライト表示される。図5において、チームAはハイライトとして実線を有し、チームBはハイライトとして破線を有する。しかし、典型的には、ハイライトの区別のために、線のスタイルの違いではなく、色の違いが用いられる。
【0051】
選手A、選手B及び選手Cを識別する情報は、記憶媒体202に記憶され、サッカーの試合中の各選手の動き及びそれに応じた位置も、記憶媒体202に記憶される。選手を追跡するための様々な技術が、当該技術分野において周知である。例えば、英国特許公開第2452512号は、選手の追跡について記載いるため、本明細書では詳しく説明しない。
【0052】
さらに、本発明の実施形態では、ビデオの各フレームにおけるボール410の位置が検出される。グラウンド100上のボール410の位置は、三角測量を用いて計算され、ビデオの各フレームと関連付けて記憶媒体202に記憶される。ボールの位置及び選手の位置は、いずれもメタデータとして、ビデオの各フレームと関連付けて記憶される。サッカーの試合中、グラウンド100上のボール410の位置が追跡される。
【0053】
図5Bを参照して、チームAのハイライト404及びチームBのハイライト406は、説明を分かりやすくするために除外されている。サッカーの試合中に選手A400がボールを受け取ると、ユーザ端末204の操作者は、この特定のビデオフレームが、それに関連付けられるアクションを有していることを画像処理装置200に通知する。ビデオのフレームは試合と同期されるため、どのフレームにおいてどのアクションが行われたかを知ることにより、特定のアクションが、試合中のどの時点で行われたかを知ることができる。後に説明するように、この動作はアンカーとして機能する。操作者がこのフレームを、それに関連するアクションを含むものとして識別すると、それに応じて、アクション選択メニュー412が画面上に現れる。このアクション選択メニューにより、ユーザは、複数のアクションの選択肢の中から、当該フレームに関連付けるアクションを選択する。例えば、操作者は、ボールが選手A400により右足でキックされるのを識別することができる。他の選択肢としては、選手A400がボールを左足でキック又はボレーする、右足若しくは左足でボールをドリブルする、ボールをコントロールする、ボールをヘディングする、又は任意の他の適当なアクションがある。さらに、アクションは、ボールのバウンド、ボールがラインの外に出る等であってもよい。アクションを識別するメタデータは、対応するビデオフレームに関連付けて記憶される。
【0054】
アクション選択メニュー412から適当な選択肢を選択する時間をユーザに与えるために、ビデオ映像を任意の方法で一時停止する。ビデオ映像は、アクション選択メニュー412が起動される度に一時停止される。ボール410は自動的に検出され、グラウンド100上のボール410の位置が三角測量を用いて計算されるが、ユーザが、アクション選択メニュー412が起動されたときに、ボール410の位置を手動でマークしてもよい。
【0055】
図5Cにおいて、ボール410は空中にあり、選手B401の方に向かっている。ボール410、グラウンド100から距離dの位置にある。また、図5Cにおいて、ボール410の検出された経路が示される。空中でのボール410を追跡するために、ボール410は、連続した各フレームについて検出される必要がある。
【0056】
図5Cから分かるように、ボールは、キックされた後にはこのように移動しないため、ボール410の検出された経路は正確ではない。ボール410の検出された経路と、ボールの実際の経路との間の誤差は、ボールの検出処理によって生じる。これは、連続したフレームにおいてボールが誤検出されたためか、又はボール410の位置を正しく求められなかったためである。その他の誤差は、ボールの動きを誤って検出すること、連続したフレームにわたってのボール410の中心点の位置の非一貫性、選手の足を誤ってボール410と認識してしまう等の誤検出によって生じる。したがって、ボール410の検出経路から生成される、サッカーグラウンド100上のボールの位置を特定するいかなる位置データも、不正確となってしまう。
【0057】
これは、図5Dにおいても示される。図5Dは、選手B401への経路をさらに進んだボール410を示す。図5Dから分かるように、ボール410のさらなる検出経路412’は、実際のボール410の経路と一致しない。
【0058】
図5Eに示すように、ボール410が選手B401に達すると、ユーザ端末204の操作者は、第2のアンカーを作成する第2のアクション選択メニュー414を起動して、フレームに関連付けられるアクションを記述するメタデータを生成し、そのフレームにフラグを付ける。ボール410の完成した検出経路412’は、不正確である。結果として、ボール410が検出経路を辿ったと想定した場合、画像処理装置200は、正しくない結果を生成してしまう。しかしながら、第2のアクション選択メニューを開くことにより、ユーザ端末204の操作者は、画像処理装置200に対し、ボール410が選手B401に到達したこと、及びボール410の行き先を通知することができる。これにより、画像処理部200に対し、ボール410が、選手A400から選手B401への経路を終了したことを通知し、また、画像処理部200に、ボール410の行き先を知らせることができる。
【0059】
ボール410の完成経路412"の誤りを訂正するためには、画像処理部200は、ボール410の完成経路412"により提供された位置データに対し、さらなる処理を実行する必要がある。本発明の実施形態では、図5Fに示すボール410のフィルタリングされた経路416(訂正経路)が、ファンデルモンド行列により求められる。ボール410の不正確な完成経路412"を、ファンデルモンド行列(すなわち、アクション選択メニューの最初の起動時から二度目の起動時までの各フレームにおける、ボール410の検出位置)に配置する結果として、検出された位置に類似する多項式形の係数が生成される。ユーザ端末204の操作者によってアクション選択メニュー412及び414が起動されたときのボール410の位置情報により、多項式の始点及び終点が提供される。
【0060】
言い換えれば、任意の特定のフレームについて、ボールの位置は、以下の多項式により定義される。
=a+a+a+a (1)
ここで、nは、用いられた多項式の次数である。
【0061】
したがって、M個のフレームのセット(すなわち、第1のアクション選択ボックス412の起動から第2のアクション選択ボックス414の起動までのフレーム)について、上記をファンデルモンド行列として、以下のように記述することができる。
【0062】
【数1】

【0063】
この行列は、Va=xの形であり、多項式係数を得るために、aの値を求める必要がある。したがって、
Va=x
Va=V
a=(VV)−1xである。
ここで、(VV)−1は、当業者には理解されるように、擬似反転である。
【0064】
上記のファンデルモンド行列を用いて生成された係数を有する多項式は、図5に示すボール410のフィルタリングされた経路416を提供する。ユーザ端末204の操作者が第1のアクション選択メニュー412を起動してから、第2のアクション選択メニュー414を起動するまでの各フレームについて求められたグラウンド100上のボール410の位置は、生成された多項式に適合するように調整される。これにより、非常に現実的且つより正確なボールの位置データが提供される。なお、本実施形態では多項式を用いたが、任意の適当な種類の式を用いてよい。例えば、風速、気圧、ボールの表面特性等が正確に分かっている場合、ボールの動きについて正確な物理モデルを構築し、画像処理部200を用いて、繰り返し解を求めることができる。しかし、正確に解を求めるには、高い処理能力が必要とされる。しかしながら、この行列反転方法は、現代のコンピュータに広く普及し、最適化された標準的なルーティンを利用するため、必要とする処理能力が格段に低い。勿論、本発明の実施形態はこの方法に限定されず、ネヴィルのアルゴリズム又はラグランジュ公式等の他の多項式補間技術を用いてもよい。
【0065】
ボールの実際の経路を正確に模倣する多項式を生成するためには、6次式で十分であることが分かったが、サンプルのサイズ(すなわち、第1のアクション選択メニュー412の起動から第2のアクション選択メニュー414までのフレーム数)が限定されている場合には、より低次の多項式が用いられる。
【0066】
図6A〜図6Eは、ボール410が選手A400によって蹴られ、選手B401がそれを受け取るまでにボール410がバウンドした状況を示す。図5Bでは、ユーザ端末204の操作者は、アクション選択メニュー412を用いて、選手A400がどちらかの足でボールを蹴ったことを選択していた。分かりやすくするために、このアクション選択メニューは、図6Aには示されない。図6Bでは、ボール410がグラウンド上でバウンドしている。既に述べたように、各フレームにおけるボール410の誤検出のため、バウンドしたボール410の検出経路500は不正確に示される。しかし、ボール410がバウンドしたとき、ユーザ端末204の操作者は、上述のような複数の選択肢を有する第3のアクション選択メニューを開く。ユーザは、ボールのバウンドを選択し、これは、特定のフレームに関連付けられるメタデータとして記憶媒体202に記憶される。この段階では、画像処理部200は、図5Fに関して説明したファンデルモンド行列を用いてフィルタリングされた経路504を生成する。ここでも、ボール410の軌跡、ひいては各フレームにおけるグラウンド100上でのボール410の位置が、バウンドしたボールのフィルタリングされた経路に適合した経路となるように調整される。
【0067】
グラウンド100上でのボール410の位置が軌跡に合わせて調整された後、バウンドの位置(第3のアクション選択メニューによって特定される)及び試合中にそのアクションが行われた時刻(又はフレーム)が、記憶媒体202に記憶される。
【0068】
ビデオは続けられ、各フレームにおけるボール410の位置が検出される。マークされたバウンド位置515から選手B401までの、バウンドしたボールのさらなる検出経路505’は、ここでも不正確である。ボール410が選手B401に到達したとき、ユーザ端末204の操作者は、第4のアクション選択ボックス505を開き、適当なアクションを選択する。このアクションの選択は、フラグ又はアンカーとして機能する。ここでも、このアクションは、そのビデオフレームに関連付けられたメタデータとして記憶される。
【0069】
バウンドしたボールのさらなる検出経路500"は、ファンデルモンド行列に配置され、マークされたバウンド位置515から、第4のアクション選択ボックスによって特定されたボール位置までの、バウンドしたボールのフィルタリングされたさらなる検出経路510が生成される。図6Eから分かるように、バウンドしたボールの経路は、実際には、バウンドしたボールのフィルタリングされた経路504と、バウンドしたボールのフィルタリングされたさらなる経路510との2つの部分からなる。これは、ボール410がグラウンド上でバウンドしたことに伴う、ボールの方向の急激な変化を示している。すなわち、この急激な方向変化を、ボールの移動方向が、短いフレーム期間のうちに所定の角度以上変化した点であると判定することができる。この所定の角度は、例えば90度である。
【0070】
本発明の実施形態は、選手Aから選手Bまでの経路を単にフィルタリングする場合と比べ、有効である。これは、ボールの検出された経路のフィルタリングが、選手A400から選手B401までの間でのみ行われる場合、経路全体が、2人の選手の間で平坦になってしまうためである。これは、現実の経路と一致しない。ボールがグラウンド上でバウンドしたときに「フラグ」を付ける(すなわち、第3のアクション選択メニューを用いて、アクションが起こったフレームにマークを付ける)ことにより、グラウンド上のボール410の経路をより正確にすることができる。本発明の実施形態では、ボール410の急激な方向変化(例えば、バウンドした場合)を自動的に検出し、フラグ及びボールの位置を生成するために用いることができる。また、ユーザがボールのキック等のアクション(左キック、右キック、ボレー等)を選択し、アンカーポイントを生成すると、受け取ったボールをヘディング又はボレーする第2の選手が、方向変化及び地面からボールまでの高さから自動的に判定される。
【0071】
選手B401がボール410を足で受けると、選手B401はおそらくそのボールをドリブルしようと望む。これには、ボール410が選手B401の足の非常に近くにある必要がある。ボール410が選手B401の足に非常に近接することにより、ボール410の検出がより難しくなり、誤りが生じやすくなる。これは、カメラ108及び110、並びにカメラ構成112が固定されている場合に当てはまる。
【0072】
したがって、図7(A)の場合のように選手がボールをドリブルする場合、ユーザ端末204の操作者は、図5及び図6において説明したものと同様の技術を用いて、ボール検出により収集される位置又はデータを向上させることができる。
【0073】
図7(A)において、選手B401は、ボールを位置410’に移動させる。これにより、新たな位置B401’(破線により示す)が与えられる。しかしながら、選手の走る方向がカーブしたからといっても、ドリブルされたボールの検出経路600はやはり不正確である。これにより、連続したフレーム間で、グラウンド100上でのボール410の位置を特定する際に誤りが生じやすくなる。したがって、ユーザ端末204の操作者は、所定数のフレーム毎に、フラグ又はアンカーを生成する。例えば、操作者は、5フレーム毎にフラグを生成してもよく、又は操作者が適当と考える任意の他の所定数毎であってもよい。各フラグ又はアンカーの後、画像処理部200は、ドリブルされたボール410の検出経路600を、アンカーポイント間のファンデルモンド行列に配置し、これにより、図7(B)に示すようなドリブルされたボールのフィルタリングされた経路605が提供される。
【0074】
図8を参照して、試合の各フレームについてボールの位置が確定されると、その試合に関連付けられたメタデータ、アクションが起こる毎にアクション選択メニューから選択されたアクション、及び選手追跡により生成された選手の位置データが照合される。この照合されたデータにより、仮想の選手を用いて試合を再構築するのに十分な情報が提供される。ネットワーク705及びディスプレイ715に接続されたプレイステーション(登録商標)3 710等の汎用のホームコンピュータシステム700において、これらのモデルを構築することができる。
【0075】
各フレームにおける各選手の位置情報により、プレイステーション(登録商標)3 710は、仮想のグラウンドのどこに仮想選手を配置するかを知る。さらに、ボールのフィルタリングされた位置情報により、プレイステーション(登録商標)3 710は、ボールがどの時点でどこにあったかを知る。さらに、選択されたアクションの発生を通知する情報により、プレイステーション(登録商標)3 710は、選手が正しい足で且つ正しい時点でボールを蹴るように、仮想モデルを操作することができる。
【0076】
このレベルの詳細情報により、リアルタイムのビデオ映像を、コンピュータゲームに用いるために、仮想環境にモーフィングすることが可能である。実際の試合の照合されたデータを、インターネット等のネットワーク又はその試合のデータを含む記憶媒体(図示せず)或いはその2つの組み合わせを介して提供することができる。これに代えて、又はこれに加えて、サッカーのコーチや解説者が、試合の詳細な分析を行うことも可能である。
【0077】
上記は、映像の短いセグメントにおいて補正されるフィルタリングされたボールの経路を参照して説明されたが、これは本発明の実現する唯一の方法ではないということを理解されたい。他の実施形態では、試合の各フレームにおけるボールの位置が特定され、すべてのアンカー及びアンカーに関連付けられたメタデータが、上述のように生成される。その後、編集段階において、試合の映像全体に対し、アンカーを考慮に入れたボールフィルタリングが適用される。
【0078】
上記は、サッカーの試合におけるボールの追跡に関して説明されたが、本発明はこれに限定されない。例えば、オブジェクトは、任意のスポーツのボールであってもよく、さらには、一連の画像にわたって検出し、追跡する必要のある任意のオブジェクトであってよい。
【0079】
さらに、上記は画像処理部200を参照して説明されたが、本発明の実施形態は、コンピュータ上で実行されてもよい。これは、本発明の実施形態では、コンピュータを上述のような画像処理部200として機能させるためのコンピュータ読取可能な命令を有するコンピュータプログラムが提供されるということを意味している。このコンピュータプログラムは、光記憶媒体、固体媒体、又は磁気ディスクタイプの媒体として提供されてよい。
【0080】
操作者がアンカーポイントを手動で指定することの利点は、アンカーポイントの選択に影響を与えるノイズを防止できることである。サッカー等のいくつかのスポーツでは、非常に多くの種類のボールとの相互作用が存在するが、追跡に用いられるカメラは、このアクションからかなり遠い位置にある場合がある。そのため、自動化されたシステムにおいては、アンカーポイントの誤検出が発生する可能性がある。
【0081】
本明細書において、本発明の例示的な実施形態を、添付の図面を参照して説明したが、本発明はこれらの厳密な実施形態に限定されず、当業者は、添付の特許請求の範囲によって規定される本発明の範囲及び精神から逸脱することなく、種々の変更及び変形を行ってもよいことを理解されたい。

【特許請求の範囲】
【請求項1】
或る位置に固定された少なくとも1台のカメラによって撮影され、第1のフラグ付きフレーム及び第2のフラグ付きフレームを有する、或る場所を映したビデオにおけるオブジェクトを追跡するオブジェクト追跡方法であって、
前記ビデオの前記第1のフラグ付きフレームにおける第1のアンカーポイントを検出し、
前記第1のフラグ付きフレーム及びそれ以降のフレームにおいて、前記場所内での前記オブジェクトの位置を検出し、
前記ビデオの前記第2のフラグ付きフレームにおける第2のアンカーポイントを検出し、
前記第2のフラグ付きフレームにおいて、前記場所内での前記オブジェクトの位置を検出し、
前記第1のフラグ付きフレームから前記第2のフラグ付きフレームまでの各フレームにおいて、前記場所内での前記オブジェクトの位置を、多項式に従って調整し、
前記第1のフラグ付きフレーム及び前記第2のフラグ付きフレームにおいて検出されたアンカーポイントにおいて発生したアクションを識別するメタデータが定義され、
前記アクションは、所定のアクションリストから選択される
オブジェクト追跡方法。
【請求項2】
請求項1に記載のオブジェクト追跡方法であって、
前記多項式は、前記ビデオの前記第1のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置から、前記ビデオの前記第2のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置にわたる
オブジェクト追跡方法。
【請求項3】
請求項2に記載のオブジェクト追跡方法であって、
前記ビデオの前記各フレームにおける前記オブジェクトの検出された位置と、前記多項式によって定義された前記ビデオの前記各フレームにおける前記場所内での前記オブジェクトの位置との間の測定誤差が最小限となるように、前記多項式のパラメータが選択される
オブジェクト追跡方法。
【請求項4】
請求項1に記載のオブジェクト追跡方法であって、
前記第2のアンカーポイントは、前記オブジェクトの方向変化に応じて検出される
オブジェクト追跡方法。
【請求項5】
請求項1に記載のオブジェクト追跡方法であって、
前記多項式は、多項式補間法を用いて生成される
オブジェクト追跡方法。
【請求項6】
請求項5に記載のオブジェクト追跡方法であって、
前記多項式は、ファンデルモンド行列を用いて生成される
オブジェクト追跡方法。
【請求項7】
請求項1に記載のオブジェクト追跡方法であって、さらに、
前記ビデオにおけるオブジェクトを追跡する前に、当該ビデオのフレームにおいて、前記場所における既知の位置に対応する複数の位置を規定し、
前記ビデオの前記フレームから、前記場所内での前記既知の位置を基準として、前記ビデオにおける他の位置を規定する
オブジェクト追跡方法。
【請求項8】
請求項1に記載のオブジェクト追跡方法であって、
前記場所は、少なくとも1本の直線を有し、
前記ビデオにおける前記オブジェクトを追跡する前に、前記カメラによって撮影された前記ビデオにおける前記直線の位置が、前記場所における前記直線に対応するように適合される
オブジェクト追跡方法。
【請求項9】
請求項1に記載のオブジェクト追跡方法であって、
前記オブジェクトの前記調整された位置は、仮想環境内での前記オブジェクトの位置を定義するために用いられる
オブジェクト追跡方法。
【請求項10】
或る位置に固定された少なくとも1台のカメラによって撮影され、第1のフラグ付きフレーム及び第2のフラグ付きフレームを有する、或る場所を映したビデオにおけるオブジェクトを追跡するオブジェクト追跡装置であって、
前記ビデオの前記第1のフラグ付きフレームにおける第1のアンカーポイントを検出する第1の検出部と、
前記第1のフラグ付きフレーム及びそれ以降のフレームにおいて、前記場所内での前記オブジェクトの位置を検出する第2の検出部と、
前記ビデオの前記第2のフラグ付きフレームにおける第2のアンカーポイントを検出し、前記第2のフラグ付きフレームにおいて、前記場所内での前記オブジェクトの位置を検出する第3の検出部と、
前記第1のフラグ付きフレームから前記第2のフラグ付きフレームまでの各フレームにおいて、前記場所内での前記オブジェクトの位置を、多項式に従って調整する処理部と
を具備し、
前記第1のフラグ付きフレーム及び前記第2のフラグ付きフレームにおいて検出されたアンカーポイントにおいて発生したアクションを識別するメタデータが定義され、
前記アクションは、所定のアクションリストから選択される
オブジェクト追跡装置。
【請求項11】
請求項10に記載のオブジェクト追跡装置であって、
前記多項式は、前記ビデオの前記第1のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置から、前記ビデオの前記第2のフラグ付きフレームにおける前記場所内での前記オブジェクトの位置にわたる
オブジェクト追跡装置。
【請求項12】
請求項11に記載のオブジェクト追跡装置であって、
前記ビデオの前記各フレームにおける前記オブジェクトの検出された位置と、前記多項式によって定義された前記ビデオの前記各フレームにおける前記場所内での前記オブジェクトの位置との間の測定誤差が最小限となるように、前記多項式のパラメータが選択される
オブジェクト追跡装置。
【請求項13】
請求項10に記載のオブジェクト追跡装置であって、
前記第2のアンカーポイントは、前記オブジェクトの方向変化に応じて検出される
オブジェクト追跡装置。
【請求項14】
請求項10に記載のオブジェクト追跡装置であって、
前記多項式は、多項式補間法を用いて生成される
オブジェクト追跡装置。
【請求項15】
請求項14に記載のオブジェクト追跡装置であって、
前記多項式は、ファンデルモンド行列を用いて生成される
オブジェクト追跡装置。
【請求項16】
請求項10に記載のオブジェクト追跡装置であって、
前記処理部は、前記ビデオにおけるオブジェクトを追跡する前に、当該ビデオのフレームにおいて、前記場所における既知の位置に対応する複数の位置を規定し、前記ビデオの前記フレームから、前記場所内での前記既知の位置を基準として、前記ビデオにおける他の位置を規定する
オブジェクト追跡装置。
【請求項17】
請求項10に記載のオブジェクト追跡装置であって、
前記場所は、少なくとも1本の直線を有し、
前記ビデオにおける前記オブジェクトを追跡する前に、前記カメラによって撮影された前記ビデオにおける前記直線の位置が、前記場所における前記直線に対応するように適合される
オブジェクト追跡装置。
【請求項18】
請求項10に記載のオブジェクト追跡装置であって、
前記オブジェクトの前記調整された位置は、仮想環境内での前記オブジェクトの位置を定義するために用いられる
オブジェクト追跡装置。
【請求項19】
ビデオマテリアル、及び当該ビデオマテリアルに関連付けられた、請求項1に記載の方法に従って生成された前記調整された位置データを格納した記憶媒体と、
仮想環境を生成する処理部と
を具備するコンピュータであって、
前記仮想環境は、当該仮想環境内の前記記憶された、前記ビデオマテリアルに関連付けられ、調整された位置データに対応する位置に位置する前記オブジェクトを含む
コンピュータ。
【請求項20】
ビデオマテリアル、及び当該ビデオマテリアルに関連付けられた、請求項1〜9のいずれか1項に記載の方法に従って生成された前記調整された位置データを有する記憶媒体。
【請求項21】
或る位置に固定された少なくとも1台のカメラと、請求項10に記載の装置とを具備する、或る場所内のオブジェクトを撮影及び追跡するシステム。
【請求項22】
コンピュータに、請求項1に記載の方法の各ステップを実行させるためのプログラム。
【請求項23】
請求項22に記載のプログラムを格納した記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図5C】
image rotate

【図5D】
image rotate

【図5E】
image rotate

【図5F】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図6C】
image rotate

【図6D】
image rotate

【図6E】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2010−246117(P2010−246117A)
【公開日】平成22年10月28日(2010.10.28)
【国際特許分類】
【出願番号】特願2010−84043(P2010−84043)
【出願日】平成22年3月31日(2010.3.31)
【出願人】(593081408)ソニー ヨーロッパ リミテッド (93)
【Fターム(参考)】