説明

映像再生装置、映像再生方法、および映像再生プログラム

【課題】あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする。
【解決手段】複数のフレーム画像からなる映像データを記憶する映像記憶手段16と、ユーザが入力した初期座標と、ユーザが初期座標を移動させた移動座標とを受け付ける入力手段12と、所定の時点のフレーム画像上で入力された初期座標の周辺の画像データを探索パターンとし、所定の時点の前後の各フレーム画像において、移動座標の周辺の探索領域の中から、探索パターンに最も類似する類似データ領域の座標を探索するパターン探索手段14と、探索した各フレーム画像の類似データ領域の座標の中で、移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択手段13と、選択したフレーム画像を表示する表示手段11とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像を再生する映像再生装置、映像再生方法、および映像再生プログラムに関する。
【背景技術】
【0002】
コンピュータを用いてデジタル映像を再生する上で、単に映像を先頭から再生して流し見するだけでなく、好きな部分をインタラクティブに巻き戻し・早送り・コマ送りして再生する方法がある。
【0003】
従来の映像再生方法としては、スライダーのGUI(Graphical User Interface)を用いて、再生する映像のフレームを選ぶものがある。例えば、図7に示すように、マウスやタッチパネル等のポインティングデバイスを用いて、スライダー上のツマミを左右に動かすことによって、フレームを前後にコマ送りし、所望のフレーム画像を表示する。
【0004】
また、特許文献1には、あらかじめ被写体の動きに合った折れ線型のスライダーを定義し、映像の中に配置しておくことによって、あたかも被写体を動かしているかのように、映像をコマ送り再生する方法が記載されている。
【0005】
また、非特許文献1には、Particle Video(非特許文献2参照)等の動き検出技術を用いて、画面上の多数の点(パーティクル)の動きをあらかじめ追跡しておき、ポインティングデバイスからの入力座標の動きに一番近い動きに相当するフレームを選択することで、映像再生を実現する方法が記載されている。
【0006】
また、非特許文献3では、あらかじめSIFT特徴点の追跡により被写体の動きを検出し、検出した被写体の動きを用いて映像再生を実現する方法が記載されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特許第3325859号公報
【非特許文献】
【0008】
【非特許文献1】Goldman, D.B., Curless, B., Salesin D., Seitz, S.M., "Interactive Video Object Annotation", Tech Report UW-CSE-2007-04-01, 2007.
【非特許文献2】Sand, P., and Teller, S., "Particle video: LOng-range motion estimation using point trajectories", CVPR'06 2006.
【非特許文献3】Dragicevic, P., Ramos, G., Bibliowitcz, J. Nowrouzezahrai, D., Balakrishnan, R., and Singh, K, "Video Browsing by Direct Manipulation", CHI'08, 2008
【発明の概要】
【発明が解決しようとする課題】
【0009】
以上の従来技術では、あらかじめ被写体の動きに対応した折れ線型のスライダーを設定し、もしくは、被写体の動きを検出しておく必要がある。このため、折れ線型のスライダーを編集する作業負荷が発生し、もしくは、被写体の動きを計算するための計算コストがかかるという問題がある。
【0010】
本発明は、上記事情に鑑みてなされたものであり、本発明の目的は、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする映像再生装置、映像再生方法、および映像再生プログラムを提供することにある。
【課題を解決するための手段】
【0011】
上記目的を達成するため、本発明は、映像再生装置であって、複数のフレーム画像からなる映像データを記憶する映像記憶手段と、ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力手段と、所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索手段と、前記パターン探索手段が探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択手段と、前記フレーム画像選択手段が選択したフレーム画像を表示する表示手段と、を備える。
【0012】
また、本発明は、映像再生装置が行う映像再生方法であって、前記映像再生装置は、複数のフレーム画像からなる映像データを記憶する映像記憶部と、ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力ステップと、所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索ステップと、前記パターン探索ステップで探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択ステップと、前記フレーム画像選択ステップで選択されたフレーム画像を表示する表示ステップと、を行う。
【0013】
また、本発明は、前記映像再生装置としてコンピュータを機能させるための映像再生プログラムである。
【発明の効果】
【0014】
本発明によれば、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする映像再生装置、映像再生方法、および映像再生プログラムを提供することができる。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態に係る映像再生装置の構成図である。
【図2】表示部に表示されたゴルフプレーヤのフレーム画像の一例を示す図である。
【図3】本実施形態の動作を示すフローチャートである。
【図4】探索パターンと探索ウィンドウを説明する説明図である。
【図5】ブロックマッチング法を説明する説明図である。
【図6】初期状態のフレーム画像と、移動後のフレーム画像の一例を示す図である。
【図7】従来のスライダーを説明するための説明図である。
【発明を実施するための形態】
【0016】
以下、本発明の実施の形態について、図面を参照して説明する。
【0017】
図1は、本発明の実施形態に係る映像再生装置の構成を示す構成図である。本実施形態の映像再生装置は、映像データを表示する表示部11と、例えばマウスやタッチパネルなどのユーザの指示を受け付ける入力部12と、フレーム画像選択部13と、パターン探索部14と、フレーム画像復号部15と、デジタル化された映像データを記憶する映像記憶部16と、記憶部17とを備える。
【0018】
映像記憶部16に記憶される映像データは、複数のフレーム画像から構成される動画データである。なお、本実施形態の映像データは、例えばMPEGなどの所定の圧縮方式を用いて圧縮し、映像記憶部16に記憶されているものとする。
【0019】
フレーム画像復号部15は、映像記憶部16に圧縮して記憶された映像データのフレーム画像を復号する。
【0020】
入力部12は、ユーザが入力した初期座標と、ユーザが初期座標を移動させた移動座標とを受け付ける。
【0021】
パターン探索部14は、所定の時点のフレーム画像上で入力された初期座標の周辺の画像データを探索パターンとし、所定の時点の前後の各フレーム画像において、移動座標の周辺の探索領域の中から、探索パターンに最も類似する類似データ領域の座標を探索する。なお、本実施形態では、探索方法として、ブロックマッチング法を用いるものとする。
【0022】
フレーム画像選択部13は、パターン探索部14が探索した各フレーム画像の類似データ領域の座標の中で、移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択する。表示部11は、フレーム画像選択部13が選択したフレーム画像を表示する。
【0023】
以上説明した映像再生装置は、例えば、CPUと、メモリと、HDD等の外部記憶装置と、入力装置と、出力装置とを備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされた映像再生装置用のプログラムを実行することにより、映像再生装置の各機能が実現される。また、映像再生装置のプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。また、映像再生装置は、専用ハードウェア上で動作することとしてもよい。
【0024】
次に、本実施形態の動作について説明する。
【0025】
本実施形態では、映像再生操作をするユーザの知識や経験、期待、操作履歴などを活用し、計算コストを削減しながら、直感的な映像再生を可能にする。ユーザは映像を見ると、被写体がどのように動くのかを期待する。たとえば、ゴルフプレーヤの映像の場合、ゴルフクラブを振り回すであろうと期待する。実際にユーザの行動を観察すると、期待する動きをなぞるように操作することが多い。そこで、本実施形態では、ユーザの操作を手がかりとして、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする。
【0026】
ここでは、映像記憶部16には、ゴルフプレーヤのスイング映像が記憶されおり、表示部11には、当該スイング映像の中の図2に示す所定のフレーム画像が表示されている場合を例に、本実施形態の動作を説明する。
【0027】
図示するフレーム画像上で、ユーザは、入力部12を用いて、ゴルフプレーヤの手の部分の座標I1を初期座標として入力するものとする。図示する例では、矢印で表示したカーソルを操作することで、初期座標I1(矢印の先端座標)を入力する。そして、ユーザが、入力部12を用いて、初期座標I1を右上の移動座標I2方向に移動(ドラッグ)した場合の動作を説明する。
【0028】
図3は、本実施形態の映像再生装置の動作を示すフローチャートである。
【0029】
ここでは、表示部11に図2に示すフレーム画像(静止画)が表示されており、この状態でユーザは、初期座標I1を入力する。これにより、映像再生装置のフレーム画像選択部13は、初期化処理として、現時点で表示されているフレーム画像のフレーム番号nと、ユーザが入力した初期座標In(I1)と、現時点で表示されているフレーム画像上の探索パターンRnとを、記憶部17に記憶する(S11)。
【0030】
探索パターンRnは、図4に示すように、初期座標In(I1)の周辺領域の画像データである。図4に示す探索パターンRnは、初期座標In(I1)を中心とした、所定のサイズの矩形領域の画像データである。
【0031】
そして、ユーザは、入力部12を用いて初期座標In(I1)に設定されたカーソルを所望の位置に移動する。このカーソルの移動操作(ドラッグ)により、カーソルが順次移動した位置(移動座標)に応じて、S13からS17の処理が繰り返し行われ(S12)、対応するフレーム画像がコマ送りで再生される。
【0032】
すなわち、フレーム画像選択部13は、カーソルの移動操作により、移動されたことを検知すると、現時点でのカーソルの位置を示す移動座標Ic(I)を、記憶部17に記憶する(S13)。
【0033】
そして、フレーム画像選択部13は、S11で記憶部17に記憶したフレーム番号nの前後のフレーム番号(d=n±1、n±2、・・・、n±D)の各フレーム画像(探索フレーム画像)について、S15およびS16の処理を、フレーム画像復号部15およびパターン探索部14を用いて、繰り返し行う(S14)。
【0034】
まず、フレーム画像復号部15は、フレーム画像選択部13が指示したフレーム番号dのフレーム画像Fdを、映像記憶部16から読み出し、復号する(S15)。
【0035】
そして、パターン探索部14は、フレーム画像復号部15が復号したフレーム画像Fdから、S11で記憶部17に記憶した探索パターンRnの画像データに最も類似する画像データの領域の位置を探索する(S16)。探索方法としては、本実施形態ではブロックマッチング法を用いることとする。
【0036】
ブロックマッチング法は、図5に示すように、所定のサイズの探索ウィンドウを設定し、当該探索ウィンドウの中で探索ブロックを1ピクセルずつずらしながら走査して、探索対象の画像データ(探索パターンRn)と最も類似する画像データの探索ブロックの位置を調べる方法である。
【0037】
図2に示すフレーム画像の場合、図4に示すように移動された移動座標Ic(I)の周辺を探索ウィンドウとして設定する。図4に示す探索ウィンドウは、移動座標Ic(I)を中心とした、所定のサイズの矩形領域の画像データである。なお、探索ウィンドウのサイズは、探索パターンRnのサイズより大きい。
【0038】
そして、図5で説明したように、探索パターンRnと同じサイズの探索ブロックを、探索ウィンドウの左上から1ピクセルずつずらしながら走査していき、探索パターンRnの画像データと最も類似する画像データ(類似データ)の探索ブロックの位置(中心座標)Odを取得する。
【0039】
なお、パターン探索部14は、探索パターンRnとの類似度を判定するために、比較する2つの画像データ(探索パターンRnの画像データと、探索ブロックの画像データ)の間の距離として、輝度の差の絶対値の和や、差の二乗和を用いることが考えられる。すなわち、以下の式により、輝度の差の絶対値の和、差の二乗和を算出する。
【0040】
輝度の差の絶対値の和=Σ|P−P
輝度の差の二乗和=Σ(P−P
ここで、PとPは、比較する2つの画像データの特定の画素の輝度値を表す。このほか、RGB成分の差の絶対値の和や2乗和や、輝度色ヒストグラムの差の絶対値の和または2乗和等を、画像データ間の距離として用いてもよい。いずれの距離を用いるにせよ、ブロックマッチング法では、探索ウィンドウの中で、最も距離の小さくなる探索ブロックの位置(中心座標)Odを検出する。
【0041】
このように、フレーム番号nの前後のフレーム番号の各フレーム画像毎にS15およびS16を繰り返し行うことで、フレーム画像選択部13は、探索パターンRnと最も類似する探索ブロックの位置(中心座標)Odを、各フレーム画像毎に取得する。
【0042】
そして、フレーム画像選択部13は、各フレーム毎の最も類似する探索ブロックの位置(中心座標)Odと、S13で記憶部17に記憶した移動座標Ic(I)との距離をそれぞれ算出し、移動座標Ic(I)に最も近い位置(中心座標)Odの探索ブロックのフレーム画像を選択し、選択したフレーム画像を表示部11に出力する(S17)。
【0043】
これにより、図6に示すように、S11で表示部11に表示されたフレーム番号nのフレーム画像(図6(a))において、ユーザが初期座標I1を入力し、当該フレーム画像(図6(a))上でカーソルを右上の移動座標Iに移動させることで、初期座標I1が示す箇所の画像(ゴルフプレーヤの手)が、移動座標Iに移動したフレーム画像(図6(b))を自動的に検索し、表示する。これにより、ユーザは、あたかもゴルフプレーヤの手を直接つかんで動かしているかのように直感的に映像データを再生することができる。
【0044】
なお、ユーザのカーソルの移動操作(ドラッグ)により、カーソルの各位置(移動座標)に応じてS13からS17のループ処理が行われるため、例えば図6に示すフレーム画像において、ユーザが、初期位置I1から右上の方向にカーソルを移動させていくと、連続的なフレーム画像が、ユーザの操作速度と同じ速度で表示部11に順次再生される。
【0045】
以上説明した本実施形態では、ユーザの操作開始時点の初期座標の周辺の画像データを探索パターンとし、前後の各フレーム画像において、移動座標の周辺の探索ウィンドウの中から、探索パターンに最も類似する探索ブロックの座標を探索し、探索した各フレーム画像の最も類似する探索ブロックの座標の中で、移動座標と最も近い距離の探索ブロックを有するフレーム画像を、次に表示すべきフレーム画像として選択する。
【0046】
これにより、本実施形態では、あらかじめ映像の被写体の動きを検出することなく、直感的な映像再生を可能とする。すなわち、被写体の動きに基づくインタラクティブな映像再生を実現する上で、あらかじめ映像中の被写体の動きを検出しなくても、ユーザの期待に基づく操作を活用して、ユーザの操作する近傍の画像データのみを探索すれば済むため、計算コストを削減することができる。
【0047】
なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。例えば、上記実施形態の本映像装置を、PCなどのコンピュータだけでなく、デジタルカメラ、カメラ付き携帯電話、スマートフォンなどで動作させてもよい。
【0048】
また、上記実施形態では、映像再生装置が単体で、映像生成を行うこととしたが、サーバー・クライアント構成を適用し、サーバ側に計算コストが比較的高いパターン探索部やフレーム画像選択部を備え、クライアント側では、サーバ側から送信される処理結果の画像フレームを表示することとしてもよい。
【0049】
また、上記実施形態では、映像データは圧縮して映像記憶部16に記憶されることとしたが、圧縮しない状態で映像記憶部16に記憶されることとしてもよい。この場合、映像再生装置は、フレーム画像復号部15を備えなくてもよい。
【符号の説明】
【0050】
11:表示部
12:入力部
13:フレーム画像選択部
14:パターン探索部
15:フレーム画像復号部
16:映像記憶部
17:記憶部

【特許請求の範囲】
【請求項1】
映像再生装置であって、
複数のフレーム画像からなる映像データを記憶する映像記憶手段と、
ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力手段と、
所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索手段と、
前記パターン探索手段が探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択手段と、
前記フレーム画像選択手段が選択したフレーム画像を表示する表示手段と、を備えること
を特徴とする映像再生装置。
【請求項2】
請求項1記載の映像再生装置であって、
前記パターン探索手段は、ブロックマッチング法を用いて、前記探索パターンに最も類似する類似データ領域の座標を探索すること
を特徴とする映像再生装置。
【請求項3】
請求項1記載の映像再生装置であって、
前記映像記憶手段に記憶された映像データのフレーム画像を復号するフレーム画像復号手段をさらに備えること
を特徴とする映像再生装置。
【請求項4】
映像再生装置が行う映像再生方法であって、
前記映像再生装置は、
複数のフレーム画像からなる映像データを記憶する映像記憶部を備え、
ユーザが入力した初期座標と、前記ユーザが前記初期座標を移動させた移動座標とを受け付ける入力ステップと、
所定の時点のフレーム画像上で入力された前記初期座標の周辺の画像データを探索パターンとし、前記所定の時点の前後の各フレーム画像において、前記移動座標の周辺の探索領域の中から、前記探索パターンに最も類似する類似データ領域の座標を探索するパターン探索ステップと、
前記パターン探索ステップで探索した各フレーム画像の類似データ領域の座標の中で、前記移動座標と最も近い類似データ領域の座標を有するフレーム画像を選択するフレーム画像選択ステップと、
前記フレーム画像選択ステップで選択されたフレーム画像を表示する表示ステップと、を行うこと
を特徴とする映像再生方法。
【請求項5】
請求項4記載の映像再生方法であって、
前記パターン探索ステップは、ブロックマッチング法を用いて、前記探索パターンに最も類似した類似データ領域の座標を探索すること
を特徴とする映像再生方法。
【請求項6】
請求項4記載の映像再生方法であって、
前記映像記憶部に記憶された映像データのフレーム画像を復号するフレーム画像復号ステップをさらに行うこと
を特徴とする映像再生方法。
【請求項7】
請求項1から請求項3のいずれか一項に記載の映像再生装置としてコンピュータを機能させるための映像再生プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−222651(P2012−222651A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−87363(P2011−87363)
【出願日】平成23年4月11日(2011.4.11)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】