説明

画像処理装置及び画像処理方法

【課題】入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみを抽出することのできる技術を提供する。
【解決手段】本発明の画像処理装置は、入力された動画データの各フレームから、フレームを分割して得られるブロック毎に、動きベクトルを検出する動きベクトル検出手段と、フレームのブロック毎に、そのフレームを含む第1期間分のフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出する積算動きベクトル算出手段と、フレーム毎に、大きさが第1の所定値以下の積算動きベクトルの数に基づく値を積算静止量として算出する積算静止量算出手段と、算出された積算静止量が第1の閾値以上のフレームを所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出する抽出手段と、を有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理方法に関する。
【背景技術】
【0002】
現在、表示装置は高画質化、そして4K×2Kといった高解像度化かつ高精細化が進んでおり、Full−HDに比べより高い臨場感を視聴者に感じさせることができるようになってきた。今後はこのような表示装置(ディスプレイ)の特徴を十分に生かせる画像、即ちより高い臨場感を視聴者に感じさせることのできる画像の需要が高まっていくと考えられる。より高い臨場感を視聴者に感じさせるには、静止画よりも動画が適している。しかし、あまりに動きが激しい動画では画像を細部まで確認することができず、高精細感を感じさせることはできない。そのため、より高い臨場感を感じさせるためには、動きがあまり激しくない単調な動画が適していると言える。
【0003】
特許文献1には、特徴量に基づき、動画データを複数のシーンに分割し、あるシーンにおける特徴量と、該シーンよりも前の位置にある1又は複数のシーンにおける特徴量とを比較することにより、同一シーンを検出する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−283966号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に開示の技術では、シーン間の特徴量の差分が所定の閾値以内のシーンが同一シーンとして検出されるため、視聴者に高い臨場感を感じさせることのできるシーンのみを検出することはできない。
【0006】
本発明は、入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみを抽出することのできる技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の第1の態様は、
入力された動画データから所望のシーンの動画データを抽出する画像処理装置であって、
入力された動画データの各フレームから、フレームを分割して得られるブロック毎に、動きベクトルを検出する動きベクトル検出手段と、
前記フレームのブロック毎に、そのフレームを含む第1期間分のフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出する積算動きベクトル算出手段と、
前記フレーム毎に、大きさが第1の所定値以下の積算動きベクトルの数に基づく値を積算静止量として算出する積算静止量算出手段と、
算出された前記積算静止量が第1の閾値以上のフレームを所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出する抽出手段と、
を有することを特徴とする。
【0008】
本発明の第2の態様は、
入力された動画データから所望のシーンの動画データを抽出する画像処理方法であって

入力された動画データの各フレームから、フレームを分割して得られるブロック毎に、動きベクトルを検出するステップと、
前記フレームのブロック毎に、そのフレームを含む第1期間分のフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出するステップと、
前記フレーム毎に、大きさが第1の所定値以下の積算動きベクトルの数に基づく値を積算静止量として算出するステップと、
算出された前記積算静止量が第1の閾値以上のフレームを所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出するステップと、
を有することを特徴とする。
【0009】
本発明の第3の態様は、
入力された動画データから所望のシーンの動画データを抽出する画像処理装置であって、
入力された動画データの各フレームから、フレームを分割して得られるブロック毎に、動きベクトルを検出する動きベクトル検出手段と、
所定期間分のフレーム群毎且つブロック毎に、そのフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出する積算動きベクトル算出手段と、
大きさが第1の所定値以下の積算動きベクトルの数が第1の閾値以上の前記所定期間分のフレーム群を所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出する抽出手段と、
を有することを特徴とする。
【発明の効果】
【0010】
本発明によれば、入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみを抽出することができる。
【図面の簡単な説明】
【0011】
【図1】実施例1に係る画像処理装置の機能構成の一例を示すブロック図
【図2】積算動きベクトルヒストグラムの一例を示す図
【図3】フレーム単位動きベクトルヒストグラムの一例を示す図
【図4】観賞用動画判定部の処理の流れの一例を示すフローチャート
【図5】積算静止量の時間変化の一例を示す図
【図6】フレーム単位動き量の時間変化の一例を示す図
【図7】積算動きベクトルヒストグラムの一例を示す図
【図8】APLの変動量の時間変化の一例を示す図
【図9】実施例2に係る画像処理装置の機能構成の一例を示すブロック図
【図10】積算静止量の時間変化の一例を示す図
【図11】積算静止量の時間変化の一例を示す図
【発明を実施するための形態】
【0012】
<実施例1>
以下、図1〜8を用いて、本発明の実施例1に係る画像処理装置及び該画像処理装置により実行される画像処理方法について説明する。
図1は、実施例1に係る画像処理装置の機能構成の一例を示すブロック図である。
画像処理装置100は、色空間変換部101、遅延部102、記録条件解析部103、APL検出部104、動きベクトル検出部105、積算動きベクトル算出部106、動き量算出部107、観賞用動画判定部108、観賞用動画記録判定部109などを有する。これらの構成要素はバスで接続されている。画像処理装置100は、記録部110、記録条件入力部111、及び、表示部112と無線または有線で通信可能に構成されている。
【0013】
記録部110は、動画データを光ディスク、磁気ディスク、メモリカードなどの記録媒体に記録する記録装置である。記録部110は、例えば、PC、DVDレコーダ、HDDレコーダ、デジタルビデオカメラ等である。記録媒体は、記録部110に固定されていてもよいし、記録部110から取り外し可能であってもよい。
動画データは、MPEG等の圧縮された動画データ、もしくは、RAW動画データである。RAW動画データは、CCD(Charge Coupled Device)センサやCMOS(Complementary Metal Oxide Semiconductor)センサから得られた動画データである。
本実施例では、画像処理装置には、記録媒体に記録された動画データ(記録部110または他の装置によって記録された動画データ)が入力される。そして、ユーザによって入力された記録条件に従って、入力された動画データから所望のシーンの動画データとして視聴者に高い臨場感を感じさせることのできる観賞用動画シーンの動画データを抽出する。
【0014】
以下、本実施例に係る画像処理装置の処理フローに従って、画像処理装置の各機能について説明する。
まず、記録条件入力部111から画像処理装置100に記録条件が入力される。記録条件入力部111はリモートコントローラ等である。具体的には、ユーザが記録条件入力部111を操作することにより、記録部110(記録媒体)に記録されている動画データから、観賞用動画シーンの動画データの抽出対象とする動画データ(対象動画データ)が選択される。また、抽出する観賞用動画シーンの動画データの時間長(観賞用動画シーン時間長)、数(観賞用動画シーン数)、記録方法などが選択される。それにより、対象動画データ、観賞用動画シーン時間長、観賞用動画シーン数、記録方法などの情報が、記録条件として入力される。
記録条件解析部103は、入力された記録条件を解析し、記録部110から動画データを読み出す制御をしたり、解析した記録条件を観賞用動画判定部108へ送信したりする。
【0015】
ユーザにより選択された動画データは記録部110から読み出され、画像処理装置100(具体的には、色空間変換部101)へ入力される。
色空間変換部101は、入力された動画データがRGBデータである場合には、カラーマトリクス演算により、入力された動画データを輝度信号(Y)と色差信号(Cb/Cr)に変換する。入力された動画データがYCbCrデータである場合には、入力された動画データをそのまま後段へ出力する。輝度信号(Y)はAPL(Average Picture Level:平均輝度レベル)や動きベクトルを検出するのに使用される。
【0016】
色空間変換部101より出力された動画データは、時間的に連続するフレーム間の動画データの差分から動きベクトルを検出するために、遅延部102において1フレーム期間分遅延される。
【0017】
APL検出部104は、動画データの輝度信号(Y)を用いて、フレーム毎に、輝度特徴量を抽出する(特徴量抽出手段)。本実施例では、輝度特徴量としてAPLが検出されるものとする。なお、輝度特徴量は、輝度レベルの最小値、最大値、最頻値などであってもよい。
【0018】
動きベクトル検出部105は、入力された動画データから動きベクトルを検出する(動きベクトル検出手段)。本実施例では、入力された動画データの各フレームを複数のブロックに分割し、ブロック毎に動きベクトルを検出する。具体的には、現在のフレームの輝度信号(Y)と遅延部102で遅延された1フレーム前のフレームの輝度信号(Y)とを
用いて、現在のフレームのブロック毎に動きベクトルを検出する。検出された動きベクトルは不図示のSRAMやフレームメモリに保持される。動きベクトルは、フレームの画像を複数のブロックに分割し、ブロック毎にフレーム間の相関を求めて検出する方法(即ち、ブロックマッチング法)などの一般的な手法を用いて検出される。そして、動きベクトル検出部105は、フレーム毎に、動きベクトルのヒストグラム(フレーム単位動きベクトルヒストグラム)を作成する(図3)。
なお、ブロックの大きさはどのような大きさであってもよい。1画素分の大きさであってもよい。即ち、画素毎に動きベクトルが検出されてもよい。例えば、Full Search(全
検索)またはExhaustive Search(徹底検索)と呼ばれる手法で、愚直に、一定の検索範囲を画素単位で左上から右下まで一つずつ調べて、SAD(差分絶対和)が最小となる位置を動きベクトルとして採用する手法を用いても良い。また、最初に粗く検索して、段々とより詳細なレベルで動きベクトルを探していくステップサーチと呼ばれる手法や、螺旋順に段々と範囲を広げながら動きベクトルを検索していくスパイラルサーチと呼ばれる手法を用いてもよい。
なお、ブロックマッチング法によりブロック毎の動きベクトルを検出し、ブロック内の各画素にそのブロックの動きベクトルを割り当ててもよい。また、ブロックマッチング法によりブロック毎の動きベクトルを検出し、ブロック内の代表画素(例えば、ブロックの中心の画素)にそのブロックの動きベクトル割り当ててもよい。その場合には、各画素の動きベクトルを参照する際に、ブロックの代表画素に割り当てられた動きベクトルを、そのブロック内の各画素の動きベクトルとして参照すればよい。
【0019】
積算動きベクトル算出部106は、第1期間分のフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出する(積算動きベクトル算出手段)。本実施例では、フレームのブロック毎に、積算動きベクトルとして、そのフレームを含む第1期間分のフレーム群の動きベクトルの時間方向の積算値を算出する。具体的には、処理対象のフレームを基準とする第1期間分のフレーム群の同一ブロックの動きベクトルを積算し、積算結果を積算動きベクトルとして処理対象のフレームのそのブロックに割り当てる処理を各ブロックについて行う。第1期間は、例えば、処理対象のフレームと、その前、後、または、前後の所定数のフレーム(数〜数十フレーム)を含む期間である。
そして、積算動きベクトル算出部106は、フレーム毎に、積算動きベクトルのヒストグラム(積算動きベクトルヒストグラム)を作成する。第1期間分の動きベクトルを足し合わせることで、木の葉のざわめき、水面のゆれといったランダム性や周期性がある動きを排除することができる。具体的には、図2に示すように、動きにランダム性や周期性のある部分における第1期間分の動きベクトルの積算値はほぼ0となる。なお、第1期間は、ランダム性や周期性のある動きを排除することができる期間であればよく、メーカーやユーザによって適宜設定される。
【0020】
動き量算出部107は、フレーム毎に、大きさが所定値以上(第2の所定値以上)の動きベクトルの数を表す値をフレーム単位動き量として算出する(動き量算出手段)。具体的には、動きベクトル検出部105で検出された動きベクトルのうち、x方向(水平方向)成分の大きさ|Vx|が所定値以上である動きベクトルの数とy方向(垂直方向)成分の大きさ|Vy|が所定値以上である動きベクトルの数の和がフレーム単位動き量として算出される。即ち、図3に示すフレーム単位の動きベクトルヒストグラムの範囲Bに属する動きベクトルの総度数がフレーム単位動き量として算出される。なお、フレーム単位動き量は、大きさが所定値以上(第2の所定値以上)の動きベクトルの数の、動きベクトルの総数に対する割合を表す値であってもよい。このように算出されたフレーム単位動き量(統計量)は、動きの大きなシーンでは大きな値となる(動きの小さなシーン、静止しているシーンでは小さな値となる)。
【0021】
観賞用動画判定部108では、記録条件、APL、積算動きベクトルヒストグラム、フ
レーム単位動き量から入力された動画データのシーンが観賞用動画シーンか否かを判定する。
【0022】
観賞用動画判定部108の処理の流れを、図4のフローチャートおよび図5(A)〜8を用いて説明する。
なお、ここでは、以下の記録条件が入力(設定)されたものとする。記録時間は、対象動画データの時間長を意味する。

(記録条件)
対象動画データ:動画データX(記録時間30秒)
観賞用動画シーン数:1シーン以上
観賞用動画シーン時間長:10秒
記録方法:元の動画データに観賞用動画フラグを付加

【0023】
まず、観賞用動画判定部108は、動画データXから動きに関する情報(積算動きベクトルヒストグラムとフレーム単位動き量)より、観賞用動画シーンの動画データを抽出する(ステップS401)。
【0024】
ステップS401では、観賞用動画判定部108(積算静止量算出手段)は、まず、フレーム毎に、大きさが所定値以下(第1の所定値以下)の積算動きベクトルの数を表す値を積算静止量として算出する。具体的には、積算動きベクトルのうち、x方向成分の大きさ|Vx|が所定値以下である積算動きベクトルの数とy方向成分の大きさ|Vy|が所定値以下である積算動きベクトルの数の和が積算静止量として算出される。即ち、図2の範囲Aに属する積算動きベクトルの総度数が積算静止量として算出される。なお、積算静止量は、大きさが所定値以下(第1の所定値以下)の積算動きベクトルの数の、動きベクトルの総数に対する割合を表す値であってもよい。このように算出された積算静止量(統計量)は、動きの小さな(静止している)シーンでは大きな値となる。図5(A)は、縦軸を積算静止量、横軸を時間とするグラフである。観賞用動画判定部108は、積算静止量を上記第1期間よりも長い観賞用動画シーン時間長(第2期間)単位でスキャンする。そして、観賞用動画判定部108(抽出手段)は、第2期間分のフレーム群であって、積算静止量が第1の閾値以上のフレームを所定の割合(第1の割合)以上含むフレーム群からなる動画データを、観賞用動画シーンの動画データとして抽出する。即ち、動きが小さい部分を多く含む動画データを、観賞用動画シーンの動画データとして抽出する。本実施例では、積算静止量が第1の閾値以上のフレーム群からなる動画データが観賞用動画シーンの動画データとして抽出されるものとする。
図5(A)の例では、シーンA1とシーンA3の動画データが観賞用動画シーンの動画データとして抽出される。第1の閾値は、積算静止量が観賞用動画シーンの静止量として適切か否かを判断することのできる値であればよく、メーカーやユーザによって適宜設定される。
なお、本実施例では抽出される観賞用動画シーンの時間長を固定(第2期間の長さ)としたが、観賞用動画シーンの時間長は変動してもよい。例えば、上記の方法で積算静止量が第1の閾値以上のフレームを第1の割合以上含むフレーム群からなるシーンを検出した後、積算静止量が第1の閾値以上のフレームを第1の割合だけ含むように、検出したシーンの時間長を長くしてもよい。
【0025】
次に、観賞用動画判定部108は、フレーム単位動き量より、抽出した動画データ(シーンA1,A3の動画データ)の観賞用動画シーンの動画データとしての妥当性を判断する。図6は、縦軸をフレーム単位動き量、横軸を時間とするグラフである。観賞用動画判定部108は、観賞用動画シーンの動画データを、抽出した動画データ(シーンA1,A
3の動画データ)のうち、フレーム単位動き量が第3の閾値以下のフレームを所定の割合(第2の割合)以上含むフレーム群からなる動画データに絞り込む。本実施例では、観賞用動画シーンの動画データが、フレーム単位動き量が第3の閾値以下のフレーム群からなる動画データに絞り込まれるものとする。それにより、動きが大きい部分を多く含む動画データが、観賞用動画シーンの動画データから除外される。
周期的だが大きい動きは、積算動きベクトルには現れない。そのため、そのような動きを多く含む動画データ、例えば、時計の振り子がアップされているシーンの動画データは、積算動きベクトルを用いた判断だけでは、観賞用動画シーンの動画データとされてしまう虞がある。そのような動画データは高い臨場感を感じさせることができないため、観賞用動画シーンの動画データから除外することが望ましい。本処理により、そのような動画データを観賞用動画シーンの動画データから除外することができる。
図6の例では、シーンA1,A3の動画データは、いずれもフレーム単位動き量が第3の閾値以下のフレーム群からなる動画データであるため、観賞用動画シーンの動画データとして妥当であると判断され、除外されない。第3の閾値は、フレーム単位動き量が観賞用動画シーンのフレーム単位動き量として適切か否かを判断することのできる値であればよく、メーカーやユーザによって適宜設定される。
【0026】
なお、ステップS401で観賞用動画シーンの動画データとして抽出されなかったシーンA2の動画データ対して、観賞用動画シーンの動画データとするか否かを判断するようにしてもよい。例えば、車や人が一方向に動きつづけている動画データは、ステップS401の処理では抽出されないことがある。物体が一方向に動き続けている場合、積算動きベクトルヒストグラムは、図7に示すような分布(度数が一部に集中するような分布)となることが多い。そこで、積算動きベクトルヒストグラムを解析し、度数が一部の積算動きベクトルに集中しているフレームを所定の割合以上含む動画データを観賞用動画データとして更に抽出してもよい。換言すれば、第2期間分のフレーム群であって、積算動きベクトルが或る向き及び第1の所定値より大きい或る大きさのベクトルに集中しているフレームを所定の割合以上含むフレーム群からなる動画データを観賞用動画シーンの動画データとして更に抽出してよい。物体が一方向に動き続けているような単調な動画データを観賞用動画シーンの動画データとするか否かは、ユーザが記録条件入力部111を用いて切り替え可能としてもよい。ここでは、シーンA2の動画データが観賞用動画シーンの動画データとして抽出されなかったものとする。なお、度数が一部に集中しているか否かを判断する方法は、どのような方法であってもよい。例えば、所定の幅の積算動きベクトルの値の度数が、その前後の積算動きベクトルの度数よりも所定の閾値分大きい場合に、度数が一部に集中していると判断することができる。
【0027】
次に、観賞用動画判定部108は、APL検出部104で抽出された輝度特徴量(APL)のフレーム間の変動量を算出する。そして、算出したAPLの変動量から、抽出された動画データ(本実施例では、積算静止量、フレーム単位動き量に基づいて抽出されたシーンA1,A3の動画データ)の観賞用動画シーンの動画データとしての妥当性を更に判断する(ステップS402)。APLの変動量は、例えば、1つ前のフレームからのAPLの変化量や、処理対象(変動量の算出対象)のフレームを含む所定期間におけるAPLの時間変化を最小二乗近似して得られる一次関数の傾きなどである。図8は、縦軸をAPLの変動量、横軸を時間とするグラフである。観賞用動画判定部108は、観賞用動画シーンの動画データを、抽出した動画データのうち、APLのフレーム間の変動量が第5の閾値以上のフレームを所定の割合(第3の割合)以上含むフレーム群からなる動画データに絞り込む。本実施例では、観賞用動画シーンの動画データが、変動量が第5の閾値以上のフレーム群からなる動画データに絞り込まれるものとする。それにより、フレーム間で輝度値が大きく変化する動画データが、観賞用動画シーンの動画データから除外される。
ストロボが小刻みに発光されているシーンの動画データのように、フレーム間で輝度値が大きく変化する動画データは、ステップS401の処理だけでは、観賞用動画シーンの
動画データとされてしまう虞がある。そのような動画データは高い臨場感を感じさせることができないため、観賞用動画シーンの動画データから除外することが望ましい。本処理により、そのような動画データを観賞用動画シーンの動画データから除外することができる。
図8の例では、シーンA3の動画データは、符号C’で示す時刻に、APLの変動量が第5の閾値より大きいフレームを含んでいる。そのため、シーンA3の動画データは、観賞用動画シーンの動画データとして妥当でないと判断され、除外され、シーンA1の動画データが観賞用動画シーンの動画データとされる。ただし、このステップS402は必須ではなく、ステップS402の処理を省略してもよい。
【0028】
そして、観賞用動画判定部108は、ステップS402で抽出(決定)された観賞用動画シーンの動画データの数が、記録条件に含まれる観賞用動画シーン数を満たしているか否かを判断する(ステップS403)。満たしている場合(ステップS403:YES)には、ステップS404へ進み、満たしていない場合(ステップS403:NO)には、ステップS405へ進む。
ステップS404では、観賞用動画判定部108が、抽出された観賞用動画シーン(ここではシーンA1)の動画データに対して、観賞用動画フラグを1と設定する。そして、観賞用動画記録判定部109へ、抽出された観賞用動画シーンの動画データとその観賞用動画フラグを出力し、本フローの処理を終了する。
ステップS405では、観賞用動画判定部108が、ユーザに観賞用動画シーンの動画データが抽出されなかったことを通知する処理を行う。
【0029】
ステップS405の次に、観賞用動画判定部108は、第1,3,5の閾値を調整するか否かをユーザに問い合わせる処理を行う(ステップS406)。第1,3,5の閾値の少なくとも1つが調整された場合(ステップS406:YES)には、ステップS407へ進み、調整されなかった場合(ステップS406:NO)には、本フローの処理は終了となる。
ステップS407では、観賞用動画判定部108は、第1,3,5の閾値を再設定する。そして、ステップS401からの処理が再度行われる。
なお、ステップS407では、ユーザの指示に応じて、観賞用動画シーン数や観賞用動画シーン時間長を再設定してもよい。また、第1〜3の割合を再設定してもよい。例えば、観賞用動画シーン時間長が10秒、第1〜3の割合がすべて80%と設定された場合には、10秒の動画データであって、観賞用動画シーンのフレームとして妥当であるフレームを8秒分以上含む動画データが観賞用動画シーンの動画データとされる。なお、観賞用動画シーンのフレームとして妥当であるフレームは、本実施例では、積算静止量が第1の閾値以上、フレーム単位動き量が第3の閾値以下、輝度特徴量のフレーム間の変動量が第5の閾値以下のフレームである。
【0030】
観賞用動画記録判定部109は、観賞用動画判定部108で観賞用動画フラグが1とされた動画データ(抽出された観賞用動画シーンの動画データ)を、記録条件に含まれる記録方法で記録部110が有する記録媒体に保存する。本実施例では、記録方法が「元の動画データに観賞用動画フラグを付加」であるため、記録部110に格納されていた元の動画データが、その観賞用動画シーンの動画データの期間に観賞用動画フラグ“1”が関連付けられて記録される。
なお、他の記録方法としては、観賞用動画フラグが1とされた動画データのみを元の動画データとは別の動画データとして記録する方法や、元の動画データから、観賞用動画シーンとして抽出された動画データ以外の動画データを削除して記録する方法などがある。また、フレーム単位動き量、積算静止量、APLの変動量などの特徴量を元の動画データに関連付けて保存し、後でそれらのデータを用いて観賞用動画シーンの動画データ抽出を行う構成であってもよい。
【0031】
以上述べたように、本実施例によれば、積算静止量が第1の閾値以上のフレームを所定の割合以上含むフレーム群からなる動画データのみを観賞用動画シーンの動画データとして抽出することができる。積算静止量が第1の閾値以上のフレームを所定の割合以上含むフレーム群からなる動画データは、動きが小さい動画データやランダム性や周期性がある動きのような単調な動きを多く含む動画データである。このような動画データは、視聴者に高い臨場感を感じさせることができる。即ち、本実施例によれば、入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみを抽出することができる。
また、周期的だが大きい動きを多く含む動画データは、高い臨場感を感じさせることができない。本実施例では、観賞用動画シーンの動画データが、抽出した動画データのうち、フレーム単位動き量が第3の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データに絞り込まれる。それにより、周期的だが大きい動きを多く含む動画データを観賞用動画シーンの動画データから除外することができ、入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみを更に精度よく抽出することができる。
また、フレーム間で輝度値が大きく変化する動画データは、高い臨場感を感じさせることができない。本実施例では、観賞用動画シーンの動画データが、抽出した動画データのうち、輝度特徴量のフレーム間の変動量が第5の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データに絞り込まれる。それにより、フレーム間で輝度値が大きく変化する動画データを観賞用動画シーンの動画データから除外することができ、入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみを更に精度よく抽出することができる。
【0032】
なお、本実施例では、フレーム毎に、各ブロックの積算動きベクトルを算出するとしたが、所定期間分(第1期間分)のフレーム群(数〜数十フレーム)毎に、各ブロックの積算動きベクトルを算出してもよい。即ち、所定期間分のフレーム群毎且つブロック毎に、そのフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出してもよい。その場合には、積算静止量も、第1期間分のフレーム群毎に算出すればよい。具体的には、図5(B)に示すように、第1期間分のフレーム群毎に、大きさが所定値以下(第1の所定値以下)の積算動きベクトルの数に基づく値(大きさが所定値以下の積算動きベクトルの数、又は、大きさが所定値以下の積算動きベクトルの数を積算動きベクトルの総数で割った値)を積算静止量として算出すればよい。そして、積算静止量が第1の閾値以上の期間(第1期間分のフレーム群の期間)を所定の割合以上含む第2期間(例えば10秒)分の動画データを、観賞用動画シーンの動画データとして抽出すればよい。
なお、フレーム毎に各ブロックの積算動きベクトルを算出し、第1期間分のフレーム群毎に積算静止量を算出してもよい。
なお、積算静止量を算出せずに、大きさが所定値以下の積算動きベクトルの数が第1の閾値以上のフレーム(または上記第1期間分のフレーム群)を所定の割合以上含むフレーム群からなる動画データを、観賞用動画シーンの動画データとして抽出してもよい。
【0033】
なお、本実施例では、特徴量として、輝度特徴量を用いる構成としたが、輝度特徴量の代わりに画像の色特徴量や形状特徴量などの他の特徴量を用いる構成であってもよい。そのような構成であっても、上述した作用効果に準じた作用効果を得ることができる。また、複数の特徴量を用いてもよい。例えば、本実施例の処理に、形状特徴量の変動量に基づく観賞用動画シーンの動画データの絞り込みを行う処理を更に追加してもよい。そのような構成にすることにより、入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみを更に精度よく抽出することができる。
なお、本実施例では、記録条件がユーザ操作によって選択され、入力される構成としたが、記録条件は予め画像処理装置内に記録されている固定値であってもよい。また、元の
動画データ(対象動画データ)毎に予め定められていてもよい(対象動画データに付加されていてもよい)。
なお、本実施例では、動きベクトル(積算動きベクトル)のヒストグラムとして、動きベクトルのx方向成分とy方向成分のそれぞれのヒストグラムが作成されるものとしたが、これに限らない。2次元ヒストグラムであってもよい。また、本実施例では、動きベクトルを複数の成分に分け、各成分の値をそれぞれ、閾値と比較するもとしたが、これに限らない。動きベクトルを複数の成分に分けず、動きベクトルそのものの大きさを閾値と比較してもよい。また、ヒストグラムは作成されなくてもよい。例えば、積算動きベクトルヒストグラム作成せずに、各積算動きベクトルの値から、積算静止量が算出されてもよい。
なお、第1〜3の割合は同じ割合であってもよいし、異なっていてもよい。
【0034】
<実施例2>
以下、図1,2,6,9〜12を用いて本発明の実施例2に係る画像処理装置及び該画像処理装置により実行される画像処理方法について説明する。
図9は、実施例2に係る画像処理装置の機能構成の一例を示すブロック図である。
画像処理装置200は、実施例1(図1)の構成の他に、デバイス情報取得部201を更に有する。また、画像処理装置200と無線乃至有線で通信可能な表示部112(抽出した観賞用動画シーンの動画データに基づく動画を表示する表示装置)には、デバイス情報格納部202が設けられている。その他の構成は、図1と同じであるため、図1と同じ符号を付す。以下、実施例1と異なる点について説明する。
【0035】
デバイス情報取得部201は、デバイス情報格納部202からデバイス情報を取得し、観賞用動画判定部108に出力する(取得手段)。
デバイス情報格納部202は、表示部112のデバイス情報を記憶するEDID(Extended Display Identification Data)ROM等の記録媒体である。なお、デバイス情報格納部202は、デバイス情報が格納されていればよく、EDIDROMに限らない。本実施例では、デバイス情報格納部202には、デバイス情報として、表示部112(表示装置;表示パネル)の駆動方式、表示フレームレート(フレームレート変換方法を含む)、表示方式等を表す情報が格納されているものとする。表示フレームレートは、表示部112の、表示する動画のフレームレートである。
【0036】
本実施例では、観賞用動画判定部108は、入力されたデバイス情報に基づいて第1の閾値の値を変更する。また、観賞用動画判定部108は、積算静止量を用いた観賞用動画シーンの動画データの抽出処理を行う際に、第2の閾値を更に用いる。
【0037】
まず、デバイス情報に基づく第1の閾値の変更方法について説明する。
表示部112の駆動方式がホールド型駆動方式の場合、強い風でゆれている木の葉などを表す動画を表示しようとするとボケてしまう可能性がある。このようなボケは臨場感を削ぐ結果に繋がってしまい、そのようなボケを生じさせる動画データは観賞用動画シーンの動画データとして適切であるとはいえない。そこで本実施例では、観賞用動画判定部108が、入力(取得)されたデバイス情報から、表示部112の駆動方式がインパルス型駆動方式なのかホールド型駆動方式なのかを判断する。そして、判断結果に応じて第1の閾値を変更する。
【0038】
図10は、縦軸を積算静止量、横軸を時間とするグラフである。インパルス型駆動方式の表示装置は、表示する動画に多少の動きがあってもボケにくい特徴がある。そのため、本実施例では、観賞用動画判定部108は、表示部112の駆動方式がインパルス型駆動方式のときのほうが、ホールド型駆動方式のときよりも第1の閾値として低い値を設定する。表示部112の駆動方式がインパルス型駆動方式のときに第1の閾値として低い値を
設定することにより、ある程度動きのある動画データも観賞用動画シーンの動画データとして抽出することができる。図10の例では、表示部112の駆動方式がインパルス型駆動方式の場合には、シーンA1,A3の動画データが観賞用動画シーンの動画データとして抽出される。
一方、ホールド型駆動方式の表示装置は、インパル型駆動方式の表示装置に比べて、表示する動画に動きがあるとボケやすい特徴がある。本実施例では、表示部112の駆動方式がホールド型駆動方式のときに第1の閾値として高い値を設定することにより、ボケが生じる虞の無い動画データのみを観賞用動画シーンの動画データとして抽出することができる。図10の例では、表示部112の駆動方式がホールド型駆動方式の場合には、シーンA1の動画データのみが観賞用動画シーンの動画データとして抽出される。
【0039】
また、表示フレームレートが高いほどボケは発生しにくい。そのため、入力されたデバイス情報から、表示部112の表示フレームレートを判断してもよい。そして、表示部112の表示フレームレートが高いほど第1の閾値として低い値を設定してもよい。そのような構成であっても、上記効果に準じた作用効果を得ることができる。
また、液晶ディスプレイでは、表示方式として、入力された動画データに基づく動画のフレーム間に黒画像を挿入して表示する黒挿入表示方式を採用することにより、ボケを軽減することができる。そのため、入力されたデバイス情報から、表示部112の表示方式が黒挿入表示方式か否かを判断してもよい。そして、表示部112の表示方式が黒挿入表示方式のときのほうが、黒挿入表示方式でないときよりも第1の閾値として低い値を設定してもよい。そのような構成であっても、上記効果に準じた作用効果を得ることができる。
また、上述した情報を組み合わせて第1の閾値を変更することにより、観賞用動画シーンの動画データとして、より適切な動画データを抽出することが可能となる。
【0040】
次に、積算静止量を用いた観賞用動画シーンの動画データの抽出処理を、第2の閾値を更に用いて行う方法について説明する。
実施例1では、積算静止量を用いた抽出処理において、全く動きがない(限りなく静止画に近い)動画のデータが観賞用動画シーンの動画データとして抽出される場合がある。臨場感は静止しているより少しでも動きのある動画の方が強く感じられる。そこで、本実施例では、第2の閾値を、積算静止量が観賞用動画シーンの静止量として妥当か否かの上限として用いることにより、全く動きがない(限りなく静止画に近い)動画のデータが観賞用動画シーンの動画データとして抽出されることを防ぐ。
【0041】
図11は、縦軸を積算静止量、横軸を時間とするグラフである。
本実施例では、第2の閾値は、ユーザ操作により、記録条件入力部111から画像処理装置内に入力される。第2の閾値は、例えば、図4のステップS401の前や、ステップS406のタイミングで入力(設定)されればよい。なお、第2の閾値は、画像処理装置内に予め記憶されていてもよいし、対象動画データに付加されていてもよい。
図4のステップS401で、積算静止量を用いた抽出処理を行う際に、第2の閾値が観賞用動画シーンとして妥当な積算静止量の上限として用いられる。即ち、ステップS401で、観賞用動画判定部108は、積算静止量が第1の閾値以上第2の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データを観賞用動画シーンの動画データとして抽出する。図11の例では、実施例1の構成ではシーンA1,A3の動画データが観賞用動画シーンの動画データとして抽出されるが、実施例2の構成ではシーンA3の動画データのみが観賞用動画シーンの動画データとして抽出される。
その他の処理は実施例1と同じであるため説明を省略する。
【0042】
観賞用動画記録判定部109は、観賞用動画判定部108で観賞用動画フラグが1とされた動画データ(抽出された観賞用動画シーンの動画データ)を、記録条件に含まれる記
録方法で記録部110が有する記録媒体に保存する。本実施例では、抽出された動画データを、表示部112のデバイス情報、抽出する際に使用した記録条件、閾値などの情報の少なくとも一部の情報を関連付けて保存する。例えば、抽出された動画データに、表示部112の駆動方式、表示フレームレート、表示方式といった情報を関連付けて保存する。
【0043】
以上述べたように、本実施例によれば、デバイス情報に基づいて第1の閾値の値が変更される。それにより、観賞用動画シーンの動画データとして、より適切な動画データを抽出することが可能となる。即ち、デバイス情報に基づいて第1の閾値が変更されない場合に比べ、入力された動画データから視聴者に高い臨場感を感じさせることのできるシーンの動画データのみをより精度よく抽出することができる。
また、本実施例によれば、積算静止量が観賞用動画シーンの静止量として妥当か否かの上限として第2の閾値が用いられる。それにより、全く動きがない(限りなく静止画に近い)動画のデータが観賞用動画シーンの動画データとして抽出されることを防ぐことができる。また、本実施例では、第2の閾値はユーザによって入力される、即ちユーザによって変更可能であるため、ユーザの好みに応じて観賞用動画シーンの動画データとするか否かの判断基準を決定することができる。例えば、全く動きがない(限りなく静止画に近い)動画のデータが観賞用動画シーンの動画データとして抽出するか否かを選択することができる。
また、本実施例によれば、抽出された動画データは、デバイス情報、記録条件、閾値などの情報の少なくとも一部の情報が関連付けられて保存される。それにより、別の画像処理装置で観賞用動画シーンの動画データの抽出を行う際に、記録されている情報を参考にして抽出することで、抽出時間(処理時間)を短縮することが可能となる。また、抽出する際の条件(デバイス情報、記録条件、閾値など)が同一である場合には、抽出処理を行うことなく観賞用動画シーンの動画データのみを表示装置で表示することが可能となる。
【0044】
なお、本実施例では、デバイス情報に基づいて第1の閾値の値を変更するものとしたが、デバイス情報に基づいて実施例1で述べた第3の閾値を変更してもよい。具体的には、表示装置の駆動方式がインパルス型駆動方式のときのほうが、ホールド型駆動方式のときよりも第3の閾値として高い値を設定すればよい。表示装置の表示フレームレートが高いほど第3の閾値として高い値を設定すればよい。表示装置の表示方式が黒挿入表示方式のときのほうが、黒挿入表示方式でないときよりも第3の閾値として高い値を設定すればよい。そのような構成であっても、上記作用効果に準じた効果が得られる。
また、積算静止量を用いた観賞用動画シーンの動画データの抽出処理(絞り込み処理)を行う際に、フレーム単位動き量が観賞用動画シーンのフレーム単位動き量として妥当か否かの下限として第4の閾値を用いてもよい。即ち、観賞用動画シーンの動画データを、抽出した動画データのうち、フレーム単位動き量が第4の閾値以上第3の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データに絞り込んでもよい。それにより、積算静止量が観賞用動画シーンの積算静止量として妥当か否かの上限として第2の閾値を用いた際に得られる作用効果に準じた作用効果を得ることができる。
【符号の説明】
【0045】
103 記録条件解析部
104 APL検出部
105 動きベクトル検出部
106 積算動きベクトル算出部
107 動き量算出部
108 観賞用動画判定部
109 観賞用動画記録判定部

【特許請求の範囲】
【請求項1】
入力された動画データから所望のシーンの動画データを抽出する画像処理装置であって、
入力された動画データの各フレームから、フレームを分割して得られるブロック毎に、動きベクトルを検出する動きベクトル検出手段と、
前記フレームのブロック毎に、そのフレームを含む第1期間分のフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出する積算動きベクトル算出手段と、
前記フレーム毎に、大きさが第1の所定値以下の積算動きベクトルの数に基づく値を積算静止量として算出する積算静止量算出手段と、
算出された前記積算静止量が第1の閾値以上のフレームを所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出する抽出手段と、
を有することを特徴とする画像処理装置。
【請求項2】
前記抽出手段は、前記積算静止量算出手段により算出された前記積算静止量に基づいて、前記第1期間よりも長い第2期間分のフレーム群からなる動画データを、前記所望のシーンの動画データとして抽出する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記抽出手段は、前記積算静止量が第1の閾値以上、かつ第2の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出する
ことを特徴とする請求項1または2に記載の画像処理装置。
【請求項4】
前記フレーム毎に、大きさが第2の所定値以上の動きベクトルの数に基づく値をフレーム単位動き量として算出するフレーム単位動き量算出手段を更に有し、
前記抽出手段は、前記所望のシーンの動画データを、前記抽出した動画データのうち、前記フレーム単位動き量が第3の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データに絞り込む
ことを特徴とする請求項1〜3のいずれか1項に記載の画像処理装置。
【請求項5】
前記抽出手段は、前記所望のシーンの動画データを、前記抽出した動画データのうち、前記フレーム単位動き量が第4の閾値以上、かつ第3の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データに絞り込む
ことを特徴とする請求項4に記載の画像処理装置。
【請求項6】
フレーム毎に、輝度特徴量、色特徴量、または、形状特徴量を抽出する特徴量抽出手段を更に有し、
前記抽出手段は、前記所望のシーンの動画データを、前記抽出した動画データのうち、前記特徴量抽出手段で抽出した特徴量のフレーム間の変動量が第5の閾値以下のフレームを所定の割合以上含むフレーム群からなる動画データに絞り込む
ことを特徴とする請求項1〜5のいずれか1項に記載の画像処理装置。
【請求項7】
前記抽出手段は、積算動きベクトルが或る向き及び前記第1の所定値より大きい或る大きさのベクトルに集中しているフレームを所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして更に抽出する
ことを特徴とする請求項1〜6のいずれか1項に記載の画像処理装置。
【請求項8】
前記抽出した所望のシーンの動画データに基づく動画を表示する表示装置の駆動方式を
表す情報を取得する取得手段を更に有し、
前記抽出手段は、
前記取得手段で取得された情報から、前記表示装置の駆動方式がインパルス型駆動方式なのかホールド型駆動方式なのかを判断し、
前記表示装置の駆動方式がインパルス型駆動方式のときのほうが、ホールド型駆動方式のときよりも前記第1の閾値として低い値を設定する
ことを特徴とする請求項1〜7のいずれか1項に記載の画像処理装置。
【請求項9】
前記抽出した所望のシーンの動画データに基づく動画を表示する表示装置の、表示される動画のフレームレートである表示フレームレートを表す情報を取得する取得手段を更に有し、
前記抽出手段は、
前記取得手段で取得された情報から、前記表示装置の表示フレームレートを判断し、
前記表示装置の表示フレームレートが高いほど前記第1の閾値として低い値を設定する
ことを特徴とする請求項1〜8のいずれか1項に記載の画像処理装置。
【請求項10】
前記抽出した所望のシーンの動画データに基づく動画を表示する表示装置の表示方式を表す情報を取得する取得手段を更に有し、
前記抽出手段は、
前記取得手段で取得された情報から、前記表示装置の表示方式が、入力された動画データに基づく動画のフレーム間に黒画像を挿入して表示する黒挿入表示方式か否かを判断し、
前記表示装置の表示方式が黒挿入表示方式のときのほうが、前記黒挿入表示方式でないときよりも前記第1の閾値として低い値を設定する
ことを特徴とする請求項1〜9のいずれか1項に記載の画像処理装置。
【請求項11】
前記動きベクトル検出手段は、入力された動画データの各フレームを複数のブロックに分割し、ブロックマッチング法によりブロック毎に動きベクトルを検出する
ことを特徴とする請求項1〜10のいずれか1項に記載の画像処理装置。
【請求項12】
前記ブロックの大きさは、1画素分の大きさである
ことを特徴とする請求項1〜11のいずれか1項に記載の画像処理装置。
【請求項13】
入力された動画データから所望のシーンの動画データを抽出する画像処理方法であって、
入力された動画データの各フレームから、フレームを分割して得られるブロック毎に、動きベクトルを検出するステップと、
前記フレームのブロック毎に、そのフレームを含む第1期間分のフレーム群の動きベクトルの時間方向の積算値である積算動きベクトルを算出するステップと、
前記フレーム毎に、大きさが第1の所定値以下の積算動きベクトルの数に基づく値を積算静止量として算出するステップと、
算出された前記積算静止量が第1の閾値以上のフレームを所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出するステップと、
を有することを特徴とする画像処理方法。
【請求項14】
入力された動画データから所望のシーンの動画データを抽出する画像処理装置であって、
入力された動画データの各フレームから、フレームを分割して得られるブロック毎に、動きベクトルを検出する動きベクトル検出手段と、
所定期間分のフレーム群毎且つブロック毎に、そのフレーム群の動きベクトルの時間方
向の積算値である積算動きベクトルを算出する積算動きベクトル算出手段と、
大きさが第1の所定値以下の積算動きベクトルの数が第1の閾値以上の前記所定期間分のフレーム群を所定の割合以上含むフレーム群からなる動画データを前記所望のシーンの動画データとして抽出する抽出手段と、
を有することを特徴とする画像処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2012−156981(P2012−156981A)
【公開日】平成24年8月16日(2012.8.16)
【国際特許分類】
【出願番号】特願2011−241099(P2011−241099)
【出願日】平成23年11月2日(2011.11.2)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】