説明

ハイライトシーンを生成する映像処理装置

【課題】本発明は、より正確なハイライトシーンを生成・保存する映像処理装置を提供する。
【解決手段】映像処理装置は、リモコンからリモコン受信部に対し命令を送り、リモコン受信部はCPUにその命令を渡す。CPUは、命令に従って、HDDより動画像データを読み出し、デコーダで音声データを抽出した上で、メモリに置く。CPUは、デコーダでデコードされた音声データを元にハイライトシーンを検出する。音声変化量を計算し、区間長分以上の音声変化量が得られていれば、音声の変化量平均値を算出する。算出された音声の変化量平均値がこれまでの変化量平均値の最大値より大きければ更新する。その際の切り出し区間の開始位置を合わせて記憶し、終端に到達するまで繰り返し行う。音声の変化量平均の最大値を持つ切り出し区間をハイライトシーンとして検出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は動画像処理に関し、特に、記録装置や外部の表示装置への出力機能を備える映像処理装置において、ハイライトシーンの生成方法に関する。
【背景技術】
【0002】
従来、動画像を再生する際に、その動画像の音声情報などの特徴量を抽出し、重要再生区間のみを再生する機能が知られている(特に、特許文献1参照)。
【0003】
特許文献1と同様な技術思想に基づく映像処理装置を、図6に基づいて説明する。インデキシング部606は、AVデータの分離部601及びA/D変換部602、エンコーダ603を通じて処理された映像データについて、各シーンに分割するとともに、音声を始めとする各種特徴量を検出する。また、各特徴量を重み付け積算することにより得た値を評価することにより、重要シーンを抽出してダイジェスト再生に用いるシナリオを作成する。シナリオはシナリオ保持部607に保持される。シナリオを元に、ナビゲーション制御部608から、デコーダ606及びD/A変換607を通じてモニタ611に再生される。
これにより、特徴シーンを適切に抽出して要約映像を作成してダイジェスト再生することができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−283993号公報(特に、図1参照)
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、ハイライトシーンを音声が大きい場面と限定している。そのため、正しくハイライトシーンを抽出できない問題があった。例えば、音声の大きいシーンでは、その音声の大きいシーンすべてをハイライトシーンと検出する可能性があった。また、逆に、音声の小さいシーンでは、その音声の小さいシーンの中にハイライトシーンが含まれていたとしても、音声の音量自体が小さいため、ハイライトシーンを検出することができなかった。
また、再生に特化しており保存されないという問題があった。そのため、ハイライトシーンを2次利用することができない。
【0006】
そこで、本発明の目的は、上記の問題を解決すべく、ハイライトシーンを生成かつ保存する機能を提供することとする。
【課題を解決するための手段】
【0007】
上記目的を達成するために、本発明の映像処理装置は、リモコンからの命令を受信するためのリモコン受信部及び、表示装置に表示するための映像出力装置を備える映像処理装置であり、映像処理を行うためCPU及びメモリ、エンコーダ・デコーダを備え、また動画像を保存するための記録装置を備える。
CPUにおいて、一定区間毎に音声レベル値を取り出す。先頭から順番に区間毎に音声変化量を計算する。ハイライトシーンとして切り出す区間長分の音声変化量が得られていれば、音声の変化量平均を算出する。音声の変化量平均値がこれまでの変化量平均値の最大値より大きければ値を更新し、その際の切り出し区間の開始位置を合わせて記憶しておく。これを1区間毎に行い終端に到達した時点で終了する。
これにより、ユーザの特別な操作を必要とせずに動画像のハイライトシーンを生成・保存できる。
【発明の効果】
【0008】
上記の構成によれば、より正確にハイライトシーンを生成およびハイライトシーンを保存する機能を提供できる。
【図面の簡単な説明】
【0009】
【図1】実施の形態1にかかる映像処理装置の構成を示す図
【図2】実施の形態1にかかるハイライトシーン検出のフローチャート
【図3】実施の形態1にかかるハイライトシーン区間の図
【図4】実施の形態1にかかる音声変化量の算出図
【図5】実施の形態1にかかるハイライトシーン作成のフローチャート
【図6】従来の映像処理装置の構成を示す図
【発明を実施するための形態】
【0010】
(実施の形態1)
[1.映像処理装置の構成]
図1に映像処理装置100の図を示す。映像処理装置100は、リモコン101からの命令を受信するためのリモコン受信部102、映像処理を行うためのCPU103及びメモリ104、エンコーダ・デコーダ105、また映像を保存するためのHDD106、また表示装置108に表示するための、HDMI107より構成される。
【0011】
リモコン101は、リモコン受信部102対して、ハイライトシーン生成や再生の命令する旨のリモコン信号を送信する。リモコン101は、少なくとも、選択をするための上下左右ボタン、メニューを表示する旨の指示をするメニュー表示ボタンおよび選択の決定を指示するための決定ボタンを備えている。ハイライトシーンを生成する場合は、表示装置108にコンテンツの一覧が表示された状態で、メニューを表示する旨のリモコン信号を送信する。その後、上下左右キーを用いて、表示装置108に表示されているハイライトシーンを生成する旨のアイコンを選択し、決定ボタンを押す。このようにすることで、ハイライトシーンを生成する旨の命令を送信する。
【0012】
またハイライトシーンを再生する場合は、表示装置108にコンテンツの一覧が表示された状態で、メニューを表示する旨のリモコン信号を送信する。その後、上下左右キーを用いて、表示装置108に表示されているハイライトシーンを再生する旨のアイコンを選択し、決定ボタンを押す。このようにすることで、ハイライトシーンを生成する旨の命令を送信する。
リモコン受信部102は、リモコン101から送信されたリモコン信号を受信する。リモコン受信部102は、受信したリモコン信号に含まれるリモコンコードを抽出しCPU103に送信する。
CPU103は、リモコン受信部102から送信されたリモコンコードを元に、メモリ104、エンコーダ・デコーダ105、HDD106を操作する。CPU103は、受信したリモコンコードと映像処理装置100に基づき、ハイライトシーンを生成するか否かを判断する。CPU103は、ハイライトシーンを生成すると判断した場合は、HDD106よりそのハイライトシーンを生成する動画像のデータを読み出し、デコーダ105に送信する。デコーダ105は、受信した動画像のデータから音声データを抽出し、メモリ104に送信する。メモリ104に送信された音声データはメモリ104内に一時的に置かれる。
CPU103は、デコーダ105でデコードされ、メモリ104に記録されている音声データを元にハイライトシーンを検出する。また、CPU103は、メモリ104上の音声データからハイライトシーンを部分切り出しする。切り出されたハイライトシーンに関する情報を、HDD106に保存する。切り出されたハイライトシーンに関する情報とは、例えば、ハイライトシーンの開始時刻と期間を含む情報である。
またCPU103は、HDD106にあるハイライトシーンを始めとする動画像データを、デコーダ105を通じてデコードする。CPU103は、そのデコードした動画像をHDMI107を通じて表示装置108へ信号送出する。
【0013】
[2.ハイライトシーン検出]
[2−1.ハイライトシーン・音声の変化量平均の定義]
本実施の形態において、ハイライトシーンを検出する場合、一定の区間毎の音声の変化量を算出し、その変な変化量に応じて、ハイライトシーンであるか否かを決定する。
図3は、ハイライトシーンを検出する際に用いる区間の決定方法を示したものである。最上段の横軸は、動画像データ全体の時間軸を示している。動画像データの開始位置をn = 0として、一定の時間毎にnを増していく。例えば、その一定時間が0.25secの場合は、
n=0は、動画像の開始から0秒の位置であり、n=1は、動画像の開始から0.25秒の位置である。末端が動画像データの終了位置となる。CPU103は、各nの値を先頭とする区間M毎に、音声の変化量平均Aを算出する。本実施の形態では、区間Mは、例えば、7秒とする。
つまり、区間Mにおける音声の変化量平均はAであり、区間Mにおける音声の変化量平均はAであり、区間Mにおける音声の変化量平均はAである。
CPU103は、動画像データ全体における、各区間Mの音声の変化量平均Aの最大値であるAmaxを持つ区間Mをハイライトシーンとして切り出す区間と判断する。
【0014】
そして、CPU103は、そのハイライトシーンとして切り出す区間と判断したMよりハイライトシーンの開始時刻と終了時刻を判断する。例えば、CPU103が区間Mをハイライトシーンと判断した場合は、ハイライトシーンの開始時刻は0.25secであり、終了時刻は7.25secである。
【0015】
なお、抽出すべきハイライトシーンは、必ずしも音声の変化量平均はAが最大値となる部分だけでなくても良い。例えば、音声の変化量平均Aが所定の閾値を超える場合は、その超えたAに対応するMすべてをハイライトシーンと判定しても良い。
【0016】
また、所定の閾値を超えたものをハイライトシーンとする場合、そのハイライトシーンが重複する場合がある。その場合はいずれか一つを選択してハイライトシーンと判定しても良い。
【0017】
図4は、CPU103が、動画像データからハイライトシーンを検出するための区間Mの音声の変化量平均Aの算出方法を示したものである。図4では、縦軸は音声量を示し、横軸は動画像データの区間M分の時間軸を示している。区間Mにおいて一定の時間毎に音声量を抽出する。その音声量をPn、n+1・・・とする。本実施の形態では、1秒ごとに音声量を抽出している。その音声の変化量をD、D・・・とする。
【0018】
CPU103は、DからDまで6つの値を算出する。これらを大きい順にソートし、その中から上位X個を取り出す。図4の場合、X = 3であるので、CPU108はDからDまで6つの値のうち、上位の3個が選ぶ。本実施の形態の例では、CPU103はD、D、Dの3つを選ぶ。これらの値をX個で平均したものを、切り出し区間Mの音声の変化量平均Aとする。
[2−2.ハイライトシーンの検出]
図2は、CPU103が実行する音声の変化量平均Aを算出するフローチャートである。動画像データの開始位置をn = 0とする(201)。一定の時間毎(本実施の形態の例では0.25秒毎)にnを増していく。CPU103は、n、n+1における、音声レベル値P、Pn+1を取り出す(202)。CPU103は、音声レベル値より、音声変化量D = |Pn+1 − P|を計算する(203)。n > Mとなり、ハイライトシーンとして切り出す区間長M分以上の音声変化量が得られていれば(204)、2−1で示した方法により、CPU103は、音声の変化量平均A = (D + D + …) /Xを算出する(205)。n ← n+1 として(206)繰り返し行い、終端に到達した時点で終了する(207)。
【0019】
以上により、CPU103は音声の変化量平均Aを算出する。
【0020】
CPU103は、動画像データに対応するすべてのAを算出した後、その算出したA
のうち最大値をAmaxとする。
【0021】
ここで、音声の変化量平均の最大値Amaxを持つ切り出し区間Mをハイライトシーンとして検出する。
【0022】
[3.ハイライトシーンの切り出し]
なお、上記実施の形態では、ハイライトシーンの開始時刻と期間を含む情報をHDD106に記録するとしたが、ハイライトシーンに対応する動画像をエンコードして、その動画像データをHDD106に記録しても良い。
【0023】
図5は、CPU103が、HDD106からメモリ104に一時的に読み出されている動画像データからハイライトシーンを切り出すフローチャートである。この場合、メモリ104には、音声データだけではなく、映像データも一時的に記録される。まず、動画像データに対応するハイライトシーンとして、音声の変化量平均の最大値Amaxに対応する、切り出し開始位置Nmax及び、切り出す区間長Mmaxを決定する(501)。次に、動画像データから、切り出し開始位置Nmaxより、切り出し開始位置Nmax+切り出す区間長M,maxまでを部分切り出しする(502)。
【0024】
[4.まとめ]
本実施の形態の映像処理装置100は、リモコン101からリモコン受信部102に対し命令を送り、リモコン受信部102はCPU103にその命令を渡す。CPU103は、命令に従って、HDD106より動画像データを読み出し、デコーダ105で音声データを抽出した上で、メモリ104に一時的に置く。
CPU103は、デコーダ105でデコードされた音声データを元にハイライトシーンを検出する。動画像データの開始位置から、一定の時間毎に音声レベル値を取り出す。音声レベル値より音声変化量を計算し、区間長分以上の音声変化量が得られていれば、音声の変化量平均値を算出する。算出された音声の変化量平均値がこれまでの変化量平均値の最大値より大きければ更新する。その際の切り出し区間の開始位置を合わせて記憶し、終端に到達するまで繰り返し行う。ここで、音声の変化量平均の最大値を持つ切り出し区間をハイライトシーンとして検出する。
CPU103は、メモリ104上の動画像データから検出されたハイライトシーンを部分切り出しする。部分切り出しされたハイライトシーンは、エンコーダ105にてエンコードされ、HDD106に保存する。また、HDMI107を通じて表示装置108へ信号送出する。
【0025】
これにより、ユーザの特別な操作を必要とせずにより正確な動画像のハイライトシーンを生成・保存できる。
【0026】
(他の実施の形態)
本発明の実施の形態として、実施の形態1を例示した。しかし、本発明はこれには限らない。そこで、本発明の他の実施の形態を以下にまとめて説明する。なお、本発明は、これらには限定されず、適宜修正された実施の形態に対しても適用可能である。
【0027】
実施の形態1において、記録装置106をHDDとしたが、これには限らない。例えば、記録装置106をSDカードといった着脱可能なメディアとしてもよい。要するに、生成されたハイライトシーンの保存が可能であればよい。
【0028】
また、実施の形態1において、出力装置107をHDMIとしたが、これに限らない。例えば、出力装置107をRCA端子としてもよい。要するに、外部の表示装置108に出力可能であればよい。また、出力装置107をLANケーブルとしてもよい。要するに、表示装置に限らず外部機器への転送が可能であればよい。
【産業上の利用可能性】
【0029】
本発明は、動画像処理に関し、特に動画像データにおけるハイライトシーンの生成と保存に関するものであって、ユーザの特別な操作を必要とせずにより正確な動画像データのハイライトシーンを提供できる。そのため、本発明は、ハードディスクレコーダーや、記録装置を持つデジタルカメラ、デジタルビデオカメラ、カメラ付き携帯端末等に適用できる。
【符号の説明】
【0030】
100 映像処理装置
101 リモコン
102 リモコン受信部
103 CPU
104 メモリ
105 エンコーダ・デコーダ
106 HDD
107 HDMI
108 表示装置

【特許請求の範囲】
【請求項1】
リモコンから送信される自装置の制御に関する命令を受信するためのリモコン受信部と、
動画像データを記録可能な記録部と、
前記動画像データをデコードし、少なくとも音声データを出力するデコーダと、
前記リモコン受信部が受信した命令に応じて、前記記録部および前記デコーダを制御するCPUを備え、
前記CPUが、
前記リモコン受信部が受信した命令に基づき、前記記憶部に記憶されている動画像データのハイライトシーンを検出すると判断した場合に、
前記デコーダは、その動画像データをデコードし少なくとも音声データを出力し、
前記CPUは、
その出力された音声データの音量の変化量に基づき、その動画像データのハイライトシーンを特定する、映像処理装置。
【請求項2】
前記CPUは、
所定の期間内の音声データの変化量の最大値を検出し、
その最大値が含まれる期間をハイライトシーンとして検出することを特徴とする、
請求項1に記載の映像処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−147296(P2012−147296A)
【公開日】平成24年8月2日(2012.8.2)
【国際特許分類】
【出願番号】特願2011−4696(P2011−4696)
【出願日】平成23年1月13日(2011.1.13)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】