ビデオコンテンツ解析装置及び方法
【課題】特定区間の認定が誤り無く行え、特定区間とその隣の区間との識別を正確にできるようする。
【解決手段】この発明の装置のイベント検出部101は、デコーディングユニット3によりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出する。イベント時刻情報格納部1012は、前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納する。複数イベント区間特定部103は、隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する。そして、映像種別識別部104は、グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する。
【解決手段】この発明の装置のイベント検出部101は、デコーディングユニット3によりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出する。イベント時刻情報格納部1012は、前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納する。複数イベント区間特定部103は、隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する。そして、映像種別識別部104は、グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ビデオコンテンツ解析装置及び方法に関するものであり、映像・音声データの途中に含まれる特定の信号区間を検出し、映像・音声データの編集を行う場合に有効である。
【背景技術】
【0002】
テレビジョン放送信号には、プログラムの境界、あるいはプログラムの途中においてコマーシャル(CM)タイムが設けられている。今、ここでは1つのCMが放送される区間をCM区間とし、複数のCMが次々と放送される区間をグループCM区間と称することにする。記録再生装置において、前記CM区間を検出する方法として、プログラム本編とCM区間との間のブラックフレームを検出するとともに、グループCM区間では隣り合うCM区間の間にあるブラックフレームを検出する方法がある。ブラックフレームの検出タイミングを参照してグループCM区間の全体をスキップし、プログラム本編のみを再生することができる。
【0003】
しかしブラックフレームのフレーム数は番組よって異なる場合があり、複数のCM区間が連続している場合、そのスキップ長に誤差が生じることがあり、プログラム本編に不要な映像が混入することがある。
【0004】
またCM区間を検出する方法として、次のような方法が開発されている(特許文献1)。音声信号を用いて音声レベルが、所定時間、閾値以下の区間を無音部として判定し、無音部と次の無音部との時間間隔が一定時間(A:たとえば15秒)の倍数であるかどうかを判定する。次に時間間隔が一定時間(A)の倍数であれば、無音部の検出をカウントし、前記無音部のカウント数が閾値(B)個以上あれば、最初と最後に現れた無音部に対して、区切り情報を設定する。しかし無音部(音声レベルが閾値以下の区間)の時間長は必ずしも一定とは限らない。このために、無音部と次の無音部との時間間隔を測定する場合、各無音部の基準時刻の設定位置が問題となる。つまり無音部の先頭、終端のどの位置を基準時刻とするかにより、前記時間間隔の測定結果が不正確となることがある。測定結果が不正確な場合、CM区間とプログラム本編との区分が不正確になる。
【特許文献1】US2006/0263062A1
【発明の開示】
【発明が解決しようとする課題】
【0005】
従来の技術であると、CM区間をスキップした連続再生映像の途中で一部に無関係のフレーム映像(CM区間の残留像)が見えることがある。そこで上記のCMなどの特定区間をさらに正確に検出したいという要望がある。
【0006】
この発明では、上記の事情に鑑みてなされたもので、特定区間の認定が誤り無く行え、特定区間とその隣の区間との識別を正確にできるようにしたビデオコンテンツ解析装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
この発明は、映像・音声データをデコードするデコーディングユニットと、前記デコーディングユニットによりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出するイベント検出部と、前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納するイベント時刻情報格納部と、隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する複数イベント区間特定部と、グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と有することを特徴とする。
【発明の効果】
【0008】
上記の手段によると、複数のイベント区間をグループ化する上で、イベント区間の解析用時刻の間隔が用いられる。この間隔が所定の条件を満たすことを判定した上で、先頭のイベント区間から最後のイベント区間の映像を第1の種別とする。イベント区間の長さが変動しても、グループとしての複数のイベント区間の検出が正確となるため、イベント区間の検出ミスが低減され、複数のイベント区間の範囲確定が正確となり、第1の種別と第2の種別の映像の識別が正確となる。
【発明を実施するための最良の形態】
【0009】
以下、図面を参照してこの発明の実施の形態を説明する。図1はこの発明が適用された信号処理装置の構成例である。この信号処理装置は、例えばデジタルテレビジョン受信装置、あるいは情報記録再生装置などに適用可能である。
【0010】
チューナ1は、例えばデジタル放送信号を受信し、受信信号を復調し、復調出力をトランスポートデコーダ2に供給する。トランスポートデコーダ2で選択された番組の映像データ・音声データはパケット毎にオーディオビデオ(AV)デコーダ3に入力されて復調される。AVデコーディングユニット3で復調された音声出力は、出力端子4Aに出力され、映像出力は、出力端子4Pに出力される。出力端子4Pの映像データには、合成回路5にて、オンスクリーンディスプレイ(OSD)コントローラ6からの映像データが合成される場合もある。
【0011】
SDRAM8は、例えば受信信号のエラー訂正処理などを行うときに、一時的にデータを格納する場合に利用される。また、EEPROM9は、例えば装置の機能を実行するプログラムあるいはパラメータなどを保存しておくために利用される。
【0012】
10は、メインバスであり、上記のトランスポートデコーダ2、AVデコーディングユニット3、OSDコントローラ6、SDRAM8、EEPROM9などに接続されている。そしてメインバス10には、装置を統括する制御部としてのCPU11が接続されている。さらにこの装置は、バス10を介して外部機器と接続することが可能である。このためにメインバス10には、モデムインターフェース12a,リモコンインターフェース12b、ATAPIインターフェース12cが接続されている。インターフェース12cを介してハードディスクドライブ(HDD)13を接続することも可能である。
【0013】
トランスポートストリームデコーダ2で分離されたAVストリームは、ATAPIインターフェース12cを介して、HDD13に記録することができる。再生時時には、HDD13から読み出されたAVストリームがAVデコーディングユニット3でデコードされる。
【0014】
AVデコーディングユニット3は、トランスポートストリームからオーディオ信号、ビデオ信号を再生することができる。またDVD規格のオーディオストリーム、ビデオストリームからもオーディオ信号、ビデオ信号を再生することができる。また更に他の規格の信号からオーディオ信号、ビデオ信号を再生できるように構成されていてもよい。
【0015】
またメインバス10には、AVエンコーダ14が接続され、このAVエンコーダ14は、映像データを記録媒体に記録するために所定のフォーマット(例えばDVD規格、トランスポートストリーム、ベースバンド、その他)に変換することができる。変換されたAV情報は、例えばHDD13に記録される。
【0016】
さらにインターフェース15を介して、DVDドライブ16が接続されていてもよい。そしてDVD規格の情報は、DVDドライブ16を介して光ディスクに記録される、あるいは光ディスクから再生されるようにしてもよい。
【0017】
CPU11は、上記した各ブロックを統括して制御する。またCPU11内部には、イベント検出部101、イベント時刻情報格納部102、複数イベント区間特定部103、映像種別識別部104が設けられている。
【0018】
イベント検出部101は、AVデコーディングユニット3によりデコードされた映像の中で、特定の特徴が生じた区間をイベント区間として検出する。イベント時刻情報格納部102は、検出したイベント区間の開始時刻、終了時刻、その間の解析用時刻を格納する。解析用時刻は、開始時刻と終了時刻の中央の中央時刻が望ましいが中央時刻にさらに±αの時刻であってもよい。
【0019】
複数イベント区間特定部103は、隣り合うイベント区間に対して求められた隣り合う解析用時刻の間隔が所定の条件を満たす場合に、隣り合うイベント区間を特定する。映像種別識別部104は、特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する部分である。そして識別情報を生成することもできる。この識別情報は、1つの管理情報としてAVエンコーダ14でエンコードされた圧縮映像データに関連付けられる。そして圧縮映像データとともに識別情報は、例えば、HDD13に記録される。
【0020】
図2はイベント検出方法の一例を示している。イベント検出部101にあっては、デコードされたビデオデータをフレーム単位で監視し、フレーム全体が特定の色(例えば青)であるか否かを判定する。この場合、必ずしも青とは限らず、他の色でもよく、1フレームが単色であるか否かを判定するよういしてもよい。そして、フレーム全体が特定の色(単色)に変化したときを、特徴が発生した時刻(t1)、特定の色から通常のビデオ内容に変化したときを特徴が消失した時刻(t3)とする。さらに時刻t1とt3の解析用時刻を計算し解析用時刻(t2)とする。解析用時刻は例えば、t1とt3の中間の時刻である。そして時刻t1からt3までをイベント区間(EV)として定義する。
【0021】
上記のようにイベント区間を検出すると、例えば図3の例のように、複数のイベント区間(EV1、EV2,EV3、EV4)を検出することができる。イベント時刻情報格納部102は、それぞれのイベント区間の特徴が発生した時刻、特徴が消失した時刻、その解析用時刻を一時的に格納する。そして、複数イベント区間特定部103により、隣り合うイベント区の中央時刻間の時間差がn秒か又はその倍数秒であるかを判断する。そして、隣り合うイベント区の中央時刻間の時間差がn秒か又はその倍数秒であれば、この期間を複数イベント区間として特定する。
【0022】
さらに映像種別識別部104は、特定された複数のイベント区間のうち先頭のイベント区間の開始時刻から最後のイベント区間の終了時刻までの映像を第1の種別として、それ以外の映像を第2の種別として識別する。
【0023】
図3の例は、グループとしての複数のイベント区間を特定する場合、隣り合うイベント区間の解析用時刻間の時間差がn秒か又はその倍数秒であることを条件にした。しかしこれに限定されるものではない。n秒としては、たとえば10秒、20秒、30秒などがある。
【0024】
図4の例は、隣り合うイベント区間の解析用時刻間の時間差がn秒以内であることを条件にして、グループとしての複数のイベント区間の範囲を認定する例である。
【0025】
上記したように、イベント区間の解析用時刻の間隔が、所定の条件を満たすことを判定した上で、先頭のイベント区間から最後のイベント区間の映像を第1の種別としている。このためにイベント区間の検出ミスが低減され、複数のイベント区間の範囲確定が正確となり、第1の種別と第2の種別の映像の識別が正確となる。
【0026】
CMによっては、短いイベント区間,長いイベント区間があり、一律に、イベントの先頭のみの情報からCM区間を特定すると、CM区間の検出ミスが生じることがある。しかしこの発明であると、イベント区間の解析用時刻間を測定しているので、このような検出ミスが低減される。
【0027】
次に本発明では、映像種別識別部104は、複数のイベント区間のうち先頭のイベント区間の開始時刻から最後のイベント区間の終了時刻までを映像の第1の種別として、それ以外を映像の第2の種別として設定する。このために、正確にフレーム単位で映像の第1の種別と、それ以外の映像の第2の種別とが分離識別される。この様子を示した図が図5である。即ち、複数のイベント区間のうち先頭のイベント区間(EV1)の開始時刻から最後のイベント区間(EV4)の終了時刻までを映像の第1の種別の区間として設定できる。
【0028】
上記の実施の形態では、イベント区間を検出するためにフレーム全体が単色であるか否かを判定した。しかしこれに限らず、以下のような方法であってもよい。即ち、CM期間の始まりと終わりには一瞬無音期間が存在するので、この期間を先のイベント区間と同様な検出結果として利用するのである。なおここで、無音期間検出は、完全な音声レベルゼロを意味するのではなく、音声レベルが所定レベル以下になったことを検出することである。
【0029】
図6と図7は、無音部を検出することで無音イベント区間を検出するときの動作と制御部11の内部を示している。この場合も無音部の開始時刻、終了時刻を判定し、次に、開始時刻と終了時刻との解析用時刻を計算により求めて、メモリに格納する。
【0030】
ビデオ信号には、プログラム本編の途中に第1回目のコマーシャルとしてCM1,CM2,CM3,CM4存在し、第2回目のコマーシャルとしてCM5,CM6,CM7が存在する例を示している。コマーシャルの境目にはイベント区間EV11−EV19が存在する。
【0031】
無音部イベント検出部201は、オーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定している。イベント時刻情報格納部102は、検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納する。
【0032】
以後の処理は、図1に示した実施の形態と同様である。つまり、制御部11内には、隣り合う無音イベント区間に対して求められた隣り合う解析用時刻の間隔が所定の条件を満たす場合に、隣り合うイベント区間をグループ内として特定する複数イベント区間特定部103と、特定された複数のイベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と104有する。
【0033】
図8、図9は、図1の実施形態と、図6、図7の実施形態を合体した実施の形態である。映像の全フレームが単色に変化したときであり、かつオーディオ信号レベルが所定の閾値以下に変化したときをイベント区間の開始と判定し、映像の全フレームが単色から通常画像状態に変化したときであり、かつオーディオ信号レベルが所定の閾値以下から以上に変化したときをイベント区間の終了と判定する例である。
【0034】
この実施の形態によれば、誤って検出された不要なイベント区間EVA5、EVA7,EVP7,EVP11が存在しても、これらのイベント区間が採用されることはない。制御部11内には、図9に示すようにイベント検出部101、無音イベント検出部201、イベント時刻情報格納部102、複数イベント区間特定部103、映像種別識別部104が存在する。
【0035】
図10には、第1の実施の形態の動作フローチャートを示している。ビデオタイトルの先頭からの再生が開始されると、時間カウンタがスタートする(ステップSA1)。全フレームが単色になったかどうかの判定が行なわれ((ステップSA2)る。単色なったときイベント区間の始まりと認識し、開始時刻を格納する(ステップSA3)。ビデオタイトルの再生が終了したかどうかをチェックしつつ((ステップSA4)、全フレーム単色検出状態から通常画像検出状態に変化したからどうかを判定する(ステップSA5)。
【0036】
ビデオタイトルが終了したら動作が終了する。全フレーム単色検出状態から通常画像検出状態に変化したら、終了時刻を格納し(ステップSA6)、次に中間の解析用時刻を計算して、イベント時刻情報格納部102に格納する(ステップSA7)。
【0037】
つぎのステップではグループ内としての前回の解析用時刻情報が存在するかどうかを判定し、なければ、今回が最初のイベント区間であるとして認識し(ステップSA10)、次のイベント区間のサーチに移行する(ステップSA11→SA2)。
【0038】
ステップSA8において、グループ内としての前回の解析用時刻情報が存在する場合は、前回の解析用時刻と今回の解析用時刻との差が所定の条件を満足しているかどうかを判定する(ステップSA9)。満足している場合には、今回のイベント区間をグループ内のものとして特定し、次のイベント区間の検索に移行する。
【0039】
前回の解析用時刻と今回の解析用時刻との差が所定の条件を満足していない場合は、今回のイベント区間がグループ内ではないと判定し、今まで検出した複数のイベント区間を決定し、最初(先頭)のイベント区間の開始時刻、最後のイベント区間の終了時刻を決定する(ステップSA12)。
【0040】
次にステップSA13に移行して、映像種別の確定を行ない、今までのイベント区間情報をクリアし(ステップSA14)、ステップSA2に戻る。次の複数のイベント区間の検索に移行する。
【0041】
図11は、図8に示した実施形態に対応するフローチャートである。
【0042】
ビデオタイトルの先頭からの再生が開始されると、時間カウンタがスタートする(ステップSC1)。音声レベルが閾値以下になったかどうかの判定が行なわれ(ステップSC2)る。閾値以下になったときイベント区間の始まりと認識し、開始時刻を格納する(ステップSC3)。ビデオタイトルの再生が終了したかどうかをチェックしつつ((ステップSC4)、音声レベルが閾値以下の状態から閾値以上に変化したか、その変化するまでの時間間隔は十分かの判定がなされる(ステップSC5)。時間間隔が一定の幅を持つことを確認する理由は、ノイズに反応しないためである。
【0043】
ビデオタイトルが終了したら動作が終了する。音声レベルが閾値以下の状態から閾値以上に変化したら、終了時刻を格納し(ステップSC6)、次に中間の解析用時刻を計算して、イベント時刻情報格納部102に格納する(ステップSC7)。
【0044】
つぎのステップではグループ内としての前回の解析用時刻情報が存在するかどうかを判定し、なければ、今回が最初のイベント区間であるとして認識し(ステップSC10)、次のイベント区間のサーチに移行する(ステップSC11→SC2)。
【0045】
ステップSC8において、グループ内としての前回の中間の解析用時刻情報が存在する場合は、前回の解析用時刻と今回の中間の解析用時刻との差が所定の条件を満足しているかどうかを判定する(ステップSC9)。満足している場合には、今回のイベント区間をグループ内のものとして特定し、次のイベント区間の検索に移行する。
【0046】
前回の解析用時刻と今回の解析用時刻との差が所定の条件を満足していない場合は、今回のイベント区間がグループ内ではないと判定し、今まで検出した複数のイベント区間を決定し、最初(先頭)のイベント区間の開始時刻、最後のイベント区間の終了時刻を決定する(ステップSC12)。
【0047】
次にステップSA13に移行して、映像種別の確定を行ない、今までのイベント区間情報をクリアし(ステップSC14)、ステップSA2に戻る。次の複数のイベント区間の検索に移行する。
【0048】
図12は、図10と図11の実施の形態が一体化された例である。図10との違いは、ステップSA2とステップSA3の間にステップSB1が設けられ、音声レベルが閾値以下か動かを判定している。またステップSA5とSA6の間に音声レベルが閾値以下から閾値以上に変化したどうかを判定している点である。そのたの部分は図10と同じである。
【0049】
上記した映像の種別確定は、例えばチューナからの受信信号が図1のAVデコーダでデコードされているビデオ信号に対して行われる。そして圧縮処理されたAVデータに関連付けて映像種別情報もハードディスクに記録される。または、ハードディスクに記録されているトラスポートストリームが、AVデコーダでデコードされるとともにビデオ信号に同期する映像種別情報も成生される。そして圧縮処理されたAVデータに関連つけて映像種別情報もハードディスクに記録される。圧縮処理されたAVデータがAVデコーダでデコードされたときは、映像種別情報も参照され、映像の第1の種別の部分がスキップされ、映像の第2の種別の部分だけが出力される。あるいは逆に映像の第1の種別の部分のみが出力されるようにしてもよい。この種別の選択は、利用者が操作部を介して任意に設定することができる。
【0050】
上記したようにこの発明によれば、イベント区間の解析用時刻の間隔が、前記所定の条件を満たすことを判定した上で、先頭のイベント区間から最後のイベント区間の映像を第1の種別とするので、イベント区間の検出ミスが低減され、複数のイベント区間の範囲確定が正確となり、第1の種別と第2の種別の映像の識別が正確となる。イベント区間が変動してもグループとしての複数のイベント区間の検出が正確となる。
【0051】
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【図面の簡単な説明】
【0052】
【図1】この発明が適用された信号処理装置の構成例を示す図である。
【図2】イベント検出方法の一例を示す図である。
【図3】グループとしての複数のイベント区間を特定する場合の条件例を示す説明図である。
【図4】グループとしての複数のイベント区間を特定する場合の他の条件例を示す説明図である。
【図5】グループとしての複数のイベント区間を映像の第1の種別とし、他の部分を映像の第2の種別とするときの分割点を示す説明図である。
【図6】無音イベント区間を検出するときの動作タイミングチャートの例を示す図である。
【図7】図6の無音イベント区間を検出するときの動作タイミングチャートを得る制御部の構成例を示す図である。
【図8】単色のイベント区間と無音イベント区間を検出するときの動作タイミングチャートの例を示す図である。
【図9】図8の単色のイベント区間と無音イベント区間を検出するときの動作タイミングチャートを得る制御部の構成例を示す図である。
【図10】単色のイベント区間を検出するときのフローチャートの例を示す図である。
【図11】無音部のイベント区間を検出するときのフローチャートの例を示す図である。
【図12】単色のイベント区間と無音イベント区間を検出するときフローチャートの例を示す図である。
【符号の説明】
【0053】
1・・・チューナ、2・・・トランスポートデコーダ、3・・・AVデコーディングユニット、11・・・制御部、13・・・ハードディスクドライブ、101・・・イベント検出部、102・・・イベント時刻情報格納部、103・・・複数イベント区間特定部、104・・・映像種別識別部、201・・・無音イベント検出部。
【技術分野】
【0001】
この発明は、ビデオコンテンツ解析装置及び方法に関するものであり、映像・音声データの途中に含まれる特定の信号区間を検出し、映像・音声データの編集を行う場合に有効である。
【背景技術】
【0002】
テレビジョン放送信号には、プログラムの境界、あるいはプログラムの途中においてコマーシャル(CM)タイムが設けられている。今、ここでは1つのCMが放送される区間をCM区間とし、複数のCMが次々と放送される区間をグループCM区間と称することにする。記録再生装置において、前記CM区間を検出する方法として、プログラム本編とCM区間との間のブラックフレームを検出するとともに、グループCM区間では隣り合うCM区間の間にあるブラックフレームを検出する方法がある。ブラックフレームの検出タイミングを参照してグループCM区間の全体をスキップし、プログラム本編のみを再生することができる。
【0003】
しかしブラックフレームのフレーム数は番組よって異なる場合があり、複数のCM区間が連続している場合、そのスキップ長に誤差が生じることがあり、プログラム本編に不要な映像が混入することがある。
【0004】
またCM区間を検出する方法として、次のような方法が開発されている(特許文献1)。音声信号を用いて音声レベルが、所定時間、閾値以下の区間を無音部として判定し、無音部と次の無音部との時間間隔が一定時間(A:たとえば15秒)の倍数であるかどうかを判定する。次に時間間隔が一定時間(A)の倍数であれば、無音部の検出をカウントし、前記無音部のカウント数が閾値(B)個以上あれば、最初と最後に現れた無音部に対して、区切り情報を設定する。しかし無音部(音声レベルが閾値以下の区間)の時間長は必ずしも一定とは限らない。このために、無音部と次の無音部との時間間隔を測定する場合、各無音部の基準時刻の設定位置が問題となる。つまり無音部の先頭、終端のどの位置を基準時刻とするかにより、前記時間間隔の測定結果が不正確となることがある。測定結果が不正確な場合、CM区間とプログラム本編との区分が不正確になる。
【特許文献1】US2006/0263062A1
【発明の開示】
【発明が解決しようとする課題】
【0005】
従来の技術であると、CM区間をスキップした連続再生映像の途中で一部に無関係のフレーム映像(CM区間の残留像)が見えることがある。そこで上記のCMなどの特定区間をさらに正確に検出したいという要望がある。
【0006】
この発明では、上記の事情に鑑みてなされたもので、特定区間の認定が誤り無く行え、特定区間とその隣の区間との識別を正確にできるようにしたビデオコンテンツ解析装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
この発明は、映像・音声データをデコードするデコーディングユニットと、前記デコーディングユニットによりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出するイベント検出部と、前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納するイベント時刻情報格納部と、隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する複数イベント区間特定部と、グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と有することを特徴とする。
【発明の効果】
【0008】
上記の手段によると、複数のイベント区間をグループ化する上で、イベント区間の解析用時刻の間隔が用いられる。この間隔が所定の条件を満たすことを判定した上で、先頭のイベント区間から最後のイベント区間の映像を第1の種別とする。イベント区間の長さが変動しても、グループとしての複数のイベント区間の検出が正確となるため、イベント区間の検出ミスが低減され、複数のイベント区間の範囲確定が正確となり、第1の種別と第2の種別の映像の識別が正確となる。
【発明を実施するための最良の形態】
【0009】
以下、図面を参照してこの発明の実施の形態を説明する。図1はこの発明が適用された信号処理装置の構成例である。この信号処理装置は、例えばデジタルテレビジョン受信装置、あるいは情報記録再生装置などに適用可能である。
【0010】
チューナ1は、例えばデジタル放送信号を受信し、受信信号を復調し、復調出力をトランスポートデコーダ2に供給する。トランスポートデコーダ2で選択された番組の映像データ・音声データはパケット毎にオーディオビデオ(AV)デコーダ3に入力されて復調される。AVデコーディングユニット3で復調された音声出力は、出力端子4Aに出力され、映像出力は、出力端子4Pに出力される。出力端子4Pの映像データには、合成回路5にて、オンスクリーンディスプレイ(OSD)コントローラ6からの映像データが合成される場合もある。
【0011】
SDRAM8は、例えば受信信号のエラー訂正処理などを行うときに、一時的にデータを格納する場合に利用される。また、EEPROM9は、例えば装置の機能を実行するプログラムあるいはパラメータなどを保存しておくために利用される。
【0012】
10は、メインバスであり、上記のトランスポートデコーダ2、AVデコーディングユニット3、OSDコントローラ6、SDRAM8、EEPROM9などに接続されている。そしてメインバス10には、装置を統括する制御部としてのCPU11が接続されている。さらにこの装置は、バス10を介して外部機器と接続することが可能である。このためにメインバス10には、モデムインターフェース12a,リモコンインターフェース12b、ATAPIインターフェース12cが接続されている。インターフェース12cを介してハードディスクドライブ(HDD)13を接続することも可能である。
【0013】
トランスポートストリームデコーダ2で分離されたAVストリームは、ATAPIインターフェース12cを介して、HDD13に記録することができる。再生時時には、HDD13から読み出されたAVストリームがAVデコーディングユニット3でデコードされる。
【0014】
AVデコーディングユニット3は、トランスポートストリームからオーディオ信号、ビデオ信号を再生することができる。またDVD規格のオーディオストリーム、ビデオストリームからもオーディオ信号、ビデオ信号を再生することができる。また更に他の規格の信号からオーディオ信号、ビデオ信号を再生できるように構成されていてもよい。
【0015】
またメインバス10には、AVエンコーダ14が接続され、このAVエンコーダ14は、映像データを記録媒体に記録するために所定のフォーマット(例えばDVD規格、トランスポートストリーム、ベースバンド、その他)に変換することができる。変換されたAV情報は、例えばHDD13に記録される。
【0016】
さらにインターフェース15を介して、DVDドライブ16が接続されていてもよい。そしてDVD規格の情報は、DVDドライブ16を介して光ディスクに記録される、あるいは光ディスクから再生されるようにしてもよい。
【0017】
CPU11は、上記した各ブロックを統括して制御する。またCPU11内部には、イベント検出部101、イベント時刻情報格納部102、複数イベント区間特定部103、映像種別識別部104が設けられている。
【0018】
イベント検出部101は、AVデコーディングユニット3によりデコードされた映像の中で、特定の特徴が生じた区間をイベント区間として検出する。イベント時刻情報格納部102は、検出したイベント区間の開始時刻、終了時刻、その間の解析用時刻を格納する。解析用時刻は、開始時刻と終了時刻の中央の中央時刻が望ましいが中央時刻にさらに±αの時刻であってもよい。
【0019】
複数イベント区間特定部103は、隣り合うイベント区間に対して求められた隣り合う解析用時刻の間隔が所定の条件を満たす場合に、隣り合うイベント区間を特定する。映像種別識別部104は、特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する部分である。そして識別情報を生成することもできる。この識別情報は、1つの管理情報としてAVエンコーダ14でエンコードされた圧縮映像データに関連付けられる。そして圧縮映像データとともに識別情報は、例えば、HDD13に記録される。
【0020】
図2はイベント検出方法の一例を示している。イベント検出部101にあっては、デコードされたビデオデータをフレーム単位で監視し、フレーム全体が特定の色(例えば青)であるか否かを判定する。この場合、必ずしも青とは限らず、他の色でもよく、1フレームが単色であるか否かを判定するよういしてもよい。そして、フレーム全体が特定の色(単色)に変化したときを、特徴が発生した時刻(t1)、特定の色から通常のビデオ内容に変化したときを特徴が消失した時刻(t3)とする。さらに時刻t1とt3の解析用時刻を計算し解析用時刻(t2)とする。解析用時刻は例えば、t1とt3の中間の時刻である。そして時刻t1からt3までをイベント区間(EV)として定義する。
【0021】
上記のようにイベント区間を検出すると、例えば図3の例のように、複数のイベント区間(EV1、EV2,EV3、EV4)を検出することができる。イベント時刻情報格納部102は、それぞれのイベント区間の特徴が発生した時刻、特徴が消失した時刻、その解析用時刻を一時的に格納する。そして、複数イベント区間特定部103により、隣り合うイベント区の中央時刻間の時間差がn秒か又はその倍数秒であるかを判断する。そして、隣り合うイベント区の中央時刻間の時間差がn秒か又はその倍数秒であれば、この期間を複数イベント区間として特定する。
【0022】
さらに映像種別識別部104は、特定された複数のイベント区間のうち先頭のイベント区間の開始時刻から最後のイベント区間の終了時刻までの映像を第1の種別として、それ以外の映像を第2の種別として識別する。
【0023】
図3の例は、グループとしての複数のイベント区間を特定する場合、隣り合うイベント区間の解析用時刻間の時間差がn秒か又はその倍数秒であることを条件にした。しかしこれに限定されるものではない。n秒としては、たとえば10秒、20秒、30秒などがある。
【0024】
図4の例は、隣り合うイベント区間の解析用時刻間の時間差がn秒以内であることを条件にして、グループとしての複数のイベント区間の範囲を認定する例である。
【0025】
上記したように、イベント区間の解析用時刻の間隔が、所定の条件を満たすことを判定した上で、先頭のイベント区間から最後のイベント区間の映像を第1の種別としている。このためにイベント区間の検出ミスが低減され、複数のイベント区間の範囲確定が正確となり、第1の種別と第2の種別の映像の識別が正確となる。
【0026】
CMによっては、短いイベント区間,長いイベント区間があり、一律に、イベントの先頭のみの情報からCM区間を特定すると、CM区間の検出ミスが生じることがある。しかしこの発明であると、イベント区間の解析用時刻間を測定しているので、このような検出ミスが低減される。
【0027】
次に本発明では、映像種別識別部104は、複数のイベント区間のうち先頭のイベント区間の開始時刻から最後のイベント区間の終了時刻までを映像の第1の種別として、それ以外を映像の第2の種別として設定する。このために、正確にフレーム単位で映像の第1の種別と、それ以外の映像の第2の種別とが分離識別される。この様子を示した図が図5である。即ち、複数のイベント区間のうち先頭のイベント区間(EV1)の開始時刻から最後のイベント区間(EV4)の終了時刻までを映像の第1の種別の区間として設定できる。
【0028】
上記の実施の形態では、イベント区間を検出するためにフレーム全体が単色であるか否かを判定した。しかしこれに限らず、以下のような方法であってもよい。即ち、CM期間の始まりと終わりには一瞬無音期間が存在するので、この期間を先のイベント区間と同様な検出結果として利用するのである。なおここで、無音期間検出は、完全な音声レベルゼロを意味するのではなく、音声レベルが所定レベル以下になったことを検出することである。
【0029】
図6と図7は、無音部を検出することで無音イベント区間を検出するときの動作と制御部11の内部を示している。この場合も無音部の開始時刻、終了時刻を判定し、次に、開始時刻と終了時刻との解析用時刻を計算により求めて、メモリに格納する。
【0030】
ビデオ信号には、プログラム本編の途中に第1回目のコマーシャルとしてCM1,CM2,CM3,CM4存在し、第2回目のコマーシャルとしてCM5,CM6,CM7が存在する例を示している。コマーシャルの境目にはイベント区間EV11−EV19が存在する。
【0031】
無音部イベント検出部201は、オーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定している。イベント時刻情報格納部102は、検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納する。
【0032】
以後の処理は、図1に示した実施の形態と同様である。つまり、制御部11内には、隣り合う無音イベント区間に対して求められた隣り合う解析用時刻の間隔が所定の条件を満たす場合に、隣り合うイベント区間をグループ内として特定する複数イベント区間特定部103と、特定された複数のイベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と104有する。
【0033】
図8、図9は、図1の実施形態と、図6、図7の実施形態を合体した実施の形態である。映像の全フレームが単色に変化したときであり、かつオーディオ信号レベルが所定の閾値以下に変化したときをイベント区間の開始と判定し、映像の全フレームが単色から通常画像状態に変化したときであり、かつオーディオ信号レベルが所定の閾値以下から以上に変化したときをイベント区間の終了と判定する例である。
【0034】
この実施の形態によれば、誤って検出された不要なイベント区間EVA5、EVA7,EVP7,EVP11が存在しても、これらのイベント区間が採用されることはない。制御部11内には、図9に示すようにイベント検出部101、無音イベント検出部201、イベント時刻情報格納部102、複数イベント区間特定部103、映像種別識別部104が存在する。
【0035】
図10には、第1の実施の形態の動作フローチャートを示している。ビデオタイトルの先頭からの再生が開始されると、時間カウンタがスタートする(ステップSA1)。全フレームが単色になったかどうかの判定が行なわれ((ステップSA2)る。単色なったときイベント区間の始まりと認識し、開始時刻を格納する(ステップSA3)。ビデオタイトルの再生が終了したかどうかをチェックしつつ((ステップSA4)、全フレーム単色検出状態から通常画像検出状態に変化したからどうかを判定する(ステップSA5)。
【0036】
ビデオタイトルが終了したら動作が終了する。全フレーム単色検出状態から通常画像検出状態に変化したら、終了時刻を格納し(ステップSA6)、次に中間の解析用時刻を計算して、イベント時刻情報格納部102に格納する(ステップSA7)。
【0037】
つぎのステップではグループ内としての前回の解析用時刻情報が存在するかどうかを判定し、なければ、今回が最初のイベント区間であるとして認識し(ステップSA10)、次のイベント区間のサーチに移行する(ステップSA11→SA2)。
【0038】
ステップSA8において、グループ内としての前回の解析用時刻情報が存在する場合は、前回の解析用時刻と今回の解析用時刻との差が所定の条件を満足しているかどうかを判定する(ステップSA9)。満足している場合には、今回のイベント区間をグループ内のものとして特定し、次のイベント区間の検索に移行する。
【0039】
前回の解析用時刻と今回の解析用時刻との差が所定の条件を満足していない場合は、今回のイベント区間がグループ内ではないと判定し、今まで検出した複数のイベント区間を決定し、最初(先頭)のイベント区間の開始時刻、最後のイベント区間の終了時刻を決定する(ステップSA12)。
【0040】
次にステップSA13に移行して、映像種別の確定を行ない、今までのイベント区間情報をクリアし(ステップSA14)、ステップSA2に戻る。次の複数のイベント区間の検索に移行する。
【0041】
図11は、図8に示した実施形態に対応するフローチャートである。
【0042】
ビデオタイトルの先頭からの再生が開始されると、時間カウンタがスタートする(ステップSC1)。音声レベルが閾値以下になったかどうかの判定が行なわれ(ステップSC2)る。閾値以下になったときイベント区間の始まりと認識し、開始時刻を格納する(ステップSC3)。ビデオタイトルの再生が終了したかどうかをチェックしつつ((ステップSC4)、音声レベルが閾値以下の状態から閾値以上に変化したか、その変化するまでの時間間隔は十分かの判定がなされる(ステップSC5)。時間間隔が一定の幅を持つことを確認する理由は、ノイズに反応しないためである。
【0043】
ビデオタイトルが終了したら動作が終了する。音声レベルが閾値以下の状態から閾値以上に変化したら、終了時刻を格納し(ステップSC6)、次に中間の解析用時刻を計算して、イベント時刻情報格納部102に格納する(ステップSC7)。
【0044】
つぎのステップではグループ内としての前回の解析用時刻情報が存在するかどうかを判定し、なければ、今回が最初のイベント区間であるとして認識し(ステップSC10)、次のイベント区間のサーチに移行する(ステップSC11→SC2)。
【0045】
ステップSC8において、グループ内としての前回の中間の解析用時刻情報が存在する場合は、前回の解析用時刻と今回の中間の解析用時刻との差が所定の条件を満足しているかどうかを判定する(ステップSC9)。満足している場合には、今回のイベント区間をグループ内のものとして特定し、次のイベント区間の検索に移行する。
【0046】
前回の解析用時刻と今回の解析用時刻との差が所定の条件を満足していない場合は、今回のイベント区間がグループ内ではないと判定し、今まで検出した複数のイベント区間を決定し、最初(先頭)のイベント区間の開始時刻、最後のイベント区間の終了時刻を決定する(ステップSC12)。
【0047】
次にステップSA13に移行して、映像種別の確定を行ない、今までのイベント区間情報をクリアし(ステップSC14)、ステップSA2に戻る。次の複数のイベント区間の検索に移行する。
【0048】
図12は、図10と図11の実施の形態が一体化された例である。図10との違いは、ステップSA2とステップSA3の間にステップSB1が設けられ、音声レベルが閾値以下か動かを判定している。またステップSA5とSA6の間に音声レベルが閾値以下から閾値以上に変化したどうかを判定している点である。そのたの部分は図10と同じである。
【0049】
上記した映像の種別確定は、例えばチューナからの受信信号が図1のAVデコーダでデコードされているビデオ信号に対して行われる。そして圧縮処理されたAVデータに関連付けて映像種別情報もハードディスクに記録される。または、ハードディスクに記録されているトラスポートストリームが、AVデコーダでデコードされるとともにビデオ信号に同期する映像種別情報も成生される。そして圧縮処理されたAVデータに関連つけて映像種別情報もハードディスクに記録される。圧縮処理されたAVデータがAVデコーダでデコードされたときは、映像種別情報も参照され、映像の第1の種別の部分がスキップされ、映像の第2の種別の部分だけが出力される。あるいは逆に映像の第1の種別の部分のみが出力されるようにしてもよい。この種別の選択は、利用者が操作部を介して任意に設定することができる。
【0050】
上記したようにこの発明によれば、イベント区間の解析用時刻の間隔が、前記所定の条件を満たすことを判定した上で、先頭のイベント区間から最後のイベント区間の映像を第1の種別とするので、イベント区間の検出ミスが低減され、複数のイベント区間の範囲確定が正確となり、第1の種別と第2の種別の映像の識別が正確となる。イベント区間が変動してもグループとしての複数のイベント区間の検出が正確となる。
【0051】
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【図面の簡単な説明】
【0052】
【図1】この発明が適用された信号処理装置の構成例を示す図である。
【図2】イベント検出方法の一例を示す図である。
【図3】グループとしての複数のイベント区間を特定する場合の条件例を示す説明図である。
【図4】グループとしての複数のイベント区間を特定する場合の他の条件例を示す説明図である。
【図5】グループとしての複数のイベント区間を映像の第1の種別とし、他の部分を映像の第2の種別とするときの分割点を示す説明図である。
【図6】無音イベント区間を検出するときの動作タイミングチャートの例を示す図である。
【図7】図6の無音イベント区間を検出するときの動作タイミングチャートを得る制御部の構成例を示す図である。
【図8】単色のイベント区間と無音イベント区間を検出するときの動作タイミングチャートの例を示す図である。
【図9】図8の単色のイベント区間と無音イベント区間を検出するときの動作タイミングチャートを得る制御部の構成例を示す図である。
【図10】単色のイベント区間を検出するときのフローチャートの例を示す図である。
【図11】無音部のイベント区間を検出するときのフローチャートの例を示す図である。
【図12】単色のイベント区間と無音イベント区間を検出するときフローチャートの例を示す図である。
【符号の説明】
【0053】
1・・・チューナ、2・・・トランスポートデコーダ、3・・・AVデコーディングユニット、11・・・制御部、13・・・ハードディスクドライブ、101・・・イベント検出部、102・・・イベント時刻情報格納部、103・・・複数イベント区間特定部、104・・・映像種別識別部、201・・・無音イベント検出部。
【特許請求の範囲】
【請求項1】
映像・音声データをデコードするデコーディングユニットと、
前記デコーディングユニットによりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出するイベント検出部と、
前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納するイベント時刻情報格納部と、
隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する複数イベント区間特定部と、
グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と有するビデオコンテンツ解析装置。
【請求項2】
前記映像種別識別部は、前記複数の前記イベント区間のうち先頭のイベント区間の開始時刻から最後のイベント区間の終了時刻までを前記映像の第1の種別として、それ以外を前記映像の第2の種別として設定することを特徴とする請求項1記載のビデオコンテンツ解析装置。
【請求項3】
前記特定の特徴部を検出する前記イベント検出部は、
映像の全フレームが単色に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したときを前記イベント区間の終了と判定していることを特徴とする請求項2記載のビデオコンテンツ解析装置。
【請求項4】
前記特定の特徴部を検出する前記イベント検出部は、
オーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定していることを特徴とする請求項2記載のビデオコンテンツ解析装置。
【請求項5】
前記特定の特徴部を検出する前記イベント検出部は、映像の全フレームが単色に変化したときであり、かつオーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したときであり、かつ前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定していることを特徴とする請求項2記載のビデオコンテンツ解析装置。
【請求項6】
前記映像の第1の種別は、コマーシャルメッセージであることを特徴とする請求項2に記載のビデオコンテンツ解析装置。
【請求項7】
映像・音声データをデコードするデコーディングユニットと、
前記デコーディングユニットによりデコードされた映像の中で、映像の全フレームが単色に変化したとき及び又はオーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したとき及び又は前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定してイベント区間を検出するイベント検出部と、
前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納するイベント時刻情報格納部と、
隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する複数イベント区間特定部と、
グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と有するビデオコンテンツ解析装置。
【請求項8】
前記映像の第1の種別は、コマーシャルメッセージであることを特徴とする請求項7記載のビデオコンテンツ解析装置。
【請求項9】
映像・音声データをデコードするデコーディングユニットと、このデコーディングユニットを制御する制御部とを有する装置のビデオコンテンツ解析方法であって、
前記制御部では、
前記デコーディングユニットによりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出し、
前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納し、
隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定し、
グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別すことを特徴とするビデオコンテンツ解析方法。
【請求項10】
前記特定の特徴は、映像の全フレームが単色に変化したとき及び又はオーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したとき及び又は前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定してイベント区間を特定することを特徴とする請求項9記載のビデオコンテンツ解析方法。
【請求項1】
映像・音声データをデコードするデコーディングユニットと、
前記デコーディングユニットによりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出するイベント検出部と、
前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納するイベント時刻情報格納部と、
隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する複数イベント区間特定部と、
グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と有するビデオコンテンツ解析装置。
【請求項2】
前記映像種別識別部は、前記複数の前記イベント区間のうち先頭のイベント区間の開始時刻から最後のイベント区間の終了時刻までを前記映像の第1の種別として、それ以外を前記映像の第2の種別として設定することを特徴とする請求項1記載のビデオコンテンツ解析装置。
【請求項3】
前記特定の特徴部を検出する前記イベント検出部は、
映像の全フレームが単色に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したときを前記イベント区間の終了と判定していることを特徴とする請求項2記載のビデオコンテンツ解析装置。
【請求項4】
前記特定の特徴部を検出する前記イベント検出部は、
オーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定していることを特徴とする請求項2記載のビデオコンテンツ解析装置。
【請求項5】
前記特定の特徴部を検出する前記イベント検出部は、映像の全フレームが単色に変化したときであり、かつオーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したときであり、かつ前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定していることを特徴とする請求項2記載のビデオコンテンツ解析装置。
【請求項6】
前記映像の第1の種別は、コマーシャルメッセージであることを特徴とする請求項2に記載のビデオコンテンツ解析装置。
【請求項7】
映像・音声データをデコードするデコーディングユニットと、
前記デコーディングユニットによりデコードされた映像の中で、映像の全フレームが単色に変化したとき及び又はオーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したとき及び又は前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定してイベント区間を検出するイベント検出部と、
前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納するイベント時刻情報格納部と、
隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定する複数イベント区間特定部と、
グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別する映像種別識別部と有するビデオコンテンツ解析装置。
【請求項8】
前記映像の第1の種別は、コマーシャルメッセージであることを特徴とする請求項7記載のビデオコンテンツ解析装置。
【請求項9】
映像・音声データをデコードするデコーディングユニットと、このデコーディングユニットを制御する制御部とを有する装置のビデオコンテンツ解析方法であって、
前記制御部では、
前記デコーディングユニットによりデコードされた映像の中で、特定の特徴が生じている区間をイベント区間として検出し、
前記検出したイベント区間の開始時刻及び終了時刻と、この開始時刻と終了時刻の間の解析用時刻を求めて格納し、
隣り合う前記イベント区間の2つの解析用時刻の間隔が所定の条件を満たす場合に、前記隣り合うイベント区間をグループ内として特定し、
グループ内として特定された複数の前記イベント区間のうち先頭イベント区間から最終イベント区間までを映像の第1の種別、その他を映像の第2の種別として識別すことを特徴とするビデオコンテンツ解析方法。
【請求項10】
前記特定の特徴は、映像の全フレームが単色に変化したとき及び又はオーディオ信号レベルが所定の閾値以下に変化したときを前記イベント区間の開始、前記映像の全フレームが単色から通常画像状態に変化したとき及び又は前記オーディオ信号レベルが前記所定の閾値以下から以上に変化したときを前記イベント区間の終了と判定してイベント区間を特定することを特徴とする請求項9記載のビデオコンテンツ解析方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2009−290330(P2009−290330A)
【公開日】平成21年12月10日(2009.12.10)
【国際特許分類】
【出願番号】特願2008−138395(P2008−138395)
【出願日】平成20年5月27日(2008.5.27)
【特許番号】特許第4372202号(P4372202)
【特許公報発行日】平成21年11月25日(2009.11.25)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
【公開日】平成21年12月10日(2009.12.10)
【国際特許分類】
【出願日】平成20年5月27日(2008.5.27)
【特許番号】特許第4372202号(P4372202)
【特許公報発行日】平成21年11月25日(2009.11.25)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】
[ Back to top ]