説明

コマーシャル検出方法および装置

【課題】抽出したCM区間の開始位置または終了位置を微調整し、最良のCM区間を割り出すことができることを目的とする。
【解決手段】テレビジョン放送に含まれるコマーシャルを検出するコマーシャル検出装置11であって、音声解析部16がテレビジョン放送の音声信号から無音区間を検出し、CM候補判定部18が検出された無音区間から、2つの無音区間が所定の時間間隔で離れて存在する区間をCM候補区間として抽出し、CM区間判定部20が抽出されたCM候補区間に基づいて、2つ以上のコマーシャルが連続して存在する区間であるCM区間を判定し、CM区間微調整部21が、抽出されたCM区間の開始位置と終了位置を無音区間内で微調整する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テレビジョン放送中におけるコマーシャル(広告放送)を自動的に検出するためのコマーシャル検出方法および装置に関する。
【背景技術】
【0002】
テレビジョン放送中におけるコマーシャル(一般にはCM(commercial message)の放送時刻は、大まかに決まってはいるものの、番組のスケジュールが緊急ニュースや番組自体の都合(特に生放送の場合)で変更されることが多いために、厳密には決められていない。そのため、特定の放送局について特定の時刻だけ受信し、特定のCMが放送されたかどうかをチェックするという方法では、CM放送区間を特定することができない。
そこで、テレビジョン放送におけるCMを自動的に検出してそのCMを自動的に同定する技術の実現が求められている。
従来、テレビジョン放送中におけるCMの放送区間を推定する方法の1つとして、無音区間を検出するコマーシャル検出装置が特許文献1に報告されている。
【0003】
特許文献1には、音声信号における無音区間から、2つの無音区間が所定の時間間隔で離れて存在する区間をCM候補区間として抽出し、1以上のCMが連続して存在する区間であるCM放映区間を判定し、CM放映区間内に含まれる全てのCM候補区間について、当該CM候補区間に引き続いて、CMとして考えられる時間間隔で無音区間が連続して配列しているかどうかを判定し、より多くのCM候補区間が連続するようにCM候補を抽出する。抽出された各CM候補に関し、当該CM候補の開始点及び終了点の近辺に映像信号におけるカット点があれば信頼度が高くなるように、かつ、当該CM候補の前後の少なくとも一方に他のCM候補が存在すれば信頼度が高くなるように信頼度を算出し、高い信頼度を得たCM候補を出力する、というコマーシャル検出装置が開示されている。
【0004】
しかしながら、従来のコマーシャル検出装置にあっては、音声(無音区間)のみを用いてCM区間の判断処理を行う場合、音声が無音になるタイミングと、映像が[番組本編→CM]、[CM→番組本編]へ切り替わるタイミングとが一致しないため、映像データの[番組本編→CM]切り替わり(CM-in点)、および[CM→番組本編]切り替わり(CM-out点)についての正確な判断処理ができなくなっていた。このため、CM-in点やCM-out点を含む無音区間の先頭部や終端部、若しくはその中間部を切り替わり点とみなしていた。
このため、コマーシャル検出装置により割り出したCM-in点およびCM-out点を基準にすると、実際の音声信号および映像信号上でのCM区間が例えば数フレーム分ずれてしまうといった問題があった。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2003−47031号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
そこで、少しでも正確なCM-in点およびCM-out点を割り出すことが切望されている。
本発明は、音声判断のみで抽出したCM区間の開始位置または終了位置を微調整し、最良のCM区間を割り出すことができるコマーシャル検出装置および方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するたに、請求項1記載の発明は、テレビジョン放送に含まれるコマーシャル(以下、CMという)を検出するコマーシャル検出装置であって、前記テレビジョン放送の音声信号から無音区間を検出する無音区間検出ステップと、前記検出された前記無音区間から、2つの無音区間が所定の時間間隔で離れて存在する区間をCM候補区間として判定するCM候補判定ステップと、前記抽出された前記CM候補区間に基づいて、2つ以上のコマーシャルが連続して存在する区間であるCM区間を判定するCM区間判定ステップと、前記抽出されたCM区間の開始位置となる無音区間の開始点および終了点について微調整を行う微調整ステップとを有することを特徴とする。
【0008】
請求項5記載の発明は、テレビジョン放送に含まれるコマーシャル(以下、CMという)を検出するコマーシャル検出装置であって、前記テレビジョン放送の音声信号から無音区間を検出する無音区間検出手段と、前記検出された前記無音区間から、2つの無音区間が所定の時間間隔で離れて存在する区間をCM候補区間として判定するCM候補判定手段と、前記抽出された前記CM候補区間に基づいて、2つ以上のコマーシャルが連続して存在する区間であるCM区間を判定するCM区間判定手段と、前記抽出されたCM区間の開始位置となる無音区間の開始点および終了点について微調整を行う微調整手段とを備えたことを特徴とする。
【発明の効果】
【0009】
本発明によれば、音声判断のみで抽出したCM区間の開始位置および終了位置を微調整し、最良のCM区間を割り出すことができ、割り出したCM区間の精度を著しく向上することができる。
【図面の簡単な説明】
【0010】
【図1】本発明の実施形態に係るコマーシャル検出装置の構成について説明するためのブロック図である。
【図2】本発明の実施形態に係るコマーシャル検出装置に設けられたCM区間微調整部21の動作概要について説明するためのフローチャートである。
【図3】本発明の実施形態に係るコマーシャル検出装置の処理対象となるCM区間を示す説明図(a)と、CM−in点の微調整について説明するための説明図(b)である。
【図4】無音区間内における映像上の切り替わり点の例を示す説明図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態について、図面を参照して説明する。
図1を参照して、本発明の実施の形態に係るコマーシャル検出装置11の構成について説明する。
このコマーシャル検出装置11は、アンテナ12を介してテレビジョン放送波を受信する受信部12からのビットストリーム(映像信号及び音声信号)、あるいは予め蓄積部14に蓄積された放送データ(映像信号及び音声信号)を入力とするものである。なお、このコマーシャル検出装置11では、放送波に含まれるCM区間を検出してそのCM区間の開始及び終了時刻を出力するので、また、映像信号と音声信号とを独立して処理するものの両者間の時刻同期は確立させる必要があるので、映像信号及び音声信号には、放送波における時刻タイミングを示す情報(タイムスタンプ)が付加されていることが好ましい。
【0012】
図1に示すコマーシャル検出装置11は、上述した受信部12、蓄積部14に加えて、ストリーム分離部15、音声解析部16、無音区間リスト記憶部17、CM候補判定部18、CM候補リスト記憶部19、CM区間判定部20、CM区間微調整部21、CM区間リスト記憶部22を備えている。
ストリーム分離部15は、受信部13や蓄積部14から出力された音声と映像が多重化したビットストリームを音声と映像に分離し、分離した音声ビットストリームと映像ビットストリームとを音声解析部16へ出力する。
【0013】
音声解析部16は、音声信号における無音区間を検出する。音声解析部16は、音声信号からリアルタイムで無音区間を検出する。音声信号における無音区間の検出方法としては、いくつかの周知の方法があるが、ここでは例えば、音声信号を8ビット(256値)でサンプリング周波数8kHzでサンプリングすることとし、50ミリ秒の長さの区間を1つの単位とし、その50ミリ秒の単位で無音区間を判定する方法を採用する。
【0014】
無音区間リスト記憶部17は、音声解析部16で検出された無音区間のリストを記憶する。
CM候補判定部18は、音声解析部16で検出した無音区間について、2つの無音区間が、ある時間間隔(例えば15秒、30秒)離れて存在する区間を検出し、CM候補区間として判定して抽出する。
CM候補リスト記憶部19は、CM候補判定部18で抽出されたCM候補区間をCM候補リストとして記憶する。
CM区間判定部20は、CM候補判定部18で抽出した単一のCM候補同士を比較し、その連続性評価を実施して、複数個のCMが連続していると判断された場合に、その区間をCM区間とみなす(判断する)。
CM区間微調整部21は、CM区間判定部20で抽出されたCM区間の開始点となる無音区間の開始点について微調整を行う。
CM区間リスト記憶部22は、CM区間微調整部21で抽出されたCM区間をCM区間リストとして記憶する。
なお、上述した音声解析部16、CM候補判定部18、CM区間判定部20、CM区間微調整部21におけるそれぞれの処理は、CPU、ROM、RAMを有する制御部(図示しない)により動作するものである。
【0015】
次に、図2に示すフローチャートを参照して、コマーシャル検出装置11に設けられたCM区間微調整部21での処理について説明する。なお、図2に示すフローチャートは、制御プログラムとして上記制御部(図示しない)により実行されることとする。
なお、制御部は、CM区間の開始位置(CM-in点)を評価するための得点となるCM評価カウンタ値とCM区間の開始位置とを1組にしてCM区間リスト記憶部22に記憶しておくこととする。
【0016】
まず、それぞれのCMを区別するための番号をL(L=1,2,3,・・・)とし、CM区間内での最初のCMの番号を1とし、最後のCMの番号をMとしておく。
ステップS10では、制御部は、L=1として初期化する。なお、ステップS20以降の処理ではLを現在の処理におけるCMの番号として考える。
【0017】
次いで、ステップS15では、制御部は、CM区間の先頭の無音区間に対して、初回はその最も先頭にCM-in点を設定する。この結果、図3(a)に示すように、CM-in点が設定される。
なお、実際の音声信号上の無音区間と映像信号との位置関係は、図4に示すように、番組本編からCMに切り替わるタイミングが無音区間の範囲に入っている場合がある。
【0018】
ところで、日本国内のCMでは、一般に15秒または30秒の長さのものが多い。そこで、15秒をCMの基本単位長としておき、15秒に整数nを乗じた時間をCM区間の時間として考える。
次いで、ステップS20では、制御部は、そのCM-in点を基準に次の無音区間、すなわち、先頭CMの終了部分を示す無音区間までの間が、(15秒×n)の範囲に収まるか否かを判断する。
CM-in(L) + (15×n)=CM-out(L) ・・・(1)
ここで、収まっている場合には、ステップS25に進む。他方、収まっていない場合には、ステップS30に進む。
【0019】
次いで、ステップS25では、制御部は、単一のCM単位でカウントするためのCM評価カウンタ値をインクリメントする。なお、収まらない場合は、CM評価カウンタ値をインクリメントしない。
【0020】
次いで、ステップS30では、制御部は、L番目のCM-out(L)を(L+1)番目のCM-in(L+1)と見なして置き換え、
CM-in(L+1)=CM-out(L) ・・・(2)
とする。
次いで、ステップS35では、制御部は、現在処理中のCMの番号Lをインクリメントする。
【0021】
次いで、ステップS40では、制御部は、L≦M、すなわち、現在処理中のCMの番号Lが最後のCMの番号M未満か否かを判断する。ここで、現在処理中のCMの番号Lが最後のCMの番号Mまで到達していない場合には、ステップS20に戻り、上記の処理を繰り返す。他方、現在処理中のCMの番号Lが最後のCMの番号Mまで到達した場合には、ステップS45に進む。
なお、ステップS40からS20に戻ることで、先頭CMの終端(すなわち、次CMの先頭)を基準に、さらに次の無音区間(次のCMの終了部分を示す無音区間)までの間が、(15秒×n)の範囲に収まるか否かを判断する。収まる場合には、ステップS25において、CM評価カウンタ値をインクリメントする。そして、最後のCMの番号Mまで繰り返す。
【0022】
次いで、ステップS45では、制御部は、現在のCM評価カウンタ値はCM区間リスト記憶部22に格納してあるCM評価カウンタ値より大きいか否かを判断する。大きい場合には、ステップS50に進む。他方、大きくない場合には、ステップS55に進む。
【0023】
次いで、ステップS50では、制御部は、現在のCM評価カウンタ値と、CM-in点の位置CM-in(L)とをCM区間リスト記憶部22に格納する。
【0024】
次いで、ステップS55では、制御部は、CM-in点の位置CM-in(1)に規定値を加算し、新たなCM-in(1)点の位置とする。
CM-in(1)=CM-in(1)+規定値 ・・・(3)
なお、無音判断の単位が50ミリ秒なので、上記の規定値を50ミリ秒に設定している。
【0025】
次いで、ステップS60では、制御部は、CM-in点の位置CM-in(1)が先頭の無音区間長以内か否かを判断する。CM-in点の位置CM-in(1)が先頭の無音区間長よりも大きくなって、はずれている場合には、ステップS70に進む。他方、CM-in点の位置CM-in(1)が先頭無音区間長よりも小さく、はずれていない場合には、ステップS65に進む。
CM-in(1)≦先頭の無音区間長 ・・・(4)
【0026】
次いで、ステップS65では、制御部は、CM評価カウンタ値をクリアし、L=1と設定し、ステップS20に戻り、同様の処理を繰り返す。
【0027】
次いで、ステップS70では、制御部は、CM区間リスト記憶部22に格納されているCM-in点の位置とCM評価カウンタ値とを読み出し、最もCM評価カウンタ値が高かったCM-in点をこのCM区間のCM-in点と決定する。
【0028】
次いで、ステップS75では、制御部は、ステップS70で決定されたCM-in点を基準にして、改めてこのCM区間のCM-out点を算出する。すなわち、決定されたCM区間のCM-in点に(15秒×n)値を加算して、CM区間の終了位置を算出する。
【0029】
次いで、ステップS80では、制御部は、ステップS75で算出されたCM-out点が、CM区間内に収まらず逸脱する場合には、CM-out点を微調整する。すなわち、CM-out点をCM区間内に戻すように微調整する。これは、CM区間内に含まれる無音区間の区間長が同じではないために、発生することである。
ここで、図3(b)は、ステップS75で算出されたCM-out点が、CM区間内に収まらずに逸脱した状態を一例として示している。
なお、ステップS80において、CM-out点をCM区間内に戻すように微調整するようにしたが、具体的には、CM-out点をこの無音区間の終端に設定する。
【0030】
以上のようにして、抽出したCM区間の開始位置および終了位置を微調整し、最良のCM区間を割り出すことができる。
この結果、割り出したCM-in点およびCM-out点を基準にすると、実際の音声信号および映像信号上でのCM区間が、CM区間の特徴である「15秒×n」の連続性の観点から、従来例と比較してより正確な位置を導き出せるようになり、割り出したCM区間の精度を著しく向上することができる。
【産業上の利用可能性】
【0031】
本発明は、テレビジョン放送を受信して蓄積することが可能なテレビジョン受信機、パーソナルコンピュータ、情報記録装置に利用できる。
【符号の説明】
【0032】
11 コマーシャル検出装置
13 受信部
14 蓄積部
15 ストリーム分離部
16 音声解析部
17 無音区間リスト記憶部
18 CM候補判定部
19 CM候補リスト記憶部
20 CM区間判定部
21 CM区間微調整部
22 CM区間リスト記憶部

【特許請求の範囲】
【請求項1】
テレビジョン放送に含まれるコマーシャル(以下、CMという)を検出するコマーシャル検出装置であって、
前記テレビジョン放送の音声信号から無音区間を検出する無音区間検出ステップと、
前記検出された前記無音区間から、2つの無音区間が所定の時間間隔で離れて存在する区間をCM候補区間として判定するCM候補判定ステップと、
前記抽出された前記CM候補区間に基づいて、2つ以上のコマーシャルが連続して存在する区間であるCM区間を判定するCM区間判定ステップと、
前記抽出されたCM区間の開始位置となる無音区間の開始点および終了点について微調整を行う微調整ステップとを有することを特徴とするコマーシャル検出装置。
【請求項2】
前記微調整ステップは、
単一のCM単位でカウントするためのCM評価カウンタ値とCM区間の開始位置とを1組にして記憶する記憶ステップと、
CM区間の開始位置にCM時間を示す所定の時間間隔を整数倍した時間を加算した和値が単一CMの終了位置に到達した場合に、CM評価カウンタ値をインクリメントし、CM区間末尾まで処理を繰り返す計数ステップと、
前記計数ステップによりインクリメントされたCM評価カウンタ値が前記記憶ステップに格納済みのCM評価カウンタ値より大きい場合に、CM評価カウンタ値とCM区間の開始位置とを1組にして前記記憶ステップに記憶する更新ステップと、
最初のCM区間の開始位置に所定の規定値を加算した和値が先頭の無音区間長を超えていない場合には、前記計数ステップによる処理に戻り、他方、最初のCM区間の開始位置に所定の規定値を加算した和値が先頭の無音区間長を超えた場合には、前記記憶ステップから読み出したCM区間の開始位置をこのCM区間の開始位置と決定する決定ステップとを有することを特徴とする請求項1記載のコマーシャル検出方法。
【請求項3】
前記決定ステップにより決定されたCM区間の開始位置に基づいて、CM区間の終了位置を算出する算出ステップと、
前記算出されたCM区間の終了位置が無音区間の終了点内に入らなかった場合には、CM区間の終了位置を無音区間の終了点に修正する修正ステップとを有することを特徴とする請求項1記載のコマーシャル検出方法。
【請求項4】
前記微調整ステップは、前記抽出されたCM区間の開始点となる無音区間の範囲で微調整を行う、ことを特徴とする請求項1記載のコマーシャル検出方法。
【請求項5】
テレビジョン放送に含まれるコマーシャル(以下、CMという)を検出するコマーシャル検出装置であって、
前記テレビジョン放送の音声信号から無音区間を検出する無音区間検出手段と、
前記検出された前記無音区間から、2つの無音区間が所定の時間間隔で離れて存在する区間をCM候補区間として判定するCM候補判定手段と、
前記抽出された前記CM候補区間に基づいて、2つ以上のコマーシャルが連続して存在する区間であるCM区間を判定するCM区間判定手段と、
前記抽出されたCM区間の開始位置となる無音区間の開始点および終了点について微調整を行う微調整手段とを備えたことを特徴とするコマーシャル検出装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2012−74119(P2012−74119A)
【公開日】平成24年4月12日(2012.4.12)
【国際特許分類】
【出願番号】特願2010−219868(P2010−219868)
【出願日】平成22年9月29日(2010.9.29)
【出願人】(311012169)NECパーソナルコンピュータ株式会社 (116)
【Fターム(参考)】