説明

CM検出システム、サーバ、CM検出方法、プログラム及び記録媒体

【課題】番組データからのCM区間検出の精度をより高めることが出来るCM検出システム、サーバ、CM検出方法、プログラム及び記録媒体を提供する。
【解決手段】番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムであって、前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、CM検出システム、サーバ、CM検出方法、プログラム及び記録媒体に関し、特に、番組データからのCM区間検出の精度をより高めることが出来るCM検出システム、サーバ、CM検出方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
録画番組に含まれるCM(commercial message)区間を検出する方法として、デジタル放送のCM区間や番組間に挟まれる無音点を利用するものがある(特許文献1参照)。この方法では、録画番組中の無音点を検出し、無音点が出現するパターンを解析してCM区間と番組区間を推測する。
【0003】
放送信号のCM部分をより確実に検出するために、予め記録したCMの映像又は音声情報との同一性を検出し、CMと判定された部分の映像を削除する情報処理装置が提案されている(特許文献2参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−47031号公報
【特許文献2】特開2004−328306号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記のような技術には、以下の問題点がある。
無音点が出現するパターンを解析してCM区間と番組区間を推測する方法(特許文献1)は、確実にCMと番組の区別は付けられないため、番組中の一定区間をCMとして誤認したり、変則的なCM区間を検出することが出来なかったりという問題がある。
【0006】
また、特許文献1では、無音区間の候補を抽出し、カット点(シーンカット部分)の存在位置により、切り換えを認識し、各区間のうち、一般にCM映像の特徴とされる15秒、30秒の長さの区間をCM区間と判断している。しかしながら、近年のインターネット配信におけるCMや、テレビジョン放送のCMも多様化が進み、1分程の長さのあるCMも多々ある。このような場合に正確にCMと認識することが出来ないという問題がある。
【0007】
CMの映像又は音声情報との同一性を検出する方法(特許文献2)は、予めCM映像を記録していなければならない。CM映像は膨大にあり、また、日々新しい映像が配信されている。予め記録しておく手間や、更新をするのか等、記録しているCM映像については特に開示されていない。
【0008】
本発明はこのような状況に鑑みてなされたものであり、番組データからのCM区間検出の精度をより高めることを目的としている。
【課題を解決するための手段】
【0009】
本発明に係るCM検出システムは、番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムであって、前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断することを特徴とする。
【0010】
本発明に係るサーバは、番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムのサーバであって、前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断することを特徴とする。
【0011】
本発明に係るCM検出方法は、番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムのサーバにおけるCM検出方法であって、前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断するステップを備えることを特徴とする。
【0012】
本発明に係るCM検出プログラムは、番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムのサーバにおけるCM検出プログラムであって、前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断する処理をコンピュータに実行させることを特徴とする。
【0013】
本発明に係る記録媒体は、上記本発明に係るCM検出プログラムの処理を記録するコンピュータ読取り可能な記録媒体である。
【発明の効果】
【0014】
本発明によれば、番組データからのCM区間検出の精度をより高めることが出来る。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態に係るCM検出システムの全体構成を示す図である。
【図2】本発明の実施形態に係るユーザ端末1の機能構成例を示す図である。
【図3】本発明の実施形態に係るサーバ3の機能構成例を示す図である。
【図4】本発明の実施形態に係る映像区間リスト作成の動作処理を示す動作処理である。
【図5】本発明の実施形態に係るCMリスト作成の動作処理を示すフローチャートである。
【図6】本発明の実施形態に係るCM検出の動作処理を示すフローチャートである。
【発明を実施するための形態】
【0016】
以下に、本発明の実施形態について図面を用いて詳細に説明する。なお、以下に述べる実施形態は、本発明の好適な実施形態であるから、技術的に好ましい種々の限定が付されているが、本発明の範囲は、以下の説明において特に本発明を限定する旨の記載がない限り、これらの態様に限られるものではない。
【0017】
(構成)
図1は、本発明の実施形態に係るCM検出システムの全体構成を示す図である。複数のユーザ端末1が、ネットワーク2を介してサーバ3に接続されている。
【0018】
図2は、本実施形態に係るユーザ端末1の機能構成例を示す図である。番組データ10、音声情報特徴量抽出部11、画像情報特徴量抽出部12、区間リスト生成部13、CMリスト取得部14、重複照合部15、本編区間データ16、CM区間データ17から構成される。各データは記憶部(図示せず)に記憶されている。
【0019】
番組データ10は、放送番組(テレビジョン放送)の画像/音声データや、インターネット配信番組の画像/音声データである。
【0020】
音声情報特徴量抽出部11は、番組データのうち本編とCMとの切り換えを検出する。具体的には、例えば無音区間を抽出し、区間の区切りと判断する。CMには、一般に、CMの前後に数10msの無音区間が存在するため、無音区間で番組データを区切ることが可能である。
【0021】
画像情報特徴量抽出部12は、音声情報特徴量抽出部11における無音区間抽出で区切った区間内での画像情報の特徴を抽出する。無音区間近傍(区切り後、区切り前)でも良いし、区間内の任意の箇所でも良い。
【0022】
区間リスト生成部13は、各区間を識別するのに必要な情報(区間情報)をリスト化する。区間情報は、例えば、開始時刻、終了時刻、長さ、画像特徴量等である。画像特徴量は、画像情報特徴量抽出部12で抽出した画像情報特徴量であって、数値化したものでも良い。区間リストはサーバ3に送られる(アップロード)。この際、どのユーザから取得したかを示すユーザ識別情報と、どの番組の区間リストかを示す番組識別情報も付加される。
【0023】
CMリスト取得部14は、サーバ3からCMリスト(長さ、画像情報特徴量等を含むCM情報のリスト)を取得する。
【0024】
重複照合部15は、取得したCMリストと、CM検出の対象とする新たに区分けされた番組データの区間情報のリストとを比較し、重複している部分について照合する。照合により、重複する区間はCM区間データ16と判断され、重複しない区間(番組データの各区間情報からCM区間を除いた差分)は本編区間データ17と判断される。
【0025】
重複照合部15により、番組データは本編区間データ16とCM区間データ17とに分けられる。
【0026】
図3は、本実施形態に係るサーバ3の機能構成例を示す図である。番組毎の区間リストを各ユーザ端末から取得する区間リスト取得部30と、差分検出部31と、CMリスト生成部32と、CMリストデータベース33と、から構成される。
【0027】
差分検出部31は、複数のユーザ端末から取得した同番組の区間リストを比較し、差分を検出する。同じ番組であっても、挿入されているCMが放送地域によって異なる場合があるという特徴を利用し、複数の異なる地域のユーザから集めた区間リストを比較し、CM検出に利用する。区間リストのうち、重複する区間は本編区間データで、異なる区間はCM区間データである可能性が高く、検出精度の向上が図れる。
【0028】
CMリスト生成部32は、差分検出部31でCM区間データと判断された区間のリストをCMリストとして生成する。CMリストはCMリストデータベース33に記憶される。
【0029】
(動作処理)
次に本実施形態の動作処理についてフローチャートを用いて説明する。
【0030】
まず、各ユーザ端末で行われる映像区間リスト作成の動作処理について図4を用いて説明する。図4は、本実施形態に係る映像区間リスト作成の動作処理を示す動作処理である。
【0031】
まず、音声情報特徴量抽出部11が、番組データ10から音声特徴量を抽出し(ステップS1)、映像区間を抽出する(ステップS2)。ここでいう音声特徴量とは、無音区間である。特定の音声特徴量(例えば、無音区間)で区切られた各映像区間の時間情報を取得する(ステップS3)。時間情報とは、その映像区間の開始時刻、終了時刻、長さ等である。
【0032】
次に、画像情報特徴量抽出部12が、無音区間抽出で区切った区間内での一定の箇所(時刻)の画像情報の特徴を取得する(ステップS4)。無音区間近傍(区切り後、区切り前)でも良いし、区間内の任意の箇所でも良い。ここで取得した画像情報特徴量は後述するようにサーバ3にアップロードするため、画像データ(コンテンツ)そのものよりも、一定の箇所(時刻)の画像情報の特徴量(数値化したもの)が好ましい。
【0033】
区間リスト生成部は、上記ステップS3、S4で取得した情報を映像区間リストに追加する(ステップS5)。
【0034】
全ての映像区間の情報を取得すると(ステップS6/Yes)、映像区間リストに番組識別情報、ユーザ識別情報を付加してサーバ3にアップロードする。
【0035】
次に、サーバ3で行われるCMリスト作成の動作処理について図5を用いて説明する。図5は、本実施形態に係るCMリスト作成の動作処理を示すフローチャートである。
【0036】
サーバ3は、各ユーザ端末からアップロードされた映像区間リストを備えている。差分検出部31は、番組識別情報が同じであって、異なるユーザ識別情報を持つ映像区間リストの集合から(ステップS10)、比較する2つの映像区間リストの組み合わせを選択し(ステップS11)、映像区間毎に区間情報の比較を行う(ステップS12)。区間情報の比較とは、すなわち、各映像区間の時間情報(開始時刻、終了時刻、長さ等)と、映像特徴量のデータが一致するか否か比較する。
【0037】
同じ番組であっても、挿入されているCMが放送地域によって異なる場合があるという特徴を利用し、区間リストのうち、重複する(一致する)区間は本編区間データで、異なる区間はCM区間データと判断する。
【0038】
従って、比較する2つの映像区間リストの組み合わせは、映像区間リストに付加された識別情報に基づき、放送地域の異なるものを組み合わせることが望ましい。
【0039】
なお、キー局と地方局の間でCMの差し替えを行った場合などに多少(0.5ms等)の遅れが生じる場合があるが、区間情報の比較では、開始時刻等の多少のずれは調整可能である。
【0040】
CMリスト作成において、映像区間の時間情報(開始時刻、終了時刻、長さ等)のみではなく、映像特徴量のデータも比較することで、よりCM誤検出を防ぐことが出来る。
【0041】
CM区間データと判断された区間のリストは、CMリストに追加される(ステップS13)。CMリストは、CM区間データと判断された映像区間の時間情報(開始時刻、終了時刻、長さ等)と、映像特徴量のデータである。
【0042】
全ての映像区間リストを比較すると(ステップS14)終了する。
【0043】
なお、差分検出とCMリストの生成については、ユーザ端末がサーバから、番組識別情報が同じであって、異なるユーザ識別情報を持つ映像区間リストの集合を取得し、比較する2つの映像区間リストの組み合わせを選択し、比較を行い、ユーザ端末側で差分検出とCMリストの生成を行っても良い。ユーザ端末自身が有している映像区間リストと同じ番組識別情報であって、他のユーザ識別情報を持つ映像区間リストの集合を取得しても良い。
【0044】
次に、各ユーザ端末で行われるCM検出の動作処理について図6を用いて説明する。図6は、本実施形態に係るCM検出の動作処理を示すフローチャートである。
【0045】
まず、対象とする番組の映像区間リストを作成する(ステップS16)。映像区間リストの作成方法は、図4のステップS1〜S6、S8に示す処理と同様である。
【0046】
次に、最初の映像区間を選択(ステップS17)し、その区間情報とCMリストを照合する(ステップS18)。CMリストは、サーバ3からCMリスト取得部14にて取得している。選択した映像区間の区間情報と一致(重複)するものがCMリスト内にある場合は(ステップS19)、選択区間をCM区間と識別する(ステップS20)。これらの処理を最後の映像区間まで行う(ステップS21)。
【0047】
これにより、サーバから取得したCMリストを用いて、番組データからCM区間データを識別することが出来る。重複していない部分(差分)は本編区間データである。なお、サーバにおいて差分検出により本編リストではなくCMリストの作成を行っているのは、他の番組で同じCMが流れることを想定し、CMリストが他の番組に対応できるためである。
【0048】
なお、サーバから取得するCMリスト、若しくはユーザ端末自身で作成したCMリストは、自身と同じ放送地域で放送された番組データから抽出したCMのリストであっても良い。これにより、重複する可能性の高いCMリストで照合することが出来る。
【0049】
さらに、異なる番組から得られたCMリスト間で比較を行うことで、さらにCMリストの精度を高めることが出来る。通常、CMは提供会社により決定され、同一のCMが異なる番組で放送されることが多い。そこで、CMリスト内の区間情報を、別の番組で得られたCMリスト内の区間情報と照合し、一致するものがあればその映像区間がCMである可能性はさらに高まる。このようにして全てのCMリストで比較を行い、さらに精度を高めた新たなCMリストを作成することが出来る。
【0050】
なお、各図のフローチャートに示す処理を、CPUが実行するためのプログラムは本発明によるプログラムを構成する。このプログラムを記録する記録媒体としては、半導体記憶部や光学的及び/又は磁気的な記憶部等を用いることができる。このようなプログラム及び記録媒体を、前述した各実施形態とは異なる構成のシステム等で用い、そこのCPUで上記プログラムを実行させることにより、本発明と実質的に同じ効果を得ることができる。
【0051】
以上、本発明を好適な実施形態に基づき具体的に説明したが、本発明は上記のものに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
【符号の説明】
【0052】
1 ユーザ端末
2 ネットワーク
3 サーバ
10 番組データ
11 音声情報特徴量抽出部
12 画像情報特徴量抽出部
13 区間リスト生成部
14 CMリスト取得部
15 重複照合部
16 本編区間データ
17 CM区間データ
30 区間リスト取得部
31 差分検出部
32 CMリスト生成部
33 CMリストデータベース

【特許請求の範囲】
【請求項1】
番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、
前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムであって、
前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断することを特徴とするCM検出システム。
【請求項2】
前記ユーザ端末が有する前記区間検出手段は、
前記番組データの音声信号から無音区間を抽出する音声特徴量抽出手段と、
前記無音区間で区切った区間内での画像情報特徴量を抽出する画像情報特徴量抽出手段と、
各区間を識別するのに必要な情報である区間情報でリスト化する区間リスト生成手段と、
を備え、
前記サーバは、
各ユーザ端末から区間リストを取得する区間リスト取得手段と、
取得した区間リストのうち、区間リストに付加されている番組識別情報が同じで、区間リストに付加されているユーザ識別情報が異なる区間リストの集合から、比較する2つの区間リストの組み合わせを選択し、区間毎に区間情報の比較を行う差分検出手段と、
前記差分検出手段で、差分があり一致しないと判断された区間をCM区間と判断し、CM区間の区間情報をリスト化するCMリスト生成手段と、
を備え、
前記サーバから取得したCMリストと、CM検出の対象とする新たに区分けされた番組データの区間情報のリストとを比較し、重複している部分について照合する重複照合手段を備えることを特徴とする請求項1記載のCM検出システム。
【請求項3】
前記区間情報は、開始時刻、終了時刻、長さを少なくとも含む時間情報と、前記画像情報特徴量抽出手段で抽出した画像情報特徴量であることを特徴とする請求項2記載のCM検出システム。
【請求項4】
番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、
前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムのサーバであって、
前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断することを特徴とするサーバ。
【請求項5】
番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、
前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムのサーバにおけるCM検出方法であって、
前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断するステップを備えることを特徴とするCM検出方法。
【請求項6】
番組データから区間情報を検出する区間検出手段を有する複数のユーザ端末と、
前記複数のユーザ端末からそれぞれ検出された区間情報を取得するサーバと、を備えるCM検出システムのサーバにおけるCM検出プログラムであって、
前記複数のユーザ端末から検出された各前記区間情報を相互に比較し、異なっている前記区間はCMであると判断する処理をコンピュータに実行させることを特徴とするCM検出プログラム。
【請求項7】
請求項6記載のCM検出プログラムの処理を記録するコンピュータ読取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2011−217144(P2011−217144A)
【公開日】平成23年10月27日(2011.10.27)
【国際特許分類】
【出願番号】特願2010−83820(P2010−83820)
【出願日】平成22年3月31日(2010.3.31)
【出願人】(302069930)NECパーソナルプロダクツ株式会社 (738)
【Fターム(参考)】