説明

評価装置および評価方法

【課題】イベントにおいて出現した語句がそのイベントの主題に適合している程度をより正確に評価する。
【解決手段】個別イベント内語句出現頻度特定部112は、イベントメタデータの内容に基づき、各個別イベントにおいて出現した各語句の出現頻度(個別イベント内語句出現頻度)を個別イベントごとに特定する。イベント群内語句出現頻度特定部113は、イベントメタデータの内容に基づき、イベント群において出現した各語句の出現頻度(イベント群内語句出現頻度)を特定する。制御部11は、個別イベント内語句出現頻度とイベント群内語句出現頻度とに基づいて、語句がイベントの主題に適合している程度に応じた評価値を算出する。視聴者にとって有用な内容の個別イベントを選別するとき、主題との適合の程度が低いと評価された語句よりもその適合の程度が高いと評価された語句を優先的に用いる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テレビジョン放送される番組などの各種イベントにおいて出現した語句がそのイベントの主題に適合している程度を評価する技術に関する。
【背景技術】
【0002】
テレビジョン(以下、テレビという)放送の多チャンネル化やテレビ番組の録画装置の多機能化に伴い、多数のテレビ番組に中からそれぞれの視聴者にとって有用な内容のテレビ番組を選別する技術に対する要求が高まっている。例えば特許文献1には、テレビ番組において語句の出現頻度を調べることで、現在注目されている注目語句を特定し、その注目語句が出現するようなテレビ番組を検索する仕組みが開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001−101195号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のような仕組みを利用した場合、例えばテレビ番組の進行上の理由で頻繁に出現してはいるがそのテレビ番組の主題とはあまり関係のない語句であっても、それが注目語句として抽出される可能性がある。その一例は、例えばそのテレビ番組の司会者やスポンサーの名称などであるが、このような語句は、いかに出現頻度が高いとしても、その番組の主題に関して特に重要な意味があるとは限らないから、視聴者にとっての有用性が高いとは言えない場合がある。また、同じテレビ番組で繰り返し取り扱われているがゆえに、そのテレビ番組においては既に普遍的になっている語句についても、その番組の主題に関して特に重要な意味があるとは限らないことがある。
【0005】
そこで、本発明は、イベントにおいて出現した語句がそのイベントの主題に適合している程度をより正確に評価することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本発明は、視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句と、当該各イベントにおいて当該語句が出現した期間に関する情報と、当該各イベントが催される期間に関する情報とを含むイベントメタデータを取得する取得手段と、前記取得手段によって取得された前記イベントメタデータに基づき、各々の前記イベントにおける各々の前記語句の出現頻度を当該イベントごとに特定する第1特定手段と、前記取得手段によって取得された前記イベントメタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定手段と、各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントの主題に適合している程度に応じた評価を行う評価手段であって、前記第1特定手段によって特定された前記出現頻度が多く、且つ、前記第2特定手段によって特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおける主題に適合している程度が高いと評価する評価手段とを備えることを特徴とする評価装置を提供する。
【0007】
前記第1特定手段は、取得された前記イベントメタデータに基づき、前記イベントにおいて前記語句が出現した期間と当該イベントが催された期間との割合を算出し、算出した当該割合に応じて、当該イベントにおける当該語句の出現頻度を特定するようにしてもよい。
【0008】
前記第2特定手段は、取得された前記イベントメタデータに基づき、前記イベント群に属するイベントの数と、当該イベント群に属する各イベントにおける前記語句の出現の有無とを求め、当該数と当該出現の有無とに基づいて、前記イベント群における前記語句の出現頻度を特定するようにしてもよい。さらに、前記第2特定手段は、前記取得手段によって取得された前記イベントメタデータに基づき、前記イベント群に属するイベントの数と前記語句が出現したイベントの数との割合を算出し、算出した当該割合に応じて前記イベント群における前記語句の出現頻度を特定するようにしてもよい。
【0009】
前記評価手段は、前記第1特定手段によって特定された出現頻度を表す数値と、前記第2特定手段によって特定された出現頻度を表す数値の逆数の自然対数とを乗算し、その乗算結果に応じて前記評価を行うようにしてもよい。
【0010】
また、前記評価手段は、各々の前記語句に対する評価結果を当該語句が出現した個別イベントごとに集計するようにしてもよい。
【0011】
また、本発明は、視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句からなる字幕と、当該各イベントにおいて当該字幕が出現した時間帯と、当該各イベントが催される期間に関する情報とを含むメタデータを取得する取得手段と、前記取得手段によって取得されたメタデータに含まれる字幕から各語句を抽出し、各々の前記イベントにおける各々の前記語句の出現頻度を当該イベントごとに特定する第1特定手段であって、前記各語句が含まれる字幕のうち、最初に出現した字幕の時間帯の開始時刻、最後に出現した字幕の時間帯の終了時刻との差を、当該字幕から抽出した各語句が出現した期間とし、前記語句が出現した期間と前記イベントが催された期間との割合に応じて、当該イベントにおける当該語句の出現頻度を特定する第1特定手段と、前記取得手段によって取得された前記メタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定手段と、各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントの主題に適合している程度に応じた評価を行う評価手段であって、前記第1特定手段によって特定された前記出現頻度が多く、且つ、前記第2特定手段によって特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおける主題に適合している程度が高いと評価する評価手段とを備えることを特徴とする評価装置を提供する。
【0012】
また、本発明は、評価装置が、視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句と、当該各イベントにおいて当該語句が出現した期間に関する情報と、当該各イベントが催される期間に関する情報とを含むイベントメタデータを取得する取得ステップと、前記評価装置が、前記取得ステップにおいて取得された前記イベントメタデータに基づき、各々の前記イベントにおける各々の前記語句の出現頻度を前記イベントごとに特定する第1特定ステップと、前記評価装置が、前記取得ステップにおいて取得された前記イベントメタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定ステップと、前記評価装置が、各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントにおいて主題として取り扱われた程度に応じた評価を行う評価ステップであって、前記第1特定ステップにおいて特定された前記出現頻度が多く、且つ、前記第2特定ステップにおいて特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおいて主題として取り扱われた程度が高いと評価する評価ステップとを備える評価方法を提供する。
【0013】
また、本発明は、評価装置が、視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句からなる字幕と、当該各イベントにおいて当該字幕が出現した時間帯と、当該各イベントが催される期間に関する情報とを含むメタデータを取得する取得ステップと、前記評価装置が、前記取得ステップにおいて取得されたメタデータに含まれる字幕から各語句を抽出し、各々の前記イベントにおける各々の前記語句の出現頻度を当該イベントごとに特定する第1特定手段であって、前記各語句が含まれる字幕のうち、最初に出現した字幕の時間帯の開始時刻、最後に出現した字幕の時間帯の終了時刻との差を、当該字幕から抽出した各語句が出現した期間とし、前記語句が出現した期間と前記イベントが催された期間との割合に応じて、当該イベントにおける当該語句の出現頻度を特定する第1特定ステップと、前記評価装置が、前記取得ステップにおいて取得された前記メタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定ステップと、前記評価装置が、各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントの主題に適合している程度に応じた評価を行う評価ステップであって、前記第1特定ステップにおいて特定された前記出現頻度が多く、且つ、前記第2特定ステップにおいて特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおける主題に適合している程度が高いと評価する評価ステップとを備える評価方法を提供する。
【発明の効果】
【0014】
本発明によれば、イベントにおいて出現した語句がそのイベントの主題に適合している程度をより正確に評価することができる。
【図面の簡単な説明】
【0015】
【図1】本発明の実施形態に係る評価装置のハードウェア構成を示すブロック図である。
【図2】評価装置の機能構成を示すブロック図である。
【図3】イベントメタデータの一例を示す図である。
【図4】評価装置の制御部が実行する処理の手順を示すフローチャートである。
【図5】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【図6】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【図7】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【図8】制御部が実行する処理の手順を示すフローチャートである。
【図9】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【図10】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【図11】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【図12】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【図13】イベントメタデータの他の一例を示す図である。
【図14】制御部が実行する処理の手順を示すフローチャートである。
【図15】制御部が実行する処理の手順を示すフローチャートである。
【図16】制御部が処理を実行しているときに記憶部に記憶される内容の一例を示す図である。
【発明を実施するための形態】
【0016】
[実施形態]
イベントとは、視聴者に対して催されることを目的として或る共通の条件の下で創作され、演じられまたは発表されるものであって、それぞれにおけるテーマ、話題、題目、目的或いは思想(以下、これらをまとめて主題という)が異なる複数の創作物、催し物、出し物または見せ物のことである。イベントの代表的な例としては、或る番組名が付けられて毎週乃至毎日連続して放送されるテレビ番組が挙げられる。これらの各テレビ番組は、いずれも共通の番組名の意味の下で作成されているが、それぞれの内容の主題は異なっている。イベントには、このようなテレビ番組のほかに、或る番組名が付けられて例えば毎週乃至毎日連続して放送されるラジオ番組や、また、放送波によらずインターネット上で視聴者に提供されるものなども含まれる。いずれも、娯楽や教養のために放送波や有線ネットワークなどの伝達手段によって視聴者に提供される、文字や音声、映像などを用いて創作されたものであり、これらはコンテンツと総称される場合もある。また、イベントには、或る条件に従って選ばれた楽曲が演奏される音楽フェスティバルや或る基準で選ばれた論文が発表される学会などのように、視聴者が或る場所に実際に集まり、その場所でリアルタイムに行われるようなものも含まれる。例えば、演劇、映画、音楽会、テレビ放送などの演目、曲目、番組などのことをプログラムということがあるが、イベントという用語は、このプログラムの意味を含むものである。
【0017】
イベントにおいては必ず語句が出現する。語句は、例えばそのイベントに出演した出演者の名称やその出演者の発言内容などに含まれているものであり、イベントの内容を代表する意味を持つものと言える。ここでいうイベントの内容には、そのイベントに特有の主題に相当する内容も含まれるし、主題に相当するとは言えない内容も含まれるから、このイベントに出現した語句群の中にも、主題との適合の程度が高い語句と低い語句とがある。そこで、これらの各語句に対し、その語句が出現したイベントの主題との適合の程度に応じた評価がなされる。この適合の程度が高いと評価された語句は、例えば視聴者にとって有用な内容のイベントを選別するときに、適合の程度が低いと評価された語句よりも優先的に用いられる。これにより、視聴者が望むような主題のイベントが選別されることになる。
【0018】
以下の説明においては、イベントとしてテレビ番組を例に挙げて説明する。そして、イベント群とは、番組名が共通する各テレビ番組の総体を意味し、個別イベントとは、これらのテレビ番組の総体に含まれる個々のテレビ番組を意味するものとする。例えば12週間にわたって毎週連続して放送される、「報道特集」という番組名のテレビ番組があったとき、12個の各放送回が個別イベントであり、これら放送回の集合、つまり「報道特集」という番組名のテレビ番組の総体がイベント群に相当する。
【0019】
図面を参照しながら、本発明の実施形態に係る評価装置10について説明する。図1は、評価装置10のハードウェア構成を示すブロック図である。この評価装置10は、コンピュータであり、制御部11と、通信部12と、記憶部13とを備えている。制御部11は、CPU(Central Proccessing Unit)などの演算装置と、ROM(Read Only Memory)およびRAM(Random Aceess Memory)などの記憶装置とを備えている。CPUは、RAMをワークエリアとして用いてROMや記憶部13に記憶されたプログラムを実行することによって、評価装置10の各部を制御する。通信部12は、通信インタフェースや通信回路を備えており、通信線(図示略)に接続されている。通信部12は、この通信線を介して接続されている通信装置(図示略)との間で通信を行う。記憶部13は、書き込み可能な不揮発性の記憶手段であり、例えばハードディスク装置である。この記憶部13には、制御部11によって実行される処理の手順が記述されたプログラムが記憶されている。
【0020】
図2は、評価装置10の機能構成を示すブロック図である。同図に示す各部は、制御部11がプログラムを実行することにより実現される機能である。本発明の取得手段に相当する取得部111は、テレビ番組の内容や属性に関するイベントメタデータを取得する。このイベントメタデータは、EPG(Electronic Program Guide)と呼ばれるテレビ番組の案内情報を記憶している通信装置や、放送されるテレビ番組を視聴したオペレータが入力した内容をXML(Extensible Markup Language)形式で記憶している通信装置などから通信線を介して評価装置10に送信されてくる。通信部12が制御部11による制御の下で上記通信装置からイベントメタデータを受信して制御部11に供給すると、制御部11は、これを取得する。
【0021】
図3は、イベントメタデータの一例を示す図である。イベントメタデータは、個別イベントの名称である個別イベント名、個別イベントに割り当てられた識別情報である個別イベントID、イベント群に割り当てられた識別情報であるイベント群ID、個別イベントが催される日時の範囲である個別イベント時間帯、個別イベントにおいて出現した語句に割り当てられた識別情報である語句ID、個別イベントにおいて出現した語句、および、その語句が出現した日時の範囲である出現時間帯を含んでいる。「個別イベント名」は、番組名に相当する文字と、放送回の別を意味する文字によって表現されている。例えば、「報道特集第八回」という個別イベント名は、「報道特集」という番組名と、「第八回」という放送回の別を意味する文字列からなる。イベント群は、前述したように、番組名が共通するテレビ番組の総体のことであるから、例えば「変わっていい人」という番組名が共通する個別イベントに対しては、同じイベント群ID「1」が付されている。
【0022】
「語句」は、例えば、そのテレビ番組に出演した出演者の名称、そのテレビ番組で紹介された店舗や施設の名称、そのテレビ番組において再生された音楽のタイトル、そのテレビ番組で紹介されたサービスや商品の名称、出演者の発言内容、または、個別イベントの概要を説明するために用意された文章などである。これらの語句は、個別イベントの内容を代表するものである。ここにおいて、これらの語句によって表される対象(例えば音楽や出演者)のみが個別イベントにおいて出現し、語句そのものがテレビ番組において放送されなかったとしても、その語句は個別イベントにおいて実質的に出現しているものとみなす。特に上述した、個別イベントの概要を説明するために用意された文章に含まれる語句については、その語句そのものがテレビ番組において実際には放送されない場合もある。「語句ID」は、個別イベントにおいて各語句が出現するたびに割り当てられるものである。従って、同じ個別イベントにおいて同じ語句が出現したとしても、その出現時間帯が異なっている場合には、これらの同じ語句に対して異なる語句IDが割り当てられることになる。
【0023】
図2の説明に戻る。本発明の第1特定手段に相当する個別イベント内語句出現頻度特定部112は、イベントメタデータの内容に基づき、各個別イベントにおいて出現した各語句の出現頻度を個別イベントごとに特定する。ここでいう出現頻度とは、或る事象が出現する度合いないし度数のことを言い、単なる出現回数だけでなく、その出現の期間をも含む概念である。つまり、Aという事象が1回だけ1秒間にわたって出現した場合と、Bという事象が1回だけ1分間にわたって出現した場合、Bという事象の出現頻度のほうが高いという考え方である。
【0024】
図4は、個別イベント内語句出現頻度特定部112として機能する制御部11が、個別イベント内語句出現頻度を特定するときの手順を示すフローチャートである。まず、制御部11は、記憶部13に記憶されているイベントメタデータから、1つの個別イベントIDを抽出する(ステップS1)。次に、制御部11は、その個別イベントIDに対応する語句IDを全て抽出する(ステップS2)。
【0025】
そして、制御部11は、抽出した語句IDのうち同じ語句に対応する語句IDを全て特定し、特定した各語句IDに対応する出現時間帯の期間(つまり出現時間帯の開始時刻と終了時刻との差)を全て合計する(ステップS3)。これは、その語句が個別イベントにおいて出現した全期間(以下、語句の出現期間という)に相当する。制御部11は、語句と出現期間とを対応付けて記憶部13に記憶する(ステップS4)。制御部11は、抽出した個別イベントIDに対応する全ての語句について出現期間を算出したら、全ての個別イベントIDについて上記処理ステップS1〜S4を行った否かを判断する(ステップS5)。これを行っていなければ(ステップS5;No)、制御部11は、ステップS1の処理に戻り、新たな個別イベントIDを抽出して上記処理ステップS1〜S4を繰り返す。この結果、図5に示すように、各個別イベントに出現した各語句とその語句の出現期間とが対応付けられた内容が個別イベントごとに記憶部13に記憶されることになる。
【0026】
制御部11は、上記のようにして出現期間を算出する処理を終えると、次に、記憶部13に記憶されているイベントメタデータから1つの個別イベントIDを抽出する(図4のステップS6)。次に、制御部11は、その個別イベントIDに対応する個別イベント時間帯の期間(つまり個別イベント時間帯の開始時刻と終了時刻と差)を特定し、記憶部13に記憶する(ステップS7)。これを個別イベント実施期間という。この結果、図6に示すように、個別イベントごとに個別イベント実施期間が記憶されることになる。
【0027】
そして、制御部11は、ステップS4にて記憶した各語句の出現期間を、その語句に対応する個別イベントIDに対応する個別イベント実施期間で除算する(ステップS8)。この除算により、各語句の出現期間と個別イベント実施期間との割合が求められることになる。そして、この除算結果が、個別イベントにおいて出現した語句の出現頻度を意味するもの、つまり個別イベント内語句出現頻度である。制御部11は、この個別イベント内語句出現頻度と語句とを対応付けて記憶する(ステップS9)。制御部11は、抽出した個別イベントIDについて全ての語句に関して個別イベント内語句出現頻度を特定したら、全ての個別イベントIDについて上記処理ステップS6〜S9を行った否かを判断する(ステップS10)。これを行っていなければ(ステップS10;No)、制御部11はステップS6の処理に戻り、新たな個別イベントIDを抽出して上記処理ステップS6〜S9を繰り返す。
【0028】
この結果、図7に示すように、個別イベントごとに語句と個別イベント内語句出現頻度とが対応付けられた内容が記憶部13に記憶されることになる。例えば番組名「報道特集第八回」に出現した「山口アナウンサー」という語句の出現期間は10分であり、「報道特集第八回」の個別イベント実施期間は30分であるから、「報道特集第八回」に出現した「山口アナウンサー」という語句についての個別イベント内語句出現頻度は、10/30≒0.333333となる。
【0029】
図2において、本発明の第2特定手段に相当するイベント群内語句出現頻度特定部113は、イベントメタデータの内容に基づき、イベント群において出現した各語句の出現頻度を特定する。つまり、前述した個別イベント内語句出現頻度特定部112が、それぞれの個別イベントにおいて出現した語句の出現頻度をその個別イベントの範囲で判断していたのに対し、これから説明するイベント群内語句出現頻度特定部113は、複数の個別イベントを含むイベント群において出現した語句の出現頻度をそのイベント群全体の範囲で判断している点で、両者は異なる。また、個別イベント内語句出現頻度特定部112が、個別イベント実施期間と語句の出現期間という時間的な概念に基づいて語句の出現頻度を判断していたのに対し、イベント群内語句出現頻度特定部113は、イベント群に含まれる個別イベントの数と各イベントにおける語句の出現の有無とに基づいて語句の出現頻度を判断している点(詳しくは後述)でも、両者は異なる。
【0030】
図8は、イベント群内語句出現頻度特定部113として機能する制御部11が、イベント群内語句出現頻度を特定するときの手順を示すフローチャートである。まず、制御部11は、記憶部13に記憶されているイベントメタデータから、1つの個別イベントIDを抽出する(ステップS11)。次に、制御部11は、イベントメタデータから、その個別イベントIDに対応するものと同じイベント群IDが付されている個別イベントIDのうち、ステップS11で抽出した個別イベントIDに対応する個別イベント時間帯よりも前に催された個別イベントの個別イベントIDを全て抽出する(ステップS12)。例えば、ステップS11にて「報道特集第八回」というテレビ番組の個別イベントIDが抽出された場合、ステップS12においては、それ以前に催された「報道特集第一回」から「報道特集第七回」までの合計7つのテレビ番組の個別イベントIDが抽出される。
【0031】
そして、制御部11は、ステップS11およびステップS12において抽出した個別イベントIDの数を数えて(ステップS13)、これを個別イベント実施回数として記憶部13に記憶する(ステップS14)。制御部11は、全ての個別イベントIDについて上記処理ステップS11〜S14を行った否かを判断し(ステップS15)、これを行っていなければ(ステップS15;NO)、ステップS11の処理に戻り、新たな個別イベントIDを抽出して上記処理ステップS11〜S14を繰り返す。この結果、図9に示すように、個別イベントごとに、個別イベント実施回数が記憶部13に記憶されることになる。例えば、ステップS11にて「報道特集第八回」というテレビ番組の個別イベントIDが抽出された場合、ステップS14においては、「報道特集第一回」から「報道特集第八回」までの合計8つのテレビ番組の個別イベントIDが数えられ、個別イベント実施回数は「8」になる。
【0032】
制御部11は、個別イベント実施回数を算出する処理を終えると、次に、記憶部13に記憶されているイベントメタデータから、或るイベント群IDに対応する個別イベントIDのうち1つを抽出する(図8:ステップS16)。次に、制御部11は、イベントメタデータから、その個別イベントIDに対応する語句を、同じ語句の重複を排除しながら、全て抽出する(ステップS17)。次に、制御部11は、これらの語句から1つを抽出する(ステップS18)。次に、制御部11は、イベントメタデータを参照して、上記の或るイベント群IDに対応する個別イベントIDのうち、抽出した上記語句と同じ語句に対応する個別イベントIDがあれば、その数を数える(ステップS19)。つまり、抽出した上記語句が1回でも出現していた個別イベントの数が数えられることになる。ただし、このとき、制御部11は、ステップS16にて抽出した個別イベントIDに対応する個別イベント時間帯よりも前に催された個別イベントの個別イベントIDの数のみを数える。この数のことを、語句出現イベント数という。
【0033】
例えば、ステップS16にて「報道特集第八回」というテレビ番組の個別イベントIDが抽出され、ステップS18にて「山口アナウンサー」という語句が抽出された場合において、同じイベント群IDが割り当てられている「報道特集第一回」から「報道特集第七回」までのテレビ番組において、この「山口アナウンサー」という語句が1回でも出現していたテレビ番組が5つあったと仮定する。この場合、ステップS19にて制御部11によって数えられる語句出現イベント数は「5」となる。この結果、図10に示すように、個別イベントIDごとに各語句についての語句出現イベント数が記憶部13に記憶されることになる。
【0034】
次に、制御部11は、或る個別イベントIDおよび或る語句についてステップS19で求めた語句出現イベント数を、その個別イベントIDについてステップS14で求めた個別イベント実施回数で除算する(ステップS20)。この除算により、イベント群に属するイベントの数と、注目している語句が出現したイベントの数との割合が算出されることになる。この除算結果が、その語句がそのイベント群において出現した頻度、つまり、イベント群内語句出現頻度である。制御部11は、このイベント群内語句出現頻度と語句とを対応付けて記憶する。
【0035】
そして、制御部11は、ステップS16で抽出した個別イベントIDに対応する全ての語句について上記処理ステップS18〜S20を行った否かを判断する(ステップS21)。これを行っていなければ(ステップS21;NO)、制御部11はステップS18の処理に戻り、新たな語句を抽出して上記処理ステップS18〜S20を繰り返す。制御部11は、全ての語句について上記処理ステップS18〜S20を行ったら(ステップS21;YES)、全ての個別イベントIDについて上記処理ステップS16〜S21を行った否かを判断する(ステップS22)。これを行っていなければ(ステップS22;NO)、制御部11は、ステップS16の処理に戻り、新たな個別イベントIDを抽出して上記処理ステップS16〜S21を繰り返す。
【0036】
この結果、図11に示すように、個別イベントごとに、語句とイベント群内語句出現頻度とが対応付けられた内容が記憶部13に記憶されることになる。例えば、「報道特集第八回」というテレビ番組に出現した「山口アナウンサー」という語句については、イベント実施回数が8で(図9参照)、語句出現イベント数が5であるから(図10参照)、イベント群内語句出現頻度は、5/8=0.625となる。
【0037】
本発明の評価手段に相当する評価部114を実現する制御部11は、個別イベント内語句出現頻度とイベント群内語句出現頻度とに基づいて、語句がイベントの主題に適合している程度に応じた評価値を算出する。具体的には、TFijを、個別イベントiにおいて出現した語句jの個別イベント内語句出現頻度とし、DFijを、個別イベントiの時点での語句jが出現したときのイベント群内語句出現頻度としたとき、評価値は、評価値=TFij×log(DFij)-1という式で算出される(図12参照)。つまり、評価値は、個別イベント内語句出現頻度とイベント群内語句出現頻度の逆数の自然対数との積である。このようにして求められた評価値は、評価装置10から図示せぬ通信装置に送信されるとか、記録媒体に記録されるとか、図示せぬ表示装置に表示されるなどの方法で出力される。
【0038】
以上のような方法で評価値を求めるようにすれば、個別イベント内語句出現頻度が高いほど上記式において大きな評価値となり、主題との適合の程度としては高く評価される一方、イベント群内語句出現頻度が高いほど上記式において小さな評価値となり、主題との適合の程度としては低く評価される。すなわち、或る個別イベントにおいて出現頻度が高い語句は、その個別イベントの主題に適合している可能性が高いと考えて、その語句に対する評価値は高くなる。一方、その語句の出現頻度が、その個別イベントよりも前に催された個別イベントにおいても高い場合には、その語句はイベント群に含まれる各個別イベントの進行上の理由などで頻繁に出現しているだけであるとか、そのイベント群において既に普遍的になっている可能性があるので、その語句に対する評価値は低くなる。要するに或る特定の個別イベントにおいてのみ出現する語句は、その個別イベントに特有の主題をよく現しているという考え方である。
【0039】
これにより、視聴者にとって有用な内容の個別イベントを選別するとき、主題との適合の程度が低いと評価された語句よりもその適合の程度が高いと評価された語句を優先的に用いる(例えば評価値そのものを語句に対する重み値として用いるなど)ようにすれば、視聴者が望むような主題のイベントが選別されるし、また、視聴者が望まないような主題のイベントは選別から排除されることになる。
【0040】
さらに、上記実施形態の構成では、個別イベント内語句出現頻度特定部112が、個別イベント実施期間と語句の出現期間という時間的な概念に基づいて語句の出現頻度を判断している。つまり、個別イベントにおいて頻繁ではあるが短期間だけ出現した語句については出現頻度を低いと考えているので、より長期間出現していた語句が個別イベントの主題との適合の程度が高くなる。これにより、視聴者が望むような主題のイベントが選別される可能性が高くなる。一方、イベント群内語句出現頻度特定部113は、イベント群に含まれる個別イベントの数と各イベントにおける語句の出現の有無とに基づいて語句の出現頻度を判断している。つまり、イベント群全体において、長期間の出現でなくても頻繁に出現している語句については出現頻度を高くするという考え方であるが、これは、語句が頻繁に出現することで、その語句はイベント群全体において既に普遍的になっているとか重要性が低くなっていると考えられるからである。従って、視聴者が望まないような主題のイベントが選別から排除される可能性が高くなることが期待される。
【0041】
[変形例]
上述した実施形態は次のような変形が可能である。また、以下の変形例を互いに組み合わせて実施してもよい。
[変形例1]
実施形態で例示したイベントメタデータは、個別イベント名、個別イベントID、イベント群ID、個別イベント時間帯、語句ID、語句および出現時間帯を含んでいたが、イベントメタデータの内容はこれに限定されない。少なくとも必須なのは、視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句と、各イベントにおいてその語句が出現した期間に関する情報(例えば上記の出現時間帯)と、各イベントが催される期間に関する情報(例えば上記の個別イベント時間帯)である。
【0042】
[変形例2]
実施形態で例示したイベントメタデータには、語句の出現時間帯が含まれていたが、本変形例では、イベントメタデータに語句の出現時間帯が含まれておらず、その代わりに、制御部11は、個別イベントにおいて例えば映像として表示されるなどの方法で出現する字幕に関する情報を取得する場合を説明する。字幕とは、映画やテレビ番組などで、題名、番組名、配役、説明などを文字で表現したものや、特に外国映画などで、会話の翻訳を文字で表現したものである。制御部11は、例えば評価装置10の通信部12に接続されたテレビ受像機が受信した字幕画像(キャプション)に対して文字認識処理を行うことによって、その字幕の内容を取得するとともに、自身が計時している日時に基づき、字幕が出現した時間帯を取得する。さらに、制御部11は、これらの各字幕に対して字幕IDを割り当てることで、この字幕IDを取得する。以下、これらの字幕ID、字幕、および字幕時間帯を字幕メタデータという。
【0043】
本変形例に係るイベントメタデータおよび字幕メタデータの一例を図13に示す。図に示す内容には、個別イベント名、個別イベントID、イベント群ID、および個別イベント時間帯というイベントメタデータのほか、個別イベントにおいて出現した字幕に割り当てられた識別情報である字幕ID、個別イベントにおいて出現した字幕、および、その字幕が出現した日時の範囲である字幕時間帯という字幕メタデータを含んでいる。ここでは、字幕には、演者の台詞だけでなく、演者の名称も含まれているものとする。イベントメタデータと字幕メタデータとは図に示すような対応関係があり、以下では、イベントメタデータ及び字幕メタデータを「メタデータ」と総称する。
【0044】
図14は、個別イベント内語句出現頻度特定部112として機能する制御部11が、上記のメタデータから個別イベント内語句出現頻度を特定するときの手順を示すフローチャートである。図14において、イベントメタデータではなくメタデータを処理対象とする点を除いて図4と同じ処理については、同じ符号を付している。制御部11は、記憶部13に記憶されているメタデータから、1つの個別イベントIDを抽出したのち(ステップS1)、語句の出現期間を算出する(ステップS1a)。以降のステップS2、S4〜S10の処理は、図4のステップS2、S4〜S10の処理と同じであるため説明を省略する。
【0045】
図15は、ステップS1aにおいて制御部11が語句の出現期間を算出する処理の詳細を説明するフローチャートである。図15において、制御部11は、ステップS1において抽出した個別イベントIDに対応する字幕を全て抽出し、これらを字幕時間帯の昇順にソートする(ステップS31)。制御部11は、これらの字幕から1つを取り出し(ステップS32)、その字幕に対して形態素解析を行って、その字幕を構成する単語を取り出し、その集合を単語集合Tとする(ステップS33)。次に、制御部11は、単語集合Tから1つの単語を抽出し(ステップS34)、その単語が単語集合Kなるものに属するか否かを判断する(ステップS35)。単語が単語集合Kに属していなければ(ステップS35;NO)、制御部11は、その単語が属する字幕の字幕時間帯を参照し、その字幕時間帯の開始時刻をその単語の初回出現時刻とし、この初回出現時刻をその単語に対応付けた状態で、単語集合Kに追加する。(ステップS36)。次に、制御部11は、その単語が属する字幕の字幕時間帯を参照し、その字幕時間帯の終了時刻をその単語の最終出現時刻とし、その単語に対応付けた状態で、単語集合Kに追加する(ステップS37)。単語が単語集合Kに属していれば(ステップS35;YES)、制御部11は、その単語が属する字幕の字幕時間帯を参照し、その字幕時間帯の終了時刻をその単語の最終出現時刻とし、その単語に対応付けた状態で、単語集合Kに保存する(ステップS37)。制御部11は、単語集合Tに含まれる全ての単語に関してステップS34〜S37の処理を行ったら(ステップS38;YES)、全ての字幕について上記処理ステップS32〜S38を行った否かを判断する(ステップS39)。
【0046】
全ての字幕について上記処理ステップS32〜S38を行った場合(ステップS39;YES)、制御部11は、単語集合Kから1つの単語を抽出し(ステップS40)、その単語に対応する初回出現時刻と最終出現時刻との差を算出し、これを単語の出現期間として、その単語に対応付けて単語集合Kに保存する(ステップS41)。制御部11は、単語集合Tに含まれる全ての単語に関してステップS40,41の処理を行ったら(ステップS42;YES)、単語集合Kに属する単語を、図14における語句とする(ステップS43)。この語句(単語)に対応付けられている、上記の単語の出現期間が、語句の出現期間に相当する。
【0047】
このようにすれば、イベントメタデータに語句の出現期間が存在しない場合でも、字幕メタデータから語句の出現期間を推定することができる。そして、イベント群内語句出現頻度特定部113は、上記のようにして字幕から抽出した語句を用い、実施形態と同様にしてイベント群に含まれる個別イベントの数と各イベントにおける語句の出現の有無とに基づいて語句の出現頻度を判断すればよい。評価部114による評価も実施形態と同様の手順で行なわれる。
【0048】
[変形例3]
前述したように、イベントはテレビ番組に限らない。例えばイベントがラジオ番組である場合には、DJと呼ばれる司会者やそのラジオ番組に招かれたゲストなどの出演者の名称や発言内容などが語句に相当することになる。また、イベントが音楽フェスティバルである場合には、音楽フェスティバルそのものがイベント群に相当し、各演奏が個別イベントに相当する。そして、出演する歌手、バンドやそのメンバーの名称或いは演奏された曲名などが語句に相当することになる。
【0049】
[変形例4]
図8のステップS18において、制御部11は、ステップS16にて抽出した個別イベントIDに対応する個別イベント時間帯よりも前に催された個別イベントの個別イベントIDの数のみを数えていたが、数える対象は、これに限定されない。例えば、制御部11は、ステップS16にて抽出した個別イベントIDに対応する個別イベント時間帯よりも前に催された個別イベントのうち、所定の期間内(例えば過去3ヶ月以内とか過去半年以内)に催された個別イベントの個別イベントIDの数のみを数えるようにしてもよい。また、このような過去の個別イベントに限定されることもなく、例えば、制御部11は、ステップS16にて抽出した個別イベントIDに対応する個別イベント時間帯以後に催された個別イベントの個別イベントIDの数を数えるようにしてもよい。これは、個別イベントが催された直後ではなく、個別イベントが催されてから一定期間が経過した場合を想定している。要するに、制御部11は、ステップS16にて抽出した個別イベントIDに対応する個別イベント時間帯以前とか以後に限定せず、同じイベント群IDに対応する個別イベントの数を数えるようにすればよい。
【0050】
[変形例5]
個別イベント内語句出現頻度特定部112として機能する制御部11は、イベントメタデータに基づき、各々のイベントにおける各々の語句の出現頻度をそのイベントごとに特定するものであればよい。さらに、イベントメタデータに基づき、個別イベントにおいて語句が出現した期間とそのイベントが催された期間との割合を算出し、算出したその割合に応じて、個別イベント内語句出現頻度を特定するときの具体的方法も実施形態の内容に限定されない。例えば、制御部11は、ステップS4にて記憶した各語句の出現期間を、その語句に対応する個別イベントIDに対応する個別イベント実施期間で除算した結果に、或る係数を乗算したり或る定数を加算したりしたものを、個別イベント内語句出現頻度としてもよい。
【0051】
[変形例6]
イベント群内語句出現頻度特定部113として機能する制御部11は、イベントメタデータに基づき、イベント群における語句の出現頻度を特定するものであればよい。さらに、イベントメタデータに基づき、イベント群に属するイベントの数と語句が出現したイベントの数との割合を算出し、算出した割合に応じてイベント群内語句出現頻度を特定するときの具体的方法も実施形態の内容に限定されない。例えば、制御部11は、ステップS19で求めた語句出現イベント数を、その個別イベントIDについてステップS14で求めた個別イベント実施回数で除算した結果に、或る係数を乗算した或る定数を加算したりしたものを、イベント群内語句出現頻度としてもよい。
【0052】
[変形例7]
評価部114として機能する制御部11は、評価値=TFij×log(DFij)-1という式に従って評価値を算出するものに限らない、要するに、制御部11は、各々のイベントにおいて出現した各々の語句に対し、その語句がそのイベントの主題に適合している程度に応じた評価を行う評価手段であって、個別イベント内語句出現頻度が多く、且つ、イベント群内語句出現頻度出現頻度が低い語句であるほど、語句がイベントにおける主題に適合している程度が高いと評価するものであればよい。
【0053】
[変形例8]
評価部114として機能する制御部11は、図12に示すように、各語句についての評価値を算出していたが、さらに、これらの評価値を個別イベントIDごとに集計し、その集計結果を出力するようにしてもよい。このときの出力内容の一例を図16に示す。或る個別イベントIDについて語句ごとの評価値を合計した合計値が大きいほど、その個別イベントの内容は、同じイベント群に属する他の個別イベントの内容に比べて特徴があると言える。従って、その個別イベントは視聴者から注目される度合いが高いという判断を行うことも可能である。逆に、或る個別イベントIDについて語句ごとの評価値を合計した合計値が小さいほど、その個別イベントの内容は、同じイベント群に属する他の個別イベントの内容に比べて特徴がないと言える。従って、その個別イベントは視聴者から注目される度合いが高くないという判断を行うことができる。
【0054】
[変形例9]
本発明は、評価装置10だけでなく、コンピュータが行う評価方法や、コンピュータを評価装置10として機能させるためのプログラムといった形態でも実施が可能である。かかるプログラムは、光ディスク等の記録媒体に記録した形態で提供されたり、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、これをインストールして利用可能にするなどの形態で提供されたりすることが可能である。
【符号の説明】
【0055】
10・・・評価装置、11・・・制御部、12・・・通信部、13・・・記憶部、111・・・取得部、112・・・個別イベント内語句出現頻度特定部、113・・・イベント群内語句出現頻度特定部、114・・・評価部

【特許請求の範囲】
【請求項1】
視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句と、当該各イベントにおいて当該語句が出現した期間に関する情報と、当該各イベントが催される期間に関する情報とを含むイベントメタデータを取得する取得手段と、
前記取得手段によって取得された前記イベントメタデータに基づき、各々の前記イベントにおける各々の前記語句の出現頻度を当該イベントごとに特定する第1特定手段と、
前記取得手段によって取得された前記イベントメタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定手段と、
各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントの主題に適合している程度に応じた評価を行う評価手段であって、前記第1特定手段によって特定された前記出現頻度が多く、且つ、前記第2特定手段によって特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおける主題に適合している程度が高いと評価する評価手段と
を備えることを特徴とする評価装置。
【請求項2】
前記第1特定手段は、取得された前記イベントメタデータに基づき、前記イベントにおいて前記語句が出現した期間と当該イベントが催された期間との割合を算出し、算出した当該割合に応じて、当該イベントにおける当該語句の出現頻度を特定する
ことを特徴とする請求項1に記載の評価装置。
【請求項3】
前記第2特定手段は、取得された前記イベントメタデータに基づき、前記イベント群に属するイベントの数と、当該イベント群に属する各イベントにおける前記語句の出現の有無とを求め、当該数と当該出現の有無とに基づいて、前記イベント群における前記語句の出現頻度を特定する
ことを特徴とする請求項1または2に記載の評価装置。
【請求項4】
前記第2特定手段は、前記取得手段によって取得された前記イベントメタデータに基づき、前記イベント群に属するイベントの数と前記語句が出現したイベントの数との割合を算出し、算出した当該割合に応じて前記イベント群における前記語句の出現頻度を特定する
ことを特徴とする請求項3に記載の評価装置。
【請求項5】
前記評価手段は、前記第1特定手段によって特定された出現頻度を表す数値と、前記第2特定手段によって特定された出現頻度を表す数値の逆数の自然対数とを乗算し、その乗算結果に応じて前記評価を行う
ことを特徴とする請求項1〜4のいずれか1項に記載の評価装置。
【請求項6】
前記評価手段は、各々の前記語句に対する評価結果を当該語句が出現した個別イベントごとに集計する
ことを特徴とする請求項1〜5のいずれか1項に記載の評価装置。
【請求項7】
視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句からなる字幕と、当該各イベントにおいて当該字幕が出現した時間帯と、当該各イベントが催される期間に関する情報とを含むメタデータを取得する取得手段と、
前記取得手段によって取得されたメタデータに含まれる字幕から各語句を抽出し、各々の前記イベントにおける各々の前記語句の出現頻度を当該イベントごとに特定する第1特定手段であって、前記各語句が含まれる字幕のうち、最初に出現した字幕の時間帯の開始時刻、最後に出現した字幕の時間帯の終了時刻との差を、当該字幕から抽出した各語句が出現した期間とし、前記語句が出現した期間と前記イベントが催された期間との割合に応じて、当該イベントにおける当該語句の出現頻度を特定する第1特定手段と、
前記取得手段によって取得された前記メタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定手段と、
各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントの主題に適合している程度に応じた評価を行う評価手段であって、前記第1特定手段によって特定された前記出現頻度が多く、且つ、前記第2特定手段によって特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおける主題に適合している程度が高いと評価する評価手段と
を備えることを特徴とする評価装置。
【請求項8】
評価装置が、視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句と、当該各イベントにおいて当該語句が出現した期間に関する情報と、当該各イベントが催される期間に関する情報とを含むイベントメタデータを取得する取得ステップと、
前記評価装置が、前記取得ステップにおいて取得された前記イベントメタデータに基づき、各々の前記イベントにおける各々の前記語句の出現頻度を前記イベントごとに特定する第1特定ステップと、
前記評価装置が、前記取得ステップにおいて取得された前記イベントメタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定ステップと、
前記評価装置が、各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントにおいて主題として取り扱われた程度に応じた評価を行う評価ステップであって、前記第1特定ステップにおいて特定された前記出現頻度が多く、且つ、前記第2特定ステップにおいて特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおいて主題として取り扱われた程度が高いと評価する評価ステップと
を備える評価方法。
【請求項9】
評価装置が、視聴者に対して催されるイベント群に属する各イベントにおいて出現する語句からなる字幕と、当該各イベントにおいて当該字幕が出現した時間帯と、当該各イベントが催される期間に関する情報とを含むメタデータを取得する取得ステップと、
前記評価装置が、前記取得ステップにおいて取得されたメタデータに含まれる字幕から各語句を抽出し、各々の前記イベントにおける各々の前記語句の出現頻度を当該イベントごとに特定する第1特定手段であって、前記各語句が含まれる字幕のうち、最初に出現した字幕の時間帯の開始時刻、最後に出現した字幕の時間帯の終了時刻との差を、当該字幕から抽出した各語句が出現した期間とし、前記語句が出現した期間と前記イベントが催された期間との割合に応じて、当該イベントにおける当該語句の出現頻度を特定する第1特定ステップと、
前記評価装置が、前記取得ステップにおいて取得された前記メタデータに基づき、前記イベント群における前記語句の出現頻度を特定する第2特定ステップと、
前記評価装置が、各々の前記イベントにおいて出現した各々の前記語句に対し、当該語句が当該イベントの主題に適合している程度に応じた評価を行う評価ステップであって、前記第1特定ステップにおいて特定された前記出現頻度が多く、且つ、前記第2特定ステップにおいて特定された前記出現頻度が低い語句であるほど、前記語句が前記イベントにおける主題に適合している程度が高いと評価する評価ステップと
を備える評価方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2012−190142(P2012−190142A)
【公開日】平成24年10月4日(2012.10.4)
【国際特許分類】
【出願番号】特願2011−51599(P2011−51599)
【出願日】平成23年3月9日(2011.3.9)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】