説明

推薦番組提示装置およびそのプログラム

【課題】視聴者の経験、知見等に基づいて、視聴者の趣味や嗜好に適合した番組を推薦する。
【解決手段】視聴者の特徴語を記憶する特徴解析辞書記憶部602と、選択された提示番組説明情報を取り込む提示番組説明情報取得部603と、視聴者の特徴語と提示番組説明情報との比較に基づき、キーワードを抽出するキーワード抽出部604と、提示番組説明情報と類似する、複数の類似番組説明情報を取り込む類似番組説明情報取得部605と、複数の類似番組説明情報それぞれに対する、キーワードの統計的相関関係を示すスコアを計算し、このスコアに基づいて、複数の類似番組コンテンツデータの中から推薦番組コンテンツデータを選択する推薦番組選定部606と、推薦番組コンテンツデータに対応する推薦番組識別情報を出力する推薦番組関連情報出力部607とを備えた。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推薦番組提示装置およびそのプログラムに関する。
【背景技術】
【0002】
従来、放送番組の閲覧履歴に基づいてテレビ番組に関する視聴者の嗜好を取得し、その嗜好に適合する放送番組を多数の放送予定番組の中から選択して推薦する技術が知られている。例えば、放送番組コンテンツの閲覧履歴や閲覧操作履歴に基づいて視聴者の嗜好を求め、この嗜好に応じて、放送番組コンテンツに対応付けて蓄積した複数の電子番組表の中から一つの電子番組表を選択し出力する番組情報表示装置が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第4628495号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記従来技術では、閲覧履歴や閲覧操作履歴に基づき放送番組に対する視聴者の興味や興味の度合を求めることによって嗜好を推定し、この推定した嗜好に適合する放送番組を選出する。
しかしながら、番組等のコンテンツを視聴しているときの視聴者は、自身の経験および知見を想起しながらそのコンテンツを視聴することがある。よって、これら視聴者自身の経験および知見に基づいて番組を選定すれば、視聴者の経験、知見等を考慮し、視聴者の趣味や嗜好により適合した放送番組の推薦が可能となる。
そこで、本発明は、上記事情に鑑みてなされたものであり、視聴者の経験、知見等に基づいて、視聴者の趣味や嗜好に適合した番組を推薦することができる、推薦番組提示装置およびそのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
[1]上記の課題を解決するため、本発明の一態様である推薦番組提示装置は、視聴者の特徴語を記憶する特徴語記憶部と、前記視聴者により選択された提示番組コンテンツデータの内容を表わす提示番組説明情報を取り込む提示番組説明情報取得部と、前記特徴語記憶部に記憶された前記視聴者の前記特徴語と前記提示番組説明情報取得部が取り込んだ前記提示番組説明情報との比較に基づき、キーワードを抽出するキーワード抽出部と、前記提示番組説明情報と類似する、複数の類似番組コンテンツデータそれぞれの内容を表わす複数の類似番組説明情報を取り込む類似番組説明情報取得部と、前記類似番組説明情報取得部が取り込んだ前記複数の類似番組説明情報それぞれに対する、前記キーワード抽出部が抽出した前記キーワードの統計的相関関係を示すスコアを計算し、前記スコアに基づいて、前記複数の類似番組コンテンツデータの中から推薦対象である番組コンテンツデータを選択する推薦番組選定部と、前記推薦番組選定部が選択した前記番組コンテンツデータに対応する推薦番組識別情報を出力する推薦番組関連情報出力部と、を備えることを特徴とする。
この構成によれば、本発明の一態様である推薦番組提示装置は、提示番組コンテンツデータに類似する複数の類似番組コンテンツデータの中から、視聴者の特徴語に基づいて推薦対象である番組コンテンツデータを選定することができる。
ここで、特徴語は、視聴者の経験に基づき得られたかまたは知得された情報であり、個々の視聴者に固有の情報である。特徴語記憶部は、例えば、一または複数の特徴語と、日付情報と、関係者情報とを対応付けて記憶する。特徴語は、例えば、人名、地名、建物の名称、施設の名称、物品の名称、社会現象、自然現象等の固有名詞(固有表現)である。提示番組説明情報は、例えば、提示番組コンテンツデータの内容や概要を表わす説明情報、番組のあらすじを表すあらすじ情報等である。同様に、類似番組説明情報は、例えば、類似番組コンテンツデータの内容や概要を表わす説明情報、番組のあらすじを表すあらすじ情報等である。提示番組説明情報および類似番組説明情報は、それぞれ、元は文を表すテキストであるが、その文に対応する単語の集合または出現単語の統計情報であってもよい。
よって、本発明の一態様である推薦番組提示装置によれば、視聴者に固有の特徴語に基づき、視聴者の経験、知見等を考慮し、視聴者の趣味や嗜好により適合した番組の推薦が可能となる。
【0006】
[2]上記[1]記載の推薦番組提示装置において、前記推薦番組選定部は、訓練データである番組説明情報における前記キーワードの分布を示す情報と前記類似番組説明情報における特徴語の条件付確率とに基づいて前記スコアを計算することを特徴とする。
【0007】
[3]上記の課題を解決するため、本発明の一態様であるプログラムは、視聴者の特徴語を記憶する特徴語記憶部を備えたコンピュータを、前記視聴者により選択された提示番組コンテンツデータの内容を表わす提示番組説明情報を取り込む提示番組説明情報取得部と、前記特徴語記憶部に記憶された前記視聴者の前記特徴語と前記提示番組説明情報取得部が取り込んだ前記提示番組説明情報との比較に基づき、キーワードを抽出するキーワード抽出部と、前記提示番組説明情報と類似する、複数の類似番組コンテンツデータそれぞれの内容を表わす複数の類似番組説明情報を取り込む類似番組説明情報取得部と、前記類似番組説明情報取得部が取り込んだ前記複数の類似番組説明情報それぞれに対する、前記キーワード抽出部が抽出した前記キーワードの統計的相関関係を示すスコアを計算し、前記スコアに基づいて、前記複数の類似番組コンテンツデータの中から推薦対象である番組コンテンツデータを選択する推薦番組選定部と、前記推薦番組選定部が選択した前記番組コンテンツデータに対応する推薦番組識別情報を出力する推薦番組関連情報出力部と、として機能させる。
【発明の効果】
【0008】
本発明によれば、視聴者の経験、知見等に基づいて、視聴者の趣味や嗜好に適合した番組を推薦することができる。
【図面の簡単な説明】
【0009】
【図1】本発明の一実施形態である推薦番組提示装置を適用した、番組コンテンツ送受信システムの概略の全体構成図である。
【図2】同実施形態における、推薦番組提示装置の機能構成を示すブロック図である。
【図3】番組コンテンツサーバが格納する番組コンテンツ情報のデータ構成を示す図である。
【図4】番組情報サーバが格納する番組情報のデータ構成を示す図である。
【図5】番組情報サーバが格納する統計情報のデータ構成を示す図である。
【図6】ウェブログサーバが管理するウェブログに含まれるテキスト情報の例である。
【図7】視聴者特徴情報抽出部が図6に示したテキスト情報から抽出した視聴者特徴情報の例である。
【図8】推薦番組関連情報出力部が生成する推薦番組関連情報のデータ構成を示す図である。
【図9】番組提示装置が図8に示した推薦番組関連情報に基づいて表示する番組推薦ガイドを模式的に示した図である。
【図10】同実施形態において、推薦番組提示装置が視聴者特徴情報を特徴解析辞書に登録する処理の手順を示すフローチャートである。
【図11】同実施形態において、番組コンテンツ送受信システムによる推薦番組提示処理の手順を示すフローチャートである。
【図12】同実施形態において、番組コンテンツ送受信システムによる推薦番組提示処理の手順を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態について、図面を参照して詳細に説明する。
図1は、本発明の一実施形態である推薦番組提示装置を適用した、番組コンテンツ送受信システムの概略の全体構成図である。同図に示すように、番組コンテンツ送受信システム100は、視聴者システム1と、番組コンテンツ供給システム2と、ウェブログサーバ3とを含んで構成される。視聴者システム1と、番組コンテンツ供給システム2、とウェブログサーバ3とは、図示しないネットワークを介して接続される。このネットワークは、例えば、インターネット、LAN(Local Area Network)、ホームネットワーク等を含むコンピュータネットワークである。
【0011】
図1は、一の視聴者システム1を番組コンテンツ送受信システム100に含めた構成を示している。しかし、実際には、番組コンテンツ送受信システム100は、複数の視聴者システム1を番組コンテンツ供給システム2およびウェブログサーバ3に接続させて実現されるものである。また、ウェブログサーバ3についても、同図では1台のみが示されているが、実際には、一または複数のウェブログサーバ3が視聴者システム1および番組コンテンツ供給システム2に接続される。
【0012】
視聴者システム1は、視聴者Aが番組コンテンツの視聴(閲覧)に利用するシステムであり、番組提示装置10と、情報処理装置20とを含んで構成される。
【0013】
番組提示装置10は、番組コンテンツ供給システム2から配信される番組コンテンツデータを取り込んで提示する装置であり、例えば、ネットワーク対応テレビジョン受像機、コンピュータ装置、携帯電話機やスマートフォン等の携帯端末等によって実現される。番組コンテンツデータは、放送局、番組制作会社等によって制作された番組についての、映像および音声またはいずれか一方のデータである。
【0014】
番組提示装置10は、番組提示装置識別情報と番組識別情報とを含めた番組提示要求を、番組コンテンツ供給システム2に対して送信する。番組提示装置識別情報は、番組提示装置10を識別する情報である。番組識別情報は、番組コンテンツデータを識別する情報である。
番組提示装置10は、番組提示要求を受信した番組コンテンツ供給システム2がその番組提示要求に基づいてストリーミング配信する番組コンテンツデータを取り込み、この番組コンテンツデータを復号して提示する。提示とは、番組提示装置10が、番組コンテンツデータから復号した映像を表示画面に表示させるとともに、復号した音声をスピーカ等から出力させることである。
【0015】
また、番組提示装置10は、番組提示装置識別情報と視聴者識別情報と提示番組識別情報とを含めた推薦番組要求を番組コンテンツ供給システム2に対して送信する。視聴者識別情報は、番組提示装置10を利用して番組コンテンツを視聴する者を識別する情報である。提示番組識別情報は、番組提示装置10が提示するか、または提示中である番組コンテンツデータ、つまり選択された番組コンテンツデータ(提示番組コンテンツデータ)を識別する情報である。
【0016】
番組提示装置10は、推薦番組要求を受信した番組コンテンツ供給システム2がその推薦番組要求に基づき生成し送信する推薦番組関連情報を受信して取り込む。推薦番組関連情報は、提示番組コンテンツデータに類似し且つ視聴者Aの経験、知見等に関係する番組コンテンツデータ(推薦番組コンテンツデータ)を示す推薦番組識別情報と、その推薦の理由を表わす情報とを含む。そして、番組提示装置10は、推薦番組関連情報に基づいて推薦番組を示す番組推薦ガイドを生成し、この番組推薦ガイドを表示する。推薦番組関連情報および番組推薦ガイドのデータ構成については後述する。
【0017】
本実施形態では、番組提示装置10が表示する番組推薦ガイドにしたがって、視聴者Aに推薦番組を選択させることにより、番組提示装置10は、視聴番組に類似し且つ視聴者A自身の経験、知見等に関係する内容の番組を、視聴者Aに視聴させることができる。
【0018】
情報処理装置20は、ウェブログサーバ3と通信可能に接続された状態で、視聴者Aによる図示しない入力受付部の操作にしたがってウェブログの記事(以下、記事の情報をテキスト情報と呼ぶ)を作成し、視聴者Aの視聴者識別情報とそのテキスト情報とを対応付けてウェブログサーバ3に登録する。このテキスト情報は、視聴者Aの経験、知見等に基づく内容を含むものである。具体的には、例えば、テキスト情報は、視聴者Aの日記、旅行記、体験記等の情報である。また、情報処理装置20は、視聴者Aによる入力受付部の操作にしたがって、ウェブログサーバ3に登録されたテキスト情報を編集したり、そのテキスト情報を削除したりする。テキスト情報の具体例については後述する。
情報処理装置20は、例えば、コンピュータ装置、携帯電話機やスマートフォン等の携帯端末等によって実現される。
【0019】
なお、番組提示装置10と情報処理装置20とは、一体的に構成されてもよい。例えば、番組提示装置10および情報処理装置20の構成を、スマートフォンやタブレット等の携帯端末、パーソナルコンピュータ等に組み込んで実現してもよい。
【0020】
番組コンテンツ供給システム2は、例えば、放送局、コンテンツ配信サービス事業者等が管理するシステムであり、番組コンテンツサーバ30と、番組情報サーバ40と、番組検索装置50と、推薦番組提示装置60とを含んで構成される。
【0021】
番組コンテンツサーバ30は、番組コンテンツ情報30aを格納するビデオ・オン・デマンド(Video On Demand;VOD)サーバ装置である。番組コンテンツ情報30aは、複数の番組コンテンツデータを含む情報である。番組コンテンツサーバ30は、番組提示装置10が送信する番組提示要求を受信し、この番組提示要求から番組提示装置識別情報と番組識別情報とを抽出する。番組コンテンツサーバ30は、番組識別情報に対応付けられた番組コンテンツデータを番組コンテンツ情報30aから読み出し、その番組コンテンツデータのストリーミング配信を、番組提示装置識別情報が示す番組提示装置10に対して行う。番組コンテンツ情報30aのデータ構造については後述する。
【0022】
番組情報サーバ40は、番組情報40aと統計情報40bとを格納する情報サーバ装置である。番組情報40aは、番組コンテンツ情報30aが有する番組コンテンツデータごとの番組説明情報を含む。番組説明情報は、例えば、番組コンテンツデータの内容や概要を表わす説明情報、番組のあらすじを表すあらすじ情報等である。番組説明情報は、文を表すテキスト以外にも、その文に対応する単語の集合または出現単語の統計情報であってもよい。統計情報40bは、番組説明情報に含まれる複数の特徴語それぞれに対する確率値を含む情報である。特徴語は、例えば、番組説明情報に含まれる固有表現である。固有表現は、例えば、人名、地名、建物の名称、施設の名称、物品の名称、社会現象、自然現象等の固有名詞である。確率値は、番組情報40aに含まれる全番組説明情報(訓練データともいう)において特徴語の分布を示す情報である。例えば、確率値は、特徴語に関連する内容を有する番組コンテンツデータの数量の、番組コンテンツデータの全数量に対する割合である。番組情報40aおよび統計情報40bのデータ構造については後述する。
【0023】
番組検索装置50は、番組提示装置10が送信する推薦番組要求を受信し、この推薦番組要求から番組提示装置識別情報と視聴者識別情報と提示番組識別情報とを抽出する。番組検索装置50は、番組情報サーバ40に格納された番組情報40aから、提示番組識別情報に対応付けられた番組説明情報を提示番組説明情報として抽出して取り込む。つまり、提示番組説明情報は、提示番組コンテンツデータの内容を表わす。
【0024】
番組検索装置50は、取り込んだ提示番組説明情報に含まれるテキストに類似するテキストを有する番組説明情報を、類似番組説明情報として番組情報40aから所定数分検索する。類似番組説明情報に対応する番組コンテンツデータを類似番組コンテンツデータという。つまり、所定数の類似番組説明情報は、類似番組コンテンツデータの内容を表わす。番組検索装置50は、所定数の類似番組説明情報それぞれに対応付けられた番組識別情報を、類似番組識別情報として番組情報40aから抽出する。
【0025】
具体的には、例えば、番組検索装置50は、番組情報サーバ40に格納された番組情報40aに含まれる全ての番組説明情報について形態素解析処理を実行し、番組説明情報ごとに固有表現を抽出する。そして、番組検索装置50は、提示番組説明情報に含まれる固有表現に一致する単語を多く含むほど度合が高くなる一致度を番組説明情報ごとに求め、一致度が最も高い方から順に所定数分(例えば10個)の番組説明情報を、所定数の類似番組説明情報として検索する。
番組検索装置50は、番組提示装置識別情報と視聴者識別情報と提示番組識別情報と所定数の類似番組識別情報とを、推薦番組提示装置60に供給する。
【0026】
推薦番組提示装置60は、例えば、定期的または特定日時に、ウェブログサーバ3から視聴者Aの視聴者識別情報に対応付けられたテキスト情報を取り込む。そして、推薦番組提示装置60は、そのテキスト情報から視聴者特徴情報を抽出し、この視聴者特徴情報を特徴解析辞書に登録する。視聴者特徴情報は、視聴者Aの経験に基づき得られたかまたは知得された情報であり、例えば、特徴語と、日付情報と、関係者情報とを対応付けた一または複数の情報を含む。この特徴語は、視聴者に固有の情報であり、例えば、テキスト情報に含まれる固有表現である。
【0027】
前述したとおり、テキスト情報には視聴者Aの経験、知見等に基づく内容が含まれているため、特徴語には、視聴者Aの経験、知見等に基づく固有表現が含まれることとなる。日付情報は、特徴語に関係する日付を表わす情報である。例えば、日付情報は、テキスト情報が作成されたときの日付、特徴語に関する事柄を視聴者Aが経験したときの日付等を表わす情報である。関係者情報は、特徴語に関して、視聴者Aと関係する個人やグループを表わす情報である。視聴者特徴情報は、言い換えると、視聴者Aの行動履歴を表す行動履歴情報である。視聴者特徴情報の具体例については後述する。
特徴解析辞書は、視聴者ごとの視聴者特徴情報を、視聴者識別情報に対応付けて登録するデータベースである。
【0028】
推薦番組提示装置60は、番組検索装置50が送信した、番組提示装置識別情報と視聴者識別情報と提示番組識別情報と所定数の類似番組識別情報とを受信する。推薦番組提示装置60は、番組情報サーバ40に格納された番組情報40aから、提示番組識別情報に対応付けられた番組説明情報である提示番組説明情報を抽出して取り込む。推薦番組提示装置60は、提示番組説明情報と、特徴解析辞書において視聴者Aの視聴者識別情報に対応付けられた視聴者特徴情報との比較に基づき、一または複数のキーワードを抽出する。
【0029】
推薦番組提示装置60は、番組情報サーバ40に格納された番組情報40aから、所定数の類似番組識別情報それぞれに対応付けられた番組説明情報である類似番組説明情報を抽出して取り込む。
推薦番組提示装置60は、各類似番組説明情報に対するキーワードの統計的相関関係を示すスコアを計算し、これらスコアに基づいて推薦番組を選択し推薦番組関連情報を生成する。スコア計算の詳細については後述する。
推薦番組提示装置60は、推薦番組関連情報を、番組提示装置識別情報が示す番組提示装置10に対して送信する。
【0030】
ウェブログサーバ3は、ウェブログ3aを管理するサーバ装置である。ウェブログ3aは、視聴者識別情報とテキスト情報とを対応付けて管理するウェブサイトである。ウェブログサーバ3は、番組コンテンツ供給システム2からの要求に応じて、視聴者識別情報とテキスト情報とを推薦番組提示装置60に供給する。
ウェブログサーバ3は、番組コンテンツ供給システム2を管理する事業者が管理するものであってもよいし、番組コンテンツ供給システム2を管理する事業者以外の事業者が管理するものであってもよい。
【0031】
図2は、推薦番組提示装置60の機能構成を示すブロック図である。同図に示すように、推薦番組提示装置60は、視聴者特徴情報抽出部601と、特徴解析辞書記憶部(特徴語記憶部)602と、提示番組説明情報取得部603と、キーワード抽出部604と、類似番組説明情報取得部605と、推薦番組選定部606と、推薦番組関連情報出力部607とを備える。
【0032】
視聴者特徴情報抽出部601は、定期的(例えば、5日間おきや毎週月曜日午前0時0分0秒)に、視聴者Aの視聴者識別情報を含めたテキスト情報要求をウェブログサーバ3に対して送信する。そして、視聴者特徴情報抽出部601は、テキスト情報要求を受信したウェブログサーバ3から送信される、視聴者Aの視聴者識別情報に対応付けられたテキスト情報を受信して取り込む。視聴者特徴情報抽出部601は、例えば形態素解析処理を実行してテキスト情報から特徴語を抽出するとともに、日付に関する情報(日付情報)と関係者に関する情報(関係者情報)とを抽出する。そして、視聴者特徴情報抽出部601は、これら抽出した特徴語と日付情報と関係者情報とを視聴者識別情報に対応付け、視聴者特徴情報として特徴解析辞書記憶部602に記憶させる。
【0033】
特徴解析辞書記憶部602は、視聴者ごとの視聴者特徴情報を、視聴者識別情報に対応付けて記憶する。特徴解析辞書記憶部602は、例えば、磁気ハードディスク装置、半導体記憶装置等によって実現される。
【0034】
なお、推薦番組提示装置60は、固有表現の類義語および同義語を体系化して記憶した類義語・同義語サーバを用いて特徴語の類義語および同義語を検索し、これら類義語および同義語を視聴者特徴情報に対応付けて特徴解析辞書記憶部602に記憶させてもよい。この場合、類義語・同義語サーバを、推薦番組提示装置60内に設置してもよいし、ネットワークを介してアクセス可能に推薦番組提示装置60外に設置してもよい。
【0035】
提示番組説明情報取得部603は、番組検索装置50が送信した提示番組識別情報を受信し、この提示番組識別情報を含む提示番組説明情報要求を生成し、この提示番組説明情報要求を番組情報サーバ40に対して送信する。そして、提示番組説明情報取得部603は、提示番組説明情報要求を受信した番組情報サーバ40が送信する提示番組説明情報を受信し、この提示番組説明情報をキーワード抽出部604に供給する。
【0036】
キーワード抽出部604は、番組検索装置50が送信した視聴者識別情報を受信し、提示番組説明情報取得部603が送信した提示番組説明情報を受信する。そして、キーワード抽出部604は、提示番組説明情報と、特徴解析辞書記憶部602に記憶されている、視聴者識別情報に対応付けられた視聴者特徴情報における一または複数の特徴語との比較に基づいて、一または複数のキーワードを抽出する。例えば、キーワード抽出部604は、提示番組説明情報と一または複数の特徴語とにおいて共通する一または複数のキーワードを抽出する。そして、キーワード抽出部604は、抽出した一または複数のキーワードを推薦番組選定部606に供給する。
【0037】
類似番組説明情報取得部605は、番組検索装置50が送信した所定数の類似番組識別情報を受信し、類似番組識別情報ごとに、この類似番組識別情報を含む類似番組説明情報要求を生成し、この類似番組説明情報要求を番組情報サーバ40に対して送信する。そして、類似番組説明情報取得部605は、類似番組説明情報要求を受信した番組情報サーバ40が送信する類似番組説明情報を受信し、この類似番組説明情報を推薦番組選定部606に供給する。
【0038】
推薦番組選定部606は、キーワード抽出部604から供給される一または複数のキーワードを取り込み、類似番組説明情報取得部605から供給される所定数の類似番組説明情報を取り込む。推薦番組選定部606は、各類似番組説明情報に対するキーワードの統計的相関関係を示すスコアを計算する。
【0039】
ここで、推薦番組選定部606が実行するスコア計算処理の具体例について説明する。本実施形態では、推薦番組選定部606は、ナイーブベイズ分類器(単純ベイズ分類器)を適用して、類似番組説明情報についてのキーワードに対するスコアを計算する。
ナイーブベイズ分類器は、下記の式(1)に示すように、クラス変数cについての条件付モデルとして表される。式(1)において、cは特徴語であるキーワードを表す。dは類似番組説明情報を表す。P(c)は、全番組説明情報、つまり訓練データにおけるcの分布を示す確率値である。P(d)は、dが発生する確率である。P(d|c)は尤度を表す。
【0040】
【数1】

【0041】
推薦番組選定部606は、類似番組説明情報ごとに、式(1)におけるP(c|d)が最大となるクラスcmaxを、下記の式(2)により計算する。
【0042】
【数2】

【0043】
式(2)において、P(c)は、番組情報サーバ40に格納された統計情報40bにおける、特徴語cに対する確率値である。つまり、P(c)は、特徴語cに関連する内容を有する番組コンテンツデータの数量の、番組コンテンツデータの全数量(訓練データの全数量)に対する割合である。番組コンテンツデータの数量とは、例えば、対応する番組の数である。
つまり、クラスcmaxは、確率値P(c)と尤度P(d|c)との積値を最大にするクラスcである。式(2)において、式(1)の分母のP(d)が省略されているのは、P(d)がcに依らず一定であるためである。
類似番組説明情報であるdを単語の集合(w,w,・・・,w)とした場合、P(d|c)は、単語間の独立性を仮定することにより下記の式(3)として表される。
【0044】
【数3】

【0045】
クラスcを条件とした単語wの条件付確率であるP(w|c)は、下記の式(4)として表される。ただし、N(c,w)は、クラスcに単語wが出現する回数、Sは、番組情報40aに含まれる全ての番組説明情報が有する単語の集合、すなわち訓練データにおける全単語の集合を表す。
【0046】
【数4】

【0047】
つまり、単語wの条件付確率であるP(w|c)は、クラスcに全単語(Sに属する全単語)が出現する回数に対する、クラスcに単語wが出現する回数の割合である。
したがって、上記の式(1)および式(2)から、下記の式(5)のように表される。
【0048】
【数5】

【0049】
式(5)において、特徴語cの分布を示す確率値P(c)と、単語wの条件付確率であるP(w|c)を全ての単語について掛け合わせたものとの積が、統計的相関関係を示すスコアである。なお、このスコアの値の対数を、スコアとしてもよい。
【0050】
推薦番組選定部606は、訓練データである番組説明情報における特徴語cの分布を示す情報と類似番組説明情報における単語wの条件付確率とに基づいて、スコアを計算するものである。
【0051】
推薦番組選定部606は、前記の所定数の類似番組説明情報dそれぞれについて、且つクラスcのそれぞれについて、上記のスコアを計算し、算出したスコアに基づいて推薦番組を選択し、推薦対象である推薦番組コンテンツデータに対応する推薦番組識別情報を推薦番組関連情報出力部607に供給する。
例えば、推薦番組選定部606は、前記の所定数の類似番組説明情報dそれぞれについて、クラスcmaxを求め、クラスcmaxに対応するスコアを、当該類似番組説明情報のスコアとする。そして、類似番組説明情報の中で最も高いスコアを有する類似番組識別情報を、推薦番組識別情報とする。
または、推薦番組選定部606は、上記のようにそれぞれの類似番組説明情報のスコアを算出し、この中から、あらかじめ決定されたスコア閾値を超えるスコアを有する、一または複数の類似番組識別情報を選択し、推薦番組識別情報とする。
または、推薦番組選定部606は、上記のようにそれぞれの類似番組説明情報のスコアを算出し、この中から、上位所定範囲(類似番組説明情報の数に対する上位の所定割合、または上位の所定数)の類似番組識別情報を選択し、推薦番組識別情報とする。
【0052】
推薦番組関連情報出力部607は、推薦番組選定部606から供給される推薦番組識別情報を取り込み、この推薦番組識別情報と、推薦番組識別情報に対応する特徴語つまりcmaxと、特徴語に対応付けられた日付情報と、関係者情報とを含めた推薦番組関連情報を生成する。そして、推薦番組関連情報出力部607は、推薦番組関連情報を、番組提示装置識別情報が示す番組提示装置10に対して送信する。
【0053】
次に、各種データのデータ構成について説明する。
図3は、番組コンテンツサーバ30が格納する番組コンテンツ情報30aのデータ構成を示す図である。同図に示すように、番組コンテンツ情報30aは、番組識別情報と、番組コンテンツデータとを対応付けたデータ構成を有している。
【0054】
図4は、番組情報サーバ40が格納する番組情報40aのデータ構成を示す図である。同図に示すように、番組情報40aは、番組識別情報と、番組説明情報とを対応付けたデータ構成を有している。
【0055】
図5は、番組情報サーバ40が格納する統計情報40bのデータ構成を示す図である。同図に示すように、統計情報40bは、特徴語と、特徴語に関連する内容を有する番組コンテンツデータの数量の、番組コンテンツデータの全数量に対する割合を表わす確率値とを対応付けたデータ構成を有している。
【0056】
図6は、ウェブログサーバ3が管理するウェブログ3aに含まれる視聴者Aのテキスト情報の例である。同図に示すように、ウェブログの記事の情報であるテキスト情報は、タイトル欄と、関係者欄と、更新日時欄と、本文欄とを有する。タイトル欄は、記事の題名が記入される欄である。関係者欄は、当該記事における視聴者Aの関係者を表わす情報が記入される欄である。更新日時欄は、当該記事がウェブログ3aに更新された日時が記入される欄である。本文欄は、記事本文が記入される欄である。これらの欄のうち、タイトル欄と関係者欄と本文欄とは、視聴者Aによって記入され、更新日時欄は、更新時に、ウェブログサーバ3の処理によって記入される。
【0057】
図7は、視聴者特徴情報抽出部601が図6に示したテキスト情報から抽出した視聴者特徴情報の例である。同図に示すように、視聴者特徴情報は、特徴語と、日付情報と、関係者情報とを対応付けたデータ構成を有している。視聴者特徴情報抽出部601は、例えば図6に示したテキスト情報の本文欄に記載されたテキストから複数の固有表現を抽出し、これら固有表現を特徴語とする。また、視聴者特徴情報抽出部601は、テキスト情報の更新日時欄に記載された情報のうち、年月日の情報を日付情報とする。また、視聴者特徴情報抽出部601は、テキスト情報の関係者欄に記載された情報を関係者情報とする。
【0058】
図8は、推薦番組関連情報出力部607が生成する推薦番組関連情報のデータ構成を示す図である。同図に示すように、推薦番組関連情報は、推薦番組選定部606が選択した推薦番組を示す推薦番組識別情報と、その推薦番組に対するスコアcmaxに対応する特徴語と、日付情報と、関係者情報とを対応付けたデータ構成を有している。
【0059】
図9は、番組提示装置10が図8に示した推薦番組関連情報に基づいて表示する番組推薦ガイドを模式的に示した図である。同図は、番組提示装置10が表示する表示画面の一部分を示している。同図に示すように、番組推薦ガイド90は、サムネイル画像91と、推薦理由情報92とを有する。サムネイル画像91は、推薦番組関連情報に含まれる推薦番組識別情報が示す番組コンテンツデータにおける代表画像を縮小して得た画像である。推薦理由情報92は、推薦番組関連情報に含まれる、特徴語と日付情報と関係者情報とを表す情報である。番組提示装置10は、推薦番組提示装置60が送信した推薦番組関連情報を受信して取り込むと、推薦番組識別情報が示す番組コンテンツデータにおける代表画像データを番組コンテンツサーバ30から取り込む。そして、番組提示装置10は、代表画像データを縮小させる画像処理を実行してサムネイル画像91を生成し、特徴語と日付情報と関係者情報とを含めた推薦理由情報92を生成する。そして、番組提示装置10は、サムネイル画像91と推薦理由情報92とを含めた番組推薦ガイド90を表示させる。
【0060】
次に、本実施形態における番組コンテンツ送受信システム100の動作について説明する。
図10は、推薦番組提示装置60が視聴者Aについての視聴者特徴情報を特徴解析辞書に登録する処理の手順を示すフローチャートである。視聴者Aによる情報処理装置20の操作によって、視聴者Aの記事の情報であるテキスト情報がウェブログ3aに登録されているものとする。
【0061】
ステップS1において、視聴者特徴情報抽出部601は、ウェブログサーバ3が管理するウェブログ3aから視聴者Aに関するテキスト情報を取り込むタイミングをはかっている。具体的には、視聴者特徴情報抽出部601は、あらかじめ決定された期間(例えば、5日間)の周期を計測する。または、視聴者特徴情報抽出部601は、暦における特定日時(例えば、毎週月曜日の午前0時0分0秒)を計時する。視聴者特徴情報抽出部601は、視聴者Aに関するテキスト情報を取り込むタイミングを検出すると、ステップS2の処理に移す。
【0062】
ステップS2において、視聴者特徴情報抽出部601は、視聴者Aの視聴者識別情報を含めたテキスト情報要求をウェブログサーバ3に対して送信し、そのテキスト情報要求を受信したウェブログサーバ3から送信された、視聴者Aの視聴者識別情報に対応付けられたテキスト情報を受信する。
次に、ステップS3において、視聴者特徴情報抽出部601は、例えば、形態素解析処理を実行してテキスト情報から固有表現である特徴語を抽出するとともに、日付情報と関係者情報とを抽出する。
次に、ステップS4において、視聴者特徴情報抽出部601は、抽出した特徴語と日付情報と関係者情報とである視聴者特徴情報を、視聴者識別情報に対応付けて特徴解析辞書記憶部602の特徴解析辞書に登録する。
次に、視聴者特徴情報抽出部601は、ステップS1の処理に戻す。
【0063】
図11および図12は、番組コンテンツ送受信システム100による推薦番組提示処理の手順を示すフローチャートである。番組提示装置10は、番組コンテンツサーバ30から所望の番組コンテンツデータを取得して提示しているものとする。
【0064】
まず、番組提示装置10の動作について説明する。
ステップ11において、番組提示装置10は、自装置の番組提示装置識別情報と、視聴者Aの視聴者識別情報と、現在選択中である提示番組コンテンツデータに対応する提示番組識別情報とを含めた推薦番組要求を、番組検索装置50に対して送信する。
次に、ステップS12において、番組提示装置10は、推薦番組提示装置60の推薦番組関連情報出力部607が送信する推薦番組関連情報を受信して取り込む。
次に、ステップS13において、番組提示装置10は、推薦番組関連情報に基づいて番組推薦ガイドを生成し、この番組推薦ガイドを表示する。
【0065】
次に、番組検索装置50の動作について説明する。
ステップS21において、番組検索装置50は、番組提示装置10が送信した推薦番組要求を受信し、この推薦番組要求から番組提示装置識別情報と視聴者識別情報と提示番組識別情報とを抽出する。
次に、ステップS22において、番組検索装置50は、提示番組識別情報に基づいて、番組情報サーバ40に格納された番組情報40aから所定数の類似番組を検索する。
例えば、番組検索装置50は、番組情報サーバ40に格納された番組情報40aから、提示番組識別情報に対応付けられた番組説明情報を提示番組説明情報として抽出して取り込む。次に、番組検索装置50は、取り込んだ提示番組説明情報に含まれるテキストに類似するテキストを有する番組説明情報を、類似番組説明情報として番組情報40aから所定数分検索する。
次に、ステップS23において、番組検索装置50は、番組提示装置識別情報と視聴者識別情報と提示番組識別情報と所定数の類似番組識別情報とを、推薦番組提示装置60に供給する。
【0066】
次に、推薦番組提示装置60の動作について説明する。
ステップS31において、提示番組説明情報取得部603は提示番組識別情報を取り込み、キーワード抽出部604は視聴者識別情報を取り込み、類似番組説明情報取得部605は所定数の類似番組識別情報を取り込み、推薦番組関連情報出力部607は番組提示装置識別情報を取り込む。
【0067】
次に、ステップS32において、提示番組説明情報取得部603は、提示番組識別情報を含む提示番組説明情報要求を生成し、この提示番組説明情報要求を番組情報サーバ40に対して送信する。次に、提示番組説明情報取得部603は、提示番組説明情報要求を受信した番組情報サーバ40が送信する提示番組説明情報を受信し、この提示番組説明情報をキーワード抽出部604に供給する。
【0068】
次に、ステップS33において、キーワード抽出部604は、提示番組説明情報取得部603から供給された提示番組説明情報を取り込み、この提示番組説明情報と、特徴解析辞書記憶部602に記憶されている、視聴者識別情報に対応付けられた視聴者特徴情報における一または複数の特徴語との比較に基づいて、一または複数のキーワードを抽出する。次に、キーワード抽出部604は、抽出した一または複数のキーワードを推薦番組選定部606に供給する。
【0069】
次に、ステップS34において、類似番組説明情報取得部605は、所定数の類似番組識別情報それぞれについて、類似番組識別情報を含む類似番組説明情報要求を生成し、この類似番組説明情報要求を番組情報サーバ40に対して送信する。次に、類似番組説明情報取得部605は、類似番組説明情報要求を受信した番組情報サーバ40が送信する所定数の類似番組説明情報を受信し、類似番組説明情報を推薦番組選定部606に供給する。
【0070】
次に、ステップS35において、推薦番組選定部606は、キーワード抽出部604から供給された一または複数のキーワードを取り込み、類似番組説明情報取得部605から供給される所定数の類似番組説明情報を順次取り込む。次に、推薦番組選定部606は、各類似番組説明情報に対する各キーワードの統計的相関関係を示すスコアを計算する。このスコアを元に、推薦番組選定部606は、類似番組説明情報ごとのスコアを決定する。次に、推薦番組選定部606は、所定数の類似番組説明情報それぞれについてのスコアに基づいて推薦番組を選択し、推薦対象である推薦番組コンテンツデータに対応する推薦番組識別情報を推薦番組関連情報出力部607に供給する。
【0071】
次に、ステップS36において、推薦番組関連情報出力部607は、推薦番組選定部606から供給された推薦番組識別情報を取り込み、この推薦番組識別情報と、推薦番組識別情報に対応する特徴語cmaxと、特徴語cmaxに対応付けられた日付情報と、関係者情報とを含めた推薦番組関連情報を生成する。次に、推薦番組関連情報出力部607は、推薦番組関連情報を、番組提示装置識別情報が示す番組提示装置10に対して送信する。
【0072】
以上説明したとおり、本発明の一実施形態である推薦番組提示装置60は、例えば定期的または特定日時に、視聴者Aの経験、知見等に基づく内容を含むテキスト情報をウェブログサーバ3から取得する。そして、推薦番組提示装置60は、このテキスト情報から視聴者特徴情報を抽出して、この視聴者特徴情報を特徴解析辞書に登録する。つまり、推薦番組提示装置60は、視聴者Aの経験に基づき得られたかまたは知得された固有表現を含む視聴者特徴情報を特徴解析辞書に登録しておく。
【0073】
推薦番組提示装置60は、番組提示装置10が提示する番組コンテンツデータ、または提示中である番組コンテンツデータの内容を表わす提示番組説明情報を番組情報サーバ40から取得し、特徴解析辞書に登録された視聴者Aの視聴者特徴情報と提示番組説明情報との比較に基づいてキーワードを抽出する。
そして、推薦番組提示装置60は、提示番組説明情報と類似する、所定数の類似番組説明情報を番組情報サーバ40から取得し、各類似番組説明情報に対するキーワードの統計的相関関係を示すスコアを計算し、このスコアに基づいて、所定数の類似番組コンテンツデータの中から推薦対象である番組コンテンツデータを選択する。
【0074】
このように構成したことにより、推薦番組提示装置60は、視聴している番組に類似する所定数の類似番組の中から、視聴者自身の経験、知見等に基づいて推薦番組を選択することができる。よって、推薦番組提示装置60によれば、視聴者の経験、知見等を考慮し、視聴者の趣味や嗜好により適合した番組の推薦が可能となる。
【0075】
なお、本実施形態における番組コンテンツ送受信システム100では、推薦番組提示装置60を、番組コンテンツデータの供給元である番組コンテンツ供給システム2に含めた構成とした。これ以外にも、推薦番組提示装置60を、番組コンテンツデータの供給先である視聴者システム1に含めて構成してもよい。この場合、例えば、番組提示装置10と推薦番組提示装置60とを一体的に構成してもよい。
【0076】
また、本実施形態では、情報処理装置20は、視聴者Aによる入力受付部の操作により作成したウェブログの記事の情報を、ウェブログサーバ3のウェブログ3aに登録するようにした。そして、推薦番組提示装置60は、ウェブログサーバ3のウェブログ3aから視聴者Aの記事の情報をテキスト情報として取り込む構成とした。これ以外にも、例えば、視聴者Aによる入力受付部の操作によって特徴語と日付情報と関係者情報とを情報処理装置20の図示しない記憶部に記憶させ、情報処理装置20がその記憶された各情報を、推薦番組提示装置60に供給するようにしてもよい。
【0077】
また、本実施形態である推薦番組提示装置60の一部の機能をコンピュータで実現するようにしてもよい。この場合、その制御機能を実現するためのプログラム(推薦番組提示プログラム)をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませて、このコンピュータシステムが実行することによって実現してもよい。なお、このコンピュータシステムとは、オペレーティング・システム(Operating System;OS)や周辺装置のハードウェアを含むものである。また、コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに備えられる磁気ハードディスクやソリッドステートドライブ等の記憶装置のことをいう。さらに、コンピュータ読み取り可能な記録媒体とは、インターネット等のコンピュータネットワーク、および電話回線や携帯電話網を介してプログラムを送信する場合の通信回線のように、短時間の間、動的にプログラムを保持するもの、さらには、その場合のサーバ装置やクライアントとなるコンピュータシステム内部の揮発性メモリのように、一提示間プログラムを保持するものを含んでもよい。また上記のプログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
【0078】
以上、本発明の実施の形態について図面を参照して詳述したが、具体的な構成はその実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0079】
1 視聴者システム
2 番組コンテンツ供給システム
3 ウェブログサーバ
3a ウェブログ
10 番組提示装置
20 情報処理装置
30 番組コンテンツサーバ
30a 番組コンテンツ情報
40 番組情報サーバ
40a 番組情報
40b 統計情報
50 番組検索装置
60 推薦番組提示装置
100 番組コンテンツ送受信システム
601 視聴者特徴情報抽出部
602 特徴解析辞書記憶部(特徴語記憶部)
603 提示番組説明情報取得部
604 キーワード抽出部
605 類似番組説明情報取得部
606 推薦番組選定部
607 推薦番組関連情報出力部

【特許請求の範囲】
【請求項1】
視聴者の特徴語を記憶する特徴語記憶部と、
前記視聴者により選択された提示番組コンテンツデータの内容を表わす提示番組説明情報を取り込む提示番組説明情報取得部と、
前記特徴語記憶部に記憶された前記視聴者の前記特徴語と前記提示番組説明情報取得部が取り込んだ前記提示番組説明情報との比較に基づき、キーワードを抽出するキーワード抽出部と、
前記提示番組説明情報と類似する、複数の類似番組コンテンツデータそれぞれの内容を表わす複数の類似番組説明情報を取り込む類似番組説明情報取得部と、
前記類似番組説明情報取得部が取り込んだ前記複数の類似番組説明情報それぞれに対する、前記キーワード抽出部が抽出した前記キーワードの統計的相関関係を示すスコアを計算し、前記スコアに基づいて、前記複数の類似番組コンテンツデータの中から推薦対象である番組コンテンツデータを選択する推薦番組選定部と、
前記推薦番組選定部が選択した前記番組コンテンツデータに対応する推薦番組識別情報を出力する推薦番組関連情報出力部と、
を備えることを特徴とする推薦番組提示装置。
【請求項2】
前記推薦番組選定部は、
訓練データである番組説明情報における前記キーワードの分布を示す情報と前記類似番組説明情報における特徴語の条件付確率とに基づいて前記スコアを計算する
ことを特徴とする請求項1記載の推薦番組提示装置。
【請求項3】
視聴者の特徴語を記憶する特徴語記憶部を備えたコンピュータを、
前記視聴者により選択された提示番組コンテンツデータの内容を表わす提示番組説明情報を取り込む提示番組説明情報取得部と、
前記特徴語記憶部に記憶された前記視聴者の前記特徴語と前記提示番組説明情報取得部が取り込んだ前記提示番組説明情報との比較に基づき、キーワードを抽出するキーワード抽出部と、
前記提示番組説明情報と類似する、複数の類似番組コンテンツデータそれぞれの内容を表わす複数の類似番組説明情報を取り込む類似番組説明情報取得部と、
前記類似番組説明情報取得部が取り込んだ前記複数の類似番組説明情報それぞれに対する、前記キーワード抽出部が抽出した前記キーワードの統計的相関関係を示すスコアを計算し、前記スコアに基づいて、前記複数の類似番組コンテンツデータの中から推薦対象である番組コンテンツデータを選択する推薦番組選定部と、
前記推薦番組選定部が選択した前記番組コンテンツデータに対応する推薦番組識別情報を出力する推薦番組関連情報出力部と、
として機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2013−29973(P2013−29973A)
【公開日】平成25年2月7日(2013.2.7)
【国際特許分類】
【出願番号】特願2011−165366(P2011−165366)
【出願日】平成23年7月28日(2011.7.28)
【出願人】(000004352)日本放送協会 (2,206)
【Fターム(参考)】