説明

コンテンツ処理装置

【課題】発声者の意図する映像のタイミングでコンテンツに対して入力されたコメントを視聴者が聞くことができるコンテンツ処理装置を提供する。
【解決手段】本発明のコンテンツ処理装置4は、コンテンツを配信すると共に、コンテンツに対するコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理装置である。コンテンツの映像を出力する映像再生手段42と、コンテンツから分離した音声の時間情報と、コンテンツの時間情報に基づいて予め与えられ、ユーザの要求に基づいて受信したコメントの時間情報と、が一致すると、コンテンツの音声をコメントに切り替えて出力するオーディオ切り替え手段44と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツを配信すると共に、当該コンテンツに対するユーザのコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理装置、コンテンツ処理方法及びコンテンツ処理プログラム、コンテンツ配信システムに関する。
【背景技術】
【0002】
xDSL(Digital Subscriber Line)やFTTH(Fiber To The Home)等の広帯域ネットワークの普及によりIP(Internet Protocol)ネットワークを利用したコンテンツ配信サービスが盛んに行われるようになってきた。これまで、多言語音声や副音声などといった通常番組以外の音声情報は、コンテンツ製作者が提供していた。
【0003】
最近では、特許文献1に開示されているように、視聴者が映像画面に文字などの情報を付加したコンテンツを作成し、他の視聴者と当該コンテンツを同時に視聴するコンテンツ共有サービスが提案されている。
【0004】
また、特許文献2に開示されているように、同一のコンテンツを同時に視聴し、VoIP(Voice over Internet Protocol)機能を利用した音声通信を行い、発言コメントを共有するサービスが提案されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2006−41886号公報
【特許文献2】特開2007−274227号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1、2の技術は、視聴者同士が同一のコンテンツを同時に視聴する必要がある。そのため、VOD(Video On Demand)などのように視聴者が個々にコンテンツを要求し再生する場合には、予め参加者がスケジュールを決め、その時間には必ずTVの視聴を行なう必要がある。したがって、たまたま参加できなかったメンバが会話の内容を聞いたり、後でコメントに参加できなかったり、といった課題があった。
【0007】
特に、特許文献2の技術は、同時視聴しているコンテンツと会話の内容とが同時視聴中に共有できても、コメントをコンテンツに同期させて残しておくことができない。また、映像画面に文字などのコメントを書き込む場合にもコメントを付加したいタイミングにコメントを挿入することは困難であった。
【0008】
ところで、VODにおいてコンテンツ開始から経過した時間情報によりコメントを挿入する方法も考えられる。しかし、例えばIPマルチキャスト放送を視聴している時にコメントデータを挿入する場合には、コンテンツの開始時刻がわからないため適切な時刻にコメントを挿入できない問題が残る。更に、今後放送されたコンテンツを番組単位で見逃し視聴サービスといわれるVODを行う際に、コメントが挿入された放送コンテンツを視聴する場合、番組単位に編集した場合、コメント挿入時刻情報を一致させる方法が提案されていない。
【0009】
本発明の目的は、上述した課題を解決するコンテンツ処理装置、コンテンツ処理方法及びコンテンツ処理プログラム、コンテンツ配信システムを提供することにある。
【課題を解決するための手段】
【0010】
本発明のコンテンツ処理装置は、コンテンツを配信すると共に、前記コンテンツに対するコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理装置であって、前記コンテンツの映像を出力する映像再生手段と、前記コンテンツから分離した音声の時間情報と、前記コンテンツの時間情報に基づいて予め与えられ、ユーザの要求に基づいて受信した前記コメントの時間情報と、が一致すると、前記コンテンツの音声を前記コメントに切り替えて出力するオーディオ切り替え手段と、を備える。
本発明のコンテンツ配信システムは、上記コンテンツ処理装置を備える。
【0011】
本発明のコンテンツ処理方法は、コンテンツを配信すると共に、前記コンテンツに対するコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理方法であって、前記コンテンツの映像を出力する映像再生工程と、前記コンテンツから分離した音声の時間情報と、前記コンテンツの時間情報に基づいて予め与えられ、ユーザの要求に基づいて受信した前記コメントの時間情報と、が一致すると、前記コンテンツの音声を前記コメントに切り替えて出力するオーディオ切り替え工程と、を備える。
【0012】
本発明のコンテンツ処理プログラムは、コンテンツを配信すると共に、前記コンテンツに対するコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理プログラムであって、コンテンツ処理装置に、前記コンテンツの映像を出力する映像再生処理と、前記コンテンツから分離した音声の時間情報と、前記コンテンツの時間情報に基づいて予め与えられ、ユーザの要求に基づいて受信した前記コメントの時間情報と、が一致すると、前記コンテンツの音声を前記コメントに切り替えて出力するオーディオ切り替え処理と、を実現させる。
【発明の効果】
【0013】
本発明によれば、コンテンツ配信サービスの視聴時間は視聴者によって自由に選択でき、更に視聴しているコンテンツにコメントが入力されている場合には、発声者の意図する映像のタイミングで入力されたコメントを視聴者が聞くことができる。
【図面の簡単な説明】
【0014】
【図1】本発明の第1の実施の形態のコンテンツ配信システムを概略的に示すブロック図である。
【図2】本発明の第1の実施の形態のコンテンツ処理装置を概略的に示すブロック図である。
【図3】本発明の第1の実施の形態のコンテンツ処理装置を詳細に示すブロック図である。
【図4】本発明の第1の実施の形態のコンテンツ処理方法の流れを示すタイミングチャートである。
【図5】本発明の第1の実施の形態のコンテンツ処理プログラムの動作を示すフローチャートである。
【図6】本発明の第2の実施の形態のコンテンツ処理装置を詳細に示すブロック図である。
【図7】本発明の第2の実施の形態のコンテンツ処理方法の流れを示すタイミングチャートである。
【図8】本発明の第2の実施の形態のコンテンツ処理プログラムの動作を示すフローチャートである。
【図9】本発明の第4の実施の形態のコンテンツ配信システムを概略的に示すブロック図である。
【図10】本発明の第4の実施の形態のコンテンツ処理装置を詳細に示すブロック図である。
【発明を実施するための形態】
【0015】
本発明の実施の形態に係るコンテンツ処理装置、コンテンツ処理方法及びコンテンツ処理プログラム、コンテンツ配信システムについて説明する。但し、本発明が以下の実施の形態に限定される訳ではない。また、説明を明確にするため、以下の記載及び図面は、適宜、簡略化されている。
【0016】
<第1の実施の形態>
本実施の形態のコンテンツ処理装置は、図1に示す音声付加コンテンツ配信システムにおいて好適に用いることができる。
【0017】
便宜上、先ず音声付加コンテンツ配信システムの構成を説明する。本実施の形態の音声付加コンテンツ配信システムは、IPネットワークを利用してコンテンツを配信すると共に、当該コンテンツに対するコメントを配信する。但し、図1に示す音声付加コンテンツ配信システムは、IPネットワークに対して視聴者A、Bが接続されているが、視聴者の数はこの限りでない。
【0018】
コンテンツサーバ1は、VODサービス等のコンテンツサービスを配信するサーバであり、視聴者Aの視聴要求によりコンテンツS101を配信する。コンテンツS101は、IPネットワーク2を介して視聴者A宅のコンテンツ処理装置(STB:Set Top Box)4に配信され、当該コンテンツ処理装置4にてコンテンツをデコードし、視聴装置5にて映像・音声が出力される。視聴装置5は通常のテレビ画面でも、パーソナルコンピュータ等のモニタでも構わない。視聴者Aは、モニタ画面を見ながら感想や意見といったコメントをマイク(入力部)6より入力する。コメントには、例えば視覚障害者向けの副音声や放送されていない外国語の吹き替え音声でも良い。
【0019】
コンテンツ処理装置4は、詳細は後述するが、マイク6より入力されたコメント情報(音声情報)をデジタル化し、現在デコード中のコンテンツの時間情報を付加してコンテンツ情報と共にエンコードした後に、IPネットワーク2を通してコメントサーバ3に送信する。すなわち、配信されるコンテンツがMPEG−2 TSである場合には、MPEG−2 TSのAudioストリームもしくはVideoストリームのPTS(Presentation Time Stamp)を時間情報として付加することで、コメントとコンテンツの映像とを同期させることができる。また、コンテンツ情報は配信されたコンテンツが特定できる情報であれば良いため、視聴装置5から再生中のコンテンツ情報(例えば、コンテンツのタイトルであったり、コンテンツの録画開始された時刻情報及びチャンネル情報等)であれば良い。なお、音声情報をデジタル化する際のクロックは、コンテンツをデコードしているクロックを用いることにより、時間情報と同期させることができる。デジタル化されたコメント情報は、非圧縮のままコメントサーバ3に送信しても良いし、圧縮符号化してコメントサーバ3に送信しても良い。また、コメント情報を圧縮符号化する場合には、再生中のコンテンツの音声情報と同じ圧縮符号化方式を用い、同じ圧縮率に符号量制御することにより、コメントサーバ3の処理を簡略化することができる。
【0020】
コメントサーバ3は、視聴者A宅のコンテンツ処理装置4から時間情報等が付加されたコメント情報S102とコンテンツ情報を受信し、コンテンツ情報からコンテンツサーバ1にコンテンツの詳細情報(例えば、コンテンツの録画開始された時刻情報及びチャンネル情報、コンテンツの映像符号化方式及び符号化レートや、音声符号化方式及び符号化レート等の情報)S103を問い合わせし、視聴者A宅のコンテンツ処理装置4から受信したコメント情報S102を、当該コンテンツの詳細情報S103に基づいて、コンテンツS101と同じ音声フォーマットに圧縮し蓄積する。コンテンツサーバ1は、コメントサーバ3のコンテンツ詳細情報問い合わせによって、コンテンツS101にコメント情報があることを記憶する。
【0021】
視聴者B宅のコンテンツ処理装置4からコンテンツサーバ1に対してコンテンツS101の再生要求があると、コンテンツサーバ1は視聴者B宅のコンテンツ処理装置4に視聴者Aのコメントがあることを告知する。コンテンツ処理装置4に視聴者Aのコメントがあることを告知する方法としては、Widget等のアプリケーションを用いて告知したり、視聴装置5の画面にPopUPコメント有り表示を示したりする。また、視聴装置5に表示されたVOD選択画面のGUI(Graphical User Interface)上にコメントがある場合には、その番組表示にコメントがあることが判るようにしておく。
【0022】
視聴者Bからの要求があれば、コンテンツサーバ1がコンテンツS101を配信する際に、コメントサーバ3がコメント情報S104を配信する。視聴者B宅のコンテンツ処理装置4は、コンテンツS101とコメント情報S104を受信してデコードし、コンテンツS101を再生して視聴装置5に出力する。それと共に、視聴者B宅のコンテンツ処理装置4は、コンテンツS101の復号時間情報とコメント情報S104の時間情報とが一致したタイミングでコメント情報S104を視聴装置5に出力する。これにより、視聴者Bは視聴者Aが発言したタイミングでコンテンツに対するコメントを聞くことが可能となる。ちなみに、視聴者Bは、例えばコンテンツ処理装置4が備える、VOD選択画面のGUI上のコメントに連動したボタン(選択部)を視聴者が選択する等の方法でコメントの要求ができる(図示を省略)。
【0023】
このような音声付加コンテンツ配信システムにおいて、本実施の形態のコンテンツ処理装置4は視聴者B宅で用いられる。
コンテンツ処理装置4は、図2に示すように、少なくとも映像再生部42、オーディオ切り替え部44を備える。映像再生部42は、視聴者Bの要求に基づいて、コンテンツサーバ1からIPネットワーク2を介して送信された、コンテンツS101の映像を視聴装置5に出力する。オーディオ切り替え部44は、当該コンテンツS101から分離した音声の時間情報と、視聴者Bの要求に基づいてコメントサーバ3からIPネットワーク2を介して送信された、コメント情報S104の時間情報と、が一致すると、コンテンツS101の音声をコメント情報S104に切り替えて、当該コメント情報S104を視聴装置5に出力する。すなわち、コンテンツ処理装置4には、当該コンテンツ処理装置4に、コンテンツS101の映像を出力する処理と、コンテンツS101から分離した音声の時間情報と、視聴者Bの要求に基づいて送信された、コメント情報S104の時間情報と、が一致すると、コンテンツS101の音声をコメント情報S104に切り替えて、当該コメント情報S104を出力する処理と、を実現させるコンテンツ処理プログラムが格納されている。そして、コンテンツ処理装置4は、当該プログラムに基づいて、上述した処理を実現する。
【0024】
ここで、コメント情報S104(S102)は、上述のように視聴者A宅で視聴されたコンテンツS101の時間情報に基づいて、予め時間情報が与えられた状態でコメントサーバ3に格納されている。そして、コメント情報S104は、視聴者Bの要求に基づいて、コメントサーバ3から視聴者B宅のコンテンツ処理装置4に送信される。このとき、コメント情報S104の時間情報として、コンテンツS101の時間情報、例えば、配信されるコンテンツがMPEG−2 TSである場合には、MPEG−2 TSのAudioストリームもしくはVideoストリームのPTSを時間情報として与えている。
【0025】
このようなコンテンツ処理装置4、コンテンツ処理方法及びコンテンツ処理プログラム、コンテンツ配信システムは、視聴者の要求に基づいて、コンテンツサーバ1から所望のコンテンツを受信するので、コンテンツの視聴時間を視聴者によって自由に選択できる。更に視聴しているコンテンツにコメントが入力されている場合には、発声者(視聴者A)の意図する映像のタイミングで入力されたコメントを視聴者(視聴者B)が聞くことができる。
【0026】
このようなコンテンツ処理装置4は、図3のような構成とされていることが好ましい。すなわち、コンテンツ処理装置4は、IP網を通してさまざまなサービスのデータS400が通信I/F部40に入力される。通信I/F部40は、コンテンツストリームS401を選択して、当該コンテンツストリームS401をストリーム分離部41に入力する。また、通信I/F部40は、TCPプロトコルのメッセージを利用して視聴者に対して、視聴装置5の画面にコメントがあることを示したり、Widget等のアプリケーションを利用して、視聴装置5の画面にコメントの有無を示したりする。
【0027】
ストリーム分離部41は、コンテンツストリームS401のヘッダ情報を解析し、当該コンテンツストリームS401を映像ストリームS402、クロック情報S403、音声ストリームS404に分離する。クロック情報S403は、クロック制御部43に入力される。クロック制御部43は、クロック情報S403に基づいてコンテンツ処理装置4の動作クロックを生成する。映像ストリームS402は、クロック制御部43で生成された映像クロック信号S406に基づいて、ビデオ復号化部(映像再生部)42でデコード(復号化)されて映像信号S405として出力される。また、音声ストリームS404は、クロック制御部43で生成された音声クロック信号S407に基づいて、オーディオ復号化部(オーディオ切り替え部)44でデコードされてオーディオ信号S409として出力される。この時、オーディオ信号S409は、必ずしもオーディオ復号化部44でデコードされなくてもよく、圧縮されたデジタルストリーム例えばAES/EBU規格やSPDIF規格に準拠したフォーマットのオーディオ信号S409として出力しても良い。
【0028】
視聴者Bは、例えばコンテンツ処理装置4が予め備える、VOD選択画面のGUI上のコメントに連動したボタン(選択部)を操作して、コメントの要求を行う。視聴者Bのコメントの要求に基づいて、コンテンツ再生時にコメント情報S412をオーディオ信号S409として出力する際には、通信I/F部40で受信したコメント情報S412をオーディオ復号化部44に入力する。オーディオ復号化部44には、音声ストリームS404とコメント情報S412とが入力される。オーディオ復号化部44は、コメント情報S412をデコードし、当該コメント情報S412のタイムスタンプ(時間情報)が音声ストリームS404と一致すると、当該コメント情報S412をオーディオ信号S409として出力する。
【0029】
ちなみに、CPU(Central Processing Unit)46は、通信I/F部40がさまざまな情報の中からユーザ所望のコンテンツを選択したり、コメント入出力をサーバと通信したりする等のコンテンツ処理装置4全体を制御する。
【0030】
このようなコンテンツ処理装置4を用いて、図4に示すようにコンテンツ処理方法が実現される。
先ず、視聴者B宅のコンテンツ処理装置4からコンテンツサーバ1へコンテンツ視聴要求を出力する(C11)。これにより、コンテンツ処理装置4には、コンテンツサーバ1からコンテンツが配信される(C12)。更にコンテンツ処理装置4には、コンテンツサーバ1から視聴者Aのコメントが蓄積されていることを示す情報が配信される(C13)。視聴者B宅のコンテンツ処理装置4は、受信したコンテンツのデコードを開始すると共に、上述のように例えばWidget等のアプリケーションを利用して、コメントの有無を視聴者Bに伝える。コンテンツ処理装置4は、視聴者Bからのコメント要求を、IPネットワーク2を介してコメントサーバ3に送信する(C14)。これにより、コンテンツ処理装置4には、コメントサーバ3から視聴者Aのコメントが配信される(C15)。コンテンツ処理装置4は、コンテンツから分離した音声の時間情報と、視聴者Aのコメントの時間情報と、が一致すると、コンテンツの音声を視聴者Aのコメントに切り替えて出力する。その結果、視聴者B宅では、コンテンツを視聴すると共に、当該コンテンツと同期するコメントを視聴することが可能となる(C16)。
【0031】
さらに具体的に云うと、コンテンツ処理装置4は、コンテンツ処理プログラムに基づいて、図5に示す処理フローを実現する。
コンテンツ処理装置4の通信I/F部40は、入力されたIPパケットからRTP(Real-time Transport Protocol)/UDP(User Datagram Protocol)パケットヘッダを解析する(F101)。そして、視聴者Bが要求したストリームのみ次のF103の処理に送り、そうでないパケットデータの場合には破棄し、次のパケットデータの処理に移行する(F102)。
【0032】
次に、コンテンツ処理装置4の通信I/F部40は、RTPパケットヘッダ内のシーケンス番号によりパケットデータがコンテンツストリームパケットであるか、コメントパケットであるかを判定する。そして、コンテンツパケットの場合にはF104の処理に移行し、コメントパケットの場合にはF110の処理に移行する(F103)。
【0033】
次に、コンテンツ処理装置4のストリーム分離部41は、TSヘッダ解析を行い、TSパケットの分離情報をビデオパケット(映像パケット)とオーディオパケット(音声パケット)とPCR(Program Clock Reference)などの時間情報に分離する為のPID情報を取得する(F104)。
【0034】
次に、コンテンツ処理装置4のストリーム分離部41は、PID情報からPCR、ビデオパケット、オーディオパケットを分離し、それぞれF106、F107、F110の処理に移る(F105)。
【0035】
コンテンツ処理装置4のクロック制御部43には、PCRが入力される。クロック制御部43は、PCRに基づいて基準クロックを生成する(F106)。ビデオ復号化部42は、分離したビデオデータをデコードしビデオ信号を出力する(F107)。オーディオ復号化部44は、コメント情報と、コンテンツの音声情報とのどちらをデコードするかを選択し(F110)、いずれか一方の情報をデコードし出力する(F108)。
【0036】
<第2の実施の形態>
上記第1の実施の形態のコンテンツ処理装置は、音声付加コンテンツを良好に受信することができる構成とされているが、コンテンツにコメントを入力することができる手段をさらに備えていることが好ましい。
【0037】
即ち、コンテンツ処理装置は、図6に示すように、コメントを入力するマイクなどの入力部6、オーディオ符号化部45を備えることが好ましい。入力部6から入力されるコメント情報S410は、オーディオ符号化部45においてエンコードされたコメント情報S411として通信I/F部40からIPネットワーク2を介してコメントサーバ3に送信される。これにより、コンテンツ処理装置は、単に音声付加コンテンツを受信するだけでなく、当該コンテンツに対してコメントを付加することができる。しかも、再生中のコンテンツに対して意図したタイミングでコメントを付加することができる。
【0038】
オーディオ符号化部45には、現在受信している音声ストリーム情報S408が入力される。オーディオ符号化部45は、音声ストリーム情報S408に基づいてコメント情報S410をエンコード(符号化)する。ここで、音声ストリーム情報S408とは、オーディオ復号化部44でデコードしている音声ストリームの符号化方式情報と、符号化レートと、時間情報(PTS)等である。
【0039】
オーディオ符号化部45は、発声されている状態ではエンコードを続ける。そのため、コンテンツ処理装置から出力される音声などの取り込みを防止するためのエコーキャンセラを搭載することが好ましい。これにより、入力されるコメントをより精度よく入力することが可能となる。
【0040】
このようなコンテンツ処理装置を用いると、図7に示すような音声付加コンテンツ処理方法を実現することができる。なお、図1に示す音声付加コンテンツ処理システムを前提として説明する。
【0041】
先ず、視聴者A宅のコンテンツ処理装置4は、視聴者Aの要求に基づいて、コンテンツサーバ1にコンテンツ視聴要求を出力する(C100)。コンテンツサーバ1は、当該視聴要求に基づいて、所望のコンテンツの配信を視聴者A宅のコンテンツ処理装置4に対して開始する(C101)。
【0042】
次に、視聴者A宅のコンテンツ処理装置4は、コンテンツをデコードし視聴者Aが視聴可能な状態とする(C102)。この時、視聴者Aが視聴中にコメントを発言した際、視聴者A宅のコンテンツ処理装置4の入力部6は当該コメントを取得する。そして、当該コンテンツ処理装置4のオーディオ符号化部45は、コメントに再生中のコンテンツの時間情報を付加してエンコードし、コメントサーバ3に送信する(C103)。
【0043】
次に、コメントサーバ3は、コメントを受信するとコンテンツサーバ1にコメント蓄積通知を送信する(C104)。コンテンツサーバ1は、コメント蓄積通知から当該コンテンツに視聴者Aのコメントが残されたことを管理する。
【0044】
一方、視聴者B宅のコンテンツ処理装置4は、視聴者Bの要求に基づいて、コンテンツサーバ1にコンテンツ視聴要求を出力する(C105)。コンテンツサーバ1は、当該コンテンツ視聴要求に基づいて、所望のコンテンツを視聴者B宅のコンテンツ処理装置4に対して配信する(C106)。更に、コンテンツサーバ1は、視聴者Aのコメントが蓄積されていることを示す情報を視聴者B宅のコンテンツ処理装置4に配信する(C107)。
【0045】
視聴者B宅のコンテンツ処理装置4は、コンテンツを受信しデコードを開始すると共にコメントがあることを視聴者Bに伝える。視聴者B宅のコンテンツ処理装置4は、視聴者Bからのコメント要求を、IPネットワーク2を介してコメントサーバ3に送信する(C108)。これにより、コメントサーバ3は、視聴者B宅のコンテンツ処理装置4にコメントサーバ3からIPネットワーク2を介して視聴者Aのコメントを配信する(C109)。視聴者B宅のコンテンツ処理装置4は、コンテンツから分離した音声の時間情報と、視聴者Aのコメントの時間情報と、が一致すると、コンテンツの音声を視聴者Aのコメントに切り替えて出力する。その結果、視聴者B宅では、コンテンツを視聴すると共に、当該コンテンツと同期するコメントを視聴することが可能となる(C110)。
【0046】
ちなみに、本実施の形態のコンテンツ処理装置4も、コンテンツ処理プログラムに基づいて動作し、第1の実施の形態のコンテンツ処理装置4と略同様に動作する。但し、本実施の形態のコンテンツ処理装置4は、図8に示すように、コメント情報が入力された場合、コンテンツ処理装置4のオーディオ符号化部45が、コメント情報とクロック情報とオーディオ出力時間情報とをエンコードし、通信I/F部40を介してコメントサーバ3に送信する(F109)。
【0047】
<第3の実施の形態>
第1及び第2の実施の形態では、コンテンツの音声をコメントに切り替えて出力しているが、この限りでない。
【0048】
即ち、オーディオ復号化部44は、視聴者B宅のスピーカがサラウンド設定である場合、背面スピーカのチャンネルの出力を音声ストリームからコメント情報に切り替える構成であることが好ましい。これにより、前面スピーカからはコンテンツの音声を聞きつつ、背面スピーカからコメントを聞くことが可能となる。
【0049】
つまり、図1に示すように、視聴者B宅のスピーカがサラウンドの設定である場合には背面スピーカ7よりコメント情報S104をデコードしたコメントS105を出力し、前面スピーカからはコンテンツの音声を出力することが可能となる。これにより、視聴者BはコンテンツS101を視聴しながら、視聴者Aのコメントを楽しむことが可能となる。この時、コメントサーバ3では配信されるコンテンツの音声データが5.1chサラウンド音声もしくは7.1chサラウンド音声といった複数チャンネルの音声の場合、コメント情報を背面チャンネルの圧縮フォーマットに従った符号量に制御する。コンテンツ処理装置4では、背面チャンネル情報をコメント情報に切り替えて出力する。これにより、視聴者Bは背面スピーカ7からコメントS105を聞くことができる。コメントとコンテンツの音声を前後のチャンネルに分割して出力することにより、人間の聴覚特性を利用して、コンテンツそのものの音声と後から付け加えたコメントとを区別することが可能となる。
【0050】
<第4の実施の形態>
第3の実施の形態では、コンテンツサーバ1から配信されたコンテンツに対してコメントを付加するべく、当該コンテンツサーバ1からコンテンツを受信しているが、この限りでない。
【0051】
即ち、本実施の形態のコンテンツ処理装置4は、図9に示す音声付加コンテンツ配信システムにおいて好適に用いられる。当該音声付加コンテンツ配信システムは、図1に示す音声付加コンテンツ配信システムの機能に加えて、放送局8から放送コンテンツが放送されたり、見逃した当該放送コンテンツが配信されたりする構成とされている。
【0052】
図9に示す音声付加コンテンツ配信システムは、放送局8からの放送コンテンツS106が各家庭に放送されると共に、コンテンツサーバ1に放送コンテンツごとに蓄積される。視聴者A宅のコンテンツ処理装置4は、アンテナで放送コンテンツS106を受信し、その後は、上記実施の形態で説明したコンテンツサーバ1からのビデオコンテンツと略同様に、放送コンテンツをデコードし、視聴装置5にて映像・音声を出力する。視聴装置5は通常のTV画面でも、PC等のモニタでも構わない。
【0053】
視聴者Aは、モニタ画面を見ながら感想や意見といったコメントを、入力部(マイク)6より入力する。コメントとしては例えば視覚障害者向けの副音声や放送されていない外国語の吹き替え音声でも良い。視聴者A宅のコンテンツ処理装置4は、オーディオ符号化部45が入力部6より入力されたコメント情報(音声情報)をデジタル化して、さらに現在デコード中の時間情報を付加し放送コンテンツ情報と共にエンコードして、IPネットワーク2を介してコメントサーバ3に送信する。配信されるコンテンツがMPEG−2 TSである場合には、MPEG−2 TSのAudioストリームもしくはVideoストリームのPTSを時間情報として付加することでコメントと映像とを同期させることができる。つまり、放送局8からの放送コンテンツはMPEG−2 TSであるため、第1の実施の形態などと同様に、AudioストリームもしくはVideoストリームのPTSを時間情報として付加する。
また、放送コンテンツ情報は、放送された放送コンテンツが特定できる情報であれば良いため、放送コンテンツのチャンネル情報であれば良い。尚、コメント情報をデジタル化する際のクロックは、放送コンテンツをデコードしているクロックを用いることで、時間情報と同期させる。デジタル化されたコメント情報は、非圧縮のままコメントサーバ3に送信しても良いし、圧縮符号化してコメントサーバ3に送信しても良い。また、コメント情報を圧縮符号化する場合には、放送コンテンツの音声情報と同じ圧縮符号化方式を用い、同じ圧縮率に符号量制御することにより、コメントサーバ3の処理を簡略化することができる。
【0054】
コメントサーバ3は、視聴者A宅のコンテンツ処理装置4から時間情報が付加されたコメント情報と放送コンテンツ情報とを受信してデコードし、コンテンツ情報からコンテンツサーバ1に放送コンテンツの詳細情報を問い合わせし、視聴者A宅のコンテンツ処理装置4から受信したコメント情報を放送コンテンツS106と同じ音声フォーマットに圧縮し蓄積する。
【0055】
コンテンツサーバ1は、コメントサーバ3のコンテンツ詳細情報(S103)問い合わせによって、放送コンテンツS106にコメントがあることを記憶する。コンテンツサーバ1は、VODサービス等のコンテンツサービスを配信するサーバであり、視聴者Bの視聴要求により放送コンテンツS106をビデオコンテンツS101として配信する。視聴者B宅のコンテンツ処理装置4からコンテンツサーバ1に対してビデオコンテンツS101(放送コンテンツS106)の再生要求があると、コンテンツサーバ1は視聴者B宅のコンテンツ処理装置4に視聴者Aのコメントがあることを告知する。視聴者Bからの要求があれば、コンテンツサーバ1がビデオコンテンツS101を配信する際に、コメントサーバがコメント情報S104を配信する。
【0056】
視聴者B宅のコンテンツ処理装置4は、上記実施の形態と同様に、ビデオコンテンツS101とコメント情報S104とを受信し、ビデオコンテンツS101を再生し視聴装置5に出力すると共に、ビデオコンテンツS101の復号時間情報とコメント情報S104の時間情報とが一致したタイミングで、コメント情報S104を視聴装置5に出力する。これにより、視聴者Bは、視聴者Aが放送局8から受信してコメントを残した放送コンテンツS106を、所望のタイミングで視聴することができ、しかも視聴者Aが意図したタイミングでコメントを聞くことが可能となる。
勿論、視聴者Bは、コンテンツ処理装置4を用いて当該放送コンテンツに対してコメントを付加することもできる。
【0057】
本実施の形態のコンテンツ処理装置について図10を用いて動作を説明する。放送局8からの放送S106を受信する放送受信部47で視聴者が選択した放送チャンネルのストリームS414を出力する。ストリーム分離部41は、ビデオストリームS402とクロック情報S403とオーディオS404とに分離する。ビデオ復号化部42は、映像ストリームS402を復号し、ビデオ信号S405を出力する。オーディオ復号化部44は、オーディストリームS404を復号し、オーディオ信号S409を出力すると共に、オーディオ符号化方式や符号化レートなどのオーディオ符号化情報S408を出力する。クロック制御部43は、クロック情報S403に基づいて基準クロックを生成し、ビデオ信号とオーディオ信号の出力タイミングを合わせると共に、オーディオ符号化部45に符号化したコメントデータの時間情報を出力させる。
【0058】
本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
【符号の説明】
【0059】
1 コンテンツサーバ
2 IPネットワーク
3 コメントサーバ
4 コンテンツ処理装置
5 視聴装置
6 入力部(マイク)
7 背面スピーカ
8 放送局
40 通信I/F部
41 ストリーム分離部
42 ビデオ復号化部(映像再生部)
43 クロック制御部
44 オーディオ復号化部
45 オーディオ符号化部
46 CPU
47 放送受信部

【特許請求の範囲】
【請求項1】
コンテンツを配信すると共に、前記コンテンツに対するコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理装置であって、
前記コンテンツの映像を出力する映像再生手段と、
前記コンテンツから分離した音声の時間情報と、前記コンテンツの時間情報に基づいて予め与えられ、ユーザの要求に基づいて受信した前記コメントの時間情報と、が一致すると、前記コンテンツの音声を前記コメントに切り替えて出力するオーディオ切り替え手段と、
を備えるコンテンツ処理装置。
【請求項2】
前記コンテンツの再生中にユーザがコメントを入力する入力手段と、
前記再生中のコンテンツから分離した音声の時間情報及び前記再生中のコンテンツのオーディオ符号化方式情報に基づいて、前記コメントを符号化するオーディオ符号化手段と、
前記ユーザのコメントをコメントサーバに送信する送信手段と、
をさらに備えることを特徴とする請求項1に記載のコンテンツ処理装置。
【請求項3】
放送局から放送コンテンツを受信する放送コンテンツ受信手段と、前記コンテンツサーバからネットワークを介してビデオコンテンツを受信するビデオコンテンツ受信手段と、をさらに備え、
前記映像再生手段は、前記受信した放送コンテンツの映像、又は前記受信したビデオコンテンツの映像を再生し、
前記オーディオ符号化手段は、前記再生中の放送コンテンツ又はビデオコンテンツから分離した音声の時間情報及び前記再生中の放送コンテンツ又はビデオコンテンツのオーディオ符号化方式情報に基づいて、前記コメントを符号化することを特徴とする請求項1又は2に記載のコンテンツ処理装置。
【請求項4】
前記ビデオコンテンツ受信手段は、前記ビデオコンテンツとして前記コンテンツサーバに蓄積された放送コンテンツを、ユーザの要求に基づいて受信することを特徴とする請求項3に記載のコンテンツ処理装置。
【請求項5】
前記オーディオ符号化手段は、前記入力手段から入力されたコメントに対して、前記ビデオコンテンツのオーディオ情報のリアチャンネルに相当する符号量に従った符号化を行うことを特徴とする請求項2又は3に記載のコンテンツ処理装置。
【請求項6】
請求項1乃至5のいずれか1項に記載のコンテンツ処理装置を備えるコンテンツ配信システム。
【請求項7】
コンテンツを配信すると共に、前記コンテンツに対するコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理方法であって、
前記コンテンツの映像を出力する映像再生工程と、
前記コンテンツから分離した音声の時間情報と、前記コンテンツの時間情報に基づいて予め与えられ、ユーザの要求に基づいて受信した前記コメントの時間情報と、が一致すると、前記コンテンツの音声を前記コメントに切り替えて出力するオーディオ切り替え工程と、
を備えるコンテンツ処理方法。
【請求項8】
前記コンテンツの再生中にユーザがコメントを入力する入力工程と、
前記再生中のコンテンツから分離した音声の時間情報及び前記再生中のコンテンツのオーディオ符号化方式情報に基づいて、前記コメントを符号化するオーディオ符号化工程と、
前記ユーザのコメントをコメントサーバに送信する送信工程と、
をさらに備えることを特徴とする請求項7に記載のコンテンツ処理方法。
【請求項9】
前記映像再生工程では、放送局から受信した放送コンテンツの映像、又はコンテンツサーバからネットワークを介して受信したビデオコンテンツの映像を再生し、
前記オーディオ符号化工程では、前記再生中の放送コンテンツ又はビデオコンテンツから分離した音声の時間情報及び前記再生中の放送コンテンツ又はビデオコンテンツのオーディオ符号化方式情報に基づいて、前記コメントを符号化することを特徴とする請求項7又は8に記載のコンテンツ処理方法。
【請求項10】
前記映像再生工程では、ユーザの要求に基づいて受信した、前記ビデオコンテンツとして前記コンテンツサーバに蓄積された放送コンテンツの映像を再生することを特徴とする請求項9に記載のコンテンツ処理方法。
【請求項11】
前記オーディオ符号化工程では、前記ユーザが入力したコメントに対して、前記ビデオコンテンツのオーディオ情報のリアチャンネルに相当する符号量に従った符号化を行うことを特徴とする請求項8又は9に記載のコンテンツ処理方法。
【請求項12】
コンテンツを配信すると共に、前記コンテンツに対するコメントを配信する音声付加コンテンツ配信サービスを実現するコンテンツ処理プログラムであって、
コンテンツ処理装置に、
前記コンテンツの映像を出力する映像再生処理と、
前記コンテンツから分離した音声の時間情報と、前記コンテンツの時間情報に基づいて予め与えられ、ユーザの要求に基づいて受信した前記コメントの時間情報と、が一致すると、前記コンテンツの音声を前記コメントに切り替えて出力するオーディオ切り替え処理と、
を実現させるコンテンツ処理プログラム。
【請求項13】
前記コンテンツの再生中にユーザがコメントを入力する入力処理と、
前記再生中のコンテンツから分離した音声の時間情報及び前記再生中のコンテンツのオーディオ符号化方式情報に基づいて、前記コメントを符号化するオーディオ符号化処理と、
前記ユーザのコメントをコメントサーバに送信する送信処理と、
をさらに実現させることを特徴とする請求項12に記載のコンテンツ処理プログラム。
【請求項14】
前記映像再生処理では、放送局から受信した放送コンテンツの映像、又はコンテンツサーバからネットワークを介して受信したビデオコンテンツの映像を再生させ、
前記オーディオ符号化処理では、前記再生中の放送コンテンツ又はビデオコンテンツから分離した音声の時間情報及び前記再生中の放送コンテンツ又はビデオコンテンツのオーディオ符号化方式情報に基づいて、前記コメントを符号化させることを特徴とする請求項12又は13に記載のコンテンツ処理プログラム。
【請求項15】
前記映像再生処理では、ユーザの要求に基づいて受信した、前記ビデオコンテンツとして前記コンテンツサーバに蓄積された放送コンテンツの映像を再生させることを特徴とする請求項14に記載のコンテンツ処理プログラム。
【請求項16】
前記オーディオ符号化処理では、前記ユーザが入力したコメントに対して、前記ビデオコンテンツのオーディオ情報のリアチャンネルに相当する符号量に従った符号化を行わせることを特徴とする請求項13又は14に記載のコンテンツ処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−23811(P2011−23811A)
【公開日】平成23年2月3日(2011.2.3)
【国際特許分類】
【出願番号】特願2009−164815(P2009−164815)
【出願日】平成21年7月13日(2009.7.13)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】