説明

映像音声再生システム及び配信装置

【課題】映像と音声とを容易に同期させることができる映像音声再生システム及び配信装置を提供する。
【解決手段】映像音声再生システムは、映像再生用の映像データと音声再生用の音声データとを配信する配信装置と、配信された前記映像データを処理して映像として表示する映像表示装置と、配信された前記音声データを処理して音声として出力する音声出力装置と、を備え、前記配信装置は、同期調整用のテストコンテンツとしての、判定用音声の前記音声データと、前記判定用音声が出力されるべきタイミングを視覚的に判断可能な判定用映像の前記映像データと、を配信する、ものとして構成されており、前記配信装置と前記音声出力装置の少なくとも何れかは、前記判定用映像における前記タイミングで前記判定用音声が出力されるように、前記音声出力装置からの出力を遅延させる、ものとして構成されている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像音声再生システム及び配信装置に関する。
【背景技術】
【0002】
従来、デジタル放送やIP(Internet Protocol)放送では、受信信号をSTB(Set Top Box)やデジタルテレビに内蔵されているチューナによって復調して、TS(Transport Stream)を得ている。TSには、映像、音声やEPG(Electronic Program Guide)などの、データの種類に対応したPID(Packet ID)が割り振られている。TSはデジタルテレビ内で復号処理され、復号処理された信号は、このPIDに基づきデータの種類に応じてディスプレイと内蔵スピーカの何れかへ出力される。一般的に、映像データの表示処理には音声データの出力処理よりも長い時間が必要である。そこで、表示される映像と出力される音声との間に時間差が生じない様に、デジタルテレビ内において映像と音声の同期をとっている。
【0003】
近年では、画質及び音質に対する視聴者の要求は高まり、デジタルテレビにおいても高画質化及び高音質化が要求されている。特に、音質に関しては、デジタルテレビの内蔵スピーカは、市販されている高級アンプとスピーカに比べ、音質が劣る。また、デジタルテレビのみで5.1chや7.1chといったサラウンドシステムに対応することは困難である。これらの理由から、デジタルテレビの外部にデジタルオーディオシステムを接続することが行われている。従来、このようにデジタルテレビに接続して用いられるデジタルオーディオシステムでは、デジタルテレビからのES(Elementary Stream)又は復号後のPCM(Pulse Code Modulation)をオーディオアンプで受け、ESであれば復号して、スピーカへ出力している。
【0004】
一方、高画質化及び高音質化を達成できるホームサーバシステム(映像音声再生システム)が提案されている。ホームサーバシステムは、デジタル放送やIP放送などのデジタルコンテンツをホームサーバで受信し、蓄積し、復号化し、映像はディスプレイ(例えばデジタルテレビ)により表示し、音声はオーディオシステムのスピーカから出力するものである。
【0005】
しかしながら、この様なホームサーバシステムにおいては、映像データを表示処理するディスプレイと音声データを出力処理するオーディオシステムとが別々の機器であり、各機器が独立した処理を行う。そのため、映像データと音声データを同期させてサーバから配信しても、ディスプレイに表示される映像とオーディオシステムから出力される音声とを同期させることができず、視聴者に違和感を与えていた。
【0006】
なお、複数のAV機器をネットワークを介して接続し、テレビ等で映像を表示し、オーディオシステムで音声を出力するシステムにおいて、映像と音声とを同期させる技術が知られている(特許文献1参照)。しかし、この技術では、ネットワークにおける遅延時間が刻々と変化する状況下で映像と音声とを同期させるために、機器間の相互間通信や特殊なオーディオシステムが必要となる。また、機器間の通信が多くなるため、音声等の出力に時間がかかる。
【特許文献1】特開2008−136027号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明の目的は、映像と音声とを容易に同期させることができる映像音声再生システム及び配信装置を提供することにある。
【課題を解決するための手段】
【0008】
本願発明の一態様によれば、映像再生用の映像データを映像表示装置に配信し、音声再生用の音声データを音声出力装置に配信する、配信装置であって、前記音声データの配信を遅延させる、音声配信遅延部を備え、同期調整用のテストコンテンツとしての、判定用音声の前記音声データと、前記判定用音声が前記音声出力装置から出力されるべきタイミングを視覚的に判断可能な、前記映像表示装置に表示される判定用映像の前記映像データと、を配信する、ものとして構成されている、ことを特徴とする、配信装置が提供される。
【0009】
また、本願発明の他の一態様によれば、映像再生用の映像データと音声再生用の音声データとを配信する配信装置と、配信された前記映像データを処理して映像として表示する映像表示装置と、配信された前記音声データを処理して音声として出力する音声出力装置と、を備え、前記配信装置は、同期調整用のテストコンテンツとしての、判定用音声の前記音声データと、前記判定用音声が出力されるべきタイミングを視覚的に判断可能な判定用映像の前記映像データと、を配信する、ものとして構成されており、前記配信装置と前記音声出力装置の少なくとも何れかは、前記判定用映像における前記タイミングで前記判定用音声が出力されるように、前記音声出力装置からの出力を遅延させる、ものとして構成されている、ことを特徴とする、映像音声再生システムが提供される。
【発明の効果】
【0010】
本発明によれば、映像と音声とを容易に同期させることができる映像音声再生システム及び配信装置を提供できる。
【発明を実施するための最良の形態】
【0011】
以下に、図面を参照して本発明の実施形態について説明する。これらの実施形態は、本発明を限定するものではない。
【0012】
以下の実施形態では、デジタル放送を受信する一例について説明する。
【0013】
(第1の実施形態)
図1から図4を参照して本発明の第1の実施形態について説明する。本実施形態は、判定用音声が出力されるべきタイミングを視覚的に判断可能な判定用映像を含むテストコンテンツを再生して、判定用映像の表示と判定用音声の出力とのタイミングのずれに基づいて映像データと音声データの遅延時間を調節するようにしたものである。
【0014】
まず、本実施形態に係る映像音声再生システムの構成について説明する。図1に示す様に、映像音声再生システムは、サーバ10(配信装置)と、ディスプレイ11(映像表示装置)と、オーディオシステム12(音声出力装置)と、を備える。
【0015】
サーバ10は、デジタル放送やIP放送などのデジタルコンテンツを受信し、復調し、蓄積するものである。それと共に、蓄積されているデータを復号し、復号された映像再生用の映像データをディスプレイ11に配信し、復号された音声再生用の音声データをオーディオシステム12に配信するものである。
【0016】
ディスプレイ11は、配信された映像データを処理して映像として表示するものである。
【0017】
オーディオシステム12は、配信された音声データをオーディオアンプ13で処理して、スピーカ14〜18から音声として出力するものである。
【0018】
ディスプレイ11は、例えば壁に掛けられて設置される事が想定される。そこで、ここでは、サーバ10とディスプレイ11は無線接続されるものとする。サーバ10とオーディオシステム12のオーディオアンプ13は有線接続されるものとする。
【0019】
次に、図2を参照して、サーバ10についてより詳しく説明する。図2は、サーバ10のブロック図である。
【0020】
まず、データ蓄積部20に蓄積されているデータ(TS:Transport Stream)は、デマルチプレックス部21によって音声符号データと映像符号データとに分けられる。音声符号データは音声符号データ蓄積部22に蓄積され、映像符号データは映像符号データ蓄積部25に蓄積される。
【0021】
音声復号部23は音声符号データを復号化し、映像復号部26は映像符号データを復号化する。復号化された音声データは音声出力データ蓄積部24に蓄積され、復号化された映像データは映像出力データ蓄積部27に蓄積される。
【0022】
同期制御部28は、音声符号データと映像符号データに付加されている時間情報(PTS:Presentation Time Stamp)に基づき、音声出力データ蓄積部24と映像出力データ蓄積部27を制御して、音声データと映像データが出力されるタイミングを制御する。これにより、音声データと映像データは同期を保った状態でオーディオシステム12やディスプレイ11に配信される。
【0023】
また、同期制御部28は、音声出力データ蓄積部24と、映像出力データ蓄積部27と、音声符号データ蓄積部22と、映像符号データ蓄積部25とに、遅延時間を設定することもできる。
【0024】
音声出力データ蓄積部24と映像出力データ蓄積部27の制御は、データの出力を遅延時間分だけ遅らせることで行う。
【0025】
音声符号データ蓄積部22と映像符号データ蓄積部25の制御は、同様に、データの出力を遅延時間分だけ遅らせることで行う。また、音声出力データ蓄積部24や映像出力データ蓄積部27に出力可能なデータが無くなり音声や映像が途切れることを防いだり、音声出力データ蓄積部24と映像出力データ蓄積部27の容量をなるべく小さくしたりするために、音声出力データ蓄積部24や映像出力データ蓄積部27のデータ占有量により制御しても良い。つまり、音声出力データ蓄積部24や映像出力データ蓄積部27の残りのデータが所定の下限の閾値よりも少なくなると復号化を開始し、所定の上限の閾値よりも多くなると復号化を停止する様に制御しても良い。
【0026】
このようにして、音声符号データ蓄積部22と音声出力データ蓄積部24(音声配信遅延部)は、オーディオシステム12への音声データの配信を遅延させることができる。また、映像符号データ蓄積部25と映像出力データ蓄積部27(映像配信遅延部)は、ディスプレイ11への映像データの配信を遅延させることができる。
【0027】
なお、必要な遅延時間の長さと、音声出力データ蓄積部24と映像出力データ蓄積部27の容量と、により、音声符号データ蓄積部22と映像符号データ蓄積部25とにおいて遅延時間の設定を行うか否かをシステム単位で切り替える様にしても良い。
【0028】
次に、映像コンテンツと音声コンテンツの同期調整の方法について説明する。同期調整は、ディスプレイ11とオーディオシステム12の設置位置を確定した後に行う。また、オーディオシステム12においては、視聴者が音声を聞く位置を予めリスニングポイントとして設定し、各スピーカ14〜18から視聴者へ届く音声の遅延などを調整しておく。
【0029】
同期調整は、予め用意されている同期調整用のテストコンテンツを、サーバ10からディスプレイ11とオーディオシステム12とに配信し、再生させて行う。このテストコンテンツは、サーバ10に備えられている記憶装置に記憶しておいても良く、記録媒体から読み出しても良く、デジタル放送等の受信信号に含まれていても良い。
【0030】
次に、テストコンテンツについて説明する。テストコンテンツの映像コンテンツは、音声コンテンツとの同期がとれているか否かを容易に判断できるように、判定用音声がスピーカ14〜18から出力されるべきタイミングを視覚的に判断可能な判定用映像を含むものとする。
【0031】
例えば、図3に示すように、ディスプレイ11の画面の右から左へ音符30〜32が流れ、各々の音符30〜32がポイントAに達する毎に判定用音声が出力されるべきタイミングを示すような判定用映像を含む映像コンテンツとする。つまり、このテストコンテンツは、同期がとれている場合には、各々の音符30〜32がポイントAに達するタイミング毎に判定用音声が視聴者に聞こえるものである。なお、映像コンテンツは、この判定用音声が出力されるべきタイミングにおいて、判定用映像に明度変化をもたせたものでも良い。
【0032】
テストコンテンツのデータ形式は、例えばデジタル放送の受信を想定して、図4に示すようにTSパケット構成とする。同図において、Vnは映像コンテンツのTSパケット(n番目のピクチャ)を表す。Anは音声コンテンツのTSパケット(n番目のフレーム)を表す。そして、判定用音声が出力されるべきタイミングでの判定用映像のピクチャにおけるTSパケット(例えばV1)と、その判定用音声のフレームにおけるTSパケット(例えばA1)とに、PTSなどの同一の時間情報(例えばT1)を埋め込んでおく。
【0033】
サーバ10は、テストコンテンツに含まれている映像コンテンツの映像符号データと音声コンテンツの音声符号データを復号化する。そして、復号した映像データや音声データをPTSに従ったタイミングでディスプレイ11やオーディオシステム12に配信する。つまり、同一のPTSを有する映像データと音声データを同時に配信する。
【0034】
視聴者はディスプレイ11を見ながら、ポイントAに音符30が到達したタイミングで上記判定用音声が聞こえるように、サーバ10に遅延時間を設定して同期をとる。例えば、視聴者は、ポイントAに音符30が到達する前に判定用音声が聞こえた場合には、音声の遅延時間を長く設定する。また、視聴者は、ポイントAに音符30が到達した後に判定用音声が聞こえた場合には、映像の遅延時間を長く設定する。この調節を繰り返すことにより、リスニングポイントにおいて視聴者に届く判定用映像と判定用音声とを同期させることができる。その結果、デジタル放送等を受信する場合においても映像と音声とを同期させることができるので、視聴者に違和感を与えることがなくなる。
【0035】
以上で説明した様に、本実施形態によれば、判定用音声が出力されるべきタイミングを視覚的に判断可能な判定用映像を含むテストコンテンツを再生するようにしたので、視聴者は、映像音声再生システムが有する、判定用映像の表示と判定用音声の出力とのタイミングのずれを把握できる。このタイミングのずれに基づいて、サーバ10から映像データや音声データを配信する際の遅延時間を調節できるので、映像と音声の同期調整を高精度且つ容易に行える。
【0036】
また、サーバ10において遅延時間を調整する様にしたので、既存のデジタルテレビやオーディオシステム12をそのまま用いることができる。
【0037】
また、ディスプレイ11は映像出力機能のみを有しているものでも良い。つまり、デジタルテレビの様な音声コンテンツ処理機能やデマルチプレックス機能を実装していなくても良い。
【0038】
さらに、復号前のデータを扱う音声符号データ蓄積部22や映像符号データ蓄積部25においても遅延時間を設定できるので、復号後のデータを扱う音声出力データ蓄積部24や映像出力データ蓄積部27のみで遅延時間を設定する場合よりも、これらの全体の容量を削減できる。
【0039】
なお、本実施形態において、サーバ10における遅延時間の調整に加え、ディスプレイ11とオーディオシステム12の少なくとも何れかにおいても遅延時間を調整できるようにしても良い。
【0040】
この場合、既存のディスプレイ11やオーディオシステム12が遅延時間調整機能を有していれば、これら既存の装置に手を加えることなく同期調整できる。また、サーバ10においても遅延時間を調整できるので、ディスプレイ11とオーディオシステム12において設定すべき遅延時間は短くて良い。つまり、ディスプレイ11とオーディオシステム12で必要とされる遅延用のバッファはサイズが小さいもので良い。
【0041】
さらに、本実施形態においては、サーバ10とオーディオシステム12の少なくとも何れかにおいて遅延時間が調整できれば良い。つまり、サーバ10においては遅延時間を調整できる様にせず、オーディオシステム12のみ、又は、オーディオシステム12及びディスプレイ11において遅延時間を調整できる様に構成しても良い。この場合にも、既存のディスプレイ11やオーディオシステム12が遅延時間調整機能を有していれば、これら既存の装置に手を加えることなく同期調整できる。
【0042】
(第2の実施形態)
次に、図5から図7を参照して本発明の第2の実施形態について説明する。本実施形態では、音声センサ50と光センサ51を用いてテストコンテンツの判定用音声と判定用映像を検知し、サーバ10は、判定用映像が検知された時刻と判定用音声が検知された時刻との差が短くなるように映像データと音声データの遅延時間を調節するようにしている点が、第1の実施形態と異なる。
【0043】
図5に示す様に、本実施形態に係る映像音声再生システムは、サーバ10に接続されている音声センサ50と光センサ51を備える。その他の構成は、第1の実施形態と同一であるため、詳細な説明を省略する。
【0044】
また、テストコンテンツの判定用映像は、第1の実施形態において説明した様に、判定用音声が出力されるべきタイミングにおいて明度変化を伴うものである。
【0045】
音声遅延時間の算出方法について、図6を参照して説明する。サーバ10からオーディオシステム12に判定用音声の音声データが配信される時刻をt1とし、スピーカ14〜18から出力される判定用音声を音声センサ50が検知する時刻をt1’aとする。サーバ10は、t1’a−tを計算して音声遅延時間t1adを得る。
【0046】
映像遅延時間の算出方法について、図7を参照して説明する。サーバ10からディスプレイ11に判定用映像の映像データが配信される時刻をt1とし、ディスプレイ11に表示される判定用映像の明度変化を光センサ51が検知する時刻をt1’vとする。そして、サーバ10はt1’v−tを計算して映像遅延時間t1vdを得る。
【0047】
次に、サーバ10は、音声遅延時間t1adと映像遅延時間t1vdとの差分遅延時間t1dを計算する。そして、サーバ10は、差分遅延時間t1dが短くなる様に、音声符号データ蓄積部22と音声出力データ蓄積部24、または、映像符号データ蓄積部25と映像出力データ蓄積部27における遅延時間を制御する。これにより、サーバ10は、ディスプレイ11とオーディオシステム12への映像データと音声データの配信タイミングの調整を行う。
【0048】
例えば、音声遅延時間t1adが映像遅延時間t1vdよりも短い場合、サーバ10は差分遅延時間t1dだけ音声データの遅延時間を長くし、その配信タイミングを遅くする。
【0049】
一方、音声遅延時間t1adが映像遅延時間t1vdよりも長い場合、サーバ10は差分遅延時間t1dだけ映像データの遅延時間を長くし、その配信タイミングを遅くする。
【0050】
これにより、音声遅延時間t1adと映像遅延時間t1vdとをほぼ等しくできるので、視聴者に届く映像と音声とを同期させることができる。
【0051】
以上で説明した様に、本実施形態によれば、音声センサ50と光センサ51によってテストコンテンツの判定用映像と判定用音声を検知し、サーバ10が、判定用映像が検知された時刻と判定用音声が検知された時刻との差が短くなるように映像データと音声データの遅延時間を調節するようにしたので、映像と音声との同期調整が自動的に行える。
【0052】
なお、サーバ10は、計算した遅延時間に基づいて、ディスプレイ11とオーディオシステム12において遅延時間を調整する様に構成しても良い。
【0053】
以上、本発明の実施形態を詳述してきたが、具体的な構成は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で種々に変形して実施することができる。
【0054】
例えば、上記実施形態ではサーバがデジタル放送を受信する場合について説明したが、IP放送などを受信する場合にも本発明を適用できる。また、サーバは映像データと音声データを配信する装置であれば良く、例えばDVDプレーヤーなどでも良い。
【0055】
また、上記実施形態ではサーバは映像データと音声データの配信を遅延するものとして説明したが、少なくとも音声データの配信を遅延できれば良い。
【0056】
また、サーバとディスプレイは有線接続されても良い。また、サーバとオーディオシステムは無線接続されても良い。
【図面の簡単な説明】
【0057】
【図1】本発明の第1の実施形態に係る映像音声再生システムの全体構成図である。
【図2】本発明の第1の実施形態に係るサーバのブロック図である。
【図3】本発明の第1の実施形態に係るテストコンテンツの説明図である。
【図4】本発明の第1の実施形態に係るテストコンテンツのデータ形式を表す模式図である。
【図5】本発明の第2の実施形態に係る映像音声再生システムの全体構成図である。
【図6】本発明の第2の実施形態に係る音声遅延時間の算出方法の説明図である。
【図7】本発明の第2の実施形態に係る映像遅延時間の算出方法の説明図である。
【符号の説明】
【0058】
10 サーバ
11 ディスプレイ
12 オーディオシステム
13 オーディオアンプ
14〜18 スピーカ
20 データ蓄積部
21 デマルチプレックス部
22 音声符号データ蓄積部
23 音声復号部
24 音声出力データ蓄積部
25 映像符号データ蓄積部
26 映像復号部
27 映像出力データ蓄積部
28 同期制御部
50 音声センサ
51 光センサ

【特許請求の範囲】
【請求項1】
映像再生用の映像データを映像表示装置に配信し、音声再生用の音声データを音声出力装置に配信する、配信装置であって、
前記音声データの配信を遅延させる、音声配信遅延部を備え、
同期調整用のテストコンテンツとしての、
判定用音声の前記音声データと、
前記判定用音声が前記音声出力装置から出力されるべきタイミングを視覚的に判断可能な、前記映像表示装置に表示される判定用映像の前記映像データと、
を配信する、
ものとして構成されている、ことを特徴とする、配信装置。
【請求項2】
前記映像データの配信を遅延させる、映像配信遅延部を更に備えることを特徴とする、請求項1に記載の配信装置。
【請求項3】
前記判定用映像は、前記判定用音声が出力されるべき前記タイミングにおいて明度変化を伴うものであることを特徴とする、請求項2に記載の配信装置。
【請求項4】
光センサと、
音センサと、を更に備え、
前記判定用映像の前記映像データを配信した時刻と、前記光センサが前記判定用映像の前記明度変化を検知した時刻と、の差としての映像遅延時間と、
前記判定用音声の前記音声データを配信した時刻と、前記音センサが前記判定用音声を検知した時刻と、の差としての音声遅延時間と、
を計算し、
前記映像遅延時間と前記音声遅延時間との差が短くなる様に、前記音声配信遅延部または前記映像配信遅延部を制御する、
ものとして構成されている、ことを特徴とする、請求項3に記載の配信装置。
【請求項5】
映像再生用の映像データと音声再生用の音声データとを配信する配信装置と、
配信された前記映像データを処理して映像として表示する映像表示装置と、
配信された前記音声データを処理して音声として出力する音声出力装置と、
を備え、
前記配信装置は、
同期調整用のテストコンテンツとしての、
判定用音声の前記音声データと、
前記判定用音声が出力されるべきタイミングを視覚的に判断可能な判定用映像の前記映像データと、
を配信する、
ものとして構成されており、
前記配信装置と前記音声出力装置の少なくとも何れかは、
前記判定用映像における前記タイミングで前記判定用音声が出力されるように、前記音声出力装置からの出力を遅延させる、
ものとして構成されている、
ことを特徴とする、映像音声再生システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2010−154249(P2010−154249A)
【公開日】平成22年7月8日(2010.7.8)
【国際特許分類】
【出願番号】特願2008−330437(P2008−330437)
【出願日】平成20年12月25日(2008.12.25)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】