説明

同期再生装置

【課題】映像再生装置と音声再生装置が別々にネットワークに接続されているようなシステム構成の下、映像と音声の同期を可能とする。
【解決手段】音声再生装置3側に設けられ、コンテンツデータの音声をデコードするデコーダ36と、デコーダ36によるデコードのタイミングを制御する音声側クロック信号を、ネットワーク4を通じて映像再生装置2側に送信する同期制御部32と、映像再生装置2側に設けられ、コンテンツデータの映像をデコードするデコーダ26と、映像再生装置2側に設けられ、音声再生装置3側から送信された音声側クロック信号に応じて、デコーダ26によるデコードのカウント値を調整する同期制御部22とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワーク上にある別々の映像再生装置と音声再生装置を使って映像と音声とが組み合わされたストリームを再生する場合に、映像と音声との同期を取る同期再生装置に関する。
【背景技術】
【0002】
近年にあっては、MPEG(Moving Picture Expert Group)などのデジタル圧縮技術により高品位な映像と音声を少ないデータ量で保存したり、限られた帯域のネットワーク通信路を介して伝送するといったことが可能になってきている。
【0003】
また、一般家庭においては、Ethernet(登録商標)等の普及により、特別な設備を導入せずとも手軽にネットワークが構築できる環境になっている。
上記のような背景からLAN(Local Area Network)を経由した映像や音楽の視聴といった利用のされ方が増えつつある。
【0004】
ところで、LANを経由してサーバーに蓄積されたコンテンツを視聴しようとした場合、一般的には、再生装置において、ある程度サーバーからのMPEGデータを受信バッファに蓄積した後、デコーダのクロックを基準にMPEGデコードとデコード結果の出力を行い、バッファが少なくなるとクライアントである再生装置側からサーバーへMPEGデータを取りに行き、受信バッファへ補充するということを繰り返す。
【0005】
従来こういったネットワーク経由での視聴は、映像と音声がマルチプレックスされたストリームを単一の再生装置で受信し再生するか、又はRTP(ReaI−timeTransport Protocol)に代表されるような音声と映像が別々に伝送されるストリームを映像と音声を同時にデコードできる単一の再生装置で受信し再生する構成が主流であった(例えば、特許文献1)。
【特許文献1】特開2005−102192号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した特許文献1に開示された従来の装置では、映像と音声がマルチプレックスされたストリームでありながらも、単一の再生装置で映像と音声を再生する構成であることから、映像と音声との両方をデコードできる能力が必要となる。一般的なMPEG2等の符号化方式で符号化された映像音声であればこのような装置でも問題はない。しかし、近年は、符号化技術の向上により多様な圧縮方式が開発されており、特に音声に関しては、MPEG2の他、MP3(MPEG Audio Layer−3)、AAC(Advanced Audio Coding)、AC−3(Audio Code number 3)(登録商標)等多くの符号化方式が存在する。したがって、単一の再生装置に、上記したような多様な符号化方式で符号化された音声をデコードする能力がないと、映像は再生できるが音声は再生されないといったケースが生じてしまう場合がある。
【0007】
また、単一の再生装置が音声をデコードする能力を有していたとしても、デコード後のアナログ的な性能の面で、より高音質な音声再生を実現できる音声再生装置をユーザーが所有していた場合、音声はこの音声再生装置で再生したいというニーズもある。
【0008】
上記のような問題を解決する一手法として、LANなどのネットワークを経由して音声のデータを音声再生装置に供給し、単一の再生装置(映像再生装置)では映像を再生し、音声は音声再生装置で再生する方法が考えられる。
このような手法を実現する場合、映像と音声の同期を取らなければならないという課題が発生する。
【0009】
すなわち、従来、LANなどのネットワークを経由して、映像と音声を別々の機器で受信し再生した場合、受信の際のバッファ量の違いによる遅延時間の違いとデコーダ内での遅延時間が個別のデコーダに依存することから同時にスタートしても同期関係は、全く保障されていなかった。
【0010】
また、従来の装置では、それぞれの再生装置でそれぞれのクロック発信器に従って各々デコードされるため、再生クロック自体がエンコーダ側のクロックと同期しておらず、各デコーダにおけるクロック発信器の誤差分だけ徐々に映像と音声のズレが発生していってしまうという課題があった。
【0011】
そこで、本発明は、上記課題を解決するものであり、映像再生装置と音声再生装置が別々にネットワークに接続されているようなシステム構成の下、映像と音声との同期再生を可能とする同期再生装置を提供することを目的とする。
【課題を解決するための手段】
【0012】
そこで上記課題を解決するために本発明は、下記の装置を提供するものである。
(1)コンテンツデータに含まれる映像データと音声データとを、ネットワーク上に独立して配置される映像再生装置及び音声再生装置を用いてそれぞれ独立して再生させる場合に、前記映像再生装置による前記映像データの再生と前記音声再生装置による音声データの再生とを同期させる同期再生装置であって、
前記音声再生装置側に設けられ、前記コンテンツデータの音声データをデコードする音声デコード手段と、
前記音声再生装置側に設けられ、前記音声デコード手段によるデコード結果である音声信号を出力すべきタイミングの制御値を、音声側同期信号として前記ネットワークを通じて前記映像再生装置側に送信する音声側同期制御部と、
前記映像再生装置側に設けられ、前記コンテンツデータの映像データをデコードする映像デコード手段と、
前記映像再生装置側に設けられ、前記音声再生装置側から送信された前記音声側同期信号を受信し、該音声側同期信号に応じて、前記映像デコード手段で用いるクロックの周波数、及び前記映像デコード手段で再生するフレームのうちの少なくともいずれか一方を調整する映像側同期制御部と、
を備えることを特徴とする同期再生装置。
【0013】
(2)前記映像再生装置側に設けられ、
前記ネットワークにおける応答時間を測定するための測定用信号を、前記ネットワークを介して前記音声再生装置側に送信し、前記測定用信号に応じて前記音声再生装置側から返信された応答信号を受信し、前記測定用信号の送信から前記応答信号の受信までの伝送遅延時間を測定し、測定された伝送遅延時間に応じて、前記音声再生装置側から受信した前記音声側同期信号の値を補正する遅延補正部を
更に備えることを特徴とする上記(1)記載の同期再生装置。
【発明の効果】
【0014】
本発明によれば、映像再生装置と音声再生装置とが別々にネットワークに接続されているようなシステム構成の下、別々に設置された映像再生装置と音声再生装置との間で映像と音声とを同期再生させることが可能となる。
【0015】
したがって、音声をより高品位に再生することが可能な音声再生装置によって再生して楽しみたいといったニーズに対応することができる。
【発明を実施するための最良の形態】
【0016】
以下に添付図面を参照して、本発明に係る同期再生装置の実施形態を詳細に説明する。図1は、本実施形態に係る同期再生装置の全体構成を示す概念図である。
【0017】
(装置の全体構成)
同期再生装置は、少なくとも映像及び音声を含むコンテンツデータを、ネットワーク上に別途独立して分散配置された映像再生装置2及び音声再生装置3により、映像及び音声を同期させて再生出力する機能を備えている。本実施形態では、ネットワーク4に接続されたAVサーバー1と、映像再生装置2と、音声再生装置3(3a〜3cを含む。)とからなる機器構成となっており、ネットワーク4に接続されたAVサーバー1から、映像再生装置2及び音声再生装置3へ同一のコンテンツの映像と音声を送信し、各装置において再生出力する。
【0018】
本実施形態においてAVサーバー1は、コンテンツデータを配信するコンテンツサーバーの役割を果たす装置である。例えば、地上波放送や衛星放送、ケーブルテレビ放送を受信したり、ルーター44及びLAN4を介してインターネット42上のコンテンツ配信サーバー5に接続したりして、音声・映像を含むコンテンツデータを中継したり、蓄積して再配信する機能を備えた装置である。AVサーバー1としては、例えば、ホームサーバーやセットトップボックスなどがある。
【0019】
映像再生装置2は、ネットワークに接続する通信インターフェースを備え、AVサーバー1に接続することによって、AVサーバー1が中継・配信するコンテンツデータに含まれる映像を再生し、モニター2aに出力表示させる装置である。なお、本説明では便宜上、映像再生装置2と名づけているが、この映像再生装置2は、音声再生機能を備えていてもよい。この映像再生装置2としては、例えばネットワーク4に接続する機能を有するDVDプレーヤー/レコーダーなどがある。
【0020】
本発明は、このような前提の下で、より高品位に音声を再生することが可能な音声再生装置3側に音声再生機能を委ね、かつ、映像再生装置2での映像再生と音声再生装置3での音声再生とを同期させるところに特徴がある。
【0021】
音声再生装置3は、映像再生装置2とは別途独立して構成され、ネットワークに接続する通信インターフェースを備え、AVサーバー1に接続することによって、AVサーバー1が中継・配信するコンテンツデータに含まれる音声を再生し、スピーカーやヘッドホン等から出力させる装置である。この音声再生装置3としては、例えばネットワーク4に接続する機能を有し、高品位な音声の再生が可能な、オーディオコンポや、携帯型シリコンプレーヤー3aや、PDA3bや、携帯電話3cなどがある。
【0022】
なお、AVサーバー1と映像再生装置2とを単一の装置とし、両者の機能を兼ね備えた装置としてもよい。この場合には、AVサーバー兼映像再生装置で映像の再生をしつつ、これと同一のコンテンツの音声を音声再生装置3で同期して再生出力を行う。同様にAVサーバー1が音声再生装置3を兼ねた構成としてもよく、ネットワーク4に接続されている映像再生装置2へコンテンツを送信し、音声と映像とを同期させて再生出力するようにしてもよい。また、これらの機器操作を、ネットワーク4に接続可能なコントローラで操作するようにしてもよい。
【0023】
そして、各再生装置において再生出力する際、映像再生装置2で再生出力される映像と、音声再生装置3で再生出力される音声との間で同期を取り、視聴者が映像と音声のタイミングのズレによる違和感が生じないように制御する。
【0024】
なお、コンテンツのストリームは、AVサーバー1側で送信時に同一のシステムクロックを持つ映像ストリームと音声ストリームとに分離してそれぞれ送信してもよい。
【0025】
図2は、AVサーバー1、映像再生装置2、及び音声再生装置3の内部構成を示すブロック図である。
同図に示すように、AVサーバー1は、テレビ放送受信アンテナ43等を介してコンテンツを受信するチューナー部12と、受信したコンテンツがアナログ信号の場合に、このアナログ信号をデジタル化し、MPEG2方式等の高能率符号化方式で圧縮するとともに、この圧縮したコンテンツデータをPS(program Stream)形式のストリームデータ(以下PSデータと呼ぶ)に変換するエンコーダ14と、エンコーダ14で得られたPS形式のストリームデータを蓄積するか、又はチューナー部12で受信したコンテンツがデジタル信号の場合は、このデジタル信号であるTS(Transport Stream)形式のストリームデータ(以下TSデータと呼ぶ)を直接蓄積するストレージ16と、ストレージ16に対するストリームデータの入出力を管理するストレージ管理部13と、ストリームデータをネットワーク4に送出するネットワーク制御部11と、ストリームデータのFlFO(First In First Out)バッファであるストリームバッファ15とを有する。
【0026】
なお、TS形式は、主にデジタル放送やATM(非同期転送モード)交換網などの通信メディアで使用される形式であり、PS形式は、主にDVD(Digital Versatile Disc)などの蓄積メディアで使用される形式である。
【0027】
そして、AVサーバー1に蓄積されたストリームツデータは、再生機からの要求に応じてストレージ16から読み出される。そしてこの読み出されたストリームデータは、ストリームバッファ15に蓄積されつつ、ネットワーク制御部11に送出され、ネットワーク制御部11においてネットワークプロトコル(TCP/IP又はUDP/IP)のヘッダ情報が付加されパケットデータとしてネットワーク4に送出される。
【0028】
一方、映像再生装置2は、AVサーバー1から送信されたパケットデータをネットワーク4から受信し、このパケットデータからストリームデータを抽出するネットワーク制御部23と、ネットワーク制御部23で抽出したストリームデータを一時的に蓄積するFlFOバッファであるストリームバッファ27と、このストリームバッファ27に蓄積されたストリームデータを後述する同期制御部22からの制御に基づくタイミングで読み出してデコーダ26に出力するTSパケットタイミング再現部2001と、このTSパケットタイミング部2001から出力されるストリームデータをデコードするデコーダ26と、デコードされた映像をディスプレイ24等に表示させる出力インターフェース25と、TSパケットタイミング再現部2001におけるストリームデータの入出力のタイミングと、デコーダ26におけるデコードのタイミングを調整する同期制御部22とから構成される。なお、TSパケットタイミング00部21は、映像再生装置2へ入力されるストリームデータが、後述するタイムスタンプ付のTSデータの場合に必要になるものであり、通常のTSデータとPSデータの場合は必要ない。したがって、通常のTSデータとPSデータの場合、ストリームバッファ27から出力されるストリームデータは、直接デコーダ26へ供給される。
【0029】
デコーダ26は、ストリームデータに含まれる音声データ及び映像データのうち、少なくとも映像データのデコードを行う映像デコード手段であり、上述したように、ストリームデータとして、TSデータとPSデータとが入力されるため、この両方のデータをデコードする能力を有している。
【0030】
このような構成の映像再生装置2では、ネットワーク制御部23で受信したパケットデータは、TCP/IP又はUDP/IPの各プロトコルのヘッダが取り除かれてストリームデータに変換され、ストリームバッファ27に一時的に蓄積された後、TSパケットタイミング再現部2001によって逐次ストリームバッファ37から読み出され、デコーダ26に供給されて、デコード処理され、出力インターフェース25を通じて映像信号として送出され、ディスプレイ24により表示される。
【0031】
他方、音声再生装置3は、AVサーバー1から送信されたパケットデータをネットワーク4から受信し、このパケットデータからストリームデータを抽出するネットワーク制御部33と、ネットワーク制御部23で抽出したストリームデータを一時的に蓄積するストリームバッファ37と、このストリームバッファ27に蓄積されたストリームデータを後述する同期制御部32からの制御に基づくタイミングで読み出してデコーダ36に出力するTSパケットタイミング再現部3001と、このTSパケットタイミング再現部3001から出力されるストリームデータをデコードするデコーダ36と、デコードされた音声をスピーカー34等から出力させる出力インターフェース35と、TSパケットタイミング再現部3001におけるストリームデータの入出力のタイミングと、デコーダ36におけるデコードのタイミングを調整する同期制御部22とから構成される。なお、TSパケットタイミング再現部3001は、映像再生装置2の場合と同様に、タイムスタンプ付のTSデータの場合に必要になるものである。
【0032】
このような構成の音声再生装置3では、ネットワーク制御部33で受信されたパケットデータは、TCP/IP又はUDP/IPの各プロトコルのヘッダが取り除かれたストリームデータに変換され、ストリームバッファ37に一時的に蓄積された後、TSパケットタイミング再現部3001によって逐次ストリームバッファ37から読み出され、デコーダ36に供給されて、デコード処理され、出力インターフェース35を通じて音声信号として送出され、スピーカー34により出力される。
【0033】
上記したようなシステムに用いるネットワークが、例えば、Ethenet(登録商標)に代表されるようなパケット通信とCSMA/CD(CarrierSense Multiple Access withCollision Detection)によるベストエフォートからなる場合、同時に出力するように対応付けされた映像データと音声データとの間の同期を取るための基準クロックを、映像再生装置2と音声再生装置3とに直接伝送することができないため、これらの装置間での再生同期を取るための特別な手段が必要になる。
【0034】
以下に、本願に係る上記した再生同期を取るための手段の実施例を図3及び図4を用いて説明する。
図3は、音声再生装置3側の同期制御部32の内部構成を示すブロック図であり、図4は、映像再生装置2側の同期制御部22の内部構成を示すブロック図である。
【0035】
(音声側)
まず音声再生装置3側の同期制御部32について図3を用いて説明する。
【0036】
同期制御部32は、位相同期ループ回路(PLL回路)として比較器301と、デジタル信号をアナログ信号に変換する回路であるDAC(Digital Analog Converter)302と、低域周波数を通過させるフィルタであるLPF(Low Pass Filter)303と、発振周波数を制御する発振回路であるVCXO(Voltage Controlled Xtal Oscillator)304と、STCカウンタ305を備えている。
【0037】
また、本実施形態での同期制御部32は、タイムスタンプ付きTSデータの再生に対応するために、VCXO306と、タイミング制御ブロック307と、スイッチ308とを備えている。
【0038】
なお、本説明におけるタイムスタンプとは、ARIB STD−B24「デジタル放送におけるデータ放送符号化方式」の第二編に記載されているタイムスタンプ付きTS形式を指しており、MPEG規格におけるPTS(Presentation Time Stamp)、DTS(Decoding Time Stamp)とは異なるものである。「タイムスタンプ付きTS」は、放送などのようにマルチプログラムが多重化されたMPEG−TSから目的のプログラムのみを抽出したパーシャルTSをストレージメディアなどの蓄積媒体に記録する際に、再生時にクロック・リカバリーができるようにパケットの到着タイミングを表す4バイトのタイムスタンプを付加したものである。上記タイムスタンプ付きTSは、188バイトのNPEG−TSパケットにこの4バイトを付加した192バイトのMPEG−TSパケットを指している。
【0039】
しかし、このタイムスタンプ付のTSデータであっても、それぞれの装置内のストリームバッファ27、37のサイズが異なっていると、ストリームデータが各デコーダ26、36へ入力されるまでの遅延時間が異なってしまい、完全には同期が取れない。また、各デコーダ26、36での遅延時間は、通常の場合同一ではないので、これによっても同期がずれてしまう。
【0040】
上記で示した構成の同期制御部32の内部動作を以下に説明する。入力データがタイムスタンプ付TSデータの場合は、タイミング制御ブロックにこのデータが供給され、タイムスタンプが付いていない通常のTSデータとPSデータとの場合は、これらからそれぞれ抽出したPCR及びSCR(以下両者をまとめてクロックリファレンスと呼ぶ)がスイッチ308のB側の端子に供給される。
【0041】
(TSデータ、PSデータの場合)
まず、入力データが通常のTSデータとPSデータとの場合について説明する。この場合、308はB側の端子に接続される。
AVサーバー1から受信したストリームデータから抽出されたクロックリファレンスは、スイッチ308のB側の端子を介して、STCカウンタ305に供給される。
【0042】
STCカウンタ305は、クロックリファレンスが最初に到着したときにその値を初期値にセットされ、PLLを構成するVCXO304から出力されるクロックをカウントすることでSTCを生成する。そして、このSTCを比較器301に供給する。
【0043】
比較器301は、供給されるクロックリファレンスと、このクロックリファレンスが供給された時点でのSTCの値とを比較して、誤差値を算出しDAC302に供給する。
DAC302は、供給された誤差値に応じた誤差電圧を生成しLPF303に供給する。
【0044】
LPF303は、供給される誤差電圧から高周波成分を除去し、低周波成分をVCXO304に制御電圧として供給する。
【0045】
VCXO304は、供給される制御電圧に応じて発振中心周波数が可変制御されたクロックを出力する。このVCXO304から出力されたクロックは、STCカウンタ305に帰還入力される。この、VCXO304から出力されるクロックが、デコーダ36のシステムクロックとして用いられる。
【0046】
そして、デコーダ36は、上記で生成されたシステムクロックを用いてストリームデータのデコードを行う。このとき、デコーダ36は、オーディオフレームが出力された瞬間にそのフレームに関連付けられたPTS(Presentation Time Stamp)を、音声側同期信号としてネットワーク4を通じて映像再生装置2側に送信する。本実施形態では、この音声側同期信号を、オーバーヘッドの少なさを考慮して、UDP(UserDatagramProtocol)パケットにPTSの値をパケッタイズし、PTS通知パケットとして送信する。
【0047】
ここで、PTS通知パケットにより音声再生装置3側のPTSを通知するのは、音声再生装置3側においてSTCカウンタの値がPTSと一致したときに、当該PTSに関連付けられたオーディオフレームが出力されることから、音声再生装置3側のSTCカウンタの値を映像再生装置2側に通知するのと同等となるためである。なお、この音声再生装置3側のPTSに代えて、オーディオフレームが出力された瞬間のSTCカウンタの値を読み取って、これを通知パケットにより映像再生装置2側に通知するようにしてもよい。
【0048】
(タイムスタンプ付きTSデータの場合)
次に、入力データがタイムスタンプ付きTSデータの場合について説明する。この場合、スイッチ308はA側の端子に接続される。
タイムスタンプ付きTSデータは、タイミング制御ブロック307に供給される。
【0049】
タイミング制御ブロック307は、タイムスタンプ付きTSデータの再生時に、VCXO306からのクロック信号に基づいてこのTSデータを取り込み、このTSデータをデコーダへ供給するタイミングを制御する回路である。
【0050】
このタイミング制御ブロック307は、上記動作とともにTSデータからクロックリファレンス(PCR)を抽出し、上記で説明したPLL回路(比較器301、DAC302、LPF303、VCXO304及びSTCカウンタ305)に入力する。その後のPLL回路の動作は通常のTSデータ及びPSデータの場合と同様である。
VCXO306は、タイミング制御ブロック307で用いるクロックを発生する発振器である。
【0051】
(映像側)
次に映像再生装置3の同期制御部22について図4を用いて説明する。
同期制御部22は、位相同期ループ回路(PLL回路)として比較器205と、デジタル信号をアナログ信号に変換するDAC207と、低域周波数を通過させるLPF208と、発振周波数を制御するVCXO209と、STCカウンタ212とを備えている。
【0052】
また、本実施形態での同期制御部22は、タイムスタンプ付きTSデータの再生に対応するために、VCXO201と、タイミング制御ブロック202と、スイッチ203及び204とを備えている。
【0053】
(TSデータ、PSデータの場合)
音声側の説明と同様に、まず、入力データが通常のTSデータとPSデータとの場合について説明する。この場合、スイッチ204はB側の端子に接続される。
【0054】
AVサーバー1から受信したストリームデータから抽出されたクロックリファレンスは、スイッチ204のB側の端子を介して比較器205に入力される。ただし最初に到着したときはSTCカウンタ212に初期化のため、供給される。
【0055】
その後のPLL回路における、比較器205,DAC207、LPF208、VCXO209及びSTCカウンタ212の各部の動作は、音声再生装置3側とほぼ同様であるので説明を省略し、音声再生装置3との同期を図るために映像再生装置2側に加わった構成についてのみ説明する。
【0056】
映像再生装置2の同期制御部22は、上記PLL回路の各部に加えて、遅延補正ブロック213と、STC差分検出ブロック211と、比較器210と、加算器206とを備えている。
【0057】
遅延補正ブロック213は、音声再生装置3側に応答時間を測定するための測定用信号を、ネットワーク4を通じて送信し、測定用信号に応じて音声再生装置3側から返信された応答信号を受信し、測定用信号の送信から応答信号の受信までの伝送遅延時間を測定し、測定された伝送遅延時間に応じて、音声再生装置3側から受信した音声側同期信号を補正するモジュールである。
【0058】
具体的には、この遅延補正ブロック213は、図5に示すように、コンテンツの再生開始前に、映像再生装置2から音声再生装置3へ、測定用信号としての応答時間測定パケットを複数回送信してから、これに対する応答信号である音声再生装置3からの応答パケットを受信するまでの時間Trを測定する。そして、このTrの半分、すなわちTr/2の平均時間を伝送遅延時間とする。そして、このようにして測定したPTS通知パケットの遅延時間を、デコーダのクロック周波数で換算したSTCカウント値分として補正に使用する。
【0059】
ここで、音声再生装置3では、映像再生装置2からの応答時間測定パケットを受信してから応答パケットを送信するまでの応答遅延時間Tdlが発生する可能性があるが、この応答遅延時間Tdlは、人間の検知しうるリップシンクのズレ量より十分小さい時間と考えられることから、Tr/2の平均時間を音声再生装置3がオーディオフレームを出力した瞬間から映像再生装置2でPTSを通知するパケットを受信するまでの時間として問題無い。なお、この人間のリップシンクズレの検知限は、アナウンスにおける評価実験の場合、音進み約45ms、音遅れ約125ms、許容限は音進み約90ms、音遅れ約185msであることが知られており、打楽器における評価実験の場合で、音進み23ms、音遅れ56ms、許容限は音進み56ms、音遅れ130msであることも知られている。
【0060】
比較器210は、遅延補正ブロック213により補正された音声側STCカウント値(すなわちPTS値)とデコーダ26のSTCカウント値とを比較してこれらの差分を算出し、STC差分検出ブロック211は、比較器210で得た差分がVideo信号のフレーム周期より大きい小さいか、正の値か負の値かの検出を行うモジュールである。
【0061】
具体的には、比較器210は、補正後の音声再生装置3側のSTCカウント値(PTS値)と、映像再生装置2側のSTCカウント値との差分を検出するモジュールである。また、STC差分検出ブロック211は、検出された差分が、正の値でビデオフレーム周期相当のカウント値よりも大きかった場合、デコーダにフレームスキップを指示し、負の値で同様の場合だったら、フレームの連続出力をするよう、STC差分検出ブロック211から制御するようにして映像と音声の大きな時間ズレに対して短い時間で同期状態に補正できるようにする。
【0062】
なお、フレームスキップする場合、MPEGではI、Pフレームをスキップすると、これらのフレームは、それ以降のフレームを復号する参照元になっているため再生画像に影響を及ぼしてしまう。したがって、本実施形態では、スキップする場合、次のBフレームをスキップするようにする。
【0063】
このようなフレームのスキップや連続出力を行った場合、映像再生装置2側のSTCカウンタ212には、次のPCRが到着したときに、その値がセットされ、スキップされたフレーム分だけ追従するように、STCカウンタの値が更新される。
【0064】
(タイムスタンプ付きTSデータの場合)
次に、入力データがタイムスタンプ付きTSデータの場合について説明する。この場合、スイッチ204はA側の端子に接続される。タイムスタンプ付きTSデータは、タイミング制御ブロック202に供給される。
【0065】
タイミング制御ブロック202は、タイムスタンプ付きTSデータの再生時に、VCXO201からのクロック信号に基づいてこのTSデータを取り込み、このTSデータをデコーダへ供給するタイミングを制御する回路である。
【0066】
このタイミング制御ブロック202は、上記動作とともにTSデータからクロックリファレンス(PCR)を抽出し、上記で説明したPLL回路(比較器205、加算器206、DAC207、LPF208、VCXO209及びSTCカウンタ212)に入力する。その後のPLL回路の動作は通常のTSデータ及びPSデータの場合と同様である。
【0067】
VCXO201は、タイミング制御ブロック307で用いるクロックを発生する発振器である。
【0068】
スイッチ203は、LPF208から出力される誤差電圧と、固定値の電圧とを選択的に切り替えて、VCXO201に入力させるためのスイッチであり、外部の音声再生装置3側との同期を行うときには、スイッチをC側の端子に接続してLPF208からの誤差電圧をVCXO201に入力させる一方、同期を行わないときには、スイッチをD側の端子に接続して固定値の電圧をVCXO201に入力させてタイミング制御ブロック202のクロックを固定周波数とするとともに、STC差分検出ブロック211の出力を「STCカウントの誤差なし」の固定値出力とする。
【0069】
(処理の流れ)
次に、以上の構成によって映像と音声の同期再生を実現するための処理の流れを図6のシーケンス図を用いて説明する。
【0070】
音声再生装置3又は映像再生装置2からAVサーバー1に対して、コンテンツデータの配信要求を送信する(S101)。
AVサーバー1は、この配信要求を受信したらコンテンツデータの配信を開始する(S105)。
【0071】
このコンテンツデータの配信は、本実施形態では、音声再生装置3及び映像再生装置2の両方に対して同一内容のデータを送信する例で説明するが、音声再生装置3及び映像再生装置2のそれぞれに対して、映像データ及び音声データのそれぞれを送信するようにしてもよい。
【0072】
次に、遅延補正のための伝送遅延の測定及び算出を行う(S102及びS103)。なお、このステップは、コンテンツデータの配信要求の前に前もって行なっておいてもよい。
【0073】
次いで、音声再生装置3及び映像再生装置2において、それぞれネットワーク制御部23及び33でコンテンツデータをネットワーク4から受信する(S104)。
【0074】
次に、音声再生装置3は、音声をデコードするとともに、このデコード時に取り出される音声側同期信号(PTS)を、この音声の出力タイミングで映像再生装置2へ送信する。
映像再生装置2は、音声再生装置3から送信される音声側同期信号(PTS)を受信する(S107)。
【0075】
次いで、映像再生装置2側において、S103で算出した遅延時間分を補正する(S108)。
この遅延補正は、ステップS102及びS103で測定・算出したPTS通知パケットの遅延時間を、デコーダのクロック周波数で換算したSTCカウント値分として加算する。そして、比較器210において、補正後の音声再生装置3側のSTCカウント値(PTS値)と、映像再生装置2側のSTCカウント値との差分を検出する。
【0076】
検出された差分が、ビデオフレーム周期相当のカウント値よりも大きかった場合(ステップS109における“Y”)、デコーダにフレームスキップ、又はフレームの連続出力をするよう、STC差分検出ブロック211から制御するようにして、映像と音声の大きな時間ズレを補正し、同期状態を維持する(S110)。
【0077】
一方、検出された差分がビデオフレーム周期相当のカウント値よりも小さかった場合(ステップS109における“N”)、そのまま処理を続行する。
更に、送信されるコンテンツデータがタイムスタンプ付きTSデータの場合は、映像再生装置2側のタイミング制御ブロック202のクロックを発生しているVCXO201に対しても、上記デコーダのクロック制御に用いるLPF208からの出力を利用し、タイミング制御ブロック202のクロックを、デコーダのクロック制御に追従させ、ストリームデータの流量とデコーダの動作クロックとを整合させ、破綻なくデコード動作を制御する。
【0078】
以上のような処理により、映像再生装置2側において、同期制御部22は、音声再生装置3側の音声側同期信号(PTS)とのズレをなくすように動作し、映像と音声の同期が取るようになる。また、このズレ量が1フレーム期間を超えるような場合は、上述したようにフレームスキップ、若しくはフレームの連続出力により映像の再生を、音声再生装置3側に追従するように動作させる。
したがって、映像の出力タイミングと音声の出力タイミングのズレによる違和感を解消することができる。
【0079】
(変更例)
本発明は、上述した実施形態に限定されるものではなく、種々の変更を加えることができる。例えば、映像再生装置側のデコーダを、サイズや処理能力、デコード方式が異なるものを複数設け、遅延補正ブロックにおいて検出された伝送遅延の程度に応じて、デコーダを選択するようにしてもよい。
【0080】
また、図1に示した、AVサーバー1や、音声再生装置3、映像再生装置2に備えられている操作パネルや操作ボタン、リモコン、液晶ディスプレイ等のユーザーインターフェースを、ネットワーク4を通じて相互に接続し、ユーザーの操作信号を相互に送受信可能とし、これらのネットワーク4に接続されたユーザーインターフェースのいずれからでも、上述したコンテンツデータの配信要求や、再生・停止等の再生制御を行えるようにするとともに、これらの操作を上記リップシンク処理の開始又は停止のトリガーとすることができる。
【0081】
(作用・効果)
以上説明した本実施形態によれば、ネットワーク4上に別途独立して分散配置された映像再生装置2及び音声再生装置3を備えたシステム構成において、音声再生装置3側のデコードを制御する音声側同期信号を映像再生装置2側で取得し、取得した音声側同期信号に映像再生装置2側におけるデコードのカウント値を整合させることにより、音声再生に映像再生を同期させ、リップシンクを取ることができる。
【0082】
また、本実施形態では、同期再生の際に、伝送遅延時間を測定し、測定された伝送遅延時間に応じて、音声再生装置側から受信した音声側クロック信号を補正するため、ネットワークに依存する伝送遅延を解消することができ、より精度よリップシンクを取ることができる。
【図面の簡単な説明】
【0083】
【図1】実施形態に係る同期再生装置の全体構成を示す概念図である。
【図2】実施形態に係るAVサーバー1、映像再生装置2、及び音声再生装置3の内部構成を示すブロック図である。
【図3】実施形態に係る音声再生装置側同期制御部32の内部構成を示すブロック図である。
【図4】実施形態に係る映像再生装置側同期制御部22の内部構成を示すブロック図である。
【図5】実施形態に係る伝送遅延測定方法の説明図である。
【図6】実施形態に係る同期再生装置の動作を示すシーケンス図である。
【符号の説明】
【0084】
Tdl…応答遅延時間
Tr…時間
1…AVサーバー
2…映像再生装置
2a…モニター
3…音声再生装置(オーディオコンポ)
3a…シリコンプレーヤー
3b…PDA
3c…携帯電話
4…ネットワーク
5…コンテンツ配信サーバー
11…ネットワーク制御部
12…チューナー部
13…ストレージ管理部
14…エンコーダ
15…ストリームバッファ
16…ストレージ
2001,3001…TSパケットタイミング再現部
22,32…同期制御部
23,33…ネットワーク制御部
24…ディスプレイ
25…出力インターフェース
26,36…デコーダ
27,37…ストリームバッファ
34…スピーカー
35…出力インターフェース
41…無線LANルーター
42…インターネット
43…テレビ放送受信アンテナ
44…ルーター
201,306…VCXO
202,307…タイミング制御ブロック
203,204,308…スイッチ
205,301…比較器
206…加算器
207,302…DAC
208,303…LPF
209,304…VCXO
210…比較器
211…STC差分検出ブロック
212,305…STCカウンタ
213…遅延補正ブロック

【特許請求の範囲】
【請求項1】
コンテンツデータに含まれる映像データと音声データとを、ネットワーク上に独立して配置される映像再生装置及び音声再生装置を用いてそれぞれ独立して再生させる場合に、前記映像再生装置による前記映像データの再生と前記音声再生装置による音声データの再生とを同期させる同期再生装置であって、
前記音声再生装置側に設けられ、前記コンテンツデータの音声データをデコードする音声デコード手段と、
前記音声再生装置側に設けられ、前記音声デコード手段によるデコード結果である音声信号を出力すべきタイミングの制御値を、音声側同期信号として前記ネットワークを通じて前記映像再生装置側に送信する音声側同期制御部と、
前記映像再生装置側に設けられ、前記コンテンツデータの映像データをデコードする映像デコード手段と、
前記映像再生装置側に設けられ、前記音声再生装置側から送信された前記音声側同期信号を受信し、該音声側同期信号に応じて、前記映像デコード手段で用いるクロックの周波数、及び前記映像デコード手段で再生するフレームのうちの少なくともいずれか一方を調整する映像側同期制御部と、
を備えることを特徴とする同期再生装置。
【請求項2】
前記映像再生装置側に設けられ、
前記ネットワークにおける応答時間を測定するための測定用信号を、前記ネットワークを介して前記音声再生装置側に送信し、前記測定用信号に応じて前記音声再生装置側から返信された応答信号を受信し、前記測定用信号の送信から前記応答信号の受信までの伝送遅延時間を測定し、測定された伝送遅延時間に応じて、前記音声再生装置側から受信した前記音声側同期信号の値を補正する遅延補正部を
更に備えることを特徴とする請求項1に記載の同期再生装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2009−272945(P2009−272945A)
【公開日】平成21年11月19日(2009.11.19)
【国際特許分類】
【出願番号】特願2008−122496(P2008−122496)
【出願日】平成20年5月8日(2008.5.8)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】