説明

映像再生装置及び映像再生方法

【課題】高度動画像圧縮符号化標準により圧縮された映像及び音声を特殊再生するときに安定した再生を行なうことができるようにする。
【解決手段】映像デコーダでデコードされる符号化映像データに対応する映像PTSと、音声デコーダでデコードされる符号化音声データに対応する音声PTSとを比較し、両者のプレゼンテーションタイムが所定の時間差を超えているか否かを判定する第1の比較部と、前記所定の時間差を超えている場合、符号化映像データを復号するために基準となる次のIピクチャまで前記映像デコーダの処理をスキップさせるスキップ制御部と、前記次のIピクチャが存在するPESパケットの映像PTSと前記音声PTSとを比較し、両者の差が所定の時間内であるか否かを判定する第2の比較部と、前記差が所定の時間内である場合、前記映像デコーダのデコード処理を再スタートさせ再スタート制御部とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は映像再生装置及び映像再生方法に関するもので、特に倍速再生、逆送り再生を行なう所謂特殊再生時に音声と映像との同期状態を安定化するものである。
【背景技術】
【0002】
映像データ・音声データの高度動画像圧縮符号化標準(AVC: Advanced Video Coding )において、勧告名H.264/AVCと称される規格がある。このような規格の信号を記録・再生する装置及びメディアも開発されている。一般に記録メディアに記録された圧縮情報(映像圧縮データ、音声圧縮データが含まれる)を再生する装置には、特殊再生機能が設けられる(例えば特許文献1)。
【0003】
しかしながら上記H.264/AVC規格の信号の映像及び音声を特殊再生するための有効な装置及び方法が無い。上記文献1に映像に関して特殊再生を行なう手法は開示されているが、音声に関する再生手法が不明である。
【特許文献1】特開平8−9327号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
この発明の目的は、高度動画像圧縮符号化標準により圧縮された映像及び音声を特殊再生するときに安定した再生を行なうことができる映像再生装置及び再生方法を提供することにある。
【課題を解決するための手段】
【0005】
上記課題を解決するために、この発明の一実施例は以下の手段を有する。まず符号化映像データあるいは符号化音声データを含む所定単位のパケッタイズドエレメンタリーストリーム(PES)パケットが定義され、前記PESパケットのヘッダの一部にはデータのデコード時間を指示するためのデコードタイムスタンプ(DTS)、及び再生出力時間を指示するためのプレゼンテーションタイムスタンプ(PTS)が記述され、また前記PESパケット内には、前記符号化映像データあるいは符号化音声データを配置するアクセスユニットが設定されている。さらに前記PESパケットは、トランスポートストリーム(TS)を形成し、それぞれシステムヘッダを有するTSパケットに分散配置されており、前記システムヘッダはプログラム時刻基準値(PCR)を含んでいる。
【0006】
ここで前記TSパケットを受信して情報処理を行う装置は、前記TSパケットのシステムヘッダから前記プログラム時刻基準値(PCR)を抽出してシステムタイムクロックを再生するSTC再生部と、前記PESパケットのヘッダから前記DTS,前記PTSを取得する時刻情報取得部と、前記符号化映像データを含むPESパケットから前記符号化映像データが配置されているアクセスユニットを取り込む映像バッファ部と、前記映像バッファ部に取り込まれている符号化映像データを復号する映像デコーダと、前記符号化音声データを含むPESパケットから前記符号化音声データが配置されているアクセスユニットを取り込む音声バッファ部と、前記映像デコーダでデコードされる符号化映像データに対応する映像PTSと、前記音声デコーダでデコードされる符号化音声データに対応する音声PTSとを比較し、両者のプレゼンテーションタイムが所定の時間差を超えているか否かを判定する第1の比較部と、プレゼンテーションタイムが所定の時間差を超えている場合、符号化映像データを複合するために基準となる次のIピクチャまで前記映像デコーダの処理をスキップさせるスキップ制御部と、前記次のIピクチャが存在するPESパケットの映像PTSと前記音声デコーダでデコードされる符号化音声データに対応する音声PTSとを比較し、両者のプレゼンテーションタイムの差が所定の時間内であるか否かを判定する第2の比較部と、前記プレゼンテーションタイムの差が所定の時間内である場合、前記映像デコーダのデコード処理を再開させる再開制御部と、を有する。
【発明の効果】
【0007】
上記の手段によると、映像データの復号のために遅れが生じてもスキップ処理を行い、遅れの無い映像データの復号出力を得るので、表示されている画像の破綻が生じたり、音声と映像の非同期による違和感が生じるようなことが防止される。
【発明を実施するための最良の形態】
【0008】
以下図面を参照して、この発明の実施の形態を説明する。図1は、この発明に係る映像再生装置の概略構成を示す図である。入力部11には、例えば受信部、光ディスク、あるいはハードディスクから再生されたトランスポートストリーム(Transport Stream :TS)が入力する。トランスポートストリーム(TS)パケットの集合であるトランスポートストリーム(TS)は、トランスポートストリームデコーダ12に入力され、データの種類毎にあるいはプログラム毎に分離される。
【0009】
分離された複数のTSパケットが、データの種類毎に集合されパケッタイズドエレメンタリーストリーム(Packetized Elementary Stream: PES)として構築される。種類としては、ビデオデータのためのPES,音声データのためのPES,字幕情報のためのPES、そのほか各種情報などが存在する。トランスポートストリームデコーダ12において分離されたビデオデータのためのPESには、符号化映像データが含まれ、音声データのためのPESには符号化音声データが含まれている。
【0010】
パケッタイズドエレメンタリーストリーム(PES)は、PESパケットの集合でもある。そしてPESパケットは、ヘッダを有し、ヘッダには、対応する映像と音声の同期をとるためのDTS(decoding Time Stamp:デコードタイムスタンプ),PTS(Presentation Time Stamp:プレゼンテーションタイムスタンプ)が記述されている。
【0011】
DTS(デコードタイムスタンプ),PTS(プレゼンテーションタイムスタンプ)は、アクセスユニットと称される単位毎に付加される。即ち、映像データのためのPESパケット内には、符号化映像データが含まれるが、ピクチャ毎にアクセスユニットが設定されている。音声データのためのPESパケット内には、符号化音声データが含まれるが、フレーム毎にアクセスユニットが設定されている。複数のPESパケット内のペイロードを集合することで1つのアクセスユニットが形成されることもある。
【0012】
またトランスポートストリーム(TS)パケットは、それぞれシステムヘッダを有し、システムヘッダはプログラム時刻基準値(program clock Reference: PCR)を含んでいる。プログラム基準時刻(PCR)は、TSデコーダ12で分離されて、STC再生部16に入力される。STC再生部16では、PCRを用いて、装置のシステム基準時刻(STC)を生成している。
【0013】
20は中央演算ユニットを含む制御部であり、各ブロックを統括して制御している。制御部20は、STC,DTS,PTSを認識している。
【0014】
TSデコーダ12で抽出された映像データのためのアクセスユニットは、映像バッファ部13に転送され、音声データのためのアクセスユニットは音声バッファ部14に転送される。映像及び音声バッファ部13、14はそれぞれSTC再生部16からの基準時刻信号に基づいて、動作する。映像及び音声バッファ部13、14はそれぞれ制御部20からデコード開始指令が与えられると、映像及び音声用のアクセスユニットをそれぞれ映像デコーダ17、音声デコーダ18に転送する。これにより映像及び音声のデコードが開始される。映像デコーダ17、音声デコーダ18にて復号された映像データ及び音声データは、制御部20から与えられた出力開始指令が与えられると出力される。
【0015】
制御部20では、STCとDTS,STCとPTSを比較し、デコード開始時刻、復号データの出力開始時刻が来たら、上記のデコード開始指令、出力開始指令を出力している。
【0016】
ところで、映像再生装置には通常は特殊再生機能が設けられている。特殊再生機能は、音声データ、映像データを通常再生速度よりも速いたとえば1.5倍速、2倍速、4倍速などで再生したり、逆送り再生したりする機能である。制御部20は、操作入力を認識するための操作入力認識部220を有する。また特殊再生の指令信号が入力すると特殊再生起動部221が起動し、後述する動作が実行される。このとき、第1の比較部222、スキップ制御部223、第2の比較部224、再スタート制御部225が相俟って、特殊再生を実行する。またPESパケットのヘッダからDTS,PTSを取得する時刻情報取得部230が設けられている。
【0017】
図2には映像及び音声データが同期して再生されているとき(通常再生のとき)にSTC,PTSが変化する様子を示している。時間とともにSTCが増加し、それに合わせて映像データ及び音声データのPTSが増加する。
【0018】
この装置は特殊再生機能を持つ。特殊再生とは、例えば記録メディアに記録されているトランスポートストリームを読み出し、早送り再生する、あるいは逆送り再生、さらには静止再生、間欠再生することを含む。
【0019】
さらにこの装置は特殊再生時には、音声データが主となり、音声データがタイムスタンプに合わせて復号および再生出力される。特殊再生時には、ジャンプ先に応じてシステムタイムクロックがジャンプ修正される。そして各バッファ部13、14へアクセスユニット毎に符号化映像データ、符号化音声データが取り込まれる。アクセスユニットの符号化映像データ、符号化音声データは、先に説明したように制御部20からのデコード開始指令、出力開始指令に応じて復号タイミング及び出力タイミングが制御されている。
【0020】
しかし、ここで符号化映像データに関しては、デコードに時間がかかることがある。このために映像データのPTSをシステムタイムクロックが大きく通過してしまうことがある。
【0021】
この様子を示したのが図3である。映像データはピクチャ単位、音声データはフレーム単位ごとのPTSが確認される。倍速再生のためにスキップしながら復号している途中で、STCに対して音声データの復号時のPTS(以下音声PTS)は追従しているが、映像データの復号時のPTS(以下映像PTS)は遅れている。このような状態で映像データの復号が完了するまでまって復号された映像データを出力すると画像と音声との非同期状態となる。または映像データが完全に復号されないまま出力動作に切換えると画像破綻が生じることがある。例えば、遅延量DLが生じている時刻(T0)で、復号映像データを出力すると、画像が破綻した状態で画面表示されることがある。
【0022】
そこでこの発明の装置では、図4に示すように、復号した音声データの音声PTSと映像データの映像PTSとを比較し、プレゼンテーションタイムの差が所定値以上であるかどうかを判定している。プレゼンテーションタイムの差が所定値以上になった場合(時刻T0)、次のIピクチャまで上記の符号化映像データをスキップし、次のIピクチャを含むグループオブピクチャ(GOP)からデコードを行なう(時点T1)。そして、次のIピクチャが存在するユニットの映像PTSと音声デコーダ18でデコードされる符号化音声データに対応する音声PTSとを比較し、両者のプレゼンテーションタイムの差が所定の時間内であるか否かを判定する。ここで、プレゼンテーションタイムの差が所定の時間内である場合、映像データの復号出力を実行する。
【0023】
図5は、例えばGOP内の復号の基準となる基準ピクチャ(Iピクチャ)、Bピクチャ、Pピクチャの配置の様子を示している。今、例えばPピクチャをデコードしたとき(時刻T0)、遅延量DLがあるにも係らず復号映像データを出力すると、画像が破綻した状態で画面表示されることがある。
【0024】
そこでこの発明の装置では、図6に示すように、例えばPピクチャをデコードしたとき(時刻T0)、遅延量DLがあった場合は、先のIピクチャに関連するP,Bピクチャの復号を省略し、次のIピクチャのデコードから開始する。
【0025】
図7は上記の動作を示すフローチャートである。今、特殊再生が開始されたものとする。すると、映像デコード及び音声デコードが実行される(ステップSA1、SA2)。デコードが終わると映像PTS,音声PTSが抽出されて比較される(ステップSA3,SA4,SA5)。このとき、両者の時刻が所定の時間差を超えているか否か判定される。
【0026】
復号された音声データは、システムタイムクロックSTCと比較され、音声PTSに対してSTCが等しいか経過しているときに音声データが出力される。即ち音声データが音声処理回路に音声出力用として出力される(ステップSA7)。また映像PTS,音声PTSの時刻が所定の時間差以内であれば、復号された映像データもデコーダから映像処理回路へ出力される(ステップSA6)。
【0027】
ステップSA5において、映像PTS,音声PTSの時刻が所定の時間差を越えているようであれば、ステップSA9に移行する。ステップSA9ではデコード処理に付されるピクチャ情報を取得する。次にステップSA10に移行し、ここでは、次のIピクチャまでデコード処理をスキップさせる。つまり図6で説明したように、先のIピクチャに関連するP,Bピクチャの復号を省略し、次のIピクチャのデコードから開始する。そしてIピクチャをデコードしたところで、このIピクチャに対応する映像PTSを先の音声PTSと比較する(ステップSA11,SA12)。ここで両者の者の時刻が所定の時間差以内であるかどうかを判定する(ステップSA12)。所定の時間差以内であれば、復号された映像データがデコーダから映像処理回路へ出力される(ステップSA6)。音声PTSが進んでいる場合には、ステップSA10に戻る。音声PTSが遅れている場合、エラーであり、最初のステップに戻り、続けて特殊再生を開始する。
【0028】
上記の処理により、高度動画像圧縮符号化標準により圧縮された映像及び音声を特殊再生するときに安定した再生を行なうことができる。即ち、映像データの復号のために遅れが生じてもスキップ処理を行い、遅れの無い映像データの復号出力を得るので、表示されている画像の破綻が生じたり、音声と映像の非同期による違和感が生じるようなことが防止される。
【0029】
尚上記の説明では、映像PTSは音声PTSと比較されるとしたが、音声PTSの代わりにシステムタイムクロックSTCと比較されてもよい。
【0030】
次に、本発明の装置において取り合われるトランスポートストリームに適応されている規格について説明する。この規格は、所謂H.264/AVCと称される規格である。
【0031】
図8に示すように、映像のためのPESパケットのペイロード部には、H.264規格により符号化された符号化映像データが配置される。また音声のためのPESパケットのペイロード部には例えばAAC(Advanced Audio Coding)により符号化された符号化音声データが配置される。この符号化データの層は、NAL(Network Abstraction Layer)と称されており、NALユニットが定義されている。符号化映像データの場合、NALユニットには、符号化映像データを運ぶためのユニットの他に符号化映像データを復号するためのピクチャーパラメータセット(PPS)、シーケンスパラメータセット(SPS)などの参照用情報を運ぶためのユニットも存在する。参照用情報には、復号のための属性、参照先情報等が含まれている。従って、符号化映像データを復号するためには、これらの多くの参照用情報を再生して、参照しなければならない。
【0032】
次にPESパケットは、複数のTSパケットのペイロード部に分散配置される。TSパケットはそれぞれヘッダを有する。TSパケットは、他の情報のためのTSパケットと共に多重化されトランスポートストリームを形成する。
【0033】
図9には、PESパケットの構成を示している。PESパケットは、ヘッダとPESパケットデータバイト(このパケットが運ぶデータ)部を有する。ヘッダには、パケットスタートコード、ストリームID,PESパケット長の情報、オプショナルPESヘッダが含まれる。
【0034】
オプショナルPESヘッダには、オプショナルフィールドが含まれており、このフィールドにPTS,DTSが記述されている。
【0035】
上記したようにH.264/AVCに基づく符号化においては、映像データを復号するに当たって、事前に種々の情報を再生しなければならない。このために特殊再生のときはジャンプのたびに参照先情報を改めて取得しなければならないケースがある。このようなケースでは、ピクチャ復号前に事前の準備期間が必要となり、音声データの復号が進んでいるのに、映像データの復号が遅れる場合がある。
【0036】
H.264/AVCにおいては、上記Iピクチャは厳密には、IDR(Instantaneous Decoding Refresh)ピクチャのことであり、画像シーケンスの先頭のピクチャである。このときのデコーダでは、参照ピクチャのバッファ状態は、フレーム番号、POC(Picture
Order Count; ピクチャ出力の出力順序を示す情報)などが、ビットストリームを復号するための状態情報がリセットされる。ピクチャ単位にアクセスが得られるようにいくつかのNALユニット(IDRピクチャ、Pピクチャ、Bピクチャ、PPS,SPSなどのNALユニット)をまとめたものをアクセスユニットとして規定されている。音声データに関してはフレーム単位でアクセスが得られるように、アクセスユニットが規定されている。
【0037】
本発明の装置は、たとえば記録再生装置に適用された場合、次のような利用形態が可能である。トランスポートストリームが例えばハードディスクに記録されている途中で、ユーザがどのような番組が記録中であるのか追っかけ再生動作させることがある。このような場合の再生装置に適用することが可能である。或いは、すでにトランスポートストリームが例えばハードディスクあるいは光ディスクに記録されているとき、早送り再生により確認したいような場合にも、その再生装置に適用することが可能である。
【0038】
図10には本発明がメディア記録再生装置に適用された例を簡単に示している。図1と同一部分には同一符号を付している。アンテナより導入された放送波は、チューナ部111で所望のチャンネルが選択され、復号部112でそのトランスポートストリームが復号される。トランスポートストリームはトランスポートストリームデコーダ12に入力される。またトランスポートストリームは、記録再生装置113に入力されてハードディスクあるいは光ディスク(例えばDVD)に記録される。特殊再生時には制御部20からの制御信号が記録再生装置113に与えられ、スキップ処理が実現される。
【0039】
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【図面の簡単な説明】
【0040】
【図1】この発明の映像再生装置の一実施の形態を示す構成説明図である。
【図2】映像デコーダと音声デコーダのプレゼンテーションタイムスタンプが変化する様子を示す説明図である。
【図3】特殊再生時に映像デコーダと音声デコーダのプレゼンテーションタイムスタンプが変化する様子を示す説明図である。
【図4】本発明による装置において、殊再生時に映像デコーダと音声デコーダのプレゼンテーションタイムスタンプが変化する様子を示す説明図である。
【図5】GOP内のIピクチャ、Bピクチャ、Pピクチャの配置の様子を示す図である。
【図6】GOP内のIピクチャ、Bピクチャ、Pピクチャの配置の中で、デコード処理がスキップされた様子を示す図である。
【図7】本発明の装置において特殊再生が行なわれるときの動作を説明するフローチャートである。
【図8】H.264/AVC規格におけるPESパケットとトランスポートストリームの関係をしめす説明図である。
【図9】H.264/AVC規格におけるPESパケットの構成例を示す説明図である。
【図10】この発明が適用されたメディア記録再生装置の構成説明図である。
【符号の説明】
【0041】
12・・・トランスポートデコーダ、13・・・映像バッファ部、14・・・音声バッファ部、16・・・STC再生部、17・・・映像デコーダ、18・・・音声デコーダ、20・・・制御部。

【特許請求の範囲】
【請求項1】
映像デコーダでデコードされる符号化映像データに対応する映像プレゼンテーションタイムスタンプ(映像PTS)と、音声デコーダでデコードされる符号化音声データに対応する音声プレゼンテーションタイムスタンプ(音声PTS)とを比較し、両者の時間差が所定の時間差を超えているか否かを判定する第1の比較部と、
前記所定の時間差を超えている場合、符号化映像データを復号するために基準となる次の基準ピクチャまで前記映像デコーダの処理をスキップさせるスキップ制御部と、
前記次の基準ピクチャが存在するパケッタイズドエレメンタリーストリーム(PES)パケットの映像PTSと前記音声PTSとを比較し、両者の差が所定の時間内であるか否かを判定する第2の比較部と、
前記差が所定の時間内である場合、前記映像デコーダのデコード処理を再スタートさせ再スタート制御部を有することを特徴する映像再生装置。
【請求項2】
前記映像PTSは、映像用の前記PESパケットのヘッダに含まれており、前記音声PTSは、音声用の前記PESパケットのヘッダに含まれていることを特徴とする請求項1記載の映像再生装置。
【請求項3】
前記トランスポートストリームは、記録媒体より再生された信号であることを特徴とする請求項2記載の映像再生装置。
【請求項4】
前記基準ピクチャは、H.264/AVC規格におけるIDR(Instantaneous Decoding Refresh)ピクチャであることを特徴とする請求項2記載の映像再生装置。
【請求項5】
符号化映像データあるいは符号化音声データを含む所定単位のパケッタイズドエレメンタリーストリーム(PES)パケットが定義され、
前記PESパケットのヘッダの一部にはデータのデコード時間を指示するためのデコードタイムスタンプ(DTS)、及び再生出力時間を指示するためのプレゼンテーションタイムスタンプ(PTS)が記述され、また前記PESパケット内には、前記符号化映像データあるいは符号化音声データを配置するアクセスユニットが設定されており、
前記PESパケットは、トランスポートストリーム(TS)を形成し、それぞれシステムヘッダを有するTSパケットに分散配置されており、前記システムヘッダはプログラム時刻基準値(PCR)を含んでおり、前記TSパケットを受信して情報処理を行う装置において、
前記TSパケットのシステムヘッダから前記プログラム時刻基準値(PCR)を抽出してシステムタイムクロックを再生するSTC再生部と、
前記PESパケットのヘッダから前記DTS,前記PTSを取得する時刻情報取得部と、
前記符号化映像データを含むPESパケットから前記符号化映像データが配置されているアクセスユニットを取り込む映像バッファ部と、
前記映像バッファ部に取り込まれている符号化映像データを復号する映像デコーダと、
前記符号化音声データを含むPESパケットから前記符号化音声データが配置されているアクセスユニットを取り込む音声バッファ部と、
前記映像デコーダでデコードされる符号化映像データに対応する映像PTSと、前記音声デコーダでデコードされる符号化音声データに対応する音声PTSとを比較し、両者のプレゼンテーションタイムが所定の時間差を超えているか否かを判定する第1の比較部と、
プレゼンテーションタイムが所定の時間差を超えている場合、符号化映像データを複合するために基準となる次のIピクチャまで前記映像デコーダの処理をスキップさせるスキップ制御部と、
前記次のIピクチャが存在するPESパケットの映像PTSと前記音声デコーダでデコードされる符号化音声データに対応する音声PTSとを比較し、両者のプレゼンテーションタイムの差が所定の時間内であるか否かを判定する第2の比較部と、
前記プレゼンテーションタイムの差が所定の時間内である場合、前記映像デコーダのデコード処理を再スタートさせる再スタート制御部と、
を具備したことを特徴とする映像再生装置。
【請求項6】
トランスポートストリーム(TS)デコーダ、前記TSデコーダからの映像用のパケッタイズドエレメンタリーストリーム(PES)パケットを取り込む映像バッファ部、前記映像バッファからの符号化映像データを復号する映像デコーダ、前記TSデコーダからの音声用のパケッタイズドエレメンタリーストリーム(PES)パケットを取り込む音声バッファ部、及び前記音声バッファからの符号化音声データを復号する音声デコーダを制御部で制御する映像再生方法において、前記制御部により
前記映像デコーダでデコードされる符号化映像データに対応する映像プレゼンテーションタイムスタンプ(映像PTS)と、音声デコーダでデコードされる符号化音声データに対応する音声プレゼンテーションタイムスタンプ(音声PTS)とを比較し、両者の時間差が所定の時間差を超えているか否かを判定し、
前記所定の時間差を超えている場合、符号化映像データを復号するために基準となる次の基準ピクチャまで前記映像デコーダの処理をスキップさせ、
前記次の基準ピクチャが存在するパケッタイズドエレメンタリーストリーム(PES)パケットの映像PTSと前記音声PTSとを比較し、両者の差が所定の時間内であるか否かを判定し、
前記差が所定の時間内である場合、前記映像デコーダのデコード処理を再スタートさせることを特徴する映像再生方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2009−218934(P2009−218934A)
【公開日】平成21年9月24日(2009.9.24)
【国際特許分類】
【出願番号】特願2008−61461(P2008−61461)
【出願日】平成20年3月11日(2008.3.11)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】