説明

音声/映像同期の自動検査方法

デジタルストリームの符号化に用いられた装置の周波数を、プログラムクロック基準に基づいて計算する工程と、音声デコーディングタイムスタンプと、実際の音声デコーディング時刻との間の第1時間差を計算する工程と、音声プレゼンテーションタイムスタンプと、実際の音声プレゼンテーション時刻との間の第2時間差を計算する工程と、映像デコーディングタイムスタンプと、4つの実際の映像デコーディング時刻との間の第3時間差を計算する工程と、映像プレゼンテーションタイムスタンプと、実際の映像プレゼンテーション時刻との間の第4時間差を計算する工程と、を備える音声/映像同期を検査する方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタル信号処理の分野に関し、より具体的には、レシーバハードウェア、ソフトウェア、ハードウェア/ソフトウェアの組み合わせにおいて音声/映像の同期(AV同期)を検査するための方法に関し、デジタル信号自体の検査に、容易に拡張可能である。
【背景技術】
【0002】
MPEG(Moving Pictures Expert Group)規格は、デジタル音声/映像(A/V)圧縮規格であり、例えばデジタル衛星システム(DSS:Digital Satellite System)放送、デジタルケーブル放送およびデジタル地上波放送を含む、様々なA/V配給システムにおいて採用されている。受信端において、圧縮されたA/Vデジタルストリームを、解凍および復号する必要がある。MPEG規格は、(MPEGエンコーダの)プログラムクロック基準(PCR:Program Clock Reference)、プレゼンテーションタイムスタンプ(PTS:Presentation Time Stamp)、復号タイムスタンプ(DTS:Decode Time Stamp)およびシステムタイムクロック(STC:System Time Clock)などのフィールドを提供する。PCRは、放送ストリームを生成するMPEGエンコーダ内で、STCに対して厳密な関係を有し、したがって、エンコーダのタイムクロックをデコーダの端で複製するために用いることができる。DTSは、音声単位または映像フレームをいつ復号するかを決めるために、デコーダにより使用され、PTSは、復号された音声単位または映像フレームを、いつ提供するかを決めるために使用される。音声および映像データの両方を、適切なAV同期で復号および提供することが重要である。
【0003】
レシーバシステム(ハードウェア、ソフトウェア、または両方)を設計する際、システムのAV同期性能が、MPEG規格に準拠しているかを検査しなければならない。現在の検査では、人間によってビデオクリップを観察し、伴われる音声を聴き、受け入れ可能なAV同期の主観的な決定を行う必要がある。これは、非常に手間がかかり、不正確かつ低精度である。
【0004】
より高精度の検査では、映像にフラッシュを、音声にビープ音を加え、オシロスコープを用いてAV同期を測定する。これでもまだ、人間の観察者と、特殊な検査信号が必要であり、正確さおよび精度は、オシロスコープ作業者の技術およびオシロスコープの調整に依存している。さらに、長期の検査は、オシロスコープを調整するための人間による周期的な仲介を必要とする。これら2つの検査方法は、手間がかかり、よって高価であり、AV同期の問題の迅速なデバッグに必要な正確さまたは反復性を提供しない。よって、多くの場合、繰り返し検査を行う必要がある。
【発明の開示】
【発明が解決しようとする課題】
【0005】
したがって、非主観的であり、精度および反復性が高く、安価で長い検査時間にわたって安定したAV同期検査の方法が必要とされている。
【課題を解決するための手段】
【0006】
本発明の第1の態様は、システムタイムクロックフィールドと、プログラムクロック基準フィールドと、音声デコーディングタイムスタンプフィールドと、音声プレゼンテーションタイムスタンプフィールドと、映像デコーディングタイムスタンプフィールドと、映像プレゼンテーションタイムスタンプフィールドとを含むデジタルストリームを受信するためのデコーダ装置の音声/映像同期を検査する方法であって、プログラムクロック基準フィールドから、少なくとも2つの連続プログラムクロック基準を再生する工程と、デジタルストリームの符号化に用いられた装置の周波数を、連続プログラムクロック基準と、連続プログラムクロック基準が再生された際のデコーダタイムスタンプとに基づいて計算する工程と、音声基本ストリームと、映像基本ストリームとを、デジタルストリームから生成する工程と、音声基本ストリームから、音声デコーディングタイムスタンプフィールドからの少なくとも1つの音声デコーディングタイムスタンプを再生し、音声デコーディングタイムスタンプと、音声デコーディングタイムスタンプに対応する音声単位が復号された際の第1デコーダタイムスタンプとの間の第1時間差を計算する工程と、音声基本ストリームから、音声プレゼンテーションタイムスタンプフィールドからの少なくとも1つの音声プレゼンテーションタイムスタンプを再生し、音声プレゼンテーションタイムスタンプと、音声プレゼンテーションタイムスタンプに対応する音声単位が提供された際の第2デコーダタイムスタンプとの間の第2時間差を計算する工程と、映像基本ストリームから、映像デコーディングタイムスタンプフィールドからの少なくとも1つの映像デコーディングタイムスタンプを再生し、映像デコーディングタイムスタンプと、映像デコーディングタイムスタンプに対応する映像フレームが復号された際の第3デコーダタイムスタンプとの間の第3時間差を計算する工程と、映像基本ストリームから、映像プレゼンテーションタイムスタンプフィールドからの少なくとも1つの映像プレゼンテーションタイムスタンプを再生し、映像プレゼンテーションタイムスタンプと、映像プレゼンテーションタイムスタンプに対応する映像フレームが提供された際の第4デコーダタイムスタンプとの間の第4時間差を計算する工程と、を備える。
【0007】
本発明の第2の態様は、システムタイムクロックフィールドと、プログラムクロック基準フィールドと、音声デコーディングタイムスタンプフィールドと、音声プレゼンテーションタイムスタンプフィールドと、映像デコーディングタイムスタンプフィールドと、映像プレゼンテーションタイムスタンプフィールドとを含むデジタルストリームを受信する、検査対象のデコーダ装置の音声/映像同期を検査する方法であって、デコーダ装置の多重分離器に、プログラムクロック基準フィールドから少なくとも2つの連続プログラムクロック基準を再生し得るようにした周波数抽出モジュールを設ける工程と、デジタルストリームの符号化に用いられた装置の周波数を、連続プログラムクロック基準と、連続プログラムクロック基準が再生された際のデコーダタイムスタンプとに基づいて計算する工程と、音声基本ストリームと、映像基本ストリームとを、デジタルストリームから生成する工程と、音声基本ストリームから、音声デコーディングタイムスタンプフィールドからの少なくとも1つの音声デコーディングタイムスタンプを再生し、音声デコーディングタイムスタンプと、音声デコーディングタイムスタンプに対応する音声単位が復号された際の第1デコーダタイムスタンプとの間の第1時間差を計算し、音声基本ストリームから、音声プレゼンテーションタイムスタンプフィールドからの少なくとも1つの音声プレゼンテーションタイムスタンプを再生し、音声プレゼンテーションタイムスタンプと、音声プレゼンテーションタイムスタンプに対応する音声単位が提供された際の第2デコーダタイムスタンプとの間の第2時間差を計算し得るようにした音声デルタ計算モジュールを、音声デコーダ内に設ける工程と、映像基本ストリームから、映像デコーディングタイムスタンプフィールドからの少なくとも1つの映像デコーディングタイムスタンプを再生し、映像デコーディングタイムスタンプと、映像デコーディングタイムスタンプに対応する映像フレームが復号された際の第3デコーダタイムスタンプとの間の第3時間差を計算し、映像基本ストリームから、映像プレゼンテーションタイムスタンプフィールドからの少なくとも1つの映像プレゼンテーションタイムスタンプを再生し、映像プレゼンテーションタイムスタンプと、映像プレゼンテーションタイムスタンプに対応する映像フレームが提供された際の第4デコーダタイムスタンプとの間の第4時間差を計算し得るようにした映像デルタ計算モジュールを設ける工程と、を備える。
【0008】
本発明の第3の態様は、システムタイムクロックフィールドと、プログラムクロック基準フィールドと、音声デコーディングタイムスタンプフィールドと、音声プレゼンテーションタイムスタンプフィールドと、映像デコーディングタイムスタンプフィールドと、映像プレゼンテーションタイムスタンプフィールドとを含むデジタルストリームにおける音声/映像同期を検査する方法であって、既知の度合いの音声/映像同期を有するデコーダ装置内のデジタルストリームを受信する工程と、プログラムクロック基準フィールドから、少なくとも2つの連続プログラムクロック基準を再生する工程と、デジタルストリームの符号化に用いられた装置の周波数を、連続プログラムクロック基準と、連続プログラムクロック基準が再生された際のデコーダタイムスタンプとに基づいて計算する工程と、音声基本ストリームと、映像基本ストリームとを、デジタルストリームから生成する工程と、音声基本ストリームから、音声デコーディングタイムスタンプフィールドからの少なくとも1つの音声デコーディングタイムスタンプを再生し、音声デコーディングタイムスタンプと、音声デコーディングタイムスタンプに対応する音声単位が復号された際の第1デコーダタイムスタンプとの間の第1時間差を計算する工程と、音声基本ストリームから、音声プレゼンテーションタイムスタンプフィールドからの少なくとも1つの音声プレゼンテーションタイムスタンプを再生し、音声プレゼンテーションタイムスタンプと、音声プレゼンテーションタイムスタンプに対応する音声単位が提供された際の第2デコーダタイムスタンプとの間の第2時間差を計算する工程と、映像基本ストリームから、映像デコーディングタイムスタンプフィールドからの少なくとも1つの映像デコーディングタイムスタンプを再生し、映像デコーディングタイムスタンプと、映像デコーディングタイムスタンプに対応する映像フレームが復号された際の第3デコーダタイムスタンプとの間の第3時間差を計算する工程と、映像基本ストリームから、映像プレゼンテーションタイムスタンプフィールドからの少なくとも1つの映像プレゼンテーションタイムスタンプを再生し、映像プレゼンテーションタイムスタンプと、映像プレゼンテーションタイムスタンプに対応する映像フレームが提供された際の第4デコーダタイムスタンプとの間の第4時間差を計算する工程と、を備える。
【0009】
本発明の特性は、添付された特許請求の範囲において定められる。しかしながら、本発明自体は、以下の例示的な実施形態の詳細な説明を参考にして、添付の図面と併せて読まれた場合に、最も良く理解されるであろう。
【発明を実施するための最良の形態】
【0010】
MPEGの用語およびデータ構造を、本発明の説明に使用する。MPEGという用語は、MPEG−1、MPEG−2、MPEG−4、MPEG−7、デジタル衛星システム(DSS:Digital Satellite System)データ構造、あるいは、MPEG規格と共通デジタルストリーム構造を共有する他の規格またはMPEG規格に基づいて構築された他の規格と、置き換え可能であることを理解されたい。また、MPEGという用語は、前述の規格のすべてを含むことを目的としている。
【0011】
本発明は、上述のデータ構造または規格のいずれかを利用する製品に適用可能であり、この製品は、デジタルおよびハイブリッドテレビジョン、デジタルビデオディスクプレイヤー、MPEGプレイヤー、およびセットトップボックスを含み、かつこれらに限定されない。
【0012】
しかしながら、本発明は、MPEG符号化信号を受信するMPEGレシーバ向けに説明される。
【0013】
図1〜図3は、本発明を理解するための補助として提供され、単にMPEG規格のデジタルストリーム構造を示している。
【0014】
図1は、MPEGトランスポートストリームのデータ構造の概略図である。トランスポートストリームは、複数のプログラムを搬送する。トランスポートストリームは、複数の188バイト単位により構成され、各単位は、ヘッダおよびペイロードを含んでいる。ヘッダは、同期バイト(sync byte)フィールド、トランスポートエラー標識(transport error indicator)フィールド、ペイロード単位開始標識(payload unit start indicator)フィールド、トランスポート優先度(transport priority)フィールド、パケットID(PID)フィールド、トランスポートスクランブリング制御(transport scrambling control)フィールド、適応フィールド制御(adaptation field control)フィールド、連続性カウンタ(continuity counter)フィールドおよび適応(adaptation)フィールド、の各フィールドに分割される。PIDフィールドが、本発明において特に関心が持たれるフィールドである。
【0015】
適応フィールドは、適応フィールド長(adaptation field length)フィールド、非連続性カウンタ(discontinuity counter)フィールド、ランダムアクセス標識(random access indicator)フィールド、基本ストリーム優先度標識(elementary stream priority indicator)フィールド、任意フィールドのフィールドをポイントする5フラグ(5 flags pointing to an optional fields field)のフィールドおよびスタッフィングバイト(stuffing bytes)フィールド、の各フィールドにさらに分割される。
【0016】
任意フィールドのフィールドは、プログラムクロック基準(PCR:Program Clock Reference)フィールド、旧プログラムクロック基準(OPCR:Old Program Clock Reference)フィールド、スプライスカウンタ(splice counter)フィールド、トランスポートプライベートデータ長(transport private data length)フィールド、トランスポートプライベートデータ(transport private data)フィールド、適応フィールド拡張長(adaptation field extension length)フィールドおよび任意フィールドのフィールドをポイントする3つのフラグ(three flags pointing to an optional fields field)のフィールド、にさらに分割される。PCRフィールドが、本発明において特に関心が持たれるフィールドである。
【0017】
任意フィールドのフィールドは、図1に示されるように、さらなるフィールドに分割される。
【0018】
各ペイロードは、一般的に、パケット化基本ストリーム(PES:Packetized Elementary Stream)の断片の形式のデータを含んでいる。しかしながら、他のデータフォーマットのデータを、ペイロードに組み込むこともできる。映像、音声、エンタイトルメント管理メッセージおよびエンタイトルメント制御メッセージデータが、常にPESフォーマットに組み込まれる。MPEGのPESストリームのデータ構造を、図3に示し、以下に説明する。
【0019】
図2は、MPEGプログラムストリームのデータ構造の概略図である。プログラムストリームは、複数のパックで構成される可変長構造であり、各パックはパックヘッダおよび1つまたは複数のPESパケットに分割される。プログラムストリームは、1つのプログラムのみを搬送する。MPEGのPESストリームのデータ構造を、図3に示し、以下に説明する。パックヘッダは、パック開始コード(pack start code)フィールド、“01’”フィールド、システムクロック基準(SCR:System Clock Reference)フィールド、プログラムMUXレートフィールド(program MUX rate field)、パックスタッフィング長(pack stuffing length)フィールド、パックスタッフィングバイト(pack stuffing byte)フィールドおよびシステムヘッダ(system header)フィールド、の各フィールドに分割される。
【0020】
システムヘッダフィールドは、システムヘッダ開始コード(system header start code)フィールド、ヘッダ長(header length)フィールド、レートバウンド(rate bound)フィールド、音声バウンド(audio bound)フィールド、固定フラグ(fixed flag)フィールド、CSPSフラグ、映像バウンド(video bound)フィールドおよびNループ(N loop)フィールド、にさらに分割される。
【0021】
Nループフィールドは、ストリームIDフィールド、“11”フィールド、P−stdバッファバウンドスケール(buffer bound scale)フィールド、P−stdバッファサイズバウンド(buffer size bound)フィールド、および他のフィールドにさらに分割される。
【0022】
図3は、MPEGパケット化基本ストリーム(PES)のデータ構造の概略図である。PESストリームは、パケット開始コードプレフィクス(packet start code prefix)フィールド、ストリームID(stream ID)フィールド、PESパケット長(PES packet length)フィールド、任意PESヘッダ(optional PES header)フィールドおよび実際のPESパケットデータ(actual PES packet data)のためのフィールドにより構成される可変長構造である。任意PESヘッダフィールドは、図3に示すように分割およびサブ分割される。任意PESヘッダフィールドの任意フィールドのPTS/DTSフィールドが、本発明において特に関心が持たれるフィールドである。
【0023】
図4は、本発明に係る好適なシステムの概略ブロック図である。図4において、レシーバ100は、条件アクセスサブシステム110を含むレシーバコントローラ105と、変調MPEGストリーム120(デジタルストリーム)を受信し、暗号化MPEGストリーム125をMPEGストリーム多重分離および解読器130に渡すための同調および復調器115と、を含む。条件アクセスサブシステム110は、解読サポートを、MPEGストリーム多重分離および解読器130に提供する機能を含む。条件アクセスサブシステム110は、オプションであり、変調MPEGストリーム120が暗号化される際にのみ必要とされる。同様に、MPEG多重分離および解読器130は、変調MPEGストリーム120が暗号化されている場合にのみ解読能力を有する必要がある。MPEG多重分離および解読器130は、トランスポートストリーム125を、音声基本ストリーム(ES:Elementary Stream)140および映像ESストリーム145に変換する。
【0024】
音声デコーダ150は、音声基本ストリーム140を受信し、音声ESを再生可能な音声出力155に変換する。映像デコーダ160は、映像ESストリーム145を受信し、映像ESを再生可能な映像出力165に変換する。音声出力155および映像出力165の両方は、通常のテレビジョン、オーディオおよび/またはコンピュータ機器での使用に適している。様々な制御信号170が、レシーバコントローラ105(または条件アクセスサブシステム110)により、MPEG多重分離および解読器130、音声デコーダ155および映像デコーダ160に送られ、MPEG多重分離および解読器ならびに音声および映像デコーダの動作を制御および調整する。
【0025】
レシーバ100は、ローカルシステムタイムクロック(STC:System Time Clock)175および記憶サブシステム180をさらに含む。記憶サブシステム180は、ハードディスク、書き換え可能CDドライブ、書き換え可能DVDドライブ、半導体記憶装置またはテープなどの記憶メディアを備えてもよい。ローカルSTC175は、MPEGストリーム多重分離および解読器130より、再生されたPCR信号185を受信し、ローカルタイム信号(LTS)190を生成する。LTS190は、音声デコーダ155および映像デコーダ160に供給される。PCR信号185は、図1で示されるように、MPEGトランスポートストリーム内のPCRフィールドから再生されたPCRのストリームである。
【0026】
AV同期には5つの尺度がある。第1の尺度は、デコーダSTC175の周波数である。エンコーダSTC(変調MPEGストリーム120を生成したユニット内のSTC)の周波数は、通常、一例として、標準FREQENCODER=27MHz+/−810サイクルで流れる。デコーダSTC175の周波数は、FREQDECODER=((PCRT−1)−(PCRT))/(TT−1−TT)の式で計算され、ただし、PCRTはローカルタイムTTにおいて再生されたPCRであり、PCRT−1は、ローカルタイムTT−1において再生されたPCRである。FREQDECODERが、所定の27MHz+/−810サイクルとは異なる場合、レシーバ100は、本質的にAV同期状態の外にあり、その理由は、音声単位および映像フレームの復号および提供のすべてのクロック動作が、音声および映像が符号化された際に用いられた時間関係とは異なる時間関係で行われるためである。この目的のために、MPEGストリーム多重分離および解読器130に、周波数抽出モジュール195が設けられ、これは、タイムスタンプが付された周波数データ200を、記憶サブシステム180に送る。
【0027】
AV同期の第2の尺度は、再生された音声DTSと実際の音声デコーディングタイム(LTSAD)の間の差(_dta)であり、これは_dta=DTS−LTSADとして表現することができる。AV同期の第3の尺度は、再生された音声PTSと実際の音声プレゼンテーションタイム(LTSAP)の間の差(_pta)であり、これは_dpa=PTS−LTSAPとして表すことができる。DTSおよびPTSは、図3に示されるMPEGのPESのPTS/DTSフィールドから再生される。完璧なAV同期のためには、_dtaおよび_ptaは、ゼロに等しい。_dtaがゼロに等しくない場合、音声単位の復号は、これらの音声単位の符号化がエンコーダで行われたタイミングと同じタイミング関係では行われない。_ptaがゼロに等しくない場合、レシーバ100における音声単位の提供は、音声単位がエンコーダで符号化のために提供された際と同じタイミング関係では行われない。この目的のために、音声デコーダ150に、音声デルタ計算モジュール205を設ける。音声デルタ計算モジュール205は、タイムスタンプが付された_dtaおよびpta(信号210)を、記憶サブシステム180に送る。
【0028】
AV同期の第4の尺度は、再生される映像DTSと実際の映像デコーディングタイム(LTSVD)の間の差(_dtv)であり、これは_dtv=DTS−LTSvDとして表わすことができる。AV同期の第5の尺度は、再生される映像PTSと実際の映像プレゼンテーションタイム(LTSVP)の間の差(_ptv)であり、これは_dpva=PTS−LTSVPとして表わすことができる。DTSとPTSは、図3に示されるMPEGのPESのPTS/DTSフィールドから再生される。完璧なAV同期のためには、_dtvおよび_ptvは、ゼロに等しい。_dtvがゼロに等しくない場合、映像単位(一般的にはフレーム)の復号は、これらの映像単位の符号化がエンコーダで行われたタイミングと同じタイミング関係では行われない。_ptvがゼロに等しくない場合、レシーバ100における映像単位のプレゼンテーションは、映像単位がエンコーダで符号化のために提供された際と同じタイミング関係では行われない。この目的のために、映像デコーダ160に、映像デルタ計算モジュール215を設ける。映像デルタ計算モジュール215は、タイムスタンプが付された_dtvおよびptv(信号220)を、記憶サブシステム180に送る。
【0029】
LTSタイムスタンプに沿う、FREQDECODER、_dta、_pta、_dtvおよび_ptvは、記憶サブシステム180の表225に集められる。作業においては、レシーバ100の検査の間に、既知の良好なMPEGストリームがレシーバに供給され、FREQDECODER、_dta、_pta、_dtvおよび_ptvは、周期的にサンプリングされ、テーブル225に加えられる。これは、どのような作業者の仲介もなく行われ、所望の短い時間間隔または長い時間間隔にわたって行うことができ、所望の数の異なるMPEGストリームを用いて行うことができる。検査の終わりに、表225がコンピュータ230にダウンロードされ、LTS、FREQDECODER、_dta、_pta、_dtvおよび_ptvの分析が行われる。
【0030】
代わりの実施形態において、記憶サブシステム180は、レシーバシステム100の代わりに、コンピュータ230内に存在する。
【0031】
検査では、レシーバ100のハードウェアとソフトウェアの両方が検査される。ハードウェアまたはソフトウェアにて検出されたエラーを、次いで固定して、所望の検査結果が得られるまで追加の検査を行うことができる。周波数抽出モジュール195、音声デルタ計算モジュール205および映像デルタ計算モジュール215は、通常、ソフトウェアで実施され、レシーバ100にロードされるソフトウェアのテストバージョンのみで実施される。周波数抽出器195、音声デルタ計算モジュール205および映像デルタ計算モジュール215は、通常、製品ハードウェアと共に出荷されるソフトウェア内では提供されない。人間の仲介がないため、検査は、従来の検査手段により得られていた検査よりも徹底的であり、正確かつ高精度である。
【0032】
図5は、本発明の第1実施形態のフローチャートである。ステップ250において、既知の良好なMPEGストリームが受信される。既知の良好なMPEGストリームは、1レベルであり、これはMPEGに準拠するストリームであり、他のレベルは、図4に示される上述の検査システムにおいて、FREQDECODER=27KHz+/−810サイクル、_dta=0、_pta=0、_dtv=0および_ptv=0を供給することが知られているストリームである。FREQDECODERは、正確に27MHz+/−810サイクルに等しい必要はないが、供給される音声および映像信号が、同期を外れずに視聴者によって知覚されるように十分に近い必要がある。同様に、_dta、_pta、_dtvおよび_ptvは、正確にゼロである必要はないが、供給される音声および映像信号が、同期を外れずに視聴者によって知覚されるように十分にゼロに近い必要がある。
【0033】
ステップ255において、MPEGストリームは、多重分離および任意に解読される。ステップ260において、MPEGトランスポートストリームからのPCRが再生され、エンコーダ周波数FREQDECODERが、上述したように計算される。計算された周波数は、ステップ265においてローカルタイム(レシーバタイム)と共に記憶される。ステップ255、260および265は、新たなPCRが検出されるたびに継続的に反復される。
【0034】
ステップ270において、音声単位の場合では、_dtaおよび_ptaの値が、図4を参考に上述したように計算され、_dtaおよび_ptaの値は、ステップ265においてローカルタイム(レシーバタイム)と共に記憶される。音声単位の場合、_dtvおよび_ptvの値が、図4を参考に上述したように計算され、_dtvおよび_ptvの値は、ステップ265においてローカルタイム(レシーバタイム)と共に記憶される。ステップ275は、次の音声または映像単位が検出されるまでの遅延を生成し、次いで方法は、ステップ270にループバックされる。音声/映像単位の検出は、図3に示されるMPEGのPESにおけるPTS/DTSフィールドを検出することにより達成される。音声単位またはビデオ単位の決定は、図1に示されるトランスポートストリームのPIDフィールドに基づく。
【0035】
ステップ280において、記憶されタイムスタンプが付されたFREQDECODER、_dta、_pta、_dtvおよび_ptvの値を、検査の間または終了後の任意の時刻にリアルタイムで再検査することができる。タイムスタンプは、FREQDECODER、_dta、_pta、_dtvの特定の値または時間範囲を、特定の一時音声および映像単位に関連付けることを可能にし、とりわけ内容に関係し得る問題のハードウェアおよびソフトウェアデバッグにおいて大きな補助となる。
【0036】
図6は、本発明の第2実施形態のフローチャートである。図4に示される、上述したレシーバを用いて、MPEGストリームを、AV同期に関するMPEG規格への準拠について検査することができる。必要なものは、高度のAV同期が可能であることが知られているハードウェア/ソフトウェアの組合せだけである。したがって、図6のステップ305、310、315、320、325および330は、上述した図5の各ステップ250、255、260、265、270、275および280と同一である。大きな違いは、ステップ300において、未知のAV同期の質のMPEGストリームが受信されることである。ステップ330において、記憶されタイムスタンプが付されたFREQDECODER、_dta、_pta、_dtvおよび_ptvの値を、検査の間または終了後の任意の時刻にリアルタイムで再検査することができる。タイムスタンプは、FREQDECODER、_dta、_pta、_dtvの特定の値または時間範囲を、特定の一時音声および映像単位に関連付けることを可能にし、AV同期の問題の原因であるMPEGストリームあるいは音声または映像単位の特定の部分の決定において大きな補助となる。
【0037】
以上、本発明の理解のために、本発明の実施形態を説明した。本発明は、本明細書に記載される特定の実施形態に限定されず、しかし、本発明の範囲を逸脱することなく、ここで当業者に明らかになるような様々な修正、再構成および代替が可能であるものと理解される。したがって、添付の特許請求の範囲は、すべてのこのような修正および変更を、本発明の真の要旨および範囲に入るものとして包含することを意図するものである。
【図面の簡単な説明】
【0038】
【図1】図1は、MPEGトランスポートストリームのデータ構造の概略図である。
【図2】図2は、MPEGプログラムストリームのデータ構造の概略図である。
【図3】図3は、MPEGパケット化基本ストリームのデータ構造の概略図である。
【図4】図4は、本発明に係る好適なシステムの概略ブロック図である。
【図5】図5は、本発明の第1実施形態のフローチャートである。
【図6】図6は、本発明の第2実施形態のフローチャートである。

【特許請求の範囲】
【請求項1】
システムタイムクロックフィールドと、プログラムクロック基準フィールドと、音声デコーディングタイムスタンプフィールドと、音声プレゼンテーションタイムスタンプフィールドと、映像デコーディングタイムスタンプフィールドと、映像プレゼンテーションタイムスタンプフィールドとを含むデジタルストリームを受信するためのデコーダ装置の音声/映像同期を検査する方法であって、
前記プログラムクロック基準フィールドから、少なくとも2つの連続プログラムクロック基準を再生する工程と、
前記デジタルストリームの符号化に用いられた装置の周波数を、前記連続プログラムクロック基準と、前記連続プログラムクロック基準が再生された際のデコーダタイムスタンプとに基づいて計算する工程と、
音声基本ストリームと、映像基本ストリームとを、前記デジタルストリームから生成する工程と、
前記音声基本ストリームから、前記音声デコーディングタイムスタンプフィールドからの少なくとも1つの音声デコーディングタイムスタンプを再生し、前記音声デコーディングタイムスタンプと、前記音声デコーディングタイムスタンプに対応する音声単位が復号された際の第1デコーダタイムスタンプとの間の第1時間差を計算する工程と、
前記音声基本ストリームから、前記音声プレゼンテーションタイムスタンプフィールドからの少なくとも1つの音声プレゼンテーションタイムスタンプを再生し、前記音声プレゼンテーションタイムスタンプと、前記音声プレゼンテーションタイムスタンプに対応する音声単位が提供された際の第2デコーダタイムスタンプとの間の第2時間差を計算する工程と、
前記映像基本ストリームから、前記映像デコーディングタイムスタンプフィールドからの少なくとも1つの映像デコーディングタイムスタンプを再生し、前記映像デコーディングタイムスタンプと、前記映像デコーディングタイムスタンプに対応する映像フレームが復号された際の第3デコーダタイムスタンプとの間の第3時間差を計算する工程と、
前記映像基本ストリームから、前記映像プレゼンテーションタイムスタンプフィールドからの少なくとも1つの映像プレゼンテーションタイムスタンプを再生し、前記映像プレゼンテーションタイムスタンプと、前記映像プレゼンテーションタイムスタンプに対応する映像フレームが提供された際の第4デコーダタイムスタンプとの間の第4時間差を計算する工程と、
を備えることを特徴とする方法。
【請求項2】
前記計算された周波数と、前記第1時間差と、前記第2時間差と、前記第3時間差と、前記第4時間差とを記憶する工程をさらに含む、ことを特徴とする請求項1に記載の方法。
【請求項3】
前記計算された周波数が計算された際のデコーダタイムスタンプと、前記第1デコーダタイムスタンプと、前記第2デコーダタイムスタンプと、前記第3デコーダタイムスタンプと、前記第4デコーダタイムスタンプとを記憶する工程をさらに含む、ことを特徴とする請求項2に記載の方法。
【請求項4】
前記計算された周波数と、前記第1時間差と、前記第2時間差と、前記第3時間差と、前記第4時間差とを記憶する前記工程と、前記計算された周波数が計算された際のデコーダタイムスタンプと、前記第1デコーダタイムスタンプと、前記第2デコーダタイムスタンプと、前記第3デコーダタイムスタンプと、前記第4デコーダタイムスタンプとを記憶する前記工程では、前記デコーダ装置の内部にある記憶メディアに記憶される、ことを特徴とする請求項3に記載の方法。
【請求項5】
前記計算された周波数と、前記第1時間差と、前記第2時間差と、前記第3時間差と、前記第4時間差とを記憶する前記工程と、前記計算された周波数が計算された際のデコーダタイムスタンプと、前記第1デコーダタイムスタンプと、前記第2デコーダタイムスタンプと、前記第3デコーダタイムスタンプと、前記第4デコーダタイムスタンプとを記憶する前記工程では、前記デコーダ装置の外部にある記憶メディアに記憶される、ことを特徴とする請求項3に記載の方法。
【請求項6】
前記第1、第2、第3および第4デコーダタイムスタンプを、前記デジタルストリームの前記プログラムクロック基準フィールドから再生されるプログラムクロック基準に基づいて生成する工程をさらに含む、ことを特徴とする請求項1に記載の方法。
【請求項7】
前記第1、第2、第3および第4デコーダタイムスタンプを、前記デジタルストリームの符号化に用いられた前記装置の前記周波数に基づいて生成する工程をさらに含む、ことを特徴とする請求項1に記載の方法。
【請求項8】
前記計算された周波数を、前記エンコーダ周波数の既知の値と比較する工程と、
前記第1時間差をゼロと、前記第2時間差をゼロと、前記第3時間差をゼロと、前記第4時間差をゼロと比較する工程と、
をさらに含むことを特徴とする請求項1に記載の方法。
【請求項9】
システムタイムクロックフィールドと、プログラムクロック基準フィールドと、音声デコーディングタイムスタンプフィールドと、音声プレゼンテーションタイムスタンプフィールドと、映像デコーディングタイムスタンプフィールドと、映像プレゼンテーションタイムスタンプフィールドとを含むデジタルストリームを受信する、検査対象のデコーダ装置の音声/映像同期を検査する方法であって、
前記デコーダ装置の多重分離器に、前記プログラムクロック基準フィールドから少なくとも2つの連続プログラムクロック基準を再生し得るようにした周波数抽出モジュールを設ける工程と、
前記デジタルストリームの符号化に用いられた装置の周波数を、前記連続プログラムクロック基準と、前記連続プログラムクロック基準が再生された際のデコーダタイムスタンプとに基づいて計算する工程と、
音声基本ストリームと、映像基本ストリームとを、前記デジタルストリームから生成する工程と、
前記音声基本ストリームから、前記音声デコーディングタイムスタンプフィールドからの少なくとも1つの音声デコーディングタイムスタンプを再生し、前記音声デコーディングタイムスタンプと、前記音声デコーディングタイムスタンプに対応する音声単位が復号された際の第1デコーダタイムスタンプとの間の第1時間差を計算し、前記音声基本ストリームから、前記音声プレゼンテーションタイムスタンプフィールドからの少なくとも1つの音声プレゼンテーションタイムスタンプを再生し、前記音声プレゼンテーションタイムスタンプと、前記音声プレゼンテーションタイムスタンプに対応する音声単位が提供された際の第2デコーダタイムスタンプとの間の第2時間差を計算し得るようにした音声デルタ計算モジュールを、音声デコーダ内に設ける工程と、
前記映像基本ストリームから、前記映像デコーディングタイムスタンプフィールドからの少なくとも1つの映像デコーディングタイムスタンプを再生し、前記映像デコーディングタイムスタンプと、前記映像デコーディングタイムスタンプに対応する映像フレームが復号された際の第3デコーダタイムスタンプとの間の第3時間差を計算し、前記映像基本ストリームから、前記映像プレゼンテーションタイムスタンプフィールドからの少なくとも1つの映像プレゼンテーションタイムスタンプを再生し、前記映像プレゼンテーションタイムスタンプと、前記映像プレゼンテーションタイムスタンプに対応する映像フレームが提供された際の第4デコーダタイムスタンプとの間の第4時間差を計算し得るようにした映像デルタ計算モジュールを設ける工程と、
を備えることを特徴とする方法。
【請求項10】
前記計算された周波数と、前記第1時間差と、前記第2時間差と、前記第3時間差と、前記第4時間差とを記憶する工程と、
前記計算された周波数が計算された際のデコーダタイムスタンプと、前記第1デコーダタイムスタンプと、前記第2デコーダタイムスタンプと、前記第3デコーダタイムスタンプと、前記第4デコーダタイムスタンプとを記憶する工程と、
をさらに含むことを特徴とする請求項9に記載の方法。
【請求項11】
前記計算された周波数を、前記エンコーダ周波数の既知の値と比較する工程と
前記第1時間差を第1所定値と、前記第2時間差を第2所定値と、前記第3時間差を第3所定値と、前記第4時間差を第4所定値と比較する工程と、
をさらに含むことを特徴とする請求項9に記載の方法。
【請求項12】
前記デコーダ装置を、前記エンコーダ周波数の既知の値と異なる前記計算された周波数に応じて、所定量で修正する工程と、
前記デコーダを、前記第1、第2、第3および第4所定値とそれぞれ異なる前記第1時間差、前記第2時間差、前記第3時間差または前記第4時間差に応じて、第1、第2、第3および第4の所定量によりそれぞれ修正する工程と、
をさらに含むことを特徴とする請求項11に記載の方法。
【請求項13】
検査が終了した後に、前記周波数抽出モジュールと、前記音声デルタ計算モジュールと、前記映像デルタ計算モジュールと、を前記デコーダ装置から取り除く工程をさらに含む、ことを特徴とする請求項9に記載の方法。
【請求項14】
前記第1、第2、第3および第4デコーダタイムスタンプを、前記デジタルストリームの前記プログラムクロック基準フィールドから再生されるプログラムクロック基準に基づいて生成する工程をさらに含む、ことを特徴とする請求項9に記載の方法。
【請求項15】
前記第1、第2、第3および第4デコーダタイムスタンプを、前記デジタルストリームの符号化に用いられた前記装置の前記周波数に基づいて生成する工程をさらに含む、ことを特徴とする請求項9に記載の方法。
【請求項16】
システムタイムクロックフィールドと、プログラムクロック基準フィールドと、音声デコーディングタイムスタンプフィールドと、音声プレゼンテーションタイムスタンプフィールドと、映像デコーディングタイムスタンプフィールドと、映像プレゼンテーションタイムスタンプフィールドとを含むデジタルストリームにおける音声/映像同期を検査する方法であって、
既知の度合いの音声/映像同期を有するデコーダ装置内の前記デジタルストリームを受信する工程と、
前記プログラムクロック基準フィールドから、少なくとも2つの連続プログラムクロック基準を再生する工程と、
前記デジタルストリームの符号化に用いられた装置の周波数を、前記連続プログラムクロック基準と、前記連続プログラムクロック基準が再生された際のデコーダタイムスタンプとに基づいて計算する工程と、
音声基本ストリームと、映像基本ストリームとを、前記デジタルストリームから生成する工程と、
前記音声基本ストリームから、前記音声デコーディングタイムスタンプフィールドからの少なくとも1つの音声デコーディングタイムスタンプを再生し、前記音声デコーディングタイムスタンプと、前記音声デコーディングタイムスタンプに対応する音声単位が復号された際の第1デコーダタイムスタンプとの間の第1時間差を計算する工程と、
前記音声基本ストリームから、前記音声プレゼンテーションタイムスタンプフィールドからの少なくとも1つの音声プレゼンテーションタイムスタンプを再生し、前記音声プレゼンテーションタイムスタンプと、前記音声プレゼンテーションタイムスタンプに対応する音声単位が提供された際の第2デコーダタイムスタンプとの間の第2時間差を計算する工程と、
前記映像基本ストリームから、前記映像デコーディングタイムスタンプフィールドからの少なくとも1つの映像デコーディングタイムスタンプを再生し、前記映像デコーディングタイムスタンプと、前記映像デコーディングタイムスタンプに対応する映像フレームが復号された際の第3デコーダタイムスタンプとの間の第3時間差を計算する工程と、
前記映像基本ストリームから、前記映像プレゼンテーションタイムスタンプフィールドからの少なくとも1つの映像プレゼンテーションタイムスタンプを再生し、前記映像プレゼンテーションタイムスタンプと、前記映像プレゼンテーションタイムスタンプに対応する映像フレームが提供された際の第4デコーダタイムスタンプとの間の第4時間差を計算する工程と、
を備えることを特徴とする方法。
【請求項17】
前記デコーダ装置は、前記デジタルストリームの符号化に用いられた前記装置の前記周波数を生成し得るようにした周波数抽出モジュールと、前記第1および第2時間差を生成し得るようにした音声デルタ計算モジュールと、前記第3および第4時間差を生成し得るようにした映像デルタ計算モジュールとを含む、ことを特徴とする請求項16に記載の方法。
【請求項18】
前記計算された周波数と、前記第1時間差と、前記第2時間差と、前記第3時間差と、前記第4時間差とを記憶する工程と、
前記計算された周波数が計算された際のデコーダタイムスタンプと、前記第1デコーダタイムスタンプと、前記第2デコーダタイムスタンプと、前記第3デコーダタイムスタンプと、前記第4デコーダタイムスタンプとを記憶する工程と、
をさらに含むことを特徴とする請求項16に記載の方法。
【請求項19】
前記第1、第2、第3および第4デコーダタイムスタンプを、前記デジタルストリームの前記プログラムクロック基準フィールドから再生されるプログラムクロック基準に基づいて生成する工程、または、前記第1、第2、第3および第4デコーダタイムスタンプを、前記デジタルストリームの符号化に用いられた前記装置の前記周波数に基づいて生成する工程、をさらに含むことを特徴とする請求項16に記載の方法。
【請求項20】
前記計算された周波数を、所定の周波数と比較する工程と、
前記第1時間差を第1所定値と、前記第2時間差を第2所定値と、前記第3時間差を第3所定値と、前記第4時間差を第4所定値と比較する工程と、
をさらに含むことを特徴とする請求項16に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2006−509409(P2006−509409A)
【公表日】平成18年3月16日(2006.3.16)
【国際特許分類】
【出願番号】特願2004−556656(P2004−556656)
【出願日】平成15年11月26日(2003.11.26)
【国際出願番号】PCT/IB2003/005457
【国際公開番号】WO2004/052021
【国際公開日】平成16年6月17日(2004.6.17)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)
【氏名又は名称原語表記】Koninklijke Philips Electronics N.V.
【住所又は居所原語表記】Groenewoudseweg 1,5621 BA Eindhoven, The Netherlands
【Fターム(参考)】