説明

映像音声同期検出装置、および検証機能付き映像音声再生システム

【課題】映像音声同期検出装置により、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価する。
【解決手段】出力タイミング部122は、映像データ復号部112が所定の復号映像データを出力する映像データ出力タイミング、および音声データ復号部113が所定の復号音声データを出力する音声データ出力タイミングを検出する。再生基準時刻取得部125は、符号化映像データまたは符号化音声データに含まれる再生時刻情報に基づいて、上記所定の1画像の復号映像データが出力されるべき映像再生基準時刻と上記所定の連続音声データが出力されるべき音声再生基準時刻とを取得する。算出部126は、映像データ出力タイミングと音声データ出力タイミングとの間隔である映像音声出力間隔と、映像再生基準時刻と音声再生基準時刻との基準間隔との差を同期ずれ時間として算出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化された映像データと音声データを復号し、復号した映像データと音声データを再生時刻情報を用いて同期させて出力する装置の同期動作を、出力される映像データと音声データの同期を測定することによって検証する技術に関するものである。
【背景技術】
【0002】
従来、MPEG(Moving Picture Experts Group)規格等を適用し、別々に圧縮し、多重化して映像データおよび音声データを伝送したり記憶媒体に記録する技術が知られている。このような技術を用いて伝送または記録された多重化圧縮データは、再生装置に入力され、多重分離される。そして、分離された映像データと音声データがそれぞれ伸長されて再生される。このようないわゆるコーデックシステムにおいては、多重化する際に、映像データと音声データに、それぞれ各所定単位のデータの再生時刻を示すタイムスタンプと呼ばれる再生時刻情報が埋め込まれる。そして、再生装置がそのタイムスタンプに基づくタイミングで映像データと音声データとを再生する。
【0003】
ここで、再生装置が正常にタイムスタンプに基づくタイミングで映像データと音声データを再生しているかを検証する方法として、再生される映像と音声が同期しているか、例えば、人間が話す時の唇の動きと声が同期しているかを人間が観察することによって検証する方法がある。
【0004】
ところが、このように人間が観察して検証する方法には、定量的な評価ができないという問題がある。そこで、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを定量的に評価できるようにするAV同期検出装置が特許文献1に提案されている。
【0005】
同文献の図1に示されるAV同期検出装置において、映像信号発生手段1は、フレーム番号に対応した時刻が画面右下にスーパーインポーズされた映像の映像データを発生する。一方、タイムコード発生手段3は、LTC(Longitudinal Time Code)信号を使用してタイムコードを発生する。そして、表示装置10に表示される映像の画面右下にスーパーインポーズされた時刻と、タイムコード読取手段12に表示されるタイムコードとが比較される。この比較により、タイムスタンプで示される再生タイミングと実際に再生されるタイミングの時間差を算出することができる。つまり、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを定量的に評価できる。
【特許文献1】特開平8−172597号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上記従来のAV同期検出装置による検証方法では、時刻情報が付された状態で再生される映像データと音声データを用いてしか評価できない。したがって、映像信号発生手段1やタイムコード発生手段3等の、時刻情報が付された状態で再生される映像データと音声データを生成するための特別な装置が必要となっていた。また、タイムコード読取手段12等の、再生される音声データから時刻情報を読み取るための装置も必要となっていた。
【0007】
本発明は、上記の点に鑑み、映像音声同期検出装置により、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できるようにする。
【課題を解決するための手段】
【0008】
上記の課題を解決するため、請求項1の発明は、
符号化映像データおよび符号化音声データを復号し、復号映像データと復号音声データとを同期させて出力する映像音声再生装置の同期動作を検証するための映像音声同期検出装置であって、
上記映像音声再生装置が所定の1画像の復号映像データを出力する映像データ出力タイミング、および上記映像音声再生装置が所定単位時間連続する所定の連続復号音声データを出力する音声データ出力タイミングを検出する出力タイミング検出部と、
上記符号化映像データまたは符号化音声データに含まれる再生時刻情報に基づいて、上記所定の1画像の復号映像データが出力されるべき映像再生基準時刻と上記所定の連続音声データが出力されるべき音声再生基準時刻とを取得する再生基準時刻取得部と、
上記映像データ出力タイミングと上記音声データ出力タイミングとの間隔である映像音声出力間隔と、上記映像再生基準時刻と上記音声再生基準時刻との基準間隔との差を同期ずれ時間として算出する算出部と、
を備えたことを特徴とする。
【0009】
これにより、映像データ出力タイミングと音声データ出力タイミングとの差である映像音声出力間隔と映像再生基準時刻と音声再生基準時刻との差である基準間隔との差を同期ずれ時間として算出することにより、映像データと音声データとの同期を定量的に評価できる。
【0010】
請求項2の発明は、
請求項1の映像音声同期検出装置であって、
上記出力タイミング検出部は、
上記所定の1画像の復号映像データに対応する照合対象映像データを、上記映像音声再生装置が順次出力する各復号映像データと照合し、上記照合対象映像データと一致する復号映像データを検出する映像データ照合部と、
上記所定単位時間連続する所定の連続復号音声データに対応する照合対象音声データを、上記映像音声再生装置が順次出力する各復号音声データと照合し、上記照合対象音声データと一致する復号音声データを検出する音声データ照合部と、
を備え、
上記照合対象映像データに一致する復号映像データが出力されたタイミングを上記映像データ出力タイミングとして検出し、
上記照合対象音声データに一致する復号音声データが出力されたタイミングを上記音声データ出力タイミングとして検出するようになっていることを特徴とする。
【0011】
これにより、同期ずれを評価する対象の復号映像データと復号音声データを、照合によって特定し、検出できる。
【0012】
請求項3の発明は、
請求項2の映像音声同期検出装置であって、
上記映像データ照合部は、複数画像の照合対象映像データについて、順次、それぞれと一致する復号映像データを検出し、上記算出部は、上記一致が検出された各復号映像データについての上記同期ずれ時間を算出することを特徴とする。
【0013】
これにより、複数画像の映像データについて音声データとの同期ずれが評価されるので、複数画像の映像データを再生している途中に生じる同期ずれも評価でき、同期ずれが生じた画像を特定することもできる。
【0014】
請求項4の発明は、
請求項3の映像音声同期検出装置であって、
上記映像データ照合部は、
各照合対象映像データについて一致する復号映像データが検出された後、次の照合対象映像データについて一致する復号映像データが検出されるまでの照合回数をカウントする画像数カウンタを備え、
上記算出部は、
各照合対象映像データに一致する復号映像データが出力されるごとに、前回一致した復号映像データが出力された際の上記映像音声出力間隔に、上記画像数カウンタの値と1画像の出力時間との積を加算した値を、上記各照合対象映像データに一致する復号映像データについての映像音声出力間隔として求めることを特徴とする。
【0015】
これにより、各照合対象映像データに一致する復号映像データと所定の復号音声データとの差が順次、映像音声出力間隔として求められる。
【0016】
請求項5の発明は、
請求項2の映像音声同期検出装置であって、
上記音声データ照合部は、複数組の照合対象復号音声データについて、順次、それぞれと一致する復号音声データを検出し、上記算出部は、上記一致が検出された各復号音声データについての上記同期ずれ時間を算出するようになっていることを特徴とする。
【0017】
これにより、複数組の所定単位時間連続する音声データについて映像データとの同期ずれが評価されるので、複数組の所定単位時間連続する音声データを再生している途中に生じる同期ずれも評価でき、同期ずれが生じた音声データを特定することもできる。
【0018】
請求項6の発明は、
上記音声データ照合部は、
各照合対象復号音声データについて一致する復号音声データが検出された後、次の照合対象復号音声データについて一致する復号音声データが検出されるまでの照合回数をカウントする組数カウンタを備え、
上記算出部は、
各照合対象音声データに一致する復号音声データが出力されるごとに、前回一致した復号音声データが出力された際の上記映像音声出力間隔に、上記組数カウンタの値と1組の所定単位時間連続する連続復号音声データの出力時間との積を加算した値を、上記各照合対象音声データに一致する復号音声データについての映像音声出力間隔として求めることを特徴とする。
【0019】
これにより、各照合対象音声データに一致する復号音声データと所定の復号映像データとの差が順次、映像音声出力間隔として求められる。
【0020】
請求項7の発明は、
請求項1の映像音声同期検出装置であって、
上記算出部は、
上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を上記映像音声出力間隔として出力するカウンタを備えたことを特徴とする。
【0021】
請求項8の発明は、
請求項1の映像音声同期検出装置であって、
上記算出部は、
所定のタイミングで時間経過に応じた値のカウントを開始し、上記映像データ出力タイミングでカウント値を出力する映像データ出力タイミングカウンタと、
上記所定のタイミングで時間経過に応じた値のカウントを開始し、上記音声データ出力タイミングでカウント値を出力する音声データ出力タイミングカウンタと、
上記映像データ出力タイミングカウンタによって出力されるカウント値と上記音声データ出力タイミングカウンタによって出力されるカウント値との差を上記映像音声出力間隔として出力する映像音声出力間隔算出部と、
を備えたことを特徴とする。
【0022】
これらにより、カウンタを用いることにより、映像音声出力間隔を容易に算出できる。
【0023】
請求項9の発明は、
請求項1の映像音声同期検出装置であって、
さらに、上記同期ずれ時間を所定の閾値と比較する判定部を備えたことを特徴とする。
【0024】
これにより、算出された同期ずれ時間を、あらかじめ自由に設定された閾値と比較することによって映像データと音声データとの同期を評価できる。
【0025】
請求項10の発明は、
請求項1の映像音声同期検出装置と、
映像音声再生装置と、
を有する検証機能付き映像音声再生システムであって、
上記映像音声再生装置は、
符号化多重データを符号化映像データと符号化音声データとに分離する多重分離部と、
上記符号化映像データを復号する映像データ復号部と、
上記符号化音声データを復号する音声データ復号部と、
を備え、
復号された復号映像データと復号音声データとを同期させて出力する一方、
上記映像音声同期検出装置は、
上記復号映像データと上記復号音声データとの同期ずれ時間を検出することを特徴とする。
【0026】
これにより、映像音声再生装置の同期動作が、映像音声同期検出装置により検証される。
【0027】
請求項11の発明は、
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、処理時間が互いに異なる複数種類の復号処理を行う機能を有し、上記映像データ出力タイミングが遅いことにより上記同期ずれ時間が所定の閾値より大きい場合の方が、小さい場合よりも処理時間の短い復号処理を行うように構成されていることを特徴とする。
【0028】
請求項12の発明は、
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、1画像あたりの画素数を増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする。
【0029】
請求項13の発明は、
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、復号映像データのビットレートを増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする。
【0030】
請求項14の発明は、
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、上記映像データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号映像データを遅らせて出力させ、上記音声データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号音声データを遅らせて出力させるように構成されていることを特徴とする。
【0031】
これらにより、映像音声再生装置が出力する復号映像データと復号音声データとの同期ずれ時間が、映像音声同期検出装置によって評価され、同期ずれ時間が所定の閾値を超えている場合は、同期ずれが低減されるように映像音声同期検出装置が映像音声再生装置が制御される。
【発明の効果】
【0032】
映像音声同期検出装置により、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できる。したがって、時刻情報が付された状態で再生される評価用の映像データと音声データを生成する特別な装置を備えることなく、再生装置が映像データと音声データをタイムスタンプにどの程度忠実なタイミングで再生しているかを評価できる。
【発明を実施するための最良の形態】
【0033】
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の各実施形態において、他の実施形態と同様の機能を有する構成要素については同一の符号を付して説明を省略する。
【0034】
《発明の実施形態1》
図1は、本発明の実施形態1に係るコーデックシステムの構成を示すブロック図である。
【0035】
実施形態1に係るコーデックシステムでは、映像音声符号化多重装置100が出力する符号化多重データが、記憶媒体130に記憶され、検証機能付き映像音声再生装置110で再生されるようになっている。検証機能付き映像音声再生装置110(検証機能付き映像音声再生システム)は、再生される復号映像データと復号音声データの同期を検出する映像音声同期検出装置120を備えている。
【0036】
映像音声符号化多重装置100は、映像データ発生部101、映像データ符号化部102、音声データ発生部103、音声データ符号化部104、および多重化部105を備えている。
【0037】
映像データ発生部101は、映像データを生成するようになっている。映像データ発生部101としては、例えば、ビデオカメラが用いられる。
【0038】
映像データ符号化部102は、映像データ発生部101によって生成された映像データを符号化するようになっている。ここで行われる符号化は、映像データを圧縮する符号化等である。
【0039】
音声データ発生部103は、音声データを生成するようになっている。音声データ発生部103としては、例えば、マイクが用いられる。
【0040】
音声データ符号化部104は、音声データ発生部103によって生成された音声データを符号化するようになっている。ここで行われる符号化は、音声データを圧縮する符号化等である。
【0041】
多重化部105は、映像データ符号化部102によって符号化された符号化映像データにタイムスタンプ等の映像再生時刻情報を付加し、音声データ符号化部104によって符号化された符号化音声データにタイムスタンプ等の音声再生時刻情報を付加するようになっている。そして、再生時刻情報が付加された符号化映像データと符号化音声データとを、1つの通信回線または伝送チャネルで送信できるデータに多重化(合成)するようになっている。
【0042】
検証機能付き映像音声再生装置110は、多重分離部111、映像データ復号部112、音声データ復号部113、および映像音声同期検出装置120を備えている。
【0043】
多重分離部111は、多重化部105によって多重化された符号化多重データを符号化映像データと符号化音声データとに分離して出力するようになっている。
【0044】
映像データ復号部112は、多重分離部111によって出力された符号化映像データを復号し、符号化映像データに付された映像再生時刻情報に基づくタイミングで出力するようになっている。ここで行われる復号は、圧縮された符号化映像データを伸長する復号等である。映像データ復号部112には、後述する判定部127から判定信号が入力されるようになっており、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行うようになっている。
【0045】
音声データ復号部113は、多重分離部111によって出力された符号化音声データを復号し、符号化音声データに付された音声再生時刻情報に基づくタイミングで出力するようになっている。ここで行われる復号は、圧縮された符号化音声データを伸長する復号等である。
【0046】
映像音声同期検出装置120は、記録部121、出力タイミング検出部122、再生基準時刻取得部125、算出部126、および判定部127を備えている。
【0047】
記録部121は、映像データ復号部112および音声データ復号部113からそれぞれ出力される復号映像データと復号音声データとを記録するようになっている。そして、記録した復号映像データと復号音声データとを、映像データ復号部112および音声データ復号部113からそれぞれが出力されるのと同じ速度と順序で出力するようになっている。記録部121は、例えば、AV(Audio Visual)データ用のハードディスク、メモリ、またはビデオテープで構成される。
【0048】
出力タイミング検出部122は、図2に示すように、映像データ照合部122aと音声データ照合部122bとを備えている。映像データ照合部122aは、照合対象映像データ123を、記録部121から順次出力される復号映像データと1画像毎に比較照合し、照合対象映像データ123と一致する復号映像データを検出するようになっている。そして、照合対象映像データ123と一致する復号映像データを検出したタイミングを映像データ出力タイミングとして出力するようになっている。
【0049】
音声データ照合部122bは、照合対象音声データ124を、記録部121から順次出力される復号音声データと所定単位時間連続する復号音声データ毎に比較照合し、照合対象音声データ124と一致する復号音声データを検出するようになっている。そして、照合対象音声データ124と一致する復号音声データを検出したタイミングを音声データ出力タイミングとして出力するようになっている。
【0050】
照合対象映像データ123は複数画像分記憶されており、一致する復号映像データが検出されると、比較照合される照合対象映像データ123が、次の新たな照合対象映像データ123に切り換えられるようになっている。同様に、照合対象音声データ124は複数組の所定単位時間連続する復号音声データ分記憶されており、一致する復号音声データが検出されると、比較照合される照合対象音声データ124が、次の新たな照合対象音声データ124に切り換えられるようになっている。
【0051】
再生基準時刻取得部125は、1画像の符号化映像データ毎に、各符号化映像データに含まれる映像再生時刻情報を読み取り、後述する算出部126のカウンタ126aで時間経過に応じてカウントされる値と単位を揃えるように換算した映像再生基準時刻を求めて記憶するようになっている。さらに、所定単位の連続する符号化音声データ毎に、各符号化音声データに含まれる音声再生時刻情報を読み取り、各符号化音声データが音声データ復号部113から復号音声データとして出力されるべき音声再生基準時刻を取得し、記憶するようになっている。例えば、27MHzのクロックでカウントされた値が再生時刻情報として用いられるMPEG2システムの場合であって、後述する算出部126のカウンタ126aにおいて、映像データ出力タイミングと音声データ出力タイミングとの間隔が9MHzのクロックでカウントされる場合、映像再生基準時刻と音声再生基準時刻は、映像再生時刻情報と音声再生時刻情報をそれぞれ1/3倍して求められる。
【0052】
算出部126は、所定の1画像の映像データの映像データ出力タイミングと所定単位時間連続する所定の音声データ出力タイミングとの間隔である映像音声出力間隔と、上記所定の1画像の映像データの映像再生基準時刻と上記所定の音声データの音声再生基準時刻との基準間隔との差を同期ずれ時間として算出するようになっている。具体的な構成としては、例えば、図3に示すように、カウンタ126a、映像音声再生基準間隔算出部126b、および同期ずれ時間算出部126cを備えている。
【0053】
カウンタ126aは、映像データ出力タイミングと音声データ出力タイミングのうち早い方のタイミングでカウント値をリセットすると同時に、時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を映像音声出力間隔として出力するようになっている。
【0054】
映像音声再生基準間隔算出部126bは、映像再生基準時刻と音声再生基準時刻との差を算出し、映像再生基準時刻と音声再生基準時刻との基準間隔として出力するようになっている。
【0055】
同期ずれ時間算出部126cは、映像音声出力間隔と基準間隔との差を同期ずれ時間として算出するようになっている。
【0056】
判定部127は、算出部126によって出力される同期ずれ時間を所定の閾値と比較し、同期ずれ時間が所定の閾値より小さい場合は判定信号として“0”を出力し、同期ずれ時間が所定の閾値より大きい場合は判定信号として“1”を出力するようになっている。
【0057】
記憶媒体130は、映像音声符号化多重装置100の多重化部105によって出力された符号化多重データを記憶するようになっている。
【0058】
−動作−
次に、上記のように構成されたコーデックシステムにおける各部の動作について説明する。
【0059】
まず、映像データ発生部101が映像データを生成すると、生成された映像データは映像データ符号化部102によって符号化される。一方、音声データ発生部103が音声データを生成すると、生成された音声データは音声データ符号化部104によって符号化される。そして、符号化された符号化映像データと符号化音声データは、多重化部105によって、それぞれに再生時刻情報が付加されて多重化され、符号化多重データとして記憶媒体130に記憶される。
【0060】
記憶媒体130に記憶された符号化多重データは、多重分離部111で符号化映像データと符号化音声データとに分離される。分離された符号化映像データは映像データ復号部112で復号され、分離された符号化音声データは音声データ復号部113で復号される。復号された復号映像データは、復号される前の符号化映像データに付されていた映像再生時刻情報に基づくタイミングで記録部121に出力される。同様に、復号された復号音声データは、復号される前の符号化音声データに付されていた音声再生時刻情報に基づくタイミングで記録部121に出力される。
【0061】
記録部121は、映像データ復号部112から出力される復号映像データ、および音声データ復号部113から出力される復号音声データを記録し、映像データ復号部112および音声データ復号部113からそれぞれが出力されたのと同じ速度と順序で、出力タイミング検出部122へ出力する。
【0062】
一方、再生基準時刻取得部125は、1画像の符号化映像データ毎に、符号化映像データに含まれる映像再生時刻情報を読み取り、各符号化映像データが復号された後に映像データ復号部112から復号映像データとして出力されるべき映像再生基準時刻を取得し、記憶する。さらに、所定単位時間連続する符号化音声データ毎に、各符号化音声データに含まれる音声再生時刻情報を読み取り、各符号化音声データが復号された後に音声データ復号部113から復号音声データとして出力されるべき音声再生基準時刻を取得し、記憶する。
【0063】
以下、出力タイミング検出部122、および算出部126の動作については、まず、先頭の復号映像データと先頭の復号音声データについて出力タイミングが検出され、再生基準時刻と比較される場合について説明する。
【0064】
記録部121から出力される復号映像データは出力タイミング検出部122に入力される。出力タイミング検出部122に入力された復号映像データは、1画像毎に、映像データ照合部122aで、先頭の1画像の復号映像データを示す照合対象映像データ123と比較照合される。映像データ照合部122aは、その照合対象映像データ123と一致する復号映像データを検出する。そして、照合対象映像データ123と一致する復号映像データを検出したタイミングを映像データ出力タイミングとして検出する。そして、照合対象映像データ123と一致する復号映像データが検出された後、比較照合される照合対象映像データ123は、2画像目の復号映像データを示す照合対象映像データ123になる。
【0065】
同様に、記録部121から出力される復号音声データは出力タイミング検出部122に入力される。出力タイミング検出部122に入力された復号音声データは、所定単位時間連続する復号音声データ毎に、音声データ照合部122bで、先頭の所定単位時間連続する連続復号音声データを示す照合対象音声データ124と比較照合される。音声データ照合部122bは、その照合対象音声データ124と一致する復号音声データを検出する。そして、照合対象音声データ124と一致する復号音声データを検出したタイミングを音声データ出力タイミングとして検出する。そして、照合対象音声データ124と一致する復号音声データが検出された後、比較照合される照合対象音声データ124は、2組目の所定単位時間連続する連続復号音声データを示す照合対象音声データ124になる。
【0066】
映像データ照合部122aで検出された先頭の1画像の復号映像データの映像データ出力タイミング、および音声データ照合部122bで検出された先頭の所定単位時間連続する復号音声データの音声データ出力タイミングで、検出信号が算出部126のカウンタ126aに入力される。そして、カウンタ126aは、上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで、リセットされるとともに時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を先頭の映像および音声の映像音声出力間隔として出力する。
【0067】
一方、再生基準時刻取得部125に記憶された映像再生基準時刻、および音声再生基準時刻のうち、先頭の1画像の符号化映像データに含まれていた映像再生基準時刻と先頭の所定単位時間連続する符号化音声データに含まれていた音声再生基準時刻とが算出部126の映像音声再生基準間隔算出部126bに入力される。そして、映像音声再生基準間隔算出部126bは、上記映像再生基準時刻と上記音声再生基準時刻との差を算出し、先頭の映像再生基準時刻と先頭の音声再生基準時刻との基準間隔として出力する。
【0068】
先頭の映像および音声の映像音声出力間隔と基準間隔とは、同期ずれ時間算出部126cに入力される。そして、同期ずれ時間算出部126cによって、上記映像音声出力間隔と上記基準間隔との差が同期ずれ時間として算出される。このように、再生装置が正常に映像データと音声データとを同期させているかどうかが定量的に評価される。
【0069】
出力タイミング検出部122、および算出部126の上記のような動作が、比較照合される照合対象映像データ123と照合対象音声データ124とがそれぞれ切り替わることによって、次には2画像目の復号映像データと2組目の所定単位時間連続する連続復号音声データについて行われ、その次には3画像目の復号映像データと3組目の所定単位時間連続する連続復号音声データについて行われ、それ以降も繰り返される。このように、映像データと音声データとが同期しているかどうかが、複数画像の復号映像データおよび複数組の所定単位時間連続する連続復号音声データのそれぞれについて評価される。
【0070】
判定部127は、算出部126によって出力される同期ずれ時間を所定の閾値と比較し、同期ずれ時間が所定の閾値より小さい場合は判定信号として“0”を出力し、同期ずれ時間が所定の閾値より大きい場合は判定信号として“1”を出力する。
【0071】
映像データ復号部112は、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行う。このように、映像音声同期検出装置120により、検証機能付き映像音声再生装置110に生じる映像データと音声データとの同期ずれが、解消または低減される。
【0072】
本実施形態において、記録部121は、映像データ復号部112が出力するのと同じ速度で復号映像データを出力するので、照合対象映像データ123と一致する復号映像データが検出されたタイミングが、照合対象映像データ123と一致する復号映像データが映像データ復号部112から出力されたタイミングとして扱われている。音声データについても同様である。しかし、必ずしも記録部121は、データを記録する速度とデータを読み出す速度が等しくなるように構成されなくてもよい。算出部126のカウンタ126aにおいて、記録部121における記録速度と読み出し速度の比に応じたクロックで、再生基準時刻取得部125で算出される基準間隔と同じ時間単位の映像音声出力間隔が得られればよい。
【0073】
また、復号映像データが映像データ復号部112から出力されたタイミングや復号音声データが音声データ復号部113から出力されたタイミング、すなわち映像データ出力タイミングや音声データ出力タイミングは、必ずしも、記録部121から復号映像データや復号音声データが出力されたタイミングを検出することにより検出されなくてもよい。例えば、記録部121が、復号映像データや復号音声データに、それぞれの映像データ出力タイミングや音声データ出力タイミングをタイムスタンプとして付して記録するようになっていた場合、それらのタイムスタンプを読み出すことによって検出してもよい。
【0074】
また、本実施形態では、再生基準時刻取得部125において、各映像再生基準時刻と各音声再生基準時刻が取得される際に、再生基準時刻の時間単位を、算出部126において求められる映像音声出力間隔と合わせるようにしていたが、時間単位が合わせられるのは必ずしも再生基準時刻取得部125でなくてもよい。算出部126で、再生基準時刻の基準間隔と映像音声出力間隔との差を算出する際に、基準間隔と映像音声出力間隔の時間単位が同じになっていればよい。したがって、例えば、再生基準時刻取得部125では、映像再生時刻情報と音声再生時刻情報がそのまま記憶され、算出部126の映像音声再生基準間隔算出部126bにおいてそれらの差が算出され、その算出された差が映像音声出力間隔と同じ時間単位となるように換算されるようになっていてもよい。
【0075】
《発明の実施形態1の変形例》
実施形態1の映像音声同期検出装置120は、算出部126に代えて、図4に示す算出部226を備えてもよい。
【0076】
算出部226は、算出部126のカウンタ126aに代えて、映像データ出力タイミングカウンタ226a、音声データ出力タイミングカウンタ226b、および映像音声出力間隔算出部226cを備えている。
【0077】
映像データ出力タイミングカウンタ226aは、所定のタイミングでカウント値をリセットするとともに時間経過に応じた値のカウントを開始し、映像データ出力タイミングでカウント値を出力するようになっている。
【0078】
音声データ出力タイミングカウンタ226bは、映像データ出力タイミングカウンタ226aがカウントを開始するのと同じ所定のタイミングでカウント値をリセットするとともに時間経過に応じた値のカウントを開始し、音声データ出力タイミングでカウント値を出力するようになっている。
【0079】
映像音声出力間隔算出部226cは、映像データ出力タイミングカウンタ226aによって出力されるカウント値と音声データ出力タイミングカウンタ226bによって出力されるカウント値との差を映像音声出力間隔として出力するようになっている。
【0080】
−動作−
映像データ照合部122aと音声データ照合部122bとが同時に照合動作を開始し、その照合動作の開始と同時に映像データ出力タイミングカウンタ226aと音声データ出力タイミングカウンタ226bがカウントを開始する場合の算出部226の動作を例として説明する。
【0081】
映像データ照合部122aと音声データ照合部122bとが照合動作を開始すると、同時に映像データ出力タイミングカウンタ226aと音声データ出力タイミングカウンタ226bがリセットされるとともに、時間経過に応じた値のカウントを開始する。映像データ出力タイミングカウンタ226aは、映像データ出力タイミングでカウント値を出力する。音声データ出力タイミングカウンタ226bは、音声データ出力タイミングでカウント値を出力する。そして、映像音声出力間隔算出部226cは、映像データ出力タイミングカウンタ226aによって出力されたカウント値と音声データ出力タイミングカウンタ226bによって出力されたカウント値との差を映像音声出力間隔として同期ずれ時間算出部126cに出力する。
【0082】
《発明の実施形態2》
実施形態2のコーデックシステムは、実施形態1のコーデックシステムの出力タイミング検出部122と算出部126に代えて、図5に示すような出力タイミング検出部122と算出部326を備えている。
【0083】
本実施形態の映像データ照合部122aは、実施形態1の映像データ照合部122aの機能に加え、算出部326の不一致画像数カウンタ326aに対し、照合対象映像データ123と記録部121から順次出力される各画像の復号映像データとが一致したことを示す信号、および不一致であったことを示す信号を不一致画像数カウンタ326aに出力する機能を有している。
【0084】
本実施形態において、音声データ照合部122bは、先頭の所定単位時間連続する連続復号音声データを示す照合対象音声データ124についての比較照合しか行わず、先頭の所定単位時間連続する復号音声データの音声データ出力タイミングを検出したあとは、他の検出を行わないようになっている。
【0085】
算出部326は、カウンタ126a、不一致画像数カウンタ326a、出力時刻情報算出部326b、映像音声再生基準間隔算出部326c、および同期ずれ時間算出部326dを備えている。
【0086】
不一致画像数カウンタ326aは、映像データ照合部122aから不一致を示す信号が入力されると、保持する値に1を加算するようになっている。また、不一致画像数カウンタ326aの値は、映像データ照合部122aから一致を示す信号が入力されると、出力時刻情報算出部326bに出力され、0にリセットされる。不一致は、例えば、伝送経路上の問題から映像データ復号部112に対する符号化映像データの供給が遅れ、所定の1画像の復号映像データが再生時刻情報に示されるタイミングで出力されるのに間に合わず、上記再生時刻情報に示されるタイミングで前の画像の復号映像データがそのまま出力されることによって生じる。
【0087】
出力時刻情報算出部326bは、まず、カウンタ126aから出力される先頭の1画像の復号映像データの映像データ出力タイミングと先頭の所定単位時間連続する復号音声データの音声データ出力タイミング(以下、先頭音声データ出力タイミング)との映像音声出力間隔を記憶するようになっている。そして2画像目以降の照合対象映像データ123と一致する復号映像データが検出される毎に、記憶されている映像音声出力間隔に、リセットされる前の不一致画像数カウンタ326aの値に1を加算した値と1画像あたりの出力時間との積を加算し、新たな映像音声出力間隔として記憶するようになっている。
【0088】
すなわち、n番目の画像の復号映像データの映像データ出力タイミングと先頭音声データ出力タイミングとの映像音声出力間隔は以下の式によって算出される。
【0089】
{(n番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}
={(n−1番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}
+1画像あたりの出力時間×{(不一致画像数カウンタ326aの値)+1}
映像音声再生基準間隔算出部326cは、再生基準時刻取得部125から出力される先頭の1画像の符号化映像データに含まれていた映像再生基準時刻と先頭の所定単位時間連続する符号化音声データに含まれていた音声再生基準時刻(以下、先頭音声再生基準時刻)の基準間隔を算出するようになっている。そして、2番目以降の各画像の符号化映像データについても、それぞれに含まれる映像再生基準時刻と先頭の音声の音声再生基準時刻との基準間隔を算出するようになっている。
【0090】
同期ずれ時間算出部326dは、記憶された映像音声出力間隔とそれに対応する基準間隔との差を同期ずれ時間として算出し、出力するようになっている。同期ずれ時間として算出される値を以下の式に示す。
【0091】
同期ずれ時間={(n番目の画像の復号映像データの映像データ出力タイミング)−(先頭音声データ出力タイミング)}−{(n番目の画像の映像再生基準時刻)−(先頭音声再生基準時刻)}
【0092】
−動作−
次に、上記のように構成された本実施形態の出力タイミング検出部122と算出部326の動作について説明する。
【0093】
まず、映像データ照合部122aが先頭の1画像の復号映像データの映像データ出力タイミングを検出し、音声データ照合部122bが先頭の所定単位時間連続する復号音声データの音声データ出力タイミングを検出し、同期ずれ時間を算出する動作は、実施形態1と同様である。
【0094】
映像データ照合部122aが先頭の画像の照合対象映像データ123と一致する復号映像データを検出してからの各部の動作について説明する。
【0095】
映像データ照合部122aが先頭の画像の照合対象映像データ123と一致する復号映像データを検出すると、不一致画像数カウンタ326aの値は0にリセットされる。また、照合される照合対象映像データ123が2画像目の復号映像データを示す照合対象映像データ123になる。そして、映像データ照合部122aは、2画像目の復号映像データを示す照合対象映像データ123を、入力される復号映像データと1画像毎に比較照合する。不一致の場合は、不一致画像数カウンタ326aの保持する値に1加算される。一致すると、不一致画像数カウンタ326aの保持する値が出力時刻情報算出部326bに出力され、0にリセットされる。
【0096】
2画像目の復号映像データを示す照合対象映像データ123と復号映像データとの一致が検出されると、出力時刻情報算出部326bは、その時記憶されている先頭の映像および音声の映像音声出力間隔に、リセットされる前の不一致画像数カウンタ326aの値に1を加算した値と1画像あたりの出力時間との積を加算した値を、新たな映像音声出力間隔として記憶する。
【0097】
一方、映像音声再生基準間隔算出部326cは、2画像目の映像再生基準時刻と先頭の音声の音声再生基準時刻との差を基準間隔として算出する。
【0098】
そして、同期ずれ時間算出部326dは、出力時刻情報算出部326bに記憶されている2画像目の復号映像データの映像データ出力タイミングと先頭音声データ出力タイミングとの差である映像音声出力間隔と2画像目の映像再生基準時刻と先頭の音声の音声再生基準時刻との差である基準間隔との差を同期ずれ時間として算出する。
【0099】
上記のような動作が、3画像目の復号映像データ以降についても繰り返される。
【0100】
なお、本実施形態の不一致画像数カウンタ326aに代えて、各照合対象映像データ123について一致する復号映像データが検出された後、次の照合対象映像データ123について一致する復号映像データが検出されるまでの照合回数、すなわち各照合対象映像データ123についての照合回数をカウントするカウンタを備え、出力時刻情報算出部326bは、記憶されている映像音声出力間隔に、カウンタの値と1画像あたりの出力時間との積を加算した値を、新たな映像音声出力間隔として記憶するようにしてもよい。
【0101】
《その他の実施形態》
本発明は、データの符号化および復号が、上記各実施形態のように記憶媒体130にデータを記憶させるために行われる場合に限らず、データを所定の伝送経路で伝送するために行われる場合等にも適用できる。
【0102】
上記実施形態において、照合対象映像データ123は複数画像分記憶され、照合対象音声データ124は複数組の所定単位時間連続する復号音声データ分記憶される構成であったが、必ずしも一連の映像データや音声データについての同期検出動作の開始時に、一連のすべての照合対象映像データ123や照合対象音声データ124が記憶されている必要はない。例えば、映像データ復号部112や音声データ復号部113から順次入力されるようにしてもよい。
【0103】
また、実施形態2では、先頭の復号音声データの音声データ出力タイミングと各復号映像データの映像データ出力タイミングとの映像音声出力間隔とそれに対応する基準間隔との差が同期ずれ時間として順次算出されるようになっていたが、逆に、先頭の復号映像データの映像データ出力タイミングと各復号音声データの音声データ出力タイミングとの映像音声出力間隔とそれに対応する基準間隔との差が同期ずれ時間として順次算出されるように構成してもよい。
【0104】
また、上記実施形態では、判定信号の値が“1”の時、判定信号の値が“0”の時よりも1画像あたりの画素数を少なくしたりビットレートを減らす等して、処理時間の短い復号処理を行うことにより、映像データと音声データとの同期ずれを解消または低減するようになっていたが、同期ずれを低減する方法はこれに限らない。例えば、映像データ出力タイミングが早いことにより同期ずれ時間が大きくなっている場合は、復号映像データを映像データ復号部112が遅らせて出力し、音声データ出力タイミングが早いことにより同期ずれ時間が大きくなっている場合は、復号音声データを音声データ復号部113が遅らせて出力するようにしてもよい。
【0105】
また、上記実施形態において、映像再生時刻情報と音声再生時刻情報が、多重分離部111から出力される符号化映像データと符号化音声データとから読み取られるようになっていたが、再生基準時刻取得部125が映像再生時刻情報と音声再生時刻情報を得る方法はこれに限らない。例えば、多重化部105が、付加する映像再生時刻情報と音声再生時刻情報とを再生基準時刻取得部125に出力し、記録させるようにしてもよい。
【0106】
また、上記実施形態において、算出部は、|映像データ出力タイミング−音声データ出力タイミング|−|映像再生基準時刻−音声再生基準時刻|という順序の演算が行われて同期ずれ時間が算出されるように構成されていたが、|映像データ出力タイミング−映像再生基準時刻|−|音声データ出力タイミング−音声再生基準時刻|という順序の演算が行われて同期ずれ時間が算出されるように構成されてもよい。
【産業上の利用可能性】
【0107】
本発明に係る映像音声同期検出装置、および検証機能付き映像音声再生システムは、再生時に時刻情報が付かない映像データと音声データを用いて再生装置を評価できるという効果を有し、例えば、符号化された映像データと音声データを復号し、復号した映像データと音声データを再生時刻情報を用いて同期させて出力する装置の同期動作を、出力される映像データと音声データの同期を測定することによって検証する技術等として有用である。
【図面の簡単な説明】
【0108】
【図1】本発明の実施形態1に係るコーデックシステムの構成を示すブロック図である。
【図2】本発明の実施形態1に係る出力タイミング検出部122の構成を示すブロック図である。
【図3】本発明の実施形態1に係る算出部126の構成を示すブロック図である。
【図4】本発明の実施形態1の変形例に係る算出部126の構成を示すブロック図である。
【図5】本発明の実施形態2に係る出力タイミング検出部122と算出部326との構成を示すブロック図である。
【符号の説明】
【0109】
100 映像音声符号化多重装置
101 映像データ発生部
102 映像データ符号化部
103 音声データ発生部
104 音声データ符号化部
105 多重化部
110 検証機能付き映像音声再生装置
111 多重分離部
112 映像データ復号部
113 音声データ復号部
120 映像音声同期検出装置
121 記録部
122 出力タイミング検出部
122a 映像データ照合部
122b 音声データ照合部
123 照合対象映像データ
124 照合対象音声データ
125 再生基準時刻取得部
126 算出部
126a カウンタ
126b 映像音声再生基準間隔算出部
126c 同期ずれ時間算出部
127 判定部
130 記憶媒体
226 算出部
226a 映像データ出力タイミングカウンタ
226b 音声データ出力タイミングカウンタ
226c 映像音声出力間隔算出部
326 算出部
326a 不一致画像数カウンタ
326b 出力時刻情報算出部
326c 映像音声再生基準間隔算出部
326d 同期ずれ時間算出部

【特許請求の範囲】
【請求項1】
符号化映像データおよび符号化音声データを復号し、復号映像データと復号音声データとを同期させて出力する映像音声再生装置の同期動作を検証するための映像音声同期検出装置であって、
上記映像音声再生装置が所定の1画像の復号映像データを出力する映像データ出力タイミング、および上記映像音声再生装置が所定単位時間連続する所定の連続復号音声データを出力する音声データ出力タイミングを検出する出力タイミング検出部と、
上記符号化映像データまたは符号化音声データに含まれる再生時刻情報に基づいて、上記所定の1画像の復号映像データが出力されるべき映像再生基準時刻と上記所定の連続音声データが出力されるべき音声再生基準時刻とを取得する再生基準時刻取得部と、
上記映像データ出力タイミングと上記音声データ出力タイミングとの間隔である映像音声出力間隔と、上記映像再生基準時刻と上記音声再生基準時刻との基準間隔との差を同期ずれ時間として算出する算出部と、
を備えたことを特徴とする映像音声同期検出装置。
【請求項2】
請求項1の映像音声同期検出装置であって、
上記出力タイミング検出部は、
上記所定の1画像の復号映像データに対応する照合対象映像データを、上記映像音声再生装置が順次出力する各復号映像データと照合し、上記照合対象映像データと一致する復号映像データを検出する映像データ照合部と、
上記所定単位時間連続する所定の連続復号音声データに対応する照合対象音声データを、上記映像音声再生装置が順次出力する各復号音声データと照合し、上記照合対象音声データと一致する復号音声データを検出する音声データ照合部と、
を備え、
上記照合対象映像データに一致する復号映像データが出力されたタイミングを上記映像データ出力タイミングとして検出し、
上記照合対象音声データに一致する復号音声データが出力されたタイミングを上記音声データ出力タイミングとして検出するようになっていることを特徴とする映像音声同期検出装置。
【請求項3】
請求項2の映像音声同期検出装置であって、
上記映像データ照合部は、複数画像の照合対象映像データについて、順次、それぞれと一致する復号映像データを検出し、上記算出部は、上記一致が検出された各復号映像データについての上記同期ずれ時間を算出することを特徴とする映像音声同期検出装置。
【請求項4】
請求項3の映像音声同期検出装置であって、
上記映像データ照合部は、
各照合対象映像データについて一致する復号映像データが検出された後、次の照合対象映像データについて一致する復号映像データが検出されるまでの照合回数をカウントする画像数カウンタを備え、
上記算出部は、
各照合対象映像データに一致する復号映像データが出力されるごとに、前回一致した復号映像データが出力された際の上記映像音声出力間隔に、上記画像数カウンタの値と1画像の出力時間との積を加算した値を、上記各照合対象映像データに一致する復号映像データについての映像音声出力間隔として求めることを特徴とする映像音声同期検出装置。
【請求項5】
請求項2の映像音声同期検出装置であって、
上記音声データ照合部は、複数組の照合対象復号音声データについて、順次、それぞれと一致する復号音声データを検出し、上記算出部は、上記一致が検出された各復号音声データについての上記同期ずれ時間を算出するようになっていることを特徴とする映像音声同期検出装置。
【請求項6】
請求項5の映像音声同期検出装置であって、
上記音声データ照合部は、
各照合対象復号音声データについて一致する復号音声データが検出された後、次の照合対象復号音声データについて一致する復号音声データが検出されるまでの照合回数をカウントする組数カウンタを備え、
上記算出部は、
各照合対象音声データに一致する復号音声データが出力されるごとに、前回一致した復号音声データが出力された際の上記映像音声出力間隔に、上記組数カウンタの値と1組の所定単位時間連続する連続復号音声データの出力時間との積を加算した値を、上記各照合対象音声データに一致する復号音声データについての映像音声出力間隔として求めることを特徴とする映像音声同期検出装置。
【請求項7】
請求項1の映像音声同期検出装置であって、
上記算出部は、
上記映像データ出力タイミングと上記音声データ出力タイミングのうち早い方のタイミングで時間経過に応じた値のカウントを開始し、もう一方のタイミングでのカウント値を上記映像音声出力間隔として出力するカウンタを備えたことを特徴とする映像音声同期検出装置。
【請求項8】
請求項1の映像音声同期検出装置であって、
上記算出部は、
所定のタイミングで時間経過に応じた値のカウントを開始し、上記映像データ出力タイミングでカウント値を出力する映像データ出力タイミングカウンタと、
上記所定のタイミングで時間経過に応じた値のカウントを開始し、上記音声データ出力タイミングでカウント値を出力する音声データ出力タイミングカウンタと、
上記映像データ出力タイミングカウンタによって出力されるカウント値と上記音声データ出力タイミングカウンタによって出力されるカウント値との差を上記映像音声出力間隔として出力する映像音声出力間隔算出部と、
を備えたことを特徴とする映像音声同期検出装置。
【請求項9】
請求項1の映像音声同期検出装置であって、
さらに、上記同期ずれ時間を所定の閾値と比較する判定部を備えたことを特徴とする映像音声同期検出装置。
【請求項10】
請求項1の映像音声同期検出装置と、
映像音声再生装置と、
を有する検証機能付き映像音声再生システムであって、
上記映像音声再生装置は、
符号化多重データを符号化映像データと符号化音声データとに分離する多重分離部と、
上記符号化映像データを復号する映像データ復号部と、
上記符号化音声データを復号する音声データ復号部と、
を備え、
復号された復号映像データと復号音声データとを同期させて出力する一方、
上記映像音声同期検出装置は、
上記復号映像データと上記復号音声データとの同期ずれ時間を検出することを特徴とする検証機能付き映像音声再生システム。
【請求項11】
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、処理時間が互いに異なる複数種類の復号処理を行う機能を有し、上記映像データ出力タイミングが遅いことにより上記同期ずれ時間が所定の閾値より大きい場合の方が、小さい場合よりも処理時間の短い復号処理を行うように構成されていることを特徴とする検証機能付き映像音声再生システム。
【請求項12】
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、1画像あたりの画素数を増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする検証機能付き映像音声再生システム。
【請求項13】
請求項11の検証機能付き映像音声再生システムであって、
上記映像データ復号部は、復号映像データのビットレートを増減させることによって、上記処理時間が互いに異なる複数種類の復号処理を行うことを特徴とする検証機能付き映像音声再生システム。
【請求項14】
請求項10の検証機能付き映像音声再生システムであって、
上記同期ずれ時間を所定の閾値と比較する判定部を備え、
上記映像データ復号部は、上記映像データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号映像データを遅らせて出力させ、上記音声データ出力タイミングが早いことにより上記同期ずれ時間が所定の閾値より大きい場合、上記復号音声データを遅らせて出力させるように構成されていることを特徴とする検証機能付き映像音声再生システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2007−306110(P2007−306110A)
【公開日】平成19年11月22日(2007.11.22)
【国際特許分類】
【出願番号】特願2006−130139(P2006−130139)
【出願日】平成18年5月9日(2006.5.9)
【出願人】(000005821)松下電器産業株式会社 (73,050)
【Fターム(参考)】