説明

画像再生装置、および画像記録装置

【課題】 MPEG方式の符号化データ列を再生する際、高速再生や逆順再生に制限があった。
【解決手段】 Iピクチャ構成情報取得部104により、符号化データ列のGOP内のピクチャの構成情報を取得しておく。高速再生時には、高速再生モード判断部112が、ピクチャの構成を参照して、高速スムーズ再生が可能か否かを判断し、可能であれば高速スムーズ再生制御部116が高速スムーズ再生を実行し、不可能であれば高速スキップ再生制御部114が高速スキップ再生を実行する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は画像を再生または記録する技術、とくに符号化画像データを再生する画像再生装置、符号化画像データを記録する画像記録装置、およびこれらに利用可能な動画データのデータ構造に関する。
【背景技術】
【0002】
BS放送やCS放送においてデジタル放送が開始されており、地上波放送もデジタル化が計画されていて、テレビ放送のデジタル化が急速に進展している。デジタルテレビ放送においては、データ圧縮/伸長規格の国際標準であるMPEG2(Moving Picture Expert Group 2)を用いることによって、効率の高い情報の伝送、蓄積が可能であり、また単一の中継器によって複数のチャンネルを伝送することができる。これにより、ユーザの利便性の向上が期待されている。
【0003】
一方で、最近の携帯端末の普及により、高い圧縮率の符号化方式のニーズは一層高まると予想され、これに対応して、低ビットレートで画像を圧縮して伝送することのできるMPEG4符号化方式を利用することが検討されている。今後、デジタルテレビ放送ではMPEG2とともにMPEG4による画像情報の配信が並行して行われるものと思われる。
【0004】
MPEGでは、動画データの符号化に際し、フレーム間予測と呼ばれる圧縮技術を用いる。フレーム間予測は、符号化すべきフレームのデータを、そのフレームよりも過去または未来に当たる符号化済みのフレームのデータに基づいて予測し、圧縮する技術である。MPEGにおけるフレーム間予測では、過去のフレームに基づいて予測が行われる順方向予測のみならず、過去と未来の双方のフレームに基づいて予測が行われる双方向予測が取り入れられている。
【0005】
MPEG2においては、この双方向予測を実現するために、Iピクチャ(Intra-Picture)、Pピクチャ(Predictive-Picture)、およびBピクチャ(Bidirectionally Predictive-Picture)と呼ばれる3つのタイプのピクチャを規定している。Iピクチャは、フレーム内符号化処理によって過去や未来の再生画像とは無関係に独立して生成される画像であり、その画像内のデータのみで復号が可能である。Iピクチャ内のすべてのマクロブロックは、フレーム内符号化処理によって生成される。Pピクチャは、フレーム間の順方向符号化処理によって、過去のIピクチャまたはPピクチャに基づいた予測により生成される。Pピクチャ内のマクロブロックは、フレーム内符号化されたものと順方向予測によりフレーム間符号化されたものの両方を含む。
【0006】
Bピクチャは、フレーム間符号化処理によって、双方向予測により生成される。双方向予測においてBピクチャは、以下に示す3つの予測のうちいずれか1つにより生成される。
(1)順方向予測;過去のIピクチャまたはPピクチャからの予測
(2)逆方向予測;未来のIピクチャまたはPピクチャからの予測
(3)双方向予測;過去および未来のIピクチャまたはPピクチャからの予測
Bピクチャ内のマクロブロックは、フレーム内符号化されたものと、順方向予測、逆方向予測、および内挿的予測のいずれかによりフレーム間符号化されたものを含む。
【0007】
MPEG4においては、ビデオ・オブジェクトの時系列をVO(Video Object)と呼び、VOを構成する各画像をVOP(Video Object Plane)と呼ぶ。VOPはMPEG2におけるピクチャに相当する。VOPには予測符号化の違いにより、次の4種類が存在する。
(1)I−VOP;フレーム内符号化VOP
(2)P−VOP;フレーム間順方向予測符号化VOP
(3)B−VOP;フレーム間双方向予測符号化VOP
(4)S−VOP;スプライトVOP
最初の3つのタイプI−VOP、P−VOP、B−VOPはそれぞれMPEG2におけるIピクチャ、Pピクチャ、Bピクチャに相当する。
【0008】
MPEGでは、符号化画像データは、階層構造をもつビットストリームデータとして表現されている。MPEGで取り扱われる動画は1秒間に例えば30枚のフレームで構成される。MPEG2では、一般にフレームがピクチャに対応する。MPEG2ではピクチャの集まりをGOP(Group Of Picture)と呼び、このGOP単位のランダムアクセスを可能としている。ランダムアクセスを行うために、GOP内には最低1枚のIピクチャが必要である。MPEG4ではVOPの集まりをGOV(Group Of VOP)として扱う。
【発明の開示】
【発明が解決しようとする課題】
【0009】
このように、MPEG方式の符号化データストリームを復号して再生するとき、GOPまたはGOVを単位としてデータにアクセスすることになるが、一つのGOP(またはGOV)に含まれるピクチャ(またはVOP)の数は必ずしも一定でない。標準的には、MPEG2では一つのGOPあたりほぼ15〜30のピクチャが含まれ、MPEG4では一つのGOVあたりほぼ120のVOPが含まれるが、たとえば、シーンチェンジがあった場合は、そのピクチャから新たなGOPとするなど、編集時にGOPの構成が変更されることがある。そのため、一連の符号化データストリーム内であっても、GOPに含まれるピクチャの数、種類、順序などは一定であるとは限らない。MPEGでは、前述のように双方向予測を行うことから、符号化データストリームにおけるピクチャの出現順と、実際の表示順が異なっており、複雑な復号処理を必要とするが、符号化データストリーム中のピクチャ構成が不規則的である場合は、とくに高速再生、逆順再生などの特殊再生処理を行うときに処理がさらに複雑となり、場合によっては適切な処理を不可能とする要因になっている。
【0010】
本発明はこうした課題に鑑みてなされたものであり、その目的は、符号化データ列の高速再生の処理技術の向上にある。また、別の目的は、より自然な印象をユーザに与えることのできる高速再生技術を提供することにある。
【課題を解決するための手段】
【0011】
本発明のある態様は、画像再生装置に関する。この装置は、形式の異なる第1および第2形式フレームが混在した符号化データ列を復号して画像データを生成する復号器と、前記符号化データ列に含まれるフレームのうち、一部のみを前記復号器に復号させ、表示装置に表示させることにより、高速再生を行う高速再生制御部と、前記符号化データ列に含まれるフレームの数、形式、または順序を取得する構成情報取得部と、を備え、前記高速再生制御部は、前記フレームの数、形式、または順序に基づいて、前記高速再生を制御する。
【0012】
第1形式フレームは、当該フレームの符号化データにより復号可能であり、第2形式フレームは、他のフレームの符号化データを参照することにより復号可能であるような形式であってもよい。より具体的には、第1形式フレームは、MPEGにおけるIピクチャであってもよく、第2形式フレームは、MPEGにおけるPピクチャまたはBピクチャであってもよい。別の例では、第1形式フレームは、自身のフレーム内またはそのフレームよりも過去のフレームの符号化データを参照して復号可能な形式であってもよく、具体的には、MPEGにおけるIピクチャおよびPピクチャであってもよい。この場合、第2形式フレームは、そのフレームの前後のフレームの符号化データを参照して復号される形式であってもよく、具体的には、MPEGにおけるBピクチャであってもよい。ここで、「フレーム」は、画像の単位としてフレームに準ずる「フィールド」等の概念を含む。
【0013】
前記高速再生制御部は、前記第1形式フレームのみを復号して表示する第1の高速再生モードを実現する第1制御部を含み、前記第1制御部は、前記構成情報取得部から、第1形式フレームと、その次に表示すべき第1形式フレームとの間に存在するフレーム数を取得し、前記フレーム数と前記高速再生の速度に基づいて、第1形式フレームの表示間隔を決定してもよい。
【0014】
前記符号化データ列は、少なくとも1枚の第1形式フレームと、少なくとも1枚の第2形式フレームを含むフレーム群を単位として符号化されたものであり、前記第1制御部は、前記フレーム群に属するフレームの数を取得し、それを第1形式フレームとその次に表示すべき第1形式フレームとの間に存在するフレーム数としてもよい。フレーム群は、たとえば、MPEG2におけるGOP、MPEG4におけるGOVであってもよい。一般に、1つのGOPには1つのIピクチャが含まれる場合が多いので、GOPに含まれるピクチャ数と、Iピクチャ間のピクチャ数とを同じとみなしてもよい。
【0015】
前記高速再生制御部は、前記高速再生の速度に応じてフレームを間引いて表示する第2の高速再生モードを実現する第2制御部を含み、前記第2制御部は、前記構成情報取得部から、再生すべき部分の前記符号化データ列を構成するフレームの種類および順序を取得し、それに基づいて表示すべきフレームおよび復号すべきフレームを決定してもよい。
【0016】
前記高速再生制御部は、前記復号すべきフレームと、前記復号器の性能に基づいて、前記第2の高速再生モードの可否を判断する判断部をさらに含んでもよい。前記判断部は、前記第2の高速再生モードが不可能と判断されたときに、前記第1の高速再生モードに切り替えてもよい。これにより、再生速度を連続的に変化させた場合にも、シームレスな高速再生を実現することができる。
【0017】
前記構成情報取得部は、前記符号化データ列の所定位置に格納された情報を読み出すことにより、前記符号化データ列に含まれるフレームの数、形式、または順序を取得してもよい。情報の格納側と読出側とで共通の認識があれば、任意の位置に格納してもよい。
【0018】
本発明の別の態様は画像記録装置に関する。この装置は、形式の異なる第1および第2形式フレームが混在したフレーム群を単位として符号化された符号化データ列の所定位置に、前記フレーム群に含まれるフレームの数、形式、または順序を示す情報を付加する構成情報付加部を備える。たとえば、第1形式フレームは単一フレームの符号化データにより復号可能な形式であり、第2形式フレームは他のフレームの符号化データを参照することにより復号可能な形式であってもよい。
【0019】
本発明のさらに別の態様は動画像のデータ構造に関する。このデータ構造は、動画像を表す動画データのデータ構造であって、形式の異なる第1および第2形式フレームが混在したフレーム群を単位として前記動画データを符号化した符号化データ列と、前記符号化データ列の所定位置に格納された、前記フレーム群に含まれるフレームの数、形式、または順序を示す情報と、を含む。
【0020】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、記録媒体などの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0021】
本発明によれば、符号化データ列の高速再生のための適切な制御技術を提供することができる。
【発明を実施するための最良の形態】
【0022】
(第1の実施の形態)
本実施の形態では、MPEG方式で符号化された動画の符号化データ列中の所定位置にピクチャ構成情報を予め格納しておき、再生時にそのピクチャ構成情報を取得して各種再生処理の制御に利用する技術を説明する。本実施の形態では、MPEG方式を例にとって説明するが、本実施の形態の技術は、フレーム内符号化方式で符号化されたフレームと、フレーム間符号化方式で符号化されたフレームとが混在する符号化データ列を取扱うときに、一般に利用可能である。また、以下では、説明の簡単のため、MPEG2方式におけるピクチャとGOPという用語を用いるが、これはMPEG4方式への適用を除外する趣旨ではなく、MPEG4方式におけるVOPとGOVの概念を包含するものである。
【0023】
図1は、第1の実施の形態に係る画像再生装置300の構成図である。この画像再生装置300は、伝達メディア200からのMPEGビデオストリームを表示装置344に出力するムービーカメラ、スチルカメラ、テレビジョン、ビデオCD再生装置、DVD再生装置などに組み込まれる。なお、伝達メディア200には、蓄積メディア(ビデオCD,CD−ROM,DVD,VTRなど)、通信メディア(LANなど)、放送メディア(地上波放送,衛星放送,CATVなど)などが含まれる。また、蓄積メディアや放送メディアからのデータがMPEGビデオパートに準拠して符号化されていないデータである場合は、伝達メディアは、このデジタルデータを符号化するためのMPEGビデオエンコーダをも含む。画像再生装置300をムービーカメラまたはスチルカメラに組み込む場合は、伝達メディア200がCCDなどの撮像デバイスおよびその信号処理回路に置き換えられる。
【0024】
画像再生装置300は、伝達メディア200から符号化データストリームを入力する入力ブロック304と、入力ブロック304により取得された画像および音声データを処理する処理ブロック306と、処理ブロック306によって復号された音声および画像を再生する再生ブロック308と、ユーザからの指示を受けつけるユーザインタフェイス312と、ユーザインタフェイス312からの命令にもとづいて入力ブロック304および処理ブロック306を制御する制御部310とを含む。またインタフェイスブロック336は、処理ブロック306による復号画像データを適宜外部機器へ出力する。
【0025】
処理ブロック306の再生制御部334は、CPU330およびメモリ332と連携し、符号化データストリーム中の画像および音声データを復号する。再生制御部334は、入力された符号化データストリームを復号し、音声データを音声出力部340へ、画像データを表示装置344へそれぞれ出力する。音声出力部340は、入力された音声データに所定の処理を施し、最終的に音声がスピーカ342へ出力される。表示装置344は、入力された画像データを表示する。
【0026】
ユーザインタフェイス312は、リモートコントローラまたは入力パネルなどを介して、ユーザから再生速度の切り替え、逆順再生の要求などを受けつける。制御部310は入力ブロック304および処理ブロック306に、再生モードの切替信号を送る。再生制御部334は、この切替信号に基づいて、通常再生、高速再生、または逆順再生を行う。
【0027】
図2は、再生制御部334の構成図である。これらの構成は、ハードウエア的には、CPU、メモリ、その他のLSIや組合せ回路などによって実現でき、ソフトウエア的にはメモリにロードされた画像再生制御機能のあるプログラムなどによって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能がハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。再生制御部334のうちハードウェアにより実現されるブロックを1チップのLSIに搭載してもよい。
【0028】
再生モード切替部102は、制御部310から再生モードの切替信号を受信して、通常再生制御部106、高速再生制御部110、および逆順再生制御部120に、再生処理の指示を送る。通常再生制御部106は、再生モードが通常再生モードであるとき、入力ブロック304により入力された符号化データストリームをMPEGデコーダ130に入力して復号し、それを再生ブロック308に送り再生するための制御を行う。MPEGデコーダ130として、既知のMPEGデコーダを利用しても良く、後述のように、高速再生や逆順再生の処理限界の向上を目指して、通常のMPEGデコーダよりも高速な処理が可能な、2倍速対応デコーダ、3倍速対応デコーダなどを利用しても良い。
【0029】
ピクチャ構成情報取得部104は、符号化データストリームを構成するピクチャに関する情報を取得する。ピクチャ構成情報取得部104は、後述のように、高速再生処理または逆順再生処理のために必要なピクチャ構成情報として、たとえば、1つのGOPを構成するピクチャの数、種類、順序などの情報を取得する。この情報は、符号化データストリームの所定位置に予め格納されており、ピクチャ構成情報取得部104は、その所定位置のデータを読み込むことで、取得すべき情報を得る。
【0030】
高速再生制御部110は、再生モードが高速再生モードであるとき、通常再生モードよりも速い速度で符号化データストリームを再生するための制御を行う。本実施の形態では、高速再生モードとして、PピクチャおよびBピクチャを全てスキップしてIピクチャのみを順に表示する「高速スキップ再生モード」と、PピクチャおよびBピクチャも用いて滑らかに高速再生を行う「高速スムーズ再生モード」の2種類のモードを用意する。高速再生モード判断部112は、ピクチャ構成情報取得部104が取得したピクチャ構成情報と、制御部310を介してユーザから指示された再生速度に基づいて、いずれのモードにより高速再生を行うかを判断する。判断の方法については、後で詳述する。
【0031】
図3(a)(b)(c)は、高速スキップ再生の方法を説明するための図である。図3(a)の上段は、符号化データストリームのピクチャ構成の例を示す。この例では、15ピクチャで構成されるGOPが繰り返し出現するようなピクチャ構成となっている。図3(a)の中段は、この符号化データストリームを従来方式で4倍速再生したときのピクチャの表示順を示す。従来方式では、4フレームごとに1枚ずつIピクチャを順に表示することで、4倍速再生を実現している。図3(b)の下段は、この符号化データストリームを本実施の形態の方式で4倍速再生したときのピクチャの表示順を示す。本方式も、従来方式と同様に、Iピクチャのみを順に表示する。これにより、簡便に高速再生を実現することができる。
【0032】
図3(b)の上段は、12ピクチャで構成されるGOPが繰り返し出現するような符号化データストリームの例を示す。図3(b)の中段は、この符号化データストリームを従来方式で高速再生したときのピクチャの表示順を示す。従来方式では、前述の通りIピクチャのみを順に表示するが、このときの表示間隔は固定的であり、図3(a)の中段に示した例と同様に、4フレームごとに1枚のIピクチャを表示している。この例では、1つのGOPが12ピクチャで構成されているため、結果的に3倍速再生が実現されているが、ユーザが3倍速再生を指定したから3倍速再生を行ったわけではなく、固定間隔でIピクチャを順に表示した結果、この例では3倍速再生となっただけである。すなわち、従来方式では、高速再生を行うときに、Iピクチャを固定間隔で表示するため、再生速度を制御することはできず、符号化データストリーム中のピクチャ構成に依存して再生速度が変化するという問題があった。
【0033】
さらに顕著な例として、図3(c)の上段は、GOPを構成するピクチャ数が同じ符号化データストリーム中で変化する例を示す。このとき、図3(b)に示すように、従来方式で高速再生を行うと、実際の符号化データストリーム中ではIピクチャ間の間隔が変化しているにも関わらず、その変化を反映せずに固定間隔でIピクチャを表示するため、再生速度が速くなったり遅くなったりして不自然な印象を与える恐れがあった。
【0034】
このような問題を解決するために、本実施の形態では、ピクチャ構成情報取得部により取得されたピクチャ構成情報を利用して、実際のIピクチャ間の間隔を反映した自然な高速再生を実現する。たとえば、図3(b)の上段に示した符号化データストリームを4倍速で高速スキップ再生する場合、予め1GOPが12ピクチャで構成されていることが分かるので、図3(b)の下段に示すように、3フレームごとに1枚ずつIピクチャを表示することにより、4倍速の高速スキップ再生が実現される。3倍速の場合は4フレームごとに1枚、6倍速の場合は2フレームごとに1枚のIピクチャを表示すればよい。5倍速の場合は、たとえば、4倍速(3フレームに1枚)と6倍速(2フレームに1枚)を組み合わせて平均して5倍速になるように制御してもよいし、1枚のIピクチャを表示する時間が2.4フレーム分になるように制御してもよい。
【0035】
図3(c)の上段に示した例のように、GOPを構成するピクチャ数が変化する場合においても、予めGOPを構成するピクチャの情報を取得することにより、図3(c)の下段に示すように、Iピクチャ間の間隔を適切に反映した高速スキップ再生を実現することができる。ここで、上記の方法を実現するために、予めIピクチャが出現する間隔を知っておく必要があるが、1つのGOPに含まれる1枚のIピクチャが含まれる場合は、GOPを構成するピクチャの数を取得することで、Iピクチャの間隔を取得または類推することができる。もちろん、GOPを構成するピクチャの種類および順序を取得してもよい。
【0036】
図4(a)(b)(c)(d)(e)は、高速スムーズ再生の方法を説明するための図である。図4(a)上段は、符号化データストリームのピクチャ構成の例を、図4(a)中段および下段は、それぞれ、この符号化データストリームの表示順および符号順を示す。図4(b)は、この符号化データストリームを2倍速で高速スムーズ再生するときに表示すべきピクチャと、デコードすべきピクチャを示す。2倍速再生の場合は、2フレームごとに1枚のピクチャを表示すればよい。この例では、表示すべきピクチャの種類は、順に、I111315となる。ここで、たとえば「I」は、表示順が「1」の「I」ピクチャを示す。Pピクチャは、参照元である過去のIピクチャまたはPピクチャが復号されていれば復号可能であるから、間のBピクチャは復号する必要がない。したがって、デコードすべきピクチャも、順に、I111315となる。表示ピクチャ1枚につき、1枚のピクチャをデコードすればよいため、通常のMPEGデコーダを用いて、この符号化データストリームを2倍速で高速スムーズ再生できることが分かる。
【0037】
図4(c)は、この符号化データストリームを3倍速で高速スムーズ再生するときに表示すべきピクチャと、デコードすべきピクチャを示す。3倍速再生の場合は、3フレームごとに1枚のピクチャを表示すればよく、順に、I1013となる。Bピクチャを復号するためには、参照元である過去および未来のIピクチャまたはPピクチャを復号する必要があるため、デコードすべきピクチャは、順に、[I]P[B][P]P11[B10][P13]となる。ここで、実際に表示されるピクチャを[]で囲んでいる。このとき、1倍速のMPEGデコーダではデコードが間に合わず高速スムーズ再生を行うことができないが、1フレーム期間に2フレームのデコードが可能な2倍速対応のMPEGデコーダを用いると、高速スムーズ再生を行うことができる。
【0038】
図4(d)は、この符号化データストリームを4倍速で高速スムーズ再生するときに表示すべきピクチャと、デコードすべきピクチャを示す。4倍速再生の場合は、順に、I13が表示されるが、そのために、[I]P[P]P[P]P11[P13]をデコードする必要がある。すなわち、2倍速以上のMPEGデコーダを用いることにより、この符号化データストリームを4倍速で高速スムーズ再生することができる。
【0039】
図4(e)は、この符号化データストリームを5倍速で高速スムーズ再生するときに表示すべきピクチャと、デコードすべきピクチャを示す。5倍速再生の場合は、順に、I11が表示されるが、そのために、[I]P[B]P[P11]をデコードする必要がある。すなわち、もはや2倍速のMPEGデコーダでも処理が破綻し、3倍速以上のMPEGデコーダが必要となる。
【0040】
このように、符号化データストリームのピクチャ構成と、MPEGデコーダの性能により、何倍速まで高速スムーズ再生可能かが決まる。いま、ピクチャ構成を示す指標として、Bピクチャが繰り返し出現する数をMとする。すなわち、ピクチャ構成が「IPPPPP・・・」の場合は、Bピクチャは存在しないのでM=0であり、ピクチャ構成が「IBPBPBP・・・」の場合は、Bピクチャが1枚ずつ挿入されているのでM=1であり、ピクチャ構成が「IBBPBBP・・・」の場合は、Bピクチャが2枚ずつ挿入されているのでM=2である。また、デコーダの性能を示す指標として、1フレーム期間にデコードできるフレームの数をDで表す。たとえば、2倍速対応デコーダの場合はD=2であり、3倍速対応デコーダの場合はD=3である。このとき、高速スムーズ再生可能な限界速度Lは、L=(M+1)×Dで与えられる。図4(a)の例のように、Bピクチャが一枚挿入されている場合はM=1であるから、1倍速対応デコーダの場合は、L=(1+1)×1=2、すなわち2倍速の高速スムーズ再生まで可能であり、2倍速対応デコーダの場合は、L=(1+1)×2=4、すなわち4倍速の高速スムーズ再生まで可能である。
【0041】
高速再生モード判断部112は、上述したような判断基準をもとに、ユーザから指定された再生速度SがL以下の場合は高速スムーズ再生モードを選択し、再生速度SがLを超えた場合は、高速スムーズ再生が不可能となるので、高速スキップ再生モードを選択してもよい。また、ピクチャ構成が一定でなく、GOPごとに変化するような場合は、GOPごとに高速スムーズ再生の可否を判断して切り替えてもよいし、高速スキップ再生モードを選択してもよい。GOP内のピクチャ構成が上述の例のように規則的でない場合についても同様である。ピクチャ構成が不規則的で判断が困難な場合は、高速スキップ再生モードを選択してもよいし、高速スムーズ再生モードで再生を行い、処理が破綻した時点で高速スキップ再生モードに切り替えてもよい。
【0042】
以上のように、予め符号化データストリームのピクチャ構成に関する情報を取得して高速再生処理を制御することで、適切な再生方式を選択し、符号化データストリームのピクチャ構成を反映した自然な高速再生を実現することができる。また、ユーザが再生速度をアナログ的に変化させることができるように構成した場合にも、高速スムーズ再生から高速スキップ再生への切り替えをシームレスに行うことが可能となる。
【0043】
図2に戻り、逆順再生制御部304は、再生モードが逆順再生モードであるとき、通常再生モードとは逆順に符号化データストリームを再生するための制御を行う。MPEGでは、順方向予測、双方向予測を利用して符号化を行い、ピクチャの符号順と表示順が異なるため、通常の正方向の復号に比べて逆順の復号は容易ではない。本実施の形態では、逆順再生をスムーズに行うために、通常再生中に、いったんデコードしたフレームをMPEGエンコーダ140により再びエンコードし、保持部150に一時的に保持しておく。メモリを効率良く利用するために、再符号化したデータを次々に上書きし、直前のGOPのみを保持しておく。エンコードの際、全てのピクチャをIピクチャとして符号化しておいてもよいし、ピクチャを逆順に並べ替えて、通常のMPEG方式で符号化してもよい。保持部150に保持しておくデータ量は、たとえば、1GOPであってもよい。
【0044】
ユーザから制御部310を介して逆順再生の要求があったとき、逆順再生制御部120は、まず、保持部150に保持されている1GOP分のIピクチャを逆順に読み出してMPEGデコーダ130に送り、復号して表示する。その間に並行して、入力ブロック304により過去の符号化データストリームを取得し、たとえば1GOPごとにデコードして、生成したピクチャを逆順に再生する。
【0045】
ここで、たとえば1GOP分のピクチャを符号化して保持部150に格納するとき、GOPに含まれるピクチャの数、種類などが一定でない符号化データストリームの場合は、1GOPに含まれるピクチャ数が通常よりも多いときに、保持部150の容量を超えてしまうことがある。そのため、本実施の形態では、ピクチャ構成情報取得部104により取得したピクチャ構成情報を参照して、再符号化したデータが保持部150に格納可能か否かを判断する。格納できないと判断された場合、1)圧縮率を高くしてピクチャ1枚あたりの容量を下げる、2)ピクチャを間引いて符号化し、逆順再生時には、間引いたフレームの箇所は直前のフレームを表示し続けることで再生速度を合わせる、3)逆順再生時の表示順にピクチャを格納し、格納できなかった分は逆順再生の要求後にデコードして生成する、4)他のメモリ領域を確保して保持部150の容量を上げる、5)逆順再生を不可とし、その旨をユーザに警告する、などの方法をとることができる。これにより、ピクチャ構成が一定でない場合であっても、予めピクチャ構成を取得することにより、メモリを効率的に利用して逆順再生を行うことができるので、メモリの削減にもつながる。
【0046】
ピクチャ構成情報取得部104が取得するピクチャの構成情報は、符号化データ列の所定位置に格納されている。その格納位置は、MPEGにおけるGOPヘッダ、シーケンスヘッダなどに設けられているリザーブ領域、すなわちユーザデータ領域であってもよいし、さらに上位のレイヤであってもよいし、ピクチャ構成情報取得部104が認識可能であればどの位置に格納されていてもよい。GOPに含まれるピクチャの数については、MPEG2におけるIピクチャのピクチャヘッダに設けられた「temporal_reference」コードの差分により算出してもよいし、GOPヘッダに設けられた「time_code」情報とシーケンスヘッダに設けられたフレームレート情報とから算出してもよい。
【0047】
ピクチャの構成情報の形式も、ピクチャ構成情報取得部104が認識可能な形式であれば任意でよい。たとえば、あるGOPを構成するピクチャが、「IBPBPB」であったとき、ユーザデータ領域に、GOP内のピクチャ数を示す「6」、ピクチャ形式をそれぞれ「I:1」、「P:2」、「B:3」で表現した、「132323」を、それぞれ格納してもよい。ピクチャの順序を、間に挿入されるBピクチャの数で表現してもよい。上述の例では、Bピクチャが1枚ずつ挿入されているため、「1」となる。また、代表的なピクチャの順序をテーブル化してもよい。ピクチャ数に代えて、GOPの時間情報を格納してもよい。
【0048】
以上、本実施の形態の画像再生装置300の構成を説明した。この構成に基づく本実施形態の画像再生手順を、図5から図7に示すフローチャートにしたがって説明する。
【0049】
図5は、本実施の形態の画像再生装置300における高速スキップ再生の手順を示す。まず、高速スキップ再生モードになると、ピクチャ構成情報取得部104が、次に再生すべきGOPに含まれるピクチャ数を取得する(S100)。GOPに複数のIピクチャが含まれる場合は、Iピクチャ間のピクチャ数を取得してもよい。つづいて、再生速度とピクチャ数に基づいて、高速スキップ再生制御部114は、Iピクチャの表示間隔を算出する(S102)。つづいて、MPEGデコーダ130によりIピクチャが復号され(S104)、表示装置344に表示される(S106)。Iピクチャの表示時間が経過するまでは(S108のN)、そのIピクチャを表示し続け、表示時間が経過すると(S108のY)、次のIピクチャを表示するための処理に移る。以上の手順が、高速スキップ再生モードが終了する(S110のY)まで繰り返される。
【0050】
図6は、本実施の形態の画像再生装置300における高速スムーズ再生の手順を示す。まず、高速スムーズ再生モードになると、ピクチャ構成情報取得部104が、次に再生すべきGOPに含まれるピクチャの形式および順序を取得する(S200)。つづいて、高速スムーズ再生制御部116が、高速スムーズ再生が可能か否かを判断する(S202)。このとき、上述のように、標準的なピクチャ構成の場合は、ピクチャ構成と再生速度から高速スムーズ再生の可否が判断できる。図4に示したように、表示すべきピクチャと復号すべきピクチャを決定し、それらの構成から高速スムーズ再生の可否を判断してもよい。高速スムーズ再生が可能であると判断されると(S202のY)、復号すべきフレームをMPEGデコーダ130により復号し(S204)、そのうち表示すべきフレームを表示装置344に表示する(S206)。高速スムーズ再生が不可能であると判断されると(S202のN)、高速スキップ再生に切り替え(S208)、Iピクチャのみが復号され表示される。以上の手順が、高速スムーズ再生モードが終了する(S210のY)まで繰り返される。図6のフローチャートでは、GOPごとに高速スムーズ再生の可否を判断しているが、符号化データ列内でピクチャ構成が一定である場合は、再生速度が変更されたときに1回判断すれば十分であり、その後は高速スムーズ再生処理を続ければよい。
【0051】
図7は、本実施の形態の画像再生装置300における逆順再生の手順を示す。まず、通常再生モードにおいて、ピクチャ構成情報取得部104が、次に再生すべきGOPに含まれるピクチャの構成情報を取得する(S300)。ピクチャの構成情報として、ピクチャの数、形式、順序などを取得してもよい。つづいて、逆順再生制御部120は、そのGOPを再エンコードした符号化データを保持部150に格納可能か否かを判断する(S302)。格納可能である場合は(S302のY)、MPEGエンコーダ140により逆順再生可能な形式に符号化し(S304)、保持部150に格納する(S306)。格納不可能である場合は(S302のN)、フレームを間引いたり、圧縮率を上げるなどして、符号化の態様を変更した後(S308)、同様に符号化し(S304)、格納する(S306)。以上の手順が、通常再生モードの間、繰り返し実行される。
【0052】
逆順再生モードに変わると(S310のY)、逆順再生制御部120は、保持部150に保持されていた1GOP分の逆順再生用画像を読み出し(S312)、それをMPEGデコーダ130により復号して(S314)、表示装置344に表示する(S316)。その間に、バックグラウンドで、入力ブロック304を介して過去のGOPを入力して復号し、生成した画像データを逆順に表示する。
【0053】
(第2の実施の形態)
図8は、第2の実施の形態に係る画像記録装置400の構成図である。この画像記録装置400は、伝達メディア200からのMPEGビデオストリームを記録するムービーカメラ、スチルカメラ、ビデオCD記録装置、DVD記録装置などに組み込まれる。なお、伝達メディア200には、蓄積メディア(ビデオCD,CD−ROM,DVD,VTRなど)、通信メディア(LANなど)、放送メディア(地上波放送,衛星放送,CATVなど)などが含まれる。また、蓄積メディアや放送メディアからのデータがMPEGビデオパートに準拠して符号化されていないデータである場合は、画像記録装置400は、このデジタルデータを符号化するためのMPEGビデオエンコーダを含む。画像記録装置400をムービーカメラまたはスチルカメラに組み込む場合は、伝達メディア200がCCDなどの撮像デバイスおよびその信号処理回路に置き換えられる。
【0054】
画像記録装置400は、伝達メディア200から符号化データ列を入力する入力ブロック404と、入力ブロック404により取得された符号化データ列の記録ブロック408への記録を制御する処理ブロック406と、符号化データ列を記録する記録ブロック408と、ユーザからの指示を受けつけるユーザインタフェイス412と、ユーザインタフェイス412からの命令にもとづいて入力ブロック404および処理ブロック406を制御する制御部410とを含む。
【0055】
処理ブロック406の記録制御部434は、符号化データ列を記録ブロック408に記録する。ピクチャ構成情報付加部436は、符号化データ列に含まれるピクチャの数、形式、順序などの構成情報を、たとえばGOPごとに、ユーザデータ領域などの所定位置に付加する。これにより、形式の異なる第1および第2形式フレームが混在したフレーム群を単位として動画データを符号化した符号化データ列と、符号化データ列の所定位置に格納された、フレーム群に含まれるフレームの数、形式、または順序を示す情報とを含むデータ構造が生成される。ユーザインタフェイス412は、リモートコントローラまたは入力パネルなどを介して、ユーザから記録要求などを受けつける。制御部410は入力ブロック404および処理ブロック406に、記録開始信号を送る。記録制御部434は、この記録開始信号に基づいて、記録処理を行う。記録ブロック408は、CD、MO、MD、DVD、その他の各種記録媒体に記録するためのドライブ装置であってもよいし、記録媒体自身であってもよい。
【0056】
ピクチャ構成情報格納部436がピクチャの構成情報を付加することにより、符号化データ列を再生する画像再生装置において、この情報を利用して適切な制御を行うことができる。ピクチャ構成情報を格納するタイミングは、本実施の形態のように符号化データ列を記録する段階であってもよいし、MPEGエンコーダにより符号化データ列を生成する段階であってもよいし、その他任意のタイミングであってもよい。
【0057】
以上、本発明を実施の形態をもとに説明した。これらの実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。以下、変形例を挙げる。
【0058】
実施の形態では、高速スキップ再生のときに、Iピクチャのみを再生したが、これに加えて、Pピクチャ、場合によってはBピクチャを再生してもよい。GOPまたはGOVに含まれるピクチャまたはVOPの数が多い場合は、IピクチャまたはI−VOPのみを表示すると粗過ぎるので、必要に応じて、途中の画像を表示してもよい。
【図面の簡単な説明】
【0059】
【図1】第1の実施の形態に係る画像再生装置の構成図である。
【図2】図1の再生制御部の機能構成図である。
【図3】図3(a)(b)(c)は、高速スキップ再生の方法を説明する図である。
【図4】図4(a)(b)(c)(d)(e)は、高速スムーズ再生の方法を説明するための図である。
【図5】実施の形態の画像再生装置における高速スキップ再生の手順を示すフローチャートである。
【図6】実施の形態の画像再生装置における高速スムーズ再生の手順を示すフローチャートである。
【図7】実施の形態の画像再生装置における逆順再生の手順を示すフローチャートである。
【図8】第2の実施の形態に係る画像記録装置の構成図である。
【符号の説明】
【0060】
104 ピクチャ構成情報取得部
110 高速再生制御部
112 高速再生モード判断部
114 高速スキップ再生制御部
116 高速スムーズ再生制御部
120 逆順再生制御部
130 MPEGデコーダ
140 MPEGエンコーダ
150 保持部
300 画像再生装置
334 再生制御部
400 画像記録装置
436 ピクチャ構成情報付加部

【特許請求の範囲】
【請求項1】
形式の異なる第1および第2形式フレームが混在した符号化データ列を復号して画像データを生成する復号器と、
前記符号化データ列に含まれるフレームのうち、一部のみを前記復号器に復号させ、表示装置に表示させることにより、高速再生を行う高速再生制御部と、
前記符号化データ列に含まれるフレームの数、形式、または順序を取得する構成情報取得部と、を備え、
前記高速再生制御部は、前記フレームの数、形式、または順序に基づいて、前記高速再生を制御することを特徴とする画像再生装置。
【請求項2】
前記高速再生制御部は、前記第1形式フレームのみを復号して表示する第1の高速再生モードを実現する第1制御部を含み、
前記第1制御部は、前記構成情報取得部から、第1形式フレームと、その次に表示すべき第1形式フレームとの間に存在するフレーム数を取得し、前記フレーム数と前記高速再生の速度に基づいて、第1形式フレームの表示間隔を決定することを特徴とする請求項2に記載の画像再生装置。
【請求項3】
前記符号化データ列は、少なくとも1枚の第1形式フレームと、少なくとも1枚の第2形式フレームを含むフレーム群を単位として符号化されたものであり、
前記第1制御部は、前記フレーム群に属するフレームの数を取得し、それを第1形式フレームとその次に表示すべき第1形式フレームとの間に存在するフレーム数とすることを特徴とする請求項2に記載の画像再生装置。
【請求項4】
前記高速再生制御部は、前記高速再生の速度に応じてフレームを間引いて表示する第2の高速再生モードを実現する第2制御部を含み、
前記第2制御部は、前記構成情報取得部から、再生すべき部分の前記符号化データ列を構成するフレームの種類および順序を取得し、それに基づいて表示すべきフレームおよび復号すべきフレームを決定することを特徴とする請求項1に記載の画像再生装置。
【請求項5】
前記高速再生制御部は、前記復号すべきフレームと、前記復号器の性能に基づいて、前記第2の高速再生モードの可否を判断する判断部をさらに含むことを特徴とする請求項4に記載の画像再生装置。
【請求項6】
前記高速再生制御部は、前記第1形式フレームのみを復号して表示する第1の高速再生モードを実現する第1制御部をさらに含み、
前記判断部は、前記第2の高速再生モードが不可能と判断されたときに、前記第1の高速再生モードに切り替えることを特徴とする請求項5に記載の画像再生装置。
【請求項7】
前記構成情報取得部は、前記符号化データ列の所定位置に格納された情報を読み出すことにより、前記符号化データ列に含まれるフレームの数、形式、または順序を取得することを特徴とする請求項1から6のいずれかに記載の画像再生装置。
【請求項8】
形式の異なる第1および第2形式フレームが混在したフレーム群を単位として符号化された符号化データ列の所定位置に、前記フレーム群に含まれるフレームの数、形式、または順序を示す情報を付加する構成情報付加部を備えることを特徴とする画像記録装置。
【請求項9】
動画像を表す動画データのデータ構造であって、
形式の異なる第1および第2形式フレームが混在したフレーム群を単位として前記動画データを符号化した符号化データ列と、
前記符号化データ列の所定位置に格納された、前記フレーム群に含まれるフレームの数、形式、または順序を示す情報と、
を含むことを特徴とするデータ構造。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2006−217635(P2006−217635A)
【公開日】平成18年8月17日(2006.8.17)
【国際特許分類】
【出願番号】特願2006−40947(P2006−40947)
【出願日】平成18年2月17日(2006.2.17)
【分割の表示】特願2002−173316(P2002−173316)の分割
【原出願日】平成14年6月13日(2002.6.13)
【出願人】(000001889)三洋電機株式会社 (18,308)
【Fターム(参考)】