説明

複数の経路を含むネットワークを通じてビデオを転送する方法およびシステム

複数の経路を含むネットワークを通じてビデオを転送する方法を提供する。まず、細粒度スケーラビリティを用いて、基本階層、1つまたは複数の低ビットレート拡張階層、および1つまたは複数の高ビットレート拡張階層に、ビデオが符号化される。基本階層および低ビットレート階層は、それぞれ、複数の基本階層および複数の低ビットレート拡張階層に複製される。高ビットレート階層は、複数の部分低ビットレート階層に分割され、次にそれぞれの階層が、ネットワークの異なる経路を通じて受信者に送信される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、包括的には圧縮ビデオのストリーミングに関し、詳細には、複数のネットワーク経路を通じてのビデオの細粒度スケーラビリティ(fine-granularity scalability:FGS)によるストリーミングの送信に関する。
【背景技術】
【0002】
インターネット等のネットワークを通じて圧縮ビデオをストリーミングする用途について、重要な問題の1つは、異なる資源、アクセス経路、およびプロセッサを使用する受信者に、ビデオストリームを配信するということである。したがって、ビデオのコンテンツは、そのようなネットワークにおいて見出される異機種環境に動的に適応する。
【0003】
MPEG−4規格用に、そのような動的に変化するネットワーク環境にビデオを適応させる細粒度スケーラビリティ(FGS)が開発されている、ISO/IEC 14496-2: 1999/FDAM4, "Information technology - coding of audio/visual objects, Part 2: Visual"を参照されたい。MPEG−4規格へのこの改正の概要は、Li, "Overview of Fine Granularity Scslability in MPEG-4 Video Standard," IEEE Trans. on Circuits and Systems for Video Technology, Vol. 11, No.3, pp. 301-317, March 2001を参照願いたい。
【0004】
MPEG−4 FGSエンコーダは、基本階層ストリームと拡張階層ストリームという、2つのビットストリームを生成する。この2つのビットストリームは、目的および重要性が異なっている。基本階層ストリームは、基本復号ビデオを提供する。基本階層ストリームは、拡張階層ストリームを用いることができるようになる前に、正確に復号しなければならない。したがって、基本階層は、強力に保護しなければならない。拡張階層ストリームは、基本ビデオの品質を改善するのに用いることができる。
【0005】
FGS符号化は、従来のスケーラブル符号化から根本的に脱却するものである。従来のスケーラブル符号化では、コンテンツは、基本階層のビットストリームに、およびもしかするといくつかの拡張階層に符号化され、その場合粒度は、形成されている拡張階層の数と同程度に精細なだけである。結果として生じるレート歪曲線は、階段状の関数に類似している。
【0006】
これに対して、FGS符号化は、連続的にスケーラブルな拡張階層のビットストリームを提供する。基本階層のビットストリームの再構築したフレームが入力ビデオから引き算されることによって、拡張階層のビットストリームが発生される。これにより、空間ドメインにおいてFGS残差信号が生じる。この残差信号に、離散コサイン変換(DCT)符号化が適用される。そうすると、DCT係数が、ビットプレーン符号化方式によって符号化される。ビットプレーン符号化によって、拡張階層のビットストリームの複数の副階層を生成することができる。以下、副階層も拡張階層と言う。ビットプレーン符号化によって、拡張階層のビットストリームをいかなるポイントにおいても切り捨てることができる。したがって、再構築されるビデオの品質は、拡張階層のビットストリームから復号されるビットの数に比例する。
【0007】
FGSは、ストリーミングビデオの連続的なレート制御を行う。拡張階層のビットストリームをいかなるポイントにおいても切り捨てて、目標ビットレートを達成することができるからである。従来のスケーラブル符号化方式と比較して、FGSの他の利点は、その誤り耐性である。復号される拡張階層内の1つまたは複数のフレームにおける損失または破損は、後続のフレームに伝播するものではない。後続のフレームは、常に、拡張階層が適用される前に、まず基本階層から復号される。
【0008】
FGSの取組みは、以下の各領域に焦点を当ててきた。すなわち、符号化効率を改善する(Kalluri, "Single-Loop Motion-Compensated based Fine-Granular Scalability (MC-FGS)," MPEG2001/M6831, July 2001およびWu et al., "A framework for Efficient Fine Granularity Scalable Video Coding," IEEE Trans. on Circuits and System for Video Technology, Vol. 11, No. 3, pp. 332-344, March 2001を参照されたい)、拡張階層を切り捨てて隣接するフレーム間での品質のばらつきを最少にする(Zhang et al., "Constant Quality Constrained Rate Allocation for FGS Video Coded Bitstreams," Visual Communications and Image Processing 2002, Proceedings of SPIE, Vol. 4671, pp. 817-827, 2000、Cheong et al., "FGS coding scheme with arbitrary water ring scan order," ISO/IEC JTC1/SC29/WG11, MPEG 2001/M7442, July 2001、およびLim et al., "Macroblock reordering for FGS," ISO/IEC JTC1/SC29/WG11, MPEG 2000/M5759, March 2000を参照されたい)、ならびに、時間スケーラビリティを付加するようFGS符号化構造を変更する(Van der Schaar et al., "A Hybrid Temporal-SNR Fine Granular Scalability for Internet Video," IEEE Trans. on Circuits and System for Video Technology, Vol. 11, No. 3, pp. 318-331, March 2001、およびYan et al., "Macroblock-based Progressive Fine Granularity Spatial Scalability (mb-PFGSS)," ISO/IEC JTC1/SC29/WG11, MPEG2001/M7112, March 2001を参照されたい)ことに焦点を当ててきた。
【0009】
FGSストリームを保護する問題もまた、取り組まれてきた。基本階層を符号化し送信するのに、さまざまな技法が利用できる(Wang et al., "Error Control and Concealment for Video Communication: A Review," Proceedings of the IEEE, vol. 86, No. 5, pp. 974-997, May 1998、およびWang et al., "Error Resilient Video Coding Techniques,"IEEE Signal Processing Magazine, pp. 61-82, July 2000を参照されたい)。
【0010】
FGS拡張階層を保護するのに、適応的な前方誤り訂正コード(FEC)を用いることができる(Wang et al., "Channel-Adaptiveive Error Control for Scalable Video over Wireless Channel," The 7th International Workshop on Mobile Multimedia Communications(MoMuC)2000, October 2000を参照されたい)。不均一誤り保護(Unequal error protection)もまた、FGSビットストリームを転送するのに用いてもよい(Van der Schaar et al. "Unequal packet Loss Resilience for Fine Granularity Scalability Video," IEEE Trans. on Multimedia, Vol. 3, No. 4, pp. 381-394, December 2001を参照されたい)。
【0011】
ネットワークにおける瞬間的な輻輳は、ストリーミングビデオの送信にとっての大きな課題である。理論的には、FGSは、ネットワークの特性を終端間で測定し、そのコンポーネントを予測することによって、利用できる帯域幅に動的に適応することができる。しかし、多くの場合、輻輳の継続時間は、そのFGSビデオストリームを効果的に適応させるために測定し予測するのにかかる時間よりも短い。
【0012】
FECおよび再送信によって、瞬間的な輻輳のために損失したパケットを回復できることもある。しかし、このような解決策は、両方とも、さらなるトラフィックを持ち込むことによって、輻輳を悪化させる可能性もある。
【0013】
有線ネットワークと無線ネットワークの両方について、非常に多くのマルチパス技術が知られている(Cidon et al., "Analysis of Multi-path Routing," IEEE/ACM transaction on Networking, Vol. 7, No. 6, pp. 885-896, December 1999、Su et al., "Dynamic multi-path routing: asymptotic approximation and simulations," ACM SIGMETRICS Performance Evaluation Review, Volume: 29, Issue: 1, pp. 25-36, June 2001、およびPham et al., "Multi-path routing protocol with load balancing policy in mobile ad hoc network," 4th International Workshop on Mobile and Wireless Communications Network, 2002を参照されたい)。
【0014】
そのような場合、それぞれの経路が有する帯域幅は、シングルパスよりも低いかもしれないが、利用できる帯域幅全体はシングルパスよりも高い。
【0015】
複数の別個の経路を通じて標準の(非FGSの)圧縮ビデオストリームを転送する、多重記述符号化(MDC)が開発されている。MDCにおいては、ビデオのコンテンツの、互いに異なる記述が、それぞれの経路を通じて送信される。このような互いに異なる経路においては、誤りは別個に生じるので、すべての経路が同じ誤りを招く確率は低い(Wang et al., "Error Resilient Video Coding Techniques," IEEE Signal Processing Magazine, pp. 61-82, July 2000を参照されたい)。複数の無線チャネルを通じてビデオストリームを転送するMDC技法もまた知られている(Reibman et al., "Transmission of Multiple Description and Layered Video over an EGPRS Wireless Network," ICIP 2000, pp. 136-139, 2000、Zheng et al., "Wireless Video Performance Through BLAST Testbed," VTC 2001, pp. 141-146, 2001、およびKamaci et al., "Multiple description coding with multiple transmit and receive antennas for wireless channels: the case of digital modulation," Global Telecommunications Conference, 2001, GLOBECOM '01. IEEE, Volume: 6 pp. 3272-3276, 2001を参照されたい)。
【0016】
しかし、既知の従来技術の技法は、いずれも、ネットワークの複数の経路を通じてMPEG−4のFGSの圧縮ビデオストリームを送信する方法を説明してはいない。
【発明の開示】
【発明が解決しようとする課題】
【0017】
したがって、複数の経路を通じてFGSのビデオストリームを送信して誤りおよび瞬間的な輻輳が低減するようにするシステムおよび方法を提供することが望まれている。
【課題を解決するための手段】
【0018】
方法は、複数の経路を含むネットワークを通じてビデオを転送する。まず、細粒度スケーラビリティを用いて、基本階層、1つまたは複数の低ビットレート拡張階層、および1つまたは複数の高ビットレート拡張階層に、ビデオが符号化される。
【0019】
基本階層および低ビットレート階層は、複数の基本階層および複数の低ビットレート拡張階層に複製される。
【0020】
1つまたは複数の高ビットレート階層は、複数の部分低ビットレート階層に分割され、次にそれぞれの階層が、ネットワークの異なる経路を通じて受信者に送信される。
【発明を実施するための最良の形態】
【0021】
システム構造
図1は、本発明を用いることができるインターネット等の通信システム100を示す。システム100は、送信者101と、受信者102と、すべて複数の経路105によって接続された複数のノード103(例えばルータやブリッジを含む)を備えたネットワーク110とを含む。本発明は、ネットワーク110の複数の経路105を通じてMPEG−4の細粒度スケーラビリティ(FGS)ビデオストリームを送信する方法を提供する。
【0022】
システム動作
図2は、本発明による方法200を示す。入力ビデオ201は、細粒度スケーラビリティを用いて、基本階層211と、例えば約30から40Kbpsよりも低い、1つまたは複数の低ビットレート拡張階層212とに符号化される(210)。ビットストリーム211〜212は、それぞれ、複数のストリーム221〜222に複製されて(220)、ネットワーク110の複数の経路105を通じて受信者102に送信される(240)。
【0023】
1つまたは複数の高ビットレート拡張階層213は、複数の記述205を用いて符号化され(210)、次に、部分高ビットレート階層231に分割されて(230)、ネットワーク110の複数の経路105を通じて送信され(240)、受信者102に配信される。
【0024】
ビットレートおよび誤りの統計分析
本発明の背後にある考え方は、符号化FGSビットストリームの特性の綿密な統計分析によってもたらされている。我々は、「Coast Guard」や「Akiyo」等の標準のビデオシーケンスの符号化によって開始する。Coast Guardは、きめの細かい水を進むボートを示し、Akiyoは、簡素な背景をバックにしたかなり動きがないニュースアナウンサーを示す。IフレームとPフレームの両方について基本階層の量子化パラメータQを31に設定することによって、シーケンスは、CIF(common-intermediate-format)で符号化される。このような2つの標準のビデオシーケンスにおいて、Bフレームはない。
【0025】
基本階層(BL)、および大きな残差の情報を保持するEL1やEL2等の低ビットレート拡張階層については、ビットレートは比較的低く、例えば、それぞれ約31.3Kbpsおよび6.8Kbpsである。しかし、EL3以上の拡張階層については、ビットレートは、数百Kbpsになる可能性がある。したがって、シーケンス全体のピーク平均信号対雑音比(PSNR)は、著しく増大する。例えば、EL3のビットレートは、基本階層のビットレートの約6倍であり、EL7のビットレートは、基本階層のビットレートの18倍を超える。言い換えれば、低ビットレートストリームのレートと高ビットレートストリームのレートとの間には、著しい差がある。
【0026】
小さな帯域幅が要求されるので、前方誤り訂正(FEC)またはその他の既知の誤り防止方式を用いて基本階層211および低ビットレート拡張階層212を保護することが妥当である。高ビットレート拡張階層213を保護するには、より多くのオーバーヘッドビットが必要である。しかし、上述のように、ネットワークは、瞬間的な輻輳に遭遇することが多い。帯域幅が限られている場合には、これによって高ビットレート拡張階層が切り捨てられ、復号ビデオの品質がかなり低下する。そのような場合には、従来技術の方式は、高ビットレート拡張階層213を保護するのに効果的ではない。
【0027】
複数の経路
輻輳したネットワークにおいては、帯域幅が大きい単一の経路を見つけることよりも、帯域幅がより低い経路をいくつか見つけることのほうが容易であろう。したがって、我々は、ストリームを複製し、複数の経路105を通じて、この複数のストリーム221〜222、231を送信する(240)。本発明による複数の経路という解決策を用いることによっても、パケットが損失する可能性が低減する。
【0028】
それぞれの経路について、元のビデオのコンテンツを簡単に複製することができる。これによって、ビデオ送信のロバスト性が改善される。1つの経路において損失したパケットを、その他の経路から回復することができるからである。しかし、それぞれの経路の帯域幅が不十分な場合には、低品質のビデオしか再構築できない。別の簡単な解決策では、ビデオストリームを重なりのないストリームに分割して、それぞれのストリームについて互いに異なる経路を用いてもよい。これにより、送信ビットレートが改善される。しかし、いずれかの経路においてパケットが損失すると、それに対応する損失した情報を再構築することはできない。
【0029】
したがって我々は、ネットワークの複数の経路105を通じてMPEG−4のFGSビデオストリームを送信する方法200を提供する。
【0030】
基本階層および低ビットレート拡張階層の複製
入力ビデオ201の基本階層211および低ビットレート拡張階層212は、FGSおよび従来の前方誤り訂正(FEC)方式を用いて符号化される(210)。ビデオのこのようなビットストリームは、利用できるあらゆる経路について、複数のストリーム221〜222に複製される(220)。このようにして、基本階層および低ビットレート拡張階層が保護される。
【0031】
高ビットレート拡張階層の分割
高ビットレート拡張階層213は、複数の部分低ビットレートビットストリーム231に分割される(230)。複数の部分低ビットレートビットストリームは、それぞれ、複数の記述205のうちの互いに異なる1つを用いて変換されて、このような複数の経路を利用する。それぞれの経路は、元の高ビットレート拡張階層213の複数のビットストリームの記述のうちの1つを保持している。このようにして、分割された低ビットレート拡張階層231は、それぞれ、入力高ビットレート拡張階層213と比較すると、有するビットレートが低い。したがって、分割されたビットストリーム231のそれぞれを、より低ビットレートの経路を通じて送信する(240)ことが可能である。
【0032】
高ビットレートFGS拡張階層213を分割すると、誤りが低減する。1つのパケット内の情報が損失した場合には、別の経路から同様の情報を回復して、復号ビデオの品質を改善することができる。
【0033】
ビット配分
高ビットレート拡張階層213を分割するには、利用できる帯域幅内の互いに異なる記述を用いて、高ビットレート階層の「1」のビットを配分する。簡単な方法では、複数の部分拡張階層231の間でこの「1」のビットを均等に配分する。
【0034】
例えば、2つの経路が利用でき、入力ブロックが
000011000101・・・110
という64個のビットを含む場合には、以下のように「1」のビットが2つの記述に均等に配分される。
記述1:000010000100・・・100
記述2:000001000001・・・010
【0035】
または、「1」のビットは、入力ブロックにおける「1」のビットの位置と、それに対応する、ビデオの知覚される視覚品質にとっての「1」のビットの重要性とに従って、配分される。例えば、ブロック内の左上の隅からの係数は、輝度変化を著しく反映する。したがって、これに対応する「1」のビットは、部分階層のすべてにおいて複製され、残りの「1」のビットは、部分階層の間で均等に割り当てられる。
【0036】
一般的に、2つの経路が利用できる場合には、入力拡張階層における「1」のビットは、第1の部分階層に割り当ててもよく、第2の部分階層に割り当ててもよく、両方の部分階層に割り当ててもよく、どちらの部分階層にも割り当てなくてもよい、すなわち、可能性のある選択肢は4つある。これにより、それぞれの記述について、異なるレートおよび歪がもたらされる。したがって、レート歪最適化によって、「1」のビットがどのように配分されるべきかを決定することができる。このような4つの選択肢でビットが配分される方法については、より詳細に以下に説明する。
【0037】
異なる経路は、異なる利用できる帯域幅および異なるパケット損失特性を有する可能性があるので、2つの可能性のある経路について、拡張階層の分割を以下のように行うことができる。
【0038】
トレリス探索
まず、利用できる帯域幅に従って、それぞれの画像ブロック301に適切な数のビットを配分する。次に、それぞれのブロック301について、4つの段階311〜314を有するトレリス探索方法300を適用して、2つの経路について「1」のビットの配分を決定する。
【0039】
ブロック301において「1」のビットに遭遇すると、新しい段階、すなわち、「10」311、「01」312、「11」313、および「00」314を用いて、「1」のビットを第1の部分階層に割り当てるか、第2の部分階層に割り当てるか、両方の階層に割り当てるか、いずれにも割り当てないかを決定する。それぞれの段階について、可能性のある前の段階からの入力ルートは4つある。
【0040】
コスト関数
それぞれのルートは、次式の対応するコスト関数を有する。
J(λ)=D(R,R,Ploss)+λ(R+R
ここで、RおよびRは、それぞれの部分階層において現在の段階までに生成されたビット数、Plossは、ネットワーク100の状態に関係するパラメータ、D(.)は、ビットレートおよびネットワーク状態に関連する2つの記述の全体的な歪、λは、基本階層ブロックの量子化パラメータに従って特定される経験的パラメータである。状態は、平均パケット損失率および損失バースト率を含んでもよい。
【0041】
次に、この「1」のビットが、コストJ(λ)を最低にするコスト関数に従って割り当てられる。それぞれの記述について、ビットバジェットを満たすまで、この過程を繰り返す。
【0042】
本発明によるFGSビデオのマルチパス転送で、PSNR利得は、入力ビデオの複雑度次第で、2.0から2.6dBの範囲になり得る。
【0043】
本発明を好ましい実施の形態の例として説明したが、本発明の精神および範囲内でさまざまな他の改造および変更を行ってもよいということが理解されなければならない。したがって、特許請求の範囲の目的は、本発明の真の精神および範囲内にある変形および変更をすべて包含することである。
【図面の簡単な説明】
【0044】
【図1】本発明を用いる通信システムのブロック図である。
【図2】本発明に従ってネットワークの複数の経路を通じてFGSのビデオストリームを送信する方法のフロー図である。
【図3】本発明が用いるトレリスの図である。

【特許請求の範囲】
【請求項1】
複数の経路を含むネットワークを通じてビデオを転送する方法であって、
細粒度スケーラビリティを用いて、基本階層、1つまたは複数の低ビットレート拡張階層、および1つまたは複数の高ビットレート拡張階層にビデオを符号化することと、
前記基本階層と前記低ビットレート階層とをそれぞれ複数の基本階層と複数の低ビットレート拡張階層とに複製することと、
前記高ビットレート階層を複数の部分低ビットレート階層に分割することと、
前記複数の基本階層、前記複数の低ビットレート拡張階層、および前記複数の部分低ビットレート階層のそれぞれを、前記ネットワークの異なる経路を通じて送信することと
を備える複数の経路を含むネットワークを通じてビデオを転送する方法。
【請求項2】
前記低ビットレートと前記高ビットレートとの差は、少なくとも2倍である請求項1に記載の方法。
【請求項3】
前記高ビットレート拡張階層は、それぞれ異なる記述を用いて符号化される請求項1に記載の方法。
【請求項4】
前記分割することは、前記高ビットレート拡張階層の「1」のビットを前記複数の部分低ビットレート拡張階層の間で均等に配分することをさらに含む請求項1に記載の方法。
【請求項5】
前記分割することは、前記高ビットレート拡張階層の「1」のビットを、前記高ビットレート拡張階層のブロックにおける前記「1」のビットの位置に従って前記複数の部分低ビットレート拡張階層の間で配分することをさらに含む請求項1に記載の方法。
【請求項6】
前記分割することは、前記高ビットレート拡張階層の「1」のビットを、前記ビデオの知覚される視覚品質に従って前記複数の部分低ビットレート拡張階層の間で配分すること
をさらに含む請求項1に記載の方法。
【請求項7】
前記分割することは、前記複数の部分低ビットレート拡張階層の間での前記「1」のビットの分割を決定するためにコスト関数を評価することをさらに含む請求項1に記載の方法。
【請求項8】
2つの部分低ビットレート拡張階層があり、特定の「1」のビットを、前記コスト関数の最小値によって、第1の部分低ビットレート拡張階層に割り当てること、第2の部分低ビットレート拡張階層に割り当てること、前記第1および第2の部分低ビットレート拡張階層の両方に割り当てること、またはどちらの部分低ビットレート拡張階層にも割り当てないことをさらに含む請求項7に記載の方法。
【請求項9】
前記コスト関数は
J(λ)=D(R,R,Ploss)+λ(R+R
であり、ここでRおよびRは、前記2つの部分低ビットレート拡張階層のそれぞれにおいて生成されたビット数、Plossは、前記ネットワークの状態に関係するパラメータ、D(.)は所与のビットレートおよび前記ネットワークの前記状態に関連する前記2つの部分低ビットレート拡張階層の全体的な歪、λは、前記基本階層のブロックの量子化パラメータに従って特定される経験的パラメータである請求項8に記載の方法。
【請求項10】
前記状態は、平均パケット損失率および損失バースト率を含む請求項9に記載の方法。
【請求項11】
複数の経路を含むネットワークを通じてビデオを転送するシステムであって、
細粒度スケーラビリティを用いて、基本階層、1つまたは複数の低ビットレート拡張階層、および1つまたは複数の高ビットレート拡張階層にビデオを符号化するよう構成されたエンコーダと、
前記基本階層と前記低ビットレート階層とをそれぞれ複数の基本階層と複数の低ビットレート拡張階層とに複製する手段と、
前記高ビットレート階層を複数の部分低ビットレート階層に分割する手段と、
前記複数の基本階層、前記複数の低ビットレート拡張階層、および前記複数の部分低ビットレート階層のそれぞれを、前記ネットワークの異なる経路を通じて送信するよう構成された送信機と
を備える複数の経路を含むネットワークを通じてビデオを転送するシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公表番号】特表2006−520554(P2006−520554A)
【公表日】平成18年9月7日(2006.9.7)
【国際特許分類】
【出願番号】特願2006−502675(P2006−502675)
【出願日】平成16年2月19日(2004.2.19)
【国際出願番号】PCT/JP2004/001930
【国際公開番号】WO2004/075561
【国際公開日】平成16年9月2日(2004.9.2)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】