説明

映像処理装置、映像処理システム、映像処理方法及び映像処理プログラム

【課題】多視点映像符号化データのリアルタイムストリーミング配信において安定した映像再生の実現と、再生開始時間の遅延を少なくすることができる映像処理装置を提供する。
【解決手段】全体映像データのうち指定された一部領域である映像再生領域の符号化データを復号化する映像処理装置であって、入力する符号化データを一時的に保存し、保存している前記符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している前記符号化データを出力するバッファ部と、前記バッファ部から入力する前記符号化データを復号化して出力部に出力する復号化部と、前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じて、前記プレロール時のバッファ量を設定するプレロール制御部と、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像処理装置、映像処理システム、映像処理方法及び映像処理プログラム
に関する。
【背景技術】
【0002】
従来、映像/音声符号化データのストリーミング配信の際には、安定した再生品質を保持するため、クライアント側である程度データをバッファリングしてから再生を開始している(例えば特許文献1参照)。
【0003】
図9は、本発明の背景技術を説明するために本願発明者が作成した映像/音声配信システムの一例を示すブロック図である。図9に示した映像/音声配信システム8は、送信側装置6と受信側装置7とから構成されている。送信側装置6は、映像/音声データ(すなわち映像又は映像及び音声データ)を所定形式の符号化データに符号化して出力する映像/音声符号化部61と、符号化データを一時蓄積して送信する送信バッファ部62とを備えている。受信側装置7は、符号化データを受信し、一時蓄積して出力する受信バッファ部71と、符号化データを復号する映像/音声復号化部72とを備えている。
【0004】
図9に示すような構成の映像/音声配信システム8では、映像/音声符号化データのリアルタイムストリーミング配信を行う場合、映像/音声符号化データのビットレートがほぼ一定のときには、ビットレートに合わせてある固定値で指定されるデータ量が受信バッファ部71に保存された状態になってから再生が開始される。こうすること(以下、データ量がある程度バッファに保存された状態になってから再生を開始することを「プレロール」と呼ぶ)で、リアルタイムストリーミング配信時でもネットワークの劣化(遅延ゆらぎなど)に対しても安定した再生品質を保持することができる。
【0005】
ここで、上記のようなプレロールを多視点映像符号化データに適用することを考える。多視点映像とは、複数の視点から見た各視点の映像を含んで構成される複合的な映像を意味する。多視点映像には、立体映像、自由視点映像、パノラマ映像などがある。立体映像は、左右の目の視差を利用して幅、高さに加え、奥行きを表現する映像であり、左右の視線に対応した複数の映像を含んで構成される。自由視点映像は、視聴者が視点位置や視点方向を自由に変えられるようにした映像であり、複数の視点や方向に対応した複数の映像を含んで構成される。パノラマ映像は、通常よりも広角な映像であり、広角な映像の一部の領域に対応する複数の映像を含んで構成される。本願では、この「多視点映像」に含まれる各視点の映像を「視点映像」と呼ぶこととする。
【0006】
また、多視点映像符号化データは、複数の視点の映像を含む多視点映像を符号化した映像データであり、符号化方式は例えばITU−T(国際電気通信連合−電気通信標準化部門)とISO/IEC(国際標準化機構/国際電気標準会議)による国際標準H.264/AVC Annex Hで規定されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2007−28241号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
多視点映像符号化データの配信システムでは、再生開始時点の複数の視点にわたる再生領域をあらかじめサーバ側で設定したり、変更したりできるようにしたものがある。また、多視点映像符号化データの配信においては、再生される視点の数に応じてリアルタイムストリーミング配信されるビットレートが変化する。したがって、プレロールを多視点映像符号化データに適用する場合、再生開始時初期の再生領域をカバーする視点の数に応じてリアルタイムストリーミング配信されるビットレートが異なることになる。そのため多視点映像符号化データの配信システムでは、以下の問題が生じることがある。
【0009】
例えば、再生開始時の初期の視点でトータルのビットレートが、固定したプレロールの閾値よりも高い場合、十分にバッファリングが行われる前に再生が開始されてしまうため、以後の再生品質の安定性が低下するという問題点がある。これとは逆に、再生開始時の初期の視点でトータルのビットレートが、固定したプレロールの閾値よりも低い場合、プレロールの閾値にバッファリングが達するまでに時間が多くかかり、再生開始が遅れるという問題点がある。
【0010】
本発明は、上記の事情を考慮してなされたものであり、多視点映像符号化データのリアルタイムストリーミング配信に際して、安定した映像再生の実現と再生開始時間の遅延を少なくすることとを両立させることができる映像処理装置、映像処理システム、映像処理方法及び映像処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
この発明は上述した課題を解決するためになされたもので、本発明の一態様による映像処理装置は、全体映像データのうち指定された一部領域である映像再生領域の符号化データを復号化する映像処理装置であって、入力する符号化データを一時的に保存し、保存している前記符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している前記符号化データを出力するバッファ部と、前記バッファ部から入力する前記符号化データを復号化して出力部に出力する復号化部と、前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じて、前記プレロール時のバッファ量を設定するプレロール制御部と、を備える。
【0012】
本発明の一態様は、上述の映像処理装置であって、前記プレロール制御部は、前記全体映像データの映像内における前記映像再生領域の位置関係を示す情報を入力し、当該情報に基づき前記映像再生領域に対応する前記視点映像のデータ容量を算出し、算出した前記視点映像のデータ容量に応じて前記プレロール時のバッファ量を設定する。
【0013】
本発明の一態様は、上述の映像処理装置であって、前記プレロール制御部は、前記入力する符号化データのデータ容量の目標値にあわせて、データ容量が異なる前記視点映像を組み合わせた前記映像再生領域に対応する前記視点映像のデータ容量を算出し、算出した前記視点映像のデータ容量に応じて前記プレロール時のバッファ量を設定する。
【0014】
本発明の一態様による映像処理システムは、全体映像データのうち指定された一部領域である映像再生領域の符号化データを送信する送信側映像処理装置と、前記符号化データを受信し、復号化する受信側映像処理装置とを備え、前記受信側処理装置は、前記送信側映像処理装置から受信する前記符号化データを一時的に保存し、保存している前記符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している前記符号化データを出力するバッファ部と、前記バッファ部から入力する前記符号化データを復号化して出力部に出力する復号化部と、前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じて、前記プレロール時のバッファ量を設定するプレロール制御部と、を備える。
【0015】
本発明の一態様による映像処理方法は、全体映像データのうち指定された一部領域である映像再生領域の符号化データを復号化する映像処理方法であって、前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じてプレロール時のバッファ量を設定するステップと、入力する符号化データを一時的に記憶領域に保存するステップと、保存している前記符号化データのデータ容量が設定された前記プレロール時のバッファ量に到達した場合、保存している前記符号化データを前記記憶領域から出力するステップと、前記出力する前記符号化データを入力し、復号化するステップと、を備える。
【0016】
本発明の一態様による映像処理プログラムは、全体映像データのうち指定された一部領域である映像再生領域の符号化データを復号化するコンピュータを、入力する符号化データを一時的に保存し、保存している前記符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している前記符号化データを出力するバッファ手段、前記バッファ部から入力する前記符号化データを復号化して出力部に出力する復号化手段、前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じて、前記プレロール時のバッファ量を設定するプレロール制御手段、として機能させるためのプログラムである。
【発明の効果】
【0017】
本発明によれば、プレロール制御部によって、全体映像データを構成する複数の視点映像のうち、映像再生領域を含む視点映像のビットレートに応じて、プレロール時のバッファ量が設定される。すなわち、バッファリングされるデータ量を、映像再生領域の再生に要する実際のビットレートに応じて制御することが可能となる。よって、プレロールのためにバッファリングされるデータ量に過不足を生じさせず、適切に設定し、安定した映像再生の実現と、再生開始時間の遅延を少なくすることとの両立が可能となる。
【図面の簡単な説明】
【0018】
【図1】本発明の一実施形態としての多視点映像配信システムの構成例を示すブロック図である。
【図2】図1の多視点映像配信システム100で配信される多視点映像4の一例を説明するための模式図である。
【図3】図1の送信バッファ部12に蓄積される符号化データの格納例を説明するための模式図である。
【図4】図1の多視点映像配信システム100で用いられる再生設定ファイルの一例を説明するための模式図である。
【図5】図2に示した多視点映像4と図3に示した再生設定ファイル5内のパラメータとの対応を説明するための模式図である。
【図6】図1の多視点映像配信システム100の動作例を説明するためのフローチャートである。
【図7】図1の多視点映像配信システム100で用いられる再生設定ファイルの他の例を説明するための模式図である。
【図8】図1の多視点映像配信システム100の他の動作例を説明するためのフローチャートである。
【図9】本発明の背景技術としての多視点映像配信システムの構成例を示すブロック図である。
【発明を実施するための形態】
【0019】
以下、図面を参照して本発明の一実施の形態について説明する。図1は、本発明の一実施の形態を説明するための多視点映像配信システムを示すブロック図である。図1に示した多視点映像配信システム100は、送信側装置1と、受信側装置2と、通信網3とから構成されている。この場合、送信側装置1は、コンピュータと、その周辺装置とを有して構成されていて、多視点映像符号化データを配信するサーバとして動作する。受信側装置2は、コンピュータと、その周辺装置とを有して構成されていて、多視点映像符号化データを受信するクライアントとして動作する。通信網3は、有線や無線の通信回線、中継装置などから構成されていて、送信側装置1と受信側装置2との間を接続する。
【0020】
本実施形態の多視点映像配信システム100では、図2に示すような多視点映像4を表す符号化データが、送信側装置1から受信側装置2へと配信される。図2は、本実施形態において配信対象とする多視点映像4の一例を模式的に示した図である。本実施形態において、多視点映像4は、例えばパノラマ映像であって、この多視点映像4を複数の領域に分割した各映像を、以下、視点映像41−iと呼称する。
図2に示した多視点映像4は、複数の視点映像41−1〜41−40から形成されている。本実施形態では、多視点映像4をマトリクス状に分割することにより、多視点映像4を複数の視点映像41−1〜41−40に分割する。この多視点映像4が矩形の形状を有し、また、視点映像41−1〜40−40がすべて同一の矩形の形状を有している。この場合、多視点映像4は、横に8個で、縦に5個で合計40個の視点映像41−1〜41−40から形成されている。また、視点映像41−1〜40−40には、識別情報としてのID(識別符号)=1〜40が左上からラスタキャンで順に割り当てられている。なお、以下では、視点映像41−1〜41−40について位置を特定せずに1又は複数の視点映像を参照する場合には視点映像41と表記することとする。
【0021】
本実施形態において多視点映像4は、例えば1つのパノラマ映像であり、視点映像41−1〜41−40がそのパノラマ映像を40分割した各領域の映像である。ただし、多視点映像4は、パノラマ映像に限らず、立体映像や自由視点映像であってもよい。
【0022】
また、本実施形態では、受信側装置2において、多視点映像4の再生開始時点に、破線で示した一部の領域42(以下、再生開始時映像再生領域42と呼ぶ)に対応する映像が再生される。再生開始時映像再生領域42は、例えば送信側装置1において多視点映像4に対応させてあらかじめ設定されている。すなわち、再生開始時映像再生領域42の設定情報が送信側装置1において多視点映像4に対応させて図示していない所定の記憶装置に記憶されている。
【0023】
また、本実施形態では、送信側装置1から受信側装置2へ向けて多視点映像4の符号化データが配信される際に、配信に先立って受信側装置2から送信側装置1に対してどの視点映像41を送信するのかが要求される。すなわち、送信側装置1は、受信側装置2から要求された1又は複数の視点映像41に対応する符号化データを送信する。また、上述したように本実施形態では再生開始時に再生開始時映像再生領域42に対応する映像が受信側装置2において再生される。したがって、受信側装置2から送信側装置1に対しては再生開始時映像再生領域42を含む1又は複数の視点映像41(図2の例では視点映像41−1〜41−3、41−9〜41−11及び41−17〜41−19の9個)の送信要求が通知される。
【0024】
なお、本実施形態において送信側装置1から受信側装置2へ配信される多視点映像4の符号化データは、例えばITU−T H.264/AVC Annex Hに準じて符号化することができる。このITU−T H.264/AVC Annex Hでは、各視点映像41を独立して符号化する場合と、隣り合う複数の視点映像41間の差異に応じて予測処理を行って符号化する場合とが規定されている。本実施形態では、説明を簡単にするため、各視点映像41は独立して符号化されていることとする。
【0025】
図1に戻って、送信側装置1は、映像/音声符号化部11、送信バッファ部12、多視点映像制御部13及び再生設定ファイル送信部14を備えている。これらの映像/音声符号化部11、送信バッファ部12、多視点映像制御部13及び再生設定ファイル送信部14の各ブロックは、送信側装置1内部のコンピュータや周辺装置と、それらを制御するプログラムとを用いて実現される機能ブロックを表している。
【0026】
受信側装置2は、受信バッファ部21、映像/音声復号化部22、多視点映像要求部23、再生設定ファイル受信部24、プレロール制御部25及び映像/音声出力部26を備えている。これらの受信バッファ部21、映像/音声復号化部22、多視点映像要求部23、再生設定ファイル受信部24、プレロール制御部25及び映像/音声出力部26の各ブロックは、受信側装置2内部のコンピュータや周辺装置と、それらを制御するプログラムとを用いて実現される機能ブロックを表している。
【0027】
映像/音声符号化部11は、多視点映像4を表すデータと多視点映像4に対応した音声を表すデータとを所定の記憶装置や記憶媒体又は所定の外部の装置から入力し、ITU−T H.264/AVC Annex Hに準拠して符号化処理を行う。この映像/音声符号化部11から出力された符号化データは、送信バッファ部12に入力される。
【0028】
送信バッファ部12は、映像/音声符号化部11から出力された符号化データを視点映像41毎や符号化ビットレート毎に選択可能に所定時間分(あるいは所定データ量分)記憶し、多視点映像制御部13からの所定の通知に応じて1又は複数の視点映像41に対応する符号化データを選択して受信側装置2へ向けて送信する。図3は、図2を参照して説明した多視点映像4を送信バッファ部12に記憶する場合の符号化データの格納形態の一例を説明するための模式図である。図3(A)は、すべての視点映像41を同一の符号化ビットレートで符号化した場合の符号化データの格納単位の一例を示している。図3(B)は、各視点映像41をそれぞれ3種類の符号化ビットレートで符号化した場合の符号化データの格納単位の一例を示している。
【0029】
図3(A)の格納単位50は、付加情報51と、符号化データ52−1〜52−40とを含んでいる。符号化データ52−1〜52−40は、視点映像41−1〜41−40の同一時刻における各ピクチャに対応する符号化データである。また、付加情報51は、当該ピクチャのタイミング情報や各符号化データ52−1〜52−40にランダムアクセスする場合に用いられる位置情報などを含んでいる。また、この場合、符号化データ52−1〜52−40には、視点映像41−1〜41−40に割り当てられているものと同一のIDが割り当てられている。
【0030】
図3(B)の格納単位53は、付加情報54と、符号化データ55−1〜55−40とを含んでいる。符号化データ55−1−1〜55−40−1は、視点映像41−1〜41−40の同一時刻における各ピクチャに対応する、ある符号化ビットレートで符号化された符号化データである。符号化データ55−1−2〜55−40−2は、視点映像41−1〜41−40の同一時刻における各ピクチャに対応する、他の符号化ビットレートによる符号化データである。符号化データ55−1−3〜55−40−3は、視点映像41−1〜41−40の同一時刻における各ピクチャに対応する、さらに他の符号化ビットレートによる符号化データである。また、付加情報54は、当該ピクチャのタイミング情報や各符号化データにランダムアクセスする場合の位置情報などを含んでいる。また、この場合、符号化データ55−1−1〜55−40−3には、視点映像41−1〜41−40に割り当てられているものと同一のIDに、符号化ビットレートの階層を表す符号「−1」、「−2」及び「−3」を添えたIDが割り当てられている。
【0031】
送信バッファ部12は、映像/音声符号化部11から出力された符号化データを、図3に示すような格納単位50や格納単位53を単位として複数ピクチャ分記憶する。
【0032】
多視点映像制御部13は、受信側装置2内の多視点映像要求部23から多視点映像4の配信要求を受け取り、送信バッファ部12に対して出力すべき1又は複数の視点映像41(及びその符号化ビットレート)を示す情報を通知する。本実施形態では、符号化ビットレートが1種類の場合は、多視点映像要求部23から通知される配信要求が、図2に示した各視点映像41に割り当てられているID=1〜40のうちの1又は複数を含むものとなる。また、例えば、符号化ビットレートが3種類の場合は、多視点映像要求部23から通知される配信要求が、図2に示した各視点映像41に割り当てられているID=1〜40のうちの1又は複数を含むとともに、図3に示した符号化データ55−1−1〜55−40−3のID=1−1〜40−3のうちの1又は複数を示すものとなる。
【0033】
再生設定ファイル送信部14は、多視点映像4に対応してあらかじめ所定の記憶装置に記憶されている情報を参照し、受信側装置2に対して配信される多視点映像4の仕様と再生開始時映像再生領域42の設定値などを表す複数のパラメータ(つまり複数の所定の値)を含んだ再生設定ファイルを作成して、受信側装置2の再生設定ファイル受信部24へ向けて送信する。
【0034】
図4は、再生設定ファイル送信部14で作成される再生設定ファイルの一例を示している。図4に示した再生設定ファイル5には、多視点映像4の仕様を表すパラメータである「HeightSize」、「WidthSize」、「HeightView」、「WidthView」及び「ViewZ(ただし、図4の例ではZが1から40までの整数)」と、再生開始時映像再生領域42の設定値を表すパラメータである「ROIX」、「ROIY」、「ROIXsize」及び「ROIYsize」とが含まれている。
【0035】
ここで、「HeightSize」及び「WidthSize」は多視点映像4の大きさを表すパラメータである。「HeightView」及び「WidthView」は多視点映像4における視点映像41の縦及び横の数を表すパラメータである。また、「ROIX」、「ROIY」、「ROIXsize」及び「ROIYsize」は再生開始時映像再生領域42の位置及び大きさを表すパラメータである。そして、「ViewZ」がID=Zの各視点映像41−Zの符号化ビットレートを表すパラメータである。
【0036】
さらに、図5を参照して、図4に示した再生設定ファイル5に含まれる各パラメータの詳細について説明する。図5は、上記で多視点映像4を説明する際に用いた図2の模式図に、再生設定ファイル5に含まれる各パラメータを説明するための記述を追加した模式図である。
【0037】
「HeightSize」は、多視点映像4の縦幅を画素数を単位として表すパラメータである。「WidthSize」は、多視点映像4の横幅を画素数を単位として表すパラメータである。「HeightView」(不図示)は、多視点映像4の縦の視点映像41の数を表すパラメータである。「WidthView」(不図示)は、多視点映像4の横の視点映像41の数を表すパラメータである。
【0038】
「ViewZ(Z=1〜40)」は、多視点映像4を構成する各視点映像41の符号化ビットレートを表すパラメータである。図4及び図5に示す例では、View1、View2、…、View40が、ID=1の視点映像41の符号化ビットレート、ID=2の視点映像41の符号化ビットレート、…、ID=40の視点映像41の符号化ビットレートをそれぞれ表している。
【0039】
また、「ROIX」は、再生開始時映像再生領域42の左上の画素43のx座標を表すパラメータである。「ROIY」は、再生開始時映像再生領域42の左上の画素43のy座標を表すパラメータである。ここで、画素43のx座標とy座標は、多視点映像4の左上の画素44の座標を(1,1)とした場合の座標である。
【0040】
「ROIXsize」は、再生開始時映像再生領域42の横方向(x方向)のサイズを画素数を単位として表すパラメータである。「ROIYsize」は、再生開始時映像再生領域42の縦方向(y方向)のサイズを画素数を単位として表すパラメータである。
【0041】
なお、図4に示した再生設定ファイル5に含まれている各パラメータの数値の意味は以下の通りである。
【0042】
「HeightSize=2500」は、多視点映像4の縦幅が2500(pixel)であることを示している。「WidthSize=4000」は、多視点映像4の横幅が4000(pixel)であることを示している。「HeightView=5」は、多視点映像4の縦の視点映像41の数が5個であることを示している。「WidthView=8」は、多視点映像4の横の視点映像41の数が8個であることを示している。「ROIX=300」は、再生開始時映像再生領域42の左上の画素43のx座標が300であることを示している。「ROIY=300」は、再生開始時映像再生領域42の左上の画素43のy座標が300であることを示している。
【0043】
「ROIXsize=1000」は、再生開始時映像再生領域42の横方向(x方向)のサイズが1000(pixel)であることを示している。「ROIYsize=1000」は、再生開始時映像再生領域42の縦方向(y方向)のサイズが1000(pixel)であることを示している。「ViewZ(ただしZ=1〜40)=1000kbps」は、多視点映像4を構成するID=1〜40の各視点映像41−1〜41−40の符号化ビットレートが1000kbpsであることを示している。
つまり、再生設定ファイルに含まれる情報は、多視点映像4内における再生開始時映像再生領域42の位置関係を示す。
【0044】
一方、図1に示した受信側装置2における受信バッファ部21は、例えばマイクロコンピュータなどからなる信号処理装置と記憶装置とを有して構成されていて、送信バッファ部12から送信された符号化データを受信し、受信した符号化データを一時的に記憶してバッファリングするとともに、順次読み出して映像/音声復号化部22へ出力する。すなわち、受信バッファ部21は、受信した符号化データを一時的に保存し、保存している符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している符号化データを出力する。この受信バッファ部21におけるバッファリングの記憶量であるバッファ量(つまりプレロール時のバッファ量)は、プレロール制御部25から通知されるプレロール時のバッファ量の指示値に応じて、可変して設定される。すなわち、受信バッファ部21は、受信した多視点映像符号化データを所定のバッファ量分一時記憶して出力するものであって、バッファ量が変更可能なものである。
【0045】
本実施形態においてプレロール時のバッファ量は、再生開始時にあらかじめ設定されているプレロール時間分確保される。ここで、本実施形態では、受信側装置2において、多視点映像4の再生開始時点に再生開始時映像再生領域42に対応する映像が再生される。したがって、プレロール時のバッファ量は、再生開始時映像再生領域42を含む1又は複数の視点映像41−iに対応する各符号化データをプレロール時間分記憶するのに必要な量だけ確保される。より具体的には、再生開始時映像再生領域42を含む1又は複数の視点映像41−iに対応する各符号化データの符号化ビットレート(すなわち単位時間あたりのデータ伝送量)にプレロール時間を乗じた分のバッファ量(プレロール時のバッファ量)が確保される。また、受信バッファ部21は、プレロール時のバッファ量の設定が完了した場合(つまりプレロールのためにバッファされる最大の容量を指示されたプレロール時のバッファ量に設定する処理が完了した場合)にその旨を多視点映像要求部23に対して通知する。
【0046】
例えば、プレロール制御部25が受信バッファ部21に対してプレロール時間=0.5秒と設定した場合の一例について具体的に説明する。再生開始時映像再生領域42を含む視点映像41−iに対応する各符号化データの符号化ビットレートが3Mbpsである場合、受信バッファ部21は、自身の記憶領域に格納する符号化データのバッファ量が1.5Mbitsに到達したら、格納する符号化データを出力する。また、再生開始時映像再生領域42を含む視点映像41−iに対応する各符号化データの符号化ビットレートが10Mbpsである場合、受信バッファ部21は、自身の記憶領域に格納する符号化データのバッファ量が5Mbitsに到達したら、格納する符号化データを出力する。つまり、受信バッファ部21は、受信側装置2が受信する符号化データの符号化ビットレートに応じて、プレロール時間に対応するプレロール時のバッファ量が設定される。
本実施形態では、プレロール時のバッファ量は、受信側装置2が受信する符号化データの符号化ビットレートにプレロール時間を乗算した値をプレロール制御部25が算出して受信バッファ部21に設定される。
【0047】
一方、映像/音声復号化部22は、受信バッファ部21から入力した符号化データを復号し、映像/音声出力部26に出力する。
【0048】
映像/音声出力部26は、内蔵あるいは外部の図示していない所定の映像表示装置や音声出力装置に対して映像信号と音声信号を出力する。
【0049】
多視点映像要求部23は、再生設定ファイル受信部24から通知された多視点映像4の所定の仕様、再生開始時映像再生領域42の設定値などを表す所定のパラメータに基づいて、再生開始時映像再生領域42を含んでいる1又は複数の視点映像41を決定し、決定した1又は複数の視点映像41を表す情報を初期要求ビューとしてプレロール制御部25へ通知する。具体的には、本実施形態では、多視点映像要求部23が決定した、再生開始時映像再生領域42を含む1又は複数の視点映像41の各IDの集合が、初期要求ビューとなる。例えば、図4に示す例では、初期要求ビューは、{1,2,3,9,10,11,17,18,19}となる。さらに、多視点映像要求部23は、受信バッファ部21からプレロール時のバッファ量の設定が完了した旨の通知を受けた後、多視点映像4の配信を要求する信号を多視点映像制御部13に対して送信する。
【0050】
再生設定ファイル受信部24は、再生設定ファイル送信部14から再生設定ファイル5を受信し、再生設定ファイル5に含まれる多視点映像4の所定の仕様と再生開始時映像再生領域42の設定値などを表す所定のパラメータを多視点映像要求部23とプレロール制御部25とに対して通知する。
【0051】
プレロール制御部25は、再生設定ファイル受信部24から通知された再生設定ファイル5に含まれる多視点映像4の仕様を表す所定のパラメータと、多視点映像要求部23から通知された初期要求ビューを表す情報とに基づいて、受信バッファ部21において設定すべきプレロール時のバッファ量を算出する。また、プレロール制御部25は、算出したプレロール時のバッファ量を表す情報を、受信バッファ部21に対して通知する。より具体的には、本実施形態において、プレロール制御部25は、再生開始時映像再生領域42を含む視点の映像である各視点映像41の符号化ビットレートの合計値に応じて、プレロール時間に対応するプレロール時のバッファ量を受信バッファ部21に設定する。
【0052】
なお、プレロール制御部25は、各視点映像41の符号化ビットレートが視点映像41毎に複数選択可能な場合(すなわち図3(B)を参照して説明したようにマルチビットレートとなっている場合)には、所定の目標ビットレートとの比較において、各視点映像41の異なる符号化ビットレートを順次選択しながら再生開始時映像再生領域42を含む各視点映像41の符号化ビットレートの合計値を算出した結果に応じて、受信バッファ部21のプレロール時のバッファ量を設定する機能も有している。なお、目標ビットレートとは、送信側装置1から受信側装置2に伝送するデータのビットレートの上限値であって、受信側装置2から送信側装置1に要求するデータの総ビットレートの目標値である。
【0053】
次に、図6を参照して、図1に示した多視点映像配信システム100の動作について説明する。図6は、多視点映像配信システム100における処理の流れの一例を示したフローチャートである。また、配信対象となる多視点映像4、再生開始時映像再生領域42及び再生設定ファイル5の仕様や設定、内容は、図2〜図5を参照して説明した例を用いることとする。
【0054】
図6は、映像再生開始にあたっての処理フローの一例を示している。まず、送信側の再生設定ファイル送信部14から受信側の再生設定ファイル受信部24に対して再生設定ファイル5が送信される(ステップS101)。この場合、再生設定ファイル5には、図4を参照して説明したように、多視点映像4の大きさを表すパラメータ「HeightSize」及び「WidthSize」、多視点映像4における視点映像41の縦及び横の数を表すパラメータ「HeightView」及び「WidthView」、再生開始時映像再生領域42の位置及び大きさを表すパラメータ「ROIX」、「ROIY」、「ROIXsize」及び「ROIYsize」と、ID=Zの各視点映像41−Zの符号化ビットレートを表すパラメータである「ViewZ」とが含まれている。
【0055】
ステップS101で再生設定ファイル送信部14から送信された再生設定ファイル5は、再生設定ファイル受信部24で受信され、再生設定ファイル受信部24が、再生設定ファイル5の内の次の値を多視点映像要求部23に通知する(ステップS102)。
【0056】
すなわちステップS102で再生設定ファイル受信部24によって多視点映像要求部23に通知される値は、多視点映像4の縦幅HeightSize、同横幅WidthSize、多視点映像4の縦の視点映像41の数HeightView、同横の視点映像41の数WidthView、再生開始時映像再生領域42の左上の画素43のx座標ROIX、同y座標ROIY、同x方向のサイズROIXsize及び同y方向のサイズROIYsizeである。
【0057】
多視点映像要求部23は、通知された値に基づいて、初期要求ビューを算出する(ステップS103)。初期要求ビューは、上述したように、再生開始時映像再生領域42を含む1又は複数の視点映像41−iの各IDの集合である。多視点映像要求部23による初期要求ビューの算出は、例えば次のようにして行うことができる。
【0058】
まず、多視点映像要求部23は、図5に示した1つの視点映像41の横サイズViewWidthSizeと、縦サイズViewHeightSizeとを下式にてそれぞれ算出する。
【0059】
ViewWidthSize=WidthSize/WidthView
【0060】
図4に示した値を用いると、ViewWidthSize=WidthSize/WidthView=4000/8=500となる。
【0061】
ViewHeightSize=HeightSize/HeightView
【0062】
図4に示した値を用いると、ViewHeightSize=HeightSize/HeightView=2500/5=500となる。
【0063】
次に、多視点映像要求部23は、再生開始時映像再生領域42の左上の画素43がどの視点映像41に含まれるかを次のようにして算出する。まず、画素43を含む視点映像41の横方向(x方向)の位置M1を下式にて確定する。なお、下式において関数INTは、括弧内の変数の小数点以下を切り捨てて整数化する関数である。ここで、位置M1は、左端を0、その右隣を1として1ずつ増加する値をとり、例えば図5に示した例では、ID=1の視点映像41の位置M1が0、ID=2の視点映像41の位置M1が1、…、ID=8の視点映像41の位置M1が7、ID=9の視点映像41の位置M1が0、…、ID=40の視点映像41の位置M1が7となる。
【0064】
M1=INT(ROIX/ViewWidthSize)
【0065】
図4に示した値を用いると、M1=INT(ROIX/ViewWidthSize)=INT(300/500)=0となる。
【0066】
さらに、多視点映像要求部23は、縦方向の位置N1を下式にて確定する。位置N1は、一番上を0、その下を1として1ずつ増加する値をとり、例えば図5に示した例では、ID=1〜8の各視点映像41の位置N1が0、ID=9〜16の各視点映像41の位置N1が1、…、ID=33〜40の各視点映像41の位置N1が4となる。
【0067】
N1=INT(ROIY/ViewHeightSize)
【0068】
図4に示した値を用いると、N1=INT(ROIY/ViewHeightSize)=INT(300/500)=0となる。
【0069】
次に、多視点映像要求部23は、以下の式にて、再生開始時映像再生領域42の左上端の視点映像41のIDとなるZ1を確定する。
【0070】
Z1=M1+N1*WidthView+1
【0071】
図4に示した値を用いると、Z1=M1+N1*WidthView+1=0+0*8+1=1となる。
【0072】
続いて、多視点映像要求部23は、再生開始時映像再生領域42の右上端の視点映像41のIDとなるZ2を以下の手順で確定する。
【0073】
まず、多視点映像要求部23は、右上端の視点映像41の横方向の位置M2を下式にて確定する。この場合、位置M2は、位置M1と同様に、左端を0、その右隣を1として1ずつ増加する値をとり、例えば、ID=1の視点映像41の位置M2が0、ID=2の視点映像41の位置M2が1、…、ID=8の視点映像41の位置M2が7、ID=9の視点映像41の位置M2が0、…、ID=40の視点映像41の位置M2が7となる。
【0074】
M2=INT((ROIX+ROIXsize)/ViewWidthSize)
【0075】
図4に示した値を用いると、M2=INT((ROIX+ROIXsize)/ViewWidthSize)=INT((300+1000/500)=2となる。
【0076】
さらに、多視点映像要求部23は、右上端の視点映像41の縦方向の位置N2を確定する。位置N2は、位置N1と同様に、一番上を0、その下を1として1ずつ増加する値をとり、例えば、ID=1〜8の各視点映像41の位置N2が0、ID=9〜16の各視点映像41の位置N2が1、…、ID=33〜40の各視点映像41の位置N2が4となる。
【0077】
N2=INT(ROIY/ViewHeightSize)
【0078】
図4に示した値を用いると、N2=INT(ROIY/ViewHeightSize)=INT(300/500)=0となる。
【0079】
そして、多視点映像要求部23は、以下の式にて、再生開始時映像再生領域42の右上端の視点映像41のIDとなるZ2を確定する。
【0080】
Z2=M2+N2*WidthView+1
【0081】
図4に示した値を用いると、Z2=M2+N2*WidthView+1=2+0*8+1=3となる。
【0082】
ここで多視点映像要求部23は、再生開始時映像再生領域42を含む複数の視点映像41−iの横の個数Aを以下の式で算出する。
【0083】
A=Z2−Z1+1
【0084】
図4に示した値を用いると、Z1=1及びZ2=3から、A=Z2−Z1+1=3−1+1=3となる。
【0085】
さらに、多視点映像要求部23は、再生開始時映像再生領域42を含む複数の視点映像41−iの縦の個数Bを求める。
【0086】
B=INT(ROIYsize/ViewHeightSize)+1
【0087】
図4に示した値を用いると、B=INT(ROIYsize/ViewHeightSize)+1=INT(1000/500)+1=3となる。
【0088】
次に、多視点映像要求部23は、再生開始時映像再生領域42を含む複数の視点映像41−iを表す情報として下式の条件を満たすIDの集合Pを算出する。下式において変数cが視点映像41−iのID(i)を表す変数であり、集合Pが初期要求ビューとなる。
【0089】
P={c|cは以下を満たす整数。Z1+WidthView*k≦c≦Z2+WidthView*k(ただしkは0から(B−1)までの整数)}
【0090】
図4に示した値を用いると、Z1=1、Z2=3及びB=3から、変数kの範囲が0から(B−1)=3−1=2までとなる。
したがって、この例での集合Pは、
P={c|cは以下を満たす整数。
Z1+WidthView*0≦c≦Z2+WidthView*0、
Z1+WidthView*1≦c≦Z2+WidthView*1、
Z1+WidthView*2≦c≦Z2+WidthView*2}
={c|cは以下を満たす整数。
1+8*0≦c≦3+8*0、
1+8*1≦c≦3+8*1、
1+8*2≦c≦3+8*2}
={c|cは以下を満たす整数。
1≦c≦3、9≦c≦11、17≦c≦19}
={1,2,3,9,10,11,17,18,19}となる。
【0091】
多視点映像要求部23は、以上の手順で初期要求ビュー(すなわち上記の集合P)を算出すると(ステップS103)、算出した初期要求ビューをプレロール制御部25に通知する(ステップS104)。
【0092】
上記初期要求ビューである集合Pを受け取ったプレロール制御部25は、集合Pに含まれる各視点映像41の符号化ビットレートの合計値X(kbps)を、再生設定ファイル5に含まれている各視点映像41の符号化ビットレートViewZ(図4の例では、Z=1〜40までが記載されている)に基づいて算出する(ステップS105)。
【0093】
上述したように、図4及び図5に示した例を用いると、P={1,2,3,9,10,11,17,18,19}となるので、プレロール制御部25は、図4の再生設定ファイル5のView1、View2、View3、View9、View10、View11、View17、View18及びView19の値を合計し、X=9000kbpsを算出する。
【0094】
その後、プレロール制御部25は、プレロール時のバッファ量Yを下式にて算出する(ステップS106)。
【0095】
Y=X*プレロール時間(秒)/1000(Mbits)
【0096】
次に、プレロール制御部25は、算出したプレロール時のバッファ量Yを受信バッファ部21に通知する(ステップS107)。ここで、受信バッファ部21は、通知された値に応じたプレロール時のバッファ量を設定する。なお、プレロール時間(秒)は任意に設定可能である。
【0097】
さらに、受信バッファ部21は、プレロール時のバッファ量Yの設定が完了したら、多視点映像要求部23に準備完了を通知する(ステップS108)。
【0098】
上記の通知を受け取った多視点映像要求部23は、初期要求ビュー(集合P)を表す情報を多視点映像制御部13に対して通知することで、必要な視点映像41−iに対応する映像及び音声の符号化データの送信を多視点映像制御部13に要求する(ステップS109)。
【0099】
送信側装置1では、多視点映像制御部13が通知された初期要求ビュー(集合P)に基づいて送信バッファ部12に対して送信すべき1又は複数の視点映像41の各IDを通知することによって、送信バッファ部12が当該各IDで指定される1又は複数の視点映像41に対応する映像及び音声の符号化データの受信側装置2に向けた送出を開始する(ステップS110)。このステップS110で送信された映像及び音声の符号化データは受信バッファ部21で受信される。そして、映像及び音声の符号化データを受け取った受信バッファ部21は、映像/音声の再生開始に先立ち、プレロール時のバッファ量Yだけデータをバッファリングした後、先にバッファリングしたデータから映像/音声復号化部22へ向けて順次送出する。
【0100】
以降、必要に応じて多視点映像要求部23から多視点映像制御部13への多視点映像4の送信要求(ステップS109)と、その送信要求に基づく送信バッファ部12から受信バッファ部21への符号化データの送信処理(ステップS110)が行われる。
【0101】
次に、図7及び図8を参照して、図1に示した多視点映像配信システム100の他の動作例について説明する。図8は、多視点映像配信システム100における処理の流れの他の例を示したフローチャートである。また、配信対象となる多視点映像4の仕様については、図2及び図5を参照して説明した例の一部を変更して用いることとする。
【0102】
この動作例では、図2及び図5に示した各視点映像41が、図3(B)を参照して説明したようにマルチビットレートで符号化されている。すなわちこの動作例では、多視点映像4を構成する各視点映像41の符号化ビットレートが、1種類に固定されているのではなく、複数の異なる階層で複数種類設定されている。図7を参照して、マルチビットレートの場合の再生設定ファイルの例について説明する。図7に示した例では各視点映像41が3つの階層のビットレートで符号化されている。ただし、図7の例では、階層毎のビットレートは同一であるとしている。
【0103】
図4に示した再生設定ファイル5と比較して、図7に示した再生設定ファイル5Aにおいて追加あるいは変更されたパラメータは、「TargetBps」と「ViewZ−n」である。「TargetBps」は、新たに追加されたパラメータである。「ViewZ−n」は、図4の再生設定ファイル5内で各視点映像41の符号化ビットレートを表すパラメータ「ViewZ」を変更したものである。図7の再生設定ファイル5A内の他のパラメータについては図4の再生設定ファイル5内のものと同一である。
【0104】
「TargetBps」は受信側装置2から送信側装置1に要求する総ビットレートの目標値を表すパラメータである。本実施形態において、TargetBpsは、目標ビットレートである。
【0105】
「ViewZ−n(ただし、図7の例ではZが1〜40の整数、nが1〜3の整数)」は、Zで示されるID(位置)を有する視点映像41のn階層の符号化ビットレートを表すパラメータである。この場合、階層を表すnが小さいと、ビットレートも低いものとする。
プレロール制御部25は、この目標ビットレートにあわせて、データ容量が異なる視点映像41を組み合わせた再生開始時映像再生領域42に対応する視点映像41のデータ容量を算出し、算出した視点映像41のデータ容量に応じてプレロール時のバッファ量を設定する。
つまり、プレロール制御部25は、再生開始時映像再生領域42に対応する視点映像41−1、41−2、41−3、41−9、41−10、41−11、41−17、41−18、41−19を、指定された階層nの符号化ビットレートの映像データで構成した場合、目標ビットレート以下であるか否かを判定する。
【0106】
再生開始時映像再生領域42に対応する視点映像41−1、・・・の数と指定された階層nの符号化ビットレートとの積、つまり、再生開始時映像再生領域42に対応する視点映像41−1、・・・のデータ容量が目標ビットレート以下である場合、プレロール制御部25は、指定された階層nの符号化ビットレートの視点映像41−1・・・のデータ容量に応じてプレロール時のバッファ量を設定する。
一方、再生開始時映像再生領域42に対応する視点映像41−1、・・・のデータ容量が目標ビットレートより大きい場合、プレロール制御部25は、指定された階層nの符号化ビットレートの視点映像41−1・・・と、指定された階層nの符号化ビットレートよりも小さい階層n−1の符号化ビットレートの視点映像41−n・・・とを組み合わせて、視点映像41−1、・・・のデータ容量が目標ビットレート以下となるように、再生開始時映像再生領域42に対応する視点映像41−1、・・・のそれぞれの符号化ビットレートを決定する。このようにして、プレロール制御部25は、符号化ビットレートが異なる視点映像41を組み合わせた再生開始時映像再生領域42に対応する視点映像41のデータ容量(符号化ビットレート)を算出し、算出した視点映像41のデータ容量に応じてプレロール時間に対応するプレロール時のバッファ量を設定する。
【0107】
次に、図8を参照して、マルチビットレートに対応する場合の動作例について説明する。なお、図8において、図6に示したものに対応する処理には同一の符号を付けている。
【0108】
ここでは、上述と同じ方法で多視点映像要求部23にて初期要求ビューを算出し、以下の初期要求ビューの集合Pを得たとする(ステップS101〜S103)。
【0109】
P={1,2,3,9,10,11,17,18,19}
【0110】
算出された初期要求ビューは、多視点映像要求部23からプレロール制御部25へ通知され、プレロール制御部25は次のようにして受信ビットレートの合計値X(bps)を算出する(ステップS105A)。
【0111】
プレロール制御部25は、まず、再生設定ファイル5A内の符号化ビットレートを表すパラメータ「ViewZ−n」を参照し、集合Pの要素の左側から最低のビットレートの和を算出する。図7に示した再生設定ファイル5Aの場合は、View1−1、View2−1、View3−1、View9−1、View10−1、View11−1、View17−1、View18−1、及びView19−1の値の合計値から7200kbpsとなる。
【0112】
プレロール制御部25は、さらに、TargetBpsである15000kbpsに近づくように、集合Pの要素の左側から、順次、マルチビットレートの階層を1つあげていく。この場合、View1−1〜View19−1のビットレートが800kbpsであるのに対して、View1−2〜View19−2のビットレートは1800bpsであり、それぞれ1000bpsの増加となる。したがって、View1−1、View2−1、View3−1、View9−1、View10−1、View11−1、及びView17−1のビットレートの階層を1つあげてView1−2、View2−2、View3−2、View9−2、View10−2、View11−2、及びView17−2のビットレートを合計すると、すべてを1つ前の階層で合計したビットレートに対して、+7000kbpsとなることから、合計14200kbpsとなる。この時点でTargetBps(目標ビットレート)を越えない最大値となる。この値をXとして用いることとする。
【0113】
すなわち、プレロール制御部25は、X=142000kbspとして、その後、以下の値(プレロール時のバッファ量Y)を算出し(ステップS106)、次いで受信バッファ部21に通知する(ステップS107)。
【0114】
Y=X*プレロール時間(秒)/1000(Mbits)
【0115】
受信バッファ部21では、プレロール時のバッファ量Yの設定が完了したら、多視点映像要求部23に準備完了を通知する(ステップS108)。
【0116】
上記の通知を受け取った多視点映像要求部23は、必要な視点映像41の各IDとビットレートの各階層を多視点映像制御部13に通知する(ステップS109)。
【0117】
さらに、多視点映像制御部13は送信バッファ部12に必要な視点映像41の各IDとビットレートの各階層を通知して、送信バッファ部12から必要な視点映像41の指定されたIDとビットレートの階層の映像及び音声データの送出を開始する(ステップS110)。受信側装置2では、必要な視点映像41の指定されたIDとビットレートの階層の映像及び音声データを受け取った受信バッファ部21が、映像/音声の再生開始に先立ち、プレロール時のバッファ量Yだけデータをバッファリングした後、データを映像/音声復号化部22に対して順次送出する。
【0118】
以降、必要に応じて多視点映像要求部23から多視点映像制御部13への多視点映像4の送信要求(ステップS109)と、その送信要求に基づく送信バッファ部12から受信バッファ部21への符号化データの送信処理(ステップS110)が行われる。
【0119】
以上のように、図7及び図8を参照して説明した他の動作例では、視点映像41毎に複数種類の符号化ビットレートを設定した場合でも、プレロール時のバッファ量Yを適切に設定することが可能となる。
【0120】
本実施形態の多視点映像配信システム100では、再生設定ファイル5(あるいは5A)を用いて、最初に見る領域情報から初期要求ビューが自動的に算出される。さらに、初期要求ビューの合計ビットレートを算出し、これを受信バッファ部21に通知し、初期要求ビューが必要とするプレロール時のバッファ量Yが算出される。加えて、初期要求ビューがマルチビットレートで符号化されていた場合でも、目的ビットレート以下に抑えた適切に初期要求ビューと必要なビットレートの組み合わせのプレロール時のバッファ量Yを算出できる。
【0121】
すなわち、本実施形態によれば、映像/音声符号化データのリアルタイムストリーミング配信に際して、受信側装置1の受信バッファ部21において、再生開始時点の映像再生領域の再生に必要なビットレートに合わせてプレロール時のバッファ量Yを設定することができる。
【0122】
また、送信側装置1から再生設定ファイル5(あるいは5A)を送信することで、多視点映像4の縦幅(pixel)、多視点映像4の横幅(pixel)、多視点映像4の縦の画像(視点映像41の)数、多視点映像4の横の画像(視点映像41の)数、再生開始時映像再生領域42の左上のx座標、再生開始時映像再生領域42の左上のy座標、再生開始時映像再生領域42の横(x方向)方向のサイズ、再生開始時映像再生領域42の縦(y方向)方向のサイズ、多視点映像4を構成する視点映像41の各符号化ビットレートといったプレロール時のバッファ量の算出に必要な情報がサーバ側からクライアント側に通知される。そして、受信側装置2では、送信側装置1から通知された再生設定ファイル5(あるいは5A)から、初期の注視領域に合わせて初期要求ビューが自動的に算出される。また、初期要求ビューについて、各視点映像41を複数のビットレート(マルチビットレート)で符号化している場合でも、再生設定ファイル5の多視点映像4を構成する視点映像41の各符号化ビットレートを用いて受信バッファ部21にプレロール時のバッファ量Yを設定することができる。
【0123】
上記の構成及び処理により、多視点映像/音声符号化データのリアルタイムストリーミング配信に際して適切なプレロール時のバッファ量Yを受信バッファ部21で設定し、簡易に運用することが可能となる。
【0124】
すなわち、本実施形態によれば、多視点映像/音声符号化データのリアルタイムストリーミング配信に際して、受信側でのプレロール値(プレロール時のバッファ量Y)を適切に設定することで、安定した映像再生が実現できる。また、多視点映像/音声符号化データのリアルタイムストリーミング配信に際して、受信側でのプレロール時のバッファ量を適切に設定することで、再生開始時間の遅延を防止できる。
【0125】
なお、本発明の実施の形態は上記のものに限定されず、例えば図1に示した各ブロックをさらに分割して構成したり、あるいは複数のブロックを統合して構成したりといった変更を適宜行うことができる。また、送信側装置1や受信側装置2を構成するコンピュータによって実行されるプログラムの一部又は全部は、コンピュータ読み取り可能な記録媒体や通信回線を介して頒布することが可能である。
【0126】
また、本実施形態の受信バッファ部21では、あらかじめ決められている再生開始時映像領域42の設定値に応じて再生開始時におけるプレロール時のバッファ量を変化させることとしているが、例えば視聴者が受信側で再生する映像領域を可変できるようにしてそれに応じて、あるいは、視聴者による受信側での視点切り替え時の領域情報に応じて、受信バッファ部21のプレロール時のバッファ量を変更できるようにしてもよい。この場合、再生開始時点の場合と同様に、プレロール時のバッファ量が不適切な値となって再生品質の低下や遅延が発生する可能性を低く抑えることが可能となる。すなわち、例えば、バッファリングされるデータ量が増えるため、再生開始後の視点切り替えにかかる時間が増加する(応答遅延が増加する)といった問題点を回避することができる。
【0127】
なお、上記実施の形態における構成と、特許請求の範囲に記載した構成との関係は次の通りである。「全体映像データ」は「多視点映像4」に対応している。「映像再生領域」は「再生開始時映像領域42」に対応している。「映像処理装置」は「受信側装置2」に対応している。「バッファ部」は「受信バッファ部21」に対応している。「復号化部」は「映像/音声復号化部22」に対応している。「視点映像」は「視点映像41」に対応している。「ブレロール制御部」は「ブレロール制御部25」に対応している。
【0128】
また、本実施形態にかかる映像処理装置は、多視点映像符号化データが表す多視点映像の大きさと、前記多視点映像に所定形式で配列される前記視点映像の配列数と、前記映像再生領域の位置及び大きさと、前記各視点映像の符号化ビットレートとを表す情報を含む再生設定ファイルが、前記多視点映像符号化データを配信する際の送信側から受信側へと通知され、前記プレロール制御部が、前記受信側において、前記再生設定ファイルの内容に基づき、前記映像再生領域を含む前記各視点映像の符号化ビットレートの合計値に応じて前記受信バッファ部のバッファ量を設定することを特徴とする。
また、本実施形態にかかる映像処理装置において、前記プレロール制御部が、前記各視点映像の符号化ビットレートが視点毎に複数選択可能な場合に、所定の目標ビットレートとの比較において、前記各視点映像の符号化ビットレートを順次選択しながら前記映像再生領域を含む前記各視点映像の符号化ビットレートの合計値を算出した結果に応じて、前記受信バッファ部のバッファ量を設定することを特徴とする。
【0129】
また、本実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えることができる。また、これら一連の手順をコンピュータに実行させるためのプログラムまたはそのプログラムを記憶する記録媒体として捉えることができる。この記録媒体としては、例えば、ブルーレイディスク(Blu−ray Disc(登録商標))、DVD(Digital Versatile Disk)、HDD(ハードディスク)、メモリカード等を挙げることができる。
【0130】
なお、上述の装置は、内部にコンピュータシステムを有している。そして、動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいう「コンピュータシステム」とは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
【0131】
また、各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、また、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、検出対象物の形状情報の推定値を算出する処理を行ってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0132】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【符号の説明】
【0133】
1 送信側装置
2 受信側装置
3 通信網
4 多視点映像
5、5A 再生設定ファイル
11 映像/音声符号化部
12 送信バッファ部
13 多視点映像制御部
14 再生設定ファイル送信部
21 受信バッファ部
22 映像/音声復号化部
23 多視点映像要求部
24 再生設定ファイル受信部
25 プレロール制御部
26 映像音声出力部
41 視点映像
42 再生開始時映像領域

【特許請求の範囲】
【請求項1】
全体映像データのうち指定された一部領域である映像再生領域の符号化データを復号化する映像処理装置であって、
入力する符号化データを一時的に保存し、保存している前記符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している前記符号化データを出力するバッファ部と、
前記バッファ部から入力する前記符号化データを復号化して出力部に出力する復号化部と、
前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じて、前記プレロール時のバッファ量を設定するプレロール制御部と、
を備えることを特徴とする映像処理装置。
【請求項2】
前記プレロール制御部は、
前記全体映像データの映像内における前記映像再生領域の位置関係を示す情報を入力し、当該情報に基づき前記映像再生領域に対応する前記視点映像のデータ容量を算出し、算出した前記視点映像のデータ容量に応じて前記プレロール時のバッファ量を設定することを特徴とする請求項1に記載の映像処理装置。
【請求項3】
前記プレロール制御部は、
前記入力する符号化データのデータ容量の目標値にあわせて、データ容量が異なる前記視点映像を組み合わせた前記映像再生領域に対応する前記視点映像のデータ容量を算出し、算出した前記視点映像のデータ容量に応じて前記プレロール時のバッファ量を設定することを特徴とする請求項1または2に記載の映像処理装置。
【請求項4】
全体映像データのうち指定された一部領域である映像再生領域の符号化データを送信する送信側映像処理装置と、
前記符号化データを受信し、復号化する受信側映像処理装置とを備え、
前記受信側処理装置は、
前記送信側映像処理装置から受信する前記符号化データを一時的に保存し、保存している前記符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している前記符号化データを出力するバッファ部と、
前記バッファ部から入力する前記符号化データを復号化して出力部に出力する復号化部と、
前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じて、前記プレロール時のバッファ量を設定するプレロール制御部と、
を備えることを特徴とする映像処理システム。
【請求項5】
全体映像データのうち指定された一部領域である映像再生領域の符号化データを復号化する映像処理方法であって、
前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じてプレロール時のバッファ量を設定するステップと、
入力する符号化データを一時的に記憶領域に保存するステップと、
保存している前記符号化データのデータ容量が設定された前記プレロール時のバッファ量に到達した場合、保存している前記符号化データを前記記憶領域から出力するステップと、
前記出力する前記符号化データを入力し、復号化するステップと、
を備えることを特徴とする映像処理方法。
【請求項6】
全体映像データのうち指定された一部領域である映像再生領域の符号化データを復号化するコンピュータを、
入力する符号化データを一時的に保存し、保存している前記符号化データのデータ容量が設定されたプレロール時のバッファ量に到達した場合、保存している前記符号化データを出力するバッファ手段、
前記バッファ部から入力する前記符号化データを復号化して出力部に出力する復号化手段、
前記全体映像データの映像を構成する複数の視点映像のうち前記映像再生領域を含む前記視点映像のデータ容量に応じて、前記プレロール時のバッファ量を設定するプレロール制御手段、
として機能させるための映像処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2013−38541(P2013−38541A)
【公開日】平成25年2月21日(2013.2.21)
【国際特許分類】
【出願番号】特願2011−171806(P2011−171806)
【出願日】平成23年8月5日(2011.8.5)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】