説明

映像伝送方式

【課題】ユーザーが任意で定義する補助データを映像信号に多重することが可能な映像伝送方式において、圧縮符号化・復号化の回数(世代数)や各世代における方式を把握することを可能とする。
【解決手段】ユーザーが任意で定義する補助データを映像信号に多重することが可能な映像伝送方式において、映像信号に対する圧縮符号化・復号化の多段実行回数及び各実行回数における圧縮符号化・復号化の種類をフレーム毎に管理し、これらを示すデータを補助データとして前記映像信号にフレーム毎に多重する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像伝送装置が映像信号を伝送する際に使用する映像伝送方式に関し、特に、圧縮符号化・復号化の回数(世代数)や各世代における符号化方式を把握し、劣化の度合いを管理できる映像信号を伝送する映像伝送方式に関する。
【背景技術】
【0002】
近年の放送・映像システムでは、デジタル化した映像データに対してMPEG−2やH.264等の非可逆圧縮符号化・復号化を施すことにより、一般にHDTV(High Definition Television)と呼ばれるような高精細・高解像度の映像データをリアルタイムで送受信することが可能となっている。
また、デジタル化は映像データの再利用を飛躍的に向上させた。例えば、地上デジタル放送の映像データをワンセグへ再送信する際には、再度、圧縮符号化・復号化を実施することで異なるビットレートへ変換する。
【0003】
更に、デジタル・シネマ等やBlu−ray DVD等のような高画質を極めようとする業界では、映像ストリームやファイル全体を通した画質評価では満足せず、フレーム毎に圧縮符号化・復号化のパラメータを調整することで高画質化を図っている。
しかしながら、通常の圧縮符号化・復号化は圧縮劣化(画質劣化)を伴うものであり、圧縮符号化・復号化の世代数(繰り返し回数)は2〜3回が限度であると考えられている。そのため、符号化処理の履歴を残しておき、画質の劣化をある範囲に収めるようにする編集方法等が知られている(例えば、特許文献2及び3参照)。
【0004】
一方、SMPTE 292M等で規定され、機器間の映像信号インタフェースとして標準的に使用されているHD−SDI(High Definition−Serial Digital Interface)のような公知の映像ストリームフォーマットでは、圧縮符号化・復号化の世代数(繰り返し回数)を示す情報が含まれていない(非特許文献1及び2参照)。このため、現状では、映像ストリームやファイル全体を通して再度、圧縮符号化・復号化を行った後に、全体を再生して画質を確認しており、非常に非効率であった。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2009−55579号公報
【特許文献2】特開平8−130712号公報
【特許文献3】特開平10−56613号公報
【非特許文献】
【0006】
【非特許文献1】BTA S−005B、「1125/60方式HDTVビット直列インタフェースにおける補助データの共通規格」、社団法人電波産業会、1998年3月
【非特許文献2】ARIB STD−B40、「補助データのPES伝送方式」、社団法人電波産業会、2002年7月
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述のように、映像ストリーム或いは映像ファイル等の圧縮符号化・復号化を実施した回数(世代数)が多い場合には、例えば3回以上の場合には、画質劣化の影響が大きい。しかしながら、特許文献2のような独自方式で符号化処理履歴を記録しても、SDIのような非圧縮映像を伝送する標準的な信号インタフェースで伝送できないため、映像信号の取り込み先の機器では、画質劣化が許容範囲であるかどうかを確認するために、映像ストリームやファイル等の先頭から再生し、人の視覚で全体をチェックしなければならず、非常に非効率であった。
【0008】
本発明は、このような従来の事情に鑑み為されたもので、圧縮符号化・復号化の回数(世代数)や各世代における符号化方式等を把握することが可能な映像信号を伝送する映像伝送方式を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明では、ユーザーが任意で定義する補助データを映像信号に多重することが可能な映像伝送方式において、次のような構成とした。
すなわち、映像信号に対する圧縮符号化・復号化の多段実行回数(世代数)及び各実行回数(各世代)における圧縮符号化・復号化の種類をフレーム毎に管理し、これらを示すデータ(世代数を示すデータ及び各世代における圧縮符号化・復号化の種類を示すデータ)を補助データとして前記映像信号にフレーム毎に多重する。
【0010】
従って、映像のフレーム毎に、圧縮符号化・復号化の回数(世代数)や各世代における種類(方式の種類)を把握することが可能な映像信号を伝送することができ、例えば、映像の編集作業を効率化することができる。
【0011】
一構成例として、本発明では、次のような映像伝送装置(補助データを多重する側である例えば送信側の装置)を提供することもできる。
ユーザーが任意で定義する補助データを映像信号に多重することが可能な映像伝送方式を使用して映像信号を伝送する映像伝送装置において、
映像信号に対する圧縮符号化・復号化の多段実行回数や各実行回数における圧縮符号化・復号化の種類をフレーム(若しくはフィールド)毎に管理する管理手段と、
前記管理手段により管理される前記多段実行回数を示すデータや前記種類を示すデータを補助データとして前記映像信号にフレーム毎に多重する補助データ多重手段と、
を備えたことを特徴とする映像伝送装置。
【0012】
また、一構成例として、本発明では、次のような映像伝送装置(補助データを分離する側である例えば受信側の装置)を提供することもできる。
ユーザーが任意で定義する補助データを映像信号に多重することが可能な映像伝送方式を使用して映像信号を伝送する映像伝送装置において、
映像信号に対する圧縮符号化・復号化の多段実行回数を示すデータや各実行回数における圧縮符号化・復号化の種類を示すデータが補助データとしてフレーム毎に多重された映像信号から当該多段実行回数を示すデータや当該種類を示すデータを分離(抽出)する補助データ分離手段を備えたことを特徴とする映像伝送装置。
【0013】
一構成例として、非圧縮映像信号と補助データとを多重して伝送する映像伝送方式において、該非圧縮映像信号に対する過去に為された圧縮符号化・復号化の実行回数及び各実行回数における圧縮符号化・復号化の種類をフレーム毎に補助データとしてフレーム毎に多重することを特徴とする映像伝送方式。
更に、一構成例として、前記映像伝送方式で伝送される信号はSDI信号であり、前記補助データは、該SDI信号のYデータ領域であって、ユーザーが任意で定義できるHANC(Horizontal Ancillary)領域内で多重されることを特徴とする前記映像伝送方式。
【発明の効果】
【0014】
以上説明したように、本発明に係る映像伝送方式によると、圧縮符号化・復号化の回数(世代数)や各世代における種類(符号化方式の種類)を把握することが可能な映像信号を伝送することができ、例えば、映像の編集作業を効率化することができる。
【図面の簡単な説明】
【0015】
【図1】本発明の一実施例に係る映像伝送方式の映像信号の構成例を示す図である。
【図2】本発明の一実施例に係る補助データの構成例を示す図である。
【図3】本発明の一実施例に係るUDWの構成例を示す図である。
【図4】本発明の一実施例に係る圧縮符号化・復号化方式の割り当て値の一例を示す図である。
【図5】本発明の一実施例に係る映像編集装置の機能ブロック図である。
【発明を実施するための形態】
【0016】
本発明に係る実施例を図面を参照して説明する。
図1には、本発明の一実施例に係る映像伝送方式の映像信号の構成例を示してある。本例のSDI映像信号の構成は、非特許文献1の規定に従っており、図1には、Y(輝度)データのみを図示してある。図の横方向が映像信号の1水平ライン期間に相当し、1ライン期間は、SAV(Start of Active Video)から始まり、有効映像領域(もしあれば)、EAV(End of Active Video)、LN(Line Number)、CRCC(Cyclic Redundancy Check Code)と続き、HANC(Horizontal Ancillary)領域(もしあれば)で終わる。
図1における斜線部分は、非特許文献1で規定された補助データ多重可能領域で、この領域へ補助データの多重が可能である。Pb/Prデータ(図示しない)には、HANC領域に音声が多重されている。
【0017】
本例では、このような補助データ多重可能領域へ、圧縮符号化・復号化の世代数を示す情報や各世代における方式を示す情報を、ユーザー定義の補助データとして多重する。
具体的に、本例では、このような情報を、YデータのHANC領域に多重し、oddフィールドとevenフィールドの有効映像領域の最初のライン(第41ライン、第603ライン)へそれぞれ多重する。この多重位置は、図1において、補助データのoddフィールド多重位置1、補助データのevenフィールド多重位置2、として格子模様で示されている。
【0018】
図2には、補助データの構成例(形式の一例)を示してある。本例の補助データは、補助データフラグ(ADF)、データ識別ワード(DID)、第2データ識別ワード(SDID)、データカウントワード(DC)、ユーザーデータワード(UDW)、チェックサムワード(CS)から構成されている。なお、ワード長は10ビットであるとする。また、hは16進表現であることを示す。
【0019】
ADFは、補助データパケットの開始を示し、000h、3FFh、3FFhの連続する3ワードで構成されるユニーク・コードである。
DIDは、1ワードで構成され、データ識別のためのコードであり、この値によりUDWの種類を示す。本例では、DIDの値として、b0〜b7(1ワード内の下位8ビット)はユーザー用(50h〜5Fh)を使用し、b8はb0〜b7に対する偶数パリティとなり、b9はb8の反転となる。
SDIDは、1ワードで構成され、DIDと同様に、UDWの種類を示す。本例では、SDIDの値として、b0〜b7として使用可能な(01h〜FFh)を使用し、また、b8、b9はDIDと同様である。
【0020】
DCは、1ワードで構成され、UDWのワード数を示す。DCの値として、b0〜b7はワード数(ワード長)を示し、b8、b9はDID等と同様である。
UDWは、DIDがユーザー用を示すときに、ワード数が255以下であれば、その構造は任意となっている。但し、UDWの各ワード値としては、004h〜3FBhを使用する。
CSは、1ワードで構成され、DIDからUDWの最後のワードまでの下位9bitの総和の下位9bit(b0〜b8)を用いる。CSの最上位ビットb9は、b8の反転値となる。
【0021】
次に、本発明の一実施例に係る補助データのUDWの詳細について説明する。
図3には、本例のUDWの構成例を示してある。
本例のUDWは、UDW0〜UDW4の5ワードで構成され、先頭のUDW0には、圧縮符号化・復号化の世代数を格納する。具体的には、UDW0のb7〜b4を使用する。この書き込みビット位置は、禁止コード以外であればどこでもよいが、本例では視覚的及びビット配列的に認識し易い配置にしてある。図3の例では、UDW0は040hであり、これは世代数が“4”であることを示す。
【0022】
また、UDW1以降の各ワードを、各世代数における圧縮符号化・復号化の方式を示すワードとして割り当てる。具体的には、UDW1が第1回目の圧縮符号化・復号化の方式を表わし、UDW2が第2回目の圧縮符号化・復号化の方式を表わし、UDW3が第3回目の圧縮符号化・復号化の方式を表わし、UDW4が第4回目の圧縮符号化・復号化の方式を表わす。
【0023】
図4の表には、各圧縮符号化・復号化方式の割り当て値の一例を示してある。
図4の例では、UDWx(x=1〜4のいずれか)=010hであれば、その世代数においてJPEGの圧縮符号化(及び復号化)が施されたことを示し、UDWx=020hであれば、その世代数においてJPEG2000の圧縮符号化(及び復号化)が施されたことを示し、UDWx=030hであれば、その世代数においてMPEG−2の圧縮符号化(及び復号化)が施されたことを示し、UDWx=040hであれば、その世代数においてMPEG−4 part2の圧縮符号化(及び復号化)が施されたことを示し、UDWx=050hであれば、その世代数においてMPEG−4 part10/H.264の圧縮符号化(及び復号化)が施されたことを示し、UDWx=060hであれば、その世代数において他(other)の圧縮符号化(及び復号化)が施されたことを示す。
【0024】
上記の設定に基づくと、図3に示されるUDWでは、圧縮符号化・復号化の世代数(UDW0=040h)は4(回)であり、第1回目の圧縮符号化・復号化の方式(UDW1=010h)はJPEGであり、第2回目の圧縮符号化・復号化の方式(UDW2=020h)はJPEG2000であり、第3回目の圧縮符号化・復号化の方式(UDW3=010h)はJPEGであり、第4回目の圧縮符号化・復号化の方式(UDW4=030h)はMPEG−2であることを示している。なお下位4ビットは未使用であるが、将来の拡張として、符号化による劣化度を数値化したものを格納したり、トランスコーデック時の各種パラメータ等を格納するために利用されうる。
【0025】
本例において、上述のような補助データを多重した映像データを圧縮符号化する際には、補助データを映像データから分離して、非特許文献2の規格に則ってPES(Packetized Elementary Stream)化する。このPESデータをTS(Transport Stream)パケットに分割多重することで、規格に則っている一般的な伝送装置において、補助データを欠落することなく送受信することが可能である。また、PESデータにはフレーム毎に同期再生するための時間情報(PTS:Presentation Time Stamp)が含まれており、送受信での補助データの多重フレーム位置を同期化することができる。
【0026】
このとき、補助データの伝送ビットレートはわずかなものであり、本例で示した図1〜図3の構成例では、次のようになる。
1フィールド中のbit数[bit/field]
=TSヘッダ+PESヘッダ+ANC_data(≦120bit)+stuffing(TSパケット1回分で転送)
=188[byte/TSパケット]×8[bit]
=1504[bit]。
補助データ伝送レート
=30/1.001[frame/sec]×1フィールド中のbit数[bit/field]×2[field/frame]
≒90.15[kbps]。
【0027】
このように本例では、フィールド毎に、圧縮符号化・復号化の世代数及び各世代における圧縮符号化・復号化の方式を示す最長12ワードの補助データを多重することにより、フィールド毎にそれらについて把握することが可能となる。
本例では、ARIB規格等に準じた補助データ多重方式におけるユーザー定義の領域を使用している。このため、送信機と受信機との間での互換性が損なわれることが無い。また、ARIB規格等に則った一般的な映像機器やソフトウエアを用いることで、そのデータの抽出は容易である。
なお、補助データは、フィールド毎ではなくフレーム毎に設けてもよい。
【実施例】
【0028】
図5は、本発明の一実施例に係る映像編集装置の機能ブロック図である。
SDI−I/F(Interface)11は、同軸ケーブル等に接続されHDや3GのSDI信号を入出力可能なハードウェア(物理層)、及びデータ・フォーマットおよびマッピング機能を提供する。
ENC/DEC(Encoder/Decoder)12は、SDI−I/F11から入力された映像、音声、アンシラリを適宜圧縮して、MXFエンジン13(後述)に出力する。またMXFエンジン13から受け取った映像、音声、アンシラリデータのうちエンコードされているものをデコードして、SDI−I/F11に出力する。なお、本例では、映像についてはAVC−Intraで圧縮し、アンシラリは圧縮しない(素通りさせる)ものとして説明する。ただし、アンシラリのうち本発明の補助データに関しては、ENC/DEC12が映像に対して復号化を行ったときに、その映像に対応する補助データに、UDW0の示す世代数を1加算するとともにUDWの最後に新たなワードを追加する。
【0029】
MXF(Material eXchange Format)エンジン13は、ファイル記録部14(後述)に格納する(された)MXFファイルへの高レベルでのアクセス操作を提供する。MXFエンジン13はいくつかの機能に分けられるが、ENC/DEC12から入力された映像、音声、アンシラリをMXFファイル化する際は、MXF化機能を利用する。
MXFファイル化は、ラッピングの仕方により多様であるが、本例のMXF化機能は、一例として、映像、音声、アンシラリ(VBI)を(クリップ単位で)別個のMXFファイルにする“OP−Atom”と呼ばれるオペレーショナルパターンを使用する。ただし、水平帰線期間に多重される本例の補助データに関しては、アンシラリとしてではなく、映像又はアンシラリMXFファイルのヘッダメタデータか、ファイルボディのエディットユニット(1フレーム単位に相当する)のシステムアイテム内にKLV符号化して記述する。つまり補助データはメタデータに変換される。
或いは、MPEG2システムに従いTS化してラッピングする場合は、TS内のPESパケットが保たれるので、補助データもそのまま保存できる。
更には、補助データ圧縮符号化・復号化の世代数情報等を適宜集約してから、シーンやクリップ単位で“Video Compression History”等のメタデータを生成し、映像のMXFファイルのヘッダ部に記述してもよい。
【0030】
ファイル記録部14は、MXFエンジン13でMXF化されたファイルを記録するものであり、ハードディスク等である。
LAN−I/F15は、IEEE 802.3等を用い、ソケット通信(IP通信)を提供する。またFTP等のファイル転送プロトコルも含み、MXFファイルのほか、.TS、.MPG、.AVI、.MOV、.VOB等の任意のファイルを送受信する。
受信したファイルがMXFであれば、MXFエンジン13の検証機能に渡され、MXFでなければ、トランスコーダ17(後述)に渡される。検証機能は定義情報記憶部16を参照して、MXFの(UIDの木構造等の)チェックを行う。
定義情報記憶部16は、MXFやMPEG7等におけるメタデータ辞書や、各種の設定情報を記憶している。
【0031】
トランスコーダ17は、LAN−I/F15で受信したファイルの圧縮方式等が所望のものでない場合に、それを一旦復号して所望の方式で符号化し直した(トランスコードした)後、MXFエンジン13のMXF化機能に渡す。また、送信すべきファイルをMXF化機能から受け取り、適宜送信先にあった方式にトランスコードし、LAN−I/F15に渡す。
なお、このようにMXFファイルと他のファイルやSDI信号との変換を行う際に、両ファイル間で厳密に対応するメタデータ項目がなかったり、メタデータが変化したりして、メタデータに何らかの加工が必要となる場合がある。MXFエンジン13のメタデータ変換・最適化機能は、定義情報記憶部16を参照して、メタデータの情報がなるべく保たれるようにメタデータの変換を行う。またENC/DEC12やトランスコーダ17、V−codec19(後述)での符号化・復号化によりメタデータが変化したときには、本発明の補助データに相当するものも含めて適切に更新する。例えば映像に効果や色補正等のレンダリングを要する編集をしたときは、復号化と(再)符号化の過程が発生するが、もし映像ソースが補助データのない映像だった場合は、新規に補助データ或いはそれに相当するメタデータを作成し、MXFファイル中に記録する。
【0032】
アプリケーション制御部18は、本例の映像編集装置の機能を実現する部分であり、MXFエンジン13のファイル操作機能を介して、MXFファイルを表示(再生)のために読み出したり、(部分的に)編集して書き戻したりする。アプリケーション制御部18は、これらの操作を、HIDドライバ(後述)から受け取ったユーザ操作に従い、MXFファイルのヘッダやメタデータ、定義情報記憶部16等を参照して行う。
V−codec19は、編集用のワークメモリを内蔵した、映像符号化/復号化器である。
A−codec20は、編集用のワークメモリを内蔵した、音声符号化/復号化器である。V−codec19やA−codec20は、符号化の設定等がアプリケーション制御部18に制御されるほか、ワークメモリもアプリケーション制御部18から読み書きされる。
【0033】
描画部21は、表示用のビデオメモリに各種の描画処理、合成処理等を行って出力するものであり、V−codec19で復号化された映像信号を受け取って、メモリに描画するか、合成出力する。
【0034】
ディスプレイI/F22は、描画部21から出力された映像信号を、液晶ディスプレイ等のスクリーンディスプレイに与えるためのインタフェースである。
音声出力I/F23は、A−codec20からの音声データを、スピーカ等に出力するための、ハードウェア及びそのドライバ等からなるインタフェースである。
HID(Human Interface Device)−I/F24は、キーボードやマウス等のHIDからのユーザ操作を受け取りアプリケーション制御部18に渡すための、ハードウェア及びそのドライバ等からなるインタフェースである。
【0035】
次に、本例の映像編集装置の特徴的な動作を説明する。
アプリケーション制御部18は、音声や映像の内容を編集をする際は、V−codec19等のワークメモリにアクセスする。またMXFファイルから本例の補助データに相当するメタデータを読み出し、映像を再生、編集等する際には、そのメタデータから推定される映像の劣化度に応じたサインが表示されるよう、描画部21に描画指示をする。例えば全画面表示で再生中には、画面の隅に世代数を文字表示する。編集中には、編集画面のタイムライン上に、世代数(劣化度)を示すグラフを表示したり、サムネイルのフレーム連続表示においてサムネイルの枠の色などを世代数に応じて異ならせて表示したりする。また世代数が映像品質上の限界に達しているときは、そのフレームに対する編集を禁止したり警告を発したりする。もちろん、フレームに適用されるメタデータ全てを一覧表示するなどし、過去の符号化方式の種類を見たユーザが、映像の劣化度を判断して編集の可否を決めてもよい。
【0036】
このように、本発明に係る実施形態では、圧縮符号化・復号化を実施した回数(世代数)の情報をフレーム毎に多重する。多重する領域としては補助データのユーザー定義領域とし、また、世代数のほかに、圧縮符号化・復号化の種類等も多重する。
従って、従来では、圧縮符号化・復号化の世代数を、映像ストリーム或いは映像ファイル全体についても把握できていなかったのに対して、本例の映像伝送方式を用いることで、フレーム単位で圧縮符号化・復号化の世代数を認識した上で映像を編集することが可能となる。また、圧縮符号化方式の情報も付加することで、どのような圧縮符号化方式が実行されてきたかを把握することが可能となり、フレーム単位で再編集する際の参考情報となる。このように、本例では、映像データの編集に適した映像伝送方式を実現することができる。
【0037】
ここで、本発明に係るシステムや装置などの構成としては、必ずしも以上に示したものに限られず、種々な構成が用いられてもよい。また、本発明は、例えば、本発明に係る処理を実行する方法或いは方式や、このような方法や方式を実現するためのプログラムや当該プログラムを記録する記録媒体などとして提供することも可能であり、また、種々なシステムや装置として提供することも可能である。
また、本発明に係るシステムや装置などにおいて行われる各種の処理としては、例えばプロセッサやメモリ等を備えたハードウェア資源においてプロセッサがROM(Read Only Memory)に格納された制御プログラムを実行することにより制御される構成が用いられてもよく、また、例えば当該処理を実行するための各機能手段が独立したハードウェア回路として構成されてもよい。
また、本発明は上記の制御プログラムを格納したCD−ROM等のコンピュータにより読み取り可能な記録媒体や当該プログラム(自体)として把握することもでき、当該制御プログラムを当該記録媒体からコンピュータに入力してプロセッサに実行させることにより、本発明に係る処理を遂行させることができる。
【符号の説明】
【0038】
1・・補助データのoddフィールド多重位置、 2・・補助データのevenフィールド多重位置、 11・・SDI−I/F、 12・・ENC/DEC、 13・・MXFエンジン、 14・・ファイル記録部、 15・・LAN−I/F、 16・・定義情報記憶部、 17・・トランスコーダ、 18・・アプリケーション制御部、 19・・V−codec、 20・・A−codec、 21・・描画部、 22・・ディスプレイI/F、 23・・音声出力I/F、 24・・HID−I/F

【特許請求の範囲】
【請求項1】
非圧縮映像信号と補助データとを多重して伝送する映像伝送方式において、
該非圧縮映像信号に対する過去に為された圧縮符号化・復号化の実行回数及び各実行回数における圧縮符号化・復号化の種類をフレーム毎に補助データとしてフレーム毎に多重することを特徴とする映像伝送方式。
【請求項2】
前記映像伝送方式で伝送される信号はSDI信号であり、
前記補助データは、該SDI信号のYデータ領域であって、ユーザーが任意で定義できるHANC(Horizontal Ancillary)領域内で多重されることを特徴とする請求項1記載の映像伝送方式。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate