説明

伝送装置

【課題】SMPTE302M規格では、HD−SDI信号に多重化されている音声データの各チャネルが有効であるか無効であるかを示す情報を、映像データおよび音声データとともに伝送することについては規定されていない。つまり、MPEG−2TSデータを受信する受信装置等では音声データの各チャネルが有効であるか無効であるかを把握することができず、無効チャネルからノイズデータが出力されるという問題があった。
【解決手段】HD−SDI信号に多重化されている映像データと音声データとをMPEG−2TSデータに多重化するために、音声データをSMPTE302M形式の音声パケットデータに変換する。この時、音声データの各チャネルが有効であるか無効であるかを示す音声チャネル情報を音声パケットデータの未使用領域に格納する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像データと音声データとを多重して伝送する伝送装置に関する。
【背景技術】
【0002】
従来、映像データと音声データとを多重化して送信するための規格として、MPEG(Moving Picture Experts Group)が存在する。また、ビデオカメラ等のHD(High Definition)映像を伝送するためのHD−SDI(Serial Digital Interface)信号にAES(Audio Engineering Society)音声を多重化するための規格として、ARIB(社団法人電波産業会:Association of Radio Industries and Businesses)が定めたARIB−STD BTA S−006B(非特許文献1)、およびSMPTE(米国映画テレビ技術者協会:Society of Motion Picture and Television Engineers)が定めたSMPTE299M規格が存在する。
【0003】
また、HD−SDI信号には、例えばEmbedded−Audioの音声制御パケット中に含まれるアクティブチャネルデータのように各音声チャネルが有効となっているか無効となっているかの設定(以下、適宜「アクティベート」という)を示す情報が多重化されている。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】社団法人電波産業会、「1125/60方式HDTVビット直列インタフェースにおけるデジタル音声規格 標準規格 BTA S−006B」、1125/60方式スタジオシステム 標準規格、平成10年3月17日、p.133−160
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、HD−SDI信号に多重化されている非圧縮音声であるAES音声をMPEG−2 part1 System規格に準拠したMPEG−2TransportStream形式(以下、「MPEG−2TS」という)で伝送する場合、通常はSMPTE302M規格に準拠したPacketized Elementary Stream(以下、「PES」という)で伝送する。
【0006】
しかしながら、この規格では、HD−SDI信号に多重化されている音声チャネルのアクティベートを示す情報を伝送することについては規定されていない。つまり、通常、MPEG−2TSデータを受信する受信装置等では、どの音声チャネルがアクティブ(有効)となっているのかを把握することはできない。このため、無音化(ミュート)されていない音声データが無効チャネルで入力された場合、受信側の無効チャネルからノイズが出力される等の問題が起こっていた。
【0007】
よって、従来では、受信装置等において一旦音声を再生して、ユーザがノイズか否かを確認するという人間の確認動作が必要であった。もしくは音声データとは異なるPID(パケット識別子:Packet Identifier)のTSパケットを用いて音声のアクティベーションを示す情報を伝送しなければならなかった。
【0008】
そこで、本発明は上記課題を解決し、SMPTE302M規格に準拠しつつ、伝送データの受信側において、音声チャネルのアクティベートを把握して無効チャネルにおける無音データの出力を可能とする伝送装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明は、映像データと音声データとが多重化されたHD−SDI信号から前記映像データと前記音声データとを抽出する抽出手段と、前記映像データを、MPEG−2TS形式で多重化可能な形式の映像パケットデータに変換する映像データ変換手段と、前記音声データを、SMPTE302M形式の音声パケットデータに変換する音声データ変換手段と、前記映像パケットデータと前記音声パケットデータとを多重化することでMPEG−2TS形式に変換して送信する送信手段と、を有し、前記音声データ変換手段は、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納して、SMPTE302M形式の音声パケットデータに変換することを特徴とする伝送装置を提案する。
【0010】
この構成によれば、SMPTE302M規格に準拠しつつ、音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することができる。これにより、受信側の装置では音声チャネルのアクティベートを把握し、人間の確認動作を必要とせずに無効チャネルにおいて無音データを出力することが可能となる。よって、従来問題となっていたノイズの発生を防止することができる。また、音声チャネルのアクティベートに関する情報を送信するために、映像データや音声データ以外の余分なデータを送信する必要もない。
【発明の効果】
【0011】
以上のように、本発明によれば、SMPTE302M規格に準拠しつつ、音声チャネルのアクティベートに関する情報を、伝送装置から他の装置に送信することが可能である。これにより、受信側の装置において音声チャネルのアクティベートを把握し、無効チャネルにおいては無音データを出力することが可能となる。
【図面の簡単な説明】
【0012】
【図1】伝送システムの構成例を示す図である。
【図2】Embedded−Audioの音声制御パケットの構造を示す図である。
【図3】音声制御パケットの各構成の詳細を示す図である。
【図4】アクティブチャネルデータの詳細を示す図である。
【図5】SMPTE302M形式のPESデータの構成を示す図である。
【図6】SMPTE302M AES3 data Headerの構成を示す図である。
【図7】音声入力のチャネル組合せの具体例を示す図である。
【図8】伝送装置100における処理の流れを示すフロー図である。
【図9】受信装置200における処理の流れを示すフロー図である。
【発明を実施するための形態】
【0013】
以下、本発明の実施形態について、図面を参照しながら説明する。なお、以下の説明において参照する各図では、他の図と同等部分は同一符号によって示される。
【0014】
(伝送システムの構成)
図1は、本実施形態に係る伝送システムの構成例を示す図である。本実施形態に係る伝送システムは、伝送装置100と受信装置200とを含んで構成される。伝送装置100は、受信したHD−SDI信号から映像データおよび音声データを分離し、分離した映像データおよび音声データをMPEG−2TS形式に変換して受信装置200に送信する。
【0015】
また、受信装置200は、伝送装置100から受信するMPEG−2TS形式のデータから映像データおよび音声データを分離し、分離した映像データおよび音声データをHD−SDI信号に多重可能なEmbedded−Audioデータに変換する。
【0016】
なお、以下に説明する伝送装置100および受信装置200は、図示しないCPU(Central Processing Unit)、RAM(Random Access Memory)等のメモリ、ハードディスク等の記憶装置、ネットワークインターフェイス等の一般的なコンピュータの構成と同様の構成により実現される。また、伝送装置100および受信装置200の各構成の機能は、例えば、各装置のCPUがハードディスク等に記憶されているプログラムを読み出して実行することにより、もしくは、例えば、FPGA(Field Programmable Gate Array)においてシーケンサロジックをカスタム設計することに実現される機能である。また、映像データ、音声データ、音声制御パケット等の各データは、各装置のハードディスクやRAM等に記憶されるデータである。
【0017】
(伝送装置100の構成)
伝送装置100は、抽出部110と、映像データ変換部120と、音声データ変換部130と、送信部140と、を有する。
【0018】
抽出部110は、映像データと音声データとが多重化されたHD−SDI信号から映像データと音声データとを抽出する。本実施形態においては、抽出部110で受信するHD−SDI信号は、外部の装置から受信される信号であり、音声データであるEmbedded−Audioデータが多重化されている信号である。つまり、抽出部110は、HD−SDI信号から、映像データと、Embedded−Audioデータとを抽出する。
【0019】
映像データ変換部120は、抽出部110で抽出された映像データを、MPEG−2TS形式で多重化可能な形式の映像パケットデータに変換する。映像データ変換部120は、具体的には、映像ES処理部121において、抽出部110で抽出された映像データを任意のES(Elementary Stream)形式に変換する。
【0020】
ここで、「任意のES形式に変換する」とは、具体的には、例えばH.264圧縮符号化を行い、ES形式のデータ(以下、適宜、「映像ESデータ」という。)を生成することが該当する。そして、映像データ変換部120は、映像PES処理部122において、このESデータをMPEG−2 part1 System規格に準拠したPESデータ(以下、適宜、「映像PESデータ」という。)に変換する。
【0021】
音声データ変換部130は、抽出部110で抽出された音声データを、SMPTE302M形式の音声パケットデータに変換する。音声データ変換部130は、具体的には、音声ES処理部131において、抽出部110で抽出されたEmbedded−AudioデータをESデータ(以下、適宜、「音声ESデータ」という。)に変換する。
【0022】
また、この際、音声ES処理部131では、HD−SDI信号に多重化されているEmbedded−Audioの音声制御パケットに含まれているアクティブチャネルデータやサンプリングビット数などの情報が取得され、後段の音声PES処理部132に送出される。
【0023】
また、音声データ変換部130は、音声PES処理部132において、このESデータをパケット化してSMPTE302M規格に準拠したPESデータ(以下、適宜、「音声PESデータ」という。)に変換する。
【0024】
また、この際、音声データ変換部130の音声PES処理部132は、抽出部110で抽出された音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を、音声パケットデータの未使用領域に格納する。本実施形態においては、音声チャネル情報は、HD−SDI信号に多重化されているEmbedded−Audioの音声制御パケットに含まれるアクティブチャネルデータに基づいて生成された情報である。
【0025】
具体的には、本実施形態における音声チャネル情報は、HD−SDI信号に多重化されているEmbedded−Audioの音声制御パケットに含まれるアクティブチャネルデータであるUDW2の1〜4ビット目について、チャネルペアごとに論理和をとった値である。この点については、後に詳述する。
【0026】
また、伝送装置100は、音声チャネル情報を取得する音声チャネル情報取得部150をさらに有していてもよい。そして、音声データ変換部130は、音声チャネル情報取得部150において取得された音声チャネル情報の少なくとも一部を音声パケットデータ(例えば、音声PESデータ)の未使用領域に格納するようになっていてもよい。具体的には、例えば、外部の装置からの送信やユーザからの入力を受け付けること等によって、音声チャネル情報取得部150において音声チャネル情報を取得するようになっていてもよい。
【0027】
送信部140は、映像データ変換部120において変換された映像データ(例えば、映像PESデータ)と、音声データ変換部130において変換された音声データ(例えば、音声PESデータ)と、を多重化することでMPEG−2TS形式に変換して送信する。なお、映像PESデータと音声PESデータとを多重化してMPEG−2TS形式に変換する処理は、具体的には、TS−Mux処理部141において実行される。
【0028】
(受信装置200の構成)
受信装置200は、TS−Demux処理部211と、映像PES処理部221と、映像ES処理部222と、音声PES処理部231と、音声ES処理部232と、を有する。
【0029】
TS−Demux処理部211は、伝送装置100の送信部140から送信されるMPEG−2TS形式のデータにおいて多重化されている映像データおよび音声データを抽出する。TS−Demux処理部211は、具体的には、受信したMPEG−2TSデータから映像PESデータおよびSMPTE302M規格に準拠した音声PESデータを抽出する。
【0030】
映像PES処理部221は、TS−Demux処理部211で抽出された映像PESデータを映像ESデータに変換する。
【0031】
映像ES処理部222は、映像ESデータを、HD−SDI信号に多重可能な映像データ形式に変換する。「HD−SDI信号に多重可能な映像データ形式に変換する」とは、具体的には、例えば、H.264圧縮復号化を行うことが該当する。
【0032】
音声PES処理部231は、TS−Demux処理部211で抽出された音声PESデータを音声ESデータに変換する。
【0033】
音声ES処理部232は、音声PESデータ中に格納されている伝送チャネル数やサンプリングビット数を基にして、音声ESデータを、HD−SDI信号に多重可能な音声データ形式に変換する。「HD−SDI信号に多重可能な音声データ形式に変換する」とは、具体的には、例えば、Embedded−Audioデータに変換することが該当する。
【0034】
また、この際、音声ES処理部232は、TS−Demux処理部211において抽出された音声データから音声チャネル情報を抽出する。そして、抽出した音声チャネル情報に基づいて、音声データの出力の際に各チャネルが有効であるか無効であるかを判断するための情報である再生チャネル情報を、HD−SDI信号に多重可能なパケットであって、音声データについての制御パケット(例えば、Embedded−Audioの音声制御パケット)に格納する。なお、再生チャネル情報の決定方法については、後に詳述する。
【0035】
また、受信装置200は、映像ES処理部222および音声ES処理部232においてそれぞれ変換された映像データおよび音声データをHD−SDI信号に多重化して他の装置に送信する。
【0036】
(伝送装置100の動作)
ここで、本発明の特徴である伝送装置100の音声データ変換部130における動作について説明する。
【0037】
本実施形態において、音声データ変換部130にて音声PESデータの未使用領域に格納される音声チャネル情報は、HD−SDI信号に多重されたEmbedded−Audioの音声制御パケットに格納されているアクティブチャネルデータに基づいて生成される。
【0038】
図2は、Embedded−Audioの音声制御パケットの構造を示す図である。なお、Embedded−Audioの音声制御パケットについては、ARIB−STD BTA S−006B規格およびSMPTE299規格に規定されているので、ここでは簡単に説明する。
【0039】
Embedded−Audioの音声制御パケットは、「ADF」、「DID」、「DBN」、「DC」、「UDW」、「CS」の各データで構成されている。図3は、音声制御パケットの各構成の詳細を示す図である。
【0040】
「ADF」は、補助データフラグと呼ばれ、音声制御パケットの開始を示すデータである。また、ADFは、“000h”、“3FFh”、“3FFh”の連続する3ワードで構成するユニーク・コードである。
【0041】
「DID」は、データ識別ワードと呼ばれ、この値によって後述するUDWの種類が示される。なお、Embedded−Audioの音声制御パケットでは、音声グループごとにユニーク・コードが割り当てられている。例えば、音声グループ1(チャネル1〜4)にはDID=“1E3h”が、音声グループ2(チャネル5〜8)にはDID=“2E2h”が、割り当てられている。
【0042】
「DBN」は、データブロック番号ワードと呼ばれ、同一DIDを有する音声制御パケットの順番を示すが、未使用でもよい。なお、Embedded−Audioの音声制御パケットでは、“200h”(未使用)にすることになっている。
【0043】
「DC」は、データカウントワードと呼ばれ、後述する「UDW」のワード数を示す。また、「CS」は、チェックサムワードと呼ばれる。CSの値は、DIDからUDWに含まれる最後のワードまでの下位9ビットの総和における下位9ビットである。
【0044】
「UDW」は、ユーザデータワードと呼ばれ、Embedded−Audioデータの制御情報が格納されている。音声制御パケットにおいては、UDWは11ワードの固定長である。なお、非特許文献1においては、UDWの11ワードは、パケットの先頭からUDW0、UDW1、・・・UDW9、UDW10と表記されている(本明細書中においても同様とする)。また、各音声チャネルのアクティベートを示すアクティブチャネルデータは、「UDW」のUDW2(すなわち、「UDW」の3ワード目)に格納されている。
【0045】
図4は、アクティブチャネルデータの詳細を示す図である。上述したように、アクティブチャネルデータは、「UDW」のUDW2に格納されている。また、図4に示されるb0〜b3(UDW2の1〜4ビット目)の4ビットによって、各チャネルが有効であるか無効であるか(アクティベート)が示される。各チャネルが有効である場合にはビットb0〜b3の値は“1”に設定され、各チャネルが無効である場合にはビットb0〜b3の値は“0”に設定される。
【0046】
具体的には、ビットb0はチャネル1(もしくはチャネル5)のアクティベートを表し、ビットb1はチャネル2(もしくはチャネル6)のアクティベートを表す。また、ビットb2はチャネル3(もしくはチャネル7)のアクティベートを表し、ビットb3はチャネル4(もしくはチャネル8)のアクティベートを表す。
【0047】
ここで、本実施形態の伝送装置100の音声データ変換部130は、このアクティブチャネルデータのb0〜b3を利用して、音声データの各チャネルが有効であるか無効であるかを示す音声チャネル情報を、音声パケットデータ(音声PESデータ)の未使用領域に格納する。
【0048】
図5を用いて音声パケットデータ(音声PESデータ)の未使用領域について詳細に説明する。図5は、SMPTE302M形式のPESデータの構成を示す図である。なお、このSMPTE302M形式については、ISO/IEC13818−1にて規定されているので、ここでは簡単に説明する。
【0049】
「MPEG−2 PES Header」は、MPEG−2 part1 System規格に準じた構成をとる。また、「SMPTE302M AES3 data Payload」は、実際の音声データそのものが格納される領域である。
【0050】
また、「SMPTE302M AES3 data Header」は、図6に示すような構成をとる。「audio_packet_size」は、図5の「SMPTE302M AES3 Payload」のデータ数(バイト)を16ビットで表したものである。「number_channels」は、伝送する音声のチャンネル数を2ビットで表したものである。
【0051】
「channel_identification」は、伝送する音声の全チャネルに対し、音声PESデータが先頭チャネルの何番目のチャネルで伝送される音声PESデータであるかを8ビットで表すものである。「bits_per_sample」は、伝送する音声のサンプリングビット数を2ビットで表すものである。
【0052】
「alignment bits」は、SMPTE302M AES3 data Headerの長さを調整する(バイト・アライメント)のための未使用領域であり、長さは4ビットである。SMPTE302M規格では“0000b”を格納することになっているが、本実施形態では、この未使用領域であるalignment bitsに、音声チャネル情報が格納される。
【0053】
また、本実施形態では、この音声チャネル情報として、図4に示されるアクティブチャネルデータのビットb0〜b3についてチャネルペアごとに論理和をとったものを採用する。すなわち、「alignment bits」の各ビットd0〜d3は、以下のように決定される。

alignment bits d3=「グループ2のb2(CH7)」or「グループ2のb3(CH8)」
alignment bits d2=「グループ2のb0(CH5)」or「グループ2のb1(CH6)」
alignment bits d1=「グループ1のb2(CH3)」or「グループ1のb3(CH4)」
alignment bits d0=「グループ1のb0(CH1)」or「グループ1のb1(CH2)」

ここで、「チャネルペア」とは、通常、ステレオ音声の伝送に用いられる2つのチャンネルのペアである。このようにチャネルペアの4ビットとしたのは、近年のテレビ放送やIPTV(Internet Protocol Television)などのサービスにおいてモノラル音声による運用は皆無に等しく、実際の運用ではチャネルペアの運用が大多数であるためであり、実用上、問題になることは無いと思われるからである。
【0054】
上記のようにalignment bitsの4ビットをチャネルペアごとにアクティブであるか否かを示す情報として使用することで、図7に示されるような音声入力のチャネル組合せにおいて、受信側の装置では、どのチャネルが無効チャネルかを認識することが可能となる。以下、図7について、より詳細に説明する。
【0055】
図7において、「音声入力」は、実際の音声入力における各チャネルのアクティベートを示す。数字が表記されているチャネルは有効となっているチャネルであり、“×”が表記されているチャネルは無効となっているチャネル(すなわち、音声が出力されないチャネル)である。例えば、“××345678”は、チャネル1と2は無効チャネルであり、チャネル3〜8は有効チャネルであることを表す。
【0056】
また、図7における「従来方式」は、実際の音声入力の各チャネルのアクティベーションが「音声入力」で示される状態であった場合に、従来の音声出力方式において、各チャネルのアクティベーションがどのように判断されるかを示すものである。例えば、音声入力の各チャネルのアクティベートが“××345678”である場合、従来の音声出力方式(図7の「従来方式」)では、音声出力時に、“△△345678”(△は有効チャネルと認識されるチャネル)と判断される。よって、チャネル1および2においてはノイズデータが出力されてしまう。
【0057】
これに対し、本実施形態に係る伝送装置100では、SMPTE302M規格に準拠したPESデータのalignment bitsのデータ領域に、図7の「alignment bits」に示されるようなビットd0〜d3が格納される。なお、ビットd0〜d3の値は、上述したように、Embedded−Audio音声制御パケット中のアクティブチャネルデータのビットb0〜b3についてチャネルペアごとに論理和をとったものである。例えば、音声入力の各チャネルのアクティベートが“××345678”である場合、音声PESデータのalignment bitsのデータ領域には、“0111”の値が格納される。そして、この音声PESデータは、映像PESデータと多重化されて送信部140から受信装置200に送信される。
【0058】
そして、この音声PESデータを受信する受信装置200では、TS−Demux処理部211、音声PES処理部231、音声ES処理部232を経て、音声ESデータがEmbedded−Audioデータに変換される。この時、Embedded−Audioの音声制御パケットには、音声データの出力の際に各チャネルが有効であるか無効であるかを判断するための再生チャネル情報が格納されるが、この再生チャネル情報は、以下のようにして決定される。
【0059】
図7の「本発明」は、実際の音声入力の各チャネルのアクティベーションが「音声入力」で示される状態であった場合の再生チャネル情報の内容を示す。例えば、伝送装置100から送信された音声PESデータのalignment bitsのビットd0〜d3の値が“0111”であった場合、ビットd0の値が“0”であることから、チャネル1と2のアクティベーションは“0”、すなわち、無効チャネルであると判断する。また、ビットd1、d2、d3の値が“1”であることから、チャネル3と4、チャネル5と6、チャネル7と8のアクティベーションは“1”、すなわち、有効チャネルであると判断する(図7の「本発明」では、“○○345678”(○は無効チャネル)と表記)。
【0060】
よって、受信装置200の音声ES処理部232では、音声グループ1の音声制御パケット(DID=“1E3h”である音声制御パケット)に格納する再生チャネル情報の値は“0011”と決定される。また、音声グループ2の音声制御パケット(DID=“2E2h”である音声制御パケット)に格納する再生チャネル情報の値は“1111”と決定される。そして、これらの再生チャネル情報は、各音声制御パケットのUDW2のビットb0〜b3の値として格納される。
【0061】
これにより、本実施形態に係る伝送システムによれば、受信装置200からHD−SDI信号を受信して再生する音声再生装置等においては、無効チャネルについては無音データを出力することで、音声を聞いているユーザにノイズなどを聞かせて不快感を与えることを防止することができる。
【0062】
(受信装置200の動作)
伝送装置100の送信部140では、音声データ変換部130で音声チャネル情報が格納されて生成された音声PESデータが、映像データ変換部120で生成された映像PESデータとともに多重化されてMPEG−2TS形式に変換された後、受信装置200に送信される。そして、受信装置200では、TS−Demux処理部211において音声PESデータがMPEG−2TSデータから抽出された後、音声PES処理部231において、音声PESデータが音声ESデータ(SMPTE302M PESパケット)に変換される。
【0063】
さらに、受信装置200の音声ES処理部232において音声ESデータをEmbedded−Audioデータに変換する際、音声PESデータの「alignment bits」に格納されていた4ビットの音声チャネル情報に基づいて、再生チャネル情報が決定される。そして、決定された再生チャネル情報の値が、Embedded−Audioデータのアクティブチャネルデータ(UDW2)のb0〜b3の値として格納される。また、この時、UDW2のビットb4〜b7(5〜8ビット目)には“0”が格納される。また、UDW2のビットb8(9ビット目)にはビットb0〜b7に対する偶数パリティビットが格納され、ビットb9(10ビット目)にはビットb8の反転ビットが格納される。
【0064】
(伝送装置100の処理フロー)
図8は、伝送装置100における処理の流れを示すフロー図である。
【0065】
抽出部110において、HD−SDI信号が受信される(ステップS101)。さらに、受信されたHD−SDI信号から映像データおよび音声データ(Embedded−Audioデータ)が抽出される(ステップS102)。
【0066】
ステップS102で抽出された映像データは、映像データ変換部120の映像ES処理部121において、H.264圧縮符号化が行われることで映像ESデータに変換される(ステップS103)。さらに、映像データ変換部120の映像PES処理部122において、映像ESデータがMPEG−2 part1 System規格に準拠した映像PESデータに変換される(ステップS104)。
【0067】
一方で、ステップS102で抽出された音声データは、音声データ変換部130の音声ES処理部131において音声ESデータに変換される(ステップS105)。さらに、この音声ESデータは、音声データ変換部130の音声PES処理部132において音声PESデータに変換される(ステップS106)。
【0068】
そして、音声データ変換部130の音声PES処理部132において、HD−SDI信号に多重化されている音声制御パケットのアクティブチャネルデータの一部(UDW2のビットb0〜b3)が抽出され、チャネルペアごとの論理和が算出され、この算出結果が音声チャネル情報として音声PESデータの「alignment bits」に格納される(ステップS107)。
【0069】
最後に、送信部140のTS−Mux処理部141において、映像PESデータと音声PESデータとが多重化されてMPEG−2TS形式に変換され、受信装置200に送信される(ステップS108)。
【0070】
(受信装置200の処理フロー)
図9は、受信装置200における処理の流れを示すフロー図である。
【0071】
TS−Demux処理部211において、MPEG−2TSデータが受信される(ステップS201)。そして、受信されたMPEG−2TSデータから映像PESデータおよび音声PESデータが抽出される(ステップS202)。
【0072】
映像PES処理部221において、映像PESデータが映像ESデータに変換される(ステップS203)。そして、映像ES処理部222において、映像ESデータについてH.264圧縮復号化が実行されることにより、映像ESデータがHD−SDI信号に多重可能な形式に変換される(ステップS204)。
【0073】
一方で、音声PES処理部231において、音声PESデータの「alignment bits」から音声チャネル情報が抽出される(ステップS205)。そして、音声PES処理部231において、音声PESデータが音声ESデータに変換される(ステップS206)。
【0074】
さらに、音声ES処理部232において、この音声ESデータがHD−SDI信号に多重可能な形式(Embedded−Audio形式)に変換される(ステップS207)。この際、Embedded−Audio音声制御パケットのアクティブチャネルデータであるUDW2のb0〜b3には、ステップS205で抽出された音声チャネル情報の4ビット(d0〜d3)に基づいて各チャネルのアクティベートを示す値が格納される(ステップS208)。
【0075】
すなわち、図7に示されるように、ビットd0〜d3の値によって各チャネルのアクティベートが判断されて、音声制御パケットのUDW2のb0〜b3の値が決定される。なお、図4に示されるように、アクティブチャネルデータであるUDW2のビットb4〜b7(5〜8ビット目)には“0”が格納される。また、UDW2のビットb8(9ビット目)にはビットb0〜b7に対する偶数パリティビットが格納され、ビットb9(10ビット目)にはビットb8の反転ビットが格納される。
【0076】
そして、映像データ、音声データ、および音声制御パケットがHD−SDI信号に多重化されて外部の再生装置等に送信される(ステップS209)。
【0077】
以上のように、伝送装置において、従来では音声PESデータにおいて未定義となっている領域に音声チャネル情報を格納して伝送することで、チャネルペアごとのアクティベートを受信側の装置にて認識し、無効チャネルについては、ユーザの確認動作を要せずに自動的に無音出力することが可能となる。
【0078】
また、本実施形態の伝送装置によれば、SMPTE規格やARIB規格等に準じたHD−SDI信号への音声データ多重方式、および非圧縮音声のPESデータ化に則している。従って、従来のMPEG−2TS方式に準じた伝送装置や受信装置での互換性が損なわれることがなく、従来の伝送装置や受信装置に適用可能である。
【0079】
なお、上記の実施形態においては、受信装置200においてはMPEG2−TSデータから抽出された映像データと音声データとがHD−SDI信号に多重化されて外部の再生装置等に出力されることとしているが、受信装置200において映像データと音声データとが再生出力されるようになっていてもよい。
【0080】
(付記)
以上に、本発明に係る実施形態について詳細に説明したことからも明らかなように、上述の実施形態の一部または全部は、以下の各付記のようにも記載することができる。しかしながら、以下の各付記は、あくまでも、本発明の単なる例示に過ぎず、本発明は、かかる場合のみに限るものではない。
【0081】
(付記1)
映像データと音声データとが多重化されたHD−SDI信号から前記映像データと前記音声データとを抽出する抽出手段と、
前記映像データを、MPEG−2TS形式で多重化可能な形式の映像パケットデータに変換する映像データ変換手段と、
前記音声データを、SMPTE302M形式の音声パケットデータに変換する音声データ変換手段と、
前記映像パケットデータと前記音声パケットデータとを多重化することでMPEG−2TS形式に変換して送信する送信手段と、を有し、
前記音声データ変換手段は、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納して、SMPTE302M形式の音声パケットデータに変換することを特徴とする伝送装置。
【0082】
(付記2)
前記音声チャネル情報は、前記HD−SDI信号に多重化されているEmbedded−Audioの音声制御パケットに含まれるアクティブチャネルデータに基づいて生成される情報であることを特徴とする付記1に記載の伝送装置。
【0083】
この構成によれば、例えば、HD−SDI信号に多重化されている音声制御パケットに含まれているアクティブチャネルデータを利用して、SMPTE302M規格に準拠しつつ、各音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することが可能である。
【0084】
(付記3)
前記音声チャネル情報は、前記HD−SDI信号に多重化されているEmbedded−Audioの音声制御パケットに含まれるアクティブチャネルデータであるUDW2の1〜4ビット目について、チャネルペアごとに論理和をとった値で構成されることを特徴とする付記2に記載の伝送装置。
【0085】
この構成によれば、例えば、HD−SDI信号に多重化されている音声制御パケットに含まれているアクティブチャネルデータを利用して、SMPTE302M規格に準拠しつつ、各音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することが可能である。
【0086】
(付記4)
前記音声チャネル情報を取得する音声チャネル情報取得手段をさらに有し、
前記音声データ変換手段は、前記音声チャネル情報取得手段において取得された音声チャネル情報の少なくとも一部を前記音声パケットデータの未使用領域に格納することを特徴とする付記1に記載の伝送装置。
【0087】
この構成によれば、伝送装置は、外部の装置や伝送装置のユーザの入力から音声チャネル情報を取得し、その音声チャネル情報の少なくとも一部を音声パケットの未使用領域に格納して他の装置に送信することが可能である。
【0088】
(付記5)
映像データと音声データとが多重化されたMPEG−2TS形式のデータであって前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報が前記音声データの一部に格納されているMPEG2−TS形式のデータを受信する受信装置であって、
前記MPEG−2TS形式データから前記映像データと前記音声データとを抽出するTS処理手段(例えば、図1のTS−Demux処理部211)と、
前記映像データを、HD−SDI(Serial Digital Interface)信号に多重化可能な形式の映像データに変換する映像データ処理手段(例えば、図1の映像PES処理部(受信側)221および映像ES処理部(受信側)222)と、
前記音声データを、HD−SDI信号に多重化可能な形式の音声データに変換する音声データ処理手段(例えば、図1の音声PES処理部(受信側)231および音声ES処理部(受信側)232)と、を有し、
前記音声データ処理手段は、前記TS処理手段において抽出された前記音声データから前記音声チャネル情報を抽出し、抽出した前記音声チャネル情報に基づいて、前記音声データの出力の際に各チャネルが有効であるか無効であるかを判断するための情報である再生チャネル情報を、HD−SDI信号に多重可能なパケットであって、前記音声データについての制御パケット(例えば、図2に示される音声制御パケット)に格納することを特徴とする受信装置。
【0089】
この構成によれば、例えば、MPEG2−TSデータに多重化されている映像データと音声データとをHD−SDI信号によって受信装置から受信する他の装置において、無効チャネルについては、ユーザの確認動作を要せずに自動的に無音出力することが可能となる。
【0090】
(付記6)
映像データと音声データとが多重化されたHD−SDI(Serial Digital Interface)信号から前記映像データと前記音声データとを抽出する抽出ステップ(例えば、図8のステップS101〜S102)と、
前記映像データを、MPEG(Moving Picture Experts Group)−2TS(Transport Stream)形式で多重化可能な形式の映像パケットデータに変換する映像データ変換ステップ(例えば、図8のステップS103〜S104)と、
前記音声データを、SMPTE(Society of Motion Picture and Television Engineers)302M形式の音声パケットデータに変換する音声データ変換ステップ(例えば、図8のステップS105〜S106)と、
前記映像パケットデータと前記音声パケットデータとを多重化することでMPEG−2TS形式に変換して送信する送信ステップ(例えば、図8のステップS108)と、を有し、
前記音声データ変換ステップにおいて、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納すること(例えば、図8のステップS107)を特徴とする伝送方法。
【0091】
この構成によれば、SMPTE302M規格に準拠しつつ、音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することができる。これにより、受信側の装置では音声チャネルのアクティベートを把握し、人間の確認動作を必要とせずに無効チャネルにおいて無音データを出力することが可能となる。また、音声チャネルのアクティベートに関する情報を送信するために、音声データ以外の余分なデータを送信する必要もない。
【符号の説明】
【0092】
100 伝送装置
110 抽出部
120 映像データ変換部
121 映像ES処理部(送信側)
122 映像PES処理部(送信側)
130 音声データ変換部
131 音声ES処理部(送信側)
132 音声PES処理部(送信側)
140 送信部
141 TS−Mux処理部
150 音声チャネル情報取得部
200 受信装置
211 TS−Demux処理部
221 映像PES処理部(受信側)
222 映像ES処理部(受信側)
231 音声PES処理部(受信側)
232 音声ES処理部(受信側)

【特許請求の範囲】
【請求項1】
映像データと音声データとが多重化されたHD−SDI(Serial Digital Interface)信号から前記映像データと前記音声データとを抽出する抽出手段と、
前記映像データを、MPEG(Moving Picture Experts Group)−2TS(Transport Stream)形式で多重化可能な形式の映像パケットデータに変換する映像データ変換手段と、
前記音声データを、SMPTE(Society of Motion Picture and Television Engineers)302M形式の音声パケットデータに変換する音声データ変換手段と、
前記映像パケットデータと前記音声パケットデータとを多重化することでMPEG−2TS形式に変換して送信する送信手段と、を有し、
前記音声データ変換手段は、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納して、SMPTE302M形式の音声パケットデータに変換することを特徴とする伝送装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−95175(P2012−95175A)
【公開日】平成24年5月17日(2012.5.17)
【国際特許分類】
【出願番号】特願2010−241804(P2010−241804)
【出願日】平成22年10月28日(2010.10.28)
【出願人】(000001122)株式会社日立国際電気 (5,007)
【Fターム(参考)】