伝送装置

【課題】ＳＭＰＴＥ３０２Ｍ規格では、ＨＤ−ＳＤＩ信号に多重化されている音声データの各チャネルが有効であるか無効であるかを示す情報を、映像データおよび音声データとともに伝送することについては規定されていない。つまり、ＭＰＥＧ−２ＴＳデータを受信する受信装置等では音声データの各チャネルが有効であるか無効であるかを把握することができず、無効チャネルからノイズデータが出力されるという問題があった。
【解決手段】ＨＤ−ＳＤＩ信号に多重化されている映像データと音声データとをＭＰＥＧ−２ＴＳデータに多重化するために、音声データをＳＭＰＴＥ３０２Ｍ形式の音声パケットデータに変換する。この時、音声データの各チャネルが有効であるか無効であるかを示す音声チャネル情報を音声パケットデータの未使用領域に格納する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、映像データと音声データとを多重して伝送する伝送装置に関する。
【背景技術】
【０００２】
従来、映像データと音声データとを多重化して送信するための規格として、ＭＰＥＧ（Moving Picture Experts Group）が存在する。また、ビデオカメラ等のＨＤ（High Definition）映像を伝送するためのＨＤ−ＳＤＩ（Serial Digital Interface）信号にＡＥＳ（Audio Engineering Society）音声を多重化するための規格として、ＡＲＩＢ（社団法人電波産業会：Association of Radio Industries and Businesses）が定めたＡＲＩＢ−ＳＴＤＢＴＡＳ−００６Ｂ（非特許文献１）、およびＳＭＰＴＥ（米国映画テレビ技術者協会：Society of Motion Picture and Television Engineers）が定めたＳＭＰＴＥ２９９Ｍ規格が存在する。
【０００３】
また、ＨＤ−ＳＤＩ信号には、例えばＥｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケット中に含まれるアクティブチャネルデータのように各音声チャネルが有効となっているか無効となっているかの設定（以下、適宜「アクティベート」という）を示す情報が多重化されている。
【先行技術文献】
【非特許文献】
【０００４】
【非特許文献１】社団法人電波産業会、「１１２５／６０方式ＨＤＴＶビット直列インタフェースにおけるデジタル音声規格標準規格ＢＴＡＳ−００６Ｂ」、１１２５／６０方式スタジオシステム標準規格、平成１０年３月１７日、ｐ．１３３−１６０
【発明の概要】
【発明が解決しようとする課題】
【０００５】
ところで、ＨＤ−ＳＤＩ信号に多重化されている非圧縮音声であるＡＥＳ音声をＭＰＥＧ−２ｐａｒｔ１Ｓｙｓｔｅｍ規格に準拠したＭＰＥＧ−２ＴｒａｎｓｐｏｒｔＳｔｒｅａｍ形式（以下、「ＭＰＥＧ−２ＴＳ」という）で伝送する場合、通常はＳＭＰＴＥ３０２Ｍ規格に準拠したＰａｃｋｅｔｉｚｅｄＥｌｅｍｅｎｔａｒｙＳｔｒｅａｍ（以下、「ＰＥＳ」という）で伝送する。
【０００６】
しかしながら、この規格では、ＨＤ−ＳＤＩ信号に多重化されている音声チャネルのアクティベートを示す情報を伝送することについては規定されていない。つまり、通常、ＭＰＥＧ−２ＴＳデータを受信する受信装置等では、どの音声チャネルがアクティブ（有効）となっているのかを把握することはできない。このため、無音化（ミュート）されていない音声データが無効チャネルで入力された場合、受信側の無効チャネルからノイズが出力される等の問題が起こっていた。
【０００７】
よって、従来では、受信装置等において一旦音声を再生して、ユーザがノイズか否かを確認するという人間の確認動作が必要であった。もしくは音声データとは異なるＰＩＤ（パケット識別子：Packet Identifier）のＴＳパケットを用いて音声のアクティベーションを示す情報を伝送しなければならなかった。
【０００８】
そこで、本発明は上記課題を解決し、ＳＭＰＴＥ３０２Ｍ規格に準拠しつつ、伝送データの受信側において、音声チャネルのアクティベートを把握して無効チャネルにおける無音データの出力を可能とする伝送装置を提供することを目的とする。
【課題を解決するための手段】
【０００９】
上記課題を解決するために、本発明は、映像データと音声データとが多重化されたＨＤ−ＳＤＩ信号から前記映像データと前記音声データとを抽出する抽出手段と、前記映像データを、ＭＰＥＧ−２ＴＳ形式で多重化可能な形式の映像パケットデータに変換する映像データ変換手段と、前記音声データを、ＳＭＰＴＥ３０２Ｍ形式の音声パケットデータに変換する音声データ変換手段と、前記映像パケットデータと前記音声パケットデータとを多重化することでＭＰＥＧ−２ＴＳ形式に変換して送信する送信手段と、を有し、前記音声データ変換手段は、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納して、ＳＭＰＴＥ３０２Ｍ形式の音声パケットデータに変換することを特徴とする伝送装置を提案する。
【００１０】
この構成によれば、ＳＭＰＴＥ３０２Ｍ規格に準拠しつつ、音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することができる。これにより、受信側の装置では音声チャネルのアクティベートを把握し、人間の確認動作を必要とせずに無効チャネルにおいて無音データを出力することが可能となる。よって、従来問題となっていたノイズの発生を防止することができる。また、音声チャネルのアクティベートに関する情報を送信するために、映像データや音声データ以外の余分なデータを送信する必要もない。
【発明の効果】
【００１１】
以上のように、本発明によれば、ＳＭＰＴＥ３０２Ｍ規格に準拠しつつ、音声チャネルのアクティベートに関する情報を、伝送装置から他の装置に送信することが可能である。これにより、受信側の装置において音声チャネルのアクティベートを把握し、無効チャネルにおいては無音データを出力することが可能となる。
【図面の簡単な説明】
【００１２】
【図１】伝送システムの構成例を示す図である。
【図２】Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットの構造を示す図である。
【図３】音声制御パケットの各構成の詳細を示す図である。
【図４】アクティブチャネルデータの詳細を示す図である。
【図５】ＳＭＰＴＥ３０２Ｍ形式のＰＥＳデータの構成を示す図である。
【図６】ＳＭＰＴＥ３０２ＭＡＥＳ３ｄａｔａＨｅａｄｅｒの構成を示す図である。
【図７】音声入力のチャネル組合せの具体例を示す図である。
【図８】伝送装置１００における処理の流れを示すフロー図である。
【図９】受信装置２００における処理の流れを示すフロー図である。
【発明を実施するための形態】
【００１３】
以下、本発明の実施形態について、図面を参照しながら説明する。なお、以下の説明において参照する各図では、他の図と同等部分は同一符号によって示される。
【００１４】
（伝送システムの構成）
図１は、本実施形態に係る伝送システムの構成例を示す図である。本実施形態に係る伝送システムは、伝送装置１００と受信装置２００とを含んで構成される。伝送装置１００は、受信したＨＤ−ＳＤＩ信号から映像データおよび音声データを分離し、分離した映像データおよび音声データをＭＰＥＧ−２ＴＳ形式に変換して受信装置２００に送信する。
【００１５】
また、受信装置２００は、伝送装置１００から受信するＭＰＥＧ−２ＴＳ形式のデータから映像データおよび音声データを分離し、分離した映像データおよび音声データをＨＤ−ＳＤＩ信号に多重可能なＥｍｂｅｄｄｅｄ−Ａｕｄｉｏデータに変換する。
【００１６】
なお、以下に説明する伝送装置１００および受信装置２００は、図示しないＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）等のメモリ、ハードディスク等の記憶装置、ネットワークインターフェイス等の一般的なコンピュータの構成と同様の構成により実現される。また、伝送装置１００および受信装置２００の各構成の機能は、例えば、各装置のＣＰＵがハードディスク等に記憶されているプログラムを読み出して実行することにより、もしくは、例えば、ＦＰＧＡ（Field Programmable Gate Array）においてシーケンサロジックをカスタム設計することに実現される機能である。また、映像データ、音声データ、音声制御パケット等の各データは、各装置のハードディスクやＲＡＭ等に記憶されるデータである。
【００１７】
（伝送装置１００の構成）
伝送装置１００は、抽出部１１０と、映像データ変換部１２０と、音声データ変換部１３０と、送信部１４０と、を有する。
【００１８】
抽出部１１０は、映像データと音声データとが多重化されたＨＤ−ＳＤＩ信号から映像データと音声データとを抽出する。本実施形態においては、抽出部１１０で受信するＨＤ−ＳＤＩ信号は、外部の装置から受信される信号であり、音声データであるＥｍｂｅｄｄｅｄ−Ａｕｄｉｏデータが多重化されている信号である。つまり、抽出部１１０は、ＨＤ−ＳＤＩ信号から、映像データと、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏデータとを抽出する。
【００１９】
映像データ変換部１２０は、抽出部１１０で抽出された映像データを、ＭＰＥＧ−２ＴＳ形式で多重化可能な形式の映像パケットデータに変換する。映像データ変換部１２０は、具体的には、映像ＥＳ処理部１２１において、抽出部１１０で抽出された映像データを任意のＥＳ（Elementary Stream）形式に変換する。
【００２０】
ここで、「任意のＥＳ形式に変換する」とは、具体的には、例えばＨ．２６４圧縮符号化を行い、ＥＳ形式のデータ（以下、適宜、「映像ＥＳデータ」という。）を生成することが該当する。そして、映像データ変換部１２０は、映像ＰＥＳ処理部１２２において、このＥＳデータをＭＰＥＧ−２ｐａｒｔ１Ｓｙｓｔｅｍ規格に準拠したＰＥＳデータ（以下、適宜、「映像ＰＥＳデータ」という。）に変換する。
【００２１】
音声データ変換部１３０は、抽出部１１０で抽出された音声データを、ＳＭＰＴＥ３０２Ｍ形式の音声パケットデータに変換する。音声データ変換部１３０は、具体的には、音声ＥＳ処理部１３１において、抽出部１１０で抽出されたＥｍｂｅｄｄｅｄ−ＡｕｄｉｏデータをＥＳデータ（以下、適宜、「音声ＥＳデータ」という。）に変換する。
【００２２】
また、この際、音声ＥＳ処理部１３１では、ＨＤ−ＳＤＩ信号に多重化されているＥｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットに含まれているアクティブチャネルデータやサンプリングビット数などの情報が取得され、後段の音声ＰＥＳ処理部１３２に送出される。
【００２３】
また、音声データ変換部１３０は、音声ＰＥＳ処理部１３２において、このＥＳデータをパケット化してＳＭＰＴＥ３０２Ｍ規格に準拠したＰＥＳデータ（以下、適宜、「音声ＰＥＳデータ」という。）に変換する。
【００２４】
また、この際、音声データ変換部１３０の音声ＰＥＳ処理部１３２は、抽出部１１０で抽出された音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を、音声パケットデータの未使用領域に格納する。本実施形態においては、音声チャネル情報は、ＨＤ−ＳＤＩ信号に多重化されているＥｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットに含まれるアクティブチャネルデータに基づいて生成された情報である。
【００２５】
具体的には、本実施形態における音声チャネル情報は、ＨＤ−ＳＤＩ信号に多重化されているＥｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットに含まれるアクティブチャネルデータであるＵＤＷ２の１〜４ビット目について、チャネルペアごとに論理和をとった値である。この点については、後に詳述する。
【００２６】
また、伝送装置１００は、音声チャネル情報を取得する音声チャネル情報取得部１５０をさらに有していてもよい。そして、音声データ変換部１３０は、音声チャネル情報取得部１５０において取得された音声チャネル情報の少なくとも一部を音声パケットデータ（例えば、音声ＰＥＳデータ）の未使用領域に格納するようになっていてもよい。具体的には、例えば、外部の装置からの送信やユーザからの入力を受け付けること等によって、音声チャネル情報取得部１５０において音声チャネル情報を取得するようになっていてもよい。
【００２７】
送信部１４０は、映像データ変換部１２０において変換された映像データ（例えば、映像ＰＥＳデータ）と、音声データ変換部１３０において変換された音声データ（例えば、音声ＰＥＳデータ）と、を多重化することでＭＰＥＧ−２ＴＳ形式に変換して送信する。なお、映像ＰＥＳデータと音声ＰＥＳデータとを多重化してＭＰＥＧ−２ＴＳ形式に変換する処理は、具体的には、ＴＳ−Ｍｕｘ処理部１４１において実行される。
【００２８】
（受信装置２００の構成）
受信装置２００は、ＴＳ−Ｄｅｍｕｘ処理部２１１と、映像ＰＥＳ処理部２２１と、映像ＥＳ処理部２２２と、音声ＰＥＳ処理部２３１と、音声ＥＳ処理部２３２と、を有する。
【００２９】
ＴＳ−Ｄｅｍｕｘ処理部２１１は、伝送装置１００の送信部１４０から送信されるＭＰＥＧ−２ＴＳ形式のデータにおいて多重化されている映像データおよび音声データを抽出する。ＴＳ−Ｄｅｍｕｘ処理部２１１は、具体的には、受信したＭＰＥＧ−２ＴＳデータから映像ＰＥＳデータおよびＳＭＰＴＥ３０２Ｍ規格に準拠した音声ＰＥＳデータを抽出する。
【００３０】
映像ＰＥＳ処理部２２１は、ＴＳ−Ｄｅｍｕｘ処理部２１１で抽出された映像ＰＥＳデータを映像ＥＳデータに変換する。
【００３１】
映像ＥＳ処理部２２２は、映像ＥＳデータを、ＨＤ−ＳＤＩ信号に多重可能な映像データ形式に変換する。「ＨＤ−ＳＤＩ信号に多重可能な映像データ形式に変換する」とは、具体的には、例えば、Ｈ．２６４圧縮復号化を行うことが該当する。
【００３２】
音声ＰＥＳ処理部２３１は、ＴＳ−Ｄｅｍｕｘ処理部２１１で抽出された音声ＰＥＳデータを音声ＥＳデータに変換する。
【００３３】
音声ＥＳ処理部２３２は、音声ＰＥＳデータ中に格納されている伝送チャネル数やサンプリングビット数を基にして、音声ＥＳデータを、ＨＤ−ＳＤＩ信号に多重可能な音声データ形式に変換する。「ＨＤ−ＳＤＩ信号に多重可能な音声データ形式に変換する」とは、具体的には、例えば、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏデータに変換することが該当する。
【００３４】
また、この際、音声ＥＳ処理部２３２は、ＴＳ−Ｄｅｍｕｘ処理部２１１において抽出された音声データから音声チャネル情報を抽出する。そして、抽出した音声チャネル情報に基づいて、音声データの出力の際に各チャネルが有効であるか無効であるかを判断するための情報である再生チャネル情報を、ＨＤ−ＳＤＩ信号に多重可能なパケットであって、音声データについての制御パケット（例えば、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケット）に格納する。なお、再生チャネル情報の決定方法については、後に詳述する。
【００３５】
また、受信装置２００は、映像ＥＳ処理部２２２および音声ＥＳ処理部２３２においてそれぞれ変換された映像データおよび音声データをＨＤ−ＳＤＩ信号に多重化して他の装置に送信する。
【００３６】
（伝送装置１００の動作）
ここで、本発明の特徴である伝送装置１００の音声データ変換部１３０における動作について説明する。
【００３７】
本実施形態において、音声データ変換部１３０にて音声ＰＥＳデータの未使用領域に格納される音声チャネル情報は、ＨＤ−ＳＤＩ信号に多重されたＥｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットに格納されているアクティブチャネルデータに基づいて生成される。
【００３８】
図２は、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットの構造を示す図である。なお、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットについては、ＡＲＩＢ−ＳＴＤＢＴＡＳ−００６Ｂ規格およびＳＭＰＴＥ２９９規格に規定されているので、ここでは簡単に説明する。
【００３９】
Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットは、「ＡＤＦ」、「ＤＩＤ」、「ＤＢＮ」、「ＤＣ」、「ＵＤＷ」、「ＣＳ」の各データで構成されている。図３は、音声制御パケットの各構成の詳細を示す図である。
【００４０】
「ＡＤＦ」は、補助データフラグと呼ばれ、音声制御パケットの開始を示すデータである。また、ＡＤＦは、“０００ｈ”、“３ＦＦｈ”、“３ＦＦｈ”の連続する３ワードで構成するユニーク・コードである。
【００４１】
「ＤＩＤ」は、データ識別ワードと呼ばれ、この値によって後述するＵＤＷの種類が示される。なお、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットでは、音声グループごとにユニーク・コードが割り当てられている。例えば、音声グループ１（チャネル１〜４）にはＤＩＤ＝“１Ｅ３ｈ”が、音声グループ２（チャネル５〜８）にはＤＩＤ＝“２Ｅ２ｈ”が、割り当てられている。
【００４２】
「ＤＢＮ」は、データブロック番号ワードと呼ばれ、同一ＤＩＤを有する音声制御パケットの順番を示すが、未使用でもよい。なお、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットでは、“２００ｈ”（未使用）にすることになっている。
【００４３】
「ＤＣ」は、データカウントワードと呼ばれ、後述する「ＵＤＷ」のワード数を示す。また、「ＣＳ」は、チェックサムワードと呼ばれる。ＣＳの値は、ＤＩＤからＵＤＷに含まれる最後のワードまでの下位９ビットの総和における下位９ビットである。
【００４４】
「ＵＤＷ」は、ユーザデータワードと呼ばれ、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏデータの制御情報が格納されている。音声制御パケットにおいては、ＵＤＷは１１ワードの固定長である。なお、非特許文献１においては、ＵＤＷの１１ワードは、パケットの先頭からＵＤＷ０、ＵＤＷ１、・・・ＵＤＷ９、ＵＤＷ１０と表記されている（本明細書中においても同様とする）。また、各音声チャネルのアクティベートを示すアクティブチャネルデータは、「ＵＤＷ」のＵＤＷ２（すなわち、「ＵＤＷ」の３ワード目）に格納されている。
【００４５】
図４は、アクティブチャネルデータの詳細を示す図である。上述したように、アクティブチャネルデータは、「ＵＤＷ」のＵＤＷ２に格納されている。また、図４に示されるｂ０〜ｂ３（ＵＤＷ２の１〜４ビット目）の４ビットによって、各チャネルが有効であるか無効であるか（アクティベート）が示される。各チャネルが有効である場合にはビットｂ０〜ｂ３の値は“１”に設定され、各チャネルが無効である場合にはビットｂ０〜ｂ３の値は“０”に設定される。
【００４６】
具体的には、ビットｂ０はチャネル１（もしくはチャネル５）のアクティベートを表し、ビットｂ１はチャネル２（もしくはチャネル６）のアクティベートを表す。また、ビットｂ２はチャネル３（もしくはチャネル７）のアクティベートを表し、ビットｂ３はチャネル４（もしくはチャネル８）のアクティベートを表す。
【００４７】
ここで、本実施形態の伝送装置１００の音声データ変換部１３０は、このアクティブチャネルデータのｂ０〜ｂ３を利用して、音声データの各チャネルが有効であるか無効であるかを示す音声チャネル情報を、音声パケットデータ（音声ＰＥＳデータ）の未使用領域に格納する。
【００４８】
図５を用いて音声パケットデータ（音声ＰＥＳデータ）の未使用領域について詳細に説明する。図５は、ＳＭＰＴＥ３０２Ｍ形式のＰＥＳデータの構成を示す図である。なお、このＳＭＰＴＥ３０２Ｍ形式については、ＩＳＯ／ＩＥＣ１３８１８−１にて規定されているので、ここでは簡単に説明する。
【００４９】
「ＭＰＥＧ−２ＰＥＳＨｅａｄｅｒ」は、ＭＰＥＧ−２ｐａｒｔ１Ｓｙｓｔｅｍ規格に準じた構成をとる。また、「ＳＭＰＴＥ３０２ＭＡＥＳ３ｄａｔａＰａｙｌｏａｄ」は、実際の音声データそのものが格納される領域である。
【００５０】
また、「ＳＭＰＴＥ３０２ＭＡＥＳ３ｄａｔａＨｅａｄｅｒ」は、図６に示すような構成をとる。「ａｕｄｉｏ＿ｐａｃｋｅｔ＿ｓｉｚｅ」は、図５の「ＳＭＰＴＥ３０２ＭＡＥＳ３Ｐａｙｌｏａｄ」のデータ数（バイト）を１６ビットで表したものである。「ｎｕｍｂｅｒ＿ｃｈａｎｎｅｌｓ」は、伝送する音声のチャンネル数を２ビットで表したものである。
【００５１】
「ｃｈａｎｎｅｌ＿ｉｄｅｎｔｉｆｉｃａｔｉｏｎ」は、伝送する音声の全チャネルに対し、音声ＰＥＳデータが先頭チャネルの何番目のチャネルで伝送される音声ＰＥＳデータであるかを８ビットで表すものである。「ｂｉｔｓ＿ｐｅｒ＿ｓａｍｐｌｅ」は、伝送する音声のサンプリングビット数を２ビットで表すものである。
【００５２】
「ａｌｉｇｎｍｅｎｔｂｉｔｓ」は、ＳＭＰＴＥ３０２ＭＡＥＳ３ｄａｔａＨｅａｄｅｒの長さを調整する（バイト・アライメント）のための未使用領域であり、長さは４ビットである。ＳＭＰＴＥ３０２Ｍ規格では“００００ｂ”を格納することになっているが、本実施形態では、この未使用領域であるａｌｉｇｎｍｅｎｔｂｉｔｓに、音声チャネル情報が格納される。
【００５３】
また、本実施形態では、この音声チャネル情報として、図４に示されるアクティブチャネルデータのビットｂ０〜ｂ３についてチャネルペアごとに論理和をとったものを採用する。すなわち、「ａｌｉｇｎｍｅｎｔｂｉｔｓ」の各ビットｄ０〜ｄ３は、以下のように決定される。

alignment bits d3＝「グループ２のb2(CH7)」or「グループ２のb3(CH8)」
alignment bits d2＝「グループ２のb0(CH5)」or「グループ２のb1(CH6)」
alignment bits d1＝「グループ１のb2(CH3)」or「グループ１のb3(CH4)」
alignment bits d0＝「グループ１のb0(CH1)」or「グループ１のb1(CH2)」

ここで、「チャネルペア」とは、通常、ステレオ音声の伝送に用いられる２つのチャンネルのペアである。このようにチャネルペアの４ビットとしたのは、近年のテレビ放送やＩＰＴＶ（Internet Protocol Television）などのサービスにおいてモノラル音声による運用は皆無に等しく、実際の運用ではチャネルペアの運用が大多数であるためであり、実用上、問題になることは無いと思われるからである。
【００５４】
上記のようにalignment bitsの４ビットをチャネルペアごとにアクティブであるか否かを示す情報として使用することで、図７に示されるような音声入力のチャネル組合せにおいて、受信側の装置では、どのチャネルが無効チャネルかを認識することが可能となる。以下、図７について、より詳細に説明する。
【００５５】
図７において、「音声入力」は、実際の音声入力における各チャネルのアクティベートを示す。数字が表記されているチャネルは有効となっているチャネルであり、“×”が表記されているチャネルは無効となっているチャネル（すなわち、音声が出力されないチャネル）である。例えば、“××３４５６７８”は、チャネル１と２は無効チャネルであり、チャネル３〜８は有効チャネルであることを表す。
【００５６】
また、図７における「従来方式」は、実際の音声入力の各チャネルのアクティベーションが「音声入力」で示される状態であった場合に、従来の音声出力方式において、各チャネルのアクティベーションがどのように判断されるかを示すものである。例えば、音声入力の各チャネルのアクティベートが“××３４５６７８”である場合、従来の音声出力方式（図７の「従来方式」）では、音声出力時に、“△△３４５６７８”（△は有効チャネルと認識されるチャネル）と判断される。よって、チャネル１および２においてはノイズデータが出力されてしまう。
【００５７】
これに対し、本実施形態に係る伝送装置１００では、ＳＭＰＴＥ３０２Ｍ規格に準拠したＰＥＳデータのalignment bitsのデータ領域に、図７の「alignment bits」に示されるようなビットｄ０〜ｄ３が格納される。なお、ビットｄ０〜ｄ３の値は、上述したように、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏ音声制御パケット中のアクティブチャネルデータのビットｂ０〜ｂ３についてチャネルペアごとに論理和をとったものである。例えば、音声入力の各チャネルのアクティベートが“××３４５６７８”である場合、音声ＰＥＳデータのalignment bitsのデータ領域には、“０１１１”の値が格納される。そして、この音声ＰＥＳデータは、映像ＰＥＳデータと多重化されて送信部１４０から受信装置２００に送信される。
【００５８】
そして、この音声ＰＥＳデータを受信する受信装置２００では、ＴＳ−Ｄｅｍｕｘ処理部２１１、音声ＰＥＳ処理部２３１、音声ＥＳ処理部２３２を経て、音声ＥＳデータがＥｍｂｅｄｄｅｄ−Ａｕｄｉｏデータに変換される。この時、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットには、音声データの出力の際に各チャネルが有効であるか無効であるかを判断するための再生チャネル情報が格納されるが、この再生チャネル情報は、以下のようにして決定される。
【００５９】
図７の「本発明」は、実際の音声入力の各チャネルのアクティベーションが「音声入力」で示される状態であった場合の再生チャネル情報の内容を示す。例えば、伝送装置１００から送信された音声ＰＥＳデータのalignment bitsのビットｄ０〜ｄ３の値が“０１１１”であった場合、ビットｄ０の値が“０”であることから、チャネル１と２のアクティベーションは“０”、すなわち、無効チャネルであると判断する。また、ビットｄ１、ｄ２、ｄ３の値が“１”であることから、チャネル３と４、チャネル５と６、チャネル７と８のアクティベーションは“１”、すなわち、有効チャネルであると判断する（図７の「本発明」では、“○○３４５６７８”（○は無効チャネル）と表記）。
【００６０】
よって、受信装置２００の音声ＥＳ処理部２３２では、音声グループ１の音声制御パケット（ＤＩＤ＝“１Ｅ３ｈ”である音声制御パケット）に格納する再生チャネル情報の値は“００１１”と決定される。また、音声グループ２の音声制御パケット（ＤＩＤ＝“２Ｅ２ｈ”である音声制御パケット）に格納する再生チャネル情報の値は“１１１１”と決定される。そして、これらの再生チャネル情報は、各音声制御パケットのＵＤＷ２のビットｂ０〜ｂ３の値として格納される。
【００６１】
これにより、本実施形態に係る伝送システムによれば、受信装置２００からＨＤ−ＳＤＩ信号を受信して再生する音声再生装置等においては、無効チャネルについては無音データを出力することで、音声を聞いているユーザにノイズなどを聞かせて不快感を与えることを防止することができる。
【００６２】
（受信装置２００の動作）
伝送装置１００の送信部１４０では、音声データ変換部１３０で音声チャネル情報が格納されて生成された音声ＰＥＳデータが、映像データ変換部１２０で生成された映像ＰＥＳデータとともに多重化されてＭＰＥＧ−２ＴＳ形式に変換された後、受信装置２００に送信される。そして、受信装置２００では、ＴＳ−Ｄｅｍｕｘ処理部２１１において音声ＰＥＳデータがＭＰＥＧ−２ＴＳデータから抽出された後、音声ＰＥＳ処理部２３１において、音声ＰＥＳデータが音声ＥＳデータ（ＳＭＰＴＥ３０２ＭＰＥＳパケット）に変換される。
【００６３】
さらに、受信装置２００の音声ＥＳ処理部２３２において音声ＥＳデータをＥｍｂｅｄｄｅｄ−Ａｕｄｉｏデータに変換する際、音声ＰＥＳデータの「ａｌｉｇｎｍｅｎｔｂｉｔｓ」に格納されていた４ビットの音声チャネル情報に基づいて、再生チャネル情報が決定される。そして、決定された再生チャネル情報の値が、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏデータのアクティブチャネルデータ（ＵＤＷ２）のｂ０〜ｂ３の値として格納される。また、この時、ＵＤＷ２のビットｂ４〜ｂ７（５〜８ビット目）には“０”が格納される。また、ＵＤＷ２のビットｂ８（９ビット目）にはビットｂ０〜ｂ７に対する偶数パリティビットが格納され、ビットｂ９（１０ビット目）にはビットｂ８の反転ビットが格納される。
【００６４】
（伝送装置１００の処理フロー）
図８は、伝送装置１００における処理の流れを示すフロー図である。
【００６５】
抽出部１１０において、ＨＤ−ＳＤＩ信号が受信される（ステップＳ１０１）。さらに、受信されたＨＤ−ＳＤＩ信号から映像データおよび音声データ（Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏデータ）が抽出される（ステップＳ１０２）。
【００６６】
ステップＳ１０２で抽出された映像データは、映像データ変換部１２０の映像ＥＳ処理部１２１において、Ｈ．２６４圧縮符号化が行われることで映像ＥＳデータに変換される（ステップＳ１０３）。さらに、映像データ変換部１２０の映像ＰＥＳ処理部１２２において、映像ＥＳデータがＭＰＥＧ−２ｐａｒｔ１Ｓｙｓｔｅｍ規格に準拠した映像ＰＥＳデータに変換される（ステップＳ１０４）。
【００６７】
一方で、ステップＳ１０２で抽出された音声データは、音声データ変換部１３０の音声ＥＳ処理部１３１において音声ＥＳデータに変換される（ステップＳ１０５）。さらに、この音声ＥＳデータは、音声データ変換部１３０の音声ＰＥＳ処理部１３２において音声ＰＥＳデータに変換される（ステップＳ１０６）。
【００６８】
そして、音声データ変換部１３０の音声ＰＥＳ処理部１３２において、ＨＤ−ＳＤＩ信号に多重化されている音声制御パケットのアクティブチャネルデータの一部（ＵＤＷ２のビットｂ０〜ｂ３）が抽出され、チャネルペアごとの論理和が算出され、この算出結果が音声チャネル情報として音声ＰＥＳデータの「ａｌｉｇｎｍｅｎｔｂｉｔｓ」に格納される（ステップＳ１０７）。
【００６９】
最後に、送信部１４０のＴＳ−Ｍｕｘ処理部１４１において、映像ＰＥＳデータと音声ＰＥＳデータとが多重化されてＭＰＥＧ−２ＴＳ形式に変換され、受信装置２００に送信される（ステップＳ１０８）。
【００７０】
（受信装置２００の処理フロー）
図９は、受信装置２００における処理の流れを示すフロー図である。
【００７１】
ＴＳ−Ｄｅｍｕｘ処理部２１１において、ＭＰＥＧ−２ＴＳデータが受信される（ステップＳ２０１）。そして、受信されたＭＰＥＧ−２ＴＳデータから映像ＰＥＳデータおよび音声ＰＥＳデータが抽出される（ステップＳ２０２）。
【００７２】
映像ＰＥＳ処理部２２１において、映像ＰＥＳデータが映像ＥＳデータに変換される（ステップＳ２０３）。そして、映像ＥＳ処理部２２２において、映像ＥＳデータについてＨ．２６４圧縮復号化が実行されることにより、映像ＥＳデータがＨＤ−ＳＤＩ信号に多重可能な形式に変換される（ステップＳ２０４）。
【００７３】
一方で、音声ＰＥＳ処理部２３１において、音声ＰＥＳデータの「ａｌｉｇｎｍｅｎｔｂｉｔｓ」から音声チャネル情報が抽出される（ステップＳ２０５）。そして、音声ＰＥＳ処理部２３１において、音声ＰＥＳデータが音声ＥＳデータに変換される（ステップＳ２０６）。
【００７４】
さらに、音声ＥＳ処理部２３２において、この音声ＥＳデータがＨＤ−ＳＤＩ信号に多重可能な形式（Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏ形式）に変換される（ステップＳ２０７）。この際、Ｅｍｂｅｄｄｅｄ−Ａｕｄｉｏ音声制御パケットのアクティブチャネルデータであるＵＤＷ２のｂ０〜ｂ３には、ステップＳ２０５で抽出された音声チャネル情報の４ビット（ｄ０〜ｄ３）に基づいて各チャネルのアクティベートを示す値が格納される（ステップＳ２０８）。
【００７５】
すなわち、図７に示されるように、ビットｄ０〜ｄ３の値によって各チャネルのアクティベートが判断されて、音声制御パケットのＵＤＷ２のｂ０〜ｂ３の値が決定される。なお、図４に示されるように、アクティブチャネルデータであるＵＤＷ２のビットｂ４〜ｂ７（５〜８ビット目）には“０”が格納される。また、ＵＤＷ２のビットｂ８（９ビット目）にはビットｂ０〜ｂ７に対する偶数パリティビットが格納され、ビットｂ９（１０ビット目）にはビットｂ８の反転ビットが格納される。
【００７６】
そして、映像データ、音声データ、および音声制御パケットがＨＤ−ＳＤＩ信号に多重化されて外部の再生装置等に送信される（ステップＳ２０９）。
【００７７】
以上のように、伝送装置において、従来では音声ＰＥＳデータにおいて未定義となっている領域に音声チャネル情報を格納して伝送することで、チャネルペアごとのアクティベートを受信側の装置にて認識し、無効チャネルについては、ユーザの確認動作を要せずに自動的に無音出力することが可能となる。
【００７８】
また、本実施形態の伝送装置によれば、ＳＭＰＴＥ規格やＡＲＩＢ規格等に準じたＨＤ−ＳＤＩ信号への音声データ多重方式、および非圧縮音声のＰＥＳデータ化に則している。従って、従来のＭＰＥＧ−２ＴＳ方式に準じた伝送装置や受信装置での互換性が損なわれることがなく、従来の伝送装置や受信装置に適用可能である。
【００７９】
なお、上記の実施形態においては、受信装置２００においてはＭＰＥＧ２−ＴＳデータから抽出された映像データと音声データとがＨＤ−ＳＤＩ信号に多重化されて外部の再生装置等に出力されることとしているが、受信装置２００において映像データと音声データとが再生出力されるようになっていてもよい。
【００８０】
（付記）
以上に、本発明に係る実施形態について詳細に説明したことからも明らかなように、上述の実施形態の一部または全部は、以下の各付記のようにも記載することができる。しかしながら、以下の各付記は、あくまでも、本発明の単なる例示に過ぎず、本発明は、かかる場合のみに限るものではない。
【００８１】
（付記１）
映像データと音声データとが多重化されたＨＤ−ＳＤＩ信号から前記映像データと前記音声データとを抽出する抽出手段と、
前記映像データを、ＭＰＥＧ−２ＴＳ形式で多重化可能な形式の映像パケットデータに変換する映像データ変換手段と、
前記音声データを、ＳＭＰＴＥ３０２Ｍ形式の音声パケットデータに変換する音声データ変換手段と、
前記映像パケットデータと前記音声パケットデータとを多重化することでＭＰＥＧ−２ＴＳ形式に変換して送信する送信手段と、を有し、
前記音声データ変換手段は、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納して、ＳＭＰＴＥ３０２Ｍ形式の音声パケットデータに変換することを特徴とする伝送装置。
【００８２】
（付記２）
前記音声チャネル情報は、前記ＨＤ−ＳＤＩ信号に多重化されているＥｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットに含まれるアクティブチャネルデータに基づいて生成される情報であることを特徴とする付記１に記載の伝送装置。
【００８３】
この構成によれば、例えば、ＨＤ−ＳＤＩ信号に多重化されている音声制御パケットに含まれているアクティブチャネルデータを利用して、ＳＭＰＴＥ３０２Ｍ規格に準拠しつつ、各音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することが可能である。
【００８４】
（付記３）
前記音声チャネル情報は、前記ＨＤ−ＳＤＩ信号に多重化されているＥｍｂｅｄｄｅｄ−Ａｕｄｉｏの音声制御パケットに含まれるアクティブチャネルデータであるＵＤＷ２の１〜４ビット目について、チャネルペアごとに論理和をとった値で構成されることを特徴とする付記２に記載の伝送装置。
【００８５】
この構成によれば、例えば、ＨＤ−ＳＤＩ信号に多重化されている音声制御パケットに含まれているアクティブチャネルデータを利用して、ＳＭＰＴＥ３０２Ｍ規格に準拠しつつ、各音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することが可能である。
【００８６】
（付記４）
前記音声チャネル情報を取得する音声チャネル情報取得手段をさらに有し、
前記音声データ変換手段は、前記音声チャネル情報取得手段において取得された音声チャネル情報の少なくとも一部を前記音声パケットデータの未使用領域に格納することを特徴とする付記１に記載の伝送装置。
【００８７】
この構成によれば、伝送装置は、外部の装置や伝送装置のユーザの入力から音声チャネル情報を取得し、その音声チャネル情報の少なくとも一部を音声パケットの未使用領域に格納して他の装置に送信することが可能である。
【００８８】
（付記５）
映像データと音声データとが多重化されたＭＰＥＧ−２ＴＳ形式のデータであって前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報が前記音声データの一部に格納されているＭＰＥＧ２−ＴＳ形式のデータを受信する受信装置であって、
前記ＭＰＥＧ−２ＴＳ形式データから前記映像データと前記音声データとを抽出するＴＳ処理手段（例えば、図１のＴＳ−Ｄｅｍｕｘ処理部２１１）と、
前記映像データを、ＨＤ−ＳＤＩ（Serial Digital Interface）信号に多重化可能な形式の映像データに変換する映像データ処理手段（例えば、図１の映像ＰＥＳ処理部（受信側）２２１および映像ＥＳ処理部（受信側）２２２）と、
前記音声データを、ＨＤ−ＳＤＩ信号に多重化可能な形式の音声データに変換する音声データ処理手段（例えば、図１の音声ＰＥＳ処理部（受信側）２３１および音声ＥＳ処理部（受信側）２３２）と、を有し、
前記音声データ処理手段は、前記ＴＳ処理手段において抽出された前記音声データから前記音声チャネル情報を抽出し、抽出した前記音声チャネル情報に基づいて、前記音声データの出力の際に各チャネルが有効であるか無効であるかを判断するための情報である再生チャネル情報を、ＨＤ−ＳＤＩ信号に多重可能なパケットであって、前記音声データについての制御パケット（例えば、図２に示される音声制御パケット）に格納することを特徴とする受信装置。
【００８９】
この構成によれば、例えば、ＭＰＥＧ２−ＴＳデータに多重化されている映像データと音声データとをＨＤ−ＳＤＩ信号によって受信装置から受信する他の装置において、無効チャネルについては、ユーザの確認動作を要せずに自動的に無音出力することが可能となる。
【００９０】
（付記６）
映像データと音声データとが多重化されたＨＤ−ＳＤＩ（Serial Digital Interface）信号から前記映像データと前記音声データとを抽出する抽出ステップ（例えば、図８のステップＳ１０１〜Ｓ１０２）と、
前記映像データを、ＭＰＥＧ（Moving Picture Experts Group）−２ＴＳ（Transport Stream）形式で多重化可能な形式の映像パケットデータに変換する映像データ変換ステップ（例えば、図８のステップＳ１０３〜Ｓ１０４）と、
前記音声データを、ＳＭＰＴＥ（Society of Motion Picture and Television Engineers）３０２Ｍ形式の音声パケットデータに変換する音声データ変換ステップ（例えば、図８のステップＳ１０５〜Ｓ１０６）と、
前記映像パケットデータと前記音声パケットデータとを多重化することでＭＰＥＧ−２ＴＳ形式に変換して送信する送信ステップ（例えば、図８のステップＳ１０８）と、を有し、
前記音声データ変換ステップにおいて、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納すること（例えば、図８のステップＳ１０７）を特徴とする伝送方法。
【００９１】
この構成によれば、ＳＭＰＴＥ３０２Ｍ規格に準拠しつつ、音声チャネルのアクティベートに関する情報を、伝送装置から外部の装置に送信することができる。これにより、受信側の装置では音声チャネルのアクティベートを把握し、人間の確認動作を必要とせずに無効チャネルにおいて無音データを出力することが可能となる。また、音声チャネルのアクティベートに関する情報を送信するために、音声データ以外の余分なデータを送信する必要もない。
【符号の説明】
【００９２】
１００伝送装置
１１０抽出部
１２０映像データ変換部
１２１映像ＥＳ処理部（送信側）
１２２映像ＰＥＳ処理部（送信側）
１３０音声データ変換部
１３１音声ＥＳ処理部（送信側）
１３２音声ＰＥＳ処理部（送信側）
１４０送信部
１４１ＴＳ−Ｍｕｘ処理部
１５０音声チャネル情報取得部
２００受信装置
２１１ＴＳ−Ｄｅｍｕｘ処理部
２２１映像ＰＥＳ処理部（受信側）
２２２映像ＥＳ処理部（受信側）
２３１音声ＰＥＳ処理部（受信側）
２３２音声ＥＳ処理部（受信側）

【特許請求の範囲】
【請求項１】
映像データと音声データとが多重化されたＨＤ−ＳＤＩ（Serial Digital Interface）信号から前記映像データと前記音声データとを抽出する抽出手段と、
前記映像データを、ＭＰＥＧ（Moving Picture Experts Group）−２ＴＳ（Transport Stream）形式で多重化可能な形式の映像パケットデータに変換する映像データ変換手段と、
前記音声データを、ＳＭＰＴＥ（Society of Motion Picture and Television Engineers）３０２Ｍ形式の音声パケットデータに変換する音声データ変換手段と、
前記映像パケットデータと前記音声パケットデータとを多重化することでＭＰＥＧ−２ＴＳ形式に変換して送信する送信手段と、を有し、
前記音声データ変換手段は、前記音声データの各チャネルが有効であるか無効であるかを示す情報である音声チャネル情報を前記音声パケットデータの未使用領域に格納して、ＳＭＰＴＥ３０２Ｍ形式の音声パケットデータに変換することを特徴とする伝送装置。

【図１】