説明

メディア符号化伝送装置

【課題】メディアの再生品質を維持しながら、帯域利用効率の低下を防止することができるとともに、回線の帯域に制限がある伝送路を使用する場合でも、伝送誤りの発生を防止することができるようにする。
【解決手段】符号化対象のメディアデータの重要度を判別する重要度判別部13や、重要度判別部13により判別された重要度を基準にして、そのメディアデータを圧縮符号化する際の符号化レートErateを決定する符号化レート決定部14などを設ける。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、メディアデータを圧縮符号化して、圧縮符号化後のメディアデータであるメディア符号化データをネットワーク経由でリアルタイムに伝送するメディア符号化伝送装置に関するものである。
【背景技術】
【0002】
例えば、映像データや音声データなどのメディアデータを圧縮符号化し、圧縮符号化後のメディアデータであるメディア符号化データをネットワーク経由でリアルタイムに伝送するメディア符号化伝送装置が開発されている。
ただし、メディア符号化伝送装置から送出されたメディア符号化データが受信側に到達するまでの間に、ネットワークを構成する様々な中継器や、特性が異なる回線を経由するため、伝送の途中で発生した電気的ノイズなどの影響でメディア符号化データが破損したり、伝送データの輻輳により中継器でメディア符号化データが破棄されたりして、メディア符号化データに伝送誤りが発生することがある。
【0003】
伝送誤りが発生した場合の対策として、受信側が伝送誤りの発生を検知すると、メディア符号化データの再送を送信側に要求し、送信側から再送されたメディア符号化データを用いて、破損しているメディア符号化データの修復を行う再送処理が一般的に行われている。
ただし、このような再送処理の場合、送信側が受信側から再送要求を受信した時点から、メディア符号化データの再送を開始するため、破損しているメディア符号化データの修復が完了するまでに遅延が発生し、メディア符号化データのリアルタイム伝送には適していない。
【0004】
破損しているメディア符号化データを遅延なく誤り訂正を行う方式として、受信側において、伝送誤りを訂正することが可能な誤り訂正用データを予めメディア符号化データに付加して送信する前方誤り訂正(Forward Error Correction:FEC)の方式がある(例えば、非特許文献1を参照)。
前方誤り訂正方式を用いる場合、メディア符号化データを構成しているメディアデータ伝送用パケットを送信する際、そのメディアデータ伝送用パケットの一定間隔毎(例えば、10パケット毎)に、FECパケットを1個挿入して送信する。
FECパケットの内容は、FECパケットを送信する直前の例えば10個のメディアデータ伝送用パケットのXOR(eXclusive OR:排他的論理和)をとったものである。
【0005】
受信側では、メディアデータ伝送用パケットに連続的に付けられている番号等を参照することでパケットの欠落を検知すると、欠落していない残りの9個のメディアデータ伝送用パケットとFECパケットを合わせた合計10個のパケットのXORをとることで、欠落しているメディアデータ伝送用パケットを復旧させることができる。
しかし、前方誤り訂正方式を用いる場合、伝送誤りの発生の有無に関わらず、常時、一定量のFECパケットを伝送する必要があるため、本来のメディア符号化データを伝送するための帯域が減少して、伝送効率が低下してしまうことになる。
【0006】
そこで、メディアデータの重要度に応じて誤り訂正用データのデータ量を制御することで、帯域利用効率の低下を防止するメディア符号化伝送装置が開発されている(例えば、特許文献1を参照)。
このようなメディア符号化伝送装置では、メディアデータの重要度(例えば、MPEGのピクチャタイプ)に応じて、誤り訂正用データのデータ長を変更している。
誤り訂正用データのデータ長が長い程、誤り訂正能力が高くなるため、重要なメディアデータに付加する誤り訂正用データのデータ長を長くし、それ以外のメディアデータに付加する誤り訂正用データのデータ長を短くすることで、メディアの再生品質を維持しながら、帯域利用効率の低下を防止している。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2008−92214号公報(段落番号[0016])
【非特許文献】
【0008】
【非特許文献1】IETF RFC2733 “An RTP Payload Format for Generic Forward Error Correction”
【発明の概要】
【発明が解決しようとする課題】
【0009】
従来のメディア符号化伝送装置は以上のように構成されているので、メディアデータの重要度に応じて、誤り訂正用データのデータ長を制御することで、帯域利用効率の低下を防止している。しかし、メディアデータのデータ量が常時一定量であっても、誤り訂正用データのデータ長がメディアデータの重要度に応じて変化するので、メディアデータと誤り訂正用データを合わせた全体のデータ長が時間毎に変動する。このため、例えば、衛星通信や無線通信のように、回線の帯域に制限がある伝送路を使用する場合、全体のデータ長が長くなって伝送量が増加したときに、回線の帯域の制限を越えてしまって、伝送誤りが発生することがある課題があった。
【0010】
この発明は上記のような課題を解決するためになされたもので、メディアの再生品質を維持しながら、帯域利用効率の低下を防止することができるとともに、回線の帯域に制限がある伝送路を使用する場合でも、伝送誤りの発生を防止することができるメディア符号化伝送装置を得ることを目的とする。
【課題を解決するための手段】
【0011】
この発明に係るメディア符号化伝送装置は、符号化対象のメディアデータの重要度を判別する重要度判別手段と、重要度判別手段により判別された重要度を基準にして、そのメディアデータを圧縮符号化する際の符号化レートを決定するとともに、圧縮符号化後のメディアデータに付加する誤り訂正符号の付加レートを決定するレート決定手段と、レート決定手段により決定された符号化レートでメディアデータを圧縮符号化して、圧縮符号化後のメディアデータであるメディア符号化データを出力するメディアデータ符号化手段と、メディアデータ符号化手段から出力されたメディア符号化データに対して、レート決定手段により決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きのメディア符号化データを出力する誤り訂正符号付加手段と、誤り訂正符号付加手段から出力された誤り訂正符号付きのメディア符号化データをネットワークに送出するデータ送出手段とを設け、データ送出手段から送出された誤り訂正符号付きのメディア符号化データの伝送レートが許容範囲内から逸脱している場合、レート補正手段がレート決定手段に対して符号化レート及び付加レートの補正を指示して、伝送レートを許容範囲内に収めるようにしたものである。
【発明の効果】
【0012】
この発明によれば、符号化対象のメディアデータの重要度を判別する重要度判別手段と、重要度判別手段により判別された重要度を基準にして、そのメディアデータを圧縮符号化する際の符号化レートを決定するとともに、圧縮符号化後のメディアデータに付加する誤り訂正符号の付加レートを決定するレート決定手段と、レート決定手段により決定された符号化レートでメディアデータを圧縮符号化して、圧縮符号化後のメディアデータであるメディア符号化データを出力するメディアデータ符号化手段と、メディアデータ符号化手段から出力されたメディア符号化データに対して、レート決定手段により決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きのメディア符号化データを出力する誤り訂正符号付加手段と、誤り訂正符号付加手段から出力された誤り訂正符号付きのメディア符号化データをネットワークに送出するデータ送出手段とを設け、データ送出手段から送出された誤り訂正符号付きのメディア符号化データの伝送レートが許容範囲内から逸脱している場合、レート補正手段がレート決定手段に対して符号化レート及び付加レートの補正を指示して、伝送レートを許容範囲内に収めるように構成したので、メディアの再生品質を維持しながら、帯域利用効率の低下を防止することができるとともに、回線の帯域に制限がある伝送路を使用する場合でも、伝送誤りの発生を防止することができる効果がある。
【図面の簡単な説明】
【0013】
【図1】この発明の実施の形態1によるメディア符号化伝送装置を示す構成図である。
【図2】この発明の実施の形態1によるメディア符号化伝送装置の処理内容を示すフローチャートである。
【図3】符号化レートErateで圧縮符号化されたメディアデータ及び付加レートArateで付加された誤り訂正符号を示す説明図である。
【図4】この発明の実施の形態2によるメディア符号化伝送装置を示す構成図である。
【図5】この発明の実施の形態3によるメディア符号化伝送装置を示す構成図である。
【図6】映像音声多重部22により多重化された映像符号化データ及び音声符号化データと、映像音声整列部23により並び替えが行われた映像符号化データ及び音声符号化データと、誤り訂正符号が付加された映像符号化データ及び音声符号化データとを示す説明図である。
【図7】この発明の実施の形態9によるメディア符号化伝送装置を示す構成図である。
【発明を実施するための形態】
【0014】
実施の形態1.
図1はこの発明の実施の形態1によるメディア符号化伝送装置を示す構成図である。
図1において、メディア符号化伝送装置1はメディアソース2から例えば映像データや音声データなどのメディアデータを入力し、そのメディアデータを圧縮符号化して、圧縮符号化後のメディアデータであるメディア符号化データをネットワーク3に送出する装置である。
メディアソース2は例えば映像データや音声データなどのメディアデータを出力することが可能な装置であり、例えば、ビデオカメラやVTRなどが該当する。
ネットワーク3は例えば無線LANや衛星通信回線などが該当する。
【0015】
メディア圧縮符号化処理部11は特徴量抽出処理部12及び符号化処理部16から構成されており、メディアソース2からメディアデータを入力すると、そのメディアデータの特徴量を抽出して、その特徴量を重要度判別部13に出力するとともに、そのメディアデータを圧縮符号化して、圧縮符号化後のメディアデータであるメディア符号化データを誤り訂正符号付加部17に出力する処理を実施する。
【0016】
特徴量抽出処理部12はメディアソース2から符号化対象のメディアデータを入力するインタフェース(例えば、ビデオ入力端子や音声入力端子)を備えており、入力した符号化対象のメディアデータの特徴量(例えば、動きベクトル、DCT(Discrete Cosine Transform:離散コサイン変換)係数、音声データの有無など)を抽出して、その特徴量を重要度判別部13及び符号化処理部16に出力するとともに、そのメディアデータを符号化処理部16に出力する処理を実施する。
重要度判別部13は特徴量抽出処理部12から出力された特徴量を参照して、符号化対象のメディアデータの重要度を判別する処理を実施する。
なお、特徴量抽出処理部12及び重要度判別部13から重要度判別手段が構成されている。
【0017】
符号化レート決定部14は重要度判別部13により判別された重要度を基準にして、特徴量抽出処理部12により入力されたメディアデータを圧縮符号化する際の符号化レートを決定する処理を実施する。
誤り訂正符号付加レート決定部15は重要度判別部13により判別された重要度を基準にして、符号化処理部16により圧縮符号化されたメディアデータに付加する誤り訂正符号の付加レートを決定する処理を実施する。
なお、符号化レート決定部14及び誤り訂正符号付加レート決定部15からレート決定手段が構成されている。
【0018】
符号化処理部16は符号化レート決定部14により決定された符号化レートで、特徴量抽出処理部12から出力された特徴量に応じてメディアデータを圧縮符号化し、圧縮符号化後のメディアデータであるメディア符号化データを出力する処理を実施する。なお、符号化処理部16はメディアデータ符号化手段を構成している。
誤り訂正符号付加部17は符号化処理部16から出力されたメディア符号化データに対して、誤り訂正符号付加レート決定部15により決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きのメディア符号化データを出力する処理を実施する。なお、誤り訂正符号付加部17は誤り訂正符号付加手段を構成している。
【0019】
データ送出部18はネットワーク3に対するインタフェース(例えば、無線LANアダプタ、無線通信機器など)を備えており、誤り訂正符号付加部17から出力された誤り訂正符号付きのメディア符号化データをネットワーク3に送出する処理を実施する。なお、データ送出部18はデータ送出手段を構成している。
伝送レート補正部19はデータ送出部18から送出された誤り訂正符号付きのメディア符号化データの伝送レートが予め設定されている許容範囲内から逸脱している場合、符号化レート決定部14及び誤り訂正符号付加レート決定部15に対して、符号化レート及び付加レートの補正を指示して、その伝送レートを許容範囲内に収める処理を実施する。なお、伝送レート補正部19はレート補正手段を構成している。
【0020】
図1の例では、メディア符号化伝送装置の構成要素である特徴量抽出処理部12、重要度判別部13、符号化レート決定部14、誤り訂正符号付加レート決定部15、符号化処理部16、誤り訂正符号付加部17、データ送出部18及び伝送レート補正部19のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、メディア符号化伝送装置がコンピュータで構成される場合、特徴量抽出処理部12、重要度判別部13、符号化レート決定部14、誤り訂正符号付加レート決定部15、符号化処理部16、誤り訂正符号付加部17、データ送出部18及び伝送レート補正部19の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図2はこの発明の実施の形態1によるメディア符号化伝送装置の処理内容を示すフローチャートである。
【0021】
次に動作について説明する。
メディア圧縮符号化処理部11の特徴量抽出処理部12は、メディアソース2から符号化対象のメディアデータ(映像データ、音声データ)を入力すると(ステップST1)、そのメディアデータの特徴量を抽出する(ステップST2)。
メディアデータの特徴量としては、例えば、メディアデータのピクチャタイプ、映像データが圧縮符号化される際に用いられる動きベクトル、映像データが圧縮符号化される際に算出されるDCT係数、メディアデータにおける音声データの有無などが考えられる。
【0022】
特徴量を抽出する具体的な手順として、例えば、「ISO/IEC MPEG(Moving Picture Experts Group)−1/2/4」や、「ITU−T勧告 H.261/262/263/264」に規定されている圧縮符号化技術を利用すればよいので、ここでは詳細な説明を省略する。
特徴量抽出処理部12は、メディアデータの特徴量を抽出すると、その特徴量を重要度判別部13及び符号化処理部16に出力するとともに、そのメディアデータを符号化処理部16に出力する。
【0023】
重要度判別部13は、特徴量抽出処理部12からメディアデータの特徴量を受けると、その特徴量を参照して、符号化対象のメディアデータの重要度を判別する(ステップST3)。
メディアデータの重要度は、特徴量に基づいて判別するが(重要度の具体的な判別処理は、実施の形態4〜8で説明する)、メディアデータの重要度は、「符号化対象のメディアデータの欠落が、メディア再生の品質に及ぼす影響の度合い」を示す指標であり、影響度が大きい程、重要度が高い。
【0024】
符号化レート決定部14は、重要度判別部13がメディアデータの重要度を判別すると、その重要度を基準にして、特徴量抽出処理部12により入力されたメディアデータを圧縮符号化する際の符号化レートErateを決定し、その符号化レートErateを符号化処理部16に出力する(ステップST4)。
符号化レートErateの具体的な決定処理は後述する。
【0025】
符号化処理部16は、符号化レート決定部14から符号化レートErateを受けると、その符号化レートErateで、特徴量抽出処理部12から出力された特徴量に応じてメディアデータを圧縮符号化し、圧縮符号化後のメディアデータであるメディア符号化データを誤り訂正符号付加部17に出力する(ステップST5)。
メディアデータを圧縮符号化する具体的な手順として、例えば、「ISO/IEC MPEG(Moving Picture Experts Group)−1/2/4」や、「ITU−T勧告 H.261/262/263/264」に規定されている圧縮符号化技術を利用すればよいので、ここでは詳細な説明を省略する。
【0026】
誤り訂正符号付加レート決定部15は、重要度判別部13がメディアデータの重要度を判別すると、その重要度を基準にして、符号化処理部16により圧縮符号化されたメディアデータに付加する誤り訂正符号の付加レートArateを決定し、誤り訂正符号の付加レートArateを誤り訂正符号付加部17に出力する(ステップST6)。
付加レートArateの具体的な決定処理は後述する。
【0027】
誤り訂正符号付加部17は、符号化処理部16からメディア符号化データを受けると、そのメディア符号化データが伝送中に破損した場合に、受信側が破損したメディア符号化データを復旧させる際に利用する誤り訂正符号を生成する。
即ち、誤り訂正符号付加部17は、符号化処理部16から出力された付加レートArateに対応するデータ長の誤り訂正符号を生成し、その誤り訂正符号をメディア符号化データに付加する(ステップST7)。
誤り訂正符号を付加する具体的な手順については、例えば、リードソロモン符号の手順や、「IETF RFC2733 “An RTP Payload Format for Generic Forward Error Correction”」に規定されているFECパケット挿入の手順を利用すればよいので、ここでは詳細な説明を省略する。
【0028】
ここで、図3は符号化レートErateで圧縮符号化されたメディアデータ及び付加レートArateで付加された誤り訂正符号を示す説明図である。
以下、図3を参照して、重要度判別部13により判別された重要度に応じて、符号化レートErate及び付加レートArateを決定する処理内容を具体的に説明する。
図3において、縦軸は誤り訂正符号付きのメディア符号化データ(メディア符号化データ+誤り訂正符号)の伝送レートを表している。
横軸は誤り訂正符号付きのメディア符号化データの伝送時間を表しており、面積は伝送可能なメディア符号化データ及び誤り訂正符号の情報量を表している。
【0029】
また、図3の例では、メディアデータの重要度が「高/中/低」の3段階の場合を示している。
図3の上側の図は、メディアデータの重要度が考慮されていない場合の誤り訂正符号とメディア符号化データの配分であり、メディアデータの重要度と関係なく、常に、誤り訂正符号とメディア符号化データのレート配分が一定である。
図3の下側の図は、メディアデータの重要度が考慮されている場合の誤り訂正符号とメディア符号化データの配分である。
【0030】
重要度が高いメディアデータは、伝送誤りによって欠落すると、メディアの再生品質に与える影響が大きいので、仮に欠落しても受信側で正確に訂正できるように誤り訂正能力を上げる必要がある。
そこで、誤り訂正符号付加部17は、メディアデータの重要度が高い場合、重要度が低い場合よりも、誤り訂正符号の付加レートArateを増やしている(図3の下側の図を参照)。
しかし、全体の伝送レートを一定に維持するには、誤り訂正符号の付加レートArateの増加に伴ってメディアデータの符号化レートErateを減少させる必要があるので、符号化レート決定部14がメディアデータの符号化レートErateを下げている。
【0031】
ただし、誤り訂正符号の付加レートArateを増す前後で、同等の情報量を伝送可能にするため、全体の伝送時間のうち、重要度が高いメディアデータの符号化データに割り当てる伝送時間を長くして、伝送可能な情報量を確保している。
重要度が高いメディアデータの符号化データに割り当てる伝送時間を長くした分、重要度が「中/低」のメディアデータの符号化データに割り当てる伝送時間を短くすることで、全体の伝送時間を維持している。
なお、伝送時間の短縮によって、重要度が「中/低」のメディアデータの伝送可能な情報量が不足する場合には、重要度が低いメディアデータの符号化データに付加する誤り訂正符号の付加レートArateを減少させて情報量を確保するようにする。
【0032】
データ送出部18は、誤り訂正符号付加部17から誤り訂正符号付きのメディア符号化データを受けると、誤り訂正符号付きのメディア符号化データをネットワーク3に送出する(ステップST8)。
上述したように、符号化レートErate及び付加レートArateがメディアデータの重要度に応じて決定されているので、データ送出部18から送出される誤り訂正符号付きのメディア符号化データの伝送レートは一定に制御される。
しかし、実際には、メディアデータの内容等によって伝送レートに誤差が生じることがある。
【0033】
そこで、伝送レート補正部19は、データ送出部18から送出された誤り訂正符号付きのメディア符号化データの伝送レートを監視し、その伝送レートが予め設定されている許容範囲内から逸脱していれば(ステップST9)、符号化レート決定部14及び誤り訂正符号付加レート決定部15に対して、符号化レートErate及び付加レートArateの補正を指示して、その伝送レートを許容範囲内に収めるようにする(ステップST10)。
具体的には、以下の通りである。
【0034】
伝送レート補正部19は、データ送出部18から送出された誤り訂正符号付きのメディア符号化データの伝送レートを監視して、そのメディア符号化データの全体の伝送レートと、そのメディア符号化データの重要度別の伝送レートを分析する。
伝送レート補正部19は、そのメディア符号化データの全体の伝送レートが許容範囲を超えて変動している場合、変動が特定の重要度に係る誤り訂正符号付きのメディア符号化データ(例えば、重要度が高いメディアデータが圧縮符号化されている符号化データ及び誤り訂正符号)にのみ発生しているのか、特定の重要度に関わらず全体的に変動している(全ての重要度に係る誤り訂正符号付きのメディア符号化データに変動が発生している)のかを確認する。
【0035】
伝送レート補正部19は、変動が特定の重要度に係る誤り訂正符号付きのメディア符号化データにのみ発生している場合、該当する重要度に対応する符号化レートErateの補正指示を符号化レート決定部14に出力し、また、該当する重要度に対応する付加レートArateの補正を誤り訂正符号付加レート決定部15に出力する。
これにより、符号化レート決定部14が該当する重要度に対応する符号化レートErateを下げる補正を実施し、誤り訂正符号付加レート決定部15が該当する重要度に対応する付加レートArateを下げる補正を実施する。
【0036】
伝送レート補正部19は、特定の重要度に関わらず全体的に変動している場合、全ての重要度に対応する符号化レートErateの補正指示を符号化レート決定部14に出力し、また、全ての重要度に対応する付加レートArateの補正指示を誤り訂正符号付加レート決定部15に出力する。
これにより、符号化レート決定部14が全ての重要度に対応する符号化レートErateを下げる補正を実施し、誤り訂正符号付加レート決定部15が全ての重要度に対応する付加レートArateを下げる補正を実施する。
【0037】
以上で明らかなように、この実施の形態1によれば、符号化対象のメディアデータの重要度を判別する重要度判別部13と、重要度判別部13により判別された重要度を基準にして、そのメディアデータを圧縮符号化する際の符号化レートErateを決定する符号化レート決定部14と、重要度判別部13により判別された重要度を基準にして、圧縮符号化後のメディアデータに付加する誤り訂正符号の付加レートArateを決定する誤り訂正符号付加レート決定部15と、符号化レート決定部14により決定された符号化レートErateでメディアデータを圧縮符号化して、圧縮符号化後のメディアデータであるメディア符号化データを出力する符号化処理部16と、符号化処理部16から出力されたメディア符号化データに対して、誤り訂正符号付加レート決定部15により決定された付加レートArateで誤り訂正符号を付加し、誤り訂正符号付きのメディア符号化データを出力する誤り訂正符号付加部17とを設け、データ送出部18が誤り訂正符号付加部17から出力された誤り訂正符号付きのメディア符号化データをネットワーク3に送出するように構成したので、メディアの再生品質を維持しながら、帯域利用効率の低下を防止することができる効果を奏する。
【0038】
また、データ送出部18から送出された誤り訂正符号付きのメディア符号化データの伝送レートが許容範囲内から逸脱している場合、伝送レート補正部19が符号化レート決定部14及び誤り訂正符号付加レート決定部15に対して、符号化レートErate及び付加レートArateの補正を指示して、伝送レートを許容範囲内に収めるように構成したので、回線の帯域に制限がある伝送路を使用する場合でも、伝送誤りの発生を防止することができる効果を奏する。
【0039】
実施の形態2.
図4はこの発明の実施の形態2によるメディア符号化伝送装置を示す構成図であり、図において、図1と同一符号は同一又は相当部分を示すので説明を省略する。
映像圧縮符号化処理部11aは映像特徴量抽出処理部12a及び映像符号化処理部16aから構成されており、メディアソース2からメディアデータである映像データを入力すると、その映像データの特徴量を抽出して、その特徴量を映像重要度判別部13aに出力するとともに、その映像データを圧縮符号化して、圧縮符号化後の映像データである映像符号化データを映像誤り訂正符号付加部17aに出力する処理を実施する。
音声圧縮符号化処理部11bは音声特徴量抽出処理部12b及び音声符号化処理部16bから構成されており、メディアソース2からメディアデータである音声データを入力すると、その音声データの特徴量を抽出して、その特徴量を音声重要度判別部13bに出力するとともに、その音声データを圧縮符号化して、圧縮符号化後の音声データである音声符号化データを音声誤り訂正符号付加部17bに出力する処理を実施する。
【0040】
映像特徴量抽出処理部12aはメディアソース2から符号化対象の映像データを入力するインタフェース(例えば、ビデオ入力端子)を備えており、入力した符号化対象の映像データの特徴量(例えば、動きベクトル、DCT係数など)を抽出して、その特徴量を映像重要度判別部13a及び映像符号化処理部16aに出力するとともに、その映像データを映像符号化処理部16aに出力する処理を実施する。
音声特徴量抽出処理部12bはメディアソース2から符号化対象の音声データを入力するインタフェース(例えば、音声入力端子)を備えており、入力した符号化対象の音声データの特徴量を抽出して、その特徴量を音声重要度判別部13b及び音声符号化処理部16bに出力するとともに、その音声データを音声符号化処理部16bに出力する処理を実施する。
【0041】
映像重要度判別部13aは映像特徴量抽出処理部12aから出力された特徴量を参照して、符号化対象の映像データの重要度を判別する処理を実施する。
音声重要度判別部13bは音声特徴量抽出処理部12bから出力された特徴量を参照して、符号化対象の音声データの重要度を判別する処理を実施する。
なお、映像特徴量抽出処理部12a、音声特徴量抽出処理部12b、映像重要度判別部13a及び音声重要度判別部13bから重要度判別手段が構成されている。
【0042】
映像符号化レート決定部14aは映像重要度判別部13aにより判別された重要度を基準にして、映像特徴量抽出処理部12aにより入力された映像データを圧縮符号化する際の符号化レートを決定する処理を実施する。
音声符号化レート決定部14bは音声重要度判別部13bにより判別された重要度を基準にして、音声特徴量抽出処理部12bにより入力された音声データを圧縮符号化する際の符号化レートを決定する処理を実施する。
【0043】
映像誤り訂正符号付加レート決定部15aは映像重要度判別部13aにより判別された重要度を基準にして、映像符号化処理部16aにより圧縮符号化された映像データに付加する誤り訂正符号の付加レートを決定する処理を実施する。
音声誤り訂正符号付加レート決定部15bは音声重要度判別部13bにより判別された重要度を基準にして、音声符号化処理部16bにより圧縮符号化された音声データに付加する誤り訂正符号の付加レートを決定する処理を実施する。
なお、映像符号化レート決定部14a、音声符号化レート決定部14b、映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bからレート決定手段が構成されている。
【0044】
映像符号化処理部16aは映像符号化レート決定部14aにより決定された符号化レートで、映像特徴量抽出処理部12aから出力された特徴量に応じて映像データを圧縮符号化し、圧縮符号化後の映像データである映像符号化データを出力する処理を実施する。
音声符号化処理部16bは音声符号化レート決定部14bにより決定された符号化レートで、音声特徴量抽出処理部12bから出力された特徴量に応じて音声データを圧縮符号化し、圧縮符号化後の音声データである音声符号化データを出力する処理を実施する。
なお、映像符号化処理部16a及び音声符号化処理部16bからメディアデータ符号化手段が構成されている。
【0045】
映像誤り訂正符号付加部17aは映像符号化処理部16aから出力された映像符号化データに対して、映像誤り訂正符号付加レート決定部15aにより決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きの映像符号化データを出力する処理を実施する。
音声誤り訂正符号付加部17bは音声符号化処理部16bから出力された音声符号化データに対して、音声誤り訂正符号付加レート決定部15bにより決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きの音声符号化データを出力する処理を実施する。
なお、映像誤り訂正符号付加部17a及び音声誤り訂正符号付加部17bから誤り訂正符号付加手段が構成されている。
【0046】
データ送出部20はネットワーク3に対するインタフェース(例えば、無線LANアダプタ、無線通信機器など)を備えており、映像誤り訂正符号付加部17aから出力された誤り訂正符号付きの映像符号化データ及び音声誤り訂正符号付加部17bから出力された誤り訂正符号付きの音声符号化データをネットワーク3に送出する処理を実施する。なお、データ送出部20はデータ送出手段を構成している。
伝送レート補正部21はデータ送出部20から送出された誤り訂正符号付きのメディア符号化データ(誤り訂正符号付きの映像符号化データ+誤り訂正符号付きの音声符号化データ)の伝送レートが予め設定されている許容範囲内から逸脱している場合、映像符号化レート決定部14a及び音声符号化レート決定部14bに対して符号化レートの補正を指示するとともに、映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bに対して付加レートの補正を指示して、その伝送レートを許容範囲内に収める処理を実施する。なお、伝送レート補正部21はレート補正手段を構成している。
【0047】
図4の例では、メディア符号化伝送装置の構成要素である映像特徴量抽出処理部12a、音声特徴量抽出処理部12b、映像重要度判別部13a、音声重要度判別部13b、映像符号化レート決定部14a、音声符号化レート決定部14b、映像誤り訂正符号付加レート決定部15a、音声誤り訂正符号付加レート決定部15b、映像符号化処理部16a、音声符号化処理部16b、映像誤り訂正符号付加部17a、音声誤り訂正符号付加部17b、データ送出部20及び伝送レート補正部21のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、メディア符号化伝送装置がコンピュータで構成される場合、映像特徴量抽出処理部12a、音声特徴量抽出処理部12b、映像重要度判別部13a、音声重要度判別部13b、映像符号化レート決定部14a、音声符号化レート決定部14b、映像誤り訂正符号付加レート決定部15a、音声誤り訂正符号付加レート決定部15b、映像符号化処理部16a、音声符号化処理部16b、映像誤り訂正符号付加部17a、音声誤り訂正符号付加部17b、データ送出部20及び伝送レート補正部21の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
【0048】
上記実施の形態1では、メディアデータを圧縮符号化して伝送するものについて示したが、通常、メディアデータには、映像データや音声データなど、複数種類のデータが重畳されている場合が多い。
しかし、映像データから見て重要度が高いシーンが、音声データにおいても重要度が高いとは限らない。逆に、音声データから見て重要度が高いシーンが、映像データにおいても重要度が高いとは限らない。
そこで、この実施の形態2では、映像データと音声データの重要度を個別に判別して、映像データに係る符号化レートIErate及び付加レートIArateと、音声データに係る符号化レートVErate及び付加レートVArateとを別個に決定するようにする。
【0049】
次に動作について説明する。
映像圧縮符号化処理部11aの映像特徴量抽出処理部12aは、メディアソース2から符号化対象の映像データを入力すると、図1の特徴量抽出処理部12と同様に、その映像データの特徴量を抽出する。
映像特徴量抽出処理部12aは、映像データの特徴量を抽出すると、その特徴量を映像重要度判別部13a及び映像符号化処理部16aに出力するとともに、その映像データを映像符号化処理部16aに出力する。
【0050】
音声圧縮符号化処理部11bの音声特徴量抽出処理部12bは、メディアソース2から符号化対象の音声データを入力すると、図1の特徴量抽出処理部12と同様に、その音声データの特徴量を抽出する。
音声特徴量抽出処理部12bは、音声データの特徴量を抽出すると、その特徴量を音声重要度判別部13b及び音声符号化処理部16bに出力するとともに、その音声データを音声符号化処理部16bに出力する。
【0051】
映像重要度判別部13aは、映像特徴量抽出処理部12aから映像データの特徴量を受けると、図1の重要度判別部13と同様に、その特徴量を参照して、符号化対象の映像データの重要度を判別する。
音声重要度判別部13bは、音声特徴量抽出処理部12bから音声データの特徴量を受けると、図1の重要度判別部13と同様に、その特徴量を参照して、符号化対象の音声データの重要度を判別する。
【0052】
映像符号化レート決定部14aは、映像重要度判別部13aが映像データの重要度を判別すると、図1の符号化レート決定部14と同様に、その重要度を基準にして、映像特徴量抽出処理部12aにより入力された映像データを圧縮符号化する際の符号化レートIErateを決定し、その符号化レートIErateを映像符号化処理部16aに出力する。
音声符号化レート決定部14bは、音声重要度判別部13bが音声データの重要度を判別すると、図1の符号化レート決定部14と同様に、その重要度を基準にして、音声特徴量抽出処理部12bにより入力された音声データを圧縮符号化する際の符号化レートVErateを決定し、その符号化レートVErateを音声符号化処理部16bに出力する。
【0053】
映像符号化処理部16aは、映像符号化レート決定部14aから符号化レートIErateを受けると、図1の符号化処理部16と同様に、その符号化レートIErateで、映像特徴量抽出処理部12aから出力された特徴量に応じて映像データを圧縮符号化し、圧縮符号化後の映像データである映像符号化データを映像誤り訂正符号付加部17aに出力する。
音声符号化処理部16bは、音声符号化レート決定部14bから符号化レートVErateを受けると、図1の符号化処理部16と同様に、その符号化レートVErateで、音声特徴量抽出処理部12bから出力された特徴量に応じて音声データを圧縮符号化し、圧縮符号化後の音声データである音声符号化データを音声誤り訂正符号付加部17bに出力する。
【0054】
映像誤り訂正符号付加レート決定部15aは、映像重要度判別部13aが映像データの重要度を判別すると、図1の誤り訂正符号付加レート決定部15と同様に、その重要度を基準にして、映像符号化処理部16aにより圧縮符号化された映像データに付加する誤り訂正符号の付加レートIArateを決定し、誤り訂正符号の付加レートIArateを映像誤り訂正符号付加部17aに出力する。
音声誤り訂正符号付加レート決定部15bは、音声重要度判別部13bが音声データの重要度を判別すると、図1の誤り訂正符号付加レート決定部15と同様に、その重要度を基準にして、音声符号化処理部16bにより圧縮符号化された音声データに付加する誤り訂正符号の付加レートVArateを決定し、誤り訂正符号の付加レートVArateを音声誤り訂正符号付加部17bに出力する。
【0055】
映像誤り訂正符号付加部17aは、映像符号化処理部16aから映像符号化データを受けると、その映像符号化データが伝送中に破損した場合に、受信側が破損した映像符号化データを復旧させる際に利用する誤り訂正符号を生成する。
即ち、映像誤り訂正符号付加部17aは、映像符号化処理部16aから出力された付加レートIArateに対応するデータ長の誤り訂正符号を生成し、その誤り訂正符号を映像符号化データに付加する。
【0056】
音声誤り訂正符号付加部17bは、音声符号化処理部16bから音声符号化データを受けると、その音声符号化データが伝送中に破損した場合に、受信側が破損した音声符号化データを復旧させる際に利用する誤り訂正符号を生成する。
即ち、音声誤り訂正符号付加部17bは、音声符号化処理部16bから出力された付加レートVArateに対応するデータ長の誤り訂正符号を生成し、その誤り訂正符号を音声符号化データに付加する。
【0057】
データ送出部20は、映像誤り訂正符号付加部17aから誤り訂正符号付きの映像符号化データを受け、音声誤り訂正符号付加部17bから誤り訂正符号付きの音声符号化データを受けると、誤り訂正符号付きのメディア符号化データ(誤り訂正符号付きの映像符号化データ+誤り訂正符号付きの音声符号化データ)をネットワーク3に送出する。
上述したように、符号化レートIErate,VErate及び付加レートIArate,VArateが映像データ/音声データの重要度に応じて決定されているので、データ送出部20から送出される誤り訂正符号付きのメディア符号化データの伝送レートは一定に制御される。
しかし、実際には、メディアデータの内容等によって伝送レートに誤差が生じることがある。
【0058】
そこで、伝送レート補正部21は、データ送出部20から送出された誤り訂正符号付きのメディア符号化データの伝送レートを監視し、その伝送レートが予め設定されている許容範囲内から逸脱していれば、映像符号化レート決定部14a及び音声符号化レート決定部14bに対して符号化レートIErate,VErateの補正を指示するとともに、映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bに対して付加レートIArate,VArateの補正を指示して、その伝送レートを許容範囲内に収めるようにする。
具体的には、以下の通りである。
【0059】
伝送レート補正部21は、データ送出部20から送出された誤り訂正符号付きのメディア符号化データの伝送レートを監視して、そのメディア符号化データの全体の伝送レートと、そのメディア符号化データの重要度別の伝送レートを分析する。
伝送レート補正部21は、そのメディア符号化データの全体の伝送レートが許容範囲を超えて変動している場合、変動が特定の重要度に係る誤り訂正符号付きのメディア符号化データ(例えば、重要度が高い映像データ/音声データが圧縮符号化されている符号化データ及び誤り訂正符号)にのみ発生しているのか、特定の重要度に関わらず全体的に変動している(全ての重要度に係る誤り訂正符号付きのメディア符号化データに変動が発生している)のかを確認する。
【0060】
伝送レート補正部21は、変動が特定の重要度に係る誤り訂正符号付きの映像符号化データにのみ発生している場合、該当する重要度に対応する符号化レートIErateの補正指示を映像符号化レート決定部14aに出力し、また、該当する重要度に対応する付加レートIArateの補正を映像誤り訂正符号付加レート決定部15aに出力する。
これにより、映像符号化レート決定部14aが該当する重要度に対応する符号化レートIErateを下げる補正を実施し、映像誤り訂正符号付加レート決定部15aが該当する重要度に対応する付加レートIArateを下げる補正を実施する。
【0061】
伝送レート補正部21は、変動が特定の重要度に係る誤り訂正符号付きの音声符号化データにのみ発生している場合、該当する重要度に対応する符号化レートVErateの補正指示を音声符号化レート決定部14bに出力し、また、該当する重要度に対応する付加レートVArateの補正を音声誤り訂正符号付加レート決定部15bに出力する。
これにより、音声符号化レート決定部14bが該当する重要度に対応する符号化レートVErateを下げる補正を実施し、音声誤り訂正符号付加レート決定部15bが該当する重要度に対応する付加レートVArateを下げる補正を実施する。
【0062】
伝送レート補正部21は、特定の重要度に関わらず全体的に変動している場合、全ての重要度に対応する符号化レートIErate,VErateの補正指示を映像符号化レート決定部14a及び音声符号化レート決定部14bに出力し、また、全ての重要度に対応する付加レートIArate,VArateの補正指示を映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bに出力する。
これにより、映像符号化レート決定部14a及び音声符号化レート決定部14bが全ての重要度に対応する符号化レートIErate,VErateを下げる補正を実施し、映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bが全ての重要度に対応する付加レートIArate,VArateを下げる補正を実施する。
【0063】
以上で明らかなように、この実施の形態2によれば、映像データと音声データの重要度を個別に判別して、映像データに係る符号化レートIErate及び付加レートIArateと、音声データに係る符号化レートVErate及び付加レートVArateとを別個に決定するように構成したので、同一シーンの映像データと音声データの重要度が異なる場合でも、メディアの再生品質を維持しながら、帯域利用効率の低下を防止することができるとともに、回線の帯域に制限がある伝送路を使用する場合でも、伝送誤りの発生を防止することができる効果を奏する。
【0064】
実施の形態3.
上記実施の形態2では、映像データと音声データの重要度を個別に判別して、映像データに係る符号化レートIErate及び付加レートIArateと、音声データに係る符号化レートVErate及び付加レートVArateとを別個に決定するものについて示したが、例えば、MPEGシステムなどのように、映像データと音声データを符号化した後、誤り訂正符号を付加する前に、映像符号化データと音声符号化データを多重化する場合、上記実施の形態2を適用することができない。
この実施の形態3では、映像データと音声データを符号化した後、誤り訂正符号を付加する前に、映像符号化データと音声符号化データを多重化する場合でも、適用可能な実施形態を開示する。
【0065】
図5はこの発明の実施の形態3によるメディア符号化伝送装置を示す構成図であり、図において、図4と同一符号は同一又は相当部分を示すので説明を省略する。
映像音声多重部22は映像符号化処理部16aから出力された映像符号化データと音声符号化処理部16bから出力された音声符号化データを多重化し、メディア符号化データ(映像符号化データ+音声符号化データ)を映像音声整列部23に出力する処理を実施する。なお、映像音声多重部22はデータ多重化手段を構成している。
映像音声整列部23は映像音声多重部22から出力されたメディア符号化データ内の映像符号化データと音声符号化データの並び替え処理を実施する。なお、映像音声整列部23はデータ整列手段を構成している。
【0066】
映像誤り訂正符号付加部24aは映像音声整列部23により並び替えが行われたメディア符号化データ内の映像符号化データに対して、映像誤り訂正符号付加レート決定部15aにより決定された付加レートで誤り訂正符号を付加する処理を実施する。
音声誤り訂正符号付加部24bは映像音声整列部23により並び替えが行われたメディア符号化データ内の音声符号化データに対して、音声誤り訂正符号付加レート決定部15bにより決定された付加レートで誤り訂正符号を付加する処理を実施する。
なお、映像誤り訂正符号付加部24a及び音声誤り訂正符号付加部24bから誤り訂正符号付加手段が構成されている。
【0067】
図5の例では、メディア符号化伝送装置の構成要素である映像特徴量抽出処理部12a、音声特徴量抽出処理部12b、映像重要度判別部13a、音声重要度判別部13b、映像符号化レート決定部14a、音声符号化レート決定部14b、映像誤り訂正符号付加レート決定部15a、音声誤り訂正符号付加レート決定部15b、映像符号化処理部16a、音声符号化処理部16b、映像音声多重部22、映像音声整列部23、映像誤り訂正符号付加部24a、音声誤り訂正符号付加部24b、データ送出部20及び伝送レート補正部21のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、メディア符号化伝送装置がコンピュータで構成される場合、映像特徴量抽出処理部12a、音声特徴量抽出処理部12b、映像重要度判別部13a、音声重要度判別部13b、映像符号化レート決定部14a、音声符号化レート決定部14b、映像誤り訂正符号付加レート決定部15a、音声誤り訂正符号付加レート決定部15b、映像符号化処理部16a、音声符号化処理部16b、映像音声多重部22、映像音声整列部23、映像誤り訂正符号付加部24a、音声誤り訂正符号付加部24b、データ送出部20及び伝送レート補正部21の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
【0068】
次に動作について説明する。
映像音声多重部22は、映像符号化処理部16aが映像データを圧縮符号化して映像符号化データを出力し、音声符号化処理部16bが音声データを圧縮符号化して音声符号化データを出力すると、その映像符号化データと音声符号化データを多重化し、メディア符号化データ(映像符号化データ+音声符号化データ)を映像音声整列部23に出力する。
ここで、図6は映像音声多重部22により多重化された映像符号化データ及び音声符号化データと、映像音声整列部23により並び替えが行われた映像符号化データ及び音声符号化データと、誤り訂正符号が付加された映像符号化データ及び音声符号化データとを示す説明図である。
【0069】
映像音声整列部23は、映像音声多重部22から図6に示すようなメディア符号化データ(映像符号化データ+音声符号化データ)を受けると、そのメディア符号化データ内の映像符号化データと音声符号化データの並び替え処理を実施する。
具体的には、以下に示すような並び替え処理を実施する。
【0070】
例えば、映像符号化データに対して、5パケット毎に1つの誤り訂正符号を付加するように指定されている場合、映像符号化データのパケット[1]〜[5]に対して、1つの誤り訂正符号を付加する。
図6の例では、映像符号化データのパケット[1]〜[5]の次に2つの映像符号化データのパケット[6][7]が入力されているが、5つのパケットが入力される前に、音声符号化データのパケット[8]が入力されているため、映像符号化データの5つのパケットに対して、1つの誤り訂正符号を付加することができない。
そこで、音声符号化データのパケット[8]の次に入力された映像符号化データのパケット[9]〜[11]を、音声符号化データのパケット[8]の前に入れ替える並び替え処理を行って、映像符号化データの5つのパケット[6][7][9][10][11]に対して、1つの誤り訂正符号を付加することができるようにしている。
【0071】
ただし、伝送にMPEGシステムを利用する場合、メディア符号化データの中に、送信側と受信側の時刻を同期させるための信号(PCR:Program Clock Reference)が含まれている。
このPCRが含まれているパケットの送信順序を並べ替えると、受信側において、時刻同期がずれてしまうため、並べ替えの対象となるパケットの中にPCRが含まれている場合、受信側での時刻同期がずれないように、PCRの補正も合わせて行うことで、受信側での時刻同期を守るようにしている。
【0072】
映像誤り訂正符号付加部24aは、映像音声整列部23がメディア符号化データ内の映像符号化データと音声符号化データの並び替えを行うと、並び替えが行われたメディア符号化データ内の映像符号化データに対して、映像誤り訂正符号付加レート決定部15aにより決定された付加レートIArateで誤り訂正符号を付加する。
図6では、例えば、映像符号化データのパケット[1]〜[5]に対して、1つの誤り訂正符号を付加し、また、映像符号化データのパケット[6][7][9][10][11]に対して、1つの誤り訂正符号を付加している。
【0073】
音声誤り訂正符号付加部24bは、映像音声整列部23がメディア符号化データ内の映像符号化データと音声符号化データの並び替えを行うと、並び替えが行われたメディア符号化データ内の音声符号化データに対して、音声誤り訂正符号付加レート決定部15bにより決定された付加レートVArateで誤り訂正符号を付加する。
図6の例では、音声符号化データのパケット[8]に対して、1つの誤り訂正符号を付加している。
データ送出部20及び伝送レート補正部21の処理内容は、上記実施の形態2と同様であるため説明を省略する。
【0074】
以上で明らかなように、この実施の形態3によれば、映像音声整列部23が映像音声多重部22から出力されたメディア符号化データ内の映像符号化データと音声符号化データの並び替えを行うように構成したので、MPEGシステムなどのように、映像データと音声データを符号化した後、誤り訂正符号を付加する前に、映像符号化データと音声符号化データを多重化する場合でも適用することができる。
【0075】
実施の形態4.
この実施の形態4では、図1の特徴量抽出部12(図4及び図5の映像特徴量抽出部12a、音声特徴量抽出部12bを含む)が符号化対象のメディアデータの特徴量として、そのメディアデータがヘッダ部を構成している情報であるのか、データ部を構成している情報であるのかを確認し、図1の重要度判別部13(図4及び図5の映像重要度判別部13a、音声重要度判別部13bを含む)が、符号化対象のメディアデータがヘッダ部を構成している情報であれば、そのメディアデータの重要度が「高」であると判別し、符号化対象のメディアデータがデータ部を構成している情報であれば、そのメディアデータの重要度が「中」又は「低」であると判別するようにする。
【0076】
具体的には、以下の通りである。
メディアデータのデータ部には、例えば、映像データや音声データなど、実際に伝送したい情報が格納され、ヘッダ部には、データ部に格納されている情報の種別やデータ構成などが格納される。
ヘッダ部の種類には、例えば、MPEGシステムでは、映像の縦横の画素数や、フレームレートなどが格納されているシーケンスヘッダや、シーケンスの先頭からの時間などが格納されたGOP(Group of Picture)ヘッダなどがある。
ヘッダ部が欠落すると、データ部に格納されている情報の種別や構成が分からなくなり、データ部が正常に受信されても、メディアデータの復号ができなくなってしまうため、ヘッダ部はデータ部よりも重要度が高い。
【0077】
そこで、特徴量抽出部12は、符号化対象のメディアデータの特徴量として、そのメディアデータがヘッダ部を構成している情報であるのか、データ部を構成している情報であるのかを確認する。
重要度判別部13は、符号化対象のメディアデータがヘッダ部を構成している情報であれば、そのメディアデータの重要度が「高」であると判別し、符号化対象のメディアデータがデータ部を構成している情報であれば、そのメディアデータの重要度が「中」又は「低」であると判別する。
【0078】
以上で明らかなように、この実施の形態4によれば、符号化対象のメディアデータの重要度を判別する際、そのメディアデータがヘッダ部を構成している情報であるのか、データ部を構成している情報であるのかを確認し、そのメディアデータがヘッダ部を構成している情報である場合の重要度を、データ部を構成している情報である場合の重要度より高く設定するように構成したので、ヘッダ部の誤り訂正能力を高めて、復号メディアの品質を高めることができる効果を奏する。
【0079】
実施の形態5.
この実施の形態5では、符号化対象のメディアデータが映像データである場合、図1の特徴量抽出部12(図4及び図5の映像特徴量抽出部12aを含む)が符号化対象の映像データの特徴量として、その映像データのピクチャタイプを確認し、図1の重要度判別部13(図4及び図5の映像重要度判別部13aを含む)が、そのピクチャタイプを基準にして、その映像データの重要度を判別するようにする。
【0080】
具体的には、以下の通りである。
例えば、映像データの圧縮符号化にMPEG−2を利用する場合、Iピクチャが欠落すると、そのIピクチャを参照するPピクチャやBピクチャの復号にも影響を及ぼしてしまうため、Iピクチャは、PピクチャやBピクチャよりも重要度が高いデータであるといえる。
また、Pピクチャが欠落すると、そのPピクチャを参照するBピクチャの復号にも影響を及ぼしてしまうため、Pピクチャは、Bピクチャよりも重要度が高いデータであるといえる。
【0081】
そこで、特徴量抽出部12は、符号化対象の映像データの特徴量として、その映像データのピクチャタイプを確認する。
重要度判別部13は、特徴量抽出部12が映像データのピクチャタイプを確認すると、そのピクチャタイプを基準にして、その映像データの重要度を判別する。
例えば、映像データのピクチャタイプがIピクチャであれば、その映像データの重要度が「高」であると判別し、映像データのピクチャタイプがPピクチャであれば、その映像データの重要度が「中」であると判別し、映像データのピクチャタイプがBピクチャであれば、その映像データの重要度が「低」であると判別する。
【0082】
以上で明らかなように、この実施の形態5によれば、符号化対象のメディアデータが映像データである場合、その映像データのピクチャタイプを確認し、そのピクチャタイプを基準にして、その映像データの重要度を判別するように構成したので、復号映像の画質を高めることができる効果を奏する。
【0083】
実施の形態6.
この実施の形態6では、符号化対象のメディアデータが映像データである場合、図1の特徴量抽出部12(図4及び図5の映像特徴量抽出部12aを含む)が符号化対象の映像データの特徴量として、その映像データが圧縮符号化される際に用いられる動きベクトルを確認し、図1の重要度判別部13(図4及び図5の映像重要度判別部13aを含む)が、その動きベクトルを基準にして、その映像データの重要度を判別するようにする。
【0084】
具体的には、以下の通りである。
例えば、MPEGなどの映像圧縮符号化方式では、圧縮符号化手法の一つとして、動き補償フレーム間予測が行われる。
動き補償フレーム間予測が行われるとき、大きな移動量(動きベクトル)を持っているピクチャは、参照画像からの変化が大きいことを意味するので、このピクチャが欠落すると、このピクチャを参照するピクチャの復号映像に影響を与えることになる。
このため、大きな動きベクトルを持つピクチャは、大きな動きベクトルを持たないピクチャよりも重要度が高いといえる。
これより、例えば、ピクチャの持つ動きベクトルの大きさの平均値が大きいピクチャの重要度を高くすることによって、PピクチャやBピクチャの中でも、重要度が高いピクチャと重要度が低いピクチャを判定して、より細かく符号化レートや誤り訂正符号の付加レートを制御することができる。
【0085】
そこで、特徴量抽出部12は、符号化対象の映像データの特徴量として、その映像データが圧縮符号化される際に用いられる動きベクトルを確認する。動きベクトルを確認するに際して、特徴量抽出部12が動きベクトルを探索する動きベクトル探索部を実装するようにしてもよいし、図1の符号化処理部16(図4及び図5の映像符号化処理部16aを含む)から圧縮符号化される際に用いられる動きベクトルを取得するようにしてもよい。
重要度判別部13は、特徴量抽出部12により確認された動きベクトルを基準にして、映像データの重要度を判別する。
例えば、動きベクトルの大きさの平均値が大きいピクチャ(映像データ)である程、当該ピクチャの重要度を高く設定する。
【0086】
以上で明らかなように、この実施の形態6によれば、符号化対象のメディアデータが映像データである場合、その映像データが圧縮符号化される際に用いられる動きベクトルを基準にして、その映像データの重要度を判別するように構成したので、符号化レートや付加レートをきめ細かく制御することができるようになり、その結果、復号映像の画質を高めることができる効果を奏する。
【0087】
なお、この実施の形態6では、動きベクトルの大きさの平均値が大きいピクチャ(映像データ)である程、当該ピクチャの重要度を高く設定するものについて示したが、これに限るものではなく、例えば、ある閾値以上の大きさを持つ動きベクトルの数や、ある方向を向いている動きベクトルの数などに応じて、映像データの重要度を判別するようにしてもよい。
【0088】
実施の形態7.
この実施の形態7では、符号化対象のメディアデータが映像データである場合、図1の特徴量抽出部12(図4及び図5の映像特徴量抽出部12aを含む)が符号化対象の映像データの特徴量として、その映像データが圧縮符号化される際に算出されるDCT係数(離散コサイン変換係数)を確認し、図1の重要度判別部13(図4及び図5の映像重要度判別部13aを含む)が、そのDCT係数を基準にして、その映像データの重要度を判別するようにする。
【0089】
具体的には、以下の通りである。
例えば、MPEGなどの映像圧縮符号化方式では、空間方向の冗長度を削減するために、符号化対象の映像データをDCT変換して、その変換結果であるDCT係数を量子化する。
このとき、DCT係数のAC成分に大きな値(特に、高周波成分に大きな値)を持つピクチャは、ピクチャ内の画像が複雑であることを意味するので、DCT係数の分布を計算し、高周波成分に多くの値を持つピクチャの重要度を高く設定すれば、複雑な画像の誤り訂正能力を強化することができる。
【0090】
そこで、特徴量抽出部12は、符号化対象の映像データの特徴量として、その映像データが圧縮符号化される際に算出されるDCT係数を確認する。DCT係数を確認するに際して、特徴量抽出部12が、例えば、符号化対象の映像データと参照画像の映像データとの差分データをDCT変換してDCT係数を算出するDCT器を実装するようにしてもよいし、図1の符号化処理部16(図4及び図5の映像符号化処理部16aを含む)から圧縮符号化される際に算出されるDCT係数を取得するようにしてもよい。
重要度判別部13は、特徴量抽出部12により確認されたDCT係数を基準にして、映像データの重要度を判別する。
例えば、DCT係数のAC成分に大きな値を有するピクチャ(映像データ)である程、当該ピクチャの重要度を高く設定する。
【0091】
以上で明らかなように、この実施の形態7によれば、符号化対象のメディアデータが映像データである場合、その映像データの特徴量として、その映像データが圧縮符号化される際に算出されるDCT係数を確認し、そのDCT係数を基準にして、その映像データの重要度を判別するように構成したので、符号化レートや付加レートをきめ細かく制御することができるようになり、その結果、復号映像の画質を高めることができる効果を奏する。
【0092】
実施の形態8.
この実施の形態8では、符号化対象のメディアデータの重要度を判別する際、図1の特徴量抽出部12が、そのメディアデータが音声データを含んでいるか否かを確認し、図1の重要度判別部13が、音声データを含んでいる場合のメディアデータの重要度を、音声データを含んでいない場合のメディアデータの重要度より高いものと判別するようにする。
【0093】
具体的には、以下の通りである。
映像データは音声データと一緒に使用されることが多く、映像データは音声データが重畳されて伝送されることが多い。
音声データは、単位時間当たりのデータ量が映像データと比べて非常に小さいため、映像データであれば、復号映像の一部分の画質が劣化する程度のデータ量の欠落でも、音声データであれば、音声を復号することができないほどの欠落になる可能性がある。
つまり、1つのデータ欠落が復号音声に与える影響は、1つのデータ欠落が復号映像に与える影響より大きい。
このため、音声データを含むメディアデータの重要度を高く判定すれば、音声データの伝送誤り訂正能力を上げて、復号音声の品質を維持することができる。
【0094】
そこで、特徴量抽出部12は、符号化対象のメディアデータの特徴量として、そのメディアデータが音声データを含んでいるか否かを確認する。
重要度判別部13は、符号化対象のメディアデータが音声データを含んでいる場合のメディアデータの重要度を、音声データを含んでいない場合のメディアデータの重要度より高く設定する。
【0095】
以上で明らかなように、この実施の形態8によれば、符号化対象のメディアデータの重要度を判別する際、そのメディアデータが音声データを含んでいるか否かを確認し、音声データを含んでいる場合のメディアデータの重要度を、音声データを含んでいない場合のメディアデータの重要度より高く設定するように構成したので、音声データの伝送誤り訂正能力を上げて、復号音声の品質を維持することができる効果を奏する。
【0096】
実施の形態9.
上記実施の形態1〜8では、受信側において、誤り訂正を行うことができるようにするために、誤り訂正符号を付加しているが、誤り訂正符号は冗長なデータであり、伝送誤りが発生していなければ、誤り訂正符号が使用する帯域をメディア符号化データに割り当てた方が、より高画質なメディアデータを伝送することができる。
そのため、伝送状況が良好であれば、誤り訂正符号の付加レートを下げて伝送効率を上げ、伝送状況が劣化していれば、誤り訂正符号の付加レートを上げて誤り訂正能力を上げることが望ましい。
【0097】
図7はこの発明の実施の形態9によるメディア符号化伝送装置を示す構成図であり、図において、図4と同一符号は同一又は相当部分を示すので説明を省略する。
回線状況取得部25は例えば受信側装置などのネットワーク3内の他の機器から回線状況(ネットワークの通信状況)を収集する処理を実施する。なお、回線状況取得部25は通信状況収集手段を構成している。
【0098】
伝送レート補正部26は図4の伝送レート補正部21と同様の処理を実施するほか、回線状況取得部25により収集された回線状況に応じた符号化レートに決定する指示を映像符号化レート決定部14a及び音声符号化レート決定部14bに行うとともに、その回線状況に応じた付加レートに決定する指示を映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bに行う処理を実施する。なお、伝送レート補正部26はレート補正手段を構成している。
図7では、回線状況取得部25及び伝送レート補正部26を図4のメディア符号化伝送装置に実装している例を示しているが、回線状況取得部25及び伝送レート補正部26を図1又は図5のメディア符号化伝送装置に実装するようにしてもよい。
【0099】
図7の例では、メディア符号化伝送装置の構成要素である映像特徴量抽出処理部12a、音声特徴量抽出処理部12b、映像重要度判別部13a、音声重要度判別部13b、映像符号化レート決定部14a、音声符号化レート決定部14b、映像誤り訂正符号付加レート決定部15a、音声誤り訂正符号付加レート決定部15b、映像符号化処理部16a、音声符号化処理部16b、映像誤り訂正符号付加部17a、音声誤り訂正符号付加部17b、データ送出部20、回線状況取得部25及び伝送レート補正部26のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、メディア符号化伝送装置がコンピュータで構成される場合、映像特徴量抽出処理部12a、音声特徴量抽出処理部12b、映像重要度判別部13a、音声重要度判別部13b、映像符号化レート決定部14a、音声符号化レート決定部14b、映像誤り訂正符号付加レート決定部15a、音声誤り訂正符号付加レート決定部15b、映像符号化処理部16a、音声符号化処理部16b、映像誤り訂正符号付加部17a、音声誤り訂正符号付加部17b、データ送出部20、回線状況取得部25及び伝送レート補正部26の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
【0100】
次に動作について説明する。
回線状況取得部25は、例えば、受信側装置などのネットワーク3内の他の機器から回線状況を収集し、その回線状況を伝送レート補正部26に通知する。
具体的には、例えば、伝送路がIPネットワークである場合、「IETF RFC3550 “RTP:A Trasnport Protocol for Real−Time Applications”」に規定されているRTCP(Real−Time Transfer Control Protocol)を利用することで、回線状況を収集することができる。
即ち、RTCPを利用する場合、回線状況取得部25が、送信側装置であるメディア符号化伝送装置1のレポート(SR:Sender Report)に対する受信側装置からのレポート(RR:Receiver Report)を受け取ることにより、ネットワーク3の回線状況として、ネットワーク3におけるパケット欠落率、累積欠落パケット数やパケット間隔ジッタなどを収集することができる。
【0101】
伝送レート補正部26は、伝送レートを一定に維持するために、図4の伝送レート補正部21と同様の処理を実施するが、ネットワーク3の回線状況に応じて、符号化レートと付加レートを制御する。
例えば、伝送レート補正部26は、回線状況取得部25から通知されたネットワーク3の回線状況が、パケットの欠落がない旨を示していれば、誤り訂正符号の付加レートIArate,VArateを下げる補正指示を映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bに出力して、伝送効率が上がるようにする。
一方、回線状況取得部25から通知されたネットワーク3の回線状況が、パケットの欠落が発生している旨を示していれば、誤り訂正符号の付加レートIArate,VArateを上げる補正指示を映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bに出力して、誤り訂正能力が上がるようにする。
【0102】
以上で明らかなように、この実施の形態9によれば、ネットワーク3の回線状況を収集する回線状況取得部25を設け、伝送レート補正部26が、回線状況取得部25により収集された回線状況に応じた付加レートIArate,VArateに決定する指示を映像誤り訂正符号付加レート決定部15a及び音声誤り訂正符号付加レート決定部15bに行うように構成したので、ネットワーク3の回線状況が良好であれば、伝送効率を上げることができる一方、ネットワーク3の回線状況が劣化していれば、誤り訂正能力を上げることができる効果を奏する。
【0103】
実施の形態10.
上記実施の形態9では、ネットワーク3の回線状況に応じて誤り訂正符号の付加レートIArate,VArateを増減させるものについて示したが、この場合、ネットワーク3の回線状況が悪くなると、全体的に誤り訂正符号の符号量が増えるため、メディア符号化データの符号量が減り、メディアデータの重要度に関係なく、一律にメディア品質が低下することになる。
【0104】
そこで、この実施の形態10では、ネットワーク3の回線状況が劣化している場合、伝送レート補正部26が、メディアデータの重要度の再判別を映像重要度判別部13a及び音声重要度判別部13bに指示するようにしている。
これにより、映像重要度判別部13aは、映像データの重要度を再判別し、音声重要度判別部13bは、音声データの重要度を再判別する。
【0105】
この結果、回線状況が劣化している場合、誤り訂正符号の付加レートIArate,VArateを上げた分だけ、重要度が高いメディアデータの伝送時間を更に長く設定して、重要度が低いメディアデータの伝送時間を短くすることで、重要度が高いメディアデータの伝送をより確実に行うことが可能な最適なレート配分を実現することができる。
【符号の説明】
【0106】
1 メディア符号化伝送装置、2 メディアソース、3 ネットワーク、11 メディア圧縮符号化処理部、11a 映像圧縮符号化処理部、11b 音声圧縮符号化処理部、12 特徴量抽出処理部(重要度判別手段)、12a 映像特徴量抽出処理部(重要度判別手段)、12b 音声特徴量抽出処理部(重要度判別手段)、13 重要度判別部(重要度判別手段)、13a 映像重要度判別部(重要度判別手段)、13b 音声重要度判別部(重要度判別手段)、14 符号化レート決定部(レート決定手段)、14a 映像符号化レート決定部(レート決定手段)、14b 音声符号化レート決定部(レート決定手段)、15 誤り訂正符号付加レート決定部(レート決定手段)、15a 映像誤り訂正符号付加レート決定部(レート決定手段)、15b 音声誤り訂正符号付加レート決定部(レート決定手段)、16 符号化処理部(メディアデータ符号化手段)、16a 映像符号化処理部(メディアデータ符号化手段)、16b 音声符号化処理部(メディアデータ符号化手段)、17 誤り訂正符号付加部(誤り訂正符号付加手段)、17a,24a 映像誤り訂正符号付加部(誤り訂正符号付加手段)、17b,24b 音声誤り訂正符号付加部(誤り訂正符号付加手段)、18,20 データ送出部(データ送出手段)、19,21,26 伝送レート補正部(レート補正手段)、22 映像音声多重部(データ多重化手段)、23 映像音声整列部(データ整列手段)、25 回線状況取得部(通信状況収集手段)。

【特許請求の範囲】
【請求項1】
符号化対象のメディアデータの重要度を判別する重要度判別手段と、上記重要度判別手段により判別された重要度を基準にして、上記メディアデータを圧縮符号化する際の符号化レートを決定するとともに、圧縮符号化後のメディアデータに付加する誤り訂正符号の付加レートを決定するレート決定手段と、上記レート決定手段により決定された符号化レートで上記メディアデータを圧縮符号化して、圧縮符号化後のメディアデータであるメディア符号化データを出力するメディアデータ符号化手段と、上記メディアデータ符号化手段から出力されたメディア符号化データに対して、上記レート決定手段により決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きのメディア符号化データを出力する誤り訂正符号付加手段と、上記誤り訂正符号付加手段から出力された誤り訂正符号付きのメディア符号化データをネットワークに送出するデータ送出手段と、上記データ送出手段から送出された誤り訂正符号付きのメディア符号化データの伝送レートが許容範囲内から逸脱している場合、上記レート決定手段に対して符号化レート及び付加レートの補正を指示して、上記伝送レートを許容範囲内に収めるレート補正手段とを備えたメディア符号化伝送装置。
【請求項2】
符号化対象のメディアデータである映像データの重要度を判別する一方、符号化対象のメディアデータである音声データの重要度を判別する重要度判別手段と、上記重要度判別手段により判別された映像データの重要度を基準にして、上記映像データを圧縮符号化する際の符号化レートを決定するとともに、圧縮符号化後の映像データに付加する誤り訂正符号の付加レートを決定する一方、上記重要度判別手段により判別された音声データの重要度を基準にして、上記音声データを圧縮符号化する際の符号化レートを決定するとともに、圧縮符号化後の音声データに付加する誤り訂正符号の付加レートを決定するレート決定手段と、上記レート決定手段により決定された符号化レートで上記映像データを圧縮符号化して、圧縮符号化後の映像データである映像符号化データを出力する一方、上記レート決定手段により決定された符号化レートで上記音声データを圧縮符号化して、圧縮符号化後の音声データである音声符号化データを出力するメディアデータ符号化手段と、上記メディアデータ符号化手段から出力された映像符号化データに対して、上記レート決定手段により決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きの映像符号化データを出力する一方、上記メディアデータ符号化手段から出力された音声符号化データに対して、上記レート決定手段により決定された付加レートで誤り訂正符号を付加し、誤り訂正符号付きの音声符号化データを出力する誤り訂正符号付加手段と、上記誤り訂正符号付加手段から出力された誤り訂正符号付きの映像符号化データ及び誤り訂正符号付きの音声符号化データをネットワークに送出するデータ送出手段と、上記データ送出手段から送出された誤り訂正符号付きの映像符号化データ及び誤り訂正符号付きの音声符号化データの伝送レートが許容範囲内から逸脱している場合、上記レート決定手段に対して符号化レート及び付加レートの補正を指示して、上記伝送レートを許容範囲内に収めるレート補正手段とを備えたメディア符号化伝送装置。
【請求項3】
符号化対象のメディアデータである映像データの重要度を判別する一方、符号化対象のメディアデータである音声データの重要度を判別する重要度判別手段と、上記重要度判別手段により判別された映像データの重要度を基準にして、上記映像データを圧縮符号化する際の符号化レートを決定するとともに、圧縮符号化後の映像データに付加する誤り訂正符号の付加レートを決定する一方、上記重要度判別手段により判別された音声データの重要度を基準にして、上記音声データを圧縮符号化する際の符号化レートを決定するとともに、圧縮符号化後の音声データに付加する誤り訂正符号の付加レートを決定するレート決定手段と、上記レート決定手段により決定された符号化レートで上記映像データを圧縮符号化して、圧縮符号化後の映像データである映像符号化データを出力する一方、上記レート決定手段により決定された符号化レートで上記音声データを圧縮符号化して、圧縮符号化後の音声データである音声符号化データを出力するメディアデータ符号化手段と、上記メディアデータ符号化手段から出力された映像符号化データと音声符号化データを多重化し、上記映像符号化データと上記音声符号化データが多重化されているメディア符号化データを出力するデータ多重化手段と、上記データ多重化手段から出力されたメディア符号化データ内の映像符号化データと音声符号化データの並び替えを行うデータ整列手段と、上記データ整列手段により並び替えが行われたメディア符号化データ内の映像符号化データ及び音声符号化データに対して、上記レート決定手段により決定された付加レートで誤り訂正符号を付加する誤り訂正符号付加手段と、上記誤り訂正符号付加手段により誤り訂正符号が付加されているメディア符号化データをネットワークに送出するデータ送出手段と、上記データ送出手段から送出された誤り訂正符号付きのメディア符号化データの伝送レートが許容範囲内から逸脱している場合、上記レート決定手段に対して符号化レート及び付加レートの補正を指示して、上記伝送レートを許容範囲内に収めるレート補正手段とを備えたメディア符号化伝送装置。
【請求項4】
重要度判別手段は、符号化対象のメディアデータの重要度を判別する際、そのメディアデータがヘッダ部を構成している情報であるのか、データ部を構成している情報であるのかを確認し、そのメディアデータがヘッダ部を構成している情報である場合の重要度を、データ部を構成している情報である場合の重要度より高く設定することを特徴とする請求項1から請求項3のうちのいずれか1項記載のメディア符号化伝送装置。
【請求項5】
重要度判別手段は、符号化対象のメディアデータが映像データである場合、上記映像データのピクチャタイプを確認し、上記ピクチャタイプを基準にして、上記映像データの重要度を判別することを特徴とする請求項1から請求項3のうちのいずれか1項記載のメディア符号化伝送装置。
【請求項6】
重要度判別手段は、符号化対象のメディアデータが映像データである場合、上記映像データが圧縮符号化される際に用いられる動きベクトルを基準にして、上記映像データの重要度を判別することを特徴とする請求項1から請求項3のうちのいずれか1項記載のメディア符号化伝送装置。
【請求項7】
重要度判別手段は、符号化対象のメディアデータが映像データである場合、上記映像データが圧縮符号化される際に算出される離散コサイン変換係数を基準にして、上記映像データの重要度を判別することを特徴とする請求項1から請求項3のうちのいずれか1項記載のメディア符号化伝送装置。
【請求項8】
重要度判別手段は、符号化対象のメディアデータの重要度を判別する際、上記メディアデータが音声データを含んでいるか否かを確認し、音声データを含んでいる場合のメディアデータの重要度を、音声データを含んでいない場合のメディアデータの重要度より高く設定することを特徴とする請求項1記載のメディア符号化伝送装置。
【請求項9】
ネットワークの通信状況を収集する通信状況収集手段を設け、レート補正手段が上記通信状況収集手段により収集されたネットワークの通信状況に応じた付加レートに決定する指示をレート決定手段に行うことを特徴とする請求項1から請求項8のうちのいずれか1項記載のメディア符号化伝送装置。
【請求項10】
レート補正手段は、通信状況収集手段により収集されたネットワークの通信状況が許容状況より劣化している場合、メディアデータの重要度の再判別を重要度判別手段に指示することを特徴とする請求項9記載のメディア符号化伝送装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−172153(P2011−172153A)
【公開日】平成23年9月1日(2011.9.1)
【国際特許分類】
【出願番号】特願2010−36124(P2010−36124)
【出願日】平成22年2月22日(2010.2.22)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】