説明

データ処理装置、プログラム及び方法、並びに、ネットワークシステム

【課題】 複数の端末にデータ送信するネットワークシステムにおいて、低コストで各端末へのデータ送信の品質を向上させる。
【解決手段】 本発明は、少なくとも動画又は音声の一方を含む配信データを、符号化して複数の端末に向けて送信するデータ処理装置に関する。そしてデータ処理装置は、配信用データを符号化する複数の符号化部と、それぞれの端末の通信に係るパラメータ値を管理する手段と、管理している端末情報に基づいて、それぞれの端末を、いずれかの符号化部に対応付けるグループ分けを行う手段と、それぞれの端末へ、端末分類手段により対応付けされた符号化部が符号化した符号化配信データを送信する手段とを有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置、プログラム及び方法、並びに、ネットワークシステムに関し、例えば、会議を行うシステムに適用し得る。
【背景技術】
【0002】
ネットワークを介した2人以上の参加者による多地点の会議システムにおいて、音声、映像、データを相互交換する目的でMulti-point Control Unit(以下、「MCU」という)という装置が用いられるのが一般的である。
【0003】
MCUの主な機能は、呼の制御機能の他に、会議に参加している複数の端末から送られてくる音声、映像、データを受信し、必要な場合はそれらを復号化などの計算処理する機能、集まった音声、映像、データを選択(スイッチング)することや、音声の重ねあわせによる合成、映像の空間的合成を行う機能、最後にこれら加工されたデータを特定のコーデック、ビットレート、映像の場合は特定の映像サイズで符号化し、参加者に音声、映像、データを配信することである。また、直接は相互通信ができない互換性のない端末同士がMCUを介することで同一の会議に参加し相互に音声、映像等の通信を行うことを可能にしている。
【0004】
映像に関して言えば、映像データを圧縮、伸張する際に用いられる符号化方式、フレームレート、映像のサイズ、ビットレートなどの特徴量があり、これらに互換性が無い場合は、ネットワークを介して相互に映像を通信することができない。しかし、特許文献1に記載されているように受信端末ごとの上記特徴量に合わせた復号化装置及び符号化装置を用いることで、会議へ接続する端末間の差分を吸収し、相互に映像の交換が可能となる。
【0005】
特許文献1に記載の方式では、映像の符号化方式、フレームレート、映像サイズ、ビットレートなど、各端末にとって最適な特徴量を選択して符号化した映像を配信できるというメリットがある。また、仮にMCUから送信されたデータがネットワークなど、受信装置へ到着するまでの経路上で損失された場合、失われた画像データを補う目的で一枚の画像の完全なデータを含んだイントラフレームを受信端末に送信するのが一般的であるが、イントラフレームの送信は瞬間的に高いビットレートのデータを生み出し、ネットワークに高い負荷をかける、もしくは精細度の低い映像フレームを送出するというマイナスの効果も持っている。上記の接続端末ごとに符号化装置を用いる方法においては、このイントラフレームの送出が接続している一つの端末だけに行われるため、一つの符号化装置を会議参加端末全てが共有する後述の方式に比べて、イントラフレーム送出によって生じるマイナスの効果を狭い範囲に限定することが可能である。
【0006】
しかしながら、特許文献1に記載の方式では、符号化処理は大きな計算量を必要とし、その方式では会議への参加人数に比例して必要な計算量も増加するため、多人数の会議の実現は困難である。特に、汎用PCサーバでMCUを構築する場合限られたCPU計算処理能力でMCUを実現する場合には、符号化処理の負担は提供可能な会議室への参加人数を小さい値に限定することになってしまう。
【0007】
一方で、非特許文献1に記載の方式のように、会議室に対して一つの符号化装置を用い、その出力映像を会議への参加端末全てに配信する方式もある。この方式の場合、会議に参加する端末全てに対して、再生可能な共通の特徴量で符号化した映像を送信することになる。この方式では、会議室への参加端末が増加しても符号化装置の数は増加しないので、少ない計算量で多人数の会議を実現することが可能である。
【0008】
また、符号化した映像データをマルチキャスト方式で配信することにより、MCUから接続端末方向への通信利用帯域を大幅に縮小することも可能である。しかしながら、特許文献1にある方式のように、各接続端末へ最適な符号化データを配信することができないため、いくつかの問題が生じてしまう。
【0009】
第1には、参加端末中、最も能力の低い端末に合わせて映像データの符号化を行う必要があるため、本来ならよりサイズの大きい高精細な映像を受信し再生できる端末も、低いビットレート、小さいサイズ、最新ではない符号化方式の映像に甘んじなければならなくなる。第2には、ある特定の端末がパケットの損失により失われた画像データを補うためにMCUにイントラフレームの送信を要求した場合に、この方式では全ての端末に対してイントラフレームを送信することになり、瞬間的なネットワーク負荷の増大、精細度の低い映像フレームの再生といったマイナスの効果が接続している全ての端末で生じる一方、それと引き換えに失われた画像の回復というメリットは、該当する特定の1端末でしか実現しない。
【0010】
上記イントラフレームの送信頻度は、接続端末数に応じて増加するため、数十を超えるような会議参加端末がある場合で、端末からのイントラフレーム要求に対して必ずイントラフレームを送信する方式をとった場合、ネットワークにおけるパケットロス率がかなり低い場合においても、終始イントラフレームを送信し続け、結果として恒常的に大きなネットワーク負荷を発生させる、もしくは恒常的に精細度の低い映像を各端末が再生し続けるというデメリットが生じる。
【0011】
この問題の回避策の一つとして、非特許文献1に提案されている方法では一定の方法でイントラフレームの要求を間引いて、イントラフレームをMCUから端末に送信する方法が示されているが、この方式ではパケット損失により画像が壊れてしまった端末は、映像の回復まで平均してより長い時間待たされることとになる。
【特許文献1】米国特許 第6,584,077B1
【非特許文献1】中野和俊、田中令治著、「大規模ビデオ会議における映像の品質改善の検討,信学技報,vol.107,no.229,CQ2007−66,pp.165−170,2007年9月 電子情報通信学会発行
【非特許文献2】V.Jacobson and Micheal J.Karels著, 「Congestion Avoidance and Control」,Proceedings of ACM SIGCOMM, Sept.1988,pp.314−329、[Online]、INTERNET、[2008年11月20日検索],<URL: http://www.cs.rice.edu/~eugeneng/teaching/s04/comp629/papers/Jac88.pdf>
【発明の開示】
【発明が解決しようとする課題】
【0012】
上述の特許文献1及び非特許文献1に記載の方式では、ビデオ会議システムにおけるMCUの構成方式として、特に映像データの符号化装置の数に着目してその特徴の違いを説明した。二つの方式は、限られたネットワーク帯域と限られた計算処理量のもとで、いかに質の高い映像を送受信するかという課題に対する異なる解決方法である。しかしながら、どちらの方法も、比較的少人数の会議参加者で会議を行う場合は、デメリットが目立たないが、会議への参加者が増えるに従って以下に述べる問題が顕在化してくる。
【0013】
特許文献1に記載の方式では、計算処理量が参加者人数に比例して増大するため、多人数の会議では膨大な計算量が必要となり、汎用のPCサーバでMCUを実現する場合、会議室への同時参加人数が、比較的少人数に限定されてしまう。符号化の専用装置を用いる場合は、符号化処理に必要な計算処理が他の処理を圧迫することはないが、多人数の会議を実現するにはかなり高価な装置となってしまう。また、汎用PCサーバもしくは符号化装置のどちらの場合も、受信端末ごとに異なるデータストリームを送信することになるので、利用する送信帯域も参加端末に比例して増大してしまう。このことは、限られたネットワーク帯域を利用する上では、個々の端末に送信する映像データのビットレートを下げることにつながり、結果として映像の質を低下させることになる。
【0014】
非特許文献1に記載の方式では、符号化装置が会議室に1つだけであるため、接続端末の多様な要求条件に対応することができず、映像の質を左右する画像サイズ、符号化ビットレート、等は会議参加端末の中で最も性能の低い端末に送信画像の特徴量を合わせなければならない。また、ネットワークにおけるパケットロス率とそれに応じたイントラフレームに関しては、個々の端末の要求に即座に対応してイントラフレームを送信する場合、会議への参加端末数が増加するに従い、イントラフレームの送信頻度が上がり、結果としてネットワーク帯域の有効利用ができず精細度の低い映像をより長い時間送信することになってしまう。イントラフレームの送信頻度を間引くことで制御した場合においては、あまりに高い頻度でイントラフレーム送信が実行されることは避けられるが、接続する端末の多様な要求に対して、一部の端末にしか適さない頻度でしか、イントラフレームを送信することができず、ある端末にとっては必要以上にイントラフレームが送信され、本来受け取れるはずの映像に比べて精細度を欠いた映像をより長い時間受信することになり、反対にパケットロス率が高い端末にとっては、必要な頻度より低い頻度でしかイントラフレームを受信することができず、その結果として画像データの部分的な損失により壊れた映像がより長い時間回復しないことになる。
【0015】
そのため、複数の端末にデータ送信するネットワークシステムにおいて、低コストで各端末へのデータ送信の品質を向上させることができるデータ処理装置、プログラム及び方法、並びに、ネットワークシステムが望まれている。
【課題を解決するための手段】
【0016】
第1の本発明のデータ処理装置は、(1)少なくとも動画又は音声の一方を含む送信データを、符号化して複数の端末に向けて送信するデータ処理装置において、(2)上記送信データを符号化する複数の符号化部と、(3)それぞれの上記端末の通信に係る端末情報を管理する端末情報管理手段と、(4)上記端末情報管理手段が管理している端末情報に基づいて、それぞれの上記端末を、いずれかの上記符号化部に対応付けるグループ分けを行う端末分類手段と、(5)それぞれの上記端末へ、上記端末分類手段により対応付けされた符号化部が符号化した符号化送信データを送信するデータ送信手段とを有することを特徴とする。
【0017】
第2の本発明のデータ処理プログラムは、(1)少なくとも動画又は音声の一方を含む送信データを、符号化して複数の端末に向けて送信するデータ処理装置に搭載されたコンピュータを、(2)上記送信データを符号化する複数の符号化部と、(3)それぞれの上記端末の通信に係る端末情報を管理する端末情報管理手段と、(4)上記端末情報管理手段が管理している端末情報に基づいて、それぞれの上記端末を、いずれかの上記符号化部に対応付けるグループ分けを行う端末分類手段と、(5)それぞれの上記端末へ、上記端末分類手段により対応付けされた符号化部が符号化した符号化送信データを送信するデータ送信手段として機能させることを特徴とする。
【0018】
第3の本発明のデータ処理方法は、(1)少なくとも動画又は音声の一方を含む送信データを、符号化して複数の端末に向けて送信し、上記送信データを符号化する複数の符号化部を備えたデータ処理装置におけるデータ処理方法において、(2)端末情報管理手段、端末分類手段、データ送信手段を有し(3)上記端末情報管理手段は、それぞれの上記端末の通信に係る端末情報を管理し、(4)上記端末分類手段は、上記端末情報管理手段が管理している端末情報に基づいて、それぞれの上記端末を、いずれかの上記符号化部に対応付けるグループ分けを行い、(5)上記データ送信手段は、それぞれの上記端末へ、上記端末分類手段により対応付けされた符号化部が符号化した符号化送信データを送信することを特徴とするデータ処理方法。
【0019】
第4の本発明のネットワークシステムは、(1)複数の端末と、少なくとも動画又は音声の一方を含む送信データを、符号化して上記端末に向けて送信するデータ処理装置とを備えるネットワークシステムにおいて、上記データ処理装置として、第1の本発明のデータ処理装置を適用したことを特徴とする。
【発明の効果】
【0020】
本発明によれば、複数の端末にデータ送信するネットワークシステムにおいて、低コストで各端末へのデータ送信の品質を向上させることができる。
【発明を実施するための最良の形態】
【0021】
(A)主たる実施形態
以下、本発明によるデータ処理装置、プログラム及び方法、並びに、ネットワークシステムの一実施形態を、図面を参照しながら詳述する。なお、この実施形態のネットワークシステム、データ処理装置は、それぞれ、会議システム、映像信号処理装置である。
【0022】
(A−1)第1の実施形態の構成
図2は、この実施形態のビデオ会議システムの全体構成を示すブロック図である。
【0023】
会議システム1には、会議サーバ10と、4台の会議接続端末40−1〜40−4が配置されている。
【0024】
会議サーバ10は、会議接続端末の接続許可及びアドレス変換機能を有するゲートキーパ(以下、「GK」という)20と、2人以上の参加者による多地点会議において、音声、映像、データを相互交換する機能を担っているMCU30とを有している。会議サーバ10においては、仮想的に1又は複数の会議室が設定され、会議接続端末40−1〜40−4から送られてくる映像データを合成して、会議接続端末40−1〜40−4に送信する。この実施形態においては、会議サーバ10において、4台の会議接続端末40−1〜40−4により一つの会議室が設定され、会議サーバ10では、会議接続端末40−1〜40−4から送られてきた映像データを合成して、会議接続端末40−1〜40−4に送信するものとして説明する。
【0025】
図2においては、記載を省略しているが、会議サーバ10は、映像データと併せて音声データを会議接続端末40−1〜40−4から収集して合成し、送信するようにしても良い。また、図2において、会議接続端末40−1〜40−4は、会議サーバ10(MCU30)と、H.323準拠の方式で呼を接続するものとして説明するが、呼を接続する方式はH.323に限定されないものである。
【0026】
会議接続端末40−1〜40−4は、上述の通り会議サーバ10に接続する端末であり、既存のビデオ会議システムにおける端末を適用するようにしても良い。なお、配置する会議接続端末40の数は限定されないものである。
【0027】
図1は、MCU30(映像信号処理装置31)の内部の機能的構成について示したブロック図である。
【0028】
MCU30にはさらに図1に示すように、映像信号を処理する映像信号処理装置31が含まれている。なお、図1においては記載を省略しているが、既存のMCU装置と同様に、音声信号処理装置、データ信号処理装置等を有する構成としても良い。
【0029】
映像信号処理装置31は、パソコンなどの情報処理装置(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)上に、実施形態の映像処理プログラム(固定データを含む)をインストールすることにより、構築しても良く、その場合でも機能的には図1のように表すことができる。また、映像信号処理装置31の一部又は全部の構成要素を、専用のハードウェアとして構築するようにしても良い。
【0030】
図1において、映像信号処理装置31は、データ受信部33(33−1〜33−4)、復号化部34(34−1〜34−4)、画像合成部35、符号化部36(36−1、36−2)、データ送信部37(37−1〜37−4)を有している。なお、データ受信部33、復号化部34、データ送信部37は接続する会議接続端末数と同数作成される。
【0031】
画像合成部35は、図1に示すように通常会議室に対して1つだけ作成するようにしても良い(複数作成することも可能であり、その場合、各画像合成部35と各符号化部との接続は制御装置からの指示により動的に変更可能である)。
【0032】
図3は、画像合成部35により、画像が合成されるレイアウトの例を示した説明図である。
【0033】
画像合成部35では、4台の会議接続端末40−1〜40−4から受信した画像(フレーム)を合成する場合には、例えば、図3(a)に示すように4分割したフレームごとに各会議接続端末40から受信した画像をはめ込むように合成しても良い。
【0034】
符号化部36は、会議室に対して1つ以上任意の数で作成される。制御部32からの制御に基づき、符号化部36は新たに作成すること、及び消去することができるものとする。符号化部36とデータ送信部37の接続関係は会議中であっても、制御装置からの指示に従い、動的に変化させることができるものとする。なお、この実施形態において、制御部32が指示する符号化パラメータとしては、映像符号化コーデック、画像サイズ、符号化ビットレート、映像フレームレート、フレームタイプ(イントラフレーム/インターフレーム)を適用するものとするが、符号化パラメータは上述の一部のパラメータについて適用しても良いし、他のパラメータを適用しても良く、適用する符号化パラメータの数や組み合わせは限定されないものである。
【0035】
次に、制御部32の構成の詳細について説明する。
【0036】
図4は、制御部32内部の機能的構成について示したブロック図である。
【0037】
制御部32は、会議接続端末40−1〜40−4の通信に係るパラメータ値などの情報(以下、「端末情報」という)として、例えば、性能、ネットワーク環境などの情報を収集し、その端末情報に基づいて会議接続端末40を複数のグループにグループ化し、各グループに対応した符号化パラメータでそれぞれの符号化部36を動作させるものである。この実施形態において、制御部32が収集する端末情報として、具体的には、それぞれの会議接続端末40に係るパケットロス率、イントラフレームなどを適用するものとして説明する。
【0038】
制御部32は、端末分類部321及び通信部325を有している。
【0039】
通信部325は、それぞれの会議接続端末40に係る性能、ネットワーク環境などのパラメータの情報を収集する機能を担っており。端末分類部321は、後述の接続端末のグループ分けを行う機能を担っており、データ記憶部322、ソート部323、分類点計算部324を有している。
【0040】
次に、端末分類部321におけるグループ分けの処理について説明する。
【0041】
データ記憶部322は、通信部325が収集した端末情報を記憶する手段であり、ソート部323は、データ記憶部322が記憶している各会議接続端末40の端末情報を基準として、会議接続端末40のリストを降順又は昇順にソートを行う。そして、分類点計算部324は、ソート部323がソートしたリストにおいて、上述のグループ分けを行う分類点を算出する。
【0042】
例えば、それぞれの会議接続端末40−1〜40−4が利用可能なネットワーク帯域の値をもとにA種類に分け、パケットロス率の値に応じてB種類に分けるとする(A、Bともに1以上任意の正の整数とする)。この場合、符号化装置のパラメータとして、ネットワークの利用帯域とパケットロス率から、合計(A・B)種類の組み合わせが可能であり、それぞれに応じたパラメータで符号化装置を(A・B)種類作成することができる。なお、(A・B)種類全てではなく、その一部だけを作成するようにしてもよい。
【0043】
例えば、高いパケットロス率に対応する符号化部では、ビットレートを低くする、フレームレートを低くする、よりパケットロスに強い映像コーデックを選択する、イントラフレームの送信頻度を高くする、等で対応するようにしても良い。符号化部36とデータ送信部37の接続関係は、制御装置からの指示に従い会議中であっても動的に変更するようにしても良い。
【0044】
上述のように、(A・B)種類の符号化部36を作成した場合、符号化部36とデータ送信部37との接続関係、すなわち、どの会議接続端末40にどの符号化部36で符号化された映像データを送信するのか決定するグループ分けの方法としては、例えば、以下の第1〜第4の方法が挙げられる。
【0045】
[第1の方法]
まず、符号化部36とデータ送信部37の接続関係のグループ分けを決定する第1の方法について説明する。第1の方法は、予め、例えば、利用可能ネットワーク帯域、パケットロス率等、必要なパラメータをシステム内(会議接続端末40、もしくはMCU30を含む会議サーバ10)で保持しておき、制御装置はその情報を呼確立時前後に取得し、取得した情報をもとに符号化部36とデータ送信部37との接続関係を決定することが挙げられる。また、制御部32が、会議接続端末40−1〜40−4に係る情報を保持する方法としては、例えば、会議サーバ10と会議接続端末40−1〜40−4との呼確立時にH.245による能力交換で得られる情報を利用して決定するようにしても良い。
【0046】
[第2の方法]
次に、符号化部36とデータ送信部37の接続関係のグループ分けを決定する第2の方法について説明する。第2の方法は、必要なパラメータを測定するための試験パケットを会議サーバと会議接続端末間で送受信し、その試験パケットの送受信の状況により、各会議接続端末40に係るネットワーク帯域、パケットロス率を測定することである。
【0047】
ネットワーク帯域、パケットロス率を測定する方法としては、非特許文献2に記載されている「Packet pair」を用いた方法を用いても良い。上述の試験パケットによるネットワーク帯域、パケットロス率の測定は会議接続前及び会議接続中の任意のタイミングで行うことができる。会議接続中に測定を行いその結果に応じて動的に符号化部と会議接続端末との接続関係を変更するようにしても良い。
【0048】
[第3の方法]
次に、符号化部36とデータ送信部37の接続関係のグループ分けを決定する第3の方法について説明する。第3の方法は、RTCPによりパケットロス率、ジッタ遅延時間情報を収集することである。(利用可能ネットワーク帯域については、直接知ることができない)RTCP情報は会議接続中継続して情報が更新される。この情報をもとに、符号化部との接続関係を動的に決定する。
【0049】
[第4の方法]
次に、符号化部36とデータ送信部37の接続関係のグループ分けを決定する第4の方法について説明する。H.323では、イントラフレーム送信を要求する方法が定義されている。これは、パケットロス等が原因となり、受信側で完全な映像を復号化できない場合などに、一枚の完全なフレーム情報を含んだイントラフレームを送信側に要求する仕組みである。会議システム1では、会議接続端末40側から会議サーバ10にイントラフレームが要求されることになるが、第4の方法は、各会議接続端末40からの、イントラフレーム要求の頻度を記録し、その頻度に応じて、現在接続されている符号化部36の符号化パラメータが適切でないと判断される場合、符号化部36との接続関係を動的に変更するものである。具体的には、イントラフレーム要求が一定の頻度以下になるまで、より低帯域(送信データ量が少ない)で高パケットロスに対応したパラメータの符号化部36へと接続を切り替えていく。この操作により、結果としてパケットロス率の高さに応じた複数のグループに端末を分類することになる。
【0050】
次に、制御部32で、上述の第1〜第3の方式を適用した場合に、符号化部36とデータ送信部37の接続関係、すなわち、端末分類部321において、どの会議接続端末40を、どの符号化部36に対応付けけるかをグループ分けする処理の具体例について説明する。なお、この実施形態における以下の説明では、計算式等の説明を簡易にするため、全ての符号化部36について適用する符号化パラメータは全て同一であるものとして説明するが、符号化部36ごとに異なる符号化パラメータを適用するようにしても良いことは上述の通り当然である。
【0051】
また、この実施形態では、説明を簡易にするために、映像信号処理装置31に2つの符号化部36−1、36−2が配置されているので、端末分類部321では、会議接続端末40が、2つのグループにグループ分けされるものとして説明する。また、図2においては、会議システム1には、4台の会議接続端末40−1〜40−4が配置されているが、ここでは、配置されている会議接続端末40の総数はN台であるものとして説明する。
【0052】
まず、N台の端末が接続した会議で、ある任意の時間会議を行う場合を考える。この会議中に全ての会議接続端末40が経験する受信パケットにおけるパケットロスの回数の合計をX回とする。非特許文献1に示されている方式のように、符号化部が会議室に対して1つの場合、パケットロスが発生するごとに会議接続端末40からMCU30に対してイントラフレーム要求が送られるとすると会議中に最大X回イントラフレームがN台の会議接続端末40に送信される。従って、会議室全体における送信されたイントラフレームの累積値は、N・X回となる。ここで、符号化部を2つ作成し、符号化部36−1にα・N台(0≦α≦1とする)の端末が接続し、符号化部36−2には、残りの(1−α)・N台の端末が接続する場合について考える。
【0053】
仮に、N台の会議接続端末40全てにおいてパケットロス率が等しいとすると、符号化部36−1が送信するイントラフレーム数はα・N・Xとなり、符号化部36−2が送信するイントラフレーム数は(1−α)・N・Xとなり、会議システム1全体で送信されるイントラフレーム数は、以下の(1)式で表される。
【0054】
イントラフレーム数=(2α2−2α+1)・N・X …(1)
上記の(1)式においては、α=0.5の時に最小値0.5・N・Xとなる。すなわち、符号化部を2つに増やすことにより、システム全体で送信されるイントラフレーム数を半分にすることができることになる。そして、実際にはパケットロス率は一様ではなく、偏在しており、パレート分布に近い確率分布をしていることが知られている。
【0055】
例えば、2割の会議接続端末40(0.2・N)が全体のパケットロスの8割(0.8・X)を引き起こしている場合、該当する2割の会議接続端末40を符号化部36−1に接続し、残りの8割の端末を符号化部36−2に接続すると、それぞれの符号化部から送信されるイントラフレーム数は、0.2・0.8・N・X、0.8・0.2・N・Xとなりシステム全体で送信されるイントラフレーム数は、0.32・N・X回となり、パケットロス率が一様であると仮定した場合に比べて、さらに送信するイントラフレーム数を少なくすることができる。仮に1割の端末が全体の9割にあたるパケットロスを引き起こしている場合、上記と同様に2つの符号化部に分けて接続することにより、会議システム1全体で送信されるイントラフレーム数を0.18・N・X回まで減少させることが可能である。
【0056】
この実施形態では、結果としてパケットロス率の高低で端末を分類することになるので、上記のような条件が成立する。以下、その仕組みについて説明する。
【0057】
会議接続端末40をx:(1−x)の比率で二つのグループに分ける。この時、それぞれのグループで合計したイントラフレーム要求数の合計値の比率が(1−y):yとなっているとする。すると、システム全体のイントラフレーム数の合計値z・N・xにおけるzは、以下の(2)式で表わされる。
【0058】
z=x+y−2xy(ただし、0≦X≦1,0≦y≦1) …(2)
図5及び図6は、分類点計算部324において、算出するzを3次元空間内の曲面として表現した場合の説明図である。
【0059】
図5及び図6に示した曲線Lはパケットロス率が一様な場合、すなわちx+y=1におけるzの取り得る範囲を示している。この場合、前述のように、x=y=0.5においてzは最小値0.5をとる。一方、パケットロス率が一様ではなく偏在している場合、y=x≠0.5となるx、yとなるようにN個の端末を二つのグループに分けることができる。
【0060】
y=xの条件のもとで、z(システム全体のイントラフレーム数合計値に比例した係数)はy=x=0.5で最大値をとる2次曲線となるので、符号化部36を2つにすることで、システム全体のイントラフレーム合計数を半分より少なくすることが可能である。また、イントラフレーム要求数もしくはパケットロス率の値をもとにグループに含まれるN個の接続端末をソートし、1番目からk番目までとk+1番目からN番目の二つのグループに分割する場合、1≦k≦Nの範囲でkが取り得る全ての値について、システム全体のイントラフレーム数の合計値に比例した係数であるzを上記の(2)式に従って計算し、zが最小となるkのところで、グループを二つに分割するようにしても良い。なお、上記の(2)式において、x−y=0(y=x≠0.5)の場合には、x−yが最も0に近づくkのところで、グループを2つに分割するようにしても良い。この場合、x−yの演算だけで良く、またkに対してx−yの値は単調増加もしくは単調減少となるので、上記の(2)式と比較して演算量が抑えられる。
【0061】
符号化部36の数をさらに多くする場合も同様の計算が成り立つ。例えば、符号化部36を4つ作成する場合、符号化部36−1、36−2に接続されている端末をさらにそれぞれ二つのグループに分け、それぞれ二つの異なる符号化部36を作成して接続することで、パケットロス率が偏在している限り、送信するイントラフレーム数を半分より少ない数に減少させることが可能である。
【0062】
ここで、符号化部の数(M)の増加、すなわち計算量の増加というコストとシステム全体で送信されるイントラフレーム数(I)の減少というメリットとの関係を評価する評価関数EをE=M・Iと定義する。前述の状況(端末数N、全ての接続端末が経験した受信パケットにおけるパケットロスの回数の合計をX回)において、符号化装置が会議室に一つである非特許文献1の場合における評価関数Eは、E=(1)・(N・X)接続端末ごとに符号化部を用意する特許文献1の場合における評価関数Eは、E=(N)・(X)と、どちらも同じ値となる。
【0063】
一方で、本発明の方式では、パケットロス率が偏在しているという条件のもとでは、E<N・X÷2となるように端末を分けることが可能である。これは、特許文献1、非特許文献1にある方式に比べて、より少ない計算量への投資で、より大きなイントラフレーム数削減効果を得ることができることを示している。
【0064】
(A−2)実施形態の動作
次に、以上のような構成を有する実施形態の会議サーバ10(映像信号処理装置31)におけるデータ送信の動作を説明する。
【0065】
(A−2−1)会議サーバ(映像信号処理装置)全体の動作
まず、会議サーバ10(映像信号処理装置31)の全体の動作について説明する。
【0066】
図7は、映像信号処理装置31の全体の動作について示した説明図である。
【0067】
会議サーバ10と会議接続端末40−1〜40−4との間の呼の確立時に、MCU30は各会議接続端末40−1〜40−4に、映像データの送信先情報を通知する(S101)。映像データの送信先情報には、映像信号処理装置31のデータ受信部が利用しているサーバアドレス、通信ポート番号の情報が含まれ、これらの情報は呼の確立時以前に制御装置が映像信号処理装置31から取得したものを用いる。
【0068】
そして、呼の確立後、各会議接続端末は映像データが映像信号処理装置31に送信されるが、映像信号処理装置31では、会議接続端末40−1〜40−4ごとに、データ受信部33、復号化部34が作成される(S102)。ここでは、会議サーバ10は、4台の会議接続端末40−1〜40−4と呼を確立するので、それぞれの会議接続端末に対応するデータ受信部33−1〜33−4及び復号化部34−1〜34−4が作成される。
【0069】
そして、会議接続端末40−1〜40−4からデータ受信部33−1〜33−4により映像データが受信され、受信された映像データが復号化部34−1〜34−4により復号され、YUV画像(もしくはRGB画像)が得られる(S103)。
【0070】
そして、復号化部34−1〜34−4復号された画像データは画像合成部35に送られ、例えば、制御装置から指定された所定の画像レイアウト(図3参照)に従い、合成される(S104)。
【0071】
そして、合成された画像データが、画像合成部35から、符号化部36−1、36−2に与えられ、符号化部36−1、36−2では、制御部32から指示される符号化パラメータに従って、画像データが符号化される(S105)。
【0072】
符号化部36−1、36−2で符号化された映像データは、制御部32の指示に応じて、対応するデータ送信部37−1〜37−4に送られ、会議接続端末40−1〜40−4に、ネットワークを介して送信され(S106)、会議の終了まで上述のステップS103の処理から再度動作する。
【0073】
(A−2−2)制御装置の動作について
次に、制御部32の動作の詳細について説明する。
【0074】
図8は、制御部32において、符号化部36とデータ送信部37の接続関係のグループ分けを決定する動作について示したフローチャートである。
【0075】
なお、図8のフローチャートに示す処理においては、変数として「更新State」、「終了state」を用いている。
【0076】
まず、会議サーバ10に、最初の会議接続端末40が接続されると、更新state、終了stateがともに0に初期化される(S201)。
【0077】
通信部325から新規端末の接続(S202)、すでに接続されている端末の切断(S203)、接続されている会議接続端末のパケットロス(S204)、接続端末数が0であるか否か(S205)等の情報が通知され、終了stateは1にセットされる(S206)。なお、ステップS204において、パケットロスが無い場合は、後述するステップS209の処理に移行し、パケットロスがある場合には、後述するステップS207に移行する。
【0078】
そして、上述のステップS207において、パケットロスがあると判定された場合には、これらの情報をもとに、端末ID、発生イベント種別(端末接続、端末切断、パケットロス)及び発生時刻情報が、データ記憶部322に保存され(S207)、更新stateが1にセットされる(S208)。
【0079】
次に、終了stateが0である場合(S209)、任意のタイムアウト時間幅を設定しておき、その時間幅が経過するごと(S210)に更新stateを評価し、更新state=1の場合(S211)は、ソート部323で現在時刻から任意の時間幅の過去までのパケットロス率をもとに各会議接続端末40の情報をソートし、パケットロス率の昇順もしくは降順に並べ替える(S212)。なお、ステップS210において、タイムアウトでは無い場合は、ステップS202の処理に戻る。また、ステップS211において、更新state=0の場合は、ステップS202の処理に戻る。
【0080】
更新stateを0とした後(S213)、昇順、もしくは降順に並べ替えられた端末とそれぞれのパケットロス率をもとに、上述のグループ分け計算方法を適用して、分類点計算部324で端末をグループ分けする境界を算出する(S214)。
【0081】
この計算結果をもとに、制御部から映像信号処理装置31へ制御命令を発行し、会議参加端末と符号化部との接続関係を更新して、ステップS202に戻り、以後会議参加端末=0となり終了state=1となるまでステップS202〜ステップS214の処理を繰り返し行う。
【0082】
(A−3)第1の実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
【0083】
(A−3−1)会議システム1において、会議接続端末40のネットワーク品質に関る端末情報に応じてグループに分類し、それぞれに応じた符号化部を接続することにより、会議サーバ10から会議接続端末40に送信されるイントラフレーム数を減少させるとともに、会議サーバ10から会議接続端末40に高い品質のデータ(映像)を送信することが可能となる。
【0084】
また、会議接続端末40をグループ分けして、そのグループごとに符号化部36を備えればよいので、特許文献1の方法と比較した場合、符号化部36を会議接続端末40の数と同数作成する必要がない。すなわち低コストで上述のような会議サーバ10から会議接続端末40に高い品質のデータ(映像)を送信することができる。非特許文献1の方法では、会議接続端末40が多くなるに従い、イントラフレームの送出頻度が増し、結果として精細度の低い映像を高い頻度で受け取り、映像がにじんだように見える問題があるが、本発明を適用することによりそのような問題を低減することができる。
【0085】
(A−3−2)映像信号処理装置31において、複数の符号化部36を設け、異なる符号化パラメータを利用し、イントラフレーム要求の頻度(すなわち、パケットロス率の高さ)などに応じて接続する符号化部を選別する場合、パケットロス率の高い端末のグループに対しては、送信する映像データのビットレートを低くすることで、単位時間に送信されるパケット数を減らし、結果として会議中に発生するパケットロス数を減少させることができる。
【0086】
ビットレートを低くすることと、イントラフレームが高い頻度で送信されることは、通常どちらも映像品質低下の原因であり、かつトレードオフの関係になっている。(片方の影響を小さくすることは、もう一方の影響を大きくするという関係になっている。)そのため、最適なビットレートを一意に決定はできないが、符号化部36に接続する会議接続端末40の数が増加するに従いイントラフレーム要求数も比例して増加する傾向があり、送信されるイントラフレームの延べ数は端末数の2乗に比例して増加するので、会議への参加端末が増えるに従い、パケットロスの高いグループに対してより低いビットレートを設定し、イントラフレーム要求数を一定の頻度以下に抑えることが有効な手段となる。これは、上述したように、イントラフレーム要求が一定の頻度以下になるまで、よりビットレートの低い符号化部へ接続を動的に変更する機能により実現できる。
【0087】
(B)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
【0088】
(B−1)上述の図7におけるステップS104で、画像合成部35において、会議接続端末から送信された画像データを合成する際に、画像データに変換された文字情報を上書きするようにしても良い。画像合成部35で、画像データの合成において文字情報の上書きをする際には、文字情報が上書きされる領域に含まれる、会議接続端末から送信された画像データに対し、画素の明度及び彩度を一定の計算ルールで変更し、その後画像化された文字列を上書きするようにしても良い。この処理により、文字が表示される領域の映像は他の領域よりも暗く表示され、文字がはっきりと識別しやすくなる。
【0089】
また、画像合成部35で、画像データの合成において文字情報の上書きをする際には、フレームごとに文字情報の表示位置を移動させるようにしても良い。例えば、一定時間ごとに一定ピクセル数平行移動した位置に文字列を表示するように文字情報を上書きし、結果として文字がスクロールする視覚効果をもたらすようにしても良い。
【0090】
さらに、画像合成部35で、画像データの合成において文字情報の上書きをする他の例としては、一定画像フレーム数単位で2箇所の文字列表示位置に交互に表示することで、上書きした文字列が震えているような視覚効果をもたらすようにしても良い。
【0091】
さらにまた、画像合成部35では、画像データの合成において制御部32からの指示に従い、合成される映像チャネル単位でその領域が目立つように外枠を上書きするようにしても良い。
【0092】
このように、画像合成部35では、画像データの合成において、文字の表示位置の移動や外枠の表示を行うことにより、例えば、会議接続端末から送信される音声の大きさに応じて制御装置から指示を出すことで、今話しをしている人の画面を強調するなどの効果として利用できる。
【0093】
(B−2)上記の実施形態では、本発明のデータ処理装置を映像信号処理装置に適用した例について説明したが、映像信号(動画データ)だけでなく、音声データを複数の端末に送信するものに適用するようにしても良い。すなわち、本発明のデータ処理装置が端末に送信するデータは、少なくとも音声又は動画の一方が含まれていれば良い。
【0094】
本発明のデータ処理装置を音声データの送信に適用する場合は、上述の図1において、復号化部34、画像合成部35、符号化部36を音声データを処理するものに置き換えることにより実現することができる。その場合、上記の実施形態では、符号化部36とデータ送信部37との接続関係、すなわち、どの会議接続端末40にどの符号化部36で符号化された映像データを送信するのか決定するグループ分けの方法では、パケットロス率若しくはイントラフレームの要求頻度を用いて分類していたが、本発明のデータ処理装置を音声データの送信に適用する場合は、パケットロス率のみを用いて実現するようにしても良い。
【0095】
(B−3)上記の実施形態では、本発明のデータ処理装置(映像信号処理装置)を会議サーバに搭載した例について説明したが、本発明のデータ処理装置が送信するデータは、端末から収集したデータを合成したものに限定されないものである。すなわち、本発明のデータ処理装置を、単に端末にデータを送信する装置に適用し、データ送信を行うネットワークシステムとして構築するようにしても良い。
【0096】
例えば、会議システムではなく、ネットワークを経由した放送/遠隔講義に代表されるリアルタイムの映像配信など、一方的に送信側(データ処理装置)から受信側(端末)にデータを送信するシステムに適用するようにしても良い。その場合、データ処理装置においては、端末からデータを収集して合成する必要が無いため、図1において、データ受信部33、復号化部34、画像合成部35を省略し、代わりに送信用のデータ(コンテンツ)を保持する手段を備えることにより実現するようにしても良い。
【0097】
(B−4)上記の実施形態においては、映像信号処理装置31に、データを送信する会議接続端末40の数だけ、データ送信部37を備え、会議接続端末40へ個別のストリームデータとしてユニキャストでデータ送信を行っているが、符号化部36と同じ数だけデータ送信部37を作成してマルチキャストでデータ送信を行うようにしても良い。
【0098】
上記の実施形態のように、一つの符号化部36に複数のデータ送信部37が対応付けられている場合には、同じデータを複数の会議接続端末40に送信しなければならないが、マルチキャスト技術を用いて送信することより、1本のデータストリームで複数の会議接続端末40にデータ送信することができるので、必要とする映像信号処理装置31内の処理量及びネットワーク帯域を低減することができる。
【0099】
映像信号処理装置31から、会議接続端末40へのデータ送信にマルチキャストを用いる際、対応付けを行う符号化部36を切り替える場合には、会議接続端末40側からデータ受信をするマルチキャストのチャンネルを変更する必要があるが、映像信号処理装置31側からチャンネルの切り替えの指示を通知し、会議接続端末40がその指示に基づいてチャンネルの切り替えを行う構成を別途備えることにより実現するようにしても良い。
【図面の簡単な説明】
【0100】
【図1】実施形態に係る映像信号処理装置内部の機能的構成について示したブロック図である。
【図2】実施形態に係る会議システムの全体構成を示したブロック図である。
【0101】
る。
【図3】実施形態に係る画像合成部における、画像合成のレイアウトの例について示した説明図である。
【図4】実施形態に係る制御装置内部の機能的構成について示したブロック図である。
【図5】分類点計算部において、算出する係数zを3次元空間内の曲面として表現した場合の説明図(1)である。
【図6】分類点計算部において、算出する係数zを3次元空間内の曲面として表現した場合の説明図(2)である。
【図7】実施形態に係る、映像信号処理装置の動作について示したフローチャートである。
【図8】実施形態に係る、映像信号処理装置における制御装置の動作について示した説明図である。
【符号の説明】
【0102】
1…会議システム(ネットワークシステム)、10…会議サーバ、20…GK、30…MCU、40、40−1〜40−4…会議接続端末、31…映像信号処理装置(データ処理装置)、32…制御部、33、33−1〜33−4…データ受信部、34、34−1〜34−4…復号化部、35…画像合成部、36、36−1、36−2…符号化部、37、37−1〜37−4…データ送信部、321…端末分類部、322…データ記憶部、323…ソート部、324…分類点計算部、325…通信部。

【特許請求の範囲】
【請求項1】
少なくとも動画又は音声の一方を含む送信データを、符号化して複数の端末に向けて送信するデータ処理装置において、
上記送信データを符号化する複数の符号化部と、
それぞれの上記端末の通信に係る端末情報を管理する端末情報管理手段と、
上記端末情報管理手段が管理している端末情報に基づいて、それぞれの上記端末を、いずれかの上記符号化部に対応付けるグループ分けを行う端末分類手段と、
それぞれの上記端末へ、上記端末分類手段により対応付けされた符号化部が符号化した符号化送信データを送信するデータ送信手段と
を有することを特徴とするデータ処理装置。
【請求項2】
上記送信データは、一部又は全部の上記端末から取得した動画のデータを合成した合成動画データを含むものであることを特徴とする請求項1に記載のデータ処理装置。
【請求項3】
上記各符号化部は、上記送信データの動画におけるフレームを、イントラフレーム又はインターフレームとして符号化し、
上記データ送信手段は、上記符号化部が符号化したデータをパケット単位で送信し、
上記端末情報管理手段は、それぞれの上記端末に係る、パケットロス率又はイントラフレームの送信要求の頻度の値で示されるパラメータ値を、端末情報として管理することを特徴とする請求項1又は2に記載のデータ処理装置。
【請求項4】
上記端末分類手段が、上記端末を2つの上記符号化部のいずれかに対応付けるグループ分けを行う場合、パラメータ値を基準に上記端末をソートし、全ての上記端末の数をNとし、パラメータ値の大きい方又は小さい方から1番目からk番目までを第1のグループ、k+1番目からN番目までを第2のグループとし、Nに対する上記第1のグループ内の上記端末の数の比率をxとし、全ての上記端末のパラメータ値の累積値に対する上記第1のグループに属する上記端末のパラメータ値の累積値の比率を1−yとしたとき、x−yの値が0に最も近づくkを用いて、上記端末を上記第1のグループと上記第2のグループのいずれかにグループ分けすることを特徴とする請求項3に記載のデータ処理装置。
【請求項5】
上記端末分類手段が、上記端末を2つの上記符号化部のいずれかに対応付けるグループ分けを行う場合、パラメータ値を基準に上記端末をソートし、全ての上記端末の数をNとし、パラメータ値の大きい方又は小さい方から1番目からk番目までを第1のグループ、k+1番目からN番目までを第2のグループとし、Nに対す上記る第1のグループ内の上記端末の数の比率をxとし、全ての上記端末のパラメータ値の累積値に対する上記第1のグループに属する上記端末のパラメータ値の累積値の比率を1−yとしたとき、1≦k≦Nの範囲でkが取り得る全ての値について、全ての上記端末のパラメータ値の総計に比例する係数であるzを、z=x+y−2xyに従って計算し、zが最小となるkを用いて、上記端末を上記第1のグループと上記第2のグループのいずれかにグループ分けすることを特徴とする請求項3に記載のデータ処理装置。
【請求項6】
上記複数の符号化部として、第1の符号化部と、上記第1の符号化部よりも符号化後のデータ量が少なくなる符号化を行う第2の符号化部を備え、
上記端末分類手段は、当初は全ての上記端末を上記第1の符号化部に対応付け、その後、パラメータ値の高い方から順番に上記第2の符号化部に対応付けを変更することを、全ての上記端末のパラメータ値の合計が閾値以下となるまで繰り返す
ことを特徴とする請求項1〜3のいずれかに記載のデータ処理装置。
【請求項7】
上記送信データは、全部又は一部の上記端末から、少なくとも動画又は音声の一方を含むデータを受信して合成した合成データであることを特徴とする請求項1〜6に記載のいずれかに記載のデータ処理装置。
【請求項8】
当該データ処理装置は、会議サーバと複数の会議端末とを有する会議システムを構成する上記会議サーバに搭載されており、
上記会議端末として上記端末が適用されていること
を特徴とする請求項7に記載のデータ処理装置。
【請求項9】
少なくとも動画又は音声の一方を含む送信データを、符号化して複数の端末に向けて送信するデータ処理装置に搭載されたコンピュータを、
上記送信データを符号化する複数の符号化部と、
それぞれの上記端末の通信に係る端末情報を管理する端末情報管理手段と、
上記端末情報管理手段が管理している端末情報に基づいて、それぞれの上記端末を、いずれかの上記符号化部に対応付けるグループ分けを行う端末分類手段と、
それぞれの上記端末へ、上記端末分類手段により対応付けされた符号化部が符号化した符号化送信データを送信するデータ送信手段と
して機能させることを特徴とするデータ処理プログラム。
【請求項10】
少なくとも動画又は音声の一方を含む送信データを、符号化して複数の端末に向けて送信し、上記送信データを符号化する複数の符号化部を備えたデータ処理装置におけるデータ処理方法において、
端末情報管理手段、端末分類手段、データ送信手段を有し
上記端末情報管理手段は、それぞれの上記端末の通信に係る端末情報を管理し、
上記端末分類手段は、上記端末情報管理手段が管理している端末情報に基づいて、それぞれの上記端末を、いずれかの上記符号化部に対応付けるグループ分けを行い、
上記データ送信手段は、それぞれの上記端末へ、上記端末分類手段により対応付けされた符号化部が符号化した符号化送信データを送信する
ことを特徴とするデータ処理方法。
【請求項11】
複数の端末と、少なくとも動画又は音声の一方を含む送信データを、符号化して上記端末に向けて送信するデータ処理装置とを備えるネットワークシステムにおいて、
上記データ処理装置として、請求項1〜7のいずれかに記載のデータ処理装置を適用したこと
を特徴とするネットワークシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2010−141824(P2010−141824A)
【公開日】平成22年6月24日(2010.6.24)
【国際特許分類】
【出願番号】特願2008−318724(P2008−318724)
【出願日】平成20年12月15日(2008.12.15)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】