説明

符号化レートを制御する送信装置、送信プログラム及び送信方法

【課題】 IPテレビ電話等の会話目的のリアルタイム通信に適するように、符号化レートを制御する送信装置、送信プログラム及び送信方法を提供する。
【解決手段】 送信すべきメディアデータを符号化するエンコーダ102と、符号化されたメディアデータを一時的に蓄積するバッファ121と、バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録できるレジスタ122と、バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出部131と、バッファ蓄積変動量(B1−BN)が増加している場合、バッファからのメディアデータのバッファ出力レートBRを、バッファ出力レートBR=BRin−(B1−BN)/(dT×N)によって決定し、決定されたBRを符号化レートとしてエンコーダ部102に入力する符号化レート決定部132とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、符号化レートを制御する送信装置、送信プログラム及び送信方法に関する。
【背景技術】
【0002】
異なるメディアデータを多重化する送信装置は、同時に並行して発生する複数のメディアデータをメディア毎に符号化し、所定サイズのフレームに構成してネットワークへ送信する。一方、受信装置は、メディア毎に異なるメディアデコーダを用いて、受信したフレーム単位でメディアデータを復号する。メディアデータ毎に、所定サイズをどのように決定するかが、マルチメディアデータの多重化においては重要である。
【0003】
多重化方式としては、バイト多重がある。バイト多重は、異なるメディアデータを適当なバイト数の単位で切り替えることができる。受信装置は、フレームに付加されたヘッダの内容によって、そのメディアデータに適したデコーダに切り替える。このようなパケット多重は、柔軟性が高く、ソフトウェア処理に適している。
【0004】
図1は、従来技術によるパケット多重化のための送信装置の機能構成図である。
【0005】
送信装置1は、映像データ及び音声データをリアルタイムで符号化して送信するものである。送信装置1は、映像信号を出力するカメラ4と、音声信号を出力するマイク5とに接続され、データパケットを送信するためにIPネットワーク3に接続されている。
【0006】
送信装置1は、映像データについて、フォーマット変換部101と、映像エンコーダ部102と、映像データ用バッファ103と、RTP(Real-time Transport Protocol)ヘッダ付加部104とを有する。また、音声データについて、増幅器110と、音声エンコーダ部108と、音声データ用バッファ107と、RTPヘッダ付加部106とを有する。更に、IP(Internet Protocol)ネットワーク3に対応してUDP(User Datagram Protocol)/IPプロトコルスタック部105を有する。
【0007】
カメラ4から出力された映像信号は、フォーマット変換部101によって圧縮符号化に適した映像フォーマットに変換され、映像エンコーダ102によって圧縮符号化される。その方式は、1フレーム(1画面)を単位として符号化データを生成するものであって、例えばISO/IEC(International Organization for Standardization/International Electrotechnical Commission) MPEG−4(Moving Picture Experts Group-4)ビジュアルがある。低ビットレートのMPEG−4によれば、1フレームは、例えば100m秒間隔(毎秒10フレーム)となる。生成されたビットストリームデータは、映像データ用バッファ103に入力される。RTPヘッダ付加部104は、バッファ103から取り出した映像データのフレーム毎にRTPヘッダを付加する。そのRTPパケットは、UDP/IPプロトコルスタック部105によってUDP及びIPヘッダが付加され、IPネットワーク3へ送信される。
【0008】
一方、マイク5から出力された音声信号は、増幅器110によって増幅され、A/D(Analog/Digital)変換部109によって伝送可能なビット列に変換される。次に、その音声データは、音声エンコーダ108によって圧縮符号化される。その方式は、予め決められた時間長を1フレームとして符号化データを生成するものであって、例えば3GPP(3rd Generation Partnership Project) AMR(Adaptive Multi Rate)がある。AMR方式においては、1フレームは20m秒となる。生成されたビットストリームは、音声データ用バッファ107に入力される。RTPヘッダ付加部106は、バッファ107から取り出した映像データのフレーム毎にRTPヘッダを付加する。そのRTPパケットは、UDP/IPプロトコルスタック部105によってUDP及びIPヘッダが付加され、IPネットワーク3へ送信される。
【0009】
受信装置2は、データパケットを受信するためにIPネットワーク3に接続され、受信したデータパケットのメディアデータに応じて復号するものである。受信装置2は、映像信号を入力するディスプレイ6と、音声信号を入力するスピーカ7とに接続されている。
【0010】
受信装置2は、IPネットワーク3から受信したパケットに対して、IP及びUDPヘッダを処理するUDP/IPプロトコルスタック部205を有する。受信装置2は、映像データについて、RTPヘッダ除去部204と、映像デコーダ203と、映像データ用バッファ202と、ディスプレイ制御部201とを有する。映像信号は、ディスプレイ制御部201からディスプレイ6に出力される。また、音声データについて、RTPヘッダ除去部206と、音声デコーダ207と、音声データ用バッファ208と、D/A変換部209と、増幅器210とを有する。音声信号は、増幅器210からスピーカ7へ出力される。
【0011】
先行公知文献としては、RTPについて規定したIETF RFC3550(非特許文献1参照)、MPEG−4をRTPに乗せたフォーマットを規定したIETF RFC3016(非特許文献2参照)、AMRをRTPに乗せたフォーマットを規定したIETF RFC3267(非特許文献3参照)がある。
【0012】
【非特許文献1】IETF(Internet Engineering Task Force) RFC(Request For Comment)3550
【非特許文献2】IETF RFC3016
【非特許文献3】IETF RFC3267
【発明の開示】
【発明が解決しようとする課題】
【0013】
表1は、従来技術におけるパケット多重化フレームのデータ構造である。
【表1】

【0014】
従来技術によれば、音声データのフレームと、映像データのフレームとは別々に必要となる。これは、フレーム毎に、そのメディアデータに応じたデコーダによって復号させるためである。
【0015】
前述したような従来技術によれば、生成されるRTPパケットは以下のようになる。ここで、符号化パラメータとして、低い伝送レート(64kbit/秒)における一般的な値を想定する。
映像の符号化ビットレート:32kbit/秒、フレームレート:10枚/秒
音声の符号化ビットレート:6800bit/秒、フレーム長:20m秒
RTPヘッダサイズ:12byte
UDPヘッダ:8byte
IPヘッダ:20byte
【0016】
映像データについては、以下のようになる。
映像の符号化ビットレート:32kbit/秒÷8bit = 4kbyte/秒
秒当たりの伝送フレーム数:10フレーム/秒
映像データパケットの伝送間隔:1秒/10フレーム = 100m秒
フレームレート:4kbyte/秒÷10フレーム/秒 = 400byte/フレーム
映像の1パケット:400byte+12byte+8byte+20byte = 440byte
映像1パケットの伝送時間:440byte×8bit÷64kbit/秒 = 55m秒
【0017】
音声データについては、以下のようになる。
音声の符号化ビットレート:6800bit/秒÷8bit = 850byte/秒
秒当たりの伝送フレーム数:50フレーム/秒
音声データパケットの伝送間隔:1秒/50フレーム = 20m秒
1フレーム当たりのバイト数:850byte/秒×20m秒 = 17byte/フレーム
音声の1パケット:17byte+12byte+8byte+20byte = 57byte
音声1パケットの伝送時間:57byte×8bit÷64kbit/秒 = 7.125m秒
【0018】
音声データパケットは20m秒間隔で送信され、映像データパケットは100m秒間隔で送信されるので、音声データパケットの送信の5回に1回の割合で、映像データパケットの送信が割り込むこととなる。
【0019】
図2は、従来技術におけるフレームの伝送シーケンス図である。
【0020】
音声データパケットは20m秒毎に送信され、映像データパケットは100m秒毎に送信される。音声データパケットは、40byteのヘッダ(IP、UDP、RTP)とデータ部分とからなる。データ部分が17byteとすると、伝送に7.125m秒を要する。映像データパケットは、40byteのヘッダとデータ部分とからなる。データ部分が400byteとすると、伝送に55m秒を要する。
【0021】
図2によれば、例えば、映像データパケットV1の送信の直後に、音声データパケットA3が送信されたとする。映像データパケットV1は、送信装置から送信されてから55m秒後に、受信装置に到着する。一方、音声データパケットA3は、更に7.125m秒後、即ち送信装置から送信されてから62.125m秒後に、受信装置に到着する。このために、映像データパケットによって割り込まれた音声データパケットは、送信装置の送出間隔20m秒に対し、受信装置に受信された時は62m秒後ということになる。その後、音声データパケットA4,A5,A6,A7が連続して、受信装置に到着する。音声データパケットの伝送に要する時間7m秒は、送出間隔20m秒に比べて十分小さいため、受信装置における到着間隔はやがて元に戻ることとなるが、その後、再度、映像データパケットが音声データパケットの間に割り込むため、到着遅延の変動が生じる。
【0022】
音声データは、映像データのようなフレーム単位で離散的なデータと異なって、アナログ信号に戻して再生する際に、連続的でなければならない。このため、受信装置は、音声データパケットの最大到着遅延量に合わせて、予めバッファに蓄積してから再生する。このような音声データパケットの遅延変動は、受信側に大きなバッファ蓄積を要求することとなり、伝送遅延全体を増大させるものとなる。
【0023】
更に、従来技術によれば、RTP、UDP、IPのヘッダを、映像データパケット及び音声データパケットそれぞれ独立に付加する必要がある。従って、
(12byte+8byte+20byte)×8bit×(50音声フレーム+10映像フレーム)
= 19.2kbit/秒
ものヘッダによるオーバヘッドを要する。
【0024】
また、音声データパケットの遅延変動を抑えるために、映像データパケットを分割し、映像データパケットと音声データパケットとを交互に送信するという方法もある。この場合、両パケットが等間隔で送信されるため、音声データパケットの到着時間ゆらぎを回避することは可能となる。しかしながら、この方法によれば、ヘッダによるオーバヘッドは、更に大きくなり、伝送効率が極めて低下する。
(12byte+8byte+20byte)×8bit×(50音声フレーム+50映像フレーム)
= 32kbit/秒
【0025】
このように、従来技術によれば、異なるメディアデータが異なるフレームで伝送され、フレーム毎にRTPヘッダを必要とするために伝送効率が低くなるだけでなく、一方のメディアデータの伝送が、他方のメディアデータの伝送の遅延変動に影響を与えることとなる。
【0026】
しかしながら、多重化フレームのパケットを一時的に蓄積するバッファについて、バッファ入力レートよりも、伝送路レート即ちバッファ出力レートの方が低い場合、バッファに蓄積されるパケットの数が時間と共に増大する。帯域保証のないインターネットや、無線環境が変化しやすいモバイルネットワークにおいては、伝送路レートの変動が著しい。リアルタイム通信における音声データについては、音声データが所望の時間間隔で到着しないことによる音途切れが発生する。また、映像データについては、フレーム間隔のゆらぎ及び表示遅延として、利用者に知覚されることとなる。
【0027】
特に、IPテレビ電話等の会話目的のリアルタイム通信においては、会話成立のために、少なくとも音声データは遅滞なく伝送される必要がある。このため、伝送路レートが変動するような環境下においては、音声データを確実に伝送するための制御が必要となる。
【0028】
従って、本発明は、IPテレビ電話等の会話目的のリアルタイム通信に適するように、符号化レートを制御する送信装置、送信プログラム及び送信方法を提供する。
【課題を解決するための手段】
【0029】
本発明における送信装置は、
送信すべきメディアデータを符号化するエンコーダ手段と、
符号化されたメディアデータを一時的に蓄積するバッファと、
バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定されたバッファ出力レートBRを符号化レートとしてエンコーダ手段に入力する符号化レート決定手段と
を有することを特徴とする。
【0030】
また、本発明における送信装置は、
送信すべき第1のメディアデータを符号化する第1のエンコーダ手段と、
送信すべき第2のメディアデータを符号化する第2のエンコーダ手段と、
符号化された第1のメディアデータ及び第2のメディアデータそれぞれのパケットを一時的に蓄積するバッファと、
バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定されたバッファ出力レートBRを符号化レートとして第1のエンコーダ手段に入力する符号化レート決定手段と
を有することを特徴とする。
【0031】
本発明の送信装置における他の実施形態によれば、第1のメディアデータは映像データであって、第2のメディアデータは音声データであってもよい。また、第1のメディアデータは音声データであって、第2のメディアデータは映像データであってもよい。
【0032】
また、本発明の送信装置における他の実施形態によれば、符号化レート決定手段は、符号化レートを
符号化レート ≦ バッファ出力レートBR
となるように決定することも好ましい。
【0033】
更に、本発明の送信装置における他の実施形態によれば、
バッファ入力レートBRin ≦ バッファ出力レートBR
であって、且つ、バッファのバッファ蓄積量が所定の閾値以下である状態が、一定時間経過した際に、安定状態であるとして検出する安定状態判定手段と、
安定状態判定手段が安定状態であると判定した際に、メディアデータを送信すべき伝送路レートを測定する伝送路レート測定手段と
を更に有し、
符号化レート決定手段は、伝送路レート測定手段によって測定された伝送路レートをバッファ出力レートBRとして、符号化レートを決定することも好ましい。
【0034】
更に、本発明の送信装置における他の実施形態によれば、バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)について平均化する平均化手段を更に有することも好ましい。
【0035】
本発明における送信プログラムは、
送信すべきメディアデータを符号化するエンコーダ手段と、
符号化されたメディアデータを一時的に蓄積するバッファと、
バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定されたバッファ出力レートBRを符号化レートとしてエンコーダ手段に入力する符号化レート決定手段と
してコンピュータを機能させることを特徴とする。
【0036】
また、本発明における送信プログラムは、
送信すべき第1のメディアデータを符号化する第1のエンコーダ手段と、
送信すべき第2のメディアデータを符号化する第2のエンコーダ手段と、
符号化された第1のメディアデータ及び第2のメディアデータそれぞれのパケットを一時的に蓄積するバッファと、
バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定されたバッファ出力レートBRを符号化レートして第1のエンコーダ手段に入力する符号化レート決定手段と
してコンピュータを機能させることを特徴とする。
【0037】
本発明の送信プログラムにおける他の実施形態によれば、第1のメディアデータは映像データであって、第2のメディアデータは音声データであってもよい。また、第1のメディアデータは音声データであって、第2のメディアデータは映像データであってもよい。
【0038】
また、本発明の送信プログラムにおける他の実施形態によれば、符号化レート決定手段は、符号化レートを
符号化レート ≦ バッファ出力レートBR
となるように決定するように機能させることも好ましい。
【0039】
更に、本発明の送信プログラムにおける他の実施形態によれば、
バッファ入力レートBRin ≦ バッファ出力レートBR
であって、且つ、バッファのバッファ蓄積量が所定の閾値以下である状態が、一定時間経過した際に、安定状態であるとして検出する安定状態判定手段と、
安定状態判定手段が安定状態になったと判定した際に、メディアデータを送信すべき伝送路レートを測定する伝送路レート測定手段と
を更に有し、
符号化レート決定手段は、伝送路レート測定手段によって測定された伝送路レートをバッファ出力レートBRとして、符号化レートを決定するように機能させることも好ましい。
【0040】
更に、本発明の送信プログラムにおける他の実施形態によれば、バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)について平均化する平均化手段を更に有するように機能させることも好ましい。
【0041】
本発明における送信方法は、
送信すべきメディアデータを符号化するエンコーダと、符号化されたメディアデータを一時的に蓄積するバッファとを有し、
バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、メモリにその測定されたバイト数(B1〜BN)の履歴を記録する第1のステップと、
バッファへのバッファ入力レートBRinを測定する第2のステップと、
バッファ蓄積変動量(B1−BN)が増加している場合、バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定されたバッファ出力レートBRを符号化レートとしてエンコーダに入力する第3のステップと
有することを特徴とする。
【0042】
また、本発明における送信方法は、
送信すべき第1のメディアデータを符号化する第1のエンコーダと、送信すべき第2のメディアデータを符号化する第2のエンコーダと、符号化された第1のメディアデータ及び第2のメディアデータそれぞれのパケットを一時的に蓄積するバッファとを有し、
バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、メモリにその測定されたバイト数(B1〜BN)の履歴を記録する第1のステップと、
バッファへのバッファ入力レートBRinを測定する第2のステップと、
バッファ蓄積変動量(B1−BN)が増加している場合、バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定されたバッファ出力レートBRを符号化レートとして第1のエンコーダ手段に入力する第3のステップと
を有することを特徴とする。
【0043】
本発明の送信方法における他の実施形態によれば、第1のメディアデータは映像データであって、第2のメディアデータは音声データであってもよい。また、第1のメディアデータは音声データであって、第2のメディアデータは映像データであってもよい。
【0044】
また、本発明の送信方法における他の実施形態によれば、第3のステップは、符号化レートを
符号化レート ≦ バッファ出力レートBR
となるように決定することも好ましい。
【0045】
更に、本発明の送信方法における他の実施形態によれば、
バッファ入力レートBRin ≦ バッファ出力レートBR
であって、且つ、バッファのバッファ蓄積量が所定の閾値以下である状態が、一定時間経過した際に、安定状態であるとして検出するステップと、
安定状態判定手段が安定状態であると判定した際に、メディアデータを送信すべき伝送路レートを測定するステップとを更に有し、
第3のステップは、伝送路レート測定手段によって測定された伝送路レートをバッファ出力レートBRとして、符号化レートを決定することも好ましい。
【0046】
更に、本発明の送信方法における他の実施形態によれば、バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)について平均化するステップを更に有することも好ましい。
【発明の効果】
【0047】
本発明によれば、バッファ入力レートと、時間経過に伴うバッファ蓄積変動量とに基づいて、バッファ出力レートを算出し、そのバッファ出力レートよりも幾分低い符号化レートをエンコーダに入力することによって、バッファ入力レートがバッファ出力レート(伝送路レート)を越えないように、エンコーダの情報発生量を制御することができる。
【0048】
特に、音声エンコーダと映像エンコーダとを有する送信装置等においては、映像エンコーダのみの符号化レートを制御することにより、音声データは、そのビットレートを変更することなく維持することができ、安定した音声会話が実現できる。
【0049】
また、バッファ蓄積量が所定の閾値以下であって、バッファ蓄積量に基づく符号化レート決定が変動しない状態が一定時間経過した際に、伝送路レート測定部によって伝送路レートの回復を判断し、測定された伝送路レートに応じてメディアエンコーダの情報発生量を制御することもできる。
【発明を実施するための最良の形態】
【0050】
以下では、図面を用いて、本発明を実施するための最良の形態について詳細に説明する。
【0051】
表2は、本発明によって用いられるパケット多重化フレームのデータ構造である。
【表2】

【0052】
表2によれば、本発明におけるフレームのデータ構造は、UDPヘッダに続いて、1byteのシリアル番号部と、1byteの音声データサイズ部と、そのサイズ部に格納された長さの音声データと、映像データとを含む。従って、表1と比較して、RTPヘッダを必要としない。シリアル番号部は、符号なし整数であって、0〜255の巡回値となる。音声データサイズ部は1byteであるので、必然的に音声データのサイズは0〜255byteとなる。
【0053】
図3は、本発明におけるパケット多重化フレームのメディア分割構成図である。
【0054】
図3の上段には、映像データを等サイズに分割し、パケット多重化フレームを構成したものである。常に、所定のバイト数の位置で映像データを分割することができるので、実装が容易となる。しかしながら、フレームの間を意識することなく、等サイズに分割するために、フレームに跨って分割される場合がある。この場合、映像フレームに跨った映像データを含むパケットを損失すると、2つの(前後の)フレーム対して影響を及ぼす。
【0055】
図3の下段には、映像フレームにResyncマーカが挿入されたものが表されている。Resyncマーカは、符号化時に、マクロブロック境界に挿入される。このResyncマーカを実質的に等サイズ間に挿入し、このResyncマーカ間を1つの映像データとして多重化フレームに含めることにより、映像フレームに跨って映像データが分割されることがなくなる。即ち、1つの多重化フレームの損失が、2つの映像フレームに影響を及ぼすことがなくなる。
【0056】
図4は、本発明によって用いられる送信装置の機能構成図である。以下では、音声再生装置の機能について説明するが、各機能はプログラムによって実装され、そのプログラムをコンピュータが実行することによって各機能が実現される。
【0057】
図4によれば、送信装置1は、図1のRTPヘッダ付加部104及び106に代わって、多重化部111を備えている。多重化部111は、多重パケット生成部111と、映像データを一時的に蓄積するメモリ1112と、音声データを一時的に蓄積するメモリ1113と、シリアル番号を生成する減算器1114と、遅延回路1115とを有する。ここで、音声データ用メモリ1112は、音声データサイズ(書き込みポインタと読み出しポインタとの差分)を、0〜255byteで表して出力することができる。
【0058】
音声データがメモリ113に蓄積され及び/又は映像データがメモリ112に蓄積された際、多重パケット生成部111は、4入力1出力のスイッチで、シリアル番号、音声データサイズ、音声データ、映像データの順に切り替えて、その1巡によって、表2に表した1つのフレームを構成する。シリアル番号は、遅延回路115を通じて減算器1114に入力され、1増分(1加算)されて、新たなシリアル番号となる。
【0059】
本発明によれば、映像データ及び音声データは、同じタイミングでバッファ103及び107から抜き取られ、シェーピングされて1つのフレームに多重化される。これにより、映像データと音声データとの到着遅延が一定となり、受信装置において音声データの到着ゆらぎを回避することができる。
【0060】
また、多重パケットの生成に際し、RTPによって映像データパケット及び音声データパケットそれぞれに12byteを要していたのに対し、本発明によれば、これら異なるメディアデータのパケットが統合され、且つRTPに相当する部分のヘッダが2byteとなるため、ヘッダサイズを軽減することができる。
【0061】
例えば、パケット送出間隔を20m秒とした場合、
(2byte+8byte+20byte) × 8bit × 50 = 12kbit/秒
のオーバヘッドとなる。
【0062】
即ち、従来技術によれば32kbit/秒であることを考慮すると、本発明によれば20kbit/秒ものオーバヘッドを削減することができる。ここで削減されたオーバヘッドのbit数は、映像データ又は音声データの符号化ビットレートに割り当てることができ、符号化品質を向上させることもできる。
【0063】
図5は、図4の送信装置におけるフレームの伝送シーケンス図である。以下では、受信装置の機能について説明するが、各機能はプログラムによっても実現できる。
【0064】
図5は、従来技術である図2のS200の部分を表している。20m秒毎に送信する音声データパケットの送信タイミングで送信しようとすると、図2の映像データパケットよりも短い長さの映像データパケットを送信することができる。図5によれば、17byteの音声データと80byteの映像データとからなるフレームは、15.8m秒で受信装置によって受信される。即ち、映像データV1(400byte)の受信終了タイミングは、音声データA1〜A4(17byte×4個)の受信終了のタイミングと一致する。
【0065】
例えば、AMR方式の音声データサイズは、パケット送出間隔が20m秒である場合、以下のようなバイト数になる。ここでは、代表的な3モードについて列記する。
4.75kbit/秒モード: 14byte
※6.70kbit/秒モード: 19byte
12.2kbit/秒モード: 33byte
【0066】
映像データサイズは、単純に「ビットレート×時間」で表される。1パケットが20m秒間隔の場合、以下のようなバイト数となる。
32kbit/秒: 32kbit/8bit × 20m秒 = 80byte
【0067】
AMRが6.70kbit/秒モードの場合、多重化フレームは、シリアル番号1byte、音声データサイズ1byte、音声データ19byte及び映像データ80byteからなる合計101byteを要する。
【0068】
図6は、本発明における送信装置の基本的な機能構成図である。これは、1つのメディアデータに対する機能構成を表しており、エンコーダは、映像エンコーダであってよいし、音声エンコーダであってもよい。以下では、送信装置の機能について説明するが、各機能はプログラムによって実装され、そのプログラムをコンピュータが実行することによって各機能が実現される。
【0069】
図6の送信装置は、メディアデータを符号化するエンコーダ部102と、符号化されたデータをパケットに構成するパケット構成部111と、符号化されたデータを一時的に蓄積するバッファ103と、UDP/IPヘッダを付加してIPネットワークへ送信するUDP/IPプロトコルスタック部105とを有する。更に、メモリであるN個のシフトレジスタ122と、減算器123と、平均化部124と、安定度判定部125と、伝送路レート測定部126と、タイマ127と、クロック128と、減算器130と、バッファ入力レート算出部131と、符号化レート決定部132とを有する。
【0070】
シフトレジスタ122は、バッファ121に蓄積されているパケットのバイト数を、一定の時間間隔dTで測定し、そのバイト数を現在時刻のバッファ蓄積バイト数としてレジスタB1に記憶する。時間間隔dTは、クロック128によって供給される。例えば、N個のレジスタ(B1〜BN)が備えられ、各レジスタに記憶されたバイト数はFIFO(First In First Out)の形式で順にシフトされる。
【0071】
各変数を、以下のように定義する。
B1:現在時刻のバッファ蓄積バイト数
BN:過去時刻(=現在時刻−変動時間間隔(dT×N))のバッファ蓄積バイト数
dT:バッファのバイト数測定時間間隔
dT×N:過去時刻から現在時刻までの時間間隔
BR:バッファ出力レート(伝送路レート)
BRin:バッファ入力レート(情報発生速度)
CR:エンコーダに入力される符号化レート
【0072】
バッファ蓄積変動量dBは、以下のように表される。これは、減算器123によって行われる。
dB = B1−BN 式(1)
【0073】
一方、バッファ入力レートBRinと、バッファ出力レートBRとの差分が、バッファ蓄積変動量dBに反映される。
dB = (BRin−BR)×dT×N 式(2)
【0074】
式(1)=式(2)から、以下のような関係式となる。
B1−BN = (BRin−BR)×dT×N 式(3)
【0075】
式(3)から、以下のような関係式が得られる。本発明によれば、式(4)によってバッファ蓄積量からバッファ出力レートBRを決定することができる。これは、符号化レート決定部132によって行われる。
BR = BRin−(B1−BN)/(dT×N) 式(4)
【0076】
更に、バッファ量の推移については、局所変動による影響を避けるため平均化処理を行う。平均化部124は、(B1−BN)/(dT×N)の値を所定個数だけ蓄積し、その平均を算出することにより、実際の変動よりも緩和される。
BR = BRin−average{(B1−BN)/(dT×N)} 式(5)
【0077】
通常、バッファ入力レートBRinがバッファ出力レートBRよりも小さくなければ、バッファ蓄積変動量は増加する一方となる。従って、通信を安定させるためには、以下の式を満たす必要がある。
BRin ≦ BR 式(6)
【0078】
式(5)によって推定されたBRから、エンコーダ102へ入力する符号化レートCRを決定する際に、測定されたBRinが式(6)を満足するように、例えば運用で使用される符号化レートの中で、BRを越えないものをCRとする(CR<≒BR)。映像データの符号化レートCRは、例えば、32kbps->28kbps->24kbps・・・->4kbps->0kbpsのように変更できるとする。このときBR=25kbpsであれば、CRは24kbpsに設定する。即ち、決定されたBRよりも小さい値であって、且つ、エンコーダで実際に運用される設定可能な値を設定する。決定された符号化レートCRは、エンコーダ102へ入力される。エンコーダ102は、入力された符号レートCRによって制御される。
【0079】
安定度判定部125は、伝送路レートが回復したにもかかわらず、バッファ入力レートが低く抑えられている際に、伝送路レートを測定するタイミングを判定するものである。
式(6)「バッファ入力レートBRin ≦ バッファ出力レートBR」の状態であって、且つ、バッファのバッファ蓄積量が所定の閾値Th以下である状態が、一定時間TM経過した際に、安定状態であるとして検出する。所定の閾値Thは、パケット1個分のバイト数に設定することができる。例えば図5によれば、1byte+1byte+17byte+80byte=99byteとなる(UDP/IPヘッダの28byteを含まない)。
【0080】
伝送路レート測定部126は、安定度判定部125が安定状態にあると判定した際に、実際に伝送路レートを測定するものである。伝送路レートの具体的な測定方法としては、例えば同一出願人による特願2003−080134号がある。この方法は、サイズの異なる2種類のレポートパケットを送信装置及び受信装置の間で交換することによる往復遅延時間に基づいて、伝送路レートを決定するものである。
【0081】
図7は、測定時間間隔dT毎に実行されるフローチャートである。
【0082】
図7の処理は、一定の時間間隔dT毎、即ちバッファ蓄積量が測定され、レジスタをシフトし、シフトレジスタB1にバッファ蓄積量が格納される毎、に行われる。
(S701)レジスタB1に蓄積された現在時刻のバッファ蓄積量B1が、レジスタBNに蓄積された過去時刻のバッファ蓄積量BNよりも大きいか否か判定する。B1がBNよりも大きくないならば、処理を終了する。
(S702)B1がBNよりも大きいならば、式(4)の計算をする。これにより、バッファ出力レートBRが算出される。
(S703)次に、バッファ出力レートBRに基づいて、エンコーダに対する符号化レートCRを求める。ここでは、CR=BR−αとする。
(S704)算出された符号化レートCRは、エンコーダへ入力される。エンコーダは、入力された符号化レートCRに応じて制御される。
【0083】
図8は、安定度判定部における伝送路レートの回復のためのフローチャートである。
【0084】
図8の処理は、図7の処理に続いて(dT毎に)実行されてもよいし、別のタイミングで実行されてもよい。
(S801)バッファ入力レートBRinが、バッファ出力レートBR以下であるか否かを判定する。BRinがBRよりも大きければ、変数tに現在時刻nowを代入して(S807)、処理を終了する。
(S802)BRinがBR以下であるならば、バッファのバッファ蓄積量が、所定の閾値Thよりも小さいか否かを判定する。バッファ蓄積量が閾値Th以上であれば、変数tに現時時刻nowを代入して(S807)、処理を終了する。
(S803)バッファ蓄積量が閾値Thよりも小さいならば、現在時刻nowから過去時刻tを差し引いた時間間隔が、所定の時間間隔TMよりも長いか否かを判定する。TMよりも短かいならば、処理を終了する。時間間隔TMは、伝送路レートの回復判定時間であって、タイマ127によってカウントされる。例えば実際の伝送路レートが80kbps程度であれば、時間間隔TMはおよそ5秒程度に設定される。
(S804)所定の時間間隔TMよりも長いならば、安定状態にあると判断し、伝送路レート測定処理を行う。
(S805)伝送レート測定処理によって測定された伝送路レートTRは、バッファ出力レートBRに代入され、符号化レートCR(=BR−α)が決定される。
(S806)最後に、符号化レートCRは、エンコーダへ入力される。エンコーダは、CRに基づいて符号化レートを制御する。
【0085】
図9は、バッファ蓄積量の時間変動を表すグラフである。縦軸は現在時刻のバッファ蓄積量を表し、横軸は時刻を表す。
【0086】
伝送開始当初、式(6)BRin ≦ BRの関係が満足されているとする。
(S1)N=5として、過去時刻のバッファ蓄積量BN=2、現在時刻のバッファ蓄積量B1=7とする。これは、伝送路レートが低下したことによって、バッファ蓄積変動量dB(B1−BN)が増加している。このとき、式(4)によってバッファ出力レートBRが算出される。そして、符号化レートCR(=BR−α)がエンコーダに入力される。
【0087】
(S2)次に、dT時間経過した際、レジスタをシフトさせ、レジスタB1に現在時刻のバッファ蓄積量を新たに格納する。このとき、過去時刻のバッファ蓄積量BN=2、現在時刻のバッファ蓄積量B1=7とする。このとき、式(4)によってバッファ出力レートBRが算出される。そして、符号化レートCR(=BR−α)がエンコーダに入力される。
【0088】
(S3、S4)次に、dT時間経過した際、レジスタをシフトさせ、レジスタB1に現在時刻のバッファ蓄積量を新たに格納する。このとき、過去時刻のバッファ蓄積量BN=4、現在時刻のバッファ蓄積量B1=5とする。このとき、式(4)によってバッファ出力レートBRが算出される。そして、符号化レートCR(=BR−α)がエンコーダに入力される。
【0089】
(S5)次に、dT時間経過した際、レジスタをシフトさせ、レジスタB1に現在時刻のバッファ蓄積量を新たに格納する。このとき、過去時刻のバッファ蓄積量BN=7、現在時刻のバッファ蓄積量B1=2とする。ここでは、バッファ蓄積変動量dB(B1−BN)が減少している。従って、式(4)によって新たなバッファ出力レートを算出することはしない。
【0090】
(S6)次に、dT時間経過した際、レジスタをシフトさせ、レジスタB1に現在時刻のバッファ蓄積量を新たに格納する。このとき、過去時刻のバッファ蓄積量BN=7、現在時刻のバッファ蓄積量B1=2とする。ここでは、バッファ蓄積変動量dB(B1−BN)が減少している。従って、式(4)によって新たなバッファ出力レートを算出することはしない。
【0091】
図3のS4以降は、新たに決定されたバッファ入力レートBRinによって式(6)「バッファ入力レートBRin≦バッファ出力レートBR」の状態が継続している。この間、バッファに蓄積されているデータバイト数は小さい値で維持されることとなる。しかしながら、伝送路レートが回復した場合であっても、このバッファ入力レートBRinを簡単に増大することはできない。式(4)からは、伝送路レートの回復の判断はできないためである。
【0092】
図3のS4以降は、式(6)「バッファ入力レートBRin≦バッファ出力レートBR」の状態であって、且つ、閾値Th以下の状態が、一定時間TM以上継続しているとする安定状態か否かを判定する。安定状態が継続した場合、伝送路レートの測定を開始する。実際に測定された伝送路レートは、新たにバッファ出力レートBRとして反映される。従って、「バッファ入力レートBRin≦バッファ出力レートBR」となるバッファ入力レートBRinが新たに決定され、そのバッファ入力レートBRinが映像エンコーダに102に入力される。
【0093】
安定度判定部125は、レポートパケットを送受信して伝送路レートを測定する。レポートパケットを送信している際に、式(4)による伝送路レートの低下が検知されれば、レポートパケットにより送信バッファが影響を受けていることとなる。この場合、伝送路の回復状態は不十分と判断し、安定状態の判断は解除されることとなる。
【0094】
図10は、本発明における送信装置の機能構成図である。
【0095】
図10の送信装置は、図4の送信装置に図6の機能構成を含むものである。バッファ入力レート算出部131は、映像エンコーダ部102と音声エンコーダ部108とからバッファ入力レートを取得する。これら入力レートの和が、バッファ入力レートBRinとして算出される。バッファ121は、多重化部111によって映像データ及び音声データが1つのフレームに構成された多重化パケットを一時的に蓄積しており、シフトレジスタ122は、バッファ121のバッファ蓄積量を記憶する。符号化レート決定部132は、決定した符号化レートCRを映像エンコーダ部102に入力する。従って、映像データの符号化レートが動的に変更されることとなる。
【0096】
しかしながら、符号化レート決定部132によって出力される符号化レートは、音声エンコーダに入力されてもよい。また、映像エンコーダ及び音声エンコーダの両方に入力されるものであってもよい。
【0097】
例えば、符号化レート決定部132は、以前の符号化レートから10000bit/秒だけ減少させなればならないとする。図10の送信装置によれば、10000bit/秒の符号化レートの減少を、映像エンコーダ102によって制御する。しかしながら、映像エンコーダ102の符号化レートを9000bit/秒だけ低下させ、音声エンコーダ108の符号化レートを1000bit/秒だけ低下させることもできる。
【0098】
実際には、IPテレビ電話によって用いられる会話用音声エンコーダは、ビットレートの設定範囲が狭い。例えばAMRでは、4.75kbit/秒〜12.2kbit/秒である。これに対し、映像エンコーダは、32kbit/秒の設定範囲がある。従って、音声エンコーダのレートを変更してもその範囲に限界があり、会話を優先するためにも音声エンコーダのレートは維持する必要がある。一方、映像エンコーダは、レート変更の範囲が広く、音声エンコーダと比較してビットレートに依存しないために、そのビットレート情報を相手通信装置へ送信する必要もない。従って、図10の送信装置によれば、映像エンコーダのみの符号化レートを変更している。
【0099】
前述した本発明における符号化レートを制御する送信装置、送信プログラム及び送信方法の種々の実施形態によれば、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略を、当業者は容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【図面の簡単な説明】
【0100】
【図1】従来技術によるパケット多重化のための送信装置の機能構成図である。
【図2】従来技術におけるデータパケットの伝送のシーケンス図である。
【図3】本発明におけるパケット多重化フレームのメディア分割構成図である。
【図4】本発明によって用いられる送信装置の機能構成図である。
【図5】図4の送信装置におけるデータパケットの伝送のシーケンス図である。
【図6】本発明における送信装置の基本的な機能構成図である。
【図7】測定時間間隔dT毎に実行されるフローチャートである。
【図8】安定度判定部における伝送路レートの回復のためのフローチャートである。
【図9】バッファ蓄積量の時間変動を表すグラフである。
【図10】本発明における送信装置の機能構成図である。
【符号の説明】
【0101】
1 送信装置
101 フォーマット変換部
102 映像エンコーダ部、エンコーダ部
103 映像データ用バッファ、バッファ
104、106 RTPヘッダ付加部
105 UDP/IPプロトコルスタック部
107 音声データ用バッファ
108 音声エンコーダ部
109 A/D変換部
110 増幅器
111 パケット構成部、多重化部
121 バッファ
122 シフトレジスタ
123、130 減算器
124 平均化部
125 安定度判定部
126 伝送路レート測定部
127 タイマ
128 クロック
129 スイッチ
131 バッファ入力レート算出部
132 符号化レート決定部
3 IPネットワーク
4 カメラ
5 マイク

【特許請求の範囲】
【請求項1】
送信すべきメディアデータを符号化するエンコーダ手段と、
前記符号化されたメディアデータを一時的に蓄積するバッファと、
前記バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
前記バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、前記バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定された前記バッファ出力レートBRを符号化レートとして前記エンコーダ手段に入力する符号化レート決定手段と
を有することを特徴とする符号化レートを制御する送信装置。
【請求項2】
送信すべき第1のメディアデータを符号化する第1のエンコーダ手段と、
送信すべき第2のメディアデータを符号化する第2のエンコーダ手段と、
前記符号化された第1のメディアデータ及び第2のメディアデータそれぞれのパケットを一時的に蓄積するバッファと、
前記バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
前記バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、前記バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定された前記バッファ出力レートBRを符号化レートとして前記第1のエンコーダ手段に入力する符号化レート決定手段と
を有することを特徴とする符号化レートを制御する送信装置。
【請求項3】
前記第1のメディアデータは映像データであって、前記第2のメディアデータは音声データであることを特徴とする請求項2に記載の送信装置。
【請求項4】
前記第1のメディアデータは音声データであって、前記第2のメディアデータは映像データであることを特徴とする請求項2に記載の送信装置。
【請求項5】
前記符号化レート決定手段は、前記符号化レートを
符号化レート ≦ バッファ出力レートBR
となるように決定することを特徴とする請求項1から4のいずれか1項に記載の送信装置。
【請求項6】
バッファ入力レートBRin ≦ バッファ出力レートBR
であって、且つ、前記バッファのバッファ蓄積量が所定の閾値以下である状態が、一定時間経過した際に、安定状態であるとして検出する安定状態判定手段と、
前記安定状態判定手段が前記安定状態であると判定した際に、前記メディアデータを送信すべき伝送路レートを測定する伝送路レート測定手段と
を更に有し、
前記符号化レート決定手段は、前記伝送路レート測定手段によって測定された伝送路レートを前記バッファ出力レートBRとして、前記符号化レートを決定することを特徴とする請求項1から5のいずれか1項に記載の送信装置。
【請求項7】
バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)について平均化する平均化手段を更に有することを特徴とする請求項1から6のいずれか1項に記載の送信装置。
【請求項8】
送信すべきメディアデータを符号化するエンコーダ手段と、
前記符号化されたメディアデータを一時的に蓄積するバッファと、
前記バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
前記バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、前記バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定された前記バッファ出力レートBRを符号化レートとして前記エンコーダ手段に入力する符号化レート決定手段と
してコンピュータを機能させることを特徴とする符号化レートを制御する送信プログラム。
【請求項9】
送信すべき第1のメディアデータを符号化する第1のエンコーダ手段と、
送信すべき第2のメディアデータを符号化する第2のエンコーダ手段と、
前記符号化された第1のメディアデータ及び第2のメディアデータそれぞれのパケットを一時的に蓄積するバッファと、
前記バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、該測定されたバイト数(B1〜BN)の履歴を記録するメモリ手段と、
前記バッファへのバッファ入力レートBRinを測定するバッファ入力レート算出手段と、
バッファ蓄積変動量(B1−BN)が増加している場合、前記バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定された前記バッファ出力レートBRを符号化レートして前記第1のエンコーダ手段に入力する符号化レート決定手段と
してコンピュータを機能させることを特徴とする符号化レートを制御する送信プログラム。
【請求項10】
前記第1のメディアデータは映像データであって、前記第2のメディアデータは音声データであることを特徴とする請求項9に記載の送信プログラム。
【請求項11】
前記第1のメディアデータは音声データであって、前記第2のメディアデータは映像データであることを特徴とする請求項9に記載の送信プログラム。
【請求項12】
前記符号化レート決定手段は、前記符号化レートを
符号化レート ≦ バッファ出力レートBR
となるように決定するようにコンピュータを機能させることを特徴とする請求項8から11のいずれか1項に記載の送信プログラム。
【請求項13】
バッファ入力レートBRin ≦ バッファ出力レートBR
であって、且つ、前記バッファのバッファ蓄積量が所定の閾値以下である状態が、一定時間経過した際に、安定状態であるとして検出する安定状態判定手段と、
前記安定状態判定手段が前記安定状態になったと判定した際に、前記メディアデータを送信すべき伝送路レートを測定する伝送路レート測定手段と
を更に有し、
前記符号化レート決定手段は、前記伝送路レート測定手段によって測定された伝送路レートを前記バッファ出力レートBRとして、前記符号化レートを決定するようにコンピュータを機能させることを特徴とする請求項8から12のいずれか1項に記載の送信プログラム。
【請求項14】
バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)について平均化する平均化手段を更に有するように機能させることを特徴とする請求項8から13のいずれか1項に記載の送信プログラム。
【請求項15】
送信すべきメディアデータを符号化するエンコーダと、前記符号化されたメディアデータを一時的に蓄積するバッファとを有し、
前記バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、メモリにその測定されたバイト数(B1〜BN)の履歴を記録する第1のステップと、
前記バッファへのバッファ入力レートBRinを測定する第2のステップと、
バッファ蓄積変動量(B1−BN)が増加している場合、前記バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定された前記バッファ出力レートBRを符号化レートとして前記エンコーダに入力する第3のステップと
有することを特徴とする符号化レートを制御する送信方法。
【請求項16】
送信すべき第1のメディアデータを符号化する第1のエンコーダと、送信すべき第2のメディアデータを符号化する第2のエンコーダと、前記符号化された第1のメディアデータ及び第2のメディアデータそれぞれのパケットを一時的に蓄積するバッファとを有し、
前記バッファに蓄積されたメディアデータのバイト数を所定時間dT毎に測定し、メモリにその測定されたバイト数(B1〜BN)の履歴を記録する第1のステップと、
前記バッファへのバッファ入力レートBRinを測定する第2のステップと、
バッファ蓄積変動量(B1−BN)が増加している場合、前記バッファからのメディアデータのバッファ出力レートBRを、
バッファ出力レートBR=
バッファ入力レートBRin−バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)
によって決定し、決定された前記バッファ出力レートBRを符号化レートとして前記第1のエンコーダ手段に入力する第3のステップと
を有することを特徴とする符号化レートを制御する送信方法。
【請求項17】
前記第1のメディアデータは映像データであって、前記第2のメディアデータは音声データであることを特徴とする請求項16に記載の送信方法。
【請求項18】
前記第1のメディアデータは音声データであって、前記第2のメディアデータは映像データであることを特徴とする請求項16に記載の送信方法。
【請求項19】
前記第3のステップは、前記符号化レートを
符号化レート ≦ バッファ出力レートBR
となるように決定することを特徴とする請求項15から18のいずれか1項に記載の送信方法。
【請求項20】
バッファ入力レートBRin ≦ バッファ出力レートBR
であって、且つ、前記バッファのバッファ蓄積量が所定の閾値以下である状態が、一定時間経過した際に、安定状態であるとして検出するステップと、
前記安定状態判定手段が前記安定状態であると判定した際に、前記メディアデータを送信すべき伝送路レートを測定するステップと
を更に有し、
前記第3のステップは、前記伝送路レート測定手段によって測定された伝送路レートを前記バッファ出力レートBRとして、前記符号化レートを決定することを特徴とする請求項15から18のいずれか1項に記載の送信方法。
【請求項21】
バッファ蓄積変動量(B1−BN)/変動時間間隔(dT×N)について平均化するステップを更に有することを特徴とする請求項15から20のいずれか1項に記載の送信方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2006−115306(P2006−115306A)
【公開日】平成18年4月27日(2006.4.27)
【国際特許分類】
【出願番号】特願2004−301610(P2004−301610)
【出願日】平成16年10月15日(2004.10.15)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】