説明

音声通信システム、音声通信装置及びプログラム

【課題】 固定レート型の音声符号化方式が適用されていても伝送レートを可変とし、変化する伝送路の状態(帯域に)適合可能な音声通信装置を提供する。
【解決手段】 本発明の音声通信装置は、固定レートの音声符号化方式で符号化した符号化音声データをパケットのペイロードに挿入して対向装置に向けて送信するものに関する。そして、当該音声通信装置から対向装置への伝送路の状態を把握する伝送路状態把握手段と、把握した伝送路状態に応じて、組み立てるパケットのペイロードサイズを変更するパケット生成手段とを有することを特徴とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声通信システム、音声通信装置及びプログラムに関し、例えば、携帯電話やスマートフォンに適用し得るものである。
【背景技術】
【0002】
近年では、VoIP技術を利用した音声通信であるIP電話端末(ソフトフォンを含む)が広く普及してきた。IP電話端末は、音声の情報をIPパケット化して、IPネットワークを介して伝送することにより、通話相手に音声を伝える。IP電話端末の形態も、スマートフォンなどの携帯型端末が普及してきた。携帯型のIP電話端末では、音声データの伝送路として、いわゆる3G(3世代)ネットワークを用いるため、その時点での使用ユーザ数などに応じて伝送帯域が割り当てられるため、必ずしも十分な伝送帯域が割り当てられない場合がある。
【0003】
割り当てられる伝送帯域は時々刻々変化するため、それに応じて伝送レートを可変できると都合が良い。例えば、非特許文献1で規定されているような可変レート型の音声符号化方式を用いることにより、上述したような伝送帯域の問題を解決できる可能性はある。また、特許文献1には、RTP(リアルタイムプロトコル)パケットにおけるシーケンス番号を省略して伝送することにより、伝送帯域を軽減することが記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特表2010−515346号公報
【非特許文献】
【0005】
【非特許文献1】ITU−T G.722.2
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、IP電話に利用される音声符号化方式は、固定レート型である場合が多く、この場合には、符号化レートを変更することによって伝送レートを制御することはできない。
【0007】
特許文献1の記載技術のようにシーケンス番号を省略することで伝送レートを高めることは可能であるが、この方法では、シーケンス番号を省略した分しか伝送レートを高めることができず、伝送帯域の変化量をカバーすることができない。また、シーケンス番号を省略したことに伴って、送信側及び受信側の処理が非常に複雑なものとなっている。
【0008】
本発明は、以上の点に鑑みなされたものであり、固定レート型の音声符号化方式が適用されていても伝送レートを可変とし、変化する伝送路の状態(帯域に)適合可能な音声通信システム、音声通信装置及びプログラムが望まれている。
【課題を解決するための手段】
【0009】
第1の本発明は、固定レートの音声符号化方式で符号化した符号化音声データをパケットのペイロードに挿入して対向装置に向けて送信する音声通信装置において、(1)当該音声通信装置から上記対向装置への伝送路の状態を把握する伝送路状態把握手段と、(2)把握した伝送路状態に応じて、組み立てる上記パケットのペイロードサイズを変更するパケット生成手段とを有することを特徴とする。
【0010】
第2の本発明は、固定レートの音声符号化方式で符号化した符号化音声データをパケットのペイロードに挿入して対向装置に向けて送信する2つの音声通信装置がネットワークを介して対向している音声通信システムにおいて、上記各音声通信装置として、(1)当該音声通信装置から上記対向装置への伝送路の状態を把握する伝送路状態把握手段と、(2)把握した伝送路状態に応じて、組み立てる上記パケットのペイロードサイズを変更するパケット生成手段と、(3)上記対向装置から当該音声通信装置への伝送路の状態を検出する伝送路状態検出手段と、(4)送信するパケットにおけるシーケンス番号の欠落パターンを意図したものとし、上記対向装置から当該音声通信装置への伝送路状態の情報を上記対向装置へ通知させる伝送路状態通知手段とを有する音声通信装置を適用していることを特徴とする。
【0011】
第3の本発明は、固定レートの音声符号化方式で符号化した符号化音声データをパケットのペイロードに挿入して対向装置に向けて送信する音声通信装置に搭載されるコンピュータを、(1)当該音声通信装置から上記対向装置への伝送路の状態を把握する伝送路状態把握手段と、(2)把握した伝送路状態に応じて、組み立てる上記パケットのペイロードサイズを変更するパケット生成手段として機能させることを特徴とする。
【0012】
第4の本発明は、音声データをパケットのペイロードに挿入して対向装置に向けて送信する音声通信装置において、送信するパケットにおけるシーケンス番号の欠落パターンを意図したものとし、所定情報を上記対向装置へ通知する伝送路状態通知手段を有することを特徴とする。
【発明の効果】
【0013】
本発明によれば、固定レート型の音声符号化方式が適用されていても伝送レートを可変とし、変化する伝送路の状態(帯域に)適合することができる。
【図面の簡単な説明】
【0014】
【図1】実施形態に係る音声通信装置の構成を示すブロック図である。
【図2】実施形態の音声通信装置におけるRTP生成・送信回路の詳細構成を示すブロック図である。
【図3】実施形態の音声通信装置におけるRTP生成・送信回路で生成されるRTPパケットの構成を示す説明図である。
【図4】実施形態の音声通信装置におけるRTP受信・ロス監視回路の詳細構成を示すブロック図である。
【発明を実施するための形態】
【0015】
(A)主たる実施形態
以下、本発明による音声通信システム、音声通信装置及びプログラムの一実施形態を、図面を参照しながら詳述する。実施形態の音声通信システムは、実施形態の音声通信装置がネットワークを介して対向しているシステムである。
【0016】
(A−1)実施形態の構成
図1は、実施形態に係る音声通信装置の構成を示すブロック図である。図1において、第1の実施形態の音声通信装置1は、マイクロフォン10、アナログ/デジタル変換器(A/D)11、音声符号化回路12、RTP生成・送信回路13、RTP受信・ロス監視回路14、音声復号回路15、デジタル/アナログ変換器(D/A)16及びスピーカ17を有する。
【0017】
ここで、音声符号化回路12、RTP生成・送信回路13、RTP受信・ロス監視回路14及び音声復号回路15は、専用的な回路として構成するだけでなく、CPUと、CPUが実行するプログラムで実現するようにしても良い。
【0018】
マイクロフォン10は、送話者が発した音声(発話音声)を捕捉するものであり、アナログ/デジタル変換器11は、捕捉されて得られたアナログ音声信号をデジタル音声信号Ssに変換するものである。
【0019】
音声符号化回路12は、デジタル音声信号Ssを固定の符号化レートで符号化し、符号化音声データCsを出力するものである。例えば、固定符号化レートの音声符号化方式として、ITU−T G.711に規定の方式を適用できる。符号化に際しては、デジタル音声信号Ssを所定期間(フレーム)ずつに切り分けて処理する。このような所定期間として、例えば、20msを適用できる。
【0020】
RTP生成・送信回路13は、後述する図2に示すような詳細構成を有し、符号化音声データCsをペイロードに含むRTPパケットRsを生成してネットワークに向けて送信するものである。RTP生成・送信回路13の詳細機能については後述する。
【0021】
RTP受信・ロス監視回路14は、後述する図4に示すような詳細構成を有し、ネットワークから到来したRTPパケットRdを分解し、取り出した符号化音声データCdを音声復号回路15に与えるものである。
【0022】
音声復号回路15は、符号化音声データCdに対して音声復号処理を行い、デジタル音声信号Sdを得るものである。
【0023】
デジタル/アナログ変換器16は、デジタル音声信号Sdをアナログ音声信号に変換し、スピーカ17は、そのアナログ音声信号を発音出力するものである。
【0024】
図2は、RTP生成・送信回路13の詳細構成を示すブロック図である。図2において、RTP生成・送信回路13は、符号化音声データバッファ20、RTPパケット組立部21、ペイロードサイズ制御部22及びヘッダ情報提供部23を有する。
【0025】
符号化音声データバッファ20は、音声符号化回路12から与えられ、RTPパケットのペイロードに挿入されるのを待っている符号化音声データをバッファリングしているものである。
【0026】
RTPパケット組立部21は、符号化音声データバッファ20にバッファリングされている符号化音声データと、ヘッダ情報提供部23が提供するヘッダ情報とから、RTPパケットを組み当てて出力するものである。
【0027】
ペイロードサイズ制御部22は、RTP受信・ロス監視回路14から与えられた伝送レート制御信号Pの値や変化に基づき、1つのRTPパケットのペイロードに挿入する符号化音声データの量(以下では、ペイロードサイズと呼ぶこともある)を、RTPパケット組立部21に指示するものである。ここで、ペイロードサイズは、20ms分(フレーム分)のデジタル音声信号を符号化したデータ量(以下、単位データ量と呼ぶ;その量をxとする)ずつ異なるようになされている。
【0028】
図3は、この実施形態の通信システムにおけるRTPパケットの構成を示す説明図である。図3(A)は、ヘッダ(H)に1つの単位データ量の符号化音声データD1、D2、D3、D4が付いたRTPパケットを4つ示している。図3(B)は、ヘッダ(H)に2つの単位データ量の符号化音声データD1及びD2、D3及びD4が付いたRTPパケットを2つ示している。図3(C)は、ヘッダ(H)に4つの単位データ量の符号化音声データD1〜D4が付いたRTPパケットを1つ示している。
【0029】
ここで、4つの単位データ量の符号化音声データD1〜D4をネットワークに送出するのに、図3(A)〜(C)のそれぞれのRTPパケットを利用する場合を考える。図3(C)に示すRTPパケットを利用する場合、伝送路に送出されたデータ量は、ヘッダのデータ量をyとすると4x+yとなる。図3(B)に示すRTPパケットを利用する場合、伝送路に送出されたデータ量は4x+2yとなる。図3(A)に示すRTPパケットを利用する場合、伝送路に送出されたデータ量は4x+4yとなる。すなわち、ヘッダに付与する単位データ量の符号化音声データの数によって(言い換えると、ペイロードサイズによって)、伝送路に所定時間当りに流れるデータ量である伝送レートを制御することができる。
【0030】
ペイロードサイズ制御部22は、RTP受信・ロス監視回路14から「1」の伝送レート制御信号Pが与えられた場合には、今までよりペイロードサイズを20msだけ大きくするように制御する。また、ペイロードサイズ制御部22は、RTP受信・ロス監視回路14からの伝送レート制御信号Pが「0」をとる連続時間が所定時間を越えると、今までよりペイロードサイズを20msだけ小さくするように制御すると共に、計時している連続時間を0クリアし、最初から計時し直すようにする。
【0031】
ここで、通話開始時のデフォルトのペイロードサイズは任意であるが、例えば、最小サイズにするようにしても良い。また、ペイロードサイズに上限を設けないようにしても良いが、ペイロードサイズが大きくなればなるほど、RTPパケットの生成遅延が大きくなるので、上限を設けるようにしても良い。上限を設けた場合には、上限のペイロードサイズに達しているときに、「1」の伝送レート制御信号Pが与えられても上限のペイロードサイズを維持することになる。
【0032】
ヘッダ情報提供部23は、生成するRTPパケットのヘッダの情報を提供するものである。この実施形態の場合、ヘッダ情報提供部23が提供するヘッダ情報のうち、シーケンス番号の形成に特徴を有している。ヘッダ情報提供部23は、シーケンス番号制御信号Qが「1」であった場合には、シーケンス番号の下1桁が「0」となるRTPパケットを所定回数(例えば、10回)だけ生成しないようにする動作を行う(ネットワークに送信しないこととする)。ヘッダ情報提供部23は、シーケンス番号制御信号Qが「0」であった場合には、通常の動作を行う。
【0033】
例えば、シーケンス番号が「0129」のRTPパケットを生成した後に、「1」のシーケンス番号制御信号Qが与えられた場合には、次のRTPパケットのシーケンス番号を「0131」とし、シーケンス番号が「0130」のRTPパケットが生成されないようにする。所定回数が10回であれば、同様に、シーケンス番号が「0140」、「0150」、「0160」、「0170」、「0180」、「0190」、「0200」、「0210」、「0220」のRTPパケットは生成されない。なお、一旦、RTPパケットを生成した後、直ちに廃棄するようにしても良いが、廃棄されたRTPパケットのペイロードに挿入されている符号化音声データが無駄になるので、当初より生成しないことが好ましい。また、生成しないRTPパケットの送信タイミングでは当然に送信がなされず、送信が空となる。なお、シーケンス番号を飛ばすだけであり、送信タイミングでは常時RTPパケットを送信するようにしても良い。
【0034】
図4は、RTP受信・ロス監視回路14の詳細構成を示すブロック図である。図4において、RTP受信・ロス監視回路14は、RTPパケット分解部30、符号化音声データバッファ31、伝送レート指示部32及びロス率監視部33を有する。
【0035】
RTPパケット分解部30は、ネットワークから到来したRTPパケットを分解し、符号化音声データを抽出するものである。また、RTPパケット分解部30は、受信したRTPパケットのヘッダからシーケンス番号を取り出して、
伝送レート指示部32及びロス率監視部33に与えるものである。
【0036】
符号化音声データバッファ31は、RTPパケット分解部30から出力された符号化音声データをバッファリングし、RTPパケットの到来揺らぎ(ジッタ)を吸収して出力するものである。
【0037】
伝送レート指示部32は、シーケンス番号の下1桁が「0」となるRTPパケットが到来しない連続回数を監視するものである。伝送レート指示部32は、この連続回数が所定回数に達したときに、「1」の伝送レート制御信号Pをペイロードサイズ制御部22に与え、これ以外では、伝送レート制御信号Pの値を「0」に維持するものである。シーケンス番号の下1桁が「0」となるRTPパケットが到来しない連続回数が所定回数に達することは、対向する音声通信装置が、当該音声通信装置からのRTPパケットが通っていく伝送路の状態が悪い(伝送帯域を越えて当該音声通信装置がRTPパケットを送出している)と判断したことを表している。
【0038】
ロス率監視部33は、所定時間(例えば10秒)ごとに、ロス率を計算する。ロス率は、受信したRTPパケットのシーケンス番号に基づいて、伝送路で廃棄されたRTPパケットを認識することを行うが、この実施形態のロス率監視部33は、シーケンス番号の下1桁が「0」となるRTPパケットが到来しないことを、ロス率の算出には反映しないものとなっている。ロス率監視部33は、ロス率が閾値を越えた場合には、「1」のシーケンス番号制御信号Qをヘッダ情報提供部23に与え、ロス率が閾値以下の場合には、「0」のシーケンス番号制御信号Qをヘッダ情報提供部23に与える。これにより、RTP生成・送信回路13から、シーケンス番号の下1桁が「0」となるRTPパケットが所定回数出力されず、対向する音声通信装置へ、ロス率が高いこと(伝送路の状態が悪いこと)を検出したことを通知することができる。
【0039】
(A−2)実施形態の動作
次に、以上のような構成を有する実施形態に係る音声通信装置1の動作を説明する。以下の説明において、構成要素の符号末尾に「−1」又は「−2」を付して、通信に供している2つの音声通信装置のうち、第1の音声通信装置1−1に関するものか、第2の音声通信装置1−2に関するものかを区別する。
【0040】
第1の音声通信装置1−1において、送話者が発した音声(発話音声)は、マイクロフォン10−1で捕捉され、アナログ/デジタル変換器11−1によってデジタル音声信号Ss−1に変換される。このデジタル音声信号Ss−1は、音声符号化回路12−1によって、固定の符号化レートで符号化され、得られた符号化音声データCs−1が、RTP生成・送信回路13−1においてRTPパケットRs−1に組み立てられて、対向する第2の音声通信装置1−2に向けて送信される。
【0041】
対向する第2の音声通信装置1−2が送信し、当該第1の音声通信装置1−1に到来したRTPパケットRd−1は、RTP受信・ロス監視回路14−1で分解され、抽出された符号化音声データCd−1は、音声復号回路15−1において復号され、デジタル音声信号Cd−1が復元される。このデジタル音声信号Cd−1は、デジタル/アナログ変換器16−1においてアナログ音声信号に変換された後、スピーカ17−1によって発音出力される。
【0042】
ここで、当該第1の音声通信装置1−1から対向する第2の音声通信装置1−2に向かう伝送路の状態が悪く、RTPパケットの廃棄が頻発し、ロス率が閾値を越えるようになると、第2の音声通信装置1−2(のRTP生成・送信回路13−2)から、シーケンス番号の下1桁が「0」となるRTPパケットが所定回数だけ連続して送出されない。
【0043】
当該第1の音声通信装置1−1のRTP受信・ロス監視回路14−1によって、シーケンス番号の下1桁が「0」となるRTPパケットの所定回数連続した空送出が検出されると、RTP受信・ロス監視回路14−1からRTP生成・送信回路13−1へ、「1」の伝送レート制御信号P−1が与えられる。これにより、RTPパケットRs−1のペイロードサイズが、RTP生成・送信回路13−1によって20msだけ増加され、当該第1の音声通信装置1−1から対向する第2の音声通信装置1−2に向かう伝送路への伝送レートが低下される。
【0044】
また、対向する第2の音声通信装置1−2から当該第1の音声通信装置1−1に向かう逆方向の伝送路の状態は、当該第1の音声通信装置1−1のRTP受信・ロス監視回路14−1によってロス率として検出される。ロス率が閾値を越えると、RTP受信・ロス監視回路14−1からRTP受信・ロス監視回路14−1に、「1」のシーケンス番号制御信号Q−1が与えられる。これにより、RTP生成・送信回路13−1から、シーケンス番号の下1桁が「0」となるRTPパケットが所定回数出力されず、対向する音声通信装置1−1へロス率が高いこと(伝送路の状態が悪いこと)が通知される。
【0045】
(A−3)実施形態の効果
以上のように、上記実施形態によれば、固定レート型の音声符号化方式を適用しながら、RTPパケットのペイロードサイズを適宜変更するようにしたので、伝送レートを可変とでき、変化する伝送路の状態(帯域)に適合することができる。
【0046】
(B)他の実施形態
上記実施形態においては、双方向共に、伝送路の状態(ロス率)を監視するものを示したが、片方向(例えば、発呼側装置から着呼側装置への方向)だけ監視し、他の方向については、監視している方向と同じ制御を行うようにしても良い。例えば、ロス率を検出している方から送信するRTPパケットのペイロードサイズは、到来したRTPパケットのペイロードサイズと同じになるように制御すれば良い。
【0047】
上記実施形態においては、RTPパケットのペイロードサイズを1段階ずつ上げるか又は下げる制御を行うものを示したが、ペイロードサイズの制御方法は、これに限定されない。例えば、伝送路の状態(ロス率)に応じ、相手側へ、RTPパケットのペイロードサイズの絶対的な段階を指示するようにしても良い。また、ロス率と比較する閾値を複数設け、ペイロードサイズの上昇又は下降の変化として、1段階から所定段階の間で指示できるようにしても良い。このような場合において、送信しないRTPパケットのシーケンス番号の下1桁の値を変えることで多くの指示に対応できるようにしても良く、送信しない空パケットの出現パターン(配置パターン)によって多くの指示に対応できるようにしても良い。
【0048】
上記実施形態においては、伝送路状態をロス率で捉えるものを示したが、他の方法で捉えるようにしても良い。
【0049】
例えば、相手装置が折り返すOAM(保守/運用/管理)パケットを送信し、複数のOAMパケットの往復時間の時間変動を、伝送路状態を表すものとして、RTPパケットのペイロードサイズを制御するようにしても良い。この場合であれば、ペイロードサイズを制御する装置が伝送路状態を把握できるので、対向装置へ伝送路状態を通知することが不要となる。
【0050】
また例えば、RTPパケットに挿入されているタイムスタンプから、片道の伝送時間を検出し、複数の伝送時間の揺らぎを、伝送路状態を表すものとして捉え、対向装置に通知して、RTPパケットのペイロードサイズを制御させるようにしても良い。
【0051】
さらに例えば、通話状態に入る前のネゴシエーション段階で、OAMパケットなどを利用して伝送路状態を捉えてRTPパケットのペイロードサイズを定め、通話状態では、定めたペイロードサイズを維持するようにしても良い。
【0052】
上記実施形態においては、シーケンス番号の下1桁が「0」となるRTPパケットの送出を所定回数だけ中止することで、対向装置に、所定情報(伝送路状態情報)を通知するものを示したが、他の通知方法を適用するようにしても良い。例えば、ペイロードの最初に通知情報を盛り込むようにしても良い。また、RTPパケットを送信させるタイミングが、タイムスタンプの下位数桁が複数の所定値のいずれかになる通信システムであれば、いずれかの所定値のRTPパケットの送信を中止することで、対向装置に所定情報を通知するようにしても良い。
【0053】
上記実施形態においては、シーケンス番号の下1桁が「0」となるRTPパケットの送出を所定回数だけ中止することで、対向装置に、伝送路状態を通知するものを示したが、この方法によって、他の情報を対向装置に通知するようにしても良い。例えば、送話音量のアップやダウンを指示するようにしても良い。
【符号の説明】
【0054】
1…音声通信装置、12…音声符号化回路、13…RTP生成・送信回路、14…RTP受信・ロス監視回路、15…音声復号回路、20…符号化音声データバッファ、21…RTPパケット組立部、22…ペイロードサイズ制御部、23…ヘッダ情報提供部、30…RTPパケット分解部、31…符号化音声データバッファ、32…伝送レート指示部、33…ロス率監視部。

【特許請求の範囲】
【請求項1】
固定レートの音声符号化方式で符号化した符号化音声データをパケットのペイロードに挿入して対向装置に向けて送信する音声通信装置において、
当該音声通信装置から上記対向装置への伝送路の状態を把握する伝送路状態把握手段と、
把握した伝送路状態に応じて、組み立てる上記パケットのペイロードサイズを変更するパケット生成手段と
を有することを特徴とする音声通信装置。
【請求項2】
上記伝送路状態把握手段は、上記対向装置から通知された情報に基づいて、当該音声通信装置から上記対向装置への伝送路の状態を把握することを特徴とする請求項1に記載の音声通信装置。
【請求項3】
上記対向装置から当該音声通信装置への伝送路の状態を検出する伝送路状態検出手段と、
送信するパケットにおけるシーケンス番号の欠落パターンを意図したものとし、上記対向装置から当該音声通信装置への伝送路状態の情報を上記対向装置へ通知させる伝送路状態通知手段と
をさらに有することを特徴とする請求項1又は2に記載の音声通信装置。
【請求項4】
固定レートの音声符号化方式で符号化した符号化音声データをパケットのペイロードに挿入して対向装置に向けて送信する2つの音声通信装置がネットワークを介して対向している音声通信システムにおいて、
上記各音声通信装置として、請求項3に記載の音声通信装置を適用していることを特徴とする音声通信システム。
【請求項5】
固定レートの音声符号化方式で符号化した符号化音声データをパケットのペイロードに挿入して対向装置に向けて送信する音声通信装置に搭載されるコンピュータを、
当該音声通信装置から上記対向装置への伝送路の状態を把握する伝送路状態把握手段と、
把握した伝送路状態に応じて、組み立てる上記パケットのペイロードサイズを変更するパケット生成手段と
して機能させることを特徴とする音声通信プログラム。
【請求項6】
音声データをパケットのペイロードに挿入して対向装置に向けて送信する音声通信装置において、
送信するパケットにおけるシーケンス番号の欠落パターンを意図したものとし、所定情報を上記対向装置へ通知する伝送路状態通知手段を有することを特徴とする音声通信装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2013−74424(P2013−74424A)
【公開日】平成25年4月22日(2013.4.22)
【国際特許分類】
【出願番号】特願2011−211307(P2011−211307)
【出願日】平成23年9月27日(2011.9.27)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】