説明

音声パケット伝送システム

【課題】 無音制御において、伝送路の有効利用を損なうことなく、無音区間と有音区間とのレベルの不連続性を補正し、会話の始まりや終わりに違和感を感じない音声パケット伝送システムを提供することを目的とするものである。
【解決手段】 無音境界判定手段の判定結果に基づき、音声フレームの有音区間と無音区間との境界に、補間フレーム生成手段によって生成された少なくとも1つの補間フレームを挿入するものである

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パケット網を介して、音声信号を伝送する音声パケット伝送システムに係り、特に、無音状態ではパケットの伝送を行なわない無音制御を行なう音声パケット伝送システムに関する。
【0002】
【従来の技術】従来、パケット網を介して音声信号を伝送し、無音状態ではパケットの伝送を行なわない無音制御を行なう音声パケット伝送システムは、送信側で有音区間/無音区間の検出を行い、無音区間ではパケットの送出は行なわず、受信側では背景雑音を再生する等し、伝送路の有効利用を図っている。
【0003】しかし、無音区間と有音区間との境界における音圧レベルが、入力側では連続的に変化するところが、出力側では、不連続に変化するので、会話の始まりや終わりで途切れのような違和感を感じるという問題がある。
【0004】無音区間と有音区間との境界の途切れや雑音に対して、特開平5−292121号公報に開示されているように、差分符号化を初期化する方法、特開平9−116571号公報に開示されるように、有音区間の先頭パケットとして予測係数を出力し、符号化器の状態を一致させる方法、音声を遅延させる有音区間の前方の無音区間を有音区間として音声フレーム化し、伝送する方法が提案されている。
【0005】
【発明が解決しようとする課題】しかし、特開平5−292121号公報、特開平9−116571号公報に記載されている手法は、無音パケット廃棄による復号化器の誤差を補正する手段であり、上記従来例では、無音制御による音圧レベルの不連続性を補正することはできないという問題がある。
【0006】また、有音区間の前方の無音区間から有音として取り扱う手法は、無音圧縮による伝送路の有効利用上マイナスとなる。さらに、擬似的に作り出された背景雑音と、実際に伝送された無音区間の音声フレームとの不連続性によって、無音制御の違和感が残るという問題がある。
【0007】本発明は、無音制御において、伝送路の有効利用を損なうことなく、無音区間と有音区間とのレベルの不連続性を補正し、会話の始まりや終わりに違和感を感じない音声パケット伝送システムを提供することを目的とするものである。
【0008】
【課題を解決するための手段】本発明は、音声信号をデジタル化された音声フレームヘ変換する音声符号化手段と、上記音声フレームを音声信号へ変換する音声復号化手段と、音声フレームをパケット化して送受信するパケット送受信手段と、音声信号に基づき音声の有無を検出する無音検出手段と、上記無音検出手段の検出結果に基づいて上記パケット送受信手段による音声フレームの送受信を制御する無音制御手段と、受信音声フレームの有音区間と無音区間との境界を判定する無音境界判定手段と、音声フレーム列の間を補う少なくとも1つの補間フレームを生成する補間フレーム生成手段とによって構成され、上記無音境界判定手段の判定結果に基づき、音声フレームの有音区間と無音区間との境界に、上記補間フレーム生成手段によって生成された少なくとも1つの補間フレームを挿入するよう動作するものである。
【0009】
【発明の実施の形態および実施例】[第1の実施例]図1R>1は、本発明の一実施例であるパケット伝送システムの概略を示すブロック図である。
【0010】上記実施例は、アナログ音声信号をマイク、電話回線等から入力する音声入力部101と、アナログ音声信号をPCMデジタルの音声信号へ変換するA/D変換部102と、PCMデジタル音声信号を圧縮符号化した音声フレームヘ変換する音声圧縮部103と、音声フレームをパケット網で転送可能なパケットに組み立て等を行なうパケット送信部104と、音声信号の無音区間を検出する無音検出部105と、パケット網120に対してパケットの送受信を行なうパケット送受信インタフェース106と、受信パケットから音声フレームの分解等を行なうパケット受信部107と、背景雑音フレームの生成を行なう背景雑音フレーム生成部111と、圧縮されている音声フレームを伸張し、PCMデジタルの音声信号へ変換する音声伸張部108と、PCMデジタル音声信号をアナログ音声信号へ変換するD/A変換部109と、アナログ音声信号をスピーカ、電話回線等へ出力する音声出力部110とを有する。
【0011】図2は、パケット送信部104の構成を示すブロック図である。
【0012】パケット送信部104は、音声圧縮部によって変換された音声フレームを一時貯える音声フレームバッファ201と、無音検出部105からの検出結果に基づき、無音制御を行なうフレームを生成する無音制御フレーム生成部204と、音声フレームバッファからパケット化に必要な音声フレームを取得し、タイムスタンプ、シケーンス番号、宛先アドレス等のヘッダ情報等を付加しパケットを組み立てるパケット組立部202と、組み立てたパケットをパケットインタフェース(I/F)106へ引き渡すパケット送信バッファ203とを有する。
【0013】図3は、パケット受信部107の構成を示すブロック図である。
【0014】パケット受信部107は、パケットインタフェース106からの受信パケットを格納し、ヘッダ情報に基づき、パケットの並べ替えや処理タイミングを制御するパケット受信バッファ301と、パケットのヘッダ情報を取り除き音声フレームを切り出すパケット分解部302と、音声フレームを格納する音声フレームバッファ303は、無音制御フレームを検出し、背景雑音フレーム生成部111から背景雑音フレームを取得し、音声フレームバッファ303へ格納する無音制御フレーム検出部304と、音声フレームバッファに格納された音声フレームの並びから、任意に位置する音声フレームを予測算出する音声フレーム補間部305とを有する。
【0015】次に、上記実施例の動作について説明する。
【0016】図4は、音声信号401を示す図である。
【0017】音声信号401は、図4に示すように、音声圧縮部103によって音声フレーム列402へ変換される。音声の圧縮方式としては、ITU−T勧告G.728、G.729、G.723.1等で規定されるハイブリッド方式等が考えられる。
【0018】図6は、上記実施例において、有音区間における符号化処理周期を示すフローチャートである。
【0019】図6のフローチャートにおいて、音声圧縮部103によって音声圧縮処理(S601)された音声フレーム、たとえば音声フレーム列402の音声フレームF3は、無音検出部105による無音検出がされないので(S602、No)、音声フレームF3は、音声フレームバッファ201へ格納される(S603)。
【0020】ここで、たとえば、音声フレーム列402における音声フレームF8のタイミングのように、入力音声信号401が、基準値L1を下回り、無音へ変化したと検出された場合(S602、Yes)、音声フレームF8は廃棄され(S611)、無音制御フレーム生成部204によって、有音区間から無音区間への変化を示す無音制御オンフレームFonが、音声フレームバッファ201へ格納され(S612)、無音区間へ遷移する(S613)。
【0021】図7は、上記実施例において、無音区間における符号化周期処理を示すフローチャートである。
【0022】まず、音声圧縮部103によって音声圧縮処理された(S701)音声フレーム、たとえば音声フレーム列402の音声フレームF12は、無音検出部105による有音検出がされないので(S702、No)、音声フレームバッファ201へは格納されず、廃棄される(S703)。
【0023】ここで、たとえば、音声フレーム列402における音声フレームF18のタイミングのように、入力音声信号401が基準値L1を越え、有音区間へ変化したと検出された場合(S702、Yes)、無音制御フレーム生成部204によって、無音区間から有音区間への変化を示す無音制御オフフレームFoffが、音声フレームバッファ201へ格納され(S711)、引き続き音声フレームF18が、音声フレームバッファ201へ格納され(S712)、有音区間へ遷移する(S713)。
【0024】図4に示され、音声フレームバッファ201へ格納された音声フレームと無音制御フレームとの列403は、パケット組立部202によって、パケット列404へ組み立てられ、パケット送信バッファ203へ転送される。
【0025】図8は、上記実施例におけるパケット組立周期処理を示すフローチャートである。
【0026】まず、音声フレームバッファ201に音声フレームが存在する場合(S801、Yes)、パケット組立に必要な音声フレームを、音声フレームバッファ201から取得し(S802)、この取得された音声フレームを合成し(S803)、ヘッダ情報を付加し(S804)、パケット送信バッファ203へ格納する(S805)。音声フレームバッファ201に音声フレームが存在しない場合(S801、No)、処理を終了する。
【0027】ここで、図4には、合成するフレーム数が1、すなわち音声フレームと音声パケットが1対1である場合を示してある。
【0028】図9は、上記実施例において、パケット転送周期処理を示すフローチャートである。
【0029】図10は、上記実施例における受信処理を示すフローチャートである。
【0030】まず、パケット送信バッファ203に格納されたパケットは、パケット送信バッファから取り出され(S901)、パケットが存在する場合(S902、Yes)、パケットインタフェース(I/F)106を介して、パケット網120へ送信される(S903)。パケットが存在しない場合(S902、No)、処理を終了する。パケット網120へ送出されたパケットは、ヘッダ情報を基に転送され、パケットI/F106を介して受信されると、図10に示す受信処理において、パケット受信バッファ301へ格納される(S1001)。
【0031】図5に示すように、パケット受信バッファ301に格納された受信パケット列501は、パケット分解部302によって、受信フレーム列502へ分解され、音声フレームバッファ303へ格納される。
【0032】図11は、上記実施例において、パケット分解周期を示すフローチャートである。
【0033】まず、パケットヘッダのシーケンス番号情報を基にして、パケット受信バッファ301内の受信パケット列501の到着順序の逆転等が補正される(S1101)。次に、パケットヘッダのタイムスタンプ情報を基にして、パケット受信バッファ301に分解処理を行なうべきパケットが存在するか否かを判断し(S1102)、処理タイミングのパケットが存在する場合(S1102、Yes)、受信パケットバッファ301から上記パケットを取り出し(S1103)、ヘッダが除去され(S1104)、フレームが分解され(S1105)、音声フレームバッファ303へ、音声フレームが格納される(S1106)。分解処理タイミングのパケットが存在しない場合(S1102、No)、そのまま処理を終了する。
【0034】図5に示すように、音声フレームバッファ303へ格納された音声フレーム列502は、無音制御フレーム検出部304によって、無音制御検出が行われ、背景雑音フレーム生成部111によって生成された背景雑音フレームFs、音声フレーム補間部305によって補間された補間フレームFiが挿入され、音声フレーム列503へ変換され、その後、音声伸張部108へ送られ、音声信号504が復元される。
【0035】図12は、上記実施例において、有音区間、たとえば音声フレーム列502の音声フレームF6のタイミングの復号化周期処理を示すフローチャートである。
【0036】まず、音声フレームと背景雑音フレームとの変化によって、無音区間と有音区間との境界であるか否かが判断される(S1201)。本実施例では、後述する補間フレームによる置き換え処理を1フレームに関して行なうとすると、境界は有音フレームと2つの背景雑音フレームとの連続する3フレームで判断されるので、音声フレームF6のタイミングにおいて、フレームF4〜F6は、全て有音フレームであり、境界ではないと判断される(S1201、No)。
【0037】次に、無音制御御フレームFonであるか否かが判断され(S1202)、Fonではないので(S1202、No)、音声フレームバッファ303の最も先頭の音声フレームが取り出され(S1203)、音声伸張部108へ転送される(S1204)。
【0038】ここで、音声フレームバッファ303には、無音境界検出に必要な音声フレームが最低限格納されているので、音声伸張部108へ転送される音声フレームは、フレームF4以前のものとなる。音声フレーム列502における有音区間F7に引き続く無音制御オンフレームFonのタイミングにおける復号化周期処理においては、無音制御オンフレームが認識され(S1202、Yes)、無音区間へ状態が遷移される(S1211)。
【0039】また、有音区間F2、F18のタイミングにおける復号化周期処理では、無音区間と有音区間との境界であると判断され(S1201、Yes)、有音区間と無音区間とに位置する背景雑音フレームが、それぞれ、補間フレームFi0、Fi2へ置換される(S1211)。補間フレームの生成は、たとえば、ハイブリッド符号化方式の場合、フィルタ係数、雑音符号帳インデックスは、有音区間のものを用い、ゲイン係数は、背景雑音ゲインとの中間値を取る手法等が考えられる。
【0040】図13は、上記実施例において、無音区間における復号化周期処理を示すフローチャートである。
【0041】まず、有音区間と無音区間との境界と判断されず(S1301、No)、無音制御オフフレームFoffでないと判断された場合(S1302、No)、背景雑音フレームFsが音声フレームバッファ303へ格納され(S1303)、先頭の音声フレームが取り出され(S1304)、音声伸張部108へ転送される(S1305)。有音区間と無音区間との境界であると判断されると(S1301、Yes)、補間フレームFi1、Fi3が生成置換され(S1311)、無音制御オフフレームFoffが検出されると(S1302、Yes)、有音区間に状態を遷移させる(S1321)。
【0042】[第2の実施例]上記第1の実施例において、音声圧縮方式によって定まる1音声フレームの時間的長さによって、補間フレームのサイズを変化させ、これによって、無音区間と有音区間との境界の時間的変化を、同一レベルに保つことが可能となり、音声圧縮方式に関わらず安定した滑らかさを実現することが可能となる。
【0043】
【発明の効果】本発明によれば、無音制御において、伝送路の有効利用を損なうことなく、無音区間と有音区間とのレベルの不連続性を補正し、会話の始まりや終わりに違和感を感じない音声パケット伝送システムを構築することが可能となり、さらに、音声圧縮方式によらず、安定した滑らかさを実現することも可能になるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例であるパケット伝送システムの概略を示すブロック図である。
【図2】パケット送信部104の構成を示すブロック図である。
【図3】パケット受信部107の構成を示すブロック図である。
【図4】音声信号401を示す図である。
【図5】音声信号501を示す図である。
【図6】上記実施例において、有音区間における符号化処理周期を示すフローチャートである。
【図7】上記実施例において、無音区間における符号化周期処理を示すフローチャートである。
【図8】上記実施例におけるパケット組立周期処理を示すフローチャートである。
【図9】上記実施例において、パケット転送周期処理を示すフローチャートである。
【図10】上記実施例において、パケット転送周期処理を示すフローチャートである。
【図11】上記実施例において、パケット分解周期を示すフローチャートである。
【図12】上記実施例において、有音区間、たとえば音声フレーム列502の音声フレームF6のタイミングの復号化周期処理を示すフローチャートである。
【図13】上記実施例において、無音区間における復号化周期処理を示すフローチャートである。
【符号の説明】
100…パケット伝送システム、
104…パケット送信部、
105…無音検出部、
107…パケット受信部、
111…背景雑音フレーム生成部、
120…パケット網、
401…音声信号。

【特許請求の範囲】
【請求項1】 パケット網を介して、音声信号を伝送する音声パケット伝送システムにおいて、上記音声信号を、デジタル化された音声フレームヘ変換する音声符号化手段と;上記音声フレームを、音声信号へ変換する音声復号化手段と;上記音声フレームをパケット化して送受信するパケット送受信手段と;上記音声信号に基づき、音声の有無を検出する無音検出手段と;上記無音検出手段の検出結果に基づいて、上記パケット送受信手段による音声フレームの送受信を制御する無音制御手段と;受信音声フレームにおける有音区間と無音区間との境界を判定する無音境界判定手段と;音声フレーム列の間を補う少なくとも1つのフレームを生成する補間フレーム生成手段と;を有し、上記無音境界判定手段の判定結果に基づき、上記音声フレームにおける有音区間と無音区間との境界に、上記補間フレーム生成手段によって生成された少なくとも1つの補間フレームを挿入することを特徴とする音声パケット伝送システム。
【請求項2】 請求項1において、背景雑音フレームを生成する背景雑音フレーム生成手段を設け、上記無音制御手段は、受信音声フレームが無音状態である場合、上記背景雑音フレーム生成手段によって生成された背景雑音フレームを取得する手段であり、上記音声復号化手段は、上記背景雑音フレームを音声信号へ変換するとともに、背景雑音フレームと音声フレームとの境界に存在する上記背景雑音フレームを、上記補間フレーム生成手段によって生成された上記補間フレームと置き換える手段であることを特徴とする音声パケット伝送システム。
【請求項3】 請求項1または2において、1音声フレームの時間的長さを認識する音声フレーム時間認識手段を設け、上記補間フレーム生成手段は、上記音声フレーム時間認識手段から得られる音声フレーム時間に基づき、補間フレーム数を決定する手段であることを特徴とする音声パケット伝送システム。

【図3】
image rotate


【図1】
image rotate


【図2】
image rotate


【図4】
image rotate


【図5】
image rotate


【図6】
image rotate


【図10】
image rotate


【図7】
image rotate


【図8】
image rotate


【図9】
image rotate


【図11】
image rotate


【図12】
image rotate


【図13】
image rotate


【公開番号】特開2000−307654(P2000−307654A)
【公開日】平成12年11月2日(2000.11.2)
【国際特許分類】
【出願番号】特願平11−115957
【出願日】平成11年4月23日(1999.4.23)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】