説明

音声データ処理装置

【課題】 音声の再生速度変更によって生じる音声品質の劣化を抑制することが可能な音声データ処理装置を得ることを目的とする。
【解決手段】 揺らぎ吸収バッファに蓄積されている音声データ量に基づいて、上記音声データの再生速度を決定する再生速度決定部と、上記音声データの再生速度と、上記揺らぎ吸収バッファに蓄積されている音声データの無音区間の区間長とに基づいて、上記無音区間の再生速度を決定する無音区間再生速度決定部と、上記音声データの再生速度と、上記揺らぎ吸収バッファに蓄積されている音声データの有音区間の区間長と、上記無音区間の再生速度とに基づいて、上記有音区間の再生速度を決定する有音区間再生速度決定部と、上記無音区間の再生速度と、上記有音区間の再生速度とに基づいて、上記音声データを再生する音声再生部とを備えたものである。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、揺らぎ吸収バッファに蓄積された音声データを再生する音声データ処理装置に関するものである。
【背景技術】
【0002】
近年のIP(Internet Protocol)ネットワークの発展により、音声信号をIPパケット化して伝送するVoIP(Voice over IP)技術の普及が進んでいる。このようなパケット通信においては、ネットワーク負荷の変動やデータ誤りの発生などによってパケット伝送遅延が変動する。このため、VoIPのような音声のリアルタイム通信を行う装置は、受信パケットの伝送遅延揺らぎを吸収する揺らぎ吸収バッファを備える。
【0003】
従来、揺らぎ吸収バッファを備えた音声データ処理装置の制御としては、伝送遅延揺らぎが大きい場合のバッファの枯渇や溢れを防止するために音声の再生速度を変更する技術が開示されている。具体的には、揺らぎ吸収バッファの蓄積量が増大すると音声の再生速度を速め、逆に蓄積量が減少すると音声の再生速度を下げる制御を行う(例えば、特許文献1)。
【0004】
また、音声の再生速度を変更すると音声品質の劣化が生じる。ここで、音声の無音部分については再生速度変更を行っても音声品質の劣化が小さく、有音部分については劣化が大きくなる。そこで、音声の無音区間を検出し、再生速度を上げる場合は無音部分の音声信号を削除し、再生速度を下げる場合は無音部分に仮無音データを挿入する制御が開示されている(例えば、特許文献2)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2004−282692号公報
【0006】
【特許文献2】特開2005−197850号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記の通り、音声の無音部分の削除・挿入により再生速度を変更することで、音声品質の劣化を防止することは出来るが、再生速度の変更が必要な場合に必ずしも無音部分があるとは限らないため、有音部分の再生速度変更は必要になる。従って、揺らぎ吸収バッファを備えた音声データ処理装置の制御において、音声の再生速度の変更を行うと音声品質の劣化が生じるという問題点があった。
【0008】
この発明は上記のような問題点を解決するためになされたもので、音声の再生速度変更によって生じる音声品質の劣化を抑制することが可能な音声データ処理装置を得ることを目的とする。
【課題を解決するための手段】
【0009】
この発明にかかる音声データ処理装置は、音声データが蓄積される揺らぎ吸収バッファと、上記揺らぎ吸収バッファに蓄積されている音声データ量に基づいて、上記音声データの再生速度を決定する再生速度決定部と、上記音声データの有音区間及び無音区間の各区間長を抽出する有音/無音区間長抽出部と、上記再生速度決定部で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部で抽出された上記揺らぎ吸収バッファに蓄積されている音声データの無音区間の区間長とに基づいて、上記無音区間の再生速度を決定する無音区間再生速度決定部と、上記再生速度決定部で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部で抽出された上記揺らぎ吸収バッファに蓄積されている音声データの有音区間の区間長と、上記無音区間再生速度決定部で決定された上記無音区間の再生速度とに基づいて、上記有音区間の再生速度を決定する有音区間再生速度決定部と、上記有音/無音区間長抽出部で抽出された有音区間及び無音区間の各区間長に対応する音声データを上記揺らぎ吸収バッファから読み出し、上記無音区間再生速度決定部で決定された上記無音区間の再生速度と、上記有音区間再生速度決定部で決定された上記有音区間の再生速度とに基づいて、上記音声データを再生する音声再生部とを備えたものである。
【発明の効果】
【0010】
この発明によれば、音声データが蓄積される揺らぎ吸収バッファと、上記揺らぎ吸収バッファに蓄積されている音声データ量に基づいて、上記音声データの再生速度を決定する再生速度決定部と、上記音声データの有音区間及び無音区間の各区間長を抽出する有音/無音区間長抽出部と、上記再生速度決定部で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部で抽出された上記揺らぎ吸収バッファに蓄積されている音声データの無音区間の区間長とに基づいて、上記無音区間の再生速度を決定する無音区間再生速度決定部と、上記再生速度決定部で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部で抽出された上記揺らぎ吸収バッファに蓄積されている音声データの有音区間の区間長と、上記無音区間再生速度決定部で決定された上記無音区間の再生速度とに基づいて、上記有音区間の再生速度を決定する有音区間再生速度決定部と、上記有音/無音区間長抽出部で抽出された有音区間及び無音区間の各区間長に対応する音声データを上記揺らぎ吸収バッファから読み出し、上記無音区間再生速度決定部で決定された上記無音区間の再生速度と、上記有音区間再生速度決定部で決定された上記有音区間の再生速度とに基づいて、上記音声データを再生する音声再生部とを備えたことにより、音声品質の劣化を抑制することが出来る。
【図面の簡単な説明】
【0011】
【図1】実施の形態1の音声データ処理装置の構成を示すブロック図である。
【図2】音声信号波形と音声信号の圧縮量を求める過程を示した説明図である。
【図3】無音時間(無音区間の時間長)と圧縮量との関係を示すグラフである。
【図4】音声信号波形と音声信号の伸長量を求める過程を示した説明図である。
【図5】無音時間(無音区間の時間長)と伸長量との関係を示すグラフである。
【図6】音声信号波形の一例を示した説明図である。
【図7】音声信号波形の一例を示した説明図である。
【図8】音声信号波形の一例を示した説明図である。
【図9】実施の形態2の音声データ処理装置の構成を示すブロック図である。
【図10】有音/無音区間長保持部32の動作を示すフローチャートである。
【図11】実施の形態3の音声データ処理装置の構成を示すブロック図である。
【図12】揺らぎ吸収バッファ1の音声パケット蓄積量と再生速度の変化を示した説明図である。
【図13】揺らぎ吸収バッファ1の音声パケット蓄積量と再生速度の変化を示した説明図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態を説明する。
【0013】
実施の形態1.
図1は、この発明の一実施の形態による音声データ処理装置の構成を示すブロック図である。
図1において、揺らぎ吸収バッファ1は、音声データが蓄積され、外部から読み出し可能なバッファであり、本実施の形態では、例えば、音声データとして、伝送路を介してネットワーク側から受信された信された音声パケットが蓄積される。
【0014】
再生速度決定部2は、上記揺らぎ吸収バッファ1に蓄積されている音声データ量に基づいて、上記音声データの再生速度を決定する。本実施の形態では、音声データとして、揺らぎ吸収バッファ1に蓄積されている音声パケットの音声信号の再生速度を、揺らぎ吸収バッファ1に蓄積されている(読み出されずに残っている)音声パケットの量を監視し、決定する。
【0015】
有音/無音区間長抽出部3は、上記音声データの有音区間及び無音区間の各区間長を抽出する。本実施の形態では、揺らぎ吸収バッファ1に接続され、揺らぎ吸収バッファ1に蓄積されている音声パケットの音声信号の有音区間及び無音区間を判定し、各区間長を抽出する。
【0016】
無音区間再生速度決定部4は、上記再生速度決定部2で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部3で抽出された上記揺らぎ吸収バッファ1に蓄積されている音声データの無音区間の区間長とに基づいて、上記無音区間の再生速度を決定する。本実施の形態では、音声パケットの音声信号の再生速度と、音声パケットの音声信号の無音区間とに基づいて、無音区間の再生速度を決定する。
【0017】
有音区間再生速度決定部5は、上記再生速度決定部2で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部3で抽出された上記揺らぎ吸収バッファ1に蓄積されている音声データの有音区間の区間長と、上記無音区間再生速度決定部4で決定された上記無音区間の再生速度とに基づいて、上記有音区間の再生速度を決定する。本実施の形態では、音声パケットの音声信号の再生速度と、音声パケットの音声信号の有音区間と、無音区間の再生速度とに基づいて、有音区間の再生速度を決定する。
【0018】
音声再生部6は、上記有音/無音区間長抽出部3で抽出された有音区間及び無音区間の各区間長に対応する音声データを上記揺らぎ吸収バッファ1から読み出し、上記無音区間再生速度決定部4で決定された上記無音区間の再生速度と、上記有音区間再生速度決定部5で決定された上記有音区間の再生速度とに基づいて、上記音声データを再生する。本実施の形態では、揺らぎ吸収バッファ1から音声パケットの音声信号を読み出し、当該音声信号を再生する。
【0019】
以下、動作について説明する。
ネットワークから受信された音声パケットは、揺らぎ吸収バッファ1に書き込まれ、蓄積される。音声再生部6は揺らぎ吸収バッファ1に蓄積された音声パケットを読み出して音声信号を抜き出し、これを再生してローカル側に出力する。ここで、通信開始時など揺らぎ吸収バッファ1が空の状態である場合、揺らぎ吸収バッファ1に音声パケットが一定時間分(これを初期蓄積量と称する)蓄積されてから、音声パケットの読み出しを開始することで、その後の音声パケット伝送遅延揺らぎが上記初期遅延量以内であれば、その揺らぎを吸収することが出来る。
【0020】
以降、動作について、詳細に説明する。
再生速度決定部2は、揺らぎ吸収バッファ1に蓄積されている音声パケットの量を監視して、音声再生部6における音声再生速度を決定する。具体的には、例えば、予め速度決定用の3種類のしきい値A、しきい値B、及び、しきい値Cを決めておく。ここで、しきい値A≧しきい値B≧しきい値Cとする。しきい値Bは揺らぎ吸収バッファ1の目標遅延量であり、上記初期蓄積量に等しい。再生速度決定部2は、このような3種類のしきい値A、しきい値B、及び、しきい値Cと、揺らぎ吸収バッファ1の音声パケットの蓄積量(読み出されずに残っている量)とを比較して、音声再生部6における音声再生速度を決定する。
【0021】
例えば、再生速度決定部2は、揺らぎ吸収バッファ1の音声パケットの蓄積量が0の場合、その蓄積量がしきい値B以上になるまでは再生速度を通常速度の0%(読み出し停止)とし、しきい値B以上になると100%(通常速度)とする。そして、再生速度決定部2は、揺らぎ吸収バッファ1の音声パケットの蓄積量がしきい値A以上になった場合に再生速度を通常速度より上げ、140%に決定する。そして、再生速度を140%にした後は、音声パケットの蓄積量がしきい値Bよりも大きい状態では140%という状態を維持し、音声パケットの蓄積量がしきい値B以下になると100%に戻す。また、再生速度決定部2は、揺らぎ吸収バッファ1の音声パケットの蓄積量がしきい値C以下になった場合に再生速度を通常速度より遅く、例えば70%に決定する。そして、再生速度を70%にした後は、音声パケットの蓄積量がしきい値Bよりも小さい状態では70%という状態を維持し、音声パケットの蓄積量がしきい値B以上になると100%に戻す。
【0022】
有音/無音区間長抽出部3、無音区間再生速度決定部4、有音区間再生速度決定部5の動作については、受信された音声パケットの音声信号波形と、再生速度を上げるために音声信号の圧縮量を求める過程を示した図2を併用して説明する。
図2(a)は、音声パケットの音声信号波形を示している。ここで、Xで示された範囲はある時点において揺らぎ吸収バッファ1に蓄積されている音声パケットの音声信号であり、この時点において揺らぎ吸収バッファ1内に格納される音声信号の有音区間及び無音区間における再生速度を決定するものとする。
【0023】
まず、有音/無音区間長抽出部3は、揺らぎ吸収バッファ1内に蓄積されている音声信号の有音・無音を判定し、有音区間及び無音区間の各区間長を抽出する。具体的には、図2(a)における有音区間1、無音区間1、有音区間2、無音区間2を抽出し、それぞれの時間長a1、b1、a2、b2を求め、これらを各区間長として無音区間再生速度決定部4、有音区間再生速度決定部5及び、音声再生部6に出力する。
【0024】
無音区間再生速度決定部4は、再生速度決定部2で決定された音声再生部6における音声再生速度(速度を上げる決定がなされている場合であり入力値は140%)と、有音/無音区間長抽出部3で抽出された各有音区間と無音区間の時間長a1、b1、a2、b2を基に、無音区間1及び無音区間2の圧縮後の時間長を求める。ここで、予め定められた再生速度の設定範囲内で圧縮後の時間長を求め、無音区間の再生速度を決定する。
【0025】
図3は、無音時間(無音区間の時間長)に対してどれだけ圧縮することが出来るかを示したものであり、圧縮後の時間がグラフに示す値(以後、最小圧縮時間と称す)以上であれば音声品質劣化は許容範囲内に収まる。このグラフについては、予め実験等により求めておくことが出来る。本実施の形態では、予め定められた再生速度の設定範囲として、図3に示すグラフを用いる。
【0026】
無音区間再生速度決定部4は、図3に示すグラフより、時間長b1、b2に対する最小圧縮時間c1、c2を求める。そして、a1+b1+a2+b2≧1.4×(a1+c1+a2+c2)であるとき、無音区間のみの圧縮、つまり図2(b)に示す音声信号を出力することで再生速度140%を達成出来るので、無音区間再生速度決定部4は無音区間1及び無音区間2の圧縮後の時間長d1、d2を下記の式(1)(2)の通り求める。
【0027】
d1=c1+e×c1/(c1+c2) ・・・(1)
d2=c2+e×c2/(c1+c2) ・・・(2)
【0028】
ここで、e=(a1+b1+a2+b2)/1.4−(a1+c1+a2+c2)である。
【0029】
一方、a1+b1+a2+b2<1.4×(a1+c1+a2+c2)であるとき、無音区間のみの圧縮では再生速度140%を達成出来ない。この場合、無音区間再生速度決定部4は、は無音区間1及び無音区間2の圧縮後の時間長d1、d2を、d1=c1、d2=c2とする。このように、図3に示すグラフを用いて予め定められた再生速度の設定範囲内で圧縮後の時間長を求め、無音区間の再生速度を決定する。なお、例えば、無音区間1の再生速度は、無音区間1の時間長b1及び圧縮後の時間長d1に基づいて、(d1/b1)×100%であらわすことができ、無音区間1の時間長b1が既知であれば、圧縮後の時間長d1と無音区間1の再生速度とを同等に扱うことができるので、本実施の形態では、無音区間の再生速度として、圧縮後の時間長を用いて説明する。
【0030】
無音区間再生速度決定部4は、以上のように求めた時間長d1、d2を有音区間再生速度決定部5と音声再生部6に出力する。
【0031】
有音区間再生速度決定部5は、再生速度決定部2で決定された音声再生部6における音声再生速度(速度を上げる決定がなされている場合であり入力値は140%)と、有音/無音区間長抽出部3で抽出された各有音区間と無音区間の時間長a1、b1、a2、b2と、無音区間再生速度決定部4で求められた無音区間1及び無音区間2の圧縮後の時間長d1、d2を基に、有音区間1及び有音区間2の圧縮後の時間長f1、f2を求め、有音区間の再生速度を決定する。なお、例えば、有音区間1の再生速度は、有音区間1の時間長a1及び時間長f1に基づいて、(f1/a1)×100%であらわすことができ、有音区間1の時間長a1が既知であれば、時間長f1と有音区間1の再生速度とを同等に扱うことができるので、本実施の形態では、有音区間の再生速度として、時間長(例えば、f1、f2)を用いて説明する。
【0032】
有音区間再生速度決定部5は、有音区間1及び有音区間2の時間長f1、f2を下記の式(3)(4)の通り求める。そして、有音区間再生速度決定部5はこのように求めた時間長f1、f2を音声再生部6に出力する。
【0033】
f1=a1+g×a1/(a1+a2) ・・・(3)
f2=a2+g×a2/(a1+a2) ・・・(4)
【0034】
ここで、g=(a1+b1+a2+b2)/1.4−(a1+d1+a2+d2)である。
【0035】
音声再生部6は、有音/無音区間長抽出部3、無音区間再生速度決定部4、及び、有音区間再生速度決定部5からの入力を基に、揺らぎ吸収バッファ1に蓄積されている音声パケットの音声信号を再生してローカル側に出力する。
まず、音声再生部6は、有音/無音区間長抽出部3で抽出された音声信号の有音区間及び無音区間の各区間長に基づいて、揺らぎ吸収バッファ1に蓄積された音声パケットを読み出して音声信号(有音区間1、無音区間1、有音区間2、無音区間2)を抜き出す。そして、有音区間1の時間長a1をf1に、無音区間1の時間長b1をd1に、有音区間2の時間長a2をf2に、そして、無音区間2の時間長b2をd2にそれぞれ圧縮して再生する。音声信号出力波形は図2(c)に示す通りとなり、これにより、再生速度が140%速められる。なお、再生速度の変更は従来開示されている方法で実現可能である(例えば特許文献1に開示されている)。また、揺らぎ吸収バッファ1に蓄積されているXで示された範囲の音声信号のうち、有音区間3の先頭部分を再生対象としないことにより、有音区間3の再生時に途中で再生速度が変更され、再生音が劣化することを防ぐことができる。
【0036】
以上の手順により、図2(a)における有音区間1、無音区間1、有音区間2、及び、無音区間2までの再生速度が決定されたが、音声再生部6において無音区間2までの読み出しが完了した時点が、次の再生速度算出タイミングとなり、再生速度決定部2は、有音区間3以降の再生速度を算出する。そして、この時点で揺らぎ吸収バッファ1内に蓄積される音声信号(図2(a)においてYで示される区間)により、上記と同様の手順で図2(a)における有音区間3、無音区間3、有音区間4、無音区間4、有音区間5、無音区間5の再生速度を決定する。
【0037】
以下、図4を用いて、再生速度を下げる場合の動作について説明する。なお、再生速度を下げる場合の動作についても、再生速度を上げる場合とほぼ同様の動作となる。図4は、音声信号波形と、再生速度を下げるために音声信号の伸長量を求める過程を示した説明図である。図4(a)は、音声パケットの音声信号波形を示している。ここで、図中のXで示された範囲はある時点において揺らぎ吸収バッファ1に蓄積されている音声パケットの音声信号であり、この時点において揺らぎ吸収バッファ1内に格納される音声信号の有音区間及び無音区間における再生速度を決定するものとする。
【0038】
まず、有音/無音区間長抽出部3は、再生速度を上げる場合と同様に、揺らぎ吸収バッファ1内に蓄積されている音声信号の有音・無音を判定し、有音区間及び無音区間の各区間長を抽出する。具体的には、図4(a)における有音区間1、無音区間1、有音区間2、無音区間2を抽出し、それぞれの時間長a1、b1、a2、b2を求め、これらを各区間長として無音区間再生速度決定部4、有音区間再生速度決定部5及び、音声再生部6に出力する。
【0039】
無音区間再生速度決定部4は、再生速度決定部2で決定された音声再生部6における音声再生速度(速度を下げる決定がなされている場合であり入力値は70%)と、有音/無音区間長抽出部3で抽出された各有音区間と無音区間の時間長a1、b1、a2、b2を基に、無音区間1及び無音区間2の伸長後の時間長を求める。ここで、予め定められた再生速度の設定範囲内で伸長後の時間長を求め、無音区間の再生速度を決定する。
【0040】
図5は、無音時間(無音区間の時間長)に対してどれだけ伸長することが出来るかを示したものであり、伸長後の時間がグラフに示す値(以後、最大伸長時間と称す)以上であれば音声品質劣化は許容範囲内に収まる。このグラフについては、予め実験等により求めておくことが出来る。本実施の形態では、予め定められた再生速度の設定範囲として、図5に示すグラフを用いる。
【0041】
無音区間再生速度決定部4は、図5に示すグラフより、時間長b1、b2に対する最大伸長時間c1、c2を求める。そして、a1+b1+a2+b2≦0.7×(a1+c1+a2+c2)であるとき、無音区間のみの伸長、つまり図4(b)に示す音声信号を出力することで再生速度70%を達成出来るので、無音区間再生速度決定部4は無音区間1及び無音区間2の伸長後の時間長d1、d2を下記の式(5)(6)の通り求める。
【0042】
d1=c1+e×c1/(c1+c2) ・・・(5)
d2=c2+e×c2/(c1+c2) ・・・(6)
【0043】
ここで、e=(a1+b1+a2+b2)/0.7−(a1+c1+a2+c2)である。
【0044】
一方、a1+b1+a2+b2>0.7×(a1+c1+a2+c2)であるとき、無音区間のみの伸長では再生速度70%を達成出来ない。この場合、無音区間再生速度決定部4は無音区間1及び無音区間2の伸長後の時間長d1、d2を、d1=c1、d2=c2とする。このように、図5に示すグラフを用いて予め定められた再生速度の設定範囲内で伸長後の時間長を求め、無音区間の再生速度を決定する。なお、上述の再生速度を上げる場合と同様に、無音区間1の時間長b1が既知であれば、伸長後の時間長d1と無音区間1の再生速度とを同等に扱うことができるので、本実施の形態では、無音区間の再生速度として、伸長後の時間長を用いて説明する。
【0045】
無音区間再生速度決定部4は、以上のように求めた時間長d1、d2を有音区間再生速度決定部5と音声再生部6に出力する。
【0046】
有音区間再生速度決定部5は、再生速度決定部2で決定された音声再生部6における音声再生速度(速度を下げる決定がなされている場合であり入力値は70%)と、有音/無音区間長抽出部3で抽出された各有音区間と無音区間の時間長a1、b1、a2、b2と、無音区間再生速度決定部4で求められた無音区間1及び無音区間2の伸長後の時間長d1、d2を基に、有音区間1及び有音区間2の伸長後の時間長f1、f2を求め、有音区間の再生速度を決定する。なお、上述の再生速度を上げる場合と同様に、有音区間1の時間長a1が既知であれば、時間長f1と有音区間1の再生速度とを同等に扱うことができるので、本実施の形態では、有音区間の再生速度として、時間長(例えば、f1、f2)を用いて説明する。
【0047】
有音区間再生速度決定部5は、有音区間1及び有音区間2の時間長f1、f2を下記の式(7)(8)の通り求める。そして、有音区間再生速度決定部5はこのように求めた時間長f1、f2を音声再生部6に出力する。
【0048】
f1=a1+g×a1/(a1+a2) ・・・(7)
f2=a2+g×a2/(a1+a2) ・・・(8)
【0049】
ここで、g=(a1+b1+a2+b2)/0.7−(a1+d1+a2+d2)である。
【0050】
音声再生部6は、有音/無音区間長抽出部3、無音区間再生速度決定部4、及び、有音区間再生速度決定部5からの入力を基に、揺らぎ吸収バッファ1に蓄積されている音声パケットの音声信号を再生してローカル側に出力する。
まず、音声再生部6は、有音/無音区間長抽出部3で抽出された音声信号の有音区間及び無音区間の各区間長に基づいて、揺らぎ吸収バッファ1に蓄積された音声パケットを読み出して音声信号(有音区間1、無音区間1、有音区間2、無音区間2)を抜き出す。そして、有音区間1の時間長a1をf1に、無音区間1の時間長b1をd1に、有音区間2の時間長a2をf2に、そして、無音区間2の時間長b2をd2にそれぞれ伸長して再生する。音声信号出力波形は図4(c)に示す通りとなり、これにより、再生速度が70%に下がることになる。
【0051】
以上の手順により、図4(a)における有音区間1、無音区間1、有音区間2、及び、無音区間2までの再生速度が決定されたが、音声再生部6において無音区間2までの読み出しが完了した時点が、次の再生速度算出タイミングとなり、再生速度決定部2は、有音区間3以降の再生速度を算出する。そして、この時点で揺らぎ吸収バッファ1内に蓄積される音声信号(図4(a)においてYで示される区間)により、上記と同様の手順で図4(a)における有音区間3、無音区間3、有音区間4、無音区間4、有音区間5、無音区間5の再生速度を決定する。
【0052】
以上では、再生速度算出タイミングにおいて揺らぎ吸収バッファ1に蓄積されている音声信号の末尾が、有音区間の途中である場合の動作を説明した。同様に、揺らぎ吸収バッファ1に蓄積されている音声信号の末尾が無音区間の場合でも同様の手順で再生速度を決定することが出来る。
【0053】
図6は、音声パケットの音声信号波形の一例を示している。例えば、音声パケットの音声信号波形が図6に示す通りであり、再生速度算出タイミングにおいて、図中のXで示された範囲の音声信号が揺らぎ吸収バッファ1に蓄積されている場合、図6に示す有音区間1、無音区間1、有音区間2について各区間における圧縮後(再生速度を上げる場合)または伸長後(再生速度を下げる場合)の時間長を算出する。これらの時間長を求める手順は上記の説明と同様である。次に、この有音区間2までの音声信号が音声再生部6から読み出されると新たな再生速度算出タイミングとなり、このとき図6のYで示す範囲の音声信号が揺らぎ吸収バッファ1に蓄積されている状態とすると、図中の無音区間2、有音区間3、無音区間3、有音区間4、無音区間4について、圧縮後のまたは伸長後の時間長を算出する。
【0054】
また、再生速度算出タイミングにおいて揺らぎ吸収バッファ1に蓄積されている音声信号の全てが有音であり、引き続き有音が継続する場合がある。
図7は、音声パケットの音声信号波形の一例を示している。例えば、音声パケットの音声信号波形が図7に示す通りであり、再生速度算出タイミングにおいて、図中のXで示された範囲の音声信号が揺らぎ吸収バッファ1に蓄積されている場合、揺らぎ吸収バッファ1内の音声信号を1個の有音区間(図7中の有音区間1)と見なして圧縮後または伸長後の時間長を決定する。圧縮の場合、圧縮後の時間長をf1とすると、f1=a1/1.4、伸長の場合、伸長後の時間長をf1とするとf1=a1/0.7となる。そして、この有音区間1の音声信号が音声再生部6から読み出されると次の再生速度決定タイミングとなり、このとき図7のYで示す範囲の音声信号が揺らぎ吸収バッファ1に蓄積されている状態とすると、図中の有音区間2、無音区間1、有音区間3、無音区間2、有音区間4、無音区間3について、圧縮後の時間長または伸長後の時間長を求める。このように、有音区間2を有音区間1と別の有音区間と見なし、他の場合と同様な手順で再生速度を決定する。
【0055】
逆に、再生速度算出タイミングにおいて揺らぎ吸収バッファ1に蓄積されている音声信号の全てが無音であり、引き続き無音が継続する場合もある。
図8は、音声パケットの音声信号波形の一例を示している。例えば、音声パケットの音声信号波形が図8に示す通りであり、再生速度算出タイミングにおいて、図中のXで示された範囲の音声信号が揺らぎ吸収バッファ1に蓄積されている場合、揺らぎ吸収バッファ1内の音声信号を1個の無音区間(図8中の無音区間1)と見なして圧縮後または伸長後の時間長を決定する。圧縮の場合、圧縮後の時間長をd1とすると、d1=b1/1.4、伸長の場合、伸長後の時間間隔をb1とするとb1=a1/0.7となる。そして、この無音区間1の音声信号が音声再生部6から読み出されると次の再生速度決定タイミングとなり、このとき図8のYで示す範囲の音声信号が揺らぎ吸収バッファ1に蓄積されている状態とすると、図中の無音区間2、有音区間1、無音区間3、有音区間2、無音区間4について、圧縮後の時間間隔または伸長後の時間長を求める。このように、無音区間2を無音区間1と別の無音区間と見なし、他の場合と同様な手順で再生速度を決定する。
【0056】
以上のように、本実施の形態によれば、揺らぎ吸収バッファ1内に蓄積される音声信号の無音区間の長さに応じて、無音区間再生速度決定部4が無音区間の再生速度を決定し、有音区間再生速度決定部5が、無音区間の再生速度決定結果に基づいて全体の再生速度が必要な速度となるように有音区間の再生速度を決定するので、音声品質が劣化し易い有音区間の再生速度変更量が少なくなり、音声の再生速度変更によって生じる音声品質の劣化を抑制することが出来る。
【0057】
また、本実施の形態によれば、予め定められた再生速度の設定範囲内で無音区間の再生速度を決定するので、再生速度変更による音声品質劣化を許容範囲内に収めることが出来る。
【0058】
実施の形態2.
以上の実施の形態1では、再生速度算出タイミングにおいて有音/無音区間長抽出部3が揺らぎ吸収バッファ1内に蓄積されている全ての音声信号について有音区間、無音区間を抽出するようにしたので、再生速度を算出するタイミングが処理負荷のピークとなる。本実施の形態においては、処理を平滑化して処理負荷のピークを低減する実施形態を示す。
【0059】
図9は、この発明の一実施の形態による音声データ処理装置の構成を示すブロック図である。図において、前述の図と同様な構成には同一符号を付し、説明を省略する。
有音/無音区間長抽出部3は、有音/無音時間監視部31と、有音/無音区間長保持部32とを備える構成とされている。
【0060】
有音/無音時間監視部31は、上記音声データが上記揺らぎ吸収バッファ1に蓄積される際に上記音声データの有音時間及び無音時間を監視し、上記音声データの有音区間及び無音区間の各区間長を出力する。本実施の形態では、ネットワークから受信された音声パケットが揺らぎ吸収バッファ1に蓄積される際に、書き込み前に順次、当該音声パケットの音声信号の有音時間及び無音時間を監視し、音声信号の有音区間及び無音区間の各区間長を出力する。
【0061】
有音/無音区間長保持部32は、上記有音/無音時間監視部31から出力された上記音声データの有音区間及び無音区間の各区間長を保持する。本実施の形態では、有音/無音時間監視部31から出力された音声信号の有音区間及び無音区間の各区間長を保持する。
【0062】
以下、動作について説明する。なお、揺らぎ吸収バッファ1、再生速度決定部2、無音区間再生速度決定部4、有音区間再生速度決定部5、音声再生部6の動作については、図1に示した音声データ処理装置と同様であるので、異なる動作について主に説明することとし、同様な動作については、説明を省略する。
【0063】
ネットワークから音声パケットが受信されると、有音/無音時間監視部31は、受信された音声パケットの音声信号の有音時間及び無音時間を監視し、音声信号の有音区間及び無音区間の各区間長を出力する。まず、有音/無音時間監視部31は、音声信号が有音であるか無音であるかを判定する。そして、有音から無音に変化したときは、変化前の有音の時間長を音声信号の有音区間の区間長として出力し、無音から有音に変化したときは、変化前の無音の時間長を音声信号の無音区間の区間長として出力する。
【0064】
また、有音/無音時間監視部31は、区間長を出力する要求があった場合、例えば、再生速度算出タイミングを制御する機能を有する再生速度決定部2又は図示しない動作制御部等より、再生速度算出タイミングに区間長を出力する要求があった場合、その時点で監視中の有音区間または無音区間の区間長を出力すると共に、以降の受信音声信号を新たな有音又は無音区間と見なして有音時間又は無音時間の監視を行う。なお、再生速度算出タイミングは、例えば、予め定められた頻度(20ms毎など)の他、揺らぎ吸収バッファ1から読み出された音声信号の量、音声再生部6で音声が再生された量などから検知することが可能である。
【0065】
そして、有音/無音区間長保持部32は、有音/無音時間監視部31から出力された音声信号の有音区間及び無音区間の各区間長を保持する。
【0066】
図10は有音/無音区間長保持部32の動作を示すフローチャートである。以下、このフローチャートに沿って、音声データ処理装置に図2(a)に示した音声信号が受信された場合の動作を説明する。
【0067】
図2(a)に示すXの範囲の音声信号が揺らぎ吸収バッファ1に蓄積されている状態では、それまでに、有音区間1と無音区間1との間、無音区間1と有音区間2の間、有音区間2と無音区間2の間、及び、無音区間2と有音区間3の間のタイミングで、有音/無音時間監視部31から有音/無音区間長保持部32に各区間の時間長a1、b1、a2、b2の入力があり(S1)、これらを内部に蓄積・保持する(S2)。そして、有音区間1の先頭が音声再生部6から読み出される直前のタイミングが再生速度算出タイミングであるため(S3)、内部に保持する有音区間、無音区間の時間長があるかどうかを判断する(S4)。ここでは、上記時間長a1、b1、a2、b2が保持されているため、これらを無音区間再生速度決定部4、有音区間再生速度決定部5、音声再生部6に出力し(S5)、保持していた上記時間長a1、b1、a2、b2を廃棄する(S6)。
【0068】
次に、音声データ処理装置に図7に示した音声信号が受信された場合の動作を説明する。
有音区間1の先頭が音声再生部6から読み出される直前のタイミングが再生速度算出タイミングであり(S3)、この時点において、それまでの受信音声信号に有音から無音または無音から有音の変化がないため、有音/無音区間長保持部32が保持する有音区間及び無音区間の時間長が存在しない(S4)。この場合、再生速度決定部2又は図示しない動作制御部が有音/無音時間監視部31に有音区間/無音区間の時間長を要求し、この要求によって図7における有音区間1の時間長a1が有音/無音区間長保持部32に入力される(S7)。そして、この時間長a1を有音/無音区間長保持部32が無音区間再生速度決定部4、有音区間再生速度決定部5、音声再生部6に出力する(S8)。
【0069】
このように、音声パケットが揺らぎ吸収バッファ1に蓄積される際に、音声パケットの受信毎に、当該音声パケットの音声信号の有音時間及び無音時間を監視し、音声信号の有音区間及び無音区間の各区間長を保持しておき、その各区間長を再生速度算出タイミングに無音区間再生速度決定部4、有音区間再生速度決定部5、音声再生部6に出力するように動作することにより、有音/無音区間長保持部32からの出力は、実施の形態1で説明した図1に示される有音/無音区間長抽出部3の出力と同じとなる。そして、再生速度算出タイミングにおいて、揺らぎ吸収バッファ1に蓄積されている全ての音声信号について有音/無音判定し、音/無音区間長抽出する必要がなくなるため、処理負荷が一時的に増大せずに平滑化される。
【0070】
以上のように、本実施の形態によれば、実施の形態1と同様に、音声品質が劣化し易い有音区間の再生速度変更量が少なくなり、音声の再生速度変更によって生じる音声品質の劣化を抑制することが出来る。更に、音声パケットが揺らぎ吸収バッファ1に蓄積される際に、音声パケットの受信毎に、音声信号の有音/無音判定と、音/無音区間長抽出を行うため、処理負荷を時間的に分散できるので、処理負荷のピークを低減することが出来る。
【0071】
実施の形態3.
以上の実施の形態1、2では、揺らぎ吸収バッファ1内の音声信号蓄積量に基づいて再生速度を決定するようにしたものであるが、次に、受信音声パケットの伝送遅延量が増大した場合にその増大量に基づいて再生速度を決定する手段を備えた実施形態を示す。
【0072】
図11は、この発明の一実施の形態による音声データ処理装置の構成を示すブロック図である。図において、前述の図と同様な構成には同一符号を付し、説明を省略する。
伝送遅延監視部7は、上記音声データの伝送遅延を監視する。本実施の形態では、音声パケットの伝送遅延を監視する。
伝送遅延対応再生速度決定部8は、上記伝送遅延監視部7で監視された伝送遅延に基づいて、上記音声データの再生速度を決定する。本実施の形態では、伝送遅延監視部7で監視された伝送遅延に基づいて、音声信号の再生速度を決定する。また、本実施の形態では、揺らぎ吸収バッファ1の音声信号蓄積量に基づいて、伝送遅延に基づいて決定された音声信号の再生速度と、再生速度決定部2で決定された音声信号の再生速度との何れの再生速度を用いるかを判定する。
スイッチ9は、伝送遅延対応再生速度決定部8の判定結果に基づいて、再生速度決定部2で決定された音声信号の再生速度、又は伝送遅延に基づいて決定された音声信号の再生速度のいずれかの再生速度を出力する。
【0073】
また、無音区間再生速度決定部4は、上記音声データの再生速度として、上記再生速度決定部2又は上記伝送遅延対応再生速度決定部8で決定された上記音声データの再生速度を用いて、上記無音区間の再生速度を決定するように構成され、本実施の形態では、再生速度決定部2又は伝送遅延対応再生速度決定部8で決定された音声信号の再生速度と、揺らぎ吸収バッファ1に蓄積されている音声信号の無音区間の区間長とに基づいて、上記無音区間の再生速度を決定する。
【0074】
また、有音区間再生速度決定部5は、上記音声データの再生速度として、上記再生速度決定部2又は上記伝送遅延対応再生速度決定部8で決定された上記音声データの再生速度を用いて、上記有音区間の再生速度を決定するように構成され、本実施の形態では、再生速度決定部2又は伝送遅延対応再生速度決定部8で決定された音声信号の再生速度と、揺らぎ吸収バッファ1に蓄積されている音声信号の有音区間の区間長と、上記無音区間再生速度決定部4で決定された上記無音区間の再生速度とに基づいて、上記有音区間の再生速度を決定する。
【0075】
次に動作について説明する。なお、揺らぎ吸収バッファ1、再生速度決定部2、無音区間再生速度決定部4、有音区間再生速度決定部5、音声再生部6の動作については、図1に示した音声データ処理装置と同様であるので、異なる動作について主に説明することとし、同様な動作については、説明を省略する。
【0076】
ネットワークから音声パケットが受信されると、伝送遅延監視部7は、受信音声パケットの到着時間間隔とパケットヘッダのタイムスタンプ差を基に伝送遅延を監視し、伝送遅延量の増大を検出する。例えば、ある受信音声パケットと次の受信音声パケットの到着時間間隔がT1、パケットヘッダのタイムスタンプ差がT2であったとすると、T1−T2が遅延増大検出しきい値TH以上である場合、遅延増大と判定する。そして遅延増大と判定したら、その遅延増大量T3=T1−T2を伝送遅延対応再生速度決定部8に指示する。
【0077】
伝送遅延対応再生速度決定部8は、伝送遅延監視部7で監視された伝送遅延に基づいて、音声信号の再生速度を決定する。例えば、伝送遅延監視部7から遅延増大量T3を入力すると再生速度を上げる決定をする。そして、スイッチ9に対して再生速度として140%を出力する。同時にスイッチ9に対し、再生速度決定部2の出力ではなく、伝送遅延対応再生速度決定部8の出力を選択するように通知する。すなわち、揺らぎ吸収バッファ1の音声信号蓄積量に基づいて、伝送遅延に基づいて決定された音声信号の再生速度ではなく、伝送遅延に基づいて決定された再生速度を用いる判定をする。
【0078】
そして、伝送遅延対応再生速度決定部8は、揺らぎ吸収バッファ1の音声信号蓄積量が再生速度決定部2において再生速度を上げる判定となるしきい値A以上になると、スイッチ9の選択が元に戻るように、すなわち、再生速度決定部2が出力する再生速度を選択するように通知する。
【0079】
スイッチ9が伝送遅延対応再生速度決定部8の通知にしたがって音声信号の再生速度を出力すると、出力された再生速度を用いて、実施の形態1と同様に、無音区間再生速度決定部4は、音区間の再生速度を決定し、有音区間再生速度決定部5は、有音区間の再生速度を決定する。
【0080】
図12と図13は、音声データ処理装置の受信音声パケットの伝送遅延が急激に増大した場合における揺らぎ吸収バッファ1の音声パケット蓄積量と再生速度の変化を示したもので、図12が図1及び図9に示した音声データ処理装置の場合、図13が図11に示した音声データ処理装置の場合の変化である。図12、図13共に、音声パケットのパケット化周期は20msで、3個目の受信パケットと4個目の受信パケットの間で遅延が増大して到着時間差が1000msとなり、その後、遅延していたパケットが短時間に到着した場合の例である。また、再生速度決定部2が再生速度を決定するために用いるしきい値Aは500ms、しきい値Bは300ms、しきい値Cは100ms、伝送遅延監視部7の遅延増大検出しきい値THは500msに設定された場合の図となっている。
【0081】
図12の場合の揺らぎ吸収バッファ1における音声信号の蓄積量と再生速度の変化について説明する。
4個目のパケットが到着すると揺らぎ吸収バッファ1における音声信号の蓄積量が急激に増大してしきい値B(300ms)を超え、再生速度が100%となる。この速度で音声の再生が始まり、それから300ms後(図12中1340msの時点)に次の再生速度更新タイミングとなる。この時点での揺らぎ吸収バッファ1のバッファ残量は1000msとなり、しきい値A(500ms)よりも大きいため再生速度は140%となる。この140%という速度は揺らぎ吸収バッファ1のバッファ残量がしきい値B(300ms)以下になるまで1750ms間続き、その後は再生速度が100%に戻る。
【0082】
次に、図13の場合の揺らぎ吸収バッファ1における音声信号の蓄積量と再生速度の変化について説明する。
4個目のパケットが到着すると、3個目のパケットとの到着時間間隔は1000ms、タイムスタンプ差は20msであり、その差980msが遅延増大検出しきい値TH(500ms)よりも大きいため、再生速度は140%となる。この状態が揺らぎ吸収バッファ1のバッファ残量がしきい値B(300ms)以下になるまで1690ms間続き、その後は再生速度が100%に戻る。
【0083】
図12と図13とを比較すると分る通り、揺らぎ吸収バッファ1における音声信号の蓄積量が大きい状態は、図13の方が短い期間で終ることが分る。電話のように音声の双方向通話が行われる場合、伝送遅延は通話品質に大きな影響を与え、伝送遅延が小さいほど通話品質が良い。つまり、揺らぎ吸収バッファ1における音声信号の蓄積量は、図12に示すような変化(音声の再生の遅延時間が長い状態(揺らぎ吸収バッファ1における音声信号の蓄積量が大きい状態)が長時間続いているような変化)をするよりも図13に示す変化(音声の再生の遅延時間が長い状態(揺らぎ吸収バッファ1における音声信号の蓄積量が大きい状態)が長時間続かないような変化)をする方が望ましいと言える。
【0084】
以上のように、本実施の形態によれば、実施の形態1と同様に、音声品質が劣化し易い有音区間の再生速度変更量が少なくなり、音声の再生速度変更によって生じる音声品質の劣化を抑制することが出来る。更に、音声パケットの伝送遅延を監視して伝送遅延に基づいて音声信号の再生速度を決定し、当該伝送遅延に基づいて決定された音声信号の再生速度と、揺らぎ吸収バッファ1の音声信号蓄積量に基づいて決定された音声信号の再生速度とのいずれかの再生速度を用いるようにしたことにより、伝送遅延の変動による通話品質の劣化を抑制することが出来る。例えば、受信音声パケットの伝送遅延が増大した場合に再生速度を上げるようにしたので、伝送遅延が急激に増大した場合の通話品質の劣化を抑制することが出来る。
【0085】
なお、上記説明では、伝送遅延増大時の再生速度を揺らぎ吸収バッファ1における音声信号の蓄積量がしきい値A以上となった場合と同じ140%としたが、これを遅くすることで、伝送遅延増大後に揺らぎ吸収バッファ1における音声信号の蓄積量が300msに戻るまでの時間が同じとなるようにしても良い。これにより、再生速度を140%より下げることが出来るため、音声の再生速度変更によって生じる音声品質の劣化を更に抑えることが出来る。
【0086】
また、上記説明では、伝送遅延対応再生速度決定部8が、揺らぎ吸収バッファ1の音声信号蓄積量に基づいて、伝送遅延に基づいて決定された音声信号の再生速度と、再生速度決定部2で決定された音声信号の再生速度との何れの再生速度を用いるかを判定する場合について説明したが、伝送遅延に基づいて決定された音声信号の再生速度と、再生速度決定部2で決定された音声信号の再生速度との何れの再生速度を用いるかを判定する機能をスイッチ9に備えるようにしても良い。この場合、揺らぎ吸収バッファ1と伝送遅延対応再生速度決定部8との接続線は不要となり、スイッチ9は、再生速度決定部2から入力された再生速度と伝送遅延対応再生速度決定部8から入力された再生速度とを比較することにより、何れの再生速度を用いるかを判定する。
【0087】
また別の構成として、再生速度決定部2で決定された音声信号の再生速度を伝送遅延対応再生速度決定部8に入力するようにし、伝送遅延対応再生速度決定部8が、伝送遅延に基づいて決定された音声信号の再生速度と、再生速度決定部2から入力された再生速度との何れの再生速度を用いるかを判定し、判定結果に基づいていずれかの再生速度を出力するようにしても良い。この場合、揺らぎ吸収バッファ1と伝送遅延対応再生速度決定部8との接続線は不要となり、スイッチ9も不要となる。
【0088】
実施の形態4.
上記実施の形態1、2、3においては、再生速度を上げる場合に通常速度の140%、下げる場合に通常速度の70%としたが、他の速度であってもよい。更に、再生速度を上げる場合及び下げる場合の速度を2通り以上とすることも可能である。
【0089】
実施の形態5.
再生速度算出タイミングは10ms毎など頻度を上げてもよい。音声復号器と組み合わせて動作する場合には、その音声符号化フレーム毎のタイミングとしてもよい。
また、以上で説明した実施の形態1、2、3の各構成については、発明の主旨を逸脱しない範囲で適宜組み合わせることが可能である。
【符号の説明】
【0090】
1 揺らぎ吸収バッファ、2 再生速度決定部、3 有音/無音区間長抽出部、4 無音区間再生速度決定部、5 有音区間再生速度決定部、6 音声再生部、7 伝送遅延監視部、8 伝送遅延対応再生速度決定部、9 スイッチ、31 有音/無音時間監視部、32 有音/無音区間長保持部。

【特許請求の範囲】
【請求項1】
音声データが蓄積される揺らぎ吸収バッファと、
上記揺らぎ吸収バッファに蓄積されている音声データ量に基づいて、上記音声データの再生速度を決定する再生速度決定部と、
上記音声データの有音区間及び無音区間の各区間長を抽出する有音/無音区間長抽出部と、
上記再生速度決定部で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部で抽出された上記揺らぎ吸収バッファに蓄積されている音声データの無音区間の区間長とに基づいて、上記無音区間の再生速度を決定する無音区間再生速度決定部と、
上記再生速度決定部で決定された上記音声データの再生速度と、上記有音/無音区間長抽出部で抽出された上記揺らぎ吸収バッファに蓄積されている音声データの有音区間の区間長と、上記無音区間再生速度決定部で決定された上記無音区間の再生速度とに基づいて、上記有音区間の再生速度を決定する有音区間再生速度決定部と、
上記有音/無音区間長抽出部で抽出された有音区間及び無音区間の各区間長に対応する音声データを上記揺らぎ吸収バッファから読み出し、上記無音区間再生速度決定部で決定された上記無音区間の再生速度と、上記有音区間再生速度決定部で決定された上記有音区間の再生速度とに基づいて、上記音声データを再生する音声再生部と
を備えたことを特徴とする音声データ処理装置。
【請求項2】
上記無音区間再生速度決定部は、予め定められた再生速度の設定範囲内で上記無音区間の再生速度を決定することを特徴とする請求項1に記載の音声データ処理装置。
【請求項3】
上記有音/無音区間長抽出部は、上記音声データが上記揺らぎ吸収バッファに蓄積される際に上記音声データの有音時間及び無音時間を監視し、上記音声データの有音区間及び無音区間の各区間長を出力する有音/無音時間監視部と、
上記有音/無音時間監視部から出力された上記音声データの有音区間及び無音区間の各区間長を保持する有音/無音区間長保持部とを備え、
上記無音区間再生速度決定部は、上記揺らぎ吸収バッファに蓄積されている音声データの無音区間の区間長として、上記有音/無音区間長保持部に保持された上記無音区間の区間長を用いて上記無音区間の再生速度を決定し、
上記有音区間再生速度決定部は、上記揺らぎ吸収バッファに蓄積されている音声データの有音区間の区間長として、上記有音/無音区間長保持部に保持された上記有音区間の区間長を用いて上記有音区間の再生速度を決定する
ことを特徴とする請求項1に記載の音声データ処理装置。
【請求項4】
上記音声データの伝送遅延を監視する伝送遅延監視部と、
上記伝送遅延監視部で監視された伝送遅延に基づいて、上記音声データの再生速度を決定する伝送遅延対応再生速度決定部とを備え、
上記無音区間再生速度決定部は、上記音声データの再生速度として、上記再生速度決定部又は上記伝送遅延対応再生速度決定部で決定された上記音声データの再生速度を用いて、上記無音区間の再生速度を決定し、
上記有音区間再生速度決定部は、上記音声データの再生速度として、上記再生速度決定部又は上記伝送遅延対応再生速度決定部で決定された上記音声データの再生速度を用いて、上記有音区間の再生速度を決定する
ことを特徴とする請求項1に記載の音声データ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2012−205066(P2012−205066A)
【公開日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2011−67659(P2011−67659)
【出願日】平成23年3月25日(2011.3.25)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】