説明

音声通信装置及びプログラム

【課題】 受話音声を対向受話者が聴き取り易くできる音声通信装置を提供する。
【解決手段】 本発明の音声通信装置は、対向する音声通信装置の受話者を考慮し、送話信号における周囲雑音レベルを推定する周囲雑音推定部と、推定された周囲雑音レベルに応じて、送話信号の音量を調整する送話音量調整部とを設けた。これにより、周囲雑音が大きいため送話者が大声を出したとしても、受話者に聴き取り易いレベルで受話信号が発音出力される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は音声通信装置及びプログラムに関し、例えば、携帯型の音声通信端末に適用し得るものである。
【背景技術】
【0002】
近年では、VoIP技術を利用した音声通信であるIP電話端末(ソフトフォンを含む)が広く普及してきた。IP電話端末は、音声の情報をIPパケット化して、IPネットワークを介して伝送することにより、通話相手に音声を伝える。IP電話端末の形態も、スマートフォンなどの携帯型端末が普及してきており、従来の携帯電話端末も含め、いわゆる携帯型の音声通信端末が増加している。携帯型端末は、屋外で使用されることが多く、周囲雑音の影響で受話音声が聴き取り難いこともある。そのため、特許文献1に記載のように、受話音量を自動で調整する機能を備えた通信端末も提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−253097号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、周囲雑音は受話音量のみならず送話音量にも影響を及ぼす。一般に、周囲雑音が大きい場所(周りがうるさい場所)で発話する場合、自然と声が大きくなってしまう事象が生じる。このとき、対向側の受話音声が必要以上に大きくなり、受話音量の自動調整機能を備えない通信端末を利用している対向受話者は、過剰な音量での受話になり、受話音声が聴き取り難くなる。
【0005】
そのため、受話音声を対向受話者が聴き取り易くできる音声通信装置及びプログラムが望まれている。
【課題を解決するための手段】
【0006】
第1の本発明の音声通信装置は、送話信号における周囲雑音レベルを推定する周囲雑音推定手段と、推定された周囲雑音レベルに応じて、上記送話信号の音量を調整する送話音量調整手段とを備えたことを特徴とする。
【0007】
第2の本発明の音声通信プログラムは、音声通信装置に搭載されるコンピュータを、送話信号における周囲雑音レベルを推定する周囲雑音推定手段と、推定された周囲雑音レベルに応じて、上記送話信号の音量を調整する送話音量調整手段として機能させることを特徴とする。
【発明の効果】
【0008】
本発明によれば、周囲雑音に応じて送話音量を調整するようにしたので、対向する音声通信装置の受話者が、受話音声を聴き取り易くすることができる。
【図面の簡単な説明】
【0009】
【図1】第1の実施形態に係る音声通信装置の構成を示すブロック図である。
【図2】第1の実施形態の音声通信装置における周囲雑音パワ推定器の推定方法の説明図である。
【図3】第1の実施形態の音声通信装置における推定周囲雑音パワをゲインに変換する方法の説明図である。
【図4】第2の実施形態に係る音声通信装置の構成を示すブロック図である。
【図5】第3の実施形態に係る音声通信装置の構成を示すブロック図である。
【図6】第4の実施形態に係る音声通信装置の構成を示すブロック図である。
【発明を実施するための形態】
【0010】
(A)第1の実施形態
以下、本発明による音声通信装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。第1の実施形態の音声通信装置は、携帯電話端末やスマートフォンなどの携帯型音声通信端末である。
【0011】
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声通信装置の構成を示すブロック図である。
【0012】
図1において、第1の実施形態の音声通信装置1は、マイクロフォン10、アナログ/デジタル変換器(A/D)11、送話音量調整回路12、周囲雑音パワ推定器13及びゲイン制御回路14を有する。ここで、送話音量調整回路12、周囲雑音パワ推定器13及びゲイン制御回路14は、専用的な回路として構成するだけでなく、CPUと、CPUが実行するプログラムで実現するようにしても良い。
【0013】
マイクロフォン10は、送話者が発した音声を捕捉するものであり、アナログ/デジタル変換器11は、捕捉されて得られたアナログ音声信号をデジタル音声信号Sに変換するものである。
【0014】
送話音量調整回路12は、例えば、乗算器でなり、入力されたデジタル音声信号Sに、ゲイン制御回路14から与えられたゲインGを乗算して送話音量を調整して出力するものである。このような音量が調整されたデジタル音声信号Sgが、図示しない処理部によって、符号化された後、パケット化されて、対向する音声通信装置に向けて送信される。
【0015】
周囲雑音パワ推定器13は、デジタル音声信号Sから、送話者の周囲雑音パワNを推定するものである。周囲雑音パワNの推定方法は、問われないものであり、いかなる方法を適用しても良い。例えば、入力パワと最小パワとを比較し、入力パワが最小パワより小さければ入力パワを新たな最小パワに更新することを通じて最小パワをいつも検出しておき、図2に示すように、デジタル音声信号Sの最小パワを周囲雑音パワNとして推定するようにしても良い。また、デジタル音声信号Sに対して、有音/無音判定を行い、無音区間の平均パワを周囲雑音パワNとして無音区間毎に推定するようにしても良い。
【0016】
なお、周囲雑音レベルを、周囲雑音パワ(サンプル値の2乗値)で表しているが、サンプル値の絶対値など、他の指標を用いても良い。
【0017】
ゲイン制御回路14は、推定された周囲雑音パワNに応じたゲインGを得て、送話音量調整回路12に与えるものである。ゲイン制御回路14は、例えば、変換テーブルを内蔵してゲインGを得るものであっても良く、また例えば、変換式に従って演算してゲインGを得るものであっても良い。図3は、周囲雑音パワNをゲインGに変換する変換方法の一例の説明図であり、変換テーブルを利用する場合であっても変換式を利用する場合であっても適用できるものである。図3の例は、推定された周囲雑音パワNが所定パワN0(所定パワN0が0であっても良い)まではゲインGとしてデジタル音声信号Sをそのまま、音量調整後のデジタル音声信号Sgとして出力させるゲイン1.0を出力し、推定された周囲雑音パワNが所定パワN0を超えていると、超えた度合いが大きいほどゲインGを小さくするように変換する。ここで、漸減直線は、周囲雑音パワNそのものに対して線形なものであっても良く、周囲雑音パワNの対数値に対して線形なものであっても良い。後者は、図3の横軸が対数表記されている場合に該当する。
【0018】
ここで、周囲雑音パワNが所定パワN0まではゲインGとして1.0を出力するようにしたので、周囲雑音がある程度大きくなるまでは、送話者は、概ね定まっている声の大きさで発声する傾向があるためである。
【0019】
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態に係る音声通信装置1の動作を説明する。
【0020】
送話者の音声や周囲雑音は、マイクロフォン10によって捕捉されてアナログ音声信号になり、このアナログ音声信号がアナログ/デジタル変換器11によってデジタル音声信号Sに変換され、送話音量調整回路12を介して音量が調整され、音量調整後のデジタル音声信号Sgが対向する音声通信装置に向けて送出される。
【0021】
デジタル音声信号Sは、周囲雑音パワ推定器13にも与えられ、このデジタル音声信号Sに基づいて、周囲雑音パワNが推定され、推定された周囲雑音パワNに応じたゲインGが、ゲイン制御回路14によって得られて送話音量調整回路12に与えられる。これにより、デジタル音声信号Sに対する上述した音量調整が、送話音量調整回路12において実行される。
【0022】
周囲雑音がさほどでもない状況では、送話者は、自己が携帯型音声通信端末(第1の実施形態の音声通信装置1)に対して通常発声する程度のパワで発話する。このとき、周囲雑音パワ推定器13によって推定される周囲雑音パワNは、所定パワN0より小さく、その結果、1.0のゲインGが送話音量調整回路12に与えられ、デジタル音声信号Sがそのまま、音量調整後のデジタル音声信号Sgとして出力される。
【0023】
これに対して、周囲雑音が大きい場合には、送話者は、周囲雑音に負けずに通話できるように知らず知らずと声を大きくする。このとき、周囲雑音パワ推定器13によって推定される周囲雑音パワNは、所定パワN0を超え、その結果、1.0より小さいゲインGが送話音量調整回路12に与えられ、デジタル音声信号Sの音量が、送話音量調整回路12によって減衰調整され、減衰されたデジタル音声信号Sgが出力される。
【0024】
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、周囲雑音が大きいときには、送話信号を減衰して受話側の音声通信装置に送信するようにしたので、受話音量が大き過ぎて受話者が不快感を抱くようなことを防止することができる。
【0025】
受話音量が過大になること防止すべく、受話側の音声通信装置で受話音量を自動調整する方法が既に提案されているが、この解決方法では、そのような機能を有する音声通信装置を受話者が所持していなければならず、音量調整のメリットを受ける受話者は所持者に限定される。
【0026】
一方、第1の実施形態の場合、受話側の音声通信装置が音量調整機能を備えていない場合であっても、過大な受話音量を防止することのメリットを受話者は享受することができる。すなわち、送話者が第1の実施形態の音声通信装置を所持している場合には、多くの受話者が過大な受話音量を防止することのメリットを享受できる。
【0027】
(B)第2の実施形態
次に、本発明による音声通信装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。
【0028】
図4は、第2の実施形態に係る音声通信装置の構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0029】
図4において、第2の実施形態の音声通信装置1Aは、マイクロフォン10、アナログ/デジタル変換器11、送話音量調整回路12、周囲雑音パワ推定器13A、ゲイン制御回路14A及びパワ対履歴記憶部15を有する。マイクロフォン10、アナログ/デジタル変換器11及び送話音量調整回路12は、第1の実施形態のものと同様なものであるので、その機能説明は省略する。
【0030】
第2の実施形態における周囲雑音パワ推定器13Aは、有音/無音判定を行い、無音区間の平均パワを周囲雑音パワNとして推定する方式を採用しているものである。周囲雑音パワ推定器13Aは、また、有音区間の平均パワを音声パワPとして推定するものであり、推定した音声パワPもゲイン制御回路14Aに与えるものである。
【0031】
パワ対履歴記憶部15は、推定された音声パワPと周囲雑音パワNとの対情報を、最新側の所定対(例えば、20対)だけ記憶しているものである。音声パワPを推定した有音区間の直前の無音区間から推定された周囲雑音パワNが、その直後の有音区間から推定された音声パワPと対をなしている。パワ対履歴記憶部15に記憶される対情報は、今回の通話におけるものだけでなく、過去の通話のものも含まれる。なお、通話ごとの対の数に制限を与えるようにしても良い。
【0032】
第2の実施形態におけるゲイン制御回路14Aは、学習機能を有するゲイン制御回路である。ゲイン制御回路14Aは、パワ対履歴記憶部15に記憶されている対情報を利用して、当該音声通信装置1Aを所持する送話者に適したゲインを学習する機能を有している。学習方法は任意であるが、以下に例示するような方法を挙げることができる。
【0033】
X軸を推定周囲雑音パワNの軸とし、Y軸を推定音声パワPの軸とし、回帰曲線として2次関数を適用して、記憶されている音声パワPと周囲雑音パワNとの対情報を全て適用して、回帰曲線を特定する。この回帰曲線における、所定の推定周囲雑音パワNの値N1(例えば、サンプル中の最小値)での推定音声パワPを基準値Prefとし、推定周囲雑音パワNの値ごとに、推定音声パワPを基準値Prefにするための比率を求めて、その推定周囲雑音パワNの値のゲインGとし、ゲイン制御回路14A内に格納し直す。
【0034】
ゲイン制御回路14Aは、以上のような学習を通話終了時に実行し、学習し直したゲインGを次の通話で反映できるようにする。
【0035】
第2の実施形態によっても、第1の実施形態と同様な効果を奏することができる。これに加え、第2の実施形態によれば、送話者の発声音量の特質に応じてゲインを設定でき、音声通信装置1Aを所持する送話者によらずに、同様な受話音量品質を受話者に提供することができる。
【0036】
(C)第3の実施形態
次に、本発明による音声通信装置及びプログラムの第3の実施形態を説明する。
【0037】
図5は、第3の実施形態に係る音声通信装置の構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0038】
図5において、第3の実施形態の音声通信装置1Bは、マイクロフォン10、アナログ/デジタル変換器11、送話音量調整回路12、周囲雑音パワ推定器13、ゲイン制御回路14、マイクロフォン10N及びアナログ/デジタル変換器11Nを有する。マイクロフォン10、アナログ/デジタル変換器11、送話音量調整回路12、周囲雑音パワ推定器13及びゲイン制御回路14は、第1の実施形態のものと同様なものであるので、その機能説明は省略する。
【0039】
第3の実施形態の音声通信装置1Bは、周囲雑音の捕捉専用のマイクロフォン10Nと、その捕捉信号(アナログ信号)をデジタル信号に変換して周囲雑音パワ推定器13に与えるアナログ/デジタル変換器11Nを追加したものである。
【0040】
携帯電話端末やスマートフォンなどの携帯型音声通信端末が該当する第3の実施形態の音声通信装置10Bは、通話時には、マイクロフォン10が送話者の口に近付くように位置される。そのため、マイクロフォン10が十分に周囲雑音を捕捉できない場合も生じる。しかし、送話者は、大きな周囲雑音が聴こえているときには大声で話す可能性が高い。すなわち、マイクロフォン10の配置位置や指向性によっては、その捕捉信号に周囲雑音が含まれている量が少なく、周囲雑音の推定精度が低下する可能性がある。そのため、第3の実施形態の音声通信装置1Bでは、周囲雑音の捕捉専用のマイクロフォン10Nを設け、その捕捉信号から周囲雑音パワを推定することとした。
【0041】
第3の実施形態によっても、第1の実施形態と同様な効果を奏することができる。これに加え、第3の実施形態によれば、周囲雑音パワの推定精度を向上させることができ、その結果、送話音量も適切に調整することができる。
【0042】
(D)第4の実施形態
次に、本発明による音声通信装置及びプログラムの第4の実施形態を説明する。
【0043】
図6は、第4の実施形態に係る音声通信装置の構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0044】
図6において、第4の実施形態の音声通信装置1Cは、マイクロフォン10、アナログ/デジタル変換器11、送話音量調整回路12、周囲雑音パワ推定器13、ゲイン制御回路14、受話音量調整回路16、デジタル/アナログ変換器(D/A)17、スピーカ18及び受話ゲイン制御回路19を有する。マイクロフォン10、アナログ/デジタル変換器11、送話音量調整回路12、周囲雑音パワ推定器13及びゲイン制御回路14は、第1の実施形態のものと同様なものであるので、その機能説明は省略する。
【0045】
第4の実施形態の音声通信装置1Cは、送話方向のデジタル音声信号Sから得た推定された周囲雑音パワNを、受話音量の調整にも利用しようとしたものである。
【0046】
対向する音声通信装置から到来した音声パケットを分解し、符号化音声データを抽出し、それを復号して得られた受話方向のデジタル音声信号SRは、受話音量調整回路16に与えられてその音量が調整される。音量調整後のデジタル音声信号SRgは、デジタル/アナログ変換器17を介してアナログ音声信号に変換された後、スピーカ18から発音出力される。受話ゲイン制御回路19には、周囲雑音パワ推定器13から推定された周囲雑音パワNが与えられ、受話ゲイン制御回路19は、周囲雑音が大きくても受話音声が聴き取り易くなるように、周囲雑音が大きいほど大きくなるようなゲインGRを形成して、受話音量調整回路16に与え、受話音量調整回路16において、デジタル音声信号SRにゲインGRが乗算されて受話音量が調整される。
【0047】
第4の実施形態によっても、第1の実施形態と同様な効果を奏することができる。これに加え、第4の実施形態によれば、周囲雑音パワに応じて、当該装置での受話音量をも調整したので、周囲雑音に拘らず、受話音声を聴き取り易くできる。
【0048】
(E)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
【0049】
上記各実施形態においては、送話音量調整回路12から出力されたデジタル音声信号を符号化処理するように説明したが、送話音量調整回路12の後段で雑音除去(ノイズキャンセル)するようにしても良い。送話音量を調整しても、調整前後でS/N比は変わらず、S/N比を向上させたい場合には、送話音量の調整と、雑音除去との双方を実行すれば良い。
【0050】
上記各実施形態では、送話音量調整回路12を新たに設けたものを示したが、既存の増幅回路を利用して送話音量を調整するようにしても良い。マイクロフォン10が捕捉したアナログ音声信号を増幅する増幅回路を備えている音声通信装置も多いが、この増幅回路を送話音量調整回路12として利用するようにしても良い。この場合、周囲雑音パワをデジタル音声信号に基づいて推定していると、フィードバック制御となるので、制御が安定するように、通話初期時の所定期間でのみ、周囲雑音パワを推定して、その推定値を通話期間の全体に適用するようにしても良い。
【0051】
上記各実施形態では、携帯電話端末やスマートフォンなどの携帯型音声通信端末に、本発明の技術思想を適用した場合を示したが、固定電話端末に対しても本発明の技術思想を適用でき、また、電話端末以外の音声通信装置に対しても、本発明の技術思想を適用することができる。
【符号の説明】
【0052】
1、1A〜1C…音声通信装置、10、10N…マイクロフォン、11、11N…アナログ/デジタル変換器(A/D)、12…送話音量調整回路、13、13A…周囲雑音パワ推定器、14、14A…ゲイン制御回路、15…パワ対履歴記憶部、16…受話音量調整回路、17…デジタル/アナログ変換器(D/A)、18…スピーカ、19…受話ゲイン制御回路。

【特許請求の範囲】
【請求項1】
送話信号における周囲雑音レベルを推定する周囲雑音推定手段と、
推定された周囲雑音レベルに応じて、上記送話信号の音量を調整する送話音量調整手段と
を備えたことを特徴とする音声通信装置。
【請求項2】
上記周囲雑音推定手段は、上記送話信号における最小レベルを周囲雑音レベルとして推定することを特徴とする請求項1に記載の音声通信装置。
【請求項3】
上記送話音量調整手段は、推定された周囲雑音レベルが所定レベル以下の場合には送話信号の音量を変更せず、推定された周囲雑音レベルが上記所定レベルを超えた場合に、超えた量が大きくなるに従って音量の低減度合いを大きくなるように、送話信号の音量を調整することを特徴とする請求項1又は2に記載の音声通信装置。
【請求項4】
音声通信装置に搭載されるコンピュータを、
送話信号における周囲雑音レベルを推定する周囲雑音推定手段と、
推定された周囲雑音レベルに応じて、上記送話信号の音量を調整する送話音量調整手段と
して機能させることを特徴とする音声通信プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2013−74422(P2013−74422A)
【公開日】平成25年4月22日(2013.4.22)
【国際特許分類】
【出願番号】特願2011−211284(P2011−211284)
【出願日】平成23年9月27日(2011.9.27)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】