音声信号処理装置、音声信号処理方法、及び、通信端末

【課題】少ない処理量で受話音声を聞き取り易くする。特に、人の声が雑音源として含まれる環境下での通話時に、受話音声を聞き取り易くする。
【解決手段】
バンドパスフィルタ６１は、通話時にマイクロホン２２より入力された音声信号から人の音声帯域の信号成分を抽出する。ミュート回路６３とミュート制御回路６４は、人の音声帯域の信号成分から定常的な信号成分、つまり通話時の話者音声を除いた周囲の他者音声の信号成分を抽出する。ミュート回路６３の出力は、コンパレータ６６を介してオートレベルコントローラ４９のコントロール信号となる。オートレベルコントローラ４９では、他者音声の信号成分から作られたコントロール信号により、受話音声信号の入出力特性が制御される。具体的には、他者音声による周囲環境雑音が大きい時、入力レベルに対して出力レベルが大きくなるように入出力特性が制御される。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、携帯電話網等の通信網を通じて送られてきた受話音声を聞き取り易くするための音声信号処理装置及び音声信号処理方法と、音声による通話が可能な携帯電話端末等の通信端末に関する。
【背景技術】
【０００２】
従来より、携帯電話網等の通信網を通じて音声通話が行われる場合に関して、例えば受話側の通話音声信号に所定の信号処理を施すことにより、周囲雑音環境下における通話音声の聞き取り易さを向上させる技術が存在している。
【０００３】
例えば、特開平７−２２１８３２号の公開特許公報（特許文献１）には、周囲雑音と受話音声の周波数特性を比較し、受話音声の周波数特性を変化させることで聞き取り易さを向上させるようにした技術が開示されている。
【０００４】
【特許文献１】特開平７−２２１８３２号公報（図１）
【発明の開示】
【発明が解決しようとする課題】
【０００５】
しかしながら、上述のように、周囲雑音と受話音声の周波数特性を比較して受話音声の周波数特性を変化させるようなことを行うためには、周囲雑音と受話音声の両方の信号解析を行い、またそれら解析結果を比較するなどの多くの処理が必要になる。このため、例えば携帯電話端末のように処理能力が限られている装置にとっては負担が大きくなってしまうという問題がある。
【０００６】
また、携帯電話端末は一般に様々な環境下で使用されるが、その使用環境の中でも特にパーティ会場内や居酒屋内のような環境で使用される場合には、通話中の話者以外の周囲の他者による音声が雑音源となる。しかしながら、このように他者音声による雑音が存在する環境下での使用において、通話音声を聞き取り易くするような技術は現在のところ存在していない。
【０００７】
本発明は、このような実情に鑑みて提案されたものであり、少ない処理量で通話音声（受話音声）を聞き取り易くすることを可能とし、特に、話者以外の他者による音声が雑音源となる環境下でも、通話音声を聞き取り易くすることを可能とする、音声信号処理装置、音声信号処理方法、及び、通信端末を提供することを目的とする。
【課題を解決するための手段】
【０００８】
本発明の音声信号処理装置は、帯域信号成分抽出部と、定常信号成分抽出部と、信号調整部と、制御信号生成部とを有することにより、上述した課題を解決する。ここで、帯域信号成分抽出部は、音声通話時に少なくとも送話音声を集音するための音声集音手段より入力された音声信号から、所定周波数帯域の信号成分を抽出する。定常信号成分抽出部は、帯域信号成分抽出部が抽出した信号成分の中から、少なくとも定常的な信号成分を抽出する。制御信号生成部は、定常信号成分抽出部が抽出した定常的な信号成分を少なくとも用いて、信号調整部の入出力特性を変更するための制御信号を生成する。そして、信号調整部は、入力信号レベルに対する出力信号レベルを調整するレベル調整機能と、制御信号によりレベル調整機能におけるレベル調整の際の入出力特性を変更する入出力特性変更機能とを備え、音声通話時の受話音声信号が入力信号となされる。
【０００９】
すなわち、本発明によれば、音声集音手段より入力された音声信号から所定周波数帯域の信号成分を抽出している。当該所定周波数帯域としては、人の音声の周波数帯域を挙げることができる。その所定周波数帯域の信号成分の中で、特に定常的な信号成分は、通話中の話者音声を除いた周囲の他者による音声の信号成分と考えることができる。したがって、本発明では、当該定常的な信号成分を用い、通話音声の際の受話音声信号のレベルを調整すること、具体的には、その信号成分の信号レベルの大きさに応じて、受話音声側のダイナミクスを制御するようにしている。
【００１０】
また、本発明の音声信号処理装置において、帯域信号成分抽出部は、入力音声信号から第一の周波数帯域の信号波形を抽出する第一のフィルタと、入力音声信号から第二の周波数帯域の信号波形を抽出する第二のフィルタと、第一のフィルタ通過後の信号波形のエンベロープを検波する第一のエンベロープ検波器と、第二のフィルタ通過後の信号波形のエンベロープを検波する第二のエンベロープ検波器とを有する。そして、帯域信号成分抽出部は、第一のエンベロープ検波器によるエンベロープ検波後の信号波形を第一の周波数帯域の信号成分として出力し、第二のエンベロープ検波器によるエンベロープ検波後の信号波形を第二の周波数帯域の信号成分として出力する。また、定常信号成分抽出部は、第一のエンベロープ検波部によるエンベロープ検波後の信号波形をミュートするミュート部と、第一のエンベロープ検波部によるエンベロープ検波後の信号波形の信号レベルが所定閾値を超え且つその状態が所定時間経過した時にミュート部のミュートを解除し、ミュート解除後に信号レベルが所定閾値を下回った時にミュート部のミュートを有効にするミュート制御部とを有し、当該ミュート部の出力波形を定常的な信号成分として出力する。そして、制御信号生成部は、ミュート部から出力された信号波形からなる定常的な信号成分と、第二のエンベロープ検波器によるエンベロープ検波後の信号波形からなる第二の周波数帯域の信号成分とを用いて制御信号を生成する。
【００１１】
すなわち、本発明によれば、所定周波数帯域の信号成分として、第一の周波数帯域と第二の周波数帯域の信号成分を抽出している。第一の周波数帯域としては、人の音声の周波数帯域を挙げることができる、第二の周波数帯域としては、人の音声の周波数帯域よりも低い周波数帯域を挙げることができる。そして、本発明によれば、第一の周波数帯域の信号成分についてミュート部を介した信号成分と、第二の周波数帯域の信号成分とに基づいて、制御信号を生成している。
【発明の効果】
【００１２】
本発明によれば、入力音声信号から抽出された所定周波数帯域の信号成分に基づいて、音声通話時の受話音声信号のレベルを調整すること、すなわち例えば、周囲環境雑音が大きい時には受話音声信号のレベルを上げるようなレベル調整を行うことにより、少ない処理量で通話音声（特に受話音声）を聞き取り易くすることを可能にしている。特に本発明によれば、所定周波数帯域として、人の音声の周波数帯域を用いることで、人の声が雑音源として含まれる環境下での通話時に、受話音声を聞き取り易くすることが可能となる。
【００１３】
また、所定周波数帯域として、例えば人の音声の第一の周波数帯域とそれよりも低い第二の周波数帯域をそれぞれ抽出し、それぞれの帯域での解析に必要な時間的遅延を最小限に抑えて組み合わせることで、広帯域の周囲環境雑音に適応でき、且つ、より反応時間の速い受話音声信号のレベル調整を実現することが可能となる。
【発明を実施するための最良の形態】
【００１４】
以下、図面を参照しながら、本発明の一実施形態について説明する。
【００１５】
なお、本実施形態では、本発明の一例として、携帯電話端末を挙げているが、勿論、ここで説明する内容はあくまで一例であり、本発明はこの例に限定されないことは言うまでもない。
【００１６】
〔携帯電話端末の概略構成〕
図１には、本実施形態の携帯電話端末の概略構成を示す。
【００１７】
図１において、通信アンテナ１２は、例えば内蔵アンテナであり通話や、電子メール等のパケット通信のための信号電波の送受信を行う。通信回路１１は、送受信信号の周波数変換、変調と復調等を行う。
【００１８】
制御部１０は、ＣＰＵ（中央処理ユニット）からなり、通信回路１１における通信の制御、音声処理の制御、画像処理の制御、その他各種信号処理や各部の制御等を行う。また、制御部１０は、メモリ部１５に蓄積されている各種の制御プログラムやアプリケーションプログラムの実行及びそれに付随する各種データ処理等を行う。
【００１９】
スピーカ２１は、携帯電話端末に設けられている受話用のスピーカや、リンガ（着信音）、アラーム音、警告音、再生音楽、ディジタル音声、再生動画像の音声等の出力用スピーカからなり、音声処理部２０から供給された音声信号を音響波に変換して空気中に出力する。
【００２０】
マイクロホン２２は、送話用及び外部音声集音用のマイクロホンであり、音響波を音声信号に変換し、その音声信号を音声処理部２０へ入力する。
【００２１】
音声処理部２０は、復号等の所定の音声処理により生成した音声データをディジタル／アナログ変換した後に増幅し、その増幅後の音声信号を上記スピーカ２１へ出力する。また、音声処理部２０は、マイクロホン２２から供給された入力音声信号を増幅及びアナログ／ディジタル変換し、そのアナログ／ディジタル変換後の音声データの符号化等の所定の音声処理を施す。また特に、本発明実施形態の携帯電話端末の場合、上記音声処理部２０は、ノイズ検出部２３と受話音声処理部２４を備えている。これらノイズ検出部２３と受話音声処理部２４の詳細な構成及び動作については後述する。
【００２２】
操作部１３は、本実施形態の携帯電話端末の図示しない筐体上に設けられているテンキーや発話キー、終話／電源キー等の各キーや十字キー，ジョグダイヤル等の各操作子と、それら操作子が操作された時の操作信号を発生する操作信号発生器とからなる。
【００２３】
表示部１４は、例えば液晶ディスプレイや有機ＥＬ（ElectroLuminescent）ディスプレイ等の表示デバイスと、そのディスプレイの表示駆動回路とを含み、画像処理部２５から供給された画像信号により、上記ディスプレイ上に例えば電子メール等の各種文字やメッセージを表示したり、静止画像や動画像等の表示を行う。
【００２４】
画像処理部２５は、表示部１４に表示される文字、記号、画像等の画像信号を生成する処理を行う。また、画像処理部２５は、制御部１０による制御の元で、各種のユーザインターフェース画面の表示やウェブページの表示等をも行う。
【００２５】
メモリ部１５は、ＲＯＭ（Read Only Memory）とＲＡＭ（Random Access Memory）を含む。ＲＯＭは、ＮＡＮＤ型フラッシュメモリ（NAND-type flash memory）のような書き換え可能な記憶媒体を含み、例えば、ＯＳ（Operating System）のプログラムや制御部１０が各部を制御するための制御プログラム、各種のアプリケーションプログラム、例えば圧縮符号化された楽曲データコンテンツや動画像データコンテンツの他、各種の初期設定値、フォントデータ、各辞書データ、機種名情報や端末識別情報などをも記憶する。ＲＡＭは、制御部１０が各種のデータ処理を行う際の作業領域として、随時データを格納する。
【００２６】
その他、図１には図示を省略しているが、本実施形態の携帯電話端末は、写真画像の撮影のためのディジタルカメラ部、キー照明や着信ライト用などのＬＥＤ（発光ダイオード）とその駆動部、各部へ電力を供給するバッテリとその電力をコントロールするパワーマネージメントＩＣ部、いわゆるブルートゥース方式（Bluetooth：登録商標）やＵＷＢ（Ultra Wide Band）方式、無線ＬＡＮ（Local Area Network）などによる近距離無線通信を行うための近距離無線通信部、非接触ＩＣカード機能とリーダライタ機能とを備えた非接触通信処理部、ＧＰＳ（Global Positioning System）通信部、外部メモリ用スロット、ディジタル放送の受信チューナ部とＡＶコーデック部、タイマ（時計部）など、一般的な携帯電話端末に設けられる各構成要素についても備えている。
【００２７】
［ノイズ検出部及び受話音声処理部の詳細及び動作の説明］
図２には、本実施形態の携帯電話端末の音声処理部２０内に設けられているノイズ検出部２３と受話音声処理部２４の詳細な構成を示す。なお、以下、説明の都合上、アナログ音声信号を処理する例を挙げているが、本発明はディジタル化された音声信号を処理する場合も適用可能であることは言うまでもない。
【００２８】
本実施形態の携帯電話端末において、上記受話音声処理部２４は、ダイナミクス調整部５０とフォルマント調整部４０とを有している。上記ダイナミクス調整部５０は、本実施形態の携帯電話端末により通話が行われている時に、通話の相手先から送られてきた受話音声信号の入出力特性（ダイナミクス）を、ノイズ検出部２３からのコントロール信号に応じて制御する入出力特性変更機能部である。上記フォルマント調整部４０は、上記受話音声信号に含まれる後述するフォルマントのうち、特に周囲環境雑音のピークとは帯域が重なり難い二番目のフォルマントを強調する処理を行うレベル調整機能部、すなわち受話音声の声の輪郭成分を持ち上げるようなイコライザとなされている。
【００２９】
上記ノイズ検出部２３は、周囲環境雑音レベル検出部とコントロール信号生成部とからなり、本実施形態の携帯電話端末にて通話が行われている時、マイクロホン２２にて集音された音声信号に含まれる周囲環境雑音レベルを検出し、その周囲環境雑音レベルから、上記ダイナミクス調整部５０の入出力特性を制御するためのコントロール信号を生成する。
【００３０】
すなわち、本実施形態の携帯電話端末は、周囲環境雑音レベルに基づいて、音声通話時の受話音声信号のレベルを調整すること、具体的には、例えば周囲環境雑音レベルが大きい時には、受話音声信号のレベルを上げるように受話音声側のダイナミクスを制御することにより、少ない処理量で通話音声（特に受話音声）を聞き取り易くすることを可能にしている。
【００３１】
また、本実施形態の携帯電話端末によれば、上記ノイズ検出部２３は、例えば通話時の話者音声を除く他者音声による周囲環境雑音についても検出し、当該他者音声による周囲環境雑音に基づいて上記コントロール信号を生成する。
【００３２】
これにより、本実施形態の携帯電話端末では、他者音声による周囲環境雑音が存在する場合でも、受話音声を聞き取り易くすることを可能としている。
【００３３】
以下、上述したような受話音声を聞き取り易くするための構成とその動作について具体的に説明する。
【００３４】
図２において、音声処理部２０内に設けられているノイズ検出部２３のマイク音声入力端子３１には、通話に使用されているマイクロホン２２から出力される音声信号が入力される。当該マイク音声入力端子３１へ入力された音声信号は、アンプ３２により増幅された後、送話音声信号として、送話音声出力端子３５から図示しない通常の送話音声処理用の回路部へと出力される。
【００３５】
また、本実施形態において、上記アンプ３２にて増幅された後の音声信号は、上記送話音声の出力経路から分岐され、それぞれが並列に設けられたローパスフィルタ（ＬＰＦ）３３とバンドパスフィルタ６１へ通される。
【００３６】
上記ローパスフィルタ３３とバンドパスフィルタ６１への各分岐経路は、上記マイクロホン２２から入力された音声信号に周囲環境雑音がどの程度含まれているかを調べるために設けられている。本実施形態の場合、詳細については後述するが、上記ローパスフィルタ３３側の分岐経路は、人間の音声を略々除いた周囲環境雑音について調べるために設けられている。一方、バンドパスフィルタ６１側の分岐経路は、通話時の話者音声を除いた他者音声による周囲環境雑音について調べるために設けられている。
【００３７】
ここで、人間の声の周波数特性には、図３中の実線で示す特性曲線のように、特定のピーク（フォルマント）が存在している。当該フォルマントの周波数には個人差があるが、概ね３００Ｈｚ〜３．４ｋＨｚの間に大きな二つのピーク（フォルマント）があり、一番目のフォルマントは５００ｋＨｚ〜１ｋＨｚ、二番目のフォルマントは１．５ｋＨｚ〜３ｋＨｚ近辺に存在する。
【００３８】
一方で、周囲環境雑音は環境によって様々なものが考えられるが、一般的な携帯電話端末の使用環境での周囲環境雑音の周波数特性は、図３中の点線で示す特性曲線のように、低い帯域から高い帯域に向かって減衰していくようなものが多い。
【００３９】
なお、図４には周囲環境雑音が含まれた実測による受話音声信号の振幅−周波数特性図を示し、図５には図４の受話音声信号のうち０Ｈｚ〜３００Ｈｚまでを拡大して示している。また、図６には実測による受話音声信号のフォルマントの振幅−周波数特性図を示し、図７には図６の受話音声信号のうち０Ｈｚ〜３００Ｈｚまでを拡大して示している。
【００４０】
このようなことから、本実施形態の携帯電話端末は、マイクロホン２２からの入力音声信号内に、人間の音声を略々除いた周囲環境雑音がどの程度含まれているかを特定するために、例えば図８及び図９に示すような特性を有するローパスフィルタ３３を備えている。なお、図９は、図８のｘ軸（周波数軸）の縮尺を変えることにより、図８の低周波数帯域部分を拡大して示した図である。すなわち本実施形態では、上記ローパスフィルタ３３として、図３のように人間の声の周波数特性における一番目のフォルマントよりも低い帯域をカットオフ周波数（本発明の第二の周波数帯域）とする、例えば図８及び図９に示すような比較的急峻な特性を備えたフィルタを用いている。なお、本実施形態では、当該ローパスフィルタ３３として、カットオフ周波数が例えば５０Ｈｚ〜１４０Ｈｚ（特に図８及び図９の例では１００Ｈｚ程度）で、四次程度のチェビシェフ特性を有するフィルタを用いている。
【００４１】
本実施形態によれば、上述したローパスフィルタ３３による低域通過がなされることにより、図１０に示すように、マイクロホン２２から入力された音声信号波形Ｂfは、ＬＰＦ通過後信号波形Ａlpfとなされる。すなわち、ＬＰＦ通過後信号波形Ａlpfは、上記マイクロホン２２の出力信号から人間の声の成分が非常に少ない帯域成分（つまり人間の音声を略々除いた周囲環境雑音の信号成分）のみが取り出された信号波形となっている。
【００４２】
上述のローパスフィルタ３３を通過した信号（つまり人間の音声を略々除いた周囲環境雑音の信号成分）は、図２に示すように、エンベロープ検出器３４へ送られる。
【００４３】
上記エンベロープ検出器３４では、上記ローパスフィルタ３３を通過した後の信号のエンベロープ検波を行うこと、具体的には、ＬＰＦ通過後信号波形Ａlpfを一定時間間隔毎に平均化してサンプリングすることにより、上記周囲環境雑音の大まかなエネルギー推移を表す信号を生成する。すなわち本実施形態において、当該エンベロープ検出器３４の出力信号は、上記マイクロホン２２から入力された音声信号内に、人間の音声を略々除いた周囲環境雑音がどの程度含まれているかを調べた結果を表す信号となっている。なお、当該エンベロープ検出器３４において、どの程度の刻み（一定時間間隔毎に平均化する周期）で上記エネルギー推移を検出するかについてはここでは特に限定しないが、後段の受話音声処理部２４で用いられる処理時間単位（例えば１００ｍｓｅｃ）に応じた時間刻みにすることが望ましい。
【００４４】
ところで、上述したローパスフィルタ３３により抽出される周囲環境雑音成分は、人間の声の音域よりも低い音域の雑音成分に限られている。但し、携帯電話端末は、例えばパーティ会場内や居酒屋内のような環境で使用されることもある。すなわち、携帯電話端末がそのような環境下で使用されている場合には、通話中の話者以外の周囲の他者による音声も、上記周囲環境雑音に含まれることになる。
【００４５】
一方で、人の音声が雑音源となるような環境下で携帯電話端末により通話が行われる場合において、通話音声の聞き取り易さを向上させるために前述のような受話音声信号のレベル調整を行うような処理を実行する際には、通話音声と周囲の他者音声による雑音成分とを区別する必要がある。すなわち、通話音声に基づいて受話音声信号のフォルマントを強調するようなレベル調整が行われてしまうと、受話音声の音質が劣化してしまうことになるため、例えば、通話音声が存在する期間を除き、周囲の他者音声のみが存在している期間において当該他者音声を雑音成分として検出するような処理が必要となる。
【００４６】
このようなことから、本実施形態では、マイクロホン２２から入力された音声信号内に、通話時の話者音声を除いた他者音声による周囲環境雑音がどの程度含まれているかを特定するために、上記ノイズ検出部２３内に、バンドパスフィルタ６１の分岐経路を設けている。
【００４７】
上記バンドパスフィルタ６１は、例えば図１１に示すような特性を有している。すなわち、上記バンドパスフィルタ６１は、図１１に示すように、人間の声の帯域を含む２００Ｈｚから数ｋＨｚ程度の比較的高い帯域（本発明の第１の周波数帯域）を通過させる特性を備えたフィルタとなされている。
【００４８】
本実施形態によれば、上述したバンドパスフィルタ６１にて帯域通過がなされることにより、図１２に示すように、マイクロホン２２から入力された音声信号波形Ｂfは、ＢＰＦ通過後信号波形Ａbpfとなされる。すなわち、ＢＰＦ通過後信号波形Ａbpfは、上記マイクロホン２２の出力信号から人間の声の成分に近い帯域成分（つまり人間の音声による周囲環境雑音を含む信号成分）が抽出された信号波形となっている。
【００４９】
ここで、上述のように人間の声の成分に近い周波数帯域成分を周囲環境雑音の検出に使用した場合には、通話時の話者自身の声の成分をも周囲環境雑音として検出してしまうことが問題となる。
【００５０】
本実施形態の携帯電話端末は、この問題を解決するため、上記バンドパスフィルタ６１側の分岐経路内に、図２に示したようにミュート制御回路６４とミュート回路６３を備えている。
【００５１】
すなわち、通話時の話者音声と、周囲環境雑音としての他者音声とでは、音声周波数帯域については略々同じになると考えられる一方で、時間的連続性には違いがある。具体的に説明すると、通話時には言葉が用いられているため、話者音声は、文の区切れや息継ぎ、通話相手の発話などにより、音声の時間的連続性が少なく、非定常に変化するものとなる。これに対し、周囲環境雑音としての他者音声は、当該他者の人数が増えて騒音が大きくなるほど、時間的な途切れが少ない定常的なものとなる。
【００５２】
上記ミュート制御回路６４とミュート回路６３は、上述したような音声の時間的連続性の違いから双方を識別するために設けられている。
【００５３】
図２の説明に戻り、上記バンドパスフィルタ６１を通過した信号（人間の音声帯域の信号成分）は、前述のエンベロープ検出器３４と同様のエンベロープ検出器６２を介して、ミュート回路６３とミュート制御回路６４へ入力する。
【００５４】
上記ミュート回路６３は、初期状態では入力信号をミュートする設定（ミュートオン）となされており、ミュート制御回路６４からミュートオフ信号が供給された時に、上記ミュートを解除（ミュートオフ）する。
【００５５】
上記キュート制御回路６４は、上記エンベロープ検出器６２からの信号レベルが、予め決められた所定閾値を超え、その状態が予め決められた所定時間（数秒程度）連続した時、上記ミュートオフ信号を上記ミュート回路６３へ出力する。すなわち、ミュート制御回路６４は、上記エンベロープ検出器６２の出力信号レベルが上記閾値を超えている状態の連続時間を測定し、その状態が上記所定時間経過した時に上記ミュートオフ信号を出力する。
【００５６】
また、ミュート制御回路６４は、上記ミュート回路６３のミュートが解除された状態になった後（ミュート解除信号を出力した後）、上記エンベロープ検出器６３からの出力信号レベルが上記所定閾値を下回った時には、直ぐに上記ミュート回路６３のミュートを有効（ミュートオン）にするためのミュートオン信号を出力する。
【００５７】
すなわち、本実施形態において、上記バンドパスフィルタ６１の分岐経路では、ミュート制御回路６４への入力信号が非定常的で時間的連続性が無い信号、つまり通話者の音声信号に対応した信号である場合には、ミュート回路６３がミュートオンとなり、上記エンベロープ検出器６２の出力信号はミュート回路６３の後段へは出力されない。一方、ミュート制御回路６４への入力信号が定常的で時間的連続性を有した信号、つまり周囲環境雑音としての他者音声信号に対応した信号である場合には、ミュート回路６３がミュートオフとなり、上記エンベロープ検出器６２の出力信号はミュート回路６３の後段へ出力される。
【００５８】
上記ミュート回路６３の出力信号は、コンパレータ６６へ送られる。また、当該コンパレータ６６へは、前述のローパスフィルタ３３側の分岐経路のエンベロープ検出器３４の出力信号も供給されている。なお、ミュート回路６３とコンパレータ６６との間には、ミキシング用ボリューム回路６５が設けられている。当該ミキシング用ボリューム回路６５は、上記ローパスフィルタ３３側の分岐経路とバンドパスフィルタ６１側の分岐経路上の双方の信号強度のバランスを調整するために設けられている。
【００５９】
上記コンパレータ６６は、バンドパスフィルタ６１側分岐経路の上記ミュート回路６３を介したエンベロープ検出器６２の出力信号と、前記ローパスフィルタ３３側分岐経路のエンベロープ検出器３４の出力信号とのレベルを比較し、大きい方の信号を後段の受話音声処理部２４へコントロール信号として出力する。なお、当該コンパレータ６６におけるレベル比較は、一例として、上記エンベロープ検出器３４とエンベロープ検出器６２における前記一定時間間隔の周期に同期して行われる。
【００６０】
図１３の（Ａ）にはエンベロープ検出器６２の出力信号波形の一例を示し、図１３の（Ｂ）にはミュート回路６３の出力信号波形の一例を、図１３の（Ｃ）にはミキシング用ボリューム回路６５の出力信号波形の一例を示す。
【００６１】
この図１３の例に示すように、上記ミュート回路６３及びミュート制御回路６４への入力信号が図１３の（Ａ）に示すような波形信号であった場合、上記ミュート制御回路６４は、当該信号波形のレベルが図１３の（Ａ）の所定閾値Ｌthを超えた状態が所定時間Ｔth連続した時に、ミュートオフ信号をミュート回路６３へ出力する。これにより、ミュートオフになされたミュート回路６３からは、図１３の（Ｂ）に示すような波形信号が出力されることになる。
【００６２】
またその後、上記ミュート制御回路６４への入力信号が上記所定閾値Ｔthを下回った場合、ミュート制御回路６４は、直ちにミュートオン信号をミュート回路６３へ出力する。これにより、ミュートオンになされたミュート回路６３からは、図１３の（Ｂ）に示すように信号波形が出力されないようになる。
【００６３】
また、図１４の（Ａ）にはローパスフィルタ３３の分岐経路側のエンベロープ検出器３４の出力信号波形の一例を示し、図１４の（Ｂ）には上記ミキシング用ボリューム回路６５の出力信号波形の一例を、図１４の（Ｃ）にはコンパレータ６６の出力信号波形（コントロール信号）の一例を示す。
【００６４】
この図１４の例に示すように、コンパレータ６６からは、バンドパスフィルタ６１側の分岐経路のミキシング用ボリューム回路６６からの出力信号と、ローパスフィルタ３３側の分岐経路のエンベロープ検出器３４の出力信号とのレベル比較により、大きい方となった信号が出力される。
【００６５】
上述したように、本実施形態によれば、ローパスフィルタ３３側の分岐経路による人間の音声を略々除いた周囲環境雑音に基づくコントロール信号と、バンドパスフィルタ６１側の分岐経路による他者音声の周囲環境雑音に基づくコントロール信号のうち、信号レベルの大きい方の信号が、受話音声処理部２４へ出力される。
【００６６】
これにより、例えば人間の音声を略々除いた周囲環境雑音よりも、人間の音声による周囲環境雑音が大きい場合、受話音声処理部２４では、当該人間の音声に起因した周囲環境雑音レベルに応じたコントロール信号により、受話音声信号のレベル調整が行われることになる。一方、人間の音声による周囲環境雑音よりも、人間の音声を略々除いた周囲環境雑音が大きい場合、受話音声処理部２４では、当該人間の音声を略々除いた周囲環境雑音レベルに応じたコントロール信号により、受話音声信号のレベル調整が行われることになる。
【００６７】
また、本実施形態によれば、通話による話者音声が存在している期間と、他者音声の周囲環境雑音のみが存在している期間を明確に区別できるため、特に通話による話者音声が存在している期間では、人間の音声を略々除いた周囲環境雑音レベルに応じたコントロール信号により、受話音声処理部２４で受話音声信号のレベル調整が行われることになる。
【００６８】
また、本実施形態によれば、人間の音声を略々除いた周囲環境雑音と人間の音声に起因した周囲環境雑音とを並列に検出可能となされている。そして、人間の音声に起因した周囲環境雑音によるコントロール信号は、バンドパスフィルタ６１側分岐経路により少なくとも所定時間分だけ遅延して生成され、その一方で、人間の音声を略々除いた周囲環境雑音に基づくコントロール信号については、ローパスフィルタ３３側の分岐経路により常時生成されている。すなわち、本実施形態の受話音声処理部２４では、人間の音声を略々除いた周囲環境雑音から常時生成されているコントロール信号による前記レベル調整の際の反応速度の速さを活かしたまま、人間の音声に起因した周囲環境雑音による前記レベル調整も可能となっている。
【００６９】
［ダイナミクス調整部の構成及び動作説明］
以下、上述した受話音声処理部２４内のダイナミクス調整部５０とフォルマント調整部４０の詳細な構成及び動作について説明する。
【００７０】
先ず、ダイナミクス調整部５０から説明し、その後にフォルマント調整部４０の説明を行う。
【００７１】
当該受話音声処理部２４において、受話音声入力端子４５には、図示しない通常の受話音声処理用の回路部から送られてきた受話音声信号が入力される。
【００７２】
この受話音声信号は、後述するフォルマント調整部４０のバンドパスフィルタ（ＢＰＦ）４４へ送られると共に、ディレイ・フェーズシフタ部４７へも送られる。
【００７３】
後述するディレイ・フェーズシフタ部４７を介し、さらに後述する加算器４６を介した受話音声信号は、ダイナミクス調整部５０のアンプ４８にて必要に応じて増幅された後、オートレベルコントローラ（ＡＬＣ）４９へ入力する。
【００７４】
また、前記ノイズ検出部２３のコンパレータ６６から出力されたコントロール信号は、当該ダイナミクス調整部５０のリミッタ５１により、規定レベルを超える部分についてレベル制限が掛けられ、さらにアンプ５２にて必要に応じてレベル調整された後、オートレベルコントローラ４９へ送られる。なお、コンパレータ６６から出力されたコントロール信号の信号波形が例えば図１５に示すような波形であった場合、上記ダイナミクス調整部５０のリミッタ５１にてレベル制限が掛けられ、アンプ５２にてレベル調整がなされた後のコントロール信号波形は、例えば図１６に示すような波形となる。
【００７５】
上記オートレベルコントローラ４９の出力信号は、受話音声出力端子５３を介して受話用のスピーカ２１へ出力される。なお、本実施形態のオートレベルコントローラ４９の詳細な構成については後述する。
【００７６】
ここで、一般的なオートレベルコントローラ（ＡＬＣ）は、入出力特性曲線が一つに決められており、入力レベルと出力レベルが一対一に対応する特性を有するものとなされている。これに対し、本実施形態の受話音声処理部２４に設けられているオートレベルコントローラ４９は、上記図１６に示したようなコントロール信号によって入出力特性そのものを変化させることが可能なものとなされている。具体的には、本実施形態のオートレベルコントローラ４９は、図１７〜図１９に示すような可変ヒンジ点を持った入出力特性を有したものとなされている。なお、図１８は図１７の可変ヒンジ点近傍を拡大して示す図であり、また、図１９はコントロール信号のレベル変化と可変ヒンジ点の変化の関係を示す図である。
【００７７】
すなわち、本実施形態のオートレベルコントローラ４９は、図１７及び図１８に示すように、例えば人間の音声による受話音声の信号レベルであると考えられる所定入力レベル範囲内（図１７，図１８では例えば−３０ｄＢ以上で且つ上限としての−１０ｄＢの範囲内）において、入力レベルに対する出力レベルの値を例えば最大１０ｄＢ分まで１ｄＢ毎に複数段階（一例として１ｄＢステップ毎の１１段階）に渡って変更可能となされており、図１９に示すように、一つ前のコントロール信号の値に対してその次のコントロール信号の値が大きくなれば上記可変ヒンジ点を出力レベルが大きくなる方向へ一段階のみ移行（１ランクアップ）させる。逆に、一つ前のコントロール信号の値に対してその次のコントロール信号の値が小さくなれば、上記可変ヒンジ点を出力レベルが小さくなる方向に移行（１ランクダウン）させるようなレベル制御を行う。
【００７８】
より具体的に説明すると、本実施形態のオートレベルコントローラ４９は、入力レベルが上記所定入力レベル範囲内である時に、例えば、上記コントロール信号の値が大きい場合（つまり周辺環境雑音が大きい場合）には、入力レベルに対して出力レベルを上げる方向へ上記可変ヒンジ点を変化させて当該オートレベルコントローラの効果を強くするダイナミクス制御を行う。一方、例えば、上記コントロール信号の値が小さい場合（つまり周辺環境雑音が小さい場合）には、入力レベルに対して出力レベルが一対一の関係となる方向へ近づくように上記可変ヒンジ点を変化させて当該オートレベルコントローラの効果を弱めるダイナミクス制御を行う。
【００７９】
言い換えると、本実施形態のオートレベルコントローラ４９は、一定レベル以上の受話音声信号が入力されている場合において、前述した周辺環境雑音が大きい時（つまりコントロール信号の値が大きい時）には、オートレベルコントローラの入出力特性を、例えば、入力レベル：出力レベル＝１：ｎ（この場合のｎは１より大きく上記１ｄＢステップ毎の各可変ヒンジ点に応じた値）となる方向へ調整することにより、例えば図２０に示すように受話音声信号の出力レベルを上げて受話音声を聞こえ易くする。一方、周辺環境雑音が小さい時（コントロール信号の値が小さい時）には、オートレベルコントローラの入出力特性を、入力レベル：出力レベル＝１：１に近づく方向へ調整することにより、オートレベルコントローラでのダイナミクス制御による受話音声の音質劣化を必要最小限に抑えるようにする。なお、図２０中の実線は実際の受話音声信号の振幅波形を表しており、図２０中の一点鎖線は本実施形態により出力レベルが上げられた時の受話音声信号の振幅波形を表している。
【００８０】
上述のように、本実施形態によれば、例えば、周辺環境雑音が大きくなり、上記オートレベルコントローラ４９の入出力特性を上記入力レベル：出力レベル＝１：ｎとなる方向へ調整した場合には、受話音声に多少の音質劣化が生じたとしても、上記周辺環境雑音に対して相対的に受話音声のレベルが大きくなるため、その受話音声は聞き易いものとなる。一方、周辺環境雑音が小さくなり、オートレベルコントローラ４９の入出力特性を上記入力レベル：出力レベル＝１：１に近づく方向へ調整した場合、受話音声のレベルは大きくならないが、元々の周辺環境雑音のレベルも小さいため、当該周辺環境雑音が通話に悪影響を及ぼす可能性は低くなり、また、受話音声の音質劣化も少なくなるため、当該受話音声は聞き易いものとなる。
【００８１】
なお、上述の説明では、図１７及び図１８のように、入力レベルに対する出力レベルの値を、例えば最大１０ｄＢ分まで１ｄＢ毎に複数段階に渡って変更可能とする可変ヒンジ点を例に挙げたが、可変ヒンジ点は上述のような非連続的に変化するものだけでなく、例えば連続的に変化するものであっても良い。
【００８２】
また、上述の例では、説明を簡略にするために、オートレベルコントローラ４９における上述の可変ヒンジ点によるダイナミクス制御は、周囲環境雑音の大きさの変化にそのまま追従して行われる例を挙げている。しかしながら、例えば、周囲環境雑音が急激に変化するような場合には、上記ダイナミクス制御後の受話音声が、利用者の聴覚上で違和感を感じるほど急激に変化してしまうようなことも有り得る。このため、本実施形態のオートレベルコントローラ４９でのダイナミクス制御は、上述したような急激な変化を防ぐために、例えば可変ヒンジ点の変化に対して或る程度のヒステリシスを設けるように成されている。
【００８３】
また、前述の図１７及び図１８では、オートレベルコントローラ４９の入出力特性が変更される部分の特性曲線として、或る所定の入力レベル（図１７，図１８の例では−２０ｄＢの入力レベル）の部分で折れ曲がるような特性曲線（可変ヒンジ点の特性曲線）を例に挙げているが、例えば図２１に示すように、入力レベルと出力レベルが一対一となる入出力特性曲線に対して並行で且つ或る程度の長さの線分を有した状態で、複数段階（非連続的）或いは連続的に変更されるような特性曲線を用いることも可能である。
【００８４】
すなわち、この図２１の例の場合、オートレベルコントローラ４９は、人間の音声による受話音声の信号レベルであると考えられる所定入力レベル範囲内において、入力レベルに対する出力レベルの値を最大で例えば１０ｄＢ分まで１ｄＢ毎に複数段階（例えば１ｄＢステップ毎の１１段階）に渡って変更可能となされており、一つ前のコントロール信号の値に対してその次のコントロール信号の値が大きくなった時には上記出力レベルが大きくなる方向へゲインを一段階のみ移行させる。逆に、一つ前のコントロール信号の値に対してその次のコントロール信号の値が小さくなった時には、出力レベルが小さくなる方向へゲインを移行させるようなダイナミクス制御を行う。この図２１の例の場合、オートレベルコントローラ４９が元々有している入出力特性曲線を並行移動させるだけであるため、回路構成の変更が少なく安価且つ容易に実現することができる。なお、ダイナミクス制御の際には、例えば、入出力レベルを検出すると共に、ゲインを調整するアタック時間（ゲインを下げる際の時間）と、リカバリ時間（ゲインを上げる際の時間）を設け、それらアタック時間とリカバリ時間を上記入出力レベルの検出値に応じて調整することで、ゲインの変化が急激にならないようにすることが望ましい。
【００８５】
また、上述の説明ではアナログ処理を例に挙げて説明しているが、その他にも、例えばディジタル処理を用いる場合には、コントロール信号と可変ヒンジ点との間に、例えば図２２や図２３に示すような関係を持たせ、一定時間間隔（例えば１００ｍｓｅｃ間隔）でコントロール信号が入力する毎に、その時点での可変ヒンジ点に対応するコントロール信号の値と上記入力したコントロール信号との比較を行い、上記入力したコントロール信号の値の方が大きければ可変ヒンジ点を出力が大きくなる方向に一段階のみ移行させ、逆に、入力したコントロール信号の値の方が小さければ可変ヒンジ点を出力が小さくなる方向に移行させるようにしても良い。このようにすることで、ディジタル処理を用いる場合であっても、可変ヒンジ点の急激な変化を防ぐことができる。
【００８６】
本実施形態によれば、以上のようなことを行うことにより、処理量を増大させることなく、周囲環境雑音下での通話音声の聞き取り易さを向上させることができる。
【００８７】
［フォルマント調整部の構成及び動作説明］
次に、受話音声処理部２４のフォルマント調整部４０について説明する。
【００８８】
上記受話音声処理部２４のコンパレータ６６から出力されたコントロール信号は、フォルマント調整部４０のリミッタ４１により規定レベルを超える部分についてレベル制限が掛けられ、さらにアンプ４２にて必要に応じてレベル調整された後、アンプ４３へコントロール信号として送られる。なお、コンパレータ６６から出力されたコントロール信号の信号波形が例えば前述の図１５に示すような波形であった場合、上記フォルマント調整部４０のリミッタ４１にてレベル制限が掛けられ、アンプ４２にてレベル調整がなされた後のコントロール信号波形は、例えば図２４に示すような波形となる。
【００８９】
また、受話音声入力端子４５からの受話音声信号が入力されるバンドパスフィルタ４４は、例えば図２５に示すような周波数特性を備えたフィルタである。すなわち、バンドパスフィルタ４４は、受話音声信号の周波数帯域のうち、特に周囲環境雑音のピークとは帯域が重なり難い二番目のフォルマントの周波数帯域のみを通過させるフィルタとなされている。なお、図２６には、受話音声信号入力端子４５から入力された受話音声信号の実測による振幅−周波数測定図を示し、図２７には上記バンドパスフィルタ４４による帯域通過処理後の受話音声信号の実測による振幅−周波数測定図を示している。
【００９０】
上記バンドパスフィルタ４４を通過した上記二番目のフォルマントの周波数帯域の受話音声信号は、上記アンプ４３へ入力される。
【００９１】
ここで、アンプ４３は、上記コントロール信号に対して図２８に示すような増幅率の関係を有するアンプとなされている。これにより、当該アンプ４３では、前述の図３と同様に示す図２９の図中一点鎖線で示す特性曲線のように、上記受話音声信号のうち二番目のフォルマントの周波数帯域の信号に対して、上記図２８のコントロール信号と増幅率の関係に応じたゲイン調整処理（強調処理）が行われることになる。なお、図３０には上記アンプ４３によるゲイン調整後の受話音声信号の実測による振幅−周波数測定図を示している。
【００９２】
そして、当該アンプ４３の出力信号は、加算器４６へ送られる。
【００９３】
また、上記加算器４６には、ディレイ・フェーズシフタ４７により遅延及び位相調整がなされた後の受話音声信号が供給されている。なお、ディレイ・フェーズシフタ４７は、受話音声入力端子４５に入力した受話音声信号に対し、上記フォルマント調整部４０のバンドパスフィルタ４４での遅延と同様の遅延を与えるために設けられている。
【００９４】
上記加算器４６では、上記ディレイ・フェーズシフタ部４７により時間及び位相調整がなされた後の受話音声信号に、上記アンプ４３の出力信号（つまり二番目のフォルマントのゲイン調整がなされた信号）が加算される。すなわち、当該加算器４６の出力信号は、前述の図２９に示したように、受話音声信号に含まれるフォルマントのうち特に周囲環境雑音のピークとは帯域が重なり難い二番目のフォルマントを強調する処理が行われた信号となる。なお、図３１には上記加算器４６での加算処理後の受話音声信号の実測による振幅−周波数測定図を示している。
【００９５】
そして、上記加算器４６から出力された信号は、前述したダイナミクス調整部５０のアンプ４８に送られることになる。
【００９６】
［ノイズ検出部の他の構成例］
図３２には、本実施形態の携帯電話端末の音声処理部２０内に設けられているノイズ検出部２３の他の構成例を示す。なお、この図３２において、前述した図２の各構成要素と同一のものには同じ参照符号を付し、それらの説明は省略する。
【００９７】
この図３２の構成例では、ノイズ検出部２３において、前述の図２に示したコンパレータ６６に代えて、加算器６７が設けられている。
【００９８】
すなわちこの図３２において、加算器６７には、前述したローパスフィルタ３３側の分岐経路のエンベロープ検出器３４の出力信号と、前述したバンドパスフィルタ６１側の分岐経路のミキシング用ボリューム回路６６の出力信号が供給される。
【００９９】
加算器６７では、上記バンドパスフィルタ６１側分岐経路の上記ミュート回路６３を介したエンベロープ検出器６２の出力信号と、ローパスフィルタ３３側分岐経路のエンベロープ検出器３４の出力信号とが加算される。
【０１００】
そして、この図３２の例では、当該加算器６７による加算信号が後段の受話音声処理部２４へコントロール信号として出力される。
【０１０１】
この図３２の構成例によれば、ローパスフィルタ３３側の分岐経路による人間の音声を略々除いた周囲環境雑音に基づくコントロール信号と、バンドパスフィルタ６１側の分岐経路による他者音声の周囲環境雑音に基づくコントロール信号とを加算した信号が、受話音声処理部２４へのコントロール信号として出力される。
【０１０２】
すなわちこの図３２の構成例によれば、通話による話者音声が存在していない期間において、他者音声の周囲環境雑音が存在している場合に、当該他者音声に起因した周囲環境雑音と人間の音声を略々除いた周囲環境雑音との両方を加味したコントロール信号が生成されることになる。
【０１０３】
したがって、この図３２の例によれば、受話音声処理部２４では、当該他者音声に起因した周囲環境雑音と人間の音声を略々除いた周囲環境雑音との両方に基づいて、受話音声信号のレベル調整が行われることになる。
【０１０４】
勿論、この例の場合も前述同様に、受話音声処理部２４では、人間の音声を略々除いた周囲環境雑音から常時生成されているコントロール信号によるレベル調整の反応速度の速さを活かしたまま、人間の音声に起因した周囲環境雑音によるレベル調整も可能となっている。
【０１０５】
［まとめ］
以上説明したように、本実施形態においては、通話の相手先から送られてきた受話音声信号の入出力特性（ダイナミクス）を、人間の音声を略々除いた周囲環境雑音と通話時の話者音声を除く周囲の他者音声による周囲環境雑音の両方を利用して制御する処理を行うようにしている。
【０１０６】
したがって本実施形態によれば、一般的な様々な使用環境だけでなく、例えばパーティ会場内や居酒屋内のような人の声が騒音源となっている環境で使用される場合であっても、受話音声を聞き取り易くすることが可能となっている。
【０１０７】
また、受話音声信号のダイナミクスを周囲環境雑音の大きさに応じて制御する処理は、ローパスフィルタ及びエンベロープ検出とオートレベルコントロールのみの非常に少ない処理量で実現可能となっている。
【０１０８】
更に、本実施形態によれば、上記受話音声信号に対してダイナミクス制御を行うと同時に、受話音声信号に含まれるフォルマントのうち特に周囲環境雑音のピークとは帯域が重なり難い二番目のフォルマントを強調する処理（受話音声の声の輪郭成分を持ち上げるような処理）を行うことにより、受話音声をより聞き取り易くしている。
【０１０９】
なお、上述した実施形態の説明は、本発明の一例である。このため、本発明は上述した各実施形態に限定されることなく、本発明に係る技術的思想を逸脱しない範囲であれば、設計等に応じて種々の変更が可能であることはもちろんである。
【０１１０】
例えば、上述した実施形態では、携帯電話端末等の移動体端末を例に挙げたが、本発明は固定電話等の固定通信端末にも適用可能である。その他、本発明は、例えば音声通話機能を備えたＰＤＡ（Personal Digital Assistants）等の各種の携帯端末にも適用可能である。
【図面の簡単な説明】
【０１１１】
【図１】本発明実施形態の携帯電話端末の概略構成を示すブロック図である。
【図２】本実施形態の携帯電話端末の音声処理部内に設けられているノイズ検出部と受話音声処理部の詳細な構成を示すブロック回路図である。
【図３】人間の声の周波数特性の説明に用いる概略図である。
【図４】周囲環境雑音が含まれた実測による受話音声信号の振幅−周波数特性図である。
【図５】図４の受話音声信号のうち０Ｈｚ〜３００Ｈｚまでを拡大して示す振幅−周波数特性図である。
【図６】実測による受話音声信号のフォルマントの振幅−周波数特性図である。
【図７】図６の受話音声信号のうち０Ｈｚ〜３００Ｈｚまでを拡大して示す振幅−周波数特性図である。
【図８】ノイズ検出部のローパスフィルタの周波数特性を示す特性図である。
【図９】ノイズ検出部のローパスフィルタの周波数特性のうち、特に低周波数帯域部分を拡大して示す特性図である。
【図１０】マイクロホンから入力された音声信号波形と、その音声信号波形がノイズ検出部のローパスフィルタを通過した後のＬＰＦ通過後信号波形とを示す波形図である。
【図１１】ノイズ検出部のバンドパスフィルタの周波数特性を示す特性図である。
【図１２】マイクロホンから入力された音声信号波形と、その音声信号波形がノイズ検出部のバンドパスフィルタを通過した後のＢＰＦ通過後信号波形とを示す波形図である。
【図１３】バンドパスフィルタの分岐経路側のエンベロープ検出器の出力信号波形例とミュート回路の出力信号波形例とミキシング用ボリューム回路の出力信号波形例とを示す波形図である。
【図１４】ローパスフィルタの分岐経路側のエンベロープ検出器の出力信号波形例と、バンドパスフィルタの分岐経路側のミキシング用ボリューム回路の出力信号波形とコンパレータの出力信号波形例を示す波形図である。
【図１５】ノイズ検出部から出力されるコントロール信号（周囲環境雑音の大まかなエネルギー推移を表す信号）の波形例を示す波形図である。
【図１６】ノイズ検出部から出力されたコントロール信号がダイナミクス調整部のリミッタ及びアンプを通過した後の信号波形例を図１８示す波形図である。
【図１７】本実施形態にかかる可変ヒンジ点を有したオートレベルコントローラの入出力特性曲線を示す特性図である。
【図１８】図１７の可変ヒンジ点近傍を拡大して示す特性図である。
【図１９】コントロール信号のレベル変化と可変ヒンジ点の変更の関係説明に用いる図である。
【図２０】本実施形態にかかるオートレベルコントローラによりレベル調整がなされた後の受話音声信号の概略的な振幅波形を示す波形図である。
【図２１】入力レベルと出力レベルが一対一に対応する入出力特性曲線に対して並行な線分を有した状態でオートレベルコントローラの入出力特性を変更する例の説明に用いる特性図である。
【図２２】ディジタル処理によりオートレベルコントローラの入出力特性を制御する場合のコントロール信号と可変ヒンジ点との関係の一例を示す図である。
【図２３】ディジタル処理によりオートレベルコントローラの入出力特性を制御する場合のコントロール信号と可変ヒンジ点との関係の他の例を示す図である。
【図２４】ノイズ検出部から出力された図１５のコントロール信号が、フォルマント調整部のリミッタ及びアンプを通過した後の信号波形を示す波形図である。
【図２５】フォルマント調整部のバンドパスフィルタの周波数特性を示す特性図である。
【図２６】受話音声信号入力端子から入力された受話音声信号の実測による振幅−周波数測定図である。
【図２７】フォルマント調整部のバンドパスフィルタによる帯域通過処理後の受話音声信号の実測による振幅−周波数測定図である。
【図２８】フォルマント調整部のアンプにおけるコントロール信号と増幅率の関係を示す特性図である。
【図２９】フォルマント調整部により人間の声の周波数特性における二番目のフォルマントの周波数特性が調整される状態の説明に用いる概略図である。
【図３０】フォルマント調整部のアンプによるゲイン調整後の受話音声信号の実測による振幅−周波数測定図である。
【図３１】フォルマント調整部の加算器での加算処理後の受話音声信号の実測による振幅−周波数測定図である。
【図３２】本実施形態の携帯電話端末の音声処理部内に設けられているノイズ検出部の他の構成例の説明に用いるブロック回路図である。
【符号の説明】
【０１１２】
１０制御部、１１通信回路、１２通信用のアンテナ、１３操作部、１４表示部、１５メモリ、２０音声処理部、２１スピーカ、２２マイクロホン、２３ノイズ検出部、２４受話音声処理部、２５画像処理部、３１マイク音声入力端子、３２，４２，４３，４８，５２アンプ、３３ローパスフィルタ、３４，６２エンベロープ検出器、３５送話音声出力端子、４０フォルマント調整部、４１フォルマント調整部のリミッタ、４４，６１バンドパスフィルタ、４５受話音声入力端子、４６、６７加算器、４７ディレイ・フェーズシフタ、４９オートレベルコントローラ、５０ダイナミクス調整部、５１ダイナミクス調整部のリミッタ、５３受話音声出力端子、６３ミュート回路、６４ミュート制御回路、６６コンパレータ

【特許請求の範囲】
【請求項１】
音声通話時に少なくとも送話音声を集音するための音声集音手段より入力された音声信号から、所定周波数帯域の信号成分を抽出する帯域信号成分抽出部と、
上記帯域信号成分抽出部が抽出した信号成分の中から、少なくとも定常的な信号成分を抽出する定常信号成分抽出部と、
入力信号レベルに対する出力信号レベルを調整するレベル調整機能と、制御信号により上記レベル調整機能におけるレベル調整の際の入出力特性を変更する入出力特性変更機能とを備え、上記音声通話時の受話音声信号が上記入力信号となされる信号調整部と、
上記定常信号成分抽出部が抽出した上記定常的な信号成分を少なくとも用いて、上記信号調整部の上記入出力特性を変更するための上記制御信号を生成する制御信号生成部と、
を有する音声信号処理装置。
【請求項２】
上記帯域信号成分抽出部は、上記所定周波数帯域の信号成分として、第一の周波数帯域の信号成分と第二の周波数帯域の信号成分を抽出し、
上記定常信号成分抽出部は、上記所定周波数帯域の信号成分のうち上記第一の周波数帯域の信号成分から上記定常的な信号成分を抽出し、
上記制御信号生成部は、上記定常信号成分抽出部にて上記第一の周波数帯域の信号成分から抽出された上記定常的な信号成分と上記帯域信号成分抽出部にて抽出された上記第二の周波数帯域の信号成分の両信号レベルを比較し、何れか大きい方の信号レベルの信号成分を用いて、上記制御信号を生成する請求項１記載の音声信号処理装置。
【請求項３】
上記帯域信号成分抽出部は、上記所定周波数帯域の信号成分として、第一の周波数帯域の信号成分と第二の周波数帯域の信号成分とを抽出し、
上記定常信号成分抽出部は、上記所定周波数帯域の信号成分のうち上記第一の周波数帯域の信号成分から上記定常的な信号成分を抽出し、
上記制御信号生成部は、上記定常信号成分抽出部にて上記第一の周波数帯域の信号成分から抽出された上記定常的な信号成分と上記帯域信号成分抽出部にて抽出された上記第二の周波数帯域の信号成分とを加算した信号成分を用いて、上記制御信号を生成する請求項１記載の音声信号処理装置。
【請求項４】
上記帯域信号成分抽出部は、上記第一の周波数帯域として人の音声帯域の信号成分を抽出し、上記第二の周波数帯域として人の音声帯域を除く周波数帯域の信号成分を抽出する請求項２又は請求項３記載の音声信号処理装置。
【請求項５】
上記帯域信号成分抽出部は、入力音声信号から上記所定周波数帯域の信号波形を抽出するフィルタと、上記フィルタ通過後の信号波形のエンベロープを検波するエンベロープ検波器とを有し、上記エンベロープ検波後の信号波形を上記所定周波数帯域の信号成分として出力し、
上記定常信号成分抽出部は、上記エンベロープ検波後の信号波形をミュートするミュート部と、上記エンベロープ検波後の信号波形の信号レベルが所定閾値を超え且つその状態が所定時間経過した時に上記ミュート部のミュートを解除し、上記ミュート解除後に上記信号レベルが所定閾値を下回った時に上記ミュート部のミュートを有効にするミュート制御部とを有し、
上記制御信号生成部は、上記ミュート部から出力された信号波形からなる上記定常的な信号成分を少なくとも用いて、上記制御信号を生成する請求項１記載の音声信号処理装置。
【請求項６】
上記帯域信号成分抽出部は、入力音声信号から上記第一の周波数帯域の信号波形を抽出する第一のフィルタと、入力音声信号から上記第二の周波数帯域の信号波形を抽出する第二のフィルタと、上記第一のフィルタ通過後の信号波形のエンベロープを検波する第一のエンベロープ検波器と、上記第二のフィルタ通過後の信号波形のエンベロープを検波する第二のエンベロープ検波器とを有し、上記第一のエンベロープ検波器によるエンベロープ検波後の信号波形を上記第一の周波数帯域の信号成分として出力し、上記第二のエンベロープ検波器によるエンベロープ検波後の信号波形を上記第二の周波数帯域の信号成分として出力し、
上記定常信号成分抽出部は、上記第一のエンベロープ検波部によるエンベロープ検波後の信号波形をミュートするミュート部と、上記第一のエンベロープ検波部によるエンベロープ検波後の信号波形の信号レベルが所定閾値を超え且つその状態が所定時間経過した時に上記ミュート部のミュートを解除し、上記ミュート解除後に上記信号レベルが所定閾値を下回った時に上記ミュート部のミュートを有効にするミュート制御部とを有し、当該ミュート部の出力波形を上記定常的な信号成分として出力し、
上記制御信号生成部は、上記ミュート部から出力された信号波形からなる上記定常的な信号成分と、上記第二のエンベロープ検波器によるエンベロープ検波後の信号波形からなる上記第二の周波数帯域の信号成分とを用いて、上記制御信号を生成する請求項２乃至請求項４のうち何れか一項に記載の音声信号処理装置。
【請求項７】
上記制御信号生成部は、上記信号成分の信号レベルの値が規定値より大きい時、当該信号成分から、入力信号レベルに対して出力信号レベルが大きくなる方向に上記信号調整部の入出力特性を変更する上記制御信号を生成する請求項１乃至請求項６のうち何れか一項に記載の音声信号処理装置。
【請求項８】
上記制御信号生成部は、上記信号成分の信号レベルの値が小さくなる方向に変化した時、当該信号成分から、入力信号レベルと出力信号レベルとの関係が一対一に近づく方向へ上記信号調整部の入出力特性を変更する上記制御信号を生成する請求項７記載の音声信号処理装置。
【請求項９】
上記信号調整部は、制御信号により上記入出力特性を段階的若しくは連続的に変更する請求項７記載の音声信号処理装置。
【請求項１０】
上記信号調整部は、制御信号による上記入出力特性の変更にヒステリシスを持たせている請求項７記載の音声信号処理装置。
【請求項１１】
上記信号調整部は、上記音声通話時の受話音声信号に含まれる所定のフォルマント成分を強調するフォルマント調整機能を有し、上記フォルマント調整機能による所定のフォルマント成分の調整処理後の受話音声信号を上記入力信号とする請求項７記載の音声信号処理装置。
【請求項１２】
音声通話時に少なくとも送話音声を集音するための音声集音手段より入力された音声信号から、帯域信号成分抽出部が、所定周波数帯域の信号成分を抽出するステップと、
上記帯域信号成分抽出部が抽出した信号成分の中から、定常信号成分抽出部が、少なくとも定常的な信号成分を抽出するステップと、
上記定常信号成分抽出部が抽出した上記定常的な信号成分を少なくとも用いて、制御信号生成部が、信号調整部の入出力特性を変更する際の制御信号を生成するステップと、
音声通話時の受話音声信号が入力信号となされ、上記制御信号生成部にて生成された制御信号により、信号調整部が、入力信号レベルに対して出力信号レベルを調整する際の入出力特性を変更して上記受話音声信号のレベルを調整するステップと、
を有する音声信号処理方法。
【請求項１３】
少なくとも音声通話のための通信を行う通信部と、
音声通話時の少なくとも送話音声を集音するための音声集音部と、
上記音声通話時の受話音声信号を音響波に変換して出力するための音声放音部と、
上記音声集音部より入力された音声信号から、所定周波数帯域の信号成分を抽出する帯域信号成分抽出部と、
上記帯域信号成分抽出部が抽出した信号成分の中から、少なくとも定常的な信号成分を抽出する定常信号成分抽出部と、
入力信号レベルに対する出力信号レベルを調整するレベル調整機能と、制御信号により上記レベル調整機能におけるレベル調整の際の入出力特性を変更する入出力特性変更機能とを備え、上記音声通話時の受話音声信号が上記入力信号となされる信号調整部と、
上記定常信号成分抽出部が抽出した上記定常的な信号成分を少なくとも用いて、上記信号調整部の上記入出力特性を変更する際の上記制御信号を生成する制御信号生成部とを有し、
上記信号調整部から出力された受話音声信号を上記音声放音部へ供給する通信端末。

【図１】