説明

電話機、制御方法、及びプログラム

【課題】送話器によって集音された音声の周波数特性をイコライジングする。
【解決手段】電話機100の使用者が話をしている最中に送話器160によって集音された音声の周波数帯域毎の音声パワーに基づいて、送話器160によって集音される周波数特性を調整するための初期パラメータを調整してイコライジングパラメータを生成し、当該イコライジングパラメータを用いて送話器160によって集音される音声の周波数特性をイコライジングするイコライジング部120を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電話機、制御方法、及びプログラムに関する。特に、本発明は、送話器によって集音された音声の周波数特性をイコライジングする電話機、当該電話機を制御する制御方法、並びに当該電話機用のプログラムに関する。
【背景技術】
【0002】
携帯電話の送話信号は、使用可能な周波数帯域内においてその感度が規格されている。そのため、携帯電話は、それを基にイコライザー等で調整を実施し、送話音の周波数特性を生成している。しかしながら、相手への送出する音声の明瞭性を上げるには限界があり、単純にレベルを上げれば、周囲騒音も相手へ伝わるため明瞭性のある送話音声に調整するのは容易ではなかった。
【0003】
このような背景に鑑みて成された技術としては、周囲騒音の音声への混入を軽減すると共に、周囲騒音の少ない静かな場所での通話音の音質を損なうことなく伝達できる技術が知られている(例えば、特開平08−320154号公報)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開平08−320154号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術は、使用者が発する音声の周波数帯域に応じて、送話信号の周波数特性を調整することができない。そのため、特許文献1に記載の技術によっては、使用者の音声の明瞭性を上げるのに限界がある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の第1の形態によると、送話器によって集音された音声の周波数特性をイコライジングする電話機であって、当該電話機の使用者が話をしている最中に送話器によって集音された音声の周波数帯域毎の音声パワーに基づいて、送話器によって集音される音声の周波数特性をイコライジングするイコライジング部を備える。
【0007】
本発明の第2の形態によると、送話器によって集音された音声の周波数特性をイコライジングする電話機を制御する制御方法であって、当該電話機の使用者が話をしている最中に送話器によって集音された音声の周波数帯域毎の音声パワーに基づいて、当該音声の周波数特性をイコライジングするイコライジング段階を備える。
【0008】
本発明の第3の形態によると、送話器によって集音された音声の周波数特性をイコライジングする電話機用のプログラムであって、電話機を、当該電話機の使用者が話をしている最中に送話器によって集音された音声の周波数帯域毎の音声パワーに基づいて、当該音声の周波数特性をイコライジングする周波数特性イコライジング部として機能させる。
【0009】
なおまた、上記のように発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となり得る。
【発明の効果】
【0010】
以上の説明から明らかなように、この発明によっては、既知の技術と比較して、使用者の音声をより明瞭にした送話音声を生成することができる。
【図面の簡単な説明】
【0011】
【図1】一実施形態に係る携帯電話100のハードウェア構成の一例を示す図である。
【図2】携帯電話100の動作フローの一例を示す図である。
【図3】分割された周波数帯域毎のパワー計算結果の一例を示す図である。
【図4】図3に示すパワーを平滑化させたイコライジングパラメータ生成用に用いる参考特性の一例を示す図である。
【図5】マイクロフォン160によって集音される周波数特性を調整するための初期パラメータの一例を示す図である。
【図6】DSP120で生成されたイコライジングパラメータの一例を示す図である。
【図7】携帯電話100の動作フローの他の例を示す図である。
【図8】周囲騒音を含む使用者の音声パワー特性の一例と、周囲騒音のみの騒音パワー特性の一例を示す図である。
【図9】図8に示す各パワーを平滑化した特性を示す図である。
【図10】イコライジングパラメータ生成用に用いる参考特性を示す図である。
【発明を実施するための形態】
【0012】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は、特許請求の範囲にかかる発明を限定するものではなく、また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0013】
図1は、一実施形態に係る携帯電話100のハードウェア構成の一例を示す。携帯電話100は、無線通信を利用した、持ち歩ける電話機である。より具体的に説明すると、携帯電話100は、マイクロフォン160によって集音された音声の周波数特性をイコライジングする機能を有する。なおまた、携帯電話100は、この発明における「電話機」の一例であってよい。また、マイクロフォン160は、この発明における「送話器」の一例であってよい。
【0014】
携帯電話100は、CPU(Central Processing Unit)110、DSP(Digital Signal Processor)120、メモリ130、ディスプレイ140、キーボード150、マイクロフォン160、アンプ170、ADC(Analog Digital Converter)180、DAC(Digital Analog Converter)190、アンプ200、及びスピーカー210を備える。なおまた、DSP120は、この発明における「イコライジング部」の一例であってよい。
【0015】
CPU110は、携帯電話100を構成する部品の一つで、DSP120、メモリ130、ディスプレイ140、及びキーボード150の制御やデータの計算、加工を行う装置である。より具体的に説明すると、CPU110は、DSP120、メモリ130、ディスプレイ140、及びキーボード150とそれぞれ電気的に接続されている。そして、CPU110は、携帯電話100全体を制御すると共に通話・通信に関連する種々の演算処理に関係する処理・指示を行い、また、着信音・音声・送話感度等の音量を切り替え指示の処理を行う機能を有する。
【0016】
DSP120はCPU110に接続されており、送受話部での音声信号処理、着信音等のメロディーデータや音楽データの信号処理等を行い、録音したデータの周波数帯域毎のパワー計算ができる機能を有するものとする。DSP120は、CPU110からの指示を受けて送話音声信号制御を行う。また、DSP120は周波数帯域毎にレベル制御ができる一種のイコライザー機能を有しているものとする。
【0017】
メモリ130はCPU110とDSP120に接続されており、CPU110やDSP120での演算した結果等のデータや種々の機能設定状態をデータに変換して格納しており、着信音メロディーデータや音楽データを格納しており、また、録音したデータ等も格納可能とする。
【0018】
ディスプレイ140はCPU110に接続されており、機能設定時の選択画面、機能の設定状況等を表示する。
【0019】
キーボード150はCPU110に接続されており、発呼、通話開始・終了、メニュー選択時のキー入力等に使用者が操作するものであり、本機能で必要となる特定の機能が所定のキーにアサインされているものとする。
【0020】
ADC180は、マイクロフォン160で集音したアナログ信号をデジタル信号に変換する。アンプ170はマイクロフォン160に接続されており、送話音声信号を増幅する。
【0021】
DAC190はDSP120に接続されており、DSP120から出力された音声・音楽のデジタル信号をアナログ信号に変換を行う。アナログ信号に変換された音声・音楽はアンプ200経由し増幅され、スピーカー210から出力される。
【0022】
図2は、携帯電話100の動作フローの一例を示す。図3は、分割された周波数帯域毎のパワー計算結果の一例を示す。図4は、図3に示すパワーを平滑化させたイコライジングパラメータ生成用に用いる参考特性の一例を示す。図5は、マイクロフォン160によって集音される周波数特性をイコライジングするための初期パラメータの一例を示す。図6は、DSP120で生成されたイコライジングパラメータの一例を示す。携帯電話100の動作について、図1から6を参照して説明する。騒音の少ない静かな環境で使用した場合に関して説明する。
【0023】
先ず、待ち受け状態から、機能としてメニューにある送話音声制御機能がキーボード150で選択されると、本機能が動作するものとする。
【0024】
次に待ち受け状態から通話状態に入ると、DSP120は、CPU110からの指示を受けて、マイクロフォン160から集音した使用者の音声をある一定期間繰り返しメモリ130に録音する(S101)。ここで使用者の音声を一定期間繰り返し録音とあるが、周囲騒音も録音されるものとする。指示に従い、マイク用音孔を通り、マイクロフォン160から集音された使用者の音声は、アンプ170を通り増幅され、ADC180を通り、DSP120でデータ圧縮等が行われメモリ130に収集される。この時点では、使用者の送話音声はイコライジングをしていない状態で、相手へ送出されるものとする。
【0025】
そして、DSP120は、CPU110からの指示を受けて、メモリ130に格納された使用者の音声データを各周波数帯域に分割し、分割された帯域毎のパワー計算を行う(S102)。この動作もある一定期間繰り返し行うものとする。
【0026】
そして、CPU110はDSP120で先ほど算出した結果を基に、DSP120にて、送話周波数特性のイコライジングに使用するイコライジングパラメータ生成を指示する。DSP120はイコライジングパラメータを生成する(S103)。図4に示すように、平滑化したデータを基に、しきい値αより大きい帯域は、大きい分レベルをアップさせ、小さい帯域は、小さい分レベルをダウンさせ、イコライジングパラメータを生成する。具体的には大きい場合は図4の帯域4で説明するとA分、しきい値αより大きいので、図6の帯域4はA分上げるように調整される。逆に小さい場合は図4の帯域2で説明するとB分、しきい値αより小さいので、図6の帯域2はB分下がるように調整される。
【0027】
そして、DSP120は、CPU110からの指示を受けて、イコライジングパラメータを適用してイコライジング処理を行って、使用者の音声の特徴に合わせた使用者の音声帯域部を強調した音声を送出する(S104)。
【0028】
ステップS101で使用者の音声をある一定期間繰り返しメモリ130に録音するとあるが、ここで、再度録音されるとステップS101からステップS104を繰り返し、順次イコライジングパラメータが更新され、常時に使用者の音声の特徴に合わせた使用者の音声帯域部が強調された音声が送出される。
【0029】
図7は、携帯電話100の動作フローの他の例を示す。図8は、周囲騒音を含む使用者の音声パワー特性の一例と、周囲騒音のみの騒音パワー特性の一例を示す。図9は、図8に示す各パワーを平滑化した特性を示す。図10は、イコライジングパラメータ生成用に用いる参考特性を示す。次に非常に騒音が大きい環境での使用を考慮した場合に関して、説明をする。
【0030】
図2の動作フローの動作と同様、先ず、待ち受け状態から、機能としてメニューにある送話音声制御機能がキーボード150で選択される。次に待ち受け状態から通話状態に入ると、DSP120は、CPU11からの指示を受けて、マイクロフォン160から集音した使用者の音声をある一定期間繰り返しメモリ130に録音する(S201)。ここで使用者の音声を一定期間繰り返し録音とあるが、非常に騒音が大きい環境のため、使用者の音声と同時に周囲騒音も録音されるものとする。指示に従い、マイク用音孔を通り、マイクロフォン160から集音された使用者の音声及び周囲騒音は、アンプ170を通り増幅され、ADC180を通り、DSP120でデータ圧縮等が行われメモリ130に収集される。この時点では、送話音声はイコライジングされていない状態で、相手へ送出されるものとする。
【0031】
そして、使用者が騒音が大きいと感じた場合や通話相手に騒音で聞き取り難いと言われた場合に、使用者が話さない状態で、キーボード150にあらかじめ配置しておいた特定キーを長押しすることで(携帯電話によくあるマナーモード時設定で利用するキー長押しのイメージ)、長押ししている間に、周囲騒音がマイク用音孔を通り、マイクロフォン160で集音され、アンプ170を通り増幅され、ADC180を通り、DSP120でデジタル信号処理を行いメモリ130に周囲騒音のみのデータとして収集される(S202)。
【0032】
そして、DSP120は、CPU110からの指示を受けて、メモリ130に格納された周囲騒音を含む使用者の音声データ及び周囲騒音データを各周波数帯域に分割し、分割された帯域毎のパワー計算を行う(S203)。
【0033】
そして、DSP120は、CPU110からの指示を受けて、周囲騒音を含む使用者の音声データのパワー算出値が周囲騒音のみのデータのパワー算出値より、全帯域で同等以上であるか判定をする(S204)。判定の結果、全帯域同等以上ではないときは(S204:No)、新たな周囲騒音を含む使用者の音声データが算出されるのを待ち、再度ステップS204に入る。
【0034】
全帯域同等以上と判定されたら(S204:Yes)、DSP120は、先ほど算出した結果を基に、送話周波数特性のイコライジングに使用するイコライジングパラメータを生成する(S205)。先ず、DSP120は、イコライジングパラメータを生成するのに用いる参考特性を生成する。調整参考特性は、周囲騒音を含む使用者の音声データが周囲騒音データより大きい場合(具体的には図9の帯域3や帯域4)、大きい分レベルアップをさせる。また、周囲騒音を含む使用者の音声データと周囲騒音データが同等レベルでかつ、基準線より大きいレベルの帯域は(具体的には図9の帯域1や帯域2)、しきい値βより大きい分レベルをダウンさせる。また、周囲騒音を含む使用者の音声データと周囲騒音データが同等レベルでかつ、しきい値βより小さいレベルの帯域は(具体的には図9の帯域8や帯域9)、特に調整をしない。そして、DSP120はイコライジングパラメータを生成する。イコライジングパラメータを生成する手順は騒音の少ない静かな環境で使用した場合と同様、参考特性からしきい値αより大きい帯域は、大きい分レベルをアップさせ、小さい帯域は、小さい分レベルをダウンさせ、パラメータを生成するものとする。
【0035】
そして、DSP120は、CPU11からの指示を受けて、生成したイコライジングパラメータを適用してイコライジングを行い、周囲騒音のレベルが下げ、使用者の音声部のみ強調した音声が送出される。
【0036】
上記のように、携帯電話100で送話音声を使用者の音声帯域に合わせたイコライジングパラメータを生成し、使用することでより聞こえやすい明瞭性のある音声を相手へ伝えることが可能になる。
【0037】
以上説明したように、本発明においては、以下に記載するような効果を奏する。第1の効果は、携帯電話100において、マイクロフォン160で音声を集音し、その集音した音声を各周波数帯域に分割し、分割された帯域毎のパワーを基に送話周波数特性を調整し、音声送出時にそのデータを用いてパラメータとして補正するように制御し、相手へ送出することにより、使用者に合わせた明瞭性のある送話音声を提供することができる。
【0038】
第2の効果は、携帯電話100において、マイクロフォン160で音声及び周囲騒音を集音し、その集音したデータを各周波数帯域に分割し、分割された帯域毎のパワーを基に送話周波数特性を調整し、音声送出時にそのデータを用いてパラメータとして補正するように制御し、相手へ送出することにより、周囲騒音の影響を受けにくい、明瞭性のある送話音声を提供することができる。
【0039】
本発明の他の実施例として、その基本的構成は上記の通りであるが、マイクロフォン160を指向性マイクロフォンにすることで、通話者の口元に指向性を持たせることで、より使用者の音声の特徴を明確に録音が可能となり、効果向上が可能である。
【0040】
また、2つのマイクロフォンを搭載し、一つは音声のみ集音するマイクロフォンともう一つは極力音声のみ集音するマイクロフォンから離した位置に実装をする周囲騒音のみ集音するマイクロフォンと用途を分けて実装することで、周囲騒音と使用者の音声を分離して、パラメータを計算することで、より明瞭性のある音声を送信することができ、効果向上も可能である。
【0041】
また、動画撮影時の音声録音やボイスレコーダーの音声録音時でも同様な機能を用いれば、明瞭性のある音声を録音可能となる。
【0042】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は、上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【符号の説明】
【0043】
100 携帯電話
110 CPU
120 DSP
130 メモリ
140 ディスプレイ
150 キーボード
160 マイクロフォン
170 アンプ
180 ADC
190 DAC
200 アンプ
210 スピーカー

【特許請求の範囲】
【請求項1】
送話器によって集音された音声の周波数特性をイコライジングする電話機であって、
当該電話機の使用者が話をしている最中に前記送話器によって集音された音声の周波数帯域毎の音声パワーに基づいて、前記送話器によって集音される音声の周波数特性をイコライジングするイコライジング部
を備える電話機。
【請求項2】
前記イコライジング部は、当該電話機の使用者が話をしている最中に前記送話器によって集音された音声の周波数帯域毎の音声パワーに基づいて、前記送話器によって集音される周波数特性を調整するための初期パラメータを調整してイコライジングパラメータを生成し、当該イコライジングパラメータを用いて前記送話器によって集音される音声の周波数特性をイコライジングする
請求項1に記載の電話機。
【請求項3】
前記イコライジング部は、当該電話機の使用者が話をしている最中に前記送話器によって集音された音声の周波数帯域毎の音声パワーと、当該音声パワーのパワーレベルに対する所定のしきい値との関係に基づいて、前記初期パラメータを調整して前記イコライジングパラメータを生成するための調整値を算出する
請求項2に記載の電話機。
【請求項4】
前記イコライジング部は、当該電話機の使用者が話をしていない最中に前記送話器によって集音された騒音の周波数帯域毎の騒音パワーに更に基づいて、前記送話器によって集音される音声の周波数特性をイコライジングする
請求項1から3のいずれか一項に記載の電話機。
【請求項5】
前記イコライジング部は、前記音声パワー及び前記騒音パワーのパワーレベルの差と、これら各パワーレベルに対する所定のしきい値との関係に基づいて、当該電話機の使用者の音声のみを抽出し、当該使用者の音声の周波数帯域毎の使用者音声パワーに基づいて、前記送話器によって集音される周波数特性を調整するための初期パラメータを調整してイコライジングパラメータを生成し、当該イコライジングパラメータを用いて前記送話器によって集音される音声の周波数特性をイコライジングする
請求項4に記載の電話機。
【請求項6】
送話器によって集音された音声の周波数特性をイコライジングする電話機を制御する制御方法であって、
当該電話機の使用者が話をしている最中に前記送話器によって集音された音声の周波数帯域毎の音声パワーに基づいて、当該音声の周波数特性をイコライジングするイコライジング段階
を備える制御方法。
【請求項7】
送話器によって集音された音声の周波数特性をイコライジングする電話機用のプログラムであって、前記電話機を、
当該電話機の使用者が話をしている最中に前記送話器によって集音された音声の周波数帯域毎の音声パワーに基づいて、当該音声の周波数特性をイコライジングする周波数特性イコライジング部
として機能させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−195813(P2012−195813A)
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2011−58972(P2011−58972)
【出願日】平成23年3月17日(2011.3.17)
【出願人】(390010179)埼玉日本電気株式会社 (1,228)
【Fターム(参考)】