説明

特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット

【課題】装着者が発話した音声信号から雑音除去して遠隔聴取者に伝達することができるようにするオーディオ・ヘッドセットを提供する。
【解決手段】ヘッドセットは、装着者の頬またはこめかみに接触し内部骨伝導によって伝達される非音響の音声振動を拾い上げて第1の音声信号を出力する生理学的センサ18と、装着者の口から空気によって伝達される音響の音声振動を拾い上げて第2の音声信号を出力する一組のマイクロホン20,22と、第1の音声信号と第2の音声信号とを結合して装着者が発する音声を表す第3の信号を出力するミクサ手段54とを備える。第1の音声信号は、低域通過フィルタ48および高域通過フィルタ50,52の遮断周波数を計算するための手段44、ならびに音声が存在しない確率を計算するための手段64,66で使用する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、マイクロホンとイヤホンの組合せタイプのオーディオ・ヘッドセットに関する。
【背景技術】
【0002】
このようなヘッドセットは、具体的には「ハンズフリー」電話機能などの通信機能において使用してもよく、加えて、ヘッドセットが接続されている先の機器から得られるオーディオ・ソース(たとえば音楽)を聴くのに使用してもよい。
【0003】
通信機能では、困難な点の1つが、マイクロホンが拾い上げる信号、すなわち近接話者(ヘッドセットの装着者)の音声を表す信号の了解度を確実に十分なものにすることである。
【0004】
ヘッドセットは、騒々しい環境(地下鉄、繁華街、列車など)で使用されることがあり、その結果、マイクロホンは、ヘッドセットの装着者からの音声だけでなく、周辺環境からの干渉雑音をも拾い上げる。
【0005】
特に、ヘッドセットが、外部から耳を隔離する密閉型イヤホンを備える場合と同じ種類の場合、またさらにはヘッドセットに「アクティブ・ノイズ・コントロール」が設けられている場合には、ヘッドセットによって、これらの雑音から装着者を保護することができる。対照的に、遠隔聴取者(すなわち、通信チャネルのもう一端にいる相手方)は、マイクロホンが拾い上げる干渉雑音に悩まされることになり、この雑音は、近接話者(ヘッドセットの装着者)からの音声信号に重畳され、またそれに干渉する。
【0006】
具体的には、音声を理解するのに不可欠な何らかの音声ホルマントが、しばしば、毎日の環境で普通に遭遇する雑音成分に埋もれてしまい、この雑音成分は、大部分が低い周波数に集中している。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】FR2792146A1
【特許文献2】WO2007/099222 A1
【発明の概要】
【発明が解決しようとする課題】
【0008】
このような事情で、本発明の全般的な課題は、近接話者が発話した音声を実際に表す音声信号を遠隔話者に伝達することができるようにする効果的な雑音低減を実現することであり、この信号は、そこから、近接話者の環境に存在する外部雑音からの干渉成分を取り除いている。
【課題を解決するための手段】
【0009】
この問題の重要な態様は、自然で了解度のよい音声信号、すなわち歪んでおらず、雑音除去処理によって周波数範囲が削減されていない音声信号を再生する必要があることである。
【0010】
本発明が基づく考えの1つは、ヘッドセットの装着者の頬またはこめかみに取り付けられた生理学的センサによって何らかの音声振動を拾い上げて、音声成分に関連する新規情報にアクセスすることにある。次いでこの情報は、雑音除去のために使用され、また以下で説明する様々な補助機能、具体的には動的フィルタの遮断周波数を計算するために使用される。
【0011】
人が有声音を発しているとき(すなわち、声帯の振動が付随する音声成分を生成しているとき)、この振動は、声帯から咽頭に、また口と鼻の空洞に伝搬し、ここで変調され、増幅され、明瞭に発音される。口、軟口蓋、咽頭、空洞、および鼻腔は、有声音のための共振箱を形成し、その壁は弾性的なので結果として振動し、この振動が内部骨伝導によって伝達され、頬およびこめかみから知覚可能である。
【0012】
まさにその本質から、頬およびこめかみからのこのような音声振動により、周囲環境からの雑音によってほとんど損なわれないという特性が得られる。すなわち、外部雑音が存在する場合、頬またはこめかみの組織がほんのわずか振動し、外部雑音のスペクトル成分がどうであれ、この振動が加えられる。
【0013】
本発明は、頬またはこめかみに直接取り付けられた生理学的センサにより、雑音のないこのような音声振動を拾い上げる実現可能性に依存する。必然的に、このようにして拾い上げられた信号は、正確に発話された「音声」ではない。というのも、音声は、声帯から発生しない成分を含む場合、すなわち、たとえば音声が喉から生じ、口から出る状態で、周波数成分がはるかに豊かである場合には、もっぱら有声音から作成されるものではないからである。さらに、内部骨伝導および皮膚を通した経路が、ある種の音声成分を除去する効果を有する。
【0014】
それにもかかわらず、信号は、発話された音声成分を実際に表しており、雑音の低減および/または他の様々な機能のために効果的に使用することができる。
【0015】
さらに、こめかみまで振動が伝搬する結果として生じるフィルタリングのために、生理学的センサによって拾い上げられた信号は、低周波についてのみ使用可能である。しかし、毎日の環境(街路、地下鉄、電車、・・・)で一般に遭遇する雑音は、大部分は低い周波数に集中しているので、雑音から生じる干渉成分が必然的にない低周波信号を出力する生理学的センサを利用可能にすると(これは、従来型のマイクロホンでは不可能である)、雑音を低減することに関してかなりの利点がある、
【0016】
より正確には、本発明は、ヘッドバンドで互いに接続され、耳を囲むクッションが設けられた外ケースに収容されたオーディオ信号の音再生用のトランスデューサをそれぞれが有するイヤホン、およびヘッドセットの装着者の音声を拾い上げるのに適した少なくとも1つのマイクロホンを従来の方式で備えるマイクロホンとイヤホンの組合せ型のヘッドセットを使用することにより、近接音声信号の雑音除去を実行することを提案する。
【0017】
本発明特有の方式では、このマイクロホンとイヤホンの組合せ型のヘッドセットは、ヘッドセットの装着者が発話した近接音声信号を雑音除去するための手段を備え、この手段は、耳を囲むクッションに組み込まれ、ヘッドセットの装着者の頬またはこめかみに接触して、それと結合し、内部骨伝導によって伝達される非音響の音声振動を拾い上げるのに適したその領域に配置された生理学的センサであって、第1の音声信号を出力する生理学的センサと、ヘッドセットの装着者の口から空気を介して伝達される音響音声振動を拾い上げるのに適した(1つまたは複数の)マイクロホンを備えるマイクロホン・セットであって、第2の音声信号を出力するマイクロホン・セットと、第2の音声信号を雑音除去するための手段と、第1の音声信号と第2の音声信号を結合し、ヘッドセットの装着者が発話した音声を表す第3の音声信号を出力するためのミクサ手段とを備える。
【0018】
好ましくは、このマイクロホンとイヤホンの組合せ型のヘッドセットは、第1の音声信号を、ミクサ手段によって結合する前に濾波するための低域通過フィルタ手段、および/または、第2の音声信号を、雑音除去し、ミクサ手段によって結合する前に濾波するための高域通過フィルタ手段を備える。有利には、低域通過フィルタ手段および/または高域通過フィルタ手段は、遮断周波数が調整可能なフィルタを備え、ヘッドセットは、生理学的センサが出力する信号に応じて動作する遮断周波数計算手段を備える。具体的には、遮断周波数計算手段は、生理学的センサが出力する信号のスペクトル成分を分析するための手段であって、生理学的センサが出力する信号の互いに異なる複数の周波数帯で評価される信号対雑音比の相対レベルに応じて遮断周波数を決定するのに適した手段を備える。
【0019】
好ましくは、第2の音声信号を雑音除去するための手段は、本発明の具体的な一実施形態において、2つのマイクロホンを有するマイクロホン・セットと、そのマイクロホンのうちの一方から出力される信号に遅延を加え、もう一方のマイクロホンが出力する信号から遅延された信号を減算するのに適した結合装置とを使用する、周波数に依存しない雑音低減手段である。
【0020】
具体的には、2つのマイクロホンは、主方向がヘッドセットの装着者の口に向いている直線状のアレイで配列してもよい。
【0021】
やはり好ましくは、特定の周波数雑音低減手段においては、ミクサ手段が出力する第3の音声信号を雑音除去するための手段が提供される。
【0022】
本発明の元の態様によれば、第1および第3の音声信号を入力として受信し、それらの間の相互相関を実行し、相互相関の結果に応じて音声が存在する確率を表す信号を出力として送信する手段が提供される。第3の音声信号を雑音除去するための手段は、音声が存在する確率を表すこの信号を入力として受信し、i)音声が存在する確率を表す信号の値に応じて様々な周波数帯で別々に雑音除去を実行すること、およびii)音声が存在しない場合に全ての周波数帯で最大限の雑音低減を実行することについて、選択的に適したものである。
【0023】
生理学的センサが拾い上げる信号に対応するスペクトルの一部分にある様々な周波数帯において、選択的に等化を実行するのに適した後処理手段を設けてもよい。これらの手段は、周波数帯のそれぞれについて等化利得を決定し、この利得は、周波数領域で考えると、(1つまたは複数の)マイクロホンが出力する信号、および生理学的センサが出力する信号のそれぞれの周波数係数に基づいて計算される。
【0024】
これらはまた、複数の連続した信号フレームにまたがって計算された等化利得の平滑化を実行する。
【0025】
添付図面を参照しながら、本発明の装置の一実施形態の説明が続く。各図面において、同一または機能的に同様の要素を指定するため、図面から図面へと同じ参照番号が使用される。
【図面の簡単な説明】
【0026】
【図1】ユーザの頭の上に置かれた、本発明のヘッドセットの全体図である。
【図2】ヘッドセットの装着者が発話した音声を表す、雑音除去された信号を出力できるようにする信号処理がどのように実行されるのかを説明する全体ブロック図である。
【図3】音声が存在する確率を評価するために使用される相互相関計算を示す振幅/周波数スペクトル図である。
【図4】雑音低減の後で操作される最終の自動等化処理を示す振幅/周波数スペクトル図である。
【発明を実施するための形態】
【0027】
図1では、参照番号10が、本発明のヘッドセット全体の参照図であり、ヘッドバンドによって互いに保持された2つのイヤホン12を備える。イヤホンのそれぞれは、音再生のトランスデューサを収容し、外部から耳を隔離するために挿入された隔離クッション16でユーザの耳の周りを押さえつける密閉された外ケース12から構成されることが好ましい。
【0028】
本発明特有の方式では、ヘッドセットには、ヘッドセットの装着者が発話した音声信号によって生成される振動を拾い上げるための生理学的センサ18が設けられており、この振動は、頬またはこめかみを介して拾い上げることができる。センサ18は、実現可能な最も近接した結合状態でユーザの頬またはこめかみを押さえつけるための、クッション16に組み込まれた加速度計であることが好ましい。具体的には、生理学的センサは、クッションを覆う表皮の内面に配置してもよく、その結果、ヘッドセットが適位置に置かれると、クッション材料が平坦になることから生じるわずかな圧力の効果の下で、生理学的センサがユーザの頬またはこめかみに押さえつけられ、クッションの表皮のみがユーザとセンサの間に挿入される。
【0029】
ヘッドセットはまた、たとえばイヤホン12の外ケースに配置された2つの無指向性のマイクロホン20および22など、マイクロホンのアレイまたはアンテナを備える。これら2つのマイクロホンは、前部マイクロホン20および後部マイクロホン22を備え、これらは、ほぼヘッドセットの装着者の口26に向けられた方向24に沿って配列されるように、互いに対して配置された無指向性のマイクロホンである。
【0030】
図2は、本発明の方法で使用される様々な機能ブロック、および、それらがどのように相互作用するのかを示すブロック図である。
【0031】
本発明の方法は、ソフトウェア手段で実施され、これを細分化して、図2に示す様々なブロック30〜64で図式的に表すことができる。この処理は、マイクロコントローラまたはデジタル信号プロセッサによって実行される適切なアルゴリズムの形で実施される。これらの様々な処理は、説明を明確にするために別々のブロックの形で提示されるが、各要素を共通に実施し、実際には同じソフトウェアで全体として実行される複数の機能に対応する。
【0032】
図2には、生理学的センサ18、ならびに前部および後部の無指向性マイクロホン20および22が示してある。参照番号28は、イヤホンの外ケースの内側に配置された音声再生トランスデューサを示す。これらの様々な要素は、参照番号30のブロックによる処理を受ける信号を伝達し、このブロックは、通信回路(電話回路)を有するインターフェース32に結合してもよく、このインターフェースから、トランスデューサ28によって再生されることになる音声(電話中の遠隔話者からの音声、電話の会話以外での音楽ソース)である入力Eを受信し、このトランスデューサに、近接話者すなわちヘッドセットの装着者からの音声を表す信号である出力Sを送信する。
【0033】
入力Eに現れる再生用の信号はデジタル信号であり、これは、コンバータ34によってアナログ信号に変換され、次いでトランスデューサ28による再生のために増幅器36によって増幅される。
【0034】
近接話者からの音声を表す雑音除去された信号が、生理学的センサ18、ならびにマイクロホン20および22によって拾い上げられたそれぞれの信号に基づいて生成される方法の説明が続く。
【0035】
生理学的センサ18によって拾い上げられた信号は、音声スペクトルの低域の成分(通常は0〜1500ヘルツ(Hz))を主に含む信号である。前述の通り、この信号には必然的に雑音がない。
【0036】
マイクロホン20および22によって拾い上げられた信号は、スペクトルの高域部分(約1500Hz)に対して主に使用されるが、これらの信号は雑音が非常に多く、強力な雑音除去処理を実行して干渉雑音成分を排除することが不可欠である。これらの成分は、環境によっては、マイクロホン20および22によって拾い上げられた音声信号を完全に隠すようなレベルになることがある。
【0037】
処理の第1のステップは、生理学的センサおよび各マイクロホンからの信号に加えられるアンチエコー処理である。
【0038】
トランスデューサ28によって再生される音声は、生理学的センサ18、ならびにマイクロホン20および22によって拾い上げられ、それにより、システムの動作を妨害し、したがって上流部(音源に近い側)で開始時に排除しなければならないエコーを生成する。
【0039】
このアンチエコー処理は、ブロック38、40、および42で実施され、これらブロックのそれぞれが、センサ18、ならびにマイクロホン20および22のうちのそれぞれ1つによって伝達される信号を受信する第1の入力と、トランスデューサ28によって再生された信号(エコー生成信号)を受信する第2の入力とを有し、後続の処理で使用するためにエコーがそこから排除された信号を出力する。
【0040】
一例として、アンチエコー処理は、FR2792146A1(Parrot SA)に記載のアルゴリズムなど、適応アルゴリズム処理によって実行され、より詳細に説明するためにこれを参照する。これは、トランスデューサ28によって再生される信号(すなわち、ブロック38、40、および42に入力として加えられる信号E)と、生理学的センサ18(または、マイクロホン20もしくは22)によって拾い上げられたエコーとの間の線形変換により、トランスデューサ28と生理学的センサ18(または、それぞれマイクロホン20もしくはマイクロホン22)との間の音響結合をモデリングする補償フィルタを動的に規定することにある、自動キャンセリング技法AECである。この変換は、再生された入射信号に適用される適応フィルタを規定し、このフィルタリングの結果が、生理学的センサ18(または、マイクロホン20もしくは22)によって拾い上げられた信号から差し引かれ、それにより音響エコーの大部分を相殺する効果がある。
【0041】
このモデリングは、トランスデューサ28によって再生される信号と、生理学的センサ18(または、マイクロホン20もしくは22)によって拾い上げられた信号との間の相関、すなわち、これら様々な要素を支持するイヤホン12の本体によって構成された結合のインパルス応答の推定量を探すステップに依存する。
【0042】
この処理は、具体的には、アフィン射影アルゴリズム(APA)タイプの適応アルゴリズムによって実行され、これは、急速な収束を確実にし、音声伝達が間欠的で、あるレベルで急速に変化することができる「ハンズフリー・タイプ」の用途によく適合される。
【0043】
有利には、前述のFR2792146A1に記載されているように、可変サンプリング・レートで反復的アルゴリズムが実行される。この技法を用いる場合、フィルタリングの前後で、マイクロホンによって拾い上げられた信号のエネルギー・レベルに応じて、サンプリング間隔μが絶えず変化する。拾い上げられた信号のエネルギーがエコーのエネルギーで占められているとき、この間隔は増大し、逆に、拾い上げられた信号のエネルギーが背景雑音および/または遠隔話者の音声のエネルギーで占められているとき、この間隔は減少する。
【0044】
ブロック38によるアンチエコー処理の後、生理学的センサ18によって拾い上げられた信号は、遮断周波数FCを計算するためのブロック44への入力信号として使用される。
【0045】
以下のステップは、生理学的センサ18からの信号については低域通過フィルタ48を用いて、またマイクロホン20および22によって拾い上げられた信号についてはそれぞれ高域通過フィルタ50、52を用いて、信号フィルタリングを実行することにある。
【0046】
これらのフィルタ48、50、52は、通過帯域と阻止帯域の間で相対的に急激に遷移する、入射インパルス応答タイプのデジタル・フィルタ、すなわち巡回型フィルタであることが好ましい。
【0047】
有利には、これらのフィルタは、遮断周波数が可変であり、ブロック44によって動的に決定される適応フィルタである。
【0048】
これにより、ヘッドセットが使用されている具体的な状態にフィルタリングを適合させることが可能になる。すなわち、多かれ少なかれ発話しているときの話者の音声が高いと、多かれ少なかれ生理学的センサ18と話者の頬またはこめかみなどとの間の結合が密になる。遮断周波数FCは、低域通過フィルタ48、ならびに高域通過フィルタ50および52については同じであることが好ましいが、アンチエコー処理38の後に、生理学的センサ18からの信号から決定される。このために、アルゴリズムが、たとえば0〜2500Hzにわたる範囲にある複数の周波数帯にまたがって信号対雑音比を計算する(最も高い周波数帯、たとえば3000Hz〜4000Hzの範囲でのエネルギー計算によって雑音のレベルが与えられるが、それというのも、生理学的センサ18を構成する各構成部品の特性が与えられている場合に、この範囲では、信号を雑音のみから生成することができることが知られているからである)。選択された遮断周波数は、信号対雑音比が所定の閾値たとえば10デジベル(dB)を超える場合の最大周波数に対応する。
【0049】
以下のステップは、スペクトルのこの部分で雑音除去を実行できるようにする結合装置および位相器56を通過した後に、ブロック54を使用して、生理学的センサ18からの濾波された信号によって与えられるスペクトルの低周波領域とマイクロホン20および22からの濾波された信号によって与えられるスペクトルの高周波部分との両方と、完全なスペクトルを再構成するために混合することにある。この再構成は、いかなる変形も避けるようにミクサ・ブロック54に同期して加えられる、2つの信号を加算することによって実行される。
【0050】
結合装置および位相器56によって雑音低減が実行される方式の、より精密な記述が続く。
【0051】
雑音除去しようと考える信号(すなわち、近接話者からの、スペクトルの高域部分にある信号で、通常は1500Hzを超える周波数成分)は、ヘッドセットのイヤホンのうちの1つの外ケース14に互いに数センチメートル離して配置された2つのマイクロホン20および22から生じる。前述の通り、これら2つのマイクロホンは、それらが規定する方向24が、ほぼヘッドセットの装着者の口26に向かって指すように、互いに対して配置される。その結果、口から発せられる音声信号は前部マイクロホン20に到達し、次いで、遅延して後部マイクロホン22に到達し、したがって位相シフトは実質的に一定であるが、2つのマイクロホン20および22から干渉雑音源が離れている場合、周囲の雑音が位相シフトすることなくマイクロホン20と22の両方によって拾い上げられる(これらのマイクロホンは無指向性のマイクロホンである)。
【0052】
マイクロホン20および22によって拾い上げられた信号における雑音は、後部マイクロホン22からの信号に遅延τを加える位相器58と、前部マイクロホン20から生じる信号から領域信号を差し引くことができるようにする結合装置60とを備える結合装置および位相器56により、(大抵の場合)周波数領域では低減されず、時間領域で低減される。
【0053】
これにより、0≦τ≦τの範囲にわたって、τの値に応じて調整することができる単一の指向性仮想マイクロホンと等価な1次差動マイクロホン・アレイが構成される(ここで、τは、2つのマイクロホン20と22の間の自然の位相シフトに対応する値であり、音の速度によって分割された2つのマイクロホンの間の距離に等しい。すなわち、1センチメートル(cm)の空間に対して約30マイクロ秒(μS)の遅延である)。値がτ=τの場合、カージオイド指向性パターンになり、値がτ=τ/3の場合は、ハイパー・カージオイド・パターンになり、値がτ=0の場合には、双極パターンになる。このパラメータを適切に選択することにより、拡散周囲雑音向けに約6dBの減衰を得ることが可能である。この技法についてより詳細に説明するために、たとえば以下を参照してもよい。
【0054】
[1]M.BuckおよびM.Rossler著「First order differential microphone arrays for automotive applications」、Proceedings of the 7th International Workshop on Acoustic on Echo and Noise Control (IWAENC)、ダルムシュタット、2001年9月10〜13日。
【0055】
ミクサ手段54から出力される信号全体(スペクトルの高域および低域部分)に実行される処理の説明が続く。
【0056】
この信号は、ブロック62により、周波数雑音低減処理を受ける。
【0057】
この周波数雑音低減は、生理学的センサ18によって拾い上げられた信号に音声がない確率pを評価することにより、音声が存在する場合または存在しない場合で別々に実行されることが好ましい。
【0058】
有利には、音声が存在しないこの可能性は、生理学的センサが提供する情報から導かれる。
【0059】
前述の通り、このセンサが伝達する信号は、ブロック44によって決定された遮断周波数FCに至るまで非常に良好な信号対雑音比を示す。しかし、遮断周波数を超えても、その信号対雑音比は依然として良好なままであり、しばしばマイクロホン20および22からの信号対雑音比よりも良好である。センサからの情報はブロック64によって使用され、このブロック64は、低域通過フィルタリング48に先立って、ミクサ・ブロック54によって伝達された結合信号と、生理学的センサからの濾波されていない信号との間の周波数相関を計算する。
【0060】
したがって、たとえばFC〜4000Hzの各周波数f、および各フレームnについて、以下の計算がブロック64によって実行される。
【0061】
【数1】

ここで、Smix(f)およびSaac(f)は、フレームnについての周波数の(複素)ベクトル表現であり、それぞれ、ミクサ・ブロック54によって伝達される結合信号、および生理学的センサ18からの信号のものである。
【0062】
音声が存在しない確率を評価するために、このアルゴリズムは、雑音だけが存在する(音声が存在しないときに当てはまる状況)周波数を探す。すなわち、ミクサ・ブロック54によって伝達される信号のスペクトル図において、ある高調波は雑音に埋もれるが、生理学的センサ18からの信号においてはより目立つ。
【0063】
前述の数式を使用して相関を計算することによって周波数領域で結果が生じるが、図3に一例を示す。
【0064】
相関計算における各ピークP、P、P、P・・・は、ミクサ・ブロック54によって伝達される結合信号と、生理学的センサ18からの信号との間に強い相関を示し、その結果、このように相関のとれた周波数が現れることにより、両方の周波数で恐らくは音声が存在することが示される。
【0065】
音声が存在しない確率を得るために(ブロック66)、以下の補完値を考えてみる。
AbsProba(n,f)=
1−InterCorrelation(n,1)/normalization_coefficient
【0066】
正規化係数の値により、0〜1の範囲の値を得るために、相関の値に応じて確率分布を調整することができる。
【0067】
このようにして得られた音声が存在しない確率pはブロック62に加えられ、このブロック62は、ミクサ・ブロック54によって伝達された信号に作用して、音声が存在しない確率についての所与の閾値に対して選択的な方式で周波数雑音低減を実行する。すなわち、
−音声が存在しない可能性がある場合、周波数帯の全てに周波数に雑音低減が適用される。すなわち、信号の各成分の全てに、同じように最大低減利得が適用される(それというのも、このような環境下では、任意の有用な成分が含まれないことが多いからである)。
−対照的に、音声が存在する可能性がある場合、たとえば、WO2007/099222 A1 (Parrot)に記載の方式に相当する従来の方式の用途において、雑音低減は、様々な周波数帯で音声が存在する確率の値pに応じて選択的に適用される周波数雑音低減である。
【0068】
前述のシステムにより、優れた総合性能を得ることが可能になり、通常、近接話者からの音声信号において、およそ30dB〜40dB程度の雑音低減が実現される。全ての干渉雑音が排除されるので、特に、最も侵入しやすい雑音(列車、地下鉄など)は低周波に集中しているが、遠隔聴取者(すなわち、ヘッドセットの装着者が通信している相手側)に、もう一方の当事者(ヘッドセットの装着者)が静かな部屋にいるような印象を与える。
【0069】
最後に、ブロック68により、特にスペクトルの低域部分において信号に最終等化を施すことは有利である。
【0070】
生理学的センサ18によって頬またはこめかみから拾い上げられる低周波成分は、ユーザの口から生じる音の低周波成分とは異なるが、それというのも、これは、口から数センチメートル離れて配置されたマイクロホンから拾い上げられることになるか、または聴取者の耳から拾い上げられることになるからである。生理学的センサおよび前述のフィルタリングを使用することにより、確かに、信号/雑音比に関して非常に良好であるが、幾分張りのない不自然な音質を聴取者に提供する信号を得ることになる可能性がある。
【0071】
この難題を軽減するために、選択的に調整される利得を使用して、生理学的センサによって拾い上げられた信号に対応するスペクトルの領域内の様々な周波数帯に出力信号の等化を実行することが有利である。等化は、濾波する前に、マイクロホン20および22によって伝達される信号から自動的に実行してもよい。
【0072】
図4には、口から数センチメートル離れて拾い上げられるマイクロホンの信号MICと比較して、生理学的センサ18が生成する信号ACCの周波数領域(ただしフーリエ変換後)での一例が示してある。
【0073】
生理学的センサによって拾い上げられる信号のレンダリングを最適化するために、様々な利得G、G、G、G、・・・が、スペクトルの低周波部分の様々な周波数帯に適用される。
【0074】
これらの利得は、生理学的センサ18とマイクロホン20および/または22との両方によって、共通の周波数帯で拾い上げられる信号を比較することによって評価される。
【0075】
より精密には、アルゴリズムは、これら2つの信号のそれぞれのフーリエ変換を計算し、一連の周波数係数(dBで表現される)NormPhysioFreq_dB(i)、およびNormMicFreq_dB(i)をもたらし、生理学的センサからの信号のi番目のフーリエ係数の絶対値または「ノルム」、およびマイクロホン信号のi番目のフーリエ係数のノルムにそれぞれ対応する。
【0076】
ランクiの各周波数係数において、差
DifferenceFreq_dB(i)=
NormPhysioFreq_dB(i)−NormMicFreq_dB(i)が正である場合、適用される利得は、1未満(dBでは負)になり、逆に、差が負である場合には、適用される利得は1よりも大きい(dBでは正)。
【0077】
利得がそのように適用される場合、特に音声以外の音を扱うときには、あるフレームから別のフレームまで差が正確に一定になることはなく、したがって音質の等化において変動が大きくなる。このような変動を避けるために、アルゴリズムは、差の平滑化を実行し、それにより等化を改善できるようにする。すなわち、
Gain_dB(i)=λ.Gain_dB(i)−(1−λ)DifferenceFreq_dB(i)
【0078】
係数が1に近づくと、i番目の係数の利得を計算する際に、現在のフレームからの情報を考慮することが少なくなる。逆に、係数λが0に近づくと、瞬時の情報を考慮することが多くなる。実際には、平滑化を有効にするために、1に近いたとえば0.99のλの値が選ばれる。次いで、生理学的センサからの信号の各周波数帯に適用される利得は、i番目の修正された周波数に対して以下の通りである。すなわち、
NormPhysioFreq_dB_corrected(i)=
NormPhysioFreq_dB(i)+Gain_dB(i)
【0079】
等化アルゴリズムが使用するのはこのノルムである。
【0080】
様々な利得を適用することには、スペクトルの低域部分で音声信号をより自然にする働きがある。静かな環境でこのような等化を加えるとき、スペクトルの低域部分での基準マイクロホン信号と生理学的センサによって生成される信号との間の差が事実上感知できなくなるという主観的な研究を示してきた。

【特許請求の範囲】
【請求項1】
マイクロホンとイヤホンの組合せタイプのオーディオ・ヘッドセット(10)であって、
−オーディオ信号の音再生のためのトランスデューサ(28)をそれぞれが備える2つのイヤホン(12)と、
−前記ヘッドセットの装着者の頬またはこめかみに接触して、それに結合し、内部骨伝導によって伝達される非音響の音声振動を拾い上げるのに適した生理学的センサ(18)であって、第1の音声信号を出力する生理学的センサ(18)と、
−前記ヘッドセットの前記装着者の口から空気によって伝達される音響の音声振動を拾い上げるのに適した少なくとも1つのマイクロホン(20、22)を備えるマイクロホン・セットであって、第2の音声信号を出力するマイクロホン・セットと、
−前記第1の音声信号と前記第2の音声信号を結合し、前記ヘッドセットの前記装着者が発する音声を表す第3の音声を出力するためのミクサ手段(54)とを備え、
前記ヘッドセットは、
−前記生理学的センサ(18)が、前イヤホン(12)のうちの1つの外ケース(14)の耳を囲むクッション(16)に組み込まれ、
−マイクロホンの前記セットが、前記イヤホン(12)のうちの1つの前記外ケース(14)に配置された2つのマイクロホン(20、22)を備え、
−前記2つのマイクロホン(20、22)が、前記ヘッドセットの前記装着者の前記口(26)に向いている主方向(24)で直線状のアレイを形成するように配列され、
−前記第2の音声信号の周波数に依存しない雑音を低減させるための手段(56)が設けられ、前記手段が、前記マイクロホンのうちの1つによって出力される信号に遅延を加え、前記ヘッドセットの前記装着者が発する近接音声信号から雑音を取り除くように、もう一方のマイクロホンによって出力される信号を前記遅延信号から差し引くのに適した結合装置を備えることを特徴とするオーディオ・ヘッドセット。
【請求項2】
−前記第1の音声信号を、前記ミクサ手段によって結合される前に前記濾波するための低域通過フィルタ手段(48)、および/または、前記第2の音声信号を、前記ミクサ手段によって雑音除去され結合される前に濾波するための高域通過フィルタ手段(50、52)であって、これらの低域通過フィルタ手段および/または高域通過フィルタ手段(48、50、52)が調整可能な遮断周波数のフィルタを備える、低域通過フィルタ手段および/または高域通過フィルタ手段と、
−前記生理学的センサによって出力される前記信号に応じて動作する遮断周波数計算手段(44)とをさらに備える、請求項1に記載のオーディオ・ヘッドセット。
【請求項3】
前記遮断周波数計算手段(44)が、前記生理学的センサが出力する前記信号のスペクトル成分を分析するための手段であって、前記生理学的センサが出力する前記信号の互いに異なる複数の周波数帯で評価される信号対雑音比の相対レベルに応じて前記遮断周波数を決定するのに適した手段を備える、請求項2に記載のオーディオ・ヘッドセット。
【請求項4】
前記ミクサ手段が出力する前記第3の音声信号を雑音除去し、周波数雑音低減によって動作するための手段(62)をさらに備える、請求項1に記載のオーディオ・ヘッドセット。
【請求項5】
前記第1および第3の音声信号を入力として受信し、それらの間の相互相関を実行し、前記相互相関の結果に応じて音声が存在する確率を表す信号を出力として送信する手段をさらに備える、請求項4に記載のオーディオ・ヘッドセット。
【請求項6】
前記第3の音声信号を雑音除去するための前記手段(62)が、音声が存在する確率を表す前記信号を入力として受信し、
i)音声が存在する確率を表す前記信号の値に応じて様々な周波数帯で別々に雑音除去を実行すること、および
ii)音声が存在しない場合に全ての周波数帯で最大限の雑音低減を実行することについて、選択的に適したものである、請求項5に記載のオーディオ・ヘッドセット。
【請求項7】
前記生理学的センサが拾い上げる信号に対応するスペクトルの一部分にある様々な周波数帯において選択的に等化を実行するのに適した後処理手段(64)をさらに備える、請求項1に記載のオーディオ・ヘッドセット。
【請求項8】
前記後処理手段が、前記周波数帯のそれぞれについて等化利得を決定するのに適しており、前記利得は、周波数領域で考えると、前記(1つまたは複数の)マイクロホンが出力する前記信号、および前記生理学的センサが出力する前記信号のそれぞれの周波数係数に基づいて計算される、請求項7に記載のオーディオ・ヘッドセット。
【請求項9】
前記後処理手段がまた、複数の連続した信号フレームにまたがって、前記計算された等化利得の平滑化を実行するのに適している、請求項8に記載のオーディオ・ヘッドセット。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate