集積回路装置及び音声入力装置、並びに、情報処理システム
【課題】外形が小さく、かつ、精度の高い雑音除去機能を有する音声入力素子の実現が可能な集積回路装置、及び、音声入力装置、並びに、情報処理システムを提供すること。
【解決手段】第1のマイクロフォンを構成する第1の振動膜714−1と、第2のマイクロフォンを構成する第2の振動膜714−2と、前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路720と、を含む配線基板1200’を有することを特徴とする集積回路装置である。
【解決手段】第1のマイクロフォンを構成する第1の振動膜714−1と、第2のマイクロフォンを構成する第2の振動膜714−2と、前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路720と、を含む配線基板1200’を有することを特徴とする集積回路装置である。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、集積回路装置及び音声入力装置、並びに、情報処理システムに関する。
【背景技術】
【0002】
電話などによる通話や、音声認識、音声録音などに際しては、目的の音声(ユーザの音声)のみを収音することが好ましい。しかし、音声入力装置の使用環境では、背景雑音など目的の音声以外の音が存在することがある。そのため、雑音を除去する機能を有する音声入力装置の開発が進んでいる。
【0003】
雑音が存在する使用環境で雑音を除去する技術として、マイクロフォンに鋭い指向性を持たせること、あるいは、音波の到来時刻差を利用して音波の到来方向を識別して信号処理により雑音を除去する方法が知られている。
【0004】
また、近年では、電子機器の小型化が進んでおり、音声入力装置を小型化する技術が重要になっている。
【特許文献1】特開平7−312638号公報
【特許文献2】特開平9−331377号公報
【特許文献3】特開2001−186241号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
マイクロフォンに鋭い指向性を持たせるためには、多数の振動膜を並べる必要があり、小型化は困難である。
【0006】
また、音波の到来時刻差を利用して音波の到来方向を精度よく検出するためには、複数の振動膜を、可聴音波の数波長分の1程度の間隔で設置する必要があるため、小型化は困難である。
【0007】
本発明のいくつかの態様の目的は、外形が小さく、かつ、精度の高い雑音除去機能を有する音声入力素子(マイク素子)の実現が可能な集積回路装置、及び、音声入力装置、並びに、情報処理システムを提供することにある。
【課題を解決するための手段】
【0008】
(1)本発明は、
第1のマイクロフォンを構成する第1の振動膜と、
第2のマイクロフォンを構成する第2の振動膜と、
前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路と、
を含む配線基板を有することを特徴とする。
【0009】
第1の振動膜、前記第2の振動膜、差分信号生成回路は基板内に形成されていても良いし、配線基板上にフリップチップ実装等により実装されていてもよい。
【0010】
配線基板は半導体基板でも良いし、ガラスエポキシ等の他の回路基板等でもよい。
【0011】
第1の振動膜および前記第2の振動膜を同一基板上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。
【0012】
差分信号生成回路は2つのマイクのゲインバランスを調整する機能を有するように構成してもよい。これにより、両マイク間のゲインばらつきを基板毎に調整して出荷することができる。
【0013】
本発明によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理で、雑音成分が除去された音声を示す信号を生成することができる。
【0014】
また本発明によると、高密度実装により外形が小さく、かつ、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。
【0015】
なお、本発明に係る集積回路装置は、接話型の音声入力装置の音声入力素子(マイク素子)として適用することができる。このとき、集積回路装置は、前記第1及び第2の振動膜が、前記差分信号に含まれる前記雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す音声強度比よりも小さくなるように配置されていてもよい。このとき、雑音強度比は雑音の位相差成分に基づく強度比であってもよく、音声強度比は入力音声の振幅成分に基づく強度比であってもよい。
【0016】
なお、この集積回路装置(半導体基板)は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。また、振動膜については無機圧電薄膜、あるいは有機圧電薄膜を使用して、圧電効果により音響−電気変換するようなものであっても構わない。
【0017】
(2)この集積回路装置は、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜および前記差分信号生成回路は、前記半導体基板に形成されることを特徴とする。
【0018】
(3)この集積回路装置は、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜は前記半導体基板に形成され、前記差分信号生成回路は、前記半導体基板上にフリップチップ実装されることを特徴とする。
【0019】
前記第1の振動膜および前記第2の振動膜を同一の半導体基板上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。
【0020】
フリップチップ実装とは、IC(Integration circuit)素子又はICチップの回路面
を基板に対向させて一括でダイレクトに電気接続する実装方法であり、チップ表面と基板とを電気的に接続する際、ワイヤ・ボンディングのようにワイヤによって接続するのではなく、アレイ状に並んだバンプと呼ばれる突起状の端子によって接続するため、ワイヤ・ボンディングに比べて実装面積を小さくできる。
【0021】
(4)この集積回路装置は、
前記第1の振動膜、および前記第2の振動膜、および前記差分信号生成回路は、前記配線基板上にフリップチップ実装されることを特徴とする。
【0022】
(5)この集積回路装置は、
前記配線基板は半導体基板であって、
前記差分信号生成回路は、半導体基板上に形成され、前記第1の振動膜、および前記第2の振動膜は、前記半導体基板上にフリップチップ実装されることを特徴とする。
【0023】
(6)この集積回路装置は、
前記第1及び第2の振動膜の中心間距離は、5.2mm以下であることを特徴とする。
【0024】
(7)この集積回路装置は、
前記振動膜を、SN比が約60デシベル以上の振動子で構成してもよい。
例えばSN比が60デシベル以上の振動子で構成してもよいし、60±αデシベル以上の振動子で構成してもよい。
【0025】
(8)この集積回路装置は、
前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が0デシベル以下となる距離に設定されていてもよい。
【0026】
(9)この集積回路装置は、
前記第1及び第2の振動膜の中心間距離が、抽出対象周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧が全方位において単体マイクとして使用した場合の音圧を上回らない範囲の距離に設定されていてもよい。
【0027】
抽出対象周波数は、本音声入力装置で抽出したい音の周波数である。例えば7kHz以下の周波数を抽出対象周波数として前記第1及び第2の振動膜の中心間距離が設定されていてもよい。
【0028】
(10)この集積回路装置は、
前記第1及び第2の振動膜は、シリコン膜であることを特徴とする。
【0029】
(11)この集積回路装置は、
前記第1及び第2の振動膜は、法線が平行になるように形成されていることを特徴とする。
【0030】
(12)この集積回路装置は、
前記第1及び第2の振動膜は、法線と直交する方向にずれて配置されていることを特徴とする。
【0031】
(13)この集積回路装置は、
前記第1及び第2の振動膜は、前記半導体基板の1つの面から形成された凹部の底部であることを特徴とする。
【0032】
(14)この集積回路装置は、
前記第1及び第2の振動膜は、法線方向にずれて配置されていることを特徴とする。
【0033】
(15)この集積回路装置は、
前記第1及び第2の振動膜は、それぞれ、前記半導体基板の対向する第1及び第2の面から形成された第1及び第2の凹部の底部であることを特徴とする。
【0034】
(16)この集積回路装置は、
前記第1の振動膜及び前記第2の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管を介して音波を取得するように構成されていることを特徴とする。
【0035】
導音管は、開口部から入力した音波が外部に漏れないよう振動膜まで届くように、振動膜の周囲の基板に密着して設置することにより、導音管に入った音は減衰することなく振動膜に届く。本発明によれば前記第1の振動膜及び前記第2の振動膜の少なくとも一方に導音管を設置することにより、拡散による減衰なしに音が振動膜に届くまでの距離を変えることができる。すなわち、導音管入り口での音の振幅を保ったまま、位相のみを制御することが可能であり、例えば2つのマイクの遅延バランスのばらつきに応じて、適当な長さ(例えば数ミリ)の導音管を設置することにより遅延を解消することができる。
【0036】
(17)この集積回路装置は、
前記差分信号生成回路は、
前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含むことを特徴とする。
【0037】
(18)この集積回路装置は、
前記差分信号生成回路は、
前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号の振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含むことを特徴とする。
【0038】
振幅差検出部は、ゲイン部の出力信号振幅を検出する第1の振幅検出部と、前記第2のマイクロフォンで取得された第2の電圧信号の信号振幅を検出する第2の振幅検出部と、前記第1の振幅検出手段で検出された振幅信号と前記第2の振幅検出手段で検出された振幅信号との差分信号を検出する振幅差信号生成部とを含んで構成してもよい。
【0039】
例えばゲイン調整用にテスト用の音源を用意して、当該音源からの音を第1のマイクロフォンと第2のマイクロフォンに対して等しい音圧で入力されるように設定し、第1のマイクロフォンと第2のマイクロフォンで受音して、出力される第1の電圧信号と第2の電圧信号の波形をモニタして(例えばオシロスコープ等を用いてモニタしてもよい)振幅が一致するように、または振幅差が所定の範囲内になるように増幅率を変更してもよい。
例えば振幅の差がゲイン部の出力信号または第2の電圧信号に対して−3%以上、+3%以下の範囲になるようにしても良いし、−6%以上、+6%以下の範囲になるようにしても良い。前者の場合1kHzの音波に対してノイズ抑圧効果が約10デシベルとなり、後者の場合ノイズ抑圧効果が約6デシベルとなり、適切な抑圧効果をだすことができる。
【0040】
または所定のデシベル(例えば約10デシベル)のノイズ抑圧効果を得るように所定のゲインを制御してもよい。
【0041】
本発明によれば使用時の状況(環境や使用年数)等により変化するマイクロフォンのゲインバランスのばらつきをリアルタイムに検出して調整を行うことができる。
【0042】
(19)この集積回路装置は、
前記差分信号生成部は、
所定の端子にかかる電圧または流れる電流に応じて増幅率が変化するよう構成されたゲイン部と、
前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部を含み、
前記ゲイン制御部は、
複数の抵抗が直列または並列に接続された抵抗アレー含み、前記抵抗アレーを構成する抵抗体又は導体の一部を切断すること、もしくは少なくとも1つの抵抗体を含み、該抵抗体の一部を切断することでゲイン部の所定の端子にかかる電圧または流れる電流を変更可能に構成されていることを特徴とする。
【0043】
抵抗アレーを構成する抵抗体又は導体の一部をレーザによるカット、あるいは高電圧または高電流の印加により溶断することで切断してもよい。
【0044】
マイクロフォンの製造過程で生じる個体差によるゲインバランスのばらつきを調べて、当該ばらつきにより生じる振幅差を解消するように、第1の電圧信号の増幅率を決定する。そして決定した増幅率を実現するための電圧または電流を所定の端子に供給できるように前記抵抗アレーを構成する抵抗体又は導体(例えばヒューズ)の一部を切断して、ゲイン制御部の抵抗値を適切な値に設定する。これによりゲイン部の出力と、前記第2のマイクロフォンで取得された第2の電圧信号との振幅のバランスを調整することができる。
【0045】
(20)本発明は、
上記のいずれかに記載の集積回路装置が実装されていることを特徴とする音声入力装置である。
【0046】
この音声入力装置によると、2つの電圧信号の差を示す差分信号を生成するだけで、雑音成分が除去された、入力音声を示す信号を取得することができる。そのため、本発明によると、精度の高い音声認識処理や、音声認証処理、あるいは、入力音声に基づくコマンド生成処理などの実現を可能にする音声入力装置を提供することができる。
【0047】
(21)本発明は、
上記のいずれかに記載の集積回路装置と、
前記差分信号に基づいて、入力音声情報の解析処理を行う解析処理部と、
を含む情報処理システムである。
【0048】
この情報処理システムによると、解析処理部は、差分信号に基づいて入力音声情報の解析処理を行う。ここで、差分信号は、雑音成分が除去された音声成分を示す信号とみなすことができるため、この差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。
【0049】
本発明に係る情報処理システムは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。
【0050】
(22)本発明は、
上記のいずれかに記載の集積回路装置とネットワークを介した通信処理を行う通信処理装置とが実装された音声入力装置と、
前記ネットワークを介した通信処理によって取得した前記差分信号に基づいて、前記音声入力装置に入力された入力音声情報の解析処理を行うホストコンピュータと、
を含む情報処理システムである。
【0051】
この情報処理システムによると、解析処理部は、差分信号に基づいて入力音声情報の解析処理を行う。ここで、差分信号は、雑音成分が除去された音声成分を示す信号とみなすことができるため、この差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。
【0052】
本発明に係る情報処理システムは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。
【発明を実施するための最良の形態】
【0053】
以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。
【0054】
1.集積回路装置の構成
はじめに、図1〜図3を参照して、本発明を適用した実施の形態に係る集積回路装置1の構成について説明する。なお、本実施の形態に係る集積回路装置1は、音声入力素子(マイク素子)として構成され、接話型の音声入力装置等に適用することができる。
【0055】
本実施の形態に係る集積回路装置1は、図1及び図2に示すように、半導体基板100を有する。なお、図1は集積回路装置1(半導体基板100)の斜視図であり、図2は、集積回路装置1の断面図である。半導体基板100は、半導体チップであってもよい。あるいは、半導体基板100は、集積回路装置1となる領域を複数有する半導体ウエハであってもよい。半導体基板100は、シリコン基板であってもよい。
【0056】
半導体基板100には、第1の振動膜12が形成されている。第1の振動膜12は、半導体基板100の所与の面101から形成された第1の凹部102の底部であってもよい。第1の振動膜12は、第1のマイクロフォン10を構成する振動膜である。すなわち、第1の振動膜12は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第1の電極14と対になって第1のマイクロフォン10を構成する。第1の振動膜12に音波が入射すると、第1の振動膜12が振動し、第1の振動膜12と第1の電極14との間隔が変化して、第1の振動膜12と第1の電極14との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、第1の振動膜12を振動させる音波(第1の振動膜12に入射する音波)を、電気信号(電圧信号)に変換して出力することができる。以下、第1のマイクロフォン10から出力される電圧信号を、第1の電圧信号と呼ぶ。
【0057】
半導体基板100には、第2の振動膜22が形成されている。第2の振動膜22は、半導体基板100の所与の面101から形成された第2の凹部104の底部であってもよい。第2の振動膜22は、第2のマイクロフォン20を構成する振動膜である。すなわち、第2の振動膜22は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第2の電極24と対になって第2のマイクロフォン20を構成する。第2のマイクロフォン20は、第1のマイクロフォン10と同様の作用によって、第2の振動膜22を振動させる音波(第2の振動膜22に入射する音波)を、電圧信号に変換して出力する。以下、第2のマイクロフォン20から出力される電圧信号を、第2の電圧信号と呼ぶ。
【0058】
本実施の形態では、第1及び第2の振動膜12,22は半導体基板100に形成されており、例えばシリコン膜であってもよい。すなわち、第1及び第2のマイクロフォン10,20は、シリコンマイク(Siマイク)であってもよい。シリコンマイクを利用することで、第1及び第2のマイクロフォン10,20の小型化、及び、高性能化を実現することができる。第1及び第2の振動膜12,22は、法線が平行になるように配置されていてもよい。また、第1及び第2の振動膜12,22は、法線と直交する方向にずれて配置されていてもよい。
【0059】
第1及び第2の電極14,24は、半導体基板100の一部であってもよく、あるいは、半導体基板100上に配置された導電体であってもよい。また、第1及び第2の電極14,24は、音波の影響を受けない構造をなしていてもよい。例えば、第1及び第2の電極14,24は、メッシュ構造をなしていてもよい。
【0060】
半導体基板100には、集積回路16が形成されている。集積回路16の構成は特に限定されないが、例えば、トランジスタ等の能動素子や、抵抗等の受動素子を含んでいてもよい。
【0061】
本実施の形態に係る集積回路装置は、差分信号生成回路30を有する。差分信号生成回路30は、第1の電圧信号と、第2の電圧信号とを受け付けて、両者の差を示す差分信号を生成(出力)する。差分信号生成回路30では、第1及び第2の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、差分信号を生成する処理を行う。差分信号生成回路30は、半導体基板100に構成された集積回路16の一部であってもよい。図3には、差分信号生成回路30の回路図の一例を示すが、差分信号生成回路30の回路構成はこれに限られるものではない。
【0062】
なお、本実施の形態に係る集積回路装置1は、差分信号を所定のゲインを与える(ゲインを上げる場合でもよいし、ゲインを下げる場合でもよい)信号増幅回路をさらに含んでいてもよい。信号増幅回路は、集積回路16の一部を構成していてもよい。ただし、集積回路装置は、信号増幅回路を含まない構成になっていてもよい。
【0063】
本実施の形態に係る集積回路装置1では、第1及び第2の振動膜12,22、及び、集積回路16(差分信号生成回路30)は、1つの半導体基板100に形成されている。半導体基板100は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)ととらえてもよい。また、振動膜については無機圧電薄膜、あるいは有機圧電薄膜を使用して、圧電効果により音響−電気変換するようなものであっても構わない。第1及び第2の振動膜12,22を、同一基板(半導体基板100)に形成することで、第1及び第2の振動膜12,22を精度よく形成することができるとともに、第1及び第2の振動膜12,22を極めて近接させることが可能になる。
【0064】
前記振動膜を、SN(Signal to Noise)比が約60デシベル以上の振動子で構成してもよい。振動子を差動マイクとして機能させる場合には単体マイクとして機能させる場合に比べてSN比が低下する。従ってSN比に優れた振動子(例えばSN比が60デシベル以上のMEMS振動子)を用いて前記振動膜を構成することで、感度のよい集積回路装置を実現することができる。
【0065】
例えば、単体マイク2個を5mm程度離して配置し、これらの差分をとることで差動マイクを構成し、話者とマイク間の距離を約2.5cm程度(接話型の音声入力装置)の条件で使用する場合には、単体マイクの場合に比べて出力感度が10デシベル程度低下する。すなわち、単体マイクに比べて差動マイクは少なくとも10デシベルはSN比が低下することになる。マイクの実用性を考えた場合、SN比は50デシベル程度必要であるとされているため、差動マイクにおいてこの条件を満たすためには、単体の状態でSN比が約60デシベル以上確保できるような振動子を用いてマイクロフォンを構成する必要があり、これにより、前記感度の低下による影響を鑑みてもマイクとしての機能の必要レベルを満たした集積回路装置を実現することができる。
【0066】
なお、本実施の形態に係る集積回路装置1によると、後述するように、第1及び第2の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を高精度に実現するために、第1及び第2の振動膜12,22は、一定の制約を満たすように配置してもよい。第1及び第2の振動膜12,14が満たすべき制約の詳細については後述するが、本実施の形態では、第1及び第2の振動膜12,22は、雑音強度比が、入力音声強度比よりも小さくなるように配置されてもよい。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第1及び第2の振動膜12,22は、例えば、中心間距離Δrが5.2mm以下になるように配置されていてもよい。
【0067】
本実施の形態に係る集積回路装置1は以上のように構成されていてもよい。これによると、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。なお、その原理については後述する。
【0068】
2.雑音除去機能
以下、集積回路装置1による音声除去原理、及び、これを実現するための条件について説明する。
【0069】
(1)雑音除去原理
はじめに、雑音除去原理について説明する。
【0070】
音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離Rとの関係において、
【0071】
【数1】
と表すことができる。なお、式(1)中、Kは比例定数である。図4には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。本実施の形態に係る集積回路装置では、この減衰特性を利用して雑音成分を除去する。
【0072】
すなわち、集積回路装置1を接話型の音声入力装置に適用する場合、ユーザは、雑音の音源よりも、集積回路装置1(第1及び第2の振動膜12,22)に近い位置で音声を発することになる。そのため、第1及び第2の振動膜12,22の間で、ユーザの音声は大きく減衰し、第1及び第2の電圧信号に含まれるユーザ音声の強度には差が現れる。これに対して雑音成分は、ユーザの音声に比べて音源が遠いため、第1及び第2の振動膜12,22の間でほとんど減衰しない。そのため、第1及び第2の電圧信号に含まれる雑音の強度には、差が現れないとみなすことができる。このことから、第1及び第2の電圧信号の差を検出すれば雑音が消去され、集積回路装置1の近傍で発声されたユーザの音声成分のみが残ることになる。すなわち、第1及び第2の電圧信号の差を検出することで、雑音成分が含まれない、ユーザの音声成分のみを示す電圧信号(差分信号)を取得することができる。そして、この集積回路装置1によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理によって、精度よく雑音が除去された、ユーザ音声を示す信号を取得することができる。
【0073】
ただし、音波は位相成分を有する。そのため、より精度の高い雑音除去機能を実現するためには、第1及び第2の電圧信号に含まれる音声成分及び雑音成分の位相差を考慮する必要がある。
【0074】
以下、差分信号を生成することによって雑音除去機能を実現するために、集積回路装置1が満たすべき具体的な条件について説明する。
【0075】
(2)集積回路装置が満たすべき具体的条件
集積回路装置1によると、先に説明したように、第1及び第2の電圧信号の差分を示す差分信号を、雑音を含まない入力音声信号であるとみなす。この集積回路装置によると、差分信号に含まれる雑音成分が、第1又は第2の電圧信号に含まれる雑音成分よりも小さくなったことをもって、雑音除去機能が実現できたと評価することができる。詳しくは、差分信号に含まれる雑音成分の強度の、第1又は第2の電圧信号に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分信号に含まれる音声成分の強度の、第1又は第2の電圧信号に含まれる音声成分の強度に対する比を示す音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。
【0076】
以下、この雑音除去機能を実現するために、集積回路装置1(第1及び第2の振動膜12,22)が満たすべき具体的な条件について説明する。
【0077】
はじめに、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する音声の音圧について検討する。入力音声(ユーザの音声)の音源から第1の振動膜12までの距離をRとし、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)の中心間距離をΔrとすれば、位相差を無視すれば、第1及び第2のマイクロフォン10,20で取得される、入力音声の音圧(強度)P(S1)及びP(S2)は、
【0078】
【数2】
と表すことができる。
【0079】
そのため、入力音声の位相差を無視した時の、第1のマイクロフォン10で取得される入力音声成分の強度に対する、差分信号に含まれる入力音声成分の強度の比率を示す音声強度比ρ(P)は、
【0080】
【数3】
と表される。
【0081】
ここで、本実施の形態に係る集積回路装置が接話式の音声入力装置に利用されるマイク素子である場合、ΔrはRに比べて充分小さいとみなすことができるため、上述の式(4)は、
【0082】
【数4】
と変形することができる。
【0083】
すなわち、入力音声の位相差を無視した場合の音声強度比は、式(A)と表されることがわかる。
【0084】
ところで、入力音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、
【0085】
【数5】
と表すことができる。なお、式中、αは位相差である。
【0086】
このとき、音声強度比ρ(S)は、
【0087】
【数6】
と表される。式(7)を考慮すると、音声強度比ρ(S)の大きさは、
【0088】
【数7】
と表すことができる。
【0089】
ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr/R sinωt項は振幅成分の強度比を示す。入力音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、入力音声(ユーザの音声)を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr/R sinωtとは、
【0090】
【数8】
の関係を満たしていることが必要である。
【0091】
ここで、
【0092】
【数9】
と表すことができるため、上述の式(B)は、
【0093】
【数10】
と表すことができる。
【0094】
式(10)の振幅成分を考慮すると、本実施の形態に係る集積回路装置1は、
【0095】
【数11】
を満たす必要があることがわかる。
【0096】
なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin(α/2)は充分小さいとみなすことができ、
【0097】
【数12】
と近似することができる。
そのため、式(C)は、
【0098】
【数13】
と変形することができる。
また、位相差であるαとΔrとの関係を、
【0099】
【数14】
と表せば、式(D)は、
【0100】
【数15】
と変形することができる。
【0101】
すなわち、本実施の形態では、入力音声(ユーザの音声)を精度よく抽出するためには、集積回路装置1が式(E)に示す関係を満たすことが必要である。
【0102】
次に、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する雑音の音圧について検討する。
【0103】
第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、
【0104】
【数16】
と表すことができ、第1のマイクロフォン10で取得される雑音成分の強度に対する、差分信号に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、
【0105】
【数17】
と表すことができる。
【0106】
なお、先に説明したように、第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、
【0107】
【数18】
と変形することができる。
そして、雑音強度比の大きさは、
【0108】
【数19】
と表すことができる。
ここで、上述の式(9)を考慮すると、式(17)は、
【0109】
【数20】
と変形することができる。
【0110】
そして、式(11)を考慮すると、式(18)は、
【0111】
【数21】
と変形することができる。
【0112】
ここで、式(D)を参照すれば、雑音強度比の大きさは、
【0113】
【数22】
と表すことができる。なお、Δr/Rとは、式(A)に示すように、入力音声(ユーザ音声)の振幅成分の強度比である。式(F)から、この集積回路装置1では、雑音強度比が入力音声の強度比Δr/Rよりも小さくなることがわかる。
【0114】
以上のことから、入力音声の位相成分の強度比が振幅成分の強度比よりも小さくなる集積回路装置1によれば(式(B)参照)、雑音強度比が入力音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比が入力音声強度比よりも小さくなるように設計された集積回路装置1によると、精度の高い雑音除去機能を実現することができる。
【0115】
3.集積回路装置の製造方法
以下、本実施の形態に係る集積回路装置の製造方法について説明する。本実施の形態では、第1及び第2の振動膜12,22の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、集積回路装置を製造してもよい。
【0116】
雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、
【0117】
【数23】
と表すことができる。
【0118】
そして、式(20)のαに各値を代入すれば、位相差αと雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図5には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。
【0119】
なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図5の横軸は、Δr/λとみなすことができる。すなわち、図5は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。
【0120】
本実施の形態では、このデータを利用して、集積回路装置1を製造する。図6は、このデータを利用して集積回路装置1を製造する手順について説明するためのフローチャート図である。
【0121】
はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図5参照)を用意する(ステップS10)。
【0122】
次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。
【0123】
次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。
【0124】
そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。
【0125】
具体例として、主要な雑音が1kHzであり、その波長が0.347mとなる環境下で、雑音の強度が20dB低下する集積回路装置を製造する場合について考える。
【0126】
はじめに、必要条件として、雑音の強度比が0dB以下になるための条件について検討する。図5を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を0.16以下とすればよいことがわかる。すなわち、Δrの値が55.46mm以下とすればよいことがわかり、これが、この集積回路装置の必要条件となる。
【0127】
次に、1kHzの雑音の強度を20dB低下させるための条件について考える。図5を参照すると、雑音の強度を20dB低下させるためには、Δr/λの値を0.015とすればよいことがわかる。そして、λ=0.347mとすると、Δrの値が5.20mm以下のときに、この条件を満たすことがわかる。すなわち、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)の中心間距離Δrを約5.2mm以下に設定すれば、雑音除去機能を有する集積回路装置を製造することが可能になる。
【0128】
なお、本実施の形態に係る集積回路装置1は接話式の音声入力装置に利用されるため、ユーザの音声の音源と集積回路装置1(第1又は第2の振動膜12,22)との間隔は、通常5cm以下である。また、ユーザ音声の音源と集積回路装置1(第1及び第2の振動膜12,22)との間隔は、筐体の設計によって制御することが可能である。そのため、入力音声(ユーザの音声)の強度比であるΔr/Rの値は、0.1(雑音の強度比)よりも大きくなり、雑音除去機能が実現されることがわかる。
【0129】
なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δr/λの値は小さくなり、この集積回路装置によって除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、集積回路装置に与える影響を無視することができる。このことから、本実施の形態に係る集積回路装置は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。
【0130】
また、本実施の形態では、式(12)からもわかるように、第1及び第2の振動膜12,22を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の振動膜12,22の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係る集積回路装置1は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係る集積回路装置1によると、すべての方向から入射する雑音が除去される。
【0131】
4.効果
以下、集積回路装置1が奏する効果についてまとめる。
【0132】
先に説明したように、集積回路装置1によると、第1及び第2のマイクロフォン10,20で取得された電圧信号の差分を示す差分信号を生成するだけで、雑音成分が除去された音声成分を取得することができる。すなわち、この音声入力装置では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため、簡単な構成で、精度の高い雑音除去機能を実現することが可能な集積回路装置(マイク素子・音声入力素子)を提供することができる。
【0133】
特に、第1及び第2の振動膜の中心間距離Δrを5.2mm以下に設定することで、位相歪が少なく、より精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。
【0134】
また前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して、第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が、0デシベル以下となる距離に設定してもよい。
【0135】
前記第1及び第2の振動膜を音源の音(例えば音声)の進行方向に沿って配置して、前記進行方向からの10kHz以下の周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧の位相成分が単体マイクとして使用した場合の音圧を上回らない範囲の距離に前記第1及び第2の振動膜の中心間距離を設定してもよい。
【0136】
集積回路装置が奏する遅延歪除去効果について説明する。
【0137】
先に説明したように、ユーザ音声強度比ρ(S)は以下の式(8)で表される。
【0138】
【数24】
ここで、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、sinωt−sin(ωt−α)の項である。式(8)に、
【0139】
【数25】
と
【0140】
【数26】
を代入すると、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、以下の式で表すことができる。
【0141】
【数27】
したがって、ユーザ音声強度比ρ(S)の位相成分ρ(S)p haseに基づく強度比のデシベル値は、以下の式で表すことができる。
【0142】
【数28】
そして、式(22)のαに各値を代入すれば、位相差αと、ユーザ音声の位相成分に基づく強度比との対応関係を明らかにすることができる。
【0143】
図26から図28はマイク間距離とユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの関係について説明するための図である。図26から図28の横軸はΔr/λであり、縦軸はユーザ音声強度比ρ(S)の位相成分ρ(S)phaseである。ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseとは差動マイクと単体マイクの音圧比の位相成分(ユーザ音声の位相成分に基づく強度比)であり、差動マイクを構成するマイクを単体マイクとして使用した場合の音圧が差動音圧と同じになるところを0デシベルとしている。
【0144】
すなわち図26から図28のグラフは、Δr/λに対応した差動音圧の遷移を示しており、縦軸が0デシベル以上のエリアは、遅延歪(ノイズ)が大きいと考えることができる。
【0145】
現行の電話回線は3.4kHzの音声周波数帯域で設計されているが、より高品質な音声通信を実現しようとした場合、7kHz以上、好ましくは10kHzの音声周波数帯域が必要とされる。以下、10kHzの音声周波数帯域を想定した場合における、遅延による音声歪みの影響について考察する。
【0146】
図26はマイク間距離(Δr)が5mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
【0147】
マイク間距離が5mmの場合には、図26に示すように1kHz、7kHz、10kHzのいずれの周波数の音についても音ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下である。
【0148】
また図27はマイク間距離(Δr)が10mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
【0149】
マイク間距離が10mmになると、図27に示すように1kHz、7kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、10kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延ひずみ(ノイズ)が大きくなっている。
【0150】
また図28はマイク間距離(Δr)が20mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合の音ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
【0151】
マイク間距離が20mmになると、図28に示すように1kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、7kHz、10kHzの音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延ひずみ(ノイズ)が大きくなっている。
【0152】
ここで、マイク間距離を短くするほど、話者音声の位相歪みを抑えられて忠実性は良くなるが、逆に差動マイクの出力レベルが低下して、SN比が低下してしまう。したがって、実用性を考えた場合、最適なマイク間距離範囲が存在する。
従ってマイク間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、周波数が10kHz帯域まで話者音声を忠実に抽出し、かつ実用レベルのSN比を確保し、遠方雑音の抑制効果の高い音声入力装置を実現することができる。
【0153】
本実施の形態では第1及び第2の振動膜の中心間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、10kHz帯域まで話者音声を忠実に抽出し、かつ遠方雑音の抑制効果の高い集積回路装置を実現することができる。
【0154】
また、集積回路装置1では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、第1及び第2の振動膜12,22が配置されている。そのため、この集積回路装置1によると、全方位から入射する雑音が除去される。すなわち、本発明によると、全方位から入射する雑音を除去することが可能な集積回路装置を提供することができる。
【0155】
図29(A)(B)から図37(A)(B)は音源周波数とマイク間距離Δrとマイク−音源間の距離毎の差動マイクの指向性について説明するための図である。
【0156】
図29(A)(B)は音源の周波数が1kHz、マイク間距離が5mm、マイク−音源間距離がそれぞれ2.5cm(接話型の話者の口元からマイクまでの距離に相当)および1m(遠方雑音に相当)の場合の差動マイクの指向性を示す図である。
【0157】
1116は差動マイクの全方位に対する感度(差動音圧)を示すグラフであり、差動マイクの指向特性を示している。また1112は差動マイクを単体マイクとして使用した場合の全方位に対する感度(音圧)を示すグラフであり、単体マイクの均等特性を示している。
【0158】
1114はマイクを2つ用いて差動マイクを構成する場合の両マイクを結ぶ直線の方向又はマイクを1つで差動マイクを実現する場合にマイクの両面に音波を到達させるための第1の振動膜と第2の振動膜を結ぶ直線の方向(0度−180度、差動マイクを構成する2つのマイクM1、M2又は第1の振動膜と第2の振動膜はこの直線上に置かれている)を示している。この直線の方向を0度、180度とし、この直線の方向と直角な方向を90度、270度とする。
【0159】
1112、1122に示すように単体マイクは全方位から均一に音を取っており指向性を有していない。また音源が遠くなるほど取得する音圧は減衰している。
【0160】
1116、1120に示すように差動マイクは90度、270度方向で多少感度が落ちるが全方位にほぼ均一な指向性を有している。また単体マイクより取得する音圧が減衰しており、単体マイクと同様に音源が遠くなるほど取得する音圧は減衰している。
【0161】
図29(B)に示すように音源の周波数帯域が1kHz、マイク間距離が5mmの場合には、差動マイクの指向性を示す差動音圧のグラフ1120の示す領域は単体マイクの均等特性を示すグラフ1122の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0162】
図30(A)(B)は音源の周波数が1kHz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を説明する図である。かかる場合にも、図30(B)に示すように、差動マイクの指向性を示すグラフ1140の示す領域は単体マイクの均等特性を示すグラフ1422の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0163】
図31(A)(B)は音源の周波数が1kHz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図31(B)に示すように、差動マイクの指向性を示すグラフ1160の示す領域は単体マイクの均等特性を示すグラフ1462の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0164】
図32(A)(B)は音源の周波数が7kHz、マイク間距離Δrが5mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図32(B)に示すように、差動マイクの指向性を示すグラフ1180の示す領域は単体マイクの均等特性を示すグラフ1182の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0165】
図33(A)(B)は音源の周波数が7kHz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合には、図33(B)に示すように、差動マイクの指向性を示すグラフ1200の示す領域は単体マイクの均等特性を示すグラフ1202の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
【0166】
図34(A)(B)は音源の周波数が7kHz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図34(B)に示すように、差動マイクの指向性を示すグラフ1220の示す領域は単体マイクの均等特性を示すグラフ1222の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
【0167】
図35(A)(B)は音源の周波数が300Hz、マイク間距離Δrが5mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合には、図35(B)に示すように、差動マイクの指向性を示すグラフ1240の示す領域は単体マイクの均等特性を示すグラフ1242の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0168】
図36(A)(B)は音源の周波数が300Hz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図36(B)に示すように、差動マイクの指向性を示すグラフ1260の示す領域は単体マイクの均等特性を示すグラフ1262の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0169】
図37(A)(B)は音源の周波数が300Hz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図37(B)に示すように、差動マイクの指向性を示すグラフ1280の示す領域は単体マイクの均等特性を示すグラフ1282の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0170】
マイク間距離が5mmである場合には、図29(B)、図32(B)、図35(B)に示すように音の周波数が1kHz、7kHz、300Hzのいずれの場合についても、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されている。すなわちマイク間距離が5mmである場合については音の周波数が7kHz以下の帯域では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0171】
ところがマイク間距離が10mmである場合には、図30(B)、図33(B)、図36(B)に示すように音の周波数が7kHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が10mmである場合については音の周波数が7kHz付近(又は7kHz以上)では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。
【0172】
またマイク間距離が20mmである場合には、図31(B)、図34(B)、図37(B)に示すように音の周波数が7kHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が20mmである場合については音の周波数が7kHz付近(又は7kHz以上)では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。
【0173】
差動マイクのマイク間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、7kHz以下の音については指向性によらず全方位の遠方雑音の抑圧効果が単体マイクに比べ高くなる。従って第1及び第2の振動膜の中心間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、7kHz以下の音については指向性によらず全方位の遠方雑音を抑圧することが可能な集積回路装置を実現することができる。
【0174】
なお、集積回路装置1によると、壁などで反射した後に集積回路装置1に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声の音源は、長距離を伝搬した後に集積回路装置1に入射するため、通常のユーザ音声の音源よりも遠いとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の振動膜12,22の間で音圧が大きく減衰することがない。そのため、この集積回路装置1によると、壁などで反射した後に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。
【0175】
また、集積回路装置1によると、第1及び第2の振動膜12,22と、差分信号生成回路30とが1つの半導体基板100に形成されている。これによると、第1及び第2の振動膜12,22を、高精度に形成することができ、また、第1及び第2の振動膜12,22の中心間距離を極めて近接させることができる。そのため、雑音除去精度が高く、かつ、外形が小さい集積回路装置を提供することができる。
【0176】
そして、集積回路装置1を利用すれば、雑音を含まない、入力音声を示す信号を取得することができる。そのため、この集積回路装置を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
【0177】
5.音声入力装置
次に、集積回路装置1を有する音声入力装置2について説明する。
【0178】
(1)音声入力装置の構成
はじめに、音声入力装置2の構成について説明する。図7及び図8は、音声入力装置2の構成について説明するための図である。なお、以下に説明する音声入力装置2は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
【0179】
図7は、音声入力装置2の構造を説明するための図である。
【0180】
音声入力装置2は、筐体40を有する。筐体40は、音声入力装置2の外形を構成する部材であってもよい。筐体40には基本姿勢が設定されていてもよく、これにより、入力音声(ユーザの音声)の進行径路を規制することができる。筐体40には、入力音声(ユーザの音声)を受け付けるための開口42が形成されていてもよい。
【0181】
音声入力装置2では、集積回路装置1は、筐体40に設置される。集積回路装置1は、第1及び第2の凹部102,104が開口42に連通するように、筐体40に設置されていてもよい。集積回路装置1は、第1及び第2の振動膜12,22が入力音声の進行径路に沿ってずれて配置されるように、筐体40に設置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第1の振動膜12とし、下流側に配置される振動膜を第2の振動膜22としてもよい。
【0182】
次に、図8を参照して、音声入力装置2の機能について説明する。なお、図8は、音声入力装置2の機能を説明するためのブロック図である。
【0183】
音声入力装置2は、第1及び第2のマイクロフォン10,20を有する。第1及び第2のマイクロフォン10,20は、第1及び第2の電圧信号を出力する。
【0184】
音声入力装置2は、差分信号生成回路30を有する。差分信号生成回路30は、第1及び第2のマイクロフォン10,20から出力された第1及び第2の電圧信号を受け付けて、両者の差を示す差分信号を生成する。
【0185】
なお、第1及び第2のマイクロフォン10,20と、差分信号生成回路30とは、1つの半導体基板100で実現される。
【0186】
音声入力装置2は、演算処理部50を有していてもよい。演算処理部50は、差分信号生成回路30で生成された差分信号に基づいて各種の演算処理を行う。演算処理部50は、差分信号に対する解析処理を行ってもよい。演算処理部50は、差分信号を解析することにより、入力音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部50は、差分信号を解析処理することにより、入力音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部50は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部50は、差分信号を所定のゲインを与える(ゲインを上げる場合でもよいし、ゲインを下げる場合でもよい)処理を行ってもよい。また、演算処理部50は、後述する通信処理部60の動作を制御してもよい。なお、演算処理部50は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。
【0187】
音声入力装置2は、通信処理部60をさらに含んでいてもよい。通信処理部60は、音声入力装置と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部60は、ネットワークを介して、他の端末に信号(差分信号)を送信する機能を有していてもよい。通信処理部60は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部60を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部60を有しない構成となっていてもよい。
【0188】
なお、上述した演算処理部50及び通信処理部60は、パッケージングされた半導体装置(集積回路装置)として、筐体40内に配置されていてもよい。ただし、本発明はこれに限られるものではない。例えば、演算処理部50は、筐体40の外部に配置されていてもよい。演算処理部50が筐体40の外部に配置されている場合、演算処理部50は、通信処理部60を介して、差分信号を取得してもよい。
【0189】
なお、音声入力装置2は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。
【0190】
音声入力装置2は、以上の構成をなしていてもよい。この音声入力装置2は、マイク素子(音声入力素子)として集積回路装置1を利用する。そのため、この音声入力装置2は、雑音を含まない、入力音声を示す信号を取得することができ、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
【0191】
また、音声入力装置2をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。
【0192】
6.変形例
以下、本発明を適用した実施の形態の変形例について説明する。
【0193】
図9は、本実施の形態に係る集積回路装置3について説明するための図である。
【0194】
本実施の形態に係る集積回路装置3は、図9に示すように、半導体基板200を有する。半導体基板200には、第1及び第2の振動膜12,22が形成されている。ここで、第1の振動膜15は、半導体基板200の第1の面201から形成された第1の凹部210の底部である。また、第2の振動膜25は、半導体基板200の第2の面202(第1の面201と対向する面)から形成された第2の凹部220の底部である。すなわち、集積回路装置3(半導体基板200)によると、第1及び第2の振動膜15,25は、法線方向に(半導体基板200の厚み方向に)ずれて配置される。なお、半導体基板200では、第1及び第2の振動膜15,25は、法線距離が5.2mm以下になるように配置されていてもよい。あるいは、第1及び第2の振動膜15,25は、中心間距離が5.2mm以下になるように配置されていてもよい。
【0195】
図10は、集積回路装置3が実装された音声入力装置4について説明するための図である。集積回路装置3は、筐体40に実装される。集積回路装置3は、図3に示すように、第1の面201が、筐体40の開口42が形成された面を向くように、筐体40に実装されていてもよい。そして、集積回路装置3は、第1の凹部210が開口42に連通するように、かつ、第2の振動膜25が開口42と重複するように、筐体40に実装されていてもよい。
【0196】
本実施の形態では、集積回路装置3は、第1の凹部210に連通する開口212の中心が、第2の振動膜25(第2の凹部220の底面)の中心よりも、入力音声の音源に近い位置に配置されるように設置されていてもよい。集積回路装置3は、入力音声が、第1及び第2の振動膜15,25に、同時に到着するように設置されていてもよい。例えば、集積回路装置3は、入力音声の音源(モデル音源)と第1の振動膜15との間隔が、モデル音源と第2の振動膜25との間隔と同じになるように設置されていてもよい。集積回路装置3は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。
【0197】
本実施の形態に係る音声入力装置によると、第1及び第2の振動膜15,25に入射する入力音声(ユーザの音声)の、入射時間のずれを低減することができる。そのため、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。
【0198】
なお、凹部(第1の凹部210)内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第1の振動膜15を振動させる入力音声の強度(振幅)は、開口212における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第1及び第2の振動膜15,25に同時に到達するように構成されている場合でも、第1及び第2の振動膜15,25を振動させる入力音声の強度には差が現れる。そのため、第1及び第2の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。
【0199】
まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分(差分信号)を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。
【0200】
最後に、図11〜図13に、本発明の実施の形態に係る音声入力装置の例として、携帯電話300、マイク(マイクシステム)400、及び、リモートコントローラ500を、それぞれ示す。また、図14には、情報入力端末としての音声入力装置602と、ホストコンピュータ604とを含む、情報処理システム600の概略図を示す。
【0201】
7.集積回路装置の構成
上記実施の形態では、第1のマイクロフォンを構成する第1の振動膜と第2のマイクロフォンを構成する第2の振動膜と差分信号生成回路が半導体基板に形成される場合を例にとり説明したがこれに限られない。第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路と、を含む配線基板を有する集積回路装置であれば本発明の範囲内である。第1の振動膜、前記第2の振動膜、差分信号生成回路は基板内に形成されていても良いし、配線基板上にフリップチップ実装等により実装されていてもよい。
【0202】
配線基板は半導体基板でも良いし、ガラスエポキシ等の他の回路基板等でもよい。
【0203】
第1の振動膜および前記第2の振動膜を同一基板上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。差分信号生成回路は2つのマイクのゲインバランスを調整する機能を有するように構成してもよい。これにより、両マイク間のゲインばらつきを基板毎に調整して出荷することができる。
【0204】
図15〜図17は、本実施の形態の集積回路装置の他の構成について説明するための図である。
【0205】
本実施の形態の集積回路装置は図15に示すように、配線基板は半導体基板1200であって、第1の振動膜714−1および前記第2の振動膜714−2は半導体基板1200に形成され、差分信号生成回路720は、半導体基板上1200にフリップチップ実装された構成でもよい。
【0206】
フリップチップ実装とは、IC(Integrated circuit)素子又はICチップの回路面を基板に対向させて一括でダイレクトに電気接続する実装方法であり、チップ表面と基板とを電気的に接続する際、ワイヤ・ボンディングのようにワイヤによって接続するのではなく、アレイ状に並んだバンプと呼ばれる突起状の端子によって接続するため、ワイヤ・ボンディングに比べて実装面積を小さくできる。
【0207】
第1の振動膜714−1および第2の振動膜714−2を同一の半導体基板1200上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。
【0208】
また本実施の形態の集積回路装置は図16に示すように、第1の振動膜714−1および第2の振動膜714−2および差分信号生成回路720は、配線基板1200’上にフリップチップ実装された構成でもよい。配線基板1200’は、配線基板は半導体基板でも良いし、ガラスエポキシ等の他の回路基板等でもよい。
【0209】
また本実施の形態の集積回路装置は図17に示すように、配線基板は半導体基板1200であって、差分信号生成回路720は、半導体基板1200上に形成され、前記第1の振動膜714−1、および第2の振動膜714−2は、半導体基板1200上にフリップチップ実装された構成でもよい。
【0210】
図18、19は本実施の形態の集積回路装置の構成の一例を示す図である。
【0211】
本実施の形態の集積回路装置700は、第1の振動膜を有する第1のマイクロフォン710−1を含む。また第4の実施の形態の音声入力装置700は、第2の振動膜を有する第2のマイクロフォン710−2を含む。
【0212】
第1のマイクロフォン710−1の第1の振動膜及び第2のマイクロフォン710−2の第1の振動膜は、差分信号742に含まれる雑音成分の強度の、前記第1又は第2の電圧信号712−1,712−2に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号742に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されている。
【0213】
本実施の形態の集積回路装置700は、前記第1のマイクロフォン710−1で取得された第1の電圧信号712−1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2とに基づき第1の電圧信号712−1と第2の電圧信号712−2の差分信号を742生成する差分信号生成部720を含む。
【0214】
また差分信号生成部720は、ゲイン部760を含む。ゲイン部760は、第1のマイクロフォン710−1で取得された第1の電圧信号712−1を所定のゲインを与えて出力する。
【0215】
また差分信号生成部720は、差分信号出力部740を含む。差分信号出力部に740は、ゲイン部760によって所定のゲインを与えられた第1の電圧信号S1と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号S1と第2の電圧信号との差分信号を生成して出力する。
【0216】
第1の電圧信号712−1を所定のゲインを与えることにより、2つのマイクロフォンの個体感度差に起因する第1の電圧信号及び第2の電圧信号の振幅差が無くなるように補正することができるので、ノイズ抑制効果の低減を防止することができる。
【0217】
図20、21は本実施の形態の集積回路装置の構成の一例を示す図である。
【0218】
本実施の形態の差分信号生成部720は、ゲイン制御部910を含んで構成してもよい。ゲイン制御部910は、ゲイン部760におけるゲインを変化させる制御を行う。ゲイン制御部910でゲイン部760のゲインをダイナミックにまたはスタティックに制御するとこで、ゲイン部出力S1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2との振幅のバランスを調整してもよい。
【0219】
図22はゲイン部とゲイン制御部の具体的構成の一例を示す図である。例えばアナログ信号を処理する場合にはゲイン部760を、オペアンプ(例えば図22に示すような非反転増幅回路)などのアナログ回路で構成してもよい。抵抗R1、R2の値を変更することにより、又は例えば製造時に所定の値に設定することで、オペアンプの−端子にかかる電圧をダイナミックまたはスタティックに制御することでオペアンプの増幅率を制御してもよい。
【0220】
図23(A)(B)は、ゲイン部の増幅率をスタティックに制御する構成の一例である。
【0221】
例えば図22の抵抗R1又R2を、図23(A)に示すように複数の抵抗が直列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子(図22の−端子)に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体又は導体(912のF)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
【0222】
また例えば図32の抵抗R1又R2を、図23(B)に示すように複数の抵抗が並列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子(図22の−端子)に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体又は導体(912のF)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
【0223】
ここで適切な増幅値は、製造工程で生じたマイクロフォンのゲインバランスを解消できる値に設定するとよい。図23(A)(B)のように複数の抵抗が直列又は並列に接続された抵抗アレーを用いることにより、製造工程で生じたマイクロフォンのゲインバランスに対応した抵抗値を作り込むことができ、所定の端子に接続され、前記ゲイン部のゲインを制御する電流を供給するゲイン制御部として機能する。
【0224】
なお上記実施の形態では複数の抵抗体(r)がヒューズ(F)を介して接続されている構成を例にとり説明したがこれに限られない。複数の抵抗(r)がヒューズ(F)を介さずに直列または並列に接続されている構成でもよく、この場合少なくとも1つの抵抗を切断してもよい。
【0225】
また、例えば図23の抵抗R1又R2を、図25に示すように1つの抵抗体で構成し、抵抗体の一部を切断する、いわゆるレーザートリミングにより抵抗値を調整する構成であっても構わない。
【0226】
また、抵抗体はマイクロフォン710が搭載される配線基板上に、抵抗体を吹き付ける等により、パターンニングして形成されたプリント抵抗を使用し、トリミングを行うものであって構わない。また、マイクロホンユニットの完成状態で実動作状態でのトリミングを行うためには、マイクロホンユニットの筐体表面に抵抗体を設けることがより好ましい。
【0227】
図24は本実施の形態の集積回路装置の他の構成の一例を示す図である。
【0228】
本実施の形態の集積回路装置は、第1の振動膜を有する第1のマイクロフォン710−1と、第2の振動膜を有する第2のマイクロフォン710−2と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号を生成する図示しない差分信号生成部とを含んでおり、前記第1の振動膜及び前記第2の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管1100を介して音波を取得するように構成してもよい。
【0229】
導音管1100は、筒の開口部1102からから入力した音波が音響孔714−2を介して外部に漏れないよう第2のマイクロフォン710−2の振動膜まで届くように、振動膜の周囲の基板1110に設置してもよい。このようすると、導音管1100に入った音は減衰することなく第2のマイクロフォン710−2の振動膜に届く。本実施の形態によれば前記第1の振動膜及び前記第2の振動膜の少なくとも一方に導音管を設置することにより、音が振動膜に届くまでの距離を変えることができる。従って遅延バランスのばらつきに応じて、適当な長さ(例えば数ミリ)の導音管を設置することにより遅延を解消することができる。
【0230】
なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
【図面の簡単な説明】
【0231】
【図1】集積回路装置について説明するための図。
【図2】集積回路装置について説明するための図。
【図3】集積回路装置について説明するための図。
【図4】集積回路装置について説明するための図。
【図5】集積回路装置を製造する方法について説明するための図。
【図6】集積回路装置を製造する方法について説明するための図。
【図7】集積回路装置を有する音声入力装置について説明するための図。
【図8】集積回路装置を有する音声入力装置について説明するための図。
【図9】変形例に係る集積回路装置について説明するための図。
【図10】変形例に係る集積回路装置を有する音声入力装置について説明するための図。
【図11】集積回路装置を有する音声入力装置の一例としての携帯電話を示す図。
【図12】集積回路装置を有する音声入力装置の一例としてのマイクを示す図。
【図13】集積回路装置を有する音声入力装置の一例としてのリモートコントローラを示す図。
【図14】情報処理システムの概略図。
【図15】集積回路装置の他の構成について説明するための図。
【図16】集積回路装置の他の構成について説明するための図。
【図17】集積回路装置の他の構成について説明するための図。
【図18】集積回路装置の構成の一例を示す図。
【図19】集積回路装置の構成の一例を示す図。
【図20】集積回路装置の構成の一例を示す図。
【図21】集積回路装置の構成の一例を示す図。
【図22】ゲイン部とゲイン制御部の具体的構成の一例を示す図。
【図23】図23(A)(B)は、ゲイン部の増幅率をスタティックに制御する構成の一例。
【図24】集積回路装置の他の構成の一例を示す図である。
【図25】レーザートリミングにより抵抗値を調整する例を示す図。
【図26】マイク間距離が5mmの場合のユーザー音声強度比の位相成分の分布の関係について説明するための図。
【図27】マイク間距離が10mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。
【図28】マイク間距離が20mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。
【図29】マイク間距離5mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図30】マイク間距離10mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図31】マイク間距離20mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図32】マイク間距離5mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図33】マイク間距離10mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図34】マイク間距離20mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図35】マイク間距離5mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図36】マイク間距離10mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図37】マイク間距離20mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【符号の説明】
【0232】
1…集積回路装置、 2…音声入力装置、 3…集積回路装置、 4、音声入力装置、
10…第1のマイクロフォン、 12…第1の振動膜、 14…第1の電極、 15…第1の振動膜、 16…集積回路、 20…第2のマイクロフォン、 22…第2の振動膜、 24…第2の電極、 25…第2の振動膜、 30…差分信号生成回路、 40…筐体、 42…開口、 50…演算処理部、 60…通信処理部、 100…半導体基板、 102…第1の凹部、 104…第2の凹部、 200…半導体基板、 201…第1の面、 202…第2の面、 210…第1の凹部、 212…開口、 220…第2の凹部、 300…携帯電話、 400…マイク、 500…リモートコントローラ、 600…情報処理システム、 602…音声入力装置、 604…ホストコンピュータ、710−1 第1のマイクロフォン、710−2 第2のマイクロフォン、712−1 第1の電圧信号、712−2 第2の電圧信号、714−1 第1の振動膜、714−2 第2の振動膜、720 差分信号生成回路、760 ゲイン部、740 差分信号出力部、910 ゲイン制御部、1100 導音管、1200 半導体基板、1200’ 配線基板
【技術分野】
【0001】
本発明は、集積回路装置及び音声入力装置、並びに、情報処理システムに関する。
【背景技術】
【0002】
電話などによる通話や、音声認識、音声録音などに際しては、目的の音声(ユーザの音声)のみを収音することが好ましい。しかし、音声入力装置の使用環境では、背景雑音など目的の音声以外の音が存在することがある。そのため、雑音を除去する機能を有する音声入力装置の開発が進んでいる。
【0003】
雑音が存在する使用環境で雑音を除去する技術として、マイクロフォンに鋭い指向性を持たせること、あるいは、音波の到来時刻差を利用して音波の到来方向を識別して信号処理により雑音を除去する方法が知られている。
【0004】
また、近年では、電子機器の小型化が進んでおり、音声入力装置を小型化する技術が重要になっている。
【特許文献1】特開平7−312638号公報
【特許文献2】特開平9−331377号公報
【特許文献3】特開2001−186241号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
マイクロフォンに鋭い指向性を持たせるためには、多数の振動膜を並べる必要があり、小型化は困難である。
【0006】
また、音波の到来時刻差を利用して音波の到来方向を精度よく検出するためには、複数の振動膜を、可聴音波の数波長分の1程度の間隔で設置する必要があるため、小型化は困難である。
【0007】
本発明のいくつかの態様の目的は、外形が小さく、かつ、精度の高い雑音除去機能を有する音声入力素子(マイク素子)の実現が可能な集積回路装置、及び、音声入力装置、並びに、情報処理システムを提供することにある。
【課題を解決するための手段】
【0008】
(1)本発明は、
第1のマイクロフォンを構成する第1の振動膜と、
第2のマイクロフォンを構成する第2の振動膜と、
前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路と、
を含む配線基板を有することを特徴とする。
【0009】
第1の振動膜、前記第2の振動膜、差分信号生成回路は基板内に形成されていても良いし、配線基板上にフリップチップ実装等により実装されていてもよい。
【0010】
配線基板は半導体基板でも良いし、ガラスエポキシ等の他の回路基板等でもよい。
【0011】
第1の振動膜および前記第2の振動膜を同一基板上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。
【0012】
差分信号生成回路は2つのマイクのゲインバランスを調整する機能を有するように構成してもよい。これにより、両マイク間のゲインばらつきを基板毎に調整して出荷することができる。
【0013】
本発明によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理で、雑音成分が除去された音声を示す信号を生成することができる。
【0014】
また本発明によると、高密度実装により外形が小さく、かつ、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。
【0015】
なお、本発明に係る集積回路装置は、接話型の音声入力装置の音声入力素子(マイク素子)として適用することができる。このとき、集積回路装置は、前記第1及び第2の振動膜が、前記差分信号に含まれる前記雑音成分の強度の、前記第1又は第2の電圧信号に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す音声強度比よりも小さくなるように配置されていてもよい。このとき、雑音強度比は雑音の位相差成分に基づく強度比であってもよく、音声強度比は入力音声の振幅成分に基づく強度比であってもよい。
【0016】
なお、この集積回路装置(半導体基板)は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)として構成されていてもよい。また、振動膜については無機圧電薄膜、あるいは有機圧電薄膜を使用して、圧電効果により音響−電気変換するようなものであっても構わない。
【0017】
(2)この集積回路装置は、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜および前記差分信号生成回路は、前記半導体基板に形成されることを特徴とする。
【0018】
(3)この集積回路装置は、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜は前記半導体基板に形成され、前記差分信号生成回路は、前記半導体基板上にフリップチップ実装されることを特徴とする。
【0019】
前記第1の振動膜および前記第2の振動膜を同一の半導体基板上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。
【0020】
フリップチップ実装とは、IC(Integration circuit)素子又はICチップの回路面
を基板に対向させて一括でダイレクトに電気接続する実装方法であり、チップ表面と基板とを電気的に接続する際、ワイヤ・ボンディングのようにワイヤによって接続するのではなく、アレイ状に並んだバンプと呼ばれる突起状の端子によって接続するため、ワイヤ・ボンディングに比べて実装面積を小さくできる。
【0021】
(4)この集積回路装置は、
前記第1の振動膜、および前記第2の振動膜、および前記差分信号生成回路は、前記配線基板上にフリップチップ実装されることを特徴とする。
【0022】
(5)この集積回路装置は、
前記配線基板は半導体基板であって、
前記差分信号生成回路は、半導体基板上に形成され、前記第1の振動膜、および前記第2の振動膜は、前記半導体基板上にフリップチップ実装されることを特徴とする。
【0023】
(6)この集積回路装置は、
前記第1及び第2の振動膜の中心間距離は、5.2mm以下であることを特徴とする。
【0024】
(7)この集積回路装置は、
前記振動膜を、SN比が約60デシベル以上の振動子で構成してもよい。
例えばSN比が60デシベル以上の振動子で構成してもよいし、60±αデシベル以上の振動子で構成してもよい。
【0025】
(8)この集積回路装置は、
前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が0デシベル以下となる距離に設定されていてもよい。
【0026】
(9)この集積回路装置は、
前記第1及び第2の振動膜の中心間距離が、抽出対象周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧が全方位において単体マイクとして使用した場合の音圧を上回らない範囲の距離に設定されていてもよい。
【0027】
抽出対象周波数は、本音声入力装置で抽出したい音の周波数である。例えば7kHz以下の周波数を抽出対象周波数として前記第1及び第2の振動膜の中心間距離が設定されていてもよい。
【0028】
(10)この集積回路装置は、
前記第1及び第2の振動膜は、シリコン膜であることを特徴とする。
【0029】
(11)この集積回路装置は、
前記第1及び第2の振動膜は、法線が平行になるように形成されていることを特徴とする。
【0030】
(12)この集積回路装置は、
前記第1及び第2の振動膜は、法線と直交する方向にずれて配置されていることを特徴とする。
【0031】
(13)この集積回路装置は、
前記第1及び第2の振動膜は、前記半導体基板の1つの面から形成された凹部の底部であることを特徴とする。
【0032】
(14)この集積回路装置は、
前記第1及び第2の振動膜は、法線方向にずれて配置されていることを特徴とする。
【0033】
(15)この集積回路装置は、
前記第1及び第2の振動膜は、それぞれ、前記半導体基板の対向する第1及び第2の面から形成された第1及び第2の凹部の底部であることを特徴とする。
【0034】
(16)この集積回路装置は、
前記第1の振動膜及び前記第2の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管を介して音波を取得するように構成されていることを特徴とする。
【0035】
導音管は、開口部から入力した音波が外部に漏れないよう振動膜まで届くように、振動膜の周囲の基板に密着して設置することにより、導音管に入った音は減衰することなく振動膜に届く。本発明によれば前記第1の振動膜及び前記第2の振動膜の少なくとも一方に導音管を設置することにより、拡散による減衰なしに音が振動膜に届くまでの距離を変えることができる。すなわち、導音管入り口での音の振幅を保ったまま、位相のみを制御することが可能であり、例えば2つのマイクの遅延バランスのばらつきに応じて、適当な長さ(例えば数ミリ)の導音管を設置することにより遅延を解消することができる。
【0036】
(17)この集積回路装置は、
前記差分信号生成回路は、
前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含むことを特徴とする。
【0037】
(18)この集積回路装置は、
前記差分信号生成回路は、
前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号の振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含むことを特徴とする。
【0038】
振幅差検出部は、ゲイン部の出力信号振幅を検出する第1の振幅検出部と、前記第2のマイクロフォンで取得された第2の電圧信号の信号振幅を検出する第2の振幅検出部と、前記第1の振幅検出手段で検出された振幅信号と前記第2の振幅検出手段で検出された振幅信号との差分信号を検出する振幅差信号生成部とを含んで構成してもよい。
【0039】
例えばゲイン調整用にテスト用の音源を用意して、当該音源からの音を第1のマイクロフォンと第2のマイクロフォンに対して等しい音圧で入力されるように設定し、第1のマイクロフォンと第2のマイクロフォンで受音して、出力される第1の電圧信号と第2の電圧信号の波形をモニタして(例えばオシロスコープ等を用いてモニタしてもよい)振幅が一致するように、または振幅差が所定の範囲内になるように増幅率を変更してもよい。
例えば振幅の差がゲイン部の出力信号または第2の電圧信号に対して−3%以上、+3%以下の範囲になるようにしても良いし、−6%以上、+6%以下の範囲になるようにしても良い。前者の場合1kHzの音波に対してノイズ抑圧効果が約10デシベルとなり、後者の場合ノイズ抑圧効果が約6デシベルとなり、適切な抑圧効果をだすことができる。
【0040】
または所定のデシベル(例えば約10デシベル)のノイズ抑圧効果を得るように所定のゲインを制御してもよい。
【0041】
本発明によれば使用時の状況(環境や使用年数)等により変化するマイクロフォンのゲインバランスのばらつきをリアルタイムに検出して調整を行うことができる。
【0042】
(19)この集積回路装置は、
前記差分信号生成部は、
所定の端子にかかる電圧または流れる電流に応じて増幅率が変化するよう構成されたゲイン部と、
前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部を含み、
前記ゲイン制御部は、
複数の抵抗が直列または並列に接続された抵抗アレー含み、前記抵抗アレーを構成する抵抗体又は導体の一部を切断すること、もしくは少なくとも1つの抵抗体を含み、該抵抗体の一部を切断することでゲイン部の所定の端子にかかる電圧または流れる電流を変更可能に構成されていることを特徴とする。
【0043】
抵抗アレーを構成する抵抗体又は導体の一部をレーザによるカット、あるいは高電圧または高電流の印加により溶断することで切断してもよい。
【0044】
マイクロフォンの製造過程で生じる個体差によるゲインバランスのばらつきを調べて、当該ばらつきにより生じる振幅差を解消するように、第1の電圧信号の増幅率を決定する。そして決定した増幅率を実現するための電圧または電流を所定の端子に供給できるように前記抵抗アレーを構成する抵抗体又は導体(例えばヒューズ)の一部を切断して、ゲイン制御部の抵抗値を適切な値に設定する。これによりゲイン部の出力と、前記第2のマイクロフォンで取得された第2の電圧信号との振幅のバランスを調整することができる。
【0045】
(20)本発明は、
上記のいずれかに記載の集積回路装置が実装されていることを特徴とする音声入力装置である。
【0046】
この音声入力装置によると、2つの電圧信号の差を示す差分信号を生成するだけで、雑音成分が除去された、入力音声を示す信号を取得することができる。そのため、本発明によると、精度の高い音声認識処理や、音声認証処理、あるいは、入力音声に基づくコマンド生成処理などの実現を可能にする音声入力装置を提供することができる。
【0047】
(21)本発明は、
上記のいずれかに記載の集積回路装置と、
前記差分信号に基づいて、入力音声情報の解析処理を行う解析処理部と、
を含む情報処理システムである。
【0048】
この情報処理システムによると、解析処理部は、差分信号に基づいて入力音声情報の解析処理を行う。ここで、差分信号は、雑音成分が除去された音声成分を示す信号とみなすことができるため、この差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。
【0049】
本発明に係る情報処理システムは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。
【0050】
(22)本発明は、
上記のいずれかに記載の集積回路装置とネットワークを介した通信処理を行う通信処理装置とが実装された音声入力装置と、
前記ネットワークを介した通信処理によって取得した前記差分信号に基づいて、前記音声入力装置に入力された入力音声情報の解析処理を行うホストコンピュータと、
を含む情報処理システムである。
【0051】
この情報処理システムによると、解析処理部は、差分信号に基づいて入力音声情報の解析処理を行う。ここで、差分信号は、雑音成分が除去された音声成分を示す信号とみなすことができるため、この差分信号を解析処理することによって、入力音声に基づく種々の情報処理が可能になる。
【0052】
本発明に係る情報処理システムは、音声認識処理や、音声認証処理、あるいは、音声に基づくコマンド生成処理などを行うシステムであってもよい。
【発明を実施するための最良の形態】
【0053】
以下、本発明を適用した実施の形態について図面を参照して説明する。ただし、本発明は以下の実施の形態に限定されるものではない。また、本発明は、以下の内容を自由に組み合わせたものを含むものとする。
【0054】
1.集積回路装置の構成
はじめに、図1〜図3を参照して、本発明を適用した実施の形態に係る集積回路装置1の構成について説明する。なお、本実施の形態に係る集積回路装置1は、音声入力素子(マイク素子)として構成され、接話型の音声入力装置等に適用することができる。
【0055】
本実施の形態に係る集積回路装置1は、図1及び図2に示すように、半導体基板100を有する。なお、図1は集積回路装置1(半導体基板100)の斜視図であり、図2は、集積回路装置1の断面図である。半導体基板100は、半導体チップであってもよい。あるいは、半導体基板100は、集積回路装置1となる領域を複数有する半導体ウエハであってもよい。半導体基板100は、シリコン基板であってもよい。
【0056】
半導体基板100には、第1の振動膜12が形成されている。第1の振動膜12は、半導体基板100の所与の面101から形成された第1の凹部102の底部であってもよい。第1の振動膜12は、第1のマイクロフォン10を構成する振動膜である。すなわち、第1の振動膜12は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第1の電極14と対になって第1のマイクロフォン10を構成する。第1の振動膜12に音波が入射すると、第1の振動膜12が振動し、第1の振動膜12と第1の電極14との間隔が変化して、第1の振動膜12と第1の電極14との間の静電容量が変化する。この静電容量の変化を、例えば電圧の変化として出力することによって、第1の振動膜12を振動させる音波(第1の振動膜12に入射する音波)を、電気信号(電圧信号)に変換して出力することができる。以下、第1のマイクロフォン10から出力される電圧信号を、第1の電圧信号と呼ぶ。
【0057】
半導体基板100には、第2の振動膜22が形成されている。第2の振動膜22は、半導体基板100の所与の面101から形成された第2の凹部104の底部であってもよい。第2の振動膜22は、第2のマイクロフォン20を構成する振動膜である。すなわち、第2の振動膜22は音波が入射することによって振動するように形成されており、間隔をあけて対向配置された第2の電極24と対になって第2のマイクロフォン20を構成する。第2のマイクロフォン20は、第1のマイクロフォン10と同様の作用によって、第2の振動膜22を振動させる音波(第2の振動膜22に入射する音波)を、電圧信号に変換して出力する。以下、第2のマイクロフォン20から出力される電圧信号を、第2の電圧信号と呼ぶ。
【0058】
本実施の形態では、第1及び第2の振動膜12,22は半導体基板100に形成されており、例えばシリコン膜であってもよい。すなわち、第1及び第2のマイクロフォン10,20は、シリコンマイク(Siマイク)であってもよい。シリコンマイクを利用することで、第1及び第2のマイクロフォン10,20の小型化、及び、高性能化を実現することができる。第1及び第2の振動膜12,22は、法線が平行になるように配置されていてもよい。また、第1及び第2の振動膜12,22は、法線と直交する方向にずれて配置されていてもよい。
【0059】
第1及び第2の電極14,24は、半導体基板100の一部であってもよく、あるいは、半導体基板100上に配置された導電体であってもよい。また、第1及び第2の電極14,24は、音波の影響を受けない構造をなしていてもよい。例えば、第1及び第2の電極14,24は、メッシュ構造をなしていてもよい。
【0060】
半導体基板100には、集積回路16が形成されている。集積回路16の構成は特に限定されないが、例えば、トランジスタ等の能動素子や、抵抗等の受動素子を含んでいてもよい。
【0061】
本実施の形態に係る集積回路装置は、差分信号生成回路30を有する。差分信号生成回路30は、第1の電圧信号と、第2の電圧信号とを受け付けて、両者の差を示す差分信号を生成(出力)する。差分信号生成回路30では、第1及び第2の電圧信号に対して例えばフーリエ解析などの解析処理を行うことなく、差分信号を生成する処理を行う。差分信号生成回路30は、半導体基板100に構成された集積回路16の一部であってもよい。図3には、差分信号生成回路30の回路図の一例を示すが、差分信号生成回路30の回路構成はこれに限られるものではない。
【0062】
なお、本実施の形態に係る集積回路装置1は、差分信号を所定のゲインを与える(ゲインを上げる場合でもよいし、ゲインを下げる場合でもよい)信号増幅回路をさらに含んでいてもよい。信号増幅回路は、集積回路16の一部を構成していてもよい。ただし、集積回路装置は、信号増幅回路を含まない構成になっていてもよい。
【0063】
本実施の形態に係る集積回路装置1では、第1及び第2の振動膜12,22、及び、集積回路16(差分信号生成回路30)は、1つの半導体基板100に形成されている。半導体基板100は、いわゆるメムス(MEMS:Micro Electro Mechanical Systems)ととらえてもよい。また、振動膜については無機圧電薄膜、あるいは有機圧電薄膜を使用して、圧電効果により音響−電気変換するようなものであっても構わない。第1及び第2の振動膜12,22を、同一基板(半導体基板100)に形成することで、第1及び第2の振動膜12,22を精度よく形成することができるとともに、第1及び第2の振動膜12,22を極めて近接させることが可能になる。
【0064】
前記振動膜を、SN(Signal to Noise)比が約60デシベル以上の振動子で構成してもよい。振動子を差動マイクとして機能させる場合には単体マイクとして機能させる場合に比べてSN比が低下する。従ってSN比に優れた振動子(例えばSN比が60デシベル以上のMEMS振動子)を用いて前記振動膜を構成することで、感度のよい集積回路装置を実現することができる。
【0065】
例えば、単体マイク2個を5mm程度離して配置し、これらの差分をとることで差動マイクを構成し、話者とマイク間の距離を約2.5cm程度(接話型の音声入力装置)の条件で使用する場合には、単体マイクの場合に比べて出力感度が10デシベル程度低下する。すなわち、単体マイクに比べて差動マイクは少なくとも10デシベルはSN比が低下することになる。マイクの実用性を考えた場合、SN比は50デシベル程度必要であるとされているため、差動マイクにおいてこの条件を満たすためには、単体の状態でSN比が約60デシベル以上確保できるような振動子を用いてマイクロフォンを構成する必要があり、これにより、前記感度の低下による影響を鑑みてもマイクとしての機能の必要レベルを満たした集積回路装置を実現することができる。
【0066】
なお、本実施の形態に係る集積回路装置1によると、後述するように、第1及び第2の電圧信号の差を示す差分信号を利用して、雑音成分を除去する機能を実現する。この機能を高精度に実現するために、第1及び第2の振動膜12,22は、一定の制約を満たすように配置してもよい。第1及び第2の振動膜12,14が満たすべき制約の詳細については後述するが、本実施の形態では、第1及び第2の振動膜12,22は、雑音強度比が、入力音声強度比よりも小さくなるように配置されてもよい。これにより、差分信号を、雑音成分が除去された音声成分を示す信号とみなすことが可能になる。第1及び第2の振動膜12,22は、例えば、中心間距離Δrが5.2mm以下になるように配置されていてもよい。
【0067】
本実施の形態に係る集積回路装置1は以上のように構成されていてもよい。これによると、精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。なお、その原理については後述する。
【0068】
2.雑音除去機能
以下、集積回路装置1による音声除去原理、及び、これを実現するための条件について説明する。
【0069】
(1)雑音除去原理
はじめに、雑音除去原理について説明する。
【0070】
音波は、媒質中を進行するにつれ減衰し、音圧(音波の強度・振幅)が低下する。音圧は、音源からの距離に反比例するため、音圧Pは、音源からの距離Rとの関係において、
【0071】
【数1】
と表すことができる。なお、式(1)中、Kは比例定数である。図4には、式(1)を表すグラフを示すが、本図からもわかるように、音圧(音波の振幅)は、音源に近い位置(グラフの左側)では急激に減衰し、音源から離れるほどなだらかに減衰する。本実施の形態に係る集積回路装置では、この減衰特性を利用して雑音成分を除去する。
【0072】
すなわち、集積回路装置1を接話型の音声入力装置に適用する場合、ユーザは、雑音の音源よりも、集積回路装置1(第1及び第2の振動膜12,22)に近い位置で音声を発することになる。そのため、第1及び第2の振動膜12,22の間で、ユーザの音声は大きく減衰し、第1及び第2の電圧信号に含まれるユーザ音声の強度には差が現れる。これに対して雑音成分は、ユーザの音声に比べて音源が遠いため、第1及び第2の振動膜12,22の間でほとんど減衰しない。そのため、第1及び第2の電圧信号に含まれる雑音の強度には、差が現れないとみなすことができる。このことから、第1及び第2の電圧信号の差を検出すれば雑音が消去され、集積回路装置1の近傍で発声されたユーザの音声成分のみが残ることになる。すなわち、第1及び第2の電圧信号の差を検出することで、雑音成分が含まれない、ユーザの音声成分のみを示す電圧信号(差分信号)を取得することができる。そして、この集積回路装置1によると、2つの電圧信号の差を示す差分信号を生成するだけの単純な処理によって、精度よく雑音が除去された、ユーザ音声を示す信号を取得することができる。
【0073】
ただし、音波は位相成分を有する。そのため、より精度の高い雑音除去機能を実現するためには、第1及び第2の電圧信号に含まれる音声成分及び雑音成分の位相差を考慮する必要がある。
【0074】
以下、差分信号を生成することによって雑音除去機能を実現するために、集積回路装置1が満たすべき具体的な条件について説明する。
【0075】
(2)集積回路装置が満たすべき具体的条件
集積回路装置1によると、先に説明したように、第1及び第2の電圧信号の差分を示す差分信号を、雑音を含まない入力音声信号であるとみなす。この集積回路装置によると、差分信号に含まれる雑音成分が、第1又は第2の電圧信号に含まれる雑音成分よりも小さくなったことをもって、雑音除去機能が実現できたと評価することができる。詳しくは、差分信号に含まれる雑音成分の強度の、第1又は第2の電圧信号に含まれる雑音成分の強度に対する比を示す雑音強度比が、差分信号に含まれる音声成分の強度の、第1又は第2の電圧信号に含まれる音声成分の強度に対する比を示す音声強度比よりも小さくなれば、この雑音除去機能が実現されたと評価することができる。
【0076】
以下、この雑音除去機能を実現するために、集積回路装置1(第1及び第2の振動膜12,22)が満たすべき具体的な条件について説明する。
【0077】
はじめに、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する音声の音圧について検討する。入力音声(ユーザの音声)の音源から第1の振動膜12までの距離をRとし、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)の中心間距離をΔrとすれば、位相差を無視すれば、第1及び第2のマイクロフォン10,20で取得される、入力音声の音圧(強度)P(S1)及びP(S2)は、
【0078】
【数2】
と表すことができる。
【0079】
そのため、入力音声の位相差を無視した時の、第1のマイクロフォン10で取得される入力音声成分の強度に対する、差分信号に含まれる入力音声成分の強度の比率を示す音声強度比ρ(P)は、
【0080】
【数3】
と表される。
【0081】
ここで、本実施の形態に係る集積回路装置が接話式の音声入力装置に利用されるマイク素子である場合、ΔrはRに比べて充分小さいとみなすことができるため、上述の式(4)は、
【0082】
【数4】
と変形することができる。
【0083】
すなわち、入力音声の位相差を無視した場合の音声強度比は、式(A)と表されることがわかる。
【0084】
ところで、入力音声の位相差を考慮すると、ユーザ音声の音圧Q(S1)及びQ(S2)は、
【0085】
【数5】
と表すことができる。なお、式中、αは位相差である。
【0086】
このとき、音声強度比ρ(S)は、
【0087】
【数6】
と表される。式(7)を考慮すると、音声強度比ρ(S)の大きさは、
【0088】
【数7】
と表すことができる。
【0089】
ところで、式(8)のうち、sinωt−sin(ωt−α)項は位相成分の強度比を示し、Δr/R sinωt項は振幅成分の強度比を示す。入力音声成分であっても、位相差成分は、振幅成分に対するノイズとなるため、入力音声(ユーザの音声)を精度よく抽出するためには、位相成分の強度比が、振幅成分の強度比よりも充分に小さいことが必要である。すなわち、sinωt−sin(ωt−α)と、Δr/R sinωtとは、
【0090】
【数8】
の関係を満たしていることが必要である。
【0091】
ここで、
【0092】
【数9】
と表すことができるため、上述の式(B)は、
【0093】
【数10】
と表すことができる。
【0094】
式(10)の振幅成分を考慮すると、本実施の形態に係る集積回路装置1は、
【0095】
【数11】
を満たす必要があることがわかる。
【0096】
なお、上述したように、ΔrはRに比べて充分小さいとみなすことができるため、sin(α/2)は充分小さいとみなすことができ、
【0097】
【数12】
と近似することができる。
そのため、式(C)は、
【0098】
【数13】
と変形することができる。
また、位相差であるαとΔrとの関係を、
【0099】
【数14】
と表せば、式(D)は、
【0100】
【数15】
と変形することができる。
【0101】
すなわち、本実施の形態では、入力音声(ユーザの音声)を精度よく抽出するためには、集積回路装置1が式(E)に示す関係を満たすことが必要である。
【0102】
次に、第1及び第2のマイクロフォン10,20(第1及び第2の振動膜12,22)に入射する雑音の音圧について検討する。
【0103】
第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅を、A,A´とすると、位相差成分を考慮した雑音の音圧Q(N1)及びQ(N2)は、
【0104】
【数16】
と表すことができ、第1のマイクロフォン10で取得される雑音成分の強度に対する、差分信号に含まれる雑音成分の強度の比率を示す雑音強度比ρ(N)は、
【0105】
【数17】
と表すことができる。
【0106】
なお、先に説明したように、第1及び第2のマイクロフォン10,20で取得される雑音成分の振幅(強度)はほぼ同じであり、A=A´と扱うことができる。そのため、上記の式(15)は、
【0107】
【数18】
と変形することができる。
そして、雑音強度比の大きさは、
【0108】
【数19】
と表すことができる。
ここで、上述の式(9)を考慮すると、式(17)は、
【0109】
【数20】
と変形することができる。
【0110】
そして、式(11)を考慮すると、式(18)は、
【0111】
【数21】
と変形することができる。
【0112】
ここで、式(D)を参照すれば、雑音強度比の大きさは、
【0113】
【数22】
と表すことができる。なお、Δr/Rとは、式(A)に示すように、入力音声(ユーザ音声)の振幅成分の強度比である。式(F)から、この集積回路装置1では、雑音強度比が入力音声の強度比Δr/Rよりも小さくなることがわかる。
【0114】
以上のことから、入力音声の位相成分の強度比が振幅成分の強度比よりも小さくなる集積回路装置1によれば(式(B)参照)、雑音強度比が入力音声強度比よりも小さくなる(式(F)参照)。逆に言うと、雑音強度比が入力音声強度比よりも小さくなるように設計された集積回路装置1によると、精度の高い雑音除去機能を実現することができる。
【0115】
3.集積回路装置の製造方法
以下、本実施の形態に係る集積回路装置の製造方法について説明する。本実施の形態では、第1及び第2の振動膜12,22の中心間距離Δrと雑音の波長λとの比率を示すΔr/λの値と、雑音強度比(雑音の位相成分に基づく強度比)との対応関係を示すデータを利用して、集積回路装置を製造してもよい。
【0116】
雑音の位相成分に基づく強度比は、上述した式(18)で表される。そのため、雑音の位相成分に基づく強度比のデシベル値は、
【0117】
【数23】
と表すことができる。
【0118】
そして、式(20)のαに各値を代入すれば、位相差αと雑音の位相成分に基づく強度比との対応関係を明らかにすることができる。図5には、横軸をα/2πとし、縦軸に雑音の位相成分に基づく強度比(デシベル値)を取った時の、位相差と強度比との対応関係を表すデータの一例を示す。
【0119】
なお、位相差αは、式(12)に示すように、距離Δrと波長λとの比であるΔr/λの関数で表すことができ、図5の横軸は、Δr/λとみなすことができる。すなわち、図5は、雑音の位相成分に基づく強度比と、Δr/λとの対応関係を示すデータであるといえる。
【0120】
本実施の形態では、このデータを利用して、集積回路装置1を製造する。図6は、このデータを利用して集積回路装置1を製造する手順について説明するためのフローチャート図である。
【0121】
はじめに、雑音の強度比(雑音の位相成分に基づく強度比)と、Δr/λとの対応関係を示すデータ(図5参照)を用意する(ステップS10)。
【0122】
次に、用途に応じて、雑音の強度比を設定する(ステップS12)。なお、本実施の形態では、雑音の強度が低下するように雑音の強度比を設定する必要がある。そのため、本ステップでは、雑音の強度比を、0dB以下に設定する。
【0123】
次に、当該データに基づいて、雑音の強度比に対応するΔr/λの値を導出する(ステップS14)。
【0124】
そして、λに主要な雑音の波長を代入することによって、Δrが満たすべき条件を導出する(ステップS16)。
【0125】
具体例として、主要な雑音が1kHzであり、その波長が0.347mとなる環境下で、雑音の強度が20dB低下する集積回路装置を製造する場合について考える。
【0126】
はじめに、必要条件として、雑音の強度比が0dB以下になるための条件について検討する。図5を参照すると、雑音の強度比を0dB以下とするためには、Δr/λの値を0.16以下とすればよいことがわかる。すなわち、Δrの値が55.46mm以下とすればよいことがわかり、これが、この集積回路装置の必要条件となる。
【0127】
次に、1kHzの雑音の強度を20dB低下させるための条件について考える。図5を参照すると、雑音の強度を20dB低下させるためには、Δr/λの値を0.015とすればよいことがわかる。そして、λ=0.347mとすると、Δrの値が5.20mm以下のときに、この条件を満たすことがわかる。すなわち、第1及び第2の振動膜12,22(第1及び第2のマイクロフォン10,20)の中心間距離Δrを約5.2mm以下に設定すれば、雑音除去機能を有する集積回路装置を製造することが可能になる。
【0128】
なお、本実施の形態に係る集積回路装置1は接話式の音声入力装置に利用されるため、ユーザの音声の音源と集積回路装置1(第1又は第2の振動膜12,22)との間隔は、通常5cm以下である。また、ユーザ音声の音源と集積回路装置1(第1及び第2の振動膜12,22)との間隔は、筐体の設計によって制御することが可能である。そのため、入力音声(ユーザの音声)の強度比であるΔr/Rの値は、0.1(雑音の強度比)よりも大きくなり、雑音除去機能が実現されることがわかる。
【0129】
なお、通常、雑音は単一の周波数に限定されるものではない。しかし、主要な雑音として想定された雑音よりも周波数の低い雑音は、当該主要な雑音よりも波長が長くなるため、Δr/λの値は小さくなり、この集積回路装置によって除去される。また、音波は、周波数が高いほどエネルギーの減衰が早い。そのため、主要な雑音として想定された雑音よりも周波数の高い雑音は、当該主要な雑音よりも早く減衰するため、集積回路装置に与える影響を無視することができる。このことから、本実施の形態に係る集積回路装置は、主要な雑音として想定された雑音とは異なる周波数の雑音が存在する環境下でも、優れた雑音除去機能を発揮することができる。
【0130】
また、本実施の形態では、式(12)からもわかるように、第1及び第2の振動膜12,22を結ぶ直線上から入射する雑音を想定した。この雑音は、第1及び第2の振動膜12,22の見かけ上の間隔が最も大きくなる雑音であり、現実の使用環境において、位相差が最も大きくなる雑音である。すなわち、本実施の形態に係る集積回路装置1は、位相差が最も大きくなる雑音を除去することが可能に構成されている。そのため、本実施の形態に係る集積回路装置1によると、すべての方向から入射する雑音が除去される。
【0131】
4.効果
以下、集積回路装置1が奏する効果についてまとめる。
【0132】
先に説明したように、集積回路装置1によると、第1及び第2のマイクロフォン10,20で取得された電圧信号の差分を示す差分信号を生成するだけで、雑音成分が除去された音声成分を取得することができる。すなわち、この音声入力装置では、複雑な解析演算処理を行うことなく雑音除去機能を実現することができる。そのため、簡単な構成で、精度の高い雑音除去機能を実現することが可能な集積回路装置(マイク素子・音声入力素子)を提供することができる。
【0133】
特に、第1及び第2の振動膜の中心間距離Δrを5.2mm以下に設定することで、位相歪が少なく、より精度の高い雑音除去機能を実現することが可能な集積回路装置を提供することができる。
【0134】
また前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して、第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が、0デシベル以下となる距離に設定してもよい。
【0135】
前記第1及び第2の振動膜を音源の音(例えば音声)の進行方向に沿って配置して、前記進行方向からの10kHz以下の周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧の位相成分が単体マイクとして使用した場合の音圧を上回らない範囲の距離に前記第1及び第2の振動膜の中心間距離を設定してもよい。
【0136】
集積回路装置が奏する遅延歪除去効果について説明する。
【0137】
先に説明したように、ユーザ音声強度比ρ(S)は以下の式(8)で表される。
【0138】
【数24】
ここで、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、sinωt−sin(ωt−α)の項である。式(8)に、
【0139】
【数25】
と
【0140】
【数26】
を代入すると、ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは、以下の式で表すことができる。
【0141】
【数27】
したがって、ユーザ音声強度比ρ(S)の位相成分ρ(S)p haseに基づく強度比のデシベル値は、以下の式で表すことができる。
【0142】
【数28】
そして、式(22)のαに各値を代入すれば、位相差αと、ユーザ音声の位相成分に基づく強度比との対応関係を明らかにすることができる。
【0143】
図26から図28はマイク間距離とユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの関係について説明するための図である。図26から図28の横軸はΔr/λであり、縦軸はユーザ音声強度比ρ(S)の位相成分ρ(S)phaseである。ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseとは差動マイクと単体マイクの音圧比の位相成分(ユーザ音声の位相成分に基づく強度比)であり、差動マイクを構成するマイクを単体マイクとして使用した場合の音圧が差動音圧と同じになるところを0デシベルとしている。
【0144】
すなわち図26から図28のグラフは、Δr/λに対応した差動音圧の遷移を示しており、縦軸が0デシベル以上のエリアは、遅延歪(ノイズ)が大きいと考えることができる。
【0145】
現行の電話回線は3.4kHzの音声周波数帯域で設計されているが、より高品質な音声通信を実現しようとした場合、7kHz以上、好ましくは10kHzの音声周波数帯域が必要とされる。以下、10kHzの音声周波数帯域を想定した場合における、遅延による音声歪みの影響について考察する。
【0146】
図26はマイク間距離(Δr)が5mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
【0147】
マイク間距離が5mmの場合には、図26に示すように1kHz、7kHz、10kHzのいずれの周波数の音についても音ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下である。
【0148】
また図27はマイク間距離(Δr)が10mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合のユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
【0149】
マイク間距離が10mmになると、図27に示すように1kHz、7kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、10kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延ひずみ(ノイズ)が大きくなっている。
【0150】
また図28はマイク間距離(Δr)が20mmである場合の、1kHz、7kHz、10kHzの周波数の音を差動マイクでとらえた場合の音ユーザ音声強度比ρ(S)の位相成分ρ(S)phaseの分布を示している。
【0151】
マイク間距離が20mmになると、図28に示すように1kHzの周波数の音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseは0デシベル以下であるが、7kHz、10kHzの音についてはユーザ音声強度比ρ(S)の位相成分ρ(S)phaseが0デシベル以上となり遅延ひずみ(ノイズ)が大きくなっている。
【0152】
ここで、マイク間距離を短くするほど、話者音声の位相歪みを抑えられて忠実性は良くなるが、逆に差動マイクの出力レベルが低下して、SN比が低下してしまう。したがって、実用性を考えた場合、最適なマイク間距離範囲が存在する。
従ってマイク間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、周波数が10kHz帯域まで話者音声を忠実に抽出し、かつ実用レベルのSN比を確保し、遠方雑音の抑制効果の高い音声入力装置を実現することができる。
【0153】
本実施の形態では第1及び第2の振動膜の中心間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、10kHz帯域まで話者音声を忠実に抽出し、かつ遠方雑音の抑制効果の高い集積回路装置を実現することができる。
【0154】
また、集積回路装置1では、位相差に基づく雑音強度比が最も大きくなるように入射する雑音を除去することができるように、第1及び第2の振動膜12,22が配置されている。そのため、この集積回路装置1によると、全方位から入射する雑音が除去される。すなわち、本発明によると、全方位から入射する雑音を除去することが可能な集積回路装置を提供することができる。
【0155】
図29(A)(B)から図37(A)(B)は音源周波数とマイク間距離Δrとマイク−音源間の距離毎の差動マイクの指向性について説明するための図である。
【0156】
図29(A)(B)は音源の周波数が1kHz、マイク間距離が5mm、マイク−音源間距離がそれぞれ2.5cm(接話型の話者の口元からマイクまでの距離に相当)および1m(遠方雑音に相当)の場合の差動マイクの指向性を示す図である。
【0157】
1116は差動マイクの全方位に対する感度(差動音圧)を示すグラフであり、差動マイクの指向特性を示している。また1112は差動マイクを単体マイクとして使用した場合の全方位に対する感度(音圧)を示すグラフであり、単体マイクの均等特性を示している。
【0158】
1114はマイクを2つ用いて差動マイクを構成する場合の両マイクを結ぶ直線の方向又はマイクを1つで差動マイクを実現する場合にマイクの両面に音波を到達させるための第1の振動膜と第2の振動膜を結ぶ直線の方向(0度−180度、差動マイクを構成する2つのマイクM1、M2又は第1の振動膜と第2の振動膜はこの直線上に置かれている)を示している。この直線の方向を0度、180度とし、この直線の方向と直角な方向を90度、270度とする。
【0159】
1112、1122に示すように単体マイクは全方位から均一に音を取っており指向性を有していない。また音源が遠くなるほど取得する音圧は減衰している。
【0160】
1116、1120に示すように差動マイクは90度、270度方向で多少感度が落ちるが全方位にほぼ均一な指向性を有している。また単体マイクより取得する音圧が減衰しており、単体マイクと同様に音源が遠くなるほど取得する音圧は減衰している。
【0161】
図29(B)に示すように音源の周波数帯域が1kHz、マイク間距離が5mmの場合には、差動マイクの指向性を示す差動音圧のグラフ1120の示す領域は単体マイクの均等特性を示すグラフ1122の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0162】
図30(A)(B)は音源の周波数が1kHz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を説明する図である。かかる場合にも、図30(B)に示すように、差動マイクの指向性を示すグラフ1140の示す領域は単体マイクの均等特性を示すグラフ1422の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0163】
図31(A)(B)は音源の周波数が1kHz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図31(B)に示すように、差動マイクの指向性を示すグラフ1160の示す領域は単体マイクの均等特性を示すグラフ1462の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0164】
図32(A)(B)は音源の周波数が7kHz、マイク間距離Δrが5mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図32(B)に示すように、差動マイクの指向性を示すグラフ1180の示す領域は単体マイクの均等特性を示すグラフ1182の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0165】
図33(A)(B)は音源の周波数が7kHz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合には、図33(B)に示すように、差動マイクの指向性を示すグラフ1200の示す領域は単体マイクの均等特性を示すグラフ1202の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
【0166】
図34(A)(B)は音源の周波数が7kHz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図34(B)に示すように、差動マイクの指向性を示すグラフ1220の示す領域は単体マイクの均等特性を示すグラフ1222の示す領域に内包されておらず、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているとはいえない。
【0167】
図35(A)(B)は音源の周波数が300Hz、マイク間距離Δrが5mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合には、図35(B)に示すように、差動マイクの指向性を示すグラフ1240の示す領域は単体マイクの均等特性を示すグラフ1242の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0168】
図36(A)(B)は音源の周波数が300Hz、マイク間距離Δrが10mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図36(B)に示すように、差動マイクの指向性を示すグラフ1260の示す領域は単体マイクの均等特性を示すグラフ1262の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0169】
図37(A)(B)は音源の周波数が300Hz、マイク間距離Δrが20mm、マイク−音源間距離がそれぞれ2.5cm及び1mの場合の差動マイクの指向性を示す図である。かかる場合にも、図37(B)に示すように、差動マイクの指向性を示すグラフ1280の示す領域は単体マイクの均等特性を示すグラフ1282の示す領域に内包されており、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0170】
マイク間距離が5mmである場合には、図29(B)、図32(B)、図35(B)に示すように音の周波数が1kHz、7kHz、300Hzのいずれの場合についても、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されている。すなわちマイク間距離が5mmである場合については音の周波数が7kHz以下の帯域では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえる。
【0171】
ところがマイク間距離が10mmである場合には、図30(B)、図33(B)、図36(B)に示すように音の周波数が7kHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が10mmである場合については音の周波数が7kHz付近(又は7kHz以上)では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。
【0172】
またマイク間距離が20mmである場合には、図31(B)、図34(B)、図37(B)に示すように音の周波数が7kHzの場合には、差動マイクの指向性を示すグラフの示す領域は単体マイクの均等特性を示すグラフの示す領域に内包されていない。すなわちマイク間距離が20mmである場合については音の周波数が7kHz付近(又は7kHz以上)では、差動マイクは単体マイクに比べ遠方雑音の抑制効果に優れているといえない。
【0173】
差動マイクのマイク間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、7kHz以下の音については指向性によらず全方位の遠方雑音の抑圧効果が単体マイクに比べ高くなる。従って第1及び第2の振動膜の中心間距離を約5mm〜6mm程度(より具体的には5.2mm以下)にすることで、7kHz以下の音については指向性によらず全方位の遠方雑音を抑圧することが可能な集積回路装置を実現することができる。
【0174】
なお、集積回路装置1によると、壁などで反射した後に集積回路装置1に入射したユーザ音声成分も除去することができる。詳しくは、壁などで反射したユーザ音声の音源は、長距離を伝搬した後に集積回路装置1に入射するため、通常のユーザ音声の音源よりも遠いとみなすことができ、かつ、反射により大きくエネルギーを消失しているため、雑音成分と同様に、第1及び第2の振動膜12,22の間で音圧が大きく減衰することがない。そのため、この集積回路装置1によると、壁などで反射した後に入射するユーザ音声成分も、雑音と同様に(雑音の一種として)除去される。
【0175】
また、集積回路装置1によると、第1及び第2の振動膜12,22と、差分信号生成回路30とが1つの半導体基板100に形成されている。これによると、第1及び第2の振動膜12,22を、高精度に形成することができ、また、第1及び第2の振動膜12,22の中心間距離を極めて近接させることができる。そのため、雑音除去精度が高く、かつ、外形が小さい集積回路装置を提供することができる。
【0176】
そして、集積回路装置1を利用すれば、雑音を含まない、入力音声を示す信号を取得することができる。そのため、この集積回路装置を利用することで、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
【0177】
5.音声入力装置
次に、集積回路装置1を有する音声入力装置2について説明する。
【0178】
(1)音声入力装置の構成
はじめに、音声入力装置2の構成について説明する。図7及び図8は、音声入力装置2の構成について説明するための図である。なお、以下に説明する音声入力装置2は、接話式の音声入力装置であって、例えば、携帯電話やトランシーバー等の音声通信機器や、入力された音声を解析する技術を利用した情報処理システム(音声認証システム、音声認識システム、コマンド生成システム、電子辞書、翻訳機や、音声入力方式のリモートコントローラなど)、あるいは、録音機器やアンプシステム(拡声器)、マイクシステムなどに適用することができる。
【0179】
図7は、音声入力装置2の構造を説明するための図である。
【0180】
音声入力装置2は、筐体40を有する。筐体40は、音声入力装置2の外形を構成する部材であってもよい。筐体40には基本姿勢が設定されていてもよく、これにより、入力音声(ユーザの音声)の進行径路を規制することができる。筐体40には、入力音声(ユーザの音声)を受け付けるための開口42が形成されていてもよい。
【0181】
音声入力装置2では、集積回路装置1は、筐体40に設置される。集積回路装置1は、第1及び第2の凹部102,104が開口42に連通するように、筐体40に設置されていてもよい。集積回路装置1は、第1及び第2の振動膜12,22が入力音声の進行径路に沿ってずれて配置されるように、筐体40に設置されていてもよい。そして、入力音声の進行径路の上流側に配置される振動膜を第1の振動膜12とし、下流側に配置される振動膜を第2の振動膜22としてもよい。
【0182】
次に、図8を参照して、音声入力装置2の機能について説明する。なお、図8は、音声入力装置2の機能を説明するためのブロック図である。
【0183】
音声入力装置2は、第1及び第2のマイクロフォン10,20を有する。第1及び第2のマイクロフォン10,20は、第1及び第2の電圧信号を出力する。
【0184】
音声入力装置2は、差分信号生成回路30を有する。差分信号生成回路30は、第1及び第2のマイクロフォン10,20から出力された第1及び第2の電圧信号を受け付けて、両者の差を示す差分信号を生成する。
【0185】
なお、第1及び第2のマイクロフォン10,20と、差分信号生成回路30とは、1つの半導体基板100で実現される。
【0186】
音声入力装置2は、演算処理部50を有していてもよい。演算処理部50は、差分信号生成回路30で生成された差分信号に基づいて各種の演算処理を行う。演算処理部50は、差分信号に対する解析処理を行ってもよい。演算処理部50は、差分信号を解析することにより、入力音声を発した人物を特定する処理(いわゆる音声認証処理)を行ってもよい。あるいは、演算処理部50は、差分信号を解析処理することにより、入力音声の内容を特定する処理(いわゆる音声認識処理)を行ってもよい。演算処理部50は、入力音声に基づいて、各種のコマンドを作成する処理を行ってもよい。演算処理部50は、差分信号を所定のゲインを与える(ゲインを上げる場合でもよいし、ゲインを下げる場合でもよい)処理を行ってもよい。また、演算処理部50は、後述する通信処理部60の動作を制御してもよい。なお、演算処理部50は、上記各機能を、CPUやメモリによる信号処理によって実現してもよい。
【0187】
音声入力装置2は、通信処理部60をさらに含んでいてもよい。通信処理部60は、音声入力装置と、他の端末(携帯電話端末や、ホストコンピュータなど)との通信を制御する。通信処理部60は、ネットワークを介して、他の端末に信号(差分信号)を送信する機能を有していてもよい。通信処理部60は、また、ネットワークを介して、他の端末から信号を受信する機能を有していてもよい。そして、例えばホストコンピュータで、通信処理部60を介して取得した差分信号を解析処理して、音声認識処理や音声認証処理、コマンド生成処理や、データ蓄積処理など、種々の情報処理を行ってもよい。すなわち、音声入力装置は、他の端末と協働して、情報処理システムを構成していてもよい。言い換えると、音声入力装置は、情報処理システムを構築する情報入力端末であるとみなしてもよい。ただし、音声入力装置は、通信処理部60を有しない構成となっていてもよい。
【0188】
なお、上述した演算処理部50及び通信処理部60は、パッケージングされた半導体装置(集積回路装置)として、筐体40内に配置されていてもよい。ただし、本発明はこれに限られるものではない。例えば、演算処理部50は、筐体40の外部に配置されていてもよい。演算処理部50が筐体40の外部に配置されている場合、演算処理部50は、通信処理部60を介して、差分信号を取得してもよい。
【0189】
なお、音声入力装置2は、表示パネルなどの表示装置や、スピーカ等の音声出力装置をさらに含んでいてもよい。また、本実施の形態に係る音声入力装置は、操作情報を入力するための操作キーをさらに含んでいてもよい。
【0190】
音声入力装置2は、以上の構成をなしていてもよい。この音声入力装置2は、マイク素子(音声入力素子)として集積回路装置1を利用する。そのため、この音声入力装置2は、雑音を含まない、入力音声を示す信号を取得することができ、精度の高い音声認識や音声認証、コマンド生成処理を実現することができる。
【0191】
また、音声入力装置2をマイクシステムに適用すれば、スピーカから出力されるユーザの声も、雑音として除去される。そのため、ハウリングが起こりにくいマイクシステムを提供することができる。
【0192】
6.変形例
以下、本発明を適用した実施の形態の変形例について説明する。
【0193】
図9は、本実施の形態に係る集積回路装置3について説明するための図である。
【0194】
本実施の形態に係る集積回路装置3は、図9に示すように、半導体基板200を有する。半導体基板200には、第1及び第2の振動膜12,22が形成されている。ここで、第1の振動膜15は、半導体基板200の第1の面201から形成された第1の凹部210の底部である。また、第2の振動膜25は、半導体基板200の第2の面202(第1の面201と対向する面)から形成された第2の凹部220の底部である。すなわち、集積回路装置3(半導体基板200)によると、第1及び第2の振動膜15,25は、法線方向に(半導体基板200の厚み方向に)ずれて配置される。なお、半導体基板200では、第1及び第2の振動膜15,25は、法線距離が5.2mm以下になるように配置されていてもよい。あるいは、第1及び第2の振動膜15,25は、中心間距離が5.2mm以下になるように配置されていてもよい。
【0195】
図10は、集積回路装置3が実装された音声入力装置4について説明するための図である。集積回路装置3は、筐体40に実装される。集積回路装置3は、図3に示すように、第1の面201が、筐体40の開口42が形成された面を向くように、筐体40に実装されていてもよい。そして、集積回路装置3は、第1の凹部210が開口42に連通するように、かつ、第2の振動膜25が開口42と重複するように、筐体40に実装されていてもよい。
【0196】
本実施の形態では、集積回路装置3は、第1の凹部210に連通する開口212の中心が、第2の振動膜25(第2の凹部220の底面)の中心よりも、入力音声の音源に近い位置に配置されるように設置されていてもよい。集積回路装置3は、入力音声が、第1及び第2の振動膜15,25に、同時に到着するように設置されていてもよい。例えば、集積回路装置3は、入力音声の音源(モデル音源)と第1の振動膜15との間隔が、モデル音源と第2の振動膜25との間隔と同じになるように設置されていてもよい。集積回路装置3は、上記の条件を満たすように、基本姿勢が設定された筐体に設置されていてもよい。
【0197】
本実施の形態に係る音声入力装置によると、第1及び第2の振動膜15,25に入射する入力音声(ユーザの音声)の、入射時間のずれを低減することができる。そのため、入力音声の位相差成分が含まれないように差分信号を生成することができることから、入力音声の振幅成分を精度よく抽出することが可能になる。
【0198】
なお、凹部(第1の凹部210)内では音波は拡散しないため、音波の振幅ほとんど減衰しない。そのため、この音声入力装置では、第1の振動膜15を振動させる入力音声の強度(振幅)は、開口212における入力音声の強度と同じとみなすことができる。このことから、音声入力装置が、入力音声が第1及び第2の振動膜15,25に同時に到達するように構成されている場合でも、第1及び第2の振動膜15,25を振動させる入力音声の強度には差が現れる。そのため、第1及び第2の電圧信号の差を示す差分信号を取得することで、入力音声を抽出することができる。
【0199】
まとめると、この音声入力装置によると、入力音声の位相差成分に基づくノイズを含まないように、入力音声の振幅成分(差分信号)を取得することができる。そのため、精度の高い雑音除去機能を実現することが可能になる。
【0200】
最後に、図11〜図13に、本発明の実施の形態に係る音声入力装置の例として、携帯電話300、マイク(マイクシステム)400、及び、リモートコントローラ500を、それぞれ示す。また、図14には、情報入力端末としての音声入力装置602と、ホストコンピュータ604とを含む、情報処理システム600の概略図を示す。
【0201】
7.集積回路装置の構成
上記実施の形態では、第1のマイクロフォンを構成する第1の振動膜と第2のマイクロフォンを構成する第2の振動膜と差分信号生成回路が半導体基板に形成される場合を例にとり説明したがこれに限られない。第1のマイクロフォンを構成する第1の振動膜と、第2のマイクロフォンを構成する第2の振動膜と、前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路と、を含む配線基板を有する集積回路装置であれば本発明の範囲内である。第1の振動膜、前記第2の振動膜、差分信号生成回路は基板内に形成されていても良いし、配線基板上にフリップチップ実装等により実装されていてもよい。
【0202】
配線基板は半導体基板でも良いし、ガラスエポキシ等の他の回路基板等でもよい。
【0203】
第1の振動膜および前記第2の振動膜を同一基板上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。差分信号生成回路は2つのマイクのゲインバランスを調整する機能を有するように構成してもよい。これにより、両マイク間のゲインばらつきを基板毎に調整して出荷することができる。
【0204】
図15〜図17は、本実施の形態の集積回路装置の他の構成について説明するための図である。
【0205】
本実施の形態の集積回路装置は図15に示すように、配線基板は半導体基板1200であって、第1の振動膜714−1および前記第2の振動膜714−2は半導体基板1200に形成され、差分信号生成回路720は、半導体基板上1200にフリップチップ実装された構成でもよい。
【0206】
フリップチップ実装とは、IC(Integrated circuit)素子又はICチップの回路面を基板に対向させて一括でダイレクトに電気接続する実装方法であり、チップ表面と基板とを電気的に接続する際、ワイヤ・ボンディングのようにワイヤによって接続するのではなく、アレイ状に並んだバンプと呼ばれる突起状の端子によって接続するため、ワイヤ・ボンディングに比べて実装面積を小さくできる。
【0207】
第1の振動膜714−1および第2の振動膜714−2を同一の半導体基板1200上に形成することで、温度等の環境に対する両マイクの特性差を抑圧することができる。
【0208】
また本実施の形態の集積回路装置は図16に示すように、第1の振動膜714−1および第2の振動膜714−2および差分信号生成回路720は、配線基板1200’上にフリップチップ実装された構成でもよい。配線基板1200’は、配線基板は半導体基板でも良いし、ガラスエポキシ等の他の回路基板等でもよい。
【0209】
また本実施の形態の集積回路装置は図17に示すように、配線基板は半導体基板1200であって、差分信号生成回路720は、半導体基板1200上に形成され、前記第1の振動膜714−1、および第2の振動膜714−2は、半導体基板1200上にフリップチップ実装された構成でもよい。
【0210】
図18、19は本実施の形態の集積回路装置の構成の一例を示す図である。
【0211】
本実施の形態の集積回路装置700は、第1の振動膜を有する第1のマイクロフォン710−1を含む。また第4の実施の形態の音声入力装置700は、第2の振動膜を有する第2のマイクロフォン710−2を含む。
【0212】
第1のマイクロフォン710−1の第1の振動膜及び第2のマイクロフォン710−2の第1の振動膜は、差分信号742に含まれる雑音成分の強度の、前記第1又は第2の電圧信号712−1,712−2に含まれる前記雑音成分の強度に対する比率を示す雑音強度比が、前記差分信号742に含まれる入力音声成分の強度の、前記第1又は第2の電圧信号に含まれる前記入力音声成分の強度に対する比率を示す入力音声強度比よりも小さくなるように配置されている。
【0213】
本実施の形態の集積回路装置700は、前記第1のマイクロフォン710−1で取得された第1の電圧信号712−1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2とに基づき第1の電圧信号712−1と第2の電圧信号712−2の差分信号を742生成する差分信号生成部720を含む。
【0214】
また差分信号生成部720は、ゲイン部760を含む。ゲイン部760は、第1のマイクロフォン710−1で取得された第1の電圧信号712−1を所定のゲインを与えて出力する。
【0215】
また差分信号生成部720は、差分信号出力部740を含む。差分信号出力部に740は、ゲイン部760によって所定のゲインを与えられた第1の電圧信号S1と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号S1と第2の電圧信号との差分信号を生成して出力する。
【0216】
第1の電圧信号712−1を所定のゲインを与えることにより、2つのマイクロフォンの個体感度差に起因する第1の電圧信号及び第2の電圧信号の振幅差が無くなるように補正することができるので、ノイズ抑制効果の低減を防止することができる。
【0217】
図20、21は本実施の形態の集積回路装置の構成の一例を示す図である。
【0218】
本実施の形態の差分信号生成部720は、ゲイン制御部910を含んで構成してもよい。ゲイン制御部910は、ゲイン部760におけるゲインを変化させる制御を行う。ゲイン制御部910でゲイン部760のゲインをダイナミックにまたはスタティックに制御するとこで、ゲイン部出力S1と、前記第2のマイクロフォンで取得された第2の電圧信号712−2との振幅のバランスを調整してもよい。
【0219】
図22はゲイン部とゲイン制御部の具体的構成の一例を示す図である。例えばアナログ信号を処理する場合にはゲイン部760を、オペアンプ(例えば図22に示すような非反転増幅回路)などのアナログ回路で構成してもよい。抵抗R1、R2の値を変更することにより、又は例えば製造時に所定の値に設定することで、オペアンプの−端子にかかる電圧をダイナミックまたはスタティックに制御することでオペアンプの増幅率を制御してもよい。
【0220】
図23(A)(B)は、ゲイン部の増幅率をスタティックに制御する構成の一例である。
【0221】
例えば図22の抵抗R1又R2を、図23(A)に示すように複数の抵抗が直列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子(図22の−端子)に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体又は導体(912のF)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
【0222】
また例えば図32の抵抗R1又R2を、図23(B)に示すように複数の抵抗が並列に接続された抵抗アレーを含み、当該抵抗アレーを介してゲイン部の所定の端子(図22の−端子)に所定の大きさの電圧をかけるよう構成してもよい。適切な増幅率を求めて、当該増幅率を実現するための抵抗値をとるように、製造段階において、前記抵抗アレーを構成する抵抗体又は導体(912のF)をレーザによるカット、あるいは高電圧または高電流の印加により溶断してもよい。
【0223】
ここで適切な増幅値は、製造工程で生じたマイクロフォンのゲインバランスを解消できる値に設定するとよい。図23(A)(B)のように複数の抵抗が直列又は並列に接続された抵抗アレーを用いることにより、製造工程で生じたマイクロフォンのゲインバランスに対応した抵抗値を作り込むことができ、所定の端子に接続され、前記ゲイン部のゲインを制御する電流を供給するゲイン制御部として機能する。
【0224】
なお上記実施の形態では複数の抵抗体(r)がヒューズ(F)を介して接続されている構成を例にとり説明したがこれに限られない。複数の抵抗(r)がヒューズ(F)を介さずに直列または並列に接続されている構成でもよく、この場合少なくとも1つの抵抗を切断してもよい。
【0225】
また、例えば図23の抵抗R1又R2を、図25に示すように1つの抵抗体で構成し、抵抗体の一部を切断する、いわゆるレーザートリミングにより抵抗値を調整する構成であっても構わない。
【0226】
また、抵抗体はマイクロフォン710が搭載される配線基板上に、抵抗体を吹き付ける等により、パターンニングして形成されたプリント抵抗を使用し、トリミングを行うものであって構わない。また、マイクロホンユニットの完成状態で実動作状態でのトリミングを行うためには、マイクロホンユニットの筐体表面に抵抗体を設けることがより好ましい。
【0227】
図24は本実施の形態の集積回路装置の他の構成の一例を示す図である。
【0228】
本実施の形態の集積回路装置は、第1の振動膜を有する第1のマイクロフォン710−1と、第2の振動膜を有する第2のマイクロフォン710−2と、前記第1のマイクロフォンで取得された第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号との差を示す差分信号を生成する図示しない差分信号生成部とを含んでおり、前記第1の振動膜及び前記第2の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管1100を介して音波を取得するように構成してもよい。
【0229】
導音管1100は、筒の開口部1102からから入力した音波が音響孔714−2を介して外部に漏れないよう第2のマイクロフォン710−2の振動膜まで届くように、振動膜の周囲の基板1110に設置してもよい。このようすると、導音管1100に入った音は減衰することなく第2のマイクロフォン710−2の振動膜に届く。本実施の形態によれば前記第1の振動膜及び前記第2の振動膜の少なくとも一方に導音管を設置することにより、音が振動膜に届くまでの距離を変えることができる。従って遅延バランスのばらつきに応じて、適当な長さ(例えば数ミリ)の導音管を設置することにより遅延を解消することができる。
【0230】
なお、本発明は、上述の実施の形態に限定されるものではなく、種々の変形が可能である。本発明は、実施の形態で説明した構成と実質的に同一の構成(例えば、機能、方法及び結果が同一の構成、あるいは目的及び効果が同一の構成)を含む。また、本発明は、実施の形態で説明した構成の本質的でない部分を置き換えた構成を含む。また、本発明は、実施の形態で説明した構成と同一の作用効果を奏する構成又は同一の目的を達成することができる構成を含む。また、本発明は、実施の形態で説明した構成に公知技術を付加した構成を含む。
【図面の簡単な説明】
【0231】
【図1】集積回路装置について説明するための図。
【図2】集積回路装置について説明するための図。
【図3】集積回路装置について説明するための図。
【図4】集積回路装置について説明するための図。
【図5】集積回路装置を製造する方法について説明するための図。
【図6】集積回路装置を製造する方法について説明するための図。
【図7】集積回路装置を有する音声入力装置について説明するための図。
【図8】集積回路装置を有する音声入力装置について説明するための図。
【図9】変形例に係る集積回路装置について説明するための図。
【図10】変形例に係る集積回路装置を有する音声入力装置について説明するための図。
【図11】集積回路装置を有する音声入力装置の一例としての携帯電話を示す図。
【図12】集積回路装置を有する音声入力装置の一例としてのマイクを示す図。
【図13】集積回路装置を有する音声入力装置の一例としてのリモートコントローラを示す図。
【図14】情報処理システムの概略図。
【図15】集積回路装置の他の構成について説明するための図。
【図16】集積回路装置の他の構成について説明するための図。
【図17】集積回路装置の他の構成について説明するための図。
【図18】集積回路装置の構成の一例を示す図。
【図19】集積回路装置の構成の一例を示す図。
【図20】集積回路装置の構成の一例を示す図。
【図21】集積回路装置の構成の一例を示す図。
【図22】ゲイン部とゲイン制御部の具体的構成の一例を示す図。
【図23】図23(A)(B)は、ゲイン部の増幅率をスタティックに制御する構成の一例。
【図24】集積回路装置の他の構成の一例を示す図である。
【図25】レーザートリミングにより抵抗値を調整する例を示す図。
【図26】マイク間距離が5mmの場合のユーザー音声強度比の位相成分の分布の関係について説明するための図。
【図27】マイク間距離が10mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。
【図28】マイク間距離が20mmの場合のユーザー音声強度比の位相成分の分布について説明するための図。
【図29】マイク間距離5mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図30】マイク間距離10mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図31】マイク間距離20mm、音源周波数1kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図32】マイク間距離5mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図33】マイク間距離10mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図34】マイク間距離20mm、音源周波数7kHz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図35】マイク間距離5mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図36】マイク間距離10mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【図37】マイク間距離20mm、音源周波数300Hz、マイク−音源間の距離2.5cm及び1mの場合の差動マイクの指向性について説明するための図。
【符号の説明】
【0232】
1…集積回路装置、 2…音声入力装置、 3…集積回路装置、 4、音声入力装置、
10…第1のマイクロフォン、 12…第1の振動膜、 14…第1の電極、 15…第1の振動膜、 16…集積回路、 20…第2のマイクロフォン、 22…第2の振動膜、 24…第2の電極、 25…第2の振動膜、 30…差分信号生成回路、 40…筐体、 42…開口、 50…演算処理部、 60…通信処理部、 100…半導体基板、 102…第1の凹部、 104…第2の凹部、 200…半導体基板、 201…第1の面、 202…第2の面、 210…第1の凹部、 212…開口、 220…第2の凹部、 300…携帯電話、 400…マイク、 500…リモートコントローラ、 600…情報処理システム、 602…音声入力装置、 604…ホストコンピュータ、710−1 第1のマイクロフォン、710−2 第2のマイクロフォン、712−1 第1の電圧信号、712−2 第2の電圧信号、714−1 第1の振動膜、714−2 第2の振動膜、720 差分信号生成回路、760 ゲイン部、740 差分信号出力部、910 ゲイン制御部、1100 導音管、1200 半導体基板、1200’ 配線基板
【特許請求の範囲】
【請求項1】
第1のマイクロフォンを構成する第1の振動膜と、
第2のマイクロフォンを構成する第2の振動膜と、
前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路と、
を含む配線基板を有することを特徴とする集積回路装置。
【請求項2】
請求項1において、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜および前記差分信号生成回路は、前記半導体基板に形成されることを特徴とする集積回路装置。
【請求項3】
請求項1において、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜は前記半導体基板に形成され、前記差分信号生成回路は、前記半導体基板上にフリップチップ実装されることを特徴とする集積回路装置。
【請求項4】
請求項1において、
前記第1の振動膜、および前記第2の振動膜、および前記差分信号生成回路は、前記配線基板上にフリップチップ実装されることを特徴とする集積回路装置。
【請求項5】
請求項1において、
前記配線基板は半導体基板であって、
前記差分信号生成回路は、半導体基板上に形成され、前記第1の振動膜、および前記第2の振動膜は、前記半導体基板上にフリップチップ実装されることを特徴とする集積回路装置。
【請求項6】
請求項1乃至5のいずれかにおいて、
前記第1及び第2の振動膜の中心間距離は、5.2mm以下であることを特徴とする集積回路装置。
【請求項7】
請求項1乃至請求項6のいずれかにおいて、
前記振動膜を、SN比が約60デシベル以上の振動子で構成することを特徴とする集積回路装置。
【請求項8】
請求項1乃至請求項7のいずれかにおいて、
前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が0デシベル以下となる距離に設定されていることを特徴とする集積回路装置。
【請求項9】
請求項1乃至請求項8のいずれかにおいて、
前記第1及び第2の振動膜の中心間距離が、抽出対象周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧が全方位において単体マイクとして使用した場合の音圧を上回らない範囲の距離に設定されていることを特徴とする集積回路装置。
【請求項10】
請求項1乃至9のいずれかにおいて、
前記第1及び第2の振動膜は、シリコン膜であることを特徴とする集積回路装置。
【請求項11】
請求項1乃至10のいずれかにおいて、
前記第1及び第2の振動膜は、法線が平行になるように形成されていることを特徴とする集積回路装置。
【請求項12】
請求項11において、
前記第1及び第2の振動膜は、法線と直交する方向にずれて配置されていることを特徴とする集積回路装置。
【請求項13】
請求項1乃至12のいずれかにおいて、
前記第1及び第2の振動膜は、前記半導体基板の1つの面から形成された凹部の底部であることを特徴とする集積回路装置。
【請求項14】
請求項13において、
前記第1及び第2の振動膜は、法線方向にずれて配置されていることを特徴とする集積回路装置。
【請求項15】
請求項14において、
前記第1及び第2の振動膜は、それぞれ、前記半導体基板の対向する第1及び第2の面から形成された第1及び第2の凹部の底部であることを特徴とする集積回路装置。
【請求項16】
請求項1乃至15のいずれかにおいて、
前記第1の振動膜及び前記第2の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管を介して音波を取得するように構成されていることを特徴とする集積回路装置。
【請求項17】
請求項1乃至16のいずれかにおいて、
前記差分信号生成回路は、
前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含むことを特徴とする集積回路装置。
【請求項18】
請求項17において、
前記差分信号生成回路は、
前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号の振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含むことを特徴とする集積回路装置。
【請求項19】
請求項17において、
前記差分信号生成部は、
所定の端子にかかる電圧または流れる電流に応じて増幅率が変化するよう構成されたゲイン部と、
前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部を含み、
前記ゲイン制御部は、
複数の抵抗が直列または並列に接続された抵抗アレー含み、前記抵抗アレーを構成する抵抗体又は導体の一部を切断すること、もしくは少なくとも1つの抵抗体を含み、該抵抗体の一部を切断することでゲイン部の所定の端子にかかる電圧または流れる電流を変更可能に構成されていることを特徴とする集積回路装置。
【請求項20】
請求項1乃至19のいずれかに記載の集積回路装置が実装されていることを特徴とする音声入力装置。
【請求項21】
請求項1乃至19のいずれかに記載の集積回路装置と、
前記差分信号に基づいて、入力音声情報の解析処理を行う解析処理部と、
を含む情報処理システム。
【請求項22】
請求項1乃至19のいずれかに記載の集積回路装置とネットワークを介した通信処理を行う通信処理装置とが実装された音声入力装置と、
前記ネットワークを介した通信処理によって取得した前記差分信号に基づいて、前記音声入力装置に入力された入力音声情報の解析処理を行うホストコンピュータと、
を含む情報処理システム。
【請求項1】
第1のマイクロフォンを構成する第1の振動膜と、
第2のマイクロフォンを構成する第2の振動膜と、
前記第1のマイクロフォンで取得された第1の信号電圧と、前記第2のマイクロフォンで取得された第2の信号電圧とを受け取って、前記第1及び第2の電圧信号の差を示す差分信号を生成する差分信号生成回路と、
を含む配線基板を有することを特徴とする集積回路装置。
【請求項2】
請求項1において、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜および前記差分信号生成回路は、前記半導体基板に形成されることを特徴とする集積回路装置。
【請求項3】
請求項1において、
前記配線基板は半導体基板であって、
前記第1の振動膜および前記第2の振動膜は前記半導体基板に形成され、前記差分信号生成回路は、前記半導体基板上にフリップチップ実装されることを特徴とする集積回路装置。
【請求項4】
請求項1において、
前記第1の振動膜、および前記第2の振動膜、および前記差分信号生成回路は、前記配線基板上にフリップチップ実装されることを特徴とする集積回路装置。
【請求項5】
請求項1において、
前記配線基板は半導体基板であって、
前記差分信号生成回路は、半導体基板上に形成され、前記第1の振動膜、および前記第2の振動膜は、前記半導体基板上にフリップチップ実装されることを特徴とする集積回路装置。
【請求項6】
請求項1乃至5のいずれかにおいて、
前記第1及び第2の振動膜の中心間距離は、5.2mm以下であることを特徴とする集積回路装置。
【請求項7】
請求項1乃至請求項6のいずれかにおいて、
前記振動膜を、SN比が約60デシベル以上の振動子で構成することを特徴とする集積回路装置。
【請求項8】
請求項1乃至請求項7のいずれかにおいて、
前記第1及び第2の振動膜の中心間距離が、10kHz以下の周波数帯域の音に対して第1の振動膜に入射する音声の音圧の強度に対する第1の振動膜と第2の振動膜に入射する音声の差分音圧の強度の比率である音声強度比の位相成分が0デシベル以下となる距離に設定されていることを特徴とする集積回路装置。
【請求項9】
請求項1乃至請求項8のいずれかにおいて、
前記第1及び第2の振動膜の中心間距離が、抽出対象周波数帯域の音に対して、前記振動膜を差動マイクとして使用した場合の音圧が全方位において単体マイクとして使用した場合の音圧を上回らない範囲の距離に設定されていることを特徴とする集積回路装置。
【請求項10】
請求項1乃至9のいずれかにおいて、
前記第1及び第2の振動膜は、シリコン膜であることを特徴とする集積回路装置。
【請求項11】
請求項1乃至10のいずれかにおいて、
前記第1及び第2の振動膜は、法線が平行になるように形成されていることを特徴とする集積回路装置。
【請求項12】
請求項11において、
前記第1及び第2の振動膜は、法線と直交する方向にずれて配置されていることを特徴とする集積回路装置。
【請求項13】
請求項1乃至12のいずれかにおいて、
前記第1及び第2の振動膜は、前記半導体基板の1つの面から形成された凹部の底部であることを特徴とする集積回路装置。
【請求項14】
請求項13において、
前記第1及び第2の振動膜は、法線方向にずれて配置されていることを特徴とする集積回路装置。
【請求項15】
請求項14において、
前記第1及び第2の振動膜は、それぞれ、前記半導体基板の対向する第1及び第2の面から形成された第1及び第2の凹部の底部であることを特徴とする集積回路装置。
【請求項16】
請求項1乃至15のいずれかにおいて、
前記第1の振動膜及び前記第2の振動膜の少なくとも一方は、膜面に対して垂直になるように設置された筒状の導音管を介して音波を取得するように構成されていることを特徴とする集積回路装置。
【請求項17】
請求項1乃至16のいずれかにおいて、
前記差分信号生成回路は、
前記第1のマイクロフォンで取得された第1の電圧信号に所定のゲインを与えるゲイン部と、
前記ゲイン部によって所定のゲインを与えられた第1の電圧信号と、前記第2のマイクロフォンで取得された第2の電圧信号を入力して、所定のゲインを与えられた第1の電圧信号と第2の電圧信号の差分信号を生成して出力する差分信号出力部とを含むことを特徴とする集積回路装置。
【請求項18】
請求項17において、
前記差分信号生成回路は、
前記差分信号出力部の入力となる第1の電圧信号と第2の電圧信号を受け取り、受けとった第1の電圧信号と第2の電圧信号に基づいて、差分信号が生成される際の第1の電圧信号と第2の電圧信号の振幅差を検出して、検出結果に基づき振幅差信号を生成して出力する振幅差検出部と、
前記振幅差信号に基づき、前記ゲイン部における増幅率を変化させる制御を行うゲイン制御部と、を含むことを特徴とする集積回路装置。
【請求項19】
請求項17において、
前記差分信号生成部は、
所定の端子にかかる電圧または流れる電流に応じて増幅率が変化するよう構成されたゲイン部と、
前記所定の端子にかかる電圧または流れる電流を制御するゲイン制御部を含み、
前記ゲイン制御部は、
複数の抵抗が直列または並列に接続された抵抗アレー含み、前記抵抗アレーを構成する抵抗体又は導体の一部を切断すること、もしくは少なくとも1つの抵抗体を含み、該抵抗体の一部を切断することでゲイン部の所定の端子にかかる電圧または流れる電流を変更可能に構成されていることを特徴とする集積回路装置。
【請求項20】
請求項1乃至19のいずれかに記載の集積回路装置が実装されていることを特徴とする音声入力装置。
【請求項21】
請求項1乃至19のいずれかに記載の集積回路装置と、
前記差分信号に基づいて、入力音声情報の解析処理を行う解析処理部と、
を含む情報処理システム。
【請求項22】
請求項1乃至19のいずれかに記載の集積回路装置とネットワークを介した通信処理を行う通信処理装置とが実装された音声入力装置と、
前記ネットワークを介した通信処理によって取得した前記差分信号に基づいて、前記音声入力装置に入力された入力音声情報の解析処理を行うホストコンピュータと、
を含む情報処理システム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【公開番号】特開2009−284111(P2009−284111A)
【公開日】平成21年12月3日(2009.12.3)
【国際特許分類】
【出願番号】特願2008−132460(P2008−132460)
【出願日】平成20年5月20日(2008.5.20)
【出願人】(505303059)株式会社船井電機新応用技術研究所 (108)
【出願人】(000201113)船井電機株式会社 (7,855)
【Fターム(参考)】
【公開日】平成21年12月3日(2009.12.3)
【国際特許分類】
【出願日】平成20年5月20日(2008.5.20)
【出願人】(505303059)株式会社船井電機新応用技術研究所 (108)
【出願人】(000201113)船井電機株式会社 (7,855)
【Fターム(参考)】
[ Back to top ]