説明

音情報表示装置、音情報表示方法およびプログラム

【課題】使用者が音源の位置とその音源から出る音の情報を直観的に判断可能とする。
【解決手段】集音情報(音信号)を得るためのマイクロホン101を透過型ヘッドマウントディスプレイの前面に配設する。信号処理部104は、マイクロホン101の集音情報に基づき、表示データを生成する。表示部105は、表示データに基づいて、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示する。例えば、音源から出る音のレベル情報を、円の大きさで表示する。また、音源から出る音の周波数情報を、円に付される色で表示する。音源位置が視覚映像内にある場合、その音源位置あるいはその近傍に、音情報を表示する。一方、音源位置が表示面内から外れる場合、その音源位置に近い視覚映像の端部に、音情報を表示する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音情報表示装置、音情報表示方法およびプログラムに関し、特に、頭部装着型のディスプレイ(ヘッドマウントディスプレイ)に視覚映像に重ねて音源の音情報を表示する音情報表示装置などに関する。
【背景技術】
【0002】
特許文献1には、複数のマイクロホンにより音源位置や、音の強さを推定する技術が記載されている。また、特許文献2には、複数のマイクロホンにより音源の到来方向を認識し、認識結果に対応する言葉や擬音語を文字情報として出力する聴覚障害者用ヘッドマウントディスプレイが記載されている。また、特許文献3には、入力された映像から音情報を抽出し、その音が何であるかを分類、識別し、映像内の画像に対応づけていく可視化装置が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】再表2004−021031号公報
【特許文献2】特開2007−334149号公報
【特許文献3】特開平08−179791号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
音源方向を推定する技術やそこから音の強さを求める技術(特許文献1参照)は、既に確立されており、主に計測用に用いられている。しかしながら、計測用の分野では精密さが求められることから、装置が大規模になっているのが現状である。一方で、このような音源方向推定技術は一般人向けの発音体探索や聴覚障害者向けの聴力支援ツールともなり得る。
【0005】
上述の特許文献2に記載される技術は、メガネ型のヘッドマウントディスプレイということで、一般の歩行者を意識している。しかし、音源の到来方向は文字で表示され、直観的にわかりにくい。さらに、認識結果が擬態語を用いて表現されるが、発音体の音表現に個人差がある可能性がある。
【0006】
また、上述の特許文献3に記載される技術は、膨大なデータベースが必要となり、また映像内に隠れている発音体や映像外から到来してくる発音体の識別が難しい。
【0007】
この発明の目的は、使用者が音源の位置とその音源から出る音の情報を直観的に判断可能とすることにある。
【課題を解決するための手段】
【0008】
この発明の概念は、
複数の集音部と、
上記複数の集音部の集音情報に基づいて、音源の位置情報および音情報を取得する情報取得部と、
上記情報取得部で取得された音情報を、該情報取得部で取得された位置情報に対応した視覚映像内の位置に、該視覚映像に重ねて表示するための表示データを生成する表示データ生成部と、
上記表示データ生成部で生成された表示データに基づいて、上記視覚映像内の音源に対応した位置に、該音源の音情報を該視覚映像に重ねて表示する、頭部装着型の画像表示部と
を備える音情報表示装置にある。
【0009】
この発明において、複数の集音部、例えば複数のマイクロホンが備えられている。情報取得部により、複数の集音部の集音情報に基づいて、音源の位置情報および音情報が取得される。例えば、音情報は、音源から出る音のレベル情報、あるいは音源から出る音の周波数情報などとされる。
【0010】
表示データ生成部により、情報取得部で取得された音情報を表示するための表示データが生成される。この表示データは、音情報を、情報取得部で取得された位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示する、ように生成される。
【0011】
例えば、この表示データは、音源から出る音のレベル情報を円などの所定の形状の大きさで表示するように、生成される。この場合、遠近感を判断することが可能となる。例えば、少しずつ大きくなる円から音源が近づいていると判断できる。また、例えば、この表示データは、音源から出る音の周波数情報を円などの所定の形状に付される色で表示するように、生成される。この場合、特定の音源を色に基づいて探すことができる。
【0012】
表示データ生成部で生成された表示データに基づいて、頭部装着型の画像表示部に、音源の音情報が表示される。この場合、この音情報は、視覚映像内の音源に対応した位置に、この視覚映像に重ねて表示される。例えば、音源位置が視覚映像内にある場合には、その音源位置あるいはその近傍に音情報が表示される。また、例えば、音源位置が視覚映像内から外れる場合には、その音源位置に近い視覚映像の端部に音情報が表示される。例えば、頭部装着型の画像表示部は、透過型の画像表示部とされる。この場合、視覚映像は、例えば、使用者がこの画像表示部を通して観察し得る実映像とされる。
【0013】
また、例えば、頭部装着型の画像表示部は、非透過型の画像表示部とされる。この場合、視覚映像の映像データを得るための撮像部が画像表示部に配設され、この撮像部で得られた映像データに、表示データ生成部で生成された表示データが重畳される。そして、この重畳データに基づいて、画像表示部に、視覚映像が表示されると共に、この視覚映像内の音源に対応した位置に、この音源の音情報が重ねて表示される。すなわち、この場合の視覚映像は、画像表示部に表示された表示映像とされる。
【0014】
このように、この発明においては、視覚映像内の音源に対応した位置に、この音源の音情報が重ねて表示されるため、使用者が音源の位置とその音源から出る音の情報を直観的に判断することが可能となる。また、この発明においては、複数の集音部の集音情報に基づいて音源の位置情報および音情報が取得されるものであり、視覚映像内の所定のオブジェクトに隠れている音源に関しても、視覚映像内の音源に対応した位置に、この音源の音情報を重ねて表示することが可能となる。
【0015】
この発明において、例えば、複数の集音部は、画像表示部に配設され、この複数の集音部の配設位置で構成される面は、画像表示部の表示面に対して直交しない、ようにされる。この場合、画像表示部の表示面上、つまり2次元平面上において、音源位置の取得を簡単に行うことができる。例えば、複数の集音部の配設位置で構成される面は、画像表示部の表示面に平行とされる。この場合、画像表示部の表示面上の音源位置を取得するための演算が簡単となる。
【0016】
また、この発明において、例えば、複数の集音部は、複数の全指向集音部および複数の指向性集音部とからなり、情報取得部は、複数の全指向集音部の集音情報に基づいて音源の第1の方向情報を取得し、この第1の方向情報に基づいて複数の指向性集音部の指向方向を制御してこの複数の指向性集音部の配設位置における音源の第2の方向情報を取得し、この第2の方向情報に基づいて音源の位置情報を取得する、ようにされる。この場合、集音部の数を多くすることなく、音源の位置情報の取得精度を高めることが可能となる。
【0017】
また、この発明において、例えば、情報取得部が位置情報および音情報を取得する対象としての音源を特定する音源特定部をさらに備える、ようにされる。例えば、音源特定部では、周波数により音情報を取得する対象としての音源が特定される。この場合、視覚映像内に特定の音源の音情報のみを表示させることができ、特定の音源の探索が容易となる。
【発明の効果】
【0018】
この発明によれば、視覚映像内の音源に対応した位置に、この音源の音情報が重ねて表示されるため、使用者が音源の位置とその音源から出る音の情報を直観的に判断することが可能となり、例えば、難聴者等の視覚を利用した聴力支援が可能となる。
【図面の簡単な説明】
【0019】
【図1】この発明の第1の実施の形態としての透過型ヘッドマウントディスプレイ(透過型HMD)の外観を示す図である。
【図2】4個のマイクロホンの配設位置で構成される面と表示面との関係を説明するための図である。
【図3】この発明の第1の実施の形態としての透過型HMDシステムの構成例を示すブロック図である。
【図4】透過型HMDシステムを構成する信号処理部の構成例を示すブロック図である。
【図5】音源位置検出のために必要な到来角度の算出方法の一例を説明するための図である。
【図6】透過型HMDシステムを構成する信号処理部の処理手順を示すフローチャートである。
【図7】視覚映像内の音源に対応した位置に音情報が重ねて表示された表示例を示す図である。
【図8】透過型HMDへの他のマイクロホン配設例を説明するための図である。
【図9】この発明の第2の実施の形態としての透過型ヘッドマウントディスプレイ(透過型HMD)の外観を示す図である。
【図10】この発明の第2の実施の形態としての透過型HMDシステムの構成例を示すブロック図である。
【図11】透過型HMDシステムを構成する信号処理部の構成例を示すブロック図である。
【図12】透過型HMDシステムを構成する信号処理部の処理手順を示すフローチャートである。
【図13】この発明の第3の実施の形態としての非透過型ヘッドマウントディスプレイ(非透過型HMD)の外観を示す図である。
【図14】この発明の第3の実施の形態としての非透過型HMDシステムの構成例を示すブロック図である。
【図15】非透過型HMDへの撮像素子(カメラ)の他の配設例を説明するための図である。
【図16】この発明の第4の実施の形態としての透過型HMDシステムの構成例を示すブロック図である。
【発明を実施するための形態】
【0020】
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明を以下の順序で行う。
1.第1の実施の形態
2.第2の実施の形態
3.第3の実施の形態
4.第4の実施の形態
5.変形例
【0021】
<1.第1の実施の形態>
[透過型ヘッドマウントディスプレイの構成例]
図1は、第1の実施の形態としての透過型ヘッドマウントディスプレイ(透過型HMD)10の外観を示している。この透過型HMD10の前面に、4個の全指向のマイクロホン101が配設されている。音源位置検出の精度を向上させるために、マイクロホン同士は、一定の間隔をあけて配設されている。ここで、マイクロホン101は、集音部を構成している。
【0022】
この場合、4個のマイクロホン101の配設位置で構成される面は、透過型HMD10の表示面に対して直交しないようにされている。この場合、4個のマイクロホン101には、表示面の水平方向に配設位置が異なるものが含まれると共に、表示面の垂直方向に配設位置が異なるものが含まれることを意味する。
【0023】
図2(a)は、その状態を示している。この図2(a)において、実線の四角形は表示面SFaを概略的に示し、破線の四角形は4個のマイクロホン101の配設位置で構成される面SFbを示している。この場合、面SFbを表示面SFaに投影した場合に面となる。そのため、後述する4個のマイクロホン101の集音情報(音信号)に基づいて、表示面SFa上、つまり2次元平面上における音源位置を取得することが、容易となる。
【0024】
なお、図2(b)に示すように、面SFbが表示面SFaに平行となるように、4個のマイクロホン101が透過型HMD10に配設されてもよい。この場合、後述する4個のマイクロホン101の集音情報に基づいて、表示面SFa上、つまり2次元平面上における音源位置を取得する際の演算が簡単となる。
【0025】
図3は、第1の実施の形態としての透過型HMD10のシステム構成を示している。この透過型HMD10は、4個のマイクロホン101と、アンプ102と、A/D変換器103と、信号処理部104と、表示部105を有している。アンプ102は、4個のマイクロホン101の集音情報(音信号)を増幅する。A/D変換器103は、アンプ102で増幅された4個のマイクロホン101の集音情報(音信号)を、アナログ信号からデジタル信号に変換する。
【0026】
信号処理部104は、A/D変換器103で得られた4個のマイクロホン101の集音情報(音信号)に基づいて、音源の位置情報および音情報を取得し、音情報を表示するための表示データを生成する。この表示データは、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するためのものとされる。ここで、位置情報に対応した視覚映像内の位置とは、位置情報が示す位置の他に、位置情報が示す位置の近傍位置を含むことを意味している。近傍位置を含むことで、例えば、使用者は、視覚映像内の音源映像を音情報の表示で邪魔されずに見ることが可能となる。信号処理部104は、情報取得部および表示データ生成部を構成している。
【0027】
音情報は、この実施の形態において、音源から出る音のレベル情報および周波数情報とされる。信号処理部104は、音源から出る音のレベル情報を、所定の形状、この実施の形態においては円(楕円も含む)の大きさで表示するように、表示データを生成する。また、信号処理部104は、音源から出る音の周波数情報を、上述した円に付される色で表示するように、表示データを生成する。
【0028】
表示部105は、信号処理部104で生成された表示データに基づいて、視覚映像内の音源に対応した位置に、音源の音情報を、この視覚映像に重ねて表示する。この場合、音源位置が視覚映像内にある場合には、その音源位置あるいはその近傍に、音情報が表示される。また、この場合、音源位置が視覚映像内から外れる場合には、その音源位置に近い視覚映像の端部に、音情報が表示される。この表示部105は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)からバックライトユニットを取りはずした透過型構造のディスプレイにより構成される。
【0029】
図4は、信号処理部104の詳細構成を示している。この信号処理部104は、デジタルフィルタ111と、ゲイン調整部112と、音源位置検出部113と、レベル解析部114と、周波数解析部115と、表示データ発生部116を有している。デジタルフィルタ111は、4個のマイクロホン101の集音情報(音信号)S1〜S4に含まれる風切り音や衣擦れ音などの周波数成分を除去、あるいは低減するためのフィルタ処理を行う。この周波数成分は音源位置検出処理等に悪影響を及ぼすからである。
【0030】
このデジタルフィルタ111は、例えば、FIR(Finite-duration Impulse Response)フィルタ、あるいはIIR(Infinite -duration Impulse Response)フィルタで構成される。例えば、このデジタルフィルタ111は、ハイパスフィルタ、あるいはバンドパスフィルタを構成する。また、例えば、このデジタルフィルタ111は、検出したくない特定周波数の雑音がある場合、一部帯域を阻止するノッチフィルタを構成する。
【0031】
ゲイン調整部112は、4個のマイクロホン101の集音情報(音信号)S1〜S4から、反射音、あるいは定常雑音などの低レベル信号をカットする。この低レベル信号は音源位置検出処理等に悪影響を及ぼすからである。このゲイン調整部112は、例えば、入力信号レベルに応じてゲイン制御するオートマティックゲインコントロール回路により構成される。
【0032】
音源位置検出部113は、4個のマイクロホン101の集音情報(音信号)S1〜S4に基づいて、音源の位置情報を検出する。この音源位置検出部113は、透過型HMD10の表示面、つまり表示部105の表示面(2次元平面)をX−Y座標とした位置情報を検出する。音源位置検出部113における音源位置検出処理は、(1)各マイクロホン101への音源からの音の到達時間差を求める、(2)音源からの音の到来角度を算出する、(3)音源位置を推定する、という3段階の処理に分かれる。以下に、各段階の処理を説明する。
【0033】
(1)到達時間差を求める処理について説明する。この処理は、詳細説明は省略するが、従来周知の方法により行われる。例えば、相互相関関数を利用して求める方法や、フーリエ変換を利用したCSP法(Cross-power Spectrum Phase analysis)などが一般的である。
【0034】
(2)到来角度を算出する処理について説明する。音源位置検出部113は、4個のマイクロホン101から抽出される各一対のマイクロホンに対してそれぞれ到来角度の算出処理を行う。図5(a)は、到来角度算出方法の一例を示している。一対のマイクロホンM1,M2の到達時間差は、図5(b)に示すように、τであるとする。マイクロホンM1,M2の距離をd、音速をcとするとき、音源からの音の到来角度θは、以下の(1)式で算出される。
【0035】
【数1】

【0036】
(3)音源位置を推定する処理について説明する。音源位置検出部113は、各一対のマイクロホンに対してそれぞれ算出された到来角度を組み合わせて、音源の位置、つまり音源の表示面を含む2次元平面上の位置を推定する。このように推定される音源位置としては、表示面内(視覚映像内)の位置、あるいは表示面内(視覚映像内)から外れた位置の2通りが考えられる。
【0037】
なお、上述の音源位置検出部113における音源位置検出処理は、音源からの音の到達時間差を利用した処理である。しかし、音源位置検出部113における音源位置検出処理は、その他の処理、例えば、振幅特性と位相特性を利用した処理(特許文献1参照)などであってもよい。
【0038】
図4に戻って、レベル解析部114は、音源位置検出部113で音源位置が検出された各音源について、その音源からの音のレベル(音の大きさ)を解析し、音源の音情報としてのレベル情報を得る。上述したように各マイクロホン101への音源からの音には到達時間差が発生する。レベル解析部114は、到達時間差を考慮して、4個のマイクロホン101の集音情報(音信号)S1〜S4を加算し、その加算信号に基づいて音源のレベル情報を得る。
【0039】
周波数解析部115は、音源位置検出部113で音源位置が検出された各音源について、その音源からの音の周波数を解析し、音源の音情報としての周波数情報を得る。例えば、周波数解析部115は、周波数解析を、音源の種類毎の周波数成分を抽出する複数のデジタルフィルタを用いて行うことができる。また、例えば、周波数解析部115は、周波数解析を、音源からの音に対してFFT(Fast Fourie Transform)処理により行うことができる。
【0040】
表示データ発生部116は、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するための表示データDdsを生成する。表示データ発生部116は、音源位置検出部113で検出される音源の位置情報、レベル解析部114で得られる音源からの音のレベル情報および周波数解析部115で得られる音源からの音の周波数情報に基づいて、表示データDdsを生成する。
【0041】
表示データ生成部116は、音源から出る音のレベル情報を、円の大きさで表示するように、表示データDdsを生成する。この場合、レベルが大きくなるほど、円は大きくされる。また、表示データ生成部116は、音源から出る音の周波数情報を、円に付される色で表示するように、表示データDdsを生成する。これにより、音源の種類毎に音の周波数成分が異なる場合、各種類の音源は、円に付される色で識別可能となる。
【0042】
上述したように、音源位置検出部113で検出される音源の位置情報は、表示面内(視覚映像内)の位置を示す場合と、表示面内(視覚映像内)から外れた位置を示す場合の2通りがある。表示データ生成部116は、音源位置が表示面内(視覚映像内)にある場合には、その音源位置あるいはその近傍に、音情報を表示するように、表示データDdsを生成する。また、表示データ生成部116は、音源位置が表示面内(視覚映像内)から外れる場合には、その音源位置に近い表示面(視覚映像)の端部に、音情報を表示するように、表示データDdsを生成する。
【0043】
図4に示す信号処理部104の各部の処理は、例えば、コンピュータ(CPU)によるソフトウェア処理で実行される。この場合、コンピュータは、処理プログラムに基づいて、図4に示す信号処理部104の各部として機能するようにされる。勿論、図4に示す信号処理部104の各部の一部または全部をハードウェアで構成することも可能である。
【0044】
図6のフローチャートは、図4に示す信号処理部104の処理手順を示している。信号処理部104は、この処理手順を周期的に繰り返し、表示データDdsを、順次更新していく。信号処理部104は、ステップST1において、処理を開始し、その後に、ステップST2の処理に移る。
【0045】
このステップST2において、信号処理部104は、4個のマイクロホン101の集音情報(音信号)S1〜S4に含まれる風切り音や衣擦れ音などの周波数成分を除去、あるいは低減するためのフィルタ処理を行う。そして、信号処理部104は、ステップST3において、4個のマイクロホン101の集音情報(音信号)S1〜S4から、反射音、あるいは定常雑音などの低レベル信号をカットするゲイン調整処理を行う。
【0046】
次に、信号処理部104は、ステップST4において、4個のマイクロホン101の集音情報(音信号)S1〜S4に基づいて、音源の位置情報を検出する。また、信号処理部104は、ステップST5において、音源位置が検出された各音源について、その音源からの音のレベル(音の大きさ)を解析し、音源の音情報としてのレベル情報を得る。さらに、信号処理部104は、ステップST6において、音源位置が検出された各音源について、その音源からの音の周波数を解析し、音源の音情報としての周波数情報を得る。
【0047】
次に、信号処理部104は、ステップST7において、ステップST4で得られる音源の位置情報、ステップST5で得られる音源からの音のレベル情報およびステップST6で得られる音源からの音の周波数情報に基づいて、表示データを生成する。すなわち、信号処理部104は、ステップST7において、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するための表示データを生成する。信号処理部104は、ステップST7の処理の後、ステップST8において、処理を終了する。
【0048】
図1、図3に示す透過型HMD10の動作を説明する。4個のマイクロホン101の集音情報(音信号)は、アンプ102で増幅され、さらに、A/D変換器103でアナログ信号からデジタル信号に変換された後に、信号処理部104に供給される。この信号処理部104では、4個のマイクロホン101の集音情報(音信号)に基づいて、音源の位置情報および音情報(レベル情報、周波数情報)が取得される。
【0049】
また、信号処理部104では、取得された音源の位置情報および音情報に基づいて、音情報を表示するための表示データが生成される。この表示データは、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するためのものとされる。この場合、音源から出る音のレベル情報は、円の大きさで表示されるように、表示データが生成される。また、この場合、音源から出る音の周波数情報は、円に付される色で表されるように、表示データが生成される。
【0050】
信号処理部104で生成される表示データは、表示部105に供給される。この表示部105では、表示データに基づいて、視覚映像内の音源に対応した位置に、音源の音情報が、この視覚映像に重ねて表示される。この場合、音源位置が表示面内(視覚映像内)にある場合には、その音源位置あるいはその近傍に、音情報が表示される。また、この場合、音源位置が表示面内(視覚映像内)から外れる場合には、その音源位置に近い表示面(視覚映像)の端部に、音情報が表示される。
【0051】
図7(a)は、使用者が、透過型HMD10を通して観察する視覚映像(実映像)の一例を示している。また、図7(b)は、表示部105に表示される音情報(レベル情報、周波数情報)の一例を示している。なお、図7(b)においては、音源の音の周波数情報を色で示す代わりに、模様で示している。使用者は、図7(a)に示す視覚映像に、図7(b)に示す音情報表示が重畳した状態の、図7(c)に示すような映像を観察する。この映像は、視覚映像内の音源に対応した位置に、この音源の音情報が重ねて表示されたものとなる。
【0052】
図1、図3に示す透過型HMD10において、視覚映像内の音源に対応した位置に、この音源の音情報が重ねて表示される。そのため、使用者が音源の位置とその音源から出る音の情報を直観的に判断することが可能となる。
【0053】
また、図1、図3に示す透過型HMD10において、4個のマイクロホン101の集音情報(音信号)に基づいて、音源の位置情報および音情報が取得される。そのため、視覚映像内の所定のオブジェクトに隠れている音源に関しても、視覚映像内の音源に対応した位置に、この音源の音情報を重ねて表示することが可能となる。
【0054】
また、図1、図3に示すに示す透過型HMD10において、音源の音のレベル情報は、円の大きさで表示されるため、遠近感を判断することが可能となる。例えば、例えば、少しずつ大きくなる円から音源が近づいていると判断できる。また、図1、図3に示すに示す透過型HMD10において、音源の音の周波数情報は、円に付される色で表示されるため、特定の音源を色に基づいて探すことができる。
【0055】
また、図1、図3に示す透過型HMD10において、音源位置が視覚映像内から外れる場合には、その音源位置に近い視覚映像の端部に音情報が表示される。そのため、視覚映像内から外れる位置にある音源に関してもその音情報を表示でき、しかも、使用者は視覚映像に対してどの方向に音源があるかを直観的に知ることができる。
【0056】
また、図1、図3に示す透過型HMD10において、この透過型HMD10に配設される4個のマイクロホン101で構成される面SFbは、この透過型HMD10の表示面SFaに対して直交しないように構成されている。この場合、面SFbを表示面SFaに投影した場合に面となるため、表示面SFa上、つまり2次元平面上における音源位置の取得を簡単に行うことができる。
【0057】
なお、図1、図3に示す透過型HMD10においては、アナログマイクロホン101が使用されている。しかし、MEMSのようなデジタルマイクロホンを使用し、アンプやA/D変換器を不要とする構成も可能である。
【0058】
また、図1、図3に示す透過型HMD10においては、4個のマイクロホン101が使用されているが、マイクロホン101の個数は4個に限定されない。例えば、図8(a)は、透過型HMD10の前面に2個のマイクロホン101が配設された例を示している。また、図8(b)は、透過型HMD10の前面に3個のマイクロホン101が配設された例を示している。
【0059】
音源位置検出の精度を上げるためにはマイクロホン同士が一定の間隔をもって配設される必要がある。そのため、透過型HMD10の前面に2個のマイクロホン101を配設する場合には、例えば、図8(a)に示すように、左右両端に配設される。また、透過型HMD10の前面に3個のマイクロホン101を配設する場合には、例えば、図8(b)に示すように、3角形を作るように配設される。
【0060】
また、図1、図3に示す透過型HMD10においては、透過型HMD10の前面にマイクロホン101が一体的に配設されている。しかし、マイクロホン101は、透過型HMD10とは独立していてもよい。その場合には、マイクロホン101と透過型HMD10の距離の情報、およびマイクロホン101間の距離の情報を、信号処理部104に受け渡す仕組みが必要となる。
【0061】
この場合、マイクロホン101の位置は透過型HMD10に近く、固定している方が望ましい。透過型HMD10と、他の集音を目的とした機器が一体となっている構成でもよい。また、2つのマイクロホンを使用する場合、耳介付近にマイクロホンを設置すれば、両耳間の相関を用いる方法、あるいは両耳間の位相差を用いる方法(特開2004−325284号公報参照)などにより音源位置を推定することも可能である。
【0062】
以上の各変形例については、後述する他の実施の形態についても、同様のことが言える。
【0063】
<2.第2の実施の形態>
[透過型ヘッドマウントディスプレイの構成例]
図9は、第2の実施の形態としての透過型ヘッドマウントディスプレイ(透過型HMD)10Aの外観を示している。この透過型HMD10Aの前面に、図1に示す透過型HMD10と同様に、4個の全指向マイクロホン101が配設されている。また、この透過型HMD10Aの前面に、3個の指向性マイクロホン101aが配設されている。ここで、マイクロホン101,101aは、集音部を構成している。
【0064】
4個のマイクロホン101の配設位置で構成される面は、図1に示す透過型HMD10と同様であり、透過型HMD10の表示面に対して直交しないようにされている。3個のマイクロホン101aの配設位置で構成される面も、同様に、透過型HMD10の表示面に対して直交しないようにされている。つまり、この場合、3個のマイクロホン101aには、表示面の水平方向に配設位置が異なるものが含まれると共に、表示面の垂直方向に配設位置が異なるものが含まれる。
【0065】
図10は、第2の実施の形態としての透過型HMD10Aのシステム構成を示している。この図10において、図3と対応する部分には同一符号を付し、適宜、その詳細説明を省略する。この透過型HMD10Aは、4個の全指向マイクロホン101と、3個の指向性マイクロホン101aと、アンプ102,106と、A/D変換器103,107と、信号処理部104Aと、表示部105を有している。例えば、指向性マイクロホン101aは、複数個のマイクロホンアレイからなり、指向方向をダイナミックにスキャン可能とされている。
【0066】
アンプ102は、4個のマイクロホン101の集音情報(音信号)を増幅する。A/D変換器103は、アンプ102で増幅された4個のマイクロホン101の集音情報(音信号)を、アナログ信号からデジタル信号に変換する。アンプ106は、3個のマイクロホン101aの集音情報(音信号)を増幅する。A/D変換器107は、アンプ106で増幅された3個のマイクロホン101aの集音情報(音信号)を、アナログ信号からデジタル信号に変換する。
【0067】
信号処理部104Aは、A/D変換器103からの4個の全指向マイクロホン101の集音情報(音信号)およびA/D変換器107からの3個の指向性マイクロホン101aの集音情報(音信号)に基づいて、音源の位置情報および音情報を取得する。また、信号処理部104Aは、この音源の位置情報および音情報に基づいて、音情報を表示するための表示データを生成する。この表示データは、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するためのものとされる。信号処理部104Aは、情報取得部および表示データ生成部を構成している。
【0068】
この信号処理部104Aは、音源の位置情報を、以下の処理手順で取得する。すなわち、信号処理部104Aは、4個の全指向マイクロホン101の集音情報(音信号)に基づいて、音源の第1の方向情報を取得する。この第1の方向情報は、音源の方向をおおまかに示す情報である。次に、信号処理部104Aは、この第1の方向情報に基づいて、3個の指向性マイクロホン101aの指向方向を制御して、この3個の指向性マイクロホン101aの配設位置における音源の第2の方向情報を取得する。
【0069】
この場合、図10には、信号処理部104Aから指向性マイクロホン101aへの制御ラインを示していないが、信号処理部104Aにより、指向性マイクロホン101aの指向方向が第1の方向情報で示される一定範囲をスキャンするように制御される。信号処理部104Aは、指向性マイクロホン101aの集音情報(音信号)のレベルが最大となる指向方向を、その指向性マイクロホン101aの配設位置における音源の第2の方向情報とする。この第2の方向情報は、音源の方向を精度よく示す情報となる。そして、信号処理部104Aは、この3個の指向性マイクロホン101aの配設位置における音源の第2の方向情報に基づいて、音源の位置情報を取得する。
【0070】
表示部105は、信号処理部104Aで生成された表示データに基づいて、視覚映像内の音源に対応した位置に、音源の音情報を、この視覚映像に重ねて表示する。この場合、音源位置が視覚映像内にある場合には、その音源位置あるいはその近傍に、音情報が表示される。また、この場合、音源位置が視覚映像内から外れる場合には、その音源位置に近い視覚映像の端部に、音情報が表示される。
【0071】
図11は、信号処理部104Aの詳細構成を示している。この図11において、図4と対応する部分には、同一符号を付し、適宜、その詳細説明は省略する。この信号処理部104Aは、デジタルフィルタ111,118と、ゲイン調整部112,119と、音源方向推定部117と、音源位置検出部113Aと、レベル解析部114と、周波数解析部115と、表示データ発生部116を有している。
【0072】
デジタルフィルタ111は、4個のマイクロホン101の集音情報(音信号)S1〜S4に含まれる風切り音や衣擦れ音などの周波数成分を除去、あるいは低減するための、フィルタ処理を行う。この周波数成分は音源方向推定出処理等に悪影響を及ぼすからである。ゲイン調整部112は、4個の全指向マイクロホン101の集音情報(音信号)S1〜S4から、反射音、あるいは定常雑音などの低レベル信号をカットする。この低レベル信号は音源方向推定出処理等に悪影響を及ぼすからである。
【0073】
音源方向推定部117は、フィルタ処理およびゲイン調整処理が行われた4個のマイクロホン101の集音情報(音信号)S1〜S4に基づいて、音源方向を概略的に推定する。この音源方向推定部117は、上述した図4に示す透過型HMD10における信号処理部104の3段階の処理のうち、(1)各マイクロホンへの音源からの音の到達時間差を求める、(2)音源からの音の到来角度を算出する、の2段階の処理を行う。
【0074】
音源位置検出部113Aは、音源方向推定部117で得られる複数の到来角度情報と、3個の指向性マイクロホン101の集音情報(音信号)Sa1〜Sa4とに基づいて、音源の位置情報を検出する。この音源位置検出部113Aは、透過型HMD10Aの表示面、つまり表示部105の表示面(2次元平面)をX−Y座標とした位置情報を検出する。
【0075】
音源位置検出部113Aは、まず、3個の指向性マイクロホン101aのそれぞれにつき、その配設位置における音源方向を取得する。この場合、音源位置検出部113Aは、指向性マイクロホン101aの指向方向が音源方向推定部117で得られる複数の到来角度情報(音源の第1の方向情報)で示される一定範囲をスキャンするように制御する。そして、音源位置検出部113Aは、その指向性マイクロホン101aの集音情報(音信号)のレベルが最大となる指向方向を、その指向性マイクロホン101aの配設位置における音源方向とする。
【0076】
音源位置検出部113Aは、次に、3個の指向性マイクロホン101aの配設位置における音源方向情報(音源の第2の方向情報)に基づいて、音源の位置情報を取得する。すなわち、音源位置検出部113Aは、3個の指向性マイクロホン101aの配設位置における音源方向を組み合わせて、音源の位置、つまり音源の表示面を含む2次元平面上の位置を推定する。このように推定される音源位置としては、表示面内(視覚映像内)の位置、あるいは表示面内(視覚映像内)から外れた位置の2通りが考えられる。
【0077】
レベル解析部114は、音源位置検出部113Aで音源位置が検出された各音源について、例えば4個の指向性マイクロホン101で集音されるその音源の音のレベル(音の大きさ)を解析し、音源の音情報としてのレベル情報を得る。上述したように各マイクロホン101への音源からの音には到達時間差が発生する。
【0078】
レベル解析部114は、到達時間差を考慮して、4個のマイクロホン101の集音情報(音信号)S1〜S4を加算し、その加算信号に基づいて音源のレベル情報を得る。周波数解析部115は、音源位置検出部113Aで音源位置が検出された各音源について、例えば4個の指向性マイクロホン101aで集音されるその音源の音の周波数を解析し、音源の音情報としての周波数情報を得る。
【0079】
表示データ発生部116は、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するための表示データDdsを生成する。表示データ発生部116は、音源位置検出部113Aで検出される音源の位置情報、レベル解析部114で得られる音源からの音のレベル情報および周波数解析部115で得られる音源からの音の周波数情報に基づいて、表示データDdsを生成する。
【0080】
表示データ生成部116は、音源から出る音のレベル情報を、円の大きさで表示するように、表示データDdsを生成する。この場合、レベルが大きくなるほど、円は大きくされる。また、表示データ生成部116は、音源から出る音の周波数情報を、円に付される色で表示するように、表示データDdsを生成する。これにより、音源の種類毎に音の周波数成分が異なる場合、各種類の音源は、円に付される色で識別可能となる。
【0081】
上述したように、音源位置検出部113Aで検出される音源の位置情報は、表示面内(視覚映像内)の位置を示す場合と、表示面内(視覚映像内)から外れた位置を示す場合の2通りがある。表示データ生成部116は、音源位置が表示面内(視覚映像内)にある場合には、その音源位置あるいはその近傍に、音情報を表示するように、表示データDdsを生成する。また、示データ生成部116は、音源位置が表示面内(視覚映像内)から外れる場合には、その音源位置に近い表示面(視覚映像)の端部に、音情報を表示するように、表示データDdsを生成する。
【0082】
図11に示す信号処理部104Aの各部の処理は、例えば、コンピュータ(CPU)によるソフトウェア処理で実行される。この場合、コンピュータは、処理プログラムに基づいて、図11に示す信号処理部104Aの各部として機能するようにされる。勿論、図11に示す信号処理部104Aの各部の一部または全部をハードウェアで構成することも可能である。
【0083】
図12のフローチャートは、図11に示す信号処理部104Aの処理手順を示している。信号処理部104Aは、この処理手順を周期的に繰り返し、表示データDdsを、順次更新していく。信号処理部104Aは、ステップST10において、処理を開始し、その後に、ステップST11の処理に移る。
【0084】
このステップST11において、信号処理部104Aは、4個の全指向マイクロホン101の集音情報(音信号)S1〜S4に含まれる風切り音や衣擦れ音などの周波数成分を除去、あるいは低減するためのフィルタ処理を行う。そして、信号処理部104Aは、ステップST12において、4個の全指向マイクロホン101の集音情報(音信号)S1〜S4から、反射音、あるいは定常雑音などの低レベル信号をカットするゲイン調整処理を行う。
【0085】
次に、ステップST13において、信号処理部104Aは、フィルタ処理およびゲイン調整処理が行われた4個のマイクロホン101の集音情報(音信号)S1〜S4に基づいて、音源方向を概略的に推定する。この場合、信号処理部104Aは、(1)各マイクロホンへの音源からの音の到達時間差を求める、(2)音源からの音の到来角度を算出する、の2段階の処理を行う。
【0086】
次に、信号処理部104Aは、ステップST14において、3個の指向性マイクロホン101aの集音情報(音信号)Sa1〜Sa3に含まれる風切り音や衣擦れ音などの周波数成分を除去、あるいは低減するためのフィルタ処理を行う。そして、信号処理部104Aは、ステップST15において、3個の指向性マイクロホン101aの集音情報(音信号)Sa1〜Sa3から、反射音、あるいは定常雑音などの低レベル信号をカットするゲイン調整処理を行う。
【0087】
次に、信号処理部104Aは、ステップST16において、音源の位置情報を検出する。この場合、信号処理部104Aは、ステップST13で得られた複数の到来角度情報と、フィルタ処理およびゲイン調整処理が行われた3個の指向性マイクロホン101aの集音情報(音信号)Sa1〜Sa3に基づいて、音源の位置情報を検出する。
【0088】
次に、信号処理部104Aは、ステップST17において、音源位置が検出された各音源について、その音源からの音のレベル(音の大きさ)を解析し、音源の音情報としてのレベル情報を得る。さらに、信号処理部104Aは、ステップST18において、音源位置が検出された各音源について、その音源からの音の周波数を解析し、音源の音情報としての周波数情報を得る。
【0089】
次に、信号処理部104Aは、ステップST19において、ステップST16で得られる音源の位置情報、ステップST17で得られる音源からの音のレベル情報およびステップST18で得られる音源からの音の周波数情報に基づいて、表示データを生成する。すなわち、信号処理部104Aは、ステップST19において、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するための表示データを生成する。信号処理部104Aは、ステップST19の処理の後、ステップST20において、処理を終了する。
【0090】
図9、図10に示す透過型HMD10Aの動作を説明する。4個の全指向マイクロホン101の集音情報(音信号)は、アンプ102で増幅され、さらに、A/D変換器103でアナログ信号からデジタル信号に変換された後に、信号処理部104Aに供給される。また、3個の指向性マイクロホン101aの集音情報(音信号)は、アンプ106で増幅され、さらに、A/D変換器107でアナログ信号からデジタル信号に変換された後に、信号処理部104Aに供給される。
【0091】
信号処理部104Aでは、4個の全指向マイクロホン101の集音情報(音信号)および3個の指向性マイクロホン101aの集音情報(音信号)に基づいて、音源の位置情報および音情報が取得され、音情報を表示するための表示データが生成される。この表示データは、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するためのものとされる。
【0092】
この場合、まず、信号処理部104Aでは、4個の全指向マイクロホン101の集音情報(音信号)S1〜S4に基づいて、音源の第1の方向情報(音源の方向をおおまかに示す情報)が取得される。次に、信号処理部104Aでは、この第1の方向情報に基づいて、3個の指向性マイクロホン101aの指向方向が制御される。そして、3個の指向性マイクロホン101aの集音情報(音信号)Sa1〜Sa3に基づいて、この3個の指向性マイクロホン101aの配設位置における音源の第2の方向情報(音源の方向を精度よく示す情報)が取得される。さらに、信号処理部104Aでは、この3個の指向性マイクロホン101aの配設位置における音源の第2の方向情報に基づいて、音源の位置情報が取得される。
【0093】
信号処理部104Aで生成される表示データは、表示部105に供給される。この表示部105では、表示データに基づいて、視覚映像内の音源に対応した位置に、音源の音情報が、この視覚映像に重ねて表示される(図7(c)参照)。この場合、音源位置が表示面内(視覚映像内)にある場合には、その音源位置あるいはその近傍に、音情報が表示される。また、この場合、音源位置が表示面内(視覚映像内)から外れる場合には、その音源位置に近い表示面(視覚映像)の端部に、音情報が表示される。
【0094】
図9、図10に示す透過型HMD10Aにおいては、上述の図1、図3に示す透過型HMD10と同様に構成されているので、同様の効果を得ることができる。また、図9、図10に示す透過型HMD10Aにおいて、信号処理部104Aでは、4個の全指向マイクロホン101の集音情報に基づいた処理と、3個の指向性マイクロホン101aの集音情報に基づいた処理の2段階の処理で音源の方向情報が取得される。そのため、マイクロホン数をそれほど多くすることなく、音源の位置情報の取得精度を高めることが可能となる。
【0095】
<3.第3の実施の形態>
[非透過型ヘッドマウントディスプレイの構成例]
図13は、第3の実施の形態としての非透過型ヘッドマウントディスプレイ(HMD)10Bの外観を示している。この非透過型HMD10Bの前面に、図1に示す透過型HMD10と同様に、4個の全指向マイクロホン101が配設されている。また、この非透過型HMD10Bの前面中央に、視覚映像の映像データを得るための撮像素子(カメラ)131が配設されている。ここで、マイクロホン101は、集音部を構成している。4個のマイクロホン101の配設位置で構成される面は、図1に示す透過型HMD10と同様であり、非透過型HMD10Bの表示面に対して直交しないようにされている。
【0096】
図14は、第3の実施の形態としての非透過型HMD10Bのシステム構成を示している。この図14において、図3と対応する部分には同一符号を付し、適宜、その詳細説明を省略する。この非透過型HMD10Bは、4個の全指向マイクロホン101と、アンプ102と、A/D変換器103と、信号処理部104と、撮像素子(カメラ)131と、撮像信号処理部132と、重畳部134と、表示部105Bを有している。
【0097】
アンプ102は、4個のマイクロホン101の集音情報(音信号)を増幅する。A/D変換器103は、アンプ102で増幅された4個のマイクロホン101の集音情報(音信号)を、アナログ信号からデジタル信号に変換する。信号処理部104Cは、A/D変換器103で得られた4個のマイクロホン101の集音情報(音信号)に基づいて、音源の位置情報および音情報を取得し、音情報を表示するための表示データを生成する。
【0098】
撮像素子(カメラ)131は、使用者の視界に対応した被写体を撮像する。撮像信号処理部132は、撮像素子131で得られる撮像信号を処理して、視覚映像の映像データを出力する。この場合、撮像信号処理部132では、撮像素子131の配設位置に応じて発生する撮像映像と実際の使用者の視界とのずれを補正する処理も行われる。ここで、撮像素子131および撮像信号処理部132は、撮像部を構成している。
【0099】
重畳部134は、撮像信号処理部132で得られた視覚映像の映像データに、信号処理部104で生成された表示データを重畳する。表示部105Bは、重畳部134の出力データに基づいて、視覚映像を表示すると共に、この視覚映像内の音源に対応した位置に、音源の音情報を、この視覚映像に重ねて表示する。この表示部105Bは、図3に示す透過型HMD10の表示部105とは異なり、例えば、バックライトユニットを取りはずしていない通常の液晶ディスプレイ(LCD)により構成される。
【0100】
図13、図14に示す非透過型HMD10Bの動作を説明する。4個のマイクロホン101の集音情報(音信号)は、アンプ102で増幅され、さらに、A/D変換器103でアナログ信号からデジタル信号に変換された後に、信号処理部104に供給される。信号処理部104では、4個のマイクロホン101の集音情報(音信号)に基づいて、音源の位置情報および音情報が取得され、音情報を表示するための表示データが生成される。この表示データは、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するためのものとされる。
【0101】
また、撮像素子131では、使用者の視界に対応した被写体が撮像される。この撮像素子131から出力される撮像信号は、撮像信号処理部132に供給される。撮像信号処理部132では、撮像信号が処理されて、視覚映像の映像データが生成される。この撮像信号処理部132では、撮像素子131の配設位置に応じて発生する撮像映像と実際の使用者の視界とのずれを補正する処理も行われる。
【0102】
撮像信号処理部132で得られる視覚映像の映像データは、重畳部134に供給される。また、この重畳部134には、信号処理部104で生成された表示データが供給される。この重畳部134では、視覚映像の映像データに表示データが重畳される。この重畳データは、表示部105Bに供給される。
【0103】
表示部105Bでは、重畳部134の出力データ(重畳データ)に基づいて、視覚映像が表示されると共に、この視覚映像内の音源に対応した位置に、音源の音情報が、この視覚映像に重ねて表示される(図7(c)参照)。この場合、音源位置が表示面内(視覚映像内)にある場合には、その音源位置あるいはその近傍に、音情報が表示される。また、この場合、音源位置が表示面内(視覚映像内)から外れる場合には、その音源位置に近い表示面(視覚映像)の端部に、音情報が表示される。
【0104】
図13、図14に示す非透過型HMD10Bにおいては、表示部105Bに音源の音情報の他に視覚映像も表示されることを除き、上述の図1、図3に示す透過型HMD10と同様に構成されているので、同様の効果を得ることができる。また、図13、図14に示す非透過型HMD10Bにおいて、撮像信号処理部132では、撮像素子131の配設位置に応じて発生する撮像映像と実際の使用者の視界とのずれが補正されるので、表示部105Bに実施の視界に対応した良好な視覚映像を表示できる。
【0105】
なお、図13、図14に示す非透過型HMD10Bにおいては、非透過型HMD10Bの前面中央に撮像素子(カメラ)131が一体的に配設されているが、撮像素子131の配設位置はこれに限定されない。例えば、図15に示すように、非透過型HMD10Bの前面の側端に、あるいは非透過型HMD10Bとは独立した位置に配設することも考えられる。このような場合にあっても、上述したように、撮像信号処理部132で撮像素子131の配設位置に応じて発生する撮像映像と実際の使用者の視界とのずれが補正されることで、表示部105Bには実施の視界に対応した良好な視覚映像を表示可能となる。
【0106】
<4.第4の実施の形態>
[透過型ヘッドマウントディスプレイの構成例]
図16は、第4の実施の形態としての透過型ヘッドマウントディスプレイ(HMD)10Cの構成を示している。図示は省略するが、この透過型HMD10Cの外観は、図1に示す透過型HMD10と同様である。この図16において、図3と対応する部分には、同一符号を付し、適宜、その詳細説明は省略する。この透過型HMD10Cは、4個の全指向マイクロホン101と、アンプ102と、A/D変換器103と、信号処理部104Cと、表示部105と、音源特定部135を有している。
【0107】
アンプ102は、4個のマイクロホン101の集音情報(音信号)を増幅する。A/D変換器103は、アンプ102で増幅された4個のマイクロホン101の集音情報(音信号)を、アナログ信号からデジタル信号に変換する。信号処理部104Cは、A/D変換器103で得られた4個のマイクロホン101の集音情報(音信号)に基づいて、音源の位置情報および音情報を取得し、音情報を表示するための表示データを生成する。
【0108】
音源特定部135は、信号処理部104Cで位置情報および音情報を取得する対象としての音源を特定する。この音源特定部135は、図示しない音源選択ボタンなどを備えており、使用者が音源特定操作を行い得るようにされている。対象音源の特定は、例えば、音の周波数、レベル等により行うことができるが、この実施の形態においては、周波数により行う。
【0109】
表示部105は、信号処理部104Cで生成された表示データに基づいて、視覚映像内の音源に対応した位置に、音源の音情報を、この視覚映像に重ねて表示する。この表示部105は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)からバックライトユニットを取りはずした透過型構造のディスプレイにより構成される。
【0110】
図16に示す透過型HMD10Cの動作を説明する。4個のマイクロホン101の集音情報(音信号)は、アンプ102で増幅され、さらに、A/D変換器103でアナログ信号からデジタル信号に変換された後に、信号処理部104Cに供給される。この信号処理部104Cでは、4個のマイクロホン101の集音情報(音信号)に基づいて、音源の位置情報および音情報(レベル情報、周波数情報)が取得される。この場合、信号処理部104Cでは、音源特定部135で特定された音源のみが対象とされて、位置情報および音情報が取得される。
【0111】
また、信号処理部104Cでは、取得された音源の位置情報および音情報に基づいて、音情報を表示するための表示データが生成される。この表示データは、音情報を、位置情報に対応した視覚映像内の位置に、この視覚映像に重ねて表示するためのものとされる。この場合、音源から出る音のレベル情報は、円の大きさで表示されるように、表示データが生成される。また、この場合、音源から出る音の周波数情報は、円に付される色で表されるように、表示データが生成される。
【0112】
信号処理部104Cで生成される表示データは、表示部105に供給される。この表示部105では、表示データに基づいて、視覚映像内の音源に対応した位置に、音源の音情報が、この視覚映像に重ねて表示される(図7(c)参照)。この場合、音源位置が表示面内(視覚映像内)にある場合には、その音源位置あるいはその近傍に、音情報が表示される。また、この場合、音源位置が表示面内(視覚映像内)から外れる場合には、その音源位置に近い表示面(視覚映像)の端部に、音情報が表示される。
【0113】
図16に示す透過型HMD10Cにおいては、上述の図1、図3に示す透過型HMD10と同様に構成されているので、同様の効果を得ることができる。また、図16に示す透過型HMD10Cにおいて、信号処理部104Cでは、音源特定部135で特定された音源のみが対象とされて、位置情報および音情報が取得される。そのため、視覚映像内に特定の音源の音情報のみを表示させることができ、特定の音源の探索が容易となる。
【0114】
<5.変形例>
なお、上述実施の形態においては、音源の音情報がレベル情報および周波数である例を示した。しかし、この音情報としては、その他の情報も考えられる。例えば、(1)音声認識によって判断した言葉を表す文字情報、(2)環境音から得られた物体の発音を示す擬態語(電車:ガタンゴトンなど)、(3)生物の発音を示す擬音語、(4)音信号の時間軸波形、パワースペクトル、周波数スペクトル、などである。
【0115】
また、上述実施の形態においては、音源の音のレベル情報が円の大きさで表示される例を示した。しかし、円以外の表示形状であってもよい。例えば、(1)多角形、(2)矢印、(3)吹き出し、(4)人の音声、その他生物、環境音といった発音体の種類によるフォント、等であってもよい。
【0116】
また、上述実施の形態においては、音源の音の周波数情報が円に付される色で表示される例を示した。しかし、(1)人の性別、(2)人の音声、(3)その他生物、環境音といった発音体の種類を色分けして表示し、さらに、音の大きさを色の濃淡で表示すること等も考えられる。
【産業上の利用可能性】
【0117】
この発明は、例えば、ヘッドマウントディスプレイを用いた聴力支援装置等に適用できる。
【符号の説明】
【0118】
10,10A,10C・・・透過型ヘッドマウントディスプレイ(透過型HMD)
10B・・・非透過型ヘッドマウントディスプレイ(非透過型HMD)
101・・・マイクロホン(全指向マイクロホン)
101a・・・指向性マイクロホン
102・・・アンプ
103・・・A/D変換器
104,104A,104C・・・信号処理部
105,105B・・・表示部
106・・・アンプ
107・・・A/D変換器
111・・・デジタルフィルタ
112・・・ゲイン調整部
113,113A・・・音源位置検出部
114・・・レベル解析部
115・・・周波数解析部
116・・・表示データ発生部
117・・・音源方向推定部
118・・・デジタルフィルタ
119・・・ゲイン調整部
131・・・撮像素子(カメラ)
132・・・撮像信号処理部
134・・・重畳部
135・・・音源特定部

【特許請求の範囲】
【請求項1】
複数の集音部と、
上記複数の集音部の集音情報に基づいて、音源の位置情報および音情報を取得する情報取得部と、
上記情報取得部で取得された音情報を、該情報取得部で取得された位置情報に対応した視覚映像内の位置に、該視覚映像に重ねて表示するための表示データを生成する表示データ生成部と、
上記表示データ生成部で生成された表示データに基づいて、上記視覚映像内の音源に対応した位置に、該音源の音情報を該視覚映像に重ねて表示する、頭部装着型の画像表示部と
を備える音情報表示装置。
【請求項2】
上記複数の集音部は、上記画像表示部に配設され、
上記複数の集音部の配設位置で構成される面は、上記画像表示部の表示面に対して直交しない
請求項1に記載の音情報表示装置。
【請求項3】
上記複数の集音部の配設位置で構成される面は、上記画像表示部の表示面に平行である
請求項2に記載の音情報表示装置。
【請求項4】
上記音情報は、上記音源から出る音のレベル情報である
請求項1に記載の音情報表示装置。
【請求項5】
上記表示データ生成部は、上記レベル情報を所定の形状の大きさで表示する表示データを生成する
請求項4に記載の音情報表示装置。
【請求項6】
上記音情報は、上記音源から出る音の周波数情報である
請求項1に記載の音情報表示装置。
【請求項7】
上記表示データ生成部は、上記周波数情報を、所定の形状に付される色で表示する表示データを生成する
請求項6に記載の音情報表示装置。
【請求項8】
上記複数の集音部は、複数の全指向集音部および複数の指向性集音部とからなり、
上記情報取得部は、
上記複数の全指向集音部の集音情報に基づいて音源の第1の方向情報を取得し、該第1の方向情報に基づいて上記複数の指向性集音部の指向方向を制御して該複数の指向性集音部の配設位置における音源の第2の方向情報を取得し、該第2の方向情報に基づいて上記音源の位置情報を取得する
請求項1に記載の音情報表示装置。
【請求項9】
上記情報取得部が上記位置情報および上記音情報を取得する対象としての音源を特定する音源特定部をさらに備える
請求項1に記載の音情報表示装置。
【請求項10】
上記音源特定部は、周波数により上記音情報を取得する対象としての音源を特定する
請求項9に記載の音情報表示装置。
【請求項11】
上記画像表示部は、透過型の画像表示部である
請求項1に記載の音情報表示装置。
【請求項12】
上記画像表示部は、非透過型の画像表示部であり、
上記画像表示部に配設され、上記視覚映像の映像データを得るための撮像部と、
上記撮像部で得られた映像データに、上記表示データ生成部で生成された表示データを重畳する重畳部とをさらに備え、
上記画像表示部は、上記重畳部の出力データに基づいて、上記視覚映像を表示すると共に、該視覚映像内の音源に対応した位置に、該音源の音情報を該視覚映像に重ねて表示する
請求項1に記載の音情報表示装置。
【請求項13】
複数の集音部の集音情報に基づいて、音源の位置情報および音情報を取得する情報取得ステップと、
上記情報取得ステップで取得された音情報を、該情報取得ステップで取得された位置情報に対応した視覚映像内の位置に、該視覚映像に重ねて表示するための表示データを生成する表示データ生成ステップと、
上記表示データ生成ステップで生成された表示データに基づいて、上記視覚映像内の音源に対応した位置に、該音源の音情報を該視覚映像に重ねて表示する音情報表示ステップと
を備える音情報表示方法。
【請求項14】
コンピュータを、
複数の集音部の集音情報に基づいて、音源の位置情報および音情報を取得する情報取得手段と、
上記情報取得手段で取得された音情報を、該情報取得手段で取得された位置情報に対応した視覚映像内の位置に、該視覚映像に重ねて表示するための表示データを生成する表示データ生成手段と
として機能させるためのプログラム。

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図14】
image rotate

【図16】
image rotate

【図2】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図13】
image rotate

【図15】
image rotate


【公開番号】特開2012−133250(P2012−133250A)
【公開日】平成24年7月12日(2012.7.12)
【国際特許分類】
【出願番号】特願2010−286934(P2010−286934)
【出願日】平成22年12月24日(2010.12.24)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】