説明

複合現実感システムとそのイベント入力方法及びヘッドマウントディスプレイ

【課題】 現実空間で発生した音響で複合現実空間へのイベント入力を行えるようにして、比較的簡単なシステム構成で種々のイベント入力を実現する。
【解決手段】 操作者Uが装着した表示部11に現実空間と仮想空間を重畳してリアルタイムで表示する複合現実感システム1において、現実空間における操作者Uの位置及び方向を検出し、現実空間で発生した音響を検出し、所定の音源方向からの操作者Uによる操作指示を示す音響に基づいて仮想空間に対する処理を起動する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、操作者が装着した表示部に現実空間と三次元の仮想空間を重畳してリアルタイムで表示する複合現実感システムと、そのイベント入力方法、及び、同システムに使用するヘッドマウントディスプレイに関するものである。
【背景技術】
【0002】
従来、三次元の仮想空間をリアルタイムで可視化した映像を操作者に表示する複合現実感システムにおいて、複合現実感(MR:Mixed Reality)を構成する仮想空間を起動させるイベント入力(操作入力)の方法として、操作者が自ら発した音声をヘッドマウントディスプレイ(HMD:Head Mounted Display)に装着したマイクロホンで取得し、このマイクロホンで取得した所定の音声命令を認識して、システムを起動させるものがある(特許文献1参照)。
【0003】
また、音声とは異なるイベント入力の方法を採用したMRシステムとして、現実空間における物体の動きを検知する検知手段と、操作入力のための表示要素をヘッドマウントディスプレイの表示部に表示させ、この表示要素に対応して操作者の身体が所定の動きを見せた場合に当該表示要素に対応する処理を起動させる制御手段とを備えたものがある。
より具体的には、上記検知手段は、操作者の視線を検出する視線検出手段よりなり、上記制御手段は、表示要素に対して操作者の視線が所定方向にあること又は所定動作をしたことが検出すると、表示要素に対する処理を起動させるようになっている(特許文献2参照)。
【0004】
【特許文献1】特開平10−289034号公報(請求項1及び8)
【特許文献2】特開平8−6708号公報(請求項1及び2)
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、上記特許文献1に記載の音声入力方法では、音声の位置情報を取得しておらず、現実空間における音声の三次元空間情報を利用していないので、システムそのものを起動するイベント入力としては比較的簡単に利用できるが、既に表示された仮想空間の画像に対するイベント入力として利用するためには、現実空間と仮想空間を結びつけるための位置センサが別途必要であり、このセンサで検出した位置情報と音声命令を連動させる必要があるので、システム構成が非常に複雑になるという欠点がある。
【0006】
一方、上記特許文献2に記載のイベント入力方法では、現実空間における物体の動きを検知する検知手段が、操作者の視線を検出する視線検出手段により構成されているので、ヘッドマウントディスプレイの構造が複雑になって製作コストが嵩むとともに、操作者の目の動きを制御手段によって常に捕捉しておく必要があるので、入力処理のための制御データ量が多くなり、システム構成が大型にならざるを得ないという欠点がある。
【0007】
本発明は、このような実情に鑑み、現実空間で発生した音響で複合現実空間へのイベント入力を行えるようにして、比較的簡単なシステム構成で種々のイベント入力を実現することができる複合現実感システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の複合現実感システム(以下、MRシステムという。)は、現実空間における操作者の位置及び方向を検出する位置検出部と、現実空間で発生した音響を検出する音響センサと、前記音響センサで検出した音響の操作者から見た音源方向と、当該音響が操作者による操作指示か否かを認識する音響認識手段と、前記音響認識手段で認識された所定の音源方向からの操作指示に基づいて前記仮想空間に対する処理を起動する起動手段とを備えていることを特徴とする。
【0009】
本発明によれば、音響センサで検出した音響の操作者から見た音源方向と、当該音響が操作者による操作指示か否かを認識し、認識された所定の音源方向からの操作指示に基づいて仮想空間に対する処理を起動するようにしたので、現実空間で発生した音響で複合現実空間へのイベント入力を行うことができる。
このため、従来のように操作者の視線を検出する視線検出手段を設ける必要がなく、ヘッドマウントディスプレイの構造を簡素化できるとともに、操作者の目の動きを常に捕捉しておく必要もないので、入力処理のための制御データ量が少なくて済み、比較的簡単なシステム構成で種々のイベント入力を実現することができる。
【0010】
本発明のMRシステムにおいて、前記音響センサとしては、現実空間で発生した音響の操作者から見た音源方向とその周波数特性を特定できる限り、その設置場所は時に限定されない。しかし、当該音響センサとして現実空間に固定したマイクロホンアレイを採用すると、マイクロホンアレイで拾った音源方向を操作者から見た音源方向に変換する必要があるため、音源方向の推定精度が悪化する恐れがある。
そこで、音源方向の推定をより高精度に行うためには、操作者自身に装着可能なウェアラブルなものであることが好ましく、特に、表示部が、操作者の頭部に装着可能なヘッドマウントディスプレイの表示画面よりなる場合には、当該音響センサとして、そのディスプレイに装着されたマイクロホンアレイより構成することが好ましい。
【0011】
また、本発明のMRシステムにおいて、起動手段を駆動する操作指示のための音響としては、操作者による拍手や指鳴らし等、種々の音響を採用し得るが、操作者が手に持って操作可能な音響発生部材によって発生させる音響であることが好ましい。
この場合、例えば、カスタネットやステッキ等の、マイクロホンアレイで拾い易い比較的高周波の音響を発生する音響発生部材を採用することにより、現実空間で自然に発生する環境音と操作指示のための音響とを区別し易くなるので、仮想空間に対する処理が誤って起動するのを極力防止することができる。
【0012】
また、本発明の複合現実空間に対するイベント入力方法は、現実空間における操作者の位置及び方向を検出し、現実空間で発生した音響を検出し、所定の音源方向からの操作者による操作指示を示す前記音響に基づいて前記仮想空間に対する処理を起動することを特徴とする。
この入力方法によれば、所定の音源方向からの操作指示を示す音響に基づいて仮想空間に対する処理を起動するので、現実空間で発生した音響で複合現実空間へのイベント入力を行うことができる。
このため、従来のように操作者の視線を検出する視線検出手段を設ける必要がなく、ヘッドマウントディスプレイの構造を簡素化できるとともに、操作者の目の動きを常に捕捉しておく必要もないので、入力処理のための制御データ量が少なくて済み、比較的簡単なシステム構成で種々のイベント入力を実現することができる。
【0013】
更に、本発明のヘッドマウントディスプレイは、現実空間における操作者の位置及び方向を検出する位置検出部と、現実空間で発生した音響を検出する音響センサとを備えており、表示部が、所定の音源方向からの操作者による操作指示を示す音響に基づいて起動された仮想画像を前記仮想空間に表示するものであることを特徴とする。
このディスプレイにおいても、所定の音源方向からの操作指示を示す音響に基づいて起動された仮想画像を仮想空間に表示するので、現実空間で発生した音響で複合現実空間へのイベント入力を行うことができる。
このため、従来のように操作者の視線を検出する視線検出手段を設ける必要がなく、ヘッドマウントディスプレイの構造を簡素化できるとともに、操作者の目の動きを常に捕捉しておく必要もないので、入力処理のための制御データ量が少なくて済み、比較的簡単なシステム構成で種々のイベント入力を実現することができる。
【発明の効果】
【0014】
以上の通り、本発明によれば、現実空間で発生した音響で複合現実空間へのイベント入力を行えるので、比較的簡単なシステム構成で種々のイベント入力を実現することができる。
【発明を実施するための最良の形態】
【0015】
以下、図面に基づいて、本発明の実施形態を説明する。
図1〜図3は、本発明の実施形態に係るMRシステムの一例を示している。
〔システムのハードウェア構成〕
図1は、上記MRシステムのハードウェア構成を示している。
この図1に示すように、本実施形態のMRシステム1は、現実空間と仮想空間を重畳してリアルタイムで表示するヘッドマウントディスプレイ2と、現実空間で発生した音響を検出する音響センサとして機能するマイクロホンアレイ3と、その音響の音源方向推定用の第一処理コンピュータ4と、MR空間管理用の第二処理コンピュータ5と、現実空間における操作者Uの位置及び方向を検出する位置検出部15の構成要素であるトランスミッタ16とから主構成されている。
【0016】
図2に示すように、ヘッドマウントディスプレイ2は、操作者Uの頭部に装着して使用されるもので、操作者Uの両目を覆った状態で装着されるゴーグル部8と、このゴーグル部8の左右両端部に取り付けられたヘッドバンド9とを備えている。
本実施形態のディスプレイ2は、ビデオシースルー方式であり、ゴーグル部8の内部における両眼とほぼ対応する位置に、CCDイメージセンサを有するビデオカメラ10,10を備えている。ゴーグル部8の前面部分の裏側には、それぞれ両眼に対応する表示画面11,11が左右両側に振り分けて配置されており、この各表示画面11,11に、第二処理コンピュータ5で生成された仮想空間の画像がステレオ方式で表示されるようになっている。
【0017】
本実施形態では、上記ヘッドマウントディスプレイ2に、マイクロホンアレイ3が装着されている。このマイクロホンアレイ3は、ゴーグル部8の上面部分に固定された横長平板状の取付プレート12と、この取付プレート12の上面に固定された複数(図例では4つ)のマイクロホン13よりなる。取付プレート12の左右両端部は、ゴーグル部6の横幅よりも更に左右方向外側に突出しており、その突出部分に各マイクロホン13が取り付けられている。
【0018】
また、ヘッドマウントディスプレイ2のゴーグル部8には、前記位置検出部15の構成要素である位置センサ14が取り付けられている。
図1に戻り、本実施形態の位置検出部15は、屋内の部屋(現実空間)の所定位置に固定されたトランスミッタ16と、ディスプレイ2側に設けた上記位置センサ14とからなる。トランスミッタ16と位置センサ14はそれぞれセンサコントローラ17に接続されており、このコントローラ17は第二処理コンピュータ5に接続されている。
トランスミッタ16は、一定周波数の電磁波を所定半径の領域に放出しており、この領域内に入った電磁コイル式の位置センサ14に発生する交流起電力を分析することでその絶対位置と方向が検出され、この位置センサ14の絶対位置と方向(従って、操作者Uの頭部の絶対位置と方向)が、常時、第二処理コンピュータ5に送信されるようになっている。
【0019】
また、ヘッドマウントディスプレイ2のビデオカメラ10は、HMDコントローラ18を介して第二処理コンピュータ5に接続されており、当該カメラ10で撮影した映像も、上記第二処理コンピュータ5に送信されている。更に、ヘッドマウントディスプレイ2の表示画面11は、中継ボックス19を介して第二処理コンピュータ5に接続されており、この第二処理コンピュータ5で生成された仮想空間の画像が有線又は無線方式で表示画面11に送信される。
【0020】
他方、図1に示すように、マイクロホンアレイ3を構成する各マイクロホン13は音響を増幅するアンプ20に接続され、このアンプ20はAD変換器21を介してに第一処理コンピュータ4に接続されている。従って、マイクロホン13で検出された音響は、増幅及びデジタル信号に変換されて第一処理コンピュータ4に送信される。
また、第一処理コンピュータ4は、受信した音響データを分析して、その音源方向と周波数特性を認識し、その結果を第二処理コンピュータ5に送信する。
【0021】
〔システムの機能〕
図3は、本実施形態のMRシステムの機能ブロック図を示している。
この図3に示すように、マイクロホンアレイ3で検出した音響は、音響入力部23に入力される。この音響入力部23は、前記マイクロホンアンプ20とAD変換器21とから構成されており、当該音響入力部23においてデジタル信号に変換された音響データは第一処理コンピュータ4に送られる。
【0022】
第一処理コンピュータ4は、プログラマブルなパーソナルコンピュータ(PC)よりなり、所定の各機能を実行するプログラムを格納した記憶装置(HDD等)を備えている。この第一処理コンピュータ4は、その記憶装置に格納したプログラムが実行する機能部として、音響分析部24と、音源方向推定部25と、操作指示認識部26とを備えている。
このうち、音響分析部24は、音響入力部23から入力された音響のデジタル信号に高速フーリエ変換等の処理を行う。
【0023】
操作指示認識部26は、変換処理された音響データの周波数が、予め定めた所定の操作指示(操作者Uによるイベント入力)に対応する音響データの周波数に一致するか否かを認識し、一致する場合には、その認識信号を後述する第二処理コンピュータ5の画像生成部28に送信する。
音源方向推定部25は、所定の音源位置の推定アルゴリズムに基づいて音響データの音源方向を推定するものである。
【0024】
上記の推定方法としては、ビームフォーミングによる音源方向推定法、MUSIC法(MUltiple SIgnal Crassification)による音源方向推定法、最小分散法による音源方向推定法、及び、白色化相互相関法(CSP法:Cross-Power Spectrum phase analysis)による音源方向推定法等、種々のものを採用することができるが、この中でもCSP法は、2chのマイクロホンで音響方向を推定できることから、他の手法よりも計算量が少ない点で有利な手法である。
【0025】
他方、音源方向推定部25は、ヘッドマウントディスプレイ2の位置センサ14が検出した操作者Uの頭部の絶対位置及び方向を常時受信しており、この絶対位置及び方向と、前記推定方法で推定した音響データの音源方向に基づいて、操作者Uから見た音源方向を演算する。この操作者Uから見た音源方向は、後述する第二処理コンピュータ5の画像生成部28に送信される。
従って、本実施形態では、上記の音源方向推定部25と操作指示認識部26とから、マイクロホンアレイ3で検出した音響の操作者Uから見た音源方向と、当該音響が操作者Uによる操作指示か否かを認識する音響認識手段が構成されている。
【0026】
前記第二処理コンピュータ5も、プログラマブルなパーソナルコンピュータ(PC)よりなり、所定の各機能を実行するプログラムを格納した記憶装置(HDD等)を備えている。この第二処理コンピュータ5は、その記憶装置に格納したプログラムが実行する機能部として、仮想空間管理部27と、画像生成部28とを備えている。
このうち、仮想空間管理部27は、ヘッドマウントディスプレイ2のビデオカメラ10で撮像された映像を元に、三次元のCG画像よりなる仮想空間を生成するものであり、ビデオシースルー方式のディスプレイ2を使用する本実施形態では、ビデオカメラ10で撮像された映像と同じCG画像が生成される。
【0027】
他方、画像生成部28には、仮想空間管理部27で生成された仮想空間であるCG画像と、トランスミッタ16で検出された操作者Uの頭部の絶対位置及び方向が常時入力されている。画像生成部28は、予め定められた人工的な仮想画像(例えば、図4に示す操作アイコン30A〜30Dや図5に示す仮想配線33等)をCG画像に合成し、ヘッドマウントディスプレイ2の表示画面11に表示させる。
また、画像生成部28は、音源方向推定部25から入力された操作者Uから見た音源方向と、操作指示認識部26から入力された認識信号を受信すると、仮想空間である上記CG画像に対する所定の合成処理を起動し、その処理内容に対応する仮想画像(例えば、図5に示す仮想配管33や図6に示す詳細説明35)をヘッドマウントディスプレイ2の表示画面11に表示させる。
【0028】
〔イベント入力と処理の応用例(1)〕
図4は、上記MRシステムで行えるイベント入力と処理の応用例の一つを示している。
この応用例では、操作者Uの頭部の手前に、仮想空間に対する合成画像である複数の操作アイコン30A〜30Dが横並びで表示されており、操作者Uは、この操作アイコン30A〜30Dに対する音響発生部材よりなる入力デバイスとして、カスタネット31を手に持っている。
そこで、操作者Uがある特定の操作アイコン30Cの場所でカスタネット31を鳴らすと、第二処理コンピュータ5の画像生成部28が当該操作アイコン30Cが操作者Uによって選択されたと判断し、その操作アイコン30Cに対応する所定の処理(例えば、仮想画像の一種である次のメニュー画面への移動)を起動するようになっている。
【0029】
〔イベント入力と処理の応用例(2)〕
図5は、上記MRシステムで行えるイベント入力と処理の他の応用例を示している。
この応用例では、操作者Uは、音響発生部材よりなる入力デバイスとして、ステッキ32を手に持っている。
そこで、操作者Uが現実空間を構成する部屋内の床を叩くと(図5(a)参照)、第二処理コンピュータ5の画像生成部28が操作者Uによって叩かれた床の位置が選択されたと判断し、その位置に床下に埋設された仮想配線33を合成する処理を起動するようになっている(図5(b)参照)。
【0030】
〔イベント入力と処理の応用例(3)〕
図6は、上記MRシステムで行えるイベント入力と処理の他の応用例を示している。
この応用例では、操作者Uは、操作者Uの前方の仮想空間の壁面に、複数の写真や絵画等よりなる表示物34A〜34Cが横並びで表示されており、操作者Uは、この表示物34A〜34Cに対する音響発生部材よりなる入力デバイスとして、カスタネット31を手に持っている。
そこで、操作者Uがある特定の表示物30Bの場所でカスタネット31を鳴らすと、第二処理コンピュータ5の画像生成部28が当該表示物30Bが操作者Uによって選択されたと判断し、その表示物30Bに対応する詳細説明35を起動するようになっている。
【0031】
このように、本実施形態のMRシステム1によれば、マイクロホンアレイ3で検出した音響の操作者Uから見た音源方向と、当該音響が操作者Uによる操作指示か否かを認識し、認識された所定の音源方向からの操作指示に基づいて仮想空間に対する処理を起動するようにしたので、現実空間で発生した音響で複合現実空間へのイベント入力を行うことができる。
従って、上記各応用例(図4〜図6)に示すように、入力デバイスとしてカスタネット31やステッキ32といった簡単な構造の音響発生部材を使用することができる。なお、操作者Uによる拍手や指鳴らしによって入力することも可能である。
【0032】
本発明は上記実施形態に限定されるものではない。
例えば、マイクロホンアレイ3は必ずしもヘッドマウントディスプレイ2に取り付けられている必要はなく、そのディスプレイ2と別体であってもよい。もっとも、前記した通り、操作入力となる音源方向の推定精度を向上させる観点からは、マイクロホンアレイ3を操作者Uに装着することが好ましい。
また、上記MRシステムでは、二台の処理コンピュータ4,5を使用しているが、これらのコンピュータ4,5を一台に纏めることもでき、また、操作者Uが携帯可能なウェアラブルなコンピュータを採用することもできる。
【0033】
更に、上記MRシステムでは、ヘッドマウントディスプレイ2としてビデオシースルー方式のものを採用しているが、光学シースルー方式のディスプレイを採用することもできる。
また、本発明のMRシステムは、屋内だけでなく、屋外を移動する操作者Uに適用することもできる。この場合には、操作者UがGPSと姿勢センサを携帯することにより、操作者Uの絶対位置と方向を計測するシステム構成にすればよい。また、この場合、環境側に位置を特定するIrDAセンサやRFIDタグを設置し、この環境インフラと操作者Uが携帯する歩数計によって操作者Uの位置を計測するようにしてもよい。
【産業上の利用可能性】
【0034】
以上の通り、本発明は、複合現実空間に対する音響による汎用性のあるイベント入力の手法を提供するものであり、複合現実空間に対する対話型の操作インタフェースとしてその応用範囲は広範である。
例えば、本発明は、製造現場や建物での不具合箇所の早期発見(図5参照)、美術館等のアミューズメント施設での顧客サービス(図6参照)、及び、屋外での交通ナビゲーション等に応用することができる。
【図面の簡単な説明】
【0035】
【図1】MRシステムのハードウェア構成を示す全体構成図である。
【図2】ヘッドマウントディスプレイの斜視図である。
【図3】MRシステムの機能ブロック図である。
【図4】イベント入力と処理の応用例を示す図であり、操作者が操作アイコンの位置でカスタネットを鳴らしている状態を示す。
【図5】イベント入力と処理の他の応用例を示す図であり、(a)は操作者が床をステッキで叩く状態を示し、(b)はその叩いた部分に仮想配線が表示された状態を示す。
【図6】イベント入力と処理の他の応用例を示す図であり、(a)は操作者が表示物の手前でカスタネットを鳴らす状態を示し、(b)は選択された表示物の詳細説明が表示された状態を示す。
【符号の説明】
【0036】
1 複合現実感システム
2 ヘッドマウントディスプレイ
3 マイクロホンアレイ(音響センサ)
4 第一処理コンピュータ
5 第二処理コンピュータ
11 表示画面(表示部)
12 取付プレート
13 マイクロホン
14 位置センサ
15 位置検出部
16 トランスミッタ
23 音響入力部
24 音響分析部
25 音源方向推定部(音響認識手段)
26 操作指示認識部(音響認識手段)
27 仮想空間管理部
28 画像生成部(起動手段)
31 カスタネット(音響発生部材)
32 ステッキ(音響発生部材)
33 仮想配管(仮想画像)
35 詳細説明(仮想画像)
U 操作者

【特許請求の範囲】
【請求項1】
操作者が装着した表示部に現実空間と仮想空間を重畳してリアルタイムで表示する複合現実感システムであって、
現実空間における操作者の位置及び方向を検出する位置検出部と、
現実空間で発生した音響を検出する音響センサと、
前記音響センサで検出した音響の操作者から見た音源方向と、当該音響が操作者による操作指示か否かを認識する音響認識手段と、
前記音響認識手段で認識された所定の音源方向からの操作指示に基づいて前記仮想空間に対する処理を起動する起動手段と
を備えていることを特徴とする複合現実感システム。
【請求項2】
前記表示部は、操作者の頭部に装着可能なヘッドマウントディスプレイの表示画面よりなり、前記音響センサは、そのヘッドマウントディスプレイに装着されたマイクロホンアレイよりなる請求項1に記載の複合現実感システム。
【請求項3】
前記操作指示は、操作者が手に持って操作可能な音響発生部材によって発生させる音響よりなる請求項1又は2に記載の複合現実感システム。
【請求項4】
操作者が装着した表示部に現実空間と仮想空間を重畳してリアルタイムで表示してなる複合現実空間に対するイベント入力方法であって、
現実空間における操作者の位置及び方向を検出し、現実空間で発生した音響を検出し、所定の音源方向からの操作者による操作指示を示す前記音響に基づいて前記仮想空間に対する処理を起動することを特徴とする複合現実空間に対するイベント入力方法。
【請求項5】
操作者の頭部に装着可能であり、現実空間と仮想空間を重畳してリアルタイムで表示する表示部を有するヘッドマウントディスプレイであって、
現実空間における操作者の位置及び方向を検出する位置検出部と、現実空間で発生した音響を検出する音響センサとを備えており、
前記表示部は、所定の音源方向からの操作者による操作指示を示す音響に基づいて起動された仮想画像を前記仮想空間に表示するものであることを特徴とするヘッドマウントディスプレイ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−65675(P2008−65675A)
【公開日】平成20年3月21日(2008.3.21)
【国際特許分類】
【出願番号】特願2006−243952(P2006−243952)
【出願日】平成18年9月8日(2006.9.8)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 2006年3月8日 社団法人 電子情報通信学会発行の「電子情報通信学会 2006総合大会講演論文集 A−16−30」に発表
【出願人】(593006630)学校法人立命館 (359)
【Fターム(参考)】