ジェスチャ入力装置
【課題】ユーザの身体にジェスチャ認識用の撮像装置を装着する場合においても、ユーザの意図しない指示が出力されることを低減することが可能なジェスチャ入力装置を提供することを目的とする。
【解決手段】ユーザの身体に装着される撮像装置7と、撮像装置7により撮像されるユーザの手指の撮像画像に基づいて、ユーザの手指のジェスチャを認識する画像認識装置2と、画像認識装置2により認識されるジェスチャに対応する指示を出力するコマンド認識装置3と、ユーザの身体の動きに伴う撮像装置7の姿勢の変動量を求める姿勢測定装置4及び撮像装置姿勢認識装置5と、その変動量に基づいて、コマンド認識装置3からコマンドが出力されることを許可する認識制御装置6とを備えてジェスチャ入力装置1を構成する。
【解決手段】ユーザの身体に装着される撮像装置7と、撮像装置7により撮像されるユーザの手指の撮像画像に基づいて、ユーザの手指のジェスチャを認識する画像認識装置2と、画像認識装置2により認識されるジェスチャに対応する指示を出力するコマンド認識装置3と、ユーザの身体の動きに伴う撮像装置7の姿勢の変動量を求める姿勢測定装置4及び撮像装置姿勢認識装置5と、その変動量に基づいて、コマンド認識装置3からコマンドが出力されることを許可する認識制御装置6とを備えてジェスチャ入力装置1を構成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザにより行われるジェスチャを認識し、その認識結果を外部装置の動作を制御するための指示に変換するジェスチャ入力装置に関する。
【背景技術】
【0002】
ジェスチャ入力装置として、例えば、ユーザの頭部に装着される撮像装置によりマーカや背景を撮像し、その撮像画像に基づいてユーザにより行われるジェスチャを認識し、その認識結果によりパーソナルコンピュータなどの外部装置のGUIの表示や非表示の判定を行うものがある(例えば、特許文献1参照)。
【0003】
また、他のジェスチャ入力装置として、例えば、ユーザの手形状を認識する認識手段と、その認識した手形状の特徴に応じて選択メニューを表示するものがある(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−251154号公報
【特許文献2】特許3777650号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述のように、ユーザの身体に装着される撮像装置からの撮像画像に基づいてユーザにより行われるジェスチャを認識し、その認識結果を外部装置の動作を制御するための指示に変換するジェスチャ入力装置では、ユーザの身体の動きに伴い撮像装置も動いてしまう。すると、撮像装置の動きに併せて撮像装置の撮像範囲も動いてしまうため、あたかもユーザの手指が移動したとジェスチャ入力装置により判断されて、ユーザの意図しない指示が外部装置に出力されるおそれがある。
【0006】
そこで、本発明は、ユーザの身体にジェスチャ認識用の撮像装置を装着する場合においても、ユーザの意図しない動作制御指示が外部装置に出力されることを低減することが可能なジェスチャ入力装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明のジェスチャ入力装置は、撮像手段と、認識手段と、指示出力手段と、変動量検出手段と、指示出力許可手段とを備える。
【0008】
前記撮像手段は、ユーザの身体に装着される。
【0009】
前記認識手段は、前記撮像手段により撮像される前記ユーザの手指の撮像画像に基づいて、前記ユーザにより行われる手指のジェスチャを認識する。
【0010】
前記指示出力手段は、前記認識手段により認識されるジェスチャに対応する動作制御指示を出力する。
【0011】
前記変動量検出手段は、前記ユーザの身体の動きに伴う前記撮像手段の姿勢の変動量を求める。
【0012】
前記指示出力許可手段は、前記変動量が閾値以下のときのみ、前記指示出力手段から動作制御指示が出力されることを許可する。
【発明の効果】
【0013】
本発明によれば、ユーザの手指のジェスチャの認識結果を外部装置の動作制御指示に変換するジェスチャ入力装置において、ユーザの身体にジェスチャ認識用の撮像装置を装着する場合においても、ユーザの意図しない指示が外部装置に出力されることを低減することができる。
【図面の簡単な説明】
【0014】
【図1】本発明の第1実施形態のジェスチャ入力装置を示す図である。
【図2A】ジェスチャ入力装置がメガネ型冶具に取り付けられた例を示す図である。
【図2B】ジェスチャ入力装置がペンダント型に構成された例を示す図である。
【図3】撮像装置の撮像範囲の一例を示す図である。
【図4】撮像画像の一例を示す図である。
【図5】撮像範囲の移動に伴う撮像画像内のユーザの手指の移動の一例を示す図である。
【図6】ユーザの手指のサイズ及び撮像装置からユーザの手指までの距離を示す図である。
【図7】撮像画像に対応する2次元座標と実空間に対応する3次元座標との関係を示す図である。
【図8】3次元座標における手指マーカhとその手指マーカhを外包する球との関係を示す図である。
【図9】撮像画像内のユーザの手指の画素数及び撮像画像の縦方向の画素数を示す図である。
【図10】本発明の第2実施形態のジェスチャ入力装置を示す図である。
【図11】空間に配置されるマーカの一例を示す図である。
【図12】撮像画像内のマーカの一例を示す図である。
【図13】本発明の第3実施形態のジェスチャ入力装置を示す図である。
【図14A】静止時のユーザを示す図である。
【図14B】姿勢測定装置から出力される姿勢データの一例を示す図である。
【図14C】フーリエ変換後の姿勢データの周波数成分の一例を示す図である。
【図14D】特定の周波数帯域に対応する姿勢データを示す図である。
【図14E】バンドカットフィルタ装置から出力される姿勢データの一例を示す図である。
【図15A】歩行時又は走行時のユーザを示す図である。
【図15B】姿勢測定装置から出力される姿勢データの一例を示す図である。
【図15C】フーリエ変換後の姿勢データの周波数成分の一例を示す図である。
【図15D】特定の周波数帯域に対応する姿勢データを示す図である。
【図15E】バンドカットフィルタ装置から出力される姿勢データの一例を示す図である。
【図16】本発明の第4実施形態のジェスチャ入力装置を示す図である。
【図17】モード切替装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0015】
<第1実施形態>
【0016】
図1は、本発明の第1実施形態のジェスチャ入力装置を示す図である。
【0017】
図1に示すジェスチャ入力装置1は、画像認識装置2(認識手段)と、コマンド生成認識装置3(指示出力手段)と、姿勢測定装置4(例えば、ジャイロ、地磁気を利用した方位センサー、加速度計を用いた重力方向センサーなど)(変動量検出手段)と、撮像装置姿勢認識装置5(変動量検出手段)と、認識制御装置6(指示出力許可手段)と、撮像装置7(例えば、小型カメラなど)(撮像手段)と、通信装置8とを備える。
【0018】
すなわち、撮像装置7は、画像認識装置2に接続され、画像認識装置2は、コマンド生成認識装置3に接続される。姿勢測定装置4は、撮像装置姿勢認識装置5に接続され、撮像装置姿勢認識装置5は、コマンド生成認識装置3に接続される。撮像装置姿勢認識装置5は、認識制御装置6に接続され、認識制御装置6は、画像認識装置2に接続される。認識制御装置6は、コマンド生成認識装置3に接続される。コマンド生成認識装置3及び撮像装置姿勢認識装置5は、それぞれ、無線通信又は有線通信を行う通信装置8を介して外部制御装置9(外部装置)に接続される。また、コマンド生成認識装置3は、表示装置10に接続される。
【0019】
なお、ジェスチャ入力装置1は、例えば、パーソナルコンピュータや携帯電話などの外部制御装置9のマウス、キーボード、又はタッチパネルなどに相当する入力装置として利用されるものであって、外部制御装置9の動作を制御するための指示を出力する。また、図2Aに示すように、ジェスチャ入力装置1や表示装置10は、メガネ型治具11に取り付けられてもよい。図2Aに示す例では、撮像装置7の画角とユーザの視野とが互いに同じ方向になるように、ジェスチャ入力装置1がメガネ型治具11に取り付けられている。また、図2Aに示す例では、HMD(Head Mounted Display)などのように、表示装置10に表示される内容が常にユーザの視野に入るように、表示装置10がメガネ型治具11に取り付けられている。また、図2Bに示すように、ジェスチャ入力装置1は、ペンダント型に構成してもよい。図2Bに示す例では、ユーザがジェスチャ入力装置1を首にかけたとき、撮像装置7の画角とユーザの視野とが互いに同じ方向になるように、撮像装置7がジェスチャ入力装置1に内蔵されている。すなわち、ジェスチャ入力装置1は、図2Aや図2Bに示すように、ユーザの身体に装着されるものであって、その形態や装着場所は特に限定されない。
【0020】
第1実施形態のジェスチャ入力装置1は、撮像装置7からの撮像画像に基づいて、ユーザにより行われるジェスチャを認識し、その認識結果をコマンド(外部制御装置9の動作を制御するための指示)に変換した後、そのコマンドを通信装置8を介して外部制御装置9に出力し、そのコマンドに対応する動作を外部制御装置9に実行させる。
【0021】
撮像装置7は、結像レンズ、撮像素子、及び画像処理エンジンなどを備え、主にユーザの手指の画像を撮像し、その撮像画像を画像認識装置2に出力する。また、撮像装置7は、カメラ撮影パラメータ・サムネイル画像データを通信装置8を介して外部制御装置9に出力する。
【0022】
画像認識装置2は、入力される撮像画像に基づいて、ユーザの手指の形や動作すなわちジェスチャを認識し、その認識結果をコマンド生成認識装置3に出力する。なお、撮像画像からジェスチャを認識する技術は、予め手指に付けられる1以上のマーカの撮像画像に基づいてジェスチャ認識を行うなど、種々の既存の技術を利用することができる。例えば、特開2006−155244号公報や特許4013100号公報などに記載されている技術を利用することができる。
【0023】
コマンド生成認識装置3は、画像認識装置2から出力される認識結果に対応するコマンドを通信装置8を介して外部制御装置9に送信したり、外部制御装置9から送信されるコマンド(ジェスチャ入力装置1の動作を制御するための指示)を通信装置8を介して受信する。
【0024】
外部制御装置9は、受信するコマンドに基づいて、マウスカーソルの移動、クリック、画像の再生や停止などの各種動作を実行する。
【0025】
ここで、例えば、図3に示すように、ジェスチャ入力装置1がユーザの頭部に装着され、図4に示すように、撮像装置7の撮像範囲(画角)にユーザの手指や外部制御装置9が入っている場合を想定する。このような場合において、ユーザが頭部を上から下に振ると、ユーザの頭部とともに撮像装置7の撮像範囲は下方に移動し、撮像画像内のユーザの手指は、図5に示すように、上方に移動する。そのため、画像認識装置2は、あたかもユーザが手指を上方に振り上げたようなジェスチャが行われたと認識してしまうおそれがある。そして、このようなジェスチャの誤認識が発生すると、その認識結果に対応するコマンドがコマンド生成認識装置3から出力されてしまい、ユーザが意図しない動作(例えば、カーソルを下から上に移動させる動作)が外部制御装置9により実行されてしまう。すなわち、ユーザの何気ない身体の動作に伴う撮像装置7の姿勢の変動により、ユーザが意図しないコマンドが出力されてしまい、外部制御装置9が誤動作するおそれがある。
【0026】
第1実施形態のジェスチャ入力装置1では、このようなユーザが意図しないコマンドが出力されることを低減するために、姿勢測定装置4、撮像装置姿勢認識装置5、及び認識制御装置6を備えている。
【0027】
姿勢測定装置4は、撮像装置7との相対距離が固定されており、姿勢測定装置4自体が縦方向に回転するときの回転角の変動量を測定し、その変動量を姿勢データとして撮像装置姿勢認識装置5に出力する。例えば、ジェスチャ入力装置1がユーザの頭部に装着され、ユーザの頭部が縦方向に動いていないとき、姿勢測定装置4は一定の姿勢データを出力する。
【0028】
撮像装置姿勢認識装置5は、入力される姿勢データに基づいて、撮像装置7が縦方向に回転するときの回転角の変動量を求め、その変動量を撮像装置姿勢データとして認識制御装置6に出力する。なお、撮像装置姿勢認識装置5は、撮像装置姿勢データを通信装置8を介して外部制御装置9に出力してもよい。
【0029】
認識制御装置6は、入力される撮像装置姿勢データに基づいて、画像認識装置2において認識されるジェスチャをコマンドに変換することを許可するか否かを示す許可・不許可データをコマンド生成認識装置3に出力する。
【0030】
例えば、ユーザの手指が所定距離(例えば、±5mm)以上移動したとき、そのユーザの手指のジェスチャが画像認識装置2において予め決められているジェスチャとして認識される場合を想定する。なお、上記所定距離は、以下、「ジェスチャ分解能」とし、予め決められているジェスチャに応じて設定されているものとする。
【0031】
このような場合において、認識制御装置6は、撮像装置姿勢データが閾値(例えば、±2.5mm(撮像装置姿勢データをユーザの手指の移動距離に換算したときの値))以下であると判断すると、ジェスチャからコマンドへの変換を許可することを示す許可・不許可データをコマンド生成認識装置3に出力する。コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可することを示す許可・不許可データが入力されると、画像認識装置2において認識されるジェスチャをコマンドに変換する。また、コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可することを示す許可・不許可データが入力されると、ジェスチャによる外部制御装置9の動作制御が可能である旨を表示装置10に表示させるようにしてもよい。これにより、ユーザに対して外部制御装置9が制御可能である旨を伝えることができ、現在の姿勢を維持することをユーザに促すことができる。
【0032】
一方、認識制御装置6は、撮像装置姿勢データが閾値を超えたと判断すると、ジェスチャからコマンドへの変換を許可しないことを示す許可・不許可データをコマンド生成認識装置3に出力する。コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可しないことを示す許可・不許可データが入力されると、画像認識装置2において認識されるジェスチャをコマンドに変換しない。また、コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可しないことを示す許可・不許可データが入力されると、ジェスチャによる外部制御装置9の動作制御が不可能であり、頭部の動作をやめさせる旨を表示装置10に表示させるようにしてもよい。これにより、ユーザに対して外部制御装置9が制御不能である旨を伝えることができ、外部制御装置9が制御可能になる姿勢を取ることをユーザに促すことができる。また、外部制御装置9が制御可能になる姿勢をユーザが取ることができない場合、外部制御装置9が誤動作しないように、わざと手指から視線(撮像装置7の撮像範囲)を外すことをユーザに促すことができる。
【0033】
なお、上記閾値は、特には限定されないが、上述のように「ジェスチャ分解能」の1/2としてもよいし、ユーザが意図しないコマンドが発生する場合としない場合のそれぞれの姿勢データの実測値に基づいて設定してもよい。
【0034】
また、上記閾値は、撮像装置7からユーザの手指までの距離が短くなる程、大きくなるように変化させてもよい。例えば、図6に示すように、姿勢データをθH[deg]、等角射影のレンズを有する撮像装置7からユーザの手指に付けられた楕円状のマーカ12までの距離をLh、手指のサイズをWh、手指のサイズのうちジェスチャ認識の不感帯幅となる割合をα[%]、上記閾値をΔθHとすると、閾値ΔθH=tan−1(Wh×α/100Lh)という式(1)が成り立つ。
ここで、距離Lhの求め方の一例を説明する。
例えば、図7に示すように、撮像装置7の焦点距離をf、撮像装置7を基準とする3次元座標(以下、単に3次元座標という)の原点をOcとし、3次元座標のx軸が撮像装置7の撮像画像に対応する2次元座標(以下、単に2次元座標という)のu軸と平行であり、3次元座標のy軸が2次元座標のv軸と平行であり、3次元座標のz軸が2次元座標における撮像画像の中心位置(u0,v0)を通る場合を想定する。
このような場合、3次元座標におけるマーカ12の中心位置P(x, y, z)と、その中心位置P(x,y,z)に対応する2次元座標におけるマーカ12の中心位置Q (u,v)との間には下記数1又は数2の関係が成り立つ。
【数1】
【数2】
また、図8に示すように、2次元座標のv軸におけるマーカ12の長軸の長さをrとし、3次元座標のy−z軸におけるマーカ12を外包する球の半径をR(近似値)とすると、撮像装置7の光軸(3次元座標のz軸)と直線OP(原点Ocとマーカ12の中心位置Pとを結ぶ直線)とが成す角度をθとすると、下記数3の関係が成り立つ。
【数3】
すなわち、上記数3は下記数4となる。
【数4】
また、下記数5又は数6の関係も成り立つ。
【数5】
【数6】
そして、上記数4と上記数6により、下記数7を求めることができる。
【数7】
すなわち、認識制御装置6は、上記数7に、撮像装置7の焦点距離をf、2次元座標におけるマーカ12の長軸の長さをr、3次元座標におけるマーカ12を外包する球の半径R、2次元座標における撮像画像の中心位置(u0,v0)、2次元座標におけるマーカ12の中心位置Q (u,v)を代入することにより、3次元座標におけるマーカ12のz座標を求める。
同様にして、認識制御装置6は、下記数8により、3次元座標におけるマーカ12のx座標を求める。
【数8】
また、同様にして、認識制御装置6は、下記数9により、3次元座標におけるマーカ12のy座標を求める。
【数9】
そして、認識制御装置6は、距離Lhを3次元座標におけるマーカ12の中心位置(x、y、z)と下記数10とにより求める。
【数10】
【0035】
また、上述の式(1)は、図9に示すように、撮像画像上の手指のサイズ(画素数)をWh1、撮像画像の縦サイズ(画素数)をWL1とすると、閾値ΔθH=tan−1(α・(π/18000)・(Wh1/WL1)・θL)と表すこともできる。また、撮像画像上における手指のサイズWh1は、ジェスチャ毎に変化するため、サイズWh1の変化量を考慮して閾値ΔθHを計算するようにしてもよい。
【0036】
このように、第1実施形態のジェスチャ入力装置1は、撮像装置姿勢データが閾値以下のときのみ、すなわち、撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【0037】
なお、上記撮像装置姿勢認識装置5は、姿勢測定装置4が縦方向に回転するときの回転角の変動量を示す姿勢データに基づいて、撮像装置姿勢データを求める構成であるが、姿勢測定装置4が縦方向に回転するときの回転角の変動量及び姿勢測定装置4が横方向に回転するときの回転角の変動量を示す姿勢データに基づいて、撮像装置姿勢データを求めるようにしてもよい。このように構成する場合、認識制御装置6は、撮像装置7が縦方向に回転するときの回転角の変動量が第1閾値以下のときのみ又は撮像装置7が横方向に回転するときの回転角の変動量が第2閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可する。これにより、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることをさらに精度よく低減することができる。
【0038】
また、上記第1実施形態のジェスチャ入力装置1では、撮像装置7の姿勢の変動量が閾値以下であるか否かによりコマンド出力制御を行う構成であるが、撮像装置7の姿勢の変動量の連続的な変化に基づいてコマンド出力制御を行うように構成してもよい。
【0039】
<第2実施形態>
【0040】
図10は、本発明の第2実施形態のジェスチャ入力装置を示す図である。なお、図10において、図1に示す構成と同じ構成には同じ符号を付している。
【0041】
第2実施形態のジェスチャ入力装置13において、第1実施形態のジェスチャ入力装置1と異なる点は、姿勢測定装置4により測定される姿勢データではなく、空間に配置されるマーカ(例えば、図11や図12に示すように、机上に配置されるマーカAや外部制御装置9のディスプレイに表示されるマーカB)の撮像画像に基づいて、コマンド出力を許可するか否かを判断する点である。そのため、第2実施形態のジェスチャ入力装置13では、姿勢測定装置4を備えていない。
【0042】
第2実施形態の画像認識装置2は、入力される撮像画像内のマーカの移動量を求め、その求めた移動量を姿勢データ(撮像装置7が縦方向や横方向に回転するときの回転角の変動量に相当する値)として撮像装置姿勢認識装置5に出力する。なお、撮像画像内のマーカの移動量の求め方は、種々の既存の技術を利用することができる。例えば、特許4455294号公報などに記載される技術を利用することができる。また、上述したように、3次元座標におけるマーカの中心位置(x,y,z)を定期的に求め、そのマーカの中心位置の変化量をマーカの移動量として求めてもよい。
【0043】
第2実施形態の撮像装置姿勢認識装置5は、入力される姿勢データに基づいて、撮像装置7が縦方向や横方向に回転するときの回転角の変動量を求め、その変動量を撮像装置姿勢データとして認識制御装置6に出力する。
【0044】
第2実施形態の認識制御装置6及びコマンド生成認識装置3の動作は、第1実施形態の認識制御装置6及びコマンド生成認識装置3の動作と同様である。
【0045】
このように、第2実施形態のジェスチャ入力装置13は、第1実施形態のジェスチャ入力装置1と同様に、撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【0046】
また、第2実施形態のジェスチャ入力装置13は、第1実施形態のジェスチャ入力装置1に比べて、姿勢測定装置4を備えていない分、より簡易な構成にすることができる。
【0047】
<第3実施形態>
【0048】
図13は、本発明の第3実施形態のジェスチャ入力装置を示す図である。なお、図13において、図1に示す構成と同じ構成には同じ符号を付している。
【0049】
第3実施形態のジェスチャ入力装置14において、第1実施形態のジェスチャ入力装置1と異なる点は、姿勢測定装置4や撮像装置姿勢認識装置5に接続されるバンドカットフィルタ装置15(移動量補正手段)をさらに備えている点である。なお、バンドカットフィルタ装置15は、第2実施形態のジェスチャ入力装置13において、画像認識装置2と撮像装置姿勢認識装置5との間に備えてもよい。
【0050】
すなわち、バンドカットフィルタ装置15は、姿勢測定装置4から出力される姿勢データをフーリエ変換して特定の周波数帯域の姿勢データをカットした後、逆フーリエ変換を行い、その逆フーリエ変換後の姿勢データを補正後の姿勢データとして撮像装置姿勢認識装置5に出力する。
【0051】
例えば、図14Aに示すように、ユーザが静止している場合では、図14Bに示すような姿勢データが姿勢測定装置4から出力される。この姿勢データは、主にユーザの身体の動きに伴う変動(振幅)が含まれており、バンドカットフィルタ装置15においてフーリエ変換が行われ、例えば、図14Cに示すような特定の周波数帯域の姿勢データがカットされる。この特定の周波数帯域は、ユーザが歩行や走行を行っているときなどユーザが周期的な動作を行っているときに姿勢測定装置4により測定される姿勢データの周波数帯域であり、この特定の周波数帯域の姿勢データは、ユーザが静止している場合、例えば、図14Dに示すように、ほぼ変動がない姿勢データとなる。その後、バンドカットフィルタ装置15において逆フーリエ変換が行われると、図14Eに示すような姿勢データとなる。すなわち、ユーザが静止している場合の補正後の姿勢データは、補正前の姿勢データと比べてあまり変化がない。
【0052】
また、図15Aに示すように、ユーザが歩行や走行を行っている場合では、図15Bに示すような姿勢データが姿勢測定装置4から出力される。この姿勢データは、ユーザの身体の動きに伴う変動(振幅)の他に、ユーザの歩行や走行に伴う変動が重畳されており、バンドカットフィルタ装置15においてフーリエ変換が行われ、例えば、図15Cに示すような特定の周波数帯域(図14Cに示す特定の周波数帯域と同様)の姿勢データがカットされる。この特定の周波数帯域の姿勢データは、ユーザが歩行や走行を行っている場合、例えば、図15Dに示すように、周期的な変動がある姿勢データとなる。その後、バンドカットフィルタ装置15において逆フーリエ変換が行われると、図15Eに示すような姿勢データとなる。すなわち、図15Eに示す姿勢データは、ユーザが静止しているときの姿勢データとほぼ同じものとして扱うことができる。
【0053】
このように、バンドカットフィルタ装置15から出力される補正後の姿勢データは、ユーザが歩行や走行を行っていても、ユーザが静止しているときの姿勢データとして扱うことができる。
【0054】
第3実施形態の撮像装置姿勢認識装置5は、バンドカットフィルタ装置15から出力される姿勢データに基づいて、撮像装置7が縦方向や横方向に回転するときの回転角の変動量を求め、その変動量を撮像装置姿勢データとして認識制御装置6に出力する。
【0055】
第3実施形態の認識制御装置6及びコマンド生成認識装置3の動作は、第1及び第2実施形態の認識制御装置6及びコマンド生成認識装置3の動作と同様である。
【0056】
このように、第3実施形態のジェスチャ入力装置14は、第1実施形態のジェスチャ入力装置1や第2実施形態のジェスチャ入力装置13と同様に、撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【0057】
また、第3実施形態のジェスチャ入力装置14は、ユーザの歩行や走行の際に生じる姿勢データの変動をキャンセルすることができるため、ユーザが歩行や走行を行っているときでも、精度を落とすことなく、姿勢データに基づいて、コマンド出力を許可するか否かを判断することができる。
【0058】
<第4実施形態>
【0059】
図16は、本発明の第4実施形態のジェスチャ入力装置を示す図である。なお、図16において、図1に示す構成と同じ構成には同じ符号を付している。
【0060】
第4実施形態のジェスチャ入力装置16において、第1実施形態のジェスチャ入力装置1と異なる点は、認識制御装置6に接続されるモード切替装置17(閾値変更手段)をさらに備えている点である。なお、モード切替装置17は、第2実施形態のジェスチャ入力装置13において、認識制御装置6に接続されるようにして備えられてもよい。
【0061】
モード切替装置17は、コマンド生成認識装置3や通信装置8から出力されるコマンドを常時確認し、そのコマンドがモード切替用のコマンドのとき、モード切替を実施する。モード切替とは、認識制御装置6で使用される閾値を変更することである。例えば、ユーザの親指と人差し指とで輪を形成するジェスチャが5秒間行われたことを認識した結果によりコマンド生成認識装置3からモード切替用のコマンドが出力されると、モード切替装置17は、そのモード切替用のコマンドに対応する閾値を認識制御装置6に出力する。そして、認識制御装置6は、モード切替装置17から出力される閾値に基づいて、ジェスチャからコマンドへの変換を許可するか否かを判断する。例えば、画像認識装置2において細かい動きのジェスチャを認識させるモードに切り替えるためのコマンドがモード切替装置17に入力されると、認識制御装置6で使用される閾値を小さくする。一方、画像認識装置2において大きな動きのジェスチャを認識させるモードに切り替えるためのコマンドがモード切替装置17に入力されると、認識制御装置6で使用される閾値を大きくする。これにより、指先を動かすジェスチャなど細かな動きのジェスチャを行う際にユーザが意図しないコマンドが頻繁に出力されることや腕を使ったジェスチャなど大きな動きのジェスチャを行う際にユーザが意図するコマンドがなかなか出力されないことを低減することができる。
【0062】
図17は、モード切替装置17の動作を説明するフローチャートである。
【0063】
まず、モード切替装置17は、コマンドが入力されると(ステップS1がYes)、その入力されたコマンドとモード切替装置17内の記憶部に記憶されているコマンドとを比較して(ステップS2)、入力されたコマンドが変更されているか否かを判断する(ステップS3)。
【0064】
次に、モード切替装置17は、変更されていないと判断した場合(ステップS3がNo)、ステップS1に戻り、変更されていると判断した場合(ステップS3がYes)、入力されたコマンドを記憶部に上書きすることによりコマンドを書き換える(ステップS4)。
【0065】
そして、モード切替装置17は、その書換え後のコマンドに対応する閾値を記憶部から読み出し(ステップS5)、認識制御装置6に新しい閾値として出力する。
【0066】
このように、第4実施形態のジェスチャ入力装置16においても、第1実施形態のジェスチャ入力装置1や第2実施形態のジェスチャ入力装置13と同様に撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【符号の説明】
【0067】
1 ジェスチャ入力装置
2 画像認識装置
3 コマンド生成認識装置
4 姿勢測定装置
5 撮像装置姿勢認識装置
6 認識制御装置
7 撮像装置
8 通信装置
9 外部制御装置
10 表示装置
11 メガネ型冶具
12 マーカ
13 ジェスチャ入力装置
14 ジェスチャ入力装置
15 バンドカットフィルタ装置
16 ジェスチャ入力装置
17 モード切替装置
【技術分野】
【0001】
本発明は、ユーザにより行われるジェスチャを認識し、その認識結果を外部装置の動作を制御するための指示に変換するジェスチャ入力装置に関する。
【背景技術】
【0002】
ジェスチャ入力装置として、例えば、ユーザの頭部に装着される撮像装置によりマーカや背景を撮像し、その撮像画像に基づいてユーザにより行われるジェスチャを認識し、その認識結果によりパーソナルコンピュータなどの外部装置のGUIの表示や非表示の判定を行うものがある(例えば、特許文献1参照)。
【0003】
また、他のジェスチャ入力装置として、例えば、ユーザの手形状を認識する認識手段と、その認識した手形状の特徴に応じて選択メニューを表示するものがある(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−251154号公報
【特許文献2】特許3777650号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述のように、ユーザの身体に装着される撮像装置からの撮像画像に基づいてユーザにより行われるジェスチャを認識し、その認識結果を外部装置の動作を制御するための指示に変換するジェスチャ入力装置では、ユーザの身体の動きに伴い撮像装置も動いてしまう。すると、撮像装置の動きに併せて撮像装置の撮像範囲も動いてしまうため、あたかもユーザの手指が移動したとジェスチャ入力装置により判断されて、ユーザの意図しない指示が外部装置に出力されるおそれがある。
【0006】
そこで、本発明は、ユーザの身体にジェスチャ認識用の撮像装置を装着する場合においても、ユーザの意図しない動作制御指示が外部装置に出力されることを低減することが可能なジェスチャ入力装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明のジェスチャ入力装置は、撮像手段と、認識手段と、指示出力手段と、変動量検出手段と、指示出力許可手段とを備える。
【0008】
前記撮像手段は、ユーザの身体に装着される。
【0009】
前記認識手段は、前記撮像手段により撮像される前記ユーザの手指の撮像画像に基づいて、前記ユーザにより行われる手指のジェスチャを認識する。
【0010】
前記指示出力手段は、前記認識手段により認識されるジェスチャに対応する動作制御指示を出力する。
【0011】
前記変動量検出手段は、前記ユーザの身体の動きに伴う前記撮像手段の姿勢の変動量を求める。
【0012】
前記指示出力許可手段は、前記変動量が閾値以下のときのみ、前記指示出力手段から動作制御指示が出力されることを許可する。
【発明の効果】
【0013】
本発明によれば、ユーザの手指のジェスチャの認識結果を外部装置の動作制御指示に変換するジェスチャ入力装置において、ユーザの身体にジェスチャ認識用の撮像装置を装着する場合においても、ユーザの意図しない指示が外部装置に出力されることを低減することができる。
【図面の簡単な説明】
【0014】
【図1】本発明の第1実施形態のジェスチャ入力装置を示す図である。
【図2A】ジェスチャ入力装置がメガネ型冶具に取り付けられた例を示す図である。
【図2B】ジェスチャ入力装置がペンダント型に構成された例を示す図である。
【図3】撮像装置の撮像範囲の一例を示す図である。
【図4】撮像画像の一例を示す図である。
【図5】撮像範囲の移動に伴う撮像画像内のユーザの手指の移動の一例を示す図である。
【図6】ユーザの手指のサイズ及び撮像装置からユーザの手指までの距離を示す図である。
【図7】撮像画像に対応する2次元座標と実空間に対応する3次元座標との関係を示す図である。
【図8】3次元座標における手指マーカhとその手指マーカhを外包する球との関係を示す図である。
【図9】撮像画像内のユーザの手指の画素数及び撮像画像の縦方向の画素数を示す図である。
【図10】本発明の第2実施形態のジェスチャ入力装置を示す図である。
【図11】空間に配置されるマーカの一例を示す図である。
【図12】撮像画像内のマーカの一例を示す図である。
【図13】本発明の第3実施形態のジェスチャ入力装置を示す図である。
【図14A】静止時のユーザを示す図である。
【図14B】姿勢測定装置から出力される姿勢データの一例を示す図である。
【図14C】フーリエ変換後の姿勢データの周波数成分の一例を示す図である。
【図14D】特定の周波数帯域に対応する姿勢データを示す図である。
【図14E】バンドカットフィルタ装置から出力される姿勢データの一例を示す図である。
【図15A】歩行時又は走行時のユーザを示す図である。
【図15B】姿勢測定装置から出力される姿勢データの一例を示す図である。
【図15C】フーリエ変換後の姿勢データの周波数成分の一例を示す図である。
【図15D】特定の周波数帯域に対応する姿勢データを示す図である。
【図15E】バンドカットフィルタ装置から出力される姿勢データの一例を示す図である。
【図16】本発明の第4実施形態のジェスチャ入力装置を示す図である。
【図17】モード切替装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0015】
<第1実施形態>
【0016】
図1は、本発明の第1実施形態のジェスチャ入力装置を示す図である。
【0017】
図1に示すジェスチャ入力装置1は、画像認識装置2(認識手段)と、コマンド生成認識装置3(指示出力手段)と、姿勢測定装置4(例えば、ジャイロ、地磁気を利用した方位センサー、加速度計を用いた重力方向センサーなど)(変動量検出手段)と、撮像装置姿勢認識装置5(変動量検出手段)と、認識制御装置6(指示出力許可手段)と、撮像装置7(例えば、小型カメラなど)(撮像手段)と、通信装置8とを備える。
【0018】
すなわち、撮像装置7は、画像認識装置2に接続され、画像認識装置2は、コマンド生成認識装置3に接続される。姿勢測定装置4は、撮像装置姿勢認識装置5に接続され、撮像装置姿勢認識装置5は、コマンド生成認識装置3に接続される。撮像装置姿勢認識装置5は、認識制御装置6に接続され、認識制御装置6は、画像認識装置2に接続される。認識制御装置6は、コマンド生成認識装置3に接続される。コマンド生成認識装置3及び撮像装置姿勢認識装置5は、それぞれ、無線通信又は有線通信を行う通信装置8を介して外部制御装置9(外部装置)に接続される。また、コマンド生成認識装置3は、表示装置10に接続される。
【0019】
なお、ジェスチャ入力装置1は、例えば、パーソナルコンピュータや携帯電話などの外部制御装置9のマウス、キーボード、又はタッチパネルなどに相当する入力装置として利用されるものであって、外部制御装置9の動作を制御するための指示を出力する。また、図2Aに示すように、ジェスチャ入力装置1や表示装置10は、メガネ型治具11に取り付けられてもよい。図2Aに示す例では、撮像装置7の画角とユーザの視野とが互いに同じ方向になるように、ジェスチャ入力装置1がメガネ型治具11に取り付けられている。また、図2Aに示す例では、HMD(Head Mounted Display)などのように、表示装置10に表示される内容が常にユーザの視野に入るように、表示装置10がメガネ型治具11に取り付けられている。また、図2Bに示すように、ジェスチャ入力装置1は、ペンダント型に構成してもよい。図2Bに示す例では、ユーザがジェスチャ入力装置1を首にかけたとき、撮像装置7の画角とユーザの視野とが互いに同じ方向になるように、撮像装置7がジェスチャ入力装置1に内蔵されている。すなわち、ジェスチャ入力装置1は、図2Aや図2Bに示すように、ユーザの身体に装着されるものであって、その形態や装着場所は特に限定されない。
【0020】
第1実施形態のジェスチャ入力装置1は、撮像装置7からの撮像画像に基づいて、ユーザにより行われるジェスチャを認識し、その認識結果をコマンド(外部制御装置9の動作を制御するための指示)に変換した後、そのコマンドを通信装置8を介して外部制御装置9に出力し、そのコマンドに対応する動作を外部制御装置9に実行させる。
【0021】
撮像装置7は、結像レンズ、撮像素子、及び画像処理エンジンなどを備え、主にユーザの手指の画像を撮像し、その撮像画像を画像認識装置2に出力する。また、撮像装置7は、カメラ撮影パラメータ・サムネイル画像データを通信装置8を介して外部制御装置9に出力する。
【0022】
画像認識装置2は、入力される撮像画像に基づいて、ユーザの手指の形や動作すなわちジェスチャを認識し、その認識結果をコマンド生成認識装置3に出力する。なお、撮像画像からジェスチャを認識する技術は、予め手指に付けられる1以上のマーカの撮像画像に基づいてジェスチャ認識を行うなど、種々の既存の技術を利用することができる。例えば、特開2006−155244号公報や特許4013100号公報などに記載されている技術を利用することができる。
【0023】
コマンド生成認識装置3は、画像認識装置2から出力される認識結果に対応するコマンドを通信装置8を介して外部制御装置9に送信したり、外部制御装置9から送信されるコマンド(ジェスチャ入力装置1の動作を制御するための指示)を通信装置8を介して受信する。
【0024】
外部制御装置9は、受信するコマンドに基づいて、マウスカーソルの移動、クリック、画像の再生や停止などの各種動作を実行する。
【0025】
ここで、例えば、図3に示すように、ジェスチャ入力装置1がユーザの頭部に装着され、図4に示すように、撮像装置7の撮像範囲(画角)にユーザの手指や外部制御装置9が入っている場合を想定する。このような場合において、ユーザが頭部を上から下に振ると、ユーザの頭部とともに撮像装置7の撮像範囲は下方に移動し、撮像画像内のユーザの手指は、図5に示すように、上方に移動する。そのため、画像認識装置2は、あたかもユーザが手指を上方に振り上げたようなジェスチャが行われたと認識してしまうおそれがある。そして、このようなジェスチャの誤認識が発生すると、その認識結果に対応するコマンドがコマンド生成認識装置3から出力されてしまい、ユーザが意図しない動作(例えば、カーソルを下から上に移動させる動作)が外部制御装置9により実行されてしまう。すなわち、ユーザの何気ない身体の動作に伴う撮像装置7の姿勢の変動により、ユーザが意図しないコマンドが出力されてしまい、外部制御装置9が誤動作するおそれがある。
【0026】
第1実施形態のジェスチャ入力装置1では、このようなユーザが意図しないコマンドが出力されることを低減するために、姿勢測定装置4、撮像装置姿勢認識装置5、及び認識制御装置6を備えている。
【0027】
姿勢測定装置4は、撮像装置7との相対距離が固定されており、姿勢測定装置4自体が縦方向に回転するときの回転角の変動量を測定し、その変動量を姿勢データとして撮像装置姿勢認識装置5に出力する。例えば、ジェスチャ入力装置1がユーザの頭部に装着され、ユーザの頭部が縦方向に動いていないとき、姿勢測定装置4は一定の姿勢データを出力する。
【0028】
撮像装置姿勢認識装置5は、入力される姿勢データに基づいて、撮像装置7が縦方向に回転するときの回転角の変動量を求め、その変動量を撮像装置姿勢データとして認識制御装置6に出力する。なお、撮像装置姿勢認識装置5は、撮像装置姿勢データを通信装置8を介して外部制御装置9に出力してもよい。
【0029】
認識制御装置6は、入力される撮像装置姿勢データに基づいて、画像認識装置2において認識されるジェスチャをコマンドに変換することを許可するか否かを示す許可・不許可データをコマンド生成認識装置3に出力する。
【0030】
例えば、ユーザの手指が所定距離(例えば、±5mm)以上移動したとき、そのユーザの手指のジェスチャが画像認識装置2において予め決められているジェスチャとして認識される場合を想定する。なお、上記所定距離は、以下、「ジェスチャ分解能」とし、予め決められているジェスチャに応じて設定されているものとする。
【0031】
このような場合において、認識制御装置6は、撮像装置姿勢データが閾値(例えば、±2.5mm(撮像装置姿勢データをユーザの手指の移動距離に換算したときの値))以下であると判断すると、ジェスチャからコマンドへの変換を許可することを示す許可・不許可データをコマンド生成認識装置3に出力する。コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可することを示す許可・不許可データが入力されると、画像認識装置2において認識されるジェスチャをコマンドに変換する。また、コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可することを示す許可・不許可データが入力されると、ジェスチャによる外部制御装置9の動作制御が可能である旨を表示装置10に表示させるようにしてもよい。これにより、ユーザに対して外部制御装置9が制御可能である旨を伝えることができ、現在の姿勢を維持することをユーザに促すことができる。
【0032】
一方、認識制御装置6は、撮像装置姿勢データが閾値を超えたと判断すると、ジェスチャからコマンドへの変換を許可しないことを示す許可・不許可データをコマンド生成認識装置3に出力する。コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可しないことを示す許可・不許可データが入力されると、画像認識装置2において認識されるジェスチャをコマンドに変換しない。また、コマンド生成認識装置3は、ジェスチャからコマンドへの変換を許可しないことを示す許可・不許可データが入力されると、ジェスチャによる外部制御装置9の動作制御が不可能であり、頭部の動作をやめさせる旨を表示装置10に表示させるようにしてもよい。これにより、ユーザに対して外部制御装置9が制御不能である旨を伝えることができ、外部制御装置9が制御可能になる姿勢を取ることをユーザに促すことができる。また、外部制御装置9が制御可能になる姿勢をユーザが取ることができない場合、外部制御装置9が誤動作しないように、わざと手指から視線(撮像装置7の撮像範囲)を外すことをユーザに促すことができる。
【0033】
なお、上記閾値は、特には限定されないが、上述のように「ジェスチャ分解能」の1/2としてもよいし、ユーザが意図しないコマンドが発生する場合としない場合のそれぞれの姿勢データの実測値に基づいて設定してもよい。
【0034】
また、上記閾値は、撮像装置7からユーザの手指までの距離が短くなる程、大きくなるように変化させてもよい。例えば、図6に示すように、姿勢データをθH[deg]、等角射影のレンズを有する撮像装置7からユーザの手指に付けられた楕円状のマーカ12までの距離をLh、手指のサイズをWh、手指のサイズのうちジェスチャ認識の不感帯幅となる割合をα[%]、上記閾値をΔθHとすると、閾値ΔθH=tan−1(Wh×α/100Lh)という式(1)が成り立つ。
ここで、距離Lhの求め方の一例を説明する。
例えば、図7に示すように、撮像装置7の焦点距離をf、撮像装置7を基準とする3次元座標(以下、単に3次元座標という)の原点をOcとし、3次元座標のx軸が撮像装置7の撮像画像に対応する2次元座標(以下、単に2次元座標という)のu軸と平行であり、3次元座標のy軸が2次元座標のv軸と平行であり、3次元座標のz軸が2次元座標における撮像画像の中心位置(u0,v0)を通る場合を想定する。
このような場合、3次元座標におけるマーカ12の中心位置P(x, y, z)と、その中心位置P(x,y,z)に対応する2次元座標におけるマーカ12の中心位置Q (u,v)との間には下記数1又は数2の関係が成り立つ。
【数1】
【数2】
また、図8に示すように、2次元座標のv軸におけるマーカ12の長軸の長さをrとし、3次元座標のy−z軸におけるマーカ12を外包する球の半径をR(近似値)とすると、撮像装置7の光軸(3次元座標のz軸)と直線OP(原点Ocとマーカ12の中心位置Pとを結ぶ直線)とが成す角度をθとすると、下記数3の関係が成り立つ。
【数3】
すなわち、上記数3は下記数4となる。
【数4】
また、下記数5又は数6の関係も成り立つ。
【数5】
【数6】
そして、上記数4と上記数6により、下記数7を求めることができる。
【数7】
すなわち、認識制御装置6は、上記数7に、撮像装置7の焦点距離をf、2次元座標におけるマーカ12の長軸の長さをr、3次元座標におけるマーカ12を外包する球の半径R、2次元座標における撮像画像の中心位置(u0,v0)、2次元座標におけるマーカ12の中心位置Q (u,v)を代入することにより、3次元座標におけるマーカ12のz座標を求める。
同様にして、認識制御装置6は、下記数8により、3次元座標におけるマーカ12のx座標を求める。
【数8】
また、同様にして、認識制御装置6は、下記数9により、3次元座標におけるマーカ12のy座標を求める。
【数9】
そして、認識制御装置6は、距離Lhを3次元座標におけるマーカ12の中心位置(x、y、z)と下記数10とにより求める。
【数10】
【0035】
また、上述の式(1)は、図9に示すように、撮像画像上の手指のサイズ(画素数)をWh1、撮像画像の縦サイズ(画素数)をWL1とすると、閾値ΔθH=tan−1(α・(π/18000)・(Wh1/WL1)・θL)と表すこともできる。また、撮像画像上における手指のサイズWh1は、ジェスチャ毎に変化するため、サイズWh1の変化量を考慮して閾値ΔθHを計算するようにしてもよい。
【0036】
このように、第1実施形態のジェスチャ入力装置1は、撮像装置姿勢データが閾値以下のときのみ、すなわち、撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【0037】
なお、上記撮像装置姿勢認識装置5は、姿勢測定装置4が縦方向に回転するときの回転角の変動量を示す姿勢データに基づいて、撮像装置姿勢データを求める構成であるが、姿勢測定装置4が縦方向に回転するときの回転角の変動量及び姿勢測定装置4が横方向に回転するときの回転角の変動量を示す姿勢データに基づいて、撮像装置姿勢データを求めるようにしてもよい。このように構成する場合、認識制御装置6は、撮像装置7が縦方向に回転するときの回転角の変動量が第1閾値以下のときのみ又は撮像装置7が横方向に回転するときの回転角の変動量が第2閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可する。これにより、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることをさらに精度よく低減することができる。
【0038】
また、上記第1実施形態のジェスチャ入力装置1では、撮像装置7の姿勢の変動量が閾値以下であるか否かによりコマンド出力制御を行う構成であるが、撮像装置7の姿勢の変動量の連続的な変化に基づいてコマンド出力制御を行うように構成してもよい。
【0039】
<第2実施形態>
【0040】
図10は、本発明の第2実施形態のジェスチャ入力装置を示す図である。なお、図10において、図1に示す構成と同じ構成には同じ符号を付している。
【0041】
第2実施形態のジェスチャ入力装置13において、第1実施形態のジェスチャ入力装置1と異なる点は、姿勢測定装置4により測定される姿勢データではなく、空間に配置されるマーカ(例えば、図11や図12に示すように、机上に配置されるマーカAや外部制御装置9のディスプレイに表示されるマーカB)の撮像画像に基づいて、コマンド出力を許可するか否かを判断する点である。そのため、第2実施形態のジェスチャ入力装置13では、姿勢測定装置4を備えていない。
【0042】
第2実施形態の画像認識装置2は、入力される撮像画像内のマーカの移動量を求め、その求めた移動量を姿勢データ(撮像装置7が縦方向や横方向に回転するときの回転角の変動量に相当する値)として撮像装置姿勢認識装置5に出力する。なお、撮像画像内のマーカの移動量の求め方は、種々の既存の技術を利用することができる。例えば、特許4455294号公報などに記載される技術を利用することができる。また、上述したように、3次元座標におけるマーカの中心位置(x,y,z)を定期的に求め、そのマーカの中心位置の変化量をマーカの移動量として求めてもよい。
【0043】
第2実施形態の撮像装置姿勢認識装置5は、入力される姿勢データに基づいて、撮像装置7が縦方向や横方向に回転するときの回転角の変動量を求め、その変動量を撮像装置姿勢データとして認識制御装置6に出力する。
【0044】
第2実施形態の認識制御装置6及びコマンド生成認識装置3の動作は、第1実施形態の認識制御装置6及びコマンド生成認識装置3の動作と同様である。
【0045】
このように、第2実施形態のジェスチャ入力装置13は、第1実施形態のジェスチャ入力装置1と同様に、撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【0046】
また、第2実施形態のジェスチャ入力装置13は、第1実施形態のジェスチャ入力装置1に比べて、姿勢測定装置4を備えていない分、より簡易な構成にすることができる。
【0047】
<第3実施形態>
【0048】
図13は、本発明の第3実施形態のジェスチャ入力装置を示す図である。なお、図13において、図1に示す構成と同じ構成には同じ符号を付している。
【0049】
第3実施形態のジェスチャ入力装置14において、第1実施形態のジェスチャ入力装置1と異なる点は、姿勢測定装置4や撮像装置姿勢認識装置5に接続されるバンドカットフィルタ装置15(移動量補正手段)をさらに備えている点である。なお、バンドカットフィルタ装置15は、第2実施形態のジェスチャ入力装置13において、画像認識装置2と撮像装置姿勢認識装置5との間に備えてもよい。
【0050】
すなわち、バンドカットフィルタ装置15は、姿勢測定装置4から出力される姿勢データをフーリエ変換して特定の周波数帯域の姿勢データをカットした後、逆フーリエ変換を行い、その逆フーリエ変換後の姿勢データを補正後の姿勢データとして撮像装置姿勢認識装置5に出力する。
【0051】
例えば、図14Aに示すように、ユーザが静止している場合では、図14Bに示すような姿勢データが姿勢測定装置4から出力される。この姿勢データは、主にユーザの身体の動きに伴う変動(振幅)が含まれており、バンドカットフィルタ装置15においてフーリエ変換が行われ、例えば、図14Cに示すような特定の周波数帯域の姿勢データがカットされる。この特定の周波数帯域は、ユーザが歩行や走行を行っているときなどユーザが周期的な動作を行っているときに姿勢測定装置4により測定される姿勢データの周波数帯域であり、この特定の周波数帯域の姿勢データは、ユーザが静止している場合、例えば、図14Dに示すように、ほぼ変動がない姿勢データとなる。その後、バンドカットフィルタ装置15において逆フーリエ変換が行われると、図14Eに示すような姿勢データとなる。すなわち、ユーザが静止している場合の補正後の姿勢データは、補正前の姿勢データと比べてあまり変化がない。
【0052】
また、図15Aに示すように、ユーザが歩行や走行を行っている場合では、図15Bに示すような姿勢データが姿勢測定装置4から出力される。この姿勢データは、ユーザの身体の動きに伴う変動(振幅)の他に、ユーザの歩行や走行に伴う変動が重畳されており、バンドカットフィルタ装置15においてフーリエ変換が行われ、例えば、図15Cに示すような特定の周波数帯域(図14Cに示す特定の周波数帯域と同様)の姿勢データがカットされる。この特定の周波数帯域の姿勢データは、ユーザが歩行や走行を行っている場合、例えば、図15Dに示すように、周期的な変動がある姿勢データとなる。その後、バンドカットフィルタ装置15において逆フーリエ変換が行われると、図15Eに示すような姿勢データとなる。すなわち、図15Eに示す姿勢データは、ユーザが静止しているときの姿勢データとほぼ同じものとして扱うことができる。
【0053】
このように、バンドカットフィルタ装置15から出力される補正後の姿勢データは、ユーザが歩行や走行を行っていても、ユーザが静止しているときの姿勢データとして扱うことができる。
【0054】
第3実施形態の撮像装置姿勢認識装置5は、バンドカットフィルタ装置15から出力される姿勢データに基づいて、撮像装置7が縦方向や横方向に回転するときの回転角の変動量を求め、その変動量を撮像装置姿勢データとして認識制御装置6に出力する。
【0055】
第3実施形態の認識制御装置6及びコマンド生成認識装置3の動作は、第1及び第2実施形態の認識制御装置6及びコマンド生成認識装置3の動作と同様である。
【0056】
このように、第3実施形態のジェスチャ入力装置14は、第1実施形態のジェスチャ入力装置1や第2実施形態のジェスチャ入力装置13と同様に、撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【0057】
また、第3実施形態のジェスチャ入力装置14は、ユーザの歩行や走行の際に生じる姿勢データの変動をキャンセルすることができるため、ユーザが歩行や走行を行っているときでも、精度を落とすことなく、姿勢データに基づいて、コマンド出力を許可するか否かを判断することができる。
【0058】
<第4実施形態>
【0059】
図16は、本発明の第4実施形態のジェスチャ入力装置を示す図である。なお、図16において、図1に示す構成と同じ構成には同じ符号を付している。
【0060】
第4実施形態のジェスチャ入力装置16において、第1実施形態のジェスチャ入力装置1と異なる点は、認識制御装置6に接続されるモード切替装置17(閾値変更手段)をさらに備えている点である。なお、モード切替装置17は、第2実施形態のジェスチャ入力装置13において、認識制御装置6に接続されるようにして備えられてもよい。
【0061】
モード切替装置17は、コマンド生成認識装置3や通信装置8から出力されるコマンドを常時確認し、そのコマンドがモード切替用のコマンドのとき、モード切替を実施する。モード切替とは、認識制御装置6で使用される閾値を変更することである。例えば、ユーザの親指と人差し指とで輪を形成するジェスチャが5秒間行われたことを認識した結果によりコマンド生成認識装置3からモード切替用のコマンドが出力されると、モード切替装置17は、そのモード切替用のコマンドに対応する閾値を認識制御装置6に出力する。そして、認識制御装置6は、モード切替装置17から出力される閾値に基づいて、ジェスチャからコマンドへの変換を許可するか否かを判断する。例えば、画像認識装置2において細かい動きのジェスチャを認識させるモードに切り替えるためのコマンドがモード切替装置17に入力されると、認識制御装置6で使用される閾値を小さくする。一方、画像認識装置2において大きな動きのジェスチャを認識させるモードに切り替えるためのコマンドがモード切替装置17に入力されると、認識制御装置6で使用される閾値を大きくする。これにより、指先を動かすジェスチャなど細かな動きのジェスチャを行う際にユーザが意図しないコマンドが頻繁に出力されることや腕を使ったジェスチャなど大きな動きのジェスチャを行う際にユーザが意図するコマンドがなかなか出力されないことを低減することができる。
【0062】
図17は、モード切替装置17の動作を説明するフローチャートである。
【0063】
まず、モード切替装置17は、コマンドが入力されると(ステップS1がYes)、その入力されたコマンドとモード切替装置17内の記憶部に記憶されているコマンドとを比較して(ステップS2)、入力されたコマンドが変更されているか否かを判断する(ステップS3)。
【0064】
次に、モード切替装置17は、変更されていないと判断した場合(ステップS3がNo)、ステップS1に戻り、変更されていると判断した場合(ステップS3がYes)、入力されたコマンドを記憶部に上書きすることによりコマンドを書き換える(ステップS4)。
【0065】
そして、モード切替装置17は、その書換え後のコマンドに対応する閾値を記憶部から読み出し(ステップS5)、認識制御装置6に新しい閾値として出力する。
【0066】
このように、第4実施形態のジェスチャ入力装置16においても、第1実施形態のジェスチャ入力装置1や第2実施形態のジェスチャ入力装置13と同様に撮像装置7の姿勢の変動量が閾値以下のときのみ、コマンド生成認識装置3からのコマンド出力を許可するように構成している。そのため、撮像装置7がユーザの身体に装着される場合であっても、ユーザが意図しないコマンドがコマンド生成認識装置3から出力されることを低減することができる。
【符号の説明】
【0067】
1 ジェスチャ入力装置
2 画像認識装置
3 コマンド生成認識装置
4 姿勢測定装置
5 撮像装置姿勢認識装置
6 認識制御装置
7 撮像装置
8 通信装置
9 外部制御装置
10 表示装置
11 メガネ型冶具
12 マーカ
13 ジェスチャ入力装置
14 ジェスチャ入力装置
15 バンドカットフィルタ装置
16 ジェスチャ入力装置
17 モード切替装置
【特許請求の範囲】
【請求項1】
ユーザの身体に装着される撮像手段と、
前記撮像手段により撮像される前記ユーザの手指の撮像画像に基づいて、前記ユーザにより行われる手指のジェスチャを認識する認識手段と、
前記認識手段により認識されるジェスチャに対応する動作制御指示を出力する指示出力手段と、
前記ユーザの身体の動きに伴う前記撮像手段の姿勢の変動量を求める変動量検出手段と、
前記変動量に基づいて、前記指示出力手段から動作制御指示が出力されることを許可する指示出力許可手段と、
を備えることを特徴とするジェスチャ入力装置。
【請求項2】
請求項1に記載のジェスチャ入力装置であって、
前記指示出力許可手段は、前記変動量が閾値以下のときに、動作制御指示が出力されることを特徴とするジェスチャ入力装置。
【請求項3】
請求項1または請求項2に記載のジェスチャ入力装置であって、
前記指示出力許可手段は、前記変動量が閾値以上のときに、動作制御指示を停止することを特徴とするジェスチャ入力装置。
【請求項4】
請求項1に記載のジェスチャ入力装置であって、
前記変動量検出手段は、前記撮像手段が縦方向又は横方向に回転するときの回転角の変動量を前記撮像手段の姿勢の変動量として求めることを特徴とするジェスチャ入力装置。
【請求項5】
請求項1に記載のジェスチャ入力装置であって、
前記撮像手段は、空間に配置されるマーカを撮像し、
前記変動量検出手段は、前記撮像手段により撮像される撮像画像内のマーカの移動量を前記撮像手段の姿勢の変動量として求めることを特徴とするジェスチャ入力装置。
【請求項6】
請求項1〜5の何れか1項に記載のジェスチャ入力装置であって、
前記変動量検出手段により求められる変動量をフーリエ変換して特定の周波数帯域の変動量をカットした後、逆フーリエ変換を行い出力する変動量補正手段をさらに備え、
前記指示出力手段は、前記変動量補正手段から出力される変動量が前記閾値以下のときのみ、前記指示出力手段から動作制御指示が出力されることを許可する
ことを特徴とするジェスチャ入力装置。
【請求項7】
請求項1〜5の何れか1項に記載のジェスチャ入力装置であって、
前記指示出力手段から出力される動作制御指示に応じて、前記閾値を変更する閾値変更手段をさらに備えることを特徴とするジェスチャ入力装置。
【請求項8】
請求項5に記載のジェスチャ入力装置であって、
前記撮像手段の焦点距離をf、前記撮像手段により撮像される撮像画像に対応する2次元座標における前記マーカの長軸の長さをr、前記撮像手段を基準とする3次元座標における前記マーカを外包する球の半径をR、前記2次元座標における前記撮像画像の中心位置を(u0,v0)、前記2次元座標における前記マーカの中心位置を (u,v)とするとき、
前記認識手段は、前記3次元座標における前記マーカの中心位置(x,y,z)を
【数11】
により定期的に求め、前記マーカの中心位置の変化量を前記マーカの移動量として求めて前記変動量検出手段に出力することを特徴とするジェスチャ入力装置。
【請求項1】
ユーザの身体に装着される撮像手段と、
前記撮像手段により撮像される前記ユーザの手指の撮像画像に基づいて、前記ユーザにより行われる手指のジェスチャを認識する認識手段と、
前記認識手段により認識されるジェスチャに対応する動作制御指示を出力する指示出力手段と、
前記ユーザの身体の動きに伴う前記撮像手段の姿勢の変動量を求める変動量検出手段と、
前記変動量に基づいて、前記指示出力手段から動作制御指示が出力されることを許可する指示出力許可手段と、
を備えることを特徴とするジェスチャ入力装置。
【請求項2】
請求項1に記載のジェスチャ入力装置であって、
前記指示出力許可手段は、前記変動量が閾値以下のときに、動作制御指示が出力されることを特徴とするジェスチャ入力装置。
【請求項3】
請求項1または請求項2に記載のジェスチャ入力装置であって、
前記指示出力許可手段は、前記変動量が閾値以上のときに、動作制御指示を停止することを特徴とするジェスチャ入力装置。
【請求項4】
請求項1に記載のジェスチャ入力装置であって、
前記変動量検出手段は、前記撮像手段が縦方向又は横方向に回転するときの回転角の変動量を前記撮像手段の姿勢の変動量として求めることを特徴とするジェスチャ入力装置。
【請求項5】
請求項1に記載のジェスチャ入力装置であって、
前記撮像手段は、空間に配置されるマーカを撮像し、
前記変動量検出手段は、前記撮像手段により撮像される撮像画像内のマーカの移動量を前記撮像手段の姿勢の変動量として求めることを特徴とするジェスチャ入力装置。
【請求項6】
請求項1〜5の何れか1項に記載のジェスチャ入力装置であって、
前記変動量検出手段により求められる変動量をフーリエ変換して特定の周波数帯域の変動量をカットした後、逆フーリエ変換を行い出力する変動量補正手段をさらに備え、
前記指示出力手段は、前記変動量補正手段から出力される変動量が前記閾値以下のときのみ、前記指示出力手段から動作制御指示が出力されることを許可する
ことを特徴とするジェスチャ入力装置。
【請求項7】
請求項1〜5の何れか1項に記載のジェスチャ入力装置であって、
前記指示出力手段から出力される動作制御指示に応じて、前記閾値を変更する閾値変更手段をさらに備えることを特徴とするジェスチャ入力装置。
【請求項8】
請求項5に記載のジェスチャ入力装置であって、
前記撮像手段の焦点距離をf、前記撮像手段により撮像される撮像画像に対応する2次元座標における前記マーカの長軸の長さをr、前記撮像手段を基準とする3次元座標における前記マーカを外包する球の半径をR、前記2次元座標における前記撮像画像の中心位置を(u0,v0)、前記2次元座標における前記マーカの中心位置を (u,v)とするとき、
前記認識手段は、前記3次元座標における前記マーカの中心位置(x,y,z)を
【数11】
により定期的に求め、前記マーカの中心位置の変化量を前記マーカの移動量として求めて前記変動量検出手段に出力することを特徴とするジェスチャ入力装置。
【図1】
【図2A】
【図2B】
【図3】
【図4】
【図5】
【図10】
【図11】
【図12】
【図13】
【図14B】
【図14C】
【図14D】
【図14E】
【図15B】
【図15C】
【図15D】
【図15E】
【図16】
【図17】
【図6】
【図7】
【図8】
【図9】
【図14A】
【図15A】
【図2A】
【図2B】
【図3】
【図4】
【図5】
【図10】
【図11】
【図12】
【図13】
【図14B】
【図14C】
【図14D】
【図14E】
【図15B】
【図15C】
【図15D】
【図15E】
【図16】
【図17】
【図6】
【図7】
【図8】
【図9】
【図14A】
【図15A】
【公開番号】特開2012−146220(P2012−146220A)
【公開日】平成24年8月2日(2012.8.2)
【国際特許分類】
【出願番号】特願2011−5296(P2011−5296)
【出願日】平成23年1月13日(2011.1.13)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】
【公開日】平成24年8月2日(2012.8.2)
【国際特許分類】
【出願日】平成23年1月13日(2011.1.13)
【出願人】(000000376)オリンパス株式会社 (11,466)
【Fターム(参考)】
[ Back to top ]