説明

ジェスチャ認識装置、その方法、及び、そのプログラム

【課題】指先動きに応じた動作の誤判定を軽減できるジェスチャ認識装置を提供する。
【解決手段】取得した動画像からユーザの指先位置の軌跡を検出する検出部12と、前記指先位置の軌跡から送り動作か否かの判定を行うための有効範囲を設定する設定部15と、前記指先位置の軌跡が、前記有効範囲に含まれている場合に、前記指先位置の軌跡が送り動作か否かを判定する判定部14と、前記指先位置の軌跡が前記送り動作の場合に、前記送り動作から前記ユーザのジェスチャを認識する認識部16とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、ジェスチャ認識装置、その方法、及び、そのプログラムに関する。
【背景技術】
【0002】
従来のジェスチャ認識装置においては、特定部位の現在の運動が高速運動であると検出された場合に、現高速運動の履歴の中から、過去の高速運動のベクトル情報である直前高速運動を抽出し、現高速運動の方向と直前高速運動の方向とがなす角を用いて、特定部位の現在の状態が、予め定められた方向へ特定部位が高速動作していることを示す送り動作であるか否かを判定する。すなわち、このジェスチャ認識装置は、ユーザの手の動きからジェスチャコマンドを判定する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−182014号公報
【特許文献2】特開2001−312356号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、上記従来のジェスチャ認識装置では、手の動きの速度から送り動作を判定しているため、ユーザが送り動作を行う後に発生する戻し動作が、閾値以上の早さである場合に、その戻し動作も送り動作であると誤判定するという問題点があった。
【0005】
そこで本発明の実施形態は、上記問題点に鑑み、指先動きに応じた送り動作の誤判定を軽減できるジェスチャ認識装置、その方法、及び、そのプログラムを提案することを目的とする。
【課題を解決するための手段】
【0006】
本実施形態は、動画像を取得する画像取得部と、前記動画像からユーザの指先位置の軌跡を検出する検出部と、前記指先位置の軌跡から送り動作か否かの判定を行うための有効範囲を設定する設定部と、前記指先位置の軌跡が、前記有効範囲に含まれている場合に、前記指先位置の軌跡が送り動作か否かを判定する判定部と、前記指先位置の軌跡が前記送り動作の場合に、前記送り動作から前記ユーザのジェスチャを認識する認識部と、を有するジェスチャ認識装置である。
【図面の簡単な説明】
【0007】
【図1】実施形態1のジェスチャ認識装置のブロック図。
【図2】ジェスチャ認識装置のフローチャート。
【図3】有効範囲における指先動きの説明。
【図4】実施形態2の有効範囲における指先動きの説明。
【図5】実施形態3のジェスチャ認識装置のブロック図。
【図6】実施形態3のジェスチャ認識装置のフローチャート。
【図7】実施形態4のジェスチャ認識装置を応用した説明図。
【図8】ヘッドマウントディスプレイの表示画面。
【発明を実施するための形態】
【0008】
一実施形態のジェスチャ認識装置について図面に基づいて説明する。
【実施形態1】
【0009】
実施形態1のジェスチャ認識装置10について図1〜図3に基づいて説明する。
【0010】
本実施形態に係わるジェスチャ認識装置10は、ユーザの1本の指Fの指先動きにより画面を操作するためのものであり、ユーザの送り動作を検知して対応する方向に画面の表示内容を遷移させる。なお、「送り動作」とは、ユーザの一方向への指先動きである。なお、一方向とは、上方向、下方向、左方向、右方向、又は、斜め上方向、斜め下方向などの一つの方向を意味する。
【0011】
ユーザの指先の送り動作を繰り返し行う場合、送り動作の後に指先を元の位置に戻す動作を「戻し動作」という。
【0012】
ジェスチャ認識装置10の構成について図1のブロック図に基づいて説明する。
【0013】
ジェスチャ認識装置10は、撮像部11、画像取得部12、検出部13、判定部14、設定部15、認識部16、表示部17とを有する。
【0014】
撮像部11は、ユーザの1本の指Fの指先動きを動画像で撮像する。撮像部11は、イメージセンサなどの撮像素子、又は、カメラなどであり、単眼の撮像素子に限らず、各画素にセンサからの各画素に撮像された物体までの推定した距離が付加される距離センサ、同様にセンサからの距離が取得できる複数の撮像素子を用いてもよい。
【0015】
画像取得部12は、撮像部11で取得した動画像を取得する。
【0016】
検出部13は、動画像から1本の指Fの指先位置の軌跡を検出する。
【0017】
判定部14は、検出した1本の指Fの指先位置の軌跡、設定部15から送られた有効範囲Aに基づいて指先動きが送り動作か否かを判定する。
【0018】
設定部15は、指先動きが送り動作か否かを判定するのに用いる有効範囲Aを設定する。
【0019】
認識部16は、判定部14が判定した送り動作から、ユーザのジェスチャを認識する。
【0020】
表示部17は、画像取得部12で取得した動画像を表示すると共に、設定部15で設定した有効範囲Aを重畳して表示する。
【0021】
ジェスチャ認識装置10の動作について図2のフローチャートに基づいて説明する。
【0022】
ステップS101において、撮像部11が、ユーザの1本の指Fの指先動きを撮像し、画像取得部12は、撮像された動画像の各画像(各フレーム)を取得し、取得した各フレームを検出部13へ送り、ステップS102に進む。
【0023】
ステップS102において、検出部13は、送られてきた動画像の各フレームに写っている1本の指Fの指先位置をそれぞれ検出する。以下、この検出方法を順番に説明する。
【0024】
第1に、検出部13は、予め指先のパターンと背景のパターンから2クラス識別器を学習し、取得した1フレーム中から指先パターンに識別される矩形領域を探索する。指先の領域は、特徴的なテクスチャが少ないため、次の傾向の異なる特徴を相補的に利用し,カスケード接続することで高速で高精度な検出処理を実現する。
【0025】
第2に、検出部13は、顔検出向けに開発された共起関係のHaar−like特徴であるJoint Haar−like特徴量を用いて、AdaBoostアルゴリズムで学習した識別器(T. Mita, T. Kaneko, B. Stenger, and O. Hori, Discriminative feature co-occurrence selection for object detection, IEEE Trans. Pattern Anal. Mach. Intell.,Vol.30,No.7,pp.1257-1269, 2008.参照)により指先の候補領域を抽出する。
【0026】
第3に、検出部13は、人物検出向けに開発された輝度勾配の組み合わせによる2次元ヒストグラムから得られる共起行列であるCo−occurrence Histograms of Oriented Gradients特徴を用いて、Support Vector Machineで学習した識別器(T. Watanabe, S. Ito, and K. Yokoi, Co-occurrence histograms of oriented gradients of pedestrian detection, In PSIVT 2009, LNCS, Vol. 5414, pp. 37-47, 2009.参照)で最終的に指先位置を検出する。
【0027】
なお、前段の識別器は、非常に高速に識別できるという特徴を有し、後段の識別器は前記識別器よりも高速でないものの詳細な特徴を用いて精度よく識別できる特徴を有する。
【0028】
また、検出部13は、過去フレームにおいて指先検出した結果が存在する場合、その結果に基づき追跡処理を行う。
【0029】
上記の検出方法は、いずれもテクスチャに着目した特徴(例えば、特徴量)から指先か否かを検出するため、モーションブラーによる指先のテクスチャが精細に撮像できないと、検出できない。そのため、色情報を用いて指先を、非特許文献(D.Comaniciu, V .Ramesh and P. Meer, Kernel Based Object Tracking, PAMI,Vol.25,No.5,pp.564-577,2003.)に記載された方法に基づき追跡してもよい。
【0030】
検出部13は、現フレームで検出した1本の指Fの指先位置と、過去の指先位置の軌跡を論理和で統合した結果を、最終的な現フレームの指先位置とする。
【0031】
検出部13は、検出した現フレームの1本の指Fの指先位置(例えば、左上の座標と右下の座標で表す長方形)を設定部4と判定部5へ送る。
【0032】
検出部13は、引き続き動画像のフレーム毎に1本の指Fの指先位置の検出を行う。これにより、検出部13は、検出した指先位置の軌跡を送ることとなる。
【0033】
ステップS103において、判定部14は、送られてきた現フレームから過去のフレームの1本の指Fの指先位置の軌跡と、設定部15から送られた有効範囲Aに基づいて、1本の指Fの指先動きが送り動作であるか否かを図3に示すように判定する。この指先位置の軌跡は、検出部13から送られてきた任意のフレーム数N(例えば、5フレーム)のそれぞれの指先位置を用いる。
【0034】
また、判定部14は、有効範囲A内でのみ指先動きを判定する。この有効範囲Aは、設定部15が前フレームまでの指先動きから設定されるものであり、この設定については後から説明する。また、判定部14は、この有効範囲A以外の範囲については、指先動きは判定しない。
【0035】
まず、判定部14は、指先位置の軌跡が、有効範囲A内に含まれるか否かを判定し、有効範囲A内のときは次の処理に移行し、有効範囲A外のときは送り動作でないと判定する。
【0036】
次に、判定部14は、指先位置の軌跡から求まる画像中の現時点での指先の速度(x成分とy成分)と加速度(x成分とy成分)からなる特徴量をもとに、予め学習した動き(一方向の指先動き)であるか否かを判定する。この判定には識別器を用い、例えばk−Nearest Neighbour Classificationでもよいし、Support Vector Machineでもよいが、予め動き(一方向の指先動き)を学習しておく。判定部14は、この判定により指先がジクザクに動いたりする動作を排除できる。
【0037】
また、速度の閾値と加速度に閾値とを予め決定しておき、判定部14は、指先動きが送り動作であっても、ゆっくりした指Fの動作を排除できる。
【0038】
但し、上記判定では、戻し動作については排除できないため、図3に示すように、ユーザは、戻し動作については、有効範囲A以外で行う。
【0039】
判定部14は、送り動作と判定した指先動きの判定結果を認識部16に送り、ステップS104に進む。
【0040】
ステップS104において、設定部15は、検出部13から送られてきたNフレーム間の1本の指Fの指先位置の軌跡から、次フレームにおける指先動きの判定に用いる有効範囲Aを設定して判定部14に送り、表示部17に写っている画像中に有効範囲Aを重畳して表示する。
【0041】
まず、設定部15は、有効範囲Aの初期範囲を画像全体に設定する。
【0042】
次に、設定部15は、検出部13が検出したNフレーム間の1本の指Fの指先位置の軌跡から、指先の動いた範囲を有効範囲Aとして設定する。例えば、N=5とした場合に、設定部15は、過去のnフレーム目の指先位置から(n+4)フレーム目の指先位置の軌跡で表現される領域を有効範囲Aとして設定する。この有効範囲Aは、厳密に指先が移動した領域である必要はなく、図3に示すように、矩形領域で表現し、例えば、横方向の大きさは、nフレーム目の指先位置と(n+4)フレーム目の指先位置とによって決まり、縦方向は指先の1〜3倍の大きさに設定する。
【0043】
次に、設定部15は、設定した(n+4)フレーム目の有効範囲Aを判定部14と表示部17へ送る。判定部14は、上記したように(n+5)フレーム目の判定に用いる。また、表示部17は、図3に示すように、画像中に有効範囲Aを重畳して表示する。
【0044】
なお、設定部15は、nフレーム目において検出された指先位置と(n+1)フレーム目において検出された指先位置が、閾値以上の距離が離れている場合は、有効範囲Aを初期化する。
【0045】
ステップS105において、認識部16は、判定部14で判定した送り動作に基づいて、ユーザのジェスチャを認識して終了する。この認識方法は、例えば、特許文献1に記載した方法を用いる。
【0046】
本実施形態によれば、送り動作のみを判定でき、戻し動作を送り動作と誤判定することを軽減できる。すなわち、ユーザが、表示部17に写った有効範囲A以外で戻し動作を行うことにより、従来のように戻し動作を送り動作と誤判定することを軽減できる。
【実施形態2】
【0047】
次に、実施形態2に係わるジェスチャ認識装置10について図4に基づいて説明する。
【0048】
本実施形態のジェスチャ認識装置10と実施形態1のジェスチャ認識装置10の異なる点は、判定部14と設定部15の機能にある。
【0049】
本実施形態では、設定部15は、画像中に有効範囲Aを設定するのではなく、送り動作を示す1次元の方向ベクトルも設定する。
【0050】
判定部14は、図4に示すように、有効範囲A中の指先動きに関して、指先位置の軌跡から求めた指先動きベクトルと方向ベクトルのなす角度θ1と判定角度θ0(例えば、−30°<=θ0<=30°)とを比較し、判定部14は、θ1<=θ0のときを送り動作と判定する。なお、図4においては、送り動作がθ1=0°で示し、戻し動作はθ1=180°で示している。
【0051】
そして、設定部15は、設定した有効範囲Aと指先位置との距離が閾値以上となると、有効範囲Aを初期化する。
【0052】
なお、本実施形態の場合は、有効範囲Aを表示部17に表示する必要がない。
【0053】
本実施形態であると、実施形態1のようにユーザが表示部17に写った有効範囲A以外で戻し動作を行う必要がなく、有効範囲Aで戻し動作を行っても、送り動作のみを判定できる。
【実施形態3】
【0054】
次に、実施形態3に係わるジェスチャ認識装置100について図5と図6に基づいて説明する。
【0055】
本実施形態のジェスチャ認識装置100と実施形態1のジェスチャ認識装置10の異なる点は、本実施形態のジェスチャ認識装置100が管理部118を有する点にある。すなわち、実施形態1のジェスチャ認識装置10は一本の指Fの指先動きによるジェスチャ認識していたが、本実施形態のジェスチャ認識装置100は、管理部118を設けることにより複数本の指Fの指先動きによるジェスチャ認識を行う。
【0056】
なお、ジェスチャ認識装置100の中でジェスチャ認識装置10と同様な部分については説明を省略する。
【0057】
ジェスチャ認識装置100の構成について図5のブロック図に基づいて説明する。
【0058】
ジェスチャ認識装置100は、図5に示すように、撮像部111、画像取得部112、検出部113、判定部114、設定部115、認識部116に加えて、上記したように管理部118を有する。
【0059】
撮像部111は、ユーザの複数本の指Fの指先を撮像する。
【0060】
画像取得部112は、その撮像した動画像を取得する。
【0061】
検出部113は、各フレーム中の各指先位置をそれぞれ検出し、管理部118にその検出結果を送る。この検出方法は実施形態1と同様である。
【0062】
管理部118は、複数本の指Fの指先から1本の指Fの指先を特定し、その特定指先位置の軌跡のみを判定部114、設定部115に送る。
【0063】
判定部114は、管理部118が特定した指先に関して、検出部113から管理部118を経て送られてきたその特定指先位置の軌跡と、設定部115で設定された有効範囲Aとを基に指先動きが送り動作であるか否かを判定する。この判定方法は実施形態1と同様である。
【0064】
設定部115は、検出部113から管理部118を経て送られてきたその特定指先位置の軌跡から有効範囲Aを設定し、判定部114へ送る。この設定方法は実施形態1と同様である。
【0065】
管理部118は、1本の指先動きが送り動作であるか否かを判定した後に、次の指先動きを判定するように、判定部114、設定部115に特定指先位置の軌跡を送り、全ての指Fの指先動きの判定が終了すると、この制御を終了する。
【0066】
認識部116は、判定した各指先動き(送り動作)を統合し、複数の指先動きで定義されるジェスチャであるか否かを認識する。例えば、2本の指先動きで定義されるジェスチャには、2本の指が異なる方向に移動し間を広げる操作である「ピンチアウト」や、2本の指を縮める操作である「ピンチイン」などがある。このとき片手の2本の指で行うジェスチャであってもよいし、両手で1本ずつ行うジェスチャであってもよいし、2人のユーザのそれぞれの指を用いたジェスチャであってもよい。
【0067】
また、判定部114で判定可能な1次元方向の指先動きであれば、2本以上の指先動きで定義できるジェスチャであればよく、片手の全ての指(5本)を手の中央から外側へはじく動作で表示してある複数オブジェクトがばらばらに散らばるようなジェスチャを定義してもよい。
【0068】
ジェスチャ認識装置100の動作について図6のフローチャートに基づいて説明する。なお、ジェスチャ認識装置100の動作のうち、図6のステップS101〜S102は、図2のステップS101〜S102と同様であるため説明を省略する。
【0069】
ステップS303において、管理部118は、検出部203が検出した指Fの本数と、それら指Fの指先位置がそれぞれフレーム毎に入力される。管理部118は、指先動きを判定した指Fを順番に特定して、特定指先位置の軌跡を判定部114と設定部115に送る。
【0070】
ステップS304において、判定部14は、特定指先位置の軌跡に関して、設定部115で設定された有効範囲Aを基に指先動作が送り動作か否かを判定する。設定部115は、判定結果を認識部116へ送る。
【0071】
ステップS305において、設定部115は、指先動きの判定に用いる次フレームからの有効範囲Aを特定指先位置の軌跡から設定し、判定部114へ送る。
【0072】
ステップS306において、認識部116は、全ての指Fの指先動きの組み合わせが、予め設定したジェスチャであるか否かを認識して終了する。
【実施形態4】
【0073】
次に、実施形態4について図7と図8に基づいて説明する。本実施形態は、実施形態1のジェスチャ認識装置1をヘッドマウントディスプレイ302に適用した例である。
【0074】
図7に示すように、本実施形態は、ヘッドマウントディスプレイ302の表示項目送りをジェスチャで行う。ハンズフリーを目的として開発されたヘッドマウントディスプレイ302は、ハンズフリーな操作が可能なジェスチャ認識による操作が有益である。
【0075】
ヘッドマウントディスプレイ302は、ウェアラブルコンピュータ300、表示部17、撮像部11を有する。ジェスチャ認識装置10は、ウェアラブルコンピュータ300にプログラムとして内蔵されている。
【0076】
撮像部11は、ユーザの視線方向を撮影している。
【0077】
表示部17は、ヘッドマウントディスプレイ302に画像を表示する。
【0078】
ウェアラブルコンピュータ300(ジェスチャ認識装置10)は、ユーザの指Fによる送り動作を認識し、図8に示すように、その指Fの送り動作に基づいて、表示部17によってヘッドマウントディスプレイ302で表示中の複数項目を動作の方向へスクロールさせるコマンドを実行する。
【0079】
本実施形態によれば、ユーザは送り動作によって、送った方向に項目をスクロールさせ詳細を閲覧できる。
【変更例】
【0080】
上記各実施形態の変更例について説明する。
【0081】
変更例1は、判定部14が判定に用いる特徴量の変更例である。上記実施形態の以外の他の特徴量としては、次のようなものもある。
【0082】
第1の他の特徴量としては、Nフレームの平均x速度、Nフレームの平均x加速度、Nフレームの平均y速度、Nフレームの平均y加速度の4次元特徴量を用いる。
【0083】
第2の他の特徴量としては、に、使用する履歴数がN−1の速度と、N−2の加速度を要素としてもつ4N−6次元の特徴量を用いる。
【0084】
上記実施形態4はヘッドマウントディスプレイ302で説明したが、これに限らず、ジェスチャ認識装置10を他の機器に適用してもよく、また、実施形態2のジェスチャ認識装置100を適用してもよい。
【0085】
ジェスチャ認識装置10,100は、例えば、汎用のコンピュータを基本ハードウェアとして用いることでも実現することが可能である。すなわち、画像取得部12.112、検出部13,113、判定部14,114、設定部15,115、管理部118は、上記のコンピュータに搭載されたプロセッサにプログラムを実行させることにより実現することができる。このとき、ジェスチャ認識装置10,100は、上記のプログラムをコンピュータに予めインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記録して、又はネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータに適宜インストールすることで実現してもよい。また、画像取得部12.112、検出部13,113、判定部14,114、設定部15,115、管理部118は、上記のコンピュータに内蔵又は外付けされたメモリ、ハードディスクもしくはCD−R,CD−RW,DVD−RAM,DVD−Rなどの記憶媒体などを適宜利用して実現できる。
【0086】
上記では本発明の一実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の主旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0087】
10,100・・・ジェスチャ認識装置、12,112・・・画像取得部、13,113・・・検出部、14,114・・・判定部、15,115・・・設定部、16,116・・・認識部、117・・・管理部

【特許請求の範囲】
【請求項1】
動画像を取得する画像取得部と、
前記動画像からユーザの指先位置の軌跡を検出する検出部と、
前記指先位置の軌跡から送り動作か否かの判定を行うための有効範囲を設定する設定部と、
前記指先位置の軌跡が、前記有効範囲に含まれている場合に、前記指先位置の軌跡が送り動作か否かを判定する判定部と、
前記指先位置の軌跡が前記送り動作の場合に、前記送り動作から前記ユーザのジェスチャを認識する認識部と、
を有するジェスチャ認識装置。
【請求項2】
前記動画像と前記有効範囲を重畳して表示する表示部をさらに有する、
請求項1に記載のジェスチャ認識装置。
【請求項3】
前記設定部は、前記有効範囲に加えて、前記送り動作の指先動きを示す方向ベクトルも設定し、
前記判定部は、前記指先位置の軌跡が前記有効範囲に含まれ、かつ、前記指先位置の軌跡が表す指先動きベクトルと前記方向ベクトルとのなす角度が判定角度より小さいときに前記送り動作と判定する、
請求項1に記載のジェスチャ認識装置。
【請求項4】
前記検出部が複数本の指の各指先位置の軌跡をそれぞれ検出した場合に、前記指毎の前記指先位置の軌跡を前記判定部と前記設定部に順番に送る管理部をさらに有し、
前記設定部は、前記指毎に前記有効範囲を設定し、
前記判定部は、前記指毎に前記送り動作か否かを判定し、
前記認識部は、前記複数本の指の前記送り動作を統合して、前記ユーザのジェスチャを認識する、
請求項1乃至3のいずれか一項に記載のジェスチャ認識装置。
【請求項5】
前記有効範囲が矩形領域である、
請求項1乃至4のいずれか一項に記載のジェスチャ認識装置。
【請求項6】
動画像を取得し、
前記動画像からユーザの指先位置の軌跡を検出し、
前記指先位置の軌跡から送り動作か否かの判定を行うための有効範囲を設定し、
前記指先位置の軌跡が、前記有効範囲に含まれている場合に、前記指先位置の軌跡が送り動作か否かを判定し、
前記指先位置の軌跡が前記送り動作の場合に、前記送り動作から前記ユーザのジェスチャを認識する、
ジェスチャ認識方法。
【請求項7】
動画像を取得する画像取得機能と、
前記動画像からユーザの指先位置の軌跡を検出する検出機能と、
前記指先位置の軌跡から送り動作か否かの判定を行うための有効範囲を設定する設定機能と、
前記指先位置の軌跡が、前記有効範囲に含まれている場合に、前記指先位置の軌跡が送り動作か否かを判定する判定機能と、
前記指先位置の軌跡が前記送り動作の場合に、前記送り動作から前記ユーザのジェスチャを認識する認識機能と、
をコンピュータによって実現するためのジェスチャ認識プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−105305(P2013−105305A)
【公開日】平成25年5月30日(2013.5.30)
【国際特許分類】
【出願番号】特願2011−248569(P2011−248569)
【出願日】平成23年11月14日(2011.11.14)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】