説明

ジェスチャ認識装置

【課題】終点の位置ずれによる誤認識を低減して認識精度を高める。
【解決手段】カメラ4により撮像されたユーザの画像データを取り込み、この取り込まれた画像データから先ず指の初期位置を検出してこの初期位置を含む第1のサイズE0 の終始点入力判定領域を上記画像データ中に設定する。そして、上記画像データから検出される指の位置座標が終始点入力判定領域外に出たのち当該終始点入力判定領域内に戻るまでの指の位置座標の軌跡を検出している過程で、終始点入力判定領域拡大縮小部32の制御の下で、検出された指の位置座標が上記終始点入力判定領域内に存在するか否かを判定し、存在すると判定されているときには上記終始点入力判定領域のサイズを上記第1のサイズE0 より大きい第2のサイズE1 に拡大し、存在しないと判定されているときには上記終始点入力判定領域のサイズを上記第1のサイズE0 に縮小する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、例えばテレビジョン受信機や録画再生装置において、離れた場所からチャネル情報や制御情報等を入力するために用いる、指又は腕の動きによるジェスチャを認識するジェスチャ認識装置に関する。
【背景技術】
【0002】
カメラを接続可能な外部インタフェース(例えばUSB)を備えたネット対応テレビジョン受信機の登場に伴い、テレビジョン電話等のネットワークとカメラを用いたサービスが普及しつつある。また、カメラを用いた画像処理技術を用いてその場にいる人々の年齢性別を認識する技術を組み込んだデジタルサイネージの登場に伴い、その場の人々の年齢性別に合わせた広告を表示するサービスが普及しつつある。
【0003】
ところで、これらのサービスを利用する際にユーザはメニューの選択操作等を行う必要があるが、その入力操作方式として利用者の動きを利用したジェスチャ入力方式が提案されている。このジェスチャ入力方式は、例えばユーザの指の動きをカメラを用いて撮像し、この撮像された画像データからユーザの特定の身体部位の動作軌跡をパターン認識処理により認識して、この認識結果をもとにメニュー等のポインティングを行うものとなっている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特許第4053903号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところが、従来提案されているジェスチャ認識処理技術は以下のような解決すべき課題があった。
すなわち、従来の技術では、ユーザが例えば図22(a)に示す入力開始前の状態から図22(b)に示すようにカメラの撮像画面の中央部に指の位置を持っていくと、このときの指の初期位置Psを基準として終始点入力判定領域Eが作成される。この状態で、ユーザが一筆書きで図形を描くと、図22(c)に示すように指の位置が終始点入力判定領域E外へ出た時点で入力判定フラグがONとなり、その後図22(d)に示すように指の位置Peが終始点入力判定領域E内に戻った時点で入力判定フラグがOFFとなる。そして、上記入力判定フラグがONになっている期間に得られた指の軌跡により表される図形が、ジェスチャとして認識される。
【0006】
しかし、指の位置が終始点入力判定領域E内に戻った際に、ユーザは指を停止させたつもりでもその位置は微妙に変化する。このため、指の停止位置、つまり終点Pe が図23(a),(b)に示すように領域境界上にあると、この終点Pe 位置が領域境界線を何度も通過するため図23(c)に示すようにいわゆるチャタリングのような現象が起こり、その結果誤認識が発生することがある。
【0007】
また、ユーザが一筆書き図形を描いてもこの図形がジェスチャとして認識されない場合がある。この問題が生じる例としては以下の2つがあげられる。
(1) ユーザは円を描いたつもりでも、図24(a),(b)に示すように指の軌跡が終始点入力判定領域Eを通過しない場合
(2) 同様に円を描いたつもりでも、図24(c)に示すように指の位置が終始点入力判定領域Eに届かずに手前で止まってしまった場合。
【0008】
この発明は上記事情に着目してなされたもので、その第1の目的は、終点の位置ずれによる誤認識を低減して認識精度を高めたジェスチャ認識装置を提供することである。
また第2の目的は、ユーザによる図形の描画位置が移動しても図形を確実に認識できるようにしたジェスチャ認識装置を提供することである。
【0009】
さらに第3の目的は、ユーザが描く図形の移動範囲を狭い範囲に抑制することが可能なジェスチャ認識装置を提供することである。
【課題を解決するための手段】
【0010】
上記第1の目的を達成するためにこの発明の第1の観点は、ジェスチャにより空間に図形を描く動きを撮像してその画像データを出力する撮像装置と、上記撮像装置から出力された画像データをもとに上記ジェスチャにより描かれた図形を認識するジェスチャ認識装置とを具備するシステムで使用される上記ジェスチャ認識装置において、上記撮像装置から出力された画像データを取り込み、この取り込まれた画像データから先ず描画点の初期位置を検出してこの初期位置を含む第1のサイズの終始点入力判定領域を上記画像データ中に設定する。そして、上記画像データから検出される描画点が上記終始点入力判定領域外に出たのち当該終始点入力判定領域内に戻るまでの描画点の軌跡を検出している最中に、当該描画点が上記終始点入力判定領域内に存在するか否かを判定し、存在すると判定されているときには上記終始点入力判定領域のサイズを上記第1のサイズより大きい第2のサイズに拡大し、存在しないと判定されているときには上記終始点入力判定領域のサイズを上記第1のサイズに縮小するようにしたものである。
【0011】
したがって、この発明の第1の観点によれば、描画点が終始点入力判定領域内に戻るとこの終始点入力判定領域のサイズが第2のサイズに拡大される。つまり、第1のサイズの境界線上に停止した指の位置は第2のサイズの内部に存在することになる。このため、上記描画点の終点がユーザの指の震えや揺れ等により多少位置ずれを起こしたとしても終点の位置を終始点入力判定領域内に安定的に留めることが可能となり、これによりいわゆるチャタリングのような現象が発生しても、誤認識の発生を減らすことができる。
【0012】
上記第2の目的を達成するためにこの発明の第2の観点は、少なくとも上記描画点が上記終始点入力判定領域外に存在するときに、上記描画点の軌跡の通過を検出するための入力判定境界線を上記画像データ中に設定する手段をさらに備える。そして、ジェスチャを認識する際に、上記描画点の軌跡が上記設定された入力判定境界線を通過せずかつ上記描画点が上記終始点入力判定領域内に戻ったか否かを判定する第1の判定処理と、上記描画点の軌跡が上記入力判定境界線を複数回通過したか否かを判定する第2の判定処理と、上記描画点の軌跡が上記入力判定境界線を1回通過しかつ描画点が上記終始点入力判定領域内に戻ったか否かを判定する第3の判定処理のいずれかでその判定結果が「OK」となった場合に、当該描画点の軌跡をジェスチャにより描かれた図形として認識するようにしたものである。
【0013】
したがって、この発明の第2の観点によれば、描画点の終点が終始点入力判定領域内に戻った場合に止まらず、ユーザが円を描いたつもりでも描画点の軌跡が終始点入力判定領域を通過しなかった場合でも、また描画点の位置が終始点入力判定領域に届かずに手前で止まってしまった場合でも、このとき描かれた図形を認識対象のジェスチャとして認識することが可能となる。
【0014】
上記第3の目的を達成するためにこの発明の第3の観点は、上記終始点入力判定領域の位置を補正する補正手段をさらに備える。そして、上記補正手段により、上記描画点の軌跡が上記第2の判定処理により定義される判定条件を満たした場合に、上記終始点入力判定領域の位置を上記描画点の終点を含む位置に移動させる。また、上記描画点の軌跡が上記第1又は第3の判定処理により定義される判定条件を満たした場合には、上記終始点入力判定領域の位置を上記描画点の初期位置に近づくように移動させるようにしたものである。
【0015】
このようにすると、ユーザが1つの図形を描くごとに、終始点入力判定領域の位置が当該図形の終点を含む位置に移動する。このため、複数の図形を連続的に描く場合に次の図形をより確実に認識することが可能となる。また、複数の図形を連続的に描いている過程で、図形の終点位置が終始点入力判定領域の初期位置に戻った場合には、終始点入力判定領域の位置が上記初期位置に対し近い位置に戻るように修正される。このため、ユーザが描く図形の移動範囲を狭い範囲に規制することが可能となる。
【0016】
また、上記第2の目的を達成するためにこの発明の第4の観点は、上記終始点入力判定領域及び上記入力判定境界線を拡張する拡張手段をさらに具備する。そして、拡張手段により、上記描画点が予め設定した時間以上連続して停止したか否かを判定し、この判定処理により上記描画点の停止が検出されかつその停止位置が上記終始点入力判定領域外のとき、上記終始点入力判定領域及び上記入力判定境界線の少なくとも一方を上記停止中の描画点に近づけるようにしたものである。
【0017】
このようにすると、描画点の終点位置が終始点入力判定領域外の位置で一定時間以上停止した場合に、終始点入力判定領域が上記停止中の描画点に近づくように拡張されるか、或いは入力判定境界線の位置が上記停止中の描画点に近づくように移動される。このため、ユーザが描いた図形の軌跡が終始点入力判定領域を通過しなかったり、或いは図形の終点が終始点入力判定領域に届かずに手前で止まってしまった場合でも、このときの描画図形をジェスチャとして認識することが可能となる。
【発明の効果】
【0018】
すなわちこの発明の第1の観点によれば、終点の位置ずれによる誤認識を低減して認識精度を高めたジェスチャ認識装置を提供することができる。
またこの発明の第2の観点によれば、ユーザによる図形の描画位置が移動しても図形を確実に認識できるようにしたジェスチャ認識装置を提供することができる。
さらにこの発明の第3の観点によれば、ユーザが描く図形の移動範囲を狭い範囲に抑制することが可能なジェスチャ認識装置を提供することができる。
【図面の簡単な説明】
【0019】
【図1】この発明の一実施形態に係わるジェスチャ認識装置を含むシステムの概略構成図。
【図2】図1にジェスチャ認識装置として示したテレビジョン受信機の機能構成を示すブロック図。
【図3】図2に示したテレビジョン受信機による全体の処理手順と処理内容を示すフローチャート。
【図4】図3に示した全体の処理手順のうち終始点入力判定領域拡大縮小処理の処理手順と処理内容を示すフローチャート。
【図5】図3に示した全体の処理手順のうち入力判定境界線作成削除処理の処理手順と処理内容を示すフローチャート。
【図6】図3に示した全体の処理手順のうち終始点入力判定領域・境界線拡張処理の処理手順と処理内容を示すフローチャート。
【図7】図3に示した全体の処理手順のうちジェスチャ入力処理の処理手順と処理内容を示すフローチャート。
【図8】図4に示した終始点入力判定領域拡大縮小処理の具体例を説明するための図。
【図9】図5に示した入力判定境界線作成削除処理の説明に用いる入力判定水平境界線作成領域の一例を示す図。
【図10】図5に示した入力判定境界線作成削除処理の説明に用いる入力判定垂直境界線作成領域の一例を示す図。
【図11】図5に示した入力判定境界線作成削除処理の説明に用いる入力判定境界線の一例を示す図。
【図12】図6に示した終始点入力判定領域・境界線拡張処理のうち、終始点入力判定領域の拡張処理の一例を示す図。
【図13】図6に示した終始点入力判定領域・境界線拡張処理のうち、入力判定境界線の接近処理の一例を示す図。
【図14】図7に示したジェスチャ入力処理のうち、入力判定垂直境界線を利用した入力判定処理の一例を示す図。
【図15】図7に示したジェスチャ入力処理のうち、入力判定水平境界線を利用した入力判定処理の一例を示す図。
【図16】図7に示したジェスチャ入力処理のうち、入力判定境界線と終始点入力判定領域を併用した入力判定処理の一例を示す図。
【図17】図7に示したジェスチャ入力処理のうち、終始点入力判定領域の位置補正処理の一例を示す図。
【図18】図7に示したジェスチャ入力処理のうち、終始点入力判定領域の位置補正処理の他の例を示す図。
【図19】この発明の用途の第1の例を示す図。
【図20】この発明の用途の第2の例を示す図。
【図21】この発明の用途の第3の例を示す図。
【図22】この発明に係る基本的なジェスチァ認識手順を示す図。
【図23】従来の認識手段の課題を説明するための図。
【図24】従来の認識手段の課題を説明するための図。
【発明を実施するための形態】
【0020】
以下、図面を参照してこの発明に係わる実施形態を説明する。
[構成]
図1は、この発明の一実施形態に係わるジェスチャ認識を用いた情報入力システムの概略構成図である。このシステムは、テレビジョン受信機2にカメラ4を装着したものとなっている。カメラ4は、ユーザ1の指の動きを用いたジェスチャを撮像し、その撮像画像データをUSBケーブルを介してテレビジョン受信機2へ出力する。なお、ユーザ1の指先には、指先の動きをより認識し易くするために例えばLED(Light Emitting Diode)を用いた発光マーカ6が装着される。
【0021】
テレビジョン受信機2は、ジェスチャ認識装置としての機能を備えたもので、以下のように構成される。図2は、このテレビジョン受信機2の構成を上記カメラ4の構成と共に示すブロック図である。
【0022】
カメラ4は、撮像処理部41と、画像送信部42を備えている。撮像処理部41は、後述するリアルタイムイベント発行ユニット50からトリガ信号が発生されるごとにユーザ1のジェスチャを撮像する処理を行う。画像送信部42は、上記撮像処理により得られた画像データを後述する記憶ユニット20内の画像情報蓄積部21に記憶させる処理を行う。
【0023】
テレビジョン受信機2は、ジェスチャ認識処理を行うために必要な機能として、記憶ユニット20と、ジェスチャ認識ユニット30と、表示画像制御ユニット40と、リアルタイムイベント発行ユニット50と、指位置検出ユニット60を備えている。
【0024】
記憶ユニット20は、記憶媒体として例えばハードディスク又はNAND型フラッシュメモリを使用したもので、この発明を実施するために必要な記憶機能として、画像情報蓄積部21と、ジェスチャコマンド変換テーブル部22と、表示画像データ蓄積部23と、図形パターン記憶部24と、指位置情報蓄積部25を有している。
【0025】
画像情報蓄積部21は、上記カメラ4の画像送信部42から出力された画像データを記憶するために用いられる。ジェスチャコマンド変換テーブル部22には、認識対象の複数の入力コマンドに対応付けて、当該入力コマンドを意味する図形パターンの種類とその終始点を表す情報が予め記憶されている。表示画像データ蓄積部23には、上記入力コマンドが意味する表示処理内容に応じた画像を表示するために必要な様々な表示画像データが記憶される。図形パターン記憶部24には、認識対象となる複数の図形形状の基本パターンが記憶される。指位置情報蓄積部25は、後述する指位置検出ユニット60により検出されたユーザ1の指の軌跡を表す位置座標集合を蓄積するために用いられる。
【0026】
リアルタイムイベント発行ユニット50は、例えばタイマを使用して、上記カメラ4等を予め決められた周期で動作させるためのトリガ信号を生成する。
指位置検出ユニット60は、上記リアルタイムイベント発行ユニット50により決められたトリガ信号の発行周期で上記画像情報蓄積部21に新たな画像データが記憶されるごとに、この画像データから発光マーカ6の輝点画像を指の位置を表す情報として検出し、画像データ中における上記輝点画像の位置座標を記憶ユニット20内の指位置情報蓄積部25に記憶させる処理を行う。
【0027】
ジェスチャ認識ユニット30は、この発明の一実施形態を実施するために必要な処理機能として、ジェスチャ入力初期設定部31と、終始点入力判定領域拡大縮小部32と、入力判定境界線作成削除部33と、終始点入力判定領域・境界線拡張部34と、ジェスチャ認識部35を備えている。
【0028】
ジェスチャ入力初期設定部31は、待機状態においてユーザ1がジェスチャによる入力操作開始動作を行った場合に起動される。そして、上記指位置検出ユニット60により検出されたユーザ1の指の位置を初期位置として認識して、この初期位置を中心とする終始点入力判定領域を画像データ中に設定する処理を行う。終始点入力判定領域とは、ジェスチャにより描かれる一筆書き図形の終始点を検出するためのもので、この終始点が検出された場合に1つの図形の入力が終了したと判定する。
【0029】
終始点入力判定領域拡大縮小部32は、上記ジェスチャ入力初期設定部31により終始点入力判定領域が設定された状態で、上記指位置検出ユニット60により指の位置座標が検出されるごとに、この検出された指の位置座標が上記終始点入力判定領域内に存在するか否かを判定する。そして、上記指の位置座標が終始点入力判定領域の外部に存在するときには終始点入力判定領域のサイズを上記ジェスチャ入力初期設定部31により初期設定された第1のサイズに維持し、上記指の位置座標が終始点入力判定領域の内部に入った場合には終始点入力判定領域のサイズを上記第1のサイズより大きい第2のサイズに拡大する処理を行う。
【0030】
入力判定境界線作成削除部33は、ユーザ1がジェスチャにより一筆書きの図形を描いている期間に、画像データ中における指の検出位置に応じて入力判定境界線を画像データ中に設定する処理を行う。この入力判定境界線は、水平境界線と垂直境界線とからなり、画像データ中において指の描画軌跡が通過したか否かを判定するもので、上記終始点入力判定領域と協同して上記ジェスチャによる1つの図形の入力操作が終了したか否かを判定するために用いられる。
【0031】
終始点入力判定領域・境界線拡張部34は、上記指位置検出ユニット60により検出された指の位置座標が予め設定した一定時間以上連続して停止しているか否かと、当該検出された指の位置座標が終始点入力判定領域に含まれているか否かを判定する。そして、上記検出された指の位置座標が一定時間以上連続して停止し、かつ終始点入力判定領域に含まれていると判定された場合に、ユーザ1がジェスチャで描いた図形の終点が終始点入力判定領域内に到達していないと判断し、終始点入力判定領域を徐々に拡張させて上記停止している指の位置座標に近づける処理か、又は入力判定境界線を徐々に移動させて上記停止している指の位置座標に近づける処理を行う。
【0032】
ジェスチャ認識部35は、上記指位置情報蓄積部25に記憶された指の軌跡を表す情報もとにユーザ1がジェスチャにより描いた図形を認識するためのもので、その機能としてジェスチャ入力判定部351と、終始点入力判定領域位置補正部352と、描画方向・形状認識部353を有している。
【0033】
ジェスチャ入力判定部351は、上記終始点入力判定領域及び入力判定境界線を用いて、上記指位置情報蓄積部25に記憶された指の軌跡を表す位置座標集合から利用者が1つの図形の入力操作を終了したか否かを判定する処理を行う。
【0034】
終始点入力判定領域位置補正部352は、ユーザ1ができるだけ小さな描画範囲で連続的にジェスチャ入力を行えるようにするために、上記ジェスチャ入力判定部351によるジェスチャの入力判定結果に応じて終始点入力判定領域の位置を適応的に変更する処理を行う。
【0035】
描画方向・形状認識部353は、上記ジェスチャ入力判定部351により1つの図形の入力操作が終了したと判定された場合に、上記指位置情報蓄積部25から指の位置座標集合を読み出してこの位置座標集合から上記図形の形状と方向を認識する。そして、この図形の形状と方向を表すデータをジェスチャコマンド変換テーブル部22に渡し、ジェスチャの内容を表すコマンドに変換させる処理を行う。
【0036】
表示画像制御ユニット40は、上記ジェスチャコマンド変換テーブル部22により変換されたジェスチャの内容を表すコマンドをもとに、表示画像データを更新する。そして、この更新された表示画像データを図示しないディスプレイに出力して表示させる処理を行う。
【0037】
なお、上記ジェスチャ認識ユニット30、表示画像制御ユニット40、リアルタイムイベント発行ユニット50及び指位置検出ユニット60の各処理機能は、記憶ユニット20内の図示しないプログラムメモリに格納されたアプリケーション・プログラムを中央処理ユニット(Central Processing Unit:CPU)に実行させることにより実現される。
【0038】
[動作]
次に、以上のように構成されたテレビジョン受信機2による、ジェスチャを用いた入力情報の認識動作を説明する。
図3は、その全体の処理手順と処理内容を示すフローチャートである。なお、ここではテレビジョン受信機2のディスプレイに電子番組案内(Electronic Program Guide:EPG)情報を表示させ、このEPG情報に対しユーザ1がジェスチャにより番組の選択操作を行う場合を例にとって説明する。
【0039】
(1)ジェスチャ入力初期設定処理
テレビジョン受信機2は、ジェスチャ入力初期設定部31の制御の下で、先ずステップS10によりユーザがジェスチャ入力の開始を要求する操作を行ったか否かを監視する。ジェスチャ入力の開始要求操作は、リモートコントローラ等のテレビジョン受信機2とインタラクション可能な入力デバイスにより行う場合と、ユーザのジェスチャにより行う場合とがあるが、ここでは後者を使用する場合について述べる。
【0040】
ユーザがカメラ4に向かって例えば手を振ったとする。そうするとジェスチャ入力初期設定部31は、カメラ4により得られた画像データから手の領域をカラーマッチング処理により抽出し、この抽出された手の領域の移動軌跡が手を左右に複数回繰り返し振っているパターンに該当する場合に、このときのジェスチャをジェスチャ入力の開始要求と認識する。
【0041】
上記ジェスチャ入力の開始要求を認識すると、ジェスチャ入力初期設定部31は続いて上記開始要求操作時の指の位置がジェスチャ入力を開始可能な位置(図22(a)の×印に示す画面中央位置の周辺領域)にあるか否か判定する。この判定の結果、指の位置がジェスチャ入力を開始可能な位置に存在しない場合には、指の位置の変更を促すガイダンスメッセージをテレビジョン受信機2のディスプレイに表示させる。そして、ユーザの指の位置がジェスチャ入力を開始可能な位置に移動すると、図22(b)に示すように上記画面中央位置を中心としかつ直径が第1のサイズに設定された終始点入力判定領域Eを生成する。
【0042】
(2)終始点入力判定領域の拡大縮小処理
上記終始点入力判定領域の設定が終了しジェスチャ入力モードになると、ステップS11によりリアルタイムイベント発行ユニット50が起動し、タイマの計時時間が予め設定された時間、例えば33msecになるごとにトリガ信号が発生される。すなわち、ジェスチァ入力モードになると33msec周期でトリガ信号が発生される。
【0043】
上記トリガ信号が発生されると、カメラ4によりユーザの撮像処理が行われ(ステップS12)、この撮像処理により得られた画像データが画像情報蓄積部21に記憶される(ステップS13)。そして、上記画像情報蓄積部21に新たな画像データが記憶されると、ステップS14により指位置検出ユニット60が起動し、この指位置検出ユニット60により上記画像データ中から発光マーカ6の輝点画像を検出する処理が行われる。そして、この検出された輝点画像の画像データ中の位置座標が、ユーザの指の位置を表す情報として指位置情報蓄積部25に記憶される(ステップS15)。以上の処理は上記33msec周期で繰り返し行われ、この結果上記指位置情報蓄積部25には指の位置座標の集合がユーザが描いた図形を示すデータとして記憶される。
【0044】
さて、上記指位置情報蓄積部25に新たな指位置座標が記憶されるごとに、ステップS16により終始点入力判定領域拡大縮小部32が起動され、この終始点入力判定領域拡大縮小部32の制御の下で以下のような処理が行われる。図4はその処理手順と処理内容を示すフローチャートである。
【0045】
すなわち、先ずステップS30により上記検出された指の位置座標が上記終始点入力判定領域内に存在するか否かが判定される。この判定の結果、例えば指の位置座標が図8(a)のPs に示すように前記初期設定された終始点入力判定領域E0 内に存在し、かつ当該終始点入力判定領域が拡大されていない場合には、ステップS31において終始点入力判定領域のサイズが上記第1のサイズE0より大きい第2のサイズE1に拡大される。
【0046】
続いて、上記指の位置座標が図8(b)に示すように終始点入力判定領域E1 の外部に出たとする。そうすると、この状態はステップS32により検出され、ステップS33において終始点入力判定領域のサイズが上記ジェスチャ入力初期設定部31により初期設定された第1のサイズE0 に縮小される。
【0047】
さらに、図形の軌跡Lが描かれたのち、指の位置座標が例えば図8(c)に示すように終始点入力判定領域E0内に戻ると、この状態はステップS30により検出されてステップS31に移行する。そして、このステップS31により終始点入力判定領域のサイズが上記第2のサイズE1に拡大される。
【0048】
したがって、ユーザの指の位置が終始点入力判定領域E0内に戻った後に、震えなどにより当該領域E0の境界付近で位置ずれを起こしたとしても、このときの指の位置座標、つまり終点の位置を、終始点入力判定領域E1内に安定的に留めることが可能となる。このため、終始点入力判定領域の境界上でいわゆるチャタリングのような現象が発生しても、これにより後述する描画の終了判定(入力判定)において誤認識が発生しないようにすることができる。
【0049】
(3)入力判定境界線の作成・削除処理
前記指位置情報蓄積部25に新たな指位置座標が記憶されるごとに、ステップS17では入力判定境界線の作成・削除部33が起動され、この入力判定境界線の作成・削除部33の制御の下で以下のような処理が行われる。図5はその処理手順と処理内容を示すフローチャートである。
【0050】
すなわち、先ずステップS40において、上記検出された指の位置座標が水平境界線作成領域内に存在するか否かが判定される。この判定の結果、指の位置座標が例えば図9に示す水平境界線作成領域H1 ,H2 内のいずれかに存在する場合には、ステップS41により画像データの中心点を通る入力判定水平境界線H0 が生成される。次にステップS42において、上記検出された指の位置座標が垂直境界線作成領域内に存在するか否かが判定される。そして、この判定の結果、指の位置座標が例えば図10に示すように垂直境界線作成領域V1 ,V2 内のいずれかに存在すると、ステップS43において画像データの中心点を通る入力判定垂直境界線V0 が生成される。
【0051】
図11は、上記入力判定水平境界線H0 と入力判定垂直境界線V0 の両方が生成された場合の例を示している。これらの入力判定水平境界線H0 及び入力判定垂直境界線V0 は、後述するジェスチャ入力処理において指の軌跡の通過を判定するために用いられる。
なお、上記生成された入力判定水平境界線H0 及び入力判定垂直線V0 は、上記指の位置座標が境界線作成領域外に出ると、つまり終始点入力判定領域E0 内に入ると、消去される。
【0052】
(4)終始点入力判定領域の拡張及び入力判定境界線の移動処理
前記指位置情報蓄積部25に新たな指位置座標が記憶されるごとに、ステップS18では終始点入力判定領域・境界線拡張部34が起動され、この終始点入力判定領域・境界線拡張部34の制御の下で以下の処理が行われる。図6はその処理手順と処理内容を示すフローチャートである。
【0053】
すなわち、ステップS50において、上記検出された指の位置座標が予め設定された一定時間以上連続して停止しているか否かと、当該検出された指の位置座標が終始点入力判定領域E0 に含まれているか否かが判定される。そして、上記検出された指の位置座標が一定時間(例えば2sec)以上連続して停止し、かつ終始点入力判定領域E0 に含まれていると判定されると、ユーザ1がジェスチャにより描いた図形の終点が終始点入力判定領域E0 内に到達していないと判断され、ステップS51に移行して終始点入力判定領域を徐々に拡張させて上記停止している指の位置座標に近づける処理か、又は入力判定境界線を徐々に移動させて上記停止している指の位置座標に近づける処理が行われる。
【0054】
例えば、終始点入力判定領域を拡張処理する場合には、図12のE0 〜En に示すように、33msec周期で一定サイズずつ直径を増加させる処理が行われる。このため、指が停止した状態がしばらく続くと、当該指の停止位置座標は終始点入力判定領域内に入り、これにより1つの図形の入力が終了したと判定することが可能となる。
【0055】
また、入力判定境界線を拡張処理する場合には、入力判定水平境界線H0 及び入力判定垂直境界線V0 が図13のH0 〜Hm ,V0 〜Vm に示すように、33msec周期で一定量ずつ上記指の停止位置座標に近づけられる。この結果、上記指の軌跡を入力判定水平境界線H0 及び入力判定垂直境界線V0 により検出できる確率が高くなる。
【0056】
なお、上記停止中の指の位置が再び動き始めた場合には、その直前における終始点入力判定領域のサイズEn と、入力判定水平境界線Hm 及び入力判定垂直境界線Vm の位置が保持される。そして、また指の動きが一定時間以上停止した場合には、上記終始点入力判定領域のサイズが上記En からさらに拡張され、また入力判定水平境界線Hm 及び入力判定垂直境界線Vm の位置が当該Hm ,Vm から上記指の停止位置座標にさらに近づけられる。
【0057】
(5)ジェスチャ入力処理
ステップS19ではジェスチャ認識部35が起動され、このジェスチャ認識部35の制御の下で以下のようにジェスチャの入力判定処理と認識処理が行われる。図7はその処理手順と処理内容を示すフローチャートである。
すなわち、先ずステップS60において、指の停止位置座標が、初期設定された終始点入力判定領域E1 或いはステップS18により拡張処理された終始点入力判定領域に入ったか否かが判定される。次にステップS61において、指位置情報蓄積部25に記憶されている指の軌跡が入力判定水平境界線H0 又は入力判定垂直境界線V0 を2回通過したか否かが判定される。さらにステップS62において、指位置情報蓄積部25に記憶されている指の軌跡が入力判定水平境界線H0 又は入力判定垂直境界線V0 を1回通過し、かつ指の停止位置が上記拡張処理された終始点入力判定領域に入ったか否かが判定される。
【0058】
そして、上記ステップS60,S61,S62のいずれかにおいて判定条件が満たされると、ステップS63に移行して描画方向・形状認識部353によりジェスチャ認識処理が行われる。この認識処理は、回指位置情報蓄積部25に記憶された指位置座標の集合を読み出し、この指位置座標の集合により表される指の軌跡をもとに、ユーザが入力判定までにジェスチャにより描いた図形の方向と形状を認識することにより行われる。
【0059】
例えば、図14(a),(b)に示すように指の軌跡Lが入力判定垂直境界線V0 をC1及びC2の2箇所で横切っている場合には、ステップS61からステップS63に移行して、このときの描画図形の方向と形状が認識される。同様に、図15(a),(b)に示すように指の軌跡Lが入力判定水平境界線V0 をC1及びC2の2箇所で横切っている場合にも、ステップS61からステップS63に移行して、このときの描画図形の方向と形状が認識される。
【0060】
また、図16に示すように指の軌跡Lが入力判定水平境界線V0 を1箇所しか横切っていないものの、当該指の停止位置座標が拡張処理後の終始点入力判定領域En 内に入っている場合には、ステップS62からステップS63に移行して、このときの描画図形の方向と形状が認識される。
【0061】
上記認識された図形の方向及び形状はジェスチャコマンド変換テーブル部22により入力コマンドに変換され、この変換された入力コマンドは表示画像制御ユニット40に送られる。
【0062】
また、上記ジェスチャ認識処理が終了すると、ステップS64において終始点入力判定領域補正部352が起動され、この終始点入力判定領域補正部352の制御の下で、終始点入力判定領域の位置を補正する処理が行われる。この補正処理は、ユーザ1ができるだけ小さな描画範囲で連続的にジェスチャ入力を行えるようにするためのもので、例えば以下のように行われる。
【0063】
すなわち、上記ジェスチャ認識処理においてステップS61の判定条件を満たした場合には、例えば図17(a),(b)に示すように終始点入力判定領域E0 が指の停止位置座標を含む領域EM に移動される。これに対し、上記ジェスチャ認識処理においてステップS60及びステップS62の判定条件を満たした場合には、例えば図18(a),(b)のEk に示すように、終始点入力判定領域EM の位置が初期設定された終始点入力判定領域E0 に近づくように補正される。ただし、このとき移動後の終始点入力判定領域Ek には指の停止位置座標が含まれるようにする。なお、指の停止位置座標が、前記ジェスチャ入力初期設定処理(ステップS10)により初期設定された終始点入力判定領域E0 内に戻っている場合には、当該終始点入力判定領域E0の位置は変更しない。
このようにすることで、ユーザが描く図形の移動範囲をコンパクトな範囲内に抑制することが可能となる。
【0064】
(6)表示画像の更新処理
ステップS20では表示画像制御ユニット40が起動され、この表示画像制御ユニット40の制御の下で表示画像の更新処理が以下のように行われる。
すなわち、ジェスチャコマンド変換テーブル部22から出力された入力コマンドに従い、表示中のEPG表示画像が更新される。例えば、図19に示すようにEPG表示画像G0 が表示されている状態で、同図(a)に示すようにジェスチャにより描画方向が“上”でかつ形状が“円”からなる図形が入力された場合には、EPG表示画像上のカーソル位置(網掛け表示)がG1 に示すように上方へ1ステップ分シフト移動する。同様に、同図(b),(c),(d)に示すようにジェスチャによりそれぞれ“右”、“左”、“下”方向に“円”の図形が入力された場合には、EPG表示画像上のカーソル位置(網掛け表示)がG4 ,G3 ,G2に示すようにそれぞれ“右”、“左”、“下”方向に1ステップ分シフト移動する。
【0065】
また、図20に示すようにEPG表示画像G0 が表示されている状態で、同図(a)に示すようにジェスチャにより描画方向が“上”でかつ形状が“線”からなる図形が入力された場合には、EPG表示画像がG5 に示すように“1日前”のものに更新される。同様に、ジェスチャにより描画方向が“下”でかつ形状が“線”からなる図形が入力された場合には、EPG表示画像がG6 に示すように“1日後”のものに更新される。
【0066】
さらに、図21に示すようにEPG表示画像G0 が表示されている状態で、同図(a)に示すようにジェスチャにより描画方向が“上”でかつ形状が“三角形”からなる図形が入力された場合には、EPG表示画像がG7 に示すように“1週間前”のものに更新される。同様に、ジェスチャにより描画方向が“下”でかつ形状が“三角形”からなる図形が入力された場合には、EPG表示画像がG8 に示すように“1週間後”のものに更新される。
【0067】
以上詳述したようにこの実施形態では、カメラ4により撮像されたユーザの画像データを取り込み、この取り込まれた画像データから先ず指の初期位置を検出してこの初期位置を含む第1のサイズE0 の終始点入力判定領域を上記画像データ中に設定する。そして、上記画像データから検出される指の位置座標が終始点入力判定領域外に出たのち当該終始点入力判定領域内に戻るまでの指の位置座標の軌跡を検出している過程で、終始点入力判定領域拡大縮小部32の制御の下で、検出された指の位置座標が上記終始点入力判定領域内に存在するか否かを判定し、存在すると判定されているときには上記終始点入力判定領域のサイズを上記第1のサイズE0 より大きい第2のサイズE1 に拡大し、存在しないと判定されているときには上記終始点入力判定領域のサイズを上記第1のサイズE0 に縮小するようにしている。
【0068】
したがって、指の位置座標が終始点入力判定領域内に戻るとこの終始点入力判定領域のサイズが第2のサイズE1 に拡大される。つまり、第1のサイズE0 の境界線上に停止した指の位置は第2のサイズE1 の内部に存在することになる。このため、上記指の位置座標の終点がユーザの指の震えや揺れ等により多少位置ずれを起こしたとしても、終点の位置を終始点入力判定領域内に安定的に留めることが可能となり、これによりいわゆるチャタリングのような現象が発生しても、誤認識の発生を減らすことができる。
【0069】
またこの実施形態では、上記指の位置座標が上記終始点入力判定領域外に存在するときに、入力判定境界線作成削除部33の制御の下で、当該指の位置座標の軌跡の通過を検出するための入力判定水平境界線H0 及び入力判定垂直境界線V0 を画像データ中に設定する。そして、ジェスチャ入力を判定する際に、
(1) 上記指の位置座標の軌跡が、上記設定された入力判定水平境界線H0 及び入力判定垂直境界線V0 を通過せずに、上記指の位置座標が上記終始点入力判定領域内に戻ったか否かを判定する処理。
(2) 上記指の位置座標の軌跡が、上記入力判定水平境界線H0 又は入力判定垂直境界線V0 を2回通過したか否かを判定する処理。
(3) 上記指の位置座標の軌跡が、上記入力判定水平境界線H0 又は入力判定垂直境界線V0 を1回通過し、かつ指の位置座標が終始点入力判定領域内に戻ったか否かを判定する処理。
を行い、これらの判定処理のいずれかでその判定結果が「OK」となった場合に、当該指の位置座標の軌跡をジェスチャにより描かれた図形として認識するようにしている。
【0070】
したがって、ユーザが円を描いたつもりでも、その指の位置座標の軌跡が終始点入力判定領域を通過しなかった場合や、指の位置座標が終始点入力判定領域に届かずに手前で止まってしまった場合でも、このとき描かれた図形を認識対象のジェスチャとして認識することが可能となる。
【0071】
さらにこの実施形態では、終始点入力判定領域位置補正部352の制御の下で、指の位置座標の軌跡が上記(2) の判定処理により定義される判定条件を満たした場合に、終始点入力判定領域の位置を上記指の位置座標の終点を含む位置に移動させる。また、上記指の位置座標の軌跡が上記(1) 又は(3) の判定処理により定義される判定条件を満たした場合には、上記終始点入力判定領域の位置を上記指の位置座標の初期位置に近い位置に戻すようにしている。
【0072】
したがって、ユーザが1つの図形を描くごとに、終始点入力判定領域の位置が当該図形の終点を含む位置に移動する。このため、複数の図形を連続的に描く場合に次の図形をより確実に認識することが可能となる。また、複数の図形を連続的に描いている過程で、図形の終点位置が終始点入力判定領域の初期位置に戻った場合には、終始点入力判定領域の位置が上記初期位置に対し近い位置に戻るように修正される。このため、ユーザが描く図形の移動範囲をコンパクトな範囲に規制することが可能となる。
【0073】
さらにこの実施形態では、終始点入力判定領域・境界線拡張部24の制御の下で、指の位置座標が予め設定した時間(例えば2sec)以上連続して停止したか否かを判定する。そして、上記指の位置座標が上記設定時間以上停止し、かつその停止位置が上記終始点入力判定領域外のとき、上記終始点入力判定領域及び上記入力判定境界線を上記停止中の指の位置座標に徐々に近づけるようにしている。
【0074】
したがって、指の位置座標の終点が終始点入力判定領域に届かずに一定時間以上停止した場合には、終始点入力判定領域のサイズが上記停止中の指の位置座標に近づくように徐々に拡張される。また、入力判定境界線の位置が上記停止中の指の位置座標に近づくように徐々に移動する。このため、ユーザが描いた図形の軌跡が終始点入力判定領域を通過しなかったり、或いは図形の終点が終始点入力判定領域に届かずに手前で止まってしまった場合でも、このときの描画図形をジェスチャ入力として認識することが可能となる。
【0075】
なお、この発明は上記実施形態に限定されるものではない。例えば、前記実施形態では、終始点入力判定領域外で指の位置座標が一定時間(例えば2sec)以上停止した場合に、終始点入力判定領域を徐々に上記指の位置座標の停止位置に近づけるようにした。しかし、終始点入力判定領域を近づける前に、指の位置座標の停止位置と終始点入力判定領域の中心位置との間の距離を計算し、この離間距離が予め定めたしきい値以内の場合に近づける処理を行い、離間距離がしきい値を超えている場合にはユーザがジェスチャにより描いた図形が誤っていると判断して、終始点入力判定領域を指の位置座標の停止位置に近づけないようにしてもよい。
【0076】
また前記実施形態では、指の位置座標が終始点入力判定領域外へ出て再度終始点入力判定領域内に戻った場合に、終始点入力判定領域のサイズを大きなサイズに拡大するようにした。しかし、それに限らず、終始点入力判定領域内に戻った指の位置座標の位置に対し終始点入力判定領域の中心位置を一致又は近接させるように当該終始点入力判定領域を移動させるようにしてもよい。
【0077】
さらに前記実施形態では、テレビジョン受信機2に表示されるEPG情報をジェスチャにより操作する場合を例にとって説明したが、パーソナル・コンピュータの表示画面やビデオプロジェクタによる表示画面をジェスチャにより操作するようにしてもよい。
その他、ジェスチャ認識装置の種類や構成、処理手順と処理内容、図形の形状等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
【0078】
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【符号の説明】
【0079】
1…ユーザ、2…テレビジョン受信機、3…通信回線、4…カメラ、6…発光マーカ、20…記憶ユニット、21…画像信号蓄積部、22…ジェスチャコマンド変換テーブル部、23…表示画像データ蓄積部、24…図形パターン記憶部、25…指位置情報蓄積部、30…ジェスチャ認識ユニット、31…ジェスチャ入力初期設定部、32…終始点入力判定領域拡大縮小部、33…入力判定境界線作成削除部、34…終始点入力判定領域・境界線拡張部、35…ジェスチャ認識部、351…ジェスチャ入力判定部、352…終始点入力判定領域位置補正部、353…描画方向・形状認識部、40…表示画像制御ユニット、41…画像撮像部、42…画像送信部、50…リアルタイムイベント発行ユニット、60…指位置検出ユニット。

【特許請求の範囲】
【請求項1】
ジェスチャにより空間に図形を描く動きを撮像してその画像データを出力する撮像装置と、前記撮像装置から出力された画像データをもとに前記ジェスチャにより描かれた図形を認識するジェスチャ認識装置とを具備するシステムで使用される前記ジェスチャ認識装置であって、
前記撮像装置から出力された画像データを取り込む手段と、
前記取り込まれた画像データから描画点の初期位置を検出し、この検出された描画点の初期位置を含む第1のサイズの終始点入力判定領域を前記画像データ中に設定する手段と、
前記終始点入力判定領域が設定された状態で、前記画像データから検出される描画点が前記終始点入力判定領域外に出たのち当該終始点入力判定領域内に戻るまでの描画点の軌跡を検出し、この検出された軌跡をジェスチャにより描かれた図形として認識するジェスチャ認識手段と、
前記描画点の軌跡の検出期間中に、当該描画点が前記終始点入力判定領域内に存在するか否かを判定し、存在すると判定されているときには前記終始点入力判定領域のサイズを前記第1のサイズより大きい第2のサイズに拡大し、存在しないと判定されているときには前記終始点入力判定領域のサイズを前記第1のサイズに縮小する拡大縮小制御手段と
を具備することを特徴とするジェスチャ認識装置。
【請求項2】
少なくとも前記描画点が前記終始点入力判定領域外に存在するときに、前記描画点の軌跡の通過を検出するための入力判定境界線を前記画像データ中に設定する手段を、さらに具備し、
前記ジェスチャ認識手段は、
前記描画点の軌跡が前記設定された入力判定境界線を通過せずかつ前記描画点が前記終始点入力判定領域内に戻ったか否かを判定する第1の判定手段と、
前記描画点の軌跡が前記入力判定境界線を複数回通過したか否かを判定する第2の判定手段と、
前記描画点の軌跡が前記入力判定境界線を1回通過しかつ描画点が前記終始点入力判定領域内に戻ったか否かを判定する第3の判定手段と、
前記描画点の軌跡が第1、第2及び第3の判定手段のいずれかで定義される判定条件を満たした場合に、当該軌跡をジェスチャにより描かれた図形として認識する手段と
を備えることを特徴とする請求項1記載のジェスチャ認識装置。
【請求項3】
前記終始点入力判定領域の位置を補正する補正手段を、さらに具備し、
前記補正手段は、
前記描画点の軌跡が前記第2の判定手段により定義される判定条件を満たした場合に、前記終始点入力判定領域の位置を前記描画点の終点を含む位置に移動させる手段と、
前記描画点の軌跡が前記第1又は第3の判定手段により定義される判定条件を満たした場合に、前記終始点入力判定領域の位置を前記描画点の初期位置に近づくように移動させる手段と
を備えることを特徴とする請求項2記載のジェスチャ認識装置。
【請求項4】
前記終始点入力判定領域及び前記入力判定境界線を拡張する拡張手段を、さらに具備し、
前記拡張手段は、
前記描画点が予め設定した時間以上連続して停止したか否かを判定する手段と、
前記描画点の停止が検出され、かつその停止位置が前記終始点入力判定領域外のとき、前記終始点入力判定領域及び前記入力判定境界線の少なくとも一方を、前記停止中の描画点に近づける手段と
を備えることを特徴とする請求項2記載のジェスチャ認識装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate


【公開番号】特開2012−98987(P2012−98987A)
【公開日】平成24年5月24日(2012.5.24)
【国際特許分類】
【出願番号】特願2010−247264(P2010−247264)
【出願日】平成22年11月4日(2010.11.4)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】