説明

ジェスチャ認識装置及びそのプログラム

【課題】ジェスチャ入力の応答性を向上し、かつジェスチャ入力期間中におけるユーザの不安を軽減する。
【解決手段】線対称図形予測部330を新たに備え、先ずジェスチャ認識領域中に対称軸作成判断領域を設定し、この状態で描画点の軌跡が当該対称軸作成判断領域内で直線を描いたか又は対称軸作成判断領域外で曲線を描いたかを判定し、その結果に応じて対称軸1又は対称軸2を設定する。次に、上記描画点の軌跡が上記設定された第1又は第2の対称軸を通過したかどうかを判定し、通過した場合に当該描画点が検出ゾーンを出てから上記第1又は第2の対称軸を通過するまでに描かれた描画軌跡の形状を識別する。そして、この識別された形状をもとに線対称図形の全体形状を復元し、この復元された線対称図形の全体形状からジェスチャにより描かれた図形の種類を推測し、表示画面を更新する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、例えばテレビジョン受信機や録画再生装置に対し離れた場所からチャネル情報や制御情報等を入力するために用いる、指又は腕の動きによるジェスチャを認識するジェスチャ認識装置及びそのプログラムに関する。
【背景技術】
【0002】
テレビジョン受信機に取り付け可能なカメラや赤外線距離センサを備える電子機器が安価に簡単に手に入るようになり、リモートコントローラを使わずに、手もしくは指のジェスチャによってテレビジョン受信機のメニュー項目を選択する方式が提案されている。このジェスチャ入力方式は、例えばユーザの指の動きをカメラを用いて撮像し、この撮像された画像データから指の動作軌跡を図形として検出して、この検出された図形を認識するものとなっている。
【0003】
ジェスチャを認識する手法には様々あるが、その1つとして一筆書きジェスチャ入力方式が提案されている。この一筆書きジェスチャ入力方式は、入力対象のメニュー項目に対し予め対応付けられたジェスチャを一筆書き操作により入力するもので、直感的で自然な動きによってジェスチャ入力できる利点がある(例えば非特許文献1又は2を参照)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】青木 良輔、唐津 豊、井原 雅行、前田 篤彦、渡部 智樹、小林 稔、鏡 慎吾:“大型ディスプレイ上のメニュー選択に適したカメラによる一筆書きジェスチャインタフェース”、ヒューマンインタフェース学会研究報告集2010,VOL.12,NO.9,35-42.
【非特許文献2】Ryosuke Aoki, Yutaka Karatsu, Masayuki Ihara, Atsuhiko Maeda, Minoru Kobayashi and Shingo Kagami : “Gesture Identification Based on Zone Entry and Axis Crossing”, Lecture Notes in Computer Science, 2011, Volume 6762/2011, 194-203.
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところが、上記各文献で述べられた一筆書きジェスチャ入力方式は、指によって描かれる一筆書き図形とジェスチャの始点に対するこの一筆書き図形の描画方向をもとに当該描画図形を認識する方式であり、ジェスチャによる指の指示位置がジェスチャ終始点判定領域を出たのち当該領域に戻った時点でジェスチャの認識を開始するようになっている。このため、ジェスチャ操作が終了するまでは当該ジェスチャにより入力しようとする図形を認識することができず、ジェスチャによる入力操作を開始してからその入力図形に応じてコマンドが実行されるまでに時間がかかる。また、ユーザはジェスチャ操作が終了するまで自身が入力した図形を確認することができず、ジェスチャ入力期間中に不安を覚えながらジェスチャ操作を行うことになり、誤入力も発生し易い。
【0006】
この発明は上記事情に着目してなされたもので、その目的とするところは、ジェスチャ入力の応答性を向上し、かつジェスチャ入力期間中におけるユーザの不安を軽減することが可能なジェスチャ認識装置及びそのプログラムを提供することにある。
【課題を解決するための手段】
【0007】
上記目的を達成するためにこの発明の第1の観点は、ユーザがジェスチャにより空間に図形を描く動きを撮像してその画像データを出力する撮像装置と、前記撮像装置から出力された画像データをもとに前記ジェスチャにより一筆書きで描かれた線対称の図形を認識するジェスチャ認識装置とを具備するシステムで使用される前記ジェスチャ認識装置にあって、上記撮像装置から出力された画像データを所定の周期で取り込み、この画像データが取り込まれるごとに当該画像データから上記ジェスチャによる描画点の位置情報を検出して、この検出された描画点の位置情報を記憶手段に格納する。そして、図形推測手段の制御の下、上記検出された描画点の位置情報が予め設定された終始点入力判定領域外に出たのち当該終始点入力判定領域内に戻るまでのジェスチャ入力期間中において、上記記憶手段に格納された描画点の位置情報の集合をもとに描画途中の描画点の軌跡を検出し、この検出された描画軌跡に基づいてユーザがジェスチャにより一筆書きで描こうとしている線対称の図形を推測して、この推測された図形を上記ユーザに提示する。
【0008】
したがって、ジェスチャ入力期間中において、描画途中の描画点の軌跡からユーザがジェスチャにより一筆書きで描こうとしている線対称の図形が推測され、ユーザに提示される。このため、ジェスチャによる入力操作を開始してからその入力図形が認識されるまでの時間が短縮され、これによりジェスチャ入力の応答性が向上する。また、ユーザはジェスチャ入力期間中に、自身の入力途中の図形を確認することができるようになり、これにより入力操作の不安が軽減される。
【0009】
またこの発明の第1の実施形態は、上記図形を推測する際に以下の処理を実行することを特徴とする。すなわち、先ず予め設定されたジェスチャ認識領域内に対称軸作成判断領域を設定し、描画途中の描画点の軌跡が上記設定された対称軸作成判断領域内に描かれているか又は対称軸作成判断領域外に描かれているかを判定する。この判定の結果、上記描画点の軌跡が対称軸作成判断領域内に描かれている場合には、当該対称軸作成判断領域に対し直交する第1の対称軸を設定する。これに対し上記描画点の軌跡が対称軸作成判断領域外に描かれていると判定された場合には、当該対称軸作成判断領域に対し直交する軸と平行する軸とからなる第2の対称軸を設定する。そして、上記描画点の軌跡が上記第1又は第2の対称軸を通過した場合に、上記検出された描画点が上記終始点入力判定領域外に出たのち当該第1又は第2の対称軸を通過するまでの当該描画点の軌跡の形状を識別し、この識別された描画点の軌跡の形状をもとにユーザがジェスチャにより一筆書きで描こうとしている線対称図形を推測する。
【0010】
したがって、ユーザがジェスチャ終始点判定領域から垂直方向又は水平方向に直線状に指を動かした場合でも、また方向を問わず非直線状に指を動かして場合でも、これらの動きをそれぞれ的確に検出することが可能となる。
【発明の効果】
【0011】
すなわちこの発明によれば、ジェスチャ入力の応答性を向上し、かつジェスチャ入力期間中におけるユーザの不安を軽減することが可能なジェスチャ認識装置を提供することができる。
【図面の簡単な説明】
【0012】
【図1】この発明の一実施形態に係わるジェスチャ認識装置を含むシステムの概略構成図。
【図2】図1にジェスチャ認識装置として示した情報処理装置の機能構成を示すブロック図。
【図3】図2に示した情報処理装置による全体の処理手順と処理内容を示すフローチャート。
【図4】図3に示したフローチャートにおける一筆書きジェスチャ認識機能のON/OFF切替処理の処理手順と処理内容を示すフローチャート。
【図5】ジェスチャ機能ONのためのユーザの操作例を示す図。
【図6】ジェスチャ機能OFFのためのユーザの操作例を示す図。
【図7】図3に示したフローチャートにおける一筆書きジェスチャ認識処理の処理手順と処理内容を示すフローチャート。
【図8】図3に示したフローチャートにおける線対称図形予測処理の処理手順と処理内容を示すフローチャート。
【図9】図8に示した線対称図形予測処理の第1の例を説明するための図。
【図10】図9に示した第1の例により予測可能な線対称図形の一例を示す図。
【図11】図8に示した線対称図形予測処理の第2の例を説明するための図。
【図12】図11に示した第2の例により予測可能な線対称図形の一例を示す図。
【発明を実施するための形態】
【0013】
以下、図面を参照してこの発明に係わる実施形態を説明する。
[構成]
図1は、この発明の一実施形態に係わるジェスチャ認識装置を用いた操作情報入力システムの概略構成図である。このシステムは、テレビジョン受信機2にカメラ4を装着すると共に、テレビジョン受信機2に情報処理装置3を接続したものとなっている。カメラ4は、ユーザ1の指の動きを用いたジェスチャを撮像し、その撮像画像データをUSBケーブルを介してテレビジョン受信機2へ出力する。なお、ユーザ1の指先には、指先の動きをより認識し易くするために例えばLED(Light Emitting Diode)を用いた発光マーカ6が装着される。
【0014】
情報処理装置3は、ジェスチャ認識装置としての機能を備えたもので、以下のように構成される。図2は、情報処理装置3の機能構成を示すブロック図である。情報処理装置3は、ジェスチャ認識処理を行うために必要な機能として、指の位置検出ユニット10と、データベース20と、一筆書きジェスチャ認識処理ユニット30と、リアルタイム処理発生ユニット40と、表示画面処理ユニット50を備えている。
【0015】
データベース20は、記憶媒体として例えばハードディスク又はNAND型フラッシュメモリを使用したもので、この発明を実施するために必要な記憶領域として、カメラ画像蓄積部21と、一筆書き図形蓄積部22と、操作内容蓄積部23と、表示画像・映像蓄積部24と、指位置蓄積部25を有している。
【0016】
カメラ画像蓄積部21は、指の位置検出ユニット10によりカメラ4から取得された画像データを記憶するために用いられる。指位置蓄積部25は、カメラ画像蓄積部21に蓄積された画像データから検出された指の指示位置と、当該画像データを撮像した時刻とを関連付けて格納するために用いられる。一筆書き図形蓄積部22には、一筆書き図形の認識に用いる一筆書き図形のモデルが予め格納されている。操作内容蓄積部23には、認識されたジェスチャの種類と方向に対応する操作内容を表す情報が予め格納されている。表示画像・映像蓄積部24には、上記操作内容データベース23に格納された操作内容を表す情報に対応付けて、表示画面に表示する画像や映像のデータが予め格納されている。
【0017】
リアルタイム処理発生ユニット40は、タイマを使用して、例えば33msecごとにイベント信号を発行する機能を有する。
【0018】
撮像画像取得ユニット10はカメラ画像取得部11を備え、上記リアルタイム発生ユニットによりイベント信号が発行されるごとに、カメラ4から画像データを取得して、この画像データを上記カメラ画像蓄積部21に記憶させる機能を有する。
【0019】
一筆書きジェスチャ認識処理ユニット30は、一筆書きジェスチャ認識機能ON/OFF切替部310と、一筆書きジェスチャ認識処理部320と、線対称図形予測部330を備えている。
【0020】
このうち、先ず一筆書きジェスチャ認識機能ON/OFF切替部310は、指位置検出部311と、一筆書きジェスチャ認識機能ON/OFF判断・切替部312を有する。指位置検出部311は、上記カメラ画像蓄積部21に格納された画像データからマーカ5の描画点の位置座標、つまりユーザの指の指示位置を検出し、この検出された描画点の位置座標を上記指位置蓄積部25に格納する。
【0021】
一筆書きジェスチャ認識機能ON/OFF判断・切替部312は、以下の処理機能を有している。
(1) 一筆書きジェスチャ認識処理部320の機能がOFFに設定されている状態で、カメラ4による撮像範囲、つまりジェスチャの認識領域内に、ジェスチャの始点判定領域(ジェスチャ開始領域)を設定する。そして、上記指位置検出部311により検出された発光マーカ5の描画点が上記ジェスチャ開始領域内に存在するか否かを判定し、存在すると判定された場合に上記一筆書きジェスチャ認識処理部320の機能をONに設定すると共に、ジェスチャの終点を検出するための検出ゾーン(Detection zone)を上記ジェスチャの認識領域内に設定する機能。
【0022】
(2) ジェスチャ認識処理部320の機能がONに設定されている状態で、上記指位置検出部311により検出された発光マーカ5の描画点が上記ジェスチャ認識領域の外に出たか否かを判定し、ジェスチャ認識領域の外に出たことが検出された場合に、上記一筆書きジェスチャ認識処理部の機能をONからOFFに遷移させる機能。
【0023】
一筆書きジェスチャ認識処理部320は、一筆書きジェスチャ入力判断部321と、一筆書き図形の方向識別部322と、一筆書き図形識別部323を有している。
一筆書きジェスチャ入力判断部321は、一筆書きジェスチャ認識処理部320の機能がONの状態で、上記画像データから検出される描画点が上記ジェスチャ開始領域内に入ったことが検出されたときの位置座標をジェスチャの開始点として検出する。また、上記描画点がジェスチャ開始領域外に出たのち上記検出ゾーン内に戻ったとき、このときの描画点の位置座標をジェスチャの終了点として検出する。
【0024】
一筆書き図形の方向識別部322は、上記ジェスチャの終了点が検出された場合に、当該ジェスチャによる描画点がジェスチャ開始領域外に出たのち上記検出ゾーン内に戻るまでの軌跡を表す位置座標の集合をもとに当該描画軌跡の重心位置座標を求め、この描画軌跡の重心位置座標とジェスチャの描画開始点との関係をもとに、当該描画開始点に対する描画方向を識別する。
【0025】
一筆書き図形識別部323は、上記描画点がジェスチャ開始領域外に出たのち上記検出ゾーン内に戻るまでの軌跡、つまりジェスチャにより描かれた図形の形状を表す情報を、上記一筆書き図形蓄積部22に記憶された一筆書き図形モデルと照合することで、上記ジェスチャにより描かれた図形の種類を識別する。
【0026】
線対称図形予測部330は、対称軸ON/OFF部331と、対称軸通過判断部332と、一筆書き図形予測部333を備えている。
【0027】
対称軸ON/OFF部331は、一筆書きにより描かれる線対称図形の左右又は上下半分までの二等分図形を検出するために使用する対称軸を設定するもので、以下の処理機能を有する。
(1) 上記描画点がジェスチャ開始領域に入り検出ゾーンが設定された状態で、ジェスチャ認識領域中に対称軸作成判断領域を設定する機能。
(2) 上記対称軸作成判断領域が設定された状態で、その後描画点の軌跡が当該対称軸作成判断領域内で直線を描いたか、又は対称軸作成判断領域外で曲線を描いたかを判定する機能。
(3) 上記判定処理により、描画点の軌跡が対称軸作成判断領域外で曲線を描いたと判定された場合には、水平及び垂直の2軸からなる第1の対称軸(対称軸1)を設定する。これに対し、描画点の軌跡が対称軸作成判断領域内で直線を描いたと判定された場合には、当該対称軸作成判断領域と直交する第2の対称軸(対称軸2)を設定する機能。
【0028】
対称軸通過判断部332は、上記描画点の軌跡が上記設定された第1又は第2の対称軸を通過したかどうかを判断する。
【0029】
一筆書き図形予測部333は、上記描画点の軌跡が上記第1又は第2の対称軸を通過した場合に、描画点が検出ゾーンを出てから上記第1又は第2の対称軸を通過するまでに描かれた描画点の軌跡の形状、つまり線対称図形の左右又は上下半分までの二等分図形の形状を識別する。そして、この識別された二等分図形の形状をもとに線対称図形の全体形状を復元し、この復元された線対称図形の全体形状を上記対称軸上記一筆書き図形蓄積部22に記憶された一筆書き図形モデルと照合することで、上記ジェスチャにより描かれた図形の種類を推測する。
【0030】
表示画面処理ユニット50は表示画面処理部51を有する。表示画面処理部51は以下の2つの表示処理機能を有する。
(1) 上記一筆書き図形の方向識別部322及び一筆書き図形識別部323によりそれぞれ識別されたジェスチャ図形の描画方向と図形の種類をもとに、操作内容データベース23から対応する操作内容を表す情報を読出す。そして、この読み出された操作内容を表す情報をもとに、表示画像・映像蓄積部24から対応する画像や映像の表示データを読出し、この表示データをもとにテレビジョン受信機2の表示画面を更新する処理。
(2) 上記一筆書き図形予測部333により推測された線対称図形を表す画像を生成し、この生成された線対称図形の画像をテレビジョン受信機2の表示画面に表示させる処理。
【0031】
なお、上記指の位置検出ユニット10、一筆書きジェスチャ認識処理ユニット30、リアルタイム処理発生ユニット40及び表示画面処理ユニット50の各処理機能は、図示しないプログラムメモリに格納されたアプリケーション・プログラムを中央処理ユニット(Central Processing Unit:CPU)に実行させることにより実現される。
【0032】
[動作]
次に、以上のように構成された情報処理装置3による、ジェスチャを用いた入力情報の認識動作を説明する。
図3は、その全体の処理手順と処理内容を示すフローチャートである。なお、ここではテレビジョン受信機2のディスプレイに電子番組案内(Electronic Program Guide:EPG)情報を表示させ、このEPG情報に対しユーザ1がジェスチャにより番組の選択操作を行う場合を例にとって説明する。
【0033】
(1)リアルタイムイベント発生処理
ジェスチャ入力モードが設定されると、ステップS10によりリアルタイム処理発生ユニット40が起動し、タイマの計時時間Tが予め設定された時間、例えば33msecになるごとにステップS11においてイベント信号が発生される。すなわち、ジェスチァ入力モードでは33msec周期でイベント信号が発生される。なお、タイマの計時時間Tはイベント信号が発生されるごとにステップS12でリセットされる。
【0034】
(2)カメラ画像の取得及び指位置の検出処理
上記リアルタイム処理発生ユニット40からイベント信号が発生されると、先ずステップS20において撮像画像取得ユニット10が起動し、そのカメラ画像取得部11の制御の下で、カメラ4により撮像されたユーザ1の画像データが取り込まれてカメラ画像蓄積部21に記憶される。
【0035】
そして、上記カメラ画像蓄積部21に新たな画像データが記憶されると、図4に示すステップS311において、上記画像データ中から発光マーカ5の輝点画像を検出する処理が行われる。そして、この検出された輝点画像の画像データ中の重心位置を示す座標が、ユーザ1の指の位置を表す描画点として指位置蓄積部25に記憶される。以上の処理は上記33msec周期で繰り返し行われ、この結果上記指位置蓄積部25にはユーザ1の指の位置を表す描画点の位置座標の集合が、ユーザ1がジェスチャにより描いた図形を示すデータとして記憶される。なお、このときカメラ4の絞り値(F値)を大きく設定して受光光量を制限することで、発光マーカ5の光のみを検出しやすくするとよい。
【0036】
(3)一筆書きジェスチャ認識機能のON/OFF切替処理
上記指位置蓄積部25に新たな指位置座標が記憶されるごとに、ステップS30のステップS31において一筆書きジェスチャ認識処理ユニット30の一筆書きジェスチャ認識機能ON/OFF切替部310が起動され、この一筆書きジェスチャ認識機能ON/OFF切替部310の制御の下で以下のような処理が実行される。図4中のステップS312はその処理手順と処理内容を示すフローチャートである。
【0037】
(3−1)一筆書きジェスチャ認識機能をONする場合
先ずステップS3121により一筆書きジェスチャ認識処理部320の機能がONであるか否かが判定される。そして、ここではまだONになっていないのでステップS3126に移行し、カメラ4による撮像範囲、つまりジェスチャの認識領域内に、ジェスチャの始点判定領域(ジェスチャ開始領域)を設定する。例えば図5(a)に示すように、ジェスチャの認識領域Cの中央にジェスチャ開始領域E1を設定する。そして、上記指位置検出処理(ステップS311)により検出された発光マーカ5の描画点の位置座標が上記ジェスチャ開始領域E1内に存在するか否かを判定する。
【0038】
この状態で、ユーザ1が指の位置を動かし、これにより図5(a)に示すように描画点の位置座標P0が破線L1に示すように上記ジェスチャ開始領域E1内に入ると、ステップS3127により上記一筆書きジェスチャ認識部320の機能をONに設定する。またそれと共に、ステップS3128により図5(b)に示すようにジェスチャの終点を検出するための検出ゾーン(Detection zone)E2を上記ジェスチャの認識領域C内に設定する。
【0039】
このとき、検出ゾーンE2のサイズはジェスチャ開始領域E1より大きなサイズに設定される。このようにすると、ユーザ1によるユーザの指の位置が検出ゾーンE2内に戻った後に、震えなどにより当該検出ゾーンE2の境界付近で位置ずれを起こしたとしても、このときの指の位置座標、つまり終点の位置を、終点判定領域としての検出ゾーンE2内に安定的に留めることが可能となる。このため、検出ゾーンE2の境界上でいわゆるチャタリングのような現象が発生しても、これにより後述する描画の終了判定(入力判定)において誤認識が発生しないようにすることができる。
【0040】
(3−2)一筆書きジェスチャ認識機能をOFFする場合
上記一筆書きジェスチャ認識機能がONとなった状態で、ユーザ1がジェスチャによるテレビジョン受信機2の操作を一旦中止するべく、指の位置を例えば図6(a)のL2に示すようにカメラ4の撮像範囲外、つまりジェスチャの認識領域Cの外へ移動させたとする。そうすると、一筆書きジェスチャ認識機能ON/OFF切替部310は、ステップS3121により一筆書きジェスチャ認識処理部320の機能がONであるか否かを判定し、ここではONになっているのでステップS3122に移行する。そして、指位置検出処理(ステップS311)により検出された発光マーカ5の描画点の位置座標が、上記ジェスチャの認識領域Cの外に出たか否かを判定する。
【0041】
この判定の結果、図6(a)の破線L2に示すように、発光マーカ5の描画点の位置座標が上記ジェスチャの認識領域Cの外に出ると、ステップS3123により一筆書きジェスチャ認識処理部320の機能をOFFに遷移させる。かくして、ユーザ1は指の位置をカメラ4の撮像範囲外へ移動させるだけで、一筆書きジェスチャ認識機能をOFFに戻すことが可能となる。
【0042】
なお、一筆書きジェスチャ認識機能がOFFに復帰すると、次のイベント信号発生(33msec)時に、ステップS3125において図6(b)に示すようにジェスチャの認識領域C内にジェスチャ開始領域E1が設定される。すなわち、一筆書きジェスチャ認識機能がOFFになると、消去された検出ゾーンE2の代わりにそれよりも小さいジェスチャ開始領域E1が再設定される。
【0043】
(4)一筆書きジェスチャ認識処理
上記一筆書きジェスチャ認識機能がONとなった状態で、一筆書きジェスチャ認識処理部320は以下のようにジェスチャの認識処理を実行する。図7はその全体の処理手順と処理内容を示すフローチャートである。
【0044】
すなわち、先ずステップS321において一筆書きジェスチャ入力判断部321が起動し、この一筆書きジェスチャ入力判断部321の制御の下で、ユーザ1の指に装着された発光マーカ5による描画点が上記検出ゾーンE2内に入ったか否かをステップS3211により判定する。そして、描画点が上記検出ゾーンE2内に入っていなければ、ステップS3214によりジェスチャ入力中か否かを示すジェスチャフラグ(Gesture Flag)を“TRUE”に設定し、以後イベントが発生するごとに描画点が検出ゾーンE2内に入るか否かを監視する処理を繰り返す。
【0045】
(4−1)一筆書き図形の方向識別処理
さて、この状態でユーザ1の指に装着された発光マーカ5による描画点が上記検出ゾーンE2内に入ったことが検出されたとする。そうすると、ステップS3212によりジェスチャフラグが“TRUE”になっていることを確認した後、先ずステップS322により一筆書き図形の方向識別処理を実行する。
【0046】
この一筆書き図形の方向識別処理は以下のように行われる。すなわち、先ず指位置蓄積部25に記憶された指位置座標の集合を読み出し、この指位置座標の集合により表される指の描画軌跡を表す画像をもとに当該描画軌跡を表す画像の重心位置座標を算出する。そして、この算出された描画軌跡画像の重心位置座標と描画開始点における座標との関係から、当該描画開始点に対する上記描画軌跡の描画方向が上下左右の何れであるかを識別することにより行われる。
【0047】
(4−2)一筆書き図形識別処理
次にステップS323により一筆書き図形識別処理を実行する。この一筆書き図形識別処理は、指位置蓄積部25に記憶された指位置座標、つまり描画点の位置情報の集合を読み出し、この描画点の位置座標の集合により表される指の軌跡、つまりジェスチャにより描かれた図形の形状を、一筆書き図形蓄積部22に記憶された一筆書き図形モデルと照合することで識別する。
そして、上記ジェスチャにより描かれた図形の描画方向及び図形形状の識別処理が終了すると、ステップS3213によりジェスチャフラグ(Gesture Flag)を“False”にリセットする。
【0048】
(5)表示画面の更新処理
上記一筆書きジェスチャの認識処理が終了すると、ステップS40において表示画像処理ユニット50が起動され、この表示画像処理ユニット50の制御の下で、表示画像の更新処理が以下のように行われる。
すなわち、上記一筆書き図形の方向識別部322及び一筆書き図形識別部323によりそれぞれ識別されたジェスチャ図形の描画方向及び図形の種類をもとに、操作内容データベース23から対応する操作内容を表す情報が読出される。そして、この読み出された操作内容を表す情報をもとに、表示画像・映像蓄積部24から対応する画像や映像の表示データが読出され、この表示データをもとにテレビジョン受信機2の表示画面が更新される。
【0049】
(6)線形図形予測処理
一方、上記一筆書きジェスチャ認識処理S32において描画点が検出ゾーンE2内に存在していないと判定された場合には、ユーザ1の指位置が検出ゾーンE2内にまだ到達していないと判断される。そして、この期間に、つまりユーザ1によるジェスチャ入力操作が行われている期間に、ステップS33により線対称図形予測部330が起動され、この線対称図形予測部330の制御の下で、上記ユーザ1がジェスチャにより描こうとしている線対称図形を予測する処理が以下のように実行される。図8はその処理手順と処理内容を示すフローチャートである。
【0050】
すなわち、先ずジェスチャ入力の開始直前において、指の位置を示す描画点の位置座標が検出ゾーンE1内に存在するか否かをステップS331により判定し、存在する場合にはステップS343によりジェスチャ認識領域中に対称軸の削除/作成判断領域を設定する。例えば、図9(a)又は図11(a)に示すように、ジェスチャ認識領域中の検出ゾーンE1を中心とする位置に十字型をなす所定の幅を有する対称軸作成判断領域DZを設定する。そして、ステップS344により、対称軸作成判断領域DZ内で直線を描いたか否かを示すフラグ(Line Flag)を初期化(FALSE)する。
【0051】
この状態で、ユーザ1が指を移動させ、その描画点が上記検出ゾーンDZ外に出ると、当該描画点が上記対称軸作成判断領域DZ内に存在しているか否かをステップS322により判定する。この判定の結果、描画点が上記対称軸作成判断領域DZ内に存在している場合には、続いて当該描画点の軌跡が上記対称軸作成判断領域DZ内でほぼ直線を描いているか否かをステップS333により判定する。そして、描画点の軌跡が上記対称軸作成判断領域DZ内でほぼ直線を描いていると判定された場合には、ステップS335において上記Line Flagを“TRUE”に設定し、直線を描いていないと判定された場合にはステップS334によりLine Flagを“FALSE”に維持する。
【0052】
一方、上記ステップS322において描画点が上記対称軸作成判断領域DZ内に存在していないと判定されると、ステップS336によりSymmetry Axis Flagを“TRUE”に設定したのち、ステップS337においてLine Flag=TRUEであるか否かを判定する。そして、この判定の結果Line Flag=TRUEでなければ、描画点の軌跡は上記対称軸作成判断領域DZ内で直線を描いていないので、ステップS338により上記対称軸作成判断領域DZの設定を解除し、代わりにステップS339において「対称軸1」を設定する。この対称軸1は、例えば図9(b)に示すように検出ゾーンE1の中心を通る水平軸Hと垂直軸Vとからなる。
【0053】
これに対し、Line Flag=TRUEであれば、描画点の軌跡は上記対称軸作成判断領域DZ内で直線を描いているので、ステップS340により上記対称軸作成判断領域DZの設定を解除し、代わりにステップS341において「対称軸2」を設定する。この対称軸2としては、この場合の描画点の軌跡は垂直方向に移動しているので、例えば図11(b)に示すように水平軸Iが設定される。
【0054】
この状態で線対称図形予測部330は、ステップS342において対称軸通過判断部332を起動し、この対称軸通過判断部332により、描画点の軌跡が上記対称軸1又は対称軸2を通過したか否かを判定する。そして、まだ通過していなければそのまま監視を継続する。これに対し、描画点が対称軸1又は対称軸2を通過したことが検出されると、ステップS343により一筆書き図形予測部333を起動し、この一筆書き図形予測部333の制御の下で一筆書き図形予測処理を実行する。
【0055】
例えば、いま図9(c)に示すように描画点の軌跡L2が対称軸1の垂直軸Vを通過したとすると、描画点が検出ゾーンE1内のP0を出発して上記対称軸1の垂直軸VをP2で通過するまでに描かれた描画軌跡L2の形状、つまりユーザ1が描こうとする線対称図形の左半分の形状を識別する。そして、この識別された左半分の形状をもとに、図9(d)のL3に示すような線対称図形の全体形状を復元する。次に、この復元された線対称図形の全体形状L3を一筆書き図形蓄積部22に記憶された一筆書き図形モデルと照合することで、上記ジェスチャにより一筆書きで描かれた線対称図形の種類を推測する。図10(a)〜(d)は、この「対称軸1」を用いた図形予測処理により認識可能な図形の一例を示すものである。
【0056】
一方、いま図11(b)に示すように直線を描いた描画点の軌跡L1が、反転してP1を経て上記対称軸2の水平軸Iを図11(c)に示すようにP2で通過したとする。そうすると、ジェスチャ開始点P0を出発してから点P1を経由して水平軸Iとの交差点P2に至るまでの描画軌跡L2の形状を識別する。そして、この識別された形状のうち上記水平軸Iより上側の図形の形状をもとに、図11(d)のL2に示すような線対称図形の全体形状を復元する。次に、この復元された線対称図形の全体形状L2を一筆書き図形蓄積部22に記憶された一筆書き図形モデルと照合することで、上記ジェスチャにより一筆書きで描かれた線対称図形の種類を推測する。図12(a)〜(d)は、この「対称軸2」を用いた図形予測処理により認識可能な図形の一例を示すもので、左右対称の図形群と、上下対称の図形群をそれぞれ示している。
【0057】
そうして上記一筆書きジェスチャ図形の予測処理が終了すると、ステップS40において表示画像処理ユニット50が起動され、この表示画像処理ユニット50の制御の下で、上記予測された図形の表示処理が以下のように行われる。すなわち、上記予測された図形の描画方向及び図形の種類を表す情報をもとに、操作内容データベース23から対応する操作内容を表す情報が読出される。そして、この読み出された操作内容を表す情報をもとに、表示画像・映像蓄積部24から対応する画像や映像の表示データが読出され、この表示データをもとにテレビジョン受信機2の表示画面が更新される。
【0058】
以上詳述したようにこの実施形態では、線対称図形予測部330を新たに備え、描画点がジェスチャ開始領域に入り検出ゾーンが設定された状態でジェスチャ認識領域中に対称軸作成判断領域を設定し、この状態で描画点の軌跡が当該対称軸作成判断領域内で直線を描いたか又は対称軸作成判断領域外で曲線を描いたかを判定して、対称軸1又は対称軸2を設定する。次に、上記描画点の軌跡が上記設定された第1又は第2の対称軸を通過したかどうかを判定し、通過した場合に当該描画点が検出ゾーンを出てから上記第1又は第2の対称軸を通過するまでに描かれた描画軌跡の形状を識別する。そして、この識別された形状をもとに線対称図形の全体形状を復元し、この復元された線対称図形の全体形状からジェスチャにより描かれた図形の種類を推測し、その結果をもとに表示画面を更新するようにしている。
【0059】
したがって、ジェスチャ入力期間中において、描画途中の描画点の軌跡からユーザ1がジェスチャにより一筆書きで描こうとしている線対称の図形が推測され、ユーザ1に提示される。このため、ジェスチャによる入力操作を開始してからその入力図形が認識されるまでの時間が短縮され、これによりジェスチャ入力の応答性が向上する。また、ユーザ1はジェスチャ入力期間中に、自身の入力途中の図形を確認することができるようになり、これにより入力操作の不安が軽減される。
【0060】
また、描画軌跡が対称軸作成判断領域DZ内で直線状に描かれたか、又は対称軸作成判断領域DZ外に出て非直線状に描かれたかを判定し、その判定結果に応じて対称軸1と対称軸2を選択的に設定するようにしている。このため、ユーザ1が検出ゾーンから垂直方向又は水平方向に直線状に指を動かした場合でも、また方向を問わず非直線状に指を動かした場合でも、これらの動きをそれぞれ的確に検出することが可能となる。
【0061】
なお、この発明は上記実施形態に限定されるものではない。例えば、前記実施形態では本発明に係るジェスチャ認識装置の機能を情報処理装置に設けた場合を例に説明したが、同機能をテレビジョン受信機に設けてもよいし、セットトップボックスやビデオレーダなどに設けてもよい。その他、ジェスチャ認識装置の種類や構成、処理手順と処理内容などについても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
【0062】
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
【符号の説明】
【0063】
1…ユーザ、2…テレビジョン受信機、3…情報処理装置、4…カメラ、5…発光マーカ、10…撮像画像取得ユニット、11…カメラ画像取得部、20…データベース、21…カメラ画像蓄積部、22…一筆書き図形蓄積部、23…操作内容データベース、24…表示画像・映像蓄積部、25…指位置蓄積部、30…一筆書きジェスチャ認識処理ユニット、310…一筆書きジェスチャ認識機能ON/OFF切替部、311…指位置検出部、312…一筆書きジェスチャ認識機能ON/OFF判断・切替部、320…一筆書きジェスチャ認識処理部、321…一筆書きジェスチャ入力判断部、322…一筆書き図形の方向識別部、323…一筆書き図形識別部、330…線対称図形予測部、331…対称軸ON/OFF部、332…対称軸通過判断部、333…一筆書き図形予測部、40…リアルタイム処理発生ユニット、50…表示画面処理ユニット、51…表示画面処理部。

【特許請求の範囲】
【請求項1】
ユーザがジェスチャにより空間に図形を描く動きを撮像してその画像データを出力する撮像装置と、前記撮像装置から出力された画像データをもとに前記ジェスチャにより一筆書きで描かれた線対称の図形を認識するジェスチャ認識装置とを具備するシステムで使用される前記ジェスチャ認識装置であって、
前記撮像装置から出力された画像データを所定の周期で取り込む手段と、
前記画像データが取り込まれるごとに当該画像データから前記ジェスチャによる描画点の位置情報を検出し、この検出された描画点の位置情報を記憶手段に格納する手段と、
前記検出された描画点の位置情報が、予め設定された終始点入力判定領域外に出たのち当該終始点入力判定領域内に戻るまでのジェスチャ入力期間中に、前記記憶手段に格納された描画点の位置情報の集合をもとに描画途中の描画点の軌跡を検出し、この検出された描画軌跡に基づいて前記ユーザがジェスチャにより一筆書きで描こうとしている線対称の図形を推測する図形推測手段と、
前記推測された図形を前記ユーザに提示する手段と
を具備することを特徴とするジェスチャ認識装置。
【請求項2】
前記図形推測手段は、
予め設定されたジェスチャ認識領域内に対称軸作成判断領域を設定する手段と、
前記描画途中の描画点の軌跡が、前記設定された対称軸作成判断領域内に描かれているか又は対称軸作成判断領域外に描かれているかを判定する手段と、
前記描画点の軌跡が対称軸作成判断領域内に描かれていると判定された場合には当該対称軸作成判断領域に対し直交する第1の対称軸を設定し、前記描画点の軌跡が対称軸作成判断領域外に描かれていると判定された場合には当該対称軸作成判断領域に対し直交する軸と平行する軸とからなる第2の対称軸を設定する手段と、
前記描画点の軌跡が前記第1又は第2の対称軸を通過した場合に、前記検出された描画点が前記終始点入力判定領域外に出たのち当該第1又は第2の対称軸を通過するまでの当該描画点の軌跡の形状を識別し、この識別された描画点の軌跡の形状をもとにユーザがジェスチャにより一筆書きで描こうとしている線対称の図形を推測する手段と
を備えることを特徴とする請求項1記載のジェスチャ認識装置。
【請求項3】
請求項1又は請求項2に記載のジェスチャ認識装置が具備する各手段の処理をコンピュータに実行させるプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2013−80430(P2013−80430A)
【公開日】平成25年5月2日(2013.5.2)
【国際特許分類】
【出願番号】特願2011−221119(P2011−221119)
【出願日】平成23年10月5日(2011.10.5)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】