説明

ジェスチャー入力システム

【課題】ユーザへの肉体的負担の少ない肘より先の手先部分の動きを認識でき、実用に耐える文字入力機能を持ちかつ素早いジェスチャーに対応できるジェスチャーシステムを提供する。
【解決手段】ユーザ1の主に手2の動作を画像センサ3で撮像し、その撮像された映像に対し、リアルタイムに画像処理、認識を行い、その結果をテレビ、スマートフォン等のスクリーン4に表示することによって、ユーザ1が手2のジェスチャー動作によってテレビ等のデバイスを負荷なく簡単に操作できることを実現する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ジェスチャーによりテレビ、ゲーム、スマートフォンなどの機器を操作するユーザインタフェース技術に関する。
【背景技術】
【0002】
従来のジェスチャーシステムは、認識のための解像度があまり高くなく、手や指の動きを認識することが困難であった。そのため特許文献1に示すように、大きな動作即ち手全体(腕)や体全体の動き(ボディアクション)を基本にしている。そのため、1)ユーザへの肉体的負担が大きい。2)画面上の小さなオブジェクト(機械制御アイコン)を操作するのが困難である。などの問題があった。またフレームレートも低く(30〜60FPS)このために、ユーザの素早いジェスチャーに対応することが困難になり、これも使い勝手を悪くしている。
【0003】
リモコンシステムは、リモコンに装備されたボタンの操作によって命令を実行するために、多くのボタンが装備されているが、それら一つ一つの機能を十分理解し、正確に操作するのに時間がかかる。また、紛失した時や、汚れた手では使えないという問題もある。文字入力はさらに困難で、リモコンに小型のキーボードが付いたものもあるが、遠くにあるモニターを見ながら文字をスムーズに入力するためには、ブラインドタッチができることが求められる。
【0004】
スマートフォンのユーザインタフェースは、多くはタッチパネルベースとなっている。タッチパネルベースのユーザインタフェースの問題点は、指等でパネルに触れる際に、パネルに描かれたボタン、キー等のオブジェクトを指等が覆い隠すので、ユーザがオブジェクトの位置を正確に認識できないという問題がある。特に指の大きい大人或いは欧米人にとってはこれが問題になる場合が多い(いわゆるFat Finger Problem)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平10−31551号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
解決しようとする問題点は以上のような点であり、本発明は、ユーザへの肉体的負担の少ない肘より先の手先部分の動きを認識でき、実用に耐える文字入力機能を持ちかつ素早いジェスチャーに対応できるジェスチャーシステムを提供することを目的になされたものである。
【課題を解決するための手段】
【0007】
そのため本発明は、操作者の手及び指の動きを動画撮影する撮影手段と、操作対象機器の画面に操作パネルを表示する操作パネル表示手段と、撮影した手の動きに連動してポインターを動画表示するポインター表示手段とを備え、操作者の手及び指の動作を高速度・高解像度の画像センサで撮像し、その撮像された映像に対し、リアルタイムに画像処理、認識を行い、その結果と操作パネルを操作対象機器の画面に表示することによって、操作者が手及び指のジェスチャー動作によって操作対象機器を負荷なく簡単に操作できることを最も主要な特徴とする。
【発明の効果】
【0008】
本発明は、操作者の手及び指の動作を高速度・高解像度の画像センサで撮像するので、画面上の小さなオブジェクトも手、指の素早い動作に対応して正確にかつ素早く操作でき、ユーザに快適な使用感を提供する。素早い動作に対応することによって、他のジェスチャー、例えば動画中の移動しているオブジェクトを選択しそのオブジェクトに対して命令を実行できる。また肘から上の主に手、指のジェスチャー動作なのでユーザに負担がかからない。文字入力も両手で素早く快適に行える。
【図面の簡単な説明】
【0009】
【図1】本発明を実施したジェスチャー入力システムの構成図である。
【図2】高速画像演算処理のフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明の実施の形態について説明する。
【0011】
図1に、本発明を実施したジェスチャー入力システムの構成図を示す。
ジェスチャー入力システムは、ユーザ1の主に手2の動作を画像センサ3で撮像し、その撮像された映像に対し、リアルタイムに画像処理、認識を行い、その結果をテレビ、スマートフォン等のスクリーン4に表示することによって、ユーザ1が手2のジェスチャー動作によってテレビ等のデバイスを負荷なく簡単に操作できることを実現する。画像センサ3は、その中に高速画像演算プロセッサーが一体に組み込まれ、コンパクトにテレビ等の筐体に装着される。ジェスチャーは、手首より上の動作(指先及び指一本の動作を含む)でも可能で、高速画像演算プロセッサーはジェスチャー動作の手及び指等の形状を認識する。
【0012】
本ジェスチャーシステムでは、ジェスチャーの際の人間の手2、指の素早い動きを十分正確にとらえるため従来この分野で使われていない100FPS以上の高速かつ、640×480以上の高解像度の画像センサ3を採用し手2、及び指のジェスチャー動作を、素早く、正確に認識し、従来にない快適なユーザインタフェースを、TV、ゲーム機器等に提供するものである。
【0013】
ユーザ1に快適なユーザインタフェースを実現するため、従来のシステムに見られる、片手での操作だけではなく、両手を使ったジェスチャーも提供する。
【0014】
本ジェスチャーシステムでは、画面上に1〜2のポインター(ハンドアイコン)を表示し、そのポインターを両手の指を使った簡単なジェスチャー操作を実行することにより、様々な操作、例えば視聴したいプログラムの検索及び選択(テレビのチャネル切り替え、番組表から視聴したい番組の選択等に相当)、スクリーンに複数のウィンドウの表示、移動、そのウィンドウを両手或いは片手を使って大きさの変更、画面上に表示された仮想キーボードに対して2つのポインターを指で操作することにより文字入力する、コマンドを指定する、などを実現できるように設計されている。
【0015】
ユーザ1は、両腕の肘より先の手2指の操作だけでジェスチャーを実現するので、テレビのような日常頻繁に行う操作でも疲労なく継続的に操作をすることができる。
【0016】
テレビ等の大きなスクリーン5を持った、両手2の指の全部又は一部を使ったジェスチャー操作が適した場合に、その文字入力の際に使われるキーボードは、その手2の自然な動きに対応したキー配列とデザインを持つ。
【0017】
ジェスチャーのタップ操作(キーボードのキーが押されたり、メニュー上のボタンが押された状況を実現する動作)を高速にかつ安定して実現するために、手2操作の位置、移動情報に加え、その速度、加速度を認識に利用する。
【0018】
画像センサから得られる手指に関する複数の適切な特徴量を使って手2、指の認識を行う。
【0019】
スマートフォンの場合、機器背面の振動素子による触覚フィードバックを行う。
【0020】
指、手2の対象機器との前後の動きによってズーミングを実現、3次元映像の作画を行えるようにする。
【0021】
図2に、高速画像演算処理のフローチャートを示す。
高速画像演算処理は、まず、センサーの環境パラメータの設定(パラメータは環境の変化によって随時調整)を行い(ステップ1)、次に、画像の取り込みを行い(ステップ2)、次に、ジェスチャー動作をする手、指の位置、形状等を複数フレームに亘ってその形状、動作速度、色情報を総合的に判断し、同定する(ステップ3)。次に、同定した手、指の属性・特徴量(特徴的な手、指の部位の位置、大きさ、形状、動作速度等)の抽出と計算を行い(ステップ4)、次に、同定した手の属性・特徴量から、ジェスチャー操作を認識し、システム(OS)に提供し(ステップ5)、次に、システムプログラム、アプリケーションプログラムがジェスチャー操作情報を、システム(OS)から入手し、ジェスチャーUI(ユーザインタフェース)を実現する(ステップ6)。
【0022】
すなわち、ジェスチャーサブシステムで、ユーザのジェスチャー動作を動画として取り込み、そこでの画像処理、ジェスチャー認識処理を経て、手、指の形状、相対的移動量、速度加速度等を計測し、それらのデータからジェスチャー動作の意味を認識する処理を行いそれから、画像上のポインターの位置、移動量、ポインターその時点でのステート(状態とその意味、状態の変化を指し示すデータ等)を作成し、データセットとして、TV側システムに提供し、ジェスチャーによるユーザインタフェースシステムを実現する。
【0023】
以上のような構成で、ユーザが手を任意に素早く振るとジェスチャーシステムはその画像中の手とその動きを認識して、ジェスチャー認識をスタートする。この際に肘より先の手先部分を動かす操作で、スクリーン上のすべてのポイントを操作できるように、図1の点線で示す腕の捜査範囲とスクリーン画面をマッチングさせるためのキャリブレーションを行う。
【0024】
文字入力は、両手の指の操作によって実現し、画面上にジェスチャー文字入力に最適化された仮想キーボードを表示し、そこに描かれたキーを両手の指で2つのポインターを操作することによって実現する。キーを選択押すジェスチャーは、指の姿勢、動き、速度、加速度を素早く正確に認識することによって実現する。
【0025】
また、手、指の姿勢、その指の手全体の動きに対する相対的な動き、速度、加速度を測定、認識して、タップ、ドラッグ、フリック等を認識する。
【0026】
本ジェスチャーシステムは、例えばスマートフォンにおいて、指の3次元位置を使って画面上の3次元映像の描画機能を提供する。さらに指やこの場合は目の3次元位置を視点と定義して、画面上に3次元映像を表現しその指、目が3次元で定義する視点に応じて3次元映像を提供する機能を提供する。例えばこれはマップ等のストリートビューのコントロールする機能の提供をする。
【0027】
また、ジェスチャーシステムの動作環境(リビングルーム等)で、誤動作が発生する可能性がある環境状態になった場合その誤動作の原因(以降障害物と呼ぶ。例えば非常に強い光源の存在、部屋全体の不適切な照度等)となるものをユーザに示唆し、それを取り除く、問題を解消してもらうために、映像情報をスクリーン上の一つのウィンドウに表示し、その障害物の存在をユーザに認識させ、取り除くことを可能にするための機能を提供する。
【0028】
なお、手、指の位置、動き、加速度、形状の認識は、手の色情報、色の勾配情報等から使った輪郭データとそのフレーム毎の変化を計算し、さらに手の形状のモデルとの比較をすることにより、手、指の位置、動き、加速度、形状の認識をする。
【符号の説明】
【0029】
1 ユーザ
2 手
3 画像センサ
4 スクリーン

【特許請求の範囲】
【請求項1】
操作者の手及び指の動きを動画撮影する撮影手段と、
操作対象機器の画面に操作パネルを表示する操作パネル表示手段と、
撮影した手の動きに連動してポインターを動画表示するポインター表示手段と、
を備え、
操作者の手及び指の動作を高速度・高解像度の画像センサで撮像し、その撮像された映像に対し、リアルタイムに画像処理、認識を行い、その結果と操作パネルを操作対象機器の画面に表示することによって、操作者が手及び指のジェスチャー動作によって操作対象機器を負荷なく簡単に操作できることを特徴とするジェスチャー入力システム。
【請求項2】
前記ポインターが操作者の手及び指の動きを適切に連想させる形状であることを特徴とする請求項1記載のジェスチャー入力システム。
【請求項3】
前記ジェスチャー動作が両手操作を含むことを特徴とする請求項1記載のジェスチャー入力システム。
【請求項4】
前記画面制御がテレビのチャネル切替え、音量調整、番組検索及び番組選択、テレビ画面に表示された複数のウィンドウの移動、リサイジング等の基本動作及びテレビ上のオンラインショッピングのための動画に含まれる静止あるいは動いている物品の選択操作、ソーシャルネットワークアプリケーション等のテレビを介したコミュニケーションに使われる文字入力、番組検索等のための文字入力、視聴者の意見を収集するための投票のための操作、を含むことを特徴とする請求項1記載のジェスチャー入力システム。
【請求項5】
前記ジェスチャーの動作によって画面表示する操作パネルが選択されることを特徴とする請求項1記載のジェスチャー入力システム。
【請求項6】
前記ジェスチャー動作が
画面や、スクロールバーを慣性を持たせスクロールさせるフリック操作、
画面の表示ウィンドウを移動させるドラッグ操作、
画面表示を拡大・縮小させるピンチ操作、
画面上のボタンを押してキー入力するタップ操作、
画面上のレバーを移動させるスライド操作、
画面上のボリュームを回転させる回転操作、
画面上のメニューを検索する検索操作、
画面上に表示された、静止及び動いているオブジェクトを選択する操作
文字入力のための画面上のキーボードの両手・両指での操作
のいずれかを含むことを特徴とする請求項1記載のジェスチャー入力システム。

【図1】
image rotate

【図2】
image rotate


【公開番号】特開2013−114647(P2013−114647A)
【公開日】平成25年6月10日(2013.6.10)
【国際特許分類】
【出願番号】特願2011−263363(P2011−263363)
【出願日】平成23年12月1日(2011.12.1)
【出願人】(511292161)株式会社エクスビジョン (1)
【Fターム(参考)】