説明

映像表示装置及びそれを用いた映像領域選択方法

【課題】映像中の形状領域に対する処理をリアルタイムで実行する。
【解決手段】一つの実施形態によれば、映像表示装置は、撮像部、ジェスチャ認識部、映像生成部、及び表示部を有し、操作者が提示する両手の手形状によって表示画面の映像処理の指示が与えられる。撮像部は操作者の手を含む映像を撮像する。ジェスチャ認識部は、撮像された操作者の映像から認識対象として1種類以上の前記両手の手形状を認識し、操作者の提示する両手の手形状から構成される第1の形状領域と表示画面を対比して第1の形状領域を表示画面座標における第2の形状領域として認識する。映像生成部は表示画面に表示される第2の形状領域の映像を強調処理する。表示部は強調処理された第2の形状領域の映像を表示画面に表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、映像表示装置及びそれを用いた映像領域選択方法に関する。
【背景技術】
【0002】
映像表示装置に表示される映像コンテンツやGUI(graphical user interface)を操作するジェスチャ認識装置には、指差し動作によって映像表示装置上の単一オブジェクトを選択するもの、或いは手指の一連の動作によって複数のオブジェクトを選択するものなどが多数知られている。
【0003】
指差し動作によって単一オブジェクトを選択する場合、操作者(ユーザ)が注目する座標を点で指定するのでGUIのアイコンをクリックする操作には好適であるが、映像の特定領域を任意に選択することは困難であるという問題点がある。手指の一連の動作によって複数のオブジェクトを選択する場合、ジェスチャ認識装置は操作者が提示するジェスチャの一連の映像を解析する必要がある。このため、操作者が一連の動作を終了してから初めて操作内容が映像表示装置に反映されるので、操作者による操作の開始から終了までのタイムラグが発生するという問題点がある。また、映像の特定領域を選択しながら、選択された特定領域を移動、拡大、縮小、或いは回転などの編集処理を実行することが困難であるという問題点がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−78977号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、映像中の形状領域に対する処理をリアルタイムで実行できる映像表示装置及びそれを用いた映像領域選択方法を提供することにある。
【課題を解決するための手段】
【0006】
一つの実施形態によれば、映像表示装置は、撮像部、ジェスチャ認識部、映像生成部、及び表示部を有し、操作者が提示する両手の手形状によって表示画面の映像処理の指示が与えられる。撮像部は操作者の手を含む映像を撮像する。ジェスチャ認識部は、撮像された操作者の映像から認識対象として1種類以上の前記両手の手形状を認識し、操作者の提示する両手の手形状から構成される第1の形状領域と表示画面を対比して第1の形状領域を表示画面座標における第2の形状領域として認識する。映像生成部は表示画面に表示される第2の形状領域の映像を強調処理する。表示部は強調処理された第2の形状領域の映像を表示画面に表示する。
【0007】
他の実施形態によれば、映像表示装置を用いた映像領域選択方法は、表示部、撮像部、ジェスチャ認識部、及び映像生成部を有する映像表示装置において、操作者が提示する両手の手形状によって前記表示部の表示画面の映像領域選択が第1乃至4の工程で行われる。第1の工程では操作者の手を含む映像が撮像される。第2の工程では操作者の右手で形成される第1のL字型ジェスチャと第1のL字型ジェスチャに対して対角をなす左手で形成される第2のL字型ジェスチャから構成される撮像映像が第1の矩形領域として認識される。第3の工程では第1の矩形領域と表示画面を対比して第1の矩形領域を表示画面座標における第2の矩形領域として認識され、第2の矩形領域が表示画面に対して平行或いは垂直に配置される。第4の工程では表示画面に表示される第2の矩形領域の映像が強調表示される。
【図面の簡単な説明】
【0008】
【図1】第1の実施形態に係る映像表示装置の構成を示すブロック図である。
【図2】第1の実施形態に係るジェスチャ認識部の構成を示すブロック図である。
【図3】第1の実施形態に係るジェスチャ判別方法を説明する動作フローである。
【図4】第1の実施形態に係るトリガ動作の一例を示す図である。
【図5】第1の実施形態に係る矩形の映像領域選択方法を説明する動作フローである。
【図6】変形例の映像表示装置の構成を示すブロック図である。
【図7】第2の実施形態に係る映像表示装置の構成を示すブロック図である。
【図8】第2の実施形態に係る矩形映像領域の編集処理方法を説明する動作フローである。
【図9】第2の実施形態に係る選択された矩形映像領域の境界強調処理示す図である。
【図10】第3の実施形態に係る映像表示装置の構成を示すブロック図である。
【図11】第4の実施形態に係る表示画面レイアウトを説明するブロック図である。
【発明を実施するための形態】
【0009】
以下本発明の実施形態について図面を参照しながら説明する。
【0010】
(第1の実施形態)
まず、本発明の第1の実施形態に係る映像表示装置及びそれを用いた映像領域選択方法について、図面を参照して説明する。図1は映像表示装置の構成を示すブロック図である。図2はジェスチャ認識部の構成を示すブロック図である。本実施形態では、操作者(ユーザ)の両手でそれぞれ形成されるL字型ジェスチャから構成される第1の矩形領域を映像表示装置が認識し、第1の矩形領域と表示画面を対比して第1の矩形領域を表示画面座標における第2の矩形領域として映像表示装置が認識し、表示画面に表示される第2の矩形領域の映像が強調表示される。
【0011】
図1に示すように、映像表示装置90には、ジェスチャ認識部1、映像生成部2、映像復号部3、映像信号発生部4、表示部5、撮像部6、及び撮像部7が設けられる。ここでは、映像表示装置90はデジタルTVに適用しているが、DVDレコーダなどのデジタル家電、アミューズメント機器、デジタルサイネージ、携帯端末、車載機器、超音波診断装置、電子ペーパ、パソコンなどに適用することができる。
【0012】
映像表示装置90では、操作者(ユーザ)の提示する両手の手形状や両手の動きによって表示部5に表示される表示画面51の映像処理の指示が与えられる。例えば、図1に示すように、操作者の右手13の親指と人差し指で形成される第1のL字型ジェスチャと第1のL字型ジェスチャと対角をなす操作者の左手14の親指と人差し指で形成される第2のL字型ジェスチャから矩形領域11(第1の形状領域)が提示される。提示された矩形領域11に対応する表示画面51の矩形領域12(第2の形状領域)が認識される。認識された矩形領域12の映像が強調表示される(詳細は後述する)。矩形領域11及び矩形領域12は、長方形或いは正方形をなす。
【0013】
ここでは、L字型ジェスチャを用いているが必ずしもこれに限定されるものではない。例えば、両手の人差し指を提示してそれぞれの指先を矩形の2頂点とする方式などを用いてもよい。映像とは、静止画像或いは動画像のことを言う。
【0014】
映像信号発生部4は、記憶部或いは放送信号受信機からなる。記憶部の場合、記憶される映像情報が映像信号である信号SG11として映像復号部3に出力される。放送信号受信機の場合、受信された映像情報が映像信号である信号SG11として映像復号部3に出力される。
【0015】
映像復号部3は、映像信号発生部4と映像生成部2の間に設けられる。映像復号部3は、映像信号発生部4から出力される信号SG11が入力され、復号映像信号である信号SG12を映像生成部2に出力する。
【0016】
撮像部6は、表示部5の上端に配置される。撮像部7は、撮像部6と間隔Lだけ離間して表示部5の上端に配置される。撮像部6及び撮像部7は表示部5の表示側前方の操作者(ユーザ)を認識し、手、指を含む映像及びその動きを撮像する。間隔Lは、撮像される映像の視差から操作者の手の3次元位置と姿勢を推定するのに十分なだけの距離に設定される。撮像部6及び撮像部7を設けることにより、操作者の手、指を含む映像情報及び動きを3次元的に認識することが可能となる。ここでは、撮像部6及び撮像部7にビデオカメラを用いているが、代わりにwebカメラやVGAカメラなどを適用してもよい。
【0017】
ジェスチャ認識部1は、撮像部6及び撮像部7と映像生成部2の間に設けられる。図2に示すように、ジェスチャ認識部1には、フレームバッファ21、手領域検出部22、指位置検出部23、形状決定部24、記憶部25、及び座標変換部26が設けられる。
【0018】
フレームバッファ21は、撮像部6及び撮像部7と手領域検出部22の間に設けられる。フレームバッファ21は、撮像部6から出力される撮像情報信号である信号SG1と撮像部7から出力される撮像情報信号である信号SG2が入力される。フレームバッファ21は、信号SG1と信号SG2から操作者の映像情報を抽出する。
【0019】
手領域検出部22は、フレームバッファ21と指位置検出部23の間に設けられる。手領域検出部22は、操作者の映像情報信号である信号SG21が入力され、操作者の映像情報から操作者の両手に対応する映像情報を抽出する。
【0020】
指位置検出部23は、手領域検出部22と形状決定部24の間に設けられる。指位置検出部23は、両手の映像情報信号である信号SG22が入力され、両手の映像情報から右手の指及び左手の指に対応する映像情報を抽出する。
【0021】
形状決定部24は、指位置検出部23と座標変換部26の間に設けられ、記憶部25に記憶される手及び指から構成される1種類以上のジェスチャ情報が入力される。形状決定部24は、両手の指の映像情報信号である信号SG23が入力され、両手の指の映像情報から両手の指から構成される形状領域を推定し、予め記憶部25に記憶されるジェスチャ形状と比較し、一致する場合はその形状領域を認定する。また、一連の両手の指の動画像情報から予め記憶部25に記憶されるジェスチャ動作と比較し、一致する場合はその動作を認定する。
【0022】
また、認定されなかった形状領域情報やジェスチャ動作は、記憶部25に適宜格納される。認定されなかった形状領域情報やジェスチャ動作は、両手の指から構成される形状領域との比較に適宜使用される。
【0023】
座標変換部26は、形状決定部24と映像生成部2の間に設けられる。座標変換部26は、形状決定部24で決定されたジェスチャ形状やジェスチャ動作であって、表示画面5から手までの距離情報信号が含まれる信号SG24が入力される。座標変換部26は、ジェスチャ形状の場合、両手の指で形成される矩形領域11と表示画面51を対比して表示画面座標における矩形領域12として認識し、また他のジェスチャ形状から矩形領域12を活性化する。活性化とは次のジェスチャ動作を可能化するものである。ジェスチャ動作の場合、両手の指で形成される矩形領域11の動きを表示画面51の表示画面座標における動きとして認識する。矩形領域11の動きとしては、例えば、両手の指から形成される形状を固定したままの移動、両手の指から形成される形状間隔の変化や回転などがある。ジェスチャ動作の認識方法として、時系列パターンと入力パターンのマッチング(認識)するCDP(continuous dynamic programming)法やDP(dynamic programming)法などがある。
【0024】
映像生成部2は、ジェスチャ認識部1の座標変換部26及び映像復号部3と表示部5の間に設けられる。映像生成部2は、映像復号部3から出力される映像復号信号である信号SG12と座標変換部26から出力される座標変換情報である信号SG3が入力される。
【0025】
映像生成部2は、信号SG12が入力され、信号SG3が入力されない場合、映像復号情報信号である信号S4を表示部5に出力する。表示部5では映像復号情報信号である信号S4に基づいて1フレーム毎の映像が表示される。映像生成部2は、復号された映像が表示画面51に表示され、信号SG3が入力される場合、信号SG3に基づいて表示画面51に矩形領域12の映像が強調表示される。或いは信号SG3に基づいて編集処理された矩形領域12の映像が表示される。矩形領域12は、例えば表示画面51に対して水平或いは垂直に配置される。
【0026】
次に、ジェスチャ判別方法について図3及び図4を参照して説明する。図3はジェスチャ判別方法を説明する動作フローである。図3では、ステップS1において事前処理が実行され、ステップS2乃至5において位置判別が実行され、ステップS6乃至8において手、指動作判別が実行される。
【0027】
図3に示すように、ジェスチャ判別はフレームバッファ21に入力される操作者(ユーザ)の映像情報での手に対応する映像領域を、例えば背景差分、色に基づく領域抽出などの処理を行う(ステップS1)。
【0028】
次に、手領域の幾何学的特徴に基づいて手の3次元位置と姿勢を推定する。この場合、事前にカメラキャリブレーション手法を用いてカメラパラメータを算出しておく(ステップS2)。
【0029】
そして、投影中心から手の3次元位置への方向ベクトルを決定する(ステップS3)。
【0030】
次に、手、指の3次元姿勢を元にRoll、Pitch、Yawの回転角度を算出する。RollのほかにPitch、Yawの回転角度を利用することにより、例えば図4に示す種々のジェスチャ動作判別に対応することが可能となる(ステップS4)。
【0031】
続いて、例えばバックプロパゲーション法を用いて両手の動作判別を行う(ステップS5)。
【0032】
そして、正規化処理を実行する。具体的には、手、指領域が画像中央になるように平行移動及び回転して、アスペクト比が1になるように拡大或いは縮小処理を実行する(ステップS6)。
【0033】
次に、平滑化、間引き処理などにより画像の簡略化処理を実行する。正規化処理や画像の簡素化処理を実行することにより、画像の情報量を削減できCPU(central processing unit)やプロセッサの容量を削減することができる。このため、ジェスチャ判別の迅速化、低コスト化が図られる(ステップS7)。
【0034】
続いて、手、指の形状判別を実行する。例えば、矩形領域の判別ではHough変換などを用いて親指と人差し指の角度を算出し、L字型ジェスチャであるかを判別する。判別された両手の手形状や両手の動きは、記憶データとの比較が行われ、一致するかどうかの判定が行われる。一致したものはジェスチャ判別情報として用いられる(ステップS8)。
【0035】
図4はトリガ動作の一例を示す図である。図4に示すように、ジェスチャ判別として使用されるトリガ動作の情報は、ジェスチャ認識部1の記憶部25に格納される。ここでは、代表例として動作モード1乃至11について説明する。
【0036】
動作モード1は矩形領域の設定である。手及び指の動作は、両手の親指と人差し指でそれぞれL字型ジェスチャを形成し、両手を対角線上に配置する。例えば、右手の親指を垂直方向に配置し、右手の人差し指を水平方向に配置する。左手の親指を水平方向に配置し、左手の人差し指を垂直方向に配置する。このモードのとき、表示画面51の矩形領域12は常にハイライト表示される(以降、この動作をジェスチャIとする)。
【0037】
動作モード2は矩形領域の選択(活性化)と境界強調である。ジェスチャIから両手の親指と人差し指をくっつけて離すという動作により、この矩形領域の映像が活性化され、この矩形領域の映像は編集処理動作が可能となる。選択された矩形領域は、例えば外周領域に太線枠が追加されることで境界強調される。
【0038】
動作モード3は選択領域の移動である。ジェスチャIの状態を保ちながら両手を移動することにより、選択(活性化)された矩形領域の映像を表示画面51上に移動(例えば、水平方向、垂直方向など)することが可能となる。
【0039】
動作モード4は選択領域の拡大である。ジェスチャIの状態を保ちながら両手の間隔を広げることにより、選択(活性化)された矩形領域の映像を表示画面51上に拡大表示することが可能となる。
【0040】
動作モード5は選択領域の縮小である。ジェスチャIの状態を保ちながら両手の間隔を狭めることにより、選択(活性化)された矩形領域の映像を表示画面51上に縮小表示することが可能となる。
【0041】
動作モード6は選択領域の回転である。ジェスチャIの状態を保ちながら両手を回転することにより、選択(活性化)された矩形領域の映像を表示画面51上に回転表示することが可能となる。
【0042】
動作モード7は選択状態の解除である。操作者が両手を合わせることにより、選択された形状領域の解除を行うことが可能となる。
【0043】
動作モード8は選択領域の消去である。操作者が両手で×印を形成することにより、選択(活性化)された形状領域の映像を消去することが可能となる。
【0044】
動作モード9はスナップショットの設定である。右手の親指と左手の親指を水平方向に配置及び接して、右手の人差し指、中指、薬指、及び小指を親指に対して90°開く。左手の人差し指、中指、薬指、及び小指を親指に対して90°開く。
【0045】
動作モード10はハイライト表示の切り出しである。操作者が両手の人差し指と中指でそれぞれ挟印を形成することにより、ハイライト表示された形状領域の映像を切り出すことが可能となる。
【0046】
動作モード11は三角形領域の設定である。右手の親指を水平方向に配置し、右手の人差し指、中指、薬指、及び小指を親指に対して60°開く。左手の親指を水平方向に配置し、あわせて右手の親指に対して一直線上に配置し、左手の人差し指、中指、薬指、及び小指を親指に対して60°開く。
【0047】
ここで説明した動作モードの手、指の動作は一例であり、必ずしもこれに限定されるものではない。例えば、矩形領域の設定には、親指と人差し指でL字型ジェスチャを形成しているが代わりに親指と他の4つの指でL字型ジェスチャを形成してもよい。
【0048】
このように両手で形成される種々の動作モードを予め記憶部25に格納することにより、複数人でデジタルTVなどの映像コンテンツを視聴中に、ある視聴者が映像中の特定の対象について他の視聴者に説明したいと考えた場合に、自分が注目している対象が映像中のどこに表示されているのかを正確に伝えることが可能となる。また、視聴者間のコミュニケーションが円滑化される効果が見込まれる。
【0049】
次に、矩形の映像領域選択方法について図5を参照して説明する。図5は矩形の映像領域選択方法を説明する動作フローである。
【0050】
図5に示すように、映像復号部3から出力される映像復号信号である信号SG12が、映像生成部2に入力されて1フレーム分の映像が表示画面51に表示された後、矩形提示の有無が確認される(ステップS11)。
【0051】
矩形提示信号である信号SG3がジェスチャ認識部1から提示されると、操作者の操作で形成される矩形領域11に対応する矩形領域12が表示画面51上に設定される。提示されない場合は、1フレーム分の映像が保持される(ステップS12)。
【0052】
次に、矩形領域12の映像は選択され(ステップS13)、表示画面51にハイライト表示される。ハイライト表示としては、例えば周囲よりも輝度を明るくする、或いはカラー映像の場合周囲の色調に対して矩形領域12の色調を変化させてコントラストを強調するなどがある(ステップS14)。
【0053】
上述したように、本実施形態の映像表示装置及びそれを用いた映像領域選択方法では、ジェスチャ認識部1、映像生成部2、映像復号部3、映像信号発生部4、表示部5、撮像部6、及び撮像部7が設けられる。操作者の提示する両手の手形状や両手の動きによって表示部5に表示される表示画面51の映像処理の指示が与えられる。
【0054】
このため、リモコン、キーボード、マウス、或いは画面上のアイコンなどの入力装置を用いることなく、表示画面51の矩形領域をリアルタイムに任意に選択表示することができる。
【0055】
なお、本実施形態では、映像部6及び7としてのカメラを2台設けているが必ずしもこれに限定されるものではない。3台以上のカメラを設けてもよい。また、変形例である図6に示す映像表示装置90aのように、撮像部6aにTOF(time of flight)カメラを用いてもよい。TOFカメラは距離センサとRGBカメラなどから構成され、操作者が提示する両手の手形状或いは両手の動きを3次元的に把握することができる。このため、映像部としてのTOFカメラは1台で対応することができる。
【0056】
(第2の実施形態)
次に、本発明の第2の実施形態に係る映像表示装置及びそれを用いた映像領域選択方法について、図面を参照して説明する。図7は映像表示装置の構成を示すブロック図である。本実施形態では、選択された矩形領域の映像が操作者の両手で形成されるジェスチャ動作により編集処理される。
【0057】
以下、第1の実施形態と同一構成部分には、同一符号を付してその部分の説明を省略し、異なる部分のみ説明する。
【0058】
図7に示すように、本実施形態の映像表示装置90は第1の実施形態と同一な構成を有する。本実施形態の映像表示装置90では、部分映像の編集や映像の編集などが実行される。
【0059】
映像表示装置90では、操作者の提示する両手の動作により矩形領域12aが選択される。選択された矩形領域12aの映像は拡大処理され、移動処理されて表示画面51に編集領域15aとして表示される。また、操作者の提示する両手の動作により表示画面51に形成される矩形領域12bが選択される。選択された矩形領域12bの映像は縮小処理され、移動処理されて表示画面51に編集領域15bとして表示される。
【0060】
次に、矩形領域の編集処理について図8及び9を参照して説明する。図8は矩形領域の編集処理方法を説明する動作フローである。図9は矩形映像領域の境界強調処理を示す図である。
【0061】
図8に示すように、矩形領域の編集処理では、ステップS11乃至ステップS15までは第1の実施形態と同様なので説明を省略する。
【0062】
選択され、映像表示された矩形領域の映像は選択の解除の有無が確認される(ステップS16)。
【0063】
次に、選択の解除が行われないと選択された矩形領域の編集処理の有無が確認される(ステップS17)。
【0064】
続いて、編集処理が確認されると、操作者が提示する両手の動き(例えば、図4に示す動作モード3乃至6のいずれか選択)に対応する編集処理が実行され、編集処理された矩形領域の映像が表示画面51に表示される(ステップS18)。
【0065】
そして、編集処理された矩形領域の映像と選択の解除が行われた矩形領域の映像は図示しない記憶部に登録される(ステップS19)。
【0066】
なお、矩形領域のハイライト表示として、図9に示すように、矩形領域12の外周領域に太線枠を追加した編集領域15cとする処理(境界強調処理)を実行してもよい。
【0067】
編集処理機能を利用することで、例えば、映像中で操作者(ユーザ)が注目している領域を表示画面の端に拡大表示や縮小表示するといった表示形式の変更操作を、リモコン、キーボード、マウス、或いは画面上のアイコンなどの入力装置を用いることなく実現できる。この編集操作は映像の再生と並行して実行できるため、操作者(ユーザ)は映像コンテンツの表示方法を、再生を一時停止する必要なくシームレスに行うことが可能となる。また、本機能は記憶部での映像再生時、放送波からの映像再生時を問わず利用可能である。
【0068】
ここでは、映像表示装置90上で映像コンテンツが再生されるデジタルTVを想定しているが、このような編集処理はデスクトップ画面やブラウザなどのGUIにも適用できる。例えば、提示矩形を拡大縮小することで、選択状態にあるウィンドウのサイズを変更、或いは矩形領域内にある複数のアイコンを選択した状態で提示矩形を移動すると、アイコンの集合をまとめて移動するといった操作が可能となる。
【0069】
上述したように、本実施形態の映像表示装置及びそれを用いた映像領域選択方法では、操作者の提示する両手の手形状や両手の動きによって矩形領域が選択され、選択された矩形領域の映像が編集処理される。
【0070】
このため、リモコン、キーボード、マウス、或いは画面上のアイコンなどの入力装置を用いることなく、表示画面51の矩形領域の映像を移動、拡大、縮小、或いは回転処理をリアルタイムで実行することができる。また、操作者による操作の開始から終了までのタイムラグを大幅に抑制することができる。
【0071】
(第3の実施形態)
次に、本発明の第3の実施形態に係る映像表示装置について、図面を参照して説明する。図10は映像表示装置の構成を示すブロック図である。本実施形態では、操作者の両手の提示に基づいて形成される矩形領域が切り出され、符号化されて記憶部に格納される。
【0072】
以下、第1の実施形態と同一構成部分には、同一符号を付してその部分の説明を省略し、異なる部分のみ説明する。
【0073】
図10に示すように、映像表示装置91には、ジェスチャ認識部1、映像生成部2、映像復号部3、映像信号発生部4、表示部5、撮像部6、撮像部7、切り出し部31、映像符号部32、及び記憶部33が設けられる。ここでは、映像表示装置91はデジタルTVに適用しているが、DVDレコーダなどのデジタル家電、アミューズメント機器、デジタルサイネージ、携帯端末、車載機器、超音波診断装置、電子ペーパ、パソコンなどに適用することができる。
【0074】
切り出し部31は、ジェスチャ認識部1及び映像復号部3と映像符号部32の間に設けられる。切り出し部31は、ジェスチャ認識部1から出力される信号SG21と映像復号部3から出力される信号SG22が入力される。切り出し部31は、ジェスチャ認識部1で認識された表示画面51上の矩形領域などの形状領域の映像情報を切り出す。切り出し部31は、映像復号部3で復号された映像情報を、例えば1フレーム分毎に切り出す。切り出し部31は、切り出しの開始や停止をトグルするトリガ動作を制御する。
【0075】
映像符号部32は、切り出し部31と記憶部33の間に設けられる。映像符号部32は、切り出し部31から出力される信号SG23が入力される。映像符号部32は、切り出し部31で切り出された映像情報を符号化する。
【0076】
記憶部33は、映像符号部32から出力される信号SG24が入力される。記憶部33は、映像符号部32で符号化された映像情報を格納する。
【0077】
映像表示装置91では、例えば、表示画面51内の注目する対象物(人物など)に向かって、操作者が両手で図4に示す動作モード1(矩形領域の設定)、動作モード2(矩形領域の選択)を提示すると選択された矩形領域が表示画面51にハイライト表示される。この状態で操作者が両手で図4に示す動作モード10(ハイライト表示⇒切り出し)を提示すると、映像表示装置91は切り出し状態に移行する。
【0078】
切り出し状態では表示画面51上の矩形領域をハイライトすると同時に、選択された矩形領域の映像が切り出し部31で切り出され、映像符号器32で符号化された上で記憶部33に格納される。操作者が両手で図4に示す動作モード3(選択領域の移動)を提示すると、それに従って切り出し部31で切り出される領域も動的に移動する。同様に、動作モード4(選択領域の拡大)、または動作モード5(選択領域の縮小)を提示すると、切り出される領域が広がる、または狭まる。
【0079】
なお、動作モード3を提示しても切り出し領域を移動させたくない場合、切り出し領域が動的に変化するモードと固定されるモードを用意して、両者を切り替える動作モードを新たに追加してもよい。
【0080】
切り出し部31を設けることにより、映像中で操作者(ユーザ)が注目している対象のみを切り出す映像編集処理が実現できる。操作者が提示する矩形を移動させることで、切り出す領域も移動することができるため、注目している対象が表示画面内を移動していても切り出しが可能である。この編集作業においては、映像を止めたり巻き戻したりする作業が不要であるため、映像信号発生部4に格納される映像をオフラインで処理するのみでなく、放送波の映像をオンラインで処理することもできる。
【0081】
上述したように、本実施形態の映像表示装置では、ジェスチャ認識部1、映像生成部2、映像復号部3、映像信号発生部4、表示部5、撮像部6、撮像部7、切り出し部31、映像符号部32、及び記憶部33が設けられる。切り出し部31はジェスチャ認識部1で認識された表示画面51上の矩形領域の映像情報を切り出す。映像符号部32は切り出された矩形領域の映像情報を符号化する。記憶部33は符号化された矩形領域の映像情報を格納する。
【0082】
このため、操作者が注目している矩形領域のみ切り出して映像編集処理を容易に実行することができる。
【0083】
(第4の実施形態)
次に、本発明の第4の実施形態に係る映像表示装置について、図面を参照して説明する。図11は表示画面レイアウトを説明するブロック図である。本実施形態では、操作者の両手で形成される提示形状に基づいて表示画面上にスナップショット表示領域が設けられる。
【0084】
本実施形態では、映像表示装置は第1の実施形態の映像表示装置90と同様な構成を有する。図11に示すように、表示画面51は映像生成部2が生成した映像情報が表示される映像表示領域42と操作者(ユーザ)の両手の提示に基づいて表示されるスナップショット表示領域43に分割される。映像表示領域42は表示画面51上部に表示される。スナップショット表示領域43は表示画面下部に表示される。
【0085】
ここでは、操作者が両手で図4に示す動作モード1(矩形領域の設定)、動作モード2(矩形領域の選択)を提示すると選択された矩形領域が表示画面51にハイライト表示される。この状態で操作者が両手で図4に示す動作モード9(スナップショットの設定)を提示すると、選択された矩形領域に対応する表示画面において、その時刻に表示されている矩形領域の映像が静止画のスナップショットとして切り出され、スナップショット表示領域43の中央部に表示される。操作者が例えばn回トリガ動作(動作モード9)を行うと、その都度矩形領域のスナップショットが生成され、スナップショット表示領域43に追加される。
【0086】
例えば、最初のスナップショットの設定動作では、画面表示領域42の矩形領域41aの映像がスナップショット44aとしてスナップショット表示領域43の中央部に表示される。同様に、n回目のスナップショットの設定動作では、画面表示領域42の中央の矩形領域41nの映像がスナップショット44nとしてスナップショット表示領域43の中央に表示される。つまり、最新のスナップショットがスナップショット表示領域43の中央部に常に表示されることになる。
【0087】
上述したように、本実施形態の映像表示装置では、操作者の提示する両手の手形状によって矩形領域が選択され、選択された矩形領域の映像が表示画面51上のスナップショット表示領域43にスナップショットとして表示される。
【0088】
このため、リモコン、キーボード、マウス、或いは画面上のアイコンなどの入力装置を用いることなく、表示画面51上のスナップショット表示領域43に時系列的に複数スナップショットを表示することができる。
【0089】
本発明は、上記実施形態に限定されるものではなく、発明の趣旨を逸脱しない範囲で、種々、変更してもよい。
【0090】
実施形態では、操作者の両手で提示される形状領域を矩形領域にしているが必ずしもこれに限定されるものではない。例えば三角形領域、円形領域、或いは表示画面51に対して平行或いは垂直ではない任意の矩形領域であってもよい。
【0091】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【0092】
本発明は、以下の付記に記載されているような構成が考えられる。
(付記1) 操作者が提示する両手の手形状によって表示画面の映像処理の指示が与えられる映像表示装置であって、前記操作者の手を含む映像を撮像する第1のカメラと、前記第1のカメラと離間して配置され、前記操作者の手を含む映像を撮像する第2のカメラと、前記第1及び第2のカメラから撮像された前記操作者の映像から認識対象として1種類以上の前記両手の手形状を認識し、前記操作者の提示する両手の手形状から構成される第1の形状領域と前記表示画面を対比して前記第1の形状領域を表示画面座標における第2の形状領域として認識するジェスチャ認識部と、前記表示画面に表示される前記第2の形状領域の映像を強調処理する映像生成部と、強調処理された前記第2の形状領域の映像を前記表示画面に表示する表示部とを具備する映像表示装置。
【0093】
(付記2) 映像情報を出力する映像信号発生部と、前記映像情報を復号し、復号された復号映像信号を前記映像情報部に出力する映像復号部とを更に具備する付記1に記載の映像表示装置。
【0094】
(付記3) 操作者が提示する両手の手形状によって表示画面の映像処理の指示が与えられる映像表示装置であって、前記操作者の手を含む映像を撮像する撮像部と、撮像された前記操作者の映像から認識対象として1種類以上の前記両手の手形状を認識し、前記操作者の提示する両手の手形状から構成される第1の形状領域と前記表示画面を対比して前記第1の形状領域を表示画面座標における第2の形状領域として認識するジェスチャ認識部と、前記表示画面に表示される前記第2の形状領域の映像を強調処理する映像生成部と、強調処理された前記第2の形状領域の映像を前記表示画面に表示する表示部と、前記ジェスチャ認識部で認識された前記第2の形状領域の映像を切り出し、切り出しの開始及び停止をトグルするトリガ動作を制御する切り出し部と、切り出された前記第2の形状領域の映像を符号化する映像符号部と、符号化された前記第2の形状領域の映像情報を格納する記憶部とを具備することを特徴とする映像表示装置。
【0095】
(付記4) 前記操作者が提示する両手の手形状によって、前記表示画面にスナップショット表示領域が設けられ、前記スナップショット表示領域にスナップショットが表示される付記1乃至3のいずれかに記載の映像表示装置。
【符号の説明】
【0096】
1 ジェスチャ認識部
2 映像生成部
3 映像複合部
4 映像信号発生部
5 表示部
6、6a、7 撮像部
11、12、12a、12b、41a、41n 矩形領域
13 右手
14 左手
15a、15b、15c 編集領域
21 フレームバッファ
22 手領域検出部
23 指位置検出部
24 形状決定部
25、33 記憶部
26 座標変換部
31 切り出し部
32 映像符号部
42 映像表示領域
43 スナップショット表示領域
44a、44n スナップショット
51 表示画面
90、90a、91 映像表示装置
L 間隔
SG1〜3、SG1a、SG11、SG12、SG21〜24 信号

【特許請求の範囲】
【請求項1】
操作者が提示する両手の手形状によって表示画面の映像処理の指示が与えられる映像表示装置であって、
前記操作者の手を含む映像を撮像する撮像部と、
撮像された前記操作者の映像から認識対象として1種類以上の前記両手の手形状を認識し、前記操作者の提示する両手の手形状から構成される第1の形状領域と前記表示画面を対比して前記第1の形状領域を表示画面座標における第2の形状領域として認識するジェスチャ認識部と、
前記表示画面に表示される前記第2の形状領域の映像を強調処理する映像生成部と、
強調処理された前記第2の形状領域の映像を前記表示画面に表示する表示部と、
を具備することを特徴とする映像表示装置。
【請求項2】
操作者が提示する両手の手形状或いは両手の動きによって表示画面の映像処理の指示が与えられる映像表示装置であって、
前記操作者の手を含む映像を撮像する撮像部と、
撮像された前記操作者の映像から認識対象として1種類以上の前記両手の手形状或いは前記両手の動きを認識し、前記両手の手形状では前記操作者の提示する両手の手形状から構成される第1の形状領域と前記表示画面を対比して前記第1の形状領域を表示画面座標における第2の形状領域として認識し、前記両手の動きでは前記第2の形状領域の編集操作として認識するジェスチャ認識部と、
前記両手の手形状では前記表示画面に表示される前記第2の形状領域の映像を強調処理し、前記両手の動きでは強調処理された前記第2の形状領域の映像を編集処理する映像生成部と、
強調処理された前記第2の形状領域の映像を前記表示画面に表示し、編集処理された前記第2の形状領域の映像を前記表示画面に表示する表示部と、
を具備することを特徴とする映像表示装置。
【請求項3】
前記編集処理は、前記第2の形状領域の映像を移動、拡大、縮小、或いは回転であることを特徴とする請求項2に記載の映像表示装置。
【請求項4】
前記第1の形状領域は、矩形形状であることを特徴とする請求項1乃至3のいずれか1項に記載の映像表示装置。
【請求項5】
前記強調処理は、前記第2の形状領域の映像の輝度を明るくする、或いは前記第2の形状領域の外周領域に太線枠を追加することを特徴とする請求項1乃至4のいずれか1項に記載の映像表示装置。
【請求項6】
表示部、撮像部、ジェスチャ認識部、及び映像生成部を有する映像表示装置において、操作者が提示する両手の手形状によって前記表示部の表示画面の映像領域選択が行われる映像表示装置を用いた映像領域選択方法であって、
前記操作者の手を含む映像を撮像する工程と、
前記操作者の右手で形成される第1のL字型ジェスチャと前記第1のL字型ジェスチャに対して対角をなす左手で形成される第2のL字型ジェスチャから構成される撮像映像を第1の矩形領域と認識する工程と、
前記第1の矩形領域と前記表示画面を対比して第1の矩形領域を表示画面座標における第2の矩形領域として認識し、前記第2の矩形領域を前記表示画面に対して平行或いは垂直に配置する工程と、
前記表示画面に表示される第2の矩形領域の映像を強調表示する工程と、
を具備することを特徴とする映像表示装置を用いた映像領域選択方法。
【請求項7】
強調表示された前記第2の矩形領域を選択する工程と、
選択された前記第2の矩形領域の映像を編集処理する工程と、
編集処理された前記第2の矩形領域の映像を前記表示画面に表示する工程と、
を更に具備することを特徴とする映像表示装置を用いた映像領域選択方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2012−243007(P2012−243007A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−111249(P2011−111249)
【出願日】平成23年5月18日(2011.5.18)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】