説明

電子機器の制御装置

【課題】ユーザの動きの画像をディスプレイ上のメニューに重ねて電子機器の遠隔操作を行う場合、操作メニュー上のユーザ画像のサイズ、位置が最適ではないときは操作しにくい。ユーザ画像のサイズ、位置を補正する場合は、操作が煩雑になる。
【解決手段】検出部13は表示装置21の表示画面の表示領域を縦方向9個、横方向に16個の計144個の検出領域に分割し、これら分割検出領域毎にユーザ画像の手の動きの画像を検出する。制御情報判断器(CPU)20は、検出部13からの検出信号の最大幅に基づいて、スケーラ15から出力される鏡像変換画像信号によるユーザ画像の画像サイズを所定のサイズとし、かつ、検出信号の重心座標を求め、その重心座標がグラフィックス生成器16で生成される操作用画像の中心位置にくるように、スケーラ15を制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は電子機器の制御装置に係り、特に人の手などの動作の画像を認識して、テレビジョン受像機などの電子機器の遠隔操作を行うための電子機器の制御装置に関する。
【背景技術】
【0002】
1980年代に赤外線リモートコントローラ(通称リモコン)がテレビジョン受像機をはじめとする家電機器に付属するようになり、手元で家電機器を遠隔制御できるユーザインターフェースが広く普及し、家電製品の操作形態を大きく変貌させた。現在においてもこの操作形態が主流である。リモコンは一機能をその機能に割り当てられた一つのキーを押下することで実行する仕組みが基本となっている操作装置である。例えば、テレビジョン受像機に付属するリモコンでは、「電源」、「チャンネル」、「音量」、「入力切替」などの機能を遠隔操作するためのキーが存在する。このリモコンによる遠隔操作方法は、これまでのテレビジョン受像機にとって大変便利な遠隔の操作方法であった。
【0003】
しかしながら、リモコンが手元にない場合やリモコンの所在が不明な場合、大変不自由を強いられることを経験させられる。これに対して、画像の動きや形状を認識して、電子機器の電源のオン/オフ(ON/OFF)などの切替操作をする方式が検討されており、例えば、手の動きや形状を認識して機器の操作に応用する技術が従来開示されている(例えば、特許文献1参照)。この特許文献1記載の発明では、専用の赤外線センサやイメージセンサを用いてユーザの手の動きや形状を検出し、その検出した動きや形状に基づいて、制御対象の電子機器を遠隔操作するようにしており、ユーザ自身の手を用いるので、リモコンを不要にでき、いつでも操作することができる。
【0004】
一方、最近始まったデータ放送を受信するテレビジョン受像機において、所望のメニュー画面を選択するためには、リモコンの「上」、「下」、「左」、「右」や「決定」キーを何度も押下する必要があり、リモコンでの操作は煩雑で使いづらくなっている。また、EPG(電子プログラムガイド)を用いて操作する場合は、マトリクスに配列された案内画面から所望の位置を選択して、リモコンのキーを押下する必要があるため、データ放送受信用テレビジョン受像機と同様にきめ細かな選択操作が必要であるという課題を有している。従って、これらのきめ細かな選択操作に対しても、ユーザの手の動きや形状の認識を活用して、多様な操作に対応できる方式が望まれている。
【0005】
一方、このような課題を解決するために、マウスまたはこれに類似した位置指定操作装置を使って得られる位置指定情報を、リモコンキーのキー押下信号の時系列パターンであるキー押下時系列符号に符号化し、そのキー押下時系列符号をテレビジョン受像機に送信するようにした制御装置が提案されている(例えば、特許文献2参照)。
【0006】
【特許文献1】特開平11−338614号公報
【特許文献2】特開2003−283866号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1記載の方法でテレビジョン受像機などの電子機器に表示されたメニューの操作を行う時に、ユーザ自身の画像、または動作をディスプレイ上のメニューに重ねて行う場合に、被制御機器である電子機器に対するユーザの位置や距離によって、操作メニュー上のユーザ画像のサイズ、位置が最適ではないような場合がある。そのため、操作メニュー上のユーザ画像のサイズ、位置を補正するために、操作メニューを表示させた後に操作メニューの特定のボタンを操作することによって調整する必要があり、操作が煩雑になるという問題がある。
【0008】
また、特許文献2記載の制御装置は、パーソナルコンピュータ(パソコン)の操作と酷似したポインティングの操作により、テレビジョン受像機を遠隔操作するものであるため、パソコンを利用しない人にとっては使いづらいという問題がある。
【0009】
本発明は以上の点に鑑みなされたもので、ユーザの画像とメニューの位置関係及びユーザの画像サイズを自動的に調整することにより、操作性を向上し得る電子機器の制御装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記の目的を達成するため、本発明は、表示装置と、その表示装置の前方に位置する操作者を撮影するビデオカメラとを備えた電子機器の操作を、ビデオカメラで撮影して得た操作者の画像の動きに応じて制御する電子機器の制御装置において、ビデオカメラで撮影された画像を鏡像変換して、第1の鏡像変換画像信号を生成し、この生成した第1の鏡像変換画像信号を出力する鏡像変換手段と、入力されるサイズ制御信号に応じた拡大率又は縮小率で第1の鏡像変換画像信号の画像サイズを制御し、かつ、入力される位置制御信号に応じて第1の鏡像変換画像信号の表示される画面における画像位置を制御した第2の鏡像変換画像信号を出力する画像変換手段と、複数の操作検出領域を含んだ操作用画像に対応した操作用画像信号を生成する操作用画像信号生成手段と、第2の鏡像変換画像信号と操作用画像信号とを混合して表示装置へ出力する混合手段と、第2の鏡像変換画像信号を表示する画面を水平方向にN分割(Nは2以上の自然数)し、かつ、垂直方向にM分割(Mは2以上の自然数)することにより得られる計N×M分割された分割画像領域のそれぞれについて、操作者の所定の部位の動作を示す画像信号を検出する検出手段と、検出手段で検出された動作を示す画像信号により得られる動き画像と分割画像領域との位置関係とから当該動き画像の重心座標を求め、その重心座標が操作用画像の所定操作検出領域に位置するように当該動き画像の位置を制御する位置制御信号を生成すると共に、当該動き画像の最大幅に応じて画像サイズを決定してサイズ制御信号を生成し、これら生成した位置制御信号とサイズ制御信号とを画像変換手段に出力する制御信号生成手段とを有する構成としたものである。
【発明の効果】
【0011】
本発明によれば、操作者(ユーザ)の動きを示す画像の位置と制御対象の電子機器の表示部に表示されている操作用画像との相対位置、及び操作者(ユーザ)の画像サイズを最適位置及び最適な大きさに自動で調整することができ、より短い手数で操作でき、操作性を向上することができる。
【発明を実施するための最良の形態】
【0012】
次に、発明を実施するための最良の形態について図面と共に説明する。図1は従来のリモコンによる操作形態と、本発明の操作形態との違いを説明するための図である。視聴者(ユーザ)3が、テレビジョン受像機1を操作する場合、従来はユーザ3がリモコン4を手に持って所望の機能を働かせるキーをテレビジョン受像機1に向けて押下することによって操作がなされる。従って、リモコン4が無ければ操作ができず、不便を強いられる場合を時々経験する。
【0013】
これに対し、本実施の形態では、図1に示すようにテレビジョン受像機1に設けられているビデオカメラ2により、テレビジョン受像機1の前方にいるユーザ3を撮影し、ビデオカメラ2の撮影画像からユーザ3の動作を検出して、テレビジョン受像機1及びそれに関連する機器の操作が行われる。検出されるユーザ3の動作とは、具体的にはテレビジョン受像機1の電源オン/オフ(ON/OFF)制御やメニュー画面の表示/非表示の制御、メニュー画面から所望のボタンを選択する制御に対応した、ユーザ3の身体(手、足、顔など)を使った特定の動作のことであり、この特定の動作を検出することでテレビジョン受像機1及びそれに関連する機器の操作を行う。
【0014】
図2は本発明になる電子機器の制御装置の一実施の形態に係るテレビジョン受像機の要部のブロック図を示す。同図において、テレビジョン受像機1は、ビデオカメラ2、基準同期発生器11、タイミングパルス発生器12、検出部13、鏡像変換器14、スケーラ15、グラフィックス生成器16、第1の混合器17、画素数変換器18、第2の混合器19、制御情報判断器(CPU)20、及び表示装置21を備えている。
【0015】
基準同期発生器11は、テレビジョン受像機1の基準になる水平周期パルスと垂直周期パルスとを発生し、テレビジョン放送受信時や外部の機器から映像信号が入力されている場合は、その入力映像信号の同期信号に同期するパルスを生成する。タイミングパルス発生器12は、基準同期発生器11から出力される水平周期パルス及び垂直周期パルスに同期して、図2に示す各ブロックで必要とする水平方向と垂直方向の任意の位相と幅を有するタイミングパルスを生成する。
【0016】
ビデオカメラ2は、図1に示すようにテレビジョン受像機1の前方に位置する視聴者(ユーザ)3、またはテレビジョン受像機1の前方の映像を撮影する。ビデオカメラ2により撮影して得られた出力撮像信号は、輝度(Y)信号、及び色差(R−Y、B−Y)信号からなり、基準同期発生器11から出力される水平周期パルス及び垂直周期パルスに同期している。また、本実施の形態では、ビデオカメラ2で撮像される画像の画素数は、表示装置21の画素数と一致しているものとする。なお、画素数が一致していない場合は画素数変換器を挿入すればよい。
【0017】
検出部13は、ここでは144個の検出器、すなわち第1の検出器301,第2の検出器302,第3の検出器303,・・・,第144の検出器444からなる。検出部13に含まれる検出器の数は特定するものではなく、グラフィックス生成器16で生成されるメニュー画面と連携した制御内容を表すプッシュボタン(パソコンではマウスでクリック操作する操作ボタンに該当)の数に対応して変動する。図2では後述する理由から検出器の数を最大144個用意した場合を示す。検出部13は、144個に分割された画面領域のそれぞれについて、被写体像であるユーザの所定の部位(手や指)の動きを示す動き画像を検出する。
【0018】
鏡像変換器14は、ビデオカメラ2で撮影した被写体像を表示装置21上に鏡と同じように左右を反転して表示するためのものである。従って、文字を表示する場合は鏡と同じように左右が反転することになる。本実施の形態では、メモリを活用して水平方向の画像を反転させる手法を想定しているが、表示装置21として陰極線管(CRT;Cathode Ray Tube)を用いる場合には、水平偏向を逆に操作することで同様の効果が得られる。その場合には、グラフィックスやその他混合する側の画像を予め水平方向に左右逆転しておく必要がある。
【0019】
スケーラ15は、ビデオカメラ2により撮影した被写体像(ユーザの画像)の大きさと位置とを調整する。すなわち、スケーラ15は、検出部13からの動き画像から、制御情報判断器(CPU)20がその最大幅や重心座標に基づいて生成した制御信号に基づいて、入力鏡像変換画像信号の拡大率や縮小率を2次元で調整すると共に、グラフィックス生成器16により生成される操作ボタン等の操作用画像に対する相対的な位置を移動調整する。また、スケーラ15は被写体画像から動き画像だけを切り出すことも行う。なお、スケーラ15は拡大率や縮小率の調整を行わずに、水平と垂直の位相調整を行うこともできる。このスケーラ15の利用の仕方については後で詳しく述べる。
【0020】
グラフィックス生成器16は、制御情報判断器(CPU)20から転送されるメニュー画面を展開するもので、メモリ上の信号がR(赤)信号、G(緑)信号、B(青)信号の原色信号で展開されていても、後段で映像信号と合成または混合される信号として、Y(輝度)信号と色差信号(R−Y、B−Y)を出力する。このグラフィックス生成器16は操作メニューや操作ボタン等の操作用画像信号を生成する。また、生成されるグラフィックスのプレーン数は限定するものではないが、説明に要するものは1プレーンである。グラフィックス生成器16が出力する信号の画素数は、本実施の形態では表示装置21の画素数に一致させるようにしている。一致していない場合は、画素数変換器を入れて一致させる必要がある。
【0021】
第1の混合器17は、グラフィックス生成器16の出力信号Gsと、スケーラ15の出力信号S1とを、制御値α1により混合割合を制御して混合する。具体的には、第1の混合器17は下記式で表される信号M1oを出力する。
【0022】
M1o=α1・S1+(1−α1)・Gs (1)
制御値α1は、「0」から「1」の間の値に設定され、制御値α1を大きくするとスケーラ出力信号S1の割合が大きくなり、グラフィックス生成器出力信号Gsの割合が小さくなる。混合器17の例としてはこれに限らないが、本実施の形態では、入力される2系統の信号情報が入っていれば同様の効果が得られる。
【0023】
画素数変換器18は、外部から入力される外部入力信号の画素数と表示装置21の画素数を合わせるための画素数変換を行う。外部入力信号は、放送されているテレビ信号(データ放送なども含む)やビデオ(VTR)入力などテレビジョン受像機の外部から入力されてくる信号を想定している。外部入力信号の同期系については、ここでの説明から省いてあるが、同期信号(水平及び垂直)を取得し、基準同期発生器11にて同期を一致させている。
【0024】
第2の混合器19は、第1の混合器17と同様の機能を有する。すなわち、第1の混合器17の出力信号M1oと、画素数変換器18の出力信号S2とを制御値α2で混合割合を制御して混合する。具体的には、第2の混合器19は下記式で表される信号M2oを出力する。
【0025】
M2o=α2・M1o+(1−α2)・S2 (2)
制御値α2は、「0」から「1」の間の値に設定され、制御値α2を大きくすると第1の混合器出力信号M1oの割合が大きくなり、画素数変換器出力信号S2の割合が小さくなる。混合器19の例としてはこれに限らないが、本実施の形態では、入力される2系統の信号情報が入っていれば同様の効果が得られる。
【0026】
制御情報判断器(CPU)20は、検出部13から出力されるデータの解析を行い、各種制御信号を出力する。制御情報判断器(CPU)20の処理内容は、ソフトウェアで実現するものとなり、アルゴリズムの詳細は後述する。本実施の形態では、ハードウェア(各機能ブロック)による処理と、ソフトウェア(CPU上で展開)による処理とが混在するが、特にここで示す切り分けに限定するものではない。
【0027】
表示装置21は、CRT(陰極線管)、LCD(液晶ディスプレイ)、PDP(プラズマディスプレイ)、あるいはプロジェクションディスプレイなどを想定しているが、ディスプレイの表示方式を限定するものではない。表示装置21の入力信号は、第2の混合器19から出力された信号M2oであり、これは輝度信号Yと、色差信号R−Y及びB−Yであるが、表示装置21の内部にてRGBの三原色信号にマトリクス変換された後、表示される。
【0028】
次に、以上のように構成されたテレビジョン受像機1の動作を、視聴者(ユーザ)3の動作を交えて説明する。図3は、本実施の形態が実際に使用されている状態の一例を示すイメージ図である。同図に示すように、表示装置21の画面には機器の操作メニューに、これを操作するユーザをビデオカメラ2で撮影したカメラ画像が鏡像変換機14で鏡像変換して重ねて表示されている。水平方向と垂直方向のそれぞれに示された格子上の線は、図2の検出部13がユーザのジェスチャーを捉えるために便宜的に画像を区切って検出を行っていることを示すものである。
【0029】
ユーザが被制御対象の電子機器(ここでは、テレビジョン受像機1)の操作を行おうとする場合は、その電子機器に対するユーザの位置はできるだけ限定されずに広いことが望ましい。従って、図3に示すように、テレビジョン受像機1の操作を表示装置21の画面上に表示される操作メニューとこれを操作するユーザの画像とを重ね合わせて行わせようとした場合、図4に示すように、位置固定のビデオカメラ2に対して、ユーザが3Aで示す位置Aにいる場合には、図3に示したように操作メニューとユーザ画像との位置関係が最適で操作がし易い。
【0030】
しかし、ユーザが3Bで示す位置Bにいる場合は、位置3Aよりも遠いために、ビデオカメラ2のズームが一定のままでは表示装置21の画面上に表示される操作メニューとこれを操作するユーザの画像とは図5に示すようになって、操作メニューの操作の為にはユーザの大きな動作を必要とする位置関係となり、操作メニューとユーザの関係が最適にはならず操作がしにくいという状況が発生する。そこで、本実施の形態では、ユーザの動きを基にユーザが操作メニューがし易い位置に画像のサイズと位置を自動的に調整するものである。
【0031】
次に、ユーザの操作する手の画像のサイズと位置を自動的に調整する方法について説明する。図6はy軸方向に9個、x軸方向に16個に分割された検出ブロックについて説明するための図である。図2の検出部13内にはビデオカメラ2で撮影されたユーザの手の画像を、図6に示したy軸方向に9個、x軸方向に16個に分割された計144個の検出ブロック(領域)を各検出ブロック毎に互いに独立して検出する計144個の検出器301〜444が存在する。各検出器301〜444は手の動作を検出する検出器として機能する。
【0032】
図2の検出器301〜444はそれぞれ同一構成であり、代表して検出器301の構成を図7に示す。図7に示すように、検出器301は特定色フィルタ31と、階調限定器32と、動作検出フィルタ33と、合成器34と、オブジェクトゲート器34とを備えている。
【0033】
特定色フィルタ31について図8を参照して説明する。図8は色差平面図で、縦軸を色差信号R−Yの値、横軸を色差信号B−Yの値としたものである。テレビ信号のすべての色信号はこの色差平面図上のベクトルで表すことができ、極座標で評価することができる。特定色フィルタ31は、色差信号で入力される色信号の色相と色の濃さ(飽和度)を特定するフィルタである。色信号の色相と色の濃さ(飽和度)を特定するために色相は、図8の色差平面図の第1象限のB−Y軸を基準(零度)として左回りの角度で表現するものとする。また、飽和度は、色差平面図でベクトルのスカラ量で表される。色差平面図の原点が飽和度0(零)で色がない状態を示し、原点から離れるに従い飽和度が大きくなり色が濃いことを示す。
【0034】
図8では、特定色フィルタ31により抽出される範囲は、等色相線L1に対応する角度θ1より小さく、かつ、等色相線L2に対応する角度θ2より大きな角度範囲に設定され、また色の濃さは等飽和度線L4より小さく、かつ、等飽和度線L3より大きいベクトル長さ範囲に設定されている。色差平面図の第2象限のこの検出範囲は本実施の形態で抽出する人間の手の色である肌色の領域に相当するが、特にこれに限定するものではない。特定色フィルタ31は、ビデオカメラ2から入力される色差信号(R−Y、B−Y)が上記の等色相線L1とL2の角度範囲と等飽和度線L3とL4の範囲とで囲まれた領域に入っているか否かを検出する。そのためには特定色フィルタ31は色差信号から角度と飽和度を算出して判定を行う。
【0035】
角度算出は、一例として図9に示すような処理によって、入力画素それぞれについて行われ、図8に示す色差平面図上でなす角度が算出される。図9は角度算出処理をフローチャートとして図示しているが、角度算出処理はソフトウェア、ハードウェアのいずれで実現してもよい。本実施の形態では、ハードウェアで実現するようにしている。
【0036】
角度算出動作について説明するに、まず、入力画素それぞれの色差信号R−Y,B−Y成分の符号を判断し、入力画素の色相が、色差平面図上の第何象限に位置しているかが検出される(図9のステップS101)。続いて、色差信号R−Y,B−Y成分それぞれの絶対値の大きい方をAとし、小さい方をBとして算出する(図9のステップS102)。次に、B/Aより角度T1を検出する(図9のステップS103)。この角度T1は、ステップS102での処理より明らかなように、0°〜45°となる。角度T1は、折れ線近似やROMテーブルによって算出することができる。
【0037】
続いて、Aが|R−Y|であるか、即ち、|R−Y|>|B−Y|であるか否かが判定される(図9のステップS104)。ステップS104の判定がNOつまり、|R−Y|>|B−Y|でなければ、そのままステップS106に進む。ステップS104の判定がYESつまり、|R−Y|>|B−Y|であれば、ステップS105に進み、角度T1を、(90−T1)に置き換える。これによって、tan−1((R−Y)/(B−Y))が求められる。ステップS103において検出する角度T1を0°〜45°としているのは、tan−1((R−Y)/(B−Y))のカーブは45°を超えると急激に勾配が大きくなり、角度の算出に不適であるからである。
【0038】
更に、ステップS106にて、ステップS101にて検出した象限のデータを用いて角度T1又はTが、色差平面図上の第2象限か否かを判定し、第2象限であれば、ステップS107に進み、T=180−T1を算出する。第2象限でなければ、ステップS108に進み、第3象限か否かを判定し、第3象限であれば、ステップS109に進み、T=180+T1を算出する。角度T1又はTが、色差平面図上の第3象限でなければ、ステップS110に進み、第4象限か否かを判定し、第4象限であれば、ステップS111に進み、T=360−T1を算出する。第4象限でもない、すなわち第1象限であるときは、角度TをT1とする(図9のステップS112)。そして、最終的に、ステップS112にて、入力画素それぞれの図8の色差平面図上でなす角度T(図8ではθs)が出力される。
【0039】
以上の処理により、入力された色差信号R−Y,B−Yの色差平面図上での角度を0°〜360°の範囲で求めることができる。ステップS104〜S111は、ステップS103にて検出した角度T1を角度Tに補正する処理である。また、ステップS104〜S111は、角度T1を、色差平面図の第1〜第4象限に応じて補正している。
【0040】
次に色の濃さである飽和度の算出は、下記の式により行われる。
【0041】
Vc=sqrt(Cr×Cr+Gb)(Cb) (3)
但し、上式中、Crは、図8に示すように色信号の(R−Y)軸成分であり、Cbは(B−Y)軸成分である。またsqrt()は平方根の演算を行う演算子である。
【0042】
ここでの処理はソフトウェアまたはハードウェアを特定するものではないが、乗算と平方根はハードウェアでは実現が容易でなく、またソフトウェアでも演算のステップが多く、好ましくないので以下のように近似することもできる。
【0043】
Vc=max(|Cr|,|Cb|)
+0.4・min(|Cr|,|Cb|) (4)
但し、上式中、max(|Cr|,|Cb|)は、|Cr|と|Cb|のうち、大きい値の方を選択する演算処理であり、min(|Cr|,|Cb|)は、|Cr|と|Cb|のうち、小さい値の方を選択する演算処理である。またVcはベクトルのスカラ量であり、ここでは飽和度を表す。
【0044】
以上より求めた角度(色相)Tと飽和度Vcが等色相線の角度θ1からθ2の範囲に入っているか否か、また、色の濃さが等飽和度線L4より小さく、かつ、等飽和度線L3より大きい範囲に入っているか否かを評価する。この範囲に入っている信号を通過させるのが、図7に示す特定色フィルタ31の役割である。
【0045】
図7の階調限定器32は、図10に示すように、輝度信号の特定の階調を限定するものである。6ビットデジタル信号の場合、0〜255までの256階調を有するが、この範囲の階調を限定する最大レベルLmax及び最小レベルLminを設定し、レベルがその間にある輝度信号を出力する。この階調限定器32は、人間の手の階調レベルの輝度信号を通過させるものである。
【0046】
次に、図7の動作検出フィルタ33について図11及び図12を併せ参照して説明する。動作検出フィルタ33は、図11に示すように、1フレーム遅延器41と、減算器42と、絶対値器43と、非線形処理器44と、量子化器45とから構成されており、入力される輝度信号から画像の動きを検出する。図11において、まず、1フレーム遅延器41でビデオカメラ2からの輝度信号は1フレーム遅延された後、減算器42に入力される。減算器42ではビデオカメラ2からの輝度信号と1フレーム遅延器41からの輝度信号との差分信号を算出し、絶対値器43に出力する。差分信号は信号のレベルによって正又は負の値で出力されるため、動作検出フィルタ4は、絶対値器43にて差分信号を絶対値化して正側の信号だけで差分信号を扱う。
【0047】
非線形処理器44は正の値のみの差分信号が入力され、非線形処理による感度調整を行う。図12(A)にはこの非線形処理の特性が示されている。図12(A)の横軸は入力信号(ここでは絶対値器43からの絶対値化された正の差分信号)のレベル、縦軸は出力信号のレベルを示す。入力信号がa以下のレベルではノイズとみなして、出力信号は0レベルとする。折れ線Iは入力信号がレベルa以上レベルb1未満のレベル範囲では入力信号レベルに応じたレベルの出力信号を出力し、レベルb1以上ではリミット値LIMに制限される入出力特性を示す。また、折れ線IIは入力信号がレベルa以上レベルb2未満のレベル範囲では入力信号レベルに応じたレベルの出力信号を出力し、レベルb2以上ではリミット値LIMに制限される入出力特性を示す。更に、折れ線IIIは入力信号がレベルa以上レベルb3未満のレベル範囲では入力信号レベルに応じたレベルの出力信号を出力し、レベルb3以上ではリミット値LIMに制限される入出力特性を示す。
【0048】
非線形処理器44の上記の折れ線I〜IIIで示すような入出力特性は、範囲R1及びR2の範囲内で可変され感度調整が行われ、その結果が量子化器45に出力される。量子化器45は非線形処理器44で非線形処理された信号を閾値と大小比較して2値化する。図12(B)に2値化された非線形の差分信号が示されている。
【0049】
再び図7に戻って説明する。図7において、合成器34は、特定色フィルタ31、階調限定器32及び動作検出フィルタ33からそれぞれ出力された信号を合成して領域パルスに変換する。すなわち、合成器34は、特定色フィルタ31を通過した信号、階調限定器32を通過した信号、及び動作検出フィルタ33を通過した信号が全て高レベルである場合に、高レベルの領域パルスを出力する。
【0050】
合成器34で生成された領域パルスは、オブジェクトゲート35に供給される。オブジェクトゲート35は、領域パルスが高レベルであるとき、輝度信号と色差信号を通過させ、領域パルスが低レベルであるときは(すなわち、領域パルス外の範囲であるときは)、入力された輝度信号と色差信号は通過させず、規定した値の信号を出力する。本実施の形態では、通過させない範囲では、黒レベルの輝度信号及び飽和度ゼロの色差信号を規定した値の信号として出力する。
【0051】
この図7に示される検出器301(検出器302〜444も同様)の働きは、特定色フィルタ31で色信号の色相(角度)と飽和度を限定した範囲を通過した信号と、階調限定器32により輝度信号レベルで限定した範囲を通過した信号と、動作検出フィルタ33で動作を検出して動きがあるときの映像信号とを通過させるものである。特定色フィルタ31で色相と飽和度を限定することで人の肌色に絞ることはできるが、人の肌色は日焼け具合で変化し、また人種によっても異なる。これら肌色といっても様々であるが、色相、飽和度、輝度信号の階調限定の範囲を調整すれば概ね人の手の画像を検出することができる。
【0052】
また、本実施の形態では動作検出フィルタ33により縦または横に手を振る動作を認識しているが、これは静止しているものと動作しているものを区別することである。これにより、検出器301〜444の処理で手が動作している信号のみを後段に送ることができる。
【0053】
図13には検出器301〜444の出力信号の内容をモデル化したものが描かれている。図13にはビデオカメラ2で撮影された手の画像の中で肌色が動いている部分のブロックが抽出されて描かれている。ここでは、この抽出された部分のブロックをハンドブロックと呼ぶことにする。このハンドブロックが上下に移動して、あたかもコイコイ(来い来い)というような動作をした場合に、ユーザが機器の操作を可能とするメニューが画面上に表れるとする。
【0054】
このハンドブロックの重心座標をG(Xg,Yg)とする時、図13に示すハンドブロックAの座標は前述した144個の検出ブロック(領域)のうち下記のようにハンドブロックAを構成する個々の検出ブロックの座標を加算して、構成する検出ブロックの数で除算して求められる。いま、n行目の検出ブロックのX座標をXn、m列目の検出ブロックのY座標をYmとすると、ハンドブロックの重心座標(Xg,Yg)は下記のように求められる。
【0055】
Xg=ΣΣXn/TOTAL (5)
Yg=ΣΣYm/TOTAL (6)
ここで、TOTALは、ハンドブロックを構成する検出ブロックの個数とする。
【0056】
このようにして求められるハンドブロックの重心座標のYgの時間変化を表したのが図14である。図14中、Tで表される1周期が手の上下運動1回に相当する。そして、例えばこの動作が3回あった場合にメニューを表示させるというようにしておく。ここで、図1のユーザ3とビデオカメラ2との距離が近い場合には、図13に示されるようにハンドブロックA、上記距離が遠い場合にはハンドブロックBのように抽出される。ハンドブロックAは図4のユーザ位置3Aで抽出された手、ハンドブロックBは図4のユーザ位置3Bで抽出された手に相当する。
【0057】
この状態で画面中央にメニューが表示されている場合には、図4のユーザ位置3Aからの操作が想定されたメニューとユーザの大きさ、位置関係は図3のようになり、図4のユーザ位置3Bからの操作ではユーザが小さく画面上に映るため、メニューとユーザの大きさ、位置関係は図5のようになる。図3に比べ図5では、ユーザの大きさがメニューに対して小さく、かつ、離れているためメニュー操作のために大きな動作が必要となる。
【0058】
ここで、図13に示すハンドブロックBを構成するブロックは座標(3,1)、(3,0)、(3,−1)、(2,0)、(2,−1)の計5つであるので、重心座標は(Xg,Yg)=(2.6,−0,2)と表せる。一方、図13に示すハンドブロックAを構成するブロックは座標(−4,1)、(−4,0)、(−4,−1)、(−5,0)、(−5,−1)、(−6,0)、(−6,−1)の計7つであるので、重心座標は(Xg,Yg)=(−4.9,−0.3)と表せる。
【0059】
従って、メニューの中心が座標(x,y)=(0,0)としたならば、ハンドブロックA、Bの重心座標を中心にカメラ画像から切り出して、座標(x,y)に重ねるようにすれば、ユーザの手がメニューの中央になるため、メニュー上のどのボタンに対しても等距離となり操作に最適な位置となる。
【0060】
また、図13に示すハンドブロックのx軸方向に占めるブロック数の最大幅をハンドブロックAとBで比較すると、ハンドブロックAの方が大きいことがわかる。これは即ち、図4との関係からも分かるように操作対象機器とユーザの距離を表すと考えることもできる。また、ハンドブロックBは幅が小さいためにユーザは子供であり、ハンドブロックAは幅が大きいために大人であると考えることもできる。
【0061】
いずれにせよ、ハンドブロックの最大幅が小さい場合には図5に示されるように、画面上でのユーザとメニューの大きさが画面上のメニュー操作に対して最適ではなく、大きな動作が必要となることが予想される。従って、このハンドブロックの最大幅に応じて、その幅が所定の幅となるようにユーザのカメラ画像をズームして捉えることで、カメラ画像を図3に示したような最適な大きさとする。上記のズームは、ビデオカメラ2がズーム機能を有している場合はそのズーム機能を制御して実現し、ズーム機能を有しない場合はスケーラ15により電気信号処理により拡大率や縮小率の調整を行うことで実現する。
【0062】
ここで、ズームの倍率を求める方法について説明する。図13のように検出されたハンドブロックに関して、操作をするために望ましいハンドブロックのX軸方向の幅をXrefとし、実際に検出されたハンドブロックのX軸方向の幅をxとすると、行うべきズームの倍率Kzは下記の式で求められる。
【0063】
Kz=Xref/x
実際には、図13で表わすハンドブロックは1フレームの検出結果に過ぎず、ユーザが意識して行った操作であるとすると検出するまでには数フレームを要する。この間に、検出すべき手の陰影の変化などにより必ずしも正確な幅が求められるとは限らない。従って、上記式の右辺に表わす幅xは数フレームにわたって検出されるハンドブロックのX軸方向の幅の平均ないし最大値、あるいは最大値と最小値を除いた平均値を使用する。
【0064】
このように、本実施の形態によれば、ユーザの手の画像の画像位置及び画像の大きさを最適な画像位置及び画像サイズに自動調整するようにしたため、ユーザの手の画像位置を、図3のようにメニュー画面の中心位置で所定の大きさで表示することができ、これによりユーザは少ない距離の動きにより所望の操作ができ、操作性を向上することができる。なお、スケーラ15で切り出したユーザの画像を基にユーザの手による遠隔操作が完了した後には、再びビデオカメラ2が広い範囲を捉えるべく、その切り出し位置を広げる動作を行うことは当然のことである。
【0065】
なお、本発明は以上の実施の形態に限定されるものではなく、例えば操作する電子機器としては、テレビジョン受像機以外の電子機器も可能である。
【図面の簡単な説明】
【0066】
【図1】従来のリモコンによる操作形態と、本発明の操作形態との違いを説明するための図である。
【図2】本発明の電子機器の制御装置の一実施の形態に係るテレビジョン受像機の要部のブロック図である。
【図3】本発明の一実施の形態が実際に使用されている状態の一例を示すイメージ図である。
【図4】ユーザのビデオカメラに対する距離の違いによるビデオカメラへの捉えられ方を説明する図である。
【図5】本発明の一実施の形態が実際に使用されている状態の他の例(図3よりもユーザ位置が遠い場合の例)を示すイメージ図である。
【図6】本発明の一実施の形態における検出ブロックの一例の構成をビデオカメラに撮影されたユーザと共に示す図である。
【図7】図2中の検出部を構成する検出器の一例の構成を示すブロック図である。
【図8】図7に示す特定色フィルタで抽出する対象物の色相及び飽和度を説明するための図である。
【図9】色差信号から色相を算出する処理の一例のフローチャートである。
【図10】図7に示す階調限定器で抽出する対象物の輝度信号レベルを説明するための図である。
【図11】図7に示す動作検出フィルタの一例の構成を示すブロック図である。
【図12】図11中の非線形処理器の一例の特性図である。
【図13】図2中の検出部の出力信号の一例が画面に映し出されている様子をモデル化して描いた図である。
【図14】図13に示すハンドブロックの重心座標Ygの時間変化の一例を表した図である。
【符号の説明】
【0067】
1 テレビジョン受像機(電子機器)
2 ビデオカメラ
3 ユーザ(視聴者)
4 リモートコントローラ(リモコン)
11 基準同期発生器
12 タイミングパルス発生器
13 検出部
14 鏡像変換器
15 スケーラ
16 グラフィックス生成器
17 第1の混合器
18 画素数変換器
19 第2の混合器
20 制御情報判断器(CPU)
21 表示装置
31 特定色フィルタ
32 階調限定器
33 動作検出フィルタ
34 合成器
35 オブジェクトゲート
41 1フレーム遅延器
42 減算器
43 絶対値器
44 非線形処理器
45 量子化器
301〜444 検出器

【特許請求の範囲】
【請求項1】
表示装置と、その表示装置の前方に位置する操作者を撮影するビデオカメラとを備えた電子機器の操作を、前記ビデオカメラで撮影して得た前記操作者の画像の動きに応じて制御する電子機器の制御装置において、
前記ビデオカメラで撮影された画像を鏡像変換して、第1の鏡像変換画像信号を生成し、この生成した第1の鏡像変換画像信号を出力する鏡像変換手段と、
入力されるサイズ制御信号に応じた拡大率又は縮小率で前記第1の鏡像変換画像信号の画像サイズを制御し、かつ、入力される位置制御信号に応じて前記第1の鏡像変換画像信号の表示される画面における画像位置を制御した第2の鏡像変換画像信号を出力する画像変換手段と、
複数の操作検出領域を含んだ操作用画像に対応した操作用画像信号を生成する操作用画像信号生成手段と、
前記第2の鏡像変換画像信号と前記操作用画像信号とを混合して前記表示装置へ出力する混合手段と、
前記第2の鏡像変換画像信号を表示する画面を水平方向にN分割(Nは2以上の自然数)し、かつ、垂直方向にM分割(Mは2以上の自然数)することにより得られる計N×M分割された分割画像領域のそれぞれについて、前記操作者の所定の部位の動作を示す画像信号を検出する検出手段と、
前記検出手段で検出された前記動作を示す画像信号により得られる動き画像と前記分割画像領域との位置関係とから当該動き画像の重心座標を求め、その重心座標が前記操作用画像の所定操作検出領域に位置するように当該動き画像の位置を制御する前記位置制御信号を生成すると共に、当該動き画像の最大幅に応じて前記画像サイズを決定して前記サイズ制御信号を生成し、これら生成した前記位置制御信号と前記サイズ制御信号とを前記画像変換手段に出力する制御信号生成手段と
を有することを特徴とする電子機器の制御装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2008−282131(P2008−282131A)
【公開日】平成20年11月20日(2008.11.20)
【国際特許分類】
【出願番号】特願2007−124372(P2007−124372)
【出願日】平成19年5月9日(2007.5.9)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】