説明

画像処理装置、方法、及び画像表示装置

【課題】対象物の三次元位置を高精度で算出する。
【解決手段】実施形態の画像処理装置は、実施形態の画像処理装置は、第1取得部、第2取得部、第1設定部、第2設定部、第1算出部、及び第2算出部を備える。第1取得部は、対象物が複数の位置から撮像された複数の撮像画像を取得する。第2取得部は、前記対象物の仮三次元位置と、前記対象物の仮サイズを取得する。第1設定部は、実空間における前記仮三次元位置の近傍に少なくとも1つの探索候補点を設定する。第2設定部は、前記探索候補点を前記撮像画像に射影した射影位置毎に、前記対象物を探索するための探索窓であって、前記探索候補点の位置と前記仮サイズとに基づくサイズの前記探索窓を設定する。第1算出部は、前記探索窓内において、前記対象物が含まれるかどうかを示す評価値を算出する。第2算出部は、前記評価値に基づいて前記対象物の三次元位置を算出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、画像処理装置、方法、及び画像表示装置に関する。
【背景技術】
【0002】
撮像画像における対象物の位置を検出し、検出位置から対象物の三次元位置を推定する方法として、パーティクルフィルタを用いた技術が知られている。パーティクルフィルタでは、追跡対象を、状態量と尤度を持つ多数の仮設群により離散的な確率密度として表現する。そして、状態遷移モデルを用いて伝播させることで、動きの変動やノイズの影響を抑制した追跡を実現する。
【0003】
パーティクルフィルタを用いた方法では、ステレオ画像から局所特徴の三次元座標を算出し、その三次元座標の近傍に仮設群となる三次元座標サンプル点を設定する。そして、三次元座標サンプル点をステレオ画像上に射影した二次元座標サンプル点を仮説群として評価することで、局所特徴の三次元位置を推定している。
【0004】
また、三次元位置に三次元座標サンプル点を仮設群として生成するパーティクルフィルタを用い、人物頭部を一定の大きさの楕円体モデルと仮定する方法が開示されている。この開示では、この楕円体を各撮像画像上に射影した際の大きさを探索窓とし、探索窓内に人物頭部が存在する確率を示す尤度を各仮説の尤度として算出する。そして、各仮説の尤度から、人物頭部の三次元位置を推定している。また、探索窓を使用した探索方法が知られている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2011−90465公報
【0006】
【非特許文献1】小林貴訓、他6名、「カスケード型識別機を用いたパーティクルフィルタによる人物三次元追跡」画像の認識・理解シンポジウム(MIRU2006)、2006年7月
【非特許文献2】Paul Viola and Michael Jones,“Rapid Object Detection using a Boosted Cascade of Simple Features”IEEE conf. on Computer Vision and Patern Recognition(CVPR 2001)
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、単にパーティクルフィルタを用いた方法では、探索窓サイズを得ることができず、探索法を適用することができない。また、楕円体モデルを用いる方法では、探索窓サイズが一定の人物から定まるサイズであるため、対象物の個体差を吸収することができなかった。
【0008】
本発明が解決しようとする課題は、対象物の三次元位置を高精度で算出することができる、画像処理装置、方法、及び画像表示装置を提供することである。
【課題を解決するための手段】
【0009】
実施の形態の画像処理装置は、第1取得部、第2取得部、第1設定部、第2設定部、第1算出部、及び第2算出部を備える。第1取得部は、対象物が複数の位置から撮像された複数の撮像画像を取得する。第2取得部は、前記対象物の仮三次元位置と、前記対象物の仮サイズを取得する。第1設定部は、実空間における前記仮三次元位置の近傍に少なくとも1つの探索候補点を設定する。第2設定部は、前記探索候補点を前記撮像画像に射影した射影位置毎に、前記対象物を探索するための探索窓であって、前記探索候補点の位置と前記仮サイズとに基づくサイズの前記探索窓を設定する。第1算出部は、前記探索窓内において、前記対象物が含まれるかどうかを示す評価値を算出する。第2算出部は、前記評価値に基づいて前記対象物の三次元位置を算出する。
【図面の簡単な説明】
【0010】
【図1】実施の形態1の画像表示装置の図。
【図2】実施の形態1の表示装置の図。
【図3】実施の形態1の表示部の模式図。
【図4】実施の形態1の三次元座標系を示す図。
【図5】実施の形態1の画像処理装置の図。
【図6】実施の形態1の取得処理のフローチャート。
【図7】実施の形態1のピンホールカメラモデルを示す図。
【図8】実施の形態1の探索窓と対象物の幅の一例の図。
【図9】実施の形態1の算出処理のフローチャート。
【図10】実施の形態1の算出手順の図。
【図11】実施の形態2の画像処理装置の図。
【図12】実施の形態2の算出処理のフローチャート。
【図13】実施の形態3の視域の設定位置及び設定範囲の制御の図。
【図14】実施の形態3の視域の設定位置及び設定範囲の制御の図。
【図15】実施の形態3の視域の設定位置及び設定範囲の制御の図。
【図16】実施の形態3の視域の設定位置及び設定範囲の制御の図。
【図17】実施の形態3の画像表示装置の図。
【発明を実施するための形態】
【0011】
(実施の形態1)
本実施の形態の画像処理装置は、視聴者が裸眼で立体画像を観察可能なTV(テレビ)、PC(Personal Computer)、スマートフォン、デジタルフォトフレーム等の画像表示装置に用いられ得る。立体画像とは、互いに視差を有する複数の視差画像を含む画像である。なお、実施の形態で述べる画像とは、静止画又は動画のいずれであってもよい。
【0012】
図1は、本実施の形態の画像表示装置10の概略図である。画像表示装置10は、表示装置14、撮像装置16、及び画像処理装置12を備える。
【0013】
図2は、表示装置14の概略図である。図2に示すように、表示装置14は、立体画像を表示する表示部21を備える。立体画像とは、互いに視差を有する複数の視差画像を含む画像である。表示部21は、例えば、インテグラル・イメージング方式(II方式)や多眼方式等の3Dディスプレイ方式を採用する。
【0014】
表示部21は、表示パネル20と、光線制御部22と、を備える。表示パネル20は、色成分を有する複数のサブ画素(例えば、R、G、B)を、第1方向(例えば、図1における行方向(左右))と第2方向(例えば、図1における列方向(上下))とに、マトリクス状に配列した液晶パネルである。この場合、第1方向に並ぶRGB各色のサブ画素が1画素を構成する。また、隣接する画素を視差の数だけ第1方向に並べた画素群に表示される画像を要素画像24と称する。表示装置14のサブ画素の配列は、他の公知の配列であっても構わない。また、サブ画素は、RGBの3色に限定されない。例えば、4色以上であってもよい。
【0015】
表示パネル20には、直視型2次元ディスプレイ、例えば、有機EL(Organic Electro Luminescence)やLCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、投射型ディスプレイなどを用いる。また、表示パネル20は、バックライトを備えた構成でもよい。
【0016】
光線制御部22は、表示パネル20に対して間隔を隔てて対向して配置されている。光線制御部22は、表示パネル20の各サブ画素からの光線の出射方向を制御する。光線制御部22は、光線を出射するための光学的開口部が直線状に延伸し、当該光学的開口部が第1方向に複数配列されたものである。光線制御部22には、例えば、シリンドリカルレンズが複数配列されたレンチキュラーシート、スリットが複数配列されたパララックスバリア等を用いる。光学的開口部は、表示パネル20の各要素画像24に対応して配置される。
【0017】
図3は、表示部21を視聴者が視認した状態を示す模式図である。表示パネル20に複数の要素画像24を表示する。すると、表示パネル20には、複数の視差方向に対応した視差画像群(多視差画像)が表示される。この多視差画像による光線は、光線制御部22の各光学的開口部を透過する。そして、視域内に位置する視聴者26は、要素画像24に含まれる異なる画素を、左目26Aおよび右目26Bでそれぞれ観察することになる。このように、視聴者26の左目26Aおよび右目26Bに対し、視差の異なる画像をそれぞれ表示させることで、視聴者26が立体画像を観察することができる。
【0018】
図1に戻り、撮像装置16は、実空間に位置する対象物を撮像する。対象物は、後述する画像処理装置12において三次元位置及びサイズの算出対象とする物体である。
【0019】
撮像装置16には、公知の撮像装置を用いる。本実施の形態では、画像表示装置10は、複数の撮像装置16を備える。これらの撮像装置16は、互いに異なる位置に設置されている。本実施の形態では、例えば、表示部21の水平方向一端部に撮像装置16Aを設置し、表示部21の水平方向他端部に撮像装置16Bを設置する。また、表示部21の水平方向中央部に撮像装置16Cを設置する。なお、各撮像装置16A〜撮像装置16Cの設置位置は、これらの位置に限られない。また、画像表示装置10の備える撮像装置16の数は、複数であればよく、3個に限られない。また、本実施の形態では、撮像装置16A〜撮像装置16Cを総称して説明する場合には、単に撮像装置16と称して説明する。
【0020】
画像処理装置12は、対象物の実空間における三次元位置、及びサイズを算出する。本実施の形態において、三次元位置とは、実空間における三次元位置座標を示す。また、後述する二次元位置とは、二次元位置座標を示す。
【0021】
なお、本実施の形態では、実空間上における三次元座標系を、以下のように定義する。図4は、本実施の形態における三次元座標系を示す模式図である。図4に示すように、本実施の形態では、実空間上における、画像表示装置10に設けられた複数の撮像装置16の位置の重心位置を原点Oとする。そして、原点Oを通る水平方向をX軸とする。また、原点Oを通り且つ撮像装置16の撮像方向を正とする方向をZ軸とする。また、X軸Z軸平面に対して垂直で且つ原点Oを通り、撮像装置16の反重力方向を正とする方向をY軸とする。これらのX軸、Z軸、及びY軸によって定まる座標系を、本実施の形態では、実空間上における三次元座標系として説明する。なお、実空間上における座標の設定方法はこれに限定されない。また、撮影画像の左上を原点とし、水平右方向に正とするx軸、垂直下方向に正とするy軸を設定する。
【0022】
また、画像処理装置12では、探索法を用いて、対象物の仮三次元位置、仮サイズ、三次元位置、及びサイズを算出する。対象物の三次元位置とは、対象物の実空間上における実際の位置を示す。対象物のサイズとは、対象物の実際のサイズを示す。対象物の仮三次元位置とは、後述する三次元位置の算出方法とは異なる方法で得た対象物の仮の位置である。対象物の仮サイズとは、後述するサイズの算出方法とは異なる方法で得た対象物の仮のサイズである。なお、対象物の仮三次元位置、仮サイズ、三次元位置、及びサイズの算出方法の詳細は後述する。
【0023】
本実施の形態では、対象物が人物の正面顔であり、対象物の撮像画像が人物の顔を正面側から撮像した顔画像であるとする。この場合には、探索法として、Paul Viola and Michael Jones,“Rapid Object Detection using a Boosted Cascade of Simple Features”IEEE conf. on Computer Vision and Patern Recognition(CVPR 2001)(上記、非特許文献2)に開示された探索法を用いる。
【0024】
この探索法は、探索窓内の画像に対していくつかの矩形特徴を求め、それぞれの特徴に対する弱識別器を直列につないだ強識別器によって、正面顔であるかどうかを判定する方法である。
【0025】
画像処理装置12で探索法を用いる場合には、探索法を行う各機能部(詳細後述)に、パターン識別器(図示省略)を備えた構成とすればよい。パターン識別器は、複数の弱識別器を直列に接続したカスケード構造の識別器であって、非特許文献2に開示されたカスケード型AdaBoostベース識別器である。
【0026】
具体的には、パターン識別器は、入力された撮像画像に対して、カスケードの各段の弱識別器で顔、非顔の判定を行い、顔と判定された画像のみを次段の弱識別器へと進める。そして、最後の弱識別器を通過した画像を最終的に顔画像と判定する。
【0027】
カスケードの各段を構成する強識別器は、複数の弱識別器を直列につないだ構成である。各弱識別器では、探索窓内の画像に対して求めた矩形特徴を用いて評価を行う。
【0028】
ここで、xを探索窓の画像内における2次元座標位置ベクトルとしたときの、位置ベクトルxにおいての、ある弱識別器nの出力は、下記式(1)によって示される。
【0029】
【数1】

【0030】
式(1)中、h(x)は弱識別器nの出力を示し、f(x)は弱識別器nの判定関数を示す。また、式(1)中、pは不等号の等号の向きを定めるために、1またはー1となる数を示し、θは各弱識別器nに対して予め定められている閾値を示す。例えばθは、識別器作成の際の学習において設定される。
【0031】
また、N個の弱識別器を直列につないだ構成の強識別器の出力は、下記式(2)によって示される。
【0032】
【数2】

【0033】
式(2)中、H(x)は、N個の弱識別器を直列につないだ構成の強識別器の出力を示す。また、式(2)中、αは予め定められている弱識別器nの重みを示し、hは式(1)で表した弱識別器nの出力を示す。例えばαは、識別器作成の際の学習において設定される。
【0034】
なお、パターン識別器を通過した画像について、顔らしさを表す尤度l(x)を算出するためには、下記式(3)を用いる。
【0035】
【数3】

【0036】
式(3)中、aは、識別器作成の際の学習において生成される重みを表す定数である。また、式(3)中、H(x)は、強識別器の出力を示す。
【0037】
なお、対象物は必ずしも一定の方向から撮影されるわけではない。例えば、横方向や斜め方向から撮影する場合も考えられる。このような場合には、画像処理装置12を、横顔を検出するためのパターン識別器を備えた構成とする。なお、画像処理装置12において探索法を用いる各機能部は、対象物の1つないし複数の姿勢の各々に対応するパターン識別器を備えた構成であるものとする。
【0038】
次に、画像処理装置12について詳細に説明する。図5は、画像処理装置12の機能的構成を示すブロック図である。
【0039】
図5に示すように、画像処理装置12は、第1取得部30、第2取得部32、第1設定部34、及び推定部36を備える。
【0040】
第1取得部30は、複数の撮像装置16の各々から、対象物の撮像画像を取得する。第1取得部30は取得した複数の撮像画像を、推定部36へ出力する。
【0041】
第2取得部32は、実空間における対象物の仮の三次元位置座標である仮三次元位置と、実空間における対象物の仮のサイズである仮サイズを取得する。
【0042】
第2取得部32による、対象物の仮三次元位置、及び対象物の仮サイズの取得方法は、対象物の三次元位置及びサイズを取得する公知の方法であればよい。
【0043】
例えば、第2取得部32は、撮像装置16による撮像画像を用いて、探索法により、対象物の仮三次元位置、及び対象物の仮サイズを取得する。
【0044】
一例として、第2取得部32が、ステレオカメラによる撮像画像を用いて、対象物の仮三次元位置及び仮サイズを取得する。なお、ステレオカメラによる撮像画像として、本実施の形態では、表示部21の水平方向の両端部に設けられた撮像装置16Aの撮像画像と、撮像装置16Bの撮像画像を用いる場合を説明する。また、説明の便宜上、撮像装置16Aをメインカメラ、撮像装置16Bをサブカメラと称して説明する。なお、メインカメラ及びサブカメラの選定方法は、任意でよく、この選定に限られない。
【0045】
図6は、第2取得部32が実行する、対象物の仮三次元位置及び仮サイズの取得処理の手順の一例を示すフローチャートである。
【0046】
第2取得部32は、まず、メインカメラである撮像装置16Aから取得した撮像画像から、該撮像画像上における対象物の位置を検出する(ステップS100)。この対象物の位置の検出には、上述した探索法を用いる。具体的には、第2取得部32を、上記パターン識別器を備えた構成とする。そして、第2取得部32では、撮像装置16Aから取得した撮像画像における、ある探索窓サイズの探索窓内の画像が対象物を含む画像であるかどうかをパターン識別器によって判定する。この探索窓サイズは、予め設定したサイズであってよい。また、この探索窓サイズは、予め第2取得部32に記憶しておけばよい。そして、該探索窓を、撮像装置16Aから取得した撮像画像内で該画像全体に渡って走査し、各走査位置における判定結果を得る。また、第2取得部32では、この走査を、サイズの異なる複数の探索窓サイズの探索窓を用いて行う。なお、このサイズの異なる複数の探索窓サイズは、予め設定し第2取得部32に記憶しておけばよい。
【0047】
そして、第2取得部32は、撮像装置16Aから取得した撮像画像内の、各探索窓サイズで走査した各走査位置ベクトルxにおける判定結果である強識別器の出力値H(x)から、各探索窓サイズ及び各走査位置ベクトルxにおける尤度l(x)を求める。この強識別器の出力値H(x)及び、各探索窓サイズ及び各走査位置xベクトルにおける尤度l(x)は、上記式(2)及び式(3)を用いて算出する。さらに、第2取得部32は、最も尤度l(x)の高い走査位置ベクトルxの探索窓サイズの探索窓内の中心位置を、撮像装置16Aから取得した撮像画像上における対象物の位置、すなわち二次元位置座標として検出する。
【0048】
次に、第2取得部32は、サブカメラである撮像装置16Bから取得した撮像画像から、該撮像画像上における対象物の位置を検出する(ステップS102)。この検出には、上述した探索法を用いる。すなわち、撮像装置16Bから取得した撮像画像を用いる以外は、ステップS100と同様にして対象物の該撮像画像上における対象物の位置を検出する。
【0049】
なお、ステップS102における探索窓による撮像画像の走査は、撮像画像全体の走査に限られない。例えば、サブカメラの撮像画像において、メインカメラ(撮像装置16A)と対象物とを結ぶ直線をサブカメラ(撮像装置16B)の撮像画像に投影したエピポーラ線状に、対象物が撮像されているとする。この場合には、上記ステップS102における探索窓の走査範囲は、エピポーラ線上のみであってもよい。
【0050】
次に、第2取得部32は、対象物の仮三次元位置を算出する(ステップS104)。
【0051】
ステップS104において、第2取得部32は、メインカメラ(撮像装置16A)から取得した撮像画像上における対象物iの位置である二次元位置と、サブカメラ(撮像装置16B)から取得した撮像画像上における対象物iの位置である二次元位置と、から、三角測量により、対象物の仮三次元位置を算出する。
【0052】
なお、対象物iの仮三次元位置は、下記式(4)によって示される。
【0053】
【数4】

【0054】
メインカメラ(撮像装置16A)から取得した撮像画像上における対象物iの位置ベクトルui,lを、下記式(5)で示す。また、サブカメラ(撮像装置16B)から取得した撮像画像上における対象物iの位置ベクトルui,rを、下記式(6)で示す。そして、対象物iの実空間上における位置座標を、下記式(7)のように同次座標系で表現する。すると、下記式(8)及び式(9)の関係式が得られる。
【0055】
【数5】

【0056】
【数6】

【0057】
【数7】

【0058】
なお、式(5)〜(7)中、Tは、転置を示す。また、式(5)中、xは、メインカメラ(撮像装置16A)の撮像画像における対象物iの二次元座標のx座標値を示す。また、式(5)中、yは、メインカメラ(撮像装置16A)の撮像画像における対象物iの二次元座標のy座標値を示す。
【0059】
また、式(6)中、xは、サブカメラ(撮像装置16B)の撮像画像における対象物iの二次元座標のx座標値を示す。また、式(6)中、yは、サブカメラ(撮像装置16B)の撮像画像における対象物iの二次元座標のy座標値を示す。
【0060】
また、式(8)中のαは、メインカメラ(撮像装置16A)の撮像時のカメラスケールを示す。式(9)中のβは、サブカメラ(撮像装置16B)の撮像時のカメラスケールを示す。また、式(8)中のPは、実空間(三次元座標系)上の点からメインカメラ(撮像装置16A)の撮像画像への射影行列を示す。また、式(9)中のQは、実空間(三次元座標系)上の点からサブカメラ(撮像装置16B)の撮像画像への射影行列を示す。なお、これらの射影行列は、事前に撮像装置16のキャリブレーションを行う事で得られ、画像処理装置12に予め記憶する。
【0061】
そして、上記式(8)及び式(9)からα及びβを消去すると、下記式(10)に示す連立方程式が得られる。
【0062】
【数8】

【0063】
そして、第2取得部32は、式(10)の左辺の行列の擬似逆行列を最小二乗法によって求めることで、対象物iの仮三次元位置を算出する。
【0064】
次に、第2取得部32は、ステップS104で算出した、対象物iの仮三次元位置と、ステップ100において、もっとも尤度が大きくなった探索窓のサイズから、対象物iの仮サイズを算出する(ステップS106)。
【0065】
第2取得部32は、ステップS106の処理において、例えば、ピンホールカメラモデルを用いて対象物iの仮サイズを算出する。
【0066】
図7は、ピンホールカメラモデルを示す模式図である。撮像装置16のX軸方向の画角をθxとし、撮像装置16によって得られた撮像画像のZ軸方向の焦点位置をFとし、対象物iのZ軸方向の位置をZとする。すると、対象物iのZ軸方向の位置と画角の端部とのX軸方向の距離であるZZ’は、下記式(11)によって示される。また、ZZ’の範囲にピンホールカメラの撮影画像の水平解像度wcの半分の画像が投影されていることを考えると、1画素当たりのZZ’上の長さは、下記式(12)によって示される。
【0067】
【数9】

【0068】
式(11)中、OZは、撮像装置16から対象物iまでのZ軸方向の最短距離を示す。また、式(12)中、wは、ピンホールカメラの撮影画像の水平解像度を示す。
【0069】
すなわち、対象物iの仮三次元位置のZ座標Z~iと、ピンホールカメラの撮影画像の水平解像度wと、を用いて、第2取得部32は、対象物iのX軸方向の仮サイズであるWを、下記式(13)によって算出する。同様にして、第2取得部32は、対象物iのY軸方向の仮サイズであるWを、下記式(14)によって算出する。ここで、式(13)の右辺wは、ステップ100において、もっとも尤度が大きくなった探索窓のx軸方向の画素数を示す。をた、式(14)の右辺wyは、ステップ100において、もっとも尤度が大きくなった探索窓のサイズのy軸方向の画素数を示す。
【0070】
【数10】

【0071】
なお、上記では、撮像装置16から対象物iまでのZ軸方向の仮三次元位置のZ座標値Ziを、ステレオカメラを用いた三角測量によって求めた。しかし、撮像装置16から対象物iまでのZ軸方向の距離の算出方法は、この方法に限られない。例えば、撮像装置16から対象物iまでのZ軸方向の距離は、レーダーやセンサ等の他の機器を用いて計測してもよいし、公知の複数の方法によって得た計測値の平均値を用いてもよい。
【0072】
図6に戻り、そして、第2取得部32は、上記ステップS104で算出した、対象物iの仮三次元位置、及びステップS106で算出した、対象物iの仮サイズを、第1設定部34へ出力し(ステップS108)、本ルーチンを終了する。
【0073】
第2取得部32が上記ステップS100〜ステップS108の処理を実行することによって、第2取得部32は、対象物iの仮三次元位置及び仮サイズを取得し、第1設定部34へ出力する。
【0074】
なお、第2取得部32による仮三次元位置及び仮サイズの取得方法は、図6に示す処理に限られない。
【0075】
例えば、1つの撮像装置16から取得した撮像画像を用いた方法を採用してもよい。一例として、表示部21の水平方向中央部に設けられた撮像装置16Cの撮像画像を用いる場合を説明する。
【0076】
この場合には、第2取得部32は、まず、撮像装置16Cの撮像画像上で、複数種類の探索窓サイズの探索窓を走査し、該撮像画像上における対象物の位置を検出する。この対象物の位置の検出方法は、上記ステップ100及びステップS102と同様にして行えばよい。
【0077】
図8は、X軸とZ軸によって構成されるXZ平面上で検出された対象物の探索窓と、実空間上での対象物のX軸上の幅を示す図である。撮像装置16CのX軸方向の画角をθxとし、撮像装置16Cによって得られた撮像画像のZ軸方向の焦点位置をFとし、対象物iのZ軸方向の位置をZとする。すると、図8中、AA’、BB’、OF、及びOZは、相似関係により、AA’:BB’=OF:OZの関係がある。なお、AA’は、撮像装置16Cの撮像画像における探索窓のX軸方向の幅を示す。BB’は、対象物のX軸方向の実際の幅を示す。OFは、撮像装置16Cから焦点位置Fまでの距離を示す。OZは、撮像装置16Cから対象物の位置Zまでの距離を示す。
【0078】
ここで、焦点位置Fから撮像画像の端部までの距離であるFF’を、単眼カメラ(撮像装置16C)の水平解像度の半分の値wc/2とする。すると、OF=FF’/tan(θ/2)となる。
【0079】
そして、撮像装置16Cの撮像画像における探索窓のX軸方向の幅であるAA’を、探索窓のx軸方向の画素数とする。BB’は、対象物のX軸方向の実際の幅であるが、対象物の平均的な大きさを仮定する。例えば、顔であれば、平均的な顔の横幅は、14cmと言われている。
【0080】
よって、第2取得部32は、撮像装置16Cから対象物までの距離であるOZを、下記式(15)によって算出する。
【0081】
【数11】

【0082】
すなわち、第2取得部32は、対象物の仮の三次元位置のZ座標を、撮像装置16Cの撮像画像における探索窓の画素数によって示される幅に基づいて求める。
【0083】
また、図8中、AF、BZ、OF、及びOZは、相似関係により、AF:BZ=OF:OZの関係を示す。なお、AFは、撮像装置16Cの撮像画像における探索窓のX軸方向端部Aから焦点位置Fまでの距離を示す。また、BZは、対象物のX軸方向の端部Bから対象物のZ軸方向における位置Zまでの距離を示す。
【0084】
このため、第2取得部32は、BZを求めることで、対象物の仮の三次元位置のX座標を求める。そして、Y軸Z軸によるYZ平面についても同様にして、第2取得部32は、対象物の仮の三次元位置のY座標を求める。
【0085】
このようにして、第2取得部32は、1つの撮像装置16Cから取得した撮像画像を用いて、対象物の仮三次元位置を得てもよい。
【0086】
なお、1つの撮像装置16Cから取得した撮像画像を用いる場合には、上記のように、対象物の平均的な大きさを予め設定する必要がある。このため、1つの撮像装置16Cから取得した撮像画像を用いて対象物の仮サイズを算出する方法は、ステレオカメラによる撮像画像を用いる場合に比べて算出精度が低い。そこで、1つの撮像装置16Cから取得した撮像画像を用いて対象物の仮サイズを算出する場合には、画像表示装置10にさらに測距離計を備えた構成とすればよい。そして、測距計を用いて対象物のZ座標を用いれば、対象物の平均的な大きさを予め設定する必要がないため、高精度の仮サイズを得ることができる。
【0087】
なお、第2取得部32における、対象物の仮サイズ及び仮三次元位置の取得方法は、上記方法に限られない。
【0088】
図5に戻り、第2取得部32は、対象物の仮三次元位置及び対象部の仮サイズを第1設定部34へ出力する。
【0089】
第1設定部34は、第2取得部32から、対象物の仮三次元位置及び対象物の仮サイズを取得する。そして、第1設定部34は、実空間における仮三次元位置の近傍に、1または複数の探索候補点を設定する。探索候補点とは、実空間における対象物の実際の位置を推定する候補となる点である。そして、第1設定部34は、設定した探索候補点と、第2取得部32から受け付けた対象物の仮三次元位置及び仮サイズを、推定部36へ出力する。なお、実空間における仮三次元位置の近傍とは、仮三次元位置の周辺の予め定めた範囲内を示す。
【0090】
第1設定部34は、例えば、ガウシアンによって定義されるランダムウォークモデルに従って、第2取得部32から取得した仮三次元位置の近傍に探索候補点を設定する。
【0091】
具体的には、第1設定部34は、三次元ガウス分布N(μ、S)に従った乱数によって、第2取得部32から取得した仮三次元位置の近傍に探索候補点を設定する。ここで、μは対象物の仮三次元位置を表す三次元ベクトルである。Sは、上記乱数の発生範囲を示す。具体的には、この範囲Sは、式(16)で示す行列で示される。
【0092】
【数12】

【0093】
式(16)中、σは、3次元ガウス分布のX軸方向への広がり度合い(X軸方向の標準偏差)を示し、σは、3次元ガウス分布のY軸方向への広がり度合い(Y軸方向の標準偏差)を示し、σは、3次元ガウス分布のZ軸方向への広がり度合い(Z軸方向の標準偏差)を示す。
【0094】
式(16)中、σが大きい値であるほど、ガウシアンのX軸方向の広がりが大きくなる。すなわち、σが大きい値であるほど、X軸方向への探索候補点の出現範囲が広がるため、対象物の早い動きに対応できる。しかし、σが大きい値であるほど、探索候補点が疎になるため、対象物の位置推定精度が低下するおそれがある。σ、σについても同様である。
【0095】
そこで、本実施の形態では、第1設定部34は、第1取得部30で取得する撮像画像のフレームレートが小さければ小さいほど、式(16)中のσ、σ、σとして、より小さな値を設定する。これは、第1取得部30で取得する撮像画像のフレームレートが小さければ小さいほど、撮影間隔が短く対象物の移動が小さいと考えられるためである。この場合には、第1取得部30から、撮像画像のフレームレートを示す情報を第1設定部34で取得すればよい。また、第1設定部34では、撮像画像のフレームレートに対応づけて、フレームレートが小さいほど小さい値のσ、σ、σを示す情報を予め記憶すればよい。
【0096】
または、第1設定部34は、第2取得部32で取得した仮三次元位置の推定精度が低ければ低いほど、式(16)中のσ、σ、σとして、より大きな値を設定する。仮三次元位置の推定精度が低いとは、例えば、仮三次元位置の推定方法として、精度の低い推定精度を用いた場合である。また、仮三次元位置の推定精度が低いとは、撮像画像の検出環境が悪い、すなわち撮像画像にノイズが含まれる場合も挙げられる。撮像画像にノイズが含まれる場合とは、例えば、対象物を暗い環境下で撮像した場合等である。また、仮三次元位置の推定精度が低いとは、対象物の高速移動により、対象物に焦点のあっていない撮像画像を取得した場合も挙げられる。そこで、第2取得部32は、予め、仮三次元位置の推定精度に寄与するこれらの因子に対応する、σ、σ、σの値を予め記憶する。そして、これらの因子の1または複数を得るための検知装置等の取得部を更に設けた構成とし、該取得部から得られた情報に基づいて該因子を特定し、特定した因子に対応するσ、σ、σを用いればよい。
【0097】
または、第1設定部34は、上記式(16)におけるσ、σを、各々WX、WYとしてもよい。WXとは、対象物の仮のサイズのX軸上での大きさを示す。またWYとは、対象物の仮のサイズのY軸上での大きさを示す。
【0098】
また、上記例では、第1設定部34は、第2取得部32から取得した対象物の仮三次元位置μを中心とした範囲Sに、探索候補点を設定する場合を説明した。しかし、探索候補点の設定方法は、この方法に限られない。例えば、第1設定部34は、第2取得部32から取得した対象物の仮三次元位置μにランダム値を加算した1または複数の位置を仮三次元位置とし、これらの仮三次元位置を中心として、範囲S内に探索候補点を設定してもよい。また、上記では、対象物の動きは、ランダムウォークに従うとして説明したが、動きに関する前提知識があれば、その動きモデルに従った探索候補点を設定してもよく、ランダムウォークに限られない。
【0099】
推定部36は、対象物の複数の撮像画像を第1取得部30から取得する。また、推定部36は、1つないし複数の三次元位置座標を示す探索候補点と、第2取得部で得た対象物の仮サイズを含むサンプル点データを第1設定部34から取得する。そして、推定部36は、対象物の三次元位置及び対象物のサイズを算出し、表示装置14へ出力する。
【0100】
推定部36は、第2設定部38、第1算出部40、第2算出部42、及び第3算出部44を備える。
【0101】
第2設定部38は、第1取得部30から取得した各撮像画像に対して探索候補点を射影した射影位置(二次元位置)毎に、対象物を探索するための探索窓であって、該探索候補点の位置と前記仮サイズとに基づくサイズの該探索窓を設定する。
【0102】
第1算出部40は、第1取得部30から取得した撮像画像の各々における、探索候補点iを射影した射影位置毎に、設定した探索窓内に対象物が含まれるかどうかの度合を示す評価値を算出する。なお本実施の形態では、この評価値として、探索窓内に対象物が含まれているか否かを示す探索候補点iの尤度li(第1尤度)を用いる。
【0103】
第3算出部44は、複数の撮像画像の各々における、探索候補点iを射影した射影位置毎に算出した評価値に基づいて、該射影位置に対応する実空間上の探索候補点iに対象物が存在する度合を示す尤度Li(第2尤度)を算出する。
【0104】
第2算出部42は、実空間上の探索候補点毎に算出した第2尤度に基づいて、実空間上における対象物の三次元位置、及び対象物のサイズを算出する。
【0105】
次に、推定部36が実行する、対象物の三次元位置及び対象物のサイズの算出処理の手順を説明する。図9は、推定部36が実行する、対象物の三次元位置及び対象物のサイズの算出処理の手順を示すフローチャートである。
【0106】
推定部36は、ステップS200〜ステップS208の処理を、第1設定部34から受け付けた探索候補点の数分、繰り返し実行する。
【0107】
まず、第2設定部38が、1つの探索候補点(以下、探索候補点iと称する)を、第1取得部30から取得した複数の撮像画像の各々上に射影した射影探索候補点jの射影位置を算出する(ステップS200)。なお、各々の撮像装置16では、カメラキャリブレーションが予めおこなわれており、三次元位置を撮像画像上に射影する射影行列は、予め第2設定部38に記憶されているものとする。
【0108】
そして、第2設定部38は、探索候補点iのZ座標、及び対象物の仮サイズから、射影探索候補点jの射影位置毎に探索窓サイズを算出する(ステップS202)。
【0109】
第2設定部38によるステップS202の探索窓サイズの算出処理を、図8を用いて説明する。まず、対象物の仮サイズを撮像画像上に射影した場合の大きさを(以下、基準探索窓サイズ)求める。上述したように、相似関係から、図8中におけるAA’:BB’=OF:OZの関係を用いる。ここで、BB’は、対象物の仮サイズを示す。OFは、上述したように、撮像装置16の解像度と画角から算出する。また、OZは、探索候補点iのZ座標である。このため、これらの値から、第2設定部38は、基準探索窓サイズであるAA’を算出する。この基準探索窓サイズを、探索候補点iの探索窓サイズとする。
【0110】
また、第2設定部38は、探索候補点iの探索窓サイズを求める際に、対象物の基準探索窓サイズを用いて、以下の式(17)によって示される確率密度関数に従った乱数によって探索窓サイズを求める。
【0111】
【数13】

【0112】
式(17)中、wは基準探索窓サイズである。また、式(17)中、σは、上記乱数のちらばりの大きさを示し、第2取得部32による仮サイズの推定精度が高いほど、小さい値を予め設定する。
【0113】
第2取得部32による仮サイズの推定精度が高いとは、例えば、仮サイズの推定方法として、精度の高い推定精度を用いた場合である。また、仮サイズの推定精度が高いとは、撮像画像の検出環境が良好、すなわち撮像画像に含まれるノイズが少ない場合である。撮像画像に含まれるノイズが少ない場合とは、例えば、対象物を明るい環境下で撮像した場合等である。また、仮サイズの推定精度が高い場合には、対象物に焦点のあった撮像画像を取得した場合も含まれる。そこで、第2取得部32は、予め、仮サイズの推定精度に寄与するこれらの因子に対応する、σの値を予め記憶する。そして、これらの因子の1または複数を得るための検知装置等の取得部を更に設けた構成とし、該取得部から得られた情報に基づいて該因子を特定し、特定した因子に対応するσを用いればよい。
【0114】
そして、第2設定部38では、上記と同様にして、生成した1つないし複数の乱数の探索窓を求める。つまり、探索候補点iの三次元位置座標を持ち、探索窓サイズが異なる探索候補点i−1〜i−nが新たに生成されることになる(nは1以上の整数)。
【0115】
図9に戻り、推定部36では、これらのn個のサンプル点i−nそれぞれに対して、下記ステップS204〜ステップS208の処理を行えばよい。
【0116】
次に、第1算出部40が、第1取得部30から取得した撮像画像の各々における、探索候補点iを射影した射影探索候補点jの射影位置毎に評価値を算出する(ステップS204)。本実施の形態では、上述のように、第1算出部40は、評価値として尤度li、jを算出する。第1算出部40は、この尤度li、jの算出を、第1取得部30から取得したすべての撮像画像、つまりすべてのjに対して行う。
【0117】
第1算出部40は、具体的には、この尤度li−jを、上記探索法を用いて算出する。すなわち、第1算出部40は、上記式(1)〜式(3)を用いて尤度liを算出する。
【0118】
次に、第3算出部44が、上記ステップS204で射影位置毎に算出された評価値(尤度li−j)に基づいて、射影位置に対応する実空間上の探索候補点iに対象物が存在する度合を示す尤度Liを算出する(ステップS206)。
【0119】
第3算出部44は、尤度Liの算出方法として、種々の算出方法を用いる。例えば、第3算出部44は、下記式(18)を用いて、尤度Liを算出する。
【0120】
【数14】

【0121】
式(18)中、Πは総乗を示し、Mは画像表示装置10に搭載された撮像装置16の台数を示す。
【0122】
このとき、ある射影探索候補点jにおける尤度li−jがゼロであったときには、第3算出部44は、探索候補点iにおける尤度Liをゼロとして出力する。これにより、第3算出部44は、まだ計算していない尤度算出処理を省略することが可能である。
【0123】
また、第3算出部44は、尤度li−jの平均値を尤度Liとして算出してもよい。
【0124】
【数15】

【0125】
式(19)中、Mは画像表示装置10に搭載された撮像装置16の台数を示す。
【0126】
また、第3算出部44は、尤度li−jの最大値、尤度li−jの中央値、または尤度li−jの重み付け中央値を、尤度Liとして算出してもよい。また、第3算出部44は、上記尤度Liの複数種類の算出方法を組み合わせ、各種類の算出方法によって得た値の平均値や、各種類の算出方法によって得た値の中央値を、尤度Liとして算出してもよい。
【0127】
また、第3算出部44では、尤度Liとして、実空間上の探索候補点iに対象物が存在する度合を示す尤度Liを算出したが、逆に対象物でない尤度を計算し1から減算することによって対象物らしさの尤度Liとしてもよい。
【0128】
次に、第3算出部44が、探索候補点iの尤度Liを求める際に使用した探索窓サイズλi、及び探索候補点iの三次元位置Piを記憶する(ステップS208)。なお、Pは、三次元位置を表すベクトルである。
【0129】
すべての探索候補点について、上記ステップS200〜ステップS208の処理を行うと、第2算出部42が、対象物の三次元位置P、及び対象物のサイズを算出する(ステップS210)。
【0130】
ステップS210の処理において、第2算出部42は、上記ステップS208で記憶された、対象物の探索候補点iの三次元位置Pi、尤度Li、及び尤度Liを求める際に使用した探索窓サイズλiを用いて、対象物の三次元位置P、及び対象物のサイズを算出する。
【0131】
第2算出部42が、対象物の三次元位置Pを求める方法は複数ある。例えば、第2算出部42は、各探索候補点の尤度Liを重みとし、各探索候補点の三次元位置の重み付き平均として、対象物の三次元位置Pを算出する。この場合、第2算出部42は、対象物の三次元位置Pを、下記式(20)を用いて算出する。
【0132】
【数16】

【0133】
式(20)中、Kは、正規化定数であり、式(21)で示される。また、それぞれの式中のIは、探索候補点すべてを含む集合を表す。
【0134】
【数17】

【0135】
なお、第2算出部42が、対象物の三次元位置Pを算出する方法は、上記方法に限られない。例えば、下記方法A〜方法Fが挙げられる。
【0136】
方法Aは、すべての探索候補点のうち、尤度Liが最大になる探索候補点の三次元座標を、対象物の三次元位置Pとして算出する方法である。方法Bは、すべての探索候補点のうち、尤度Liが中央値となる探索候補点の三次元座標を、対象物の三次元位置Pとして算出する方法である。方法Cは、すべての探索候補点の内、これらの探索候補点の尤度Liの平均値に最も近い探索候補点の三次元座標を、対象物の三次元位置Pとして算出する方法である。方法Dは、すべての探索候補点の尤度Liの内、予め定めた閾値以上の尤度Liの探索候補点を抽出し、抽出した探索候補点の尤度Liの平均値を、対象物の三次元位置Pとして算出する方法である。方法Eは、すべての探索候補点の尤度Liの内、予め定めた閾値以上の尤度Liの探索候補点を抽出し、抽出した探索候補点の尤度Liを重みとした探索候補点の座標の重み付き平均を、対象物の三次元位置Pとして算出する方法である。方法Fは、すべての探索候補点の尤度Liの内、予め定めた閾値以上の尤度Liの探索候補点を抽出し、抽出した探索候補点の尤度Liの中央値に対応する探索候補点の三次元座標を、対象物の三次元位置Pとして算出する方法である。
【0137】
また、第2算出部42は、上記方法を組み合わせて、その平均や中央値等を、対象物の三次元位置Pとして算出してもよい。
【0138】
第2算出部42が、対象物のサイズを算出する方法についても、複数の方法が挙げられる。例えば、下記方法G〜方法Mが挙げられる。
【0139】
方法Gは、対象物のサイズλを、第1設定部34で設定した探索候補点の尤度Liの重みとし、各探索候補点の探索窓サイズの重み付き平均として求める方法である。この場合、λは、下記式(22)によって算出する。
【0140】
【数18】

【0141】
式(22)中、Iは、探索候補単すべてを含む集合を表す。また、式(22)中、Kは、正規化定数であり、上記式(21)で示される。
【0142】
また、方法Hは、第1設定部34が設定した全ての探索候補点の内、尤度Liが最大の探索候補点の探索窓サイズを、対象物のサイズλとする方法である。方法Iは、第1設定部34が設定した全ての探索候補点の内、尤度Liが中央値の探索候補点の探索窓サイズを対象物のサイズλとする方法である。方法Jは、第1設定部34が設定した全ての探索候補点の内、尤度Liの平均値に最も近い探索候補点の探索窓サイズを対象物のサイズλとする方法である。また、方法Kは、第1設定部34が設定した全ての探索候補点の内、予め定めた閾値以上の尤度Liを有する探索候補点を抽出し、抽出した探索候補点の探索窓サイズの平均を対象物のサイズλとする方法である。方法Lは、第1設定部34が設定した全ての探索候補点の内、予め定めた閾値以上の尤度Liを有する探索候補点を抽出し、抽出した探索候補点の探索窓サイズの重み付き平均値を対象物のサイズλとする方法である。方法Mは、第1設定部34が設定した全ての探索候補点の内、予め定めた閾値以上の尤度Liを有する探索候補点を抽出し、抽出した探索候補点の尤度Liの中央値を示す探索候補点の探索窓サイズを対象物のサイズλとする方法である。
【0143】
次に、推定部36は、上記ステップS210で算出した、対象物の三次元位置、及び対象物のサイズを、表示装置14へ出力した後に(ステップS212)、本ルーチンを終了する。
【0144】
なお、ステップS210で算出した、対象物の三次元位置、及び対象物のサイズの出力先は、表示装置14に限られない。例えば、画像処理装置12を、有線通信網または無線通信網を介して、各種外部装置と接続した構成とする。各種外部装置としては、例えば、公知の記憶媒体や、パーソナルコンピュータや、携帯端末等が挙げられる。そして、推定部36は、上記ステップS210で算出した、対象物の三次元位置及び対象物のサイズを、この各種外部装置に出力してもよい。
【0145】
図10は、尤度Liの算出手順の模式図である。第2取得部32が対象物の仮三次元位置及び仮サイズを取得することによって、図10(A)に示すように、画像処理装置12は、実空間における、対象物Qの仮三次元位置Z及び仮サイズを取得する。第1設定部34は、仮三次元位置Zの周辺の予め定められた領域S内に、1または複数の探索候補点Iを設定する。図10(B)に示すように、推定部36の第2設定部38では、1つの探索候補点Iに対応する、撮像画像90〜撮像画像90上の射影位置i毎の探索窓50〜50の探索窓サイズを算出する。そして、第1算出部40が、射影位置i毎の評価値である尤度l〜lを設定する。第3算出部44は、算出された尤度l〜lに基づいて、仮三次元位置Zの尤度Liを算出する。そして、第2算出部42が、対象物の三次元位置及びサイズを算出する。
【0146】
以上説明したように、本実施の形態の画像処理装置12では、第1取得部30、第2取得部32、第1設定部34、第2設定部38、第1算出部40、第2算出部42を備える。第1取得部30は、対象物の複数の撮像画像を取得する。第2取得部32は、対象物の仮三次元位置及び対象物の仮サイズを取得する。第1設定部34は、実空間における仮三次元位置の周辺の予め定めた範囲内に探索候補点を設定する。第2設定部38は、複数の撮像画像の各々について、撮像画像上の探索候補点に対応する射影位置と仮サイズとから、該射影位置毎の探索窓サイズを設定する。そして、第1算出部40は、複数の撮像画像の各々における該射影位置毎に、設定した探索窓サイズの探索窓内に対象物が含まれる度合を示す評価値を算出する。第2算出部42は、複数の撮像画像の各々における、該射影位置毎の評価値に基づいて、対象物の三次元位置を算出する。
【0147】
このように、本実施の形態の画像処理装置12では、探索法によって撮像画像内の対象物を探索するときに、第2設定部38が、複数の撮像画像の各々について、対象物の仮三次元位置の近傍の探索候補点に対応する、撮像画像上の射影位置と、仮サイズとから、該射影位置毎の探索窓サイズを設定する。このように、探索候補点を撮像画像上に射影した射影位置と、対象物の仮サイズとから、該射影位置毎の探索窓サイズを設定するので、対象物の個体差による三次元位置算出精度の低下を抑制することができる。
【0148】
従って、本実施の形態の画像処理装置12は、精度よく、対象物の三次元位置を算出することができる。また、画像処理装置12は、精度よく、対象物のサイズを算出することができる。
【0149】
さらに、本実施の形態の画像処理装置12では、探索候補点を撮像画像上に射影した射影位置と、対象物の仮サイズとから、該射影位置毎の探索窓サイズを設定するので、より高速かつ効率的に、対象物の三次元位置及びサイズを算出することができる。
【0150】
(実施の形態2)
本実施の形態では、本実施の形態では、推定部36で前に算出した対象物の三次元位置及び対象物のサイズを、次の算出時の仮三次元位置及び仮サイズとして用いる。
【0151】
図11は、本実施の形態の画像処理装置12Aの機能的構成を示すブロック図である。
【0152】
画像処理装置12Aは、第1取得部30、第2取得部32、第1設定部35、切替部39、及び推定部37を備える。推定部37は、第2設定部38、第1算出部40、第2算出部42、及び第3算出部44を備える。
【0153】
なお、第1取得部30、第2取得部32、第2設定部38、第1算出部40、第2算出部42、及び第3算出部44は、実施の形態1で説明した画像処理装置12と同様であるため説明を省略する。
【0154】
なお、本実施の形態では、第2取得部32は、対象物の仮サイズ及び対象物の仮三次元位置を、第1設定部34に代えて切替部39へ出力する。また、本実施の形態では、推定部37は、第2算出部42で算出した対象物の三次元位置及び対象物のサイズを、表示装置14へ出力する。また、推定部37は、対象物の仮のサイズとして第2算出部42で算出した対象物のサイズと、推定部37で新たに生成し直したすべての探索候補点の三次元位置および探索サイズと、を含むサンプル点データを切替部39へ出力する。
【0155】
切替部39は、対象物の仮三次元位置及び仮サイズを含む第1データを第2取得部32から取得する。また、切替部39は、推定部37からサンプル点データを取得する。そして、切替部39は、第2取得部32から取得した第1データ、及び推定部37から取得したサンプル点データの何れか一方を選択し、第1設定部35へ出力する。
【0156】
切替部39は、下記方法により、第2取得部32から取得した第1データ、及び推定部37から取得したサンプル点データの何れか一方を選択する。
【0157】
例えば、切替部39は、内部タイマーを備える。そして、切替部39は、予め測定しておいた第2取得部32の処理時間内に第2取得部32から第1データを受け付けなかったときに、推定部37から取得したサンプル点データを第1設定部35へ出力する。
【0158】
また、切替部39は、予め設定した時間内に推定部37からサンプル点データを受け付けなかったときに、第2取得部32から取得した第1データを第1設定部35へ出力する。これは、対象物が検出されない状態では、推定部37からの出力は無いためである。
【0159】
また、切替部39は、上記2つの場合以外は、推定部37から受け付けたサンプル点データを第1設定部35へ出力する。
【0160】
第1設定部35は、切替部39から、第1データまたはサンプル点データを受け付ける。第1設定部35では、切替部39から受け付けたデータが第1データであるかサンプル点データであるかによって異なる処理を行う。
【0161】
第1設定部35は、受け付けたデータが、第2取得部32から出力された第1データである場合には、実施の形態1で説明した第1設定部34と同様にして、探索候補点を設定する。そして、設定した探索候補点と、第2取得部32から切替部39を介して取得した対象物の仮サイズと、を含むサンプル点データを生成し、推定部37へ出力する。
【0162】
また、第1設定部35は、切替部39から受け付けたデータが、推定部37から出力されたサンプル点データである場合には、受け付けたサンプル点データに含まれる探索候補点の三次元位置を修正した後に、推定部37へ出力する。
【0163】
第1設定部35は、切替部39から受け付けたデータが、推定部37から出力されたサンプル点データである場合には、受け付けたサンプル点データに含まれる対象物の探索候補点の三次元位置は、時間的には過去の三次元位置となる。このため、第1設定部35では、受け付けたサンプル点データに含まれる探索候補点の三次元位置を、以下の運動モデルに従って修正する。
【0164】
一例として、時刻tにおける探索候補点の三次元位置X、Y、Zに、X軸Y軸Z軸のそれぞれの方向の速度を加えた(文字の上のドットで表記)6次元ベクトルPを下記式(23)で示す。
【0165】
【数19】

【0166】
また、推定部37から切替部39を介してサンプル点データを受け付けた時刻t−1における、対象物の仮三次元位置を6次元ベクトルPt−1で表す。そして、対象物が等速直線運動をしていると仮定し、第1設定部35は、6次元ベクトルPを式(24)によって算出する。
【0167】
【数20】

【0168】
式(24)中、なお、該Sは、上記式(16)と同じである。また、式(24)中、Fは、下記式(25)で示す。
【0169】
【数21】

【0170】
なお、共分散行列は、上述した式(16)に従う。また、速度を表す要素は、三次元ガウス分布N(0、S)とする。このほか、定加速度運動をしていると仮定したモデルに従って、ベクトルPを求めてもよい。また、行列Fを単位行列にしてもよい。この場合、速度についてはベクトルPに反映されなく、ランダムウォークモデルと同一になる。
【0171】
推定部37は、対象物の複数の撮像画像を第1取得部30から取得する。また、推定部37は、サンプル点データを第1設定部35から受け付ける。そして、推定部37は、実施の形態1の推定部36と同様にして、対象物の三次元位置及び対象物のサイズを算出し、出力する。また、上述したように、推定部37は、更に、第2算出部42で算出した対象物の三次元位置及び対象物のサイズと、第3算出部44で算出した各探索候補点の尤度Liと、を含むサンプル点データを切替部39へ出力する。
【0172】
次に、推定部37が実行する、対象物の三次元位置及び対象物のサイズの算出処理の手順を説明する。図12は、推定部37が実行する、対象物の三次元位置及び対象物のサイズの算出処理の手順を示すフローチャートである。
【0173】
推定部37は、ステップS200〜ステップS208の処理を、第1設定部35から受け付けた探索候補点の数分、繰り返し実行する。なお、ステップS200〜ステップS208の処理は、実施の形態1で説明した推定部36の算出処理(図9のステップS200〜ステップ208)と同様であるため、詳細な説明を省略する。
【0174】
推定部37が、すべての探索候補点について、上記ステップS200〜ステップS208の処理を行うと、第2算出部42が、対象物の三次元位置P、及び対象物のサイズを算出する(ステップS210)。なお、ステップS210の処理は、図9のステップS210の処理と同様である。
【0175】
次に、推定部37は、上記ステップS208で算出した尤度Liの高い探索候補点の近傍に、次の推定部37による算出時に用いる探索候補点が多くなるように、次の算出時に用いる探索候補点を設定する(ステップS214)。
【0176】
推定部37によるステップS214の処理は、時刻tにおいての推定部37の処理によって得られたそれぞれの探索候補点の尤度Liの高い探索候補点iの近傍に時刻t+1の探索候補点を設定すればよい。ここで、新たに設定された探索候補点の持つ探索サイズは、コピーしてもよいし、式(17)において、基準探索窓サイズを、コピーされる時刻tの探索候補点の探索窓サイズと設定した確率密度関数に基づく乱数によって指定してもよい。
【0177】
なお、尤度Liの高い探索候補点の近傍に、次の時刻t+1における推定部37による算出時に用いる探索候補点が多くなるように、次の算出時に用いる探索候補点を設定する方法は、具体的には、次のように行う。
【0178】
時刻tにおいての探索候補点の総数をSとする。また、すべての探索候補点のS206で求めた尤度の総和Φに対する、時刻tにおける探索候補点iの尤度の割合をφi,tとする。この探索候補点i、tの3次元位置と同位置に、(φi、t/Φ×S)個の時刻t+1における探索候補点を生成する。つまり、尤度が低い時刻tの探索候補点であれば、1個も時刻t+1における探索候補点が生成されなくなり、尤度の低い探索候補点は時刻t+1で消滅する。また、尤度の高い時刻tの探索候補点は、複数コピーされることになり、同位置を探索するように見えるが、上述したように、第1設定部35で、サンプル点データを受け付けた場合、それに含まれる複数の探索候補点は、それぞれ修正されるため、それぞれ別の位置の探索候補点となる。これにより、時刻tで尤度の高い探索候補点であればあるほど、その近傍に時刻t+1の探索候補点が設定されることになる。
【0179】
たとえば、時刻tにおける探索候補点の総数を100、尤度の総和を1とする。時刻tの探索候補点iの尤度を0.5とすると、尤度の割合φωは0.5になる。つまり、探索候補点iと同位置には、50個の時刻t+1における探索候補点が生成される。尤度0.01の探索候補点ならば、同位置に1個の時刻t+1の探索候補点が生成される。尤度0.01よりも低い探索候補点であれば、消滅する。
【0180】
次に、推定部37は、出力処理を行った後に(ステップS216)、本ルーチンを終了する。ステップS216において、推定部37は、上記ステップS214で設定した探索候補点、上記ステップS210で算出した対象物の三次元位置及び対象物のサイズを含む、サンプル点データを切替部39へ出力する。また、推定部37は、上記ステップS210で算出した対象物の三次元位置及び対象物のサイズを、表示装置14へ出力する。
【0181】
なお、ステップS216における、対象物の三次元位置、及び対象物のサイズの出力先は、表示装置14に限られない。例えば、画像処理装置12Aを、有線通信網または無線通信網を介して、各種外部装置と接続した構成とする。各種外部装置としては、例えば、公知の記憶媒体や、パーソナルコンピュータや、携帯端末等が挙げられる。そして、推定部37は、上記ステップS210で算出した、対象物の三次元位置及び対象物のサイズを、この各種外部装置に出力してもよい。
【0182】
以上説明したように、本実施の形態の画像処理装置12Aでは、前に算出した、対象物の三次元位置及びサイズを、次に対象物の三次元位置及びサイズを算出するときの仮三次元位置及び仮サイズとして用いる。
【0183】
このため、第1取得部30、第2取得部32、及び第1設定部35による処理が終了してから、第1取得部30から取得した撮像画像及び第1設定部35から取得した仮サイズ及び仮三次元位置に基づいて、推定部37で対象物の三次元位置及び対象物のサイズを算出する場合に比べて、画像処理装置12Aにおける処理時間の短縮を図ることができる。
【0184】
具体的には、第1取得部30の処理時間と、第2取得部32及び第1設定部35の処理時間と、が異なる場合には、遅い方の処理の完了を待ってから推定部37で処理を行う必要があった。特に、第2取得部32では、例えばステレオカメラを使用した探索方法を行う場合、撮像画像全体を複数サイズの探索窓を走査させることで、撮像画像内の各走査位置に対象物が存在するかどうかを判定する必要があった。このため、対象物の仮三次元位置および仮サイズを取得するまでの時間間隔が大きくなっていた。一方、第1取得部30は、撮像画像を撮像装置16から取得するだけであるので、その処理時間は第2取得部32より短い。
【0185】
一方、本実施の形態では、前に算出した、対象物の三次元位置及びサイズを、次に対象物の三次元位置及びサイズを算出するときの仮三次元位置及び仮サイズとして用いるので、画像処理装置12Aにおける処理時間の短縮を図ることができる。
【0186】
(実施の形態3)
本実施の形態では、画像処理装置12または画像処理装置12Aで算出した、対象物の三次元位置及びサイズに基づいて、表示部21の視域を調整する形態を説明する。
【0187】
視域とは、表示装置14の表示部21に表示された立体画像を視聴者が観察可能な範囲を示す。この観察可能な範囲は、実空間における範囲である。この視域は、表示部21の表示パラメータの組み合わせによって定まる。このため、表示部21の表示パラメータを設定することで、視域を設定することができる。
【0188】
図13〜図16は、表示部21の各表示パラメータの調整による、視域80の設定位置や設定範囲の制御の説明図である。
【0189】
図13〜図16には、表示部21における表示パネル20及び光線制御部22と視域80の関係を示した。また、図13〜図16中には、適宜、各要素画像24部分を拡大した図を示した。
【0190】
図13(A)に示すように、表示パラメータとしては、表示パネル20と光線制御部22との相対位置、表示パネル20と光線制御部22との距離、表示部21の角度、表示部21の変形、及び表示パネル20における画素のピッチ等がある。
【0191】
表示パネル20と光線制御部22との相対位置とは、光線制御部22の光学的開口部の中心に対する、対応する要素画像24の位置を示す。表示パネル20と光線制御部22との距離は、光線制御部22の開口部と対応する要素画像24との最短距離を示す。表示部21の角度とは、表示部21を、垂直方向を回転軸として回転させたときの、予め定めた基準位置に対する回転角度を示す。表示部21の変形とは、表示部21本体を変形させることを示す。表示パネル20における画素のピッチとは、表示パネル20の各要素画像24の画素の間隔を示す。これらの表示パラメータの組み合わせによって、実空間において視域80が設定される領域が一意に定まる。
【0192】
まず、図13を用いて、表示パネル20と光線制御部22との距離や、表示パネル20と光線制御部22との相対位置を調整することによって、視域80の設定される位置等を制御する場合を説明する。
【0193】
図13(A)は、表示部21とその視域80の基本的な位置関係を示す。図13(B)は、表示パネル20と光線制御部22との距離を図13(A)に比べて短くした場合を示している。
【0194】
図13(A)及び図13(B)に示すように、表示パネル20と光線制御部22との距離を短くするほど、表示部21により近い位置に視域80を設定することができる(図13(A)中、視域80A、及び図13(B)中、視域80B参照)。逆に、表示パネル20と光線制御部22との距離を長くするほど、表示部21からより離れた位置に視域80を設定することができる。なお、視域80が表示部21の近い位置に設定されるほど、光線密度は減る。
【0195】
図13(C)は、表示パネル20の光線制御部22に対する相対位置を、図13(A)に比べて右方向(図13(C)中、矢印R方向参照)に移動させた場合を示している。図13(A)及び図13(C)に示すように、表示パネル20を光線制御部22に対して相対的に右方向へ移動させると、視域80は左方向(図13(C)中、矢印L方向)に移動する(図13(C)中、視域80C参照)。逆に、表示パネル20の光線制御部22に対する相対位置を、図13(A)に比べて左方向に移動させると、視域80は右方向に移動する(不図示)。
【0196】
次に、図14及び図15を用いて、表示パネル20に表示する画素のピッチ(画素の並び)を調整することによって、視域80が設定される位置等を制御する場合を説明する。
【0197】
図14は、表示部21における、表示パネル20の各画素と光線制御部22とを拡大して示す。図15(A)は、表示部21とその視域80(視域80A)との基本的な位置関係を示す。表示パネル20の画面の端(右端(図14中、矢印R方向端部)、左端(図14中、矢印L方向端部))ほど、表示パネル20の各画素と光線制御部22との位置を相対的に大きくずらす。すると、視域80は、より表示部21に近い位置に移動し、かつ視域80の幅がより狭くなる(図15(B)中、視域80D参照)。なお、視域80の幅とは、各視域80における水平方向の最大長を示す。この視域80の幅は、視域設定距離と称される場合がある。
【0198】
一方、表示パネル20の画面の端ほど、表示パネル20の各画素と光線制御部22との位置を相対的にずらす量を小さくする。すると、視域80は、より表示部21から遠い位置に移動し、かつ視域80の幅がより広くなる(図15(C)中、視域80E参照)。
【0199】
次に、図16を用いて、表示部21の角度、表示部21の変形、表示パネル20と光線制御部22との相対位置の調整によって、視域80の設定される位置等を制御する場合を説明する。
【0200】
図16(A)は、表示部21とその視域80(視域80A)の基本的な位置関係を示す。図16(B)は、表示部21を回転(図16中、矢印V方向)させた状態を示す。図16(A)及び図16(B)に示すように、表示部21を回転して表示部21の角度を調整すると、視域80の位置は、視域80Aから視域80Fへ移動する。
【0201】
図16(C)は、光線制御部22に対する表示パネル20の位置及び方向を調整した状態を示す。図16(C)に示すように、光線制御部22に対する表示パネル20の位置及び方向を変更すると、視域80は視域80Aから視域80Gに移動する。
【0202】
図16(D)は、表示部21全体を変形させた状態を示す。図16(A)及び図16(D)に示すように、表示部21を変形させることによって、視域80は、視域80Aから視域80Hへ変化する。
【0203】
上述のように、表示部21の表示パラメータの組み合わせによって、実空間において視域80の設定される領域(位置や大きさ等)が一意に定まる。
【0204】
次に、画像表示装置10の機能的構成について説明する。
【0205】
図17は、画像表示装置10の機能的構成を示すブロック図である。画像表示装置10は、画像処理装置12及び表示装置14を備える。画像処理装置12の構成は、上記実施の形態1で説明したため、詳細な説明を省略する。
【0206】
表示装置14は、決定部28、制御部29、及び表示部21を備える。表示部21は、実施の形態1で説明したため詳細な説明を省略する。
【0207】
決定部28は、画像処理装置12から、対象物の三次元位置及び対象物のサイズを受け付ける。なお、決定部28は、画像処理装置12から少なくとも対象物の三次元位置を受け付ければよい。決定部28は、受け付けた三次元位置において立体画像を観察可能な視域を示す視域情報を算出する。この視域情報の算出は、たとえば、予めメモリ(不図示)内に、各表示パラメータの組み合わせに対応する視域を示す視域情報を記憶しておく。そして、決定部28は、画像処理装置12から取得した三次元位置を視域に含む視域情報を該メモリから検索することによって、視域情報を算出する。
【0208】
また、決定部28は、画像処理装置12から取得した該三次元位置を含む、画像処理装置12から取得した対象物のサイズに相当する領域を算出し、該領域を含む視域の視域情報を該メモリから検索することによって、視域情報を算出してもよい。
【0209】
制御部29は、決定部28が算出した視域情報に応じた視域を設定するように、表示部21を制御する、表示制御処理を行う。すなわち、制御部29は、表示部21の表示パラメータを調整し、該視域を設定する。具体的には、表示部21には、各表示パラメータを調整するための不図示の駆動部が設けられている。また、制御部29は、予めメモリ(不図示)内に、各表示パラメータの組み合わせに対応する視域を示す視域情報を記憶している。そして、制御部29は、決定部28で算出した視域情報に対応する表示パラメータの組み合わせを該メモリから読み取り、読み取った各表示パラメータに対応する駆動部を制御する。
【0210】
これにより、表示部21は、画像処理装置12から受け付けた対象物の三次元位置を含む領域を視域とした立体画像を表示する。
【0211】
上述のように、画像処理装置12で算出する対象物の三次元位置は、高精度に対象物の位置を特定した三次元位置である。このため、表示装置14は、精度よく、対象物の三次元位置に視域を設定することができる。また、視域内に位置するように視聴者が自ら場所を移動する必要がなくなるので、利便性も向上する。
【0212】
なお、本実施の形態では、表示装置14が、決定部28及び制御部29を備えた構成である場合を説明したが、画像処理装置12が、決定部28及び制御部29を備えた構成であってもよい。
【0213】
また、本実施の形態では、画像表示装置10は、画像処理装置12及び表示装置14を備えた構成である場合を説明したが、画像処理装置12に代えて、実施の形態2で説明した画像処理装置12Aを備えた構成であってもよい。
【0214】
なお、実施の形態1〜3における画像処理装置12及び画像処理装置12Aで実行する取得処理、及び算出処理、並びに表示装置14で実行する表示制御処理の各々を実行するためのプログラムは、ROM等に予め組み込まれて提供される。
【0215】
実施の形態1〜3における画像処理装置12及び画像処理装置12Aで実行する取得処理、及び算出処理、並びに表示装置14で実行する表示制御処理の各々を実行するためのプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
【0216】
さらに、実施の形態1〜3における画像処理装置12及び画像処理装置12Aで実行する取得処理、及び算出処理、並びに表示装置14で実行する表示制御処理の各々を実行するためのプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、実施の形態1〜3における画像処理装置12及び画像処理装置12Aで実行する取得処理、及び算出処理、並びに表示装置14で実行する表示制御処理の各々を実行するためのプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0217】
実施の形態1〜3における画像処理装置12及び画像処理装置12Aで実行する取得処理、及び算出処理、並びに表示装置14で実行する表示制御処理の各々を実行するためのプログラムは、上述した各部(第1取得部30、第2取得部32、第1設定部34、第1設定部35、推定部36、推定部37、第2設定部38、切替部39、第2算出部42、第1算出部40、第3算出部44)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記ROMからプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、これらの各機能部が主記憶装置上に生成されるようになっている。
【0218】
なお、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0219】
10 画像表示装置
12、12A 画像処理装置
14 表示装置
28 決定部
29 制御部
21 表示部
30 第1取得部
32 第2取得部
34、35 第1設定部
36、37 推定部
38 第2設定部
39 切替部
40 第1算出部
42 第2算出部
44 第3算出部

【特許請求の範囲】
【請求項1】
対象物が複数の位置から撮像された複数の撮像画像を取得する第1取得部と、
前記対象物の仮三次元位置と、前記対象物の仮サイズとを取得する第2取得部と、
前記仮三次元位置の近傍に少なくとも1つの探索候補点を設定する第1設定部と、
前記探索候補点を前記撮像画像に射影した射影位置毎に、前記対象物を探索するための探索窓であって、前記探索候補点の位置と前記仮サイズとに基づくサイズの前記探索窓を設定する第2設定部と、
前記探索窓内において、前記対象物が含まれるかどうかを示す評価値を算出する第1算出部と、
前記評価値に基づいて、前記対象物の三次元位置を算出する第2算出部と、
を備えた画像処理装置。
【請求項2】
前記第2設定部は、前記仮サイズに基づいて、前記対象物の1または複数の仮サイズを新たに算出し、新たに算出した該仮サイズと前記射影位置とから、前記射影位置毎に前記探索窓サイズを設定する、請求項1に記載の画像処理装置。
【請求項3】
前記第1算出部は、前記撮像画像上の前記探索窓サイズの探索窓内の画素値に基づいて、前記探索窓内に前記対象物が含まれているか否かを示す第1尤度を前記評価値として算出する、請求項2に記載の画像処理装置。
【請求項4】
前記第1設定部は、前記第2算出部によって算出された前記三次元位置を前記仮三次元位置として、前記探索候補点を設定する、請求項3に記載の画像処理装置。
【請求項5】
前記第1算出部は、前記対象物の予め定めた姿勢に基づいて前記評価値を算出する請求項1に記載の画像処理装置。
【請求項6】
前記第1設定部は、前記対象物の予め定めた運動モデルに応じて前記探索候補点を設定する、請求項1に記載の画像処理装置。
【請求項7】
前記評価値に基づいて、前記射影位置に対応する前記探索候補点に前記対象物が存在する度合を示す第2尤度を算出する第3算出部を更に備え、
前記第2算出部は、前記第2尤度に基づいて前記三次元位置を算出する、
請求項1に記載の画像処理装置。
【請求項8】
表示部に表示される立体画像を視聴者が観察可能な視域を前記三次元位置に決定する決定部と、
前記視域が設定されるよう、前記表示部を制御する制御部と、
備えた請求項1に記載の画像処理装置。
【請求項9】
対象物が複数の位置から撮像された複数の撮像画像を取得し、
前記対象物の仮三次元位置と、前記対象物の仮サイズを取得し、
実空間における前記仮三次元位置の近傍に少なくとも1つの探索候補点を設定し、
前記探索候補点を前記撮像画像に射影した射影位置毎に、前記対象物を探索するための探索窓であって、前記探索候補点の位置と前記仮サイズとに基づくサイズの前記探索窓を設定し、
前記探索窓内において、前記対象物が含まれるかどうかを示す評価値を算出し、
前記評価値に基づいて前記対象物の三次元位置を算出する、
画像処理方法。
【請求項10】
対象物が複数の位置から撮像された複数の撮像画像を取得する第1取得部と、
前記対象物の仮三次元位置と、前記対象物の仮サイズを取得する第2取得部と、
実空間における前記仮三次元位置の近傍に少なくとも1つの探索候補点を設定する第1設定部と、
前記探索候補点を前記撮像画像に射影した射影位置毎に、前記対象物を探索するための探索窓であって、前記探索候補点の位置と前記仮サイズとに基づくサイズの前記探索窓を設定する第2設定部と、
前記探索窓内において、前記対象物が含まれるかどうかを示す評価値を算出する第1算出部と、
前記評価値に基づいて前記対象物の三次元位置を算出する第2算出部と、
立体画像を表示可能な表示部と、
前記立体画像を視聴者が観察可能な視域を前記三次元位置に決定する決定部と、
前記視域が設定されるよう、前記表示部を制御する制御部と、
備えた画像表示装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2013−105343(P2013−105343A)
【公開日】平成25年5月30日(2013.5.30)
【国際特許分類】
【出願番号】特願2011−249164(P2011−249164)
【出願日】平成23年11月14日(2011.11.14)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】