説明

画像処理装置、画像処理方法

【課題】 高解像度の画像に対してリアルタイムでの物体認識を可能とする技術を提供すること。
【解決手段】 全方位の撮像が可能な撮像装置が撮像した画像を高解像度画像として取得すると共に、該高解像度画像から解像度を低下させた画像を低解像度画像として取得する。低解像度画像から、予め定められた被写体が写っている領域を被写体領域として検出する。高解像度画像において、被写体領域に対応する領域を特定し、該特定した領域に対して、該領域内の被写体を認識する処理を行う。認識結果を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、広範囲を撮像可能な撮像装置による撮像画像に対する認識処理を効率的に行う為の技術に関するものである。
【背景技術】
【0002】
魚眼レンズや全方位ミラーなどの広範囲撮像装置を用いて、通常の画角の撮像装置に比べて広い範囲を一度に撮像する方式が知られている。これら広範囲撮像装置で撮像した画像の中から動体を検出し、その動体の切り出し領域を自動的に決定して追尾する技術が特許文献1,2に開示されている。これらの特許文献では、撮像装置に起因する歪みを補正することにより、動体から歪みを取り除くことを行っている。
【0003】
広範囲撮像装置として全方位ミラーを用いる場合は、画像の歪みの補正方法としてパノラマ展開と透視投影展開がよく用いられる。パノラマ展開は、全方位ミラーの周囲に仮想的な円柱を想定し、広範囲画像を円柱の側面に投影する方法である。透視投影展開は、全方位ミラーの焦点からある視線方向に鉛直平面を想定し、広範囲画像を鉛直平面に投影する方法である。また、動体検知を行うための技術が特許文献3に開示されている。また、人体検出や顔検出などの物体認識を行うための技術が特許文献4,5に開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008-048443号公報
【特許文献2】特開2002-064812号公報
【特許文献3】特開2008-165792号公報
【特許文献4】特開2009-211311号公報
【特許文献5】特開2008-234169号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
広範囲撮像装置で撮像した画像(広範囲画像)に対して人体検出、顔検出、顔認識などの物体認識処理を行うニーズが存在する。既存の物体認識手法は、通常の画角の撮像装置で撮像した映像に対して行うように設計されている。そのため、広範囲画像に対してこれら物体認識を行うためには、広範囲撮像装置に起因する画像の歪みを補正する処理を前処理として行う必要がある。
【0006】
一方で、広範囲撮像装置で使用する撮像センサの解像度は現在ますます高解像度化している。そのため、このような広範囲撮像装置が撮像した画像に対して上記の前処理を行うと、この前処理にかかる処理量は従来に比べて増大し、リアルタイムでの物体認識を高フレームレートで行なえない、という課題が発生する。
【0007】
本発明はこのような問題に鑑みてなされたものであり、高解像度の画像に対してリアルタイムでの物体認識を可能とする技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の目的を達成するために、例えば、本発明の画像処理装置は、全方位の撮像が可能な撮像装置が撮像した画像を高解像度画像として取得すると共に、該高解像度画像から解像度を低下させた画像を低解像度画像として取得する取得手段と、前記取得手段が取得した低解像度画像から、予め定められた被写体が写っている領域を被写体領域として検出する検出手段と、前記取得手段が取得した高解像度画像において、前記被写体領域に対応する領域を特定し、該特定した領域に対して、該領域内の被写体を認識する処理を行う認識手段と、前記認識手段による認識結果を出力する出力手段とを備えることを特徴とする。
【発明の効果】
【0009】
本発明の構成により、高解像度の画像に対してリアルタイムでの物体認識を行うことができる。
【図面の簡単な説明】
【0010】
【図1】撮像システムの機能構成例を示すブロック図。
【図2】全方位カメラ部101を除く各部の動作のフローチャート。
【図3】物体検知結果302、物体認識対象範囲303を説明する図。
【図4】歪み補正部106による歪み補正処理を説明する図。
【図5】物体認識処理部107による認識処理を説明する図。
【図6】結果表示部108による表示例を示す図。
【図7】撮像システムの機能構成例を示すブロック図。
【図8】全方位カメラ部101を除く各部の動作のフローチャート。
【発明を実施するための形態】
【0011】
以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載した構成の具体的な実施例の一つである。
【0012】
[第1の実施形態]
先ず、本実施形態に係る画像処理装置を適用した撮像システムの機能構成例について、図1のブロック図を用いて説明する。全方位カメラ部101は、カメラと、回転双曲面の形をしたミラーと、を組み合わせることで、広角を一度に撮影することを可能にしたカメラである。ミラーには、回転放物面、または円錐の形をした全方位ミラーを利用してもよい。なお、全方位カメラ部101は、魚眼レンズを用いた撮像装置や、複数の撮像装置からの映像を合成するような装置であってもよい。つまり、全方位カメラ部101は、一度に周辺の映像(動画像)を入力できるものであれば、如何なる構成を有していてもよい。ただし、全方位カメラ部101により得られる撮像画像は、幾何的な歪みを含むので、歪み補正処理が必要になることが多い。
【0013】
全方位カメラ部101は、このような構成により撮像した各フレームの画像(広範囲画像)を順次出力すると共に、この撮像した画像より低解像度の画像を出力する機能を有する。すなわち、全方位カメラ部101は、全方位の撮像が可能な撮像装置であって、撮像した画像を高解像度画像として出力すると共に、該高解像度画像よりも低解像度の画像である低解像度画像を出力する撮像装置である。
【0014】
低解像度画像は、全方位カメラ部101が有する撮像素子群から適当な間隔(荒い間隔)で撮像素子を選択し、選択した撮像素子から画素を読みだすことで出力可能である。一方、高解像度画像は、全方位カメラ部101の有する全ての撮像素子から画素を読み出すことで出力可能である。低解像度画像の生成は、単純な画素間引きによってだけではなく、高解像度画像からバイリニア法などのアルゴリズムによっても可能である。これにより、例えば、全方位カメラ部101はm画素×n画素の解像度を有する高解像度画像を出力すると共に、(m/2)画素×(n/2)画素の解像度を有する低解像度画像を出力することができる。そのため、全方位カメラ部101は、高解像度画像を出力する間隔よりも短い間隔で低解像度画像を出力することになる。
【0015】
なお、全方位カメラ部101は、撮像した各高解像度画像には、解像度や撮像タイミングを含むメタデータを付加してから出力する。また、全方位カメラ部101は、各低解像度画像には、解像度や撮像タイミングを含むメタデータを付加してから出力する。
【0016】
高解像度画像取込部102は、全方位カメラ部101から順次出力される高解像度画像を取得し、取得した高解像度画像を順次、同期部110に対して出力する。また、この高解像度画像は、必要に応じて結果表示部108や結果保存部109に対して出力してもよい。
【0017】
低解像度画像取込部103は、全方位カメラ部101から順次出力される低解像度画像を取得し、取得した低解像度画像を順次、動体検知部104に対して出力する。また、この低解像度画像は、必要に応じて結果表示部108や結果保存部109に対して出力してもよい。
【0018】
動体検知部104は、低解像度画像取込部103から取得した低解像度画像から、予め定められた被写体(動体)を検出する。動体の検出は、背景差分法を用いて前景と背景とを分離し、前景オブジェクトを動体とみなす方法などを用いて行うことができる。もちろん、動体の検出方法についてはこれに限るものではない。
【0019】
物体認識対象範囲決定部105は、動体検知部104から低解像度画像を受けると、この低解像度画像において、動体検知部104が検出した被写体を包含する領域を被写体領域として決定する。そして物体認識対象範囲決定部105は、この低解像度画像と、決定した被写体領域を示す情報(物体認識対象範囲)と、を同期部110に対して出力する。
【0020】
同期部110は、高解像度画像取込部102からは高解像度画像を取得すると共に、物体認識対象範囲決定部105からは低解像度画像及び物体認識対象範囲を取得する。上記の通り、全方位カメラ部101は、高解像度画像を出力する間隔よりも短い間隔で低解像度画像を出力する。然るに同期部110は、高解像度画像取込部102から高解像度画像を取得する間隔よりも短い間隔で、物体認識対象範囲決定部105から低解像度画像及び物体認識対象範囲を取得することになる。よって同期部110は、物体認識対象範囲決定部105から低解像度画像及び物体認識対象範囲を取得すると、取得した低解像度画像及び物体認識対象範囲をセットにして、本装置内のメモリに格納する。そして同期部110は、高解像度画像取込部102から高解像度画像(着目高解像度画像)を取得すると、この着目高解像度画像に付加されているメタデータ中の撮像タイミングを参照する。そして同期部110は、この撮像タイミングに最も近い撮像タイミングを含むメタデータが付加された低解像度画像とセットにしてメモリに格納されている物体認識対象範囲をメモリから読み出す。そして同期部110は、読み出した物体認識対象範囲と、この着目高解像度画像と、をセットにして歪み補正部106に出力する。
【0021】
歪み補正部106は、同期部110から受けた高解像度画像において、同期部110から受けた物体認識対象範囲に対応する領域を特定する。そして歪み補正部106は、この特定した領域に対して、全方位カメラ部101に起因する、幾何的な歪みを補正する歪み補正処理を行う。このように、歪み補正部106は、特定した領域に対する歪み補正処理を行うことで、この領域を矩形化した画像を歪み補正画像として生成する。そして歪み補正部106は、この歪み補正画像を物体認識処理部107に対して出力する。
【0022】
物体認識処理部107は、歪み補正部106から受けた歪み補正画像に対して、該歪み補正画像内の被写体を認識する処理を行う。この被写体の認識は、例えば、人体検出、顔検出、顔認識などの物体認識である。なお、画像の特徴量を使って物体の種別を判別するものであれば、認識対象は人体や顔に限定するものではない。そして物体認識処理部107は、認識した結果、例えば、認識した対象に係る情報を、結果表示部108や結果保存部109に対して出力する。
【0023】
結果表示部108は、CRTや液晶画面などの表示装置により構成されている。結果表示部108は、高解像度画像取込部102から出力された高解像度画像、低解像度画像取込部103から出力された低解像度画像、歪み補正部106により生成された歪み補正画像、物体認識処理部107による認識結果などを表示することができる。どの情報を取得してどのような表示を行うのかについては特に限定するものではない。例えば、高解像度画像に、認識した対象に係る情報を重畳させて表示してもよい。もちろん、表示内容を切り替えるようにしてもよい。
【0024】
結果保存部109は、ハードディスクドライブ装置や可搬型メモリ装置などのメモリ装置により構成されている。結果保存部109は、高解像度画像取込部102から出力された高解像度画像、低解像度画像取込部103から出力された低解像度画像、歪み補正部106により生成された歪み補正画像、物体認識処理部107による認識結果などを保存することができる。例えば、認識結果をメタデータとして結果保存部109に格納してもよい。どの情報を取得してどのように保存するのかについては特に限定するものではない。
【0025】
次に、全方位カメラ部101を除く各部の動作について、図2のフローチャートを用いて説明する。先ずステップS201では、高解像度画像取込部102は、全方位カメラ部101から出力された高解像度画像を取得すると共に、低解像度画像取込部103は、全方位カメラ部101から出力された低解像度画像を取得する。
【0026】
ステップS202では動体検知部104は、低解像度画像取込部103から取得した低解像度画像から被写体(動体)を検出する。動体の検出について、図3を用いて説明する。図3において低解像度画像301は、全方位カメラ部101として回転体ミラーを用いた撮像機器(以下、全方位カメラと呼ぶ)を使用した場合に、この撮像機器を用いて撮像された低解像度画像である。ステップS201でこのような低解像度画像301を取得した場合、ステップS202では動体検知部104は、物体検知結果302として示した被写体を検出する。
【0027】
ステップS202において被写体が検出された場合には処理はステップS203を介してステップS204に進み、検出されなかった場合には、処理はステップS203を介してステップS207に進む。
【0028】
ステップS204では物体認識対象範囲決定部105は、動体検知部104から低解像度画像を受けると、この低解像度画像において、動体検知部104が検出した被写体を包含する領域を被写体領域として決定する。被写体領域の決定について、図3を用いて説明する。
【0029】
物体認識対象範囲決定部105は、物体検知結果302を包含する領域(被写体領域)として、物体認識対象範囲303を決定する。この物体認識対象範囲303の形状は、歪み補正部106によって補正された場合に矩形となるような形状である必要がある。図3の場合、低解像度画像301は全方位カメラ部101により撮像されたものであるので、物体認識対象範囲303の形状は図3に示す如く扇形となっている。この物体認識対象範囲303は、低解像度画像301の中心位置304を通り且つ物体検知結果302を挟む2本の直線と、中心位置304を中心とする2つの円の弧の一部と、から成る。このようにして設定された物体認識対象範囲303は、歪み補正部106による歪み補正処理が施されると、その形状が矩形となる。物体認識対象範囲303は、物体検知結果302のサイズに対して一定の比率、または物体検知結果302のサイズに関わらず一定の大きさの余白を含むように決定してもよい。
【0030】
図3の場合、物体認識対象範囲303は、点A305、点B306、点C307、点D308のそれぞれの座標位置、中心位置304、により定義可能である。そのため、物体認識対象範囲決定部105は、これらの位置の情報を物体認識対象範囲として同期部110に対して出力する。
【0031】
なお、物体認識対象範囲303の形状が図3に示すような単純な形状ではない場合、物体認識対象範囲決定部105は、物体認識対象範囲303の枠上の各点の座標位置を物体認識対象範囲として、同期部110に対して出力する。
【0032】
そして物体認識対象範囲決定部105は、動体検知部104から受けた低解像度画像と、決定した物体認識対象範囲と、を同期部110に対して出力する。同期部110は、高解像度画像取込部102からは高解像度画像を取得すると共に、物体認識対象範囲決定部105からは低解像度画像及び物体認識対象範囲を取得する。そして同期部110は、高解像度画像取込部102から高解像度画像(着目高解像度画像)を取得すると、この着目高解像度画像に付加されているメタデータ中の撮像タイミングを参照する。そして同期部110は、この撮像タイミングに最も近い撮像タイミングを含むメタデータが付加された低解像度画像とセットにしてメモリに格納されている物体認識対象範囲をメモリから読み出す。そして同期部110は、読み出した物体認識対象範囲と、この着目高解像度画像と、をセットにして歪み補正部106に出力する。
【0033】
ステップS205で歪み補正部106は、同期部110から受けた高解像度画像において、物体認識対象範囲に対応する領域を特定し、特定した領域に対して、全方位カメラ部101に起因する、幾何的な歪みを補正する歪み補正処理を行う。歪み補正部106による歪み補正処理について、図4を用いて説明する。歪み補正部106は、同期部110から高解像度画像401を受けると、同期部110から受けた物体認識対象範囲303に対応する領域を物体認識対象範囲403として設定する。例えば、高解像度画像401の解像度がm画素×n画素であり、低解像度画像301の解像度が(m/2)画素×(n/2)画素である場合、物体認識対象範囲303に含まれるX座標値、Y座標値をそれぞれ2倍にしたものが物体認識対象範囲403となる。
【0034】
そして歪み補正部106は、このようにして得られた物体認識対象範囲403に対する歪み補正処理を行うことで、この物体認識対象範囲403を矩形化した画像を歪み補正画像として生成する。歪み補正は、全方位カメラ部101の特性を考慮して行うことができる。本実施形態では、パノラマ展開を用いて歪み補正画像を得る手法をとる。しかし、歪み補正画像の生成方法についてはこの方法に限るものではなく、透視投影展開を用いてもよい。
【0035】
ステップS206では物体認識処理部107は、歪み補正部106から受けた歪み補正画像に対して、該歪み補正画像内の被写体を認識する処理を行う。この認識処理について、図5を用いて説明する。歪み補正部106から図5に示す歪み補正画像501が得られた場合、物体認識処理部107がこの歪み補正画像501に対して人体検出を行うと、人体の領域を示す人体認識結果502が得られる。また、物体認識処理部107がこの歪み補正画像501に対して顔検出を行うと、顔の領域を示す顔検出結果503が得られる。そして物体認識処理部107は、認識した結果を、メタデータとして結果表示部108や結果保存部109に対して出力する。
【0036】
ステップS207では結果表示部108は、高解像度画像、低解像度画像、歪み補正画像、認識結果のうち1以上を表示する。例えば、高解像度画像において認識した対象の領域に枠を付してからこの高解像度画像を表示する。なお、認識や検出した領域(502,503)に対応する高解像度画像(低解像度画像)上の領域に枠を付す場合、認識や検出した領域に対して上記の歪み補正処理の逆処理を行うことで得られる領域に枠を付す必要がある。
【0037】
結果表示部108による表示例を図6に示す。図6では、表示ウィンドウ601の左側に高解像度画像401を表示していると共に、この高解像度画像401上に物体認識対象範囲403の枠を表示している。表示ウィンドウ601の右側には歪み補正画像501を表示していると共に、この歪み補正画像501上に人体認識結果502及び顔検出結果503を示す枠を表示している。
【0038】
ステップS208では結果保存部109は、高解像度画像取込部102からの高解像度画像、低解像度画像取込部103からの低解像度画像、歪み補正部106により生成された歪み補正画像、物体認識処理部107による認識結果などを保存する。
【0039】
そして、ユーザが不図示の操作部を操作して終了指示を入力したことを検知した場合等、既定の終了条件が満たされたことを検知した場合には、処理はステップS209を介して終了する。一方、規定の終了条件が満たされたことを検知していない場合は、処理はステップS209を介してステップS201に戻る。
【0040】
なお、高解像度画像、低解像度画像、歪み補正画像、認識結果の出力先については結果表示部108、結果保存部109に限るものではなく、例えばネットワークを介して外部の装置に対して送信するようにしてもよい。
【0041】
[第2の実施形態]
本実施形態に係る画像処理装置を適用した撮像システムの機能構成例について、図7のブロック図を用いて説明する。図7に示した構成は、図1に示した構成から歪み補正部106を省くと共に、全方位カメラ部101が魚眼レンズを備えたカメラであること以外は、図1に示した構成と同様である。然るに以下では、第1の実施形態と同じ部分については説明を省略し、第1の実施形態と異なる点のみについて説明する。
【0042】
本実施形態に係る全方位カメラ部101は、魚眼レンズを備えたカメラであること以外は、第1の実施形態に係る全方位カメラ部101と同様の機能を有する。すなわち、本実施形態に係る全方位カメラ部101も、全方位の撮像が可能な撮像装置であって、撮像した画像を高解像度画像として出力すると共に、該高解像度画像よりも低解像度の画像である低解像度画像を出力する撮像装置である。そして本実施形態に係る全方位カメラ部101も、撮像した各高解像度画像には、解像度や撮像タイミングを含むメタデータを付加してから出力する。また、本実施形態に係る全方位カメラ部101も、各低解像度画像には、解像度や撮像タイミングを含むメタデータを付加してから出力する。
【0043】
物体認識処理部107は、同期部110から受けた高解像度画像において、同期部110から受けた物体認識対象範囲に対応する領域を特定する。この領域の特定方法については、第1の実施形態と同様にして行う。そして物体認識処理部107は、この特定した領域に対して、該領域内の被写体を認識する処理を行う。
【0044】
次に、全方位カメラ部101を除く各部の動作について、図8のフローチャートを用いて説明する。図8において、図2と同じ処理ステップには同じステップ番号を付しており、その説明は省略する。
【0045】
ステップS210では物体認識処理部107は、同期部110から受けた高解像度画像において、同期部110から受けた物体認識対象範囲に対応する領域を特定する。そして物体認識処理部107は、この特定した領域に対して、該領域内の被写体を認識する処理を行う。
【0046】
[第3の実施形態]
全方位カメラ部101、結果表示部108、結果保存部109を除く各部は1つの画像処理装置を構成する各ハードウェアとして実装してもよいし、ソフトウェア(コンピュータプログラム)により実装してもよい。後者の場合、画像処理装置が管理するメモリにこのソフトウェアをインストールし、画像処理装置のCPUがこのソフトウェアを実行することで、この画像処理装置は、全方位カメラ部101、結果表示部108、結果保存部109を除く各部の動作を実行する。
【0047】
[第4の実施形態]
上記の各実施形態では、高解像度画像、低解像度画像は全方位カメラ部101から直接取得し、取得したこれらの画像を用いた認識処理について説明した。しかし、システムの構成はこれに限るものではない。
【0048】
例えば、全方位カメラ部101により撮像された各フレームの高解像度画像及び低解像度画像、を予めハードディスク装置やサーバ装置に格納しておく実施形態が考え得る。この場合、高解像度画像取込部102、低解像度画像取込部103はそれぞれ、有線や無線のネットワークを介してハードディスク装置やサーバ装置から高解像度画像、低解像度画像を取得することになる。
【0049】
このように、高解像度画像、低解像度画像の取得元には様々なものが考えられるので、それぞれの画像の取得方法は特定の方法に限定されるものではない。
【0050】
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

【特許請求の範囲】
【請求項1】
全方位の撮像が可能な撮像装置が撮像した画像を高解像度画像として取得すると共に、該高解像度画像から解像度を低下させた画像を低解像度画像として取得する取得手段と、
前記取得手段が取得した低解像度画像から、予め定められた被写体が写っている領域を被写体領域として検出する検出手段と、
前記取得手段が取得した高解像度画像において、前記被写体領域に対応する領域を特定し、該特定した領域に対して、該領域内の被写体を認識する処理を行う認識手段と、
前記認識手段による認識結果を出力する出力手段と
を備えることを特徴とする画像処理装置。
【請求項2】
前記認識手段は、前記取得手段が取得した高解像度画像において、前記被写体領域に対応する領域を特定し、該特定した領域に対して幾何的な歪みを補正する歪み補正処理を行い、該歪み補正処理を行った領域内の被写体を認識する処理を行うことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記認識手段は、前記取得手段が取得した高解像度画像において、該高解像度画像の撮像タイミングに最も近いタイミングで撮像された低解像度画像から前記検出手段が検出した被写体領域、に対応する領域を特定し、該特定した領域に対して、該領域内の被写体を認識する処理を行うことを特徴とする請求項1又は2に記載の画像処理装置。
【請求項4】
前記撮像装置は、全方位の動画像を撮像し、撮像した各フレームの画像を高解像度画像として出力すると共に、該高解像度画像から解像度を低下させた画像を低解像度画像として出力することを特徴とする請求項1乃至3の何れか1項に記載の画像処理装置。
【請求項5】
前記撮像装置は、回転双曲面、回転放物面、または円錐の形をした全方位ミラー、または、魚眼レンズを有する撮像装置であることを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。
【請求項6】
画像処理装置が行う画像処理方法であって、
前記画像処理装置の取得手段が、全方位の撮像が可能な撮像装置が撮像した画像を高解像度画像として取得すると共に、該高解像度画像から解像度を低下させた画像を低解像度画像として取得する取得工程と、
前記画像処理装置の検出手段が、前記取得工程で取得した低解像度画像から、予め定められた被写体が写っている領域を被写体領域として検出する検出工程と、
前記画像処理装置の認識手段が、前記取得工程で取得した高解像度画像において、前記被写体領域に対応する領域を特定し、該特定した領域に対して、該領域内の被写体を認識する処理を行う認識工程と、
前記画像処理装置の出力手段が、前記認識工程による認識結果を出力する出力工程と
を備えることを特徴とする画像処理方法。
【請求項7】
コンピュータを、請求項1乃至5の何れか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−9050(P2013−9050A)
【公開日】平成25年1月10日(2013.1.10)
【国際特許分類】
【出願番号】特願2011−138892(P2011−138892)
【出願日】平成23年6月22日(2011.6.22)
【出願人】(000001007)キヤノン株式会社 (59,756)
【Fターム(参考)】