説明

物体検出装置及び方法、並びにプログラム

【課題】 検出性能を低下させずに車両周辺の物体を高速で検出する。
【解決手段】 物体検出装置10は、車両周辺を撮影した映像を、その映像から画像特徴を抽出した特徴映像に変換する映像変換部20と、特徴映像を複数の領域に分割して合成する映像分割合成部30と、合成映像を走査して第一の物体検出処理を行う第一物体検出処理部40と、第一の物体検出処理の結果から物体候補位置を求める物体候補位置指定部50と、物体候補位置に対して第二の物体検出処理を行う第二物体検出処理部60を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物体検出装置に関し、特に、車両周辺に存在する歩行者等の物体を検出可能な物体検出装置に関する。
【背景技術】
【0002】
近年、自動車の安全運転を支援する目的で、車載カメラの搭載が拡大している。例えば、車両の前方部分や後方部分に設置した撮像装置により車両周辺の映像を撮影し、撮影された映像を運転席に設置したディスプレイに表示することで、運転手は、車両の走行時に、車両周辺に存在する歩行者等の物体の有無を確認することができる。
【0003】
また、車両周辺の映像を単にディスプレイに表示するのではなく、歩行者等の物体をあらかじめ何らかの手段で検出しておき、検出結果の情報を映像に付加したうえで表示したり、音声による警告を発したりすることで運転手の注意を喚起する取組みもなされている。
【0004】
歩行者等の物体を検出する手段としては、例えば熱源や距離を関知するセンサを車載カメラとは別に搭載するものがこれまでの主流であった。しかし、コストや汎用性の点で別センサの搭載にはデメリットがあり、車載カメラの映像だけで物体を検出する画像認識手段の実用化が望まれている。
【0005】
画像認識による物体検出手法として、研究分野においては以前より映像中のエッジ特徴を利用する手法が有効とされている。また、検出対象物体の映像をあらかじめ大量に学習して統計データとして活用するブースティング手法が確立されている。エッジ特徴を利用する手法とブースティングを組み合わせた物体検出手法は、研究分野においては検出精度の点で既に実用レベルに至っている。
【0006】
しかし、実用化の点で上記の画像認識による物体検出手法には、処理時間の課題が残されている。画像認識の場合、映像処理が複雑であるのと同時に画像中を一通り走査する必要があるため、物体検出した結果を得るまでに時間がかかる。これにより、カメラのフレームレートに対して物体検出処理のフレームレートが低くなることや、映像に対して物体検出結果を得るまでの遅延時間が生じるという問題がある。
【0007】
このような処理時間の課題に対して、特許文献1では、入力画像を縮小した縮小画像を作成し、まず縮小画像上で物体の有無を粗く検出し、縮小画像上で物体を検出したときだけ元の入力画像に再度検出処理をかける二段階検出を行う物体検出装置が開示されている。これにより、実質的には縮小画像サイズでの走査になるので検出処理の高速化ができる。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2007−265390号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、上記特許文献1に記載の方法では、縮小画像を使って検出処理を行っているため、物体検出処理で利用している画像特徴が縮小化によって失われる。このため、特に物体検出対象が元々画像中で小さく撮影されている場合において、検出性能が十分に発揮できないという課題がある。物体検出対象が小さく撮影される要因としては、検出対象物体として元々小さいものを対象としていること、もしくは検出対象物体がカメラから距離が遠い位置に存在していること、またはその両方の要因が考えられるが、前者の場合は検出対象とする物体によっては検出精度が十分得られず、後者の場合は検出できる物体までの距離範囲が短縮化する弊害を生じた。
【0010】
本発明は、上記背景に鑑みなされたものであり、物体検出を画像認識だけで行いながら検出性能を犠牲にすることなく、検出処理時間を高速化することが可能な物体検出装置及び方法、並びにプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明の物体検出装置は、車両周辺の映像から画像特徴を抽出した特徴映像へと変換する映像変換部と、前記特徴映像を複数の領域に分割して合成する映像分割合成部と、前記映像分割合成部で合成した合成映像を走査して第一の物体検出処理を行う第一物体検出処理部と、前記第一物体検出処理部で物体が検出された合成映像上の位置を基に分割前の映像において物体が存在する可能性がある物体候補位置を求める物体候補位置指定部と、前記物体候補位置検出部で求めた物体候補位置に対して第二の物体検出処理を行い分割前の映像における物体位置を特定する第二物体検出処理部とを備えた構成を有する。
【0012】
この構成により、画像特徴を損なわないので検出性能を犠牲にせずに検出処理時間を高速化することが可能な物体検出装置を提供することが可能になる。
【0013】
本発明の物体検出装置において、前記映像変換部は、画像特徴としてエッジ特徴を抽出することを特徴とする。この構成により、物体検出処理で用いるエッジ特徴だけを残した映像に変換できる。
【0014】
本発明の物体検出装置において、前記映像変換部は、映像に対してエンボス加工を施すことを特徴とする。この構成により、映像中のエッジ特徴を簡易に求めることができる。
【0015】
本発明の物体検出装置において、前記映像分割合成部は、映像を複数の短冊状の領域に分割した分割領域を合成し、分割前の映像よりも小さい合成映像を生成することを特徴とする。この構成により、検出処理時に走査する映像の大きさを小さくできるので検出処理を高速化できる。
【0016】
本発明の物体検出装置において、前記映像分割合成部は、フレーム毎に分割位置が異なることを特徴とする。この構成により、映像の分割によって検出対象の物体が切れてしまうことで検出ができなくなる弊害を防ぐことができる。
【0017】
本発明の物体検出装置において、前記映像分割合成部は、前記分割領域をαブレンディングで合成することを特徴とする。この構成により、合成係数を調整することによって合成映像における各分割映像領域の影響度を調整することができる。
【0018】
本発明の物体検出装置において、前記映像分割合成部は、前記分割領域に含まれる画像特徴量に応じてαブレンディングの合成係数を調整して合成することを特徴とする。この構成により、画像特徴が多く含まれる映像領域の合成係数を高めることで、合成映像にしたときに画像特徴を保持した状態にできる。
【0019】
本発明の物体検出装置において、前記第一物体検出処理部は、前記合成映像を拡大もしくは縮小した合成映像に対して物体検出処理を行うことを特徴とする。この構成により、映像中に存在する検出対象物体の大きさの違いに対応できる。
【0020】
本発明の物体検出装置において、前記第一物体検出処理部は、前記映像分割合成部で分割した分割領域の大きさに基づいて前記合成映像の拡大率もしくは縮小率を決定することを特徴とする。この構成により、分割した映像領域内で存在しえない大きさの検出対象物を対象とした走査をしないので検出処理を高速化することができる。
【0021】
本発明の物体検出装置において、前記第一物体検出処理部は、物体検出を行う検出判定基準を前記第二物体検出処理部とは別々に調整可能であり、前記第二物体検出処理部よりも物体であると判定しやすくなるように検出基準を調整することを特徴とする。この構成により、第一物体検出処理部では検出を粗く(検出しやすく)して合成映像上における検出漏れを防ぎ、第二物体検出処理部で検出物体が存在することを最終的に判断して誤検出を防ぐことができる。
【0022】
本発明の物体検出装置において、前記第一物体検出処理部は、前記合成映像上で画像特徴が存在する部分だけを対象に第一の物体検出処理を行うことを特徴とする。この構成により検出物体が存在しえない箇所の走査をしないので、検出処理を高速化することができる。
【0023】
本発明の物体検出方法は、車両周辺の映像から画像特徴を抽出した特徴映像へと変換する映像変換ステップと、前記特徴映像を複数の領域に分割して合成する映像分割合成ステップと、前記映像分割合成ステップで合成した合成映像を走査して第一の物体検出処理を行う第一物体検出処理ステップと、前記第一物体検出処理ステップで物体が検出された合成映像上の位置を基に分割前の映像において物体が存在する可能性がある物体候補位置を求める物体候補位置指定ステップと、前記物体候補位置検出ステップで求めた物体候補位置に対して第二の物体検出処理を行い分割前の映像における物体位置を特定する第二物体検出処理ステップとを備えた構成を有する。この構成によっても、上記と同様の効果を得ることができる。
【0024】
本発明の物体検出方法において、前記映像変換ステップは、画像特徴としてエッジ特徴を抽出することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0025】
本発明の物体検出方法において、前記映像変換ステップは、映像に対してエンボス加工を施すことを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0026】
本発明の物体検出方法において、前記映像分割合成ステップは、映像を複数の短冊状の領域に分割した分割領域を合成し、分割前の映像よりも小さい合成映像を生成することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0027】
本発明の物体検出方法において、前記映像分割合成ステップは、フレーム毎に分割位置が異なることを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0028】
本発明の物体検出方法において、前記映像分割合成ステップは、前記分割領域をαブレンディングで合成することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0029】
本発明の物体検出方法において、前記映像分割合成ステップは、前記分割領域に含まれる画像特徴量に応じてαブレンディングの合成係数を調整して合成することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0030】
本発明の物体検出方法において、前記第一物体検出処理ステップは、前記合成映像を拡大もしくは縮小した合成映像に対して物体検出処理を行うことを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0031】
本発明の物体検出方法において、前記第一物体検出処理ステップは、前記映像分割合成ステップで分割した分割領域の大きさに基づいて前記合成映像の拡大率もしくは縮小率を決定することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0032】
本発明の物体検出方法において、前記第一物体検出処理ステップは、物体検出を行う検出判定基準を前記第二物体検出処理ステップとは別々に調整可能であり、前記第二物体検出処理ステップよりも物体であると判定しやすくなるように検出基準を調整することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0033】
本発明の物体検出方法において、前記第一物体検出処理ステップは、前記合成映像上で画像特徴が存在する部分だけを対象に第一の物体検出処理を行うことを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0034】
本発明の物体検出プログラムは、車両周辺の映像から画像特徴を抽出した特徴映像へと変換する映像変換機能と、前記特徴映像を複数の領域に分割して合成する映像分割合成機能と、前記映像分割合成機能で合成した合成映像を走査して第一の物体検出処理を行う第一物体検出処理機能と、前記第一物体検出処理機能で物体が検出された合成映像上の位置を基に分割前の映像において物体が存在する可能性がある物体候補位置を求める物体候補位置指定機能と、前記物体候補位置検出機能で求めた物体候補位置に対して第二の物体検出処理を行い分割前の映像における物体位置を特定する第二物体検出処理機能とをコンピュータに実現させるためのプログラムである。この構成によっても、上記と同様の効果を得ることができる。
【0035】
本発明の物体検出プログラムにおいて、前記映像変換機能は、画像特徴としてエッジ特徴を抽出することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0036】
本発明の物体検出プログラムにおいて、前記映像変換機能は、映像に対してエンボス加工を施すことを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0037】
本発明の物体検出プログラムにおいて、前記映像分割合成機能は、映像を複数の短冊状の領域に分割した分割領域を合成し、分割前の映像よりも小さい合成映像を生成することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0038】
本発明の物体検出プログラムにおいて、前記映像分割合成機能は、フレーム毎に分割位置が異なることを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0039】
本発明の物体検出プログラムにおいて、前記映像分割合成機能は、前記分割領域をαブレンディングで合成することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0040】
本発明の物体検出プログラムにおいて、前記映像分割合成機能は、前記分割領域に含まれる画像特徴量に応じてαブレンディングの合成係数を調整して合成することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0041】
本発明の物体検出プログラムにおいて、前記第一物体検出処理機能は、前記合成映像を拡大もしくは縮小した合成映像に対して物体検出処理を行うことを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0042】
本発明の物体検出プログラムにおいて、前記第一物体検出処理機能は、前記映像分割合成機能で分割した分割領域の大きさに基づいて前記合成映像の拡大率もしくは縮小率を決定することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0043】
本発明の物体検出プログラムにおいて、前記第一物体検出処理機能は、物体検出を行う検出判定基準を前記第二物体検出処理機能とは別々に調整可能であり、前記第二物体検出処理機能よりも物体であると判定しやすくなるように検出基準を調整することを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【0044】
本発明の物体検出プログラムにおいて、前記第一物体検出処理機能は、前記合成映像上で画像特徴が存在する部分だけを対象に第一の物体検出処理を行うことを特徴とする。この構成によっても、上記と同様の効果を得ることができる。
【発明の効果】
【0045】
本発明によれば、画像特徴を損なわずに映像を小さくできるので、検出性能を犠牲にすることなく、検出処理時間を高速化することができる物体検出装置を提供することが可能になるという優れた効果を有する。
【図面の簡単な説明】
【0046】
【図1】本発明の実施の形態における物体検出装置の構成を示すブロック図
【図2】(a)本発明の実施の形態における映像を2分割した分割領域の一例を示す説明図 (b)本発明の実施の形態における映像を4分割した分割領域の一例を示す説明図
【図3】本発明の実施の形態における分割境界線上に検出対象物体が存在する一例を示す説明図
【図4】(a)本発明の実施の形態の分割位置の調整におけるNフレーム目の分割の一例を示す説明図 (b)本発明の実施の形態の分割位置の調整におけるN+1フレーム目の分割の一例を示す説明図
【図5】(a)本発明の実施の形態の映像分割合成における分割前の特徴映像の一例を示す説明図 (b)本発明の実施の形態の映像分割合成における分割領域と合成係数の対応の一例を示す説明図 (c)本発明の実施の形態の映像分割合成における分割領域に合成係数を乗じた一例を示す説明図 (d)本発明の実施の形態の映像分割合成における合成結果の一例を示す説明図
【図6】(a)本発明の実施の形態の拡大縮小処理における拡大縮小前の映像の一例を示す説明図 (b)本発明の実施の形態の拡大縮小処理における物体検出可能な物体の大きさの一例を示す説明図 (c)本発明の実施の形態の映像分割合成における大きさ合わせの説明図
【図7】(a)本発明の実施の形態における2分割時の分割領域の一例を示す説明図 (b)本発明の実施の形態における2分割時の分割領域の縦横比率を示す説明図
【図8】(a)本発明の実施の形態における4分割時の分割領域の一例を示す説明図 (b)本発明の実施の形態における4分割時の分割領域の縦横比率を示す説明図
【図9】(a)本発明の実施の形態における分割時の分割領域の一例を示す説明図 (b)本発明の実施の形態における8分割時の分割領域の縦横比率を示す説明図
【図10】本発明の実施の形態における分割数と拡大縮小倍率の関係の一例を示す説明表
【図11】本発明の実施の形態における合成映像上での画像特徴量判定処理の一例を示す説明図
【図12】(a)本発明の実施の形態における4分割時の分割領域の一例を示す説明図 (b)本発明の実施の形態における合成映像の一例を示す説明図 (c)本発明の実施の形態における合成映像上での検出結果位置の一例を示す説明図 (d)本発明の実施の形態における分割前の映像上での物体候補位置の一例を示す説明図
【図13】(a)本発明の実施の形態における合成映像上での検出結果位置の座標の一例を示す説明図 (b)本発明の実施の形態における分割前の映像上での物体候補位置の座標の一例を示す説明図
【図14】(a)本発明の実施の形態の第二の物体検出処理における物体候補位置の一例を示す説明図 (b)本発明の実施の形態の第二の物体検出処理における検出結果の一例を示す説明図
【図15】本発明の実施の形態における物体検出装置の動作を示すフロー図
【発明を実施するための形態】
【0047】
以下、本発明の実施形態における物体検出装置について、図面を参照して説明する。
【0048】
図1は、本発明の実施の形態に係る物体検出装置の構成を示すブロック図である。物体検出装置10は、外部より入力される映像を、その映像から画像特徴を抽出した特徴映像に変換する映像変換部20と、特徴映像を複数の領域に分割した分割領域を合成して合成画像を生成する映像分割合成部30と、合成映像から物体検出を行う第一物体検出処理部40と、第一物体検出処理部40の検出結果から分割前の映像において物体が存在する可能性がある物体候補位置を求める物体候補位置指定部50と、分割前の映像上の物体候補位置に対して物体検出を行う第二物体検出処理部60とを備える。
【0049】
外部より入力される映像は、例えば車両前側または後側のナンバープレート近くの所定位置に所定角度で取り付けられた車載カメラにより車両周辺を撮影した映像である。
【0050】
映像変換部20は、外部より入力される映像を基に、画像特徴を映像上で抽出する映像変換処理を行う。本実施の形態では、外部より入力される映像に対してエンボス処理を行い、画像特徴としてエッジ特徴を抽出するものとし、後段の処理でエッジ特徴に注目した処理を行なっているが、本発明で対象とする画像特徴はエッジ特徴に限定されない。例えば、道路上の標識や信号機を検出する目的においては、画像特徴として特定の色を抽出する処理を行うことが有効である。また、本発明ではエッジ特徴を抽出する処理としてエンボス処理を行うが、エッジ特徴を抽出する映像変換処理もこれに限るものではない。例えば、エッジ特徴を抽出する手段としてはソーベルフィルタやCanny法を利用してもよい。
【0051】
映像分割合成部30は、映像分割部31、分割領域特徴量判定部32、合成係数調整部33、及び映像合成部34を備える。映像分割部31は、特徴映像を複数の領域に分割する。分割領域特徴判定部32は、映像分割部31で分割された各分割領域内に存在する画像特徴量を求める。合成係数調整部33は、分割領域特徴量判定部32で求めた各分割領域の画像特徴量を基に各領域に対応する合成係数を求める。映像合成部34は、映像分割部31で分割された各分割領域に対して合成係数調整部33で求めた合成係数を乗じ、全ての分割領域を合成した合成映像を生成する。このとき、合成映像は分割前の映像よりも小さくなる。
【0052】
第一物体検出処理部40は、映像拡大縮小部41、合成映像特徴量判定部42、合成映像物体検出部43を備える。映像拡大縮小部41は、合成映像を拡大または縮小する。ここでの拡大縮小処理は、映像上における物体検出対象の大きさの違いに対応するための処理であり、物体検出処理の高速化を目的としたものではない。例えば、物体検出対象がカメラから近距離に存在すれば物体は映像中で大きく映る。逆に物体が遠距離に存在すれば小さく映る。物体検出ではこのように生じる映像中における物体の大きさによらず同一の処理で物体検出処理を行うため、物体が大きく映っているときは映像を縮小し、小さく映っているときは映像を拡大して大きさの正規化を行い、そのうえで物体検出処理を行うのが常套手段である。合成映像特徴量判定部42は、映像拡大縮小部41から出力される映像上で画像特徴が存在する箇所を特定する。合成映像物体検出部43は、映像拡大縮小部41から出力される映像上で、合成映像特徴量判定部42で画像特徴が存在するとした合成映像中の箇所に対して物体検出処理を行う(この物体検出処理を「第一の物体検出処理」という。)。画像特徴が存在しない箇所はそもそも検出対象物体が存在しないため、あらかじめ除外しておくことで物体検出処理の高速化が期待できる。
【0053】
物体候補位置指定部50は、第一物体検出処理部40で物体検出された合成映像上の位置が、分割前の映像上のどこに該当するかを求める。例えば、合成映像が2つの領域を合成していたとき、合成映像上で1つの物体が検出されれば、分割前の映像上で物体が存在する可能性がある位置は2箇所となる。
【0054】
第二物体検出処理部60は、分割前の映像上で物体候補位置指定部50において指定された位置のみを対象に物体検出を行い、最終的な物体検出結果を得る(この物体検出処理を「第二の物体検出処理」という。)。
【0055】
以上が本発明の一実施形態に係る物体検出装置の構成と、処理の流れの説明である。
【0056】
次に、映像分割合成部30、第一物体検出処理部40、物体候補位置指定部50、第二物体検出処理部60の一連の処理について、図面を参照して詳細に説明する。
【0057】
映像分割部31で特徴映像を複数の領域に分割する例を図2に示す。図2(a)は映像を2つの領域に分割した例、(b)は4つの領域に分割した例を示している。この後の映像合成を考慮し、分割後の領域はそれぞれ同じ大きさであることが望ましいが、必ずしも同じである必要はない。また、分割数が大きいほど高速化の効果は大きくなる。具体的には、2分割の場合は分割なしの場合と比較して約1/2の処理時間、4分割の場合は約1/4の処理時間となる。ここでは、4分割を例にとって説明する。
【0058】
図3は、映像を分割にした場合に生じる課題を示したものである。今、図3の映像上には被写体Aと被写体Bの2つが存在している。映像を4分割したとき、被写体Bは領域3に収まるが、被写体Aは領域1と領域2に分割されてしまう。このように被写体が複数の領域に分割されてしまうと後段の検出処理が困難になる。このとき、被写体Aの位置が時間的に変化しない場合には被写体Aが現在から未来において検出されないという課題を生じる。
【0059】
この課題に対して、本実施の形態では図4のようにフレームごとに分割位置が互い違いになる位置になるように調整する。これにより、Nフレーム目には被写体Bが検出でき、N+1フレーム目には被写体Aが検出できる。なお、図4(b)の領域1〜3に含まれない左右の領域は後段の検出処理には使用していない。
【0060】
次に、分割領域特徴量判定部32について説明する。ここでの特徴量判定は、映像分割部41で分割された各分割領域にそれぞれどの程度の画像特徴が存在しているかをカウントする。本実施の形態では画像特徴としてエッジ特徴を用いる。エッジ量のカウント手段としては各種存在するが、本発明はその手段について限定するものではない。例えば、単純にエッジが存在する画素数や、エッジが存在する画素のエッジの大きさの総和をエッジ量としてカウントしてよい。あるいは、検出対象物体において特定の方向のエッジが多いとあらかじめ分かっているならば、特定の方向のエッジだけを対象にカウントする手段も有効である。また、本実施の形態ではエッジ特徴を対象にしているが、他の画像特徴を判定する処理に置き換えることも可能である。例えば、特定色の有無を判定してもよいし、一定以上の明るさの有無を判定するような処理でもよい。
【0061】
合成係数調整部33は、分割領域特徴量判定部32で求めた各分割領域の画像特徴量に基づいて各領域の合成係数を算出する。本実施の形態の第一の物体検出処理はエッジ特徴に基づくため、映像を合成する際にはエッジが存在する領域の合成係数を大きく、エッジが存在しない領域の合成係数を小さくする。このような合成係数を算出する方法として一例を挙げると、領域1のエッジ量をE1、領域2のエッジ量をE2、領域3のエッジ量をE3、領域4のエッジ量をE4としたとき、領域1〜4の合成係数M1〜M4は下式のように求めることができる。
【数1】

【数2】

【数3】

【数4】

なお、合成係数の総和が1になるような算出方法であれば、上記の計算式に限定されるものではない。
【0062】
映像合成部34は、合成係数調整部33で求めた合成係数M1〜M4を用いて、映像分割部31で分割した4つの分割領域を合成して、1つの合成映像を生成する。この合成は、合成係数M1〜M4に従った割合で複数の分割領域の重ねあわせを行なうものであり、αブレンディングと呼ばれる。図5は映像合成を説明する図である。図5(a)は映像分割前の特徴映像であり、図5(b)は映像分割部31で特徴映像を4分割した4つの分割領域と、分割領域特徴量判定部32および合成係数調整部33で求めた各分割領域に対応する合成係数M1〜M4を示している。ここで、合成係数M1〜M4の関係はエッジ量の大きさに比例するので、M3が一番大きく、次に大きいのがM1とM4でほぼ同じ大きさであり、一番小さいのがM2となる。このような大きさの関係にある合成係数を各分割領域に乗じたイメージが図5(c)となる。最後に合成係数を乗じた各領域を合成したのが図5(d)であり、最終的な合成映像としてはエッジ量が最も多い領域3が一番鮮明に残った形で合成されることになる。このようにエッジ量によって合成係数を調整することで、複数の分割領域を合成しても第一の物体検出に必要な画像特徴を残すことができる。
【0063】
以上、映像分割合成部30について説明した。次に、第一物体検出処理部40について説明する。
【0064】
映像拡大縮小部41は、後段の合成画像物体検出部43に映像を出力するにあたって合成映像を拡大または縮小する。なお、映像を拡大または縮小する理由は前述したとおり、検出対象物体の映像上における大きさの違いに対応するためであり、高速化のためではない。次に、映像の分割数と拡大縮小の関係について説明する。まず、拡大縮小処理の基本概念について図6を用いて説明する。なお、以下の説明では、説明を具体化する目的で適宜数値を記載するが、本実施の形態はこれに限定されるものではない。
【0065】
分割前の映像の大きさを水平640画素、垂直480画素とする(図6(a))。また、第一の物体検出処理で検出可能な物体の大きさを水平64画素、垂直128画素とする(図6(b))。図6(c)に図示したように、拡大縮小処理とは、もともと映像上に撮影される様々な大きさの被写体を、第一の物体検出処理が対応できる大きさ相当に拡大または縮小して大きさを合わせる処理となる。つまり、拡大縮小によって映像中の検出対象の物体の大きさが水平64画素、垂直128画素相当になれば検出可能となる。実際には映像中の検出対象物体の大きさがあらかじめ分からないので、拡大もしくは縮小の倍率をかえて複数回行うことになる。
【0066】
続いて、拡大縮小処理の拡大率および縮小率の限界値を考える。一般的に拡大率が大きすぎると拡大処理に伴って映像の鮮明度が低下するため、第一の物体検出処理にはおのずと限界が生じる。ここでは説明のために限界を拡大率10倍とする。また、縮小率については拡縮前の映像の大きさと、第一の物体検出処理が対応できる大きさの関係によって求まる。図6の例では、拡縮前の垂直サイズ480画素を128画素に縮小するときが取りうる最小の縮小率となるためその倍率は0.27倍となる。つまり、映像分割がない場合は、拡大縮小前の映像に対し、倍率0.27〜10倍の範囲で拡大縮小(1以下の場合は縮小)することになる。
【0067】
次に、映像を分割したときの拡大率および縮小率の限界について図7〜図9を参照しながら説明する。
【0068】
図7は2分割の例を示したものであり、図7(a)は2分割時の分割領域例、図7(b)は各分割領域の縦横比をそれぞれ示したものである。2分割時の縦横比は横0.67に対し縦1となる(以下では0.67:1のように表記する)。一方で、第一の物体検出処理が対応できる大きさが水平64画素、垂直128画素のとき縦横比は0.5:1であり、かつ前述したように映像分割がない場合の倍率範囲は垂直画素数によって規定されたので、2分割時も分割がない場合と同様に倍率値は0.27〜10の範囲を取る。
【0069】
図8は4分割の例を示したものであり、図8(a)は4分割時の分割領域例、図8(b)は各分割領域の縦横比をそれぞれ示したものである。4分割時の縦横比は0.33:1となる。このとき、第一の物体検出処理が対応できる対象物体の縦横比より水平の比率が小さくなるので、最小倍率は水平画素数により規定される。すなわち、合成映像の水平サイズ160画素を64画素に縮小するときが最小の縮小率となるためその倍率は0.4倍となる。よって、4分割時の取りうる倍率は0.4〜10となる。
【0070】
図9は8分割の例を示したものであり、図9(a)は8分割時の分割領域例、図9(b)は各領域の縦横比をそれぞれ示したものである。8分割時の縦横比は0.17:1となる。このとき、第一の物体検出処理が対応できる対象物体の縦横比より水平の比率が小さくなるので、最小倍率は水平画素数により規定される。すなわち、合成映像の水平サイズ80画素を64画素に縮小するときが最小の縮小率となるためその倍率は0.8倍となる。よって、8分割時の取りうる倍率は0.8〜10となる。
【0071】
ここまで説明した各分割数で取りうる倍率をまとめると、分割をしない時は0.27〜10倍、2分割時は0.27〜10倍、4分割時は0.4〜10倍、8分割時は0.8〜10倍となる。同じ倍率はいずれかの分割時に検出対象とすればよいので重複分を削除することができ、かつ、分割数が多いほど検出の高速化が可能であることを考慮すると、各分割数と取りうる倍率の関係は図10のようにまとめられる。このように、分割数と拡大縮小の倍率を組み合わせて拡大縮小処理を実施することで検出処理を高速化することができる。
【0072】
次に合成映像特徴量判定部42について図11を参照して説明する。ここでの判定処理は、映像拡大縮小部41で拡大縮小された合成映像上において、第一の物体検出処理が検出可能な大きさの枠(例えば水平64画素、垂直128画素の検出対象枠)内にどの程度の画像特徴が存在しているかをカウントする。本実施の形態ではエッジ特徴を対象とし、エッジのカウント方法は分割領域特徴量判定部32と同様であるので説明は割愛する。
【0073】
合成映像物体検出部43は、合成映像に対して第一の物体検出処理を行う。物体検出処理は、合成映像上でラスタ走査し、検出対象枠内に検出対象物体が存在するかを判定する処理となる。このとき、ラスタ走査において全ての検出対象枠で検出処理を行うのではなく、合成映像特徴量判定部42の結果を用いて検出処理を行うかどうかを判断する。すなわち、検出対象枠内に画像特徴が存在しない場合は物体が存在しえないので、検出処理を行わずに走査を進めることで全体の検出処理を高速化する。画像特徴が存在するかどうかの判定は、閾値を適宜に設定して一定以上の画像特徴が存在する場合にのみ検出処理を行うようにする。
【0074】
本実施の形態における物体検出処理は、エッジ特徴をベースにした物体検出手法を用いる。エッジ特徴を使う手法としては、エッジの強度と方向を用いるHOG(Histogram of Oriented Gradient)特徴を利用した手法が一般的であり、本発明にも適用できる。また、HOG特徴を利用した手法に限らず、エッジ特徴を用いる物体検出ならばいずれも適用が可能である。また、本発明においては画像特徴としてエッジ特徴以外のものでも適用可能である。
【0075】
次に、物体候補位置指定部50について図12を参照して説明する。図12(a)は特徴映像を4分割した例、図12(b)は4分割した映像を合成した合成映像、図12(c)は合成映像上で第一の物体検出処理を行った結果、図12(d)は第一の物体検出処理より分割前の映像上における物体候補位置を指定した結果である。物体候補位置の個数は分割数と同じ数になり、図12の例では4分割した合成映像を使って第一の物体検出処理を行っているので、分割前の映像上における物体候補位置は4つとなる。また、物体候補位置の座標位置は、図13に示すように、合成映像上における検出結果位置から一意に求めることができる。図13(a)は、合成映像上の検出結果座標を図示しており、合成映像の左上を座標(0,0)としたとき、検出結果枠の左上座標を(xs,ys)、右下座標を(xe,ye)とする。図13(b)は、図13(a)の検出結果座標に対応する物体位置候補座標を図示しており、映像の左上を座標(0,0)としたとき物体位置候補1の左上座標は(xs,ys)、右下座標は(xe,ye)、物体位置候補2の左上座標は(xs+160,ys+160)、右下座標は(xe+160,ye+160)、物体位置候補3の左上座標は(xs+320,ys+320)、右下座標は(xe+320,ye+320)、物体位置候補4の左上座標は(xs+480,ys+480)、右下座標は(xe+480,ye+480)となる。
【0076】
次に、第二物体検出処理部60について図14を参照して説明する。図14(a)は物体候補位置、図14(b)は最終的な検出結果の位置を示している。第二の物体検出処理は、物体候補位置指定部50で指定した物体候補位置に対して物体検出処理を行い、最終的な物体検出結果を求める。ここでは、既に検出処理を行う座標位置が指定されているため合成映像物体検出部43で行ったようなラスタ走査の必要はない。また、物体検出処理については合成映像物体検出部43と同様にエッジ特徴をベースにした物体検出手法を用いる。用いる手法としては合成映像物体検出部43と同じ検出手法でもよいし、異なっていてもよい。さらに、合成映像物体検出部43と第二物体検出処理部60における物体検出の精度を変えてもよい。この場合、合成映像物体検出部43よりも第二物体検出処理部60の検出精度をより厳密にしておくとよい。合成部映像物体検出部43は第二物体検出処理部60と比較して処理量が多いので誤検出を多少許容する程度の簡易的な物体検出を行い、物体候補が限定されて処理量が少ない第二の物体検出処理で誤検出を除外し確実に検出対象物体だけを検出結果とする。これによって、検出精度を落とさずに検出処理の高速化が実現できる。
【0077】
図15は、上記の物体検出装置100を用いて車両周辺の映像に基づいて車両付近の物体を検出する物体検出方法のフロー図である。図15のフロー図は、入力された1フレームの映像に対する処理であり、映像が連続的に入力される場合には、各フレームについて図15のフローが繰り返される。映像変換部20は、映像が入力されると、その映像を、その映像から画像特徴を抽出した特徴映像に変換する(ステップS151)。次に映像分割部31は、特徴映像を複数の分割領域に分割する(ステップS152)。そして、分割領域特徴量判定部32が、各分割領域について、その特徴量を判定する(ステップS153)。続いて、合成係数調整部33が、分割領域特徴量判定部32で求めた各分割領域の画像特徴量に基づいて各分割領域の合成係数を算出する(ステップS154)。次に、映像合成部34は、合成係数調整部33で求めた合成係数を用いて、映像分割部31で分割した分割領域に対してαブレンディングによる合成をして、1つの合成映像を生成する(ステップS155)。
【0078】
映像拡大縮小部41は、映像合成部34で生成された合成映像を拡大または縮小する(ステップS156)。合成映像特徴量判定部42は、合成映像上において、第一の物体検出処理で検出可能な大きさの枠内にどの程度の画像特徴が存在しているかを判定する(ステップS157)。そして、合成映像物体検出部43は、第一の物体検出処理として、合成映像を走査して物体検出を行う(ステップS158)。なお、このとき、合成映像物体検出部43は、合成映像特徴量判定部42の結果を用いて、検出対象枠内に画像特徴が存在しない場合は物体検出処理を行わずに次のステップに進む。次に、物体候補位置指定部50が、第一の物体検出処理において物体が検出された合成映像上の位置を基に分割前の前記映像において物体が存在する可能性がある位置を物体候補位置として指定する(ステップS159)。最後に、物体候補位置指定部50で指定した物体候補位置に対して第二の物体検出処理を行い、最終的に、分割前の映像における物体位置を特定する(ステップS160)。
【0079】
上記の実施の形態にかかる物体検出装置によれば、カメラで撮影した映像から特徴映像に変換し、特徴映像を分割合成した映像上で第一の物体検出処理を行って物体候補位置を求め、さらに物体候補位置に対して第二の物体検出処理を行って最終的な物体検出結果を求めるので、物体検出性能を犠牲にすることなく物体検出処理を高速化することができる。
【0080】
なお、上記で説明した物体検出装置は、コンピュータがプログラムを実行することにより、そのコンピュータが物体検出装置となり、また、コンピュータがプログラムを実行することにより上記の物体検出方法が実行されてよい。
【0081】
以上に現時点で考えられる本発明の好適な実施の形態を説明したが、本実施の形態に対して多様な変形が可能であり、そして、本発明の真実の精神と範囲内にあるそのようなすべての変形を請求の範囲が含むことが意図されている。
【産業上の利用可能性】
【0082】
以上のように、本発明に係る物体検出装置は、車両周辺を撮影した映像から画像特徴を抽出した特徴映像へ変換し、特徴映像を分割して合成した合成映像上で第一の物体検出処理を行って物体候補位置を求め、さらに物体候補位置に対して第二の物体検出処理を行うので、物体検出性能を犠牲にすることなく物体検出処理を高速化することができるという優れた効果を有し、車両周辺の物体を検出するための物体検出装置等として有用である。
【符号の説明】
【0083】
10 物体検出装置
20 映像変換部
30 映像分割合成部
31 映像分割部
32 分割領域特徴量判定部
33 合成係数調整部
34 映像合成部
40 第一物体検出処理部
41 映像拡大縮小部
42 合成映像特徴量判定部
43 合成映像物体検出部
50 物体候補位置指定部
60 第二物体検出処理部


【特許請求の範囲】
【請求項1】
車両周辺の映像に基づいて車両付近の物体を検出する物体検出装置であって、
前記映像を、前記映像から画像特徴を抽出した特徴映像に変換する映像変換部と、
前記特徴映像を複数の領域に分割した分割領域を合成して合成画像を生成する映像分割合成部と、
前記映像分割合成部で合成した前記合成映像を走査して第一の物体検出処理を行う第一物体検出処理部と、
前記第一物体検出処理部で物体が検出された前記合成映像上の位置を基に分割前の前記映像において物体が存在する可能性がある物体候補位置を求める物体候補位置指定部と、
前記物体候補位置指定部で求めた前記物体候補位置に対して第二の物体検出処理を行い、分割前の前記映像における物体位置を特定する第二物体検出処理部と、
を備えたことを特徴とする物体検出装置。
【請求項2】
前記映像変換部は、前記画像特徴としてエッジ特徴を抽出することを特徴とする、請求項1記載の物体検出装置。
【請求項3】
前記映像変換部は、前記映像に対してエンボス加工を施すことで前記映像を前記特徴映像に変換することを特徴とする、請求項1または2に記載の物体検出装置。
【請求項4】
前記映像分割合成部は、前記映像を複数の短冊状の領域に分割し、前記分割領域を合成して分割前の前記映像よりも小さい前記合成映像を生成することを特徴とする、請求項1〜3のいずれか1項に記載の物体検出装置。
【請求項5】
前記映像分割合成部は、フレーム毎に異なる分割位置で前記特徴映像を分割することを特徴とする、請求項1〜4のいずれか1項に記載の物体検出装置。
【請求項6】
前記映像分割合成部は、前記分割領域をαブレンディングで合成することを特徴とする、請求項1〜5のいずれか1項に記載の物体検出装置。
【請求項7】
前記映像分割合成部は、前記分割領域に含まれる画像特徴量に応じて前記αブレンディングの合成係数を調整して合成することを特徴とする、請求項6に記載の物体検出装置。
【請求項8】
前記第一物体検出処理部は、前記合成映像を拡大もしくは縮小した拡大縮小合成映像に対して前記第一の物体検出処理を行うことを特徴とする、請求項1〜7のいずれか1項に記載の物体検出装置。
【請求項9】
前記第一物体検出処理部は、前記映像分割合成部で分割した前記分割領域の大きさに基づいて前記合成映像の拡大率もしくは縮小率を決定することを特徴とする、請求項8に記載の物体検出装置。
【請求項10】
前記第一物体検出処理部は、前記第一の物体検出処理における第一の検出判定基準を前記第二物体検出処理部の前記第二の物体検出処理における第二の検出判定基準とは別々に調整可能であり、前記第二の検出判定基準よりも物体であると判定しやすくなるように前記第一の検出判定基準を調整することを特徴とする、請求項1〜9のいずれか1項に記載の物体検出装置。
【請求項11】
前記第一物体検出処理部は、前記合成映像上で前記画像特徴が存在する部分だけを対象に前記第一の物体検出処理を行うことを特徴とする、請求項1〜10のいずれか1項に記載の物体検出装置。
【請求項12】
車両周辺の映像に基づいて車両付近の物体を検出する物体検出方法であって、
前記映像を、前記映像から画像特徴を抽出した特徴映像に変換する映像変換ステップと、
前記特徴映像を複数の領域に分割した分割領域を合成して合成画像を生成する映像分割合成ステップと、
前記映像分割合成ステップで合成した前記合成映像を走査して第一の物体検出処理を行う第一物体検出処理ステップと、
前記第一物体検出処理ステップで物体が検出された前記合成映像上の位置を基に分割前の前記映像において物体が存在する可能性がある物体候補位置を求める物体候補位置指定ステップと、
前記物体候補位置指定ステップで求めた前記物体候補位置に対して第二の物体検出処理を行い、分割前の前記映像における物体位置を特定する第二物体検出処理ステップと、
を備えたことを特徴とする物体検出方法。
【請求項13】
前記映像変換ステップは、前記画像特徴としてエッジ特徴を抽出することを特徴とする、請求項12記載の物体検出方法。
【請求項14】
前記映像変換ステップは、前記映像に対してエンボス加工を施すことで前記映像を前記特徴映像に変換することを特徴とする、請求項12または13記載の物体検出方法。
【請求項15】
前記映像分割合成ステップは、前記映像を複数の短冊状の領域に分割し、前記分割領域を合成して分割前の前記映像よりも小さい前記合成映像を生成することを特徴とする、請求項12〜14のいずれか1項に記載の物体検出方法。
【請求項16】
前記映像分割合成ステップは、フレーム毎に異なる分割位置で前記特徴映像を分割することを特徴とする、請求項12〜15のいずれか1項に記載の物体検出方法。
【請求項17】
前記映像分割合成ステップは、前記分割領域をαブレンディングで合成することを特徴とする、請求項12〜16のいずれか1項に記載の物体検出方法。
【請求項18】
前記映像分割合成ステップは、前記分割領域に含まれる画像特徴量に応じて前記αブレンディングの合成係数を調整して合成することを特徴とする、請求項17に記載の物体検出方法。
【請求項19】
前記第一物体検出処理ステップは、前記合成映像を拡大もしくは縮小した拡大縮小合成映像に対して前記第一の物体検出処理を行うことを特徴とする、請求項12〜18のいずれか1項に記載の物体検出方法。
【請求項20】
前記第一物体検出処理ステップは、前記映像分割合成ステップで分割した前記分割領域の大きさに基づいて前記合成映像の拡大率もしくは縮小率を決定することを特徴とする、請求項19に記載の物体検出方法。
【請求項21】
前記第一物体検出処理ステップは、前記第一の物体検出処理における第一の検出判定基準を前記第二物体検出処理ステップの前記第二の物体検出処理における第二の検出判定基準とは別々に調整可能であり、前記第二の検出判定基準よりも物体であると判定しやすくなるように前記第一の検出判定基準を調整することを特徴とする、請求項12〜20のいずれか1項に記載の物体検出方法。
【請求項22】
前記第一物体検出処理ステップは、前記合成映像上で前記画像特徴が存在する部分だけを対象に前記第一の物体検出処理を行うことを特徴とする、請求項12〜21のいずれか1項に記載の物体検出方法。
【請求項23】
車両周辺の映像に基づいて車両付近の物体を検出する物体検出プログラムであって、
前記映像を、前記映像から画像特徴を抽出した特徴映像に変換する映像変換機能と、
前記特徴映像を複数の領域に分割した分割領域を合成して合成画像を生成する映像分割合成機能と、
前記映像分割合成機能で合成した前記合成映像を走査して第一の物体検出処理を行う第一物体検出処理機能と、
前記第一物体検出処理機能で物体が検出された前記合成映像上の位置を基に分割前の前記映像において物体が存在する可能性がある物体候補位置を求める物体候補位置指定機能と、
前記物体候補位置指定機能で求めた前記物体候補位置に対して第二の物体検出処理を行い、分割前の前記映像における物体位置を特定する第二物体検出処理機能と、
をコンピュータに実現させるための物体検出プログラム。
【請求項24】
前記映像変換機能は、前記画像特徴としてエッジ特徴を抽出することを特徴とする、請求項23記載の物体検出プログラム。
【請求項25】
前記映像変換機能は、前記映像に対してエンボス加工を施すことで前記映像を前記特徴映像に変換することを特徴とする、請求項23または24記載の物体検出プログラム。
【請求項26】
前記映像分割合成機能は、前記映像を複数の短冊状の領域に分割し、前記分割領域を合成して分割前の前記映像よりも小さい前記合成映像を生成することを特徴とする、請求項23〜25のいずれか1項に記載の物体検出プログラム。
【請求項27】
前記映像分割合成機能は、フレーム毎に異なる分割位置で前記特徴映像を分割することを特徴とする、請求項23〜26のいずれか1項に記載の物体検出プログラム。
【請求項28】
前記映像分割合成機能は、前記分割領域をαブレンディングで合成することを特徴とする、請求項23〜27のいずれか1項に記載の物体検出プログラム。
【請求項29】
前記映像分割合成機能は、前記分割領域に含まれる画像特徴量に応じて前記αブレンディングの合成係数を調整して合成することを特徴とする、請求項28に記載の物体検出プログラム。
【請求項30】
前記第一物体検出処理機能は、前記第一物体検出処理機能は、前記合成映像を拡大もしくは縮小した拡大縮小合成映像に対して前記第一の物体検出処理を行うことを特徴とする、請求項23〜29のいずれか1項に記載の物体検出プログラム。
【請求項31】
前記第一物体検出処理機能は、前記映像分割合成機能で分割した前記分割領域の大きさに基づいて前記合成映像の拡大率もしくは縮小率を決定することを特徴とする、請求項30に記載の物体検出プログラム。
【請求項32】
前記第一物体検出処理機能は、前記第一の物体検出処理における第一の検出判定基準を前記第二物体検出処理機能の前記第二の物体検出処理における第二の検出判定基準とは別々に調整可能であり、前記第二の検出判定基準よりも物体であると判定しやすくなるように前記第一の検出判定基準を調整することを特徴とする、請求項23〜31のいずれか1項に記載の物体検出プログラム。
【請求項33】
前記第一物体検出処理機能は、前記合成映像上で前記画像特徴が存在する部分だけを対象に前記第一の物体検出処理を行うことを特徴とする、請求項23〜32のいずれか1項に記載の物体検出プログラム。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2012−185555(P2012−185555A)
【公開日】平成24年9月27日(2012.9.27)
【国際特許分類】
【出願番号】特願2011−46616(P2011−46616)
【出願日】平成23年3月3日(2011.3.3)
【出願人】(000005821)パナソニック株式会社 (73,050)
【Fターム(参考)】