運転環境判定装置,運転状況推定装置,運転支援装置
【課題】ドライバに応じた運転支援をより的確に行うことができるようにする。
【解決手段】運転環境判定部11では、分布選択情報(識別情報ID,天気情報W,時間帯情報TB)により、環境判定クラスタ分布を選択し、車速V、及びステアリング操作量S及びブレーキ操作量Bに基づく規格化操作量Hsbを判定用パラメータとして、この判定用パラメータを、選択した環境判定クラスタ分布と照合することによって、運転環境を推定し、目標値設定部15では、その運転環境毎に用意された推定モデルを用いて、現在の運転環境やドライバ,天気,時間帯に適した車間距離及び衝突余裕時間の目標値OD,OTを設定し、運転状況推定部16は、その目標値OD,OTに対する実際の検出値D,TTCの逸脱度を、ドライバの運転状況を示す推定値として出力する。
【解決手段】運転環境判定部11では、分布選択情報(識別情報ID,天気情報W,時間帯情報TB)により、環境判定クラスタ分布を選択し、車速V、及びステアリング操作量S及びブレーキ操作量Bに基づく規格化操作量Hsbを判定用パラメータとして、この判定用パラメータを、選択した環境判定クラスタ分布と照合することによって、運転環境を推定し、目標値設定部15では、その運転環境毎に用意された推定モデルを用いて、現在の運転環境やドライバ,天気,時間帯に適した車間距離及び衝突余裕時間の目標値OD,OTを設定し、運転状況推定部16は、その目標値OD,OTに対する実際の検出値D,TTCの逸脱度を、ドライバの運転状況を示す推定値として出力する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ドライバの運転支援に使用される装置に関する。
【背景技術】
【0002】
近年、車両の運転環境(道路種別や天候等)やドライバの運転状況(車速,車間距離等)を推定し、その運転環境や運転状況に応じた運転支援を実行するシステムについて各種検討が行われている。
【0003】
例えば、車間距離が予め設定された閾値以下となった場合に、警報を発生させる装置が知られているが、その閾値の最適値は、ドライバ毎に様々に異なったものとなるだけでなく、同じドライバであっても、運転環境が異なれば変化する。
【0004】
そこで、車両の走行状況を、走行の難易の度合いによって類別化することが提案されている(例えば、特許文献1参照)。
この特許文献1には、走行状況の類別化の方法として、具体的には、(1)車速及び車速の一定時間内での変化量をパラメータとする方法、 (2)(1)に加えファジィ空間を用いて類別化する方法、(3)一定時間内において抽出した定速走行時の車速と、その車速で走行した時間により定義した走行状況判定値をパラメータとする方法、(4)一定時間内での走行距離、最高車速及び最低車速により定義した走行状況判定値をパラメータとする方法が挙げられている。また、類別としては、高速道路走行、市街地走行、渋滞時走行が例示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第2844113号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、市街地走行といっても、それに該当する道路は様々であり、走行している道路種別によって、運転の仕方は異なったものとなる。例えば、同じ60km/h規制になっている一般道の中には、中央分離帯を持つ複数車線道路やガードレール等で明確に歩道との分離がなされている地域高規格道路のような重要道路もあれば、中央分離帯やガードレールのない道路もあり、両道路での運転を比較すると、車間距離の取り方や、それに伴うステアリングやブレーキの操作タイミングや操作量,操作頻度等が大きく異なったものとなる。
【0007】
従って、上記従来装置の手法のように、速度に関するパラメータを用いるだけでは、運転環境の的確な識別、ひいてはドライバの感覚にあった的確な運転支援を行うことができないという問題があった。
【0008】
本発明は、上記問題点を解決するために、ドライバに応じた運転支援をより的確に行うことができるようにすることを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するためになされた本発明の運転環境判定装置では、検出データ取得手段が、車両の挙動を表す挙動データ及びドライバの操作を表す操作データからなる検出データを取得し、環境判定手段が、検出データ取得手段により取得された検出データに基づいて、車両の運転環境を判定する。
【0010】
このとき、環境判定手段は、様々な運転環境にて取得された検出データをクラスタリングすることで予め生成され、それぞれが異なった運転環境に対応する複数のクラスタからなるクラスタ分布を使用し、検出データ取得手段にて逐次取得される検出データをクラスタ分布と照合することによって運転環境を判定する。
【0011】
このように構成された本発明の運転環境判定装置によれば、車両の挙動だけでなく、ドライバの操作も、運転環境の判定の基準となるクラスタ分布の作成に用いられているため、ドライバの感覚にあった運転環境の判定を行うことができ、ひいてはドライバの感覚にあった的確な運転支援を行うことができる。
【0012】
なお、本発明において、環境判定手段は、検出データ取得手段によって連続的に検出された一定量の検出データを用いて判定を行うことが望ましい。
即ち、運転環境は、短い時間間隔で目まぐるしく変化するものではないため、ある一定期間内での検出データの傾向から判定を行うことによって、判定精度を向上させることができる。
【0013】
また、本発明の運転環境判定装置は、環境判定手段が判定する運転環境以外に、クラスタの分布を変化させる要因に関する分布選択情報を取得する分布選択情報取得手段を備え、クラスタ分布が、要因毎に用意されていると共に、環境判定手段は、分布選択情報取得手段が取得した分布選択情報に基づき、判定に使用するクラスタ分布を切り換えるように構成されていてもよい。
【0014】
即ち、大雨や積雪は、ドライバの運転操作に確実に大きな影響を与えるため、このような要因が存在する時には、専用の別のクラスタ分布を用意することによって、運転環境の判定精度をより向上させることができる。
【0015】
なお、分布選択情報取得手段が取得する分布選択情報は、天気情報,時間帯情報,ドライバの識別情報のうち、少なくとも一つを含んでいることが望ましい。
次に、本発明の運転状況推定装置は、請求項1乃至請求項4のいずれかに記載の運転環判定装置を備えると共に、環境判定装置での判定結果の種類毎に用意され、ドライバの運転傾向をモデル化した推定モデルを記憶するモデル記憶手段を備えている。
【0016】
そして、学習手段が、検出データ取得手段にて取得された検出データに基づいて推定モデルを学習し、選択手段が、運転環境判定装置での判定結果に従って推定モデルを選択し、推定手段が、選択手段にて選択された推定モデルを用い、検出データに基づいてドライバの運転状況を推定する。
【0017】
このように構成された本発明の運転状況推定装置では、環境判定装置での判定結果の種類(即ち、判定可能な運転環境)毎に用意され学習された推定モデルを用いて、運転状況を推定するため、運転環境の影響を受けることなく運転状況を精度よく推定することができる。
【0018】
なお、ここで言う運転状況とは、少なくとも、普段の運転からの逸脱状況や、運転行動の種類(例えば、ブレーキ操作やステアリング操作等の意図)を含むものとする。
そして、本発明の運転状況推定装置は、例えば、検出データに、自車速及び先行車との車間距離が少なくとも含まれている場合、学習手段は、自車速と車間距離に関わる車間パラメータとの関係に基づいて、自車速から車間パラメータの目標値を推定するための推定モデルを生成し、推定手段は、自車速と推定モデルとによって設定された目標値と車間パラメータの実測値との差から運転状況を推定するように構成されていてもよい。
【0019】
また、この場合、学習手段は、自車速と車間パラメータとの関係を表すグラフに対して、OCSVM(One-Class Support Vector Machine)を用いることで求められる回帰式を、推定モデルとしてもよい。
【0020】
なお、OCSVMは、予め設定された割合のデータをアウトライア(異常値)として除去する仕組みを有しているため、学習された推定モデル(回帰式)によって得られる目標値は、受容性の高いものとなる。
【0021】
即ち、アウトライアは不注意等により、意図せず車間距離が縮まってしまった時などに現れやすく、これを含んだデータで車間距離の学習を行うと、実際の普段の車間距離より短めの距離が目標値として設定され目標値の受容性が低下するため、これを除去することで受容性の高い結果を得ることができるのである。
【0022】
このように本発明の運転状況推定装置によれば、OCSVMを用いた学習では、アウトライアの要因に対応するパラメータを考慮する必要がないため、推定モデルの生成に用いるパラメータ数を必要最小限に抑えることができる。その結果、学習手段の処理や、推定モデルの生成に必要なデータを記憶する記憶装置の容量を少なく抑えることができ、装置を安価に構成することができる。
【0023】
また、本発明の運転状況推定装置は、例えば、検出データに、ブレーキ操作量が少なくとも含まれている場合、学習手段は、ある時刻でのブレーキ操作量、及びブレーキ操作が開始されてからのその時刻に至るブレーキ操作量の積分値からなる2次元の運転データの状態遷移に基づいて、運転データからドライバのブレーキ意図を推定するための推定モデルを生成し、推定手段は、運転データと推定モデルとによって推定されたブレーキ意図を運転状況の推定結果とするように構成されていてもよい。
【0024】
この場合、学習手段は、例えば、運転データをクラス分けすると共に、ブレーキの踏み始めから踏み終わりまでを一つのトライアルとして、トライアルの中で最も多くの運転データが属するクラスを、ブレーキ意図の一つを表すトライアルの教師ラベルとし、同一のトライアルを構成する運転データが、クラス間を遷移する確率をHMM(Hidden Markov Model)を用いて学習するように構成されていてもよい。
【0025】
また、運転データのクラス分けは、例えば、様々な運転状況で測定した運転データをクラスタリングすることによって予め設定され、それぞれが異なった運転状況に対応した複数のクラスタとの照合により行ってもよい。
【0026】
次に、本発明の運転支援装置は、請求項5乃至請求項10のいずれかに記載の運転状況推定装置を備え、支援実行手段が、推定手段での推定結果に応じた運転支援を選択して実行する。
【0027】
このように構成された本発明の運転支援装置によれば、運転環境の判定,運転状況の推定が精度よく行われるため、ドライバの感覚に合った的確な運転支援を実行することができる。
【0028】
なお、本発明の運転支援装置が、学習手段にて学習された推定モデルの履歴を記憶する履歴記憶手段を備えている場合、支援実行手段は、履歴記憶手段に記憶された推定モデルの変化に応じて運転支援の内容を決定してもよい。
【0029】
また、本発明の運転支援装置が多数のドライバの平均的な推定モデルである標準モデルを記憶する標準モデル記憶手段を備えている場合、支援実行手段は、標準推定モデルに対する学習手段にて学習された推定モデルの逸脱度に応じて運転支援の内容を決定してもよい。
【図面の簡単な説明】
【0030】
【図1】第1実施形態の運転支援装置の全体構成を示すブロック図。
【図2】運転環境の判定に用いるクラスタ分布を例示した説明図。
【図3】運転環境判定部が実行する処理の内容を示すフローチャート。
【図4】推定モデル学習部が実行する処理の流れを示すフローチャート。
【図5】学習に用いる散布図と学習結果に対応する回帰直線を示すグラフ。
【図6】支援内容選択装置が実行する処理の一例を示す説明図。
【図7】第2実施形態の運転支援装置の全体構成を示すブロック図。
【図8】運転データのラベル付けに用いるクラスタ分布を例示した説明図。
【図9】トライアルのラベル付けを説明するためのグラフ。
【図10】推定モデルに関する説明図。
【図11】推定モデル学習部が実行する処理の流れを示すフローチャート。
【発明を実施するための形態】
【0031】
以下に本発明の実施形態を図面と共に説明する。
[第1実施形態]
図1は、車両に搭載され、自車速に応じて設定される目標値(目標車間距離,目標衝突余裕時間)に基づいてドライバの運転状況を推定し、その運転状況に応じた運転支援を行う運転支援装置1の全体構成を示すブロック図である。
【0032】
<全体構成>
図1に示すように、運転支援装置1は、車両の挙動を検出する挙動検出センサ群2と、ドライバによる運転操作を検出する操作検出センサ群3と、地図データやVICS等により車外から取得した各種情報に基づいて経路設定や経路案内等を実行すると共に、それらの処理に使用される情報の一部を他の車載装置に提供するナビゲーション装置4と、ドライバを識別しその識別結果を表す識別情報IDを他の車載装置に提供するドライバ識別装置5と、挙動検出センサ群2,操作検出センサ群3,ナビゲーション装置4,ドライバ識別装置5から取得する各種情報に基づいて、ドライバによる運転の状況を推定する運転状況推定装置6と、運転状況推定装置6にて運転状況を推定する際に設定される目標値を、ドライバが修正するための目標値修正装置7と、運転状況推定装置6での推定結果に基づいて、運転支援の内容を選択して実行する支援内容選択装置8とを備えている。
【0033】
このうち、挙動検出センサ群2には、先行車との車間距離Dを少なくとも検出する車間距離センサ、及び自車両の車速(自車速)Vを検出する車速センサが少なくとも含まれている。
【0034】
なお、先行車との車間距離Dを少なくとも検出するするセンサは、レーザやミリ波を用いたレーダセンサや、カメラ画像から先行車との車間距離Dを推定するセンサであっても良い。
【0035】
また、操作検出センサ群3には、ステアリングの操作量(操舵角)Sを検出する操舵角センサ、及びブレーキの操作量(踏力)Bを検出するブレーキ踏力センサが少なくとも含まれている。
【0036】
ナビゲーション装置4が提供する情報には、少なくとも、VICS等により取得した天気情報W、現在の時間帯を表す時間帯情報TBが含まれている。
ドライバ識別装置5は、例えば、ドライバからの入力を受け付けるものであってもよいし、ドライバの顔等を撮影した画像に対する画像認識処理によって自動的にドライバを識別するものであってもよい。
【0037】
目標値修正装置7は、支援内容選択装置8によって実行される運転支援がドライバの感覚に適合するように、目標値を増減させるドライバの操作を受け付ける装置であり、ボタンスイッチ又はタッチパネル上に設定されたソフトスイッチ等からなる。
【0038】
<運転状況推定装置>
運転状況推定装置6は、車速V,ステアリング操作量S,ブレーキ操作量B,天気情報W,時間帯情報TB,識別情報IDに基づいて、運転環境(走行中の道路の走行環境)を判定しその判定結果を表すクラスタ情報CLを出力する運転環境判定部11と、車間距離D,車速Vに基づいて、衝突余裕時間TTCを算出する衝突余裕時間算出部12と、車間距離D,車速V,衝突余裕時間TTC,クラスタ情報CLに基づいて、クラスタ情報CLで特定される運転環境毎に、目標車間距離OD及び目標衝突余裕時間OTの設定に使用する推定モデルの学習を行う推定モデル学習部13と、推定モデル学習部13で学習された推定モデルやその履歴、及び平均的な推定モデルを表す標準モデル等を記憶するデータ記憶部14と、クラスタ情報CLから特定される推定モデルを用い、車速Vに従って、目標車間距離OD及び目標衝突余裕時間OTを設定する目標値設定部15と、目標値設定部15にて設定された車間距離及び衝突時間の目標値OD,OTと実際に検出された検出値D,TTCとの差等から、ドライバの運転状況を推定する運転状況推定部16とを備えている。
【0039】
なお、運転状況推定装置6は、CPU,メモリ(ROM,RAM等)からなる周知のマイクロコンピュータを中心に構成され、上記データ記憶部14は、メモリ上に設定される一部の領域からなり、それ以外の各部11〜13,15,16は、CPUが実行する処理によって実現される。
【0040】
<<運転環境判定部>>
運転環境判定部11では、ステアリング操作量S,ブレーキ操作量Bに基づいて定義される規格化操作量Hsb、及び車速Vに基づいて、現在の運転環境が、予め設定された四つのクラスのいずれであるかを判定する。
【0041】
なお、規格化操作量Hsbは、種類の異なる操作量S,Bを、比較が可能となるように規格化した上で加算したものである。具体的には、様々な運転環境において計測した各操作量S,Bの平均,分散をそれぞれ求め、互いの分散が同じ大きさ(例えば1)となるように各操作量S,Bを規格化する変換式を求めておき、この変換式を用いて、操作量S,Bを規格化する。
【0042】
また、四つのクラスは、高速・低操作負荷の運転環境を表すクラス1、低速・中操作負荷の運転環境を表すクラス2、超低速・高操作負荷の運転環境を表すクラス3、中速・低操作負荷の運転環境を表すクラス4からなる。
【0043】
そして、図2に示すように、規格化操作量Hsbと車速Vをパラメータとする二次元グラフ上に、各クラス1〜4に対応するクラスタ1〜4を予め定義しておき、逐次検出されるパラメータHsb,Vの組みが、どのクラスタに属するかによってクラスを判定する。
【0044】
なお、二次元グラフ上におけるクラスタの定義は、具体的には、以下のように行う。
まず、様々な運転環境(ここでは、高速道路/地域高規格道路/一般道路/繁華街)を走行することで蓄積されたステアリング操作量S,ブレーキ操作量B,車速Vのデータを用いて、図2に示すように、規格化操作量Hsbと車速Vをパラメータとする散布図を作成する。
【0045】
この散布図をクラスタリングすることによって、四つのクラスタ(以下、その四つを総称して環境判定クラスタ分布という)を抽出する。
なお、運転環境の分類を表すクラスタを四つに設定した理由は、散布図に表された分布について、ディリクレ過程混合ガウスのクラスタ数・平均・分散を変分ベイズで推定すると、クラスタの平均・分散の値は多少異なるものの、多数(n=23)の被験者で共に4つのクラスに分類されたことによる。
【0046】
この4つのクラスタは、実際の運転行動から考えて次の意味づけが可能である。
即ち、車速が早く、ステアリング操作もブレーキ操作も比較的少ない高速道路での走行は、高速・低操作負荷領域(クラスタ1)に分類される。
【0047】
交通量が多くスピードが低い上、駐車車両等の障害物回避や車線変更、信号停止等、頻繁にステアリング・ブレーキ操作が要求される繁華街や市街地の一部での走行は、超低速・高操作負荷領域(クラスタ3)に分類される。
【0048】
交通量が多く、速度が中低速域となり且つ操作負荷が中くらいとなる一部の市街地や近郊の主要道での走行は、低速・中操作負荷領域(クラスタ2)に分類される。
比較的速度も高く、運転操作も頻繁ではない道路、例えば、近郊でも中速で流れがスムーズな道路の一部や地域高規格道路等での走行は、中速・低操作負荷領域(クラスタ4)に分類される。
【0049】
なお、クラスタ1〜4の分布は、ドライバによって異なり、また、同じドライバであっても、極端な天気(大雨,雪等)や、時間帯(夜明/日暮れ,昼,夜など)によっては異なったものとなる。従って、環境判定クラスタ分布は、識別情報ID,天気情報W,時間帯情報TB(以下では、これらを総称して「分布選択情報」という)によって定義される分類毎に用意されている。
【0050】
このため、運転環境判定部11の出力となるクラスタ情報CLは、分布選択情報により選択される環境判定クラスタ分布と、パラメータHsb,Vにより判定されたクラスとを示すものとなっている。
【0051】
なお、選択情報は、ナビゲーション装置4やドライバ識別装置5から提供される情報に限らず、例えば、激しい雨であれば、ワイパースピード等を情報源としてもよい。
ここで、運転環境判定部11が実行する処理を、図3に示すフローチャートに沿って説明する。なお、本処理は、予め設定された一定時間間隔(例えば、100ms)毎に起動する。
【0052】
本処理が起動すると、まずS110では、分布選択情報ID,W,TBを取得し、続くS120では、分布選択情報ID,W,TBに変化があるか否かを判断する。
変化がない場合には、そのままS140に進み、変化がある場合には、S130にて、分布選択情報ID,W,TBに応じた環境判定クラスタ分布を選択してS140に進む。
【0053】
S140では、クラスの判定に必要なデータ(車速V,ステアリング操作量S,ブレーキ操作量B)を取得し、続くS150では、ステアリング操作量S及びブレーキ操作量Bから、規格化操作量Hsbを算出し、この規格化操作量Hsb及び車速Vを、クラス判定に用いるパラメータとして、現在選択されている環境判定クラスタ分布に対応付けて記憶する。
【0054】
S160では、クラス判定を行う判定タイミングであるか否かを判断する。具体的には、運転環境(現在走行している道路環境)は、頻繁かつ急激に変化するものではないため、例えば、環境判定クラスタ分布の切り替わり後、一定時間間隔(例えば5分)が経過する毎のタイミングを判定タイミングとする。
【0055】
そして、判定タイミングでなければ、そのまま本処理を終了し、判定タイミングであれば、S170にて、その一定時間間隔の間に蓄積された、パラメータHsb,Vの分布から、どのクラスタに属するか(最も近いか)を判定し、そのクラスタに対応するクラス、及び判定に使用した環境判定クラスタ分布を特定するクラスタ情報CLを、推定モデル学習部13及び目標値設定部15に対して出力して、本処理を終了する。
【0056】
<<衝突余裕時間算出部>>
衝突余裕時間算出部12では、車速Vと先行車との車間距離Dとから相対車速、相対加速度を算出し、等加速度運動を仮定した先行車との衝突余裕時間TTCを算出する。なお、この技術は周知技術であるため、詳細な説明は省略する。
【0057】
<<推定モデル学習部>>
推定モデル学習部13は、クラスタ情報CLで特定される運転環境毎に、目標車間距離ODを算出するための推定モデル、及び目標衝突余裕時間OTを算出するための推定モデルを作成する。
【0058】
具体的には、車速Vと車間距離の逆数D-1とをパラメータとする散布図、及び車速Vと衝突余裕時間の逆数TTC-1とをパラメータとする散布図を求め(図5参照)、これらの散布図に、それぞれOCSVM(One-Class Support Vector Machine)を適用することで、散布図上に引かれる境界線(ここでは直線)を表す回帰式が、推定モデルとなる。
【0059】
そして、OCSVMでは、散布図上に設定される基準点からの距離を尺度として、予め設定された閾値th(例えば初期値を5%とする)のデータをアウトライア(異常値)として除去する(ここでは境界線の上側に位置する)ように境界線を引く。なお、閾値thは、変更可能なパラメータである。
【0060】
ここで、推定モデル学習部13が実行する処理の流れを、図4に示すフローチャートに沿って説明する。
本処理は、運転環境判定部11での処理と同様に、予め設定された一定時間間隔(例えば、100ms)毎に起動する。
【0061】
本処理が起動すると、まず、S210では、運転環境判定部11からのクラスタ情報CLを取得し、続くS220では、クラスタ情報CLに変化があったか否かを判断する。
変化がない場合は、そのままS240に進み、変化がある場合は、S230にて、クラスタ情報CLに従って学習対象となる推定モデルを切り換えてS240に進む。
【0062】
S240では、学習対象となる推定モデルが学習済みであるか否かを判断し、学習済みである場合は、S270に進み、学習済みでない場合は、S250にて、目標値設定部15からの再学習指令があるか否かを判断する。
【0063】
再学習指令がない場合は、そのまま本処理を終了し、再学習指令がある場合は、S260にて、現在の推定モデルを履歴として保存すると共に、再学習指令に示された指示に従って、回帰式を求める際に使用する閾値thを変更してS270に進む。
【0064】
なお、再学習指令において、目標値OD,OTが大き過ぎる旨が示されている場合には、閾値thを予め設定された所定値(例えば0.5%)だけ減少させ、逆に、目標値OD,OTが小さ過ぎる旨が示されている場合には、閾値thを上記所定値だけ増加させる。
【0065】
S270では、学習に用いるデータ(車速V,車間距離D,衝突余裕時間TTC)を取得して、現在の学習対象推定モデルに対応づけて記憶し、続くS280では、記憶されたデータが、十分な精度が得られる量に達していれば、推定モデルとなる回帰式の算出を行い、これをデータ記憶部14に保存して、本処理を終了する。
【0066】
なお、図5は、学習に用いるデータの散布図と、その散布図に基づく回帰直線の算出結果を、それぞれ3名の被験者について例示したものであり、(a)がクラス3における車速Vと車間距離の逆数D-1の散布図、(b)がクラス1における車速Vと車間距離の逆数D-1の散布図、(c)がクラス1における車速Vと衝突余裕時間の逆数TTC-1の散布図である。
【0067】
散布図において、回帰直線より上側は、普段の車間距離や衝突余裕時間より短いこと、即ち危険側を意味し、回帰直線より下側は、普段の車間距離や衝突余裕時間より長いこと、即ち安全側を意味する。
【0068】
<<目標値設定部>>
目標値設定部15は、クラスタ情報CLによって特定される学習済みの推定モデルが、データ記憶部14に記憶されている場合には、その推定モデル(回帰式)に基づき、車速Vに対応する目標車間距離OD、目標衝突余裕時間OTを設定する。
【0069】
なお、設定された目標値OD,OTに対して、目標値修正装置7から目標値を修正する指令が入力された場合は、算出に用いた推定モデルに対応付けられたカウント値を、目標値OD,OTを増加させる修正が行われた場合には+1、減少させる修正が行われた場合には−1する。
【0070】
そして、カウント値の絶対値が予め設定された閾値を超えた場合、カウント値が+(プラス)であれば目標値OD,OTを減少させる旨、カウント値が−(マイナス)であれば目標値OD,OTを増加させる旨を指示する再学習指令RSを、推定モデル学習部13に対して出力する。
【0071】
<<運転状況推定部>>
運転状況推定部16は、目標値設定部15で設定された車間距離及び衝突余裕時間の目標値OD,OTと、最新の検出値D,TTCとを比較し、検出値D,TTCの目標値OD,OTからの逸脱度ΔD(=D−OD),ΔT(=TTC−OD)を算出、その逸脱度ΔD1,ΔT1(そのドライバにとっての通常の運転状況を基準とした逸脱度)を第1の運転状況として出力する。
【0072】
また、運転状況推定部16は、データ記憶部14に記憶されている標準的な推定モデル(多数のドライバの平均値)から設定される標準的な目標値SD,STに基づき、その標準的な目標値からの逸脱度ΔD2,ΔT2(一般的なドライバの運転状況を基準とした逸脱度)を第2の運転状況として出力する。
【0073】
更に、運転状況推定部16は、データ記憶部14に、ある一定期間(例えば、6ヶ月,1年,3年など)前の推定モデルが記憶されている場合には、それらの推定モデルから設定される過去の目標値に対する現在の目標値OD,OTの変化量(そのドライバの運転状況の長期的な変化傾向)を、第3の運転状況として出力する。
【0074】
<支援内容選択装置>
支援内容選択装置8は、例えば、車間距離について以下の運転支援を実行する。
即ち、図6に示すように、現車速で先行車にこれ以上接近すると急ブレーキをかけても衝突が避けられない距離を衝突不可避距離XDとして、目標車間距離ODから衝突不可避距離に至る車間距離の範囲を4分割し、車間距離の広い順に、レベル1(ディスプレイに情報提供),レベル2(インジケータによる注意喚起),レベル3(ブザーによる警報),レベル4(車両による自動ブレーキ)の制御エリアとする。
【0075】
そして、車間距離の逸脱度ΔD1が、どのレベルの制御エリアに属するかによって、運転支援内容を決定して実行する。
なお、ドライバが定常的に危険な運転(車間距離が極端に短い)をしている場合には、推定モデルでは、その挙動を正常な挙動として学習してしまい、警報などを発生させることができなくなる可能性がある。
【0076】
このため、支援内容選択装置8では、第2の運転状況に従って、逸脱度が異常レベルにある場合、即ち、多くの人の平均的な運転挙動からかけ離れた運転挙動を示している場合には、それがそのドライバの平均的な運転挙動であったとしても、警報を発する等の運転支援制御を実行する。
【0077】
更に、第3の運転状況に基づき、運転状況がある変化傾向を示している(例えば、車間距離が年々短くなる(又は長くなる)傾向にある等)ことが明らかになった場合に、その旨をドライバに通知し、注意喚起をすることによって運転支援を行う。また、運転状況の変化傾向に応じて運転支援の内容を変化させてもよい。
【0078】
<効果>
以上説明したように、運転支援装置1では、運転環境を分類してその運転環境毎に、ドライバの運転状況の推定に用いる推定モデルを学習により生成するようにされている。しかも、運転環境を判定する際には、車両の挙動(車速V)だけでなく、ドライバの操作(ステアリング操作量S,ブレーキ操作量B)も考慮されている。
【0079】
従って、運転支援装置1によれば、ドライバの運転操作に影響を与える運転環境を精度よく判定することができ、その運転環境に適した推定モデルを用いて運転状況の推定が行われるため、よりドライバの感覚にあった推定を行うことができ、ひいてはドライバの感覚にあった的確な運転支援を実行することができる。
【0080】
また、運転支援装置1では、運転環境を判定する際に、一定期間の間に連続的に検出された一定量のデータV,S,Bに基づくパラメータHsb,Vを用いて、それらパラメータHsb,Vの傾向から判定を行っているため、データが検出される毎に逐次判定を行う場合と比較して、判定精度を向上させることができる。
【0081】
また、運転支援装置1では、OCSVMによって推定モデルを学習することによって、閾値thによって決まる一定量のデータがアウトライア(異常値)として除去されるため、異常値の影響が抑制された再現性の高い推定モデルを得ることができ、ひいては、その推定モデルに基づいて受容性の高い推定結果を得ることができる。
【0082】
<実験>
図5に示した散布図から求めた推定モデルを用い、被験者1〜3に、自身に適合させた推定モデル、他人に適合させた推定モデルの両方について、同じ道路を走行して注意喚起や警報のタイミングを確認した。
【0083】
これにより、被験者毎に注意喚起や警報のタイミングが異なること、また、他の被験者に適合させた推定モデルを使用すると、注意喚起や警報のタイミングに明らかな違和感を感じることが確認された。
【0084】
<発明との対応>
本実施形態において、S140が検出データ取得手段、S170が環境判定手段、S110が分布選択情報取得手段、運転環境判定部11が運転環境判定装置、データ記憶部14がモデル記憶手段,履歴記憶手段,標準モデル記憶手段、推定モデル学習部13が学習手段、目標値設定部15及び運手状況推定部16が推定手段、支援内容選択装置8が支援実行手段に相当する。
【0085】
<変形例>
本実施形態では、推定モデル学習部13は、一定期間のデータを蓄積してから推定モデル(回帰式)を求めているが、オンラインで(即ち、前回の処理で算出された回帰式と、今回の検出データとで)回帰式が導ける演算方式に変更してもよい。この場合、推定モデルの学習を行う際に蓄積すべきデータ数を大幅に削減することができる。
【0086】
また、本実施形態では、推定モデルの学習が一端終了すると、再学習指令RSを受けた場合に限り再学習を行っているが、推定モデルの学習を、常時実行したり、ある一定期間毎に繰り返して実行したりしてもよい。
【0087】
また、推定モデルの学習が終了していない場合は、標準モデルを用いて推定を行ってもよく、特に、オンラインで回帰式(推定モデル)を導く場合は、標準モデルを回帰式の初期値として学習を進めるように構成してもよい。
【0088】
また、推定モデルを推定に使用できるか否か(学習が終了しているか否か)をドライバに通知するようにしてもよい。この場合、推定に使用できるか否かの判断は、例えば、学習に使用したデータ量や、推定誤差の収束(例えば、第1の運転状況を表す逸脱度ΔD1,ΔT1の平均値が許容値以下)などによって行うことが考えられる。なお、実験では、同一クラスタの挙動データV,Dが1時間分程度あれば、ある程度許容できるレベルの回帰式が得られることが確認されている。
【0089】
本実施形態では、挙動データとして車速V及び車間距離Dを用いているが、これらに限るものではなく、加速度やヨーレートなど、その他の運転挙動を表すパラメータを用いてもよい。
【0090】
本実施形態では、目標値の手動変更の傾向によって再学習指令RSを出力するように構成したが、例えば、アクセルやブレーキ操作が所定以上の頻度で実施される場合に、目標値OD,OTが不適切であるものとして再学習指令RSを出力するように構成してもよい。この場合、アクセル操作が多く実施されるならば閾値thを減少させ、ブレーキ操作が多く実施されるならば閾値thを増加させて再学習を実施すればよい。
【0091】
[第2実施形態]
次に、第2実施形態について説明する。
図7は、車両に搭載され、ブレーキの操作パターン(時系列的な状態遷移)からにブレーキで行った運転行動(ブレーキ意図)を推定し、その運転行動に応じた運転支援を行う運転支援装置1aの全体構成を示すブロック図である。
【0092】
<全体構成>
図7に示すように、運転支援装置1aは、車両の挙動を検出する挙動検出センサ群2と、ドライバによる運転操作を検出する操作検出センサ群3と、地図データやVICS等により車外から取得した各種情報に基づいて経路設定や経路案内等を実行すると共に、それらの処理に使用される情報の一部を他の車載装置に提供するナビゲーション装置4と、ドライバを識別しその識別結果を表す識別情報IDを他の車載装置に提供するドライバ識別装置5と、挙動検出センサ群2,操作検出センサ群3,ナビゲーション装置4,ドライバ識別装置5から取得する各種情報に基づいて、ドライバの運転行動を推定する運転行動推定装置6aと、運転行動推定装置6aでの推定結果に基づいて、運転支援の内容を選択して実行する支援内容選択装置8aとを備えている。
【0093】
このうち、操作検出センサ群3,ナビゲーション装置4,ドライバ識別装置5については、第1実施形態と同様の構成であるため、説明を省略する。
挙動検出センサ群2には、自車両の車速(自車速)Vを検出する車速センサが少なくとも含まれている。
【0094】
<運転行動推定装置>
運転行動推定装置6aは、車速V,ステアリング操作量S,ブレーキ操作量B,天気情報W,時間帯情報TB,識別情報IDに基づいて、運転環境(走行中の道路の走行環境)を判定しその判定結果を表すクラスタ情報CLを出力する運転環境判定部11と、ブレーキ操作量B及びクラスタ情報CLに基づいて、クラスタ情報CLで特定される運転環境毎に、ドライバの運転行動の推定に使用する推定モデルの学習を行う推定モデル学習部23と、推定モデル学習部23で学習された推定モデルやその履歴、及び平均的な推定モデルを表す標準モデル等を記憶するデータ記憶部24と、クラスタ情報CLから特定される推定モデルを用い、ブレーキ操作量Bに従って、ドライバの運転行動を推定する運転行動推定部25とを備えている。
【0095】
なお、運転行動推定装置6aは、CPU,メモリ(ROM,RAM等)からなる周知のマイクロコンピュータを中心に構成され、上記データ記憶部24は、メモリ上に設定される一部の領域からなり、それ以外の各部11,23,25は、CPUが実行する処理によって実現される。
【0096】
このうち、運転環境判定部11については、第1実施形態と同様の構成であるため、説明を省略する。
<<推定モデル学習部>>
推定モデル学習部23は、ブレーキ操作量Bから求めた運転データに基づき、ブレーキの踏み始めから踏み終わりに至る一連の運転データ(以下、トライアルという)が、予め設定された四つのクラスのいずれに属するかを判断することにより、各トライアルに教師ラベルを付与すると共に、その教師ラベル毎に、ブレーキ操作をモデル化したHMMでの状態遷移確率の学習とを行う。
【0097】
具体的には、運転データは、一定時間間隔(例えば100ms)毎に検出されるブレーキ操作量Bに基づいて生成され、ブレーキ操作量Bに応じた大きさとなるブレーキ踏力と、自身が属するトライアルの開始からの踏力の和(以下「踏力積分値」という)とからなる。
【0098】
また、四つのクラス(教師ラベル)は、ブレーキの踏み始め、あるいは操作量が小さい状況に対応するラベル1、操作量が大きく踏力を一定に保っている状況に対応するラベル2、それらの中間の状況に対応するラベル3、ブレーキを踏んでいない状況に対応するラベル4からなる。
【0099】
そして、図8に示すように、運転データを表すブレーキ踏力,踏力積分値をパラメータとする二次元グラフ上にラベル1〜ラベル4に対応するクラスタを予め定義しておき、逐次検出される運転データが、どのクラスタに属するかによってクラスを判別し、そのクラスに対応するラベルを付与する。
【0100】
更に、同一のトライアルに属する運転データに付与されたラベルの中で、最も数が多いラベルを、そのトライアルの教師ラベルとする。
ここで、図9は、上段がブレーキ踏力の時間変化を例示したものであり、下段が、その時々の運転データがどのクラスタに属するかを判断した結果を例示したものである。図9において、1,2,5番目のトライアルはラベル1に分類され、3,4,7番目のトライアルはラベル2に分類され、6番目のトライアルはラベル3に分類されることになる。
【0101】
なお、ラベル付けに用いるクラスタ分布の定義は、具体的には以下のように行う。
まず、ブレーキ操作を伴った様々な運転行動が行われている時に検出された運転データを蓄積し、その蓄積された運転データに対して、GMM(混合ガウスモデル)を適用して混合数4でクラスタリングする。
【0102】
図8は、ブレーキ踏力と踏力積分値をパラメータとする散布図であり、散布図中の運転データは、クラスタリングした結果に従って、属するクラスタ毎に異なる点(△,○,×,▲)で表されている。具体的には、△で示され縦軸周辺に伸びるクラスタをラベル1、○で示され水平方向に密集して伸びるクラスタをラベル2、Xで示され水平方向に疎に分布するクラスタをラベル3、▲で示され原点付近に存在するクラスタをラベル4とする。
【0103】
本実施形態では、このラベル1〜4の付与に用いるクラスタの分布は学習の対象ではなく、予め用意されたものを用いるが、個人毎に学習しても構わない。
次に、図10(a)は、運転データの時系列からなるトライアルのクラスタリングに使用するHMMを表す状態遷移図である。
【0104】
ここでは、状態数が5のleft-to-right HMMを用いている。即ち、ブレーキを踏んでない状況を表すラベル4(図中S1)から始まって、ラベル1(図中S2),ラベル2(図中S3),ラベル3(図中S4)と遷移し、最後にブレーキを踏んでいないラベル4(図中S5)に戻るものとし、遷移は多くとも次の状態までのモデルを扱う。
【0105】
HMMの出力はガウス分布に基づくとし、初期値には、GMMクラスタリング(図8参照)で導いた各クラスタ中心と分散を用いる。
学習するに当たり、遷移状態Si(i=1,2,3,4,5)に対して、状態Siから状態Sjに遷移する確率をAijで表すものとして、初期状態遷移確率は、上三角形行列で、対角行列(即ち、自身に遷移する確率A11,A22,A33,A44,A55)とその次の列(即ち、ある状態から次の状態に遷移する確率A12,A23,A34,A45)を0.5とし、それ以外の確率は0とした。但し、終了の状態を加味するために、S5からS5への遷移確率はA55=1とした。
【0106】
図10(b)は、教師ラベル1〜3が付与されたトライアルを教師データとして、HMMの状態遷移確率の学習を行った結果を示す。但し、上からラベル1,ラベル2,ラベル3である。
【0107】
なお、各ラベルに対応する運転行動は、ラベル1が先行車に対する接近のブレーキ、ラベル2が信号待ちのブレーキ、ラベル3が右左折によるブレーキである。
ここで、推定モデル学習部13が実行する処理の流れを、図11に示すフローチャートに沿って説明する。
【0108】
本処理は、運転環境判定部11での処理と同様に、予め設定された一定時間間隔(例えば、100ms)毎に起動する。
本処理が起動すると、まず、S310では、運転環境判定部11からのクラスタ情報CLを取得し、続くS320では、クラスタ情報CLに変化があったか否かを判断する。
【0109】
変化がない場合は、そのままS340に進み、変化がある場合は、S330にて、クラスタ情報CLに従って学習対象となる推定モデルを切り換えてS340に進む。
S340では、学習に用いるブレーキ操作量Bを取得し、続くS350では、そのブレーキ操作量Bに基づいて、運転データ(ブレーキ踏力,踏力積分値)を求める。
【0110】
S360では、運転データに基づきトライアルが終了したか否かを判断し、終了していなければ(今回の運転データが非ゼロ)、S370にて、運転データに対するラベル付けを行って本処理を終了する。
【0111】
一方、トライアルが終了している場合(前回の運転データが非ゼロで且つ今回が運転データがゼロ)は、S380にて、トライアルに対するラベル(教師ラベル)付けを行い、続くS390にて、その教師ラベルに対応した推定モデル(HMM)の状態遷移確率の学習を行って本処理を終了する。
【0112】
<<運転行動推定部>>
運転行動推定部25は、クラスタ情報CLに対応した推定モデル(ラベル1〜3に対応した3個一組のHMM)に運転データを入力し、対数尤度が最大となるHMMを選択し、その選択されたHMMのラベル(ひいてはそのラベルに対応する運転行動)、推定結果として支援内容選択装置8aに出力する。
【0113】
なお、推定モデルが、十分な精度が得られるまでは、運転行動の推定を禁止するように構成されていてもよい。
<支援内容選択装置>
支援内容選択装置8aは、推定結果のラベルに対応する運転行動に応じた運転支援を実行する。
【0114】
例えば、推定されたブレーキラベルと実際の運転行動に頻繁に差異が生じる場合(例えば推定されたブレーキラベルはラベル1の先行車に対する接近のブレーキパターンであることを示しているにもかかわらず、右左折の運転行動を伴っている場合等)、現在の運転状態はあせりや眠気など普段の運転状態とは異なると判断し、運転者に注意喚起や警報を与えたりする。
【0115】
<効果>
以上説明したように、運転支援装置1aでは、運転環境を分類してその運転環境毎に、ドライバの運転行動の推定に用いる推定モデル(HMM)を学習により生成するようにされている。しかも、運転環境を判定する際には、車両の挙動(車速V)だけでなく、ドライバの操作(ステアリング操作量S,ブレーキ操作量B)も考慮されている。
【0116】
従って、運転支援装置1aによれば、ドライバの運転行動に影響を与える運転環境を精度よく判定することができ、その運転環境に適した推定モデルを用いて運転行動の推定が行われるため、推定精度を向上させることができ、ひいてはドライバの運転行動に応じた的確な運転支援を実行することができる。
【0117】
<実験>
図8に示すクラスタ分布、図10(b)に示すHMMを用いて実際に運転行動を推定したところ、推定出力された運転行動は、実際の運転行動(実際にブレーキをかけた時に行った行動)と良く一致していることを確認した。
【0118】
<発明との対応>
本実施形態において、データ記憶部24がモデル記憶手段、推定モデル学習部23が学習手段、運転行動推定部25が推定手段、支援内容選択装置8aが支援実行手段に相当する。
【0119】
[他の実施形態]
以上本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
【0120】
例えば、上記実施形態では、分布選択情報ID,W,TBによって選択される環境判定クラスタ分布を構成するクラスタの数を4としているが、これに限るものではなく、クラスタ数は2以上であればよい。
【0121】
また、分布選択情報も、識別情報ID,天気情報W,時間帯情報TBに限るものではなく、例えば、ナビゲーション装置4から、道路種別(高速道路/一般道路)や道路形状(急カーブ,直進等)等を取得して、これらによって使用する環境判定クラスタ分布を切り換えるように構成してもよい。
【符号の説明】
【0122】
1,1a…運転支援装置 2,2a…挙動検出センサ群 3…操作検出センサ群 4…ナビゲーション装置 5…ドライバ識別装置 6,6a…運転状況推定装置 7…目標値修正装置 8,8a…支援内容選択装置 11…運転環境判定部 12…衝突余裕時間算出部 13,23…推定モデル学習部 14,24…データ記憶部 15…目標値設定部 16…運転状況推定部
【技術分野】
【0001】
本発明は、ドライバの運転支援に使用される装置に関する。
【背景技術】
【0002】
近年、車両の運転環境(道路種別や天候等)やドライバの運転状況(車速,車間距離等)を推定し、その運転環境や運転状況に応じた運転支援を実行するシステムについて各種検討が行われている。
【0003】
例えば、車間距離が予め設定された閾値以下となった場合に、警報を発生させる装置が知られているが、その閾値の最適値は、ドライバ毎に様々に異なったものとなるだけでなく、同じドライバであっても、運転環境が異なれば変化する。
【0004】
そこで、車両の走行状況を、走行の難易の度合いによって類別化することが提案されている(例えば、特許文献1参照)。
この特許文献1には、走行状況の類別化の方法として、具体的には、(1)車速及び車速の一定時間内での変化量をパラメータとする方法、 (2)(1)に加えファジィ空間を用いて類別化する方法、(3)一定時間内において抽出した定速走行時の車速と、その車速で走行した時間により定義した走行状況判定値をパラメータとする方法、(4)一定時間内での走行距離、最高車速及び最低車速により定義した走行状況判定値をパラメータとする方法が挙げられている。また、類別としては、高速道路走行、市街地走行、渋滞時走行が例示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第2844113号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、市街地走行といっても、それに該当する道路は様々であり、走行している道路種別によって、運転の仕方は異なったものとなる。例えば、同じ60km/h規制になっている一般道の中には、中央分離帯を持つ複数車線道路やガードレール等で明確に歩道との分離がなされている地域高規格道路のような重要道路もあれば、中央分離帯やガードレールのない道路もあり、両道路での運転を比較すると、車間距離の取り方や、それに伴うステアリングやブレーキの操作タイミングや操作量,操作頻度等が大きく異なったものとなる。
【0007】
従って、上記従来装置の手法のように、速度に関するパラメータを用いるだけでは、運転環境の的確な識別、ひいてはドライバの感覚にあった的確な運転支援を行うことができないという問題があった。
【0008】
本発明は、上記問題点を解決するために、ドライバに応じた運転支援をより的確に行うことができるようにすることを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するためになされた本発明の運転環境判定装置では、検出データ取得手段が、車両の挙動を表す挙動データ及びドライバの操作を表す操作データからなる検出データを取得し、環境判定手段が、検出データ取得手段により取得された検出データに基づいて、車両の運転環境を判定する。
【0010】
このとき、環境判定手段は、様々な運転環境にて取得された検出データをクラスタリングすることで予め生成され、それぞれが異なった運転環境に対応する複数のクラスタからなるクラスタ分布を使用し、検出データ取得手段にて逐次取得される検出データをクラスタ分布と照合することによって運転環境を判定する。
【0011】
このように構成された本発明の運転環境判定装置によれば、車両の挙動だけでなく、ドライバの操作も、運転環境の判定の基準となるクラスタ分布の作成に用いられているため、ドライバの感覚にあった運転環境の判定を行うことができ、ひいてはドライバの感覚にあった的確な運転支援を行うことができる。
【0012】
なお、本発明において、環境判定手段は、検出データ取得手段によって連続的に検出された一定量の検出データを用いて判定を行うことが望ましい。
即ち、運転環境は、短い時間間隔で目まぐるしく変化するものではないため、ある一定期間内での検出データの傾向から判定を行うことによって、判定精度を向上させることができる。
【0013】
また、本発明の運転環境判定装置は、環境判定手段が判定する運転環境以外に、クラスタの分布を変化させる要因に関する分布選択情報を取得する分布選択情報取得手段を備え、クラスタ分布が、要因毎に用意されていると共に、環境判定手段は、分布選択情報取得手段が取得した分布選択情報に基づき、判定に使用するクラスタ分布を切り換えるように構成されていてもよい。
【0014】
即ち、大雨や積雪は、ドライバの運転操作に確実に大きな影響を与えるため、このような要因が存在する時には、専用の別のクラスタ分布を用意することによって、運転環境の判定精度をより向上させることができる。
【0015】
なお、分布選択情報取得手段が取得する分布選択情報は、天気情報,時間帯情報,ドライバの識別情報のうち、少なくとも一つを含んでいることが望ましい。
次に、本発明の運転状況推定装置は、請求項1乃至請求項4のいずれかに記載の運転環判定装置を備えると共に、環境判定装置での判定結果の種類毎に用意され、ドライバの運転傾向をモデル化した推定モデルを記憶するモデル記憶手段を備えている。
【0016】
そして、学習手段が、検出データ取得手段にて取得された検出データに基づいて推定モデルを学習し、選択手段が、運転環境判定装置での判定結果に従って推定モデルを選択し、推定手段が、選択手段にて選択された推定モデルを用い、検出データに基づいてドライバの運転状況を推定する。
【0017】
このように構成された本発明の運転状況推定装置では、環境判定装置での判定結果の種類(即ち、判定可能な運転環境)毎に用意され学習された推定モデルを用いて、運転状況を推定するため、運転環境の影響を受けることなく運転状況を精度よく推定することができる。
【0018】
なお、ここで言う運転状況とは、少なくとも、普段の運転からの逸脱状況や、運転行動の種類(例えば、ブレーキ操作やステアリング操作等の意図)を含むものとする。
そして、本発明の運転状況推定装置は、例えば、検出データに、自車速及び先行車との車間距離が少なくとも含まれている場合、学習手段は、自車速と車間距離に関わる車間パラメータとの関係に基づいて、自車速から車間パラメータの目標値を推定するための推定モデルを生成し、推定手段は、自車速と推定モデルとによって設定された目標値と車間パラメータの実測値との差から運転状況を推定するように構成されていてもよい。
【0019】
また、この場合、学習手段は、自車速と車間パラメータとの関係を表すグラフに対して、OCSVM(One-Class Support Vector Machine)を用いることで求められる回帰式を、推定モデルとしてもよい。
【0020】
なお、OCSVMは、予め設定された割合のデータをアウトライア(異常値)として除去する仕組みを有しているため、学習された推定モデル(回帰式)によって得られる目標値は、受容性の高いものとなる。
【0021】
即ち、アウトライアは不注意等により、意図せず車間距離が縮まってしまった時などに現れやすく、これを含んだデータで車間距離の学習を行うと、実際の普段の車間距離より短めの距離が目標値として設定され目標値の受容性が低下するため、これを除去することで受容性の高い結果を得ることができるのである。
【0022】
このように本発明の運転状況推定装置によれば、OCSVMを用いた学習では、アウトライアの要因に対応するパラメータを考慮する必要がないため、推定モデルの生成に用いるパラメータ数を必要最小限に抑えることができる。その結果、学習手段の処理や、推定モデルの生成に必要なデータを記憶する記憶装置の容量を少なく抑えることができ、装置を安価に構成することができる。
【0023】
また、本発明の運転状況推定装置は、例えば、検出データに、ブレーキ操作量が少なくとも含まれている場合、学習手段は、ある時刻でのブレーキ操作量、及びブレーキ操作が開始されてからのその時刻に至るブレーキ操作量の積分値からなる2次元の運転データの状態遷移に基づいて、運転データからドライバのブレーキ意図を推定するための推定モデルを生成し、推定手段は、運転データと推定モデルとによって推定されたブレーキ意図を運転状況の推定結果とするように構成されていてもよい。
【0024】
この場合、学習手段は、例えば、運転データをクラス分けすると共に、ブレーキの踏み始めから踏み終わりまでを一つのトライアルとして、トライアルの中で最も多くの運転データが属するクラスを、ブレーキ意図の一つを表すトライアルの教師ラベルとし、同一のトライアルを構成する運転データが、クラス間を遷移する確率をHMM(Hidden Markov Model)を用いて学習するように構成されていてもよい。
【0025】
また、運転データのクラス分けは、例えば、様々な運転状況で測定した運転データをクラスタリングすることによって予め設定され、それぞれが異なった運転状況に対応した複数のクラスタとの照合により行ってもよい。
【0026】
次に、本発明の運転支援装置は、請求項5乃至請求項10のいずれかに記載の運転状況推定装置を備え、支援実行手段が、推定手段での推定結果に応じた運転支援を選択して実行する。
【0027】
このように構成された本発明の運転支援装置によれば、運転環境の判定,運転状況の推定が精度よく行われるため、ドライバの感覚に合った的確な運転支援を実行することができる。
【0028】
なお、本発明の運転支援装置が、学習手段にて学習された推定モデルの履歴を記憶する履歴記憶手段を備えている場合、支援実行手段は、履歴記憶手段に記憶された推定モデルの変化に応じて運転支援の内容を決定してもよい。
【0029】
また、本発明の運転支援装置が多数のドライバの平均的な推定モデルである標準モデルを記憶する標準モデル記憶手段を備えている場合、支援実行手段は、標準推定モデルに対する学習手段にて学習された推定モデルの逸脱度に応じて運転支援の内容を決定してもよい。
【図面の簡単な説明】
【0030】
【図1】第1実施形態の運転支援装置の全体構成を示すブロック図。
【図2】運転環境の判定に用いるクラスタ分布を例示した説明図。
【図3】運転環境判定部が実行する処理の内容を示すフローチャート。
【図4】推定モデル学習部が実行する処理の流れを示すフローチャート。
【図5】学習に用いる散布図と学習結果に対応する回帰直線を示すグラフ。
【図6】支援内容選択装置が実行する処理の一例を示す説明図。
【図7】第2実施形態の運転支援装置の全体構成を示すブロック図。
【図8】運転データのラベル付けに用いるクラスタ分布を例示した説明図。
【図9】トライアルのラベル付けを説明するためのグラフ。
【図10】推定モデルに関する説明図。
【図11】推定モデル学習部が実行する処理の流れを示すフローチャート。
【発明を実施するための形態】
【0031】
以下に本発明の実施形態を図面と共に説明する。
[第1実施形態]
図1は、車両に搭載され、自車速に応じて設定される目標値(目標車間距離,目標衝突余裕時間)に基づいてドライバの運転状況を推定し、その運転状況に応じた運転支援を行う運転支援装置1の全体構成を示すブロック図である。
【0032】
<全体構成>
図1に示すように、運転支援装置1は、車両の挙動を検出する挙動検出センサ群2と、ドライバによる運転操作を検出する操作検出センサ群3と、地図データやVICS等により車外から取得した各種情報に基づいて経路設定や経路案内等を実行すると共に、それらの処理に使用される情報の一部を他の車載装置に提供するナビゲーション装置4と、ドライバを識別しその識別結果を表す識別情報IDを他の車載装置に提供するドライバ識別装置5と、挙動検出センサ群2,操作検出センサ群3,ナビゲーション装置4,ドライバ識別装置5から取得する各種情報に基づいて、ドライバによる運転の状況を推定する運転状況推定装置6と、運転状況推定装置6にて運転状況を推定する際に設定される目標値を、ドライバが修正するための目標値修正装置7と、運転状況推定装置6での推定結果に基づいて、運転支援の内容を選択して実行する支援内容選択装置8とを備えている。
【0033】
このうち、挙動検出センサ群2には、先行車との車間距離Dを少なくとも検出する車間距離センサ、及び自車両の車速(自車速)Vを検出する車速センサが少なくとも含まれている。
【0034】
なお、先行車との車間距離Dを少なくとも検出するするセンサは、レーザやミリ波を用いたレーダセンサや、カメラ画像から先行車との車間距離Dを推定するセンサであっても良い。
【0035】
また、操作検出センサ群3には、ステアリングの操作量(操舵角)Sを検出する操舵角センサ、及びブレーキの操作量(踏力)Bを検出するブレーキ踏力センサが少なくとも含まれている。
【0036】
ナビゲーション装置4が提供する情報には、少なくとも、VICS等により取得した天気情報W、現在の時間帯を表す時間帯情報TBが含まれている。
ドライバ識別装置5は、例えば、ドライバからの入力を受け付けるものであってもよいし、ドライバの顔等を撮影した画像に対する画像認識処理によって自動的にドライバを識別するものであってもよい。
【0037】
目標値修正装置7は、支援内容選択装置8によって実行される運転支援がドライバの感覚に適合するように、目標値を増減させるドライバの操作を受け付ける装置であり、ボタンスイッチ又はタッチパネル上に設定されたソフトスイッチ等からなる。
【0038】
<運転状況推定装置>
運転状況推定装置6は、車速V,ステアリング操作量S,ブレーキ操作量B,天気情報W,時間帯情報TB,識別情報IDに基づいて、運転環境(走行中の道路の走行環境)を判定しその判定結果を表すクラスタ情報CLを出力する運転環境判定部11と、車間距離D,車速Vに基づいて、衝突余裕時間TTCを算出する衝突余裕時間算出部12と、車間距離D,車速V,衝突余裕時間TTC,クラスタ情報CLに基づいて、クラスタ情報CLで特定される運転環境毎に、目標車間距離OD及び目標衝突余裕時間OTの設定に使用する推定モデルの学習を行う推定モデル学習部13と、推定モデル学習部13で学習された推定モデルやその履歴、及び平均的な推定モデルを表す標準モデル等を記憶するデータ記憶部14と、クラスタ情報CLから特定される推定モデルを用い、車速Vに従って、目標車間距離OD及び目標衝突余裕時間OTを設定する目標値設定部15と、目標値設定部15にて設定された車間距離及び衝突時間の目標値OD,OTと実際に検出された検出値D,TTCとの差等から、ドライバの運転状況を推定する運転状況推定部16とを備えている。
【0039】
なお、運転状況推定装置6は、CPU,メモリ(ROM,RAM等)からなる周知のマイクロコンピュータを中心に構成され、上記データ記憶部14は、メモリ上に設定される一部の領域からなり、それ以外の各部11〜13,15,16は、CPUが実行する処理によって実現される。
【0040】
<<運転環境判定部>>
運転環境判定部11では、ステアリング操作量S,ブレーキ操作量Bに基づいて定義される規格化操作量Hsb、及び車速Vに基づいて、現在の運転環境が、予め設定された四つのクラスのいずれであるかを判定する。
【0041】
なお、規格化操作量Hsbは、種類の異なる操作量S,Bを、比較が可能となるように規格化した上で加算したものである。具体的には、様々な運転環境において計測した各操作量S,Bの平均,分散をそれぞれ求め、互いの分散が同じ大きさ(例えば1)となるように各操作量S,Bを規格化する変換式を求めておき、この変換式を用いて、操作量S,Bを規格化する。
【0042】
また、四つのクラスは、高速・低操作負荷の運転環境を表すクラス1、低速・中操作負荷の運転環境を表すクラス2、超低速・高操作負荷の運転環境を表すクラス3、中速・低操作負荷の運転環境を表すクラス4からなる。
【0043】
そして、図2に示すように、規格化操作量Hsbと車速Vをパラメータとする二次元グラフ上に、各クラス1〜4に対応するクラスタ1〜4を予め定義しておき、逐次検出されるパラメータHsb,Vの組みが、どのクラスタに属するかによってクラスを判定する。
【0044】
なお、二次元グラフ上におけるクラスタの定義は、具体的には、以下のように行う。
まず、様々な運転環境(ここでは、高速道路/地域高規格道路/一般道路/繁華街)を走行することで蓄積されたステアリング操作量S,ブレーキ操作量B,車速Vのデータを用いて、図2に示すように、規格化操作量Hsbと車速Vをパラメータとする散布図を作成する。
【0045】
この散布図をクラスタリングすることによって、四つのクラスタ(以下、その四つを総称して環境判定クラスタ分布という)を抽出する。
なお、運転環境の分類を表すクラスタを四つに設定した理由は、散布図に表された分布について、ディリクレ過程混合ガウスのクラスタ数・平均・分散を変分ベイズで推定すると、クラスタの平均・分散の値は多少異なるものの、多数(n=23)の被験者で共に4つのクラスに分類されたことによる。
【0046】
この4つのクラスタは、実際の運転行動から考えて次の意味づけが可能である。
即ち、車速が早く、ステアリング操作もブレーキ操作も比較的少ない高速道路での走行は、高速・低操作負荷領域(クラスタ1)に分類される。
【0047】
交通量が多くスピードが低い上、駐車車両等の障害物回避や車線変更、信号停止等、頻繁にステアリング・ブレーキ操作が要求される繁華街や市街地の一部での走行は、超低速・高操作負荷領域(クラスタ3)に分類される。
【0048】
交通量が多く、速度が中低速域となり且つ操作負荷が中くらいとなる一部の市街地や近郊の主要道での走行は、低速・中操作負荷領域(クラスタ2)に分類される。
比較的速度も高く、運転操作も頻繁ではない道路、例えば、近郊でも中速で流れがスムーズな道路の一部や地域高規格道路等での走行は、中速・低操作負荷領域(クラスタ4)に分類される。
【0049】
なお、クラスタ1〜4の分布は、ドライバによって異なり、また、同じドライバであっても、極端な天気(大雨,雪等)や、時間帯(夜明/日暮れ,昼,夜など)によっては異なったものとなる。従って、環境判定クラスタ分布は、識別情報ID,天気情報W,時間帯情報TB(以下では、これらを総称して「分布選択情報」という)によって定義される分類毎に用意されている。
【0050】
このため、運転環境判定部11の出力となるクラスタ情報CLは、分布選択情報により選択される環境判定クラスタ分布と、パラメータHsb,Vにより判定されたクラスとを示すものとなっている。
【0051】
なお、選択情報は、ナビゲーション装置4やドライバ識別装置5から提供される情報に限らず、例えば、激しい雨であれば、ワイパースピード等を情報源としてもよい。
ここで、運転環境判定部11が実行する処理を、図3に示すフローチャートに沿って説明する。なお、本処理は、予め設定された一定時間間隔(例えば、100ms)毎に起動する。
【0052】
本処理が起動すると、まずS110では、分布選択情報ID,W,TBを取得し、続くS120では、分布選択情報ID,W,TBに変化があるか否かを判断する。
変化がない場合には、そのままS140に進み、変化がある場合には、S130にて、分布選択情報ID,W,TBに応じた環境判定クラスタ分布を選択してS140に進む。
【0053】
S140では、クラスの判定に必要なデータ(車速V,ステアリング操作量S,ブレーキ操作量B)を取得し、続くS150では、ステアリング操作量S及びブレーキ操作量Bから、規格化操作量Hsbを算出し、この規格化操作量Hsb及び車速Vを、クラス判定に用いるパラメータとして、現在選択されている環境判定クラスタ分布に対応付けて記憶する。
【0054】
S160では、クラス判定を行う判定タイミングであるか否かを判断する。具体的には、運転環境(現在走行している道路環境)は、頻繁かつ急激に変化するものではないため、例えば、環境判定クラスタ分布の切り替わり後、一定時間間隔(例えば5分)が経過する毎のタイミングを判定タイミングとする。
【0055】
そして、判定タイミングでなければ、そのまま本処理を終了し、判定タイミングであれば、S170にて、その一定時間間隔の間に蓄積された、パラメータHsb,Vの分布から、どのクラスタに属するか(最も近いか)を判定し、そのクラスタに対応するクラス、及び判定に使用した環境判定クラスタ分布を特定するクラスタ情報CLを、推定モデル学習部13及び目標値設定部15に対して出力して、本処理を終了する。
【0056】
<<衝突余裕時間算出部>>
衝突余裕時間算出部12では、車速Vと先行車との車間距離Dとから相対車速、相対加速度を算出し、等加速度運動を仮定した先行車との衝突余裕時間TTCを算出する。なお、この技術は周知技術であるため、詳細な説明は省略する。
【0057】
<<推定モデル学習部>>
推定モデル学習部13は、クラスタ情報CLで特定される運転環境毎に、目標車間距離ODを算出するための推定モデル、及び目標衝突余裕時間OTを算出するための推定モデルを作成する。
【0058】
具体的には、車速Vと車間距離の逆数D-1とをパラメータとする散布図、及び車速Vと衝突余裕時間の逆数TTC-1とをパラメータとする散布図を求め(図5参照)、これらの散布図に、それぞれOCSVM(One-Class Support Vector Machine)を適用することで、散布図上に引かれる境界線(ここでは直線)を表す回帰式が、推定モデルとなる。
【0059】
そして、OCSVMでは、散布図上に設定される基準点からの距離を尺度として、予め設定された閾値th(例えば初期値を5%とする)のデータをアウトライア(異常値)として除去する(ここでは境界線の上側に位置する)ように境界線を引く。なお、閾値thは、変更可能なパラメータである。
【0060】
ここで、推定モデル学習部13が実行する処理の流れを、図4に示すフローチャートに沿って説明する。
本処理は、運転環境判定部11での処理と同様に、予め設定された一定時間間隔(例えば、100ms)毎に起動する。
【0061】
本処理が起動すると、まず、S210では、運転環境判定部11からのクラスタ情報CLを取得し、続くS220では、クラスタ情報CLに変化があったか否かを判断する。
変化がない場合は、そのままS240に進み、変化がある場合は、S230にて、クラスタ情報CLに従って学習対象となる推定モデルを切り換えてS240に進む。
【0062】
S240では、学習対象となる推定モデルが学習済みであるか否かを判断し、学習済みである場合は、S270に進み、学習済みでない場合は、S250にて、目標値設定部15からの再学習指令があるか否かを判断する。
【0063】
再学習指令がない場合は、そのまま本処理を終了し、再学習指令がある場合は、S260にて、現在の推定モデルを履歴として保存すると共に、再学習指令に示された指示に従って、回帰式を求める際に使用する閾値thを変更してS270に進む。
【0064】
なお、再学習指令において、目標値OD,OTが大き過ぎる旨が示されている場合には、閾値thを予め設定された所定値(例えば0.5%)だけ減少させ、逆に、目標値OD,OTが小さ過ぎる旨が示されている場合には、閾値thを上記所定値だけ増加させる。
【0065】
S270では、学習に用いるデータ(車速V,車間距離D,衝突余裕時間TTC)を取得して、現在の学習対象推定モデルに対応づけて記憶し、続くS280では、記憶されたデータが、十分な精度が得られる量に達していれば、推定モデルとなる回帰式の算出を行い、これをデータ記憶部14に保存して、本処理を終了する。
【0066】
なお、図5は、学習に用いるデータの散布図と、その散布図に基づく回帰直線の算出結果を、それぞれ3名の被験者について例示したものであり、(a)がクラス3における車速Vと車間距離の逆数D-1の散布図、(b)がクラス1における車速Vと車間距離の逆数D-1の散布図、(c)がクラス1における車速Vと衝突余裕時間の逆数TTC-1の散布図である。
【0067】
散布図において、回帰直線より上側は、普段の車間距離や衝突余裕時間より短いこと、即ち危険側を意味し、回帰直線より下側は、普段の車間距離や衝突余裕時間より長いこと、即ち安全側を意味する。
【0068】
<<目標値設定部>>
目標値設定部15は、クラスタ情報CLによって特定される学習済みの推定モデルが、データ記憶部14に記憶されている場合には、その推定モデル(回帰式)に基づき、車速Vに対応する目標車間距離OD、目標衝突余裕時間OTを設定する。
【0069】
なお、設定された目標値OD,OTに対して、目標値修正装置7から目標値を修正する指令が入力された場合は、算出に用いた推定モデルに対応付けられたカウント値を、目標値OD,OTを増加させる修正が行われた場合には+1、減少させる修正が行われた場合には−1する。
【0070】
そして、カウント値の絶対値が予め設定された閾値を超えた場合、カウント値が+(プラス)であれば目標値OD,OTを減少させる旨、カウント値が−(マイナス)であれば目標値OD,OTを増加させる旨を指示する再学習指令RSを、推定モデル学習部13に対して出力する。
【0071】
<<運転状況推定部>>
運転状況推定部16は、目標値設定部15で設定された車間距離及び衝突余裕時間の目標値OD,OTと、最新の検出値D,TTCとを比較し、検出値D,TTCの目標値OD,OTからの逸脱度ΔD(=D−OD),ΔT(=TTC−OD)を算出、その逸脱度ΔD1,ΔT1(そのドライバにとっての通常の運転状況を基準とした逸脱度)を第1の運転状況として出力する。
【0072】
また、運転状況推定部16は、データ記憶部14に記憶されている標準的な推定モデル(多数のドライバの平均値)から設定される標準的な目標値SD,STに基づき、その標準的な目標値からの逸脱度ΔD2,ΔT2(一般的なドライバの運転状況を基準とした逸脱度)を第2の運転状況として出力する。
【0073】
更に、運転状況推定部16は、データ記憶部14に、ある一定期間(例えば、6ヶ月,1年,3年など)前の推定モデルが記憶されている場合には、それらの推定モデルから設定される過去の目標値に対する現在の目標値OD,OTの変化量(そのドライバの運転状況の長期的な変化傾向)を、第3の運転状況として出力する。
【0074】
<支援内容選択装置>
支援内容選択装置8は、例えば、車間距離について以下の運転支援を実行する。
即ち、図6に示すように、現車速で先行車にこれ以上接近すると急ブレーキをかけても衝突が避けられない距離を衝突不可避距離XDとして、目標車間距離ODから衝突不可避距離に至る車間距離の範囲を4分割し、車間距離の広い順に、レベル1(ディスプレイに情報提供),レベル2(インジケータによる注意喚起),レベル3(ブザーによる警報),レベル4(車両による自動ブレーキ)の制御エリアとする。
【0075】
そして、車間距離の逸脱度ΔD1が、どのレベルの制御エリアに属するかによって、運転支援内容を決定して実行する。
なお、ドライバが定常的に危険な運転(車間距離が極端に短い)をしている場合には、推定モデルでは、その挙動を正常な挙動として学習してしまい、警報などを発生させることができなくなる可能性がある。
【0076】
このため、支援内容選択装置8では、第2の運転状況に従って、逸脱度が異常レベルにある場合、即ち、多くの人の平均的な運転挙動からかけ離れた運転挙動を示している場合には、それがそのドライバの平均的な運転挙動であったとしても、警報を発する等の運転支援制御を実行する。
【0077】
更に、第3の運転状況に基づき、運転状況がある変化傾向を示している(例えば、車間距離が年々短くなる(又は長くなる)傾向にある等)ことが明らかになった場合に、その旨をドライバに通知し、注意喚起をすることによって運転支援を行う。また、運転状況の変化傾向に応じて運転支援の内容を変化させてもよい。
【0078】
<効果>
以上説明したように、運転支援装置1では、運転環境を分類してその運転環境毎に、ドライバの運転状況の推定に用いる推定モデルを学習により生成するようにされている。しかも、運転環境を判定する際には、車両の挙動(車速V)だけでなく、ドライバの操作(ステアリング操作量S,ブレーキ操作量B)も考慮されている。
【0079】
従って、運転支援装置1によれば、ドライバの運転操作に影響を与える運転環境を精度よく判定することができ、その運転環境に適した推定モデルを用いて運転状況の推定が行われるため、よりドライバの感覚にあった推定を行うことができ、ひいてはドライバの感覚にあった的確な運転支援を実行することができる。
【0080】
また、運転支援装置1では、運転環境を判定する際に、一定期間の間に連続的に検出された一定量のデータV,S,Bに基づくパラメータHsb,Vを用いて、それらパラメータHsb,Vの傾向から判定を行っているため、データが検出される毎に逐次判定を行う場合と比較して、判定精度を向上させることができる。
【0081】
また、運転支援装置1では、OCSVMによって推定モデルを学習することによって、閾値thによって決まる一定量のデータがアウトライア(異常値)として除去されるため、異常値の影響が抑制された再現性の高い推定モデルを得ることができ、ひいては、その推定モデルに基づいて受容性の高い推定結果を得ることができる。
【0082】
<実験>
図5に示した散布図から求めた推定モデルを用い、被験者1〜3に、自身に適合させた推定モデル、他人に適合させた推定モデルの両方について、同じ道路を走行して注意喚起や警報のタイミングを確認した。
【0083】
これにより、被験者毎に注意喚起や警報のタイミングが異なること、また、他の被験者に適合させた推定モデルを使用すると、注意喚起や警報のタイミングに明らかな違和感を感じることが確認された。
【0084】
<発明との対応>
本実施形態において、S140が検出データ取得手段、S170が環境判定手段、S110が分布選択情報取得手段、運転環境判定部11が運転環境判定装置、データ記憶部14がモデル記憶手段,履歴記憶手段,標準モデル記憶手段、推定モデル学習部13が学習手段、目標値設定部15及び運手状況推定部16が推定手段、支援内容選択装置8が支援実行手段に相当する。
【0085】
<変形例>
本実施形態では、推定モデル学習部13は、一定期間のデータを蓄積してから推定モデル(回帰式)を求めているが、オンラインで(即ち、前回の処理で算出された回帰式と、今回の検出データとで)回帰式が導ける演算方式に変更してもよい。この場合、推定モデルの学習を行う際に蓄積すべきデータ数を大幅に削減することができる。
【0086】
また、本実施形態では、推定モデルの学習が一端終了すると、再学習指令RSを受けた場合に限り再学習を行っているが、推定モデルの学習を、常時実行したり、ある一定期間毎に繰り返して実行したりしてもよい。
【0087】
また、推定モデルの学習が終了していない場合は、標準モデルを用いて推定を行ってもよく、特に、オンラインで回帰式(推定モデル)を導く場合は、標準モデルを回帰式の初期値として学習を進めるように構成してもよい。
【0088】
また、推定モデルを推定に使用できるか否か(学習が終了しているか否か)をドライバに通知するようにしてもよい。この場合、推定に使用できるか否かの判断は、例えば、学習に使用したデータ量や、推定誤差の収束(例えば、第1の運転状況を表す逸脱度ΔD1,ΔT1の平均値が許容値以下)などによって行うことが考えられる。なお、実験では、同一クラスタの挙動データV,Dが1時間分程度あれば、ある程度許容できるレベルの回帰式が得られることが確認されている。
【0089】
本実施形態では、挙動データとして車速V及び車間距離Dを用いているが、これらに限るものではなく、加速度やヨーレートなど、その他の運転挙動を表すパラメータを用いてもよい。
【0090】
本実施形態では、目標値の手動変更の傾向によって再学習指令RSを出力するように構成したが、例えば、アクセルやブレーキ操作が所定以上の頻度で実施される場合に、目標値OD,OTが不適切であるものとして再学習指令RSを出力するように構成してもよい。この場合、アクセル操作が多く実施されるならば閾値thを減少させ、ブレーキ操作が多く実施されるならば閾値thを増加させて再学習を実施すればよい。
【0091】
[第2実施形態]
次に、第2実施形態について説明する。
図7は、車両に搭載され、ブレーキの操作パターン(時系列的な状態遷移)からにブレーキで行った運転行動(ブレーキ意図)を推定し、その運転行動に応じた運転支援を行う運転支援装置1aの全体構成を示すブロック図である。
【0092】
<全体構成>
図7に示すように、運転支援装置1aは、車両の挙動を検出する挙動検出センサ群2と、ドライバによる運転操作を検出する操作検出センサ群3と、地図データやVICS等により車外から取得した各種情報に基づいて経路設定や経路案内等を実行すると共に、それらの処理に使用される情報の一部を他の車載装置に提供するナビゲーション装置4と、ドライバを識別しその識別結果を表す識別情報IDを他の車載装置に提供するドライバ識別装置5と、挙動検出センサ群2,操作検出センサ群3,ナビゲーション装置4,ドライバ識別装置5から取得する各種情報に基づいて、ドライバの運転行動を推定する運転行動推定装置6aと、運転行動推定装置6aでの推定結果に基づいて、運転支援の内容を選択して実行する支援内容選択装置8aとを備えている。
【0093】
このうち、操作検出センサ群3,ナビゲーション装置4,ドライバ識別装置5については、第1実施形態と同様の構成であるため、説明を省略する。
挙動検出センサ群2には、自車両の車速(自車速)Vを検出する車速センサが少なくとも含まれている。
【0094】
<運転行動推定装置>
運転行動推定装置6aは、車速V,ステアリング操作量S,ブレーキ操作量B,天気情報W,時間帯情報TB,識別情報IDに基づいて、運転環境(走行中の道路の走行環境)を判定しその判定結果を表すクラスタ情報CLを出力する運転環境判定部11と、ブレーキ操作量B及びクラスタ情報CLに基づいて、クラスタ情報CLで特定される運転環境毎に、ドライバの運転行動の推定に使用する推定モデルの学習を行う推定モデル学習部23と、推定モデル学習部23で学習された推定モデルやその履歴、及び平均的な推定モデルを表す標準モデル等を記憶するデータ記憶部24と、クラスタ情報CLから特定される推定モデルを用い、ブレーキ操作量Bに従って、ドライバの運転行動を推定する運転行動推定部25とを備えている。
【0095】
なお、運転行動推定装置6aは、CPU,メモリ(ROM,RAM等)からなる周知のマイクロコンピュータを中心に構成され、上記データ記憶部24は、メモリ上に設定される一部の領域からなり、それ以外の各部11,23,25は、CPUが実行する処理によって実現される。
【0096】
このうち、運転環境判定部11については、第1実施形態と同様の構成であるため、説明を省略する。
<<推定モデル学習部>>
推定モデル学習部23は、ブレーキ操作量Bから求めた運転データに基づき、ブレーキの踏み始めから踏み終わりに至る一連の運転データ(以下、トライアルという)が、予め設定された四つのクラスのいずれに属するかを判断することにより、各トライアルに教師ラベルを付与すると共に、その教師ラベル毎に、ブレーキ操作をモデル化したHMMでの状態遷移確率の学習とを行う。
【0097】
具体的には、運転データは、一定時間間隔(例えば100ms)毎に検出されるブレーキ操作量Bに基づいて生成され、ブレーキ操作量Bに応じた大きさとなるブレーキ踏力と、自身が属するトライアルの開始からの踏力の和(以下「踏力積分値」という)とからなる。
【0098】
また、四つのクラス(教師ラベル)は、ブレーキの踏み始め、あるいは操作量が小さい状況に対応するラベル1、操作量が大きく踏力を一定に保っている状況に対応するラベル2、それらの中間の状況に対応するラベル3、ブレーキを踏んでいない状況に対応するラベル4からなる。
【0099】
そして、図8に示すように、運転データを表すブレーキ踏力,踏力積分値をパラメータとする二次元グラフ上にラベル1〜ラベル4に対応するクラスタを予め定義しておき、逐次検出される運転データが、どのクラスタに属するかによってクラスを判別し、そのクラスに対応するラベルを付与する。
【0100】
更に、同一のトライアルに属する運転データに付与されたラベルの中で、最も数が多いラベルを、そのトライアルの教師ラベルとする。
ここで、図9は、上段がブレーキ踏力の時間変化を例示したものであり、下段が、その時々の運転データがどのクラスタに属するかを判断した結果を例示したものである。図9において、1,2,5番目のトライアルはラベル1に分類され、3,4,7番目のトライアルはラベル2に分類され、6番目のトライアルはラベル3に分類されることになる。
【0101】
なお、ラベル付けに用いるクラスタ分布の定義は、具体的には以下のように行う。
まず、ブレーキ操作を伴った様々な運転行動が行われている時に検出された運転データを蓄積し、その蓄積された運転データに対して、GMM(混合ガウスモデル)を適用して混合数4でクラスタリングする。
【0102】
図8は、ブレーキ踏力と踏力積分値をパラメータとする散布図であり、散布図中の運転データは、クラスタリングした結果に従って、属するクラスタ毎に異なる点(△,○,×,▲)で表されている。具体的には、△で示され縦軸周辺に伸びるクラスタをラベル1、○で示され水平方向に密集して伸びるクラスタをラベル2、Xで示され水平方向に疎に分布するクラスタをラベル3、▲で示され原点付近に存在するクラスタをラベル4とする。
【0103】
本実施形態では、このラベル1〜4の付与に用いるクラスタの分布は学習の対象ではなく、予め用意されたものを用いるが、個人毎に学習しても構わない。
次に、図10(a)は、運転データの時系列からなるトライアルのクラスタリングに使用するHMMを表す状態遷移図である。
【0104】
ここでは、状態数が5のleft-to-right HMMを用いている。即ち、ブレーキを踏んでない状況を表すラベル4(図中S1)から始まって、ラベル1(図中S2),ラベル2(図中S3),ラベル3(図中S4)と遷移し、最後にブレーキを踏んでいないラベル4(図中S5)に戻るものとし、遷移は多くとも次の状態までのモデルを扱う。
【0105】
HMMの出力はガウス分布に基づくとし、初期値には、GMMクラスタリング(図8参照)で導いた各クラスタ中心と分散を用いる。
学習するに当たり、遷移状態Si(i=1,2,3,4,5)に対して、状態Siから状態Sjに遷移する確率をAijで表すものとして、初期状態遷移確率は、上三角形行列で、対角行列(即ち、自身に遷移する確率A11,A22,A33,A44,A55)とその次の列(即ち、ある状態から次の状態に遷移する確率A12,A23,A34,A45)を0.5とし、それ以外の確率は0とした。但し、終了の状態を加味するために、S5からS5への遷移確率はA55=1とした。
【0106】
図10(b)は、教師ラベル1〜3が付与されたトライアルを教師データとして、HMMの状態遷移確率の学習を行った結果を示す。但し、上からラベル1,ラベル2,ラベル3である。
【0107】
なお、各ラベルに対応する運転行動は、ラベル1が先行車に対する接近のブレーキ、ラベル2が信号待ちのブレーキ、ラベル3が右左折によるブレーキである。
ここで、推定モデル学習部13が実行する処理の流れを、図11に示すフローチャートに沿って説明する。
【0108】
本処理は、運転環境判定部11での処理と同様に、予め設定された一定時間間隔(例えば、100ms)毎に起動する。
本処理が起動すると、まず、S310では、運転環境判定部11からのクラスタ情報CLを取得し、続くS320では、クラスタ情報CLに変化があったか否かを判断する。
【0109】
変化がない場合は、そのままS340に進み、変化がある場合は、S330にて、クラスタ情報CLに従って学習対象となる推定モデルを切り換えてS340に進む。
S340では、学習に用いるブレーキ操作量Bを取得し、続くS350では、そのブレーキ操作量Bに基づいて、運転データ(ブレーキ踏力,踏力積分値)を求める。
【0110】
S360では、運転データに基づきトライアルが終了したか否かを判断し、終了していなければ(今回の運転データが非ゼロ)、S370にて、運転データに対するラベル付けを行って本処理を終了する。
【0111】
一方、トライアルが終了している場合(前回の運転データが非ゼロで且つ今回が運転データがゼロ)は、S380にて、トライアルに対するラベル(教師ラベル)付けを行い、続くS390にて、その教師ラベルに対応した推定モデル(HMM)の状態遷移確率の学習を行って本処理を終了する。
【0112】
<<運転行動推定部>>
運転行動推定部25は、クラスタ情報CLに対応した推定モデル(ラベル1〜3に対応した3個一組のHMM)に運転データを入力し、対数尤度が最大となるHMMを選択し、その選択されたHMMのラベル(ひいてはそのラベルに対応する運転行動)、推定結果として支援内容選択装置8aに出力する。
【0113】
なお、推定モデルが、十分な精度が得られるまでは、運転行動の推定を禁止するように構成されていてもよい。
<支援内容選択装置>
支援内容選択装置8aは、推定結果のラベルに対応する運転行動に応じた運転支援を実行する。
【0114】
例えば、推定されたブレーキラベルと実際の運転行動に頻繁に差異が生じる場合(例えば推定されたブレーキラベルはラベル1の先行車に対する接近のブレーキパターンであることを示しているにもかかわらず、右左折の運転行動を伴っている場合等)、現在の運転状態はあせりや眠気など普段の運転状態とは異なると判断し、運転者に注意喚起や警報を与えたりする。
【0115】
<効果>
以上説明したように、運転支援装置1aでは、運転環境を分類してその運転環境毎に、ドライバの運転行動の推定に用いる推定モデル(HMM)を学習により生成するようにされている。しかも、運転環境を判定する際には、車両の挙動(車速V)だけでなく、ドライバの操作(ステアリング操作量S,ブレーキ操作量B)も考慮されている。
【0116】
従って、運転支援装置1aによれば、ドライバの運転行動に影響を与える運転環境を精度よく判定することができ、その運転環境に適した推定モデルを用いて運転行動の推定が行われるため、推定精度を向上させることができ、ひいてはドライバの運転行動に応じた的確な運転支援を実行することができる。
【0117】
<実験>
図8に示すクラスタ分布、図10(b)に示すHMMを用いて実際に運転行動を推定したところ、推定出力された運転行動は、実際の運転行動(実際にブレーキをかけた時に行った行動)と良く一致していることを確認した。
【0118】
<発明との対応>
本実施形態において、データ記憶部24がモデル記憶手段、推定モデル学習部23が学習手段、運転行動推定部25が推定手段、支援内容選択装置8aが支援実行手段に相当する。
【0119】
[他の実施形態]
以上本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、様々な態様にて実施することが可能である。
【0120】
例えば、上記実施形態では、分布選択情報ID,W,TBによって選択される環境判定クラスタ分布を構成するクラスタの数を4としているが、これに限るものではなく、クラスタ数は2以上であればよい。
【0121】
また、分布選択情報も、識別情報ID,天気情報W,時間帯情報TBに限るものではなく、例えば、ナビゲーション装置4から、道路種別(高速道路/一般道路)や道路形状(急カーブ,直進等)等を取得して、これらによって使用する環境判定クラスタ分布を切り換えるように構成してもよい。
【符号の説明】
【0122】
1,1a…運転支援装置 2,2a…挙動検出センサ群 3…操作検出センサ群 4…ナビゲーション装置 5…ドライバ識別装置 6,6a…運転状況推定装置 7…目標値修正装置 8,8a…支援内容選択装置 11…運転環境判定部 12…衝突余裕時間算出部 13,23…推定モデル学習部 14,24…データ記憶部 15…目標値設定部 16…運転状況推定部
【特許請求の範囲】
【請求項1】
車両の挙動を表す挙動データ及びドライバの操作を表す操作データからなる検出データを取得する検出データ取得手段と、
前記検出データ取得手段により取得された検出データに基づいて、車両の運転環境を判定する環境判定手段と、
を備え、
前記環境判定手段は、様々な運転環境にて取得された前記検出データをクラスタリングすることで予め生成され、それぞれが異なった運転環境に対応する複数のクラスタからなるクラスタ分布を使用し、前記検出データ取得手段にて逐次取得される検出データを前記クラスタ分布と照合することによって前記運転環境を判定することを特徴とする運転環境判定装置。
【請求項2】
前記環境判定手段は、前記検出データ取得手段によって連続的に検出された一定量の前記検出データを用いて判定を行うことを特徴とする請求項1に記載の運転環境判定装置。
【請求項3】
前記環境判定手段が判定する運転環境以外に、前記クラスタの分布を変化させる要因に関する分布選択情報を取得する分布選択情報取得手段を備え、
前記クラスタ分布が、前記要因毎に用意されていると共に、
前記環境判定手段は、前記分布選択情報取得手段が取得した分布選択情報に基づき、判定に使用する前記クラスタ分布を切り換えることを特徴とする請求項1又は請求項2に記載の運転環境判定装置。
【請求項4】
前記分布選択情報取得手段が取得する前記分布選択情報は、天気情報,時間帯情報,ドライバの識別情報のうち、少なくとも一つを含むことを特徴とする請求項3に記載の運転環境判定装置。
【請求項5】
請求項1乃至請求項4のいずれかに記載の運転環判定装置と、
前記環境判定装置での判定結果の種類毎に用意され、ドライバの運転傾向をモデル化した推定モデルを記憶するモデル記憶手段と、
前記検出データ取得手段にて取得された検出データに基づいて前記推定モデルを学習する学習手段と、
前記運転環境判定装置での判定結果に従って選択した推定モデルを用い、前記検出データに基づいてドライバの運転状況を推定する推定手段と、
を備えることを特徴とする運転状況推定装置。
【請求項6】
前記検出データには、自車速及び先行車との車間距離が少なくとも含まれ、
前記学習手段は、前記自車速と前記車間距離に関わる車間パラメータとの関係に基づいて、前記自車速から前記車間パラメータの目標値を推定するための推定モデルを生成し、
前記推定手段は、前記自車速と前記推定モデルとによって設定された目標値と前記車間パラメータの実測値との差から前記運転状況を推定することを特徴とする請求項5に記載の運転状況推定装置。
【請求項7】
前記学習手段は、前記自車速と前記車間パラメータとの関係を表すグラフに対して、OCSVM(One-Class Support Vector Machine)を用いることで求められる回帰式を、前記推定モデルとすることを特徴とする請求項6に記載の運転環境判定装置。
【請求項8】
前記検出データには、ブレーキ操作量が少なくとも含まれ、
前記学習手段は、ある時刻でのブレーキ操作量、及びブレーキ操作が開始されてからのその時刻に至る前記ブレーキ操作量の積分値からなる2次元の運転データの状態遷移に基づいて、前記運転データからドライバのブレーキ意図を推定するための推定モデルを生成し、
前記推定手段は、前記運転データと前記推定モデルとによって推定されたブレーキ意図を前記運転状況の推定結果とすることを特徴とする請求項5に記載の運転状況推定装置。
【請求項9】
前記学習手段は、前記運転データをクラス分けすると共に、ブレーキの踏み始めから踏み終わりまでを一つのトライアルとして、前記トライアルの中で最も多くの運転データが属するクラスを、前記ブレーキ意図の一つを表す該トライアルの教師ラベルとし、同一のトライアルを構成する運転データが、前記クラス間を遷移する確率をHMM(Hidden Markov Model )を用いて学習することを特徴とする請求項8に記載の運転状況推定装置。
【請求項10】
前記運転データのクラス分けには、様々な運転状況で測定した運転データをクラスタリングすることによって予め設定され、それぞれが異なった運転状況に対応する複数のクラスタとの照合により行うことを特徴とする請求項9に記載の運転状況推定装置。
【請求項11】
請求項5乃至請求項10のいずれかに記載の運転状況推定装置と、
前記推定手段での推定結果に応じた運転支援を選択して実行する支援実行手段と、
を備えることを特徴とする運転支援装置。
【請求項12】
前記学習手段にて学習された推定モデルの履歴を記憶する履歴記憶手段を備え、
前記支援実行手段は、前記履歴記憶手段に記憶された推定モデルの変化に応じて運転支援の内容を決定することを特徴とする請求項11に記載の運転支援装置。
【請求項13】
多数のドライバの平均的な推定モデルである標準モデルを記憶する標準モデル記憶手段を備え、
前記支援実行手段は、前記標準推定モデルに対する前記学習手段にて学習された推定モデルの逸脱度に応じて運転支援の内容を決定することを特徴とする請求項11又は請求項12に記載の運転支援装置。
【請求項1】
車両の挙動を表す挙動データ及びドライバの操作を表す操作データからなる検出データを取得する検出データ取得手段と、
前記検出データ取得手段により取得された検出データに基づいて、車両の運転環境を判定する環境判定手段と、
を備え、
前記環境判定手段は、様々な運転環境にて取得された前記検出データをクラスタリングすることで予め生成され、それぞれが異なった運転環境に対応する複数のクラスタからなるクラスタ分布を使用し、前記検出データ取得手段にて逐次取得される検出データを前記クラスタ分布と照合することによって前記運転環境を判定することを特徴とする運転環境判定装置。
【請求項2】
前記環境判定手段は、前記検出データ取得手段によって連続的に検出された一定量の前記検出データを用いて判定を行うことを特徴とする請求項1に記載の運転環境判定装置。
【請求項3】
前記環境判定手段が判定する運転環境以外に、前記クラスタの分布を変化させる要因に関する分布選択情報を取得する分布選択情報取得手段を備え、
前記クラスタ分布が、前記要因毎に用意されていると共に、
前記環境判定手段は、前記分布選択情報取得手段が取得した分布選択情報に基づき、判定に使用する前記クラスタ分布を切り換えることを特徴とする請求項1又は請求項2に記載の運転環境判定装置。
【請求項4】
前記分布選択情報取得手段が取得する前記分布選択情報は、天気情報,時間帯情報,ドライバの識別情報のうち、少なくとも一つを含むことを特徴とする請求項3に記載の運転環境判定装置。
【請求項5】
請求項1乃至請求項4のいずれかに記載の運転環判定装置と、
前記環境判定装置での判定結果の種類毎に用意され、ドライバの運転傾向をモデル化した推定モデルを記憶するモデル記憶手段と、
前記検出データ取得手段にて取得された検出データに基づいて前記推定モデルを学習する学習手段と、
前記運転環境判定装置での判定結果に従って選択した推定モデルを用い、前記検出データに基づいてドライバの運転状況を推定する推定手段と、
を備えることを特徴とする運転状況推定装置。
【請求項6】
前記検出データには、自車速及び先行車との車間距離が少なくとも含まれ、
前記学習手段は、前記自車速と前記車間距離に関わる車間パラメータとの関係に基づいて、前記自車速から前記車間パラメータの目標値を推定するための推定モデルを生成し、
前記推定手段は、前記自車速と前記推定モデルとによって設定された目標値と前記車間パラメータの実測値との差から前記運転状況を推定することを特徴とする請求項5に記載の運転状況推定装置。
【請求項7】
前記学習手段は、前記自車速と前記車間パラメータとの関係を表すグラフに対して、OCSVM(One-Class Support Vector Machine)を用いることで求められる回帰式を、前記推定モデルとすることを特徴とする請求項6に記載の運転環境判定装置。
【請求項8】
前記検出データには、ブレーキ操作量が少なくとも含まれ、
前記学習手段は、ある時刻でのブレーキ操作量、及びブレーキ操作が開始されてからのその時刻に至る前記ブレーキ操作量の積分値からなる2次元の運転データの状態遷移に基づいて、前記運転データからドライバのブレーキ意図を推定するための推定モデルを生成し、
前記推定手段は、前記運転データと前記推定モデルとによって推定されたブレーキ意図を前記運転状況の推定結果とすることを特徴とする請求項5に記載の運転状況推定装置。
【請求項9】
前記学習手段は、前記運転データをクラス分けすると共に、ブレーキの踏み始めから踏み終わりまでを一つのトライアルとして、前記トライアルの中で最も多くの運転データが属するクラスを、前記ブレーキ意図の一つを表す該トライアルの教師ラベルとし、同一のトライアルを構成する運転データが、前記クラス間を遷移する確率をHMM(Hidden Markov Model )を用いて学習することを特徴とする請求項8に記載の運転状況推定装置。
【請求項10】
前記運転データのクラス分けには、様々な運転状況で測定した運転データをクラスタリングすることによって予め設定され、それぞれが異なった運転状況に対応する複数のクラスタとの照合により行うことを特徴とする請求項9に記載の運転状況推定装置。
【請求項11】
請求項5乃至請求項10のいずれかに記載の運転状況推定装置と、
前記推定手段での推定結果に応じた運転支援を選択して実行する支援実行手段と、
を備えることを特徴とする運転支援装置。
【請求項12】
前記学習手段にて学習された推定モデルの履歴を記憶する履歴記憶手段を備え、
前記支援実行手段は、前記履歴記憶手段に記憶された推定モデルの変化に応じて運転支援の内容を決定することを特徴とする請求項11に記載の運転支援装置。
【請求項13】
多数のドライバの平均的な推定モデルである標準モデルを記憶する標準モデル記憶手段を備え、
前記支援実行手段は、前記標準推定モデルに対する前記学習手段にて学習された推定モデルの逸脱度に応じて運転支援の内容を決定することを特徴とする請求項11又は請求項12に記載の運転支援装置。
【図1】
【図3】
【図4】
【図6】
【図7】
【図11】
【図2】
【図5】
【図8】
【図9】
【図10】
【図3】
【図4】
【図6】
【図7】
【図11】
【図2】
【図5】
【図8】
【図9】
【図10】
【公開番号】特開2011−53798(P2011−53798A)
【公開日】平成23年3月17日(2011.3.17)
【国際特許分類】
【出願番号】特願2009−200369(P2009−200369)
【出願日】平成21年8月31日(2009.8.31)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.VICS
【出願人】(000004260)株式会社デンソー (27,639)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【Fターム(参考)】
【公開日】平成23年3月17日(2011.3.17)
【国際特許分類】
【出願日】平成21年8月31日(2009.8.31)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.VICS
【出願人】(000004260)株式会社デンソー (27,639)
【出願人】(504143441)国立大学法人 奈良先端科学技術大学院大学 (226)
【Fターム(参考)】
[ Back to top ]