説明

車載カメラシステム

【課題】 カーナビゲーションシステムに対し、口形の変形量から識別される目的地を示す言葉を送信可能な車載カメラシステムを提供する。
【解決手段】 車内に着座する人物を撮像する撮像部6,8と、前記撮像部6,8により撮像される前記人物の口形及び前記口形の変形量を検出する検出部20と、前記検出部20の検出結果から前記人物の発した言葉を識別する識別部20と、前記識別部20の識別結果をカーナビゲーションシステムに対して送信する送信部22とを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車載カメラシステムに関するものである。
【背景技術】
【0002】
マイクから入力される音声を認識する間、オーディオ用スピーカからの音量を0にする音声認識装置が提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平11−15494号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、上述のような音声認識装置において認識された音声に基づいて目的地を設定可能なカーナビゲーションシステムが存在するが、雑音等の混在により正確に音声認識されず、目的地を設定するのに時間を要する場合があった。
【0005】
本発明の目的は、カーナビゲーションシステムに対し、口形の変形量から識別される目的地を示す言葉を送信可能な車載カメラシステムを提供することである。
【課題を解決するための手段】
【0006】
本発明の車載カメラシステムは、車内に着座する人物を撮像する撮像部と、前記撮像部により撮像される前記人物の口形及び前記口形の変形量を検出する検出部と、前記検出部の検出結果から前記人物の発した言葉を識別する識別部と、前記識別部の識別結果をカーナビゲーションシステムに対して送信する送信部とを備えることを特徴とする。
【発明の効果】
【0007】
本発明の車載カメラシステムによれば、カーナビゲーションシステムに対し、口形の変形量から識別される目的地を示す言葉を送信することができる。
【図面の簡単な説明】
【0008】
【図1】実施の形態に係る車載カメラシステムのシステム構成を示すブロック図である。
【図2】実施の形態に係る車載カメラシステムにおいて運転手の口形及び口形の変形量から言葉を識別する際の処理について説明するためのフローチャートである。
【図3】実施の形態に係る車載カメラシステムにおいて運転手の口形及び口形の変形量から警告を行うか否かを判別する際の処理について説明するためのフローチャートである。
【発明を実施するための形態】
【0009】
以下、図面を参照して、本発明の実施の形態に係る車載カメラシステムについて説明する。図1は、実施の形態に係る車載カメラシステム2及びカーナビゲーションシステム(以下、カーナビという。)4のシステム構成を示すブロック図である。車載カメラシステム2は、自動車内の、例えばバックミラー近傍に設けられ、運転手及び助手席に着座する人の口形を撮像し、口形の変化量を検出することにより運転手または助手席に着座する人が発音した言葉を識別するためのシステムである。カーナビ4は、現在地から目的地までのルートを検索し、検索結果を表示し、検索結果に基づいて現在地から目的地までの道案内を行うシステムである。
【0010】
図1に示すように、車載カメラシステム2は、2つの異なる方向から同時に撮像することにより両眼視差を再現可能なステレオカメラシステムとして機能し、CCDまたはCMOS等により構成される左側撮像素子6及び右側撮像素子8を備えている。左側撮像素子6は、右側撮像素子8に対して左側に配置され、図示しない左側撮影レンズを透過した被写体光を撮像して被写体像に応じた撮像信号を出力する。右側撮像素子8は、左側撮像素子6に対して右側に配置され、左側レンズに対して右側に配置される図示しない右側撮影レンズを透過した被写体光を撮像して被写体像に応じた撮像信号を出力する。なお、左側撮像素子6及び右側撮像素子8は、被写体として運転手及び助手席に着座する人の口形を撮像する。
【0011】
また、車載カメラシステム2は、左側A/D変換部10、左側フレームバッファ12、右側A/D変換部14、右側フレームバッファ16、口形テンプレート記憶部18、制御部20、及び通信部22を備えている。左側A/D変換部10は、左側撮像素子6からの撮像信号をアナログ信号からデジタル信号に変換し、左側フレームバッファ12は、左側A/D変換部10から出力されるデジタル信号に基づく画像データを一時的に記憶する。同様に、右側A/D変換部14は、右側撮像素子8からの撮像信号をアナログ信号からデジタル信号に変換し、右側フレームバッファ16は、右側A/D変換部14からのデジタル信号に基づく画像データを一時的に記憶する。
【0012】
口形テンプレート記憶部18は、ある言葉、例えば「あ」と発音する際の人物の口形及び口形の変形量のパターン、及び他の音(い、う、え、お・・・)を発音する際の人物の口形及び口形の変形量のパターンをテンプレートとして記憶する。制御部20は、CPU等により構成され、車載カメラシステム2の各部を統括的に制御する。通信部22は、制御部20からの指示に従いカーナビ4に対して各種データを送信し、また、カーナビ4の後述する通信部32から送信される各種データを受信し、受信した各種データを制御部20に対して出力する。
【0013】
この実施の形態では、制御部20は、左側フレームバッファ12及び右側フレームバッファ16に記憶されている画像データを読み込み、読み込んだ画像データから人物の口形及び口形の変形量を後述するSnakesの原理を用いて検出し、検出された口形及び口形の変形量に合致するパターンを口形テンプレート記憶部18に記憶されている様々なパターンの中から抽出し、発音している言葉を識別する。
【0014】
また、カーナビ4は、制御部24、マイク26、スピーカ28、音声記憶部30、及び通信部32を備えている。制御部24は、CPU等により構成され、カーナビ4の各部を統括的に制御する。マイク26は、目的地を設定する際に運転手または助手席に着座する人が発する音声(目的地を示す言葉)を集音し、集音した音声を制御部24に対して出力する。スピーカ28は、制御部24からの指示に従い、後述する警告音を出力する。音声記憶部30は、マイク26から出力される音声に基づく音声データを記憶する。通信部32は、制御部24からの指示に従い車載カメラシステム2に対して音声データ等を送信し、また、車載カメラシステム2から送信される各種データを受信し、受信した各種データを制御部24に対して出力する。
【0015】
次に、図2に示すフローチャートを参照して、この実施の形態に係る車載カメラシステム2において人物の口形及び口形の変形量から言葉を識別する際の処理について説明する。
【0016】
まず、運転手等のカーナビ4への操作により、カーナビ4において目的地を設定する目的地設定モードへの移行がなされた場合、カーナビ4の制御部24は、通信部32を介して目的地設定モードに移行した旨を示す情報を車載カメラシステム2に対して送信する。車載カメラシステム2の制御部20は、通信部22を介して、目的地設定モードに移行した旨を示す情報をカーナビ4から受信すると(ステップS10)、左側撮像素子6及び右側撮像素子8に対して撮像を開始する指示を出力し、被写体光の撮像を開始する(ステップS11)。
【0017】
次に、制御部20は、左側フレームバッファ12及び右側フレームバッファ16に記憶される画像データを読み込み、読み込んだ画像データから運転手または助手席に着座する人の口形を検出する(ステップS12)。なお、この実施の形態では、運転手の口形を検出したとする。具体的には、Snakesの原理を用いて運転手の唇の輪郭(以下、唇輪郭という。)を抽出する。Snakesの原理とは、制御点の集合として表される閉曲線V(s)=(x(s),y(s))上で、形状エネルギEintと画像エネルギEimageの線形和として数1で表されるエネルギ関数Esnakesを定義し、エネルギ関数Esnakesが最小となるように輪郭線の形状を順次修正し、輪郭線(この実施の形態では唇輪郭)の抽出を行うモデルである。
【数1】

【0018】
ここで、形状エネルギEintは曲線の滑らかさを示す関数、画像エネルギEimageは画像のエッジポテンシャルの強さを示す関数、Ecomは外部エネルギでユーザーが必要に応じて組み込む関数である。
【0019】
次に、制御部20は、ステップS12において検出された口形(唇輪郭)に基づいて、画像データ内に唇が存在するか否かを判別する(ステップS13)。即ち、制御部20は、ステップS12においてSnakesの原理を用いて唇輪郭が抽出されなかった場合には、画像データ内に唇が存在しないと判別し(ステップS13、No)、ステップS11の処理に戻り、ステップS13において唇が存在すると判別されるまでステップS11〜ステップS13の処理を繰り返す。
【0020】
一方、制御部20は、ステップS20においてSnakesの原理を用いて唇輪郭が抽出された場合には、画像データ内に唇が存在すると判別し(ステップS13、Yes)、左側フレームバッファ12及び右側フレームバッファ16から読み込んだ画像データから運転手の口形の変形量を検出する(ステップS14)。具体的には、ステップS12において唇輪郭を抽出した後に、Snakesの原理を用いて再び唇輪郭の抽出を行い、ステップS12において抽出された唇輪郭と、その後に抽出された唇輪郭との差分を検出することにより、唇輪郭(口形)の変形量を検出する。
【0021】
次に、制御部20は、ステップS14において検出された口形の変形量に合致するパターンを、口形テンプレート記憶部18に記憶されている様々なパターンの中から抽出し、運転手が発音している言葉を識別する(ステップS15)。例えば、ステップS14において検出された口形の変形量が、「あ」と発音する際の口形の変形量のパターンと合致する場合には、制御部20は、運転手が「あ」と発音したものとして認識する。このように、制御部20は、ステップS14において検出された口形の変形量と、口形テンプレート記憶部18に記憶されているパターンとを比較し、運転手が発音した単語を順次識別することにより、運転手が発音した地名等の目的地を特定する。なお、この実施の形態では、Snakesの原理を用いて運転手の唇輪郭及び唇輪郭の変形量を検出しているが、例えば画像処理を行い、差分を算出する等の他の公知の技術を用いて運転手の口形及び口形の変形量を検出してもよい。
【0022】
なお、車載カメラシステム2の制御部20がステップS11〜ステップS15の処理を行っている間、カーナビ4の制御部24は、運転手が発した目的地を示す音声をマイク26から取得し、取得した音声に基づく音声データを音声記憶部30に記憶させておく。
【0023】
ステップS15の処理の後、車載カメラシステム2の制御部20は、通信部22を介して、制御部20がステップS11〜ステップS15の処理を行っている間に音声記憶部30に記憶された音声データをカーナビ4から取得する(ステップS16)。
【0024】
次に、制御部20は、ステップS15において識別された言葉と、ステップS16において取得した音声データから形成される音声とを比較する(ステップS17)。即ち、車載カメラシステム2において運転手の口形及び口形の変形量に基づき判別された目的地と、カーナビ4において運転手の音声に基づき判別された目的地とを比較する。ステップS15において識別された言葉と、ステップS16において取得した音声データから形成される音声とが同一である場合(ステップS18、Yes)、制御部20は、ステップS15において運転手の口形及び口形の変形量に基づき識別された言葉が、運転手が指示した目的地であると確定する。一方、ステップS15において識別された言葉と、ステップS16において取得した音声データから形成される音声とが異なる場合、音声の音量が小さいためマイク26が音声を集音できず音声データを取得できない場合、音声が曖昧なためマイク26により集音した音声から音声データを形成できない場合(ステップS18、No)、制御部20は、ステップS15において運転手の口形及び口形の変形量に基づき識別された言葉を、運転手が指示した目的地として採用する(ステップS19)。
【0025】
なお、制御部20は、口形の変形量が0である場合等、ステップS15において運転手の口形及び口形の変形量に基づき言葉を識別できなかった場合には、ステップS16において取得した音声データから形成される音声を、運転手が指示した目的地として採用する。
【0026】
次に、制御部20は、通信部22を介して、結果、即ち運転手が指示した目的地を示すデータをカーナビ4に対して送信する(ステップS20)。カーナビ4の制御部24は、通信部32を介して、車載カメラシステム2から送信されたデータ(運転手が指示した目的地を示すデータ)を取得し、取得したデータに基づく目的地が正しいか否かを運転手に問う。例えば、スピーカ28から「・・・で設定しますか。」等の音声の出力、または、図示しない表示部に「・・・で設定しますか?」等の表示を行う。
【0027】
そして、制御部24は、運転手により例えば「はい」等が選択され、取得したデータに基づく目的地が正しいと確認した場合には、その目的地までのルートを検索し、検索結果を表示する。一方、制御部24は、運転手により例えば「いいえ」等が選択され、取得したデータに基づく目的地が誤っていると確認した場合には、車載カメラシステム2に対してその旨を示す情報を送信し、再びマイク26から音声の集音を開始する。車載カメラシステム2は、カーナビ4からその旨を示す情報を受信した場合には、ステップS11〜ステップS20の処理を繰り返す。
【0028】
ところで、この実施の形態に係る車載カメラシステム2では、運転手の口形の変形量から、居眠りや度重なる欠伸等を検出し、カーナビ4に対し、居眠り運転等に対する警告を示す情報を送信することができる。図3は、実施の形態に係る車載カメラシステム2において運転手の口形及び口形の変形量から警告を行うか否かを判別する際の処理について説明するためのフローチャートである。
【0029】
まず、制御部20は、カーナビ4において目的地が設定されてから所定時間が経過したか否かを判別し(ステップS30)、所定時間が経過したと判別された場合には(ステップS30、Yes)、左側撮像素子6及び右側撮像素子8に対して撮像を開始する指示を出力し、被写体光の撮像を開始する(ステップS31)。ここで、所定時間は、10分、30分、1時間、2時間等、変更可能に構成されており、予め設定されている値が図示しないメモリ等に記憶されている。なお、カーナビ4が起動してから所定時間が経過したか否かを判別してもよい。また、カーナビ4における目的地設定時やカーナビ4の起動から所定時間経過後でなく、常時撮像を行うようにしてもよく、または、所定時間間隔で撮像を行うようにしてもよい。なお、ステップS31〜S34の処理は、図2に示すステップS11〜S14の処理と同一のため、説明を省略する。
【0030】
次に、制御部20は、ステップS34において検出された口形の変形量が0であるか否か、または、口形の変形量が一定であるか否かを判別する(ステップS35)。即ち、運転手の口形が変化していないか否か、または、運転手の口形が何度も同一の形に変化しているか否かを判別する。例えば、運転手の口形が変化していない場合には、運転手がガムをかむ等の行為及び言葉を発している等の行為がなされていないと判別することができ、制御部20は、運転手が居眠りをしている可能性があると判別する。また、運転手の口形が何度も同一の形に変化している場合には、運転手が欠伸を何度も行っていると判別することができ、制御部20は、運転手が眠気を催している可能性があると判別する。
【0031】
ステップS34において検出された口形の変形量が0、または、口形の変形量が一定であると判別された場合には(ステップS35、Yes)、制御部20は、通信部22を介して、居眠りや度重なる欠伸等に対する警告を示す情報をカーナビ4に対して送信する(ステップS36)。カーナビ4の制御部24は、通信部32を介して、車載カメラシステム2から送信された警告を示す情報を取得すると、スピーカ28から警告音を出力する。運転手は、スピーカ28から出力される警告音を聞くことにより、居眠りや度重なる欠伸を認識することができる。
【0032】
一方、ステップS34において検出された口形の変形量が0でない、または、口形の変形量が一定でないと判別された場合には(ステップS35、No)、制御部20は、居眠りや度重なる欠伸等に対する警告を発する必要がないと判断し、ステップS30の処理に戻り、ステップS30〜S35の処理を繰り返す。
【0033】
なお、この実施の形態では、車載カメラシステム2がカーナビ4に対して警告を示す情報を送信し、カーナビ4が警告音を出力しているが、車載カメラシステム2がスピーカ等を備えている場合には警告音を出力してもよい。
【0034】
この実施の形態に係る車載カメラシステム2によれば、目的地を示す言葉を口形の変形量から識別することができ、識別された言葉をカーナビ4に対して送信することができるため、カーナビ4においてマイク26により音声が集音できない場合においても目的地の設定を行うことができる。したがって、カーナビ4における運転手や助手席に着座する人の音声による目的地設定の精度を向上させることができる。また、従来のように、雑音等により音声が認識されない場合等においても、または目的地設定の度にオーディオ用スピーカの音量を0にしなくとも、運転手や助手席に着座する人の口形の変形量により目的地を設定することができる。
【0035】
また、運転手の口形の変形量から、居眠りや度重なる欠伸等を検出し、カーナビ4に対し、居眠り運転等に対する警告を示す情報を送信することができるため、居眠り運転による事故を予防することができる。また、従来技術として運転手の目の動き(瞬き)から居眠り等を検出する技術が開示されているが、運転手がサングラスやメガネ等を着用している場合には従来技術では居眠り等を検出することができない。しかしながら、この実施の形態によれば、運転手の口形の変形量から居眠りや度重なる欠伸等を検出するため、運転手がサングラスやメガネ等を着用している場合でも、従来技術と比較して居眠りや度重なる欠伸等の検出精度を向上させることができる。
【0036】
また、この実施の形態に係る車載カメラシステム2によれば、ステレオカメラシステムとして機能しているため、広領域撮像が可能であり、助手席に着座する人の口形も撮像することができる。したがって、助手席に着座する人の口形の変形量に基づき目的地を設定することもできる。
【0037】
なお、この実施の形態においては、カーナビ4から音声データを取得し、車載カメラシステム2において運転手の口形及び口形の変形量に基づき識別された言葉と、カーナビ4において記録された運転手の音声とを比較しているが、比較することなく、車載カメラシステム2において運転手の口形及び口形の変形量に基づき識別された言葉の情報のみで目的地を確定してもよい。
【符号の説明】
【0038】
2…車載カメラシステム、4…カーナビゲーションシステム、6…左側撮像素子、8…右側撮像素子、10…左側A/D変換部、12…左側フレームバッファ、14…右側A/D変換部、16…右側フレームバッファ、18…口形テンプレート記憶部、20…制御部、22…通信部。

【特許請求の範囲】
【請求項1】
車内に着座する人物を撮像する撮像部と、
前記撮像部により撮像される前記人物の口形及び前記口形の変形量を検出する検出部と、
前記検出部の検出結果から前記人物の発した言葉を識別する識別部と、
前記識別部の識別結果をカーナビゲーションシステムに対して送信する送信部と、
を備えることを特徴とする車載カメラシステム。
【請求項2】
前記カーナビゲーションシステムから前記人物の音声を取得する取得部と、
前記識別結果と前記取得部の取得結果とを比較する比較部とを備え、
前記送信部は、前記比較部の比較結果を送信することを特徴とする請求項1記載の車載カメラシステム。
【請求項3】
前記検出部の検出結果に基づいて前記人物に対して警告を行うか否かを判別する判別部を備えることを特徴とする請求項1または請求項2記載の車載カメラシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2010−262424(P2010−262424A)
【公開日】平成22年11月18日(2010.11.18)
【国際特許分類】
【出願番号】特願2009−111777(P2009−111777)
【出願日】平成21年5月1日(2009.5.1)
【出願人】(000004112)株式会社ニコン (12,601)
【Fターム(参考)】