車載用の音声処理装置、音声処理システム、及び音声処理方法
【課題】車両間での通信において、より臨場感のある対話を可能とする。
【解決手段】第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、第2の車両の位置を取得する車両位置取得手段と、第2の車両内で取得された音声を取得する音声取得手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、第2の車両内で取得された音声の仮想音源が、第2の車両の位置の方向に形成されるように、第2の車両内で取得された音声を加工し、スピーカアレイにより出力する。第2の車両内で取得された音声の仮想音源を、発話者の座席位置に応じて、定めてもよい。
【解決手段】第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、第2の車両の位置を取得する車両位置取得手段と、第2の車両内で取得された音声を取得する音声取得手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、第2の車両内で取得された音声の仮想音源が、第2の車両の位置の方向に形成されるように、第2の車両内で取得された音声を加工し、スピーカアレイにより出力する。第2の車両内で取得された音声の仮想音源を、発話者の座席位置に応じて、定めてもよい。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車載用の音声処理装置の音声処理技術に関する。
【背景技術】
【0002】
電話回線等を利用して複数の車両間で対話可能なシステムがある。例えば、ハンズフリー電話を利用すれば、車両間で、容易に対話をすることができる。
【0003】
【特許文献1】特開2007−13838号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、単に従来の電話機能を利用して、他の車両からの音声をスピーカから出力するだけでは、臨場感に欠ける。特に、車両内は、個々のプライベート空間が形成されるため、他の車両からの音声を単に出力しても、相手の存在を実感しにくい。
【0005】
本発明の目的は、車両間での通信において、より臨場感のある対話を可能とすることにある。
【課題を解決するための手段】
【0006】
上記課題を解決すべく、本発明では、車両の位置や発話者の座席位置に応じて、受話者の音場における、発話者の音声の仮想音源位置を定める。
【0007】
例えば、本発明の第1の態様は、第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、前記第2の車両の位置を取得する車両位置取得手段と、前記第2の車両内で取得された音声を取得する音声取得手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、前記第2の車両内で取得された音声の仮想音源が、前記第2の車両の位置の方向に形成されるように、前記第2の車両内で取得された音声を加工し、前記スピーカアレイにより出力する音声出力手段と、を備える。
【0008】
また、本発明の第2の態様は、第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する前記第1の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と、を備える。
【0009】
また、本発明の第3の態様は、第1の車両の車載装置と通信可能な、第2の車両に搭載される車載用音声処理装置であって、複数のマイクロフォンにより前記第2の車両内の音声を取得する手段と、前記第2の車両内で取得された音声を、音源ごとに分離する音声分離手段と、前記音声分離手段により分離された音声を、座席位置に対応付ける手段と、前記座席位置に対応付けた音声を、前記第1の車両の車載装置に送信する手段とを備える。
【0010】
本発明の第4の態様は、第1の車両と第2の車両との間で音声の送受信が可能な音声処理システムであって、前記第1の車両内で取得された音声を、音源ごとに分離する音声分離手段と、前記音声分離手段により得られた音源の位置ごとの音声から、座席位置に対応付けた音声を求める手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けた音声の仮想音源が、その座席位置に対応する前記第2の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段とを備える。
【発明を実施するための最良の形態】
【0011】
以下に、本発明の一実施形態について、図面を参照して説明する。
【0012】
<第1の実施形態>
図1は、本発明の一実施形態が適用された車載用の音声処理装置100の概略構成図である。なお、本実施形態において、車両間での対話は、それぞれの車両に搭載された複数台の音声処理装置100の間で行われる。また、2台とは限らず、3台以上が同時に音声の送受信を行ってもよい。この場合は、会議のように、同時に複数人での対話が可能となる。
【0013】
本実施形態の音声出力装置100は、ナビゲーション装置と一体となっている。図示するように、音声処理装置100は、演算処理部1と、ディスプレイ2と、記憶装置3と、マイクロフォンアレイ4と、スピーカアレイ5と、着席センサ6と、入力装置7と、車輪速センサ8と、ジャイロセンサ9と、GPS(Global Positioning System)受信装置10と、通信装置15とを備えている。
【0014】
演算処理部1は、様々な処理を行う中心的ユニットである。例えば各種センサ8、9やGPS受信装置10から出力される情報を基にして現在位置を検出する。また、マイクロフォンアレイ4から入力された音声を、通話相手の他の車載装置100に送信したり、通話相手の車載装置100から受信した音声をスピーカアレイ5から出力したりする。また、音声を認識し、認識した語句から、ユーザの入力内容を特定することも行う。
【0015】
ディスプレイ2は、液晶表示装置などで構成され、演算処理部1で生成されたグラフィックス情報を表示するユニットである。
【0016】
記憶装置3は、CD-ROMやDVD-ROMやHDDやICカードといった記憶媒体で構成されている。この記憶媒体には、地図データ等が記憶されている。
【0017】
マイクロフォンアレイ4は、ユーザが発話した音声を取得する音声入力装置である。マイクロフォンアレイ4は、設定位置の異なる複数のマイクロフォンからなる。これにより、音声取得位置による音声の相違(遅延時間、音量など)を利用した音声分離が可能となり、各音声の音源位置を特定することができる。
【0018】
スピーカアレイ5は、演算処理部1で生成された音声を出力するための音声出力装置である。スピーカアレイ5は、設置位置の異なる複数のスピーカからなり、それぞれのスピーカから、遅延時間や音量を変化させた音声を出力することで、聴取者(受話者)に対して音場の中に仮想音源を定位させることができる。これにより、聴取者に、実際には音源が位置しない位置から音声が出力されているかのような感覚を与えることができる。本実施形態では、これを利用して、対話の臨場感を向上させる。
【0019】
着席センサ6は、感圧センサなどで構成され、車両内の座席に搭乗者が着席しているか否かを検知する。
【0020】
図2は、車両300における、マイクロフォンアレイ4、スピーカアレイ5、及び着席センサ6の配置について説明するための図(天頂からみた図)である。図示するように、マイクロフォンアレイ4は、例えば、ダッシュボード、バックミラー、ピラー等の近傍に設置された、複数(少なくとも2つ、好ましくは3〜4つ)のマイクロフォンからなる。
【0021】
スピーカアレイ5は、各座席の搭乗者が各々に向けられた音声を聴取可能なように、座席ごとに設けられている。例えば、スピーカアレイ5は、各座席のヘッドレストに、搭乗者の左右の耳の位置に合わせて配置されている。
【0022】
着席センサ6は、各座席301の座板に配されており、搭乗者の重みにより、着席状態か否かを検出する。
【0023】
図1に戻って説明する。入力装置7は、ユーザからの指示を受け付けるユニットである。入力装置5は、スクロールキー、縮尺変更キーなどのハードスイッチ、ジョイスティック、ディスプレイ上に貼られたタッチパネルなどで構成される。
【0024】
センサ8、9およびGPS受信装置10は、現在地(自車位置)を検出するために使用されるものである。
【0025】
通信装置15は、他の車両に搭載された音声処理装置100と通信を行うための装置である。通信装置15は、電話回線を利用するものであってもよいし、インターネットを利用するものであってもよい。また、携帯電話と接続して、通信を行うものであってもよい。
【0026】
図3は、演算処理部1の機能ブロック図である。
【0027】
図示するように、演算処理部1は、ユーザ操作解析部41と、現在位置算出部42と、ナビゲーション処理部43と、音声取得部44と、音声分離部45と、音場設定部46と、音声加工部47と、音声出力部48と、通信部49とを備えている。
【0028】
ユーザ操作解析部41は、入力装置7に入力されたユーザからの要求を受け、その要求内容を解析して、その要求内容に対応する処理が実行されるように演算処理部1の各部を制御する。
【0029】
現在位置算出部42は、各センサ8,9及びGPS受信装置10の出力から、現在位置を求める。例えば、地図データを用いて、マップマッチングにより地図上の自車両の位置を求める。
【0030】
ナビゲーション処理部43は、指定された2地点(現在地、目的地)間を結ぶ推奨経路を探索したり、ディスプレイ2に推奨経路を表示し経路誘導を行ったりする。
【0031】
音声取得部44は、マイクロフォンアレイ4を介して、話者が発した音声を取得する処理を行う。
【0032】
音声分離部45は、マイクロフォンアレイ4で取得した、複数の音源から出力された音声(混合音)を、音源位置ごとの音声に分離する。音声分離部45は、マイクロフォンアレイ4を構成する各マイクロフォンの位置を予め記憶しており、各マイクロフォンの位置を基準として、音源位置を特定する。なお、音声分離の手法については、公知の方法を用いることができるので詳述しない。
【0033】
音場設定部46は、スピーカアレイ5が出力する音声により聴取者に対して実現される、音場の構成(仮想音源の位置、発する音声、音量など)を決定する処理を行う。
【0034】
音声加工部47は、音場設定部46で決定された音場がスピーカアレイ5により実現されるように、スピーカアレイ5を構成する各スピーカに出力する音声を加工する処理を行う。音声加工部47は、スピーカアレイ5を構成する各スピーカの位置を予め記憶しており、各スピーカの位置を基準として音場が形成されるように音声を加工する。なお、音場における仮想音源の形成方法については、公知の方法を用いることができるので詳述しない。
【0035】
音声出力部48は、音声加工部47で加工された、各スピーカで出力されるべき音声を、スピーカアレイ5に送信し、音声出力を実行する。
【0036】
通信部49は、通信装置15を介して、他の音声処理装置100との間の情報の送受信を仲介する処理を行う。
【0037】
なお、演算処理部1は、図1に示すように、数値演算及び各デバイスを制御するといった様々な処理を実行するCPU(Central Processing Unit)11と、記憶装置3から読み出した地図データ、演算データなどを格納するRAM(Random Access Memory)12と、プログラムやデータを格納するROM(Read Only Memory)13と、外部との情報の授受を行うインターフェース14とを備えるコンピュータシステムにより達成される。上述の演算処理部1の各機能部は、CPUがメモリにロードしたプログラムを実行することにより達成される。なお、音声処理に関して、専用のDSP(Digital Signal Processor)が行うようにしてもよい。
【0038】
[動作の説明]次に、上記構成の複数台の音声処理装置100の間で行われる、発話から受話までの動作について説明する。
【0039】
図4は、かかる処理のフロー図である。
【0040】
なお、ここでは、発話者側の音声処理装置100と受話者側の音声処理装置100とに分けて動作を説明する。もちろん、いずれの車両の搭乗者が発話者になるかによって、音声処理装置100は、発話者側になったり、受話者側になったりする。
【0041】
本フローは、複数の音声処理装置100の間で、対話モードとなっている場合に開始される。
【0042】
まず、発話者側の音声処理装置100の音声取得部44は、マイクロフォンアレイ4を介して、発話者の音声を取得する(S11)。次に、発話者側の音声処理装置100の通信部49は、取得された音声を、現在位置算出部42で算出された現在位置とともに、受話側の音声処理装置100に送信する(S12)。
【0043】
これを受けて、受話側の音声処理装置100の通信部49は、発話者側の音声処理装置100から送信された、発話者の音声と、発話者側の車両の現在位置を取得する(S13)。
【0044】
次に、受話側の音声処理装置100の音場設定部46は、音場の構成を設定する(S14)。図5は、音場の構成を説明するための図である。音場設定部46は、自車両(受話者側の車両)の現在位置と相手車両(発話者側の車両)の現在位置との関係500に基づいて、音場510の構成を設定する。具体的には、自車両501の位置を音場510の中心511として、発話者側の車両502(または503)の現在位置に相当する位置に、発話者の音声の仮想音源512(または513)を配置し、音場510を構成する。また、発話者の音声の音量については、車両間の距離L1(またはL2)が離れる程、小さくなるように設定する。
【0045】
すなわち、図5の例のように、自車両501に対して、右斜め前に発話者側の車両502があるとすると、車両502の搭乗者の音声の仮想音源512は、音場の中心(自身の位置)511に対して、右斜め前に設定される。一方、左斜め後ろに発話者側の車両503があるとすると、車両503の搭乗者の音声の仮想音源513は、音場の中心(自身の位置)511に対して、左斜め後ろに設定される。さらに、発話者の音声の音量は、自車両から遠い車両からの音声ほど小さくなるように設定されるので、図5の例では、右斜め前の車両502からの音声は、左斜め後ろの車両からの音声に比べて小さく設定される。
【0046】
なお、発話者の実際の声の大きさが一定とは限らない。発話者の実際の声の大きさにばらつきがあると、車両間の距離に応じて音量を調整する意味が薄れる。そこで、音場設定部46は、発話者側から受信した音声について、一旦音量を所定の音量に正規化した後、車両間の距離に応じて調整するようにしてもよい。
【0047】
次に、音声加工部47は、音場設定部46で設定された音場が再現されるように、スピーカアレイ5を構成する各スピーカに出力されるべき音声を、元の音声を加工することにより生成する(S15)。
【0048】
そして、音声出力部48は、音声加工部47で加工された、スピーカアレイ5を構成する各スピーカに出力されるべき音声を、スピーカアレイ5に出力し、音声出力を実現する(S16)。これにより、受話者は、発話者の発話内容を聴取することができる。
【0049】
以上、図4のフローを用いて、発話から受話までの動作について説明した。なお、かかるフローは、いずれかの搭乗者が発話する度に繰り返される。
【0050】
上記した本実施形態によれば、受話者に対して、スピーカアレイ5により形成される音場により、発話者側の車両位置に発話者の音源位置を定位させることができる。したがって、受話者に、あたかもその方向から発話者が発話しているかのような感覚を与えることができ、臨場感のある対話が実現する。
【0051】
上記実施形態は、さまざまな変形が可能である。
【0052】
例えば、ドライバ同士のみの対話、後部座席の搭乗者同士のみの対話など、特定の座席位置の搭乗者のみの対話に制限することもできる。
【0053】
図6は、かかる場合の対話動作の処理のフロー図である。図6のフローは、図4で示した処理と基本的に同じである。ただし、マイクロフォンアレイ4で取得される「発話者の音声」に、複数の搭乗者の音声が混合していることを想定して、音声分離により特定の座席の搭乗者の音声のみを抽出するための処理S11’が挿入されている。S11’では、概略すると、発話者側の音声処理装置100の音声分離部45は、S11において取得された音声に対して、音声分離を行って、特定の座席位置の音声のみを抽出する。
【0054】
図7は、かかる処理を説明するための概念図である。
【0055】
まず、音声分離部45は、音声分離の手法(すなわち、混合音から音源位置ごとの音声に分離する手法)を用いて、S11で取得された発話者の音声(混合音)700を、音源位置701ごとの音声702に分離する。
【0056】
一方、音声分離部45は、座席位置711と車両内の空間領域712との対応表710を保持している。図2を用いて説明すると、車両300の内部空間は、座席位置(ドライバ位置(右前)、助手席位置(左前)、後部右側位置、後部左側位置)に対応して、座席空間A1、A2,A3、A4が定められている。すなわち、車内の三次元座標における位置は、いずれかの座席空間A1〜A4に属する。
【0057】
そこで、音声分離部45は、かかる座席位置711と空間領域712との対応表710を用いて、音源位置701に対応付けられた音声702を、座席位置711に対応付ける。そして、座席位置711に対応つけた音声702を取得する。
【0058】
さらに音声分離部45は、予め定められた座席位置(例えば、ドライバ位置)の音声702のみを抽出する。なお、いずれの座席位置の音声を抽出するかは、ユーザにより選択可能にすることができる。
【0059】
そして、通信部49は、S12において、音声分離部45により抽出された音声を、車両の現在位置とともに、受信側の音声処理装置100に送信する。その後の処理は、上記した通りである。
【0060】
このようにすれば、特定の座席位置の搭乗者の音声のみを、対話に用いることができる。例えば、複数の車両で同一目的地を目指す場合など、ドライバ間の対話が優先的となる場合において、他の搭乗者が発声している場合でも、ドライバの発話内容に関しては、確実に他の車両のドライバに伝えるということができる。
【0061】
なお、音声分離の処理S11’は、受話側の音声処理装置100で行ってもよい。例えば、図4のフローと同様に、発話者側の通信部49は、発話者の音声(混合音)を、受話者側の音声処理装置100に送信する。受話者側の音声処理装置100は、これを受信後、上記のS11’と同様に、音声分離と、座席位置との対応付け、及び特定の座席位置の音声の抽出を行う。そして、抽出した音声のみが、音声出力されるようにする。
【0062】
また、S12において、通信部49は、発話者の音声を送信する際に、その音声に対応付けられた座席位置も送信するようにしてもよい。そして、受話者側の音声処理装置100では、受信した発話者の座席位置を示す情報を、表示装置に表示して、誰が発話者なのか分かるようにしてもよい。また、受話側の音声処理装置100の音声出力部48は、受信した発話者の座席位置に対応する座席位置のスピーカアレイ5にのみから音声出力するようにしてもよい。こうすれば、設定された座席位置の搭乗者のみで対話をすることができ、対話内容が他の座席位置の搭乗者に聴かれることがない。
【0063】
また、発話者の座席位置ごとに、受話側で出力する際の音量を異ならせることもできる。例えば、発話者側の音声出力装置100の通信部49は、複数の座席位置に対応付けられた複数の音声を、座席位置の情報とともに、受話側の音声出力装置100に送信する。受話側の音声出力装置100の音声出力部48は、出力しようとする音声について、対応付けられた座席位置に応じて、音量を異ならせる。例えば、優先順位を設け、ドライバ位置>助手席位置>後部右側位置>後部左側位置の順に、音量を大きくする。こうすれば、重要性が高い内容を話しそうな搭乗者の会話を優先的に受話側の搭乗者に聴取させることができる。
【0064】
<第2の実施形態>
第2の実施形態におけるハードウェア構成及び機能部の構成は、上記第1の実施形態と似た構成を備えている。したがって、重複する部分については説明を省略する。
【0065】
本実施形態では、発話者の座席位置、及び受話者の座席位置に応じて、各受話者に対して提供する音場における音声の仮想音源位置を設定する。例えば、他の車両の助手席に搭乗している発話者の音声が、受話側のドライバにとっては、自車両の助手席側から発せられたように感じさせることが可能となる。
【0066】
図8は、本実施形態にかかる発話から受話までの処理を示すフロー図である。
【0067】
本フローは、複数の音声処理装置100の間で、対話モードとなっている場合に開始される。
【0068】
まず、発話者側の音声処理装置100の音声取得部44は、マイクロフォンアレイ4を介して、発話者の音声を取得する(S21)。次に、音声分離部45は、S21において取得された音声に対して、音声分離を行って(S22)、さらに、図7で示した方法と同様にして、座席位置ごとの音声を抽出する(S23)。次に、発話者側の音声処理装置100の通信部49は、取得された音声を、現在位置算出部42で算出された現在位置とともに、受話側の音声処理装置100に送信する(S24)。
【0069】
これを受けて、受話側の音声処理装置100の通信部49は、発話者側の音声処理装置100から送信された、座席位置に対応付けられた発話者の音声と、発話者側の座席位置とを取得する(S25)。
【0070】
次に、受話側の音声処理装置100の音場設定部46は、着席センサ6を介して、自車両内の各座席について着席状態か否かを検出する(S26)。
【0071】
さらに、音場設定部46は、音場の構成を設定する(S27)。図9は、音場の構成を説明するための図である。音場設定部46は、各座席のスピーカアレイ5ごとに、異なる音場を設定することになる。また、発話者の発話者側の車両内での座席位置と、受話者の受話者側の車両内の座席位置との位置関係に基づいて、音場の構成を設定する。具体的には、音場設定部46は、S25で受信した座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する受話側の車両の座席位置に形成されるように、音場の構成を設定する。
【0072】
例えば、図9(A)に示すように、発話者側の車両において助手席の搭乗者が発話者である音声があるとする。受話者側の車両のドライバ席の音場を設定す場合、音場設定部46は、まず、ドライバ位置を中心とした音場を設定する。そして、図9(B)に示すように、発話者(発話者側の車両の助手席の搭乗者)の音声の仮想音源800を、ドライバ位置からみた助手席位置の方向に設定する。
【0073】
ところで、発話者の座席位置に対応する受話者側の座席位置に、既に搭乗者がいる場合がある。かかる場合に、その座席位置に仮想音源を設定すると、発話者の音声と実際の搭乗者の音声が混じり、受話者に違和感を与える。そこで、音場設定部46は、
(1)S25で取得した座席位置に対応付けられた音声のうち、自車両の未着席状態の座席位置に対応する音声については、その座席位置を音源位置と設定する。
(2)一方、S25で取得した座席位置に対応付けられた音声のうち、自車両の着席状態の座席位置に対応する音声については、他の未着席の座席位置(または、予め定めた位置(例えば、車両中央の天井位置)を音源位置と設定する。
【0074】
こうして音場が設定されると、音声加工部47は、音場設定部46で設定された音場が再現されるように、各座席のスピーカアレイ5ごとに、スピーカアレイ5を構成する各スピーカに出力されるべき音声を、元の音声を加工することにより生成する(S28)。
【0075】
そして、音声出力部48は、音声加工部47で加工された音声を、各スピーカアレイ5に出力し、音声出力を実現する(S29)。これにより、受話者は、発話者の発話内容を聴取することができる。
【0076】
以上、図8のフローを用いて、発話から受話までの動作について説明した。なお、かかるフローは、いずれかの搭乗者が発話する度に繰り返される。
【0077】
上記した第2の実施形態によれば、発話者の音源位置を、発話者と受話者との座席の位置関係に基づいて定める。したがって、受話者に対して、あたかも自車両の対応する座席に発話者が存在するかのような感覚を与えることができ、より臨場感のある対話を実現することができる。
【0078】
本実施形態は、さまざまな変形が可能である。
【0079】
例えば、上記第1の実施形態の変形例で説明したのと同様に、ドライバ同士のみの対話、後部座席の搭乗者同士のみの対話など、特定の座席位置の搭乗者のみの対話に制限することもできる。
【0080】
図10は、かかる場合の対話動作の処理のフロー図である。また、図11は、かかる場合の音場の構成を説明するための図である。図10のフローは、図8で示した処理と基本的に同じである。ただし、マイクロフォンアレイ4で取得される「発話者の音声」に、複数の搭乗者の音声が混合していることを想定して、音声分離により特定の座席の搭乗者の音声のみを抽出するための処理S23’が挿入されている。すなわち、発話者側の音声処理装置100の音声分離部45は、S23において取得された座席位置に対応付けられた音声から、特定の座席位置(例えば、ドライバ位置)の音声のみを抽出する。図11の例では、発話者であるドライバの音声のみが、受話者側のスピーカアレイ5に出力されるように設定された様子を示している。さらに、受話側のドライバ位置には、既にドライバが着席しているので、音場設定部46により、発話者の音声の仮想音源801の位置は、予め定められた位置(天井中央)に設定されている。なお、いずれの座席位置の音声を抽出して出力するかは、ユーザにより選択可能にすることができる。
【0081】
このようにすれば、特定の座席位置の搭乗者の音声のみを、対話に用いることができる。例えば、複数の車両で同一目的地を目指す場合など、ドライバ間の対話が優先的となる場合において、他の搭乗者が発声している場合でも、ドライバの発話内容に関しては、確実に他の車両のドライバに伝えることができる。
【0082】
なお、音声分離に係る処理S22、S23(対話者を制限する場合、さらにS23’)は、受話側の音声処理装置100で行ってもよい。例えば、発話者側の通信部49は、発話者の音声(混合音)を、受話者側の音声処理装置100に送信する。受話者側の音声処理装置100は、これを受信後、S22、S23(対話者を制限する場合、さらにS23’)と同様に、音声分離と、座席位置との対応付け、(対話者を制限する場合、さらに特定の座席位置の音声の抽出)を行う。そして、音場設定部46は、抽出された音声のみを、音場に割り当てる。これにより、音声出力部48は、特定の座席位置の発話者の音声のみを出力することになる。
【0083】
また、図8及び図10のフローでは、着席状態か否かを判定したが、これに限定されない。ユーザの選択に応じて、着席状態の判定を行わないでもよい。そして、着席状態か否かに関らず、一律に、該当する座席位置に仮想音源の位置を割り当てるようにしてもよい。
【0084】
また、音場の設定S27において、音場設定部46は、受話者の自身の位置(音場の中心)を中心として、円卓会議を行うように、周囲に、発話者の音声の音源位置を割り当ててもよい。発話者の音声の音源位置をどのように配置するかについては、ユーザから選択を受け付けるようにすることができる。
【0085】
また、3台上の複数台で対話を行う場合、同じ座席位置の搭乗者が同時に発話する場合がある。かかる場合、音場設定部46は、車両ごとに予め優先順位を設けておき、優先順位に応じて発話者の音量を大きく設定してもよい。または、同時に発話した発話者の中の、優先順位が最も高い発話者の音声のみを出力するようにしてもよい。
【0086】
また、上記第1の実施形態と第2の実施形態は、適宜組み合わせることも可能である。すなわち、受話者側の音声処理装置100の音場設定部46は、発話者の音源位置を、車両同士の位置関係により概略設定し、さらに、車両内の座席位置に応じて、細かく設定することもできる。または、出力しようとする音声に対応付けられた座席位置が、所定の座席位置(例えば、ドライバ位置)である場合、車両間の距離が遠くても、他の座席の発話者の音声に比べて音量を大きく出力するように設定することもできる。
【図面の簡単な説明】
【0087】
【図1】図1は、音声処理装置の概略構成図である。
【図2】図2は、マイクロフォンアレイ、スピーカアレイ、着席センサの配置を説明するための図である。
【図3】図3は、演算処理部1の機能構成を示す図である。
【図4】図4は、対話動作の処理のフロー図である。
【図5】図5は、音場の構成を設定する方法を説明するための図である。
【図6】図6は、対話動作の処理のフロー図である。
【図7】図7は、座席位置ごとの音声を求める処理を説明するための図である。
【図8】図8は、対話動作の処理のフロー図である。
【図9】図9は、音場の構成を設定する方法を説明するための図である。
【図10】図10は、対話動作の処理のフロー図である。
【図11】図11は、音場の構成を設定する方法を説明するための図である。
【符号の説明】
【0088】
100…音声処理装置、
1…演算処理部、2…ディスプレイ、3…記憶装置、4…マイクロフォンアレイ、5…スピーカアレイ、6…着席センサ、7…入力装置、8…車輪速センサ、9…ジャイロ、10…GPS受信装置、15…通信装置、
41…ユーザ操作解析部、42…現在位置算出部、43…ナビゲーション処理部、44…音声取得部、45…音声分離部、46…音場設定部、47…音声加工部、48…音声出力部、49…通信部
【技術分野】
【0001】
本発明は、車載用の音声処理装置の音声処理技術に関する。
【背景技術】
【0002】
電話回線等を利用して複数の車両間で対話可能なシステムがある。例えば、ハンズフリー電話を利用すれば、車両間で、容易に対話をすることができる。
【0003】
【特許文献1】特開2007−13838号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、単に従来の電話機能を利用して、他の車両からの音声をスピーカから出力するだけでは、臨場感に欠ける。特に、車両内は、個々のプライベート空間が形成されるため、他の車両からの音声を単に出力しても、相手の存在を実感しにくい。
【0005】
本発明の目的は、車両間での通信において、より臨場感のある対話を可能とすることにある。
【課題を解決するための手段】
【0006】
上記課題を解決すべく、本発明では、車両の位置や発話者の座席位置に応じて、受話者の音場における、発話者の音声の仮想音源位置を定める。
【0007】
例えば、本発明の第1の態様は、第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、前記第2の車両の位置を取得する車両位置取得手段と、前記第2の車両内で取得された音声を取得する音声取得手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、前記第2の車両内で取得された音声の仮想音源が、前記第2の車両の位置の方向に形成されるように、前記第2の車両内で取得された音声を加工し、前記スピーカアレイにより出力する音声出力手段と、を備える。
【0008】
また、本発明の第2の態様は、第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する前記第1の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と、を備える。
【0009】
また、本発明の第3の態様は、第1の車両の車載装置と通信可能な、第2の車両に搭載される車載用音声処理装置であって、複数のマイクロフォンにより前記第2の車両内の音声を取得する手段と、前記第2の車両内で取得された音声を、音源ごとに分離する音声分離手段と、前記音声分離手段により分離された音声を、座席位置に対応付ける手段と、前記座席位置に対応付けた音声を、前記第1の車両の車載装置に送信する手段とを備える。
【0010】
本発明の第4の態様は、第1の車両と第2の車両との間で音声の送受信が可能な音声処理システムであって、前記第1の車両内で取得された音声を、音源ごとに分離する音声分離手段と、前記音声分離手段により得られた音源の位置ごとの音声から、座席位置に対応付けた音声を求める手段と、複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けた音声の仮想音源が、その座席位置に対応する前記第2の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段とを備える。
【発明を実施するための最良の形態】
【0011】
以下に、本発明の一実施形態について、図面を参照して説明する。
【0012】
<第1の実施形態>
図1は、本発明の一実施形態が適用された車載用の音声処理装置100の概略構成図である。なお、本実施形態において、車両間での対話は、それぞれの車両に搭載された複数台の音声処理装置100の間で行われる。また、2台とは限らず、3台以上が同時に音声の送受信を行ってもよい。この場合は、会議のように、同時に複数人での対話が可能となる。
【0013】
本実施形態の音声出力装置100は、ナビゲーション装置と一体となっている。図示するように、音声処理装置100は、演算処理部1と、ディスプレイ2と、記憶装置3と、マイクロフォンアレイ4と、スピーカアレイ5と、着席センサ6と、入力装置7と、車輪速センサ8と、ジャイロセンサ9と、GPS(Global Positioning System)受信装置10と、通信装置15とを備えている。
【0014】
演算処理部1は、様々な処理を行う中心的ユニットである。例えば各種センサ8、9やGPS受信装置10から出力される情報を基にして現在位置を検出する。また、マイクロフォンアレイ4から入力された音声を、通話相手の他の車載装置100に送信したり、通話相手の車載装置100から受信した音声をスピーカアレイ5から出力したりする。また、音声を認識し、認識した語句から、ユーザの入力内容を特定することも行う。
【0015】
ディスプレイ2は、液晶表示装置などで構成され、演算処理部1で生成されたグラフィックス情報を表示するユニットである。
【0016】
記憶装置3は、CD-ROMやDVD-ROMやHDDやICカードといった記憶媒体で構成されている。この記憶媒体には、地図データ等が記憶されている。
【0017】
マイクロフォンアレイ4は、ユーザが発話した音声を取得する音声入力装置である。マイクロフォンアレイ4は、設定位置の異なる複数のマイクロフォンからなる。これにより、音声取得位置による音声の相違(遅延時間、音量など)を利用した音声分離が可能となり、各音声の音源位置を特定することができる。
【0018】
スピーカアレイ5は、演算処理部1で生成された音声を出力するための音声出力装置である。スピーカアレイ5は、設置位置の異なる複数のスピーカからなり、それぞれのスピーカから、遅延時間や音量を変化させた音声を出力することで、聴取者(受話者)に対して音場の中に仮想音源を定位させることができる。これにより、聴取者に、実際には音源が位置しない位置から音声が出力されているかのような感覚を与えることができる。本実施形態では、これを利用して、対話の臨場感を向上させる。
【0019】
着席センサ6は、感圧センサなどで構成され、車両内の座席に搭乗者が着席しているか否かを検知する。
【0020】
図2は、車両300における、マイクロフォンアレイ4、スピーカアレイ5、及び着席センサ6の配置について説明するための図(天頂からみた図)である。図示するように、マイクロフォンアレイ4は、例えば、ダッシュボード、バックミラー、ピラー等の近傍に設置された、複数(少なくとも2つ、好ましくは3〜4つ)のマイクロフォンからなる。
【0021】
スピーカアレイ5は、各座席の搭乗者が各々に向けられた音声を聴取可能なように、座席ごとに設けられている。例えば、スピーカアレイ5は、各座席のヘッドレストに、搭乗者の左右の耳の位置に合わせて配置されている。
【0022】
着席センサ6は、各座席301の座板に配されており、搭乗者の重みにより、着席状態か否かを検出する。
【0023】
図1に戻って説明する。入力装置7は、ユーザからの指示を受け付けるユニットである。入力装置5は、スクロールキー、縮尺変更キーなどのハードスイッチ、ジョイスティック、ディスプレイ上に貼られたタッチパネルなどで構成される。
【0024】
センサ8、9およびGPS受信装置10は、現在地(自車位置)を検出するために使用されるものである。
【0025】
通信装置15は、他の車両に搭載された音声処理装置100と通信を行うための装置である。通信装置15は、電話回線を利用するものであってもよいし、インターネットを利用するものであってもよい。また、携帯電話と接続して、通信を行うものであってもよい。
【0026】
図3は、演算処理部1の機能ブロック図である。
【0027】
図示するように、演算処理部1は、ユーザ操作解析部41と、現在位置算出部42と、ナビゲーション処理部43と、音声取得部44と、音声分離部45と、音場設定部46と、音声加工部47と、音声出力部48と、通信部49とを備えている。
【0028】
ユーザ操作解析部41は、入力装置7に入力されたユーザからの要求を受け、その要求内容を解析して、その要求内容に対応する処理が実行されるように演算処理部1の各部を制御する。
【0029】
現在位置算出部42は、各センサ8,9及びGPS受信装置10の出力から、現在位置を求める。例えば、地図データを用いて、マップマッチングにより地図上の自車両の位置を求める。
【0030】
ナビゲーション処理部43は、指定された2地点(現在地、目的地)間を結ぶ推奨経路を探索したり、ディスプレイ2に推奨経路を表示し経路誘導を行ったりする。
【0031】
音声取得部44は、マイクロフォンアレイ4を介して、話者が発した音声を取得する処理を行う。
【0032】
音声分離部45は、マイクロフォンアレイ4で取得した、複数の音源から出力された音声(混合音)を、音源位置ごとの音声に分離する。音声分離部45は、マイクロフォンアレイ4を構成する各マイクロフォンの位置を予め記憶しており、各マイクロフォンの位置を基準として、音源位置を特定する。なお、音声分離の手法については、公知の方法を用いることができるので詳述しない。
【0033】
音場設定部46は、スピーカアレイ5が出力する音声により聴取者に対して実現される、音場の構成(仮想音源の位置、発する音声、音量など)を決定する処理を行う。
【0034】
音声加工部47は、音場設定部46で決定された音場がスピーカアレイ5により実現されるように、スピーカアレイ5を構成する各スピーカに出力する音声を加工する処理を行う。音声加工部47は、スピーカアレイ5を構成する各スピーカの位置を予め記憶しており、各スピーカの位置を基準として音場が形成されるように音声を加工する。なお、音場における仮想音源の形成方法については、公知の方法を用いることができるので詳述しない。
【0035】
音声出力部48は、音声加工部47で加工された、各スピーカで出力されるべき音声を、スピーカアレイ5に送信し、音声出力を実行する。
【0036】
通信部49は、通信装置15を介して、他の音声処理装置100との間の情報の送受信を仲介する処理を行う。
【0037】
なお、演算処理部1は、図1に示すように、数値演算及び各デバイスを制御するといった様々な処理を実行するCPU(Central Processing Unit)11と、記憶装置3から読み出した地図データ、演算データなどを格納するRAM(Random Access Memory)12と、プログラムやデータを格納するROM(Read Only Memory)13と、外部との情報の授受を行うインターフェース14とを備えるコンピュータシステムにより達成される。上述の演算処理部1の各機能部は、CPUがメモリにロードしたプログラムを実行することにより達成される。なお、音声処理に関して、専用のDSP(Digital Signal Processor)が行うようにしてもよい。
【0038】
[動作の説明]次に、上記構成の複数台の音声処理装置100の間で行われる、発話から受話までの動作について説明する。
【0039】
図4は、かかる処理のフロー図である。
【0040】
なお、ここでは、発話者側の音声処理装置100と受話者側の音声処理装置100とに分けて動作を説明する。もちろん、いずれの車両の搭乗者が発話者になるかによって、音声処理装置100は、発話者側になったり、受話者側になったりする。
【0041】
本フローは、複数の音声処理装置100の間で、対話モードとなっている場合に開始される。
【0042】
まず、発話者側の音声処理装置100の音声取得部44は、マイクロフォンアレイ4を介して、発話者の音声を取得する(S11)。次に、発話者側の音声処理装置100の通信部49は、取得された音声を、現在位置算出部42で算出された現在位置とともに、受話側の音声処理装置100に送信する(S12)。
【0043】
これを受けて、受話側の音声処理装置100の通信部49は、発話者側の音声処理装置100から送信された、発話者の音声と、発話者側の車両の現在位置を取得する(S13)。
【0044】
次に、受話側の音声処理装置100の音場設定部46は、音場の構成を設定する(S14)。図5は、音場の構成を説明するための図である。音場設定部46は、自車両(受話者側の車両)の現在位置と相手車両(発話者側の車両)の現在位置との関係500に基づいて、音場510の構成を設定する。具体的には、自車両501の位置を音場510の中心511として、発話者側の車両502(または503)の現在位置に相当する位置に、発話者の音声の仮想音源512(または513)を配置し、音場510を構成する。また、発話者の音声の音量については、車両間の距離L1(またはL2)が離れる程、小さくなるように設定する。
【0045】
すなわち、図5の例のように、自車両501に対して、右斜め前に発話者側の車両502があるとすると、車両502の搭乗者の音声の仮想音源512は、音場の中心(自身の位置)511に対して、右斜め前に設定される。一方、左斜め後ろに発話者側の車両503があるとすると、車両503の搭乗者の音声の仮想音源513は、音場の中心(自身の位置)511に対して、左斜め後ろに設定される。さらに、発話者の音声の音量は、自車両から遠い車両からの音声ほど小さくなるように設定されるので、図5の例では、右斜め前の車両502からの音声は、左斜め後ろの車両からの音声に比べて小さく設定される。
【0046】
なお、発話者の実際の声の大きさが一定とは限らない。発話者の実際の声の大きさにばらつきがあると、車両間の距離に応じて音量を調整する意味が薄れる。そこで、音場設定部46は、発話者側から受信した音声について、一旦音量を所定の音量に正規化した後、車両間の距離に応じて調整するようにしてもよい。
【0047】
次に、音声加工部47は、音場設定部46で設定された音場が再現されるように、スピーカアレイ5を構成する各スピーカに出力されるべき音声を、元の音声を加工することにより生成する(S15)。
【0048】
そして、音声出力部48は、音声加工部47で加工された、スピーカアレイ5を構成する各スピーカに出力されるべき音声を、スピーカアレイ5に出力し、音声出力を実現する(S16)。これにより、受話者は、発話者の発話内容を聴取することができる。
【0049】
以上、図4のフローを用いて、発話から受話までの動作について説明した。なお、かかるフローは、いずれかの搭乗者が発話する度に繰り返される。
【0050】
上記した本実施形態によれば、受話者に対して、スピーカアレイ5により形成される音場により、発話者側の車両位置に発話者の音源位置を定位させることができる。したがって、受話者に、あたかもその方向から発話者が発話しているかのような感覚を与えることができ、臨場感のある対話が実現する。
【0051】
上記実施形態は、さまざまな変形が可能である。
【0052】
例えば、ドライバ同士のみの対話、後部座席の搭乗者同士のみの対話など、特定の座席位置の搭乗者のみの対話に制限することもできる。
【0053】
図6は、かかる場合の対話動作の処理のフロー図である。図6のフローは、図4で示した処理と基本的に同じである。ただし、マイクロフォンアレイ4で取得される「発話者の音声」に、複数の搭乗者の音声が混合していることを想定して、音声分離により特定の座席の搭乗者の音声のみを抽出するための処理S11’が挿入されている。S11’では、概略すると、発話者側の音声処理装置100の音声分離部45は、S11において取得された音声に対して、音声分離を行って、特定の座席位置の音声のみを抽出する。
【0054】
図7は、かかる処理を説明するための概念図である。
【0055】
まず、音声分離部45は、音声分離の手法(すなわち、混合音から音源位置ごとの音声に分離する手法)を用いて、S11で取得された発話者の音声(混合音)700を、音源位置701ごとの音声702に分離する。
【0056】
一方、音声分離部45は、座席位置711と車両内の空間領域712との対応表710を保持している。図2を用いて説明すると、車両300の内部空間は、座席位置(ドライバ位置(右前)、助手席位置(左前)、後部右側位置、後部左側位置)に対応して、座席空間A1、A2,A3、A4が定められている。すなわち、車内の三次元座標における位置は、いずれかの座席空間A1〜A4に属する。
【0057】
そこで、音声分離部45は、かかる座席位置711と空間領域712との対応表710を用いて、音源位置701に対応付けられた音声702を、座席位置711に対応付ける。そして、座席位置711に対応つけた音声702を取得する。
【0058】
さらに音声分離部45は、予め定められた座席位置(例えば、ドライバ位置)の音声702のみを抽出する。なお、いずれの座席位置の音声を抽出するかは、ユーザにより選択可能にすることができる。
【0059】
そして、通信部49は、S12において、音声分離部45により抽出された音声を、車両の現在位置とともに、受信側の音声処理装置100に送信する。その後の処理は、上記した通りである。
【0060】
このようにすれば、特定の座席位置の搭乗者の音声のみを、対話に用いることができる。例えば、複数の車両で同一目的地を目指す場合など、ドライバ間の対話が優先的となる場合において、他の搭乗者が発声している場合でも、ドライバの発話内容に関しては、確実に他の車両のドライバに伝えるということができる。
【0061】
なお、音声分離の処理S11’は、受話側の音声処理装置100で行ってもよい。例えば、図4のフローと同様に、発話者側の通信部49は、発話者の音声(混合音)を、受話者側の音声処理装置100に送信する。受話者側の音声処理装置100は、これを受信後、上記のS11’と同様に、音声分離と、座席位置との対応付け、及び特定の座席位置の音声の抽出を行う。そして、抽出した音声のみが、音声出力されるようにする。
【0062】
また、S12において、通信部49は、発話者の音声を送信する際に、その音声に対応付けられた座席位置も送信するようにしてもよい。そして、受話者側の音声処理装置100では、受信した発話者の座席位置を示す情報を、表示装置に表示して、誰が発話者なのか分かるようにしてもよい。また、受話側の音声処理装置100の音声出力部48は、受信した発話者の座席位置に対応する座席位置のスピーカアレイ5にのみから音声出力するようにしてもよい。こうすれば、設定された座席位置の搭乗者のみで対話をすることができ、対話内容が他の座席位置の搭乗者に聴かれることがない。
【0063】
また、発話者の座席位置ごとに、受話側で出力する際の音量を異ならせることもできる。例えば、発話者側の音声出力装置100の通信部49は、複数の座席位置に対応付けられた複数の音声を、座席位置の情報とともに、受話側の音声出力装置100に送信する。受話側の音声出力装置100の音声出力部48は、出力しようとする音声について、対応付けられた座席位置に応じて、音量を異ならせる。例えば、優先順位を設け、ドライバ位置>助手席位置>後部右側位置>後部左側位置の順に、音量を大きくする。こうすれば、重要性が高い内容を話しそうな搭乗者の会話を優先的に受話側の搭乗者に聴取させることができる。
【0064】
<第2の実施形態>
第2の実施形態におけるハードウェア構成及び機能部の構成は、上記第1の実施形態と似た構成を備えている。したがって、重複する部分については説明を省略する。
【0065】
本実施形態では、発話者の座席位置、及び受話者の座席位置に応じて、各受話者に対して提供する音場における音声の仮想音源位置を設定する。例えば、他の車両の助手席に搭乗している発話者の音声が、受話側のドライバにとっては、自車両の助手席側から発せられたように感じさせることが可能となる。
【0066】
図8は、本実施形態にかかる発話から受話までの処理を示すフロー図である。
【0067】
本フローは、複数の音声処理装置100の間で、対話モードとなっている場合に開始される。
【0068】
まず、発話者側の音声処理装置100の音声取得部44は、マイクロフォンアレイ4を介して、発話者の音声を取得する(S21)。次に、音声分離部45は、S21において取得された音声に対して、音声分離を行って(S22)、さらに、図7で示した方法と同様にして、座席位置ごとの音声を抽出する(S23)。次に、発話者側の音声処理装置100の通信部49は、取得された音声を、現在位置算出部42で算出された現在位置とともに、受話側の音声処理装置100に送信する(S24)。
【0069】
これを受けて、受話側の音声処理装置100の通信部49は、発話者側の音声処理装置100から送信された、座席位置に対応付けられた発話者の音声と、発話者側の座席位置とを取得する(S25)。
【0070】
次に、受話側の音声処理装置100の音場設定部46は、着席センサ6を介して、自車両内の各座席について着席状態か否かを検出する(S26)。
【0071】
さらに、音場設定部46は、音場の構成を設定する(S27)。図9は、音場の構成を説明するための図である。音場設定部46は、各座席のスピーカアレイ5ごとに、異なる音場を設定することになる。また、発話者の発話者側の車両内での座席位置と、受話者の受話者側の車両内の座席位置との位置関係に基づいて、音場の構成を設定する。具体的には、音場設定部46は、S25で受信した座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する受話側の車両の座席位置に形成されるように、音場の構成を設定する。
【0072】
例えば、図9(A)に示すように、発話者側の車両において助手席の搭乗者が発話者である音声があるとする。受話者側の車両のドライバ席の音場を設定す場合、音場設定部46は、まず、ドライバ位置を中心とした音場を設定する。そして、図9(B)に示すように、発話者(発話者側の車両の助手席の搭乗者)の音声の仮想音源800を、ドライバ位置からみた助手席位置の方向に設定する。
【0073】
ところで、発話者の座席位置に対応する受話者側の座席位置に、既に搭乗者がいる場合がある。かかる場合に、その座席位置に仮想音源を設定すると、発話者の音声と実際の搭乗者の音声が混じり、受話者に違和感を与える。そこで、音場設定部46は、
(1)S25で取得した座席位置に対応付けられた音声のうち、自車両の未着席状態の座席位置に対応する音声については、その座席位置を音源位置と設定する。
(2)一方、S25で取得した座席位置に対応付けられた音声のうち、自車両の着席状態の座席位置に対応する音声については、他の未着席の座席位置(または、予め定めた位置(例えば、車両中央の天井位置)を音源位置と設定する。
【0074】
こうして音場が設定されると、音声加工部47は、音場設定部46で設定された音場が再現されるように、各座席のスピーカアレイ5ごとに、スピーカアレイ5を構成する各スピーカに出力されるべき音声を、元の音声を加工することにより生成する(S28)。
【0075】
そして、音声出力部48は、音声加工部47で加工された音声を、各スピーカアレイ5に出力し、音声出力を実現する(S29)。これにより、受話者は、発話者の発話内容を聴取することができる。
【0076】
以上、図8のフローを用いて、発話から受話までの動作について説明した。なお、かかるフローは、いずれかの搭乗者が発話する度に繰り返される。
【0077】
上記した第2の実施形態によれば、発話者の音源位置を、発話者と受話者との座席の位置関係に基づいて定める。したがって、受話者に対して、あたかも自車両の対応する座席に発話者が存在するかのような感覚を与えることができ、より臨場感のある対話を実現することができる。
【0078】
本実施形態は、さまざまな変形が可能である。
【0079】
例えば、上記第1の実施形態の変形例で説明したのと同様に、ドライバ同士のみの対話、後部座席の搭乗者同士のみの対話など、特定の座席位置の搭乗者のみの対話に制限することもできる。
【0080】
図10は、かかる場合の対話動作の処理のフロー図である。また、図11は、かかる場合の音場の構成を説明するための図である。図10のフローは、図8で示した処理と基本的に同じである。ただし、マイクロフォンアレイ4で取得される「発話者の音声」に、複数の搭乗者の音声が混合していることを想定して、音声分離により特定の座席の搭乗者の音声のみを抽出するための処理S23’が挿入されている。すなわち、発話者側の音声処理装置100の音声分離部45は、S23において取得された座席位置に対応付けられた音声から、特定の座席位置(例えば、ドライバ位置)の音声のみを抽出する。図11の例では、発話者であるドライバの音声のみが、受話者側のスピーカアレイ5に出力されるように設定された様子を示している。さらに、受話側のドライバ位置には、既にドライバが着席しているので、音場設定部46により、発話者の音声の仮想音源801の位置は、予め定められた位置(天井中央)に設定されている。なお、いずれの座席位置の音声を抽出して出力するかは、ユーザにより選択可能にすることができる。
【0081】
このようにすれば、特定の座席位置の搭乗者の音声のみを、対話に用いることができる。例えば、複数の車両で同一目的地を目指す場合など、ドライバ間の対話が優先的となる場合において、他の搭乗者が発声している場合でも、ドライバの発話内容に関しては、確実に他の車両のドライバに伝えることができる。
【0082】
なお、音声分離に係る処理S22、S23(対話者を制限する場合、さらにS23’)は、受話側の音声処理装置100で行ってもよい。例えば、発話者側の通信部49は、発話者の音声(混合音)を、受話者側の音声処理装置100に送信する。受話者側の音声処理装置100は、これを受信後、S22、S23(対話者を制限する場合、さらにS23’)と同様に、音声分離と、座席位置との対応付け、(対話者を制限する場合、さらに特定の座席位置の音声の抽出)を行う。そして、音場設定部46は、抽出された音声のみを、音場に割り当てる。これにより、音声出力部48は、特定の座席位置の発話者の音声のみを出力することになる。
【0083】
また、図8及び図10のフローでは、着席状態か否かを判定したが、これに限定されない。ユーザの選択に応じて、着席状態の判定を行わないでもよい。そして、着席状態か否かに関らず、一律に、該当する座席位置に仮想音源の位置を割り当てるようにしてもよい。
【0084】
また、音場の設定S27において、音場設定部46は、受話者の自身の位置(音場の中心)を中心として、円卓会議を行うように、周囲に、発話者の音声の音源位置を割り当ててもよい。発話者の音声の音源位置をどのように配置するかについては、ユーザから選択を受け付けるようにすることができる。
【0085】
また、3台上の複数台で対話を行う場合、同じ座席位置の搭乗者が同時に発話する場合がある。かかる場合、音場設定部46は、車両ごとに予め優先順位を設けておき、優先順位に応じて発話者の音量を大きく設定してもよい。または、同時に発話した発話者の中の、優先順位が最も高い発話者の音声のみを出力するようにしてもよい。
【0086】
また、上記第1の実施形態と第2の実施形態は、適宜組み合わせることも可能である。すなわち、受話者側の音声処理装置100の音場設定部46は、発話者の音源位置を、車両同士の位置関係により概略設定し、さらに、車両内の座席位置に応じて、細かく設定することもできる。または、出力しようとする音声に対応付けられた座席位置が、所定の座席位置(例えば、ドライバ位置)である場合、車両間の距離が遠くても、他の座席の発話者の音声に比べて音量を大きく出力するように設定することもできる。
【図面の簡単な説明】
【0087】
【図1】図1は、音声処理装置の概略構成図である。
【図2】図2は、マイクロフォンアレイ、スピーカアレイ、着席センサの配置を説明するための図である。
【図3】図3は、演算処理部1の機能構成を示す図である。
【図4】図4は、対話動作の処理のフロー図である。
【図5】図5は、音場の構成を設定する方法を説明するための図である。
【図6】図6は、対話動作の処理のフロー図である。
【図7】図7は、座席位置ごとの音声を求める処理を説明するための図である。
【図8】図8は、対話動作の処理のフロー図である。
【図9】図9は、音場の構成を設定する方法を説明するための図である。
【図10】図10は、対話動作の処理のフロー図である。
【図11】図11は、音場の構成を設定する方法を説明するための図である。
【符号の説明】
【0088】
100…音声処理装置、
1…演算処理部、2…ディスプレイ、3…記憶装置、4…マイクロフォンアレイ、5…スピーカアレイ、6…着席センサ、7…入力装置、8…車輪速センサ、9…ジャイロ、10…GPS受信装置、15…通信装置、
41…ユーザ操作解析部、42…現在位置算出部、43…ナビゲーション処理部、44…音声取得部、45…音声分離部、46…音場設定部、47…音声加工部、48…音声出力部、49…通信部
【特許請求の範囲】
【請求項1】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、
前記第2の車両の位置を取得する車両位置取得手段と、
前記第2の車両内で取得された音声を取得する音声取得手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記第2の車両内で取得された音声の仮想音源が、前記第2の車両の位置の方向に形成されるように、前記第2の車両内で取得された音声を加工し、前記スピーカアレイにより出力する音声出力手段と、
を備えることを特徴とする車載用音声処理装置。
【請求項2】
請求項1に記載の車載用音声処理装置であって、
前記音声出力手段は、
前記第1の車両と前記第2の車両との間の距離が離れている程、前記第2の車両内で取得された音声の音量を小さくして出力する
ことを特徴とする車載用音声処理装置。
【請求項3】
請求項1に記載の車載用音声処理装置であって、
前記音声出力手段は、
前記第2の車両内で取得された音声を、予め定めた一定の音量に調整したのち、前記第1の車両と前記第2の車両との距離に応じて、音量を調整する
ことを特徴とする車載用音声処理装置。
【請求項4】
請求項1に記載の車載用音声処理装置であって、
前記第2の車両内で取得された音声を、音源ごとに分離する音声分離手段と、
前記音声分離手段により分離された音声の中から、予め定められた車両内の座席位置に対応する音源位置の音声を抽出する音声抽出手段とを備え、
前記音声出力手段は、
前記音声抽出手段で抽出した音声を前記スピーカアレイに出力する
ことを特徴とする車載用音声処理装置。
【請求項5】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、
前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する前記第1の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と
を備えることを特徴とする車載用音声処理装置。
【請求項6】
請求項5に記載の車載用音声処理装置であって、
前記音声取得手段は、
前記第2の車両内で取得された音声を、音源の位置ごとの音声に分離したのち、座席位置に対応付けることにより、前記座席位置に対応付けられた音声を取得する
ことを特徴とする車載用音声処理装置。
【請求項7】
請求項5に記載の車載用音声処理装置であって、
前記第1の車両内の座席について着席状態か否かを判定する着席判定手段を備え、
前記音声出力手段は、
前記着席判定手段により着席状態と判定された座席に対応する前記第2の座席位置に対応付けられた音声については、その仮想音源が、前記第1の車両内の着席状態でない座席位置又は予め定めた位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する
ことを特徴とする車載用音声処理装置。
【請求項8】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、
前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、前記音場の中心位置を囲うような位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と
を備えることを特徴とする車載用音声処理装置。
【請求項9】
第1の車両の車載装置と通信可能な、第2の車両に搭載される車載用音声処理装置であって、
複数のマイクロフォンにより前記第2の車両内の音声を取得する手段と、
前記第2の車両内で取得された音声を、音源ごとに分離する音声分離手段と、
前記音声分離手段により分離された音声を、座席位置に対応付ける手段と、
前記座席位置に対応付けた音声を、前記第1の車両の車載装置に送信する手段と
を備えることを特徴とする車載用音声処理装置。
【請求項10】
第1の車両と第2の車両との間で音声の送受信が可能な音声処理システムであって
前記第1の車両内で取得された音声を、音源ごとに分離する音声分離手段と、
前記音声分離手段により得られた音源の位置ごとの音声から、座席位置に対応付けた音声を求める手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けた音声の仮想音源が、その座席位置に対応する前記第2の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と
を備えることを特徴とする音声処理システム。
【請求項11】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置の音声処理方法であって、
前記第2の車両の位置を取得する車両位置取得ステップと、
前記第2の車両内で取得された音声を取得する音声取得ステップと、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記第2の車両内で取得された音声の仮想音源が、前記第2の車両の位置の方向に形成されるように、前記第2の車両内で取得された音声を加工し、前記スピーカアレイにより出力する音声出力ステップと、
を有することを特徴とする音声処理方法。
【請求項12】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置の音声処理方法であって、
前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得ステップと、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する前記第2の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力ステップと
を備えることを特徴とする音声処理方法。
【請求項1】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、
前記第2の車両の位置を取得する車両位置取得手段と、
前記第2の車両内で取得された音声を取得する音声取得手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記第2の車両内で取得された音声の仮想音源が、前記第2の車両の位置の方向に形成されるように、前記第2の車両内で取得された音声を加工し、前記スピーカアレイにより出力する音声出力手段と、
を備えることを特徴とする車載用音声処理装置。
【請求項2】
請求項1に記載の車載用音声処理装置であって、
前記音声出力手段は、
前記第1の車両と前記第2の車両との間の距離が離れている程、前記第2の車両内で取得された音声の音量を小さくして出力する
ことを特徴とする車載用音声処理装置。
【請求項3】
請求項1に記載の車載用音声処理装置であって、
前記音声出力手段は、
前記第2の車両内で取得された音声を、予め定めた一定の音量に調整したのち、前記第1の車両と前記第2の車両との距離に応じて、音量を調整する
ことを特徴とする車載用音声処理装置。
【請求項4】
請求項1に記載の車載用音声処理装置であって、
前記第2の車両内で取得された音声を、音源ごとに分離する音声分離手段と、
前記音声分離手段により分離された音声の中から、予め定められた車両内の座席位置に対応する音源位置の音声を抽出する音声抽出手段とを備え、
前記音声出力手段は、
前記音声抽出手段で抽出した音声を前記スピーカアレイに出力する
ことを特徴とする車載用音声処理装置。
【請求項5】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、
前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する前記第1の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と
を備えることを特徴とする車載用音声処理装置。
【請求項6】
請求項5に記載の車載用音声処理装置であって、
前記音声取得手段は、
前記第2の車両内で取得された音声を、音源の位置ごとの音声に分離したのち、座席位置に対応付けることにより、前記座席位置に対応付けられた音声を取得する
ことを特徴とする車載用音声処理装置。
【請求項7】
請求項5に記載の車載用音声処理装置であって、
前記第1の車両内の座席について着席状態か否かを判定する着席判定手段を備え、
前記音声出力手段は、
前記着席判定手段により着席状態と判定された座席に対応する前記第2の座席位置に対応付けられた音声については、その仮想音源が、前記第1の車両内の着席状態でない座席位置又は予め定めた位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する
ことを特徴とする車載用音声処理装置。
【請求項8】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置であって、
前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、前記音場の中心位置を囲うような位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と
を備えることを特徴とする車載用音声処理装置。
【請求項9】
第1の車両の車載装置と通信可能な、第2の車両に搭載される車載用音声処理装置であって、
複数のマイクロフォンにより前記第2の車両内の音声を取得する手段と、
前記第2の車両内で取得された音声を、音源ごとに分離する音声分離手段と、
前記音声分離手段により分離された音声を、座席位置に対応付ける手段と、
前記座席位置に対応付けた音声を、前記第1の車両の車載装置に送信する手段と
を備えることを特徴とする車載用音声処理装置。
【請求項10】
第1の車両と第2の車両との間で音声の送受信が可能な音声処理システムであって
前記第1の車両内で取得された音声を、音源ごとに分離する音声分離手段と、
前記音声分離手段により得られた音源の位置ごとの音声から、座席位置に対応付けた音声を求める手段と、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けた音声の仮想音源が、その座席位置に対応する前記第2の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力手段と
を備えることを特徴とする音声処理システム。
【請求項11】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置の音声処理方法であって、
前記第2の車両の位置を取得する車両位置取得ステップと、
前記第2の車両内で取得された音声を取得する音声取得ステップと、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記第2の車両内で取得された音声の仮想音源が、前記第2の車両の位置の方向に形成されるように、前記第2の車両内で取得された音声を加工し、前記スピーカアレイにより出力する音声出力ステップと、
を有することを特徴とする音声処理方法。
【請求項12】
第1の車両に搭載され、第2の車両の車載装置と通信可能な車載用音声処理装置の音声処理方法であって、
前記第2の車両内で取得され、音源位置ごとに分離され、かつ座席位置に対応付けられた音声を取得する音声取得ステップと、
複数のスピーカからなるスピーカアレイにより形成される音場において、前記座席位置に対応付けられた音声の仮想音源が、その座席位置に対応する前記第2の車両の座席位置に形成されるように、前記座席位置ごとの音声を加工し、前記スピーカアレイにより出力する音声出力ステップと
を備えることを特徴とする音声処理方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2009−23486(P2009−23486A)
【公開日】平成21年2月5日(2009.2.5)
【国際特許分類】
【出願番号】特願2007−188207(P2007−188207)
【出願日】平成19年7月19日(2007.7.19)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
【公開日】平成21年2月5日(2009.2.5)
【国際特許分類】
【出願日】平成19年7月19日(2007.7.19)
【出願人】(591132335)株式会社ザナヴィ・インフォマティクス (745)
【Fターム(参考)】
[ Back to top ]