説明

音声システム及び受話者端末

【課題】聞き手に複数の音源の位置を互いに独立して認識させることができるようにする。
【解決手段】この音声システムは音声データ生成部(複数の発話者端末100)、位置対応部(発話者端末100)、及び再生部(受話者端末200)を備えている。音声データ生成部は、音源別の音声データを生成する。位置対応部は、音声データ生成部が生成した音声データを、当該音声データの音源の位置を示す位置情報に対応付ける。再生部は、音声データと位置情報とを互いに対応付けて受信し、受信した音声データを、位置情報に対応して個別に出力する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声システム及び受話者端末に関する。
【背景技術】
【0002】
情報通信技術の発展に伴い、電話会議システムの普及が進んでいる。電話会議システムは、互いに異なる場所にいる人同士を、電話を介して会話させることにより、会議を行わせるシステムである。電話会議システムのマイク及びスピーカは、いずれもオープンになっている。
【0003】
一方、近年は圧電素子を用いたスピーカが普及している。このようなスピーカとしては、パラメトリックスピーカがある。特許文献1には、パラメトリックスピーカの搬送波を変えることにより、音波の到達距離を変更できる、と記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−245731号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、電話会議システムなどにおいて、複数の音源から発せられた音が同一のマイクによって音声データに変換され、この音声データが同一のスピーカによって再生される場合、聞き手が複数の音源の位置を独立して認識できない。このような場合、聞き手に臨場感を与えることが難しくなる。
【0006】
本発明の目的は、聞き手が複数の音源の位置を互いに独立して認識することができるようにした音声システム及び受話者端末を提供することにある。
【課題を解決するための手段】
【0007】
本発明によれば、音源別の音声データを生成する音声データ生成手段と、
前記音声データ生成手段が生成した前記音声データを、当該音声データの音源の位置を示す位置情報に対応付ける位置対応手段と、
前記音声データと前記位置情報とを互いに対応付けて受信し、受信した前記音声データを、前記位置情報に対応した指向性をもたせて出力する再生手段と、
を備える音声システムが提供される。
【0008】
本発明によれば、複数の発話者端末と通信を行う受話者端末であって、
前記発話者端末から、音声データを、当該発話者端末を他の前記発話者端末から識別する端末識別情報に対応付けて受信する受信手段と、
前記受信手段が受信した前記端末識別情報に基づいて、当該端末識別情報に対応する前記音声データを再生したときの音声の指向性を定める指向性設定手段と、
前記受信手段が受信した前記音声データを、前記指向性設定手段が設定した指向性を満たす条件で再生する再生手段と、
を有する受話者端末が提供される。
【発明の効果】
【0009】
本発明によれば、聞き手に複数の音源の位置を互いに独立して認識させることができる。
【図面の簡単な説明】
【0010】
【図1】第1の実施形態に係る音声システムの構成を示す図である。
【図2】発話者端末の機能構成を示すブロック図である。
【図3】受話者端末の機能構成を示すブロック図である。
【図4】再生部が有している発振装置の一例を示す平面図である。
【図5】第2の実施形態に係る音声システムに用いられる発話者端末の機能構成を示すブロック図である。
【図6】第3の実施形態に係る補聴器の機能構成を示すブロック図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0012】
(第1の実施形態)
図1は、第1の実施形態に係る音声システムの構成を示す図である。この音声システムは音声データ生成部(複数の発話者端末100)、位置対応部(発話者端末100)、及び再生部(受話者端末200)を備えている。音声データ生成部は、音源別の音声データを生成する。位置対応部は、音声データ生成部が生成した音声データを、当該音声データの音源の位置を示す位置情報に対応付ける。再生部は、音声データと位置情報とを互いに対応付けて受信し、受信した音声データを、位置情報に対応した指向性をもたせて出力する。以下、詳細に説明する。
【0013】
本実施形態の音声システムは、電話会議システム、又はテレビ会議システムの音声システムであり、発話者端末100及び受話者端末200を備えている。発話者端末100は、話し手が使う端末であり、受話者端末200は聞き手が使う端末である。発話者端末100は、話し手の発話を音声データに変換し、受話者端末200に送信する。受話者端末200は、発話者端末100から受信した音声データを再生する。すなわち本実施形態において、音声データ生成部及び位置対応部は、複数の発話者端末100により構成されており、再生部は受話者端末200により構成されている。そして受話者端末200は、発話者端末100それぞれから受信した音声データを、その音声データを生成した発話者端末100に対応した指向性をもたせて出力する。このため、聞き手は、発話者端末100それぞれ別に話し手を個別に認識することができる。
【0014】
図2は、発話者端末100の機能構成を示すブロック図である。発話者端末100は、音声データ生成部110、位置対応部120、端末識別情報記憶部125、及び送信部130を備えている。音声データ生成部110は、マイクを有しており、音声を音声データに変換する。端末識別情報記憶部125は、その発話者端末100を他の発話者端末100から識別する端末識別情報を記憶している。位置対応部120は、音声データ生成部110が生成した音声データに端末識別情報記憶部125が記憶している端末識別情報を付加する。送信部130は、音声データと端末識別情報とを互いに対応付けて受話者端末200に送信する。
【0015】
図3は、受話者端末200の機能構成を示すブロック図である。受話者端末200は、受信部210、指向性設定部220、指向性記憶部225、及び再生部230を備えている。受信部210は、発話者端末100から送信されてきた音声データ及び端末識別情報を受信する。
【0016】
指向性記憶部225は、端末識別情報と、その端末識別情報に対応する音声データにどのような指向性を持たせるかを示す指向性情報を、互いに対応付けて記憶している。指向性設定部220は、受信部210が受信した端末識別情報に対応する指向性情報を、指向性記憶部225から読み出す。そして読み出した指向性情報を、受信部210が受信した音声データに対応付けて再生部230に出力する。再生部230は、音声データを、その音声データに対応付けられた指向性情報を満たすような指向性を持たせて再生する。
【0017】
具体的には、再生部230は、パラメトリックスピーカとしての機能を有している。そして、再生部230は、指向性設定部220から受信した音声データをパラメトリックスピーカとしての変調信号に変調した上で、再生部230が有している発振装置238(図4参照)に入力する。
【0018】
図4は、再生部230が有している発振装置238の一例を示す平面図である。再生部230は、複数の発振装置238をアレイ状に有している。各発振装置238は、振動部材234及び圧電素子236を有している。振動部材234は、例えばステンレスなどからなるシート状の部材であり、その外周部が、枠体232に格子状に設けられた開口の内周面に固定されている。圧電素子236は、振動部材234の一面上に固定されている。そして圧電素子236にパラメトリックスピーカとしての変調信号が入力されることにより、発振装置238は、パラメトリックスピーカの搬送波となる超音波、例えば20kHz以上の音波を出力する。なお本実施形態では、一つの枠体232に複数の発振装置238がアレイ状に取り付けられている。
【0019】
本実施形態において、再生部230は、複数の発振装置238を複数の組に分ける。そして、各組を、互いに異なる発話者端末100(音源)に対応させる。このようにして、再生部230は、異なる発話者端末100が生成した音声データを再生するときに、それぞれ互いに独立した指向性を持たせることができる。
【0020】
なお、双方向の通話機能を持たせるためには、発話者端末100は受話者端末200の機能を備えており、受話者端末200は発話者端末100の機能を備えていればよい。
【0021】
次に、本実施形態に作用及び効果について説明する。本実施形態によれば、発話者端末100は、生成した音声データを、その発話者端末100の端末識別情報に対応付けて受話者端末200に送信する。そして受話者端末200は、発話者端末100別に指向性を持たせて音声データを再生する。すなわち受話者端末200は、聞き手の前後左右に独立した音源を生成する。従って、受話者端末200の聞き手は、発話者端末100の話し手それぞれの位置を互いに独立して認識することができる。
【0022】
また本実施形態では、再生部230は、一つの枠体232に取り付けられた複数の発振装置238を複数の組に分け、各組を互いに異なる発話者端末100に対応付けている。従って、複数の音響デバイスを用いなくても、受話者端末200の聞き手に、発話者端末100の話し手それぞれの位置を互いに独立して認識させることができる。
【0023】
(第2の実施形態)
図5は、第2の実施形態に係る音声システムに用いられる発話者端末100の機能構成を示すブロック図である。本実施形態に係る音声システムは、発話者端末100の機能構成、及び受話者端末200の指向性記憶部225が記憶している情報を除いて、第1の実施形態に係る音声システムと同様の構成である。
【0024】
まず、発話者端末100は、音声データ生成部110が少なくとも2つのマイクを有している。そして発話者端末100は、位置対応部120の代わりに音源分離部122を有している。音源分離部122は、音声データ生成部110が有する複数のマイクそれぞれが生成した音声データを用いて音源分離処理を行うことにより、音声データ生成部110が生成した音声データを音源別の音声データに分離し、かつその音声データを、その音源の少なくとも方向を示す位置情報に対応付ける。送信部130は、音源別の音声データを、その音声データの音源の位置情報及び端末識別情報に対応付けて、受話者端末200に送信する。
【0025】
そして受話者端末200の指向性記憶部225は、音源の位置情報を指向性に変換する情報を記憶している。そして再生部230は、指向性設定部220が設定した指向性を満たすように発振装置238を制御し、音声を再生する。例えば再生部230は、その発話者端末100に割り当てられた複数の発振装置238を、その発話者端末100が送信してきた音源別にさらに振り分けることにより、発話者端末100から送信されてきた音声データを、音源別に指向性を持たせて再生する。
【0026】
本実施形態によっても、第1の実施形態と同様の効果を得ることができる。また、発話者端末100が複数の話し手の音声に基づいた音声データを生成して受話者端末200に送信する場合でも、受話者端末200は、複数の話し手それぞれ別に指向性を持たせて音声を再生することができる。
【0027】
(第3の実施形態)
図6は、第3の実施形態に係る補聴器300の機能構成を示すブロック図である。補聴器300は、音声データ生成部310、音源分離部320、指向性設定部330、指向性記憶部335、及び再生部340を備えている。音声データ生成部310は第2の実施形態における音声データ生成部110と同様の機能を有している。音源分離部320は、第2の実施形態における音源分離部122と同様の機能を有している。指向性設定部330は、第2の実施形態における指向性設定部220と同様の機能を有している。指向性記憶部335は、第2の実施形態における指向性記憶部225と同様のデータを記憶している。再生部340は、第2の実施形態における再生部230と同様の機能を有している。
【0028】
本実施形態によれば、補聴器300が増幅する音声に指向性を持たせることができる。
【0029】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。例えば本実施形態では、再生部230及び再生部340は、パラメトリックスピーカを用いることにより音源別に指向性を持たせていたが、再生部230及び再生部340が複数のスピーカを有している場合、これらスピーカそれぞれに、互いに異なる音源の音声データを再生させるようにしても良い。
【符号の説明】
【0030】
100 発話者端末
110 音声データ生成部
120 位置対応部
122 音源分離部
125 端末識別情報記憶部
130 送信部
200 受話者端末
210 受信部
220 指向性設定部
225 指向性記憶部
230 再生部
232 枠体
234 振動部材
236 圧電素子
238 発振装置
300 補聴器
310 音声データ生成部
320 音源分離部
330 指向性設定部
335 指向性記憶部
340 再生部

【特許請求の範囲】
【請求項1】
音源別の音声データを生成する音声データ生成手段と、
前記音声データ生成手段が生成した前記音声データを、当該音声データの音源の位置を示す位置情報に対応付ける位置対応手段と、
前記音声データと前記位置情報とを互いに対応付けて受信し、受信した前記音声データを、前記位置情報に対応した指向性をもたせて出力する再生手段と、
を備える音声システム。
【請求項2】
請求項1に記載の音声システムにおいて、
前記音声データ生成手段及び前記位置対応手段は、複数の発話者端末により構成されており、
前記再生手段は、受話者端末に設けられており、
前記複数の発話者端末は、前記音声データを、当該発話者端末を他の前記発話者端末から識別する端末識別情報に対応付けて前記受話者端末に送信する音声システム。
【請求項3】
請求項2に記載の音声システムにおいて、
前記受話者端末は、
前記端末識別情報と、前記指向性を示す情報とを互いに対応付けて記憶する指向性記憶手段を備え、
前記再生手段は、前記端末識別情報に対応する前記指向性を示す情報を、前記指向性記憶手段から読み出す音声システム。
【請求項4】
請求項1に記載の音声システムにおいて、
発話者端末と、
受話者端末と、
を備え、
前記発話者端末は、
前記位置対応手段として音源分離手段を備えており、前記音源分離手段によって音源別に分離された前記音声データを前記位置情報に対応付けて前記受話者端末に送信し、
前記受話者端末は、前記再生手段を備える音声システム。
【請求項5】
請求項1に記載の音声システムにおいて、
前記音声システムは補聴器である音声システム。
【請求項6】
請求項1〜5のいずれか一項に記載の音声システムにおいて、
前記再生手段は、パラメトリックスピーカである音声システム。
【請求項7】
請求項6に記載の音声システムにおいて、
前記再生手段は、アレイ状に配置された複数の圧電素子を有しており、
前記複数の圧電素子を複数の組に分け、各組を、互いに異なる前記音源に対応させる音声システム。
【請求項8】
複数の発話者端末と通信を行う受話者端末であって、
前記発話者端末から、音声データを、当該発話者端末を他の前記発話者端末から識別する端末識別情報に対応付けて受信する受信手段と、
前記受信手段が受信した前記端末識別情報に基づいて、当該端末識別情報に対応する前記音声データを再生したときの音声の指向性を定める指向性設定手段と、
前記受信手段が受信した前記音声データを、前記指向性設定手段が設定した指向性を満たす条件で再生する再生手段と、
を有する受話者端末。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2012−142650(P2012−142650A)
【公開日】平成24年7月26日(2012.7.26)
【国際特許分類】
【出願番号】特願2010−291872(P2010−291872)
【出願日】平成22年12月28日(2010.12.28)
【出願人】(310006855)NECカシオモバイルコミュニケーションズ株式会社 (1,081)
【Fターム(参考)】