説明

伝送装置及び携帯電話システム

【課題】 理解しやすい文章が得られ、短時間で文章を読解することができるとともに、通話においても違和感を生じることのない伝送装置および携帯電話システムを提供する。
【解決手段】 音声認識部11で認識した音声情報から文章理解要約部12により会話内容を理解するとともに会話内容の文章を要約し、理解した内容に応じた応答文を応答文生成部16で生成し、生成した応答文を音声変換部17により音声に変換する。そして、音声/文字信号切換部14で携帯端末3への下り音声信号と文字信号との切り換えを行い、上り信号分離部15では携帯端末3からの音声/文字の受信形態を選択する音声/文字受信選択信号と応答文選択信号と上り音声信号とを分離し、音声信号切換部18で上記変換した応答文の音声信号と携帯端末3からの上り音声信号とを切り換える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、通信装置に音声信号及び文字信号を伝送する伝送装置およびこの伝送装置を有する携帯電話システムに関するものである。
【背景技術】
【0002】
従来、電話機などの通信装置との間で音声や文字信号の伝送を行う伝送装置として、図3に示すような受信側端末の負担を軽減したものが提案されている(例えば特許文献1参照)。
【0003】
このシステムは、送信装置101から伝送装置102を経由して受信装置103に音声/文字情報を伝送するもので、伝送装置102に音声と文字の情報を交換する情報交換部102aを備えている。送信装置101および受信装置103は、それぞれ音声情報と文字情報のうちいずれか一方の送信および受信を行う。伝送装置102は、送信装置101からの情報を受信し、その情報の形態を受信装置が受信可能な情報に変換して受信装置103に送信する。
【0004】
【特許文献1】特開平10−42056号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、上記のような従来の伝送装置においては、音声情報を文字情報に変換する場合、送信者の話し言葉がそのまま文字に変換されるため、文字変換された文章の理解が難しいとともに、文字変換された文章が冗長になり、受信者が文章を読解するのに時間を要することがある。
【0006】
また、文字情報を音声情報に変換する場合、送信者の文字による文章作成は音声よりも時間を要するため、送信者と受信者との間における即応性が低下し、通話において違和感が生じることがある。
【0007】
本発明は、従来の問題を解決するためになされたもので、利用者が、音声による文章を文字情報として容易に理解することができる伝送装置および携帯電話システムを提供することを目的とする。また、受信内容に対してすばやく応答できる伝送装置および携帯電話システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の伝送装置は、通信装置に音声信号及び文字信号を伝送する伝送装置であって、音声を認識する音声認識部と、認識した音声から文章を理解するとともに文章を要約する文章理解要約部と、要約した文章の文字信号を生成する文字信号生成部と、を備える。上記構成によれば、認識した音声から文章を理解するとともに文章を要約する文章理解要約部を備えることにより、利用者は、会話内容等の音声による文章を文字情報として容易に理解することができる。
【0009】
また、本発明の伝送装置は、認識した音声から理解した文章の内容に応じた応答文を生成する応答文生成部と、生成した応答文を音声信号に変換する音声変換部と、を備える。上記構成によれば、認識した音声から理解した文章の内容に応じた応答文を生成する応答文生成部を備えることにより、受信内容に対して、音声に対する応答文を文字入力する場合に比べて、すばやく応答できる。
【0010】
また、本発明の伝送装置は、前記音声変換部で変換した応答文の音声信号と前記通信装置からの音声信号とを切替える音声信号切替部を備える。上記構成によれば、音声変換部で変換した応答文の音声信号と前記通信装置からの音声信号とを切替える音声信号切替部を備えることにより、複数系統の音声信号が送信されることがない為、違和感のない応答音声を伝送できる。
【0011】
また、本発明の伝送装置は、前記音声変換部が、音声認識により、入力された音声信号の音声サンプルの抽出及び音声特徴データの生成を行う音声認識部と、音声サンプルを蓄積する音声サンプル蓄積部と、前記音声認識部からの音声特徴データを蓄積する音声特徴データ蓄積部と、前記応答文生成部からの応答文データに応じて、前記音声サンプルと前記音声特徴データとに基づいて合成音声を生成する合成音声生成部と、を有する。
【0012】
さらに、本発明の携帯電話システムは、本発明の伝送装置を備える。
【発明の効果】
【0013】
本発明によれば、認識した音声から文章を理解するとともに文章を要約する文章理解要約部を備えることにより、利用者は、会話内容等の音声による文章を文字情報として容易に理解することができる。また、本発明によれば、認識した音声から理解した文章の内容に応じた応答文を生成する応答文生成部を備えることにより、受信内容に対して、音声に対する応答文を文字入力する場合に比べて、すばやく応答できる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の実施形態の伝送装置および携帯電話システムについて、図面を用いて説明する。
【0015】
図1は本発明の実施形態の音声文字変換機能付伝送装置を有する携帯電話システムの構成を示すブロック図である。この携帯電話システムは、センター局1と、基地局2と、携帯端末3とで構成されている。
【0016】
センター局1は、基地局2を介して携帯端末3に音声信号及び文字信号を伝送する音声文字変換機能付伝送装置10と交換装置20で構成されており、音声文字変換機能付伝送装置10は、音声認識部11、文章理解要約部12、文字信号生成部13、音声/文字信号切換部14、上り信号分離部15、応答文生成部16、音声変換部17、および音声信号切換部18を備えている。
【0017】
音声認識部11は、交換装置20からの下り音声信号21aから音声を認識し、文章理解要約部12は、その認識した音声情報から会話内容の文章を理解するとともに、会話内容の文章を要約する。文字信号生成部13は、文章理解要約部12で要約した文章の文字信号を生成し、応答文生成部16は、文章理解要約部12で理解した内容に応じた応答文を自動的に生成する。また音声変換部17は、応答文生成部16で生成した応答文を音声信号に変換する。
【0018】
音声/文字信号切換部14は、携帯端末3への下り音声信号21aと下り文字信号22aとの切り換えを行う。この切り換えられた信号は、下り音声信号21b、下り文字信号22bとして携帯端末3へ伝送される。上り信号分離部15は、携帯端末3からの音声/文字の受信形態を選択する音声/文字受信選択信号31bと応答文選択信号32bと上り音声信号33bとを分離する。この分離された信号は、音声/文字受信選択信号31a、応答文選択信号32a、上り音声信号33aとして音声/文字信号切換部14、応答文生成部16、音声変換部17、音声信号切換部18へ入力される。
【0019】
音声信号切換部18は、音声変換部17で変換した応答文の音声信号と携帯端末3からの上り音声信号33aとを切り換える。この切り換えられた信号は、上り応答音声信号34として交換装置20に入力される。
【0020】
次に、上記のように構成された携帯電話システムの動作について説明する。
【0021】
図不示の携帯端末または固定電話機から携帯端末3へ音声通話が発呼され、センター局1および基地局2を経由して通話のための呼出信号が携帯端末3に着信した状態において、携帯端末3の使用者は音声受信または文字受信、もしくは音声受信および文字受信の両方を選択する音声/文字受信選択信号31bを返信する。この携帯端末3からの上り信号は、基地局2を経由してセンター局1へ伝送され、音声文字変換機能付伝送装置10の上り信号分離部15で音声/文字受信選択信号31aとして分離され、音声/文字信号切換部14に入力される。
【0022】
また、交換装置2からの下り音声信号21aは2分岐されて、その一方は音声認識部11へ入力される。音声認識部11は、入力された下り音声信号21aの音声解析を行い、会話文章データを作成する。この音声認識部11で得られた会話文章データに基づき、文章理解要約部12は会話内容を理解した文章理解データを生成するとともに、会話内容を要約した要約文章データを生成する。
【0023】
応答文生成部16では、上記文章理解要約部12で生成した文章理解データに基づき、一つまたは複数の応答文候補を生成する。文字信号生成部13では、文章理解要約部12で生成した要約文章データと、応答文生成部16で生成した応答文候補とに対応した下り文字信号22aを生成する。
【0024】
音声/文字信号切換部14では、上り信号分離部15からの音声/文字受信選択信号31aに応じて、音声受信が選択されている場合には下り音声信号21aのみを、文字受信が選択されている場合には下り文字信号22aのみを、音声受信および文字受信の両方が選択されている場合には下り音声信号21aおよび下り文字信号22aを基地局2へ伝送する。
【0025】
一方、携帯端末3で選択する応答文に対応した応答文選択信号32bは、上り信号分離部15で分離されて、応答文選択信号32aとして応答文生成部16に入力される。そして、選択された応答文に対応する音声信号が音声変換部17で生成される。この音声変換部17で生成される音声信号は、携帯端末3の使用者の音声、あるいはあらかじめ登録されている任意の音声が用いられる。
【0026】
また、音声信号切換部18では、携帯端末3からの上り音声信号33bが基地局2を通じて伝送された後、上り信号分離部15で分離された上り音声信号33aがある場合にはその上り音声信号33aを優先し、上り音声信号33aがなく応答文選択信号32aにより応答文が選択されている場合には音声変換部17で生成した音声を上り応答信号34として交換装置20へ伝送する。
【0027】
このような本実施形態の伝送装置および携帯電話システムによれば、会話内容の文章を理解して要約する文章理解要約部12と、文章理解要約部12で理解した内容に応じた応答文を生成する応答文生成部16と、生成した応答文を音声に変換する音声変換部17を設けることにより、携帯端末3上で理解しやすい文章が得られ、短時間で文章を読解することができるとともに、通話においても違和感を生じることはない。
【0028】
図2は本システムの音声変換部17の構成を示すブロック図である。
【0029】
音声変換部17は、音声認識部171と、音声サンプル蓄積部172と、音声特徴データ部173と、合成音声生成部174と、応答文理解部175とで構成されている。
【0030】
音声認識部171は、上り音声信号33aに対し音声認識を行って上り音声信号33aの音声サンプルを抽出するとともに、音声特徴データを生成する。音声サンプル蓄積部172は、音声認識部171で抽出した音声サンプルあるいは任意の音声サンプル201を蓄積し、音声特徴データ部173は、音声認識部171からの音声特徴データを蓄積する。合成音声生成部174は、入力された応答文データ202を応答文理解部175で理解したデータに応じて上記音声サンプルと音声特徴データから応答する合成音声を生成する。
【0031】
次に、上記のように構成された音声変換部17の動作について説明する。
【0032】
通常の音声通話状態において、上り音声信号33aは音声認識部171に入力される。音声認識部171では、携帯端末3の使用者の音声の解析を行い、携帯端末3の使用者の音声サンプルの抽出と音声の特徴データの生成を行う。この音声認識部171で生成された携帯端末3の使用者の音声サンプル、あるいは任意の音声を生成するようにあらかじめ生成しておいた音声サンプル201は音声サンプル蓄積部172に蓄積され、また音声認識部171で生成された音声特徴データは音声特徴データ部173に蓄えられる。
【0033】
応答文理解部175では、図1の音声文字変換機能付伝送装置10の応答文生成部16で生成された応答文データ202の解析を行い、会話口調の音声信号を生成するのに必要な会話口調データを生成する。合成音声生成部174では、音声サンプル蓄積部172および音声特徴データ部173のデータを基に、応答文データ202と応答文理解部175で生成された会話口調データに対応した応答合成音声信号203を生成する。
【0034】
このように、本実施形態の音声変換部17では、応答合成音声信号203を生成するのに必要な音声データを音声サンプルデータと音声特徴データとに分離しているので、単語や文節ごとに対応した大量の合成音声データを用意しなくとも、任意の応答文に対応した会話口調の合成音声を生成することができ、また合成音声生成に音節データのみを用いる場合より、自然な会話口調の合成音声を生成することができる。したがって、文字情報を音声情報に変換する場合の送信者と受信者との間における即応性が向上する。
【0035】
なお、以上の説明における携帯端末3は、携帯電話のみならず、他の機能を持つ通信装置であっても同様に実施可能である。
【産業上の利用可能性】
【0036】
本発明は、認識した音声から文章を理解するとともに文章を要約する文章理解要約部を備えることにより、利用者は、会話内容等の音声による文章を文字情報として容易に理解することができる効果を有し、通信装置に音声信号及び文字信号を伝送する伝送装置およびこの伝送装置を有する携帯電話システム等に有用である。
【図面の簡単な説明】
【0037】
【図1】本発明にかかる音声文字変換機能付伝送装置を有する携帯電話システムの構成を示すブロック図
【図2】本発明の実施形態における音声変換部の構成を示すブロック図
【図3】従来の伝送装置の構成を示すブロック図
【符号の説明】
【0038】
1 センター局
2 基地局
3 携帯端末
10 音声文字変換機能付伝送装置
11 音声認識部
12 文章理解要約部
13 文字信号生成部
14 音声/文字信号切換部
15 上り信号分離部
16 応答文生成部
17 音声変換部
18 音声信号切換部
20 交換装置
171 音声認識部
172 音声サンプル蓄積部
173 音声特徴データ部
174 合成音声生成部
175 応答文理解部

【特許請求の範囲】
【請求項1】
通信装置に音声信号及び文字信号を伝送する伝送装置であって、
音声を認識する音声認識部と、
認識した音声から文章を理解するとともに文章を要約する文章理解要約部と、
要約した文章の文字信号を生成する文字信号生成部と、
を備える伝送装置。
【請求項2】
認識した音声から理解した文章の内容に応じた応答文を生成する応答文生成部と、
生成した応答文を音声信号に変換する音声変換部と、
を備える請求項1記載の伝送装置。
【請求項3】
前記音声変換部で変換した応答文の音声信号と前記通信装置からの音声信号とを切替える音声信号切替部を備える請求項2記載の伝送装置。
【請求項4】
前記音声変換部は、
音声認識により、入力された音声信号の音声サンプルの抽出及び音声特徴データの生成を行う音声認識部と、
音声サンプルを蓄積する音声サンプル蓄積部と、
前記音声認識部からの音声特徴データを蓄積する音声特徴データ蓄積部と、
前記応答文生成部からの応答文データに応じて、前記音声サンプルと前記音声特徴データとに基づいて合成音声を生成する合成音声生成部と、
を有する請求項2記載の伝送装置。
【請求項5】
請求項1ないし4のいずれか一項記載の伝送装置を備える携帯電話システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2006−220917(P2006−220917A)
【公開日】平成18年8月24日(2006.8.24)
【国際特許分類】
【出願番号】特願2005−34254(P2005−34254)
【出願日】平成17年2月10日(2005.2.10)
【出願人】(000005821)松下電器産業株式会社 (73,050)
【Fターム(参考)】