音声合成用音声データベース構築のための通信システム、中継装置および中継方法
【課題】個人の音声の特徴を再現する本人性を重視した音声合成用音声データベースを容易に構築のための通信システム、中継装置および中継方法を提供すること。
【解決手段】中継装置20は、通話中の通信端末間で送受信される音声データを複製する。複製された音声データは、メディア処理装置40に送信され蓄積される。メディア処理装置40は、蓄積された音声データを基に音声合成用データベースを構築する。
【解決手段】中継装置20は、通話中の通信端末間で送受信される音声データを複製する。複製された音声データは、メディア処理装置40に送信され蓄積される。メディア処理装置40は、蓄積された音声データを基に音声合成用データベースを構築する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声合成用音声データベース構築のための通信システム、中継装置および中継方法に関し、より詳細には、本人性の再現を重視する音声合成システムにおいて、音声合成のための音声データベースを電話やTV電話の通話内容に基づき構築する通信システム、中継装置および中継方法に関する。
【背景技術】
【0002】
音声合成技術には、合成された音声が滑らかに再現されていることを重視する完全性と、あたかも本人が発声しているような音声を再現する本人性が重視されながら研究開発が行われている。
【0003】
これら音声合成技術では、予め様々な原稿を人に読ませることにより被験者の様々な音声データをデータベースに録音しておき、入力されたテキストに最もマッチした音声データを組み合わせることにより、合成された音声を生成することにより実現されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−295880号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の音声合成技術では、音声合成用の音声データが蓄積されたデータベースを構築するためには、専用のスタジオを用意して、長時間(数時間から十数時間)の録音時間を要する。そのため、従来の音声合成技術は、カーナビゲーションシステムやIVR(Interactive Voice Response)など、限定的な音声パターンだけを必要とするシステムには適用可能であったが、移動通信システムなどにおいて個人の音声を再現することは困難であった。
【0006】
本発明は、以上の問題点を解決するためになされたものであり、個人の音声の特徴を再現する本人性を重視した音声合成用音声データベースを容易に構築のための通信システム、中継装置および中継方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するため、本発明は、通信網に接続する中継装置と、前記中継装置を介して前記通信網に接続し、前記中継装置を介して他の通信端末と音声データの送受信を行う複数の通信端末と、前記中継装置に接続するメディア処理装置とを備えた通信システムであって、前記中継装置は、第1の通信端末から送信された第1の音声データを受信し、受信した前記第1の音声データを第2の通信端末へ送信する送受信部と、音声データを複製するデータ複製部と、前記第1の通信端末からデータ送受信部を介して受信した前記第1の音声データを前記データ複製部によって複製し、当該複製された音声データを前記送受信部によって前記メディア処理装置へ送信するように制御する通信制御部とを備え、前記メディア処理装置は、前記第1の通信端末の複製された音声データを、前記中継装置から受信する受信部と、前記受信部により受信した音声データを音声データ蓄積部に蓄積する音声データ処理部と、前記音声データ蓄積部に蓄積された前記音声データに基づいて、前記第1の通信端末用の音声合成用データベースを作成する音声合成用データベース作成部と、前記音声合成用データベース作成部によって作成された音声合成用データベースが記憶される音声合成用データベース記憶部と、前記第1の通信端末から音声合成の依頼を受信した場合、前記音声合成用データベースに基づいて音声合成を行う音声合成部とを備えることを特徴とする通信システムを提供する。本発明の通信システムによれば、本人性の再現を重視した音声合成用データベースを容易に作成することができる。
【0008】
上記通信システムの別の好適な態様において、前記通信制御部は、前記複製の指示を前記第1の通信端末から受信した場合に、前記送受信部を介して前記第1の通信端末から受信した音声データを前記データ複製部に複製させる。この態様によれば、第1の通信端末は、音声データを送信するたびに録音する音声データを指定することができる。また、この場合、第1の通信端末は、音声通信が終了した後に音声データを録音するか否かを指定しても良い。この形態によれば、メディア処理装置において録音する音声データを、通信端末で自由に指定することができる。
【0009】
上記通信システムの別の好適な態様において、前記音声データ処理部は、前記受信部により受信した前記音声データが前記蓄積された音声データのいずれかと一致するか否かを判定する判定部と、受信した前記音声データの雑音量と、当該音声データと一致する蓄積済み音声データの雑音量とを測定する雑音測定部とを更に備え、前記音声データ処理部は、受信した前記音声データの雑音量が、前記蓄積済みの音声データの雑音量より少ない場合には、前記蓄積済みの音声データを受信した前記音声データで上書きするようにしてもよいし、前記音声データ処理部は、前記音声データ内の背景雑音を除去する雑音フィルターを更に備え、前記音声データ処理部は、前記雑音フィルターによって前記背景雑音を除去した前記音声データを蓄積するようにしてもよい。このような形態においては、音声合成用データベースはより質の高い音声データを提供することができる。
【0010】
また、本発明は、通信網に接続する中継装置と当該中継装置を介して前記通信網に接続する複数の通信端末とを備える通信システムにおいて、ある通信端末から他の通信端末へデータ中継を行う中継装置であって、第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する送受信部と、音声データを複製するデータ複製部と、前記第1の通信端末から前記送受信部を介して受信した前記音声データを前記データ複製部によって複製するよう制御するとともに、当該複製された音声データを蓄積して音声合成用データベースを作成するメディア処理装置に対して、前記複製した音声データを前記送受信部によって送信するように制御する通信制御部とを備える中継装置を提供する。本発明の中継装置によれば、個人の音声を再現する本人性を重視した音声合成用データベースを容易に作成することができる。
【0011】
加えて、本発明は、通信網に接続する中継装置と、前記中継装置を介して前記通信網に接続する複数の通信端末とを備え、ある通信端末より他の通信端末へデータの中継を前記中継装置が行う通信システムにおける中継方法であって、第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する受信ステップと、前記受信ステップで受信した前記音声データを複製する複製ステップと、前記複製した音声データを、当該音声データを蓄積して音声合成用データベースを作成するメディア処理装置へ送信する送信ステップとを備える中継方法を提供する。本発明の中継方法によれば、個人の音声を再現する本人性を重視した音声合成用データベースを容易に作成することができる。
【発明の効果】
【0012】
本発明によれば、個人の音声の特徴を再現する本人性を重視した音声合成用音声データベースを容易に構築可能な通信システム、中継装置および中継方法を提供することができる。
【図面の簡単な説明】
【0013】
【図1】本発明にかかる全体構成図である。
【図2】本発明にかかる通信端末の機能構成図である。
【図3】本発明にかかる中継装置の機能構成図である。
【図4】本発明にかかる通信情報蓄積部で管理する情報である。
【図5】本発明にかかる契約情報DBで管理する情報である。
【図6】本発明にかかるメディア処理装置の機能構成図である。
【図7】本発明にかかる通信システムで交換される情報の流れを示すシーケンス図である。
【図8】中継装置が実行する通信制御処理の流れを示すフローチャートである。
【図9】中継装置が実行するレジストレーション処理の流れを示すフローチャートである。
【図10】中継装置が実行する発信側処理の流れを示すフローチャートである。
【図11】中継装置が実行する着信側処理の流れを示すフローチャートである。
【図12】中継装置が実行するユーザデータ転送複製処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0014】
以下、図面とともに本発明の好適な一実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
【0015】
図1に、本実施形態に係る音声合成用音声データベース構築のための通信システム(以下通信システム)の一例を示す。通信システムは、ネットワークNからサービスを受ける複数の通信端末10(通信端末10aと通信端末10bの総称)、ネットワークNに各通信端末を接続する中継装置20(中継装置20aと中継装置20bの総称)、通信端末10の契約情報を管理する契約情報DB(データベース)30、通信端末に関わるメディア情報を蓄積・加工するメディア処理装置40を備え、およびこれらの各装置はネットワークNを介してそれぞれ接続されている。2つの通信端末10および中継装置20が図示されているが、これに限定されず、それぞれ3以上の通信端末10および中継装置20を備えることとしてもよい。
【0016】
音声データとは、具体的には例えば音声通話、TV電話、留守番電話などが該当する。また、メディア情報とは、例えば留守電により蓄積された音声・映像メッセージ、音楽ファイル、動画像などである。
【0017】
通信端末10は、中継装置20を介してネットワークNに接続されている。ネットワークNは、通信端末10に対して通信サービスを提供する。ネットワークNは、具体的には例えば、携帯電話網である。通信端末10は、無線または有線により中継装置20に接続されている。
【0018】
通信端末10は、中継装置20を介して、同じく中継装置20を介してネットワークNに接続する他の通信端末10と通信することができる。図には示さないが、通信端末10は、CPU(Central Processing Unit)、主記憶装置であるRAM(Random Access Memory)およびROM(Read Only Memory)、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置、更に通信端末10のユーザが操作する操作部等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述する通信端末10の機能が発揮される。
【0019】
図2は、通信端末10の機能構成図である。図2に示すように、通信端末10は、音声入出力部101、符号/復号化部102、パケット処理部103、通信制御部104、およびデータ送受信部105を備える。
【0020】
音声入出力部101は、マイク101aおよびスピーカー101bなどで構成され、ユーザから入力された音声をマイク101aで取得し、音声データとして符号/復号化部102へ出力する。また、音声入出力部101は、符号/復号化部102で復号された音声データを受け取り、スピーカー101bより出力する。
【0021】
符号/復号化部102は、マイク101aより入力された音声データを、データ送受信部105から送信可能とするために符号化する。また、符号/復号化部102は、入力した音声データを音声入出力部101のスピーカー101bから出力可能とするために復号化する。符号/復号化部102は、移動通信においては例えば、AMR−narrow band、AMR−wide bandなどの各種コーデックがこれに該当する。
【0022】
パケット処理部103は、符号/復号化部102により符号化された音声データを複数のパケットに分割して、これをデータ送受信部105に出力する。また、パケット処理部103は、データ送受信部105より受信したパケットを組みたてて、符号/復号化部102において復号化したあとに音声データを再現できるようにする。パケット処理部103で行われる処理は、具体的に例えば、VoIPなどのIPシステムでの音声通話における、RTP(Real time Transfer Protocol)などのプロトコルに基づいて行われる。
【0023】
通信制御部104は、通信端末10がネットワークNから通信サービスを受けることができるように、レジストレーションメッセージを作成し、これをデータ送受信部105に出力する。また、通信制御部104は、データ送受信部105を介して通信相手からの応答メッセージを受信すると、これにより、通信が可能になったことを判断する。通信制御部104による制御処理は、具体的には、例えば、SIP(Session Initiation Protocol)などのプロトコルに基づいて行われる。ユーザにより操作部が操作されて通信を終了させる指示が入力されると、通信端末10は、通信制御部104による制御処理に基づいて、通信相手の端末へ終了メッセージを送信し、通信相手より応答メッセージが返送されると通信を終了する。
【0024】
データ送受信部105は、他の端末とのデータやメッセージの送受信を行う。データ送受信部105は、パケット処理部103からの音声データ、および通信制御部104からの制御メッセージをネットワークNへ転送する。また、データ送受信部105は、ネットワークNから受信した音声データをパケット処理部103へ、ネットワークNから受信した制御メッセージを通信制御部104へ出力する。
【0025】
通信端末10は、移動通信端末がその代表例であるが、これに限るものではなく、例えば音声通話可能なパソコンや、SIP電話などにも適用可能である。本実施形態においては、通信端末10は移動通信端末であるとして説明する。
【0026】
中継装置20は、ネットワークNに接続されており、他の中継装置20を介して通信端末10間を接続することにより、通信機能を提供する。図には示さないが、中継装置20は、CPU、主記憶装置であるRAMおよびROM、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述する中継装置20の機能が発揮される。
【0027】
図3は、通信装置20の機能構成図である。図3に示すように、中継装置20は、データ送受信部201、データ複製部202、通信制御部203、および通信情報蓄積部204、およびプロファイル情報管理DB(データベース)205を備える。本実施形態においては、通信端末10は移動通信端末であるので、中継装置20は、通信端末10が無線で接続する基地局、あるいは他のネットワーク要素と通信するルーターおよび交換局である。以下では、説明の便宜のため、中継装置20は中継装置20aであるとする。
【0028】
データ送受信部201は、通信端末10、他の中継装置20(本実施形態では中継装置20b)、契約情報DB30、又はメディア処理装置40から制御メッセージを受信すると、これを通信制御部203へ出力する。また、データ送受信部201は、通信制御部203から入力された制御メッセージを通信端末10、中継装置20b、契約情報DB30、又はメディア処理装置40へ送信する。
【0029】
ここで、中継装置20aで送受信される制御メッセージの例としては、通信端末10がネットワークNよりサービスを受けるためのレジストレーションメッセージ、契約情報DB30より通信端末10の契約情報をダウンロードするプロファイルダウンロードメッセージ、通信開始を通知する発信メッセージ、発信メッセージに応答する応答メッセージがある。また、制御メッセージの他の例としては、通信相手の接続先(すなわち中継装置20)を問い合わせる着信者接続先問い合わせメッセージ、着信者接続先問い合わせメッセージに対する応答として、通信相手の接続先を応答する着信者接続先応答メッセージ、通信端末10が通信相手の通信端末との通信を終了する終了メッセージ、およびメディア処理装置40との通信を終了する終了メッセージ、これら終了メッセージへの返答としての通信端末10やメディア処理装置40からの応答メッセージ等が該当する。
【0030】
また、通信制御部203により指定されたパケットを受信すると、これをデータ複製部202へ転送する。さらに、データ複製部202により複製されたパケットをメディア処理装置40へ送信する。
【0031】
データ複製部202は、データ送受信部201から入力されたパケットを複製する。データ複製部202は、複製されたパケットが有する送信元のアドレスはそのままにして、宛先アドレスをメディア処理装置40のIPアドレスに変更して、このパケットをデータ送受信部201へ出力する。
【0032】
図4に、通信情報蓄積部204に蓄積される情報の一例を示す。図に示されるように、通信情報蓄積部204は、複数のレコードを有している。各レコードは、現在お互いに通信している発着信両通信端末10の通信端末識別情報およびIPアドレスを含むとともに、通信中の各通信端末10が音声合成サービスに加入しているか否かを示す情報(サービス加入情報)も含んでいる。この音声合成サービスは、例えば、携帯通信ネットワークの事業者によって提供され、加入者が指示したテキストに対応する音声合成メッセージを生成して、所望の送り先に送るサービスである。
【0033】
各レコードは、中継装置20に接続している通信端末10のプロファイル情報に基づいて、音声通信セッションの各々に対して生成される。プロファイル情報は、契約情報DB30よりダウンロードしたものである。なお、契約情報DB30の詳細は後段で説明する。各レコードは、通信セッションが終了した後(すなわち、通信を終了するための終了メッセージへ応答する応答メッセージを受信した後)に削除される。
本実施形態では、通信端末識別情報には通信端末ごとに一意に識別可能な電話番号を利用する。
【0034】
プロファイル情報管理DB205は、契約情報DB30よりダウンロードしたプロファイル情報を記憶する。契約情報DB30よりダウンロードしたプロファイル情報は、少なくとも、レジストレーションメッセージの送信元通信端末10の電話番号(すなわち、通信端末識別情報)と、当該通信端末10が音声合成サービスに加入しているか否かを示すサービス加入情報とを含む。プロファイル情報は、各通信端末10のIPアドレスと関連付けて記憶され、同一の通信端末識別情報を持つプロファイル情報がダウンロードされるたびに、最新のIPアドレスで書き換えられる。
【0035】
通信制御部203は、データ送受信部201より制御メッセージを受信すると、この制御メッセージに対応した処理を行う。制御メッセージの例は上述したとおりである。
通信制御部203は、データ送受信部201を介して通信端末10よりレジストレーションメッセージを受信すると、データ送受信部201を介してこのメッセージを契約情報DB30に送信する。このメッセージに対する応答として、該当する通信端末20のプロファイル情報が、プロファイルダウンロードメッセージによって通知される。受信したプロファイル情報は、プロファイル情報管理DB205に蓄積される。
【0036】
また、通信制御部203は、データ送受信部201を介して通信端末10から発信メッセージを受信すると、通信相手である他の通信端末10の接続先であり、この発信メッセージの転送先として最適な中継装置20を特定するために、着信者接続先問い合わせメッセージを作成する。通信制御部203は、作成した着信者接続先問い合わせメッセージをデータ送受信部201へ出力して契約情報DB30へ送信する。通信制御部203は、データ送受信部201より着信者接続先応答メッセージを受信すると、通信相手の通信端末10が接続する中継装置20を確認し、その中継装置20に向けてデータ送受信部201を介して発信メッセージを送信する。通信制御部203は、通信相手の通信端末10から応答メッセージを受信すると、通信情報蓄積部204に新たなレコードを作成する。
【0037】
また、通信制御部203は、データ送受信部201を介して通信相手の中継装置20から発信メッセージを受信すると、データ送受信部201を介して、該当する通信端末10に受信した発信メッセージを送信する。通信制御部203は、データ送受信部201を介して通信端末10から上記発信メッセージに対する応答メッセージを受信すると、プロファイル情報管理DB205から応答メッセージの送信者に対応するプロファイル情報を読み出す。そして、この応答メッセージに、読み出したプロファイル情報と応答メッセージの送信元通信端末10のIPアドレスとを付加した後、データ送受信部201を介してこの応答メッセージを通信相手の中継装置20へ送信する。
【0038】
また、通信制御部203は、データ送受信部201を介して通信端末10より終了メッセージを受信すると、データ送受信部201を介して通信相手の中継装置20とメディア処理装置40に向けて終了メッセージを送信する。また、通信制御部203は、通信相手の中継装置20とメディア処理装置40からの応答メッセージの受信が確認された後に、通信端末10に応答メッセージを送信する。
【0039】
ここで、例えば、プロファイルダウンロードメッセージによって通知されたプロファイル情報に、ある通信端末10が音声合成サービスに加入していることが示されているとする。この場合、この通信端末10からの音声通話又はTV電話による発信、又は当該通信端末への着信があったときに、その通信内容である音声データなどのデータが、データ送受信部201からデータ複製部202へパケットとして出力され、データ複製部202で複製される。複製されたパケットは、データ送受信部201を介してメディア処理装置40へ送信される。
【0040】
このように、通信端末10aが音声合成サービスに加入している場合、通信制御部203は、通信端末10より受信した音声データをデータ複製部202に複製させ、複製した音声データをメディア処理装置40へデータ送受信部201に送信させる。メディア処理装置40に送信された音声データは蓄積されて音声合成データベースの基礎として使われるので、音声合成用のデータベースを、音声合成サービスに加入しているユーザ本人の音声データに基づいて作ることができる。したがって、このようにして作成されたデータベースに基づいて生成された音声合成メッセージは、ユーザ本人の音声の特性を反映した(すなわち、ユーザ本人の声と類似性が非常に高い)音声メッセージになる。
【0041】
さらに、通信端末10aと通信している通信端末10bが音声合成サービスに加入している場合、通信端末10aと接続している中継装置20aの通信制御部203は、通信端末10bから受信した音声データを、中継装置20aのデータ複製部202に複製させる。通信端末10aと通信相手の通信端末10bの両方が音声合成サービスに加入している場合には、中継装置20aの通信制御部203は、通信端末10aから受信した音声データと、通信端末10bから受信した音声データの両方を、中継装置20aのデータ複製部202に複製させる。このようにして、本実施形態の通信システムによると、通信相手の通信端末のユーザの音声合成データベースも作成することができる。
【0042】
発信メッセージへの応答として送信された上記応答メッセージは、着信に対する応答であるばかりでなく、着信側の通信端末10のIPアドレスも通知している。これにより発信側の通信端末10の接続する中継装置20は、発着信両側の通信端末10の通信端末識別情報とIPアドレスを知ることができ、これらの情報を通信情報蓄積部204内に蓄積することができる。上述のように、発着信両側の通信端末10の通信端末識別情報とIPアドレスは、通信情報蓄積部204に保持される。
【0043】
通信制御部203は、相手方の通信端末10から応答メッセージを受信すると、メディア処理装置40との間に通信経路を設定するために発信メッセージを作成し、メディア処理装置40へ送信する。このメッセージ送信に対する応答として、メディア処理装置40から応答メッセージを受信した後、データ複製部202でパケットの複製を開始する。
【0044】
契約情報DB30は、ネットワークNに接続されており、ネットワークNの事業者と契約している全通信端末10の契約情報、接続先情報(位置情報)などを管理しているDBサーバ装置である。移動通信システムにおいては、契約情報DB30は、例えばHLR(Home Location Register)である。図には示さないが、契約情報DB30は、CPU、主記憶装置であるRAMおよびROM、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述する契約情報DB30の機能が発揮される。
【0045】
図5に契約情報DB30に登録されている情報の一例を示す。図に示されるように、契約情報DB30には、契約情報301として、通信端末10ごとに、ユーザID、電話番号、音声合成サービス加入の有無、およびレジストレーション状態が登録されている。本実施形態においては、契約情報DB30に記憶されている電話番号は、通信端末10の通信端末識別情報として機能する。レジストレーション状態は、通信端末10が登録されている(すなわち、電源が入っている)場合に、通信端末10がどの中継装置20に接続しているかを中継装置20のIPアドレスで示す。中継装置20のIPアドレスは、当該中継装置20からレジストレーションメッセージとともに送信される。この意味で、レジストレーションメッセージは位置登録要求メッセージに相当する。
【0046】
契約情報DB30は、中継装置20からレジストレーションメッセージを受信すると、レジストレーション状態として、レジストレーションメッセージを送信した通信端末10が接続する中継装置20を特定する情報を登録する。さらに、契約情報DB30は、通信端末10のプロファイル情報として、電話番号と、音声合成サービスへ加入しているか否かを「YES」又は「NO」で示すサービス加入情報とを、プロファイルダウンロードメッセージの中に入れて中継装置20へ転送する。さらに、契約情報DB30は、着信側通信端末10の接続先(すなわち、通信端末10が接続している中継装置20)を問い合わせる着信者接続先問い合わせメッセージを受信すると、該当する着信側通信端末10の接続先の情報を着信者接続先応答メッセージにのせて、問い合わせメッセージの送信元である中継装置20に送信する。
【0047】
メディア処理装置40は、ネットワークNに接続されており、通信端末10のマルチメディア情報の蓄積・加工機能を提供する。図には示さないが、メディア処理装置40は、CPU、主記憶装置であるRAMおよびROM、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述するメディア処理装置40の機能が発揮される。
【0048】
図6は、メディア処理装置40の機能構成図である。図に示すように、メディア処理装置40は、データ送受信部401、メディア処理アプリケーション402、音声データ蓄積部403、音声合成用DB作成エンジン404、音声合成DB405、および音声合成部406を備えて構成される。
【0049】
データ送受信部401は、制御メッセージを中継装置20より受信すると、これをメディア処理アプリケーション402へ転送する。データ送受信部401は、メディア処理アプリケーション402から受信した制御メッセージを、中継装置20へ転送する。また、データ送受信部401は、中継装置20より受信したパケットをメディア処理アプリケーション402へ転送する。データ送受信部401は、音声合成を依頼する音声合成依頼メッセージを通信端末10から受信すると、これを音声合成部406へ出力する。この音声合成依頼メッセージには、インスタントメッセージ(Instant messaging)やメールのテキストデータなどが添付されて送信される。
【0050】
メディア処理アプリケーション402は、中継装置20から発信メッセージを受信すると、応答メッセージを送信する。この発信メッセージには、発信側通信端末10の通信端末識別情報とIPアドレスが含まれている。その後、中継装置20よりパケットを受信すると、メディア処理アプリケーション402は、この各パケットを送信元のIPアドレスごとに分類し、分類したパケットを、音声データ蓄積部403の該当するIPアドレスの通信端末の蓄積スペースに蓄積していく。この蓄積処理は、中継装置20よりパケットを受信する度に行われる。メディア処理アプリケーション402は、終了メッセージを中継装置より受信すると、終了メッセージを確認する応答メッセージを送信する。さらに、メディア処理アプリケーション402は、それまで蓄積していたパケットを1つのファイルとして蓄積するように、音声データ蓄積部403に指示する。
【0051】
音声合成用DBエンジン404は、音声データ蓄積部403に音声合成用のデータが登録されたことを契機に、このデータを音声データ蓄積部403から取り出し、音声合成用のDBを作成する。作成されたDBは、音声合成用DB405に蓄積される。
【0052】
音声合成部406は、通信端末10から音声合成依頼メッセージを受信すると、その送信元である通信端末10の音声合成用データを音声合成用DB405より取り出し、音声合成処理をする。音声合成されたメッセージは、着信側通信端末10に向けて転送される。
【0053】
図8は、中継装置20の通信制御部203が実行する通信制御処理の流れを簡略化して示すフローチャートである。図に示されるように、通信制御処理においては、まず、通信制御部203は、通信端末10よりレジストレーションメッセージを受信すると、レジストレーション処理(SA1)を実行する。このレジストレーションメッセージは、例えば移動通信端末10の電源が入れられた場合に送信される。レジストレーション処理が終了すると、通信制御部203は、次の制御メッセージを待つ。
【0054】
受信した制御メッセージが、当該中継装置20に接続する通信端末10からの発信メッセージである場合、通信制御部203は、発信側処理(SA2)を行う。次に、通信制御部203は、通信情報蓄積部204に蓄積されている情報に基づいて、当該中継装置20に接続している発信側通信端末10および他の中継装置20に接続している着信側通信端末10の少なくとも1つが音声合成サービスに加入しているか否かを判定する判定処理(SA4)を行う。判定結果がYESの場合、通信制御部203は、メディア処理装置40との通信接続を確立するメディア処理装置接続処理(SA5)へ進み、続いて、ユーザデータ転送複製処理(SA6)を行う。通信制御部203は、その後、通信セッションを終了する終了処理(SA7)を行う。一方、ステップSA4の判定結果がNOの場合、通信制御部203は、ユーザデータ転送処理(SA8)へと進む。ユーザデータ転送処理はユーザデータが受信される度に実行され、終了メッセージを受信すると、終了処理が行われる(SA7)。
【0055】
一方、制御メッセージを受信し、その制御メッセージが、他の中継装置20からの発信メッセージである場合、通信制御部203は、まず着信側処理(SA3)を行う。この着信側処理により、当該中継装置20に接続する通信端末10と他の中継装置20に接続する他の通信端末10との間に通信接続が確立すると、通信制御部203は、当該中継装置20に接続する通信端末10から受信したユーザデータを他の中継装置20に転送するとともに、他の中継装置20から受信したユーザデータを、当該中継装置20に接続する通信端末10へ転送するユーザデータ転送処理を開始する(SA8)。ユーザデータ転送処理は、ユーザデータを受信する度に行われる。そして、終了メッセージを受信すると、処理は終了処理(SA7)に進む。終了処理においては、通信制御部203は、通信端末10から終了メッセージを受信すると、他の中継装置20との通信を終了するとともに、メディア処理装置と接続している場合には、メディア処理装置40との通信も終了する。
【0056】
図7は、本通信システムで送受信されるデータの流れを示すシーケンス図である。図9〜12は、レジストレーション処理(図8のSA1)、発信側処理(図8のSA2)、着信側処理(図8のSA3)、ユーザデータ転送複製処理(図8のSA6)の詳細な流れをそれぞれ示している。
【0057】
次に、図7および図9〜12を参照して、通信システムにおいて行われる処理の一例を説明する。この処理は、2台の通信端末10aと通信端末10bにより音声通話が行われ、その通話中にパケットをメディア処理装置40に蓄積し、通話完了後に、通信端末10aと10bの各々が音声合成メッセージを送信するまでの処理である。
【0058】
まず、図7のステップS1において、各通信端末10a、10bは、電源が入力された時などに、ネットワークNからサービスを受けられるようにレジストレーションメッセージを各中継装置20a、20bに送信する。各中継装置20a、20bは、このレジストレーションメッセージを契約情報DB30へ送信する。このとき、通信端末10a、10bがどの中継装置に接続しているかがわかるように、中継装置20a、20bは、契約情報DB30に対して自己のIPアドレスをそれぞれ通知する。契約情報DB30はその後、通信端末10a、10bが接続する中継装置20a、20bの各IPアドレスをレジストレーション状態として登録する。
【0059】
次に、ステップS2において、レジストレーションメッセージを受信した契約情報DB30は、各通信端末10a、10bのプロファイル情報を抽出し、ステップS1においてレジストレーションメッセージによって通知された中継装置20a、20bの各IPアドレスに対して、このプロファイル情報をそれぞれ送信する(図7のS2:プロファイルダウンロード)。各中継装置20a、20bは、自装置内のプロファイル情報管理DB205に、受信したプロファイル情報を登録する。
【0060】
図9は、中継装置20の通信制御部203で行われるレジストレーション処理の流れを示すフローチャートである。レジストレーション処理において、通信制御部203は、まず通信端末10からレジストレーションメッセージを受信する(SA11)。通信制御部203は、次に、受信したレジストレーションメッセージを契約情報DB30へ送信する(SA12)。このとき、通信制御部203は、中継装置20のIPアドレスをレジストレーションメッセージに付加して送信する。
【0061】
次に、通信制御部203は、プロファイル情報が契約情報DB30から受信されたか否かを判定する(SA13)。この判定はプロファイル情報が受信されるまで繰り返される(SA13:NO)。この判定結果がYESになると、通信制御部203は、受信したプロファイル情報をプロファイル情報管理DB205へ登録し(SA14)、当該レジストレーション処理を終了する。
図7に示されるように、このレジストレーション処理は、中継装置20aと20bの各装置において行われる。
【0062】
次に、図7のステップS3において、通信端末10aは、通信端末10bに対して発信メッセージを送信する。
【0063】
次に、図7のステップS4において、中継装置20aは、着信者接続先問い合わせメッセージを送信し、通信端末10bがどの中継装置に接続しているかについて契約情報DB30に問い合わせる。
【0064】
次に、図7のステップS5において、通信端末10bのレジストレーションが完了している場合、契約情報DB30は、通信端末10bが中継装置20bに接続していることを確認して、中継装置20bを示す情報を中継装置20aに送信する(図7のS5:着信者接続先応答)。
【0065】
次に、図7のステップS6において、中継装置20aは、契約情報DB30より通知された、通信端末10bの接続先である中継装置20bに対して、発信メッセージを送信する。中継装置20bは、この発信メッセージを受信すると、通信端末10bに対して、同発信メッセージを送信するとともに、受信した発信メッセージの送信元アドレスを記録する。
【0066】
次に、図7のステップS7において、通信端末10bは、応答が可能な場合は、中継装置20bに対して応答メッセージを送信する。中継装置20bは、受信した応答メッセージに通信端末10bのIPアドレスとプロファイル情報とを付加した後、中継装置20aへ送信する。さらに、中継装置20aはこの応答メッセージを通信端末10aへ送信する。本実施形態において、中継装置20bは中継装置20aへメッセージを送信できることとしたが、これは、中継装置20bは、ステップS6において受信した発信メッセージの送信元アドレスを記憶しているためである。
【0067】
図10は、中継装置20(図7の例では中継装置20a)の通信制御部203(これ以降、「通信制御部203a」とする)が実行する発信側処理の流れを示すフローチャートである。この発信側処理においては、通信制御部203aは、まず発信側である通信端末10aから発信メッセージを受信する(SA21)。通信制御部203aは、着信者接続先問い合わせメッセージを契約情報DB30に送信することによって、発信メッセージで特定される通信端末10bがどの中継装置に接続しているかを問い合わせる(SA22)。
【0068】
通信制御部203は、次に、契約情報DB30から着信者の接続先に関する情報を受信したか否かを判定する。この判定は、着信者の接続先に関する情報が受信されるまで繰り返される(SA23:NO)。判定結果がYESの場合、通信制御部203は、着信者の接続先に関する情報に示される中継装置20(図7の例では中継装置20b)に上記発信メッセージを送信する(SA24)。図7のステップS6に示されるように、この発信メッセージは、中継装置20bから通信端末10bへ転送される。
【0069】
図11は、中継装置20(図7の例では、中継装置20b)の通信制御部203(これ以降、「通信制御部203b」とする)により実行される着信側処理の流れを示すフローチャートである。着信側処理においては、通信制御部203bはまず、中継装置20aより発信メッセージを受信する(SA31)。次に、通信制御部203bは、着信側通信端末10bにこの発信メッセージを送信し(SA32)、送信した発信メッセージに対する応答メッセージを待つ(SA33:NO)。
【0070】
通信端末10bから応答メッセージを受信すると(SA33:YES)、通信制御部203bは、プロファイル情報管理DB205から通信端末10bのプロファイル情報を読み出し(SA34)、この応答メッセージに、IPアドレスと読み出したプロファイル情報とを付加して(SA35)中継装置20aへ送信し(SA36)、着信側処理を終了する。
【0071】
一方、図10のステップSA25において、中継装置20aの通信制御部203aは、中継装置20bを介して通信端末10bより応答メッセージが受信されたか否かを判定する(SA25)。この判定は、応答メッセージが受信されるまで繰り返される(SA25:NO)。
【0072】
判定結果がYESになると、通信制御部203aは、通信情報蓄積部204にレコードを新規作成する。具体的には、通信制御部203aは、受信したプロファイル情報に基づいて、通信端末識別情報と、通信端末10bが音声合成サービスに加入しているか否かを示すサービス加入情報とを取得し、新規作成したレコードに、通信端末識別情報と、サービス加入情報と、受信した通信端末10bのIPアドレスとを記憶する。また、通信制御部203aは、プロファイル情報管理DB205から、SA21で受信した発信メッセージに含まれるIPアドレス(通信端末10aのIPアドレス)に対応するプロファイル情報を読み出し、読み出したプロファイル情報から通信端末10aの通信端末識別情報と、通信端末10aが音声合成サービスに加入しているか否かを示すサービス加入情報とを取得して、通信端末10aのIPアドレスとともに同レコードに記憶する(SA26)。
【0073】
この例では、ステップSA26における処理の結果、図4における通信情報蓄積部204の最上段に示すようなレコードが生成されたとする。図示のように、このレコードでは、通信端末10aの通信端末識別子は「090AAAAAAAA」であり、通信端末10bの通信端末識別子は「090BBBBBBBB」である。また、通信端末10aと10bの両方が、音声合成サービスに加入している。
通信制御部203aはその後、発信側処理を終了して、図8のステップSA4の判定処理へ進む。
【0074】
判定処理において、中継装置20aは、通信情報蓄積部204に蓄積した情報に基づいて、発信側と着信側の通信端末の少なくとも1つが音声合成サービスに加入しているか否かを判定する。この例では、通信情報蓄積部204に蓄積した情報に基づいて、肯定的であると判定されるので(図8のSA4:YES)、中継装置20aは、通信経路を確立するための発信メッセージを生成し、メディア処理装置40へ送信する(図7のS8:発信、図8のSA5)。一方、発信側と着信側がいずれも音声合成サービスに加入していないと判定された場合(図8のSA4:NO)には、通信制御部203は、メディア処理装置40へ発信メッセージを送信せず、代わりに、通信制御部203は、ユーザデータ転送処理へ進む(図8のSA8)。
【0075】
次に、図7のステップS9において、メディア処理装置40は、発信メッセージを受信した後、応答メッセージを中継装置20aへ送信し、中継装置20aとの通信経路を設定する。
【0076】
次に、図7のステップS10において、通信端末10aから中継装置20aに対してユーザデータ(音声データ)を含むパケットが送信された場合、中継装置20aは、そのパケットを通信相手の通信端末10bが接続している中継装置20bへと送信する。この例では、通信端末10aは音声合成サービスに加入しているので、中継装置20aは、パケットを複製して、メディア処理装置40へ送信する。逆に、通信端末10bから中継装置20bを介して中継装置20aにパケットが送信された場合、この例では、通信端末10bも音声合成サービスに加入しているので、中継装置20aは、このパケットも複製してメディア処理装置40へ送信する(図7のS10a:複製パケット)。メディア処理装置40は、受信したパケットを送信元アドレス(すなわち、通信端末10aまたは10bのIPアドレス)ごとに分類し、音声データ蓄積部403の、送信元アドレスに該当する通信端末識別情報に該当する蓄積スペースに各パケットのデータを蓄積していく。
【0077】
図12は、通信制御部203aが実行するユーザデータ転送複製処理の流れを示すフローチャートである。この処理では、通信制御部203aは、まずユーザデータを受信する(SA61)。次に、通信制御部203aは受信したデータが、ステップSA21で受信された発信メッセージの送信元である発信側通信端末(すなわち、通信端末10a)から送信されたものであるか否かを判定する(SA62)。判定結果がYESになった場合、通信制御部203aは、着信側通信端末(すなわち、通信端末10b)へユーザデータを送信する(SA63)。続いて、通信制御部203aは、通信情報蓄積部204に蓄積されている情報に基づいて、通信端末10aが音声合成サービスに加入しているか否かを判定する(SA64)。この動作例では、通信端末10aは音声合成サービスに加入しているので、判定結果はYESになる。よって、通信制御部203aは、データ複製部202にユーザデータを複製させ(SA65)、データ送受信部201を介してメディア処理装置40へ送信し(SA66)、ユーザデータ転送複製処理を終了する。ステップSA64の判定結果がNOになると、処理は図8のメインプロセスへ戻る。
【0078】
一方、ステップSA62の判定結果がNOの場合、すなわち、受信したユーザデータが通信端末10bから送信されたものである場合、通信制御部203aは、このユーザデータを、その受信者である通信端末(すなわち通信端末10a)へ送信する(SA67)。続いて、通信制御部203aは、通信情報蓄積部204内の情報に基づいて、通信端末10bが音声合成サービスに加入しているか否かを判定する(SA68)。この動作例では、通信端末10bは音声合成サービスに加入しているので、その判定結果はYESとなる。よって、通信制御部203aは、データ複製部202にユーザデータを複製させ(SA65)、複製したデータをデータ送受信部201を介してメディア処理装置40に送信し(SA66)、ユーザデータ転送複製処理を終了する。ステップSA68の判定結果がNOの場合、処理は図8のメインプロセスに戻る。このユーザデータ転送複製処理は、ユーザデータを受信する度に行われる。
【0079】
次に、図7のステップS11において、ユーザにより通信を終了させる指示が入力されると、通信端末10aは、終了メッセージを送信する。これを受信した中継装置20aは、この終了メッセージを中継装置20bへ転送する。引き続き、中継装置20bは同メッセージを通信端末10bへ転送する。
【0080】
次に、図7のステップS12において、通信端末10bは、終了メッセージを受信して、通話を終了すると応答メッセージを返送する。中継装置20bはこれを受信すると中継装置20aへ転送する。中継装置20bが中継装置20aへメッセージを転送できるのは、ステップS7で説明した理由と同様である。
【0081】
次に、図7のステップS13において、中継装置20aは、通信端末10aからの終了メッセージを受信すると、自装置内でのパケットの複製機能を停止し、メディア処理装置40へ終了メッセージを送信する。
【0082】
次に、図7のステップS14において、メディア処理装置40は、終了メッセージを受信すると応答メッセージを返送し、中継装置20aとの通信を終了する。メディア処理装置40は、1回の音声通話が完了したことを検出し、音声データ蓄積部403に蓄積していた複製パケット内のデータを1つのファイルとして結合する。
【0083】
次に、図7のステップS15において、中継装置20aは、中継装置20bとメディア処理装置40の両方から応答メッセージを受信すると、通信が終了したことを通信端末10aに通知するために、応答メッセージを送信する(ステップS11からS15は図8のSA7に対応)。通信端末10aと10bとの間の通信セッションはこのようにして終了する。
【0084】
次に、図7のステップS16において、メディア処理装置40は、音声データ蓄積部403に登録された音声通信のデータファイルに基づいて、音声合成に利用するデータベースを構築する。
【0085】
S16で作成された音声合成用DBは、メールまたはインスタントメッセージなどのメッセージングアプリケーションにより、通信端末10a又は10bからメッセージデータが送信され、これに音声合成依頼が示されている時に利用される。
【0086】
ステップS17において、通信端末10aは、宛先を通信端末10bとする音声合成依頼付きのメッセージを中継装置20aへ送信する。中継装置20aは、受信したメッセージをメディア処理装置40へ送信する(図7のS17:音声合成依頼メッセージ)。
【0087】
ステップS18において、メディア処理装置40は、構築されている音声合成用DBを利用して、通信端末10aのユーザの本人性を反映した音声合成メッセージを作成し、中継装置20bを介してこれを通信端末10bへ送信する(図7のS18:音声合成メッセージ)。
【0088】
ステップS19において、通信端末10bは、宛先を通信端末10aとする音声合成依頼付きのメッセージを中継装置20bへ送信する。中継装置20bは、受信したメッセージをメディア処理装置40へ送信する(図7のS19:音声合成依頼メッセージ)。
【0089】
ステップS20において、メディア処理装置40は、構築されている音声合成用DBを利用して、通信端末10bのユーザの本人性を反映した音声合成メッセージを作成し、中継装置20aを介してこれを通信端末10aへ送信する(図7のS20:音声合成メッセージ)。
【0090】
変形例:
続いて、本実施形態にかかる通信システムの変形例について説明する。上記実施形態は、以下のような変形が可能である。
上記実施形態においては、通信端末10aが通信端末10bに対して発信した場合、通信端末10aの接続先中継装置20aが、通信端末10aと通信端末10b双方の音声データを複製して、この複製した音声データをメディア処理装置40へ送信していたが、上記実施形態においては、中継装置20bも中継装置20aと同様の構成を有するので、中継装置20bが、通信端末10aと通信端末10b双方の音声データを複製してもよい。もしくは、中継装置20aと中継装置20bのそれぞれが、通信端末10aと通信端末10b双方の音声データを複製するように本システムを構成してもよいし、中継装置20aが通信端末10aの音声データを複製し、中継装置20bが通信端末10bの音声データを複製するように本システムを構成してもよい。
【0091】
さらに、上述の実施形態においては、通信端末10aが中継装置20aに接続し、通信端末10bが中継装置20bに接続している場合の説明をした。しかしながら、通信端末10aと10bが、同じ中継装置20に接続していてもよい。また、通信端末10のうち少なくとも1つが、中継装置20に接続していてもよい。換言すれば、通信端末のうち1つが、中継装置20の機能を持たない従来型の中継装置に接続していてもよい。
【0092】
上記実施形態では、メディア処理装置40に転送された音声通信中のデータを全て蓄積することとしていたが、転送されたデータの中で選択されたもののみを蓄積しても良い。この選択は、既に蓄積されているデータと受信したデータとの比較に基づいて行ってもよい。つまり、この選択では、発音や意味がすでに蓄積されているデータと同一か類似している場合には、データが破棄される。具体的には、メディア処理装置40のメディア処理アプリケーション402は、データ送受信部401(受信部)により受信された音声データが蓄積済みの音声データのいずれかに一致するか否かを判定する判定部を有し、判定部により、両者が一致していることが検知された場合には、蓄積済みの音声データを受信した音声データで上書きするようにしてもよい。
【0093】
好適には、類似度もしくは同一度の高いデータであっても、蓄積されているデータが背景雑音などを含んでおり、新しく受信されたデータの方がよりクリアな音質を有するデータであった場合には、蓄積されたデータを新たに受信したデータで置換し、クリアなデータを優先的に蓄積することが望ましい。この場合、メディア処理アプリケーション402は、受信した音声データの雑音量と、このデータに対応する蓄積された音声データの雑音量をそれぞれ測定する雑音測定部を有するのが望ましく、受信した音声データの雑音量が、蓄積済みの対応する音声データの雑音量より少ない場合には、音声データ蓄積部403は、蓄積済みの音声データを受信した音声データで上書きするのが望ましい。この構成により、データベースのサイズを最適化しながら、より質の高い音声合成用データベースを提供することができる。
【0094】
好適には、音声合成されたメッセージを送信する際によく利用されるデータを優先的に蓄積しておき、頻繁に使用されるデータが後から入力されたデータで置換されないようにすることが望ましい。
【0095】
上記実施形態では、メディア処理装置40に転送された通話中のデータを全て蓄積することとしていたが、蓄積する前に不要な音声を除去しても良い。この場合、メディア処理アプリケーション402は、音声データに含まれる背景雑音を除去する雑音フィルターを有し、音声データ蓄積部403は、この雑音フィルターにより雑音が除去された後に、音声データを蓄積するのが望ましい。この構成により、必要なデータのみを蓄積することができる。
好適には、背景雑音に加えて、無音部のデータを除去して蓄積することが望ましい。
【0096】
上記実施形態では、中継装置において送信元IPアドレスによりデータ複製し、メディア処理装置において送信元IPアドレスにより蓄積することとしていたが、別の識別子によりデータ複製、データ蓄積しても良い。つまり、Ethernet(登録商標)のMACアドレスや、ATMのVCI(Virtual Channel Identifier)、またはIMSI(International Mobile Subscriber Identity)などを使用してもよい。さらに、通信端末の通信端末識別情報を使用してもよい。この構成により、本実施形態における通信システムは、IPを用いたネットワーク(例えばインターネット)以外のネットワークにおいても提供できる。
【0097】
上記実施形態では、契約情報を基にして、中継装置でデータを複製し、複製したデータをメディア処理装置で蓄積するか否かを判定していた。しかし、発信側の通信端末から音声データの録音(すなわち、データの複製と蓄積)の指示を送出し、通信端末から指定された音声データのみメディア処理装置に蓄積されるようにしても良い。この場合、データ送受信部201が通信端末10より複製の指示を受信した場合、中継装置20の通信制御部203は、データ複製部202に、通信端末10よりデータ送受信部201を介して受信した音声データを複製させる。この構成により、録音するデータを通信端末から柔軟に指定することができる。
【0098】
好適には、通話が終了した後に、録音する/しないをユーザが指定できるようにしてもよい。この場合、音声合成用DB作成エンジン404は、データファイルをデータベースに追加する指示を得た時のみ、音声データ蓄積部403よりデータファイルを取得し音声合成用のデータベースを作成する。
【0099】
上記実施形態では、音声合成サービスに加入している通信端末の音声データをメディア処理装置において蓄積することとしていたが、音声合成サービスに加入している音声端末が頻繁に音声通信を行う相手の音声データを蓄積するようにしても良い。つまり、通話回数の上位数名の音声データを蓄積しておき、その上位数名から自分宛にメッセージが送信された時に、音声合成されたメッセージが送信されるようにするものである。この場合、通信端末10aが音声合成サービスに加入しており、通信端末10bが加入していない場合でも、所定の期間中に通信端末10aと10bとの間で行われた電話の回数が閾値を越えている場合には、通信端末10aの接続先である中継装置20の通信制御部203が、データ複製部202に、通信端末10bから受信した音声データを複製させるようにしてもよい。この構成により、相手の通信端末が音声合成サービスに加入していなくても、相手の通信端末からのメッセージは音声合成されたメッセージが送信されるようにできる。
【0100】
上記実施形態では、音声合成の依頼メッセージを送信すると、自動的にメディア処理装置で音声合成してメッセージを送信することとしていたが、音声合成されたメッセージが相手方通信端末に送信される前に、音声合成されたメッセージを発信側通信端末にて確認できるようにしても良い。つまり、音声合成されたメッセージを、発信側通信端末で再生するようにしても良い。この構成により、発信側通信端末は、音声合成されたメッセージが十分本人性のある合成メッセージとなっているかどうかを確認し、音声合成されたメッセージを送信する/しないを判断できる。
【0101】
上記実施形態では、メディア処理装置において音声データファイルごとに蓄積することとしていたが、蓄積された音声データに対して、音声認識処理を行い、認識されたテキストと音声データファイルをリンクして管理するようにしても良い。
【0102】
以上、本発明に係る通話中の音声データによる音声合成向けデータベース構築用通信システムでは、通信端末を利用した会話内容を基にして、音声合成向けデータベースが構築される。即ち、このシステムでは、専用の録音環境を必要とせず、録音のためにユーザを長時間拘束する必要もない。従って、本発明に係る通話中の音声データによる音声合成向けデータベース構築用通信システムによれば、ユーザに音声合成用の録音をしていることに気づかせることなく、容易に音声合成用データベースを構築することができる。
【0103】
また、通信端末を利用した本人の会話内容を基にして、音声合成向けデータベースが構築される。従って、本発明によれば、容易に本人の特徴を再現する本人性を重視した音声合成データベース構築方法を提供することができる。
【0104】
また、データベース作成のために特別な原稿を用意していないため、より普段の会話に近い合成データを提供することが可能となる。
通信端末10がパーソナルコンピュータのような固定端末である場合、中継装置20は固定通信網の交換機である。この場合、位置登録や着信者接続先問い合わせが不要なので、契約情報DB30は無くても良い。
【符号の説明】
【0105】
10a、10b…通信端末、20a、20b…中継装置、30…契約情報DB(契約情報データベース装置)、40…メディア処理装置、101…音声入出力部、101a…マイク、101b、102…符号/複合化部、103…パケット処理部、104…通信制御部、105…データ送受信部、201…データ送受信部(送受信部)、202…データ複製部、203…通信制御部、204…通信情報蓄積部、205…プロファイル情報管理DB、401…データ送受信部(受信部)、402…メディア処理アプリケーション(音声データ処理部)、403…音声データ蓄積部、404…音声合成用DB作成エンジン(音声合成用データベース作成部)、405…音声合成用DB(音声合成用データベース記憶部)、406…音声合成部、N…ネットワーク。
【技術分野】
【0001】
本発明は、音声合成用音声データベース構築のための通信システム、中継装置および中継方法に関し、より詳細には、本人性の再現を重視する音声合成システムにおいて、音声合成のための音声データベースを電話やTV電話の通話内容に基づき構築する通信システム、中継装置および中継方法に関する。
【背景技術】
【0002】
音声合成技術には、合成された音声が滑らかに再現されていることを重視する完全性と、あたかも本人が発声しているような音声を再現する本人性が重視されながら研究開発が行われている。
【0003】
これら音声合成技術では、予め様々な原稿を人に読ませることにより被験者の様々な音声データをデータベースに録音しておき、入力されたテキストに最もマッチした音声データを組み合わせることにより、合成された音声を生成することにより実現されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−295880号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来の音声合成技術では、音声合成用の音声データが蓄積されたデータベースを構築するためには、専用のスタジオを用意して、長時間(数時間から十数時間)の録音時間を要する。そのため、従来の音声合成技術は、カーナビゲーションシステムやIVR(Interactive Voice Response)など、限定的な音声パターンだけを必要とするシステムには適用可能であったが、移動通信システムなどにおいて個人の音声を再現することは困難であった。
【0006】
本発明は、以上の問題点を解決するためになされたものであり、個人の音声の特徴を再現する本人性を重視した音声合成用音声データベースを容易に構築のための通信システム、中継装置および中継方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するため、本発明は、通信網に接続する中継装置と、前記中継装置を介して前記通信網に接続し、前記中継装置を介して他の通信端末と音声データの送受信を行う複数の通信端末と、前記中継装置に接続するメディア処理装置とを備えた通信システムであって、前記中継装置は、第1の通信端末から送信された第1の音声データを受信し、受信した前記第1の音声データを第2の通信端末へ送信する送受信部と、音声データを複製するデータ複製部と、前記第1の通信端末からデータ送受信部を介して受信した前記第1の音声データを前記データ複製部によって複製し、当該複製された音声データを前記送受信部によって前記メディア処理装置へ送信するように制御する通信制御部とを備え、前記メディア処理装置は、前記第1の通信端末の複製された音声データを、前記中継装置から受信する受信部と、前記受信部により受信した音声データを音声データ蓄積部に蓄積する音声データ処理部と、前記音声データ蓄積部に蓄積された前記音声データに基づいて、前記第1の通信端末用の音声合成用データベースを作成する音声合成用データベース作成部と、前記音声合成用データベース作成部によって作成された音声合成用データベースが記憶される音声合成用データベース記憶部と、前記第1の通信端末から音声合成の依頼を受信した場合、前記音声合成用データベースに基づいて音声合成を行う音声合成部とを備えることを特徴とする通信システムを提供する。本発明の通信システムによれば、本人性の再現を重視した音声合成用データベースを容易に作成することができる。
【0008】
上記通信システムの別の好適な態様において、前記通信制御部は、前記複製の指示を前記第1の通信端末から受信した場合に、前記送受信部を介して前記第1の通信端末から受信した音声データを前記データ複製部に複製させる。この態様によれば、第1の通信端末は、音声データを送信するたびに録音する音声データを指定することができる。また、この場合、第1の通信端末は、音声通信が終了した後に音声データを録音するか否かを指定しても良い。この形態によれば、メディア処理装置において録音する音声データを、通信端末で自由に指定することができる。
【0009】
上記通信システムの別の好適な態様において、前記音声データ処理部は、前記受信部により受信した前記音声データが前記蓄積された音声データのいずれかと一致するか否かを判定する判定部と、受信した前記音声データの雑音量と、当該音声データと一致する蓄積済み音声データの雑音量とを測定する雑音測定部とを更に備え、前記音声データ処理部は、受信した前記音声データの雑音量が、前記蓄積済みの音声データの雑音量より少ない場合には、前記蓄積済みの音声データを受信した前記音声データで上書きするようにしてもよいし、前記音声データ処理部は、前記音声データ内の背景雑音を除去する雑音フィルターを更に備え、前記音声データ処理部は、前記雑音フィルターによって前記背景雑音を除去した前記音声データを蓄積するようにしてもよい。このような形態においては、音声合成用データベースはより質の高い音声データを提供することができる。
【0010】
また、本発明は、通信網に接続する中継装置と当該中継装置を介して前記通信網に接続する複数の通信端末とを備える通信システムにおいて、ある通信端末から他の通信端末へデータ中継を行う中継装置であって、第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する送受信部と、音声データを複製するデータ複製部と、前記第1の通信端末から前記送受信部を介して受信した前記音声データを前記データ複製部によって複製するよう制御するとともに、当該複製された音声データを蓄積して音声合成用データベースを作成するメディア処理装置に対して、前記複製した音声データを前記送受信部によって送信するように制御する通信制御部とを備える中継装置を提供する。本発明の中継装置によれば、個人の音声を再現する本人性を重視した音声合成用データベースを容易に作成することができる。
【0011】
加えて、本発明は、通信網に接続する中継装置と、前記中継装置を介して前記通信網に接続する複数の通信端末とを備え、ある通信端末より他の通信端末へデータの中継を前記中継装置が行う通信システムにおける中継方法であって、第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する受信ステップと、前記受信ステップで受信した前記音声データを複製する複製ステップと、前記複製した音声データを、当該音声データを蓄積して音声合成用データベースを作成するメディア処理装置へ送信する送信ステップとを備える中継方法を提供する。本発明の中継方法によれば、個人の音声を再現する本人性を重視した音声合成用データベースを容易に作成することができる。
【発明の効果】
【0012】
本発明によれば、個人の音声の特徴を再現する本人性を重視した音声合成用音声データベースを容易に構築可能な通信システム、中継装置および中継方法を提供することができる。
【図面の簡単な説明】
【0013】
【図1】本発明にかかる全体構成図である。
【図2】本発明にかかる通信端末の機能構成図である。
【図3】本発明にかかる中継装置の機能構成図である。
【図4】本発明にかかる通信情報蓄積部で管理する情報である。
【図5】本発明にかかる契約情報DBで管理する情報である。
【図6】本発明にかかるメディア処理装置の機能構成図である。
【図7】本発明にかかる通信システムで交換される情報の流れを示すシーケンス図である。
【図8】中継装置が実行する通信制御処理の流れを示すフローチャートである。
【図9】中継装置が実行するレジストレーション処理の流れを示すフローチャートである。
【図10】中継装置が実行する発信側処理の流れを示すフローチャートである。
【図11】中継装置が実行する着信側処理の流れを示すフローチャートである。
【図12】中継装置が実行するユーザデータ転送複製処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0014】
以下、図面とともに本発明の好適な一実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
【0015】
図1に、本実施形態に係る音声合成用音声データベース構築のための通信システム(以下通信システム)の一例を示す。通信システムは、ネットワークNからサービスを受ける複数の通信端末10(通信端末10aと通信端末10bの総称)、ネットワークNに各通信端末を接続する中継装置20(中継装置20aと中継装置20bの総称)、通信端末10の契約情報を管理する契約情報DB(データベース)30、通信端末に関わるメディア情報を蓄積・加工するメディア処理装置40を備え、およびこれらの各装置はネットワークNを介してそれぞれ接続されている。2つの通信端末10および中継装置20が図示されているが、これに限定されず、それぞれ3以上の通信端末10および中継装置20を備えることとしてもよい。
【0016】
音声データとは、具体的には例えば音声通話、TV電話、留守番電話などが該当する。また、メディア情報とは、例えば留守電により蓄積された音声・映像メッセージ、音楽ファイル、動画像などである。
【0017】
通信端末10は、中継装置20を介してネットワークNに接続されている。ネットワークNは、通信端末10に対して通信サービスを提供する。ネットワークNは、具体的には例えば、携帯電話網である。通信端末10は、無線または有線により中継装置20に接続されている。
【0018】
通信端末10は、中継装置20を介して、同じく中継装置20を介してネットワークNに接続する他の通信端末10と通信することができる。図には示さないが、通信端末10は、CPU(Central Processing Unit)、主記憶装置であるRAM(Random Access Memory)およびROM(Read Only Memory)、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置、更に通信端末10のユーザが操作する操作部等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述する通信端末10の機能が発揮される。
【0019】
図2は、通信端末10の機能構成図である。図2に示すように、通信端末10は、音声入出力部101、符号/復号化部102、パケット処理部103、通信制御部104、およびデータ送受信部105を備える。
【0020】
音声入出力部101は、マイク101aおよびスピーカー101bなどで構成され、ユーザから入力された音声をマイク101aで取得し、音声データとして符号/復号化部102へ出力する。また、音声入出力部101は、符号/復号化部102で復号された音声データを受け取り、スピーカー101bより出力する。
【0021】
符号/復号化部102は、マイク101aより入力された音声データを、データ送受信部105から送信可能とするために符号化する。また、符号/復号化部102は、入力した音声データを音声入出力部101のスピーカー101bから出力可能とするために復号化する。符号/復号化部102は、移動通信においては例えば、AMR−narrow band、AMR−wide bandなどの各種コーデックがこれに該当する。
【0022】
パケット処理部103は、符号/復号化部102により符号化された音声データを複数のパケットに分割して、これをデータ送受信部105に出力する。また、パケット処理部103は、データ送受信部105より受信したパケットを組みたてて、符号/復号化部102において復号化したあとに音声データを再現できるようにする。パケット処理部103で行われる処理は、具体的に例えば、VoIPなどのIPシステムでの音声通話における、RTP(Real time Transfer Protocol)などのプロトコルに基づいて行われる。
【0023】
通信制御部104は、通信端末10がネットワークNから通信サービスを受けることができるように、レジストレーションメッセージを作成し、これをデータ送受信部105に出力する。また、通信制御部104は、データ送受信部105を介して通信相手からの応答メッセージを受信すると、これにより、通信が可能になったことを判断する。通信制御部104による制御処理は、具体的には、例えば、SIP(Session Initiation Protocol)などのプロトコルに基づいて行われる。ユーザにより操作部が操作されて通信を終了させる指示が入力されると、通信端末10は、通信制御部104による制御処理に基づいて、通信相手の端末へ終了メッセージを送信し、通信相手より応答メッセージが返送されると通信を終了する。
【0024】
データ送受信部105は、他の端末とのデータやメッセージの送受信を行う。データ送受信部105は、パケット処理部103からの音声データ、および通信制御部104からの制御メッセージをネットワークNへ転送する。また、データ送受信部105は、ネットワークNから受信した音声データをパケット処理部103へ、ネットワークNから受信した制御メッセージを通信制御部104へ出力する。
【0025】
通信端末10は、移動通信端末がその代表例であるが、これに限るものではなく、例えば音声通話可能なパソコンや、SIP電話などにも適用可能である。本実施形態においては、通信端末10は移動通信端末であるとして説明する。
【0026】
中継装置20は、ネットワークNに接続されており、他の中継装置20を介して通信端末10間を接続することにより、通信機能を提供する。図には示さないが、中継装置20は、CPU、主記憶装置であるRAMおよびROM、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述する中継装置20の機能が発揮される。
【0027】
図3は、通信装置20の機能構成図である。図3に示すように、中継装置20は、データ送受信部201、データ複製部202、通信制御部203、および通信情報蓄積部204、およびプロファイル情報管理DB(データベース)205を備える。本実施形態においては、通信端末10は移動通信端末であるので、中継装置20は、通信端末10が無線で接続する基地局、あるいは他のネットワーク要素と通信するルーターおよび交換局である。以下では、説明の便宜のため、中継装置20は中継装置20aであるとする。
【0028】
データ送受信部201は、通信端末10、他の中継装置20(本実施形態では中継装置20b)、契約情報DB30、又はメディア処理装置40から制御メッセージを受信すると、これを通信制御部203へ出力する。また、データ送受信部201は、通信制御部203から入力された制御メッセージを通信端末10、中継装置20b、契約情報DB30、又はメディア処理装置40へ送信する。
【0029】
ここで、中継装置20aで送受信される制御メッセージの例としては、通信端末10がネットワークNよりサービスを受けるためのレジストレーションメッセージ、契約情報DB30より通信端末10の契約情報をダウンロードするプロファイルダウンロードメッセージ、通信開始を通知する発信メッセージ、発信メッセージに応答する応答メッセージがある。また、制御メッセージの他の例としては、通信相手の接続先(すなわち中継装置20)を問い合わせる着信者接続先問い合わせメッセージ、着信者接続先問い合わせメッセージに対する応答として、通信相手の接続先を応答する着信者接続先応答メッセージ、通信端末10が通信相手の通信端末との通信を終了する終了メッセージ、およびメディア処理装置40との通信を終了する終了メッセージ、これら終了メッセージへの返答としての通信端末10やメディア処理装置40からの応答メッセージ等が該当する。
【0030】
また、通信制御部203により指定されたパケットを受信すると、これをデータ複製部202へ転送する。さらに、データ複製部202により複製されたパケットをメディア処理装置40へ送信する。
【0031】
データ複製部202は、データ送受信部201から入力されたパケットを複製する。データ複製部202は、複製されたパケットが有する送信元のアドレスはそのままにして、宛先アドレスをメディア処理装置40のIPアドレスに変更して、このパケットをデータ送受信部201へ出力する。
【0032】
図4に、通信情報蓄積部204に蓄積される情報の一例を示す。図に示されるように、通信情報蓄積部204は、複数のレコードを有している。各レコードは、現在お互いに通信している発着信両通信端末10の通信端末識別情報およびIPアドレスを含むとともに、通信中の各通信端末10が音声合成サービスに加入しているか否かを示す情報(サービス加入情報)も含んでいる。この音声合成サービスは、例えば、携帯通信ネットワークの事業者によって提供され、加入者が指示したテキストに対応する音声合成メッセージを生成して、所望の送り先に送るサービスである。
【0033】
各レコードは、中継装置20に接続している通信端末10のプロファイル情報に基づいて、音声通信セッションの各々に対して生成される。プロファイル情報は、契約情報DB30よりダウンロードしたものである。なお、契約情報DB30の詳細は後段で説明する。各レコードは、通信セッションが終了した後(すなわち、通信を終了するための終了メッセージへ応答する応答メッセージを受信した後)に削除される。
本実施形態では、通信端末識別情報には通信端末ごとに一意に識別可能な電話番号を利用する。
【0034】
プロファイル情報管理DB205は、契約情報DB30よりダウンロードしたプロファイル情報を記憶する。契約情報DB30よりダウンロードしたプロファイル情報は、少なくとも、レジストレーションメッセージの送信元通信端末10の電話番号(すなわち、通信端末識別情報)と、当該通信端末10が音声合成サービスに加入しているか否かを示すサービス加入情報とを含む。プロファイル情報は、各通信端末10のIPアドレスと関連付けて記憶され、同一の通信端末識別情報を持つプロファイル情報がダウンロードされるたびに、最新のIPアドレスで書き換えられる。
【0035】
通信制御部203は、データ送受信部201より制御メッセージを受信すると、この制御メッセージに対応した処理を行う。制御メッセージの例は上述したとおりである。
通信制御部203は、データ送受信部201を介して通信端末10よりレジストレーションメッセージを受信すると、データ送受信部201を介してこのメッセージを契約情報DB30に送信する。このメッセージに対する応答として、該当する通信端末20のプロファイル情報が、プロファイルダウンロードメッセージによって通知される。受信したプロファイル情報は、プロファイル情報管理DB205に蓄積される。
【0036】
また、通信制御部203は、データ送受信部201を介して通信端末10から発信メッセージを受信すると、通信相手である他の通信端末10の接続先であり、この発信メッセージの転送先として最適な中継装置20を特定するために、着信者接続先問い合わせメッセージを作成する。通信制御部203は、作成した着信者接続先問い合わせメッセージをデータ送受信部201へ出力して契約情報DB30へ送信する。通信制御部203は、データ送受信部201より着信者接続先応答メッセージを受信すると、通信相手の通信端末10が接続する中継装置20を確認し、その中継装置20に向けてデータ送受信部201を介して発信メッセージを送信する。通信制御部203は、通信相手の通信端末10から応答メッセージを受信すると、通信情報蓄積部204に新たなレコードを作成する。
【0037】
また、通信制御部203は、データ送受信部201を介して通信相手の中継装置20から発信メッセージを受信すると、データ送受信部201を介して、該当する通信端末10に受信した発信メッセージを送信する。通信制御部203は、データ送受信部201を介して通信端末10から上記発信メッセージに対する応答メッセージを受信すると、プロファイル情報管理DB205から応答メッセージの送信者に対応するプロファイル情報を読み出す。そして、この応答メッセージに、読み出したプロファイル情報と応答メッセージの送信元通信端末10のIPアドレスとを付加した後、データ送受信部201を介してこの応答メッセージを通信相手の中継装置20へ送信する。
【0038】
また、通信制御部203は、データ送受信部201を介して通信端末10より終了メッセージを受信すると、データ送受信部201を介して通信相手の中継装置20とメディア処理装置40に向けて終了メッセージを送信する。また、通信制御部203は、通信相手の中継装置20とメディア処理装置40からの応答メッセージの受信が確認された後に、通信端末10に応答メッセージを送信する。
【0039】
ここで、例えば、プロファイルダウンロードメッセージによって通知されたプロファイル情報に、ある通信端末10が音声合成サービスに加入していることが示されているとする。この場合、この通信端末10からの音声通話又はTV電話による発信、又は当該通信端末への着信があったときに、その通信内容である音声データなどのデータが、データ送受信部201からデータ複製部202へパケットとして出力され、データ複製部202で複製される。複製されたパケットは、データ送受信部201を介してメディア処理装置40へ送信される。
【0040】
このように、通信端末10aが音声合成サービスに加入している場合、通信制御部203は、通信端末10より受信した音声データをデータ複製部202に複製させ、複製した音声データをメディア処理装置40へデータ送受信部201に送信させる。メディア処理装置40に送信された音声データは蓄積されて音声合成データベースの基礎として使われるので、音声合成用のデータベースを、音声合成サービスに加入しているユーザ本人の音声データに基づいて作ることができる。したがって、このようにして作成されたデータベースに基づいて生成された音声合成メッセージは、ユーザ本人の音声の特性を反映した(すなわち、ユーザ本人の声と類似性が非常に高い)音声メッセージになる。
【0041】
さらに、通信端末10aと通信している通信端末10bが音声合成サービスに加入している場合、通信端末10aと接続している中継装置20aの通信制御部203は、通信端末10bから受信した音声データを、中継装置20aのデータ複製部202に複製させる。通信端末10aと通信相手の通信端末10bの両方が音声合成サービスに加入している場合には、中継装置20aの通信制御部203は、通信端末10aから受信した音声データと、通信端末10bから受信した音声データの両方を、中継装置20aのデータ複製部202に複製させる。このようにして、本実施形態の通信システムによると、通信相手の通信端末のユーザの音声合成データベースも作成することができる。
【0042】
発信メッセージへの応答として送信された上記応答メッセージは、着信に対する応答であるばかりでなく、着信側の通信端末10のIPアドレスも通知している。これにより発信側の通信端末10の接続する中継装置20は、発着信両側の通信端末10の通信端末識別情報とIPアドレスを知ることができ、これらの情報を通信情報蓄積部204内に蓄積することができる。上述のように、発着信両側の通信端末10の通信端末識別情報とIPアドレスは、通信情報蓄積部204に保持される。
【0043】
通信制御部203は、相手方の通信端末10から応答メッセージを受信すると、メディア処理装置40との間に通信経路を設定するために発信メッセージを作成し、メディア処理装置40へ送信する。このメッセージ送信に対する応答として、メディア処理装置40から応答メッセージを受信した後、データ複製部202でパケットの複製を開始する。
【0044】
契約情報DB30は、ネットワークNに接続されており、ネットワークNの事業者と契約している全通信端末10の契約情報、接続先情報(位置情報)などを管理しているDBサーバ装置である。移動通信システムにおいては、契約情報DB30は、例えばHLR(Home Location Register)である。図には示さないが、契約情報DB30は、CPU、主記憶装置であるRAMおよびROM、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述する契約情報DB30の機能が発揮される。
【0045】
図5に契約情報DB30に登録されている情報の一例を示す。図に示されるように、契約情報DB30には、契約情報301として、通信端末10ごとに、ユーザID、電話番号、音声合成サービス加入の有無、およびレジストレーション状態が登録されている。本実施形態においては、契約情報DB30に記憶されている電話番号は、通信端末10の通信端末識別情報として機能する。レジストレーション状態は、通信端末10が登録されている(すなわち、電源が入っている)場合に、通信端末10がどの中継装置20に接続しているかを中継装置20のIPアドレスで示す。中継装置20のIPアドレスは、当該中継装置20からレジストレーションメッセージとともに送信される。この意味で、レジストレーションメッセージは位置登録要求メッセージに相当する。
【0046】
契約情報DB30は、中継装置20からレジストレーションメッセージを受信すると、レジストレーション状態として、レジストレーションメッセージを送信した通信端末10が接続する中継装置20を特定する情報を登録する。さらに、契約情報DB30は、通信端末10のプロファイル情報として、電話番号と、音声合成サービスへ加入しているか否かを「YES」又は「NO」で示すサービス加入情報とを、プロファイルダウンロードメッセージの中に入れて中継装置20へ転送する。さらに、契約情報DB30は、着信側通信端末10の接続先(すなわち、通信端末10が接続している中継装置20)を問い合わせる着信者接続先問い合わせメッセージを受信すると、該当する着信側通信端末10の接続先の情報を着信者接続先応答メッセージにのせて、問い合わせメッセージの送信元である中継装置20に送信する。
【0047】
メディア処理装置40は、ネットワークNに接続されており、通信端末10のマルチメディア情報の蓄積・加工機能を提供する。図には示さないが、メディア処理装置40は、CPU、主記憶装置であるRAMおよびROM、通信を行うための通信モジュール、並びにハードディスク等の補助記憶装置等のハードウェアを備えるコンピュータとして構成される。これらの構成要素が協働することにより、後述するメディア処理装置40の機能が発揮される。
【0048】
図6は、メディア処理装置40の機能構成図である。図に示すように、メディア処理装置40は、データ送受信部401、メディア処理アプリケーション402、音声データ蓄積部403、音声合成用DB作成エンジン404、音声合成DB405、および音声合成部406を備えて構成される。
【0049】
データ送受信部401は、制御メッセージを中継装置20より受信すると、これをメディア処理アプリケーション402へ転送する。データ送受信部401は、メディア処理アプリケーション402から受信した制御メッセージを、中継装置20へ転送する。また、データ送受信部401は、中継装置20より受信したパケットをメディア処理アプリケーション402へ転送する。データ送受信部401は、音声合成を依頼する音声合成依頼メッセージを通信端末10から受信すると、これを音声合成部406へ出力する。この音声合成依頼メッセージには、インスタントメッセージ(Instant messaging)やメールのテキストデータなどが添付されて送信される。
【0050】
メディア処理アプリケーション402は、中継装置20から発信メッセージを受信すると、応答メッセージを送信する。この発信メッセージには、発信側通信端末10の通信端末識別情報とIPアドレスが含まれている。その後、中継装置20よりパケットを受信すると、メディア処理アプリケーション402は、この各パケットを送信元のIPアドレスごとに分類し、分類したパケットを、音声データ蓄積部403の該当するIPアドレスの通信端末の蓄積スペースに蓄積していく。この蓄積処理は、中継装置20よりパケットを受信する度に行われる。メディア処理アプリケーション402は、終了メッセージを中継装置より受信すると、終了メッセージを確認する応答メッセージを送信する。さらに、メディア処理アプリケーション402は、それまで蓄積していたパケットを1つのファイルとして蓄積するように、音声データ蓄積部403に指示する。
【0051】
音声合成用DBエンジン404は、音声データ蓄積部403に音声合成用のデータが登録されたことを契機に、このデータを音声データ蓄積部403から取り出し、音声合成用のDBを作成する。作成されたDBは、音声合成用DB405に蓄積される。
【0052】
音声合成部406は、通信端末10から音声合成依頼メッセージを受信すると、その送信元である通信端末10の音声合成用データを音声合成用DB405より取り出し、音声合成処理をする。音声合成されたメッセージは、着信側通信端末10に向けて転送される。
【0053】
図8は、中継装置20の通信制御部203が実行する通信制御処理の流れを簡略化して示すフローチャートである。図に示されるように、通信制御処理においては、まず、通信制御部203は、通信端末10よりレジストレーションメッセージを受信すると、レジストレーション処理(SA1)を実行する。このレジストレーションメッセージは、例えば移動通信端末10の電源が入れられた場合に送信される。レジストレーション処理が終了すると、通信制御部203は、次の制御メッセージを待つ。
【0054】
受信した制御メッセージが、当該中継装置20に接続する通信端末10からの発信メッセージである場合、通信制御部203は、発信側処理(SA2)を行う。次に、通信制御部203は、通信情報蓄積部204に蓄積されている情報に基づいて、当該中継装置20に接続している発信側通信端末10および他の中継装置20に接続している着信側通信端末10の少なくとも1つが音声合成サービスに加入しているか否かを判定する判定処理(SA4)を行う。判定結果がYESの場合、通信制御部203は、メディア処理装置40との通信接続を確立するメディア処理装置接続処理(SA5)へ進み、続いて、ユーザデータ転送複製処理(SA6)を行う。通信制御部203は、その後、通信セッションを終了する終了処理(SA7)を行う。一方、ステップSA4の判定結果がNOの場合、通信制御部203は、ユーザデータ転送処理(SA8)へと進む。ユーザデータ転送処理はユーザデータが受信される度に実行され、終了メッセージを受信すると、終了処理が行われる(SA7)。
【0055】
一方、制御メッセージを受信し、その制御メッセージが、他の中継装置20からの発信メッセージである場合、通信制御部203は、まず着信側処理(SA3)を行う。この着信側処理により、当該中継装置20に接続する通信端末10と他の中継装置20に接続する他の通信端末10との間に通信接続が確立すると、通信制御部203は、当該中継装置20に接続する通信端末10から受信したユーザデータを他の中継装置20に転送するとともに、他の中継装置20から受信したユーザデータを、当該中継装置20に接続する通信端末10へ転送するユーザデータ転送処理を開始する(SA8)。ユーザデータ転送処理は、ユーザデータを受信する度に行われる。そして、終了メッセージを受信すると、処理は終了処理(SA7)に進む。終了処理においては、通信制御部203は、通信端末10から終了メッセージを受信すると、他の中継装置20との通信を終了するとともに、メディア処理装置と接続している場合には、メディア処理装置40との通信も終了する。
【0056】
図7は、本通信システムで送受信されるデータの流れを示すシーケンス図である。図9〜12は、レジストレーション処理(図8のSA1)、発信側処理(図8のSA2)、着信側処理(図8のSA3)、ユーザデータ転送複製処理(図8のSA6)の詳細な流れをそれぞれ示している。
【0057】
次に、図7および図9〜12を参照して、通信システムにおいて行われる処理の一例を説明する。この処理は、2台の通信端末10aと通信端末10bにより音声通話が行われ、その通話中にパケットをメディア処理装置40に蓄積し、通話完了後に、通信端末10aと10bの各々が音声合成メッセージを送信するまでの処理である。
【0058】
まず、図7のステップS1において、各通信端末10a、10bは、電源が入力された時などに、ネットワークNからサービスを受けられるようにレジストレーションメッセージを各中継装置20a、20bに送信する。各中継装置20a、20bは、このレジストレーションメッセージを契約情報DB30へ送信する。このとき、通信端末10a、10bがどの中継装置に接続しているかがわかるように、中継装置20a、20bは、契約情報DB30に対して自己のIPアドレスをそれぞれ通知する。契約情報DB30はその後、通信端末10a、10bが接続する中継装置20a、20bの各IPアドレスをレジストレーション状態として登録する。
【0059】
次に、ステップS2において、レジストレーションメッセージを受信した契約情報DB30は、各通信端末10a、10bのプロファイル情報を抽出し、ステップS1においてレジストレーションメッセージによって通知された中継装置20a、20bの各IPアドレスに対して、このプロファイル情報をそれぞれ送信する(図7のS2:プロファイルダウンロード)。各中継装置20a、20bは、自装置内のプロファイル情報管理DB205に、受信したプロファイル情報を登録する。
【0060】
図9は、中継装置20の通信制御部203で行われるレジストレーション処理の流れを示すフローチャートである。レジストレーション処理において、通信制御部203は、まず通信端末10からレジストレーションメッセージを受信する(SA11)。通信制御部203は、次に、受信したレジストレーションメッセージを契約情報DB30へ送信する(SA12)。このとき、通信制御部203は、中継装置20のIPアドレスをレジストレーションメッセージに付加して送信する。
【0061】
次に、通信制御部203は、プロファイル情報が契約情報DB30から受信されたか否かを判定する(SA13)。この判定はプロファイル情報が受信されるまで繰り返される(SA13:NO)。この判定結果がYESになると、通信制御部203は、受信したプロファイル情報をプロファイル情報管理DB205へ登録し(SA14)、当該レジストレーション処理を終了する。
図7に示されるように、このレジストレーション処理は、中継装置20aと20bの各装置において行われる。
【0062】
次に、図7のステップS3において、通信端末10aは、通信端末10bに対して発信メッセージを送信する。
【0063】
次に、図7のステップS4において、中継装置20aは、着信者接続先問い合わせメッセージを送信し、通信端末10bがどの中継装置に接続しているかについて契約情報DB30に問い合わせる。
【0064】
次に、図7のステップS5において、通信端末10bのレジストレーションが完了している場合、契約情報DB30は、通信端末10bが中継装置20bに接続していることを確認して、中継装置20bを示す情報を中継装置20aに送信する(図7のS5:着信者接続先応答)。
【0065】
次に、図7のステップS6において、中継装置20aは、契約情報DB30より通知された、通信端末10bの接続先である中継装置20bに対して、発信メッセージを送信する。中継装置20bは、この発信メッセージを受信すると、通信端末10bに対して、同発信メッセージを送信するとともに、受信した発信メッセージの送信元アドレスを記録する。
【0066】
次に、図7のステップS7において、通信端末10bは、応答が可能な場合は、中継装置20bに対して応答メッセージを送信する。中継装置20bは、受信した応答メッセージに通信端末10bのIPアドレスとプロファイル情報とを付加した後、中継装置20aへ送信する。さらに、中継装置20aはこの応答メッセージを通信端末10aへ送信する。本実施形態において、中継装置20bは中継装置20aへメッセージを送信できることとしたが、これは、中継装置20bは、ステップS6において受信した発信メッセージの送信元アドレスを記憶しているためである。
【0067】
図10は、中継装置20(図7の例では中継装置20a)の通信制御部203(これ以降、「通信制御部203a」とする)が実行する発信側処理の流れを示すフローチャートである。この発信側処理においては、通信制御部203aは、まず発信側である通信端末10aから発信メッセージを受信する(SA21)。通信制御部203aは、着信者接続先問い合わせメッセージを契約情報DB30に送信することによって、発信メッセージで特定される通信端末10bがどの中継装置に接続しているかを問い合わせる(SA22)。
【0068】
通信制御部203は、次に、契約情報DB30から着信者の接続先に関する情報を受信したか否かを判定する。この判定は、着信者の接続先に関する情報が受信されるまで繰り返される(SA23:NO)。判定結果がYESの場合、通信制御部203は、着信者の接続先に関する情報に示される中継装置20(図7の例では中継装置20b)に上記発信メッセージを送信する(SA24)。図7のステップS6に示されるように、この発信メッセージは、中継装置20bから通信端末10bへ転送される。
【0069】
図11は、中継装置20(図7の例では、中継装置20b)の通信制御部203(これ以降、「通信制御部203b」とする)により実行される着信側処理の流れを示すフローチャートである。着信側処理においては、通信制御部203bはまず、中継装置20aより発信メッセージを受信する(SA31)。次に、通信制御部203bは、着信側通信端末10bにこの発信メッセージを送信し(SA32)、送信した発信メッセージに対する応答メッセージを待つ(SA33:NO)。
【0070】
通信端末10bから応答メッセージを受信すると(SA33:YES)、通信制御部203bは、プロファイル情報管理DB205から通信端末10bのプロファイル情報を読み出し(SA34)、この応答メッセージに、IPアドレスと読み出したプロファイル情報とを付加して(SA35)中継装置20aへ送信し(SA36)、着信側処理を終了する。
【0071】
一方、図10のステップSA25において、中継装置20aの通信制御部203aは、中継装置20bを介して通信端末10bより応答メッセージが受信されたか否かを判定する(SA25)。この判定は、応答メッセージが受信されるまで繰り返される(SA25:NO)。
【0072】
判定結果がYESになると、通信制御部203aは、通信情報蓄積部204にレコードを新規作成する。具体的には、通信制御部203aは、受信したプロファイル情報に基づいて、通信端末識別情報と、通信端末10bが音声合成サービスに加入しているか否かを示すサービス加入情報とを取得し、新規作成したレコードに、通信端末識別情報と、サービス加入情報と、受信した通信端末10bのIPアドレスとを記憶する。また、通信制御部203aは、プロファイル情報管理DB205から、SA21で受信した発信メッセージに含まれるIPアドレス(通信端末10aのIPアドレス)に対応するプロファイル情報を読み出し、読み出したプロファイル情報から通信端末10aの通信端末識別情報と、通信端末10aが音声合成サービスに加入しているか否かを示すサービス加入情報とを取得して、通信端末10aのIPアドレスとともに同レコードに記憶する(SA26)。
【0073】
この例では、ステップSA26における処理の結果、図4における通信情報蓄積部204の最上段に示すようなレコードが生成されたとする。図示のように、このレコードでは、通信端末10aの通信端末識別子は「090AAAAAAAA」であり、通信端末10bの通信端末識別子は「090BBBBBBBB」である。また、通信端末10aと10bの両方が、音声合成サービスに加入している。
通信制御部203aはその後、発信側処理を終了して、図8のステップSA4の判定処理へ進む。
【0074】
判定処理において、中継装置20aは、通信情報蓄積部204に蓄積した情報に基づいて、発信側と着信側の通信端末の少なくとも1つが音声合成サービスに加入しているか否かを判定する。この例では、通信情報蓄積部204に蓄積した情報に基づいて、肯定的であると判定されるので(図8のSA4:YES)、中継装置20aは、通信経路を確立するための発信メッセージを生成し、メディア処理装置40へ送信する(図7のS8:発信、図8のSA5)。一方、発信側と着信側がいずれも音声合成サービスに加入していないと判定された場合(図8のSA4:NO)には、通信制御部203は、メディア処理装置40へ発信メッセージを送信せず、代わりに、通信制御部203は、ユーザデータ転送処理へ進む(図8のSA8)。
【0075】
次に、図7のステップS9において、メディア処理装置40は、発信メッセージを受信した後、応答メッセージを中継装置20aへ送信し、中継装置20aとの通信経路を設定する。
【0076】
次に、図7のステップS10において、通信端末10aから中継装置20aに対してユーザデータ(音声データ)を含むパケットが送信された場合、中継装置20aは、そのパケットを通信相手の通信端末10bが接続している中継装置20bへと送信する。この例では、通信端末10aは音声合成サービスに加入しているので、中継装置20aは、パケットを複製して、メディア処理装置40へ送信する。逆に、通信端末10bから中継装置20bを介して中継装置20aにパケットが送信された場合、この例では、通信端末10bも音声合成サービスに加入しているので、中継装置20aは、このパケットも複製してメディア処理装置40へ送信する(図7のS10a:複製パケット)。メディア処理装置40は、受信したパケットを送信元アドレス(すなわち、通信端末10aまたは10bのIPアドレス)ごとに分類し、音声データ蓄積部403の、送信元アドレスに該当する通信端末識別情報に該当する蓄積スペースに各パケットのデータを蓄積していく。
【0077】
図12は、通信制御部203aが実行するユーザデータ転送複製処理の流れを示すフローチャートである。この処理では、通信制御部203aは、まずユーザデータを受信する(SA61)。次に、通信制御部203aは受信したデータが、ステップSA21で受信された発信メッセージの送信元である発信側通信端末(すなわち、通信端末10a)から送信されたものであるか否かを判定する(SA62)。判定結果がYESになった場合、通信制御部203aは、着信側通信端末(すなわち、通信端末10b)へユーザデータを送信する(SA63)。続いて、通信制御部203aは、通信情報蓄積部204に蓄積されている情報に基づいて、通信端末10aが音声合成サービスに加入しているか否かを判定する(SA64)。この動作例では、通信端末10aは音声合成サービスに加入しているので、判定結果はYESになる。よって、通信制御部203aは、データ複製部202にユーザデータを複製させ(SA65)、データ送受信部201を介してメディア処理装置40へ送信し(SA66)、ユーザデータ転送複製処理を終了する。ステップSA64の判定結果がNOになると、処理は図8のメインプロセスへ戻る。
【0078】
一方、ステップSA62の判定結果がNOの場合、すなわち、受信したユーザデータが通信端末10bから送信されたものである場合、通信制御部203aは、このユーザデータを、その受信者である通信端末(すなわち通信端末10a)へ送信する(SA67)。続いて、通信制御部203aは、通信情報蓄積部204内の情報に基づいて、通信端末10bが音声合成サービスに加入しているか否かを判定する(SA68)。この動作例では、通信端末10bは音声合成サービスに加入しているので、その判定結果はYESとなる。よって、通信制御部203aは、データ複製部202にユーザデータを複製させ(SA65)、複製したデータをデータ送受信部201を介してメディア処理装置40に送信し(SA66)、ユーザデータ転送複製処理を終了する。ステップSA68の判定結果がNOの場合、処理は図8のメインプロセスに戻る。このユーザデータ転送複製処理は、ユーザデータを受信する度に行われる。
【0079】
次に、図7のステップS11において、ユーザにより通信を終了させる指示が入力されると、通信端末10aは、終了メッセージを送信する。これを受信した中継装置20aは、この終了メッセージを中継装置20bへ転送する。引き続き、中継装置20bは同メッセージを通信端末10bへ転送する。
【0080】
次に、図7のステップS12において、通信端末10bは、終了メッセージを受信して、通話を終了すると応答メッセージを返送する。中継装置20bはこれを受信すると中継装置20aへ転送する。中継装置20bが中継装置20aへメッセージを転送できるのは、ステップS7で説明した理由と同様である。
【0081】
次に、図7のステップS13において、中継装置20aは、通信端末10aからの終了メッセージを受信すると、自装置内でのパケットの複製機能を停止し、メディア処理装置40へ終了メッセージを送信する。
【0082】
次に、図7のステップS14において、メディア処理装置40は、終了メッセージを受信すると応答メッセージを返送し、中継装置20aとの通信を終了する。メディア処理装置40は、1回の音声通話が完了したことを検出し、音声データ蓄積部403に蓄積していた複製パケット内のデータを1つのファイルとして結合する。
【0083】
次に、図7のステップS15において、中継装置20aは、中継装置20bとメディア処理装置40の両方から応答メッセージを受信すると、通信が終了したことを通信端末10aに通知するために、応答メッセージを送信する(ステップS11からS15は図8のSA7に対応)。通信端末10aと10bとの間の通信セッションはこのようにして終了する。
【0084】
次に、図7のステップS16において、メディア処理装置40は、音声データ蓄積部403に登録された音声通信のデータファイルに基づいて、音声合成に利用するデータベースを構築する。
【0085】
S16で作成された音声合成用DBは、メールまたはインスタントメッセージなどのメッセージングアプリケーションにより、通信端末10a又は10bからメッセージデータが送信され、これに音声合成依頼が示されている時に利用される。
【0086】
ステップS17において、通信端末10aは、宛先を通信端末10bとする音声合成依頼付きのメッセージを中継装置20aへ送信する。中継装置20aは、受信したメッセージをメディア処理装置40へ送信する(図7のS17:音声合成依頼メッセージ)。
【0087】
ステップS18において、メディア処理装置40は、構築されている音声合成用DBを利用して、通信端末10aのユーザの本人性を反映した音声合成メッセージを作成し、中継装置20bを介してこれを通信端末10bへ送信する(図7のS18:音声合成メッセージ)。
【0088】
ステップS19において、通信端末10bは、宛先を通信端末10aとする音声合成依頼付きのメッセージを中継装置20bへ送信する。中継装置20bは、受信したメッセージをメディア処理装置40へ送信する(図7のS19:音声合成依頼メッセージ)。
【0089】
ステップS20において、メディア処理装置40は、構築されている音声合成用DBを利用して、通信端末10bのユーザの本人性を反映した音声合成メッセージを作成し、中継装置20aを介してこれを通信端末10aへ送信する(図7のS20:音声合成メッセージ)。
【0090】
変形例:
続いて、本実施形態にかかる通信システムの変形例について説明する。上記実施形態は、以下のような変形が可能である。
上記実施形態においては、通信端末10aが通信端末10bに対して発信した場合、通信端末10aの接続先中継装置20aが、通信端末10aと通信端末10b双方の音声データを複製して、この複製した音声データをメディア処理装置40へ送信していたが、上記実施形態においては、中継装置20bも中継装置20aと同様の構成を有するので、中継装置20bが、通信端末10aと通信端末10b双方の音声データを複製してもよい。もしくは、中継装置20aと中継装置20bのそれぞれが、通信端末10aと通信端末10b双方の音声データを複製するように本システムを構成してもよいし、中継装置20aが通信端末10aの音声データを複製し、中継装置20bが通信端末10bの音声データを複製するように本システムを構成してもよい。
【0091】
さらに、上述の実施形態においては、通信端末10aが中継装置20aに接続し、通信端末10bが中継装置20bに接続している場合の説明をした。しかしながら、通信端末10aと10bが、同じ中継装置20に接続していてもよい。また、通信端末10のうち少なくとも1つが、中継装置20に接続していてもよい。換言すれば、通信端末のうち1つが、中継装置20の機能を持たない従来型の中継装置に接続していてもよい。
【0092】
上記実施形態では、メディア処理装置40に転送された音声通信中のデータを全て蓄積することとしていたが、転送されたデータの中で選択されたもののみを蓄積しても良い。この選択は、既に蓄積されているデータと受信したデータとの比較に基づいて行ってもよい。つまり、この選択では、発音や意味がすでに蓄積されているデータと同一か類似している場合には、データが破棄される。具体的には、メディア処理装置40のメディア処理アプリケーション402は、データ送受信部401(受信部)により受信された音声データが蓄積済みの音声データのいずれかに一致するか否かを判定する判定部を有し、判定部により、両者が一致していることが検知された場合には、蓄積済みの音声データを受信した音声データで上書きするようにしてもよい。
【0093】
好適には、類似度もしくは同一度の高いデータであっても、蓄積されているデータが背景雑音などを含んでおり、新しく受信されたデータの方がよりクリアな音質を有するデータであった場合には、蓄積されたデータを新たに受信したデータで置換し、クリアなデータを優先的に蓄積することが望ましい。この場合、メディア処理アプリケーション402は、受信した音声データの雑音量と、このデータに対応する蓄積された音声データの雑音量をそれぞれ測定する雑音測定部を有するのが望ましく、受信した音声データの雑音量が、蓄積済みの対応する音声データの雑音量より少ない場合には、音声データ蓄積部403は、蓄積済みの音声データを受信した音声データで上書きするのが望ましい。この構成により、データベースのサイズを最適化しながら、より質の高い音声合成用データベースを提供することができる。
【0094】
好適には、音声合成されたメッセージを送信する際によく利用されるデータを優先的に蓄積しておき、頻繁に使用されるデータが後から入力されたデータで置換されないようにすることが望ましい。
【0095】
上記実施形態では、メディア処理装置40に転送された通話中のデータを全て蓄積することとしていたが、蓄積する前に不要な音声を除去しても良い。この場合、メディア処理アプリケーション402は、音声データに含まれる背景雑音を除去する雑音フィルターを有し、音声データ蓄積部403は、この雑音フィルターにより雑音が除去された後に、音声データを蓄積するのが望ましい。この構成により、必要なデータのみを蓄積することができる。
好適には、背景雑音に加えて、無音部のデータを除去して蓄積することが望ましい。
【0096】
上記実施形態では、中継装置において送信元IPアドレスによりデータ複製し、メディア処理装置において送信元IPアドレスにより蓄積することとしていたが、別の識別子によりデータ複製、データ蓄積しても良い。つまり、Ethernet(登録商標)のMACアドレスや、ATMのVCI(Virtual Channel Identifier)、またはIMSI(International Mobile Subscriber Identity)などを使用してもよい。さらに、通信端末の通信端末識別情報を使用してもよい。この構成により、本実施形態における通信システムは、IPを用いたネットワーク(例えばインターネット)以外のネットワークにおいても提供できる。
【0097】
上記実施形態では、契約情報を基にして、中継装置でデータを複製し、複製したデータをメディア処理装置で蓄積するか否かを判定していた。しかし、発信側の通信端末から音声データの録音(すなわち、データの複製と蓄積)の指示を送出し、通信端末から指定された音声データのみメディア処理装置に蓄積されるようにしても良い。この場合、データ送受信部201が通信端末10より複製の指示を受信した場合、中継装置20の通信制御部203は、データ複製部202に、通信端末10よりデータ送受信部201を介して受信した音声データを複製させる。この構成により、録音するデータを通信端末から柔軟に指定することができる。
【0098】
好適には、通話が終了した後に、録音する/しないをユーザが指定できるようにしてもよい。この場合、音声合成用DB作成エンジン404は、データファイルをデータベースに追加する指示を得た時のみ、音声データ蓄積部403よりデータファイルを取得し音声合成用のデータベースを作成する。
【0099】
上記実施形態では、音声合成サービスに加入している通信端末の音声データをメディア処理装置において蓄積することとしていたが、音声合成サービスに加入している音声端末が頻繁に音声通信を行う相手の音声データを蓄積するようにしても良い。つまり、通話回数の上位数名の音声データを蓄積しておき、その上位数名から自分宛にメッセージが送信された時に、音声合成されたメッセージが送信されるようにするものである。この場合、通信端末10aが音声合成サービスに加入しており、通信端末10bが加入していない場合でも、所定の期間中に通信端末10aと10bとの間で行われた電話の回数が閾値を越えている場合には、通信端末10aの接続先である中継装置20の通信制御部203が、データ複製部202に、通信端末10bから受信した音声データを複製させるようにしてもよい。この構成により、相手の通信端末が音声合成サービスに加入していなくても、相手の通信端末からのメッセージは音声合成されたメッセージが送信されるようにできる。
【0100】
上記実施形態では、音声合成の依頼メッセージを送信すると、自動的にメディア処理装置で音声合成してメッセージを送信することとしていたが、音声合成されたメッセージが相手方通信端末に送信される前に、音声合成されたメッセージを発信側通信端末にて確認できるようにしても良い。つまり、音声合成されたメッセージを、発信側通信端末で再生するようにしても良い。この構成により、発信側通信端末は、音声合成されたメッセージが十分本人性のある合成メッセージとなっているかどうかを確認し、音声合成されたメッセージを送信する/しないを判断できる。
【0101】
上記実施形態では、メディア処理装置において音声データファイルごとに蓄積することとしていたが、蓄積された音声データに対して、音声認識処理を行い、認識されたテキストと音声データファイルをリンクして管理するようにしても良い。
【0102】
以上、本発明に係る通話中の音声データによる音声合成向けデータベース構築用通信システムでは、通信端末を利用した会話内容を基にして、音声合成向けデータベースが構築される。即ち、このシステムでは、専用の録音環境を必要とせず、録音のためにユーザを長時間拘束する必要もない。従って、本発明に係る通話中の音声データによる音声合成向けデータベース構築用通信システムによれば、ユーザに音声合成用の録音をしていることに気づかせることなく、容易に音声合成用データベースを構築することができる。
【0103】
また、通信端末を利用した本人の会話内容を基にして、音声合成向けデータベースが構築される。従って、本発明によれば、容易に本人の特徴を再現する本人性を重視した音声合成データベース構築方法を提供することができる。
【0104】
また、データベース作成のために特別な原稿を用意していないため、より普段の会話に近い合成データを提供することが可能となる。
通信端末10がパーソナルコンピュータのような固定端末である場合、中継装置20は固定通信網の交換機である。この場合、位置登録や着信者接続先問い合わせが不要なので、契約情報DB30は無くても良い。
【符号の説明】
【0105】
10a、10b…通信端末、20a、20b…中継装置、30…契約情報DB(契約情報データベース装置)、40…メディア処理装置、101…音声入出力部、101a…マイク、101b、102…符号/複合化部、103…パケット処理部、104…通信制御部、105…データ送受信部、201…データ送受信部(送受信部)、202…データ複製部、203…通信制御部、204…通信情報蓄積部、205…プロファイル情報管理DB、401…データ送受信部(受信部)、402…メディア処理アプリケーション(音声データ処理部)、403…音声データ蓄積部、404…音声合成用DB作成エンジン(音声合成用データベース作成部)、405…音声合成用DB(音声合成用データベース記憶部)、406…音声合成部、N…ネットワーク。
【特許請求の範囲】
【請求項1】
通信網に接続する中継装置と、
前記中継装置を介して前記通信網に接続し、前記中継装置を介して、他の通信端末と音声データの送受信を行う複数の通信端末と、
前記中継装置に接続するメディア処理装置と
を備えた通信システムであって、
前記中継装置は、
第1の通信端末から送信された第1の音声データを受信し、受信した前記第1の音声データを第2の通信端末へ送信する送受信部と、
音声データを複製するデータ複製部と、
前記第1通信端末からデータ送受信部を介して受信した前記第1の音声データを前記データ複製部によって複製し、当該複製された音声データを前記送受信部によって前記メディア処理装置へ送信するように制御する通信制御部と
を備え、
前記メディア処理装置は、
前記第1の通信端末の複製された音声データを、前記中継装置から受信する受信部と、
前記受信部により受信した音声データを音声データ蓄積部に蓄積する音声データ処理部と、
前記音声データ蓄積部に蓄積された前記音声データに基づいて、前記第1の通信端末用の音声合成用データベースを作成する音声合成用データベース作成部と、
前記音声合成用データベース作成部によって作成された音声合成用データベースが記憶される音声合成用データベース記憶部と、
前記第1の通信端末から音声合成の依頼を受信した場合、前記音声合成用データベースに基づいて音声合成を行う音声合成部と
を備える、
ことを特徴とする通信システム。
【請求項2】
前記通信制御部は、前記複製の指示を前記第1の通信端末から受信した場合に、前記送受信部を介して前記第1の通信端末から受信した音声データを前記データ複製部に複製させる、
ことを特徴とする請求項1に記載の通信システム。
【請求項3】
前記音声データ処理部は、
前記受信部により受信した前記音声データが前記蓄積された音声データのいずれかと一致するか否かを判定する判定部と、
受信した前記音声データの雑音量と、当該音声データと一致する蓄積済み音声データの雑音量とを測定する雑音測定部と、
を更に備え、
前記音声データ処理部は、受信した前記音声データの雑音量が、前記蓄積済みの音声データの雑音量より少ない場合には、前記蓄積済みの音声データを受信した前記音声データで上書きする、
ことを特徴とする請求項1又は2に記載の通信システム。
【請求項4】
前記音声データ処理部は、前記音声データ内の背景雑音を除去する雑音フィルターを更に備え、
前記音声データ処理部は、前記雑音フィルターによって前記背景雑音が除去された前記音声データを蓄積する、
ことを特徴とする請求項1乃至3のいずれか一項に記載の通信システム。
【請求項5】
通信網に接続する中継装置と当該中継装置を介して前記通信網に接続する複数の通信端末とを備える通信システムにおいて、ある通信端末から他の通信端末へデータ中継を行う中継装置であって、
第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する送受信部と、
音声データを複製するデータ複製部と、
前記第1の通信端末から前記送受信部を介して受信した前記音声データを前記データ複製部によって複製するよう制御するとともに、当該複製した音声データを蓄積して音声合成用データベースを作成するメディア処理装置に対して、前記複製された音声データを前記送受信部によって送信するように制御する通信制御部と、
を備えることを特徴とする中継装置。
【請求項6】
通信網に接続する中継装置と、前記中継装置を介して前記通信網に接続する複数の通信端末とを備え、ある通信端末より他の通信端末へデータの中継を前記中継装置が行う通信システムにおける中継方法であって、
第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する受信ステップと、
前記受信ステップで受信した前記音声データを複製する複製ステップと、
前記複製した音声データを、当該音声データを蓄積して音声合成用データベースを作成するメディア処理装置へ送信する送信ステップと、
を備えることを特徴とする中継方法。
【請求項1】
通信網に接続する中継装置と、
前記中継装置を介して前記通信網に接続し、前記中継装置を介して、他の通信端末と音声データの送受信を行う複数の通信端末と、
前記中継装置に接続するメディア処理装置と
を備えた通信システムであって、
前記中継装置は、
第1の通信端末から送信された第1の音声データを受信し、受信した前記第1の音声データを第2の通信端末へ送信する送受信部と、
音声データを複製するデータ複製部と、
前記第1通信端末からデータ送受信部を介して受信した前記第1の音声データを前記データ複製部によって複製し、当該複製された音声データを前記送受信部によって前記メディア処理装置へ送信するように制御する通信制御部と
を備え、
前記メディア処理装置は、
前記第1の通信端末の複製された音声データを、前記中継装置から受信する受信部と、
前記受信部により受信した音声データを音声データ蓄積部に蓄積する音声データ処理部と、
前記音声データ蓄積部に蓄積された前記音声データに基づいて、前記第1の通信端末用の音声合成用データベースを作成する音声合成用データベース作成部と、
前記音声合成用データベース作成部によって作成された音声合成用データベースが記憶される音声合成用データベース記憶部と、
前記第1の通信端末から音声合成の依頼を受信した場合、前記音声合成用データベースに基づいて音声合成を行う音声合成部と
を備える、
ことを特徴とする通信システム。
【請求項2】
前記通信制御部は、前記複製の指示を前記第1の通信端末から受信した場合に、前記送受信部を介して前記第1の通信端末から受信した音声データを前記データ複製部に複製させる、
ことを特徴とする請求項1に記載の通信システム。
【請求項3】
前記音声データ処理部は、
前記受信部により受信した前記音声データが前記蓄積された音声データのいずれかと一致するか否かを判定する判定部と、
受信した前記音声データの雑音量と、当該音声データと一致する蓄積済み音声データの雑音量とを測定する雑音測定部と、
を更に備え、
前記音声データ処理部は、受信した前記音声データの雑音量が、前記蓄積済みの音声データの雑音量より少ない場合には、前記蓄積済みの音声データを受信した前記音声データで上書きする、
ことを特徴とする請求項1又は2に記載の通信システム。
【請求項4】
前記音声データ処理部は、前記音声データ内の背景雑音を除去する雑音フィルターを更に備え、
前記音声データ処理部は、前記雑音フィルターによって前記背景雑音が除去された前記音声データを蓄積する、
ことを特徴とする請求項1乃至3のいずれか一項に記載の通信システム。
【請求項5】
通信網に接続する中継装置と当該中継装置を介して前記通信網に接続する複数の通信端末とを備える通信システムにおいて、ある通信端末から他の通信端末へデータ中継を行う中継装置であって、
第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する送受信部と、
音声データを複製するデータ複製部と、
前記第1の通信端末から前記送受信部を介して受信した前記音声データを前記データ複製部によって複製するよう制御するとともに、当該複製した音声データを蓄積して音声合成用データベースを作成するメディア処理装置に対して、前記複製された音声データを前記送受信部によって送信するように制御する通信制御部と、
を備えることを特徴とする中継装置。
【請求項6】
通信網に接続する中継装置と、前記中継装置を介して前記通信網に接続する複数の通信端末とを備え、ある通信端末より他の通信端末へデータの中継を前記中継装置が行う通信システムにおける中継方法であって、
第1の通信端末から音声データを受信し、受信した前記音声データを第2の通信端末へ送信する受信ステップと、
前記受信ステップで受信した前記音声データを複製する複製ステップと、
前記複製した音声データを、当該音声データを蓄積して音声合成用データベースを作成するメディア処理装置へ送信する送信ステップと、
を備えることを特徴とする中継方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2013−47851(P2013−47851A)
【公開日】平成25年3月7日(2013.3.7)
【国際特許分類】
【出願番号】特願2012−254973(P2012−254973)
【出願日】平成24年11月21日(2012.11.21)
【分割の表示】特願2009−36712(P2009−36712)の分割
【原出願日】平成21年2月19日(2009.2.19)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
【公開日】平成25年3月7日(2013.3.7)
【国際特許分類】
【出願日】平成24年11月21日(2012.11.21)
【分割の表示】特願2009−36712(P2009−36712)の分割
【原出願日】平成21年2月19日(2009.2.19)
【出願人】(392026693)株式会社エヌ・ティ・ティ・ドコモ (5,876)
【Fターム(参考)】
[ Back to top ]