説明

SSMLエディターシステム

【課題】VoIP基盤のMRCP-TTSサービスのSSMLエディターシステムを提供する。
【解決手段】SSMLエディターシステム(100)は、文書編集機能を提供する基本SSMLエディター(110)と、基本SSMLエディター(110)に接続されており、基本SSMLエディター(110)で作成中であったり作成されたSSML文書がSSML文法にあうように作成されたかどうかを判断し、間違った部分を構成する文法管理モジュール(120)と、基本SSMLエディター(110)または文法管理モジュール(120)に接続されており、MRCPサーバを通じて作成されたSSML文書による音声を確認することができるようにするMRCP管理モジュール(130)と、作成されたSSML文書をSSMLデータベースに保存するデータベース管理モジュールを備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はSSMLエディターシステムに関し、より具体的には、リアルタイムエラーチェック及び音声確認の可能なSSMLエディターシステムに関する。
【背景技術】
【0002】
VoIP(Voice over Internet Protocol)基盤のMRCP-TTSサービスは、ARSサービスと似ている、ユーザが要請するサービスを、音声で提供するサービスである。
【0003】
図1を参照して一般的なVoIP基盤のMRCP-TTSサービスシステムのサービス提供過程を説明すると、まず、サービス利用者が有線電話(10a)、無線電話(10b)、又はPC(10c)を用いてサービスを要請し、次にSIPサーバ(20)が適当なシナリオに従ったSSML(Speech Synthesis Markup Language:音声合成記述言語)文書をSSMLデータベース(30)から持ってきてMRCP(Media Resource Control Protocol)サーバ(40)に該当SSML文書の音声合成を要請する。この際、音声合成要請を受けたMRCPサーバは、要請されたSSML文書をTTS(Text-To-Speech)エンジン(50)が解析可能な形態に加工して伝達し、TTSエンジンは音声データベース(60)を用いて実際の音声を合成した後、MRCPサーバに再び伝達する。そしてMRCPサーバは、TTSエンジンから受けた合成された音声をSIPサーバに伝達し、SIPサーバがこれをユーザに提供する。
【0004】
現在、このようなサービスを提供するためのあらゆるプロトコル及びSSMLの標準が決められており、このようなサービスを用いることによって、サービス提供者は、より低廉な価格で需要者により便利で豊富なサービスを提供することができることになるため、今後VoIP基盤のMRCP-TTSサービスが広く用いられるであろう。
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、このようなVoIP基盤のMRCP-TTSサービスでは、全てのコンテンツがSSML文書で構成されなければならないので、サービス提供者は、提供しようとする全てのコンテンツに対応するSSML文書を作成して、データベースに構築しておかなければならないのにもかかわらず、現在このようなSSML文書を簡単に作成することのできるSSMLエディターは皆無な状態である。
【0006】
従って、従来VoIP基盤のMRCP-TTSサービスの提供者は、自身の提供しようとするサービスに適するようSSML文書が作成されたかどうかを確認するために、作成されたSSML文書をSSMLデータベースに保存し、有無線電話やPCを通じてSIPサーバに接続し直接対応するサービスを要請した後、実際に合成され提供される音声を聞く方式で一々確認しなければならない。
【0007】
また、自身の提供しようとする音声が提供されない場合、自身が作成したSSML文書のどの部分が間違っているのかを把握して、再び修正し保存して音声を確認する過程を繰り返さなければならない。
【0008】
更に、既に登録されたSSML文書を検索、挿入、修正、または削除するためにも、別途のプロセスを経なければならないため、従来のVoIP基盤のMRCP-TTSサービスでは、サービス提供者が自身の提供しようとするコンテンツに対応するSSML文書に対するデータベースを構築するのが容易でなかった。
【0009】
従って本発明者は、SSML文書を効率的に作成し、リアルタイム/非リアルタイム作成されたSSML文書のエラーがチェックできるだけでなく、SSMLデータベースに保存する必要がなく、作成と同時に完成したSSML文書に対応する音声が確認できる新たなSSMLエディターシステムを開発することに至ったのである。
【0010】
本発明の目的は、VoIP基盤のMRCP-TTSサービスのSSMLエディターシステムを提供するためのものである。
【0011】
本発明の別の目的は、当業者が慣れている方法でSSML文書を簡単に作成することができるSSMLエディターシステムを提供するためのものである。
【0012】
本発明のまた別の目的は、SSML文書作成中、または作成後にSSML文法の確認及び校正の可能なSSMLエディターシステムを提供するためのものである。
【0013】
本発明のまた別の目的は、MRCPサーバへの接続、メッセージ伝達のためのSIP/SDP/MRCPメッセージを自動に生成するSSMLエディターシステムを提供するためのものである。
【0014】
本発明のまた別の目的は、MRCPサーバに直接接続して、メッセージ伝送及び音声受信の可能なSSMLエディターシステムを提供するためのものである。
【0015】
本発明のまた別の目的は、SSMLデータベースに接続して保存されたSSML文書の検索、挿入、修正、削除の可能なSSMLエディターシステムを提供するためのものである。
【0016】
本発明の上記及びその他の目的は、下記で説明される本発明によって全て達成できる。
【課題を解決するための手段】
【0017】
本発明によるSSMLエディターシステムは、SSML文書の編集機能を提供する基本SSMLエディターと、基本SSMLエディターに接続されており、基本SSMLエディターで作成中であったり作成されたSSML文書が、SSML文法に合うように作成されたかどうかを判断し、間違った部分を校正する文法管理モジュールと、基本SSMLエディターまたは文法管理モジュールに接続されており、MRCPサーバを通じて作成されたSSML文書による音声が確認できるようにするMRCP管理モジュールと、作成されたSSML文書をSSMLデータベースに保存するデータベース管理モジュールとを備えることを特徴とする。
【0018】
基本SSMLエディターは、一般的なテキスト編集窓にSSMLコードを直接入力したり、GUI基盤の文書編集が可能であり、SSML文書をツリー状に編集することができるようにするのが望ましい。
【0019】
文法管理モジュールは、SSML文書の作成中、該当位置で予め入力可能な項目を推薦し、入力途中にリアルタイムまたは非リアルタイムで文法エラーのチェック及び校正が可能なようできる。
【0020】
MRCP管理モジュールは、SSMLを基盤としてSIP/SDP/MRCPメッセージを自動で生成し、生成されたメッセージを通じてMRCPサーバに接続してメッセージを伝達した後、RTPを通じて伝達された音声を確認することができる。
【0021】
また、データベース管理モジュールは、SSMLデータベースに保存されている文書を検索、挿入、修正及び削除することができる。
【発明の効果】
【0022】
本発明は、当業者が慣れている方法でSSML文書を簡単に作成することができ、SSML文書作成中、または作成後にSSML文法の確認及び校正が可能であり、MRCPサーバへの接続、メッセージ伝達のためのSIP/SDP/MRCPメッセージを自動で生成し、MRCPサーバーに直接接続して、メッセージ伝送及び音声受信が可能であり、SSMLデータベースに接続して保存されたSSML文書の検索、挿入、修正、削除が可能であり、ユーザが作成にSSML文書のデータベースを構築することができるVoIP基盤のMRCP-TTSサービスのSSMLエディターシステムを提供する効果を有する。
【発明を実施するための最良の形態】
【0023】
図2に、本発明の一実施形態であるSSMLエディターシステムが適用されたMRCP-TTSサービスシステムの構成図が図示されている。SSMLエディターシステム(100)は、MRCP-TTSサービスシステムのSSMLデータサービス(30)に作成されたSSML文書を保存するために、またはSSMLデータベースに保存されているSSML文書を検索、修正、削除するために、SSMLデータベースに接続されている。
【0024】
また、SSMLエディターシステム(100)は、作成されたSSML文書のテストのために、MRCPサーバ(40)とも接続されており、ここでの接続は、インターネット等のような伝送路を通じた接続であってもよい。
【0025】
図3に、SSMLエディターシステム(100)の構成図が図示されている。SSMLエディターシステム(100)は、大きく分けて基本SSMLエディター(110)、文法管理モジュール(120)、MRCP管理モジュール(130)及びDB(データベース)管理モジュール(140)で構成される。
【0026】
基本SSMLエディター(110)は、SSMLエディターシステム(100)において文書編集機能を提供するものであって、その他の別のXMLエディターと類似するように構成することによって、ユーザが容易に使用できるよう構成するのが望ましい。従って、図4に図示された画面左側のようにSSMLコードを直接入力してSSML文書を作成できるようにテキストエディターで構成する。
【0027】
また、SSML文書作成に用いられる命令語は、audio、breakなど12個に過ぎないため、図4に図示された画面右側のようにSSML文書作成に用いられる命令語を提示しておき、これをマウスでクリックするかドラッグして、文書作成に用いることができるようにするGUI(Graphical User Interface)基盤の文書編集機能を備えたGUI基盤のエディターで構成することも望ましい。
【0028】
また、ウィンドウの文書探索機のように、SSMLをツリー状に編集することができるよう、ツリー基盤のエディターで構成することも望ましい。
【0029】
基本SSMLエディター(110)は、新しいSSML文書を作成したり、DB管理モジュール(140)を通じてSSMLデータベース(30)に保存されているSSML文書を呼び出した後文書作業を行うこともできる。
【0030】
基本SSMLエディターで作成中であったり作成されたSSML文書は、文法管理モジュール(120)によりSSML文法に合うよう作成されたかどうかが確認され、文法に誤りがある場合、自動校正したり、ユーザに文法に誤りがあることを通知できる。
【0031】
図5に図示された文法管理モジュール(120)の構成図を参考にして、より詳細に説明すると、基本SSMLエディター(110)で作成中であったり作成されたSSML文書は、文法管理モジュール(120)に伝達される。文法管理モジュール(120)に伝達されたSSML文書は、まずSSMLパーサ(121)により解析できる単位に分割され、構文解析される。
【0032】
すなわち、入力されたSSML文書は、構文を解釈することのできる単位に分割され、文法に合うようにパースツリーで構成され、必要な全ての入力が提供されたかどうかが点検されもする。
【0033】
このように構文が把握されたSSML文書は、SSML文法検査モジュール(122)により文法に合うよう作成されたかどうかが確認され、SSML文法校正モジュール(123)により校正される。
【0034】
SSML文法校正モジュール(123)は、命令語に誤記が含まれている等、間違った部分が明確な場合には、これを状況に合うよう校正し、明確でない誤りの場合には、ユーザにどの部分に誤りがあるのかを表示して知らせる。
【0035】
上記のような文法管理モジュール(120)は、作成者がSSML文書を作成中にも文書を把握して、予め入力可能な項目などを推薦したりリアルタイムでエラーチェックが可能なようすることができる。
【0036】
上記のように自動でSSML文法の誤りの可否を検査し、作成者に誤りの可否、適切な命令語情報などを知らせることによって、正確なSSML文書がより容易に作成できる。
【0037】
上記のような文法検査が完了したSSML文書は、文法管理モジュール(120)または基本SSMLエディター(110)からMRCP管理モジュール(130)へ伝達される。従来のシステムでは、作成されたSSML文書による音声を確認するためには、作成されたSSML文書をSSMLデータベース(30)に保存し、その音声を確認するためにMRCP-TTSサーバに接続しなければならなかったが、本実施形態では、MRCP管理モジュールにより自動的にMRCPサーバに接続され、作成されたSSML文書による合成音が受信されて、作成者がリアルタイムで作成したSSML文書による音声を確認することができる。
【0038】
SIPサーバ(20)がSSMLデータベース(30)に保存された文書の音声合成をMRCPサーバ(40)に要求した事と同じように本実施形態によるSSMLエディターシステムがMRCPサーバに作成されたSSML文書の音声合成を要求するためには、MRCPサーバにSIPメッセージ、SDPメッセージ、MRCPメッセージを伝送しなくてはならない。従って、上記MRCP管理モジュール(130)は、作成されたSSML文書を用いて自動でSIP、SDP、MRCPメッセージを作成し、作成されたメッセージをMRCPサーバに伝送する。
【0039】
このような本実施形態によるMRCP管理モジュールの構成図が図6に図示されており、これを参考にしてより詳細に説明すると、作成されたSSML文書が受信されると、MRCPメッセージ生成モジュール(131)がSSML文書からMRCPメッセージを生成する。
【0040】
MRCPメッセージは、MRCPサーバへの伝送のためにMRCP支援モジュール(134)へ伝達されると共に、SDP(Session Description Protocol)メッセージ生成モジュール(132)へ伝達する。SDPメッセージ生成モジュールは、MRCPメッセージからSDPメッセージを生成し、生成されたSDPメッセージは、MRCPサーバへの伝送のためSDP支援モジュール(135)へ伝達されると共に、SIP(Session Initiation Protocol)メッセージ生成モジュール(133)へ伝達される。SIPメッセージ生成モジュールは、SDPメッセージからSIPメッセージを生成し、生成されたSIPメッセージは、MRCPサーバへの伝送のためSIP支援モジュール(136)へ伝達される。
【0041】
上記のように生成されたそれぞれのMRCP/SDP/SIPメッセージは、それぞれのMRCP/SDP/SIP支援モジュールを通じてSIPメッセージ、SDPメッセージ、MRCPメッセージの順にMRCPサーバへ伝送される。SIPメッセージとSDPメッセージは、MRCPサーバに接続するためのメッセージであり、作成されたSSML文書に対応する音声を合成するようにするためのメッセージであって、全て国際標準方式に沿う。
【0042】
MRCPサーバを通じてTTSエンジンで合成された音声は、SDPメッセージに含まれたアドレス情報によって再びSSMLエディターシステムに提供され、MRCP管理モジュール(130)のRTP(Real time Transport Protocol)支援モジュール(137)を通じてSSMLエディターシステムに受信され、ユーザは自ら作成したSSML文書に対応する音声をリアルタイムで確認することができることになる。
【図面の簡単な説明】
【0043】
【図1】一般的なVoIP基盤のMRCP-TTSサービスシステムの構成図である。
【図2】本発明の一実施形態であるSSMLエディターシステムが適用されたMRCP-TTSサービスシステムの構成図である。
【図3】本発明の一実施形態である SSMLエディターシステムの構成図である。
【図4】本発明の一実施形態である SSMLエディターシステムを実行させた画面を示す図である。
【図5】本発明の一実施形態である SSMLエディターシステムのうち文法管理モジュールの構成を示す構成図である。
【図6】本発明の一実施形態である SSMLエディターシステムのうちMRCP管理モジュールの構成を示す構成図である。
【符号の説明】
【0044】
10a 有線電話
10b 無線電話
10c PC
20 SIPサーバ
30 SSMLデータベース
40 MRCPサーバ
50 TTSエンジン
60 音声データベース
100 SSMLエディターシステム
110 基本SSMLエディター
120 文法管理モジュール
121 SSMLパーサ
122 SSML文法検査モジュール
123 SSML文法校正モジュール
130 MRCP管理モジュール
131 MRCPメッセージ生成モジュール
132 SDPメッセージ生成モジュール
133 SIPメッセージ生成モジュール
134 MRCP支援モジュール
135 SDP支援モジュール
136 SIP支援モジュール
137 RTP支援モジュール
140 データベース管理モジュール

【特許請求の範囲】
【請求項1】
SSML文書編集機能を提供する基本SSMLエディターと、
上記基本SSMLエディターに接続されており、上記基本SSMLエディターで作成中であったり作成されたSSML文書が、SSML文法に合うよう作成されたかどうかを判断し、間違った部分を校正する文法管理モジュールと、
上記基本SSMLエディターまたは文法管理モジュールに接続されており、MRCP サーバを通じて作成されたSSML文書による音声が確認できるようにするMRCP管理モジュールと、
作成されたSSML文書をSSMLデータベースに保存するデータベース管理モジュールと、
を備えることを特徴とするSSMLエディターシステム。
【請求項2】
上記基本SSMLエディターは、一般的なテキスト編集窓にSSMLコードを直接入力するテキスト基盤エディター、GUI基盤の文書編集が可能なGUI基盤エディター、またはSSML文書をツリー状に編集できるツリー基盤エディターで構成されることを特徴とする請求項1に記載のSSMLエディターシステム。
【請求項3】
上記文法管理モジュールは、リアルタイムまたは非リアルタイムで文法のエラーチェック及び校正、入力可能な項目推薦が可能なようにSSMLパーサ、SSML文法検査モジュール、SSML文法校正モジュールを備えることを特徴とする請求項1に記載のSSMLエディターシステム。
【請求項4】
上記MRCP管理モジュールは、上記作成されたSSML文書からMRCPメッセージを生成するMRCPメッセージ生成モジュール、上記MRCPメッセージからSDPメッセージを生成するSDPメッセージ生成モジュール、上記SDPメッセージからSIPメッセージを生成するSIPメッセージ生成モジュール、上記MRCPメッセージをMRCPサーバへ伝送するMRCP支援モジュール、上記SDPメッセージをMRCPサーバへ伝送するSDP支援モジュール、上記SIPメッセージをMRCPサーバへ伝送するSIP支援モジュール、及びMRCPからの音声情報を受信するRTP支援モジュールを含んでなることを特徴とする請求項1に記載のSSMLエディターシステム。
【請求項5】
上記データベース管理モジュールは、保存されているSSML文書を検索、挿入、修正及び削除することができるようにMRCP-TTSシステムのSSMLデータベースに接続されていることを特徴とする請求項1に記載のSSMLエディターシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−59586(P2008−59586A)
【公開日】平成20年3月13日(2008.3.13)
【国際特許分類】
【出願番号】特願2007−220793(P2007−220793)
【出願日】平成19年8月28日(2007.8.28)
【出願人】(000000527)ペンタックス株式会社 (1,878)
【出願人】(501354211)ボイスウェア カンパニー リミテッド (4)
【住所又は居所原語表記】10th Fl,SAMHWAN Digital Venture Tower,Sungsu−Dong 2−Ga,280−13,SungDong−Gu,Seoul,133−120,Korea
【Fターム(参考)】